流处理
是时候准备结束数仓领域流批一体的讨论了---增量数仓系列其二
ℹ️ 本文原先发表于 zhihu @ 2024-03-27 书接上文(由于工作等原因,两篇文章之间拖得有点久)离线数仓近实时化的成本问题— 增量数仓系列其一
September 14, 2025
离线数仓近实时化的成本问题--- 增量数仓系列其一
ℹ️ 本文原先发表于 zhihu @ 2023-10-07 离线数仓近实时化的需求 离线数仓尤其是Spark + Hive的这一套计算存储架构,已经经过了十多年的发展和业界验证,成为了工业界的事实标准。不过随着业界对数据时效性越来越高的需求,逐渐发展出了Flink + 多种类型存储的实时计算存储架构。二者的使用场景不同,成本以及数据加工准确性等方面都有所不同,所以导致了也就是至今依然在业界广为使用的Lambda架构。
September 14, 2025