数据仓库
这是一个传统的概念了,趋向于结构化数据,简单来说就是进过数据治理后的标准数据更易于数据分析使用,代价就是存储比较昂贵了
数据湖
近些年来新出的一种概念,就是存储了结构化,非结构化,半结构等数据,也就是不管什么数据先存起来在说,这些数据更易于大模型分析,存储比较简单
湖仓一体
结合了上面的两种模式
盗来的图:
主要讲讲在实际应用中,湖仓一体的有点:
- 数据统一存储:湖仓一体里,数据只存储一份,这样流程简单,输出数据格式统一,易于管理等
- 存算分离:既存又算,在一些架构中需要两套系统来维持其稳定性的话,需要将存算进行分离,但是湖仓一体只需要一套系统就能进行存算分离
- 查询:目前其能满足mysql结构,也有es高效查询,用时又兼容hbase列存储的键值查询
----- -----------------参考文档