數據湖是類似以前數據倉庫的一個新概念他是把數據聚集在一起像一個超級大的湖泊一樣
以往的數據倉庫會還是使用關系型數據庫的思路像目前用的多的是redshift就基本和Postgres數據庫類似當然功能更強大
數據湖是非結構化的分布式存儲比如presto就是你可以把數據按照文件形式存儲在文件系統上然后使用Hadoop的生態結構就可以做查詢相比數據倉庫的做法這種非結構化的存儲比較自由給業務的數據分析提供了一些技術上的便利性
在應用方面數據湖的角色和數據倉庫一樣是拉平業務數據庫的數據支持后續的數據建模的
數據湖是類似以前數據倉庫的一個新概念他是把數據聚集在一起像一個超級大的湖泊一樣
以往的數據倉庫會還是使用關系型數據庫的思路像目前用的多的是redshift就基本和Postgres數據庫類似當然功能更強大
數據湖是非結構化的分布式存儲比如presto就是你可以把數據按照文件形式存儲在文件系統上然后使用Hadoop的生態結構就可以做查詢相比數據倉庫的做法這種非結構化的存儲比較自由給業務的數據分析提供了一些技術上的便利性
在應用方面數據湖的角色和數據倉庫一樣是拉平業務數據庫的數據支持后續的數據建模的