hbase區別

hbase區別？

1、hadoop：它是一個分布式計算+分布式文件系統，前者其實就是MapReduce，后者是hdfs。后者可以獨立運行，前者可以選擇性使用，也可以不使用

2、hive：通俗的說是一個數據倉庫，倉庫中的數據是被hdfs管理的數據文件，它支持類似sql語句的功能，你可以通過該語句完成分布式環境下的計算功能，hive會把語句轉換成MapReduce，然后交給hadoop執行。這里的計算，僅限于查找和分析，而不是更新、增加和刪除。它的優勢是對歷史數據進行處理，用時下流行的說法是離線計算，因為它的底層是MapReduce，MapReduce在實時計算上性能很差。它的做法是把數據文件加載進來作為一個hive表（或者外部表），讓你覺得你的sql操作的是傳統的表。

3、hbase：通俗的說，hbase的作用類似于數據庫，傳統數據庫管理的是集中的本地數據文件，而hbase基于hdfs實現對分布式數據文件的管理，比如增刪改查。也就是說，hbase只是利用hadoop的hdfs幫助其管理數據的持久化文件（HFile），它跟MapReduce沒任何關系。hbase的優勢在于實時計算，所有實時數據都直接存入hbase中，客戶端通過API直接訪問hbase，實現實時計算。由于它使用的是nosql，或者說是列式結構，從而提高了查找性能，使其能運用于大數據場景，這是它跟MapReduce的區別。

總結：hadoop是hive和hbase的基礎，hive依賴hadoop，而hbase僅依賴hadoop的hdfs模塊。hive適用于離線數據的分析，操作的是通用格式的（如通用的日志文件）、被hadoop管理的數據文件，它支持類sql，比編寫MapReduce的java代碼來的更加方便，它的定位是數據倉庫，存儲和分析歷史數據hbase適用于實時計算，采用列式結構的nosql，操作的是自己生成的特殊格式的HFile、被hadoop管理的數據文件，它的定位是數據庫，或者叫DBMS

最后補充一下：hive可以直接操作hdfs中的文件作為它的表的數據，也可以使用hbase數據庫作為它的表

java map 區別,hbase區別

上一篇如何用LabVIEW做顏色識別

下一篇access數據庫中字段名能用中文嗎

色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

網站導航

網站導航

網站分類

hbase區別

色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

網站導航

網站導航

網站分類

hbase區別

相關文章