kudo是什么系統(tǒng)?
Kudo是一個列式存儲的用于快速分析的NoSQLhttps://www.b5b6.com/shujuku/,提供了類似SQL的查詢語句,與RDBMS十分類似,有**PRIMARY KEY **,基于主鍵查詢而不是HBase的RowKey
低延遲隨機存取
與其他大數(shù)據(jù)https://www.b5b6.com/shujuku/不同,Kudu不僅僅是一個文件格式。行訪問達到毫秒級延遲,支持C++ JAVA, API PyThon API 擁有簡單好用的API
融會貫通入Hadoop生態(tài)系統(tǒng)
你可以使用Java Client實時導(dǎo)入數(shù)據(jù),同時也支持Spark(運算) impala(分析工具,比Hive快) MapReduce HDFS HBase 很容易從HDFS中獲取數(shù)據(jù),占用內(nèi)存小于1G
列式存儲有利于編碼和壓縮,數(shù)據(jù)比使用Parquet壓縮還省空間。這樣的高壓縮,降低了數(shù)據(jù)的IO,為計算服務(wù)。使用如laze data這樣的技術(shù),使得超高速成為可能
分布式和容錯機制
Kudu通過把tables切分成tablets,每個表都可以配置切分的哈希,分區(qū)和組合
Kudu使用了Raft來復(fù)制給定的操作,保證了數(shù)據(jù)同時存儲在兩個節(jié)點上,因此不村子單點故障。
下一篇還愿意補償三個月工資