scala中的分布式數據集有?
RDD(Resilient Distributed Datasets)彈性分布式數據集,可以把RDD就可以看成是一個簡單的"動態數組"(比如ArrayList),對其操作,也只需要 調用它的方法而已,和java中的ArrayList一樣。但它與一般動態數組的區別在于:RDD是分布的。
彈性是指的是數據自動在內存和磁盤切換, task如果失敗會進行特定次數的重試
scala中的分布式數據集有?
RDD(Resilient Distributed Datasets)彈性分布式數據集,可以把RDD就可以看成是一個簡單的"動態數組"(比如ArrayList),對其操作,也只需要 調用它的方法而已,和java中的ArrayList一樣。但它與一般動態數組的區別在于:RDD是分布的。
彈性是指的是數據自動在內存和磁盤切換, task如果失敗會進行特定次數的重試