大數(shù)據(jù)除了Hadoop?
1、Spark —— 使用簡(jiǎn)單、支持所有重要的大數(shù)據(jù)語(yǔ)言(Scala、Python、Java、R)。擁有強(qiáng)大的生態(tài)系統(tǒng),成長(zhǎng)迅速,對(duì)microbatching/batching/SQL支持簡(jiǎn)單。Spark能更好地適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法。
2、NiFi —— Apache NiFi是由美國(guó)國(guó)家安全局(NSA)貢獻(xiàn)給Apache基金會(huì)的開(kāi)源項(xiàng)目,其設(shè)計(jì)目標(biāo)是自動(dòng)化系統(tǒng)間的數(shù)據(jù)流。基于其工作流式的編程理念,NiFi非常易于使用、強(qiáng)大、可靠、高可配置。兩個(gè)最重要的特性是其強(qiáng)大的用戶界面和良好的數(shù)據(jù)回溯工具。堪稱大數(shù)據(jù)工具箱里的瑞士軍刀。