hadoop和大數據的關系?
首先,大數據是個概念而已,簡單比喻可以這么說,hadoop是實現大數據分析的一種架構;其實有點類似建設銀行與銀行的概念,建設銀行是銀行的一種;在沒有hadoop之前我們處理大數據也是可以的,我們可以自己寫程序去處理,Java,Python等語言都可以去實現大數據處理,而hadoop是Java里面沉淀出來的一個架構,里面就有個生態圍繞著它完善,所以喊著喊著,好多人一說到大數據就會說到Hadoop,而Hadoop里面又有原生apache,cdh,hdp等廠商開源版。
Apache Spark 是專為大規模數據處理而設計的快速通用的計算引擎,你可以理解它是Hadoop里面的一個補充功能。