簡述speak計算框架的特點?
一是高效性。相比于早期的Hadoop,Spark運行速度可以提到10-100倍,同樣的程序,在Hadoop當中運行和在Spark上運行,速度的提升帶來的就是計算效率的提升,Spark使用最先進的DAG調度程序,查詢優化程序和物理執行引擎,實現批量和流式數據的高性能。
二是易用性。Spark在應用層面提供Java、Python和Scala的API,還支持超過80種高級算法,可以根據實際的數據處理需求,快速構建計算平臺,滿足數據處理需求,并且Spark還支持交互式的Python和Scala的shell,大大方便了用戶的操作。三是通用性。Spark的生態圈,已經趨于完善,各個組件可以共同完成絕大部分的數據處理需求和場景。批處理、交互式查詢(Spark SQL)、實時流處理(Spark Streaming)、機器學習(Spark MLlib)和圖計算(GraphX),都能在Spark生態圈找到相應的解決方案。