云存儲的幾十年發展歷程,其計算架構模型,也從ScaleUp走向ScaleOut。但是展望未來數字世界的海量需求,目前流行的模型還能夠持續滿足嗎?本文通過對云存儲歷史的回顧,及對ScaleUp和ScaleOut兩種擴展模型的詮釋,來揭開云存儲的未來模式。
1.云存儲及其歷史
簡而言之,云存儲(cloudstorage)就是將數字內容安全的存儲在服務器上,從而任何連接互聯網的設備可以方便的獲取。首先讓我們簡單回顧一下云存儲的歷史。
云存儲的早期雛形要回溯到上個世紀的90年代,也就是互聯網泡沫時期(dot-comboom),當時有許多家公司,例如EVault,NetMass,Arkeia和CommVault等等[1]均提供在線數據備份服務,當然它們絕大部分也隨著互聯網泡沫的破碎而煙消云散了。少數幸存下來的有一家叫VeritasNetBackup最后也被Symantec收購,現在依舊提供SymantecNetBackup的在線存儲服務。
而真正讓大家耳熟能詳的云存儲是2006年由Amazon提供的AWSS3云存儲服務,其最具有革命意義的變革是,提出了即買即用(pay-per-use)的價格模型,使得云存儲的使用像水電一樣可計算衡量。從此云存儲以S3為標準一路絕塵,我們所熟悉的大廠,比如Netflix,Pinterest,Dropbox也是S3的顧客。尾隨的Microsoft和Google也于2010年分別發布了類似的AzureBlobStorage和GoogleStorage的存儲服務。
云存儲真正發展的十幾年中,見證了移動互聯網的崛起,大數據的生機勃發,人工智能的再次復興,并能夠展望到未來物聯網,無人駕駛及各類機器人自動化的世界。海量數據的產生,存儲,分析,預測及應用,快速以正反饋循環方式,推進著人類社會向數字世界大步邁進。所以,為了適應數據存儲新的需求,各家云存儲產品的應用場景及價格模型,已從單一向多元發展,比如AWSS3就有Standard,Intelligent-Tiering,Standard-IA,OneZone-IA,Glacier和GlacierDeepArchive六類存儲產品來滿足各類使用場景,我會在未來的文章里針對性的細講一下。而本文重點所探討的是,目前云存儲的基礎架構體系是否能夠適應未來數據存儲的要求和挑戰?為了回答這個問題,讓我們先簡單回顧一下計算機體系架構里的ScaleUp和ScaleOut擴展模型。
2.ScaleUp和ScaleOut?
ScaleUp又稱為垂直擴展(scalevertically)[2],意為在單節點上添加資源,如CPU,內存和存儲,在縱向上擴展從而獲得更多計算或存儲能力;ScaleUp初期能夠快速達到升級目的,操作起來相對比較簡單,但隨著計算或存儲的要求越來越高,硬件資源的添加可能已經達到極限,不僅單節點的造價非常昂貴,維護成本很高,而且更容易留下單點故障的隱患。傳統的RAID(RedundantArrayofInexpensiveDisks)存儲就是此種模式。
ScaleOut又稱為水平擴展(scalehorizontally)[2],意為在分布式環境下,通過添加節點計算或存儲資源,在橫向上滿足更多的計算存儲需求;隨著計算和存儲單位價格的降低和效率的提升,使用低端的商用(commodity)系統,利用分布式技術可以搭建起“超級計算”中心,以及后來衍生出來的私有或公有云平臺解決方案。雖然分布式系統會帶來一定程度上的軟件復雜度和管理困難,但由軟件定義的計算和存儲解決方案,能夠以較低的價格和較高的魯棒性,優雅的解決了海量增長的計算存儲需求,也是目前云平臺的主流技術。但它就一定能夠承載未來的更加海量的需求嗎?云存儲的未來是什么?方向是向左還是向右?
3.未來向左還是向右?
話說天下大勢,分久必合,合久必分,事物發展的規律似乎從來就沒有什么絕對。當下,云平臺內部似乎已完全是ScaleOut模式了,但當我們把鏡頭再拉遠一點,從云平臺在全球部署的每一個可用區來看,整體上它又是一個ScaleUp模型,不是嗎?單點投入巨大,耗費能源,使用成本高昂。而相反,隨著強大的計算,存儲和帶寬能力能夠進入尋常家庭、工作和生活等邊緣節點,資源閑置或者不均衡使用也變得越來越明顯。
那么,是否能夠將這些邊緣節點的計算存儲能力結合起來,組成一個真正意義上的ScaleOut平臺,提供人們日益增長的計算存儲需求?
可否將浪費或者不對等的資源重新組合,提供一個更加節能環保的綠色ScaleOut平臺?
可否摒棄中心化的單點故障和數據安全隱患,真正做到廉價高效,零數據泄露的ScaleOut平臺?
答案是應該可以而且必須可以!
縱觀云存儲平臺的發展歷史,從單節點的ScaleUp模式走向可用區內部的ScaleOut模式,又從內部的ScaleOut模式走向整體上相對的ScaleUp模式。而未來數字世界的海量計算和存儲需求的滿足,一定需要真正意義上的全球ScaleOut模型,那就是把邊緣節點和半中心化節點高效且系統的組織起來,減少浪費,提高效率,節省成本,去除中心。將天空中幾塊為數不多的白云,變成漫天遍布的朵朵白云,讓人們自由定價、自由選擇、自由組合。
挑戰雖然巨大,但未來很美好,讓我們一起努力迎接云存儲的明天!
[1]:HistoryofOnlineStorage
[2]:WikiScalability
文章作者:BruceLee(http://PP.IO總架構師)
轉載請注明出處
如果有關于PPIO的交流,可以通過下面的方式聯系我:
加我微信,注意備注來源
wechat:omnigeeker