談談大數據時代背景下對信息安全的挑戰?
【關鍵詞】大數據;信息安全;APT;數據標識;存儲監控
一、概述
隨著國民經濟的不斷快速發展,尤其是我國加入世界貿易組織(WTO)之后,我國經濟正朝著經濟全球化和國際市場化的方向快速發展,從而使得我國各個企業與國外經濟體的聯系和交流越來越廣泛。在經濟全球化日益加速的今天,互聯網技術的不斷優化和更新,企業經濟的發展越來越快,經濟樣式也越來越多,也就催生了企業生產數據的不斷增加,尤其是近幾年智能網絡終端的增加、云計算技術的廣泛應用等,互聯網的數據量更是呈爆炸式增長。據國際互聯網數據中心IDC (Internet Data Center)預計,互聯網內現有的數據量90%以上是近幾年才產生的,而且每兩年就會翻一番的速度增長,到2020年,全球互聯網數據量將增加50倍。這就表明,互聯網經濟已經步入了大數據時代。大數據是指互聯網內數據信息量非常巨大且不能用當前常見的工具在正常時間內無法處理的數據信息。由于互聯網自身的特點,這些數據絕大多數都是以非結構化的多樣化形式存在,但是為人們的決策、規律研究、有用信息挖掘等提供重要的數據依據。隨著時代的前進,大數據將會隨著互聯網絡的發展而更具開發性,這也為大數據的私密數據泄露和敏感信息竊取等信息安全問題的解決提出了更大的挑戰。所以如何確保數據信息安全性對于在在大數據背景下推動各個政府部門、教育科研機構、企業單位和金融機構等諸多領域的快速安全發展來說具有非常重要的現實意義。
二、大數據簡介
上世紀八十年代初,美國著名謝家Alvin Toffler在《第三次浪潮》中提及了“大數據”(Big Data)的概念。大數據是指以計算機技術為基礎的規模龐大、利用當前常規的數據處理工具無法在合理時間內進行正常存儲、提取、搜索、分析、處理等的數據信息。同時,大數據也代表著異于傳統數據信息處理系統的新的技術和框架,可以更加有效、經濟地、高頻率地、智能地從大容量、不同數據結構和類型的多樣化數據中獲取有用的價值和信息。
大數據具有五個特征,可以通過4C+V來描述,分別是Volume,Variety,Value,Velocity,Complexity。
其中Volume表示大數據的數據量多、規模巨大的特性。在對大數據進行描述時,常見的GB或者TB的數據存儲單位已經不再使用,而是以PB(1024TB)、EB(1024PB)甚至ZB(1024EB)。根據一些資料顯示,國際互聯網數據中心IDC預測,2020年全球互聯網數據量為35ZB。所以,大數據的特點首先就是數據規模龐大。Variety表示大數據的數據結構多樣化,數據類型更加復雜,不僅包括常見的計算機處理的結構數據,包括二維或多維的數據結構存儲表,而且有很多文件、視頻、圖片、音頻等非結構化的數據信息。由于互聯網分布式的特點,加上物聯網、云計算等技術平臺的不斷發展,信息數據的來源逐漸趨于多樣化,互聯網數據來源逐漸增加,首先是互聯網終端用戶,在各種互聯網應用中產生的文字、圖片、視頻、音頻等各類數據信息,然后就是各種互聯網設備以及各種信息管理系統,在生產過程中產生的各種文件、數據庫、審計、操作日志等信息數據,最后就是各種物聯網的傳感設備和信號采集設備,如醫療設備產生的各種生命特征數據、天文望遠鏡產生的大量天文相關的信息數據等。Value表示大數據的價值密度低的特征。由于大數據數據量多,所以數據基數大,加上對于企業生產決策的有用信息并不多,所以大數據價值密度低也是大數據的另外一個特性。這里值得說明的是,價值密度低不是沒有價值,對于企業來說,大數據的存儲是一個企業在發展過程中非常寶貴的財富。Velocity表示大數據的數據信息處理速度快的特性,由于大數據基數龐大,所以數據處理速度快將是大數據時代數據處理工具一個最為明顯的特征。Complexity表示大數據的復雜性的特征。特別是當前人們要求大數據的智能分析和處理的階段,大數據處理和分析的復雜性將進一步提升。
三、大數據面臨的安全問題
在大數據時代,數據信息成為企業發展的重要資源,然而隨著數據的不斷增加,大數據的安全風險也會逐漸增加,加上大數據是未來互聯網絡新的競爭點,必然也成為眾矢之的,引發更多的安全為題。
(一)大數據的網絡攻擊
由于大數據的數據規模龐大,在互聯網云端采用分布式存儲形式進行存儲,相關數據已經形成了統一的視圖,就存儲形勢來看,數據保護相對簡單,很容易為黑客留下攻擊漏洞,更加便以黑客實施高持續行威脅APT攻擊,造成安全問題。由于大數據環境下終端用戶非常多,且群體復雜,所以系統很難對網絡用戶的合法性進行快速實時的判斷。所以,大數據為高持續性威脅攻擊提供了良好的隱藏環境,APT在一個不確定的時間內進行持續攻擊,并且無法被實時檢測到,對大數據造成極大的威脅。在2013年3月份,韓國包括KBS以及多家民間企業在內的網站受到黑客的高持續性威脅攻擊(APT),導致互聯網絡受阻,計算機系統癱瘓。在此次APT中,韓國的金融機構共受到1500多次的非法入侵,受害的計算機達48000臺,成為2013年度最嚴重的APT攻擊。
由于高持續威脅攻擊具有很強的針對性,且攻擊時間長,配合數據挖掘技術等大數據分析攻擊和手段,很容易獲取大數據中獲取有用的數據信息,從而引發數據泄露,造成更大的危害。
(二)大數據的用戶隱私
由于大數據對所有網絡用戶的數據進行匯集存儲,在一定程度上,為用戶的個人數據的隱私保護埋下了安全隱患。如果大數據安全機制不完善,在用戶對個人數據操作不當的情況下,可能會造成一些相關的隱私數據的泄露,從而造成嚴重的隱私數據的安全問題。大數據的個人用戶數據的隱私保護,需要強大的大數據分析和處理技術和完善的隱私數據保護機制,來提升數據安全級別。如果在大數據管理端沒有完善的數據管理機制,用戶的一些敏感數據信息的所有權和使用權的界定或者分配可能會出現問題,對于大數據分析的應用來說,勢必會造成用戶隱私數據泄露,引發數據安全問題。
在對大數據進行數據采集和信息挖掘的時候,要注重用戶隱私數據的安全問題,在不泄露用戶隱私數據的前提下進行數據挖掘,完成有用信息提取。當前,大數據與云計算平臺的結合,使得分布式計算的應用逐漸廣泛,如何在分布計算的信息傳輸和數據交換時保證各個存儲點內的用戶隱私數據不被非法泄露和使用是當前大數據背景下云計算信息安全的主要問題。同時,當前的大數據數據量并不是固定的,而是在應用過程中動態增加的,而傳統的數據隱私保護技術大都是針對靜態數據的,所以如何有效地應對大數據動態數據屬性和表現形式的數據隱私保護也是要注重的安全問題。最后,大數據的數據遠比傳統數據復雜,現有的敏感數據的隱私保護是否能夠滿足大數據復雜的數據信息也是應該考慮的安全問題。
(三)大數據的數據存儲
大數據的數據類型和數據結構是傳統數據不能比擬的,在大數據的存儲平臺上,數據量是非線性甚至是指數級的速度增長的,各種類型和各種結構的數據進行數據存儲,勢必會引發多種應用進程的并發且頻繁無序的運行,極易造成數據存儲錯位和數據管理混亂,為大數據存儲和后期的處理帶來安全隱患。當前的數據存儲管理系統,能否滿足大數據背景下的海量數據的數據存儲需求,還有待考驗。不過,如果數據管理系統沒有相應的安全機制升級,出現問題后則為時已晚。
四、大數據的信息安全策略
由于大數據自身的寶貴價值,在如火如荼地發展期間,必然要注重大數據的信息安全問題,來從而提升大數據的安全策略,推動大數據下的云計算的廣泛應用。
(一)加快大數據信息安全體系建設
大數據的信息安全體系建設不僅是計算機信息技術的發展問題,更是國家數據安全的策略問題。在大數據的發展規劃階段,要在戰略角度出發,切實認識到大數據信息安全的重要性,不僅要在技術上加強大數據信息安全體系建設,更要在策略上態度上重視大數據信息安全建設,明確大數據的重點數據保護對象,構建大數據價值等級,加快完成大數據信息安全體系的建設。
(二)實施大數據信息安全技術
大數據的信息安全技術是通過相關的工具和一定的安全策略,構建完善的大數據信息安全模型,來實現數據信息的安全。首先,可以通過一定的工具,在數據收錄和存儲階段完成數據類型的劃分,并通過數據挖掘等技術,持續自動地對大數據進行分類、分析、評估,從而為有用信息提取做準備,最后要確保大數據框架下各個節點之間的加密安全的通信,降低大數據的攻擊。
在數據收錄和存儲時對數據進行標記處理,是在確保大數據安全性的前提下,對大規模的價值密度低的大數據實現快速運算處理的有效方法。針對數據標識的內容,可以根據系統不同的要求,對數據的類別、敏感等級等進行標記,然后數據管理系統對該表示進行判斷之后,存放到數據庫中。如圖2.所示,為數據標識判斷流程圖。
如圖2.所示,當數據增加標識后,如果數據庫內未對該標識進行記錄,則會將該表示直接存入數據庫。如果已經有記錄,則會直接將該數據存入數據庫。在數據已經有數據標識之后,則可以通過數據挖掘技術(如決策樹、聚類等)對數據進行實施快速處理,為后期有用價值提取做好準備。
在大數據的分布式計算框架下,數據加密的安全傳輸是加強大數據信息安全的重要問題,可以在分布式框架下的客戶端和服務器端配置統一的數據傳輸加密配置文件,通過將密鑰與通信數據的分開存儲來增加分布式系統的數據傳輸的安全性。
(三)加強大數據動態存儲機制
大數據的數據存儲問題是解決海量數據動態并發存儲的安全監控問題,在海量數據的動態存儲過程中,要對數據存儲程序進程等進行安全監控和檢測,同時對系統各種硬件資源如CPU、內存、磁盤、輸入輸出端口進行全面監控和控制,從而建立高校的動態數據細粒度的分析機制和安全監控機制,確保大數據的海量數據動態并發存儲的有序進行,保證大數據管理系統自身的運行可靠性和安全性。
五、總結
大數據的信息安全是針對大數據環境下的網絡APT攻擊、用戶隱私數據保護以及數據存儲等安全問題的安全的策略,主要是通過構建完善的大數據信息安全體系、實施數據標識、加密通信以及動態存儲監控等方法手段來提升大數據信息安全性,從而為互聯網絡創建一個安全穩定的大數據環境。