理資產、治數據,一體化大數據治理
為什么需要數據治理?
大數據不是憑空而來,1981年第一個數據倉庫誕生,到現在已經有了近40年的歷史,而國內數據平臺的建設大概從90年代末就開始了,從第一代架構出現,到現在已經歷了近20年的時間。
1
在這20年的時間里,國內數據平臺實施者受盡折磨,交付數據項目是出了名的臟活累活。
忽視數據治理給數據平臺建設帶來了不少問題。隨處可見的數據不統一、數據質量差,以及難以完成的數據模型梳理等這些基礎性數據問題已經嚴重限制了數據平臺的發展,與此同時,數據應用在商業上難以嶄露頭角。
數據治理的難點痛點,歸納有以下幾點:
數據采集難:數據的形態多樣化,給數據采集帶來很大難度,使得數據難以匯聚。
數據整合難:數據的來源多樣化,很難理清數據之間的關系,進而難以整合。
數據共享難:數據間壁壘高筑,數據權限不明晰,使得數據無法實現共享交換,難以推進數據的流通。
數據發現難:大量的IT系統,眾多廠商的參與,系統間數據標準不統一,很難找到真正需要的數據。
數據使用難:數據涵義不清晰,業務屬性不明確,數據難以利用,難以發揮出數據的價值。
數據監管難:少標準、缺規范,難以有效管理數據,難以保證數據的質量。
2
數據治理的對象
在20余年的信息化建設中,無論是政府還是企業都積累了大量的信息化資產。這些信息資產,從不同的維度,我們把它分為業務資產、技術資產、數據資產三部分,這些信息化資產貫穿數據的全生命周期。所以說,數據治理,不僅僅是治理數據本身,而是治理這些和數據全生命周期相關的信息化資產。
信息化資產包括內容
業務資產:業務資產指的是業務的術語,業務的規則,業務上的理解。
技術資產:技術資產存在于業務系統、數據庫服務器、文件服務器里面,指的是技術設計類的資產。
數據資產:數據資產指所有的針對于數據庫表結構的設計、代碼表的設計及其相關數據。
對這三大類資產的管理過程,就是我們常說的數據治理,具備又包含數據的權限責任管理、數據的規則管理、數據的質量管理、數據的安全管理等。
3
東軟大數據治理一體化解決方案
在20余年的信息化建設過程中,東軟通過諸多行業數據類項目的實施經驗的不斷積累,從元數據、主數據、數據標準、數據質量到數據處理、資源目錄、數據交換和數據安全,提供全面的數據治理解決方案,打通數據治理全流程,為大數據應用構建提供支撐,同時,在各個領域豐富的解決方案實踐經驗也為項目的成功提供了保障。
在數據治理的策略上,東軟采用先理后治的方案,實現數據標準化、流程規范化、治理常態化、價值可視化、監管智能化的數據治理。
東軟數據治理的“理”指的是統籌規劃,“治”指的是貫徹執行。
具體到內容上,“理”包括:
理系統:梳理已有業務系統、數據庫、文件存儲等信息,輸出數據連接,形成技術資產。
理數據:發掘數據表、文件、視頻、圖片等數據,描述數據的結構信息,形成數據資產。
理關系:分析表與表、文件與文件、系統與系統等關系,形成數據資產及資產間關系。
理標準:識別主數據、數據元、代碼、術語、規則等,形成業務、數據及管理資產。
理流程:規范上報數據、轉換清洗、標準變更流程,明確權責,形成業務及管理資產。
理目錄:整理資產清單,按照業務、技術等維度制定目錄,形成數據訪問同一入口。
具體到流程上,“理”包含三種方式
理的目的是為治,數據治理的第二階段是基于理出的標準規范貫徹執行。
治的具體內容包含
治匯聚:監管采集流程,整合多源數據,統一數據存儲,形成數據中心。
治質量:對齊標準及數據,基于數據標準對數據進行校核,生成問題庫,形成質量報告。
治清洗:去除重復數據、補充不完整數據、修正錯誤數據,形成主數據。
治加工:發掘數據價值,轉化數據為信息,對數據進行標簽處理,形成數據洞察。
治安全:識別敏感數據,明確責任人及權限,對數據進行分類分級,形成安全策略。
治共享:構筑數據共享通道,提供數據訪問統一入口,形成自服務的共享平臺。
東軟大數據治理的目標
數據標準化
消除歧義,剔除重復
補全缺失,修正錯誤
統一碼表,理清關系
流程規范化
規范數據生產,統一來源
規范數據變更,統一流轉
規范數據共享,統一出口
治理常態化
建立長效工程,循序漸進
確立業務目標,小步快跑
樹立治理文化,長治久安
價值可視化
量化指標,價值可衡量
資產全景,價值可展現
全鏈分析,價值可跟蹤
監管智能化
數據操作留痕,可追溯
安全權責明晰,可監測
差異智能監測,可覺察
東軟大數據治理解決方案使用系統的方法來解決政府及企業如今所面臨的數據治理難題,提供一體化的解決方案,用來透明地管理全行業各類系統中龐雜的數據,形成一套標準、規范、準確、干凈、完整的數據資產。
來源:東軟平臺產品https://platform.neusoft.com/