大數據與公安工作
“大數據”的深度應用,開啟了公安警務工作的新紀元。傳統方式的治安防控體系已逐漸被以“大數據”為核心的信息化新技術所取代,信息化轉型已成為公安機關掌控當下和贏得未來的必由之路。
一、“大數據”是基本含義及其帶來的新機遇
近年來,“大數據(BigData)”一詞被專家和媒體頻繁提及,所謂大數據,是指通過對海量數據的收集、整理、歸類、分析及預測,找到數據的內在聯系及規律,從而獲取新的信息和分析結論。大數據與傳統的數據并不是割裂開的,而是數據積累發展到一定程度,形成的海量數據,并且無法通過現有的技術和手段實現快速處理,這些海量數據,我們稱之為大數據。大數據是數據、技術與應用三者的有機統一,其基于可持續海量數據的集合,集成應用各種現代高新技術,以達到獲得有價值信息的目的。大數據的發展應用為公安機關運用科技手段構建立體化現代化社會治安防控體系,推動警務機制轉型升級帶來新的機遇,其深度應用給公安工作帶來了前所未有的機遇。
(一)實現大數據的整合共享,有助于推動社會管理部門的協同合作,促進社會治理體制從碎片化到集成化轉變。
(二)依靠現實數據決策,推動社會治理方式的根本性變革。
(三)為及時全面掌握社會信息提供了技術支撐,實現從靜態管理向動態管理的轉變。
(四)為最終決策提供參考,是實現社會治理方式由簡單粗放到科學決策轉變的重要抓手。
二、目前公安工作的應用
目前對于公安大數據的應用方式,可以分為以下三個層次:
(一)統計查詢:這是對大數據最基本的應用方式,主要面向歷史與現狀,回答已經發生了什么事情,如流動人口分區域統計、實有車輛歸屬地統計、各類案件的數量分布和趨勢。
(二)數據挖掘:是目前大數據的核心應用方式,其重點不在于發現因果,而是發現數據之間的關聯關系。這種關系可能可以直觀解釋,也可能不能馬上發現其中的深層次原因,但對工作具有一定指導意義,比如季節氣候與某些類型案件的關聯關系、車輛活動范圍、活動習慣與黑車的關聯關系。
(三)預測預判:是大數據應用未來的發展方向,在數據統計、分析、挖掘的基礎上,建立起合適的數據模型,從數據的關聯關系入手,推導出因果關系,能夠對一定時期內的趨勢走向做出預測,對危險信號做出預警,指導預防工作的走向。
這三個層次具體到實際業務系統,包括圖偵、車輛特征分析系統、人員特征分析系統、視頻偵查系統等等。這些系統以普通視頻監控、車輛/人員卡口、智能IPC等監控前端獲取的視頻、圖片、結構化描述為基礎,通過大數據平臺的智能分析,實現如以圖搜圖、語義搜圖、車輛/人員布控、疑似案件對比、詳細特征分析等等深度大數據應用,幫助公安能夠快速、科學地偵破案件。
公安大數據應用于不同警種,由于其實際應用需求的區別,解決的問題也有所區別。如智能交通領域,目前大數據主要應用于車輛的疏導,比如基于不同道路、路口車流量的統計(時、日、月統計等),根據這些統計可以分析不同時段某條道路實時的車流密度、發展方向和趨勢等。這些應用目前已在很多大城市落地,比如平時大家在公交上看到移動電視里播放的上下班高峰路段實時畫面,就是基于大數據的技術分析所得。
2016年12月28日,海南全省公安局長座談會議在海口召開。會議強調,全省公安機關要將“把博鰲亞洲論壇打造成現代化警衛安保示范基地,創建海南警務信息智能島,以禁毒斗爭為龍頭建設‘平安島’”為主要內容的“一地兩島”警務發展戰略作為工作的重中之重全力推進,合力攻堅,努力破解一批基礎性、瓶頸性難題。“一地兩島”警務發展戰略正是公安工作與智能化信息技術高度融合應用,該戰略高度整合社會治理數據資源并深度關聯分析研判,大整合、高共享、深應用全省各類社會信息資源,實現數據資源共享、基礎平臺統一、服務群眾便捷、有效支撐警務實戰,從被動應對處置向主動預測預警預防戰略轉變,提高社會治理智能化水平。
三、“大數據”服務信息化工作時所出現的問題
當前,公安機關在大數據時代還有很多亟待研究解決的難點。
(一)思想觀念難同步。目前,一些公安機關領導和民警在數據采集上還是局限在某些限定的數據上,力求精益求精,并以考核的方式加以固定,而忽視了對其它數據的采集,或者根本沒有預見到哪些數據可以采集進而為我所用。在數據應用上,常常借助傳統的經驗,開展個案化的因果分析,不能考慮出現的新情況,導致效率不高。
(二)數據整合度不理想。近幾年,隨著公安信息中心建設工作的深化,可利用的信息量大大提升,但地區與地區、部門與部門間還不同程度地存在信息壁壘。目前,在公安信息中心整合的數以億計的信息中,社會信息所占比例很少,難以適應“大數據”時代對數據完整性、混雜性的要求;因個別數據的缺失或采集獲取不及時,使得分析研判工作滯后于實際事態發展;警種部門出于自身利益的考慮,對一些可以整合的數據搞數據孤島。
(三)信息處理能力有欠缺。在信息處理中,多沿用傳統的數據分析工具和分析方法,對于多種格式的數據整合力度不夠,對數學模型等技術創新不夠,難以滿足實戰的需要。很多數據的處理還只是簡單的累加、比對和百分比計算,未能完全滿足公安工作的需求,在操作性方面也存在一定的不足。目前,很多地區對視頻監控還主要依靠人工分析,工作效率較低,視頻監控分析軟件沒有共享。
(四)專業人員較匱乏。“大數據”時代需要大量專業的系統研發、數據挖掘、應用數學、統計計量、社會心理等方面的專業人才,但公安機關在這方面專才匱乏,很難見到能夠使用數學模型進行數據分析的人才。同時,從近年來的實際情況看,民警隊伍信息化應用水平得到了顯著的提高,但對于“大數據”的功能和基本應用,大多數還處于懵懂階段。
四、公安大數據的發展趨勢
公安信息化歷經多年一直長于出入境、戶政、執法辦案等規范數據格式和業務流程方面的信息系統建設,而短于面向實戰的分析研判類信息系統建設,主要原因就是后者對于數據綜合利用廣度和數據挖掘分析深度有很高的要求,在數據存儲及運算能力不足、數據采集量不夠的情況下難以取得良好的效果。目前隨著基礎業務系統建設的不斷完善,數據采集手段和技術提升所帶來的數據采集廣度和頻次不斷加大,網絡傳輸能力不斷提升,公安信息化逐漸進入了大數據時代,合理利用大數據與云計算技術提高公安信息化建設水平是一個發展趨勢。
(一)數據架構升級
隨著數據采集量的增大,而且數據類型多種多樣,有結構化數據(比如人口檔案數據、賓館住宿記錄等),也有半結構化和非結構化數據(比如監控視頻、卡口照片等),這對當前公安信息化系統提出了極大挑戰。傳統關系型數據庫和大容量存儲的技術方案即將或已經出現瓶頸。對這些海量數據合理地進行存儲和利用必須要進行架構升級,建立專門的數據中心是一種勢不可擋的趨勢,云計算和大數據會在這些數據中心落地。云計算技術通過對物理資源(CPU、存儲、網絡等)虛擬化,通過資源池的方式,實現應用的彈性擴展和無縫遷移,對資源進行充分利用。大數據技術包含分布式存儲和分布式執行引擎,對海量公安數據進行有效地存儲和利用,當前比較流行的Hadoop、MPP數據庫、內存計算、流式計算、搜索都屬于大數據技術的范疇。云計算和大數據技術當前已在公安內部實現局部落地。
(二)數據價值發現
傳統的基于SQL語句的數據分析方式已無法充分發揮海量數據的價值,公安海量數據需要經過一個價值發現或重新發現的過程。首先,對當前響應時間緩慢、運行狀態不穩定的業務系統基于大數據技術進行升級改造,保證業務系統的正常高效運轉。這中間主要是進行一些業務遷移和升級,以增刪改查的數據處理模式為主。再者,是對已有海量數據的深度挖掘。對于結構化數據(存儲在當前數據庫中的數據),從業務角度出發,綜合利用,深度挖掘數據模型(比如作案人預測模型、突發事件預測模型等),重新發現其潛在價值。對于半結構和非結構化數據(視頻、圖片等),優化語義分析技術,把非結構化數據轉換為結構化數據,提升這部分數據的信息化程度,發揮出其應有的價值。
(三)數據融合創新
大數據的一個特點就是價值密度低,并且僅憑單一類型數據本身無法發揮出應有的價值。不同數據放在一起會發生“化學作用”,往往比單一數據的價值大很多,比如金融數據跟電商數據碰撞在一起,就產生了像小微貸款那樣的互聯網金融;電信數據跟政府數據碰撞在一起,可以產生人口統計學方面的價值,幫助城市規劃人們居住、工作、娛樂的場所。隨著“互聯網+”時代的不斷發展,社會各行業數據化、互聯網化,融合公安數據和社會數據為公共安全服務,做到防患于未然,是公安大數據的真正價值所在。