發電公司如何構建自己的數據倉庫?
這問題有點專業哇,火電、水電、核電還都有區分,火電畢竟不算太環保,核電咱也講不清楚,挑個簡單的水電來說吧!
說到大數據,很多都覺得數據應該用有5V特性(我就不贅述了,大家可以直接問度娘),為了描述簡單一點我梳理一下數據有哪些:
1.水電運行設備狀態數據,結構化;
2.運維檢修數據,結構化/半結構化;
3.設備/配件,出入庫數據,結構化;
4.產、耗能數據,結構化;
5.引入設備運行外部指標,聲音,圖像等,非結構化數據
6.其他數據
設定大數據計算亟待解決什么問題
1.產,耗均能比
2.設備、零件、管纜故障分析
3.檢修機制
4.設備、零部件負載閥值
5.建立故障處置預案庫
6.我說我沒想好會不會被打-_-||,大數據是可以碰撞出一些本來沒有預設的東西。
好了,匯聚數據要解決以下問題
1.結構化數據入數據庫(數據倉庫也行)
說話簡單,做起來不簡單哇,清洗數據工作帶來的是不僅僅是IT層面,往往還需要修改配套的業務流程及實際習慣;
2.非結構化數據匯聚存放
生命周期管理(自補,問度娘吧),有問設備都更換了是不是就可以刪除這些數據了呢,其實不然,新老對比還是需要這些數據的,那么換新設備,是不是就可以完結它的生命周期了呢,其實還可以看看新老設備故障對比,更換零部件成本對比……所以數據作為重要的生產資料其實留著還是挺好的!(我不是存儲產商哇),可以做數據的冷熱分級存儲。
3.數據采集和匯聚的管道
采集得想想辦法,不同設備老化故障都有一定的采集方法(連瀝青、混凝土都可以加入監測粒子了呢)。匯聚傳輸通道建議還是走互聯網吧,不過建議可以走特殊封裝,如sm3非對稱加密,sm請自行腦補吧。
另外需要水文資料可以向水利申請,他們有遙測數據(( ??? ? ??? )別問我遙測,也別問我為啥知道);氣象也有數據可以申請的。不過估計這些數據要么走專網,要么就只能拷硬盤了(光盤是放不下的)
接下去選著一個大數據的平臺和合適的算法,碰撞吧,小宇宙……串臺詞了
關于耗能解釋一下,一般發電機組發動起來就不停的,停下來要再開就需要一定時間的預熱,所以有些水電在枯水季的非用電高峰,會在下游抽水回來發電,這個耗能是大頭!!!所以晚上電才會有半價喲。
服務器最好搭建集群組來計算,數據庫呢最好能有分級高性能存儲支撐!
小編問了難題還是要支持一下,說的不對大家見諒!