作為一名數(shù)據(jù)分析師,一提到數(shù)據(jù)可視化就會(huì)感到莫名興奮,我認(rèn)為數(shù)據(jù)可視化有兩個(gè)非常重要的部分:一個(gè)是數(shù)據(jù),一個(gè)是可視化。而我們最常見(jiàn)的問(wèn)題就是一看已經(jīng)有了數(shù)據(jù),卻不知道如何去可視化。
市面上有相當(dāng)多的可視化工具,絕對(duì)能夠挑花你的眼,但這些大多是門檻比較高的工具,比如Gantti、Paper.js、Highchart.js等等,不得不說(shuō),它們?cè)诩夹g(shù)層面上確實(shí)做的很牛逼,也很成熟。但是針對(duì)的使用人群也比較單一,就是程序員。
個(gè)人覺(jué)得在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的使用是會(huì)越來(lái)越普及的,現(xiàn)在的很多做數(shù)據(jù)類工具的公司都在企圖讓數(shù)據(jù)分析變成一件沒(méi)門檻的事,只有大家都能輕松上手,才能真正實(shí)現(xiàn)數(shù)據(jù)價(jià)值最大化。
所以站在這個(gè)角度上說(shuō),想給大家推薦幾款人人可用,能夠快速給數(shù)據(jù)賦能的可視化工具。
數(shù)據(jù)可視化的目的?
在推薦工具之前我們需要回答另外一個(gè)問(wèn)題,你需要用這些數(shù)據(jù)可視化的工具來(lái)做什么,實(shí)現(xiàn)什么目的?
- 也許你因?yàn)橛幸粋€(gè)完整的想法,已經(jīng)通過(guò)事實(shí)驗(yàn)證了,需要用更直觀易懂的方式來(lái)展現(xiàn)出來(lái),從而講述一個(gè)邏輯或者是一個(gè)故事;
- 也許你是有大量的數(shù)據(jù),你想怎么從這些數(shù)據(jù)中間發(fā)現(xiàn),挖掘,并展現(xiàn)一些數(shù)據(jù)背后的知識(shí)或者洞察,發(fā)現(xiàn)等;
- 也許你是有各種各樣的數(shù)據(jù),但是你不懂?dāng)?shù)據(jù)建模,編程,或者數(shù)據(jù)清洗,你需要一個(gè)易用的數(shù)據(jù)可視化工具實(shí)現(xiàn)通過(guò)拖拽就能完成數(shù)據(jù)的可視化,并且可以給出最合適的展示圖形;
- 也許還有其他的各種場(chǎng)景,但是所有數(shù)據(jù)可視化工具都有他核心服務(wù)的一個(gè)場(chǎng)景,漂亮,易用,簡(jiǎn)單,協(xié)作,智能,等等都是每一個(gè)數(shù)據(jù)可視化工具的父母給予他的一個(gè)標(biāo)簽,我們需要匹配相關(guān)的標(biāo)簽來(lái)做對(duì)應(yīng)的推薦。
首先要明確數(shù)據(jù)分析是需要以自我需求為導(dǎo)向的,拋開(kāi)目的推薦可視化工具都是刷流氓。
我們可以將他們分類為:
- 個(gè)人自助式分析:非編程式可視化,能夠適合業(yè)務(wù)人員、運(yùn)營(yíng)人員等進(jìn)行自我數(shù)據(jù)分析,不需要依賴IT人員,代表工具比如python、FineBI、Tableau等BI工具;
- 指標(biāo)監(jiān)控型報(bào)表:能夠及時(shí)反映業(yè)務(wù)實(shí)際情況,給予數(shù)據(jù)分析支持進(jìn)行預(yù)測(cè)分析、決策診斷等,主要工具是應(yīng)用于企業(yè)級(jí)的報(bào)表平臺(tái),國(guó)內(nèi)除了FineReport似乎也沒(méi)有別的;
- 動(dòng)態(tài)數(shù)據(jù)可視化:能夠?qū)崿F(xiàn)動(dòng)態(tài)實(shí)時(shí)數(shù)據(jù)的更新與展示,除了時(shí)間序列數(shù)據(jù),還有動(dòng)態(tài)路徑數(shù)據(jù)、實(shí)時(shí)軌跡數(shù)據(jù)等等,比較專業(yè),代表工具為ECharts等;
基于這一假設(shè),開(kāi)始基于目的性推薦幾款數(shù)據(jù)可視化工具。
一、個(gè)人自助式分析
1、FineBI
簡(jiǎn)潔明了的數(shù)據(jù)分析工具,也是我個(gè)人最喜歡的可視化工具,優(yōu)點(diǎn)是零代碼可視化、可視化圖表豐富,只需要拖拖拽拽就可以完成十分炫酷的可視化效果,擁有數(shù)據(jù)整合、可視化數(shù)據(jù)處理、探索性分析、數(shù)據(jù)挖掘、可視化分析報(bào)告等功能,更重要的是個(gè)人版免費(fèi)。
主要優(yōu)點(diǎn)是可以實(shí)現(xiàn)自助式分析,而且學(xué)習(xí)成本極低,幾乎不需要太深?yuàn)W的編程基礎(chǔ),比起很多國(guó)外的工具都比較易用上手,非常適合經(jīng)常業(yè)務(wù)人員和運(yùn)營(yíng)人員。
在綜合性方面,F(xiàn)ineBI的表現(xiàn)比較突出,不需要編程而且簡(jiǎn)單易做,能夠?qū)崿F(xiàn)平臺(tái)展示,比較適合企業(yè)用戶和個(gè)人用戶,在數(shù)據(jù)可視化方面是一個(gè)不錯(cuò)的選擇。
2、python
本來(lái)沒(méi)想把python放進(jìn)來(lái)的,畢竟python這種腳步語(yǔ)言學(xué)習(xí)起來(lái)是比較麻煩的,但是最終考慮還是python太強(qiáng)大了,數(shù)據(jù)分析可視化只是python的一小部分應(yīng)用方向,如果你不想敲代碼的話,建議忽略這一節(jié)。
其實(shí)利用Python可視化數(shù)據(jù)并不是很麻煩,因?yàn)镻ython中有兩個(gè)專用于可視化的庫(kù)matplotlib和seaborn能讓我們很容易的完成任務(wù)。
3、Tableau
Tableau是各大外企在用的數(shù)據(jù)分析類報(bào)表工具,個(gè)人感覺(jué)主打的是:人人都會(huì)用的數(shù)據(jù)分析工具,通過(guò)簡(jiǎn)單的圖形化操作(類似Excel)就可以得出自己想要的分析結(jié)果。
原理是通過(guò)連接公司數(shù)據(jù)庫(kù)基于一定的SQL語(yǔ)法建立基本數(shù)據(jù)集,對(duì)數(shù)據(jù)集進(jìn)行分析。這對(duì)數(shù)據(jù)集的完整性有很高的要求。
二、指標(biāo)監(jiān)控型報(bào)表
1、FineReport
可視化的一大應(yīng)用就是數(shù)據(jù)報(bào)表,而FineReport可以自由編寫整合所需要的報(bào)表字段進(jìn)行報(bào)表輸出,支持定時(shí)刷新和監(jiān)控郵件提醒,是大部分互聯(lián)網(wǎng)公司會(huì)用到的日常報(bào)表平臺(tái)。
尤其是公司體系內(nèi)經(jīng)營(yíng)報(bào)表,我們用的是商業(yè)報(bào)表工具,就是FineReport。推薦他是因?yàn)橛袃蓚€(gè)高效率的點(diǎn):
- 可以完成從數(shù)據(jù)庫(kù)取數(shù)(有整合數(shù)據(jù)功能)—設(shè)計(jì)報(bào)表模板—數(shù)據(jù)展示的過(guò)程。
- 類似excel做報(bào)表,一張模板配合參數(shù)查詢可以代替幾十張報(bào)表。
三、動(dòng)態(tài)數(shù)據(jù)可視化
一個(gè)使用JavaScript實(shí)現(xiàn)的開(kāi)源可視化庫(kù),底層依賴輕量級(jí)的矢量圖形庫(kù)ZRender,提供直觀,交互豐富,可高度個(gè)性化定制的數(shù)據(jù)可視化圖表,它是由百度團(tuán)隊(duì)開(kāi)源的。
在實(shí)際開(kāi)發(fā)中使用的往往會(huì)要求從服務(wù)器端取數(shù)據(jù)進(jìn)行動(dòng)態(tài)顯示,一般來(lái)說(shuō)數(shù)據(jù)請(qǐng)求過(guò)程如下:
- 客戶端通過(guò)ajax發(fā)送請(qǐng)求;
- 服務(wù)器端Servlet接收請(qǐng)求;
- 生成json數(shù)據(jù)并返回給客戶端;
- 客戶端接收數(shù)據(jù)后顯示。
通常都是用Jsp+Servlet+Echarts來(lái)實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)可視化的。