1、分析工具:Excel、Tableau等屬于分析工具類;
2、分析語(yǔ)言:Python、R等屬于分析腳本語(yǔ)言。
3.挖掘工具:像SPSS/SAS類就屬于挖掘工具。此類挖掘工具側(cè)重探索隱藏得比較深的業(yè)務(wù)知識(shí)和模式,挖掘工具側(cè)重于業(yè)務(wù)的影響因素分析、預(yù)測(cè)性分析等等,講究分析模型(比常規(guī)的分析方法要復(fù)雜),在分析模型中不見(jiàn)得有統(tǒng)計(jì)指標(biāo),而是模式。
常用的分析模型:影響因素分析(相關(guān)/方差/列聯(lián)分析)、數(shù)據(jù)預(yù)測(cè)模型(回歸預(yù)測(cè)/時(shí)序預(yù)測(cè))、分類預(yù)測(cè)模型(決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等),當(dāng)然還其它更多的模型,比如聚類、關(guān)聯(lián)等等。
理論上,高級(jí)的數(shù)據(jù)挖掘工具也能夠?qū)崿F(xiàn)統(tǒng)計(jì)分析功能,但坦白地說(shuō),用挖掘工具來(lái)做統(tǒng)計(jì)工具分析,其效率反而沒(méi)有統(tǒng)計(jì)工具高;而且操作比較復(fù)雜,可視化功能也相對(duì)較差。
而且,當(dāng)前絕大多數(shù)公司,都是在用Excel/SQL來(lái)做數(shù)據(jù)分析,可見(jiàn)他們并沒(méi)有什么復(fù)雜的業(yè)務(wù)問(wèn)題需要用到更高級(jí)的挖掘工具,簡(jiǎn)單的工具已經(jīng)足以勝任平時(shí)的業(yè)務(wù)數(shù)據(jù)分析了。實(shí)際上平時(shí)的工作中80%的業(yè)務(wù)數(shù)據(jù)分析都可以用Excel/SQL或BI工具來(lái)完成。
分析語(yǔ)言本身也可以看作是一種特殊的分析工具。只是這種分析工具與SPSS相比不一樣, SPSS只需要通過(guò)拖拉就能夠?qū)崿F(xiàn)數(shù)據(jù)分析結(jié)果,但Python/R則需要通過(guò)寫(xiě)腳本寫(xiě)代碼的方式來(lái)運(yùn)行分析,所以用Python/R做數(shù)據(jù)分析就比較復(fù)雜。
作為工具, SPSS中已經(jīng)內(nèi)置和封裝了很多常用的分析方法、分析模型,所以你不需要花太多的時(shí)間去弄明白是怎樣實(shí)現(xiàn)的,甚至你有時(shí)不需要知道數(shù)據(jù)公式和原理(如果知道的話就更好了),你只需要聚焦在業(yè)務(wù)層面,就可以實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)分析,得到良好的分析結(jié)果。所以,使用工具的優(yōu)點(diǎn)在于:簡(jiǎn)單易操作,不需要掌握深?yuàn)W的理論知識(shí)。
但是,正因?yàn)楣ぞ叻庋b了具體的實(shí)現(xiàn)過(guò)程,無(wú)法對(duì)分析模型進(jìn)行修改或自定義,如果你們公司需要一些特殊的分析模型,或者需要對(duì)原有的模型進(jìn)行修改或優(yōu)化,而分析工具又不支持的話,那么此時(shí)你就得要使用分析語(yǔ)言Python來(lái)實(shí)現(xiàn)自定義的分析流程了。
當(dāng)你使用Python分析語(yǔ)言時(shí),你就得必須了解分析模型的數(shù)學(xué)原理及實(shí)現(xiàn)過(guò)程,還得要掌握編程的一系列技能,才能夠勝任Python/R的分析工作。同時(shí),你得花大量的時(shí)間在如何實(shí)現(xiàn)模型上,而無(wú)法真正聚焦在業(yè)務(wù)問(wèn)題的解決上了。
所以,比起用分析工具,用Python的好處是可以任意修改或定制化模型、可以自動(dòng)化實(shí)現(xiàn)分析流程,但壞處也是顯而易見(jiàn)的(分析復(fù)雜、周期較長(zhǎng)、技能要求高)。你擁有了定制化,就失去了簡(jiǎn)潔;你擁有了超強(qiáng)的功能,就增加了復(fù)雜度,此即有得就必有失了。
e??~??