色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

如何從概念上分清數據挖掘與數據分析?

錢斌斌2年前16瀏覽0評論

通俗點說,數據分析是本科生,通過簡單的統計來觀察小數據,解決相對簡單問題,比如用戶年齡分布分析;而數據挖掘是研究生,通過機器學習算法建模,要深挖大數據背后的模式,來解決復雜問題,比如個性化推薦。

方法論方面:一個是統計,一個是機器學習

數據分析作用的多數是概率統計理工具,比如留存率的分析,大多數上是對歷史數據的某個維度的展示。而數據挖掘,背后的目標隱藏在大數據中,需要通過機器學習、深度學習理論去預測,比如挖掘用戶的喜好,本質上是對用戶未來行為的預測。

工具層面:一個是excel,一個是代碼

數據分析,通過excel可以基本搞定,excel內置很多統計函數,頂多做個簡單的線性回歸分析。而數據挖掘,將要利用大數據、機器學習等用更專業的編程語言來實現,比如python調用sklearn或xgboost,來實現。

數據層面:一個是小數據,一個是大數據

數據分析數據量上相對小,或者很多數據都進行了聚合。比如通過分析某商品的近幾年的銷量來看市場趨勢。而數據挖掘,背后對應的大部分為海量數據,比如通過用戶行為日志,來對用戶做千人千面的個性化推薦。

實際項目中,以實際需求驅動,根據實際情況選不同的方法。