在一個工作交流群里,一個朋友說想轉行做數據分析師,隨后很多人開始討論,半路出家的能找到工作嗎?做數據分析師需要哪些知識和技能?
今天我們就來說說商業數據分析師的7類崗位,以及基礎技能。要知道數據分析這一行,入行容易,精通難。方法工具都要有。
一、商業數據分析的7類崗位
1.業務統計人員
理解企業數據,發現業務問題,開發預測模型,幫助企業更好地進行信息決策。
2.數據挖掘人員
進行知識發掘積累,需要熟悉各種數據挖掘算法,可以進行深層次的客戶識別、畫像,以滿足營銷、風控和客戶關系管理方面的需要。
3.大數據分析人員
處理海量異構數據,借助其他工具進行數據的搜集、儲存和清洗。同時與數據挖掘人員、報表制作人員、業務統計分析人員合作完成工作。
4.業務支持
創建業務報表或進行業務分析。
5.報表制作人員
撰寫SQL程序進行查詢并生成報表。
6.數據管理人員
為需求人員提供便捷的數據訪問服務。
7.數據架構人員
流處理、模型開發和數據質量管理設計所需的架構和方法;平臺架構人員:負責企業管理平臺的安裝、配置、管理和維護。
二、什么是數據分析?
數據分析是基于商業目的,收集、整理、加工和分析數據,提煉有價值信息,并指導實踐的過程。數據分析的三大作用,主要是現狀分析、原因分析和預測分析。過程主要包括:明確分析目的與框架、數據收集、數據處理、數據分析、數據展現、撰寫報告6個階段。
1、明確分析目的與框架
一個分析項目,它的數據對象是誰?商業目的是什么?要解決什么業務問題?數據分析師對這些都要了然于心,隨后整理分析框架和分析思路。
例如,減少新客戶的流失、優化活動效果、提高客戶響應率等。每個項目對數據的要求不同,使用的分析手段也是不一樣的。(本文第三部分將詳細介紹4種常用分析框架。)
2、數據收集
數據收集是數據分析的基礎,按照確定的分析框架,有目的的收集、整合相關數據。
3、數據處理
數據處理是指對收集到的數據進行加工、整理,它是數據分析前必不可少的階段,也是整個數據分析過程中最占據時間的,耗費時間的程度取決于整個項目對數據倉庫和數據質量的要求。
數據處理的常用方法有:數據清洗、數據轉化等。
4、數據分析
在明確了分析目的與框架,收集處理好數據后,就可以開始著手進行數據分析了。我們需要通過特定手段、多種方法和行業技巧對數據進行探索,從中發現因果關系、內容聯系和業務規律等,為商業目的提供參考。
到了這個階段,要能駕馭數據、開展分析工作,就要使用工具和方法了。
在分析方法方面,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等概念,及他們的原理、使用范圍、優缺點;在分析工具方面,數據分析師一般首選Excel,同時搭配一個專業的分析軟件,如數據分析工具SPSS/SAS/Matlab等,便于進行一些專業的統計分析、數據建模等。
5、數據展現
俗話說:字不如表,表不如圖。借助數據展現手段,能更直觀的讓數據分析師表述想要呈現的信息、觀點和建議。一般情況下,數據分析的結果都是通過圖表方式來呈現的。
常用的圖表包括:餅圖、折線圖、柱形圖/條形圖、散點圖、雷達圖、金字塔圖、矩陣圖、漏斗圖、帕累托圖等。
6、撰寫報告
最后階段,就是撰寫數據分析報告,這是對整個數據分析成果的呈現。通過分析報告,把數據分析的目的、過程、結果及方案完整呈現出來,以供商業目的提供參考。
Tips: 一份好的數據分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結構清晰、主次分明可以讓閱讀者正確理解報告內容;圖文并茂,可以令數據更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。
另外,數據分析報告需要有明確的結論、建議和解決方案,不僅僅是找出問題,后者是更重要的,否則稱不上好的分析,同時也失去了報告的意義,數據的初衷就是為解決一個商業目的才進行的分析,不能舍本求末。
三、4種常用分析框架
從管理和業務的角度提出的分析框架,指導著后期數據分析工作的開展。
營銷方面的理論模型有:4P、用戶使用行為、STP理論、SWOT等。
管理方面的理論模型有:PEST、5W2H、時間管理、生命周期、邏輯樹、金字塔、SMART原則等。
本文主要說明:5W2H、邏輯樹、4P、用戶使用行為這4個比較實用的理論。
1、5W2H
定義:何因(Why)、何事(What)、何人(Who)、何時(When)、何地(Where)、如何做(How)、何價(How much)
適用范圍:用戶行為分析、業務問題專題分析、營銷活動等。
優點:廣泛應用于企業營銷、管理活動,對于決策和執行性的活動措施非常有幫助,也有助于彌補考慮問題的疏漏。
2、邏輯樹
定義:邏輯樹,又稱問題樹、演繹樹或分解樹等。它將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展。
適用范圍:業務問題專題分析
優點:邏輯樹的作用主要是幫你理清自己的思路,避免進行重復、無關的思考。邏輯樹能保證解決問題的過程的完整性,能將工作細分為便于操作的任務,確定各部分的優先順序,明確地把責任落實到個人。
缺點:涉及的相關問題可能有遺漏,雖然可以用頭腦風暴把涉及的問題總結歸納出來,但還是難以避免存在考慮不周全的地方。所以在使用邏輯樹的時候,盡量把涉及的問題或要素考慮周全。
使用邏輯樹必須遵循以下3個原則:
要素化:把相同問題總結歸納成要素。
框架化:將各個要素組織成框架,遵守不重不漏的原則。
關聯化:框架內的各要素保持必要的相互關系,簡單而不孤立。
3、4P
定義:4P,即產品(Product)、價格(Price)、渠道(Place)、促銷(Promotion)
適用范圍:主要用于公司整體經營情況分析。
4、用戶使用行為
用戶使用行為,即用戶為獲取、使用物品或服務所采取的各種行為。
用戶使用行為的完整過程
通常情況下,用戶對產品首先需要有一個認知、熟悉的過程,然后試用,再決定是否繼續消費使用,最后成為忠誠用戶。在這個鍋層中,我們可以利用用戶使用行為理論,梳理產品分析的各關鍵指標之間的邏輯關系,構建符合公司實際業務的產品分析指標體系。
它的缺點是用途較為單一,就是用于用戶行為的研究分析。
數據分析師的發展前景普遍如何?本文,我們收集了目前國內主流招聘網站的一些相關數據,通過可視化的方式來看看這一崗位的現狀。
分析目的
基于招聘網站的相關數據,通過可視化分析,探究以下問題:
哪些行業對數據分析師需求量最大?
招聘企業普遍處于哪個階段(融資情況,上市情況)?
數據分析崗位學歷要求?
數據分析崗位工作經驗要求?
數據分析崗位薪水情況?
數據整理
我們隨機采集了目前較為主流的幾個招聘網站有關“數據分析”崗位的數據,包括拉勾網、智聯招聘、獵聘網以及BOSS直聘。
采集字段為:職位、公司、薪水、經驗要求、學歷要求、所屬行業、企業融資情況
分析工具
首先使用八爪魚數據采集工具(免費版,可從官網http://www.bazhuayu.com下載),添加搜索網址,并選擇我們所需的字段,開始采集。對于新手來說,八爪魚數據采集工具是不錯的選擇,可以沒有任何代碼基礎,也不需要寫正則等采集規則(火車采集器會復雜一點,需要寫正則)。
然后我們將采集到的數據導出,導出格式為Excel,由于各招聘網站字段有出入,需要使用Excel工具進行簡單的整理。
數據分析工具我們使用DataHunter數據可視化分析平臺Data Analytics,同樣也是因為Data Analytics相比于Excel等產品更為簡單易用,拖拽式的操作即可完成分析過程。對于個人用戶,Data Analytics完全免費,可通過在官網(http://www.datahunter.cn)注冊即可使用。
分析結果
這里并未把所有行業都顯示出來,只選擇了占比較高的一些。數據結果顯示,金融行業、數據服務、游戲這三個行業對數據分析師的需求更為強烈,醫療、信息安全、生活服務、社交等行業也在招聘數據分析相關崗位。其它行業還包括了計算機硬件、廣告營銷、文化娛樂等。
與數據分析相關的崗位占比,可以看到,絕大部分企業在招聘數據分析師,其它崗位還包括數據分析工程師、數據分析經理、數據分析專家以及數據分析實習生,盡管都是與數據打交道,但不同崗位對技能的要求還是有一些區別的。
薪水方面,我們也只是顯示了占比較多的薪水區間。可以看出,數據分析崗位的薪水普遍在10K-20K的區間,10K以下的崗位也有一定的占比,當然,從整體數據來看,數據分析崗位的薪水跨度區間還是很大的,實習生工資最低只有3K左右,而最高薪可以達到80K-100K。
我們可以看到,絕大部分崗位都需要有一定的工作經驗,其中,3-5年占比最多,其次是1-3年。當然,還有部分企業要求有5-10年的工作經驗。而學歷方面,本科占比最多,有部分要求較高的職位,還要求具備博士、碩士學歷。
在所有招聘數據分析相關崗位的企業中,可以看到不少互聯網巨頭對于數據分析師都有強烈的需求,提供的崗位也比較多,其中包括了京東、美團、餓了么、近日頭條、58同城、搜狐、聯想等。另外,可以看到,大部分企業均已拿到融資或上市,也有部分企業還處于未獲得融資狀態或不需要融資。