零基礎如何入門數據分析師?
大數據時代,數據為王。用數據做分析,給公司決策提供指導性意見,是眾多公司在這個精細化運營,降本增效的時代必須要做的事情。各大企業都建立了數據分析部門。截止目前,我國共計1400萬數據分析人才缺口,市場規模預計將在2025年達到2000億!數據分析與其說是一個崗位,更是一個重要技能,擁有這項技能意味著你的就業前景更好,職業發展更廣。
那么數據分析零基礎應該怎么學呢?下面我將從數據分析的學習周期、學習內容以及職業發展規劃三個方面,帶大家充分了解數據分析這一行業。
1、 數據分析要學多久?
每個人的學習能力和基礎都不同,所以數據分析的學習周期也不同。如果是通過自學的方式,由于無專業老師指導及無法系統的學習,這個周期可能會很長。一般來講,如果零基礎的學習者進行系統的培訓,最快也要將近三、四個月的時間。數據分析的學習應該首先從熟悉表以及表結構開始,它的原點一定是在首先了解熟悉Excel的基礎上,在能夠從數據庫里提數的基礎上再進行技能的升級。你的技能從能夠從數據庫里提數,并且用Excel和BI處理幾萬行的小數據量,到使用python批量化處理幾十萬甚至百萬行中量級數據量,到最終使用大數據的相關組件,例如hadoop,spark,flume等組件處理千萬級甚至是億級大數據量。每一個階段所需要的工具加方法論都是不一樣的。一般而言,對于自學而成為能處理中量級數據量的分析師而言,得至少入門python的pandas,numpy等數據處理庫。這個零自學的周期,也一般跟悟性和自律有關,悟性和自律性高的同學,可能在4個月能夠掌握;如果悟性和自律性不高的同學,這個周期有可能就是半途而廢,無法估量時間了。這里給大家推薦一下聚數學院的《數據分析實戰就業班》(聚數學院),專注于培養數據分析師的數據處理能力、數據分析能力和數據挖掘能力,課程內容從數據庫管理、統計理論方法、數據分析主流軟件的應用到數據挖掘算法等,對一整套數據分析流程技術進行系統講解并配以實戰練習,學完之后,學習者可以直接達到數據分析師的水平。
2、 數據分析要學什么?
(1) Excel
說起Excel可能會有人覺得這個很簡單,但是Excel確實是一個功能強大的利器。零基礎學數據分析師一定要從Excel入門,因為Excel是處理小型數據量企業用的最多的工具,在基礎數據分析師與數據運營崗位中具有極其重要的地位。作為數據分析師的核心工具,具體學習內容有Excel函數技巧(查找函數、統計函數、邏輯函數)、Excel快速處理技巧(格式調整、查找定位、快捷鍵技巧等)和Excel可視化技巧(組合圖、條形圖、數據氣泡地圖)等。
(2) Mysql
SQL同樣是零基礎學習數據分析的核心內容。因為作為數據分析師,你首先要解決的問題就是你要有數據來做分析。通常企業都會有自己的數據庫,數據分析師首先得根據業務需要知道自己要從企業數據庫中提取哪些數據。企業如果部署本地數據庫,那么一定是SQL語言做提取數據的語言。SQL簡單易懂,非常容易上手,并且是非學不可的。SQL語言從學習MySQL數據庫開始,涉及對表結構數據的增刪改查。真正在企業里面,數據分析師一般不會有增刪改的權限,只會有查的權限。學員應該重點掌握查的各種句式。
(3) Python
Python的基礎對于數據分析師而言是非常重要的。對于十萬級或者百萬級數據量而言,Excel和BI都會因為運行卡頓而變得完全無法使用。然而在實際企業運用中,一次性處理十萬級以及百萬級數據又是非常常見的。而Python則是處理這種中量級數據的利器。因為Python有很多的第三方強大的庫,比如Numpy、Pandas、Matplotlib、Seaborn等。這些庫能讓數據分析師對百萬數據進行數據清理和畫圖分析。Python不僅能數據清洗,畫圖,還能用sklearn進行大數據算法分析。雖然Python是數據分析的重要工具,但是不同的職業發展方向,Python掌握的程度也是不一樣的。
(4) BI商業智能工具
BI可以理解成Excel圖表透視表的高級版。BI是將表與表相連,然后得出很多指標圖。它是一個大屏的看板,如下圖:
企業銷售指標,運營指標,物流指標等等。這些圖可以表示企業在過去5個月的平均銷售單價,過去24個月銷售的物流發貨量的變化曲線,甚至是現在實時的銷售額,這些都是企業關心的問題。有了這個看板,領導層在監控企業業務方面就有了非常直觀的數據,以供他們及時做出決策調整?,F在市面上比較流行的BI軟件,有FineBI,PowerBI等。而這些BI軟件實際上都是非常類似的,學起來難度也不大。學習FineReport、FineBI由入門到精通,快速挖掘數據價值,將這些數據轉化成有用的信息,讓企業決策有數據依據,從而驅動企業決策和運營。
(5) 數理統計與數據運營
數理統計和數據運營方法論是數據分析師的理論基石。數理統計包括概率論,統計學,線性代數,以及基礎的微積分理論。這些內容都不需要理解的很深,但是對它們的原理以及內涵都需要有所掌握。由于整個數據分析的源頭其實就是脫胎于描述性統計分析的。描述性統計分析是對樣本的總數、均值等指標做統計的;而數據分析后續涉及到的算法則是架構在統計學上更深一層次的建模。因此,掌握數理統計的相關知識對于入門數據分析師而言是基礎且必要的。
那數據運營方法論是什么呢?數據運營方法論實際上是學習各個行業所運營的分析模型。例如,對電商而言,漏斗分析可以分析出來進入主頁的人數PV1,到進入服裝板塊的人數PV2,PV2/PV1就可以得出一個進入服裝板塊的比率。還有很多通用的分析模型:相關分析,A/B test等。對于想往管理路線發展的數據分析師來講,數據運營是必須要學習的知識。其實數據運營知識也不復雜,就是根據自身業務需求將指標拆解到最細,然后運用同比和環比兩種數據分析方式。
(6) 機器學習
最后一個進階要求數據分析師掌握對大量數據分析的能力。這種分析就不只是停留在描述統計分析和運用數據運營方法進行分析了,而是進行預測分析。預測分析的本質是利用已有的數據做出一套變量x,與預測最終值y之間的關系(也就是數學算法公式),然后利用這套算法,將更多的x輸入算法中去得出一個預測的y值,這里聽不懂沒關系??傊?,這個階段的數據分析是利用大量的歷史數據構建出一套數學公式(也就是算法),用這個數學公式去對未來進行預測。比如說:一個人大量地刷體育短視頻,根據算法可以得出這個人可能對觀看足球比賽的騰訊體育會員感興趣。這類推斷和預測對于商業世界是有著極大變現意義的。要想成為掌握算法的數據分析師,機器學習是不可跳過的入門。學員應該從簡單的一元回歸,多元回歸,以及邏輯回歸學習等,逐漸學習更多像決策樹,隨機森林,SVM等更高級的算法。
3、 數據分析的職業發展規劃?
一般來講,數據分析有兩條發揮路線,一條是管理路線,一條是技術路線。往管理端發展,比如初級數據分析師,到數據運營,到數據分析經理、數據運營總監等等。這條發展路徑主要要求統計學、Excel、PPT等技能,需要撰寫市場分析報告。這條路看似技術掌握不用太深,但是對業務的理解要極深。而精深的業務理解需要時間和深度的業務鉆研精神。如果你是非數學、計算機和統計學專業的朋友,比較適合這條非技術的職業發展之路。
而向技術方向發展,則目標會非常明確。一是深入往數據挖掘方向發展,學習深度神經網絡,NLP等前沿算法。二是深入數據分析開發,把大數據組件hadoop,spark等等大數據組件學好學精。這是一條技術類的發展方向,要求更高的統計學能力、數理能力以及編程技巧。
實際上,無論是非技術的業務方向和技術專家方向都要的是兩個字:鉆研。當然聽到這里,我們也需要重重地闡述一下:入門初級數據分析是不難的。而后半段,要成為一個優秀的數據分析師是難的,是需要刻苦鉆研精神的。
如果看到這里,你覺得自己心理上已經就入門數據分析師方向做好了準備,但是你是零基礎實在不知道如何入行的話,歡迎私聊獲取免費的數據分析師知識點大綱,并且免費做數據分析師的入門咨詢。