對于高級的數據分析而言,不一定非得求助于SPSS,SAS這類專業的分析工具,有時候Excel的數據分析功能也能實現從低級到高級層次的跳躍~
so,這里給你介紹幾種Excel在數據分析里的神奇用途~
1、數據透視表
數據透視表是一種交互式的表,可以對數據的不同項目進行快速地統計,并且動態地改變數據的版面布置,讓分析以不同的角度來分析數據。
Excel的數據透視表是一個強大的工具,它可以將海量數據做成各種報表,并實現報表數據的快速切換。
還可以對數據進行統計、排序、篩選。使用交互工具,如切片器、日程表,可以從項目名稱和時間的角度動態地查看數據。
舉個栗子:
貨物銷售數據量十分大,每天都會產生大量的銷量數據,如下圖所示,僅僅只是銷售數據的冰山一角。面對這樣的如何,如何快速分析,不同日期下,不同商品的銷量?不同地區的銷量?不同商品的售價波動情況?不同地區的退貨量?不同銷售員的總銷量大小?不同銷售員的退貨總量大小?
答案是將海量數據建立成數據透視表,可以通過選擇字段的方式,快速切換數據版面,從不同的角度匯總商品數據。
不同日期下不同商品的銷量
【切片器】功能可以通過交互動態的查看數據,如下圖所示,選擇需要查看的條件(王強銷售員的相關數據),就能快速顯示符合條件的數據。
2、圖表
數據分析少不了圖表分析,圖表不僅是后期制作數據報告時,數據展現的重要形式,還能在數據分析過程,以直觀的方式帶給分析者“靈感”,發現數據中隱藏的信息量。
在Excel中,選中數據后,打開【插入圖表】對話框,可以看到所提供的圖表類型,一共15種圖表類型,每一種圖表類型下,又細分為多種形式的圖表。
Excel圖表的種類如此豐富,基本能覆蓋90%的數據分析需求。
兩個注意點:可以將圖表的格式設置好后,添加到【模板】中,方便下次快速調用;圖表的呈現形式是多種多樣的,通過調整布局元素的格式,可以制作出效果豐富、驚人的圖表。重在不要固化思維,多思考與數據切合的呈現形式。
3、條件格式
條件格式適用于表格數據的分析,通過更改表格數據的格式,讓分析者快速掌握表格數據的概況。
1)快速找出符合要求的數據:使用【突出顯示單元格規則】菜單中的選項,可以快速找出符合一定數值范圍的單元格數據,并為這些數據單元格填充底色突出顯示;
2)找出數值排名靠前、靠后的數據:利用【最前/最后規則】選項可以突出顯示數值排名靠前多少位、靠后多少位的單元格數據;
3)根據單元格數據大小添加長短不一的數據條,通過數據條的長度來快速判斷單元格數據大小的分布,方法是使用【數據條】選項功能;
4)根據單元格數據大小添加顏色深淺不一的數據條,通過數據條的顏色深淺來快速判斷單元格數據大小的分布,方法是使用【色階】功能;
5)為單元格中不同類型的數據添加圖標,以示區分,方法是使用【圖標集】選項功能;通過函數實現更復雜的數據突出顯示功能。
6)通過【新建規則】選項,可以編寫函數同,實現更復雜的單元格數據顯示。
4、分類匯總
分類匯總提供了將數據以不同形式匯總的功能。比如如果需要統計不同數據項目的總和,以便對數據的總數值有一個了解,同時對比各項目的總和大小等等場景。
舉個例子:
原始表格中,包含多個項目,有產品名稱、型號、銷售部門、銷量、日期、單價、銷售額項目,使用分類匯總功能:
- 可以匯總不同日期下的商品銷量、銷售額;
- 匯總不同銷售部門的商品銷量、銷售;
- 匯總不同商品的銷量、銷售額;
- 匯總不同商品型號的銷量、銷售額。
針對一份數據的不同匯總要求,均能快捷簡便地實現。如下圖所示,是匯總不同日期下銷售額總值的效果。
5、回歸分析
這個算是Excel在數據分析里比較高級的功能了,在詳細進行回歸分析之前,首先要理解什么叫回歸?
實際上,回歸這種現象最早由英國生物統計學家高爾頓在研究父母親和子女的遺傳特性時所發現的一種有趣的現象:身高這種遺傳特性表現出”高個子父母,其后代身高也高于平均身高;但不見得比其父母更高,到一定程度后會往平均身高方向發生’回歸’”。這種效應被稱為”趨中回歸”。
現在的回歸分析則多半指源于高爾頓工作的那樣一整套建立變量間的數量關系模型的方法和程序。這里的自變量是父母的身高,因變量是子女的身高。
這里舉個電商的例子:電子商務的轉換率是一定的,網站訪問數一般正比對應于銷售收入,現在要建立不同訪問數情況下對應銷售的標準曲線,用來預測搞活動時的銷售收入,如下所示:
在使用之前,首先得安裝Excel的數據分析功能,默認情況下,Excel是沒有安裝這個擴展功能的,安裝如下所示:
1)鼠標懸浮在Office按鈕上,然后點擊【Excel選項】:
2)找到【加載項】,在管理板塊選擇【Excel加載項】,然后點擊【轉到】:
3)選擇【分析工具庫】,點擊【確定】:
4)安裝完后,就可以【數據】板塊看到【數據分析】功能,如下所示:
接下來,我們看下它的實操應用。
1.首先,利用散點圖描繪圖形:
2.添加趨勢線,并且顯示回歸分析的公式和R平方值:
從圖得知,R平方值=0.9995,趨勢線趨同于一條直線,公式是:y=0.01028x-27.424
R平方值是介于0和1之間的數字,當趨勢線的R平方值為1或者接近1時,趨勢線最可靠。因為R2>0.99,所以這是一個線性特征非常明顯的數值,說明擬合直線能夠以大于99.99%地解釋、涵蓋了實際數據,具有很好的一般性,能夠起到很好的預測作用。
3.使用Excel的數據分析功能
1)點擊【數據分析】,在彈出的選擇框中選擇【回歸】,然后點擊【確定】:
2)【X值輸入區域】選擇訪問數的單元格,【Y值輸入區域】選擇銷售額的單元格,同時勾選如下所示的選項,包括殘差、標準殘差、殘差圖、線性擬合圖和正態概率圖。
3)以下內容是殘差和標準殘差:
4)以下是殘差圖:
殘差圖是有關于實際值與預測值之間差距的圖表,如果殘差圖中的散點在中軸上下兩側分布,那么擬合直線就是合理的,說明預測有時多些,有時少些,總體來說是符合趨勢的,但如果都在上側或者下側就不行了,這樣有傾向性,需要重新處理。
5)以下是線性擬合圖:
在線性擬合圖中可以看到,除了實際的數據點,還有經過擬和處理的預測數據點,這些參數在以上的表格中也有顯示。
6)以下是正態概率圖
正態概率圖一般用于檢查一組數據是否服從正態分布,是實際數值和正態分布數據之間的函數關系散點圖,如果這組數值服從正態分布,正態概率圖將是一條直線。回歸分析不一定得符合正態分布,這里只是僅僅把它描繪出來而已。
以上數據表格和圖表都說明公式y=0.01028x-27.424是一個值得信賴的預測曲線,假設搞活動時流量有50萬訪問數的話,那么預測銷售將是51373,如下圖所示:
不過實話實說,用excel做數據分析報表或多或少還是有一定的使用門檻的,需要有持久的定力外加百分之200%的專注度和探索精神。
如果學習起來真的灰常吃力,那也千萬不要捉急~因為我還準備了第二種解決方案。
第二個智囊盒就是!!!!