本次書單推薦包含「入門篇」、「進(jìn)階篇」、「高階篇」,適用于不同層次的學(xué)習(xí)者。請(qǐng)大家對(duì)號(hào)入座,收好適合自己的修煉秘籍吧~
入門篇 1.《誰(shuí)說菜鳥不會(huì)數(shù)據(jù)分析》
推薦理由:基于通用的Excel工具,在8個(gè)章節(jié)中,分別講解數(shù)據(jù)分析必知必會(huì)的知識(shí)、數(shù)據(jù)處理技巧、數(shù)據(jù)展現(xiàn)的技術(shù)、通過專業(yè)化的視角來(lái)提升圖表之美、數(shù)據(jù)分析報(bào)告的撰寫技能以及持續(xù)的修煉。讀者完全可以把這本書當(dāng)小說來(lái)閱讀,跟隨主人公小白,在Mr.林的指點(diǎn)下輕松掌握數(shù)據(jù)分析的技能,提升職場(chǎng)競(jìng)爭(zhēng)能力。
2.《深入淺出數(shù)據(jù)分析》
推薦理由:數(shù)據(jù)分析入門第一本。通俗簡(jiǎn)單,卻能夠讓讀者對(duì)數(shù)據(jù)分析的相關(guān)概念有大致的了解,詮釋了數(shù)據(jù)分析的基本步驟,實(shí)驗(yàn)方法,最優(yōu)化方法/假設(shè)檢驗(yàn)法/貝葉斯統(tǒng)計(jì)法/等等方法論,還有數(shù)據(jù)整理技巧,這個(gè)太重要了,為讀者搭建了走向深入研究的橋梁。
3.《深入淺出統(tǒng)計(jì)學(xué)》
推薦理由:號(hào)稱“文科生也能看懂”的統(tǒng)計(jì)書。盡管閱讀容易,但所講的知識(shí)在數(shù)據(jù)分析中都是常見且必須掌握的,比如基本的統(tǒng)計(jì)量,基本上每個(gè)分析項(xiàng)目中都會(huì)用到;比如基本的概率分布,總體與樣本的概念、置信區(qū)間、假設(shè)檢驗(yàn)、回歸分析,都是關(guān)于數(shù)據(jù)分析的統(tǒng)計(jì)學(xué)知識(shí)。
4.《赤裸裸的統(tǒng)計(jì)學(xué)》
推薦理由:作者年輕時(shí)是個(gè)追求學(xué)習(xí)意義的學(xué)霸,后來(lái)自己從統(tǒng)計(jì)學(xué)中發(fā)掘了很多可以應(yīng)用到生活的地方。這也是本書的主旨,結(jié)合生活講解統(tǒng)計(jì)知識(shí),生動(dòng)有趣。可以避免統(tǒng)計(jì)學(xué)一上來(lái)就大講貝葉斯概率和隨機(jī)分析的枯燥。
進(jìn)階篇 一、數(shù)據(jù)分析—Excel 1.《EXCEL數(shù)據(jù)處理與分析實(shí)戰(zhàn)技巧精粹》
推薦理由:詳盡的實(shí)例,精彩的講解,細(xì)致的描述,多角度的剖析,融匯Excel Home萬(wàn)千問題與答案,彰顯Excel豐富內(nèi)涵。相信本書是你愛不釋手、輕松辦公的利器。
2.《Excel VBA從入門到精通》
推薦理由:本書分為五篇,其中第一篇是VBA基礎(chǔ)知識(shí)篇,主要內(nèi)容包括VBA的概念、宏和VBA開發(fā)環(huán)境;第二篇是VBA基礎(chǔ)語(yǔ)法篇,主要內(nèi)容包括VBA語(yǔ)法基礎(chǔ)、VBA基礎(chǔ)語(yǔ)句、程序結(jié)構(gòu)控制語(yǔ)句、過程、Sub與Function過程;第三篇是Excel VBA對(duì)象篇,主要內(nèi)容包括Excel VBA對(duì)象模型和應(yīng)用程序?qū)ο蟆⒐ぷ鞑緦?duì)象、工作表對(duì)象、單元格對(duì)象和圖表對(duì)象;第四篇是VBA高級(jí)應(yīng)用篇,主要內(nèi)容包括自定義Excel 2010的用戶界面、工作表控件、界面設(shè)計(jì)、XML與VBA、加載宏和數(shù)據(jù)庫(kù)編程等;第五篇是綜合實(shí)例與面試問答篇,主要講解了成績(jī)管理系統(tǒng)和日程安排表兩個(gè)綜合實(shí)例,并提供了30多個(gè)近幾年各大公司經(jīng)常考察的面試題。
二、數(shù)據(jù)分析—R 1.《R語(yǔ)言實(shí)戰(zhàn)(第2版)》 推薦理由:本書從解決實(shí)際問題入手,盡量跳脫統(tǒng)計(jì)學(xué)的理論闡述來(lái)討論R語(yǔ)言及其應(yīng)用,講解清晰透澈,極具實(shí)用性。作者不僅高度概括了R語(yǔ)言的強(qiáng)大功能、展示了各種實(shí)用的統(tǒng)計(jì)示例,而且對(duì)于難以用傳統(tǒng)方法分析的凌亂、不完整和非正態(tài)的數(shù)據(jù)也給出了完備的處理方法。第2版新增6章內(nèi)容,涵蓋時(shí)間序列、聚類分析、分類、高級(jí)編程、創(chuàng)建包和創(chuàng)建動(dòng)態(tài)報(bào)告等,并分別詳細(xì)介紹了如何使用ggplot2和lattice進(jìn)行高級(jí)繪圖。通讀本書,你將全面掌握使用R語(yǔ)言進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘的技巧,并領(lǐng)略大量探索和展示數(shù)據(jù)的圖形功能,從而更加高效地進(jìn)行分析與溝通。
2.《統(tǒng)計(jì)建模與R軟件》
推薦理由:書中結(jié)合數(shù)理統(tǒng)計(jì)問題對(duì)R軟件進(jìn)行科學(xué)、準(zhǔn)確和全面的介紹,以便使讀者能深刻理解該軟件的精髓和靈活、高效的使用技巧.此外,還介紹了在工程技術(shù)、經(jīng)濟(jì)管理、社會(huì)生活等各方面的豐富的統(tǒng)計(jì)問題及其統(tǒng)計(jì)建模方法,通過該軟件將所建模型進(jìn)行求解,使讀者獲得從實(shí)際問題建模入手,到利用軟件進(jìn)行求解,以及對(duì)計(jì)算結(jié)果進(jìn)行分析的全面訓(xùn)練。
三、數(shù)據(jù)分析—Python 1.《利用Python進(jìn)行數(shù)據(jù)分析(原書第2版) 推薦理由:本書由Python pandas項(xiàng)目創(chuàng)始人Wes McKinney親筆撰寫,詳細(xì)介紹利用Python進(jìn)行操作、處理、清洗和規(guī)整數(shù)據(jù)等方面的具體細(xì)節(jié)和基本要點(diǎn)。第2版針對(duì)Python 3.6進(jìn)行全面修訂和更新,涵蓋新版的pandas、NumPy、IPython和Jupyter,并增加大量實(shí)際案例,可以幫助你高效解決一系列數(shù)據(jù)分析問題。
2.《Python數(shù)據(jù)分析從入門到精通》
推薦理由:對(duì)于希望使用Python來(lái)完成數(shù)據(jù)分析工作的人來(lái)說,學(xué)習(xí)IPython、Numpy、pandas、Matplotlib這個(gè)組合是目前看來(lái)不錯(cuò)的方向,本書就是這樣一本循序漸進(jìn)的書。內(nèi)容精練、重點(diǎn)突出、實(shí)例豐富,是廣大數(shù)據(jù)分析工作者必備的參考書,為讀者能真正使用Python進(jìn)行數(shù)據(jù)分析奠定基礎(chǔ)。
3.《Python數(shù)據(jù)挖掘:概念、方法與實(shí)踐》
推薦理由:本書使用Python編程語(yǔ)言和基于項(xiàng)目的方法介紹多種常被忽視的數(shù)據(jù)挖掘概念,如關(guān)聯(lián)規(guī)則、實(shí)體匹配、網(wǎng)絡(luò)分析、文本挖掘和異常檢測(cè)。每個(gè)章節(jié)都全面闡述某種特定數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)知識(shí),提供替代方案以評(píng)估其有效性,并用真實(shí)的數(shù)據(jù)實(shí)現(xiàn)該技術(shù),幫助你“知其然,知其所以然”,從而邁向數(shù)據(jù)挖掘?qū)<业牡缆贰?/p>
四、數(shù)據(jù)分析— SPSS 1.《SPSS統(tǒng)計(jì)分析基礎(chǔ)教程》
推薦理由:本書改變了以往SPSS書籍對(duì)統(tǒng)計(jì)理論和軟件操作“兩條主線、各自表述”的編寫方式,將這兩者完全融合了起來(lái)。它以SPSS 12.0為準(zhǔn),針對(duì)統(tǒng)計(jì)初學(xué)者和SPSS初級(jí)用戶的需求,以統(tǒng)計(jì)理論為主線,詳細(xì)介紹了在SPSS中的界面操作、數(shù)據(jù)管理、統(tǒng)計(jì)圖表制作、統(tǒng)計(jì)描述和常用單因素統(tǒng)計(jì)分析方法的原理與實(shí)際操作。其內(nèi)容完全覆蓋目前國(guó)內(nèi)大部分專業(yè)本科統(tǒng)計(jì)課程的教學(xué)范圍,并結(jié)合SPSS的強(qiáng)大功能作了很好的擴(kuò)展。全書內(nèi)容深入淺出,風(fēng)格簡(jiǎn)潔明快,是一本難得的統(tǒng)計(jì)理論與SPSS操作相結(jié)合的統(tǒng)計(jì)參考書。
2.《Discovering statistics using spas》
推薦理由:國(guó)外的一些入門書籍很容易上手, 在學(xué)術(shù)論壇和知乎等頁(yè)面都有網(wǎng)友推薦這本書。國(guó)外圖書價(jià)格偏貴,但是據(jù)說某寶的PDF版很便宜。
3.《問卷統(tǒng)計(jì)分析實(shí)務(wù): SPSS操作與應(yīng)用》
推薦理由:本書的內(nèi)容架構(gòu),在于完整介紹問卷調(diào)查法中的數(shù)據(jù)處理與其統(tǒng)計(jì)分析流程,統(tǒng)計(jì)分析技術(shù)以SPSS統(tǒng)計(jì)軟件包的操作界面與應(yīng)用為主,內(nèi)容除基本統(tǒng)計(jì)原理的解析外,著重的是SPSS統(tǒng)計(jì)軟件包在量化研究上的應(yīng)用。
五、 數(shù)據(jù)分析—SAS
1.《The little SAS book》
推薦理由:內(nèi)容不深,但是全面、實(shí)用,很經(jīng)典的一本書,適合初學(xué)者看。英文版讀得太累可以搜一下中文版。
2.《SAS統(tǒng)計(jì)分析應(yīng)用》
推薦理由:本書基于SAS 9.1.3中文版本編寫,介紹了SAS Learning Edition基于窗口點(diǎn)擊式環(huán)境以及Base SAS、SAS\STAT的用法。全書以統(tǒng)計(jì)分析方法為主線,通過大量實(shí)例,詳細(xì)介紹了SAS程序設(shè)計(jì)方法及各種統(tǒng)計(jì)過程適用條件和使用方法,并對(duì)統(tǒng)計(jì)過程實(shí)例的輸出結(jié)果做了詳盡的解釋。
3.《SAS統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》
推薦理由:從SAS編程出發(fā),用案例形式介紹SAS數(shù)據(jù)挖掘在各領(lǐng)域的廣泛應(yīng)用,全書分為SAS基礎(chǔ)篇、提高篇及應(yīng)用篇,每章均給出大量分析案例。
六、數(shù)據(jù)分析—SQL
1.《SQL必知必會(huì)》
推薦理由:本書是深受世界各地讀者歡迎的SQL經(jīng)典暢銷書,內(nèi)容豐富,文字簡(jiǎn)潔明快,針對(duì)Oracle、SQL Server、MySQL、DB2、PostgreSQL、SQLite等各種主流數(shù)據(jù)庫(kù)提供了大量簡(jiǎn)明的實(shí)例。與其他同類圖書不同,它沒有過多闡述數(shù)據(jù)庫(kù)基礎(chǔ)理論,而是專門針對(duì)一線軟件開發(fā)人員,直接從SQL SELECT開始,講述實(shí)際工作環(huán)境中最常用和最必需的SQL知識(shí),實(shí)用性極強(qiáng)。通過本書,讀者能夠從沒有多少SQL經(jīng)驗(yàn)的新手,迅速編寫出世界級(jí)的SQL!
2. 《SQL基礎(chǔ)教程》
推薦理由:本書介紹了關(guān)系數(shù)據(jù)庫(kù)以及用來(lái)操作關(guān)系數(shù)據(jù)庫(kù)的SQL語(yǔ)言的使用方法,提供了大量的示例程序和詳實(shí)的操作步驟說明,讀者可以親自動(dòng)手解決具體問題,循序漸進(jìn)地掌握SQL的基礎(chǔ)知識(shí)和技巧,切實(shí)提高自身的編程能力。在每章結(jié)尾備有習(xí)題,用來(lái)檢驗(yàn)讀者對(duì)該章內(nèi)容的理解程度。另外本書還將重要知識(shí)點(diǎn)總結(jié)為“法則”,方便大家隨時(shí)查閱。
3.《高可用MySQL:構(gòu)建健壯的數(shù)據(jù)中心》
推薦理由:本書是“MySQL High Availability”的中文翻譯版,主要講解真實(shí)環(huán)境下如何使用MySQL的復(fù)制、集群和監(jiān)控特性,揭示MySQL可靠性和高可用性的方方面面。本書由MySQL開發(fā)團(tuán)隊(duì)親自執(zhí)筆,定位于解決MySQL數(shù)據(jù)庫(kù)的常見應(yīng)用瓶頸,在保持MySQL的持續(xù)可用性的前提下,挖潛各種提高性能的解決方案。
七、數(shù)據(jù)挖掘 1.《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫?/p>
推薦理由:本書全面介紹了數(shù)據(jù)挖掘,涵蓋了五個(gè)主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測(cè)。除異常檢測(cè)外,每個(gè)主題都有兩章。前一章涵蓋基本概念、代表性算法和評(píng)估技術(shù),而后一章討論高級(jí)概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎(chǔ)的同時(shí),還能夠了解更多重要的高級(jí)主題。
2.《數(shù)據(jù)挖掘概念與技術(shù)(原書第3版)》
推薦理由:本書完整全面地講述數(shù)據(jù)挖掘的概念、方法、技術(shù)和最新研究進(jìn)展。本書對(duì)前兩版做了全面修訂,加強(qiáng)和重新組織了全書的技術(shù)內(nèi)容,重點(diǎn)論述了數(shù)據(jù)預(yù)處理、頻繁模式挖掘、分類和聚類等的內(nèi)容,還全面講述了OLAP和離群點(diǎn)檢測(cè),并研討了挖掘網(wǎng)絡(luò)、復(fù)雜數(shù)據(jù)類型以及重要應(yīng)用領(lǐng)域。 3.《大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理(第2版)》
推薦理由:暢銷書全新升級(jí),新增影響與同質(zhì)性、社交媒體推薦和行為分析等超實(shí)用內(nèi)容,涵蓋解決數(shù)據(jù)挖掘核心問題所用算法,及實(shí)際應(yīng)用數(shù)據(jù)挖掘所需知識(shí),理論與實(shí)現(xiàn)并重。斯坦福大學(xué)數(shù)據(jù)挖掘方向?qū)<襃ure Leskovec、Anand Rajaraman、Jeffrey David Ullman重磅力作。
八、數(shù)據(jù)可視化 1.《數(shù)據(jù)可視化之美》
推薦理由:在本書中,20多位可視化專家包括藝術(shù)家、設(shè)計(jì)師、評(píng)論家、科學(xué)家、分析師、統(tǒng)計(jì)學(xué)家等,展示了他們?nèi)绾卧诟髯缘膶W(xué)科領(lǐng)域內(nèi)開展項(xiàng)目。他們共同展示了可視化所能實(shí)現(xiàn)的功能以及如何使用它來(lái)改變世界。成功的可視化的美麗之處既在于其藝術(shù)設(shè)計(jì),也在于其通過對(duì)細(xì)節(jié)的優(yōu)雅展示,能夠有效地產(chǎn)生對(duì)數(shù)據(jù)的洞察和新的理解。
2.《用數(shù)據(jù)講故事》
推薦理由:本書通過大量案例研究介紹數(shù)據(jù)可視化的基礎(chǔ)知識(shí),以及如何利用數(shù)據(jù)創(chuàng)造出吸引人的、信息量大的、有說服力的故事,進(jìn)而達(dá)到有效溝通的目的。具體內(nèi)容包括:如何充分理解上下文,如何選擇合適的圖表,如何消除雜亂,如何聚焦受眾的視線,如何像設(shè)計(jì)師一樣思考,以及如何用數(shù)據(jù)講故事。本書得到了國(guó)內(nèi)數(shù)據(jù)分析大咖秋葉、范冰、鄧凱的推薦。
3.《ggplot2:數(shù)據(jù)分析與圖形藝術(shù)》
推薦理由:ggplot2 是最優(yōu)秀的數(shù)據(jù)分析可視化工具之一,這本書系統(tǒng)地講解了 ggplot2 的基本原理和具體操作,書中有大量的例子,也可以下載源代碼。更建議直接學(xué)習(xí)英文版的教材(如果英文過關(guān)的話)。
九、報(bào)告撰寫 《麥肯錫教我的寫作武器》
推薦理由:本書分為基礎(chǔ)篇和實(shí)踐篇兩部分,結(jié)合實(shí)際案例,系統(tǒng)地介紹了運(yùn)用邏輯思考,制作一份兼具邏輯力與明確表達(dá)力的精彩商務(wù)文案所需的諸多方法,如金字塔原理、MECE原則、分辨問題類型的高杉法、SCQOR故事展開法以及具體制作報(bào)告與簡(jiǎn)報(bào)的方法等,讓你學(xué)會(huì)邏輯思考方法、提高寫作能力的實(shí)用工具書。
高階篇 1.《精益數(shù)據(jù)分析》
推薦理由:此書優(yōu)勢(shì)在于將企業(yè)分成了幾個(gè)大的行業(yè)類別,并分門別類的講解了每個(gè)行業(yè)的商業(yè)模式特點(diǎn)及分析技巧,對(duì)使用者的分析能力要求較高,且必須具備相應(yīng)的業(yè)務(wù)知識(shí)。書中并沒有講到具體的數(shù)據(jù)分析技術(shù),主要分析了各種產(chǎn)品中用到的指標(biāo)、模型和“數(shù)據(jù)驅(qū)動(dòng)型產(chǎn)品”的一些思路。
2.《數(shù)學(xué)之美》
推薦理由:本書把高深的數(shù)學(xué)原理講得更加通俗易懂,讓非專業(yè)讀者也能領(lǐng)略數(shù)學(xué)的魅力。讀者通過具體的例子學(xué)到的是思考問題的方式 —— 如何化繁為簡(jiǎn),如何用數(shù)學(xué)去解決工程問題,如何跳出固有思維不斷去思考創(chuàng)新。
3.《集體智慧編程》
推薦理由:本書以機(jī)器學(xué)習(xí)與計(jì)算統(tǒng)計(jì)為主題背景,專門講述如何挖掘和分析Web上的數(shù)據(jù)和資源,如何分析用戶體驗(yàn)、市場(chǎng)營(yíng)銷、個(gè)人品味等諸多信息,并得出有用的結(jié)論,通過復(fù)雜的算法來(lái)從Web網(wǎng)站獲取、收集并分析用戶的數(shù)據(jù)和反饋信息,以便創(chuàng)造新的用戶價(jià)值和商業(yè)價(jià)值。全書內(nèi)容翔實(shí),包括協(xié)作過濾技術(shù)(實(shí)現(xiàn)關(guān)聯(lián)產(chǎn)品推薦功能)、集群數(shù)據(jù)分析(在大規(guī)模數(shù)據(jù)集中發(fā)掘相似的數(shù)據(jù)子集)、搜索引擎核心技術(shù)(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進(jìn)行分析統(tǒng)計(jì)得出結(jié)論的優(yōu)化算法、貝葉斯過濾技術(shù)(垃圾郵件過濾、文本過濾)、用決策樹技術(shù)實(shí)現(xiàn)預(yù)測(cè)和決策建模功能、社交網(wǎng)絡(luò)的信息匹配技術(shù)、機(jī)器學(xué)習(xí)和人工智能應(yīng)用等。
4.《機(jī)器學(xué)習(xí)》
推薦理由:展示了機(jī)器學(xué)習(xí)中核心的算法和理論,并闡明了算法的運(yùn)行過程。本書綜合了許多的研究成果,例如統(tǒng)計(jì)學(xué)、人工智能、哲學(xué)、信息論、生物學(xué)、認(rèn)知科學(xué)、計(jì)算復(fù)雜性和控制論等,并以此來(lái)理解問題的背景、算法和其中的隱含假定。 5.《R數(shù)據(jù)分析——方法與案例詳解(雙色)》
推薦理由:R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件,用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖。這本書從實(shí)用的統(tǒng)計(jì)研究角度逐例分析R在數(shù)據(jù)處理、模型構(gòu)建、以及圖形操作上的由淺入深的結(jié)合,堪稱經(jīng)典。 6.《Python高級(jí)數(shù)據(jù)分析:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和NLP實(shí)例》
推薦理由:本書介紹了基于Python的高級(jí)數(shù)據(jù)分析,探討了Neo4j、Elasticsearch和MongoDB等數(shù)據(jù)庫(kù),討論了如何實(shí)現(xiàn)包括主題爬取在內(nèi)的ETL技術(shù),并用于高頻算法交易和目標(biāo)導(dǎo)向的對(duì)話系統(tǒng)等領(lǐng)域;還介紹了一些機(jī)器學(xué)習(xí)概念(如半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)和NLP)的例子;同時(shí)涵蓋了重要的傳統(tǒng)數(shù)據(jù)分析技術(shù),如時(shí)間序列和主成分分析等。