有什么能快速入門的好書嗎?
首先學(xué)習(xí)機(jī)器學(xué)習(xí)必須有扎實(shí)的數(shù)學(xué)基礎(chǔ)和算法基礎(chǔ),要想吃透其思想沒有捷徑可以走,只能踏踏實(shí)實(shí)的學(xué)習(xí),不然南京大學(xué)成立的人工智能學(xué)院怎么開了那么多門的數(shù)學(xué)課?比如高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)、泛函分析、運(yùn)籌學(xué)(注意不是諸葛亮運(yùn)籌帷幄的那個(gè)兵法,是數(shù)學(xué)的分支,你如果理解為奇門遁甲得原理和數(shù)學(xué)相通的,這個(gè)是沒問題的)、算法設(shè)計(jì)等等,據(jù)說985的大學(xué)生也學(xué)的頭疼,其實(shí)我覺得不管什么樣的好學(xué)生,認(rèn)識事物都是從感性到理性的過程,不可逾越,能夠逾越的,都是從小各種環(huán)境就好,985大學(xué)生學(xué)起來吃力說明課程安排和時(shí)間安排有問題,我是做大學(xué)生工作的,對955同學(xué)也很了解,就是他們太忙了,一上大學(xué)手頭的名目太多了:什么考研、第二學(xué)歷、托福等。不說這些了,那么初學(xué)者機(jī)器學(xué)習(xí)想入門到底有沒有捷徑可走?答曰:有,前提是你肯專研,這可不如web前端、JAVA語言之類的入門容易,按照我說的步驟做法如下:
1、你連初高中的數(shù)學(xué)都不扎實(shí)的,多補(bǔ)習(xí),多做數(shù)學(xué)題
因?yàn)橛行┧惴ǔ醺咧械臄?shù)學(xué)就能解決,比如協(xié)同過濾算法里面求相似度:你可以用歐式距離求,歐式距離不會?那你還不復(fù)習(xí)和補(bǔ)習(xí)?初中學(xué)的。可以用余玄函數(shù)求解,這個(gè)是初中知識吧?
當(dāng)然也可以用大學(xué)學(xué)的方差、相關(guān)系數(shù)求解,忘了?可以百度,大學(xué)生應(yīng)該有自學(xué)能力吧(由于分?jǐn)?shù)低的200~450分的不算,當(dāng)然也有好的,我們這里不談小概率事件,大家也別喝毒雞湯:什么某某學(xué)歷不好,但是什么什么云云,下同)?
2、你可以借助于計(jì)算框架先入門
機(jī)器學(xué)習(xí)計(jì)算框架比如JAVA語言的mahout、python語言的機(jī)器學(xué)習(xí)庫(一般來說是sklearn),Scala語言的MLib。比如決策樹算法就被python封裝的很好。
基礎(chǔ)不好,借助于框架也是沒辦法的事情,先入門體驗(yàn),再學(xué)原理。值得注意的是:不可以只會框架,不懂原理和推導(dǎo)步驟,這樣只會表面東西沒什么用。
我的學(xué)生我直接要求使用代碼實(shí)現(xiàn)諸如Apriori算法、決策樹算法等,我不讓他們用框架,那是害他們,什么時(shí)候用框架?對了,工作時(shí)候用,因?yàn)楣ぷ骱蛯W(xué)習(xí)不一樣,工作追求效率,學(xué)習(xí)追求原理。所以很多社會上拿python來忽悠的,大多數(shù)為學(xué)藝不精或者不學(xué)無術(shù)者來誤人子弟,大家一定善于辨別,別入坑。
3、要有不斷學(xué)習(xí)和鉆研精神
急功近利的人學(xué)不好機(jī)器學(xué)習(xí),更別指望靠它創(chuàng)新設(shè)計(jì)出來新的數(shù)學(xué)模型。比如SVM支持向量積算法涉及到的知識有凸優(yōu)化、拉格朗日乘數(shù)法、空間幾何等知識,很多機(jī)器學(xué)習(xí)的書本寫到這個(gè)算法就寥寥幾筆帶過,因?yàn)闆]法寫了,要寫光這個(gè)算法就寫好幾本書?那怎么辦,我們大家要有鉆研精神。
機(jī)器學(xué)習(xí)算法工程師工資是高,甚至月薪10萬以上很正常。但是你和面試官說我會python機(jī)器學(xué)習(xí),面試官必然問的深入,這時(shí)候你就會表面東西肯定和高薪無緣,不是不用你,你可以做數(shù)據(jù)、調(diào)參數(shù)。
所以我們浮躁不得,更不能有傳統(tǒng)思想:靠簡單的游戲規(guī)則賺大錢,因?yàn)楝F(xiàn)在資本家投資越來越理性,野蠻增長日子一去不復(fù)返。更重要的你不愛機(jī)器學(xué)習(xí),它就不愛你,你目的不純(只向錢看)它更讓你難受。所以要學(xué)機(jī)器學(xué)習(xí)務(wù)必有鉆研精神。
至于入門的書有沒有?答曰:有,列舉如下:
1、《白話大數(shù)據(jù)與機(jī)器學(xué)習(xí)》
這本書優(yōu)秀高中生就能看懂,這已經(jīng)是最低要求了。作者:高揚(yáng),一位務(wù)實(shí)的專家。
這本書將涵蓋以下比較重要的數(shù)據(jù)挖掘和分析知識點(diǎn):概率、統(tǒng)計(jì)和分布、多維向量空間、回歸、聚類、分類、關(guān)聯(lián)分析、協(xié)同過濾、文本挖掘、神經(jīng)網(wǎng)絡(luò)。同時(shí),講解了大數(shù)據(jù)相關(guān)的人才需求、行業(yè)情況、大數(shù)據(jù)變現(xiàn)與產(chǎn)品發(fā)布、系統(tǒng)調(diào)優(yōu)等讀者需要了解的內(nèi)容。
2、《白話深度學(xué)習(xí)與TensorFlow》
本書寫的很人性化,作者還是高揚(yáng)等,這里感謝開發(fā)公司的架構(gòu)師們百忙之中還為初學(xué)者著想。
本書適用于零基礎(chǔ)的初學(xué)者:
(1)基礎(chǔ)篇(靠前~3章),講解了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)與實(shí)踐的上下文知識,如基本的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法,TensorFlow框架的安全與配置,簡單的深度學(xué)習(xí)實(shí)踐。該篇是閱讀和實(shí)踐的基石。
原理與實(shí)踐篇(第4~8章),介紹“老牌”的深度學(xué)習(xí)網(wǎng)絡(luò)的數(shù)學(xué)原理和工程實(shí)現(xiàn)原理,尤其是第4章,如果能基本讀懂,后面的網(wǎng)絡(luò)實(shí)現(xiàn)層面的問題基本都可以迎刃而解。涵蓋BP網(wǎng)絡(luò)、CNN、RNN的結(jié)構(gòu)、思路、訓(xùn)練與使用,以及一些常見的綜合性問題。該篇是學(xué)習(xí)深度學(xué)習(xí)的重點(diǎn)和難點(diǎn),作者通過大量示例、推理與實(shí)現(xiàn),幫讀者優(yōu)選化降低學(xué)習(xí)曲線。
(2)擴(kuò)展篇(第9~13章),介紹一些網(wǎng)絡(luò)的變種和一些較新的網(wǎng)絡(luò)特性,涵蓋深度殘差網(wǎng)絡(luò)、受限玻爾茲曼機(jī)、強(qiáng)化學(xué)習(xí)、對抗學(xué)習(xí),這是讀者進(jìn)一步學(xué)習(xí)與實(shí)踐思路的鑰匙。很后給出了一些有趣的深度學(xué)習(xí)應(yīng)用:人臉識別、作詩姬、大師風(fēng)圖像處理,有趣又等