要如何開始從零掌握Python機器學習?
作為一個過來人,我的建議是分三步進行:
第一步:學習基本 Python 技能
如果要使用 Python 進行機器學習,擁有對 Python 有基礎的理解非常關鍵。幸運的是,Python 是當前普遍使用的流行語言,并納入了科學計算和機器學習的內容,所以找到入門教程并不困難。在選擇起點時,很大程度上要取決于你之前的 Python 經驗和編程經驗。推薦一本最經典的入門書籍:《Python編程 從入門到實踐》
第二步:學習機器學習基礎技能KDnuggets 的 Zachary Lipton 指出,人們對于“數據科學家”的認知千差萬別。這實際上是對機器學習領域的反映。數據科學家在不同程度上使用計算學習算法。要建立和使用支持向量機模型,熟知核函數方法是否是必需的?答案當然不是。就像現實生活中的許多事情一樣,所需要的理論深入程度與具體的實際應用有關。獲取對機器學習算法的深入理解不是本文的討論范圍, 而且這通常需要在學術領域投入大量時間,或者至少要通過密集的自學才能達到。
好消息是,你不必擁有博士級別的機器學習理論能力才能進行實踐,就如同不是所有程序員都必須接受計算機理論教育才能寫好代碼。
吳恩達在 Coursera 的課程非常贊,如果你有時間,可以自己去 Coursera 完成這個課程 :Andrew Ng’s Machine Learning course 。另外推薦一本書:周志華的《機器學習》
第三步:開始用 Python 進行機器學習
這一步開始進入到實踐了,推薦看Peter Harrington的《機器學習實戰(zhàn) 》
這本書啃透,你的Python和機器學習已經是能達到掌握的水平啦!
另外也推薦你使用一些其他的機器學習框架:比如H2O,還有像http://www.datazen.ai/這樣的網站,里面會集成很多機器學習框架,迅速完成建模實戰(zhàn)任務。