成為一個(gè)合格的機(jī)器學(xué)習(xí)工程師?
謝謝邀請(qǐng)。
在人工智能火熱的今天,對(duì)機(jī)器學(xué)習(xí)人才的需求也是越來越大,也需要越來越多的工程師來配合開發(fā)人工智能應(yīng)用。
在回答這個(gè)問題之前,覺得需要明確的一個(gè)概念是,開發(fā)機(jī)器學(xué)習(xí)應(yīng)用,不只是研究上的事,還是工程上的事。而對(duì)此問題的答案是,合格的機(jī)器學(xué)習(xí)工程師,博士學(xué)位不是必要的。
舉個(gè)例子,剛成立一年左右的騰訊AI Lab 對(duì)外宣傳「現(xiàn)有50多位世界知名院校的AI科學(xué)家與200多位應(yīng)用工程師」,值得注意的是這段描述中50多位AI 科學(xué)家的博士比例為 90%。也就是說,如果是博士學(xué)位也基本上上升到了AI 科學(xué)家的層次了。
在圈內(nèi)熟知的年輕博士中,Ian Goodfellow 、Andrej karpathy 等的title也都是research Scientist。
此外,這個(gè)問題在國(guó)內(nèi)也引起過極大的討論。也就是,為了在機(jī)器學(xué)習(xí)領(lǐng)域工作,是否需要該領(lǐng)域的 PhD?還有就是在學(xué)習(xí)機(jī)器學(xué)習(xí)之前,是不是一定要先修微積分、線性代數(shù)、概率論/統(tǒng)計(jì)學(xué)這些乏味的全套大學(xué)數(shù)學(xué)課程,然后再學(xué) C/C++和并行分布式編程(CUDA、MPI、OpenMP 等等)?
Hacker News 一個(gè)評(píng)分最高的評(píng)論表示,即便你把這些內(nèi)容學(xué)了個(gè)遍,還是得從頭開始應(yīng)用機(jī)器學(xué)習(xí)算法,先是 C,接下來是 MPI 或 CUDA,然后是 Numpy,然后你才能學(xué)會(huì)在 Theano 或者 TensorFlow 上應(yīng)用它們(但有些人并不是很贊同有如此復(fù)雜的學(xué)習(xí)過程)。
而且,即使你是一個(gè)普通的工程師,但有豐富的編程經(jīng)驗(yàn),完全有能力通過自學(xué)的方式學(xué)習(xí)機(jī)器學(xué)習(xí)編程。這里向大家推薦一個(gè)機(jī)器之心很喜歡選擇的一個(gè)文章主題《沒有博士學(xué)位如何玩轉(zhuǎn)TensorFlow和深度學(xué)習(xí)》。
最后用機(jī)器之心不久之前發(fā)表的一篇文章數(shù)據(jù)說話(《AI人才爭(zhēng)奪戰(zhàn)持續(xù)升級(jí),數(shù)據(jù)看懂中國(guó)人工智能人才分布》):
商務(wù)社交平臺(tái)脈脈發(fā)布的數(shù)據(jù)來看,學(xué)歷結(jié)構(gòu)上,目前國(guó)內(nèi) AI 人才的學(xué)歷構(gòu)成以研究生為主,占比達(dá)到 62.72%,反映出該行業(yè)由于涉及到多學(xué)科的交叉理論,對(duì)人才的學(xué)歷要求較高;本科以 29.94% 的占比位居第二;博士占比為 5.84%,位居第三。
但脈脈此數(shù)據(jù)的樣本源受到脈脈的用戶規(guī)模、分布和行業(yè)集中度影響,結(jié)論僅供參考。