前輩們有沒(méi)有比較好的建議?
大數(shù)據(jù)是我的主要研究方向之一,目前也在采用Python從事機(jī)器學(xué)習(xí)方面的開(kāi)發(fā),所以我來(lái)回答一下這個(gè)問(wèn)題。
首先,從近幾年研究生的就業(yè)情況來(lái)看,數(shù)據(jù)分析方向的薪資待遇還是比較高的,而且上升趨勢(shì)也比較明顯。隨著大數(shù)據(jù)的落地應(yīng)用,數(shù)據(jù)分析將有廣泛的發(fā)展前景,未來(lái)廣大的傳統(tǒng)行業(yè)也將陸續(xù)釋放出大量的數(shù)據(jù)分析崗位,所以當(dāng)前選擇學(xué)習(xí)數(shù)據(jù)分析是個(gè)不錯(cuò)的選擇。
從技術(shù)角度上來(lái)看,數(shù)據(jù)分析雖然有應(yīng)用級(jí)數(shù)據(jù)分析和開(kāi)發(fā)級(jí)數(shù)據(jù)分析兩種方式,但是從業(yè)者都需要具備三方面基礎(chǔ)知識(shí),分別是數(shù)學(xué)基礎(chǔ)、統(tǒng)計(jì)學(xué)基礎(chǔ)和計(jì)算機(jī)基礎(chǔ)。另外,數(shù)據(jù)分析往往與場(chǎng)景有緊密的聯(lián)系,所以數(shù)據(jù)分析師通常還需要具備一定的行業(yè)知識(shí)。
通過(guò)Python來(lái)進(jìn)行數(shù)據(jù)分析通常需要學(xué)習(xí)以下三方面知識(shí):
第一:Python基本語(yǔ)法。Python語(yǔ)言的語(yǔ)法結(jié)構(gòu)還是比較簡(jiǎn)單易學(xué)的,由于Python是函數(shù)式語(yǔ)言和面向?qū)ο笳Z(yǔ)言的結(jié)合體,所以Python使用起來(lái)也比較直接。即使沒(méi)有任何計(jì)算機(jī)基礎(chǔ),學(xué)習(xí)Python語(yǔ)法也并不困難。另外,在學(xué)習(xí)Python的過(guò)程中需要同時(shí)學(xué)習(xí)一下數(shù)據(jù)庫(kù)知識(shí),重點(diǎn)在于Sql語(yǔ)言的掌握。
第二:機(jī)器學(xué)習(xí)。目前采用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)分析是比較常見(jiàn)的方式,通過(guò)Python來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法也相對(duì)比較容易。機(jī)器學(xué)習(xí)的步驟包括數(shù)據(jù)收集、數(shù)據(jù)整理、算法設(shè)計(jì)、算法實(shí)現(xiàn)、算法訓(xùn)練、算法驗(yàn)證和算法應(yīng)用,所以學(xué)習(xí)機(jī)器學(xué)習(xí)的重點(diǎn)在算法上,然后通過(guò)Python來(lái)完成算法實(shí)現(xiàn),這個(gè)過(guò)程需要學(xué)習(xí)一系列庫(kù),包括Numpy、Matplotlib、Scipy、pandas等。
第三:大數(shù)據(jù)平臺(tái)。大數(shù)據(jù)分析離不開(kāi)大數(shù)據(jù)平臺(tái),所以掌握大數(shù)據(jù)平臺(tái)知識(shí)也是非常重要的,目前比較常見(jiàn)的大數(shù)據(jù)平臺(tái)包括Hadoop和Spark,Python也是比較常見(jiàn)的大數(shù)據(jù)平臺(tái)開(kāi)發(fā)語(yǔ)言。
我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計(jì)算機(jī)專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會(huì)陸續(xù)寫(xiě)一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會(huì)有所收獲。
如果有互聯(lián)網(wǎng)方面的問(wèn)題,或者考研方面的問(wèn)題,都可以咨詢我,謝謝!