需要重點(diǎn)學(xué)習(xí)哪些能力?
題主學(xué)歷是夠了,數(shù)據(jù)工程師這個(gè)方向也很好,未來也是主流。我就結(jié)合我自身的學(xué)習(xí)經(jīng)驗(yàn)提幾點(diǎn)吧,按需采納。
1.linux環(huán)境工作時(shí)的程序都是在linux環(huán)境跑的,所以基本運(yùn)維要熟悉,推薦使用centos7,熟練使用vi編輯器。熟練shell腳本。
2.docker容器技術(shù)不得不說,這個(gè)技術(shù)真是太尼瑪方便了,讓服務(wù)器運(yùn)維變得那么和諧。先掌握單機(jī)docker,然后可以用用docker swarm,如果k8s會(huì)的話,就更牛逼了。
3.java,python高級(jí)語言java的簡(jiǎn)單demo可以做做,安裝環(huán)境要熟悉,hadoop的安裝離不開java。python的一句名言,“人生苦短,我用python”,在我做了幾年java后,突然接觸python,體會(huì)的更深。python也是大數(shù)據(jù)分析的主流語言哦,比如深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)TensorFlow,就是用python的哦,學(xué)完python,做做圖像識(shí)別會(huì)有很大成就感。
4.hadoop生態(tài)老牌大數(shù)據(jù),相關(guān)資料也比較多,掌握hdfs,hive,hbase。
5.spark生態(tài)大數(shù)據(jù)網(wǎng)紅,spark streaming,spark sql,如果了解了storm流式計(jì)算更好。
6.數(shù)學(xué)做牛逼的數(shù)據(jù)分析師,算法是核心,而算法的核心就是數(shù)學(xué),有木有無招勝有招,大道至簡(jiǎn)的感覺。當(dāng)然大部分人不用寫啥算法,模型大牛們都寫好了,更多的是組裝調(diào)參。