樓主打錯字了,應該是(從事計算機生物信息學需要學哪些編程?)才對。
生物信息學,日常的工作環境是基于Unix的計算機集群,因此最常用的就是shell腳本。它可以簡單的處理數據,再加上迷你語言sed和awk,也能滿足日常需求了。
如果你滿足于此,將會發現自己的代碼維護不易,難以閱讀和分享,這時候我們需要學習更專業的語言。R和python都是數據科學領域紅火的編程語言,R本來就是由統計學家創建的,天生驕傲。python則是易上手的膠水語言,加上其擴展包pandas和scikit-learn等的加持,各行各業都有它的身影。建議都試試看,選擇一個用得順手的。
R的ggplot2和python的matplotlib各自賦予了兩者強大的畫圖能力,繪制科研插圖必不可少。有時候我們希望給圖片加上交互的功能,這時候javascript就該出場了,掌握javascript語法及其常用庫(如JQuery,boostrap和d3),能夠創建各類交互式應用。
有時候我們收集了大量的結果,想分享給整個領域,可以選擇創建一個數據庫,一個可行的技術棧就是前端使用javascript(包括boostrap,JQuery),后端搭配python的django或者flask。不少發表的科研數據庫文章都使用這種組合。
生物數據處理的經典軟件,需要密集計算的或可視化交互的一般都由C++和Java開發,組學數據處理的包大部分都在bioconductor里,少數是python的模塊。為了更好的交互體驗,基于javascript的軟件包也在不斷推出,比如bio.js社區的成立,再比如HiGlass(http://higlass.io/)可以流暢的在瀏覽器端可視化染色質交互矩陣(使用d3.js)。
當然對大部分生信分析人員來說,編程語言只是工具和解決問題的手段之一,更重要的還是對生物學問題的理解。