R語言和Python一塊學習會弄混嗎?
參考前期的一篇文章:R vs Python / R 和 Python : 哪一種更好用?
R 和 Python 都是開源的、免費的高級編程語言。R 專門用于統計計算。它有大量附加包(package)/工具來支持機器學習和數據分析。另一方面,Python 是一種通用的強大的編程語言,在數據準備、數據調試和數據分析方面有特殊的應用。
這種區別也是不同分析人士喜歡這些編程語言的原因。Python 通常被嘗試開發數字處理和分析技能的計算機程序員所青睞。另一方面,R 被數學家和統計學家優先選擇。這些差異在這些語言的學習資源(書籍和網上論壇)中是顯而易見的。例如,考慮以下 4 本免費的在線圖書。
所有這些書都是高質量的統計教材,用 R 作為首選編程語言。這些只是幾個例子。請注意,第一本書不是專門用于 R,與第二本書有相同的作者。你很少會找到用 Python 作為首選語言的書籍。因此,R 更有能力處理數據挖掘和統計分析的相關問題。另一方面,Python 提供了非常好的應用程序來處理非結構化和復雜的數據集,如圖像、書面文本(網絡、電子郵件等)、基因、聲音等。
實質上,Python 和 R 一起構成了數據科學家的工具包。因此,對于務實的和面向應用的數據科學家來說,了解這兩種語言的超級能力和特點是至關重要的。
使用 R 進行分析、數據可視化與建模:
為分析提供了極好的靈活性
R 使你在分析的時候更容易思考
由于有著十分活躍的統計與數學社區,可以持續的更新和增強分析功能優秀的數據可視化工具
優秀的數據可視化工具
使用 Python 進行數據預處理、數據清洗,特別針對于非結構化數據(如網頁,圖像,文本等):
極強的靈活性,能夠從自由文本、網站和社交媒體網站提取信息
便于圖像挖掘和為分析準備數據
處理大量的數據的時候比 R 語言更好
對于一個認真的數據科學家來說,R 和 Python 都應該了解。我們需要的是 R+Python,而不是 R vs Python。
附圖: