Python 是一種強大的編程語言,它支持多種編程范式,包括對象、面向過程和函數式編程。 Python 提供了許多功能,讓開發者能夠更加容易地開發軟件和解決問題。
1. 數據處理和分析
import pandas as pd # 讀取 CSV 文件 df = pd.read_csv('data.csv') # 顯示前 5 行數據 print(df.head()) # 計算平均值 print(df.mean()) # 畫散點圖 df.plot(kind='scatter', x='x', y='y')
Python 中的 Pandas 庫是一個非常強大的數據分析工具,它可以處理各種類型的數據結構,并且提供了一系列的能力來分析和統計數據。使用 Pandas,可以輕松地讀取和寫入各種格式的文件,如 CSV、Excel、SQL 和 HDF5 文件。
2. 爬蟲
import requests from bs4 import BeautifulSoup # 獲取 HTML 頁面 url = 'https://www.google.com' response = requests.get(url) html = response.text # 解析 HTML 頁面 soup = BeautifulSoup(html, 'html.parser') print(soup.title.string)
Python 甚至在網絡爬蟲的領域也很出色。通過 Python 中的 Requests 和 BeautifulSoup 等庫,可以輕松地獲取網頁的 HTML 頁面并從中抽取所需的數據。這使得 Python 成為尋找和提取網絡數據的最佳工具之一。
3. 機器學習
from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier # 加載數據 iris = datasets.load_iris() X = iris.data y = iris.target # 劃分訓練集和測試集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 訓練模型 knn = KNeighborsClassifier(n_neighbors=3) knn.fit(X_train, y_train) # 預測 y_pred = knn.predict(X_test) # 計算準確率 print(knn.score(X_test, y_test))
Python 還有一大優勢是其強大的機器學習和數據挖掘庫。Scikit-learn 是一個流行的 Python 機器學習庫,它包含了大量的機器學習算法和工具,如分類、聚類、回歸等。使用 Scikit-learn,可以輕松地訓練機器學習模型,預測數據,評估模型的性能等等。