聚類是一種常見的數據分析方法,它將相似的數據點分為一組。Python 在機器學習和數據分析中廣泛應用聚類技術。在 Python 中,有很多聚類算法,例如 K-means、層次聚類、DBSCAN 等。
# K-means 聚類示例 from sklearn.cluster import KMeans import matplotlib.pyplot as plt # 生成測試數據(二維點) X = np.random.random((100, 2)) # 定義聚類數 k = 3 # 初始化 K-means 模型 kmeans = KMeans(n_clusters=k) # 訓練模型 kmeans.fit(X) # 預測聚類結果 y_pred = kmeans.predict(X) # 繪制聚類結果 plt.scatter(X[:, 0], X[:, 1], c=y_pred) plt.title('K-means 聚類結果') plt.show()
以上代碼展示了 K-means 聚類算法的一個簡單示例。首先,我們使用 NumPy 庫生成了一個二維隨機點數據集。然后,我們定義了聚類數 k,初始化 K-means 模型。接著,我們訓練模型并使用它預測聚類結果。最后,使用 Matplotlib 庫繪制聚類結果圖形。
Python 還提供了用于可視化聚類結果的其他工具。seaborn 庫提供了基于 Matplotlib 的高度封裝聚類圖表,mpl_toolkits.mplot3d 庫提供了可視化三維版本的聚類分析。
上一篇vue去掉左右空格