Python中直方分布是一個非常常用的統計學概率分布。它用于描述一個樣本的頻率分布。直方圖就是一種用柱形圖來表示數據分布的可視化方法。在Python中,我們可以使用matplotlib package中的hist()函數來實現對數據的直方分布計算和可視化。
# 導入相關packages import matplotlib.pyplot as plt import numpy as np # 生成隨機數據 data = np.random.normal(size=1000) # 直方圖可視化 plt.hist(data, bins=30, density=True, alpha=0.5, color='steelblue', edgecolor='black') plt.ylabel('Probability') plt.title('Histogram of Data') plt.show()
在上面的代碼中,我們使用Numpy中的random模塊生成了1000個隨機數,然后使用matplotlib的hist()函數來計算并繪制直方圖。繪圖時,我們指定了30個bin(bins=30),表示將數據分成30個區間。density=True參數會令y軸顯示出概率密度而非頻數,alpha指定柱子的透明度。
通過觀察這個直方分布圖,我們可以了解數據集的分布情況。柱子的高度表示每個區間內數據點的數量,柱子寬度表示區間跨度。如果數據呈現出不同的峰值,這意味著數據集中存在不同的集群。