Python 是一種高效易用的編程語言,幾乎可以完成任何數(shù)學和統(tǒng)計分析任務(wù)。一項常見的數(shù)據(jù)分析工作就是繪制分位數(shù)圖。分位數(shù)圖可以讓我們很容易地檢查一組數(shù)據(jù)的分布情況。
# 導入必要的庫 import numpy as np import matplotlib.pyplot as plt # 生成一組隨機數(shù)據(jù) data = np.random.normal(size=1000) # 分位數(shù)的取值 percentiles = np.percentile(data, [25, 50, 75]) # 繪制分位數(shù)圖 plt.boxplot(data) plt.title('分位數(shù)圖') plt.xlabel('樣本') plt.ylabel('值') plt.axhline(y=percentiles[0], color='r', linestyle='--') # 25% 分位數(shù)線 plt.axhline(y=percentiles[1], color='g', linestyle='-') # 50% 分位數(shù)線 plt.axhline(y=percentiles[2], color='b', linestyle='--') # 75% 分位數(shù)線 plt.show()
代碼中使用了 NumPy 和 Matplotlib 庫,首先使用 NumPy 生成一組隨機數(shù)據(jù),然后使用 np.percentile() 函數(shù)計算出數(shù)據(jù)的 25%, 50%, 75% 分位數(shù)值。最后調(diào)用 Matplotlib 的 boxplot() 函數(shù)繪制分位數(shù)圖。
通過分位數(shù)圖,我們可以直觀上了解數(shù)據(jù)分布情況,包括極端值、分散程度和是否存在異常值等等。如果分位數(shù)線之間的距離相等,說明數(shù)據(jù)符合正態(tài)分布。如果分位數(shù)線之間的距離不等,說明數(shù)據(jù)存在偏斜。同時,可以根據(jù)分位數(shù)圖的繪制結(jié)果對數(shù)據(jù)進行進一步分析和挖掘。