在數(shù)據(jù)分析過程中,探索性數(shù)據(jù)分析(EDA)是很重要的環(huán)節(jié)之一。在EDA過程中,我們通常需要了解數(shù)據(jù)之間的關(guān)系及其分布。其中,聯(lián)合分布就是一種非常有用的探索工具。本文將介紹如何使用Python畫聯(lián)合分布。
# 導(dǎo)入相關(guān)庫(kù) import seaborn as sns import matplotlib.pyplot as plt # 導(dǎo)入數(shù)據(jù) tips = sns.load_dataset('tips') # 畫聯(lián)合分布圖 sns.jointplot(x='total_bill', y='tip', data=tips, kind='scatter') plt.show()
代碼解釋:
- sns.load_dataset('tips')導(dǎo)入tips數(shù)據(jù)集
- sns.jointplot()函數(shù)用于畫聯(lián)合分布圖,其中x為橫坐標(biāo),y為縱坐標(biāo),data為數(shù)據(jù)集,kind為圖表類型,此處為散點(diǎn)圖
- plt.show()用于顯示圖表
上述代碼所畫的聯(lián)合分布圖如下圖所示:
______________ | | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | | X X X X X X | |______________
其中,X表示散點(diǎn)。
除了散點(diǎn)圖外,聯(lián)合分布圖還有其他圖表類型,如hex、kde等。它們的使用方式與上述代碼類似,只需要將kind參數(shù)改為對(duì)應(yīng)的值即可。
Python的seaborn庫(kù)提供了非常方便的畫圖函數(shù),可以幫我們快速地進(jìn)行探索性數(shù)據(jù)分析,包括聯(lián)合分布圖。希望本文能對(duì)大家的數(shù)據(jù)分析工作有所幫助。