Python作為一種流行的編程語(yǔ)言,擁有很多強(qiáng)大的工具來(lái)處理數(shù)據(jù)。當(dāng)處理大量數(shù)據(jù)時(shí),缺失值是一件很常見(jiàn)的事情。在Python中通過(guò)檢查缺失值我們能夠找到這些缺失值并做出進(jìn)一步的處理。
import pandas as pd # 創(chuàng)建一個(gè)包含缺失值的數(shù)據(jù)框 data = { '姓名': ['小明', '小紅', '小李', '小張', '小王'], '年齡': [18, 19, None, 22, 23], '性別': ['男', '女', '男', None, '女'], '職業(yè)': ['學(xué)生', None, '程序員', '商人', '教師'] } df = pd.DataFrame(data) # 檢查缺失值 print(df.isnull())
在上面的代碼中我們使用了pandas庫(kù)中的DataFrame函數(shù)來(lái)創(chuàng)建了一個(gè)包含缺失值的數(shù)據(jù)框。DataFrame函數(shù)可以根據(jù)字典的鍵值對(duì)來(lái)創(chuàng)建數(shù)據(jù)框,并自動(dòng)對(duì)齊各列的索引。對(duì)于缺失值pandas提供了isnull函數(shù)來(lái)判斷。isnull函數(shù)會(huì)返回一個(gè)布爾值的數(shù)據(jù)框,值為T(mén)rue的表示缺失值,否則為False。
除了使用isnull函數(shù)來(lái)檢查缺失值外,還可以使用fillna函數(shù)來(lái)填充缺失值。當(dāng)然,如果缺失值對(duì)分析結(jié)果不產(chǎn)生實(shí)質(zhì)性的影響,也可以選擇直接將含有缺失值的行或列刪除。在數(shù)據(jù)分析的過(guò)程中,需要考慮到缺失值的產(chǎn)生原因和實(shí)際情況來(lái)做出具體的處理。
上一篇python 檢查字典
下一篇python 給字典追加