色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

python 缺失值統計

吉茹定2年前9瀏覽0評論

Python是一種流行的編程語言,擁有豐富的數據分析工具包,其中包括用于處理缺失值的工具。缺失值在數據分析中是經常遇到的問題。處理缺失值是一項非常重要的任務,因為未處理的缺失值將導致不準確和不完整的數據分析結果。

import pandas as pd
data = {'name': ['John','Sam','Ali','Mia','Lisa'],
'age': [22,28,30,None,25],
'gender': ['M','M','M',None,'F'],
'salary': [30000, 50000, None, 70000, 40000]}
df = pd.DataFrame(data)
print(df.isna().sum())

在上述代碼中,我們使用pandas包創建了一個包含缺失值的數據集。我們使用isna()函數來檢查缺失值。該函數返回的結果是布爾值,在缺失值的位置為True。我們使用sum()函數來計算每列缺失值的數量。結果顯示age列有一個缺失值,gender列有一個缺失值,salary列有一個缺失值。

除了計算每列的缺失值數量外,還可以對缺失值進行其他處理。例如,我們可以使用fillna()函數來用特定的值填充缺失值。我們可以使用dropna()函數刪除包含缺失值的行或列。

# 用平均工資填充缺失值
df['salary'].fillna(df['salary'].mean(), inplace=True)
print(df)
# 刪除包含缺失值的行
df.dropna(inplace=True)
print(df)

在上述代碼中,我們使用fillna()函數將salary列的缺失值替換為平均工資。我們使用inplace=True參數來直接在原數據集上進行更改。我們還可以使用dropna()函數刪除包含缺失值的行或列。同樣,我們使用inplace=True參數直接在原數據集上進行更改。

在數據分析中,處理缺失值是一項非常重要的任務。Python提供了多種工具和函數來處理缺失值。通過使用這些函數,我們可以有效地統計和處理缺失值,保證數據分析結果的準確性和完整性。