在Python中,我們可以使用條件分組對數據進行分類和統計。條件分組是根據一定的條件進行分組的一種數據分析方法,它可以將數據分成若干個互不重疊的組,并在此基礎上進行分析和計算。在Python中,我們可以使用pandas庫中的groupby方法來實現條件分組。
import pandas as pd # 創建數據 data = {'學科': ['語文', '數學', '英語', '數學', '語文', '英語', '英語'], '分數': [90, 85, 95, 92, 88, 90, 93]} df = pd.DataFrame(data) # 按學科分組,并計算平均分 result = df.groupby('學科')['分數'].mean() print(result)
在上面的代碼中,我們首先使用pandas庫創建了一組數據,包含學科和分數兩列。然后使用groupby方法,按照學科列進行分組,并計算每個分組中的分數平均值。最后,將結果輸出。
此外,我們還可以根據多個條件進行分組。在groupby方法中可以傳入多個列名作為參數,此時會按照這些列的組合進行分組。
import pandas as pd # 創建數據 data = {'學科': ['語文', '數學', '英語', '數學', '語文', '英語', '英語'], '班級': ['一班', '二班', '三班', '二班', '一班', '三班', '三班'], '分數': [90, 85, 95, 92, 88, 90, 93]} df = pd.DataFrame(data) # 按學科和班級分組,并計算平均分 result = df.groupby(['學科', '班級'])['分數'].mean() print(result)
在上面的代碼中,我們根據學科和班級兩個條件進行分組,并計算每個組的分數平均值。
通過條件分組,我們可以方便地對數據進行分類和統計,便于我們進行數據分析和決策。