色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

python++樣本劃分

林子帆1年前9瀏覽0評論

在機器學習的分類任務中,樣本劃分是非常重要的一個環節,需要將樣本集合分成訓練集、驗證集、測試集三個部分。這里我們介紹Python++中的樣本劃分函數。

from sklearn.model_selection import train_test_split
# 加載數據
X, y = load_data()
# 劃分數據集
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)
X_val, X_test, y_val, y_test = train_test_split(X_val, y_val, test_size=0.5, random_state=42)
print("訓練集大小:", len(X_train))
print("驗證集大小:", len(X_val))
print("測試集大小:", len(X_test))

在上述代碼中,我們首先通過load_data()函數加載了數據集X和標簽y。然后使用train_test_split()函數將數據集和標簽分別劃分為訓練集、驗證集和測試集。

其中test_size參數表示要劃分出來的測試集大小占總樣本數量的比例(本例中test_size=0.2表示劃分出來的測試集占總樣本數量的20%),random_state參數表示隨機數種子,方便將結果進行復現。

在本例中,我們將驗證集大小設置為測試集大小的一半,即test_size=0.5。

最后,我們輸出了劃分之后的訓練集、驗證集和測試集的大小。