色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

python 拆分訓練集

傅智翔2年前9瀏覽0評論

在機器學習中,訓練集的劃分是至關重要的一步。適當的訓練集劃分可以有效提高模型的準確性和泛化能力。在python中,使用sklearn庫可以很方便地進行訓練集和測試集的劃分。

from sklearn.model_selection import train_test_split
X = [[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]
y = [0, 1, 2, 3, 4]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

上面的代碼中,X是特征矩陣,y是目標變量。train_test_split函數會將X和y按照test_size的比例拆分為訓練集(X_train, y_train)和測試集(X_test, y_test),其中random_state為隨機種子,保證每次劃分的結果相同。

除了train_test_split函數外,sklearn庫還提供了其他數據集拆分的函數,并支持跨數據集的拆分,例如StratifiedKFold、TimeSeriesSplit等。