Python是一種廣泛使用的編程語言,用于數據分析、人工智能、機器學習等領域。在機器學習中,評估模型性能是非常重要的。ROC曲線是一種常見的評估工具,可以用于評估二元分類模型的性能。下面介紹如何使用Python創建ROC曲線。
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt
import numpy as np
# 構建二元分類模型
# ...
# 計算預測值和真實標簽
y_pred = model.predict(X_test)
fpr, tpr, threshold = roc_curve(y_test, y_pred)
roc_auc = auc(fpr, tpr)
# 繪制ROC曲線
plt.title('ROC Curve')
plt.plot(fpr, tpr, 'b', label='AUC = %0.2f' % roc_auc)
plt.legend(loc='best')
plt.plot([0, 1], [0, 1], 'r--')
plt.xlim([0, 1])
plt.ylim([0, 1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.show()
上面的代碼使用sklearn庫中的roc_curve和auc函數計算真陽率和假陽率,并繪制ROC曲線。其中,fpr表示假陽率,tpr表示真陽率。通過繪制ROC曲線,我們可以選擇最佳的模型閾值,以達到最佳的分類效果。ROC曲線下面積(AUC)可以用來評估模型的性能,AUC越大,則模型性能越好。