python sklearn.learning_curve 什么是学习曲线?
生活随笔
收集整理的這篇文章主要介紹了
python sklearn.learning_curve 什么是学习曲线?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習曲線顯示了對于不同數量的訓練樣本的估計器的驗證和訓練評分。它可以幫助我們發現從增加更多的訓 練數據中能獲益多少,以及估計是否受方差誤差或偏差誤差的影響更大。如果驗證分數和訓練分數都收斂到一個相對于增加的訓練集大小來說過低的值,那么我們將不能從更多的訓練數據中獲益。
學習曲線函數:
from sklearn.learning_curve import learning_curve調用格式:
learning_curve(estimator, X, y, train_sizes=array([0.1, 0.325, 0.55, 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)# exploit 開發,開拓 incremental 增加的 dispatch 派遣,分派 verbose 冗長的參數:
- estimator:分類器
- X:訓練向量
- y:目標相對于X分類或者回歸
- train_sizes:訓練樣本相對的或絕對的數字,這些量的樣本將會生成learning curve。
- cv:確定交叉驗證的分離策略(None:使用默認的3-fold cross validation;integer:確定幾折交叉驗證)
- verbose:整型,可選擇的。控制冗余:越高,有越多的信息。
返回值:
-
train_sizes_abs:生成learning curve的訓練集的樣本數。重復的輸入會被刪除。
-
train_scores:在訓練集上的分數
-
test_scores:在測試集上的分數
總結
以上是生活随笔為你收集整理的python sklearn.learning_curve 什么是学习曲线?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入浅出python机器学习_4.3.1
- 下一篇: websocket python爬虫_p