深度学习-AUC/PR计算
1 AUC :AUC 表示隨機抽取一個正樣本和一個負樣本,分類器正確給出正樣本的score高于負樣本的概率,在所以標注樣本中,正樣本共T個,負樣本共F 個,如果隨機抽取一個正樣本和負樣本,共有T*F 個pair,其實如果有s個pair 的正負樣本pair 滿足于正樣本的score 高于負樣本(權重為1),v個pair 正負樣本score 相同(權重為0.5),則AUC就等于(s+0.5v)/(T*F).
1 根據定義,由梯形法計算ROC 曲線下的面積,求auc
2 變量全部樣本,對正負pair 的數目計數,求AUC。
3 從高到底依次將score 值作為閾值,當測試樣本屬于正樣本的概率大于或等于這個threshold 時,我們認為它為正樣本,否則為負樣本,每次選取一個不同的threshold,就可以得到一組FPR和TPR,即ROC曲線上的一點,這樣一來,我們一共得到了20組FPR和TPR的值,將它們畫在ROC曲線。
2 PR 曲線
PR 曲線的橫坐標是召回率,縱坐標是準確率,對于一個排序模型來說,其PR 曲線上的一個點代表: 在某一個閾值下,模型將大于該閾值的結果判定為正樣本,整條PR 曲線是通過將閾值從高到低移動而生成的。所以可以整體地比較在不同閾值下模型預測的水平。
但是有個問題是離線評測數據集的數據分布往往跟線上環境的數據集分布不同,比如你的離線數據集正負樣本比例為1:1,線上樣本比例1:100,這是PR 曲線就不適用了,需要ROC 曲線。
總結
以上是生活随笔為你收集整理的深度学习-AUC/PR计算的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何给apk安装包去毒,避免被识别为病毒
- 下一篇: 梳理百年深度学习发展史-七月在线机器学习