日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习和统计里面的auc怎么理解?

發布時間:2023/12/3 编程问答 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习和统计里面的auc怎么理解? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉自: https://www.zhihu.com/question/39840928


作者:小小丘 (該作者對 auc的意義 講得非常棒, 感謝付出)
鏈接:https://www.zhihu.com/question/39840928/answer/84906286
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

看到前面答主的答案,我表示很激動的想來一個簡化的版本。
曾經面試的時候被問到過這么一個問題,怎么向一個沒有任何計算機、數學、統計等基礎的人介紹下什么是AUC,當時我敗北了。不過后來我有一天頓悟了,為了檢驗我的頓悟是否有效,特此一答。
我給出的答案是 AUC是指 從一堆樣本中隨機抽一個,抽到正樣本的概率 比 抽到負樣本的概率 大的可能性。 其實這個解釋百度下到處都是,我是看別人說的然后理解了。 (這里列出無數參考文獻,請自行百度)
詳細解釋如下: 隨機抽取一個樣本, 對應每一潛在可能值X都對應有一個抽中的概率P。
按概率從高到矮排個降序, 對于正樣本中概率最高的,排序為rank_1, 比它概率小的有M-1個正樣本(M為正樣本個數), (rank_1 - M) 個負樣本。
正樣本概率第二高的, 排序為rank_2, 比它概率小的有M-2個正樣本,(rank_2 - M + 1) 個 負樣本。
以此類推
正樣本中概率最小的, 排序為rank_M,比它概率小的有0個正樣本,rank_M - 1 個負樣本。
總共有MxN個正負樣本對(N為負樣本個數)。把所有比較中 正樣本概率大于負樣本概率 的例子都算上, 得到公式(rank_1 - M + rank_2 - M + 1 .... + rank_M - 1) / (MxN) 就是正樣本概率大于負樣本概率的可能性了。 化簡后(因為后面是個等差數列)得:
<img src="https://pic3.zhimg.com/a84974778b7d3c1387971c181876c4e2_b.png" data-rawwidth="571" data-rawheight="113" class="origin_image zh-lightbox-thumb" width="571" data-original="https://pic3.zhimg.com/a84974778b7d3c1387971c181876c4e2_r.png">這就是傳說中的AUC公式。這只是用于理解,具體計算時候需要考慮rank平列的情況這就是傳說中的AUC公式。這只是用于理解,具體計算時候需要考慮rank平列的情況

總結

以上是生活随笔為你收集整理的机器学习和统计里面的auc怎么理解?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。