分类模型的评估方法-F分数(F-Score)
前面介紹了機(jī)器學(xué)習(xí)中分類(lèi)模型的精確率(Precision)和召回率(Recall)評(píng)估指標(biāo)。對(duì)于Precision和Recall,雖然從計(jì)算公式來(lái)看,并沒(méi)有什么必然的相關(guān)性關(guān)系,但是,在大規(guī)模數(shù)據(jù)集合中,這2個(gè)指標(biāo)往往是相互制約的。理想情況下做到兩個(gè)指標(biāo)都高當(dāng)然最好,但一般情況下,Precision高,Recall就低,Recall高,Precision就低。所以在實(shí)際中常常需要根據(jù)具體情況做出取舍,例如一般的搜索情況,在保證召回率的條件下,盡量提升精確率。而像癌癥檢測(cè)、地震檢測(cè)、金融欺詐等,則在保證精確率的條件下,盡量提升召回率。
所以,很多時(shí)候我們需要綜合權(quán)衡這2個(gè)指標(biāo),這就引出了一個(gè)新的指標(biāo)F-score。這是綜合考慮Precision和Recall的調(diào)和值。
當(dāng)β=1時(shí),稱(chēng)為F1-score,這時(shí),精確率和召回率都很重要,權(quán)重相同。當(dāng)有些情況下,我們認(rèn)為精確率更重要些,那就調(diào)整β的值小于1,如果我們認(rèn)為召回率更重要些,那就調(diào)整β的值大于1。
舉個(gè)例子:癌癥檢查數(shù)據(jù)樣本有10000個(gè),其中10個(gè)數(shù)據(jù)祥本是有癌癥,其它是無(wú)癌癥。假設(shè)分類(lèi)模型在無(wú)癌癥數(shù)據(jù)9990中預(yù)測(cè)正確了9980個(gè),在10個(gè)癌癥數(shù)據(jù)中預(yù)測(cè)正確了9個(gè),此時(shí)真陽(yáng)=9,真陰=9980,假陽(yáng)=10,假陰=1。
那么:
Accuracy = (9+9980) /10000=99.89%
Precision=9/19+10)= 47.36%
F1-score=2×(47.36% × 90%)/(1×47.36%+90%)=62.07%
F2-score=5× (47.36% × 90%)/(4×47.36%+90%)=76. 27%
總結(jié)
以上是生活随笔為你收集整理的分类模型的评估方法-F分数(F-Score)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 分类模型的评估方法-召回率(Recall
- 下一篇: 统计学---掌握数据的整体状态