文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法
學(xué)習(xí)筆記,僅供參考,有錯(cuò)必糾
關(guān)鍵詞:公平性學(xué)習(xí) , 分類間隔 , 目標(biāo)集 , 加權(quán)距離度量 , 歧視性
公平性機(jī)器學(xué)習(xí)中基于分類間隔的歧視樣本發(fā)現(xiàn)和消除算法
摘要
公平性學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn) , 預(yù)防歧視的目的在于執(zhí)行預(yù)測(cè)任務(wù)之前消除不公平訓(xùn)練集對(duì)于分類器的影響.為了保證分類公平性和準(zhǔn)確性 , 本文通過(guò)發(fā)現(xiàn)和消除原始數(shù)據(jù)集中的歧視樣本尋找生成公平數(shù)據(jù)集的方法 , 即提出了一種基于分類間隔的加權(quán)方法用于處理二分類任務(wù)中的歧視現(xiàn)象 , 并在 demographic parity和equalized odds公平性判定準(zhǔn)則上實(shí)現(xiàn)分類公平.
為了不影響分類準(zhǔn)確性 , 本文基于最大間隔原理將樣本投影之后選出目標(biāo)集 , 對(duì)于目標(biāo)集中的每個(gè)樣本 , 通過(guò)加權(quán)距離度量方法判定該樣本是否具有歧視性 , 并進(jìn)行修正 .
通過(guò)在 3 個(gè)真實(shí)數(shù)據(jù)集上與已有方法進(jìn)行實(shí)驗(yàn)對(duì)比 , 本文的方法能夠獲得更好的分類公平性和準(zhǔn)確性 , 并且不局限于特定的公平性判定準(zhǔn)則和分類器.
引言
近年來(lái) , 機(jī)器學(xué)習(xí)越來(lái)越受到各界人士的關(guān)注 . 然而 , 機(jī)器學(xué)習(xí)系統(tǒng)容易受到歷史數(shù)據(jù)的影響 , 并對(duì)少數(shù)群體、弱勢(shì)群體和歷史上處于不利地位的群體產(chǎn)生歧視行為 . 因此 , 有必要使用公平性準(zhǔn)則來(lái)約束機(jī)器學(xué)習(xí)系統(tǒng)在某些應(yīng)用場(chǎng)景中的行為 , 例如貸款、就業(yè)、刑事司法和廣告 , 并期望保護(hù)弱勢(shì)群體 , 從而在分類公平性和準(zhǔn)確性之間達(dá)到一個(gè)平衡.
目前 , 機(jī)器學(xué)習(xí)公平性的研究成果大致歸為以下 3 大類:
-
第 1 類方法通過(guò)數(shù)據(jù)預(yù)處理消除歧視樣本 . 主要策略是通過(guò)修改訓(xùn)練集來(lái)平衡
總結(jié)
以上是生活随笔為你收集整理的文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 筛选法求素数
- 下一篇: JupyterNotebook随记(pa