CCF BDCI 多人种人脸识别冠军分享
冠軍分享:多人種人臉識別
天才兒童隊伍由三名隊員組成,成員由在讀研究生和博士生組成,主要的研究方向是圖像特征提取,目標識別與檢測。團隊有著豐富的項目經驗和比賽經驗。
文本是他們本次參賽的分享,比賽代碼已經開源。
這次比賽圖像領域的一些大佬并沒有參加,給了我們一次咸魚翻身的機會。
一般這種圖像賽最少2張卡,4張卡以上最佳,實驗室或者公司應該有這種硬件條件,這也是相對于表格結構數據比賽的門檻(順便吐槽下,獎金較少還要扣掉租服務器,但是去鄭州玩得很開心,主辦方非常用心在此表示感謝)。
拿到特等獎完全是意料之外的事情,八分運氣在里面。要知道優秀的隊伍很多,比我們強的也不少。技術之外的秘籍這種事情你認為有就有,認為沒有就沒有,只要相信自己的本心努力就好。
by 天才兒童
01 方案摘要
隨著人臉識別技術不斷成熟,市場需求將加速釋放,應用場景不斷被挖掘。從社保領取到校園門禁,從遠程授權到安檢閘機檢查,人臉識別正在不斷打開市場。人臉識別應用在加速普及,行業也呈現出新的發展趨勢。
本文應用深度學習技術對人臉數據集進行建模,進行了數據與模型方面的探索,搭建了一套面向實際場景的人臉識別方案。我們首先提出了適合人臉圖像的數據增強方法,構建了有監督與無監督結合的人臉識別模型,并搭建了一種推理模型,以此對人臉圖片進行相似度判斷。
團隊本次復賽A榜得分0.6582,B榜得分0.6583,均為線上第一。
02?比賽背景&數據集
我們可以看到訓練集中白種人數量遠超過其他人種,而測試集中各人種數量均衡。
從數據集統計可以看到數據集具有多樣性。
第4種是我們發現的主辦方創造數據集的方法,如果有時間的話,可以根據這個思路繼續做圖像增強,訓練一個使用主辦方方法增強的模型,效果應該會更好。
圖像增強的方法非常多,大概包括這些方法:水平翻轉、旋轉、平移、縮放、直方圖、平滑、濾波、色度抖動、銳度抖動。而且這些方法相互組合效果也不一樣。除了線上提交以外,可以先建立幾種指標線下判斷。
現有的人臉識別測試過程,通常是提取人臉的特征向量,再通過向量距離比如余弦相似度進行對比,而非直接通過網絡推理得到標簽。特征提取作為人臉識別最關鍵的步驟,已經有了很多成熟的網絡模型。接下來我們主要從神經網絡的損失函數,骨干網絡2個角度進行分析。
03 有監督模型
在ResNet2015年被提出后,越來越多優秀的網絡基于ResNet進行優化更新也取得卓越成就,而在網絡結構與進一步升級優化有困難的情況下,研究者逐步將目光轉向損失函數上。2018年提出的arcface的主要創新點就是優化損失函數。在傳統的Softmax基礎上提出了Center Losas,最終arcface損失函數包含Softmax loss 和 Center Loss。
模型使用arcface效果最好,人臉識別方面就是arcface一枝獨秀了,其他模型在比賽中效果有差距但可以用于模型融合。
損失函數采用Focal Loss最佳。
模型的骨干網絡使用Resnet系列,當然還融合了其他的網絡包括IResnet,Resnext,Densenet。
04 無監督模型
然后我們還使用了無監督的模型進行后處理。
ECCV2018的論文《基于模型共識的大規模無標注數據標簽傳播》。其假設已經有了少量的標注圖像,對于大量的未標注圖像,生成其樣本標簽對,可以稱其為半監督算法。
我們對其進行了改進,最終效果是一種無監督的人臉聚類模型。人臉聚類的方法不少,第二名也使用了類似聚類的方法。我們選擇這個模型的主要原因是因為快,當然第二名的方法也許精度更高。
人種后驗概率修正,利用人種的信息對預測概率進行修正。
當獲得了聚類ID后:
(1)對同一類ID判斷為同一個人,
(2)不同類ID判斷為不同人,
(3)對于沒有劃分的人,取原概率。
05 模型融合
這里再介紹一些模型:
這個模型分數并不高,但融合效果較好。
這個是我們搭建的模型,實際方案沒有采用,這里提供給大家思路。
融合方案如下:
圖中是15種模型,低分模型的權重已經是1%左右了,提升只是萬分位的,如果不刷分只需要效果最好的5種模型就可以了。
得到最終方案:
(1)提出了一種人臉圖像優化算法,建立了優化指標,可以較為準確地選出有效的圖像增強方法。
(2)對最新的人臉識別模型進行了分析與歸納,并進行了實驗優化。
(3)無監督模型在保證精度的情況下,線下的理論復雜度與增量迭代,使得其可以用于大規模數據集中。并且可以有更多的業務拓展,比如人臉標注、數據清洗和多賬號檢測等。
(4)方案可移植性好,可復用性強。
比賽鏈接:
https://www.datafountain.cn/competitions/348
冠軍代碼:
https://github.com/themostnewone/2019ccf
下面的代碼給出了所有圖像增強方法與分數最高的3種12個有監督模型。
代碼參考指北的小暇米的框架,在此表示感謝。
https://discussion.datafountain.cn/questions/1904/answers/22795
備注:公眾號菜單包含了整理了一本AI小抄,非常適合在通勤路上用學習。
往期精彩回顧2019年公眾號文章精選適合初學者入門人工智能的路線及資料下載機器學習在線手冊深度學習在線手冊AI基礎下載(第一部分)備注:加入本站微信群或者qq群,請回復“加群”加入知識星球(4500+用戶,ID:92416895),請回復“知識星球”喜歡文章,點個在看
總結
以上是生活随笔為你收集整理的CCF BDCI 多人种人脸识别冠军分享的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 10个关于文件操作的小功能(Python
- 下一篇: 梳理百年深度学习发展史-七月在线机器学习