LFW
?
LFW概述
1. 人臉檢測測試數據庫:
fddb:http://vis-www.cs.umass.edu/fddb/
2. 人臉識別測試數據庫:
lfw:http://vis-www.cs.umass.edu/lfw/#views
3. LFW(人臉比對數據集)
無約束自然場景人臉識別數據集,該數據集由13000多張全世界知名人士互聯網自然場景不同朝向、表情和光照環境人臉圖片組成,共有5000多人,其中有1680人有2張或2張以上人臉圖片。每張人臉圖片都有其唯一的姓名ID和序號加以區分。
?
LFW數據集主要測試人臉識別的準確率,該數據庫從中隨機選擇了6000對人臉組成了人臉辨識圖片對,其中3000對屬于同一個人2張人臉照片,3000對屬于不同的人每人1張人臉照片。測試過程LFW給出一對照片,詢問測試中的系統兩張照片是不是同一個人,系統給出“是”或“否”的答案。通過6000對人臉測試結果的系統答案與真實答案的比值可以得到人臉識別準確率。?
這個集合被廣泛應用于評價 face verification算法的性能。
4. 技術報告(lfw technical report):
http://vis-www.cs.umass.edu/lfw/lfw_update.pdf
5. 測試過程概述
通過dlib進行人臉識別網絡訓練后,得到dlib_face_recognition_resnet_model_v1.dat。通常大家在LFW人臉數據集上對該模型進行精度驗證。以下梳理驗證過程:
(1) 在原始LFW數據集中,截取人臉圖像并保存。(例如:可以使用開源人臉檢測對齊seetaface將人臉crop出來,并 保存,建議以原圖像名稱加一個后綴命名人臉圖像)
(2) 通過python,matlab,或者C++,構建訓練時的網絡結構并加載dlib_face_recognition_resnet_model_v1.dat。?
(3) 將截取的人臉送入網絡,每個人臉都可以得到網絡前向運算的最終結果,一般為一個N維向量,并保存,建議以原圖像名稱加一個后綴命名。
(4) LFW提供了6000對人臉驗證txt文件,lfw_pairs.txt,其中第1個300人是同一個人的兩幅人臉圖像;第2個300人是兩個不同人的人臉圖像。按照該list,在(3)保存的數據中,找到對比人臉對應的N維特征向量。
(5) 通過cosine距離/歐式距離計算兩張人臉的相似度。同臉和異臉分別保存到各自對應的得分向量中。?
(6) 同臉得分向量按照從小到大排序,異臉向量按照從大到小排序。?
(7) FAR(錯誤接受率)從0~1,按照萬分之一的單位,利用排序后的向量,求FRR(錯誤拒絕率)或者TPR(ture positive ratio)。
(8) 根據7可繪制ROC曲線。
6. 閾值確定
(1) 將測試人臉對分為10組,用來確定閾值并驗證精讀。
(2) 自己擬定一個人臉識別相似度閾值范圍,在這個范圍內逐個確認在某一閾值下,選取其中1組數據統計同臉判斷錯誤和異臉判定錯誤的個數。
(3) 選擇錯誤個數最少的那個閾值,用剩余9組,判斷識別精度。?
(4) 步驟(2)和(3)執行10次,將每次(3)獲取的精度進行累加并求平均,得到最終判定精度。
其中也可以用下述方式替換?
自己擬定一個人臉識別相似度閾值范圍,在這個范圍內逐個確認在某一閾值下,針對所有人臉對統計同臉判斷錯誤和異臉判定錯誤的個數,從而計算得出判定精度。
LFW中的 pairs.txt
pairs.txt 官方介紹
第一行:300表示的是300個匹配圖片(相同的人),10表示的是重復十次?
Abel_Pacheco 1 4 表示這個文件夾的Abel_Pacheco_0001.jpg 和Abel_Pacheco_0004.jpg
300行以后 開始不匹配圖片?
一共重復10次構成完整的pairs.txt,因此一共3000 mached, 3000個no_mached
得出準確率的思路就是:(正確判斷出 matche的次數+正確判斷 no_mached的次數) / 6000
總結
- 上一篇: VR与AR简史
- 下一篇: 查看手机是否安装微信客户端