基于数据驱动的人脸识别课题研究
目錄
- 摘要
- Abstract
- 1 項(xiàng)目研究背景
- 1.1 課題研究背景及意義
- 1.2 人臉識(shí)別國內(nèi)外研究現(xiàn)狀
- 2 圖像預(yù)處理
- 2.1 圖像縮放
- 2.2 圖像灰度化
- 2.3 直方圖均衡化
- 第三章 人臉識(shí)別
- 3.1 HOG
- 3.2 SVM
- 4 人臉識(shí)別
- 4.1 LBP原理
- 4.1.1 圓形LBP算子
- 4.1.2 旋轉(zhuǎn)不變模式
- 4.1.3 等價(jià)模式
- 4.2 LBP特征用于檢測的原理
- 4.3 LBP于SVM相結(jié)合
- 4.3.1 分類器
- 4.3.2 非線性支持向量機(jī)
- 4.4 數(shù)據(jù)驅(qū)動(dòng)
- 第五章 結(jié)論
摘要
人臉識(shí)別技術(shù)是指根據(jù)人臉的面部特征,對人臉進(jìn)行識(shí)別,通 過人臉識(shí)別技術(shù)進(jìn)行身份識(shí)別,是一種方便有效的方式,跟其他身 份識(shí)別方式相比,具有方便,不宜復(fù)制等優(yōu)點(diǎn)。因此可以廣泛用于 門禁識(shí)別,安防監(jiān)控等領(lǐng)域?;诖诵枨?#xff0c;本文提出了人臉識(shí)別技術(shù)在住宅小區(qū)安全監(jiān)測中的應(yīng)用。人臉識(shí)別技術(shù)的核心問題是識(shí)別計(jì)算機(jī)的能力。它可以促進(jìn)人工智能、模式識(shí)別和計(jì)算機(jī)視覺等相關(guān)領(lǐng)域的發(fā)展。它具有一定的理論意義。人臉識(shí)別在信息安全、醫(yī)療保健、安全監(jiān)控、人機(jī)交互、金融等領(lǐng)域有著廣泛的應(yīng)用。
人臉識(shí)別包括人臉檢測、預(yù)處理、特征提取和人臉檢測四個(gè)主要步驟。本文對上述步驟進(jìn)行了研究。主要內(nèi)容如下:
1、研究了局部二值模式(LBP)人臉特征的表達(dá)和提取方法,比較了直方圖均衡化、高斯平滑和Sobel邊緣提取三種預(yù)處理方法對LBP識(shí)別率的影響。通過比較發(fā)現(xiàn),不同的預(yù)處理方法對LBP算法有不同的影響。其中,LBP算法與索貝爾相結(jié)合提高了不同光照條件下人臉圖像的識(shí)別率。
2、通過實(shí)驗(yàn)驗(yàn)證了基于LBP人臉識(shí)別方法的塊大小對LBP算子性能的影響。實(shí)驗(yàn)表明,識(shí)別率越高,識(shí)別率越高,識(shí)別率越低。
3、提出了一種結(jié)合LBP特征提取和支持向量機(jī)(SVM)分類器的算法,并在FRET人臉庫中使用支持向量機(jī)分類器和最近鄰分類器對實(shí)驗(yàn)進(jìn)行比較。實(shí)驗(yàn)表明,支持向量機(jī)分類器結(jié)合LBP特征提取方法具有較好的分類性能。
最后,對全文的工作進(jìn)行了總結(jié)。
關(guān)鍵詞:人臉識(shí)別;局部二值模式;預(yù)處理;支持向量機(jī)。
Abstract
The key issue of face recognition is how to make computer identify the specific person, It can speed up the development of the Artificial Intelligence,Pattern recognition and Computer Vision.and it is very significant in theoretical aspect. At the same time,face recognition is of wide potential applications, such as information security,medical treatment,security monitoring, human-computer interaction, and the finance,and so on.Face recognition mainly consists of four basic steps: face detection,pretreatment,feature extraction and face judgment. The main contents are as follows:
1.Study on the LBP representation and extraction of the facial features,compare the LBP recognition rate with the three kinds of pretreatment methods of histogram equalization, Gaussian smoothing, Sobel edge detection.Experiment found that different pretreatment on the LBP algorithm induces different influence.The recognition rate of LBP algorithm with Sobel under different light conditions increase larger.
2.Experiments validate the face recognition method based on LBP,
observing the block-size effects on the performance of the LBP operator.Experiments show that the more block, the more higher the recognition rate,but blocks too much lead to a fall in the recognition rate.
3.The thesis combin LBP algorithm with classification,through experiment compare the classification result of support vector machine classifier and nearest neighbor classifier.The results show the combination of LBP feature extraction method and support vector machine classifier has a better classification performance.
The last,The thesis make a summary for all of work.
Key Words: face recognition;LBP;pretreatment;SVM
1 項(xiàng)目研究背景
1.1 課題研究背景及意義
人臉識(shí)別技術(shù)在商業(yè)、軍事、政府和其他領(lǐng)域中都有著廣闊的應(yīng)用前景。例如信息安全、檔案管理、出入口控制、醫(yī)療、刑事偵破、保安監(jiān)視、人機(jī)交互系統(tǒng)、視頻會(huì)議等場合。在經(jīng)濟(jì)和電子商務(wù)領(lǐng)域,對各種銀行卡、儲(chǔ)蓄卡的持卡人身份進(jìn)行驗(yàn)證。在家庭娛樂方面,有智能玩具、家政機(jī)器人、真實(shí)感虛擬游戲等。主要典型應(yīng)用有:
①身份鑒定:將采集到的臉部數(shù)據(jù)進(jìn)行處理后與人臉數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行實(shí)時(shí)的對比,按相似度進(jìn)行排序,給出鑒定的結(jié)果或相對應(yīng)的可信度??捎糜谟?jì)算機(jī)、網(wǎng)絡(luò)安全、金融業(yè)務(wù)、邊境控制、訪問控制等領(lǐng)域。例如,2008 年北京奧運(yùn)會(huì)入場檢測首次采用了人臉識(shí)別技術(shù)對入場者進(jìn)行身份識(shí)別;2009 年國慶閱兵武器管理以及天安門廣場日常安全監(jiān)控系統(tǒng)都采用了人臉識(shí)別技術(shù)。
②身份確認(rèn):將實(shí)時(shí)采集到的人臉數(shù)據(jù)和存儲(chǔ)在智能卡或其他存儲(chǔ)設(shè)備中的人臉數(shù)據(jù)進(jìn)行對比,相似度達(dá)到一定程度,則對比成功即可以確定用戶身份。身份確認(rèn)可應(yīng)用于選民登記、身份證、護(hù)照、駕駛執(zhí)照、工作證、機(jī)場安檢口身份證檢查及結(jié)合犯罪嫌疑人識(shí)別系統(tǒng)的安檢口控制系統(tǒng)等。利用人臉特征識(shí)別用戶,保護(hù)計(jì)算機(jī)信息,及人臉屏幕保護(hù)和文件加密。
③視頻監(jiān)控:人臉識(shí)別技術(shù)可以用攝像機(jī)對人進(jìn)行連續(xù)跟蹤和定位,將人臉從背景中分離出來,與監(jiān)控列表進(jìn)行比對,具有連續(xù)實(shí)時(shí)性、不被干擾等點(diǎn)。在對圖像進(jìn)行分析時(shí),用到人臉檢測、跟蹤及識(shí)別等技術(shù)。該技術(shù)可應(yīng)用于閉路電視監(jiān)控、交通管理、臉部照片登記系統(tǒng)、事件后分析系統(tǒng),以及基于Internet 的網(wǎng)上追逃系統(tǒng)等。
1.2 人臉識(shí)別國內(nèi)外研究現(xiàn)狀
人臉識(shí)別國內(nèi)外研究現(xiàn)狀如下:
目前,國內(nèi)從事人臉識(shí)別技術(shù)研究的主要專業(yè)機(jī)構(gòu)和相關(guān)人員包括:
中國科學(xué)院計(jì)算所,高文教授和陳熙霖教授帶領(lǐng)的研究小組在人臉檢測、大型人臉數(shù)據(jù) 庫的建立、人臉識(shí)別算法的實(shí)用化等方面取得了豐碩成果;
中國科學(xué)院自動(dòng)化所,譚鐵牛研究員領(lǐng)導(dǎo)的研究小組提出將人臉特征與其它生物特征相 融合的方法,大幅度改善了單一生物特征識(shí)別的效果;
生物特征識(shí)別與安全技術(shù)研究中心,李子青教授帶領(lǐng)的研究小組在近紅外人臉識(shí)別和中 遠(yuǎn)距離人臉識(shí)別的研究中獲得了顯著成果,有效降低了光照對人臉識(shí)別性能的影響。
國外人臉識(shí)別技術(shù)的研究主要以美國、歐洲、日本等國家為主。例如:
美國哈佛大學(xué)(Harvard University)的 Stone Z 等人提出了一種基于社交語境下的大規(guī)模 人臉識(shí)別方法;英國格拉斯哥大學(xué)(University of Glasgow)的 Mike 教授和斯特林大學(xué)(University of Stirling)的 Bruce 教授領(lǐng)導(dǎo)的研究組,主要從事大腦在人臉識(shí)別中的作用和人 臉感知方面的研究。
人臉識(shí)別技術(shù)的發(fā)展最早始于上世紀(jì)60年代末。它主要經(jīng)歷了三個(gè)階段:第一階段是1964-1990年,是人臉識(shí)別的初級(jí)階段,其主要方法是基于人臉的幾何結(jié)構(gòu)特征。以Bertillon、艾倫和帕克為代表,研究了人臉識(shí)別所需的人臉特征,計(jì)算出各特征點(diǎn)之間的幾何距離,并利用最近鄰法和其他分類方法對人臉進(jìn)行識(shí)別。識(shí)別過程由人工操作完成。這是一個(gè)非自動(dòng)識(shí)別過程。在這一階段,結(jié)果很少,實(shí)際應(yīng)用也不多。第二階段為1991~1997年。人臉識(shí)別研究正在迅速發(fā)展。這是人臉識(shí)別研究的高潮。已經(jīng)產(chǎn)生了一些代表性的人臉識(shí)別算法,并且許多商業(yè)操作的人臉識(shí)別系統(tǒng)已經(jīng)誕生,并且美國軍方還組織了一個(gè)著名的FRET人臉識(shí)別算法測試。其中,重要的結(jié)果是Turk和Pentland提出的“特征臉”方法,并成為人臉識(shí)別性能識(shí)別的基準(zhǔn)算法。一般來說,線性子空間判別分析、統(tǒng)計(jì)外觀模型和統(tǒng)計(jì)模式識(shí)別方法是現(xiàn)階段的主流技術(shù)。在理想條件下,該算法能取得令人滿意的結(jié)果。第三階段是從1998到現(xiàn)在。它屬于機(jī)器識(shí)別階段,用戶不合作、不合意的采集條件、光照和姿態(tài)等問題逐漸成為研究熱點(diǎn)。這一時(shí)期的重要成果是基于Georghiades等人提出的光錐模型的人臉識(shí)別等?;贐lanz和維特爾提出的基于三維變形模型的人臉識(shí)別技術(shù),在姿態(tài)變化、光照變化、年齡和表情變化的條件下,提高了人臉識(shí)別的性能。以支持向量機(jī)為代表的統(tǒng)計(jì)學(xué)習(xí)理論也被應(yīng)用于人臉識(shí)別。
2 圖像預(yù)處理
從廣義上講,人臉識(shí)別過程包括人臉檢測、圖像預(yù)處理、人臉特征提取和人臉識(shí)別四個(gè)部分。
人臉檢測是指任何圖像或視頻輸入判斷是否有人臉。如果有人臉,則區(qū)分人臉區(qū)域和背景,并給出人臉的位置、大小和其他相關(guān)信息。它還可以在一系列圖像序列或動(dòng)態(tài)視頻和人臉跟蹤中實(shí)時(shí)檢測人臉。人臉檢測主要受光照、噪聲、姿態(tài)和遮擋等因素的影響。人臉檢測作為人臉識(shí)別系統(tǒng)的第一步,直接關(guān)系到人臉識(shí)別的準(zhǔn)確性和可行性,影響整個(gè)系統(tǒng)的性能。人臉檢測與跟蹤是人臉識(shí)別研究中的一項(xiàng)關(guān)鍵技術(shù),具有很高的學(xué)術(shù)價(jià)值。模型的特點(diǎn)是復(fù)雜的,很難找到一個(gè)常用的算法來檢測,所以在應(yīng)用中經(jīng)常會(huì)集成很多模式來檢測。本章將詳細(xì)分析圖像預(yù)處理。
2.1 圖像縮放
圖像因大小不同,不可以直接使用,需要對圖像進(jìn)行預(yù)處理使得圖像大小一致。
假如圖像的象素矩陣如下圖所示(這個(gè)原始圖把它叫做源圖,Source):
234 38 22
67 44 12
89 65 63
這個(gè)矩陣中,元素坐標(biāo)(x,y)是這樣確定的,x從左到右,從0開始,y從上到下,也是從零開始,這是圖象處理中最常用的坐標(biāo)系,就是這樣一個(gè)坐標(biāo):
---------------------->X
|
|
|
|
|
∨Y
如果想把這副圖放大為 4X4大小的圖像,那么該怎么做呢?那么第一步肯定想到的是先把4X4的矩陣先畫出來再說,好了矩陣畫出來了,如下所示,當(dāng)然,矩陣的每個(gè)像素都是未知數(shù),等待著我們?nèi)ヌ畛?#xff08;這個(gè)將要被填充的圖的叫做目標(biāo)圖,Destination):
? ? ? ?
? ? ? ?
? ? ? ?
? ? ? ?
常用的插值方法有:最近鄰插值、雙線性插值、三次卷積法。
在進(jìn)行數(shù)字圖像處理時(shí),經(jīng)常會(huì)遇到十進(jìn)制像素坐標(biāo)值的問題,因此需要根據(jù)相鄰像素的值插值坐標(biāo)。例如:地圖投影轉(zhuǎn)換,將目標(biāo)圖像中的一個(gè)像素坐標(biāo)變換到對應(yīng)點(diǎn)上的源圖像,變換的坐標(biāo)是一個(gè)十進(jìn)制,例如,幾何校正的圖像,也會(huì)遇到同樣的問題。下面是三種常用的數(shù)字圖像插值方法。
1、最鄰近元法
這是最簡單的插值方法。它不需要計(jì)算。在像素的四個(gè)相鄰像素中,像素的最近像素灰度被給予最近像素中的像素。設(shè)i+u, j+v(i, j為正整數(shù), u, v為大于零小于1的小數(shù),下同)為待求象素坐標(biāo),則待求象素灰度的值 f(i+u, j+v) 如圖1.1所示:
圖1.1 像素坐標(biāo)最鄰近元法
如果(i+u, j+v)落在A區(qū),即u<0.5, v<0.5,則將左上角象素的灰度值賦給待求象素,同理,落在B區(qū)則賦予右上角的象素灰度值,落在C區(qū)則賦予左下角象素的灰度值,落在D區(qū)則賦予右下角象素的灰度值。
最鄰近元法計(jì)算量較小,但可能會(huì)造成插值生成的圖像灰度上的不連續(xù),在灰度變化的地方可能出現(xiàn)明顯的鋸齒狀。
2、雙線性內(nèi)插法
雙線性內(nèi)插法是利用待求象素四個(gè)鄰象素的灰度在兩個(gè)方向上作線性內(nèi)插,如圖1.2所示:
圖1.2 雙線性內(nèi)插
對于 (i, j+v),f(i, j) 到 f(i, j+1) 的灰度變化為線性關(guān)系,則有:
f(i, j+v) = [f(i, j+1) - f(i, j)] * v + f(i, j)
同理對于 (i+1, j+v) 則有:
f(i+1, j+v) = [f(i+1, j+1) - f(i+1, j)] * v + f(i+1, j)
從f(i, j+v) 到 f(i+1, j+v) 的灰度變化也為線性關(guān)系,由此可推導(dǎo)出待求象素灰度的計(jì)算式如下:
f(i+u, j+v) = (1-u) * (1-v) * f(i, j) + (1-u) * v * f(i, j+1) + u * (1-v) * f(i+1, j) + u * v * f(i+1, j+1)
雙線性內(nèi)插法的計(jì)算比最鄰近點(diǎn)法復(fù)雜,計(jì)算量較大,但沒有灰度不連續(xù)的缺點(diǎn),結(jié)果基本令人滿意。它具有低通濾波性質(zhì),使高頻分量受損,圖像輪廓可能會(huì)有一點(diǎn)模糊
w
圖1.3 最鄰近插值放大圖片
圖1.4 雙線型內(nèi)插值放大圖片
2.2 圖像灰度化
識(shí)別物體,最關(guān)鍵的因素是梯度(現(xiàn)在很多的特征提取,SIFT,HOG等等本質(zhì)都是梯度的統(tǒng)計(jì)信息),梯度意味著邊緣,這是最本質(zhì)的部分,而計(jì)算梯度,自然就用到灰度圖像了。顏色本身,非常容易受到光照等因素的影響,同類的物體顏色有很多變化。所以顏色本身難以提供關(guān)鍵信息。
將彩色圖像轉(zhuǎn)化成為灰度圖像的過程成為圖像的灰度化處理。彩色圖像中的每個(gè)像素的顏色有R、G、B三個(gè)分量決定,而每個(gè)分量有255中值可取,這樣一個(gè)像素點(diǎn)可以有1600多萬(255255255)的顏色的變化范圍。而灰度圖像是R、G、B三個(gè)分量相同的一種特殊的彩色圖像,其一個(gè)像素點(diǎn)的變化范圍為255種,所以在數(shù)字圖像處理種一般先將各種格式的圖像轉(zhuǎn)變成灰度圖像以使后續(xù)的圖像的計(jì)算量變得少一些?;叶葓D像的描述與彩色圖像一樣仍然反映了整幅圖像的整體和局部的色度和亮度等級(jí)的分布和特征。圖像的灰度化處理可用兩種方法來實(shí)現(xiàn)。
第一種方法使求出每個(gè)像素點(diǎn)的R、G、B三個(gè)分量的平均值,然后將這個(gè)平均值賦予給這個(gè)像素的三個(gè)分量。
第二種方法是根據(jù)YUV的顏色空間中,Y的分量的物理意義是點(diǎn)的亮度,由該值反映亮度等級(jí),根據(jù)RGB和YUV顏色空間的變化關(guān)系可建立亮度Y與R、G、B三個(gè)顏色分量的對應(yīng):Y=0.3R+0.59G+0.11B,以這個(gè)亮度值表達(dá)圖像的灰度值。
2.3 直方圖均衡化
如果圖像中的像素占據(jù)大量灰度并均勻分布,那么這些圖像往往具有高對比度和可變灰度。直方圖均衡化是一種僅由輸入直方圖信息自動(dòng)實(shí)現(xiàn)這種效果的變換函數(shù)。其基本思想是擴(kuò)大圖像中的像素?cái)?shù),壓縮圖像中的幾個(gè)像素的灰度級(jí),從而擴(kuò)大像素值的動(dòng)態(tài)范圍,提高對比度和灰度色調(diào)的變化,使圖像更加清晰。
圖像對比度增強(qiáng)方法可分為兩大類:一種是直接對比增強(qiáng),另一種是間接對比增強(qiáng)。直方圖拉伸和直方圖均衡是兩種最常用的間接對比度增強(qiáng)方法。通過對比度拉伸來拉伸直方圖,以擴(kuò)大前景和背景灰度之間的差異,從而達(dá)到增強(qiáng)對比度的目的。這種方法可以通過線性或非線性的方法來實(shí)現(xiàn)。利用累加函數(shù)對灰度值進(jìn)行“調(diào)整”,實(shí)現(xiàn)直方圖均衡化。對比增強(qiáng)。
直方圖均衡化是在圖像處理領(lǐng)域中利用圖像直方圖進(jìn)行圖像對比度的一種方法。這種方法通常用于增加許多圖像的局部對比度,特別是當(dāng)有用數(shù)據(jù)的對比度非常接近時(shí)。通過這種方法,亮度可以更好地分布在直方圖上。這可以用來增強(qiáng)局部對比度而不影響整體對比度,并且直方圖均衡可以通過有效地?cái)U(kuò)展通常亮度來實(shí)現(xiàn)。
直方圖均衡化的“中心思想”是將原始圖像的灰度直方圖變換成灰度范圍內(nèi)從相對集中的灰度范圍內(nèi)的均勻分布。直方圖均衡化是對圖像進(jìn)行非線性拉伸并重新分配圖像的像素值,使得某一灰度級(jí)的像素?cái)?shù)大致相同。直方圖均衡化是給定圖像的直方圖。分布改變成“均勻”分布直方圖分布。
直方圖均衡化的基本思想是把原始圖的直方圖變換為均勻分布的形式,這樣就增加了像
灰度值的動(dòng)態(tài)范圍可以增強(qiáng)圖像的整體對比度。將原始圖像的灰度(x,y)設(shè)置為f,當(dāng)改變圖像為G時(shí),圖像增強(qiáng)方法可以被描述為將灰度f映射到(x,y)到g?;叶戎狈綀D均衡過程中的映射函數(shù)到圖像可以定義為g=eq(f),映射。G函數(shù)Eq(f)必須滿足兩個(gè)條件(L是圖像的灰度序列):
(1)EQ(f)在0≤f≤L-1范圍內(nèi)是一個(gè)單值單增函數(shù)。這是為了保證增強(qiáng)處理沒有打亂原始圖像的灰度排列次序,原圖各灰度級(jí)在變換后仍保持從黑到白(或從白到黑)的排列。
(2)對于0≤f≤L-1有0≤g≤L-1,這個(gè)條件保證了變換前后灰度值動(dòng)態(tài)范圍的一致性。
累積分布函數(shù)(cumulative distribution function,CDF)即可以滿足上述兩個(gè)條件,并且通過該函數(shù)可以完成將原圖像f的分布轉(zhuǎn)換成g的均勻分布。此時(shí)的直方圖均衡化映射函數(shù)為:
= EQ( ) = (ni/n) = pf( ) ,
(k=0,1,2,……,L-1)
根據(jù)該方程,上述求和區(qū)間為K.的0,可以直接從源圖像中每個(gè)像素的灰度值獲得每個(gè)像素的灰度值。在實(shí)際的處理變換中,對原始圖像的灰度情況進(jìn)行統(tǒng)計(jì)分析,計(jì)算原始直方圖分布,然后根據(jù)計(jì)算得到的累積直方圖分布得到灰度映射關(guān)系。在重復(fù)上述步驟之后,將源圖像的所有灰度映射到目標(biāo)圖像的灰度級(jí),可以根據(jù)映射關(guān)系通過源圖像像素像素的灰度變換完成源圖像的直方圖均衡化。
直接白地理解直方圖均衡化:上述公式不能簡單地從數(shù)學(xué)的角度解釋直方圖均衡化的計(jì)算方法,也不能解釋數(shù)學(xué)公式背后的含義。簡而言之,直方圖均衡化是尋找對應(yīng)函數(shù)s= f(r),r作為輸入信號(hào)圖像,s作為輸出信號(hào)的圖像。我們的目標(biāo)是找到F的表達(dá)式,想象一個(gè)直方圖位于小灰度值區(qū)域的未處理圖像。俗話說,柱狀圖很窄。我們想把它變成一個(gè)非常寬的直方圖,所以這需要一個(gè)拉伸函數(shù)。顯然,該函數(shù)必須保證圖像中像素的大小不能順序改變,否則將改變原始圖像中表達(dá)的內(nèi)容。我們認(rèn)為此時(shí)的累積分布函數(shù)。為了便于理解,相反,我們討論如何找到累積分布函數(shù)。首先,一般來說,灰度圖像的像素值在0~255之間。然后,如果要在0~255之間盡可能地分布像素,則在灰度分布時(shí),原始圖像的灰度值的密度是不同的。例如,圖像R的原始像素分布在原始像素的像素值的100-150和140~150之間。此時(shí),如果將原始圖像映射到0~255的線性函數(shù)(45度直線的起點(diǎn))是不可行的,則線性函數(shù)不能表示原始像素值的密度分布。情況。然而,累積分布函數(shù)與原始像素在一定間隔內(nèi)的分布密切相關(guān)。如果原始像素被累加,則發(fā)現(xiàn)140~150像素占據(jù)累積函數(shù)的大部分變化。累積函數(shù)僅是表示區(qū)間內(nèi)原始像素的分布規(guī)律。它以灰度值表示100-150區(qū)間內(nèi)原始圖像中像素的分布。此時(shí),我們使用這個(gè)分布乘以255,并且我們將分布擴(kuò)展到0~255區(qū)間。如果將該產(chǎn)品作為像素值來形成新的圖像S,則發(fā)現(xiàn)原始的窄直方圖將被拉伸到0~255,并且在原始圖像中像素值分布的分布被良好地保存。上述過程是從輸入圖像R到輸出圖像S的過程,這是我們正在尋找的映射函數(shù)F。
該方法對背景和前景過于明亮或太暗的圖像有很大的幫助,特別是在X射線圖像中顯示出更好的骨結(jié)構(gòu)顯示,并且在曝光過度或曝光不足的情況下能更好地顯示細(xì)節(jié)。這種方法的主要優(yōu)點(diǎn)之一是它是一種相當(dāng)直觀的技術(shù)和可逆操作,并且如果已知平衡函數(shù),則可以恢復(fù)原始直方圖,并且計(jì)算量小。
這種方法的一個(gè)缺點(diǎn)是它不選擇處理過的數(shù)據(jù)。它可以增大背景噪聲的對比度,減少有用信號(hào)的對比度,減少變換后的灰度值,消除一些細(xì)節(jié);直方圖等圖像具有峰值,處理后的對比度自然地過度增強(qiáng)。
第三章 人臉識(shí)別
3.1 HOG
梯度直方圖(HOG)是計(jì)算機(jī)視覺和圖像處理中用于目標(biāo)檢測的特征描述符。通過計(jì)算統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖,特征描述符HOG特征。
在一對圖像中,可以通過梯度或邊緣的方向密度的分布來很好地描述局部目標(biāo)的圖像和形狀。本質(zhì)是梯度的統(tǒng)計(jì)信息,梯度主要存在于邊緣。
HOG特征和SVM分類器在圖像識(shí)別中有著廣泛的應(yīng)用,特別是在行人檢測中。
1、顏色和伽馬歸一化
為了減少光照因素的影響,首先需要對整個(gè)圖像進(jìn)行歸一化處理。在圖像的紋理強(qiáng)度中,局部表面曝光的貢獻(xiàn)較大,因此這種壓縮處理可以有效地減少圖像的陰影和光照變化。
2。圖像梯度的計(jì)算
計(jì)算圖像的水平坐標(biāo)和垂直坐標(biāo)的梯度,并相應(yīng)地計(jì)算每個(gè)像素位置的梯度方向值。引導(dǎo)操作不僅可以捕捉輪廓、人體陰影和一些紋理信息,而且可以進(jìn)一步削弱照明的影響。
最常用的方法是簡單地將一維離散差分模板在一個(gè)方向上或同時(shí)在水平和垂直兩個(gè)方向上進(jìn)行圖像處理,更具體地說,該方法需要使用濾波器核來濾除圖像或C的顏色。收集暴力數(shù)據(jù)。
三。施工方向直方圖
單元單元中的每個(gè)像素對基于方向的直方圖信道進(jìn)行投票。投票是一個(gè)加權(quán)投票,也就是說,每個(gè)票都有一個(gè)權(quán)重值。權(quán)重是根據(jù)像素點(diǎn)的梯度來計(jì)算的。權(quán)重值本身或其功能可以用來表示權(quán)重。結(jié)果表明,利用振幅表示權(quán)重值可以獲得最佳效果。當(dāng)然,它也可以選擇振幅的函數(shù),如振幅的平方根、振幅的平方、振幅的截?cái)嗟?。單元單元可以是長方形的或星形的。直方圖通道均勻分布在01800(NO或0(3600))。在研究的范圍內(nèi),發(fā)現(xiàn)有一個(gè)方向)。使用無向梯度和9個(gè)直方圖通道,可以在行人檢測實(shí)驗(yàn)中獲得最佳結(jié)果。
4。將細(xì)胞單元結(jié)合成大間隔
由于背景光的變化和前景背景的對比,梯度強(qiáng)度變化很大。這需要梯度強(qiáng)度的歸一化。歸一化可以進(jìn)一步壓縮光、陰影和邊緣。
該方法是將每個(gè)單元單元組合成一個(gè)大的、空間上連接的間隔。以這種方式,HOG描述符成為由每個(gè)間隔中的所有單元單元的直方圖組成的向量。這些間隔彼此重疊,這意味著每個(gè)單元單元的輸出多次作用于端部。描述符。
間隔有兩個(gè)主要的幾何形狀-矩形間隔(R -豬和環(huán)間隔(C)-豬-豬間隔通常是一個(gè)正方形格子)。它可以具有三個(gè)參數(shù)來表征每個(gè)間隔中的單元單元的數(shù)目、每個(gè)單元單元中的像素?cái)?shù)目、以及每個(gè)單元的直方圖通道的數(shù)目。眼睛。
5。收集豬的特點(diǎn)
提取的HOG特征被輸入到SVM分類器,以找到最優(yōu)超平面作為決策函數(shù)。
當(dāng)數(shù)據(jù)量大或數(shù)據(jù)維數(shù)大但樣本量小時(shí),在計(jì)算過程中可能存在大量的資源消耗或過度學(xué)習(xí)(過擬合)[39 ] -[ 40 ]。過濾特征篩選方法與樣本維數(shù)不直接相關(guān),當(dāng)特征維數(shù)較高時(shí),可以有效地過濾特征。過濾方法是基于現(xiàn)有的數(shù)據(jù)集,并從數(shù)據(jù)角度選擇特征。在這個(gè)過程中,特征選擇與訓(xùn)練模型沒有直接關(guān)系。過濾器主要從距離、信息、依賴性和一致性四個(gè)角度對[41 ]進(jìn)行評價(jià)。
從信息的角度進(jìn)行測量是當(dāng)前研究的一個(gè)重要方向。從信息熵的角度出發(fā),提出了提取特征的算法。信息熵理論提出了數(shù)據(jù)分布,并利用不確定性來評估42個(gè)特征間的關(guān)系(用最大線性關(guān)系)。
信息的測量是多種多樣的,例如SNR(方查碧),這是一種廣泛使用的測量方法。
信號(hào)噪聲大,響應(yīng)數(shù)據(jù)中的有用信息大,信噪比低。在實(shí)際應(yīng)用中,變量數(shù)可能變化較小,不能提供有用的信息,但其存在可能影響算法的運(yùn)算時(shí)間或精度,因此有必要濾除數(shù)據(jù)中的小變化特性。當(dāng)數(shù)據(jù)發(fā)生很大變化時(shí),它被認(rèn)為是有用的信息,而基本不變。它被認(rèn)為是噪聲信號(hào)。基于方差閾值的特征選擇方法是一種相對簡單的特征,它消除了數(shù)據(jù)方差的方差,并且類似于低通濾波器。然而,由于數(shù)據(jù)單元的不同,為了避免引入閾值設(shè)置,應(yīng)該進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化。
圖2-2方差閾值與特征個(gè)數(shù)關(guān)系圖
Fig.2-2 The relation graph of variance threshold and characteristic number
方差閾值與特征個(gè)數(shù)關(guān)系圖顯示,隨著閾值的提高,特征個(gè)數(shù)逐漸降低。因?yàn)閷?shù)據(jù)做歸一化處理,使得數(shù)據(jù)落在(0,1),在數(shù)據(jù)波動(dòng)不到1%既認(rèn)為數(shù)據(jù)的波動(dòng)主要來自噪聲數(shù)據(jù),數(shù)據(jù)特征是不相關(guān)特征。通過方差閾值特征篩選法,將特征數(shù)從728維降到479維。
3.2 SVM
支持向量機(jī)(SVM)是指支持向量機(jī),這是一種常見的判別方法。在機(jī)器學(xué)習(xí)領(lǐng)域,它是一種有監(jiān)督的學(xué)習(xí)模式,它通常是用于模式識(shí)別,分類和回歸分析。
支持向量機(jī)方法是地圖樣本空間到特征空間(希爾伯特空間)的非線性映射,使得非線性可分的問題在原始樣本空間轉(zhuǎn)化為特征空間中的線性可分問題。將樣本映射到高維空間。在一般情況下,這會(huì)增加計(jì)算的復(fù)雜度,甚至導(dǎo)致“維數(shù)災(zāi)難”,所以很少有人問。但作為分類和回歸,它是可能的樣本集不能在低維樣本空間的線性處理,但它可以在高維特征空間,通過。線性超平面是一個(gè)線性劃分(或回歸)。一般的升維會(huì)帶來復(fù)雜的計(jì)算。支持向量機(jī)方法巧妙地解決了這個(gè)問題:利用核函數(shù)的展開定理,沒有必要知道的非線性映射的顯式表達(dá)式;因?yàn)榫€性學(xué)習(xí)機(jī)在高獸醫(yī)空間建立,所以線性學(xué)習(xí)機(jī)是建立。與線性模型相比,它不僅不僅增加了計(jì)算的復(fù)雜度,又避免了“維數(shù)災(zāi)難”在一定程度上。這一切都是由于核函數(shù)的擴(kuò)展和計(jì)算理論。這是訓(xùn)練分類器建立分類模型的第一步,和訓(xùn)練次數(shù)需要在訓(xùn)練階段分析。根據(jù)機(jī)組的特點(diǎn),相應(yīng)的數(shù)據(jù)集的一個(gè)準(zhǔn)確的描述或模型為每個(gè)類生成。我們可以使用LIBSVM軟件包來訓(xùn)練分類器模型。首先,我們需要寫的人臉圖像的特征向量為樣本文件根據(jù)libsvm格式。數(shù)據(jù)格式是
[label][indexl]:[value1][index2]:[value2]…
其中[label]標(biāo)識(shí)樣本類別,通常為整數(shù)。[index]為有序的索引,以1開始的整數(shù),可以是不連續(xù)的整數(shù),代表特征向量序列。
選擇不同的核函數(shù),可以生成不同的SVM,常用的核函數(shù)有以下4種:
⑴線性核函數(shù)K(x,y)=x·y;
⑵多項(xiàng)式核函數(shù)K(x,y)=[(x·y)+1]^d;
⑶徑向基函數(shù)K(x,y)=exp(-|x-y|2/d2)
⑷二層神經(jīng)網(wǎng)絡(luò)核函數(shù)K(x,y)=tanh(a(x·y)+b)
4 人臉識(shí)別
歷史數(shù)據(jù)包括電梯運(yùn)行數(shù)據(jù)、故障原因、維修記錄等。由于收集器故障和通信環(huán)境的運(yùn)行環(huán)境,原始數(shù)據(jù)中不存在臟數(shù)據(jù)?!芭K數(shù)據(jù)”指的是不完整的數(shù)據(jù)和噪聲,影響數(shù)據(jù)集訓(xùn)練模型的正確性,這使得決策系統(tǒng)產(chǎn)生錯(cuò)誤的結(jié)果并影響信息服務(wù)的質(zhì)量。良好的數(shù)據(jù)挖掘結(jié)果的前提是數(shù)據(jù)必須是正確的、一致的、完整的和可靠的。數(shù)據(jù)預(yù)處理在很大程度上決定了用于分析的數(shù)據(jù)質(zhì)量,影響了決策的科學(xué)性。
在預(yù)處理中,實(shí)際特征數(shù)據(jù)與業(yè)務(wù)背景應(yīng)有效結(jié)合。該方案以電梯數(shù)據(jù)和電梯營業(yè)環(huán)境為背景。通過對數(shù)據(jù)進(jìn)行預(yù)處理,使原始數(shù)據(jù)更適合于電梯設(shè)備的健康評估。
3-1 數(shù)據(jù)預(yù)處理系統(tǒng)
Fig.3-1 Data preprocessing system
4.1 LBP原理
人臉識(shí)別是指將一個(gè)需要識(shí)別的人臉和人臉庫中的某個(gè)人臉對應(yīng)起來(類似于指紋識(shí)別),目的是完成識(shí)別功能,該術(shù)語需要和人臉檢測進(jìn)行區(qū)分,人臉檢測是在一張圖片中把人臉定位出來,完成的是搜尋的功能。從OpenCV2.4開始,加入了新的類FaceRecognizer,該類用于人臉識(shí)別,使用它可以方便地進(jìn)行相關(guān)識(shí)別實(shí)驗(yàn)。
原始的LBP算子對于每幅圖上每個(gè)像素點(diǎn)用其周圍3× 3鄰域像素值對此像素點(diǎn)進(jìn)行紋理描述。LBP 算子公式為
原始的LBP算子定義為在33的窗口內(nèi),以窗口中心像素為閾值,將相鄰的8個(gè)像素的灰度值與其進(jìn)行比較,若周圍像素值大于或等于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。這樣,33鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù)(通常轉(zhuǎn)換為十進(jìn)制數(shù)即LBP碼,共256種),即得到該窗口中心像素點(diǎn)的LBP值,并用這個(gè)值來反映該區(qū)域的紋理特征。如下圖所示:
原始的LBP提出后,研究人員不斷對其提出了各種改進(jìn)和優(yōu)化。
4.1.1 圓形LBP算子
基本的 LBP算子的最大缺陷在于它只覆蓋了一個(gè)固定半徑范圍內(nèi)的小區(qū)域,這顯然不能滿足不同尺寸和頻率紋理的需要。為了適應(yīng)不同尺度的紋理特征,Ojala等對LBP算子進(jìn)行了改進(jìn),將3×3鄰域擴(kuò)展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進(jìn)后的LBP算子允許在半徑為R的圓形鄰域內(nèi)有任意多個(gè)像素點(diǎn),從而得到了諸如半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子,OpenCV中正是使用圓形LBP算子,下圖示意了圓形LBP算子:
4.1.2 旋轉(zhuǎn)不變模式
從LBP的定義可以看出,LBP算子是灰度不變的,但卻不是旋轉(zhuǎn)不變的,圖像的旋轉(zhuǎn)就會(huì)得到不同的LBP值。Maenpaa等人又將LBP算子進(jìn)行了擴(kuò)展,提出了具有旋轉(zhuǎn)不變性的LBP算子,即不斷旋轉(zhuǎn)圓形鄰域得到一系列初始定義的LBP值,取其最小值作為該鄰域的LBP值。下圖給出了求取旋轉(zhuǎn)不變LBP的過程示意圖,圖中算子下方的數(shù)字表示該算子對應(yīng)的LBP值,圖中所示的8種LBP模式,經(jīng)過旋轉(zhuǎn)不變的處理,最終得到的具有旋轉(zhuǎn)不變性的LBP值為15。也就是說,圖中的8種LBP模式對應(yīng)的旋轉(zhuǎn)不變的LBP碼值都是00001111。
4.1.3 等價(jià)模式
一個(gè)LBP算子可以產(chǎn)生不同的二進(jìn)制模式,對于半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子將會(huì)產(chǎn)生P2種模式。很顯然,隨著鄰域集內(nèi)采樣點(diǎn)數(shù)的增加,二進(jìn)制模式的種類是急劇增加的。例如:5×5鄰域內(nèi)20個(gè)采樣點(diǎn),有220=1,048,576種二進(jìn)制模式。如此多的二值模式無論對于紋理的提取還是對于紋理的識(shí)別、分類及信息的存取都是不利的。為了解決二進(jìn)制模式過多的問題,提高統(tǒng)計(jì)性,Ojala提出了采用一種“等價(jià)模式”(Uniform Pattern)來對LBP算子的模式種類進(jìn)行降維。Ojala等認(rèn)為,在實(shí)際圖像中,絕大多數(shù)LBP模式最多只包含兩次從1到0或從0到1的跳變。因此,Ojala將“等價(jià)模式”定義為:當(dāng)某個(gè)局部二進(jìn)制模式所對應(yīng)的循環(huán)二進(jìn)制數(shù)從0到1或從1到0最多有兩次跳變時(shí),該局部二進(jìn)制模式所對應(yīng)的二進(jìn)制就成為一個(gè)等價(jià)模式類。如00000000(0次跳變),00000111(含一次從0到1的跳變和一次1到0的跳變),10001111(先由1跳到0,再由0跳到1,共兩次跳變)都是等價(jià)模式類。除等價(jià)模式類以外的模式都?xì)w為另一類,稱為混合模式類,例如10010111(共四次跳變)。
通過這樣的改進(jìn),二進(jìn)制模式的種類大大減少,模式數(shù)量由原來的2P種減少為P(P-1)+2+1種,其中P表示鄰域集內(nèi)的采樣點(diǎn)數(shù),等價(jià)模式類包含P(P-1)+2種模式,混合模式類只有1種模式。對于3×3鄰域內(nèi)8個(gè)采樣點(diǎn)來說,二進(jìn)制模式由原始的256種減少為59種,這使得特征向量的維數(shù)更少,并且可以減少高頻噪聲帶來的影響。
4.2 LBP特征用于檢測的原理
顯而易見的是,上述提取的LBP算子在每個(gè)像素點(diǎn)都可以得到一個(gè)LBP“編碼”,那么,對一幅圖像(記錄的是每個(gè)像素點(diǎn)的灰度值)提取其原始的LBP算子之后,得到的原始LBP特征依然是“一幅圖片”(記錄的是每個(gè)像素點(diǎn)的LBP值),如圖所示:
如果將以上得到的LBP圖直接用于人臉識(shí)別,其實(shí)和不提取LBP特征沒什么區(qū)別,在實(shí)際的LBP應(yīng)用中一般采用LBP特征譜的統(tǒng)計(jì)直方圖作為特征向量進(jìn)行分類識(shí)別,并且可以將一幅圖片劃分為若干的子區(qū)域,對每個(gè)子區(qū)域內(nèi)的每個(gè)像素點(diǎn)都提取LBP特征,然后,在每個(gè)子區(qū)域內(nèi)建立LBP特征的統(tǒng)計(jì)直方圖。如此一來,每個(gè)子區(qū)域,就可以用一個(gè)統(tǒng)計(jì)直方圖來進(jìn)行描述,整個(gè)圖片就由若干個(gè)統(tǒng)計(jì)直方圖組成,這樣做的好處是在一定范圍內(nèi)減小圖像沒完全對準(zhǔn)而產(chǎn)生的誤差,分區(qū)的另外一個(gè)意義在于我們可以根據(jù)不同的子區(qū)域給予不同的權(quán)重,比如說我們認(rèn)為中心部分分區(qū)的權(quán)重大于邊緣部分分區(qū)的權(quán)重,意思就是說中心部分在進(jìn)行圖片匹配識(shí)別時(shí)的意義更為重大。 例如:一幅100100像素大小的圖片,劃分為1010=100個(gè)子區(qū)域(可以通過多種方式來劃分區(qū)域),每個(gè)子區(qū)域的大小為1010像素;在每個(gè)子區(qū)域內(nèi)的每個(gè)像素點(diǎn),提取其LBP特征,然后,建立統(tǒng)計(jì)直方圖;這樣,這幅圖片就有1010個(gè)子區(qū)域,也就有了1010個(gè)統(tǒng)計(jì)直方圖,利用這1010個(gè)統(tǒng)計(jì)直方圖,就可以描述這幅圖片了。之后,我們利用各種相似性度量函數(shù),就可以判斷兩幅圖像之間的相似性了。
4.3 LBP于SVM相結(jié)合
人臉識(shí)別的最后一個(gè)步驟,就是分類人臉的特征信息,對人臉進(jìn)行判別。LBP 方法是一個(gè)很有效的特征提取方法,很適合人臉表征。但在分類性能上存在一定不足,與后續(xù)的學(xué)習(xí)算法無關(guān),我們嘗試將其與分類器結(jié)合來提高圖像識(shí)別率。因此本章要研究的問題就是LBP特征提取與SVM分類器的結(jié)合,通過實(shí)驗(yàn)來研究LBP特征提取與SVM分類器的關(guān)系,并比較SVM和最近鄰分類器的性能。
4.3.1 分類器
分類器的設(shè)計(jì)是模式識(shí)別領(lǐng)域的重要內(nèi)容,對人臉識(shí)別來說,分類器的設(shè)計(jì)是否合適是一個(gè)值得研究的重要問題,其分類能力好壞直接決定了系統(tǒng)的性能。在人臉識(shí)別過程中,在人臉特征提取之后,可以利用分類器對提取的特征向量進(jìn)行分類處理。
支持向量機(jī)是2世紀(jì)90年代提出的基于統(tǒng)計(jì)學(xué)習(xí)理論的學(xué)習(xí)算法,是近年來非常流行的分類器。其基本原理是以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則,通過某種非線性映射把原始數(shù)據(jù)映射到高維特征空間,在高維空間中構(gòu)造具有低VC維的最優(yōu)分類超平面,使其具有最優(yōu)的推廣能力。在人臉識(shí)別的分類系統(tǒng)中,一開始就收集到完備的訓(xùn)練樣本是很困難的,我們要求分類器能夠在使用過程中,從實(shí)際測試樣本中選擇出重要的樣本進(jìn)行主動(dòng)、增量和長期的學(xué)習(xí),不斷提高分類器的性能,支持向量機(jī)憑借統(tǒng)計(jì)學(xué)習(xí)理論堅(jiān)實(shí)的基礎(chǔ),成為解決小樣本、非線性及高維模式識(shí)別的有力工具。Guodong 在ORL人臉庫上進(jìn)行實(shí)驗(yàn)比較了支持向量機(jī)、特征臉和最近鄰分類器的分類效果,實(shí)驗(yàn)結(jié)果表明支持向量機(jī)的分類性能要優(yōu)于特征臉和最近鄰分類器。因此我們選擇支持向量機(jī)作為實(shí)驗(yàn)的分類器,觀察LBP 特征提取方法和SVM 結(jié)合的效果。
4.3.2 非線性支持向量機(jī)
線性支持向量機(jī)對于許多具有非線性結(jié)構(gòu)的現(xiàn)實(shí)問題來說是不適合的。對于非線性問題,如何把線性支持向量機(jī)推廣到解決非線性模式分類問題?利用一個(gè)簡單的方法可以解決這個(gè)問題,如圖4.2所示,利用非線性函數(shù)? (x)把數(shù)據(jù)從低維輸入空間Rn映射到一個(gè)高維的特征空間H。使得數(shù)據(jù)在高維空間中具有更好的可分性。在高維特征空間H中求解線性支持向量機(jī)的最優(yōu)分類面,再投影回低維輸入空間就是一個(gè)非線性的曲面。
4.4 數(shù)據(jù)驅(qū)動(dòng)
在計(jì)算機(jī)系統(tǒng)中, 經(jīng)驗(yàn)通常是以數(shù)據(jù)的形式存在. 我們將提供給計(jì)算機(jī)每個(gè)類別的許多實(shí)例(examples), 它們組成了訓(xùn)練集(training set), 利用學(xué)習(xí)算法(learning algorithms)從訓(xùn)練集中產(chǎn)生分類器(classifier)}或模型(model). 在面對新情況時(shí)(例如看到一張以前未出現(xiàn)的圖像), 模型會(huì)提供相應(yīng)的判斷. 這個(gè)過程, 即本文需要討論的數(shù)據(jù)驅(qū)動(dòng)過程.
為了通過攝像頭或者其他的攝取人臉設(shè)備采集到圖像信息,相應(yīng)的開發(fā)板需要安裝相應(yīng)的攝像頭驅(qū)動(dòng)程序,以及對攝像頭訪問的應(yīng)用程序,需要編寫對攝像頭的訪問程序。通過攝像頭所獲得的圖像信息的數(shù)據(jù)格式為YUV編碼格式,而opencv所支持的圖像信息顏色通道順序?yàn)锽GR格式,在qt中對圖像操作的類是Qimages,該類支持的Qimage支持的顏色通道順序是RGB,在opencv 中實(shí)現(xiàn)顏色通道順序的轉(zhuǎn)換可使用函數(shù)cvCvtColor(const CvArrsrc, CvArr dst,int code)來實(shí)現(xiàn)。
第五章 結(jié)論
人臉識(shí)別在公安部門、安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、檔案管理、人機(jī)交互系統(tǒng)等領(lǐng)域有著廣闊的應(yīng)用前景,已經(jīng)成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。對于機(jī)器來說,要快速準(zhǔn)確的通過人臉識(shí)別出人的身份是很困難的事情,識(shí)別率容易受到姿態(tài)、光照和表情的影響。經(jīng)過幾十年的發(fā)展,各種人臉識(shí)別技術(shù)相對成熟,各種識(shí)別技術(shù)各有優(yōu)缺,本文對紋理描述算子LBP 進(jìn)行了研究,主要工作有:
1.歸納總結(jié)了常用的人臉識(shí)別方法,分析人臉識(shí)別的主要步驟,介紹了國際上常用的人臉數(shù)據(jù)庫。
2.針對LBP 基本算子和LBP 的演化算子進(jìn)行深入研究,總結(jié)出LBP 的優(yōu)點(diǎn)。通過實(shí)驗(yàn)對傳統(tǒng)的LBP 人臉識(shí)別方法進(jìn)行驗(yàn)證,為了提升識(shí)別率,對圖像進(jìn)行三種預(yù)處理。結(jié)果表明經(jīng)過高斯平滑和Sobel 邊緣提取的LBP 算子對于不同光照條件下人臉圖像識(shí)別率提高幅度較大。分塊大小對LBP 算子性能也產(chǎn)生一定的影響,分塊越多,識(shí)別率相對提高,特征向量維數(shù)也越高,花費(fèi)的時(shí)間和存儲(chǔ)空間也隨之增大。
3.比較了各分類器的優(yōu)缺,針對SVM 分類器原理進(jìn)行研究,認(rèn)為SVM 比較適合解決人臉識(shí)別這類小樣本、非線性、高維并稀疏的模式識(shí)別問題,通過實(shí)驗(yàn)證明將SVM 與LBP 結(jié)合可以提高LBP 的識(shí)別率,SVM 與最近鄰分類器相比有更好的分類性能。
總結(jié)
以上是生活随笔為你收集整理的基于数据驱动的人脸识别课题研究的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Nginx系列二:(Nginx Rewr
- 下一篇: 亚马逊Rekognition发布针对人脸