日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Histogram of Oriented Gridients(HOG) 方向梯度直方图

發布時間:2025/7/25 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Histogram of Oriented Gridients(HOG) 方向梯度直方图 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

from:

Histogram of Oriented Gridients(HOG) 方向梯度直方圖


Histogram of Oriented Gridients,縮寫為HOG,是目前計算機視覺、模式識別領域很常用的一種描述圖像局部紋理的特征。這個特征名字起的也很直白,就是說先計算圖片某一區域中不同方向上梯度的值,然后進行累積,得到直方圖,這個直方圖呢,就可以代表這塊區域了,也就是作為特征,可以輸入到分類器里面了。那么,接下來介紹一下HOG的具體原理和計算方法,以及一些引申。

?

1.分割圖像

因為HOG是一個局部特征,因此如果你對一大幅圖片直接提取特征,是得不到好的效果的。原理很簡單。從信息論角度講,例如一幅640*480的圖像,大概有30萬個像素點,也就是說原始數據有30萬維特征,如果直接做HOG的話,就算按照360度,分成360個bin,也沒有表示這么大一幅圖像的能力。從特征工程的角度看,一般來說,只有圖像區域比較小的情況,基于統計原理的直方圖對于該區域才有表達能力,如果圖像區域比較大,那么兩個完全不同的圖像的HOG特征,也可能很相似。但是如果區域較小,這種可能性就很小。最后,把圖像分割成很多區塊,然后對每個區塊計算HOG特征,這也包含了幾何(位置)特性。例如,正面的人臉,左上部分的圖像區塊提取的HOG特征一般是和眼睛的HOG特征符合的。

接下來說HOG的圖像分割策略,一般來說有overlap和non-overlap兩種,如下圖所示。overlap指的是分割出的區塊(patch)互相交疊,有重合的區域。non-overlap指的是區塊不交疊,沒有重合的區域。這兩種策略各有各的好處。

先說overlap,這種分割方式可以防止對一些物體的切割,還是以眼睛為例,如果分割的時候正好把眼睛從中間切割并且分到了兩個patch中,提取完HOG特征之后,這會影響接下來的分類效果,但是如果兩個patch之間overlap,那么至少在一個patch會有完整的眼睛。overlap的缺點是計算量大,因為重疊區域的像素需要重復計算。

再說non-overlap,缺點就是上面提到的,有時會將一個連續的物體切割開,得到不太“好”的HOG特征,優點是計算量小,尤其是與Pyramid(金字塔)結合時,這個優點更為明顯。

2.計算每個區塊的方向梯度直方圖

將圖像分割后,接下來就要計算每個patch的方向梯度直方圖。步驟如下:

A.利用任意一種梯度算子,例如:sobel,laplacian等,對該patch進行卷積,計算得到每個像素點處的梯度方向和幅值。具體公式如下:

?

其中,Ix和Iy代表水平和垂直方向上的梯度值,M(x,y)代表梯度的幅度值,θ(x,y)代表梯度的方向。

?

B.將360度(2*PI)根據需要分割成若干個bin,例如:分割成12個bin,每個bin包含30度,整個直方圖包含12維,即12個bin。然后根據每個像素點的梯度方向,利用雙線性內插法將其幅值累加到直方圖中。

?

C.(可選)將圖像分割成更大的Block,并利用該Block對其中的每個小patch進行顏色、亮度的歸一化,這一步主要是用來去掉光照、陰影等影響的,對于光照影響不劇烈的圖像,例如很小區域內的字母,數字圖像,可以不做這一步。而且論文中也提及了,這一步的對于最終分類準確率的影響也不大。

3.組成特征

將從每個patch中提取出的“小”HOG特征首尾相連,組合成一個大的一維向量,這就是最終的圖像特征。可以將這個特征送到分類器中訓練了。例如:有4*4=16個patch,每個patch提取12維的小HOG,那么最終特征的長度就是:16*12=192維。

4.一些引申

?與pyramid相結合,即PHOG。PHOG指的是,對同一幅圖像進行不同尺度的分割,然后計算每個尺度中patch的小HOG,最后將他們連接成一個很長的一維向量,作為特征。例如:對一幅512*512的圖像先做3*3的分割,再做6*6的分割,最后做12*12的分割。接下來對分割出的patch計算小HOG,假設為12個bin即12維。那么就有9*12+36*12+144*12=2268維。需要注意的是,在將這些不同尺度上獲得的小HOG連接起來時,必須先對其做歸一化,因為3*3尺度中的HOG任意一維的數值很可能比12*12尺度中任意一維的數值大很多,這是因為patch的大小不同造成的。PHOG相對于傳統HOG的優點,是可以檢測到不同尺度的特征,表達能力更強。缺點是數據量和計算量都比HOG大了不少。

參考文獻:

Navneet Dalal and Bill Triggs,《Histograms of Oriented Gradients for Human Detection》,2005

A. Bosch, A. Zisserman, and X. Munoz, 《Representing shape with a spatial pyramid kernel》,2007

總結

以上是生活随笔為你收集整理的Histogram of Oriented Gridients(HOG) 方向梯度直方图的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。