八邻域轮廓跟踪算法_结合mRMR选择和IFCM聚类的遥感影像分类算法
?隨著遙感成像技術的發展,高分遙感影像空間分辨率逐年提高,已經成為獲取地物信息的主要數據來源之一。高分影像分類作為遙感影像處理的重要任務之一,在地理國情普查與監測、數字城市建設、城市規劃等領域具有廣闊的應用前景。高分影像具有紋理信息豐富、形狀特征明顯、光譜混疊現象普遍存在的特點,單純利用光譜特征的分類方法難以滿足分類要求,多特征綜合提取利用并結合高性能分類器的分類方法已經成為目前高分影像分類的主流趨勢。但由于影像特征維數過高,容易造成冗余現象,加大了分類難度。
?為解決特征冗余問題,文獻[2]提出采用傅里葉譜分解算法提取紋理特征,并將光譜特征與紋理特征的分類規則相結合,來提高影像分類精度。文獻[3]提出一種綜合不同層次特征的MRF觀測場模型,并針對高分影像的特點提出一種描述地物目標結構特性的特征,用于對MRF分類結果中易混淆類別進行序貫分類。文獻[4]提出基于直方圖的APs(HAPs),用于支持向量機的遙感圖像分類,提出的HAP提供了關于標準AP場景空間信息的更完整和詳細的表征,能夠有效地表示紋理信息,HAP利用高維特征向量作為輸入給具有HI內核的SVM分類器,可以有效避免直方圖特征的休斯現象。文獻[5]提出一種新的Fisher鑒別字典對學習(FDDPL)模型進行圖像分類,將合成字典、編碼系數和分析字典的判別嵌入到提出的字典對學習中,通過分析編碼系數,不同分析詞典之間的相關性及綜合詞典表示法,獲得了較好的分類結果。文獻[6]在核函數集成SVM分類框架下,提出一種多尺度光譜—空間—語義特征融合的高分影像分類方法,以有效解決特征冗余及同譜異物問題,提高地物提取精度。文獻[7]提出基于多尺度多特征融合的高分影像分類方法,利用各地物特征的顯著性差異實現多尺度下多特征的加權融合,得出了較好的分類效果,但各最優尺度下特征間相關性較高,冗余現象明顯。
?本文在上述研究的基礎上,提出一種基于mRMR選擇與IFCM(improved fuzzy c-means)聚類的影像分類算法。首先采用對象置信度指標(OC)進行影像分割,然后利用mRMR算法對分割影像進行特征選擇,以減少特征冗余,最后使用IFCM算法進行特征距離計算,實現影像分類。
1 影像分割
?為改善影像分割過程中的過分割及欠分割問題,本文采用文獻[8]的分割方法,通過構建一個新的對象置信度(OC)索引度量任意區域與地理對象之間匹配程度的面向對象多尺度分割算法。該算法主要包括兩個步驟:首先,通過對影像進行過分割構建初始種子區域集合及確定尺度參數集合; 隨后,通過跟蹤OC的尺度間變化來引導多尺度區域合并過程,使區域合并結果逐漸逼近實際的地理對象。
2 mRMR特征選擇
?為解決文獻[7]利用不同特征之間的鄰接關系,只考慮各特征之間相關性,造成特征冗余度大、計算復雜度高的問題,本文在此引入mRMR特征選擇算法。
?mRMR算法利用互信息衡量不同特征的相關性和冗余度,并根據信息差和信息熵這兩個代價函數來尋找特征子集,使得選出的特征與目標類別之間具有最大相關性,且互相之間具有最小冗余度,可以很好地實現特征選擇[9]。mRMR的最大相關和最小冗余分別定義如下
(1)
式中,Sm為已選的特征集合;m為特征個數;c為目標類別;H(fi|c)為特征fi在目標類別下的信息熵;H(fi)為特征fi的信息熵;I(fi;?fj)為特征fi與fj之間的互信息。
?因此,假定已確定特征集Sm,下一步從{S-Sm}中選擇第m+1個特征。公式如下
(2)
?假設訓練數據集為D,全部特征集為S,則mRMR算法的執行過程為:
?(1) 進行初始化操作,S= {f1,?f2, …,?fn},?Sm=?。
?(2) 對于任意兩個輸入S的特征fi和fj,計算I(fi;?fj)和I(fi;?c)。
?(3) 根據式(2)選出特征fl,則Sm=Sm∪{fl},?S=S/fl;然后,回到步驟(2)繼續執行,直至選出最優特征子集。
?其中,像斑多特征提取見表 1。
表 1 ??像斑多特征提取
| 光譜特征 | 紋理特征 | 形狀特征 |
| 均值、標準差、波段比、亮度、NDVI等 | 標準差、平均值、差異度、對比度、信息熵、同質性等 | 形狀指數(OCI)、面積、長寬比、長度、寬度等 |
3 IFCM影像分類過程3.1 顯著特征差異性融合的FCM分類算法
?文獻[7]利用各地物顯著特征的不同,實現顯著特征差異性融合的圖像分類。具體步驟如下:
?(1) 將矢量化的特征進行人工魚群算法運算,尋找顯著性特征,即為聚類中心,S?={s1,?s2, …,?sn}。
?(2) 計算各特征矢量到聚類中心S?={s1,?s2, …,?sn}的距離D={d1,?d2, …,dn}, 并求取距離的倒數,歸一化表示為各矢量特征對應的權重εi,達到特征差異性融合的目的。
?(3) 對特征加權融合所生成的向量空間進行模糊c均值聚類(FCM)。
3.2 文獻[7]中FCM聚類策略
?(1) 參數初始化。設定聚類數目c, 算法終止循環閾值δ, 最大迭代次數n及初始聚類中心V?= {v1,?v2, …,?vn}和模糊隸屬度矩陣U。
?(2) 輸入待訓練特征向量X?= {x1,?x2, …,?xn},及模糊c均值聚類算法目標函數
(3)
?(3) 使用當前系數迭代更新隸屬度,獲得新的隸屬度再迭代更新各系數。在約束條件下,目標函數可轉化為
(4)
?(4) 使用目標函數進行迭代,直到滿足終止循環的閾值或達到最大迭代次數,則停止聚類并輸出最終分類結果。
3.3 IFCM聚類算法
?由于上述分類算法只考慮特征間的相關性,易導致算法對噪聲敏感,穩定性差。本文在原始算法目標函數計算的基礎上,考慮封裝在本地窗口中局部信息的同時引入空間吸引力模型,抑制噪聲的同時使算法更具穩健性,提出如下目標函數計算方法
(5)
(6)
?式(6)代表特征xi與聚類中心的距離測度。s(i)表示xi所處區域內部標準差,A(i)表示xi所在區域的面積,二者會隨聚類中心和隸屬度的更新進行相應的更新。s(i)越大,A(i)越小,其內部同質度大、合并其他對象的可能性就越低;Ia表示xi與聚類中心vk的相關性,Ia越大,對象點和聚類中心之間相關性越低,則聚類合并的可能性就越小。Ρ代表對象內部同質度所占權重,可通過權重值來調整對象內部同質度和對象間相關性的比重。
(7)
?式(7)代表xi鄰域向量到聚類中心的距離。在此,本文引入像素空間吸引力模型,吸引力模型能有效表征像素之間的空間相關性。兩個像素之間的空間吸引力SAir(k)可以被描述為SAir(k)=?,表示xi和它的鄰域xj分別對第k個簇的吸引力與它們的模糊隸屬度uki和ukj成正比,并與兩個像素空間距離的平方成反比。NR表示鄰域像素的基數,為了自適應計算鄰域像素的隸屬度,引入參數α,,dir表示xi與xj的空間距離。由此,再進行目標函數在約束條件下的計算,求取分類結果。本文具體算法如下:
?輸入:待分類影像數據Y,訓練數據占比ε,對象置信度指標OC,尺度參數ML,已選特征集Sm,聚類數目c,算法終止循環的閾值δ,最大迭代次數n。
?輸出:聚類劃分Yi,i=1, 2, …,k。
?步驟1??采用對象置信度OC指引的圖像分割方法分割圖像。
?步驟2??假設訓練數據集為D,全部特征集為S,利用mRMR算法選出最優特征子集,避免特征冗余。
?步驟3??人工魚群算法尋找顯著性特征S?= {s1,?s2, …,sn},求取距離D?= {d1,?d2, …,dn}的倒數歸一化為權重εi, 實現特征的差異性融合。
?步驟4??輸入待訓練特征向量X?={x1,?x2, …,?xn},改進模糊c均值聚類算法在約束條件下目標函數J的轉化公式,進行IFCM聚類。
?步驟5??判斷是否滿足終止循環閾值或達到最大迭代次數,不滿足則轉步驟4,滿足則輸出最終分類結果。
4 試驗結果與分析
?試驗選取重慶市某地區WorldView-2影像為研究對象,影像大小為687×452像素,拍攝時間為2016年8月,主要含有R、G、B、NIR 4個波段和4個附加波段,空間分辨率為0.5 m。人工選取分割影像中的30%為訓練樣本,其余70%為測試樣本。
?在特征提取與選擇過程中,提取影像光譜特征(各波段光譜均值(8維)、波段比(8維)、標準差(8維)、亮度),紋理特征(標準差(8維)、平均值(8維)、差異度(8維)、對比度(8維)、信息熵(8維)、同質性(8維)),形狀特征(面積、長度、寬度、矩形度、長寬比、形狀指數、緊致度)等共計80維特征,經mRMR算法選擇出具有最大相關最小冗余的16維特征構成特征向量并進行歸一化處理。其中,參數c=4,?m=2,?ε=1×10-5,?NR=8。
?為驗證所提方法的有效性,本文設計了不同的方法進行對比,包括:文獻[2]分類方法、文獻[3]分類方法、文獻[4]分類方法、文獻[5]分類方法、文獻[6]分類方法、本文方法。各方法分類結果如圖 1、表 2所示。
| 圖 1 ??不同方法試驗結果(一) |
表 2 ??本文方法分類地物統計表(混淆矩陣)
| 本文方法 | 人工解譯 | |||||||
| 植被 | 陰影 | 水體 | 裸地 | 道路 | 建筑物 | 行總和 | 生產者精度/(%) | |
| 植被 | 304 | 5 | 2 | 4 | 0 | 3 | 318 | 94.41 |
| 陰影 | 8 | 61 | 7 | 0 | 3 | 0 | 79 | 85.92 |
| 水體 | 5 | 3 | 46 | 0 | 0 | 0 | 54 | 85.19 |
| 裸地 | 6 | 2 | 0 | 229 | 4 | 0 | 242 | 94.24 |
| 道路 | 0 | 0 | 0 | 6 | 111 | 3 | 120 | 90.98 |
| 建筑物 | 0 | 0 | 0 | 4 | 4 | 182 | 190 | 96.81 |
| 列總和 | 323 | 71 | 55 | 243 | 122 | 188 | — | — |
| 用戶精度/(%) | 95.59 | 77.22 | 85.20 | 94.63 | 92.50 | 95.79 | — | — |
?本文從主觀評價和客觀評價兩方面對各種分類算法影像分類效果進行了比較和分析。
?(1) 主觀評價(圖 1中均已用方框標出):從目視效果上看,依照前4個文獻的分類方法均出現道路與裸地混淆現象。另外,圖 1(b)中,大量植被和建筑物錯分,少量陰影被錯分為植被,少量水體被錯分為陰影,少量植被被錯分為道路;圖 1(c)中的分類方法,水體被錯分為陰影,陰影與植被等少量混淆,少量植被被錯分為道路;圖 1(d)中的分類方法,少量道路及陰影被錯分為植被,少量建筑物被錯分為道路;圖 1(e)中,大量道路被錯分為裸地與植被,少量陰影被錯分為水體;圖 1(f)分類結果中,少量建筑物及陰影被錯分為植被。而本文方法大部分地物實現了準確劃分,避免了地物混淆現象,總體分類精度較高。
?(2) 客觀評價:本文采用基于像素的評價方法進行定量分析。
?在原始影像中隨機選取1000個樣本點,將樣本點映射到分類結果中,通過人工解譯構造混淆矩陣,依據混淆矩陣計算生產者精度(PA)、用戶精度(UA)、Kappa系數等來比較分析。樣本分布如圖 2所示。分別對上文所述分類方法中,地物分類的正確樣本數和錯誤樣本數進行統計,取10次統計的平均數作為最終數據,統計結果見表 3。
| 圖 2 ??樣本分布 |
表 3 ??測試樣本點數目統計
| 地物類型 | 樣本數量/個 |
| 植被 | 322 |
| 陰影 | 71 |
| 水體 | 54 |
| 裸地 | 243 |
| 道路 | 122 |
| 建筑物 | 188 |
| 總計 | 1000 |
?利用混淆矩陣(表 2)、OA和Kappa系數客觀評估不同方法的優劣,計算結果見表 4。本文算法總體分類精度達到93.29%,Kappa系數為0.914 3。相比文獻[5]和文獻[6],總體分類精度分別提高3.24%和2.05%,Kappa系數分別提高0.041 7和0.026 4。
表 4 ??試驗一分類方法綜合評價結果
| 分類方法 | 評價方法 | |
| 總體分類精度/(%) | Kappa系數 | |
| 文獻[2] | 84.00 | 0.797 4 |
| 文獻[3] | 86.60 | 0.826 8 |
| 文獻[4] | 88.54 | 0.852 6 |
| 文獻[5] | 90.05 | 0.872 6 |
| 文獻[6] | 91.24 | 0.887 9 |
| 本文方法 | 93.29 | 0.914 3 |
?從表 4中數據得出:基于mRMR選擇與IFCM聚類算法分類效果要優于其他算法的試驗結果,其分類精度高于以往其他算法,分類結果中混淆地物較少,實現了大多數地物的準確劃分。基于對象置信度OC指標的分割,改善了傳統分割方法中的過分割與欠分割問題;mRMR特征選擇算法可以很好地避免特征冗余帶來的存儲空間大、計算復雜度高的問題;IFCM聚類算法比傳統FCM算法穩健性更好,獲取的分類結果精度更高。
?為了進一步驗證本文算法的合理性和正確性,另選用重慶某城鄉地物較簡單區域的航天遙感影像作分類試驗,影像大小為696×760像素。試驗結果如圖 3所示。
| 圖 3 ??不同方法試驗結果(二) |
圖選項 |
?由圖 3目視效果上看,文獻[2]分類結果中出現少量植被與道路混淆現象,且有部分陰影被錯分為植被;文獻[3]分類結果中出現植被與裸地混淆現象,及少量的植被被錯分為建筑物,少量建筑物被錯分為道路,這是由于道路和建筑物光譜相似所致;文獻[4]分類結果中少量植被被錯分為裸地,少量建筑物被錯分為道路;文獻[5]分類中只有少量道路被錯分為植被和陰影;文獻[6]分類結果中出現少量道路與植被混淆現象,建筑物與道路錯分現象;而本文算法大部分地物實現了準確劃分,只有少量樣本(道路與建筑物)出現了錯誤劃分,對比其他分類算法,在地物提取精度方面有大幅度提高。
?本試驗定量評價結果見表 5,其總體精度和Kappa系數的計算方法同上。
表 5 ??試驗二分類方法綜合評價結果
| 分類方法 | 評價方法 | |
| 總體分類精度/(%) | Kappa系數 | |
| 文獻[2] | 85.60 | 0.819 5 |
| 文獻[3] | 87.20 | 0.843 6 |
| 文獻[4] | 88.72 | 0.857 6 |
| 文獻[5] | 90.43 | 0.873 9 |
| 文獻[6] | 92.91 | 0.895 6 |
| 本文方法 | 94.33 | 0.922 0 |
?從分類效果圖和表 5的定量分析可得:本文方法比試驗中文獻[4]、文獻[5]和文獻[6]分類方法的精度分別提高了5.16%、4.10%和1.42%,Kappa系數分別提高了0.064 4、0.048 1和0.026 4。
?由以上兩組不同地區影像分類試驗可知,本文算法分類精度最好,能實現大部分地物的準確劃分。本文在對象置信度指標(OC)的基礎上分割圖像并利用mRMR特征選擇方法減少冗余,降低計算復雜度;IFCM聚類算法增強了穩健性,且對噪聲不敏感,易于在大規模問題中應用。
5 ?結 ?語
?本文提出了一種基于mRMR選擇與IFCM聚類的遙感影像分類算法。首先基于OC指標進行影像分割試驗,在分割良好的基礎上采用mRMR算法進行特征選擇以減少冗余,并利用IFCM算法進行特征聚類以達到地物分類的目的。對比不同試驗結果,本文方法分類精度最高,實現了地物的準確劃分。
黃磊, 向澤君, 楚恒. 結合mRMR選擇和IFCM聚類的遙感影像分類算法[J]. 測繪通報,2019(4):32-37.?
DOI:?10.13474/j.cnki.11-2246.2019.0108
作者簡介:?黃磊,女,碩士生,研究方向為遙感影像融合與分類。E-mail:1377825510@qq.com
———————& ? ?End ? ?&————————
微信投稿郵箱:lyg0061@163.com
歡迎加入《測繪通報》作者QQ群:??435838860
進群請備注:姓名+單位
總結
以上是生活随笔為你收集整理的八邻域轮廓跟踪算法_结合mRMR选择和IFCM聚类的遥感影像分类算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python做一个考试系统_Python
- 下一篇: php修改js内容,js怎样修改html