ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略
ML之FE:數據處理—特征工程之稀疏特征的簡介、如何處理、案例應用之詳細攻略
?
?
目錄
稀疏特征的簡介
稀疏特征的如何處理
稀疏特征的案例應用
?
?
稀疏特征的簡介
? ? ? ?信號稀疏表示是過去近20年來信號處理界一個非常引人關注的研究領域,眾多研究論文和專題研討會表明了該領域的蓬勃發展。信號稀疏表示的目的就是在給定的超完備字典中用盡可能少的原子來表示信號,可以獲得信號更為簡潔的表示方式,從而使我們更容易地獲取信號中所蘊含的信息,更方便進一步對信號進行加工處理,如壓縮、編碼等 ? ?
? ? ? ?數學變換會追求所謂稀疏表示(sparse representation),即如何通過最小數量的系數盡可能更多的描述信號的能量。不同類型的信號,其在不同變換下系數的分布會不同。
? ? ? ?信號稀疏表示的目的就是在給定的超完備字典中用盡可能少的原子來表示信號,可以獲得信號更為簡潔的表示方式,從而使我們更容易地獲取信號中所蘊含的信息,更方便進一步對信號進行加工處理,如壓縮、編碼等。信號稀疏表示方向的研究熱點主要集中在稀疏分解算法、超完備原子字典、和稀疏表示的應用等方面。
1、稀疏表示在圖像處理領域的應用的幾個方面:
- 圖像去噪:傳統的去噪方法往往假設含噪圖像的有用信息處在低頻區域,而噪聲信息處在高頻區域,從而基于中值濾波、Wiener 濾波、小波變換等方法實現圖像去噪,而實際上這種假設并不總是成立的。基于圖像的稀疏表示,近幾年來研究者們提出了基于過完備字典稀疏表示的圖像去噪模型,其基本原理是將圖像的稀疏表示作為有用信息,將逼近殘差視為噪聲。利用 K-SVD 算法求得基于稀疏和冗余的訓練字典,同時針對 K-SVD 算法僅適合處理小規模數據的局限,通過定義全局最優來強制圖像局部塊的稀疏性。文獻提出了稀疏性正則化的圖像泊松去噪算法,該算法采用 log 的泊松似然函數作為保真項,用圖像在冗余字典下稀疏性約束作為正則項,從而取得更好的去噪效果。
- 人臉識別:近年來,稀疏表示廣泛應用于人臉識別,并取得了很好的識別效果。Wright 等人認為:①同類樣本處于同一個線性子空間,任一測試樣本均可以用來自于該類的訓練樣本進行線性表示;②用所有的訓練樣本構成字典,則測試樣本在該字典上的表示是稀疏的,同時該稀疏系數包含了樣本的類別信息。基于此,Wright 等提出了基于稀疏表示的人臉識別框架,即首先基于人臉庫構造過完備字典,然后計算待測圖像在該字典上的稀疏系數,再根據重構誤差判別圖像身份。該算法對特征選擇不敏感,有很強的抗噪聲能力,并且具有較好的遮擋處理功能,從而在人臉識別領域得到了廣泛關注。提出加權稀疏編碼算法,該方法在解決人臉遮擋、光照、表情等方面取得了較好的效果。為了解決小維度,小樣本的人臉識別問題,提出了基于稀疏表示和奇異值分解的人臉識別算法,實驗表明該方法在 ORL 人臉庫上取得了較好的效果。
- 目標跟蹤:近年來,稀疏表示在目標跟蹤領域也得到的廣泛應用。針對紅外圖像序列中目標與背景對比度低、灰度特征易受噪聲影響等問題,提出了一種基于稀疏表示模型的紅外目標跟蹤算法。提出了一個新的基于稀疏表示的目標跟蹤方法,通過L1 范數最小化求解,實驗結果表明,該方法比現有的基于 L1 范數最小化的跟蹤方法性能更穩定、計算效率更高。為了有效解決跟蹤過程中的目標遮擋問題,提出了一種基于局部稀疏表示模型的跟蹤方法。實驗結果表明,該方法比各種流行跟蹤方法穩定可靠且具有良好的抗遮擋性,并對海上紅外目標跟蹤取得良好效果。圖像修復隨著稀疏表示研究的深入,稀疏表示在圖像修復領域也得到了廣泛應用[35-37]。為了確保修復時填充洞和周圍之間的視覺合理性與一致性,Shen 等人提出直接在待處理圖像完整區域采樣,構造冗余字典,然后通過依次計算洞邊界不完整的塊的稀疏表示進行恢復。該算法在處理大洞和保留圖像細節方面具有較好的能力。針對現有圖像修復方法中待填充塊在全局搜索與之最匹配塊的計算復雜度高、結構連貫性和紋理清晰性不佳的缺點,文獻[36]提出了基于塊結構稀疏度的自適應圖像修復算法。針對圖像結構信息缺損較大的圖像,提出利用結構約束和樣本稀疏表示實現圖像修復,該方法既能較好的修復圖像邊緣結構,又能保持結構的整體平滑性。
- 壓縮感知:為了有效重構原信號,傳統方式下需要基于奈奎斯特采樣定理實現對信號的采樣。近年來,隨著稀疏表示的興起為重構原信號提出了一種新的理論-壓縮感知。壓縮感知理論突破了奈奎斯特采樣頻率的下限,它以信號的稀疏性(或可壓縮性)作為前提,將傳統方式下對信號的采樣和壓縮兩個過程融為一個過程,直接獲取稀疏信號,然后用一個與變換矩陣無關的觀測矩陣對變換系數向量進行變換,最后通過求解一個優化問題重構原信號。目前,國內外研究人員在該領域進行了深入研究,并提出了有效的壓縮感知理論與方法。
2、樹模型下的稀疏特征
?
稀疏特征的如何處理
1、統一的稀疏特征處理方案:將稀疏特征視為缺失值。
Algorithm 3: Sparsity-aware Split Finding 稀疏感知分割發現
?
?
?
?
稀疏特征的案例應用
1、在數據高度稀疏的Allstate-10K 數據集上稀疏算法比基本算法快近50倍。
?
?
?
?
?
總結
以上是生活随笔為你收集整理的ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成功解决 .Quit() File CO
- 下一篇: Dataset之HiggsBoson:H