matlab 野值剔除,一种基于多项式拟和的野值剔除方法与流程
本發(fā)明涉及一種基于多項(xiàng)式擬和的野值剔除方法,適用于通信、 導(dǎo)航等測(cè)控系統(tǒng)領(lǐng)域。
背景技術(shù):
在通信、導(dǎo)航等測(cè)量數(shù)據(jù)中往往包含了大量的嚴(yán)重偏離被測(cè)量真 值的數(shù)據(jù)點(diǎn),這些異常數(shù)據(jù)就稱(chēng)為野值。盡管野值數(shù)量較少,但對(duì)數(shù) 據(jù)的處理和分析會(huì)產(chǎn)生較大的影響,降低了數(shù)據(jù)的可靠性。雖然有些 濾波平滑方法能夠在一定程度上剔除野值,但是當(dāng)參數(shù)選擇不好的 話(huà),很可能使數(shù)據(jù)處理結(jié)果因?yàn)槭д嫣珖?yán)重而沒(méi)有說(shuō)服力,或者達(dá)不 到平滑的效果。因此,在數(shù)據(jù)的平滑處理之前,應(yīng)先將測(cè)量數(shù)據(jù)中的 野值點(diǎn)進(jìn)行有效的辨識(shí)和剔除。對(duì)試驗(yàn)數(shù)據(jù)中野值的識(shí)別剔除,有人 工和計(jì)算機(jī)自動(dòng)兩種方式。人工方式對(duì)有明顯錯(cuò)誤的異常值的判斷比 較成功,但是這種方式效率很低,標(biāo)準(zhǔn)難以掌握,特別是對(duì)數(shù)據(jù)量較 大時(shí)候,這種缺點(diǎn)尤為明顯。
技術(shù)實(shí)現(xiàn)要素:
為了克服上述現(xiàn)有技術(shù)的不足之處,本發(fā)明提供一種基于多項(xiàng)式 擬和的野值剔除方法,以多項(xiàng)式擬和為基礎(chǔ),發(fā)明計(jì)算機(jī)自動(dòng)去除測(cè) 量數(shù)據(jù)中的野值的方法,通過(guò)擬合估計(jì)值與觀測(cè)值的殘差序列識(shí)別及 剔除觀測(cè)數(shù)據(jù)序列中的野值,對(duì)實(shí)際工程應(yīng)用的重要的應(yīng)用價(jià)值。
為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:一種基于多項(xiàng)式擬 和的野值剔除方法,包括步驟:
1、對(duì)原測(cè)量數(shù)據(jù)進(jìn)行n階多項(xiàng)式擬和,得出系數(shù)矩陣和擬和多 項(xiàng)式,由已知的觀測(cè)數(shù)據(jù)i畫(huà)出粗略的散點(diǎn)圖,選取合適的次數(shù)n進(jìn) 行最小二乘多項(xiàng)式擬和,對(duì)給定的測(cè)量數(shù)據(jù)(xi,yi)構(gòu)造一個(gè)函數(shù)p(x) 作為給定數(shù)據(jù)(xi,yi)的近似表達(dá)式,使誤差ri=p(xi)-yi的平方和最小, 即其中i為0到m的整數(shù),
從幾何意義上尋求與給定點(diǎn)(xi,yi)的距離平方和為最小的曲線(xiàn) y=p(x),函數(shù)p(x)為擬合函數(shù)或最小二乘解,求擬合函數(shù)p(x)的方法 為曲線(xiàn)擬合的最小二乘法,當(dāng)擬合函數(shù)為多項(xiàng)式時(shí),即當(dāng) (n≦m)時(shí),為最小二乘擬合多項(xiàng)式,
為a0,a1,...,an的多元函數(shù),對(duì)I=I(a0,a1,...,an) 求極值,由多元函數(shù)求極值的必要條件, 即 即是關(guān)于a0,a1,...,an的線(xiàn)性方 程,用矩陣表示為
該式為對(duì)原測(cè)量數(shù)據(jù)進(jìn)行n階多項(xiàng)式擬和,得出系數(shù)矩陣 a0,a1,...,an,可得到擬和多項(xiàng)式求出對(duì)應(yīng)的擬合值序列 和對(duì)應(yīng)的殘差序列;
2、計(jì)算出相應(yīng)的擬合值序列為{pi:i=1,2,...,m}:生成擬合殘差序 列為{Δyi=pi-yi,i=1,2,...m};
3、計(jì)算擬合殘差序列的均方誤差σ,按如下公式進(jìn)行計(jì)算:
4、利用工程上常用的3σ準(zhǔn)則判斷并剔除野值,剔除野值后的 數(shù)據(jù)為yi':i=1,2,...,m
根據(jù)該公式進(jìn)行判定,若殘差值小于門(mén)限值,則該點(diǎn)為正常值, 此值不變;若殘差值大于或等于門(mén)限值時(shí),則判斷該點(diǎn)為野值,用該 點(diǎn)前六個(gè)點(diǎn)的均值代替該值;
5、判斷是否對(duì)所有數(shù)據(jù)都進(jìn)行了處理,若沒(méi)有處理完畢,則 對(duì)沒(méi)處理的數(shù)據(jù)重新進(jìn)行野值點(diǎn)判斷;
6、對(duì)全部數(shù)據(jù)進(jìn)行野值判斷后,輸出剔除野值后的數(shù)據(jù)。
在上述技術(shù)方案中,所述門(mén)限值3σ可根據(jù)實(shí)驗(yàn)具體情況作 出適當(dāng)?shù)男薷摹?/p>
本發(fā)明的有益效果是:本發(fā)明以多項(xiàng)式擬和為基礎(chǔ),通過(guò)擬合估 計(jì)值與觀測(cè)值的殘差序列識(shí)別及剔除觀測(cè)數(shù)據(jù)序列中的野值,對(duì)實(shí)際 工程應(yīng)用的重要的應(yīng)用價(jià)值;與現(xiàn)有方法相比,不依賴(lài)設(shè)計(jì)經(jīng)驗(yàn),因 此更方便;門(mén)限值3σ可根據(jù)實(shí)驗(yàn)具體情況做出適當(dāng)?shù)母?#xff0c;因此設(shè) 計(jì)出的參數(shù)更準(zhǔn)確,應(yīng)用范圍更廣;野值剔除后補(bǔ)值的方式保持了數(shù) 據(jù)的連續(xù)性,滿(mǎn)足數(shù)據(jù)處理選點(diǎn)的要求,實(shí)現(xiàn)了對(duì)數(shù)據(jù)源的初級(jí)濾波。
附圖說(shuō)明
圖1為本發(fā)明的步驟流程圖。
圖2為源測(cè)量數(shù)據(jù)的分布圖。
圖3為圖2進(jìn)行n階多項(xiàng)式后的擬和曲線(xiàn)圖。
圖4為殘差數(shù)列圖。
圖5為剔除野值后的數(shù)據(jù)圖。
具體實(shí)施方式
下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
如圖1所示一種基于多項(xiàng)式擬和的野值剔除方法,包括步驟:
步驟一:對(duì)原測(cè)量數(shù)據(jù)據(jù)進(jìn)行n階多項(xiàng)式擬合,得出系數(shù)矩陣和 擬和多項(xiàng)式;
由已知的觀測(cè)數(shù)據(jù)(i=0,1,…,m)畫(huà)出粗略的圖形——散點(diǎn) 圖,選取合適的次數(shù)n進(jìn)行最小二乘多項(xiàng)式擬合;
對(duì)給定的測(cè)量數(shù)據(jù)(xi,yi)(i=0,1,…,m),構(gòu)造一個(gè)函數(shù)p(x)作 為給定數(shù)據(jù)(xi,yi)的近似表達(dá)式,使誤差ri=p(xi)-yi(i=0,1,…,m)的 平方和最小,即
從幾何意義上尋求與給定點(diǎn)(xi,yi)(i=0,1,…,m)的距離平方和為最 小的曲線(xiàn)y=p(x)。函數(shù)p(x)稱(chēng)為擬合函數(shù)或最小二乘解,求擬合函數(shù) p(x)的方法稱(chēng)為曲線(xiàn)擬合的最小二乘法。當(dāng)擬合函數(shù)為多項(xiàng)式時(shí),即 當(dāng)時(shí),稱(chēng)為最小二乘擬合多項(xiàng)式。顯然
為a0,a1,...,an的多元函數(shù),因此上述問(wèn)題即為求I=I(a0,a1,...,an)的極值問(wèn) 題。由多元函數(shù)求極值的必要條件,得
即
式(4)是關(guān)于a0,a1,...,an的線(xiàn)性方程組,用矩陣表示為
公式(5)為對(duì)原測(cè)量數(shù)據(jù)據(jù)進(jìn)行n階多項(xiàng)式擬合,得出系數(shù)矩陣。 求出系數(shù)矩陣a0,a1,...,an,得到擬合多項(xiàng)式:
步驟二、求出對(duì)應(yīng)的擬合值序列和對(duì)應(yīng)的殘差序列;
計(jì)算出相應(yīng)的擬合值序列為{pi:i=1,2,...,m}:生成擬合殘差序列 為{Δyi=pi-yi,i=1,2,...m};
步驟三、計(jì)算均方誤差
計(jì)算擬合殘差序列的均方誤差σ按如下公式進(jìn)行計(jì)算:
步驟四、對(duì)野值點(diǎn)進(jìn)行判斷
利用工程上常用的3σ準(zhǔn)則判斷并剔除野值,剔除野值后的數(shù)據(jù) 為{yi':i=1,2,...,m}
根據(jù)公式(8)進(jìn)行判定,若殘差值小于門(mén)限值,為正常值,此值 不變;若大于或等于門(mén)限值,則判斷為野值。若該點(diǎn)是野值,則該點(diǎn) 用前6個(gè)點(diǎn)的均值代替,若該點(diǎn)不是野值,則該點(diǎn)的值不變。
步驟五:判斷是否對(duì)所有數(shù)據(jù)都進(jìn)行了處理,若沒(méi)有處理完畢,則對(duì) 沒(méi)處理的數(shù)據(jù)重新進(jìn)行野值點(diǎn)判斷;
步驟六:若已經(jīng)對(duì)所有數(shù)據(jù)都進(jìn)行了野值判斷,則輸出剔除野值 后的數(shù)據(jù)。整個(gè)流程結(jié)束。
在上述技術(shù)方案中,所述門(mén)限值3σ可根據(jù)實(shí)驗(yàn)具體情況作出適 當(dāng)?shù)男薷摹?/p>
在第步驟一中,對(duì)原測(cè)量數(shù)據(jù)據(jù)進(jìn)行n階多項(xiàng)式擬合,得出系數(shù) 矩陣和擬和多項(xiàng)式;步驟二中求出對(duì)應(yīng)的擬合值序列和對(duì)應(yīng)的殘差序 列;步驟三中計(jì)算均方誤差;步驟四中采用3σ準(zhǔn)則判斷并剔除野值; 步驟五中對(duì)測(cè)試數(shù)據(jù)進(jìn)行判斷,判斷是否對(duì)所有數(shù)據(jù)都進(jìn)行了處理, 若沒(méi)有處理完畢,則對(duì)沒(méi)處理的數(shù)據(jù)重新進(jìn)行野值點(diǎn)判斷;步驟六中 輸出剔除野值后的數(shù)據(jù),流程結(jié)束。該方法流程可以用于計(jì)算機(jī)自動(dòng) 判別。
以實(shí)際測(cè)量的海流速度大小數(shù)據(jù)為例,從中選取800個(gè)連續(xù)的數(shù) 據(jù)點(diǎn)進(jìn)行剔除野值處理。原測(cè)量數(shù)據(jù)如圖2所示,進(jìn)行n階多項(xiàng)式擬 和后擬和曲線(xiàn)如圖3所示,殘差序列如圖4所示,輸出剔除野值后的 數(shù)據(jù)如圖5所示。
本發(fā)明以多項(xiàng)式擬和為基礎(chǔ),通過(guò)擬合估計(jì)值與觀測(cè)值的殘差序 列識(shí)別及剔除觀測(cè)數(shù)據(jù)序列中的野值,對(duì)實(shí)際工程應(yīng)用的重要的應(yīng)用 價(jià)值;與現(xiàn)有方法相比,不依賴(lài)設(shè)計(jì)經(jīng)驗(yàn),因此更方便;門(mén)限值3σ 可根據(jù)實(shí)驗(yàn)具體情況做出適當(dāng)?shù)母?#xff0c;因此設(shè)計(jì)出的參數(shù)更準(zhǔn)確,應(yīng) 用范圍更廣;野值剔除后補(bǔ)值的方式保持了數(shù)據(jù)的連續(xù)性,滿(mǎn)足數(shù)據(jù) 處理選點(diǎn)的要求,實(shí)現(xiàn)了對(duì)數(shù)據(jù)源的初級(jí)濾波。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范 圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技 術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍 之內(nèi)。
總結(jié)
以上是生活随笔為你收集整理的matlab 野值剔除,一种基于多项式拟和的野值剔除方法与流程的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【谈谈】动态规划——求最长公共子序列
- 下一篇: 在matlab中怎么限定值域,matla