图像处理 --- 一、认识图像处理
聲明: 本系列文檔由學習嗶站視頻總結(jié)而得,后續(xù)會逐漸添加相對應的示例代碼(python)
1. 什么是圖像與圖像處理
百聞不如一見。
圖像是客觀對象的一種相似性的、生動性的描述或?qū)懻?#xff0c;是人類社會活動中最常用的信息載體。 或者說圖像是客觀對象的一種表示,它包含了被描述對象的有關信息。 它是人們最主要的信息源。
1.1 什么是圖像
- 圖 ——> 物體透射或反射的分布,是客觀存在的;
- 像 ——> 人(的視覺系統(tǒng))對(接受在大腦中形成的)圖的印象或認識,是人的感覺。
- 圖像 ——> 是圖和像的有機結(jié)合,既反映物體的客觀存在,又體現(xiàn)人的心里因素;是客觀對象的一種可視表示,它包含了被描述對象的有關信息。
1.2 圖像的分類
根據(jù)圖像空間坐標和幅度(亮度或色彩)的連續(xù)性可分為模擬(連續(xù))圖像和數(shù)字圖像。
- 模擬圖像:空間坐標和幅度都連續(xù)變化的圖像
- 數(shù)字圖像:空間坐標和幅度均用離散的數(shù)字表示的圖像
1.3 圖像處理
圖像處理(image processing)就是對圖像信息進行加工處理和分析,以滿足:
- 人的視覺、心里需求
- 實際應用或某種目的(如機器識別)的需求
著重強調(diào)圖像之間進行的變換,廣義上泛指各種圖像技術,狹義上指隨圖像進行各種加工(處理),達到:
- 改善人的視覺效果,
- 為自動識別打基礎,
- 壓縮編碼
1.4 圖像處理的分類
- 模擬圖像處理(光學處理):光學透鏡處理、光學照相處理等。
- 優(yōu)點:實時性強、速度快、處理信息量大、分辨率高;
- 缺點:處理精度低,靈活度差,難有判斷功能。
- 數(shù)字圖像處理:利用計算機對數(shù)字圖像進行處理。
- 精度高、處理內(nèi)容豐富、方法易變、靈活度高
- 缺點處理速度較慢。
- 光電結(jié)合處理:用光學方法完成運算量巨大的處理(如頻譜變換等),用計算機對光學處理結(jié)果(如頻譜)進行分析判斷等處理。該方法是前兩種方法的有機結(jié)合,它集結(jié)了二者的優(yōu)點,光電結(jié)合處理是今后圖像處理的發(fā)展方向,也是一個值得關注的研究方向。
2. 數(shù)字圖像處理的方法和步驟
2.1 圖像的數(shù)學表示
一幅圖像所包含的信息首先表現(xiàn)為光的強度(intensity),即一幅圖像可看成是空間各個坐標點上的光強度 I 的集合,其普遍數(shù)學表達式為:
I = f(x,y,z,λ,t) # x,y,z 表示空間坐標,λ表示波長,t表示時間。式中:
- (x,y,z)表示空間坐標,
- λ 表示波長,
- t 表示時間,
- I (大寫) 是光點(x,y,z)的強度(幅度)。
靜止圖像,與時間 t 無關;
靜止圖像: I = f(x,y,z,λ)單色圖像(也成灰度圖像),波長 λ 為常數(shù);
單色圖像: I = f(x,y,z,t)平面圖像則與坐標 z 無關。
平面圖像: I = f(x,y,λ,t)而對于平面上的靜止灰度圖像,器數(shù)學表達式可簡化為:
I = f(x,y)運動圖像可用(靜止)的圖像序列來表示,彩色圖像可分解成三基色圖像,三維圖像可有二維重建。
因此主要針對平面上的靜止灰度圖像進行論述。
圖像的特點:
- 空間有限:人的視野有限,一幅圖像的大小業(yè)有限。
- 幅度(強度)有限:即對于所有的 x,y 都有 0 <= f(x,y) <= Bm ,其中 Bm 為有限值。
2.2 數(shù)字圖像處理的基本步驟
- 圖像信息的獲取:采用圖像掃描儀等獎圖像數(shù)字化
- 圖像信息的存儲:對獲取的數(shù)字圖像、處理過程中的圖像信息以及處理結(jié)果存儲在計算機等數(shù)字系統(tǒng)中。
- 圖像信息的處理:即數(shù)字圖像處理,它是指用數(shù)字計算機或數(shù)字系統(tǒng)對數(shù)字圖像進行各種處理。
- 圖像信息的傳輸:要解決的主要問題是傳輸信道和數(shù)據(jù)量的矛盾問題。
- 圖像信息的顯示:用可視的方法進行輸出和顯示。
2.3 數(shù)字圖像處理的內(nèi)容和方法
-
圖像數(shù)字化:將非數(shù)字形成的圖像信號通過數(shù)字化設備轉(zhuǎn)換成數(shù)字圖像,包括采樣和量化。
-
圖像變換:對圖像進行變換以便于在頻域?qū)D像進行有效的處理。
-
圖像增強:增強圖像中的有用信息,削弱干擾和噪聲,提高圖像的清晰度,突出圖像中所感興趣的部分。
-
圖像恢復(復原):對退化的圖像進行處理,使處理后的圖像盡可能地接近原始(清晰)圖像。
-
圖像壓縮編碼:對待處理圖像進行壓縮編碼以減少面熟信息的數(shù)據(jù)量(存儲空間的限制)。
- 靜止圖像:
- 圖像尺寸:480*640像素的彩色圖片
- 數(shù)據(jù)量:480 x 640 x 3 = 900K bytes
- 運動圖像:
- 8G容量:8G bytes
- 放映速度:36幀/秒
- 壓縮前約放映2502秒
- 結(jié)論:有限的存儲空間要求壓縮圖像。
- 靜止圖像:
-
圖像分隔:根據(jù)選定的特征將圖像劃分為若干個有意義的部分,這些選定的特征包括圖像的邊緣、區(qū)域等。
通過Prewitt梯度方法獲取圖像的輪邊緣
-
圖像的分析和描述:主要是對已經(jīng)分隔的或正在分隔的圖像各個部分的屬性及各部分之間的關系進行分析表述。
- 區(qū)域的幾何特征
- 邊界描述
- 區(qū)域描述
- 紋理描述
- 形態(tài)學描述
-
圖像的識別分類:根據(jù)從圖像中提取的各自目標物的特征,與目標國有的特征進行匹配、識別,以作出對各自目標物類屬的判別。
3. 數(shù)字圖像處理系統(tǒng)的組成
一個基本的數(shù)字圖像處理系統(tǒng)由圖像輸入、圖像存儲、圖像通信、圖像處理和分析五個模塊組成。如圖所示:
1) 數(shù)字圖像輸入模塊:也稱圖像采集或圖像數(shù)字化,是利用圖像采集設備(數(shù)碼相機、數(shù)碼攝像機等)來獲取數(shù)字圖像,或通過數(shù)字化設備(如圖像掃描儀)將要處理的連續(xù)圖像轉(zhuǎn)換成適合于計算機處理的數(shù)字圖像。
2)數(shù)字圖像存儲模塊:用于圖像處理和分析的數(shù)字圖像存儲器可分為三類,
-
處理和分析過程中使用的快速存儲器
-
在線或聯(lián)機存儲器
-
不經(jīng)常使用的數(shù)據(jù)庫(檔案庫)存儲器
如:計算機內(nèi)存、硬盤、軟盤、閃存盤、CD光盤等。
**3)數(shù)字圖像輸出模塊:**在圖像分析、識別和理解中,一般需要將處理前后的圖像顯示出來,或?qū)⑻幚斫Y(jié)果永久保存。
-
前者稱為軟拷貝或顯示,使用設備包括CRT顯示器、液晶顯示器和投影儀等;
-
后者稱為硬拷貝,使用設備包括照相機、激光拷貝和打印機等。
**4)數(shù)字圖像通信模塊:**對圖像數(shù)據(jù)進行傳輸和通信。用于圖像數(shù)據(jù)量很大,而能提供通信傳輸又有限,因此傳輸前必須對表示圖像的數(shù)據(jù)進行壓縮編碼,以減少圖像數(shù)據(jù)量。
**5)數(shù)字圖像處理與分析模塊(核心模塊):**包括處理算法、實現(xiàn)軟件和計算機。
4. 數(shù)字圖像的主要應用
- 宇宙探測中的應用:主要是星體圖片的獲取、傳送和處理;
- 通信方面的應用:圖像信息傳輸、電視電話、衛(wèi)星電話、數(shù)字電視等。主要是壓縮圖像數(shù)據(jù)和動態(tài)圖像(序列)傳送;
- 遙感方面的應用:(航空遙感衛(wèi)星遙感)地形、地質(zhì)、資源的勘測,自然災害檢測、預報和調(diào)查,環(huán)境檢測、調(diào)查等;
- 生物醫(yī)學方面的應用:細胞分析、染色體分類、放射圖像處理、血球分類、各種CT、核磁共振圖像分析、DNA顯示分析、顯微圖像處理、癌細胞識別、心臟活動的動態(tài)分析、超聲圖像成像、生物進化的圖像分析等等;
- 軍事公安方面的應用:軍事目標的偵查和探測、導彈制導、各種偵查圖像的判讀和識別,雷達、聲納圖像處理、指揮自動化系統(tǒng)等;
- 工業(yè)生產(chǎn)的應用:將CAD和CAM技術應用于磨具和零件優(yōu)化設計和制造、無損探傷、石油氣勘測、紡織物的圖案設計、流水線零件的自動檢測識別、郵件自動分揀和包裹的自動分揀識別等。
- 天氣預報:天氣云圖測繪、傳輸,氣象衛(wèi)星云圖的處理和識別等。
- 信息安全:信息隱藏與數(shù)字水印,指紋識別、虹膜識別和面部識別。
總結(jié)
以上是生活随笔為你收集整理的图像处理 --- 一、认识图像处理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 求解相机参数Camera Calibra
- 下一篇: MFC中单选按钮的特点总结