《数字图像处理(第三版)》 第一章 绪论 笔记
此內容為學習《數(shù)字圖像處理(第三版)》(岡薩雷斯著,阮秋琦、阮宇智等譯)時的筆記。
引言
數(shù)字圖像處理方法的重要性源于兩個主要應用領域:
1.1 什么是數(shù)字圖像處理
一幅圖像可以定義為一個二維函數(shù) f(x,y) (以后可能發(fā)展出三維圖像,但本書中指的是二維圖像)。(x,y)為平面坐標,幅值 f 稱為圖像在該點處的強度或灰度。當 x, y 和灰度值 f 是有限的離散數(shù)值時,稱該圖像為數(shù)字圖像。數(shù)字圖像是由有限數(shù)量的元素組成的,每個元素都有一個特定的位置和幅值。這些元素稱為圖畫元素、圖像元素或像素。
人類的感知僅限于電磁波譜的可見光波段;而成像機器幾乎可以覆蓋從伽馬射線到無線電波的整個電磁波譜范圍。因而,數(shù)字圖像處理涉及很寬泛的各種應用領域。
數(shù)字圖像處理與其他相似研究領域的區(qū)別:
從圖像處理到計算機視覺的這個連續(xù)統(tǒng)一體內并沒有明確的界限。但一種分類是在這個過程中考慮三種典型的計算處理,即低級、中級和高級處理。
本書中將數(shù)字圖像處理界定為其輸入和輸出都是圖像的處理,另外,包含從圖像中提取特征的處理,直至包括各個目標的識別。
1.2 數(shù)字圖像處理的起源
數(shù)字圖像的最早應用之一是在報紙業(yè)。早在20世紀20年代曾引入巴特蘭(Bartlane)電纜圖片傳輸系統(tǒng),把橫跨大西洋傳送一幅圖片所需的時間從一個多星期減少到了3小時。早期的巴特蘭系統(tǒng)可以使用5個不同的灰度級來編碼圖像。到1929年,這一能力已經(jīng)增大到了15級。
上述例子雖然涉及數(shù)字圖像,但并不認為它們就是我們定義的數(shù)字圖像處理,應為創(chuàng)建這種圖像時并未涉及計算。因此,數(shù)字圖像處理的歷史與數(shù)字計算機發(fā)展密切相關。事實上,數(shù)字圖像要求非常大的存儲和計算能力,因此數(shù)字圖像處理領域的發(fā)展必須依靠數(shù)字計算機及數(shù)據(jù)存儲、顯示和傳輸?shù)认嚓P支撐技術的發(fā)展。
第一臺功能強大到足以執(zhí)行有意義圖像處理任務的大型計算機出現(xiàn)在20世紀60年代初。我們今天稱之為數(shù)字圖像處理的誕生可追溯至這一時期這些機器的使用和空間項目的開發(fā)。
1.3 使用數(shù)字圖像處理領域的實例
在今天的應用中,最主要的圖像能源是電磁能譜,其他主要圖像能源包括聲波、超聲波和電子(以用于電子顯微鏡中的電子束形式)。用于建模和可視化的合成圖像由計算機產(chǎn)生。本節(jié)簡要討論如何生成各種類別的圖像及這些圖像適用的領域。
以電磁波譜輻射為基礎的圖像是我們最熟悉的,特別是X射線和可見光譜波段的圖像。
電磁波可定義為以各種波長傳播的正弦波,或視為無質量的粒子流,每個粒子以波的形式傳播并以光的速度運動。每個無質量的粒子包含一定的能量(或一束能量),每束能量稱為一個光子。
如果光譜波段根據(jù)光子能量進行分組,則可得到如下圖光譜,范圍從伽馬射線(最高能量)到無線電波(最低能量)。如圖所示,加底紋的條帶表明電磁波譜的各個波段之間并沒有明確的界線,而是由一個波段平滑地過渡到另一個波段。
1.3.1 伽馬射線成像
伽馬射線成像的主要用途包括核醫(yī)學(如正電子放射斷層PET)和天文觀測。
1.3.2 X射線成像
X射線是最早用于成像的電磁輻射源之一。最熟悉的X射線應用是醫(yī)學診斷(血管照相術、計算機軸向斷層CAT),同時,X射線還被廣泛用于工業(yè)和其他領域。
1.3.3 紫外波段成像
紫外“光”的應用包括平板印刷術、工業(yè)檢測、顯微方法、激光、生物成像和天文觀測等。
1.3.4 可見光及紅外波段成像
由于電磁波譜可見光波段在所有波段中是我們最熟悉的,所以這一波段的成像應用領域遠遠超過其他波段的成像應用領域。紅外波段常用于與可見光相結合成像。主要應用在光顯微方法、天文學、遙感、工業(yè)和法律實施等方面。
1.3.5 微波波段成像
微波波段成像的典型應用是雷達。成像雷達的獨特之處是在任何范圍和任何時間內,不考慮氣候、周圍光照條件都可收集數(shù)據(jù)的能力。某些雷達波可以穿透云層,在一定條件下還可以穿透植被、冰層和極干燥的沙漠。在許多情況下,雷達是探測地球表面不可接近地區(qū)的唯一方法。在雷達圖像中,能看到的只是反射到雷達天線的微波能量。
1.3.6 無線電波段成像
無線電波段成像主要應用于醫(yī)學和天文學。在醫(yī)學中,無線電波用于核磁共振成像(MRI)
1.3.7 使用其他成像方式
其他的成像方式還包括聲波成像、電子顯微方法和(由計算機產(chǎn)生的)合成成像。
聲波成像在地質勘探、工業(yè)和醫(yī)學中應用廣泛。超聲波成像常用于制造業(yè),但這一技術最為熟知的應用是在醫(yī)學領域,特別是婦產(chǎn)科。在婦產(chǎn)科,醫(yī)生對未出生的胎兒成像,以確定其發(fā)育的健康狀況。
1.4 數(shù)字圖像處理的基本步驟
把數(shù)字圖像處理劃分為之前定義的兩個類別:一類是其輸入和輸出都是圖像;另一類是其輸入可能是圖像但輸出是從這些圖像中提取的屬性。
圖像獲取:通常,圖像獲取階段包括圖像預處理,譬如圖像縮放。
圖像增強:是對一幅圖像進行某種操作,使其結果在特定應用中比原始圖像更適合進行處理,因為一開始增強技術就建立在面向問題的基礎之上。例如,對增強X射線圖像十分有用的方法,對增強電磁波譜中紅外波段獲取的衛(wèi)星圖像可能就不是最好的方法。不存在增強圖像的通用“理論”。
圖像復原:也是改進圖像外觀的一個處理領域。然而,與圖像增強不同,圖像增強是主觀的,而圖像復原是客觀的;在某種意義上說,復原技術傾向于以圖像退化的數(shù)學或概率模型為基礎。另一方面,增強以什么是好的增強效果這種主觀偏愛為基礎。
彩色圖像處理已成為一個重要的領域,因為互聯(lián)網(wǎng)上數(shù)字圖像的使用正在不斷增長。
小波:是以不同的分辨率來描述圖像的基礎。
壓縮:指的是減少圖像存儲量或降低傳輸圖像帶寬的處理。
形態(tài)學處理:涉及提取圖像成分的工具,這些成分在表示和描述形狀方面很有用。
分割:分割過程是將一幅圖像劃分為其組成部分或目標。通常,自動分割是數(shù)字圖像處理中最困難的任務之一。成功地把目標逐一識別出來是一個艱難的分割過程。另一方面,很弱且不穩(wěn)定的分割算法幾乎總是會導致最終失敗。通常,分割越準確,識別越成功。
表示和描述*:幾乎總是在分割階段的輸出之后。選擇一種表示僅是把原始數(shù)據(jù)轉換為適合計算機進行后續(xù)處理的形式的一部分。為了描述數(shù)據(jù)以使感興趣的特征更明顯,必須確定一種方法。描述又稱為特征選擇,它涉及提取特征,可得到某些感興趣的定量信息,或是區(qū)分一組目標或其他目標的基礎。
識別:使基于目標的描述給該目標賦予標志(譬如“車輛”)的過程。
1.5 圖像處理系統(tǒng)的組成
圖像傳感器(感知):需要兩個不見來獲取數(shù)字圖像。第一個部件是物理設備,該設備對我們希望成像的目標輻射的能量很敏感。第二個部件稱為數(shù)字化器,數(shù)字化器是一種把物理感知裝置的輸出轉換為數(shù)字形式的設備。
專用圖像處理硬件:通常由數(shù)字化器與執(zhí)行其他原始操作的硬件[如算術邏輯單元(ALU)]組成,算術邏輯單元對整個圖像并行執(zhí)行算術與邏輯運算。該單元執(zhí)行要求快速數(shù)據(jù)吞吐的功能(譬如以30幀/秒的速率來數(shù)字化和平均視頻圖像)。
計算機:指通用計算機。
圖像處理軟件:由執(zhí)行特定任務的專用模塊組成。
大容量存儲:大容量存儲能力在圖像處理應用中是必須的。圖像處理應用的數(shù)字存儲分為三個主要類別:
圖像顯示器:即顯示器。
硬拷貝:用于記錄圖像。硬拷貝設備包括激光打印機、膠片相機、熱敏裝置、噴墨裝置和數(shù)字單元,如CD-ROM等。
網(wǎng)絡:因為在圖像處理應用中會形成大量數(shù)據(jù),圖像傳輸中主要考慮的問題是帶寬,隨著光纖和其他寬帶技術的發(fā)展,網(wǎng)絡環(huán)境正在迅速得到改善。
總結
以上是生活随笔為你收集整理的《数字图像处理(第三版)》 第一章 绪论 笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于前端性能优化
- 下一篇: Qt下Undefined referen