matlab --- 图像处理基础
MATLAB圖像處理
1. 數(shù)字圖像處理
參考
數(shù)字圖像處理(Digital Image Processing)又稱為計(jì)算機(jī)圖像處理,是一種將圖像信號數(shù)字化利用計(jì)算進(jìn)行處理的過程。隨著計(jì)算機(jī)科學(xué)、電子學(xué)和光學(xué)的發(fā)展,數(shù)字圖像處理已經(jīng)廣泛的應(yīng)用到諸多領(lǐng)域之中。本小節(jié)主要介紹圖像的概念、分類和數(shù)字圖像處理的產(chǎn)生以及數(shù)字圖像處理的研究的內(nèi)容。
1.1 什么是圖像
圖像: 是三維世界在二維平面的表示,具體來說就是光學(xué)器件對一個(gè)物體,一個(gè)人或是一個(gè)場景等的可視化表示。圖像中包含了它所表達(dá)的事物的大部分信息,據(jù)有關(guān)資料表示,人類所獲得的大部分信息來源于視覺系統(tǒng),也就是從圖像中獲得的。
1.2 圖像的分類
根據(jù)圖像的屬性不同,圖像分類方法也不同。從獲取方式上圖像分為拍攝類圖像和繪制類圖像;從顏色上圖像分為彩色圖像、灰度圖像和黑白圖像等;從圖像的內(nèi)容上圖像分為人物圖像,風(fēng)景圖像等;從功能上又分為流程圖、結(jié)構(gòu)圖、心電圖、電路圖、設(shè)計(jì)圖等。
在數(shù)字圖像處理領(lǐng)域,將圖像分為模擬圖像和數(shù)字圖像兩種,計(jì)算機(jī)處理的信號都是數(shù)字信號,所以在計(jì)算機(jī)上處理的圖像均為數(shù)字圖像。根據(jù)數(shù)字圖像在計(jì)算機(jī)中表示方法不同,分為二進(jìn)制圖像,索引圖像,灰度圖像,RGB圖像和多幀圖像;根據(jù)計(jì)算機(jī)中圖像文件格式不同,圖像又分為位圖和矢量圖??梢?圖像的屬性是多角度的,圖像的分類也是多維的。
1.3 數(shù)字圖像的產(chǎn)生
數(shù)字圖像的產(chǎn)生主要有兩種渠道,一種是通過數(shù)碼照相機(jī)這樣的設(shè)備直接拍攝得到數(shù)字圖像,還有一種是通過圖像采集卡、掃描儀等數(shù)字化設(shè)備,將模擬圖像變?yōu)閿?shù)字圖像。
模擬圖像轉(zhuǎn)換成數(shù)字圖像: 首先將圖像分割成8 * 8 個(gè)各自,用數(shù)字0表示全是黑色,用數(shù)字8表示全是白色.(1~7表示黑色的多少)
1.4 數(shù)字圖像處理的研究內(nèi)容
數(shù)字圖像處理的研究內(nèi)容主要有以下方向:
圖像增強(qiáng)
圖像復(fù)原
圖像的銳化處理及邊緣檢測
圖像分割: 將感興趣的區(qū)域分割出來,進(jìn)行研究
圖像編碼壓縮
2. 圖像的表示方法
圖像的表示方法是對圖像處理算法描述和利用計(jì)算機(jī)處理圖形的基礎(chǔ)。一個(gè)二維圖像,在計(jì)算機(jī)中通常為一個(gè)二維數(shù)組f(x, y), 或者是一個(gè)M * N 的二維矩陣,其中, M為圖像的行數(shù), N為圖像的列數(shù)。
2.1 二進(jìn)制圖像
二進(jìn)制圖像也稱為二值圖像,通常用一個(gè)二維數(shù)組來描述,1位表示一個(gè)像素,組成圖像的像素值非0即1,沒有中間值,通常0表示黑色,1表示白色。二進(jìn)制圖像一般用來描述文字或者圖形,其優(yōu)點(diǎn)是占用空間少,缺點(diǎn)是當(dāng)表示人物或風(fēng)景圖形時(shí)只能描述輪廓。
2.2 灰度圖像
灰度圖像也稱為單色圖像,通常也是由一個(gè)二維數(shù)組表示一副圖像,8位表示一個(gè)像素,0表示黑色,255表示白色,1~254表示不同的深淺灰色。通?;叶葓D像顯示了黑色與白色之間許多級的顏色深度,比人眼所能識別的顏色深度范圍要寬的多。
2.3 RGB圖像
RGB圖像也稱為真彩色,是一種彩色圖像的表示方法,利用3個(gè)大小相同的二維數(shù)組表示一個(gè)像素,3個(gè)數(shù)組分別代表R、G、B三個(gè)分量,R表示紅色,G表示綠色,B表示藍(lán)色,通過三種基本顏色可以合成任意顏色。每個(gè)像素中的每種顏色分量占8位,每一位由[0, 255]中的任意數(shù)值表示,那么一個(gè)像素由24位表示,允許的最大值為2^24(即1677216,通常記為16M)
2.4 索引圖像
索引圖像是一種把像素值直接作為RGB調(diào)色版下標(biāo)的圖像。在MATLAB中,索引圖像包含一個(gè)數(shù)據(jù)矩陣X和一個(gè)顏色映射(調(diào)色板)矩陣map。數(shù)據(jù)矩陣可以是8位無符號整型、16位無符號整型或雙精度類型的。
3. 圖像的數(shù)據(jù)結(jié)構(gòu)
數(shù)字圖像處理常用的數(shù)據(jù)結(jié)構(gòu)有矩陣,鏈表,拓?fù)浣Y(jié)構(gòu)和關(guān)系結(jié)構(gòu)。圖像的數(shù)據(jù)結(jié)構(gòu)用于目標(biāo)表示和描述。本節(jié)主要介紹矩陣、鏈表、拓?fù)浣Y(jié)構(gòu)和關(guān)系結(jié)構(gòu)描述圖像、圖像的邊界、區(qū)域和區(qū)域之間的關(guān)系。
3.1 矩陣
矩陣用于描述圖像,可以表示黑白圖像、灰度圖像和彩色圖像。矩陣中的一個(gè)元素表示圖像的一個(gè)像素。矩陣描述黑白圖像時(shí),矩陣中的元素取值只有0和1兩個(gè)值,因此黑白圖像又叫二值圖像或二進(jìn)制圖像。矩陣描述灰度圖像時(shí),矩陣中的元素由一個(gè)量化的灰度級描述,灰度級通常為8位,即0~255之間的整數(shù),其中0表示黑色,255表示白色。
3.2 RGB彩色圖像
RGB彩色圖像是由三原色紅、綠、藍(lán)組成的,RGB圖像的每個(gè)像素都是由不同灰度級的紅、綠、藍(lán)描述的,每種單色的灰度描述同灰度圖像的描述方式相同。
鏈碼用于描述目標(biāo)圖像的邊界,通過規(guī)定鏈的起始坐標(biāo)和鏈起始點(diǎn)坐標(biāo)的斜率用一小段線段來表示圖像中的曲線。鏈碼按照標(biāo)準(zhǔn)方向的斜率分為4向鏈碼或8向鏈碼。
3.3 拓?fù)浣Y(jié)構(gòu)
拓?fù)浣Y(jié)構(gòu)**用于描述圖像的基本結(jié)構(gòu),通常在于形態(tài)的圖像處理或是二值圖像中,用于描述目標(biāo)事件發(fā)生的次數(shù),在一個(gè)目標(biāo)事件中有多少孔洞,有多少聯(lián)通區(qū)域等。在圖像中定義相鄰的概念,一個(gè)像素與它周圍的像素組成一個(gè)鄰域
在圖像中,目標(biāo)事件上的兩個(gè)像素點(diǎn)如果可以用一個(gè)像素序列聯(lián)通。連接像素p和q的都是4-鄰域像素點(diǎn),則p和q稱為4-連通,連接p和q的都是8鄰域像素點(diǎn),則p和q稱為8-連通。如果一個(gè)像素集合中的所有像素點(diǎn)都是4連通,則這個(gè)集合稱為4-組元,如果一個(gè)像素集合的所有像素都是8連通,則這個(gè)集合稱為8-組元。
3.4關(guān)系結(jié)構(gòu)
關(guān)系結(jié)構(gòu)用于描述一組目標(biāo)物體之間的相互關(guān)系,常用的描述方法為傳描述和樹描述。串描述是一種一維結(jié)構(gòu),當(dāng)用串描述圖像時(shí),需要建立一種合適的映射關(guān)系,將二維圖像降為一維形式。串描述適用于那些圖像元素的鏈表的連接可以用來從頭到尾或用其他連續(xù)形式的圖像元素的描述。鏈碼表示就是基于串描述思想描述的。
樹描述:是一種能夠?qū)Σ贿B接區(qū)域進(jìn)行很好描述的方法。樹是一個(gè)或一個(gè)以上節(jié)點(diǎn)的有限集合
4. 計(jì)算機(jī)中圖像文件格式
數(shù)字圖像在計(jì)算機(jī)中存儲(chǔ)的格式有多種多樣,每一個(gè)文件格式都包括一個(gè)頭文件和一個(gè)數(shù)據(jù)文件。頭文件的內(nèi)容由制作圖像的公司規(guī)定,一般包括文件類型、制作時(shí)間,文件大小制作人及版本號等信息。文件制作時(shí)還涉及到圖像的壓縮和存儲(chǔ)效率等。
4.1 BMP文件格式
BMP文件格式是Windows系統(tǒng)中的一種標(biāo)準(zhǔn)圖像文件格式,支持RGB、索引顏色、灰度和位圖顏色模式。BMP文件一共有兩種類型,設(shè)備相關(guān)位圖(DDB)和設(shè)備無關(guān)位圖(DIB)。Windows3.0及以前的BMP文件格式與顯示設(shè)備有關(guān),因此把這種BMP文件格式稱為設(shè)備相關(guān)位圖DDB(device-dependent bitmap)文件格式。Windows3.0 以后的BMP文件與顯示設(shè)備無關(guān),因此把這種BMP圖像文件格式稱為與位圖無關(guān)DIB(device-independent bitmap)格式。BMP文件默認(rèn)的文件擴(kuò)展名是.BMP或.bmp。
4.2 GIF文件格式
- GIF文件格式是CompuServe公司在1987年開發(fā)的圖像文件格式,任何商業(yè)目的使用均須由CompuServe公司授權(quán)。
- GIF文件主要是為數(shù)據(jù)流設(shè)計(jì)一種傳輸格式,不作為文件的存儲(chǔ)格式,它具有順序的結(jié)構(gòu)形式。GIF文件主要由5部分組成:
- 文件標(biāo)志塊: 標(biāo)識"GIF"和版本號;
- 邏輯屏幕描述塊: 定義圖像顯示區(qū)域的參數(shù),包含背景顏色信息、顯示區(qū)域大小、縱橫尺寸、顏色深淺以及是否存在全局彩色表;
- 全局彩色表: 其大小由圖像使用的顏色決定;
- 圖像數(shù)據(jù)塊: 包含圖像的描述塊,局部彩色表,壓縮圖像數(shù)據(jù),圖像控制塊,無格式文本擴(kuò)展塊,注釋擴(kuò)展塊,應(yīng)用程序擴(kuò)展塊,此部分可以缺省;
- 尾塊: 為三維16進(jìn)制數(shù),表示數(shù)據(jù)流以及結(jié)束,此部分可以缺省。
總結(jié)
以上是生活随笔為你收集整理的matlab --- 图像处理基础的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C# 静态类
- 下一篇: matlab画图函数基本使用(适合新手)