图像处理与图像识别笔记(一)
本系列是研一課程《圖像處理與圖像識別》的隨堂筆記,主要內容是數字圖像處理方面,根據老師的講課內容與自己的理解所書寫,還會有一些具體實現的代碼,基于Python,歡迎交流。本篇主要介紹圖像處理與圖像識別的基礎知識。
一、圖像處理(ImageProcessing)
圖像處理是對圖像信息進行加工處理,以滿足人的視覺心理和實際應用的要求。
圖像處理是以人作為最終的信息接收者,主要目的是改善圖像的質量。
圖像處理是計算機視覺的基礎。
二、圖像識別(ImageRecognition)
圖像識別是以機器為對象,目的是使機器或計算機能自動地識別目標,屬于計算機視覺范疇內。
圖像分割是數字圖像處理中的關鍵技術之一,指的是將圖像中的有意義的特征部分提取出來,包括圖像中物體的邊緣、區域等。圖像分割是進一步進行圖像識別、分析和理解的基礎,例如手寫數據集MNIST就是已經分割好的數據集。我們這里所述的圖像分割是指傳統的分割,將屬于不同物體的像素分開,計算機并不知道分割出來的內容是什么,這個階段的圖像分割方法包括像Ostu、FCM、分水嶺、N-Cut等,屬于非監督學習;圖像語義分割是更高級的分割,語義分割是在傳統分割的基礎之上,分類出每一個區域的語義,這個階段的主要方法是深度學習。還有一種分割叫實例分割(Instance Segmentation),在語義分割的基礎上,對屬于同一類別的不同物體進行劃分。圖像分割的應用場景,比如自動駕駛,3D 地圖重建,美化圖片,人臉建模等等。圖像分割是像素級的,與圖像分類、目標檢測區分開,是更高一級層面的。
上圖中的圖像分割應指的是傳統的分割方法,在傳統的圖像識別中需要先進行圖像分割。
三、圖像識別快速發展的原因
(1)計算性能大幅提高,底層芯片從CPU+GPU到FPGA,再到人工智能芯片,計算性能不斷刷新;
(2)應用場景多樣化,提升產業與技術的發展;
(3)開源工具與框架方便學習與研究,縮短理論到應用的距離。
總結
以上是生活随笔為你收集整理的图像处理与图像识别笔记(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sublime text安装插件出现问题
- 下一篇: 图像分割——迭代式阈值分割