图像识别与人工智能的联系
圖像識別與人工智能的聯系
對于圖像識別,自然應當與當今的時代潮流人工智能相結合起來。正如今年下半年在天津的夏季達沃斯峰會和在上海的中國國際進口博覽會中所展示出來的,人工智能就是人類的第四次工業革命,而各個國家、企業都在展示當今時代人工智能的成果。而圖像識別,正是人工智能的一個重要的研究方向。如何教會機器像人類一樣會看會識別,是當今時代重點研究的一個課題。
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,采用工業相機拍攝圖片,然后再利用軟件根據圖片灰度差,做進一步識別處理,圖像識別軟件國外代表的有康耐視等,國內代表的有圖智能等。另外在地理學中指將遙感圖像進行分類的技術。
而聯系到機器學習,主要涉及到的算法包含SVM,一種支持向量機,在機器學習領域,是一個有監督的學習模型,通常用來進行模式識別、分類以及回歸分析的算法。以及CNN卷積神經網絡算法,基于卷積神經網絡CNN的人工智能技術的發展,目前基于主流的深度學習框架的直接開發出端到端不分割的識別方式,而且在沒有經過太多trick的情況下,已經可以達到95%以上的識別率。
機器是如何學習的呢?這是一個非常值得思考的問題。人類正是有著聰明的大腦才能成為世界上最高級的生物,而教會機器像人的大腦一樣去看這個世界并不容易,一個小孩從出生到這個世界到三歲,就已經看到了數以億萬計的、海量的圖片,而一個機器,簡單將已有的而較為尋常普遍的圖片給其學習,遠遠難以達到人類大腦所能識別的信息。因此,早在2007年,TED便在網上發起了圖片收集,在ImageNet上收集了來自全世界各個國家各個地區所傳來的各式各樣的圖片,數量達到接近十億,以此龐大數量的圖像數據,來使機器所學習到的圖像信息盡可能的貼近一個人類,或說是一個三歲孩子所學習到的信息。這便是機器學習的出發點,教會機器像人類一樣去看這個世界。
而本次我將重點介紹CNN卷積神經網絡,并用此種方法淺顯的展現出機器學習與圖像識別的聯系。為了像人一樣,人的大腦便是由一個龐大而縝密的神經網絡組成,而每一個神經元就是最小最基本的單位。而卷積神經網絡便是模仿了人腦的這一特點,由一個個神經元組成了一個神經網絡,再經由機器學習以后,將訓練的結果用于實際測試。
利用課余時間,我在網上收集資料并嘗試搭建框架經行圖像識別驗證碼。我運行的環境是基于Windows10,Python3.6,編譯器為Pycharm,同時,主要利用Tensorflow進行機器訓練學習這一過程。TensorFlow是一個基于數據流編程的符號數學系統,被廣泛應用于各類機器學習算法的編程實現,擁有多層級結構,可部署于各類服務器、PC終端和網頁并支持GPU和TPU高性能數值計算,被廣泛應用于谷歌內部的產品開發和各領域的科學研究。
在此條件下,在機器學習過程中首先構建卷積神經網絡并訓練,經由卷積層(這里一共包含三層卷積層)、全連接層、池化層(每次池化后圖片的高度和寬度都縮小為原來的一半)、輸出層,這里在Python中調用Captcha庫函數進行驗證碼的下載,訓練集包含10000張圖片(從0000-9999),同時生成測試集,即隨機挑選50張驗證碼圖片在機器經過學習后測試,這里的機器學習時長根據電腦配置不同而不同,CPU所需時間大約為20小時,而GPU所需時間大約為5-6小時。最后,這里我將生成的測試集數據以及測試情況截圖:
最后所得到結果,正確率為92%,由于測試集包含數量較少,以及驗證碼的灰度、散點都有所不同,此次數據結果僅為參考值。
圖像識別作為人工智能的一個大類,如今已經變得越來越熱門,在前幾年江蘇衛視《最強大腦》節目中也已經展現出百度機器人小度對于圖像識別以及信息綜合處理的能力,在技術發展越來越快、效果越來越完善的現在,我們應該要明白,最難的不是使用一個算法,而是真正明白我們要解決的問題。
參考文獻:
1. 機器學習初步與實踐
2. 使用Tensorflow構建和訓練自己的CNN來做簡單的驗證碼識別
3. 基于Opencv和Tensorflow實現實時手勢識別
4. 李飛飛:如何教計算機理解圖片
總結
以上是生活随笔為你收集整理的图像识别与人工智能的联系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于MATLAB BP神经网络的数字图像
- 下一篇: 图像识别与软件自动化测试