使用tesserocr二值化识别知网登录验证码
生活随笔
收集整理的這篇文章主要介紹了
使用tesserocr二值化识别知网登录验证码
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
- 隨機獲取了知網(wǎng)登錄界面的三個圖片驗證碼,測試 tesserocr 識別驗證碼的準確度
- 編寫代碼,先測試pic1
- pic1識別結果:PEHK.
- 由于驗證碼圖片中帶有很多干擾線條,導致識別結果不準確(后面多一個點).
- 接下來,進行圖片灰度測試看看能不能解決問題
- 測試結果:PEHK. 還是有個點
- 繼續(xù)進行圖片二值化
- 二值化結果:成功識別到驗證碼 【PEHK】
- 經(jīng)過測試,pic2 以及 pic3 在二值化后都可以識別出來,如果二值化后還無法精確識別,則需要調(diào)整二值化閾值(threshold = 155)。關于圖像二值化,參考
-遇到的【問題1】:tessdata路徑報錯
- 解決: tessdata的路徑出錯,找到tesseract安裝路徑,把tessdata文件夾復制一份到anaconda路徑下面,例如:C:\ProgramData\Anaconda3\tessdata
-遇到的【問題2】:安裝tesserocr模塊失敗
- 解決:參考我的另一篇博客(https://editor.csdn.net/md/?articleId=123265184)
總結
以上是生活随笔為你收集整理的使用tesserocr二值化识别知网登录验证码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 十步会用IOCOMP–iplotx控件
- 下一篇: 东芝发布全系列消费级硬盘