日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

cnn 验证集 参与训练吗_一个简单的零基础的机器学习教程之二,字母数字验证码识别...

發布時間:2025/3/11 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 cnn 验证集 参与训练吗_一个简单的零基础的机器学习教程之二,字母数字验证码识别... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一.前言
基于前面我發的貼子

土味程序員:一個簡單的零基礎的機器學習教程,Pytorch搭建Faster R-CNN目標檢測平臺?zhuanlan.zhihu.com

一個非常震撼的目標檢測的例子。上個帖子從環境安裝到調試代碼再到圖片檢測視頻檢測一個詳細的教程,今天我來講一下正真的實戰經歷吧。完全不需要深度相關的知識。
這個項目就是《Python3 反爬蟲原理與繞過實戰》里面的例子,

asyncins/captcha_cnn?github.com

基礎環境與我上一個深度學習教程的基礎環境一摸一樣,拿過來基本不用改就可以用了。書里面的講了一下原理,還不錯,通俗易懂,但是沒講太深,意猶未盡,畢竟是一本爬蟲書啊
整個項目訓練速度非???#xff0c;因為專門為驗證碼檢測設計的,自己的顯卡還不錯,每次訓練就幾分鐘的樣子,測試了一下,最終我把原項目的單次訓練的樣本數量調大了8倍,原先是32的,4分鐘不到3w張圖片。setting.py里面我看到,檢測的內容都限制了,26個字母和10個數字,所有的圖片格式大小都規定了。

二.開始訓練
運行環境看我的上一個深度學習的教程

土味程序員:一個簡單的零基礎的機器學習教程,Pytorch搭建Faster R-CNN目標檢測平臺?zhuanlan.zhihu.com


完全一樣。
下載代碼和相關資源
下載GitHub代碼,下載圖片數據集。相關資源最后會放出來,原項目的代碼導入圖片目錄的時候有點問題。貌似原項目是在ubuntu系統上面運行的,我改了一下setting里面的參數如下圖。
把下載images的圖片放到項目目錄下面如圖,images里面的數據集圖片的文件名就是圖片正確的識別結果,要做自己的數據集要注意哦,train文件夾下面的圖片就是我們訓練時候的圖片集,test文件夾下面的圖片是用來訓練時驗證我們的訓練效果的圖片集,predict文件夾下面的圖片就是我們訓練好之后要預測的圖片集。

接下來打開setting.py根據自己顯卡的算力設置BATCH_SIZE,我的顯卡是2070S,最終設置成了256,CPU和GPU都快到100%了。然后打開train.py運行等待就行了,訓練完成會生成result.pkl文件。

驗證的代碼在verifies.py里面,直接運行,它會先載入模型,遍歷驗證集圖片正確的驗證碼與預測結果對比,算出成功比例。


驗證碼的圖片就是下圖,26個字母和10個數字的混合,長度固定,6位。有干擾線和干擾點,沒有傾斜變形。

三.最后說明
這個項目代碼量非常的少,文章的篇幅也很短,項目的結構簡單可以一步步的詳細分析所有代碼的用處,特別是model.py里面進行了三次卷積和池化操作。loader.py對圖片的灰度化處理和數字化處理。雖然這些東西很抽象,但是只要不要本能的去拒絕它們,還是能夠慢慢的理解的。
關注我,給我動力繼續研究更多有意思的有關python的東西哦。

Github地址?github.com

總結

以上是生活随笔為你收集整理的cnn 验证集 参与训练吗_一个简单的零基础的机器学习教程之二,字母数字验证码识别...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。