日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

Stroke filter: 一种用于OCR预处理的文字滤波器

發布時間:2025/7/25 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Stroke filter: 一种用于OCR预处理的文字滤波器 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

from:Stroke filter: 一種用于OCR預處理的文字濾波器

  近幾個月我在一家公司的研發部做模式識別實習生,學習了很多OCR相關的知識和技術,在此謝謝陸老師,孫老師以及其它各位老師的指導,我很喜歡這里,你們讓我收獲了很多

  OCR(Optical?Character?Recognition)光學字符識別是一種獲取圖像中的字符信息的處理技術,用通俗一點的話說,就是把帶有文字信息的圖像數據變成文本數據的一種技術。在我們的生活中很多地方都有它的身影,如高速路上的電子眼(車牌識別),有道詞典(圖像單詞識別)等等。

  OCR的識別過程大致有以下幾個步驟:字符檢測,去噪,傾斜校正,版面分析,文字切割,字符識別,修正,后處理等。Stroke?filter?正是一種用于OCR預處理去噪的濾波器,它能夠濾除圖像中那些文字特征不明顯的部分,而保留那些文字較明顯的部分。它是字符檢測和背景去噪的一種常用方法。

  

  Stroke?filter的定義很簡單:

  首先定義stroke響應,對于一個給定的角度alpha和距離參數d(上圖), 一個像素點的響應response(此處用小r表示)為:

?

  其中u1,u2,u3表示1號2號3號矩形內的像素和, 分母是正比于1號矩形內像素方差分布的一個參數,B表示bright,即白底黑字的情況。從直觀上來看,如果當前像素點(x,y)為筆劃像素點時,1號矩形的像素和與2號3號矩形的像素和之差會比較大,2號和3號矩形像素和之差會較小,因此response會在筆劃像素點的位置達到極大值。但是這個值會因為當前筆劃的方向和字體大小有所不同,這時就需要調整alpha和d來尋找這個最大值。

  下面的任務就是要找出這個最大值了,如下圖第一行所示(后兩行不用看,是為了后續svm分類用的,具體內容可以看這篇paper),一個像素點的Response(此處用大R表示)值為:在所有的alpha,d的可能取值所對應的response的集合中,最大的一個r值,即為該像素點的R。可以想像,這種濾波器很符合文字的紋理特點,文字都是由條狀的筆劃組成,一張圖片如果含有文字,則文字筆劃處的Response會比較大,其它地方的Response會較小,利用這一特點就可以把文字濾出來了。

  以下是部分實驗結果:

首先是輸入圖像:

?

?

Response:

?

二值化:

?

注意到文章中的參數比較死板,效果不是太好,在我的實驗中,一組較合理的參數如下圖所示

d=1,2,3,4, alpha interval = 45度,其中stroke的長度不要超過兩倍的d,不然文字邊界的response會出現振鈴效應

?

速度方面,上面的測試圖長寬為722 * 535 pixels?,在我的i5小黑上跑,大概1300ms, 環境是windows,x64,opencv, c++。影響速度最重要的參數是alpha的選取,每隔45度計算一個response和每隔10度計算一個response在精度上不會有太大差別,同樣地,如果alpha interval設為90也不會損失太多的精度,而速度卻可以降到600ms。如果想要做實時視頻處理的話,最好先把字幕所在矩形提取出來,然后在處理,這樣的話速度可以保證在50ms以內。

總結

以上是生活随笔為你收集整理的Stroke filter: 一种用于OCR预处理的文字滤波器的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。