java 数字图片识别_java – 识别图像中的数字
您很可能需要執行以下操作:
>在整個頁面上應用Hough Transform算法,這應該會產生一系列頁面部分。
>對于您獲得的每個部分,請再次應用。如果當前部分產生2個元素,那么你應該處理類似于上面的矩形。
>完成后,您可以使用OCR提取數值。
在這種情況下,我建議你看一看JavaCV(OpenCV Java Wrapper),應該允許你處理Hough變換部分。你會需要一些類似于Tess4j(Tesseract Java Wrapper),它應該允許你提取你之后的數字。
另外,為了減少誤報,您可能需要執行以下操作:
>如果您確定某些坐標絕不會包含您之前的數據,請裁剪圖像。這應該給你一個更小的圖片使用。
>將圖像更改為灰度可能是明智的(假設您使用彩色圖像)。顏色可能對OCR解析圖像的能力產生負面影響。
編輯:根據你的評論,給出這樣的:
+------------------------------+
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---+ |
+------------------------------+
您將裁剪圖像,以便通過裁剪圖像刪除沒有相關數據的區域(左邊的部分),您會得到這樣的:
+-------------+
|+---+---+ |
|| | | |
|+---+---+ |
|+---+---+ |
|| | | |
|+---+---+ |
|+---+---+ |
|| | | |
|+---+---+ |
|+---+---+ |
|| | | |
|+---+---+ |
+-------------+
想法是運行Hough變換,以便您可以獲得包含矩形的頁面的段,如:
+---+---+
| | |
+---+---+
然后你會再次應用霍夫變換,結束兩個段,你拿左邊的。
一旦你有左段,你會應用OCR。
你可以嘗試手前應用OCR,但最多時,OCR將會識別的數字值,書面和兩種類型,從我得到的,不是你的后。
此外,描繪矩形的額外線可能會使OCR偏離軌道,并使其產生不良結果。
總結
以上是生活随笔為你收集整理的java 数字图片识别_java – 识别图像中的数字的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 狂喜 汽车购置税减半政策或将延续 若销量
- 下一篇: java 向上抛异常_java thro