深延科技:基于深度学习的智能OCR识别技术大有可为
智能OCR技術作為人工智能領域的重要原子能力之一,在行業轉型過程中發揮作用。近年來,移動互聯、大數據等新技術飛速發展,倒逼傳統行業向智能化、移動化的方向轉型。這一大趨勢也促使傳統OCR技術不斷向智能OCR升級,以滿足更復雜、更高要求的任務需求。
隨著深度學習的融入,實現了OCR對復雜文本的識別,即智能OCR識別。同時配合其他信息化手段的綜合應用,使智能OCR具備移動端適配、多任務檢測、整行識別、圖像分割定位和分類等功能,應用場景更加廣泛,在圖書情報領域中的圖書文本和卡證識別會更高效。
01 傳統OCR識別技術缺陷漸露
光學字符識別(Optical Character Recognition,OCR)指自動識別圖像中的文字內容,屬于人工智能機器視覺領域的一個重要的分支,即把文本、卡證等載體上的文字通過光學等技術手段轉化為計算機認識的電子化數據。傳統OCR識別采用統計模式,處理流程較長,包括圖像的預處理、二值化、連通域分析、版面分析、行切分、字切分、單字符識別和后處理等步驟。典型的傳統OCR識別流程如圖1所示。
圖1 傳統OCR識別技術流程
傳統OCR識別方法存在諸多弊端,匯總如下:a)在進行版面分析時,使用大量的規則,導致程序維護成本很高。b)行業域分析完全依靠圖像二值化得到的二值圖,對于掃描文檔效果尚可,面對手機拍攝和高拍儀取圖時,難取得效果良好的二值化圖,造成二值化過程中大量信息的丟失。c)傳統OCR技術包含8個模塊,如圖1所示,其中任何一個模塊的不完善都會產生誤差,誤差的累積將導致識別率大幅下降。d)傳統OCR識別靈活性差,對于自然場景下拍攝的復雜樣本基本無法處理,沒有修改提升空間,可用性不高。e)傳統的方法將OCR系統割裂成過多的環節,倚重人工規則,需要在每個環節上引入人工干預并根據場景設定方法參數,難做到端到端的訓練。
而深度學習算法可以有效地規避傳統OCR識別的不足,通過組合低層特征形成更加抽象的高層表示屬性類別或特征,挖掘數據的分布式特征表示。借助神經網絡來模擬人腦進行分析、學習和訓練,即模仿人腦機制來分析圖像、聲音和文本等數據,被廣泛應用于人工智能的模型構建和處理中。
02 基于深度學習的智能OCR大有可為
基于深度學習的智能OCR技術是一次跨越式的升級,深度學習算法實現整行識別,提升了OCR的識別率和識別速度,人工需要幾分鐘才能錄入的文本,智能OCR技術可以秒速進行精準識別。智能OCR識別技術對識別流程進行了優化,優化后的識別流程包括檢測、識別和后處理3個主要步驟,如圖2所示。
圖2 智能OCR識別技術流程
深延科技智能一站式OCR服務平臺基于深度學習的OCR定位與識別,通過卷積神經網絡CNN、循環神經網絡RNN、長短期記憶網絡LSTM技術實現,可在灰度圖像上實現文字區域的自動定位和整行文字的識別,解決了傳統OCR技術中單字識別無法借助上下文來判斷形似字的問題。
此外,智能OCR識別技術在低質量圖片的容忍能力和識別準確率方面得到了顯著的提升,可在印刷體低分辨率與模糊字符識別、印刷體復雜或者非均勻背景識別、印刷體多語言混合識別、印刷體藝術字體識別、手寫小寫數字識別、手寫大寫金額識別、手寫通用文本識別等場景下實現高效的識別和分類。
深延科技智能一站式OCR服務平臺基于深度學習的智能OCR識別技術支持移動設備拍攝的圖像識別,可適用于對焦不準、高噪聲、低分辨率、強光影等復雜背景。
除了在卡證識別、票據識別、表單識別、文檔識別,智能OCR可應用于互聯網廣告推薦系統、UCG圖片視頻過濾、醫學影像識別、街景路牌識別等。智能OCR識別屬于多類分類問題,場景復雜、挑戰性大;尤其是中文識別,字符集達到20000類,而英文數字加字母只有62類。
深延科技智能一站式OCR服務平臺可提供多場景、多語種、高精度的文字檢測與識別服務,廣泛適用于身份證、戶口本、銀行卡、名片、財稅票據、文檔、表格、車牌等具體識別對象,全面輔助企業智能化辦公,實現降本增效。
深延科接智能OCR一站式服務平臺功能
深延科技智能一站式OCR服務平臺行業解決方案
保險
利用OCR技術全面賦能保費代扣、投保、財產保險等業務,為保險行業各細分領域提供個性化服務和技術支持。
- 手機移動端投保
通過手機拍攝身份證、駕駛證、行駛證等證件信息,并將姓名、身份證號、車牌號碼、號牌類型、初登日期,使用性質、車輛種類等信息分門別類自動錄入。投保更加方便,提升客戶轉化率。
- 客戶保費代扣
業務員可通過手機或平板拍攝自動識別客戶的銀行卡對投保人賬戶的銀行卡信息進行核實,降低手動輸入的錯誤率,方便操作、節省時間,提高業務效率。
- 車險現場勘查
業務員現場采集信息時,使用移動端設備(手機、平板電腦等)拍攝,通過部署OCR技術自動識別錄入當事人的身份證、駕駛證、行駛證等信息。節省業務時間,提高客戶滿意度。
銀行
為銀行開戶業務、內部流程、貸款等業務創造全新的服務生態,降低服務成本,增強用戶體驗,創造新的收入流。
- 線上開戶
提供ocr線上識別身份證、銀行卡等開戶證件服務,隨時隨地錄入信息,更便捷、高效的滿足用戶需求。
- 貸前企業背調
賦能企業投資、企業帶貸款等銀行主營業務,利用ocr技術識別、錄入企業三證信息進行校驗。
- 內部流程優化
通過手機或平板實現企業年報、各類表單、文檔及工單文本電子化,自動錄入。
證券
協助證券開戶,賬戶認證,移動支付業務,利用精準的OCR識別技術,為金融機構提供更加智能化、精準化和專業化的服務,用智能變革業務模式。
- 線上開戶認證
移動端開戶認證、Web開戶認證。支持身份證識別、人臉識別、銀行卡識別,精準的OCR識別技術和生物識別技術,提升金融服務體驗。
- 實名認證
投資理財客戶拍攝身份證,即可自動識別獲得用戶的姓名、身份證號碼、身份證有效期、所在地區等信息。同時綁定銀行卡時,也可通過拍攝銀行卡識別,進行自動識別卡號,輕松完成綁定,操作更漸變。
- 移動支付
結合OCR證件識別技術與人臉識別技術,為移動支付身份認證的安全性提供保障,避免手機盜用同時減少流程時間以提高轉化率。
供應鏈
準確把握產業鏈的布局,輔助風險管理、營銷拓客或者招商引資,為產業研究提供強有力的數據支撐。利用OCR技術,識別錄入各種運輸流程文件及單據,優化流程提高效率。
移動設備
從移動支付、身份認證、車輛認證,到37個維度的企業信用數據查詢,給使用帶來新體驗。
- 移動端文檔掃描
利用ocr技術,可使移動端(手機或平板電腦)設備成為移動掃描儀,掃描紙質文檔、PPT、各類票據,生成PDF或JPG格式文件。
- 銀行卡號等信息識別
手機拍照即可錄入銀行卡號,在手機移動支付,銀行卡管理。而且深延OCR識別技術,不僅支持識別卡號,還能同時錄入持卡人姓名、卡片到期日期。
智慧政務、社區
運用大數據,以及OCR技術,推進政府和社區的移動化、信息化,優化信息采集管理、訪客登記、證件辦理等流程,形成高效、敏捷、便民的智慧政務&智慧社區。
- 政務移動辦公
企業OA系統,CRM系統等辦公系統,利用ocr識別快速錄入人員信息、證件信息、名片信息管理。
- 信息服務平臺優化
利用ocr技術,只需手機拍照,就能自動識別錄入,完成居民身份認證,銀行卡綁定,證件申請、換證等諸多便民服務。
相比于傳統OCR,基于深度學習的智能OCR技術具有識別準確率更高、速度更快、無格式依賴、支持私有化快速部署等優勢,深度學習算法和模型構建也是OCR應用的關鍵。隨著智能OCR技術不斷演進,深延科技將繼續細化業務需求,和已有的信息化系統相結合,打造智能OCR創新服務模型,解決實際生產中的痛點問題。
|關于深延科技|
深延科技成立于2018年1月,中關村高新技術企業,是擁有全球領先人工智能技術的企業AI服務專家。以計算機視覺、自然語言處理和數據挖掘核心技術為基礎,公司推出四款平臺產品——深延智能數據標注平臺、深延AI開發平臺、深延自動化機器學習平臺、深延AI開放平臺,為企業提供數據處理、模型構建和訓練、隱私計算、行業算法和解決方案等一站式AI平臺服務。
總結
以上是生活随笔為你收集整理的深延科技:基于深度学习的智能OCR识别技术大有可为的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java面试必看的18个开源项目
- 下一篇: 梳理百年深度学习发展史-七月在线机器学习