日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

个人征信报告,OCR识别,OCR识别技术方案

發布時間:2023/12/31 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 个人征信报告,OCR识别,OCR识别技术方案 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、產品背景

1、業務需求

個人征信報告是反應個人信用最真實、直觀的材料,通過評估個人的信用情況,從而給予信用貸款是國內金融信貸機構通行的做法。

目前個人征信報告都是從人民銀行征信中心獲取打印的,個人征信數據屬于個人隱私信息,不能對金融信貸機構開放,因此,信貸機構從人民銀行征信中心獲取個人信用數據是比較困難的,必須通過央行的牌照申請。

基于以上情況,現行個人信用貸款的業務模式是:個人從人民銀行征信官網查詢打印本人的征信報告,提交紙質材料或者掃描影像件給信貸機構,信貸機構將信用數據錄入到各自的風控模型中,進而對申請人給予評級和相應額的的貸款。

信貸機構在實際業務中遇到如下的問題:

1)貸款審批流程時間長,容易錯過意向客戶:由于個人征信報告數量大,而目前的風控系統都需要手工錄入個人信用的數據,因此在數據錄入環節,手工方式效率低下,阻礙了信用的快速評估。因此,數據從紙質信用報告轉化到風控系統中的電子數據,是效率關鍵所在。

2)信用數據評估不精確,不全面,隱含風險:由于信用報告數據量大,信貸業務部門又希望能快速放款,所以對風控數據評估勢必存在疏漏和主觀判斷。出現這種情況還是因為,信用數據的獲取和錄入耗費時間。信用數據評估的不精確,對信貸業務會留下潛在的風險,影響貸款決策。

以上是從影響信貸審批效率的一個方面分析的,不難看出,如果提高個人征信報告數據采集的效率將提升整個信貸活動的效率,提升信貸部門的作業效率,提升客戶的體驗度,從而獲取更多的信貸客戶。

2、數據獲取方案

從實際情況出發,目前獲取個人征信報告的途徑有三種,簡要說明如下:

1)直接對接人民銀行的征信系統:目前央行只授權了8家征信企業可以獲得個人征信牌照,意味著更多的信貸機構無法直接從官方拿到信用數據,如果從已授權的8家征信企業購買信用數據,即使有非公開渠道,在法律上應該也是禁止的,風險較大;

2)從人民銀行查詢征信的網頁結果中解析征信數據:此方法屬于技術手段,存在數據被篡改、數據不可信的問題;

3)通過征信中心,查詢并打印個人的征信報告:此方法由于是官方提供了查詢打印平臺,所以對消費者來說,最便捷,數據也最可信。缺點是貸款人提交的征信報告是紙質版,需要將數據錄入到風控系統中,數據采集工作量較大。

對比以上三種方式,信貸機構都選擇了第三種,即由貸款人提交個人征信報告,提交方式為征信報告掃描件,大額貸款還需要本人帶上征信報告面簽。在第三種方式中,錄入信用數據到風控系統中是必須的,如何提高數據采集的效率是提升信貸業務效率的關鍵所在。在經過多個項目的考察和探索、實踐,我們研發出一套依托于OCR(光學字符識別)技術快速采集個人征信報告數據的解決方案,從而為信貸機構提供高可靠性的信用數據。

二、解決方案

1、方案工作流程說明如下

OCR(光學字符識別)技術,是通過圖像處理技術手段,將圖像(影像)上的文字、表格、圖像轉化為電子版的數據,通過計算機程序,快速實現數據信息的采集。個人征信報告中,存在大量的數據需要手工錄入,使用OCR技術將極大提高數據采集的效率和準確度。

解決方案流程如下圖所示:

①客戶面簽時,業務人員將客戶的征信報告掃描為圖像資料,掃描要求為300DPI(分辨率);

②業務人員將掃描的圖像按順序導入OCR自動識別軟件中,軟件開始自動分析圖像特征和數據;

③表格分析識別/文字分析識別:通過版面分析、表格分析、文字分析,識別出征信報告的表格部分、文字部分。表格分析,檢測所有的表格線,并組織成單元格結構,為之后的還原提供數據支撐;文字分析,對非表格部分,進行分析并識別。

④識別結果校驗和匯總:表格中,存在多種文字類型和數據格式,通過識別后分析判斷,進行二次識別,以提高識別精度。

⑤導出Excel/csv格式:對表格分析識別、文字分析識別的結果進行組織和導出,按照原表格樣式進行原版書還原。

A.風控系統:在風控系統和OCR識別系統之間,通過Excel/csv方式進行數據交互。風控系統不需要改造即可使用OCR自動識別出來的數據。

2、方案技術特點

1)速度快:OCR的特點為速度快,識別一張征信報告平均耗時5秒,以一份征信報告6頁計算,識別一份征信報告需要30秒的時間,風控系統可以導入Excel數據,那么在30秒內,風控系統就可以獲得個人征信報告的數據,對比人工錄入,完全錄入一份報告的數據,可能需要30分鐘。

2)數據詳細:采用OCR識別方式,將獲得申請人所有詳細的信用數據;

3)數據精度高:有數據表明,OCR技術識別率比人工錄入的精度要高,計算機作業不受環境、作業疲勞的影響,保證高精度;

4)表格原版式還原:傳統的OCR文字識別軟件只能處理全幅文字的識別,處理簡單表格結構的識別,且有些OCR軟件還需要制作識別模板才能識別,不能滿足征信報告如此復雜的表格的識別。在本方案中,實現了表格自動檢測自動識別的功能,且經過實際測試應用,表格檢測的準確率高達99%。因為表格線檢測精度高,才可以實現表格原版式還原,還原出一個邏輯結構和征信報告一樣的表格。

總結

以上是生活随笔為你收集整理的个人征信报告,OCR识别,OCR识别技术方案的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。