個人貸款
中小企業貸款
分期超市
慈善公益
投資專區
x
x

OCR(光學字元辨識)是什麼?

2021-03-22 02:46:57
20210322-1

先前我們在【耳朵也能作為生物辨識?】中提到,普匯目前已在用戶認證中,運用OCR來作為證件字元的辨識,但OCR技術到底是什麼呢?此篇我們將帶您深入了解:

 

名詞解釋:
 

OCR光學字元識別(Optical Character Recognition),目的是將圖片或掃描文字,轉化成電腦能識別的電子訊號的技術。

早在1929年OCR的概念就已誕生,但剛開始的應用範圍小—僅能辨識「印刷體的數字與字母」;後演變為可辨識「手寫文字」—有利於信件分類;近年更將人工智慧投入發展,用以辨識「清晰度較差的文字」與「變化度較大的漢字」,在速度上也有大幅進展—每秒可識別70~100個漢字,且正確率達99.5%。


OCR 的辨識流程:


傳統 vs. 人工智慧:

由上圖可知,傳統OCR在辨識上存在許多缺點—對格式的工整度與清晰度要求極高,且字元的分割能力也大幅影響辨識結果,因此近年將人工智慧技術投入後,再辨識能力上便有了大幅的進步:

  • 不受排版影響:即使畫面歪斜、字句非縱橫平整排列,甚至是電視、影片中的文字,都能清楚辨識,打破OCR只能辨識掃描文件的限制
  • 持續優化:透過深度學習的人工智慧OCR模組,可隨著處理過的文件量增加,加強辨別錯字的辨識能力,自我學習優化

#若想了解更多有關機器深度學習的內容,可見【深度學習(Deep Learning)是什麼?,我們會在文中作更深入的說明。


普匯觀點:

過去大部分的徵信審查為「用戶手動輸入為主、拍照為輔」,而後台再以人工來審核,因此若用戶輸入錯誤、而後台又未發現時,易造成系統風險與無法即時核實的窘境。

普匯目前已運用OCR(光學字元辨識)作為證件號碼的辨識,但OCR的發展快速,且在掃描文件上已十分成熟,因此未來也會將此技術用於APP中用戶註冊時的證明文件審查,如:畢業證書、薪資明細、電話費帳單、成績單、信用卡帳單…等文件的辨識,不僅可使審核的速度加快,達到真正的AI審核;也可減少人工審核的人力,將人力資源作更妥善的運用。

#若想了解更多有關OCR辨識的應用與展望,可見【OCR光學字元識別的應用】,我們會在文中作更深入的說明。