超碰激情 I 成人福利网站 I 淫国产 I 曰批视频免费30分钟成人 I 刘亦菲裸体视频一区二区三区 I 午夜久 I 尤物综合 I 亚洲一区av在线观看 I 欧美亚洲国产精品久久高清 I 欧美老熟妇乱子伦视频 I 无码中出人妻中文字幕av I 久久美女福利视频 I 精品无人区乱码1区2区3区在线 I 性饥渴的农村熟妇 I 色综合综合色 I 少妇人妻88久久中文字幕 I 久久夜色精品国产噜噜av I 老熟妇仑乱视频一区二区 I 男女做爰猛烈叫床视频动态图 I 日本大片一区二区 I 人成午夜免费视频在线观看 I 激情婷婷av I 男女下面一进一出免费视频网站 I 久久影视一区 I 午夜污网站 I 先锋人妻无码av电影 I 久久久久久久岛国免费网站 I 又粗又大又黄又硬又爽免费看 I 人妻无码免费一区二区三区 I www.色成人100 I 欧美高清网站 I 精品国产第一页 I 国产suv一区二区三区88区 I 橹图极品美女无圣光 I 午夜宅男欧美

產品分類

當前位置: 首頁 > 工業控制產品 > 自動化控制 > 人工智能

類型分類:
科普知識
數據分類:
人工智能

人工智能之OCR識別技術簡析

發布日期:2022-10-09 點擊率:234


文字識別是計算機視覺研究領域的分支之一,歸屬于模式識別和人工智能,是計算機科學的重要組成部分。計算機文字識別,俗稱光學字符識別,英文全稱是Optical Character Recognition(簡稱OCR),它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人可以理解的格式。OCR技術是實現文字高速錄入的一項關鍵技術。

OCR技術的興起便是從印刷體識別開始的,印刷體識別的成功為后來手寫體的發展奠定了堅實的基礎。印刷體識別的主要流程大致分為以下幾個部分:圖像預處理、版面處理、圖像切分、特征提取和模型訓練、識別后處理。

圖像預處理

輸入文本經過掃描儀進入計算機后,由于紙張的厚薄、光潔度和印刷質量都會造成文字畸變,產生斷筆、粘連和污點等干擾,所以在進行文字識別之前,要對帶有噪聲的文字圖像進行處理。由于這種處理工作是在文字識別之前,所以被稱為預處理。預處理一般包括灰度化、二值化,傾斜檢測與校正,行、字切分,平滑,規范化等等。

版面處理

版面處理分為三個主要部分,版面分析、版面理解、版面重構。

版面分析將文本圖像分割為不同部分,并標定各部分屬性,如:文本、圖像、表格。目前在版面分析方面的工作核心思想都是基于連通域分析法,后衍生出的基于神經網絡的版面分析法等也都是以連通域為基礎進行的。連通域是指將圖像經過二值化后轉為的二值矩陣中任選一個像素點,若包圍其的所有像素點中存在相同像素值的像素點則視為兩點連通,以此類推,這樣的像素點構成的一個集合在圖像中所在的區域即一個連通域。根據連通域大小或像素點分布等特征可以將連通域的屬性標記出來,用作進一步處理的依據。

圖像切分

圖像切分大致可以分為兩個主要類別,行(列)切分和字切分。經過切分處理后,才能方便對單個文字進行識別處理。

特征提取與模型訓練

特征提取與模型訓練在深度學習廣泛應用于圖像識別領域之前,模板匹配是較為常見的一種識別方式,之后由于神經網絡的復蘇,基于反饋的神經網絡給OCR領域帶來了又一春。現在隨著計算機硬件計算能力的提升,利用大批數據訓練深度神經網絡在圖像識別方面取得了傲人的成績。

特征提取是從單個字符圖像上提取統計特征或結構特征的過程。特征匹配是從已有的特征庫中找到與待識別文字相似度最高的文字的過程。

識別后處理

識別校正是在識別結果基礎上根據語種的語言模型進行,當然在單文種識別中相對容易一些,而在多語種則較為復雜。

OCR的應用案例有哪些

印刷體識別應用擴展較多且技術發展較為成熟,無論在識別準確率方面還是在識別效率方面,都達到了較高的標準。

車牌識別

車牌識別系統是OCR工業化應用較早而且成功的典型案例,如今從停車場到小區門禁,車牌識別技術已走進生活的各個角落。

驗證碼識別

驗證碼的主要目的是強制人機交互來抵御機器自動化攻擊的。驗證碼作為一種輔助安全手段在Web安全中有著特殊的地位,驗證碼安全和web應用中的眾多漏洞相比似乎微不足道,但是千里之堤毀于蟻穴,有些時候如果能繞過驗證碼,則可以把手動變為自動,對于Web安全檢測有很大的幫助。

下一篇: PLC、DCS、FCS三大控

上一篇: 索爾維全系列Solef?PV

推薦產品

更多