天天操免费视频,国产免费aa,三级视频黄色,98精品国产,久久深爱网,国产精品久久国产精麻豆96堂,色偷偷色偷偷色偷偷在线视频

人工智能之OCR識別技術(shù)簡析

來源:網(wǎng)絡(luò)

點擊:956

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: 人工智能,OCR,面部識別

    文字識別是計算機(jī)視覺研究領(lǐng)域的分支之一,歸屬于模式識別和人工智能,是計算機(jī)科學(xué)的重要組成部分。計算機(jī)文字識別,俗稱光學(xué)字符識別,英文全稱是Optical Character Recognition(簡稱OCR),它是利用光學(xué)技術(shù)和計算機(jī)技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來,并轉(zhuǎn)換成一種計算機(jī)能夠接受、人可以理解的格式。OCR技術(shù)是實現(xiàn)文字高速錄入的一項關(guān)鍵技術(shù)。

    OCR技術(shù)的興起便是從印刷體識別開始的,印刷體識別的成功為后來手寫體的發(fā)展奠定了堅實的基礎(chǔ)。印刷體識別的主要流程大致分為以下幾個部分:圖像預(yù)處理、版面處理、圖像切分、特征提取和模型訓(xùn)練、識別后處理。

    圖像預(yù)處理

    輸入文本經(jīng)過掃描儀進(jìn)入計算機(jī)后,由于紙張的厚薄、光潔度和印刷質(zhì)量都會造成文字畸變,產(chǎn)生斷筆、粘連和污點等干擾,所以在進(jìn)行文字識別之前,要對帶有噪聲的文字圖像進(jìn)行處理。由于這種處理工作是在文字識別之前,所以被稱為預(yù)處理。預(yù)處理一般包括灰度化、二值化,傾斜檢測與校正,行、字切分,平滑,規(guī)范化等等。

    版面處理

    版面處理分為三個主要部分,版面分析、版面理解、版面重構(gòu)。

    版面分析將文本圖像分割為不同部分,并標(biāo)定各部分屬性,如:文本、圖像、表格。目前在版面分析方面的工作核心思想都是基于連通域分析法,后衍生出的基于神經(jīng)網(wǎng)絡(luò)的版面分析法等也都是以連通域為基礎(chǔ)進(jìn)行的。連通域是指將圖像經(jīng)過二值化后轉(zhuǎn)為的二值矩陣中任選一個像素點,若包圍其的所有像素點中存在相同像素值的像素點則視為兩點連通,以此類推,這樣的像素點構(gòu)成的一個集合在圖像中所在的區(qū)域即一個連通域。根據(jù)連通域大小或像素點分布等特征可以將連通域的屬性標(biāo)記出來,用作進(jìn)一步處理的依據(jù)。

    圖像切分

    圖像切分大致可以分為兩個主要類別,行(列)切分和字切分。經(jīng)過切分處理后,才能方便對單個文字進(jìn)行識別處理。

    特征提取與模型訓(xùn)練

    特征提取與模型訓(xùn)練在深度學(xué)習(xí)廣泛應(yīng)用于圖像識別領(lǐng)域之前,模板匹配是較為常見的一種識別方式,之后由于神經(jīng)網(wǎng)絡(luò)的復(fù)蘇,基于反饋的神經(jīng)網(wǎng)絡(luò)給OCR領(lǐng)域帶來了又一春?,F(xiàn)在隨著計算機(jī)硬件計算能力的提升,利用大批數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)在圖像識別方面取得了傲人的成績。

    特征提取是從單個字符圖像上提取統(tǒng)計特征或結(jié)構(gòu)特征的過程。特征匹配是從已有的特征庫中找到與待識別文字相似度最高的文字的過程。

    識別后處理

    識別校正是在識別結(jié)果基礎(chǔ)上根據(jù)語種的語言模型進(jìn)行,當(dāng)然在單文種識別中相對容易一些,而在多語種則較為復(fù)雜。

    OCR的應(yīng)用案例有哪些

    印刷體識別應(yīng)用擴(kuò)展較多且技術(shù)發(fā)展較為成熟,無論在識別準(zhǔn)確率方面還是在識別效率方面,都達(dá)到了較高的標(biāo)準(zhǔn)。

    車牌識別

    車牌識別系統(tǒng)是OCR工業(yè)化應(yīng)用較早而且成功的典型案例,如今從停車場到小區(qū)門禁,車牌識別技術(shù)已走進(jìn)生活的各個角落。

    驗證碼識別

    驗證碼的主要目的是強制人機(jī)交互來抵御機(jī)器自動化攻擊的。驗證碼作為一種輔助安全手段在Web安全中有著特殊的地位,驗證碼安全和web應(yīng)用中的眾多漏洞相比似乎微不足道,但是千里之堤毀于蟻穴,有些時候如果能繞過驗證碼,則可以把手動變?yōu)樽詣樱瑢τ赪eb安全檢測有很大的幫助。

    (審核編輯: 林靜)

    聲明:除特別說明之外,新聞內(nèi)容及圖片均來自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請聯(lián)系我們刪除。