一種識(shí)別印刷品上字符的方法及裝置制造方法
【專利摘要】本申請(qǐng)涉及一種識(shí)別印刷品上字符的方法及裝置。該方法可以包括:對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像;對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像;將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像;從所述處理后圖像中提取每個(gè)字符的圖像;以及對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。采用本申請(qǐng)的技術(shù)方案,在對(duì)例如證件等印刷品進(jìn)行圖像處理時(shí),能夠?qū)崿F(xiàn)對(duì)該印刷品上字符的更有效、更精確的識(shí)別。
【專利說明】—種識(shí)別印刷品上字符的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及圖像識(shí)別【技術(shù)領(lǐng)域】,尤其涉及一種識(shí)別印刷品上字符的方法及裝置。
【背景技術(shù)】
[0002]在以往的OCR (Optical Character Recognit1n,光學(xué)字符識(shí)別)識(shí)別中,對(duì)于一些外部比較光滑,反射較強(qiáng)的印刷品上文字的識(shí)別,例如經(jīng)過表面覆膜處理的印刷品上的文字的識(shí)別、或者例如各類證件照或各種卡(尤其是過塑處理的證件(駕駛證、行駛證等))上文字的識(shí)別,往往會(huì)存在識(shí)別率較低或者另外因?yàn)楸砻娓材し垂鈴亩嬖谧R(shí)別錯(cuò)誤的情況,造成這種問題的本質(zhì)在于識(shí)別的過程中無法進(jìn)行有效的濾光,導(dǎo)致OCR識(shí)別源的字體存在模糊或者對(duì)比度過大的問題,同時(shí),由于各種印刷品往往存在多種不同的字體,也會(huì)在識(shí)別上帶來的字符無法匹配或匹配錯(cuò)誤的問題。
[0003]目前,在OCR的識(shí)別技術(shù)發(fā)展上,面向證照的需求越來越多,而現(xiàn)有的OCR技術(shù)的發(fā)展方向都趨向于對(duì)于完整圖像信息的識(shí)別與搜尋,針對(duì)目前的證照識(shí)別來看,現(xiàn)行的幾種OCR識(shí)別方案中,對(duì)于身份證、護(hù)照等的識(shí)別,現(xiàn)階段雖然有較為成熟的高識(shí)別率引擎與算法,但對(duì)于類似駕照、工作證等的識(shí)別上,由于這些證件在最終頒發(fā)的時(shí)候都會(huì)對(duì)證件進(jìn)行過塑處理,同時(shí)也由于各個(gè)地區(qū)的類似證件打印并不像身份證一樣具備統(tǒng)一的打印標(biāo)準(zhǔn)與字體,從而導(dǎo)致了現(xiàn)行的證照識(shí)別中,針對(duì)需要識(shí)別的證照往往會(huì)存在由于曝光過度導(dǎo)致圖像模糊以及針對(duì)變形字體的識(shí)別效率低的問題,從本質(zhì)而言,在于現(xiàn)行的識(shí)別方法中并沒有完全考慮這兩個(gè)方面的需要。
【發(fā)明內(nèi)容】
[0004]本申請(qǐng)的主要目的在于提供一種識(shí)別印刷品上字符的方法及裝置,以解決現(xiàn)有技術(shù)存在的對(duì)印刷品上字符進(jìn)行識(shí)別中的圖像處理問題以及字符識(shí)別問題,其中:
[0005]根據(jù)本申請(qǐng)的一個(gè)方面,提供了一種識(shí)別印刷品上字符的方法,其特征在于,包括:對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像;對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像;將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像;從所述處理后圖像中提取每個(gè)字符的圖像;以及對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。
[0006]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像,包括:在進(jìn)行拍攝時(shí)按預(yù)定條件進(jìn)行曝光設(shè)置。
[0007]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,對(duì)所述每一幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像,包括:對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像;以及對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像。
[0008]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像,包括:識(shí)別所述復(fù)制圖像中的噪點(diǎn);將每個(gè)噪點(diǎn)的灰度值與其周圍相鄰的八個(gè)像素點(diǎn)的灰度值相加并取平均值作為每個(gè)噪點(diǎn)的去噪灰度值;以及將所述復(fù)制圖像中每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值以得到第一分層圖像。
[0009]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,識(shí)別所述復(fù)制圖像中的噪點(diǎn)包括:將所述復(fù)制圖像中每個(gè)像素點(diǎn)的灰度值與其左右兩個(gè)相鄰像素點(diǎn)的灰度值相加并取平均值作為每個(gè)像素點(diǎn)的計(jì)算灰度值;判斷每個(gè)像素點(diǎn)的灰度值與其計(jì)算灰度值的差值的絕對(duì)值是否在預(yù)定閾值范圍內(nèi);以及將灰度值與計(jì)算灰度值的差值的絕對(duì)值超出預(yù)定閾值范圍的像素點(diǎn)識(shí)別為噪點(diǎn)。
[0010]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像,包括:將所述復(fù)制圖像劃分為至少兩個(gè)子區(qū)域;以及對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,以得到第二分層圖像。
[0011]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,將所述分層圖像進(jìn)行合并,以得到處理后圖像,包括:對(duì)所述分層圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值取中值,得到每個(gè)像素點(diǎn)的灰度值中值;以及將每個(gè)像素點(diǎn)的灰度值替換為該像素點(diǎn)的灰度值中值,以得到處理后圖像。
[0012]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,提取出所述處理后圖像中每個(gè)字符的圖像,包括:確定所述處理后圖像中的文本圖像的位置;以及對(duì)所述文本圖像進(jìn)行字符分割,提取出所述文本圖像中的每個(gè)字符的圖像。
[0013]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,獲取所述處理后圖像中的文本圖像的位置,包括:通過邊緣檢測(cè)識(shí)別出每行像素中的邊緣紋理;對(duì)每行像素的邊緣紋理做直方圖,并根據(jù)對(duì)所述直方圖的分析確定邊緣基元的識(shí)別閾值;根據(jù)所述邊緣基元的識(shí)別閾值統(tǒng)計(jì)每行的邊緣基元的數(shù)目,并記錄每行邊緣基元的開始位置和結(jié)束位置;識(shí)別所述處理后圖像中的非空白行;判斷當(dāng)前非空白行是否滿足預(yù)設(shè)條件,如果滿足,則進(jìn)行下一非空白行的檢測(cè);以及當(dāng)連續(xù)檢測(cè)到超過預(yù)定數(shù)目的非空白行滿足所述預(yù)設(shè)條件時(shí),根據(jù)每一非空白行邊緣基元的開始位置和結(jié)束位置確定文本圖像的位置。
[0014]根據(jù)本申請(qǐng)的實(shí)施例,在該方法中,對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別,包括:利用BP神經(jīng)網(wǎng)絡(luò)對(duì)所述每個(gè)字符的圖像進(jìn)行字符識(shí)別。
[0015]本申請(qǐng)的另一方面,提供了一種識(shí)別印刷品上字符的裝置,其特征在于,包括:采集模塊,用于對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像;分層處理模塊,用于對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像;圖層合并模塊,用于將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像;提取模塊,用于從所述處理后圖像中提取每個(gè)字符的圖像;以及識(shí)別模塊,用于對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。
[0016]與現(xiàn)有技術(shù)相比,根據(jù)本申請(qǐng)的技術(shù)方案,通過對(duì)印刷品進(jìn)行拍攝并對(duì)要識(shí)別的圖像進(jìn)行分層圖像處理,并通過圖層合并進(jìn)行效果補(bǔ)償,能夠提升圖像質(zhì)量,提高識(shí)別的準(zhǔn)確率。
【專利附圖】
【附圖說明】
[0017]此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0018]圖1是本申請(qǐng)實(shí)施例的一種識(shí)別印刷品上字符的方法的流程圖;
[0019]圖2是本申請(qǐng)實(shí)施例的圖1中的步驟S102中,去除噪點(diǎn)處理的步驟SI的流程圖;
[0020]圖3是本申請(qǐng)實(shí)施例的圖2中的步驟S201的流程圖;
[0021]圖4是本申請(qǐng)實(shí)施例的圖1中的步驟S102中,對(duì)比度增強(qiáng)處理的步驟S2的流程圖;
[0022]圖5是本申請(qǐng)實(shí)施例的圖1中的步驟S103的流程圖;
[0023]圖6是本申請(qǐng)實(shí)施例的圖1中的步驟S104的流程圖;
[0024]圖7是本申請(qǐng)實(shí)施例的圖6中的步驟S601的流程圖;以及
[0025]圖8是本申請(qǐng)實(shí)施例的一種識(shí)別印刷品上字符的裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0026]本申請(qǐng)的主要思想在于,通過對(duì)帶有文字的印刷品進(jìn)行拍攝,將得到的圖像復(fù)制成至少兩幅圖像分別進(jìn)行不同的圖像處理得到分層圖像,并對(duì)各分層圖像進(jìn)行圖層合并,得到處理后的圖像,再對(duì)所述處理后的圖像進(jìn)行文本提取和文字識(shí)別。
[0027]為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0028]根據(jù)本申請(qǐng)的實(shí)施例,提供了一種識(shí)別印刷品上字符的方法。
[0029]本申請(qǐng)可以應(yīng)用于對(duì)印有字符的印刷品上的字符進(jìn)行識(shí)別,例如,可以用于證件的識(shí)別,尤其是對(duì)過塑處理過的證件進(jìn)行識(shí)別。
[0030]參考圖1,圖1是本申請(qǐng)實(shí)施例的一種識(shí)別印刷品上字符的方法流程圖:如圖1所示,在步驟SlOl中,對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像。
[0031]在進(jìn)行拍攝時(shí),由于圖像采集設(shè)備參差不齊,拍攝時(shí)可能受到各個(gè)方面的影響,例如曝光時(shí)間、曝光補(bǔ)償?shù)龋赡軐?dǎo)致拍攝出來的圖像效果不好,同時(shí)也會(huì)影響后續(xù)對(duì)圖像的處理。因此,在進(jìn)行拍攝時(shí),可以在拍攝前按預(yù)定條件進(jìn)行曝光設(shè)置,得到效果更好的圖片。通過對(duì)同類型圖像在相同環(huán)境(例如光強(qiáng)等條件)下進(jìn)行拍攝時(shí)曝光相關(guān)的參數(shù)設(shè)置不同而產(chǎn)生不同效果的情況進(jìn)行統(tǒng)計(jì),并設(shè)定所述預(yù)定條件。
[0032]在步驟S102中,對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像。也就是說,將拍攝的圖像復(fù)制成多份,對(duì)得到的每一幅復(fù)制圖像分別進(jìn)行圖像處理,并且對(duì)每一幅圖像所進(jìn)行的圖像處理是不同的,這就相當(dāng)于對(duì)原圖像進(jìn)行分層處理,從而獲得經(jīng)過不同處理的分層圖像。
[0033]所述不同的圖像處理可以包括:去除噪點(diǎn)處理、對(duì)比度增強(qiáng)處理。還可以包括其他的圖像處理,例如,路徑著色處理、圖形切割處理、紋理識(shí)別預(yù)處理等,經(jīng)過這些圖像處理后,就會(huì)得到多幅分層圖像。
[0034]步驟S102可以進(jìn)一步包括步驟:S1對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理得到第一分層圖像;以及步驟S2對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理得到第二分層圖像。
[0035]圖2為進(jìn)行去除噪點(diǎn)處理的步驟SI的具體流程圖,如圖2所示,步驟SI可以包括:
[0036]步驟S201,識(shí)別所述復(fù)制圖像中的噪點(diǎn)。如圖3所示,步驟S201可以進(jìn)一步包括子步驟 S301-S303。
[0037]在子步驟S301中,將所述復(fù)制圖像中每個(gè)像素點(diǎn)的灰度值與其左右兩個(gè)相鄰像素點(diǎn)的灰度值相加并取平均值作為每個(gè)像素點(diǎn)的計(jì)算灰度值。
[0038]在子步驟S302中,判斷每個(gè)像素點(diǎn)的灰度值與其計(jì)算灰度值的差值的絕對(duì)值是否在預(yù)定閾值范圍內(nèi)。
[0039]在子步驟S303中,將灰度值與計(jì)算灰度值的差值的絕對(duì)值超出預(yù)定閾值范圍的像素點(diǎn)識(shí)別為噪點(diǎn)。其中預(yù)定閾值范圍可以根據(jù)具體的條件進(jìn)行設(shè)置,或者還可以根據(jù)以往進(jìn)行噪點(diǎn)識(shí)別及處理過程中累積的經(jīng)驗(yàn)值進(jìn)行設(shè)置。
[0040]步驟S202,在識(shí)別出所述復(fù)制圖像中的噪點(diǎn)后,將每個(gè)噪點(diǎn)的灰度值與其周圍相鄰的八個(gè)像素點(diǎn)的灰度值相加并取平均值作為每個(gè)噪點(diǎn)的去噪灰度值。由于像素點(diǎn)是以縱橫兩個(gè)方向均勻排布的,因此,每個(gè)像素點(diǎn)都會(huì)有八個(gè)相鄰的像素點(diǎn),因此,將每個(gè)噪點(diǎn)的灰度值與其相鄰的八個(gè)像素點(diǎn)的灰度值進(jìn)行求和在求平均值作為該噪點(diǎn)的去噪灰度值。
[0041]步驟S203,將所述復(fù)制圖像中每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值得到第一分層圖像。得到每個(gè)噪點(diǎn)的去噪灰度值后,將所述復(fù)制圖像中的每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值,而其他的像素點(diǎn)(不是噪點(diǎn))的灰度值不變,得到經(jīng)去除噪點(diǎn)處理的第一分層圖像。
[0042]數(shù)字圖像在采集過程中,由于照明或物體本身等原因,經(jīng)常會(huì)出現(xiàn)目標(biāo)區(qū)域?qū)Ρ榷鹊偷那闆r,可對(duì)圖像進(jìn)行對(duì)比度增強(qiáng)處理。
[0043]圖4為對(duì)所述復(fù)制圖像進(jìn)行對(duì)比度處理的步驟S2的流程圖,如圖4所示,步驟S2可以包括:
[0044]步驟S401,將所述復(fù)制圖像劃分為至少兩個(gè)子區(qū)域。
[0045]進(jìn)行對(duì)比度增強(qiáng)處理的基本思想,是將圖像按灰度區(qū)間劃分為兩段或多段,分別進(jìn)行灰度變換,從而增強(qiáng)圖像的對(duì)比度。
[0046]首先,可以通過對(duì)復(fù)制圖像的灰度直方圖的分析確定劃分子區(qū)域的數(shù)目以及劃分的子區(qū)域的邊界閾值。灰度直方圖是統(tǒng)計(jì)圖像中不同灰度級(jí)的像素出現(xiàn)頻率的,因此根據(jù)灰度直方圖可以得到所述復(fù)制圖像灰度值的分布情況,并根據(jù)所述復(fù)制圖像灰度值的分布情況來確定將圖像劃分為多個(gè)子區(qū)域,并確定劃分區(qū)域的邊界閾值以確定相鄰兩個(gè)區(qū)域的分段點(diǎn),并按分段點(diǎn)將所述復(fù)制圖像分成至少兩個(gè)子區(qū)域。在子區(qū)域的劃分上,可以根據(jù)圖像的灰度直方圖有多少波峰或波谷來確定劃分子區(qū)域的數(shù)目,并以谷作為子區(qū)域邊界閾值。在邊界閾值的設(shè)定方面,可以根據(jù)對(duì)圖像引擎進(jìn)行訓(xùn)練來確定,即,對(duì)大量類似要識(shí)別圖像的圖像進(jìn)行訓(xùn)練以確定的合適的邊界閾值,而分段點(diǎn)的確定可以根據(jù)選取的邊界閾值進(jìn)行計(jì)算,或者還可以在直方圖上設(shè)定閾值來確定分段點(diǎn)。
[0047]步驟S402,對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,以得到第二分層圖像。
[0048]對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,具體而言,就是根據(jù)需要,將每個(gè)子區(qū)域中各個(gè)像素按照預(yù)定規(guī)則進(jìn)行灰度值的變換,以突出感興趣目標(biāo)所在的灰度區(qū)間,相對(duì)抑制那些不感興趣的灰度空間,可以采用線性變換,即利用預(yù)設(shè)線性變換公式進(jìn)行灰度值的變換,并得到第二分層圖像。
[0049]在步驟S103中,將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像。
[0050]圖5為步驟S103的具體流程圖,如圖5所示,步驟S103可以包括:
[0051]步驟S501,對(duì)所述各分層圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值取中值,得到每個(gè)像素點(diǎn)的灰度值中值。
[0052]具體來說,在上述的步驟S102中得到的每幅分層圖像都是針對(duì)各相同的復(fù)制圖像分別進(jìn)行不同圖像處理后的圖像,因此各幅分層圖像中的像素點(diǎn)仍然還是原來的像素點(diǎn),表達(dá)的還是相同的圖形信息,只是經(jīng)過不同的圖像處理后,每個(gè)像素點(diǎn)的灰度可能產(chǎn)生了變化,因此,對(duì)每幅分層圖像中相對(duì)應(yīng)的像素點(diǎn)的灰度值取中值,可以為每個(gè)像素點(diǎn)確定一個(gè)合適的新灰度值。
[0053]步驟S502,將每個(gè)像素點(diǎn)的灰度值替換為該像素點(diǎn)的灰度值中值,得到處理后圖像。
[0054]具體來說,可以在拍攝得到的圖像的原圖像或另一幅復(fù)制圖像中,將得到的每個(gè)像素點(diǎn)的灰度值中值作為該像素點(diǎn)的新灰度值,將每個(gè)像素點(diǎn)的灰度值調(diào)整為該像素點(diǎn)的灰度值中值,得到處理后圖像,這樣就完成了分層圖像的圖層合并,得到了處理后的圖像??蛇x地,在完成了圖像合并后,考慮到圖像質(zhì)量的需要,還可以將得到的所述處理后圖像中符合預(yù)定條件的像素點(diǎn)進(jìn)行重新的灰度著色,從而在圖像上更加強(qiáng)地將圖像進(jìn)行標(biāo)注,例如,將趨近于純黑像素(灰度值超過一定值的點(diǎn))的像素點(diǎn)的灰度值加2,以提升偏黑像素的顏色深度。
[0055]對(duì)得到的處理后圖像,還可以進(jìn)行與原圖像的對(duì)比,將所述處理后的圖像每個(gè)像素點(diǎn)的灰度值與原圖像的對(duì)應(yīng)像素點(diǎn)的灰度值相減得到每個(gè)像素點(diǎn)的灰度值差,并判斷所述灰度值差的絕對(duì)值是否超過預(yù)定閾值,如果該點(diǎn)的灰度值差超過預(yù)定閾值,則還需對(duì)該點(diǎn)的灰度值進(jìn)行灰度值的調(diào)整。
[0056]在步驟S104中,從所述處理后圖像中提取每個(gè)字符的圖像。
[0057]參考圖6,圖6為步驟S104的具體流程圖。對(duì)每個(gè)字符進(jìn)行提取,可以先通過紋理分析確定所述處理后圖像中文本圖像的位置,再對(duì)文本圖像進(jìn)行字符分割以提取這每個(gè)字符。
[0058]如圖6所示,步驟S104可以包括步驟S601和步驟S602。
[0059]在步驟S601中,獲取所述處理后圖像中的文本圖像的位置??蓞⒖紙D7所示,圖7為步驟S601的具體流程圖,具體而言,可以包括以下步驟:
[0060]步驟S701,通過邊緣檢測(cè)識(shí)別出每行像素中的邊緣紋理。所述邊緣紋理,是指圖像中灰度發(fā)生急劇變化的區(qū)域,可以通過設(shè)置一個(gè)預(yù)設(shè)閾值變化范圍來進(jìn)行識(shí)別,即,識(shí)別出灰度變化超出所述預(yù)設(shè)閾值變化范圍的區(qū)域。
[0061]步驟S702,對(duì)每行像素的邊緣紋理做直方圖,并根據(jù)對(duì)所述直方圖的分析確定邊緣基元的識(shí)別閾值。所述邊緣基元可以為灰度值在預(yù)定閾值范圍內(nèi)的像素點(diǎn)。所述邊緣基元的識(shí)別閾值,可以為利用自適應(yīng)閾值算法進(jìn)行計(jì)算得到的動(dòng)態(tài)閾值。
[0062]步驟S703,根據(jù)所述邊緣基元的識(shí)別閾值統(tǒng)計(jì)每行中邊緣基元數(shù)目,并記錄每行邊緣基元的開始位置和結(jié)束位置。
[0063]步驟S704,識(shí)別所述處理后圖像中的非空白行??梢愿鶕?jù)所述處理后圖像的灰度直方圖,將灰度值極差(灰度值最大值與最小值的差)低于預(yù)定閾值的行識(shí)別為空白行,其余識(shí)別為非空白行。例如,將灰度值極差低于直方圖中最大灰度值與最小灰度值之間振幅(極差)的5%的行識(shí)別為空白行。在后續(xù)的處理中將識(shí)別出的空白行作為空白背景,不做后續(xù)處理,后續(xù)處理中只將非空白行作為處理目標(biāo)。其中,預(yù)定閾值可以為根據(jù)對(duì)多種樣本圖片進(jìn)行訓(xùn)練后得到的變量,例如,針對(duì)于目前已知訓(xùn)練后的證照?qǐng)D片而言,可以將預(yù)定閾值設(shè)為灰度直方圖中最大灰度值與最小灰度值之間振幅的5%,針對(duì)其它類型的圖片識(shí)別,該變量可以根據(jù)對(duì)其他類型圖像進(jìn)行訓(xùn)練的結(jié)果進(jìn)行配置。
[0064]步驟S705,判斷當(dāng)前非空白行是否滿足預(yù)設(shè)條件,如果滿足,則進(jìn)行下一非空白行的檢測(cè)。其中,所述預(yù)設(shè)條件,可以將大量字符樣本送入BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練學(xué)習(xí),根據(jù)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后得到的結(jié)果來確定,例如,判斷每行中的邊緣基元的數(shù)目是否達(dá)到預(yù)定數(shù)目。
[0065]步驟S706,當(dāng)連續(xù)檢測(cè)到超過預(yù)定數(shù)目的非空白行滿足所述預(yù)設(shè)條件時(shí),根據(jù)每一非空白行的邊緣基元的開始位置和結(jié)束位置確定文本圖像的位置。
[0066]對(duì)于上述確定所述處理后圖像中的文本圖像的位置的步驟S701-S706,執(zhí)行順序不限于上述一種,還可以采用其他的順序執(zhí)行,例如,可以先識(shí)別所述處理后圖像中的非空白行,再對(duì)識(shí)別出的非空白行進(jìn)行其他的步驟識(shí)別、判斷等。
[0067]在步驟S602中,對(duì)所述文本圖像進(jìn)行字符分割,提取出所述文本圖像中的每個(gè)字符的圖像。
[0068]對(duì)所述文本圖像進(jìn)行分割可以利用投影法進(jìn)行行切分和字切分以提取出所述文本圖像中每個(gè)字符的圖像。行切分,就是將一行一行的字符切分出來,形成單行字符文本圖像??梢匝匦械姆较蛩酵队?,通過識(shí)別文字行與行之間的空白進(jìn)行行切分。字切分,就是在進(jìn)行了行切分并得到的單行字符文本圖像后,將單個(gè)字符圖像從每個(gè)單行字符文本圖像中切分出來,得到每個(gè)字符的單個(gè)字符圖像。
[0069]在步驟S105中,對(duì)提取出的每個(gè)字符的圖像進(jìn)行文字識(shí)別。
[0070]可以利用BP神經(jīng)網(wǎng)絡(luò)對(duì)所述字符進(jìn)行文字識(shí)別,將每個(gè)字符的圖像送入BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)中進(jìn)行字符的識(shí)別。
[0071]其中,BP神經(jīng)網(wǎng)絡(luò)中的預(yù)先對(duì)字符樣本的訓(xùn)練可以通過的對(duì)字符樣本的圖像矩陣進(jìn)行訓(xùn)練的方法,即,先對(duì)字符樣本的圖像進(jìn)行歸一化處理,得到每個(gè)字符樣本的圖像矩陣,再對(duì)所述每個(gè)字符樣本的圖像矩陣進(jìn)行BP神經(jīng)網(wǎng)絡(luò)(誤差反向傳播)訓(xùn)練學(xué)習(xí)。
[0072]在進(jìn)行每個(gè)字符圖像的識(shí)別時(shí)將所述每個(gè)字符的圖像送入BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行字符的識(shí)別。
[0073]本申請(qǐng)還提供了一種識(shí)別印刷品上字符的裝置,圖8是根據(jù)本申請(qǐng)實(shí)施例的識(shí)別印刷品上字符的裝置800的結(jié)構(gòu)框圖,如圖所示該裝置800可以包括:采集模塊810,分層處理模塊820,圖層合并模塊830,提取模塊840,以及識(shí)別模塊850。
[0074]采集模塊810可以用于對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像。
[0075]分層處理模塊820可以用于對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像。
[0076]圖層合并模塊830可以用于將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像。
[0077]提取模塊840可以用于從所述處理后圖像中提取每個(gè)字符的圖像。
[0078]識(shí)別模塊850可以用于對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。
[0079]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述采集模塊810可以進(jìn)一步用于在進(jìn)行拍攝時(shí)按預(yù)定條件進(jìn)行曝光設(shè)置。
[0080]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述分層處理模塊820可以包括去噪處理模塊和對(duì)比度增強(qiáng)模塊。
[0081]去噪處理模塊可以用于對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像。
[0082]對(duì)比度增強(qiáng)模塊可以用于對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像。
[0083]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述去噪處理模塊可以包括:噪點(diǎn)識(shí)別模塊,去噪灰度值獲取模塊,以及噪點(diǎn)去除模塊。
[0084]噪點(diǎn)識(shí)別模塊可以用于識(shí)別所述復(fù)制圖像中的噪點(diǎn)。
[0085]去噪灰度值獲取模塊可以用于將每個(gè)噪點(diǎn)的灰度值與其周圍相鄰的八個(gè)像素點(diǎn)的灰度值相加并取平均值作為每個(gè)噪點(diǎn)的去噪灰度值。
[0086]噪點(diǎn)去除模塊可以用于將所述復(fù)制圖像中每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值以得到第一分層圖像。
[0087]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述噪點(diǎn)識(shí)別模塊可以包括:計(jì)算子模塊,判斷子模塊,以及識(shí)別子模塊。
[0088]計(jì)算子模塊可以用于將所述復(fù)制圖像中每個(gè)像素點(diǎn)的灰度值與其左右兩個(gè)相鄰像素點(diǎn)的灰度值相加并取平均值作為每個(gè)像素點(diǎn)的計(jì)算灰度值。
[0089]判斷子模塊可以用于判斷每個(gè)像素點(diǎn)的灰度值與其計(jì)算灰度值的差值的絕對(duì)值是否在預(yù)定閾值范圍內(nèi)。
[0090]識(shí)別子模塊可以用于將灰度值與計(jì)算灰度值的差值絕對(duì)值超出預(yù)定閾值范圍的像素點(diǎn)識(shí)別為噪點(diǎn)。
[0091]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述對(duì)比度增強(qiáng)模塊可以包括圖像分區(qū)模塊和灰度調(diào)整模塊。
[0092]圖像分區(qū)模塊可以用于將所述復(fù)制圖像劃分為至少兩個(gè)子區(qū)域。
[0093]灰度調(diào)整模塊可以用于對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,以得到第二分層圖像。
[0094]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述合并模塊830可以包括:取值模塊和灰度值替換模塊。
[0095]取值模塊可以用于對(duì)所述分層圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值取中值,得到每個(gè)像素點(diǎn)的灰度值中值。
[0096]灰度值替換模塊可以用于將每個(gè)像素點(diǎn)的灰度值替換為該像素點(diǎn)的灰度值中值,得到處理后圖像。
[0097]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述提取模塊840可以包括:
[0098]位置獲取模塊,可以用于獲取所述處理后圖像中的文本圖像的位置;
[0099]字符分割模塊,可以用于對(duì)所述文本圖像進(jìn)行字符分割,提取出所述文本圖像中的每個(gè)字符的圖像。
[0100]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述位置獲取模塊可以進(jìn)一步包括:邊緣檢測(cè)模塊,閾值獲取模塊,統(tǒng)計(jì)記錄模塊,非空白行識(shí)別模塊,條件判斷模塊,以及位置確定模塊。
[0101]邊緣檢測(cè)模塊可以用于通過邊緣檢測(cè)識(shí)別出每行像素中的邊緣紋理。其中,所述邊緣紋理可以為灰度值發(fā)生劇烈變化的區(qū)域。
[0102]閾值獲取模塊可以用于對(duì)每行像素的邊緣紋理做直方圖,并根據(jù)對(duì)所述直方圖分析確定邊緣基元的識(shí)別閾值。
[0103]統(tǒng)計(jì)記錄模塊可以用于根據(jù)所述邊緣基元的識(shí)別閾值統(tǒng)計(jì)每行上邊緣基元的數(shù)量,并記錄每行邊緣基元的開始位置和結(jié)束位置。
[0104]非空白行識(shí)別模塊可以用于識(shí)別所述處理后圖像中的非空白行。
[0105]條件判斷模塊可以用于判斷當(dāng)前非空白行是否滿足預(yù)設(shè)條件,如果滿足,則進(jìn)行下一非空白行的檢測(cè)。
[0106]位置確定模塊可以用于當(dāng)連續(xù)檢測(cè)到超過預(yù)定數(shù)目的非空白行滿足所述預(yù)設(shè)條件時(shí),根據(jù)每一非空白行的邊緣基元的開始位置和結(jié)束位置確定文本圖像的位置。
[0107]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述識(shí)別模塊850可以進(jìn)一步用于,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)所述每個(gè)字符的圖像進(jìn)行字符識(shí)別。
[0108]由于本實(shí)施例的裝置所實(shí)現(xiàn)的功能基本相應(yīng)于前述圖1至圖7所示的方法實(shí)施例,故本實(shí)施例的描述中未詳盡之處,可以參見前述實(shí)施例中的相關(guān)說明,在此不做贅述。
[0109]在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
[0110]內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
[0111]計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
[0112]還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。
[0113]本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0114]以上所述僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來說,本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。
【權(quán)利要求】
1.一種識(shí)別印刷品上字符的方法,其特征在于,包括: 對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像; 對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像; 將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像; 從所述處理后圖像中提取每個(gè)字符的圖像;以及 對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像,包括:在進(jìn)行拍攝時(shí)按預(yù)定條件進(jìn)行曝光設(shè)置。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述每一幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像,包括: 對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像;以及 對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像,包括: 識(shí)別所述復(fù)制圖像中的噪點(diǎn); 將每個(gè)噪點(diǎn)的灰度值與其周圍相鄰的八個(gè)像素點(diǎn)的灰度值相加并取平均值作為每個(gè)噪點(diǎn)的去噪灰度值;以及 將所述復(fù)制圖像中每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值以得到第一分層圖像。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,識(shí)別所述復(fù)制圖像中的噪點(diǎn)包括: 將所述復(fù)制圖像中每個(gè)像素點(diǎn)的灰度值與其左右兩個(gè)相鄰像素點(diǎn)的灰度值相加并取平均值作為每個(gè)像素點(diǎn)的計(jì)算灰度值; 判斷每個(gè)像素點(diǎn)的灰度值與其計(jì)算灰度值的差值的絕對(duì)值是否在預(yù)定閾值范圍內(nèi);以及 將灰度值與計(jì)算灰度值的差值的絕對(duì)值超出預(yù)定閾值范圍的像素點(diǎn)識(shí)別為噪點(diǎn)。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像,包括: 將所述復(fù)制圖像劃分為至少兩個(gè)子區(qū)域;以及 對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,以得到第二分層圖像。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述分層圖像進(jìn)行合并,以得到處理后圖像,包括: 對(duì)所述分層圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值取中值,得到每個(gè)像素點(diǎn)的灰度值中值;以及 將每個(gè)像素點(diǎn)的灰度值替換為該像素點(diǎn)的灰度值中值,以得到處理后圖像。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取出所述處理后圖像中每個(gè)字符的圖像,包括: 獲取所述處理后圖像中的文本圖像的位置;以及 對(duì)所述文本圖像進(jìn)行字符分割,提取出所述文本圖像中的每個(gè)字符的圖像。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,獲取所述處理后圖像中的文本圖像的位置,包括: 通過邊緣檢測(cè)識(shí)別出每行像素中的邊緣紋理; 對(duì)每行像素的邊緣紋理做直方圖,并根據(jù)對(duì)所述直方圖的分析確定邊緣基元的識(shí)別閾值; 根據(jù)所述邊緣基元的識(shí)別閾值統(tǒng)計(jì)每行的邊緣基元的數(shù)目,并記錄每行邊緣基元的開始位置和結(jié)束位置; 識(shí)別所述處理后圖像中的非空白行; 判斷當(dāng)前非空白行是否滿足預(yù)設(shè)條件,如果滿足,則進(jìn)行下一非空白行的檢測(cè);以及當(dāng)連續(xù)檢測(cè)到超過預(yù)定數(shù)目的非空白行滿足所述預(yù)設(shè)條件時(shí),根據(jù)每一非空白行的邊緣基元的開始位置和結(jié)束位置確定文本圖像的位置。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)另IJ,包括:利用BP神經(jīng)網(wǎng)絡(luò)對(duì)所述每個(gè)字符的圖像進(jìn)行字符識(shí)別。
11.一種識(shí)別印刷品上字符的裝置,其特征在于,包括: 采集模塊,用于對(duì)所述印刷品進(jìn)行拍攝以獲取要識(shí)別的圖像; 分層處理模塊,用于對(duì)所述圖像進(jìn)行復(fù)制以得到至少兩幅復(fù)制圖像,并對(duì)每幅復(fù)制圖像分別進(jìn)行不同的圖像處理以得到至少兩幅分層圖像; 圖層合并模塊,用于將得到的分層圖像進(jìn)行圖層合并,以得到處理后圖像; 提取模塊,用于從所述處理后圖像中提取每個(gè)字符的圖像;以及 識(shí)別模塊,用于對(duì)提取出的每個(gè)字符的圖像進(jìn)行字符識(shí)別。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述采集模塊,進(jìn)一步用于在進(jìn)行拍攝時(shí)按預(yù)定條件進(jìn)行曝光設(shè)置。
13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述分層模塊包括: 去噪處理模塊,用于對(duì)所述復(fù)制圖像中的一幅進(jìn)行去除噪點(diǎn)處理以得到第一分層圖像;以及 對(duì)比度增強(qiáng)模塊,用于對(duì)所述復(fù)制圖像中的另一幅進(jìn)行對(duì)比度增強(qiáng)處理以得到第二分層圖像。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述去噪處理模塊,包括: 噪點(diǎn)識(shí)別模塊,用于識(shí)別所述復(fù)制圖像中的噪點(diǎn); 去噪灰度值獲取模塊,用于將每個(gè)噪點(diǎn)的灰度值與其周圍相鄰的八個(gè)像素點(diǎn)的灰度值相加并取平均值作為每個(gè)噪點(diǎn)的去噪灰度值;以及 噪點(diǎn)去除模塊,用于將所述復(fù)制圖像中每個(gè)噪點(diǎn)的灰度值替換為該噪點(diǎn)的去噪灰度值以得到第一分層圖像。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述噪點(diǎn)識(shí)別模塊包括: 計(jì)算子模塊,用于將所述復(fù)制圖像中每個(gè)像素點(diǎn)的灰度值與其左右兩個(gè)相鄰像素點(diǎn)的灰度值相加并取平均值作為每個(gè)像素點(diǎn)的計(jì)算灰度值; 判斷子模塊,用于判斷每個(gè)像素點(diǎn)的灰度值與其計(jì)算灰度值的差值的絕對(duì)值是否在預(yù)定閾值范圍內(nèi);以及 識(shí)別子模塊,用于將灰度值與計(jì)算灰度值的差值的絕對(duì)值超出預(yù)定閾值范圍的像素點(diǎn)識(shí)別為噪點(diǎn)。
16.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述對(duì)比度增強(qiáng)模塊包括: 圖像分區(qū)模塊,用于將所述復(fù)制圖像劃分為至少兩個(gè)子區(qū)域;以及 灰度調(diào)整模塊,用于對(duì)每個(gè)子區(qū)域分別進(jìn)行灰度調(diào)整,以得到第二分層圖像。
17.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述合并模塊包括: 取值模塊,用于對(duì)所述分層圖像中相對(duì)應(yīng)像素點(diǎn)的灰度值取中值,得到每個(gè)像素點(diǎn)的灰度值中值;以及 灰度值替換模塊,用于將每個(gè)像素點(diǎn)的灰度值替換為該像素點(diǎn)的灰度值中值,得到處理后圖像。
18.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述提取模塊包括: 位置獲取模塊,用于獲取所述處理后圖像中的文本圖像的位置;以及 字符分割模塊,用于對(duì)所述文本圖像進(jìn)行字符分割,提取出所述文本圖像中的每個(gè)字符的圖像。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述位置獲取模塊包括: 邊緣檢測(cè)模塊,用于通過邊緣檢測(cè)識(shí)別出每行像素中的邊緣紋理; 閾值獲取模塊,用于對(duì)每行像素的邊緣紋理做直方圖,并根據(jù)對(duì)所述直方圖分析確定邊緣基元的識(shí)別閾值; 統(tǒng)計(jì)記錄模塊,用于根據(jù)所述邊緣基元的識(shí)別閾值統(tǒng)計(jì)每行上邊緣基元的數(shù)量,并記錄每行邊緣基元的開始位置和結(jié)束位置; 非空白行識(shí)別模塊,用于識(shí)別所述處理后圖像中的非空白行; 條件判斷模塊,用于判斷當(dāng)前非空白行是否滿足預(yù)設(shè)條件,如果滿足,則進(jìn)行下一非空白行的檢測(cè);以及 位置確定模塊,用于當(dāng)連續(xù)檢測(cè)到超過預(yù)定數(shù)目的非空白行滿足所述預(yù)設(shè)條件時(shí),根據(jù)每一非空白行的邊緣基元的開始位置和結(jié)束位置確定文本圖像的位置。
20.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述識(shí)別模塊進(jìn)一步用于,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)所述每個(gè)字符的圖像進(jìn)行字符識(shí)別。
【文檔編號(hào)】G06K9/20GK104346609SQ201310331468
【公開日】2015年2月11日 申請(qǐng)日期:2013年8月1日 優(yōu)先權(quán)日:2013年8月1日
【發(fā)明者】侯放 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司