本發(fā)明涉及計算機識別文本圖像的技術領域,尤其涉及基于筆畫粗細的手寫體與印刷體的鑒別算法。
背景技術:
文檔圖像中主要包含了兩類文字,手寫體和印刷體。對人類而言,它們雖然形體有區(qū)別,卻都能夠傳遞相同的文字本身蘊含的信息。然而當計算機處理手寫體和印刷體時,則會遇到很多的問題。首先,它們的識別效率不一樣。印刷體只包含數(shù)種字體,相同的字符用某種特定字體總是呈現(xiàn)相同的形體,因此目前印刷體的識別率達到99%以上。而手寫體的識別率還需要不斷研究,各類新的特征統(tǒng)計和分類方法爭相被采用,以提高手寫體的識別率。其次,它們的識別算法不通用,將它們混合起來,可能降低印刷體的識別率卻不能提高手寫體的識別率。另外,特殊場合的需要從文檔圖像中提取手寫字符,比如支票的簽名識別,以及手寫文檔的筆跡鑒別等。因此,手寫體、印刷體的鑒別成為文檔圖像處理中重要的組成部分。
目前這兩類字符的分類主要依靠的是版面分析的方法和局部特征的方法。現(xiàn)有技術中,有人用提取文本行的特征區(qū)分手寫體和印刷體,也有人進一步使用了文本行的結構特征和統(tǒng)計特征。對于整行都是同一類型時,這種方法的準確率較高,但是出現(xiàn)手寫體和印刷體混合在同一行中時,該類方法就不夠精細了。使用局部特征的方法提取特征的區(qū)域通常較小,因此可能出現(xiàn)特征區(qū)分度不夠,分類結果不準確的問題。
現(xiàn)有技術中,也有文獻提供了手寫體的識別方法,例如:中國專利201310286449.4公開了一種手寫體數(shù)字識別方法,其技術方案是:在手寫體數(shù)字進行降維的過程中,對于每一個圖像數(shù)據都通過K個近鄰來線性表示,而對每一個圖像數(shù)據通過K個近鄰線性表示時的加權系數(shù)通過正交匹配算法獲??;通過構造加權系數(shù)矩陣對訓練圖像數(shù)據降維,對待識別圖像則通過加權系數(shù)向量及其K個近鄰降維后的向量數(shù)據進行降維;該手寫體數(shù)字識別方法,提高了手寫體數(shù)字識別的識別率,但并不能有效識別印刷體與手寫體。中國專利201210313007.X提供了一種觸摸屏筆畫粗細識別方法,該方法包括以下步驟:實時采集觸摸屏表面的圖像;判斷所采集的圖像中是否存在亮度值大于預設亮度閾值的像素點;若是,則計算所述像素點的個數(shù)總和以及重心坐標,并將所述像素點的個數(shù)總和以及重心坐標作為筆畫粗細參數(shù)以及觸摸點坐標;該現(xiàn)有技術降低了識別成本,但也沒有解決如何將一行中既包含手寫體也包含印刷體時的鑒別問題。
技術實現(xiàn)要素:
為克服現(xiàn)有技術中存在的一行中既有手寫體也有印刷體時,計算機識別手寫體與印刷體比較困難的問題,本發(fā)明提供了一種基于筆畫粗細的手寫體與印刷體的鑒別算法。本發(fā)明在版面分析中加入筆畫粗細特征,能實現(xiàn)更精細的版面分析。
本發(fā)明的技術方案是:一種基于筆畫粗細的手寫體與印刷體的鑒別算法,其特征在于:通過統(tǒng)計鄰域內邊緣像素數(shù)目獲得筆畫粗細的特征,再結合版面分析將圖像文檔分割為粗細均勻的區(qū)域,然后計算這些區(qū)域內筆畫粗細的統(tǒng)計特征,最后使用SVM判斷手寫體與印刷體類別。
進一步,上述基于筆畫粗細的手寫體與印刷體的鑒別算法,具體包括以下步驟:
001,文檔圖像預處理:將文檔圖像進行灰度校正、顏色過濾;
002,計算筆畫的粗細:統(tǒng)計一個區(qū)域中出現(xiàn)的邊緣像素數(shù)目得出筆畫的粗細;
003,將文檔圖像分割成判斷區(qū)域:利用筆畫粗細的特征結合版面分析,將文檔圖像分割成比文本行單位小且比字符單位大的判斷區(qū)域;
004,區(qū)域判斷:統(tǒng)計判斷區(qū)域中字符寬、高、間隔,以及筆畫粗細的方差,使用線性SVM分類,當寬、高、間隔的方差小而筆畫粗細的方差較大時判斷為印刷體,否則為手寫體。
進一步,上述步驟004中筆畫粗細的計算方法包括如下步驟:
401:獲得文檔圖像的邊緣:所述獲取的邊緣為8連通;所述8連通是指以定點像素(x,y)為中心,其周圍上下左右+兩條對角線上的8個像素組成的8鄰域;所述圖像的邊緣點是由像素灰度值及其相鄰像素的灰度值來確定的;
402:計算細筆畫:所述細筆畫的邊緣像素i*i鄰域中只有邊緣和背景;定義F是筆畫的粗細值,則此類細筆畫的粗細值其中,Ni是i*i鄰域內邊緣像素的數(shù)量,當周圍所含邊緣像素數(shù)目Ni為i時,此時筆畫粗細為1;
403:計算粗筆畫:首先對粗筆畫進行形態(tài)學的腐蝕操作,每次使用半徑為1的圓結構腐蝕,循環(huán)腐蝕操作就j次,直至處理后的筆畫的邊緣像素i*i鄰域中只有邊緣和背景,此時筆畫粗細按照步驟2中的公式進行計算,所得的筆畫粗細值為2*j+F。
在上述步驟403中,為了提高計算粗筆畫的速度,可使用圖像金字塔結構,在計算粗筆畫前,先將圖像縮小為原來的1/n,然后再進行形態(tài)學的腐蝕操作和計算筆畫粗細值,以減少計算次數(shù),最后所得的筆畫值應為計算值的n倍。n取偶數(shù),優(yōu)選為n=2。
進一步,所述步驟001中預處理中的灰度校正是采用雙閾值二值化方法,以處理掃描或者拍照方式獲得的文檔圖像存在光照不均勻的情況;所述雙閾值二值化方法包括高低兩個閾值,所述高低閾值分別為60和20。
進一步,所述顏色過濾是去除黑色之外的其他顏色,如紅色、綠色、藍色等。
進一步,步驟402中,所述緣像素i*i鄰域中,i大于2,優(yōu)選為i取奇數(shù),進一步優(yōu)選為i=3。
進一步,步驟403中,所述腐蝕操作過程包括以下步驟:
501:掃描文本圖像,找到第一個筆畫內部的目標像素點;
502:用半徑為1的圓結構覆蓋目標像素點;
503:判斷該半徑為1的圓結構所覆蓋范圍內的像素是否全部為1:如果是,則腐蝕后的文本圖像中的相同位置的像素值為1;如果不是,則腐蝕后的文本圖像中的相同位置的像素值為0;
504:重復步驟502和503,直至所有文本圖像中的像素處理完成。
進一步,所述步驟002中還包括,在計算筆畫的粗細后,再采用卷積神經網絡提取筆畫隱含的本質特征。
與現(xiàn)有技術相比,本發(fā)明的有益效果是:
1、本發(fā)明提出的方法通過統(tǒng)計一個區(qū)域中出現(xiàn)的邊緣像素數(shù)目獲得筆畫的粗細,具有定義明確、計算簡便的特點。
2、利用本發(fā)明提供的筆畫粗細特征結合版面分析,能夠將文檔圖像中的文本行進一步分割為粗細均勻的區(qū)域,該類區(qū)域較文本行更細致,較單個字符范圍廣,因此能夠提取出比文本行和單個字符更穩(wěn)定的特征,從而獲得更好地分類效果。
3、本發(fā)明采用統(tǒng)計判斷區(qū)域中字符寬、高、間隔,以及筆畫粗細的方差,使用線性SVM分類,利用方差來判斷手寫體和印刷體,具有判斷準確、準確率高的特點。
附圖說明
圖1是字體二值化的圖像示意圖;
圖2是字體二值化的圖像的邊緣示意圖;
圖3是細筆畫區(qū)域示意圖;
圖4是粗筆畫區(qū)域示意圖;
圖5是筆畫粗細為1的示例;
圖6是二值化的圖像腐蝕后的結果示意圖;
圖7是二值化的圖像腐蝕后的邊緣示意圖。
具體實施方式
以下結合附圖和實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
實施例1
一種基于筆畫粗細的手寫體與印刷體的鑒別算法,其特征在于:引入一個可以輔助區(qū)分手寫體和印刷體的特征:筆畫粗細;一種基于筆畫粗細的手寫體與印刷體的鑒別算法,其特征在于:通過統(tǒng)計鄰域內邊緣像素數(shù)目獲得筆畫粗細的特征,再結合版面分析將圖像文檔分割為粗細均勻的區(qū)域,然后計算這些區(qū)域內筆畫粗細的統(tǒng)計特征,最后使用SVM判斷手寫體與印刷體類別。對于一行字符,可以通過一致均勻特征來分類。
筆畫粗細是一個比較穩(wěn)定的特征,手寫體和印刷體的粗細統(tǒng)計特性不相同。在同一幅圖像中的同一個人的筆跡具有相似的筆畫粗細,這是由于同一個人的書寫力度是一致的,當他使用同一種書寫工具時,獲得的筆跡自然也相似,因此基本上可以認為一幅圖像中的手寫體粗細基本一致。而印刷體是系統(tǒng)預先設置的,每條筆畫的粗細和其他筆畫沒有直接關系,因此印刷體筆畫粗細變化較手寫體大。在一幅包含手寫體和印刷體的文檔圖像中,手寫體粗細比較均勻,而印刷體的粗細變化較大,從而利用筆畫粗細的統(tǒng)計特性能夠區(qū)分印刷體和手寫體。
本發(fā)明提供的寫體與印刷體的鑒別算法,具體包括如下步驟:
步驟001:文檔圖像預處理:將文檔圖像進行灰度校正、顏色過濾;預處理中的灰度校正是采用雙閾值二值化方法,以處理掃描或者拍照方式獲得的文檔圖像存在光照不均勻的情況;雙閾值二值化方法是一種基于開關映射(Toggle Mapping,TM)的二值化方法,它使用高低兩個閾值,所述高低閾值分別為60和20。例如,由于測試圖像中出現(xiàn)了較多的紅色筆跡,因此預處理還包含了紅色筆畫部分的去除。紅色與黑色在RGB顏色空間有較明顯的差別,當彩色像素的藍色通道B、紅色通道R與綠色通道G的差值較大時,像素的顏色接近紅色,即判斷條件為:|B-G|>t1and|R-G|>t2,其中t1和t2是閾值,實驗中取t1=5,t2=5。使用該方法可以除去紅色筆跡區(qū)域;
步驟002:計算筆畫的粗細:統(tǒng)計一個區(qū)域中出現(xiàn)的邊緣像素數(shù)目得出筆畫的粗細;
步驟003:將文檔圖像分割成判斷區(qū)域:利用筆畫粗細的特征結合版面分析,將文檔圖像分割成比文本行單位小且比字符單位大的判斷區(qū)域;這是因為字符單位比較小,容易誤判;行單位較大,但是經常出現(xiàn)手寫體和印刷體在同一行的區(qū)域。本發(fā)明利用筆畫粗細特征能夠將一行中的不同區(qū)域分割開來。
步驟004,區(qū)域判斷:統(tǒng)計判斷區(qū)域中字符寬、高、間隔,以及筆畫粗細的方差,使用線性SVM分類,當寬、高、間隔的方差小而筆畫粗細的方差較大時判斷為印刷體,否則為手寫體。
在上述步驟中,重點在于計算筆畫粗細值,筆畫粗細的一般計算方法是找到筆畫兩側對應的邊緣像素,然后計算它們之間的距離。但是筆畫兩邊的對應點卻難以定位,因此本發(fā)明設計了一種筆畫粗細的計算方法。
本發(fā)明步驟004中筆畫粗細的計算方法包括如下步驟:
401:獲得文檔圖像的邊緣:所述獲取的邊緣為8連通;所述8連通是指以定點像素(x,y)為中心,其周圍上下左右+兩條對角線上的8個像素組成的8鄰域;所述圖像的邊緣點是由像素灰度值及其相鄰像素的灰度值來確定的;圖1為字體二值化的圖像示意圖;圖2是二值化的圖像的邊緣示意圖;
402:計算細筆畫:這里所所述的細筆畫的邊緣像素i*i鄰域中只有邊緣和背景;定義F是筆畫的粗細值,則此類細筆畫的粗細值其中,Ni是i*i鄰域內邊緣像素的數(shù)量,當周圍所含邊緣像素數(shù)目Ni為i時,此時筆畫粗細為1;圖3是細筆畫區(qū)域示意圖,其中a是邊緣;細筆畫的邊緣像素3*3鄰域中只有邊緣和背景;此時公式變化為其中,F(xiàn)是筆畫的粗細值,N3是3*3鄰域內邊緣像素的數(shù)量,當周圍所含邊緣像素數(shù)目N3為3時,此時筆畫粗細為1(圖5中的四種筆畫粗細為1的情況);
403:計算粗筆畫:首先對粗筆畫進行形態(tài)學的腐蝕操作(圖6是腐蝕后的結果,圖7是腐蝕后的邊緣),每次使用半徑為1的圓結構腐蝕,循環(huán)腐蝕操作就j次,直至處理后的筆畫的邊緣像素i*i鄰域中只有邊緣和背景,此時筆畫粗細按照步驟2中的公式進行計算,所得的筆畫粗細值為2*j+F。
在此基礎上,本發(fā)明步驟403中,所述腐蝕操作過程包括以下步驟:
501:掃描文本圖像,找到第一個筆畫內部F為1的目標像素點;
502:用半徑為1的圓結構覆蓋目標像素點;
503:判斷該半徑為1的圓結構所覆蓋范圍內的像素是否全部為1:如果是,則腐蝕后的文本圖像中的相同位置的像素值為1;如果不是,則腐蝕后的文本圖像中的相同位置的像素值為0;
504:重復步驟502和503,直至所有文本圖像中的像素處理完成。
進一步,所述步驟002中還包括,在計算筆畫的粗細后,還可以采用卷積神經網絡提取筆畫隱含的本質特征。
在本發(fā)明的技術方案中,可以處理以下幾種手寫筆跡出現(xiàn)的情況:
1、當手寫體單獨成行時,此種情況可以形成以行為單位的判斷區(qū)域,判斷的準確率最高。
2、當手寫體位于填空中橫線上方時,此種情況可以通過橫線檢測的方法加以輔助,從而增加判斷的準確性。
3、當手寫體與印刷體在同一行時,此種情況需要借助于筆畫粗細的特征,進一步分割行,獲得精確地判斷區(qū)域。
4、當手寫體與印刷體粘連時,此種情況最難處理,需要配合粘連區(qū)域分割的方法,進行行分割,獲得精確地判斷區(qū)域。
為了驗證本發(fā)明提供的基于筆畫粗細的手寫體與印刷體的鑒別算法,與僅包含版面分析分析的算法進行了比較。比較時采用了正確率和召回率兩項指標。正確率Precision(P)=TB/(TB+FB)、召回率Recall(R)=TB/AB,其中TB是分類正確的塊,F(xiàn)B是分類錯誤的塊,AB是塊的總數(shù)。表1顯示了本發(fā)明提出算法和未使用筆畫粗細的版面分析算法的性能比較,提出的算法在正確率和召回率兩項指標都超過了原有的算法。
表1本發(fā)明算法和版面分析算法的性能比較
本發(fā)明提出的方法通過統(tǒng)計一個區(qū)域中出現(xiàn)的邊緣像素數(shù)目獲得筆畫的粗細,具有定義明確、計算簡便的特點。利用本發(fā)明提供的筆畫粗細特征結合版面分析,能夠將文檔圖像中的文本行進一步分割為粗細均勻的區(qū)域,該類區(qū)域較文本行更細致,較單個字符范圍廣,因此能夠提取出比文本行和單個字符更穩(wěn)定的特征,從而獲得更好地分類效果。本發(fā)明采用統(tǒng)計判斷區(qū)域中字符寬、高、間隔,以及筆畫粗細的方差,使用線性SVM分類,利用方差來判斷手寫體和印刷體,具有判斷準確、準確率高的特點。
上述說明示出并描述了本發(fā)明的優(yōu)選實施例,如前所述,應當理解本發(fā)明并非局限于本文所披露的形式,不應看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構想范圍內,通過上述教導或相關領域的技術或知識進行改動。而本領域人員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應在本發(fā)明所附權利要求的保護范圍內。