·识别"1"、"C"、"J"、"K"、"M"、"N"、"U"、"W"和"Y"。根据竖笔画的数量将这些字符分为三类,"1"、 "C"、"J"、"K"和"Y"都是一条竖笔画、"M"、"N"和"U"是两条竖笔画,而"W"有三条竖笔画,这样就完成了"W"的识别。
对于一条竖笔画的字符,判断该笔画的位置是在左边("C"和"K")、中间("1"和"Y")还是在右边("J"),即可识别出"厂。根据有无右斜笔画区分"C"和"K",按照中间竖笔画的长短区分"1"和"Y"。
.由于字符"N"有一右斜笔画,以此将其从"M"和"U"中识别出来。对于"M"和"U",依靠结构特征已无法识别,本文使用字符图像中前景像素个数与背景像素个数的比值来判断。根据这两个字符的特点,只计算字符上半部分即可。 · 识别"5"、"E"、"F"、"G"、"H"、"I"和"T"。这些字符中,只有"E"具有三条横笔画,"F"有两条横笔画,其余为一条横笔画。剩下的字符中,按照竖笔画的数量分为两组: "5"、"L"和"T"为一条竖笔画,"G"和"H"为两条竖笔画。"H"的两条竖笔画长度相同,而"G"的两条竖笔画则一长一短,这是区分"G"和"H"的标志。"T"的竖笔画在中间,"5"和"L"的竖笔画在左边。"L"的竖笔画长,"5"的竖笔画短,这样就完成了"5"、"T"和"L"的识别。
搜索封闭环实际上就是在字符图像中搜索连通域。在字符的二值图像中,假定字符像素值"1",背景像素值为"0",则:
(1)无封闭环的字符图像中只有两个连通域,即字符连通域和背景连通域,图2(a)中的B和F。
(2)只有一个封闭环的字符图像中有三个连通域,即一个字符连通域和两个背景连通域,图2(c)中的B1、B2和F。
(3)有两个封闭环的字符图像中有四个连通域,即一个字符连通域和三个背景连通域,图2(b)中的B1she、B2、B3和F。
搜索封闭环的算法如下:
(1)读入二值字符图像。
(2)找到一个像素值为"0"的背景像素点B。
(3)搜索B的连通域,并将该连通域内的像素全部标记为背景1。
(4)遍历图像中像素值为"0"的像素。
(5)若所有"0"像素都已标记为背景1,则该图像内封闭环个数为0,跳转到(11)。
(6)若存在没有标记为背景1的"0"像素点B1,则有封闭环。
(7)搜索B1的连通域,并将该连通域内的像素全部标记为背景2。
(8)遍历图像中像素值为"0"的像素。
(9)若所有"0"像素都已标记为背景1或背景2该图像内封闭环个数为1,跳转到(11)。
(10)若存在没有标记为背景1或背景2的"0"像素,则该图像内封闭环个数为2。
(11)结束搜索,返回封闭环个数。
字符的笔画抽取可参见文献[1]
2 识别测试
利用本识别方法,笔者对从车牌中分割出的字符进行了识别测试。所测试的字符包括了车牌中所使用的全部35个数字和字母共7000幅图像,其中图幅最大的为l00xl00像素,而最小的是20x20像素。正确识别的有6946幅,正确率超过99%。其中识别错误的图像主要集中在字母"0"和"D"。通过对这些容易识别错误的字符进行二次识别,可以大大提高识别准确率
本文提出的字符识别方法的核心就是通过判定树对字符群体层层分类,从树干开始逐步缩小识别范围,直到最后只有一类字符,即识别成功。
该方法具有如下特点:
(1)不需要建立识别样本库,完全依据字符自身的结构特征进行逼近识别。
(2)不需要将待识别字符与全部字符进行匹配识别,因而提高了识别速度和准确率。