传统纸质读物的数字化以及诸如条码识别等字符识别系统都离不开图像的读入与识别,然而目前广泛使用的字符识别设备将这两部分独立开,即由图像读入设备(如扫描仪)和安装于计算机上的识别软件构成,但这样的设备构成离不开安装识别软件的计算机,造成成本上升和使用不便。随着电子产品的普及,具有摄像功能的电子产品及其上的识别软件也可以构成一个字符识别系统,但是这种识别系统的识别速度受到摄像头调焦的限制,难以广泛应用。文中提出的便携式字符采集和识别系统,其硬件平台是基于接触式图像传感器(CIS)与ARM9处理器S3C2410,软件平台是基于嵌入式Linux系统,可以克服以上两种设备的缺点,同时满足方便性和快速性的要求。另一方面,由于设备基于Li-nux操作系统,使得识别软件的开发和扩展可以脱离硬件,大大提高识别系统的通用性。
1 图像采集模块
字符识别系统主要由图像采集模块和图像处理模块组成,其中图像采集模块是整个系统的硬件核心,图像采集的质量直接影响系统的整体性能。线阵CIS每次扫描得到一行像素值,配合运动平台的纵向运动可以完成一幅二维图像的扫描。为保证图像采集的质量,必须精确控制运动平台与CIS之间的工作匹配,本系统以CPLD作为图像采集模块的控制核心,CIS传感器、步进电机、ADC以及高速缓存FIFO在CPLD的控制协调下完成一幅图像的采集、模数转换和数据缓存。系统总体结构框图如图1所示。
1.1 硬件平台
(1)ARM处理器
采用三星公司的ARM9系列S3C2410A作为处理器,工作频率可达203 MHz,片上资源丰富,可以满足实时性要求,为图像处理提供运行平台并配合CPLD完成图像采集模块的逻辑和读写控制。
(2)图像传感器及运动平台
接触式图像传感器(CIS)具有体积小、重量轻、功耗低、结构紧凑、连接方便以及无阱深等优点,在扫描仪等领域被广泛应用。本系统采用SV643C10型CIS,其物理分辨率600 dpi(23.6 dot/mm),有效扫描宽度29.2 mm,共688个传感器像素单元,其像素输出频率为5 MHz。
运动平台由步进电机和光电传感器等组成,光电传感器实现对进纸的检测,启动扫描。步进电机控制扫描件换行,配合CIS完成图像的采集。
(3)信号调理电路
信号调理电路完成对CIS输出模拟信号的差分、放大等,实现降噪和电压匹配的作用。
(4)高速A/D转换器
由于CIS的像素输出频率高于处理器内部的A/D转换器,所以本系统采用高速的外部ADC器件TLC5540,其最大采样率40 MB·s-1,拥有8位分辨率。
(5)数据缓存
为了实现ADC和ARM的速度匹配,提高系统工作效率,在ADC与ARM处理器之间加一个FIFO存储器作为高速数据缓存,选用Averlogic公司的1 MB×8 bit的AL4V8M440。
(6)CPLD模块
实现图像采集模块的逻辑控制。为CIS传感器提供的时钟信号CP和行转移信号SP。为ADC提供采集时钟,为FIFO提供读写控制和写时钟等。本文的CPLD器件采用Ahera公司的EPM7128SLC84-15。
(7)存储器
本系统采用三星公司的64 MB NAND Flash存储器K9F1208作为程序和数据的存储单元,采用两片16位的HY57V561620CT-H(总容量64 MB)SDRAM作为系统内存,同时作为DMA方式读取缓存数据的目的存储器。其中Flash存储器存储空间分配情况如图2所示。