基于图像的OMR技术的实现
彩标阅读及识别系统》中采用了基于图像的OMR技术。所谓基于图像的OMR技术,就是将信息卡经光电变换,形成二值化图像;再经歪斜校正、图像分割,对分割出的小块图像(含“涂点”)中的黑点数进行计数。若大于某个阈值,就认为有标记,否则就没有标记,从而完成了标记识别。相对OCR而言,它省去了最耗时的字符特征抽取步骤。
3硬件组成
本系统框图如图1所示。
(1)图像传感器
采用国产的CIS(ContactImageSensor)图像传感器,其光学分辨率比CCD略低,但是其驱动电路、光学系统和机械结构却比CCD简单。光学系统中采用特殊光源实现光学滤波,消除或减轻了信息卡背景信息对分割、识别的影响。工作时,由CPLD(ComplexProgramableLogicDevice)产生一个周期性的同步脉冲SYN引导每次扫描,时钟信号CLK在移动寄存器的作用下,对CIS内的像元依次进行扫描,像元上的光电信号串行输出。
(2)走纸控制
输入的信息卡
通过光学系统成像在图像传感器的光敏面上,在CPLD器件产生的扫描信号的驱动下,图像传感器对信息卡进行横向自扫描;步进电机驱动输纸机构使信息卡纵向运行,从而实现了信息卡的二维扫描。
(3)模拟信号处理
模拟信号处理要考虑信息卡颜色的深浅、字迹的轻重和光强均匀度的变化等引起的脉冲幅度的变化。在光电变换中,对信号幅值影响较大的是:光束照射在光敏面上,光强的不均匀性及波动影响表现为白电平浮动对比度的变化也会引起信号幅值的较大起伏。处理的好坏直接影响到采集图像的质量。其过程为:CIS图像传感器摄取的原始图像信号,经放大、采样保持及滤波、对消、浮动阈值及二值化等一系列处理,消除或减轻了信息卡背景明暗变化、光源变化、开关噪声、高低频干扰等对系统的影响,获得高质量的二值化信号。
(4)数字信号处理
采用A、B两块大容量的SRAM轮流工作在读或写状态。合并二值化的信号,同时为了加快数据采集的速度,每次将16位的串行信号转换为2个字节的并行数据。在标志寄存器的控制下,将信号暂时写入A中,同时计算机通过16位ISA总线从B中取数据。在下一周期,二值化信号写入B中,计算机通过16位ISA总线从A中取数据。这样就保证数据传输的高效性。
(5)逻辑控制
整个系统的逻辑控制采用Lattice公司的CPLD——L1032,它负责控制轮纸机构、图像传感器、两块SRAM的轮换;并随时检测系统的工作状态,协调各部分的工作;并将检测到的状态即时送给计算机,便于计算机对整个系统的管理。
4软件处理
在大数据量的文档处理中,为了满足快速高效地处理,文档必须针对OCR技术或OMR技术进行专门设计。这样才适合光电阅读。在信息卡上设计定位标记块是一种有效手段。它分为水平定位标记块和垂直定位标记块,并且按照与填写的字符相同的颜色(黑色)来印刷。一个水平定位标记块表示一个字符行,垂直定位标记表示一个字符列。标记填写在以字符行列交叉点为中心的矩形区域。定位标记块主要用于字符定位和信息卡图像的倾斜校正,如图2所示。
另一种有效手段就是常常对信息卡学习,获得相应的先验知识,如信息卡的行数、列数、标记出现的主要区域、 《基于图像的OMR技术的实现(第2页)》
本文链接地址:http://www.oyaya.net/fanwen/view/140277.html
3硬件组成
本系统框图如图1所示。
(1)图像传感器
采用国产的CIS(ContactImageSensor)图像传感器,其光学分辨率比CCD略低,但是其驱动电路、光学系统和机械结构却比CCD简单。光学系统中采用特殊光源实现光学滤波,消除或减轻了信息卡背景信息对分割、识别的影响。工作时,由CPLD(ComplexProgramableLogicDevice)产生一个周期性的同步脉冲SYN引导每次扫描,时钟信号CLK在移动寄存器的作用下,对CIS内的像元依次进行扫描,像元上的光电信号串行输出。
(2)走纸控制
输入的信息卡
通过光学系统成像在图像传感器的光敏面上,在CPLD器件产生的扫描信号的驱动下,图像传感器对信息卡进行横向自扫描;步进电机驱动输纸机构使信息卡纵向运行,从而实现了信息卡的二维扫描。
(3)模拟信号处理
模拟信号处理要考虑信息卡颜色的深浅、字迹的轻重和光强均匀度的变化等引起的脉冲幅度的变化。在光电变换中,对信号幅值影响较大的是:光束照射在光敏面上,光强的不均匀性及波动影响表现为白电平浮动对比度的变化也会引起信号幅值的较大起伏。处理的好坏直接影响到采集图像的质量。其过程为:CIS图像传感器摄取的原始图像信号,经放大、采样保持及滤波、对消、浮动阈值及二值化等一系列处理,消除或减轻了信息卡背景明暗变化、光源变化、开关噪声、高低频干扰等对系统的影响,获得高质量的二值化信号。
(4)数字信号处理
采用A、B两块大容量的SRAM轮流工作在读或写状态。合并二值化的信号,同时为了加快数据采集的速度,每次将16位的串行信号转换为2个字节的并行数据。在标志寄存器的控制下,将信号暂时写入A中,同时计算机通过16位ISA总线从B中取数据。在下一周期,二值化信号写入B中,计算机通过16位ISA总线从A中取数据。这样就保证数据传输的高效性。
(5)逻辑控制
整个系统的逻辑控制采用Lattice公司的CPLD——L1032,它负责控制轮纸机构、图像传感器、两块SRAM的轮换;并随时检测系统的工作状态,协调各部分的工作;并将检测到的状态即时送给计算机,便于计算机对整个系统的管理。
4软件处理
在大数据量的文档处理中,为了满足快速高效地处理,文档必须针对OCR技术或OMR技术进行专门设计。这样才适合光电阅读。在信息卡上设计定位标记块是一种有效手段。它分为水平定位标记块和垂直定位标记块,并且按照与填写的字符相同的颜色(黑色)来印刷。一个水平定位标记块表示一个字符行,垂直定位标记表示一个字符列。标记填写在以字符行列交叉点为中心的矩形区域。定位标记块主要用于字符定位和信息卡图像的倾斜校正,如图2所示。
另一种有效手段就是常常对信息卡学习,获得相应的先验知识,如信息卡的行数、列数、标记出现的主要区域、 《基于图像的OMR技术的实现(第2页)》