一种在线图像编码识别系统的设计
摘要:本文介绍了在线图像编码字符识别系统的设计与实现过程,对其中
重点环节进行了分析与研究,给出了主要环节问题的解决方法,在识别算法上,结合模板匹配与特征识别,提出了基于特征加权的模板匹配算法,该算法对提高字符识别率提到了较好的作用。 关键词:图像处理;模式识别;特征加权;软件设计
0引言
图像编码字符识别的研究目前仍是国内外一个重点研究课题,它具有广泛的应用背景,比如车牌号码自动识别、邮政编码的自动识别、试卷自动阅读、报表自动处理等,由于这种在线图像编码字符的识别都具有一些共性,本文结合在线轮胎编码字符识别系统的设计,对一般图像编码字符识别系统进行了阐述,对关键环节进行了研究与分析,该方法对其它在线图像编码字符系统的开发具有一定指导意义。
1在线图像编码识别系统流程
在线图像编码字符识别系统主要包括数字图像的采集、存储、图像预处理、编码图像提取、编码特征提取、编码识别和后续处理等一些环节,其流程图如图1所示。
编码图像的采集与存储 编码特征提取与识别 后续处理 图像预处理 图1 在线图像编码字符识别系统流程图 在线轮胎图像编码字符识别系统要求对通过生产流水线上每一个轮胎采集含有轮胎编码的图像,然后通过对图像的处理,提取出轮胎编码特征,采用合适的识别算法将每一位编码字符进行识别。由于轮胎编码字符在轮胎上有一定变形,且摄像角度不同,得到的编码图像差异也很大,规律性差,所以编码图像的预处理和识别算法的选取显得尤为重要。
2图像采集与存储
在线编码图像通常使用数码摄像机、数码照相机、数码摄像头等设备采集并输入计算机进行处理,本系统采用QuickCamPro4000数码摄像头采集轮胎编码图像,直接按JPG格式存储。
编码图像一般都要先转成BMP图像格式,因为BMP格式己经成为PC领域事实上的标准——几乎所有为Windows操作系统设计的图像处理软件都支持这种格式的图像。BMP是Windows的原始位图格式,它可以用于保存任意类型的位图数据,可以支持所有的屏幕分辨率和Windows所支持的颜色组合。一般情况下,为了保证显示的高效率,它对图像数据没有任何的压缩,所以一幅很小的位图就可能占据相当大的空间。
BMP位图文件包括位图文件头、位图信息头、调色板、位图数据区四个部分,位图文件头由14个字节构成,位图信息头由40个字节构成,调色板的大小取决于色彩数,单色图像调色
板占8个字节,16色图像调色板占64个字节,256色图像调色板占1024
1
个字节,224色图像没有调色板,位图数据区内数据按行顺序自下而上、自左而右排列。
3图像预处理
图像预处理主要包括有:图像灰度化、图像降噪与增强、编码区边缘检测、图像几何校正、编码区图像提取、编码图像二值化、字符分割、字符归一化等。下面介绍几个关键环节的处理过程。
3.1 图像灰度化处理
编码图像通常是彩色的,实际识别用的图像是灰度图,所在需要先将彩色编码图像转换为灰度图像。在RGB颜色模型中,如果R=G=B,则颜色(R,G,B)表示一种?籽丈??渲蠷=G=B的值叫灰度值,灰度化处理就是使彩色的R、G、B分量值相等的过程。常用灰度化处理方法是加权平均值法,即
R=G=B=(WRR+WGG+WBB)/3 其中,WR、WG、WB分别是R、G、B的权值,实验和理论证明,当WR=0.3, WG=0.59, WB=0.11时,即当R=G=B=0.30R+0.59G+0.11B时,能得到最合理的灰度图像。
3.2 图像增强处理 3.2.1 直接灰度变换
①线性灰度变换:假设图像灰度是线性变化的,如原图像f(x,y)灰度范围为[a,b],要求变换后图像灰度范围达到[c,d],根据线性规律,则变换后图像g(x,y)为: g(x,y)?d?cf(x,y)?c (1) b?a②非线性变换——对数变换和指数变换。当需要扩展低灰度区、压缩高灰度区时使用对数变换,当需要扩展高灰度区时使用指数变换。
3.2.2 平滑滤波—降噪
由于噪声对应图像中的区域边缘等灰度值具有较大较快变化的部分,属高频分量,所以使用低通滤波器(即平滑滤波器)降噪。同时平滑还可以使图像模糊,有利于在提取较大的目标前去除较小的细节或将目标内的小间断连接起来。
平滑降噪的方法是使用模板对图像进行卷积运算,线性平滑滤波器最常用的模板是如图2所示的3×3模板,将此模板与图像中像素按如下方法进行卷积运算,可得到平滑降噪的图像。
①将模板在图中漫游,并将模板中心与图中每个像素位置重合; ②将模板上系数与模板下对应像素相乘; ③将所有乘积相加;
④将和赋给图中对应模板中心位置的像素。 非线性平滑滤波器最常用的是中值滤波器,它将区域中所有的值按大小进行排序,将排序后位于中间的像素值赋予中心像素。中值滤波可有效地去除随机噪声,能得到较好的视觉效果。
3.3 编码区边缘检测
边缘是灰度值不连续的结果,可利用求一阶和二阶导数的方法检测到。因为在边缘地带导数值大,而非边缘的地方导数值小。由于数字图像是离
2
散的,不能求导数,可以通过卷积的方法用差分近似代替微分。
效果较好的边缘检测算法是Sobel算子。Sobel算子是一种梯度幅值,分别利用垂直算子Sx、水平算子Sy来获取编码区垂直边缘
和水平边缘,即在水平和垂直方向上使用如图3所示的两个不同的卷积模板,得到如图4所示的边缘检测结果。
1 2 1 0 0 0 -1 -2 -1 -1 0 1 -2 0 2 -1 0 1 M?22sx?sy
图2 平滑滤波器模板 图3 Sobel边缘检测模板 图4 Sobel算子边缘检测结果
3.4 图像几何校正
Hough变换可以检测出编码区图像倾斜角度,根据此角度进行旋转变换可使编码区图像得到校正。
Hough变换可以将图像空间XY中的直线(y=px+q)检测问题转换到参数空间PQ中点的检测问题,在参数空间PQ里,建立一个累加数组Sum(p,q),对每一个图像空间中给定边缘点,让p取遍所有可能值,根据直线方程q=-xp+y计算出对应的q,对Sum(p,q)进行累加,得到Sum(p,q)的值就是在(p,q)处共线的点的个数,(p,q)的值就是图像空间中直线的斜率和截距,由斜率得到图像编码区水平边缘角度。
3.5 字符切割
通过对编码字符区直接进行水平扫描,由字符间距一般可以将字符区域分割出来。也可以通过对编码字符区做垂直方向投影运算,根据字符大致宽度与字符总数,对字符进行切割。如图5所示是编码字符区及对应垂直投影图。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说英语学习图像分割英文资料及翻译在线全文阅读。
相关推荐: