知网论文查重知网论文查重

论文在线投稿
论文范文大全
知网论文查重 zaolun.COM

基于图像识别的答题卡识别系统的设计与实现

万方网论文查重

摘 要:本文综合运用图像处理,模式识别的理论来构建答题卡的识别系统。当前使用的答题卡阅读机,均采用光反射阅读方式。要求使用指定的铅笔,按严格的格式涂填。这与平时的习惯差距较大,容易发生人为失误。这里,采用图象处理和模式识别技术,对答题卡进行阅读,希望解决对书写工具约束、需要特制答题卡等问题。实现了答题卡的计算机识别 ,采用打钩的方法答题,方便,快速。

关键词:灰度分割;夹线法;小波变换;霍夫变换;区域连通

针对答题卡的识别,光电识别技术已是应用多年的成熟技术,在世界范围内广泛使用,而基于影像模式的OMR识别技术,识别准确率超过了传统光标OMR阅读机,但是其两者都对其填题方式进行了限制,即应用2B铅笔填涂,超出答题区域在方框外答题的,答案无效,这很大程度上减慢了考生的填题时间,并都存在其误率,如机械传动机构复杂、使用寿命短、维护量大、设备一致性差、答题卡出现污点[1]等。

本文设计的系统支持考生使用任何深色笔做答,且最大程度上放宽了对填图区域的限制,最大优点在于考生可以使用划钩子或其他方式来选择答案,系统采用图像处理和模式识别技术来自动识别答题卡信息,方便且快速。

1 系统设计流程

(一)读取并显示BMP图象,读取的BMP图像如图1所示。

图1 原始答题卡

(二)运用双峰算法计算阈值,二值化图象,二值化后的图像如图2所示。

图2 二值化后的图像

(三)运用夹线法求水平与垂直的各投影线,处理后的图像如图3所示。

图3 夹线法求水平与垂直的各投影线

(四)对图象进行水平与垂直投影,小波变换求投影线中点坐标,处理后的图像如图4所示。

图4小波变换求投影线中点坐标

(五)根据色调的不同,二值化提取钩子,处理后的图像如图5所示。

图5二值化提取钩子

(六)识别图像得到结果图,如图6所示。

图6输出结果图

2 系统主要实现技术

(一)求水平和垂直投影线算法的实现

用两条间距较小的水平夹线平移至线条两端,横向扫描两条直线间的象素点,记录每水平行象素点的个数,如果大于一定的值,则其为一直线,取其中一条象素点最多的作为水平投影线。这里采用visual c++编码实现[5],具体实现代码省略。

(二)阈值确定算法的实现

图象的二值化需要一个阈值,先对图象进行纵向扫描,利用双峰算法找到图象中线条部分与空白部分的一系列中心坐标,对各自的一系列中心坐标点的灰度进行最大概率值计算,取各自概率最大的值的平均值,以此值作为阈值,二值化图象。

(三)Hough变换算法的实现

Hough变换的应用可用如下的方法实现:

在(x,y)域中每一离散数据点变换为域中的曲线。将和分成许多小段,每一个小段和每个小段构成一个小单元。对应于每一个小单元可设一累加器(可定义一个二维数组Accumulator)。在(x,y)域中可能落在直线上的每一点对应于变换域中一条曲线。分别使等于0,,2,3…,便可求出相应的值,并分别计算落在各个小单元的次数,待全部的(x,y)域内数据点变换完后,可对小单元进行检测,这样,落入次数最多的单元(也就是求二维数组Accumulator元素的最大值),说明此点为较多曲线的公共点,而这些曲线对应的(x,y)平面上的点可以认为是共线的。检测出(x,y)平面上n点后,将曲线交点坐标,便可得到逼近n点的直线方程。

Hough变换的一个最大的优点[2-3]就是其抑制噪声的能力强,它能够提取处在噪声背景中的直线,并且能够把断了的线段连接起。

(四)连续小波变换的计算机实现

采用连续小波函数Marr小波,就可以根据连续小波变换的卷积定义对信号进行运算。计算机采集实际波形信号时必须以一定的时间间隔采样数据,只要这个时间间隔满足先农采样定理,就可以完全反映连续信号的全部信息[4]。鉴于计算机离散采样的特点,在算法实现上必须考虑这一特点,即要按照数字信号处理的方法实现连续信号的处理,采用连续小波变换的离散化形式进行计算。

借鉴Mallat的定义方法,直接按卷积来定义小波变换,与之不同的是,我们仍然采用归一化系数,而不是Mallat定义的:

由于选取的Marr小波是关于t=0对称的,即,因此

时移因子b的实际意义是平行移动,当时移因子b>0时,沿横向坐标轴右移,否则向相反方向移动。因此,我们可以将上式改写成以下形式,而不会改变小波变换的实际意义。

(1)

尺度a的选择可以根据需要直接调整,计算是直接依赖于最原始的。Marr小波函数的系数只是影响波形的幅值,其有无不会使波形失真,因此选取的小波基函数为:

(2)

可以近似地认为其支集为[-7,7],,在这个区间以外,Marr小波基本为0。由于涉及到指数函数的计算,我们采用插值的技术来计算Marr小波的近似值,即预先计算好从[0,7]的每隔0.05的值共141点(在程序初始化或某个类的构造中如此选定),然后通过普通的插值来实现小波基函数的计算。又由于该小波基函数的对称性,可以得到自变量小于0的各个函数值。求解Marr小波函数的具体算法如下:

由于Marr小波函数的对称性,我们只离散化采样其非负时间轴的值,并且认为时Marr小波值为0。采样时间为取采样时间间隔(采样步长)为0.05,由式(2),Marr小波离散化采样值为:

万方通用版论文查重
维普编辑部版论文查重

AI论文范文,输入题目即可生成万字论文,附赠查重报告,可选开题报告、任务书

AI论文2万字符 AI开题报告 AI工作报告 AI满分作文 AI个人总结