基于图像识别的阅卷系统的设计与实现

时间:2011-06-14来源:网络

(3)基于链码方法的结构特征
 从曲线起点开始与其相连的像素点有8种可能的方向:k×45°(k=0,1,…,7),如图6所示, 如果两个像素点间的连线方向为k×45°,就用“k”作为这条连线的代码,则一条曲线最终可近似地用下式表示:
An=a1a2…an,ai∈{0,1,2,…,7}, i=1,2,…,n

(4)孔洞特征
 在二值图像中,被目标像素1包围的背景像素0(的集合)称为孔洞(hole)。在字符的骨架线的链码形成过程中,若搜索到的下一点就是该骨架线的搜索起始点,同时己形成的骨架链码码长超过了一定的阈值,则认为搜索到一个孔洞[5]。
 (5)横竖方向交叉特征
 横向或纵向扫描字符,某一行或列的像素由白变黑的次数就是该行或列的横或纵向交叉特征。本系统将横竖两个方向距离不等的7条线作用于字符,计算水平和垂直方向与字符的交叉数,如图7所示。

2.2.2 符号模型库建立
 答题卡信息识别的训练阶段需要建立符号模型库,以便对待识别手写符号进行分类和识别。符号模型库建立的好坏直接影响分类器的应用,从而影响手写符号识别效果[5]。
 由于手写符号的多样性,需要选择某一类手写符号中具有代表性的多个样本来构造标准样本,本系统采用手写字符样本特征向量的均值来描述类目标。设有n个符号类,每个符号类中有a个训练样本,每个样本有b个符号特征,每个符号类中样本的特征记为fkj,k为样本特征序号,j为各个手写符号的样本序号,则第i个目标类特征的均值为P(i),即:

 每次计算Pik时,k为大于等于1小于等于b的固定值。Pik为对于第i个目标类中a个样本中各个样本对应第k个特征值的均值。
2.2.3 手写符号识别
 对答题卡中矩形框信息识别包括两个方面,一是识别矩形框中是否有字符,二是识别具体是哪种字符。其中识别是否书写了字符比较简单,只要比较增强对比度后的矩形框图像与已知填有信息的矩形框的均方差大小,即可识别是否有字符,因为空白的矩形框和被书写的矩形框均方差差别很大。下面主要介绍怎样识别矩形框中的具体字符。
 手写符号识别就是在提取到符号的特征向量之后,依据一定的判别函数来判定出某一图形点阵具体代表的是哪一个手写符号。
 判别函数可以先简单地作如下定义:考虑有P1,P2,...,Pm个符号类别,假使每类有一个标准样本,则共有m个标准样本,分别表示为k1,k2,...,km。任意一符号特征向量X和第i个(i=1,2,...,m)标准样本间的“相似度”为Ri。计算待识别的符号特征向量X与每类标准样本之间的“相似度”[7],并将X分到与它“相似度”最大的类别,即对所有的j不等于i,若Di>Dj,则X就属于Pi类符号。
 系统采用基于最邻近域分类器的模板匹配算法来对手写符号进行识别。
 首先定义字符特征向量,经过前面的特征提取分析,该特征向量为一个16维向量,X={x1,x2,..,x16},具体定义为:
 x1:孔洞数;
 x2:端点数;
 x3~x9:7条水平线与字符的交叉次数;
 x10~x16:7条竖直线与字符的交叉次数。
 通过度量待识别字符和样本库中样本字符的接近程度,确立最近分类的一个准则。在最邻近分类中,经常使用的是相似度。如图8所示,在提取了待识字符的特征向量并建立了字符库后,将待识别字符和样本库中第i个样本的特征向量之间求近似度R(X,G)。R(X,G)定义如下:

式中,xi为待识别符号特征向量的第i个分量,gik为样本库中第i个标准样本的第k个分量,m为样本类别数。分子为向量X,G之间的内积,分母分别为向量X、G的模。α是向量X,G在m维空间的夹角。显然,当X、G两个向量完全相同时,其夹角为0,R(X,G)=1,它们的距离D(X,G)=0,即相似度最大。求出最大Rr(X,G),若Rr(X,G)≥给定阈值,即可找到与待识别字符最接近的样本类别,否则人工干预并修改样本库[7]。
3 实验结果与分析
 实验采用CCD摄像头采集答题卡图像,经图像预处理、若干特征提取、信息识别等过程,判定矩形框中有无字符、是什么字符,最后对答题卡信息分析和统计。实验采用100份试卷作为样本,对20份试卷进行测试,结果发现识别错误的手写符号主要是“√”和“w”,原因在于这两者在结构方面相似,而符号“○”的识别率达到100%。
 本系统将图像预处理、字符特征提取与图像识别等技术应用于阅卷系统的开发,实现了阅卷自动化,加快了成绩考核的速度,改善了教学管理环境。相比于传统的基于光学标记阅读机的阅卷系统,本系统利用图像识别技术实现阅卷自动化,不需要特殊的答题卡,考生也可以随意使用各种“√”、“w”、“○”等手写符号进行答题,不必用指定的2B铅笔填涂矩形块,更符合人们的习惯。
参考文献
[1] 王虎.基于图像识别的标记阅读机及选举计票系统研究[D].合肥:安徽大学,2006.
[2] 张婷.基于图像识别技术的光学标记阅读机的研究与应用[D].合肥:安徽大学,2007.
[3] 吴元君,张婷,雷惊鹏.一种改进的OMR 技术在标准化考试中的应用[J].计算机教育,2007(13):250-272.
[4] 丁慧东.脱机手写体汉字识别研究[D].长春:东北师范大学,2006.
[5] 庞东虎,金伟杰.英文字符特征提取系统[J].计算机仿真,2007,24(12):208-210.
[6] 杨玲,毛以芳,吴天爱.基于多特征多分类器的脱机手写汉字识别研究[J].计算机与网络,2008(01):217-217.
[7] 覃胜,刘晓明.基于图像的OMR技术的实现[J].电子技术应用,2003,29(10):17-19.
[8] 翁功平.光标阅读机OMR原理的设计与实现[J].工业控制计算机,2010,23(04):61-62.

1 2

关键词: 设计 实现 系统 阅卷 图像 识别 基于

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版