毕业论文计算机手写数字识别技术完整版.docx
- 文档编号:25297830
- 上传时间:2023-06-07
- 格式:DOCX
- 页数:35
- 大小:158.06KB
毕业论文计算机手写数字识别技术完整版.docx
《毕业论文计算机手写数字识别技术完整版.docx》由会员分享,可在线阅读,更多相关《毕业论文计算机手写数字识别技术完整版.docx(35页珍藏版)》请在冰豆网上搜索。
毕业论文计算机手写数字识别技术完整版
HENsystemofficeroom【HEN16H-HENS2AHENS8Q8-HENH1688】
毕业论文计算机手写数字识别技术
合肥学院
2007届毕业设计(论文)
设计(论文)题目
基于模板匹配算法的字符识别系
统研究与实现
院系名称
计算机科学与技术系
专业(班级)
计算机科学与技术
2003级1班
姓名(学号)
宋飞(0)
指导教师
赵大政
系负责人
袁暋
二OO七年五月二十三日
摘要
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。
研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。
因此,研究模式识别,是理解人类智能的本质的重要途径。
字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题。
手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标。
在这种大类别识别的研究中,传统上大多采用模板匹配的方法来解决问题。
而在模板匹配算法中,得计算其特征值。
图像需要经过二值化,细化等预处理。
关键字模板匹配;特征值;细化;二值化
ABSTRACT
Sincecomputerappeared,ithasbeenaneffortdirectionforscientisttoletthecomputerhastheabilityofpatternrecognition.Researchingindicatesthattheproceduretodealwithseeingandhearingnotonlyaprocedureofperceptionbutalsocognition.Therefore,studyingpatternrecognitionisanimportantwayinunderstandingthemankind’sintelligenceandability.Characterrecognitionisatraditionalandtypicalpatternrecognitionproblem,andHandwrittenNumeralRecognitionisatypicallargevocabularypatternrecognitionproblem.Differentcharactersdonotvarymuch,thesamecharactercanbewritteninmanyways,thereisnocontextbetweencharacters,andsoon.Becauseofsomanycharacteristics,HandwrittenNumeralRecognitionisaverydifficultproblemandcommonlyregardedasoneoftheultimategoalsofcharacterrecognitionresearch.Andthetemplatematchingalgorithm,initscalculationofeigenvalues.Imagerequiretwovalue,thinningandotherpretreatment.
引言
手写数字识别(HandwrittenNumeralRecognition)是光学字符识别技术(OpticalCharacterRecognition,简称OCR)的一个分支,它研究的对象是:
如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。
在整个OCR领域中,最为困难的就是脱机手写字符的识别。
到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。
而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。
手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:
(1).阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国,各地区的研究工作者提供了一个施展才智的大舞台。
在这一领域大家可以探讨,比较各种研究方法。
(2).由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。
这方面最明显的例子就是人工神经网络------相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。
(3).尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。
(4).手写数字的识别方法很容易推广到其它一些相关问题枣一个直接的应用是对英文这样的拼音文字的识别。
事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。
人类认知事物的过程中,视觉起到了举足轻重的作用。
视觉是人类最高级的感知器官,它不仅指对光信号的感受,还包括了对视觉信息的获取、传输、处理、存储与理解的全过程。
随着工业自动化的发展,机器视觉作为一种应用系统逐渐得到完善和发展。
机器视觉就是用机器代替人眼来做测量和判断。
其特点是能够提高生产的柔性和自动化程度,在一些不适合人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。
而且机器视觉易于实现信息集成,是实现计算机制造的基础技术。
在机器视觉中,常常需要从图像背景中把感兴趣的物体检测出来,模板匹配是最常用也是最基本的方法。
随着信号处理技术和计算机技术的不断发展,模板匹配在工业检测、卫星遥感、半导体封装、文字识别、导航制导、医学X射线图片处理、气象云图分析、光学和雷达的图像模板跟踪、工业流水线的自动监控、工业仪表的自动监控、资源分析、交通管理、图像数据库检索以及景物分析中的变化检测等领域应用越来越广泛。
可见,匹配技术己经成为机器视觉和众多领域中不可或缺的组成部分,对图像匹配技术进行探索研究势在必行。
在下面各章我将以一个字符识别系统为例,就字符识别概述、模板匹配算法及改进、图像预处理、系统的具体实现等方面进行描述。
第一章绪论。
第二章模板匹配算法及改进。
第三章图像的预处理。
第四章系统的设计与实现。
第五章系统运行及测试。
结束语部分对本次毕业设计做出总结。
摘要………………………………………………………………………………….2
ABSTRACT………………………………………………………………………….3
引言…………………………………………………………………………………4
第一章绪论
课题研究背景意义…………………………………………………………7
字符识别概述………………………………………………………………7
字符识别分类………………………………………………………………8
研究对象及目标……………………………………………………………8
1.4.1研究的对象…………………………………………………………......8
1.4.2研究的目标…………………………………………………………......8
第二章模板匹配算法及改进
模板匹配算法描述…………………………………………………………..9
模板匹配算法的数学描述…………………………………………………..10
算法的改进及图示……………………………………………………………11
第三章图像的预处理
图像的平滑去噪……………………………………………………………..14
BMP图像的存储结构……………………………………………………….15
颜色处理……………………………………………………………………..17
图像的二值化………………………………………………………………..17
图像的细化…………………………………………………………………..18
3.5.1细化算法的定义……………………………………………………….......18
3.5.2细化的要求……………………………………………………………......19
3.5.3Hilditch算法描述………………………………………………………......19
第四章系统的设计与实现
VisualC++介绍…………………………………………………………...21
4.1.1环境安装及选择的原因……………………………………………….......21
4.1.2MFC概述……………………………………………………………….......21
系统界面按扭的生成………………………………………………………....21
模板计算的实现…………………………………………………………….....23
4.3.1模板计算设计思想…………………………………………………………………...23
4.3.2代码实现………………………………………………………………........23
样本测试的实现……………………………………………………………….25
4.4.1样本测试设计思想….…………………………………………………..…..25
4.4.2代码实现……………………………………………………………………25
第五章系统运行及测试
系统的运行…………………………………………………………………….28
系统的测试…………………………………………………………………….28
系统的评价…………………………………………………………………….30
结束语…………………………………………………………………………………..30
参考文献………………………………………………………………………………..30
致谢语…………………………………………………………………………………..31
附录部分代码清单…………………………………………………………………..31
第一章字符识别概述
课题研究背景意义
在机器视觉中,常常需要从图像背景中把感兴趣的物体检测出来,模板匹配是最常用也是最基本的方法。
随着信号处理技术和计算机技术的不断发展,模板匹配在工业检测、卫星遥感、半导体封装、文字识别、导航制导、医学X射线图片处理、气象云图分析、光学和雷达的图像模板跟踪、工业流水线的自动监控、工业仪表的自动监控、资源分析、交通管理、图像数据库检索以及景物分析中的变化检测等领域应用越来越广泛。
可见,匹配技术己经成为机器视觉和众多领域中不可或缺的组成部分,对图像匹配技术进行探索研究势在必行。
手写数字识别有着极为广泛的应用前景,这也是受到研究者重视的一个主要原因。
比如说在大规模的数据统计(如行业年鉴、人口普查等)中,在财务、税务、金融领域中,在邮件分拣中均有着应用。
字符识别概述
计算机硬件的迅速发展以及计算机应用领域的不断开拓,急切地需要计算机能够更有效的感知诸如声音、文字、图像等人类赖以发展自身、改造环境所运用的信息资料。
但就一般意义来说,目前计算机却无法感知他们,键盘,鼠标等输入设备,对于五花八门的外部世界显得无能为力。
虽然电视摄象机、图文扫描仪、话筒等设备已解决了上述非电信号的转换,并与计算机联机,但这并不能使计算机真正知道所接受的究竟是什么信息。
计算机对外部世界感知能力的低下,成为开拓计算机应用的瓶颈,也与其高超的运算能力形成强烈的对比。
因此,着眼与提高计算机感知外部信息能力的学科----模式识别得到了迅速的发展。
在模式识别领域中,手写字符的识别是一个非常活跃的研究方向。
但这方面的研究工作已有很多,其中不少成果得到了广泛的应用。
但是由于手写字符拓扑结构的多样性,目前已有的手写字符识别体统在对无限制手写字符进行分类时,始终存在这样或那样的缺陷。
字符识别是模式识别领域中的一个非常活跃的分支。
这一方面是由于问题本身的难度使之成为一个极具挑战性的课题。
另一方面,是因为字符识别不是一项孤立的应用技术,其中包含了模式识别领域中其它分之都会遇到的一些最基本的和共性的问题。
也正是由于字符识别技术的飞速发展,才促使识别领域和图像分析发展为一个成熟的科学领域。
字符识别技术的研究主要集中在特征抽取和模式匹配两个方面,这一直是光学字符识别(OCR)技术的两大关键所在。
由扫描仪转化后的字符二值图像中各点的值,可以看成是该字符的一组特征。
但由于这组特征的数量较大,而每个特征所含的信息量很少,因此有必要通过映射或变换的方法将信息集中到少量的特征中。
这个过程就叫特征抽取。
选择稳定的,分类能力强的特征是字符识别系统的核心。
在识别过程中,对待识别的字符进行特征抽取后,就要将这些特征与特征库中的特征进行比较,进行分类,这个过程称为特征匹配。
特征匹配方法可分为完全匹配法和近似匹配法。
完全匹配法就是将为未知的字符的特征向量X与特征库中的所有特征向量(Yj,j=1,2,…n)逐一进行比较,若X=Yi,则Yi所对应的字符就是识别结果。
否则,就拒识。
近似匹配法可进一步分为相关性匹配法,驰豫匹配法和树搜索法。
字符识别的分类
字符识别按输入方式的不同可分为联机识别(也称为在线识别)和脱机识别(也称为离线识别)。
联机识别是对所书写的字符进行实时识别,即写即识。
所以联机识别技术往往结合字符的笔划顺序来进行识别。
脱机识别方法中,首先对已经写在纸上的字符通过扫描仪转化为二值图像,然后再对字符的二值图像进行识别。
书写与识别可以分开进行。
因此,脱机识别技术中不涉及字符的书写顺序。
字符识别技术根据别识别的字符的类型通常可分为印刷体识别和手写体识别两大类,而手写体识别又可分为限制手写体识别和无限制手写体识别(也称为自由手写体识别)。
印刷体识别是将印刷刊物上的字符扫描转化为二值图象并进行识别,是将已有刊物上的数据大量输入计算机的最有效的方法。
研究的对象及目标
1.4.1研究的对象
我们的研究对象是无限制手写数字和英文大写字母,这方面目前已经有大量的研究成果。
但是,由于手写字符,特别是英文大写字母,拓扑结构变化的多样性,使得目前已有的一些字符识别系统在应用于无限制手写字符的分类时,始终存在这样或那样的缺陷。
正因为如此,手写字符识别对于广大研究者来说,是一个充满魅力的领域。
1.4.2研究的目标
本文所要做的工作是:
(1)建立一个无限制手写数字脱机识别系统,要求该系统具有至少90%以上的识别率,并且具备一定的稳定性。
(2)建立一个无限制手写大写英文字母脱机识别系统,要求该系统作为手写字符识别系统中的脱机识别部分,要求该系统具有至少85%以上的识别率,并且具备一定的稳定性。
第二章模板匹配算法及改进
模板匹配算法的描述
在机器识别事物的过程中,常需把不同传感器或同一传感器在不同时间、不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据己知模式到另一幅图中寻找相应的模式,这就叫做匹配。
若将已知模式的图像称为模板(如图2—1),在左侧的待匹配图像中找到对应于右侧模板图像的过程即为
待匹配图像模板
图2—1待匹配图像和模板图像的示意图
模板匹配。
因为只有当同一场景的两幅图像在同一坐标系下时,才能进行相似性比较,所以模板匹配的过程实际上也就是把一幅图像变换到另一幅图像的坐标系过程。
图像的模板匹配就是先给定一幅图像,然后到另一幅图像中去查找这幅图像,如果找到了,则匹配成功。
这看起来好像很简单,因为我们一眼就能看出一幅图中是否包含另一幅图像,遗憾的是电脑并不具有人眼的强大的视觉的功能,因而需要电脑去判定一幅图片中是否包含另一幅图片是件不容易的事情。
对于机器视觉系统而言,实现匹配首先要对图像进行预处理。
先计算模板图片的特征值,并存储到计算机中。
然后计算待测试样板图片的特征值,与计算机中模板进行比较,运用匹配算法实现匹配。
整个过程如图2—2所示。
图2—2图像匹配系统示意图
从上述图像匹配系统结构图中可以看出实现匹配要考虑以下几方面内容:
(1)图像的数据结构类型:
即描述像素灰度值和像素光学特征值之间的信息。
(2)图像的特征空间:
由特征数据组成,这些特征数据可以是原始像素数据,也可以是经过处理后提取的图像特征数据。
(3)存储:
将图像处理的一些相关信息资料存储在计算机中,了解其在计算机中存储的结构。
(4)匹配算法:
是实现匹配的基本思想和方法,是解决匹配问题的关键所在。
算法的实现涉及到相似性度量函数的正确选择,相似性度量函数是两幅图像相比较的相似性度量,直接影响着匹配的速度和精度。
(5)搜索方法:
即遍历图像时的查找策略,正确的选择搜索方法直接影响到匹配的速度。
在基于图像处理的应用领域中,对于图像匹配的研究可以说一直都是数字图像处理技术和计算机视觉理解的重要研究内容。
图像匹配在机器视觉、工业自动模式识别、医学图像的定位等方面都有着重要意义。
图像匹配的数学描述
以传统的相关算法为例对图像匹配进行数学描述。
如图2—3所示,搜索图即待匹配图像S为一方形区域,边长为N,模板图像T也是一个方形区域,边长为M。
设模板T叠放在搜索图S上平移,模板覆盖下的那块搜索图(即图中的阴影部分)叫做子图S
(i,j)为子图S
的左下角在搜索图S中的坐标为:
1
(a)(b)
图2—3被搜索图(a)和模板(b)
匹配过程如下所示:
假设模板T从待匹配图像S的左下角开始逐点遍历图像,比较T和S
的内容。
如果两者一致,则差值为零,可以用下面的测度来衡量T和S
的内容如果两者一致,则差值为零,可以用下面的测度来衡量T和S
的相似程度,如公式(1—1)所示。
D(i,j)=
--公式(1—1)
展开后有:
D(i,j)=
--公式(1—2)
公式(1—2)右边第三项代表模板的总能量,与(i,j)无关,是一个常数;第一项是子图能量,随(i,j)而改变,T和S
匹配时这一项的取值最大,可以用下面的互相关系作相似性测度:
R(i,j)=
=
--公式(1—3)
或归一化为:
R(i,j)=
--公式(1—4)
显然R(i,j)越大,模板T和子图S
就越相似,使得R(i,j)取得最大值的位置即为最佳匹配位置,(i,j)也就是我们要搜索的匹配点。
算法的改进及图示
根据以上对模板匹配的介绍,可以对字符图像进行识别。
但是求相似性度量函数,求待匹配图像和模板之间的相似性映射关系均比较复杂。
上一节知识的介绍中,也看到了其过程比较麻烦。
本系统中识别的图像均为20
36大小的。
即模板图像和待测图像大小相同。
即会从图像的左下角一直顺着搜索一直至全图结束。
而且映射关系及相似性函数均比较复杂,不是数量级上的关系。
此时识别效率就不明显。
显得木讷不灵巧。
并非像前面介绍的在待测图片中搜索,并返回得到匹配点。
因此需要基于此模板匹配算法原理的基础上,对算法进行改进,才能更有效的去完成识别的功能及简化其识别的过程。
提高识别速度。
即将图片区域化。
算法改进的思想:
将图片(3
4)分为12块区域,具体区域的划分如图2—4所示。
图2—4算法改进的图像示意图
再加上5条交线。
共记有17个特征值。
模板训练时,将数字模板图片17个特征值的信息记下并存储在数组中。
当进行样本训练的时候,用同样的算法计算图片中数字的17个特征值,并到计算机存储区中去匹配,直接利用象素灰度值的差异,找到特征值最接近的一个图片数字,便完成匹配识别的过程。
得到匹配的结果。
这样变简单多。
算法改进后图像的17个特征值计算的程序代码,如附录中所示。
先让计算机学习,先计算素材T中模板图片0~9总共10个数字的特征值,每一个特征值显示如下所示:
数字0的特征值为:
,,,,,,,,,,,,,,,,
数字1的特征值为:
,,,,,,,,,,,,,,,,
数字2的特征值为:
,,,,,,,,,,,,,,,,
数字3的特征值为:
,,,,,,,,,,,,,,,,
数字4的特征值为:
,,,,,,,,,,,,,,,,
数字5的特征值为:
,,,,,,,,,,,,,,,,
数字6的特征值为:
,,,,,,,,,,,,,,,,
数字7的特征值为:
,,,,,,,,,,,,,,,,
数字8的特征值为:
,,,,,,,,,,,,,,,,
数字9的特征值为:
,,,,,,,,,,,,,,,,
第三章图像的预处理
一般说来,被观测的图像中含有这种各样的噪声和畸变,去掉这些噪声和畸变,并将图像变成某种标准形式进行加工,使得特征的提取和识别变的容易进行,这些处理称为字符识别预处理。
预处理是识别字符前的重要的一步,预处理的好坏直接影响着识别方法的难易及识别结构的好坏。
预处理工作做的好,使反映字符本质特征的部分得到保留甚至突出出来,识别就容易进行,识别率高且识别速度快。
反之,就会使识别变的困难,甚至造成识别误识等不良后果。
图像的平滑去噪
平滑处理:
字符图像经过平滑处理,能够去掉孤立噪声干扰,平滑笔划边沿。
可用平滑算法。
设有3
3窗口如图3—1所示:
图3—1平滑算法
其中P为当前点,N0-N7为其8个邻接点,平滑准则为:
(1)当P为白时,N0,N2,N4,N6中至少有三个元素为黑,则,将P改为黑,否则不变。
(2)当P为黑时,如果:
(a)N4,N3,N2中至少有1个为黑,同时N6,N7和N0中也至少有一个为黑;
(b)N2,N1,N0中至少有一个为黑,同时N4,N5和N6中也至少有一个为黑,则P不变,否则改为白。
噪声处理
噪声处理是一个重要而复杂的工作,通过扫描得到的字符图像有时含有噪声,这些噪声可能是因为纸张质量,污点,扫描通道的碎物或其它干扰造成的。
这些噪声的存在,增加了数字识别的难度,较容易导致误识,拒识。
如能较好地滤除噪声,无疑会为正确识别带来方便。
由于阿拉伯数字0~9和英文大写字母均为由连续笔划组成的字符,因此若检测到字符扫描图像中的笔划数超过1,则认为该字符图像中肯定存在噪声或者断笔,需加以去噪声或连断笔处理。
将多余的噪声去掉,或将断笔连在主体笔划上。
而噪声和断笔的区分则可通过设定阈值来实现。
具体的方法如下:
设F(i,j),0
i
m,0
j
n,,为二值图象,令A为二值图象平面上的一个N
N的窗口区域,令A
为包含A的(N+2)
(N+2)的窗口区域,若
=
0
则我们认为窗口区域A中的笔划为噪声或断笔。
通过让窗口A在图像平面上浮动,可检测到的笔划判断为噪声;另N=5,并将检测到的笔划判断为断笔。
对于检测到的噪声,只需要对应的窗口区域A中所有的黑点变为白点,即可将噪声去除。
BMP图像的存储结构
设备无关位图(Device-IndependentBitmap)DIB是标准的Windows位图格式,DIB自带颜色信息,因此调色板管理非常容易。
任何运行Windows的计算机都可以处理D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 计算机 手写 数字 识别 技术 完整版