手写体数字识别的软件设计.docx
- 文档编号:998833
- 上传时间:2022-10-15
- 格式:DOCX
- 页数:47
- 大小:535.66KB
手写体数字识别的软件设计.docx
《手写体数字识别的软件设计.docx》由会员分享,可在线阅读,更多相关《手写体数字识别的软件设计.docx(47页珍藏版)》请在冰豆网上搜索。
手写体数字识别的软件设计
毕业设计说明书
手写体数字识别的软件设计
电子与计算机科学技术学院
学生姓名:
学号:
计算机科学与技术专业
学院:
专业:
指导教师:
2009年6月
手写体数字识别的软件设计
摘要
手写体数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。
由于阿拉伯数字的世界通用性,并且数字的识别和处理也常常是一些自动化系统的核心和关键,所以对手写体数字识别研究通用性强,且意义重大。
本文主要的研究的工作集中在图像预处理和选择合适的特征向量,并实现一个完整手写体数字识别系统。
本文中对几种常见的二值化算法进行比较,并最终选择基于梯度的二值化算法;在本文中,提出了一种方法来解决结构点检测的传统方法的缺陷。
另外本文还提出将一般用来直接识别字符的凸凹特征作为字符的特征向量之一。
通过对NIST的数据进行测试,实验数据表明本文设计的数字识别系统对手写体数字识别具有较高的识别率。
关键词:
手写体数字识别,特征向量,二值化算法,凸凹特征
TheSoftwareDesignofHandwrittenNumeralRecognition
Abstract
Thehandwrittennumeralrecognitionisatechnology,whichautorecognizesthehandwritingArabiannumeralviamachinesorcomputers,andaspecialfieldintheOpticalCharacterRecognitiontechnology.Thenhandwrittennumeralrecognitionresearchisgreatlygeneral-purposeandsignificative,becauseoftheuniversalArabicnumerals.Onthesamescore,thehandwrittennumeral,recognitiontechnologiesareplayinganimportantroleinanumberofautomatizationsystems.
Inthispaper,themainstudyfocusedonimagepre-processingandselectionofappropriatefeaturevectors,andtorealizeacompletesystemofhandwrittennumeralrecognition.Thereareseveralcommoncomparisonsofbinarizationalgorithminthisarticle,andchoosethegradient-basedbinarizationalgorithmfinally;andobjectingtothedefectionoftraditionalmethodsofstructuralpointdetection,asolutiontotheproblemwasputupinthisarticle.Inaddition,thispaperalsoraisestheconvex-concavefeatureasoneofthecharacterfeaturevectors.
ThroughtheNISTtestdata,experimentaldatashowsthatthedigitalidentificationsystemdesignedforhandwrittennumeralrecognitionhasahighrecognitionrate.
Keywords:
Handwrittennumeralrecognition,Characterfeaturevectors,Binarizationalgorithm,Convex-concavefeature
1绪论
1.1字符识别概述
光学字符识别(OpticalCharacterRecognition,简称OCR)是20世纪20年逐步发展起来的一门自动化技术,是图像处理与模式识别领域的一个重要分支[1]。
其目的就是通过扫描、摄像等光学输入方式将汉字报刊、书籍、文稿及其它印刷品的文字转化为图像信息,将图形、表格的图像进行保存,再利用文字识别技术将图像内的文字或表格中的资料一律变成计算机能识别的文字,以便于计算机的管理维护。
它能够减少存储容量、通讯交流的信息、循环利用已识别出的文字以及节省因键盘输入而浪费的人力、物力、财力和时间。
手写数字识别(HandwrittenNumeralRecognition,简称HNR)是OCR的一个分支,它的任务是把手写阿拉伯数字(如0,1,2,……,9)通过非键盘方式输入到计算机中,以便作进一步的处理和应用,给计算机建立视觉系统,自动辨识人用笔写在纸(介质)上的数字。
它属于模式识别、人工智能的一个重要分支,涉及到模式识别和图像处理、人工智能、统计决策理论、模糊数学、组合数学、信息论、计算机等学科;同时也涉及心理学等,是介于基础研究与应用研究之间的一门综合性的技术[2],在办公室、机器翻译等方面具有重大实用意义。
手写体数字的识别是人们研究较为深入的一个领域。
文字识别作为计算机技术的一个领域在许多的环境当中都有着非常广泛的应用。
文字识别是新一代智能计算机接口的重要组成部分。
近二十年来,国内外对各种字符进行了广泛深入的研究,研究出了许多非常有效的识别算法,与此同时用于各种字符识别的应用软件也越来越丰富。
字符识别可以分为两个大类,文字识别和数字识别。
数字识别又可以分为手写体数字识别和印刷体数字识别,而对于手写体数字识别可分为联机手写体数字和脱机手写体数字的识别。
当今手写体数字识别是人们研究的一个热点,而且手写体数字识别的技术相对于以前已经有了较大的提高。
国内专门做识别技术成果比较好的是汉王公司,该公司的识别软件对各种字符识别率已经很不错。
相对于联机手写体数字识别技术,脱机手写体数字识别技术识别率相对要低,而且在生活实际应用得到很多应用(例如:
手机手写输入,手写板等都是基于联机识别)。
由于联机识别相对于脱机识别能够获取更多的信息,其除了获取了图片信息外,计算机还可以通过与计算机相连的手写输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状。
因此一般的联机识别要比脱机识别的识别率要高。
所以联机识别的已经投入使用,但是对于脱机识别由于其技术限制,以至其到现在还没有大范围的应用。
虽然脱机手写体数字识别难度较大,识别率较低,但是比起联机手写体数字识别来说,脱机手写体数字识别不要求书写者在特定的输入设备上书写,它可以与平常一样书写,所以脱机手写体数字识别的应用更为广泛,如邮政编码、统计报表、财务报表、银行票据、学生成绩、车牌号码等。
一旦脱机手写体数字的研究取得成功,满足实用需求,并投入应用,将产生巨大的社会效益。
1.2手写数字识别的意义和应用前景
对手写体数字的识别研究不仅有着重大的现实意义而且还有十分广阔的应用前景。
当今经济的发展,金融市场化进程的日益加快,票据业务发展很快,票据数量也与日俱增。
其中个人凭证,支票,发票,进账单等等票据均需要处理大量的信息。
而目前,票据录入仍然依赖人工处理方式,因而使得票据管理工作也相对落后。
如果通过手写体字符识别技术来实现信息的自动录入,无疑将会有效解决传统人工处理方式中存在的工作量大、成本高、效率低、时效性差等问题。
此外,手写数字识别应用领域还有:
1)手写数字识别被应用在大规模数据统计中。
例如:
人口普查、成绩单录入、行业年检、财务报表录入等应用中。
2)手写数字识别被应用在财务、税务、金融领域应用。
随着我国经济的快速发展,每天会有大量的财务、税务、支票等需要处理。
3)手写数字识别被应用到邮件分拣系统中[3]。
由上可见,对手写体数字识别有着很高的实用价值,除此之外,手写体数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:
1)阿拉伯数字是唯一的被世界各国通用的符号,对于手写体数字识别的研究基本上与文化背景无关,这样就为世界各国研究者提供了一个供大家共同探讨技术的平台,研究并比较各种算法的优缺点。
2)由于手写体数字识别的类别少,有助于作深入分析与验证一些新的理论。
这方面最明显的例子是人工神经网络(ANN)。
很多ANN模型和算法都是以手写体数字识别作为实验测试平台,验证其理论的有效性,评价各种方法各自的优缺点。
3)尽管人们对手写体数字识别已经从事了很长时间的研究,并取得了一定的成果,但是到目前为止,机器识别本领与人的认知能力相比,还是有很大的差距。
4)手写体数字识别的方法很容易被推广到其它相关问题上,比如英文字母识别、汉字识别等等。
1.3字符识别的研究与发展
字符识别的最早能追溯到1890年一项帮助盲人阅读装置的发明专利。
1929年,有德国人Tausheck首先正式提出OCR概念,并取得了OCR专利权,四年后美国人Handel也取得了同样的专利权[4]。
但真正OCR是在本世纪50年代随着计算机的出现而到来的。
在字符识别大发展时期(1990年后),许多研究者对字符识别进行了探索与研究,当时提出许多新的有效识别工具,其中人工神经网络(ArtificialNeuralNetwork,ANN)[5],支持向量机(SupportVectorMachine)[6,7],隐马尔科夫模型(HiddenMarkovModel,HMM)[8]等,而这些识别工具至今仍然是研究的热点。
1)在人工神经网络识别方法中,模式类的描述方法一般还是特征向量,只是在分类时,利用了神经网络的自动学习和记忆功能,通过对样本的训练建立起记忆,然后将未知样本作为输入让神经网络“回忆”出该样本所属的类别。
2)支持向量机是Vapnik等人根据统计学理论提出的一种新型机器学习方法。
由于其出色的学习性能,该技术已成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如人脸识别、手写体数字识别、文本自动分类等。
3)隐马尔科夫模型是一类基于马尔科夫随机过程的统计模型[9]。
隐马尔科夫模型对于随机信号具有很强的学习和建模能力,因此在语音识别中取得了很大的成功。
从上世纪90年代开始,一些研究者已经将隐马尔科夫模型引入到了图像处理、识别和分析中来。
1.4手写数字识别的难点
虽然,人们对字符识别的研究有百余年,并在字符识别取得了可喜的成绩(其汉字识别也越来越多的应用到实际应用中),然而字符识别的一个分支——数字识别的研究却离实际应用还有一定差距。
这是因为,在一般情况下,当涉及到数字识别时,人们往往要求识别系统有很高的识别精度(又称可靠性)[10],特别是有关金融的数字识别时,如支票中填写的金额部分,更是如此。
因此针对这类问题,就要求手写数字识别系统具有高可靠性和高识别率。
总结数字识别的难点主要在于以下几方面:
1)阿拉伯数字的字型信息量很小,不同数字写法字形相差又不大,使得准确区分某些数字相当困难[11]。
2)数字虽然只用10种,而且笔画简单,但书写上带有明显的地域特性,同一数字写法千差万别,不同地域的人写法也不相同,所以很难做到兼顾各种写法的极高识别率的通用型数字识别系统[12]。
3)在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。
这是因为,文字组合一般都存在上下文关系,但数字组合存在极少的或没
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 手写体 数字 识别 软件设计
![提示](https://static.bdocx.com/images/bang_tan.gif)