用MATLAB确定图像中某一字母位置Word下载.docx
- 文档编号:13528241
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:9
- 大小:129.38KB
用MATLAB确定图像中某一字母位置Word下载.docx
《用MATLAB确定图像中某一字母位置Word下载.docx》由会员分享,可在线阅读,更多相关《用MATLAB确定图像中某一字母位置Word下载.docx(9页珍藏版)》请在冰豆网上搜索。
2.4对图像进行增强处理:
2.5取得最佳阈值,图像二值化:
7
3字母的定位8
3.1设计算法8
3.2图像的变换公式8
3.3主程序9
3.4结果及分析9
4总结10
1绪论
1.1引言
视觉信息是人的主要感觉来源,人类认识外在世界的信息很多是通过视觉提供的。
人类是通过眼睛与大脑来获取、处理和理解视觉信息的。
视觉不仅指对光信号的感受,它包括了对视觉信息的获取、传输、处理、存储与理解的全过程。
·
语言和文字是人类文明的标志,也是人们进行交流和沟通的主要媒介。
随着计算机、信息技术的高速发展,使用计算机处理和识别文字信息也就成为了一个非常重要的研究领域。
计算机文字识别,又称之为光电字符识别(OpticalCharacterRecognition,OCR),就是利用一定的光电设备将印刷或手写在纸(或其它介质)上的字符输入到计算机中并对其进行自动辨识。
字符识别技术是模式识别的一个重要分支,它涉及模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术。
1.2背景及意义
计算机视觉研究的主要是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息。
目前,计算机视觉己在遥感图像分析、文字识别、医学图像处理等领域取得了广泛应用。
尽管人们对字符识别的研究已从事了很长时间,并已取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,因此它们对于模式识别等学科和理论来说,仍有较强的研究价值和意义。
同时,字符识别的研究,对于进一步提高复杂环境条件下的文字识别的准确率,解决视频图像的文字检测和识别,手写体等各种文字的识别,以及对各种图像识别技术和应用问题,都具有重要的借鉴和启发作用。
1.3字符识别原理概述
字符识别实质上就是由计算机自动识别各种字符,生成计算机可识别的部编码。
本文容是字母识别。
目前,字母识别中有两个主要研究方向,一是新的识别算法的研究,使得一些复杂的或运算量大的算法能够得以实现。
二是集成方法的研究,字符集成识别是综合集成方法论与字符识别技术的结合。
它一方面寻求新的特征提取和识别方法,另一方面着眼于系统的体系结构。
由于采用多种识别方法,多种字符特征,并针对具体问题有效地将多个识别器组合管理起来,特征之间具有多样化的关系,最终的识别效果通常会优于每一个成员分类器。
一个基本的字符识别系统可以用下面的框图来概括,主要由计算机视觉系统和模式识别系统两大部分组成,其中计算机视觉系统包括图像的采集模块、图像的预处理模块和图像分割模块,模式识别系统包括特征提取模块和识别模块,如图1.1所示:
图像的采集是指借助光学数字影像设备(光学扫描仪,数码相机,数码摄像机)将需要识别的字符图像转换成数字图像输入到计算机系统。
图像预处理是把原始图像转化为较为理想的灰度图像,去除图像中的噪声畸变等现象,增强图像中有用的信息,以便于识别。
预处理是字符识别的第一步,占有十分重要的地位,预处理的好坏将直接影响识别方法的难易及识别结果的好坏。
预处理做得好,使反映字符本质特征的部分突显出来,识别率高且识别速度快。
反之,就会使识别变得困难,甚至造成误识。
图像分割模块是将图像中的目标从背景中分割出来,这一步也至关重要。
特征提取是将待识别图像中有代表性的特征提取出来,并对提取的大量特征进行简化和分类,以便于识别。
字符特征一般分为两大类:
结构特征和统计特征。
最后所提取的特征交给分类器模块进行比较计算,给出鉴别结果。
字符识别的后处理是指根据字符所处的上下文或者其它约束条件,对识别结果的校正或检验。
在本文中我们的工作容到图像的分割模块。
1.4主要工作
字符识别具有广阔的前景,仍有许多技术难点需要解决。
本文研究了字母块图像预处理、特征提取、字母分割的过程,主要有以下几个方面的工作:
(1)预处理阶段
本文的研究对象是字母的识别,其背景单一但难以区分,但字母数量有限,且是印刷体,形状规则。
根据以上特点,本文首先将图像进行灰度化,将图像转换为只包含亮度信息的灰度图像,以达到改善画质和增强对比度的目的;
其次对图像进行了增强操作,突出图像中感兴趣的区域。
图像增强实质上消除或减弱噪声,改善图像质量,使图像变清晰的过程。
在预处理阶段,本文还研究了图像的平滑去噪,抑制或减弱了噪声影响,达到改善画质的目的。
最后的处理阶段是图像的边缘检测,根据图像边缘灰度有跳跃变化的特性,检测出图像边缘,将感兴趣区域与背景图像分离。
(2)字母块图像定位与分割
在进行了上述预处理操作之后,字母块图像已经从背景中分离出来,但是要实现字母的识别还需将字母分割出来。
字母的位置确定之后,结合字母的特点采用自适应阈值方法将字母分割出来,以待识别。
2图像预处理
clear;
closeall;
%Step1获取图像装入待处理彩色图像并显示原始图像
Scolor=imread('
text.jpg'
);
%imread函数读取图像文件
图2.1原始图像
彩色图像包含着大量的颜色信息,不但在存储上开销很大,而且在处理上也会降低系统的执行速度,因此在对图像进行识别等处理中经常将彩色图像转变为灰度图像,以加快处理速度。
由彩色转换为灰度的过程叫做灰度化处理。
选择的标准是经过灰度变换后,像素的动态围增加,图像的对比度扩展,使图像变得更加清晰、细腻、容易识别。
%将彩色图像转换为黑白并显示
Sgray=rgb2gray(Scolor);
%rgb2gray转换成灰度图
figure,imshow(Sgray),title('
原始黑白图像'
图2.2原始黑白图像
s=strel('
disk'
13);
%strei函数
Bgray=imopen(Sgray,s);
%打开sgrays图像
figure,imshow(Bgray);
title('
背景图像'
%输出背景图像
图2.3背景图像
Egray=imsubtract(Sgray,Bgray);
%两幅图相减
figure,imshow(Egray);
增强黑白图像'
%输出黑白图像
图2.4黑白图像
二值图像是指整幅图像画面仅黑、白二值的图像。
在实际的车牌处理系统中,进行图像二值变换的关键是要确定合适的阀值,使得字符与背景能够分割开来,二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。
车牌识别系统要求处理的速度高、成本低、信息量大,采用二值图像进行处理,能大提高处理效率。
阈值处理的操作过程是先由用户指定或通过算法生成一个阈值,如果图像中某中像素的灰度值小于该阈值,则将该像素的灰度值设置为0或255,否则灰度值设置为255或0。
fmax1=double(max(max(Egray)));
%egray的最大值并输出双精度型
fmin1=double(min(min(Egray)));
%egray的最小值并输出双精度型
level=(fmax1-(fmax1-fmin1)/3)/255;
%获得最佳阈值
bw22=im2bw(Egray,level);
%转换图像为二进制图像
bw2=double(bw22);
figure,imshow(bw2);
图像二值化'
%得到二值图像
图2.5二值图像
3字母的定位
3.1设计算法
此次,我们希望在图像text.jpg中定位字母“a”,那么我们首先将包含字母“a”的图像与text.jpg图像进行相关运算,也就是首先将字母a和图像text.jpg进行傅立叶变换,然后利用快速卷积的方法,计算字母a和图像text.jpg的卷积,提取卷积运算的峰值,然后选择一个适当阈值,只显示像素超过阈值的,从而得到白色亮点,这即是在图像text.jpg中对字母a”的定位结果。
3.2图像的变换公式
(1)fft2
fft2函数用于数字图像的二维傅立叶变换,如:
i=imread('
e:
\wtext.jpg'
j=fft2(i);
(2)ifft2
ifft2函数用于数字图像的二维傅立叶反变换,如:
k=ifft2(j);
(3)利用fft2计算二维卷积
利用fft2函数可以计算二维卷积,如:
a=[8,1,6;
3,5,7;
4,9,2];
b=[1,1,1;
1,1,1;
1,1,1];
a(8,8)=0;
b(8,8)=0;
c=ifft2(fft2(a).*fft2(b));
c=c(1:
5,1:
5);
利用conv2(二维卷积函数)校验,如:
c=conv2(a,b);
3.3主程序
程序如下:
I=imread('
%读入图像‘text.jpg’
a=I(28:
62,16:
48);
%从图像中抽取字母a的图像
subplot(2,2,1),imshow(I);
subplot(2,2,2),imshow(a);
C=real(ifft2(fft2(I).*fft2(rot90(a,2),242,346)));
subplot(2,2,3),imshow(C,[]);
thresh=11500000;
%找到C中的那个最大值,选择一个小于该数的数值作为阈值
subplot(2,2,4),imshow(C>
thresh);
%显示像素超过阈值的
3.4结果及分析
将所用图片text.jpg放入MATLAB的work文件夹中,打开MATLAB新建M_file,将程序输进去,保存运行。
运行结果如下图所示。
图运行结果
右下角的图像中3个亮点就是原图中字母a的位置。
4总结
本文研究的是字母在图像中的定位,包括图像的采集、预处理以及定位字母的过程。
在目前对图像处理方面的研究基础上,进行了更深一步的研究和改进。
本文从字母块图像的采集和处理出发,涉及了数字图像处理、模式识别等理论与应用方面的研究,主要做了以下几点工作:
1.本文通过阅读大量文献,对字符识别的研究背景和国外研究现状都有了深刻的了解,对于字母图像从采集到预处理再到字母的识别的过程进行了详细深入的研究。
涉及到最佳方法的选择、算法的改进、精确结果的实现等等。
2.综合利用图像处理、图像分析和图像理解技术,对采集到的字母块图像进行图像增强、边缘检测、图像定位与分割以及字符识别等处理。
在分析归纳了前人研究成果的基础上,进行了改进尝试,也采用了一些新的处理方法。
3.图像增强部分首先进行了灰度拉伸操作使图像的对比度增强,之后采用直方图均衡化的操作对图像的直方图进行了修正,最后是图像的平滑去噪。
4.图像定位是根据字母图像的特征采用直接扫描的方法定位出字母区域,最后利用阈值变换方法将字母分割出来。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 确定 图像 某一 字母 位置