数字图像处理结课论文正稿文档格式.docx
- 文档编号:20005255
- 上传时间:2023-01-14
- 格式:DOCX
- 页数:9
- 大小:54.60KB
数字图像处理结课论文正稿文档格式.docx
《数字图像处理结课论文正稿文档格式.docx》由会员分享,可在线阅读,更多相关《数字图像处理结课论文正稿文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
1975年又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。
1979年,这项无损伤诊断技术被授予诺贝尔奖,以表彰它对人类做出的划时代贡献。
从20世纪70年代中期开始,随着计算机技术和人工智能研究的迅速发展,数字图像处理技术向更高层次发展。
人们已开始研究如何用计算机系统解释图像,类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。
很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。
其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。
20世纪80年代末期,人们开始将其应用于地理信息系统,研究海图的自动读入、自动生成方法。
数字图像处理技术的应用领域不断拓展。
数字图像处理技术的大发展是从20世纪90年代初开始的。
自1986年以来,小波理论与变换方法迅速发展,它克服了傅立叶分析不能用于局部分析等方面的不足之处,被认为是调和分析半个世纪以来工作之结晶。
Mallat在1988年有效地将小波分析应用于图像分解和重构。
小波分析被认为是信号与图像分析在数学方法上的重大突破。
随后数字图像处理技术迅猛发展,到目前为止,图像处理在图像通讯、办公自动化系统、地理信息系统、医疗设备、卫星照片传输及分析和工业自动化领域的应用越来越多。
进入21世纪,随着计算机技术的迅猛发展和相关理论的不断完善,数字图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就。
属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等。
该技术成为一门引人注目、前景远大的新型学科。
应用前景展望
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。
随着科学技术的发展,数字图像处理技术的应用领域也将随之不断扩大。
数字图像处理技术未来应用领域主要有以下六个方面:
(1)航天航空技术方面
数字图像处理技术在航天航空技术方面的应用,除JPL对月球、火星照片的处理之外,另一方面是在飞机遥感和卫星遥感技术中。
图像在空中先处理(数字化编码)成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。
这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用数字图像处理方法。
现在世界各国都在利用卫星所获取的图像进行资源调查、灾害检测、资源勘察、农业规划、城市规划。
在气象预报和对太空其它星球研究方面,数字图像处理技术也发挥了相当大的作用。
(2)生物医学工程方面数字图像处理技术在生物医学工程方面的应用十分广泛,且很有成效。
除了CT技术之外,还有一类是对医用显微技术的处理分析,如染色体分析、癌细胞识别等。
此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。
(3)通信工程方面当面通信的主要发展方向是声音、文字、图像和数据结合的流媒体通信。
其中以图像通信最为复杂和困难,因图像的数据量巨大,如传送彩色电视信号的速率达100M/s。
要将这样高速率的数据实时传送,必须采用编码技术来压缩信息的比特量。
在一定意义上讲,编码压缩是这些技术成败的关键。
(4)工业工程方面在工业工程领域中图像处理技术有着广泛的应用,它大大提高了工作效率,如自动装配线中质量检测,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些恶性环境内识别工件及物体的形状和排列状态,先进设计和制造技术中采用工业视觉等等。
其中值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的面貌,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。
(5)军事公安方面在军事方面图像处理和识别主要用于导弹的精确制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统和模拟训练系统等;
公安方面主要用于指纹识别、人脸鉴别、不完整图片的复原以及交通监控、事故分析等。
目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别就是图像处理技术成功应用的例子。
(6)文化艺术方面的应用
目前这类应用有电视画面的数字编辑、动画的制作、电子图像游戏、纺织工艺品设计、服装设计与制作、发型设计、文物资料照片的复制和修复、运动员动作分析和评分等等。
目前正在形成一门新的艺术——计算机美术。
二案例实例
(一)胸部X光图的处理
由于人眼不能分辨非常微小的灰度差别,观察图像时,很难区分灰度级较接近的组织或结构。
对X片进行图像处理,能够改善图像的可观察度,减少因图像质量差异而造成的主观误判。
同时,较为精确的面积测量也可以客观地反映治疗效果。
为了提高组织结构细节的显示,帮助医生正确地找到感兴趣部位,需要对图像进行对比度增强处理。
1.图像噪声的去除
在X光片图像的摄取过程中,由于系统本身或其它影响,往往有许多不可避免的干扰噪声,降低了图像的质量。
对于不同的噪声,要采用不同的处理方法进行消除。
常用的方法有空域低通滤波法、中值滤波法、加权中值滤波法等。
实验结果表明:
空域低通滤波法具有较好的消除图像自噪声的功能,缺点是使图像轮廓模糊。
中值滤波法和改进的加权中值滤波法分别具有保细节的优点和消除强尖峰噪声的能力。
结合二者的基本概念有文献提出了一种新的消除噪声的算法,即KNV和KSN去噪声法。
其原理如下:
在中心像素Vk的四周开一个大小为Ns=N*n的窗口,把窗口中的像素按灰度级的递增顺序排列为Vs(r),即满足
Vs(r)≤Vs(r+1)r=0,1,…,Ns-1
r称为像素Vs(r)的秩,于是,在窗口内灰度级与中心像素Vk,l最相近的K个像素的集合,就称作KNV邻域。
在空间位置上与中心像素最接近的K个像素的集合,定义为KSN邻域。
KNV和KSN去噪声法的基本原理为:
先通过中心像素Vk,l的KSN邻域求其中的中值,以消除尖峰噪声;
然后再在所得中值M=Med(KSN)(Vk,l)的KNV邻域内求平均,以去除其它噪声。
2.图像增强
增强对比度是改善图像质量(视觉效果)的有效方法之一。
它是依据图像退化的性质,有选择性地加强图像中某些有用信息,同时抑制另一些信息,是增强图像有用性的处理方法。
常用的方法有线性直方图均衡,对比度扩展(即灰度级拉伸)、高通滤波、锐化边缘等等,不过这些方法对于X光片图像,效果不是很好。
因此可以采用局部直方图均衡增强法,和依据边缘检测的对比度增强法。
(1)局部直方图均衡增强法
直方图均衡(HE)是图像对比度增强的典型方法。
由于其算法简单,增强效果较好,得到了广泛的应用。
直方图均衡的本质是通过一个映射函数将输入图像的直方图映射成一个平展的直方图。
对整幅图像用同一个映射函数进行变换的方法被称为全局直方图均衡,该方法在应用于区域灰度分布差异较大的图像时,处理效果差,会产生较多的人为噪声。
为了克服全局直方图均衡化的缺陷,Pizer等提出了局域直方图均衡化方法,该方法采用一个滑动窗口,每一个像素的直方图映射函数是由该窗口区域内灰度分布所决定的。
只要选取合适的窗口大小,就可以对图像细节进行较好的增强。
(2)依据边缘检测的对比度增强法
在许多传统的图像增强技术中,都是通过灰度级的变换或直方图的修正得以提高图像的视觉效果。
这些方法并不需要计算图像对此度本身的大小,因而也就没有一个通用的检测标准来衡量算法的好坏.依据边缘检测的对比度增强法,是考虑人眼的视觉作用,根据原始图像的直方图或灰度级本身,计算出窗口内的局部对比度大小;
再经一定的增强函数增强之后,得到新的对比度值,最后反算出增强后的图像像素的灰度级.这种方法对噪声不敏感,增强效果明显,尤其是对含有丰富细节而边绿又较模糊的图像,场强效果更好。
3.伪彩色处理
伪彩色处理就是把黑白图像的灰度值映射成相应的彩色。
(1)强度分层
强度分层技术和彩色编码是伪彩色图像处理最简单的方法。
如果一幅图像被描述为三维函数,分层方法可看成是防止一些平行于图像函数f(x,y)=li切割为两部分。
(2)灰度级到彩色转换
与强度分层这种简单的伪彩色处理相比,灰度级到彩色的转换更为通用。
这种方法对任何输入图像的灰度级执行3个独立的变换。
然后,3个变换结果分别送入彩色监视器的红绿蓝通道。
这种方法产生一幅合成图像,其彩色内容受变换函数特性调制,注意,这些方法是一幅灰度值的变换而不是位置函数。
(二)机动车牌识别(包括汉字,字母和数字三部分)
车牌识别(LicensePlateRecognition,简称LPR)系统是智能交通系统(ITS)的一个重要组成部分,该系统能从一幅车辆图像中自动提取车牌图像,自动分割字符,进而对字符进行识别,得到车牌的号码。
在国内牌照识别发展的大约20年的时间里,大致可分为三个阶段:
图像处理技术阶段、传统模式识别阶段、人工神经网络阶段。
车牌识别系统的成功开发必将大大加速ITS的进程。
目前,阻碍牌照识别系统普及应用的关键问题是牌照识别的速度与精度。
其中,牌照搜索定位和字符提取的速度与精度又是影响牌照识别速度与精度的关键问题。
1.车牌照识别系统的构成
不同的汽车牌照识别系统,其处理及识别牌照的算法可能不同,但一般情况下,一个完整的汽车牌照识别系统,由以下几部分组成:
(1)图像捕获
如上图所示,图像捕获是汽车牌照识别系统的第一步,一般由传感器、摄像机、图像采集卡组成,当有汽车经过时,传感器给计算机一触发信号,并由图像采集卡捕获一幅图像。
为了保证整个系统的识别率,图象捕获一般要求成功率大于99%。
(2)车牌定位
由于车牌的大小及在图像中的位置是多变的,档架、商标等使背景比较复杂,在识别车牌之前必须先把车牌提取出来。
考虑到运算时间不能太长,车牌定位算法的时间复杂度必须很小。
为了保证整个系统的识别率,车牌的准确定位率必须在95%以上。
(3)字符分割
在车牌定位之后,可以根据车牌各个字符间的空隙将字符分割开来,再送识别模块一一识别。
(4)字符识别
字符识别主要由特征提取、分类识别两个部分组成。
2.车牌识别系统的具体实现
系统实现具体流程图:
要想使准确的识别出所提取的字符,还得经由神经网络数字识别,其流程图如下:
(1)灰度转化
系统中摄像头捕捉到的原始彩色图像需要经过一系列的处理才能进行下一步的定位。
这些处理包括图像的灰度变换,灰度拉伸、去噪、滤波等.经过这些处理后,车牌图像由原始的彩色图变成只包含亮度信息的灰度图。
将24位真彩图像转化为灰度图,然后对灰度图进行处理。
减少了处理的数据量,提高了处理速度。
由于图像是在运动的情况下拍摄的,自身的失真度已经很大,变为256色灰度图必须在不扩大失真度的情况下进行。
(2)灰度的均匀化
图像增强是相对于图像识别、图像理解而言的一种前期处理。
图像增强的目的是采用一系列技术,改善图像的效果或将图像转换为一种更适合计算机分析处理的形式。
主要是指按照需要对图像进行适当的变换,突出某些有用的信息、去除或削弱无用的信息,如改变图像对比度、去除噪声或强调边缘的处理等。
图像增强的方法有:
傅利叶变换、对灰度进行线性、分段线性、非线性变换等,较之这几种方法,直方图变换的方法更简单有效。
经过灰度增强得到的图像的灰度比较集中,图片对比度扩大,从而大幅度地增强了图像所包含的信息量,有利于后续一系列进一步的图像处理。
(3)二值化
二值化处理是一种灰度处理算法,对于给定的阈值,程序将灰度大于给定阈值的点变成白点,另外的点变为黑点,经处理后图像变为只有黑白二色的二值图像。
二值化操作将使信息丢失,但是却是某些处理的不可缺少的步骤。
二值化的关键在于阈值的确定,在阈值确定上有各种侧重不同的方法。
经预处理后的图像已经没有了光照强度影响的问题,因我们并不关心图像的灰度细节,只需提取数字图像,所以采用根据处理后图像灰度直方图的中间谷点为阈值的方法来进行二值化,分开了背景与前景。
二值化提高了图像的对比度,把特征更加清晰地突出出来,且图像在二值化后可以使用分割算法进行进一步的处理。
(4)倾斜度调整
由于摄像设备的角度等原因,图像中的牌照不可避免的存在角度倾斜问题,因而进行字符分割前首先要对含有车牌的包围盒旋转摆正。
由于车牌照在水平或垂直悬挂时面积最小,因而本文提出了最小面积旋转法。
该方法通过在一定角度范围内逐步旋转包围盒并查找最小面积包围盒来确定牌照的最佳旋转角度。
由于包围盒是固定的矩形区域,在此矩形区域内可能包含一些与本包围盒的求取无关的小连通域,所以在旋转前需首先将不属于该包围盒的小连通域清除.这个清除过程非常简单,因为多余小连通域是在复制候选牌照时出现的,易知候选牌照的连通域应为该矩形区域内最大的连通域,那么只需将小连通域所在位置的像素全部设置成黑像素,剩余的不为黑像素的像素就是要旋转的连通域。
假设最小面积为Amin,每次旋转后的面积为A,最佳旋转角度为α,旋转增量为δ,则小面积旋转法操作的具体步骤如下:
a.设最小面积Amin初始值为合理包围盒的面积。
b.令其旋转角度在一定范围内逐渐变化:
1)令初始旋转角度为α0,α0=0,i=0;
2)令αi+1=αi+δ;
3)以角度αi+1旋转该包围盒,生成新的图像;
4)对新图像重新确定包围盒,求出其面积并赋给A;
5)如果A<
Amin,则记录该角度α0,否则,i=i+1,转步骤2)。
c.若Amin不等于初始值,则认为所记录的角度α0是最佳旋转角度α;
否则认为原图像已经水平放置,不需旋转。
d.按找到的旋转角度旋转包围盒,并保留旋转后的包围盒,以备对原图旋转后根据该包围盒进行简单去边操作。
在进行旋转时,本文采用以包围盒中心为圆心进行旋转的方法,其中的旋转公式为:
x0=x1cosθ+y1sinθ-ccosθ-dsinθ+a;
y0=-x1sinθ+y1cosθ+csinθ-dcosθ+b。
在此公式中,(x1,y1)是旋转前的图像中任一点,旋转θ度后变成了(x1,y1),(a,b)是图像旋转前的中心坐标,(c,d)是图像旋转后的中心坐标。
e.车牌图像的定位及提取
虽然我国汽车牌照颜色较多,但牌照底色与车牌号码颜色之间总能形成明显的反差,从而使得车牌字符在整个牌照中形成明显的纵向纹理特征.本文提供的方法就是先利用水平扫描找出垂直条纹所在的行得到车牌的上下边界,然后垂直扫描得出左右边界,从而定位车牌的具体位置。
1)水平扫描定位
水平扫描的主要作用是在图像水平方向找到牌照的边界。
定义纵向扫描步长d(像素数,d应小于图像中车牌的字符高度,以保证在车牌区中至少有一个扫描行穿过字符),从下向上以步长d进行行扫描。
对每一扫描像素点,计算该点与其相邻像素点的灰度差,若差值大于给定的阈值T,则把这一像素点记录下来,定义为可疑点;
当扫描一行结束时,统计本行可疑点数量,如果可疑点数量大于给定数量n(n的值根据车牌垂直边而定,应小于车牌上的字符具有最少垂直边时的数量)则记下该行,并定义为可疑行,同时将纵向扫描步长调整为1个像素进行扫描。
判断下一行是否为可疑行,如果是可疑行,步长仍然保持为1,累加连续行数量,同时判断连续可疑行是否大于2k(k值根据图像中车牌的高度而定)。
如果大于升高阈值,重新扫描,如果小于则继续扫描下一行.如果不是可疑行,计算到当前行为止连续可疑行数量是否大于k,如果小于k,判断是否扫描结束.如果扫描完成,则降低阈值T,重新扫描;
如果没有结束,将步长再放大为原来的值,重新扫描。
如果大于k,停止水平扫描,保护现场,至此,可初步确定车牌的上下边界。
2)垂直扫描连续可疑行
水平扫描的方法能够收集到超过k个连续可疑行上的所有可疑点,虽然这些点总体上是离散遍布的,但在车牌垂直条纹区域会形成密集的字符形点集,所以在从左向右进行垂直扫描时,当进入密集区域时,类似于水平扫描进行判断,当离开稀疏区域时,记下相关信息,从而得到区域的左右边界。
f.字符分割
字符分割即进行单一字符上下左右边界的切分。
为了最终识别车牌,需将字符逐个从该图像中分割出来。
通常的分割方法是以一条垂直线从左至右扫描一行字符,根据该垂直线是否遇到黑像素决定这一位置是否有字符。
然而,由于某些字符(特别是汉字)本身也存在间隔,再加上有些牌照图像中仍存在来源于牌照和光照引起的随机干扰,这些都会使得通常的分割方法失效。
本文字符分割采用垂直投影法。
对于二值化后的图像,由于每个字符块在垂直方向的投影必然在字符间或字符内的间隙处取得局部最小值m,因此字符的分割点应该在(m-ε,m+ε)(ε>
0)之间,并且这些分割点应满足车牌字符格式、尺寸以及其他限制条件。
垂直投影法的原理是:
对上节得到的车牌图像结果在水平方向上从左至右检测各图像坐标的投影值,检测到第一个投影值不为零的坐标可视为首字母的左边界,从该坐标向右检测到第一个投影值为零的坐标则认为是首字母的右边界,其余字符的左右边界可同理得到。
另外,通过计算字符的平均字宽和两字符左边界之间的平均距离可排除错误分割;
而对于字宽小于平均字宽一定比例的字符则视为无效字符;
前后两字符距离小于平均距离且此距离与字宽之和不大于平均距离则可以合并为一个字符。
g.归一化及数字特征库
为了便于单个字符的特征提取,有必要将牌照的汉字、字母和数字归一化到一个标准的尺寸上,即令每个字符取得同样的大小,而且在处理后的车牌图像内均匀分布,但是对于不同的实验图像,所提取出的车牌区域的大小是不固定的,为了将重点放在算法的设计上,我们将此问题简化,将单个字符归一化大小为40x20(单位:
像素)。
即使是同一个数字,不同字体时特征点还是有差别的,所以需要采用一定的模糊判断策略。
每个字的特征点取不同的权值,即哪些特征点是重要的,哪些特征点是可忽略的,这样可以提高识别速度。
车号及自重图像的识别,必须具有很强的鲁棒性,如各车皮字体和字号变化时,应仍具有较高的识别率。
对于特征明显的数字,可先进行检索,以提高识别速度,而特征点相似的数字则应进行深入分析和辨认。
h.字符的识别
对于单独字符,当前识别方法很多。
通用的有神经网络法和基于特征的分析统计法。
构造神经网络分类器首先要选择适当的网络结构:
神经网络分类器的输入就是字符的特征向量,神经网络分类器的输出节点数应根据结果的设定来决定,隐层数要选好,每层神经元数要合适,目前有很多采用一层隐层的网络结构。
然后要选择适当的学习算法,这样才会有很好的识别效果。
在学习阶段应该用大量的样本进行训练学习,通过样本的大量学习对神经网络各层网络的连接权值进行修正,使其对样本有正确的识别结果。
这就像人记数字一样,网络中的神经元就像是人脑细胞,权值的改变就像是人脑细胞相互作用的改变。
神经网络是按整个特征向量的整体来记忆数字的,对于某个待识别的字符,只要它的大多数特征符合曾学习过的某类字符中的一个样本时,就可将它识别为该类字符。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 论文