识别人脸的技术阅读及答案Word文档格式.docx
- 文档编号:18232361
- 上传时间:2022-12-14
- 格式:DOCX
- 页数:9
- 大小:26.92KB
识别人脸的技术阅读及答案Word文档格式.docx
《识别人脸的技术阅读及答案Word文档格式.docx》由会员分享,可在线阅读,更多相关《识别人脸的技术阅读及答案Word文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
图像质量的好坏直接影响到识别的效果,图像质量的检测功能能对即将进行比对的照片进行图像质量评估,并给出相应的建议值来辅助识别。
【篇二:
人脸检测和识别技术的文献综述】
摘要:
在阅读关于人脸检测识别技术方面文献后,本文主要讨论了人脸识别技术的基本介绍、研究历史,人脸检测和人脸识别的主要研究方法,人脸识别技术的应用前景,并且总结了人脸识别技术的优越性和当下研究存在的困难。
关键词:
人脸识别;
人脸检测;
几何特征方法;
模板匹配方法;
神经网络方法;
统计方法;
模板匹配;
基于外观方法;
随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性和实用性提出了更高的要求,传统的身份识别方式已经不能满足这些要求。
人脸识别技术(frt)是当今模式识别和人工智能领域的一个重要研究方向.虽然人脸识别的研究已有很长的历史,各种人脸识别的技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的[1]基于生物特征的身份认证技术是一项新兴的安全技术,也是本世纪最有发展潜力的技术之一[2]。
1.人脸识别技术基本介绍
人脸识别技术是基于人的脸部特征,一个完整的人脸识别过程一般包括人脸检测和人脸识别两大部分,人脸检测是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程[3],人脸识别就是将待识别的人脸与已知人脸进行比较,得
出相似程度的相关信息。
计算机人脸识别技术也就是利用计算机分析人脸图象,进而从中出有效的识别信息,用来“辨认”身份的一门技术.人脸自动识别系统包括三个主要技术环节[4]。
首先是图像预处理,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。
为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;
人脸的检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,对库中所有的人脸图像大小和各器官的位置归一化;
最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。
2.人脸识别技术的研究历史
国内关于人脸自动识别的研究始于二十世纪80年代,由于人脸识别系统和视频解码的大量运用,人脸检测的研究才得到了新的发展利用运动、颜色和综合信息等更具有鲁棒性的方法被提出来变形模板,弹性曲线等在特征提取方面的许多进展使得人脸特征的定位变得更为准确。
人脸识别的研究大致可分为四个阶段。
第一个阶段以bertillon,allen和parke为代表,主要研究人脸识别所需要的面部特征;
第二个阶段是人机交互识别阶段;
第三个阶段是真正的机器自动识别阶段;
第四个阶段是鲁棒的人脸识别技术的研究阶段。
目前,国外多所
大学和研究机构已经研制出一些较好的人脸识别原型系统和一些较成熟的商业人脸识别系统,如德国的cognitec,美国的indentix,eyematic等[5]。
3.人脸识别技术的研究方法
目前人脸识别技术的研究主要分为以下两大类:
人脸检测和人脸识别。
人脸检测的方法主要有基于知识的方法、基于特征的方法、模板匹配和基于外观的方法等四种[6]。
根据特征提取和选择方法的不同,以及出现的时间顺序,把人脸识别方法分为三大类:
早期的几何特征方法和模板匹配方法、神经网络方法和统计方法。
其中的分类只是相对的,有些方法可能也可以交叉存在[7]。
(1)人脸检测方法
①基于知识的方法
基于知识的方法(knowledge-basedmethods)一是基于规则的人脸检测方法。
规则来源于研究者关于人脸的先验知识。
一般比较容易提出简单的规则来描述人脸特征和它们的相互关系。
yang和huang使用分层的基于知识的人脸检测方法[8]。
他们的系统由3级规则组成。
在最高级,通过扫描输入图像的窗口和应用每个位置的规则集找到所有可能的人脸候选区。
较高级的规则通常描述人脸看起来象什么,而较低级的规则依赖于面部特征的细节。
②基于特征的方法
基于特征的方法(feature-basedmethods)不仅可以从已有的面部特征而且可以从它们的几何关系进行人脸检测。
和基于知识的方法
相反,它是寻找人脸的不变特征用于人脸检测。
人们已经提出了许多先检测人脸面部特征,后推断人脸是否存在的方法。
根据提取的特征,建立统计模型描述特征之间的关系并确定存在的人脸。
③模板匹配的方法
sakai等人用眼睛、鼻子、嘴和人脸轮廓等子模板建模,检测照片中的正面人脸。
每一个子模板按照线分割定义。
基于最大梯度变化提取输入图像的线,然后与子模板匹配。
计算子图像和轮廓模板之间的相互关系检测人脸的候选区域,完成用其他子模板在候选区域的匹配。
craw等人提出了一种基于正面人脸的形状模板即人脸的外形定位方法govindaraju等人提出两个阶段的人脸检测方法。
人脸模型根据边缘定义的特征构成。
这些特征描述了正面人脸的左边、发际和右边的曲线。
人脸必须是垂直、无遮挡和正面的。
④基于外观的方法
基于外观的方法首先通过学习,在大量训练样本集的基础上建立一个能对人脸和非人脸样本进行正确识别的分类器,然后对被检测图像进行全局扫描,用分类器检测扫描到的图像窗口中是否包含人脸,若有则给出人脸所在的位置。
moghaddam和pentland提出在高维空间利用特征空间分解密度估计的概率视觉学习方法[9]。
用主成分(pca)分析来定义子空间从而最好地表示人脸模式集。
主成分保存数据中主分量而丢弃了那些次分量。
这种方法把向量空间分解为互相排斥和互为补充的2个子空间主子空间或特征空间和它的正交子空间。
因此对象密度被分解为个2成分在主子空间由主分量张成的密度,和它的垂直成分(在标准的pca中被丢弃的次分量。
用多变量gaussians和混合gaussians密度分布进行学习人脸局部特征的统计。
然后将这些概率密度用于基于最大似然估计的对象检测。
(2)人脸识别方法
①早期的几何特征方法和模板匹配方法
最早的人脸识别方法就是基于几何特征的方法[10],它的基本思想是提取人脸面部具有代表性的部位(例如眉毛、眼睛、鼻子、嘴巴等)的相对位置和相对大小作为特征,再辅以人脸轮廓的形状信息,来对人脸进行分类和识别。
模板匹配方法是模式识别中最简单的一种模式分类方法。
在人脸识别中,就是把数据库的人脸图像看成是已知的模板,然后根据计算待识别图像和已知模板间的相关性大小来分类。
②神经网络方法
基于神经网络的人脸识别方法也早期的方法之一。
目前较流行的基于动态链接结构的弹性图匹配(elasticgraphmatching)方法,并且取得了一定的成功。
它是通过gabor小波来提取并描述人脸中的一些局部特征点(节点),并把它们用成标记图(labeledgraph)的形式连接起来,用标记图之间的相似度来衡量人脸图像之间的相似度。
弹性图匹配方法不但体现了人脸中的几何特征信息,而且还可以通过标记图的弹性形变来描述人脸的一些变化,因而能取得较好的识别性能。
【篇三:
人脸识别技术】
别技术是基于人的脸部特征,对输入的人脸图象或者视频流.首先判断其是否存在人脸,如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。
并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。
人脸识别系统
人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。
人脸因具有不可复制、采集方便、不需要被拍者的配合而深受欢迎。
人脸识别系统具有广泛的应用:
人脸识别出入管理系统、人脸识别门禁考勤系统、人脸识别监控管理、人脸识别电脑安全防范、人脸识别照片搜索、人脸识别来防登记、人脸识别atm机智能视频报警系统、人脸识别监狱智能报警系统、人脸识别rfid智能通关系统、人脸识别公安罪犯追逃智能报警系统等等。
人脸识别系统的应用
人脸识别系统其实是台特殊的摄像机,判断速度相当快,只需要0.01秒左右,由于利用的是人体骨骼的识别技术,所以即使易容改装,也难以蒙过它的眼睛。
而且“人脸识别系统”具有存储功能,只要把一些具有潜在危险性的“重点人物”的“脸部特写”输入存储系统,重点人物如擅自闯关,就会在0.01秒之内被揪出来,同时向其他安保中心“报警”。
另外,某些重要区域如控制中心只允许特定身份的工作人员进出,这时候面部档案信息未被系统存储的所有人全都会被拒之门外。
与此前的指纹识别系统相比,人脸识别系统有很多的改进。
指纹技术的使用寿命不如人脸识别系统,使用成本也高于人脸识别系统。
由于沾水、沾汗、沾灰,还有传感器只能在室内使用等原因,指纹识别系统在露天户外使用的可能性很小。
而用于人脸识别的摄像机一天24小时都可工作,第一它不侵犯人权,第二它是很安全的,无论室内还是户外均可使用。
人脸识别系统意味着每个人的脸上都贴着名字,外人看不见,但监控系统能看得见。
包括外国人,从踏入中国的一瞬间,他的图像和个人资料就会进入电脑的控制中心,不管在什么地方出现,都可认出此人。
而且被观察的人不知道有设备在监视他,起到了科技奥运、文明奥运的功能。
人脸识别发展历史介绍
1引言
在我们生存的这个地球上,居住着近65亿人。
每个人的面孔都由额头、眉毛、眼睛、鼻子、嘴巴、双颊等少数几个区域组合而成,它们之间的大体位置关系也是固定的,并且每张脸的大小不过七八寸见方。
然而,它们居然就形成了那么复杂的模式,即使是面容极其相似的双胞胎,其家人通常也能够非常容易地根据他们面孔上的细微差异将他们区分开来。
这使得我们不得不承认这个世界上找不出两张完全相同的人脸!
那么,区分如此众多的不同人脸的“特征”到底是什么?
能否设计出具有与人类一样的人脸识别能力的自动机器?
这种自动
机器的人脸识别能力是否能够超越人类自身?
对这些问题的分析和解答无疑具有重要的理论和应用价值,这正是众多从事自动人脸识别研究的研究人员所面临的挑战。
然而,对这些问题的回答并不像看起来那么容易。
即使在大量来自模式识别、计算机视觉、神经计算、生理学等领域的研究人员对自动人脸识别艰苦工作40余年之后,这些最基本的科学问题仍然困惑着研究人员。
而退一步讲,即使对我们自己,尽管我们每天都在根据面孔区分着亲人、同学、朋友、同事等,大多数人却很难准确地描述出自己到底是如何区分他们的,甚至描述不出自己熟悉的人有什么具体的特征。
即使专门从事相关的生理学、心理学、神经科学研究的一些专家,也很难描述清楚人类人脸识别的生理学过程。
这意味着基于仿生学的人脸识别研究路线在实践上是难以操作的。
当然,飞机的翅膀并不需要像鸟儿的翅膀一样煽动,自动人脸识别的计算模型也未必需要模拟“人脑”。
我们也许可以通过另外的途径,例如建立人脸识别的计算模型,这种计算模型可能是基于仿生神经网络的,也可能是纯粹基于统计的,或者是这二者之外的第三只眼睛,并通过构建实用的自动人脸识别系统来验证这些计算模型,从而找出对上述基本科学问题的解答。
本文首先给出了人脸识别的一个一般计算模型,然后简单回顾自动人脸识别的研究历史,接下来阐述人脸识别的研究现状并介绍几种主流的技术方法,简单介绍计算所人脸识别研究组的研究进展,最后对上述哲学层面的问题作了一些简单的探讨。
2人脸识别发展历史
大体划分为三个时间阶段,如表1所示。
该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。
下面对三个阶段的研究进展情况作简单介绍:
第一阶段(1964年~1990年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(geometricfeaturebased)的方法。
这集中体现在人们对于剪影(profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。
人工神经网络也一度曾经被研究人员用于人脸识别问题中。
较早从事afr研究的研究人员除了布莱索(bledsoe)外还有戈登斯泰因(goldstein)、哈蒙(harmon)以及金出武雄(kanadetakeo)等。
金出武雄于1973年在京都大学完成了第一篇afr方面的博士论文,直到现在,作为卡内基-梅隆大学(cmu)机器人研究院的一名教授,仍然是人脸识别领域的活跃人物之
一。
他所在的研究组也是人脸识别领域的一支重要力量。
总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(1991年~1997年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:
不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的feret人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的visionics(现为identix)的faceit系统。
美国麻省理工学院(mit)媒体实验室的特克(turk)和潘特兰德(pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。
其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(normalizedcorrelation)方法一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(brunelli)和波基奥(poggio)于1992年左右做的一个对比实验,他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能,并给出了一个比较确定的结论:
模板匹配的方法优于基于特征的方法。
这一导向性的结论与特征脸共同作用,基本中止了纯粹的基于结构特征的人脸识别方法研究,并在很大程度上促进了基于表观(appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展,使其逐渐成为主流的人脸识别技术。
贝尔胡米尔(belhumeur)等提出的fisherface人脸识别方法是这一时期的另一重要成果。
该方法首先采用主成分分析(principalcomponentanalysis,pca,亦即特征脸)对图像表观特征进行降维。
在此基础上,采用线性判别分析(lineardiscriminantanalysis,lda)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。
该方法目前仍然是主流的人脸识别方法之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的lda判别方法以及近期的一些基于核学习的改进策略。
麻省理工学院的马哈丹(moghaddam)则在特征脸的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。
该方法通过“作差法”,将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类间差数据都要首先通过主成分分析(pca)技术进行降维,计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进行人脸识别。
人脸识别中的另一种重要方法——弹性图匹配技术(elasticgraphmatching,egm)也是在这一阶段提出的。
其基本思想是用一个属性图来描述人脸:
属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多方向局部特征——gabor变换[12]特征,称为jet;
边的属性则为不同特征点之间的几何关系。
对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点,同时提取它们的jet特征,得到输入图像的属性图。
最后通过计算其与已知人脸属性图的相似度来完成识别过程。
该方法的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。
近来还出现了一些对该方法的扩展。
局部特征分析技术是由洛克菲勒大学(rockefelleruniversity)的艾提克(atick)等人提出的。
lfa在本质上是一种基于统计的低维对象描述方法,与只能提取全局特征而且不能保留局部拓扑结构的pca相比,lfa在全局pca描述的基础上提取的特征是局部的,并能够同时保留全局拓扑信息,从而具有更佳的描述和判别能力。
lfa技术已商业化为著名的faceit系统,因此后期没有发表新的学术进展。
由美国国防部反毒品技术发展计划办公室资助的feret项目无疑是该阶段内的一个至关重要的事件。
feret项目的目标是要开发能够为安全、情报和执法部门使用的afr技术。
该项目包括三部分内容:
资助若干项人脸识别研究、创建feret人脸图像数据库、组织feret人脸识别性能评测。
该项目分别于1994年,1995年和1996年组织了3次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大地促进了这些算法的改进和实用化。
该测试
的另一个重要贡献是给出了人脸识别的进一步发展方向:
光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
柔性模型(flexiblemodels)——包括主动形状模型(asm)和主动表观模型(aam)是这一时期内在人脸建模方面的一个重要贡献。
asm/aam将人脸描述为2d形状和纹理两个分离的部分,分别用统计的方法进行建模(pca),然后再进一步通过pca将二者融合起来对人脸进行统计建模。
柔性模型具有良好的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。
柔性模型目前已被广泛用于人脸特征对准(facealignment)和识别中,并出现了很多的改进模型。
总体而言,这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别商业公司。
从技术方案上看,2d人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。
第三阶段(1998年~现在)
feret’96人脸识别算法评估表明:
主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。
因此,光照、姿态问题逐渐成为研究热点。
与此同时,人脸识别的商业系统进一步发展。
为此,美国军方在feret测试的基础上分别于2000年和2002年组织了两次商业系统评测。
基奥盖蒂斯(georghiades)等人提出的基于光照锥(illuminationcones)模型的多姿态、多光照条件人脸识别方法是这一时期的重要成果之一,他们证明了一个重要结论:
同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。
为了能够从少量未知光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉方法进行了扩展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的7幅同一视点图像恢复物体的3d形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的3幅已知光照条件的图像恢复物体表面的法向量方向),从而可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。
识别则通过计算输入图像到每个光照锥的距离来完成。
以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。
支持向量机是一个两类分类器,而人脸识别则是一个多类问题。
通常有三种策略解决这个问题,即:
类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
布兰兹(blanz)和维特(vetter)等提出的基于3d变形(3dmorphablemodel)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。
该方法在本质上属于基于合成的分析技术,其主要贡献在于它在3d形状和纹理统计变形模型(类似于2d时候的aam)的基础上,同时还采用图形学模拟的方法对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更加有利于人脸图像的分析与识别。
blanz的实验表明,该方法在
cmu-pie(多姿态、光照和表情)人脸库和feret多姿态人脸库上都达到了相当高的识别率,证明了该方法的有效性。
2001年的国际计算机视觉大会(iccv)上,康柏研究院的研究员维奥拉(viola)和琼斯(jones)展示了他们的一个基于简单矩形特征和adaboost的实时人脸检测系统,在cif格式上检测准正面人脸的速度达到了每秒15帧以上。
该方法的主要贡献包括:
1)用可以快速计算的简单矩形特征作为人脸图像特征;
2)基于adaboost将大量弱分类器进行组合形成强分类器的学习方法;
3)采用了级联(cascade)技术提高检测速度。
目前,基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。
这为后端的人脸识别提供了良好的基础。
沙苏哈(shashua)等于2001年提出了一种基于商图像[13]的人脸图像识别与绘制技术。
该技术是一种基于特定对象类图像集合学习的绘制技术,能够根据训练集合中的少量不同光照的图像,合成任意输入人脸图像在各种光照条件下的合成图像。
基于此,沙苏哈等还给出了对各种光照条件不变的人脸签名(signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有效性。
巴斯里(basri)和雅各布(jacobs)则利用球面谐波(sphericalharmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论:
由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。
这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。
这不仅与先前的光照统计建模方法的经验实验结果相吻合,更进一步从理论上促进了线性子空间对象识别方法的发展。
而且,这使得用凸优化方法来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。
feret项目之后,涌现了若干人脸识别商业系统。
美国国防部有关部门进一步组织了针对人脸识别商业系统的评测frvt,至今已经举办了两次:
frvt2000和frvt2002。
这两次测试一方面对知名的人脸识别系统进行了性能比较,例如frvt2002测试就表明cognitec,identix和eyematic三个商业产品遥遥领先于其他系统,而它们之间的差别不大。
另一方面则
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 识别 技术 阅读 答案