人脸识别技术应用于校园管理的关键算法研究 docxWord格式.docx
- 文档编号:17290127
- 上传时间:2022-11-30
- 格式:DOCX
- 页数:14
- 大小:101KB
人脸识别技术应用于校园管理的关键算法研究 docxWord格式.docx
《人脸识别技术应用于校园管理的关键算法研究 docxWord格式.docx》由会员分享,可在线阅读,更多相关《人脸识别技术应用于校园管理的关键算法研究 docxWord格式.docx(14页珍藏版)》请在冰豆网上搜索。
拉普拉斯特征映射[4](LaplacianEigenmaps)是一种不太常见的降维算法,它看问题的角度和常见的降维算法不太相同,是从局部的角度去构建数据之间的关系。
也许这样讲有些抽象,具体来讲,拉普拉斯特征映射是一种基于图的降维算法[5],它希望相互间有关系的点(在图中相连的点)在降维后的空间中尽可能的靠近,从而在降维后仍能保持原有的数据拉普结构。
其缺点是:
(1)该算法具有很高的鲁棒性[6],但是没有考虑到有些数据具有线性关系。
(2)LE算法仅仅定义在部分样本空间的数据点上,而不是整个数据空间,因此新的样本点在嵌入空间中没有对应的投影点,算法的泛化能力不强。
(3)拉普拉斯特征映射算法不能利用流形上某些已知低维信息的数据去学习推测出其它数据的低维信息,扩大流形学习算法的应用范围。
(4)拉普拉斯特征映射方法对邻域选择敏感等存在问题[7]。
(二)局部保持投影算法(LPP)
局部保持投影算法(LPP)[8]是应用于流形学习的降维算法之一,最初为了解决非线性流形学习[9]和分析等领域的相关问题而提出。
LPP可以在不破坏局部邻域关系的前提下进行降维,与其他降维算法相比更能提取出原始人脸图像数据的本质特征,是一种保留了人脸图像空间结构并可以较大程度避免干扰人脸图像识别等诸多因素的降维方法。
这种算法本质上是一种线性降维方法,又由于它充分地利用了拉普拉斯特征映射算法(LE)能够保持原始数据局部邻域关系的优势,将LE算法结合非线性映射的相关知识进行改进,从而能够实现即使对数据进行降维处理后仍能保留数据内部的原始非线性状态,因而克服了线性降维算法的许多缺点和不足。
虽然LPP本质上是一种线性降维方法,同时兼有了流形学习的能力,能够保持高维数据的局部结构,可以获取投影映射,较易获得内嵌低维坐标表示和提取新样本特征。
但是,LPP方法存有如下不足:
(1)LPP容易受到小样本问题的影响;
(2)LPP在投影过程中不能保持数据的全局结构,因为其没有考虑数据的不相邻信息;
传统的LPP算法只能提取某些局部的差异,如表情,光照,姿势等,它忽略了不同人间的差异,例如性别,面部形状,种族等。
(3)LPP是一种无监督学习,没有考虑利用实际数据中有用监督信息,指导和重构邻接矩阵[10]。
三、强制性保留算法(WLPP)介绍
在特征提取过程中,传统的LE算法和LPP算法只能提取某些局部的差异,如表情,光照,姿势等,它忽略了不同人间的差异,例如性别,面部形状,种族等。
有学者们希望不同类样本点在低维空间里被映射的尽可能远,并且还能保持同一类样本点的内部几何结构。
为保留样本点之间的结构信息,提出一种强制性WLPP算法,将类间离散度矩阵加入判别信息,用最大化边际准则解决了样本点重叠问题,克服了小样本问题。
具体步骤如下:
定义原始数据集为
X=[x1,,xN
]∈Rm⨯N
,一共有N
个样本,每个样本有
m维,并且每
个样本点分别属于C个类[x1,xc],找到一个转化矩阵A使把高维数据X投影到低维空
Td⨯N
间,得到相应的低维数据Y=(y1,y2,,yN)∈R,这里(d<
m),且Y=ATX。
为了保持同一类样本点的内部几何结构,构造如下式子:
Cnc
O=∑∑(yc-yc)2Wc
Wi
c=1i.j=1
jij
(3.1)
这里C为样本类别总数,nc是第c类样本,其中
Y=aTX化简式
(1):
Wc
ij是C类样本之间的权值矩阵。
根据
∑∑(yc-yc)2Wc
i
=∑∑(aTxc-aTxc)2Wc
C⎛ncTc
nc
cTTc
cT⎫
=∑ç
ç
∑a
c=1⎝i=1
xiDii(xi)
a-∑a
i.j=1
xiWij(xj)
a⎪⎪
⎭
=aTX(D-W)XTa
=aTXLXTa
(3.2)
Dc=∑Wc
ij
ii
式(3.2)中构造对角矩阵
j。
L=D-W为拉普拉斯矩阵。
WC是相似矩阵。
其
⎡D100⎤
D=⎢0O⎥
⎡W100⎤
W=⎢00⎥
中,⎢⎣0
0DC⎥⎦,
⎢⎣0
0WC⎥⎦。
为了区别不同的样本点,构造全局结构式子:
C
O=∑(m-m)2B
Bi
(3.3)
mi=
n
ik
k=1
mj
为第i类均值。
nj
=yi
njk=1
为第j类均值。
(3)式子化简为:
C⎛1nii
2
j
∑ç
∑yk-∑yk⎪Bij
i.j=1⎝i
njk=1⎪
nj2
⎛1iTi1Tj
∑a
xk-
∑axk⎪Bij
njk=1⎪
C⎡⎛1ni⎫
⎛1nj
⎫⎤2
=∑⎢aTç
∑xj⎪⎪-aTç
∑xj⎪⎥B
i.j=1⎢⎣
⎝ni
k=1⎭
k⎪ij
⎝jk=1⎭⎦
T
=∑[aTp-a
p]Bij
i.j=1
=∑aTpE
pT-∑aTpB
pTa
i=1
iiii
iijj
=aTPGPTa
(3.4)
同理构造对角矩阵Eii。
令G=E-B使:
WLPP的优化模型可表示为:
Eii=∑Bij
⎛Cnc2C2⎫
min(O
-O)=argminç
∑∑(yc-yc)Wc-∑(m-m)B⎪
WBijijijij
⎝c=1i,j=1
i,j=1
⎭(3.5)
将式(3.2)和式(3.4)带入式(3.5)中,可得到目标函数如下:
argmin(aTXLXTa-aTPGPTa)(3.6)化简式(3.6)得到:
argmin(aTVa)
a(3.7)
用拉格朗日对(3.7)式求解得:
λa=Va。
因此特征向量矩阵A=[a1,aN]。
从特征矩阵中选取第2到d+1个特征值对应的特征向量。
即:
A=[a2,ad-1]
四、极端学习机介绍
(一)极端学习机的基本概念
对于N个不同的样本(xj,tj),可表示为X=(x1,x2,,xN)T∈RD⨯N,其中
tj=(tj1,tj2,,tjm)T∈Rm,具有L个隐层节点激活函数为g(x)的ELM[11]模型如下形式:
L
∑βig(ai⋅xj+bi)=tji=1
(4.1)
其中j=1,2,,N,ai=(ai1,ai2,,ain)为连接第i个隐层节点[12]与输入节点的输入权值向量,
βi=(βi1,βi2,,βim)为连接第i个隐层节点与输出节点的输出权值向量,bi为第i个隐层节点的
Tm
偏置值,ai⋅xj表示ai和xj的内积,tj=(tj1,tj2,,tjm)∈R为对应于样本xj的期望输出向量,对所有数据样本进行整合,(4.1)式可以改写为如下形式:
Hβ=T(4.2)
其中H是网络隐层节点输出矩阵,β为输出权值矩阵,T为期望输出矩阵:
⎛g(a1⋅x1+b1)g(aN⋅x1+bN)⎫
H=ç
⎪
g(a1⋅xN+b1)
g(aN⋅xN+bN)⎪
(4.3)
⎛βT⎫
⎛tT⎫⎛t,t⎫
1⎪
1⎪ç
111m⎪
β=ç
⎪
T=ç
⎪=ç
⎪
βT⎪
T⎪ç
⎪
⎝⎭L⨯m,
tN⎪
⎝tN1tNm⎭
(4.4)
Huang等人经过无数次实验最终得出了一个结论:
当网络隐层节点的激活函数[13]可达到无穷可微时,网络的偏移量和输入权值可直接随机赋值而不必采用梯度下降算法迭代调整。
因此单隐层神经网络的监督学习过程可利用最小二乘解的方法对(2.2)式进行求解:
^
β=argminHβ-T
2=H+T
β(4.5)
其中H+为矩阵H的广义逆。
为了增强ELM的应用机能并扩大其普适性能,Huang提出了具有等式优化约束条件[14]的ELM,该极端学习机在最小化输出权值β的同时还能最小化训练误差ξ,因此优化的极端学习机目标公式可归纳为:
N
min1β2+1C∑ξi2
W22
s.t.h(xi)β=tiT-ξiT
i=1,2,,N
(4.6)
(4.6)式中ξi=(ξi1,,ξ1m)T为对应于样本xi的训练误差向量,C为惩罚参数。
在利Lagrange
Multiplier思想时,上述的求解过程即可以当作对无条件最优化问题进行求解。
(二)ELM算法的求解过程
ELM算法求解过程[15]可总结步骤如下:
1)初始化训练样本集;
2)随机指定网络输入权值a和偏置值b;
3)通过激活函数计算隐层节点输出矩阵H;
4)计算输出权值,β=H
T(I
C+HH
T)-1
T。
ELM算法如下图4-1:
图4-1ELM求解过程图
五、实验结果及分析
为了证明本文提出的WLPP算法的有效性,有学者们用sigmoid作为统一的激活函数[16]分别在Yale人脸库、YaleB人脸库和ORL人脸库上进行实验。
在每组数据库中分别随机选取每
类样本点的训练个数为trainnum=(3,4,5,6),其余为测试样本。
并且对比了LPP,方法降
到不同维数下的识别率。
不同的数据库参数设置如表5-1所示,所使用的不同人脸库图像如
图5-1所示
表5-1数据集描述
Datasets
Dim
Samples
samples/subject
Classes
Yale
1024
165
11
15
YaleB
2414
55
38
ORL
400
10
40
(a)Yaledatabase
(b)YaleBdatabase
(c)ORLdatabase
图5-1不同人脸图像的训练集
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)图5-2ELM运用不同降维算法在Yale人脸库识别率曲线
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)
图5-3ELM运用不同降维算法在YaleB人脸库识别率曲线
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)
图5-4ELM运用不同降维算法在ORL人脸库识别率曲线
表5-2不同降维算法在Yale人脸库识别率
(平均值±
相对误差)%
Algorithms
Umist
3Train
4Train
5Train
6Train
LPP+ELM
42.32±
7.20
42.01±
3.70
40.74±
4.02
40.42±
6.24
WLPP+ELM
80.38±
19.62
100.00±
0
表5-3不同降维算法在YaleB人脸库识别率
76.73±
6.03
77.15±
4.80
78.44±
4.64
78.57±
3.00
表5-4不同降维算法在ORL人脸库识别率
73.09±
7.62
71.50±
7.07
71.66±
5.84
73.73±
7.34
实验分析:
图5-2至5-4分别给出Yale、YaleB及ORL数据集在不同降维算法上的识别率曲线。
表5-2至5-4分别给出Yale、YaleB及ORL的具体识别率以及平均识别率和相对误差。
图5-2至5-4可以看出利用WLPP降维算法明显高于其它算法的识别率曲线,因为
WLPP结合ELM算法充分考虑样本点之间的结构信息,因此图5-3至5-4中WLLP算法的识别率几乎接近于100%,但不会总是100%,因为每次生成结果是随机的,但是比较结果不会改变。
虽然在Yale数据集中每类训练样本个数为4时维度出现的波动较大,但是从表5-2可以看出其识别率仍在90%左右,明显高于LPP算法。
由此实验表明WLPP该算法是十分有效的,同时具有良好的稳定性。
六、展望与总结
综上提出的算法避免了样本点重叠和小样本问题,在采集头像样本方面,可节省一定时间,针对于教学工作的应用,将为学校教学管理提供极大的便利。
同时在分类过程中,不仅提取了人脸表情,光照,姿势等局部特征,又考虑到人的面部形状,性别,种族等类别特征。
由实验结果看出WLPP算法消除了数据包含的冗余属性,降低了能量转化,提高了ELM的泛化性能。
运用此算法,有学者们可将人脸识别技术高效应用于校园管理中去。
本文提出的强制性保留算法(WLPP)虽然在LPP算法的基础上降低了能量转化,提高了ELM的泛化性能,但是
WLPP算法是针对LPP算法的部分缺点进行改进的,并没有考虑到改进后的算法是否影响到
LPP算法原来基本结构或者随之产生其他方面的缺陷。
所以WLPP算法只能是相对LPP算法部分有优势,在大的数据库对比分析下WLPP算法的缺陷就会显现出来,所以通过以后的努力学习,需要去解决出现的问题和更加完善WLPP算法。
同时,日后有学者们会在校园中广泛取样,进行更深层次的实验,试运行阶段过后,才能逐步推广。
科学技术日益发展,人脸识别技术也将在各个不同领域得到广泛应用,在教育领域中亦是如此,将此技术算法应用于教学管理工作中,不仅能够对学生起到一定的监督作用提高学生们的出勤率,还可在一定程度上减缓教职员工的工作量,从而提高学校的总体教学质量,改善总体教学水平,进一步推动教育领域智慧校园理论的发展。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人脸识别技术应用于校园管理的关键算法研究 docx 识别 技术 应用于 校园 管理 关键 算法 研究