《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 基于压缩感知的单样本人脸识别
基于压缩感知的单样本人脸识别
2015年微型机与应用第12期
徐志京,叶 丽
(上海海事大学 信息工程学院,上海 201306)
摘要: 提出一种基于压缩感知的单样本人脸识别方法,通过局部邻域嵌入非线性降维和稀疏系数的方法产生冗余样本,则新样本包含了多种姿态和多种表情。将所有的新样本作为训练样本,运用改进后的稀疏表征分类算法进行人脸图像的识别。在单样本情况下,基于ORL人脸库和FERET人脸库的实验证明,该方法比原稀疏表征方法在识别率上分别提高了15.53%和7.67%。与RSRC、SSRC、DMMA、I-DMMA等方法相比,该方法同样具有良好的识别性能。
Abstract:
Key words :

  摘  要: 提出一种基于压缩感知的单样本人脸识别方法,通过局部邻域嵌入非线性降维和稀疏系数的方法产生冗余样本,则新样本包含了多种姿态和多种表情。将所有的新样本作为训练样本,运用改进后的稀疏表征分类算法进行人脸图像的识别。在单样本情况下,基于ORL人脸库和FERET人脸库的实验证明,该方法比原稀疏表征方法在识别率上分别提高了15.53%和7.67%。与RSRC、SSRC、DMMA、I-DMMA等方法相比,该方法同样具有良好的识别性能。

  关键词: 人脸识别;单样本;稀疏表征分类;局部邻域嵌入非线性降维

0 引言

  人脸识别技术是一种通过分析比较人脸视觉特征信息进行身份鉴别的计算机技术[1]。人脸识别受表情、姿态等多因素影响,其仍是生物特征识别领域最困难的研究课题之一。同时,因样本采集成本大、存储空间受限等造成了单训练样本问题,这使得人脸内在特征的提取变得更加困难[2]。在人脸训练数据库中每人仅有一幅图像的情况下,多数传统方法的识别性能将严重下降。压缩感知[3](Compressed Sensing,CS)是近年来新兴的信号处理方法。利用压缩感知理论,WRIGHT J等人[3]提出了一种稀疏表示人脸识别算法(Sparse Representation-based Classification,SRC)。SRC方法在局部遮挡、噪声等问题上具有相当的鲁棒性。针对单样本问题,本文提出了一种基于压缩感知的单样本人脸识别方法。该方法首先利用局部邻域嵌入非线性降维和稀疏系数将一幅人脸图像扩展为姿态表情各不同的图像,将所有新的样本作为训练样本,最后采用改进的稀疏表征方法进行识别分类。

1 压缩感知理论与SRC算法改进

  1.1 压缩感知(CS)

  CS作为一个新的理论框架,它能以远低于奈奎斯特频率对信号进行采样。

  压缩感知理论主要包括三个方面的内容:

  (1)信号x∈Rn的稀疏表示问题:x=Ψα。

  (2)信号低速采样问题:y=Φx。Φ是M×N维的观测矩阵,与稀疏基Ψ的乘积要满足有限等距性质。确保在降低维数的同时原始信号的信息损失也最小。

  (3)信号重构问题。从线性观测y=Aα中无失真地恢复信号(其中A称为CS信息算子,A=ΦΨ),它基于如下严格的数学最优化(Optimization)问题:

  1.png

  在信号足够稀疏下,基于L0和L1最小化等价的理论,可将L0范数转换成L1范数:

  2.png

  1.2 SRC算法

  SRC的基本思想是:将不同类别的样本组合成一个超完备字典,测试样本可由同一类的训练样本的线性组合来表示。算法可通过测试样本相对于超完备字典的稀疏表示系数区分出测试样本中所属类别。

  在人脸识别问题上,若第i类中有足够的训练样本Ai=[vi,1,vi,2,…,v],就可使用该类训练样本线性组合一幅新的同类人脸图像x∈Rn:x=Aiαi,2UR)3Z0{RETVL{]L8AI_YYV.png。若不知测试样本所属类别,可将所有C个类别的6Q5O9EVET09F~UB)S%US3~S.png个训练样本组合起来,形成一个新的矩阵Ψ:

  Ψ=[A1,A2,…,Ac]

  则x可线性表示为:

  x=Ψα∈Rn(3)

  理想条件下α=[0,0,…,0,αiT,0,0,…,0]T,该系数向量中除了与第i类有关的系数之外,其他元素都为0。

  再利用L1范数最小化求解α,最后计算残差ri=  ‖x-Aiαi‖来决定测试样本属于哪一类。

  1.3 基于SRC的改进算法

  本文提出的算法采用了非常稀疏投影矩阵作为观测矩阵Φ,降低图像维度。参考文献[4]已证明非常稀疏投影矩阵不仅满足CS测量矩阵的必要条件,而且比高斯矩阵有更好的测量效果。在L1最小化问题上,利用对偶增广拉格朗日乘子算法寻求最优稀疏解。其原理是先将L1范数最小化问题式(2)转化为对偶问题:

  4.jpg

  其中α是拉格朗日乘子,通过交替迭代α、t、z,求(4)式的极值,即保证了重构的精确度又降低了算法的运算度。最后为了更加精确地分类,利用加权残余确定类别。

  算法步骤如下:

  (1)输入C类N个训练样本,构成字典矩阵Ψ∈Rn×N。

  (2)产生每列都归一化的非常稀疏投影矩阵A)]8YVKJHTB0`W@2AB$E64W.jpg∈Rn×N,其中122DAW7G(8[5[_IF}$9_{`E.jpg,而hij服从非常稀疏投影分布,即:

  @3AUGNWCKI4EC(OXA21RM$I.jpg

2 冗余样本的生成

  单样本问题的难点是每个对象只有一个样本,这使得考虑类内差异的一些成熟算法识别率低。解决单样本问题的一个有效途径是增加与现实相符合的冗余样本。这种扩充训练样本个数的方法充分利用了一幅训练样本中的有用信息,便于进一步的识别分类。

  2.1 多姿态样本的生成

  生成多姿态样本的方法是基于局部邻域嵌入非线性降维理论[5]的。具体方案步骤是:

  (1)将所有人脸图像先进行小波变换,再表示为列向量形式。

  (2)设输入的某姿态人脸图像为Ii,将其视为高维空间中的一点,而相同姿态训练集人脸图像Tin(包括N个图像)作为Io点的邻近点,再根据局部邻域嵌入非线性降维理论求解近邻点的权值。

  (3)设目标姿态的训练集人脸图像Ton(包括N个图像),而待合成的目标姿态人脸图像为Io,然后利用步骤(2)中解出的权值反算出一个高维空间的点,即为目标角度人脸图像向量。

  (3)将目标姿态人脸图像向量表示为矩阵形式,再进行小波逆变换。

001.jpg

  这种方法能快速地生成多姿态样本,且克服现有的同类方法复杂、效果不佳的问题。图1是原人脸图像及其生成的多姿态样本,其中(a)为输入图像,(b)分别为生成的不同姿态图像,而(c)为真实图像。

  2.2 多表情样本的生成

  生成多表情样本的方法是基于稀疏表征的。保证所有图像大小统一,图像中眼睛、鼻子、嘴巴在各自图像中的同一个固定位置。在训练集中选取与训练样本具有相同表情的人脸图像作为变换基,使该变换基能近似地线性表示测试图像,求解出稀疏表示系数。同时选取包含目标表情的人脸图像组成数组。最后利用该数组和稀疏表示系数重构出目标表情人脸。

002.jpg

  该方法因为没有复杂的提取人脸特征的步骤,从而算法的复杂度也相对降低了。图2是同一张人脸生成的多表情的人脸图像,其中(a)为输入的高兴的人脸测试图像,(b)~(f)分别为生成的生气、厌恶、害怕、伤心、惊讶的人脸图像,而(g)为真实图像。

3 实验设计及仿真结果

  本文实验是基于ORL、FERET人脸数据库的。选取每个人的一幅图像作为训练样本,剩余的人脸图像作为测试样本。实验前统一将图像数据的大小修改为48×48。在单样本情况下,本文首先分别基于姿态库和表情库对单幅训练样本采取上文的方法扩充样本个数,以生成多姿态多表情的新图像,然后将原训练样本和新样本作为训练集,最后采用改进的稀疏表征算法进行识别分类。

  3.1 ORL人脸库

  ORL人脸库是由40个人的灰度图像构成的,共有400张图片。图3描绘了使用不同个数冗余样本下的识别率。

003.jpg

  从图3中可以看出,冗余样本的个数不够多时,识别率也偏低。随着冗余样本个数的增加,识别率大幅度增高,但当冗余样本达到8个时,识别率增长缓慢,几乎平缓。原因是训练样本太少时,样本的内蕴特征太少,此时冗余样本个数是影响识别效果的主要原因。但随着冗余样本个数的不断增加,造成大量的冗余信息,而冗余样本集与原始数据集的数据分布有不一致的地方,此时增加冗样本的个数对识别率作用不大。

005.jpg

  将本文的算法与SRC算法、参考文献[6]、[7]中的方法进行比较,表1为比较结果。从表1可以看出,本文所提出的方法识别率高于原SRC方法15.53%,也比参考文献[6]、[7]中的算法具有更好的识别性能。

  3.2 FERET人脸库

004.jpg

  FERET人脸库的1 400幅图像共有200个人,每人7幅人脸图像。图4描绘了基于FERET人脸库使用不同个数冗余样本下的识别率。

006.jpg

  参考文献[7-9]就单样本人脸识别问题也做了大量的研究。通过表2可以看出,本文方法应用在FERET人脸库上的单样本人脸识别率比原SRC方法提高7.63%,也比DMMA等算法具有更好的识别性能。表2为本文方法应用在FERET人脸库上的单样本人脸识别率。

4 结论

  针对人脸识别研究的单样本问题,本文提出了一种基于CS的单样本人脸识别算法。经对比实验表明,该方法不仅充分利用单个样本的特征信息,生成新的图像,而且很大程度上提高了单样本情况下的识别率,为单样本人脸识别技术提供了新的方法。

  参考文献

  [1] 王明军.基于压缩感知的人脸识别算法研究[D].西安:西安电子科技大学,2012.

  [2] Wang Jie, PLATANIOTIS K N, Lu Juwei, et al. On solving the face recognition problem with one training sample per subject[J].Pattern Recognition, 2006,39(9):1746-1762.

  [3] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009,31(2):210-227.

  [4] 方红,章权兵,韦穗.基于非常稀疏随机投影的图像重建方法[J].计算机工程与应用,2007,43(22):25-27.

  [5] 马瑞,宋亦旭.基于局部线性嵌入非线性降维的多流行学习[J].清华大学学报(自然科学版),2008,48(4):583-586.

  [6] Chang Xueping, Zheng Zhonglong, Duan Xiaohui, et al. Sparse representation-based face recognition for one training image per person[A]. Advanced Intelligent Computing Theories and Applications[C]. Berlin Heidelberg: Springer, 2010:407-414.

  [7] 单桂军.基于虚拟样本扩张法的单样本人脸识别算法研究[J].科学技术与工程,2013,13(14):3908-3911.

  [8] Lu Jiwen, Tan Yap-peng, Wang Gang. Discriminative multimanifold analysis for face recognition from a single training sample per person[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(1):39-51.

  [9] NABIPOUR M, AGHAGOLZADEH A, MOTAMENI H. Multimanifold analysis with adaptive neighborhood in DCT domain for face recognition using single sample per person[C]. 2014 22nd Iranian Conference on Electrical Engineering(ICEE), IEEE, 2014:925-930.


此内容为AET网站原创,未经授权禁止转载。