《电子技术应用》

人脸识别技术概述(二)

2015/10/7 20:55:00

2 常用的人脸识别方法

    Brunelli和 P oggiol6 认 为,人脸识别技 术和方法可以分为两大类 :基于几何特征(G eom etric F ea-ture— based ) 的方 法 和 基 于 模 板 匹 配 (T em plateM atching— based)的方法. 基于几何特征方法 的思想是首先检测出嘴 巴、 鼻子 、 眉毛 、 眼睛等脸部主要部件的位置和大小 ,然后利用这些部件 的总体几何 分布关系以及相互之间的参数 比例来识别人脸. 基于模板的方法利用模板和整个人脸图像 的像素值之间的自相关性 进行识 别  这类 方法也叫做基 于表 象(A ppearance— based )的方法. 虽然后来出现了很多新的人脸识别技术和方法 , 然 而这些技术和方法仍然可以按照 Brunell i和 P oggio 的方法分类。

    本文系统分析了现今常用的人脸识别方法,将人脸识别方法分为基于几何特征的方法、 基于模 型的方法、 基于统计的方法、基于神经网络的方法和多分类器集成方法。

2.1  基 于几 何特 征 的方法

    文献中记载最早 的人脸识别方法就是 Bledsoe提出的基于几何特征的方法_7], 该方法 以面部特征点之间的距离和比率作为特征 ,通过最近邻方法来识别人脸. 以该方法 建立 的人脸识别系统是一个半自动系统,面部特征点必须由人手工定位。也正是由于人工的参与,该系统对光照变化和姿态变化不敏感。

    K anade[8]首先计算眼角、鼻孔、 嘴巴、 下巴等面部特征之间的距离和它们之间的角度 以及其它几何关系, 然后通过这些几何关系进行人脸的识别工作.在一个 2o 人的数据库上识别率为 45% 一75%。

    Brunelli和 Poggio_6 通过计算鼻子的宽度和长度 、 嘴巴位置和下 巴形状 等进行识别 , 在一个 47 人的人脸库上的识别 率为 90% 。然 而, 简单模板 匹配方法在同一人脸库上的识别率为 100% 。

    侧影 (P rofile)识别 也是早期基于几何特征人脸识别的一个重要方法 , 其基本原理是从人脸 的侧影轮廓线上提取特征点 , 将侧影转化为轮廓曲线, 从中提取基准点 。 根据 这些点之 间的几何特征来进行识别. 由于侧影识别相对较简单且应用面小, 对侧影识别 的研究较少。

    基于几何特征 的方法非常直观 。 识别速度快 , 内存要求较少 , 提取 的特征在一定程度上对光照变化不太敏感. 但是 , 当人脸具有一定 的表情或者姿态变化时 , 特征提取不精确 ,而且由于忽略了整个图像 的很多细节信息 , 识别率较低 , 所以近年来 已经很少有

新的发展。

2.2 基于模型的方法

    隐马 尔 可 夫 模 型 (H idden M arkov M odel。H M M )是一种常用的模型, 基于 H M M 的方法首先被用于声音识 别等 身份识别 上 , 之后 被 N efian 和H ayes 引入到人脸识别领域  .它是用于描述信号统计特性的一组统计模型. H M M 用 马尔可 夫链来模拟信号统计特性 的变化, 而这种变化又是 问接通过观察序列来描述 的, 因此马尔可夫过程是 一个 双重的随机过程. 在 H M M 中结点表示状态, 有 向边表示状态之间的转移 , 一个状态可 以具有特征空间

中的任意特征, 对同一特征 , 不同形态表现出这一特征的概率不 同. 在人脸识 别过程 中, N efian 首 先采用两维离散余 弦变换 (D iscrete Cosine T ransform ,D C T ) 抽取人脸特征 , 得到观察 向量, 构建 H M M 人脸模型 , 然后用 E M (E xpectati on M axi m i zati on )算法[n]i jl I练. 利用该模型就可以算 出每个待识别 人脸观察向量的概率 , 从而完成识别. H M M 方法 的鲁棒性较好 , 对表情、 姿态变化不太敏感 , 识别率高。

    主动形状模型 (A ctive Shape M odel,A SM )方法 由 Cootes 等人 提 出It2], Cootes 对 形状和局 部灰度表象建模 , 用建立 的 A SM 在新 的图像 中定 位易变的物体. 后来, L anitis 等将 其应用于解释人脸 图像 , 在使用 A SM 找出人脸 的形状后 , 将人脸切割并

归一到统一的框架 , 对这个 与形 状无关 的人脸采用亮度模型来进行解释和识别。

    主动 表 象 模 型 (A ctive A ppearance M odel,A A M )可以看成是对 A SM 的进 一步扩展l _1 lf 1], 是一种通用的非线性 图像 编码模式 , 通过变形处理将通用人脸模型与输 入图像进行 匹配 , 并将控制参数作为分类的特征向量.

2.3 基于统计的方法

    基于统计 的方法将人脸图像 视为随机 向量 , 从而用一些统计方法 来分析人脸模式 , 这类方法有着完备的统计学理论支持; 得到了较好地发展 , 出现了一些较成功的算法.

    特征脸 (E igenface)方法由 T urk 和 Pentland_1 5_提 出. 对于每一幅人脸图像 , 按 照从上到下 、 从左到右 的顺序将所有像素 的灰度值 串成一个高维 向量,然 后 通过 主成分 分 析 (P rincipal C om ponent A naly—sis。 P C A )[ 将高维 向量降低维 数. 用 PC A 降维主要基于以下三点 : (1)压缩功能 。 在低维空间内 比较图像将提高计算效率 ; (2)人脸样本的分布近似正态分布。 方差大的维可能与有用信号相关, 而方差小的维可能对应噪声 , 因此去掉小方差对应 的维将有利于提高识 别精确率 ; (3)因为每 幅图像都被 减去均值 , 且被放缩成单位向量 , 两幅图像之间的相关性与特征空间中投影之间的距离成反 比, 因此特征空间

中的最近邻匹配是图像相关性 的有效近似. PC A 技术首先 由 K irby 和 Sirovi ch 引 入 到 人 脸 识 别 领域  , 并且证明 了 PC A 是使 原始图像 与重构 图像之间的均方误差极小化的最佳压缩方式. 一 幅图像在各个特征脸上 的投影组成 了该 图像 的权值向量,将待识别图像的权值 向量与人脸数据库 中各图像的权值向量相 比较 , 确定哪一幅 图像与待识别 图像的

权值向量最接近.后来 Pentland 等人L1 ]进一步扩展了特征脸方法  将类似的思想运用到面部特征上 ,分别得到了本征眼、 本征鼻、 本征嘴, 并且将 它们结合起来进行人脸识别.实验结果表明,这样比单独使用特征脸效果更好. 特征脸方法计算量低 ,使用方便,并且效果 良好 ,目前已经成为人脸识别的基准程序(Benchm ark)和事实上的工业标 准.但是它对于外界因素所带来的图像差异和人脸 自身所造成的差异是不加区分的, 因此外界因素(例如光照、 姿态)变化会 引起识别率的降低.

    特征脸方法使用由各个特征脸扩展的空间来表示人脸, 虽然可以有效地表示人脸信息, 但是并不能有效鉴别和区分人脸. 很多研究 者提 出了使用其他线性空间来代替 特征脸空间 以取得 更好 的识别 效果. 此中线性判别分析 (L inear D iscrim inate A naly—sis,L D A )方法(也叫 F isher脸方法) 9]利用了类别归属信息 ,它选择类内散 布正交 的矢量作为特征脸空间, 从而压制 了图像之间与识别信息无关的差异,强调 了不同人脸之间的差别 , 同时弱化 了同一人脸由于光照 、视角和表情而引起 的变化, 获得了比特征脸更好的识别效 果. L D A 是一种 监督学 习方法 ,而PC A 是非 监督学 习方法.Belhum eur_ _J 9J对 16 个人的各 10 幅图像进行识别实验 ,PC A 方法 的识别率为 81%,而 F isher脸方法的识别率为 99.4 %.

    M oghaddam 等人提出贝叶斯人脸识别方法 .他们提出了一种基于概率的图像相似度度量方法 , 将人脸图像之间的差异分 为类问差异和类 内差异 ,其中类间差异表示不同对象之问的本质差异,类内差异为同- - x~象 的不 同图像之 间的差异 ,而实际人脸图像之 间的差异为两者之和. 如果类 内差异大于类问差异 , 则认 为两人脸 图像属于同一对象的可能性大.他们提出了类 闯差异和类内差异度量的概率模型和计算方法 由于贝叶斯相似度 的计算涉及复杂的非线性计算 , M oghaddam 等人提出了一种线性 的快速计算方法. 这种人脸识别方法在 1996 年美国 D A PA R 组织的 F ER ET 人脸测试Ⅲ中是效果最好的方法之一, 特别是在克服光照 和表情变化对识别的影响方面性能较好.

    奇异值 分 解 (Singul ar V alue D ecom positi on ,SV D ) 1 ]是一种有效 的代数特征提取方法. 奇异值特征具有 良好的稳定性 、 转置不变性 、 旋转不变性 、位移不变性 以及镜像变换 不变性等重要性质 , 因此奇异值分解技术也被应用到人脸识别领域.

    独立成分分析(Independent C om ponent A nal—ysi s, IC A )_ _2。 可 以看成是 对 PC A 的推广. P C A 利用二阶矩去掉输入数据 的相关性 , 使得数据的协方差为零, 而 IC A 使得输入数据的二阶和高阶矩依赖性最 小. IC A 首先被 用 于盲源 分 离 (B lind SourceSeparation , B SS )问题 , 用来将 观察信号分解 成一系列独立信号的线性组合. IC A 用于人脸识别有两种结构(I(2A A rchitecture I 和 IC A A rchitecture II)和多种算法 (例如 F astIC A 和 InfoM ax )口 ,PC A和 IC A A rchitecture II 利用 的是全局特征 , 而 IC AA rchitecture I 利用的是空间局部特征. B D raper 等人_2 详细比较了 PC A 和 IC A 在人脸验证和面部表情识别 中的性能. 人脸验证实验 中, IC A A rchitec—ture II 的性能最好 , PC A 的性能与距离度量标准有关 , IC A A rchitecture I 的性能较差 , IC A 用 F astI—C A 算法较好 ; 表情识别实验中, 用 InfoM ax 算法实现的 IC A A rchi tecture I性能最好.

2.4 基于神经网络的方法

    神经 网络在人脸识别领域有很长的应用历史 ,1994 年就出现了神经网络用于人脸处理的综述性文章.

    Kohonenc 最早将自组织映射(Self O rgani—zing Map,SOM )神经 网络用于人脸识别.他利用

SOM 的联想能力“ 回忆” 人脸. 即使当输入人脸图像具有较大噪音干扰或者有部分 图像丢失时,也能恢复出完整的人脸.

    动态链接结构(D ynam ic L ink A rehitecture,DLA )是用于人脸识 别 的最有影 响的神经 网络方法.DIA 试图解决传统的神经网络中一些概念性问题,其中最突出的是网络中语法关系的表达.DIA 利用突触的可塑性将神经元集合划分成若干图结构,同时保留了神 经网络的优点.DLA 使 用G abor 小波来表示 图像的特征.

    Law rence和Giles 等人采用将 自组织映射神经网络(S()M )与卷积神经网络相结合 的混合 神经网络方法进行人脸识别.SO M 实现对 图像的采样向量降维 ,且对图像样本的小幅度变形不敏感 ; 卷积网络用来实现相邻像素间的相关性知识 , 在一定程度对图象的平移 、 旋转 、 尺度和局部 变形不敏感. 在O R I 人脸 库 8]上进 行仿 真实验 ,与用 K arhunen —I. o6ve 变换代 替 S()M 或 者用 多层 感知 器 (M ulti—L ayer P erceptron ,M I P )代替 卷积 神经 网络相 比,该方法取得 了较低的错误率; 与特征脸方法相 比,当待识别对象的训练样本数从 1 到 5 变化时,该方法都取得了较好的识别性能。

    I in 和 K ung_2 9l提出了一种基于概率决策的神经 网 络 (P robabilistic D eci si on— Based N eural N et—w ork,PD B N N )人脸识别方法. 主要原理是采用虚拟样本进行强化和反 强化学 习, 从 而得到较理想的概率估计结果, 并且采用模块 化的网络结构加快网络 的学 习.

    用于人脸识别 的神经网络还有 : M L P 的一种变形——时滞 神 经 网 络 (T im e D elay N eural N et—w orks, T D N N )Eao】 、 径 向 基 函数 网络 (R adial B asisF unction N etw ork , R B F N )[ ]. R icanek 等 人[驼 ]采用 的 H opfield 网络 , 能有效地实现低    分辨率人脸 的联想和识别.神经网络方法较其他人脸识别方法有着特有的优势, 通过对神经 网络 的训练可 以获得其他方法难以实现的关于人脸图像的规 则和特征 的隐性表示,避免了复杂的特征抽取工作 , 并有利于硬件的实现.缺点主要在于其方法的可解 释性较弱 ,且要求多张人脸图像作为训练集 , 只适合于小型人脸库.

2. 5 多分类器集成方法

    将多个学习系统(例如分类器)组合是 目前机器学习的热门课题之一,这种技术 已经被广泛运用到模式识别之 中. 当前人脸识别方法都只能在特定约束条件下取得较好的性能 ,然而在现实应用 中,人脸的表象会因为光照方 向、 姿态 、 表情变化而产生较大的变化, 每种特定 的识别器只对其中一部分变化 比较敏感 ,因此,将可以整合互补信息的多个分类器集成能够提高整个系统 的分类准确率.

    Gutta 等人口3]提出将集成的RBF与决策树(D ecision T ree)结合起来进行人脸识别. 结合 了全局的模板匹配和离散特 征的优点 ,在一个 350 人 的人脸库上测试,取得了较好的实验结果.

    H uang 等人 在多特征脸空间的基础上 , 采用神经网络集成(N eural N etw ork Ensem ble)的方法,实现 了对多视角人脸 的识别. 首先将人脸深度方 向的偏转角度人为的分为几组 (多个视 角),然后为每个视角训练一个神经 网络 ,最后对所 有视角对应的多个神经网络的输出进行集成. 实验表明, 该方法不必预先估计偏转角度就可 以取得较好 的识别性能 ,而且能实现人脸偏转角度的自动判断.

    Lu等人I3朝通 过将 PC A 、IC A 、L D A 进行集成进行人脸识别.首先分别用这三种方法对同一张人脸进行识别 ,每种方法的识别分为测试人脸 与数据库中人脸的投影向量之间夹角的余 弦值 ; 然后用简单求和方式或 R BF 网络对三个得分进行集成. 在一个包含有 206 个人 , 每人 1O 张照片的人脸库上进行实验 , 集成方法的识别性能最 好,简单求和方式 比R BF 网络集成方式性能略好.




继续阅读>>