人脸识别技术概述(三)
2015-10-07
3、人脸识别的优势与困难
3.1优势
人脸识别的优势在于其自然性和不被被测个体察觉的特点。所谓自然性,是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。不被察觉的特点对于一种识别方法也很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而更有可能被伪装欺骗。
3.2困难
人脸识别被认为是生物特征识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸作为生物特征的特点所带来的。
相似性:不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。
易变性:人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。
在人脸识别中,第一类的变化是应该放大而作为区分个体的标准的,而第二类的变化应该消除,因为它们可以代表同一个个体。通常称第一类变化为类间变化(inter-class difference),而称第二类变化为类内变化(intra-class difference)。对于人脸,类内变化往往大于类间变化,从而使在受类内变化干扰的情况下利用类间变化区分个体变得异常困难。
3.3主要用途
人脸识别主要用于身份识别。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑是最佳的选择,采用快速人脸测试技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。
4、人脸图像采集及检测定位
4.1人脸图像采集
不同的人脸图像都能通过摄像镜头采集下来,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。当用户在采集设备的拍摄范围内时,采集设备会自动搜索并拍摄用户的人脸图像。
4.2人脸检测定位
人脸检测定位是人脸分析中的第一步,它要在输入图像中搜索人脸,并确定人脸的位置和尺寸信息。从单幅图像中进行人脸检测定位常需要克服由于人脸朝向不同、光照条件的改变、景物遮挡的存在,甚至不同表情给人脸外观带来的变化等一系列问题。在为识别而进行的人脸检测定位中,一般设人在图像中的存在性是否确定的,否则常需要先对人进行检测。在通常情况下,并不能设一副图像中只有一个人脸,如只有一个人脸则常可直接采用人脸分割的方法。人脸与人体的分离也是一个困难的问题,一般也不用目标检测的方法。
人脸特征定位是近年来图像处理领域的热点问题之一,很多学者已经提出各种各样的定位算法,主要有常用的三类方法[5]:第一类方法是基于整体人脸的灰度模板匹配的方法,这种方法运算量太大,且受亮度变化影响太大。第二类方法是人工神经网络方法,通过大量样本的训练,最后对图像各区域进行判决。该方法在理论上十分可行,但是训练样本的选择和网络收敛均非易事。第三类方法是肤色检测的方法,这种方法利用了数字图像的彩色信息,大大提高了检测的速度,基本能做到实时检测并且不受人脸旋转或人侧转的影响,但由于肤色空间和其他颜色空间的交叉性,已有的方法只能限制在简单的背景,在复杂的背景图像中误检率非常高。
而近年来, 也有些国内外学者们根据定位所依据的基本信息的类型,将现有的脸部特征定位方法分为基于先验规则、基于几何形状信息、基于色彩信息、基于外观信息和基于关联信息等5 大类 。
1) 基于先验规则 先验规则是关于脸部特征一般特点的经验描述。 人脸图像有一些明显的基本特征, 如脸部区域通常包括双眼、鼻和嘴等脸部特征, 其亮度一般低于周边区域; 双眼大致对称, 鼻、嘴分布在对称轴上等。 为了利用这些基本特征进行脸部特征定位, 一般要先对输入图像作变换, 使所要使用的特征得到强化, 而后根据规则从图中筛选出候选点或区域。 此类方法的难点在于, 如何将人们的直观印象精确地表述为可应用的代码化规则, 以及如何处理规则的精确性与普适性之间的矛盾。
2) 基于几何形状信息 几何形状信息, 即目标对象的几何形状特征, 具有很好的直观性, 易于理解和应用, 因而很早就在模式识别领域得到广泛的使用。 基于几何形状信息类方法的一般思路是:根据脸部特征的形状特点构造一个带可变参数的几何模型, 并设定一个相应的评价函数以量度被检测区域与模型的匹配度, 搜索时,不断调整参数使能量函数最小化, 使模型逐渐收敛于待定位的脸部特征。
3) 基于色彩信息 色彩信息类方法的基本思想是用统计方法对目标对象的色彩建模, 在搜索中根据被测点的色彩与模型的匹配度, 筛选出待测特征的可能位置。 色彩信息在人脸检测中有广泛的应用, 而在脸部特征定位方面的应用则相对较少, 这是因为, 肤色在色彩空间中具有聚合性, 而脸部特征的色彩信息较为复杂, 如眼与嘴, 以及眼睛的瞳孔与眼白的色彩有显著区别,这给统一建模造成了一定的难度。
4) 基于外观信息 与几何信息类方法和色彩信息类方法不同的是, 外观信息类方法不再面向像素级判断, 而是将一定区域(窗口) 内的图像整体视作一个随机变量, 并映射为高维空间中的一个点。 这样,同一类型的脸部特征就可以描述为高维空间中的一个点集, 可以用统计方法对其分布规律建模, 在搜索中, 通过计算待测区域与模型的匹配度即可判定其是否包含目标脸部特征。 这类方法对图像质量、环境条件和目标对象状态等方面的变化有较好的适应能力, 近年来引起研究者们的广泛关注。
5) 基于关联信息 上述方法大多从局部着眼, 试图依据像素本身(色彩信息类方法) 或邻近像素之间的相互关系(几何、外观类方法) 来做出判断, 但局部信息的区分度有限, 在不受限制的条件下往往存在着大量的相似点, 这就增大了后期处理的难度。 为了解决这个问题, 研究者们引入了关联信息, 试图利用脸部特征之间存在着的较稳定的相对位置关系来缩小候选点范围。 与前面提到的先验知识不同的是, 这些方法所使用的关联信息都是通过统计学习得到的。
