人脸识别是模式识别研究领域的重要课题,也是一个目前非常活跃的研究方向。它一般可描述为:给定一个静止或视频图像,利用已有的人脸数据库来确认图像中的一个或多个人。近年来,关于人脸图像线性鉴别分析方法的研究激起了人们的广泛兴趣,其焦点是如何抽取有效的鉴别特征和降维。特征抽取研究肩负两方面的使命:寻找针对模式的最具鉴别性的描述,以使此类模式的特征能最大程度地区别于彼类;在适当的情况下实现模式数据描述的维数压缩,当描述模式的原始数据空间对应较大维数时,这一点会非常有意义,甚至必不可缺。
在人脸图像识别中,主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量的 m 个观察值,形成一个 n ′ m 的数据矩阵, n 通常比较大。对于一个由多个变量描述的复杂事物,人们难以认识,那么是否可以抓住事物主要方面进行重点分析呢?如果事物的主要方面刚好体现在几个主要变量上,我们只需要将这几个变量分离出来,进行详细分析。但是,在一般情况下,并不能直接找出这样的关键变量。这时我们可以用原有变量的线性组合来表示事物的主要方面, PCA 就是这样一种分析方法。
以上方法在处理人脸等图像识别问题时,遵循一个共同的过程,即首先将图像矩阵转化为图像向量,然后以该图像向量作为原始特征进行线性鉴别分析。由于图像矢量的维数一般较高,比如,分辨率为100×80的图像对应的图像向量的维数高达8 000,在如此高维的图像向量上进行线性鉴别分析不仅会遇到小样本问题,而且经常需要耗费大量的时间,有时还受研究条件的限制(比如机器内存小),导致不可行。针对这个问题,人们相继提出不少解决问题的方法。概括起来,这些方法可分为以下两类:从模式样本出发,在模式识别之前,通过降低模式样本特征向量的维数达到消除奇异性的目的,可以降低图像的分辨率实现降维;从算法本身入手,通过发展直接针对于小样本问题的算法来解决问题[6,7].
本文基于主成分分析的思想,从原始数字图像出发,在模式识别之前,先对整个图像训练矩阵集进行分块,该块中的图像尽可能具有同样的性质,从而更接近于高斯分布;再用PCA方法对每个分块得到的子图像训练矩阵进行分析,得到多个变换矩阵,通过这些变换矩阵将训练图片向量和测试图片向量投影到特征空间进行鉴别。这样做主要基于如下考虑:在传统的PCA算法中,要求训练集符合高斯分布,得到的结果才是理想的,但是实际操作中训练样本由于光照、表情、姿态等因素远离高斯分布,而改进的PCA算法通过对其进行归类训练子训练集(由于影响因素较小,更接近于高斯分布)提取主元,同时该方法可以增加主元的维数,能提供更多的有效特征。在着名的FERET人脸库上的试验结果表明,本文提出的方法在识别性能上明显优于传统的PCA方法,识别率有显着提高。