O 引言
计算机人脸识别是模式识别和人工智能领域的一个前沿课题,有着十分广泛的应用前景。人脸自动识别系统主要包括人脸检测和定位,人脸特征的提取和识别两个主要部分。
数学形态学是一种基于集合论的非线性理论,是格理论在空间结构上的应用,其基本思想是基于像素间的逻辑关系而非代数关系。这种处理方式有利于对图像的几何描述,不同于其它基于代数的线性图像处理理论,具有不模糊图像边界及细节的特点,是一种用于图像处理的新理论和新方法。
1 肤色区域检测
一般情况下图像是以RGB形式存放的,但是RGB表示方法不适合于皮肤模型。在RGB空问,三基色(r,g,b)不仅代表了颜色,还表示了亮度。由于周围环境光照的改变,亮度可能使人脸的检测变的更加复杂,在皮肤的分割过程中是不可靠的。为了利用肤色在色度空间的聚类性,需要把颜色表达式中的色度信息与亮度信息分开。将RGB转换为色度与亮度分开的色彩表达空间就可以达到这个目的。在实验中选用YCbCr空间经行肤色区域检测。Cb和Cr分量分别表示蓝色和红色的色度,这两种色度在光照改变时是稳定的,Y代表容易被改变的亮度信息。该颜色空间可以从RGB格式线性变换得到,转换公式为
亚洲人和欧美人的人脸肤色的色调一般介于红和黄之间。为了确定人脸肤色在各个颜色分量上具有较强代表性的取值范围,Douglas Chai在实验中选取脸上除去眼睛、嘴唇、等区域,并且选取分别在不同光照、环境、分辨率下得到的人脸,最终得到的肤色分布范围如图(1)所示在左边的Cb图中,可以看出肤色信息集中分布在横坐标[112,133]内;右边的Cr图中,肤色信息集中分布在[140,175]内,所以可以得到人脸肤色的判断公式:
在我们的研究中使用这个门限进行肤色分割,从而得到人脸区域的二值化图像。
2 肤色区域处理
2.1 数学形态学基本定义
数学形态学中二值图像的形态变换是针对集合的处理,其形态学算子的实质是表达物体或形态的集合与结构元素间的相互作用,因此结构元素的形态就决定了这种运算所提前的信号的形状信息,形态学图像处理是在图像中移动一个结构元素,然后将结构元素与二值图像进行交、并等集合运算,其基本的形态运算是腐蚀(erodeoperator)和膨胀(flilate)。令B(x)代表结构元素,对工作空间E中的每一点,腐蚀和膨胀的定义分别为:
腐蚀具有使目标缩小、目标内孔增大,以及外部孤立噪声消除的效果;膨胀是将图像中与目标物体接触的所有背景点合并到物体中的过程,结果是使目标增大、空洞缩小,可填补目标中的空洞,使其形成连通域。
在数学形态学图像处理中,除了腐蚀和膨胀这两种基本运算外,还有两种非常重要的运算方法,即开运算和闭运算,其定义如下: