1、摘要摘 要人脸识别是生物特征识别中一个活跃的研究领域,与利用指纹、虹膜等其他生物特征识别相比,人脸识别具有直接、友好、方便的特点,是进行身份确认的最自然直接的手段。因此,人脸识别在信息安全、刑事侦破、出入口控制等领域具有广泛的应用前景。人脸识别的一般步骤是图像预处理,特征提取,分类识别。其中特征提取直接决定分类结果的好坏,在人脸识别中占有重要地位。一个好的特征提取方法具有算法简单和速度快等特点,本文主要研究一种经典的特征提取方法主成分分析法(PCA),其基本思想是降维。主要的工作如下:挑选人脸库,建立训练集和测试集;对训练集和测试集中的图像进行PCA处理,即进行特征提取,求出人脸图像在特征脸空
2、间中的坐标系数,以此来作为人脸图像的特征;选用最近邻分类器实现人脸识别和分类,从识别效果来说明PCA的优缺点。关键词: 人脸识别 特征提取 主成分分析法 ABSTRACTABSTRACTFace recognition is an active research area of biometric identification. Compared to the use of fingerprints, iris and other biometric identification ,face recognition is more direct, friendly and convenient
3、.It is the most natural and direct means for identification.Therefore, face recognition has a wide range of applications in the information security ,criminal detection and Access Control area.Face recognition generally has three steps:image pre-processing, feature extraction, classification and ide
4、ntification. Feathure extraction is important,which directly determines the quality of classification results. A good method for feature extraction should has simple and fast algorithms. This paper mainly researches on a classical method for feature extraction Principal Component Analysis(PCA)with t
5、he basic idea of dimensionality reduction.The main work is as follows:Select a face database,create the training set and test set;Feature extraction for the images of the training set and test set,which are the coordinates coefficients in the Eigenface space;Classification and identification using M
6、inimum Distance Classifier,describe the advantages and disadvantages of PCA.Keywords: face recognition feature extraction PCA 目录目 录第一章 绪论11.1 特征提取的研究背景和意义11.1.1 研究背景和意义11.2 人脸特征提取的研究现状及存在问题31.2.1 人脸图像可以提取的特征31.2.2 人脸特征提取方法31.2.3 特征提取时存在的问题61.3 本文主要研究内容及各章安排81.3.1 本文主要研究内容81.3.2 本文各章安排8第二章 人脸特征提取主成分分
7、析法92.1 概述92.2 K-L变换102.2.1 K-L变换基本原理102.2.2 特征压缩122.3 基于PCA算法的人脸特征提取122.3.1 总体散布矩阵的形成132.3.2 维数问题142.3.3 变换矩阵的求解及变换的实现142.3.4 特征脸152.3.5 PCA算法162.4 人脸识别的分类准则182.4.1 相似性测度182.4.2 分类器182.5 PCA的特点及存在问题202.5.1 特点202.5.2 存在问题20第三章 本文方法的实现及结果233.1 人脸库的选取233.2 识别过程233.3结果分析243.3.1 基于PCA的人脸识别243.3.2 低通滤波处理和
8、边缘提取25第四章 总结与展望294.1 全文工作总结294.2 未来工作展望29致 谢31参考文献33第一章 绪论7第一章 绪论1.1 特征提取的研究背景和意义1.1.1 研究背景和意义在科学研究的众多应用领域中,一个普遍存在的问题是如何从采集的数据中获取有用的信息。随着科技的高速发展,大量数据的测量及存储己经不再成为问题,但是获取数据本身显然是不够的,提取产生这些数据的系统本身信息才是根本目的所在。而且,通常所获得的原始数据的数据量相当大,且样本常处于一个高维空间中,如果直接用原始数据进行分类器设计的话,无论从计算的复杂程度还是分类器性能来看都是不适宜的。为了有效地实现分类识别,就要把原始
9、数据映射(或变换)到低维空间,得到最能反映应样本内在本质的特征,以便能更有效的进行分类,这个过程就叫做特征提取或者数据降维1。映射后的特征叫做二次特征,它们是原始特征的某种组合(线性组合或非线性组合)。特征提取或者数据降维的基本任务是如何从许多特征中找出那些最有效的特征,特征的提取强烈影响到分类器的设计及性能,因此,特征提取是模式识别中的一个关键问题,在数据聚类,模式识别等领域有着广泛的应用。从广义上说,特征提取就是指一种变换。若X是测量空间,Y是特征空间,则变换A:XY就叫做特征提取器。为了使问题尽可能的简单化以及考虑计算的复杂性,通常对原始数据进行线性变换,因为这会给特征提取的后继分析带来
10、极大的方便。为了便于研究,通常把采集得到的数据看成多维随机变量的一系列样本值,以便于将随机变量的数值统计方法应用到源数据。对于多维信号在时刻t的采样,可看作是M维随机变量的某一观测样本矢量,其中xi(t),i=1,2,M为各个分量。按照某种准则对其施加一个线性变换,记为f(RMRN): (1-1)为变换的结果,假设这个的f是一个线性变换,于是有y(t)中的每个分量都是原始所有分量的线性组合: (1-2)其中,。对于每个的一组系数,称为一个基向量。式(1-2) 可以简单的写作矩阵形式: (1-3)其实,多维数据的线性变换及降维过程简单地说就是按照一定的准则去找一系列的加权系数组成线性变换矩阵中的
11、每个基向量,而这N个基向量就是一个新的坐标系。将原数据在这样一个坐标系上展开,得到的每个分量便是变换的结果。要求变换后的数据y在最大程度上体现原始数据间的实质结构。并且y的各个分量能够尽可能地代表产生源数据的系统本身的物理机制。基于多维随机变量统计分析的框架,变换矩阵的寻找方法通常是建立在一个体现输出结果y的统计特性的目标函数g(y)。而这种统计特性因算法的基本准准则不同而不同,可能是一,二阶的,如相关系数,协方差等,也可能是高阶的,如互信息,非高斯性等。如主成分分析方法的基本准则是当用新分量对原始数据进行重构时,在最小均方差意义下逼近效果最佳,而线性判别方法的基本准则是使不同类别的样本尽量分
12、开,即选择使得样本类间离散度和样本类内离散度的比值最大。线性变换是历史悠久的重要降维方法,目前在各个领域都得到了广泛应用,也相对比较成熟。该方法利用如上提到的类似线性变换将原数据向量从高维空间映射到低维空间中,通过保留最重要的或者最能体现个体差异性的成分,使得降维后的数据能够最大程度的保留原高维向量的特征或某一个方面的特性。依据线性降维所采用的具体方式不同,又可以分为:主成分分析 (PrincipalComPonent Analysis,PCA)2,奇异值分解(singular Value Decomposition,SVD)3,线性判别分析4,独立成分分析5,局部特征分析6,多维尺度分析7等
13、数十种主要算法。非线性降维是近年来逐渐发展起来的方法,还比较年轻,各种新的算法也在不断涌现和发展。它与前面所述方法的主要不同在于降维过程中运用的是非线性变换。目前提出的非线性变换方法大体上有两大类:基于核函数的算法8(包括KemelPcA,KemelLDA,KemelIcA等)以及基于流形学习的方法(包括Isom9,局部线性嵌入10,拉普拉斯映射方法11等)。上述各种降维方法已经广泛的应用于信号处理的各个领域:机器学习,数据压缩,可视化,模式识别等。1.2 人脸特征提取的研究现状及存在问题1.2.1 人脸图像可以提取的特征特征提取是模式识别研究的基本问题之一。对于人脸图像识别而言,抽取有效的图
14、像特征是完成图像识别的关键任务。目前用于图像识别的特征可分为如下几种:1、直观性特征。如图像的边缘,轮廓,纹理或区域等。在人脸识别中用得最多的直观性特征是几何特征,即人脸的五官尺寸及相对位置。这类特征虽然具有维数低的特点,但对于同一个人因表情及光照条件变化往往会导致其尺寸及相对位置发生较大的变化,因此识别效果并不令人满意。2、灰度的统计特征。如直方图特征,将图像看作一个二维随机过程,可以引入统计上的各阶矩作为特征来描述和分析图像,他们能够在保留主要分类信息的基础上大大降低特征的维数。3、变换系数特征。对图像作各种数学变换,可以将变换的系数作为图像的一种特征,例如Fisher变换,Hough变换
15、和小波变换等在图像特征抽取方面均有广泛应用。这类方法的优点是计算比较方便,但是去相关能力不强。系数特征的维数仍然比较大。4、代数特征。它反映图像的一种内在属性。将图像看作矩阵对待,可对其进行各种代数变换,或进行各种矩阵分解。由于矩阵的特征向量反映了矩阵的一种代数属性,并具有不变性,因此可用来作为图像特征。在人脸识别中,用来抽取图像的代数特征的典型方法是PCA变换和矩阵的奇异值分解。1.2.2 人特征提取方法人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在:人脸塑性变形(如表情等)的不确定性;人脸模式的多样性(如胡须,发型,眼镜,化妆等);图像获取过程中的不确定性(如光照的强度
16、,光源方向等)。在对人脸图像进行特征提取之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变换的影响而提高识别率12。特征提取是人脸识别的基础,对训练集和待识别的人脸图像采用相同的特征提取方法,然后对待识别的人脸图像进行分类。所以,特征提取作为人脸识别的重要组成部分,对人脸识别进行研究,也就要对特征提取方法进行不断研究探索和实验。随着人脸识别的发展,各种各样的特征提取方法也开始被应用起来。基于几何特征的方法:人脸由眼睛、鼻子、嘴、下巴等部件构成,对这些部件和结构关系的几
17、何描述,可作为识别人脸的重要特征。Kanade用几何量作为人脸的特征,这些几何量包括眼角、嘴角、鼻孔、下巴这些点之间的距离以及所成的角。Buhr用图表示法和描述树法给出了人脸的33个主要特征与12个次要特征,其主要特征包括了24个基于眼睛、人脸中心、嘴的量测。Yuille提出了包括头发、鼻子、嘴并用弹簧连接边缘的全局人脸模板以抽取出眼睛与嘴。Craw提出了更复杂的人脸模板,包含了头发线条、眼睛、眉毛、鼻子、嘴和面颊。最近,Lee等抽取人脸的5个距离量度作为人脸识别特征口侧。人脸的几何特征比较稳定,受人脸的姿态变化与光照条件等因素的影响小,但弱点是不容易抽取,而且量测精度不高。基于特征脸的方法:
18、线性判别分析(Linear Discriminant Analysis)是统计模式识别的基本方法之一。应用统计方法解决人脸识别问题时,经常碰到的问题之一就是被称之为“维数灾难”的问题。在低维空间里解析上或计算上可行的办法,在高维空间里可能变得毫无实际意义。因此,降低维数就成为处理实际问题的关键并发展了许多压缩特征空间维数的方法。我们希望通过寻求一种线性变换,可以使人脸图像从高维的图像空间映射到低维的特征空间,而不降低人脸的识别能力。特征脸方法是基于线性映射,使人脸图像从图像空间投影到特征空间的方法。采用PCA进行降维,寻求使所有的图像样本的总体散布最大的投影方向。Turk和Pentland提出
19、特征脸的方法,它根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸。识别时将测试图像投影到主元子空间上,得到一组投影系数,和各个己知人的人脸图像进行比较进行识别。在12,13中Pentland等报告了相当好的结果,在200个人的3000幅图像中得到95%的正确识别率,在FERET数据库上对150幅正面人脸像只有一个误识别。但系统在进行特征脸方法之前需要作大量预处理工作如归一化等。在传统特征脸的基础上,研究者注意到特征值大的特征向量(即特征脸) 并不一定是分类性能好的方向,据此发展了多种特征(子空间)选择方法,如Peng的双子空间方法,Weng的线性歧义分析方法15,Belh
20、umeur的FisherFace方法等。事实上,特征脸方法是一种显示主元分析人脸建模,一些线性自联想,线性压缩型BP网络则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量,Valentin对此作了详细讨论。总之,特征脸方法是一种简单,快速,实用的基于变换系数特征的算法,但由于它本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像。神经网络方法:前神经网络方法在人脸识别中的研究方兴未艾Valentin提出一种方法,首先提取人脸的50个主元,然后用相关神经网络将它映射到5维空间中,再用一个普通的多层感知器进行判别,对一些简单的测试
21、图像效果较好16;Intrator等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于分类。Lee等将人脸的特点用六条规则描述,然后根据这六条规则进行五官的定位,将五官之间的几何距离输入模糊神经网络进行识别,效果较一般的基于欧氏距离的方法有较大改善。Laurence等利用卷积神经网络方法进行人脸识别,由于卷积神经网络中集成了相邻象素之间的相关性知识,从而在一定程度上获得了对图像平移,旋转和局部变形的不变性,因此得到了非常理想的识别效果。Lin等提出了基于概率决策的神经网络方法(PDBNN),其主要思想是采用虚拟(正反例)样本进行强化和反强化学习,从而得到
22、较为理想的概率估计结果,并采用模块化的网络结构(OCON)加快网络的学习。这种方法在人脸检测,人脸定位和人脸识别的各个步骤上都得到了较好的应用17;其它研究还有:Dai等提出用Hopfield网络进行低分辨率人脸联想与识别;Gutta等提出将RBF与树型分类器结合起来进行人脸识别的混合分类器模型;Philips等人将Matching Pursuit滤波器用于人脸识别;还有则采用统计学习理论中的支持向量机进行人脸分类。神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述还是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐
23、性表达,它的适应性更强,一般也比较容易实现。形变模型方法:Lanitis等通过在人脸特征边沿,选择一些稀疏的基准点描述人脸的形状特征,然后将形状变形到所有人脸图像的平均形状,再根据变形后的形状进行纹理灰度变形,形成形状无关的人脸图像。类似地,Romdh等采用激光扫描仪获得人脸的3D数据,分别对一些基准点构成的形状和基准点的灰度或彩色完成PCA得到3D人脸形状和灰度彩色基图像。通过变化参数就可获得不同的3D人脸模型,通过施加一些先验约束可以避免合成不真实的人脸图像,利用线性形状和纹理误差,通过3D模型向2D输入图像的自动匹配实现人脸识别。其他方法:Brunelli等对模板匹配方法作了大量实验,结
24、果表明在尺度,光照,旋转角度等各种条件稳定的情况下,模板匹配的效果优于其他方法18,但它对光照,旋转和表情变化比较敏感,影响了它的直接使用。Goudail等人采用局部自相关性作为人脸识别的判断依据,它具有平移不变性,在脸部表情变化一时比较稳定。总体说来,基于线性投影的代数特征方法依然是人脸识别的最具影响力的主流方法。到目前为止,在大样本人脸库上通过测试的三种识别率最高的方法,分别为USC(University of Southern California)的方法,UMD(University of Maryland)的方法,以及Massachusetts Institute of Techno
25、logy(MIT)Media Lab给出的方法。除了USC的方法外,UMD和MIT的方法都是先进行主分量分析,再作鉴别分析。不同的是,UMD采用的是线性鉴别,而MIT采用二次鉴别(Quadratic Discriminant)。1.2.3 特征提取时存在的问题识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量。目前对人脸图像进行特征提取时基本是对人脸的正面的静态图像进行提取的。但是对于用户不配合,采集条件不理想(如光照恶劣,有遮挡,图像分辨率低等)的情况下,由于人脸变化复杂,因此特征表述和特征提取十分困难。1、光照变化问题光照问题是机器视觉的
26、老问题,在人脸识别中的表现尤为明显。目前即使最好的人脸识别系统在室外光照环境下,其识别率也会陡然下降。尽管研究人员针对光照问题提出了一些解决方案,但目前的光照处理方法还需要进一步地研究解决。2、姿态、表情变化问题与光照问题类似,姿态、表情变化问题也是目前人脸识别研究中需要解决的一个技术难点。针对姿态、表情变化的研究相对比较的少,目前多数的人脸识别算法主要针对正面准正面人脸图像,当发生深度或水平变化的情况下,或是表情发生明显改变的情况下,人脸识别算法的识别率也将会急剧下降。因此,如何提高系统对姿态和表情变化的鲁棒性也是人脸识别研究中一个极具挑战性的问题。3、遮挡问题对于非配合情况下的人脸图像采集
27、,遮挡是一个非常严重的问题。特别是在监控环境下,往往被监控对象都会带眼镜,帽子等饰物,使得被采集的人脸图像有可能不完整,从而影响了后面的特征提取。如何有效地去除遮挡物的影响是一个非常重要的研究课题。4、低质量照片问题目前的多数人脸识别系统在算法设计和模型训练方面往往只针对图像清晰的情况,但对智能监控、公安系统犯罪嫌疑人照片比对等应用而言,由于其来源不一,有的照片的质量非常差,比如模糊、高噪声、分辨率低等。如何提高系统对这些低质量照片的识别能力也是人脸识别亟待解决的关键问题之一。5、大规模人脸识别问题随着人脸数据库规模的增长,数据计算量也就变的很大,对数据降维效果也就要求比较高,也就需要应用相应
28、的特征提取方法。6、人脸信息采集设备带来的问题摄像头是目前主流的人脸信息采集设备,它们的种类、型号、传感方式(比如CCD或者CMOS)、采样和量化精度等各不相同,采集时刻的焦距、光圈、增益、白平衡等参数设置区别也很大。这些变化因素使得获取的人脸图像数据的变化更大。如何解决这些问题也是值得关注的。1.3 本文主要研究内容及各章安排1.3.1 本文主要研究内容本文主要研究人脸特征提取的一种经典方法主成分分析法,详细介绍了其基本原理和在人脸识别中的具体应用,并结合了一种简单的分类器,完成了小规模人脸的识别。1.3.2 本文各章安排第一章:绪论。介绍课题的背景和意义、人脸特征提取的方法和困难,最后简要
29、说明了本文所做的主要研究工作以及本文的结构安排;第二章:人脸特征提取的主成分分析(PCA)方法。详细地讨论了PCA的基本理论和在人脸特征提取方面的应用。这是一种典型的线性特征子空间方法,分析了此方法的优缺点;第三章:实验过程与结果分析。对基于PCA的人脸识别给出了相应的实验步骤,过程,通过Matlab实现了对算法的仿真。并且对人脸图像先分别进行低通滤波和边缘检测后再进行PCA处理,最后对结果进行了分析,讨论; 第四章:总结与展望。对本文的工作进行了总结,对进一步的研究进行了展望。第二章 人脸特征提取主成分分析法21第二章 人脸特征提取主成分分析法2.1 概述在统计特征分析用于人脸识别以前,人脸
30、自动识别系统中忽视了到底是哪一类的人脸特征在人脸识别中起到最主要的作用,而只是假定一些预先设定的一些人脸部位的测量与部位之间关系的测量是有效的,足以体现出不同人脸之间的差异。这种假定显然是不合理的。但是给我们一个重要的启示:可以从信息论的角度来对人脸进行编码和解码,从而达到着重强调一些重要的全局特征和局部特征。用这类方法提取的特征可能与通常直觉观念上的特征有所不同。主成分分析用于人脸识别主要从两方面考虑:一是从信息论的角度,我们要从人脸图像中尽可能的提取人脸图像的相关信息,然后把这些信息同人脸库中的人脸的信息相比较,从而完成了人脸的识别;二是从数学的角度,我们希望找到人脸分布的主要特征,也就是
31、一组人脸图像矩阵相关矩阵的特征向量,这组特征向量可以看成抓住了人脸图像变化的特征。在这种方法中,每张人脸图像可以通过特征向量的线性运算精确的表示。特征向量的数目等于参加训练的人脸图像的数目。也可以选择一些具有最大特征值的特征向量来近似的表示。用统计特征如二阶矩、高阶矩,建立人脸空间中的一个新的坐标系。人脸图像在这个坐标系下的投影即为该图像的特征。对于一张待识别的人脸图像,求出该图像在这个坐标系中的坐标也就是求出了这个图像的特征,然后通过与人脸库中的图像在该坐标系下的坐标相比较,就可以完成对这一幅人脸图像的识别。 把一幅人脸图像视为一个矢量,称为“人脸矢量”。如果图像宽为w个象素,高为h个象素,
32、则矢量的维数为w*h,矢量的每一个元素的值为所对应象素的灰度值。显然这是在w*h的高维空间里描述矢量,我们把这个空间定义为“原始图像空间” 。然而由于人脸固有的相似性(人脸都是由眼睛、鼻子、嘴、眉等构成),所以在“原始图像空间”中,人脸矢量仅分布在一个很小的范围内(图2.1),所以“原始图像空间”对人脸矢量来说不是最优的空间。为了有效的抽取人脸图像特征,有必要建立一个优化的子空间来更好的描述人脸矢量。我们把优化子空间称为“人脸空间”,优化子空间的基矢量称为主元。虽然“原始图像空间”的维数是w*h,但由于人脸图像象素的不完全独立性,每个象素的灰度值都依赖于与它相邻的象素,所以尽管我们不能精确地确
33、定人脸空间的维数,但它肯定大大低于原始图像空间的维数。我们使用主元分析的方法来构造优化子空间“人脸空间”(图2.2是一组二维随机数据进行主元分析的示意图)。 图2.1在原始图像空间中人脸矢量的分布 图2.2一组二维数据的主元分析构造优化子空间可以采用K-L19变换,假设人脸处于低维线性空间,由高维图像空间K-L变换后,可得到一组新的正交基,由此可以通过保留部分正交基获得正交K-L基底,该方法将人脸图像按行(列)展开所形成的一个高维向量看作是一种随机向量,因此可以采用K-L变换获得其正交K-L基底。将K-L变换用于人脸识别的研究,最早见于Kirby20等人的工作,他们首先采用K-L变换对人脸图像
34、进行表示,即将人脸图像分解为若干特征分量的加权和,并且能够从部分特征分量中重构原人脸图像。K-L (Karhunen-Loeve)变换是实现PCA的手段。下面就先介绍一下K-L变换基本原理。2.2 K-L变换2.2.1 K-L变换基本原理K-L变换(Karhunen-Loeve Transform)的目的是通过线性变换寻找一组最优的单位正交向量基(即主元),并用其中部分向量的线性组合来重建样本,使重建后的样本和原样本在最小均方意义下的误差最小,以达到最佳的数据压缩效果。给定一个维随机向量,可将其展开成个维基向量的线性组合 (2-1)式中,为随机系数向量。为维的矩阵,即 (2-2)这里,实际上定
35、义了一个从到的线性变换。K-T变换要求,变换后的随机系数向量中的各个分量是相互正交的,由此可以确定的具体形式。按照以上要求,应有 (2-3)即 (2-4)于是,若的自相关矩阵为已知的,则有 (2-5)若进一步要求为归一正交矩阵,即 (2-6)式中为单位阵,可以得到 (2-7)此即的特征方程,有 (2-8)其中,是的一个特征值,是对应的特征向量。因此,变换矩阵可由的自相关矩阵的特征向量构成。由于是实对称且非负定的矩阵,所以能够满足以上对的要求,且其所有的特征值都是非负的。由的归一正交性容易得到以下K-L变换式 (2-9)在K-L变换中,用来产生特征向量集合的自相关矩阵称为生成矩阵,而确定变换性质
36、的矩阵称为变换矩阵。2.2.2 特征压缩以上关于基本变换的讨论中,从到的变换过程中,向量的维数并没有发生变化,下面考虑从的部分分量中重建的问题。将式(2-1)重写为 (2-10)当只取的前个分量,忽略后个分量时,的估计值为 (2-11)此时的误差向量为 (2-12)均方误差为 (2-13)可见,使均方误差最小的选择应该是使忽略掉的分量对应的特征值之和为最小。于是,可以选择前个最大的特征值对应的特征向量构成的变换矩阵 (2-14)利用代替,按照式(2-9)进行变换,则有 (2-15)得到的变换域维向量就是向量经过压缩之后的主成分。理论分析指出,为使均方误差最小,应该使变换前的随机向量均值为零向量
37、。2.3 基于PCA算法的人脸特征提取对于计算机中的一幅图像,用f(x,y)表示。这里x和y指空间的坐标,点(x,y)上的f值正比于该点的亮度。一幅图像被读入计算机以后是用矩阵形式存放的,用B(i,j)表示。其行和列标出了图像上的一个点,而矩阵中的相应元素的值则表示该点的灰度等级。这样的数字阵列中的元素就叫做象素。一幅wh大小的人脸图像按列相连而构成一个x=w*h维矢量,它可被视为w*h维空间的一个点。由于人脸结构的相似性,当把很多这样的人脸图像归一化(预处理)之后,这些图像在这一超高维空间中不是随机或散乱地分布,而是存在某种规律。因此,可以通过K-L变换用一个低维子空间描述人脸图像,同时又能
38、保存所需要的识别信息。在人脸识别的实践中,系统给定的是一系列的训练样本,即人脸图像集合。因此,在将K-L变换的基本理论用于人脸识别时,还有一些具体问题需要解决。基于PCA的人脸特征提取可以以训练样本集的总体散度矩阵作为K一L变换的产生矩阵,也可以是训练样本集的类间散布矩阵,即可以采用同一人的数张图像的平均来进行训练,这样可在一定程度上消除光线等的干扰,且计算量可以减少,同时识别率不会下降。2.3.1 总体散布矩阵的形成对于的幅人脸图像集,根据图像在成像过程中的具体情况,通常需要首先进行一定的预处理,这可能包括图像平滑和灰度增强等图像处理步骤。然后,一个必要的过程是将矩阵形式的图像按照行或列展开
39、为维的向量,即 (2-16)为了使其均值为零,需要减去其均值向量,即 (2-17)式中叫做训练样本矩阵。为的统计均值估计,即 (2-18)这时,K-L变换中的自相关矩阵变成了协方差矩阵,可按下式求其最大似然估计(忽略了常数) (2-19)该估计又称为总体散布矩阵,这也就是K-L变换的生成矩阵。2.3.2 维数问题当将的人脸图像表示为向量时,其维数为,由此得到总体散布矩阵的维数为。例如,若,则总体散布矩阵就是维的,而人脸数据库中样本的数目通常要小得多,例如几千个左右,这就导致总体散布矩阵的秩是由决定的。从式(2-19)可以看出,在和式的项中,只有项是独立的,因此,总体散布矩阵的秩通常为,这也是其
40、非零特征值的个数,而零特征值对应的特征向量在人脸图像的表示中是没有意义的,这一点可以从节2.2.2关于特征压缩的讨论中得到。综上所述,在人脸的PCA方法中,所选择特征向量的数目的上限应为。2.3.3 变换矩阵的求解及变换的实现求解变换矩阵就是求生成矩阵的特征值和特征向量。按照(2-7)和(2-8)式,有 (2-20)或 (2-21)通常,该特征方程的求解有以下三种方式:1、直接求解方式直接求解(2-20)或(2-21)式中的代数方程。由于总体散布矩阵的维数通常非常高,所以这种求解方式耗时比较大。在MATLAB中可利用以下函数 (2-22)以上MATLAB函数对得到的特征值不进行排序。2、间接求
41、解方式之一不同于直接求解方式,这里不是对直接求特征值和特征向量,而是通过求的特征值和特征向量得到所求。具体地,对求解特征值和特征向量,有如下特征方程 (2-23)上式两边左乘后,有 (2-24)比较(2-20)式可见,。显然,通过2.3.2小节的讨论可知,的维数是,通常比的维数要低得多。3、间接求解方式之二通过对训练样本矩阵进行奇异值分解(SVD),也可间接求解特征方程。的SVD可以表示为 (2-25)式中和都为正交矩阵,而为奇异值矩阵,于是,总体散布矩阵可写为 (2-26)进一步整理后得到 (2-27)对比式(2-20),有,。在MATLAB中可利用以下函数进行奇异值分解 (2-28)以上M
42、ATLAB函数对得到的奇异值将进行排序。一旦求得了特征值和特征向量,就可以按照式(2-14)的方法,选取前个最大的非零特征值所对应的特征向量构成变换矩阵,并按照下式对所有人脸样本进行K-L变换。 (2-29)2.3.4 特征脸我们将特征值从大到小排序:,其对应的特征向量为0, 1,. m.这样,每一幅人脸都可以投影到由0, 1,. m张成的子空间中,因此每一幅人脸图像对应于子空间中的一个点。同样,子空间中的一点也对应于一幅图像。当特征向量0, 1,. m显示为图像时,这些图像很像人脸,所以它们被称为“特征脸”。有了这样一个由“特征脸”张成的特征子空间,任何一幅人脸图像都可以向其作投影并获得一组
43、坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。换句话说,任何一幅人脸图像都可以表示为这组“特征脸”的线性组合,其加权系数即是K-L的展开系数,也可以称为该图像的代数特征。图2.3显示了选取的ORL人脸库的8个人的图像,图2.4显示了前五幅特征脸。 图2.3 ORL人脸库的8个人的图像 图2.4 特征脸的显示2.3.5 PCA算法图2.5给出了整个PCA算法的详细步骤流程。PCA算法(Principal Component Analysis Algorithm)描述:基于PCA方法,求出图像在特征空间的展开系数(坐标)输入:1、人脸图像训练集2、人脸图像测试集输出:
44、训练集图像,测试集图像在特征空间的展开系数步骤:1、联立以下四式求出,2、求出的特征值和特征向量3、根据求出的特征值和特征向量4、对进行排序5、取前个最大的特征值所对应的特征向量6、对于图像属于训练集,已求出,由和 求得;若属于测试集,由和求出7、返回、图2.5 PCA算法的详细步骤流程2.4 人脸识别的分类准则2.4.1 相似性测度人脸样本经过特征提取过程,最终成为特征空间中的点。因此,样本之间的相似性,通常可以通过计算距离或角度实现。给定向量和,常用的相似性测度有1、欧氏距离 (2-30)2、街区距离 (2-31)3、马氏距离(Mahalanobis) (2-32)式中为模式的协方差矩阵。有时也可采用以下简化形式 (2-33)其中是第个分量的方差。4、夹角余弦 (2-34)此外,也有人采用明氏距离(Minkowski Distance,欧氏距离和街区距离的一
版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。
Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1
陕公网安备 61072602000132号 违法和不良信息举报:0916-4228922