欢迎光临112期刊网!
网站首页 > 论文范文 > 计算机论文 > 智能科技 > 基于PCA与贝叶斯决策的人脸识别的技术发展

基于PCA与贝叶斯决策的人脸识别的技术发展

日期:2023-01-24 阅读量:0 所属栏目:智能科技


 引言人脸识别技术是模式识别和人工智能领域的一个热门课题,它覆盖了图像处理、模式识别、人工神经网络、生理学及心理学等许多学科的内容,具有非常广泛的应用前景[12]。通常人脸识别系统包括人脸检测、人脸预处理、人脸特征提取和人脸识别等主要步骤。本文提出了一种主元分析结合最小错误率贝叶斯决策实现人脸分类识别的算法。1主元分析原理及人脸特征子空间提取基于主元分析(principle component analysis,PCA)的人脸特征提取方法是建立在KL变换基础上的。因为人脸结构的存在,当把这样的人脸图像归一化之后,这些图像在这个高维空间中不是随机、散乱地分布而是存在特定的规律。因此,通过KL变换用一个低维子空间描述人脸图像,同时又可以提取所需要的识别信息。
  1.1主元分析原理对于一幅人脸图像,用f(x,y)来表示,这里x和y指空间中的坐标。实际在计算机的应用中,人脸图像f(x,y)在空间坐标和灰度上都己经被离散化了,因此可以用一个矩阵来表示一幅人脸图像,矩阵中的每一个元素对应图像中的一个像素点,而矩阵中的相应元素的值对应该点的灰度等级。选择人脸库中每个人一定数量的图像构成训练集,其余形成测试集,用于测试系统性能。一幅N×N的图像按列相连可构成一个N2维列向量,通过主元分析方法用一个低维子空间来表示原始图像[3]。设训练集中有M幅大小为N×N的人脸图像,将每幅图像看作是长度为N2的列向量,记作[x1 x2…xM ]。用μ表示M幅人脸图像的平均向量:μ=1M∑Mi=1xi(1)求出每一幅图像与平均向量的差异,把差异运用KL变换,用训练集的协方差矩阵作为产生矩阵,即S=1M∑Mi=1xi-μxi-μT=1MQQT(2)光学仪器第36卷
  第2期全星慧,等:基于PCA与贝叶斯决策的人脸识别算法
  其中:Q=[x1-μ,x2-μ,…,xM-μ](3)1.2基于KL变换的人脸特征子空间提取KL展开是图像压缩的一种最优正交变换。人们将其应用于特征提取,形成了利用子空间投影进行模式识别的基础。为了求N2×N2维矩阵的特征值和正交归一的特征矢量,直接计算几乎是不可能的,为此引出奇异值分解定理(SVD)[4]:设秩为r、大小为n×r的矩阵X,存在两个正交矩阵:U=[u0,u1,…,ur-1]∈pn×rUTU=1(4)
  V=[v0,v1,…,vr-1]∈pr×rVTV=1(5)以及对角阵:Λ=diag[λ0,λ1,…,λr-1]∈pr×r且λ0≥λ1≥…λr-1(6)满足X=UΛ1/2VT(7)其中,pn×r、pr×r分别表示矩阵的大小为n×r,r×r,λi(i=0,1,…,r-1)为矩阵XXT和XTX的非零特征值,ui和vi分别为XXT和XTX对应于λi的特征矢量。推论U=XVΛ1/2(8)故由式(2)构造矩阵R=QTQ∈pM×M(9)容易求出其特征值λi及相应的正交归一特征矢量vi(i=0,1,…,M-1)。因而S的正交归一特征矢量由推论可得ui=1λiQvii=0,1,…,M-1(10)经KL变换可以得到一组由大到小特征值λi对应的特征向量ui,称之为“特征脸”。有了这样一个由“特征脸”组成的降维子空间,任何一幅人脸图像都可以向其做投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。2贝叶斯决策理论及人脸分类识别
  2.1贝叶斯决策理论及规则贝叶斯决策理论是统计模式识别中的一个基本方法[5]。已知总共有c类物体,讨论在下列条件下对某一样本按其特征向量x分类的问题[6]:(1)各类别ωi=1,2,…,c的先验概率P(ωi)及类条件概率密度函数p(xωi)已知。(2)类别数一定。贝叶斯公式为P(ωix)=p(xωi)P(ωi)p(x)=p(xωi)P(ωi)∑ci=1p(xωi)P(ωi)(11)最有代表性的决策规则分别为基于最小错误率的判决准则和基于最小风险的判决准则。本文采用基于最小错误率的判决准则,即若P(ωix)=maxj=1,2,…,cP(ωjx),则x∈ωi(12)2.2训练样本特征统计利用贝叶斯决策进行分类,首先需要求取各类样本的统计特性,即通过对各类训练样本在特征空间上的投影,得到每一个样本的特征向量,并对各类训练样本的特征向量分别求均值和协方差矩阵。
 2.3测试样本特征提取及分类识别对测试图像在特征空间进行投影,得到特征向量。利用测试样本的特征向量及各类训练样本的特征向量均值和协方差矩阵,分别计算各类的类条件概率密度及先验概率,从而可以计算得到测试样本的各类后验概率,根据最小错误率的贝叶斯决策规则,后验概率较大者,即为测试样本归属类别,从而给出分类识别结果。3实验分析本文采用ORL人脸数据库,该数据库包含40位人脸图像数据,每人10幅,共400幅图像组成[7]。每幅图像的分辨率为112×92,灰度级256。这些图像面部表情、面部遮掩物、时间、光照等各不相同。本文任选库中4人,各任意选取5张图像作训练样本,这4人的训练图像如图1所示。将训练样本进行主元分析,提取特征子空间,同时将各类训练样本投影到子空间得到相应的特征向量,对各类训练样本的特征向量求均值和协方差矩阵,并计算各类的先验概率及类条件概率密度。
  图1读取的人脸训练样本
  Fig.1The face training samples
  图2测试样本
  Fig.2The test sample
  表1测试样本所对应的后验概率
  Tab.1Posterior probability of the test samples
  第一类第二类第三类第四类4.809 4×10-222.625 9×10-246.909×10-224.098 4×10-20
  在第四类人脸图像中,任选测试样本以外的一张图像作为测试样本,其测试样本如图2所示。将测试样本投影到特征子空间得到相应的特征向量,利用式(11)计算测试样本的后验概率分布如表1所示。最后根据基于最小错误率的贝叶斯决策规则得出测试样本属于第四类。实验比较了不同数目的训练样本下,该人脸识别算法的识别率。从ORL人脸库中随机选取4,5,6,7,8幅图像作训练样本,剩余图像用作测试样本,对不同数目的训练样本各重复实验10次,识别率都在97%以上。4结论本方法结合主元分析提取人脸特征及贝叶斯决策实现分类识别。主元分析能有效地提取原始人脸图像特征,而不依赖于面部表情,光 照等因素,不仅降低了运算量而且保证了特性的稳定性,而使用基于最小错误率的贝叶斯决策规则进行分类,算法不仅简单实用而且大大提高了识别的速度。通过实验表明,本文提出的算法识别的准确率比较高。参考文献:
  [1]刘艳丽,赵跃龙.人脸识别技术研究进展[J].计算机工程,2005,31(3):1011.
  [2]朱树先,张仁杰,郑刚.基于RBF神经网络的人脸识别[J].光学仪器,2008,30(2):3133.
  [3]全星慧,于丽,计春悦.基于主元分析的人脸识别方法研究[J].科学技术与工程,2010,10(24):60636065.
  [4]陈元春.基于矩阵主成分分析的人脸识别方法研究[D].武汉:武汉理工大学,2012:2642.
  [5]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000:721.

本文选自《光学仪器》2014年第2期,版权归原作者和期刊所有。

本文链接:http://www.qk112.com/lwfw/jsjlw/zhinengkeji/242363.html

论文中心更多

发表指导
期刊知识
职称指导
论文百科
写作指导
论文指导
论文格式 论文题目 论文开题 参考文献 论文致谢 论文前言
教育论文
美术教育 小学教育 学前教育 高等教育 职业教育 体育教育 英语教育 数学教育 初等教育 音乐教育 幼儿园教育 中教教育 教育理论 教育管理 中等教育 教育教学 成人教育 艺术教育 影视教育 特殊教育 心理学教育 师范教育 语文教育 研究生论文 化学教育 图书馆论文 文教资料 其他教育
医学论文
医学护理 医学检验 药学论文 畜牧兽医 中医学 临床医学 外科学 内科学 生物制药 基础医学 预防卫生 肿瘤论文 儿科学论文 妇产科 遗传学 其他医学
经济论文
国际贸易 市场营销 财政金融 农业经济 工业经济 财务审计 产业经济 交通运输 房地产经济 微观经济学 政治经济学 宏观经济学 西方经济学 其他经济 发展战略论文 国际经济 行业经济 证券投资论文 保险经济论文
法学论文
民法 国际法 刑法 行政法 经济法 宪法 司法制度 法学理论 其他法学
计算机论文
计算机网络 软件技术 计算机应用 信息安全 信息管理 智能科技 应用电子技术 通讯论文
会计论文
预算会计 财务会计 成本会计 会计电算化 管理会计 国际会计 会计理论 会计控制 审计会计
文学论文
中国哲学 艺术理论 心理学 伦理学 新闻 美学 逻辑学 音乐舞蹈 喜剧表演 广告学 电视电影 哲学理论 世界哲学 文史论文 美术论文
管理论文
行政管理论文 工商管理论文 市场营销论文 企业管理论文 成本管理论文 人力资源论文 项目管理论文 旅游管理论文 电子商务管理论文 公共管理论文 质量管理论文 物流管理论文 经济管理论文 财务管理论文 管理学论文 秘书文秘 档案管理
社科论文
三农问题 环境保护 伦理道德 城镇建设 人口生育 资本主义 科技论文 社会论文 工程论文 环境科学