作者 可迪群 学号:2008112020336
指导老师:刘兴云
本文作为大学生科研项目“基于FPGA的人脸识别”的一部分,主要应用MATLAB来是实现人脸图像的特征值提取PCA算法设计。作为独立的论文,在原来的基础上,增加了在MATLAB中的测试程序。
关键词:MATLAB 人脸识别 PCA算法
abstruct
This research project as the students, \"FPGA-based face recognition,\" part of the main application here is to achieve MATLAB to face PCA image feature extraction algorithm.As an independent paper, on the basis of the original, an increase in the test program in MATLAB.
Keywords: MATLAB face recognition PCA
第一章 绪论 ..................................................................................................................................... 3
1.1 介绍 .................................................................................................................................... 3 1.2人脸识别的应用 ................................................................................................................. 3
第二章 JPEG原理
2.1 JPEG概述 .......................................................................................................................... 3 2.2 JPEG 原理详细分析 ......................................................................................................... 3
第三章 PCA算法及人脸识别 ........................................................................................................ 6
1.1 PCA算法原理 .................................................................................................................... 6 1.2利用PCA进行特征提取的经典算法一一Eigenface算法 ............................................. 6 1.3基于PCA的人脸识别 ....................................................................................................... 6
第四章 总结 ..................................................................................................................................... 7
4.1 总结 .................................................................................................................................... 7
1.1介绍
随着社会的发展以及技术的进步,尤其是最近十年内计算机的软硬件性能的飞速提升,以及社会各方面对快速高效的自动身份验证的要求日益迫切,生物识别技术在科研领域取得了极大的重视和发展。由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份验证的最理想依据。其中人脸特征也是典型的生物特征之一,利用人脸图像进行身份的鉴别和确认,具有被动识别、易于为用户接受、友好方便的特点,因此也成为国内外各高校研究的热点之一。
对于人类而言,识别人脸是一件非常简单的事情,也是正常人在日常生活中每天都要进行的一项工作。但要使计算机实现同样的功能,则非常的困难。人脸识别的研究涉及模式识别、图象处理、生理学、心理学、认知科学等多个领域的知识。
1.2人脸识别的应用
如同人的指纹、虹膜等特征一样,人脸也具有唯一性,可用来鉴别一个人的身份。人脸识别最早可以追溯到1888年,但人脸识别的研究真正开始成为热点是从上世纪80年代末开始的,到现在已经取得了一定的研究成果,其表现是全世界相当数量的科研院所提出了各自的人脸识别的算法,同时也出现了一批提供人脸识别相关产品的公司。近年来,因为恐怖分子的破坏活动,尤其是自美国911事件之后,包括人脸识别在内的生物特征识别再度成为人们关注的热点,各国也纷纷增加了对该领域研发的投入。
同其他的生物特征识别技术,如指纹识别、说话人语音识别、虹膜识别、 DNA识别、步态识别等相比,人脸识别具有被动、友好、方便的特点。其应用 范围广泛,可应用于以下的几个方面:
·嫌疑犯照片的识别匹配
·信用卡、驾驶执照、护照与个人身份的识别 ·银行、商场安全系统 ·公众场合监控
·门禁系统、计算机登录控制 ·专家识别系统
·基于目击线索的人脸重构 ·嫌疑犯电子照片簿
·基于残留人脸的人脸重构
·基于父母人脸的小孩脸推导生成 ·随着年龄增长的人脸估算
这些应用包括了从静态的受控背景的照片到动态的、非控背景的录像等各个方面,各项应用都有着不同的技术难度、处理方法和分析理解方式。
2.1 JPEG概述
单独在MATLAB中测试人脸识别时,我们采用JPEG格式的图片来模拟人脸数据的采集,这里就要对JPEG压缩格式有一定的了解。
JPEG 是 Joint Photographic Experts Group 的缩写,即 ISO 和 IEC 联合图像专家组,负责静态图像压缩标准的制定,这个专家组开发的算法就被称为 JPEG 算法,并且已经成为了大家通用的标准,即 JPEG 标准。 JPEG 压缩是有损压缩,但这个损失的部分是人的视觉不容易察觉到的部分,它充分利用了人眼对计算机色彩中的高频信息部分不敏感的特点,来大大节省了需要处理的数 据信息。
人眼对构成图像的不同频率成分具有不同的敏感度,这个是由人眼的视觉生理特性所决定的。如人的眼睛含有对亮度敏感的柱状细胞1.8亿 个,含有对色彩敏感的椎状细胞0.08亿个,由于柱状细胞的数量远大于椎状细胞,所以眼睛对亮度的敏感程度要大于对色彩的敏感程度。
总体来说,一个原始图像信息,要对其进行 JPEG 编码,过程分两大步: 1、 去除视觉上的多余信息,即空间冗余度
2、 去除数据本身的多余信息,即结构(静态)冗余度
2.2 JPEG原理分析
JPEG 编码中主要涉及到的内容主要包括: 1. Color Model Conversion (色彩模型)
2. DCT (Discrete Cosine Transform 离散余弦变换) 3. 量化 4. RLE 编码
5. 范式 Huffman 编码 6. DC 的编码
部分介绍如下:
1、色彩空间 color space
这里的模型是YUV模型,YUV 不是哪个英文单词的缩写,而只是符号,Y 表示亮度,UV 用来表示色差,U、V 是构成彩色的两个分量。
YUV 表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是 Y 信号分量构成的黑白灰度图与用 U、V 信号构成的另外两幅单色图是相互独立的。由于 Y、U、V 是独立的,所以可以对这些单色图分别进行编码。 2.离散余弦变换 DCT
离散余弦变换是将图像从色彩域转换到频率域。它将原始图像信息块转换成代表不同频率分量的系数集,这有两个优点:
其一,信号常将其能量的大部分集中于频率域的一个小范围内,这样一来,描述不重要的分量 只需要很少的比特数;
其二,频率域分解映射了人类视觉系统的处理过程,并允许后继的量化过程满足其灵敏度的要求。 3、量化
量化过程实际上就是对 DCT 系数的一个优化过程。它是利用了人眼对高频部分不敏感的特性来实现数据的大幅简化。
它实际上是简单地把频率领域上每个成份,除以一个对于该成份的常数,且接着四舍五入取最接近的整数。这是整个过程中的主要有损运算。也就是我们所讲的图片压缩的核心。 4、RLE编码
Run Length Coding,行程编码又称“运行长度编码”或“游程编码”,它是一种无损压缩编码。
例如:5555557777733322221111111
这个数据的一个特点是相同的内容会重复出现很多次,那么就可以用一种简化的方法来记录这一串数字,如(5,6)(7,5)(3,3)(2,4)(l,7) 即为它的行程编码。
行程编码的位数会远远少于原始字符串的位数。
3.1 PCA算法原理简介
主成分分析法(PCA)是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩的。从概率统计观点可知,一个随机变量的方差越大,该随机变量所包含的信息就越多,如当一个变量的方差为零时,该变量为一常数,不含任何信息。
3.2 利用PCA进行特征提取的经典算法——Eigenface算法 在利用PCA进行特征提取的算法中,特征脸方法(Eigenface)是其中 的一个经典算法。特征脸方法是从主成分分析导出的一种人脸识别和描述 技术。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此 可以采用K一L变换获得其正交K一L基底。对应其中较大特征值的基底具有 与人脸相似的形状,因此又称为特征脸。利用这些基底的线性组合可以描 述、表达和逼近人脸图像,因此可以进行人脸识别与合成。识别过程就是 将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征空 间中的位置,具体步骤如下:
(1)初始化,获得人脸图像的训练集并计算特征脸,定义为人脸空间, 存储在模板库中,以便系统进行识别;
(2)输入新的人脸图像,将其映射到特征脸空间,得到一组关于该人 脸的特征数据;
(3)通过检查图像与人脸空间的距离判断它是否是人脸;
(4)若为人脸,根据权值模式判断它是否为数据库中的某个人,并做 出具体的操作。
3.3 基于PCA的人脸识别
基于PCA算法的人脸识别过程由训练阶段和识别阶段两个阶段组成。在训练阶段,将一帧人脸的数据读入并进行Eigenface算法处理得出特征值和特征向量,并计算出具体阈值。
在识别的时候,首先把待识别的图像经过同样的算法处理,得出向量,比较具体值,若不在范围内则为不可识别的图像,反之输出所在库中的图像标号。
(1)若>,则输入图像不是人脸图像; (2)若<,k,(3)若<,
k>,则输入图像包含未知人脸,;
kmin{},则输入图像为库中第k个人的人脸。
人脸识别是生物特征识别技术发展到一定阶段后产生的新兴技术,它 的目的是利用人脸这一生物特征来实现身份识别,从而防止密码的丢失和 证件的冒充。目前,随着精神物理学、统计学、信息学、计算科学等各行 各业的发展人脸识别技术也有了飞速的发展,在商业界、法律界、以及智 能环境很多方面有了初步的应用。但是由于人脸识别自身的复杂性,现有 的各种体系在适应性方面仍然存在很多的问题,人脸识别仍然是一项具有 挑战性的研究课题。
特征提取是人脸识别系统诸多功能中应用最广泛的一种。在众多的特 征提取算法中,PCA算法是引起最多讨论的经典算法,它能够有效地进行 数据的转化和压缩,使得数据可以成功的投影到低维特征空间中去。但是 基于PCA算法思想的传统算法(Eigenface算法)大多存在着不能同时处 理具有表情和光照的问题。
当然这里提出的只是一种简单的人脸识别设计思想,要想实现高效率的识别,还有待算法的进一步完善。
因篇幅问题不能全部显示,请点此查看更多更全内容