人脸识别三大经典算法(附经典论文列表)

栏目: 编程工具 · 发布时间: 5年前

AMiner今日已发布 《人脸识别研究报告》

人脸识别三大经典算法(附经典论文列表)

特征脸法(Eigenface)

特征脸技术是近期发展起来的用于人脸或者一般性刚体识别以及其它涉及到人脸处理的一种方法。使用特征脸进行人脸识别的方法首先由Sirovich和Kirby(1987)提出(《Low-dimensional procedure forthe characterization of human faces》),并由Matthew Turk和Alex Pentland用于人脸分类(《Eigenfaces for recognition》)。首先把一批人脸图像转换成一个特征向量集,称为“Eigenfaces”,即“特征脸”,它们是最初训练图像集的基本组件。识别的过程是把一副新的图像投影到特征脸子空间,并通过它的投影点在子空间的位置以及投影线的长度来进行判定和识别。

人脸识别三大经典算法(附经典论文列表)

将图像变换到另一个空间后,同一个类别的图像会聚到一起,不同类别的图像会聚力比较远,在原像素空间中不同类别的图像在分布上很难用简单的线或者面切分,变换到另一个空间,就可以很好的把他们分开了。

Eigenfaces选择的空间变换方法是PCA(主成分分析),利用PCA得到人脸分布的主要成分,具体实现是对训练集中所有人脸图像的协方差矩阵进行本征值分解,得到对应的本征向量,这些本征向量就是“特征脸”。每个特征向量或者特征脸相当于捕捉或者描述人脸之间的一种变化或者特性。这就意味着每个人脸都可以表示为这些特征脸的线性组合。

局部二值模式(Local Binary Patterns,LBP)

局部二值模式(Local binary patterns LBP)是计算机视觉领域里用于分类的视觉算子。LBP,一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的T.Ojala等人在1996年提出(《A comparative study of texturemeasures with classification based on featured distributions》)。2002年,T.Ojala等人在PAMI上又发表了一篇关于LBP的文章(《Multiresolution gray-scale androtation invariant texture classification with local binary patterns》)。这一文章非常清楚的阐述了多分辨率、灰度尺度不变和旋转不变、等价模式的改进的LBP特征。LBP的核心思想就是:以中心像素的灰度值作为阈值,与他的领域相比较得到相对应的二进制码来表示局部纹理特征。

人脸识别三大经典算法(附经典论文列表)

LBP是提取局部特征作为判别依据的。LBP方法显著的优点是对光照不敏感,但是依然没有解决姿态和表情的问题。不过相比于特征脸方法,LBP的识别率已经有了很大的提升。

Fisherface

线性鉴别分析在降维的同时考虑类别信息,由统计学家Sir R. A.Fisher1936年发明(《The useof multiple measurements in taxonomic problems》)。为了找到一种特征组合方式,达到最大的类间离散度和最小的类内离散度。这个想法很简单:在低维表示下,相同的类应该紧紧的聚在一起,而不同的类别尽量距离越远。1997年,Belhumer成功将Fisher判别准则应用于人脸分类,提出了基于线性判别分析的Fisherface方法(《Eigenfaces vs. fisherfaces:Recognition using class specific linear projection》)。

人脸识别三大经典算法(附经典论文列表)

经典论文

Sirovich,L.,&Kirby,M.(1987).

Low-dimensional procedure for the characterization of human faces.

Josa a,4(3),519-524.

研究证明任何的特殊人脸都可以通过称为eigenpictures的坐标系统来表示。Eigenpictures是面部集合的平均协方差的本征函数。

Turk,M.,&Pentland,A.(1991).

Eigenfaces forrecognition.

Journal of cognitiveneuroscience,3(1), 71-86.

研究开发了一种近实时的计算机系统,可以定位和追踪人的头部,然后通过比较面部特征和已知个体的特征来识别该人。该方法将面部识别问题视为二维识别问题。识别的过程是把一副新的图像投影到特征脸子空间,该特征空间捕捉到已知面部图像之间的显著变化。重要特征称为特征脸,因为它们是面集的特征向量。

Ojala,T.,Pietikäinen,M.,&Harwood,D.(1996).

Acomparative study of texture measures with classification based on featureddistributions.

Pattern recognition,29(1),51-59.

研究对不同的图形纹理进行比较,并提出了用来描述图像纹理特征的LBP算子。

Ojala,T.,Pietikainen,M.,&Maenpaa,T.(2002).

Multiresolutiongray-scale and rotation invariant texture classification with local binarypatterns.

IEEE Transactions on pattern analysis and machineintelligence,24(7),971-987.

研究提出了一种理论上非常简单而有效的灰度和旋转不变纹理分类方法,该方法基于局部二值模式和样本和原型分布的非参数判别。该方法具有灰度变化稳健、计算简单的特点。

Fisher,R.A.(1936).

The use of multiple measurementsin taxonomic problems.

Annals of eugenics,7(2),179-188.

研究找到一种特征组合方式,以达到最大的类间离散度和最小的类内离散度。解决方式为:在低维表示下,相同的类应该紧紧的聚在一起,而不同的类别尽量距离越远。

Belhumeur,P.N.,Hespanha,J.P.,&Kriegman,D.J(1997).

Eigenfacesvs.fisherfaces:Recognition using class specificlinear projection. Yale University New Haven United States.

研究基于Fisher的线性判别进行面部投影,能够在低维子空间中产生良好分离的类,即使在光照和面部表情的变化较大情况下也是如此。广泛的实验结果表明,所提出的“Fisherface”方法的误差率低于哈佛和耶鲁人脸数据库测试的特征脸技术。

人脸识别三大经典算法(附经典论文列表) aminer学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

理论 人脸识别 计算机视觉 LBP Eigenface Fisherface 算法

相关数据

Computer Vision

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源:机器之心

降维 技术

Dimensionality reduction

降维算法是将 p+1 个系数的问题简化为 M+1 个系数的问题,其中 M<p。算法执行包括计算变量的 M 个不同线性组合或投射(projection)。然后这 M 个投射作为预测器通过最小二乘法拟合一个线性回归模型。两个主要的方法是主成分回归(principal component regression)和偏最小二乘法(partial least squares)。

来源:机器之心

Covariance matrix

在统计学与概率论中,协方差矩阵(也称离差矩阵、方差-协方差矩阵)是一个矩阵,其 i, j 位置的元素是第 i 个与第 j 个随机向量(即随机变量构成的向量)之间的协方差。这是从标量随机变量到高维度随机向量的自然推广。

来源: 维基百科

人脸识别 技术

Facial recognition

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

来源: 维基百科

线性判别分析 技术

Linear Discriminant Analysis

线性判别分析 是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。所得的组合可用来作为一个线性分类器,或者,更常见的是,为后续的分类做降维处理。

来源: 维基百科

神经科学 技术

neuroscience

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

来源: 维基百科

参数 技术

parameter

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

来源: 维基百科

Principal component analysis

在多元统计分析中,主成分分析(Principal components analysis,PCA)是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。由于主成分分析依赖所给数据,所以数据的准确性对分析结果影响很大。

来源:机器之心 维基百科

亚历克斯·彭特兰 人物

Alex Pentland

美国计算机科学家,麻省理工学院教授,可穿戴设备先驱,连续创业者。他是计算机科学领域被引用次数最多的作者之一,并帮助创建了麻省理工学院媒体实验室。他的h指数为125。研究重心:社交物理学、大数据和隐私研究。

涉及领域

来源: 维基百科


以上所述就是小编给大家介绍的《人脸识别三大经典算法(附经典论文列表)》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

神经网络在应用科学和工程中的应用

神经网络在应用科学和工程中的应用

萨马拉辛荷 / 2010-1 / 88.00元

《神经网络在应用科学与工程中的应用:从基本原理到复杂的模式识别》为读者提供了神经网络方面简单但却系统的介绍。 《神经网络在应用科学和工程中的应用从基本原理到复杂的模式识别》以神经网络在科学数据分析中所扮演角色的介绍性讨论作为开始,给出了神经网络的基本概念。《神经网络在应用科学和工程中的应用从基本原理到复杂的模式识别》首先对用于实际数据分析的神经网络结构进行了综合概述,继而对线性网络进行了大量......一起来看看 《神经网络在应用科学和工程中的应用》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

MD5 加密
MD5 加密

MD5 加密工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具