最新人脸检测 & 识别的趋势和分析

栏目: 数据库 · 发布时间: 5年前

内容简介:在今天说最近比较新颖的人脸检测&识别的时候,为啥会附上上图和下图,在江南的同学估计心有体会啊,打过年以来,没见过阳光,听说“萧敬腾”来杭州买了一栋楼,看样子我们还要难受一个月左右!

最新人脸检测 & 识别的趋势和分析

在今天说最近比较新颖的人脸检测&识别的时候,为啥会附上上图和下图,在江南的同学估计心有体会啊,打过年以来,没见过阳光,听说“萧敬腾”来杭州买了一栋楼,看样子我们还要难受一个月左右!

但是!!! 听说上图是台风"蝴蝶"即将来袭,是不是会带走我们进一个月的雨水呢?会不会帮我们拜摆脱阴雨呢?

最新人脸检测 & 识别的趋势和分析

最新人脸检测 & 识别的趋势和分析

那我们还是开始正题,今天说到得都是近几年比较流行的深度学习网络框架,会针对个别几个框架详细说说,有兴趣的同学,可以回顾我们“ 计算机视觉战队 ”公众号之前推送的一些相关内容!为了方便,我还是附在下面吧!(点击文字有链接)

往期回顾

最新人脸检测 & 识别的趋势和分析

/ 人脸注意机制网络

最新人脸检测 & 识别的趋势和分析

/ 未来人工智能之人脸领域技术

注:还有很多关于人脸的文章,有兴趣的自行去搜索!

:blush:

最新深度网络用语人脸的部分介绍与分析

DeepID网络结构

DeepID 是第一代,其结构与普通的卷积神经网络基本相同,结构图例如以下:

最新人脸检测 & 识别的趋势和分析

该结构与普通的卷积神经网络框架的结构很相似。不同点是, 在隐含层,也就是倒数第二层的时候,与Convolutional layer4和Max-pooling layer3相连,鉴于卷积神经网络层数越高感受野越大的特性,这种连接方式能够既考虑局部人脸精细特征,又考虑全局的整体特征。

· 实验结论 ·

最新人脸检测 & 识别的趋势和分析

  • 使用 Multi-scale Patches 的convnet比仅仅使用一个只有整张人脸的patch的效果要好;

  • DeepID 自身的分类错误率在40%到60%之间震荡,尽管较高,但 DeepID 是用来学习特征的,并不需要关注自身分类错误率;

  • 使用 DeepID 深度学习网络的最后一层softmax层作为特征表示,效果非常差;

  • 随着 DeepID 的训练集人数的增长, DeepID 本身的分类正确率和LFW的验证正确率都在添加。

DeepID2

DeepID2 相对于DeepID有了较大的提高,其主要原因在于在DeepID的基础上加入了 验证信号

详细来说,原本的卷积神经网络最后一层softmax使用的是逻辑回归(Logistic Regression)作为最终的目标函数,也就是识别信号;但在 DeepID2 中,目标函数上加入了验证信号,两个信号使用加权的方式进行了组合。

·  两种信号及训练过程 · 

识别信号公式例如以下:

最新人脸检测 & 识别的趋势和分析

验证信号公式例如以下:

因为验证信号的计算需要两个样本,所以整个卷积神经网络的训练过程也就发生了改变,之前是将所有数据切分为小的batch来进行训练,但如今则是每次迭代时随机抽取两个样本,然后进行训练。

·  实验结论  ·

对lambda进行调整,也即对识别信号和验证信号进行平衡,发现lambda在0.05的时候最好。使用LDA中计算类间方差和类内方差的方法进行计算。 得到的结果例如以下:

最新人脸检测 & 识别的趋势和分析

能够发现,在lambda=0.05的时候,类间方差几乎不变,类内方差下降了非常多,这样就保证了类间区分性,而降低了类内区分性。

DeepID2+

DeepID2+ 有例如以下贡献,①继续更改了网络结构;②对卷积神经网络进行了大量的分析,发现了几大特征。包含:

  • 神经单元的适度稀疏性,该性质甚至能够保证即便经过二值化后,仍然能够达到较好的识别效果;

  • 高层的神经单元对人比较敏感,即对同一个人的头像来说,总有一些单元处于一直激活或者一直抑制的状态;

  • DeepID2+ 的输出对遮挡很鲁棒。

·  网络结构变化  ·

相比于DeepID2, DeepID2+ 做了例如以下三点改动:

  • DeepID层从160维提高到512维;

  • 训练集将CelebFaces+和WDRef数据集进行了融合,共有12000人,290000张图片;

  • 将DeepID层不仅和第四层和第三层的max-pooling层连接,还连接了第一层和第二层的max-pooling层。

DeepID3

最新人脸检测 & 识别的趋势和分析

DeepID3 有两种不同的结构,分别为 DeepID3 net1 DeepID3 net2 (如上图)。相对DeepID2+,它的层数更多,网络更深,同时还借鉴了 VGG GoogLeNet ,引入了 inception layer ,这个主要是用在了 DeepID3 net2 里面。网络中还出现了连续两个conv layer直接相连的情况,这样使得网络具有更大的receptive fields和更复杂的nonlinearity,同时还能限制参数的数量。

下面稍微带着说一下 inception layer

· Inception Layer  ·

最新人脸检测 & 识别的趋势和分析

传统的ConvNet是将Convulution layer stack在一起,而 Inception 最大的改变就是时 Inception 模块叠加的形式构造网络。按论文里面说就是,用 Inception (稠密的可利用的组件)近似一个稀疏结构。 

将1x1,3x3,5x5的conv和3x3的pooling,stack在一起,一方面增加了网络的width,另一方面增加了网络对尺度的适应性. 主要特点是提高了网络内部计算资源的利用率。

· 性能比较  ·

在训练样本上, DeepID3 仍采用原来DeepID2+中使用的样本,在25个image patches产生的网络上作对比时, DeepID3 net1 优势最为明显,而 DeepID3 net2 提升不大显著。

最新人脸检测 & 识别的趋势和分析

最新人脸检测 & 识别的趋势和分析

今天就先讲这些吧,下次我们继续说更近的人脸检测&识别框架。有兴趣的同学请时刻关注我们。

如果您看到这句话,请帮我们点击下" 好看 ",以表对我们的支持,谢谢!

最新人脸检测 & 识别的趋势和分析

最新人脸检测 & 识别的趋势和分析

文 末 福 利

人脸数据集,有兴趣可以下载,慢慢去实践,挺好玩的!

■Annotated Database (Hand, Meat, LV Cardiac, IMM face) (Active Appearance Models)
■AR Face (http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html)
■BioID Face Database (BioID Face Database | facedb | BioID)
■Caltech Computational Vision Group Archive (Cars, Motorcycles, Airplanes, Faces, Leaves, Background) (Computational Vision: Archive)
■Carnegie Mellon Image Database (motion, stereo, face, car, ...) (CMU VASC Image Database)
■CAS-PEAL Face Database (The PEAL Face Database)
■CMU Cohn-Kanade AU-Coded Facial Expression Database (http://www.ri.cmu.edu/projects/project_421.html
■CMU Face Detection Databases (http://www.ri.cmu.edu/projects/project_419.html)
■CMU Face Expression Database (http://amp.ece.cmu.edu/projects/FaceAuthentication/download.htm)
■CMU Face Pose, Illumination, and Expression (PIE) Database (http://www.ri.cmu.edu/projects/project_418.html)
■CMU VASC Image Database (motion, road sequences, stereo, CIL’s stereo data with ground truth, JISCT, face, face expressions, car) (CMU VASC Image Database)
■Content-based Image Retrieval Database (Index of /groundtruth)
■Face Video Database of the Max Planck Institute for Biological Cybernetics (Welcome)
■FERET Database (frvt.org)
■Georgia Tech Face Database (http://www.anefian.com/face_reco.htm)
■German Fingerspelling Database (http://www.anefian.com/face_reco.htm)
■Indian Face (http://http://www.cs.umass.edu/~vidit/IndianFaceDatabase)
■MIT-CBCL Car Database (Pedestrian Data)
■MIT-CBCL Face Recognition Database (CBCL FACE RECOGNITION DATABASE)
■MIT-CBCL Face Databases (CBCL SOFTWARE)
■MIT-CBCL Pedestrian Database (New Page 1)
■MIT-CBCL Street Scenes Database (CBCL StreetScenes Database Download Page:)
■NIST/Equinox Visible and Infrared Face Image Database (http://www.equinoxsensors.com/products/HID.html)
■NIST Fingerprint Data at Columbia (Link)
■ORL Database of Faces (The Database of Faces)
■Rutgers Skin Texture (http://www.caip.rutgers.edu/rutgers_texture/)
■The Japanese Female Facial Expression (JAFFE) Database (Japanese Female Facial Expression (JAFFE) Database
■The Ohio State University SAMPL Image Database (3D, still, motion) (http://sampl.ece.ohio-state.edu/database.htm)
■The University of Oulu Physics-Based Face Database (Center for Machine Vision and Signal Analysis)
■UMIST Face Database (http://images.ee.umist.ac.uk/danny/database.html)
■USF Range Image Data (with ground truth) (USF Range Image Database)
■Usenix Face Database (hundreds of images, several formats) (Link)
■USC-SIPI Image Database (collection of digitized images) (SIPI Image Database)
■UCD VALID Database (multimodal for still face, audio, and video) (VALID Database)
■UCD Color Face Image (UCFI) Database for Face Detection (http://ee.ucd.ie/~prag/)
■UCL M2VTS Multimodal Face Database (http://www.tele.ucl.ac.be/PROJECTS/M2VTS/m2fdb.html)
■Vision Image Archive at UMass (sequences, stereo, medical, indoor, outlook, road, underwater, aerial, satellite, space and more) (SIPI Image Database)
■Where can I find Lenna and other images? (comp.compression Frequently Asked Questions (part 1/3)Section - [55] Where can I find Lenna and other images?)
■Yale Face Database (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)
■Yale Face Database B (http://cvc.yale.edu/projects/yalefaces/yalefaces.html)

如果想加入我们“ 计算机视觉战队 ”,请扫二维码加入学习群,我们一起学习进步,探索领域中更深奥更有趣的知识!

最新人脸检测 & 识别的趋势和分析


以上所述就是小编给大家介绍的《最新人脸检测 & 识别的趋势和分析》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

程序员之禅

程序员之禅

[德] Christian Grobmeier / 荣耀、朱艳 / 人民邮电出版社 / 2015-8 / 39.00元

禅是一种生活态度和生活方式。程序员是一份特别辛苦的职业,也是一个承受各种压力的群体。在物欲横流的今天,禅对于程序员有着特殊的意义和价值。 本书的作者是一名德国程序员老兵,深谙程序员的喜怒哀乐。他曾经发表了一篇题为“程序员之禅的十条法则”的博客文章,引发众多程序员热烈的讨论和强烈的共鸣。本书共10章,结合程序员日常生活和工作的方方面面,作者通过对禅的知识、理解、体验、思考和感悟,提出很多中肯的......一起来看看 《程序员之禅》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码