深度科普!当识别率均超99%,李雷博士发文解析人脸识别哪家强

文章正文
发布时间:2024-09-09 13:34

近期,人工智能的关注度爆发式的增长,而作为人工智能下技术成熟度以及普及率最高的人脸识别技术,也更加快速的应用在更多场景之中。

多家以图像识别渐长的公司,纷纷通过参赛刷识别率拿到大奖的方式来证明自己的功力。比如腾讯优图、猎户星空、码隆科技、美团云、平安科技纷纷宣布拿下了国际权威测试奖项大奖。

那人脸识别到底哪家强? 近日,中国科学院 遗传学博士在读李雷在知乎上的一篇深度解析,获得诸多网友的点赞和认同。以下,我们进行分享,希望通过这篇技术范十足的文章,给你一些参考。

作为一个不务正业的人,其实一直关注机器学习的问题,之前的阿尔法狗和云总学习了很多(引入一个答案链接),前两天还回答了个关于机器学习处理马赛克的问题(引入另一个答案链接)。

人脸识别是我比较喜欢的内容之一,而最近,被称作人脸识别“世界杯”的微软百万人识别竞赛第二轮落下帷幕,让人看到中国在这个领域取得的快速进展,激动不已。

今天就和大家一起聊聊这个人脸识别问题。

记得当初最强大脑里,有人可以快速辨认很多人脸,惊呆了很多人,让观众纷纷感慨人脑的强大之处。

然而,现场的人脸毕竟是有限,而且也只是那个极个别的人可以实现一定程度的识别。放在今天对人脸识别巨大的需求情况下,光依靠人力明显是不可能的。

而这个时候,感谢机器学习的进步,使得我们可以用更好的算法来让电脑执行人脸识别,而人脸识别也随之取得了更多的进步。

(机器学习过程)

如今,人脸识别已经有了取得了长足的进步,而为了方便大家的进步和交流,目前有不同的机构都成立了相应的面部图像数据集。

1,微软百万名人人脸数据库

我们知道机器学习的一个重要内容是学习,因此可供学习的样本是十分关键的。一般常见的社交网站比如Facebook,新浪微博等都拥有大量的照片,然而他们的数据是保密的,所以大部分人无法获取,因此很多人转向了可以公开使用的数据库。

在公开的人脸识别数据集里,比较著名的是LFW和MegaFace。

LFW是是美国马萨诸塞大学的一个数据集,有1万多张照片,属于相似度比较的范围。

MegaFace是美国华盛顿大学发布的数据,内容是几十位互联网明星照片加100多万张普通人的照片形成的干扰数据。

然而这两个数据集都存在一些问题影响了人脸识别的效果。

LFW由于数据太小,导致往往出现过拟合问题,且实践过程是两张图片相似性的对比;MegaFace本身更倾向于人脸验证问题,且由于MegaFace本身未进行人为标注,导致测试过程中容易出现大量的干扰噪声。

有鉴于此,微软亚洲研究院(MSRA)于2016年发布了一个全新的数据集微软百万名人数据集(MS-Celeb-1M),这个数据及首先保证了照片的数量,包含了10 万个名人的约 1000 万张脸部图片,除此以外,微软更是对照片进行了人工标准,比如标注了职业和性别等选项,这样可以最大程度上避免对应错误的情况。

我们可以用一张图来对比这三家的内容

由于微软的数据库具备了很多优势和改进,因此这个数据库一发布就受到了众人的青睐,如今已经是世界上规模最大、用户最多的图像识别数据集之一。

2,人脸识别竞赛世界杯

为了鼓励众人对人脸识别的参与,微软还组织了人脸识别竞赛(Image Recognition Challenge),这场竞赛也成为人脸识别的顶级盛宴,被称作人脸识别世界杯。

微软人脸识别竞赛的要求很简单,就是输入一张人脸,要求输出一个人名。这是一个标准的“端到端”问题,是一种最接近于现实的人脸识别,我们看到一个人,然后知道他的名字。

而根据是否可以自由的使用外部数据,微软又将竞赛分为无限制类和有限制类两部分。前者可以自由的使用外部数据来进行辅助或者训练识别。

而经过紧张的比赛,7月18日,比赛落下帷幕,最终结果呈现给公众,我们可以在相应的网站上看到比赛结果。

来自松下-新加坡国立大学(Panasonic-NUS)的团队和来自中国的猎户星空团队(Orion)分别摘得了无限制类和有限制类的冠军。

无限制类冠军

冠军是来自新加坡松下研究院和新加坡国立大学联合组建的队伍,两家的标志都是蓝色的,蛮有意思的。

这个团队是深度学习与计算机视觉领域的最顶级团队之一,尤其是在人脸识别方面,更是屡次斩获成果,他们曾经用LFW数据集实现了高达99%的识别效果。而这一次在微软百万名人人脸识别竞赛上独占鳌头,证明了他们的实力处于世界顶级。

在此次竞赛单元中,他们选择的是“Low-Shot Learning”,这是一个非常考验在面对稀缺人脸训练样本的时候,如何精确识别的问题。

在这个测试里包括两个库,基础库(base set)是包含了2万个名人,每个人提供了50-100张左右的人脸;而另一个全新库(novel set)要小得多,只包含了1千个名人,且每个人只有1张照片。尽管最终的给出的考察样本是两者都有,但是明显对于全新库的考察更为关键,也就是稀缺训练下的模型识别效果。

这种情况下,尤其考验策略,NUS-Panasonic组采取的是用基础库来训练模型然后去识别全新库的办法,且充分利用了竞赛允许的额外数据来增强学习和训练。

有限制类冠军

来自猎户星空团队(Orion)。(没找到更大的logo之类图片)

这个蛮有意思的,一个来自中国的公司团队,是猎豹移动旗下人工智能公司,2016年9月才成立,然后不到一年就参与竞赛并夺得了有限制类的冠军。不得不感慨后生可畏啊。事实上在年初的LWF人脸识别的评测中,这个团队就已经崭露头角,拿到了前三名的成绩。

而在此次微软百万名人人脸识别竞赛中,猎户星空更是接受了hard模式。因为有限制的竞赛只能使用微软提供的数据,这无疑增大了难度,因为对于可以使用其他数据的无限制类比赛,某种程度上就是数据量的比较,只要使用足够多的数据进行足够多的模型训练,一定会获得一个很好的学习效果。而限制类由于数据确定,因此更多的是算法层面的比较。结果无论是在random还是hard 中,他们都取得了第一的成绩。

————三,人脸识别路上的中国龙————

事实上,这次竞赛中,不止有猎户星空一家中国面孔。

位列无限制类竞赛的第二名,就是一家中国的团队,

来自中国科学院重庆绿色智能技术研究院,这是2011年才成立的一个非常年轻的研究所,然而在此次竞赛中,他们一举夺得了第二名的成绩,非常难得。。事实上,他们还是去年的冠军。

在人工智能领域,中国正在快速的进行追赶,甚至可能实现弯道超车。

根据普华永道预测,未来全球GDP将借助于人工智能的东风取得长足的进步,而中国和美国或许会成为人工智能的最大赢家。

以国际计算机视觉与模式识别会议(CVPR)为例,这是IEEE一年一度的学术性会议,是世界顶级的计算机视觉会议,是人工智能领域的A类会议,每次都是高手如云汇聚一堂。

  而在CVPR当前公布的接收论文名单里,华人学者占据了近一半。

而在主席团里,也有不少熟悉的面孔,比如张正友、陈熙霖、华刚、贾佳亚、孙剑、吕乐、周少华、朱松纯等。

组委会一共25人,里面可以看到的熟悉的名字就有9人。

此次微软百万名人识别竞赛中,我们看到了华人的力量,无论是限制类的冠军猎户星空,还是无限制类的亚军中国科学院重庆绿色能源研究院,都展现出了无比快速的进步,尤其是猎户星空,成立不到一年就夺得了冠军。这是一家公司,让我们看到了在人脸识别领域,科技公司和资本的力量,事实上,此次参加CVPR会议的公司里,我们熟悉的那些互联网公司不少都参与了,比如阿里巴巴,腾讯,大疆等

短短几年之间,人脸识别取得了突飞猛进的发展,这一方面得益于人脸是别的需求市场非常庞大,随着平安城市的大力推广,安防市场对人脸识别的需求迅速升温,再加上我国城镇化程度越来越高,使得人口流动性也随之增高,这种情况下,光靠传统的人工监控,无论是精力还是准确度,都受到了挑战,因此对人脸识别的需求势必增强。而另一方面,得益于机器学习取得的进展,这几年以机器学习为代表的人工智能取得了长足的进步,尤其是google 研发的阿尔法狗以高超的算法和强大的学习训练能力,在围棋界连续击败人类,更是让人们意识到了机器学习的巨大前景。

在这种情况下,依托于机器学习的人脸识别,无疑也跟着插上了飞跃的翅膀。从这次比赛涌现出来的以猎户星空为代表的中国科技公司和技术力量,更是展现出了在这个领域的进展和追赶。

首页
评论
分享
Top