新浪游戏|新浪VR频道

新闻中心

跨年龄数据显神威 人脸识别让“天下无拐”

2019-07-05 11:16 新浪VR

0

  前言:

  研究人员对0岁-18岁的人脸的成长变化进行模拟建模,采用深度神经网络算法来学习这些人脸在成长过程中的复杂变化。经过成千上万次的模型训练,终于训练出了一个可以进行跨年龄人脸识别的深度神经网络模型

  最近发生了一件震惊AI圈的大事件!根据腾讯优图实验室跨年龄人脸识别技术的圈定,警方进一步进行DNA亲子鉴定,结果找到了4位走失大约10年的孩子。这在国内尚属第一次。

  2008年至2010年,10名三岁左右的孩子在四川陆续被拐,“小耗子”就是其中一员。

  “小耗子”的父母是湖北人桂宏正夫妇,为了讨生活,在四川省武胜县沿口镇一个热闹的集市开了一间酒铺。孩子一走失,明暗两重天。夫妻俩仍然经营着小酒铺,赚了钱就在全国各地奔波参加寻亲大会,或者听到哪里有一丝线索就跑过去核实了解。

  2014年,四川警方抓获一名拐卖儿童的人贩子,结合之前大量的调查和证据,确定了包括“小耗子”在内的10名被拐孩子被卖到了广东,但是通过全国打拐DNA信息库比对并没有结果,仅凭一张儿时照片,找到分别多年的孩子无异于大海捞针。

  每位被拐的孩子,都是我的心病

  蒋晓玲从事打拐工作已经整整19年了。这个过程中,她经历了太多的杳无音信和破镜重圆。

  过去10年,四川省公安厅打拐处和案发县市的公安机关一直在积极寻找那10名被拐儿童的下落。“调查访问、模拟画像、网络公告……能试的方法我们都试了,但是时间隔了这么久,而且没有拐卖中间人提供线索,真的是太难了。”蒋晓玲说。

  转机出现在2017年12月,公安部刑侦局副局长陈士渠调研时,了解到了优图实验室的跨年龄人脸识别技术,于是将这一技术介绍给了四川警方。

  “难度很大。”李新说。“其实当时大家心里没底,但当大家看到那些层层包裹的照片时,就下定决心要努力一试。”

  “小耗子”被拐时才3岁,到2017年底已经11岁多,而这段时间正是人一生中面部变化最为剧烈的阶段,国际上当时还没有成功跨越10年通过人脸识别技术找到失踪儿童的先例。

  对于跨年龄人脸识别,优图人脸识别算法研究负责人李博士和同事们对0岁-18岁的人脸的成长变化进行模拟建模,生成大量可供学习的人脸样本,然后采用深度神经网络算法来学习这些人脸在成长过程中的复杂变化。

  “难就难在当时跨年龄人脸识别没有成熟的算法模型,加上数据样本有限,实验效果一开始一直不是很理想。”李博士说。

  李博士和同事们想到了“用机器教机器”的方法。“简单来说,就好比我把成年人的人脸识别模型作为老师,让儿童的人脸识别模型来学习其中的‘技巧’,尽量消除年龄变化对识别精度的消极影响。”李博士说。

  而作为专业的人工智能数据服务提供商,数据堂在人脸数据领域深耕多年,已积累2475人的12602张跨年龄照片,涵盖室内外多场景。其中,男性(孩)1408人,女性(孩)1067人,每人4-15张正脸照片。可以有效提高跨年龄人脸识别技术的准确率。

2,475人12,602张跨年龄人脸采集数据(数据堂)

  经过多方合作,优图在近半年的努力之后,这一名为分布式蒸馏学习法则的算法模型进行跨年龄人脸识别的准确率达到了96%以上。

  找到“小耗子”又有了新的希望。

  科技向善,让AI更有温度

  不久,优图团队利用他们的模型对警方提供的海量数据进行了第一次实际比对,警方圈定了与每个被拐孩子最像的排名前五的结果进行了最后线下确认。

  在第一批被找到的4个孩子中,有一个孩子仅仅有几个月大时的照片。蒋晓玲不禁感叹:“大数据的力量太强大了!”紧接着,利用该技术,又找到了3名孩子,其中就包括“小耗子”。

  截至目前,当年在四川先后被拐卖的10名孩子已经找回7人。陈士渠表示,该批被拐儿童的大部分成功找回,充分证明人工智能对于查找被拐多年儿童能够发挥重要作用,跨年龄人脸识别这一技术在DNA比对之外,又为公安机关查找被拐儿童提供了一条有效的途径,“具有里程碑意义”。

  据介绍,李博士团队还在不断优化跨年龄人脸识别模型,不断与各方数据服务商合作,目前准确率已达到了99.80%以上,将挑战更大的年龄跨度。

  如李新所说,“科技向善”应是技术应用者本分,也是责任。在未来的征程中,数据堂将继续秉承着“用数据支撑AI,以智能改变世界”的企业愿景。持续的投入大量资金进行人工智能领域的数据资产积累,助力AI技术发展。目前数据堂【2,475人12,602张跨年龄人脸采集数据】也在不断的更新中。希望助力人脸识别技术再进一步,以科技的力量让‘天下无拐’。”

  关于数据堂

  数据堂(北京)科技有限公司,成立于2011年(股票代码:831428),专注于人工智能数据服务,致力于为全球人工智能企业提供数据获取及数据产品服务。

  数据堂总部位于北京,拥有8家全资和控股子公司,并在硅谷设立美国子公司,目前在南京、保定、合肥、贵阳等地设有多个专业数据处理中心。数据堂数据采集范围遍及全球30多个国家,合作伙伴遍布世界10多个国家。

  公司创始人及合伙人来自Stanford University、NEC、中国移动等知名高校和高科技公司。数据堂已成功为国内外众多企业提供人工智能数据产品与服务,包括百度、腾讯、阿里巴巴、奇虎、联想、科大讯飞等国内顶级互联网和高科技企业,Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等企业及在华研发机构。