腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

栏目: 编程工具 · 发布时间: 7年前

内容简介：9月6日，在腾讯优图计算机视觉峰会上，腾讯高级执行副总裁汤道生宣布，腾讯优图实验室升级为腾讯计算机视觉研发中心，并首次公开该实验室最全面的应用落地案例；与此同时，腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作，探讨通过学术奖金、产学研交流等多种形式，在人工智能前沿研究领域展开广泛合作。腾讯优图实验室现在已升级为腾讯计算机视觉研发中心，聚焦的方向为计算机视觉研究。近年来，虽然计算机视觉在在技术和应用层面均取得了巨大的进步，但面临着的挑战和瓶颈也不可忽视。“一些重要的思想，只有拥有“傻”的精神，执着的

9月6日，在腾讯优图计算机视觉峰会上，腾讯高级执行副总裁汤道生宣布，腾讯优图实验室升级为腾讯计算机视觉研发中心，并首次公开该实验室最全面的应用落地案例；与此同时，腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作，探讨通过学术奖金、产学研交流等多种形式，在人工智能前沿研究领域展开广泛合作。

腾讯优图实验室现在已升级为腾讯计算机视觉研发中心，聚焦的方向为计算机视觉研究。近年来，虽然计算机视觉在在技术和应用层面均取得了巨大的进步，但面临着的挑战和瓶颈也不可忽视。

“一些重要的思想，只有拥有“傻”的精神，执着的精神，才能被证明是对的。”斯坦福大学电气工程荣誉教授，密码学先驱，2015年图灵奖获得者Martin Hellman在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域，包括计算机视觉，这种精神都同样适用。

与《科学》达成战略合作

峰会上，腾讯高级执行副总裁汤道生宣布国际化战略合作项目：与《科学》（Science）杂志达成战略合作，推动全球计算机视觉发展。

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

谈到与《科学》的合作的契机，贾佳亚说道，与学术的结合已经成为人工智能领域的趋势，腾讯渴望建立与国际上紧密的合作关系，腾讯将研发和场景结合，旨在为中国科研人员引入最先进的学术平台。另外，《科学》的科学家资源丰富，通过将腾讯的实践应用运用到科学家们的研发和教学中，建立起产业和研究联系的机制，以促进中国人工智能发展。

但关于与《科学》杂志的具体合作规划，腾讯未透露相关信息。

腾讯优图最全公开应用落地

腾讯优图实验室成立于2012 年，是腾讯三大人工智能实验室之一，聚焦计算机视觉，专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比AI Lab，优图实验室更偏应用，后者更多地做基础研究，腾讯公司对这两者的投入比例大概为1:1。而三大人工智能实验室之一的微信AI团队，则主要聚焦于微信中的AI功能应用。

据腾讯优图实验室总经理、杰出科学家贾佳亚介绍，目前，腾讯优图每日服务调用次数达3亿次，主要调用技术为图像。

在技术上，优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。

目前优图AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域，在手机QQ、QQ 空间、QQ 音乐、微信、广点通、全民K 歌、腾讯觅影等产品中落地，并与滴滴、公安部门、快递等行业已经有了合作案例。其中，智能医疗和自动驾驶是该实验室今年刚涉足的领域。

医疗AI案例

2017年，腾讯优图实验室借助图像识别、深度学习等技术，在肺癌、糖尿病性视网膜病变早筛上取得显著进展，并通过腾讯首个医疗AI产品“腾讯觅影” 进入大规模的临床预试验，在 早期肺癌识别，敏感度(识别正确率)达到86% 以上，在良性肺结核的特异性(识别正确率) 超过86%；糖尿病视网膜病变筛查， 筛查准确率提升至96%，几乎接近医生的诊断结果。

安防AI案例

优图天眼系统：以安防需求为导向，基于多场景海量数据库，自研深度学习和集群计算的人脸检索引擎，面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统，毫秒级识别速度，迅速完成目标人脸和名单照片库的比对，及时返回可疑人脸数据，实现报警通知。

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

智慧零售案例

腾讯优Mall智能零售系统：腾讯优图实验室联合腾讯云打造。基于腾讯优Mall智能零售系统，通过人脸检索、识别技术，识别进店顾客身份，并为老客户进行推荐，最后通过“刷脸”完成支付动作，提升消费者体验，并帮助商场优化购物动线、店铺位置、货架陈列，提升导购推荐效率以及优化广告人群定向属性等，促使线下门店实现数据化和智能化，改变门店运营方式，让门店具有思考能力。

目前，优Mall智能零售系统已经通过百丽进行落地。

金融，政务AI案例

FaceIn 人脸核身解决方案：一种通过用户的一段自拍视频（或一张自拍照）与另外一张照片（可来源于身份证或事先留存自拍照）之间的1:1 人脸验证来确认用户身份的技术手段，主要包括身份证OCR 、活体检测、人脸比对。优图人脸核身服务是业内首家在金融行业（微众银行APP）全量上线的核身服务，既能满足用户实名认证的需求，还能在识别用户为本人的同时判断是否为真人。目前，优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用，同时被应用在政务领域，如“远程缴税”“远程领取社保”。

互联网AI案例

为短视频拍摄、直播、图像处理工具等互联网产品推出了包含「主播核身+美颜特效」的 视频直播解决方案， 通过主播的自拍视频（或一张自拍照）与另外一张照片（可来源于身份证或事先留存自拍照）之间的1:1人脸验证来确认主播身份，防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在B站、东方财富、快看漫画等多个产品中落地使用； 安全审核解决方案 基于优图智能鉴黄技术、暴恐图片识别技术、OCR技术和人脸识别技术，可以精准识别出图片中的露点&不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物，针对广告、社交、游戏、直播、短视频等行业存在的UGC内容，辅助甚至代替人工过滤垃圾，提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。

物流业AI案例

优图实验室与顺丰达成合作，针对运单的收寄件人电话号码、和收件人省市区地址信息进行OCR自动识别信息，再结合自有运单数据库，可以自动匹配到更完整更充分的运单各字段信息，大幅提升运单信息录入效率和物流资源的调度匹配能力，支持印刷体和手写体识别，可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类，也支持票据、运单等定制化场景的识别，可以有效的代替人工录入信息的场景。

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

（优图OCR技术与竞品数据比较）

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

（AI+社交娱乐优图Facekit，目标是摆脱手机端对于三维的依赖，希望通过单目摄象头，完成整个脸部追踪和三维重建）

其中，在AI+社交娱乐领域，腾讯优图此前的开发集中在3D人脸、人脸分析和人脸编辑方面，比如用新的方法改变人的外貌、改变人的皱纹等。但今年，优图新做的技术包括人体分割，达到了96%的准确率；在人体关键点追踪方面，超过80个点的追踪标准的误差率降低至0.48；人体重建方面，优图可以重建3D人脸，这对于游戏行业的应用非常巨大。

另外，优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉，3D建模是非常昂贵的过程，我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂，优图则可以通过一个Video就能实现一个3D建模的匹配和完成，这包括几个重要的方面：一是人体重建算法，第二是动作捕捉的算法，优图在人体重建可以达到53毫米的精度，动作捕捉是74毫米的精度。在游戏的设计和研发过程中，这会产生非常大的作用。

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

以上二维码为腾讯优图与《科学》杂志合作上线的AI产品体验小程序，有兴趣的朋友可以尝试下。

计算机视觉领域仍有待突破

正如斯坦福大学电气工程荣誉教授，密码学先驱，2015年图灵奖获得者，现如今已70多岁高龄的Martin Hellman在演讲中以几个自己的个人经历，见证了计算机视觉技术跨世纪的发展。

19世纪70年代，Hellman在IBM工作时有一个关于OCR识别邮政编码的项目。当时，这对他来说是个巨大的挑战，因为当时OCR一分钟只能识别一个邮编，比人的速度还慢。但是，随着计算机视觉技术的发展，这已经不是问题，因为OCR识别邮编的速度已经提高到5s识别一个邮编，现如今更是花0.5s的时间就可以做到。

但计算机视觉虽然历经了六十年的发展，成为备受关注的人工智能关键技术之一。但是到今天为止，真正的大规模成熟应用还是屈指可数，比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象，很大的原因是技术的局限，很多技术还面临着挑战。以Object detection（物体检测）任务为例，我们有从Fast R-CNN 、Faster R-CNN、R-FCN到FPN等各种不同的目标检测器，但2016年ILSVRC最好的MAP仅有0.6627。包括几个最常用的落地产品，如视频监控，也并非完全成熟，还存在着视频数据采集单一，视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果，现实世界的识别更加复杂，存在的挑战和困难也更多。

这些例子表明，计算机视觉目前还只能用于一些对准确率要求不是特别高的场景，还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域，正如Martin Hellman所说，“一些重要的思想，只有拥有“傻”的精神，执着的精神，才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破，同样也需要这种精神。

感谢蔡芳芳对本文的审校。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Docker——容器与容器云（第2版）

浙江大学SEL实验室 / 人民邮电出版社 / 2016-10 / 89.00元

本书根据Docker 1.10版和Kubernetes 1.2版对第1版进行了全面更新，从实践者的角度出发，以Docker和Kubernetes为重点，沿着“基本用法介绍”到“核心原理解读”到“高级实践技巧”的思路，一本书讲透当前主流的容器和容器云技术，有助于读者在实际场景中利用Docker容器和容器云解决问题并启发新的思考。全书包括两部分，第一部分深入解读Docker容器技术，包括Docker架......一起来看看《Docker——容器与容器云（第2版）》这本书的介绍吧!

码农工具

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

与《科学》达成战略合作

腾讯优图最全公开应用落地

医疗AI案例

安防AI案例

智慧零售案例

金融，政务AI案例

互联网AI案例

物流业AI案例

计算机视觉领域仍有待突破

Docker——容器与容器云（第2版）

HTML 压缩/解压工具

JSON 在线解析

Markdown 在线编辑器