内容简介:9月6日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例;与此同时,腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作,探讨通过学术奖金、产学研交流等多种形式,在人工智能前沿研究领域展开广泛合作。腾讯优图实验室现在已升级为腾讯计算机视觉研发中心,聚焦的方向为计算机视觉研究。近年来,虽然计算机视觉在在技术和应用层面均取得了巨大的进步,但面临着的挑战和瓶颈也不可忽视。“一些重要的思想,只有拥有“傻”的精神 ,执着的
9月6日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例;与此同时,腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作,探讨通过学术奖金、产学研交流等多种形式,在人工智能前沿研究领域展开广泛合作。
腾讯优图实验室现在已升级为腾讯计算机视觉研发中心,聚焦的方向为计算机视觉研究。近年来,虽然计算机视觉在在技术和应用层面均取得了巨大的进步,但面临着的挑战和瓶颈也不可忽视。
“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”斯坦福大学电气工程荣誉教授,密码学先驱,2015年图灵奖获得者Martin Hellman在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域,包括计算机视觉,这种精神都同样适用。
与《科学》达成战略合作
峰会上,腾讯高级执行副总裁汤道生宣布国际化战略合作项目:与《科学》(Science)杂志达成战略合作,推动全球计算机视觉发展。
谈到与《科学》的合作的契机,贾佳亚说道,与学术的结合已经成为人工智能领域的趋势,腾讯渴望建立与国际上紧密的合作关系,腾讯将研发和场景结合,旨在为中国科研人员引入最先进的学术平台。另外,《科学》的科学家资源丰富,通过将腾讯的实践应用运用到科学家们的研发和教学中,建立起产业和研究联系的机制,以促进中国人工智能发展。
但关于与《科学》杂志的具体合作规划,腾讯未透露相关信息。
腾讯优图最全公开应用落地
腾讯优图实验室成立于2012 年,是腾讯三大人工智能实验室之一,聚焦计算机视觉,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比AI Lab,优图实验室更偏应用,后者更多地做基础研究,腾讯公司对这两者的投入比例大概为1:1。而三大人工智能实验室之一的微信AI团队,则主要聚焦于微信中的AI功能应用。
据腾讯优图实验室总经理、杰出科学家贾佳亚介绍, 目前,腾讯优图每日服务调用次数达3亿次,主要调用技术为图像。
在技术上,优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。
目前优图AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域,在手机QQ、QQ 空间、QQ 音乐、微信、广点通、全民K 歌、腾讯觅影等产品中落地,并与滴滴、公安部门、快递等行业已经有了合作案例。其中,智能医疗和自动驾驶是该实验室今年刚涉足的领域。
医疗AI案例
2017年,腾讯优图实验室借助图像识别、深度学习等技术,在肺癌、糖尿病性视网膜病变早筛上取得显著进展,并通过腾讯首个医疗AI产品“腾讯觅影” 进入大规模的临床预试验,在 早期肺癌识别,敏感度(识别正确率)达到86% 以上,在良性肺结核的特异性(识别正确率) 超过86%;糖尿病视网膜病变筛查, 筛查准确率提升至96%,几乎接近医生的诊断结果。
安防AI案例
优图天眼系统:以安防需求为导向,基于多场景海量数据库,自研深度学习和集群计算的人脸检索引擎,面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统,毫秒级识别速度,迅速完成目标人脸和名单照片库的比对,及时返回可疑人脸数据,实现报警通知。
智慧零售案例
腾讯优Mall智能零售系统:腾讯优图实验室联合腾讯云打造。基于腾讯优Mall智能零售系统,通过人脸检索、识别技术,识别进店顾客身份,并为老客户进行推荐,最后通过“刷脸”完成支付动作,提升消费者体验,并帮助商场优化购物动线、店铺位置、货架陈列,提升导购推荐效率以及优化广告人群定向属性等,促使线下门店实现数据化和智能化,改变门店运营方式,让门店具有思考能力。
目前,优Mall智能零售系统已经通过百丽进行落地。
金融,政务AI案例
FaceIn 人脸核身解决方案:一种通过用户的一段自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的1:1 人脸验证来确认用户身份的技术手段,主要包括身份证OCR 、活体检测、人脸比对。优图 人脸核身服务是业内首家在金融行业(微众银行APP)全量上线的核身服务, 既能满足用户实名认证的需求,还能在识别用户为本人的同时判断是否为真人。目前,优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用,同时被应用在政务领域,如“远程缴税”“远程领取社保”。
互联网AI案例
为短视频拍摄、直播、图像处理 工具 等互联网产品推出了包含「主播核身+美颜特效」的 视频直播解决方案, 通过主播的自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的1:1人脸验证来确认主播身份,防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在B站、东方财富、快看漫画等多个产品中落地使用; 安全审核解决方案 基于优图智能鉴黄技术、暴恐图片识别技术、OCR技术和人脸识别技术,可以精准识别出图片中的露点&不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物,针对广告、社交、游戏、直播、短视频等行业存在的UGC内容,辅助甚至代替人工过滤垃圾,提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。
物流业AI案例
优图实验室与顺丰达成合作,针对运单的收寄件人电话号码、和收件人省市区地址信息进行OCR自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升运单信息录入效率和物流资源的调度匹配能力,支持印刷体和手写体识别,可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类,也支持票据、运单等定制化场景的识别,可以有效的代替人工录入信息的场景。
(优图OCR技术与竞品数据比较)
(AI+社交娱乐 优图Facekit,目标是摆脱手机端对于三维的依赖,希望通过单目摄象头,完成整个脸部追踪和三维重建)
其中,在AI+社交娱乐领域,腾讯优图此前的开发集中在3D人脸、人脸分析和人脸编辑方面,比如用新的方法改变人的外貌、改变人的皱纹等。但今年,优图新做的技术包括人体分割,达到了96%的准确率;在人体关键点追踪方面,超过80个点的追踪标准的误差率降低至0.48;人体重建方面,优图可以重建3D人脸,这对于游戏行业的应用非常巨大。
另外,优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉,3D建模是非常昂贵的过程,我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂,优图则可以通过一个Video就能实现一个3D建模的匹配和完成,这包括几个重要的方面:一是人体重建算法,第二是动作捕捉的算法,优图在人体重建可以达到53毫米的精度,动作捕捉是74毫米的精度。在游戏的设计和研发过程中,这会产生非常大的作用。
以上二维码为腾讯优图与《科学》杂志合作上线的AI产品体验小程序,有兴趣的朋友可以尝试下。
计算机视觉领域仍有待突破
正如斯坦福大学电气工程荣誉教授,密码学先驱,2015年图灵奖获得者,现如今已70多岁高龄的Martin Hellman在演讲中以几个自己的个人经历,见证了计算机视觉技术跨世纪的发展。
19世纪70年代,Hellman在IBM工作时有一个关于OCR识别邮政编码的项目。当时,这对他来说是个巨大的挑战,因为当时OCR一分钟只能识别一个邮编,比人的速度还慢。但是,随着计算机视觉技术的发展,这已经不是问题,因为OCR识别邮编的速度已经提高到5s识别一个邮编,现如今更是花0.5s的时间就可以做到。
但计算机视觉虽然历经了六十年的发展,成为备受关注的人工智能关键技术之一。但是到今天为止,真正的大规模成熟应用还是屈指可数,比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象,很大的原因是技术的局限,很多技术还面临着挑战。以Object detection(物体检测)任务为例,我们有从Fast R-CNN 、Faster R-CNN、R-FCN到FPN等各种不同的目标检测器,但2016年ILSVRC最好的MAP仅有0.6627。包括几个最常用的落地产品,如视频监控,也并非完全成熟,还存在着视频数据采集单一,视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果,现实世界的识别更加复杂,存在的挑战和困难也更多。
这些例子表明,计算机视觉目前还只能用于一些对准确率要求不是特别高的场景,还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域,正如Martin Hellman所说,“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破,同样也需要这种精神。
感谢蔡芳芳对本文的审校。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 剑桥构建视觉“语义大脑”:兼顾视觉信息和语义表示
- 如何创造性地应用深度学习视觉模型于非视觉任务(附代码)
- MIPS芯片架构宣布开源
- CNCF宣布containerd毕业
- UIScrollView视觉差动画
- 学习 PixiJS — 视觉效果
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Django 1.0 Template Development
Scott Newman / Packt / 2008 / 24.99
Django is a high-level Python web application framework designed to support the rapid development of dynamic websites, web applications, and web services. Getting the most out of its template system a......一起来看看 《Django 1.0 Template Development》 这本书的介绍吧!