内容简介:作为一家以Re-ID视频结构化技术和应用为核心的计算机视觉科技公司,千视通团队在Market 1501、DukeMTMC-reID、CUHK03这三个衡量Re-ID技术最通用的数据集测试中,获得了巨大突破。这些数据集中有两项核心指标评判标准:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,缩写mAP,它反映检索的人在底库中的所有图片排在结果队列前面的程度)。千视通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已经达到
作为一家以Re-ID视频结构化技术和应用为核心的计算机视觉科技公司,千视通团队在Market 1501、DukeMTMC-reID、CUHK03这三个衡量Re-ID技术最通用的数据集测试中,获得了巨大突破。这些数据集中有两项核心指标评判标准:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,缩写mAP,它反映检索的人在底库中的所有图片排在结果队列前面的程度)。
千视通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已经达到97.1%,超越人眼识别能力(94%),领先头部厂家,并刷新了今年4月公布的96.6%的世界纪录。同时在CUHK03,Duke MTMC-reID两个数据集上也刷新了之前业内最高纪录,达到了行业state of the art的技术水平,特别是在CUHK03数据集上,Rank 1指标提高了10.7%。
Market 1501:由清华大学提供,使用了6个摄像头(5高清和1低清),镜头之间有部份重叠,当中有 1501个人的身份,共有32668个标物框/行人图片。千视通在最新的测试报告中显示,该数据集中首位命中率高达97.1%(篮框代表正确目标,红框代表误报或不清晰目标)。
(千视通Market1501 部分测试结果)
Duke MTMC-reID:格式基本上跟 Market 1501一样,共有1404个人的身份,并 36411个标物框/行人图片。DukeMTMC其实不止有Re-ID用的训练及测试素材,它本来是用于视频之间的(真正)多摄像头多轨迹动态追踪。用来训练或测试 Re-ID,只是它的其中一个功能。千视通在Duke MTMC-reID数据集中测试的mAP结果78.9%,刷新之前榜单第一的78.4%,而Rank1成绩为89.1%,超过之前第一名88.7%。
(千视通Duke MTMC-ReID 部分测试结果)
CUHK03:是香港中文大学所提供的。它前身有CUHK01 和CUHK02,因为这两个数据库不够作深度学习训练,所以采集了更多数据生成 CUHK03。这个数据库有1360个人的身份,并有 13164张图片,同样由6个摄像头所拍摄。千视通在该数据集中测试的mAP结果为74.8%,远远超过原先排行第一的67.4%数据,而Rank1更是达到78.7%,比之前榜首的68%提升了足足10.7%。
(千视通CUHK03 部分测试结果)
以上数据由国家超级计算长沙中心,以及长沙市公安局刑事侦查支队视频侦查大队测试验证。
自研技术创新,千视通Re-ID算法有效提高可识别率
Re-identification,简称Re-ID,即行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。作为人脸识别技术的重要补充,其发展内核便是在不同视频中,在无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。可广泛应用于智能视频监控、智能安保等领域。
举个例子,我们所熟悉的哈利·波特作品,在《阿兹卡班囚徒》中想象出一种叫做活点地图 (Marauder’s Map)的魔法道具,展开地图,除了显示基本地图信息外,还能实时观看某个指定人物的行动轨迹。
回到现实世界,我们现在可以在摄像头的部署环境中,通过上传特定人物的照片,同时检测多个不同位置的摄像头数据,精准找出所有摄像头抓拍到的目标人物图像,并生成他/她的行动时空轨迹,达到跨镜追踪的目的。
由于多个摄像头下拍摄行人的角度、光线等条件不同,图像中的行人很难被判断为同一个人。所以就要找到行人上的局部不变的部分,比如:衣服颜色,衣服纹理,手提包,背包等。同时行人兼具刚性和柔性的特性 ,外观易受穿着、尺度、遮挡、姿态和视角等影响,行人再识别是一个既具研究价值同时又极富挑战性的课题,为了提升Re-ID的可识别率,千视通做了多方面的算法优化,致力于加速Re-ID的应用落地。
·考虑讯息全面:一般算法只考虑了全局、多粒度及水平汇集讯息,而水平汇集讯息主要用于把图片对齐。在实际的情况下,摄像头的角度多变,同时人行是非刚体,所以,垂直方向也理应同时考虑。对于此种情况,千视通在网络设计上开发了自研的垂直汇集及其关联的算法层,用以更好的适应以上情况。
·强化特征空间的可分辨性: 千视通的 ReID 算法,针对损失函数进行改良,并提出了新的方案,能一方面增大类间距离并同时最细化类内距离。这代表能提高所计算出的高维特征向量的唯一性,并能有效的提高可识别率。
千视通卡视联动技战法,Re-ID+人脸识别助力高效办案
提到计算机视觉领域的大规模应用,大家首先想到的是人脸识别,其实Re-ID作为新兴研究方向在最近几年受到的关注程度是非常高的。千视通发现,目前人脸识别技术在安防行业落地较多,的确是发展所向,但在很多实际场景中,人脸识别技术作用并不突出。
受限于视频监控探头的安装高度及密度,在实际运行过程中,它们更多拍到的是行人的头顶、后脑勺或者侧脸。其次,即便拍到人脸,摄像头拍摄的像素可能不高,尤其是远景摄像头里面人脸截出来很可能都没有32x32的像素。所以人脸识别在实际的重识别应用中很可能有限,无法看清。
于是,千视通基于多年实战经验,提出一种卡视联动技战法,结合人脸识别和跨镜追踪(Re-ID)各自的特点及优势,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,具有极强的实战价值,对安防行业具有颠覆性意义。
让AI算法落地,不断寻找业务场景
技术发展永远都是一条向上的道路,对于Re-ID技术的精进上,千视通不断投入大量资源进行相关技术研究、攻克。但无论是数据排名如何刷新、赶超世界水准,都绕不开一个最重要的议题:让AI算法落地。作为国内第一家发布视频搜索产品的人工智能计算机视觉科技公司,千视通七年里一直在最前线深耕,在业务场景里发现行业痛点并不断打磨算法和产品,获得了300+客户单位的认可。
千视通相信,AI技术的发展要与场景应用密切结合,用最好的服务去发挥AI算法的价值,推动各行各业迈入更高效的时代去赋能。随着场景愈加丰富与成熟,千视通的技术也在迅速往前超。
由一项技术的突破,衍生到规模化的运作,为一个行业带来更极致的降本增效,人工智能,让城市更加安全、便捷、智慧,是千视通一直秉承的伟大使命!
一直以来,技术都是推动商业环境进化的重要因素,而目前最热的技术升级趋势,无疑是人工智能。当下,尽管人工智能行业本身已经进入了一个平稳的发展期,但它对于各行各业的赋能却正在以更热烈的姿态进行。
2018年11月30日上午,亿欧将在北京国贸大酒店举办“新技术·新动能创新者论坛”,以技术为核心要素,从行业角度出发,探讨新技术趋势下,企业如何把握升级机会、跟上时代节奏,在诸多竞争者中脱颖而出。
详情及报名链接: https://www.iyiou.com/post/ad/id/730
版权声明
凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- NVIDIA/悉尼科技大学/澳洲国立大学新作:用GAN生成高质量行人图像,辅助行人重识别
- 阿里行人重识别(ReID)算法效果刷新业内最好成绩
- 深度学习行人重识别综述与展望,TPAMI 2021 最新文章
- 澎思科技刷新跨域行人再识别(ReID)三大数据集世界纪录
- 行人重识别告别辅助姿势信息,港中文、商汤等提出姿势无关的特征提取GAN
- CVPR 2019 | 旷视研究院提出一种行人重识别监督之下的纹理生成网络
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Numerical Recipes 3rd Edition
William H. Press、Saul A. Teukolsky、William T. Vetterling、Brian P. Flannery / Cambridge University Press / 2007-9-6 / GBP 64.99
Do you want easy access to the latest methods in scientific computing? This greatly expanded third edition of Numerical Recipes has it, with wider coverage than ever before, many new, expanded and upd......一起来看看 《Numerical Recipes 3rd Edition》 这本书的介绍吧!