【TechWeb】6月30日消息,澎思科技(Pensees)官方宣布其再次在单帧图片数据集(Market1501,DukeMTMC-reID,MSMT17)刷 新世界 ( 600628 , 诊股 )纪录,大幅提升了跨域ReID算法的准确率。
此前,澎思科技曾在三大主流单帧图片行人再识别数据集、三大主流视频行人再识别数据集刷新世界记录。
据了解,澎思科技此次成果的取得源于澎思新加坡研究院对算法的自研创新和融合探索。本次,澎思科技将对抗生成网络与自监督学习算法结合进行模型的训练,通过迁移学习,进行高准确率的跨场景(数据库)行人再识别算法的研发,取得了突破性进展 。
澎思科技方面表示,该突破对于行人再识别技术在应用场景中的落地具有重要的意义。
澎思科技对行人再识别(ReID)算法进行了长期关注的研究。行人再识别(ReID)算法能够通过视频监控系统,在跨摄像头的条件下检索行人,大大拓展摄像资源的利用深度。特别在公共安全领域,ReID可以弥补人脸识别的局限,提升对特定人物的识别追踪能力,并大大降低人力成本。然而相比人脸识别的百万级数据库,行人再识别面临着数据量不足和复杂应用场景变化的挑战。因此,展开高准确率的跨场景(数据库)行人再识别算法研究对于行人再识别技术的应用落地十分重要。
此次澎思科技刷新的ReID三大数据集,除了Market1501,DukeMTMC-reID两大常见数据集之外,还包含了MSMT17数据集。MSMT17,即Multi-Scene Multi-Time,是在CVPR 2018上提出的一个更接近真实场景的大型数据集,涵盖了多场景多时段,是目前最赋有挑战性的综合跨场景大数据集。与之前的数据集相比,该数据库中行人和摄像头数目更多,覆盖场景更复杂,时间跨度更广。因此,在该数据集下模型的表现更能体现出算法的实力。
MSMT17 数据集与其他数据集的直观对比
最终,通过与目前最新的主流算法进行对比,澎思科技的ReID算法无论在首位命中率(Rank-1 Accuracy),还是平均精度均值(Mean Average Precision,mAP)上的表现都明显更好,准确率更高。
本次,澎思科技创新性地将对抗生成网络与自监督学习算法结合进行模型的训练,通过迁移学习,进行高准确率的跨场景(数据库)行人再识别算法的研发,取得了突破性进展。
对抗生成网络在算法中主要有两个功能:一方面,进行数据库的域迁移,具体为原域到目标域的风格迁移;另一方面,进行目标域数据库的数据增强,具体为生成跨摄像头数据并给模型赋予相机风格不变的约束。自监督学习则是通过聚类的方式给目标域数据库打虚拟标签并微调之前训练好的网络。
源域模型训练
目标域模型自监督学习
近年来,单域行人再识别(Single-Domain Person ReID)取得了巨大进展,但与实际应用场景的要求还存在较大差距,跨域行人再识别(Cross-Domain Person ReID)的研究意义愈发显著。随着人工智能的不断发展演进,如何通过自动迁移学习、自监督学习、GAN等前沿技术实现模型优化,成为跨域行人再识别的重要研究方向。
澎思科技此次创新性地通过迁移学习提升了目标场景下的ReID性能,突破了行人再识别的落地应用限制,真正发挥了ReID的算法作用和技术优势,为行人再识别算法在各类产品和应用场景中的落地打下基础。
以上所述就是小编给大家介绍的《澎思科技刷新跨域行人再识别(ReID)三大数据集世界纪录》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 谷歌刷新世界纪录!2 分钟搞定 ImageNet 训练
- 【谷歌机器翻译破世界纪录】仅用Attention模型,无需CNN和RNN
- 中国技术再下一城 阿里云自研数据库AnalyticDB打破TPC-DS世界纪录
- 新世界纪录:谷歌将圆周率计算到 31 万亿位
- 谷歌取消 I/O 开发者大会;“实锤” 披露CIA持续11年攻击中国网络;阿里达摩院刷新自然语言理解技术世界纪录 | 头条天天见
- NVIDIA/悉尼科技大学/澳洲国立大学新作:用GAN生成高质量行人图像,辅助行人重识别
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。