美图推出业界最大规模教程类行为数据集 | CVPR 2019

栏目: 编程工具 · 发布时间: 5年前

雷锋网 (公众号:雷锋网) AI 科技评论按,计算机视觉顶会 CVPR 2019 即将于 6 月在美国长滩召开,今年有超过 5165 篇的大会论文投稿,最终录取 1299 篇。随着会议临近,各大公司纷纷揭晓自家被收录论文。

美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作,推出了业界最大规模教程类行为数据集 COIN(COmprehensive INstructional video analysis),相关论文(COIN: A Large-scale Dataset for Comprehensive Instructional Video Analysis)已被 CVPR 2019 录用。

美图推出业界最大规模教程类行为数据集 | CVPR 2019

COIN 数据集概览

教程类行为视频(Instructional Video)可以帮助使用者获取完成各种行为任务的知识,但是现有教程类行为视频数据集在规模性和多样性上都存在较大的局限性,难以应用于现实生活中的复杂场景。为此,美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作提出了名为 COIN 的大规模教程类数据集,用于更全面的教程类行为视频分析。

COIN 数据集在标注结构上采用分层的组织结构,第一层是领域(Domain)、第二层是任务(Task)、第三层是步骤(Step),其中包含与日常生活相关的 11827 个视频,涉及交通 工具 、电器维修和家具装修等 12 个领域的 180 个任务,共 778 个步骤。

美图推出业界最大规模教程类行为数据集 | CVPR 2019

COIN 数据集的分层结构

COIN 数据集的设计人员还开发了创新性的标注工具,可以更高效更准确地标注视频行为的步骤信息。此外,为了给数据集提供更准确的基准指标,数据集开发人员还使用了 SSN、R-C3D 等评价方法对 COIN 数据集进行了测评。

美图推出业界最大规模教程类行为数据集 | CVPR 2019

COIN 数据集的步骤定位准确率分析

论文地址: https://arxiv.org/abs/1903.02874

GitHub地址: https://coin-dataset.github.io

雷锋网版权文章,未经授权禁止转载。详情见 转载须知


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

基业长青

基业长青

[美] 詹姆斯·柯林斯、[美] 杰里·波勒斯 / 真如 / 中信出版社 / 2006-9 / 39.00元

如何建立一个伟大并长盛不衰的公司?有思想的人们早已经厌倦了“年度流行语”般稍纵即逝的管理概念,他们渴求获得能经受时间考验的管理思想。 柯林斯和波勒斯在斯坦福大学为期6年的研究项目中,选取了18个卓越非凡、长盛不衰的公司作了深入的研究,这些公司包括通用电气、3M、默克、沃尔玛、惠普、迪士尼等,它们平均拥有近百年的历史。是什么使这些公司不同于它们的竞争对手呢?他们拥有什么别的公司所不具有的法宝呢......一起来看看 《基业长青》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具