美图推出业界最大规模教程类行为数据集 | CVPR 2019

雷锋网 (公众号：雷锋网) AI 科技评论按，计算机视觉顶会 CVPR 2019 即将于 6 月在美国长滩召开，今年有超过 5165 篇的大会论文投稿，最终录取 1299 篇。随着会议临近，各大公司纷纷揭晓自家被收录论文。

美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作，推出了业界最大规模教程类行为数据集 COIN（COmprehensive INstructional video analysis），相关论文（COIN: A Large-scale Dataset for Comprehensive Instructional Video Analysis）已被 CVPR 2019 录用。

COIN 数据集概览

教程类行为视频（Instructional Video）可以帮助使用者获取完成各种行为任务的知识，但是现有教程类行为视频数据集在规模性和多样性上都存在较大的局限性，难以应用于现实生活中的复杂场景。为此，美图公司社交产品事业群视觉算法组与清华大学自动化系智能视觉实验室合作提出了名为 COIN 的大规模教程类数据集，用于更全面的教程类行为视频分析。

COIN 数据集在标注结构上采用分层的组织结构，第一层是领域（Domain）、第二层是任务（Task）、第三层是步骤（Step），其中包含与日常生活相关的 11827 个视频，涉及交通工具、电器维修和家具装修等 12 个领域的 180 个任务，共 778 个步骤。

美图推出业界最大规模教程类行为数据集 | CVPR 2019

COIN 数据集的分层结构

COIN 数据集的设计人员还开发了创新性的标注工具，可以更高效更准确地标注视频行为的步骤信息。此外，为了给数据集提供更准确的基准指标，数据集开发人员还使用了 SSN、R-C3D 等评价方法对 COIN 数据集进行了测评。

美图推出业界最大规模教程类行为数据集 | CVPR 2019

COIN 数据集的步骤定位准确率分析

论文地址： https://arxiv.org/abs/1903.02874

GitHub地址： https://coin-dataset.github.io

雷锋网版权文章，未经授权禁止转载。详情见转载须知。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

深入理解Nginx（第2版）

陶辉 / 机械工业出版社 / 2016-2 / 99.00元

本书致力于说明开发Nginx模块的必备知识，第1版发行以后，深受广大读者的喜爱．然而由于Ng,nx功能繁多且性能强大，以致必须了解的基本技能也很庞杂，而第1版成书匆忙，缺失了几个进阶的技巧描述，因此第2版在此基础上进行了完善。书中首先通过介绍官方Nginx的基本用法和配置规则，帮助读者了解一般Nginx模块的用法，然后重点介绍了女口何开发HTTP模块(含HTTP过滤模块)来得到定制化的Ng......一起来看看《深入理解Nginx（第2版）》这本书的介绍吧!

码农工具

在线进制转换器

各进制数互转换器

美图推出业界最大规模教程类行为数据集 | CVPR 2019

深入理解Nginx（第2版）

在线进制转换器

HTML 编码/解码