内容简介:训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI 架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。“为了加速计算机视觉领域的这一过程,[我们] 开发了一个名为 [CVAT] 的程序,”英特尔在
训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI 架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。
为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。
GitHub 开源地址奉上,感兴趣的同学可以试一试:
https://github.com/opencv/cvat“为了加速计算机视觉领域的这一过程,[我们] 开发了一个名为 [CVAT] 的程序,”英特尔在 一篇博文 中写道。 “通常,有很多方法可以注释数据,但使用特殊工具 [如 CVAT] 可能有助于加快这一过程。”
正如 Santa Clara 公司所解释的那样,CVAT 通过 Docker 进行部署,并通过基于浏览器的界面(或者可选地嵌入到 Onepanel 等平台中)进行访问,并具有针对协同工作优化的基于任务的管理系统。(用户创建公共任务以将工作分开。)它支持与对象检测、图像分类和图像分割相关的监督机器学习任务,以及具有四种类型之一的注释:框、多边形、折线和点。
在 CVAT 中,注释器可以使用大量 工具 来复制和传播对象、应用过滤器、调整视觉设置,以及通过谷歌的 TensorFlow 框架中的对象检测 API 执行自动注释等。CVAT 会自动执行一些检查(但不是所有检查,有些检查需要手动进行),且可与英特尔的 OpenVino、英伟达的 Cuda 和 ELK(Elasticsearch、Logstash 和 Kibana)分析系统等工具包很好地配合使用。
但是,CVAT 仍在继续完善,英特尔表示,目前仅在 Chrome 上进行了广泛测试,在其他浏览器上可能会不好用,并表示 Chrome 中的沙盒功能 Sandbox 限制了流程周围的环境,包括使用 RAM,这会对工具包的性能产生负面影响。但英特尔承诺将会改进这一点。
“CVAT 是在专业注释和算法团队的支持下开发的,我们想要为这些团队提供最有价值的功能…用户的反馈有助于英特尔确定 CVAT 未来的发展方向,”该公司表示。“我们希望改进工具的用户体验、功能集、稳定性、自动化功能以及与其他服务集成的能力,并鼓励社区成员积极参与 CVAT 的开发。”
在 CVAT 发布几周前,Uber 开源了自动可视化系统(一个基于网络的车辆数据平台),之后,Scale 和 Hive 等样本标签初创公司也筹集了大量的风险投资,并吸引了优步和通用汽车等大厂的关注。
参考链接: https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/
以上所述就是小编给大家介绍的《英特尔开源计算机视觉数据标签工具 CVAT,加速数据注释》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 白硕:区块链+开源数据库≥商业数据库
- 开源数据库接连修改开源协议,下一个会是谁?
- [开源项目]矩阵数据的意义
- 数据堂开源1505小时中文普通话语音数据集
- 大数据领域开源工具有哪些
- 开源工具 | Python数据科学入门
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Writing Windows VxDs and Device Drivers, Second Edition
Karen Hazzah / CMP / 1996-01-12 / USD 54.95
Software developer and author Karen Hazzah expands her original treatise on device drivers in the second edition of "Writing Windows VxDs and Device Drivers." The book and companion disk include the a......一起来看看 《Writing Windows VxDs and Device Drivers, Second Edition》 这本书的介绍吧!