内容简介:训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI 架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。“为了加速计算机视觉领域的这一过程,[我们] 开发了一个名为 [CVAT] 的程序,”英特尔在
训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI 架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。
为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。
GitHub 开源地址奉上,感兴趣的同学可以试一试:
https://github.com/opencv/cvat“为了加速计算机视觉领域的这一过程,[我们] 开发了一个名为 [CVAT] 的程序,”英特尔在 一篇博文 中写道。 “通常,有很多方法可以注释数据,但使用特殊工具 [如 CVAT] 可能有助于加快这一过程。”
正如 Santa Clara 公司所解释的那样,CVAT 通过 Docker 进行部署,并通过基于浏览器的界面(或者可选地嵌入到 Onepanel 等平台中)进行访问,并具有针对协同工作优化的基于任务的管理系统。(用户创建公共任务以将工作分开。)它支持与对象检测、图像分类和图像分割相关的监督机器学习任务,以及具有四种类型之一的注释:框、多边形、折线和点。
在 CVAT 中,注释器可以使用大量 工具 来复制和传播对象、应用过滤器、调整视觉设置,以及通过谷歌的 TensorFlow 框架中的对象检测 API 执行自动注释等。CVAT 会自动执行一些检查(但不是所有检查,有些检查需要手动进行),且可与英特尔的 OpenVino、英伟达的 Cuda 和 ELK(Elasticsearch、Logstash 和 Kibana)分析系统等工具包很好地配合使用。
但是,CVAT 仍在继续完善,英特尔表示,目前仅在 Chrome 上进行了广泛测试,在其他浏览器上可能会不好用,并表示 Chrome 中的沙盒功能 Sandbox 限制了流程周围的环境,包括使用 RAM,这会对工具包的性能产生负面影响。但英特尔承诺将会改进这一点。
“CVAT 是在专业注释和算法团队的支持下开发的,我们想要为这些团队提供最有价值的功能…用户的反馈有助于英特尔确定 CVAT 未来的发展方向,”该公司表示。“我们希望改进工具的用户体验、功能集、稳定性、自动化功能以及与其他服务集成的能力,并鼓励社区成员积极参与 CVAT 的开发。”
在 CVAT 发布几周前,Uber 开源了自动可视化系统(一个基于网络的车辆数据平台),之后,Scale 和 Hive 等样本标签初创公司也筹集了大量的风险投资,并吸引了优步和通用汽车等大厂的关注。
参考链接: https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/
以上所述就是小编给大家介绍的《英特尔开源计算机视觉数据标签工具 CVAT,加速数据注释》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 白硕:区块链+开源数据库≥商业数据库
- 开源数据库接连修改开源协议,下一个会是谁?
- [开源项目]矩阵数据的意义
- 数据堂开源1505小时中文普通话语音数据集
- 大数据领域开源工具有哪些
- 开源工具 | Python数据科学入门
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Tensorflow:实战Google深度学习框架
郑泽宇、顾思宇 / 电子工业出版社 / 2017-2-10 / 79
TensorFlow是谷歌2015年开源的主流深度学习框架,目前已在谷歌、优步(Uber)、京东、小米等科技公司广泛应用。《Tensorflow实战》为使用TensorFlow深度学习框架的入门参考书,旨在帮助读者以最快、最有效的方式上手TensorFlow和深度学习。书中省略了深度学习繁琐的数学模型推导,从实际应用问题出发,通过具体的TensorFlow样例程序介绍如何使用深度学习解决这些问题。......一起来看看 《Tensorflow:实战Google深度学习框架》 这本书的介绍吧!