谷歌开源物体检测系统 API (附代码下载地址)

栏目: 软件资讯 · 发布时间: 7年前

内容简介:谷歌开源物体检测系统 API (附代码下载地址)

雷锋网AI科技评论按:6.15号,谷歌在其“谷歌开源”博客(Google Open Source )中发表一篇名为《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章,文中指出虽然谷歌的物体检测,图像识别机器学习系统很先进,但仍面临着很多挑战,比如如何提高识别精度。为此,谷歌将其物体检测系统代码开源,希望更多爱好者参与进来,共同推动研究领域的发展。雷锋网 (公众号:雷锋网) 编辑对原文做了不改动愿意的整理编译:

在谷歌,有为计算机视觉开发的最灵活,最先进的机器学习(ML)系统,不仅可以用来改进产品和服务,还可以促进研究领域的进步。不过,在单个图像中创建精确的ML模型使其能够定位和识别多个对象仍然是该领域的一个核心挑战,谷歌投入了大量的时间训练和试验这些系统。

谷歌开源物体检测系统 API (附代码下载地址)

图中为其中的一个模型对图片中对象的识别检测效果

去年十月,谷歌内部的物体检测系统已达到了最先进水平,并在COCO检测挑战赛中排名第一。此后,该系统为大量研究期刊提供了结果。在一些谷歌产品中也已投入使用,如NestCam。在Street View中,街道名称,门牌号的检测,和在Image Search中都运用了相似的理念思想。

今天很高兴可以通过TensorFlow Object Detection API将代码开源给更大的研究社区。这个代码库是建立在TensorFlow上端的开源框架,使其构建,训练,展开物体检测模型变得容易。设计这一系统目的是为支持当前最佳的模型,同时允许快速探索和研究。第一个版本包含:

一个可训练的检测模型的集合,包括:

  • 带有MobileNets的SSD(Single Shot Multibox Detector)

  • 带有Inception V2的SSD

  • 带有Resnet 101的R-FCN(Region-based Fully Convolutional Networks)

  • 带有Resnet 101的 Faster RCNN

  • 带有Inception Resnet v2的Faster RCNN

上述每一个模型的冻结权重(在COCO的数据集上训练)可被运用进行推理。

一个Jupyter notebook 可通过我们的模型之一进行开箱推理

借助谷歌云实现便捷的本地训练脚本以及分布式训练和评估管道

SSD模型使用了轻量化的MobileNet,因此它可以轻而易举地实时在移动设备运行。在赢得COCO挑战赛中,谷歌使用了Fast RCNN模型,它需要更多的计算资源,同时结果也更为准确。

更多细节,请参看谷歌发表在 CVPR 2017 (https://arxiv.org/abs/1611.10012)的论文。

准备好开始了吗?

这些代码在计算机视觉应用中非常有用。谷歌希望这次开源能满足一部分人所需。也同时也欢迎更多能为代码库做贡献的人参与进来。现在,就可以下载代码,使用Jupyter notebook对图片中的物体进行识别。也可以使用Cloud ML训练自己的识别器了。

代码下载地址: https://github.com/tensorflow/models/tree/master/object_detection

Jupyter notebook: https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb

Cloud ML: https://cloud.google.com/blog/big-data/2017/06/training-an-object-detector-using-cloud-machine-learning-engine

via Google ; 雷锋网整理编译

雷锋网版权文章,未经授权禁止转载。详情见 转载须知

谷歌开源物体检测系统 API (附代码下载地址)

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算几何

计算几何

奥罗克 / 机械工业 / 2005-4 / 49.00元

本书介绍了在计算机图形学、机器人和工业设计领域逐渐兴起的几何算法的设计和实现。计算几何中使用的基本技术包括多边形三角剖分、凸包、Voronoi图、排列、几何查找、运动计划等。虽然自主处理只涉及数学基础知识领域的一部分,但是它却和当今该研究领域的前沿课题相关。因此,专业的程序员会发现本书是一本不可多得的参考书。   与上一版相比,本版包括以下几方面的新内容:多边形三角剖分的随机化算法、平面点定......一起来看看 《计算几何》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具