怎样在树莓派上轻松实现深度学习目标检测？

栏目: 软件资讯 · 发布时间: 7年前

内容简介：雷锋网这个现实世界造成了很多挑战，比如数据有限、只有微型的计算机硬件（像手机、树莓派）所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车，冰箱里的橘子，文件上的签名和太空中的特斯拉。免责声明：我正在建设

雷锋网 (公众号：雷锋网) 按：本文为 AI 研习社编译的技术博客，原标题 How to easily Detect Objects with Deep Learning on Raspberry Pi，作者为 Sarthak Jain。
翻译 | 小哥哥狒狒校对 | 老赵整理 | 凡江

这个现实世界造成了很多挑战，比如数据有限、只有微型的计算机硬件（像手机、树莓派）所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车，冰箱里的橘子，文件上的签名和太空中的特斯拉。

免责声明：我正在建设 nanonets.com 来帮助使用很少的数据和没有计算机硬件的情况下构建机器学习模型。

如果你很迫切，请直接下拉到这篇文章的底部进入Github的仓库。

怎样在树莓派上轻松实现深度学习目标检测？

在孟买的公路上检测车辆

为什么是目标检测？为什么是树莓派？

树莓派是一款灵活的计算机硬件，它以1500万台的销量已经吸引了一代消费者的心，并且黑客们也在树莓派上构建了很多很酷的项目。考虑到深度学习和树莓派相机的的流行，我们认为如果能在树莓派上使用深度学习来检测任意的物体那就非常棒了。

现在你可以检测到你的自拍照里的照片炸弹，有人进入到Harambe的笼子里，哪里有辣椒酱或者亚马逊的快递员进入到你的房子里。

怎样在树莓派上轻松实现深度学习目标检测？

什么是目标检测？

2000万年的进化使得人类的视觉系统有了相当高的进化。人脑有30%的神经元负责处理视觉信息（相对比只有8%处理触觉和3%处理听觉）。与机器相比，人类有两个主要的优势。一是立体视觉，二是训练数据集的供应几乎是无限的（一个五岁的婴儿可以大约在30fps的采样间隔获得2.7B的图像数据）。

怎样在树莓派上轻松实现深度学习目标检测？

为了模仿人类水平的表现，科学家将视觉感知任务分解为四个不同的类别。

1. 分类，为图像指定一个标签。

2. 定位，对特定的标签指定一个边框。

3. 物体检测 ，在图像中绘制多个边框。

4. 图像分割 ，得到物体在图像中的精确位置区域。

物体检测对于很多应用已经足够好（图像分割是更精确的结果，它受到了创建训练数据复杂性的影响。相比于画边框它通常花费人类标注者12倍的时间去分割图像。）此外，在检测物体之后，可以将物体在边框中单独分割出来。

使用物体检测：

目标检测具有重要的现实意义，已经在各行各业得到了广泛应用。下面列举了一些例子：

怎样在树莓派上轻松实现深度学习目标检测？

我怎样使用物体检测解决自己的问题？

物体检测可以用于解决各种各样的问题。这些是一个概括的分类：

1. 物体是不是出现在我的图像中？ 比如在我的房子有一个入侵者。

2. 在图像中的一个物体在哪个位置？ 比如一个汽车试图在世界各地导航时，知道物体的位置就很重要。

3. 图像中有多少个物体？ 物体检测是计算物体数目最有效的方法之一。比如仓库的货架上有多少个盒子。

4. 图像中有哪些不同类型的物体？ 比如动物园的哪些区域有哪些动物？

5. 物体的尺寸有多大？ 特别是使用静态的相机，很容易计算出物体的大小。比如芒果的大小是多少。

6. 物体之间是如何相互作用的？ 比如在足球场上的队形是如何影响比赛结果的？

7. 物体在不同时间的位置（跟踪一个物体）？ 比如跟踪一个像火车一样的物体并且计算它的速度。

在 20 行代码内完成物体检测

怎样在树莓派上轻松实现深度学习目标检测？

YOLO算法的可视化

有多种用于物体检测的模型或结构。每一个都在速度、尺寸和精确度之间权衡。我们选择了最流行的一个：YOLO（You only look once），并且展示它如何以20行代码（忽略注释）进行工作。

注意：这是伪代码，不是一个可直接工作的实例。它有一个非常标准的CNN构成的黑箱，如下图所示：

你可以阅读（YOLO）全文： https://pjreddie.com/media/files/papers/yolo_1.pdf

怎样在树莓派上轻松实现深度学习目标检测？

YOLO中使用卷积神经网络的体系结构代码小于20行，如下：

怎样在树莓派上轻松实现深度学习目标检测？

如何建立目标检测的深度学习模型？

深度学习的工作流程有6个基本步骤，分为了三个部分：

1. 收集训练集

2. 训练模型

3. 预测新图像

怎样在树莓派上轻松实现深度学习目标检测？

第1阶段 — 收集训练数据

步骤1. 收集图像（每个对象至少100张）

......

想要继续阅读，请移步至我们的AI研习社社区： http://www.gair.link/page/TextTranslation/904

更多精彩内容尽在 AI 研习社。

不同领域包括计算机视觉，语音语义，区块链，自动驾驶，数据挖掘，智能控制，编程语言等每日更新。

雷锋网(公众号：雷锋网)

点击文末【阅读原文】即可观看更多精彩内容：

基于 OpenCV(C++/Python) 使用深度学习进行人类姿态检测

如何在 Azure 上使用 Horovod 框架进行物体检测的分布式深度学习

基于 OpenCV 使用 YOLOv3 进行深度学习中的物体检测

亚马逊、谷歌、微软等各家公司人脸识别对比

斯坦福CS231n李飞飞计算机视觉经典课程（中英双语字幕+作业讲解+实战分享）

等你来译：

你能在 10 分钟之内解决人物检测的问题吗？

如何使用 OpenCV 编写基于 Node.js 命令行界面和神经网络模型的图像分类

深度学习来自监督的方法

怎样在树莓派上轻松实现深度学习目标检测？

雷锋网原创文章，未经授权禁止转载。详情见转载须知。

怎样在树莓派上轻松实现深度学习目标检测？

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

Web视觉设计

Web视觉设计

Penny McIntire / 叶永彬 / 机械工业出版社 / 2008-08 / 56.00元

本书系统全面地介绍Web页面外观设计的相关知识。本书分为八章：导论、站点分析、导航、页面布局、色彩、图形、排版和表单。全面讲解网站界面所涉及的内容，叙述生动，由浅入深，提供了大量的示例代码以具体地说明如何运用所讨论的设计概念。. 本书可供Web开发技术人员和美工人员参考。...一起来看看《Web视觉设计》这本书的介绍吧!

JSON 在线解析

JSON 在线解析

在线 JSON 格式化工具

图片转BASE64编码

图片转BASE64编码

在线图片转Base64编码工具

随机密码生成器

随机密码生成器

多种字符组合密码

版权所有，保留一切权利！© 2018-2026 码农网粤ICP备17054400号-3