运用 MXNet Scala API 接口进行图像分类

栏目: Scala · 发布时间: 6年前

内容简介:雷锋网按:本文为雷锋字幕组编译的技术博客,原标题 Image Classification with MXNet Scala Inference API,作者为 Qing Lan, Roshani Nagmote翻译 | 朱茵    整理 |  凡江

雷锋网按:本文为雷锋字幕组编译的技术博客,原标题 Image Classification with MXNet Scala Inference API,作者为 Qing Lan, Roshani Nagmote

翻译 | 朱茵    整理 |  凡江

运用 MXNet Scala API 接口进行图像分类

随着 MXNet 1.2.0 版本的发布,新的 MXNet Scala API 接口也发布了。这次发布的 Scala,里面的推理应用程序致力于优化开发者体验。Scala 是一个通用目的程序语言,支持功能性编程和较强的静态类型系统,它被用于平台的高度分布式处理像 Apache Spark。

现在,你们有了新的 Scala API 接口,准备自己试验下。首先你们需要使用 mxnet-full 包来搭建环境,然后你们可以在图像分类的实例和目标侦测的实例上尝试下。(目标侦测的实例我们将在下一次的博客中公布演示)。

环境搭建 (Linux/OSX)

使用 maven 来安装 mxnet-full 包。在 pom 文件里添加属性。请转换 <你的平台> 到你们正在使用的平台。(OSX: osx-x86_64-cpu, Linux: linux-x86_64-cpu/gpu)

运用 MXNet Scala API 接口进行图像分类

如果你正在使用 IntelliJ,你应看到安装包已被导入。你也可以根据这个教程用 MXNet Scala 包来设置 IntelliJ。
图像分类实例
在这部分,你将使用预训练的图像分类模型做推理。这个例子使用了 ResNet152 模型。你可以使用这个脚本来下载这个模型文件。
以下是重建这个例实例需要导入的库。

运用 MXNet Scala API 接口进行图像分类

第一步:创建运行这个实例的主要功能 

运用 MXNet Scala API 接口进行图像分类

这里的环境意思是定义这个模型,代码将会运行。如果你想用 GPU(s) 来运行的话,你可以将这行代码改成 context.gpu()。本实例,我们使用了这副图片。

运用 MXNet Scala API 接口进行图像分类

然后给模型添加路径并添加使用 API 接口做测试的图像。

  第二步:加载模型并做推

以下代码是之前代码块的延续:

运用 MXNet Scala API 接口进行图像分类

需要用一个输入描述符来定义输入来源和模型配置。「数据」就是输入数据的名字。输入形状是输入图像的形状。输入的矩阵是 224*224 像素大小的三个信道。

运用 MXNet Scala API 接口进行图像分类

在我们挑选和整理好我们所有的输入后,我们创建了一个图像分类器目标,使用它来加载图像。然后我们开始在样本图像上做分类。「Some(5)」区域意思是我们将选取最准确的前 5 个预测。这个区域是选择性的,未分类顺序的预测会是默认选项。一旦完成这一步,我们只需打印显示输出。

运用 MXNet Scala API 接口进行图像分类

结果 

结束上一步后,你将看到类似于以下的输出(这儿我们使用了一张哈巴狗的图像):

运用 MXNet Scala API 接口进行图像分类

运用 MXNet Scala API 接口进行图像分类

第一个元素是分类「n02110958 pug, pug-dog」,第二个值是由分类器决定的该分类的可信度值。
总结 
这次简单的试验后,你应当能够使用 MXNet Scala API 接口创建一个图像分类器。你能在 MXNet 项目资源库的 Scala 推理图像分类器实例中找到更多有关这个实例的代码信息。

在我们后续的博客中,我们将介绍使用 MXNet Scala API 接口处理目标侦测的任务。

运用 MXNet Scala API 接口进行图像分类

雷锋网雷锋网 (公众号:雷锋网)

雷锋网原创文章,未经授权禁止转载。详情见 转载须知


以上所述就是小编给大家介绍的《运用 MXNet Scala API 接口进行图像分类》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Processing编程学习指南(原书第2版)

Processing编程学习指南(原书第2版)

[美]丹尼尔希夫曼(Daniel Shiffman) / 李存 / 机械工业出版社 / 2017-3-1 / 99.00元

在视觉化界面中学习电脑编程的基本原理! 本书介绍了编程的基本原理,涵盖了创建最前沿的图形应用程序(例如互动艺术、实时视频处理和数据可视化)所需要的基础知识。作为一本实验风格的手册,本书精心挑选了部分高级技术进行详尽解释,可以让图形和网页设计师、艺术家及平面设计师快速熟悉Processing编程环境。 从算法设计到数据可视化,从计算机视觉到3D图形,在有趣的互动视觉媒体和创意编程的背景之......一起来看看 《Processing编程学习指南(原书第2版)》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具