内容简介:作者:Frederic Lardinois编译:公众号海外部
标星★公众号 爱你们 ♥
作者:Frederic Lardinois
编译:公众号海外部
近期原创文章:
♥ 基于无监督学习的期权定价异常检测(代码+数据)
♥ 5种机器学习算法在预测股价的应用(代码+数据)
♥ 深入研读:利用Twitter情绪去预测股市
♥ Two Sigma用新闻来预测股价走势,带你吊打Kaggle
♥ 利用深度学习最新前沿预测股价走势
♥ 一位数据科学PhD眼中的算法交易
♥ 基于RNN和LSTM的股市预测方法
♥ 人工智能『AI』应用算法交易,7个必踩的坑!
♥ 神经网络在算法交易上的应用系列(一)
♥ 预测股市 | 如何避免p-Hacking,为什么你要看涨?
♥ 如何鉴别那些用深度学习预测股价的花哨模型?
♥ 优化强化学习Q-learning算法进行股市
微软今天宣布了三项旨在简化机器学习过程的新服务。这些 工具 包括一个新界面主要是用做完全自动化创建模型过程的工具,一个用于构建,训练和部署模型的无代码可视界面,一个为高级用户托管Jupyter风格的notebook。
刚开始学习机器学习是困难的。即使是最基本的实验也需要大量的专业知识。所有这些新工具都隐藏了代码,为那些希望编写自己的代码的人提供了一个预配置的平台,从而大大简化了这个过程。
Azure自动化机器学习工具的新接口使得创建模型变得非常简单,只需导入数据集,然后告诉服务要预测哪个值。用户不需要编写一行代码,而在后端,这个更新的版本现在支持许多新的算法和优化方法,可以生成更精确的模型。虽然大部分都是自动化的,但微软强调,这项服务:“供了完全透明的算法,因此开发人员和数据科学家可以手动重写和控制这个过程。”
对于那些希望从一开始就拥有更多控制权的人来说,微软还发布了Azure机器学习服务的预览版,这款可视化界面将允许开发人员构建、训练和部署机器学习模型,而无需接触任何代码。
这个工具,Azure机器学习可视化界面,看起来很像现有的Azure ML Studio,微软第一次尝试构建一个可视化机器学习工具。实际上,这两个服务看起来是一样的。然而,该公司从未真正推广过这项服务,尽管它似乎一直是开始机器学习的一个非常有用的工具。
微软表示,这个新版本结合了Azure ML Studio和Azure机器学习服务的优点。实际上,这意味着虽然界面几乎相同,但Azure机器学习可视化界面通过运行在Azure机器学习服务之上,并添加服务的安全性、部署和生命周期管理功能,扩展了ML Studio的功能。
该服务提供了一个简单的界面来清理数据,在不同算法的帮助下训练模型,评估它们,最后将它们投入生产。
虽然前两项服务显然是针对新手的,但Azure机器学习中新的托管notebook显然是针对更有经验的机器学习实践者。这些notebook预装了对Azure机器学习Python SDK的支持,并在公司描述为“安全,企业就绪的环境”中运行。这个新特性允许开发人员快速上手,而无需使用所有必要的云资源创建新的开发环境。
附操作流程
地址:
https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-create-portal-experiments
开始使用
导航到你的工作区的左窗格中。 在创作 (预览版) 部分下选择自动机器学习。
如果这是你第一次执行任何使用自动化的机器学习试验,你将看到以下信息:
否则,你将看到自动机器学习仪表板与所有自动化机器学习试验,包括那些运行随 SDK 的概述。 此处可以筛选和按日期浏览在运行过程中,试验名称,并运行状态。
创建试验
选择创建试验按钮以填充以下窗体。
1、输入试验名称。
2、选择计算的数据事件探查和训练作业。 在下拉列表中提供了您现有的计算资源的列表。 若要创建新的计算,请执行步骤 3 中的说明。
3、选择创建新的计算按钮以打开下方窗格中,并配置对于此试验计算上下文。
4、选择你的数据的存储帐户。 公共预览版仅支持本地文件上传和 Azure Blob 存储帐户。
5、选择一个存储容器。
6、从存储容器,选择一个数据文件或上传到容器的文件从本地计算机。
7、使用预览和配置文件选项卡进一步配置你的数据对于此试验。
a. 在预览选项卡上,指示是否你的数据包含标头,并选择特征 (列) 是用于定型包含每个功能列中切换按钮。
b. 在配置文件选项卡,你可以查看数据配置文件的功能,以及分发、 类型和摘要统计信息 (平均值、 中间值、 最大/最小值等) 的每个。
8、选择培训作业类型: 分类、 回归或预测。
9、选择目标列。 其想要对预测的列。
10、用于预测:
a. 选择时间列:此列包含要使用的时间数据。
b.选择预测时间范围:指示多少个时间单位 (分钟/小时/天/周/月/年) 将该模型能够预测到将来的发展。 随着模型需要不太准确它将成为未来的预测。
11、(可选)高级设置: 可用于更好地控制训练作业的其他设置。
数据事件探查
跨您的数据集以验证您的数据集是否是机器学习准备就绪,可以获取各种汇总统计信息。 对于非数字列,其中包括 min、 max 和错误计数等的仅基本统计信息。 对于数值列,您还可以查看其统计一点时间,估计分位数。
高级预处理
在配置在实验时,可以启用高级的设置Preprocess。 因此,这样做意味着自动执行以下数据预处理和特征化步骤。
运行实验并查看结果
若要运行此试验,请单击开始。 实验准备过程需要几分钟的时间。
查看实验详细信息
实验准备阶段完成后,你将看到运行详细信息屏幕。 这样,您创建的模型的完整列表。 默认情况下,最高评分的模型基于您的参数列表的顶部。 如训练作业尝试出更多的模型,则将它们添加到迭代列表和图表中。使用迭代图表以获取到目前为止生成的模型的快速度量值的比较。
训练作业可能需要每个管道完成运行一段时间。
查看训练运行详细信息
向下取的任何输出模型,以查看运行详细信息,如性能指标等。详情见下面的链接:
https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-track-experiments#understanding-automated-ml-charts
—End—
量化投资与机器学习微信公众号,是业内垂直于 Quant 、 MFE 、 CST 等专业的主流自媒体。公众号拥有来自 公募、私募、券商、银行、海外 等众多圈内 10W+ 关注者。每日发布行业前沿研究成果和最新资讯。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 将机器学习可视化
- 机器学习模型的数据预处理和可视化
- 计算性能提升 100 倍!Uber 推出机器学习可视化调试工具 Manifold
- 清华大学刘世霞“可解释机器学习的可视化分析”(附PPT)
- 27 张 AI 速查手册!涵盖神经网络、机器学习、数据可视化等
- 同济大学「智能大数据可视化实验室」开发绘图机器人,相关论文被 AAAI 2019 收录
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
HTML 压缩/解压工具
在线压缩/解压 HTML 代码
SHA 加密
SHA 加密工具