编者按:如果你是机器学习小白,你是否还对着五花八门的机器学习模型和超参数调整感到一头雾水?如果你是调参调到身心俱疲的机器学习er,你是否还在坚持不懈地摸索调参“玄学”?昨天,微软在Ignite大会上最新发布了一套AutoML工具,并已整合进Azure机器学习服务,可以帮你自动完成数据转换、模型选择、超参数工作。这下选择困难和脱发都有救了!
周一,在美国佛罗里达州奥兰多召开的Ignite大会上,微软发布了自动机器学习 工具 公开预览版,并将其整合到了Azure机器学习服务中。
从研究到产品
自动机器学习工具最初来自于微软一项将AI技术应用到生物学的研究项目。在这项研究中,微软研究员Nicolo Fusi和同事们开发了CRISPR.ML工具,借助机器学习帮助生物学家提高CRISPR基因编辑准确率。
微软研究员Nicolo Fusi
在研究过程中,微软的研究人员和机器学习专家在机器学习模型的选择问题上经常会出现意见相左,并且模型的测试和调参过程非常繁琐冗长,花费了大量的时间。
为了解决这一问题,Fusi着手开发了另一个AI工具,用于自动完成AI开发过程中的数据转换、模型选择和超参数调节等工作。
随后,通过与Azure机器学习团队合作,这一自动机器学习的技术最终被整合到了Azure机器学习服务中,供广大AI开发者使用。
自动机器学习工具中包含了两项最重要的功能——机器学习模型的自动选择以及决定模型性能的超参数的自动调节。这两项自动化功能将让更多没有机器学习开发经验的客户得以进行自主的AI开发。
同时,自动机器学习也能够帮助到机器学习专家。这一自动化工具提供了一种便捷的方法,让数据科学研究中大量的繁琐乏味的工作实现了自动化,让科学家们能够专注于其它更重要的功能开发方面的工作。
推荐系统
自动机器学习工具处理数据集的过程类似于在线流媒体服务的电影推荐过程。流媒体服务的新用户观看了几部电影并进行评价之后,系统就会向用户推荐其它新的电影。系统对用户评分最高的电影了解得越多,它后续提供的推荐就会越符合用户的口味。
与此类似,自动机器学习工具也在用户的新数据集上运行以不同方式进行超参数调整的一些模型,来掌握不同调参方法的准确程度,并在此基础上进行进一步的调整,进行成千上万次的迭代。
最终,开发者将会得到一个效果良好的机器学习模型。并且,这一系统永远不需要查看用户数据,用户的数据集仍然保存在他们的本地计算机或者储存于受微软隐私政策保护的Azure虚拟机中。
Azure机器学习团队在进行技术验证、产品测试和与客户进行基准测试的过程中,为客户找到了几种新的自动机器学习工具使用方法。
例如,对于在不同地理位置拥有数百乃至数千台设备(比方说风电场上的风电机)的客户,可以使用自动机器学习功能针对每台设备的机器学习模型进行微调,而此前,这一操作所需的成本和时间是难以承受的。
此外,数据科学家也可以借助自动机器学习工具,验证手工选择和调参的机器学习模型的有效性。在验证过程中还有可能发现一个意想不到的更佳模型。
重构Azure机器学习服务
自动机器学习工具是微软推动Azure机器学习成为端到端解决方案的一部分,微软希望Azure机器学习服务能够帮助所有人构建和训练机器学习模型,并将模型部署到任何地方——无论是在云端,在企业内部,还是在边缘设备上。
除了自动机器学习工具,微软还宣布Azure机器学习服务加入了一个可用于目前广受数据科学家欢迎的 Python 编程语言的软件开发工具包(SDK)。该SDK包括Visual Studio Code、PyCharm、Azure Databricks notebook和Jupyter notebook,实现了Azure机器学习服务与Python开发环境的整合。
微软负责AI平台业务的资深副总裁Eric Boyd表示,“我们一直在聆听用户心声。开发者希望能够自由使用任何开发工具和框架,我们需要重新思考向这些用户提供Azure机器学习服务的方式。因此,我们推出了Python SDK,它可以实现许多不同的功能。”
这些功能包括分布式深度学习和允许开发者使用功能强大的现场可编程门阵列(FPGA)。通过分布式深度学习,开发人员能够通过大规模图形处理单元(GPU)集群更快地构建和训练模型;利用现场可编程门阵列(FPGA),开发者可以在Azure上实现高速图像分类与识别等应用场景。
相关论文:
Probabilistic Matrix Factorization for Automated Machine Learning
https://arxiv.org/abs/1705.05355
访问Azure机器学习服务:
https://azure.microsoft.com/en-us/overview/machine-learning/
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 以jq为案例看套餐服务---外观模式
- 越用越优惠:网传中国移动取消“不限量”套餐
- PyTorch v1.1 重大更新,TensorBoard已加入豪华套餐
- 想小步快跑吗?来一份持续集成流水线套餐吧
- (策略模式+工厂模式+map)套餐 Kill 项目中的switch case
- 美国运营商:将推出5G无限量套餐,5G资费不会比4G贵
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。