谷歌开源分布式机器学习库GPipe,用于扩展深度神经网络培训

栏目: 后端 · 发布时间: 5年前

内容简介:谷歌人工智能研究团队昨天宣布开源GPipe,这是一个分布式机器学习库,用于在Lingvo框架下有效地训练大规模深度神经网络模型。GPipe利用同步随机梯度下降和管道并行性进行训练。它将网络层划分为加速器和流水线执行,以实现高硬件利用率。 GPipe还允许研究人员轻松部署加速器以训练更大的模型并在不调整超参数的情况下扩展性能。去年12月,谷歌人工智能研究人员还发表了一篇题为“

谷歌人工智能研究团队昨天宣布开源GPipe,这是一个分布式机器学习库,用于在Lingvo框架下有效地训练大规模深度神经网络模型。

GPipe利用同步随机梯度下降和管道并行性进行训练。它将网络层划分为加速器和流水线执行,以实现高硬件利用率。 GPipe还允许研究人员轻松部署加速器以训练更大的模型并在不调整超参数的情况下扩展性能。

去年12月,谷歌人工智能研究人员还发表了一篇题为“ GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism ”的论文。在本文中,研究人员展示了使用管道并行性来扩展深度神经网络以克服当前加速器的内存限制。让我们来看看GPipe的主要亮点。

GPipe有助于最大限度地提高内存和效率

GPipe有助于最大化模型参数的内存分配。研究人员对云TPUv2进行了实验。这些云TPUv2中的每一个都包含8个加速器核心和64 GB内存(每个加速器8 GB)。通常,没有GPipe,由于内存限制,单个加速器能够训练多达8200万个模型参数,但是,GPipe能够在单个加速器上将立即激活内存从6.26 GB降低到3.46GB。

研究人员还测量了GPipe对AmoebaNet-D模型吞吐量的影响,以测试其效率。研究人员发现,训练中几乎有线性加速。 GPipe还使用11x的加速速度在1024个令牌句子上启用了80亿个参数Transformer语言模型。

谷歌开源分布式机器学习库GPipe,用于扩展深度神经网络培训

研究人员使用GPipe验证了扩大现有神经网络的假设可以帮助实现更好的模型质量。对于该实验,在ImageNet ILSVRC-2012数据集上训练具有5.57百万个模型参数和输入图像尺寸为480×480的AmoebaNet-B。研究人员观察到该模型能够在不使用任何外部数据的情况下达到84.3%的前1/97%前5种单作物验证准确度。

研究人员还在CIFAR10和CIFAR100数据集上进行了转移学习实验,他们观察到巨型模型将最佳公布的CIFAR-10精度提高到99%,将CIFAR-100精度提高到91.3%。

研究人员说:“我们很高兴为更广泛的研究界提供GPipe,并希望它是有效培训大规模DNN的有用基础设施”。

有关更多信息,请查看官方 GPipe博客文章

论文PDF可以到 Linux 公社资源站下载:

------------------------------------------分割线------------------------------------------

免费下载地址在 http://linux.linuxidc.com/

用户名与密码都是 www.linuxidc.com

具体下载目录在/2019年资料/3月/6日/谷歌开源分布式机器学习库GPipe,用于扩展深度神经网络培训/

下载方法见 http://www.linuxidc.com/Linux/2013-07/87684.htm

------------------------------------------分割线------------------------------------------

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址: https://www.linuxidc.com/Linux/2019-03/157312.htm


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数文明

数文明

涂子沛 / 中信出版集团 / 2018-9 / 88.00元

从量数、据数、普适记录、人脸识别、以图搜车,到雾计算、城市大脑、单粒度治理、无匿名社会、量子思维……作为中国研究大数据的权威专家,作者在《数文明》一书中,以大数据为核心元素,抽丝剥茧,深入地阐述了这个大数据时代的文明社会——一个全新的数文明时代。 将大数据与人类文明融合在一起,这本书提供给我们的不仅是一种全新的叙事结构,它还将突破你的认知边界和思维极限,给你提供一个应对这个世界的全新的认知方......一起来看看 《数文明》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

html转js在线工具
html转js在线工具

html转js在线工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具