内容简介:Paddle v0.11.1a2 发布了,PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。 ...
Paddle v0.11.1a2 发布了,PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。
本次更新主要带来了性能增益和存储优化,更新内容如下:
配置和环境:
model: SE-ResNet-150
Input: 3 x 224 x 224
batch_size: 25
CentOS 6.3, Tesla P40, single card.
优化前后对比
优化前
Speed | Memory | |
---|---|---|
Fluid(before) | 1.95 sec/iter | 18341 MB |
PyTorch | 1.154 sec/iter | 13359 MB |
Fluid/PyTorch | 1.6898 | 1.3729 |
速度优化后
Speed | Memory | |
---|---|---|
Fluid(opti_speed) | 1.45 sec/iter | 17222 MB |
PyTorch | 1.154 sec/iter | 13359 MB |
Fluid/PyTorch | 1.2565 | 1.2892 |
存储优化后
Speed | Memory | |
---|---|---|
Fluid(opti_mem) | 1.93 sec/iter | 14388 MB |
PyTorch | 1.154 sec/iter | 13359 MB |
Fluid/PyTorch | 1.6724 | 1.0770 |
整体性能提升
issue 详情: #8990
训练时删除 GPU 内存
[WIP] 来自 C ++ 的 Feed 数据
添加基本的 RecordIO API
Polish C++ Reader operators
添加 DoubleBuffer Reader
下载地址:
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 开源 | 深度有趣 - 人工智能实战项目合集
- Facebook开源深度学习推荐模型DLRM
- Uber 开源深度学习分布训练库 Petastorm
- 谷歌开源强化学习深度规划网络 PlaNet
- 阿里开源深度神经网络推理引擎 MNN
- 小米崔宝秋:小米 AIoT 深度拥抱开源
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Hit Refresh
Satya Nadella、Greg Shaw / HarperBusiness / 2017-9-26 / USD 20.37
Hit Refresh is about individual change, about the transformation happening inside of Microsoft and the technology that will soon impact all of our lives—the arrival of the most exciting and disruptive......一起来看看 《Hit Refresh》 这本书的介绍吧!