PyTorch 1.10 发布:包括 CUDA Graphs API、前端和编译器改进

栏目: 软件资讯 · 发布时间: 3年前

内容简介:PyTorch 1.10 现已发布,该版本包含了自 1.9 以来的 3400 多个 commit ,有 426 位贡献者参与更新。PyTorch 1.10 更新侧重于改进 PyTorch 的训练和性能以及开发人员的可用性。完整的发行说明可在此处获得。主要亮...

PyTorch 1.10 现已发布,该版本包含了自 1.9 以来的 3400 多个 commit ,有 426 位贡献者参与更新。PyTorch 1.10 更新侧重于改进 PyTorch 的训练和性能以及开发人员的可用性。完整的发行说明可在此处获得主要亮点内容包括:

  • 集成了 CUDA Graphs API 以减少 CUDA 工作负载的 CPU 开销。
  • FX、torch.special 和 nn.Module Parametrization 等几个前端 API 已从测试版变为稳定版。
  • 除了 GPU 之外,JIT Compiler 中对自动融合的支持扩展到 CPU。
  • Android NNAPI 支持现已进入测试阶段。

除了 PyTorch 1.10 外,PyTorch 团队还发布了针对 PyTorch 库的重大更新,点此查看关于库更新的详细消息。

PyTorch 版本中的功能分为稳定版 (Stable)、测试版 (Beta) 和原型版 (Prototype)。

PyTorch 1.10 发布:包括 CUDA Graphs API、前端和编译器改进

(Beta) CUDA Graphs API 集成

PyTorch 现在集成了 CUDA Graphs API 以减少 CUDA 工作负载的 CPU 开销。

CUDA Graphs 大大降低了 CPU 绑定 cuda 工作负载的 CPU 开销,从而通过提高 GPU 利用率来提高性能。对于分布式工作负载,CUDA Graphs 还可以减少 jitter,并且由于并行工作负载必须等待最慢的工作负载,因此减少 jitter 可以提高整体并行效率。

集成允许 cuda graphs 捕获的网络部分与由于 graph 限制而无法捕获的网络部分之间的无缝互操作。

(Beta)CPU 融合

开发团队在 PyTorch 1.10 中为 CPU 添加了一个基于 LLVM 的 JIT compiler,可以将torch库调用序列融合在一起以提高性能。这是 PyTorch 团队第一次将编译引入 CPU。

详情可查看:https://pytorch.org/blog/pytorch-1.10-released/


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

3D游戏设计与开发

3D游戏设计与开发

2011-9 / 28.00元

《3D游戏设计与开发》,本书共分为九章:第一章主要对计算机游戏设计和3D游戏引擎进行简单介绍;第二章介绍3D游戏开发基础和Torque引擎的各种对象;第三章详细讲解游戏编程的语言及其语法;第四章详细介绍了Torque引擎编辑器的应用;第五章至第六章介绍了3D游戏的环境、角色和物品的制作;第七章讲解如何实现游戏音效;第八章详细介绍3D网络游戏的创建方法;第九章讲解如何掌握3D资源导入Torque引擎......一起来看看 《3D游戏设计与开发》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

随机密码生成器
随机密码生成器

多种字符组合密码

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具