Sockeye 3.0.7 发布，快速、可扩展的深度学习库

栏目: 软件资讯 · 发布时间: 3年前

内容简介：Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如，通过符号式和命令式 MXNet API，Sockeye 结合了陈述式和命令式编程风格；可以在多块 GPU 上并行训...

Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如，通过符号式和命令式 MXNet API，Sockeye 结合了陈述式和命令式编程风格；可以在多块 GPU 上并行训练模型。

目前 Sockeye 更新到 3.0.7 版本，改进了训练速度，内容如下：

[3.0.7]

在训练期间使用 torch.nn.functional.multi_head_attention_forward 的自注意力和编码器注意力来提高训练速度。

需要重新组织键值输入投影的参数布局，因为当前的 Sockeye 注意力会交错以进行更快的推理。注意掩码（源掩码和自回归掩码都需要一些形状调整，因为对融合 MHA 操作的要求略有不同）。

联合键值输入投影参数的非交错格式：
in_features=hidden, out_features=2*hidden -> Shape: (2*hidden, hidden)
联合键值输入投影的交错格式存储键和值参数，按头部分组：
Shape: ((num_heads * 2 * hidden_per_head), hidden)
模型以交错格式保存和加载键值投影参数。
当 model.training == True 键值投影参数被放入非交错格式时torch.nn.functional.multi_head_attention_forward
当 model.training == False，即 model.eval() 被调用时，键值投影参数再次转换为交错格式。

[3.0.6]

修复了阻止使用bleuas--optimized-metric进行分布式训练的检查点解码器问题（#995）

[3.0.5]

修复了多语言教程中的数据下载。

更新公告：https://github.com/awslabs/sockeye/releases/tag/3.0.7

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Java语言程序设计

（美） Y. Daniel Liang / 李娜 / 机械工业出版社 / 2011-6 / 75.00元

本书是Java语言的经典教材，多年来畅销不衰。本书全面整合了Java 6的特性，采用“基础优先，问题驱动”的教学方式，循序渐进地介绍了程序设计基础、解决问题的方法、面向对象程序设计、图形用户界面设计、异常处理、I/O和递归等内容。此外，本书还全面且深入地覆盖了一些高级主题，包括算法和数据结构、多线程、网络、国际化、高级GUI等内容。本书中文版由《Java语言程序设计：基础篇》和《Java语......一起来看看《Java语言程序设计》这本书的介绍吧!

码农工具

JSON 在线解析

在线 JSON 格式化工具

SHA 加密

SHA 加密工具