Sockeye 3.0.7 发布,快速、可扩展的深度学习库

栏目: 软件资讯 · 发布时间: 4年前

内容简介:Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye 结合了陈述式和命令式编程风格;可以在多块 GPU 上并行训...

Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye 结合了陈述式和命令式编程风格;可以在多块 GPU 上并行训练模型。

目前 Sockeye 更新到 3.0.7 版本,改进了训练速度,内容如下:

[3.0.7]

在训练期间使用 torch.nn.functional.multi_head_attention_forward 的自注意力和编码器注意力来提高训练速度。

需要重新组织键值输入投影的参数布局,因为当前的 Sockeye 注意力会交错以进行更快的推理。注意掩码(源掩码和自回归掩码都需要一些形状调整,因为对融合 MHA 操作的要求略有不同)。

  • 联合键值输入投影参数的非交错格式:
    in_features=hidden, out_features=2*hidden -> Shape: (2*hidden, hidden)
  • 联合键值输入投影的交错格式存储键和值参数,按头部分组:
    Shape: ((num_heads * 2 * hidden_per_head), hidden)
  • 模型以交错格式保存和加载键值投影参数。
  •  model.training == True 键值投影参数被放入非交错格式时torch.nn.functional.multi_head_attention_forward
  •  model.training == False,即 model.eval() 被调用时,键值投影参数再次转换为交错格式。

[3.0.6]

  • 修复了阻止使用bleuas--optimized-metric进行分布式训练的检查点解码器问题(#995

[3.0.5]

  • 修复了多语言教程中的数据下载。

更新公告:https://github.com/awslabs/sockeye/releases/tag/3.0.7


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Scrum敏捷软件开发

Scrum敏捷软件开发

Mike Cohn / 廖靖斌、吕梁岳、陈争云、阳陆育 / 清华大学出版社 / 2010-11 / 69.00元

《Scrum敏捷软件开发》是敏捷联盟及Scrum联盟创始人之一、敏捷估算及计划的鼻祖Mike Cohn三大经典著作中影响最为深厚的扛鼎之作,也是全球敏捷社区中获得广泛肯定的企业敏捷转型权威参考。作者花四年时间,把自己近十五年的敏捷实践经验,特别是近四年中针对各种敏捷转型企业的咨询和指导工作,并结合旁征博引的方式,从更高的思想层次对敏捷与Scrum多年来的经验和教训进行深入而前面的梳理和总结,最终集......一起来看看 《Scrum敏捷软件开发》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具