如何基于时间的反向传播算法来训练LSTMs？

栏目: 数据库 · 发布时间: 6年前

内容简介：本课程的目标是理解基于时间的反向传播算法（Backpropagation Through Time algorithm）来训练LSTMs。完成本课程之后，你将会知道：本课程分为6个部分，它们是：让我们开始吧！

LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。

《Long Short Term Memory Networks with Python》是澳大利亚机器学习专家Jason Brownlee的著作，里面详细介绍了LSTM模型的原理和使用。

该书总共分为十四个章节，具体如下：

第一章：什么是LSTMs？

第二章：怎么样训练LSTMs？（本期内容）

第三章：怎么样准备LSTMs的数据？

第四章：怎么样在Keras中开发LSTMs？

第五章：序列预测建模

第六章：怎么样开发一个Vanilla LSTM模型？

第七章：怎么样开发Stacked LSTMs？

第八章：开发CNN LSTM模型

第九章：开发Encoder-Decoder LSTMs

第十章：开发Bidirectional LSTMs

第十一章：开发生成LSTMs

第十二章：诊断和调试LSTMs

第十三章：怎么样用LSTMs做预测？

第十四章：更新LSTMs模型

本文的作者对此书进行了翻译整理之后，分享给大家。本文是第二期内容，第一期内容为：一万字纯干货|机器学习博士手把手教你入门LSTM（附代码资料）。

2.0 概览

2.0.1 课程目标

本课程的目标是理解基于时间的反向传播算法（Backpropagation Through Time algorithm）来训练LSTMs。完成本课程之后，你将会知道：

基于时间的反向传播算法是什么？以及它涉及的多层感知机网络所使用的反向传播训练算法。
引起Truncated Backpropagation Through Time需要的动机，深度学习中训练LSTMs时最广泛的使用的变体。
一种用于考虑如何通过时间和时间来研究反向传播的规范，以及用于研究和深度学习库中的正则表达式。

2.0.2 课程概要

本课程分为6个部分，它们是：

反向训练算法；
展开循环神经网络；
基于时间的反向传播；
截断基于时间的反向传播；
截断BPTT的配置；
TBPTT的Keras实现。

让我们开始吧！

2.1 反向传播训练

反向传播是指两件事情：

计算导数的数学方法和链式求导规则的使用；
更新网络权值以最小化误差的训练算法；

这是我们在本课中使用的后向传播算法的理解。反向传播算法训练的目的是修改神经网络的权重，以使网络输出的误差与响应于相应输入的一些预期输出相比最小化。这是一个监督学习算法，允许网络对所犯特定错误进行校正。一般算法如下：

提出一种训练输入模式，并通过网络传播训练以获得输出；
将预测输出与预期输出进行比较，并计算误差；
计算误差相对于网络权重的导数；
重复。