论文笔记：Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

栏目: 数据库 · 发布时间: 6年前

作者

Junyoung Chung
Caglar Gulcehre
KyungHyun Cho
Yoshua Bengio

观点

RNN 在很多机器学习任务尤其是变长输入输出的任务上效果拔群
经典 RNN 有两个主要的问题: 梯度消失, 长期记忆急速衰减。
解决 RNN 难以训练的尝试有两种: 一种是设计更好的学习方法(Bengio 2013)，另外一种是设计更复杂的激活函数
LSTM 不会每次都重写 memory，而是可以通过 input/forget gate 在需要的时候尽量地保留原来的 memory
LSTM/GRU 中额外增加的 cell state，让它们能记住较早之前的某些特定输入，同时让误差反向传播时不会衰减地太快

数据集

polyphonic music dataset(Boulanger-Lewandowski et al. 2012)
- Nottingham: http://abc.sourceforge.net/NMD/
- JSB Chorales: http://www.jsbchorales.net/index.shtml
- MuseData: http://musedata.stanford.edu/
- Piano-midi: http://www.piano-midi.de/
Ubisoft Datasets

模型/实验/结论

实验: 在上述几个数据集上，分别使用经典 RNN、LSTM、GRU 进行训练，并记录 NLL 的变化情况。

结论: LSTM/GRU 在收敛速度和最后的结果上，都要比经典 RNN 要好，但 LSTM 和 GRU 在不同的数据集和任务上虽然互有优劣但差异不大，具体使用 LSTM 还是 GRU 还要视情况而定。

概念和术语

polyphonic music:

(来自维基百科)

复音音乐/复调音乐/和弦，一种“多声部音乐”。作品中含有两条以上（含）独立旋律，通过技术性处理，和谐地结合在一起，这样的音乐就叫做复音音乐。

复音音乐第一个“音”字表示旋律，中国音乐界习惯将“复音音乐”称为“复调音乐”，主要是着眼于曲调一词，但“复调音乐”容易与二十世纪的“复调性音乐”一词混淆。

总结

实验很粗暴，结论很简单。

以上所述就是小编给大家介绍的《论文笔记：Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

JAVA多线程设计模式

结城浩、博硕文化 / 博硕文化 / 中国铁道出版社 / 2005-4-1 / 49.00元

《JAVA多线程设计模式》中包含JAVA线程的介绍导读，12个重要的线程设计模式和全书总结以及丰富的附录内容。每一章相关线程设计模式的介绍，都举一反三使读者学习更有效率。最后附上练习问题，让读者可以温故而知新，能快速地吸收书中的精华，书中最后附上练习问题解答，方便读者学习验证。一起来看看《JAVA多线程设计模式》这本书的介绍吧!

码农工具