几句话总结一个算法之RNN、LSTM和GRU

栏目: 数据库 · 发布时间: 6年前

内容简介：一般神经网络隐层的计算是h=g(w * x)，其中g是激活函数，相比于一般神经网络，RNN需要考虑之前序列的信息，因此它的隐藏h的计算除了当前输入还要考虑上一个状态的隐藏，h=g(w有上面普通RNN可以知道，每个状态下的RNN输入实际有两个，上一个隐藏h'以及当前输入x。RNN有个问题是对序列中的各个状态都是等同对待的，如果某个状态很重要，是无法长期影响后面的输出的。LSTM为了解决这个问题提出了类似于门控的想法，三个门控信号均有h'和x计算得到，分别是遗忘门、记忆门和输出门。遗忘门和记忆门用来融合当前候选

RNN

一般神经网络隐层的计算是h=g(w * x)，其中g是激活函数，相比于一般神经网络，RNN需要考虑之前序列的信息，因此它的隐藏h的计算除了当前输入还要考虑上一个状态的隐藏，h=g(w * x+w' * h')，其中h'是上一次计算的隐层，可见信息传递是通过隐层完成的。

LSTM

有上面普通RNN可以知道，每个状态下的RNN输入实际有两个，上一个隐藏h'以及当前输入x。RNN有个问题是对序列中的各个状态都是等同对待的，如果某个状态很重要，是无法长期影响后面的输出的。LSTM为了解决这个问题提出了类似于门控的想法，三个门控信号均有h'和x计算得到，分别是遗忘门、记忆门和输出门。遗忘门和记忆门用来融合当前候选隐层状态和上一时刻的隐层状态得到"传递信息"，最后在输出门的控制下根据当前"传递信息"再计算一个隐层和输出层。

GRU

上面说的LSTM有好几个门，实际上有部分门是可以共用的，比如遗忘门和记忆门在GRU里面叫更新门；另外，输出门被移到下方用来计算候选隐藏状态，在GRU里面叫重置门，重置门有助于捕捉时间序列里短期的依赖关系，更新门有助于捕捉时间序列里长期的依赖关系。

以上所述就是小编给大家介绍的《几句话总结一个算法之RNN、LSTM和GRU》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

我看电商

黄若 / 电子工业出版社 / 2013-6-1 / 39.00元

本书是作者近30年从事及电子商务管理的总结和分享。近年来电商行业在中国迅猛发展，2012年网络市场规模达到13,000亿人民币，诞生了淘宝、天猫、京东、、凡客、唯品会……等一大批全新的网络公司，电子商务正在日益深入的影响着越来越多人的生活。同时，这个行业连年亏损，顾客服务良莠不齐，也广为人们所关注。作者从地面到电子商务，从跨国公司高管到管理民营企业，从开创天猫模式到带领上市，被业界称为中国......一起来看看《我看电商》这本书的介绍吧!

码农工具

几句话总结一个算法之RNN、LSTM和GRU

RNN

LSTM

GRU

我看电商

MD5 加密

XML、JSON 在线转换

UNIX 时间戳转换