文章目录序列模型循环神经网络案例词的表示输出的表示矩阵运算表示交叉熵损失时间反向传播算法BPTT梯度消失与梯度爆炸GRULSTM总结 序列模型 循环神经网络 st是上一个隐层的输出,体现序列数据之间有很强的关联性。 案例 > S0是初始输入,一般是0;S是开始标志。 词的表示 输出的表示 矩阵运算表示 交叉熵损失 时间反向传播算法BPTT 时间反向传播算法 梯度消失与梯度爆炸 GRU LSTM 总结