传统RNN模型笔记:输入数据长度变化的结构解析

一、案例背景

本案例通过PyTorch的nn.RNN构建单隐藏层RNN模型,重点展示RNN对变长序列数据的处理能力(序列长度从1变为20),帮助理解RNN的输入输出逻辑。

二、核心代码与结构拆解

def dm_rnn_for_sequencelen():# 1. 定义RNN模型rnn = nn.RNN(5, 6, 1)  # input_size=5, hidden_size=6, num_layers=1# 2. 准备输入数据input = torch.randn(20, 3, 5)  # 序列长度=20,批次大小=3,输入维度=5# 3. 初始化隐状态h0 = torch.randn(1, 3, 6)  # 层数×方向=1,批次大小=3,隐藏层维度=6# 4. 前向传播output, hn = rnn(input, h0)# 输出结果print('output形状--->', output.shape)  # torch.Size([20, 3, 6])print('hn形状--->', hn.shape)          # torch.Size([1, 3, 6])print('模型结构--->', rnn)             # RNN(5, 6)

三、关键参数详解

1. 模型定义参数(nn.RNN

参数含义本案例取值说明
input_size输入特征维度5每个时间步的输入向量维度(如单词的 embedding 维度)
hidden_size隐藏层输出维度6每个时间步的隐状态向量维度
num_layers隐藏层层数1单隐藏层结构,简化计算

2. 输入数据格式(input

  • 形状:[sequence_length, batch_size, input_size]
  • 本案例:[20, 3, 5]
    • 20序列长度(sequence_length),每个样本包含20个时间步(如一句话有20个单词);
    • 3批次大小(batch_size),一次并行处理3个样本;
    • 5输入特征维度,与模型定义的input_size一致。

3. 初始隐状态(h0

  • 形状:[num_layers × num_directions, batch_size, hidden_size]
  • 本案例:[1, 3, 6]
    • 1num_layers × num_directions(1层+单向RNN);
    • 3:与输入的batch_size一致,每个样本对应一个初始隐状态;
    • 6:与模型定义的hidden_size一致,初始隐状态的维度。

四、输出结果解析

1. output(所有时间步的隐藏层输出)

  • 形状:[sequence_length, batch_size, hidden_size]
  • 本案例:[20, 3, 6]
    • 包含每个时间步、每个样本的隐藏层输出(20个时间步×3个样本×6维向量);
    • 体现RNN对序列的“逐步处理”特性,保留所有中间结果。

2. hn(最后一个时间步的隐状态)

  • 形状:[num_layers × num_directions, batch_size, hidden_size]
  • 本案例:[1, 3, 6]
    • 仅包含最后一个时间步(第20步)、每个样本的隐状态;
    • 因单隐藏层,hnoutput的最后一个时间步结果完全一致。

五、核心结论:RNN对变长序列的适应性

  • 序列长度可灵活变化:只要输入特征维度(input_size)和批次大小(batch_size)不变,RNN可处理任意长度的序列(如示例1中长度=1,本案例中长度=20)。
  • 输出形状随序列长度调整output的第一个维度始终等于输入序列长度,体现RNN对时序数据的动态处理能力。

六、类比理解

将RNN比作“逐字阅读的处理器”:

  • 输入:3篇文章(batch_size=3),每篇20个单词(sequence_length=20),每个单词用5维向量表示(input_size=5);
  • 处理过程:每读一个单词(时间步),结合上一步的记忆(隐状态),更新当前记忆(6维向量,hidden_size=6);
  • 输出:output是每读一个单词时的记忆记录,hn是读完最后一个单词的最终记忆。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/90202.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/90202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenLayers 快速入门(四)View 对象

看过的知识不等于学会。唯有用心总结、系统记录,并通过温故知新反复实践,才能真正掌握一二 作为一名摸爬滚打三年的前端开发,开源社区给了我饭碗,我也将所学的知识体系回馈给大家,助你少走弯路! OpenLayers…

测试左移方法论

测试左移(Shift-Left Testing)​是一种软件测试方法论,核心思想是将测试活动从传统的开发后期(如系统测试、验收测试阶段)提前到软件生命周期的更早期阶段(如需求分析、设计、编码阶段)&#xf…

OpenCV(01)基本图像操作、绘制,读取视频

图像基础 import cv2 as cv#读取图像 cv.imread(path,读取方式)默认读为彩色图像 #cv.imread(path) cat cv.imread(E:\hqyj\code\opencv\images\\face.png)#显示图像 cv.imshow(window,img) cv.imshow(myimg,cat)print(cat) print(cat.shape) #(h,w,c) 元组(1,1) print(cat…

biji 1

1.应用层:为应用程序提供网络服务。2.表示层:定义数据的格式,对数据进行压缩、解压缩、加密、解密、编码、解码。3.会话层:对通信双方间的会话进行建立、维护、拆除-----session id---区分同一应用程序的不同进程4.传输层&#x…

mongodb的备份和还原(精简)

1 官网下载对应版本msi2 运行msi mongodb-database-tools-windows-x86_64-100.12.2.msi3 将安装地址加到环境变量 C:\Program Files\MongoDB\Tools\100\bin4 查看version mongodump --version mongorestore --version5 运行 备份命令 mongodump --host 127.0.0.1 --db dbname--…

Mac安装Typescript报错

目录 Mac上安装Typescript报错: 原因分析 1. 默认 npm 全局安装目录的权限问题 2. Node.js 的安装方式 如何解决?(无需每次用 `sudo`) 方法 1:修改 npm 全局目录的权限(推荐) 方法 2:配置 npm 使用用户级目录 方法 3:使用 `nvm` 管理 Node.js(最推荐) 为什么建议避免…

spring-cloud概述

单体架构 把业务的所有功能实现都打包在一个war包或者jar包,这种方式就成为单体架构。 比如Spring课程中的博客系统,前端后端数据库实现,都在一个项目中,这种架构就称为单体架构. 举个例子: 比如在电商系统中,我们…

android ROOM kotlin官方文档完全学习

android ROOM kotlin官方文档完全学习2.6 使用 Room 将数据保存到本地数据库 | Android Developers (google.cn) 一、简介 1.1 引入 dependencies {def room_version "2.6.1"implementation "androidx.room:room-runtime:$room_version"//如下三选一a…

DOM编程全解析:操作、事件与存储实战指南

引言:DOM——JavaScript与网页交互的桥梁 DOM(文档对象模型) 是JavaScript操作HTML/XML文档的接口,它将网页文档抽象为一个树形结构,允许开发者通过API动态修改文档的内容、结构和样式。无论是实现动态交互&#xff0…

Ansible命令

Ansible命令 ansible 常用命令 /usr/bin/ansible   #Ansibe AD-Hoc 临时命令执行工具,常用于临时命令的执行 /usr/bin/ansible-doc    #Ansible 模块功能查看工具 /usr/bin/ansible-galaxy   #下载/上传优秀代码或Roles模块 的官网平台,基于网…

SY6974芯片添加enable充电控制节点

1. 需求描述项目背景:基于 Qualcomm MDM9x07 平台的 4G MIFI 产品,使用 Silergy 公司的 SY6974 充电 IC需求内容: 在环境 /sys/class/power_supply/sy6794/enable 下增加一个 sysfs 节点,用于控制是否允许充电:cat /sy…

趣玩-Ollama-Llm-Chatrbot

软件说明 这个软件本人是从零开始实现的聊天机器人。基于Ollama(PythonApi ) Pyside,实现了聊天机器的基本功能,还有一些个性化的功能比如模型管理,敏感词过滤,个性化主题设置,头像设置等功能。…

在mac 上zsh 如何安装最新的 go 工具

文章目录方法一:使用 Homebrew(推荐)方法二:从官网下载安装包方法三:使用 g(Go 版本管理器)方法四:使用 gvm(Go Version Manager)验证安装和配置常用 Go 工具…

(十九)深入了解 AVFoundation-编辑:使用 AVMutableVideoComposition 实现视频加水印与图层合成(上)——理论篇

一、引言在短视频、Vlog、剪辑工具日益流行的今天,给视频添加 Logo、水印、时间戳或动态贴纸,已经成为非常常见的功能需求。这类效果看似简单,其实背后都涉及到“图层合成”的处理:如何将一个静态或动态的图层(如文字、…

Android NDK与JNI深度解析

核心概念定义:NDK (Native Development Kit): 是什么: 一套由 Google 提供的工具集合。目的: 允许 Android 开发者使用 C 和 C 等原生(Native)语言来实现应用程序的部分功能。包含内容: 交叉编译器&#xf…

Golang各版本特性

1. Go各版本特性 | FeelingLife 2. https://chatgpt.com/share/68808f58-ae5c-800a-8153-5358098f301b 3.https://tonybai.com/2024/11/14/go-map-use-swiss-table/

HTML 转 Word API 接口

HTML 转 Word API 接口 支持网页转 Word,高效转换为 Word,提供永久链接。 1. 产品功能 超高性能转换效率;支持将传递的 HTML 转换为 Word,支持 HTML 中的 CSS 格式在 Word 文档中的呈现;支持传递网站的 URL&#xff…

Lucid Search: 极简、隐私友好的问答式搜索引擎技术解析

Lucid Search: 极简、隐私友好的问答式搜索引擎技术解析 产品定位与价值主张 Lucid Search 是一款革命性的问答式搜索引擎,其核心价值在于: 极简体验:无账户、无广告、前端完全静态隐私保护:不写入 Cookie、不记录 IP、无追踪即…

卷积神经网络:模型评估标准

一、分类模型评价指标在模型评估中,有多个标准用于衡量模型的性能,这些标准包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 分数(F1-Score)等…

【前端工程化】前端开发中想做好发布管理可以从哪些方面着手?

在企业级后台系统中,发布管理是整个开发流程的最终环节,也是最为关键的一环。它不仅涉及代码构建完成后的部署操作,还包括版本控制、灰度发布、回滚机制等保障系统稳定性的措施。 本文主要围绕发布流程设计、版本控制、部署方式、灰度策略和回…