【新手向】PyTorch常用Tensor shape变换方法

【新手向】PyTorch常用Tensor shape变换方法

前言

B站UP主科研水神大队长的视频中介绍了“缝合模块”大法,其中专门强调了“深度学习 玩的就是shape”。受此启发,专门整理能够调整tensor形状的几个内置函数,方便以后更好地调整PyTorch代码中的模型结构。

squeeze, unsqueeze

  • torch.squeeze()
  • torch.unsqueeze()

squeeze()用于压缩掉指定的维度,这个维度的取值必须是1,否则无效。unsqueeze()用于在指定的位置增加一个维度。

代码实例:

import torch# image
x1 = torch.ones([4, 3, 256, 256]) # batch_size, channels, height, width
print("x1.shape:", x1.shape) # x1.shape: torch.Size([4, 3, 256, 256])x2 = torch.ones([1, 1, 3])
print("x2.shape:", x2.shape) # x2.shape: torch.Size([1, 1, 3])y1 = x1.squeeze(0)
print("y1.shape:", y1.shape) # y1.shape: torch.Size([4, 3, 256, 256])y2 = x2.squeeze(0)
print("y2.shape:", y2.shape) # y2.shape: torch.Size([1, 3])y6 = x2.squeeze(1)
print("y6.shape:", y6.shape) # y6.shape: torch.Size([1, 3])y7 = x2.squeeze(-1)
print("y7.shape:", y7.shape) # y7.shape: torch.Size([1, 1, 3])y3 = x1.unsqueeze(0)
print("y3.shape:", y3.shape) # y3.shape: torch.Size([1, 4, 3, 256, 256])y4 = x1.unsqueeze(1)
print("y4.shape:", y4.shape) # y4.shape: torch.Size([4, 1, 3, 256, 256])y5 = x1.unsqueeze(-1)
print("y5.shape:", y5.shape) # y5.shape: torch.Size([4, 3, 256, 256, 1])

transpose

transpose()用于调整tensor的维度顺序,在计算机视觉的任务中经常需要调整通道顺序,比如有的模型输出的顺序是(channel, height, width),而有的输出顺序是(height, width, channel),需要通过调换顺序来匹配输入输出。

transpose()有两种用法:

  • torch.transpose()
  • x.transpose()

代码实例:

import torchx1 = torch.ones([4, 3, 256, 256]) # batch_size, channels, height, width
print("x1.shape:", x1.shape) # x1.shape: torch.Size([4, 3, 256, 256])x2 = torch.ones([1, 1, 3])
print("x2.shape:", x2.shape) # x2.shape: torch.Size([1, 1, 3])trans1 = torch.transpose(x1, 0, 1)
print("trans1.shape:", trans1.shape) # trans1.shape: torch.Size([3, 4, 256, 256])trans2 = torch.transpose(x2, 1, 2)
print("trans2.shape:", trans2.shape) # trans2.shape: torch.Size([1, 3, 1])trans3 = x1.transpose(0, 1)
print("trans3.shape:", trans3.shape) # trans3.shape: torch.Size([3, 4, 256, 256])

reshape

reshape()能够在总元素数量不产生变化的前提下改变tensor的形状。它也可以用于处理numpy array的形状。

代码实例:

import torch
import numpy as npx3 = torch.Tensor([1, 2, 3, 4, 5, 6])
print("x3.shape:", x3.shape) # x3.shape: torch.Size([6])reshape1 = x3.reshape(2, 3)
print("reshape1.shape:", reshape1.shape) # reshape1.shape: torch.Size([2, 3])x4 = torch.ones([4, 4, 3, 256, 256])
print("x4.shape:", x4.shape) # x4.shape: torch.Size([4, 4, 3, 256, 256])reshape2 = x4.reshape(4*4, 3, 256, 256)
print("reshape2.shape:", reshape2.shape) # reshape2.shape: torch.Size([16, 3, 256, 256])x5 = np.array([1, 2, 3, 4, 5, 6])
print("x5.shape:", x5.shape) # x5.shape: (6,)reshape3 = x5.reshape(2, 3)
print("reshape3.shape:", reshape3.shape) # reshape3.shape: (2, 3)

view

view()的作用与reshape()的作用相似,也是在总元素数量不产生变化的前提下改变形状,但view()只能对张量进行操作。

代码实例:

import torchx3 = torch.Tensor([1, 2, 3, 4, 5, 6])
print("x3.shape:", x3.shape) # x3.shape: torch.Size([6])view1 = x3.view(2, 3)
print("view1.shape:", view1.shape) # view1.shape: torch.Size([2, 3])
print("view1:", view1)
# view1: tensor([[1., 2., 3.],
#         [4., 5., 6.]])view2 = x3.view(3, 2)
print("view2.shape:", view2.shape) # view2.shape: torch.Size([3, 2])
print("view2:", view2) 
# view2: tensor([[1., 2.],
#         [3., 4.],
#         [5., 6.]])

permute

permute()用于调整维度的顺序。与transpose()一次仅能“对调”两个维度的顺序不同,permute()可以一次调整多个维度的顺序。

代码实例:

import torchx4 = torch.ones([4, 4, 3, 256, 256])
print("x4.shape:", x4.shape) # x4.shape: torch.Size([4, 4, 3, 256, 256])permute1 = x4.permute(1, 3, 4, 0, 2)
print("permute1.shape:", permute1.shape) # permute1.shape: torch.Size([4, 256, 256, 4, 3])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/92225.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/92225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React 18 vs Vue3:状态管理方案深度对比

🔥 背景: React有Redux、Zustand、Jotai等方案 Vue有Pinia、Vuex 4.x 如何选择适合项目的方案? 🔍 核心对比: 维度 React (Redux Toolkit) Vue3 (Pinia) 类型安全 ✅ 需手动配置TS ✅ 自动类型推导 代码量 较多(需写action) 较少(类似Vuex 5) 响应式原理 不可变数据…

UE5网络联机函数

Find Sessions Create Session Join Session Destroy Session Steam是p2p直接联机 一、steam提供的测试用AppId AppId是steam为每一款游戏所设定的独有标识,每一款要上架steam的游戏都会拥有独一无二的AppId。不过为了方便开发者测试,steam提供了游…

Spring Boot 监控:AOP vs Filter vs Java Agent

01前言 在 高并发 微服务 中, 传统 手动埋点(System.currentTimeMillis())就像用体温计量火箭速度——代码侵入、重复劳动、维护爆炸。 下文是无侵入、高精度、全链路 监控 API 耗时,全程不碰业务代码的方案! 02实战&…

基于Android的电子记账本系统

博主介绍:java高级开发,从事互联网行业多年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的毕业设计程序开发,开发过上千套毕业设计程序,没有什么华丽的语言&#xff0…

7月17日日记

结束了数学建模之后的这两天一直在紧张的复习,但是说实话效率有点低,因为可能觉得自己找到了两个小时速成课,觉得无所谓了,所以有点放松了。在宿舍杰哥和林雨城却一直在复习,感觉他们的微积分和线性代数复习的都比我好…

Linux下SPI设备驱动开发

一.SPI协议介绍1.硬件连接介绍引脚含义:DO(MOSI):Master Output, Slave Input,SPI主控用来发出数据,SPI从设备用来接收数据。DI(MISO):Master Input, Slave Output,SPI主控用来发出数据,SPI从设…

用Dify构建气象智能体:从0到1搭建AI工作流实战指南

作为一名Agent产品经理,我最近在负责气象智能体的建设项目。传统气象服务面临三大痛点:数据孤岛严重(气象局API、卫星云图、地面观测站等多源数据格式不一)、响应链路长(从数据采集到预警发布需人工介入多个环节)、交互体验单一(用户只能被动接收标准化预警,无法个性化…

Android NDK ffmpeg 音视频开发实战

文章目录接入FFmpeg1.下载FFmpeg 源码2.编译FFmpeg.so库异常处理3.自定义FFmpeg交互so库创建4.配置CMakeLists.txt5.CMakeLists.txt 环境配置6.Native与Java层调用解码器准备接入FFmpeg 1.下载FFmpeg 源码 FFmpeg官网地址 2.编译FFmpeg.so库 移动 FFmpeg 源码文件夹至 Andr…

使用 go-redis-entraid 实现 Entra ID 无密钥认证

1、依赖与安装 步骤命令说明安装(或升级) go-redis v9.9go get github.com/redis/go-redis/v9latestentraid 必须 ≥ 9.9.0安装 go-redis-entraidgo get github.com/redis/go-redis-entraid自动拉取 transit 依赖 2、认证方式一览 方式说明创建 Stream…

window上docker安装RabbitMQ

1、要进http://localhost:15672管理页面需要安装management版本2、搜索镜像并pull3、启动镜像时将端口映射出来4、启动成功,点击可查看日志详情,浏览器访问5、直接使用guest/guest登录会报错User can only log in via localhost解决办法有两个&#xff1…

异世界历险之数据结构世界(排序(插入,希尔,堆排))

前言 介绍 插入排序 基本知识: 直接插入排序是一种简单的插入排序法,其基本思想是: 把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 直接插入…

oracle 数据库中,将几张表的数据按指定日期范围实时同步至同一个数据库的备份表中。

以下是一个Oracle数据库中实现表数据按指定日期范围实时同步至备份表的解决方案。这个方案使用存储过程和触发器组合实现: 1. 创建备份表结构 首先需要为每张需要备份的表创建对应的备份表,结构与原表相同: -- 为原表创建备份表(示…

电脑网络连接正常,微信、QQ能正常使用,但无法访问网页?DNS问题的解决方案和背后原理。

文章目录1. 问题背景2. 解决方案2.1 手动刷新DNS2.1.1 Windows版本2.1.2 Mac版本2.2 手动设置DNS服务器2.2.1 Windows版2.2.2 Mac版2.3 其他解决方案3. DNS是什么?3.1 详细解释DNS3.1.1 A distributed, hierarchical database(一个分布式和分层数据库结构…

【HTML】图片比例和外部div比例不一致,最大程度占满

图片比例和外部div比例不一致&#xff0c;最大程度占满&#xff0c;并且图片比例不变 其中1.jpg,2.jpg,1.html在同一目录 |-----|- 1.jpg|- 2.jpg|- 1.html1.jpg2.jpg<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /&g…

如何使用python网络爬虫批量获取公共资源数据技术

如何快速批量地获取海量公共资源数据决定了科研的效率。Python网络爬虫是快速批量获取网络数据的重要手段&#xff0c;它按照发送请求、获得页面、解析页面、下载内容、储存内容等流程&#xff1f; 一&#xff1a;Python软件的安装及入门1 Python软件安装及入门1)Anaconda软件安…

Kiro vs Cursor: AI IDE 终极对比指南

概述 随着生成式 AI 革命性地改变了我们编写代码的方式&#xff0c;新一代 AI 驱动的集成开发环境 (IDE) 正在崛起。Kiro 和 Cursor 代表了这一运动的前沿&#xff0c;但它们采用了截然不同的方法。 核心理念对比 特性AWS KiroCursor核心理念结构化开发流程 (Spec-driven)对…

Python获取网页乱码问题终极解决方案 | Python爬虫编码处理指南

在Python网络爬虫开发中&#xff0c;乱码是最常见的问题之一。本文将深入探讨乱码产生的原因&#xff0c;并提供多种有效的解决方案&#xff0c;帮助您彻底解决Python获取网页内容时的乱码问题。常见网页编码格式编码类型使用场景Python解码方式UTF-8现代网站标准编码.decode(u…

Android MTK平台预置多张静态壁纸

执行 adb shell pm list package -f wallpaper 命令&#xff0c;查看壁纸应用路径&#xff1a; /product/app/MtkWallpaperPicker/MtkWallpaperPicker.apkcom.android.wallpaperpicker 结果中带 Mtk 就可确定MTK有对应用进行重构。其源码路径在 vendor/mediatek/proprietary/…

基于Django的个人博客系统开发(开题报告)

毕业论文(设计)开题报告论文(设计)题目 基于Django的个人博客系统开发 1.选题目的和意义 随着云服务器的普及化以及编程培训机构大量涌现,学习网站开发技术以及编程技术,通过租用个人云服务器部署代码,构建个人博客网站,创建学习文档,记录学习过程,与他人交流技术学…

C++ 分配内存释放内存

C 分配内存释放内存一、new、delete、malloc和free最简单的分配内存自定义对象分配和释放内存二、new、delete与虚析构的问题三、一维、二维、多维数值创建和释放一维二维多维四、new的缺点以及连续内存的优点一、new、delete、malloc和free 最简单的分配内存 int* p_m (int*…