day46/60

@浙大疏锦行

DAY 46 通道注意力(SE注意力)

知识点回顾:

  1. 不同CNN层的特征图:不同通道的特征图
  2. 什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道。
  3. 通道注意力:模型的定义和插入的位置
  4. 通道注意力后的特征图和热力图

内容参考

作业:

  1. 今日代码较多,理解逻辑即可
  2. 对比不同卷积层特征图可视化的结果(可选)

ps:

  • 我这里列出来的是通道注意力中的一种,SE注意力
  • 为了保证收敛方便对比性能,今日代码训练轮数较多,比较耗时
  • 目前我们终于接触到了模块,模块本质上也是对特征的进一步提取,整个深度学习就是在围绕特征提取展开的,后面会是越来越复杂的特征提取和组合步骤
  • 新增八股部分,在本讲义目录中可以看到----用问答的形式记录知识点

今天的内容被拆开到2天完成,不然任务量有点大,热图顺移到明天


我将用生活中常见的 **“图书馆检索”“动物特长分工”** 等场景,把这些深度学习概念转化为直观易懂的内容,并通过比喻加深理解。

一、知识点通俗解释 + 趣味比喻

1. 不同 CNN 层的特征图:不同通道的特征图

含义:CNN 每一层卷积后输出的特征图,可看作从不同角度提取图像的信息;而每个特征图的 “通道”,类似 RGB 图像的红、绿、蓝通道,各自捕捉不同类型的特征。浅层特征图聚焦边缘、纹理等基础元素,深层特征图则捕捉物体形状、语义等抽象信息。
比喻:把特征图想象成 “图书馆的检索卡片” ,通道就是 “不同的检索关键词” 。

 
  • 浅层网络:用 “直线”“曲线” 等关键词标记图像,比如在猫的图片里,某个通道专门找胡须的直线,另一个通道找毛发的曲线,这些卡片(特征图)记录的是零散的局部细节。
  • 深层网络:改用 “猫耳”“猫尾” 等关键词,通道们合作标注出完整的猫的轮廓。此时的卡片(特征图)更抽象,能直接关联到 “猫” 这个概念。
  • 不同通道:每个通道像一位 “专精馆员”,有的只关注线条(纹理通道),有的只找颜色(色彩通道),各自从图像里 “检索” 特定信息。
2. 什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道

含义:注意力机制是一类让模型聚焦重要信息、忽略次要信息的技术,包含多种不同类型的模块(如通道注意力、空间注意力、自注意力等),每种模块通过不同方式分配 “注意力权重”,提升模型性能。实际效果需通过实验验证。
比喻:把注意力机制比作 “动物园的动物特工队” :

 
  • 注意力家族:动物园里有不同动物(模块),老鹰擅长高空侦查(全局信息捕捉),狐狸擅长潜入寻找目标(局部细节挖掘)。模型遇到任务时,可以 “雇佣” 不同动物(选择不同模块),让它们用特长找关键信息。
  • 好不好试了才知道:就像派老鹰和狐狸同时执行任务,有时老鹰一眼锁定目标更高效,有时狐狸靠灵活走位找到线索更好用。模型训练时也需要尝试不同注意力模块,看哪种组合在特定任务(如猫狗分类)中表现最佳。
3. 通道注意力:模型的定义和插入的位置

含义:通道注意力模块通过学习每个通道的重要性,为不同通道分配权重,增强关键通道(如识别猫的 “猫耳”“猫尾” 特征通道)的信号,抑制无关通道。通常插入在卷积层之后,用于调整特征图的通道信息。
比喻:通道注意力是 “图书馆的资源调度员” :

 
  • 模型定义:调度员分析所有检索卡片(特征图的通道),给 “猫耳”“猫尾” 等关键卡片贴上 “加急处理” 标签(高权重),给记录杂线的卡片贴上 “普通” 标签(低权重),让后续流程优先处理重要信息。
  • 插入位置:调度员在图书馆的中间环节工作,当馆员们(卷积层)刚整理完检索卡片(输出特征图),调度员就立刻介入,调整卡片的优先级,再交给下一个部门(后续网络层)。
4. 通道注意力后的特征图和热力图

含义:经过通道注意力加权后,特征图中关键通道的信息被增强,次要通道被削弱;热力图则可视化通道注意力的权重分布,高亮显示模型关注的重点通道。
比喻

 
  • 特征图:类似 “重点标注版检索卡片” ,调度员处理后,“猫耳”“猫尾” 等关键卡片颜色变深、字号变大(权重提升),杂线卡片颜色变淡(权重降低),让后续流程一眼看清重点。
  • 热力图:好比 “调度员的工作记录” ,用红色高亮标注出被赋予高权重的通道(如 “猫耳” 通道),蓝色表示低权重通道,直观展示模型更关注图像的哪些信息维度。

二、核心要点总结表

知识点核心概念比喻场景关键作用
不同 CNN 层的特征图分层提取图像特征,通道聚焦不同信息图书馆检索卡片与关键词从局部到整体抽象特征提取
注意力机制多种模块聚焦重要信息动物园动物特工队提升模型对关键信息的敏感度
通道注意力加权调整特征图的通道重要性图书馆资源调度员增强关键通道,抑制次要通道
注意力后的特征图与热力图增强关键信息,可视化权重分布重点标注卡片与工作记录优化特征表达,直观展示关注点
 

通过这些比喻,复杂的深度学习概念变得像生活故事一样好理解。如果想进一步了解某部分细节,随时可以告诉我!



error:

import matplotlib.pyplot as plt
import numpy as npdef visualize_feature_maps(feature_maps, title='Feature Maps'):num_maps = feature_maps.shape[0]size = int(np.ceil(np.sqrt(num_maps)))fig, axes = plt.subplots(size, size, figsize=(10, 10))fig.suptitle(title)for idx, ax in enumerate(axes.flat):if idx < num_maps:ax.imshow(feature_maps[idx], cmap='viridis')ax.axis('off')plt.show()
import torch
# 设置模型为评估模式
model.eval()# 定义需要可视化的卷积层
layers_to_visualize = [model.conv1, model.conv2, model.conv3]  # 需根据实际模型结构调整for idx, layer in enumerate(layers_to_visualize):# 注册钩子函数获取该层的输出activation = {}  def get_activation(name):def hook(model, input, output):activation[name] = output.detach()return hooklayer.register_forward_hook(get_activation(f'layer_{idx}'))# 前向传播with torch.no_grad():_ = model(test_image.unsqueeze(0))# 获取该层的特征图feature_maps = activation[f'layer_{idx}'].squeeze(0).cpu().numpy()# 可视化特征图visualize_feature_maps(feature_maps, title=f'Feature Maps of Layer {idx+1}')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86729.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

提升创作效率:轻松调用固定素材与模板

日常工作和生活中&#xff0c;我们经常需要复制粘贴不同类型的数据&#xff0c;如文本、图片、文件等。使用剪切板管理工具可以快速访问之前复制的内容&#xff0c;而无需反复切换应用进行复制操作。 这款绿色便携版应用&#xff0c;无需安装&#xff0c;双击即开&#xff0c;…

【C++】组合模式

目录 一、模式核心概念与结构二、C 实现示例&#xff1a;文件系统三、组合模式的关键特性四、应用场景五、组合模式与其他设计模式的关系六、C 标准库中的组合模式应用七、优缺点分析八、实战案例&#xff1a;图形编辑器九、实现注意事项如果这篇文章对你有所帮助&#xff0c;渴…

C++包管理工具:conan2持续集成 (CI) 教程

1.持续集成 (CI) ​ 这是一个高级主题&#xff0c;需要具备 Conan 的基础知识。请先阅读并练习用户教程。本节面向设计和实施涉及 Conan 包的生产 CI 管道的 DevOps 和构建工程师。如果不是这种情况&#xff0c;您可以跳过本节。 持续集成 (CI) 对不同用户和组织有不同的含义…

免费SSL证书一键申请与自动续期

免费SSL证书申请与自动续期教程 本文介绍如何通过乐此加密&#xff08;www.letsencrypt.top) 实现免费SSL证书一键配置和自动续期 一、准备工作 服务器要求 Linux 系统&#xff08;推荐 Ubuntu/CentOS&#xff09;已安装 curl 和 crontab拥有 sudo 权限的用户 域名验证 确保域…

【NLP】自然语言项目设计

目录 项目简介 要求 需要考虑的问题 硬件需求和环境配置 n卡驱动配置 以cuda11.8 版本为例 下载对应的cudnn(version11) 安装GPU版本的torch 安装gpu版本的TensorFlow 检查cuda安装情况 项目简介 训练一个模型&#xff0c;实现歌词仿写生成 任务类型&#xff1a;文本…

设计模式:观察者模式 (Observer) 案例详解

目录 一、引言&#xff1a;为什么需要观察者模式&#xff1f; 二、观察者模式的核心原理 1. 角色划分 2. 类图关系 三、经典案例解析 案例1&#xff1a;天气监测系统 案例2&#xff1a;股票价格监控系统 案例3&#xff1a;MVC架构中的模型-视图分离 案例4&#xff1a;J…

CTF-Misc:开启全方位解题之旅

目录 一、CTF-Misc 入门指引二、基础技能储备2.1 文件格式识别2.2 基础工具使用 三、信息搜集技巧3.1 搜索引擎技巧3.2 网络信息挖掘 四、编码转换奥秘4.1 常见编码类型4.2 编码转换工具 五、隐写分析秘籍5.1 图片隐写5.1.1 LSB 隐写5.1.2 颜色通道与 Exif 信息5.1.3 图片修复与…

Adobe创意套件深度挖掘:效率倍增与灵感迸发的新玩法

最近在深入体验奥地利Blueskyy艺术学院的Adobe正版教育订阅&#xff0c;并研究全家桶时有不少新发现&#xff0c;忍不住想和大家分享一下。 先简单说下这个订阅的感受&#xff1a; Firefly 积分。 这应该是我用过Firefly积分最多的版本&#xff0c;1500点/周。对于我们这些创意…

左神算法之有序二维矩阵中的目标值查找

有序二维矩阵中的目标值查找 目录 有序二维矩阵中的目标值查找1. 题目描述2. 问题解释3. 解决思路方法一&#xff1a;逐行二分查找&#xff08;适合行数较少的情况&#xff09;方法二&#xff1a;利用行列有序特性&#xff08;最优解&#xff09; 4. 代码实现5. 总结 1. 题目描…

深入理解AVL树及其旋转操作

AVL树的概念 二叉搜索树虽可以缩短查找的效率&#xff0c;但如果数据有序或接近有序二叉搜索树将退化为单枝树&#xff0c;查找元素相当于在顺序表中搜索元素&#xff0c;效率低下。因此&#xff0c;两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种方法…

URL带有中文会引入哪些问题

处理含中文字符的 URL 1 为什么会出现“乱码”或崩溃&#xff1f; URL 标准&#xff08;RFC 3986&#xff09;规定&#xff1a;除少数保留字符外&#xff0c;URL 只能包含 ASCII。中文属于 Unicode&#xff0c;因此必须先转换。如果直接把 https://example.com/路径/ 这样的字…

结构体字段能否单独加 mut

你问的这个问题在 Rust 里很常见&#xff1a; 一、结构体字段能否单独加 mut 1. 结构体字段能否单独加 mut&#xff1f; 不能。Rust 中&#xff0c;mut 是用来修饰变量绑定的&#xff0c;可变性是绑定的属性&#xff0c;而不是结构体字段本身的属性。 你不能写&#xff1a; …

scGPT-spatial 复现

文章目录 ✅ 总体流程总览&#xff08;从 H5AD 到模型训练&#xff09;&#x1f527; 步骤 1&#xff1a;读取 H5AD 文件并做基础预处理&#x1f9f1; 步骤 2&#xff1a;构造训练样本输入&#xff08;token、value&#xff09;&#x1f4e6; 步骤 3&#xff1a;使用 DataColla…

运放电压跟随器为什么要加电阻

运放电压跟随器为什么要加电阻 我们常见运放的电压跟随器如下&#xff1a; 有时候会看见电路中加两个电阻&#xff1a; 作用就是保护运放&#xff0c;起限流电阻的作用。 当输入电压高的时候&#xff0c;运放内部存在钳位二极管&#xff0c;此电阻就能限流。 并不是所有运放…

MinerU 2.0部署

简介 MinerU 2.0使用sglang加速&#xff0c;与之前差别较大&#xff0c;建议按照官方的Docker镜像的方式启动。 Docker镜像 Dockerfile 这是官方的Dockerfile # Use the official sglang image FROM lmsysorg/sglang:v0.4.7-cu124# install mineru latest RUN python3 -m …

黑马python(十七)

目录&#xff1a; 1.数据可视化-地图-基础案例 2.全国疫情地图 3.河南省疫情地图绘制 4.基础柱状图构建 5.基础时间线柱状图绘制 6.动态GDP柱状图绘制 1.数据可视化-地图-基础案例 图示有点对的不准&#xff0c;可以通过后面的参数 2.全国疫情地图 3.河南省疫情地图绘制…

Segment Anything in High Quality之SAM-HQ论文阅读

摘要 最近的 Segment Anything Model(SAM)在扩展分割模型规模方面取得了重大突破,具备强大的零样本能力和灵活的提示机制。尽管 SAM 在训练时使用了 11 亿个掩码,其掩码预测质量在许多情况下仍不理想,尤其是对于结构复杂的目标。我们提出了 HQ-SAM,使 SAM 能够精确地分割…

深入理解_FreeRTOS的内部实现(2)

1.事件组 事件组结构体&#xff1a; 事件组 “不关中断” 的核心逻辑 事件组操作时&#xff0c;优先选择 “关调度器” 而非 “关中断” &#xff0c;原因和实现如下&#xff1a; 关调度器&#xff08;而非关中断&#xff09; FreeRTOS 提供 taskENTER_CRITICAL()&#xff08;…

【图论题典】Swift 解 LeetCode 最小高度树:中心剥离法详解

文章目录 摘要描述题解答案题解代码分析思路来源&#xff1a;树的“中心剥离法”构造邻接表和度数组循环剥叶子终止条件 示例测试及结果时间复杂度空间复杂度总结 摘要 树是一种重要的数据结构&#xff0c;在许多应用里&#xff0c;我们希望选一个根&#xff0c;让这棵树的高度…

Docker的介绍与安装

​ Docker 对初学者的简单解释和应用场景 1.什么是 Docker&#xff1f; 简单来说&#xff0c;Docker 就像一个“装箱子”的工具&#xff0c;这个箱子叫做“容器”。 你写的程序和它运行需要的环境&#xff08;比如操作系统、软件、工具&#xff09;都装进一个箱子里。这个箱…