行缓存(line buffer)在图像卷积中的工作方式

行缓存(line buffer)在图像卷积中的工作方式
上面这张图配合文字,展示了行缓存(line buffer)在图像卷积中的工作方式

  • 上半部分是一个按行扫描输入的图像块(示例为 9×9,编号 1–81)。
    蓝色表示已被写入行缓存并按队列等待的数据,绿色是当前这一步卷积所需的 3×3 邻域像素。此刻选中的 3×3 为像素 {2,3,4 / 11,12,13 / 20,21,22}。

  • 下半部分画的是行缓存结构:三条“行 FIFO”(对应 3×3 卷积核的三行)。AXI4-Stream 按顺序把新像素从右侧送入(虚线箭头,正在进入的是 23、24、25),缓存里的数据整体向左“移位”。
    当某个像素被移到最左上角位置时,它已经“过窗”,会从缓存中丢弃(删除)。

  • 对应当前位置,行缓存能同时读出 9 个像素(绿色块),与 3×3 卷积核的 9 个系数并行相乘,再经过加法树求和,得到新的输出像素(图中标成 N2)。只要行缓存支持9路并发读(通过多端口/分区/多BRAM实现),9 次乘法就能完全并行。

  • 当需要并行进行多路卷积(例如多个卷积核/输出通道)时,行缓存的容量与分区必须相应调整或复制,以提供足够的并发访问端口,避免端口冲突。

一句话:图示的是一个随输入像素流滚动的三行缓存,它不断滑动3×3窗口,支持九值并行乘加,从而高效地产生连续的卷积输出。

像素 {2,3,4 / 11,12,13 / 20,21,22}被选中的原因:
行缓存在做的是“滑动 3×3 窗口”。

  • 像素按行顺序 1、2、3、… 进入缓存,3×3 卷积需要同时读出 三行 × 三列 的 9 个像素。
  • 这时缓存中三行的数据分别是(从左往右):
    第1行:2…10;第2行:11…19;第3行:20…25(新像素从右侧持续进入,整行一起向左移)。三行在列方向上是对齐的。
  • 硬件把每行最左边的三个位置作为当前卷积窗口的三列,于是得到:
    上:2、3、4;中:11、12、13;下:20、21、22 —— 这就是图中标绿的 3×3。
  • 这个 3×3 的中心是 12,对应输出像素 N2(第一行的第 2 个输出)。
    之后每到一个新像素(例如 26),窗口整体右移一列,读到的 3×3 会变成 {3,4,5 / 12,13,14 / 21,22,23},输出 N3,以此类推。

所以,从 2–25 中选出的就是在当前时刻位于三行“头部”的 3×3 对齐像素

Reference:
F. Kästner, B. Janßen, F. Kautz, M. Hübner and G. Corradi, “Hardware/Software Codesign for Convolutional Neural Networks Exploiting Dynamic Partial Reconfiguration on PYNQ,” 2018 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), Vancouver, BC, Canada, 2018, pp. 154-161, doi: 10.1109/IPDPSW.2018.00031.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/94293.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/94293.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据分享】中国371个城市的坡度矢量数据和excel数据

今天要说明数据就是中国371个城市的坡度矢量数据和excel数据。数据介绍在城市发展的进程中,地形地貌始终是影响规划决策的关键因素,而坡度作为表征地表倾斜程度的核心指标,更是贯穿于城市建设、生态保护等诸多环节。本文将全面解读中国 371 个…

《WINDOWS 环境下32位汇编语言程序设计》第7章 图形操作(1)

图形设备接口GDI(Graphics Device Interface)是Win32的一个重要组成部分,其作用是允许Windows的应用程序将图形输出到计算机屏幕、打印机或其他输出设备上。GDI实际上是一个函数库,包括直线、画图和字体处理等数百个函数。7.1 GDI…

数据结构-HashMap

在 Java 键值对(Key-Value)集合中,HashMap 是使用频率最高的实现类之一,凭借高效的查找、插入性能,成为日常开发的 “利器”。本文将从 HashMap 的底层原理、核心特点、常用方法到遍历方式、使用注意事项,进…

[系统架构设计师]安全架构设计理论与实践(十八)

[系统架构设计师]安全架构设计理论与实践(十八) 一.信息安全面临的威胁 1.信息系统安全威胁的来源 物理环境,通信链路,网络系统,操作系统,应用系统,管理系统 2.网络与信息安全风险类别 风险类别…

AI适老服务暖人心:AI适老机顶盒破数字鸿沟、毫米波雷达护独居安全,银发生活新保障

银发经济领域长期受限于 “专业照护资源稀缺”“老年人数字适应能力弱”“独居老人安全隐患多” 的困境,而 AI 技术的适老化改造,正让银发服务从 “被动保障” 转向 “主动关怀”,既能帮老年人跨越数字鸿沟,又能为独居老人筑起安全…

Linux应用软件编程---网络编程1(目的、网络协议、网络配置、UDP编程流程)

Linux下的网络编程一、目的不同主机,进程间通信。二、解决的问题1. 主机与主机之间物理层面必须互联互通。 2. 进程与进程在软件层面必须互联互通。物理层面的互联互通流程图如下:其中:IP地址:计算机的软件地址,用来标…

常见开源协议详解:哪些行为被允许?哪些被限制?

常见开源协议详解:哪些行为被允许?哪些被限制? 开源世界的魅力在于共享与合作,但不同的开源协议对分发、修改、再发布以及宣传/推广有不同的要求和限制。很多开发者在 fork 项目、改 README、放到自己仓库并在自媒体传播 时&…

服务器硬盘进行分区和挂载

查看服务器上的硬盘:lsblk -d -o NAME,SIZE,MODEL可以看到我的硬盘是除了vda系统盘以外,还有个vdb。我们查看一下分区:lsblk可以看到:vdb 1T disk (底下没有分区,也没有挂载)我们想要用起来这…

【C初阶】数据在内存中的存储

目录 1. 整数在内存中的存储 2. 大小端字节序 2.1 什么是大小端? 2.2 为什么有大小端? 2.3 练习 2.3.1 练习1 2.3.2 练习2 2.3.3 练习3 2.3.4 练习4 2.3.5 练习5 2.3.6 练习6 3. 浮点数在内存中的存储 3.1 浮点数存储的过程 3.2 浮点数的取…

AI 自动化编程 trae 体验2 帮我分析一个项目

总结: 接手一个项目可以让trae 帮忙分析 上次讲到trae在处理组件引入的时候,经常会碰到版本问题,分析引入了互联网上非本版本或者有bug的代码。主要依赖互联网的资源库。 但是分析一个项目应该是没问题。 这次表现非常好,接手一个…

VMware虚拟机中CentOS 7 报错 ping: www.xxx.com: Name or service not known

1:主要原因是网络配置的问题 2:其实就是下面三张图片中的,物理机虚拟网卡 vmware8 和虚拟机网络编辑器,如果设置静态IP 就是这三个地方的问题最简单的解决办法第一步:还原虚拟机网络点击确认后 ** 第二步给自己的虚拟机设置网络连接方式 选择NAT模式连接…

Java面试-自动装箱与拆箱机制解析

👋 欢迎阅读《Java面试200问》系列博客! 🚀大家好,我是Jinkxs,一名热爱Java、深耕技术一线的开发者。在准备和参与了数十场Java面试后,我深知面试不仅是对知识的考察,更是对理解深度与表达能力的…

《VMware 安装 CentOS 7.9 虚拟机详细教程(含图解步骤)》

目录1.安装前准备1.1 准备VMware软件1.1.1 方式一1.1.2 方式二1.2 准备centos7.9镜像1.2.1 方式一1.2.2 方式二2.安装centos7.91.安装前准备 1.1 准备VMware软件 VMware需要的激活码百度直接搜索vmware workstation17激活码就可以搜索到 1.1.1 方式一 这种方式需要注册官网的…

新能源知识库(84)什么是IEC白皮书

IEC白皮书是由国际电工委员会(IEC)发布的战略性技术文件,旨在针对新兴技术和社会发展趋势,提出标准化需求和发展路径,为全球产业提供前瞻性指导。在新能源领域,IEC白皮书是推动技术创新、产业协同和国际规则…

从零开始学习JavaWeb-15

​​一、数据库安全与防注入实战​​1. ​​SQL 注入原理与危害​​​​攻击本质​​:利用输入漏洞篡改 SQL 语义,例如:SELECT * FROM users WHERE username admin OR 11 -- AND password xxxOR 11导致条件永真,绕过密码验证。​…

深入理解深度学习中的“Batch”

文章目录 **一、什么是Batch?为什么需要它?** **二、Batch Size(批次大小)的影响** **三、Batch, Epoch 和 Iteration 的关系** **四、案例分析** 在深度学习领域,“Batch”(批次)是一个核心且至关重要的概念。它指的是在模型训练过程中,一次性输入给神经网络进行处理的…

27.语言模型

语言模型,是NLP方向一直主力研究的,通过训练机器,来让机器学习人类语言的内在规律,理解自然语言,并将其转换为计算机语言。 目前的主流语言模型,如GPT、Deepseek等,并不是简单的搜索背诵。他们的…

小智ai+mcp+n8n的智能组合

小智aimcpn8n的智能组合1 小智ai的版本2 n8n的配置3 mcp的demo4 工作流json​ 之前有写过小智ai的介绍,它提供了流畅且丰富的用户语音交互能力。n8n提供了灵活且稳定的后台工作流的能力,如果这两个工具进行组合,可以打造一个好玩又好用的智能…

【DataGrip】连接达梦数据库后,能查询数据但是看不到表的几种情况分析,达梦数据库驱动包下载DmJdbcDriver18.jar

大概分为以下两类情况,配置问题和驱动包的问题 DmJdbcDriver18.jar点击下载 1.配置了表不可见 左上角点击过滤的图标,把table勾上就可以 2.Introspect using JDBC metadata 未勾选 1)老版本的DataGrip 在options选项下 3)新版…

全面解析 `strncasecmp` 字符串比较函数

1) 函数的概念与用途 strncasecmp 是 C 语言中一个非常实用的字符串处理函数,它执行不区分大小写的字符串比较,但只比较前 n 个字符。这个函数的名字来源于"string n case-compare"(字符串前n个字符不区分大小写比较)。…