b-up:Enzo_Mi:深度学习基础知识

1.最近邻差值(Neareast Neighbor Interpolation)

插值算法 | 最近邻插值法_哔哩哔哩_bilibili

上图中最后一行,第一个图像,因为目标像素(放大后,位于第1行第0列的像素)距离它最近的原图的像素的像素值为1,因此该目标像素取值为1。

把原图分别进行 上采样

方式1:最近邻插值

方式2:双线性插值

肉眼观看,方式2效果更好,没有锯齿状,更平滑

虽然在上采样阶段,  使用双线性插值可以得到比最近邻差值效果更好的 图片,但是对于语义分割任务并不合适。

语义分割任务只能使用最近邻插值,因为其标注时 将目标对应像素点的值赋值为1,背景赋值为0, 边缘赋值为255, 当通过数据增强进行图片缩放时,使用最近邻插值  ,得到的新图像的语义标签中像素值只包含 0,1,255,   这个三个数值对语义分割网络训练具有意义, 其他数字没有意义。

当使用双线性插值,会导致语义标签图像中出现  如   111,126等数字,这些数字没有意义,对网络训练没有用处。

个人

疑惑:对于实例实例分割,可以使用双线性插值吗? 

语义分割网络训练时,  可能进行图像缩放这一数据增强方法,因此只能使用 最近邻差值 防止语义标签出现  非规定中的数字。 

但是对于实例实例分割,可以使用双线性插值吗? 

最近使用YOLO-SEG, 发现将最近邻插值替换为 双线性插值, 精度有些提升。

2.双线性插值(bilinear  interpolation)

插值算法 |双线性插值法_哔哩哔哩_bilibili

将源图像t0进行上采样, 使用双线性插值, 首先:需要将放大的图像(t1)等比例缩小为源图像尺寸t3。

 

缩放为源图像尺寸大小,需要进行对齐,有两种对齐方式:

1.角对齐:需要将 t3与t0的网格中心点对齐, 这种需要t1缩小的尺度更大

2.边对齐,需要将t3与t0的边对齐,这种需要t1缩小的尺度比角对齐小一些

具体可以见pytorch官网的说明

该链接的内容

注意:像素值分别为v1,v2,v3,v4

 代码示例

角对齐

边对齐

角对齐

上述两段代码。第一个自已编写, 第二个是调用函数库

注意:这里以最左上角像素点的中心点的坐标作为原点坐标(0,0),而不是边界框的角点

边对齐

使用pytorch函数

 

3.双三次插值算法(Bicubic)

双: X,Y两个方向

三次:计算目标像素点周围像素权重时,使用三次项公式计算周围权重

 

与上述两种插值方法  初始步骤相同,将放大的图像t1进行缩小,缩小为源图像t0尺度t2,然后对照源图像,计算目标像素点

上图中, 发现t2的一个像素点在t0中,刚好位于t0中四个像素点之间的中心

 

双三次插值,取周围16个像素点的值进行计算

上图:

第一行表示 一维插值

第二行:二维差值,彩色点表示原图像素点,彩色点的高低表示该像素点的像素值,黑色点表示放大图像中的像素点,其高低表示所计算的采样值。

x只能表示 X或Y一个方向的距离

因此需要计算两次权重,分别表示X,Y方向

上图:右边第一个小图,

蓝色点(目标点)与源图像素的一个红点重合, X,Y方向距离均为0, 则该源图的像素点在X或Y方向的对应的权重为1,

右边第二个小图,蓝色点(目标点)与源图像素的一个红点在X,Y距离上均为1, 则该源图的像素点在X或Y方向的对应的权重为0

因此:参考上图的曲线图

在X方向距离为0,则在X方向取得权重为1;

在X方向距离为1,则在X方向取得权重为0;

在X方向距离为2,则在X方向取得权重为0;

根据距离的不同(0.5,1.5等)分别选择权重计算公式W(x)的三个不同分段函数

 

将在X,Y方向   计算出的16个值相加得到3.5 

使用个人编写程序, 以及pytorch 程序进行验证 

4.IoU与NMS

NMS 非极大值抑制 | IoU 交并比_哔哩哔哩_bilibili 

 待看

。。。

参考资料

1.插值算法 | 最近邻插值法_哔哩哔哩_bilibili

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89629.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序商品结算功能

整体结算流程概述微信小程序的商品结算涉及前端交互、API调用和数据管理。典型流程包括:用户交互:用户选择商品、填写地址和时间。数据获取:从小程序缓存或后端服务器获取订单信息。逻辑处理:验证参数、应用红包折扣。提交订单&am…

2025年7月份最新一区算法——向光生长算法

注:该算法已按照智能优化算法APP标准格式进行整改,可直接集成到APP中,方便大家与自己的算法进行对比。(近期智能优化算法APP将会迎来超级大更新!请时刻保持关注哦!)向光生长算法(Pho…

脚手架新建Vue2/Vue3项目时,项目文件内容的区别

一. package.json vue版本号不同vue2中会多一个依赖:vue-template-compiler,作用是预编译Vue2模板为渲染函数,减少运行时开销。vue-template-compiler与vue版本要保持一致,否则会报错。eslintConfig中的extends不同 eslintConfig…

微信小程序入门实例_____从零开始 开发一个每天记账的微信小程序

在前面的微信小程序实例中我们开发了体重记录等实用小程序,今天来尝试一个和生活消费紧密相关的 ——“每日记账小程序”。它能帮你随时记录收支情况,让每一笔花费都清晰可查。下面就跟着步骤,一步步构建这个小程序。​体验一个开发者的快乐。…

2026python实战——如何利用海外代理ip爬取海外数据

家人们!随着跨境电商的发展,是不是越来越多的小伙伴们也开始搞海外的数据分析了?不过虽然我们已经整天爬虫、数据采集打交道了,但一到海外数据,还是有不少人掉进坑里。你们是不是也遇到过以下情况:花了一堆…

Spring Boot启动原理:从main方法到内嵌Tomcat的全过程

Spring Boot的启动过程是一个精心设计的自动化流程,下面我将详细阐述从main方法开始到内嵌Tomcat启动的全过程。 1. 入口:main方法 一切始于一个简单的main方法: SpringBootApplication public class MyApplication {public static void m…

小白学Python,网络爬虫篇(1)——requests库

目录 一、网络爬虫的介绍 1.网络爬虫库 2.robots.txt 规则 二、requests 库和网页源代码 1.requests 库的安装 2.网页源代码 三、获取网页资源 1.get () 函数 (1)get() 搜索信息 (2)get() 添加信息 2.返回 Response 对象…

平板可以用来办公吗?从文档处理到创意创作的全面测评

在快节奏的现代职场,一个核心疑问始终萦绕在追求效率的职场人心中:平板电脑,这个轻薄便携的设备,真的能替代笔记本电脑,成为值得信赖的办公伙伴吗? 答案并非简单的“是”或“否”,而是一个充满潜…

docker gitlab 备份 恢复 版本升级(16.1.1到18.2.0)

docker 启动 # 在线 docker pull gitlab/gitlab-ce:latest # 离线 docker save -o gitlab-ce-latest.tar gitlab/gitlab-ce:latest docker load -i gitlab-ce-latest.tardocker run --detach \--publish 8021:80 --publish 8023:22 \ --name gitlab_test \--restart always \-…

web3 区块链技术与用

#53 敲点算法题 瑞吉外卖day4 调整心态 睡眠 及精神 web3 以下是应北京大学肖臻老师《区块链技术与用》公开课的完整教学大纲,综合课程内容、技术模块及前沿扩展,分为核心章节与专题拓展两部分,引用自公开课资料及学员笔记。 &#x1f4…

Redis1:高并发与微服务中的键值存储利器

redis中存储的数据格式为键值对(Key,Value)在高并发的项目和微服务的项目会频繁的用到redisNoSQL型数据库1.初始Redis1.1认识NoSQLSQL:structure query language关系型数据库结构化:有固定格式要求(表关系,…

/字符串/

字符串 个人模板 5. 最长回文子串 93. 复原 IP 地址 43. 字符串相乘 227. 基本计算器 II

我的开发日志:随机数小程序

文章目录前言UI设计代码前言 为什么我要设计这个程序呢?因为我要用,懒得在网上下载了,于是干脆写了一个。 UI设计 UI是我凹出来的,你们要使用,直接新建一个UI.ui文件,然后把下面的东西输进去就可以了。 …

《Oracle SQL:使用 RTRIM 和 TO_CHAR 函数格式化数字并移除多余小数点》

select RTRIM(to_char(1222.11123344,fm9999990.9999),.) from dual 这条 SQL 语句主要用于对数字进行格式化处理,并移除格式化结果右侧多余的小数点。下面将详细拆解该语句的执行过程和各部分作用。语句详细拆解1. to_char(1222.11123344,fm9999990.9999)函数功能&…

「Java案例」方法重装求不同类型数的立方

利用方法重装实现不同类型数值的立方计算 立方计算方法的重载实现 编写一个程序,要求编写重载方法xxx cube(xxx value)实现对不同类型数值计算立方。 # 源文件保存为“CubeCalculator.java” public class CubeCalculator {public static void main(String[] args) {// 测试…

API 接口开发与接入实践:自动化采集淘宝商品数据

在电商数据分析、价格监控等场景中,自动化采集淘宝商品数据具有重要价值。本文将详细介绍如何通过 API 接口开发实现淘宝商品数据的自动化采集,包含完整的技术方案和代码实现。 一、淘宝 API 接入基础 1. 接入流程概述 注册淘宝账号获取 ApiKey 和 Ap…

python-pptx 的layout 布局

一、布局基础概念 在 PowerPoint 中,布局(Layout) 决定了幻灯片的占位符(如标题、内容、图片等)的排列方式。python-pptx 提供了对布局的编程控制。二、默认布局类型及索引 通过 prs.slide_layouts[index] 访问&#x…

服务器mysql数据的简单备份脚本

服务器mysql数据的简单备份脚本 一个小型项目mysql数据库数据的定时备份 通过crontab定时执行脚本: 0 1 * * * /home/yuyu/mysqlbak.sh备份文件加入时间戳,防止覆盖支持删除超过x天的备份数据文件,防止备份数据文件太多 #!/bin/bash# 配置变量 DB_HOST"127.0.…

数据分析:从数据到决策的核心逻辑与实践指南

在数据驱动决策的时代,“数据分析” 早已不是专业分析师的专属技能,而是每个职场人都需要掌握的基础能力。但很多人在面对数据时,常会陷入 “罗列数据却无结论”“指标好看却解决不了问题” 的困境。本文将基于数据分析的核心定义、关键维度和…

元宇宙与Web3.0:技术特征、关系及挑战

一、元宇宙的技术特征(2025年)1. 空间构建技术3D建模与渲染:实时渲染技术(如Unity HDRP)实现路径追踪光追,AI生成模型(NVIDIA Get3D)3秒生成3D场景。数字孪生技术:城市级…