CV目标检测中的LetterBox操作

LetterBox类比理解:想象你要把一张任意形状的照片放进一个正方形的相框里,照片不能变形拉伸,所以你先等比例缩小照片,然后在空余的地方填上灰色背景。

第1章 数学原理

当我们有一个原始图像的尺寸为 1920×1080(宽××高),并希望使用 letterbox 方法将其转换为 640×640 的正方形尺寸时,我们需要遵循以下步骤进行数学推导。目的是保持原始图像的长宽比不变,并通过填充来达到目标尺寸。

1.1 计算缩放比例

首先,我们需要计算缩放比例,以确保图像能完全适应目标尺寸中的一个维度(高度或宽度)而不会超出,同时保持其原始比例。

取两者中的最小值作为最终的缩放比例:

1.2 应用缩放比例调整图像尺寸

根据缩放比例调整图像的尺寸:

这意味着原图在保持比例的情况下被缩小到 360×640 的尺寸。

1.3 计算填充区域

由于我们的目标尺寸是 640×640,而缩放后的图像尺寸为 360×640,我们需要在上下两侧添加填充以达到目标尺寸。

因此,顶部和底部各填充 140 像素。

1.4 计算偏移量

最后计算偏移量,这里仅考虑垂直方向上的偏移(因为水平方向没有偏移):

这表示在垂直方向上,填充部分占了总高度的大约 21.875%。

总结

在这个例子中,原始图像从 1920×1080被按比例缩小到了 640×360,然后在上下两边分别添加了 140像素的填充,使得最终输出的图像尺寸为 640×640。这样既保证了图像的比例不变,又满足了模型输入所需的固定尺寸要求。

具体数值总结如下:

这个过程确保了原始图像的内容不被拉伸或压缩,同时达到了模型输入所需的标准尺寸。

第2章 工程实践

2.1 python

2.2 c++

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89051.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89051.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode 3614. Process String with Special Operations II

Leetcode 3614. Process String with Special Operations II 1. 解题思路2. 代码实现 题目链接:3614. Process String with Special Operations II 1. 解题思路 这一题思路上是一个逆推的思路。 首先,我们顺序走一轮不难得到最终我们能够获得的字符串…

.NET ExpandoObject 技术原理解析

🌟 .NET ExpandoObject 技术原理解析 引用: .NET 剖析4.0上ExpandoObject动态扩展对象原理风潇潇人渺渺快意刀山中草 #mermaid-svg-RtpHctpdchPPN1Xo {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mer…

放苹果(信息学奥赛一本通-T1192)

【题目描述】把M个同样的苹果放在N个同样的盘子里,允许有的盘子空着不放,问共有多少种不同的分法?(用K表示)5,1,1和1,5,1 是同一种分法。【输入】第一行是测试数据的数目…

(懒人救星版)CNN_Kriging_NSGA2_Topsis(多模型融合典范)深度学习+SCI热点模型+多目标+熵权法 全网首例,完全原创,早用早发SCI

全网首例,完全原创,早用早发SCI(多模型融合典范)机器学习SCI热点模型多目标熵权法(懒人救星版)BP_Kriging_NSGA2_Topsis 改进克里金工作量大:多模型融合创新性:首次结合BP神经网络和克里金多目标利用 BP神…

LeetCode热题100【第一天】

第一题 两数之和 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。 你可以按任意顺序返回…

AI Linux 运维笔记

运维基本概念 IT运维是指通过专业技术手段,确保企业的IT系统和网络持续、安全、稳定运行,保障业务的连续性。运维涵盖计算机网络、应用系统、硬件环境和服务流程的综合管理。主要分为: 系统运维、数据库运维、自动化运维、容器运维、云计算运维、信创运维…

Redis性能基准测试

基准环境 机器:AWS EC2 c4.8xlarge(同机部署 Redis Server 与 ReJSONBenchmark 工具,通过网络栈连接)测试工具:ReJSONBenchmark(Go 实现、可配置并发)模式:非管线(non-pi…

XML外部实体注入与修复方案

XML外部实体注入(XXE)是一种严重的安全漏洞,攻击者利用XML解析器处理外部实体的功能来读取服务器内部文件、执行远程请求(SSRF)、扫描内网端口或发起拒绝服务攻击。以下是详细解释和修复方案:XXE 攻击原理外…

解决高并发场景中的连接延迟:TCP 优化与队头阻塞问题剖析

你是否在高并发场景下遇到过这种情况:系统性能本来不错,但在请求量大增的时刻,连接延迟暴涨,响应时间直线飙升,甚至整个服务都变得不可用?当你打开监控时,CPU、内存、带宽都在正常范围内&#x…

Web学习笔记4

CSS概述1、CSS简介CSS,层叠样式表,是一种样式表语言,用以描述HTML的呈现内容的方式(美化网页)。CSS书写规则是:选择器{属性名:属性值}的键值对CSS有三种引入方式,分别为:…

Spring AI 初学者指南:从入门到实践与常用大模型介绍

作为 Java 开发者,当 AI 浪潮席卷而来时,如何在熟悉的 Spring 生态中快速拥抱大模型开发?Spring AI 的出现给出了答案。本文将从初学者视角出发,带你了解 Spring AI 的核心概念、使用方法,并介绍与之搭配的常用大模型&…

C#自定义控件

1。C#中控件和组件的区别: 一般组件派生于:Component类,所以从此类派生出的称之为组件。 一般用户控件派生于:Control类或UserControl类,所以从该类派生出的称之为用户控件。 他们之间的关系主要是:UserControl继承Con…

网络资产测绘工具全景解析:七大平台深度洞察

​一、资产测绘工具的核心价值​网络资产测绘(Cyber Asset Intelligence)技术通过主动扫描与被动分析:实时发现全球暴露的网络设备(服务器、摄像头、IoT设备)自动化构建资产指纹库(操作系统/服务/框架版本&…

编程语言设计目的与侧重点全解析(主流语言深度总结)

编程语言的设计本质上是对计算逻辑的形式化表达与工程约束的平衡,不同语言因目标场景、时代需求和技术哲学的差异,形成了独特的设计范式。以下从系统级、应用级、脚本/动态、函数式、并发/安全等维度,选取10种最具代表性的编程语言&#xff0…

重学前端003 --- 响应式网页设计 CSS 颜色

文章目录文档声明head颜色模型div根据在这里 Freecodecamp 实践&#xff0c;记录笔记总结。 文档声明 在文档顶部添加 DOCTYPE html 声明 <!DOCTYPE html>head title 元素为搜索引擎提供了有关页面的额外信息。 它还通过以下两种方式显示 title 元素的内容&#xff1a…

这个Pandas函数可以自动爬取Web图表

Pandas作为数据科学领域鳌头独占的利器&#xff0c;有着丰富多样的函数&#xff0c;能实现各种意想不到的功能。 作为学习者没办法一次性掌握Pandas所有的方法&#xff0c;需要慢慢积累&#xff0c;多看多练。 这次为大家介绍一个非常实用且神奇的函数-read_html()&#xff0…

vLLM与SGLang在自然语言处理领域的技术架构与性能对比研究

随着大语言模型在工业界和学术界的广泛应用&#xff0c;高效推理框架的选择成为自然语言处理领域的关键挑战。vLLM与SGLang作为当前最前沿的推理优化框架&#xff0c;分别通过创新的PagedAttention和RadixAttention机制展现了独特的技术优势。本文将系统对比两大框架的核心架构…

楼宇自动化:Modbus 在暖通空调(HVAC)中的节能控制(二)

Modbus 在 HVAC 节能控制中的应用案例案例一&#xff1a;某商业建筑 HVAC 系统节能改造某大型商业建筑&#xff0c;总建筑面积达 5 万平方米&#xff0c;涵盖了购物中心、餐饮区和娱乐场所等多种功能区域 。改造前&#xff0c;其 HVAC 系统采用传统的控制方式&#xff0c;设备之…

win10安装Elasticsearch

1 启动elasticsearch 下载地址&#xff1a;Download Elasticsearch | Elastic 双击elasticsearch.bat elasticsearch黑窗口启动乱码问题解决方案 到 config 文件下找到 jvm.options 文件 打开后 在文件末尾空白处 添加 -Dfile.encodingGBK 保存后重启即可。 启动后输入&am…

[Meetily后端框架] Whisper转录服务器 | 后端服务管理脚本

第七章&#xff1a;Whisper转录服务器 欢迎回来&#xff01; 到目前为止&#xff0c;我们已经深入探索了"meeting-minutes"项目的"大脑"——Python后端。 我们已经了解了它如何通过后端API网关接收文本转录&#xff0c;使用摘要数据结构&#xff08;Pyd…