角度回归——八参数检测四边形Gliding Vertex

文章目录

  • 一、介绍
    • (一)五参数检测方法( 基于角度)
    • (二)八参数检测方法(point-based)的边界
  • 二、方案分析
    • (一)问题定义
    • (二)方案
    • (三)Gliding Vertex方案的问题
  • 参考

一、介绍

遥感目标检测Gliding Vertex 是四边形检测器,而且都考虑到了顺序标签点(sequential label points)的问题。我们先给出这两篇文章的链接:

  • https://arxiv.org/abs/1911.09358

(一)五参数检测方法( 基于角度)

在当前常用的旋转检测框的角度定义下,由于存在旋转角度的边界问题,会产生不必要的损失!
在这里插入图片描述

(二)八参数检测方法(point-based)的边界

如果是蓝框是anchor,红框是ground-truth,那么通过点的排序之后,实际和理想的回归方式是一样的(按照回归的距离定义)
在这里插入图片描述

二、方案分析

(一)问题定义

首先我们要了解一下为什么在做四边形检测前要对四个角点进行排序。举一个简单的例子,如果一个四边形的ground-truth是(x1,y1,x2,y2,x3,y3,x4,y4)并且所有的ground-truth并不是按一定规则顺序标注的,那么检测器有可能给出的预测结果是(x2,y2,x3,y3,x4,y4,x1,y1)。其实这两个是框是完全重合的,但是网络训练算损失的时候并不知道,它会按对应位置计算损失,此时的损失值并不为0甚至很大。

(二)方案

基于上述问题:
1. Gliding Vertex的Head设计
Gliding Vertex文章通过改变框的表示方式避免了排序的麻烦。 先检测水平框,这个是没有序列问题的,然后学习水平框四个角点的偏移量来达到四边形检测的目的,其实这里的(偏移量,对应的水平框的点)配对就有排序的意思了。

原文是这样写的:By limiting the offset on the corresponding side of horizontal bounding box, we may facilitate offset learning and also avoid the confusion for sequential label points in directly regressing the four vertices of oriented objects

在这里插入图片描述

Gliding Vertex通过水平框滑动偏移的方式预测旋转框,避免了直接回归无序角点的问题。其head结构包含以下输出分支:

  • 分类分支(Cls Score):预测目标类别。
  • 水平框回归分支:回归水平外接矩形 ( c e n t e r x , c e n t e r y , w , h ) (center_x, center_y, w, h) (centerx,centery,w,h)
  • 偏移比例分支(Alpha):预测四个角点相对于水平框对应顶点的偏移比例 ( α 1 , α 2 , α 3 , α 4 ) (\alpha_1, \alpha_2, \alpha_3, \alpha_4) (α1,α2,α3,α4),通过 s i = α i ⋅ w s_i = \alpha_i \cdot w si=αiw计算实际偏移量。
  • 倾斜因子(Obliquity Factor):定义为旋转框面积与水平框面积的比值 r = ∣ O ∣ ∣ B h ∣ r = \frac{|O|}{|B_h|} r=BhO,用于区分近水平目标( r ≈ 1 r \approx 1 r1时退化为水平框)和倾斜目标。

关键点顺序控制
通过固定水平框的顶点顺序(左上→右上→右下→左下),间接约束偏移量的对应关系,避免了角点排序问题。

(三)Gliding Vertex方案的问题

Gliding Vertex 预测水平框时存在问题,因此提出 obliquity factor的预测值,来控制当前所要预测目标是否可以直接采用(x,y,w,h)。
在这里插入图片描述

参考

https://zhuanlan.zhihu.com/p/108185873

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/906572.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙系统电脑:开启智能办公新时代

鸿蒙系统电脑:开启智能办公新时代 引言 2025 年 5 月 8 日,华为正式推出了鸿蒙系统电脑,这款具有里程碑意义的产品,不仅彰显了华为在智能设备领域的创新实力,也为用户带来了全新的智能办公体验。在数字化转型加速的背…

计量单片机 RN8302:特性、使用与应用

在现代电力监测与能源管理领域,精确的电能计量至关重要。计量单片机 RN8302 作为一款高性能的电能计量芯片,凭借其卓越的特性与功能,在众多应用场景中发挥着关键作用。本文将全面深入地介绍 RN8302 的各项特性、使用方法、注意事项以及广泛的…

Flink 的窗口机制

&#x1fa9f; 1. 基于时间驱动的滚动时间窗口&#xff08;Tumbling Time Window - Time-based&#xff09; ✅ 定义&#xff1a; 每隔固定的时间周期开启一个新的窗口。窗口之间不重叠。 &#x1f552; 示例&#xff1a; DataStream<Tuple2<String, Integer>>…

【RA-Eco-RA2L1-48PIN】ADC 电压表与OLED显示

【RA-Eco-RA2L1-48PIN】ADC 电压表与OLED显示 本文介绍了 RA-Eco-RA2L1-48PIN 开发板通过瑞萨 e2 Studio 灵活软件包&#xff08;FSP&#xff09;编程实现 ADC 串口采集电压和OLED显示电压数值的项目设计&#xff0c;包括串口电压值串口打印、硬件 IIC 通信协议配置、 OLED显示…

GraphQL在.NET 8中的全面实践指南

一、GraphQL与.NET 8概述 GraphQL是一种由Facebook开发的API查询语言&#xff0c;它提供了一种更高效、更灵活的替代REST的方案。与REST不同&#xff0c;GraphQL允许客户端精确指定需要的数据结构和字段&#xff0c;避免了"过度获取"或"不足获取"的问题。…

Elasticsearch 写入性能优化有哪些常见手段?

Elasticsearch 写入性能优化常见手段主要有以下 10 个方向&#xff0c;建议根据具体业务场景组合使用&#xff1a; 批量写入优化 使用_bulk API 批量提交文档建议每批次 5-15MB 数据量并发执行多个批量请求 索引配置调优 PUT /my_index {"settings": {"inde…

【图像大模型】基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析

基于深度对抗网络的图像超分辨率重建技术ESRGAN深度解析 一、技术背景与核心创新1.1 图像超分辨率技术演进1.2 核心技术创新对比 二、算法原理深度解析2.1 网络架构设计2.1.1 RRDB模块结构 2.2 损失函数设计2.2.1 对抗损失&#xff08;Adversarial Loss&#xff09;2.2.2 感知损…

第八天 搭建车辆状态监控平台(Docker+Kubernetes) OTA升级服务开发(差分升级、回滚机制)

前言 在智能网联汽车快速发展的今天&#xff0c;车辆状态监控和OTA&#xff08;Over-The-Air&#xff09;升级已成为智能汽车的核心能力。本文将手把手带你从零开始搭建基于云原生技术的车辆状态监控平台&#xff0c;并开发完整的OTA升级服务系统。无论你是刚接触容器技术的开…

五分钟学会如何封装Jsckson工具类

前言&#xff1a;在 Java 开发中&#xff0c;JSON 是一种非常常见的数据格式&#xff0c;而 Jackson 是处理 JSON 的主流库之一&#xff0c;为了提高代码的复用性、可维护性&#xff0c;我们通常会将 Jackson 的操作封装成一个工具类&#xff0c;简化使用。 ✨✨✨这里是秋刀鱼…

InternLM 论文分类微调实践(XTuner 版)

1.环境安装 我创建开发机选择镜像为Cuda12.2-conda&#xff0c;选择GPU为100%A100的资源配置 Conda 管理环境 conda create -n xtuner_101 python3.10 -y conda activate xtuner_101 pip install torch2.4.0cu121 torchvision torchaudio --extra-index-url https://downloa…

软考中级软件设计师——设计模式篇

一、设计模式核心分类 设计模式分为 3 大类&#xff0c;共 23 种模式&#xff08;考试常考约 10-15 种&#xff09;&#xff1a; 分类核心模式考试重点创建型模式工厂方法、抽象工厂、单例、生成器、原型单例模式的实现&#xff08;懒汉、饿汉&#xff09;、工厂模式的应用场…

小米2025年校招笔试真题手撕(一)

一、题目 小A每天都要吃a,b两种面包各一个。而他有n个不同的面包机&#xff0c;不同面包机制作面包的时间各不相同。第i台面包机制作a面包 需要花费ai的时间&#xff0c;制作b面包则需要花费bi的时间。 为能尽快吃到这两种面包&#xff0c;小A可以选择两个不同的面包机x&…

【微信小程序 + 高德地图API 】键入关键字搜索地址,获取经纬度等

前言 又到熟悉的前言&#xff0c;接到个需求&#xff0c;要引入高德地图api&#xff0c;我就记录一下&#xff0c;要是有帮助记得点赞、收藏、关注&#x1f601;。 后续有时间会慢慢完善一些文章&#xff1a;&#xff08;画饼时间&#xff09; map组件自定义气泡、mark标记点…

uni-app(2):页面

1 页面简介 uni-app项目中&#xff0c;一个页面就是一个符合Vue SFC规范的 vue 文件。 在 uni-app js 引擎版中&#xff0c;后缀名是.vue文件或.nvue文件。 这些页面均全平台支持&#xff0c;差异在于当 uni-app 发行到App平台时&#xff0c;.vue文件会使用webview进行渲染&…

Axure实战:智慧水务管理系统原型设计速览

本原型通过Axure构建覆盖生产到服务的全流程交互模型&#xff0c;聚焦"数据驱动智能决策"核心价值&#xff0c;助力水务企业实现管理效率提升与运营成本优化。 系统采用"13N"架构&#xff1a; 1个统一入口&#xff1a;集成单点登录与角色动态权限&#xff…

十二、Linux实现截屏小工具

系列文章目录 本系列文章记录在Linux操作系统下&#xff0c;如何在不依赖QT、GTK等开源GUI库的情况下&#xff0c;基于x11窗口系统&#xff08;xlib&#xff09;图形界面应用程序开发。之所以使用x11进行窗口开发&#xff0c;是在开发一个基于duilib跨平台的界面库项目&#x…

蓝桥杯分享经验

系列文章目录 提示&#xff1a;小白先看系列 第一章 蓝桥杯的钱白给吗 文章目录 系列文章目录前言一、自我介绍二、经验讲解:1.基础知识2.进阶知识3.个人观点 三、总结四、后续 前言 第十六届蓝桥杯已经省赛已经结束了&#xff0c;相信很多小伙伴也已经得到自己的成绩了。接下…

XC3588H搭载国产麒麟系统可用于政务/社保一体机吗?

答案是肯定的。 向成电子XC3588H搭载的国产银河麒麟系统和国产星光麒麟系统已完成适配&#xff0c;适用于政务服务、社保服务一体机的所有外设&#xff0c;运行稳定流畅。 在数字化政务快速发展的今天&#xff0c;政务服务终端的稳定性、安全性与高效性成为提升群众办事体验的关…

如何排查服务器 CPU 温度过高的问题并解决?

服务器CPU温度过高是一个常见的问题&#xff0c;可能导致服务器性能下降、系统稳定性问题甚至硬件损坏。有效排查和解决服务器CPU温度过高的问题对于确保服务器正常运行和延长硬件寿命至关重要。本文将介绍如何排查服务器CPU温度过高的问题&#xff0c;并提供解决方法&#xff…

物联网、云计算技术加持,助推楼宇自控系统实现智能高效管理

在建筑智能化发展的进程中&#xff0c;楼宇自控系统作为实现建筑高效管理的核心载体&#xff0c;正面临着数据海量复杂、设备协同困难、管理响应迟缓等挑战。而物联网与云计算技术的深度融合&#xff0c;为楼宇自控系统的升级提供了全新的解决方案&#xff0c;赋予其智能感知、…