面向恶劣条件的道路交通目标检测----大创自用(当然你也可以在里面学到很多东西)

全部内容梳理

目标检测的两个任务:

预测标签 边界框

语义分割 实力分割

一个是类别 一个是实例级别

分类任务把每个图像当作一张图片看待 所有解决方法是先生成候选区域 再进行分类

置信度:

包括对类别和边界框预测的自信程度

输出分类和IOU分数的乘积

双阶段代表R-CNN FAST R-CNN

分类 阈值判断

回归 拟合最优

锚定框是可能的候选区域

具体的

是否包含物体

判断类别

微调边界框

coco格式 json文件

YOLO格式 类别 x,y,w,h

验证集:用于验证模型效果的数据,评价模型学的好不好,选择超参数。

直接通过测试集进行检测,那么模型是以测试集为目标去优化,相当于作弊

交叉验证---为了规避掉验证集选择的bias(如验证集上的都是同一类别)

mAP:对每个类别计算AP,取所有类别AP计算平均mAP

对于每个类别,基于预测结果和真实标签,计算出一个precision-recall曲线

对于每个类别的precision-recall曲线,计算出该曲线下的面积,即AP
计算所有类别的AP的平均值。

正样本

类别 边界框损失

负样本

类别

softmax单一预测

sigmoid多预测

检测任务是遍历的分类任务

常见的优化器

Loss(w,b)容易陷入局部最优

SGD也叫mini-batch,之后的优化算法,一定是建立在SGD之上,容易震荡

模拟退火,通过随机扰动避免了局部最优

AdaGrad自适应调整学习率,缺点:学习率会一直减小,最终可能变得过小,导致训练提前停止

RMSProp是对AdaGrad改进,通过指数加权平均来调整历史梯度的影响,使学习率减小的更加平滑。

Momentum参数更新不仅取决于当前梯度,还取决于之前的更新的累计动量

Adam结合了MomentumRMSProp的优点,通过自适应学习率和动量加速收敛

主干网络

颈部:对于主干网络提取的特征信息做进一步融合,增加了鲁棒性和特征的表达能力,对多尺度目标检测和小目标检测有着重要作用

头部:卷积层或FC层进行分类和定位

anchor free

对每个像素点预测类别和边界框

每个位置预测一个框 重叠位置可能无法检测

anchor box

复杂度高

不灵活

正样本

正样本指预测框和真实框IOU大于设定阈值

负样本指预测框和真实框IOU小于设定阈值

失衡的后果:

负样本过多会淹没正样本 关注负样本

模型倾向于负样本预测 漏检正样本

最后一层换成了SPPF

模型版本

准确率

Accuracy

召回率(Recall

F1

F1 Score

每秒浮点运算次数(GFLOPs

平均精度均值(mAP

未改进版本

82.3%

78.5%

80.1%

5.6

0.468

改进点一

83.6%

82.5%

82.8%

5.7

0.479

改进点二

83.4%

81.7%

80.3%

5.6

0.468

改进点一+改进点二

85.1%

83.7%

84.1%

5.7

0.481

对于小波卷积的替换 只需要对写好小波卷积部分 然后在各个结构中进行替换

同理

标注使用LABELME YOLO格式

使用的主干网络RESNET101 使用了预训练权重

批次大小设置为24 训练轮次100 优化器为 Adam 优化器,初始学习率为0.01

召回率关注的是在所有实际为正的样本中,模型能够正确预测出多少,即模型预测正类的完整性

精确率关注的是模型预测为正的样本中有多少是 真正的正样本,即模型预测正类的准确性

map是0.5--0.95的平均map 

0.75更能反映小目标

小波变换 正交基 没有冗余信息

小波变换用于替代短时傅里叶变换 把无限长的基替换为有限长的衰减小波基

短时傅里叶处理不平稳的信号 小波变换克服了短时傅里叶的窗口不变性

小波变换卷积通过小波变换分解为不同的频率分量 关注不同的频率

进行小核卷积 进行上采样 小波基函数类似卷积核

低频对应全局 高频对应局部 通过对低频高频分别处理 更好的进行多尺度表达

小波变换卷积通过低频逐渐向高频过渡 从而实现大尺度物体向小尺度的转变 低频的信息具有全局特征 弥补了CNN局部提取的缺陷 高频特征更好的捕捉了边缘纹理等 强化了形状的识别

绝大部分噪音都是图像的高频分量,通过低通滤波器来滤除高频;  边缘也是图像的高频分量,可以通过添加高频分量来增强原始图像的边缘;

学生网络接收到的标签

一种是教师网络的输出, 一种是真实的标签。

硬标签 独热编码 软标签 概率分布

蒸馏温度 温度越高越平滑 越可以容忍学生的过失

concat 维度增加 自适应学习

add 信息量增加 残差连接

卷积如何在计算机中并行计算 转化为特征向量

深度可分离卷积 空洞卷积 扩大感受野

车道线检测

线提议单元 为了学习全局特征 类似于猫框

正标签选择 小于一个阈值 但一个车道线可以有多个提议

负标签选择 与所有车道线都大于阈值

首先是距离判断正负标签 其次看分类的分数

像目标检测一样 只有正标签 才有回归损失

回归损失 平滑L1损失 避免了过度惩罚小误差

车道线具有高级语义 也需要低级语义进行定位

高级语义检测车道线 低级语义定位

RIO聚合上下文

车到先验

背景前景概率 长度 角度和起点 N个偏移量

线IOU把车道线作为一个

在检测过程中 

计算焦点损失 类别

相似度损失 距离远近

训练时

类别损失 回归损失 LIOU损失

Lseg辅助分割损失 更好的定位

Laneiou考虑了车道角度

CLRKDNE对检测头和FPN进行简化 推理速度上升60%  保持了和CLRNET相当的精度

利用教师模型 CLRNet 的中间特征层、先验嵌入和最终检测头 logits 来提升其车道检测能力 

logits是一个向量 类似软标签

起点和角度

CLRKDNET单个检测头 固定先验参数(教师传递,不可迭代)

知识蒸馏分为三个部分

注意力图蒸馏

让学生网络也能关注关键特征

先验知识嵌入和logits蒸馏

学生网络直接使用起点和角度(RIO精炼后的)L2范数进行损失比较

Logit 蒸馏:Logit 蒸馏关注检测头的最终输出

确保学生有老师的输出逻辑 参数包括长度 类别 偏移量等

目标检测

DETR对于真实值 预测值 摒弃了NMS 使用匈牙利算法进行二分图匹配 并行预测

二分图匹配考虑 匹配损失 包括类别和回归

GIOU广义交并比 考虑了重叠区域 考虑了位置信息

D-fine

对于回归任务 概率分布 细粒度分布优化

深层向浅层的知识传递

传统的logits模仿和特征模仿在检测任务下精度低下

从固定的坐标预测变成建模概率分布(残差方式)

把四个边分为了n个bin预测每个bin的概率 取最大

首先第一层预测初步边界框 初步概率分布 

边界框作为参考框 后续层对概率分布进行优化

wn通过分段可以对小的偏差更精细调整

DEIM

解决DETR中稀疏监督的问题

增加额外的目标 提高每个图像中的正样本数量

YOLO的每个目标和多个猫框相关联 提供了密集监督

对小目标 密集监督更加重要

增加每张训练样本中的额外目标数量

提供监督

保留了020的匹配机制 避免了NMS 防止推理速度变慢

老师提问:

写的是中文还是英文

核心还是SCI

核心的发表时间会更长

改进点是什么

正常回答

前期成果
对deim进行了改进
学术论文初稿写好
参数不要动了

课题哪里来的

α:
师兄中科院二区论文和毕业论文的课题上延伸

α:
雨雪条件到恶劣条件

α:
提高了场景适应性
已经进入实验室进行相关研究 有专业的老师和师兄指导

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/82236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

需求管理工具使用不当,如何优化?

要优化需求管理工具的使用,需从选择合适工具、规范使用流程、加强用户培训、统一数据结构、定期审查与优化使用配置五个方面着手。其中,选择合适工具是前提。错误的工具选择往往会导致项目沟通效率低、需求追踪失效甚至造成交付物偏离客户预期。因此&…

openwrt虚拟机安装调试

分类 lienol lean immortalwrt 一、获取固件 (1)下载地址 1.官网构建下载 OpenWrt Firmware Selector 官网 OpenWrt Firmware Selector 2.第三方构建网站 ImmortalWrt Firmware Selector ImmortalWrt Firmware Selector 3.第三方构建下载 ht…

Apache OFBiz 17.12.01 的远程命令执行漏洞 -Java 反序列化 + XML-RPC 请求机制

目录 漏洞原理 🎯 一、漏洞背景(CVE-2020-9496) ⚙️ 二、攻击原理简述 🧱 三、完整攻击流程步骤详解 🔎 1. 信息收集 🛠️ 2. 工具准备 🧪 3. 构造初始 payload:下载恶意脚本…

最好用的wordpress外贸主题

产品展示独立站wordpress主题 橙色的首页大banner外贸英文wordpress主题,适合用于产品展示型的外贸网站。 https://www.jianzhanpress.com/?p8556 Machine机器wordpress模板 宽屏简洁实用的wordpress外贸建站模板,适合工业机器生产、加工、制造的外贸…

Q1:Go协程、Channel通道 被close后,读会带来什么问题?

在 Go 语言中,Channel(通道)关闭后读取的行为是一个常见但需要谨慎处理的问题。以下是详细的分析和注意事项: 1. 关闭 Channel 后读取的行为 (1) 读取已关闭的 Channel 剩余数据仍可读取: 关闭 Channel 后&#xff0…

【AI Study】第三天,Python基础 - 同NumPy类似的类库

学习计划:AI Study,学习计划源码地址:https://github.com/co-n00b/AI-Study.git 2025-05-23 在学习NumPy的过程中,除了了解NumPy之外,我们也对比看看其他类似的类库都有什么?各自的优缺点是什么&#xff1…

基于aspnet,微信小程序,mysql数据库,在线微信小程序汽车故障预约系统

详细视频:【基于aspnet,微信小程序,mysql数据库,在线微信小程序汽车故障预约系统。-哔哩哔哩】 https://b23.tv/zfqLWPV

人工智能100问☞第32问:什么是迁移学习?

目录 一、通俗解释 二、专业解析 三、权威参考 迁移学习就是让AI把在一个任务中学到的本事,拿来加速另一个任务的学习,实现“举一反三”。 一、通俗解释 想象你已经学会了打乒乓球,现在去学打网球,是不是会学得更快&#xff…

Linux之概述和安装vm虚拟机

文章目录 操作系统概述硬件和软件操作系统常见操作系统 初识LinuxLinux的诞生Linux内核Linux发行版 虚拟机介绍虚拟机 VMware WorkStation安装虚拟化软件VMware WorkStation 安装查看VM网络连接设置VM存储位置 在VMware上安装Linux(发行版CentOS7)安装包获取CentOS7 安装 Mac系…

两个mysql的maven依赖要用哪个?

背景 <dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId> </dependency>和 <dependency><groupId>com.mysql</groupId><artifactId>mysql-connector-j</artifactId> &l…

复杂项目中通过使用全局变量解决问题的思维方式

最近接手了一个公司的老系统的PHP项目&#xff0c;里面的代码比较混乱&#xff0c;排查解决了一个问题&#xff0c;决定将这个思路记录下来&#xff0c;希望能帮助更多的人。 其中一部分的代码信息如下&#xff1a; 备注&#xff1a;为了避免公司的相关数据信息暴露&#xff0…

V9数据库替换授权

文章目录 环境文档用途详细信息 环境 系统平台&#xff1a;Linux x86-64 Red Hat Enterprise Linux 7 版本&#xff1a;9.0 文档用途 1、本文档用于指导V9数据库替换授权。 2、V9数据库授权文件为license.dat。 详细信息 1、上传新的授权文件到服务器并修改授权文件属主为…

初识 Flask 框架

目录 1. Flask 框架概述 1.1 安装 Flask 1.2 创建你的第一个 Flask 应用 1.3 运行 Flask 应用 2. Flask 路由与视图函数 2.1 动态路由 2.2 支持多种 HTTP 请求方法 2.3 使用 Jinja2 模版渲染 HTML 2.5 模版继承与块 3. Flask 表单处理与用户输入 3.1 安装 Flask-WTF …

《深入剖析:Python自动化测试框架之unittest与pytest》

unittest作为Python标准库的一部分&#xff0c;犹如一位沉稳可靠的“老工匠”&#xff0c;默默为无数项目提供着坚实的测试基础。它诞生于Python社区长期的实践沉淀&#xff0c;拥有一套标准化的测试体系&#xff0c;就像一套精密的仪器&#xff0c;各个部件各司其职。 unitte…

【Python 命名元祖】collections.namedtuple 学习指南

&#x1f4da; collections.namedtuple 学习指南 命名元组&#xff08;namedtuple&#xff09;是 Python collections 模块中一种增强型元组&#xff0c;支持通过字段名访问元素&#xff0c;同时保持元组的内存效率和不可变性。 一、基础用法 1. 定义命名元组 from collectio…

iOS知识复习

block原理 OC block 是个结构体&#xff0c;内部有个一个结构体成员 专门保存 捕捉对象 Swift闭包 是个函数&#xff0c;捕获了全局上下文的常量或者变量 修改数组存储的内容&#xff0c;不需要加_block,修改数组对象本身时需要 weak原理 Weak 哈希表 &#xff08;散列表&a…

手眼标定:九点标定、十二点标定、OpenCV 手眼标定

因为一直使用6轴协作机器人&#xff0c;且主要应用是三维视觉&#xff0c;平常的手眼标定基本都是基于OpenCV来计算的&#xff0c;听说有九点标定和十二点标定&#xff0c;顺便了解下。 目录 1.九点标定1.1 基本原理1.2 关于最小二乘法1.3 具体示例 2.十二点标定3.OpenCV 手眼标…

CSS之元素定位

元素定位 一、什么是元素定位 元素定位&#xff08;CSS Positioning&#xff09; 是指通过CSS的 position 属性控制HTML元素在页面中的布局方式。它决定了元素如何相对于其父元素、视口或其他元素进行位置调整。 CSS的 position 属性用于控制元素在页面上的定位方式&#xff…

测试工程师如何通俗理解和入门RAG:从“查资料”到“写答案”的智能升级

1. 为什么要学习RAG?——从“查资料”到“写答案”的飞跃 背景:你已经掌握了Embedding技术,能将文档、代码、测试用例等离散信息转化为向量,用于相似度匹配。 痛点:但仅靠向量匹配找到相关文档后,如何快速生成答案?如何避免“找到文档却不会总结”的尴尬? RAG的价值:…

数量优势:使用Bagging和Boosting的集成模型

文章目录 装袋法&#xff08;Bagging&#xff09;和提升法&#xff08;Boosting&#xff09;利用集成学习创建强大的模型装袋法&#xff08;Bagging&#xff09;&#xff1a;为机器学习模型增加稳定性装袋法示例 提升法&#xff08;Boosting&#xff09;&#xff1a;减少弱学习…