⭐CVPR2025 自动驾驶半监督 LiDAR 分割新范式:HiLoTs 框架深度解析

📄论文题目:HiLoTs: High-Low Temporal Sensitive Representation Learning for Semi-Supervised LiDAR Segmentation in Autonomous Driving
✍️作者及机构:
R.D. Lin、Pengcheng Weng、Yinqiao Wang、Fei Wang(西安交通大学软件工程学院);Han Ding(西安交通大学计算机科学与技术学院);Jinsong Han(浙江大学计算机科学与技术学院)
💻开源代码:https://github.com/rdlin118/HiLoTs
🧩面临问题:
标注成本高昂:传统全监督 LiDAR 点云分割方法需大量逐点标注,耗费大量人力与时间,且难以适应新环境, scalability 受限。
时间信息利用不足:现有半监督方法多聚焦点云空间分布,或仅考虑相邻两帧短期时间特征,忽略自动驾驶场景中 “近场物体稳定、远场物体多变” 的长期时间特性。
多模态依赖与性能矛盾:部分 SOTA 方法依赖 LiDAR+Camera 多模态数据,增加硬件与标注成本,且单模态半监督方法性能难以突破。
计算效率与特征表征难题:LiDAR 点云近密远疏,传统体素化方法易导致特征失衡;Transformer 注意力机制应用于大量体素时,计算复杂度高(O (n²)),难以高效处理。

在这里插入图片描述

🎯创新点及其具体研究方法:
1️⃣ 提出 HiLoTs 嵌入单元(HEU):
核心思路:针对 “近稳远变” 特性,分通道处理不同时间敏感性特征。
具体方法:先通过多体素聚合(MVA)将相邻体素归为超体素,减少 Token 数量以降低计算成本;再分两条流处理 —— 高时间敏感流(HTSF)聚焦远场体素(最远 70% 范围),用自注意力捕捉类别与形状快速变化;低时间敏感流(LTSF)处理近场体素,同时与 HTSF 进行交叉注意力交互,实现稳定特征与动态特征的互补优化。
2️⃣ 圆柱体裁剪网络设计:
核心思路:贴合 LiDAR 径向扫描物理特性,解决点云近密远疏的数据不均衡问题。
具体方法:将笛卡尔坐标(x,y,z)转换为柱坐标(ρ,θ,z)(ρ 为径向距离,θ 为方位角);体素大小随 ρ 增大而调整,近场用小体素保留细节,远场用大体素避免稀疏特征缺失;采用 3D ResNet50 提取初始特征,为后续模块提供高质量输入。
3️⃣ 基于 Mean Teacher 的半监督优化框架:
核心思路:充分利用无标注数据,平衡监督学习与无监督学习的特征对齐。
具体方法:构建学生 - 教师双网络 —— 学生网络处理标注数据,采用 Focal Loss 解决类别不平衡问题;教师网络处理无标注数据,通过 L2 一致性损失对齐学生网络预测;教师网络参数采用指数移动平均(EMA)从学生网络缓慢更新(Wt’ = γWt-1’ + (1-γ) Wt),避免训练震荡,最终用教师网络完成推理。
4️⃣ 多维度鲁棒性与效率优化:
核心思路:在性能提升基础上,保障模型在复杂场景下的稳定性与计算效率。
具体方法:通过消融实验验证不同体素化(立方、柱体、球形、圆柱体)、EMA 比率(0.5-0.999)、体素下采样策略(随机、密度、聚合)的影响,最终选择最优配置;在 SemanticKITTI-C 与 nuScenes-C 数据集上验证,模型在雾、雪、激光缺失等扰动场景下仍保持优异性能,鲁棒性媲美专门优化的 SOTA 模型。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/94862.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/94862.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【 MYSQL | 基础篇 函数与约束 】

摘要:本文介绍数据库中的函数与约束,函数含字符串、数值、日期、流程四类,可实现字符串处理、数值计算等需求。约束分六类,重点讲外键约束的语法、删除更新行为,保证数据正确完整。思维导图1. 函数函数是指一段可以直接…

Oracle 数据库性能调优:从瓶颈诊断到精准优化之道

引言:性能优化的本质在当今数据驱动的时代,数据库性能直接关系到企业的运营效率和用户体验。Oracle 作为全球领先的关系型数据库管理系统,承载着众多企业的核心业务。然而,随着数据量的增长和业务复杂度的提升,数据库性…

杨校老师竞赛课堂之C++语言GESP一级笔记

考试大纲 GESP一级考试大纲 计算机基础与编程环境 计算机历史 变量的定义与使用 基本数据类型(整型、浮点型、字符型、布尔型) 输入与输出(cin与cout、scanf与printf) 基本运算(算术运算、关系运算、逻辑运算&am…

操作系统-管程

1. 为什么需要管程?—— 信号量 (Semaphore) 的困境在理解管程之前,你必须先知道它要解决什么问题。之前,我们使用信号量 (Semaphore) 来实现进程/线程间的同步与互斥。虽然信号量功能强大,但它存在两个主要问题:编程复…

日志的实现

目录 日志与策略模式 Log.hpp class LogStrategy基类 class ConsoleLogStrategy派生类 classFileLogStrategy派生类 日志等级 获得时间戳 localtime_r函数详解 函数原型 struct tm结构的指针 Logger类(重点) class LogMessage 日志信息类 std::stringstream 用法 重…

【论文阅读】Sparse4D v2:Recurrent Temporal Fusion with Sparse Model

标题: Sparse4D v2:Recurrent Temporal Fusion with Sparse Model 作者: Xuewu Lin, Tianwei Lin, Zixiang Pei, Lichao Huang, Zhizhong Su motivation 在v1的基础上,作者发现长时序有更好的效果,但v1的计算量太大&am…

构建免费的音视频转文字工具:支持多语言的语音识别项目

在当今数字时代,音视频内容越来越多,但如何快速将其转换为文字一直是一个挑战。本项目提供了一个免费的解决方案,支持将视频和音频文件转换为文字,并且支持多语言识别。 一个支持中英文的音视频转文字工具,集成了 Vos…

【开题答辩全过程】以 基于SpringBootVue的智能敬老院管理系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

Linux 830 shell:expect,ss -ant ,while IFS=read -r line,

[rootsamba caozx26]# scp /home/caozx26/pub root192.168.235.3:~/ root192.168.235.3s password: /home/caozx26/pub: not a regular file [rootsamba caozx26]# ls app km nntp.sh ntp.sh until1.sh 公共 图片 音乐 find.sh l2 ntp1.sh pub u…

​​​​​​​GPT-5发布引爆争议,奥特曼连夜回应!付费充值的Plus用户成最大赢家?

摘要: GPT-5发布后,社区口碑两极分化,从“强无敌”到“还我4o”的呼声并存。面对技术故障和用户质疑,OpenAI CEO萨姆奥尔特曼及团队火速回应,公布了一系列补救措施和未来计划。本文将带你速览这场风波始末,…

Python 操作 Redis 的客户端 - Redis Stream

Python 操作 Redis 的客户端 - Redis Stream1. Redis Stream2. Redis Commands2.1. CoreCommands.xadd() (生产端)2.2. CoreCommands.xlen() (生产端)2.3. CoreCommands.xdel() (生产端)2.4. CoreCommands.xrange() (生产端)2.5. RedisClusterCommands.delete()3. Redis Stream…

【Qt开发】按钮类控件(一)-> QPushButton

目录 1 -> 什么是 PushButton? 2 -> 相关属性 3 -> 代码示例 3.1 -> 带有图标的按钮 3.2 -> 带有快捷键的按钮 4 -> 总结 1 -> 什么是 PushButton? 在 Qt 框架中,QPushButton 是最基础且最常用的按钮控件之一&am…

Citrix 零日漏洞自五月起遭积极利用

安全研究员 Kevin Beaumont 披露了有关 CVE-2025-6543 的惊人细节,这是一个严重的 Citrix NetScaler 漏洞,在该公司发布补丁之前的几个月里,该漏洞被积极利用作为零日攻击。 Citrix 最初将其轻描淡写为简单的“拒绝服务”漏洞,但…

【系列08】端侧AI:构建与部署高效的本地化AI模型 第7章:架构设计与高效算子

第7章:架构设计与高效算子 要将AI模型成功部署到端侧,除了对现有模型进行压缩和优化,更根本的方法是在设计之初就考虑其在资源受限环境下的运行效率。本章将深入探讨如何设计高效的网络架构,以及如何理解并优化常用的核心算子。高…

42-Ansible-Inventory

文章目录Ansible基本概述手动运维时代(原始社会)自动化运维时代自动化运维工具的优势Ansible的功能及优点Ansible的架构Ansible的执行流程安装AnsibleAnsible配置文件生效顺序Ansible inventory主机清单Ansible基于免秘钥方式管理客户端小结Ansible-Adho…

Go语言runtime/trace工具全面解析

基本概念与功能 Go语言的runtime/trace是Go标准库中内置的性能分析工具,主要用于追踪和可视化Go程序的运行时行为。它能够记录程序执行期间的各种事件,包括goroutine调度、系统调用、垃圾回收(GC)、网络I/O、锁等待等关键信息。 trace工具的核心功能包括: goroutine生命周期…

Docker(自写)

Docker程序是跑在操作系统上的,而操作系统上又装了各种不同版本的依赖库和配置程序依赖环境,环境不同,程序就可能跑不起来,如果我们能将环境和程序一起打包docker就是可以将程序和环境一起打包并运行的工具软件基础镜像DockerFile…

深度拆解 OpenHarmony 位置服务子系统:从 GNSS 到分布式协同定位的全链路实战

1. 系统概述 OpenHarmony 的“定位子系统”就是硬件服务子系统集里的 “位置服务子系统”(Location SubSystem)。它向下对接 GNSS/GPS、基站、Wi-Fi 等定位模组,向上以 标准位置 API 形式为应用提供 实时位置、轨迹、地理围栏 等能力,并可与分布式软总线联动,实现 跨设备…

React Native基本用法

1,index调用registerComponent,把appName注入到React Native的根节点。 2,package.json是全局大管家,package-lock.json锁定版本,不会手动编辑,通过install安装 3, bebal.config.json bebal.config.json是翻…

LoraConfig target modules加入embed_tokens(64)

LoraConfig target modules加入embed_tokens 更好且成本更低的方法 嵌入层(embedding layer)的 lora_embedding_A 和 lora_embedding_B 头部(head)是否需加入目标模块列表 用户警告 解除权重绑定 解绑以后是随机权重,怎么办 更好且成本更低的方法 “有没有一种更好且成本…