浙大高飞团队新作:提出层级式探索框架,让「地空双模」机器人自主决策“飞”或“走”

导读

在面对复杂未知环境的自主探索任务中,如何在有限的能源与时间条件下实现高效、全面的场景感知,一直是机器人研究中的重要难题。近期,浙大高飞老师团队一项关于“地空双模机器人”的研究给出了新答案。

相比传统单一形态的机器人,地空双模平台结合了地面机器人的持久续航与空中机器人的灵活机动,天然具备更强的环境适应能力。本文提出了一套层级式探索框架,利用双模机器人可切换的移动方式,在不同区域中灵活决策“飞”还是“走”,实现信息获取最大化。该系统首先提取环境中的关键信息区域,生成一系列具有潜力的观测位点,并通过一种改进的蒙特卡洛树搜索算法,在能源消耗与时间成本之间做出平衡,优化探索路径和模式选择。

研究不仅在仿真中取得了优异表现,还在真实搭建的机器人平台上完成了验证,展示了地空融合平台在高效自主探索中的巨大潜力。接下来,小编将带你深入了解这套系统的设计亮点与技术实现。

图1|TABV 将地面与空中两种移动模式集成于单一平台,在自主探索任务中展现出显著的应用潜力。

论文出处:arXiv

论文标题:Autonomous Exploration with Terrestrial-Aerial Bimodal Vehicles

论文作者:Yuman Gao, Ruibin Zhang, Tiancheng Lai, Yanjun Cao, Chao Xu, and Fei Gao

自主探索在学术界与工业界持续受到关注,广泛应用于救援、工程测绘、隧道巡检等任务场景。近年来,研究者提出了多种探索策略,并将其部署在无人机(UAV)与地面机器人(UGV)上。然而,由于各类机器人的运动特性受限,其探索性能仍面临瓶颈:空中机器人虽具备高机动性与广阔视野,但续航时间短,不适合大范围长时间任务;而地面机器人在复杂崎岖地形中行动受限,主要适用于平坦开阔区域。为突破这些物理限制,部分研究尝试将UAV与UGV组合成协同系统,但多机器人协作引入了额外的SLAM、路径规划与协调难题,增加了系统复杂性。

针对上述问题,本文提出了一种基于地空双模机器人(TABV)的层级式探索框架。该平台集成了UGV的长续航与UAV的高机动性和宽视野于一体,具备极高的任务适应性。考虑到现实中的能量与时间限制(尤其在救援等任务中),作者设计了一个双模观测点生成模块,基于已知环境边界提出潜在的探索视角;接着引入一种自适应规划器,结合双模能力和任务约束,动态选择最合适的运动模式。文中进一步提出了一种新的“Bimodal Monte Carlo Tree Search(BM-MCTS)”算法,用于优化探索路径和模式选择顺序。最后,系统集成了增强版的运动规划器,支持地形感知与模式切换规划。

论文的主要贡献包括:

(1)提出了一个考虑能耗与时间限制的双模探索框架,具备两种视角覆盖策略与灵活的决策机制;

(2)设计了BM-MCTS算法,支持在任务约束下的信息驱动探索决策;

(3)将规划器与改进的运动规划模块整合,完成系统在仿真与真实平台上的部署验证。

2|全文方法总览

本研究旨在实现一个具备能量与时间意识的地空双模自主探索系统,目标是在未知但有边界的三维环境中,利用地空双模机器人(TABV)在电量和时间预算内尽可能高效地收集有价值的信息,并确保任务结束时能安全返回起点。系统追求的并非全覆盖,而是最大化信息获取与任务完成的安全性,非常适用于通信受限或灾后环境中的探索任务

任务建模与系统流程概览

作者将探索过程建模为一个观测点(viewpoint)和运动模式(modality)联合选择的问题,旨在在电量和时间预算内最大化信息增益。为处理实际中的不确定性与资源限制,作者引入了一种惩罚函数机制,对超出预算的路径进行非线性惩罚,从而鼓励策略保留“冗余空间”,确保安全执行。

整个系统如图2所示,分为三个阶段:

1. 从环境中提取信息,生成候选观测点;

2. 通过改进的双模蒙特卡洛树搜索(BM-MCTS)确定探索路径;

3. 由双模运动规划器生成可行轨迹并控制执行。

信息提取与双模观测点生成

探索点的生成借鉴了“前沿探索”思路(见图2④-⑤),即优先探索已知区域边界附近的未知空间。作者提出两种覆盖策略:

 AS(纯空中策略):仅利用空中视角对某一前沿簇进行观测;

 HS(混合策略):优先从地面视角观察,若无法完全覆盖,再补充空中视角。

每个前沿簇会被分配一组候选视角(地面+空中),并通过贪心算法选出具有代表性的一组候选点。

此外,系统根据机器人在两点之间的距离、角度变化、速度上限等,估算不同模式下的时间和能耗开销。实际中,空中模式能耗是地面模式的7倍以上,速度虽快但受安全限制,故地面移动在能耗方面更具优势,而空中模式则在节省时间上更具潜力

3BM-MCTS 过程示意图

BM-MCTS:能量与时间感知的路径规划算法

作者将经典的蒙特卡洛树搜索(MCTS)扩展为BM-MCTS,用于在观测点和双模路径选择之间进行智能规划(见图3-5)。其核心包括:

 树结构设计:每个节点代表一个观测点,并记录当前路径下的剩余能量和时间;

 奖励设计:结合路径信息增益与终端成本,鼓励策略在获取更多信息的同时保留足够资源;

 选择与扩展:基于上置信界(UCB)进行子节点选择,权衡探索与利用;

 仿真阶段:引入旅行商路径启发,估算剩余路径的能耗与时间;

 剪枝机制:若某路径剩余资源不足以返航,则剪枝以降低计算开销。

该算法在保持计算效率的同时,确保策略在约束条件下仍能做出灵活、信息增益最大的决策。

4潜在子节点确定示意图示例。(a):前沿簇 B 中视点 B1 的潜在子节点。如果某视点所属的簇已在当前路径中被展开,则禁止选择该簇中属于另一种模态的视点作为子节点。(b):对应的蒙特卡洛树结构。每一条分支代表一个视点遍历序列

5新扩展节点的引导路径生成示例。(a):正在扩展的蒙特卡洛树,其中节点 A1 为新扩展节点,需进行模拟评估。(b):节点 A1 的引导路径生成过程。在该示例中,A1 被选中用于覆盖簇 A,其从机器人当前位置 pr 到 A1 的路径首先被确定。随后通过求解分组旅行商问题(grouped TSP),得到遍历所有簇并返回起始点的完整引导路径。(c):分组 TSP 的代价矩阵图示。紫色区域表示不可达连接(代价无限),绿色区域表示同组内连接(代价为零)

双模运动规划器

为了将BM-MCTS输出的目标点转换为可执行的运动轨迹,作者设计了一种地空融合的运动规划器,具备如下特点:

 地形感知增强:通过在线地面分割动态识别可通行区域,不再假设固定地面;

 模式自适应规划:前端根据任务目标选择地面或空中运动元件;后端则根据模式应用对应的动力学约束(如地面车辆的非完整约束);

 安全飞行设计:引入欧几里得距离场(ESDF)约束,确保靠近边缘时飞行安全,防止坠落;

 全流程融合:最终构建一个具备完整闭环的自主探索系统,可部署在真实的TABV平台上运行。

6层次化的双模态运动规划框架示意图。(a):基于运动学-动力学约束的路径搜索前端;(b):基于轨迹平坦性与微分约束的时空轨迹优化后端;(c):非线性模型预测控制(NMPC)模块,用于计算目标电机转速。

为验证所提双模探索系统的实际效果,作者分别在多层仿真建筑环境与真实地下车库中进行了全面测试。实验聚焦三个核心问题:双模能力的使用策略、在不同资源约束下的适应性、以及规划算法的效率表现。

仿真测试:应对多层结构与资源限制

作者首先在一个两层的房屋场景中测试了双模机器人在能耗和时间预算下的探索策略。实验展示了四个阶段的探索行为演化:在起始阶段能量充足时,机器人优先采用飞行模式获取信息增益更高的视角;随着能量逐步下降,系统逐渐偏向地面模式以节省开销,并通过滚动穿越一层结构完成覆盖;最终,为完成剩余空中视角的探索任务,机器人再次起飞,并在能量耗尽前安全返航。这种灵活切换策略验证了 BM-MCTS 算法在多阶段任务中的动态调度能力。

7本图展示了 TABV 在双层建筑场景中的探索过程与分析。(a) 是用于实验的双层房屋场景;(b) 展示了探索过程的四个阶段:阶段 01 中,TABV 通过飞行模式完成大厅的大部分探索;阶段 02 中,TABV 转为地面模式探索一楼平台,并随后飞至二楼;阶段 03 中,TABV 滚动覆盖二楼平台区域;阶段 04 中,TABV 飞行完成剩余大厅区域的探索并返回出发点。(c) 展示了用于路径估计的拓扑图;(d) 显示了 TABV 的双模态运动方式;(e) 为蒙特卡洛树第二层中空中与地面子节点的平均奖励差异;(f) 显示了随时间推移的覆盖率变化;(g) 展示了探索结束时 TABV 剩余的能量与时间。

资源适应性分析

在一组办公场景中,作者进一步探讨了系统在不同预算条件下的适应性。结果表明:当时间预算充足而能量有限时,机器人更偏向地面行驶;相反,在能量充裕但时间紧张的情况下,则倾向采用飞行模式以节省时间。此外,作者还分析了“剩余资源量”随预算调整的变化规律,进一步验证了 BM-MCTS 算法在动态权衡能耗与任务效率上的弹性。

8仿真场景(a):带有0.5米高隔断墙的多房间场景;(b):包含一系列预设视点的场景。

9在不同能量与时间预算下系统的性能表现。(a)-(b) 展示了在不同预算条件下的探索结果:(a) 表示不同预算下地面与空中模式的时间占比,其中数值为地面时间与空中时间的比值;(b) 显示了探索完成时剩余的能量与时间情况。(c) 展示了不同迭代次数下的算法计算时间,以及对应的探索结束时的剩余能量与时间。

算法效率分析

考虑到搜索树方法的开销问题,作者测试了在不同迭代次数下,BM-MCTS 所产生解的质量变化。结果显示:随着迭代次数增加,系统在能量与时间使用上的平衡性显著提升,体现了算法在计算预算受限时依然具备渐进优化的能力。

实地测试:地下车库中完成任务闭环

最后,作者将整个系统部署至一台定制的双模机器人平台中,在真实的地下停车场中完成探索任务。该平台集成了激光雷达、边缘计算模块与自主定位系统,飞行功率约为地面模式的 7.2 倍。实地测试中,机器人成功完成了多次飞行与地面模式的切换,在资源耗尽前返回起点,充分验证了系统的闭环运行能力与真实部署潜力。

10真实环境实验。(a):地下停车场入口的侧视图;(b):能耗与运动模式的变化曲线;(c):已探索区域的俯视图

这项研究展示了一个将灵活机动性与任务资源管理结合的探索系统,通过双模机器人在飞行与地面之间的自由切换,显著提升了任务执行的效率与适应性

无论是在复杂建筑内部,还是在真实地下场景中,该系统都完成了“走得稳、飞得远、算得清”的闭环探索。尽管当前的规划尚未考虑环境的未来变化,团队已计划将“环境预测”能力纳入系统,进一步提高任务规划的前瞻性与鲁棒性。

小编在这里也强烈推荐各位感兴趣的读者阅读原文了解更详细的内容,链接:https://arxiv.org/pdf/2507.21338

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/92767.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/92767.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

驱动电路设计

一、理论基础1.1定义驱动电路时位于控制电路和负载(主)电路之间,用来对控制电路的信号进行放大的中间电路。控制电路----(控制信号)--->驱动电路----(驱动信号)--->负载电路↑提供足够的电…

RAG (Retrieval-Augmented Generation) 原理详解与实例

核心概念:什么是 RAG? 想象一下,你是一位专家,需要回答一个复杂的问题。你不会凭空编造答案,而是会: 检索 (Retrieval):先去查阅相关的书籍、论文、报告或数据库,找到最相关的信息片段。 理解与整合 (Comprehension & Integration):阅读这些信息,理解其核心内容。…

SOMGAN:利用自组织映射提高生成对抗网络的模式探索能力

论文信息 论文题目:Improving mode exploring capability ofgenerative adversarial nets by self-organizing map(利用自组织映射提高生成对抗网络的模式探索能力) 期刊:Neurocomputing 摘要:生成对抗网络(GANs)的出…

全栈:如果SSM项目里的数据库是mysql而自己使用的是SQLserver应该替换哪些文件?

将基于 SSM(Spring SpringMVC MyBatis)框架项目里的 MySQL 换成 SQL Server,主要需改动以下几部分: 1. 依赖配置(pom.xml) 移除 MySQL 驱动依赖:找到原 MySQL 驱动相关依赖,一般类…

基于 Jenkins Pipeline 实现 DITA 文档自动化构建与发布(开源方案)

这是我最近开发的一个基于 Jenkins Pipeline 的 DITA 文档自动化构建方案。对于需要维护大量 DITA 格式文档的团队来说,手动构建不仅效率低下,还容易出现版本不一致的问题。通过这套开源方案,我们可以实现代码拉取、多地图并行构建、结果归档…

reinterpret_cast and static cast

什么时候使用 reinterpret_cast&#xff1f;指针类型之间的转换&#xff1a; 当需要将一种类型的指针转换为另一种类型的指针时&#xff0c;可以使用 reinterpret_cast。例如&#xff1a;int* intPtr new int(10); void* voidPtr reinterpret_cast<void*>(intPtr); // …

自动化运维 | 乐维8.0安装及简单使用

文章目录1.创建虚拟机2.安装乐维8.03.Web界面登录访问4.添加第一个监控在文章的开头需要感谢乐维带来这么好的自动化运维系统提供我们学习参考或是在生产环境中进行使用&#xff0c;并附上乐维官网供大家参考和学习&#xff1a;https://www.lwops.cn/1.创建虚拟机 在VMware wo…

无印良品:回归本质的管理哲学

一、底层管理哲学 First, the underlying management philosophy核心思想&#xff1a;「无印」即「无品牌标识」&#xff0c;回归产品本质Core idea: "Muji" means "no brand logo", returning to the essence of products.拒绝过度营销&#xff0c;靠产品…

Redis面试精讲 Day 13:Redis Cluster集群设计与原理

【Redis面试精讲 Day 13】Redis Cluster集群设计与原理 开篇 欢迎来到"Redis面试精讲"系列第13天&#xff0c;今天我们将深入探讨Redis Cluster的集群设计与实现原理。作为Redis官方提供的分布式解决方案&#xff0c;Redis Cluster是面试中必问的高频考点&#xff…

LangChain-Unstructured 基础使用:PDF 与 Markdown 处理解析

文章目录LangChain-Unstructured 基础使用&#xff1a;PDF 与 Markdown 处理解析一、核心依赖与库说明二、核心类与方法详解1.UnstructuredLoader&#xff08;1&#xff09;类原型与核心功能&#xff08;2&#xff09;初始化参数详解&#xff08;3&#xff09;核心方法详解① l…

uboot使用指南

1.uboot的分类本节是 uboot 的使用&#xff0c;所以就直接使用正点原子已经移植好的 uboot&#xff0c;这个已经放到了开发板光盘中了&#xff0c;路径为&#xff1a;开发板光盘->1、程序源码->3、正点原子 Uboot 和 Linux 出厂源码->uboot-imx-2016.03-2.1.0-ge468cd…

学习率预热总结

学习率预热是什么&#xff1f; 学习率预热&#xff08;Learning Rate Warmup&#xff09; 是一种在深度学习训练初期逐渐增加学习率的策略。其核心思想是&#xff1a;在训练开始时使用较小的学习率&#xff0c;逐步增加到目标学习率&#xff0c;以避免模型参数在初始阶段因学习…

初识SYSCFG(System Configuration Controller)寄存器映射

SYSCFG&#xff08;System Configuration Controller&#xff09;寄存器映射的详细说明&#xff0c;以 STM32&#xff08;如 F1/F4/F7 系列&#xff09;为例。SYSCFG 控制器用于系统级配置&#xff0c;如外部中断映射、存储器重映射等。SYSCFG 寄存器映射概述 基地址&#xff1…

《P3403 跳楼机》

题目背景DJL 为了避免成为一只咸鱼&#xff0c;来找 srwudi 学习压代码的技巧。题目描述Srwudi 的家是一幢 h 层的摩天大楼。由于前来学习的蒟蒻越来越多&#xff0c;srwudi 改造了一个跳楼机&#xff0c;使得访客可以更方便的上楼。经过改造&#xff0c;srwudi 的跳楼机可以采…

【GPT-OSS 全面测评】释放推理、部署和自主掌控的 AI 新纪元

目录 一、背景与意义 二、核心参数对比 三、性能评测&#xff08;Benchmark&#xff09; 四、硬件适配与优化 五、安全性与风险 六、部署方式 七、适用场景 八、大型语言模型对比表&#xff08;2025 年 8 月版&#xff09; 总结 一、背景与意义 &#x1f4a1; 为什么…

医疗健康Agent:诊断辅助与患者管理的AI解决方案

医疗健康Agent&#xff1a;诊断辅助与患者管理的AI解决方案 &#x1f31f; Hello&#xff0c;我是摘星&#xff01; &#x1f308; 在彩虹般绚烂的技术栈中&#xff0c;我是那个永不停歇的色彩收集者。 &#x1f98b; 每一个优化都是我培育的花朵&#xff0c;每一个特性都是我放…

python魔法属性__doc__介绍

doc: 魔法属性。类、函数的描述信息。 __doc__在python中类的使用方法&#xff1a; class Person(object):"""人类---类的描述信息""" # 只能使用多行注释&#xff0c;单行注释无效passprint(Person.__doc__)运行结果如图所示&#xff1a;__d…

PostgreSQL 批量COPY导入优化参数配置

&#x1f4a1; 场景假设我们进行的是 频繁批量导入、对数据持久性容忍较高 的场景&#xff0c;比如日志表、缓存表、临时数据表等。如果系统崩溃可重导入&#xff0c;那我们就可以牺牲一点写入安全性来换极致性能。⚙️ 参数配置推荐&#xff08;postgresql.conf&#xff09;参…

BeanDefinition 与 Bean 生命周期(面试高频考点)

Bean 是 Spring 应用的核心组件&#xff0c;而 BeanDefinition 作为 Bean 的 “元数据描述”&#xff0c;贯穿了 Bean 从定义到销毁的全生命周期。理解 BeanDefinition 的加载注册机制&#xff0c;以及 Bean 的完整生命周期&#xff0c;是掌握 Spring 容器管理逻辑的关键&#…