2025年SEVC SCI2区,基于深度强化学习与模拟退火的多无人机侦察任务规划,深度解析+性能实测

目录

    • 1.摘要
    • 2.问题定义
    • 3.SA-NNO-DRL方法
    • 4.结果展示
    • 5.参考文献
    • 6.算法辅导·应用定制·读者交流


1.摘要

无人机(UAV)因其高自主性和灵活性,广泛应用于侦察任务,多无人机任务规划在交通监控和数据采集等任务中至关重要,但现有方法在计算需求上较高,导致常常无法得到最优解。为解决这一问题,本文提出了一种分治框架将任务分为两个阶段:目标分配和无人机路径规划,从而有效降低了计算复杂度。本文提出混合方法SA-NNO-DRL结合了基于最近邻最优的深度强化学习(NNO-DRL)和模拟退火(SA)算法。在路径规划阶段,NNO-DRL为每个无人机构建路径;在目标分配阶段,SA重新分配未覆盖的目标。两个阶段交替进行,直到满足终止条件。

2.问题定义

MURMPP的目标是为无人机群体规划路径,最大化其在监控目标时的总利润。每个无人机从同一中心出发并返回,成功监控指的是访问或经过目标。目标的利润预先定义,且仅在成功监控后收取。由于电池限制,部分目标可能无法覆盖。MURMPP是一个复杂的组合优化问题,随着目标数量增加,其难度呈指数级增长,该问题可通过混合整数线性规划(MILP)形式化,其中涉及多个无人机、目标、利润、路径分配和飞行范围的约束。

3.SA-NNO-DRL方法

为解决MURMPP,论文提出了一种迭代的两阶段框架——SA-NNO-DRL,在该框架中目标分配和无人机路径规划交替进行并相互作用。

单无人机NNO-DRL路径规划方法

路径规划可视为一个顺序决策问题,通过马尔可夫决策过程来实现。无人机智能体根据环境状态(如目标信息和剩余飞行范围)决定下一步行动 (即选择访问的目标节点),并获得相应的奖励。NNO-DRL的目标是学习一个策略pθp_\thetapθ,构建路径τ\tauτ,最大化总利润,同时遵循约束条件。生成路径的概率通过链式法则表示:
pθ(τ∣s)=∏t=1Tpθ(τt∣s,τ1:t−1)p_\theta\left(\tau|s\right)=\prod_{t=1}^Tp_\theta\left(\tau_t|s,\tau_{1:t-1}\right) pθ(τs)=t=1Tpθ(τts,τ1:t1)

The whole NNO-DRL structure consists of an attention encoder, a projection MLP, and a multi-start decoder

NNO-DRL由改进注意力模型和投影MLP组成,用于解决路径规划问题。其创新之处在于结合投影MLP和对比学习(CL)进行复杂问题表示,并通过kkk最近邻策略的多启动解码器提高解空间探索效率。通过最大化原始实例和增强版本节点嵌入的余弦相似度,增强了表示的鲁棒性。多启动解码器采用kkk最近邻策略,生成多个轨迹,以避免因电池限制产生次优解。

目标分配SA方法

给定位于区域中心的无人机中心,论文根据目标节点与水平轴之间的角度,将区域内的所有目标均匀地分成mmm组,角度定义为:
anglei=arctanlocyi−locy0locxi−locy0angle_i=arctan\frac{loc_y^i-loc_y^0}{loc_x^i-loc_y^0} anglei=arctanlocxilocy0locyilocy0

The target allocation scheme in which the targets of the same color are
allocated to the same UAV

4.结果展示

论文仿真

5.参考文献

[1] Fan M, Liu H, Wu G, et al. Multi-UAV reconnaissance mission planning via deep reinforcement learning with simulated annealing[J]. Swarm and Evolutionary Computation, 2025, 93: 101858.

6.算法辅导·应用定制·读者交流

xx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/92735.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/92735.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汽车娱乐信息系统域控制器的网络安全开发方案

引言1.1 项目背景随着汽车行业的快速发展和智能化、网联化的趋势日益明显,汽车娱乐信息系统(In-Vehicle Infotainment System,IVIS)已经成为现代汽车的重要组成部分。汽车娱乐信息系统不仅提供了丰富的多媒体功能,如音…

【论文阅读】Deep Adversarial Multi-view Clustering Network

摘要多视图聚类通过挖掘多个视图之间的共同聚类结构,近年来受到了越来越多的关注。现有的大多数多视图聚类算法使用浅层、线性嵌入函数来学习多视图数据的公共结构。然而,这些方法无法充分利用多视图数据的非线性特性,而这种特性对于揭示复杂…

Redis - 使用 Redis HyperLogLog 进行高效基数统计

文章目录引言HyperLogLog 工作原理Spring Boot 集成 Redis1. 添加依赖2. 配置 Redis 连接3. Redis 配置类HyperLogLog 实战应用1. 基础操作服务类2. 网站日活跃用户统计3. 性能测试与误差分析应用场景分析适用场景不适用场景性能优化技巧与传统方案对比结论引言 在数据分析和监…

後端開發技術教學(三) 表單提交、數據處理

上回:後端開發技術教學(二) 條件指令、循環結構、定義函數 -CSDN博客 必要資源: trae中文版下載網址: TRAE - The Real AI Engineer phpStudy 2018 : phpStudy - Windows 一键部署 PHP 开发环境 小皮出品 目錄 一、表單提交 1.1 get & post 1.…

Python训练Day39

浙大疏锦行 图像数据的格式:灰度和彩色数据模型的定义显存占用的4种地方 模型参数梯度参数优化器参数数据批量所占显存神经元输出中间状态 batchisize和训练的关系 一、 图像数据的介绍 图像数据,相较于结构化数据(表格数据)他的特…

十八、MySQL-DML-数据操作-插入(增加)、更新(修改)、删除

DML数据操作添加数据更新(修改)数据删除数据总结代码: -- DML:数据操作语言-- -- DML:插入数据-insert -- 1.为tb_emp表的username,name,gender 字股插入值insert into tb_emp(username,name,gender,create_time,update_time) values (Toki,小时,2,now()…

Linux 安装 JDK 8u291 教程(jdk-8u291-linux-x64.tar.gz 解压配置详细步骤)​

一、准备工作 ​下载 JDK 安装包​ 去 Oracle 官网或者可信的镜像站下载: ​jdk-8u291-linux-x64.tar.gz​ (这是一个压缩包,不是安装程序,解压就能用) ​jdk-8u291-linux-x64.tar.gz​下载链接:https://pa…

蓝桥杯----锁存器、LED、蜂鸣器、继电器、Motor

(七)、锁存器1、原理蓝桥杯中数据传入口都是P0,也就是数码管段选、位选数据、LED亮灭的数据、蜂鸣器启动或禁用的数据,外设启动或者关闭都需要通过P0写入数据,那么如何这样共用一个端口会造成冲突嘛,答案是肯定的。所以蓝桥杯加入…

AI热点周报(8.3~8.9):OpenAI重返开源,Anthropic放大招,Claude4.1、GPT5相继发布

名人说:博观而约取,厚积而薄发。——苏轼《稼说送张琥》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录一、OpenAI的"开源回归":时隔5年的战略大转弯1. GPT-OSS系列&a…

《Kubernetes部署篇:基于x86_64+aarch64架构CPU+containerd一键离线部署容器版K8S1.33.3高可用集群》

总结:整理不易,如果对你有帮助,可否点赞关注一下? 更多详细内容请参考:企业级K8s集群运维实战 一、部署背景 由于业务系统的特殊性,我们需要针对不同的客户环境部署基于containerd容器版 K8S 1.33.3集群&a…

Linux抓包命令tcpdump详解笔记

文章目录一、tcpdump 是什么?二、基本语法三、常用参数说明四、抓包示例(通俗易懂)1. 抓所有数据包(默认 eth0)2. 指定接口抓包3. 抓取端口 80 的数据包(即 HTTP 请求)4. 抓取访问某个 IP 的数据…

抖音、快手、视频号等多平台视频解析下载 + 磁力嗅探下载、视频加工(提取音频 / 压缩等)

跟你们说个安卓上的下载工具,还挺厉害的。它能支持好多种下载方式,具体多少种我没细数,反正挺全乎的。​ 平时用得最多的就是视频解析,像抖音、快手、B 站上那些视频,想存下来直接用它就行,连海外视频的也能…

【iOS】JSONModel源码学习

JSONModel源码学习前言JSONModel的使用最基础的使用转换属性名称自定义错误模型嵌套JSONModel的继承源码实现initWithDictionaryinit__doesDictionaryimportDictionary优点前言 之前了解过JSONModel的一些使用方法等,但是对于底层实现并不清楚了解,今天…

SmartMediaKit 模块化音视频框架实战指南:场景链路 + 能力矩阵全解析

✳️ 引言:从“内核能力”到“模块体系”的演进 自 2015 年起,大牛直播SDK(SmartMediaKit)便致力于打造一个可深度嵌入、跨平台兼容、模块自由组合的实时音视频基础能力框架。经过多轮技术迭代与场景打磨,该 SDK 已覆…

【第5话:相机模型1】针孔相机、鱼眼相机模型的介绍及其在自动驾驶中的作用及使用方法

相机模型介绍及相机模型在自动驾驶中的作用及使用方法 相机模型是计算机视觉中的核心概念,用于描述真实世界中的点如何投影到图像平面上。在自动驾驶系统中,相机模型用于环境感知,如物体检测和场景理解。下面我将详细介绍针孔相机模型和鱼眼相…

推荐一款优质的开源博客与内容管理系统

Halo是一款由Java Spring Boot打造的开源博客与内容管理系统(CMS),在 GitHub上拥有超过36K Start的活跃开发者社区。它使用GPL‑3.0授权开源,稳定性与可维护性极高。 Halo的设计简洁、注重性能,同时保持高度灵活性&a…

【GPT入门】第43课 使用LlamaFactory微调Llama3

【GPT入门】第43课 使用LlamaFactory微调Llama31.环境准备2. 下载基座模型3.LLaMA-Factory部署与启动4. 重新训练![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/e7aa869f8e2c4951a0983f0918e1b638.png)1.环境准备 采购autodl服务器,24G,GPU,型号3090&am…

计算机网络:如何理解目的网络不再是一个完整的分类网络

这一理解主要源于无分类域间路由(CIDR)技术的广泛应用,它打破了传统的基于类的IP地址分配方式。具体可从以下方面理解: 传统分类网络的局限性:在早期互联网中,IP地址被分为A、B、C等固定类别,每…

小米开源大模型 MiDashengLM-7B:不仅是“听懂”,更能“理解”声音

目录 前言 一、一枚“重磅炸弹”:开源,意味着一扇大门的敞开 二、揭秘MiDashengLM-7B:它究竟“神”在哪里? 2.1 “超级耳朵” 与 “智慧大脑” 的协作 2.2 突破:从 “听见文字” 到 “理解世界” 2.3 创新训练&a…

mysql出现大量redolog、undolog排查以及解决方案

排查步骤 监控日志增长情况 -- 查看InnoDB状态 SHOW ENGINE INNODB STATUS;-- 查看redo log配置和使用情况 SHOW VARIABLES LIKE innodb_log_file%; SHOW VARIABLES LIKE innodb_log_buffer_size;-- 查看undo log信息 SHOW VARIABLES LIKE innodb_undo%;检查长时间运行的事务 -…