《Dual Prompt Personalized Federated Learning in Foundation Models》——论文阅读

《Dual Prompt Personalized Federated Learning in Foundation Models》——论文阅读

bicheng/2025/8/24 23:57:07/文章来源:https://blog.csdn.net/2301_77039628/article/details/150528463

面向大规模预训练模型（ViT、BERT）的千万级设备场景，用“双提示（Dual Prompt）”机制实现高效、可扩展的个性化联邦学习（PFL）

1.研究背景

传统联邦学习在客户端数据异构（非独立同分布）场景下表现不佳，全局模型难以适配各客户端的独特数据分布。PFL 旨在为每个客户端生成个性化模型，但现有方法存在局限：当客户端本地数据有限时，模型训练不充分；基础模型（如 CLIP）虽具备强特征提取能力，但在联邦学习中应用较少，且缺乏动态集成新客户端的机制。

2.本文方法

提出了DP^2FL框架。其核心是通过 “双提示设计” 和 “自适应聚合策略”，结合全局任务信息与客户端本地数据特征，同时支持新数据源推理和新客户端无缝集成。

双提示结构
• 任务提示：捕获联邦学习的全局任务信息（如跨客户端的共性语义知识），由所有客户端共享，通过服务器聚合更新。
• 数据提示：每个客户端独有，用于建模本地数据分布的独特特征，通过客户端本地聚合更新。保存每个客户端特有的数据特征。
全局模型自适应

构建一个全局模型，通过聚合所有客户端的数据提示生成 “全局数据提示”，与全局任务提示共同组成全局模型。该模型支持：

对未参与训练的新数据源直接推理；
新客户端加入时无需从头训练，可基于全局模型快速初始化并适配本地数据。

传统 PFL 是“模型切块训练”，DualPrompt-PFL 是“冻结大模型 + 极轻提示微调”，在参数量、通信量、本地算力需求上均下降 1–3 个数量级，且天然适配大模型与跨设备场景。

3.步骤

① 服务器定义模型架构、训练轮次等参数，初始化全局任务提示和全局数据提示

②各客户端上传少量验证数据集，服务器计算初始损失，用于指导后续聚合。

③本地训练：客户端基于本地数据微调任务提示和数据提示，通过损失函数优化参数。客户端上传本地数据提示和全局任务提示之间的距离。

④全局聚合：中央服务器基于各客户端在所有验证集上的损失，计算权重并聚合任务提示和全局数据提示

⑥加入新客户端：新客户端上传验证集，服务器分发最新全局模型用于初始化。新客户端仅需少量本地训练即可适配自身数据，同时其贡献被其他客户端整合，实现无缝融入。

模型不动，服务器下发任务提示，客户端上传数据提示。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/bicheng/94398.shtml
繁体地址，请注明出处：http://hk.pswp.cn/bicheng/94398.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

深度剖析Lua Table的运作方式

深度剖析Lua Table的运作方式

前言：本篇基于Lua-5.3.6源码并配合《Lua 解释器构建：从虚拟机到编译器》一书进行Table的运作解读。一、Table数据结构typedef struct Table {CommonHeader;lu_byte flags; /* 1<<p means tagmethod(p) is not present */lu_byte lsizenode; /* l…

阅读更多...

PETR/PETRv2

PETR/PETRv2

PE: position embedding 一、PETR算法动机回归 1.1 DETR 输入组成：包含2D位置编码和Object Query 核心流程：通过Object Query直接索引2D特征图，结合位置编码迭代更新Query 特点：整体流程简洁，每个Query代表一个潜在目标…

阅读更多...

计算机大数据毕业设计推荐：基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】

计算机大数据毕业设计推荐：基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】

精彩专栏推荐订阅：在下方主页👇🏻👇🏻👇🏻👇🏻 💖🔥作者主页：计算机毕设木哥🔥 💖 文章目录一、项目介绍二、…

阅读更多...

英伟达显卡GPU驱动的本质

英伟达显卡GPU驱动的本质

我们来深入、详细地探讨一下英伟达（NVIDIA）GPU驱动程序的本质。普通用户眼中的驱动程序可能只是一个“让显卡工作的软件”，但它的本质远比这复杂和深刻。我们可以从几个层面来理解它。核心比喻：翻译官、指挥官与优化大师如果说…

阅读更多...

算法 ---哈希表

算法 ---哈希表

一、哈希介绍是什么存储数据的容器什么用快速查找某个元素什么时候用哈希表频繁的查找某一个数的时候怎么用哈希表 （1）容器（哈希表） （2）用数组模拟哈希表（字符串的字符&#xf…

阅读更多...

基于分布式环境的令牌桶与漏桶限流算法对比与实践指南

基于分布式环境的令牌桶与漏桶限流算法对比与实践指南

基于分布式环境的令牌桶与漏桶限流算法对比与实践指南在高并发的分布式系统中，限流是保障服务可用性和稳定性的核心手段。本文聚焦于令牌桶算法与漏桶算法在分布式环境下的实现与优化，对多种解决方案进行横向对比，分析各自的优缺点&#xff…

阅读更多...

WPF MVVM入门系列教程（TabControl绑定到列表并单独指定每一页内容）

WPF MVVM入门系列教程（TabControl绑定到列表并单独指定每一页内容）

在以前的开发过程中，对于TabControl控件，我一般是习惯直接定义TabItem，在TabItem下布局，并进行绑定。类似这样 1 <TabControl ItemsSource"{Binding TabList}" SelectedIndex"0">2 <TabItem…

阅读更多...

L2CAP 面向连接信道（CoC）在 BLE 中的应用：建立、流控与数据传输

L2CAP 面向连接信道（CoC）在 BLE 中的应用：建立、流控与数据传输

在物联网（IoT）蓬勃发展的今天，低功耗蓝牙（BLE）技术因其高效节能、低成本等特性，成为短距离无线通信的首选方案。作为 BLE 协议栈的核心组件，逻辑链路控制与适配协议（L2CAP）的面向连接信道（CoC）承担着数据传输的关键任务。本文将深入解析 L2CAP CoC 在 BLE 中的应用，…

阅读更多...

医疗AI与医院数据仓库的智能化升级：异构采集、精准评估与高效交互的融合方向(上)

医疗AI与医院数据仓库的智能化升级：异构采集、精准评估与高效交互的融合方向(上)

摘要：随着医疗信息化建设的深入，医院数据仓库（Data Warehouse, DW）作为医疗AI应用的核心数据底座，其效能直接决定智能化转型的深度与广度。本文聚焦医疗AI驱动下医院数据仓库的三大关键升级功能——异构采集支持数据库体检与智能SQL分析、评估引擎重构实现六大数据库精准…

阅读更多...

2015-2018年咸海流域1km归一化植被指数8天合成数据集

2015-2018年咸海流域1km归一化植被指数8天合成数据集

数据集摘要数据集包含2015年-2018年咸海流域NDVI 8天均值数据。提取美国国家航空航天局中分辨率成像光谱仪MOD13A2产品第一波段作为归一化植被指数数据，乘以比例因子0.0001，叠加咸海流域边界数据，裁切后得到咸海流域范围内的NDVI月均值数据。…

阅读更多...

Kafka消息持久化机制全解析：存储原理与实战场景

Kafka消息持久化机制全解析：存储原理与实战场景

目录引言一、Kafka消息持久化的核心目标二、底层存储机制深度剖析 1.【文件系统分层】——日志分组日志段核心结构示例目录结构 2.【消息写入流程】——从内存到磁盘的旅程✈️ 3.【默认存储参数】——生产环境的黄金比例三、典型应用场景与案例实战案例1…

阅读更多...

Python训练营打卡Day41-Grad-CAM与Hook函数

Python训练营打卡Day41-Grad-CAM与Hook函数

知识点回顾回调函数lambda函数hook函数的模块钩子和张量钩子Grad-CAM的示例作业：理解下今天的代码即可在深度学习中，我们经常需要查看或修改模型中间层的输出或梯度。然而，标准的前向传播和反向传播过程通常是一个黑盒，我们很难…

阅读更多...

使用VBA宏批量修改Word中表格题注格式

使用VBA宏批量修改Word中表格题注格式

目录📂 使用步骤✅ 方式一：应用已有样式（推荐）代码实现说明✅ 方式二：手动设置字体格式（无需预定义样式）代码实现参数说明如何运行宏？补充建议总结在撰写论文、技术文档或报告时&…

阅读更多...

Redis面试精讲 Day 27：Redis 7.0/8.0新特性深度解析

Redis面试精讲 Day 27：Redis 7.0/8.0新特性深度解析

【Redis面试精讲 Day 27】Redis 7.0/8.0新特性深度解析在“Redis面试精讲”系列的第27天，我们将聚焦Redis最新版本——7.0与8.0的核心新特性。随着Redis从内存数据库向云原生、高可用、高性能中间件持续演进，7.0和8.0版本引入了多项颠覆性改进&#xf…

阅读更多...

使用自制的NTC测量模块测试Plecs的热仿真效果

使用自制的NTC测量模块测试Plecs的热仿真效果

之前构建的 NTC 温度测量模型是进行 PLECS 热仿真的完美起点和核心组成部分。 PLECS 的强大之处在于它能够进行多域仿真，特别是电-热联合仿真。您可以将电路仿真（包括您的 NTC 测量模型）与热仿真（散热器、热容、热阻等）无缝地结合起来。电-热联合仿真原理整个仿真闭环…

阅读更多...

C语言初学者笔记【动态内存管理】

C语言初学者笔记【动态内存管理】

、文章目录一、为什么需要动态内存分配？二、malloc 和 free1. malloc2. free三、calloc 和 realloc1. calloc2. realloc四、常见的动态内存错误1. 对 NULL 解引用2. 越界访问3. 对非动态内存使用 free4. 释放部分动态内存5. 多次释放同一块内存6. 内存泄漏五、动态…

阅读更多...

AI模型部署 - 大语言模型（LLM）部署技术与框架

AI模型部署 - 大语言模型（LLM）部署技术与框架

目录一、大语言模型部署的核心挑战与关键技术二、主流开源部署框架深度解析 2.1. Ollama：本地部署的极简主义者 2.2. Hugging Face TGI (Text Generation Inference) 2.3. vLLM：为吞吐量而生 2.4. sglang：面向复杂提示与结构化输出的革新者三、特定硬件与云平台…

阅读更多...

Windows11 GeForce GTX 1060 CUDA+CUDNN+Pytorch 下载及安装

Windows11 GeForce GTX 1060 CUDA+CUDNN+Pytorch 下载及安装

一、查看显卡型号信息系统：Windows11 显卡：GeForce GTX 1060 型号： （1）搜索 NVIDIA，选择 NVIDIA Control Panel（2）打开 NVIDIA control Panel，打开系统信息，…

阅读更多...

在通义灵码中配置MCP服务

在通义灵码中配置MCP服务

目录查找mcp列表通义灵码中配置MCP 使用方式 STDIO (Standard Input/Output) 组成部分： SSE (Server-Sent Events) 特点： 主要区别对比配置方式配置优先级个人设置项目设置验证通过MCP调用高德地图查找mcp列表打开ModelScope - …

阅读更多...

网络中的IO问题（五种常见的IO方式）

网络中的IO问题（五种常见的IO方式）

什么是高效的IO？ 正常情况下，IO等拷贝高效的IO拷贝（即让IO尽量不等） 为什么我们平常玩电脑的时候，感觉不到等待的过程呢？ 任何通信场景，IO通信场景，效率一定是有上限的. 花盆里&am…

阅读更多...

最新文章