《Dual Prompt Personalized Federated Learning in Foundation Models》——论文阅读

面向大规模预训练模型(ViT、BERT)的千万级设备场景,用“双提示(Dual Prompt)”机制实现高效、可扩展的个性化联邦学习(PFL)

1.研究背景

传统联邦学习在客户端数据异构(非独立同分布)场景下表现不佳,全局模型难以适配各客户端的独特数据分布。PFL 旨在为每个客户端生成个性化模型,但现有方法存在局限:当客户端本地数据有限时,模型训练不充分;基础模型(如 CLIP)虽具备强特征提取能力,但在联邦学习中应用较少,且缺乏动态集成新客户端的机制。

2.本文方法

提出了DP^2FL框架。其核心是通过 “双提示设计”“自适应聚合策略”,结合全局任务信息与客户端本地数据特征,同时支持新数据源推理和新客户端无缝集成。

  1. 双提示结构
    • 任务提示:捕获联邦学习的全局任务信息(如跨客户端的共性语义知识),由所有客户端共享,通过服务器聚合更新。
    数据提示:每个客户端独有,用于建模本地数据分布的独特特征,通过客户端本地聚合更新。保存每个客户端特有的数据特征。

  2. 全局模型自适应

        构建一个全局模型,通过聚合所有客户端的数据提示生成 “全局数据提示”,与全局任务提示共同组成全局模型。该模型支持:

  • 对未参与训练的新数据源直接推理;
  • 新客户端加入时无需从头训练,可基于全局模型快速初始化并适配本地数据。

传统 PFL 是“模型切块训练”,DualPrompt-PFL 是“冻结大模型 + 极轻提示微调”,在参数量、通信量、本地算力需求上均下降 1–3 个数量级,且天然适配大模型与跨设备场景。

3.步骤

① 服务器定义模型架构、训练轮次等参数,初始化全局任务提示和全局数据提示

②各客户端上传少量验证数据集,服务器计算初始损失,用于指导后续聚合。

③本地训练:客户端基于本地数据微调任务提示和数据提示,通过损失函数优化参数。客户端上传本地数据提示和全局任务提示之间的距离。

④全局聚合:中央服务器基于各客户端在所有验证集上的损失,计算权重并聚合任务提示和全局数据提示

⑥加入新客户端:新客户端上传验证集,服务器分发最新全局模型用于初始化。新客户端仅需少量本地训练即可适配自身数据,同时其贡献被其他客户端整合,实现无缝融入。

模型不动,服务器下发任务提示,客户端上传数据提示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/94398.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/94398.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度剖析Lua Table的运作方式

前言&#xff1a;本篇基于Lua-5.3.6源码并配合《Lua 解释器构建&#xff1a;从虚拟机到编译器》一书进行Table的运作解读。一、Table数据结构typedef struct Table {CommonHeader;lu_byte flags; /* 1<<p means tagmethod(p) is not present */lu_byte lsizenode; /* l…

PETR/PETRv2

PE: position embedding 一、PETR算法动机回归 1.1 DETR 输入组成&#xff1a;包含2D位置编码和Object Query 核心流程&#xff1a;通过Object Query直接索引2D特征图&#xff0c;结合位置编码迭代更新Query 特点&#xff1a;整体流程简洁&#xff0c;每个Query代表一个潜在目标…

计算机大数据毕业设计推荐:基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】

精彩专栏推荐订阅&#xff1a;在下方主页&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f496;&#x1f525;作者主页&#xff1a;计算机毕设木哥&#x1f525; &#x1f496; 文章目录 一、项目介绍二、…

英伟达显卡GPU驱动的本质

我们来深入、详细地探讨一下英伟达&#xff08;NVIDIA&#xff09;GPU驱动程序的本质。 普通用户眼中的驱动程序可能只是一个“让显卡工作的软件”&#xff0c;但它的本质远比这复杂和深刻。我们可以从几个层面来理解它。 核心比喻&#xff1a;翻译官、指挥官与优化大师 如果说…

算法 ---哈希表

一、哈希介绍 是什么 存储数据的容器 什么用 快速查找某个元素 什么时候用哈希表 频繁的查找某一个数的时候 怎么用哈希表 &#xff08;1&#xff09;容器&#xff08;哈希表&#xff09; &#xff08;2&#xff09;用数组模拟哈希表&#xff08;字符串的字符&#xf…

基于分布式环境的令牌桶与漏桶限流算法对比与实践指南

基于分布式环境的令牌桶与漏桶限流算法对比与实践指南 在高并发的分布式系统中&#xff0c;限流是保障服务可用性和稳定性的核心手段。本文聚焦于令牌桶算法与漏桶算法在分布式环境下的实现与优化&#xff0c;对多种解决方案进行横向对比&#xff0c;分析各自的优缺点&#xff…

WPF MVVM入门系列教程(TabControl绑定到列表并单独指定每一页内容)

在以前的开发过程中&#xff0c;对于TabControl控件&#xff0c;我一般是习惯直接定义TabItem&#xff0c;在TabItem下布局&#xff0c;并进行绑定。 类似这样 1 <TabControl ItemsSource"{Binding TabList}" SelectedIndex"0">2 <TabItem…

L2CAP 面向连接信道(CoC)在 BLE 中的应用:建立、流控与数据传输

在物联网(IoT)蓬勃发展的今天,低功耗蓝牙(BLE)技术因其高效节能、低成本等特性,成为短距离无线通信的首选方案。作为 BLE 协议栈的核心组件,逻辑链路控制与适配协议(L2CAP)的面向连接信道(CoC)承担着数据传输的关键任务。本文将深入解析 L2CAP CoC 在 BLE 中的应用,…

医疗AI与医院数据仓库的智能化升级:异构采集、精准评估与高效交互的融合方向(上)

摘要: 随着医疗信息化建设的深入,医院数据仓库(Data Warehouse, DW)作为医疗AI应用的核心数据底座,其效能直接决定智能化转型的深度与广度。本文聚焦医疗AI驱动下医院数据仓库的三大关键升级功能——异构采集支持数据库体检与智能SQL分析、评估引擎重构实现六大数据库精准…

2015-2018年咸海流域1km归一化植被指数8天合成数据集

数据集摘要数据集包含2015年-2018年咸海流域NDVI 8天均值数据。提取美国国家航空航天局中分辨率成像光谱仪MOD13A2产品第一波段作为归一化植被指数数据&#xff0c;乘以比例因子0.0001&#xff0c;叠加咸海流域边界数据&#xff0c;裁切后得到咸海流域范围内的NDVI月均值数据。…

Kafka消息持久化机制全解析:存储原理与实战场景

目录 引言​ 一、Kafka消息持久化的核心目标 二、底层存储机制深度剖析 1.【文件系统分层】——日志分组 日志段 核心结构 示例目录结构 2.【消息写入流程】——从内存到磁盘的旅程✈️ 3.【默认存储参数】——生产环境的黄金比例 三、典型应用场景与案例实战 案例1…

Python训练营打卡Day41-Grad-CAM与Hook函数

知识点回顾回调函数lambda函数hook函数的模块钩子和张量钩子Grad-CAM的示例 作业&#xff1a;理解下今天的代码即可 在深度学习中&#xff0c;我们经常需要查看或修改模型中间层的输出或梯度。然而&#xff0c;标准的前向传播和反向传播过程通常是一个黑盒&#xff0c;我们很难…

使用VBA宏批量修改Word中表格题注格式

目录&#x1f4c2; 使用步骤✅ 方式一&#xff1a;应用已有样式&#xff08;推荐&#xff09;代码实现说明✅ 方式二&#xff1a;手动设置字体格式&#xff08;无需预定义样式&#xff09;代码实现参数说明如何运行宏&#xff1f;补充建议总结在撰写论文、技术文档或报告时&…

Redis面试精讲 Day 27:Redis 7.0/8.0新特性深度解析

【Redis面试精讲 Day 27】Redis 7.0/8.0新特性深度解析 在“Redis面试精讲”系列的第27天&#xff0c;我们将聚焦Redis最新版本——7.0与8.0的核心新特性。随着Redis从内存数据库向云原生、高可用、高性能中间件持续演进&#xff0c;7.0和8.0版本引入了多项颠覆性改进&#xf…

使用自制的NTC测量模块测试Plecs的热仿真效果

之前构建的 NTC 温度测量模型是进行 PLECS 热仿真的完美起点和核心组成部分。 PLECS 的强大之处在于它能够进行多域仿真,特别是电-热联合仿真。您可以将电路仿真(包括您的 NTC 测量模型)与热仿真(散热器、热容、热阻等)无缝地结合起来。 电-热联合仿真原理 整个仿真闭环…

C语言初学者笔记【动态内存管理】

、 文章目录一、为什么需要动态内存分配&#xff1f;二、malloc 和 free1. malloc2. free三、calloc 和 realloc1. calloc2. realloc四、常见的动态内存错误1. 对 NULL 解引用2. 越界访问3. 对非动态内存使用 free4. 释放部分动态内存5. 多次释放同一块内存6. 内存泄漏五、动态…

AI模型部署 - 大语言模型(LLM)部署技术与框架

目录 一、 大语言模型部署的核心挑战与关键技术 二、 主流开源部署框架深度解析 2.1. Ollama:本地部署的极简主义者 2.2. Hugging Face TGI (Text Generation Inference) 2.3. vLLM:为吞吐量而生 2.4. sglang:面向复杂提示与结构化输出的革新者 三、 特定硬件与云平台…

Windows11 GeForce GTX 1060 CUDA+CUDNN+Pytorch 下载及安装

一、查看显卡型号信息 系统&#xff1a;Windows11 显卡&#xff1a;GeForce GTX 1060 型号&#xff1a; &#xff08;1&#xff09;搜索 NVIDIA&#xff0c;选择 NVIDIA Control Panel&#xff08;2&#xff09;打开 NVIDIA control Panel&#xff0c;打开系统信息&#xff0c;…

在通义灵码中配置MCP服务

目录 查找mcp列表 通义灵码中配置MCP 使用方式 STDIO (Standard Input/Output) 组成部分&#xff1a; SSE (Server-Sent Events) 特点&#xff1a; 主要区别对比 配置方式 配置优先级 个人设置 项目设置 验证 通过MCP调用高德地图 查找mcp列表 打开ModelScope - …

网络中的IO问题(五种常见的IO方式)

什么是高效的IO&#xff1f; 正常情况下&#xff0c;IO等拷贝 高效的IO拷贝&#xff08;即让IO尽量不等&#xff09; 为什么我们平常玩电脑的时候&#xff0c;感觉不到等待的过程呢&#xff1f; 任何通信场景&#xff0c;IO通信场景&#xff0c;效率一定是有上限的. 花盆里&am…