【大模型水印论文阅读2】前缀文本编码、均匀性约束

@TOC


请添加图片描述

🌈你好呀!我是 是Yu欸
🚀 感谢你的陪伴与支持~ 欢迎添加文末好友
🌌 在所有感兴趣的领域扩展知识,不定期掉落福利资讯(*^▽^*)

写在最前面

版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。

第一个问题关于语义编码过程,第二个关于水印logits的数学约束。

关于前缀文本编码,需要强调三个关键点:
首先是均匀性约束——随着生成过程不断增长;
其次是BERT的编码方式,这里论文用的是[CLS]向量作为全局表示;
最后是固定长度的必要性,否则无法输入后续网络。

用户可能混淆了token嵌入和文本嵌入的区别,需要明确这是句子级表示。

至于均匀性约束,对“均值为0”的实际作用存在疑惑。
这里要区分两个层面:
数学上是通过损失函数强制实现的(公式5),工程上是为了防止统计攻击。
可以类比密码学中的均匀分布要求,比如如果某些token总是获得正logits,攻击者只需提高这些token出现频率就能破坏水印。
论文附录D提到的γ参数调整其实是个很好的延伸案例。

更直观的例子说明,比如当输入“The cat sat”和“A feline perched”时,虽然token完全不同,但BERT输出的768维向量余弦相似度可能达0.92,因此水印logits也相似。而均值为0的特性可以想象成对所有token“雨露均沾”,不会让某些token总是受益。


1. 前缀文本的语义编码:e_i = E(t_{:i-1})

含义
  • t_{:i-1}:生成第 i 个token时,模型已生成的全部前序文本(token序列)。
    例如:生成句子的第5个词时,t_{:4} = ["The", "cat", "sat", "on"]

  • E:预训练的语义编码模型(如BERT),将变长文本映射为固定维度的语义向量
    例:输入 "The cat sat on" → 输出768维向量 e_i

    BERT取[CLS]标记或平均池化输出作为文本表示

关键特性
  • 语义抽象
    向量 e_i 捕捉前序文本的整体语义而非表面形式。
    例:["The", "cat", "sat"]["A", "feline", "perched"] 的嵌入向量余弦相似度≈0.9
  • 长度无关
    无论前序文本多长,输出固定维度向量(如768维)。
  • 位置不变
    同义改写或语序调整不会显著改变 e_i(语义空间连续性)。

2. 均匀性约束:水印logits均值为0

含义
  • 水印logits:模型为每个token生成的水印偏移分数 P_W ∈ R^{|V|}|V|=词表大小)
    例:P_W = [0.3, -1.2, 0.8, ...](每个值对应词表中一个token的偏移)
  • 约束要求
    \frac{1}{|V|}\sum_{j=1}^{|V|} P_W^{(j)} = 0
    
    即:所有token的水印偏移分数总和为0(正负抵消)。
为何需要此约束?
  • 消除统计偏差
    • 若无约束 → 某些token总是获得正偏移(如常见词"the")
    • 结果:这些token在生成文本中频率异常高 → 攻击者可通过词频分析破解水印(如图)
      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
      KGW-1的绿名单词频明显高于普通文本
  • 保障生成质量
    均值为0确保水印不系统性偏向某些token,避免文本失真(如重复出现特定词)。
实现方式

通过损失函数强制约束(论文公式5):

\mathcal{L}_n = \underbrace{\sum_{i}|\sum_{j}P_W^{(j)}|}_{\text{行和=0}} + \underbrace{\sum_{i}|\sum_{j}P_W^{(j)}|}_{\text{列和=0}} + \lambda_1\sum_{i}\sum_{j}|R - |P_W^{(j)}|| 
  • 前两项:约束每行(每个位置)和每列(每个token)的偏移均值为0
  • 第三项:使偏移绝对值接近 R(控制强度)
效果示例
约束情况水印logits示例问题
无约束["the": +0.8, "a": +0.6, "cat": -1.4]“the”/"a"频率虚高,易被检测
均匀约束["the": +1.2, "a": -0.3, "cat": -0.9]各token偏移正负平衡,无统计异常

总结:两个设计的关联性

  1. 语义向量 e_i → 将离散token序列映射到连续语义空间,解决改写鲁棒性问题。
  2. logits均值为0 → 在语义空间中均匀扰动所有token,解决安全漏洞问题。

二者共同实现核心目标:水印强度与文本语义绑定,而非表面形式绑定


hello,我是 是Yu欸 。如果你喜欢我的文章,欢迎三连给我鼓励和支持:👍点赞 📁 关注 💬评论,我会给大家带来更多有用有趣的文章。
原文链接 👉 ,⚡️更新更及时。

欢迎大家点开下面名片,添加好友交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86575.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86575.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

破茧时刻,与光同行

凌晨五点的闹钟刺破薄雾,我摸黑打开台灯。摊开的数学错题本上,函数图像在暖黄的光晕里舒展,像等待破译的密码。这样的清晨已持续三百多个日夜,我知道,在无数个相似的时刻里,总有千万盏台灯在黑暗中次第亮起…

Learning PostgresSQL读书笔记: 第8章 Triggers and Rules

本章将讨论以下内容: • 探索 PostgreSQL 中的规则 • 管理 PostgreSQL 中的触发器 • 事件触发器 探索 PostgreSQL 中的规则 文档中的这段话阐述了rule和trigger的区别: PostgreSQL 规则系统允许定义在数据库表中插入、更新或删除时执行的替代操作。粗…

信创国产化替代中的开发语言选择分析

在信息技术应用创新(信创)国产化替代过程中,选择合适的开发语言至关重要。以下是适合信创环境的开发语言及其优势分析: 主流适合信创的编程语言 1. Java 优势:跨平台特性(JVM)、丰富的生态体系、企业级应用成熟 信创适配:国内有…

Android 中 函数实现多个返回值的几种方式

在编程中,函数通常只能返回一个值。但通过使用对象封装、Pair、Triple、数组、列表或 Bundle 方式,可以轻松地返回多个值。 1、对象封装方式 创建数据类来封装需要返回的多个值。 data class Result(val code: Int, val message: String)fun getMultiV…

Leetcode百题斩-DP

又到了最好玩的dp了,各种玄学转移也算是其乐无穷。前段时间刚做的LCA正是这种题的小试牛刀,如果当时就把这个专题刷完了,或许我现在已经从西溪园区跑到云谷园区了。 不过,恐怖如斯的dp专题居然只给了一道hard,基本也没…

策略模式与工厂模式的黄金组合:从设计到实战

策略模式和工厂模式是软件开发中最常用的两种设计模式,当它们结合使用时,能产生11>2的效果。本文将通过实际案例,阐述这两种模式的协同应用,让代码架构更优雅、可维护性更强。 一、为什么需要组合使用? 单独使用的…

SAP PP模块与MM模块作用详解

SAP PP模块与MM模块作用详解 一、PP模块(Production Planning)—— 生产计划与执行中枢 核心作用:将销售需求转化为可执行的生产指令,管控从计划到完工的全过程。 关键功能 功能说明业务价值主数据管理维护BOM(物料…

Linux tcp_info:监控TCP连接的秘密武器

深入解析 Linux tcp_info:TCP 状态的实时监控利器 在开发和运维网络服务时,我们常常遇到这些问题: 我的 TCP 连接为什么速度慢?是发生了重传,还是窗口太小?拥塞控制到底有没有生效? 这些问题…

CVE-2015-5531源码分析与漏洞复现(Elasticsearch目录遍历漏洞)

概述 漏洞名称:Elasticsearch 快照API目录遍历漏洞 CVE 编号:CVE-2015-5531 CVSS 评分:7.5 影响版本: Elasticsearch 1.0.0–1.6.0(1.5.1及以前版本无需配置即可触发;1.5.2–1.6.0需配置path.repo&#xf…

HexHub开发运维利器Database, Docker, SSH, SFTP

支持隧道,SFTP,X11转发,跳板机,分屏广播输入,LRZSZ,TRZSZ,SCP 分屏广播输入 管理多台服务器,更快一步 支持多种文件传输协议 支持跨服务器文件传输,使用复制粘贴即可进…

2025年教育、心理健康与信息管理国际会议(EMHIM 2025)

2025 2nd International Conference on Education, Mental Health, and Information Management 一、大会信息 会议简称:EMHIM 2025 大会地点:中国三亚 收录检索:提交Ei Compendex,CPCI,CNKI,Google Scholar等 二、会议简介 第二届教…

数字孪生技术为UI前端注入新活力:实现智能化交互新体验

hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 在数字化转型的深水区,数字孪生技术正以破竹之势重构 UI 前端的技术逻辑与交互范式…

组件协作模式

目录 “组件协作”模式模板方法模式动机模式定义结构要点总结 “组件协作”模式 现代软件专业分工之后的第一个结果是“框架与应用程序的划分”。“组件协作”模式通过晚期绑定,实现框架与应用程序之间的松耦合,是二者之间协作时常用的模式。典型模式&a…

Docker 运行RAGFlow 搭建RAG知识库

借鉴视频:DeepSeek 10分钟完全本地部署 保姆级教程 断网运行 无惧隐私威胁 大语言模型 CPU GPU 混合推理32B轻松本地部署!DeepSeek模拟王者!!_哔哩哔哩_bilibili 借鉴博客:RAGFlow搭建全攻略:从入门到精通…

python编写脚本每月1号和15号执行一次将TRX是否强更发送到钉钉

编写脚本 import requests import json import time import hmac import hashlib import base64 import urllib.parse# 1. 配置钉钉机器人 webhook "https://oapi.dingtalk.com/robot/send?access_tokenXXXXXX" secret "XXXXXXXX" # 如果没有加签验…

Linux-系统管理

[rootlocalhost ~]# lscpu //查看cpu [rootlocalhost etc]# cat /etc/redhat-release //查看当前目录的版本信息 [rootlocalhost ~]# ifconfig //查看当前激活的网卡信息 [rootlocalhost ~]# ifconfig ens33 192.168.1.10 //给网卡配置临时地址 [rootlocalhost ~]# hostnam…

【Spring】系统化的 Spring Boot 全栈学习教程,涵盖基础配置、核心功能、进阶实战及文档自动生成

这里写目录标题 🛠️ **一、环境搭建与项目创建**1. 开发环境准备2. 创建第一个项目(Spring Initializr) 🚀 **二、核心功能开发**1. RESTful API 开发2. 数据持久化(Spring Data JPA)3. 配置文件多环境切换…

Discrete Audio Tokens: More Than a Survey

文章目录 模型设计的考虑量化的方式:比特率:Fixed vs. Adaptive Bitrate码本内容设计的考虑Streamability. 模型评估Reconstruction Evaluation and Complexity Analysis.识别和生成任务(SE, SR)Acoustic Language Modeling.Music Generation…

设计在线教育项目核心数据库表

1 在线教育项目核心数据库表设计-ER图 简介:设计在线教育的核心库表结构 在线教育站点速览 xdclass.net ER图知识回顾: 实体对象:矩形属性:椭圆关系:菱形 核心库表 videochapterepisodeuservideo_ordervideo_banner…

【音视频】Ubuntu下配置ffmpeg库

一、下载预编译的库 在github上可以找到编译好的ffmpeg,多个版本的都有,这里我下载ffmpeg编译好的动态库 仓库链接:(https://github.com/BtbN/FFmpeg-Builds/releases 下载后解压得到 二、配置环境变量 打开.bashrc配置文件,添…