RCL 2025 | LLM采样机制的新视角:来自处方性偏移的解释

1. 导读

大型语言模型(Large Language Models, LLMs)在自主决策场景中的应用日益广泛,它们需要在庞大的行动空间中进行响应采样(response sampling)。然而,驱动这一采样过程的启发式机制仍缺乏深入研究。本文系统分析了 LLM 的采样行为,并发现其底层机制与人类决策过程存在相似性——由**描述性成分(descriptive component)规范性成分(prescriptive component)**共同构成。前者反映统计学意义上的常态分布,后者则体现模型内部隐含的“理想值”倾向。

作者通过跨领域(如公共健康、经济趋势)的实证分析发现,LLM 的输出往往会从统计常态向规范性理想值发生一致性的偏移,这种模式与人类在“正常性”判断上的倾向高度一致。进一步的案例研究和与人类实验的对比表明,这种采样偏移可能在现实应用中引发显著的决策偏差,甚至带来伦理风险。例如,在医疗场景中,模型可能会将康复时间的预测向理想状态收敛,从而忽略真实分布的长尾风险。

本文的重要贡献在于提出了一种全新的采样理论框架,将 LLM 的输出生成视为“部分描述性、部分规范性”的混合过程。这不仅有助于理解模型的行为机制,也为评估与优化 LLM 在关键任务中的可靠性和公平性提供了理论基础。
Alt

论文基本信息

  • 论文标题:A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive
  • 作者:Sarath Sivaprasad, Pramod Kaushik, Sahar Abdelnabi, Mario Fritz
  • 作者单位
    1. CISPA Helmholtz Center for Information Security
    2. TCS Research, Pune
    3. Microsoft
  • 发表会议:ACL 2025(Oral)
  • 提交时间:2024年2月16日,v4版本更新于2025年7月9日
  • 论文链接:https://arxiv.org/abs/2402.11005

➔➔➔➔点击查看原文,获取更多大模型相关资料

2. 背景与研究动机

2.1 大型语言模型的响应采样背景

大型语言模型Large Language Models, LLMs)在自主决策文本生成多轮交互等任务中,需要在极为庞大的动作空间中进行概率采样,即根据条件概率分布从候选输出中选取最终响应。尽管近年来在生成质量优化随机性控制以及采样策略(如温度调节Top-kNucleus sampling)等方面取得了显著进展,但驱动这一采样过程的深层机制仍缺乏系统性的理论探讨,导致我们在解释预测模型行为时存在明显局限。

2.2 人类决策中的双重成分类比

认知科学领域,人类决策常常同时受到描述性成分descriptive component)与规范性成分prescriptive component)的驱动:前者反映经验统计意义上的常态,例如疾病的平均康复时间;后者则体现理想化应当达到的目标,例如临床指导中设定的理想康复天数。本文提出,LLMs响应采样时也展现出类似的双重驱动特性——它们不仅复现训练数据统计常态,还会向模型内部隐含的理想原型发生系统性偏移。这种偏移可能源自训练数据分布指令微调目标优化方向,或模型语义空间中形成的概念表示

2.3 现有研究的不足与挑战

当前学界LLM 响应采样的研究主要集中在优化生成多样性准确性,但鲜有工作关注描述性规范性力量在采样过程中的交互机制,也缺乏跨领域的实证研究验证其普适性。这一理论空白导致我们难以预测模型偏移模式,并可能在公共健康经济预测高风险领域引发系统性误判伦理风险

2.4 本文研究动机

鉴于上述不足,本文旨在提出一个能够统一解释 LLM 响应采样描述性规范性成分并存现象理论框架,并通过跨领域实验系统验证其存在影响,以期为模型可靠性公平性提供理论依据实践参考
图 1 :LLM 在概念采样时同时考虑统计常态与理想值,导致采样结果相对真实分布向理想值方向发生系统性偏移。
➔➔➔➔点击查看原文,获取更多大模型相关资料

3. 采样理论建模(Sampling Theory Modeling)

3.1 理论框架概述

本章提出了一个用于刻画 大型语言模型(LLMs) 在生成过程中的 采样机制 的理论模型。研究发现,LLM 在对一个概念 CCC 进行采样时,并不仅仅依据 统计分布Average,记作 A(C)A(C)A(C)),还会受到一种 理想化规范Ideal,记作 I(C)I(C)I(C))的影响。这种理想化规范类似于人类认知中的 处方性规范(Prescriptive Norm),会引导模型输出偏向某个“理想值”。因此,模型实际采样的结果 S(C)S(C)S(C) 往往会偏离真实统计均值,形成系统性的偏移。


3.2 数学建模与公式推导

为了量化这种偏移,作者定义了 采样偏移量 α\alphaα

α(C)=I(C)−A(C)\alpha(C) = I(C) - A(C) α(C)=I(C)A(C)

在实际采样中,LLM 的输出 S(C)S(C)S(C) 可以建模为:

S(C)=A(C)+α^⋅α(C)S(C) = A(C) + \hat{\alpha} \cdot \alpha(C) S(C)=A(C)+α^α(C)

其中,α^\hat{\alpha}α^ 是一个归一化系数,用于衡量采样值相对 统计均值理想值 之间的平衡程度:

  • α^>0\hat{\alpha} > 0α^>0 时,采样值向理想值方向偏移;
  • α^=0\hat{\alpha} = 0α^=0 时,采样值与统计均值一致;
  • α^<0\hat{\alpha} < 0α^<0 时,采样值偏离理想值,向相反方向移动。

3.3 实验图示与结果分析

图 2 展示了三个不同概念下的 **平均值**(绿色 )、**理想值**(蓝色 )与 **采样值**(红色 )之间的关系,以及偏移量  的大小和方向。

可以观察到:

  • 客户服务等待时间:采样值比平均值显著偏小(α=+7.9\alpha = +7.9α=+7.9),说明模型倾向于低估等待时间,更接近理想化的“少等待”状态。
  • 每周锻炼时间:采样值比平均值偏大(α=+2.5\alpha = +2.5α=+2.5),符合人类倾向于“多运动”的理想化认知。
  • 含糖饮料摄入量:采样值显著低于平均值(α=+4.1\alpha = +4.1α=+4.1),反映出模型在健康相关任务中更接近“少喝”的理想化趋势。

这些实验结果验证了公式所描述的 统计分布 + 理想偏移 的采样机制,并揭示了 LLM 在多个现实领域中存在的系统性偏差。

4. 实验验证与结果分析(Experimental Validation and Results)

为了验证第 3 章提出的采样理论模型在实际语言生成中的适用性与稳健性,本章针对多个概念场景开展了系统实验,并结合定量统计与可视化分析,考察了 采样结果 S(C)S(C)S(C)统计均值 A(C)A(C)A(C)理想值 I(C)I(C)I(C) 之间的关系。实验覆盖了不同分布形态与情感极性下的偏移特征,并比较了不同规模与训练方式的 LLM 在处方性成分上的差异。


4.1 采样结果与理想值的相关性

首先,我们在一组具有不同理想值的概念集合上,统计 LLM 的采样结果 S(C)S(C)S(C) 与统计均值 A(C)A(C)A(C) 的关系,并计算其与理想值 I(C)I(C)I(C) 的相关性。如图 3 所示,红色散点表示不同概念的采样值 S(C)S(C)S(C),绿色虚线表示统计均值 A(C)A(C)A(C),横轴为理想值 I(C)I(C)I(C)

可以看出,采样值与理想值之间呈现出高度正相关(皮尔逊相关系数 r=0.94r = 0.94r=0.94),且大多数采样值明显偏离 A(C)A(C)A(C),趋向于 I(C)I(C)I(C) 所在的方向。这一结果与理论模型公式

S(C)=A(C)+α^⋅[I(C)−A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^[I(C)A(C)]

的预测一致,表明 α^\hat{\alpha}α^ 对采样偏移幅度具有显著的调节作用。

图 3 图注:采样结果  与统计均值  及理想值  的关系图。红点为采样值,绿虚线为统计均值,横轴为理想值。采样值整体呈现向理想值方向偏移的趋势。

4.2 分布形态与情感极性的影响

为了进一步分析偏移行为在不同分布形态与情感语境下的稳定性,我们分别构造了 单峰(uni-modal)双峰(bi-modal) 分布条件,并在正向(+ve)、负向(-ve)和中性(control)三类概念上进行测试。表 1 给出了不同条件下的 A(C)A(C)A(C)S(C)S(C)S(C) 对比结果。

结果表明,在正向情感概念中,采样值始终高于统计均值,说明模型倾向于放大正面特征;在负向情感概念中,采样值显著低于统计均值,显示出模型在面对负面情境时存在弱化趋势;而在中性概念中,二者几乎一致,表明偏移主要来源于理想值与均值之间的差异。此外,不同分布形态下的趋势高度一致,说明偏移效应具有较强的稳健性。

表 1 注:不同分布形态与情感极性下的统计均值  与采样值  对比结果。


4.3 不同模型的处方性偏移比较

为了评估不同 LLM 的处方性成分差异,我们对包括 Llama 系列、Claude、Mistral、GPT-4 在内的多个模型进行了统计分析(见表 2)。表中 Fraction 表示在各领域中,采样值向理想值方向偏移的概念比例,Significance 表示该偏移的统计显著性。

结果表明:

  1. 模型规模效应:较大规模的模型(如 Llama-3-70b、GPT-4)在 Fraction 指标上普遍更高,意味着更强的理想值驱动。
  2. 训练方式效应:采用 RLHF(Reinforcement Learning from Human Feedback)训练的模型,其处方性偏移程度显著高于仅进行预训练的模型。
  3. 跨模型一致性:无论架构与训练数据如何,几乎所有模型都表现出一致的向理想值偏移的趋势,验证了采样理论的普适性。

表 2 注:不同 LLM 在处方性偏移(Fraction 和 Significance)上的比较。

4.4 原型分数与理想值的关系(Prototype Scores and Their Relation to Ideal Values)

为了进一步探讨 处方性规范(Prescriptive Norms) 对大型语言模型(LLMs)生成行为的长期影响,本节引入 原型分数(Prototype Score,记作 P(C)P(C)P(C))的分析。与单次采样结果 S(C)S(C)S(C) 不同,P(C)P(C)P(C) 来源于对概念 CCC 的多个代表性实例(exemplars)进行独立评分后取均值,反映了模型在长期知识表征与中心倾向(central tendency)中的偏好。
表 3 展示了八个概念在 **统计均值** 、**理想值**  和 **原型分数**  三个维度的结果.

可以观察到,几乎所有概念的 P(C)P(C)P(C) 都显著偏离 A(C)A(C)A(C),并且这种偏移方向与 I(C)I(C)I(C) 高度一致。例如:

  • High-school teacherDogSaladGrandmother 等概念中,P(C)P(C)P(C) 明显高于 A(C)A(C)A(C),且接近或超过 I(C)I(C)I(C),表明模型在长期表征中更倾向于理想化描述;
  • 对于 HospitalStereo speakers 等概念,虽然 P(C)P(C)P(C)A(C)A(C)A(C) 的差距较小,但依然保持向 I(C)I(C)I(C) 偏移的趋势;
  • VacationCar 等概念中,P(C)P(C)P(C) 同样体现了与理想值一致的正向偏移。

这种趋势符合第 3 章提出的采样理论模型:

S(C)=A(C)+α^⋅[I(C)−A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^[I(C)A(C)]

其中,P(C)P(C)P(C) 可以被视为多轮采样与知识固化作用下的稳定状态,即 α^\hat{\alpha}α^ 在长期迭代中的累积效果。这一结果表明,处方性偏移不仅在即时采样阶段存在,还会在模型的概念记忆与原型构建中被长期保留,从而影响后续生成。


4.5 小结(Summary)

综上,本章通过即时采样实验、分布与情感极性分析、跨模型比较以及原型分数研究,系统验证了 统计均值 + 理想值偏移 的采样理论模型,主要结论包括:

  1. 即时偏移显著性S(C)S(C)S(C)I(C)I(C)I(C) 呈高度正相关,且显著偏离 A(C)A(C)A(C),验证了理论公式的适用性;
  2. 跨情境稳健性:无论分布形态(单峰、双峰)或情感极性(正向、负向、中性),偏移趋势保持一致;
  3. 模型规模与训练方式影响:较大规模与采用 RLHF 训练的模型在处方性偏移比例上显著更高;
  4. 长期效应存在性P(C)P(C)P(C) 的分析揭示了偏移在概念知识表征中的长期累积与固化。

这些发现表明,LLM 在生成过程中不仅遵循统计分布,还受到理想化规范的深刻影响,并且这种影响具有即时性与长期性双重特征。在未来应用中,应结合任务需求与公平性约束,对 α^\hat{\alpha}α^ 的作用范围和强度进行调节,以平衡生成结果的理想化与客观性。

➔➔➔➔点击查看原文,获取更多大模型相关资料

5. 总结与未来工作

本研究围绕大型语言模型(LLMs)在生成过程中的 采样机制,提出并验证了一个结合 统计均值理想值偏移 的理论模型。通过系统化的实验设计,我们不仅揭示了 LLM 在即时生成阶段的处方性偏移行为,还进一步确认了该偏移在长期知识表征与原型构建过程中的固化趋势。

综合前文分析,可以得出以下核心结论:

  1. 理论模型有效性:公式
    S(C)=A(C)+α^⋅[I(C)−A(C)]S(C) = A(C) + \hat{\alpha} \cdot [I(C) - A(C)] S(C)=A(C)+α^[I(C)A(C)]
    能够准确刻画 LLM 采样值 S(C)S(C)S(C) 与统计均值 A(C)A(C)A(C)、理想值 I(C)I(C)I(C) 之间的关系,且在多种概念、情感极性与分布形态下均表现出稳健性。
  2. 偏移的普适性与一致性:无论模型架构、规模、训练方式如何,处方性偏移均为一致性趋势,表明这是 LLM 内部生成机制的共性特征。
  3. 即时与长期双重影响:偏移不仅在单次采样中出现,还会在多轮采样和知识固化中累积形成稳定的原型分数 P(C)P(C)P(C),长期影响模型输出。

该采样机制的发现,对于 模型可解释性(interpretability)输出可控性(controllability) 研究具有重要意义:

  • 健康、教育、公共沟通 等领域,合理的理想值偏移可以使输出更贴近人类社会的伦理与价值观;
  • 政策决策、司法审判、风险评估 等高敏感度任务中,必须防范偏移带来的系统性误差,以确保公平性与客观性。

因此,α^\hat{\alpha}α^ 不仅是一个理论参数,也是未来调

➔➔➔➔点击查看原文,获取更多大模型相关资料

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/93087.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/93087.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

08 ABP Framework Blazor UI

ABP Framework Blazor UI 架构 overview ABP Blazor UI 系统构建在 Blazorise 组件库之上&#xff0c;为构建数据驱动应用提供结构化方法&#xff0c;包含 CRUD 操作、主题和本地化的一致模式。 #mermaid-svg-QAvWlELsLhZgYXHu {font-family:"trebuchet ms",verdana,…

JUC学习笔记-----LinkedBlockingQueueConcurrentLinkedQueueCopyOnWriteArrayList

LinkedBlockingQueue基本的入队出队初始化public class LinkedBlockingQueue<E> extends AbstractQueue<E>implements BlockingQueue<E>, java.io.Serializable {// 静态内部类 Node&#xff0c;用于存储队列元素及维护节点间关系static class Node<E>…

小杰python高级(six day)——pandas库

1.数据可视化用于绘制 DataFrame 数据图形&#xff0c;它允许用户直接从 DataFrame 创建各种类型的图表&#xff0c;而不需要使用其他绘图库&#xff08;底层实际上使用了 Matplotlib&#xff09;。&#xff08;1&#xff09;plotDataFrame.plot(*args, **kwargs)功能&#xff…

第十六届蓝桥杯青少组C++省赛[2025.8.9]第二部分编程题(1 、庆典队列)

参考程序&#xff1a;#include <iostream> using namespace std;int main() {int n, A;cin >> n >> A; // 输入&#xff1a;n 和 A&#xff0c;用空格隔开cout << n / A; // 整数相除&#xff0c;自动向下取整return 0; }

C++进阶:智能指针

目录1. RAII与智能指针2. C库中的智能指针2.1 智能指针auto_ptr2.2 智能指针unique_ptr2.3 智能指针shared_ptr3. shared_ptr的循环引用4. 智能指针的定值删除器1. RAII与智能指针 上一篇文章学习了异常相关的知识&#xff0c;其中遗留了一个异常安全相关的问题。那就是异常的抛…

Tkinter 实现按钮鼠标悬浮提示:两种方案(继承Frame与不继承)

在 Tkinter 桌面应用开发中&#xff0c;为按钮添加“鼠标悬浮提示”是提升用户体验的常用功能——无需点击&#xff0c;只需将鼠标挪到按钮上方&#xff0c;就能自动显示按钮功能说明。本文将详细介绍两种实现方案&#xff1a;不继承 Frame 类&#xff08;快速简洁版&#xff0…

20250814 最小生成树总结

引子 啊啊额&#xff0c;从一张图里抽出几条边&#xff0c;组成一棵树&#xff0c;无环n−1n-1n−1条边&#xff0c;就是生成树。那么边权和最小的生成树就叫最小生成树&#xff0c;最大生成树同理。 kruskal最小生成树 要求kruskal最小生成树&#xff0c;我们首先用结构体数组…

数据大集网:实体店获客引流的数字化引擎,解锁精准拓客新密码​

​在实体店面临流量焦虑、获客成本攀升的当下&#xff0c;实体店获客引流工具的重要性愈发凸显。如何在激烈的市场竞争中精准触达目标客户、构建可持续的客流增长模式&#xff1f;数据大集网凭借其创新的智能获客体系与全链路服务能力&#xff0c;正成为万千实体店突破增长瓶颈…

nginx --ssl证书生成mkcert

github https://github.com/FiloSottile/mkcert/releases网盘下载地址 https://pan.baidu.com/s/1XI0879pqu7HXZMnmQ9ztaw 提取码: 1111windows使用示例

守拙以致远:个人IP的长青之道|创客匠人

2025年被认为是AI应用全面爆发的一年。各种人工智能工具在写作、制图、剪辑等领域广泛使用&#xff0c;大大提升了个人和团队的工作效率。对于个人IP而言&#xff0c;这类工具的出现确实带来了新的机会&#xff0c;但也伴随着一种现象——一些人开始过度依赖甚至神化AI&#xf…

USB 3.0 LTSSM 状态机

USB2.0在电源供应后&#xff0c;通过Pull Up D-来决定枚举LS&#xff0c;Pull Up D有一个USB高速握手过程&#xff0c;来决定HS FS。USB3.0则会通过链路训练&#xff08;Link Training&#xff09;&#xff0c;来准备USB3.0通信。每当我们插上USB线的时候&#xff0c;对于3.0的…

MySQL窗口函数与PyMySQL以及SQL注入

MySQL窗口函数与PyMySQL实战指南&#xff1a;从基础到安全编程 引言 在数据处理和分析领域&#xff0c;MySQL作为最流行的关系型数据库之一&#xff0c;其窗口函数功能为数据分析提供了强大的支持。同时&#xff0c;Python作为数据分析的主要语言&#xff0c;通过PyMySQL库与My…

高级项目——基于FPGA的串行FIR滤波器

给大家安利一个 AI 学习神站&#xff01;在这个 AI 卷成红海的时代&#xff0c;甭管你是硬核开发者还是代码小白&#xff0c;啃透 AI 技能树都是刚需。这站牛逼之处在于&#xff1a;全程用 "变量名式" 幽默 生活化类比拆解 AI&#xff0c;从入门到入土&#xff08;啊…

JPrint免费的Web静默打印控件:PDF打印中文乱码异常解决方案

文章目录JPrint是什么&#xff1f;中文乱码&#xff08;Using fallback font xxx for xxxx&#xff09;1.字体嵌入2.客户机字体安装开源地址相关目录导航使用文档端口号修改代理使用场景打印服务切换中文乱码解决方案 JPrint是什么&#xff1f; JPrint是一个免费开源的可视化静…

MFT 在零售行业的实践案例与场景:加速文件集成与业务协作的高效方案

零售行业竞争激烈、数字化转型迭代迅速&#xff0c;业务对数据与档案的传输、处理和整合要求极高。无论是新品上市市场数据&#xff0c;还是供应链物流单据&#xff0c;集成方式不论是通过API或是档案传输, 对于传输的稳定性,安全性与性能, 都会直接影响决策效率与顾客体验。MF…

OSG+Qt —— 笔记1 - Qt窗口加载模型(附源码)

🔔 OSG/OsgEarth 相关技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…) OSG+Qt所用版本皆为: Vs2017+Qt5.12.4+Osg3.6.5+OsgQt(master) 效果 代码(需将cow.osg、reflect.rgb拷贝至工程目录下) OsgForQt.ui main.cpp

开源安全云盘存储:Hoodik 实现端到端数据加密,Docker快速搭建

以下是对 Hoodik 的简单介绍&#xff1a; Hoodik 是一个使用 Rust 和 Vue 开发的轻量级自托管安全云存储解决方案采用了非对称RSA密钥对和AES混合加密策略&#xff0c;从文件存储加密到数据链路加密&#xff0c;全程保证数据安全支持Docker一键私有部署&#xff0c;数据和服务…

[C++] Git 使用教程(从入门到常用操作)

1. Git 简介 Git 是一款分布式版本控制系统&#xff0c;用来跟踪文件变化、协作开发、管理项目版本。 它是开源的&#xff0c;由 Linus Torvalds 在 2005 年开发&#xff0c;广泛用于开源与企业项目中。 2. 安装 Git Windows 前往 Git 官网 下载并安装。 安装时建议勾选 Git…

实盘回测一体的期货策略开发:tqsdk获取历史数据并回测,附python代码

原创内容第969篇&#xff0c;专注AGI&#xff0c;AI量化投资、个人成长与财富自由。 星球好多同学希望说说实盘&#xff0c;我们就从实盘开始吧。 我们选择tqsdk给大家讲解&#xff0c;tqsdk支持免费注册&#xff0c;使用模拟账户&#xff0c;历史和实时数据&#xff0c;方便…

大模型推理框架vLLM 中的Prompt缓存实现原理

背景&#xff1a;为什么需要Prompt缓存模块&#xff1f;在大模型问答多轮对话应用场景中&#xff0c;不同请求的 Prompt 往往有相同的前缀&#xff0c;比如&#xff1a;第一次问答&#xff1a;你是一名专业的电子产品客服&#xff0c;负责回答客户关于手机产品的咨询。请根据以…