11 Prompt 工程进阶:Few-shot 与 Chain-of-Thought

11 Prompt 工程进阶:Few-shot 与 Chain-of-Thought

前10节总结 & 后10节展望

在前 10 节,我们已经完成了 AI 产品经理的入门阶段

  • 1–3:理解了大模型的基本概念、Token、Prompt 基础;
  • 4–5:体验了本地部署与 API 调用;
  • 6–8:掌握了 RAG 技术链路(Embedding + 向量数据库),让模型学会查资料;
  • 9:学会了评估 AI 产品的效果;
  • 10:写出了第一份 AI 产品 PRD。

可以说,这 10 节我们已经完成了从 “知道 AI 是什么” → “能跑起来一个 Demo” → “能写出产品文档” 的过程。

接下来的 第 11–20 节,我们进入 进阶阶段

  • 深入 Prompt 工程(Few-shot、Chain-of-Thought、模板化);
  • 构建完整的 RAG 系统,并做优化(检索、向量库、评估平台);
  • 体验多轮对话、流式输出、Web Demo;
  • 学习如何把技术和 具体行业场景(教育、电商、金融) 结合。

👉 今天(第 11 节)是第二阶段的开篇,我们要学习的内容是 Prompt 工程进阶技巧


为什么要学习 Prompt 工程?

在第一阶段的实验中,你可能发现:

  • 有时候模型回答很棒,但有时候答得完全跑偏;
  • 问题稍微复杂一点,答案就不靠谱;
  • 同一个问题,不同次回答可能差别很大。

这说明,大模型的表现 高度依赖 Prompt(提示词)
就像和人交流,如果你说得含糊,对方可能乱猜;但如果你举例说明、逐步解释,对方往往理解得更准确。

👉 Prompt 工程就是学习“如何和模型对话”,让它表现得更稳定、更符合需求。

今天我们重点看两种方法:

  • Few-shot(少样本提示):通过给模型一些“示范”,让它模仿;
  • Chain-of-Thought(思维链提示):要求模型“逐步推理”,而不是只给最终答案。

一、核心概念(零基础友好解释)

1. Zero-shot vs Few-shot

  • Zero-shot(零样本):不给示例,直接问问题。
  • Few-shot(少样本):先给几个示例,让模型模仿示例风格或推理方式。

2. Chain-of-Thought(思维链)

  • 直译:让模型“展示推理过程”。
  • 作用:尤其适合逻辑推理、数学题、复杂业务流程,可以显著提升准确率。

二、实践:对比实验

Python 示例

from openai import OpenAIclient = OpenAI(base_url="http://127.0.0.1:11434/v1", api_key="ollama")def ask(prompt):resp = client.chat.completions.create(model="deepseek-r1",messages=[{"role": "user", "content": prompt}],temperature=0.2)return resp.choices[0].message.content# Zero-shot
q1 = "小明有12个苹果,给了朋友3个,然后又买了5个,现在有多少个苹果?"
print("Zero-shot 回答:")
print(ask(q1))# Few-shot
q2 = """示例:
Q: 小红有10个橙子,吃了2个,还剩多少?
A: 她还剩 8 个橙子。Q: 小王有7支笔,送人2支,还剩多少?
A: 他还剩 5 支笔。现在请回答:
Q: 小明有12个苹果,给了朋友3个,然后又买了5个,现在有多少个苹果?
A:"""
print("\nFew-shot 回答:")
print(ask(q2))# Chain-of-Thought
q3 = """请逐步推理:
小明有12个苹果,给了朋友3个,然后又买了5个,现在有多少个苹果?"""
print("\nChain-of-Thought 回答:")
print(ask(q3))

预期结果

在学术定义中,三种方式本应区别如下:

  • Zero-shot:只给结果
  • Few-shot:模仿示例,风格更统一
  • CoT:逐步推理,展示步骤

特别说明:为什么 DeepSeek R1 三种方式都输出了推理过程?

如果你用 DeepSeek R1 跑实验,可能会发现:

  • Zero-shot / Few-shot / CoT 的回答里都有 <think> 部分;
  • 模型总是自动展示推理过程。

这是因为:

  • DeepSeek R1 是“推理增强模型”,被设计成默认生成思维链,即使用户没有要求。
  • 这是它的特性,不代表 Zero-shot / Few-shot / CoT 的概念无效。
  • 在代码里,你可以通过正则去掉 <think> 部分,得到更接近“标准差异”的对比结果。

👉 换句话说:概念依然正确,但模型行为会因实现不同而有所差异。


三、产品经理思考

1. 为什么 PM 要懂 Few-shot 和 CoT?

  • 交互设计:决定用户是“一问一答”,还是用模版(Few-shot)。
  • 控制风格:通过 Few-shot 可以固定回答口吻(礼貌、专业、简洁)。
  • 保证准确率:涉及逻辑推理的任务,必须要求模型展示思维链。

2. 模型行为差异要注意

  • 有些模型简洁(GPT-3.5),Zero-shot 只给答案。

  • 有些模型“话多”(DeepSeek R1),会自动展示推理过程。

  • 在 PRD 中要写清楚:

    • 是否要展示推理过程给用户?
    • 是否只在后台保留(便于调试)?
    • 是否需要清理 <think> 标签,让用户只看到最终答案?

3. 案例

  • 教育产品:学生问数学题 → 用 CoT 提示,强制展示步骤。
  • 客服机器人:用 Few-shot 保证礼貌统一。
  • 企业助手:可以保留 <think> 作为调试日志,但前端只展示结果。

四、小结

  • Few-shot:通过示例提升模型模仿能力。
  • Chain-of-Thought:通过逐步推理提升逻辑准确性。
  • DeepSeek R1 默认输出思维链,这是它的特性,不影响我们理解概念。
  • PM 角度:Prompt 工程是“产品体验的调节阀”,不同模型行为差异本身也是产品设计的考量点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921989.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921989.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARM1.(ARM体系结构)

1.基本概念嵌入式:以应用为心&#xff0c;以计算机技术为础&#xff0c;软便件可被的专用计算机系统。计算机系统的软件基本组成: 系统软件、应用软件。计算机系统的硬件基本组成&#xff1a;运算器、控制器、存诸器、输入设备、输出设备日常生活中遇到的专业术语&#xff1a…

Django全栈班v1.01 Python简介与特点 20250910

从零开始的Python编程之旅 “人生苦短&#xff0c;我用Python。”这不仅仅是Python程序员的口头禅&#xff0c;更是对Python强大能力的最好诠释&#xff01;&#xff01;&#xff01; 为什么全世界有超过1500万开发者选择Python&#xff1f; 为什么Python连续多年蝉联最受欢…

【WebApi】什么情况开启如何开启缓存

在 ASP.NET Core WebAPI 中开启缓存是优化性能、减少服务器负载和提升用户体验的非常重要的手段。但并非所有情况都适合开启缓存。 下面我将从 “什么情况下开启” 和 “如何开启” 两个方面为你详细解释。 一、什么情况下应该开启缓存? 总的来说,缓存适用于 “变化不频繁但…

Go语言类型断言全解析

类型断言的基本概念类型断言(Type Assertion)是Go语言中用于检查接口值底层具体类型的机制。它本质上是一种运行时类型检查的操作&#xff0c;允许程序在运行时判断接口变量是否持有特定的类型值&#xff0c;并提取该类型的值。这是Go语言类型系统中的一个重要特性&#xff0c;…

大模型在题目生成中的安全研究:攻击方法与防御机制

大模型在题目生成中的安全研究&#xff1a;攻击方法与防御机制 文章目录大模型在题目生成中的安全研究&#xff1a;攻击方法与防御机制一、引言二、大模型在题目生成中的安全漏洞与攻击方法2.1 大模型在题目生成中的安全漏洞分析2.1.1 训练数据相关漏洞2.1.2 模型架构与特性相关…

跟做springboot尚品甄选项目(二)

登录功能的书写 后端接口的书写 &#xff08;1&#xff09;创建配置文件 粘贴这两个文件&#xff08;E:\project\AllProJect\Shangpin Selection\项目材料素材\资料\资料\03-配置文件&#xff09; 在spzx-manager服务的src/resources目录下创建application.yml、application-…

前后端接口调试提效:Postman + Mock Server 的工作流

前后端接口调试提效&#xff1a;Postman Mock Server 的工作流 &#x1f31f; Hello&#xff0c;我是摘星&#xff01; &#x1f308; 在彩虹般绚烂的技术栈中&#xff0c;我是那个永不停歇的色彩收集者。 &#x1f98b; 每一个优化都是我培育的花朵&#xff0c;每一个特性都是…

大带宽香港云服务器在数据传输速度上有何优势?

为方便站长快速部署网站、优化用户访问体验&#xff0c;当下众多实力强劲的香港数据中心&#xff0c;均推出了大带宽云服务器产品。不过&#xff0c;市面上不少数据中心虽宣称提供 “专属大带宽”&#xff0c;但其线路配置中&#xff0c;国际线路占比高、绕行链路多&#xff0c…

HT862 智能音频功率放大器:为便携音频设备打造高效稳定的音质解决方案

在蓝牙音箱、智能手机、便携式游戏机等设备的设计中&#xff0c;音频功率放大器是决定音质表现、续航能力与使用稳定性的关键部件。一款优质的音频功放&#xff0c;不仅需要输出足够的功率以满足清晰响亮的听觉需求&#xff0c;还需在能效、温控、适配性上达到平衡&#xff0c;…

HarmonyOS-ArkUI Web控件基础铺垫7-HTTP SSL认证图解 及 Charles抓包原理 及您为什么配置对了也抓不到数据

HarmonyOS-ArkUI Web控件基础铺垫6--TCP协议- 流量控制算法与拥塞控制算法 HarmonyOS-ArkUI Web控件基础铺垫5--TCP协议- 动画展示超时重传&#xff0c;滑动窗口&#xff0c;快速重传 HarmonyOS-ArkUI Web控件基础铺垫4--TCP协议- 断联-四次挥手解析 HarmonyOS-ArkUI Web控件…

【qt】通过TCP传输json,json里包含图像

主要是使用协议头 发送方connect(m_pDetectWorker, &DetectionWorker::sig_detectImg, this, [](const QJsonObject &json){// 转换为JSON数据QJsonDocument doc(json);QByteArray jsonData doc.toJson(QJsonDocument::Compact);// 构建增强协议头struct EnhancedHead…

四,基础开发工具(下)

4.5自动构建make/Makefile4.5.1基本使用1示例2进一步解释3实践4最佳实践4.6练习&#xff1a;进度条4.6.1倒计时4.6.2进度条version14.6.2进度条version24.7版本控制器Git4.7.1git操作1操作一次&#xff0c;以后不愁2经典"三件套"3常用4版本回退4.7.2小结4.5自动构建m…

C++基本数据类型的范围

文章目录不同位数的系统下各个类型所占字节数如何存储的我发现我能搜到的相关文章都只讲了这些数据类型的范围是这样的&#xff0c;不说实际的存储情况&#xff0c;当你了解了类型实际是如何存储的&#xff0c;再去记忆这些范围就简单了&#xff0c;所以就有了这篇文章不同位数…

基于社交媒体数据的公众情绪指数构建与重大事件影响分析

一、引言在信息爆炸的时代&#xff0c;社交媒体&#xff08;如微博、Twitter&#xff09;已成为公众表达情绪、讨论热点事件的主要平台。通过分析社交媒体数据&#xff0c;可以构建公众情绪指数&#xff0c;并进一步研究其与股市波动、政策发布等重大事件的关联性。本文将介绍如…

OpenLayers数据源集成 -- 章节七:高德地图集成详解

前言在前面的文章中&#xff0c;我们学习了OpenLayers的瓦片调试&#xff08;VectorTileDebug&#xff09;技术。本文将深入探讨OpenLayers中高德地图的集成方法&#xff0c;这是WebGIS开发中接入商业地图服务的重要技术。高德地图作为国内领先的地图服务提供商&#xff0c;提供…

海外代理IP平台Top3评测:LoongProxy、神龙动态IP、IPIPGO哪家更适合你?

在当今互联网环境中&#xff0c;代理IP服务已成为许多企业和个人用户的刚需。无论是数据采集、市场调研还是账号管理&#xff0c;优质的代理IP都能大幅提升工作效率。本文将针对LoongProxy、神龙海外动态IP和IPIPGO这三家主流代理IP服务商进行横向评测&#xff0c;帮助你根据自…

对浏览器事件机制的理解

浏览器事件是什么&#xff1a; 事件是用户操作网页时发生的交互动作&#xff0c;比如 click/move&#xff0c; 事件除了用户触发的动作外&#xff0c;还可以是文档加载&#xff0c;窗口滚动和大小调整。事件被封装成一个 event 对象&#xff0c;包含了该事件发生时的所有相关信…

XCVP1902-2MSEVSVA6865 AMD 赛灵思 XilinxVersal Premium FPGA

XCVP1902-2MSEVSVA6865 是 AMD 赛灵思&#xff08;Xilinx&#xff09;Versal Premium FPGA 系列中的高端自适应系统级芯片&#xff08;Adaptive SoC&#xff09;变体&#xff0c;面向需要极高逻辑密度、海量 I/O 与超高速收发能力的数据中心互联、原型验证与高性能网络加速等应…

kotlin - 2个Fragment实现左右显示,左边列表,右边详情,平板横、竖屏切换(一)

kotlin - 2个Fragment实现左右显示&#xff0c;左边列表&#xff0c;右边详情&#xff0c;平板横、竖屏切换(要使用平板测试)平板横屏&#xff1a;左右fragment实现分屏效果&#xff0c;平板竖屏&#xff1a;只显示左边的fragment&#xff0c;点击才显示右边fragment屏幕旋转&a…

推荐系统中的AB测试:从设计到分析全流程

推荐系统中的AB测试:从设计到分析全流程 关键词:推荐系统、AB测试、实验设计、数据分析、效果评估、统计显著性、用户体验 摘要:本文将深入探讨推荐系统中AB测试的全流程,从实验设计到结果分析。我们将用通俗易懂的方式解释AB测试的核心概念,展示如何科学地评估推荐算法改…