大语言模型原理与书生大模型提示词工程实践-学习笔记

📘 第五期书生葡语实战营讲座总结

🎙 主讲人:王明(东部大学 数据挖掘实验室 博士生)


一、大语言模型的生成原理

  • 架构基础:采用 Transformer(Decoder-only)架构,如 GPT 系列。
  • 学习过程模拟人类成长:
    1. 🧠 预训练:以“下一个词预测”为核心任务,掌握通用语言规律。
    2. 🎯 指令微调:遵循指令,更贴合人类指令执行习惯。
    3. 🏛️ 领域微调:形成“垂直专业模型”,例如医学、金融 LLM。
    4. 🧰 工具协同:调用外部知识库、搜索引擎或 API 执行复杂任务。
  • 续写机制:根据输入内容,预测下一个最可能的词,逐步生成连贯文本。

二、提示工程 Prompt Engineering 简介

📌 什么是 Prompt?

输入给模型的指令/内容,引导其生成期望输出。

✨ 什么是提示工程?

通过设计和优化 Prompt,提高模型响应质量与稳定性。

✅ 六大提示原则(来自 OpenAI):

  1. 清晰具体的任务描述
  2. 提供上下文或示例(few-shot)
  3. 任务分解(适用于复杂任务)
  4. 给予思考时间(Chain of Thought)
  5. 调用外部工具辅助推理
  6. 系统化测试调整提示
    在这里插入图片描述

三、实用提示技巧举例

技巧类型示例
明确任务格式“生成一首七言律诗”比“写一首诗”更有效
指定角色扮演翻译大师 vs 普通翻译
提供示例 (few-shot,思维链)提高准确率与风格一致性
使用格式符用 `` 或 Markdown 包裹指令,避免误解
情感/奖励激励“这对我事业很重要” or “我给你200元小费”

四、结构化提示设计框架对比

🧩 CRISP 框架(结构灵活)

  • 能力和角色(Capabilities&Role):希望大语言模型扮演怎么样的角色
  • 洞察力(insights):背景信息和上下文
  • 个性(Persona)希望大语言模型以什么风格或方式回答你
  • 指令(Prompt)希望大语言模型做什么
  • 尝试(Experiment)要求大语言模型提供多个答案
    在这里插入图片描述

🧱 COSTAR 框架(结构清晰)

  • Context(背景):提供任务背景信息
  • Objective(目标):定义需要LLM执行的任务
  • Style(风格):指定希望LLM具备的写作风格
  • Tone(语气):设定LLM回复的情感基调
  • Audience(对象):表明回复对象
  • Response format(输出格式):提供回复格式
    在这里插入图片描述

在这里插入图片描述

⚠️ 问题:不便扩展或调整,无法容纳复杂模块(如示例/规则)


五、人格化提示设计框架:Long-GPT

🎯 目标

通过“人格化”提示设计,使模型进入特定角色和工作状态。

🧠 理论基础:心理学启发

  • 认知框架:围绕“心理模型”组织语言
  • 情绪调节:正向激励带来正面响应
  • 思维模式:模拟人类工作流、思维路径
    在这里插入图片描述

🛠 结构化模块(可选组合):

  • 基本身份与能力唤醒
  • 明确规则与目标约束
  • 分阶段工作流程(如“先做A,再做B”)
  • 输出格式要求(如 JSON、表格)
  • 初始化启动语

六、自动提示生成工具:MISTRO

Lang-GPT 提示自动生成器(挂载于 Hugging Face Space)https://huggingface.co/spaces/sci-m-wang/Minstrel

在这里插入图片描述

🧱 模块组成:

  1. 分析组:解析用户任务意图,激活相应模块
  2. 设计组:生成对应提示结构(Prompt Blocks)
  3. 测试组
    • 提示模拟器(执行任务)
    • 多智能体评估群组(自动辩论 & 优化)

七、实战演练:提示工程练习赛(论文分类)

🏆 任务目标:

  • 依据论文标题和摘要,将论文归类为 10 个科学领域之一。

📊 数据来源:

  • arXiv 论文,10类:AI、CV、CL、Robotics、Networking 等

🧪 提交内容:

  • 系统提示(可空)
  • 任务提示(包含 {title}{abstract}

🧮 评测方式:

  • 使用 OpenCompass + 书生葡语 38B instruct 模型
  • 准确率 = 正确分类数量 / 总数

🧩 示例系统提示结构(Lang-GPT):

你是一个资深arXiv论文分类专家,你的任务是……
[背景信息]
[技能唤醒]
[规则说明]
[工作流程指示]
[输出格式要求]![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/c43d5497a931482296aebe3f8b527d4c.png)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/909074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李沐 《动手学深度学习》 | 实战Kaggle比赛:预测房价

文章目录 1.下载和缓存数据集2.数据预处理读取样本预处理样本数值型特征处理特征标准化的好处离散值处理转换为张量表示 训练K折交叉验证模型选择最终模型确认及结果预测代码总结提交到Kaggle 房价预测比赛链接:https://www.kaggle.com/c/house-prices-advanced-reg…

一键部署Prometheus+Grafana+alertmanager对网站状态进行监控

在建设监控体系的过程中,针对一个系统的监控是多维度的,除了服务器资源状态、中间件状态、应用状态外,对系统访问状态的监控也是很有必要,可以在系统访问出现异常时第一时间通知到我们。本文介绍使用 Docker-compose 方式一键部署…

康谋方案 | 高精LiDAR+神经渲染3DGS的完美融合实践

目录 一、从点云到高精地图的重建 1、数据采集 2、点云聚合 3、高精地图建模 4、三维建模与装饰 二、颠覆性革新:NeRF 与 3DGS 重建 1、仅需数日,完成街景重建 2、进一步消除 Domain gap,场景逼真如实地拍摄 3、降本增效&#xff0c…

MySQL-事务(TRANSACTION-ACID)管理

目录 一、什么是事务? 1.1.事务的定义 1.2.事务的基本语句 1.3.事务的四大特性(ACID) 二、数据库的并发控制 2.1.什么是并发及并发操作带来的影响? 2.2.并发操作带来的隔离级别 三、使用事务的场景 3.1.银行转账场景示例 3.2.模拟…

centos系统docker配置milvus教程

本人使用的是京东云服务器配置milvus 参考教程:https://blog.csdn.net/withme977/article/details/137270087 首先确保安装了docker 、docker compose docker -- version docker-compose --version创建milvus工作目录 mkdir milvus # 进入到新建的目录 cd milvu…

什么是JSON ?从核心语法到编辑器

一、什么是JSON ? JSON,即 JavaScript 对象表示法,是一种轻量级、跨语言、纯文本的数据交换格式 。它诞生于 JavaScript 生态,但如今已成为所有编程语言通用的 “数据普通话”—— 无论前端、后端,还是 Python、Java&…

计算机网络(7)——物理层

1.数据通信基础 1.1 物理层基本概念 物理层(Physical Layer)是所有网络通信的物理基础,它定义了在物理介质上传输原始比特流(0和1)所需的机械、电气、功能、过程和规程特性 1.2 数据通信系统模型 信源:生成原始数据的终端设备,常见形态包括…

深度学习基础知识总结

1.BatchNorm2d 加速收敛:Batch Normalization 可以使每层的输入保持较稳定的分布(接近标准正态分布),减少梯度更新时的震荡问题,从而加快模型训练速度。 减轻过拟合:批归一化引入了轻微的正则化效果&#…

iOS 抖音首页头部滑动标签的实现

抖音首页的头部滑动标签(通常称为"Segmented Control"或"Tab Bar")是一个常见的UI组件,可以通过以下几种方式实现: 1. 使用UISegmentedControl 最简单的实现方式是使用系统自带的UISegmentedControl: let segmentedCo…

ThreadLocal实现原理

ThreadLocal 是 Java 中实现线程封闭(Thread Confinement)的核心机制,它通过为每个线程创建变量的独立副本来解决多线程环境下的线程安全问题。 Thread └── ThreadLocalMap (threadLocals) // 每个线程持有的专属Map├── Entry[] tab…

【笔记】结合 Conda任意创建和配置不同 Python 版本的双轨隔离的 Poetry 虚拟环境

如何结合 Conda 任意创建和配置不同 Python 版本的双轨隔离的Poetry 虚拟环境? 在 Python 开发中,为不同项目配置独立且适配的虚拟环境至关重要。结合 Conda 和 Poetry 工具,能高效创建不同 Python 版本的 Poetry 虚拟环境,接下来…

defineAsyncComponent

下面,我们来系统的梳理关于 defineAsyncComponent 懒加载 的基本知识点: 一、异步组件核心概念 1.1 什么是异步组件? 异步组件是 Vue 中一种按需加载组件的机制,允许将组件代码拆分为独立的 chunk,在需要时再从服务器加载。这种技术能显著提升应用初始加载速度。 1.2 为…

ANeko v1.0.3 | 在手机里养只宠物猫 实时互动 动画细腻

ANeko是一款专为喜欢猫咪的用户设计的互动养宠应用。它让你在手机屏幕上拥有一只可爱的猫咪动画,这只猫咪会实时跟随你的手指触摸轨迹,带来生动有趣的互动体验。该应用不仅保留了用户熟悉的交互式猫动画,还结合了现代高清图形技术&#xff0c…

人工智能AI

AI 简介 AI 使我们能够生成可以改进卫生保健的出色软件,让人能够克服生理上的不便,改进智能基础结构,创造令人惊叹的娱乐体验,甚至拯救地球! 什么是 AI? 简而言之,AI 就是一种模仿人类行为和能力的软件。 关键工作负载包括: 机器学习 - 它通常是 AI 系统的基础,也是…

Vue 中 data 选项:对象 vs 函数

Vue 中 data 选项&#xff1a;对象 vs 函数 在 Vue 开发中&#xff0c;data 选项可以使用对象或函数形式&#xff0c;了解它们的使用场景非常重要。下面我将通过一个直观的示例来展示两者的区别和适用场景。 <!DOCTYPE html> <html lang"zh-CN"> <h…

python打卡第49天

知识点回顾&#xff1a; 通道注意力模块复习空间注意力模块CBAM的定义 CBAM 注意力模块介绍 从 SE 到 CBAM&#xff1a;注意力机制的演进 之前我们介绍了 SE&#xff08;Squeeze-and-Excitation&#xff09;通道注意力模块&#xff0c;其本质是对特征进行增强处理。现在&#…

iOS和桌面双端抓包实战经验总结:Sniffmaster与常见工具组合解析

近几年&#xff0c;移动端和桌面端的网络调试工作变得越来越“棘手”。过去一个代理证书搞定的场景&#xff0c;现在常常被HTTPS加密、双向验证、App安全策略给难住。特别是涉及到iOS平台时&#xff0c;很多传统抓包方案都不再适用。作为一名在多个平台开发和测试的程序员&…

cloudstudio腾讯云:matplotlib 设置中文字体

检查可用字体&#xff1a; import matplotlib.font_manager as fm fonts [f.name for f in fm.fontManager.ttflist] print(fonts) # 查看系统中可用的字体列表# 列出所有中文字体文件 !fc-list :langzh没有中文字体&#xff0c;需要下载 !sudo apt-get install fonts-wqy-m…

Django中的ORM的使用步骤----以MySQL为例

1 以纯Python的形式创建项目虚拟环境 2 命令安装Django 3 在当前虚拟环境目录下命令创建Django项目 4 命令创建app 注&#xff1a; 若想将创建的子应用存放到指定目录&#xff0c;如app&#xff0c; 那么需要先手动创建app目录&#xff0c;再手动创建子应用目录&#xff0c;如o…

Rust 学习笔记:通过 Send 和 Sync trait 实现可扩展并发性

Rust 学习笔记&#xff1a;通过 Send 和 Sync trait 实现可扩展并发性 Rust 学习笔记&#xff1a;通过 Send 和 Sync trait 实现可扩展并发性Send trait&#xff1a;允许在线程之间转移所有权Sync trait&#xff1a;允许多线程访问手动实现 Send 和 Sync 是不安全的练习题 Rust…