大模型关键字解释

💡 一、模型结构关键词

1. Transformer

Transformer 是一种专门用来“理解文字”的神经网络结构。就像一个聪明的秘书,能同时看懂整段话的所有词之间的关系,而不是像老式模型那样一句一句读。

👉 举例:以前的模型像一个机器人一字一句看句子,而 Transformer 像是一个能一眼扫完全文并抓住重点的读者。


2. Encoder / Decoder

  • Encoder(编码器):负责把输入的文字变成“理解用”的数字信息。
  • Decoder(解码器):把理解后的信息变成一句完整的回复或新内容。

👉 举例:输入“我饿了”,Encoder 会理解你是饿了,Decoder 会回复“那你去吃点东西吧”。


3. Attention / Self-Attention

这是一种让模型“关注重点词”的机制。比如“狗追着猫跑”,模型要知道谁在追谁,就要重点关注“狗”和“追”。

👉 举例:你读一句话时,也会自动注意重要的词,Attention 就是模型的“注意力”。


4. Feed Forward

一个普通的神经网络层,用来把每个词的理解结果进一步加工。

👉 类比:就像你理解完每个词之后,还要在脑子里再想一下它具体的含义。


5. Residual

让模型保留旧信息,避免忘掉之前学的内容。

👉 类比:像你在写作业时,在旁边保留一个草稿记录,避免前后逻辑出错。


6. Positional Encoding

Transformer 本身不理解词语的顺序,所以要专门加上“位置信息”。

👉 举例:句子“我爱你”和“你爱我”意思不同,模型需要知道“我”和“你”的位置才能理解准确。


📘 二、训练机制关键词

1. Pretraining(预训练)

模型最初要在大量文本上自学语言规律,相当于打基础。

👉 举例:就像你上小学之前,要先学拼音和字母。


2. Fine-tuning(微调)

在预训练之后,模型可以针对具体任务(如答题、写诗)进行专门训练。

👉 类比:基础学完后,你可以专门练习写作文或做数学题。


3. Masked Language Modeling(MLM)

训练方式是“填空题”式:随机遮住句子中的某些词,让模型猜出是什么词。

👉 举例:输入“我今天很 [MASK]”,模型要猜“开心”或“难过”。


4. Causal Language Modeling(因果语言建模)

只能看到前面词,来预测下一个词。

👉 举例:你说“我今天去”,模型要猜你下一步是“上班”还是“旅游”,不能偷看后面的词。


5. Next Sentence Prediction

训练模型判断“两句话是否有关联”。

👉 举例:一句是“我今天生病了”,下一句是“我请了假”,模型要学会识别这两句是连贯的。


⚙️ 三、推理部署关键词

1. KV Cache

缓存之前生成的结果,避免重复计算。

👉 类比:你和朋友聊天,不需要每次都从第一句重复讲,模型也可以记住前文。


2. Quantization(量化)

把模型参数从大数字变成小数字,压缩模型,加快运行。

👉 举例:就像把高清图片压缩成小图,但尽量不影响清晰度。


3. LoRA(低秩适配)

只调整少部分模型参数来完成微调,节省资源。

👉 类比:给现有软件加一个插件,而不是重新写整个程序。


4. FP16 / INT8

模型的“计算精度”。FP16 是半精度,INT8 是 8位整数。

👉 举例:像把原本需要用“毫米”测量的东西,换成“厘米”测量,快但略有损失。


5. Batching

同时处理多个输入,提高效率。

👉 类比:不是一个一个炒菜,而是开大锅做十份菜。


✨ 四、提示词工程关键词

1. Prompt

给模型的提示或问题。

👉 举例:你问“写一首关于夏天的诗”,这句话就是 prompt。


2. System Prompt

系统默认的背景设定,决定模型说话风格。

👉 举例:“你是一位耐心的老师”,模型就会用耐心的语气回答问题。


3. Zero-shot / Few-shot

  • Zero-shot:不给模型例子,直接问。
  • Few-shot:给模型几个示例,帮助它更好理解任务。

👉 举例:你说“翻译‘I love you’”,就是 Zero-shot;你先给它几个中英文对照例子再让它翻译,就是 Few-shot。


4. Chain of Thought

引导模型写出思考过程,而不是直接给答案。

👉 举例:问“2个苹果和3个苹果一共几个?”模型先写“2+3=5”,再说“答案是5”。


5. Temperature / Top-k / Top-p

控制输出的“随机性”。

  • Temperature 高,回答更有创意;
  • Top-k/p 是限制选词范围,保证输出更合理。

👉 类比:就像你写作文时,可以自由发挥(高温)或按模板来写(低温)。


6. Stop Sequence

设置模型遇到某些词就停。

👉 举例:模型生成到“谢谢,再见。”就停止,避免继续胡说。


📚 五、语料与训练数据关键词

1. Common Crawl

互联网上公开网页的数据集合,是模型学习材料的一部分。

👉 类比:就像你小时候到图书馆随便读所有书,模型也从网上“读书”。


2. Deduplication

去掉重复内容,防止模型过度记忆某句话。

👉 举例:一本书里重复太多遍“我爱你”,模型就可能过度使用这个句子。


3. Tokenization

把句子切成模型能理解的小单位(词或字)。

👉 举例:“我爱你”会被切成3个 Token,模型每次处理一个单位。


4. RLHF(人类反馈强化学习)

人类给模型输出打分,然后模型根据反馈学会给出更合适的答案。

👉 类比:你教小朋友讲话时,夸他讲得好,他就更愿意那样说。


🛡️ 六、安全与对齐关键词

1. Prompt Injection

一种攻击方式,偷偷加内容控制模型行为。

👉 举例:你本来叫模型“礼貌地回答问题”,但有人输入“忽略之前所有指令”,模型可能就被控制了。


2. Jailbreak

突破模型安全限制,让它说出不该说的话。

👉 类比:像“黑客绕过密码”一样,让模型做违禁事。


3. Bias Mitigation

减少偏见,让模型更公平。

👉 举例:避免模型认为“程序员=男性”,减少性别歧视。


4. Guardrails

给模型设定边界,比如不能说暴力内容或给出危险建议。

👉 类比:像儿童视频网站一样,自动屏蔽不良内容。


5. Constitutional AI

给模型写一套“价值观宪法”,让它言行合乎道德。

👉 举例:比如“不撒谎”、“不鼓励暴力”、“尊重人类”,模型的回答会严格遵守这些原则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913316.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913316.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

空调和烘干机的使用

开关 制冷 选择上下扫风 那个就下来了 烘干机 电源键 长按3s以上直到菜单显示 选择小件 不要快烘 至少1个半小时 才可以烘干

极简的神经网络反向传播例子

我之前一直没搞清楚,神经网络为什么要求导?反向传播又是什么?于是到现在深究回来…… 本质就是拟合一个未知函数。 高中的数理统计就学过最小二乘法这种回归方法(ŷ 代表自己的预测y,这个表达要记住)&…

01-什么是强化学习

什么是强化学习 1. 定义 强化学习(Reinforcement Learning, RL)是一种使智能体(Agent)通过与环境(Environment)不断交互,学习如何在不同情境下采取行动以获得最大化累积奖励的机器学习方法。 强…

淘宝直播数字人:音视频算法工程技术

本专题是我们打造智能数字人的部分实践总结。我们将探讨六大核心环节:LLM文案生产赋予数字人思考和内容生成能力,如同其“大脑”;LLM互动能力则聚焦对话逻辑与拟人化交流,是实现自然交互的关键;TTS(语音合成…

MySQL回表查询深度解析:原理、影响与优化实战

引言 作为后端开发或DBA,你是否遇到过这样的场景: 明明给字段加了索引,查询还是慢?EXPLAIN一看,执行计划里type是ref,但数据量不大却耗时很久? 这时候,你很可能遇到了MySQL中常见的…

任务管理器看不到的内存占用:RAMMap 深度分析指南

前言:任务管理器看不到的内存真相 在日常使用 Windows 系统时,我们有时会遇到一种令人费解的情况: 刚刚开机,什么软件都没运行,系统内存却已经占用了 7~8 GB。 打开任务管理器一看,前几个进程加…

从传统仓库到智能物流枢纽:艾立泰的自动化蜕变之旅

在物流行业智能化浪潮中,艾立泰从依赖人工的传统仓库转型为智能物流枢纽,其自动化升级路径为行业提供了典型范本。​曾几何时,艾立泰仓库内人工搬运、纸质单据流转、手工盘点是常态,效率低下、差错率高、人力成本攀升等问题制约发…

408第三季part2 - 计算机网络 - 滑动窗口

理解 帧本质就是一堆二进制,后面会将帧的格式 流量控制就是 B:急急急急急急 A:别急 A控制B,B控制C,C控制D,但D无法控制A,这就是相邻节点 abc在发送的过程中发送完了 怎么才能继续发送呢 没…

RedHat高可用集群深度解析与优化

一、RHCS核心组件深度解析1. Corosync(消息层)通信机制改进说明: Totem协议采用环形令牌传递机制,在10节点以下集群中使用UDP/IP组播(224.0.0.12),超过10节点建议改用UDP/UDP单播。典型配置示例…

为什么使用 XML Schema?

为什么使用 XML Schema? XML(可扩展标记语言)是一种广泛使用的标记语言,它被设计用来存储和传输数据。XML Schema 是一种用于定义 XML 文档结构的语言,它为 XML 文档提供了严格的验证机制。以下是使用 XML Schema 的几个主要原因: 1. 结构化数据定义 XML Schema 允许开…

ESP32蓝牙学习笔记

蓝牙 官网:https://www.bluetooth.com/zh-cn/learn-about-bluetooth/tech-overview/ 概述 分类:Bluetooth经典、Bluetooth低能耗(LE) GAP 通用访问配置文件(Generic Access Profile, GAP)简称GAP,该Profile保证不同的Bluetooth产品可以互…

C#扩展方法全解析:给现有类型插上翅膀的魔法

C#扩展方法全解析:给现有类型插上翅膀的魔法 在 C# 的类型系统中,当我们需要为现有类型添加新功能时,传统方式往往意味着继承、重写或修改源代码 —— 但如果是string、int这样的系统类型,或是第三方库中的密封类,这些…

YOLOv11在边缘计算设备上的部署与优化:从理论到实践

边缘计算与YOLOv11的融合背景 边缘计算的崛起与核心价值 边缘计算作为一种分布式计算范式,正深刻改变着人工智能应用的部署方式。其核心在于将数据处理从云端下沉到网络边缘,在靠近数据源的位置完成计算任务。根据国际数据公司(IDC&#xf…

Solidity——pure 不消耗gas的情况、call和sendTransaction区别

/ pure: 纯纯牛马 function addPure(uint256 _number) external pure returns(uint256 new_number){ new_number _number 1; }不会消耗gas对吧。传的不是状态变量 你的理解基本对了,但我们来更严谨、深入地回答这个问题。 ✅ 你这段 pure 函数代码: …

柔性电路芯片赋能脑机接口:技术融合、应用突破与前景展望

柔性电路芯片赋能脑机接口:技术融合、应用突破与前景展望 一、引言 1.1 研究背景与意义 在科技飞速发展的时代,柔性电路芯片与脑机接口的融合展现出巨大的潜力,为医疗、科研等多个领域带来了新的机遇与变革。 从医疗领域来看,随着人口老龄化的加剧以及神经系统疾病患者…

全面解析存储芯片:从Flash到DDR、铁电、内存条与SD卡

一、存储芯片分类概述 存储芯片是电子设备中用于数据存储的核心组件,根据数据保存方式可分为 易失性存储器(Volatile Memory) 和 非易失性存储器(Non-Volatile Memory)。 类型代表芯片特点典型应用易失性存储器DRAM、…

编译ADI NO-OS工程

1,先在WINdows下安装git bush 可以参考下面博客 https://blog.csdn.net/Natsuago/article/details/145647536 2.安装make 工具 可参考一下链接 https://blog.csdn.net/weixin_40727233/article/details/110353240 3,参考ADI官方链接 https://wiki.analo…

自存bro code java course 笔记(2025 及 2020)

Java Full Course for free ☕ System 是 Java 中的一个 final 类,定义在 java.lang 包中。它的 构造方法是 private 的,意味着你无法通过 new System() 来创建对象。它的所有常用成员(如 System.out, System.in, System.err, currentTimeMil…

opencv基础的图像操作

目录 1.安装opencv-python 2.基础的图像操作 3.绘制几何图形 3.1.绘制直线 3.2.绘制矩形 3.3.绘制圆形 3.4.向图像中添加文字 总结 1.安装opencv-python pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python 2.基础的图像操作 # 导入库 import c…

Kali制作Linux木马

环境描述:攻击机:kali-Linux2025靶机:Linux-Centos8本文章主要介绍怎么通过kali制作Linux木马控制linux,不要用于非法用途,法律是底线不要触碰,提升自己的网络安全技能,如有用于非法用途自行承担…