AI大模型各类概念扫盲

以下内容整理自AI,进行一个概念扫盲:

  • Prompt(提示词)
    Prompt是用户提供给AI模型的指令或问题,用于引导模型生成特定输出。良好的Prompt设计能显著提升模型的任务理解能力和响应质量,例如通过结构化提示(Few-shot Prompting)让模型学习上下文中的示例,或使用思维链(Chain-of-Thought)提示引导模型分步推理。在Agent开发中,Prompt是控制行为的第一环,直接影响任务拆解、工具调用和结果生成的准确性。

  • RAG(检索增强生成)
    RAG通过结合实时检索和文本生成技术,让模型在回答时参考外部知识库的最新信息,解决静态模型的知识局限性。其核心流程包括:将用户查询转换为向量,从向量数据库中检索相关文档片段,再基于检索内容生成回答。这种技术广泛应用于客服、医疗问答等需要实时数据的场景,能有效减少模型幻觉。

  • Embedding(嵌入向量)
    Embedding是将文本、图像等数据映射为高维向量的技术,这些向量能捕捉语义特征(如“猫”和“狗”的向量相似度高于“猫”和“汽车”)。通过对比向量距离,可实现语义搜索、聚类和推荐。常用模型如OpenAI的text-embedding-ada-002或开源的Sentence-BERT,它们是构建RAG、记忆系统的基础工具。

  • 向量数据库
    向量数据库(如Pinecone、Milvus)专为存储和检索高维向量优化,支持高效的相似度搜索。与传统数据库不同,它通过近似最近邻(ANN)算法快速找到语义相似的条目,适合处理非结构化数据。在Agent中,向量数据库用于存储知识库Embedding或用户交互历史,实现快速上下文检索。

  • 召回率
    召回率衡量检索系统覆盖相关结果的能力,计算为“正确检索到的相关项/所有相关项”。高召回率意味着系统遗漏较少,适用于需全面性的场景(如法律条文查询)。实际应用中需与精确率(Precision)平衡,例如通过调整检索阈值或结合重排序(Re-ranking)技术提升效果。

  • Top_K与Top_p
    Top_K限制生成时仅从概率最高的K个候选词中采样,适合需要确定性的任务;Top_p(核采样)动态选择累积概率超过p的最小词集,增强多样性。两者共同控制生成结果的创造性,例如客服场景用低Top_p保证严谨性,而创意写作可用高Top_p激发灵感。

  • 温度(Temperature)
    温度参数调节生成随机性:高温(如1.0)增加多样性但可能偏离事实,低温(如0.2)使输出更确定但缺乏新意。在Agent中,需根据任务调整——事实查询用低温,诗歌生成用高温,而对话系统可能选择中间值(0.7)平衡流畅性与准确性。

  • Memory(记忆)
    Memory使Agent能存储和利用历史信息,分为短期记忆(如对话上下文缓存)和长期记忆(如向量化的用户偏好)。实现方式包括:数据库存储结构化数据、向量库保存语义记忆,或通过递归摘要(Recursive Summarization)压缩长上下文。记忆机制是个性化服务的核心。

  • MCP(Model Context Protocol)
    MCP是一种系统性管理AI模型交互上下文的框架协议,旨在通过结构化上下文传递和状态维护来增强复杂任务中模型的连贯性与可控性。其核心是通过标准化接口(如JSON Schema)定义对话历史、环境状态、工具调用结果等上下文要素,使模型能动态跟踪多轮交互的完整信息流。例如,在客服Agent场景中,MCP会记录用户历史问题、已尝试的解决方案、系统反馈等元数据,形成可追溯的任务图谱;在自动化流程中,它可协调多个子模型间的上下文传递,确保链式调用(如检索→分析→执行)的信息一致性。该协议通常与记忆模块(Memory)、函数调用(Function Call)深度集成,既能解决长上下文窗口的容量限制问题(通过分层存储关键信息),也能减少因上下文丢失导致的模型幻觉或逻辑断层,是构建企业级Agent系统的底层支撑技术之一。

  • Function Call(函数调用)
    Function Call允许模型调用外部工具(如API、数据库)扩展能力,例如查询天气或执行数学计算。OpenAI等平台提供结构化函数描述,模型根据需求自动触发调用。这是Agent实现复杂任务(如订机票、数据分析)的关键技术。

  • 模型幻觉
    模型幻觉指生成内容与事实或逻辑不符,成因包括训练数据偏差、过度依赖参数化知识。缓解方法包括:RAG提供真实依据、设置低温/低Top_p限制随机性、添加事后验证(如事实性检查API)以及多步推理(Self-Consistency)。

  • 模型微调
    微调是在领域数据上继续训练预训练模型,使其适应特定任务(如法律文本分析)。相比Prompt工程,微调能更深度调整模型行为,但需标注数据和算力支持。轻量级方法如LoRA(低秩适应)可降低资源消耗。

  • 链式调用
    链式调用将多个步骤串联成工作流,例如“检索→生成→验证→执行”。框架如LangChain提供标准化接口,支持灵活组合工具和模型。复杂Agent可能嵌套多条链,如先规划任务步骤,再逐步调用子链完成。

  • Agent(智能代理)
    Agent是整合感知、决策与执行的自主系统,核心能力包括:通过Prompt和Memory理解上下文,利用Function Call调用工具,基于RAG获取实时知识,并通过链式调用协调多步骤任务。高级Agent还能通过强化学习(RLHF)从反馈中持续优化行为。

总的来说,在人工智能领域,Prompt是指用户输入给模型的指令或问题,它直接影响模型的输出质量和方向,好的Prompt设计能显著提升任务完成效果。RAG(检索增强生成)是一种结合信息检索和文本生成的技术,通过从外部知识库实时获取相关信息来增强生成内容的准确性,特别适合需要实时数据的场景。Embedding技术将文本、图像等数据转化为高维向量,这些向量能够捕捉语义信息,为相似性搜索和推荐系统提供基础。向量数据库是专门为存储和检索这些嵌入向量优化的数据库,支持高效的相似度计算和大规模数据查询,是构建智能检索系统的核心组件。召回率衡量的是检索系统找到所有相关项目的能力,高召回率意味着系统很少遗漏重要信息,这在信息检索和推荐系统中尤为重要。Top_K和Top_p是控制文本生成多样性的参数,前者限制候选词范围,后者通过概率累积动态调整候选词集合,两者共同影响生成结果的创造性和准确性。温度参数调节生成过程中的随机性,较高的温度会产生更多样化的输出,而较低的温度则使结果更加确定和保守。Memory使AI系统能够记住历史交互信息,分为短期记忆(如当前会话上下文)和长期记忆(如用户偏好存储),是实现个性化服务的关键。MCP(多选提示)通过提供候选答案让模型选择最佳响应,能有效减少模型幻觉问题。Function Call允许模型调用外部工具或API来扩展能力,比如查询天气或执行计算,极大提升了Agent的功能范围。模型幻觉是指AI生成与事实不符的内容,通过RAG、参数调优和事实校验可以有效缓解。模型微调通过在特定领域数据上继续训练预训练模型,使其适应专业任务,如医疗或法律问答。链式调用将多个处理步骤串联起来,形成连贯的工作流程,常用于复杂任务的自动化处理。Agent作为智能代理,整合了上述所有技术,具备自主决策、工具调用和持续学习能力,能够完成从简单问答到复杂问题解决的全方位任务。构建高效Agent需要合理设计工作流程,选择适当的技术栈,并通过持续优化参数和评估指标来提升系统性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/90497.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/90497.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统编程——网络

一、TCP/UDP 1、osi模型 物理层、数据链路层、网络层、传输层、会话层、表示层、应用层(下层为上层提供服务) 2、TCP/IP模型(TCP/IP协议栈) 应用层: HTTP(超文本传输协议)、FTP(文件…

taro+pinia+小程序存储配置持久化

主要通过taro的getStorageSync,setStorageSync实现配置持久化 // https://pinia.esm.dev/introduction.html import { defineStore } from pinia; import { CreditCardDateUtils } from /untils/compute; import { getStorageSync, setStorageSync } from "tarojs/taro&qu…

抖音小游戏好做吗?

从0到1,教你打造爆款抖音小游戏随着移动互联网的发展,抖音小游戏凭借便捷即玩、流量庞大等优势,成为游戏开发者的热门选择。想知道如何开发出一款吸睛又好玩的抖音小游戏吗?下面就为你详细介绍开发流程。一、前期规划明确游戏类型…

Spring Boot 3核心技术面试指南:从迁移升级到云原生实战,9轮技术攻防(含架构解析)

面试官:cc程序员,聊聊Spring Boot 3的那些事儿? 场景背景 互联网大厂云原生架构部面试官老王,与自称"Spring Boot骨灰粉"的cc程序员展开技术对决。 面试过程 第一轮:迁移升级 面试官:Spring Boot…

技术演进中的开发沉思-42 MFC系列:Components 与 ActiveX Controls

点击程序启动时,是不是看过有加载的画面。在VC开发时,可使用 VC 的 Component Gallery,找到 Splash screen 组件,当时觉得组件就是给程序员的暖手宝。一、Component GalleryComponent Gallery 在 VC 里的位置很特别 —— 它藏在 “…

抽象类、接口、枚举

第八天(坚持)抽象类1.什么是抽象类,作用特点。抽象类是面向对象编程中一种特殊的类,它不能被实例化,主要用于作为其他类的基类(父类)。抽象类的主要作用是定义公共结构和行为规范,同…

在Ubuntu上使用QEMU仿真运行ARM汇编

ARM汇编一般无法在PC上直接运行,因为ARM和x86架构是不一样的。但是很多时候用ARM开发板是很不方便的,所以能不能直接在PC上仿真运行ARM汇编来练习呢?当然可以,那就是:使用QEMU来仿真。这篇文章我们就来演示下如何在Ubu…

【趣味解读】淘宝登录的前后端交互机制:Cookie-Session 如何保障你的账户安全?

在现代Web应用中,前后端交互是核心功能之一,而用户认证又是其中最关键的部分。本文将以淘宝登录为例,详细解析基于Cookie-Session的前后端交互流程,帮助开发者理解这一常见的安全认证机制。生动理解一下什么是cookie和seesion我们…

贪心算法(基础算法)

1.引言 ok啊,拖更这么长时间也是没有压力(doge) 不说啥,直接进入正题。 2.概念 这个贪心算法呢,看名字就知道,不就是每个步骤都挑最好的嘛,有啥难的。 这么说的话......其实确实&#xff0c…

简单的mcp 服务示例

参考:https://www.bilibili.com/video/BV1nyVDzaE1x 编写自己的tools.py #### tools.py from pathlib import Path import osbase_dir Path("./test")def read_file(name: str) -> str:"""Return file content. If not exist, return …

DeepSeek-R1+豆包迭代一次完成中国象棋游戏

DeepSeeek- R1生成的棋盘符合中国象棋风&#xff0c;单独豆包无法画好象棋棋盘。提示词&#xff1a;使用html实现中国象棋游戏&#xff0c;要求支持人机对弈。等等&#xff0c;你需要实现完整版本。代码如下&#xff08;电脑走棋不对&#xff09;&#xff1a;<!DOCTYPE html…

阿里通义千问Qwen3深夜升级:架构革新+性能碾压

&#xff08;以下借助 DeepSeek-R1 & Grok3 辅助整理&#xff09; 北京时间2025年7月22日凌晨&#xff0c;阿里云通义千问团队发布了Qwen3旗舰模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。这一更新不仅在性能上实现了突破&#xff0c;还标志着开源大模型技术架…

pip关于缓存的用法

pip cache info查看 pip 缓存的大小&#xff0c;运行示例 Package index page cache location (pip v23.3): c:\users\xxx\appdata\local\pip\cache\http-v2 Package index page cache location (older pips): c:\users\xxx\appdata\local\pip\cache\http Package index page c…

嵌入式学习-(李宏毅)机器学习(2)-day29

十五个作业不同类型的Functions两大类任务一个是Regression&#xff08;回归&#xff09; 一个是 Classification&#xff08;分类&#xff09;一个是给出一个数值&#xff0c;一个是从类别中选择一个还有一类任务 Structured Learning 机器要学会创造文件 机器学习预测频道第…

【C++11】哈希表与无序容器:从概念到应用

文章目录一、前言二、哈希表&#xff08;Hash Table&#xff09;1. 基本概念2. 哈希函数3. 冲突解决方法链地址法&#xff08;Separate Chaining&#xff09;开放寻址法&#xff08;Open Addressing&#xff09;4. 性能分析5. 动态扩容6. 应用场景7. 优缺点二. 无序容器的介绍1…

【智能大数据分析 | 实验二】Spark实验:部署Spark集群

【作者主页】Francek Chen 【专栏介绍】⌈⌈⌈智能大数据分析⌋⌋⌋ 智能大数据分析是指利用先进的技术和算法对大规模数据进行深入分析和挖掘&#xff0c;以提取有价值的信息和洞察。它结合了大数据技术、人工智能&#xff08;AI&#xff09;、机器学习&#xff08;ML&#xf…

使用pymongo进行MongoDB的回收

在 PyMongo 中使用 compact 命令进行 MongoDB 碎片回收的完整操作指南如下&#xff1a; 一、核心执行方法 from pymongo import MongoClient import time# 1. 连接到 MongoDB 实例 client MongoClient("mongodb://username:passwordhost:27017/dbname?authSourceadmin&q…

Azure DevOps 使用服务主体配置自托管代理 (Self-hosted Agent) 配置指南

Azure DevOps 使用服务主体配置自托管代理配置指南1. 概述2. 在 Azure AD 中创建服务主体 (SP)3. 授予 Azure DevOps 权限3.1. 组织层级&#xff1a;用户身份与访问级别3.2. 组织层级&#xff1a;Agent pools管理员3.3. 在 Linux VM 上安装和配置代理3.4. 启动并设置为系统服务…

Java学习第六十四部分——Nginx

目录 一、前言提要 二、核心特点 三、核心作用 四、架构优势 五、应用场景 六、常用命令 七、性能对比——Nginx vs Apache 八、典型用户 九、配置示例 十、Java应用需配合的配置 十一、性能优化策略 十二、常见问题排查 十三、文件结构配置 十四、总结归纳概述 …

几个常用的Oxygen编辑器插件

Oxygen XML Editor是罗马尼亚的SyncroSoft公司开发的结构化文档编辑和发布软件。 除了Oxygen编辑器带的功能&#xff0c;它还提供了丰富的插件来提供额外的功能来辅助资料开发人员更高效率、更低成本地开发结构化资料。 本文介绍几个比较常用和有用的插件。 - 1 - Git Clie…