大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


Agent成熟度模型详解:从「智能客服」到「科幻管家」

手机进化史类比AI Agent发展路径,结合书中技术框架梳理阶段特征


一、成熟度分级表(先看全局)

级别名称能力类比典型特征案例参考
L1基础对话模型功能机(只能打电话)单轮问答,无上下文记忆早期客服机器人
L2ChatGPT级(初级Agent)智能手机(装App扩展能力)简单规划+调用单个工具GPT-4联网版
L3专业领域Agent智能手表(健康监测)多步骤决策+领域工具链协作医疗诊断Agent
L4自主Agent科幻管家(贾维斯)跨系统协作+动态学习+自我优化电影《钢铁侠》AI

二、逐级拆解(含技术原理与案例)

▶ L2级:会查资料的「实习生」

核心特征

  • 有限规划:拆解简单任务(如“查天气→推荐穿搭”)[2][5]
  • 单一工具:每次调用1个接口(如地图API)[5]
  • 线性执行:出错需人工修正(订单失败就卡住)[6]

生活案例:旅行清单助手

用户说:“下周末去杭州要带什么?”
1️⃣ 查杭州天气(调用天气API → 显示有雨)[5]
2️⃣ 生成清单:雨伞、薄外套 → 结束任务[6]

用户提问
调用天气API
是否下雨?
建议带伞
建议防晒用品

▲ 线性决策流程(第5章Function Calling示例)


▶ L3级:行业专家级的「部门主管」

技术突破

  • 多级规划:任务树分解(如看病→挂号→检查→开药)[1][6]
  • 工具链协作:连续调用多个系统(医保计算+药房库存查询)[6]
  • 异常处理:预算超支自动切换方案(如改用平价替代药)[6]

医疗Agent实战流程
1️⃣ 患者输入症状 → 拆解为[挂号科室→检查项目→取药] [1]
2️⃣ 调用医院HIS系统查号源 → 推荐最近三甲医院 [5][6]
3️⃣ 检查报告解读 → 自动对比历史病例库 [5]
4️⃣ 开药时检测医保余额 → 不足时触发短信提醒 [6]

症状描述
分解就诊步骤
工具1:挂号系统
工具2:检查项库
工具3:医保计算器
生成就诊方案
患者确认?
执行预约
重新规划

▲ 多工具协作流程(第6章ReAct框架)


▶ L4级:全能型的「CEO助理」

质变特征(相比L3):

  • 动态学习:从用户反馈优化策略(如记住用户常选航空公司)[4]
  • 跨系统协同:同时调度物流+支付+供应链系统 [6]
  • 自主纠错:航班取消时自动改签+重订酒店+通知客户 [4][6]

案例:情人节鲜花危机救援
1️⃣ 感知异常:物流系统报警 → 50%库存损毁[6]
2️⃣ 动态规划
▸ 查找备用供应商(调用3个鲜花平台API)
▸ 比价后锁定本地批发市场现货 [6]
3️⃣ 多线程执行
▸ 向批发商付款 → 调用企业支付接口
▸ 同步更新客户订单 → 发送延迟补偿券 [6]
4️⃣ 经验沉淀:将本次方案存入危机应对知识库 [2][4]

库存告警
自主启动应急预案
并行调用工具
供应商检索API
比价算法
物流调度系统
成本<预算?
全自动采购
发起人工审批

▲ L4自主决策流程(第6章Plan-and-Execute案例)


三、关键技术支撑(书中核心章节索引)

L2→L3跃迁关键

  • 任务分解技术:思维链(Chain of Thought) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 工具调度能力:外部规划器(PDDL语言转换) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 验证反馈机制:ReAct框架的思考-行动循环 → 《大模型应用开发:动手做AI Agent 》第6章[6]

L3→L4跃迁关键

  • 长期记忆系统:向量数据库存储历史经验 → 《大模型应用开发:动手做AI Agent 》第2章2.3节[5]
  • 动态学习架构: Reflexion框架的自我反思 → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 多Agent协同: 边缘计算节点分工协作 → 《大模型应用开发:动手做AI Agent 》附录A[4]

四、未来展望:L5级「数字生命」会远吗?

书中线索(《大模型应用开发:动手做AI Agent 》附录A方向):

  • 具身智能: Agent控制实体机器人维修设备 [4]
  • 人机共生: AI实时学习用户习惯 → 下班前自动调节家中空调[4]
  • 社会协作: 物流Agent与交通Agent协商最优配送路线 [4]

科幻照进现实的时间表

2024-01-01 2025-01-01 2026-01-01 2027-01-01 2028-01-01 2029-01-01 2030-01-01 L3医疗Agent L4供应链Agent L5具身Agent 城市级Agent网络 当前阶段 未来5年 Agent进化路线预测

关键引用

  • 多模态Agent方向 → 《大模型应用开发:动手做AI Agent 》附录A.3节[4]
  • 边缘系统部署技术 → 《大模型应用开发:动手做AI Agent 》附录A.2节[4]
  • 自主进化架构 → 《大模型应用开发:动手做AI Agent 》第6章ReAct扩展案例[6]

目录:总目录
上篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)
下篇文章:大模型应用开发第六讲:目标:从被动响应到主动决策与执行


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Delphi 导入excel

Delphi导入Excel的常见方法可分为两种主流方案&#xff1a;基于OLE自动化操作Excel原生接口和利用第三方组件库。以下为具体实现流程及注意事项&#xff1a; ‌一、OLE自动化方案&#xff08;推荐基础场景&#xff09;‌ 该方法通过COM接口调用本地安装的Excel程序&#xff0c…

Selenium的第四天打卡——Selenium浏览器应用(完整版)

Selenium浏览器应用 目录 Selenium浏览器应用 一、浏览器操作示例代码 1.设置浏览器缩放大小 2.浏览器前进和后退 3.浏览器刷新 二、WebDriver常见方法 三、鼠标事件示例 四、键盘事件示例 五、获取断言信息 六、窗口的切换 七、关键注意事项 一、浏览器操作示例代…

PMO价值重构:从项目管理“交付机器”到“战略推手”

在数字化转型浪潮中&#xff0c;项目管理办公室&#xff08;PMO&#xff09;正经历着前所未有的角色蜕变。传统上&#xff0c;PMO往往被视为项目管理的“交付机器”&#xff0c;专注于项目的按时交付和资源分配。然而&#xff0c;随着企业对战略执行的重视&#xff0c;PMO正逐渐…

本地依赖库的版本和库依赖的版本不一致如何解决?

我用的 yarn v4 版本&#xff0c;所以以下教程命令都基于yarn 这里假设我报错的库名字叫 XXXXXXXX&#xff0c;依赖他的库叫 AAAAAAAA 排查解决思路分析&#xff1a; 首先查看一下 XXXXXXXX 的依赖关系&#xff0c;执行 yarn why XXXXXXXX 首先我们要知道 yarn 自动做了库…

SQLiteStudio - 免费开源、轻量高效,跨平台的 SQLite 数据库管理工具,代替 Navicat for SQLite

管理 SQLite 数据库就用这款软件&#xff0c;真的早该摒弃破解和盗版的 Navicat 了。 SQLiteStudio 是一款专注于管理 SQLite 数据库 的桌面软件&#xff0c;用于浏览和编辑 SQLite 数据库文件。软件的作者是来自波兰的开发者 Paweł Salawa&#xff0c;他是一位拥有 20 年 Ja…

DeepSeek R1-0528 新开源推理模型(免费且快速)

DeepSeek推出了新模型,但这不是R2! R1-0528是DeepSeek的最新模型,在发布仅数小时后就在开源社区获得了巨大关注。 这个悄然发布的模型DeepSeek R1-0528,已经开始与OpenAI的o3一较高下。 让我来详细介绍这次更新的新内容。 DeepSeek R1-0528 发布 DeepSeek在这次发布中采…

Opera Neon发布该公司首款“AI代理”浏览器

Opera 的浏览器产品组合今日迎来了新成员。Opera Neon 是该公司首款“AI 代理”浏览器&#xff0c;旨在“重新思考浏览器在代理网络中的角色”。开发人员声称&#xff0c;Neon 能够理解用户的意图&#xff0c;并利用 AI 驱动的功能将其转化为行动。 Opera Neon 由三个主要部分…

网络安全之Web渗透加解密

项目基本使用 准备环境&#xff1a;node.js python chrome npm install chrome-remote-interface pip install playwright playwright install chromium pip install mitmproxy ............... 第一步启动cdp.js。 第二步使用python .\cdp_load.py vue_demo&#xff0c;连…

【VSCode-Qt】Docker远程连接的项目UI文件在 VSCode 上无法预览

Docker远程连接的UI文件在 VSCode 上无法预览&#xff0c;通常是因为 VSCode 通过远程开发扩展&#xff08;Remote - SSH/Docker&#xff09;连接到 Docker 容器时&#xff0c;某些图形化功能未正确配置或支持。以下是可能原因和解决方案&#xff1a; 原因分析 X11 转发未配置…

【HW系列】—web组件漏洞(Strtus2和Apache Log4j2)

本文仅用于技术研究&#xff0c;禁止用于非法用途。 文章目录 Struts2Struts2 框架介绍Struts2 历史漏洞汇总&#xff08;表格&#xff09;Struts2-045 漏洞详解 Log4j2Log4j2 框架介绍Log4j2 漏洞原理1. JNDI 注入2. 利用过程 Log4j2 历史漏洞JNDILDAP 反弹 Shell 流程 Strut…

《深度关系-从建立关系到彼此信任》

陈海贤老师推荐的书&#xff0c;花了几个小时&#xff0c;感觉现在的人与人之间特别缺乏这种深度的关系&#xff0c;但是与一个人建立深度的关系并没有那么简单&#xff0c;反正至今为止&#xff0c;自己好像没有与任何一个人建立了这种深度的关系&#xff0c;那种双方高度同频…

sass基础语法

Sass&#xff08;Syntactically Awesome Style Sheets&#xff09;是一种 CSS 预处理器&#xff0c;提供了比原生 CSS 更强大、更灵活的语法功能。它有两种语法格式&#xff1a; Sass&#xff08;缩进语法&#xff0c;.sass 文件&#xff09;SCSS&#xff08;CSS-like 语法&am…

【JavaWeb】基本概念、web服务器、Tomcat、HTTP协议

目录 1. 基本概念1.1 基本概念1.2 web应用程序1.3 静态web1.4 动态web 2. web服务器3. tomcat详解3.1 安装3.2 启动3.3 配置3.3.1 配置启动的端口号3.3.2 配置主机的名称3.3.3 其他常用配置项日志配置数据源配置安全配置 3.4 发布一个网站 4. Http协议4.1 什么是http4.2 http的…

AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷

随着AI的技术进步和工具普及&#xff0c;尤其是在这两年的跃进之后&#xff0c;AI在游戏行业内的应用已经逐步由理念设想推向落地实践。从蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大厂家呈现的游戏AI新亮点&#xff0c;我们看到了更多AI与游戏的结合方式&#x…

Android Studio 2022.2.1.20 汉化教程

查看Android Studio 版本 Android Studio Flamingo | 2022.2.1 Patch 2 下载&#xff1a;https://plugins.jetbrains.com/plugin/13710-chinese-simplified-language-pack----/versions/stable

常见的分词算法

常见的分词方法分类如下&#xff1a; 类型名称说明优缺点1️⃣ 基于空格/标点Word-level以空格或标点划分&#xff0c;如 "Hello, world!" → ["Hello", ",", "world", "!"]✅简单&#xff0c;❌无法处理新词&#xff0c;词…

湖北理元理律师事务所观察:债务优化如何成为民生安全网

据央行2023年报告&#xff0c;中国家庭债务收入比达137.8%。面对债务高压&#xff0c;湖北理元理律师事务所的实践揭示&#xff1a;专业债务规划的价值不仅是减负数字&#xff0c;更是构建社会稳定的微观防线。 一、从“催收恐惧”到“主动管理”的转变 该所服务数据显示&…

服务器密码安全运维解决新思路:凭据管理SMS+双因素SLA认证结合的方案

引言&#xff1a;云服务器安全成本困局 在云计算渗透率突破60%的今天&#xff0c;中小企业正面临严峻的安全悖论&#xff1a;某权威机构数据显示&#xff0c;72%的云上数据泄露事件源于凭据管理不当&#xff0c;而传统安全解决方案的采购成本往往超过中小企业年利润的8%。这种…

Vision Transformer网络结构

0.前言 参考CSDN大佬(太阳花的小绿豆)的代码&#xff0c;梳理了一下vit的网络结构&#xff0c;代码地址如下&#xff1a; deep-learning-for-image-processing/pytorch_classification/vision_transformer at master WZMIAOMIAO/deep-learning-for-image-processing GitHub …

C++ 图像处理库 CxImage 简介 (迁移至OpenCV)

文章目录 核心功能特点局限性与替代方案常用方法构造函数从数组创建图像访问属性访问像素点Windows平台支持 常用方法迁移至OpenCV CxImage 是一款功能强大的图像处理类库&#xff0c;主要用于 Windows 平台的图像处理任务。它支持多种图像格式的加载、保存、编辑及特效处理&am…