大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


大模型是Agent的「大脑」—— 用生活案例讲透通用推理能力

以下用“人类大脑 VS 大模型”类比 + 生活场景拆解,帮你直观理解大模型的「大脑」作用


一、核心逻辑:大模型 = Agent的智慧中枢

就像人类用大脑分析问题、指挥手脚干活,大模型(如GPT-4)在Agent中扮演 决策指挥官 的角色[2][5]。

人类场景Agent内部运作
你说“肚子饿”→ 大脑分析附近餐厅、选性价比最高的用户输入需求 → 大模型拆解任务、调用工具(地图+支付接口)
朋友借钱→大脑判断关系、利息、还款能力处理用户请求 → 大模型检查财务数据、风控规则[1][5]

二、大模型如何提供推理能力?分三步说清

1. 任务拆解:像解开一团毛线

例子:用户说:“我想带爸妈去三亚旅行,他们腿脚不好,预算1万。”

  • 大模型行动
    1️⃣ 拆分核心需求 → 交通(少步行)、住宿(无障碍)、景点(轻松游) [1]。
    2️⃣ 调用工具 → 查航班/筛选酒店/规划路线(见图)[6]。
用户需求
大模型拆解任务
工具1:查直飞航班
工具2:查找无障碍酒店
工具3:规划轮椅友好景点
生成最终方案

▲ 任务拆解与工具协作流程(引用第2章框架)

2. 逻辑推理:像侦探破案

原理:大模型内部通过「思维链(CoT)」技术,像写草稿纸一样一步步推导[2]。

例子:预算超标时的推理过程

机票5000元 + 酒店400元/天×5天 = 7000元
问题:剩余3000元不够景点门票+餐饮
重组方案:改订红眼航班(省2000元)+ 减少一晚住宿(省400元)→ 总预算控制成功 [1][6]。

3. 多工具协作:像乐队指挥

关键能力:协调不同工具(订票系统、计算器、数据库)共同完成任务[5][6]。

案例对比

无大模型有大模型
工具各干各的:机票工具只能查票,酒店工具只会订房大模型协调工具:先算总预算,再订票+订房+查天气,保证方案整体可行 [5][6]

三、生动案例:旅行管家Agent的一天

用户需求:周末北京出发去杭州,想看西湖,预算2500元

大模型「大脑」工作全流程

1️⃣ 感知需求:提取关键词:时间(周末)、地点(杭州)、限制条件(预算2500)[2][5]。
2️⃣ 调用知识库:查找西湖附近酒店价格、高铁耗时、景点开放时间[5]。
3️⃣ 生成方案

  • 北京→杭州高铁(4小时,二等座单程400元)
  • 酒店:西湖边汉庭2晚(总价800元)
  • 景点:西湖游船(80元/人)+ 灵隐寺(45元/人)
    4️⃣ 逻辑验证:总费用计算(400×2 + 800 + 80×2 + 45×2 = 2450元),不超预算[6]。
    5️⃣ 执行订票:调用12306接口订票,发送确认短信到用户手机[5][6]。
用户语音输入
大模型解析
知识库:查景点/交通
工具1:算总预算
工具2:订票系统
生成可行方案
执行器下单

▲ 流程涉及第2章规划能力与第5章工具调用


四、为什么必须用大模型?

1. 传统程序 VS 大模型Agent

传统程序大模型Agent
只能处理固定规则(如“价格>1000就报警”)能理解模糊指令(如“选性价比高的酒店”)[2]
遇到未预设的情况直接报错(如台风停航)自动调整方案(改订高铁/改日期)[6]

2. 核心价值总结

  • 通用性:同一套模型处理旅游、办公、医疗等不同任务[2][5]。
  • 应变力:用户临时加需求(“顺便预约接机”)能即时响应[6]。
  • 像人一样思考:考虑间接因素(如“带老人出行”选直达车次)[1][6]。

核心章节引用说明

  • 大模型角色:《大模型应用开发:动手做AI Agent 》第1章1.3节描述大模型作为Agent大脑的核心作用[2]。
  • 任务拆解方法:《大模型应用开发:动手做AI Agent 》第2章2.2节(思维链、ReAct框架)[1][5]。
  • 工具协作逻辑:《大模型应用开发:动手做AI Agent 》第2章2.4节(调用工具扩展能力)[5][6]。
  • 案例实现技术:《大模型应用开发:动手做AI Agent 》第6章(ReAct框架实战)[6]。

技术延伸阅读:《大模型应用开发:动手做AI Agent 》第3~6章通过订票助手、自动PPT制作等7个案例,展示不同场景的大模型推理实战(参考目录)[3]。


目录:总目录
上篇文章:大模型应用开发第二讲:核心能力:自主性、适应性、推理能力
下篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/82092.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第十四篇:MySQL 运维中的故障场景还原与排查实战技巧

本篇通过典型故障场景的还原与分析,帮助你掌握高效、系统的 MySQL 故障排查与应急处理方法,构建稳定可靠的数据库运维体系。 一、故障排查的基本思路 快速定位问题入口: 错误日志、连接报错、监控告警; 确认影响范围&#xff1a…

MySQL 分页查询优化

目录 前言1. LIMIT offset, count 的性能陷阱:为什么它慢?😩2. 优化策略一:基于排序字段的“跳跃式”查询 (Seek Method) 🚀3. 优化策略二:利用子查询优化 OFFSET 扫描 (ID Subquery)4. 基础优化&#xff1…

使用curlconverter网站快速生成requests请求包

在python写requests请求的时候,抓包后需要复制粘贴包的内容,然后手动修改和写代码。 最近发现一个好的网站 https://curlconverter.com/python/ 可以复制curl(bash)数据后,直接生成数据包,非常便捷。 举例说明: 选…

python打卡day41

简单CNN 知识回顾 数据增强 卷积神经网络定义的写法 batch归一化:调整一个批次的分布,常用与图像数据 特征图:只有卷积操作输出的才叫特征图 调度器:直接修改基础学习率 卷积操作常见流程如下: 1. 输入 → 卷积层 →…

系统思考:化繁为简的艺术

系统思考,其实是一门化繁为简的艺术。当我们能够把复杂的问题拆解成清晰的核心以及更加简单,从而提升团队的思考品质和行动品质,发挥最大的合力。 每个公司都想在某方面成为最优秀的,但是实际上具有穿透性的洞察力和摆脱虚荣心的清…

2025.05.28【Parallel】Parallel绘图:拟时序分析专用图

Improve general appearance Add title, use a theme, change color palette, control variable orders and more Highlight a group Highlight a group of interest to help people understand your story 文章目录 Improve general appearanceHighlight a group探索Paralle…

Elasticsearch父子关系解析

引言 在复杂业务场景中,数据关联查询是搜索与分析的核心需求。以电商订单、文章评论、客户关系等场景为例,传统关系型数据库通过外键实现的多表关联,在分布式搜索场景下面临性能与扩展性挑战。Elasticsearch通过父子关系(Parent-…

MCP架构全解析:从核心原理到企业级实践

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「storms…

开发者体验提升:打造高效愉悦的开发环境

“开发者体验不是奢侈品,而是生产力的倍增器。优秀的工具链能让开发者从机械劳动中解放,专注于创造真正有价值的东西。” —— 前端架构师 Sarah Drasner 1. 自定义 CLI 工具开发 (1) 基于 plop.js 的组件模板生成器 痛点分析:在大型项目中…

运用集合知识做斗地主案例

方法中可变参数 一种特殊形参,定义在方法,构造器的形参列表里,格式:数据类型...参数名称; 可变参数的特点和好处 特点:可以不传数据给它;可以传一个或者同时传多个数据给它;也可以…

websocket在vue中的使用步骤,以及实现聊天

一、WebSocket集成步骤 ‌连接初始化‌ 在Vue组件中创建WebSocket实例,建议在mounted生命周期中执行: data() {return {socket: null,messages: []} }, mounted() {this.socket new WebSocket(wss://your-server-endpoint); }‌事件监听配置 ‌连接成…

HarmonyOS鸿蒙Uniapp三方框架

鸿蒙Uniapp三方框架集成指南 一、环境配置 // 安装必要依赖 npm install ohos/hvigor-ohos-plugin --save-dev // 配置harmony模块 "harmony": {"compileSdkVersion": 9,"compatibleSdkVersion": 8,"arktsVersion": "1.0.0&quo…

【HW系列】—溯源与定位—Linux入侵排查

文章目录 一、Linux入侵排查1.账户安全2.特权用户排查(UID0)3.查看历史命令4.异常端口与进程端口排查进程排查 二、溯源分析1. 威胁情报(Threat Intelligence)2. IP定位(IP Geolocation)3. 端口扫描&#x…

C++17新特性 Lambda表达式

//lambda表达式的基本语法如下&#xff1a; /* [捕获列表] (参数列表)mutable(可选)异常属性 -> 返回类型 { // 函数体 }*/ 1&#xff0c;值捕获 //1&#xff0c; 值捕获示例 #include <iostream> void lambda_value_capture() {int value 1;auto copy_value/*返…

园区智能化集成平台汇报方案

该方案为园区智能化集成平台设计,依据《智能建筑设计标准》等 20 余项国家与行业规范,针对传统园区信息孤岛、反应滞后、经验流失、管理粗放等痛点,构建可视化智慧园区管理平台,实现大屏数据可视化、三维设备监控、智慧运维(含工单管理、巡检打卡)、能源能耗分析、AI 安防…

Vue-自定义指令

自定义指令 简单写法 v-twoAge 功能&#xff1a; 当前年龄翻倍 注意&#xff1a;指令方法名称 小写 代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><title>自定义指令</title><!-- 引入V…

Kotlin 中的数据类型有隐式转换吗?为什么?

在 Kotlin 中&#xff0c;基本数据类型没有隐式转换。主要出于安全性和明确性的考虑。 1 Kotlin 的显式类型转换规则 Kotlin 要求开发者显式调用转换函数进行类型转换&#xff0c; 例如&#xff1a; val a: Int 10 val b: Long a.toLong() // 必须显式调用 toLong() // 错…

Android获取设备信息

使用java: List<TableMessage> dataListnew ArrayList<TableMessage>();//获取设备信息Hashtable<String,String> ht MyDeviceInfo.getDeviceAllInfo2(LoginActivity.this);for (Map.Entry<String, String> entry : ht.entrySet()) {String key entry…

WIN11使用vscode搭建c语言开发环境

安装 VS Code 下载地址: Visual Studio Code - Code Editing. Redefined 安装时勾选 "添加到 PATH"&#xff08;方便在终端中调用 code 命令 下载 MSYS2 官网&#xff1a;MSYS2 下载 msys2-x86_64-xxxx.exe&#xff08;64位版本&#xff09;并安装。 默认安装路径…

微信小程序带数组参数跳转页面,微信小程序跳转页面带数组参数

在微信小程序中&#xff0c;带数组参数跳转页面需要通过JSON序列化和URL编码处理&#xff0c;以下是具体实现方法 传递数组参数‌&#xff08;发送页面&#xff09; wx.navigateTo({url: /pages/targetPage?arr encodeURIComponent(JSON.stringify(yourArray)) });接收数组参…