李宏毅《生成式人工智能导论》 | 第9讲 AI Agent

文章目录

    • 大模型未来趋势:以大型语言模型打造的Agent
      • AI Agent运行的可能原理
      • 有记忆的ChatGPT

大模型未来趋势:以大型语言模型打造的Agent

人类需要做多步骤的复杂任务,AI可以做到这件事吗?

如果可以我们将其称为AI Agent,这里指AI可以做多步骤复杂任务,可以做计划能够修改计划。

目前已有的AI Agent例子

2022年7月,在ChatGPT之前,就有研究由语言模型操控机器人。

23年12月有人研究用大型语言模型开自驾车。

AI Agent运行的可能原理

理想中AI Agent应该具备的能力

Agent有一个终极目标,可能有记忆,记忆里存储过去和环境互动时获得的经验。

1.Agent从外界环境中了解外界的状态(比如通过文字输入、看见的图片、音频、触觉等)

2.根据终极目标、记忆和状态,Agent产生一个计划(短期目标)-达到终极目标之前,需要采取的行动

3.根据计划,Agent执行行为

4.Agent行动后,会对外界环境产生影响,会改变当前外界环境的状态。- 可以根据外界环境的状态学习到新的经验修改Agent的记忆,有可能修改原来的计划 - 可以通过反思修改原来的计划或者获取到新的经验(参考论文ReAcr和Reflexion)

具体的例子可以看老师的视频:https://www.bilibili.com/video/BV1XS411w7qr

当外界环境发生变化时,Agent产生新的行动计划

Agent反思之后,得到一些经验,经验会影响行动的决策。

有记忆的ChatGPT

有短期记忆的ChatGPT,ChatGPT没有长期记忆,只能记忆发生在同一个对话里的内容。如果开启新对话,ChatGPT不会有之前对话的记忆。

ChatGPT尝试去做有长期记忆,目前(25年6月)以已经实现了持久记忆功能Memory。持久记忆允许在不同会话之间保留信息,该功能支持的模型主要版本时GPT-4 Turbo(及以后)。

老师课程里介绍有记忆的ChatGPT可能的原理

当用户和ChatGPT对话结束后,ChatGPT可能会对对话的关键信息进行摘要,存储在记忆中。

当开启新对话时,过去对话的内容虽然不知道,但是根据记忆里的摘要信息可以知道之前对话的主要内容。

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与大语言模型(LLM)生成能力的技术架构,旨在通过动态引入外部知识提升模型回答的准确性、时效性,并减少“幻觉”(即模型虚构信息)问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/91336.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/91336.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OCR 与 AI 图像识别:协同共生的智能双引擎

OCR 擅长提取图像中的文字信息,但面对复杂背景、扭曲角度的图片时,容易受干扰;AI 图像识别能解析图像场景、物体形态,却难以精准捕捉文字细节 —— 两者结合才能释放最大价值。比如在票据处理中,AI 图像识别先定位票据…

C# 按照主题的订阅 按照类型的订阅

安装TinyPubSub库,按照 主题发布订阅using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Form…

当执行shell时,出现未预期的符号 `$‘\r‘‘ 附近有语法错误

1.当执行shell时,出现未预期的符号 $‘\r’’ 附近有语法错误 解决: linux下解决: 方案一: Linux下打开shell文件,用vi/vim命令打开脚本文件,输入“:set fileformatunix”,回车,保存…

合作共赢|华望系统科技受邀出席杭州市基础软件和工业软件产业技术联盟成立大会

大会现场(图源官方)2025年7月11日,在杭州市经济和信息化局(杭州市数字经济局)的指导下,杭州市基础软件与工业软件产业技术联盟成立大会暨工业软件生态共性云平台发布仪式在西电杭州研究院圆满举行。会上&am…

7.17 滑动窗口

lc523.同余定理两个注意点同余定理:余数相同的两个数,做差可被整除。--前缀和hash存mod,不可以用set,因为要保证len大于等于2,所以要存idx映射!!还有对于全选和全不选的两个边界,下标…

算法与前端的可访问性

引言 可访问性(Accessibility, a11y)是现代 Web 开发的核心,确保所有用户,包括残障人士,都能无障碍地使用应用。算法在优化前端性能的同时,也能通过高效的数据处理和交互逻辑提升可访问性体验。例如&#x…

使用token调用Spring OAuth2 Resource Server接口错误 insufficient_scope

1、场景 最近照着《Spring Security实战》学习,学到第18章,使用Keycloak作为授权服务器,使用 org.springframework.boot:spring-boot-starter-oauth2-resource-server 实现资源服务器,调用资源服务器的接口返回403,具…

4. 观察者模式

目录一、现实应用场景二、初步实现2.1 实现方案12.2 实现方案2三、观察者模式3.1 应用场景3.2 详解3.3 实现3.4 设计类图四、实现五、更多一、现实应用场景 教师的手机号改变之后要通知给所有学生如果有一个学生没有通知到位就会产生遗漏如何自动完成 二、初步实现 2.1 实现…

es 启动中的一些记录

完整修复流程 bash # 1. 创建用户主目录(如果需要) mkdir -p /home/es8 chown es8:es8 /home/es8# 2. 变更 Elasticsearch 目录所有权 chown -R es8:es8 /data/es/elasticsearch-8.17.2/# 3. 调整目录和文件权限 chmod -R 755 /data/es/elasticsearch-8.17.2/ chmod 644 /d…

区块链之拜占庭容错算法——Practical Byzantine Fault Tolerance(PBFT)

实用拜占庭容错算法(PBFT)是由 Barbara Liskov 和 Miguel Castro 于 90 年代末提出的一种共识算法。原论文链接如下: http://pmg.csail.mit.edu/papers/osdi99.pdf pBFT 被设计为在异步(响应请求的时间没有上限)系统…

从电子管到CPU

在线verilog转电路图 简单门电路 https://logic.ly/demo/ 数学基础 普通逻辑 与自然语言关系紧密, 亚里士多德三段论,‌‌穆勒五法 , 语言, 语义,概念,定义,辩论, 诈骗 等, 是文科类的逻辑。 离散数学 不连续数学 数理逻辑 命题逻辑与谓词逻辑, 与数学推理关系紧密, 它…

Javase-8.数组的练习

1.查找数组中指定元素(二分查找)以升序数组为例, 二分查找的思路是先取中间位置的元素, 然后使用待查找元素与数组中间元素进行比较: 如果相等,即找到了返回该元素在数组中的下标 如果小于,以类似方式到数组左半侧查找 如果大于,以…

H3CNE综合实验之机器人

H3CNE综合实验之机器人 实验拓扑图实验需求 1.按照图示配置 IP 地址 2.SW1 和 SW2 之间的直连链路配置链路聚合 3.公司内部业务网段为 Vlan10 和 Vlan20;Vlan10 是市场部,Vlan20 是技术部,要求对 Vlan 进行命名以识别; ​ PC8 属于 Vlan10&#xff0c…

2025/7/15——java学习总结

Java IO、Stream、异常与 File 全体系总结:从基础到进阶的完整突破一、核心知识深耕:四大模块的体系与底层逻辑(一)IO 流:数据传输的基础通道体系架构与核心分类按流向:输入流(InputStream/Read…

【轨物方案】当补贴退潮,光伏电站如何回归价值本质?

中国光伏产业正站在一个历史性的拐点。过去,国家补贴的“黄金时代”催生了装机量的爆发式增长,许多电站在建设初期将重心放在了快速并网,却忽视了贯穿2-30年生命周期的运维规划。如今,补贴浪潮逐渐退去,各大企业开始从…

群晖Nas - Docker(ContainerManager)上安装SVN Server和库权限设置问题

上次安装了Gitlab,可以参考这篇(群晖Nas - Docker(ContainerManager)上安装GitLab),今天来搞SVN服务器,废话不多说。 下载镜像 还是先下载镜像(garethflowers/svn-server&#xff…

前端打包自动压缩为zip--archiver

安装依赖 pnpm add archiver types/archiver/vitePlugins/autoBuildZip.ts import { Plugin } from vite; import archiver from archiver; import fs from fs;const compressFolder (folderPath: string, outputFilePath: string) > {const output fs.createWriteStream(…

React响应式组件范式:从类组件到Hooks

​引言 在UI开发中,"状态变化自动触发UI更新"的响应式机制是构建动态界面的核心。React通过独特的​​单向数据流​​和​​虚拟DOM(Virtual DOM)​​ 实现这一目标,但类组件(Class Components)…

com2tcp工具

com2tcp 是 com0com 套件中的一个实用工具,用于将本地串口(COM)数据转发到 TCP/IP 网络,或者将 TCP/IP 数据转发到本地串口,实现串口数据的网络透传。 1. com2tcp 基本用法 (1)安装 com0com 从…

MySQL实操:将Word表格数据导入MySQL表

文章目录 1. 提出任务1.1 Word表格数据1.2 查看商品空表1.3 任务要求2. 完成任务2.1 借助AI2.1.1 利用AI生成SQL语句2.1.2 在Navicat里执行查询2.1.3 查看商品表记录2.2 借助Excel2.2.1 将Word表格数据复制到Excel2.2.2 新建商品表2.2.3 利用导入向导将电子表格数据导入商品表2…