LLMs之Agent:ChatGPT Agent发布—统一代理系统将研究与行动无缝对接,开启智能助理新时代

LLMs之Agent:ChatGPT Agent发布—统一代理系统将研究与行动无缝对接,开启智能助理新时代

目录

OpenAI重磅发布ChatGPT Agent—统一代理系统将研究与行动无缝对接,开启智能助理新时代

第一部分:Operator 和深度研究的自然演进

第二部分:一个与您协作、为您工作的智能代理

第三部分:拓展真实世界的实用性

第四部分:使用方式

第五部分:新能力带来的新风险

第六部分:最强生物风险安全防护

第七部分:可用性

第八部分:局限性与未来展望


OpenAI重磅发布ChatGPT Agent—统一代理系统将研究与行动无缝对接,开启智能助理新时代

地址

地址:https://openai.com/index/introducing-chatgpt-agent/

时间

2025717

作者

OpenAI

第一部分:Operator 和深度研究的自然演进

OpenAI 将此前独立的 Operator(可在网页上进行点击、滚动、输入等交互操作)与深度研究模型(擅长信息综合与生成长文报告)合并,形成一个统一的代理系统,使模型既能深入分析信息,又能主动在网页上执行操作,解决了两者各自的局限性

核心要点

>> 互补优势融合:Operator 擅长网页交互,而深度研究擅长信息汇总;二者合并后,模型能够同时完成访问信息和深度分析的全过程
>> 主动式任务执行:新系统不再仅仅生成文本,而是能够“思考并行动”,根据用户指令主动在虚拟浏览器中执行一系列操作。
>> 无缝切换模式:用户可在同一对话中,从简单对话自由过渡到要求模型执行具体操作,流程自然流畅。

经验与技巧

>> 在实际应用时,可先让模型简单浏览网页(文本模式),如需下载文件或登录,切换至可视化浏览器并授权“接管”模式。
>> 对于需要深度报告的任务,明确告知模型所需分析深度与格式,充分利用其深度研究能力。

第二部分:一个与您协作、为您工作的智能代理

ChatGPT Agent 提供了一套多样化工具,包括可视化浏览器、文本浏览器、终端API 连接器,可根据任务需求灵活选择最优执行路径,并能连接 Gmail、GitHub 等应用,实现与现有工作流的无缝集成。

核心要点

>> 多元化工具箱:可视化浏览器用于处理以人类为设计对象的网站,文本浏览器便于大规模文本检索与分析,终端可运行代码,API 连接器可访问日历、收件箱等私有数据。
>> 虚拟计算机环境:所有操作均在独立的虚拟机中进行,保持任务上下文一致,无需用户来回切换环境。
>> 实时协作与中断可控:用户可随时中断、澄清指令或接管浏览器,模型会保留已有进度并根据新指示继续执行。

经验与技巧

>> 在需要处理敏感数据时,先在浏览器中“接管”登录,确保 API 连接器仅用于读取权限而不开放过度控制。
>> 面对多步骤任务,可将每一步拆分,引导模型先规划再执行,以降低因一次性复杂指令带来的错误风险。

第三部分:拓展真实世界的实用性

Agent 能自动执行工作场景中的重复性任务(如将仪表盘转换为可编辑的演示文稿、更新财务表格)以及个人场景中的生活规划(如旅行行程、晚宴规划、预约安排),大幅提升效率

核心要点

>> 职场自动化:准备演示文稿、整理会议日程、生成财务模型、构建竞争分析报告等,模型输出可直接编辑。
>> 个人助理:规划和预订旅行、菜品采购与烹饪计划、专家预约等一应俱全。
>> SOTA 性能:在 Humanity’s Last Exam(41.6 pass@1)和 FrontierMath(27.4% 正确率)、内部知识工作基准、DSBench、SpreadsheetBench(45.5%)等评测中多项领先。

经验与技巧

>> 针对专业任务,可参考Benchmark的示例指令,确保模型在关键步骤(如数据下载、图表生成)中采用正确工具。
>> 在对比多种方案时,利用并行多次尝试(parallel rollout)提高成功率,并通过自信度指标选出最佳结果。

第四部分:使用方式

用户可在对话界面的工具下拉菜单中,随时切换至“agent mode”,描述所需任务并监控模型的每一步操作,还能设置定期自动执行(如每周报告)。

使用地址:https://chatgpt.com/?openaicom-did=bdc39a56-270f-4ce0-9f6c-1736d412fe83&openaicom_referred=true

核心要点

>> 一键启用与描述:选择“agent mode”后,用自然语言描述任务要求。
>> 操作可视化:执行过程中,屏幕上实时展示模型执行步骤,可中途插入指令或接管操作。
>> 任务调度:支持定期任务,如每周自动生成并发送报告。

经验与技巧

>> 在首次使用时,可先让模型执行一遍示例任务,熟悉“屏幕叙述”流程与中断机制。
>> 对于周期性强的工作,提前配置好模板(例如 PowerPoint、电子表格),并设置自动调度,最大化节省操作时间。

第五部分:新能力带来的新风险

ChatGPT Agent 可直接在网页上执行操作并访问用户数据,虽然配备了多层次安全控制,但整体风险相较于仅生成内容的模型有所提升,需要用户在使用时谨慎衡量。

核心要点

>> 提示注入风险:恶意页面可通过隐藏提示操控模型行为,可能导致敏感数据泄露或误操作。
>> 误操作风险:在执行真实交易或发送电子邮件等关键操作前,模型会主动请求用户确认;但用户仍需保持警惕。
>> 数据隐私控制:提供一键删除浏览数据与退出所有会话的功能,且“接管模式”下模型不存储用户输入(如密码)。

经验与技巧

>> 勿在未审查过的网址或可疑网页上启用 Agent;对于高风险操作,务必手动确认所有请求。
>> 定期清理浏览数据,并仅在必要时启用连接器遵循最小权限原则

第六部分:最强生物风险安全防护

鉴于模型具备执行命令、运行代码等能力,OpenAI 将 Agent 定为“高生物与化学能力”级别,部署了最全面的生物安全防护措施,并与外部专家合作持续强化安全评估与监测。

核心要点

>> 威胁建模与双重拒绝训练:对潜在双用途生物技术攻击场景进行全面建模与训练。
>> 实时分类与监控:持续监测生成内容,防止双用途信息泄露。
>> 生态协作:与政府、学术机构和 NGO 合作举办研讨会,确保全球范围的生物安全防护。

经验与技巧

>> 在涉及生物或化学敏感话题时,倾向使用更严格的“深度研究”模式,以获得更详细的风险评估与安全建议。

第七部分:可用性

ChatGPT Agent 自 2025 年 7 月 17 日起面向 Pro、Plus 和 Team 用户逐步开放,Pro 用户当日可用,每月配额 400 次,Plus/Team 用户每月 40 次;Enterprise、教育版将于数周内上线,欧洲地区正在适配中。

核心要点

>> 分层配额:Pro:400 消息/月;Plus/Team:40 消息/月,可额外购买。
>> 区域差异:欧洲经济区与瑞士用户暂未开放,需要等待后续迭代。
>> Operator 研究版日落:深度研究功能集成至 Agent,下线前可继续通过下拉菜单访问。

经验与技巧

>> Pro 用户可根据需求灵活分配配额,团队可统一购买信用点以满足高频使用场景。

第八部分:局限性与未来展望

当前版本仍处于早期阶段,幻灯片生成功能为 Beta,格式美观度与细节打磨尚需改进;未来将持续增强模型效率、深度与多样性,优化用户监督体验。

核心要点

>> 幻灯片功能:目前可生成基本结构,可编辑性强,但导出与预览偶有差异。
>> 表格编辑:已支持上传现有电子表格,但幻灯片模板导入功能尚未上线。
>> 持续迭代:下一个版本将重点提升输出精度、格式优化与监督需求平衡。

经验与技巧

>> 对于正式演示,目前建议先让 Agent 生成初稿,再由人工优化排版与视觉元素;
>> 密切关注后续更新公告,及时体验新功能与改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/90559.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/90559.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux726 raid0,raid1,raid5;raid 创建、保存、停止、删除

RAID创建 创建raid0 安装mdadm yum install mdadm mdadm --create /dev/md0 --raid-devices2 /dev/sdb5 /dev/sdb6 [rootsamba caozx26]# mdadm --create /dev/md0 --raid-devices2 /dev/sdb3 /dev/sdb5 --level0 mdadm: Defaulting to version 1.2 metadata mdadm: array /dev…

深入剖析 MetaGPT 中的提示词工程:WriteCode 动作的提示词设计

今天,我想和大家分享关于 AI 提示词工程的文章。提示词(Prompt)是大型语言模型(LLM)生成高质量输出的关键,而在像 MetaGPT 这样的 AI 驱动软件开发框架中,提示词的设计直接决定了代码生成的可靠…

关于 ESXi 中 “ExcelnstalledOnly 已禁用“ 的解决方案

第一步:使用ssh登录esxi esxcli system settings advanced list -o /User/execInstalledOnly可能会得到以下内容 esxcli system settings advanced list -o /User/execInstalledOnlyPath: /User/ExecInstalledOnlyType: integerInt Value: 0Default Int Value: 1Min…

HTML5 Canvas 绘制圆弧效果

HTML5 Canvas 绘制圆弧效果 以下是一个使用HTML5 Canvas绘制圆弧的完整示例&#xff0c;你可以直接在浏览器中运行看到效果&#xff1a; <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"view…

智能Agent场景实战指南 Day 18:Agent决策树与规划能力

【智能Agent场景实战指南 Day 18】Agent决策树与规划能力 开篇 欢迎来到"智能Agent场景实战指南"系列的第18天&#xff01;今天我们将深入探讨智能Agent的核心能力之一&#xff1a;决策树与规划能力。在现代业务场景中&#xff0c;Agent需要具备类似人类的决策能力…

AI 编程工具 Trae 重要的升级。。。

大家好&#xff0c;我是樱木。 今天打开 Trae &#xff0c;已经看到它进行图标升级&#xff0c;之前的图标&#xff0c;国际和国内版本长得非常像&#xff0c;现在做了很明显的区分&#xff0c;这点给 Trae 团队点个赞。 自从 Claude 使出了压力以来&#xff0c;Cursor 锁区&…

排序算法,咕咕咕

1.选择排序void selectsort(vector<int>& v) { for(int i0;i<v.size()-1;i) {int minii;for(int ji1;j<v.size();j){if(v[i]>v[j]){minij;}}if(mini!i)swap(v[i],v[mini]); } }2.堆排序void adjustdown(vector<int>& v,int root,int size) { int …

数据库查询系统——pyqt+python实现Excel内查课

一、引言 数据库查询系统处处存在&#xff0c;在教育信息化背景下&#xff0c;数据库查询技术更已深度融入教务管理场景。本系统采用轻量化架构&#xff0c;结合Excel课表&#xff0c;通过PythonPyQt5实现跨平台桌面应用&#xff0c;以实现简单查课效果。 二、GUI界面设计 使用…

base64魔改算法 | jsvmp日志分析并还原

前言 上一篇我们讲了标准 base64 算法还原&#xff0c;为了进一步学习 base64 算法特点&#xff0c;本文将结合 jsvmp 日志&#xff0c;实战还原出 base64 魔改算法。 为了方便大家学习&#xff0c;我将入参和上篇文章一样&#xff0c;入参为 Hello, World!。 插桩 在js代码中&…

vue3笔记(2)自用

目录 一、作用域插槽 二、pinia的使用 一、Pinia 基本概念与用法 1. 安装与初始化 2. 创建 Store 3. 在组件中使用 Store 4. 高级用法 5、storeToRefs 二、Pinia 与 Vuex 的主要区别 三、为什么选择 Pinia&#xff1f; 三、定义全局指令 1.封装通用 DOM 操作&#…

大模型面试回答,介绍项目

1. 模型准备与转换&#xff08;PC端/服务器&#xff09;你先在PC上下载或训练好大语言模型&#xff08;如HuggingFace格式&#xff09;。用RKLLM-Toolkit把模型转换成瑞芯微NPU能用的专用格式&#xff08;.rkllm&#xff09;&#xff0c;并可选择量化优化。把转换好的模型文件拷…

Oracle 19.20未知BUG导致oraagent进程内存泄漏

故障现象查询操作系统进程的使用排序&#xff0c;这里看到oraagent的物理内存达到16G&#xff0c;远远超过正常环境&#xff08;正常环境在19.20大概就是100M多一点&#xff09;[rootorastd tmp]# ./hmem|more PID NAME VIRT(kB) SHARED(kB) R…

尝试几道算法题,提升python编程思维

一、跳跃游戏题目描述&#xff1a; 给定一个非负整数数组 nums&#xff0c;你最初位于数组的第一个下标。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标。示例&#xff1a;输入&#xff1a;nums [2,3,1,1,4] → 输出&#xff1a;True输入…

【菜狗处理脏数据】对很多个不同时间序列数据的文件聚类—20250722

目录 具体做法 可视化方法1&#xff1a;PCA降维 可视化方法2、TSNE降维可视化&#xff08;非线性降维&#xff0c;更适合聚类&#xff09; 可视化方法3、轮廓系数评判好坏 每个文件有很多行列的信息&#xff0c;每列是一个驾驶相关的数据&#xff0c;需要对这些文件进行聚类…

Qwen-MT:翻得快,译得巧

我们再向大家介绍一位新朋友&#xff1a;机器翻译模型Qwen-MT。开发者朋友们可通过Qwen API&#xff08;qwen-mt-turbo&#xff09;&#xff0c;来直接体验它又快又准的翻译技能。 本次更新基于强大的 Qwen3 模型&#xff0c;进一步使用超大规模多语言和翻译数据对模型进行训练…

在 OceanBase 中,使用 TO_CHAR 函数 直接转换日期格式,简洁高效的解决方案

SQL语句SELECT TO_CHAR(TO_DATE(your_column, DD-MON-YY), YYYY-MM-DD) AS formatted_date FROM your_table;关键说明&#xff1a;核心函数&#xff1a;TO_DATE(30-三月-15, DD-MON-YY) → 将字符串转为日期类型TO_CHAR(..., YYYY-MM-DD) → 格式化为 2015-03-30处理中文月份&a…

pnpm运行electronic项目报错,npm运行正常。electronic项目打包为exe报错

pnpm运行electronic项目报错 使用 pnpm 运行 electronic 项目报错&#xff0c;npm 运行正常&#xff0c;报错内容如下 error during start dev server and electron app: Error: Electron uninstallat getElectronPath (file:///E:/project/xxx-vue/node_modules/.pnpm/elect…

8️⃣ 高级特性—— 列表生成式

文章目录&#x1f9e0; 总结1. 基本语法2. 加筛选条件&#x1f501; 双层循环&#xff08;全排列&#xff09;&#x1f4c2; 遍历目录&#x1f511; 遍历字典&#x1f521; 转小写3. if 和 if...else 的区别4. 练习题&#x1f9e0; 总结 特性用法示例基础语法[x for x in iter…

DocC的简单使用

DocC的简单使用 在写3GShare中&#xff0c;由于刚开始使用MVC模式来写东西&#xff0c;对很多东西都不是很熟&#xff0c;经常写着写着就忘了自己在写什么&#xff0c;所以学了一下DocC来加快开发进度 什么是DocC 简单来说&#xff0c;DocC就是更高级的注释&#xff0c;虽然…

深入理解C语言快速排序与自省排序(Introsort)

排序算法是计算机科学中最基础也是最重要的知识之一。快速排序&#xff08;Quicksort&#xff09;因其平均时间复杂度为 O(n log n) 而广受欢迎&#xff0c;但在最坏情况下会退化到 O(n)。为了克服这一缺点&#xff0c;自省排序&#xff08;Introsort&#xff09; 应运而生&…