ChatGPT 5的编程能力宣传言过其实

2025年的8月7日,OpenAI 正式向全球揭开了GPT-5的神秘面纱,瞬间在 AI 领域乃至整个科技圈引发了轩然大波。OpenAI对GPT-5的宣传可谓不遗余力,将其描绘成一款具有颠覆性变革的 AI 产品,尤其在编程能力方面,给出了诸多令人瞩目的描述 。

图片

OpenAI声称,GPT-5堪称他们有史以来最为强大的编码模型。在复杂的前端生成任务中,它能够仅凭用户给出的一个简单提示,便迅速创建出美观且响应式极佳的网站、应用程序以及游戏。

我也在今天第一时间测试了一下GPT-5的具体编程能力。从结果来看,GPT-5的实际编程能力仍然不如Claude,甚至不如DeepSeek R1的最新版本。

我们首先用以下提示词要求GPT-5, Claude和DeepSeek的网页版生成一个html: 

“使用HTML设计一个类似Outlook的界面,可以通过cdn使用开源的css和字体,Javacript等。保持界面美观”

以下为这三个大模型生成的网页。

GPT-5:

图片

Claude:

图片

DeepSeek R1:

图片

从功能上来讲,基本上这三个大模型生成的网页功能覆盖都比较类似。也都是响应式布局。但是在具体呈现上来说,GPT-5就显得简陋得多。

实际上在我对网页Javascript功能也试了一下就发现,GPT-5生成的网页上,除了邮件标题可以点击以外,其他地方几乎都不能点击。而Claude和DeepSeek生成的网页,文件夹,切换邮件时候都是有内容变化的效果的。这也从侧面反映了GPT-5在思考编程问题时思考不够全面。

之后我用Cursor和Roo Code(因为Cursor中的DeepSeek不是官网版本,所以用Roo Code + DeepSeek API key的方式)测试了一下它们对复杂Agentic AI编程的支持。提示词为:

“设计一个Agentic AI程序,可以根据用户的自然语言输入,针对一个或者多个文件夹下的文件,进行敏感数据处理,以便可以和隐私法规(如GDPR)相符合。要求:1,用户可以随时中断Agent的工作,也可以在中断后通过自然语言譬如“继续以前的工作”以继续进行;2,考虑到需要处理的文件数目和大模型Token限制,Agent应该把工作规划为不同阶段以完成所有工作;3,文件可能有不同语言,判断文件中使用的主要语言,考虑可能需要适用哪些国家的隐私法规要求,进而根据不同的规则进行修改;4,如果用户有使用自然语言输入的特殊要求,应该加以满足;5,使用Python。规划并生成相关的REST服务,用户通过网页执行各种操作。”

当然这个程序代码量比较大,具体我也就不把生成的内容贴出来了。但是结果仍然是Claude和DeepSeek优于GPT-5。大家也可以自己试一下。

GPT, Gemini和Grok都是很善于宣传的,每次新模型出来都宣称自己是最强的。但是实际上大家在编程时还是继续用Claude(国内就是各种基于DeepSeek的AI)。甚至你在编码时会发现,Claude Sonnet就已经足够打败它们了,都不需要使用Claude Opus。这就是现在大模型引擎的魔幻现实。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/92704.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/92704.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从MySQL到大数据平台:基于Spark的离线分析实战指南

引言在当今数据驱动的商业环境中,企业业务数据通常存储在MySQL等关系型数据库中,但当数据量增长到千万级甚至更高时,直接在MySQL中进行复杂分析会导致性能瓶颈。本文将详细介绍如何将MySQL业务数据迁移到大数据平台,并通过Spark等…

Mysql笔记-存储过程与存储函数

1. 存储过程(Stored Procedure) 1.1 概述 1.1.1 定义: 存储过程是一组预编译的 SQL 语句和控制流语句(如条件判断、循环)的集合,​无返回值​(但可通过 OUT/INOUT 参数或结果集返回数据)。它支持参数传递、…

[论文阅读] 人工智能 + 软件工程 | LLM协作新突破:用多智能体强化学习实现高效协同——解析MAGRPO算法

LLM协作新突破:用多智能体强化学习实现高效协同——解析MAGRPO算法 论文:LLM Collaboration With Multi-Agent Reinforcement LearningarXiv:2508.04652 (cross-list from cs.AI) LLM Collaboration With Multi-Agent Reinforcement Learning Shuo Liu, …

使用OAK相机实现智能物料检测与ABB机械臂抓取

大家好!今天我们很高兴能与大家分享来自OAK的国外用户——Vention 的这段精彩视频,展示了他们的AI操作系统在现实中的应用——在演示中,进行实时的自动物料拣选。 OAK相机实时自动AI物料拣选视频中明显可以看到我们的OAK-D Pro PoE 3D边缘AI相…

html5和vue区别

HTML5 是网页开发的核心标准,而 Vue 是构建用户界面的JavaScript框架,两者在功能定位和开发模式上有显著差异: 核心定位 HTML5是 HTML标准 的第五次重大更新(2014年发布),主要提供网页结构定义、多媒体嵌入…

【前端八股文面试题】【JavaScript篇3】DOM常⻅的操作有哪些?

文章目录🧭 一、查询/获取元素 (Selecting Elements)✏️ 二、修改元素内容与属性 (Modifying Content & Attributes)🧬 三、创建与插入元素 (Creating & Inserting Elements)🗑️ 四、删除与替换元素 (Removing & Replacing)&am…

内存杀手机器:TensorFlow Lite + Spring Boot移动端模型服务深度优化方案

内存杀手机器:TensorFlow Lite Spring Boot移动端模型服务深度优化方案一、系统架构设计1.1 端云协同架构1.2 组件职责矩阵二、TensorFlow Lite深度优化2.1 模型量化策略2.2 模型裁剪技术2.3 模型分片加载三、Spring Boot内存优化3.1 零拷贝内存管理3.2 堆外内存模…

安全生产基础知识(一)

本文档围绕安全生产基础知识展开: 一、安全用电相关知识 用电安全要点 禁止用湿手触摸灯头、开关、插头插座及用电器具。发现有人触电,切勿用手拉扯,应立即拉开电源开关或用干燥木棍、竹竿挑开电线。电器通电后出现冒烟、烧焦味或着火时&…

Elasticsearch 搜索模板(Search Templates)把“可配置查询”装进 Mustache

1. 什么是 Search Template?能解决什么问题? 搜索模板是存储在 ES 集群里的 Mustache 模板(lang: mustache)。你把一份标准 _search 请求体写成模板,变量交给 params,每次调用只需传参即可: 搜索…

cocos Uncaught TypeError: Cannot read properties of null (reading ‘SetActive‘)

报错:Uncaught TypeError: Cannot read properties of null (reading SetActive) at b2RigidBody2D.setActive (rigid-body.ts:231:21) at b2RigidBody2D.onEnable (rigid-body.ts:78:14) at RigidBody2D.onEnable (rigid-body-2d.ts:551:24) at OneOffInvoker.invo…

Docker用户组介绍以及管理策略

在Docker环境中,用户组(尤其是默认的docker组)是管理用户与Docker守护进程交互权限的核心机制。以下从概念介绍和具体管理操作两方面详细说明:一、Docker用户组的核心概念 Docker守护进程(dockerd)默认通过…

【PyTorch】单目标检测项目部署

【PyTorch】单目标检测项目 两种部署情况:部署在 PyTorch 数据集上,以及部署在本地存储的单个映像上。 目录 定义数据集 搭建模型 部署模型 定义数据集 详细参照前文【PyTorch】单目标检测项目 import torchvision import os import pandas as pd i…

Baumer高防护相机如何通过YoloV8深度学习模型实现火星陨石坑的检测识别(C#代码UI界面版)

《------往期经典推荐------》 AI应用软件开发实战专栏【链接】 序号 项目名称 项目名称 1 1.工业相机 + YOLOv8 实现人物检测识别:(C#代码,UI界面版) 2.工业相机 + YOLOv8 实现PCB的缺陷检测:(C#代码,UI界面版) 2 3.工业相机 + YOLOv8 实现动物分类识别:(C#代码,U…

UniApp Vue3 TypeScript项目中使用xgplayer播放m3u8视频的显示问题

问题背景 在UniApp Vue3 TypeScript项目中使用xgplayer播放m3u8视频时&#xff0c;遇到了一个棘手的问题&#xff1a;视频画面下移&#xff0c;只能听到声音&#xff0c;全屏后才能正常显示。经过排查&#xff0c;发现是<video>元素在DOM渲染时被异常定位&#xff0c;导…

服务器硬件电路设计之 I2C 问答(三):I2C 总线上可以接多少个设备?如何保证数据的准确性?

在服务器硬件电路设计中&#xff0c;I2C 总线作为常用的串行通信协议&#xff0c;其设备连接数量和数据准确性至关重要。​I2C 总线上可连接的设备数量并非无限制。从理论上讲&#xff0c;标准 I2C 设备采用 7 位地址&#xff0c;除去保留地址&#xff0c;最多可连接 112 个设备…

用LaTeX优化FPGA开发:结合符号计算与Vivado工具链

用 LaTeX 优化 FPGA 开发&#xff1a;结合符号计算与 Vivado 工具链&#xff08;一&#xff09; 系列文章目录 第一章&#xff1a;深入了解 LaTeX&#xff1a;科技文档排版的利器 第二章&#xff1a;LaTeX 下载安装保姆级教程 第三章&#xff1a;LaTeX 创建工程并生成完整文档…

人工智能系列(6)如何开发有监督神经网络系统?

一. 开发有监督神经网络系统的步骤1. 数据收集训练数据通常由输入–输出成对组成&#xff0c;根据任务需求可能涵盖不同情境&#xff08;如白天或夜晚的车辆识别&#xff09;&#xff0c;其类型可以是数值、图像、音频等多种形式&#xff1b;数据规模越大、越多样&#xff0c;模…

CSS 选择器进阶:用更聪明的方式定位元素

在前端开发中&#xff0c;CSS 选择器是我们与 DOM 对话的语言。虽然 class 和 id 是我们最熟悉的工具&#xff0c;但真正高效、优雅的样式代码&#xff0c;往往来自于对现代 CSS 选择器的深入理解与巧妙运用。本文将带你跳出基础语法&#xff0c;探索那些能显著提升开发效率和代…

常用排序方法

一、排序的概念及引用1、排序的概念排序&#xff1a;所谓排序&#xff0c;就是使一串记录&#xff0c;按照其中的某个或某些关键字的大小&#xff0c;递增或递减的排列起来的操作。稳定性&#xff1a;假定在待排序的记录序列中&#xff0c;存在多个具有相同的关键字的记录&…

接口返回504 Gateway Time-out 错误,这意味着请求在网关或代理服务器等待上游服务器响应时超时。以下是可能的原因和排查建议:

问题分析1.后端处理耗时过长是某个方法执行时间过长&#xff0c;超过了网关的超时设置&#xff08;通常是几十秒&#xff09;可能涉及大量数据查询或复杂计算2.数据库查询性能问题查询的数据量过大缺少必要的数据库索引SQL语句执行效率低下排查建议1.检查服务端日志查看应用日志…