H20 性能表现之 Qwen3-235B

H20 性能表现之 Qwen3-235B

news/2025/8/29 7:25:07/文章来源:https://blog.csdn.net/Xsuperzone/article/details/150930034

上期为大家分享了H20性能表现之Qwen3-Coder-480B（以下称480B），今天，我为大家继续带来新的评测，这次，介绍的是 Qwen3-235B-A22B-Instruct-2507（以下称235B），这也是阿里这阵子发布的杆把子模型了，其 benchmark 表现超过了 DeepSeek 及 Kimi K2。

顾名思义，235B总参数达到235B，同样，只能在H20或A100这样的机器上才能运行。来看看其在H20上的性能表现吧。

首先来看看普通问答能力，输入128，输出2K的表现，如下图。

虽然235B的激活集也达到22B的规模，但其吞吐率还是不错的。

单用户达到82 token/s，虽然不及480B 92 token/s 的水平，但也比DeepSeek V3的31 token/s有164%的涨幅。

即使到128并发用户，也能达到32 token/s，远超480B的 21 token/s。

我们再来看长输入的表现（输入4K，输出512），适合于知识库或多次提问的场景。如下图所示。

其吞吐率有明显的下降，单用户约77 token/s。随着并发用户的增加，其首字时延性能下降明显。当并发用户达到50时，首字时延也来到了10秒，不过，吞吐率仍然有27 token/s，相比480B的12秒及21 token/s也是好些的，并且远超 DeepSeek V3 的 11 token/s。

总体而言，235B在H20表现还是不错的，特别是在多用户并发访问方面来说，即使是压力最大的知识库应用或智能体应用，能达到50个并发用户的同时，保持较好的用户体验，应该说性价比远超 DeepSeek V3 了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/news/920251.shtml
繁体地址，请注明出处：http://hk.pswp.cn/news/920251.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Diagnosing bias and variance｜诊断偏差和方差

Diagnosing bias and variance｜诊断偏差和方差

----------------------------------------------------------------------------------------------- 这是我在我的网站中截取的文章，有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn，这里还有很多有关计算机的知识，欢迎进行留言或…

阅读更多...

前端性能优化：从指标监控到全链路落地（2024最新实战指南）

前端性能优化：从指标监控到全链路落地（2024最新实战指南）

前端性能优化：从指标监控到全链路落地（2024最新实战指南） 引言：性能不是“可选项”，而是“生存线” 在前端开发中，“性能优化”常被视为“锦上添花”的工作——但数据告诉我们，它早已成为决定…

阅读更多...

Kafka面试精讲 Day 1：Kafka核心概念与分布式架构

Kafka面试精讲 Day 1：Kafka核心概念与分布式架构

【Kafka面试精讲 Day 1】Kafka核心概念与分布式架构在“Kafka面试精讲”系列的第1天，我们将深入解析Apache Kafka最根本的基石——核心概念与分布式架构。作为大数据和后端开发领域面试中的“必考题”，诸如“Kafka是如何实现高吞吐量的？”、…

阅读更多...

github copilot学生认证教程，免费使用两年Copilot Pro！！（避免踩坑版）

github copilot学生认证教程，免费使用两年Copilot Pro！！（避免踩坑版）

先放结果，本人是先后申请了三次： 1、第一次直接用的学生证，打开对着电脑摄像头直接拍了一张，失败了，如下，理由是没有开启双重认证！！，并且学生证内页没有学校名称&#x…

阅读更多...

Shiro介绍以及一个原始例子

Shiro介绍以及一个原始例子

目录基本功能核心组件应用场景优势Shiro 核心工作流程（以 Web 应用登录为例）一个例子【验证，授权]:Shiro 是一个强大且易用的 Java 安全框架，提供了身份验证、授权、加密和会话管理等功能，可帮助开发人员轻松确保应用…

阅读更多...

AI-调查研究-59-机器人行业职业地图：发展路径、技能要求与薪资全解读

AI-调查研究-59-机器人行业职业地图：发展路径、技能要求与薪资全解读

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布！“快的…

阅读更多...

LeetCode算法日记 - Day 22: 提莫攻击、Z字形变换

LeetCode算法日记 - Day 22: 提莫攻击、Z字形变换

目录 1. 提莫攻击 1.1 题目解析 1.2 解法 1.3 代码实现 2. Z字形变换 2.1 题目解析 2.2 解法 2.3 代码实现 1. 提莫攻击 495. 提莫攻击 - 力扣（LeetCode） 在《英雄联盟》的世界中，有一个叫 “提莫” 的英雄。他的攻击可以让敌方英…

阅读更多...

Unity笔记(七)——四元数、延迟函数、协同程序

Unity笔记(七)——四元数、延迟函数、协同程序

写在前面：写本系列(自用)的目的是回顾已经学过的知识、记录新学习的知识或是记录心得理解，方便自己以后快速复习，减少遗忘。主要是C#代码部分。六、四元数欧拉角具有旋转约定，也就是说，无论你调整角度的顺序是什么&…

阅读更多...

用大语言模型提升语音翻译：一种全新的端到端方法

用大语言模型提升语音翻译：一种全新的端到端方法

用大语言模型提升语音翻译：一种全新的端到端方法在语音翻译领域，如何将说话内容快速准确地转化为另一种语言，一直是研究者们关注的焦点。随着大语言模型（LLM）的兴起，我们迎来了一个全新的机遇：利用LLM的强大能力，来提升语音翻译系统的性能。最近，一项名为“End-to-E…

阅读更多...

freeModbus TCP收发数据一段时间后，出现掉线情况（time out问题）

freeModbus TCP收发数据一段时间后，出现掉线情况（time out问题）

话说这个是真难找啊。我仅仅发表我找到的问题。我在接收几十到几百次数据的时候，会出现连接超时，也就是time out。而且ping也ping不通。也就是说明lwip出了问题。首先我先介绍modbus的这个流程。首先是函数eMBTCPInit( MB_TCP_PORT_USE_DEFAULT )我们进入…

阅读更多...

Linux Web环境一键安装脚本集合(非docker)

Linux Web环境一键安装脚本集合(非docker)

✨重磅！盹猫的个人小站正式上线啦～诚邀各位技术大佬前来探秘！✨ —— 专为开发者打造的宝藏基地，等你来探索！ 这里有： 🔥 硬核技术干货：编程技巧、开发经验、踩坑指南，带…

阅读更多...

原生安卓#基于Android的爱好者分享论坛的设计与实现/基于Android在线论坛系统app/基于Android的论坛系统的设计与实现的设计与实现

原生安卓#基于Android的爱好者分享论坛的设计与实现/基于Android在线论坛系统app/基于Android的论坛系统的设计与实现的设计与实现

原生安卓#基于Android的爱好者分享论坛的设计与实现/基于Android在线论坛系统app/基于Android的论坛系统的设计与实现的设计与实现

阅读更多...

基于Android的超市购物系统的设计与实现、基于android的在线商城app/基于android的在线销售系统app#android

基于Android的超市购物系统的设计与实现、基于android的在线商城app/基于android的在线销售系统app#android

基于Android的超市购物系统的设计与实现、基于android的在线商城app/基于android的在线销售系统app#android

阅读更多...

C++14 到 C++20 全面解析：语言新特性、标准库演进与实战案例

C++14 到 C++20 全面解析：语言新特性、标准库演进与实战案例

一、前言C 作为一门历史悠久且不断演进的编程语言，在 C11 之后进入了“现代化”的快车道。C11 被称为 C 的第二次诞生，引入了 lambda 表达式、智能指针、右值引用、并发支持等革命性特性。然而，C 的标准化进程并没有止步于此。C14、C17 和 C2…

阅读更多...

HarvardX TinyML小笔记2（番外1：TFLite）

HarvardX TinyML小笔记2（番外1：TFLite）

1 原理 tflite就是Tensorflow的轻量化模型，核心处理就是量化和剪枝。不过这部分目前是在Tensorflow中封装了，所以这里也不会去看细节，主要就是看看原理和使用方法。量化Quantization，其实就是把原来的float32换成int8。这样一个…

阅读更多...

向量库Qdrant vs Milvus 系统详细对比

向量库Qdrant vs Milvus 系统详细对比

Qdrant vs Milvus 系统详细对比一、它们是什么（定位） 两者都是专门做向量相似搜索的数据库：支持ANN（近似最近邻）检索、向量结构化过滤、REST/gRPC 接口与官方SDK；Milvus 官方也定位为"面向GenAI、可…

阅读更多...

适配欧拉操作系统

适配欧拉操作系统

背景客户指定服务器环境欧拉操作系统，版本：6.6.0-72.0.0.76.oe2403sp1.x86_64 需要把Java 应用以及各种中间件部署在欧拉操作系统上。问题适配MySQL 1.1 编译报错 mysql-5.7.40-el7-x86_64.tar.gz版本在CentOS7环境安装正常当前欧拉环境直接使用CentO…

阅读更多...

学习spring Bean的生命周期

学习spring Bean的生命周期

完整项目结构 ├── pom.xml └── src/├── main/│ ├── java/│ │ └── com/│ │ └── zhang/│ │ ├── bean/│ │ │ ├── Address.java│ │ │ ├── MyBeanPostProcessor.java│ │ …

阅读更多...

elasticsearch 7.17.23 使用spring data es实现高亮分页，scroll查询分页查询

elasticsearch 7.17.23 使用spring data es实现高亮分页，scroll查询分页查询

一介绍 1.1 工程结构 1.2 启动elasticsearch服务 1.3 高亮分页 DeepSeek 代码效果： 1.4 scroll分页代码 2.效果后台日志 1.5 完整代码 https://gitee.com/jurf-liu/es-2.17.x-demo.git

阅读更多...

onlyoffice整合springboot+vue实现文档在线编辑保存

onlyoffice整合springboot+vue实现文档在线编辑保存

项目上需要用到在线word、excel文档编辑功能，通过游览器在线打开一个远程的word文档编辑保存，这里记录下整合思路。 onlyoffice简介 ONLYOFFICE 是一款开源的办公套件，提供了一系列在线文档编辑和协作工具，适用于团队和个人使用…

阅读更多...

最新文章