2025 年 6 月 20 日,华为开发者大会 2025(HDC 2025)在东莞召开。华为常务董事、云计算 CEO 张平安宣布基于 CloudMatrix 384 超节点的新一代昇腾 AI 云服务全面上线,并发布盘古大模型 5.5,五大基础模型实现技术突破,同步披露农业、工业、智能驾驶等领域的落地实践。
新一代昇腾 AI 云服务:重构大模型算力底座
面对大模型对算力的爆发式需求,华为云新一代昇腾 AI 云服务以 CloudMatrix 384 超节点为核心,通过 MatrixLink 高速网络将 384 颗昇腾 NPU 与 192 颗鲲鹏 CPU 互联,构成超级 “AI 服务器”。单卡推理吞吐量达 2300 Tokens/s,较非超节点架构提升近 4 倍,算力有效使用率(MFU)提升 50% 以上。
该架构支持混合多专家 MoE 模型推理,实现 “一卡一专家” 的 384 路并行计算,同时可通过 “日推夜训” 灵活调度训推算力。在云数据中心,432 个超节点可级联成 16 万卡的超大集群,总算力规模达 300 PFLOPS。目前昇腾 AI 云服务已为科大讯飞、中科院等 1300 余家客户提供算力支持。
盘古大模型 5.5 升级:五大领域全面突破
自然语言处理(NLP)大模型推出 718B 深度思考 MoE 模型,含 256 个专家系统,在知识推理与数学能力上跻身业界第一梯队。其自适应快慢思考技术通过难度感知机制,使简单问题响应敏捷、复杂问题深度推理,整体推理效率提升 8 倍。例如,DeepDiver 技术可在 5 分钟内完成 10 跳以上复杂问答,生成万字专业报告。
面向企业,华为云提供基础模型、数据工程工具等六大能力,支持行业数据增训与微调。中国农业科学院基于盘古构建的农业科学发现大模型,已实现水稻株型改良,株高降低 25% 且抗倒伏能力提升。此外,医学、金融等五大行业 NLP 模型将于 6 月底上线。
多模态大模型发布 “世界模型”,为智能驾驶与具身机器人构建数字物理空间。广汽集团借助该模型实现 2D 视频与 3D 点云的像素级对应,数分钟内复原复杂场景,支撑智能驾驶模型 “两天一版本” 的迭代效率。配套发布的 CloudRobo 平台整合数据合成、仿真验证等能力,并提出机器人到云协议 R2C,推动行业标准化。
预测大模型采用 triplet transformer 架构,统一处理表格、时序、图像等多源数据,跨行业泛化能力显著提升。海螺水泥应用该模型实现熟料强度预测,添加固废降低成本;宝武钢铁高炉模型使铁水温度合格率超 90%,日省燃料 20 吨。
科学计算大模型与气象、能源领域深度结合。深圳气象局升级 “智霁” 模型实现区域集合预报,重庆气象局打造的 “天资・12h” 模型提升灾害预警能力;深圳能源通过大模型优化风光发电预测,提升能源调度效率。
计算机视觉(CV)大模型推出 300 亿参数 MoE 架构,支持图像、红外、激光点云等多维度感知。中国石油昆仑大模型攻克亚毫米级管道缺陷识别,效率提升 40%,人工强度降低 25%。
🌟 DMXAPI 全维度解决方案,重构 AI 开发体验 🌟
🚀 多模型集成:一个密钥开启全球智能生态
- 只需1 个 API Key,即可无缝串联 GPT、Claude、Gemini、Llama 等全球顶尖大模型,打破技术壁垒与平台限制。
💰 财务合规:专业服务为商业落地护航
- 企业级合规支持:无论是企业用户的项目采购,还是个人开发者的技术服务,均可提供正规发票,财务流程透明合规。
👉 登录 DMXAPI 官网,体验 “一个平台管理所有 AI 能力” 的高效与便捷!
点击链接:立即探索 DMXAPI