液冷智算数据中心崛起,AI算力联动PC Farm与云智算开拓新蓝海(二)

从算法革新到基础设施升级,从行业渗透到地域布局,人工智能算力正以 “规模扩张 + 效率提升”双轮驱动中国数字经济转型。中国智能算力规模将在 2025 年突破 1000 EFLOPS,2028 年达到 2781.9 EFLOPS,五年复合增长率 46.2%,成为全球算力增长的核心引擎。

一、算法与模型:AI 算力的核心驱动力 

算法创新是算力需求的 “指挥棒”,以 DeepSeek R1 为代表的大模型,通过大规模强化学习和多头注意力机制实现双重突破:在 AIME 数学竞赛、博士级科学问答中性能接近 OpenAI o1 模型,同时将训练算力压缩至 Llama3 的 1/10,推理阶段缓存数据量降低 50 倍,7 天活跃用户破亿,验证了 “效率提升反而刺激算力需求” 的杰文斯悖论。 

规模法则(Scaling Law)从预训练延伸至后训练与推理阶段:通过强化学习、思维链技术在推理阶段追加算力投入,可显著提升模型逻辑深度。这直接推动全球 AI 服务器市场扩张 ——2024 年规模 1251 亿美元,2028 年将达 2227 亿美元,生成式 AI 服务器占比从 29.6% 升至 37.7%。 

模型技术路线呈现三大特征:

轻量化:混合专家模型(MoE)如浪潮源 2.0-M32,单 Token 算力仅为 Llama-70B 的 1/19,极大降低了运算负担,使得模型在资源有限的情况下也能高效运行。以图像识别任务为例,采用 MoE 的模型能在低配置设备上快速准确地识别复杂图像,识别速度提升 30%。 

开源化:2025 年 55% 企业将采用开源模型开发应用,DeepSeek 等开源方案使部署成本降低 60%。开源社区的蓬勃发展,让众多中小企业和开发者能够基于开源模型进行二次开发和创新,加速了 AI 技术的普及和应用。例如,某小型电商企业利用开源模型搭建智能客服系统,成本较自主研发降低 80%,且开发周期从半年缩短至两个月。 

多模态:从文本向图像、视频融合演进,在自动驾驶、远程医疗等场景实现跨模态理解。在自动驾驶场景中,多模态模型能够同时处理摄像头采集的视觉图像、雷达反馈的距离数据以及车辆传感器收集的其他信息,从而更精准地判断路况,做出安全的驾驶决策,有效减少事故发生率。

二、算力基础设施的多元与绿色

中国算力基建呈现 “四元特征”,支撑算力规模爆发式增长: 

(一)芯片与服务器:高性能与高效能双升级

芯片多元化:GPU 仍是训练主力,但 ASIC(推理)、FPGA(动态加速)占比提升至 35%,多类型芯片混合部署成主流。不同类型芯片在不同任务中发挥独特优势,GPU 擅长大规模并行计算,适用于深度学习训练;ASIC 针对特定算法优化,在推理任务中表现卓越;FPGA 则可根据需求灵活配置,实现动态加速。例如,在语音识别系统中,ASIC 芯片能够快速准确地将语音信号转换为文本,识别准确率高达 98%。

服务器演进:72 块 GPU 集群支持万亿参数模型训练,“预填充 - 解码解耦” 架构使推理延迟降低 40%,2028 年推理工作负载占比将达 73%。新型架构的服务器不断涌现,采用先进的散热技术和高速内存,提升了计算性能和稳定性。

(二)液冷技术破解高能耗

AI 数据中心能耗呈指数级增长,2025 年 IT 能耗将达 77.7 太瓦时(2023 年的 2 倍),液冷技术成为核心解决方案。

技术路径:冷板液冷使 PUE 降至 1.15,浸没式液冷达 1.1,单机柜功率密度提升至 400kW。冷板液冷通过直接接触发热部件,快速带走热量;浸没式液冷则将电子元件完全浸没在冷却液中,利用冷却液的相变特性高效散热。某大型数据中心采用浸没式液冷技术后,每年可节省电费数百万元,且数据中心的空间利用率也得到显著提高。 

市场规模:2028 年中国液冷服务器市场将达 105 亿美元,五年复合增长率 48.3%。随着技术的成熟和成本的降低,液冷服务器市场需求持续增长,越来越多的数据中心和企业开始采用液冷技术来降低能耗和提升算力。 

(三)存储与网络:支撑海量数据处理

分布式存储:支持 EB 级扩展与并行访问,配合 NVMe-oF 技术,实现 10PB 数据秒级检索。分布式存储将数据分散存储在多个节点上,不仅提高了存储容量,还提升了数据访问速度和可靠性。在大型互联网公司的海量数据存储场景中,分布式存储系统能够快速响应用户的查询请求,确保数据的高效利用。 

高速网络:400G 以太网普及,RDMA 技术使跨节点延迟 < 10 微秒,1.6T 以太网进入规划。高速网络技术的发展,使得数据在不同设备和节点之间的传更加迅速和稳定。在大规模 AI 集群中,高速网络能够保证数据的实时传输,避免因数据传输延迟导致的计算效率低下问题。科研机构的 AI 计算集群采用 400G 以太网后,数据传输速度提升,大大缩短科研项目的计算周期。 

PC 集群:中低端算力性价比方案

在 AI 算力需求呈指数级增长的背景下,#PC 集群(#PC农场/#PC Farm)作为中低端算力场景的核心基础设施,以其成本优势与灵活性,成为中小企业、边缘计算等场景的主流选择。2024 年中国 PC 集群算力市场规模达 120 亿元,年增长率 35%,预计 2028 年将突破 350 亿元,成为智能算力体系的重要补充。

PC 集群基于 x86 处理器(如 Intel Xeon Platinum 8480H、AMD EPYC 7763)构建,单机节点算力约 20-50 TFLOPS,通过分布式软件栈(Hadoop、Spark、TensorFlow)实现算力聚合且降低硬件投入成本。

典型应用场景包括云游戏、中小企业轻量化 AI 部署、边缘计算实时处理、学术研究与算法验证。

大型智算中心普遍采用 “GPU 集群(训练)+ PC 集群(推理)” 的混合部署模式。某云服务商将 30% 非实时推理任务(如日志分析、批量数据标注)迁移至 PC 集群,算力成本降低 40%,同时释放 GPU 资源用于大模型训练,呼应文中 “算力负载调度优化” 的技术路径。

PC 集群兼容开源框架(PyTorch、TensorFlow、Ray),以 MoE(混合专家模型)为例,PC 集群通过开源推理引擎(如 MLPerf Inference)优化稀疏激活机制,使单 Token 算力消耗降至 Llama-70B 的 1/19,进一步强化 “轻量化模型” 的落地可行性。

PC 集群通过 “低成本 + 高兼容性” 填补了中低端算力市场空白,与高端算力设施形成互补,共同构成中国 AI 算力 “金字塔” 架构。随着异构加速技术与开源生态的成熟,其在 “算力平权” 与 “绿色计算” 中的价值将进一步凸显,成为推动 AI 技术普惠的关键力量。

三、算力服务与行业渗透

(一)服务模式创新降低算力门槛

智算服务市场以 57.3% 的复合增长率扩张,2028 年规模达 266.9 亿美元,形成多元供给体系: 

IaaS 服务:按需弹性调度,支持万卡集群分钟级扩缩容。企业可以根据自身业务需求,灵活调整算力资源的使用量,避免资源浪费。游戏公司可在新游戏上线初期,通过 IaaS 服务快速扩展算力,满足大量玩家同时在线的需求;在游戏运营平稳期,则减少算力使用,降低成本。 

算力租赁:按推理次数计费,成本低至每百万 Token 1 元。算力租赁模式让中小企业和个人开发者能够以较低的成本获取算力资源,开展 AI 项目。初创企业通过算力租赁平台,以合理的价格租用算力进行模型训练,成功开发出创新AI 应用,节省大量前期硬件投资。 

智算中心:政府项目单期算力规划超 1000P,企业级万卡集群落地应用。智算中心的大规模建设,为地区和行业的 AI 发展提供了强大的算力支撑。智算中心吸引众多 AI 企业入驻,形成产业集聚效应,推动当地数字经济的快速发展。 

(二)应用场景深度落地

互联网:领跑大模型研发,AI agent 覆盖客服、视频生成等场景,资源利用率提升。互联网公司凭借丰富的数据资源和技术实力,在 AI 应用方面走在前列。利用 AI agent 实现智能客服自动化,能够快速响应用户咨询,提高解决问题的准确率且节省大量人力成本。

金融:算力助力风险识别和交易决策。智能风控系统能够实时监测交易行为,及时发现潜在风险;量化交易借助AI 算法优化策略,提高交易效率和收益。采用大模型辅助信贷审批,大大缩短审批时间且降低不良贷款率。

运营商:5G 网络优化、预测性维护,故障处理效率提升。运营商通过 AI 算力对 5G 网络进行优化,提高网络覆盖和信号质量。预测性维护则利用 AI 算法提前预测设备故障,及时进行维修,减少网络中断时间。 

制造:AI 视觉检测能够精准识别产品缺陷,提高产品质量;通过优化生产参数,提升生产效率和降低成本。

政府:智慧城市管理、交通预测,北京、上海等城市已实现秒级路况响应。政府利用 AI 算力提升城市管理水平,实现交通流量预测、智能安防等功能。智能交通系统,能够实时监测路况,及时调整交通信号,缓解交通拥堵,为市民提供更加便捷的出行服务。 

四、地域格局与挑战

(一)算力梯队

第一梯队:北京(105 款备案大模型、2.2 万 P 公共算力)、杭州、上海。这些城市凭借丰富的科研资源、人才优势和政策支持,在 AI 算力领域处于领先地位。北京拥有众多高校和科研机构,为 AI 发展提供了强大的智力支持;杭州作为互联网之都,互联网企业的创新活力推动了 AI 算力的应用和发展;上海则凭借国际化的金融和贸易中心地位,吸引了大量的 AI 企业和投资。 

快速追赶:深圳(10 亿级 AI 专项基金)、成都(算力券机制)、厦门(2025 年算力达 1.1 EFLOPS)。这些城市通过出台优惠政策、设立专项基金等方式,加大对 AI 算力的投入和支持,快速提升自身的算力水平。深圳的 AI 专项基金吸引了众多优质 AI 项目落地,推动当地 AI 产业的快速发展;成都的算力券机制降低了企业使用算力的成本,激发了企业的创新活力。

(二)挑战与破局 

瓶颈:49% 企业认为计算架构限制规模化应用,43% 面临算力资源不足。当前的计算架构在面对大规模、复杂的 AI 计算任务时,存在性能瓶颈,无法满足企业的需求;同时算力资源的紧张也制约了企业的发展,导致部分项目无法顺利推进。 

破局:“扩容 + 提效” 并行 —— 扩大智算中心规模(万卡集群),通过模型剪枝、分布式计算提升效率,目标将算力成本降低。加大对智算中心的建设投入,扩大算力规模;通过技术创新,优化计算架构和算法,提高算力利用效率,降低企业的算力使用成本,在不影响模型性能的前提下,大大减少了计算资源的需求。

五、算力电力协同发展

算力电力协同发展是数字经济与能源转型的核心纽带,需以数据为支撑构建系统性解决方案。

(一)强化算电协同政策支撑

1完善体制机制与跨部门协同

2023 年 12 月《“东数西算” 实施意见》首次明确 “算力电力协同”,要求国家枢纽节点新建数据中心绿电占比超 80%。截至 2023 年底,八大枢纽节点机架数占全国七成以上,其中京津冀(21.5%)、长三角(24.5%)在用机架占比集中,张家口数据中心用电量占全社会比重从 2019 年的 6.8% 升至 2023 年的 20.1%,局部电网扩容压力显著。

资金支持量化方案:设立 “算电协同专项基金”,按算力规模分档补贴:

单期算力≥100P 的政府项目,补贴 0.2 元 / 千瓦时(参考宁夏中卫 8.4 万架算力中心年用电量约 80 亿千瓦时,补贴规模约 16 亿元);

企业自建分布式光伏项目,按装机容量给予 1.5 元 / W 一次性补贴(如腾讯天津数据中心 10.54MW 光伏系统可获 1.58 亿元补贴)。

2. 建立算力电力协同评价指标

核心 KPI 设定:将 “绿电占比”“PUE 值”“弃风弃光率” 纳入地方政府考核,要求 2028 年:国家枢纽节点新建数据中心绿电占比从 80% 提升至 90%;全网算力中心平均 PUE 从 1.5 降至 1.25,其中液冷项目占比超 60%;西部枢纽节点弃风弃光率从 2024 年的青海 9.7%、甘肃 8.7% 降至 5% 以下。

(二)构建算电协同标准体系

1. 技术标准体系细化

供配电技术标准:

制定《算力中心高可靠供电规范》:

UPS 系统备用时间≥30 分钟,柴油发电机切换时间≤10 秒;

2026 年起新建算力中心采用 10kV 柔性直流供电(如中关村科学城双环网架构),供电可靠性达 99.999%。

算力负载调度标准:

发布《算力电力时空协同调度协议》:

延迟容忍型负载(如图像处理)时空调度响应时间≤15 分钟;

跨区域调度通信延迟≤50ms(参考阿里巴巴南通 - 张北调度实验)。

2. 检测认证体系建设

绿电溯源认证:依托区块链建立 “绿电 - 算力” 溯源平台:

每 1MWh 绿电对应发放 1 个绿证,可追溯至具体风光电站;数据中心绿电消费需通过平台备案,2027 年实现 100% 可核查(当前仅 11% 数据中心具备独立计量能力)。

(三)培育算电协同产业生态

1. 关键技术攻关路线图

储能技术:2026 年实现全钒液流电池储能系统:循环寿命≥15000 次,成本降至 1.0 元 / Wh(当前 1.8 元 / Wh);响应速度≤200ms,支持 MW 级算力中心调峰(参考谷歌 St. Ghislain 数据中心锂电池改造)。

源网荷储一体化:制定园区级建设标准:新能源装机容量与算力负载比≥1.2:1(如广西来宾风电数据中心);储能配置容量≥算力中心峰值负荷的 30%,放电时长≥4 小时。

2. 产学研用协同

建立 “算电协同创新联盟”:成员包括三大运营商、华为 / 浪潮等设备商、华北电力大学等科研机构;2026 年前攻克 “算力调度 - 电力市场” 接口协议,实现算力价格与电价联动(如峰谷电价差≥0.5 元 / 千瓦时触发负载迁移)。

(四)营造公平高效市场环境

1. 绿电交易机制创新

2027 年前建成 “西电东算” 专用输电通道:新增张北 - 北京、酒泉 - 上海等 5 条特高压线路,输送容量合计 20GW;跨省绿电交易手续费从当前 0.05 元 / 千瓦时降至 0.02 元 / 千瓦时(参考世纪互联太仓项目省间交易模式)。

2028 年实现绿电现货交易占比达 30%(当前不足 5%),要求:日内交易时段划分≤15 分钟;深圳、山西等试点地区推出 “算力负荷 - 绿电现货” 联动合约。

2. 价格激励与需求响应

设定 “算力电力协同电价”:低谷时段(23:00-7:00)电价下浮 30%,激励 60% 以上延迟容忍型负载错峰(当前仅 25%);新能源大发时段(如西北风电高峰 19:00-22:00)电价下浮 15%。

算力中心参与调峰可获补贴:削峰补贴 0.8 元 / 千瓦・次,填谷补贴 0.5 元 / 千瓦・次;目标 2028 年参与率达 70%(当前不足 30%),年调峰量超 500 亿千瓦时。

中国 AI 算力正从 “规模扩张” 向 “质效并重” 转型,算法创新、绿色基建、服务模式与行业需求的深度耦合,将推动其在 2028 年成为全球最大智能算力市场。这场变革不仅重构 IT 产业格局,更将为制造业升级、智慧城市建设等领域注入 “智能动能”,成为数字经济高质量发展的核心支撑。

#AI算力#智能算力#EFLOPS #大模型#混合专家模型#开源模型#多模态#芯片#GPU#ASIC#FPGA#液冷#PUE#分布式存储#IaaS服务#算力租赁#智算中心#算力资源#PC农场#PC集群#PC Farm

来源:IDC及中国信息通信研究院 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/914177.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/914177.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《QtPy:Python与Qt的完美桥梁》

QtPy 是什么 在 Python 的广袤编程宇宙中&#xff0c;当涉及到图形用户界面&#xff08;GUI&#xff09;开发&#xff0c;Qt 框架宛如一颗璀璨的明星&#xff0c;散发着独特的魅力。而 QtPy&#xff0c;作为 Python 与 Qt 生态系统交互中的关键角色&#xff0c;更是为开发者们开…

ubuntu环境下调试 RT-Thread

调试 RT-Thread 下载源码 github 搜索 RT-Thread 下载源码 安装 python scons 环境 你已经安装了 kconfiglib&#xff0c;但 scons --menuconfig 仍然提示找不到它。这种情况通常是由于 Python 环境不一致 导致的&#xff1a;你在一个 Python 环境中安装了 kconfiglib&#xff…

【数据结构初阶】--顺序表(二)

&#x1f525;个人主页&#xff1a;草莓熊Lotso &#x1f3ac;作者简介&#xff1a;C研发方向学习者 &#x1f4d6;个人专栏&#xff1a; 《C语言》 《数据结构与算法》《C语言刷题集》《Leetcode刷题指南》 ⭐️人生格言&#xff1a;生活是默默的坚持&#xff0c;毅力是永久的…

Java中的方法传参机制

1. 概述Java中的方法传参机制分为两种&#xff1a;值传递&#xff08;Pass by Value&#xff09; 和 引用传递&#xff08;Pass by Reference&#xff09;。然而&#xff0c;Java中所有的参数传递都是值传递&#xff0c;只不过对于对象来说&#xff0c;传递的是对象的引用地址的…

C++——this关键字和new关键字

一、this 关键字1. 什么是 this&#xff1f;this 是 C 中的一个隐式指针&#xff0c;它指向当前对象&#xff08;即调用成员函数的对象&#xff09;&#xff0c;在成员函数内部使用&#xff0c;用于引用调用该函数的对象。每个类的非静态成员函数内部都可以使用 this。使用 thi…

Python中类静态方法:@classmethod/@staticmethod详解和实战示例

在 Python 中&#xff0c;类方法 (classmethod) 和静态方法 (staticmethod) 是类作用域下的两种特殊方法。它们使用装饰器定义&#xff0c;并且与实例方法 (def func(self)) 的行为有所不同。1. 三种方法的对比概览方法类型是否访问实例 (self)是否访问类 (cls)典型用途实例方法…

FastGPT革命:下一代语言模型的极速进化

本文深度解析FastGPT核心技术架构&#xff0c;涵盖分布式推理、量化压缩、硬件加速等前沿方案&#xff0c;包含完整落地实践指南&#xff0c;助你掌握大模型高效部署的终极武器。引言&#xff1a;当大模型遭遇速度瓶颈2023年&#xff0c;ChatGPT引爆全球AI热潮&#xff0c;但企…

Geant4 安装---Ubuntu

安装工具 C/C工具包 sudo apt install build-essentialCmake sudo apt install -y cmakeccmake sudo apt install -y cmake-curses-gui安装Qt可视化工具(不需要可视化可以不安装) sudo apt-get install qtbase5-dev qtchooser qt5-qmake qtbase5-dev-tools qtcreator 安装Ope…

Spring Boot中请求参数读取方式

目录 一、前言 二、六种参数读取方式 1.RequestParam 2.PathVariable 3.RequestBody 4.RequestHeader 5.CookieValue 6.MatrixVariable 三、对比和搭配 1.适用方法类型及建议使用场景 2.建议使用的请求路径注解 3. 多种参数同时使用 4.同一请求不同方案&#xff1f…

2025华为OD机试真题最新题库 (B+C+D+E+2025A+2025B卷) + 在线OJ在线刷题使用(C++、Java、Python C语言 JS合集)(正在更新2025B卷,目前已收录710道)

2025年&#xff0c;已经开始使用AB卷题库&#xff0c;题目和往期一样&#xff0c;旧题加新题的组合&#xff0c;有题目第一时间更新&#xff0c;大家可以跟着继续学习&#xff0c;目前使用复用题较多&#xff0c;可在OJ上直接找到对应的AB卷学习&#xff0c;可以放心学习&#…

分析新旧因子相关性

计算一组新因子、并分析它们与已有因子间的相关性1. 导入库和初始化环境功能代码解析数据加载2. 定义新因子计算函数功能代码解析因子 1&#xff1a;波动率过滤器&#xff08;filter_001_1&#xff09;因子 2&#xff1a;ATR 过滤器&#xff08;filter_001_2&#xff09;因子 3…

Unity Demo——3D平台跳跃游戏笔记

今天是一个3D平台跳跃游戏的笔记。我们按照以下分类来对这个项目的代码进行学习&#xff1a;核心游戏系统 (Core Game Systems)核心游戏系统是IkunOdyssey项目的基础&#xff0c;负责所有游戏对象&#xff08;如玩家、敌人、道具等&#xff09;的通用行为和物理交互。它通过实体…

【C语言】回调函数、转移表、qsort 使用与基于qsort改造冒泡排序

文章目录数组指针/指针数组函数指针函数指针数组函数指针数组用途(转移表)回调函数qsort函数基于qsort改造冒泡排序源码数组指针/指针数组 int arr1[5] { 1,2,3,4,5 };int (*p1)[5] &arr1; //p1是数组指针变量int* arr2[5] { 0 }; //arr2是指针数组指针数组是存放指…

vue3 uniapp 使用ref更新值后子组件没有更新 ref reactive的区别?使用from from -item执行表单验证一直提示没有值

遇到这样一个问题&#xff0c;我有个1个页面A&#xff0c;一个from表单组件&#xff0c;一个form-item组件&#xff0c; 使用是这样的&#xff0c;我在父组件A中使用 &#xff0c;执行表单验证一直提示没有值咱们先来讲一讲ref 和reactive的区别 ref 用来创建一个基本类型或单…

PyQt5布局管理(QBoxLayout(框布局))

QBoxLayout&#xff08;框布局&#xff09; 采用QBoxLayout类可以在水平和垂直方向上排列控件&#xff0c;QHBoxLayout和 QVBoxLayout类继承自QBoxLayout类。 QHBoxLayout&#xff08;水平布局&#xff09; 采用QHBoxLayout类&#xff0c;按照从左到右的顺序来添加控件。QHBoxL…

Grok 4作战图刷爆全网,80%华人横扫硅谷!清华上交校友领衔,95后站C位

来源 | 新智元短短两年&#xff0c;马斯克Grok 4的横空出世&#xff0c;让xAI团队一举站上AI之巅。昨日一小时发布会&#xff0c;Grok 4让所有人大开眼界&#xff0c;直接刷爆了AIME 2025、人类最后的考试&#xff08;HLE&#xff09;两大基准。这是狂堆20万GPU才换来的惊人成果…

AI大模型(七)Langchain核心模块与实战(二)

Langchain核心模块与实战&#xff08;二&#xff09;Langchian向量数据库检索Langchian构建向量数据库和检索器批量搜索返回与之相似度最高的第一个检索器和模型结合得到非笼统的答案LangChain构建代理通过代理去调用Langchain构建RAG的对话应用包含历史记录的对话生成Langchia…

Flutter基础(前端教程①-容器和控件位置)

一个红色背景的 Container垂直排列的 Column 布局中央的 ElevatedButton按钮下方的白色文本import package:flutter/material.dart;void main() {runApp(const MyApp()); }class MyApp extends StatelessWidget {const MyApp({Key? key}) : super(key: key);overrideWidget bu…

CSS flex

目录 flex-box和flex-item 主轴和副轴 ​编辑 flex-box的属性 flex-direction flex-wrap flex-flow justify-content ​编辑​align-items align-content flex-item的属性 flex-basis flex-grow flex-shrink flex flex-box和flex-item 当把一个块级元素的displ…

【JMeter】执行系统命令

步骤如下&#xff1a; 添加JSP233 Sampler&#xff1a;右击线程组>添加>取样器>JSR223 Sampler2.填写脚本&#xff0c;执行后查看日志。res "ipconfig".execute().text log.info(res)res "python -c \"print(11)\"".execute().text l…