量子加速器切入 AI 底层架构!能源焦虑时代,ORCA 正在改写数据中心的计算逻辑

 内容来源:量子前哨(ID:Qforepost)

文丨浪味仙  排版丨浪味仙

行业动向:2000字丨5分钟阅读

人工智能的飞速发展,令计算需求呈现爆炸式增长,也催生出专为 AI 设计的新型计算基础设施形态——AI 工厂(AI Factories):这些为特定用途而设计的环境,旨在支持越来越复杂的模型和庞大的工作负载,成为推动 AI 创新的核心引擎。

然而,这一趋势也面临着诸多严峻挑战:能源消耗急剧攀升,运营成本不断增加,经典计算架构的性能瓶颈日益显现等。这些问题不仅制约了人工智能的进一步发展,也对可持续性提出了更高要求。

当前,ORCA Computing 正通过全球首个专为 AI 工厂量身打造的量子加速器,积极应对上述难题,为推动 AI 基础设施的落地与扩展提供了一条切实可行的新路径。

AI 工厂为何亟需

量子加速? 

数据中心在全球能源消耗中的占比持续上升。以美国为例,据预测,到 2030 年,美国数据中心的电力消耗将达到全国总用电量的 16%,而在 ChatGPT 出现之前,这一比例仅为 2.5%。

当前,经典计算架构面临的性能瓶颈,已成为限制 AI 持续创新与扩展的关键因素。行业迫切需要一种高效、可扩展的解决方案,既能满足 AI 的增长需求,又兼顾成本控制与可持续性目标。

量子计算正成为突破这一困境的关键途径,甚至被视为支撑未来 AI 基础设施的战略必需品。ORCA Computing 推出的 PT 系列🔗,是全球首款专为 AI 工厂架构设计的量子加速器,可替代并优化部分以往由 CPU 和 GPU 承担的计算任务,能够有效提升模型性能、降低能耗,并在规模化场景下加速 AI 工作负载的整体效率。

应对现实世界 AI 需求的

量子加速器

不同于绝大多数主要应用于实验室的量子系统,ORCA 的 PT 系列量子加速器专为部署于传统数据中心环境而设计。该系统体积紧凑,采用机架式安装,支持室温运行,可无缝集成至现有基础设施的各个层级,包括主流 AI/ML 应用框架,这一设计大幅降低了使用门槛,使用户能够即刻接入,快速获得性能提升。

对于 AI 工厂运营者来说,当前一个日益突出的痛点是:如何在不显著增加成本的情况下提升系统吞吐量与运行效率?PT 系列通过将模型中的部分计算任务从 GPU 转移至量子处理器运行,所实现的量子加速生成式 AI 已在模型精度方面表现出显著优势。

除了提供量子计算的加速能力外,PT 系列也已经能够在 AI 的生产级场景中交付可量化的实际价值。从制药研发、能源系统再到科学探索,各类组织都需要能跟上其增长愿景的基础设施,量子加速正在成为其不可或缺的关键能力,越来越多的行业领导者将量子集成视为下一代 AI 系统的“标配能力”。

AI 基础设施的未来:

混合架构与量子赋能并进 

高性能计算、AI 专用加速与量子计算的融合,正标志着数字基础设施的一个关键转折点。随着模型日益复杂、规模持续扩大,量子增强型架构将成为支撑 AI 持续演进与创新的核心能力。

具备无缝集成、节能高效、贴近实际应用场景特性的 PT 系列,推动行业从概念走向落地,让我们得以一窥未来 AI 工厂所需基础设施的蓝图。

近日,ORCA 宣布与欧洲领先的 AI 超级计算机、量子计算系统与高性能计算(HPC)开发商 ParTec AG 达成合作,双方将在意大利与德国建设的 AI 即服务工厂(AI-as-a-Service Factories) 中集成 PT 系列量子加速器。

ParTec 的量子计算战略聚焦于将云端量子计算与经典 AI 超级计算平台深度融合,并积极推动与全球顶尖高校及产业研究机构的合作,其打造的 AI 工厂专为高性能推理任务而设计,配备先进的 GPU 集群与高速网络架构。通过引入 ORCA 的量子加速生成式 AI(GenAI)能力,这些计算环境将实现进一步增强,助力企业与科研用户获取更深层的数据洞察与更优异的 AI 性能。

Reference:

1、https://www.hpcwire.com/2025/06/02/orca-computing-is-powering-scalable-ai-factories-with-quantum-acceleration/

2、https://orcacomputing.com/partec-ag-and-orca-computing-announce-partnership-to-deliver-quantum-accelerated-ai-factories/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/83441.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

< 买了个麻烦 (二) 618 京东云--轻量服务器 > “可以为您申请全额退订呢。“ 工单记录:可以“全额退款“

事情进展是这样的: 海外接听 一分钟 1-2 元,具体多少要问联通。 这几天接电话,有点儿心烦,看见来自 010-86310548 以为是 ICP 备案,结果接起来全是 VPS (轻量应用服务器)这个工单,就…

接口限频算法:漏桶算法、令牌桶算法、滑动窗口算法

文章目录 限频三大算法对比与选型建议一、漏桶算法(Leaky Bucket Algorithm)1.核心原理2.实现3.为什么要限制漏桶容量4.优缺点分析 二、令牌桶算法(Token Bucket Algorithm)1.核心原理2.实现(1)单机实现&am…

HTML5 盒子模型

1. 盒子模型的概念 2. 边框(border) 边框颜色(border-color) 边框粗细(border-width) 边框样式(border-style) border简写(border:) 3. 外边距&am…

【Linux】Linux高级I/O

参考博客:https://blog.csdn.net/sjsjnsjnn/article/details/128345976 一、五种IO模型 阻塞式I/O非阻塞式I/OI/O复用(多路转接)信号驱动式I/O异步I/O I/O我们并不陌生,简单的说就是输入输出;对于一个输入操作通常包…

关于界面存在AB测试后UI刷新空白的问题

问题描述: 在同一页面存在AB面,A和B同时都有一个rv,然后A面的rv填充不了数据,B面的可以。 问题解决: header_task布局里的include_new_gift_sign里有一个和外层一样id的recyclerview include的标签的作用是。在infl…

Go 协程(Goroutine)入门与基础使用

一、什么是协程(Goroutine)? 简单来说,协程是由 Go 语言运行时管理的轻量级线程。相比系统线程,它的调度开销极小,内存占用非常少(默认只需 2KB 栈空间)。 你可以在一个程序中轻松…

matlab 各种智能优化算法

1. 优化算法相关 蚁群优化算法(ACO) 蚁群优化算法是一种模拟蚂蚁觅食行为的优化技术。以下是一个简化版的ACO用于解决旅行商问题(TSP)的MATLAB代码: function [bestRoute, minDist] acoTsp(distMatrix, numAnts, n…

Hilt -> Android 专属依赖注入(DI)框架

Hilt 是 Google 基于 Dagger 封装的 Android 专属依赖注入(DI)框架,显著简化了依赖管理流程,提升代码可维护性和可测试性。以下是核心要点及使用指南: dagger2: Dagger 2 原理和使用-CSDN博客 Hilt vs Dagger2&…

AISHELL-5 全球首套智能驾舱中文语音交互数据集开源

随着汽车成为人们日常生活中不可或缺的一部分,而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力,存在安全风险,因此,车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同,驾驶场景中的系统…

openstack之neutron(一)

NFV基础 neutron是对二层物理网络的抽象与管理,实例的网络功能由连接到vSwitch的端口上的vNIC共同实现,再通过物理服务器的物理网卡访问外部的物理网络。 NFV实现 网卡虚拟化:tap、tun、veth; 交换机虚拟化:linuxbri…

【Java】Arrays.sort:TimSort

一,概述 书接前文【Java】Arrays.sort:DualPivotQuicksort-CSDN博客 Arrays.sort对基本数据类型使用了双轴快速排序,但是对Object[]类型,则使用了TimSort,TimSort是稳定的排序,它整合了插入排序归并排序,…

一个n8n构建的能和LLM对话的Agent

一个n8n构建的能和LLM对话的Agent 1.OLLAMA1.1.下载和安装1.2.设置环境变量1.3.重启ollama1.4.测试1.5.拉取模型2.n8n部署2.1. 镜像拉取和启动2.2.注册和登录2.3.新建一个工作流3.说在后面的话环境搭建说明: windows(RTX 5090)+VM CENTOS 采用本地化的ollama运行LLM n8n是一…

升级 Ubuntu Linux 内核的几种不同方法

方法 1 - 使用 dpkg 升级 Linux 内核(手动方式) 这个方法可以帮助你从 kernel.ubuntu.com 网站手动下载可用的最新 Linux 内核。如果你打算安装最新版(而不是稳定版或者正式发布版),那这种方法…

Robots.txt 文件

什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…

Linux 内核 Slab 分配器核心组件详解

Slab 分配器是 Linux 内核中用于高效管理内存的机制,其核心目标是通过对象缓存减少内存碎片和分配/释放开销。以下详细解析其核心组件及其协作关系: 一、Slab 系统的核心组件 组件 描述 作用场景 Slab 描述符 每个 Slab 的管理结构(如 struc…

Oracle 的AHF (Automatic Health Framework) 工具

Oracle 的AHF (Automatic Health Framework) 工具 Oracle AHF (Automatic Health Framework) 是 Oracle 官方提供的诊断工具集合,用于自动收集、分析和诊断 Oracle 数据库及集群环境的健康状态和问题。 一 AHF 核心功能概述 1. 主要组件 TFA (Trace File Analyz…

华为服务器obsutil使用方法

本文不生产技术,只做技术的搬运工!!! 前言 最近在使用华为云服务器进行模型训练,发现其上传下载文件都极慢,询问华为官方人员是否限速,对方推荐使用obsutil作为中转服务进行下载,在…

【大模型训练】中短序列attention 和MOE层并行方式(二)

我们考虑一个典型的Transformer模型结构,在多层堆叠中,其中包含Attention层和MoE层(FeedForward层被替换为MoE层)。在模型最后是LM Head(语言模型头),通常是一个全连接层,将隐层向量…

2025-06-09(批量智能裁剪视频尺寸并延长视频时长)

import os import subprocess import random import json # 配置参数 TARGET_WIDTH 500 TARGET_HEIGHT 600 TARGET_DURATION 180 # 目标时长(秒) OUTPUT_DIR "processed_videos" MIRROR_MODES ["none", "horizontal&quo…

CKA考试知识点分享(9)---gateway api

CKA 版本:1.32 第九套题是涉及gateway api相关。 注意:本文不是题目,只是为了学习相关知识点做的实验。仅供参考 实验目的 创建一个gateway api,来实现后端镜像的外部访问。 gateway api 通过nginx实现 实验开始 安装nginx ga…