跨芯片 AI 算子库 FlagGems 正式加入PyTorch 基金会生态项目体系

2025年北京智源大会 · PyTorch Day China 论坛上,PyTorch 基金会执行董事 Matt White 宣布高性能通用 AI 算子库 FlagGems 项目获得批准,正式加入 PyTorch 生态项目体系。Pytorch基金会于6月26日在推特上进行了官方宣布。

作为唯一支持多种AI芯片架构的算子库,FlagGems 的加入加速了 PyTorch 实现“在多种芯片架构上无忧部署大模型”的技术创新。同时,这一进展也彰显了智源研究院主导开发的 FlagGems 对全球开源 AI 的重要价值——为开发者利用各种AI加速硬件提供便捷支持,加快在多种芯片的人工智能算法创新和产业落地。

PyTorch Ecosystem 由科研人员、应用开发者以及机器学习工程师共同打造,是全球机器学习和深度学习领域的重要生态系统。该生态系统汇聚了一系列能够扩展、集成或构建于 PyTorch 之上的创新型开源 AI 项目,旨在提供一个动态、灵活且强大的开发环境。

PyTorch 基金会对 PyTorch Ecosystem 项目的遴选有着十分严格的要求,只有对 AI 开源社区具有重要价值、在社区中具有公认的技术口碑的开源项目,才能进入其评估和项目申报。PyTorch技术委员会投票决定哪些项目能成为Pytorch Ecosystem生态项目体系。Pytorch Ecosystem体系中的开源项目作为Pytorch这一深度学习框架项目的重要补充,一同为全球社区提供各种AI开发的重要工具。

扩展 PyTorch 能力,FlagGems 带来「跨芯无忧」的模型部署解决方案

FlagGems 是由智源研究院联合多家机构共同研发的 Triton 高性能通用算子库,算子贡献单位包括中科加禾、摩尔线程、硅基流动、先进编译实验室等,通过提供一套内核函数,加速大语言模型的训练和推理过程。通过在 PyTorch 的 ATen 后端进行注册,FlagGems 让用户无需修改模型代码即可切换到 Triton 函数库。历时一年多的打造,FlagGems 已经成为全球支持芯片种类最多、数量最大的(超过 180 个)Triton 语言算子库。

当前 AI 芯片市场呈现多种技术路线并行、多种产品形态共存的现象,为解决用户“一次编写、处处编译、处处执行”的难题,FlagGems 重点在以下方面做技术攻关。

  • 性能表现:平均性能超过各个芯片厂商的原生算子性能,比 PyTorch ATen 的CUDA算子库平均提速 30%

  • 可插拔式设计:无感注册到 PyTorch 的 ATen 后端

  • 算子规模:全球支持芯片种类最多、数量最大的 Triton 算子库,总数超 180+

  • 模型验证:在 DeepSeek 和 Qwen 重点模型上的训推落地验证中,FlagGems 均有不俗的表现。

整体而言,作为连接桥梁,FlagGems 加入 PyTorch 生态系统,能够搭建起 PyTorch 框架和硬件架构之间的互通。用户无需在代码中逐个替换算子,就能在 eager 模式下隐式地广泛使用 Triton 操作符。FlagGems 提供的统一代码算子库,帮助 PyTorch 适配多个芯片硬件后端生态,降低算法在不同硬件平台之间的迁移难度。

FlagGems 在主流大模型 DeepSeek 和 Qwen 的推理与训练验证中,均能稳定支持上层算法。多种不同 AI 平台上,FlagGems 也完成了在 NVIDIA、Cambricon、MooreThreads、TsingMicro、Ascend 等多种芯片架构的后端支持。

FlagOS技术生态推动多团队针对FlagGems开源合作,共创创新

为了推动FlagGems的发展,FlagOS 社群已经成功举办了数十场社区活动,包括 AI 高校公益行、Triton 生态活动、技术meetup、tech tutorial等,覆盖开发者人群15000+,汇聚 160+ 社区贡献者共建高性能统一AI 算子库,展现了FlagGems项目强大的生态张力。

FlagGems 是面向多芯片的统一开源 AI 系统软件栈 FlagOS 的重要组成部分。FlagGems 连同多后端统一 AI 编译器 FlagTree、并行训推一体框架 FlagScale 和统一通信库 FlagCX 等开源核心库,以及大模型自动迁移部署平台 FlagRelease、大模型评测平台 FlagPerf 等开源工具,共同构建起一个面向多种 AI 芯片的开源、统一系统软件生态。

FlagGems 与 PyTorch 社区的深度融合,丰富了 PyTorch Ecosystem 的多样性和实用性,也是 FlagOS 系统软件生态与更多成熟生态合作的良好开端。这将对 AI 技术的发展和应用创新贡献出更多、更有用的技术组件,让开发者享受到统一、开源开放系统软件带来的便利;方便多种主流大模型在不同 AI 芯片上极速部署,推动不同架构 AI 硬件系统的规模化落地,打破生态壁垒。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/87105.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/87105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue + vue-router写登陆验证的同步方法和异步方法,及页面组件的分离和后端代码

先写一个用vue cdn写一个登陆验证的小示例后端代码 前端719.html <div id"app"><div id"loginForm">//路由层&#xff0c;登陆页和后台主页<router-link to"/">Login</router-link><router-link to"/home&quo…

.netcore 一个mvc到静态html实现

一、新建Mvc项目 Program.cs添加拦截 二、添加一个集成测试 将页面转为html到wwwroot下面 UnitGenHtml.cs using Microsoft.AspNetCore.Hosting; using Microsoft.AspNetCore.Mvc.Testing; using Microsoft.VisualStudio.TestPlatform.TestHost;namespace SaaS.OfficialWeb…

实现Taro小程序+nut-ui左滑删除效果

Taro小程序开发中&#xff0c;使用nut-ui组件&#xff0c;实现左滑删除卡片效果&#xff08;自定义删除按钮样式&#xff09; html代码部分 <nut-swipe class"carBox" v-for"(item, index) in carList" :key"item" :ref"(el) > se…

LLM 系列(五):模型训练篇

一个面向 Java 开发者的 Sring-Ai 示例工程项目&#xff0c;该项目是一个 Spring AI 快速入门的样例工程项目&#xff0c;旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。 项目采用模块化设计&#xff0c;每个模块都专注于特定的功能领域&#xff0c;便于学习和…

Oracle LogMiner分析日志的三种方法示例

Oracle LogMiner分析日志的三种方法示例 方法一:Online Catalog作为日志挖掘字典自动获取日志模式手动获取日志模式方法二:Redo Log作为日志挖掘字典自动获取日志模式手动获取日志模式方法三:Flat File作为日志挖掘字典自动获取日志模式手动获取日志模式📖 Oracle LogMine…

Java 中 List.stream() 的全面使用指南(含完整示例)

标签&#xff1a;Java8, Stream API, 函数式编程, 集合操作 一、前言 随着 Java 8 的推出&#xff0c;Stream API 成为了处理集合数据的一种高效方式。List.stream() 是 Java Stream API 的入口方法之一&#xff0c;它允许开发者将集合转换为流&#xff0c;并通过链式调用实现…

香港 8C 站群服务器买来可以做哪些业务?

香港8C站群服务器&#xff08;即提供8个不同C段IP地址的服务器&#xff09;凭借多IP独立分配、低延迟网络及免备案优势&#xff0c;适用于以下关键业务场景&#xff1a; 一、SEO优化与搜索引擎运营 SEO站群搭建&#xff1a;为 80-100 个网站分配 8 个不同 C 段 IP &#xff0…

UI前端与数字孪生融合新趋势:智慧医疗的可视化诊断辅助

hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 一、引言&#xff1a;数字孪生重塑智慧医疗诊断范式 在医疗数字化转型的浪潮中&#xff0c;数…

OpenBayes 一周速览丨Nanonets-OCR-s深度语义理解,精准结构化转换;HLE人类问题推理基准上线,含2.5k题目,助力封闭式评估体系构建

公共资源速递 5 个公共数据集&#xff1a; * Brain Tumor 脑肿瘤数据集 * HLE 人类问题推理基准数据集 * OpenThoughts3-1.2M 推理数据集 * Nemotron-Personas 人物角色数据集 * OpenMathReasoning 数学推理数据集 14 个公共教程&#xff1a; 音频生成 * 2 视频生成 *…

ABB CH-3185 3 bhl 000986 p 1006 ab ability 800 xa自动化系统

安全性总结(续) 操作环境 在AC 800M控制器系统上线之前&#xff0c;调查哪些环境条件适用。请特别注意以下几点: 控制器不得暴露在超过相关技术规范中给定值的条件下。 控制器不得在暴露于强电气干扰的环境中使用。电机可能产生超过设备允许水平的干扰&#xff0c;例如在维…

【算法】动态规划 斐波那契类型:1137. 第 N 个泰波那契数

1137. 第 N 个泰波那契数 简单 相关标签 premium lock icon 相关企业 提示 泰波那契序列 Tn 定义如下&#xff1a; T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n&#xff0c;请返回第 n 个泰波那契数 Tn 的值。 示例 1&#xff1a; 输入&am…

图像编辑新变革 !ComfyUI-Kontext-fp8本地部署教程,120B参数对标闭源巨头

一、介绍 ComfyUI 是一个强大的、模块化的 Stable Diffusion 界面与后端项目。该用户界面将允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。 关于 FLUX.1 Kontext Dev FLUX.1 Kontext 是 Black Forest Labs 最新推出的突破性多模态图像编辑模型&#…

软件安装——下载安装ollama

一、下载&#xff08;模型管理工具&#xff09;&#xff1a; 下载地址&#xff1a;Ollama 二、自定义安装&#xff1a; 1.令行安装方式如下&#xff1a; 在OllamaSetup.exe所在目录打开cmd命令行&#xff0c;然后命令如下&#xff1a; OllamaSetup.exe /DIRE:\AllEdit\Ai…

springboot集成mqtt收发消息

在 Spring Boot 中使用 MQTT 可以通过集成 Eclipse Paho 或 HiveMQ 等客户端库实现。以下是完整的整合步骤&#xff0c;包括配置、发布和订阅消息的示例。 1. 添加 MQTT 依赖 在 pom.xml 中添加 Paho MQTT 客户端依赖&#xff1a; <dependency><groupId>org.spri…

Java 编程之备忘录模式

前言 有时候&#xff0c;我们真希望人生能有“CtrlZ”。在日常生活中&#xff0c;我们经常使用“撤销”功能&#xff0c;例如在写 Word、画图、写代码时一不小心操作失误&#xff0c;就希望能回到之前的状态。这种**“状态快照 恢复”**机制&#xff0c;在设计模式中就叫做&a…

yolov13+bytetrack的目标跟踪实现

目录 1. 介绍 2. 相关工作 (Related Works) 3. 方法 (Method) 4. 统计和结果 5. 技术实现 ByteTrack: Multi-Object Tracking by Associating Every Detection Box 1. Motivation 2. BYTE 3. ByteTrack 具体代码 UI界面设计 历史记录 完整代码实现UI界面 1. 介绍 …

GO类型转换与断言面试题及参考答案

Go 中类型转换与类型断言的区别是什么? 在Go语言里,类型转换和类型断言是两个不同的概念,它们在应用场景、语法格式以及底层实现上都存在明显差异。 类型转换主要用于将一种数据类型转变为另一种数据类型,一般适用于基本数据类型之间的转换,像整数与浮点数、字符串与字节…

【力扣 中等 C】79. 单词搜索

目录 题目 解法一&#xff1a;回溯 题目 解法一&#xff1a;回溯 void swap(char* a, char* b) {char tmp *a;*a *b;*b tmp; }void reverse(char* str) {int start 0, end strlen(str) - 1;while (start < end) {swap(&str[start], &str[end--]);} }bool se…

【数据标注师】分类标注

目录 一、 **分类标注的认知底层逻辑**1. **三大核心挑战2. **四维评估标准** 二、 **五阶成长体系**▶ **阶段1&#xff1a;分类体系深度内化&#xff08;2-4周&#xff09;**▶ **阶段2&#xff1a;标注决策流程固化**▶ **阶段3&#xff1a;场景化标注策略**▶ **阶段4&…

大数据时代UI前端的智能化转型策略:以用户为中心的设计思维

hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 一、引言&#xff1a;大数据驱动的 UI 前端变革浪潮 在数字化体验竞争白热化的今天&#xff…