苹果的机器学习框架将支持英伟达的CUDA平台

在这里插入图片描述
苹果专为Apple Silicon设计的MLX机器学习框架即将迎来CUDA后端支持,这意义重大。原因如下。

这项开发工作由GitHub开发者@zcbenz主导(据AppleInsider报道),他于数月前开始构建CUDA支持的原型。此后他将项目拆分为多个模块,逐步将其合并至苹果MLX框架的主分支。

虽然该后端仍在开发中,但矩阵乘法、softmax函数、归约运算、排序和索引等核心操作已实现支持并通过测试。

在这里插入图片描述

等等,什么是CUDA?

简单来说,CUDA(Compute Unified Device Architecture)就是英伟达硬件的"Metal":这是该公司专为其GPU打造的计算平台,旨在充分发挥其硬件性能以完成高性能并行计算任务。

对多数人而言,CUDA是在英伟达GPU上运行机器学习任务的标准方式,它贯穿整个机器学习生态圈,从学术研究到商业部署无不涉及。即便是机器学习领域之外也耳熟能详的PyTorch和TensorFlow等框架,都依赖CUDA来实现GPU加速。

为何苹果MLX框架现在要支持CUDA?

MLX最初是针对苹果芯片和Metal框架优化的,但新增CUDA后端改变了这一局面。现在研究人员和工程师可以在Mac上借助MLX本地调试基于CUDA的模型原型,然后部署在仍主导机器学习训练任务的NVIDIA大型GPU集群上。

不过目前仍存在若干限制,多数功能还在开发中。例如并非所有MLX算子都已实现,AMD显卡支持更是尚需时日。

但MLX与NVIDIA GPU的深度结合,确实为快速测试、实验和研究场景打开了新可能——这恰恰是AI开发者最期待听到的消息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/89180.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/89180.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

golang语法-----变量、常量

变量1、声明与初始化(1)标准声明 (先声明,后赋值)var age int // 声明一个 int 类型的变量 age,此时 age 的值是 0 fmt.Println(age) // 输出: 0age 30 // 给 age 赋值 fmt.Println(age) // 输出: 30//int 的零…

Jenkins+Docker(docker-compose、Dockerfile)+Gitee实现自动化部署

项目目录结构 project-root/ ├── pom.xml ├── docker │ ├── copy.sh │ ├── file │ │ ├── jar │ │ │ └── 存放执行copy.sh以后jar包的位置 │ │ └── Dockerfile │ └── docker-compose.yml ├── docker-only-test │ ├─…

TASK01【datawhale组队学习】地瓜机器人具身智能概述

https://github.com/datawhalechina/ai-hardware-robotics 参考资料地址 具身智能(Embodied AI) 具身智能 智能的大脑 行动的身体。 比例(Proportional)、积分(Integral)、微分(Derivative&a…

uni-app 配置华为离线推送流程

1、首先需要创建一个华为开发者账号,我这个是个人开发账号 申请开发者账号 2、去AppGallery Connect登陆我们刚刚创建好的账号,点击页面的APP进入到如下3 AppGallery Connect ‎‎‎‎‎ ‎3、在AppGallery Connect 网站中创建一个 Android应用、点击…

当下主流摄像头及其核心参数详解

📖 推荐阅读:《Yocto项目实战教程:高效定制嵌入式Linux系统》 🎥 更多学习视频请关注 B 站:嵌入式Jerry 当下主流摄像头及其核心参数详解 一、摄像头发展概述 摄像头作为现代智能设备(如手机、安防、车载、工业等&am…

下载了docker但是VirtualBox突然启动不了了

今天下docker后发现 eNSP 路由器,防火墙启动不了了去virtualbox检查的时候发现无法启动:报错:不能为虚拟电脑 AR_Base 打开一个新任务.Raw-mode is unavailable courtesy of Hyper-V. (VERR_SUPDRV_NO_RAW_MODE_HYPER_V_ROOT).返回代码: E_F…

C++11之lambda表达式与包装器

lambda与包装器lambda语法捕捉列表lambda的应用lambda的原理包装器functionbindlambda语法 lambda 表达式本质是⼀个匿名函数对象,跟普通函数不同的是他可以定义在函数内部。 lambda 表达式语法使⽤层⽽⾔没有类型,所以我们⼀般是⽤auto或者模板参数定义…

有痛呻吟!!!

XiTuJueJin:YYDS 分盘 有些平台吃相太难看,同样的文章,我还先选择现在这里发布,TMD. 莫名其妙将我的文章设置为仅VIP可见,还是今天才发现,之前只是将一两篇设置为仅VIP可见,今天突然发现这种标识的都自动…

2025年7-9月高含金量数学建模竞赛清单

2025年7-9月高含金量数学建模竞赛 ——“高教社杯”国赛 & “华为杯”研赛作为过来人,真心觉得参加数学建模比赛是我本科阶段做的最值的事之一。 它锻炼的那种把实际问题转化成模型求解的思维,对做研究、写论文甚至以后工作都帮助很大。我当时就是靠…

SpringBoot为什么使用new RuntimeException() 来获取调用栈?

为什么不直接使用 Thread.currentThread().getStackTrace()?这确实看起来有点“奇怪”或者“绕”,但其实这是 Java 中一种非常常见、巧妙且合法的技巧,用于在运行时动态获取当前代码的调用栈信息。Spring 选择用 new RuntimeException().getS…

小白成长之路-haproxy负载均衡

文章目录一、概述1、HAProxy简介2、HAProxy特点和优点:3、HAProxy保持会话的三种解决方法4、HAProxy的balance 8种负载均衡算法1)RR(Round Robin)2)LC(Least Connections)3)SH&#…

Kafka 与 RocketMQ 消息确认机制对比分析

目录 生产者消息确认机制 Kafka 生产者 ACK 机制 RocketMQ 生产者确认机制 消费者消息确认机制 Kafka 消费者确认机制 RocketMQ 消费者确认机制 核心差异对比 选型建议 消息确认机制是分布式消息中间件的核心功能之一,它直接关系到消息传递的可靠性和系统性能…

C/C++---rdbuf()函数

在C中,rdbuf() 是I/O流库中的一个核心成员函数,主要用于访问和操作流对象的缓冲区。这个函数在底层数据处理、流重定向以及自定义流操作等场景中应用广泛。下面将从多个方面详细解析 rdbuf() 函数。 基本概念与函数原型 rdbuf() 是 std::basic_ios 类的成…

【LLM】从零到一构建一个小型LLM--MiniGPT

从零到一构建一个小型LLM (Small Language Model)暂时起名为MiniGPT。这个模型将专注于因果语言建模 (Causal Language Modeling),这是许多现代LLM(如GPT系列)的核心预训练任务。模型设计: 我们设计的模型是一个仅包含解码器 (Dec…

网络安全威胁下的企业困境与破局技术实践

前言:网络安全威胁下的企业困境 在数字化转型的浪潮中,企业对信息技术的依赖程度日益加深,但随之而来的网络安全威胁也愈发严峻。据统计,全球每年因网络安全事件造成的经济损失高达数万亿美元,其中中小企业更是成为了网…

[RAG system] 信息检索器 | BM25 Vector | Pickle格式 | HybridRetriever重排序

第六章:信息检索器 在上一章中,我们成功完成了知识库摄入流程。这是巨大的进步~ 我们精心准备了文档"块"(类似独立的索引卡),并将其存储在两套智能归档系统中:向量数据库(用于基于含…

Android 高通平台修改音频参数效果文件-优化音频效果

Android 高通平台如何音频效果 修改音频参数效果文件-优化音频效果 按如下方式修改。 开发云 - 一站式云服务平台 diff --git a/vendor/qcom/proprietary/mm-audio/audcal/family-b/acdbdata//MTP/workspaceFile.qwsp b/vendor/qcom/proprietary/mm-audio/audcal/family-b/acdb…

Install Docker Engine on UbuntuMySQL

Install Docker Engine on Ubuntu&&MySQL安装docker安装mysql客户端连接数据库我真气鼠了,今天得到一个血泪的教训,以后一定看官方文档!!!学的课用的centos,指令全是yum,我这边不通用&a…

智能人体感应模块HC-SR501应用指南---使用esp32

人体热释电探头红外感应模块 人体感应开关HC-SR501蓝板新款 绿板-淘宝网 HC-SR501 人体红外感应电子模块传感器热释电探头感应开关RD-624-tmall.com天猫 模块信息 HC-SR501人体感应开关是一种基于红外线技术的自动控制模块,广泛应用于安防、智能家居和自动控制等领…

加速度传感器方向校准方法

保持平板平放在桌面上,将后置摄像头保持在平板的左上后方,或者右上后方,此为机器的正方向 1、以一台重力方向正常的机器做测试,通过DeviceInfoHw这个软件的加速度测试功能【Accelerometer Test】我们可以知道 X方向数据测试&#…