Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

作者头像
机器之心
发布于 2023-12-12 10:33:08
发布于 2023-12-12 10:33:08
6590
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:杜伟、小舟

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRaStable Diffusion 和 Whisper)。

2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。

苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能力。

苹果推出的 ML Compute 可用于在 Mac 上进行 TensorFlow 模型的训练。PyTorch 则支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练,使用苹果 Metal Performance Shaders (MPS) 作为后端来实现。这些使得 Mac 用户能够在本地训练神经网络。

现在,苹果宣布推出专门在 Apple 芯片上用于机器学习的开源阵列框架 ——MLX。

MLX 是专门为机器学习研究人员设计的,旨在有效地训练和部署 AI 模型。框架本身的设计在概念上也很简单。研究人员能够轻松地扩展和改进 MLX,以快速探索、测试新的想法。MLX 的设计灵感来自 NumPy、PyTorch、Jax 和 ArrayFire 等框架。

项目地址:https://github.com/ml-explore/mlx

MLX 项目贡献者之一、Apple 机器学习研究团队(MLR)研究科学家 Awni Hannun 展示了一段使用 MLX 框架实现 Llama 7B 并在 M2 Ultra 上运行的视频。

视频来源:https://twitter.com/awnihannun/status/1732184444629647840

MLX 迅速引起机器学习研究人员的关注。TVM、MXNET、XGBoost 作者,CMU 助理教授,OctoML CTO 陈天奇转推表示:「苹果芯片又有新的深度学习框架了。」

有网友评价 MLX 称,苹果再次「重造了轮子」。

图源:https://twitter.com/ofervic/status/1732305883814596953

MLX 特性、示例

在该项目中,我们可以看到,MLX 有以下一些主要特性。

熟悉的 API。MLX 拥有非常像 NumPy 的 Python API,以及功能齐备的 C++ API(与 Python API 非常相似)。MLX 还有更高级的包(比如 mlx.nn 和 mlx.optimizers),它们的 API 很像 PyTorch,可以简化构建更复杂的模型。

可组合函数变换。MLX 拥有自动微分、自动矢量化和计算图优化的可组合函数变换。

惰性计算。MLX 中的计算是惰性的,阵列只有在需要时才被实例化。

动态图构建。MLX 中的计算图构建是动态的,改变函数参数的形状不会导致编译变慢,并且 debug 很简单、容易上手。

多设备。任何支持的设备上(如 CPU 和 GPU)都可以运行操作。

统一内存。MLX 与其他框架的显著差异在于统一内存,阵列共享内存。MLX 上的操作可以在任何支持的设备类型上运行,无需移动数据。

此外,项目中提供了多种使用 MLX 框架的示例,比如 MNIST 示例可以很好地让你学习如何使用 MLX。

图源:https://github.com/ml-explore/mlx-examples/tree/main/mnist

MLX 还有其他更多有用的示例,包括如下:

  • Transformer 语言模型训练;
  • LLaMA 大规模文本生成和 LoRA 微调;
  • Stable Diffusion 生成图片;
  • OpenAI 的 Whisper 语音识别

更详细的文档可参阅:https://ml-explore.github.io/mlx/build/html/install.html#

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
​苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
对于许多人来说,都希望打破这个护城河,比如PyTorch支持更多GPU,OpenAI的Triton等等。
新智元
2023/12/20
3.1K0
​苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型
现在,用上这个框架,你就能直接在苹果GPU上跑70亿参数大模型、训练Transformer模型或是搞LoRA微调。
量子位
2023/12/12
2K0
苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型
从头造轮子 or 重复造轮子?苹果开源 MLX,为自家芯片专属定制机器学习框架
北京时间 12 月 6 日,苹果机器学习研究中心 (Apple machine learning research) 在 GitHub 上开源 MLX。
HyperAI超神经
2023/12/12
4880
从头造轮子 or 重复造轮子?苹果开源 MLX,为自家芯片专属定制机器学习框架
AI日报:苹果为使用Mac的人工智能开发者推出开源工具
用于机器学习的MLX框架是专门为苹果的Silicon处理器架构开发的。MLX可通过GitHub获得,旨在简化苹果硬件上的机器学习模型培训和部署。
Nowl
2024/01/18
2640
AI日报:苹果为使用Mac的人工智能开发者推出开源工具
机器学习算法实现,最小和最干净的例子
大噶吼,不说废话,分享一波我最近看过并觉得非常硬核的资源,包括Python、机器学习、深度学习、大模型等等。
Ai学习的老章
2023/12/15
2790
机器学习算法实现,最小和最干净的例子
tinygrad框架简介;MLX框架简介
极简主义与易扩展性 tinygrad 的设计理念是极简主义。与 XLA 类比,如果 XLA 是复杂指令集计算 (CISC),那么 tinygrad 就是精简指令集计算 (RISC)。这种简约的设计使得它成为添加新加速器最容易的框架之一。通过简化框架的架构,开发者可以更轻松地理解和扩展它。
zhangjiqun
2024/07/23
2760
tinygrad框架简介;MLX框架简介
PyTorch宣布支持苹果M1芯片GPU加速:训练快6倍,推理提升21倍
机器之心报道 编辑:泽南、蛋酱 对于 Mac 用户来说,这是令人激动的一天。 今年 3 月,苹果发布了其自研 M1 芯片的最终型号 M1 Ultra,它由 1140 亿个晶体管组成,是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗,M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。 随着用户数量的增长,人们已经逐渐接受使用 M1 芯片的计算机,但作为一款 Arm 架构芯片,还有人在担心部分任务的兼容性问题。 昨天,通过与苹果 Metal 团队工程师合作,PyTorc
机器之心
2022/05/20
2K0
PyTorch宣布支持苹果M1芯片GPU加速:训练快6倍,推理提升21倍
18秒完成渲染!苹果Core ML官宣深度支持Stable Diffusion 2.0
最近AIGC有多火不用多说了,只需一张朴实无华的自拍,就可以让你变身肌肉型男,拥有一个自己二次元的完美角色。
新智元
2023/01/09
2.9K0
18秒完成渲染!苹果Core ML官宣深度支持Stable Diffusion 2.0
搭载M1芯片,新Mac再加优化版 Tensorflow2.4,训练速度最高提升7倍
长期以来,Mac 一直是开发人员、工程师和研究人员喜爱的平台。随着苹果上周包含新 M1芯片的 Mac 电脑更新阵容,苹果的 Mac 优化版 TensorFlow 2.4 释放了 Mac 的全部能力,在性能上有了巨大的飞跃。
新智元
2020/11/24
1.8K0
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心  授权 PyTorch 1.12 正式发布,还没有更新的小伙伴可以更新了。 距离 PyTorch 1.11 推出没几个月,PyTorch 1.12 就来了!此版本由 1.11 版本以来的 3124 多次 commits 组成,由 433 位贡献者完成。1.12 版本进行了重大改进,并修复了很多 Bug。 随着新版本的发布,大家讨论最多的可能就是 PyTorch 1.12 支持苹果 M1 芯片。 其实早在今年 5 月,PyTorch 官方就已经
OpenCV学堂
2022/07/04
9370
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
苹果启动AI云服务器计划,芯片直接用M2 Ultra
尽管苹果在生成式 AI 方面的进展没有像谷歌、Meta 和微软等竞争对手那样高调,但该公司一直在进行相关研究,其构筑新生态的思路总是显得与众不同。
机器之心
2024/05/14
2240
苹果启动AI云服务器计划,芯片直接用M2 Ultra
MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试
如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。
deephub
2023/12/21
3910
MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试
星标破10万!Auto-GPT之后,Transformer越新里程碑
---- 新智元报道   编辑:桃子 【新智元导读】问世6年来,Transformer不仅成为NLP领域的主流模型,甚至成功向其他领域跨界,一度成为风靡AI界的机器学习架构。恰在今天,Transformers库在GitHub上星标破10万大关! 2017年,谷歌团队在论文「Attention Is All You Need」提出了开创性的NLP架构Transformer,自此一路开挂。 多年来,这一架构风靡微软、谷歌、Meta等大型科技公司。就连横扫世界的ChatGPT,也是基于Transformer
新智元
2023/05/22
6280
星标破10万!Auto-GPT之后,Transformer越新里程碑
谷歌并未放弃TensorFlow,将于2023年发布新版,明确四大支柱
2015 年,谷歌大脑开放了一个名为「TensorFlow」的研究项目,这款产品迅速流行起来,成为人工智能业界的主流深度学习框架,塑造了现代机器学习的生态系统。从那时起,成千上万的开源贡献者以及众多的开发人员、社区组织者、研究人员和教育工作者等都投入到这一开源软件库上。
机器之心
2022/12/15
3800
谷歌并未放弃TensorFlow,将于2023年发布新版,明确四大支柱
llama.cpp作者创业,用纯C语言框架降低大模型运行成本
通常,神经网络的推理代码是使用 Python 语言编写的。但相比于 Python,C/C++ 代码运行速度更快,编写过程更严谨,因此一些开发者尝试用 C/C++ 语言实现神经网络。
机器之心
2023/08/07
4150
llama.cpp作者创业,用纯C语言框架降低大模型运行成本
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
关键词:M2芯片;Ultra;M1芯片;UltraFusion;ULTRAMAN;RTX4090、A800;A100;H100;LLAMA、LM、AIGC、CHATGLM、LLVM、LLM、LLMs、GLM、NLP、ChatGPT、AGI、HPC、GPU、CPU、CPU+GPU、英伟达、Nvidia、英特尔、AMD、高性能计算、高性能服务器、蓝海大脑、多元异构算力、高性能计算、大模型训练、大型语言模型、通用人工智能、GPU服务器、GPU集群、大模型训练GPU集群、大语言模型
液冷服务器
2023/07/28
2.3K0
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存
---- 新智元报道   编辑:好困 【新智元导读】现在,Meta最新的大语言模型LLaMA,可以在搭载苹果芯片的Mac上跑了! 前不久,Meta前脚发布完开源大语言模型LLaMA,后脚就被网友放出了无门槛下载链接,「惨遭」开放。 消息一出,圈内瞬间就热闹了起来,大家纷纷开始下载测试。 但那些手头没有顶级显卡的朋友们,就只能望模型兴叹了。 不过,问题不大。Georgi Gerganov在最近做了一个名为「llama.cpp」的项目——没有GPU也能跑LLaMA。 项目地址:https://githu
新智元
2023/03/29
1.7K0
LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存
一分钟部署私人 ChatGPT:快速、小巧、安全的私密聊天室 | 开源日报 No.147
该项目是一个跨平台的 ChatGPT/Gemini UI(Web/PWA/Linux/Win/MacOS),提供一键部署私人 ChatGPT 应用,支持 GPT3、GPT4 和 Gemini Pro 模型。它具有快速部署、体积小巧的客户端、Markdown 支持、响应式设计等特点。
小柒
2024/01/08
5900
一分钟部署私人 ChatGPT:快速、小巧、安全的私密聊天室 | 开源日报 No.147
Julia开源新框架SimpleChain:小型神经网络速度比PyTorch快5倍!
---- 新智元报道   编辑:LRS 【新智元导读】世上没有免费的午餐,享受了通用框架的便利,在特定任务上就要牺牲性能。最近Julia开源了一个新框架SimpleChain,在小型神经网络的运行速度上比PyTorch至少快5倍! Julia从一出生开始,就瞄准了科学计算领域,并且一直在与Python暗中较量。 在神经网络的框架上,Python有PyTorch和TensorFlow,几乎是深度学习开发的首选框架,并且获得了Meta和Google在技术和资金上的支持,蓬勃发展。 虽然Julia也有Flu
新智元
2022/04/26
1.4K0
Julia开源新框架SimpleChain:小型神经网络速度比PyTorch快5倍!
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
机器之心报道 编辑:陈萍 PyTorch 1.12 正式发布,还没有更新的小伙伴可以更新了。 距离 PyTorch 1.11 推出没几个月,PyTorch 1.12 就来了!此版本由 1.11 版本以来的 3124 多次 commits 组成,由 433 位贡献者完成。1.12 版本进行了重大改进,并修复了很多 Bug。 随着新版本的发布,大家讨论最多的可能就是 PyTorch 1.12 支持苹果 M1 芯片。 其实早在今年 5 月,PyTorch 官方就已经宣布正式支持在 M1 版本的 Mac 上进行
机器之心
2022/07/04
1.2K0
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
推荐阅读
​苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
3.1K0
苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型
2K0
从头造轮子 or 重复造轮子?苹果开源 MLX,为自家芯片专属定制机器学习框架
4880
AI日报:苹果为使用Mac的人工智能开发者推出开源工具
2640
机器学习算法实现,最小和最干净的例子
2790
tinygrad框架简介;MLX框架简介
2760
PyTorch宣布支持苹果M1芯片GPU加速:训练快6倍,推理提升21倍
2K0
18秒完成渲染!苹果Core ML官宣深度支持Stable Diffusion 2.0
2.9K0
搭载M1芯片,新Mac再加优化版 Tensorflow2.4,训练速度最高提升7倍
1.8K0
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
9370
苹果启动AI云服务器计划,芯片直接用M2 Ultra
2240
MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试
3910
星标破10万!Auto-GPT之后,Transformer越新里程碑
6280
谷歌并未放弃TensorFlow,将于2023年发布新版,明确四大支柱
3800
llama.cpp作者创业,用纯C语言框架降低大模型运行成本
4150
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
2.3K0
LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存
1.7K0
一分钟部署私人 ChatGPT:快速、小巧、安全的私密聊天室 | 开源日报 No.147
5900
Julia开源新框架SimpleChain:小型神经网络速度比PyTorch快5倍!
1.4K0
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
1.2K0
相关推荐
​苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档