還支持訓練Transformer模型
蘋果M系列芯片專屬的
機器學習框架
,開源即爆火!
現在,用上這個框架,你就能直接在蘋果GPU上跑70億參數大模型、訓練Transformer模型或是搞LoRA微調。
它由蘋果官方發佈,風格與PyTorch相似,不過並不基於任何已有框架實現。
LeCun等大佬紛紛趕來點贊轉發。
英偉達高級AI科學家Jim Fan讚歎稱:
這應該是目前蘋果在開源AI開源上最大的動作了。
甚至還有網友動起了iPhone上A芯的念頭(手動狗頭)
所以,這個框架究竟長啥樣?
參考多個ML框架設計
這個新框架名叫MLX,有探索機器學習(ml-explore)的意思。
從功能來看,MLX主要有以下幾點特性:
API熟悉(包括C++ API、類似NumPy的Python API以及一些高級功能包近似於PyTorch的API)、可組合函數變換、惰性計算、動態圖構建、多設備可用、統一內存。
框架作者Awni Hannun介紹,之所以MLX不直接基於PyTorch實現,主要有幾個方面的考量。
首先是因爲,MLX框架是給蘋果芯片設計的。
蘋果芯片在採用了一些獨特的設計,例如
統一內存
,這些設計在框架中都可以被利用。
然後,MLX框架也參考了不同機器學習框架的優勢,包括NumPy、PyTorch、Jax和ArrayFire等。
例如JAX中可組合的函數轉換,就被加進了MLX的設計中,但graph(計算圖)仍然是動態構建的。
除此之外,作者認爲MLX也有一些屬於自己的特性,如簡單、靈活和多樣性等。
因此,MLX在功能和設計上與PyTorch等經典框架不完全一樣,有一些“自己的style”。
如果你手上有蘋果M芯電腦的話,現在就可以上手一試跑AI模型了。
蘋果電腦M系列芯片才能用
目前,官方給出了5類MLX的使用參考案例:
- 變壓器
架構語言模型的訓練 - 用
火焰
或
米斯特拉爾
進行長文本生成 - 用
勞拉
進行參數微調 - 用
穩定的擴散
進行圖像生成 - 用
耳語
進行語音識別
作者們還在GitHub上放出了基於Stable Diffusion對比的PyTorch和MLX的性能:
要是對這幾個AI模型感興趣,裝好MLX之後就可以直接上手試玩了。
作者給出了一系列手把手的教程,教你如何在蘋果電腦上運行MLX框架。
首先是pip install mlx,
安裝
一下框架:
我們也在蘋果M芯電腦上嘗試了一下,可以成功安裝:
值得一提的是,安裝前記得檢查一下你的蘋果電腦,各種環境和操作系統是否都搞好了。
而且芯片必須是蘋果自研的M系列芯片,可以用這個口令檢查一下:
如果是英特爾平臺,也是用不了MLX的:
搞定之後,git clone一個副本,就可以在樣例裏面找到自己想玩的模型,嘗試上手運行了:
這裏跑一個LLaMA試試:
然後就可以開始問問題了,例如波爾查諾-魏爾斯特拉斯定理是什麼等等,LLaMA就能在終端給你解答:
LightningAI的Sebastian Raschka表示,這個框架看起來非常酷,希望能看到更多PyTorch與MLX在macOS上的性能對比。
除此之外,LLaMA在MLX上的實現細節也非常有意思:
還有不少蘋果用戶表示高興:H100稀缺的情況下,終於可以用M3 Max來搞事了。
你試用過MLX了嗎?感覺如何?
參考鏈接:
[1]https://github.com/ml-explore/mlx
[2]https://twitter.com/awnihannun/status/1732184443451019431
如若转载,请注明出处:https://www.tuio.cc/945.html