阿里Qwen3全面登陸蘋果MLX！32款模型開源

2025-06-18 來源：電子工程專輯

1081

阿里通義千問開源負(fù)責(zé)人林俊旸在X上回應(yīng)，“這是一個小更新，但由于模型太多，我們甚至需要用 Mac Studio 進(jìn)行測試，所以花了不少時間。希望這些更新對 MLX 用戶有所幫助！”

近日，阿里巴巴Qwen團(tuán)隊宣布Qwen3全系模型完成蘋果MLX框架的官方適配，涵蓋從0.6B（6億參數(shù)）到235B（2350億參數(shù)）的8個尺寸，并支持4bit、6bit、8bit、BF16四種量化精度，總計32個版本模型。

蘋果MLX框架自2023年12月推出后，主要適配歐美模型（如Llama）。盡管蘋果在2024年2月已確認(rèn)與阿里合作開發(fā)中國版Apple Intelligence，但2025年WWDC大會仍未公布具體進(jìn)展。

蘋果自研的MLX框架是為Apple Silicon芯片（M1/M2/M3系列）深度優(yōu)化的開源機(jī)器學(xué)習(xí)工具，而Qwen3作為阿里巴巴通義實驗室的最新成果，憑借其混合架構(gòu)（MoE）、多語言支持和高效推理能力，成為首個全面適配MLX的國產(chǎn)大模型。

此次官宣，Qwen3將成為蘋果面向中國市場首個全面落地的中文大模型。

官方適配的戰(zhàn)略意義

4 月 28 日，在 Qwen3 發(fā)布前夕，蘋果 MLX Community 成員就在 X 上率先宣布完成了 Qwen3 的適配。 Huggingface 平臺上，在所有 MLX 模型中，排名前五有兩個都是 Qwen3 模型，這一數(shù)據(jù)充分彰顯了 Qwen3 模型在蘋果開發(fā)者群體中的受歡迎程度和廣泛應(yīng)用。

社區(qū)適配更多的是基于技術(shù)愛好者們的熱情，是一種自發(fā)的 “粉絲行為”。而此次發(fā)布者變成了 Qwen 官方團(tuán)隊，給出了一個明確的信號：Qwen 團(tuán)隊將為這一技術(shù)路線提供持續(xù)、穩(wěn)定、可靠的官方支持。

Qwen3 與蘋果 MLX 框架的碰撞

MLX 是蘋果專為 Apple Silicon 芯片設(shè)計的高效機(jī)器學(xué)習(xí)框架，提供了類 PyTorch 的 API，這對于熟悉 PyTorch 的開發(fā)者而言，降低了學(xué)習(xí)和使用成本，快速上手進(jìn)行相關(guān)開發(fā)工作。同時，它兼容 Numpy 語法，Numpy 在數(shù)據(jù)處理和科學(xué)計算領(lǐng)域應(yīng)用極為廣泛。MLX 還支持 C++/Swift 擴(kuò)展，這使得開發(fā)者可以根據(jù)具體需求，靈活地對框架進(jìn)行定制和拓展。

利用統(tǒng)一內(nèi)存架構(gòu)是 MLX 的一大亮點。在這種架構(gòu)下，數(shù)據(jù)在 CPU/GPU 間能夠?qū)崿F(xiàn)共享，帶來的直接好處便是降低了功耗，同時顯著提升了處理速度。MLX 具備動態(tài)圖構(gòu)建、多模態(tài)支持、端側(cè)部署優(yōu)化等一系列功能。這些功能的協(xié)同作用，使得它能夠在 iPhone、iPad、Mac 等各種蘋果設(shè)備上高效運(yùn)行模型，極大地幫助開發(fā)者更輕松地進(jìn)行機(jī)器學(xué)習(xí)模型訓(xùn)練與部署。

為更好服務(wù)開發(fā)者，通義團(tuán)隊推出基于 MLX 框架深度優(yōu)化的全部 Qwen3 系列模型，每款模型都有 4bit、6bit、8bit 和 BF16 等 4 種不同精度的量化版本，即共有 32 款官方的 Qwen3 MLX 模型一次性全開源。這些豐富的選擇允許用戶根據(jù)自身設(shè)備的硬件資源情況，精準(zhǔn)地選擇合適的模型精度。

目前從 Mac Pro、Mac Studio 到 Mac mini、 MacBook ，再到 iPad 、 iPhone等，都可以部署 Qwen3。

下載地址：

Huggingface：https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

ModelScope： https://modelscope.cn/collections/Qwen3-9743180bdc6b48

對于開發(fā)者而言，這種細(xì)致的劃分具有極大的實用價值。例如，低量化（如 4bit）非常適合內(nèi)存有限的設(shè)備，像 iPhone，在這類設(shè)備上運(yùn)行低量化模型可以在有限的硬件條件下實現(xiàn)輕量級 AI 助手功能，滿足用戶日常一些簡單的 AI 需求；而高精度（如 BF16）則適合需要更高推理質(zhì)量的場景，比如在配備 M2/M3 Ultra 芯片的 Mac Studio 上進(jìn)行復(fù)雜 AI 內(nèi)容創(chuàng)作時，高精度模型能夠提供更優(yōu)質(zhì)、更準(zhǔn)確的推理結(jié)果，助力創(chuàng)作者實現(xiàn)更出色的作品。

在激烈的 AI 競爭環(huán)境下，蘋果在 AI 領(lǐng)域的發(fā)展進(jìn)程備受關(guān)注。Qwen3這種 “量體裁衣” 式的優(yōu)化，本質(zhì)上是阿里與蘋果硬件的一次深度且積極的協(xié)同。

Qwen3的MLX適配，直接解決了蘋果在中國市場的本地化需求。通過開源策略，阿里巴巴吸引開發(fā)者共建生態(tài)，為國行版Apple Intelligence的推出奠定基礎(chǔ)。

對阿里巴巴而言，Qwen3成為首個適配蘋果生態(tài)的國產(chǎn)大模型，打破此前華為、小米等廠商在安卓陣營的主導(dǎo)地位。通過MLX框架，Qwen3可無縫集成到蘋果開發(fā)者工具鏈中，覆蓋全球數(shù)億蘋果用戶。而且蘋果生態(tài)的高付費(fèi)用戶群體，為Qwen3的商業(yè)化（如API調(diào)用、定制服務(wù)）提供廣闊市場。

目前，全球大模型市場呈現(xiàn)“中美雙雄”格局，美國市場以谷歌Gemini、微軟Phi-3、Meta Llama 3為代表，主打云端大模型與企業(yè)級服務(wù)；中國陣營以通義千問、文心一言、百川智能為代表，聚焦端側(cè)部署與場景化落地。

Qwen3登陸MLX不僅是技術(shù)優(yōu)化，更是阿里向蘋果生態(tài)注入的“中國解決方案”。

責(zé)編：Amy.wu