近日,阿里巴巴Qwen團隊宣布Qwen3全系模型完成蘋果MLX框架的官方適配,涵蓋從0.6B(6億參數(shù))到235B(2350億參數(shù))的8個尺寸,并支持4bit、6bit、8bit、BF16四種量化精度,總計32個版本模型。
蘋果MLX框架自2023年12月推出后,主要適配歐美模型(如Llama)。盡管蘋果在2024年2月已確認與阿里合作開發(fā)中國版Apple Intelligence,但2025年WWDC大會仍未公布具體進展。
蘋果自研的MLX框架是為Apple Silicon芯片(M1/M2/M3系列)深度優(yōu)化的開源機器學(xué)習(xí)工具,而Qwen3作為阿里巴巴通義實驗室的最新成果,憑借其混合架構(gòu)(MoE)、多語言支持和高效推理能力,成為首個全面適配MLX的國產(chǎn)大模型。
此次官宣,Qwen3將成為蘋果面向中國市場首個全面落地的中文大模型。
官方適配的戰(zhàn)略意義
4 月 28 日,在 Qwen3 發(fā)布前夕,蘋果 MLX Community 成員就在 X 上率先宣布完成了 Qwen3 的適配。 Huggingface 平臺上,在所有 MLX 模型中,排名前五有兩個都是 Qwen3 模型,這一數(shù)據(jù)充分彰顯了 Qwen3 模型在蘋果開發(fā)者群體中的受歡迎程度和廣泛應(yīng)用。
社區(qū)適配更多的是基于技術(shù)愛好者們的熱情,是一種自發(fā)的 “粉絲行為”。而此次發(fā)布者變成了 Qwen 官方團隊,給出了一個明確的信號:Qwen 團隊將為這一技術(shù)路線提供持續(xù)、穩(wěn)定、可靠的官方支持。
阿里通義千問開源負責(zé)人林俊旸在X上回應(yīng),“這是一個小更新,但由于模型太多,我們甚至需要用 Mac Studio 進行測試,所以花了不少時間。希望這些更新對 MLX 用戶有所幫助!”
Qwen3 與蘋果 MLX 框架的碰撞
MLX 是蘋果專為 Apple Silicon 芯片設(shè)計的高效機器學(xué)習(xí)框架,提供了類 PyTorch 的 API,這對于熟悉 PyTorch 的開發(fā)者而言,降低了學(xué)習(xí)和使用成本,快速上手進行相關(guān)開發(fā)工作。同時,它兼容 Numpy 語法,Numpy 在數(shù)據(jù)處理和科學(xué)計算領(lǐng)域應(yīng)用極為廣泛。MLX 還支持 C++/Swift 擴展,這使得開發(fā)者可以根據(jù)具體需求,靈活地對框架進行定制和拓展。
利用統(tǒng)一內(nèi)存架構(gòu)是 MLX 的一大亮點。在這種架構(gòu)下,數(shù)據(jù)在 CPU/GPU 間能夠?qū)崿F(xiàn)共享,帶來的直接好處便是降低了功耗,同時顯著提升了處理速度。MLX 具備動態(tài)圖構(gòu)建、多模態(tài)支持、端側(cè)部署優(yōu)化等一系列功能。這些功能的協(xié)同作用,使得它能夠在 iPhone、iPad、Mac 等各種蘋果設(shè)備上高效運行模型,極大地幫助開發(fā)者更輕松地進行機器學(xué)習(xí)模型訓(xùn)練與部署。
為更好服務(wù)開發(fā)者,通義團隊推出基于 MLX 框架深度優(yōu)化的全部 Qwen3 系列模型,每款模型都有 4bit、6bit、8bit 和 BF16 等 4 種不同精度的量化版本,即共有 32 款官方的 Qwen3 MLX 模型一次性全開源。這些豐富的選擇允許用戶根據(jù)自身設(shè)備的硬件資源情況,精準地選擇合適的模型精度。
目前從 Mac Pro、Mac Studio 到 Mac mini、 MacBook ,再到 iPad 、 iPhone等,都可以部署 Qwen3。
下載地址:
Huggingface:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48
對于開發(fā)者而言,這種細致的劃分具有極大的實用價值。例如,低量化(如 4bit)非常適合內(nèi)存有限的設(shè)備,像 iPhone,在這類設(shè)備上運行低量化模型可以在有限的硬件條件下實現(xiàn)輕量級 AI 助手功能,滿足用戶日常一些簡單的 AI 需求;而高精度(如 BF16)則適合需要更高推理質(zhì)量的場景,比如在配備 M2/M3 Ultra 芯片的 Mac Studio 上進行復(fù)雜 AI 內(nèi)容創(chuàng)作時,高精度模型能夠提供更優(yōu)質(zhì)、更準確的推理結(jié)果,助力創(chuàng)作者實現(xiàn)更出色的作品。
在激烈的 AI 競爭環(huán)境下,蘋果在 AI 領(lǐng)域的發(fā)展進程備受關(guān)注。Qwen3這種 “量體裁衣” 式的優(yōu)化,本質(zhì)上是阿里與蘋果硬件的一次深度且積極的協(xié)同。
Qwen3的MLX適配,直接解決了蘋果在中國市場的本地化需求。通過開源策略,阿里巴巴吸引開發(fā)者共建生態(tài),為國行版Apple Intelligence的推出奠定基礎(chǔ)。
對阿里巴巴而言,Qwen3成為首個適配蘋果生態(tài)的國產(chǎn)大模型,打破此前華為、小米等廠商在安卓陣營的主導(dǎo)地位。通過MLX框架,Qwen3可無縫集成到蘋果開發(fā)者工具鏈中,覆蓋全球數(shù)億蘋果用戶。而且蘋果生態(tài)的高付費用戶群體,為Qwen3的商業(yè)化(如API調(diào)用、定制服務(wù))提供廣闊市場。
目前,全球大模型市場呈現(xiàn)“中美雙雄”格局,美國市場以谷歌Gemini、微軟Phi-3、Meta Llama 3為代表,主打云端大模型與企業(yè)級服務(wù);中國陣營以通義千問、文心一言、百川智能為代表,聚焦端側(cè)部署與場景化落地。
Qwen3登陸MLX不僅是技術(shù)優(yōu)化,更是阿里向蘋果生態(tài)注入的“中國解決方案”。