AMD ROCm 7開源軟件堆棧即將發(fā)布,挑戰(zhàn)NVIDIA CUDA市場地位
關(guān)鍵詞: AMD ROCm 7 開源軟件堆棧 AI推理性能 CUDA壟斷
近日,AMD正加速推進其開源軟件堆棧ROCm 7的發(fā)布計劃,旨在打破英偉達(NVIDIA) CUDA在AI領(lǐng)域的長期壟斷。根據(jù)外媒報道,AMD已在GitHub上發(fā)布了ROCm 7的版本標(biāo)簽(release tag),包括HIP(Heterogeneous-Compute Interface for Portability)、AOMP與ROCm Libraries,標(biāo)志著該軟件堆棧已接近最終版本,預(yù)計將在未來數(shù)周內(nèi)正式推出。
性能飛躍,AI推理最高提速3.5倍
在早些時候的Advancing AI活動上,AMD公布了ROCm 7的效能數(shù)據(jù)。據(jù)介紹,ROCm 7相較于上一代ROCm 6,在AI推理效能上最高可提升3.5倍,部分工作負載的訓(xùn)練性能提升甚至可達3.8倍,顯著優(yōu)化了在AMD Instinct系列GPU上的AI計算效率。
這一顯著提升得益于ROCm 7集成了最新算法與模型,以及針對AMD GPU硬件的深度優(yōu)化。
特別值得一提的是,基于CDNA 4架構(gòu)的Instinct MI355X GPU在DeepSeek R1測試中,F(xiàn)P8吞吐量表現(xiàn)比NVIDIA B200高出30%。盡管這項數(shù)據(jù)目前仍僅為AMD公布的內(nèi)部測試結(jié)果,尚未經(jīng)第三方驗證,但已足以展示AMD在AI計算領(lǐng)域的雄心壯志。若該數(shù)據(jù)屬實,將意味著AMD在特定AI推理場景下實現(xiàn)了對當(dāng)前頂級競品的性能超越。
開源特性與完整框架支持,挑戰(zhàn)CUDA壟斷
NVIDIA的CUDA軟件棧因其硬件獨占性和高度集成的生態(tài)系統(tǒng),長期以來在AI領(lǐng)域占據(jù)主導(dǎo)地位,形成了上下游高度綁定的市場格局,使得其他競爭者難以切入。AMD此次強調(diào)ROCm 7的開源特性,旨在提供更完整的框架支持、硬件兼容性與開發(fā)工具,力圖打破CUDA的市場壁壘。
ROCm 7不僅支持最新算法和模型,還擴展了對AMD銳龍AI處理器和Radeon顯卡的兼容性,包括對MI350系列GPU的適配,并新增了對Ubuntu 24.04.3 LTS和Rocky Linux 9的系統(tǒng)兼容性支持。
此外,該套件還提供了對PyTorch 2.7、TensorFlow 2.19.1、ONNX Runtime 1.22.0、JAX 0.6.0、Triton 3.3.0、vLLM等一系列主流AI框架的支持,進一步提升了其在大規(guī)模AI部署中的可擴展性與穩(wěn)定性。
NVIDIA CUDA在AI領(lǐng)域的這種壟斷并非不可動搖,尤其是面對來自中國市場的強烈需求,AMD正通過增強框架與全新算法,以及持續(xù)的性能優(yōu)化,正逐步縮小與英偉達的差距,但其挑戰(zhàn)依然嚴(yán)峻。開發(fā)者對CUDA的依賴性,使得他們在遷移到其他平臺時面臨顯著的學(xué)習(xí)曲線。
責(zé)編:Luffy
