國產算力迎來兩大突破,國產GPU全力趕超英偉達
在替代英偉達的道路上,國產算力一直面臨一個“雞生蛋、蛋生雞”的難題。
當國產芯片問世之后,要想真正用起來,需要種子客戶用實際業(yè)務將其打磨、優(yōu)化、迭代,然后服務更多的客戶,并持續(xù)形成飛輪。
然而實際情況卻是,沒有哪一家企業(yè)愿意被當成小白鼠來試驗。這就進入了一個死胡同,越是沒有企業(yè)愿意嘗試,國產算力就越難用。
不過,在近幾年產業(yè)鏈上下游的通力合作下,國產算力迎來了兩個突破口。
一是國產算力迎來技術突破。
國內AI芯片正百花齊放,從產品性能、量產規(guī)模、擁有集群能力且已有場景落地等要素來考量,以華為和摩爾線程等為代表的國內AI芯片第一梯隊玩家已經涌現,并且具備了基于全國產芯片的千卡計算集群。
事實上,去年12月摩爾線程就面向客戶發(fā)布了首個國產全功能GPU千卡千億大模型訓練平臺:夸娥(KUAE)智算中心全棧解決方案,并且已率先實現三個千卡智算集群的落地。
二是國產算力迎來政策東風。
過去一年,全國各地陸續(xù)出臺了算力相關的扶持政策。近期,北京市發(fā)布《北京市算力基礎設施建設實施方案(2024-2027年)》,明確表示對采購自主可控GPU芯片開展智能算力服務的企業(yè),按照投資額的一定比例給予支持,加速實現智算資源供給自主可控。
技術突破與政策扶持就像是螺旋上升的兩條紐帶,互相驅動打造更加可靠的國產算力。
這一次,國產算力有望迎來“中國英偉達”的時刻。
中國版英偉達嶄露頭角
提到GPU,大家基本第一個想到的就是英偉達,的確,在GPU這個領域上,英偉達幾乎是獨占鰲頭的存在。
只不過,隨著科技的發(fā)展,我國的很多企業(yè)也都開始紛紛研究起來了這些GPU,尤其是隨著人工智能的發(fā)展,GPU有了越來越重要的作用,因此越來越多的中國企業(yè)開始涉足這一領域,全力研究起GPU起來。
而在這眾多的前赴后繼的中國企業(yè)之中,有一個企業(yè)可以說是一馬當先,早早的就開始了研究,并且很迅速的便斬獲了研究成果。
如今,這家企業(yè)更是被人們夸贊“中國版英偉達”,表示這家企業(yè)產生的芯片可以代替英偉達。
這家企業(yè)的名字叫做景嘉微,是一家2006年就已經創(chuàng)立了的純國產企業(yè)。最初,景嘉微所研發(fā)的基本也只是一些圖像處理器和小型雷達等產品。由于這些產品所要求的技術準則其實并不算高,因此成立公司才剛剛第二年的時候,景嘉微也順勢就開始研究起來了GPU芯片研發(fā)的領域。
在2014年的時候,景嘉微就已經推出了一款GPU的芯片,這款芯片的性能更是甚至超過了一些進口的芯片,也是因為這些,景嘉微的這款芯片也就成為了我國軍工企業(yè)的指定芯片。
而后來景嘉微推出的一系列JM7顯卡,也成為了民用市場上的一個佼佼者,還有人戲稱它為“中國版英偉達”。
盡管大家都知道,英偉達的種種技術和芯片,景嘉微一時半會兒是絕對不可能做到“復刻”實力的,但我們也要明白,英偉達在GPU芯片這一領域已經研究了三十年左右了。
因此在這樣的時間和技術的差距之下,景嘉微能夠用短短八年時間追上這宛如天塹的差距,簡直可以說是奇跡了。
國產芯片的機會:軟硬兼施,生態(tài)為王
目前,受制于CUDA龐大的軟件生態(tài),國產單卡的性能與H100、A100相比,差距并不明顯。但在千卡以上的集群領域,國產芯片有了一展拳腳的機會。
正如中國工程院院士鄭緯民所說,構建國產萬卡系統(tǒng)雖難但必要,只要生態(tài)做好了,多數任務不會因為芯片性能的微小差異而有明顯感知。
在國內,目前只有華為和摩爾線程兩家公司具備部署全國產AI千卡集群的能力。華為推出了Atlas900 SuperCluster,支持超萬億參數的大模型訓練,并在軟件生態(tài)層面發(fā)力。
而作為GPU芯片頭部創(chuàng)企的摩爾線程,則推出了首個全國產千卡千億模型訓練平臺——夸娥智算集群,有望在功能上對標英偉達,成為大模型國產算力的最佳選擇之一。
摩爾線程的夸娥智算集群,通過軟硬一體化的服務,為大模型企業(yè)提供了一整套解決方案。它覆蓋了主流的大模型,兼容CUDA等主流生態(tài),支持斷點續(xù)訓、分布式訓練、推理加速等功能,并在高性能通信、存儲、集群可靠性等方面進行了優(yōu)化,實現了全棧式的工程、端到端的交鑰匙方案。
鄭緯民院士指出,構建基于國產AI卡的萬卡大模型訓練平臺,需要在網絡、內存、IO等方面進行平衡設計。而摩爾線程的夸娥千卡集群,正是在軟硬件一體化方面實現了全局突破,成為了國產AI算力第一梯隊的一員。隨著摩爾線程3家千卡集群智算中心的落地,未來萬卡集群將指日可待。
核心政策助力“算力”建設
事件:近日,國務院國資委召開“AI賦能 產業(yè)煥新”中央企業(yè)人工智能專題推進會,強調中央企業(yè)要把發(fā)展人工智能放在全局工作中統(tǒng)籌謀劃,深入推進產業(yè)煥新,加快布局和發(fā)展智能產業(yè)。加快建設一批智能算力中心,開展AI+專項行動。會上,10家中央企業(yè)簽訂倡議書,表示將主動向社會開放人工智能應用場景。
在節(jié)后Sora連續(xù)刷屏的大背景下,國資委打響了“國家隊”搶占AI制高點的第一槍,彰顯了對AI的重視,相信后面,工信部等其它部委可能也有跟進動作。這個對算力板塊和AI都是直接利好,對央企也是利好。
長期來看,算力國產化是國內AI產業(yè)發(fā)展的趨勢。國內AI芯片市場需求旺盛,根據艾瑞咨詢測算,2022年中國的AI芯片市場規(guī)模約為385億元,到2027年將有望達到2164億元。
目前中國AI算力產業(yè)中,部分企業(yè)會部署更具全球競爭力的產品,例如微軟、谷歌、英特爾、英偉達、AMD和亞馬遜的AI算力產品,但部分也會進行國產算力產品的采購。我國具有競爭力的是阿里、百度、騰訊和華為,在產品和解決方案具備競爭力的是寶信軟件、中科曙光、電科數字、網宿科技等。
從整體的算力行業(yè)來看,我國無論是在通用算力還是智能算力上均與國外差距明顯。英特爾、AMD、英偉達是算力的主要廠商,在全球具有極高的話語權,同時對中國市場進行供應。但近年來隨著美國芯片法案等對中國的制裁,我國AI算力自主研發(fā)任重而道遠。
創(chuàng)新,仍是國產算力關鍵詞
算力市場仍是風起云涌、變幻莫測,而創(chuàng)新始終是不變的話題。
“市場混亂很大的原因是芯片型號太多,從早前的A100到現在的A800、H800,再到910B、H20等,大多廠商在選擇適配芯片的時候較難做到集群的統(tǒng)一?!迸龛唇榻B,由于型號眾多,異構算力集群的建設與突破是目前主流趨勢。不少廠商曾建設了單一品牌的GPU集群,但面對禁令,需要更換GPU,這對于現有集群來說是不小的損耗?!霸跊]有銀聯(lián)的時代,店鋪里有10臺不同銀行的POS機,用戶用什么卡刷哪臺POS機都有限制。而異構算力集群就相當于銀聯(lián),把所有算力資源都統(tǒng)一起來,可以很好解決當下算力市場單卡單賣成本高、不便捷的缺陷。”彭璐表示。
自主創(chuàng)新是永恒不變的話題。異構算力集群,將會是明年國內運營商發(fā)力的重點方向之一。
運營商被寄予厚望,芯片廠商的壓力自然不小。目前包括華為、寒武紀、海光等國內芯片廠商被業(yè)界看好,尤以華為昇騰為代表,被業(yè)界視為將在未來5年引領國產芯片邁入國際市場的領軍先鋒。
“屆時,就是國力之爭。國際市場如何選擇就要看政策和價格導向。但中國算力仍有獨特的優(yōu)勢,相信勢必會引起未來國際市場的震蕩”。呂天文表示。
