拒絕英偉達壟斷,八大科技巨頭組團推出UALink
英偉達的NVLink讓廠商們心生不安
作為英偉達的核心技術,NVLink在GPU網(wǎng)絡通信系統(tǒng)中占據(jù)重要地位,其對于提升數(shù)據(jù)傳輸效率和處理性能具有顯著作用。
NVLink技術實現(xiàn)了GPU與支持該技術的CPU之間以及多個GPU之間的高帶寬直接連接,從而大幅提升了整體性能。
然而,值得注意的是,NVLink技術并未向行業(yè)開放,這在一定程度上影響了其他廠商在相關領域的競爭力。
盡管英偉達的AI系統(tǒng)在市場上表現(xiàn)出色,但人們往往忽視了其背后的眾多關鍵技術。
實際上,英偉達不僅擁有出色的GPU和軟件,還在跨多個GPU和系統(tǒng)橫向擴展工作負載方面擁有豐富的技術積累。
這些技術包括芯片上和封裝上互連、用于服務器或pod中GPU到GPU通信的NVLink、用于超pod擴展的Infiniband以及連接到更龐大基礎設施的以太網(wǎng)等。
IBM指出,NVLink技術使得CPU與GPU之間能夠?qū)崿F(xiàn)快速數(shù)據(jù)交換,從而提升了整個計算系統(tǒng)的數(shù)據(jù)吞吐量,有效克服了加速計算領域的一大瓶頸。
隨著英偉達GPU芯片的更新迭代,NVLink技術也在不斷進化。
從2017年的NVLink 2.0到2020年的NVLink 3.0,再到2022年的NVLink 4.0,每一次更新都帶來了更高的性能和更廣泛的應用場景。
在2024年的GTC大會上,英偉達推出了全新的NVLink 5.0技術,并與最新一代Blackwell芯片一同亮相。
這一技術極大地提升了大型多GPU系統(tǒng)的可擴展性,單個Blackwell Tensor Core GPU支持多達18個NVLink 100GB/s連接,總帶寬達到1.8TB/s,較上一代產(chǎn)品提升了兩倍之多。
此外,NVLink 5.0技術還支持跨節(jié)點擴展,通過NVLink Switch實現(xiàn)無縫、高帶寬、多節(jié)點GPU集群的構建,從而滿足數(shù)據(jù)中心級別的大型GPU需求。
利用NVLink技術,多服務器集群能夠平衡GPU通信與增加的計算量,從而實現(xiàn)了更高的性能和效率。
例如,在GB200 NVL72等服務器平臺上,NVLink技術的應用使得這些平臺能夠支持更為復雜的大型模型,并提供了更高的可擴展性。
這些優(yōu)勢使得英偉達在GPU網(wǎng)絡通信領域繼續(xù)保持領先地位,并為其在AI、數(shù)據(jù)中心等領域的廣泛應用提供了有力支持。
八大科技巨頭組團推出UALink
近日,包括谷歌、Meta、微軟、AMD、英特爾、博通、思科、惠普在內(nèi)的科技巨頭聯(lián)合宣布成立Ultra Accelerator Link(UALink)聯(lián)盟,致力于開發(fā)人工智能數(shù)據(jù)中心GPU網(wǎng)絡通信系統(tǒng)的全新行業(yè)開放標準。
此舉旨在打破英偉達在市場上的壟斷地位,推動行業(yè)內(nèi)的競爭與創(chuàng)新。
UALink倡議由AMD牽頭提出,得到了英特爾、博通等公司的積極響應與支持。
作為倡導組織的成員,思科、谷歌、惠普、Meta和微軟等公司亦表示大力支持。
該倡議致力于構建一種內(nèi)存語義結構,在首個版本規(guī)范中便支持擴展至1024個端點,以適應不同規(guī)模的AI計算需求。
UALink聯(lián)盟計劃推出的首個UALink 1.0版本將實現(xiàn)AMD的Instinct GPU和英特爾的Gaudi等專用處理器之間的直接數(shù)據(jù)傳輸,從而顯著提升AI計算的性能與效率。
UALink的高速I/O通信設計與協(xié)議展現(xiàn)出強大的技術實力,彰顯了聯(lián)盟成員挑戰(zhàn)市場領導者的決心。
UALink專家組將負責制定管理數(shù)據(jù)中心中不同GPU之間連接的標準,并預計于2024年第三季度向聯(lián)盟成員提供這些標準。
此舉將為其他廠商提供更多參與市場競爭的機會,進一步推動行業(yè)的創(chuàng)新與發(fā)展。
去年,Ultra Ethernet技術的出現(xiàn)為行業(yè)帶來了增強型以太網(wǎng)作為Infiniband的替代方案。
今年,UALink的推出更是劍指NVLink,旨在打破其市場壟斷地位。
UALink的推出為業(yè)界其他公司提供了追趕英偉達步伐的契機。
隨著AI計算需求的不斷增長,擁有一個穩(wěn)健、低延遲且可高效擴展的網(wǎng)絡對于提升計算性能至關重要。
UALink及行業(yè)規(guī)范的制定將有助于為AI工作負載創(chuàng)建開放的高性能環(huán)境,推動行業(yè)的持續(xù)進步。
UALink工作組將致力于制定規(guī)范,以界定AI計算容器組中加速器與交換機之間進行縱向擴展通信所需的高速低延遲互連。
通過標準化接口和實現(xiàn)方式,UALink將為新一代AI數(shù)據(jù)中心提供更加高效、靈活的AI和機器學習、高性能計算以及云應用程序解決方案。
微軟、谷歌以及Meta等或是最大受益者
對于AMD和英特爾等業(yè)界巨頭,UALink的推出為它們提供了一條復制NVLink和NVSwitch功能的路徑,并促進了與其他企業(yè)的合作與成果共享。
博通等公司在UALink的助力下,可生產(chǎn)UALink交換機,有效推動其他公司的規(guī)模擴張。
AMD數(shù)據(jù)中心總經(jīng)理Forrest Norrod明確指出,行業(yè)亟需開放標準以推動持續(xù)發(fā)展,并鼓勵多家公司共同參與價值創(chuàng)造。首批UALink產(chǎn)品預計將在未來幾年內(nèi)陸續(xù)問世。
博通數(shù)據(jù)中心副總裁Jas Tremblay表示,作為UALink聯(lián)盟的創(chuàng)始成員,博通一直致力于將AI技術融入數(shù)據(jù)中心領域,并支持開放生態(tài)系統(tǒng)協(xié)作,這對于實現(xiàn)網(wǎng)絡擴展至關重要。
思科通用硬件集團執(zhí)行副總裁Martin Lund亦強調(diào),隨著AI工作負載的不斷增長,高性能互連技術的重要性日益凸顯。
思科將積極參與UALink的開發(fā),共同打造可擴展且開放的解決方案,以應對構建AI超級計算機所面臨的挑戰(zhàn)。
UALink的最大潛在受益者可能包括微軟、谷歌和Meta等科技巨頭。
這些公司已投入數(shù)十億美元購買英偉達GPU以支持云服務和AI模型訓練,并期望通過UALink降低對主導供應商的依賴。
目前,谷歌已擁有TPU和Axion定制芯片,亞馬遜推出了多個AI芯片系列,微軟推出了Maia和Cobalt芯片,而Meta也在不斷完善其加速器陣容。
微軟與OpenAI計劃投入1000億美元建造超級計算機,并將采用Cobalt和Maia芯片。UALink將成為連接這些高性能芯片的關鍵技術。
對于AMD和英特爾等公司而言,UALink不僅提供了一條復制NVLink和NVSwitch功能的途徑,還促進了與其他企業(yè)的合作與成果共享。
英特爾今年的AI加速器銷售額已達到數(shù)億美元,盡管銷量相對較小,但UALink有望助力其擴大市場份額。
AMD今年也將銷售數(shù)十億美元的MI300X產(chǎn)品,盡管與英偉達在AI領域的規(guī)模相比仍有差距,但UALink的推出將為其帶來新的發(fā)展機遇。
此外,UALink的推廣和應用還將為博通等公司創(chuàng)造新的商機。
這些公司可利用UALink技術生產(chǎn)UALink交換機,協(xié)助其他公司擴大規(guī)模,并在多家公司的加速器產(chǎn)品上廣泛應用這些交換機,共同推動行業(yè)的發(fā)展和進步。
結尾:
值得一提的是,UALink聯(lián)盟并未將英偉達排除在合作范圍之外,然而,鑒于英偉達的商業(yè)利益主要聚焦于推廣和維護其專有技術生態(tài)系統(tǒng),預計其不會主動加入UALink聯(lián)盟。
顯而易見,UALink將對英偉達的市場優(yōu)勢造成一定削弱。
不過,從現(xiàn)實角度來看,要在短時間內(nèi)取代英偉達的地位并不切實際。
據(jù)相關消息透露,首批UALink產(chǎn)品預計將在[幾年]后推向市場。
然而,盡管面臨諸多挑戰(zhàn),UALink聯(lián)盟仍堅定地認為這一步是必須邁出的。
畢竟,沒有任何人愿意看到某一領域長期被壟斷性企業(yè)所主導。
