拒絕英偉達壟斷，八大科技巨頭組團推出UALink

2024-06-06 來源：Ai芯天下

2089

關(guān)鍵詞： AMD 英特爾人工智能

undefined

英偉達的NVLink讓廠商們心生不安

作為英偉達的核心技術(shù)，NVLink在GPU網(wǎng)絡(luò)通信系統(tǒng)中占據(jù)重要地位，其對于提升數(shù)據(jù)傳輸效率和處理性能具有顯著作用。

NVLink技術(shù)實現(xiàn)了GPU與支持該技術(shù)的CPU之間以及多個GPU之間的高帶寬直接連接，從而大幅提升了整體性能。

然而，值得注意的是，NVLink技術(shù)并未向行業(yè)開放，這在一定程度上影響了其他廠商在相關(guān)領(lǐng)域的競爭力。

盡管英偉達的AI系統(tǒng)在市場上表現(xiàn)出色，但人們往往忽視了其背后的眾多關(guān)鍵技術(shù)。

實際上，英偉達不僅擁有出色的GPU和軟件，還在跨多個GPU和系統(tǒng)橫向擴展工作負載方面擁有豐富的技術(shù)積累。

這些技術(shù)包括芯片上和封裝上互連、用于服務(wù)器或pod中GPU到GPU通信的NVLink、用于超pod擴展的Infiniband以及連接到更龐大基礎(chǔ)設(shè)施的以太網(wǎng)等。

undefined

IBM指出，NVLink技術(shù)使得CPU與GPU之間能夠?qū)崿F(xiàn)快速數(shù)據(jù)交換，從而提升了整個計算系統(tǒng)的數(shù)據(jù)吞吐量，有效克服了加速計算領(lǐng)域的一大瓶頸。

隨著英偉達GPU芯片的更新迭代，NVLink技術(shù)也在不斷進化。

從2017年的NVLink 2.0到2020年的NVLink 3.0，再到2022年的NVLink 4.0，每一次更新都帶來了更高的性能和更廣泛的應(yīng)用場景。

在2024年的GTC大會上，英偉達推出了全新的NVLink 5.0技術(shù)，并與最新一代Blackwell芯片一同亮相。

這一技術(shù)極大地提升了大型多GPU系統(tǒng)的可擴展性，單個Blackwell Tensor Core GPU支持多達18個NVLink 100GB/s連接，總帶寬達到1.8TB/s，較上一代產(chǎn)品提升了兩倍之多。

此外，NVLink 5.0技術(shù)還支持跨節(jié)點擴展，通過NVLink Switch實現(xiàn)無縫、高帶寬、多節(jié)點GPU集群的構(gòu)建，從而滿足數(shù)據(jù)中心級別的大型GPU需求。

利用NVLink技術(shù)，多服務(wù)器集群能夠平衡GPU通信與增加的計算量，從而實現(xiàn)了更高的性能和效率。

例如，在GB200 NVL72等服務(wù)器平臺上，NVLink技術(shù)的應(yīng)用使得這些平臺能夠支持更為復(fù)雜的大型模型，并提供了更高的可擴展性。

這些優(yōu)勢使得英偉達在GPU網(wǎng)絡(luò)通信領(lǐng)域繼續(xù)保持領(lǐng)先地位，并為其在AI、數(shù)據(jù)中心等領(lǐng)域的廣泛應(yīng)用提供了有力支持。

undefined

八大科技巨頭組團推出UALink

近日，包括谷歌、Meta、微軟、AMD、英特爾、博通、思科、惠普在內(nèi)的科技巨頭聯(lián)合宣布成立Ultra Accelerator Link（UALink）聯(lián)盟，致力于開發(fā)人工智能數(shù)據(jù)中心GPU網(wǎng)絡(luò)通信系統(tǒng)的全新行業(yè)開放標準。

此舉旨在打破英偉達在市場上的壟斷地位，推動行業(yè)內(nèi)的競爭與創(chuàng)新。

UALink倡議由AMD牽頭提出，得到了英特爾、博通等公司的積極響應(yīng)與支持。

作為倡導(dǎo)組織的成員，思科、谷歌、惠普、Meta和微軟等公司亦表示大力支持。

該倡議致力于構(gòu)建一種內(nèi)存語義結(jié)構(gòu)，在首個版本規(guī)范中便支持擴展至1024個端點，以適應(yīng)不同規(guī)模的AI計算需求。

UALink聯(lián)盟計劃推出的首個UALink 1.0版本將實現(xiàn)AMD的Instinct GPU和英特爾的Gaudi等專用處理器之間的直接數(shù)據(jù)傳輸，從而顯著提升AI計算的性能與效率。

UALink的高速I/O通信設(shè)計與協(xié)議展現(xiàn)出強大的技術(shù)實力，彰顯了聯(lián)盟成員挑戰(zhàn)市場領(lǐng)導(dǎo)者的決心。

UALink專家組將負責制定管理數(shù)據(jù)中心中不同GPU之間連接的標準，并預(yù)計于2024年第三季度向聯(lián)盟成員提供這些標準。

此舉將為其他廠商提供更多參與市場競爭的機會，進一步推動行業(yè)的創(chuàng)新與發(fā)展。

undefined

去年，Ultra Ethernet技術(shù)的出現(xiàn)為行業(yè)帶來了增強型以太網(wǎng)作為Infiniband的替代方案。

今年，UALink的推出更是劍指NVLink，旨在打破其市場壟斷地位。

UALink的推出為業(yè)界其他公司提供了追趕英偉達步伐的契機。

隨著AI計算需求的不斷增長，擁有一個穩(wěn)健、低延遲且可高效擴展的網(wǎng)絡(luò)對于提升計算性能至關(guān)重要。

UALink及行業(yè)規(guī)范的制定將有助于為AI工作負載創(chuàng)建開放的高性能環(huán)境，推動行業(yè)的持續(xù)進步。

UALink工作組將致力于制定規(guī)范，以界定AI計算容器組中加速器與交換機之間進行縱向擴展通信所需的高速低延遲互連。

通過標準化接口和實現(xiàn)方式，UALink將為新一代AI數(shù)據(jù)中心提供更加高效、靈活的AI和機器學習、高性能計算以及云應(yīng)用程序解決方案。

undefined

微軟、谷歌以及Meta等或是最大受益者

對于AMD和英特爾等業(yè)界巨頭，UALink的推出為它們提供了一條復(fù)制NVLink和NVSwitch功能的路徑，并促進了與其他企業(yè)的合作與成果共享。

博通等公司在UALink的助力下，可生產(chǎn)UALink交換機，有效推動其他公司的規(guī)模擴張。

AMD數(shù)據(jù)中心總經(jīng)理Forrest Norrod明確指出，行業(yè)亟需開放標準以推動持續(xù)發(fā)展，并鼓勵多家公司共同參與價值創(chuàng)造。首批UALink產(chǎn)品預(yù)計將在未來幾年內(nèi)陸續(xù)問世。

博通數(shù)據(jù)中心副總裁Jas Tremblay表示，作為UALink聯(lián)盟的創(chuàng)始成員，博通一直致力于將AI技術(shù)融入數(shù)據(jù)中心領(lǐng)域，并支持開放生態(tài)系統(tǒng)協(xié)作，這對于實現(xiàn)網(wǎng)絡(luò)擴展至關(guān)重要。

思科通用硬件集團執(zhí)行副總裁Martin Lund亦強調(diào)，隨著AI工作負載的不斷增長，高性能互連技術(shù)的重要性日益凸顯。

思科將積極參與UALink的開發(fā)，共同打造可擴展且開放的解決方案，以應(yīng)對構(gòu)建AI超級計算機所面臨的挑戰(zhàn)。

undefined