沒有計(jì)算力一切都白談！英偉達(dá)正在“通吃”AI軟件和硬件市場(chǎng)

2023-03-23 來源：網(wǎng)絡(luò)整理

1204

在人工智能領(lǐng)域，英偉達(dá)正展現(xiàn)出更龐大的布局。

高性能GPU 79%的市占率，讓市場(chǎng)對(duì)英偉達(dá)的記憶停留在最強(qiáng)大的GPU供應(yīng)商上，忽略了它強(qiáng)大的軟件能力和布局。

當(dāng)全世界都在為算力焦慮時(shí)，英偉達(dá)在GTC大會(huì)上給出了解決方案。

英偉達(dá)CEO黃仁勛推出了算力平臺(tái)DGX Cloud，基于這個(gè)云平臺(tái)，用戶可以通過網(wǎng)頁瀏覽器直接調(diào)用算力，就像點(diǎn)開百度搜索界面一樣方便。而DGX超級(jí)計(jì)算機(jī)則是Open AI采用的算力引擎。這項(xiàng)云服務(wù)目前已經(jīng)和甲骨文達(dá)成合作，微軟AWS也即將加入托管。黃仁勛表示，未來中國(guó)也可以采用這項(xiàng)服務(wù)，中國(guó)創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù)。

解決了算力問題，黃仁勛又給出了模型的解決方案。

面向那些沒有大模型研發(fā)能力，又需要行業(yè)專屬模型的公司，英偉達(dá)推出了NVIDIA AI Foundations，內(nèi)置了語言模型NEMO、視覺模型PICASSO和生物學(xué)模型BIONEMO三種模型，企業(yè)可以將行業(yè)算法加入其中，生成專屬于自己的大模型。在硬件上，英偉達(dá)新推出了適合大模型需求的雙 GPU產(chǎn)品 H100 NVL，希望更進(jìn)一步為客戶提供算力服務(wù)。

AI技術(shù)是智慧未來的基礎(chǔ)

隨著大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)不斷發(fā)展，AI技術(shù)逐漸成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。正如近些年大熱的元宇宙、前不久的熱搜“?？汀盋hatGPT，火熱的背后都離不開AI技術(shù)的支撐。

數(shù)字時(shí)代下，AI技術(shù)具備著廣闊的應(yīng)用前景，在醫(yī)療、教育、金融、農(nóng)業(yè)、通信等諸多領(lǐng)域都發(fā)揮著不可替代的作用。以AI技術(shù)賦能智能家居為例，AI技術(shù)可以幫助智能家居系統(tǒng)更好地實(shí)現(xiàn)自動(dòng)化控制，從而讓家庭成員更加便捷、舒適地生活；再看AI技術(shù)加持下的智能工廠，AI貫穿智能設(shè)計(jì)、智能產(chǎn)品、智能生產(chǎn)、智能決策等制造全流程，降本增效，讓工廠煥發(fā)新生……

可見，AI技術(shù)是智慧未來的基礎(chǔ)，只有抓住了AI技術(shù)，才能使科技更好地賦能千行百業(yè)。

AI發(fā)展需“軟件”，更需“硬件”。

AI大模型的訓(xùn)練，算力支撐不可或缺。據(jù)《經(jīng)濟(jì)日?qǐng)?bào)》報(bào)道，自2016年以來，我國(guó)人工智能產(chǎn)業(yè)規(guī)模呈現(xiàn)迅猛增長(zhǎng)態(tài)勢(shì)，但2019年我國(guó)智能投融資出現(xiàn)大幅度下跌。而造成這個(gè)現(xiàn)象的主要原因是缺乏支撐人工智能產(chǎn)業(yè)快速發(fā)展的技術(shù)突破。因此，如何讓軟硬件供需平衡是當(dāng)下棘手的課題。

提供算力云平臺(tái)，讓高性能算力不再稀缺

算力是當(dāng)下最搶手的資源。

除了少數(shù)云服務(wù)廠商和巨頭，大模型企業(yè)很少有自建設(shè)算力中心的能力。大模型具有改變各行各業(yè)的能力，自GPT 3.5以來，谷歌、百度等公司紛紛推出大模型產(chǎn)品，摩肩接踵的發(fā)布會(huì)日期宣示著，大模型混戰(zhàn)已然開始。作為Open AI背后的算力支柱，也是目前市面上性能最高、性價(jià)比最強(qiáng)的已量產(chǎn)產(chǎn)品，A100成為市面上最搶手的芯片。

一時(shí)之間，擁有A100芯片的數(shù)量，成為行業(yè)判斷企業(yè)大模型能力的重要指標(biāo)。

一位行業(yè)人士告訴36氪，國(guó)內(nèi)某大模型公司拿到新一輪融資后，就趕緊通過私人渠道買了500塊A100芯片。

面對(duì)如此緊缺的算力需求，英偉達(dá)推出了一項(xiàng)新的AI超級(jí)計(jì)算服務(wù)——DGX Cloud云服務(wù)。

DGX Cloud背后是DGX（AI超級(jí)計(jì)算機(jī)）的算力能力，通過這個(gè)平臺(tái)，企業(yè)無需購(gòu)買硬件，可以通過網(wǎng)頁瀏覽的方式獲取高性能算力，擴(kuò)展多節(jié)點(diǎn)的AI訓(xùn)練。DGX配有8個(gè)H100 GPU或A100 80GB Tensor Core GPU，每個(gè)節(jié)點(diǎn)共有640GB GPU內(nèi)存。這8個(gè)模組具有很好的通信能力，能更好地傳輸數(shù)據(jù)。它配有Transformer引擎，可以處理類似ChatGPT的大模型。

此外，DGX還提供了NVIDIA AI Enterprise 套件，帶有AI 解決方案工作流程，可以幫助企業(yè)優(yōu)化框架設(shè)計(jì)和預(yù)訓(xùn)練模型，提高工程師的生產(chǎn)效率。

企業(yè)可以通過月租的方式獲取算力，每月租金36999美元?？梢哉f，DGX Cloud云平臺(tái)降低了用戶使用算力的門檻。在部署方式上，DGX支持公有云、私有云和混合云的部署方式。在混合版本，客戶在使用自己私有云算力的同時(shí)，接入DGX Cloud龐大的算力資源能力。英偉達(dá)的DGX官網(wǎng)界面已對(duì)外開放。

黃仁勛表示， NVIDIA DGX H100 AI超級(jí)計(jì)算機(jī)已全部全面投入生產(chǎn)，很快將面向全球企業(yè)。

目前，英偉達(dá)已經(jīng)和微軟Azure、谷歌云和Oracle OCI合作，向用戶提供算力能力，使用戶能通過瀏覽器就擁有英偉達(dá)DGXAI超級(jí)計(jì)算機(jī)的能力。

ChatGPT專用芯片性能再升級(jí)

在硬件領(lǐng)域，英偉達(dá)也推出了新的產(chǎn)品。

黃仁勛隆重推出了一種新的雙 GPU產(chǎn)品 H100 NVL。它加載了Transformer引擎，很適合ChatGPT 等大型 LLM。

常規(guī)顯卡的數(shù)據(jù)已經(jīng)無法支撐大模型的數(shù)據(jù)量需求，H100 NVL單卡顯存容量為94GB，最高可提供188GB HBM3 顯存。

與HGX A100相比，搭載四對(duì)H100和雙NVLINK后，服務(wù)器的處理速度可以快10倍，且大模型的處理成本降低一個(gè)數(shù)量級(jí)。

此外，面向視頻信息，英偉達(dá)推出了用于 AI 視頻的 NVIDIA L40，能提供比 CPU 高 120 倍的 AI 視頻性能，能夠用于視頻解碼和轉(zhuǎn)碼功能、視頻流、增強(qiáng)現(xiàn)實(shí)、生成 AI 視頻等場(chǎng)景。

快手和Google Cloud 是L4的早期用戶。

在圖像生成上，英偉達(dá)推出L40，針對(duì)圖形和支持 AI 的 2D、視頻和 3D 圖像生成進(jìn)行了優(yōu)化。L40 是英偉達(dá)元宇宙Omniverse的引擎，可以用來構(gòu)建數(shù)據(jù)中心和運(yùn)行元宇宙的程序。

在圖形推薦上，英偉達(dá)推出了Grace Hopper for Recommendation Models，主要用于圖形推薦模型、矢量數(shù)據(jù)庫和圖形神經(jīng)網(wǎng)絡(luò)。它將CPU 和 GPU做了一個(gè)連接，屬于超級(jí)芯片范疇，且兩類芯片之間的傳輸速度可以達(dá)到900 GB/s。

臺(tái)積電看好HPC前景

晶圓代工龍頭臺(tái)積電參加外資投資論壇時(shí)指出，美國(guó)芯片法案（CHIPS Act）對(duì)分享超額利潤(rùn)等要求不會(huì)影響臺(tái)積電的海外投資，重申五年之后海外產(chǎn)能將占28納米及更先進(jìn)制程20％目標(biāo)不變。臺(tái)積電亦看好ChatGPT等生成式人工智能（AI）應(yīng)用將帶動(dòng)高效能運(yùn)算（HPC）結(jié)構(gòu)性需求成長(zhǎng)，臺(tái)積電在先進(jìn)制程及先進(jìn)封裝領(lǐng)先同行業(yè)將明顯受惠。

同時(shí)，臺(tái)積電預(yù)期在產(chǎn)能擴(kuò)充及技術(shù)推進(jìn)下，加上5G及HPC大趨勢(shì)不變，預(yù)期未來幾年的合并營(yíng)收年復(fù)合成長(zhǎng)率（CAGR）達(dá)15％～20％目標(biāo)可望達(dá)成，長(zhǎng)期毛利率可達(dá)53％以上，持續(xù)性且健全的股東權(quán)益報(bào)酬率（ROE）會(huì)優(yōu)于25％并為股東帶來盈利增長(zhǎng)。

臺(tái)積電參加外資投資論壇，市場(chǎng)聚焦在海外投資、生成式AI、去庫存化等議題。在海外投資部分，美國(guó)芯片法案提供390億美元的半導(dǎo)體制造補(bǔ)助方案申請(qǐng)，但要求企業(yè)分享超額利潤(rùn)且不能把資金用于發(fā)放股利或買回庫藏股。

臺(tái)積電表示，拓展全球制造足跡是依照客戶需求，雖然起始成本較高，但有能力吸收海外晶圓廠較高的成本，預(yù)期五年后海外產(chǎn)能將占28納米及更先進(jìn)制程20％以上。

有關(guān)近期當(dāng)紅的ChatGPT等生成式AI應(yīng)用，臺(tái)積電認(rèn)為會(huì)帶動(dòng)HPC相關(guān)芯片的結(jié)構(gòu)性需求成長(zhǎng)，因?yàn)镠PC處理器需要采用先進(jìn)制程及先進(jìn)封裝，臺(tái)積電在這兩大領(lǐng)域具有領(lǐng)先地位，客戶群體包括IC設(shè)計(jì)廠、系統(tǒng)廠、大型資料中心業(yè)者等，所以可望受惠于生成式AI市場(chǎng)的成長(zhǎng)，未來將帶來更多繪圖處理器（GPU）、可程序邏輯閘陣列（FPGA）、特殊應(yīng)用芯片（ASIC）等晶圓代工需求。