沒(méi)有計(jì)算力一切都白談!英偉達(dá)正在“通吃”AI軟件和硬件市場(chǎng)
高性能GPU 79%的市占率,讓市場(chǎng)對(duì)英偉達(dá)的記憶停留在最強(qiáng)大的GPU供應(yīng)商上,忽略了它強(qiáng)大的軟件能力和布局。
當(dāng)全世界都在為算力焦慮時(shí),英偉達(dá)在GTC大會(huì)上給出了解決方案。
英偉達(dá)CEO黃仁勛推出了算力平臺(tái)DGX Cloud,基于這個(gè)云平臺(tái),用戶(hù)可以通過(guò)網(wǎng)頁(yè)瀏覽器直接調(diào)用算力,就像點(diǎn)開(kāi)百度搜索界面一樣方便。而DGX超級(jí)計(jì)算機(jī)則是Open AI采用的算力引擎。這項(xiàng)云服務(wù)目前已經(jīng)和甲骨文達(dá)成合作,微軟AWS也即將加入托管。黃仁勛表示,未來(lái)中國(guó)也可以采用這項(xiàng)服務(wù),中國(guó)創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù)。
解決了算力問(wèn)題,黃仁勛又給出了模型的解決方案。
面向那些沒(méi)有大模型研發(fā)能力,又需要行業(yè)專(zhuān)屬模型的公司,英偉達(dá)推出了NVIDIA AI Foundations,內(nèi)置了語(yǔ)言模型NEMO、視覺(jué)模型PICASSO和生物學(xué)模型BIONEMO三種模型,企業(yè)可以將行業(yè)算法加入其中,生成專(zhuān)屬于自己的大模型。在硬件上,英偉達(dá)新推出了適合大模型需求的雙 GPU產(chǎn)品 H100 NVL,希望更進(jìn)一步為客戶(hù)提供算力服務(wù)。
AI技術(shù)是智慧未來(lái)的基礎(chǔ)
隨著大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)不斷發(fā)展,AI技術(shù)逐漸成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。正如近些年大熱的元宇宙、前不久的熱搜“常客”ChatGPT,火熱的背后都離不開(kāi)AI技術(shù)的支撐。
數(shù)字時(shí)代下,AI技術(shù)具備著廣闊的應(yīng)用前景,在醫(yī)療、教育、金融、農(nóng)業(yè)、通信等諸多領(lǐng)域都發(fā)揮著不可替代的作用。以AI技術(shù)賦能智能家居為例,AI技術(shù)可以幫助智能家居系統(tǒng)更好地實(shí)現(xiàn)自動(dòng)化控制,從而讓家庭成員更加便捷、舒適地生活;再看AI技術(shù)加持下的智能工廠,AI貫穿智能設(shè)計(jì)、智能產(chǎn)品、智能生產(chǎn)、智能決策等制造全流程,降本增效,讓工廠煥發(fā)新生……
可見(jiàn),AI技術(shù)是智慧未來(lái)的基礎(chǔ),只有抓住了AI技術(shù),才能使科技更好地賦能千行百業(yè)。
AI發(fā)展需“軟件”,更需“硬件”。
AI大模型的訓(xùn)練,算力支撐不可或缺。據(jù)《經(jīng)濟(jì)日?qǐng)?bào)》報(bào)道,自2016年以來(lái),我國(guó)人工智能產(chǎn)業(yè)規(guī)模呈現(xiàn)迅猛增長(zhǎng)態(tài)勢(shì),但2019年我國(guó)智能投融資出現(xiàn)大幅度下跌。而造成這個(gè)現(xiàn)象的主要原因是缺乏支撐人工智能產(chǎn)業(yè)快速發(fā)展的技術(shù)突破。因此,如何讓軟硬件供需平衡是當(dāng)下棘手的課題。
提供算力云平臺(tái),讓高性能算力不再稀缺
算力是當(dāng)下最搶手的資源。
除了少數(shù)云服務(wù)廠商和巨頭,大模型企業(yè)很少有自建設(shè)算力中心的能力。大模型具有改變各行各業(yè)的能力,自GPT 3.5以來(lái),谷歌、百度等公司紛紛推出大模型產(chǎn)品,摩肩接踵的發(fā)布會(huì)日期宣示著,大模型混戰(zhàn)已然開(kāi)始。作為Open AI背后的算力支柱,也是目前市面上性能最高、性?xún)r(jià)比最強(qiáng)的已量產(chǎn)產(chǎn)品,A100成為市面上最搶手的芯片。
一時(shí)之間,擁有A100芯片的數(shù)量,成為行業(yè)判斷企業(yè)大模型能力的重要指標(biāo)。
一位行業(yè)人士告訴36氪 ,國(guó)內(nèi)某大模型公司拿到新一輪融資后,就趕緊通過(guò)私人渠道買(mǎi)了500塊A100芯片。
面對(duì)如此緊缺的算力需求,英偉達(dá)推出了一項(xiàng)新的AI超級(jí)計(jì)算服務(wù)——DGX Cloud云服務(wù)。
DGX Cloud背后是DGX(AI超級(jí)計(jì)算機(jī))的算力能力,通過(guò)這個(gè)平臺(tái),企業(yè)無(wú)需購(gòu)買(mǎi)硬件,可以通過(guò)網(wǎng)頁(yè)瀏覽的方式獲取高性能算力,擴(kuò)展多節(jié)點(diǎn)的AI訓(xùn)練。DGX配有8個(gè)H100 GPU或A100 80GB Tensor Core GPU,每個(gè)節(jié)點(diǎn)共有640GB GPU內(nèi)存。這8個(gè)模組具有很好的通信能力,能更好地傳輸數(shù)據(jù)。它配有Transformer引擎,可以處理類(lèi)似ChatGPT的大模型。
此外,DGX還提供了NVIDIA AI Enterprise 套件,帶有AI 解決方案工作流程,可以幫助企業(yè)優(yōu)化框架設(shè)計(jì)和預(yù)訓(xùn)練模型,提高工程師的生產(chǎn)效率。
企業(yè)可以通過(guò)月租的方式獲取算力,每月租金36999美元??梢哉f(shuō),DGX Cloud云平臺(tái)降低了用戶(hù)使用算力的門(mén)檻。在部署方式上,DGX支持公有云、私有云和混合云的部署方式。在混合版本,客戶(hù)在使用自己私有云算力的同時(shí),接入DGX Cloud龐大的算力資源能力。英偉達(dá)的DGX官網(wǎng)界面已對(duì)外開(kāi)放。
黃仁勛表示, NVIDIA DGX H100 AI超級(jí)計(jì)算機(jī)已全部全面投入生產(chǎn),很快將面向全球企業(yè)。
目前,英偉達(dá)已經(jīng)和微軟Azure、谷歌云和Oracle OCI合作,向用戶(hù)提供算力能力,使用戶(hù)能通過(guò)瀏覽器就擁有英偉達(dá)DGXAI超級(jí)計(jì)算機(jī)的能力。
ChatGPT專(zhuān)用芯片性能再升級(jí)
在硬件領(lǐng)域,英偉達(dá)也推出了新的產(chǎn)品。
黃仁勛隆重推出了一種新的雙 GPU產(chǎn)品 H100 NVL。它加載了Transformer引擎,很適合ChatGPT 等大型 LLM。
常規(guī)顯卡的數(shù)據(jù)已經(jīng)無(wú)法支撐大模型的數(shù)據(jù)量需求,H100 NVL單卡顯存容量為94GB,最高可提供188GB HBM3 顯存。
與HGX A100相比,搭載四對(duì)H100和雙NVLINK后,服務(wù)器的處理速度可以快10倍,且大模型的處理成本降低一個(gè)數(shù)量級(jí)。
此外,面向視頻信息,英偉達(dá)推出了用于 AI 視頻的 NVIDIA L40,能提供比 CPU 高 120 倍的 AI 視頻性能,能夠用于視頻解碼和轉(zhuǎn)碼功能、視頻流、增強(qiáng)現(xiàn)實(shí)、生成 AI 視頻等場(chǎng)景。
快手和Google Cloud 是L4的早期用戶(hù)。
在圖像生成上,英偉達(dá)推出L40,針對(duì)圖形和支持 AI 的 2D、視頻和 3D 圖像生成進(jìn)行了優(yōu)化。L40 是英偉達(dá)元宇宙Omniverse的引擎,可以用來(lái)構(gòu)建數(shù)據(jù)中心和運(yùn)行元宇宙的程序。
在圖形推薦上,英偉達(dá)推出了Grace Hopper for Recommendation Models,主要用于圖形推薦模型、矢量數(shù)據(jù)庫(kù)和圖形神經(jīng)網(wǎng)絡(luò)。它將CPU 和 GPU做了一個(gè)連接,屬于超級(jí)芯片范疇,且兩類(lèi)芯片之間的傳輸速度可以達(dá)到900 GB/s。
臺(tái)積電看好HPC前景
晶圓代工龍頭臺(tái)積電參加外資投資論壇時(shí)指出,美國(guó)芯片法案(CHIPS Act)對(duì)分享超額利潤(rùn)等要求不會(huì)影響臺(tái)積電的海外投資,重申五年之后海外產(chǎn)能將占28納米及更先進(jìn)制程20%目標(biāo)不變。臺(tái)積電亦看好ChatGPT等生成式人工智能(AI)應(yīng)用將帶動(dòng)高效能運(yùn)算(HPC)結(jié)構(gòu)性需求成長(zhǎng),臺(tái)積電在先進(jìn)制程及先進(jìn)封裝領(lǐng)先同行業(yè)將明顯受惠。
同時(shí),臺(tái)積電預(yù)期在產(chǎn)能擴(kuò)充及技術(shù)推進(jìn)下,加上5G及HPC大趨勢(shì)不變,預(yù)期未來(lái)幾年的合并營(yíng)收年復(fù)合成長(zhǎng)率(CAGR)達(dá)15%~20%目標(biāo)可望達(dá)成,長(zhǎng)期毛利率可達(dá)53%以上,持續(xù)性且健全的股東權(quán)益報(bào)酬率(ROE)會(huì)優(yōu)于25%并為股東帶來(lái)盈利增長(zhǎng)。
臺(tái)積電參加外資投資論壇,市場(chǎng)聚焦在海外投資、生成式AI、去庫(kù)存化等議題。在海外投資部分,美國(guó)芯片法案提供390億美元的半導(dǎo)體制造補(bǔ)助方案申請(qǐng),但要求企業(yè)分享超額利潤(rùn)且不能把資金用于發(fā)放股利或買(mǎi)回庫(kù)藏股。
臺(tái)積電表示,拓展全球制造足跡是依照客戶(hù)需求,雖然起始成本較高,但有能力吸收海外晶圓廠較高的成本,預(yù)期五年后海外產(chǎn)能將占28納米及更先進(jìn)制程20%以上。
有關(guān)近期當(dāng)紅的ChatGPT等生成式AI應(yīng)用,臺(tái)積電認(rèn)為會(huì)帶動(dòng)HPC相關(guān)芯片的結(jié)構(gòu)性需求成長(zhǎng),因?yàn)镠PC處理器需要采用先進(jìn)制程及先進(jìn)封裝,臺(tái)積電在這兩大領(lǐng)域具有領(lǐng)先地位,客戶(hù)群體包括IC設(shè)計(jì)廠、系統(tǒng)廠、大型資料中心業(yè)者等,所以可望受惠于生成式AI市場(chǎng)的成長(zhǎng),未來(lái)將帶來(lái)更多繪圖處理器(GPU)、可程序邏輯閘陣列(FPGA)、特殊應(yīng)用芯片(ASIC)等晶圓代工需求。
