英偉達(dá)首度將華為認(rèn)定為“最大競(jìng)爭(zhēng)對(duì)手”,原因?yàn)楹危?/h1>
近日,英偉達(dá)在向美國(guó)證券交易委員會(huì)提交的文件中,首次將華為認(rèn)定為人工智能芯片等多個(gè)主要類別的最大競(jìng)爭(zhēng)對(duì)手。在大多數(shù)人的印象中,英偉達(dá)以GPU起家,而華為長(zhǎng)于通信,二者交集并不多。但到了人工智能時(shí)代,雙方卻在暗自較勁。
1、英偉達(dá)將華為視作最大競(jìng)爭(zhēng)對(duì)手,主要有兩點(diǎn)原因
首先,驅(qū)動(dòng)AI技術(shù)的先進(jìn)制程芯片的全球格局正發(fā)生變化。
據(jù)報(bào)道,英偉達(dá)在報(bào)告中表示,華為公司在其五個(gè)主要業(yè)務(wù)類別中的四個(gè)方面都是競(jìng)爭(zhēng)對(duì)手。英偉達(dá)指出,華為在供應(yīng)GPU、CPU等用于AI的芯片領(lǐng)域,都可與之競(jìng)爭(zhēng)。
該公司還將華為定位為一家云服務(wù)公司——可以設(shè)計(jì)自己的硬件和軟件以改進(jìn)人工智能計(jì)算。
英偉達(dá)表示:“我們的一些競(jìng)爭(zhēng)對(duì)手可能比我們擁有更多的營(yíng)銷、財(cái)務(wù)、分銷和制造資源,并且可能更能夠適應(yīng)客戶或技術(shù)變化。”
其次,受到美國(guó)一系列AI芯片出口限制措施的影響,英偉達(dá)無法將先進(jìn)芯片出口到中國(guó),而華為的產(chǎn)品是其絕佳替代品。
分析師指出,華為的昇騰系列AI芯片,特別是去年推出的昇騰910B,被視為英偉達(dá)三年前推出的A100芯片在中國(guó)市場(chǎng)的替代品。
此前,百度、騰訊、阿里巴巴等過去長(zhǎng)期是英偉達(dá)的重要客戶,但在美國(guó)不斷加大對(duì)華出口管制的情況下,中國(guó)公司已開始擺脫對(duì)美國(guó)技術(shù)的依賴。去年,百度就曾訂購(gòu)了1600顆華為910B芯片。
2、比英偉達(dá)快10倍的AI芯片問世
目前,AI芯片市場(chǎng)主要是由英偉達(dá)主導(dǎo),H100也公認(rèn)是訓(xùn)練大語(yǔ)言模型最需要的GPU。在AI大發(fā)展的背景下,英偉達(dá)業(yè)績(jī)股價(jià)雙雙暴漲。華爾街預(yù)計(jì)英偉達(dá)第四財(cái)季營(yíng)收超過200億美元,是上年同期60.5億美元的3倍多,其業(yè)績(jī)也將于北京時(shí)間2月22日公布。股價(jià)方面,在去年大漲239%的情況下,今年英偉達(dá)股價(jià)再度暴漲超40%,最新市值超1.7萬億美元,一度超過谷歌、亞馬遜成為美股第三大公司。
看好AI市場(chǎng)的廣闊空間,微軟、谷歌、AMD、英特爾等巨頭也紛紛發(fā)力AI芯片業(yè)務(wù)。據(jù)報(bào)道,科技巨頭微軟公司正在開發(fā)一種新的網(wǎng)卡,用來提高其人工智能芯片Maia的性能,最終達(dá)到減少對(duì)英偉達(dá)產(chǎn)品依賴的目的。另外,去年底作為英偉達(dá)最強(qiáng)挑戰(zhàn)者的AMD,則發(fā)布了“最強(qiáng)算力”Instinct MI300X。
初創(chuàng)公司Groq近期的消息更是吸足了眼球。該公司是一家由谷歌TPU團(tuán)隊(duì) 的成立的初創(chuàng)公司,這些人推出了一種新型的自研芯片——LPU(Language Processing Unit),這個(gè)LPU用于大模型推理加速。其芯片推理速度較英偉達(dá)GPU提高10倍、成本只有其1/10;運(yùn)行的大模型生成速度接近每秒500 tokens,碾壓ChatGPT-3.5大約40 tokens/秒的速度。
3、背后真相揭秘
根據(jù)推特上與Groq關(guān)系密切的投資人k_zeroS分享,LPU的工作原理與GPU截然不同。它采用了時(shí)序指令集計(jì)算機(jī)(Temporal Instruction Set Computer)架構(gòu),這意味著它無需像使用高帶寬存儲(chǔ)器(HBM)的GPU那樣頻繁地從內(nèi)存中加載數(shù)據(jù)。這一特點(diǎn)不僅有助于避免HBM短缺的問題,還能有效降低成本。不同于Nvidia GPU需要依賴高速數(shù)據(jù)傳輸,Groq的LPU在其系統(tǒng)中沒有采用高帶寬存儲(chǔ)器(HBM)。它使用的是SRAM,其速度比GPU所用的存儲(chǔ)器快約20倍。
不過真相可能并不簡(jiǎn)單。業(yè)內(nèi)大佬賈揚(yáng)清算了一筆賬,因?yàn)镚roq小得可憐的內(nèi)存容量(230MB),在運(yùn)行Llama-2 70b模型時(shí),需要305張Groq卡才足夠,而用H100則只需要8張卡。從目前的價(jià)格來看,這意味著在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。
然而這并不影響A股市場(chǎng)對(duì)SRAM概念股的追捧。北京君正在短短1個(gè)小時(shí)內(nèi)由綠盤拉升至20cm漲停,西測(cè)測(cè)試在不到10分鐘時(shí)間拉升14%水平。今天早盤部分概念股繼續(xù)沖高,西測(cè)測(cè)試一度大漲超16%,北京君正一度漲超8%。
業(yè)內(nèi)人士指出,上述概念股的漲幅較大,一方面確實(shí)有SRAM概念助攻,另一方面作為核心題材的存儲(chǔ)器本身也受益于AI時(shí)代大發(fā)展。與此同時(shí),存儲(chǔ)復(fù)蘇也利好整個(gè)板塊。國(guó)投證券研報(bào)顯示,主流市場(chǎng)的存儲(chǔ)廠商自2023年三季度以來迎來業(yè)績(jī)拐點(diǎn),受益于AI服務(wù)器需求激增,高帶寬存儲(chǔ)芯片HBM 受到熱捧,成為存儲(chǔ)芯片行業(yè)發(fā)展的重要增量。據(jù)TrendForce 預(yù)計(jì),今年一季度 DRAM 合約價(jià)季漲幅約13%至18%,NAND Flash為18%至23%,全年維持上漲趨勢(shì),到2024年底,DRAM和NAND Flash 的價(jià)格將上漲約60%。
一些公司的業(yè)績(jī)也有望暴增。根據(jù)機(jī)構(gòu)一致預(yù)測(cè),朗科科技、德明利、恒爍股份等3股機(jī)構(gòu)一致預(yù)測(cè)今年凈利增速均超18倍,普冉股份、瀾起科技、江波龍、聚辰股份等個(gè)股機(jī)構(gòu)一致預(yù)測(cè)今年凈利增速均超100%。與業(yè)績(jī)不相符的是,大部分個(gè)股股價(jià)表現(xiàn)不佳,佰維存儲(chǔ)、恒爍股份、大為股份、中電興發(fā)等個(gè)股年內(nèi)均跌超30%。
