央視“意外”曝光參數(shù):平頭哥PPU芯片超越英偉達(dá)A800
關(guān)鍵詞: 華為昇騰 壁仞科技 國產(chǎn)卡與NV卡重要參數(shù)對比 阿里平頭哥
在9月16日晚間,央視《新聞聯(lián)播》在報道“中國聯(lián)通三江源綠電智算中心項目建設(shè)成效”時,意外引發(fā)科技圈熱議——畫面背景中出現(xiàn)的一張“國產(chǎn)卡與NV卡重要參數(shù)對比”表格,首次高調(diào)展示了華為昇騰910B、壁仞科技104P等國產(chǎn)AI芯片在關(guān)鍵性能指標(biāo)上對國際巨頭英偉達(dá)的追趕與超越。
在李強總理甘肅、青海調(diào)研的新聞畫面中,“國產(chǎn)卡與NV卡重要參數(shù)對比”表格成為國產(chǎn)算力芯片技術(shù)實力的有力證明。其中,阿里平頭哥半導(dǎo)體有限公司推出的PPU(Parallel Processing Unit,并行處理器)芯片,憑借其卓越的性能參數(shù),成為這場技術(shù)展示中的焦點。
平頭哥PPU超越英偉達(dá)A800
據(jù)央視報道及后續(xù)多方信息證實,阿里平頭哥的PPU芯片在關(guān)鍵技術(shù)指標(biāo)上實現(xiàn)了對英偉達(dá)A800的超越。具體來看,平頭哥PPU采用了96GB HBM2e顯存,與英偉達(dá)H20的96GB HBM3容量持平(盡管H20采用更新一代的HBM3,技術(shù)領(lǐng)先),而英偉達(dá)A800的顯存容量為80GB。
在片間帶寬方面,PPU達(dá)到700GB/s,遠(yuǎn)超A800的400GB/s,接近H20的水平。部分報道甚至指出該數(shù)值為“900GB/s”,可能存在不同版本或測量標(biāo)準(zhǔn)差異,但普遍共識是PPU在互聯(lián)帶寬上實現(xiàn)了對A800的顯著超越。
此外,PPU還支持更先進(jìn)的PCIe 5.0接口,優(yōu)于A800的PCIe 4.0,與H20保持一致。功耗控制在400W,與A800相當(dāng),但在能效比上表現(xiàn)出色,明顯低于H20的550W。
簡單來說,顯存容量是算力卡的“數(shù)據(jù)倉庫”,越大越能同時處理復(fù)雜AI任務(wù);片間帶寬是數(shù)據(jù)傳輸?shù)摹案咚俾贰保綄扐I訓(xùn)練、推理速度越快;PCIe規(guī)格決定了算力卡與服務(wù)器的連接效率。
據(jù)《投資研究》公眾號“壹號講獅”援引云棲大會實測數(shù)據(jù),平頭哥PPU在Llama2-70B、GPT-3.5等主流大模型上的表現(xiàn)與英偉達(dá)H20互有勝負(fù):
批尺寸為1時,首token延遲為82ms,優(yōu)于H20的95ms;
批尺寸擴展至64時,PPU吞吐達(dá)2800 tokens/s,較H20提升約18%;
整機功耗僅350W,能效比領(lǐng)先30%以上。
更關(guān)鍵的是成本優(yōu)勢:得益于國內(nèi)7nm工藝與2.5D封裝,PPU單卡BOM成本較進(jìn)口H20下降40%,推動阿里云公有云推理實例價格下降50%。
三江源智算中心簽約,平頭哥獲最大算力訂單
此次新聞聯(lián)播報道的中國聯(lián)通三江源綠電智算中心項目,是國產(chǎn)AI芯片規(guī)?;涞氐闹匾咐?。其于2024年8月17日正式揭牌,總投資約27.7億元,旨在構(gòu)建集約化、規(guī)?;⒕G色化的智算綜合園區(qū),支撐“東數(shù)西算”戰(zhàn)略需求。2024年3月,項目啟動建設(shè)并分階段實施。二期投資8.8億元建設(shè)840架高功率服務(wù)器機柜,形成超10000P算力能力;三期于同年8月23日開工,規(guī)劃984架機柜,算力規(guī)模達(dá)12000P以上。四期計劃投資50億元,聯(lián)合頭部企業(yè)打造綠電直供及算網(wǎng)協(xié)同的智算園區(qū),目標(biāo)總算力超20000P。
據(jù)《信創(chuàng)頭條》報道,該項目已簽約的國產(chǎn)算力部分總計1747臺設(shè)備、22832張算力卡,總算力達(dá)3479P(PetaFLOPS)。其中:
阿里云簽約1024臺設(shè)備、16384張平頭哥算力卡,總算力1945P,為所有品牌中最大訂單;
中科院簽約512臺設(shè)備、4096張沐曦算力卡,算力984P;
北京京儀簽約83臺設(shè)備、1328張壁仞算力卡,算力450P;
中昊芯英簽約128臺設(shè)備,算力200P。
此外,擬簽約項目算力達(dá)2002P,涉及太初元碁、燧原科技、摩爾線程等品牌。
公開資料獲悉,平頭哥半導(dǎo)體有限公司于 2018 年 9 月宣布成立,是阿里巴巴集團的全資半導(dǎo)體芯片業(yè)務(wù)主體。平頭哥擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心芯片、IoT 芯片等,官方已列出的產(chǎn)品包括倚天 710、鎮(zhèn)岳 510、含光 800、羽陣 600、羽陣 611。
其中,含光 800 是平頭哥發(fā)布的首顆數(shù)據(jù)中心芯片,也是一顆高性能人工智能推理芯片,采用平頭哥自研架構(gòu),基于 12nm 工藝,集成 170 億晶體管,算力可達(dá) 820 TOPS。在業(yè)界標(biāo)準(zhǔn)的 ResNet-50 測試中,推理性能達(dá)到 78563 IPS,能效比達(dá) 500 IPS / W。
9月17日,截至發(fā)稿,阿里巴巴港股漲3.45%,報每股158.8港元,總市值重回3萬億港元。
未來展望
央視此次“意外”展示,標(biāo)志著國產(chǎn)算力芯片已從“可用”邁向“好用”,正在“撕裂英偉達(dá)鐵幕的一道關(guān)鍵裂縫”。平頭哥PPU在顯存、帶寬、能效等關(guān)鍵指標(biāo)上的突破,不僅打破了英偉達(dá)NVLink的互聯(lián)壟斷,也為國產(chǎn)大模型訓(xùn)練提供了更具性價比的替代方案。
盡管CUDA生態(tài)仍是巨大壁壘,但PPU通過軟硬協(xié)同、場景優(yōu)化和成本優(yōu)勢,正逐步構(gòu)建自己的護城河。全國各地的國有算力樞紐被要求在芯片采購中有超過50%來自國內(nèi)廠商,以支持本土半導(dǎo)體產(chǎn)業(yè)的發(fā)展。
之前據(jù)Bernstein最新報告指出,中國將在2025年投入910億美元用于AI相關(guān)資本支出。其中,380億美元將用于采購國產(chǎn)AI芯片,顯現(xiàn)出國家層面強烈的本土化替代趨勢。在2024年中國AI芯片市場中,Bernstein Research以銷售金額口徑統(tǒng)計,英偉達(dá)的市占率約為66%,華為海思約為23%,AMD約為5%,寒武紀(jì)、摩爾線程、沐曦股份約為1%。此次三江源項目的規(guī)模化簽約,也表明國產(chǎn)AI芯片已獲得國家級算力基礎(chǔ)設(shè)施的認(rèn)可。
此外,值得關(guān)注的是,國家市場監(jiān)督管理總局在9月15日宣布對英偉達(dá)公司實施進(jìn)一步調(diào)查,因其違反《中華人民共和國反壟斷法》。這一舉措無疑為國產(chǎn)算力芯片的發(fā)展提供了更為有利的市場環(huán)境。
