芯片巨頭的新戰(zhàn)場:算力突破新抓手,“東數(shù)西算”帶來新風口
Intel下一代旗艦級CPU Sapphire Rapids將會是Intel在CPU領域的一次重要新產(chǎn)品。該CPU將會使用Intel 7工藝,并且大規(guī)模使用了chiplet(芯片粒)技術,從而讓單個CPU中可以包含高達60個核心,從而讓Intel不至于在高級封裝驅動的下一代CPU競爭中落后AMD。
Sapphire Rapids早在幾年前就已經(jīng)宣布要開發(fā),而其正式出貨在多次推遲后,終于在最近幾個月有了更確定的消息。根據(jù)最近Intel發(fā)布的消息,Sapphire Rapids將在2023年正式出貨。而在9月底,Intel也在自家舉辦的活動Innovation Event上發(fā)布了基于Sapphire Rapids樣片的demo,這也讓Sapphire Rapids的一些重要特性讓外界有了更加詳細的認知。
在Sapphire Rapids的這些新特性中,除了chiplet這一個廣為人知的技術之外,最值得關注的就是使用了異構計算的架構,集成了許多為專門計算領域優(yōu)化的加速器(domain specific accelerator,DSA)。在過去的幾十年中,由于CPU性能借著摩爾定律的高速發(fā)展而飛速提升,大多數(shù)時候用戶會考慮只使用CPU來處理所有的算法,即使用一個通用架構來解決所有問題。然而,隨著摩爾定律的發(fā)展接近瓶頸,使用一個通用架構解決所有問題已經(jīng)不再現(xiàn)實,因為CPU性能的發(fā)展速度已經(jīng)跟不上應用的需求,因此異構計算的思路得到了越來越多的重視,即為了重要的應用專門設計相關的計算加速模塊,從而加速計算性能,同時也改善效率。
我們認為Intel在下一代CPU Sapphire Rapids中引入大量異構計算是一個里程碑式的事件,這是因為傳統(tǒng)上來說通用型CPU和異構計算是兩個芯片設計陣營,通用CPU設計的時候會嘗試改善性能從而說服用戶無需使用異構計算;而Intel這次在Sapphire Rapids中主動引入大量異構計算加速器,這也說明了異構計算確實已經(jīng)成為極其重要的主流設計方案,與其單獨設計CPU然后讓其他公司去設計相關的異構計算芯片搶走市場,還不如在自己的CPU中主動擁抱異構計算,集成相關的加速器,來確保滿足用戶的需求。
具體來看,這次Intel在Sapphire Rapids中集成的獨立加速器主要包括動態(tài)負載平衡模塊(DLB),數(shù)據(jù)流加速器(DSA),內(nèi)存內(nèi)分析加速器(IAA),以及快速協(xié)助模塊(QAT)。這些獨立的加速器是作為一個單獨模塊集成在CPU之外的。除了這些單獨加速模塊之外,Intel還在每個CPU核心中集成了用于矩陣計算加速的AMX模塊(Advanced Matrix Extensions)。
我們不妨來看一下這些加速模塊的具體功能。DLB的主要功能是加速不同服務器之間的負載均衡,從而保證服務器的大規(guī)模部署分布式計算。DSA主要用于加速CPU和存儲(NVMe以及TCP)之間的數(shù)據(jù)交換和數(shù)據(jù)轉換。IAA主要用于數(shù)據(jù)庫應用,可以加速數(shù)據(jù)庫相關應用中的數(shù)據(jù)壓縮和解壓。QAT主要用于網(wǎng)絡相關應用中的數(shù)據(jù)壓縮和加密運算。最后,AMX主要是用于人工智能相關的矩陣運算。
我們可以看到,這些加速器幾乎都是針對目前最火熱的大數(shù)據(jù)應用,主要目的都是改善這些大數(shù)據(jù)應用中的痛點。DSA,IAA和QAT針對的應用目前基本都是CPU是主要計算單元,但是由于在數(shù)據(jù)傳輸?shù)阮I域傳統(tǒng)CPU的效率不高,目前有不少公司試著在用專門的ASIC來取代CPU,因此Intel這次在Sapphire Rapids中引入這些加速器正是一個希望能保住這些市場中公司份額的舉動。AMX主要針對矩陣運算,目前雖然GPU是人工智能相關計算的主流計算單元,但是也有一些模型因為需要使用的一些算子GPU支持不夠好,仍然是在CPU上計算,而Intel的AMX正是針對這些模型的部署做加速。
異構計算:解決算力瓶頸的新希望
「異構計算」這個概念可以追溯到上世紀 80 年代年。而在 2006 年左右,芯片廠商就開始嘗試把不同的計算單元整合到一顆芯片上。AMD 把高性能 CPU、GPU 做到一顆芯片上的項目命名為「Fusion」(融聚);英偉達則推出了統(tǒng)一計算框架 CUDA 進入主流市場,讓 GPU 也能夠進行原來 CPU 擅長的通用計算。
CPU 作為通用計算芯片,擅長處理不同類型的數(shù)據(jù),做邏輯判斷;而 GPU 擅長做并行同類型計算,吞吐量大。AI 算法發(fā)展起來后,既需要密集的矢量運算,又需要復雜的邏輯計算,人們自熱會想到讓不同的計算模塊發(fā)揮所長,讓硬件為軟件的需求服務。除了 GPU+CPU 的計算平臺之外,F(xiàn)PGA(現(xiàn)場可編程邏輯門陣列)也隨之誕生。FPGA 的特點是能夠根據(jù)計算任務,自定義配置芯片硬件功能。
從發(fā)展過程可以看出,「異構計算」的特點是硬件作為算力資源,主動適配軟件需求。簡單而言,就是算力資源優(yōu)化。
異構計算瓶頸待突破
異構的優(yōu)勢顯而易見,與此同時暴露出的技術難題也越來越多。一是異構計算產(chǎn)品需要面對不同的系統(tǒng)架構、指令集和編程模型,需要降低多樣計算帶給軟件開發(fā)者的難度;二是異構計算芯片產(chǎn)品除了要在芯片設計層面實現(xiàn)突破之外,還需要解決在芯片制造和封裝過程中不同結構之間的適配和升級問題;三是異構計算要實現(xiàn)性能的多樣性合一,使其同時滿足人工智能訓練、推理、圖像視頻處理等各種不同的需求。
燧原科技創(chuàng)始人兼CEO趙立東在接受《中國電子報》記者采訪時表示,從產(chǎn)業(yè)規(guī)范與標準層面看,異構計算是指在完成一個計算任務時,采用一種以上的硬件計算單元、互聯(lián)協(xié)議、差異化架構、軟件接口等。由于不同的硬件設備、協(xié)議、應用二進制接口、軟件應用層接口等都存在著巨大的差異,如何構建一個高效、系統(tǒng)化的協(xié)調(diào)統(tǒng)一的異構計算系統(tǒng),成為最關鍵的技術問題。
宋繼強同樣表示,異構計算在技術方面、互連方面和軟件方面都面臨瓶頸。一是技術設計流程的協(xié)同問題。要保證與其他不同廠商的芯粒一起互聯(lián)互通、協(xié)同工作時不出現(xiàn)問題。二是需要統(tǒng)一各廠商芯粒之間的互連標準。目前各廠商之間的互連標準并不統(tǒng)一,英特爾攜手業(yè)界部分企業(yè),推出了UCIe標準,未來有望把不同廠商的芯粒連到一起,形成一個符合要求的、大的、封裝級的集成芯片。三是軟件層面要過關。不同廠商的計算芯片之間要做出適配的I/O、內(nèi)存通道。
“東數(shù)西算”帶來新風口
當下正值我國“東數(shù)西算”工程建設穩(wěn)步推進之際。宋繼強指出,異構計算是“東數(shù)西算”的底層支撐。“東數(shù)西算”所需的大型計算中心內(nèi)部,CPU、GPU、FPGA、DPU、專用加速器等對處理不同種類的工作數(shù)據(jù)各有優(yōu)勢與劣勢,也有運營成本高低之分,所以未來一定要綜合部署,多種架構可能都需要涵蓋,而且要有機聯(lián)合起來。
趙立東認為,異構計算對于“東數(shù)西算”來說是剛需。從半導體集成電路“贏家通吃”的發(fā)展特性來說,不管是從內(nèi)部的產(chǎn)品業(yè)務布局,還是外部的生態(tài)與商業(yè)布局出發(fā),單個數(shù)據(jù)中心或智算中心項目在落地時,會考慮異構計算的復雜性及發(fā)展不完備性所帶來的巨大的額外部署成本,在一定程度上會偏好選擇以單一廠商為核心的現(xiàn)成產(chǎn)品組合,盡量避免技術適配的投入。而置身于“東數(shù)西算”背景下,最終要實現(xiàn)的是全國算力中心的大一統(tǒng),從而盡可能地優(yōu)化利用資源,在多個數(shù)據(jù)中心或智算中心互聯(lián)互通的場景下,異構計算的復雜性會是前所未有的。因此,在異構算力溯源、調(diào)度與管理平臺的建設上,需要盡早布局與投入。
算力網(wǎng)絡的構建不只依賴于異構計算,通用計算也將為“東數(shù)西算”提供更多助力。近兩年,國內(nèi)涌現(xiàn)出一批通用計算芯片初創(chuàng)企業(yè),以FPGA和ASIC類型芯片作為切入點,部分企業(yè)購買國外公司的IP授權開發(fā)通用GPU芯片,少數(shù)企業(yè)自主研發(fā)通用GPU核心IP,實現(xiàn)了國內(nèi)通用計算的突破。
天數(shù)智芯副總裁郭為表示,通用計算所構建的算力平臺通常并行處理能力特別強,計算能效比高,并且有很大的存儲帶寬,能夠釋放非??捎^的算力。
郭為建議,強化頂層謀劃,將算力網(wǎng)絡上升為國家戰(zhàn)略,從全局層面整體謀劃戰(zhàn)略定位、發(fā)展目標,加快構建新型算力網(wǎng)絡格局。此外,應成立國家重點實驗室,打造重大原創(chuàng)技術策源地。優(yōu)化異構計算產(chǎn)業(yè)布局,發(fā)揮龍頭領軍企業(yè)的“鏈長”作用,協(xié)同上下游企業(yè),制定產(chǎn)業(yè)鏈供應鏈圖譜及協(xié)同發(fā)展計劃,推動異構計算產(chǎn)業(yè)鏈本土化、供應鏈多元化,確保異構計算產(chǎn)業(yè)安全穩(wěn)定。
