AI能為企業(yè)實(shí)現(xiàn)降本增收,但GPU價(jià)格勸退不少用戶,CPU能接手嗎?
近半年來,ChatGPT 所帶來的 AI 熱度是大家能直觀感受到的。
其實(shí),在不那么直觀的地方,數(shù)據(jù)也在悄然發(fā)生變化:斯坦福大學(xué)發(fā)布的「2023 年 AI 指數(shù)報(bào)告」顯示,2022 年采用 AI 的公司比例自 2017 年以來翻了一番以上。這些公司報(bào)告稱,采用 AI 之后,它們實(shí)現(xiàn)了顯著的成本降低和收入增加。
雖然 2023 年的數(shù)據(jù)還沒出來,但僅憑被 ChatGPT 帶火的 AIGC 領(lǐng)域就不難推測(cè),上述數(shù)字將在今年迎來新的拐點(diǎn)。AIGC 大有掀起第四次產(chǎn)業(yè)革命之勢(shì)。
但與此同時(shí),這些企業(yè)在構(gòu)建 AI 基礎(chǔ)設(shè)施方面也迎來了新的挑戰(zhàn)。
首先,就算力而言,AI 領(lǐng)域 算力需求激增和供給不足形成的矛盾在今年變得尤其激烈 ,就連 OpenAI CEO Sam Altman 都坦言自家公司正被算力短缺問題困擾,其 API 的可靠性和速度問題屢遭投訴。此外,大批公司還面臨這波需求高漲帶來的算力成本上升問題。
其次,在模型的選擇上,不少企業(yè)發(fā)現(xiàn),當(dāng)前討論熱度最高的 大模型其實(shí)還沒有一個(gè)成熟的商業(yè)模式 ,其安全性等方面還存在問題。以三星設(shè)備解決方案部門為例,他們?cè)趩⒂?ChatGPT 不到一個(gè)月的時(shí)間內(nèi),就發(fā)生了三起數(shù)據(jù)泄露事件,這讓原本打算直接調(diào)用 OpenAI API 的企業(yè)打了退堂鼓。此外,自己訓(xùn)練、部署超大模型同樣很勸退:想象一下,僅僅簡(jiǎn)單地向一個(gè)大模型發(fā)送一次請(qǐng)求,可能就需要昂貴的 GPU 卡進(jìn)行獨(dú)占性的運(yùn)算,這是很多企業(yè)都難以承受的。
不過,話說回來,像 ChatGPT 那樣「無所不知」的超大模型真的是企業(yè)所必需的嗎?
性能與成本的艱難抉擇
如果要分析最早應(yīng)用人工智能提升效益的行業(yè),互聯(lián)網(wǎng)是繞不開的一個(gè),其典型工作負(fù)載 —— 推薦系統(tǒng)、視覺處理、自然語言處理等 —— 的優(yōu)化都離不開 AI。不過,隨著業(yè)務(wù)量的激增,他們也在性能和成本等層面面臨著不同的挑戰(zhàn)。
首先看 推薦系統(tǒng) 。
推薦系統(tǒng)在電子商務(wù)、社交媒體、音視頻流媒體等許多領(lǐng)域都有廣泛的應(yīng)用。以電子商務(wù)為例,在每年的 618、雙十一等購物高峰,阿里巴巴等頭部電商企業(yè)都會(huì)面臨全球龐大客戶群發(fā)出的數(shù)億實(shí)時(shí)請(qǐng)求,因此他們希望滿足 AI 推理在吞吐量與時(shí)延方面的要求,同時(shí)又能確保 AI 推理精確性,保證推薦質(zhì)量。
接下來看 視覺處理。
僅美團(tuán)一家,我們就能找到智能圖片處理、商戶入駐證照識(shí)別、掃碼開單車、掃藥盒買藥等多個(gè)應(yīng)用場(chǎng)景。AI 已經(jīng)成為其業(yè)務(wù)版圖中很重要的一部分。不過,隨著美團(tuán)業(yè)務(wù)與用戶量的高速增長(zhǎng),越來越多的應(yīng)用需要通過視覺 AI 構(gòu)建智能化流程,美團(tuán)需要在保證視覺 AI 推理精度的同時(shí),提升視覺 AI 推理的吞吐率,以支撐更多的智能化業(yè)務(wù)。
最后看 自然語言處理 。
得益于 ChatGPT 帶來的熱度,自然語言處理正獲得前所未有的市場(chǎng)關(guān)注與技術(shù)追蹤。作為國(guó)內(nèi) NLP 技術(shù)研究的先行者,百度已在該領(lǐng)域構(gòu)建起完整的產(chǎn)品體系與技術(shù)組合。ERNIE 3.0 作為其飛槳文心?NLP 大模型的重要組成部分,也在各種 NLP 應(yīng)用場(chǎng)景,尤其是中文自然語言理解和生成任務(wù)中展現(xiàn)出卓越的性能。不過,隨著 NLP 在更多行業(yè)中實(shí)現(xiàn)商業(yè)化落地,用戶對(duì) ERNIE 3.0 也提出了更多細(xì)分需求,例如更高的處理效率和更廣泛的部署場(chǎng)景等。
所有這些問題的解決都離不開大規(guī)模的基礎(chǔ)設(shè)施投入,但困擾這些企業(yè)的共同問題是: 獨(dú)立 GPU 雖然可以滿足性能所需,但是成本壓力較大,因此一味擴(kuò)充 GPU 規(guī)模并不是一個(gè)最佳選項(xiàng) 。
CPU也能搞出大模型
AMD在CES上宣布了一系列以AI為核心功能的新芯片。這些產(chǎn)品將人工智能功能與去年早些時(shí)候收購Xilinx時(shí)獲得的技術(shù)相結(jié)合。
公司XDNA架構(gòu)中的產(chǎn)品具有適應(yīng)性,并允許公司將人工智能“從PC擴(kuò)展到智能終端、邊緣設(shè)備和云”。她補(bǔ)充說,加速器可以適應(yīng)應(yīng)用和功率效率。
同時(shí)還宣布該公司正在測(cè)試其第一款推理加速器,名為Alveo V70。它基于AMD的XDNA技術(shù),可以插入服務(wù)器。
Alveo V70旨在加速視頻分析和客戶推薦引擎等應(yīng)用程序。該卡以較小的外形尺寸提供了性能效率。該加速器每秒提供400萬億次人工智能計(jì)算性能,支持PCIe 5.0,并消耗75瓦功率。
蘇博士聲稱其Alveo V70在圖像分類和物體檢測(cè)等應(yīng)用中提供了比英偉達(dá)T4 GPU加速器更好的性能。芯片制造商共享模擬到最佳條件的性能數(shù)據(jù),以使其芯片優(yōu)于競(jìng)爭(zhēng)對(duì)手產(chǎn)品。真實(shí)世界的性能數(shù)字通常與供應(yīng)商提供的數(shù)字非常不同。
AMD正在進(jìn)行Alveo V70預(yù)購,芯片將在今年春季上市。
Alveo V70 AI芯片的核心技術(shù)也在AMD最新的筆記本電腦芯片Ryzen 7040中,該芯片在CES上發(fā)布?!斑@是業(yè)界第一個(gè)集成了專用片上AI引擎的移動(dòng)x86處理器,我們稱之為Ryzen AI?!?/span>
Ryzen 7040芯片同時(shí)運(yùn)行四個(gè)AI流,每秒提供多達(dá)12萬億次操作。該芯片有八個(gè)基于Zen 4架構(gòu)的CPU內(nèi)核,運(yùn)行速度高達(dá)5.2GHz。該芯片采用臺(tái)積電的4nm制造工藝制造。這些芯片將用于三月份上市的筆記本電腦。
微軟首席產(chǎn)品官Panos Panay表示,用戶將能夠在Ryzen CPU內(nèi)部的AI引擎上運(yùn)行大規(guī)模模型,而只需要一小部分功率,在這之前需要GPU功率。例如,在Windows 11上提供的Windows Studio Effects中,Ryzen AI將對(duì)視頻進(jìn)行增強(qiáng),以減少背景模糊、改善肖像、抑制背景噪音和自動(dòng)設(shè)置視頻幀?!斑@些體驗(yàn)每秒需要數(shù)萬億次的運(yùn)算……它們現(xiàn)在可以在AMD的AI引擎上運(yùn)行,而不會(huì)對(duì)CPU或GPU造成負(fù)擔(dān),同時(shí)只消耗100毫瓦。”
AI大模型會(huì)怎樣改變B端企業(yè)生態(tài)
從高速生成圖像和視頻到全方位增強(qiáng)客戶的體驗(yàn),生成式AI已經(jīng)被證明是跨越各個(gè)行業(yè)的工具。
以下是我們探討出可能會(huì)使企業(yè)利用AI實(shí)現(xiàn)巨大增長(zhǎng)的一些方式。
內(nèi)容的極大豐富:目前的主流AI模型及其應(yīng)用,能夠讓企業(yè)快速和高效的創(chuàng)建內(nèi)容,無論是文章,圖片還是視頻,從效率和質(zhì)量上都可以獲得相當(dāng)好的性價(jià)比,這有利于率先采用AI的企業(yè)在擁擠的市場(chǎng)中脫穎而出。例如善用Stable diffusion生成高質(zhì)量的圖像和圖形,能極大的提升企業(yè)自身出圖的生產(chǎn)效率和質(zhì)量。自動(dòng)化創(chuàng)意過程也能極大的節(jié)省時(shí)間和資源。只需要合理的提示詞+預(yù)先微調(diào)好適合自己企業(yè)的模型,企業(yè)就可以生成大量的圖像和文本,無論這些是用于內(nèi)部還是用于對(duì)客戶。
加速自動(dòng)化: 相當(dāng)多的軟件工程AI可以有效的提升企業(yè)的工程能力,提高公司開發(fā)人員的效率。copilot這樣的ai提供了可靠的自動(dòng)化支持,降低了企業(yè)內(nèi)部的運(yùn)營(yíng)成本。很多補(bǔ)充功能也有利于讓沒那么經(jīng)驗(yàn)豐富的工程師獲得極大的能力提升。
個(gè)性化營(yíng)銷:我們總說要進(jìn)行個(gè)性化營(yíng)銷,但最多也就做到按照有限的客戶Tag分類來進(jìn)行分類營(yíng)銷,并不是完全的個(gè)性化。而AI讓真正的千人千面形成了可能,提供超級(jí)個(gè)性化的營(yíng)銷活動(dòng)。甚至通過分析客戶的數(shù)據(jù),可以根據(jù)用戶獨(dú)特的喜好來創(chuàng)建動(dòng)態(tài)內(nèi)容,從而優(yōu)化參與度和轉(zhuǎn)化率,能提高營(yíng)銷投資的回報(bào)率。
聊天機(jī)器人和虛擬助理:AI支持的聊天機(jī)器人和虛擬助理可以對(duì)客戶的查詢提供即時(shí),準(zhǔn)確的響應(yīng)。傳統(tǒng)的客服機(jī)器人只能應(yīng)對(duì)有限和預(yù)設(shè)的問題,而且從效果來看越來越低效。而全新的AI智能系統(tǒng)可以“理解”客戶的需求并提供個(gè)性化的支持,增強(qiáng)客戶的服務(wù),減少等待時(shí)間,這樣可以極大的提升客戶的滿意度和忠誠度。而還有一點(diǎn)很重要,即完全沒有技術(shù)背景的員工和團(tuán)隊(duì)也可以用ai來構(gòu)建屬于自己的機(jī)器人來為自己的團(tuán)隊(duì)和客戶提供服務(wù),而這些成本會(huì)非常低。
更強(qiáng)大的翻譯能力:全球經(jīng)濟(jì)越來越緊密的如今,語言障礙將會(huì)隨著AI的發(fā)展迅速弱化。企業(yè)可以越來越容易的面對(duì)全球客戶,無論所處的行業(yè)是電商,游戲,還是開發(fā)。曾經(jīng)的翻譯模式無法很好的融合進(jìn)業(yè)務(wù)本身,但生成式AI的速度和能力都遠(yuǎn)遠(yuǎn)超過了傳統(tǒng)的翻譯模式,你的交流甚至不需要預(yù)先去選擇對(duì)方的語言是什么。跨境無縫溝通會(huì)讓更多的企業(yè)更容易的全球化。
信息和網(wǎng)絡(luò)安全:生成式AI會(huì)讓信息安全更加快速的響應(yīng),通過分析大數(shù)據(jù)的模式,企業(yè)或組織可以迅速檢測(cè)和防止欺詐、保護(hù)敏感信息和數(shù)據(jù)資產(chǎn)。當(dāng)然這里會(huì)有很大的挑戰(zhàn),但我們有理由相信這已經(jīng)是一種不可阻擋的趨勢(shì)。
準(zhǔn)確的預(yù)測(cè)和分析:相比于傳統(tǒng)的數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)分析模式,生成式AI所帶來的預(yù)測(cè)分析方面表現(xiàn)更為出色。企業(yè)可以利用AI做出準(zhǔn)確的市場(chǎng)預(yù)測(cè)和及時(shí)的決策,從而優(yōu)化供應(yīng)鏈管理、庫存和需求規(guī)劃。例如曾經(jīng)需要月甚至季度才能處理的市場(chǎng)情形,在AI加持下可以提升到天,甚至小時(shí)級(jí)的突發(fā)情況,這極大的提升了很多傳統(tǒng)企業(yè)的運(yùn)營(yíng)效率。
學(xué)術(shù)研究:有相當(dāng)多的企業(yè)(醫(yī)療,科技,工程等)擁有自己的學(xué)術(shù)研究部門或與大學(xué)合作展開的科研項(xiàng)目,諸多學(xué)術(shù)方面的AI模型會(huì)極大的提升科研效率,從而讓企業(yè)更快的進(jìn)行研發(fā)迭代和市場(chǎng)投放。
以上的每一種方法都是AI可能會(huì)給B端帶來的助力,一定會(huì)有一些企業(yè)率先摸索到了AI的正確打開方式從而獲得本行業(yè)的巨大發(fā)展優(yōu)勢(shì)。無論是內(nèi)部流程的簡(jiǎn)化,還是對(duì)客戶體驗(yàn)的增強(qiáng),數(shù)據(jù)驅(qū)動(dòng)的決策和創(chuàng)新等等,都會(huì)提升效率,盈利能力和競(jìng)爭(zhēng)力。而重要的是,對(duì)企業(yè)有利的事情同時(shí)也對(duì)企業(yè)服務(wù)的客戶更有利,無論是更低的成本還是更好的體驗(yàn),都會(huì)再當(dāng)今快速發(fā)展的數(shù)字環(huán)境中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
