每日經(jing)濟新聞 2025-01-21 19:02:25
2024年8月(yue)至2025年1月(yue),國內(nei)四(si)家(jia)AI算力(li)(li)廠(chang)商陸續(xu)啟動IPO輔導,其(qi)中三家(jia)為(wei)GPU路線(xian),一家(jia)為(wei)ASIC路線(xian)。這些企業在技術(shu)和(he)團隊(dui)方(fang)面各有優(you)勢,如(ru)燧原科技和(he)沐(mu)曦股份創始(shi)團隊(dui)有AMD背景,摩(mo)爾(er)線(xian)程創始(shi)團隊(dui)來自英偉(wei)達。當下(xia)GPU仍(reng)是市(shi)場(chang)主流,但未來隨著AI技術(shu)落地,推理市(shi)場(chang)規(gui)模或超訓練環節,而ASIC在推理領域潛力(li)(li)巨大(da)。
每經記者(zhe)|朱成祥 每經編輯|楊夏
2024年,AI浪潮持續翻涌,寒武紀(688256.SH,股價625元(yuan),市值2609.1億元(yuan))作為(wei)A股(gu)AI算力芯片龍(long)頭(tou)可謂風頭(tou)無兩,Wind數據顯(xian)示,去年寒武紀股(gu)價上漲(zhang)387.55%,同(tong)期科創100指(zhi)數則下跌8.56%。
在(zai)寒武紀“獨領風騷”的二(er)級(ji)市場(chang)之(zhi)外,國內(nei)還(huan)有一(yi)批(pi)優(you)秀的AI算力芯片企業(ye)尚未登陸資本市場(chang),如壁(bi)仞科(ke)技、天數(shu)智(zhi)芯、燧原(yuan)股份(fen)、摩(mo)爾線程、沐曦等(deng)。其中,壁(bi)仞科(ke)技、燧原(yuan)股份(fen)、摩(mo)爾線程、沐曦目(mu)前已(yi)進入上市輔導(dao)階段。
AI算力(li)芯片主要可以分為(wei)GPU(圖形處理器(qi))、AI ASIC(人工智能專用處理器(qi))和FPGA(現場可編程門陣列)三種。目(mu)前,國內(nei)GPU廠商代表有壁仞科技、天(tian)智數芯、摩爾線(xian)程和沐(mu)曦等(deng);AI ASIC廠商代表有華為(wei)海思昇騰、燧原股份、地平(ping)線(xian)、黑芝麻智能、比特大陸等(deng)。

盡管位列Wind GPU指數(8841701.WI)成(cheng)分(fen)股,但根據寒武(wu)紀招股書(shu),其(qi)將自己的產品與傳統芯(xin)片CPU、GPU等進行(xing)了區分(fen),稱“主要(yao)研發通用(yong)型智(zhi)能芯(xin)片”,而不(bu)是(shi)專用(yong)型智(zhi)能芯(xin)片(ASIC)。不(bu)過,在多家券商和咨詢機構(gou)的研報中,均將其(qi)產品列為了ASIC。
根據國泰君安證(zheng)券研(yan)報,AI芯片主要分(fen)為三種(zhong)類型(xing):通(tong)用型(xing)(GPU)、半(ban)定制型(xing)(FPGA)、定制型(xing)(ASIC)。三類芯片代表分(fen)別(bie)有英偉達(NVIDIA)的(de)GPU、賽靈思的(de)FPGA和Google的(de)TPU(一種(zhong)專(zhuan)門為機器學習任務設計(ji)的(de)AI ASIC)。GPU的(de)計(ji)算(suan)能力最(zui)強,但是成(cheng)本高、功(gong)耗高;FPGA可編(bian)程,最(zui)靈活,但是計(ji)算(suan)能力不強;ASIC體積小(xiao)、功(gong)耗低,適(shi)合量產,但是研(yan)發時間長,且不可編(bian)輯,前(qian)期投入(ru)成(cheng)本高,帶來(lai)一定的(de)技術風險。
在(zai)寒(han)武(wu)紀招股書中(zhong),將自己的(de)產(chan)品與傳統CPU、GPU等芯(xin)片類型進行了區分,而是列為通(tong)用型智能(neng)芯(xin)片和專用型智能(neng)芯(xin)片(ASIC)兩(liang)類。其中(zhong),通(tong)用型智能(neng)芯(xin)片代表包(bao)括(kuo)寒(han)武(wu)紀思(si)元100/270/220)、華(hua)為海思(si)(Ascend 310/910)、谷歌(TPU V1/V2/V3、TPU EDGE)等。
在國(guo)泰君(jun)安證(zheng)券研報中,谷歌TPU、華為海思昇(sheng)騰910均被分(fen)類為ASIC。此(ci)外,燧(sui)原股份(fen)的云燧(sui)T20與(yu)寒武紀的NPU在整體性能上也與(yu)谷歌比肩(jian)。
此外(wai),民生證券研報顯(xian)示,云端(duan)算(suan)力(li)中,寒武(wu)紀也被劃(hua)入了ASIC。
頭(tou)豹研究院(yuan)AI行業高級(ji)分析師常喬雨(yu)也(ye)告訴《每(mei)日經濟新聞》記(ji)者(zhe):“目前國內從事AI ASIC研發的(de)廠商主要包括(kuo)寒武(wu)紀、地(di)平線(xian)、燧原科技、黑(hei)芝麻智(zhi)能和比特大陸等。”
不過,寒武紀、燧原科技(ji)的芯片(pian)可能(neng)更(geng)偏(pian)向于DSA(領域專用架(jia)構),不屬(shu)于傳統不可編(bian)程的ASIC,而是廣義的ASIC。
傳統ASIC不可編程,于是DSA應運而生。常喬雨表示:“DSA芯片在性能和靈活性之間找到平衡點,成為ASIC和GPGPU(通用圖形處理器計算)之外的(de)另(ling)一條技術路(lu)徑。DSA結合(he)了(le)ASIC的(de)高(gao)性(xing)能(neng)優勢和(he)GPGPU(通用(yong)(yong)圖形處(chu)理(li)器)的(de)編程(cheng)靈活性(xing),專為(wei)特定領域的(de)計(ji)算需求設計(ji),尤其適用(yong)(yong)于泛安(an)防和(he)自(zi)動駕(jia)駛等(deng)明確場景。”
他補充表示:“整(zheng)體(ti)來(lai)看,ASIC、GPGPU和(he)DSA各(ge)有側重:ASIC注(zhu)重特定任(ren)務的極致性(xing)能,GPGPU強(qiang)調通(tong)用性(xing),而(er)DSA則嘗試去結合兩(liang)者(zhe)的優點,帶來(lai)性(xing)價比(bi)和(he)效率更高(gao)的算(suan)力。”
燧原股份相關工(gong)作人員也回(hui)復《每日(ri)經濟新聞》記(ji)者稱:“我們是DSA架構。”
黑(hei)(hei)芝麻智(zhi)能也對(dui)記(ji)者表示:“黑(hei)(hei)芝麻智(zhi)能的(de)(de)芯片(pian)(pian)架(jia)構兼具(ju)(ju)ASIC的(de)(de)高性能和(he)GPGPU的(de)(de)靈(ling)活性,芯片(pian)(pian)產品可(ke)以歸為(wei)ASIC芯片(pian)(pian)類別,和(he)以上(shang)芯片(pian)(pian)(寒武紀、華為(wei)海思(si)昇騰、燧原科技)架(jia)構類似,都具(ju)(ju)備(bei)靈(ling)活編(bian)程(cheng)的(de)(de)擴展性。”
簡而(er)言之,DSA屬于(yu)廣義ASIC芯片,且較傳(chuan)統ASIC更加靈活(huo)。
2024年8月(yue)以來(lai),國(guo)內四(si)大AI算力廠(chang)商陸續啟動(dong)IPO輔導。2024年8月(yue)26日(ri),AI ASIC領域代表(biao)廠(chang)商燧原科(ke)技啟動(dong)IPO輔導;GPGPU領域代表(biao)廠(chang)商壁仞科(ke)技于9月(yue)11日(ri)啟動(dong)IPO輔導;11月(yue)12日(ri),GPU廠(chang)商摩爾(er)線程啟動(dong)IPO輔導。
進入2025年,1月15日,沐曦(xi)股份也啟(qi)動了上市(shi)(shi)輔導。若四家(jia)全(quan)部上市(shi)(shi)成功,將大幅擴展(zhan)A股AI算(suan)力(li)廠商投資標的(de)的(de)供給。
這幾家接受IPO輔導(dao)的企業中,燧原科技創始團(tuan)隊(dui)有AMD背景,其創始人兼COO張亞林于2008年加入(ru)AMD,歷任資(zi)深芯(xin)片(pian)經(jing)理(li)、技術(shu)總監。曾經(jing)作為全(quan)球芯(xin)片(pian)研(yan)發主要負責人之一,在AMD上海(hai)研(yan)發中心成(cheng)功領(ling)導(dao)開發并量產了(le)多顆世界級芯(xin)片(pian),擁有豐富的工程和產品化實(shi)戰經(jing)驗(yan)。
沐曦股份創始(shi)團隊同樣來自(zi)AMD,其創始(shi)人陳維良曾任AMD全球GPGPU設計總負責(ze)人;兩位(wei)CTO(首席技術官(guan))均為前AMD首席科學家,目前分別負責(ze)公司軟(ruan)硬件架(jia)構。
而摩爾線(xian)程創始團隊來自全球GPU巨(ju)頭英(ying)偉(wei)達,其創始人兼CEO張建中曾任英(ying)偉(wei)達全球副總裁、中國區(qu)總經(jing)理,在GPU這(zhe)一行業(ye)已經(jing)深耕近二十年。
除了這四家接受(shou)IPO輔導的廠商外,天(tian)數智(zhi)芯、昆侖芯、平頭哥(ge)等(deng)廠商也廣(guang)受(shou)市(shi)場關(guan)注。
另外,目前(qian)接受IPO輔導(dao)的(de)四家(jia)廠商中,三家(jia)屬于(yu)(yu)GPU路(lu)線,一家(jia)屬于(yu)(yu)ASIC路(lu)線。當下,以(yi)英偉達為(wei)代表(biao)的(de)GPU算力廠商仍(reng)是市(shi)場主流,而近期以(yi)博通為(wei)代表(biao)的(de)ASIC路(lu)線也逐漸受到廣泛(fan)關注。
對于GPU路線與(yu)ASIC路線的(de)(de)優(you)劣,TrendForce集邦咨(zi)詢分析(xi)師邱珮(pei)雯回復《每日經濟新聞》記者認為(wei):“ASIC在(zai)可見(jian)的(de)(de)未來不會完全(quan)取代GPU,ASIC通(tong)常(chang)(chang)是專門為(wei)某(mou)種特(te)定(ding)應用(yong)或(huo)運(yun)算去設計的(de)(de)芯片,如(ru)(ru)訓練(lian)或(huo)推理,偏向(xiang)特(te)定(ding)客戶(hu)定(ding)制(zhi)化;而GPU設計為(wei)通(tong)用(yong)運(yun)算,對于執行多樣(yang)任務較具靈活性,通(tong)常(chang)(chang)為(wei)標(biao)準(zhun)品(pin),適用(yong)于多數客戶(hu),且(qie)相較于高階(jie)英偉達芯片如(ru)(ru)B200,ASIC目前開發運(yun)算效(xiao)能落差仍(reng)大。因此,ASIC和GPU有各自的(de)(de)目標(biao)市場及應用(yong)。”
常喬雨認(ren)為:“當前,AI ASIC的(de)(de)應用主要集中在推(tui)理(li)任務上(shang),盡管部分產品也(ye)涉(she)及訓練領域,但推(tui)理(li)顯(xian)然是(shi)其(qi)核(he)心戰場(chang)(chang)。這是(shi)因為推(tui)理(li)任務具有固定的(de)(de)計(ji)算模式和高(gao)(gao)(gao)吞吐量(liang)需(xu)求,非常契合ASIC硬件固化(hua)的(de)(de)高(gao)(gao)(gao)效特性。與此同(tong)時,推(tui)理(li)的(de)(de)市場(chang)(chang)空間未來也(ye)將顯(xian)著超(chao)過(guo)訓練。隨著人工智能(neng)技術在各行業(ye)的(de)(de)加速滲透,終端設備和云端推(tui)理(li)的(de)(de)需(xu)求量(liang)快速增(zeng)長,涵蓋了從智能(neng)家居到(dao)工業(ye)自(zi)動化(hua)再到(dao)車載計(ji)算的(de)(de)多樣化(hua)場(chang)(chang)景。而推(tui)理(li)任務的(de)(de)高(gao)(gao)(gao)頻調用和長生(sheng)命周期(qi)特點,也(ye)決(jue)定了這一(yi)(yi)市場(chang)(chang)的(de)(de)規模潛(qian)力將遠(yuan)超(chao)一(yi)(yi)次性投入較(jiao)高(gao)(gao)(gao)的(de)(de)訓練環節。”
也就是(shi)說,當下(xia)AI仍以訓(xun)練為主導,GPU仍是(shi)主流。而(er)未來,隨著AI技術的(de)(de)廣泛落(luo)地,推理(li)市場規模(mo)或大幅超過(guo)訓(xun)練環節。而(er)推理(li)環節,正是(shi)AI ASIC的(de)(de)主戰場。
事實上,ASIC芯片不僅在推理領域潛力巨大,在類似智駕等(deng)特定場景(jing)的應(ying)用也前景(jing)廣(guang)闊。
黑(hei)芝(zhi)麻智(zhi)(zhi)能(neng)方面(mian)告訴(su)《每日經濟(ji)新聞》記者:“黑(hei)芝(zhi)麻智(zhi)(zhi)能(neng)的(de)智(zhi)(zhi)駕(jia)芯片在高(gao)性(xing)能(neng)、低功耗、靈活(huo)性(xing)、跨域(yu)融(rong)合、市場(chang)定位(wei)和端到端算(suan)法參考模型等(deng)方面(mian)都有(you)顯著優(you)勢。由于黑(hei)芝(zhi)麻智(zhi)(zhi)能(neng)智(zhi)(zhi)駕(jia)芯片面(mian)向特定場(chang)景(jing),因此算(suan)力的(de)利用率、能(neng)效(xiao)比(bi)都會更高(gao)。在靈活(huo)性(xing)方面(mian),黑(hei)芝(zhi)麻智(zhi)(zhi)能(neng)的(de)芯片設計融(rong)入(ru)了可編程(cheng)性(xing),使其(qi)在一定程(cheng)度(du)上(shang)具(ju)備(bei)GPGPU的(de)靈活(huo)性(xing)。”
目(mu)前,國(guo)際(ji)上主流AI ASIC廠商(shang)為博通(tong)、Marvell。需(xu)要注意的(de)是,博通(tong)不(bu)僅擁(yong)有AI ASIC設(she)計能力,其配套網(wang)絡(luo)業務也十分強大,比如以(yi)太網(wang)交換芯片(pian)、PCIe/CXL Retimer等。而英(ying)偉(wei)達算力領(ling)域的(de)三(san)大壁壘,包括GPGPU芯片(pian)、NVLink和(he)CUDA生態(tai)(tai)。而國(guo)內廠商(shang)在軟件工具鏈和(he)開發(fa)者生態(tai)(tai)方面尚待(dai)補強。
根據國聯(lian)證券研報,AI大模(mo)型的(de)(de)快(kuai)速(su)發(fa)(fa)展推動“算(suan)力(li)”“存力(li)”需(xu)求快(kuai)速(su)增(zeng)長。與此(ci)同時,對“運力(li)”也提(ti)(ti)出(chu)了更高(gao)的(de)(de)需(xu)求。系(xi)統需(xu)要更高(gao)的(de)(de)帶寬,更快(kuai)的(de)(de)傳輸。但內(nei)存的(de)(de)性(xing)能提(ti)(ti)升速(su)度(du)遠低(di)于(yu)處理器的(de)(de)性(xing)能提(ti)(ti)升速(su)度(du),導致(zhi)處理器無(wu)法充(chong)分發(fa)(fa)揮其(qi)計算(suan)能力(li)。
英偉(wei)達有NVLink,博(bo)通有CXL技術,那么(me)國內(nei)在“運力”領(ling)域有哪些布局呢?
國(guo)內(nei)CXL高(gao)速互聯(lian)(lian)廠商國(guo)數集聯(lian)(lian)告訴《每日經濟(ji)新聞》記(ji)者:“NVLink具備(bei)高(gao)帶寬和(he)低延遲的優(you)點,但存(cun)在(zai)生態封(feng)閉(bi)、價格昂貴等問題。主要運用(yong)在(zai)英偉達產品中。CXL基于(yu)PCIe的基礎上(shang)發(fa)展而來,專注于(yu)優(you)化處理器(qi)與加(jia)速器(qi)之間的通信。CXL能夠提供高(gao)帶寬、低延遲的通信,并支持先進的大容量低延遲內(nei)存(cun)協同特性。CXL也是唯一(yi)(yi)橫(heng)跨運力和(he)存(cun)力的互聯(lian)(lian)標準(zhun)、唯一(yi)(yi)橫(heng)跨通用(yong)服務(wu)器(qi)和(he)AI服務(wu)器(qi)的互聯(lian)(lian)標準(zhun)。”
目前國(guo)內(nei)也(ye)有較多的AI ASIC廠(chang)商。那么,國(guo)數集(ji)聯在(zai)高速互(hu)聯領域有哪些獨特的優(you)勢,是否有意與AI算力芯片(pian)廠(chang)商合作,共(gong)同研發、拓展市場?
國(guo)數(shu)集聯表(biao)示:“公司面向人工智能數(shu)據(ju)中心(AIDC)、云(yun)服(fu)(fu)務商(shang)、服(fu)(fu)務器廠商(shang)以及(ji)(ji)運營(ying)商(shang),提(ti)供(gong)先進的(de)(de)高(gao)速互聯算法(fa)、芯片(pian)及(ji)(ji)方(fang)案(an)。目前,公司的(de)(de)核心產品(pin)包括CXL Switch芯片(pian)、模塊以及(ji)(ji)硬件整體(ti)方(fang)案(an)。國(guo)數(shu)集聯正與國(guo)內的(de)(de)云(yun)廠商(shang)、AI廠商(shang)、運營(ying)商(shang)展開合作,旨在提(ti)供(gong)高(gao)效的(de)(de)數(shu)據(ju)傳(chuan)輸和聯結(jie)方(fang)案(an)。”
大模型發展迅速,也對各大廠商(shang)軟硬件結合(he)能力提(ti)出(chu)更高要(yao)求。而國內不(bu)少GPGPU廠商(shang),也開始走向(xiang)“異構(gou)計算”。
天數(shu)智芯(xin)副總裁鄒翾對《每(mei)日經濟新聞》記者(zhe)表示:“異構計(ji)算(suan)在(zai)(zai)(zai)訓(xun)練(lian)(lian)和(he)推理領域(yu)(yu)都(dou)占據著重要地位(wei)。在(zai)(zai)(zai)訓(xun)練(lian)(lian)領域(yu)(yu),面對大規模(mo)數(shu)據集(ji)和(he)復雜(za)模(mo)型(xing)結構,單一類型(xing)芯(xin)片往(wang)(wang)往(wang)(wang)難(nan)以滿足計(ji)算(suan)需(xu)求(qiu)。異構計(ji)算(suan)通(tong)過(guo)整合多種不(bu)(bu)同架構芯(xin)片,可以加速訓(xun)練(lian)(lian)過(guo)程(cheng),減少訓(xun)練(lian)(lian)時(shi)(shi)間和(he)成本。在(zai)(zai)(zai)推理領域(yu)(yu),實(shi)時(shi)(shi)性(xing)要求(qiu)極高,異構計(ji)算(suan)能夠(gou)根據不(bu)(bu)同的推理任務特性(xing),靈活調(diao)配(pei)硬(ying)件資源。例如在(zai)(zai)(zai)處理圖像(xiang)、語音等特定類型(xing)數(shu)據時(shi)(shi),通(tong)過(guo)不(bu)(bu)同芯(xin)片的協(xie)同工作(zuo),快速完(wan)成推理,輸出準確(que)結果。”
資料(liao)顯示,天數智芯是國內率(lv)先支(zhi)持智算芯片混(hun)合訓練的(de)通用GPU廠商。其“天垓”和“智鎧”產(chan)品系列(lie),廣泛(fan)應用于主(zhu)流(liu)大模型(xing)的(de)訓練、微調以(yi)及推(tui)理任務。2024年(nian),天數智芯參加了在上(shang)海市通信管理局和上(shang)海市數據局的(de)支(zhi)持下,多家單(dan)位聯合開展的(de)跨域(yu)異(yi)構(gou)(gou)算力網(wang)絡實驗驗證工作,異(yi)構(gou)(gou)混(hun)訓效率(lv)可達97.5%。
壁仞科(ke)技(ji)(ji)向記者(zhe)提供的(de)資(zi)料也顯示,公司(si)正聯合(he)客戶、合(he)作伙伴、科(ke)研(yan)機構(gou)共(gong)同推(tui)動異構(gou)GPU協同訓練生態,具體包(bao)括(kuo):中(zhong)國(guo)移動、中(zhong)國(guo)電信、中(zhong)興通訊、商湯科(ke)技(ji)(ji)、國(guo)網智(zhi)能(neng)電網研(yan)究院有限公司(si)、上海智(zhi)能(neng)算(suan)力科(ke)技(ji)(ji)有限公司(si)、上海人工智(zhi)能(neng)實驗(yan)室(shi)、中(zhong)國(guo)信息(xi)通信研(yan)究院等。
壁仞(ren)科技表示,這一異構(gou)GPU協同訓練方(fang)案最(zui)終(zhong)實現(xian)(xian)了國產(chan)(chan)GPU和英偉達GPU的異構(gou)共(gong)存,突破異構(gou)算力(li)孤(gu)島難題,加快國產(chan)(chan)GPU的落地遷移(yi),助力(li)國產(chan)(chan)大模型落地。此外,該方(fang)案賦能整個算力(li)產(chan)(chan)業發展(zhan),壁仞(ren)HGCT方(fang)案具備普適性、易用性、兼容(rong)性,助力(li)最(zui)終(zhong)客戶實現(xian)(xian)多種異構(gou)算力(li)聚合,最(zui)大化(hua)異構(gou)GPU集群利用效率(lv)。
在邊緣側,AI PC又(you)將(jiang)如(ru)何發展(zhan)呢(ni)?未來(lai)AI算力芯(xin)片是(shi)否可能作為單獨(du)(du)的“外掛”芯(xin)片,類似于獨(du)(du)立(li)顯卡搭配在AI PC之中(zhong)?
天智(zhi)數芯表示(shi):“目前這種(zhong)外掛AI芯片的(de)AI PC已有(you)原型,并且已經有(you)用(yong)戶在(zai)使用(yong)。隨著AI在(zai)PC端應用(yong)場(chang)景不(bu)斷拓展(zhan),如智(zhi)能創作、數據(ju)分析等,對算力需(xu)求(qiu)劇增。將AI算力芯片做成(cheng)‘外掛’,便于用(yong)戶根據(ju)自身需(xu)求(qiu)靈(ling)活升(sheng)級(ji),提(ti)升(sheng)AI性能,就像現在(zai)人們按需(xu)選擇獨(du)立顯卡。同時,這也有(you)助于降低PC整體成(cheng)本,促進AI技術在(zai)PC領域的(de)普及(ji)。”
可以(yi)看出,除了(le)寒(han)武紀外,國內未上市的企業中,也有較多GPGPU廠商、AI ASIC廠商,且在“運(yun)力(li)”、軟件生(sheng)態領域,國內廠商也在積極布(bu)局(ju)。
封(feng)面圖片(pian)來源:視覺中國-VCG41N970174988
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新(xin)聞(wen)》報社授權,嚴禁轉載(zai)或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希(xi)望作(zuo)品出現在本站,可聯系我們要(yao)求撤下您的作(zuo)品。
歡迎關注(zhu)每日(ri)經濟(ji)新聞APP