2025-09-10 13:46:09
英(ying)偉(wei)達(da)周二宣布推出(chu)專(zhuan)用(yong)GPU Rubin CPX,翻倍提升AI推理運算(suan)效(xiao)率,預計2026年底出(chu)貨。下一代(dai)旗艦AI服(fu)務器將集成144塊Rubin CPX,性能比當前旗艦高6.5倍。同時(shi),英(ying)偉(wei)達(da)第二季(ji)度(du)收(shou)入達(da)467億(yi)美(mei)元(yuan),超(chao)預期。另博通獲神秘(mi)客戶100億(yi)美(mei)元(yuan)芯(xin)片訂單,或為OpenAI,將與英(ying)偉(wei)達(da)競爭,但AI市場擴張下,英(ying)偉(wei)達(da)或仍能保持穩定增長。
每經編輯|畢(bi)陸名
全球人工智(zhi)能算力芯片龍頭英(ying)偉達(NVDA,股價:170.760美元;總(zong)市值:4.15萬億美元)周二(er)宣布(bu),推出(chu)專(zhuan)為長上(shang)下文工作(zuo)負載設(she)計的專(zhuan)用GPU Rubin CPX,用于翻(fan)倍(bei)提升當前AI推理運算的工作(zuo)效率,特別是編程(cheng)、視(shi)頻生成等需要(yao)超長上(shang)下文窗口的應用。
NVIDIA Vera Rubin NVL144 CPX機(ji)架與托盤,來源:公(gong)司博客
英(ying)偉達(da)CEO黃仁勛表示,CPX是(shi)首(shou)款專為需要一次性處理(li)大量(liang)知識(數(shu)百萬級別tokens),并進行人工智(zhi)能推理(li)的模(mo)型而構建的芯片。
需要說明的是,Rubin就是英偉達(da)將在明年發售的下一代頂(ding)級算力芯片(pian),所以基于Rubin的CPX預計也要到2026年底出貨。下一代英偉達(da)旗艦AI服務器(qi)的全稱叫做NVIDIA Vera Rubin NVL144 CPX——集(ji)成(cheng)36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。
英偉達(da)透露,搭載Rubin CPX的Rubin機架(jia)在處理大上下文窗口時的性能,能比當前旗艦機架(jia)GB300 NVL72高出最多(duo)6.5倍。
據(ju)悉,下一(yi)代旗艦機(ji)架(jia)將(jiang)提供8exaFLOPs的NVFP4算力,比GB300 NVL72高出(chu)7.5倍。同(tong)時(shi)單個(ge)機(ji)架(jia)就能(neng)提供100TB的高速內存和1.7PB/s的內存帶寬。
作為行業首創之舉,英(ying)偉(wei)達的新品在硬件層面上分拆了人(ren)工智能(neng)推理的計算負載。
英偉達介紹稱,推理過程包括兩個截然(ran)不同的階段:上下文階段與生成階段,兩者對(dui)基礎(chu)設施的要求(qiu)本(ben)質上完全(quan)不同。
據悉,Rubin CPX專門針對“數百萬tokens”級別的長上下文(wen)性能進行優化,具備30petaFLOPs的NVFP4算力(li)、128GB GDDR7內(nei)存。
英偉達估計,大約(yue)有20%的AI應用會“坐等”首個token出現(xian)。例如解碼10萬行(xing)代碼可能需要5-10分鐘。而多幀、多秒(miao)的視(shi)頻(pin),預處理和逐幀嵌入會迅速(su)增(zeng)加延遲,這(zhe)也是為什么當前的視(shi)頻(pin)大模型通(tong)常僅(jin)用于制(zhi)作短片。
英偉(wei)達計(ji)劃以(yi)兩(liang)種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個托盤上。對于已經下單NVL144的用戶,英偉(wei)達也會單獨(du)出售一整個機架的CPX芯片,數量正好匹配Rubin機架。
美(mei)國(guo)(guo)東部時間8月(yue)27日美(mei)股盤(pan)后(hou),英偉達發(fa)布(bu)2026財年(nian)第(di)(di)二季度財報。第(di)(di)二季度,英偉達收入達到467億(yi)美(mei)元(yuan)(yuan)(yuan),超(chao)過此前市(shi)場(chang)預(yu)期的(de)461億(yi)美(mei)元(yuan)(yuan)(yuan),比(bi)去年(nian)同(tong)期增(zeng)長(chang)(chang)55%;凈利潤(按美(mei)國(guo)(guo)標準(zhun)會(hui)計準(zhun)則(ze)GAAP衡量)為264億(yi)美(mei)元(yuan)(yuan)(yuan),同(tong)比(bi)增(zeng)長(chang)(chang)60%,換算成每(mei)股收益(EPS)為1.04美(mei)元(yuan)(yuan)(yuan),也(ye)超(chao)出(chu)了市(shi)場(chang)預(yu)期的(de)1.01美(mei)元(yuan)(yuan)(yuan)。
毛利率則有所下滑,該季度(du)為72.4%,去年同期為75.2%。對下一(yi)季度(du)的業績(ji)展望(wang),英偉(wei)(wei)達(da)預計(ji)第三季度(du)收入將達(da)到540億美(mei)(mei)元(yuan),毛利率預計(ji)在(zai)73.3%至73.5%之間。截至收盤,英偉(wei)(wei)達(da)漲0.77%,公司最新市值4.09萬(wan)億美(mei)(mei)元(yuan)。
4日,博通盤后公布的第(di)三財季業(ye)績(ji)超出預(yu)期(qi),并為第(di)四(si)(si)財季提供了強勁(jing)的指引。公司(si)預(yu)計(ji),第(di)四(si)(si)財季的人工智能芯片業(ye)務繼續提速。
在財報電話會上(shang),博通(tong)首席執(zhi)行官陳福陽(Hock Tan)表示,公司(si)已從一家神秘的新客(ke)戶那里獲(huo)得了100億(yi)美元的定(ding)制芯片訂單,這一消息令(ling)投(tou)資者們感到(dao)驚喜。
電話會后不久,業內人(ren)士透(tou)露,這名新客戶極(ji)大(da)可能就是人(ren)工智能領軍(jun)企(qi)業OpenAI——消息稱,OpenAI與博通共同設(she)計的芯片將在明年首次(ci)上(shang)市,以(yi)減少(shao)對英偉達產品的依賴。
這意(yi)味著,博通(tong)將更直接(jie)地(di)與人工智(zhi)能(AI)硬件(jian)龍頭英偉達競爭。
Clearstead Advisors高管Jim Awad表示,投資者需要準備(bei)好面對英偉(wei)達(da)在該領域出(chu)現(xian)更(geng)多競爭的局面,但由于AI市(shi)場本身的快速(su)擴張,即便失去部分市(shi)場份額,公司依然能保持(chi)穩定增長。
“我認為(wei)這(zhe)(英偉達(da)股(gu)價下(xia)跌)只是(shi)膝跳反應,不(bu)是(shi)賣(mai)出的(de)理由,”Awad說道,“關鍵要(yao)看博(bo)通和OpenAI接下(xia)來的(de)執行情況,目前(qian)沒人能在一(yi)夜之間奪(duo)走英偉達(da)的(de)生意。”
每日經濟新聞綜合英偉達、公(gong)開信息
封(feng)面圖片來(lai)源:視覺中國(guo)
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)(jing)《每日經(jing)(jing)濟新(xin)聞》報社(she)授權,嚴禁(jin)轉載或鏡像,違者(zhe)必(bi)究。
讀(du)者(zhe)熱線(xian):4008890008
特(te)別提醒:如果我們使用了您的圖片,請作者與本站聯系索取(qu)稿酬。如(ru)您不希望(wang)作(zuo)品(pin)出現(xian)在本(ben)站,可聯(lian)系我們要求撤下您的(de)作(zuo)品(pin)。
歡迎關注每日經濟新(xin)聞APP