今日報紙

英偉達深夜發“重磅” 預計明年推出Blackwell Ultra AI芯片

每日經濟新聞 2024-06-04 00:16:15

每經(jing)記者｜楊(yang)卉每經(jing)編輯｜陳俊杰  

6月2日晚間(jian)，英偉達(da)創始人兼首席執行官黃仁勛登臺演講，透露(lu)了不(bu)少關鍵信(xin)息(xi)。據他(ta)介紹(shao)，使(shi)用NVIDIA NIM將AI模型部署(shu)在云、數據中心或工(gong)作(zuo)站上的開發者，可將模型部署(shu)時間(jian)從(cong)以前(qian)的數周縮短(duan)至幾分鐘。和碩、勞(lao)氏公司、西門(men)子等客戶均在使(shi)用。

視覺中國

此外，被英偉達寄予厚(hou)望的新一代AI芯(xin)(xin)片與超級計算平臺Blackwell芯(xin)(xin)片已開(kai)始投(tou)產，預(yu)計將在2025年(nian)推出Blackwell Ultra AI芯(xin)(xin)片。

據悉，英偉達的(de)第(di)一款Blackwell芯片名為(wei)GB200，宣(xuan)稱是(shi)目(mu)前“全球最強大的(de)芯片”。目(mu)前，供應(ying)鏈對(dui)GB200寄予厚望(wang)，預估2025年出貨量有機會突破百萬顆，將占英偉達高端GPU出貨量的(de)近40%~50%。

NIM大幅加快模型部署

6月2日晚間，一身(shen)皮衣的黃仁勛又在(zai)舞臺(tai)上擺弄起了(le)自家產品，重磅介紹了(le)NVIDIA NIM，一種(zhong)推(tui)理(li)微服務，可通過經優化的容器形式提供模(mo)型，旨在(zai)助(zhu)力各(ge)種(zhong)規模(mo)企業部署(shu)AI服務。

不過，嚴格來說，NVIDIA NIM并非新(xin)品，最早露面是在(zai)今(jin)年3月。英偉達(da)在(zai)6月2日(ri)晚間宣(xuan)布，全(quan)球2800萬開(kai)(kai)發者(zhe)皆可(ke)下載(zai)NVIDIA NIM，將AI模(mo)型部署在(zai)云、數據中心(xin)或(huo)工作站上，構建Copilot（微軟的AI助理）、ChatGPT聊(liao)天機器人等生成式AI應用(yong)。下月起，NVIDIA開(kai)(kai)發者(zhe)計劃的會員(yuan)可(ke)免費使(shi)用(yong)NIM，在(zai)其選擇(ze)的基(ji)礎設施(shi)上進行研究、開(kai)(kai)發和測試。

根據英偉(wei)達的(de)(de)(de)說法，新(xin)的(de)(de)(de)生(sheng)成式AI應用(yong)正變得越來越復雜(za)，通常需要使用(yong)具有不同功能的(de)(de)(de)多個(ge)模型(xing)來生(sheng)成文本，如圖(tu)像、視(shi)頻、語(yu)音等。而(er)NVIDIA NIM提供了一種(zhong)簡單(dan)、標準化的(de)(de)(de)方式，將生(sheng)成式AI添加到應用(yong)中，可使模型(xing)部署時間從以前的(de)(de)(de)數周縮短(duan)至幾分鐘。

黃仁勛還透露，包括Cadence、 Cloudera、 Cohesity、DataStax、NetApp、Scale AI和新(xin)思科(ke)技等在內的(de)(de)近200家技術合作伙伴正在將(jiang)NIM集(ji)成到(dao)(dao)他們的(de)(de)平臺中(zhong)，以加快生(sheng)成式(shi)AI的(de)(de)部署。“每(mei)個企(qi)業都(dou)希望在其運營(ying)中(zhong)融入生(sheng)成式(shi)AI，但并(bing)非每(mei)個企(qi)業都(dou)擁有專門的(de)(de)AI研究團隊。NVIDIA NIM可被集(ji)成到(dao)(dao)任意平臺中(zhong)，任何地方的(de)(de)開發者都(dou)可以訪問(wen)，并(bing)且可以在任意環境(jing)中(zhong)運行。”黃仁勛稱。

《每日(ri)經(jing)濟新聞》記者了解到(dao)，NIM是預(yu)先構建的(de)，目前有近40個模型可作為NIM的(de)端點(dian)供開發者體(ti)驗；開發人員可從(cong)開源(yuan)社區平臺Hugging Face訪問適用于Meta Llama 3模型的(de)NVIDIA NIM微服務，使用Hugging Face推理端點(dian)訪問和(he)運行Llama 3 NIM。

值得注意的是(shi)，英偉達還透露了一批大客戶的使用(yong)情況(kuang)，如電子(zi)制造商Foxconn正在(zai)使用(yong)NIM開發(fa)針(zhen)對特定領域(yu)的大語言模型（LLM），用(yong)于(yu)智(zhi)(zhi)能制造、智(zhi)(zhi)慧城市和智(zhi)(zhi)能電動汽車；和碩正在(zai)將NIM用(yong)于(yu)一個當地的混合(he)(he)專家（MoE）模型；勞氏公司(si)(si)正在(zai)用(yong)NVIDIA NIM推理微服(fu)務來提升員工(gong)和客戶的體驗；西(xi)門子(zi)正在(zai)將其運營技術與NIM微服(fu)務整合(he)(he)，用(yong)于(yu)車間AI工(gong)作負載(zai)；還有(you)數十(shi)家醫療保(bao)健(jian)公司(si)(si)正在(zai)部署NIM，為包(bao)括手術規(gui)劃(hua)、數字(zi)助理、藥物發(fa)現和臨(lin)床(chuang)試驗優化等在(zai)內的應用(yong)領域(yu)的生成式AI推理提供支持。

Blackwell開始投產

除了(le)上述產品，黃仁勛還在(zai)演講中透露，英偉達(da)Blackwell芯(xin)片已開始投(tou)產，并將在(zai)2025年推出(chu)Blackwell Ultra AI芯(xin)片。

今年(nian)5月，黃(huang)仁勛(xun)在財(cai)(cai)報電(dian)話(hua)會上稱(cheng)，預計今年(nian)Blackwell架構芯片(pian)(pian)將為公司帶來大量收入(ru)。英(ying)偉(wei)達對Blackwell芯片(pian)(pian)寄予厚(hou)望，還(huan)是(shi)與市場(chang)強勁(jing)需(xu)求(qiu)有(you)關。從最新披露(lu)的財(cai)(cai)報數據來看，2025財(cai)(cai)年(nian)第一(yi)財(cai)(cai)季，英(ying)偉(wei)達實現營收260億美(mei)元，較(jiao)上年(nian)同(tong)期增長(chang)262%。其中，數據中心業務營收226億美(mei)元，與上年(nian)同(tong)期相比增長(chang)427%，是(shi)業績收入(ru)的“大頭”。

據英(ying)偉(wei)達首席財務(wu)官科萊(lai)特·克雷斯（Colette Kress）解讀，數據中心(xin)業務(wu)的增長源自Hopper架構GPU（例如H100）出(chu)貨量(liang)的增加；該季度的重要亮點之一就(jiu)是Meta宣布推出(chu)Llama 3 開源大模型(xing)，使用了(le)近2.4萬(wan)塊H100GPU。

除了披(pi)露芯片量產進度，英偉達此(ci)次還推出了一系(xi)列采用(yong)NVIDIA Blackwell架構的系(xi)統。

據(ju)悉，這些系統搭載了Grace CPU以及NVIDIA網絡和(he)基(ji)礎設施(shi)，用于助力企業建立AI工廠(chang)和(he)數(shu)據(ju)中(zhong)心。其中(zhong)，NVIDIA MGX模塊化參考設計(ji)平臺加入了對NVIDIA Blackwell產(chan)品的支持，包(bao)括專(zhuan)為主流大(da)語言模型推(tui)理、檢索增(zeng)強生成和(he)數(shu)據(ju)處(chu)理提供(gong)卓越性能打造的 NVIDIA GB200 NVL2平臺。

英偉達強調，GB200 NVL2適(shi)合用于數據(ju)(ju)分析等新興領域，借助NVLink—C2C互連技術帶來的(de)(de)帶寬內存性能(neng)(neng)及Blackwell架構中專有的(de)(de)解壓縮引擎(qing)，較使用X86CPU時的(de)(de)數據(ju)(ju)處理(li)速度可最(zui)多(duo)提速到18倍，能(neng)(neng)效提高8倍。“新一(yi)輪工業(ye)革命已經開始，眾多(duo)企業(ye)和地區正在(zai)與(yu)NVIDIA合作推動價值萬(wan)億美(mei)元的(de)(de)傳統數據(ju)(ju)中心(xin)向(xiang)加速計算轉型，并建造一(yi)種(zhong)新型數據(ju)(ju)中心(xin)AI工廠來生產新的(de)(de)商(shang)品，人(ren)工智能(neng)(neng)。”黃仁勛稱。

英偉(wei)達(da)方面表示，目前已(yi)有超過25家合作伙(huo)伴的90多(duo)套已(yi)發布(bu)或正在開(kai)發中的系統使用了MGX參考架(jia)構，開(kai)發成本較之(zhi)前最多(duo)降低了四分之(zhi)三，開(kai)發時間(jian)縮短到(dao)六(liu)個月，較之(zhi)前減少了三分之(zhi)二。另外，英偉(wei)達(da)還透露，比(bi)亞(ya)迪電(dian)子、西(xi)門子、泰瑞達(da)和(he)(he)Alphabet旗下公司Intrinsic等(deng)全(quan)球10多(duo)家機器(qi)人企業正在將(jiang)NVIDIA Isaac加(jia)速庫(ku)、基于物(wu)理學(xue)的仿真(zhen)和(he)(he)AI模(mo)(mo)型(xing)集成到(dao)其軟(ruan)件框架(jia)和(he)(he)機器(qi)人模(mo)(mo)型(xing)中，以此提(ti)高工(gong)廠(chang)、倉庫(ku)和(he)(he)配送中心的工(gong)作效率。

封面圖(tu)片來(lai)源：視(shi)覺中(zhong)國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟(ji)新聞》報社授權，嚴禁轉載或鏡像(xiang)，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您(nin)(nin)不希望作品(pin)出現在(zai)本站，可聯系(xi)我們要求撤下您(nin)(nin)的作品(pin)。

Ai 英偉達 AI芯片(pian)

上一篇文章

有門店(dian)串換藥品、超量開藥一(yi)心堂被國(guo)家醫保(bao)局約談

返回每經網首頁

下一篇文章

精典汽車（871644）：約(yue)1701萬股的股份過戶(hu)至四(si)川天府銀行股份有限公司(si)成都分行名下