每日經濟新聞 2024-06-04 00:16:15
每經(jing)記者|楊(yang)卉 每經(jing)編輯|陳俊杰
6月2日晚間(jian),英偉達(da)創始人兼首席執行官黃仁勛登臺演講,透露(lu)了不(bu)少關鍵信(xin)息(xi)。據他(ta)介紹(shao),使(shi)用NVIDIA NIM將AI模型部署(shu)在云、數據中心或工(gong)作(zuo)站上的開發者,可將模型部署(shu)時間(jian)從(cong)以前(qian)的數周縮短(duan)至幾分鐘。和碩、勞(lao)氏公司、西門(men)子等客戶均在使(shi)用。

視覺中國
此外,被英偉達寄予厚(hou)望的新一代AI芯(xin)(xin)片與超級計算平臺Blackwell芯(xin)(xin)片已開(kai)始投(tou)產,預(yu)計將在2025年(nian)推出Blackwell Ultra AI芯(xin)(xin)片。
據悉,英偉達的(de)第(di)一款Blackwell芯片名為(wei)GB200,宣(xuan)稱是(shi)目(mu)前“全球最強大的(de)芯片”。目(mu)前,供應(ying)鏈對(dui)GB200寄予厚望(wang),預估2025年出貨量有機會突破百萬顆,將占英偉達高端GPU出貨量的(de)近40%~50%。
NIM大幅加快模型部署
6月2日晚間,一身(shen)皮衣的黃仁勛又在(zai)舞臺(tai)上擺弄起了(le)自家產品,重磅介紹了(le)NVIDIA NIM,一種(zhong)推(tui)理(li)微服務,可通過經優化的容器形式提供模(mo)型,旨在(zai)助(zhu)力各(ge)種(zhong)規模(mo)企業部署(shu)AI服務。
不過,嚴格來說,NVIDIA NIM并非新(xin)品,最早露面是在(zai)今(jin)年3月。英偉達(da)在(zai)6月2日(ri)晚間宣(xuan)布,全(quan)球2800萬開(kai)(kai)發者(zhe)皆可(ke)下載(zai)NVIDIA NIM,將AI模(mo)型部署在(zai)云、數據中心(xin)或(huo)工作站上,構建Copilot(微軟的AI助理)、ChatGPT聊(liao)天機器人等生成式AI應用(yong)。下月起,NVIDIA開(kai)(kai)發者(zhe)計劃的會員(yuan)可(ke)免費使(shi)用(yong)NIM,在(zai)其選擇(ze)的基(ji)礎設施(shi)上進行研究、開(kai)(kai)發和測試。
根據英偉(wei)達的(de)(de)(de)說法,新(xin)的(de)(de)(de)生(sheng)成式AI應用(yong)正變得越來越復雜(za),通常需要使用(yong)具有不同功能的(de)(de)(de)多個(ge)模型(xing)來生(sheng)成文本,如圖(tu)像、視(shi)頻、語(yu)音等。而(er)NVIDIA NIM提供了一種(zhong)簡單(dan)、標準化的(de)(de)(de)方式,將生(sheng)成式AI添加到應用(yong)中,可使模型(xing)部署時間從以前的(de)(de)(de)數周縮短(duan)至幾分鐘。
黃仁勛還透露,包括Cadence、 Cloudera、 Cohesity、DataStax、NetApp、Scale AI和新(xin)思科(ke)技等在內的(de)(de)近200家技術合作伙伴正在將(jiang)NIM集(ji)成到(dao)(dao)他們的(de)(de)平臺中(zhong),以加快生(sheng)成式(shi)AI的(de)(de)部署。“每(mei)個企(qi)業都(dou)希望在其運營(ying)中(zhong)融入生(sheng)成式(shi)AI,但并(bing)非每(mei)個企(qi)業都(dou)擁有專門的(de)(de)AI研究團隊。NVIDIA NIM可被集(ji)成到(dao)(dao)任意平臺中(zhong),任何地方的(de)(de)開發者都(dou)可以訪問(wen),并(bing)且可以在任意環境(jing)中(zhong)運行。”黃仁勛稱。
《每日(ri)經(jing)濟新聞》記者了解到(dao),NIM是預(yu)先構建的(de),目前有近40個模型可作為NIM的(de)端點(dian)供開發者體(ti)驗;開發人員可從(cong)開源(yuan)社區平臺Hugging Face訪問適用于Meta Llama 3模型的(de)NVIDIA NIM微服務,使用Hugging Face推理端點(dian)訪問和(he)運行Llama 3 NIM。
值得注意的是(shi),英偉達還透露了一批大客戶的使用(yong)情況(kuang),如電子(zi)制造商Foxconn正在(zai)使用(yong)NIM開發(fa)針(zhen)對特定領域(yu)的大語言模型(LLM),用(yong)于(yu)智(zhi)(zhi)能制造、智(zhi)(zhi)慧城市和智(zhi)(zhi)能電動汽車;和碩正在(zai)將NIM用(yong)于(yu)一個當地的混合(he)(he)專家(MoE)模型;勞氏公司(si)(si)正在(zai)用(yong)NVIDIA NIM推理微服(fu)務來提升員工(gong)和客戶的體驗;西(xi)門子(zi)正在(zai)將其運營技術與NIM微服(fu)務整合(he)(he),用(yong)于(yu)車間AI工(gong)作負載(zai);還有(you)數十(shi)家醫療保(bao)健(jian)公司(si)(si)正在(zai)部署NIM,為包(bao)括手術規(gui)劃(hua)、數字(zi)助理、藥物發(fa)現和臨(lin)床(chuang)試驗優化等在(zai)內的應用(yong)領域(yu)的生成式AI推理提供支持。
Blackwell開始投產
除了(le)上述產品,黃仁勛還在(zai)演講中透露,英偉達(da)Blackwell芯(xin)片已開始投(tou)產,并將在(zai)2025年推出(chu)Blackwell Ultra AI芯(xin)片。
今年(nian)5月,黃(huang)仁勛(xun)在財(cai)(cai)報電(dian)話(hua)會上稱(cheng),預計今年(nian)Blackwell架構芯片(pian)(pian)將為公司帶來大量收入(ru)。英(ying)偉(wei)達對Blackwell芯片(pian)(pian)寄予厚(hou)望,還(huan)是(shi)與市場(chang)強勁(jing)需(xu)求(qiu)有(you)關。從最新披露(lu)的財(cai)(cai)報數據來看,2025財(cai)(cai)年(nian)第一(yi)財(cai)(cai)季,英(ying)偉(wei)達實現營收260億美(mei)元,較(jiao)上年(nian)同(tong)期增長(chang)262%。其中,數據中心業務營收226億美(mei)元,與上年(nian)同(tong)期相比增長(chang)427%,是(shi)業績收入(ru)的“大頭”。
據英(ying)偉(wei)達首席財務(wu)官科萊(lai)特·克雷斯(Colette Kress)解讀,數據中心(xin)業務(wu)的增長源自Hopper架構GPU(例如H100)出(chu)貨量(liang)的增加;該季度的重要亮點之一就(jiu)是Meta宣布推出(chu)Llama 3 開源大模型(xing),使用了(le)近2.4萬(wan)塊H100GPU。
除了披(pi)露芯片量產進度,英偉達此(ci)次還推出了一系(xi)列采用(yong)NVIDIA Blackwell架構的系(xi)統。
據(ju)悉,這些系統搭載了Grace CPU以及NVIDIA網絡和(he)基(ji)礎設施(shi),用于助力企業建立AI工廠(chang)和(he)數(shu)據(ju)中(zhong)心。其中(zhong),NVIDIA MGX模塊化參考設計(ji)平臺加入了對NVIDIA Blackwell產(chan)品的支持,包(bao)括專(zhuan)為主流大(da)語言模型推(tui)理、檢索增(zeng)強生成和(he)數(shu)據(ju)處(chu)理提供(gong)卓 越 性 能 打 造 的 NVIDIA GB200 NVL2平臺。
英偉達強調,GB200 NVL2適(shi)合用于數據(ju)(ju)分析等新興領域,借助NVLink—C2C互連技術帶來的(de)(de)帶寬內存性能(neng)(neng)及Blackwell架構中專有的(de)(de)解壓縮引擎(qing),較使用X86CPU時的(de)(de)數據(ju)(ju)處理(li)速度可最(zui)多(duo)提速到18倍,能(neng)(neng)效提高8倍。“新一(yi)輪工業(ye)革命已經開始,眾多(duo)企業(ye)和地區正在(zai)與(yu)NVIDIA合作推動價值萬(wan)億美(mei)元的(de)(de)傳統數據(ju)(ju)中心(xin)向(xiang)加速計算轉型,并建造一(yi)種(zhong)新型數據(ju)(ju)中心(xin)AI工廠來生產新的(de)(de)商(shang)品,人(ren)工智能(neng)(neng)。”黃仁勛稱。
英偉(wei)達(da)方面表示,目前已(yi)有超過25家合作伙(huo)伴的90多(duo)套已(yi)發布(bu)或正在開(kai)發中的系統使用了MGX參考架(jia)構,開(kai)發成本較之(zhi)前最多(duo)降低了四分之(zhi)三,開(kai)發時間(jian)縮短到(dao)六(liu)個月,較之(zhi)前減少了三分之(zhi)二。另外,英偉(wei)達(da)還透露,比(bi)亞(ya)迪電(dian)子、西(xi)門子、泰瑞達(da)和(he)(he)Alphabet旗下公司Intrinsic等(deng)全(quan)球10多(duo)家機器(qi)人企業正在將(jiang)NVIDIA Isaac加(jia)速庫(ku)、基于物(wu)理學(xue)的仿真(zhen)和(he)(he)AI模(mo)(mo)型(xing)集成到(dao)其軟(ruan)件框架(jia)和(he)(he)機器(qi)人模(mo)(mo)型(xing)中,以此提(ti)高工(gong)廠(chang)、倉庫(ku)和(he)(he)配送中心的工(gong)作效率。
封面圖(tu)片來(lai)源:視(shi)覺中(zhong)國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟(ji)新聞》報社授權,嚴禁轉載或鏡像(xiang),違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您(nin)(nin)不希望作品(pin)出現在(zai)本站,可聯系(xi)我們要求撤下您(nin)(nin)的作品(pin)。
歡(huan)迎關注每日經濟(ji)新聞(wen)APP