每日經濟新聞 2025-01-20 22:08:49
每經(jing)記者|鄭雨(yu)航 實習(xi)記者 岳楚鵬 每經(jing)編(bian)輯|蘭(lan)素英
近日,OpenAI公司(si)CEO阿(a)爾特(te)曼(man)又在(zai)X平臺上放(fang)出旗下產品的最新消息。
據(ju)他透露,最(zui)新的o3-mini推理模型(xing)預計將(jiang)在(zai)幾(ji)周內(nei)正式(shi)推出。他強調,o3-mini的表現“非常出色”。除此之外,阿爾特曼在(zai)回(hui)答網友提問時表示,希(xi)望(wang)在(zai)2025年(nian)將(jiang)GPT系(xi)列和(he)o系(xi)列合并。也(ye)許,一個結(jie)合GPT系(xi)列的強大語(yu)言理解能力和(he)o系(xi)列的快速推理能力的強大AI模型(xing)將(jiang)在(zai)2025年(nian)誕生。
至于最受公眾期待的GPT-5相(xiang)關(guan)問(wen)題,阿爾特(te)曼(man)沒(mei)有給出具體的時間表和性(xing)能指(zhi)標(biao),只是(shi)表示“仍在確定中,但(dan)我認為你們會滿意(yi)的”。
AI 專(zhuan) 欄 作 家(jia) Alberto Romero在個(ge)人博客(ke)里猜測GPT-5可(ke)能早就開發好了(le),但(dan)OpenAI或許參考了(le)競(jing)爭對手(shou)Anthropic的做法(fa),將其用(yong)于模(mo)型蒸餾,以(yi)提升其他(ta)功能稍(shao)差(cha)、價(jia)格更便宜的模(mo)型的性能。他(ta)認為,GPT-5或許永(yong)遠也不會對外發布(bu)了(le)。
專注于推理速度和效率
近日,阿(a)爾(er)特曼(man)在X平臺上透露了(le)一系列(lie)關(guan)于OpenAI新(xin)模型開發(fa)和發(fa)布的消息。
阿爾特曼(man)在(zai)推文中感謝了外部安全研究人員(yuan)對最新o3-mini模型(xing)的(de)測試,然后稱(cheng),o3-mini的(de)最終版本已經確定,并進入發布流程,計(ji)劃將在(zai)幾周內正式推出。同時,針(zhen)對之前的(de)反饋意見,API(應用程序(xu)編(bian)程接口)和ChatGPT版本將同步(bu)發布。阿爾特曼(man)還特別強調,o3-mini的(de)表(biao)現(xian)“非常棒”。
在這條推文下(xia),阿爾特(te)曼還回答(da)了許多網友(you)關(guan)心的(de)問題。
比如,有網(wang)友(you)問:即(ji)將推出的(de)o3-mini和o1 pro相(xiang)比,誰(shui)更強(qiang)?對此(ci),阿爾特曼表示,o3-mini在大多(duo)數方面比o1 pro要差一些,但其(qi)最大優勢在于(yu)速度極快。o3mini是一個(ge)專(zhuan)注于(yu)推理速度和效率的(de)模(mo)型,適(shi)合對響應時間要求較高(gao)的(de)應用場景(jing)。
阿爾特(te)曼明確表示(shi),o3-mini的(de)(de)消息速率“非常高”,Plus用戶屆(jie)時可以使(shi)用。據(ju)他透(tou)露,OpenAI在計劃推出更智能的(de)(de)o3模型(xing),o3 pro的(de)(de)訂(ding)閱(yue)費為一個(ge)月200美(mei)元(yuan)。
專家猜測GPT-5已完成
關于GPT系(xi)(xi)列的(de)(de)未來,阿爾特(te)曼表(biao)示,“希望(wang)在2025年(nian)將GPT系(xi)(xi)列和(he)o系(xi)(xi)列合(he)并。”如果他的(de)(de)想(xiang)法(fa)實現,那外界有望(wang)在今(jin)年(nian)見到一個(ge)融(rong)合(he)GPT系(xi)(xi)列的(de)(de)強(qiang)大語言理解能(neng)力和(he)o系(xi)(xi)列快速推(tui)理能(neng)力的(de)(de)強(qiang)大AI模型(xing)。
當(dang)被(bei)問及關于(yu)GPT-5的發布(bu)時間(jian)和性能表現時,阿(a)爾特曼表示:“仍在確定中,但我(wo)認(ren)為你們(men)會開心的。”阿(a)爾特曼的回(hui)答耐人尋味,或(huo)許GPT-5的發布(bu)也很快將被(bei)提上日程。
此前有(you)人猜測(ce),GPT-5的內部(bu)開發已經(jing)完(wan)成,只是(shi)回報率不夠高,遠(yuan)沒有(you)內部(bu)使用(yong)來的好(hao)處大,比(bi)如用(yong)于模型蒸餾。
當地(di)時間(jian)1月17日,AI專欄作家Alberto Romero在個人博(bo)客上發表(biao)了一篇關(guan)于(yu)GPT-5的(de)深度分(fen)(fen)析文章,他通過一系列推理分(fen)(fen)析提出(chu)一個令人震驚的(de)猜(cai)測:“OpenAI很可能已經開(kai)發出(chu)了GPT-5,但選擇將其(qi)內部保留,而不是公開(kai)發布。”并且,OpenAI或許(xu)不會(hui)很快(kuai)發布GPT-5,除(chu)非還有更好的(de)模型(xing)(GPT-6)被訓練出(chu)來。
Romero的證據來自OpenAI的最大競爭(zheng)對手Anthropic。2024年10月,業界(jie)普遍預期Anthropic會發(fa)布3.5 Opus作為對GPT-4o的回應,但出人意(yi)料的是(shi),該公司只(zhi)更新(xin)了Claude 3.5 Sonnet版本。次月,彭博社報道稱,3.5Opus訓(xun)練(lian)后(hou)表現雖優(you)于舊(jiu)版,但因(yin)模型大小(xiao)及成本,優(you)勢未達預期。Anthropic之(zhi)所以(yi)不(bu)(bu)推出3.5Opus,是(shi)因(yin)為成本和性能并不(bu)(bu)匹配,雖然3.5 Opus訓(xun)練(lian)未失敗,但結果不(bu)(bu)佳(jia)。
2024年12月,半導體專家(jia)Dylan Patel及(ji)其(qi)團隊(dui)稱(cheng),Anthropic實際上已(yi)經完成(cheng)Claude3.5 Opus訓練且表現良好(hao)。未發(fa)布(bu)的原因(yin)是,Anthropic使(shi)用Claude 3.5 Opus來(lai)生(sheng)成(cheng)合成(cheng)數(shu)據并進行獎(jiang)勵建模,Claude 3.5Sonnet更新(xin)版(ban)本(ben)就是獎(jiang)勵建模的成(cheng)果。
使(shi)用功能強大、價格(ge)昂貴(gui)的模型(xing)(xing)來生成數據,從而提升功能稍差(cha)、價格(ge)更便宜的模型(xing)(xing)的性能,這一過程被(bei)稱(cheng)為蒸餾(liu)。這是一種(zhong)常見(jian)的做法。此前在國內(nei)引(yin)起(qi)轟動的DeepSeek-V3模型(xing)(xing)也使(shi)用了(le)這一方法。
Dylan表示(shi),Anthropic選擇不發布3.5 Opus,因(yin)為它在內部更有價值。這也就是開源社(she)區(qu)如此迅速趕上(shang)GPT-4的(de)原因(yin),他們直接從OpenAI的(de)礦山(shan)中(zhong)獲(huo)取黃(huang)金。
Romero認為,OpenAI可能(neng)也在采(cai)用類(lei)似的方法處理GPT-5。由于最新(xin)的模(mo)(mo)型(xing)不(bu)僅性能(neng)更好,而且比上一代更小、更便宜(yi),OpenAI可能(neng)也在通過(guo)蒸餾(liu)技(ji)術來提升(sheng)其模(mo)(mo)型(xing)性能(neng),同時控制成本。Romero稱,也許這就是OpenAI在短(duan)短(duan)3個月內從o1躍(yue)升(sheng)至o3的原因。
隨著(zhu)時間(jian)的推移,GPT-5 需(xu)要達到的門檻(jian)不斷(duan)提高(gao),公眾(zhong)對于GPT-5的期待也(ye)越(yue)來越(yue)高(gao)。
華(hua)爾街日報(bao)對GPT-5的(de)報(bao)道(dao),與彭博(bo)社對3.5 Opus的(de)評價幾乎一致。“OpenAI意(yi)識(shi)到GPT-5比目前的(de)產(chan)品表現更好,但還未好到足以證明維持(GPT-5)運行的(de)巨大成本是(shi)合理(li)的(de)。”
Romero認(ren)為,OpenAI或許永遠也不會推出GPT-5了,“現(xian)在(zai)對他(ta)們(指的是(shi)OpenAI)來(lai)說唯一重要的目標是(shi),繼續為下一代(dai)模(mo)型生成(cheng)更好(hao)的數據(ju)。從現(xian)在(zai)開始,基(ji)礎模(mo)型可能會在(zai)后臺運(yun)行,使其(qi)他(ta)模(mo)型能夠實現(xian)它們自(zi)己無法完(wan)成(cheng)的壯舉——就像一位老隱士從秘密的山(shan)(shan)洞中(zhong)傳(chuan)授智慧,只不過這(zhe)個山(shan)(shan)洞是(shi)一個巨大的數據(ju)中(zhong)心。”
封(feng)面圖片來(lai)源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每日經(jing)濟新聞》報社授權,嚴禁轉(zhuan)載(zai)或鏡像,違者必究。
讀者熱線:4008890008
特(te)別提(ti)醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您(nin)不希望作品出(chu)現在本站,可聯系(xi)我們要(yao)求撤下您(nin)的作品。
歡迎關注每日(ri)經(jing)濟(ji)新聞(wen)APP