暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文(wen)

GPT-5來了,微軟搶先接入:一鍵生成網頁、博士級智能,所有用戶免費使用;馬斯克不服

每(mei)日經(jing)濟新聞 2025-08-08 12:39:32

每(mei)經編輯|程鵬 杜宇    ; 

當地時間8月7日,OpenAI推出大型語言模型GPT-5,這一成果歷經多次推遲后終于面世。這距離GPT-4的發布已過去了兩年半。OpenAI稱(cheng)它是(shi)“世界上最好的(de)模型”,將(jiang)免費提供(gong)給用(yong)戶。

 

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5AdxKPDVKP5x0cUZjccibCuLa4bUfrNWibiahy2BSicwnlMdhIKXPRrn1g.jpg圖片(pian)來源:OpenAI官網

 

首席執行(xing)官山姆(mu)·奧爾特曼在(zai)發布會上形容,與(yu)GPT-5對話“就像在與(yu)某個領域的博士級(ji)專家交流”。這一版本首次(ci)采(cai)用(yong)集成模型架構,將根(gen)據任務(wu)自動選擇推理深度(du),無需用戶切(qie)換模式。

 

目前Plus、Pro、團隊和免費用(yong)(yong)戶(hu)均已接入GPT-5,企(qi)業版(ban)與(yu)教(jiao)育版(ban)用(yong)(yong)戶(hu)預(yu)計(ji)將在(zai)一周內覆蓋(gai),免費用(yong)(yong)戶(hu)將在(zai)數天(tian)內完成覆蓋(gai)。

 

也有業內人士認為GPT-5“不夠驚艷”,馬(ma)斯(si)克(ke)在社交媒體表示“不(bu)服”稱(cheng),GPT-5在ARC-AGI-2上沒有打敗(bai)Grok 4。

 

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDYlc8pH5aShZ1voYnrticAlqKFW77n50fibicMWTK3D2g4NLOiaDPZZl1Iw.png

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

面向所有用戶開放

OpenAI在新(xin)聞(wen)稿(gao)中寫道,GPT-5的智(zhi)能性能遠超公司(si)之前的所有(you)模型,在編碼、數學、寫作(zuo)、健康、視覺感(gan)知等(deng)領(ling)域均擁有(you)卓越(yue)的性能。

聲明補充稱(cheng),GPT-5是一個統(tong)一的(de)系統(tong),能夠識別何時快(kuai)速響應,何時需要更長時間(jian)的(de)思(si)考(kao)以提供專家級的(de)應答,不必由用(yong)戶手動選擇使用(yong)常(chang)規語言模型還是推理系統(tong)。

OpenAI表示,GPT-5將(jiang)面向所有(you)(you)(you)用(yong)戶開放。即C端免費用(yong)戶也可(ke)以使用(yong)GPT-5,但(dan)有(you)(you)(you)使用(yong)次(ci)數限(xian)制(zhi),每天可(ke)以聊“幾個小時(shi)”,當達到(dao)上限(xian)后(hou),會自動切(qie)換到(dao)GPT-5 mini模型。Plus用(yong)戶則(ze)將(jiang)擁有(you)(you)(you)比免費用(yong)戶“高得多”的使用(yong)額度 ,基本(ben)滿足日(ri)常(chang)應用(yong)。Pro會員(yuan)則(ze)可(ke)訪問GPT-5 Pro版本(ben)——該(gai)版本(ben)具有(you)(you)(you)擴展推理(li)能力,可(ke)提供更全(quan)面、更準(zhun)確的答案。

對于開發者API用戶來講,GPT-5幾乎給出了(le)一個難以拒絕的價格:每百(bai)萬token輸入1.25美元,輸出10美元。這個價格不僅比GPT 4o便宜(yi),也僅為Claude Opus 4.1的1/15,甚至比一直以“低價”著稱的Gemini 2.5 Pro更便宜(yi)。

先(xian)前,OpenAI首席執行官薩姆·奧爾(er)特曼(Sam Altman)稱GPT-5是(shi)一次“重(zhong)大升級”。

ChatGPT團隊負(fu)責人(ren)Nick Turley表示,新模(mo)型在響應(ying)速(su)度、回答準確性(xing)以及減少“幻(huan)覺”方面都優于前(qian)代產品,“你跟它對(dui)話時(shi),會感覺自然了不少。”

在8月7日的(de)(de)簡報會上,奧(ao)爾特曼對(dui)GPT-5給予(yu)了極高(gao)評價,將GPT-5定位為通往(wang)AGI的(de)(de)重要里程碑(bei)。他表示:“在以往(wang)歷史上任何(he)時期(qi),擁有(you)像(xiang)GPT-5這(zhe)樣(yang)的(de)(de)東(dong)西(xi)都(dou)是(shi)不可想(xiang)象的(de)(de)。”

“這是第一次感(gan)覺(jue)就像在與任何領域的(de)專家交談。”Altman在簡報會上甚至不惜用(yong)“踩”GPT-4抬高GPT-5。他說:“我嘗試過用(yong)回(hui)GPT-4,但效果相當糟糕。”

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaem0yEEjibMAYXxlops1ibNpD0gjibRnLFay92sTRnn838hsJS4Px7OMMoA.jpg圖片(pian)來源(yuan):視(shi)覺中國

 

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

一鍵生成網頁、像詩人一樣寫(xie)作(zuo)

更懂健康問題

根據OpenAI介紹,作為OpenAI的“最強大模型”,GPT-5在三個關鍵領域實現了顯著提升。

 

首先是編程能力。GPT-5是OpenAI迄今為止最強大的編碼模型,在復雜的前端生成和大型代碼庫調試方面表現突出,能夠僅憑一個提示就創建美觀響應式的網站、應用程序App和游戲。早(zao)期測試者注意到其在間(jian)距、排版和留白(bai)等設(she)計(ji)選(xuan)擇方面的改進。

在從GitHub獲(huo)取現實(shi)世界(jie)編碼任務的基準(zhun)測試SWE-bench Verified中,GPT-5思考后首次嘗試的準(zhun)確率達74.9%,高于(yu)OpenAI推(tui)理(li)模型o3的69.1%和GPT-4o的30.8%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaelzULGYPxlEeMsrSzvaAibO197CrVGmONK0SD8lSmQ0dC7gGF6eYF8sQ.jpg

評論指出,這意味著,GPT-5的表現(xian)略勝于Anthropic周二推(tui)出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro,后兩者(zhe)在SWE-bench Verified測試的得分分別為74.5%和59.6%。

不過,在衡量數學(xue)(xue)、人(ren)文和自(zi)然科學(xue)(xue)領域模型表(biao)現的(de)各學(xue)(xue)科專家(jia)級(ji)能力Humanity’s Last Exam測試中,帶有擴展推理功能的(de)GPT-5增強版本GPT-5 pro在使用工具的(de)情況下得分(fen)42%。這略低于得分(fen)44.4%的(de)xAI模型Grok 4 Heavy。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaez6V93mYYS166ODQzha7trFPmmlONnNwnWBLjp2moDoRG21F76TkYKg.jpg

奧爾(er)特(te)曼(man)稱(cheng),GPT-5尤其擅長按需啟(qi)動整個軟件App,也就是所謂的“氛圍編碼”、即用AI根(gen)據自然語言提(ti)示生(sheng)成功能(neng)代(dai)碼,從而加快開發速(su)度。

作為實例,OpenAI的研究者演示了,要求GPT-5創建一款網頁App,幫助(zhu)說英語的(de)用戶學(xue)(xue)習法(fa)(fa)語,且該App必須有一個(ge)引人入(ru)勝的(de)主題,包含(han)抽認卡、測驗、經典的(de)貪吃(chi)蛇游戲,以及追蹤每日學(xue)(xue)習進(jin)度的(de)方法(fa)(fa)。

研究者將相同的提示詞提交到兩個GPT-5 窗口中,幾分鐘后生成了兩個不同的App。OpenAI的(de)負責人(ren)稱,這(zhe)些(xie)App“存(cun)在一些(xie)缺陷(xian)”,但用戶(hu)可以根據個人(ren)喜好再調(diao)整AI生成(cheng)的(de)軟(ruan)件,例如更改背景或(huo)添加更多(duo)標(biao)簽(qian)頁。

在創意寫作方面,GPT-5能夠處理結構復雜的寫作任務,如無韻律的抑揚格五音步詩或自然流動的自由詩,猶如詩人。OpenAI的ChatGPT業務(wu)副總Nick Turley表示(shi),GPT-5在(zai)創意任務(wu)上表現出(chu)“更(geng)好的品味(wei)”,響(xiang)應更(geng)自然(ran)。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaecO2DKtR4iciaK5OTc4TaiaqlQBbC3Z86IO7ssemDfIpLhd9aqIzX46slA.jpg

 

健康咨詢是第三個重要提升領域。

 

GPT-5能(neng)更積極地(di)標記潛在健康問題,幫(bang)助用戶解析醫(yi)療(liao)結果(guo),盡管(guan)OpenAI強調(diao),ChatGPT不(bu)能(neng)替代醫(yi)療(liao)專業人員。

在名為(wei)(wei)HealthBench Hard Hallucinations的(de)測試(shi)中,具備思考能(neng)力的(de)GPT-5出現幻覺(jue)的(de)錯(cuo)誤信息率僅為(wei)(wei)1.6%。這遠低于(yu)GPT-4o和o3模型(xing),后兩者的(de)錯(cuo)誤信息率分別為(wei)(wei)15.8%和12.9%。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

幻覺可(ke)能性(xing)顯著降低 新的安全訓練模式

OpenAI稱,GPT-5相比此前的模型更可靠和實用,它能更準確地回答現實世界的疑問,出現幻覺的可能性顯著降低。

 

在對(dui)代表(biao)ChatGPT生產流量的匿名提示(shi)詞啟用(yong)網絡(luo)搜索后,GPT-5響(xiang)應(ying)中包含事實(shi)錯(cuo)誤(wu)的可能(neng)性(xing)(xing)比GPT-4o低約45%;在思考后,GPT-5響(xiang)應(ying)中包含事實(shi)錯(cuo)誤(wu)的可能(neng)性(xing)(xing)比o3低約 80%。下圖(tu)可見(jian),GPT-5響(xiang)應(ying)的錯(cuo)誤(wu)信息率僅為4.8%,GPT-4o為20.6%,o3為22%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5LMlQqMUxahdyMAhIibFibcxFexiaWYks1WfQ9qSicuCb7SfU9a0DCc50A.jpg

OpenAI還表示,為GPT-5引入了一種新的安全訓練形式,名為安全補全(safe completions)。它教模型在安全范圍內盡可能給出最有幫助的答案。有時(shi),這(zhe)可(ke)能意味(wei)著部(bu)分回答用戶的(de)問題,或者只提供高(gao)水平(ping)的(de)回答。

如果需要拒(ju)絕(jue),經過訓練的GPT-5會(hui)以透明的方式告(gao)知(zhi)用戶拒(ju)絕(jue)的原因,并提供(gong)安全(quan)的替代方案。

在受控(kong)的(de)(de)實驗和OpenAI的(de)(de)生產模型中,OpenAI都發(fa)現(xian)這種(zhong)安(an)全補全的(de)(de)方法更加細致入微,能(neng)夠更好(hao)地(di)引導(dao)雙重用(yong)途問(wen)題,增強對(dui)模糊意圖(tu)的(de)(de)魯棒性,并減少不必要(yao)的(de)(de)過度拒絕。

OpenAI的后訓練負責人Michelle Pokrass表(biao)示:“GPT-5已經過訓練,能(neng)夠識(shi)別(bie)任務何時無(wu)法完成,避免猜測,并能(neng)更清晰(xi)地解釋局(ju)限性,相比之前(qian)的模型,這減(jian)少了(le)無(wu)根據的斷言。”

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

推出四種可選(xuan)的 ChatGPT聊天預設(she)性格

OpenAI稱(cheng),GPT-5在指(zhi)令(ling)執行方面(mian)表(biao)現提升(sheng),其執行自定(ding)義指(zhi)令(ling)的(de)能力也得到了相(xiang)應的(de)提升(sheng)。OpenAI將為(wei)所有ChatGPT用戶推出四種預設性格的(de)全新研究預覽(lan)版(ban)。

初始的四種性格選項——憤世嫉俗者(Cynic)、機器人(Robot)、傾聽者(Listener)和書呆子(Nerd)都是可選的,用(yong)戶可在設置中隨時(shi)調整,用(yong)以匹配ChatGPT和用(yong)戶的溝通風(feng)格。

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDF0kOofUYrxRfMz4UeQxskM1IbGXUy6U1aeyXjGEO9JLAkGdriaObCCA.png

上(shang)述四(si)種(zhong)性格最初適用于(yu)文本聊天,之后將擴展到語音聊天,讓用戶無(wu)需編寫自定(ding)義提示詞(ci)即可設置ChatGPT的交互方(fang)式——無(wu)論是簡潔(jie)專業的、周到支(zhi)持的,還是略帶(dai)諷刺(ci)的。

此外,微軟在GPT-5發布當日即(ji)宣(xuan)布,將其(qi)整合到(dao)廣泛的產品線中。在企業級應用(yong)(yong)方面,Microsoft 365 Copilot將利用(yong)(yong)GPT-5更好地(di)處理(li)復雜問題、在長對話中保持專注(zhu)并理(li)解(jie)用(yong)(yong)戶(hu)(hu)上下文。企業用(yong)(yong)戶(hu)(hu)可通過(guo)推理(li)功能處理(li)電子郵(you)件(jian)、文檔和(he)文件(jian)。

對于消費者,Microsoft Copilot的新智能模式將利用GPT-5幫助用戶發現最佳解決方案。用戶可通過copilot.microsoft.com或Windows、Mac、Android和iOS設備上的Copilot應用免費體驗GPT-5。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaedOTQ4kvFhOPianyllx2ntgltbe1ObG4PFzAeU3KeDpRyM0SAaLw5yJA.jpg

開發者(zhe)將通過GitHub Copilot和(he)Visual Studio Code獲得GPT-5支持(chi),用(yong)于編寫、測試和(he)部署(shu)代碼。Azure AI Foundry平臺將提供所有GPT-5模型,配備(bei)AI驅(qu)動的模型路由器,根(gen)據每個任務(wu)的復雜性、性能(neng)需求和(he)成本效率選擇最優(you)模型。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

馬斯克拆臺

 

值得注意的(de)是(shi),在(zai)GPT-5的(de)發布會(hui)上,現(xian)場也(ye)出了一些小bug,直(zhi)播中展(zhan)示(shi)的(de)性能圖(tu)(tu)表(biao)存(cun)在(zai)數(shu)據(ju)與圖(tu)(tu)表(biao)顯示(shi)不匹配(pei)的(de)情況,例如在(zai)編程基準測試(swe-bench)的(de)圖(tu)(tu)表(biao)中,GPT-5的(de)準確率標(biao)注為52.8%,但對應的(de)柱(zhu)(zhu)狀圖(tu)(tu)高度卻(que)超過(guo)了標(biao)注為69.1%的(de)舊模(mo)型(xing)O3的(de)柱(zhu)(zhu)狀圖(tu)(tu),引發了網(wang)友的(de)廣泛質疑。奧特曼也(ye)承認了錯誤:

 

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBibSeQ73FrsmGKnN3zv1uNwmaiaaQDgqlBALwxctibjw96icktUdptdAnbA.png

更尷尬的是,馬(ma)斯克也跑來(lai)拆臺(tai),轉(zhuan)發了GPT-5在ARC-AGI-2上(shang)沒(mei)有打敗Grok 4的消息:

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBiaqIjfhXAjqnJWNWWOSTWBUCMC6blysSuRrXFI4qKIb6rG98QQNG1tQ.png

據證(zheng)券時報(bao)報(bao)道,有人工智(zhi)能資(zi)深研究員認為,GPT-5 仍然只是“漸(jian)進式優(you)化”,而非顛覆性、跨(kua)越式的提(ti)升。GPT-5表現不夠驚艷的核心(xin)原因在(zai)于,大模(mo)型訓(xun)(xun)(xun)練遵(zun)循Scaling Laws(縮放定(ding)律(lv)),即模(mo)型性能隨著參數規模(mo)、訓(xun)(xun)(xun)練數據量、計算資(zi)源(yuan)(yuan)的增(zeng)加(jia)而提(ti)升。如今(jin)這一定(ding)律(lv)正在(zai)放緩,預訓(xun)(xun)(xun)練帶來的邊(bian)際收益在(zai)減弱(ruo),而且全球高質(zhi)量數據已經枯竭,這也使(shi)得OpenAI的訓(xun)(xun)(xun)練資(zi)源(yuan)(yuan)面臨瓶頸,模(mo)型性能提(ti)升十分有限。

GPT-5這次發布或許還(huan)與OpenAI近期資(zi)本運作有關(guan)。

據(ju)參考消(xiao)息(xi)網(wang)(wang)援(yuan)引《金(jin)融時(shi)報》網(wang)(wang)站8月1日報道,OpenAI已獲得83億美(mei)元(yuan)(yuan)新(xin)資本,估值達到3000億美(mei)元(yuan)(yuan)。據(ju)知情人士透露(lu),這筆新(xin)資金(jin)來(lai)自黑石集團、得克薩斯太平洋(yang)集團資本公司(si)(si)、富達管(guan)理(li)與研究公司(si)(si)和普(pu)徠仕公司(si)(si)等原有(you)及新(xin)加入的投資者(zhe)。

GPT-5的發(fa)布(bu),將進一步鞏固OpenAI在(zai)大模型技術(shu)領域的領先優勢,提(ti)振(zhen)投資者信心,有助于公司估值的增長及股票二次出售計劃的實施。

編輯|程鵬 杜宇 易啟江

校對|段煉

封面圖片來源:截圖

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

每日經濟新聞綜合自OpenAI官網、證券時(shi)報、21世紀經(jing)濟(ji)報道、第(di)一財經(jing)、公開資料

 

 

 

如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)(jing)《每日經(jing)(jing)濟新聞》報社(she)授權,嚴禁轉載或鏡像,違(wei)者必究。

讀者熱線:4008890008

特(te)別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如(ru)您(nin)不希望(wang)作品(pin)出現(xian)在本站,可聯(lian)系我(wo)們要求撤下(xia)您(nin)的作品(pin)。

歡(huan)迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0