要聞

GPT-5來了，微軟搶先接入：一鍵生成網頁、博士級智能，所有用戶免費使用；馬斯克不服

每(mei)日經(jing)濟新聞 2025-08-08 12:39:32

每(mei)經編輯｜程鵬杜宇 ;

當地時間8月7日，OpenAI推出大型語言模型GPT-5，這一成果歷經多次推遲后終于面世。這距離GPT-4的發布已過去了兩年半。OpenAI稱(cheng)它是(shi)“世界上最好的(de)模型”，將(jiang)免費提供(gong)給用(yong)戶。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5AdxKPDVKP5x0cUZjccibCuLa4bUfrNWibiahy2BSicwnlMdhIKXPRrn1g.jpg 圖片(pian)來源：OpenAI官網

首席執行(xing)官山姆(mu)·奧爾特曼在(zai)發布會上形容，與(yu)GPT-5對話“就像在與(yu)某個領域的博士級(ji)專家交流”。這一版本首次(ci)采(cai)用(yong)集成模型架構，將根(gen)據任務(wu)自動選擇推理深度(du)，無需用戶切(qie)換模式。

目前Plus、Pro、團隊和免費用(yong)(yong)戶(hu)均已接入GPT-5，企(qi)業版(ban)與(yu)教(jiao)育版(ban)用(yong)(yong)戶(hu)預(yu)計(ji)將在(zai)一周內覆蓋(gai)，免費用(yong)(yong)戶(hu)將在(zai)數天(tian)內完成覆蓋(gai)。

也有業內人士認為GPT-5“不夠驚艷”，馬(ma)斯(si)克(ke)在社交媒體表示“不(bu)服”稱(cheng)，GPT-5在ARC-AGI-2上沒有打敗(bai)Grok 4。

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDYlc8pH5aShZ1voYnrticAlqKFW77n50fibicMWTK3D2g4NLOiaDPZZl1Iw.png

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

面向所有用戶開放

OpenAI在新(xin)聞(wen)稿(gao)中寫道，GPT-5的智(zhi)能性能遠超公司(si)之前的所有(you)模型，在編碼、數學、寫作(zuo)、健康、視覺感(gan)知等(deng)領(ling)域均擁有(you)卓越(yue)的性能。

聲明補充稱(cheng)，GPT-5是一個統(tong)一的(de)系統(tong)，能夠識別何時快(kuai)速響應，何時需要更長時間(jian)的(de)思(si)考(kao)以提供專家級的(de)應答，不必由用(yong)戶手動選擇使用(yong)常(chang)規語言模型還是推理系統(tong)。

OpenAI表示，GPT-5將(jiang)面向所有(you)(you)(you)用(yong)戶開放。即C端免費用(yong)戶也可(ke)以使用(yong)GPT-5，但(dan)有(you)(you)(you)使用(yong)次(ci)數限(xian)制(zhi)，每天可(ke)以聊“幾個小時(shi)”，當達到(dao)上限(xian)后(hou)，會自動切(qie)換到(dao)GPT-5 mini模型。Plus用(yong)戶則(ze)將(jiang)擁有(you)(you)(you)比免費用(yong)戶“高得多”的使用(yong)額度，基本(ben)滿足日(ri)常(chang)應用(yong)。Pro會員(yuan)則(ze)可(ke)訪問GPT-5 Pro版本(ben)——該(gai)版本(ben)具有(you)(you)(you)擴展推理(li)能力，可(ke)提供更全(quan)面、更準(zhun)確的答案。

對于開發者API用戶來講，GPT-5幾乎給出了(le)一個難以拒絕的價格：每百(bai)萬token輸入1.25美元，輸出10美元。這個價格不僅比GPT 4o便宜(yi)，也僅為Claude Opus 4.1的1/15，甚至比一直以“低價”著稱的Gemini 2.5 Pro更便宜(yi)。

先(xian)前，OpenAI首席執行官薩姆·奧爾(er)特曼（Sam Altman）稱GPT-5是(shi)一次“重(zhong)大升級”。

ChatGPT團隊負(fu)責人(ren)Nick Turley表示，新模(mo)型在響應(ying)速(su)度、回答準確性(xing)以及減少“幻(huan)覺”方面都優于前(qian)代產品，“你跟它對(dui)話時(shi)，會感覺自然了不少。”

在8月7日的(de)(de)簡報會上，奧(ao)爾特曼對(dui)GPT-5給予(yu)了極高(gao)評價，將GPT-5定位為通往(wang)AGI的(de)(de)重要里程碑(bei)。他表示：“在以往(wang)歷史上任何(he)時期(qi)，擁有(you)像(xiang)GPT-5這(zhe)樣(yang)的(de)(de)東(dong)西(xi)都(dou)是(shi)不可想(xiang)象的(de)(de)。”

“這是第一次感(gan)覺(jue)就像在與任何領域的(de)專家交談。”Altman在簡報會上甚至不惜用(yong)“踩”GPT-4抬高GPT-5。他說：“我嘗試過用(yong)回(hui)GPT-4，但效果相當糟糕。”

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaem0yEEjibMAYXxlops1ibNpD0gjibRnLFay92sTRnn838hsJS4Px7OMMoA.jpg 圖片(pian)來源(yuan)：視(shi)覺中國

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

一鍵生成網頁、像詩人一樣寫(xie)作(zuo)

更懂健康問題

根據OpenAI介紹，作為OpenAI的“最強大模型”，GPT-5在三個關鍵領域實現了顯著提升。

首先是編程能力。GPT-5是OpenAI迄今為止最強大的編碼模型，在復雜的前端生成和大型代碼庫調試方面表現突出，能夠僅憑一個提示就創建美觀響應式的網站、應用程序App和游戲。早(zao)期測試者注意到其在間(jian)距、排版和留白(bai)等設(she)計(ji)選(xuan)擇方面的改進。

在從GitHub獲(huo)取現實(shi)世界(jie)編碼任務的基準(zhun)測試SWE-bench Verified中，GPT-5思考后首次嘗試的準(zhun)確率達74.9%，高于(yu)OpenAI推(tui)理(li)模型o3的69.1%和GPT-4o的30.8%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaelzULGYPxlEeMsrSzvaAibO197CrVGmONK0SD8lSmQ0dC7gGF6eYF8sQ.jpg

評論指出，這意味著，GPT-5的表現(xian)略勝于Anthropic周二推(tui)出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro，后兩者(zhe)在SWE-bench Verified測試的得分分別為74.5%和59.6%。

不過，在衡量數學(xue)(xue)、人(ren)文和自(zi)然科學(xue)(xue)領域模型表(biao)現的(de)各學(xue)(xue)科專家(jia)級(ji)能力Humanity’s Last Exam測試中，帶有擴展推理功能的(de)GPT-5增強版本GPT-5 pro在使用工具的(de)情況下得分(fen)42%。這略低于得分(fen)44.4%的(de)xAI模型Grok 4 Heavy。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaez6V93mYYS166ODQzha7trFPmmlONnNwnWBLjp2moDoRG21F76TkYKg.jpg

奧爾(er)特(te)曼(man)稱(cheng)，GPT-5尤其擅長按需啟(qi)動整個軟件App，也就是所謂的“氛圍編碼”、即用AI根(gen)據自然語言提(ti)示生(sheng)成功能(neng)代(dai)碼，從而加快開發速(su)度。

作為實例，OpenAI的研究者演示了，要求GPT-5創建一款網頁App，幫助(zhu)說英語的(de)用戶學(xue)(xue)習法(fa)(fa)語，且該App必須有一個(ge)引人入(ru)勝的(de)主題，包含(han)抽認卡、測驗、經典的(de)貪吃(chi)蛇游戲，以及追蹤每日學(xue)(xue)習進(jin)度的(de)方法(fa)(fa)。

研究者將相同的提示詞提交到兩個GPT-5 窗口中，幾分鐘后生成了兩個不同的App。OpenAI的(de)負責人(ren)稱，這(zhe)些(xie)App“存(cun)在一些(xie)缺陷(xian)”，但用戶(hu)可以根據個人(ren)喜好再調(diao)整AI生成(cheng)的(de)軟(ruan)件，例如更改背景或(huo)添加更多(duo)標(biao)簽(qian)頁。

在創意寫作方面，GPT-5能夠處理結構復雜的寫作任務，如無韻律的抑揚格五音步詩或自然流動的自由詩，猶如詩人。OpenAI的ChatGPT業務(wu)副總Nick Turley表示(shi)，GPT-5在(zai)創意任務(wu)上表現出(chu)“更(geng)好的品味(wei)”，響(xiang)應更(geng)自然(ran)。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaecO2DKtR4iciaK5OTc4TaiaqlQBbC3Z86IO7ssemDfIpLhd9aqIzX46slA.jpg

健康咨詢是第三個重要提升領域。

GPT-5能(neng)更積極地(di)標記潛在健康問題，幫(bang)助用戶解析醫(yi)療(liao)結果(guo)，盡管(guan)OpenAI強調(diao)，ChatGPT不(bu)能(neng)替代醫(yi)療(liao)專業人員。

在名為(wei)(wei)HealthBench Hard Hallucinations的(de)測試(shi)中，具備思考能(neng)力的(de)GPT-5出現幻覺(jue)的(de)錯(cuo)誤信息率僅為(wei)(wei)1.6%。這遠低于(yu)GPT-4o和o3模型(xing)，后兩者的(de)錯(cuo)誤信息率分別為(wei)(wei)15.8%和12.9%。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

幻覺可(ke)能性(xing)顯著降低新的安全訓練模式

OpenAI稱，GPT-5相比此前的模型更可靠和實用，它能更準確地回答現實世界的疑問，出現幻覺的可能性顯著降低。

在對(dui)代表(biao)ChatGPT生產流量的匿名提示(shi)詞啟用(yong)網絡(luo)搜索后，GPT-5響(xiang)應(ying)中包含事實(shi)錯(cuo)誤(wu)的可能(neng)性(xing)(xing)比GPT-4o低約45%；在思考后，GPT-5響(xiang)應(ying)中包含事實(shi)錯(cuo)誤(wu)的可能(neng)性(xing)(xing)比o3低約 80%。下圖(tu)可見(jian)，GPT-5響(xiang)應(ying)的錯(cuo)誤(wu)信息率僅為4.8%，GPT-4o為20.6%，o3為22%。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiae5LMlQqMUxahdyMAhIibFibcxFexiaWYks1WfQ9qSicuCb7SfU9a0DCc50A.jpg

OpenAI還表示，為GPT-5引入了一種新的安全訓練形式，名為安全補全（safe completions）。它教模型在安全范圍內盡可能給出最有幫助的答案。有時(shi)，這(zhe)可(ke)能意味(wei)著部(bu)分回答用戶的(de)問題，或者只提供高(gao)水平(ping)的(de)回答。

如果需要拒(ju)絕(jue)，經過訓練的GPT-5會(hui)以透明的方式告(gao)知(zhi)用戶拒(ju)絕(jue)的原因，并提供(gong)安全(quan)的替代方案。

在受控(kong)的(de)(de)實驗和OpenAI的(de)(de)生產模型中，OpenAI都發(fa)現(xian)這種(zhong)安(an)全補全的(de)(de)方法更加細致入微，能(neng)夠更好(hao)地(di)引導(dao)雙重用(yong)途問(wen)題，增強對(dui)模糊意圖(tu)的(de)(de)魯棒性，并減少不必要(yao)的(de)(de)過度拒絕。

OpenAI的后訓練負責人Michelle Pokrass表(biao)示：“GPT-5已經過訓練，能(neng)夠識(shi)別(bie)任務何時無(wu)法完成，避免猜測，并能(neng)更清晰(xi)地解釋局(ju)限性，相比之前(qian)的模型，這減(jian)少了(le)無(wu)根據的斷言。”

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

推出四種可選(xuan)的 ChatGPT聊天預設(she)性格

OpenAI稱(cheng)，GPT-5在指(zhi)令(ling)執行方面(mian)表(biao)現提升(sheng)，其執行自定(ding)義指(zhi)令(ling)的(de)能力也得到了相(xiang)應的(de)提升(sheng)。OpenAI將為(wei)所有ChatGPT用戶推出四種預設性格的(de)全新研究預覽(lan)版(ban)。

初始的四種性格選項——憤世嫉俗者（Cynic）、機器人（Robot）、傾聽者（Listener）和書呆子（Nerd）都是可選的，用(yong)戶可在設置中隨時(shi)調整，用(yong)以匹配ChatGPT和用(yong)戶的溝通風(feng)格。

eFJHus9stzdnBcOEicb4YqdVpLExjCYqDF0kOofUYrxRfMz4UeQxskM1IbGXUy6U1aeyXjGEO9JLAkGdriaObCCA.png

上(shang)述四(si)種(zhong)性格最初適用于(yu)文本聊天，之后將擴展到語音聊天，讓用戶無(wu)需編寫自定(ding)義提示詞(ci)即可設置ChatGPT的交互方(fang)式——無(wu)論是簡潔(jie)專業的、周到支(zhi)持的，還是略帶(dai)諷刺(ci)的。

此外，微軟在GPT-5發布當日即(ji)宣(xuan)布，將其(qi)整合到(dao)廣泛的產品線中。在企業級應用(yong)(yong)方面，Microsoft 365 Copilot將利用(yong)(yong)GPT-5更好地(di)處理(li)復雜問題、在長對話中保持專注(zhu)并理(li)解(jie)用(yong)(yong)戶(hu)(hu)上下文。企業用(yong)(yong)戶(hu)(hu)可通過(guo)推理(li)功能處理(li)電子郵(you)件(jian)、文檔和(he)文件(jian)。

對于消費者，Microsoft Copilot的新智能模式將利用GPT-5幫助用戶發現最佳解決方案。用戶可通過copilot.microsoft.com或Windows、Mac、Android和iOS設備上的Copilot應用免費體驗GPT-5。

CFF20LXzkOx4czmaia3NdROcEhiaQHjFiaedOTQ4kvFhOPianyllx2ntgltbe1ObG4PFzAeU3KeDpRyM0SAaLw5yJA.jpg

開發者(zhe)將通過GitHub Copilot和(he)Visual Studio Code獲得GPT-5支持(chi)，用(yong)于編寫、測試和(he)部署(shu)代碼。Azure AI Foundry平臺將提供所有GPT-5模型，配備(bei)AI驅(qu)動的模型路由器，根(gen)據每個任務(wu)的復雜性、性能(neng)需求和(he)成本效率選擇最優(you)模型。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

馬斯克拆臺

值得注意的(de)是(shi)，在(zai)GPT-5的(de)發布會(hui)上，現(xian)場也(ye)出了一些小bug，直(zhi)播中展(zhan)示(shi)的(de)性能圖(tu)(tu)表(biao)存(cun)在(zai)數(shu)據(ju)與圖(tu)(tu)表(biao)顯示(shi)不匹配(pei)的(de)情況，例如在(zai)編程基準測試（swe-bench）的(de)圖(tu)(tu)表(biao)中，GPT-5的(de)準確率標(biao)注為52.8%，但對應的(de)柱(zhu)(zhu)狀圖(tu)(tu)高度卻(que)超過(guo)了標(biao)注為69.1%的(de)舊模(mo)型(xing)O3的(de)柱(zhu)(zhu)狀圖(tu)(tu)，引發了網(wang)友的(de)廣泛質疑。奧特曼也(ye)承認了錯誤：

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBibSeQ73FrsmGKnN3zv1uNwmaiaaQDgqlBALwxctibjw96icktUdptdAnbA.png

更尷尬的是，馬(ma)斯克也跑來(lai)拆臺(tai)，轉(zhuan)發了GPT-5在ARC-AGI-2上(shang)沒(mei)有打敗Grok 4的消息：

KmXPKA19gW80Lhc0tgswpbtQ4ck2trIBiaqIjfhXAjqnJWNWWOSTWBUCMC6blysSuRrXFI4qKIb6rG98QQNG1tQ.png

據證(zheng)券時報(bao)報(bao)道，有人工智(zhi)能資(zi)深研究員認為，GPT-5 仍然只是“漸(jian)進式優(you)化”，而非顛覆性、跨(kua)越式的提(ti)升。GPT-5表現不夠驚艷的核心(xin)原因在(zai)于，大模(mo)型訓(xun)(xun)(xun)練遵(zun)循Scaling Laws（縮放定(ding)律(lv)），即模(mo)型性能隨著參數規模(mo)、訓(xun)(xun)(xun)練數據量、計算資(zi)源(yuan)(yuan)的增(zeng)加(jia)而提(ti)升。如今(jin)這一定(ding)律(lv)正在(zai)放緩，預訓(xun)(xun)(xun)練帶來的邊(bian)際收益在(zai)減弱(ruo)，而且全球高質(zhi)量數據已經枯竭，這也使(shi)得OpenAI的訓(xun)(xun)(xun)練資(zi)源(yuan)(yuan)面臨瓶頸，模(mo)型性能提(ti)升十分有限。

GPT-5這次發布或許還(huan)與OpenAI近期資(zi)本運作有關(guan)。

據(ju)參考消(xiao)息(xi)網(wang)(wang)援(yuan)引《金(jin)融時(shi)報》網(wang)(wang)站8月1日報道，OpenAI已獲得83億美(mei)元(yuan)(yuan)新(xin)資本，估值達到3000億美(mei)元(yuan)(yuan)。據(ju)知情人士透露(lu)，這筆新(xin)資金(jin)來(lai)自黑石集團、得克薩斯太平洋(yang)集團資本公司(si)(si)、富達管(guan)理(li)與研究公司(si)(si)和普(pu)徠仕公司(si)(si)等原有(you)及新(xin)加入的投資者(zhe)。

GPT-5的發(fa)布(bu)，將進一步鞏固OpenAI在(zai)大模型技術(shu)領域的領先優勢，提(ti)振(zhen)投資者信心，有助于公司估值的增長及股票二次出售計劃的實施。

編輯|程鵬杜宇易啟江

校對|段煉

封面圖片來源：截圖

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

每日經濟新聞綜合自OpenAI官網、證券時(shi)報、21世紀經(jing)濟(ji)報道、第(di)一財經(jing)、公開資料

如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)(jing)《每日經(jing)(jing)濟新聞》報社(she)授權，嚴禁轉載或鏡像，違(wei)者必究。

讀者熱線：4008890008

特(te)別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如(ru)您(nin)不希望(wang)作品(pin)出現(xian)在本站，可聯(lian)系我(wo)們要求撤下(xia)您(nin)的作品(pin)。

上一篇文章

政策助力腦(nao)機(ji)接(jie)口概念股走強，滬指半(ban)日微(wei)漲(zhang)0.07%

返回每經網首頁

下一篇文章

家(jia)長不(bu)在(zai)家(jia)，孩(hai)子(zi)凌(ling)晨被人入(ru)戶抽血(xue)？衛健(jian)局介入(ru)，當地回應：給家(jia)長多次打電話(hua)未(wei)接通，派(pai)民警和醫生前往確認

熱文精選

點擊排行

歡(huan)迎關注每日經濟新聞APP

暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

GPT-5來了，微軟搶先接入：一鍵生成網頁、博士級智能，所有用戶免費使用；馬斯克不服