AI實盤投資哪家強？專訪Nof1人工智能負責人：表現最佳的都是開源模型

2025-11-05 23:10:49

北(bei)京時(shi)間11月4日，AI大(da)(da)模型(xing)實時(shi)投資(zi)比(bi)(bi)賽(sai)“Alpha Arena”落幕，阿(a)里千問Qwen奪冠，DeepSeek第(di)二。競賽(sai)由Nof1發起，六大(da)(da)頂尖模型(xing)擁(yong)有1萬美元初始(shi)資(zi)金，在(zai)真實的加密貨幣(bi)市(shi)場自主交(jiao)易。Nof1表示(shi)金融(rong)市(shi)場是AI最(zui)佳訓練環境，比(bi)(bi)賽(sai)旨在(zai)揭示(shi)模型(xing)偏見、轉向現實基準。下一季(ji)比(bi)(bi)賽(sai)周期更長、參(can)與者更多。Nof1人工智能(neng)負責人稱未來人類或(huo)將(jiang)通過AI金融(rong)投資(zi)智能(neng)體(ti)交(jiao)易。

每經記(ji)者｜葉曉(xiao)丹每經編(bian)輯｜黃(huang)博文 

歷時17天，全球六大(da)頂(ding)尖AI（人工智(zhi)能）大(da)模型，擁有1萬美元初始(shi)資(zi)金(jin)，在真實的(de)加密貨幣市場(chang)自主(zhu)交易。

真(zhen)(zhen)實市場、真(zhen)(zhen)金白(bai)銀、真(zhen)(zhen)實基準(zhun)，誰能(neng)勝出？

北京時間11月4日，備受關注的AI大模型實時投資比賽“Alpha Arena”落下帷幕，來自中國的兩款大模型在17天的比賽中保持領先，其中，阿里(li)千問(wen)Qwen奪(duo)得冠(guan)軍(jun)，DeepSeek名列第二(er)。

該競(jing)賽由國際第三方機構Nof1于(yu)10月18日發起，集(ji)合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模(mo)型，每個模(mo)型擁有一萬美元初(chu)始(shi)資金，在(zai)真實市(shi)場上無人工干預地(di)自主決策、交易，根據盈虧情況決出(chu)冠軍。

Nof1公司表示，相信金融市場是下一代人工智能的最佳訓練環境。在“Alpha Arena”比賽開始一周后，Nof1發文表示，第(di)一季(ji)Alpha Arena目標主要有兩個。

其(qi)一，通過比(bi)較分(fen)析(xi)，揭示主流LLM（大語言(yan)模型）明顯的(de)隱性(xing)偏(pian)見和默認的(de)交易行為(wei)。比(bi)如，探(tan)究模型之間的(de)交易方式是(shi)否(fou)存在巨大差(cha)異？它們(men)是(shi)否(fou)隨(sui)著時(shi)間保持(chi)一致？它們(men)在哪里犯錯？

其二，幫助(zhu)將AI研究(jiu)文化轉(zhuan)向現實(shi)世界基準，遠離靜(jing)態的、考試式的基準。我(wo)們(men)希望Alpha Arena至(zhi)少能(neng)強調在更具(ju)后(hou)果(guo)性、現實(shi)環境中評(ping)估AI的力量。我(wo)們(men)相信(xin)這是發現關鍵差(cha)距和見解、推(tui)動前沿AI發展的最快途徑。

在經歷17天真(zhen)實世(shi)界的(de)交易后，結果出(chu)乎(hu)所有人的(de)意料。阿里(li)巴(ba)巴(ba)的(de)Qwen 3 Max以(yi)22.32%的(de)收(shou)益率奪(duo)冠，另一家中國(guo)公司(si)DeepSeek位(wei)居第二，其DeepSeek v3.1的(de)收(shou)益率為4.89%。

而來自硅谷的四位明星選手則(ze)全線潰敗。OpenAI的GPT-5虧(kui)損(sun)62.66%，Google的Gemini 2.5 Pro虧(kui)損(sun)56.71%，馬斯克(ke)旗下xAI的Grok 4虧(kui)損(sun)45.3%，Anthropic的Claude 4.5 Sonnet也虧(kui)損(sun)了30.81%。

對這(zhe)場比賽，Nof1負責人Jay A在(zai)社交(jiao)媒體中表示：“我們(men)觀察到模型(xing)(xing)(xing)存(cun)在(zai)持(chi)續的(de)(de)偏差，這(zhe)種偏差隨著時(shi)間的(de)(de)推移和提示信(xin)息的(de)(de)多次迭代而持(chi)續存(cun)在(zai)。我們(men)也(ye)特(te)意將(jiang)模型(xing)(xing)(xing)置于一個困難的(de)(de)境地(di)。LLM模型(xing)(xing)(xing)實際上(shang)并不擅長處理(li)數(shu)值時(shi)間序列數(shu)據，但這(zhe)正是(shi)我們(men)給(gei)它(ta)(ta)們(men)提供的(de)(de)全部背景信(xin)息。此外，它(ta)(ta)們(men)還被(bei)賦(fu)予了(le)一個受限(xian)的(de)(de)資產(chan)范圍(wei)和一個相當(dang)有限(xian)的(de)(de)行動空間。”

同時，Nof1宣布下(xia)一(yi)季比(bi)賽即將(jiang)啟(qi)動(dong)，周(zhou)期會(hui)(hui)更長，參(can)與者會(hui)(hui)更多，市場環境也(ye)會(hui)(hui)更復雜(za)。Nof1人工智能負責(ze)人Julian Togelius在社(she)交媒體上透露，下(xia)一(yi)季的測試將(jiang)會(hui)(hui)有許多改進(jin)。

11月5日，基于此次實盤(pan)投資(zi)競賽，《每日經濟新聞》記(ji)者（以(yi)下簡稱“NBD”）獨家專訪了紐(niu)約大(da)學坦登工(gong)程學院(yuan)計算機科學與工(gong)程系副教授、Nof1人(ren)工(gong)智能負責人(ren)Julian Togelius。

六個AI模型的收益變化圖圖片來源：Nof1官(guan)網截圖

表現最佳的模型都是開源的

NBD：第一季(ji)比賽結(jie)束了，來(lai)自中國的(de)兩款大(da)模型收益率保持領先。最終的(de)比賽結(jie)果在(zai)你的(de)預期之內嗎？

Julian Togelius：根據初步測試，我們預期這些模型會展現出不同的投資風格。因此，結果出現顯著差異是意料之中的。我們并不確定哪些模型會脫穎而出，但我們曾開玩笑說，DeepSeek或許會表現出色，因為該公司起源于一家量化交易公司。結果證明我們的猜測是正確的。我們也十分欣喜地看到，表現最佳(jia)的(de)模型都(dou)是開源(yuan)的(de)，因為開源(yuan)人工(gong)智能對世界有好處。

NBD：這(zhe)次比(bi)(bi)賽持續(xu)了17天時間。有(you)評論認為相比(bi)(bi)真實市(shi)場的(de)量化交易，17天的(de)時間似乎有(you)點短暫。為什么(me)考慮設計這(zhe)個時間維度？

Julian Togelius：我們(men)是一家身處快(kuai)速發展領域(yu)的初創公司，所(suo)以(yi)我們(men)希(xi)望快(kuai)速迭代。我們(men)為即(ji)將到(dao)來(lai)的賽季有很多(duo)激(ji)動人心的想法，并希(xi)望盡快(kuai)進(jin)行嘗試。誠然，真正的交(jiao)易需(xu)要更長(chang)的時間跨度……但這項比賽只是我們(men)在Nof1工作的一個方面。

NBD：在比賽過程中(zhong)，6款AI模型(xing)(xing)前幾天(tian)整體差距還比較小(xiao)，但隨(sui)著(zhu)時間的(de)拉長，各個(ge)大(da)模型(xing)(xing)呈現了各具特(te)色的(de)投資風格。流動(dong)的(de)時間對大(da)模型(xing)(xing)而言意味(wei)著(zhu)什(shen)么？

Julian Togelius：這(zhe)些(xie)模型的(de)性(xing)格隨時間(jian)推移(yi)保持穩定。然而，早期投資決策(ce)的(de)結果可能意味著模型會讓自己置(zhi)身于(yu)或(huo)(huo)多或(huo)(huo)少(shao)困難的(de)境地，并會以不(bu)同(tong)(tong)的(de)方式應對。GPT-5似乎(hu)一度陷入(ru)決策(ce)癱瘓，但如(ru)果它從一開始(shi)就交易得更好，這(zhe)種(zhong)情況(kuang)或(huo)(huo)許就不(bu)會發生。同(tong)(tong)樣，如(ru)果Qwen的(de)財務狀況(kuang)更糟，它那種(zhong)激進的(de)投資風(feng)格或(huo)(huo)許也不(bu)會出現。

人們未來將可以通過AI金融投資智能體來交易

NBD：下一季的比賽中會有哪些調整(zheng)和優(you)化(hua)？是否可以(yi)添加(jia)一些新聞、財(cai)報、宏觀經(jing)濟、市場情緒和其他非技(ji)術(shu)信息，供(gong)人工智能在(zai)投資前進行(xing)分(fen)析，以(yi)模擬更(geng)真實的交(jiao)易環(huan)境(jing)？

Julian Togelius：你提(ti)到的(de)因素我(wo)們都討論(lun)過了，我(wo)們希望在不久的(de)將來能(neng)夠實現。不過，我(wo)們會(hui)一步(bu)一步(bu)來。我(wo)不會(hui)提(ti)前透露下一版本(ben)會(hui)做哪些(xie)改動(dong)——它很快就會(hui)發布。但我(wo)們預(yu)計(ji)會(hui)快速推進，并在后續版本(ben)中(zhong)逐(zhu)步(bu)整(zheng)合更(geng)多(duo)信息。我(wo)們的(de)目標是開(kai)發出比任(ren)何現役交易員都更(geng)優秀(xiu)的(de)AI金(jin)融投資智能(neng)體。

NBD：這次比(bi)(bi)賽(sai)引發(fa)了大量關注，你認為這場AI投資(zi)(zi)比(bi)(bi)賽(sai)的真正(zheng)價值是(shi)什么？是(shi)比(bi)(bi)較模型性能，還是(shi)驗證(zheng)AI能否(fou)真正(zheng)走(zou)向市場化？投資(zi)(zi)比(bi)(bi)賽(sai)是(shi)否(fou)可(ke)能演變(bian)為AI金融行業的一種長(chang)期機制？

Julian Togelius：我(wo)們堅信，未(wei)來(lai)人(ren)(ren)(ren)類(lei)將通(tong)過(guo)指導或(huo)構(gou)建自己的(de)AI金融(rong)投資(zi)智能體(ti)來(lai)進行交易。人(ren)(ren)(ren)類(lei)與AI專業知識(shi)的(de)結合(he)必然優于人(ren)(ren)(ren)類(lei)或(huo)AI單獨(du)運作。我(wo)們正在構(gou)建一個系統，讓(rang)任何人(ren)(ren)(ren)都能通(tong)過(guo)AI金融(rong)投資(zi)智能體(ti)進行交易，而本次大賽正是(shi)朝著這個目標邁出的(de)重要一步。（實習生張京(jing)寶(bao)對本文亦有貢獻）

封面圖片來源：圖片來源：視覺中(zhong)國-VCG211550173673

如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報社授(shou)權，嚴禁轉載(zai)或(huo)鏡(jing)像，違者必究(jiu)。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您(nin)不希望作(zuo)品出現在本站(zhan)，可聯系我們(men)要(yao)求撤下您(nin)的作(zuo)品。

上一篇文章

11月6日汽車早參

返回每經網首頁

下一篇文章

黑牡丹(dan)全資子(zi)公司(si)擬出售空置廠房(fang)等資產，虧損關聯方溢價(jia)84%接盤