暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
推薦

每經網首頁 > 推薦 > 正(zheng)文

AI實盤投資哪家強?專訪Nof1人工智能負責人:表現最佳的都是開源模型

2025-11-05 23:10:49

北(bei)京時(shi)間11月4日,AI大(da)(da)模型(xing)實時(shi)投資(zi)比(bi)(bi)賽(sai)“Alpha Arena”落幕,阿(a)里千問Qwen奪冠,DeepSeek第(di)二。競賽(sai)由Nof1發起,六大(da)(da)頂尖模型(xing)擁(yong)有1萬美元初始(shi)資(zi)金,在(zai)真實的加密貨幣(bi)市(shi)場自主交(jiao)易。Nof1表示(shi)金融(rong)市(shi)場是AI最(zui)佳訓練環境,比(bi)(bi)賽(sai)旨在(zai)揭示(shi)模型(xing)偏見、轉向現實基準。下一季(ji)比(bi)(bi)賽(sai)周期更長、參(can)與者更多。Nof1人工智能(neng)負責人稱未來人類或(huo)將(jiang)通過AI金融(rong)投資(zi)智能(neng)體(ti)交(jiao)易。

每經記(ji)者|葉曉(xiao)丹    每經編(bian)輯|黃(huang)博文     

歷時17天,全球六大(da)頂(ding)尖AI(人工智(zhi)能)大(da)模型,擁有1萬美元初始(shi)資(zi)金(jin),在真實的(de)加密貨幣市場(chang)自主(zhu)交易。

真(zhen)(zhen)實市場、真(zhen)(zhen)金白(bai)銀、真(zhen)(zhen)實基準(zhun),誰能(neng)勝出?

北京時間11月4日,備受關注的AI大模型實時投資比賽“Alpha Arena”落下帷幕,來自中國的兩款大模型在17天的比賽中保持領先,其中,阿里(li)千問(wen)Qwen奪(duo)得冠(guan)軍(jun),DeepSeek名列第二(er)。

該競(jing)賽由國際第三方機構Nof1于(yu)10月18日發起,集(ji)合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模(mo)型,每個模(mo)型擁有一萬美元初(chu)始(shi)資金,在(zai)真實市(shi)場上無人工干預地(di)自主決策、交易,根據盈虧情況決出(chu)冠軍。

Nof1公司表示,相信金融市場是下一代人工智能的最佳訓練環境。在“Alpha Arena”比賽開始一周后,Nof1發文表示,第(di)一季(ji)Alpha Arena目標主要有兩個。

其(qi)一,通過比(bi)較分(fen)析(xi),揭示主流LLM(大語言(yan)模型)明顯的(de)隱性(xing)偏(pian)見和默認的(de)交易行為(wei)。比(bi)如,探(tan)究模型之間的(de)交易方式是(shi)否(fou)存在巨大差(cha)異?它們(men)是(shi)否(fou)隨(sui)著時(shi)間保持(chi)一致?它們(men)在哪里犯錯?

其二,幫助(zhu)將AI研究(jiu)文化轉(zhuan)向現實(shi)世界基準,遠離靜(jing)態的、考試式的基準。我(wo)們(men)希望Alpha Arena至(zhi)少能(neng)強調在更具(ju)后(hou)果(guo)性、現實(shi)環境中評(ping)估AI的力量。我(wo)們(men)相信(xin)這是發現關鍵差(cha)距和見解、推(tui)動前沿AI發展的最快途徑。

在經歷17天真(zhen)實世(shi)界的(de)交易后,結果出(chu)乎(hu)所有人的(de)意料。阿里(li)巴(ba)巴(ba)的(de)Qwen 3 Max以(yi)22.32%的(de)收(shou)益率奪(duo)冠,另一家中國(guo)公司(si)DeepSeek位(wei)居第二,其DeepSeek v3.1的(de)收(shou)益率為4.89%。

而來自硅谷的四位明星選手則(ze)全線潰敗。OpenAI的GPT-5虧(kui)損(sun)62.66%,Google的Gemini 2.5 Pro虧(kui)損(sun)56.71%,馬斯克(ke)旗下xAI的Grok 4虧(kui)損(sun)45.3%,Anthropic的Claude 4.5 Sonnet也虧(kui)損(sun)了30.81%。

對這(zhe)場比賽,Nof1負責人Jay A在(zai)社交(jiao)媒體中表示:“我們(men)觀察到模型(xing)(xing)(xing)存(cun)在(zai)持(chi)續的(de)(de)偏差,這(zhe)種偏差隨著時(shi)間的(de)(de)推移和提示信(xin)息的(de)(de)多次迭代而持(chi)續存(cun)在(zai)。我們(men)也(ye)特(te)意將(jiang)模型(xing)(xing)(xing)置于一個困難的(de)(de)境地(di)。LLM模型(xing)(xing)(xing)實際上(shang)并不擅長處理(li)數(shu)值時(shi)間序列數(shu)據,但這(zhe)正是(shi)我們(men)給(gei)它(ta)(ta)們(men)提供的(de)(de)全部背景信(xin)息。此外,它(ta)(ta)們(men)還被(bei)賦(fu)予了(le)一個受限(xian)的(de)(de)資產(chan)范圍(wei)和一個相當(dang)有限(xian)的(de)(de)行動空間。”

同時,Nof1宣布下(xia)一(yi)季比(bi)賽即將(jiang)啟(qi)動(dong),周(zhou)期會(hui)(hui)更長,參(can)與者會(hui)(hui)更多,市場環境也(ye)會(hui)(hui)更復雜(za)。Nof1人工智能負責(ze)人Julian Togelius在社(she)交媒體上透露,下(xia)一(yi)季的測試將(jiang)會(hui)(hui)有許多改進(jin)。

11月5日,基于此次實盤(pan)投資(zi)競賽,《每日經濟新聞》記(ji)者(以(yi)下簡稱“NBD”)獨家專訪了紐(niu)約大(da)學坦登工(gong)程學院(yuan)計算機科學與工(gong)程系副教授、Nof1人(ren)工(gong)智能負責人(ren)Julian Togelius。

六個AI模型的收益變化圖 圖片來源:Nof1官(guan)網截圖

表現最佳的模型都是開源的

NBD:第一季(ji)比賽結(jie)束了,來(lai)自中國的(de)兩款大(da)模型收益率保持領先。最終的(de)比賽結(jie)果在(zai)你的(de)預期之內嗎?

Julian Togelius:根據初步測試,我們預期這些模型會展現出不同的投資風格。因此,結果出現顯著差異是意料之中的。我們并不確定哪些模型會脫穎而出,但我們曾開玩笑說,DeepSeek或許會表現出色,因為該公司起源于一家量化交易公司。結果證明我們的猜測是正確的。我們也十分欣喜地看到,表現最佳(jia)的(de)模型都(dou)是開源(yuan)的(de),因為開源(yuan)人工(gong)智能對世界有好處。

NBD:這(zhe)次比(bi)(bi)賽持續(xu)了17天時間。有(you)評論認為相比(bi)(bi)真實市(shi)場的(de)量化交易,17天的(de)時間似乎有(you)點短暫。為什么(me)考慮設計這(zhe)個時間維度?

Julian Togelius:我們(men)是一家身處快(kuai)速發展領域(yu)的初創公司,所(suo)以(yi)我們(men)希(xi)望快(kuai)速迭代。我們(men)為即(ji)將到(dao)來(lai)的賽季有很多(duo)激(ji)動人心的想法,并希(xi)望盡快(kuai)進(jin)行嘗試。誠然,真正的交(jiao)易需(xu)要更長(chang)的時間跨度……但這項比賽只是我們(men)在Nof1工作的一個方面。

NBD:在比賽過程中(zhong),6款AI模型(xing)(xing)前幾天(tian)整體差距還比較小(xiao),但隨(sui)著(zhu)時間的(de)拉長,各個(ge)大(da)模型(xing)(xing)呈現了各具特(te)色的(de)投資風格。流動(dong)的(de)時間對大(da)模型(xing)(xing)而言意味(wei)著(zhu)什(shen)么?

Julian Togelius:這(zhe)些(xie)模型的(de)性(xing)格隨時間(jian)推移(yi)保持穩定。然而,早期投資決策(ce)的(de)結果可能意味著模型會讓自己置(zhi)身于(yu)或(huo)(huo)多或(huo)(huo)少(shao)困難的(de)境地,并會以不(bu)同(tong)(tong)的(de)方式應對。GPT-5似乎(hu)一度陷入(ru)決策(ce)癱瘓,但如(ru)果它從一開始(shi)就交易得更好,這(zhe)種(zhong)情況(kuang)或(huo)(huo)許就不(bu)會發生。同(tong)(tong)樣,如(ru)果Qwen的(de)財務狀況(kuang)更糟,它那種(zhong)激進的(de)投資風(feng)格或(huo)(huo)許也不(bu)會出現。

人們未來將可以通過AI金融投資智能體來交易

NBD:下一季的比賽中會有哪些調整(zheng)和優(you)化(hua)?是否可以(yi)添加(jia)一些新聞、財(cai)報、宏觀經(jing)濟、市場情緒和其他非技(ji)術(shu)信息,供(gong)人工智能在(zai)投資前進行(xing)分(fen)析,以(yi)模擬更(geng)真實的交(jiao)易環(huan)境(jing)?

Julian Togelius:你提(ti)到的(de)因素我(wo)們都討論(lun)過了,我(wo)們希望在不久的(de)將來能(neng)夠實現。不過,我(wo)們會(hui)一步(bu)一步(bu)來。我(wo)不會(hui)提(ti)前透露下一版本(ben)會(hui)做哪些(xie)改動(dong)——它很快就會(hui)發布。但我(wo)們預(yu)計(ji)會(hui)快速推進,并在后續版本(ben)中(zhong)逐(zhu)步(bu)整(zheng)合更(geng)多(duo)信息。我(wo)們的(de)目標是開(kai)發出比任(ren)何現役交易員都更(geng)優秀(xiu)的(de)AI金(jin)融投資智能(neng)體。

NBD:這次比(bi)(bi)賽(sai)引發(fa)了大量關注,你認為這場AI投資(zi)(zi)比(bi)(bi)賽(sai)的真正(zheng)價值是(shi)什么?是(shi)比(bi)(bi)較模型性能,還是(shi)驗證(zheng)AI能否(fou)真正(zheng)走(zou)向市場化?投資(zi)(zi)比(bi)(bi)賽(sai)是(shi)否(fou)可(ke)能演變(bian)為AI金融行業的一種長(chang)期機制?

Julian Togelius:我(wo)們堅信,未(wei)來(lai)人(ren)(ren)(ren)類(lei)將通(tong)過(guo)指導或(huo)構(gou)建自己的(de)AI金融(rong)投資(zi)智能體(ti)來(lai)進行交易。人(ren)(ren)(ren)類(lei)與AI專業知識(shi)的(de)結合(he)必然優于人(ren)(ren)(ren)類(lei)或(huo)AI單獨(du)運作。我(wo)們正在構(gou)建一個系統,讓(rang)任何人(ren)(ren)(ren)都能通(tong)過(guo)AI金融(rong)投資(zi)智能體(ti)進行交易,而本次大賽正是(shi)朝著這個目標邁出的(de)重要一步。(實習生張京(jing)寶(bao)對本文亦有貢獻)


封面圖片來源:圖片來源:視覺中(zhong)國-VCG211550173673

如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報社授(shou)權,嚴禁轉載(zai)或(huo)鏡(jing)像,違者必究(jiu)。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您(nin)不希望作(zuo)品出現在本站(zhan),可聯系我們(men)要(yao)求撤下您(nin)的作(zuo)品。

歡迎關(guan)注(zhu)每日經濟新聞APP

每經經濟新聞官方APP

0

0