暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
AI快訊

每經網首頁 > AI快訊 > 正文

中國銀河給予傳媒互聯網行業推薦評級:VideoWorld模型開源,探索模型訓練新路徑

每日經濟(ji)新聞 2025-02-12 11:06:01

每經AI快(kuai)訊,中國銀河02月12日發布研報,給予傳媒互聯網行(xing)業(ye)推(tui)薦評級。

事件:2 月 10 日,豆包大模型(xing)團(tuan)隊聯合北京(jing)交通大學(xue)、中國科學(xue)技術大學(xue)共同開發的(de)視頻生成實驗模型(xing)"VideoWorld"開源(yuan)。

純(chun)(chun)視(shi)(shi)覺(jue)訓(xun)練(lian)(lian)模(mo)(mo)(mo)(mo)型(xing),擺脫語(yu)言模(mo)(mo)(mo)(mo)型(xing)依賴:現(xian)有的(de)(de)各類多(duo)模(mo)(mo)(mo)(mo)態(tai)模(mo)(mo)(mo)(mo)型(xing)如(ru) GPT、Sora 等(deng)大多(duo)較(jiao)為依賴語(yu)言或標簽(qian)數據(ju)(ju)學習(xi)(xi)知識,較(jiao)少涉及純(chun)(chun)視(shi)(shi)覺(jue)信號(hao)的(de)(de)學習(xi)(xi)。VideoWorld可(ke)以(yi)通過(guo)純(chun)(chun)視(shi)(shi)覺(jue)的(de)(de)方式(shi)進行學習(xi)(xi)訓(xun)練(lian)(lian):團隊(dui)構建了(le)一個(ge)包含大量視(shi)(shi)頻(pin)演示數據(ju)(ju)的(de)(de)離線(xian)數據(ju)(ju)集,讓模(mo)(mo)(mo)(mo)型(xing)以(yi)"觀(guan)看(kan)"的(de)(de)方式(shi)進行訓(xun)練(lian)(lian)學習(xi)(xi),最終(zhong)得(de)到一個(ge)可(ke)以(yi)根據(ju)(ju)過(guo)往(wang)(wang)觀(guan)測到的(de)(de)視(shi)(shi)覺(jue)輸(shu)入來(lai)(lai)推演、預(yu)測未來(lai)(lai)畫面的(de)(de)視(shi)(shi)頻(pin)生成器。我們認為,VideoWorld擺脫了(le)以(yi)往(wang)(wang)模(mo)(mo)(mo)(mo)型(xing)對語(yu)言模(mo)(mo)(mo)(mo)型(xing)的(de)(de)依賴,通過(guo)純(chun)(chun)視(shi)(shi)覺(jue)的(de)(de)方式(shi)進行學習(xi)(xi),改變了(le)以(yi)往(wang)(wang)的(de)(de)模(mo)(mo)(mo)(mo)型(xing)需要對語(yu)言文本(ben)進行理解后再進行推理的(de)(de)定式(shi),有望簡(jian)化模(mo)(mo)(mo)(mo)型(xing)的(de)(de)輸(shu)入﹣理解﹣推理﹣輸(shu)出(chu)鏈條。

引入潛在(zai)動態模(mo)型,提(ti)高視(shi)頻(pin)學(xue)習(xi)(xi)效(xiao)率:目前,傳統的(de)(de)視(shi)覺(jue)的(de)(de)訓練方式由于(yu)需要(yao)將畫面轉換(huan)為離散標記后(hou)(hou)進行(xing)學(xue)習(xi)(xi)。例如,在(zai)圍棋的(de)(de)訓練過程中,模(mo)型只(zhi)需通過少量(liang)的(de)(de)棋子位置(zhi)標記,但在(zai)數(shu)據的(de)(de)編(bian)碼過程中,編(bian)碼器會產生過多冗余標記,不(bu)利于(yu)模(mo)型對復雜知識的(de)(de)快速學(xue)習(xi)(xi),使得視(shi)頻(pin)序列的(de)(de)知識挖掘效(xiao)率顯著落后(hou)(hou)于(yu)文本形式。VideoWorld 引入了一(yi)個潛在(zai)動態模(mo)型(Latent Dynamics Model, LDM),可將幀間(jian)視(shi)覺(jue)變化壓縮為緊(jin)湊的(de)(de)潛在(zai)編(bian)碼,提(ti)高模(mo)型的(de)(de)知識挖掘效(xiao)率。最終,VideoWorld 在(zai)僅有 300M 參數(shu)量(liang)且不(bu)依賴(lai)任何獎(jiang)勵(li)函(han)數(shu)機制的(de)(de)條件下,達到9x9圍棋專業五段的(de)(de)水(shui)平,在(zai)機器人任務上也展現出(chu)了復雜環境(jing)下的(de)(de)泛(fan)化能力。

LDM具(ju)(ju)備(bei)前(qian)規劃能(neng)力(li),模(mo)(mo)型(xing)生(sheng)(sheng)成的(de)編(bian)(bian)碼具(ju)(ju)備(bei)因果(guo)關系(xi):在圍(wei)棋(qi)相關的(de)訓(xun)練中,LDM 建模(mo)(mo)了訓(xun)練集中常見(jian)的(de)走棋(qi)模(mo)(mo)式,并能(neng)將短(duan)期(qi)和長期(qi)數據模(mo)(mo)式壓(ya)縮至潛(qian)(qian)在空間中。對 LDM 的(de)模(mo)(mo)型(xing)推(tui)理(li)過程(cheng)進行 UMAP 可視(shi)化(hua)后(hou)發現(xian),LDM模(mo)(mo)型(xing)生(sheng)(sheng)成的(de)潛(qian)(qian)在編(bian)(bian)碼按照時間步(Time-step)進行分(fen)組,使(shi)得模(mo)(mo)型(xing)能(neng)夠從更長遠視(shi)角進行圍(wei)棋(qi)決(jue)策。此外,用隨(sui)機標(biao)記替換(huan)不(bu)同時間步的(de)潛(qian)(qian)在編(bian)(bian)碼的(de)實驗從側(ce)面(mian)說(shuo)明模(mo)(mo)型(xing)可生(sheng)(sheng)成因果(guo)相關編(bian)(bian)碼,理(li)解因果(guo)關系(xi)。

投資建(jian)議:我們認為,近(jin)期國內AI行(xing)業取(qu)得多項進(jin)展(zhan)。VideoWorld的(de)(de)(de)純視覺(jue)(jue)訓練(lian)(lian)(lian)方式(shi)(shi)在(zai)LDM的(de)(de)(de)加持下具有(you)較(jiao)好的(de)(de)(de)訓練(lian)(lian)(lian)效(xiao)果,且訓練(lian)(lian)(lian)方式(shi)(shi)更(geng)貼近(jin)生物的(de)(de)(de)視覺(jue)(jue)學習的(de)(de)(de)模式(shi)(shi)。展(zhan)望未來,其(qi)開源的(de)(de)(de)策略有(you)望推動(dong)視覺(jue)(jue)訓練(lian)(lian)(lian)的(de)(de)(de)快速發展(zhan),為行(xing)業帶來了新的(de)(de)(de)可(ke)能性,同時AI模型端(duan)的(de)(de)(de)進(jin)步有(you)望加速推動(dong)在(zai)影視、廣告、社交陪伴(ban)等多個領域應用(yong)落(luo)地。在(zai)應用(yong)層面,建(jian)議關注受(shou) AI賦能的(de)(de)(de)與C端(duan)用(yong)戶體(ti)驗密切相關的(de)(de)(de)行(xing)業:1)AI+游戲(xi):游戲(xi)內NPC互動(dong)、互動(dong)影游;2)AI+教育:智教系統、虛(xu)擬(ni)實驗室;3)AI+辦公:內容生成、非結構化數據(ju)處理;4)AI+出版:校對修改、智慧發行(xing);5)AI+專業咨詢:情感陪護(hu),應用(yong)場(chang)景專業解答等。

風(feng)(feng)險(xian)(xian)提示(shi):政策及監管環(huan)境的風(feng)(feng)險(xian)(xian)、AI 技術發展不及預期的風(feng)(feng)險(xian)(xian)、AI應(ying)用落地(di)不及預期的風(feng)(feng)險(xian)(xian)等。

每經頭條(tiao)(nbdtoutiao)——

(記者 王曉(xiao)波(bo))

免責聲明:本(ben)文內容與數據(ju)僅供(gong)參(can)考,不構成(cheng)投資建議(yi),使用前(qian)請核實。據(ju)此操作,風險自擔。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社(she)授(shou)權,嚴禁轉(zhuan)載(zai)或鏡像,違者必究。

讀者(zhe)熱線:4008890008

特(te)別(bie)提醒:如果我們使用了您的圖片,請作者與本站聯系索(suo)取稿酬(chou)。如您不希(xi)望(wang)作品出現在本站,可聯系我(wo)們要求(qiu)撤(che)下您的作品。

中國銀河 證券 北京市 國企改革 央企國企改革 證金持股 文化傳媒 模型(xing)

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0