每日(ri)經(jing)濟(ji)新聞 2025-09-09 12:02:46
每經(jing)AI快(kuai)訊,9月9日(ri),在WAVE SUMMIT深(shen)度(du)(du)學(xue)習(xi)(xi)開發者大(da)(da)會2025上,百(bai)度(du)(du)正式(shi)(shi)發布文心(xin)大(da)(da)模(mo)型(xing)(xing)X1.1深(shen)度(du)(du)思考模(mo)型(xing)(xing)。文心(xin)大(da)(da)模(mo)型(xing)(xing)X1是基于文心(xin)大(da)(da)模(mo)型(xing)(xing)4.5訓練而來的(de)深(shen)度(du)(du)思考模(mo)型(xing)(xing),升(sheng)級后的(de)X1.1主要采用了迭代(dai)式(shi)(shi)混合強化學(xue)習(xi)(xi)訓練框架,一(yi)方面通(tong)過(guo)混合強化學(xue)習(xi)(xi),同時(shi)提(ti)升(sheng)通(tong)用任務(wu)和智(zhi)能體任務(wu)的(de)效果;另(ling)一(yi)方面通(tong)過(guo)自蒸餾數據(ju)的(de)迭代(dai)式(shi)(shi)生(sheng)產及訓練,不斷提(ti)升(sheng)模(mo)型(xing)(xing)整體效果。相(xiang)比文心(xin)X1,X1.1的(de)事實(shi)性提(ti)升(sheng)34.8%,指令(ling)遵循提(ti)升(sheng)12.5%,智(zhi)能體提(ti)升(sheng)9.6%。目前, 文心(xin)大(da)(da)模(mo)型(xing)(xing)X1.1已正式(shi)(shi)上線百(bai)度(du)(du)智(zhi)能云千帆(fan)平臺,對(dui)企(qi)業客戶(hu)及開發者全面開放使用。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報(bao)社授(shou)權,嚴(yan)禁轉(zhuan)載或鏡像,違者必究(jiu)。
讀(du)者熱線(xian):4008890008
特別提(ti)醒:如果我們使用了您的圖片,請作者與本站聯系索取(qu)稿酬。如您(nin)不希望作(zuo)品出(chu)現在(zai)本站,可聯(lian)系我們(men)要求撤下(xia)您(nin)的作(zuo)品。
歡迎關注每日經(jing)濟(ji)新(xin)聞(wen)APP