每日經(jing)濟新聞 2025-01-01 22:34:31
每(mei)經記(ji)者(zhe)|宋欣(xin)悅 每(mei)經編輯|高 涵
近日,“推遲”“質疑”“未(wei)達(da)預(yu)期”這(zhe)類詞語頻繁出現在人工智能(AI)行業的(de)討論和報道中(zhong)。被眾人期待“炸場”的(de)OpenAI連續(xu)12天的(de)AI發布會細(xi)細(xi)品來(lai)也少(shao)了些“革(ge)命性”的(de)味道,更像是在已有成果上(shang)的(de)修修補補。
此前(qian),OpenAI的(de)聯合創(chuang)始(shi)人伊爾亞·蘇茨克維(wei)就曾在多個場合提到,AI的(de)進步并(bing)不是(shi)線性的(de),未(wei)來(lai)幾(ji)年內(nei),盡管有(you)大量資金和研(yan)究投(tou)入,技術突(tu)破的(de)速(su)度可(ke)能會有(you)所(suo)放緩。
AI發展速度真的在放緩嗎?AI發展面臨著哪些挑戰?我們距離通(tong)用人(ren)工智能(AGI)還有多遠?針對這些熱點問題,《每日經濟(ji)新聞》記者(zhe)(以下(xia)簡稱(cheng)NBD)專訪了(le)復(fu)旦(dan)大學計算機學院副教授、博士生導師鄭(zheng)驍慶。
鄭驍慶認為,從(cong)速度來(lai)講(jiang),AI發展并沒有放緩,但目前AI發展面(mian)臨(lin)著三大核心挑(tiao)戰:AI“幻覺(jue)”現象、數據隱私、算力和能(neng)源效率(lv)。在(zai)他看來(lai),當前的(de)AI技(ji)術(shu)依(yi)然處于“高級別模仿”的(de)階(jie)段,離真正的(de)AGI還(huan)有一段距離。“AGI不僅需(xu)要(yao)在(zai)認知(zhi)能(neng)力、學習(xi)能(neng)力等方面(mian)超越現有技(ji)術(shu),還(huan)需(xu)在(zai)情感理解和自主決策等領域有所突破。”
AI發展并未減速,但仍面臨三大挑戰
NBD:在您看來(lai),近(jin)期AI的發展速度相比過去兩年(nian),有怎樣的變化?
鄭驍慶(qing):我(wo)認為,人工智能(neng)的發展(zhan)速度并沒有放緩。
新(xin)一輪生成(cheng)式(shi)人(ren)(ren)工智能(neng)的標志性工作,實際上就(jiu)是(shi)OpenAI在2022年(nian)底推出的ChatGPT。這樣(yang)一個突破性的事件,距今(jin)僅有兩年(nian)左右的時間。在這段時間里,ChatGPT的成(cheng)功使得整個學(xue)(xue)術界(jie)和(he)產學(xue)(xue)界(jie)投(tou)入了大量(liang)的人(ren)(ren)力和(he)物力來推動生成(cheng)式(shi)人(ren)(ren)工智能(neng)的發展(zhan)。
不(bu)能(neng)(neng)說當(dang)(dang)前(qian)人工智能(neng)(neng)技術的(de)(de)發展變慢(man)了,實際上,它仍在加速(su)前(qian)進。當(dang)(dang)然,在發展的(de)(de)過程中(zhong),我(wo)們不(bu)可避免(mian)地會遇到一些(xie)問題和(he)新的(de)(de)挑戰,這些(xie)都是目前(qian)確實存(cun)在的(de)(de)。
NBD:目前(qian)人工智(zhi)能(neng)面臨哪(na)些重大挑戰(zhan)?
鄭驍慶:因(yin)為我(wo)的研究工作重要集中在(zai)自然語(yu)言(yan)處(chu)理和機(ji)器學習方面(mian),所(suo)以我(wo)從這個領域(yu)來談。
首(shou)先,當(dang)前大型語言模型面(mian)臨的(de)一個主要問(wen)題是“幻覺(jue)”現象,即模型可能會生成看似正確但實際上(shang)錯誤(wu)的(de)信息。因為許多(duo)用戶并不具備(bei)鑒別信息真偽的(de)能力,所以很容易被這種“幻覺(jue)”影響(xiang)。特別是在醫學、法律、金融等高風(feng)險應用領域中,存在一定風(feng)險。
其次,大模(mo)型(xing)高度依(yi)賴大數(shu)據(ju)。實際上,包括OpenAI在(zai)內的AI公司,在(zai)訓練模(mo)型(xing)時(shi),也(ye)并未透露(lu)(lu)其使(shi)用了哪(na)些(xie)數(shu)據(ju)。因為這(zhe)些(xie)數(shu)據(ju)多(duo)多(duo)少少會(hui)涉及版權(quan)或個(ge)人(ren)隱(yin)(yin)私(si)。這(zhe)種問(wen)題不(bu)僅存(cun)在(zai)于模(mo)型(xing)的構建(jian)和(he)訓練過程中,在(zai)用戶在(zai)使(shi)用大模(mo)型(xing)時(shi),也(ye)可能泄露(lu)(lu)個(ge)人(ren)信息。因此,數(shu)據(ju)的隱(yin)(yin)私(si)問(wen)題是另一個(ge)重大挑戰。
最后,AI大模(mo)型的算力消(xiao)耗巨大,資源成本高昂(ang)。如(ru)何降低使(shi)用門檻,讓更(geng)多用戶特別是中小(xiao)企業能(neng)夠負(fu)擔得起人(ren)工(gong)智能(neng)技術,是我們需要思(si)考的問題(ti)。在(zai)巨大的計算和能(neng)源消(xiao)耗情況下,如(ru)何實現(xian)更(geng)高效、更(geng)節能(neng)的AI系統(tong),可(ke)能(neng)成為未來(lai)的發展(zhan)方向。
數據最小化:只取所需,不要貪多
NBD:您認為有(you)哪些關鍵技術可(ke)能會去解決或(huo)者(zhe)緩解這些挑戰呢?
鄭(zheng)驍慶:要(yao)緩解“幻覺”問題,一(yi)種策(ce)略是(shi)“對齊”。目前,較為成熟的(de)技(ji)術手段(duan)是(shi)利用強化(hua)學習來(lai)實現與(yu)人(ren)類偏(pian)好(hao)的(de)對齊。在(zai)對齊人(ren)類偏(pian)好(hao)的(de)過程中,一(yi)個核心標準是(shi)“誠實性”,即模型必須提供真實信息,而非胡編亂造。
另(ling)外,“檢索增強生成(cheng)”(RAG)也是(shi)一項(xiang)關鍵技術。在提問(wen)時先提供相關的(de)背景資料(liao),模型會通過檢索這些資料(liao)來輔助生成(cheng)答(da)案(an),這樣可以在一定程度上提高生成(cheng)答(da)案(an)的(de)準確性(xing)和可信度,緩解單純依賴模型內部知(zhi)識庫可能產生的(de)“幻覺”問(wen)題。
還有一(yi)種技術是(shi)答(da)案生成(cheng)(cheng)的后續驗證。模(mo)型(xing)生成(cheng)(cheng)答(da)案后,我們可以利用(yong)其他模(mo)型(xing)對答(da)案中的關鍵觀點(dian)和要素(su)進行驗證,以確保正(zheng)確性(xing)。
對于數(shu)據(ju)隱(yin)私問題,高(gao)質(zhi)量的(de)(de)數(shu)據(ju)是高(gao)質(zhi)量應(ying)用的(de)(de)基礎,我認為企業(ye)需要找到創(chuang)新與數(shu)據(ju)隱(yin)私之間的(de)(de)平衡點。首先(xian),企業(ye)需要遵循數(shu)據(ju)最小化原則(ze),只收集和(he)使用與目標任務直接(jie)相關的(de)(de)最少量的(de)(de)數(shu)據(ju),只取所需,而不要貪多。
其次(ci),企業一定要做好數據的(de)加(jia)密和脫敏(min)處理。尤其是在AI應用中(zhong),模(mo)(mo)型的(de)訓(xun)練(lian)數據如果沒有保護(hu)好,攻擊者(zhe)可(ke)能通過模(mo)(mo)型推(tui)測(ce)出隱私信息,進而對企業和用戶帶來巨大的(de)安全隱患。
我們還可以考慮使用(yong)新技術來(lai)解決(jue)這個問題,比如聯(lian)(lian)邦(bang)(bang)學習,它允(yun)許多個數據(ju)(ju)(ju)擁(yong)有者各自貢獻出模型所需的(de)訓(xun)練數據(ju)(ju)(ju),在數據(ju)(ju)(ju)聯(lian)(lian)邦(bang)(bang)的(de)情況下完成模型的(de)訓(xun)練,而不會泄露數據(ju)(ju)(ju)擁(yong)有者的(de)數據(ju)(ju)(ju)。
AI處于“高級別模仿”階段 不具備“小樣本學習”能力
NBD:近日,OpenAI首(shou)席執行官薩(sa)姆·阿爾特曼在(zai)接受媒體采訪時表示,預(yu)計通用(yong)人工智能(AGI)將在(zai)2025年到來(lai)。在(zai)您看來(lai),我們離(li)AGI近了嗎?
鄭驍慶:阿爾特曼作為OpenAI的(de)(de)首席執(zhi)行(xing)官,從商業的(de)(de)角(jiao)度來(lai)說,他對于AGI的(de)(de)實現可能會比較樂觀。但對于我們研究者(zhe)來(lai)講,我持一定的(de)(de)保留(liu)意見(jian)。
當前的(de)(de)(de)(de)(de)AI技術(shu),實質上仍(reng)是(shi)一(yi)種高級別的(de)(de)(de)(de)(de)模(mo)仿,與人(ren)類的(de)(de)(de)(de)(de)智(zhi)能(neng)(neng)完全不一(yi)樣(yang)。人(ren)類的(de)(de)(de)(de)(de)智(zhi)能(neng)(neng),舉個(ge)例子,我們(men)從小(xiao)就(jiu)能(neng)(neng)流利地使用語言(yan),并產生語言(yan)的(de)(de)(de)(de)(de)新(xin)表達。但實際(ji)上,我們(men)在(zai)成長(chang)過程中接(jie)觸到(dao)(dao)語言(yan)環境的(de)(de)(de)(de)(de)數(shu)(shu)據量,遠(yuan)遠(yuan)小(xiao)于當前人(ren)工智(zhi)能(neng)(neng)模(mo)型接(jie)觸到(dao)(dao)的(de)(de)(de)(de)(de)數(shu)(shu)據量。也就(jiu)是(shi)說,人(ren)類大腦具(ju)有一(yi)種強大的(de)(de)(de)(de)(de)小(xiao)樣(yang)本(ben)學(xue)習能(neng)(neng)力(li),即僅憑少(shao)量樣(yang)本(ben),就(jiu)能(neng)(neng)泛化(hua)到(dao)(dao)未見過的(de)(de)(de)(de)(de)情境,而這是(shi)目(mu)前模(mo)型無法做到(dao)(dao)的(de)(de)(de)(de)(de)。
目(mu)前,關于AGI還(huan)存在一個爭議:AGI是要做仿真(zhen)(按(an)照人(ren)腦思(si)路(lu)來做),還(huan)是按(an)照實用主(zhu)(zhu)義的思(si)路(lu)來做?具體而言,仿真(zhen)路(lu)徑主(zhu)(zhu)張在深入理解(jie)和模擬(ni)人(ren)腦機制的基礎上構建人(ren)工智能系(xi)統;而實用主(zhu)(zhu)義路(lu)徑則(ze)更加注重(zhong)結果(guo),認為只要人(ren)工智能系(xi)統的輸出(chu)效果(guo)與(yu)人(ren)類相(xiang)當(dang),就可以認為其(qi)具備智能。
現(xian)在(zai)(zai)的發展主(zhu)(zhu)要是(shi)在(zai)(zai)走實用(yong)主(zhu)(zhu)義(yi)的道路,而這條發展路徑面臨的最大的問題在(zai)(zai)于,盡管AI在(zai)(zai)某些單一(yi)任務上(shang)可能(neng)表(biao)(biao)現(xian)非常優異(yi),但要從一(yi)個(ge)任務遷移到另一(yi)個(ge)任務,尤其是(shi)面對全新任務時,往往需要大量的新數據重新進(jin)行(xing)訓練。比(bi)如(ru),我們教會AI文字(zi)表(biao)(biao)達(da),它(ta)的語音(yin)處理能(neng)力可能(neng)就不理想;而教會它(ta)語音(yin),它(ta)的文字(zi)表(biao)(biao)達(da)能(neng)力又可能(neng)受到影響(xiang)。因此,在(zai)(zai)處理涉(she)及多種(zhong)數據形式(如(ru)文本、圖像(xiang)、音(yin)頻)的跨模態任務時,AI的表(biao)(biao)現(xian)仍然不夠(gou)出色。
人(ren)類(lei)智能(neng)完全不同,人(ren)類(lei)能(neng)夠(gou)依靠在其(qi)他(ta)任(ren)務(wu)中(zhong)積累(lei)的(de)經驗(yan),在新任(ren)務(wu)上(shang)同樣表現出色。即使(shi)面對未知的(de)任(ren)務(wu),人(ren)類(lei)也(ye)能(neng)規劃出探索和(he)研究的(de)路徑,從而順(shun)利完成任(ren)務(wu)。因(yin)此,我(wo)認為(wei)通(tong)用(yong)(yong)人(ren)工智能(neng)必(bi)須具備(bei)通(tong)用(yong)(yong)性和(he)遷移性。這種(zhong)通(tong)用(yong)(yong)性遷移性意味著,一旦(dan)AI在某個任(ren)務(wu)上(shang)學會某項技能(neng)或知識,它應該能(neng)夠(gou)將其(qi)遷移到各種(zhong)不同類(lei)型的(de)任(ren)務(wu)上(shang)。
另外一個值得探(tan)討(tao)的(de)概念是(shi)(shi),元(yuan)學(xue)(xue)習(Meta Learning)。之所以提及元(yuan)學(xue)(xue)習,是(shi)(shi)因為當前AI,包括ChatGPT在內,存在一個顯著的(de)問題:推理能力不足(zu)。元(yuan)學(xue)(xue)習是(shi)(shi)一種更(geng)高層次的(de)學(xue)(xue)習方法(fa),它關注的(de)是(shi)(shi)“學(xue)(xue)會如何(he)學(xue)(xue)習”(learning to learn),而不僅僅是(shi)(shi)學(xue)(xue)習什(shen)么。
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每日經(jing)濟(ji)新聞》報社(she)授權,嚴禁轉(zhuan)載或(huo)鏡像,違者必究。
讀(du)者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬(chou)。如您(nin)不希望(wang)作(zuo)品出現在本站,可聯系我們要求撤下(xia)您(nin)的(de)作(zuo)品。
歡(huan)迎(ying)關注每日(ri)經濟(ji)新聞(wen)APP