在ChatGPT的體驗上,張鈸有一段“生氣”的體驗。一年前,他就詢問還處于實驗室階段的ChatGPT一個簡單的問題:清華大學校歌歌詞是什么?ChatGPT迅速“一本正經(jīng)地胡說八道”。張鈸當場指正并輸入了正確的校歌歌詞。沒想到,此后張鈸數(shù)度詢問同一個問題,ChatGPT仍是“胡說八道”。
(資料圖片僅供參考)
從這個小小的案例中,這位中國科學院院士、清華大學人工智能研究院名譽院長總結(jié)了幾個ChatGPT至今難以避免的“軟肋”:結(jié)果不確定、“知錯不改”。他在2023世界人工智能大會上表示,只有徹底把以ChatGPT為代表的大模型與生成式人工智能的內(nèi)部工作原理搞清楚,才能找到未來發(fā)展的“金鑰匙”。
如何評估ChatGPT ,已迸發(fā)出AGI“火花”
去年11月,ChatGPT所引發(fā)的浪潮席卷全球。ChatGPT究竟算不算通用人工智能(AGI)?張鈸用“向AGI邁出一步”來總結(jié),認為它已迸發(fā)出AGI的“火花”。
“ChatGPT具有AGI的兩個特征。”張鈸具體解釋,一方面,在對話聊天領域,它已達到行為主義所主張的人工智能目標——讓機器的行為與人類的行為相似。另一方面,它具備“開領域、多任務”的特點,開始與領域無關(guān),這是一個重大突破,此前的第一代人工智能主要靠知識驅(qū)動,第二代人工智能主要靠數(shù)據(jù)驅(qū)動,但它們都只能在限定領域里完成單個任務。但他也認為,ChatGPT目前只在語言處理領域中達到目標,所以還不能稱作通用人工智能。
在這種客觀的評估下,張鈸又指出,ChatGPT之所以能達到這樣的水平,主要是因為有了3項關(guān)鍵技術(shù)的突破,第一是基于詞嵌入技術(shù)的文本語義表述;第二是基于注意力機制的轉(zhuǎn)換器突破,今天的大模型其實就是一個大轉(zhuǎn)換器;第三則是基于預測下一個詞的自監(jiān)督學習。“全世界的科學家們經(jīng)過約70年的探索,突破了三個關(guān)鍵技術(shù),讓機器在處理文本上有了本質(zhì)變化,它不再被當作數(shù)據(jù),而是被當作知識來處理。”
據(jù)此,他認為,通往AGI之路,需要在過去“數(shù)據(jù)、算法、算力”三要素的基礎上,加上“知識”這個新要素。
如何看待潛力, AGI要在困惑中“突圍”
猶如推開一扇門,ChatGPT帶動的大模型與生成式人工智能技術(shù),將帶來不可阻擋的三件事。
在張鈸看來,首當其沖的是人工智能領域本身的科技變革。事實上,直至今日,人工智能都沒有一套通用理論基礎,因為此前所有的人工智能都是在限定領域里完成單個任務,而ChatGPT所引發(fā)的技術(shù)革命為此掃清了障礙,當人工智能得以與領域脫鉤,才有可能建立一套通用理論。但當下,人們對生成式人工智能仍存困惑,比如它的能力從何而來,連開發(fā)者都無法從現(xiàn)象里還原本質(zhì)。它就像一個魔盒,一邊能生成讓人驚艷的結(jié)果,另一邊也會產(chǎn)生胡說八道的“幻覺”。張鈸認為,這就是一個突破口,“如果能把生成式人工智能的內(nèi)部工作原理搞清楚,就能找到發(fā)展的‘金鑰匙’”。
第二件不可阻擋的事是產(chǎn)業(yè)變革,通過以ChatGPT為代表的生成式人工智能,我們可以建立起與領域無關(guān)的通用模型或者算法,在此基礎上生產(chǎn)的硬件和軟件才會迎來爆發(fā)式發(fā)展。
此外,對生成式人工智能的治理也是不可阻擋的趨勢。目前,ChatGPT有3個明顯的缺點,一是容易“胡說八道”,錯誤是必然的;二是輸出受提示詞的影響巨大,改變輸入會得到完全不同的結(jié)果;三是它不知道自己犯錯,錯了也難以改正,說明輸出不一定會符合要求。而這些缺點,恰恰是人工智能未來發(fā)展的潛力所在。
面向未來,他指出,中國要發(fā)展的第三代人工智能,是一種安全、可信、可控、可靠的人工智能技術(shù),特別是利用大數(shù)據(jù)的機器學習,結(jié)果一定要是正確的,這樣才能推動創(chuàng)新應用和產(chǎn)業(yè)發(fā)展,為人工智能高水平發(fā)展提供動力和支撐。
作者:徐晶卉
編輯:商慧
責任編輯:唐瑋婕
*文匯獨家稿件,轉(zhuǎn)載請注明出處。