DeepMind「通才」AI Gato面世 邁向人類智慧?

撰文:孔祥威
出版:更新:

科技巨頭Alphabet轄下人工智能(AI)科研公司DeepMind,上月中推出新AI模型Gato,能執行近600種任務。學界對此反應兩極,有學者認為這預示了「人工通用智能」(Artificial General Intelligence,AGI)有望實現;但也有人認為這是過度吹捧。Gato相比過往的AI有什麼特別之處?它是不是AGI?匹敵人類智慧的AI又是否空中樓閣?

懂得玩Atari電子遊戲、為相片配上說明文字、對話聊天、利用機械臂堆疊積木……上月中DeepMind發表的AI Gato,總共能夠執行604種任務。DeepMind形容,Gato是一個「通才」(generalist)AI。

相比其他AI一般只能執行單一任務,Gato能夠執行逾600項任務。圖為DeepMind另一AI AlphaGo擊敗韓國圍棋棋手李世乭(前排右二)。(Getty Images)

AI「遊戲結束」

Gato跟其他AI一樣以例子來學習。研究人員把海量文字、圖片、按鍵、關節活動等數據,以「代幣」方式向Gata呈現和訓練。Gato的架構與多數現有AI系統沒有太大差異。它跟OpenAI開發的大型語言AI模型GPT-3,同樣是Transformer架構。在2017年,Transformer基本上已經是處理複雜任務時的AI架構必然之選,有能力總結文件內容、生成音樂、分類圖片中的物件、分析蛋白質序列等。但Gato的訓練參數(parameters),比一些只執行單一任務的AI少很多,只有12億,GPT-3有多達1,700億。研究團隊解釋這是刻意,讓Gato能夠實時操控機械臂。

最重要的研究成果是Gato作為「通才」AI。過去DeepMind的AI AlphaZero在學習過下圍棋後,需要先忘記才能再學習象棋。Gato研究的共同作者Scott Reed指出:「大多數現有AI系統,只能每次執行單一任務或在狹窄的領域運作。這研究的重要意義,主要是一個代理人利用一個模型,就能做到不同任務。」

保羅艾倫AI研究所(Allen Institute for AI)科學家Jack Hessel指出,多功能的單一AI系統並非完全新事。例如,Google的搜尋功能Google Search近來已開始使用「多任務統一模型」(Multitask Unified Model,MUM),可同時處理文字、圖片、影片,得出更仔細和準確的搜尋結果。Hessel說,Gato較新穎之處是它能處理的任務之多樣性。

不過,Gato似乎真的只有「通才」而非每樣皆專。例如在談話時,它的回應經常是非常表面,甚至有時連一些事實也搞錯(被問法國首都何在時,回應了馬賽);為圖片配文字說明時,Gato會弄錯人物性別;用機械臂疊積木時,正確率只有60%。惟DeepMind聲稱,在604項任務中,Gato在450項中有超過一半情況下都比「專才」AI好。

加拿大亞伯達大學計算機科學助理教授Matthew Guzdial指出:「在AI和機器學習領域,有很多人認為要開發出通用系統,如果你也支持這一派,那麼Gato是重要成果。」所以,儘管仍有明顯缺陷,Gato的通才表現仍引起了少數AI學者吹奏。Gato研究共同作者Nando de Freitas在社交媒體Twitter上揚言「遊戲已結束!」更有些外媒以「接近實現人類智能」之類的標題報道渲染。

DeepMind的「通才」AI Gato,懂得打機、為圖片配文字說明、聊天、利用機械臂堆疊積木等。有研究人員聲稱,Gato預示了通用人工智能(AGI)的實現方式,但也有學者批評,Gato的「通才」能力過譽。(DeepMind圖片)

過譽的「通才」

de Freitas所謂「遊戲結束」的意思是,他認為從Gato的成果可以預見,實現AGI「現在只是完全關乎規模」。這涉牽到AI學術界中,長期存在對於如何實現AGI的爭論。一直以來,在科幻小說之外,現實中AI仍流於解決一些單一而瑣碎的工作,例如編寫程式、提供釀啤酒的建議、在生物科研上預測蛋白質摺疊(protein folding)等;是所謂「弱」或「窄」AI。至於「強」AI,也所謂AGI,其實是一個空泛的概念,大意是一種匹敵、甚至超越人類智慧的AI。

有些AI學者和科技業者甚至早已擔心和警告,AGI可以為人類文明帶來反烏托邦的後果,例如它的智能將會遠遠高於人類,人類無法將它「熄機」之類。牛津大學未來人類研究院創立總監、哲學家Nick Bostrom警告,能超越生物智能的「超級智能」系統,可以取代人類成為地球上的主要生命形態;Tesla行政總裁馬斯克(Elon Musk)也曾預言,AI會對人類存亡構成威脅。

包括de Freitas在內的一派推測,只要持續加大規模,終有一日能夠製造出AGI。例如2019年,DeepMind科學家Richard Sutton撰寫《痛苦的教訓》(The Bitter Lesson)指出,當科學家試圖以人類知識和特定規則創建AI程式時,它們很多時都會被一些僅僅利用更多數據、更強運算能力的對手擊敗。所以de Freitas認為在這場爭論中,Gato證明了這種進路是對的:「只是關乎把這些模型弄得更大型、更安全、運算更高效、採樣更快、記憶更智能、模態(modalities)更多、創新的數據、線上/線下……解決這些挑戰,將可實現AGI。」

既然只是空泛的概念,要如何證明AGI已經存在,自然也沒有公認的方法。AI先驅圖靈(Alan Turing)曾提出,這種AI理應能夠在文字對話中做到與人類難以分辨;Apple共同創辦人Steve Wozniak曾說,AGI應能夠隨意進入一間屋後,知道如何沖出一杯咖啡。也有人提議過,看看AI可否取得學位,或者測試它們可否成功從事真實世界的職業。

其實,當de Freitas在Twitter上被問及Gato距離通過圖靈測試還有多遠,他回應「仍然很遠」。不少學者也批評,有些評論對於Gato的能力過譽。AI學者團體Knives & Paintbrushes成員Mike Cook質疑,Gato的通才能力容易令人誤解:「聽起來寫文字和控制機械人很不同,但實際上這跟GPT-3能夠理解英文和編程語言Python,沒有太大分別。」

美國紐約大學心理學教授、軟件商Robust.AI創辦人Gary Marcus說,Gato反映了AI領域中存在不健康的「勝利主義者文化」;很多被過度吹捧為有潛力達至人類智慧水平的深度學習模型,仍會犯下一些錯誤,而且「如果人類犯了這種錯,你肯定會覺得這個人有問題」。

此外,Marcus和麻省理工(MIT)語言AI專家Jacob Andreas均指出,Gato雖然經訓練後能執行各種任務,但面對新的挑戰時,它仍無法以邏輯分析和解決那問題,所以遠遠未能稱得上具有人類智慧的AGI。

所以Marcus批評,Gato研究成果更多只是取巧炫技:「可以愚弄到未經受訓去理解這些東西的一般人,但不代表它真的接近AGI。」英國海威大學(Heriot-Watt University)計算機科學教授Oliver Lemon也同意,「遊戲結束」的說法不準確,Gato也不是AGI。他說:「研究成果中有很多貌似厲害的例子都是經過刻意選擇的」。

Gato重燃了如何和能否實現通用人工智能(AGI)的爭論。有學者質疑,單靠增加數據和運算規模並不足夠,需要更多新的概念和知識,距離製造出AGI仍然很遠。(Getty Images)

實現人類智慧之辨

更根本的討論是,相對於de Freitas,另一派AI學者對於這種以加大規模的方式製造AGI、甚至AGI本身到底可不可能存在均非常質疑。這種有關超越人類智慧的AI爭議,在學術界是一直未解的老問題。2020年6月OpenAI發表GPT-3語言AI模型時,也曾再掀討論,如今案件又再重演。

加拿大亞伯達大學計算機科學助理教授Guzdial認為,AI「短期內都不可能達到人類智慧水平」;他傾向預計「會出現大量更加有用的小模型」。即使de Freitas的DeepMind同事Jackie Kay和Scott Reed也比較保守,不認為Gato的研究結果,足以令他們對於AGI的發展可作任何預測。

軟件商Robust.AI創辦人Marcus認為,AGI的概念或許陳義過高:「它不是那麼神奇的事。但粗略來說,我們指的是一些系統,能夠靈活、有效和可靠地,解決一些它們未遇上過的問題。」Facebook母公司Meta的首席AI科學家Yann LeCun也同意。他在上月中的網誌中「重申幾個事實」:「根本沒有所謂AGI。達到『人類程度的AI』可能是一個有用的目標,但即使人類也是術業有專攻。」

也有些這一派的學者主張,現有的知識並不足以實現AGI。Lemon認為,Gato確實展現了良好的研究成果,訓練AI完成多種任務,也可能奠下了一個扎實的知識基礎,來製造能力更強的AI;不過他也「肯定,深度學習不是故事的結局。未來將會有其他創新,填補目前在創意和互動學習上的空白」。

Lecun承認,學界在邁向人類程度AI確實有「某些」進展,不過他認為單靠加大規模並不足夠,因為目前仍缺乏某些基礎概念。當中有些新概念,例如「廣泛自主監督學習」(generalized self-supervised learning),可能快將出現,但仍未知道到底還需要多少個新概念,因此無法預測還有多久才能實現人類智慧水平的AI。他解釋道:「我不認為這單純是規模問題。我們仍未有一個學習範式,令機器可以像人類和很多非人類的嬰兒一樣,學習世界如何運作。」

他主張有必要找出新的概念,令機器能夠:像嬰兒般以觀察來學習世界運作;學習預測某個主題如何透過行動影響世界;學習階層式表現來對抽象事物作長期預測;妥善處理世界並非完全可預測的事實;預測行動先後順序的效果,以作理性思考和計劃;有階段地計劃和分解一項複雜任務成諸多細項等。他不覺得這些障礙可以輕易克服,也不肯定如何解決。

另有一派意見主張,與其追逐AGI,不如加緊開發其他更實用的AI。AI及機械人專家Emmanuel Kahembwe認為:「現在有很多有趣的題目都被放到一邊,資金不足,也沒有受到足夠注視,但這些都不是科技巨頭和其中的科學家所感興趣的。」資助AI項目的慈善組織Patrick J. McGovern基金主席Vilas Dhar也同意:「AGI是好的概念,除了一點,它也分散了我們的注意,忽視了今天應該要用AI來解決的問題。」