諾貝爾得主阿西莫格魯評DeepSeek:人工智能「斯普特尼克時刻」?

撰文:外部來稿(國際)
出版:更新:

儘管美國人工智能行業確實需要重新洗牌,但中國初創企業在科技巨頭主導的領域實現突破的消息引發了一些棘手問題。幸運的是,如果美國科技領袖和政策制定者能從深度求索(DeepSeek)的成功中汲取正確經驗,最終可能對各方都有裨益。

1月20日深度求索R1(DeepSeek-R1)模型的發布導致英偉達股價暴跌、多家科技公司市值驟降後,有人宣稱這是中美人工智能霸權爭奪戰的「斯普特尼克時刻」。雖然美國AI行業確實需要重新洗牌,但這一事件引發了若干值得深思的問題。

美國科技界對人工智能的投資規模堪稱龐大,高盛估計「科技巨頭、企業和公用事業公司未來幾年將在支持AI的資本支出上投入約1萬億美元」。然而長期以來,包括我在內的許多觀察人士一直在質疑美國AI投資與發展的方向。

所有頭部企業都遵循基本相同的策略(儘管Meta通過部分開源模式稍顯不同),整個行業似乎把雞蛋都放在同一個籃子裏。無一例外,美國科技公司都痴迷於規模擴張。他們援引尚未被證實的「擴展法則」,假設向模型輸入更多數據和算力就能解鎖更強大的能力。有人甚至斷言「規模就是一切」。

在1月20日之前,美國公司不願考慮替代方案,即放棄基於海量數據集預訓練、用於預測序列中下一個詞的基礎模型。基於這種優先考量,他們幾乎只專注於擴散模型和旨在執行人類(或類人)任務的聊天機械人。雖然深度求索的方法大體相同,但其似乎更倚重強化學習、專家混合方法(使用多個更高效的小模型)、知識蒸餾和精細化思維鏈推理。據報道,這種策略使其能夠以極小成本開發出具有競爭力的模型。

儘管有人質疑深度求索是否透露了全部細節,但該事件暴露了美國AI行業的「群體思維」。對更廉價、更具前景的替代方案的視而不見,加之過度炒作,正是西蒙·約翰遜與我在生成式AI時代開啟前夕合著的《權力與進步》中所預言的。現在的問題是,美國行業是否還存在其他更危險的盲點。例如,美國科技巨頭是否錯失了將模型導向更「以人為本」方向的機遇?我推測答案是肯定的,但唯有時間能給出答案。

另一個問題是,中國是否正在實現彎道超車?

深度求索的成就在於工程實踐:將相同方法以更高效的方式組合運用。中國企業和科研機構能否邁出下一步,開創具有顛覆性的技術、產品和路徑,仍有待觀察。

此外,深度求索似乎不同於多數依賴政府資助或為政府開發技術的中國AI企業。如果這家從對沖基金剝離的公司此前是在雷達之外運作,那麼當其進入聚光燈下,其創造力與活力能否延續?

第三個問題涉及地緣政治。深度求索事件是否意味着美國出口管制等遏制中國AI研究的措施已然失效?答案同樣不明朗。雖然深度求索使用較舊的低性能晶片訓練了最新模型(V3和R1),但若要實現更大突破和擴展,可能仍需最尖端晶片。

不過顯而易見的是,美國零和策略既不現實也不明智。這種策略唯有在相信我們正邁向人工通用智能(能在任何認知任務中比肩人類的模型),且先實現AGI者將獲得巨大地緣優勢的前提下才有意義。固守這兩個未經證實的假設,我們錯失了與中方在諸多領域開展富有成效合作的機會。例如,若某國開發出提升人類生產力或優化能源管控的模型,這類創新若能廣泛應用,對兩國都大有裨益。

與美國同行相似,深度求索也渴望開發AGI,而創建訓練成本顯著降低的模型可能改變遊戲規則。但通過既有方法降低開發成本,並不會在未來幾年奇蹟般地實現AGI。短期內能否達成AGI仍是未解之謎(其可取性則更存爭議)。

儘管我們尚不掌握深度求索模型開發的全部細節,也不明確其成就對AI產業未來的全部意義,但有一點似乎顯而易見:這家中國新銳企業戳破了科技界對規模擴張的執念,甚至可能動搖了其自滿情緒。

本文獲微信公眾號「新經濟學家智庫」授權轉載