馬斯克Grok 3發布會「坐C位」2華人是誰? xAI創始團隊四成華裔

撰文:外部來稿(國際)
出版:更新:

當地時間2月17日,馬斯克(Elon Musk)旗下AI公司「xAI」直播發布新一代AI大模型Grok 3。發布會上,坐在C位的兩位華人科學家——xAI聯合創始人Jimmy Ba和吳宇懷(Yuhuai Wu)引人注目。

2025年2月11日,美國華盛頓白宮橢圓形辦公室,全球首富馬斯克(Elon Musk)站在總統特朗普(Donald Trump,不在圖中)身旁向記者發表講話。(Reuters)

影片顯示,馬斯克、Jimmy Ba、吳宇懷以及xAI首席工程師Igor Babuschkin並肩而坐。Grok 3的介紹主要由三位技術負責人完成,坐在最右邊的馬斯克罕見地化身「點頭機器」,還表示「自己什麼也沒幹」。

左起:xAI團隊的Igor Babuschkin、Jimmy Ba、吳宇懷、馬斯克(影片截圖)

「C位」創始成員之一是杭州95後學霸

公開報道顯示,吳宇懷1995年出生於杭州建德,小學一年級就讀於新安江一小,後轉學到杭州紫陽小學;初中時進入杭州建蘭中學學習,此後轉到加拿大念高中。

吳宇懷(X平台)

2015年,吳宇懷以滿績點的成績,畢業於加拿大紐布倫斯威克大學(University of New Brunswick);2021年,博士畢業於多倫多大學機器學習專業,做過「深度學習之父」欣頓(Geoffrey Hinton,即2024年諾貝爾物理學獎得主)的學生。博士期間,他還曾在Google DeepMind和OpenAI實習,此後在Google任職並同時在史丹福大學(Stanford University)做博士後研究。

在2016年NIPS大會時,吳宇懷有三篇聯合署名為第一作者的論文被接受。創辦於1987年的NIPS大會是機器學習領域的世界頂級大會。2017年的報道顯示,當年僅有七位華人學生榮獲Google博士生獎研金,就讀於多倫多大學的吳宇懷就位列其中。

吳宇懷的主要研究方向是打造具備推理能力的機器,是自訓練增強推理模型STAR、語言模型Minerva、定理證明器Alpha Geometry等項目的作者或核心貢獻者,在國際頂會發表過諸多論文,比如在《Nature》上發表論文「Solving Olympiad Geometry Without Human Demonstrations」。這篇論文詳細描述了Alpha Geometry項目的設計和成效。論文討論了如何通過合成大量的定理和證明來訓練AI模型,以解決高難度的幾何問題,標誌着AI在數學推理領域的一個重要突破。

2022年10月,吳宇懷曾在機器之心組織的線上分享中介紹稱,他立志於創造一個善於推理的人工智能,用於解決所有數學難題。「我們不想創建一種只會像人一樣說話的語言模型。」吳宇懷說道,「我們希望它明白它在說什麼。」2023年7月,xAI成立,吳宇懷加入並擔任聯合創始人。他X賬號首頁至今置頂着當天的一條內容:「解決數學問題,了解宇宙本質。」

新安江一小方艷雲老師當時擔任吳宇懷的班主任,據她回憶,「他在班裏是班長,從小就很穩重,是一個很自律、很上進的男孩。」

當時擔任吳宇懷數學老師的建蘭中學校長陸韻表示,「他的數學非常好,學習很會思考,也很輕鬆。」陸校長記得,初中時,吳宇懷研究一道數學難題,「死磕」了一天後成功解出。當時,他加了八條輔助線。此外,吳宇懷在初中時語文也非常出色,還是語文課代表。

佔據發布會舞台「C位」的另一名華人科學家Jimmy Ba也是xAI的初創團隊成員之一。公開信息顯示,Jimmy Ba是多倫多大學計算機科學助理教授,他博士畢業於多倫多大學,曾師從欣頓攻讀博士學位,同時他也做過吳宇懷的老師。Jimmy Ba的主要研究方向為用於深度神經網絡的高效學習算法,其研究興趣也包括強化學習、自然語言處理和人工智能等領域。

Jimmy Ba (個人主頁)

Jimmy Ba在學術界以其紮實的理論功底著稱,他是訓練深度學習模型的首選算法之一Adam optimizer的開發者。Adam optimizer即自適應矩估計優化器,是深度學習常用算法,由Jimmy Ba和另一名科學家在2014年提出。他的博士論文奠定了許多現代AI訓練方法的基礎。2016年,Jimmy Ba獲得了Facebook機器學習研究生獎學金。2023年2月,他榮獲斯隆研究獎。

xAI創始團隊四成是華人

值得注意的是,xAI於2023年7月成立時公布的12人初創團隊名單中,除吳宇懷和Jimmy Ba外還有三名華人,分別為楊格(Greg Yang)、張國棟(Guodong Zhang)和戴子航(Zihang Dai)。這也意味着,xAI創始團隊裏華人的比例高達四成。如果考慮到馬斯克也「佔了一個名額」,那麼剩下11人裏,華人比例幾乎達到一半。

xAI的12名創始團隊成員裏有5名華人。(xAI官網截圖)

相比之下,開發ChatGPT的研究員中,華人佔比約為五分之一。有行業資深專家當時對這一現象評價稱,「中國人佔五分之一的話是平均水平」,可是xAI已經遠遠超過了這個數字。

據公開報道顯示,楊格出生於湖南,初中開始前往美國學習,本科和碩士學位都在哈佛大學數學系攻讀,期間師從丘成桐教授。2018年,楊格曾獲得本科生數學領域最高榮譽摩根獎提名。

2019年,楊格(Greg Yang)與丘成桐合影。(X平台)

從哈佛畢業時,楊格本打算入職Google,但丘成桐勸他,「Google這種很差的公司就不要去了」。隨後,丘成桐向微軟研究院的負責人沈向洋推薦了楊格,沈向洋則安排了菲爾茲獎得主麥克對楊格進行面試。

麥克面試後讚嘆不已,稱這個年輕人「非常出色」。沈向洋當時就對楊格講:「你把Google的Offer拿來給我看一看,我給你加一塊錢,就來微軟吧。」

在入職微軟後,楊格擔任微軟雷蒙德研究院的研究員,曾參與過微軟與OpenAI在大模型上的合作。在微軟期間,楊格的重要成果之一是開發「張量程序」(Tensor Programs)框架,其中還用GPT-3對所提出的超參數遷移方法進行了驗證,相關論文已收錄於NeurIPS、ICML等頂會。

作為楊格的重點研究項目,「張量程序」的長期目標是開發大規模深度學習的「萬物理論」,也就是找到一種理論上的規則,可以真正理解AI大模型的行為。這一理論在AI領域具有革命性意義,能夠優化大規模神經網絡的訓練方式,提高AI模型的泛化能力。

楊格的研究方向深受數學驅動。當時,xAI官宣成立後,楊格曾迅速發布推文稱:「深度學習的數學是深奧、美麗而又非常有效的。發展出適用於大型神經網絡的『萬物理論』將對將人工智能提升到新水平起到關鍵作用。反過來,這種人工智能將使每個人都能以前所未有的方式理解我們的數學世界。數學用於人工智能,人工智能用於數學!」

此外,xAI初創團隊中的張國棟和戴子航均是在國內本科畢業後,才前往美國進行的深造。張國棟本科畢業於浙江大學信息工程專業,隨後前往多倫多大學攻讀碩士和博士學位,並於2022年畢業後加入DeepMind。他在神經網絡優化和強化學習方面有深厚的研究積累。

張國棟(X平台)

張國棟的研究風格兼具理論深度和工程實踐能力,他不僅發表了大量高質量論文,同時也參與了多個前沿AI項目的研發。加入xAI之後,他的研究方向主要聚焦於如何優化AI訓練效率,並提升模型的穩定性。

據浙江大學官網介紹,張國棟於2013年考入浙大,學業成績連續三年名列專業第一,曾獲得浙江大學最高獎學金榮譽——竺可楨獎學金、美國大學生數學建模一等獎、全國大學生數學建模一等獎、浙江省大學生物理創新競賽一等獎。2016年11月,張國棟前往微軟亞洲研究院(北京)實習。2022年,張國棟還獲得了蘋果獎學金,是4位獲獎的華人學者之一。

戴子航本科畢業於清華大學計算機科學系,2020年博士畢業於卡內基梅隆大學計算機系,隨後加入Google研究院。他在自然語言處理(NLP)領域擁有深厚的積累,尤其擅長 Transformer架構的優化與創新。

戴子航(X平台)

他的研究貢獻之一,是提出了多種提升AI語言模型訓練效率的方法,在提高AI語言理解能力方面做出了突破性貢獻。他曾在Google和百度美區實習,並在多個頂級AI會議上發表論文。

本文獲《觀察者網》授權轉載