反駁AI規模擴展速度放緩論 Nvidia黃仁勳稱整個世界都判斷錯誤

撰文:格隆匯
出版:更新:

在2025年Nvidia(英偉達)GPU技術大會(GTC)的主題演講中,公司行政總裁黃仁勳談及人工智能(AI)的 「規模擴展法則」,認為在AI規模擴展速度正在放緩這一觀點上,幾乎 「整個世界都判斷錯誤」 。事實上得益於新出現的規模擴展方法和技術,AI的發展速度正比以往任何時候都要快。

他又指出需要注意的是,AI規模擴展方面的成功,對於公司向AI模型開發者和服務器提供商大量銷售圖形處理器(GPU)的業務而言,是極為關鍵的核心要素。

英偉達(NVIDIA,又名輝達)行政總裁黃仁勳2024年6月2日在演講時展示NVIDIA的Blackwell平台(Reuters)

亞馬遜等今年已購入360萬塊Blackwell AI晶片

他亦表示美國四大公有雲供應商﹕亞馬遜、微軟、Alphabet Inc.旗下谷歌和甲骨文,於去年購買了130萬塊公司前一代的Hopper AI晶片。2025年迄今,這一陣營已購買360萬塊Blackwell AI晶片,又預計2028年數據中心資本支出規模將突破1萬億美元。

談及新產品時,他表示下半年將過渡至Blackwell Ultra晶片,並正與台積電合作開發聯合封裝光網絡晶片,下半年將推出新版以太網晶片。下一次年度新推晶片將是Vera Rubin。下一次晶片升級將是Vera Rubin,距離現在還有一年時間。Rubin Ultra將於2027年的下半年推出。

2024年1月8日拍攝的插圖中,圖為美國科技公司輝達(Nvidia,又譯英偉達)的置於電腦主機板之上。(Reuters)

新一代產品Feynman架構3年後登場

在一個路線圖PPT中黃仁勳宣佈,Rubin之後的下一代命名Feynman,取自著名物理學家理查德・費曼。理查德・菲利普斯・費曼(Richard Phillips Feynman,1918 年 5 月 11 日 — 1988 年 2 月 15 日),美國理論物理學家,以對量子力學的路徑積分表述、量子電動力學、過冷液氦的超流性以及粒子物理學中部分子模型的研究聞名於世。因對量子電動力學的貢獻,費曼於 1965 年與朱利安・施温格及朝永振一郎共同獲得諾貝爾物理學獎。根據英偉達路線圖,Feynman架構將於2028年登場。

此外公司正式發布Dynamo,號稱是「AI 工廠的操作系統」。Dynamo是一個「分佈式推理服務庫」。本質上,它是一個針對用戶需求token而無法生產足夠token之間問題的開源解決方案。黃仁勳展示了一張關於推理的圖表,X軸顯示用戶每秒的Token數,Y軸顯示工廠每秒的Token數。在Dynamo、Grace Blackwell NVLink72超級晶片的加持下,Blackwell相比Hopper可實現25倍的性能提升。而在推理模型中,Blackwell的性能是Hopper的40倍。黃仁勳還打趣道,有了上述最新技術加持,搭建AI工廠的廠商「買得越多、省得越多」。