如果DeepSeek選擇華為 黃仁勳說的「災難」到底是什麼?

撰文:觀察者網
出版:更新:

4月15日黃仁勳接受Dwarkesh Patel的播客(podcast)專訪時,說了一句份量很重的話:「如果DeepSeek先在華為平台上發布,那對我們國家來說將是災難性的。」

在整場一個半小時的訪談裏,這句話顯得格外突兀。它既不是關於供應鏈的技術闡述,也不是關於TPU(張量處理單元)競爭的商業分析,而是一個高度情緒化的判斷。要讀懂它,必須把時間倒回去看。

就在這場訪談的前一周,多家媒體已經爆料DeepSeek下一代旗艦模型V4全面遷移至華為昇騰950PR,底層代碼從CUDA重寫為華為自研的CANN框架,按計劃4月下旬發布。也就是說,黃仁勳嘴裏那個被設定為「假設」的壞消息,其實已經在發生的路上。

Patel在訪談中追問得很直接:為什麼?DeepSeek是開源的,理論上可以跑在任何加速器上,即便它在華為昇騰上首發,在英偉達GPU上同樣能跑,區別到底在哪裏?黃仁勳的回答洩露了真正讓他介意的東西——「假設它是針對華為優化的,針對他們的架構化了,那就會讓我們處於劣勢」。

他把Dwarkesh描述的「全球最強模型運行在美國技術棧上」定義為「好消息」,反過來,如果一個來自中國的優秀開源模型以非美國硬件為首要優化目標、在非美國硬件上跑得最好,那才是真正的壞消息。這非常精確的暴露出:英偉達真正害怕的從來不是中國做出好模型,而是好模型不再以CUDA生態作為默認的優化起點。

這一層面紗被Dwarkesh的追問輕輕挑開以後,整場訪談很多看似「關心國家利益」的表述,才能還原出它商業本能的那一面。

延伸閱讀:黃仁勳親自介紹魔雪奇緣AI機械人 造價近800萬已進駐香港迪士尼

+11

英偉達真正的護城河從來不是GPU本身的算力,而是CUDA作為「事實標準」的軟件生態位。過去近二十年裏,幾乎所有主流AI框架、算子庫、開源模型的首發優化,都把CUDA作為默認起點。

這條生態護城河的運轉邏輯非常簡單:只要新模型先在CUDA上調通跑順,那麼哪怕華為、谷歌TPU、AMD MI300在紙面上單卡性能不差,它們在客戶那裏也只能是「備選方案」。因為遷移意味著重寫算子、重做精度校準、重新調參,工程代價可能以月計。而「事實標準」的地位一旦建立,就會自我強化:越多人優化CUDA,CUDA上跑得越好;越多人在CUDA上做研究,新工作自然繼續落在CUDA上。

DeepSeek若先在昇騰上發布,戳破的恰恰是這條鏈條的起點:這意味著至少存在一條真實、可運行、被頂級模型驗證過的非CUDA路徑,並且這條路徑上會沉澱下一批熟練的工程師、一套可複製的優化經驗、以及第一批用戶信心。這才是黃仁勳那句「災難性」的真實分量:不怕某一款晶片被替換,但怕「開源模型必須以CUDA為首要優化目標」這條默認規則出現第一個公開的反例。

把這一點放回中國算力基礎設施的真實圖譜上看,黃仁勳的焦慮就不再顯得誇張。

華為昇騰910C的單卡FP16算力大約是800TFLOPS,坦率說仍不及英偉達Blackwell旗艦,SemiAnalysis的估算顯示單卡性能差距大致在三倍左右;但華為選擇的不是單卡硬拼,而是系統工程層面的群體戰術。2025年4月推出的CloudMatrix384超節點,把384顆910C通過6912個400G光模塊全互聯堆疊在一起,BF16集群算力達到300PFLOPS,約為英偉達GB200NVL72旗艦集群的1.7倍,HBM(高頻寬記憶體)總容量更是達到後者的3.6倍。功耗代價確實驚人,整體功率近560千瓦,相當於英偉達同級方案的近四倍,但在中國可再生能源裝機全球第一的背景下,這個代價可以部分被「便宜的瓦特」吸收。

2025年9月的華為全聯接大會,徐直軍公布了更激進的路線圖:Atlas950超節點規模8192卡、四季度上市,Atlas960超節點規模15488卡、2027年四季度上市,昇騰950PR/DT、960、970三年路線依次展開。這是一條「以規模換效率,以系統換單點」的清晰敘事,而黃仁勳在訪談中提出的「五層蛋糕」,即最底層是能源、能源充足時晶片就夠用、中國能源充足所以7nm也夠,恰恰是對這條敘事的另一種表達方式,只不過他是從對手視角在說。

黃仁勳並不是沒有意識到華為這套打法在商業上意味著什麼,他只是沒法在鏡頭前用太直白的語言說。訪談裏他反覆強調一件事,中國是全球第二大計算市場,中國擁有世界上大約一半的AI研究人員,中國算力總量非常龐大:「如果他們想整合計算資源,完全可以滿足需求」。

延伸閱讀:字節跳動AI Seedance 2.0外網爆紅 生成影片超逼真震驚專業導演

+11

這些話通常被解讀為黃仁勳在為重返中國市場做輿論鋪墊,其實它們構成了一個完整的推理鏈:算力夠、能源夠、研究人員夠,唯一缺的是讓這些要素沿著非英偉達路徑組織起來的粘合劑;而這個粘合劑,就是一款可以讓全球開發者看見「在非CUDA棧上也能跑出世界級結果」的旗艦模型。

DeepSeekV3和R1在2025年初曾引發過一次全球震動,它們用極低成本訓出接近OpenAI水平的表現,第一次讓市場開始懷疑「算力決定一切」的範式。現在,V4如果真的以昇騰首發,其象徵意義將遠超V3。V3證明的是中國能做好模型,V4要證明的是中國能在自己的硬件上做好模型。這兩件事的差別,就是「客戶」和「對手」的差別。

理解了這一層,訪談裏黃仁勳那些看似不連貫的邏輯閃爍就能連成線。Patel在對話中其實遞出過好幾次尖鋭的反問,都被黃仁勳用策略性模糊處理掉。

主持人Patel問,既然你說所有美國AI實驗室都受限於算力,那讓中國算力比美國少、讓美國更早達到某個「Mythos級別」的能力上限,不是更符合美國利益嗎?黃仁勳回答說,要讓那種結果成立,得把情況推到極端,必須讓中國完全沒有算力,而這是做不到的。

這個回答其實繞過了Patel真正的問題:出口管制的目的從來不是讓對手歸零,而是維持12到18個月的能力窗口。黃仁勳把一個關於時間差的問題,偷換成了一個關於絕對值的問題。

這種辯論技巧在訪談裏出現了不止一次,它解釋了一個矛盾現象:黃仁勳一方面用DeepSeek的成功證明「出口管制沒用、中國反正會創新」,另一方面又用「再不賣中國就徹底脫離我們生態」來論證應該繼續賣晶片給中國。

如果前者為真,後者的邏輯就站不住腳,因為既然脫離不脫離都會創新,那麼賣晶片買到的「忠誠」就是虛構的。這個內在的不自洽,恰恰提示我們:黃仁勳的真實目標不是國家戰略推理,而是保住中國市場這個收入盤子的同時、保住CUDA作為事實標準的生態位——這兩件事現在正在同步滑落,他必須同時往兩頭拉。

訪談裏還有一段經常被忽略的對話,但它其實把黃仁勳的策略圖景交代得非常完整。Patel問,為什麼英偉達不同時開幾條架構路線,比如晶圓級晶片、大封裝晶片、不用CUDA的晶片?黃仁勳的回答是「我們模擬過了,效果更差」。

這個回答實際上還是前面說的戰略,英偉達不會自己去稀釋CUDA的標準地位,哪怕是內部。但他緊接著又承認,英偉達最近把Groq整合進了自己的CUDA生態,原因是token的平均售價上漲,高價值用戶願意為更低延遲付費,這開闢了一個全新的推理細分市場。

延伸閱讀:黃仁勳現身美國海底撈 親切合影還送簽名 盤點AI教父吃火鍋場面

+9

換句話說,英偉達的策略是「向外吸納、向內收斂」:所有能夠跑CUDA的加速器都可以被納入生態版圖,但CUDA本身必須是不可替代的那個中心。這種打法過去十年非常成功,因為它讓英偉達在各類專用晶片面前始終保持「平台」身份而非「玩家」身份。但這套打法在面對華為時,第一次失靈了。

華為不僅做晶片,還做網絡、做光模塊、做超節點互聯、做CANN框架、做MindSpore、做故障容錯訓練軟件,它是在英偉達的全棧覆蓋面上做另一個全棧。你無法把一個平行宇宙的全棧「納入」你的生態,你只能讓它成為你的對手。而一旦DeepSeek這樣的頂級開源模型開始為這個平行全棧背書,英偉達「平台vs玩家」的身份優勢就會鬆動。

再把視野拉回到中國大陸相關的部分,訪談中還有幾處值得單獨拎出來看。其一是黃仁勳罕見地使用了「研究性對話」這樣相當軟性的表達,說「把中國變成敵人,可能並非最佳方案」,並警告建立「美國封閉棧vs外國開源棧」兩個割裂生態對美國是「極其愚蠢」的結果。這段話讀起來像戰略分析,但它背後的商業現實是:英偉達在中國的業務正在被一刀一刀削。

從A100/H100被禁、到A800/H800出爐又被禁、到H20專供中國版在2025年4月一度被要求申請許可、再到7月恢復銷售但交付能力有限。據報道,字節、阿里、騰訊在被禁前三個月仍向英偉達下了超過160億美元(約1,253億港元)的H20訂單,這說明中國市場的真實需求仍在。

黃仁勳每呼籲一次「不要脫鈎」,背後對應的都是一次他能清楚看到的市場份額被實質性轉移。其二是他對中國算法能力的承認:「人工智能(AI)的大部分進步都源於算法的進步,而不僅僅是硬件的改進。」再加上中國擁有全球最龐大的AI研究人員隊伍:「難道不是他們最根本的優勢嗎?」

以這種表達方式,他在向美國政策圈傳遞「制裁無法阻止中國在AI上趕超」的信號,為解除出口限制鋪路;但同一套邏輯,若被中國方面接受,得到的結論卻是「既然算法優勢在手、算力通過系統工程可以補齊,那麼全面去CUDA化是有機會成功的」,這是一把雙刃劍,黃仁勳想要的是前半段效果,但後半段效果是他自己的論點附帶製造的。

把所有這些線索匯攏起來看,這場訪談的真正看點不在黃仁勳說了什麼,而在他選擇在什麼時間、以什麼方式去說。

延伸閲讀:華強北AI八駿爆紅 機械人戲院賣爆谷 深圳智能產業鏈震驚外國客

+4

4月15日這個時間點,卡在DeepSeekV4傳出昇騰首發消息與V4正式發布之間;選擇Patel這個以硬核提問著稱的播客,而非傳統財經媒體,本身就說明英偉達希望把訊息直接打進技術社群和政策圈那個交集;訪談中所有關於中國的段落:五層蛋糕、能源優勢、算法優勢、50%的研究人員、龐大的計算市場等都在指向同一個結論:你無法通過阻斷來贏,你只能通過保持在場來贏。這是一套典型的「讓我繼續賣」的論證,只不過包裝成了國家利益框架。

因此邏輯就清晰了:第一,黃仁勳的決策優先級中,CUDA生態的標準地位排在單款產品之上、甚至排在單一市場份額之上,所以他寧可被看作在為中國說話,也不願看到非CUDA棧出現一個成功的全棧範本;

第二,他對競爭的判斷是「時間維度而非終點維度」,華為最終能不能追上不重要,重要的是在追上之前英偉達必須保持在場;

第三,他對「開源」這件事的態度帶有明顯的工具理性,開源好不好,取決於開源模型首發時是優化哪一家的硬件,這和他在2025年7月北京之行公開盛讚DeepSeek是「革命性開源推理模型」之間,已經有了明顯的情緒落差。

他在訪談裏其實是在同時向華盛頓和北京喊話。向華盛頓說「請讓我繼續賣,否則我們會輸掉生態」,向北京說「請繼續用我的晶片,否則你們會被迫走一條更貴的路」。

所以,黃仁勳對「DeepSeek與華為合作」的那句「災難性」評論,是一次精心選擇時機的戰略喊話,對象是即將被一款中國頂級開源模型和一家中國全棧廠商共同背書的「另一條技術路徑」的現實可能。如果DeepSeekV4遷移到昇騰,代表著頂級模型、頂級硬件、開源傳播這三個變量第一次在中國大陸完整合體;而這個合體一旦在全球開源社群中形成首發效應,過去二十年英偉達賴以統治AI產業的「模型-框架-硬件」默認棧就會出現第一個被主流證實可用的備份棧。

技術上它未必立刻動搖CUDA,但敘事上它動搖了「CUDA是唯一起點」這件事。而敘事,在快速演化的產業裏,往往比技術本身先一步決定錢流向哪裏。這就是黃仁勳為什麼要在這個特定的四月,用「災難性」這三個字,把整場關於供應鏈、TPU、蛋糕和架構的訪談,引向那個他其實最不想談、但又必須表態的主題。

本文獲《觀察者網》授權轉載。

本文內容反映原文作者的意見,並不代表《香港01》的立場。