華為挑戰Nvidia霸主地位 美國封鎖下成中國企業發展AI唯一驅動力

撰文:聯合早報
出版:更新:

本文獲《聯合早報》授權轉載。

圖為2012年4月17日,鏡頭下華為位於深圳的總部外牆,裝有公司標誌。(Reuters)

正當美國晶片巨頭英偉達(Nvidia)乘著人工智能(AI)浪潮迅猛前行,來自中國的競爭對手華為也在悄然提速發力,兩家科技巨頭的競爭態勢驟然升級。

最近幾周,華為在AI晶片領域的新動向頻頻登上英美主流媒體的版面。

美國《華爾街日報》星期一(4月28日)引述知情人士稱,華為已與國內數家科技大廠接觸,邀請它們一同測試自家最新、最強的AI處理器——昇騰910D。華為預期最快在5月底就能拿到首批樣品。

知情人士透露,昇騰910D採用了先進的封裝技術,通過堆疊更多效能較低的晶片,抬高整體運算效能。

華為的期望是,這款最新晶片能超越英偉達2022年推出、目前在AI訓練領域幾乎是標配的熱門晶片H100。但知情人士坦言,910D功耗偏高,整體能效還是追不上H100。

同時,華為也在積極推進昇騰910B和910C兩款晶片的大規模量產。預計今年內,華為將向國有電信運營商、字節跳動等客戶交付逾80萬塊晶片。有些客戶已和華為洽談,打算進一步加大採購910C。

2019年,華為推出「昇騰910」。(視覺中國)

昇騰910系列晶片最早在2019年就亮相了,初代晶片由台積電以七納米工藝代工。但自從華為被美國列入黑名單後,後續的910B和910C才不得不交給中芯國際接棒,使用七納米工藝製造。

在產品定位上,華為希望910B能接替英偉達為中國市場定制的H20晶片,而更高端的910C則是衝著H100去。根據美國科技博客Tom's Hardware測試,910C的推理性能已經達到H100的60%。

路透社指出,與910D相似,910C也是靠「堆疊法」來增強算力和內存。換句話說,這些晶片並未出現根本性的技術突破,更像是在現有技術的基礎上進一步優化。

今年4月,華為又推出了名為CloudMatrix 384的AI晶片「集群」系統,延續了相同的思路——把多顆晶片串聯起來,堆出一台大算力機器。這套系統集成了384顆昇騰910C,主要用於AI模型開發等高負載應用。

英國《金融時報》星期三(4月30日)報道,華為目前已向中國客戶交付10多套CloudMatrix集群。

華為推出CloudMatrix意在挑戰英偉達的旗艦集群NVL72,但NVL72使用了72顆性能強悍的GB200超級晶片,單顆晶片的運算能力遠勝910C,甚至比前一代H100還強30倍。

為此,華為通過「超級節點」技術,以光通信方式串聯384顆處理器,嘗試借規模和架構優勢反超NVL72。在展示材料中,華為宣稱CloudMatrix在關鍵計算指標上全面超越NVL72,整體算力高出67%,內存容量也超過三倍。

SemiAnalysis分析師帕特爾認為,華為借助先進的網絡架構和數量優勢,有效彌補了晶片的性能短板,「中國現在已擁有一套足以超越英偉達的AI系統」。

2025年4月30日,英偉達(NVIDIA)行政總裁黃仁勳在白宮「投資美國」活動上與美國總統特朗普在台上發言。(Reuters)

華為挑戰英偉達

華為近期頻頻出手,動作之密集,或許不僅是為了響應中國「科技自主」的國家戰略,更可能是在中美科技戰加劇、英偉達節節受限的此刻,抓住機會加速突圍,爭取更大的市場份額。

隨著中美在貿易和高科技領域的角力不斷升溫,曾試圖在中美兩大國間維持平衡的英偉達,似乎已越來越難左右逢源,反而陷入左右為難的尷尬處境。

根據英偉達4月16日提交給美國證券交易委員會的文件,公司已接獲美國政府通知,未來將「無限期」禁止向中國等多個國家出口H20晶片,並為此認列55億美元的潛在虧損。

2023年10月,美國政府禁止英偉達向中國市場出售H800晶片後,英偉達針對中國市場推出降級版的替代方案H20。H20性能僅有H100的三分之一,卻已是中國客戶能合法採購到的最強AI晶片。

儘管性能受限,但H20晶片的架構設計使其特別適合訓練AI模型,因此一度成為中國科技公司的搶手貨。字節跳動、騰訊、阿里巴巴等都是H20的主要買家。

中國《財經》雜誌估算,這項禁令可能會使英偉達今年損失高達200億美元的銷售額。

英偉達出貨受限,加上主要客戶紛紛尋求替代方案,讓中國晶片製造商迎來了罕見的「窗口期」。華為正是在這樣的背景下,加快推進昇騰910C晶片和CloudMatrix集群系統的交付。

《金融時報》報道,華為成功吸引的新客戶中,不乏原本嚴重依賴英偉達的企業。如今在出口禁令的影響下,這些企業已著手擴大對華為產品的採購規模。

英偉達首席執行官黃仁勳星期三在一場論壇上坦言,中國正迅速崛起,成為美國在科技領域的一個「強勁對手」,並點名華為在AI晶片設計上的佈局。

黃仁勳說:「中國並不落後,就在我們身後,距離非常非常近。」

英偉達(NVIDIA,又名輝達)行政總裁黃仁勳2024年6月2日在演講時展示NVIDIA的Blackwell平台(Reuters)

華為的短板

儘管政策環境為華為創造了突圍的機會,但其新產品在實際應用中的性能,是否真如宣傳所言「遙遙領先」,仍要打上問號。

以CloudMatrix集群系統為例,該系統雖通過堆疊晶片提升整體算力,但這也意味著更高的能耗。據科技博客wccftech報道,CloudMatrix的運行能耗約為英偉達NVL72的3.9倍,在AI負載下的每瓦性能也不甚理想。

與英偉達軟硬件整合、生態完整的CUDA系統相比,華為的生態尚不成熟,需依賴更多資深工程師維護,整體人力成本是英偉達的三至五倍。

價格方面,CloudMatrix的售價高達6000萬元人民幣(約820萬美元),遠高於NVL72的300萬美元。

至於昇騰910D晶片,諮詢公司Counterpoint Research副總裁沙阿(Neil Shah)直言,儘管華為展現出顯著進步,但在系統整合能力方面,包括計算架構、內存優化,以及軟硬件生態等,華為仍落後英偉達三代。

不可否認,英偉達依然是當前AI領域的王者,公司2025年第一季度財報遠超預期,數據中心收入同比增長逾一倍。憑藉難以匹敵的CUDA平台及持續更新的Blackwell晶片,英偉達的護城河依然堅不可破。

眼下的「窗口期」雖然為華為提供了追趕的良機,但尚不足以撼動英偉達在AI晶片領域的霸主地位。華為正奮力提升良率、穩住供應鏈、加快生態建設試圖追趕;而英偉達則加緊推進下一代Blackwell晶片,鞏固技術壁壘。

兩強的競爭態勢仍難分難解,但可以確定的是,這恐怕不會再是一場一面倒的科技競賽。

只是,在美國持續對中國高科技領域掐脖子的當下,英偉達的技術再先進,它的產品依然無法進入中國市場;相反,即便華為的產品存在技術落後、維護成本高昂等短板,它的產品依然是中國企業在AI領域發展的唯一驅動力。

這或許也是在當前地緣政治環境下,華為所承擔的特殊功能。