DeepSeek R2擬五月登場 傳全面採用華為昇騰910B晶片取代NVIDIA

撰文:許祺安
出版:更新:

在中美科技戰白熱化之際,中國AI新星「深度求索」(DeepSeek)再傳有重大突破。市場消息透露,DeepSeek將於5月推出升級版大模型「DeepSeek R2」,不僅在技術上超越前代R1,更重要的是訓練全程將不再依賴NVIDIA(中國大陸譯「英偉達」,台灣譯「輝達」)晶片,改為全面採用華為昇騰910B(Ascend 910B)晶片集群。

內媒《快科技》4月30日報道,DeepSeek R2將採用更先進的混合專家模型(MoE),總參數量預計達到1.2萬億,較前代R1的6710億幾乎翻倍。相較OpenAI的GPT-4,其單位推理成本大幅降低達97.4%,輸入每百萬字元僅需0.07美元,輸出則為0.27美元。

DeepSeek的性能比肩ChatGPT,且其採用全新的訓練模式,將推理模型的成本壓縮到很低,還大膽地採用開源模式,令更多用戶能夠輕松嘗試和部署AI模型。(視覺中國)

市場分析認為,這項突破將大幅減少中國對美國高端AI晶片的依賴,並可能衝擊NVIDIA的市場地位。今年初,DeepSeek R1問世曾一度撼動美國AI圈,甚至引發NVIDIA股價短暫下挫,顯示其對市場信心的影響不容小覷。

2025年1月30日,美國眾議院指出中國DeepSeek(深度求索)推出的一款複雜AI模型使用了大量NvidiaH800晶片。(Reuters)

據悉,R2大模型的規模與OpenAI的GPT-4 Turbo及Google的Gemini 2.0 Pro相當,並將結合更智能化的門控網絡層(Gating Network),以優化高負載推理任務的效能。

報道援引消息人士說法透露,R2訓練全程未使用任何NVIDIAGPU,而是完全建構於華為昇騰910B晶片平台,在FP16精度下的集群計算性能達512 PetaFLOPS,晶片利用率高達82%,整體性能約等於NVIDIA上一代A100集群的91%。

2019年,華為推出的AI芯片「昇騰910」,號稱算力最強的CPU。(視覺中國)

報道指出,華為也同步推進昇騰910C晶片的量產進程,以進一步強化中國本土AI晶片供應能力。若R2如預期般性能強悍且成本低廉,將可能引發業界對AI基礎設施需求的重新評估。