DeepSeek R2擬五月登場 傳全面採用華為昇騰910B晶片取代NVIDIA
撰文:許祺安
出版:更新:
在中美科技戰白熱化之際,中國AI新星「深度求索」(DeepSeek)再傳有重大突破。市場消息透露,DeepSeek將於5月推出升級版大模型「DeepSeek R2」,不僅在技術上超越前代R1,更重要的是訓練全程將不再依賴NVIDIA(中國大陸譯「英偉達」,台灣譯「輝達」)晶片,改為全面採用華為昇騰910B(Ascend 910B)晶片集群。
內媒《快科技》4月30日報道,DeepSeek R2將採用更先進的混合專家模型(MoE),總參數量預計達到1.2萬億,較前代R1的6710億幾乎翻倍。相較OpenAI的GPT-4,其單位推理成本大幅降低達97.4%,輸入每百萬字元僅需0.07美元,輸出則為0.27美元。
市場分析認為,這項突破將大幅減少中國對美國高端AI晶片的依賴,並可能衝擊NVIDIA的市場地位。今年初,DeepSeek R1問世曾一度撼動美國AI圈,甚至引發NVIDIA股價短暫下挫,顯示其對市場信心的影響不容小覷。
據悉,R2大模型的規模與OpenAI的GPT-4 Turbo及Google的Gemini 2.0 Pro相當,並將結合更智能化的門控網絡層(Gating Network),以優化高負載推理任務的效能。
報道援引消息人士說法透露,R2訓練全程未使用任何NVIDIAGPU,而是完全建構於華為昇騰910B晶片平台,在FP16精度下的集群計算性能達512 PetaFLOPS,晶片利用率高達82%,整體性能約等於NVIDIA上一代A100集群的91%。
報道指出,華為也同步推進昇騰910C晶片的量產進程,以進一步強化中國本土AI晶片供應能力。若R2如預期般性能強悍且成本低廉,將可能引發業界對AI基礎設施需求的重新評估。