傳DeepSeek正準備適配中國國產GPU
撰文:聯合早報
出版:更新:
中國初創企業深度求索(DeepSeek)研發大語言模型時據報繞過了美國人工智能巨頭英偉達(Nvidia)的CUDA框架,為DeepSeek在未來適配中國國產晶片做好準備。
由Nvidia開發的軟硬體整合技術「統一計算架構」(Compute Unified Device Architecture,CUDA)是一種通用編程框架,允許開發者利用Nvidia的圖形處理器(GPU)進行計算。
由於CUDA大大降低了研發大模型的難度,因此全球大模型開發商都傾向選擇使用Nvidia的CUDA技術,助力Nvidia佔據全球人工智能領域的壟斷地位。
然而,據美國科技網站Tom's Hardware報道,韓國未來資產證券在對DeepSeek技術論文進行分析時發現,該模型的硬件效率之所以能比Meta等高出10倍,因為「他們從頭開始重建了一切」。
分析指出,DeepSeek在使用Nvidia的H800晶片進行訓練時,使用了Nvidia的底層硬件指令PTX(Parallel Thread Execution)語言,而不是高級編程語言CUDA。
由於CUDA是通用型編程框架,會導致訓練模型時損失一些靈活性。中國網媒「快科技」分析,DeepSeek的做法相當於繞過了硬件對訓練速度的限制,意味着其他模型需要訓練10天,而DeepSeek只需要五天。
然而,這種編程非常複雜且難以維護,行業通用的做法是使用CUDA這類高級編程語言。
快科技和騰訊網引述的消息人士指出,DeepSeek內部擁有一些擅長寫PTX語言的內部開發者,假如DeepSeek未來有意改適配中國國產的GPU,在硬體適配方面將會更得心應手。