DeepSeek使用率暴跌至3% 新模型R2遲未問世引揣測

DeepSeek使用率暴跌至3% 新模型R2遲未問世引揣測
撰文:許祺安
出版:更新:

中國人工智能新創公司深度求索(DeepSeek)今年初推出自家大型語言模型時曾引起市場關注,標榜低成本也能訓練出強大AI模型,一度在國內取得高達50%的使用率。然而,有媒體報道,目前DeepSeek的使用率已暴跌至僅剩3%,原本預計於5月發布的新一代R2模型至今亦未現蹤影,發展陷入瓶頸。

內媒《快科技》7月9日報道,DeepSeek問世初期曾轟動一時,如今「很多人都已經淡忘了DeepSeek今年初問世時的輝煌景象」,使用率從50%大幅下滑至目前的3%,下滑趨勢顯著。

報道指出,DeepSeek-R2模型原定於今年5月問世,但時間一拖再拖,遲遲未見正式發布,引起市場各界揣測。據業內人士分析,R2遲未推出的原因之一,是DeepSeek-R1主要依賴來自全球、經過認證的訓練數據,而R2模型對數據質量與數量的要求更高,然而「中國國內可提供R2訓練的數據質量不高」,導致其在測試過程中出現「幻覺體驗」問題。

所謂「幻覺體驗」,是指當大型語言模型無法提供正確答案時,會生成虛假或錯誤資訊,影響使用者體驗與可信度。報道指出,這正是DeepSeek-R2目前尚無法順利推出的核心技術瓶頸。

此外,報道還指出,硬件資源的短缺同樣造成拖延。《快科技》稱,DeepSeek受到高端繪圖處理器(GPU)供應不足影響,訓練效率大幅下降,進一步拖慢了R2模型的更新與發布進度。

與此同時,《金融投資報》指出,在DeepSeek陷入研發困境之際,其國際競爭對手則持續推出新技術、爭奪市佔率。報道指出,ChatGPT和Google Gemini的官網流量分別成長40.6%與85.8%,反觀DeepSeek「仍依賴半年前的技術」,在激烈競爭環境下無法滿足用戶需求,導致大量用戶流失,使用率急遽下滑。

DeepSeek流量斷崖下跌「低價換市場」策略崩盤 性價比不是萬能解

撰文:數位時代
出版:更新:

DeepSeek因算力受限,犧牲使用者體驗換低價,導致市佔率與流量下滑,反觀第三方服務與競爭對手則持續成長。

重點一 :儘管DeepSeek模型一度廣受歡迎,但其自有平台因刻意犧牲使用者體驗(高延遲、小上下文視窗)以換取低價,並將寶貴算力保留於內部研發,導致其市佔率下滑。                                 重點二 :AI模型競爭已進入「代幣經濟學」(Tokenomics) 時代,衡量標準不僅價格,而是包含延遲、互動速度與上下文長度等多重因素,第三方雲端服務商因提供更佳的綜合效能而崛起。                                     重點三 :算力限制是全球性挑戰,西方AI巨頭Anthropic同樣面臨困境,面對龐大需求而不得不犧牲部分模型輸出速度,顯示在AI競賽中,足夠的運算資源是所有領導廠商的共同核心課題。

自中國大型語言模型DeepSeek R1以其媲美OpenAI的推理能力及低於業界九成的震撼性低價發布以來,已超過150天。當時市場普遍擔憂此舉將引發AI模型的商品化割喉戰。然而,數據顯示的卻是另一幅景象: 儘管DeepSeek的模型在第三方平台(如 OpenRouter)大受歡迎,其自營的應用程式與API服務流量卻不增反減,市佔率持續下滑。

deepseek官方logo及其標語 (deepseek官網)

研究機構《SemiAnalysis》指出, 核心原因在於DeepSeek為應對美國晶片出口管制下的算力限制,採取了犧牲使用者體驗的戰略,亦即其雖然價格低廉,卻伴隨著極高的延遲(Time-to-First-Token)與極小的上下文視窗(Context Window),迫使用戶等待數秒才能獲得回應。

《SemiAnalysis》分析指出,這種刻意的取捨,是為了將有限的高階運算資源集中用於模型研發,力求在AGI(通用人工智慧)的終極競賽中取得突破,而非著眼於當前的API服務營利。

DeepSeek App市佔:從8%回落至4.5%

那麼,DeepSeek的App市佔率究竟下滑多嚴重?據《SemiAnalysis》指出, DeepSeek可謂出道即巔峰 ,在今年一月份推出App後,市佔率出現了近乎垂直的爆炸性增長,從接近0%迅速飆升至超過8%的峰值。

研究強調,因為中國市場的用戶數據追蹤不完整,且許多西方AI服務在中國被禁用,因此數據很可能低估了DeepSeek的真實影響力。 但整體而言,DeepSeek市佔率在1月觸頂之後就一路下滑,截至5月底已回落至4.5%左右 ;值得注意的是,同期間整體市場的AI App使用者指數一路上升,顯見用戶外移的趨勢。

「AI 應用使用者指數」與「DeepSeek 市場佔有率」比較的趨勢圖。(semianalysis)

DeepSeek網頁訪問次數:衰退近30%

而在瀏覽器訪問這一端,DeepSeek網頁版的訪問次數同樣一路下降。根據SimilarWeb數據,從今年2月到5月這三個月期間,DeepSeek網站流量從6.14億次 (614 M) 下降至4.36億次 (436 M),衰退幅度高達29%。

但反觀ChatGPT,作為市場的領導者,其流量從 39.05 億次 (3,905 M) 增長到 54.92 億次 (5,492 M),仍然實現了40.6%的強勁增長。而Google旗下的Gemini成長幅度更驚人,流量從 2.84 億次 (284 M) 大幅增長至5.28億次 (528 M),增長率高達 85.8%。

至於比較晚加入戰局的Grok由於流量基期較低,同期間流量從 5100 萬次 (51 M) 爆炸性增長至 1.79 億次 (179 M),增長率達到了驚人的 247.1%,是所有服務中最高的;Claude則成長穩健,流量從 7300 萬次 (73 M) 增長到 1 億次 (100 M),實現了 36.5% 的成長。

5大AI模型瀏覽器訪問變化 (SemiAnalysis、SimilarWeb)

犧牲體驗換未來,DeepSeek的算力告急

DeepSeek的策略選擇清晰地體現在其服務的各項指標上。相較於其他提供商,用戶在使用DeepSeek官方服務時,必須忍受超過25秒的延遲與僅64K的上下文視窗,這嚴重限制了如程式碼分析等需要大量記憶的應用場景。

《SemiAnalysis》指出,與此形成鮮明對比的是,第三方託管的DeepSeek模型實例,總使用量自R1發布以來成長了近20倍,因為這些服務商利用更優化的硬體配置,提供了延遲更低、上下文視窗更大的選項。

圖表分析了不同大型語言模型(LLM)提供商在延遲(Latency)和價格(Blended $/Mtok)之間的關係,並以氣泡大小表示上下文窗口(Context Window)的大小。可見DeepSeek便宜但延遲很高。 (semianalysis)

DeepSeek透過高併發批次處理(Batching)使用者請求,將單一GPU的效能壓榨到極致,從而降低每百萬代幣的成本。此舉雖換來了全球性的模型知名度與開源社群採納,卻也將服務的重擔與商機轉嫁給了第三方雲端平台。

《SemiAnalysis》指出,這反映了在無法大規模取得如輝達高階晶片的困境下,中國AI企業只能「用(用戶的)時間換(預算的)空間」,確保核心研發不致落後。

代幣經濟3要素:除了價格外的「CP值」指標

DeepSeek現象揭示了當前AI市場的競爭核心已不再是單純的價格戰,而是「代幣經濟學」(Tokenomics) 的權衡。一個模型的價值不能僅由「$/Mtok」(每百萬代幣價格)來定義,而是取決於三大關鍵績效指標(KPI)的平衡:

延遲(Latency) :從發出請求到模型生成第一個代幣所需的時間。       互動性(Interactivity) :模型生成後續代幣的速度,通常以每秒代幣數(tokens per second)衡量。                              上下文視窗(Context Window) :模型能「記住」的對話或資料長度。模型供應商可透過調整這些變數,來決定最終的代幣價格。

AI Token之戰,不只拚總量也拚「輸出純度」

算力受限並非DeepSeek獨有的困境,即便是資金雄厚的西方AI公司Anthropic也面臨著相似的挑戰。Anthropic的Claude 4 Sonnet在API上的輸出速度自推出以來已下降40%,來到每秒約45個代幣。這與DeepSeek的原因如出一轍: 為了用有限的算力應對海量請求,不得不提高批次處理率,從而犧牲了互動速度。

然而,Anthropic也展現了另一種優化方式,其模型在回答問題時更為「精煉」,產生的總代幣數遠少於競爭對手,也就是儘管速度較慢,但用戶獲得完整答案的總等待時間可能更短。

延伸閱讀:微信AI助手元寶登場混元與DeepSeek雙引擎智能互動提升生活效率(點擊連結看全文)

+16

延伸閱讀:

一則IG對話、一副拳王簽名拳套,為什麼讓AmazingTalker點頭首宗併購案

黃仁勳是DeepSeek暴紅推手?為何輝達寧可「便宜AI」崛起,也不願放棄中國市場?

對手不只DeepSeek!OpenAI公開叫陣中國智譜AI:中國野心威脅「民主AI」的未來

【本文獲「數位時代」授權轉載。】


正在加載