對標ChatGPT和Gemini DeepSeek重磅推新模型引發嘩然

撰文:觀察者網
出版:更新:

深度求索(DeepSeek)新品重磅發布,再度引爆AI圈。12月1日,中國人工智能(AI)初創企業DeepSeek推出兩款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

據介紹,DeepSeek-V3.2定位「平衡實用」,其在主流推理基準測試中達到美國OpenAI的GPT-5水平;而在推理能力上大幅增強的DeepSeek-V3.2-Speciale,則在推理基準測試中取得了媲美Google深度思維11月下旬剛推出的新一代AI模型「雙子座3專業版」(Gemini 3.0 Pro)。

DeepSeek還透露,其V3.2-Speciale版本在國際數學奧林匹克競賽(IMO 2025)、國際信息學奧林匹克競賽(IOI 2025)等均斬獲金牌級表現。這一成績直接對標行業巨頭,此前僅有OpenAI和Google深度思維未對外公開的內部測試模型達成過這一成就。

《南華早報》2日報道指出,這一來自開源實驗室的技術突破再次引發AI研究領域的廣泛熱議,尤其DeepSeek此次上新恰逢「AI界的奧斯卡」——2025年神經信息處理系統大會(NeurIPS)召開前夕。

作為當前全球最負盛名的機器學習和AI研究領域頂尖學術會議之一,NeurIPS大會每年舉辦一次,被中國計算機學會列為A類會議,在Google學術發布的全球學術期刊和會議影響力排名中位列第7,與國際機器學習會議(ICML)、國際學習表征會議(ICLR)並稱為AI領域難度最大、水平最高、影響力最強的三大會議,代表着當今機器學習與AI領域的最高水平。

儘管向來行事低調的DeepSeek尚未公布是否會派員參會,但正在聖地亞哥參加NeurIPS大會的弗洛里安·布蘭德(Florian Brand)已難掩興奮。

這位專門研究中國開源AI生態系統的專家告訴媒體,如果DeepSeek的研究人員現身會場,大概率會引發高度關注。

他還透露:「DeepSeek發布新模型的消息一出,今天所有相關交流群都炸開了鍋。(All the group chats today were full after DeepSeek’s announcement)」

報道還提到,本屆NeurIPS大會首次採用雙會場形式,在美國加州聖地亞哥和墨西哥首府墨西哥城同步舉辦。這一安排主要源於主辦方對國際研究人員獲取美國簽證可能遇阻的擔憂,目前已有許多中國參會者選擇前往墨西哥城會場參會。

DeepSeek-V3.2及其同類產品的基準測試。(DeepSeek技術報告)

據官方介紹,DeepSeek-V3.2定位平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用智能體任務場景。在公開的推理類基準測試(Benchmark)中,V3.2達到了GPT-5的水平,僅略低於Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。

DeepSeek評價稱,V3.2「在智能體評測中達到當前開源模型最高水平」,大幅縮小了開源模型與閉源模型的差距,且未針對測試工具進行特殊訓練。此外,該模型還是DeepSeek推出的首個將思考融入工具使用的模型,並且同時支持思考模式與非思考模式的工具調用。

DeepSeek-V3.2-Speciale則為「極致推理」而生,是V3.2的長思考增強版,同時結合了DeepSeek-Math-V2 的定理證明能力,以探索模型能力的邊界。該模型具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力,在主流推理基準測試上的性能表現媲美Gemini-3.0-Pro。

更令人矚目的是,V3.2-Speciale成功斬獲國際數學奧林匹克(IMO 2025)、中國數學奧林匹克(CMO 2025)、國際大學生程序設計競賽全球總決賽(ICPC World Finals 2025)及國際信息學奧林匹克(IOI 2025)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。

目前,DeepSeek官方網頁端、App和API均已更新為正式版V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區評測與研究。相關模型已開源。

(DeepSeek技術報告)

與兩款新模型同步發布的,還有配套的技術報告。Google深度思維的首席研究工程師蘇珊·張(Susan Zhang)在社交媒體上對此給予好評,稱讚報告內容詳盡,同時肯定了這家初創企業在模型訓練後穩定性優化及智能體能力提升方面的努力。

彭博社指出,這一成果已清晰表明,中國開源AI系統至少在部分核心指標上,已經與矽谷頂尖專有模型具備同等競爭力。

美媒進一步解讀稱,此次新品發布也釋放出一個重要信號:繼今年1月推出突破性模型顛覆AI領域後,這家頗具影響力的AI實驗室正持續加大研發力度,致力於提升AI運算的速度與效率,力求鞏固其在中國AI賽道中的領先優勢。

就在上周,DeepSeek剛發布了開源模型DeepSeek-Math-V2,該模型展現出強大的數學定理證明能力。

開源AI初創公司Hugging Face的聯合創始人兼首席執行官克萊門特·德朗格(Clement Delangue)在社交平台X上盛讚道,「想象一下,你可以免費擁有世界上最優秀數學家之一的大腦。」

他強調,用戶可以不受限制地探索、微調、優化這款中國AI模型,並在自有硬件上運行,「沒有任何公司或政府可以收回它。這正是AI和知識民主化的最佳體現。」

「據我所知,此前沒有任何聊天機械人或API能讓你接觸到一個IMO 2025金牌水平的模型。」德朗格補充說。

另據英國《金融時報》上周報道,美國麻省理工學院(MIT)和Hugging Face的一項研究發現,過去一年,中國團隊開發的開源AI模型下載量佔比上升至17%,超過了美國開發團隊的15.8%。這是中國團隊首次在這一指標上超越美國同行,取得AI技術全球應用中的關鍵優勢。

在席捲全球科技行業的AI熱潮之中,美國OpenAI、Google和Anthropic等科技巨頭傾向於「封閉」策略,保持對先進AI技術的完全掌控,通過用戶訂閱和企業合作等方式獲利。與之相比,中國科技公司傾向於更加開放的策略,發布了一系列開源模型。

德國智庫墨卡托中國研究中心的高級分析師溫迪·張(Wendy Chang)指出,「比起美國,開源在中國更像是一種主流趨勢。美國公司不願這樣做,它們依靠這些高估值賺錢,不想公開自己的商業機密。」

根據MIT和Hugging Face的數據,DeepSeek和阿里雲的Qwen是下載量最多的中國開源模型。《金融時報》稱,DeepSeek-R1模型震驚了矽谷,該模型使用的成本和算力很低,但性能足以與美國頂尖模型比肩,引發各界對於美國AI實驗室是否還能保持競爭優勢的質疑。

MIT研究員謝恩·隆普雷(Shayne Longpre)表示,中國科技公司正在改變AI模型發布的範式,許多中國公司每周或每兩周發布一次模型,並提供多種版本供用戶選擇。相比之下,美國科技公司往往每六個月或一年才發布一系列模型。

業內人士告訴《金融時報》,盡管美國出台了晶片出口管制等一系列打壓措施,但中國擁有大量優秀人才,他們在開發開源模型的過程中展現出極強的創造力。

「當美國AI實驗室押注於通過推動智能突破來獲取巨額利益的同時,中國的開源模型競爭者更專注於推動AI的廣泛應用,」《經濟學人》總結道,「如果他們成功,DeepSeek的沖擊可能僅僅只是一個開始。」

本文獲《觀察者網》授權轉載。