阿里巴巴發布通義千問開源模型　稱優於Deepseek美股升6.7%

阿里巴巴旗下阿里雲宣布通義千問發布Qwen 2.5-Max超大規模MoE模型，號稱優於Deepseek V3，阿里美股（BABA）1月28日升6.7%。

據了解，這是通義千問首次推出原生支援100萬Token上下文長度的模型，能夠處理書籍、長篇報告、法律文件等超長文檔，可以通過API的方式進行訪問，也可以登錄Qwen Chat進行體驗，例如直接與模型對話，或者使用 artifacts及搜索等功能。

報道指，用戶毋須進行繁瑣的文檔分割，該模型將能夠記住更長的對話歷史紀錄，實現更連貫、更自然的交互體驗，亦能更好地理解代碼、複雜推理、多輪對話等。

據介紹，通義千問 Qwen 2.5-Max 使用超過20萬億token的預訓練數據，以及精心設計的後訓練方案進行訓練。阿里雲更直接對比了指令模型的性能表現，比較對象包括 DeepSeek V3、OpenAI旗下的GPT-4o 和 Claude-3.5-Sonnet。

阿里雲指，在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中，Qwen2.5-Max 的表現超越了DeepSeek V3，同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績，相信隨着後訓練技術的不斷進步，下一個版本的Qwen2.5-Max將會達到更高的水平。

DeepSeek新塑科技地緣政治　分析：台日韓成美｢算力圍堵｣關鍵盟友官媒：DeepSeek遭美國IP網攻暴力破解　用戶密碼被破解私隱遭竊 DeepSeek強勢衝擊AI戰局　分析：北京意圖宣示美出口管制無效

阿里巴巴發布通義千問開源模型 稱優於Deepseek美股升6.7%

阿里巴巴發布通義千問開源模型 稱優於Deepseek美股升6.7%

阿里巴巴發布通義千問開源模型　稱優於Deepseek美股升6.7%

阿里巴巴發布通義千問開源模型　稱優於Deepseek美股升6.7%