Gemini 3 Pro數學能力「開掛」般存在 更有1能力碾壓全場封神?
Google最新一代推理模型Gemini 3.0 Pro正式發布,並同步在Google AI Studio推出預覽版,開放API接口。該模型即將陸續登陸Google旗下各類產品。
值得玩味的是,OpenAI聯合創始人兼CEO薩姆·奧特曼(Sam Altman)與xAI創始人埃隆·馬斯克(Elon Musk)先後向Google發來「賀電」。 Altman在推特上評價「Gemini 3看起來很不錯」,Google的CEO桑德爾·皮查伊(Sundar Pichai)僅以一個表情包輕鬆回應。
一經發布,Gemini 3 Pro幾乎橫掃各大評測榜單,在LMArena大模型競技場中以1501的Elo得分高居榜首。
根據Google公布的測試數據,Gemini 3 Pro毫無爭議地成為當前全球數學能力最強的AI。在被譽為「地獄難度」的數學競賽基準MathArena中,當GPT-5.1等其他大模型仍在1%左右徘徊時,Gemini 3 Pro一舉達到23.4%,遙遙領先。
編程能力方面,儘管在SWE-Bench上未取得SOTA成績,但仍穩居第一梯隊。其在Live Code Bench的Elo得分突破2400分,並在工具調用與終端操作基準測試中排名第一。
更令人震撼的是其視覺理解能力:對屏幕截圖的理解準確率高達72.7%,達到現有最先進水平的兩倍。這意味着AI Agent將不再是「視覺障礙者」,有望徹底重塑AI操作計算機的交互模式。
此外,Google還同期發布了自家的Agentic編程平台——Google Antigravity,再添一枚「技術砝碼」。
根據Model Card披露,Gemini 3 Pro在推理、多模態、Agent工具使用等關鍵基準測試中實現了全面領先。
在硬件層面,Gemini 3 Pro基於Google自研的張量處理單元(TPU)訓練。相比CPU,TPU在處理大語言模型所需的大規模計算時速度更快,其配備的大容量高帶寬內存也使其能夠高效運行超大模型與批量數據。
在實際應用上,最新發布的Gemini Agent實驗功能已能自主執行多步驟複雜流程。例如,用戶只需提出「整理一下我的收件箱」,它即可自動優先安排待辦事項,並起草郵件回覆供用戶確認。
目前,Gemini 3預覽版正逐步開放:所有用戶可通過Gemini應用使用;Google AI Pro與Ultra訂閲用戶可在搜索的AI模式中體驗;開發者可通過Gemini API、Google Antigravity及Gemini CLI訪問;企業用戶則通過Vertex AI與Gemini Enterprise獲取服務。
延伸閲讀:微軟AI助手Copilot宣傳出意外?演示犯低級錯誤 1項能力被質疑(點擊連結看全文)
【本文獲「快科技」授權轉載,微信公眾號:mydrivers】