谷歌殺瘋了！Gemini 3「一夜封神」　馬斯克、奧特曼紛紛點贊

萬眾期待的年度壓軸之王——谷歌新一代旗艦Gemini 3正式發布。而且，一上來就是頂配的Gemini 3 Pro，也是至今推理最強、多模態理解最強的模型。

這也標誌着人工智能行業正在經歷一次關鍵的範式轉移：從「對話式交互（Chatbot）」向「自主智能體（Agentic）」的全面跨越。就連OpenAI聯合創始人兼CEO奧特曼、xAI創始人埃隆·馬斯克也先後點贊。

能讓對手摺服，谷歌這次顯然是有備而來的。

一齣手就是王炸

今日凌晨，谷歌CEO Sundar Pichai 在社交媒體上發布了一則重要消息：Gemini 3發布，不只模型升級，這次還帶來了Google Antigravity這個全新的開發平台，這就是對標Cursor類的AI IDE了。

Pichai在文中說，Gemini 3是世界上最好的多模態理解模型，也是我們目前最強大的Agent和代碼生成模型。

Gemini 3可以快速理解你的想法和需求，你只需要簡單描述，就能得到你想要的結果。

這一次，谷歌發布了兩個版本，一個是Gemini 3 Pro，另一個是Gemini 3 Deep Think。

值得一提的是，Gemini 3 Pro的model card在發布之前就已經泄漏了，上面有Gemini 3 Pro在主流benchmark上的評測結果。

相較於Gemini 2.5 Pro，可以看到Gemini 3 Pro有顯著的提升，很多指標都遠遠超過了Gemini 2.5 Pro。

三大核心亮點

Gemini 3的核心亮點主要包括三個方面：

一是最智能模型。

Gemini 3定位為年度最受期待的產品，強調其智能化水平，大家可以看下第五張圖，基本在各個領域都是處於領先地位，谷歌出品不出可以，一齣驚人。

二是生成式界面。

Gemini 3可提供設計完美的響應內容，讓它生成mac os主界面，它妥妥能讓前端工程師和設計師下崗。

三是Gemini Agent。

能代表用戶完成複雜任務，無需多言就能把痛點說出來，它就能沒日沒夜的勞作，你可以安心的躺平發育。

值得一提的是，Gemini 3 Pro憑藉先進的推理和多模態能力，能夠將任何想法變為現實。它在所有主要的AI基準測試中都顯著優於2.5 Pro。

此外，Gemini 3的深度思考模式又拓展了智能的邊界，它的推理、多模態理解能力方面均實現了質的飛躍。

在測試中，Gemini 3 Deep Think在Humanity's Last Exam（不使用工具的情況下得分41.0%）和GPQA Diamond（得分93.8%）上的表現均優於Gemini 3 Pro已相當出色的成績。

此外，它在ARC-AGI-2（代碼執行，已通過ARC Prize驗證）上也取得了前所未有的45.1% 的得分，展現了其解決全新挑戰的能力。