谷歌殺瘋了!Gemini 3「一夜封神」 馬斯克、奧特曼紛紛點贊
萬眾期待的年度壓軸之王——谷歌新一代旗艦Gemini 3正式發布。而且,一上來就是頂配的Gemini 3 Pro,也是至今推理最強、多模態理解最強的模型。
這也標誌着人工智能行業正在經歷一次關鍵的範式轉移:從「對話式交互(Chatbot)」向「自主智能體(Agentic)」的全面跨越。就連OpenAI聯合創始人兼CEO奧特曼、xAI創始人埃隆·馬斯克也先後點贊。
能讓對手摺服,谷歌這次顯然是有備而來的。
一齣手就是王炸
今日凌晨,谷歌CEO Sundar Pichai 在社交媒體上發布了一則重要消息:Gemini 3發布,不只模型升級,這次還帶來了Google Antigravity這個全新的開發平台,這就是對標Cursor類的AI IDE了。
Pichai在文中說,Gemini 3是世界上最好的多模態理解模型,也是我們目前最強大的Agent和代碼生成模型。
Gemini 3可以快速理解你的想法和需求,你只需要簡單描述,就能得到你想要的結果。
這一次,谷歌發布了兩個版本,一個是Gemini 3 Pro,另一個是Gemini 3 Deep Think。
值得一提的是,Gemini 3 Pro的model card在發布之前就已經泄漏了,上面有Gemini 3 Pro在主流benchmark上的評測結果。
相較於Gemini 2.5 Pro,可以看到Gemini 3 Pro有顯著的提升,很多指標都遠遠超過了Gemini 2.5 Pro。
三大核心亮點
Gemini 3的核心亮點主要包括三個方面:
一是最智能模型。
Gemini 3定位為年度最受期待的產品,強調其智能化水平,大家可以看下第五張圖,基本在各個領域都是處於領先地位,谷歌出品不出可以,一齣驚人。
二是生成式界面。
Gemini 3可提供設計完美的響應內容,讓它生成mac os主界面,它妥妥能讓前端工程師和設計師下崗。
三是Gemini Agent。
能代表用戶完成複雜任務,無需多言就能把痛點說出來,它就能沒日沒夜的勞作,你可以安心的躺平發育。
值得一提的是,Gemini 3 Pro憑藉先進的推理和多模態能力,能夠將任何想法變為現實。它在所有主要的AI基準測試中都顯著優於2.5 Pro。
此外,Gemini 3的深度思考模式又拓展了智能的邊界,它的推理、多模態理解能力方面均實現了質的飛躍。
在測試中,Gemini 3 Deep Think在Humanity's Last Exam(不使用工具的情況下得分41.0%)和GPQA Diamond(得分93.8%)上的表現均優於Gemini 3 Pro已相當出色的成績。
此外,它在ARC-AGI-2(代碼執行,已通過ARC Prize驗證)上也取得了前所未有的45.1% 的得分,展現了其解決全新挑戰的能力。