预热了快一个月的 Gemini 3 Pro 今天凌晨终于开了 Preview,API 同步开放,接下来将陆续进入 Google 的全家桶产品。这次升级的核心看点很明确:1.数学与推理能力断层领先:MathArena 地狱模式直接做到 23.4%,而包括 GPT-5.1 在内的其他模型还停在 1% 左右;Humanity’s Last Exam 37.5%,同时还藏着更强的 Deep Think 模式。2.视觉智能突破:屏幕理解测试 ScreenSpot-Pro 直接拉到 72.7%,是现有模型的近 20 倍。这意味着 Agent 终于不再是瞎子,第一次具备像人一样理解界面、自动完成电脑操作的能力。3.真正的 Agent 编程时代开始:Google 同步发布了 Antigravity ,它不是智能补全,而是 AI 能写代码、自己跑测试、自己开浏览器验证 UI、自己修错,是奔着自动驾驶式编程去的。整体看这一轮的关键不在数学、视觉这些 Benchmark 成绩,而在 Google 重新把 AI 战争的重心从内容生成拉回到系统控制与执行的层面。从会回答到会操作、从能表达到能执行,这才是真正改变生产关系的分水岭。


