谷歌发布新版 Gemini 3 Deep Think:奥数金牌实力
谷歌面向Google AI Ultra订阅用户及部分研究人员,正式推出新版Gemini 3 Deep Think推理模式。该模型由谷歌工程师与多领域科学家联合开发,专为应对科学、研究与工程中边界模糊、数据不完整等真实复杂挑战而设计。
权威测试表现卓越,跨学科能力突出
新版Deep Think在多项基准测试中取得突破性成绩,展现出强大的跨学科推理能力。其在“终极人类考试”中得分48.4%,在ARC-AGI-2测试中经验证达到84.6%。编程方面,Codeforces竞技平台Elo评分高达3455。更在2025年国际数学、物理与化学奥林匹克竞赛笔试部分均达到金牌水平,理论物理CMT-Benchmark得分50.5%。
实战应用落地,科研工程价值显现
模型已进入顶尖科研一线,展现出实际应用价值。罗格斯大学数学家利用其发现高能物理论文中的隐蔽逻辑漏洞;杜克大学Wang Lab借助其优化晶体生长工艺,成功设计出大于100微米薄膜的制造配方。此外,模型具备将手绘草图直接转化为3D打印文件的能力,大幅压缩从概念到原型的开发周期。
高效低成本,加速专业领域普及
此次升级在成本控制上实现巨大飞跃。在ARC-AGI-1测试中,每任务成本仅为7.17美元,相较同类高算力模型降低280至420倍,极大提升了AI在科研与工程领域的经济可行性。谷歌通过Gemini API同步推出“早期访问计划”,精准赋能研究人员、工程师与企业用户,推动专业领域智能化进程。