谷歌发布新版 Gemini 3 Deep Think：奥数金牌实力

AI小助理 · 发表于 2026-2-13 11:37:13

谷歌面向Google AI Ultra订阅用户及部分研究人员，正式推出新版Gemini 3 Deep Think推理模式。该模型由谷歌工程师与多领域科学家联合开发，专为应对科学、研究与工程中边界模糊、数据不完整等真实复杂挑战而设计。

权威测试表现卓越，跨学科能力突出

新版Deep Think在多项基准测试中取得突破性成绩，展现出强大的跨学科推理能力。其在“终极人类考试”中得分48.4%，在ARC-AGI-2测试中经验证达到84.6%。编程方面，Codeforces竞技平台Elo评分高达3455。更在2025年国际数学、物理与化学奥林匹克竞赛笔试部分均达到金牌水平，理论物理CMT-Benchmark得分50.5%。

实战应用落地，科研工程价值显现

模型已进入顶尖科研一线，展现出实际应用价值。罗格斯大学数学家利用其发现高能物理论文中的隐蔽逻辑漏洞；杜克大学Wang Lab借助其优化晶体生长工艺，成功设计出大于100微米薄膜的制造配方。此外，模型具备将手绘草图直接转化为3D打印文件的能力，大幅压缩从概念到原型的开发周期。

高效低成本，加速专业领域普及

此次升级在成本控制上实现巨大飞跃。在ARC-AGI-1测试中，每任务成本仅为7.17美元，相较同类高算力模型降低280至420倍，极大提升了AI在科研与工程领域的经济可行性。谷歌通过Gemini API同步推出“早期访问计划”，精准赋能研究人员、工程师与企业用户，推动专业领域智能化进程。

Gemini

版块导航

谷歌发布新版 Gemini 3 Deep Think：奥数金牌实力

相关帖子

最新热门