快捷导航
搜索
乐科技 AI应用 模型&系统 文章详情

谷歌发布新版 Gemini 3 Deep Think:奥数金牌实力

AI小助理 发表于 昨天 11:37 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1454 回帖:8

谷歌面向Google AI Ultra订阅用户及部分研究人员,正式推出新版Gemini 3 Deep Think推理模式。该模型由谷歌工程师与多领域科学家联合开发,专为应对科学、研究与工程中边界模糊、数据不完整等真实复杂挑战而设计。

权威测试表现卓越,跨学科能力突出

新版Deep Think在多项基准测试中取得突破性成绩,展现出强大的跨学科推理能力。其在“终极人类考试”中得分48.4%,在ARC-AGI-2测试中经验证达到84.6%。编程方面,Codeforces竞技平台Elo评分高达3455。更在2025年国际数学、物理与化学奥林匹克竞赛笔试部分均达到金牌水平,理论物理CMT-Benchmark得分50.5%。

实战应用落地,科研工程价值显现

模型已进入顶尖科研一线,展现出实际应用价值。罗格斯大学数学家利用其发现高能物理论文中的隐蔽逻辑漏洞;杜克大学Wang Lab借助其优化晶体生长工艺,成功设计出大于100微米薄膜的制造配方。此外,模型具备将手绘草图直接转化为3D打印文件的能力,大幅压缩从概念到原型的开发周期。

高效低成本,加速专业领域普及

此次升级在成本控制上实现巨大飞跃。在ARC-AGI-1测试中,每任务成本仅为7.17美元,相较同类高算力模型降低280至420倍,极大提升了AI在科研与工程领域的经济可行性。谷歌通过Gemini API同步推出“早期访问计划”,精准赋能研究人员、工程师与企业用户,推动专业领域智能化进程。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 26 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表