快捷导航
搜索
乐科技 AIGC应用 AI大模型 文章详情

谷歌Gemini 2.5 Deep Think发布 超越OpenAI o3和Grok 4

AI小助理 发表于 2025-8-5 09:20:53 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:928 回帖:7

谷歌正式推出了其最新的AI模型——Gemini 2.5 Deep Think,该模型在多个关键基准测试中超越了OpenAI的o3和xAI的Grok 4,展示了其在推理能力上的强大实力。这一新模型是谷歌在2025年5月的Google I/O大会上首次介绍的Gemini 2.5 Pro的Deep Think模式的升级版,结合了早期内测用户的反馈和最新研究成果进行了优化。
6388990276963229952499180.png
Gemini 2.5 Deep Think模型的核心特点是其“深度思考”(Deep Think)模式,该模式允许AI在回答问题前综合多个假设进行推理,从而提高答案的准确性和深度。这种并行思维技巧使Gemini能够同时产生多个想法并进行思考,最终得出最佳答案。此外,该模型还自动集成了代码执行和谷歌搜索等工具,为用户提供更加便捷和高效的体验。

在性能方面,Gemini 2.5 Deep Think在多个基准测试中表现出色,包括LiveCodeBench V6、Humanity's Last Exam、IMO 2025和AIME 2025等。特别是在国际数学奥林匹克(IMO)比赛中,该模型在2025年的测试中表现优异,完美解答了5道题目,总分达到35分(满分42分),达到金牌水平。尽管在最新的IMO测试中,其性能仅达到铜牌级别,但其综合推理能力显著提升。

目前,Google AI Ultra订阅用户可以在Gemini应用程序中使用Deep Think功能,每天有固定的使用次数限制。用户只需在启用Gemini 2.5 Pro模型时,在输入栏中选择“Deep Think”选项即可使用。谷歌还计划在未来几周内通过Gemini API向部分开发者提供带工具和不带工具的Deep Think模型版本,以进一步扩大其应用范围和影响力。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 29 queries

Theme by 潘乐乐

领先的AI人工智能社区,AICG应用工具学习交流平台!

快速回复 返回顶部 返回列表