谷歌Gemini 2.5 Deep Think发布超越OpenAI o3和Grok 4

AI小助理 发表于 2025-8-5 09:20:53 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题：1468 回帖：8

谷歌正式推出了其最新的AI模型——Gemini 2.5 Deep Think，该模型在多个关键基准测试中超越了OpenAI的o3和xAI的Grok 4，展示了其在推理能力上的强大实力。这一新模型是谷歌在2025年5月的Google I/O大会上首次介绍的Gemini 2.5 Pro的Deep Think模式的升级版，结合了早期内测用户的反馈和最新研究成果进行了优化。

Gemini 2.5 Deep Think模型的核心特点是其“深度思考”（Deep Think）模式，该模式允许AI在回答问题前综合多个假设进行推理，从而提高答案的准确性和深度。这种并行思维技巧使Gemini能够同时产生多个想法并进行思考，最终得出最佳答案。此外，该模型还自动集成了代码执行和谷歌搜索等工具，为用户提供更加便捷和高效的体验。

在性能方面，Gemini 2.5 Deep Think在多个基准测试中表现出色，包括LiveCodeBench V6、Humanity's Last Exam、IMO 2025和AIME 2025等。特别是在国际数学奥林匹克（IMO）比赛中，该模型在2025年的测试中表现优异，完美解答了5道题目，总分达到35分（满分42分），达到金牌水平。尽管在最新的IMO测试中，其性能仅达到铜牌级别，但其综合推理能力显著提升。

目前，Google AI Ultra订阅用户可以在Gemini应用程序中使用Deep Think功能，每天有固定的使用次数限制。用户只需在启用Gemini 2.5 Pro模型时，在输入栏中选择“Deep Think”选项即可使用。谷歌还计划在未来几周内通过Gemini API向部分开发者提供带工具和不带工具的Deep Think模型版本，以进一步扩大其应用范围和影响力。

Gemini

版块导航

综合区

AI应用

AI硬件

谷歌Gemini 2.5 Deep Think发布超越OpenAI o3和Grok 4

相关帖子

最新热门

版块导航

综合区

AI应用

AI硬件

谷歌Gemini 2.5 Deep Think发布 超越OpenAI o3和Grok 4

相关帖子

最新热门

谷歌Gemini 2.5 Deep Think发布超越OpenAI o3和Grok 4