谷歌正式推出了其最新的AI模型——Gemini 2.5 Deep Think,该模型在多个关键基准测试中超越了OpenAI的o3和xAI的Grok 4,展示了其在推理能力上的强大实力。这一新模型是谷歌在2025年5月的Google I/O大会上首次介绍的Gemini 2.5 Pro的Deep Think模式的升级版,结合了早期内测用户的反馈和最新研究成果进行了优化。
Gemini 2.5 Deep Think模型的核心特点是其“深度思考”(Deep Think)模式,该模式允许AI在回答问题前综合多个假设进行推理,从而提高答案的准确性和深度。这种并行思维技巧使Gemini能够同时产生多个想法并进行思考,最终得出最佳答案。此外,该模型还自动集成了代码执行和谷歌搜索等工具,为用户提供更加便捷和高效的体验。
在性能方面,Gemini 2.5 Deep Think在多个基准测试中表现出色,包括LiveCodeBench V6、Humanity's Last Exam、IMO 2025和AIME 2025等。特别是在国际数学奥林匹克(IMO)比赛中,该模型在2025年的测试中表现优异,完美解答了5道题目,总分达到35分(满分42分),达到金牌水平。尽管在最新的IMO测试中,其性能仅达到铜牌级别,但其综合推理能力显著提升。
目前,Google AI Ultra订阅用户可以在Gemini应用程序中使用Deep Think功能,每天有固定的使用次数限制。用户只需在启用Gemini 2.5 Pro模型时,在输入栏中选择“Deep Think”选项即可使用。谷歌还计划在未来几周内通过Gemini API向部分开发者提供带工具和不带工具的Deep Think模型版本,以进一步扩大其应用范围和影响力。