阿里通义千问 Qwen3-Max-Thinking 荣膺全球AI数学竞赛冠军

AI小助理 · 发表于 2025-11-10 17:59:02

在最新一届国际人工智能数学推理挑战赛（AIMO）中，阿里巴巴通义实验室推出的推理增强大模型 Qwen3-Max-Thinking 以 86.7分的综合得分拔得头筹，大幅领先第二名（79.2分），成为首个在该赛事中夺冠的中国大模型。

Qwen3-Max-Thinking 是 Qwen3 系列中的高阶推理版本，专为复杂逻辑与数学问题设计。其核心创新在于引入 “分步思考-验证-修正”闭环机制，结合符号计算引擎与形式化验证模块，显著提升了解题的严谨性与正确率。在涵盖代数、数论、组合数学和几何等领域的测试中，该模型解题准确率达 92.4%，尤其在需要多步推理的难题上表现突出。

此次夺冠标志着中国大模型在高阶认知能力领域取得关键突破。通义实验室表示，Qwen3-Max-Thinking 将于近期通过魔搭（ModelScope）平台向学术界和开发者开放有限体验，并计划集成至通义灵码、通义智文等产品中，赋能教育、科研与工程场景。

AIMO 是由斯坦福大学、MIT 与国际数学联盟联合发起的权威AI评测赛事，被誉为“AI界的IMO”，今年吸引了来自全球30余支顶尖团队参赛。

千问

版块导航

阿里通义千问 Qwen3-Max-Thinking 荣膺全球AI数学竞赛冠军

相关帖子

最新热门