阿里通义千问 Qwen3-Max-Thinking 荣膺全球AI数学竞赛冠军
在最新一届 国际人工智能数学推理挑战赛(AIMO) 中,阿里巴巴通义实验室推出的推理增强大模型 Qwen3-Max-Thinking 以 86.7分 的综合得分拔得头筹,大幅领先第二名(79.2分),成为首个在该赛事中夺冠的中国大模型。
Qwen3-Max-Thinking 是 Qwen3 系列中的高阶推理版本,专为复杂逻辑与数学问题设计。其核心创新在于引入 “分步思考-验证-修正”闭环机制,结合符号计算引擎与形式化验证模块,显著提升了解题的严谨性与正确率。在涵盖代数、数论、组合数学和几何等领域的测试中,该模型解题准确率达 92.4%,尤其在需要多步推理的难题上表现突出。
此次夺冠标志着中国大模型在高阶认知能力领域取得关键突破。通义实验室表示,Qwen3-Max-Thinking 将于近期通过魔搭(ModelScope)平台向学术界和开发者开放有限体验,并计划集成至通义灵码、通义智文等产品中,赋能教育、科研与工程场景。
AIMO 是由斯坦福大学、MIT 与国际数学联盟联合发起的权威AI评测赛事,被誉为“AI界的IMO”,今年吸引了来自全球30余支顶尖团队参赛。