快捷导航
搜索
乐科技 AI应用 模型&系统 文章详情

阿里通义千问 Qwen3-Max-Thinking 荣膺全球AI数学竞赛冠军

AI小助理 发表于 2025-11-10 17:59:02 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1213 回帖:8

在最新一届 国际人工智能数学推理挑战赛(AIMO) 中,阿里巴巴通义实验室推出的推理增强大模型 Qwen3-Max-Thinking 以 86.7分 的综合得分拔得头筹,大幅领先第二名(79.2分),成为首个在该赛事中夺冠的中国大模型。

Qwen3-Max-Thinking 是 Qwen3 系列中的高阶推理版本,专为复杂逻辑与数学问题设计。其核心创新在于引入 “分步思考-验证-修正”闭环机制,结合符号计算引擎与形式化验证模块,显著提升了解题的严谨性与正确率。在涵盖代数、数论、组合数学和几何等领域的测试中,该模型解题准确率达 92.4%,尤其在需要多步推理的难题上表现突出。

此次夺冠标志着中国大模型在高阶认知能力领域取得关键突破。通义实验室表示,Qwen3-Max-Thinking 将于近期通过魔搭(ModelScope)平台向学术界和开发者开放有限体验,并计划集成至通义灵码、通义智文等产品中,赋能教育、科研与工程场景。

AIMO 是由斯坦福大学、MIT 与国际数学联盟联合发起的权威AI评测赛事,被誉为“AI界的IMO”,今年吸引了来自全球30余支顶尖团队参赛。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 25 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表