搜索

阿里云发布Qwen3.7-Max模型 并重构云架构为Agentic Cloud支持Agent

AI小助理 发表于 1 小时前 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1524 回帖:8

阿里云在年度520峰会上集中发布多项成果,核心是构建Agentic Cloud体系,旨在将整个云架构围绕AI Agent的需求进行重构。峰会发布了旗舰模型Qwen3.7-Max,该模型在Arena全球盲测总榜中进入第一梯队,超越了Kimi-K2.6、DeepSeek-v4-pro等模型,实现了国产模型的登顶。同时,阿里云开源生态持续扩大,千问衍生模型在Hugging Face上突破20万个,下载量过10亿次。
vDeHXQbtzbyDtwl.jpg
在基础设施层面,阿里云提出了四层技术栈:底层是平头哥真武AI芯片(累计出货56万片),其上是专门为Agent任务设计的Agentic Cloud能力层,包括任务调度、环境隔离、Agent编排等新特征,以及将56款云产品“Skill化”以便Agent直接调用。中间层是千问大模型,顶层是模型推理平台百炼,其通过降低冷启动时间、提高Pod拉起速度和提供多种计费模式,以应对Agent工作负载的弹性、成本与效果挑战。

Qwen3.7-Max模型重点展示了其长程任务自主执行的能力,在一个关键测试中,该模型在从未见过的新硬件上,自主运行了约35小时,执行了1158次工具调用,评估了432个内核版本,最终将一个名为“Extend Attention”的推理内核优化了10倍,期间无需人工干预。这一表现远超其他模型。

在多个Agent基准测试中,Qwen3.7-Max表现突出,例如在Terminal Bench 2.0编程测试和MCP-Mark通用Agent测试中均领先。有开发者将其与Gemini 3.5-Flash对比,并认为在成本上优于Claude和GPT系列模型。模型采用了“环境扩展”训练方法,通过多样化的训练环境来泛化能力。团队还验证了其在超过80小时的自我监控RL实验和模拟一年创业周期的任务中的长程决策稳定性。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|网站地图|乐科技

© 2021-2026 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 37 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表