近日,腾讯发布了一款名为 Youtu-agent 的高性能智能体框架,旨在构建、运行和评估自主智能体。该框架不仅在多个基准测试中表现优异,还提供了强大的智能体能力,如数据分析、文件处理和深入研究,所有功能均基于开源模型。
Youtu-agent 在多个基准测试中表现突出。在 WebWalkerQA 基准测试中,该框架使用 DeepSeek-V3 系列模型达到了 71.47% 的准确率,而在 GAIA 基准测试中,准确率达到了 72.8%,显示出开源模型的强大潜力。此外,Youtu-agent 通过优化框架,实现了低成本、便捷的部署,无需依赖封闭模型。
Youtu-agent 支持多种实际应用场景,包括 CSV 分析、文献综述、个人文件整理,以及即将推出的播客和视频生成。其灵活的架构支持多种模型 API,如 DeepSeek、gpt-oss 等,方便用户扩展和集成。
在自动化和简化操作方面,Youtu-agent 引入了基于 YAML 的配置,用户可通过简单配置文件快速生成智能体。其内置的“元智能体”能够与用户交互,自动捕捉需求并生成配置,大幅减少手动设置的工作量。此外,Youtu-agent 支持全异步执行,提高了性能效率,尤其在评估基准时表现突出。