JetBrains 推出 AI 编码智能体基准测试平台 DPAI Arena
知名集成开发环境(IDE)开发商 JetBrains 正式发布 Developer Productivity AI Arena(DPAI Arena)——业内首个面向 AI 编码智能体的开放式基准测试平台。该平台旨在科学评估各类 AI 工具在真实软件工程任务中的实际效能,填补当前行业缺乏统一、中立评估标准的空白。
DPAI Arena 采用模块化、基于路径的架构设计,支持多语言、多框架及多样化开发工作流,可对代码修补、缺陷修复、拉取请求审查、测试生成和静态分析等典型场景进行可复现的横向对比。平台首个基准测试模块 Spring Benchmark 已同步上线,不仅规范了数据集构建与评估格式,还支持开发者自带数据集(BYOD)进行定制化评测。
为确保长期中立性与社区共建,JetBrains 宣布计划将 DPAI Arena 捐赠给 Linux 基金会,并联合多方技术力量组建开放治理的技术指导委员会。此举有望推动 AI 编码工具评估体系走向标准化,助力开发者更精准地选择高效、可靠的智能辅助工具。