人工智能领军企业 OpenAI 正式推出全新智能体编程模型 GPT-5.1-Codex-Max。该模型专为复杂软件工程任务设计,标志着 AI 编程助手向长期推理、自主调试与项目级交付能力迈出关键一步。
GPT-5.1-Codex-Max 引入创新的“上下文压缩”(Compaction)机制,可在任务运行过程中动态整理记忆,保留关键状态并剔除冗余信息,从而突破传统上下文窗口限制,稳定处理百万级 Token 的连续编码任务。内部测试显示,该模型可独立运行超过24小时,成功完成多步骤代码重构、自主修复与持续集成等高难度工程场景。
在权威编程基准 SWE-Bench Verified 中,Codex-Max 准确率达 77.9%,较前代显著提升,并在 TerminalBench 2.0 等多项评测中领先同类竞品。同时,模型推理效率提高约30%,同等任务下令牌消耗减少,有效降低开发成本。
目前,GPT-5.1-Codex-Max 已作为默认模型集成至 ChatGPT Enterprise、GitHub Copilot 及 Codex 开发平台,面向 Plus、Pro 与企业级用户开放使用。公共 API 即将上线,未来还将推出支持私有部署的 Enterprise 专用版本。
OpenAI 强调,该模型定位为“开发者助手”,所有生成代码均附带详细终端日志与测试引用,默认运行于隔离沙盒环境,禁用网络访问以保障安全。公司表示,将继续通过渐进式部署收集真实反馈,推动 AI 与人类工程师高效协同,重塑软件开发范式。