OpenAI与芯片公司Cerebras联合发布全新编程模型GPT-5.3-Codex-Spark,标志着双方超百亿美元合作的首个成果落地。该模型专为实时软件开发设计,推理速度突破每秒1000 tokens,实现近乎即时的代码反馈,已在ChatGPT Pro用户中开放研究预览。
实时协作,重塑开发体验
针对“自主代理式编程”中开发者控制感弱、等待时间长的问题,Codex-Spark强调“快速响应”与“可引导性”,让开发者在编码过程中保持主导。其擅长精准代码修改、动态计划调整和代码库上下文问答,适用于界面布局优化、样式迭代等高频开发场景。
晶圆级算力,支撑极速推理
模型运行于Cerebras的晶圆级引擎(WSE-3)之上,单芯片即具备业界领先的片上内存,支持高速推理。该架构可扩展至数千芯片集群,为万亿参数模型提供硬件基础。OpenAI计划2026年内将此高速推理能力拓展至更大规模模型。
战略布局,拓展算力生态
此次发布是OpenAI推动芯片供应商多元化、降低对英伟达依赖的关键一步。双方已于2026年1月签署超100亿美元多年协议,目标部署750兆瓦级算力,预计2028年完成全部建设。
目前,Codex-Spark已集成于Codex应用、命令行工具及VS Code扩展中,API将逐步向部分合作伙伴开放。随着高性能推理基础设施升级,实时AI编程正迈入低延迟、强可控的新阶段。