Nvidia发布Rubin CPX GPU 专为百万级token的AI应用
NVIDIA 发布了全新的 Rubin CPX GPU,这是一款专为大规模上下文推理设计的新型 GPURubin CPX 是 NVIDIA 在 2025 年 9 月 10 日发布的最新产品,旨在处理大规模上下文推理任务,例如百万级 token 的软件编码和生成式视频应用 。
Rubin CPX 的性能表现显著,具备 30 PFLOPS 的计算能力(每秒 3 亿亿次计算),支持 128GB 的 GDDR7 显存,并采用 NVFP4 数据精度 。该 GPU 专为分解式推理优化,能够提升 AI 编码和视频生成能力,支持多种 AI 应用场景,如复杂的软件开发和高清晰度视频生成。
Rubin CPX 的设计目标是提升 AI 推理效率,其性能相比现有 GPU 提升显著,例如在长上下文处理场景下,其注意力性能相比 GB300 提升了 3 倍 。此外,Rubin CPX 与 NVIDIA 的 Vera Rubin NVL144 平台结合,可提供更高的计算能力和内存带宽,支持大规模 AI 应用 。
Rubin CPX 的推出预计将在 2026 年底正式上市,届时将为 AI 行业带来新的突破,推动 AI 计算和推理能力的进一步发展 。
Rubin CPX 的发布标志着 NVIDIA 在 AI 硬件领域的持续创新,进一步巩固了其在 AI 基础设施领域的领先地位 。