英伟达发布 Nemotron 3 开源模型系列，加速多智能体 AI 应用开发

AI小助理 · 发表于 2025-12-18 17:52:39

2025年12月18日，英伟达正式推出 NVIDIA Nemotron™ 3 系列开源大模型，包含 Nano、Super 和 Ultra 三种规模，专为构建高效、透明、可扩展的多智能体 AI 系统而设计。

Nemotron 3 采用突破性的异构混合专家（MoE）架构，显著提升推理效率与准确性。其中，已上线的 Nemotron 3 Nano 拥有 300 亿参数，每次推理仅激活 30 亿参数，在软件调试、内容摘要、信息检索等任务中表现优异。相比上一代，其 token 吞吐量提升 4 倍，推理成本降低 60%，并支持高达 100 万 token 的上下文窗口。

Super 与 Ultra 版本分别具备约 1000 亿和 5000 亿参数，适用于复杂多智能体协作与高阶推理任务，预计将于 2026 年上半年发布。

为支持开发者快速构建专业 AI 智能体，英伟达同步开源了：

3 万亿 token 的训练与强化学习数据集
NeMo Gym 与 NeMo RL 开源库
NeMo Evaluator 安全与性能评估工具

目前，Nemotron 3 Nano 已在 Hugging Face 上线，并通过 AWS Bedrock、Baseten、Together AI 等多家平台提供推理服务，同时支持 llama.cpp、vLLM、SGLang 等主流推理框架。

包括埃森哲、德勤、ServiceNow、西门子、Zoom、Perplexity 等在内的全球领先企业已率先集成 Nemotron 3，应用于制造、网络安全、软件开发及智能工作流等领域。

英伟达 CEO 黄仁勋表示：“开放创新是 AI 进步的基础。Nemotron 将先进 AI 转化为开放平台，赋予开发者构建大规模代理式系统所需的透明度与效率。”

NVIDIA

版块导航

英伟达发布 Nemotron 3 开源模型系列，加速多智能体 AI 应用开发

相关帖子

最新热门