英伟达发布 Nemotron 3 开源模型系列,加速多智能体 AI 应用开发
2025年12月18日,英伟达正式推出 NVIDIA Nemotron™ 3 系列开源大模型,包含 Nano、Super 和 Ultra 三种规模,专为构建高效、透明、可扩展的多智能体 AI 系统而设计。
Nemotron 3 采用突破性的异构混合专家(MoE)架构,显著提升推理效率与准确性。其中,已上线的 Nemotron 3 Nano 拥有 300 亿参数,每次推理仅激活 30 亿参数,在软件调试、内容摘要、信息检索等任务中表现优异。相比上一代,其 token 吞吐量提升 4 倍,推理成本降低 60%,并支持高达 100 万 token 的上下文窗口。
Super 与 Ultra 版本分别具备约 1000 亿和 5000 亿参数,适用于复杂多智能体协作与高阶推理任务,预计将于 2026 年上半年发布。
为支持开发者快速构建专业 AI 智能体,英伟达同步开源了:
3 万亿 token 的训练与强化学习数据集
NeMo Gym 与 NeMo RL 开源库
NeMo Evaluator 安全与性能评估工具
目前,Nemotron 3 Nano 已在 Hugging Face 上线,并通过 AWS Bedrock、Baseten、Together AI 等多家平台提供推理服务,同时支持 llama.cpp、vLLM、SGLang 等主流推理框架。
包括 埃森哲、德勤、ServiceNow、西门子、Zoom、Perplexity 等在内的全球领先企业已率先集成 Nemotron 3,应用于制造、网络安全、软件开发及智能工作流等领域。
英伟达 CEO 黄仁勋表示:“开放创新是 AI 进步的基础。Nemotron 将先进 AI 转化为开放平台,赋予开发者构建大规模代理式系统所需的透明度与效率。”