

在人工智能大模型迅速走向应用的今天,英伟达再次成为了行业的焦点。2025年12月15日,英伟达正式推出了其最新的Nemotron 3系列开放AI模型。这一系列模型包含了三种不同规模的版本:Nano、Super和Ultra,专注于提升效率和精度,旨在为AI Agent的应用开发提供强有力的支持。
英伟达的创始人兼首席执行官黄仁勋在发布会上表示:“开放创新是AI进步的基础。通过Nemotron,我们希望将先进的AI技术转化为一个开放的平台,为开发者提供构建大规模代理式系统所需的透明度和效率。”
这次发布的Nemotron 3系列模型,设计目标非常明确:在AI应用中实现高效和节能。首先推出的Nemotron 3 Nano模型已经上线亿。得益于其独特的异构MoE架构,每次运行仅需激活30亿参数,极大地节省了电力消耗。与上一代模型相比,Nemotron 3 Nano的速度提高了4倍,成本降低了60%,非常适合编写代码、总结文档和作为智能助手等日常任务。此外,这款模型还具备100万token的上下文记忆能力,能够存储几本书的内容,确保在使用过程中不会轻易遗忘信息。
预计在2026年上半年推出的Nemotron 3 Super模型,主要针对多智能体协作完成任务,参数总量约1000亿。每个token最多可激活100亿参数,兼顾了节能和高效。另一款Nemotron 3 Ultra模型同样预计于2026年推出,主要针对高级推理引擎,服务于需要深度研究和策略规划的AI工作流,成为Nemotron 3系列的“最强大脑”。该模型参数约5000亿,每个token最多激活500亿参数,适用于复杂的AI应用。
值得注意的是,Nemotron 3 Super和Ultra模型采用了基于NVIDIA Blackwell架构的4位NVFP4训练格式,这种新格式显著降低了显存需求并加快了训练进程。之前训练一个大型模型,开发者需要最新的GPU集群以兼顾准确性和效率,而现在,他们可以在现有硬件上进行训练,避免了低精度可能导致的AI能力下降。
英伟达推出Nemotron 3系列模型的初衷是希望开发者能够根据特定的工作负载选择最适合的开放模型。AI任务能够在数十至数百个智能体之间灵活扩展,同时在复杂工作流中获得更快速、精准的长时推理能力。简单来说,英伟达为AI开发者提供了一套AI“积木”,开发者可以根据需要选择小砖(Nano快)、中砖(Super稳)和大砖(Ultra强),或同时招募多个“工人”(智能体)共同完成任务。
为了方便开发者使用,英伟达不仅开源了这套模型,还提供了训练数据集和前沿的强化学习库。为帮助开发者展示如何创建高性能特定领域的智能体,英伟达还公开了规模达3万亿token的全新Nemotron预训练、后训练及强化学习数据集。Nemotron Agentic Safety Dataset工具则提供真实场景的遥测数据,帮助团队评估并提升复杂智能体系统的安全性。
此外,英伟达还发布了NeMoGym与NeMoRL开源库,为Nemotron模型提供训练环境及后训练基础。在验证模型安全性和性能方面,英伟达推出了NeMo evaluator。这些工具已经在GitHub和HuggingFace平台上线,方便开发者使用。
总体来看,Nemotron 3是英伟达为让更多开发者能够使用AI而做出的努力。作为算力供应商,英伟达依然致力于为开发者降低AI门槛,积极推动开源生态的建设。毕竟,只有当AI开发者能够实现盈利,英伟达的GPU销量才能不断提升。返回搜狐,查看更多