

(Rubin Context GPUs),这款专为处理超过100万token的长上下文推理任务而设计的GPU,标志着AI硬件领域的一次重要革新。此次发布不仅带来了硬件的升级,更预示着在软件开发、视频生成等领域,AI应用将迎来新的发展机遇。
英伟达推出的SMART框架强调采用全栈解耦式基础设施,实现计算与内存资源的高效调配。通过Blackwell 架构 GB200 NVL72 平台与 NVFP4 低精度推理技术的结合,辅以TensorRT-LLM、Dynamo等开源软件,使得整个AI领域的推理性能大大提升。解耦式推理架构将推理过程分为上下文处理与内容生成两个阶段,并针对每个阶段的特性进行优化,从而显著提升系统吞吐量,降低延迟,并全面提高资源利用率。NVIDIA Dynamo(一个开源、低延迟的模块化推理框架)在最新的 MLPerf Inference 结果中发挥了关键作用,为GB200 NVL72带来了新的性能纪录。
Rubin CPX 的发布,受到了来自行业内的广泛关注。Cursor 和 Runway 等公司均表示,这款GPU将极大地提升其在软件开发、视频生成等领域的生产力。例如,Cursor 首席执行官 Michael Truell 认为,Rubin CPX 将加速代码生成和深度开发者洞察,重塑软件创作方式。Runway 首席执行官 Cristóbal Valenzuela 也表示,Rubin CPX 将为视频生成提供有力支持,构建更通用、更智能的创意工具。 这意味着,从独立艺术家到大型工作室,创作者都能在工作中获得前所未有的速度、真实感和掌控力。
英伟达 Rubin CPX 的推出,无疑为AI 硬件市场注入了新的活力,并为长上下文 AI 应用的发展奠定了坚实的基础。随着 Rubin CPX 预计于 2026 年底上市,我们有理由期待更多创新应用的出现。你认为,在Rubin CPX的加持下,哪些AI应用领域将率先迎来爆发?