开云(中国大陆官方网站)Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

关闭菜单
027-83317177
当前位置: 首页 > 新闻资讯 > 公司新闻

英伟达RubinCPXGPU:长上下文推理新纪元赋能AI应用创新

2025-09-11 22:35:31 小编

  

英伟达RubinCPXGPU:长上下文推理新纪元赋能AI应用创新

  (Rubin Context GPUs),这款专为处理超过100万token的长上下文推理任务而设计的GPU,标志着AI硬件领域的一次重要革新。此次发布不仅带来了硬件的升级,更预示着在软件开发、视频生成等领域,AI应用将迎来新的发展机遇。

  英伟达推出的SMART框架强调采用全栈解耦式基础设施,实现计算与内存资源的高效调配。通过Blackwell 架构 GB200 NVL72 平台与 NVFP4 低精度推理技术的结合,辅以TensorRT-LLM、Dynamo等开源软件,使得整个AI领域的推理性能大大提升。解耦式推理架构将推理过程分为上下文处理与内容生成两个阶段,并针对每个阶段的特性进行优化,从而显著提升系统吞吐量,降低延迟,并全面提高资源利用率。NVIDIA Dynamo(一个开源、低延迟的模块化推理框架)在最新的 MLPerf Inference 结果中发挥了关键作用,为GB200 NVL72带来了新的性能纪录。

  Rubin CPX 的发布,受到了来自行业内的广泛关注。Cursor 和 Runway 等公司均表示,这款GPU将极大地提升其在软件开发、视频生成等领域的生产力。例如,Cursor 首席执行官 Michael Truell 认为,Rubin CPX 将加速代码生成和深度开发者洞察,重塑软件创作方式。Runway 首席执行官 Cristóbal Valenzuela 也表示,Rubin CPX 将为视频生成提供有力支持,构建更通用、更智能的创意工具。 这意味着,从独立艺术家到大型工作室,创作者都能在工作中获得前所未有的速度、真实感和掌控力。

  英伟达 Rubin CPX 的推出,无疑为AI 硬件市场注入了新的活力,并为长上下文 AI 应用的发展奠定了坚实的基础。随着 Rubin CPX 预计于 2026 年底上市,我们有理由期待更多创新应用的出现。你认为,在Rubin CPX的加持下,哪些AI应用领域将率先迎来爆发?

联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 027-83317177
咨询kaiyun全站解决方案 马上咨询
免费获取技术咨询服务
姓名图标
电话图标
QQ图标

联系我们 contact us
027-83317177