计算机行业点评报告：英伟达：重视AI推理计算发布RubinCPX芯片-Kaiyun科技股份有限公司

计算机行业点评报告：英伟达：重视AI推理计算发布RubinCPX芯片

2025-09-28 22:30:53 小编大中小

计算机行业点评报告：英伟达：重视AI推理计算发布RubinCPX芯片

　　英伟达于9月9日宣布其Blackwell Ultra计算平台在MLPerf Debut测试中创下新的AI推理速度纪录。同日，英伟达发布了专门针对长上下文推理任务设计的Rubin CPX芯片。

　　大模型发展对计算推理速度提出更高要求，英伟达算力系统具备领先表现。随着大语言模型参数量越来越大，且在推理过程中需要产生很多中间推理过程的token，对算力硬件的推理能力提出了更高要求。近期英伟达对其最新的基于Blackwell Ultra架构的算力系统（GB300 NVL72服务器）采用MLPerf Inferencev5.1测试标准，对DeepsSeek-R1、Llama3.1、Whisper等流行开源AI模型的推理速度进行了测试，结果显示，GB300服务器在每GPU每秒生成token数量上创下新纪录，大幅领先公司此前的DGX H200和GB200服务器。

　　分离式推理成为重要方向，能够进一步增强AI推理速度。英伟达高度重视分离式推理的架构，在将GB200服务器中的16块GPU用于生成、56块GPU用于上下文处理之后，能够进一步提升服务器的整体推理速度。该技术趋势有望在未来广泛应用并促进AI模型的推理效率，从而推动AI应用的部署。

　　AI智能体系统需要多步推理、持久记忆和长上下文以处理复杂任务，Rubin CPX芯片针对长上下文处理和分离式推理进行优化。本次新发布的Rubin CPX芯片专门针对长上下文进行优化，并且对视频编码解码能力给予支持，在长上下文推理和视频模型推理中具备特殊效果。其设计本身反映了英伟达对强化AI推理计算效能和分离式推理架构的重视。我们认为未来该芯片的推广应用有望巩固英伟达在AI计算生态中的领先地位，并加速AI模型和应用的部署应用。

　　英伟达始终处于AI计算领域的前沿，不断通过革新硬件和计算架构增强AI算力对AI模型计算的支持。建议投资者重点关注其AI算力产品更新、泛AI生态圈拓展延申等方面的进展。

　　（1）AI技术投入与成本控制压力；（2）市场竞争加剧；（3）用户增长可持续性挑战；（4）汇率波动与国际化风险。

上一篇：摩尔线程加速GPU自主可控进程公司累计研发投入已超过43亿元下一篇：提供算力的“三驾马车”：“通算”、“智算”与“超都是啥？返回

免费获取策划方案及报价

联系专业的商务顾问，制定方案，专业设计，一对一咨询及其报价详情

服务热线 027-83317177

热门标签

GPU计算

开云（中国大陆官方网站）Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

计算机行业点评报告：英伟达：重视AI推理计算发布RubinCPX芯片

这一战谷歌准备了十年

苹果公司正式推出M5芯片首发3款新品

上海国产GPU龙头冲刺IPO

美国要求高端GPU严禁出口：英伟达发声明坚决反对！黄仁勋曾称