开云(中国大陆官方网站)Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

关闭菜单
027-83317177
当前位置: 首页 > 新闻资讯 > 公司新闻

计算机行业点评报告:英伟达:重视AI推理计算发布RubinCPX芯片

2025-09-28 22:30:53 小编

  

计算机行业点评报告:英伟达:重视AI推理计算发布RubinCPX芯片

  英伟达于9月9日宣布其Blackwell Ultra计算平台在MLPerf Debut测试中创下新的AI推理速度纪录。同日,英伟达发布了专门针对长上下文推理任务设计的Rubin CPX芯片。

  大模型发展对计算推理速度提出更高要求,英伟达算力系统具备领先表现。随着大语言模型参数量越来越大,且在推理过程中需要产生很多中间推理过程的token,对算力硬件的推理能力提出了更高要求。近期英伟达对其最新的基于Blackwell Ultra架构的算力系统(GB300 NVL72服务器)采用MLPerf Inferencev5.1测试标准,对DeepsSeek-R1、Llama3.1、Whisper等流行开源AI模型的推理速度进行了测试,结果显示,GB300服务器在每GPU每秒生成token数量上创下新纪录,大幅领先公司此前的DGX H200和GB200服务器。

  分离式推理成为重要方向,能够进一步增强AI推理速度。英伟达高度重视分离式推理的架构,在将GB200服务器中的16块GPU用于生成、56块GPU用于上下文处理之后,能够进一步提升服务器的整体推理速度。该技术趋势有望在未来广泛应用并促进AI模型的推理效率,从而推动AI应用的部署。

  AI智能体系统需要多步推理、持久记忆和长上下文以处理复杂任务,Rubin CPX芯片针对长上下文处理和分离式推理进行优化。本次新发布的Rubin CPX芯片专门针对长上下文进行优化,并且对视频编码解码能力给予支持,在长上下文推理和视频模型推理中具备特殊效果。其设计本身反映了英伟达对强化AI推理计算效能和分离式推理架构的重视。我们认为未来该芯片的推广应用有望巩固英伟达在AI计算生态中的领先地位,并加速AI模型和应用的部署应用。

  英伟达始终处于AI计算领域的前沿,不断通过革新硬件和计算架构增强AI算力对AI模型计算的支持。建议投资者重点关注其AI算力产品更新、泛AI生态圈拓展延申等方面的进展。

  (1)AI技术投入与成本控制压力;(2)市场竞争加剧;(3)用户增长可持续性挑战;(4)汇率波动与国际化风险。

联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 027-83317177
咨询kaiyun全站解决方案 马上咨询
免费获取技术咨询服务
姓名图标
电话图标
QQ图标

联系我们 contact us
027-83317177