

英伟达与亚马逊正把AI存储架构推向新阶段,GPU直接发起存储访问的思路,正在从概念走向平台级落地,Vera Rubin将成为关键观察点
近两天,围绕这条技术路线的报道集中出现,核心都指向同一件事,GPU不再只等CPU分发数据,而是尝试直接与SSD和高速闪存建立访问通路
这意味着什么?对大模型训练和推理来说,算力并非唯一变量,数据能否及时送到GPU,正在成为决定系统效率的关键环节
传统计算架构里,数据常要经过CPU和DRAM多层转接,GPU的并行能力再强,也会被搬运链路拖慢,这类瓶颈在AI时代被放大得尤为明显
近期多家媒体提到,英伟达计划在下一代Vera Rubin AI平台导入GPU发起直接存储访问技术,目标就是缩短数据路径,让GPU直接对存储设备下达访问指令
亚马逊的参与让这条路线多了一层现实意义,云端场景对吞吐和延迟都极为敏感,一旦存储路径被压缩,集群调度方式也会随之变化
报道里反复出现的一个关键词是GIDS,它强调由GPU发起访问,而不是沿用传统由CPU先行调度的模式,这一点也是外界关注的焦点
同一时间,另一个关键词是HBF,高带宽闪存,它被放进这套新架构里,不是为了替代HBM,而是补上容量不足这一块短板
延世大学宋基焕教授团队给出的测试数据也成为讨论重点,6颗HBF配合2颗HBM,能把GPU可用存储容量从192GB提升到3120GB,扩容幅度超过16倍
这个数字之所以引人注意,不只因为容量提升幅度大,也因为它把AI推理阶段的存储压力摆到了台前,模型参数、上下文和缓存都需要更宽松的承载空间
推理和训练的需求并不相同,训练依赖HBM带来的高带宽,推理则更在意容量和访问效率,HBF被放到推理链路中,逻辑就变得清晰了
围绕这条路线,近两天的报道几乎形成同一幅图景,英伟达主导技术标准,亚马逊推动云端落地,双方都在为新一代算力架构铺路
微软和AMD也被多篇报道提到,它们同步推进各自方案,说明GPU直连存储并不是单一厂商的想法,而是整个行业都在追逐的方向
三星同样出现在这轮讨论中,Z-NAND被视作硬件侧的重要选项之一,这类闪存产品的价值,在于为高速访问和更大容量提供不同解法
GIDS与现有GPU直连存储技术的差别,也在近两天被频繁提及,现有方案仍需要CPU参与发起请求,新路线则把这一步尽量前移到GPU侧
这不是细节上的微调,而是一次路径重构,谁来发起访问,谁来承担调度,谁来决定数据流向,架构层面的答案正在变化
如果把AI系统看作一条高速公路,过去的做法像是每辆车都要先经过收费站再进入主路,如今的目标是让GPU直接驶向存储入口
这类变化对云厂商意义尤其明显,推理任务分布广、访问频繁、延迟敏感,任何一次路径压缩,都可能带来资源利用率的变化
数据搬运占用系统功耗的讨论,也在近两天的相关报道里不断出现,GPU和HBM之间的传输开销并不低,存储链路优化因而有了节能价值
HBF的出现,则把“容量”和“速度”放在同一张桌子上讨论,过去二者常常难以兼得,如今开始出现可组合的方案
这一点对大模型服务尤其重要,长上下文、Agent、检索增强推理,都在把存储需求推向前台,单靠HBM已经难以覆盖全部场景
Vera Rubin平台因此被视作一个节点,而不是一块单独的芯片,它连接的是GPU、存储、云基础设施和调度方式的整体变化
在最新的相关报道里,业内讨论并没有停留在“能不能做”,而是转向“怎么部署”,这也是这轮消息持续发酵的原因
值得注意的是,HBF和HBM的关系并非替代,而是分工,HBM继续承担高频、高带宽任务,HBF则承接容量和部分推理负载
这种组合思路,给存储厂商留出了新的竞争空间,也让服务器厂商、云服务商和网络互联方案提供商进入同一张赛道图里
Wiwynn等服务器企业在相关展会和生态消息中被提及,说明这场变化并不局限于芯片厂商,而是会向整机和系统层扩散
BlueField等DPU方案也被一些报道放在背景中讨论,虽然角色不同,但它们共同指向一个目标,让数据流转更接近系统级优化
近两天的信息中,学术界和产业界的声音有一个共同点,大家都承认AI算力的竞争,已经不只是比峰值性能,而是比数据路径的组织方式
这类判断并不夸张,因为当模型越来越大、上下文越来越长、推理越来越频繁时,存储与内存的边界就开始变得模糊
有人把GIDS看作下一代算力架构的入口,也有人认为它只是云端优化的一步,这种看法差异本身就值得放到评论区讨论
围绕HBF的争论也没有消失,支持者看重容量和场景适配,谨慎者则会关注延迟、耐久性和成本,哪一项先成熟,决定了落地速度
这正是近两天消息值得持续关注的地方,同一组报道里,既能看到明确的技术方向,也能看到现实约束留下的空间
AI推理的成本压力,已经从模型层传导到基础设施层,谁能把GPU、闪存和网络调度得更顺,谁就更接近下一轮效率优势
近两天的集中报道里,还有一个共同判断,就是这项技术并不只属于单一场景,云端训练、在线推理、边缘集群都可能受影响
对于企业客户来说,容量扩展意味着可以承载更大的上下文缓存,对于云服务商来说,数据路径缩短意味着集群利用率有机会抬升
这类变化不是瞬间完成的,标准制定、硬件适配、软件栈重构都需要时间,但方向已经足够清楚
Vera Rubin平台被反复提及,也说明英伟达正在把下一代平台当作新架构的试验场,而不是沿着旧路径继续加速
亚马逊的角色则更接近落地端,云厂商最看重实际吞吐、成本和维护复杂度,只有这些指标成立,技术才会被放大使用
近两天的报道里没有夸张的终局叙事,更多是围绕架构变化、产品节奏和生态协同展开,这种表达反而更接近产业现实
对外界来说,最值得留意的不是某个单点参数,而是这些部件开始形成组合,GPU直连存储、HBF、云端平台、DPU,彼此之间正在重新配位
这也解释了为什么同一条消息会引发持续讨论,因为它触碰到的是AI基础设施的底层组织方式,而不是单纯的硬件升级
有些内容已经可以确认,有些内容仍处于推进阶段,但近两天的报道都在指向同一个结论,数据路径正在变成新的竞争主轴
如果后续生态继续跟进,围绕存储、闪存、互联、调度的软件优化也会陆续出现,那时这条路线的价值才会更完整地显现
眼下的重点,是把这轮信息看清楚,英伟达与亚马逊推进的并不只是一次合作,而是一次围绕GPU、SSD和闪存关系的重写
当算力增长继续逼近边界,谁来搬数据,怎样搬数据,数据经过哪些层级,都会变成决定AI效率的核心变量
这一轮近两天的集中信息,已经把方向摆在了台面上,接下来要看的,就是谁先把它变成可复制的系统方案
当地时间周五,美国总统特朗普在白宫为即将上任的美联储主席凯文・沃什举行宣誓就职仪式。这是自1987年艾伦・格林斯潘以来,首次在白宫举行美联储主席宣誓仪式。
黑龙江一老虎现身林蛙养殖场,被监控拍到时“两眼放光”,当地称确有此事,老虎下山寻找食物没有伤人,并提醒附近群众不要上山
近日,黑龙江哈尔滨,有网友发布监控视频,视频显示5月18日19时许,一只老虎出现在监控画面里,监控灯光照得这只老虎眼睛放光,见到有光源老虎停下脚步趴在草丛里,趴了半分钟左右扭头跑出了监控范围。
可这帮人正等着看笑话呢,中国商务部一纸声明直接把这出戏砸了台。美媒的唱衰戏码:套路还是老样子,可观众已经累了。
黑龙江农信改革实质性启动:首批27家涉改机构名单出炉,东北三省全面采用分批合并路径
每经记者:刘嘉魁 每经编辑:魏文艺5月20日,黑龙江省农村信用社联合社官网发布公告,披露了首批27家涉改机构名单及联系方式。这标志着黑龙江省农信系统统一法人改革正式进入实施阶段。
自高市早苗发表涉台错误言论以来,中国内地赴日游客数量持续走低,今年前4月同比下降55.1%
日本政府观光局20日公布数据显示,4月中国内地访日游客数量同比下降56.8%,连续第五个月同比下降。今年头四个月,中国内地访日游客数量同比下降55.1%。自日本首相高市早苗发表涉台错误言论以来,中国内地赴日游客数量持续走低,日本零售、住宿、餐饮等多个行业承压。
逃犯整天在家洗衣服,靠洗衣机声音“解压”,3年用水1000多吨,细节披露
日常生活中,一户三口之家,一年的用水量一百多吨,很少有超过两百吨。然而在山西太原,有一户母女二人,一年的用水量竟然高达400多吨,而且连续三年这么多。异常的用水量引起了物业的注意,最后还惊动了当地的派出所,这究竟是怎么回事?
案例警示 一次爆燃,妻子全身70%烧伤!事关“电驴”安全,别拿生命冒险
“两块电池花了近7000元……我怎么也没想到它会爆燃。”张先生如今悔恨交加。为追求 “更方便、耐用”一些人选择非法改装电动自行车殊不知危险一触即发案例回顾2025年11月25日,安徽怀远的张先生骑着一辆装有非标锂电池的非法改装电动自行车,载着妻子一起去接孩子。
如果你的大脚趾外凸不好走路,一定要试一下这个脚趾矫正器#拇外翻#脚部护理#好物分享
enoi 香槟鎏光 玉田美甲 #超好看的脚趾甲美甲 #显白爆闪脚趾甲 #显白脚趾甲 #玉田美甲 #养了只橘子美甲
“大爷命不该绝!晚一分钟可能就不行了!”5月17日,黑龙江滨北桥下,钓鱼佬王先生(化名)结伴开船去河上钓鱼,结果突然看见一名大爷从二三十米的桥上掉了下来,重重的砸进了水里没了动静。两个人都看见了这一幕,第一时间被吓一跳,但下一秒就反应过来了,赶紧开船过去救人。