

最近,SemiAnalysis放出了一份堪称“GPU云天梯图”的报告,把全球AI云玩家排了个座次。
有意思的是,SemiAnalysis这套评级体系,不看云规模有多大、算力有多少,而是看↓
这样的评估原则,让我们清楚滴看到:在大模型训练、推理和智能体业务的井喷需求下,云服务正在悄悄洗牌,传统大云多年的规模优势已经被打破了。
这排名很刺激,把提供GPU云服务的厂商,从白金、黄金、白银、青铜,再到“不推荐(Not Recommended)”,分了三六九等↓
这家公司以前是干挖坑的(主要是以太坊),现在转行AI算力,专为AI训练/推理场景打造,硬件+软件栈都为大规模GPU任务优化。
甲骨文OCI支持高性能裸金属GPU(N卡A卡)+RDMA网络,低延迟、高吞吐,训练效率优秀。
而微软Azure则是传统大云里排名最靠前的,与OpenAI合作最深,GPU节点覆盖广(北美、欧洲、亚太),高端GPU供应稳定。
老大哥AWS的GPU型号最全,不仅有N卡还有自研的T卡。但更多资源内耗给Bedrock和SageMaker了,算力资源不够开放且价格昂贵。
第一档叫做不能打(UnderPerforming):能跑,但是体验太差,不推荐生产使用。
第二档叫做不可用(Unavailable):宣传有,但实际根本租不到。国内第一大云阿里云就被放在这一档。
“阿里云在海外控制台无法创建任何AI GPU实例,因此被标记为 Unavailable。”
这里面原因大家都能懂,并不是阿里云的GPU实例真不可用,而是被三类场景锁死:①通义、百炼自用②白名单大客户专享,不在公网开放③受出口管制影响。
SemiAnalysis还给出了另外一张格局图,根据各家服务商的“出身”,再次进行了点评。
这几家是最近两年爆红的新势力,全栈为 GPU 计算设计,从底层就是为 AI 训练/推理而生。
靠「灵活计费+训推优化+GPU实例现货+更懂AI开发者」一路逆袭,服务AI团队、模型创业公司。
他们更像「国家队」,主打算力自主、安全合规、本地部署,GPU主要内部专供。
这些厂商不直接造云,而是做“GPU市场平台”,他们就像GPU界的滴滴:一端连接闲置GPU算力;一端对接AI用户和训练任务。
AI开发者不再需要通用云,而需要GPU足、成本低、调度快、服务好的更纯粹的AI云。
大云们多年来都是围绕虚机、容器、数据库生态构建的,面对新需求只能补丁式适配,从原来架构上拼接GPU集群,而不是颠覆式重新设计。
每个有点Power的国家都想要「自己的GPU、自己的AI云、自己的大模型」,这种想法不止于中、美。
我只能说,传统大云一统天下的时代已经翻篇,云市场的碎片化不可逆,「这个世界只需要5朵云」的神话,彻底破灭。