开云(中国大陆官方网站)Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

关闭菜单
027-83317177
当前位置: 首页 > 新闻资讯 > 公司新闻

微软机房里大量NVIDIAGPU在吃灰:原因哭笑不得

2025-11-06 10:51:31 小编

  微软CEO纳德拉亲口承认公司正面临一个前所未有的尴尬:微软手上有成堆的GPU,却因为缺电、缺空间,只能闲置在那儿。

  最大的问题不是芯片供应,而是供电能力,以及我们能否足够快地建成靠近电源的数据中心。如果做不到,你就会有一堆芯片只能躺在仓库。

  不是因为算力已经足够或者“过剩”了,而是现在的基础设施不足以支撑这些芯片运行起来。

  二是因为缺少可以立马投入使用的数据中心也就是纳德拉口中的“warm shells”,即已经建好、具备足够供电与冷却能力的机房外壳。

  去年,当被问及微软在2024年是否仍然受到NVIDIA芯片的供应限制时,纳德拉是这么说的:

  奥特曼也在同期讨论中提到,行业面临的总体挑战不仅仅是算力问题,更多还有能源和基础设施的匹配问题。

  过去两年,他陆续投资了裂变能源公司Oklo、聚变能源公司Helion,以及太阳能创业公司Exowatt。

  只不过,这些新型能源技术离大规模商用还很远,短期内,数据中心仍得依赖燃气和可再生能源混合供电。

  随着AI和云计算带动的数据中心建设进入高峰期,用电需求开始以超出预期的速度增长,远远超过公用事业公司原本的新增发电规划。

  传统电厂从立项到并网通常需要数年周期,而AI产业扩张的节奏以季度计算,于是,为了追上算力扩张的步伐,越来越多的数据中心开发商不得不自己为AI发电。

  因此,越来越多的数据中心开发商选择采用所谓的“计量表后”(behind-the-meter)供电方式直接将电力接入数据中心,绕过公共电网,以弥补供能缺口。

  光伏太阳能被视为目前建设周期最短、部署最灵活的能源形式,但在时间维度上,它与数据中心几乎同步从选址、施工到并网动辄数月甚至一年。

  举个具体点的例子来说吧:当算力曲线每季度刷新纪录时,能源系统还在审批表格上打转(无奈摊手.jpg)。

  部分业内人士担心,如果未来AI需求增速放缓,当前为了支撑AI算力而大规模投资的电厂和储能项目可能会出现闲置风险。

  如果算力成本明天下降100倍,用量会增长远超100倍。越便宜的计算力,只会带来更大的总体需求。

  为此,奥特曼呼吁美国政府每年增加100吉瓦发电能力,并将其视为“AI战略资产”。

  一台昂贵的NVIDIA芯片,如果暂时插不上电,两、三年后又被新架构取代,那等于在折旧周期内就提前贬值。

  而根据微软经验,数据中心设备的折旧周期通常是六年,盲目囤货不仅占用现金,还会造成资源浪费。

  人口增长了20%,部分物理电网老化,新的城市生活和科技进步都对电力需要提出了不断增长的需求。

  如上所述,GPU生产可以按季度迭代,但电力系统、数据中心冷却与输电网络的建设,却是以年为单位的工程。

  AI产业算力增长能否延续,关键已不在芯片产量,而在能源与基础设施是否能同步扩张。

  如果你是受电力限制而不是芯片限制,你会想要每工作最节能的芯片,对吧?如果你已经被能耗闲置,而NVIDIA推出一款速度提升1.2倍但能耗降低25%的芯片,那将非常有吸引力。

  周一,微软上宣布,相关部门已经批准它向阿联酋运送NVIDIA芯片,用来建设训练AI模型所需的数据中心。

  微软还表示,未来四年将在海湾国家投资80亿美元用于数据中心、云计算和其他人工智能项目。

  中东地区资金丰厚,能源丰富,外媒分析,这笔交易也标志着AI基础设施正在从硅谷迁往能源充足的新兴市场。

联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 027-83317177
咨询kaiyun全站解决方案 马上咨询
免费获取技术咨询服务
姓名图标
电话图标
QQ图标

联系我们 contact us
027-83317177