

AI圈正被“算力浪费”的难题困住时,阿里云甩出了一张硬核成绩单。近日,其计算池化解决方案“Aegaeon”成功入选SOSP 2025,要知道这场由ACM SIGOPS主办的会议,是计算机系统领域的顶级盛会,每年仅收录数十篇论文,被誉为操作系统界的“奥斯卡”,能拿下入场券,足以见得这项技术的分量。
更让人关注的是实打实的效果。在阿里云模型市场超三个月的Beta测试里,面对数十个参数量达720亿的大模型,所需的英伟达H20 GPU数量从1192个直接降到213个,用量削减足足82%。这组数据背后,藏着整个AI行业的普遍痛点——此前阿里云模型市场曾出现17.7%的GPU算力,仅用来处理1.35%请求的情况,大量不常被调用的“长尾”模型独占着GPU资源,造成严重的算力闲置。如今这项技术已落地阿里云百炼平台,单GPU能同时服务7个不同模型,有效吞吐量比现有主流方案提升1.5-9倍,请求处理能力也达到原来的2-2.5倍。
82%的GPU用量削减,不是简单的“省硬件”,而是给AI行业的发展逻辑换了赛道。过去很长一段时间,行业里似乎形成了一种固定思维:模型跑不动就加GPU,算力不够就扩容硬件。就像一家餐厅,因为少数热门菜品点单多就不停扩建后厨,却任由多数冷门口味的专属灶台空着,成本越来越高,效率却没跟上。而Aegaeon做的,就是把这些零散的“灶台”整合起来,变成能灵活调配的共享厨房,让每一份设备资源都用在刀刃上。
这背后的关键,在于“token级调度”这个核心创新。大模型生成内容时,是逐词(也就是token)输出的,Aegaeon系统能在每生成一个token后,动态决定是否切换模型,实现对GPU资源的精细化管理。更重要的是,它通过组件复用、显存精细化管理等全栈技术,把模型切换的开销降低了97%,做到亚秒级的切换响应,完全不影响用户使用体验。这种操作,好比快递分拣站的智能调度系统,既能让每辆快递车不跑空趟,又能保证包裹准时送达,把整个链路的效率拉到最高。
对AI企业来说,这82%的削减意味着成本的“减负”。现在大型模型服务商动辄要投入成千上万张GPU,硬件采购成本是不小的负担。有行业人士算过一笔账,按单张高端GPU数万元的成本计算,1192张到213张的差距,能省下数千万元的投入。而对整个行业而言,这打破了“AI发展只能靠硬件堆料”的误区,证明从底层系统软件入手,同样能挖出巨大的潜力。
当下,全球AI竞争越来越激烈,底层技术的突破远比单纯的硬件堆砌更有竞争力。当不少企业还在为“抢GPU”发愁时,阿里云已经从“如何用好现有GPU”的角度找到突破口。这不是说硬件不重要,而是让硬件的价值得到最大化发挥——就像同样的食材,在不同厨师手里能做出完全不同的效果,Aegaeon就像是给AI行业的“算力食材”配上了更懂调配的“主厨”。
“真正的算力自由,从来不是拥有多少硬件,而是用好每一份硬件。”阿里云的这次突破,不仅是自身的技术里程碑,更给整个行业提了个醒:AI的下一程竞争,拼的不只是硬件数量,更是底层效率的挖掘。当算力浪费的问题被逐步解决,AI模型的落地成本会更低,能走进更多行业、服务更多场景,这才是技术突破真正的价值所在。
你觉得这种“算力优化”技术,会让哪些AI应用更快走进我们的生活?如果算力成本大幅降低,你最想体验哪些AI服务?欢迎在评论区分享你的看法。
10月20日,界面新闻注意到,微博账号名为“Cici_老魏”的魏思琪,其认证信息更新为“小米中国区市场部总经理”。此前她的微博账号认证信息为 “小米手机市场部总经理,小米汽车市场部副总经理”。 此次人事变动距离前任总经理王腾被辞退已过去一个多月。
神奇的梵净山,大自然鬼斧神工,双峰耸立,引来无数中外游客,到底怎么形成的.#大自然的鬼斧神工#自然奇观#梵净山#旅行推荐官
福建舰航空母舰出港是海军的骄傲,拥有着强大的远洋作战能力和空中打击力量。
不开玩笑!贵州真的有龙#探秘花江峡谷大桥 花江峡谷大桥下全是“贵州龙”#“桥”见世界第一高 #基建狂魔 #贵州高桥
胃痛、反酸是老胃病常见症状,但临床数据显示,我国每年新发胃癌病例约占全球40%,其中超85%患者确诊时已中晚期。成都寰亚医院白星医生提醒:胃癌并非突然发生,从慢性胃炎到癌变往往存在5-10年可逆期。若身体持续出现以下信号,务必及时胃镜检查。5大高危信号1.
杨振宁曾在百岁生日宴后摔倒住院85天 ,“翁帆为他着想,见客超1小时,翁帆就要终止”
据清华大学消息,诺贝尔物理学奖得主、中国科学院院士、著名物理学家杨振宁于10月18日在北京逝世,享年103岁。据大河报报道,杨振宁曾在百岁生日宴后摔倒,致脊椎骨裂在301医院住了85天 。朱邦芬院士表示:翁帆为杨先生着想,其见客超一小时,翁帆就要终止。
10月20日下午,南昌大学招生与就业工作处发布《情况说明》,全文如下:10月16日上午,学校双选会因一家企业摆放招聘海报引发网友讨论,我们高度重视,立即派人到现场查看,该企业已撤场,并将招聘物料带走。
景区工作人员称,雪是从昨天晚上1点多开始下的,持续了大概40分钟左右,老君山下雪的时间基本都是每年10月份。