

9月10日,Arm控股有限公司(以下简称Arm)正式发布全新Arm® Lumex™计算子系统(CSS)平台,旨在为旗舰智能手机与下一代个人电脑提供强大的端侧人工智能支持。这一全面集成硬件、软件与物理实现方案的平台,不仅显著提升AI性能与能效,更致力于帮助合作伙伴缩短产品开发周期,快速将创新体验推向市场。
Arm 高级副总裁兼终端事业部总经理 Chris Bergey强调,人工智能 (AI) 已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托 Arm Lumex CSS 平台,Arm 持续提升端侧 AI 体验,以满足用户日益增长的需求与期待。他进一步透露,Arm正将第二代可伸缩矩阵扩展(SME2)技术扩展至每一个CPU平台,预计到2030年,SME与SME2技术将为全球超过30亿台设备新增超过100亿TOPS的计算能力,为端侧 AI 性能带来指数级跃升。
Lumex CSS平台代表了Arm在移动计算领域的最新集大成之作。其核心组件包括新一代 Armv9.3 CPU集群、Arm Mali™ G1-Ultra GPU、灵活高效的Arm C1-DSU、针对三纳米工艺节点优化的物理实现,以及跨软件栈的深度集成,可为使用 Arm KleidiAI 软件库的开发者提供无缝的 AI 加速体验。其中,最引人注目的是搭载SME2技术的CPU集群,包括专为旗舰设备设计的Arm C1-Ultra和C1-Pro,面向次旗舰市场的C1-Premium,以及注重能效的C1-Nano。这一多层级设计使合作伙伴能够根据不同产品定位,灵活平衡性能、功耗与芯片面积。
在实际应用中,SME2技术表现出色。它可为AI工作负载带来高达五倍的性能提升,语音任务延迟降低4.7倍,音频生成速度提升2.8倍。例如,在智能瑜伽教练这样的实时应用中,文本转语音的生成速度提升了2.4倍,使用户能够即时获得反馈,而无需担心设备续航问题。此外,Arm与支付宝、vivo的合作表明,SME2技术有助于使得端侧大语言模型推理实现响应时间缩短40%,为生成式AI的实时体验铺平道路。
除了CPU的重大升级,新一代Mali G1-Ultra GPU也在图形与AI处理方面实现显著突破。其搭载的第二代光线)将光线追踪性能提升了两倍,为移动游戏带来桌面级的视觉体验。同时,Mali G1-Ultra还在AI推理任务中实现20%的性能提升,进一步强化了实时应用的响应能力。
Arm Lumex CSS 平台的另一大优势在于其高度的开发者友好性。通过KleidiAI软件库,开发者无需修改代码即可自动调用SME2的加速能力,目前KleidiAI已集成至PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴MNN及微软ONNX Runtime等主流AI框架中。这种深度的软件集成大幅降低了开发门槛,加速了端侧AI应用的落地。
跨平台可迁移性也是Arm Lumex的重要特点。谷歌旗下包括Gmail、YouTube和Google Photos在内的多款应用已全面支持SME2,可确保搭载Lumex的设备在上市之初就能提供无缝体验。此外,针对安卓系统优化的AI功能也可无缝迁移至基于Arm架构的Windows及其他操作系统,进一步扩展了应用场景。
生态合作伙伴的支持充分体现了Arm Lumex的平台价值。支付宝终端技术负责人翁欣旦表示,支付宝已在 vivo 新一代旗舰智能手机上完成了基于 Arm SME2 技术的 LLM 推理验证。结果显示,在预填充 (prefill) 与解码 (decode) 阶段,性能分别实现了超过 40% 和 25% 的提升。这标志着 CPU 后端能力的重大突破。vivo高级副总裁、首席技术官施玉坚则提到,vivo 是首家与 Arm 成立联合实验室的终端品牌。作为Arm的技术合作伙伴,vivo不仅与芯片平台厂商协作,在手机中率先落地Arm先进计算技术,为消费者带来体验的新升级。更重要的是,双方能将真实用户场景中的需求,提前带入技术的始发地,与 Arm 共同开启微架构层面的特性优化,进而引领未来芯片技术的演进。
Arm Lumex CSS 平台的推出,深刻反映了端侧AI的发展趋势:智能正在从云端向设备端迁移。与云优先AI相比,端侧AI在延迟、成本和隐私方面具有显著优势。SME2技术使得复杂的AI任务——如神经摄像头降噪功能在1080P分辨率下达到120fps、4K分辨率下达到30fps。用户无需牺牲数据隐私即可享受更流畅、更安全的智能体验。
这一转变不仅影响智能手机,还将覆盖PC、可穿戴设备和其他新兴AI终端。Arm通过C1-Nano等高效内核,将高性能AI能力扩展至更小型的设备中,真正实现“AI无处不在”的愿景。
SME2 已经广受业界领先生态伙伴的采用,包括阿里巴巴、支付宝、三星 System LSI、腾讯及 vivo。
诸多全球领先科技公司也对 Arm 技术给予了高度评价。Google安卓平台工程师Iliyan Malchev指出,得益于 SME2 技术增强的硬件,像 Gemma 3 这样更先进的 AI 模型能够直接在各类设备上运行。随着 SME2 的持续扩展,移动开发者将能在整个生态系统中无缝部署新一代 AI 功能,最终让终端用户在他们智能手机上随时享受低延迟的 AI 体验。Meta人工智能合作总监Sy Choudhury也表示,Meta 对 Arm Kleidi 与 PyTorch 框架下 ExecuTorch 工具的集成感到兴奋,这一集成将让 Meta 的应用得以在下一代技术平台上无缝运行,进而为终端用户带来体验的显著加速。
Arm Lumex CSS平台不仅是技术迭代的产物,更是面向AI时代的基础架构。它通过全面优化的硬件、开放的软件支持与灵活的配置选项,为OEM厂商和开发者提供了强大的工具,帮助他们在端侧实现更个性化、更高效、更隐私安全的AI体验。随着搭载Lumex的设备在不久的未来陆续上市,移动创新正迎来一个全新的起点,一个由端侧智能驱动的未来已然到来。