开云(中国大陆官方网站)Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

关闭菜单
027-83317177
当前位置: 首页 > 新闻资讯 > 行业新闻

AI实验室提出流形优化新方法助力大模型训练稳定性提升

2025-09-28 13:02:42 小编

  

AI实验室提出流形优化新方法助力大模型训练稳定性提升

  训练大型神经网络需要精细控制权重、激活值等关键张量,避免数值溢出等问题。据悉,研究人员提出通过流形约束优化算法,将权重限制在健康区间,从源头提升训练稳定性。

  该方法将权重约束在特定子流形上,并在切空间中定义距离度量进行优化。通过投影和归一化操作,确保更新方向始终沿流形表面移动,使学习率与实际位移更好对应。

  研究特别关注Stiefel流形优化,选择谱范数作为距离函数以控制矩阵对向量的拉伸效应。这种思路催生了Muon优化器,并通过模块流形理论将方法推广到整个神经网络,实现层间学习率的合理分配。

联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 027-83317177
咨询kaiyun全站解决方案 马上咨询
免费获取技术咨询服务
姓名图标
电话图标
QQ图标

联系我们 contact us
027-83317177