沐曦股份：三年研发烧掉22亿国产GPU企业冲刺科创板-Kaiyun科技股份有限公司

沐曦股份：三年研发烧掉22亿国产GPU企业冲刺科创板

2025-10-10 11:02:34 小编大中小

沐曦股份：三年研发烧掉22亿国产GPU企业冲刺科创板

　　作为中国GPU自主化突围的重要力量，沐曦股份基于自研MXGPU架构，正积极推进AI加速、图形渲染与通用计算的融合，产品已支持FP64至FP8多种计算精度，具备良好兼容性和开发潜力，并逐步构建起自主可控的软硬件生态。

　　2024年公司实现营业收入约7.43亿元，同比大幅增长，但同时净亏损扩大至14.09亿元，三年累计亏损已超30亿元，且经营性现金流持续为负。公司三年累计研发费用达22.48亿元，其中仅2024年研发支出高达9.01亿元，是同期营收的121.24%。研发支出远超营收，成沐曦股份经营亏损主因。

　　今年6月，沐曦股份正式向科创板提交IPO申请。站在冲刺科创板IPO的关键节点，高性能通用GPU产品的规模化落地能力与持续融资能力能否同步实现闭环，对于沐曦股份来说至关重要。

　　，直接持股13.30%，为第一大股东。由于上海骄迈与员工持股平台上海曦骥（持股4.05%）及陈维良先生为一致行动人，陈维良先生通过上述持股平台合计控制公司22.94%的股权。

　　陈维良先生同时拥有公司董事会半数以上成员的提名权，是公司的实际控制人.

　　陈维良，男，1995年考入电子科技大学微电子专业，后攻读清华大学微电子所硕士，2002年毕业。毕业后在上海加入国际顶级芯片厂商AMD，长期从事GPU芯片的架构设计与产品研发，主导并成功流片超15款高性能GPU产品。2020年9月，在上海临港自贸区成立沐曦，专注于高性能通用GPU的研发与产业化，目标应用于数据中心、AI、自动驾驶、图形渲染等领域。公司首颗7nm工艺通用GPU芯片于2023 年实现量产。

　　公司的产品主要面向国家级AI算力基础设施、运营商和云服务商以及行业龙头客户。在国家AI公共算力平台、运营商智能计算平台、商业化算力中心等领域均有批量部署，重点应用场景包括科研教育、金融、交通、能源、医疗健康、大型文娱等。与上海人工智能实验室等科研机构及大型云计算企业等建立了合作，将沐曦GPU用于大规模模型训练和推理。

　　沐曦基于自研MXGPU架构，当前已支持FP64至FP8等多精度计算，产品在接口层面兼容OpenCL、OpenGL、Vulkan等主流图形与通用计算协议，具有良好接口兼容性。与国际头部厂商相比，其生态系统构建仍处于早期阶段。

　　作为Fabless芯片设计企业，沐曦不自行制造芯片，主要采购环节涵盖上游晶圆代工和封装测试、核心原材料（如HBM高带宽内存）、以及服务器及GPU板卡组装所需的硬件设备和电子元器件等。其中，晶圆和封测服务由专业代工厂商提供；HBM等存储器和EDA设计工具多来自国际供应商；服务器及配件等由国内外设备厂商供应。公司通过多渠道布局，上游合作伙伴涵盖了半导体制造商、内存厂商和板卡组装厂商，以确保供应链稳定。

　　AI加速芯片主要聚焦于A端高性能计算市场，图形处理器更多服务于B端专业图形渲染及计算需求，而C端消费市场则侧重桌面级GPU及智能SoC产品，三者共同构成GPU产业多层次、分工明确的生态体系。

　　上游环节包括EDA工具、IP授权、半导体制造设备与材料等。公司主要通过采购如Synopsys、Cadence等国际厂商的EDA软件进行芯片架构设计，同时依托台积电、中芯国际等代工厂完成高性能GPU的晶圆制造。光刻机、硅片、封装材料等关键资源仍高度依赖全球头部供应商。

　　沐曦股份核心定位于中游的GPU芯片设计环节，基于自研MXGPU架构，聚焦通用计算、图形渲染与AI加速融合方向。公司承担从前端架构、逻辑实现到流片验证全过程，并通过外协完成封装与测试工作。其产品支持多精度计算（FP64–FP8），初步建立起自主可控的芯片技术体系。

　　下游方面，沐曦积极拓展应用场景与生态布局，通过自建开发平台与软硬件协同，推动GPU在AI训练、数字孪生、工业仿真等高算力领域落地。公司客户涵盖云服务商、整机厂商和政企机构，正努力构建从芯片到平台再到行业应用的一体化国产替代解决方案。

　　GPU行业是典型的技术密集型产业，融合了图形渲染、AI计算和大规模并行处理等多项复杂技术，对软硬件协同能力提出极高要求。高性能GPU的研发不仅需掌握自研指令集、系统架构（如摩尔线程的统一架构MUSA）、Chiplet集成等前沿技术，还面临研发周期长、验证环节复杂、资金投入巨大的挑战，整体形成了显著的技术壁垒和资金门槛。

　　全球GPU市场长期由英伟达、AMD等国际巨头主导，垄断程度高，尤其在AI训练、科学计算等高端场景形成较强技术和生态壁垒。龙头企业凭借CUDA、ROCm等生态平台绑定开发者与客户，带动硬件与软件协同进化。

　　随着AI大模型、自动驾驶、工业仿真、元宇宙等新兴场景的兴起，GPU芯片在计算加速中的需求呈爆发式增长。其在云计算、数据中心、智能终端等领域的通用性不断增强，推动GPU从图形处理器转变为通用计算核心。

　　受制于地缘政治与出口管制风险，中国高性能GPU产业正加快自主可控布局。政策层面积极引导核心芯片突破卡脖子环节，国产GPU企业如沐曦股份、摩尔线程、壁仞科技等加速研发，争取在基础架构层实现自主可用。

　　GPU产业链涵盖EDA/IP、晶圆代工、封装测试、驱动兼容、整机适配等多个环节，链条长、依赖度高。设计公司需与上游EDA/代工厂协同优化设计流程，同时通过开放平台打通下游AI框架与应用，形成软硬件协同体系。

　　行业高度依赖GPU生态。以英伟达为例：英伟达能够长期屹立不倒，首先在于其GPU产品具备极强的易用性和不可替代性。通过对不同计算任务的深度优化，英伟达大幅降低了开发者的上手门槛，并提供从硬件到开发工具的一站式支持。同时，其软硬件深度融合、性能高度匹配，使得使用其GPU成为很多高性能计算任务的默认选择。一旦开发者接入英伟达平台，往往需要沿用其整套工具链与编程接口，进一步加深绑定。其次，英伟达构建了一个庞大且复杂的GPU软件生态系统，这一生态涵盖了各种开发接口、调试工具、编译框架和模型库等，开发周期长、门槛极高。英伟达通过多年的软件积累和持续测试，形成了行业领先的软件基础设施，使得新竞争者很难在短时间内复制这一生态体系，显著提升了客户的迁移成本与技术依赖程度。从商业模式上看，英伟达通过巨额的研发投入与垂直整合战略，强化了其在高端市场的主导地位。无论是AI训练、自动驾驶还是云计算场景，英伟达都通过GPU硬件+软件平台+生态支持的整体解决方案绑定客户，并在软硬件一体化趋势下不断扩大市场份额。这种强生态粘性和平台封闭性，共同构筑了其难以撼动的护城河。

　　根据弗若斯特沙利文预测，受AI和大数据技术广泛应用驱动，中国算力规模正加速扩张，从2020年的136.20EFLOPs快速增长至2024年的617.00EFLOPs，年均复合增长率高达45.9%，预计到2029年将进一步攀升至3442.89EFLOPs，年均复合增长率达40.0%。其中，智能算力是主要增长引擎，其规模从2020年的59.20EFLOPs提升至2024年的438.07EFLOPs，年均复合增长率达64.9%，预计2025至2029年将以45.3%的年均增速增长至3035.91EFLOPs，主要受AI应用爆发式发展的推动。同期，通用算力也将在企业办公、数据管理及业务系统等传统行业数字化转型带动下，从2025年的215.55EFLOPs增长至2029年的406.98EFLOPs。随着AI、数据中心、游戏、专业图形渲染和自动驾驶等下游应用市场的迅猛发展，高性能计算加速芯片的市场需求将持续释放。同时，信息融合与人机交互需求的提升也带动机载、车载、船载图形显控模块及其配套产品的需求增长，为集成电路行业带来了广阔的发展空间与增长潜力。

　　随着中国AI下游应用市场的迅速扩张，AI计算加速芯片的市场需求呈现爆炸式增长，吸引各类芯片制造商的加入。目前，GPU依然是AI市场的主导芯片。不过，以ASIC和FPGA为代表的其他类型芯片也已实现商业化，并在市场中占据一定比例。

　　未来，随着中国GPU企业在技术上的不断突破，AI计算加速芯片的市场规模预计将实现快速增长。根据弗若斯特沙利文预测，到2029年，中国的AI芯片市场规模将从2024年的1,425.37亿元激增至13,367.92亿元，2025年至2029年期间年均复合增长率为53.7%。从细分市场上看，GPU的市场增长速度最快，其市场份额预计将从2024年的69.9%上升至2029年的77.3%。

　　在美国实体清单限制、国产化战略加持下，GPU行业国产替代进入提速阶段。国内供应链上下游企业协同推进，推动EDA工具、IP核、封测等环节自给率提升。政策层面，国家大基金、科创板支持等为GPU初创企业提供强力资金与上市通道。

　　近年来，作为全球电子产品制造大国及主要消费市场，中国电子信息产业持续快速发展，电子信息产业的全球地位迅速提升，为中国集成电路产业发展提供了良好机遇。我国已初步形成芯片设计、晶圆制造、封装测试的集成电路全产业链雏形，产业链布局逐步完善，上下游协同发展。在晶圆制造环节，我国拥有中芯国际、华虹公司、晶合集成等晶圆制造企业；在封装测试环节，我国拥有长电科技、华天科技、通富微电等全球领先的封测厂商。集成电路设计行业作为集成电路行业的重要细分领域，在产业链中起着承上启下的关键作用。完整的产业链使集成电路设计企业既能快速采购原材料，也能及时准确地响应客户需求，保障行业稳定发展。

　　GPU芯片类：包括上海壁仞科技股份有限公司、上海天数智芯半导体股份有限公司、沐曦集成电路（上海）股份有限公司、摩尔线程智能科技（北京）股份有限公司、芯动科技（北京）有限公司、格兰菲智能科技股份有限公司、南京砺算科技有限公司、深流微智能科技（深圳）有限公司、芯瞳半导体技术（厦门）有限公司、苏州登临科技有限公司、瀚博半导体（上海）有限公司等。

　　其他类型计算加速芯片类：包括N公司、上海燧原科技股份有限公司、昆仑芯（北京）科技有限公司等。

　　英伟达之所以稳居AI芯片龙头，根本在于其软硬件生态的深度协同和持续领先的技术布局。在GPU硬件层面，英伟达产品广泛应用于AI训练、图形渲染和高性能计算等关键场景，性能全球领先。据Omdia数据显示，截至2024年底，英伟达占据全球AI训练市场超过80%的份额，是OpenAI、谷歌、微软、Meta等大模型开发商的核心算力支撑。

　　其自2006年推出CUDA平台以来，构建起涵盖指令集、编译器、驱动、SDK及工具链等一体化开发生态，吸引超过400万开发者。中国科学院2024年研究指出，若将AI模型从英伟达迁移至国产平台，代码重构成本高达80%，显示其平台对开发者具有操作系统级别的粘性。

　　在全球地缘与技术竞争加剧背景下，英伟达的不可替代性进一步凸显。自2022年起，美国将A100、H100等芯片列入出口管制名单，并对7nm及以下先进制程和EUV光刻设备实施限制，严重制约国产GPU的高端制造能力。

　　尽管沐曦股份、摩尔线程等国产厂商陆续推出自研产品，并尝试布局智算一体机，但大多仍处于验证阶段，尚未实现规模商用，生态不完善、工具链缺失等问题仍待突破。国产替代面临制程受限+软件断档双重挑战，短期内难以撼动英伟达在AI算力领域的主导地位。

　　英伟达的领先地位也在出货能力、客户绑定和财务表现中得到充分体现。根据Jon Peddie Research 的数据，2025年第一季度，其在全球离散GPU市场中市占率高达92%，H100加速卡单季出货超50万块。摩根士丹利预计，Blackwell架构GPU季度产能将达70万至80万块，订单总量超360万块（不含Meta追加），客户涵盖微软、谷歌、亚马逊等全球科技巨头。2025财年第一季度，公司营收达441亿美元，同比增长69%，其中数据中心业务占比超过88%，两大客户贡献营收合计超24%。此外，英伟达在2025年7月宣布终止对Maxwell、Pascal架构驱动的支持，影响约8%Steam平台用户，进一步推动旧用户向新平台迁移，凸显其对消费市场与生态节奏的强控制力。

　　资本市场方面，英伟达展现出前所未有的统治力。2025年6月，公司市值突破4万亿美元，超越苹果和微软，登顶全球市值第一的科技公司，成为AI时代的标志性龙头。据彭博和FactSet数据显示，2025年上半年英伟达股价上涨超过220%，年内市值增幅达2.8万亿美元，成为标普500最大权重股，贡献指数涨幅超过三分之一。

　　英伟达已从传统芯片制造商转型为覆盖算法、平台、系统及开发生态的AI全栈基础设施提供者，成为全球科技产业链中最具战略价值的核心节点，持续引领行业技术与市场热度。

　　摩尔线程选择走平台型路线，产品线全面覆盖图形渲染、AI、视频处理等多个方向，并自建SDK与算力中心，试图复刻类似英伟达的软硬件闭环体系。但这一模式高度依赖资源投入、技术栈深耦合和开发者生态长期积累，短期内难以形成稳定现金流与客户绑定。

　　相比之下，沐曦股份的策略显得更为务实和具有现实落地性。其架构设计明确面向AI训练与推理中端算力市场，避开了正面对抗英伟达在大模型训练等高端赛道的锋芒，而是将精力聚焦在政企、信创与智算中心等对自主可控、交付可控有强需求的场景中。这种从可落地应用切入、逐步构建生态的策略，不仅提升了产品验证效率，也降低了市场教育成本与客户迁移门槛。更重要的是，它是一种与英伟达错位竞争、在政策支持与商业现实中寻求结构性突破的路径。因此，从中短期成长性与战略执行落点来看，沐曦走的是一条“生态不硬刚、应用先落地”的路线，反而更可能跑出真正具备中国式GPU价值闭环的公司形态。

　　沐曦基于自研MXGPU架构，当前已支持FP64至FP8等多精度计算，产品在接口层面兼容OpenCL、OpenGL、Vulkan等主流图形与通用计算协议，具有良好接口兼容性。然而，与国际头部厂商相比，其生态系统构建仍处于早期阶段。

　　以英伟达为例，其CUDA平台自2006年建立以来已吸引全球400万开发者，生态包括cuDNN、TensorRT、CUDA-X等工具链。在深度学习框架适配方面，截至2025年，PyTorch对英伟达GPU原生支持代码量超过12万行，而适配国产GPU仅为约3万行，且仍需大量中间件重构。根据中科院2024年研究，国产GPU迁移成本高达80%重构代价，显示平台依赖程度已接近类操作系统粘性。

　　可以看出，沐曦在FP32算力与A100接近，具备“中端性价比替代潜力”，但在高端AI训练场景（如大模型多节点集群）中，由于其显存容量、通信带宽和调度效率受限，仍难替代英伟达H100/H200级别产品。

　　摩尔线程：采用MUSA架构，是其自主研发的特色架构，在国内GPU领域积极探索创新架构设计。

　　英伟达：CUDA架构成熟且应用广泛，是GPU通用计算领域的主流架构之一，生态丰富，有大量基于此架构开发的软件和工具。

　　AMD：拥有CDNA和RDNA架构，CDNA面向高性能计算和AI领域，RDNA专注图形处理，双架构策略满足不同应用场景需求。

　　高通：基于ARM架构打造SoC，ARM架构以低功耗、高性能在移动及边缘计算领域占据重要地位。

　　沐曦股份：沐曦股份基于自研MXGPU架构，聚焦国产通用GPU设计，覆盖AI计算加速、图形渲染、GPGPU等功能，支持从FP64到INT8/FP8等多种精度，并已实现与OpenCL、OpenGL、Vulkan等主流接口的兼容。其平台逐步构建国产替代生态，主要应用于政企场景，体现出良好的工程落地能力。

　　沐曦在FP32算力与A100接近，具备中端性价比替代潜力，但在高端AI训练场景（如大模型多节点集群）中，由于其显存容量、通信带宽和调度效率受限，仍难替代英伟达H100/H200级别产品。

　　英伟达商业模式高度垂直整合：硬件+工具链+平台生态+客户解决方案。2025年上半年，其数据中心业务营收达387亿美元，占总营收的88%。在GPT-5训练中，OpenAI部署超过5万张H100卡，其Blackwell架构预计2025年底开始交付，单位集群功耗降低17%，训练效率提升47%。

　　相比之下，沐曦虽通过与UCloud等合作布局政企场景，但生态绑定能力、交付能力与客户集群管理能力尚需拓展。当前订单高度集中在政务和运营商场景，尚未在互联网大模型公司形成结构性绑定。

　　英伟达的cuGraph、cuBLAS、TensorRT已深度嵌入主流AI框架中，属于强绑定生态位。而沐曦当前生态构建多以兼容层方式适配，属于弱耦合。这意味着开发者需重写部分底层算子才能真正调用GPU潜能，严重制约大模型部署效率。

　　对比英伟达、AMD等国际头部企业，沐曦股份在架构设计、自研能力与国产替代路径上具备一定突破，但其核心竞争力构建方式呈现出明显差异。国际巨头普遍采用软硬件深度绑定+全栈平台生态模式，例如英伟达依托CUDA、cuDNN、TensorRT等工具链形成开发者闭环，通过GPU硬件与软件生态协同推进，不仅在性能指标上领先，更在用户黏性与生态垄断上构筑了强护城河。相较之下，沐曦则以自主MXGPU架构切入AI训练、推理与图形渲染等细分市场，强调接口兼容性与性价比优势，适用于国产替代需求旺盛的政务、信创、智算中心等场景。其供应链依赖Synopsys、Cadence、台积电、中芯国际、长电科技、美光等上下游核心企业，具备完整但高度专业化的国产GPU生产路径。在产品性能方面，曦云C500系列在FP32算力与A100相近，能效表现优于A800，初步具备中端场景替代能力，但在HBM带宽、显存容量及软件栈完备度上与H100、MI300等高端GPU仍存在较大差距。总体而言，沐曦虽不具备生态压制力，但凭借自研架构、国产工艺适配与定制化交付能力，在国产化替代、政策驱动市场中具备差异化竞争潜力，其未来价值将取决于能否从兼容型硬件供应商成长为生态级平台参与者。

　　沐曦股份未明确披露主要供应商信息，根据业内人士分析，主要供应商可能包括Synopsys与Cadence等国际领先的EDA软件和IP授权提供商，在芯片制造环节合作方可能为台积电或中芯国际，以支持7nm及更先进工艺的GPU产品量产；封装测试方面，则可能由长电科技、通富微电、华天科技等国内知名封测企业承接；在关键材料与设备方面，光刻设备可能来自ASML，硅片材料则可能采购自信越化学、SUMCO等全球头部厂商；此外，曦云与曦思系列GPU所需的高带宽内存（HBM）可能由美光、SK海力士等国际供应商提供，整机集成及板卡装配则可能由万司信息技术、环鸿电子等企业完成。整体来看，沐曦的核心供应商体系覆盖EDA工具、晶圆制造、先进封测、内存与材料配套等完整产业链条。

　　由此可见，2022-2023年收入低迷是产品研发到量产的必经空窗期，直到2024年曦云C500系列芯片规模化商用才实现业绩突破。

　　2024年产品实现量产，销售毛利率为53.43%。摩尔线%，沐曦股份毛利率显著低于摩尔线%相当，低于海光信息的60%毛利率。主要对标公司摩尔线%以上的毛利率，源于

　　相比沐曦股份和寒武纪的AI训推一体GPU，摩尔线程产品以图形GPU为主，设计复杂度相对较低、制造成本可控，同时依托腾讯、百度等大客户实现规模化出货，显著摊薄单位成本。

　　公司三年累计研发费用达22.48亿元，其中仅2024年研发支出高达9.01亿元，是同期营收的121.24%。研发支出远超营收，成沐曦股份经营亏损主因。

　　沐曦股份目前处于重研发、高垫资、单一产品依赖的商业早期阶段，尽管营收快速增长，但应收账款、预付款与存货占压大量现金，导致经营活动现金流连续三年大额为负。

　　其流动性高度依赖融资支持，一旦IPO或后续融资不及预期，存在显著现金流断裂的风险。

　　首先，公司核心产品“曦云C500”系列GPU虽然2024年开始放量销售，但客户主要为服务器、整机商、政企集成商，沐曦股份在2024年末的应收账款为约 6.15亿元，约占年营业收入的191.96%，回款周期长严重压缩了现金回流；其次，为保障产能，公司在2024年大量预付晶圆代工和封测费用，预付账款达8.9亿元，同时存货高达8.68亿元，占用了大量资金。

　　从当前财务结构看，公司具备一定资金储备与大客户资源，但中长期能否脱离对单一客户与政策订单的依赖，真正构建具备粘性的自主生态，仍是其未来能否完成“从产品可用到市场默认”的关键所在。

　　沐曦股份是一家典型的技术先行、生态补课型GPU设计公司，率先在国产通用计算领域推动自研架构与AI训练推理的融合落地。

　　其MXGPU架构支持FP64至FP8多精度计算，并实现对CUDA/ROCm生态的兼容适配，使其在技术层面已具备参与国产算力替代的“入场券”。

　　但生态黏性仍明显不足——它的GPU已可量产，但开发者是否愿意真正使用它的产品，仍是悬而未决的核心问题。

　　市场层面，沐曦已完成从工程验证到初步商用的跨越。2024年公司实现营业收入约7.43亿元，同比大幅增长，但同时净亏损扩大至14.09亿元，三年累计亏损已超30亿元，且经营性现金流持续为负。与此同时，公司主要客户仍集中在UCloud、新华三等政企体系，整体营收结构高度依赖大客户定制订单，商业模式仍未摆脱政策驱动与订单推动的早期阶段，距离形成稳定的市场自驱闭环尚有较大距离。

　　产业链上，公司采用Fabless模式，不掌握晶圆制造与封装产线，EDA工具、流片、封测、显存等关键环节对美、台供应商依赖显著，外部不确定性始终存在。而在软件生态方面，公司当前主要依赖兼容适配主流框架，缺乏原生工具链、开发者社区及完整SDK闭环，导致客户部署门槛高、生态粘性弱，整体仍处于硬件走在前，生态慢半拍的状态。

　　未来真正决定其生死的，不是技术参数表，而是能否从兼容型GPU供应商迈向生态级平台主角。能否从可选项变成默认项，将是国产GPU能否突围的关键拐点。

　　站在2025年冲刺科创板IPO的关键节点，高性能通用GPU产品的规模化落地能力与持续融资能力能否同步实现闭环，对于沐曦股份来说至关重要。

上一篇：CPUvsGPU：智算中心功耗与散热特性差异解析H100能效下一篇：英伟达被批准出售50万颗GPU 返回

免费获取策划方案及报价

联系专业的商务顾问，制定方案，专业设计，一对一咨询及其报价详情

服务热线 027-83317177

热门标签

GPU计算

开云（中国大陆官方网站）Kaiyun科技股份有限公司 - 领先的GPU计算与AI算力解决方案

沐曦股份：三年研发烧掉22亿国产GPU企业冲刺科创板

AMDRadeonAIPROR9700工程样品曝光：专业显卡

东芯股份GPU+Wi-Fi7双核布局赋能创新战略铸就长期价值

中联重科：目前公司拥有一个国家A级、国际T3+级的超算中心现

美格智能（002881）2025年半年度管理层讨论与分析