$智微智能(SZ001339)$  

---


一、核心驱动力:DeepSeek V4的模算协同效应


DeepSeek V4的发布是当前产业链最核心的催化剂,此前主流模型主要基于CUDA框架运行,而V4首次在官方技术报告中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单,采用细粒度专家并行(EP)方案在双平台上完成验证。截至当前,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份等8家国产AI芯片品牌均已完成对V4的Day 0适配。


这一事件标志着国产大模型已基本跑通“模型—芯片—云”全栈闭环,理论上形成从底层硬件、基础软件、平台服务到上层应用的完整技术链条。


二、国产GPU:确定性与量价齐升逻辑最清晰的环节


DeepSeek V4对国产芯片的深度适配,正是国产GPU从“能跑”到“能用”,再到“好用”的验证过程。昇腾950PR推理芯片的单卡算力较英伟达特供版H20提升2.87倍,采购价格约为H200的三分之一到四分之一,在低精度推理场景下展现出超越通用GPU的效率。


边际定价逻辑的转变: 市场正从此前单纯关注单颗国产GPU芯片与H100/B200的算力参数差距,转向更大的集群部署能力。当DeepSeek这样顶尖的模型都开始深度绑定国产算力时,整柜系统的有效算力将成为衡量竞争力的核心标准。近期国产GPU厂商营收高速增长、亏损大幅收窄,进入具备自我造血能力的成长期,正是这一逻辑转变的业绩验证。


三、国产服务器整机:超节点放量的核心受益环节


过去,服务器厂商的利润天花板受制于单一零部件的“搬运模式”。而进入超节点方案后,整机方案商的价值重心上移至“系统级架构+高速互联+液冷+大规模交付”的全栈集成。利润率显著提升,且超节点方案包含计算节点、交换模块、管理节点等核心硬件组件,盈利能力有望大幅改善。


国产服务器整机厂商在这轮“以网络换算力”的范式转变中,核心技术壁垒从硬件组装转向软硬件一体化系统集成,竞争格局有望重塑。具备计算/网络/液冷全栈能力并深度绑定云服务商的头部厂商盈利能力有望实现显著提升。


四、光交换网络(OCS):打破生态锁定的关键增量


在GPU互联规模从单卡到万卡集群的跃迁中,网络不再是附属品,而是支撑算力规模化的关键基础设施。国产超节点“光跃128卡商用版”以曦智科技全球首创的硅光OCS光交换芯片为核心,搭载壁仞科技自主GPU液冷模组,并集成中兴通讯高性能AI服务器及自研软件平台,构建起全栈自主的智算集群新范式。


该方案的关键在于硅光OCS芯片的设计与制造完全不依赖先进半导体工艺节点,具备突出的供应链安全性。已实现数千卡的规模部署,以微秒级模型切换延迟和降低90%以上的传输延迟,为国产智算集群树立了全栈自主的新标杆。在超节点高速互联需求下,交换芯片是决定集群带宽和时延性能的核心硬件,国内仅少数厂商具备研发量产能力,战略卡位价值突出。


五、关键标的梳理


环节 相关公司

芯片侧 寒武纪、海光信息、景嘉微、摩尔线程、沐曦股份

网络侧 盛科通信、曦智科技(非上市)

服务器 浪潮信息、工业富联、中科曙光、中兴通讯


六、风险提示


· 技术不确定性。 国产超节点规模化量产进度可能滞后,CANN等国产软件栈的成熟度与CUDA仍存在差距,长期生态建设需要持续投入;

· 竞争加剧与供应链风险。 全球AI芯片竞争持续升温,国内产能爬坡节奏或受上游制造链瓶颈制约。


---


风险提示与免责声明。 以上内容仅为基于公开信息的产业逻辑分析和客观事实梳理,不构成任何形式的投资建议。所述产业链及公司仅作案例说明,不代表买入或卖出建议。股票等投资品种价格存在波动风险,市场有风险,决策须谨慎,请独立判断并自行承担全部责任。

追加内容

本文作者可以追加内容哦 !