光模块更新-明年严重的供应缺口0626

目前,800G光模块主要应用于英伟达的IP网络和GPU出货。AI大模型,如GPT、谷歌的immy和Meta的lama,正在进入早期的规模化推理和应用阶段,他们不仅在训练端搭建数据中心,还在提前考虑推理端的巨大需求,进行数据中心扩建。尤其是800G以太网方案,包括博通的Tomahawk 5芯片,已经完成800G端口的以太网交换机认证,预计下半年开始批量出货。推理端的需求利好于以太网方案,这主要是因为成本因素。IB交换机基本上是英伟达独占市场,其价格是以太网交换机的两倍。因此,以太网方案在成本上具有明显优势,成为推理端需求的更优选择。英伟达选择推IB网络,主要是因为其在时延和带宽稳定性方面的优势更符合大模型训练的需求。英伟达作为AI方案商,通过绑定销售强推IB和GPU。这样做不仅提升了训练效率,而且在供货量和时间上也有选择性。

AI网络目前有两套技术方案:IB架构和以太网。IB架构由英伟达通过收购Mellanox主导,市场份额绝对领先,超过85%的IB设备都由英伟达出货。IB协议是一个专有、封闭的协议,需要通过英伟达的认证。光模块厂商若要兼容IB的网卡和交换机,必须经过英伟达的测试或得到英伟达的指定。在这种封闭体系下,光模块的适配难度较大。而以太网技术更加开放,兼容性更强,适用于复杂的网络环境,支持多厂商设备互通。近年来,AI的发展促使以太网协议(如ROCE v2)得到改进,提高了低时延和高带宽的性能,逐渐能够对标IB协议。由于以太网成本较低、供应链丰富,未来预计将加速赶超IB市场。

大量光模块用于英伟达的训练端,未来推理端需求爆发后,配比会发生变化。训练端将在明年开始使用1.6T光模块,而推理端则可能使用800G光模块。虽然推理端速率较低,但其流量需求预计是训练端的2到3倍,将成为光模块需求的主力。光模块的寿命约为三年,较短的寿命是由于高功耗和激光器负载较重导致的。相比服务器和交换机的五年折旧寿命,光模块寿命更短。高温下,光模块的三五族化合物半导体激光器芯片更容易失效,需要定期更换。在大型数据中心中,每年约有25%到30%的光模块需要更换,显示其寿命约为3到4年。2023年3月,800G光模块开始在AI数据中心应用,预计到2026年,这类光模块的需求会逐步减少。尽管有存量需求,新建数据中心的光模块会向更高速升级。

英伟达的GB200将标配1.6T光模块,这是其产品路线图中明确的。H100和H200目前标配800G光模块,下一代如NVL72和NVL36将标配1.6T。英伟达预计今年四季度将采购30万支1.6T光模块,明年可能需要350到400万支。具体订单将在今年八月启动招投标,并于十一月明确明年需求。公司明年的机架出货预期约为2万套NVL36和1万套NVL72。根据出库情况,如果明年出货5万套机架,1.6T光模块的需求可能会增加40%到50%。目前最高预测可能达到8万套,但这取决于台积电的产能能否支持。

目前全球光芯片供应量约为4000到4500万颗。主要供应商包括Broadcom、博通、Coherent、三菱和住友。其中,Broadcom的供应量最大,约为1400万颗。光、电芯片是光模块的核心器件,光芯片的传输速率决定光模块的传输速率,而电芯片负责光模块中信号的放大与处理。上游光芯片的供应已经开始紧张,特别是在五月份之后。主要厂商如新易盛正在进行大规模扩展,计划投入18亿元扩产。其他厂商如Coherent、中际旭创也在扩展800G的产能。整体来看,北美的厂商如博通、Marvell等相对积极扩产,但整体扩展速度有限,因为部分资源已转向更高端的200G和400G EML芯片。下半年各大厂商的800G计划普遍增加,产能预计将翻倍。目前EML芯片、VCSEL芯片和DSP芯片的备货周期变长,供应紧张。特别是日本厂商扩产保守,部分需求转移到Broadcom和Cherenot等厂商。国内厂商如源杰科技虽然能生产100G的EML,但尚未获得海外大客户认证,短期内无法批量发货。然而,国内光模块厂商如中际旭创已提前认证国内芯片,以应对供应紧张。

全球主要供应商的光芯片供应量约为4800万颗,而需求远超这个数字。特别是明年800G的需求将达到1400到1500万只,总需求可能接近1亿颗,导致严重的供应缺口。

 

追加内容

本文作者可以追加内容哦 !