英伟达的 GB300 和 B300 GPU,包括其性能提升、供应链变化、对超大规模云计算公司的影响以及利润率变化。
性能提升计算能力增强:B300 GPU 基于台积电 4NP 工艺节点新设计,产品级 FLOPS 比 B200 高 50%,部分源于 200W 额外功率,TDP 提升,其余来自架构和系统级增强(如 CPU 与 GPU 间电力调配)。
内存升级:内存从 8 - Hi HBM3E 升级到 12 - Hi HBM3E,容量达 288GB,但针脚速度不变,内存带宽仍为 8TB/s。这对推理模型训练和推理至关重要,如 OpenAI O3 风格的 LLM 推理训练,可应对长序列长度增加的 KVCache,提升交互性、降低成本、完整报告&纪要关注公众号奥KA姆剃刀改善用户体验,使更智能模型能解决更多问题并增加收入。
NVL72 优势:GB200 NVL72 和 GB300 NVL72 对实现关键功能重要,如提高互动性、利用 72 个 GPU 分散 KVCache 实现更长思维链、提升批量大小扩展性、增加搜索样本提高准确性和模型性能,代币经济学在长推理链上优势超 10 倍,是扩展推理长度和保持高批量的唯一方式。
供应链变化组件供应调整:GB300 推出后,英伟达供应内容改变,不再提供整个 Bianca 板,而是在 “SXM Puck” 模块提供 B300,Grace CPU 采用 BGA 封装,HMC 来自 Axiado。最终客户直接采购计算板剩余组件,第二层内存变为 LPCAMM 模块(美光主要供应),交换机托盘和铜背板仍由英伟达提供。
制造机会变化:向 SXM Puck 转变使更多 OEM 和 ODM 可参与计算托盘制造,纬创失去 Bianca 板份额,FI 虽在 Bianca 板有损失,但因是 SXM Puck 及其插座独家制造商得以抵消,且英伟达正尝试引入其他供应商。
VRM 采购变化:大部分板载 VRM 内容将由超大规模云计算公司 / 原始设备制造商直接从 VRM 供应商采购,这导致单片电源系统市场份额受影响。
网络接口卡升级:英伟达在 GB300 平台提供 800G ConnectX - 8 网络接口卡,相比 ConnectX - 7 有 2 倍带宽、48 条 PCIe 通道,支持独特架构,具备 SpectrumX 功能,效率更高。
超大规模云计算公司影响订单转移与性能提升:GB200 和 GB300 延迟使许多超大规模云计算公司从 Q3 开始订单转向 GB300,因其性能提升,且 GB300 可让公司定制主板、冷却系统等。
亚马逊的改善:亚马逊此前因内部 NIC 无法部署 NVL72 机架,采用 NVL36 导致成本高,配置次优。GB300 使亚马逊能构建定制水冷主板,集成组件,回归 NVL72 架构并改善 TCO。
设计挑战与微软情况:超大规模云计算公司面临设计、验证和确认更多内容的挑战,是最复杂平台设计之一。微软因设计速度慢,部署 GB300 最慢,Q4 仍购买 GB200。
英伟达利润率变化成本与价格变化:内存升级使英伟达芯片层面 BOM 成本增加约 2500 美元,但因供应内容改变,不再提供 512GB LPDDR5X 并节省 PCB 成本,BOM 成本上升超 1000 美元,ASP 增加 4000 美元,增量毛利率为 73%,产品利润率中性。
趋势变化:HBM 在 BOM 中占比最大趋势持续,HBM 更新周期通常稀释利润,此次 GB300 情况是趋势变化,工程问题解决后良率和利润率将改善
本文作者可以追加内容哦 !