核心结论

  • 填补国内空白:是。中科曙光 scaleFabric 为国内首款全栈自研 400G 原生无损 RDMA 高速网络,覆盖 112G SerDes IP、交换芯片、网卡 / 交换机、驱动与管理软件,补齐国产超大规模智算集群高速互联的关键短板。
  • 全球领先程度:整体与英伟达 NDR(400G InfiniBand)同代并跑,部分指标领先(端口密度、单子网规模、成本),在万卡级规模化落地验证上具备国内领先优势。

关键依据

  1. 自主可控与国内首证

    全栈自研覆盖核心关键 IP、交换芯片、网卡、交换机、驱动与管理软件,实现 100% 自主,是国内首款原生无损 RDMA 高速网络,有效填补国产集群高速互联技术空白。中国工程院院士邬贺铨评价其 “补齐国产高速网络短板”数字中国峰会

  2. 性能对标与部分赶超

    表格

    指标

    scaleFabric 400

    对标英伟达 NDR

    差异

    网卡带宽 / 端到端时延400Gbps,≤0.9μs400Gbps,同代水平同代并跑
    交换机交换时延 / 单端口≈260ns,800Gbps同代水平同代并跑
    交换机端口密度提升 25%基准scaleFabric 领先
    网卡最大 QP 数提升 100%基准scaleFabric 领先
    单子网互连规模11.4 万卡(传统 IB 2.33 倍)约 5 万卡scaleFabric 领先
    总成本较进口 IB 降低约 30%基准scaleFabric 更优
    数据来源:中科曙光官方发布、公开测评


  3. 规模化落地验证

    已在国家超算互联网郑州核心节点部署三套万卡级集群(总规模 3 万卡),稳定运行超 10 个月,链路故障恢复 < 1ms,支持 36 小时完成万卡集群部署,经实测满足 AI 训练与 HPC 需求。

定位解读

  • 国内:从 “可用” 到 “好用、耐用” 的关键突破,为万卡级智算集群提供自主可控的网络底座,打破对外依赖。
  • 全球:与英伟达 NDR 同代竞争,在端口密度、组网规模、成本上形成差异化优势,整体处于国际先进水平,部分指标领先。

总结

scaleFabric 不仅填补国内空白,更在全球同代产品中具备并跑 + 部分领先的实力,是国产高端网络突破卡脖子环节的重要里程碑。


追加内容

本文作者可以追加内容哦 !