大家知道,“连接+算力”的数字基础设施是AI大模型的根基。中兴通讯在今年投资者关系活动中表示,2024 年公司将发布新一代 400GE Fabric 方案,同时提前布局下一代 800GE Fabric 方案。中兴的400GE Fabric组网方案为云数据中心、AI提供多种灵活组网方案,满足数据中心流量的持续增长,以及对大容量400G数据中心网络解决方案的高带宽需求。400GE Fabric解决方案包括云数据中心解决方案和单层机架组网方案(见图1),前者适用于数据中心通用解决方案,后者适用于AI算力的高速、低时延和无损的高要求。

 

        中兴通讯400GE Fabric云数据中心组网方案为云数据中心内部和云数据中心之间提供全400GE互联方案。服务器网卡100GE接入,1U盒式接入设备提供48口100GE接入端口和8口400GE上行端口,多形态机架设备单槽提供36口400GE与接入设备互联,盒式设备和机架式设备为云计算场景提供更大规模的Spine-Leaf Fabric组网。

        中兴通讯400GE Fabric单层机架组网方案为AI业务提供更高带宽、更低时延以及无损承载。单层组网两台机架设备可提供1152个400GE端口,满足400G RNIC接入,同时为AI业务提供带宽无收敛的400GE Fabric网络,此外,400GE Fabric网络结合RoCEv2组网确保实现低延迟、智能拥塞管理和QoS灵活性。机架设备基于信元交换、VoQ和端到端调度架构确保机架设备跨板转发无拥塞、无抖动,单层机架组网对比多层Spine-Leaf组网架构具备以下优势:

        - 确保AI业务可靠运行

        多层组网设备间依赖HASH选路存在冲突,个别路径冲突+并行计算的同步效应,会使得预训练时间成倍增加;机架设备单层组网对比多层组网能够确保AI业务可靠运行。

        - 确保高链路利用率

        多层组网设备间的HASH选路可能引起链路带宽利用率不均衡;单层机架设备组网板卡间交换属于设备内部交换,线卡和交换网板卡间的交换能绝对负载均衡,能够确保高链路利用率。

        - 提供无感知的故障恢复

        多层组网设备间链路故障切换通常在毫秒级别,端到端切换时延依赖路由协议切换时延到百毫秒级别;单层机架设备交换网切换可为业务提供无感知的纳秒级故障恢复。

        - 网络极简运维,业务灵敏感知

        多层设备组网设备间互联端口需要无损网络进行整网配置,无损业务调整复杂,随着网络规模扩大严重影响网络灵敏度;单层组网设备间的端口均为机架设备内部端口,多台设备组网复杂的无损参数调优变得极简,利于网络运维并提升网络对业务感知保持高灵敏度。

        中兴通讯400GE Fabric组网方案将助力数据中心网络创新,构筑“5G+云+AI”时代新基建。

2024-04-23 23:20:07 作者更新了以下内容

[爱心]中兴通讯:预计 5G-A 将在 2024年进入商用部署元年,公司将积极配合运营商开展技术验证,保持产品和解决方案领先优势,在全域通感、NTN、Redcap 等有望进入落地阶段的技术方向,提前做好市场战略布局,支撑公司无线产品未来发展。

追加内容

本文作者可以追加内容哦 !