谁有更大的超算集群,谁就能在算力上占得先机,谁就能一步训练出更优秀的大模型,看似风平浪静的海面之下,正在酝酿一场异常激烈的军备竞赛。

其中影响力最大的,莫过于埃隆·马斯克(Elon Musk)的AI初创公司xAI在美国田纳西州孟菲斯建造的超算集群,该集群由10万块英伟达Hopper GPU组成,可能会一举成为目前地表最强AI超算集群。我们可以做一个简单的对比,OpenAI的 GPT-4用了2.5万块英伟达Ampere GPU;全球超算TOP1的Frontier用了 3.78万块GPU,微软的云系统集群Eagle也只用了1.44万块英伟达Hopper GPU,单纯从AI算力来看,xAI的孟菲斯超算集群是毫无争议的第一。

在AI浪潮中所兴建的数据中心,所用到的后端网络技术,不外乎InfiniBand和以太网这两种,前者源于被英伟达收购的Mellanox,其高速和低延迟特性受到了AI的青睐,而后者则是构成互联网的一种关键技术,如今也在数据中心里被广泛使用。

根据美国调研机构Dell'Oro Group今年7月的报告,未来五年内,用于连接加速服务器的AI后端网络中部署的交换机支出预计将接近800亿美元,这也意味着整个数据中心交换机市场实现了翻倍。

该调研机构指出,当前数据中心交换机市场支出主要用于连接通用服务器的前端网络,但AI工作负载将需要新的后端基础设施建设,虽然目前InfiniBand仍占据主导地位(约90%),但随着技术改进以及市场需求,未来以太网将会在AI后端网络市场取得更多机会,到2027年将占据20%的收入份额。



追加内容

本文作者可以追加内容哦 !