在AI这个行业里,每一次的性能提升都像是一次跨越式的发展,当然我说的是GPU,3月份英伟达最新推出的Blackwell complex GPU,正是这样。那块连接着每块Die的10 TB/sec NVLink 5.0,官方亲切地称它为NV-HBI。这个黑科技的出现,让Blackwell complex的NVLink 5.0端口能够提供1.8 TB/秒的带宽,是Hopper GPU上NVLink 4.0端口速度的两倍。这意味着,数据传输的速度被大大提升,就像是从自行车变成了高铁,信息的流动更加迅速和顺畅,大家理解这个速率了吧。


英伟达Blackwell GPU的突破性进展


在此之前,训练一个含有1.8万亿个参数的模型,你需要准备8000个Hopper GPU和15兆瓦的电力。但是现在,NVIDIA的首席执行官宣布,只需要2000个Blackwell GPU,耗电量仅为4兆瓦。这就像是从烧柴火炉变成了现代化的大型中央供暖系统,效率提高了,成本降了,所以对环境的影响也就小了。


在参数为1,750亿的GPT-3 LLM大模型基准测试中,NVIDIA宣称GB200的性能是H100的7倍,而训练速度是H100的4倍。Blackwell complex GPU,不仅是性能的提升,更是推动全球AI的全面飞速发展。


全球云服务巨头的AI服务器需求


广达,作为全球领先的服务器制造商,正在准备生产搭载英伟达最新的GB200芯片的服务器,这款服务器被誉为当前最强的AI芯片。广达的副COO,同时也是云达总经理的杨麒令在4月23日透露,他们预计会在9月开始大规模的生产这些服务器。


而且,那些大型云服务提供商,比如谷歌、亚马逊、Meta(就是那个Facebook),他们对这款基于英伟达Blackwell架构的新服务器非常看好,需求量大的很,早期的订单已经不少了,现在已经排队到明年了。


现在全球各地都在疯狂训练那些大型的语言模型,对于AI服务器和芯片的需求也是在不断增长。广达预计,他们今年的AI服务器营收占比将从去年的20%猛升到超过50%。所以市场对英伟达的业绩还是太保守了,建议多停停下游最前沿的信息。


广达计算机的AI服务器革命


为了满足客户的需求,广达今年正在大规模扩产,因为明年需求更大。


听说,英伟达的GB200芯片发布后,广达马上就拿下了谷歌、亚马逊、Meta这三家大型的云服务提供商的GB200服务器代工的大单。其中,谷歌的订单最早会在7月到8月开始测试。平均售价高达200万到300万美元。


这款服务器是将两颗B200 GPU和一颗Grace CPU整合在一起,每台英伟达DGX GB200服务器系统包含了36个英伟达GB200超级芯片。


Blackwell GPU的技术规格与性能优势


Blackwell GPU将采用第二代台积电的4纳米(4NP)工艺制造,拥有高达2080亿个晶体管,Blackwell GPU封装中都会配备2颗Blackwell芯片,这让它的综合性能提升了约250%。它的AI性能可以达到20 petaflops,这可是H100(4 petaflops)的5倍啊!


最重要的是Blackwell GPU在FP4八精度浮点算力方面的表现也是领先约400%。但是,需要注意的是,实际性能还会受到内存容量和带宽配置的影响。


我们国产GPU三年之内也会有这样的芯片,拭目以待吧。

追加内容

本文作者可以追加内容哦 !