11月14日,汇纳科技公告,公司接到合作方四川并济科技有限公司通知,由于内嵌英伟达A100芯片的高性能算力服务器算力需求大幅增加,相关高性能运算设备持续涨价,算力资源持续紧张,四川并济科技有限公司决定对其A100算力服务收费拟上调100%。

涨价传导至租赁市场

事实上,算力紧张之前已经出现苗头。

11月初,因供给紧张,阿里云官网已经暂停A100服务器出租业务。

以中贝通信为例,该公司在9月初签订一份算力服务协议显示,其以H800设备为基础搭建算力服务平台,提供960P算力服务,服务费为含税12万元/P/年。而在10月25日,该公司另一份协议显示,其向对方租赁容量为800P算力资源,租赁价格到了2.5万美元/P/年(按照当日汇率折算17.9万元人民币)。



算力需求暴增

算力涨价背后,是需求的暴增。专家认为,“算力时代”已经到来。一方面,算力有望替代热力、电力,成为拉动数字经济向前发展的新动能、新引擎;另一方面,算力正在成为影响国家综合实力和国际话语权的关键要素,国与国的核心竞争力正在聚焦于以计算速度、方法、通信能力、存储能力为代表的算力,未来谁掌握先进的算力,谁就掌握了发展的主动权。

机构统计显示,目前全国有超过30个城市正在建设或规划智算中心,其中一些已经投入运营或即将投入运营,总规划算力达到了数十EFLOPS。

若未来全国智算中心算力达到50EFLOPS(对应50000PFLOPS),对应AIDC建设规模空间为500-750亿元。据不完全统计,目前已经明确公开宣布规划或建设中的地方智算中心规模已超26000P。

浙商证券在一份研报中举例,GPT-3训练使用了128台英伟达A100服务器(训练34天),对应640P算力,GPT-4模型训练使用了3125台英伟达A100 服务器(训练90-100天),对应15625P算力。从GPT-3至GPT-4模型参数规模增加约10倍,但用于训练的GPU数量增加了近24倍。

因此,在该机构看来,国内15家头部大模型厂商对标GPT-3模型的训练需求,需要1920台A100/A800服务器,对应15360张GPU。而如果考虑国内5家头部大模型厂商对标GPT-4模型的训练需求,则额外需要13705台A100/A800服务器,对应近11万张GPU。



国产替代刻不容缓

最新的专题电话会纪要显示,华为Atlas900超级云集群实现相当于18000 张卡的能力,实际数据为16000张卡,带宽基本在390~400G 的水平。

并且,华为提供了自己的生态AI云服务,包括算力租赁和自己的处理体系。目前华为云的生态已经上线,向下游提供大量的3D支持,AI训练集群效果稳定,训练作业故障会自动恢复。

国产供给进步之下,多家算力运营商已相继走上替代之路。

$天弘中证沪港深云计算产业ETF发起联接C(OTCFUND|019170)$$恒生电子(SH600570)$

追加内容

本文作者可以追加内容哦 !