$川环科技(SZ300547)$ DeepSeek的分歧,关于算力需求
DeepSeek V3的成功,并不意味着算力需求下降。实际上是DeepSeek参数有歧义,才造成了市场的误读。
从训练到推理、算力需求持续增长
1.DeepSeek V3的训练成本仅考虑单次训练,而实际大模型的训练需要:1)大量高质量数据的合成及清洗;2)充分的预训练;3)多个MoE专家模型的多次训练;
2.AI应用和AI终端的落地节奏正在加速,推理侧将带来远超训练侧的算力需求,仅字节豆包未来就需要50-100万张等效H100算力需求
此文献给那些的韭菜
追加内容
本文作者可以追加内容哦 !