3月17日凌晨的英伟达GTC大会正式发布了Groq3 LPU推理芯片,其核心边际变化在于推出了全新的“Dynamo”异构推理架构,将推理任务精细拆分为由Rubin GPU负责高的Prefill和Attention计算,LPU则专注处理低延迟的Token解码。这一架构的落地标志着AI推理进入专用硬件协同时代,GPU+LPU的组合并非替代关系,而是通过功能互补共同扩展了AI算力的能力边界,为实时性要求更高的Agent等应用铺平了道路,并直接催生了对全新硬件形态的增量需求。
追加内容
本文作者可以追加内容哦 !