云天励飞的IPU-X6000加速卡和寒武纪的部分同类产品对比如下:
与MLU370-X8对比
- 算力与推理能力:IPU-X6000加速卡拥有256T算力,单卡可实现130B参数量大模型推理,在执行70B参数量大模型推理时性能达11tokens/s;而MLU370-X8智能加速卡主要提供的是256TOPS(INT8)的最大算力,并未直接体现大模型推理能力,可见IPU-X6000在大模型推理方面表现更优。
- 存储与带宽:IPU-X6000加速卡具备128GB的显存容量和486GB/s的显存带宽,采用C2C mesh互联技术,卡间高速互联带宽达64GB/s;MLU370-X8配备48GB LPDDR5内存,提供卡内及卡间互联功能,每张加速卡可获得200GB/s的通讯性能,在内存容量和显存带宽上,IPU-X6000更具优势。
- 技术架构:IPU-X6000加速卡采用“算力积木”AI芯片架构,基于D2D Chiplet技术、C2C Mesh技术和C2C Mes Torus技术,可实现不同参数量大模型的高效推理,具有很强的灵活性和扩展性;MLU370-X8基于思元370芯片采用7nm工艺和chiplet技术,将多个小芯片组合为一个整体提高性能,但在灵活性上相对较弱。
与MLU290-M5对比
- 算力与推理能力:MLU290-M5在350W的最大散热功耗下提供AI算力高达1024 TOPS(INT4),主要侧重于训练任务;而IPU-X6000加速卡的256T算力主要针对大模型推理加速,两者的应用场景和侧重点有所不同,在推理能力上,IPU-X6000单卡可实现130B参数量大模型推理,表现更为突出。
- 存储与带宽:MLU290-M5具备1.23TB/s内存带宽,高于IPU-X6000加速卡的486GB/s显存带宽,但IPU-X6000加速卡拥有128GB的显存容量,而MLU290-M5未提及内存容量。
- 技术架构:MLU290-M5采用思元290智能芯片和MLU-Link™多芯互联技术;IPU-X6000加速卡采用“算力积木”架构和C2C mesh互联技术等,在边缘端大模型推理的灵活性和扩展性上更具优势。
本文作者可以追加内容哦 !