$东山精密(SZ002384)$  

DeepSeek V4协同昇腾,定义长文本模型性价比时代


DeepSeek V4性能比肩顶级闭源模型。


4月24日深度求索发布DeepSeek V4系列模型。V4 Pro性能超越已有开源模型,并比肩世界顶级闭源模型。V4 Flash则提供更具性价比的API服务。DeepSeek V4开创了一种全新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且相较于传统方法大幅降低了对计算和显存的需求。


昇腾全面支持DeepSeek V4部署。


昇腾和DeepSeek芯模协同,昇腾950通过融合Kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。


国产算力生态成型,商业化进程加速。

DeepSeek V4系列模型在多个关键领域实现了对国际顶级闭源模型的全面比肩,并通过极致的效率优化,大幅降低了长上下文的高性能模型的使用门槛,这有望为中小企业和个人开发者提供可负担的AI能力。V4系列模型全面适配华为昇腾芯片,标志着国产AI芯片生态的成熟。V4的架构创新和昇腾的特性形成了深度协同,有望加速国产AI算力的商业化进程。

追加内容

本文作者可以追加内容哦 !