【广发计算机刘雪峰团队 | 行业深度报告:比较试用DeepSeek看模型走向应用的新迹象】$紫光股份(SZ000938)$$寒武纪-U(SH688256)$$金山办公(SH688111)$
[玫瑰]我们测试了DeepSeek大模型在逻辑、数学、代码、文本等领域的8个问题,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。
[玫瑰]通过有限的实测结果,我们发现,DeepSeek总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek给出的代码注释、算法原理解释以及开发流程的指引最为全面。在文本生成和数学计算能力方面,DeepSeek并未展现出明显优于其他大模型之处。
[玫瑰]DeepSeek-V3算力成本降低的原因有两点。第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
[玫瑰]算力依然是推动大模型发展的核心驱动力。DeepSeek-V3通过技术创新和资源优化,大幅降低了成本,展现了算力的高效性。在该技术路线得到充分验证后,[太阳]有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强[太阳][玫瑰]应用方面,该案例证明了在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果.这有利于具有特色、成本更低、更适合具体应用场景的模型的开发,后续随着相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。
[玫瑰]在DeepSeek推出引起AI行业变化之外,就计算机全行业而言,结合前期行业和个股报告当前主要推荐公司:紫光股份、寒武纪、中望软件、第四范式、金山办公、金蝶国际、寒武纪、顶点软件、德赛西威,道通科技,新大陆,并重点关注鸿蒙、信创和算力线其余公司。
本文作者可以追加内容哦 !