划重点:
1、DeepSeek性能、成本火爆海内外
2、产业链相关标的或被催化
![](https://gbres.dfcfw.com/Files/iimage/20250127/567720AB6DDD9B5DF3AC337BCA1FCFE5_w968h1138.jpg)
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。
更重要的是,DeepSeek-R1因其可比肩OpenAI o1的性能、极低的服务价格,以及代码和模型架构的完全开源,震惊业界。
一夜间,DeepSeek在全世界科技界刷屏!
DeepSeek-R1在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。DeepSeek-R1模型在多项基准测试中表现优异,并超越OpenAI-o1。
怎么看DeepSeek的刷屏?
首先,得益于成本优势明显。
根据DeepSeek公布的API定价,每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,约是 OpenAIo1运行成本的三十分之一。而训练成本极低,整个训练在2048块英伟达H800GPU集群上完成,仅花费约557.6万美元,不到其他顶尖模型训练成本的十分之一。
其次,训练模式极大创新。
DeepSeek在研发中运用强化学习使模型自主进化出推理能力,并通过混合架构,结合了大规模强化学习和思维链推理,以提高响应精度。
这个事情的意义在哪里?
1、大模型成本大幅降低;2、真正意义技术平权,给予国产大模型重要信心。
相关标的梳理(根据公开信息):
【 $每日互动(SZ300766)$ 】:24年半年报指出公司已接入DeepSeek大模型;
【 $美格智能(SZ002881)$ 】:公司结合最新发布的AIMO智能体产品,正加速开发DeepSeek-R1模型在端侧落地应用及端云结合整体方案;
【 $拓尔思(SZ300229)$ 】:联合DeepSeek开发金融舆情大模型;
【浪潮信息】:为DeepSeek北京智算中心提供AI服务器集群及自研管理平台;
【中科曙光】:承建DeepSeek杭州训练中心液冷系统;
【航锦科技】:旗下超擎数智为DeepSeek提供光模块和交换机;
【科大讯飞】:接入DeepSeek-Math模型,联合推出AI辅导应用“星火助学;
【金山办公】:WPS智能写作接入DeepSeek-WriterAPl,效率提升3倍。
欢迎关注、转发、点赞、留言
本文作者可以追加内容哦 !
其他东方等都是没任何关系、纯蹭概念的杂毛!!
超级题材,目标20倍,干!!仔细看: