中国版本的各类大模型有很多了,如百度的文心一言,抖音的豆包,科大讯飞的讯飞星火,月之暗面的KiMi,这些大模型在发布后,都没有象DeepSeek发布后产生的震憾与轰动,连川普都为此提醒美国的科技界该醒醒了,要求对中国的高科技产品进行更加严格的管制。美股为此连续下跌,而受影响最深的英伟达股价居然连续暴跌。这款大模型产品有何魔力,为何让金融圈如此震动?
首先是这款大模型是纯国产的,连研发团队的成员都没有留洋背景,纯粹的国产土鳖。DeepSeek的创始人梁文锋是浙江大学信息与通信工程专业的本科、硕士。核心成员罗福莉,95后年轻人,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。其它专业成员多是清华大学、北京邮电大学、中国科技大学、浙江大学等国内院校。由此说明中国在大模型人才储备上已不输其它国家。
其次,这款模型的性价比非常高。它比同类型的大模型都要好,推理能力强,能与OpenAIicon等行业巨头的模型正面竞争,在AIME和MATH-icon500等基准测试中,展现出卓越的推理能力和更快的复杂问题解决响应速度。不仅性能优越,而且成本极低,训练成本不到OpenAI的十分之一,如DeepSeek-V3的全部训练成本仅557.6万美元,远低于Llama-3.1等模型。
第三,完全开源免费。模型完全开源,代码、论文全部公开,前期用户能享受免费使用,普通人花少量费用就能复刻“AI神话”。
第四,不需要高端的科技芯片,仅运行普通显卡。这就大大地降低了AI模型构建和运行对英伟达高端GPU芯片的依赖。而普通的显卡的厂商不仅英伟达一家能生产,国内包括景嘉微、华为昇腾、浪潮信息、中科曙光等一众厂商均可以为DeepSeek提供硬件支持。
故DeepSeek一推出,就让华尔街非常震撼,甚至有人说连OpenAIicon都没能做到的事,居然让一家中国公司做成了。最近几天,不断暴发网络黑客对DeepSeek网站的攻击,目的就是为了阻止新用户注册,可见竞争对手对这款大模型的担心有多么大。反过来印证了这款大模型的能力超强、对未来生态的影响极大,对行业发展和金融市场的影响还会持续。不过此时最需要考虑的是相关科技研发人员的人身安全,类似悲痛事件已多次发生,应予以高度重视。
对于中国投资者而言,节后相关概念股必会掀起一波行情,让我们拭目以待吧。
本文作者可以追加内容哦 !