商业策略方面的优势 DeepSeekV3开源了模型权重和相关论文,允许免费商业使用,这一开源策略有利于吸引更多的开发者参与到技术迭代中来,不断优化产品和拓展应用场景,从而快速推动技术的普及和应用。也有助于吸引更多的合作伙伴,形成更加庞大和活跃的生态系统,对于投资者而言,随着生态的繁荣,投资回报的可能性也会相应增加。
从技术层面深入分析,DeepSeek的创新训练方法是其一大投资优势亮点。这种无需依赖监督微调和已标注数据的训练模式,开辟了新的模型训练路径。传统的监督学习往往需要大量人工标注数据,这不仅耗时而且需要投入巨大的人力成本。
而DeepSeek采用多轮强化学习并引入GroupRelativePolicyOptimization(GRPO)算法,既能节省大量时间和成本,还能避免对复杂价值模型的依赖,例如DeepSeek - R1 - Zero基于DeepSeek - V3 - Base进行训练,完全通过强化学习实现,无监督微调或已标注数据就达成模型的构建与优化。
这意味着对于投资者来说,如果投资DeepSeek相关技术研发或者基于其技术进行二次开发的项目,能够减少前期在数据标注和传统训练模式方面的资金投入,降低开发门槛和风险。
#炒股日记# #复盘记录# #强势机会# #股市怎么看# $国泰国证疫苗与生物科技ETF发起联(OTCFUND|017185)$ $大成恒生科技ETF发起式联接C(OTCFUND|012980)$ $博时恒生科技ETF发起式联接(QDII)(OTCFUND|014439)$
本文作者可以追加内容哦 !