360开源的Light-R1-14B-DS创造了三项行业纪录：一是能力复现。Li_财富号_东方财富网

2025年03月17日 22:06 江苏返回三六零吧>

点赞 5

评论 1

收藏

大中小

炒股第一步，先开个股票账户

360开源的Light-R1-14B-DS创造了三项行业纪录：

一是能力复现。Light-R1-14B-DS首次在数学能力上，用14B 模型复现了强化学习效果，通过多阶段课程学习SFT和强化学习，Light-R1-14B-DS的表现超过DeepSeek-R1-Distill-Llama-70B和DeepSeek-R1-Distill-Qwen-32B，是目前最优的14B模型，这验证了RL强化学习策略的有效性，RL对端侧模型训练的收益很大，仍有进一步挖掘潜力。

（Light-R1 训练流程）

二是效率革命。Light-R1-14B-DS 经过长思维链强化学习后训练，在AIME 24和25上分别取得了74.0和60.2的成绩，数学部分表现超越DeepSeek的70B（72.6分）和32B（54.9分）蒸馏模型，取得了非常显著的提升，这标志着推理能耗进一步降低。另一版本的Light-R1-7B-DS，无需量化即可端侧部署。此次探索，在低成本复现 DeepSeek-R1方面迈出了重要一步。

三是泛化能力增强。Light-R1-14B-DS在科学常识评测GPQA上涨，打破了模型“灾难性遗忘”的魔咒，具有较好的泛化性，开辟模型优化新路径。

最强14B端侧推理模型，撕开了DeepSeek 70B的性能封锁线，端侧AI迎来了规模化普及的拐点。不过，在AI与大众之间，还差一个开源。

追加内容

本文作者可以追加内容哦 !

分享到：

举报

郑重声明：用户在社区发表的所有信息将由本网站记录保存，仅代表作者个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

网友评论

已有1人评论，共270人参与讨论

还可输入字

清除

提交评论

郑重声明： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》

热门评论查看全部评论

全部评论 (1) 只看作者

最新最热最早

股友031l2t3718

2025-03-17 23:10:11 来自广东

开源模型牛，复现强推理省电还泛化

置顶删除举报评论点赞

这个人很懒，什么都没有留下

更多文章

投资组合

--

总收益	20日收益	日收益
--	--	--

最新操作
-	-	-

历史收益率走势(%)

Chart

自选股

代码	名称	最新价	涨跌幅
查看更多

浪客视频

-

分享到：

郑重声明：东方财富网发布此信息的目的在于传播更多信息，与本站立场无关。东方财富网不保证该信息（包括但不限于文字、视频、音频、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担。

扫一扫下载APP

东方财富产品

证券交易

关注东方财富

扫一扫下载APP

基金交易

关注天天基金

期货交易

信息网络传播视听节目许可证：0908328号经营证券期货业务许可证编号：913101046312860336 违法和不良信息举报:021-61278686 举报邮箱：jubao@eastmoney.com

沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号版权所有:东方财富网意见与建议:4000300059/952500

关于我们可持续发展广告服务联系我们诚聘英才法律声明隐私保护征稿启事友情链接

亲爱的市民朋友，上海警方反诈劝阻电
话“962110”系专门针对避免您财产被
骗受损而设，请您一旦收到来电，立即
接听。

网站首页加收藏