360gpt2-o1超过了阿里巴巴最新开源的o1系列模型QWQ-32B-prev_财富号

360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。

播报文章

亿方云企业网盘

关注

2024-12-27 11:59

就在上周，满血版o1正式上线了！它首次将多模态和新的推理范式结合起来，更智能、更快速。此前，在2024年9月OpenAI推出全新o1系列模型，以“会思考的大模型”重新定义了AI的发展方向，不仅打破了此前Scaling Law可能“见顶”的质疑，也宣告了人工智能进入更深层次逻辑推理能力的时代。OpenAI CEO奥特曼自信地表示：“o1的发布证明，AI的未来不仅没有放缓，我们对未来几年已经胜券在握。”这一言论背后，是对o1模型所展现出的突破性逻辑推理能力的肯定。

而这一波革新的浪潮也迅速蔓延至国内。短短两个月内，从kimi的k0 math到昆仑万维的天工大模型4.0 o1版，再到360的360gpt2-o1，国产厂商纷纷推出类o1模型，展示了其快速迭代与技术创新的实力。

这些新一代大模型不仅在数学、编程等领域的表现上接近甚至超越了o1，还通过引入“慢思考”技术，让人工智能开始模拟人类逐步推理和反思的过程。这种能力，不再只是简单的回答问题，而是在更深层次上尝试解决复杂难题，甚至具备了自我反思与纠错的能力。

当思维链（CoT）与强化学习的结合成为焦点，AI也逐步走向真正的“会思考”。这不仅是技术的较量，更是对未来人工智能边界的重新定义。国产大模型们，不止是跟随，更是对思考本质的一次次探索。

近日，360 自研 AI 大模型 360gpt2-o1 正式上线。

360gpt2-o1 使用树搜索构建思维链，并引入了反思机制，使用强化学习训练，模型具备自我反思与纠错的能力。该模型是继今年 10 月推出的 360 智脑大模型 360gpt2-pro 之后的重要更新，模型在数学以及各种复杂逻辑推理任务上实现了显著提升。

在多项基础数学评测（如MATH、高考数学）以及权威数学竞赛（包括AIME24、AMC23）中，360gpt2-o1 均取得了显著的成绩，不仅超越了前代模型 360gpt2-pro，也优于 GPT-4o 模型。

在数学竞赛评测中，360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。

优异的模型效果，主要得益于 360gpt2-pro 在合成数据优化、模型后训练和“慢思考”范式三个方面，均取得了重大进展，下面详细介绍一些技术细节。

2024-12-27 18:02:05 作者更新了以下内容

上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》，到2025年底，建成世界级人工智能产业生态，力争全市智能算力规模突破100EFLOPS，形成50个左右具有显著成效的行业开放语料库示范应用成果，建设3-5个大模型创新加速孵化器，建成一批上下游协同的赋能中心和垂直模型训练场。

追加内容

本文作者可以追加内容哦 !

总收益	20日收益	日收益
--	--	--

代码	名称	最新价	涨跌幅
查看更多

最新操作
-	-	-