360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。

播报文章

亿方云企业网盘

关注

2024-12-27 11:59


就在上周,满血版o1正式上线了!它首次将多模态和新的推理范式结合起来,更智能、更快速。此前,在2024年9月OpenAI推出全新o1系列模型,以“会思考的大模型”重新定义了AI的发展方向,不仅打破了此前Scaling Law可能“见顶”的质疑,也宣告了人工智能进入更深层次逻辑推理能力的时代。OpenAI CEO奥特曼自信地表示:“o1的发布证明,AI的未来不仅没有放缓,我们对未来几年已经胜券在握。”这一言论背后,是对o1模型所展现出的突破性逻辑推理能力的肯定。

而这一波革新的浪潮也迅速蔓延至国内。短短两个月内,从kimi的k0 math到昆仑万维的天工大模型4.0 o1版,再到360的360gpt2-o1,国产厂商纷纷推出类o1模型,展示了其快速迭代与技术创新的实力。

这些新一代大模型不仅在数学、编程等领域的表现上接近甚至超越了o1,还通过引入“慢思考”技术,让人工智能开始模拟人类逐步推理和反思的过程。这种能力,不再只是简单的回答问题,而是在更深层次上尝试解决复杂难题,甚至具备了自我反思与纠错的能力。

当思维链(CoT)与强化学习的结合成为焦点,AI也逐步走向真正的“会思考”。这不仅是技术的较量,更是对未来人工智能边界的重新定义。国产大模型们,不止是跟随,更是对思考本质的一次次探索。

近日,360 自研 AI 大模型 360gpt2-o1 正式上线。

360gpt2-o1 使用树搜索构建思维链,并引入了反思机制,使用强化学习训练,模型具备自我反思与纠错的能力。该模型是继今年 10 月推出的 360 智脑大模型 360gpt2-pro 之后的重要更新,模型在数学以及各种复杂逻辑推理任务上实现了显著提升。

在多项基础数学评测(如MATH、高考数学)以及权威数学竞赛(包括AIME24、AMC23)中,360gpt2-o1 均取得了显著的成绩,不仅超越了前代模型 360gpt2-pro,也优于 GPT-4o 模型。

在数学竞赛评测中,360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。

优异的模型效果,主要得益于 360gpt2-pro 在合成数据优化、模型后训练和“慢思考”范式三个方面,均取得了重大进展,下面详细介绍一些技术细节。

2024-12-27 18:02:05 作者更新了以下内容

上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》,到2025年底,建成世界级人工智能产业生态,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3-5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。

追加内容

本文作者可以追加内容哦 !