迈向通用 AI 关键一步,谷歌 AlphaGeometry国际奥数正确率达83%

IT 之家 1 月 18 日消息,谷歌 DeepMind 近日在《Nature》上发表论文,展示了最新 AI 系统 AlphaGeometry,解决数学几何问题的能力媲美全球顶尖学生。

AlphaGeometry 在高中生国际数学奥林匹克竞赛(IMO)中,30 道题目中正确回答 25 道,正确率为 83%。

作为对比,人类金牌得主平均能正确回答 25.9 个问题,而此前 AI 模型的最好纪录是成功回答 10 道几何问题。

这一成绩非常接近人类参赛者的金牌标准,Deepmind 认为,这凸显了人工智能在数学领域日益增长的能力。

参与该项目的 Deepmind 研究员 Quoc V Le 告诉《金融时报》,新系统是向构建人工通用智能(AGI)迈出的关键一步。



2024-01-18 13:58:10 作者更新了以下内容

全天候科技3小时前 接近高中数学高赛金牌水平!谷歌 DeepMind 的 AI 新突破,“构建 AGI 关键一步” DeepMind 旗下的 AlphaGeometry 系统在最新研究中表现出媲美顶尖奥赛选手的数学水平。 据报道,周三发表在《Nature》上的一篇论文显示,谷歌旗下 DeepMind 开发的系统 AlphaGeometry 能够在 30 道高中国际奥赛数学题中答对 25 道。 这个准确率相当于金牌选手的水平,意味着人工智能在数学计算能力上的又一步跃升。 具体而言,在 DeepMind 团队构建的由 1 亿个合成几何数据组成的训练用信息集中,AlphaGeometry 能够获得 25 分(满分 30),接近 2000-2022 年间奥赛获奖者的平均分(25.9 分),并远高于此前最先进的自动化系统的得分(10 分)。 DeepMind 研究员 Quoc V Le 表示: " 这是迈向 AGI(通用人工智能)的关键一步。 " " 这是 AI 推动科技进步的一大范本——能帮我们更好地理解世界运行秩序。" 据 DeepMind 称,AlphaGeometry 具有 " 快速且缜密 " 的逻辑思维能力,研究员 Trieu H Trinh 称该能力十分适合被用来解决几何问题。 不过,研究发现 AlphaGeometry 在某些特定的问题上仍显乏力,比如它无法解答 1979 年奥赛中的一道相交圆难题。 据介绍,AlphaGeometry 是一种神经符号 AI 系统,结合了语言学习和演绎推理,DeepMind 为其设定的目标是 " 能够超出人类数学思维范畴的 AI 系统 "。 伦敦数学科学研究所的研究员 Mikhail Burtsev 表示,DeepMind 的工作是向前迈出的一大步,但 " 仅限于它自身设定的挑战范围内 ",他表示: " 更严峻的挑战仍然存在——即 AI 能否解决尚未解答的数学问题。"

2024-01-18 14:05:29 作者更新了以下内容

全天候科技3小时前 接近高中数学高赛金牌水平!谷歌 DeepMind 的 AI 新突破,“构建 AGI 关键一步” DeepMind 旗下的 AlphaGeometry 系统在最新研究中表现出媲美顶尖奥赛选手的数学水平。 据报道,周三发表在《Nature》上的一篇论文显示,谷歌旗下 DeepMind 开发的系统 AlphaGeometry 能够在 30 道高中国际奥赛数学题中答对 25 道。 这个准确率相当于金牌选手的水平,意味着人工智能在数学计算能力上的又一步跃升。 具体而言,在 DeepMind 团队构建的由 1 亿个合成几何数据组成的训练用信息集中,AlphaGeometry 能够获得 25 分(满分 30),接近 2000-2022 年间奥赛获奖者的平均分(25.9 分),并远高于此前最先进的自动化系统的得分(10 分)。 DeepMind 研究员 Quoc V Le 表示: " 这是迈向 AGI(通用人工智能)的关键一步。 " " 这是 AI 推动科技进步的一大范本——能帮我们更好地理解世界运行秩序。" 据 DeepMind 称,AlphaGeometry 具有 " 快速且缜密 " 的逻辑思维能力,研究员 Trieu H Trinh 称该能力十分适合被用来解决几何问题。 不过,研究发现 AlphaGeometry 在某些特定的问题上仍显乏力,比如它无法解答 1979 年奥赛中的一道相交圆难题。 据介绍,AlphaGeometry 是一种神经符号 AI 系统,结合了语言学习和演绎推理,DeepMind 为其设定的目标是 " 能够超出人类数学思维范畴的 AI 系统 "。 伦敦数学科学研究所的研究员 Mikhail Burtsev 表示,DeepMind 的工作是向前迈出的一大步,但 " 仅限于它自身设定的挑战范围内 ",他表示: " 更严峻的挑战仍然存在——即 AI 能否解决尚未解答的数学问题。"

追加内容

本文作者可以追加内容哦 !