华尔街见闻2024-12-07 19:17北京
在最新一期节目中,OpenAI知名研究员、O1研究团队的核心科学家NoamBrown,表达了对“测试时计算”(或推理时计算,test-timecompute)技术引爆AGI时代的坚定信心。
他认为,尽管扩大预训练规模是提升模型性能的有效手段,但成本高昂且终将触及天花板。而“测试时计算”技术的出现,为解决这一瓶颈提供了全新的思路,将加速AGI的到来。
Brown曾认为,实现AGI至少需要十年,但“测试时计算”技术仅用两三年时间便攻克了他在2021年与OpenAI首席科学家IlyaSutskever讨论时提出的关键难题:如何扩展推理过程中的计算量。
他认为,这项技术让模型能够在推理阶段进行更深入的思考和计算,从而解决更复杂的问题,而O1模型便是测试时计算研究的突破,可自主学习策略、拆解任务、识别并纠正错误,展现出前所未有的智能水平,证明了模型可以进行更深入的推理和解决更复杂的问题,它存在的意义被大大低估。
Brown强调,测试时计算目前还处于早期发展阶段,未来拥有巨大的提升空间。
他以ChatGPT为例:目前每次查询的成本约为1美分,但对某些高价值应用场景,用户愿意支付的费用可能高达100万美元,这预示着测试时计算拥有巨大的市场潜力,将在未来释放出更强大的能量。
精华概要
本文主要围绕OpenAI研究科学家Noam Brown对大型语言模型(LLM)能力、测试时间计算以及AGI发展时间线的看法展开。
精华概要如下:
大模型能力触碰天花板?测试时计算打开新思路
- 模型越大,性能越强,但成本也越高,终将面临经济上的不可逾越的障碍。
- 测试时计算提供了一种更经济高效的方式来提升模型性能。
问:模型能力是否已经达到了极限?
答: Noam认为,LLM的能力并非遇到了硬性瓶颈,而是面临着经济上的软性限制。单纯通过扩大预训练规模来提高性能,成本会呈指数级增长,导致经济上不可行。
测试时计算:AGI 的终极密码?
- 测试时计算仍处于早期阶段,潜力巨大,还有很多低 hanging fruits 等着我们去摘取。
- 测试时计算可以解决预训练无法解决的问题,例如在推理过程中进行扩展。
问:测试时计算的上限有多高?
答: Noam认为,测试时计算是提升LLM能力性价比的关键。相比预训练的巨额投入,测试时间计算的成本相对较低,且算法改进空间巨大,具有巨大的提升潜力。他估计测试时间计算的成本还有至少八个数量级的提升空间。
AGI实现时间被大大缩短
问:Sam Altman 曾说:“我们基本知道如何构建 AGI 了”,你的看法呢?
答: 我和 Sam 的观点一致,OpenAI 的研究人员普遍认为 AI 会快速发展。测试时计算的出现解决了很多关键问题,例如如何扩展推理过程中的计算量。我原本以为这需要 10 年时间才能实现,但实际上只用了 2-3 年。
O1的意义被低估了:OpenAI从预训练巨头到测试时计算先锋
- OpenAI 正全力投入开发能够扩展测试时计算的技术。
- O1 是测试时计算研究的突破,它证明了模型可以进行更深入的推理和解决更复杂的问题。
问:是什么促使你专注于测试时计算的研究?
答: 在扑克和外交等游戏中,我看到了测试时计算的巨大潜力。我意识到,仅仅扩大预训练规模无法实现真正的智能,需要找到一种方法来扩展推理过程中的计算量。在 2021 年,我跟 Ilya Sutskever 讨论过 AGI 的时间线,当时我认为至少需要 10 年时间。令我惊讶的是,他当时也认为仅靠扩大预训练规模无法实现 AGI。
问:是什么让你相信测试时计算会成功?
答: 当我们让模型“思考”更长时间时,它开始展现出一些我们原本以为需要人工添加到模型中的能力,例如尝试不同的策略、将复杂问题分解成更小的子问题、识别并纠正错误。这让我相信,测试时计算是通往更高级智能的关键。
问:OpenAI 为什么会转向测试时计算?
答: OpenAI 内部也意识到仅靠扩大预训练规模无法实现 AGI,他们一直在寻找新的突破口。虽然最初的动机是为了克服数据墙的限制,但最终目标与扩展测试时计算的目标一致。O1 的出现实际上颠覆了 OpenAI 自己开创的预训练范式,这表明 OpenAI 愿意投资有风险的方向。
通用模型一统天下?专用模型和工具仍有价值
- 未来可能会出现一个能够处理所有任务的单一模型,并根据需要使用专门的工具。
问:专用模型的未来如何?
答: 我认为最终会出现一个能够处理所有任务的单一模型。但目前 O1 和 GPT-4 各有优劣。O1 更智能,擅长解决复杂问题,但响应速度较慢。GPT-4 响应速度更快,更适合那些不需要深入推理的任务。
问:专用工具在未来会扮演什么角色?
答: 我认为未来会出现很多介于简单计算器和复杂模型之间的专用工具。例如,当 O1 被要求进行复杂的数学计算时,它可以选择调用计算器工具来节省时间和成本。
O1 惊艳亮相:颠覆编码,开启人机协作新时代
本文作者可以追加内容哦 !