计算机:OPENAI或将发布新模型“草莓” 推理性能表现突出

09-13 和讯 长江证券宗建树

专业投顾直接发送:今日《独家热点股票报告》,选股+诊股+炒股指标。点击限时领 >

  事件描述

  2024 年9 月10 日,根据海外科技媒体The Information 报道,OpenAI 或将于两周内将发布最新模型“草莓”,为Chatgpt 等产品提供技术支持。

  事件评论

  “草莓”独特之处或在于响应之前能够“思考”,在数学、编码、主观任务等方面表现突出。据悉,“草莓”是一个独立产品,初级版本只支持接受并生成文本,暂不具备多模态能力。相较其他生成式人工智能,“草莓”的独特之处可能包括:1)模型体验上,“草莓”推理模式十分特殊,能够在回应之前进行“思考”而非立即回答问题,通常持续10-20s,此外客户需要在ChatGPT 中输入更多单词以获取更为智能的回答(被称为“思路链提示”),更适用于复杂或多步骤查询。2)模型能力上,“草莓”在数学问题和编码方面具备更高水平,并对“主观”任务的表现更好,应用场景包括集思广益制定产品营销策略、制定每周详细执行计划、生成更高质量的训练数据等。

  “草莓”项目旨在提升推理能力,有望突破应用端关键瓶颈。根据Open AI 此前提出的AGI 路线图,人工智能发展可分为5 大阶段:1)聊天机器人,具有对话能力的AI;2)推理者,具备像人一样解决问题能力的AI;3)智能体,能够思考且采取行动的AI 系统;4)创新者,能够协助发明创造的AI;5)组织者,能够完成组织工作的AI。当前的各类大语言模型已具备强大的文本处理能力,但有时难以准确回答常识性问题、易出现幻觉,提升推理能力成为释放模型能力、提升应用潜力的关键。此前Open AI 曾有高管表示当前其模型处于第一阶段,但将很快达到推理者级别,“草莓”模型的实际推理表现或将成为关键指引。技术实现角度,当前有消息称“草莓”与斯坦福大学2022 年提出的“自学推理(STaR)”方法类似,核心理念为在每个输入token 后进行“思考”过程,促使模型实现内部推理,实际技术细节有待进一步披露。

  Scaling Law 持续生效,持续关注模型端性能跃升与AI 投资回报率提升的拐点。从之前披露的海外大厂最新财报看,资本开支加速上行,显示科技龙头对AI 领域的投入意愿与预期仍较高,另一方面,从各大厂实际经营表现看,无法忽视的现象在于整体营收与业绩增速的边际放缓,显示需求端有所承压。投入与产出的增速分化一定程度上反映了AI 应用的商业化落地节奏不及AI 基础设施的投入。当前时点,Scaling law 持续生效,AI 赋能业务增质提效、B 端与C 端小规模应用落地持续推进,但生成式AI 与业务端的融合程度距离AI 应用商业端爆发仍需一段时间,未来主要关注模型端性能跃升与AI 投资回报率提升的拐点。

$上证指数(SH000001)$  


$超讯通信(SH603322)$  

追加内容

本文作者可以追加内容哦 !