OpenAI最近有点忙,一边是技术突破震撼数学界,一边是购物搜索功能突然宕机。这个全球最炙手可热的AI公司,正处在风暴眼中心:它既能用神秘模型一周攻克多道前沿数学难题,又会因为系统问题让用户“买不了东西”。这看似矛盾的现象,恰恰反映了当前AI发展的现实——在惊人的能力飞跃背后,依然存在基础服务的不稳定与挑战。
数学研究的革命:AI开始创造新知识
就在几天前,OpenAI扔出了一颗重磅炸弹:其内部未公开的模型,在仅有少量人工监督的情况下,成功挑战了10道从未发表的顶尖数学研究题,并宣称至少6道解答有很高概率正确。这场名为“First Proof”的实验,由来自斯坦福、哈佛、耶鲁等名校的11位顶级数学家发起,题目覆盖代数组合、随机分析、辛几何等多个前沿领域,答案此前从未公开。这意味着AI无法通过检索“作弊”,必须真正进行推理和证明。
尽管后续审查发现部分解答存在漏洞,最终确认正确的题目可能为4道左右,但这一成就依然意义非凡。一个AI模型独立完成了一篇可发表在数学期刊上的研究级证明,标志着AI已从解题工具进化为知识创造者。奥特曼直言,STEM研究范式将被彻底重塑。更关键的是,已有顶尖数学家如Ashwin Sawhney选择加入OpenAI,用行动投票,预示着AI将成为数学研究不可或缺的“对话伙伴”。
企业效率的飞跃:Frontier平台带来真实商业价值
与此同时,OpenAI的Frontier平台正在惠普、优步等巨头内部掀起效率革命。这个旨在管理“AI同事”的平台,让AI智能体深度融入企业核心业务流程。惠普通过采购智能体使成本下降15%;优步客服智能体处理了80%的用户咨询,响应时间从分钟级降至秒级;州立农业保险的理赔审核时间从3天缩短至30分钟。这些不再是预测,而是已经发生的商业价值。Frontier的成功在于解决了企业AI落地的核心痛点:通过连接CRM、ERP等割裂系统,赋予智能体“共享业务上下文”的能力,并利用精细化权限管控,让企业敢于将敏感任务交给AI,实现了从“工具辅助”到“智能体协作”的跨越。
内部变革与外部挑战:工程师变“巫师”,服务却遇宕机
在OpenAI内部,一场静默的革命早已开始。95%的工程师日常使用Codex编程,100%的代码提交(PR)都由Codex自动审查。工程师的角色正从写代码转变为管理一群AI智能体,如同“施展咒语的巫师”。高管Sherwin Wu预言,未来12 - 24个月内,模型将能连贯执行数小时的长任务,这将催生新一轮创业狂潮,尤其是服务于超级个体的B2B SaaS将迎来黄金时代。然而,就在这种高歌猛进中,OpenAI的购物搜索功能却遭遇了宕机。这一事件提醒我们,即使是最前沿的AI公司,其产品生态也并非铁板一块,基础服务的稳定性仍是用户体验的关键。能力的“天花板”和系统的“地板”同时存在,构成了AI发展的真实图景。
本文作者可以追加内容哦 !