OpenAI一周攻克6道数学难题，购物搜索却崩了！_财富号

OpenAI最近有点忙，一边是技术突破震撼数学界，一边是购物搜索功能突然宕机。这个全球最炙手可热的AI公司，正处在风暴眼中心：它既能用神秘模型一周攻克多道前沿数学难题，又会因为系统问题让用户“买不了东西”。这看似矛盾的现象，恰恰反映了当前AI发展的现实——在惊人的能力飞跃背后，依然存在基础服务的不稳定与挑战。

数学研究的革命：AI开始创造新知识

就在几天前，OpenAI扔出了一颗重磅炸弹：其内部未公开的模型，在仅有少量人工监督的情况下，成功挑战了10道从未发表的顶尖数学研究题，并宣称至少6道解答有很高概率正确。这场名为“First Proof”的实验，由来自斯坦福、哈佛、耶鲁等名校的11位顶级数学家发起，题目覆盖代数组合、随机分析、辛几何等多个前沿领域，答案此前从未公开。这意味着AI无法通过检索“作弊”，必须真正进行推理和证明。

尽管后续审查发现部分解答存在漏洞，最终确认正确的题目可能为4道左右，但这一成就依然意义非凡。一个AI模型独立完成了一篇可发表在数学期刊上的研究级证明，标志着AI已从解题工具进化为知识创造者。奥特曼直言，STEM研究范式将被彻底重塑。更关键的是，已有顶尖数学家如Ashwin Sawhney选择加入OpenAI，用行动投票，预示着AI将成为数学研究不可或缺的“对话伙伴”。

企业效率的飞跃：Frontier平台带来真实商业价值

与此同时，OpenAI的Frontier平台正在惠普、优步等巨头内部掀起效率革命。这个旨在管理“AI同事”的平台，让AI智能体深度融入企业核心业务流程。惠普通过采购智能体使成本下降15%；优步客服智能体处理了80%的用户咨询，响应时间从分钟级降至秒级；州立农业保险的理赔审核时间从3天缩短至30分钟。这些不再是预测，而是已经发生的商业价值。Frontier的成功在于解决了企业AI落地的核心痛点：通过连接CRM、ERP等割裂系统，赋予智能体“共享业务上下文”的能力，并利用精细化权限管控，让企业敢于将敏感任务交给AI，实现了从“工具辅助”到“智能体协作”的跨越。

内部变革与外部挑战：工程师变“巫师”，服务却遇宕机

在OpenAI内部，一场静默的革命早已开始。95%的工程师日常使用Codex编程，100%的代码提交（PR）都由Codex自动审查。工程师的角色正从写代码转变为管理一群AI智能体，如同“施展咒语的巫师”。高管Sherwin Wu预言，未来12 - 24个月内，模型将能连贯执行数小时的长任务，这将催生新一轮创业狂潮，尤其是服务于超级个体的B2B SaaS将迎来黄金时代。然而，就在这种高歌猛进中，OpenAI的购物搜索功能却遭遇了宕机。这一事件提醒我们，即使是最前沿的AI公司，其产品生态也并非铁板一块，基础服务的稳定性仍是用户体验的关键。能力的“天花板”和系统的“地板”同时存在，构成了AI发展的真实图景。

追加内容

本文作者可以追加内容哦 !

总收益	20日收益	日收益
--	--	--

代码	名称	最新价	涨跌幅
查看更多

最新操作
-	-	-