“这显然是假的。大模型是积极的进攻,也是必须做的防守。反正没听说模型优先级降低。”
“老板明确表示,我们绝不会下table。”
针对“百度大概率放弃通用基础大模型”的传闻,两位百度员工对「市象」表示。
所谓的传闻来自一篇帖子:“百度大概率将放弃通用基础大模型研发,(又是起了个大早赶了个晚集?)李彦宏最近和内部明晰了主要做应用的战略,百度在模型层实在卷不动了。”
该帖在短暂发酵后引发关注,这最终迫使百度不得不作出回应。9月9日,文心一言市场部负责人张全文在朋友圈发文,“所谓‘放弃通用大模型研发’纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。”
事后,一位接近百度的知情人士对「市象」透露,这在百度内部引发了广泛讨论。
有百度员工对「市象」坦言,有这样的传言并不意外:“SuperCLUE总排行榜(2024年8月),ERNIE-4.0-Turbo-8K的评分已经落后于不少模型。如果转向应用领域,那机会就更渺茫了。”
过去半年,市场对AI大模型的关注焦点从模型技术本身转向了智能应用的实际落地,AI预期也开始回调。因此,在基础大模型的投入与AI应用落地之间做出取舍,实际上已成为所有大模型玩家不可回避的共同难题。
01 从ROI看“谣言”诞生的通路
“或者这么说吧,训练下一代模型不是百度的第一优先级。”上述发帖者表示,言外之意是“放弃”并不准确。
他此前对百度大模型方向的判断逻辑是:
GPT-4现在还没追上,到了GPT-5这个级别的模型花费可能30亿美金(粗估,上下浮动,这几乎是百度一年的净利润),而且你得知道怎么做,而且做出来要考虑ROI(投入产出比)能不能打正,一旦失败就是巨大的资源浪费和机会成本损失,这已经是在眼前非常现实的问题,百度这个体量的公司已经支撑不起模型梦了。
从ROI角度出发,单看产出端,即大模型的变现而言,百度当前确实面临着一定的商业化压力。
据二季度财报,百度最大的收入来源线上广告业务收入为192亿元,同比下滑2%。广告业务如此表现的原因是,百度推进搜索业务的人工智能革新造成了不小的内部压力。目前百度检索结果中有18%的结果是由生成式人工智能提供。目前这部分业务尚未实现变现。
有营销业内人士对「市象」指出:“百度在AI技术上的投入为未来铺路,但目前AI生成的内容还没有找到合适的变现模式,这在一定程度上影响了广告主的投放决策。”
在另一块云业务上,百度云当季收入为51亿元,其中,9%的收入来自外部客户对大模型和生成式AI相关服务的需求。据计算,该季度,生成式AI为百度云贡献了约4.59亿元的收入,而在之前的两个季度,这一数字分别为3.24亿元和2.74亿元。
生成式AI收入呈现增长趋势,但目前该业务对整体业绩的贡献依然有限,尚不足以撬动百度云的整体增长曲线。
百度等大厂在大模型商业化上的变现压力,还来自国内云厂商主动或被动发起的大模型价格战。
近日,腾讯推出了新一代大语言模型“混元Turbo”,并以降低50%的价格进一步加剧了这场价格战。而在此之前,百度也在持续降低其模型的推理成本,来应对市场的价格压力。
今年5月,百度智能云宣布ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列模型预置服务对客户免费开放使用;今年7月WAIC期间,百度智能云宣布ERNIE 4.0、ERNIE 3.5两款旗舰模型大幅降价,ERNIE 4.0 Turbo面向企业客户全面开放,输入输出价格分别低至0.03元/千Tokens、0.06元/千Tokens。
随着国内大模型市场的激烈竞争,价格战导致大模型的调用成本急剧压缩,行业已经陷入所谓的“负毛利时代”。无论是开源还是闭源模型,当前都面临着同样的困境——大模型业务难以实现直接盈利。
据财经杂志,“大模型市场的淘汰赛已经启动。”一位中国云厂商大模型业务负责人分析称,大模型调用的负毛利意味着,在短期内,调用次数越多,云厂商的亏损就越大。
综合这些因素,“单靠当前大模型的商业开发程度就实现正向ROI,有些不切实际。因此,百度重新定战略是完全有可能的。”一位腾讯AI算法专家对「市象」表示。
02 百度的AI路径是“既要又要”
百度此次虽否认了“放弃通用大模型研发”的传闻,但并未否认对应用开发的优先级。与其他大厂相比,百度十分重视AI应用开发。
遍数厂长的发言,始终强调“卷大模型没有意义,卷应用机会更大”。在近期的WAIC上,李彦宏甚至不再强调模型开源还是闭源,“这些都不重要,缺乏应用支撑的基础模型,无论开源还是闭源,都毫无价值。”
一位接近百度的业内人士向「市象」透露:“李彦宏的意思是,希望创业者能基于文心大模型开发更多AI应用,而不是让资源浪费在过多的基础大模型上。”
“其实想法是对的,问题在于怎么落地,百度自己就是础大模型的,别人凭什么听你的。”他进一步补充道。
百度内部员工也讨论过这个问题,有员工表示,希望robin(李彦宏)在公开场合少发表那些容易引发众嘲的言论。“只有百度的大模型不算浪费,别的公司做就是浪费资源,这种态度,作为行业领军者,实在是格局不够。”
从当下市场视角来看,百度在大模型和应用领域的理想目标其实是双管齐下。
在一直强调的应用领域,百度推出了三款AI开发工具,分别是智能体开发工具(AgentBuilder)、AI原生应用开发工具(AppBuilder)和模型定制工具(ModelBuilder)。
智能体是百度最看好的AI应用发展方向。在2024百度AI开发者大会上,李彦宏透露,已有1万名百度客户成功上线智能体,应用覆盖教育培训、房产家居、机械设备、商务服务等30多个行业。
在近期内部公开分享中,李彦宏也再次重提智能体,他认为智能体的低门槛是做应用直接的思路。
然而,智能体的方向或在公司内部并未达成一致。据接近百度的知情人士透露,在百度AI开发者大会期间,一些员工私下表达了不满。
有员工表示,文心智能体平台展示的那些所谓的“智能体”,除了少数用于展示的项目,其他99%更像是玩具。这些“玩具”即使通过搜索分发,也几乎没有实际价值。真正有意义的智能体,应该能够提供高质量服务,或者具备公网无法获取的私域数据。如果这些“玩具”都能被称为AI原生应用,那无异于自欺欺人。
李彦宏或许也认识到智能体的不足,“有很多人看好智能体这个发展方向,但是到今天为止,智能体还不是共识,像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。”
除了智能体自身的产品属性之外,外部开发者在AI应用开发方面对百度也保持一定的谨慎。
从目前公开的案例来看,使用百度AI开发平台的多为商家为其消费者提供的轻量级应用,企业级应用却相对稀少。尽管李彦宏多次承诺百度不会涉足应用开发,给创业者留出足够空间,但在移动互联网时代屡见不鲜的“像素级复制”,让开发者在大模型时代更加警惕。
一名垂直领域模型初创公司的创始人曾向财新表示,一方面,基于百度平台进行开发意味着将算法和数据暴露给百度;另一方面,百度可能无法为腰部开发者提供足够的接口支持,这也意味着开发者的客户数据难以在百度平台上进行部署。
03 大模型泡沫下的战略转向
眼下,高潮过后,更多的人开始审视生成式AI带来的实际收益问题。
高盛在6月末发布报告《生成式AI:花费甚多,而收益甚少》,高级策略师Allison Nathan提出了一个很关键的问题:在AI上的投入是否过多,而收益却太少?
在高盛的报告中提到,生成式AI技术被认为能改变公司、行业和社会,所以很多大公司计划在未来几年投入1万亿美元在AI相关的东西上,比如数据中心、芯片和电网。
这一支出已得到验证。CoutueAI的报告也提到,预计到2030年,基础设施建设将耗资约1.2万亿美元,主要用于采购大约2500万单位的GPU及其他相关支出。
要实现正向ROI,按照25%的回报率计算,预期收益需达到6000亿美元,加上1.2万亿美元的投入,到2030年AI的总收入必须达到1.8万亿美元才能实现收支平衡。然而,根据高盛的观点,迄今为止,这些巨额投资除了略微提升了开发人员的工作效率,尚未看到显著的成果。甚至从中获益最多的英伟达,其股价也出现了下跌。
当然,这只是宏观层面的讨论。如果聚焦到具体的大厂,实际面临的问题是,通用大模型逐渐演变为一个“超级烧钱”的游戏,变成了只有巨头才能参与的“富豪局”。没有足够资金的公司将不得不退出这场竞争。
根据国家网信部门官网公示的信息,自去年8月31日我国首批通过备案的人工智能大模型名单出炉以来,短短一年间,全国已有188款大模型完成备案,从终局思维来看,随着资金不足的玩家被淘汰,或者在竞争中耗尽资源,最终只有少数几家真正具备竞争力的大模型公司会主导市场。
“本质上,基础大模型就像CPU,都是通用技术。只要少数几家公司做到足够强,就能满足大部分市场需求。通用性商品的竞争就是如此,赢家通吃,最终通过市场的竞争洗礼,只有少数几家厂商能胜出并生存下来。”一位计算机业内人士表示。
这种“烧钱打仗”的局面在互联网大厂中已上演多次。以云厂商的大模型调用价格战为例,云厂商赌的是,随着大模型调用价格降低90%,未来1-2年内调用次数将呈指数级增长。在这场赌局中,必然会有一批模型厂商因价格战倒下,而幸存者将接手市场,收拾残局。
显然,大厂要想在基础大模型的“金钱战”中胜出,除了眼下是否有足够的资金支持,长远来看,自身的造血能力至关重要,而AI应用正是实现这一目标的关键方向。
事实上,仔细研究今年各大厂商的动向可以发现,他们除了在基础大模型方面持续投入,也在不断强调AI应用的开发。AI应用不仅是未来的造血工具,也是将大模型落地并创造实际价值的重要途径之一。
因此,“百度采取双轨策略(同时推进大模型和AI应用的发展),是为了应对可能出现的大模型泡沫时比较稳妥的做法。”接近百度人士对「市象」表示。
“唯一的问题在于,AI应用的落地方向仍然不够清晰。许多项目还停留在概念验证阶段,距离真正的商业化应用还有一段不小的距离。”
本文作者可以追加内容哦 !