“外界对大模型有相当多的误解,”近日据媒体报道,李彦宏的一则内部讲话曝光。在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。

李彦宏认为未来大模型之间的差距可能会越来越大。他进一步解释,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。

误区一:榜单不代表大模型实力,模型之间的差距是多维的

对于行业“大模型之间的能力已经没有壁垒”的说法,李彦宏给出了不同观点。“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距了。”

他解释说,很多模型为了证明自己,会在发布之后去打榜,会去猜测试题目、答题技巧,从榜单上看 ,或许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的。”

李彦宏指出,模型之间的差距是多维度的。行业往往更关注理解、生成、逻辑、记忆等能力的差距,但却忽视了成本、推理速度等维度,有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。

内部讲话中,李彦宏认为,真正要去衡量大模型能力,应该是在具体应用场景中,看是否能满足用户需求、产生价值增益,这才是最值得被在乎的

误区二:开源模型效率不高,解决不了算力问题

延续此前观点,内部讲话中,李彦宏进一步阐释了外界对开源大模型的认知误区。

“在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。” 他解释说,比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,无法实现算力的高效利用。

“效率上开源模型是不行的。” 他表示,“ 闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”

李彦宏分析,在教学科研等领域,开源模型是有价值的;但在商业领域,当追求的是效率、效果和最低成本时,开源模型是没有优势的

误区三:智能体是大模型最重要的发展方向,但还不是业界共识

李彦宏还谈及了大模型应用的发展阶段,他认为首先出现的是Copilot,对人进行辅助;接下来是Agent智能体,有一定的自主性,能自主使用工具、反思、自我进化;这种自动化程度再发展,就会变成AI Worker,能独立完成各方面的工作。

当前,智能体已经受到越来越多的大模型公司及客户的关注,李彦宏认为,虽然“有很多人看好智能体这个发展方向,但是到今天为止,智能体还不是共识,像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。”

为什么要强调智能体?李彦宏也给出了答案,“智能体的门槛确实很低”, 很多人不知道怎么把大模型变成应用,而智能体是一个非常直接、高效、简单的方式,在模型之上构建智能体相当方便。目前,每周都有上万个新的智能体在百度文心智能体平台上被创造出来,智能体的日均分发次数已快速增长至800万次。

此前,李彦宏多次在内外部讲话中明确表示智能体对于AI应用的重要性。

在今年7月WAIC期间的圆桌访谈中,李彦宏认为,智能体代表着AI时代的未来趋势。“智能体正在爆发,只是现在基数还比较小,大家的体感没有那么强烈。”基础模型需要靠应用才能显现出价值,智能体是一个几乎“放之四海而皆准”的基于大模型的应用,由于它门槛足够低,可能你连编程都不用,就可以做出一个效果不错的智能体。“让更多人进来,他们发挥聪明才智,指不定哪条路跑通了,它就是一个Super APP。”

在WAIC大会演讲中,李彦宏表示,在AI应用的发展方向上,最看好智能体。“随着基础模型的日益强大,开发应用也越来越简单,其中,最简单的就是智能体,只要用‘人话’把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,比互联网时代制作一个网页还简单”。

6月亚布力企业家走进百度活动,李彦宏指出,智能体将会大量出现、形成生态。“未来,在各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据,做出来这些智能体。”展望未来,他分析说,智能体或许还将具备协作能力,“有些复杂的任务,可以通过多个智能体来完成,就像公司里有CEO,还有财务、技术、销售主管,他们协作起来,能完成一个非常复杂的任务。”

其实在百度文心智能体平台AgentBuilder上,已有20 万开发者、6.3 万企业入驻。7月,百度宣布在文心智能体平台AgentBuilder上免费开放文心大模型4.0,开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本。

据百度2024年Q2季度财报,智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,为5月的两倍,最常用的智能体包括内容创作、性格测试、日程规划等类型。用户、开发者、服务商、商户均为智能体生态的重要参与方,目前,在百度开发智能体的商户已达1.6万家,覆盖教育、法律和B2B等行业。


追加内容

本文作者可以追加内容哦 !