作者 | 河马君

如果说2023年被称为“大模型元年”,2024就应该是“大模型应用元年”。

在这个“诸神战场”中,共识已经悄然改变,主要参与者纷纷转向优先落地而不是继续无休止地研发迭代。

一方面,小型化模型的应用正在稳步增长,“低代码(Low-code)”及“无代码(No-code)等开发理念广泛传播,成本概念在持续强化。

另一方面,具体应用场景得到了空前的重视,从谷歌生物声学基础模型HeAR,到支小宝,阅文妙笔等,研发者的注意力转向更具体、更专业的垂直领域;而B端市场同样齐头并进,试图更高效地探索产业大模型应用的实际落地路径。

一、大模型B端市场如何破局?或许始于一场场“实战竞赛”

大模型一个显著的新趋势,是B端市场得到了更多重视。

全球范围内,真正有意愿、有能力为AI付费的用户大多数集中在B端。根据IDC在2023年四季度的调研,对生成式AI完全没有规划的企业只有7%,也就是说超过九成的企业至少已经意识到了AI与未来的强关联;其中已编列明确预算的企业有24%,这才是当前AI付费的主力市场。

“落地”本就是中国互联网企业最擅长的部分,阿里、腾讯、百度都在探索基础的大模型服务平台。

巨头们已经意识到,或许未必需要躬身入局去走完模型商业落地的最后一公里,在B端建立起合作生态,由下游企业自行“炼成”符合需求的模型产品,能够最大限度地优化资源配置,而过程中积累的高质量数据,则可以反哺基础大模型开发,从而在长期竞争中为国产大模型赢得优势。

前几天,我正好在云栖大会现场体验了一场AI应用竞赛,从中也感受到B端市场大模型落地的一个关键——需要极度重视具体的业务场景。

据介绍,这场阿里云“百炼杯”智能好客服PK赛,是业界首个以企业实际落地场景效果为目标的AI应用系列开发赛,不只关注算法、结构、创意等技术性内容,将重点放在了真正的“具体场景”之中。

正如PK赛的宣传片所言:“‘创新’这个词,好像也不那么创新”,的确,传统的“创新大赛”往往更重视偏于“务虚”的问题。

过往纯粹比拼纸上商业蓝图或技术能力的一些竞赛方式,或许已经不再适应AI落地的需要。

以这场比赛为例,浩鲸科技、亚信科技、合力亿捷、云梦智能等8家业内经验丰富的企业基于阿里云“百炼”平台定制的智能客服,要在现场评委和观众面前接受顾客咨询。

这些“顾客”同样是由“百炼”平台生成的、具有不同性格特征的虚拟消费者,其中有话痨的大妈、爱美的都市丽人,它们有的关注锅盖的材质、有的要求针对自己的肤质推荐推荐护肤品……

这些考验是传统客服机器人无法处理的,甚至有时候真人客服面对这些五花八门的信息也大为头痛。

基于大模型技术打造的AI智能客服在接受考验时,不能漏掉消费者询问中的关键信息,还应当给出合理的、足够拟人化的回复。

“基于实战”,其实也给竞赛带来一个值得关注的新影响:参赛方案的优劣是很难像以往那样,100%标准化的。

或者说,参赛方案其实是在不同维度,去推动解决商业场景的实际问题。

各家的Agent智能体有自己的逻辑重点和“性格”,有的在输出时强调了多重索引后的数据精准性;有的看重对消费者情绪的安抚与“人文关怀”;有企业利用全流程云上原生应用大幅提高了AI客服的响应速度……这里可能没有“最强”的智能体,而是“最适合”的智能体。

而这种真正“最适合”的创新,往往正是诞生于实战之中的。

二、小切口、大智能——AI应用的法门是“大小联动”吗?

另一个令人感兴趣的市场趋势是,从各家企业一开始反馈的困难,到最后大家解决问题的思路,都说明在大模型实用落地的过程中,“大小联动”是极具可行性的技术思路。

参赛企业在Agent介绍中普遍提到的AI客服“炼制”难点,并不限于纯技术层面,而是与专业场景息息相关。

首先是,消费者的提问可能不那么标准化,会有需要结合上下文语境才能捕获的意思,有时还会出现简写和错别字。这就导致低代码环境下AI可能出现误读甚至出现“幻觉”。

其次是,AI客服的回答不仅需要智商,还需要有点“情商”,也就是高度拟人化。好的客服既需要给出足够精准的信息,还需要安抚顾客的情绪,举例而言,如果回答中出现长篇大论的数据描述,会让一些咨询者难以识读,心情烦躁,AI如何应对就很有趣了。

针对这些问题,不止一家企业的解决方案强调了大模型与小模型联动的作用。

首先通过小模型实现对提问信息的预处理,识别商品ID等关键信息,降低“致幻率”,更准确地识别客户意图。

然后分类调取知识库,通过API调用阿里通义高智能的基础大模型,完成prompt封装,实现RAG(一种检索外部知识库强化LLM生成的技术)信息输出。

“大小联动”通过小模型的预处理,优化了大模型的处理效率,实现了兼顾成本与效能。当然,低代码乃至“无代码”开发,同时也对大模型服务平台的易用性提出了考验,这可能是平台此前自己都没有意识到的。

我在现场看到的一个有趣小细节是,云蝠智能的技术主管表示,此次参赛的Agent智能体全程由他们的财务人员创造完成,现场阿里云“百炼”技术人员侧目:“我们的易用性这么强吗?”

此次大赛中,冠军云梦科技、亚军合力亿捷的Agent智能体方案,也正都是高代码与低代码混合的模式。基于企业自身的技术能力,他们的Agent智能体能够分辨公斤与市斤,也可以识读“黄二白”“混油皮”这样直男懵圈的护肤术语,展现了很强的实用性。

当然,参赛企业在方案选择上的多元性,本身也体现“百炼”平台的基础大模型服务很强的工具性和便捷性。

三、客服、搜索、生活服务……大模型对业务的变革初露端倪?

大模型B端应用的探索,其实反过来,对巨头的业务侧变革也带来全新的启发。

让B端客户可对应用场景拥有更多自主权,这对巨头们的大模型路线也是一个启发,实际上,在“百炼”的开放式结构中,阿里云也在重构自身的伙伴生态:放开末端权限,让中小型企业用更专业的数据炼制模型,阿里云则更专注地进行基础研发投入,提供软硬件服务,收获支撑AI开发的现金流和更专业精准的数据,最终来实现AIGC、智能客服、智能政务、智能分析等多元业态的链接。

大模型竞争中,业务基因和技术基因至少是同等重要的。阿里云之所以能汇集8家各自领域的知名企业参赛并产出扎实成果,根源还是其在企业级市场的平台服务上更具优势,阿里的“平台基因”起到了关键作用。

“百炼”并不是一个严格意义上从0到1的新物种,而是阿里一直以来to B优势基因的延续,通过服务商家来实现商业上确定无疑的“落地”,这显然是阿里的舒适区。

“AI+”提供了宽阔的想象空间,但“百炼”模型依然选择“从客服开始”,这也是个很有意思的现象。

“客服”在传统上属于职能或者说中台业务,但大模型时代,智能客服作为商家最高频、刚需的使用场景确实是一个极好的接入节点,甚至可能是业务变革的一个支点。

首先,需求确实庞大,不管是叱咤风云的头部主播,还是高大上的航天科技,在变现的最后一公里都需要与客户沟通细节问题。

将人力从繁冗的重复劳动中解放出来,本就是AI研发的初衷,对企业来说,人工客服的高成本和情绪上的不确定性,也都是运营的重负。

当前的AI客服被无数人吐槽“人工”,本质上是因为它的“基础智能”不够强,无法在复杂的信息环境中准确识别客户意图。

因此,现有的大部分“智能机器人”只能算是一种迎宾手段,最终往往都要转到真人客服,它并不真正承担“客服”的职能。如果能让“智能客服”实用起来,就有机会实现销售环节“工业革命”式的技术跃进,当然目前这种“革命”才刚刚起步。

其次,客服是人与AI直接交流、高频互动的最重要场景之一,有机会挖掘出“人工智能”的巨大潜能。

比起GPT目前海阔天空的陪聊,AI客服在底层逻辑上是“带有指向性和功能性的GPT”,它在更具体的工作条件下,反复面对人们具体的关切和需求。

真正能处理好这些问题的AI,在某种意义上比现在侧重回答知识性问题,苏格拉底和哈耶克的GPT系列要更像一个人类。

平心而论,当前的“AI客服”依然是不完善的。“百炼杯”比赛让AI来“扮演”客人的想法很酷,不过AI和人毕竟是不一样,现实中难缠的客户,很可能在AI发出数百字产品介绍的时候就骂人或者转人工了……连查看加粗文字的耐性都不会有。在几组对话中,AI客服也都错过了一部分关键的信息点。

但是——正如参赛企业无一例外提到了智能体agent自我完善的问题——将AI客服置于复杂信息环境下,反复调用大模型进行多重检索、RAG输出和自我学习,其工作完成度无疑会越来越高。

对于阿里通义等大模型来说,这些基于具体场景的语料包,也都将是宝贵的财富,具体应用场景更精准、更有价值的信息,是真的能帮助大模型完成自我优化。

当大象放慢脚步甚至席地而坐,大模型这场“世纪之战”的过程可能会十分漫长。在企业级市场拥有更多红利的巨头,或许会帮助国产大模型在全球竞争中走得更远。

追加内容

本文作者可以追加内容哦 !