阿里云的这场比赛告诉我，大模型to B应用没有标准答案_财富号

作者 | 河马君

如果说2023年被称为“大模型元年”，2024就应该是“大模型应用元年”。

在这个“诸神战场”中，共识已经悄然改变，主要参与者纷纷转向优先落地而不是继续无休止地研发迭代。

一方面，小型化模型的应用正在稳步增长，“低代码（Low-code）”及“无代码（No-code）等开发理念广泛传播，成本概念在持续强化。

另一方面，具体应用场景得到了空前的重视，从谷歌生物声学基础模型HeAR，到支小宝，阅文妙笔等，研发者的注意力转向更具体、更专业的垂直领域；而B端市场同样齐头并进，试图更高效地探索产业大模型应用的实际落地路径。

一、大模型B端市场如何破局？或许始于一场场“实战竞赛”

大模型一个显著的新趋势，是B端市场得到了更多重视。

全球范围内，真正有意愿、有能力为AI付费的用户大多数集中在B端。根据IDC在2023年四季度的调研，对生成式AI完全没有规划的企业只有7%，也就是说超过九成的企业至少已经意识到了AI与未来的强关联；其中已编列明确预算的企业有24%，这才是当前AI付费的主力市场。

“落地”本就是中国互联网企业最擅长的部分，阿里、腾讯、百度都在探索基础的大模型服务平台。

巨头们已经意识到，或许未必需要躬身入局去走完模型商业落地的最后一公里，在B端建立起合作生态，由下游企业自行“炼成”符合需求的模型产品，能够最大限度地优化资源配置，而过程中积累的高质量数据，则可以反哺基础大模型开发，从而在长期竞争中为国产大模型赢得优势。

前几天，我正好在云栖大会现场体验了一场AI应用竞赛，从中也感受到B端市场大模型落地的一个关键——需要极度重视具体的业务场景。

据介绍，这场阿里云“百炼杯”智能好客服PK赛，是业界首个以企业实际落地场景效果为目标的AI应用系列开发赛，不只关注算法、结构、创意等技术性内容，将重点放在了真正的“具体场景”之中。

正如PK赛的宣传片所言：“‘创新’这个词，好像也不那么创新”，的确，传统的“创新大赛”往往更重视偏于“务虚”的问题。

过往纯粹比拼纸上商业蓝图或技术能力的一些竞赛方式，或许已经不再适应AI落地的需要。

以这场比赛为例，浩鲸科技、亚信科技、合力亿捷、云梦智能等8家业内经验丰富的企业基于阿里云“百炼”平台定制的智能客服，要在现场评委和观众面前接受顾客咨询。

这些“顾客”同样是由“百炼”平台生成的、具有不同性格特征的虚拟消费者，其中有话痨的大妈、爱美的都市丽人，它们有的关注锅盖的材质、有的要求针对自己的肤质推荐推荐护肤品……

这些考验是传统客服机器人无法处理的，甚至有时候真人客服面对这些五花八门的信息也大为头痛。

基于大模型技术打造的AI智能客服在接受考验时，不能漏掉消费者询问中的关键信息，还应当给出合理的、足够拟人化的回复。

“基于实战”，其实也给竞赛带来一个值得关注的新影响：参赛方案的优劣是很难像以往那样，100%标准化的。

或者说，参赛方案其实是在不同维度，去推动解决商业场景的实际问题。

各家的Agent智能体有自己的逻辑重点和“性格”，有的在输出时强调了多重索引后的数据精准性；有的看重对消费者情绪的安抚与“人文关怀”；有企业利用全流程云上原生应用大幅提高了AI客服的响应速度……这里可能没有“最强”的智能体，而是“最适合”的智能体。

而这种真正“最适合”的创新，往往正是诞生于实战之中的。

二、小切口、大智能——AI应用的法门是“大小联动”吗？

另一个令人感兴趣的市场趋势是，从各家企业一开始反馈的困难，到最后大家解决问题的思路，都说明在大模型实用落地的过程中，“大小联动”是极具可行性的技术思路。

参赛企业在Agent介绍中普遍提到的AI客服“炼制”难点，并不限于纯技术层面，而是与专业场景息息相关。

首先是，消费者的提问可能不那么标准化，会有需要结合上下文语境才能捕获的意思，有时还会出现简写和错别字。这就导致低代码环境下AI可能出现误读甚至出现“幻觉”。

其次是，AI客服的回答不仅需要智商，还需要有点“情商”，也就是高度拟人化。好的客服既需要给出足够精准的信息，还需要安抚顾客的情绪，举例而言，如果回答中出现长篇大论的数据描述，会让一些咨询者难以识读，心情烦躁，AI如何应对就很有趣了。

针对这些问题，不止一家企业的解决方案强调了大模型与小模型联动的作用。

首先通过小模型实现对提问信息的预处理，识别商品ID等关键信息，降低“致幻率”，更准确地识别客户意图。

然后分类调取知识库，通过API调用阿里通义高智能的基础大模型，完成prompt封装，实现RAG（一种检索外部知识库强化LLM生成的技术）信息输出。

“大小联动”通过小模型的预处理，优化了大模型的处理效率，实现了兼顾成本与效能。当然，低代码乃至“无代码”开发，同时也对大模型服务平台的易用性提出了考验，这可能是平台此前自己都没有意识到的。

我在现场看到的一个有趣小细节是，云蝠智能的技术主管表示，此次参赛的Agent智能体全程由他们的财务人员创造完成，现场阿里云“百炼”技术人员侧目：“我们的易用性这么强吗？”

此次大赛中，冠军云梦科技、亚军合力亿捷的Agent智能体方案，也正都是高代码与低代码混合的模式。基于企业自身的技术能力，他们的Agent智能体能够分辨公斤与市斤，也可以识读“黄二白”“混油皮”这样直男懵圈的护肤术语，展现了很强的实用性。

当然，参赛企业在方案选择上的多元性，本身也体现“百炼”平台的基础大模型服务很强的工具性和便捷性。

三、客服、搜索、生活服务……大模型对业务的变革初露端倪？

大模型B端应用的探索，其实反过来，对巨头的业务侧变革也带来全新的启发。

让B端客户可对应用场景拥有更多自主权，这对巨头们的大模型路线也是一个启发，实际上，在“百炼”的开放式结构中，阿里云也在重构自身的伙伴生态：放开末端权限，让中小型企业用更专业的数据炼制模型，阿里云则更专注地进行基础研发投入，提供软硬件服务，收获支撑AI开发的现金流和更专业精准的数据，最终来实现AIGC、智能客服、智能政务、智能分析等多元业态的链接。

大模型竞争中，业务基因和技术基因至少是同等重要的。阿里云之所以能汇集8家各自领域的知名企业参赛并产出扎实成果，根源还是其在企业级市场的平台服务上更具优势，阿里的“平台基因”起到了关键作用。

“百炼”并不是一个严格意义上从0到1的新物种，而是阿里一直以来to B优势基因的延续，通过服务商家来实现商业上确定无疑的“落地”，这显然是阿里的舒适区。

“AI+”提供了宽阔的想象空间，但“百炼”模型依然选择“从客服开始”，这也是个很有意思的现象。

“客服”在传统上属于职能或者说中台业务，但大模型时代，智能客服作为商家最高频、刚需的使用场景确实是一个极好的接入节点，甚至可能是业务变革的一个支点。

首先，需求确实庞大，不管是叱咤风云的头部主播，还是高大上的航天科技，在变现的最后一公里都需要与客户沟通细节问题。

将人力从繁冗的重复劳动中解放出来，本就是AI研发的初衷，对企业来说，人工客服的高成本和情绪上的不确定性，也都是运营的重负。

当前的AI客服被无数人吐槽“人工”，本质上是因为它的“基础智能”不够强，无法在复杂的信息环境中准确识别客户意图。

因此，现有的大部分“智能机器人”只能算是一种迎宾手段，最终往往都要转到真人客服，它并不真正承担“客服”的职能。如果能让“智能客服”实用起来，就有机会实现销售环节“工业革命”式的技术跃进，当然目前这种“革命”才刚刚起步。

其次，客服是人与AI直接交流、高频互动的最重要场景之一，有机会挖掘出“人工智能”的巨大潜能。

比起GPT目前海阔天空的陪聊，AI客服在底层逻辑上是“带有指向性和功能性的GPT”，它在更具体的工作条件下，反复面对人们具体的关切和需求。

真正能处理好这些问题的AI，在某种意义上比现在侧重回答知识性问题，苏格拉底和哈耶克的GPT系列要更像一个人类。

平心而论，当前的“AI客服”依然是不完善的。“百炼杯”比赛让AI来“扮演”客人的想法很酷，不过AI和人毕竟是不一样，现实中难缠的客户，很可能在AI发出数百字产品介绍的时候就骂人或者转人工了……连查看加粗文字的耐性都不会有。在几组对话中，AI客服也都错过了一部分关键的信息点。

但是——正如参赛企业无一例外提到了智能体agent自我完善的问题——将AI客服置于复杂信息环境下，反复调用大模型进行多重检索、RAG输出和自我学习，其工作完成度无疑会越来越高。

对于阿里通义等大模型来说，这些基于具体场景的语料包，也都将是宝贵的财富，具体应用场景更精准、更有价值的信息，是真的能帮助大模型完成自我优化。

当大象放慢脚步甚至席地而坐，大模型这场“世纪之战”的过程可能会十分漫长。在企业级市场拥有更多红利的巨头，或许会帮助国产大模型在全球竞争中走得更远。

追加内容

本文作者可以追加内容哦 !

总收益	20日收益	日收益
--	--	--

代码	名称	最新价	涨跌幅
查看更多

最新操作
-	-	-