在产业技术革命的浪潮中,追随者芸芸,敢为先行者却寥若晨星,王卓隽正是这片蛮荒之地的开拓者之一。作为阿里巴巴1688产业智联和AI创新应用技术高级总监,他曾推动1688运营数据化和智能化从0到1的平台建设,实现1688电商内容化的算法及工程架构升级,也孵化了平台的第一代终端智能交互技术产品。
近年来,王卓隽在产业互联网和AI技术的交汇点上进行着深入的研究和实践。他同1688产业智联团队与AI创新技术团队致力于通过大模型技术,帮助B2B用户提升采购体验、商家提效率降本,并逐步推动产业链的智能化改造。8月12日,1688刚刚发布面向产业带源头厂商的免费“AI经营助理”,通过提供自主经营和供货托管两种模式,帮助商家获得更多供货线索、应用智能工具,促涨销量、降低成本。
王卓隽认为,产业互联网不仅是一个在线交易履约的平台,更是一个融合了仓储物流、加工定制服务等多维度的综合服务平台,是未来中国产业经济高质量发展的关键所在。产业互联网和AI新技术的结合将成为新一轮产业革命的核心驱动力。
近期,新质汇在产业AI企业系列专访中与王卓隽先生进行了深入对话,探讨了1688在产业AI技术探索与实践中的最新进展和成果,以及推进AI技术落地时面临的诸多挑战与解决方案。
王卓隽主要观点如下:
在产业互联网领域,大模型主要被用于新型场景的推理应用,同时伴随着对存量产品的提效优化。
生成式AI在产业内的应用面临四大难点:数据质量、计算成本、人才储备和数据联通。
数据安全和质量是AI应用的关键,企业应通过数据统一脱敏和分级策略确保数据精准度。
1688平台通过在商家侧与用户侧两端利用AI技术进行赋能,在商家侧提供从工具到全托管模式的AI解决方案,在用户侧通过优化搜索引擎和推荐系统提供更精准的用户体验。
用大模型蒸馏的小模型在特定场景下提供了成本效益更高的AI定向解决方案,且支持快速迭代和大规模调用,企业可以通过“大训小”布局具体场景。
大模型具备的泛化能力为企业拓展了新的产品能力边界,经过备案后的大模型应用,平台经许可以开放灰度体验并与用户共建新产品。
在产业互联网中,大模型有潜力更大范围的联结产业链,实现从生产到消费的全流程数字化。
“数据质量、算力成本、人才储备、数据联通四大难点需要逐一打通”
新质汇:您觉得目前AI技术在产业互联网领域的应用处于什么阶段?跟传统产业的结合的难点在哪里?
王卓隽:现在整个大模型技术发展迭代大概有一年半到两年左右时间。从目前来看,以在线推理和新型交互表达方式为代表的AI技术应用还处于初期的探索阶段,当前主体还是用于对存量应用的提效优化。
例如,有些产品并非完全依赖于大模型,但我们通过大模型重新构建了其部分功能,比如利用大模型进行知识图谱的重构,或在特定的用户场景中,通过大模型改写用户的检索词,这些应用大致还处于初级阶段。
目前,生成式AI与业务结合的难点主要集中在以下四个方面:
首先是数据质量问题。大语言模型高度依赖高质量的数据,而从通用大模型中难以获得这种数据。我们的私有平台数据和用户基础数据多为非完全结构化和异构型数据,这些数据不经过有效处理,是难以达到AI应用所需的标准化水平。
例如,之前的互联网产品设计上线后,它的产品结果是确定性可被预测的。但接入大模型技术后,会出现推理出来的结果有80%高度符合用户预期,其余20%无法实际可用。而对于完整的产品功能需要保证每个用户都可用,这个现象就是数据不精准或缺失导致的,这对产品上线的效果产生了较大的制约。
其次是算力成本。第一, 国内处在一个都很缺显卡资源的困境,这导致计算成本显著性增加,且计算量较低。在应用微调后的基础大模型时,需要我们用离线推理去做大数据集的处理,以及生成内容,这些都需要耗费极大的算力资源。
第二,大模型在实际应用中常因数据规模和模型本身效果原因,导致最终生成结果时出现效果的折损,这就需要企业在成本和效果之间找到平衡。
第三是人才储备。 AI时代对产业和技术人才提出了新要求,原来的产品流程是有了业务设计之后,由技术去提供工程架构的解决方案。而现在,大模型的出现推翻了原来由产品方案到技术实现的上下游关系。团队需要基于新的技术能力去推动产品创新和优化。
这就需要技术团队能够看清现有产品体系整体逻辑,有哪些关键能力是可以用大模型突破的?而当前在技术和产品结合的复合型人才方面存在显著缺口。正因如此,我们的技术团队正在补充和培育有AI技术基础和产品思维的综合性人才。
第四,产业链上下游数据联通的挑战。产业互联网要深入发展,这一环节必须要打破。从消费侧到供给侧再到生产协同侧,数据的链路分散在不同的系统中,需要由平台设计一套完整价值链的方案,来推动数据飞轮的转动。同时目前的大模型技术尚无法直接提供统一的解决方案。当下仍是一个行业性难题,需要进一步探索和解决。
例如,在消费互联网中,一个搜索推荐场景能覆盖掉几亿用户和对应匹配几亿的商品,之间的连接可以用一整套算法解决。但在产业互联网里面,每个行业都存在链路差异性,没有统一的技术方案。所以在技术应用选择上,需要考虑一个最大公约数去覆盖整体产业链的最大受益面去切入。
新质汇:在解决这些问题的过程中,1688采取了哪些措施?
王卓隽:首先在战略层面上,我们确定了“用户为先,AI驱动”的大战略,并通过组织设计整体规划了AI研发的部门和联合机制,再去分阶段落地AI应用。
1688的AI团队一方面,专注于开发和实验AI原生能力,团队中包括产品设计、大模型算法和新研发工程,以便于在技术实践的过程中进行敏捷迭代。另一方面,聚焦AI在大部门应用中的合作专项推动。当我们提供了新的大模型推理能力时,并用新研发平台实现数据的快速回收和效果测评后,前端业务可以快速切换新能力上线。
在数据层面上,首要优先级是确保数据安全性,所使用的数据需经过严格脱敏处理。在此之上,我们使用的各种非结构化数据,比如图片中的信息必须都能够被解析出来,这是数据基础。其次,我们会对数据的质量和相关性进行分级,这个分级有明确的度量方式和应用逻辑。
通常情况下,用户意图来自他们的搜索词、关注的问题以及提交的兴趣偏好。为了提升模型的准确性,我们需要将这些先手逻辑与平台的后验结果进行对齐,所有的匹配逻辑在被验证效果良好或分离差异后,我们会根据不同行业对数据进行微调,以确保后验结果的逻辑更加鲜明。这是一个持续迭代的过程,需要长周期积累,形成一个完整的循环链路。
对于AI运营策略,是整个电商领域中具有决策属性和运营沉淀的核心能力。之前,我们将其称为平台机制,包括几个关键步骤:首先是用户需求洞察,然后是制定运营逻辑策略,最后是执行策略过程,其中很多内容已经被数据化和自动化。
在最新的AI能力下,我们通过模型进行数据挖掘和逻辑判断,识别哪些策略可以自动执行,从而部分替代了人工决策的过程,并慢慢慢慢补齐模型的思维链。将洞察到归因再到策略执行的过程半AI化。让AI作为先手,运营团队辅助配合,共同制定行业增长策略和目标人群活跃策略。
“1688利用AI简化生意模式,助力商家提效降本”
新质汇:1688是如何将AI技术融入到业务流程中的?有哪些具体应用场景?
王卓隽:在业务端,我们根据AI技术的应用场景,将其划分为几个大板块:用户导购、商家经营助手、运营决策和销售助手。
用户导购侧致力于提升买家的交互和体验;商家经营助手则为商家提供工具化服务,比如商品智能发布、广告动态投放、营销活动托管;运营决策模块帮助平台小二制定更有效的策略;而销售助手则帮助销售团队与商家更好服务,协同平台营销活动和商业化机制。
商家侧,我们会给商家一套自运营的AI工具体系,包括快速发品、流量投放、营销报名等。在一些平台的类自营和全托管模式中,AI自动化整包了内容优化、流量投放、询盘服务等核心能力。
第一,商家在发布产品过程中,通过AI优化主图、细节图、商详描述,并自动生成视频和挂载商品类目属性。这些操作都是商家无感完成的,大大降低了运营成本。过去,商家需要投入大量人力资源进行商品管理和线上服务,现在AI极大地简化了此过程。
第二,平台可以托管仓储和配送环节。在供应链管理方面,AI可以根据需求预测和库存管理,同时实现一些增量如线上定制、贴牌换标的供应链能力拓展和成本优化管理。
第三,平台还引入了智能客服系统,从简单的客户咨询到复杂的售后服务,逐步实现智能化。商家不再需要关心客服和售后问题,平台的智能化能力可以处理所有的客户服务需求。平台从托管内容到托管商品发布和运营,再到售后服务,全面实现了标准化集成能力。
“未来AI与产业结合的两大趋势:双轨制与小模型”
新质汇:您认为未来AI与产业结合的发展有哪些趋势?
王卓隽:未来AI与产业结合的发展方向可能采取双轨制,一条路径从企业内部优化,另一条从流通平台侧提升。最终在某些领域形成现代化的产业链升级模式,实现企业内部的生产制造、经营调度、采购到线上消费互联网的全链路连接。
目前来看,在模型的实际应用过程中,大多数企业的应用尽量不依赖于当前大模型能力的上限,这样可确保这些应用模式能够在更多场景中先被验证。通用大模型的训练和调用成本还在高位,在具体场景中并不是都需要如此强大的能力。为了降低成本并更好地适应具体场景,许多AI应用正在向蒸馏小模型进行尝试探索。
根据我们的判断,模型的应用主要分为几个程度:首先是预训练。这通常由基础团队完成,比如阿里系的通义大模型,该模型有多个版本,如多模态版本和大尺寸版本(如72B、110B),一般应用方不太会接触;接下来是模型的监督微调工作。这部分对基础模型依赖度较高,微调之后,如果模型版本升级,该工作需要重新适配,这一过程不稳定且成本高,适合在一些定向端到端的应用场景。
大多数实际应用中,我们使用模型结合检索增强生成(RAG)+Prompt优化的方式。因为它的泛化应用能力最好,维护成本较低。此外,针对特定场景如销售语音助理,使用微调后的大模型来解决定向技术难题。对于离线数据的构建,由于数据规模庞大,标准大模型的运算效率难以满足需求。我们用大模型蒸馏小尺寸高性能模型,以实现规模生产和更低成本(部分从GPU转到了CPU的消耗)。
这种小模型适用于特定任务,如用户意图判定和商品信息处理,可以在客户端侧内置,通过终端推理提升响应和降低资源开销。未来,小模型在特定功能集上有广泛的应用前景。AI模型应用的策略从全局大模型到局部小模型,逐步精细化和场景化,是目前我们在业务应用中的核心策略。
新质汇:目前国内从政策方面大力支持各行各业都对大模型算法的应用,在鼓励的同时,监管也在加强。2002年10月,1688有三个算法已经通过国家网信办备案,您认为企业在大模型技术的合规方面有哪些要注意的点?
王卓隽:大模型发挥作用需要一个调试放量过程。在备案之后,我们可以比较安全的在线上去做一些小规模的灰度验证。同时可以与核心用户群去做产品共建,大家一起探讨方案,加快产品上线的进展。
新质汇:1688在产业AI应用方面,下一步的计划是什么?长期目标是什么?
王卓隽:首先,AI是一种通用技术,并不局限于互联网或某个垂直领域。即使在非互联网领域,企业也可以利用AI技术进行数据加工和功能优化,实现企业转型和效率提升。因此,AI被认为是一种“泛技术”,在通用工业领域能够产生广泛的影响。
其次,在消费互联网领域,AI技术目前主流应用于优化现有产品的效率和精度,并不绝对应用在新产品。在现有AI技术逐渐成熟的背景下,AI的应用场景慢慢从挖掘数据和完善知识图谱的基础上,走向用户需求的精准匹配上(下一代搜索引擎)
再说下一个阶段产业互联网,其背后的产业链复杂多变,涉及生产、设计和营销、物流等多个环节,传统AI技术难以解决这些领域中异构数据和领域差异性的问题。未来的AI技术,特别是大模型具备完整自动生成代码的能力,有望打破这些限制,让系统可以快速联通,使多个领域能够快速被AI覆盖。
下一步,1688希望将消费互联网与产业互联网业务深度结合。在供应链管理方面,通过数据大范围联通可以从需求侧反向推动供应链优化,精准预测市场需求,实现小单快返、以需定产的平台能力,减少产能过剩和供需能力不匹配的问题。通过AI技术提升用户采购的深度需求匹配,在消费互联网中和商家共建更先进的供给服务能力,并在产业互联网中打造更高效的数字化供应链系统。
本文作者可以追加内容哦 !