最近AI产业出现了新的风向标:小模型正在积极爆发。

在ChatGPT横空出世后的一段时间内,业内严格遵循Scaling Law(规律定律),即更大参数、更大数据和更强算力才能够收获更好的模型智能。

但最近“大力出奇迹”的理念正在转变,海外巨头例如Mistral、Deepseek、微软、Meta、Google争相推出了一系列小巧但功能强大的小模型,甚至连Scaling Law的提出者OpenAI都杀入小模型赛场,发布了轻量版GPT-4o mini。

种种迹象显示,AI赛道的竞争格局正在重塑,那就是大模型不再是唯一,而只是AI产业的组成部分,越来越多的小模型、专用模型以及行业定制模型正在崭露头角,它们将与大模型互补结合,对外输出更加智能化的解决方案。

轻量版模型风起时

小模型集体涌现的一大背景是海内外市场竞相掀起的模型价格战,甚至将API调用的价格卷至“白菜价”。激烈的商业竞争下,模型在性能提升之余,需要更加考虑性价比、更加侧重轻巧化落地,从这个角度来说,针对不同的应用场景,将模型参数做小、做精几乎是种必然。

“大模型竞争会加剧‘倒退’至小尺寸,一些非常小的模型思考能力也会非常好且可靠。”曾参与创办OpenAI的AI大牛Andrej Karpathy如此表示。

国内市场也不乏轻量版模型布局者,比如阿里、商汤、科大讯飞、百融云创等等。作为一站式服务的AI科技领航者,百融云创(百融云-W,6608.HK)在百模大战交锋正酣之时便提出重要的是寻求算力参数、用户意图与实时反馈之间的平衡,需要警惕陷入“博算力”的误区。

同时,百融云创也是为数不多的坚定推进“模型应用一体化”布局的AI科技公司。2023年,该公司将AI软件栈与开发工具栈进行深度整合,搭建形成的AI大模型全栈开发体系覆盖从模型预训练、微调、对齐到部署工程优化等环节,极大地压缩了模型的训练、迭代和推理成本。

在这一全栈开发体系下,百融云创搭建了大模型(BR-LLMs)的应用一站式开发平台——Cybertron(赛博坦),并将大模型与RAG(检索增强生成)等技术相结合,对外以Agent、Copilot形式落地到金融、出行、租赁、物流等多个垂直场景中。

百融云创AI创新负责人认为,并不是所有的应用场景都需要非常强大的模型,某些特定场景比如绿色项目鉴定、智能单据识别等情形,并不依赖庞大复杂的模型结构,更加需要的是借助大模型帮助实现精准化文本解析、信息抽取和语义匹配,由此可以借助Cybertron平台的“知识库”来优化模型,从而求取模型性能与成本效益之间的最优性价比。

除了成本平衡约束,小模型的崛起还与大模型端侧化落地趋势相关,因小模型可以更好适配终端算力受限的场景。比如微软把Phi-3系列模型中的3.8B mini版直接装进了苹果A16芯片的手机里,使其可以在Phone 15上运行。另外,Google Gemini系列中的Nano已经在Pixel 8 Pro和三星Galaxy S24上实现部署。机构推测,OpenAI未来推出的GPT-5极有可能是端侧的小参数模型版本。

基于端云协同战略方向,百融云创也在发力将智能语音、多模态等技术集成到端侧,除了在布局参数量较大的2D与3D数字人Avatar之外,也在开发高效、耗的端侧小模型,以应用于手机、车载等智能终端。

未来是混合AI的时代

从技术上来说,轻量级模型参数虽小,但要实现有限算力下的超强性能门槛并不低,需要大量的训练数据投入、模型优化及对于硬件的有效利用等等。

以百融云创的智能语音机器人(Voice-GPT)来说,该产品基于Transformer架构,内置了FreeSWITCH(软交换)、ASR(自动语音识别)、TTS(文字转语音)、NLP(自然语言处理)等技术,自2018年推出以来持续赋能商业机构存量焕活、新客运营等。目前其在音色、情感、语速、对话层面百融云创能够提供“真人级”的互动体验,同时对客户语音识别的准确率能达到99%以上。

上述性能的实现除因百融云创在语音识别、语音理解等通用技术领域的沉淀之外,还得益于其自主研发的一种语音质检分析方法及系统。该质检系统在精确捕捉客户意向、交互情绪之后,会自动反馈生成可视化报告,“反哺”模型优化升级。以百融云创与某国有银行合作为例,通过将Voice-GPT嵌入银行的零售业务线,相比人工工况,可节省约90%的运营成本。

值得注意的是,百融云创还借势决策式AI的力量来增益大模型性能。财报显示,在2023年,该公司共上线了300余个小模型,其中针对用户画像分析、个性化推荐等蕴含决策式AI技术的小模型可以增强模型间的互补性,提高对于不同应用场景的适配度。

在百融云创看来,单一模型无法解决垂直行业的所有问题,需要的是多模型、多元化的AI技术组合拳。以大模型为基座,将其与成熟的小模型结合,再加上充分的行业Know-How,可以提升整个数智系统的成熟度和性价比,从而跑通大模型应用的PMF,构筑起更加坚固的护城河。

以百融云创帮助金融机构搭建的“一站式绿色金融解决方案”为例,该方案的底层技术包含机器学习、深度学习、OCR、模糊匹配等,在此基础上搭建的工具层中,既包含模型套件,还有流程引擎、报表工具等,大模型只是其中一个组成模块,通过模型间的互补增强,整个AI解决方案打开的是包括绿色项目识别认定、环境效益测算、绿色客户管理等十余个应用场景。

“未来,模型应用的发展趋势将呈现大模型与小模型相结合的特点,同时,机器学习平台将致力于开发更多的大模型组件、工具链,构建开闭源模型生态,并与底层算力资源进行紧密绑定。”艾瑞咨询在报告中如此表示。


追加内容

本文作者可以追加内容哦 !