在AI产业谈论数据资产时,市场往往习惯性地问"有多少TB、多少亿条"。但对卓越睿新(02687.HK)而言,数据的真正价值需要兼具的不仅在于"量",更在于"质"——尤其是,数据能否完整记录人类专家的认知过程。
多模态不仅是形式,更是认知的还原
公司近二十年沉淀的数据资产,覆盖了文字、图片、音频、视频及实验场景。其中,视频数据尤其值得单独审视。与静态图片或碎片化文本不同,视频天然承载着"慢思考"过程:一位资深教授推导公式时的停顿、纠正思路时的转折、验证结论时的反复——这些微妙的时间维度信息,是图片和文字难以完整保留的。
数亿分钟的教学与科研视频,因此成为一种极为稀缺的"过程性数据"。它们记录的不仅是"结论是什么",更是"结论如何被抵达"。对于训练垂类模型而言,这种带有完整逻辑链条的数据,比单纯的正向结果语料更具价值,因为它让模型得以学习"专家是怎么想的",而不只是"专家说了什么"。
专家推理数据:从"知识库"到"认知库"
更进一步,卓越睿新的结构化知识单元背后,附着完整的专家思维过程:知识定义的边界如何划定,推导过程遵循怎样的学科逻辑,历史上出现过哪些典型错误与纠错路径。这种"专家推理数据"与文字内容建立了精确的语义对应关系。
这意味着,公司的数据资产本质上不是静态的"知识库",而是动态的"认知库"——它包含了知识生产的全过程记录,包括反思、修正与验证。对于投资者而言,这种数据壁垒的稀缺性在于:它无法通过爬虫或采购快速获得,只能在长期与高校共生共建的过程中,一年一年、一步一步地沉淀。
数据飞轮:越服务,越值钱
更关键的是,这些数据并非一次性投入,而是自我生长的。每一次服务交互,都在产生新的学习行为数据、教学反馈数据与场景验证数据,回流至知识资产层,进一步强化模型的精准度。这是一个典型的"越服务、越沉淀、越值钱"的飞轮。
这套独特的数据体系,搭建起了完整的专家认知传递链条。传统大模型依靠通用网络语料训练,只懂表层信息,极易出现专业幻觉;而我们的模型依托带因果逻辑、反思机制的多模态推理数据训练,能够精准承接高等教育、科研场景的复杂知识,实现严谨、精准的专业输出。
AI企业的核心竞争力终会回归数据质量。卓越睿新以视频为核心的多模态专家推理数据,打破了行业同质化竞争,让模型能力从“泛化适配”走向“专业精准”,为后续智能体落地、商业化变现提供了坚实的底层支撑,也是公司长期领跑垂类AI赛道的核心护城河。
本文作者可以追加内容哦 !