1月7日,吉利亮相2025国际消费电子展 (CES),并发布了行业首个“智能汽车全域AI”技术体系。其覆盖C端消费者、B端企业服务以及空天地一体的智能生态。吉利致力于成为汽车AI科技的普及者,打造有温度、有情感、可持续成长的原生“出行智慧生命体”。

2025CES影视飓风Tim现场对话吉利汽车集团副总裁吉利汽车研究院院长李传海及吉利汽车研究院首席人工智能科学家陈勇,深度解答吉利在智能汽车AI领域的技术布局。

01

“硅碳共生”的时代,终将到来!

Tim:具身智能应该有哪些特质?

李传海:具身智能可以感知多模态信息,具有长短期记忆和推理决策能力,还可以深度理解情感与表达情感,完成“感知-记忆-决策-执行”的端到端闭环。目前的智能汽车,已经具备了具身智能的雏形。

Tim:汽车行业正逐步往具身智能的方向迈进?

李传海:是的,汽车发展具身智能在传感器数量、电池能源储备等“本体”方面具有天然优势,大模型则补齐了“大脑(智能)的短板。

未来,通过“本体+智能”的不断迭代,智能汽车将成为具身智能的重要形态之一,未来将成为有温度、有情感的“出行智慧生命体”。“硅碳共生”的时代,终将到来!

02

打造原生的出行智慧生命体

Tim:要成为有温度有情感的生命体,智能汽车会经历怎样的发展过程?

李传海:

要走向“出行智慧生命体”,我觉得应该经历三个阶段:

第一个阶段是智能助手。汽车能够辅助完成任务及指令,实现精准响应。例如银河E5搭载的上帝之眼540透明底盘,AI心跳拟合技术,银河星舰7搭载的“星睿AI云动力”,可以通过AI实现全后寻优的智能决策,实现高速用油、低速用电

第二个阶段是智能体。基于多模感知,利用思维链COT,提升复杂决策的推理能力,成为一个能够理解环境、自动完成任务的汽车智能体。比如,应对更复杂情况的自主挪车、泊车功能。

第三个阶段是生命体。智能汽车可以洞察需求,自主任务规划.自主推理、自主执行,同时它具备自我意识,甚至自主情感能力。此时,车就是一个有温度、有情感、可持续成长的生命体融入到我们的日常生活中。

Tim:吉利在人工智能方面做了哪些部署?

李传海:

大家都知道人工智能的核心三要素:算力、数据和算法。

算力方面:吉利2021年就规划建设了智算中心,2022年就建成了行业首个云数智一体的超级智算中心,并投入使用,也完成了行业首个智能计算中心管理流程的认证

我们很早就预测到,大模型对训练资源有巨大需求,所以在2023年初就已经开始测试并使用国产GPU。作为吉利造车的数字新基建,星睿智算中心,让银河E5、星舰7、星愿等产品,有了更智能化的体验。

我们在算法模型方面也取得了一系列发展成果。2022年,吉利发布了首个汽车行业大模型:2023年,完成研发的全场景星睿AI大模型,获得了中国信通院4+级能力认证,这也是行业的超高水平。

2024年,我们发布了行业首个基于离散token的情感语音合成大模型,实现零样本、文字转语音、分层声学建模,在发音准确性、在自然度和说话人相似度方面,风格、音调的一致性等,得分比之前的SOTA模型提升了10%,这也将在车型上搭载。

此外,在研发多模态大模型、全因意图理解大模型、端到端大模型、端侧大模型,以及混合云加速推理框架等领域,吉利也在持续深耕基础技术的研究。

Tim:除了大模型,我看到吉利也在推动数据平台和行业标准建设。

李传海:是的,数据是驱动AI模型产品迭代的核心燃料,决定了模型认知的能力上限。吉利已经构建了10T的token数据、40B的汽车领域垂类数据,并建成了合成数据平台,为大模型训练准备了核心燃料。

行业标准建设方面:吉利积极参与推动行业大模型标准规范的制定,牵头编写了汽车大模型标准、汽车智能体标准、智能体标准,还牵头制定了智能体的技术要求和评估方法。

一个企业的核心竞争力除了产品竞争力,还包括组织竞争力。2023年,吉利开始研发企业智能体,第二年,就推出了星睿智能体平台,打造数字员工,提升整体的设计质量和开发效率。

关于AI技术的融合与应用,吉利规划了覆盖C端消费者、B端企业服务以及空天地一体的智能生态,形成了“全域AI技术”体系。人工智能时代,吉利就是要基于AI原生OS,构建“全域AI”的技术体系,打造原生的出行智慧生命体。

 03

AI情感觉醒,汽车有生命体特征

Tim:“全因意图理解模型”有哪些技术创新点?

陈勇:吉利研发的行业首个全因意图理解大模型,可融合用户画像,车辆状态,视觉、语音等全因素信息,对用户需求进行全方位的理解。比如下雨天可综合判断是否要帮我停车,应该怎么停,实现自主个性化服务。这就初步实现了第二个阶段的智能体,真正开始像人一样“思考”用户的潜在需求,会推理、会执行。

Tim:端到端的语音大模型可以给用户带来哪些体验? 能够像人样有情感、表达情感吗 ?

陈勇:目前语音是传统级联式的,是标准的文本翻译,会丢失语音的语调、情感信息。我们研发的端到端语音大模型,融合多模信息进行语义空间对齐,构建了一个基于有监督分层情感token和decoder-only相结合的端到端语音大模型,保证了模型对情感的感知能力。

多模态端到端的语音大模型,正在革新“人机交互”的体验让汽车开始有生命体特征了。

Tim:大模型的涌现离不开数据,这方面吉利有哪些研究?

陈勇:人工智能产品和模型,需要高质量数据的不断迭代。算法关心的是数据量、数据质量以及数据分布。

2021年,吉利就开始研究基于多模态世界模型,我们引入几何先验知识与3D高斯泼溅等技术,通过videodecoder模型推理道路的语义信息 (如道路结构,交通流等),可以生成各种各样的场景,如雨雪天气、拥堵路况、立体车库等等,实现交通场景的无限泛化生成。

追加内容

本文作者可以追加内容哦 !