AI 定义汽车时代,商汤绝影可谓「家里有矿」,赢在了起跑线。
背靠商汤科技这棵大树,可汲取的算力养分高达 20 EFLOPS。
一个直观对比是,目前蔚小理三家新势力公布的算力数据总和,还不到 10 EFLOPS。
充沛的算力资源,让商汤绝影拥有对 AI 的率先领悟力。
2023 年,商汤绝影拿下了 CVPR 论文奖,提出了行业首个感知决策一体化自动驾驶通用模型 UniAD,在端到端浪潮下拿到了首批船票。
目前商汤绝影的智驾方案,上车了 3 家车企,6 款车型。而占领技术高地的端到端方案,明年四季度将迎来落地。
与此同时,为获得更多确定性筹码,商汤绝影把技术创新的步子迈的更大,更深,从数据驱动的底层逻辑出发,把战场从车端扩大到云端——世界模型"开悟",将成为商汤绝影的新底牌。
大模型玩家再出招,世界模型"开悟"
在残酷的智能化竞争场域,量产一直是关键竞速尺度,商汤绝影需要尽快从其它层面补齐差距。开拓产品矩阵成为商汤绝影的新思路,新底牌是——世界模型
事实上,商汤绝影背靠强大的大模型体系,为世界模型的诞生提供了丰沃土壤。
商汤科技的「日日新」大模型,涵盖大语言模型、文生图模型、多模态模型等多种能力,并在尺度定律下快速迭代,综合能力已经可以对标 GPT-4 Turbo。
商汤绝影基于这套大模型体系,已经衍生出了丰富的汽车智能化产品。
比如新推出的智能座舱创新产品——A New Member For U,亮点是让智能座舱跳出了「工具人」的框架,变成了会察言观色,主动提供情绪价值与服务的「贾维斯」。
而在智能驾驶层面,商汤绝影把触角延伸至端到端的数据驱动逻辑上。
商汤绝影 CEO 王晓刚表示,数据驱动模式需要建设完善的数据闭环,打造强大的数据基础设施,更低成本、更高效的生产数据是竞争获胜关键。
由此,商汤绝影探索出一条新路,通过实车采集与仿真生成「双轮驱动」的数据闭环,打造出世界模型「开悟」。
一方面,基于真实采集数据,「开悟」可以完成数据泛化,生成大量高质量场景,包括稀有标志牌、施工场景等极端场景;
另一方面,模型可以在「开悟」中完成自车与他车,环境交互的闭环仿真训练。
一个重要数据是,基于一张 A100 GPU 打造的「开悟」世界模型,平均每天生成 2 万个场景,相当于 100 台路测车数据采集能力,及 500 台量产车的效率。
当然,降本增效的前提是「开悟」生成的场景足够真实、准确。
曾有业内人士认为,采用世界模型生成式数据比较粗糙,代替不了真实世界,只能作为辅助性工具使用。
而「开悟」攻克了世界模型的难点、痛点,能够理解真实世界的物理规则、交通规则,生成的的场景视频,最长为 150 秒,分辨率高达 1080P。
另一个维度是时空一致性,在行业内都输出 1V、6V 视角视频时,「开悟」直接挑战最高难度,生成 11V 多视角时空一致的高信息密度视频。
此外,强大的泛化能力,让「开悟」能够定制长尾场景,精准改变天气、交通要素,目前场景集覆盖的各类天气、光照条件、道路类型的场景种类高达 1024 类,构建千万级场景库。
王晓刚表示,目前商汤绝影数据采集过程中,20% 的数据由「开悟」生成,未来这个比例可以达到 80%。
显然,「开悟」世界模型对端到端玩家而言,是一项面向未来的提质生产力工具,商汤绝影放出这个大招,意味着率先预定了未来竞争场的入场券。
目前,围绕高阶智驾量产、端到端量产、AI 云服务、AI 大模型等产品维度,商汤绝影已经与奇瑞大卓智能、东风岚图智驾建立了紧密的战略合作关系。
奇瑞大卓智能 CEO 谷俊丽表示,奇瑞全球用户高达 1510 万,覆盖全球 100 个国家,当下 AI 战等于资源战,数据就是流动的黄金。
这其中,商汤绝影扮演了重要的赋能者角色。
本文作者可以追加内容哦 !