AI 定义汽车时代,商汤绝影可谓「家里有矿」,赢在了起跑线。
背靠商汤科技这棵大树,可汲取的算力养分高达 20 EFLOPS。
一个直观对比是,目前蔚小理三家新势力公布的算力数据总和,还不到 10 EFLOPS。
充沛的算力资源,让商汤绝影拥有对 AI 的率先领悟力。
2023 年,商汤绝影拿下了 CVPR 论文奖,提出了行业首个感知决策一体化自动驾驶通用模型 UniAD,在端到端浪潮下拿到了首批船票。
目前商汤绝影的智驾方案,上车了 3 家车企,6 款车型。而占领技术高地的端到端方案,明年四季度将迎来落地。
与此同时,为获得更多确定性筹码,商汤绝影把技术创新的步子迈的更大,更深,从数据驱动的底层逻辑出发,把战场从车端扩大到云端——世界模型「开悟」,或将成为商汤绝影的新底牌。
01、AI 叠 buff:纯视觉、端到端、L3
秉持 AI 基因,商汤绝影的智驾之路开局顺利。
2017 年夏天,商汤绝影仅用两颗摄像头的纯视觉方案,就完成了本田的暴雨天气智驾测试,就此开启了方案商的征途。
得益于坚实的算力基础,商汤绝影的智驾方案接连在广汽埃安 LX Plus、哪咤 S、昊铂 GT 等车型上落地。
但行业内卷的「价格战」压力下,方案商还需要在产品力上加大力度。
这次,商汤绝影选择攻坚「性价比」,最新推出了中高阶智驾方案,把性价比做到极致:
AD Pro,基于地平线 J6E 芯片,算力最高达 80TOPS,搭载 7 个摄像头、多个雷达,支持高速领航、记忆行车、记忆泊车;
AD Max,基于地平线 J6M 芯片,算力最高达 200TOPS,搭载 11 个摄像头、多个雷达,支持高速领航、城区领航、记忆行车、记忆泊车。
据介绍,采用高性价比计算芯片,搭载低成本传感器,让这两套智驾方案在价格上拥有高竞争力,比如 AD Max,成本可以做到 5000 元左右。
一个直接对比是,卓驭智驾的 7V+100TOPS 的对标城区智驾方案,成本来到了 7000 元。
在落地上,商汤绝影这两套方案都将在明年二季度落地。包括新推出的端到端智驾方案 AD Ultra,商汤绝影宣称「极致体验」,也将在 10 个月后与用户见面。
正是这样,商汤绝影决定把胜算攥到下一个赛段。
实际上,在 UniAD 获得 2022 年 CVPR 最佳论文时,就意味着商汤绝影对端到端具备绝对发言权。
这两年,端到端热词席卷智能驾驶宇宙,在行业还在为端到端定义、技术分歧、真假端到端争论不休时,商汤绝影喊出了「真·一段式端到端」的口号。
现在,这个声音逐渐获得了业内共振。
Momenta 创始人曹旭东曾表示,一段式端到端比两段式端到端优势明显,两段式端到端由于感知与规控端到端分段,感知对于落石、水坑等障碍物容易误判,而一段式端到端可以提前学习未定义物体,有效处理更复杂的极端情况。
但他也强调,一段式端到端上限高但研发挑战大,对于算力、数据量要求更高,Momenta 已经从两段式端到端转向了一段式端到端落地。
目前,行业不少玩家都将一段式端到端视为两段式端到端的进阶状态。
这么看,商汤绝影掌握了技术先机,对 AD Ultra 寄予了厚望。
这是其首创的端到端+纯视觉高阶智驾方案,搭载了 NVIDIA DRIVE Thor/Orin 芯片,仅需 1 个毫米波雷达和 11 个摄像头,就能够实现一段式端到端智驾,提供「类人」驾驶体验。
据商汤绝影一位产品经理介绍,点到点领航智驾相当于现在智驾第一梯队主推的「车位到车位」功能,可以保证智驾场景的全覆盖。
另外一点是,AD Ultra 会更偏向于与 Thor 做适配,如果从竞争维度考虑,在目前其它玩家搭载 Orin 方案已经成熟的阶段,商汤绝影选择算力更大的 Thor,意味着能领先一步走,从性能上补齐时间差。
能看到的是,AD Ultra 已经把上限做到了 L3 级,基于这种高阶方案,或许可以在未来给商汤绝影带来更多胜算。
可见,基于浓重的 AI 底色,商汤绝影从纯视觉方案步入端到端技术路径,现在,又通过端到端叩开 L3 的大门,稳扎稳打下,商汤绝影走上新台阶。
02、大模型玩家再出招,世界模型「开悟」
在残酷的智能化竞争场域,量产一直是关键竞速尺度,商汤绝影需要尽快从其它层面补齐差距。
开拓产品矩阵成为商汤绝影的新思路,新底牌是——世界模型。
上一次行业对「世界模型」的认知还来源于蔚来的 NWM——具备强大的场景理解与生成能力,能有效运用大模型的数据采集、训练、仿真测试等阶段。
世界模型也逐渐被行业认定为智驾下半场的重要关键词。
事实上,商汤绝影背靠强大的大模型体系,为世界模型的诞生提供了丰沃土壤。
商汤科技的「日日新」大模型,涵盖大语言模型、文生图模型、多模态模型等多种能力,并在尺度定律下快速迭代,综合能力已经可以对标 GPT-4 Turbo。
商汤绝影基于这套大模型体系,已经衍生出了丰富的汽车智能化产品。
比如新推出的智能座舱创新产品——A New Member For U,亮点是让智能座舱跳出了「工具人」的框架,变成了会察言观色,主动提供情绪价值与服务的「贾维斯」。
而在智能驾驶层面,商汤绝影把触角延伸至端到端的数据驱动逻辑上。
商汤绝影 CEO 王晓刚表示,数据驱动模式需要建设完善的数据闭环,打造强大的数据基础设施,更低成本、更高效的生产数据是竞争获胜关键。
由此,商汤绝影探索出一条新路,通过实车采集与仿真生成「双轮驱动」的数据闭环,打造出世界模型「开悟」。
一方面,基于真实采集数据,「开悟」可以完成数据泛化,生成大量高质量场景,包括稀有标志牌、施工场景等极端场景;
另一方面,模型可以在「开悟」中完成自车与他车,环境交互的闭环仿真训练。
一个重要数据是,基于一张 A100 GPU 打造的「开悟」世界模型,平均每天生成 2 万个场景,相当于 100 台路测车数据采集能力,及 500 台量产车的效率。
当然,降本增效的前提是「开悟」生成的场景足够真实、准确。
曾有业内人士认为,采用世界模型生成式数据比较粗糙,代替不了真实世界,只能作为辅助性工具使用。
而「开悟」攻克了世界模型的难点、痛点,能够理解真实世界的物理规则、交通规则,生成的的场景视频,最长为 150 秒,分辨率高达 1080P。
另一个维度是时空一致性,在行业内都输出 1V、6V 视角视频时,「开悟」直接挑战最高难度,生成 11V 多视角时空一致的高信息密度视频。
此外,强大的泛化能力,让「开悟」能够定制长尾场景,精准改变天气、交通要素,目前场景集覆盖的各类天气、光照条件、道路类型的场景种类高达 1024 类,构建千万级场景库。
王晓刚表示,目前商汤绝影数据采集过程中,20% 的数据由「开悟」生成,未来这个比例可以达到 80%。
显然,「开悟」世界模型对端到端玩家而言,是一项面向未来的提质生产力工具,商汤绝影放出这个大招,意味着率先预定了未来竞争场的入场券。
目前,围绕高阶智驾量产、端到端量产、AI 云服务、AI 大模型等产品维度,商汤绝影已经与奇瑞大卓智能、东风建立战略合作关系。
03、「互补」,找准自己的生态位
今天,大多数车企都走上了全栈可控这条路。
掌握了数据命脉,车企就有底气把野心放大。
奇瑞大卓智能 CEO 谷俊丽表示,奇瑞全球用户高达 1510 万,覆盖全球 100 个国家,当下 AI 战等于资源战,数据就是流动的黄金。
在奇瑞的智驾产品序列上,从 L2 延展到 L4,包含乘用车、商用车,也包括青海大数据、天穹超算中心等基础数据设施。
这其中,商汤绝影扮演了重要的赋能者角色。
据透露,目前商汤绝影与奇瑞具体合作情况是,绝影提供算法方案,奇瑞负责工程化落地。
此外也有媒体报道,商汤绝影选择直接给奇瑞交付白盒方案。
在方案商的视角里,算法方案作为核心资产,完全暴露给车企,是一步险棋。
但商汤绝影选择不对车企设防线,原因可能有两点。
一是建立信任关系。
商汤绝影似乎在极力给车企释放一种真诚合作的态度。
王晓刚表示,「绝影」一词源于曹操的汗血宝马,它随曹操四处征战,所向披靡。在这层寓意上,商汤绝影建立了深刻自我认知。
「我们团队如同千里马一样,忠诚可靠,迅速全面助力合作伙伴在竞争中领先卓越。」他直言。
所以,交白盒正是完全打消车企卡脖子的顾虑,让双方没有间隙地开展合作。
二是双方合作尺度加深。
谷俊丽也大方提到,大卓与奇瑞一起建设了天穹超算中心,云端算力为 1500 PFlops。
这意味着,双方已经不局限于单独的项目定点合作,而是深入到云端算力维度,在商汤绝影助力下,大卓可以基于强大的算力体系,建立良性的数据训练闭环。
王晓刚认为,单打独斗模式早已行不通,AI 公司跟主机厂合作是一个趋势,并且二者不再是标准化黑盒的交付,更多的是研发体系对齐、共创共建的过程。
所以,商汤绝影希望能借与奇瑞的合作,打造一个样本。
在这个样本中,车企与方案商形成一种互补协同的生产关系。
车企懂用户,懂市场,可以发挥用户数据价值,打通产品交付的最后一公里;
AI 企业通过丰富的 AI 经验、算力资源帮助车企解决模型迭代的效率、性能难题。
谷俊丽同样认为,整个智能驾驶生态链,要向 PC 时代一样走进千家万户,车企、方案商都必须在生产链条上找到站位,找到最匹配的合作伙伴。
当然,生态建设需要共创共建共享,但生意经的另一面是,方案商面临的残酷市场环境。
某种程度上,方案商必须构建自己独特的互补能力,才会引起车企关注。
商汤绝影的确准备充分,一家方案商能把产品矩阵覆盖到智能座舱、智能驾驶、世界模型三个层面,的确是业内少数派。
这也意味着,如果与奇瑞的样本打造成功,商汤绝影可以打破横亘在面前的端到端「量产」高墙。
现在,它迫切需要用这个机会证明自己。
$商汤-WR(HK|80020)$
本文作者可以追加内容哦 !