特斯拉FSD对决华为智驾:全自动驾驶技术在中国的较量即将开始


特斯拉智驾技术以端到端学习、数据驱动模拟、深度学习与控制融合、全栈自研为特点,领先自动驾驶领域。华为智能驾驶技术则通过增强感知系统、道路拓扑推理网络、激光雷达传感器等技术,实现不依赖高精地图的自动驾驶。两家公司竞争激烈,推动自动驾驶行业发展。

摘要由作者通过智能技术生成

有用

近日,特斯拉智驾即将落地中国的传闻闹得沸沸扬扬。国产新能源汽车智驾之战,终于迎来最强悍的竞争对手。


全自动驾驶技术,简单说就是让汽车自己开车,不用人来操作。这项技术融合了人工智能、机器学习、传感器技术、计算机视觉和导航系统等高科技领域。


自动驾驶的基本原理是通过集成传感器感知、数据融合、智能决策、精确控制和车联网通信等技术,实现汽车在无需人类干预下的安全、自主导航和行驶


最终目标是让道路更安全,交通更顺畅,出行更高效,而且让坐车的人感觉更舒服。随着技术越来越成熟,我们未来的路上可能会看到越来越多的这种聪明汽车。


目前全自动驾驶技术领域有多家公司在进行研发和推进,包括特斯拉(Tesla)、百度Apollo、华为智驾等。它们在各自的技术领域自有专攻。


特斯拉的FSD(全自动驾驶)技术以其创新性在自动驾驶领域占据领先地位,其核心特点可以概括为以下四点:


1.端到端学习:FSD技术采用端到端的人工智能学习方式,这就像是让汽车自主学习驾驶技能,从基础的传感器数据出发,逐步掌握复杂的驾驶操作。这种方法的优势在于,它允许汽车在真实交通环境中自我学习,无需预设繁琐的规则,使FSD能够像经验丰富的驾驶员一样,通过实践不断提升驾驶技巧。


2.数据驱动的模拟:FSD技术利用特斯拉全球车队收集的海量真实驾驶数据,模拟人类驾驶员的决策过程,以此不断优化其自身的驾驶策略,确保在各种交通情况下都能做出精准的反应。



3.深度学习与控制融合:特斯拉将深度学习技术与车辆控制系统集成,实现了从环境感知到决策制定,再到行动执行的无缝自动化流程,确保了自动驾驶的连贯性和效率。


4.全栈自研能力:特斯拉拥有从算法开发到硬件设计,再到数据中心的全面自主研发能力,这为其在自动驾驶技术的快速迭代和持续优化提供了独特的优势。


简而言之,特斯拉的FSD技术通过端到端的自我学习、数据驱动的策略优化、深度学习与控制的紧密结合,以及全栈自研的创新能力,为实现全自动驾驶提供了坚实的技术基础。



这些特点共同构成了特斯拉FSD技术的核心竞争力,使其在自动驾驶的赛道上保持领先。


华为的自动驾驶技术在行业内以其创新和实用性脱颖而出,主要体现在以下五个方面:



1.不依赖高精地图:华为的智能驾驶技术强调“看得清比地图重要”,通过增强感知系统,减少了对高精地图的依赖。其GOD2.0网络,即通用障碍物检测系统,用先进的3D立体识别技术,让车辆能像有了“X光眼”,精准识别出各种障碍物,包括那些不常见的异常障碍物。


GOD2.0特别擅长识别那些“非主流”的障碍物,比如翻车、掉落的箱子、落石或倒下的大树,大大提升了行车安全。GOD2.0还能准确区分不同类型的车辆和行人,识别率高达99.9%,为自动驾驶系统提供了丰富而精确的环境感知信息。



2. RCR技术:华为的RCR技术,即道路拓扑推理网络,让自动驾驶汽车能够理解并适应道路环境,就像人类驾驶员一样,即使没有高精地图也能自如驾驶。


3.激光雷达核心传感器:华为使用先进的激光雷达作为主要传感器,无论晴天还是雨天,白天还是夜晚,都能提供稳定的三维环境感知。


4.多传感器融合:华为的系统通过融合多种传感器数据,如激光雷达、毫米波雷达、超声波传感器和摄像头,提供了全面而精确的环境感知,增强了自动驾驶的安全性和可靠性。


5.强大的计算平台:华为自研的高性能计算芯片和云算力中心,为自动驾驶系统提供了强大的数据处理能力,支持从L3到L5级别的自动驾驶功能,确保了快速响应和高效决策。



简单来说,华为的自动驾驶技术就像是一个不需要地图,依靠自己的“眼睛”和“大脑”就能在城市里自如穿梭的智能司机。


特斯拉和华为在自动驾驶领域之间的竞争不仅是一场技术较量,更是推动整个自动驾驶行业向前发展的催化剂。这种竞争激发了创新,促进了技术突破,同时也为消费者带来了更多选择和更高质量的产品。



竞争促使两家公司不断探索新技术,改进现有技术,以保持市场竞争力。特斯拉的FSD技术和华为的自动驾驶解决方案都在不断迭代,力求在安全性、可靠性和用户体验上取得领先。


随着两大巨头的技术进步,它们也在无形中推动了行业标准的形成。这些标准有助于规范整个行业的技术发展,确保自动驾驶汽车的安全性和兼容性。



最终,竞争的结果是消费者能够享受到更先进、更安全、更经济的自动驾驶解决方案,满足他们对智能出行的需求



端到端搅局,自动驾驶的商业化分水岭正在显现。

前不久有消息称,通用汽车公司将向其自动驾驶汽车子公司Cruise注资8.5亿美元,以使Cruise的运营持续到明年第一季度,同时该公司也将考虑Cruise下一步的战略和资金安排。

本月的一场会议上,通用汽车首席财务官Paul Jacobson则表示,Cruise正处于非常重要的研发阶段,不仅仅是因为其自动驾驶出租车概念,更是为了实现个人自动驾驶出行。

自去年10月,一辆Cruise的自动驾驶出租车,撞伤并拖拽了一名女性数米远,被吊销了运营无人驾驶汽车的许可证。作为Cruise的母公司,通用汽车暂停了所有自动驾驶出租车的运营。

可见,历经撞消防车、阻挡救护车、集体熄火导致交通阻塞等风波,通用汽车仍继续押注Robotaxi。Cruise不仅获得母公司追加投资,还重启了在美国凤凰城和达拉斯地区的自动驾驶汽车测试,并增加了在休斯顿的测试。

与此前自动驾驶频频遇冷,牵动全行业商业化进度有所不同,端到端等新技术路线的搅局,似乎正在拉开玩家们的商业化差距,烧钱多年的通用汽车和Cruise不得不急。

比如,另一家自动驾驶公司Wayve,不仅实现了在伦敦市中心的自动驾驶,还拿下了软银、英伟达和微软等投资的10.5亿美元C轮融资。

而Wayve的上述成就,本质上得益于其新升级的自动驾驶模型架构,包括四个主要模型:端到端深度学习系统(AV2.0)、Fleet Learning Loop、LINGO模型以及GAIA-1世界模型。

这也意味着,除特斯拉之外,包括Wayve在内的更多玩家,已经初步验证了端到端自动驾驶的可行性,推翻了依赖代码不断改进规则算法,有望打破无穷的长尾场景僵局。

未来通过大量有价值的数据训练系统,结合可解释的传统技术栈或模型,端到端有望提高车端的“智力”水平,使系统驾驶技术达到人类老司机水平,更好地处理复杂的驾驶任务。

目前来看,在自动驾驶或高阶智驾领域,端到端的作用已经显现,并逐渐成为行业共识,具体表现在不少车企、智驾Tier 1们在感知端、决策端已有技术演示和应用。

01窗口期来临,同步拉开智驾差距

本质上,用户体验仍然是端到端上车的主驱力,竞争焦点主要为两点:一是解决长尾场景,提升整个系统的安全性;二是实现驾驶风格的拟人化,尤其是动态博弈路/车况下。

比如,随着端到端的加速落地,功能聚焦、拥有更高性能上限、更接近人类驾驶行为的城市NOA,将带动高阶智驾能力迎来新一轮比拼。

对比规则驱动的传统分模块方案,决策层泛化能力差,无法应对未曾编码过的长尾场景,而数据驱动的端到端决策泛化能力强,尤其是对复杂场景的应对能力,有着更高的天花板。

而上述天花板,很大程度由算力和数据决定。

这也将驱动新一轮的最佳计算平台方案竞争,包括算力、对智驾大模型的支持等,进而支持更大的缓存带宽、支持端到端的定制化算子等。

比如,地平线早在2016年便率先提出了自动驾驶端到端的演进理念,2022年提出行业领先的自动驾驶感知端到端算法 Sparse4D;2023年,由地平线学者一作的业界首个公开发表的端到端自动驾驶大模型UniAD,荣获CVPR 2023最佳论文。

与此同时,地平线积累的基于交互博弈的端到端深度学习算法,大幅提升智驾系统在复杂交通环境中的通行效率和成功率。

面向端到端的量产应用,在硬件技术上,地平线专为大参数Transformer而生的新一代智能计算架构 BPU 纳什,能够以高度的软硬协同打造业界领先的计算效率,为自动驾驶端到端和交互博弈提供智能计算最优解。

地平线的端到端技术也已投入产品应用,今年4月份,地平线发布基于征程6P的高阶城区SuperDrive方案,可依靠动态、静态、OCC占用网格三网合一的端到端感知架构,以及数据驱动的交互式博弈算法,做到在任何道路环境下兼顾场景通过率、通行效率和行为拟人。

基于此架构,SuperDrive的遮挡准召率可提升70%,动态代码行数降低90%,网络负载降低50%,能够支持算法供应商做高效迭代,持续提升用户体验,预计2025年实现量产。

地平线认为,端到端是手段而非目的,体验拟人、计算高效、交付敏捷三者缺一不可。通过提供灵活开放的软硬结合全栈技术,地平线将加速推动全行业实现端到端的大规模量产。

不过,即使有相关计算平台支持,自动驾驶的大模型也将拆解成若干个层级进化,包括模型化、端到端,最终实现大模型。其中,模型化方面,头部企业基本完成了感知模型化,但是规控的模型化还未完全做好。

这也意味着,基于原本积累的感知算法基础,规则驱动正在加速转向数据驱动,未来各Tier 1和车企的智驾能力差距将进一步拉大。

比如,鉴智机器人推出的BEVDet,将纯视觉自动驾驶3D感知做到端到端。相比使用Transformer进行image-to-bev投影,BEVDet拥有更优的泛化性能和更少的数据量需求,可大幅度降低对于数据量的需求。

其自动驾驶端到端的最新研发成果GraphAD,采用图模型描述交通场景中复杂交互的端到端自动驾驶算法,对驾驶环境中的交互性元素进行显性建模,使得模型能够更直接、快速的捕捉到相关性信息,显著提升了学习效率和性能。

目前,该模型已成功以实时运行性能部署到量产车载计算平台上。

此外,今年北京车展上,轻舟智航发布了基于地平线征程6打造的轻舟乘风MAX智驾方案,采用端到端的技术架构设计,支持激光雷达接入和轻地图模式,可胜任处理更加复杂的城市场景,打造极致全场景NOA体验。

元戎启行也对外展示了其即将量产的高阶智驾平台DeepRoute IO,以及首款基于DeepRoute IO的解决方案,采用NVIDIA DRIVE Orin系统级芯片,200+TOPS算力,1颗固态激光激光雷达,11颗摄像头,为无高精地图的端到端方案。

有消息称,元戎启行端到端自动驾驶方案已经获得长城汽车的定点项目,并与英伟达开展合作,预计2025年适配英伟达Thor芯片。近日,元戎还与比亚迪达成合作,负责其POC端对端智能驾驶项目。

02 完全端到端,道阻且长

作为自动驾驶的终局,端到端被寄予厚望,但难以一蹴而就。

在地平线算法平台总架构师穆黎森看来,做到完全端到端大模型之前,业界可能会经历一个里程碑,即在感知环节输出相对完整的对周围世界的理解,而后进一步提升数据驱动对规则算法的替代程度。

即在比较坚实的工程量产基础上做系统的快速迭代,一边提升系统的上限,同时也能够把握一些基于规则的基础功能的正确性,保证系统性能的下限。

“端到端的优势在于提升了某些场景的表现上限,但保证系统的性能下限相对困难,业界还需要用产品和体验,证明端到端确实能够带来正向提升。”穆黎森表示,这个过程也会驱动针对端到端的计算方案的发展,为端到端提供最优的计算效率。

可见,基于端到端模型提供更拟人且灵活的处理,原有的模型和规则可以保证安全,未来几年端到端模型和原有模型将在智能驾驶领域相辅相成。

毕竟即使是端到端的标杆特斯拉FSD V12,虽在此前的直播中表现不错,各种场景处理非常丝滑,但也会犯闯红灯、撞到马路牙等低级错误。而在上一代方案中,很少出现此类错误。

事实上,特斯拉也不敢完全依赖端到端。有特斯拉车主从FSD软件包中发现,V12仅适用于城市场景,高速场景还是用V11。

这也意味着持续提升端到端方案的下限,使其表现优于原传统方案,也是一座需要业界征服的里程碑。

而作为端到端的养料和难点,优质数据的搭建和收集也至关重要。

在自动驾驶领域,训练模型需要的数据是与物理世界相关的视频,因此需要模型理解更多物理规则,但也要避免用更多的数据、算力训练更大的模型,陷入智驾能力不升反降的瓶颈。

即使是已经有数百辆车在路上跑的特斯拉,也坦言如今每10000公里的行驶数据,只有1公里能训练模型,且每训练一遍,都需要消耗大量算力。

目前,特斯拉还在开发更强的仿真系统,生成各种数据训练世界模型,以利用视频生成和预测技术理解驾驶场景,并从这些场景中学习驾驶行为和策略,以强化端到端。

但依赖世界模型去长尾场景,可信度仍需提高。

例如,Wayve用于解决自动驾驶长尾问题的模型GAIA-1,去年6月推出GAIA-1早期版本后,就有相关研究人员指出,模型生成的视频中,会有一些元素在后续“突然消失”。

虽然同年10月,Wayve更新了GAIA-1,不仅扩大了参数规模,还增加了训练时长,模型生成视频的细节和分辨率都有明显提升,目前是否完全克服了“元素突然消失”的问题,还有待充分验证。

可见,距离业界完全实现端到端落地还道阻且长,不仅诸多技术难题待解,还极度烧钱。

但基于端到端的广阔前景,资本亦展示出了高涨的热情。去年开始,与端到端相关的智驾Tier1、自动驾驶卡车公司、芯片企业、合成数据商等陆续拿下新一轮融资,亦推高了行业泡沫。

或许在未来的两三年里,历经几轮去泡沫,待寡头效应突显,端到端的格局才更清晰。

追加内容

本文作者可以追加内容哦 !