特斯拉为什么要为车辆打造 ChatGPT?

ChatGPT在互联网上掀起热潮后不久,特斯拉位于帕洛阿尔托的总部于2022年12月也启动了类似的项目。该公司自动驾驶系统的工程师Dhaval Shroff向首席执行官埃隆·马斯克提出了一个创新概念:构建一个专为汽车定制的、类似于ChatGPT的系统。

特斯拉团队摒弃了依赖预定义规则来确定最佳行驶路线的方法,而是采用了从海量训练数据中学习的神经网络。拥有十年经验的Shroff解释说,这些数据涵盖了数百万个人类驾驶行为的实例。

经过八个月的努力,马斯克亲身体验到了全自动驾驶(FSD)汽车性能的显著提升,这得益于新版本FSD 12中引入的新概念。FSD 12的平稳性和可靠性让马斯克深感满意。

马斯克认为,这项创新不仅可能彻底改变自动驾驶汽车领域,还标志着向能够在现实环境中运行的通用人工智能迈进了一大步。

Shroff提出的新系统摒弃了传统上依赖数十万行代码的方式,而是通过处理数十亿个描述人类驾驶行为的视频帧来学习驾驶技能。这种方法借鉴了新LLM聊天机器人采用的自我训练方法,即通过分析数十亿个来自人类的单词来生成响应。

全面加速发展的态势已经形成。特斯拉并非唯一一家采用端到端技术的公司,Comma.ai和OpenPilot也在积极探索这一领域。例如,班加罗尔的青年Mankaran Singh就曾使用OpenPilot通过一部旧Android手机为他的Alto汽车提供自动驾驶功能。他在印度的FSD之旅备受瞩目,因为汽车制造商通常都会强调实现自动驾驶所需的计算能力。

此外,Wayve.ai也勇于挑战,在伦敦一些最复杂的街道上测试其自动驾驶技术,并取得了一些令人瞩目的突破。八个月前,他们发布了一个拥有90亿参数的世界模型,该模型通过整合视频、文本和动作输入来训练系统以适应道路行为。

2022年5月,Wayve与微软携手合作,利用这家科技巨头的基于云的超级计算机Azure来训练其神经网络。

马斯克指出了端到端方法的一个重要优势:车辆不再接收诸如“红灯停”或“变道前先确认”等明确的指令。相反,它通过模仿在训练期间观察到的1000万个视频中的行为来自主判断这些动作。

这意味着他们使用了包含数百万个视频的数据集,并对每个视频中的驾驶员行为进行了评估。机器学习模型经过训练后,能够模仿被视为“优秀司机”的行为。

从理论上讲,这种方法具有巨大的潜力,因为模型在面对不熟悉的场景时能够更有效地进行概括。本质上来说,模型可以根据其训练结果来确定最合适的行为,而不是被局限在预定义的指令中。

然而,还有一个问题尚未得到解决。即使是最熟练的司机也经常违反交通规则。例如,超过95%的人类司机倾向于缓慢驶过停车标志而不是完全停下来。

由于新FSD系统旨在模仿人类行为,因此美国国家公路安全委员会负责人目前正在调查这种行为是否可以被视为自动驾驶汽车可以接受的。

此外,尽管经过十五年的不计后果的投入和广泛的道路测试,无人驾驶技术仍然停留在试点阶段。Wayve创始人兼首席执行官亚历克斯·肯德尔指出:“我们看到人们投入了巨额资金,但取得的成果却非常有限。”

这促使英国公司(如Wayve)和初创公司(如Waabi和Ghost)将重点放在神经网络上,并以AV2.0为品牌进行推广。他们乐观地认为,更高效、更具成本效益的技术将使他们能够超越目前的市场领导者。

这些年来,自动驾驶汽车因各种难以忽视的重大失误而频繁登上新闻头条。投资者已经投入了超过1000亿美元用于开发自动驾驶汽车,这相当于NASA将人类送上月球所花费成本的三分之一。然而,截至目前,人类迈出的一大步仍然比一辆可以自动驾驶的汽车更便宜。

标签