首页科技

马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?

原创2020-09-04 11:48:53 4792


在自动驾驶的感知领域,该行业分为位置明确的两组:视觉组和激光雷达组。特斯拉是视觉学校最坚定的监护人,他甚至使用所有最恶毒的形容词将激光雷达减为零。但是按照埃隆·马斯克(Elon Musk)的惯常作风,在某些事物“诅咒”的背后,他还必须“敬畏”某些事物。


当系统希望可靠时,关键原则是使系统“冗余”。因此,汽车工业中的大多数人都在添加这个极其可靠的对象。


但是特斯拉恰恰相反。它一直在减少汽车的使用量:大大减少汽车线束的长度,大大减少车身零件的数量,并大大减少制造过程。从技术便宜的快速实施的商业化考虑所有这些,足以让用户接受。



如果您使用相同的起点,那么不难理解埃隆·马斯克(Elon Musk)对激光雷达无限下限的公开贬值:


2015年10月-激光雷达毫无意义,对于自动驾驶汽车来说并非必需。


2017年4月-激光雷达非常糟糕,他们将放弃激光雷达,记住我的话,这是我的预测。


2018年2月-激光雷达价格昂贵,丑陋且不必要。


2019年4月-激光雷达就像一个人的一堆附录。附录本身基本上是没有意义的。如果有一堆,那就太荒谬了。任何依赖激光雷达的公司最终都会毫无问题。


当然,从事实来看,马斯克拥有足够的资本来鄙视激光雷达,因为依赖视觉解决方案的特斯拉目前被公认为是地球上将批量生产辅助驾驶的最佳公司。



但是,埃隆·马斯克(Elon Musk)真的踏上了激光雷达吗?相反,他清楚地认识到视觉和激光雷达的优缺点,同时不断推动视觉解决方案来做只能由激光雷达完成的事情。


特斯拉为什么不使用激光雷达?


从理论上讲,视觉和激光雷达是完美的补充。


视觉解决方案中的图像传感器可以获得高帧速率和高分辨率的周围复杂环境信息,而且价格便宜。但是,图像传感器是无源传感器,并且不发光。图像质量受环境亮度的影响很大,在恶劣环境下完成传感任务的难度也会大大增加。


激光雷达是一种主动传感器,它通过发射脉冲激光并检测目标的散射光特性来获取目标的深度信息。具有精度高,范围大,抗干扰能力强的特点。然而,由激光雷达获得的数据稀疏,混乱且难以直接使用,并且激光的单色特性使其无法获得颜色和纹理信息。



因此,基于可靠性考虑,业内大多数人正在研究如何将视觉与激光雷达获得的信息整合在一起,以实现更准确的环境感知。


但是在马斯克看来,汽车和道路都是由人为人设计的。由于人类可以通过视觉收集信息+大脑处理信息来安全驾驶,这意味着也可以以相同方式实现自动驾驶。如果强行添加激光雷达是一种“超人的感觉”,那就像走路时握着拐杖的人。


显然,拐杖不是创新,而是限制创新。


另一方面,由于增加了激光雷达,导致激光雷达的高成本和电气系统的复杂性与特斯拉一贯的减法制造理念不一致。



视觉的瓶颈在于算法,而激光雷达的瓶颈在于原理。显然,视觉具有更大的发展潜力,并且在理论上也具有较高的上限。做正确的事情而不做简单的事情也是马斯克的风格。


至于激光雷达在公共场合经常出现的口臭,这种权利体现了特斯拉和埃隆·马斯克出色的公共关系能力。


特斯拉如何克服视觉上的劣势?


实际上很难从2D平面图像中推断出准确的3D真实场景。


以下图中的MPV为例。如果仅查看左侧的2D图像,似乎标记有视觉和激光雷达的形状是准确的,但是如果将它们放置在3D场景中,则会找到标记有视觉方案的形状。它不仅长而狭窄,而且缺少汽车的侧面。



因为在2D图像中很容易找到车辆的左前角和右后角,但是左后角没有明显的特征。由于车辆后部的倾斜和向上变窄,总宽度将被低估。同时,依靠发动机舱盖超过车顶的部分来估计汽车的长度也会导致在深度方向上的高估。



在高亮度环境中,这只是一个相对常规的对象。如果环境变暗,或者添加了更多的遮挡物和障碍物,情况将变得更加极端。例如,在深色的两轮车中,很难区分纯视觉解决方案。



因此,基于基本算法解决视觉信息的准确处理是特斯拉自动驾驶系统的绝对核心技术。


自动驾驶功能的实现不仅仅是技巧,记忆和经验,而不仅仅是推理和计算。深度学习算法旨在提高自动驾驶的成熟度。 Tesla完善视觉算法的优势之一是通过海量车主驾驶数据训练神经网络,从而连续覆盖更多的工作条件和场景,并实现无限接近人类判断力的视觉算法的目标。


一方面,这取决于特斯拉自动驾驶硬件的强大计算能力。另一方面,它是特斯拉在“模式识别模型”领域的绝对领先者-超大型数据规模,多样化的数据覆盖范围和真实的数据场景。归根结底,全球超过一百万的特斯拉车主都是特斯拉自动驾驶算法培训的测试者。



我要在这里提到的是特斯拉独特的“阴影模式”,这是特斯拉大幅减少因数据量过多而导致的培训成本增加而又不影响算法训练的速度和准确性的关键。


隐藏在驾驶员身后的“阴影”始终在观察外部环境和驾驶员的行为。如果驾驶员在特定场景中的操作与预期的“阴影”一致,则不会报告数据;如果“影子”发现其判断与驾驶员的操作不匹配,则这次将数据发送到特斯拉的服务器,并对算法进行校正训练。达到一定水平后,它将再次发送到车辆。



在这个过程中,驾驶员不会有任何感觉,但是特斯拉实际上已经完成了“模式识别算法学习反馈反馈升级应用”的闭环。经过无数次培训之后,Tesla继续提高视觉解决方案的准确性,克服了视觉解决方案的固有缺点,并将算法优势变成了坚不可摧的技术门槛。


有可能用视觉代替激光雷达吗?


特斯拉希望达到的最终目标是使其视觉处理能力达到激光雷达的可见度,激光雷达在业界被称为“伪激光雷达”。


激光雷达穿过每个激光点的距离,以实时恢复环境。特斯拉将预测每个像素的深度,然后将其投影以复制激光雷达的功能。



分析2D图像的每个像素,并将其还原为真实的3D场景。毫无疑问,核心能力仍然是图像处理算法和支持该算法的高计算能力硬件。这也是特斯拉视觉解决方案进一步升级的体现。


不难理解为什么特斯拉必须将其自动驾驶系统的开发深化到芯片级。


在特斯拉公开显示的“伪激光雷达”还原的3D地图中,激光雷达的效果已经非常接近在明亮环境中激光雷达的效果,但是我相信这只是一个阶段性的结果,还有更多场景需要进一步研究。自2018年以来才在学术界进行过报道的“伪激光雷达”对特斯拉来说也是一个非常具有挑战性的问题。



但是,如果特斯拉要依靠纯视觉解决方案来解决L4甚至L5级完全自动驾驶,则必须通过强大的计算功能来解决2D图像到3D真实场景的转换这一难题。


写在最后


如果一个人仍在使用指南针和地图,则此时给他一个GPS,这意味着它仅提供解决问题的有价值的工具,而不能解决问题。激光雷达是解决问题的工具,但视觉解决方案也许能够从新的角度解决问题。



视觉解决方案会变得功能更强大,还是激光雷达价格下降得更快?没有人可以给出答案。这就是为什么今天的行业路线纠纷出现的原因。每条路线的实践者都坚信,他们将是最终的胜利者。这在极为自信的麝香中尤为明显。


“你说我错了,那么你最好证明你是对的。”-埃隆·马斯克。


标签:
随机快审展示 刷新 快审榜
加入快审,优先展示

加入VIP

发表评论

  • * 评论内容:
  •  

精彩评论

  • 无任何评论信息!