「核心提示」
自动驾驶的终点是人工智能
作者| 悟能
编辑李欣
马斯克最近三次亮相,备受关注。
第一次是在2022年的TED大会。在温哥华举行的这场活动的最后一次采访留给了马斯克,他与TED主席克里斯·安德森(Chris Anderson)进行了一次对话。
第二次是在5月10日,马斯克在《金融时报》直播的伦敦汽车未来会议上接受了记者彼得·坎贝尔的采访。
第三个是5月16日ALL-IN峰会上对马斯克的采访。
除了收购Twitter这个热门话题,马斯克采访中透露的一个话题应该得到新能源汽车行业的关注,那就是自动驾驶。
自去年以来,美国国家公路交通安全管理局已收到超过350起关于特斯拉“幻影制动”的投诉,调查仍在进行中。这些投诉涉及一个核心问题:自动驾驶。
以上三个出场,马斯克心目中的自动驾驶仪是什么样的?他实现自动驾驶的路径是什么?未来的方向是什么?
1。马斯克:驾驶坑太多了,但我有信心在今年突破
5年前,马斯克在参加TED大会时表示,他将在2022年驾驶汽车从洛杉矶到纽约,“没有任何干预”。
马斯克提到的汽车是全自动驾驶(FSD)车辆,但直到今年才落地。
“我并不总是对的。”五年后,马斯克回答了这个问题。
马斯克承认自动驾驶的坑太多了。
“你认为你已经解决了问题。你以为你掌握了问题的关键。然而,你没有!你只是撞了南墙。”马斯克说。
比如马斯克:如果把自动驾驶研究绘制成图表,看起来就像一条对数曲线。
马斯克一点也不喜欢这条对数曲线:它一开始以近乎垂直的方式上升,然后放缓,涨幅越来越小。
“在自动驾驶方向,有很多虚假的曙光,你最终会靠近。你的进步一开始是线性的,后来看起来是对数的。”马斯克说。
这很像特斯拉的自动驾驶RD过程:前途无量,扶摇直上;很多坑要踩,慢慢成长;有些坑还在前面。
有什么办法可以让对数曲线的上升趋势不那么快放缓?
“我相信我们今年会解决这个问题。”马斯克说。
从事故概率来看,马斯克有信心特斯拉的自动驾驶今年将超越手动驾驶。
“虽然(离我的目标)又过去了一年,但自动驾驶还没有成为现实。但我认为突破就在今年。”马斯克说。
马斯克的自信从何而来?
据业内人士估计,特斯拉的人工智能能力和对周围世界的理解取得了“顿悟”式的进步。
2。特斯拉自动驾驶:激进路线
一位软件工程师告诉Superpower,自动驾驶的难点主要在于感知和决策规划,而特斯拉选择了激进路线:纯视觉路线。
特斯拉的自动驾驶走的是仿生路线:选择摄像头和硅基神经网络,类似于眼睛和生物神经网络系统。
在马斯克的理解中,自动驾驶系统的设计应该适应生物神经网络,就像人类的大脑和眼睛一样。换句话说,自动驾驶就是解决现实世界中的人工智能和视觉问题。
特斯拉没有选择激光雷达,而是使用了摄像头和毫米波雷达。
上述软件工程师指出,用于感知的纯视觉路线,训练成本高,真实道路复杂,变化太多,对神经网络模型提出了很大的挑战。
指出使用相机和毫米波雷达是因为成本较低。
“激光雷达目前确实很贵,但从长远来看,仿生视觉路线比雷达好。”根据上述工程师的分析,如果激光雷达成本大幅下降,不排除作为特斯拉的辅助手段,但特斯拉不会用它来替代目视路线,因为目视路线难度更大,有更大的RD增值空空间。“这就是马斯克的个性”。
另外,自动驾驶决策规划模块涉及人工智能。人在驾驶的时候,会实时做出很多判断,这就涉及到人类的逻辑思维能力,也就是人工智能的深度学习要直接面对的问题。
但这样的选择符合马斯克的特点:做出激进的预测,激发身边人的野心,推动问题的解决。
特斯拉自动驾驶2014年落地,迭代迅速。
在视觉识别方面,特斯拉采用“8+1”仿生视觉配置:8个摄像头和1个毫米波雷达。
配置如下:前视宽视场相机1台,主视场相机1台,窄视场相机1台,侧视后视相机2台,侧视前视相机2台,后视相机1台。
这样,前置摄像头的组合视场角为360度,最远射程为250米。毫米波雷达的可视范围是160米。
从第一代硬件1到硬件3,每秒帧数(FPS,每秒帧数越多,显示动作越流畅)从最初的55帧增加到2300帧,可以同时感知亮度和颜色,在检测有无障碍物的基础上增加了物体识别功能。
在计算能力方面,增长同样惊人。
特斯拉第一代产品的计算能力约为0.26 TOPS,第三代产品已经达到144TOPS。
TOPS,称为Tera Operations Per Second,是一个评估处理器计算能力的性能指标。TOPS意味着处理器每秒可以执行一万亿次运算。
目前特斯拉发布的Hardware4将搭载一颗运算能力为432 TOPS的高性能芯片,由于芯片制造工艺的原因,运算能力提高到7nm(纳米)。综合判断,其计算能力可能超过500 TOPS。
商业项目的逻辑程序一般是:先有理论突破,再有技术突破,做出接近预期的样品,最后完成工程。
“只要能拿出接近预期的样本,基本上就有戏了。”上述工程师告诉Superpower,虽然硬件性能提升很快,但是在复杂路况中间确实很难,还有很多路要走,很多坑要踩。
特斯拉采用纯视觉方案,有自己的考虑。它基于数百万的车队和数百亿公里的真实道路数据。截至2020年4月,特斯拉已经积累了48亿公里的道路里程。
“现在的数据量肯定不止这个量级。”上述软件工程师判断。
另外,在最近的三次采访中,马斯克提到自动驾驶陷入了局部最大值,向上突破非常困难,所以不得不升级。
一些专家指出,在最初的自动驾驶软件架构中,处理的数据是没有时间坐标的2D图像数据。如果对具有时间维度的3D或4D数据进行处理,即从图像级处理到视频级处理,自动驾驶原有的软件和训练网络已经无法胜任,必须对自动驾驶进行革命,所以马斯克决定重写自动驾驶。
为了配合4D数据革命,Autopilot现有的用于深度神经网络训练的基础设施变成了Dojo,这是一台用于神经网络训练的超级计算机。
Dojo,日语是Dojo的意思,专门用于大规模的图像和视频数据处理,每秒运算数十亿次。马斯克说道场就像一头野兽。
需要注意的是,特斯拉Autopilot系统和FSD是两个独立开发的系统。前者针对的是L2/L3自动驾驶,而FSD针对的是L4/L5自动驾驶,这是代差。
3。马斯克面对事故的阴影:我们会做正确的事情
在三次采访中,马斯克都面临着一个无法回避的问题:自动驾驶引发的车祸。美国国家公路交通安全管理局已经收到了350多起关于特斯拉“幻影制动”的投诉。
“我认为,我们的自动驾驶实际上已经非常接近于比人类更好的安全驾驶水平。我踩过很多坑,今年一定会实现。我们真的离它不远了。”马斯克被问到这个问题时,停顿了一下说道。
他建议,评估自动驾驶效果的最好方法是观察测试项目和参与测试项目的人的视频。“你会发现进步是显著的”。
“我们有信心不仅达到人类的驾驶水平,而且远远超过人类的驾驶水平。”马斯克接着说,从伤害因素来看,我们最终可能比人类驾驶安全10倍。
为了提高自动驾驶的安全性,那些死于车祸的人值得付出吗?
“我们从来没有说过。”马斯克说,我们一再强调,你不能在不知情的情况下开启自动驾驶。
“如果从死亡人数来看,每年大约有100万起汽车死亡事故,每年可能有1000万人受重伤。”马斯克坚持认为,就像那些没有意识到自己会撞车,或撞到行人,或撞到骑自行车的人一样,他们不知道自动驾驶实际上救了他们。
“即使你救了90%本该死于车祸的人,如果剩下的10%死于车祸,你还是会被起诉。”马斯克说,什么是道德上正确的决定?我坚信善的真相远远超过所谓的对善的感知。我完全鄙视那些强调对善的感知而忽视其真实性的人。
马斯克的话翻译过来就是:行善的实践远比对善的感知重要。
马斯克承认,为了探索,公司必须承受压力,但“我们会做正确的事情,坚定立场。”
4。自动驾驶的未来:宇宙的尽头是机器人
认识到自动驾驶的终点是人工智能,马斯克花了很多时间。
为了解决自动驾驶的问题,马斯克认为真的需要解决现实世界中的人工智能问题。如果汽车解决了现实世界中的人工智能问题,那么这辆车就是四轮机器人。因此,马斯克表示,特斯拉今年正在研发的最重要的产品可能是机器人。
“目前缺少的是足够的情报。缺少的元素基本上是现实世界的智能和扩大生产规模,这是特斯拉非常擅长的两件事。”马斯克说。
因此,特斯拉需要为人形机器人设计专门的驱动器和传感器。
今年AI日,特斯拉抛出了一款名为特斯拉bot的机器人,身高1.72米。它代表了特斯拉目前所有的新技术:自动驾驶感知系统、FSD计算系统、基于视觉的神经网络架构、自动标签识别能力和DOJO自学习系统。
从运动能力上来说,特斯拉Bot还没有达到像波士顿动力那样可以和修士媲美的灵活程度。
特斯拉想制造机器人擎天柱,马斯克说他想生产机器人猫女郎。想象一下2050年,马斯克认为,到那时,大多数家庭都将拥有机器人和伴侣机器人。
“今年会有一个有趣的样机,明年可能会出一批成品,大概至少两年之内。”马斯克表示,由于生产规模的扩大,机器人的成本将会降低,可能会低于一辆汽车。
马斯克对监管感到恼火,但他意识到,不能让这个四轮机器人变得不可控。“需要一个人工智能监管机构,这对公共安全非常重要”。
"我们有开放源代码,任何人都可以免费使用我们的专利."马斯克说,我们申请专利是为了防止别人制造阻碍电动汽车进步的专利雷区。我们永远不会起诉任何免费使用我们专利的人。
马斯克知道,其他车企可能对特斯拉的自动驾驶更感兴趣。“可能有些车企想拿到特斯拉的自动驾驶执照,我们对此持开放态度。”
“这将是一场比汽车本身更大的游戏。”马斯克在专访中说道。