行业研究丨特斯拉如何使用计算机视觉技术解决自动驾驶难题?

北美时间2022年9月30日,特斯拉CEO埃隆·马斯克在美国加州帕罗奥图举办了人工智能日(AI Day)活动,活动展示了特斯拉在人工智能领域多个方面的研究成果。其中,特斯拉新研制的名为“Optimus”机器人原型机的全球首秀,成为了全场最受关注的焦点。

(图源来自网络)

特斯拉的Optimus机器人在舞台上展了其行走、跳舞、搬运物件、拿起水壶浇花等能力,吸引了许多观众的目光。虽然也有部分人对Optimus外露的机器零件以及一般的运动能力产生质疑,但是,仅从活动中机器人所展示的几个灵活动作就能看出目前Optimus已经可以对周围环境和物体进行初步的识别,并且做出合理的决策和行为动作。据悉,Optimus可能在3-5年间即可量产上市,产量应该可以达到数百万台。

 

Optimus的“大脑”是怎样的?

Optimus的一系列行为得益于特斯拉一直致力于研究自动驾驶系统,这个系统也就是Optimus的“大脑”。他们除了将自动驾驶系统应用于汽车外,还把自动驾驶系统应用于他们的智能机器人当中。活动期间,特斯拉技术人员就解释道:机器人的控制系统在本质上和特斯拉汽车上完全自动驾驶电脑是一样的。马斯克本人也提到:特斯拉使用与自动驾驶系统相同的过程来链接数据并部署网络。这说明该机器人的控制系统搭载的是与汽车相同的FSD(Full Self-Driving,自动驾驶)软件,所以在一定程度上可以认为,对于特斯拉而言,智能机器人和汽车的区别也仅仅在于汽车底部是轮子,而机器人的底部则是机械肢体。

(图源来自网络)

根据驾驶员与车辆之间的互动,自动驾驶系统可分为五个层级:驾驶员辅助、部分自动驾驶、有条件自动驾驶、高度自动驾驶和完全自动驾驶。特斯拉的自动驾驶系统属于完全自动驾驶,这是五个层级中最高层级的自动驾驶形态,仅通过系统就能操控全局,在任何情况下都无需驾驶员对车辆进行监测和操作。当然,由于使用场景和使用需求的不同,智能机器人神经网络的训练方式和训练资料还是和汽车有所差别,但不论是汽车还是机器人,其自动驾驶功能均是体现系统的感知能力、决策能力和行为能力。其中,对复杂动态环境的感知能力建设是实现自动驾驶功能的主要技术难题。

自动驾驶系统如何解决感知难题?

当前自动驾驶在感知技术上分为两个分支,分别是计算机视觉技术和激光雷达技术,特斯拉的自动驾驶系统则采用的是前者。

(图源来自网络)

计算机视觉技术是人工智能主要技术之一,也是目前自动驾驶在感知识别方面的核心技术。深圳市人工智能行业协会对计算机视觉技术的定义是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力,具有速度快、精度高、成本低等优点。一般来说,计算机视觉系统由图像采集、图像处理及分析、图像显示输出等组成。随着深度学习算法出现,计算机视觉技术进入了一个新阶段。计算机视觉通过深度学习形成神经网络,模仿人类视觉系统进行图像配准、处理和分析。神经网络在进行过大量训练资料的训练后,可以形成计算机视觉模型,可以开展对象的分类、监测、识别与跟踪,具有强大的特征学习和表示能力。

(图源来自网络)

毫无疑问,特斯拉自动驾驶系统研究团队正是通过人工智能的深度学习算法对其自动驾驶系统的神经网络模型进行训练。在过去的一年内,特斯拉就训练了近75000个神经网络模型,通过评估、筛选等方式选取一定数量的最优模型置入其FSD软件当中,以提升驾驶性能。此外,特斯拉也在不断完善训练资料,以改进神经网络模型。他们的训练资料包含了无数个由不同片段组成的训练集构成,每个训练集代表一种汽车运动的信号。也就是说,神经网络系统需要学习如何在各种不同的汽车运动信号出现后做出正常反馈。例如,在一个有停放车辆的路口转弯的场景,系统需要对路边停放车辆进行识别,判断其是静止或是正在移动,并控制所在车辆前进或减速。光是针对路口转弯时路边停放车辆的识别,特斯拉就单独选取了126种极具代表性的视频片段纳入当中,作为一个训练集。同时,特斯拉通过不断添加和更新数据来完善程序语义,提高数据引擎适用性,并不断更正修复其中的视频片段以降低模型对实际场景做出的错误预测,提升系统感知识别的正确率。在智能机器人的运行上,系统的神经网络则主要是通过对捕捉到的不同环境下的人体行为动作进行学习,模仿人类活动。例如,Optimus通过对人类浇花的图像和动作进行学习,可以在一个实际的环境中自主识别出浇花用的水壶,并且做出浇花这一行为。

深圳市人工智能行业协会认为当前利用计算机视觉技术,已经可以在某种程度上辅助、部分代替甚至完全代替人类完成一些基础类型的工作。虽然目前在自动驾驶领域,计算机视觉的逻辑模型并没有达到理想化的状态,仍存在一定的缺陷,但随着深度学习算法的不断更迭和优化,由神经网络构建的计算机视觉模型将会更加具有适用性和准确性,在未来,计算机视觉技术将会有跟广阔的发展空间,落地应用于更多领域的场景之中。

联系我们

联系我们

13316818043

邮箱: marketing@saiia.org.cn

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部