自动驾驶是若何工作的?SLAM介绍_卡尔_状况
SLAM常用于自主导航,特殊是在GPS无旗子暗记或不熟习的地区的导航。本文中我们将车辆或机器人称为“实体”。实体的传感器会实时得到周围环境的信息,并对信息进行剖析然后做出决策。
1. 先容
SLAM是一种韶光模型,它的目标是从繁芜的信息中计算出一系列状态,包括预期环境,间隔,以及根据之前的状态和信息得出的路径 W_t 。有许多种状态,例如,Rosales和Sclaroff(1999)利用状态作为行人边界框的3D位置来跟踪他们的移动。Davison 等人(2017)利用单目相机的相机位置,相机的4D方向,速率和角速率以及一组3D点作为导航状态。
SLAM一样平常包含两个步骤,预测和丈量。为了准确表示导航系统,SLAM须要在状态之间以及状态和丈量之间进行学习。SLAM最常用的学习方法称为 卡尔曼滤波。
2. 卡尔曼滤波
卡尔曼滤波是一种用于状态估计的贝叶斯滤波类型。它是一种递归算法,作为系统中不愿定性的函数,使预测可以随着韶光的推移进行校正。不愿定性表示为当前状态估计和先前丈量之间的权重,称为卡尔曼增益。该算法将实体先前的状态,不雅观测和掌握输入以及当前的不雅观测和掌握输入作为输入。过滤器包括两个步骤:预测和丈量。预测过程利用运动模型,可以根据给定的先前位置和当前的输入估计当前位置。丈量校正过程利用不雅观察模型,该模型基于估计的状态,当前和历史不雅观察以及不愿定性来对当前状态进行终极估计。
图1. 根据历史状态,传感输入和不雅观测以及当前传感输入和不雅观测来估计新状态w_{t+1}和m。
第一步涉及了韶光模型,该模型基于先前的状态和一些噪声天生预测。
公式1. 预测模型。μ表示状态的均匀变革向量。ψ是状态数量的矩阵,将当前状态与先前的均匀值干系联。ε是转换噪声,可以确定当前状态与前一个状态的紧密干系程度。
第二步是“校正”预测。传感器网络自主导航的丈量值。有两类传感器:外传感器器和内传感器(proprioceptive)。外传感器从外部环境中网络信息,包括声纳,间隔激光,相机和GPS。在SLAM中,这些是不雅观察值。内传感器利用编码器,加速度计和陀螺仪等设备网络系统内部信息,如速率,位置,变革和加速度。在SLAM中,这些是单元掌握,传感器结果输入到实体中进行打算。这些传感器各有利弊,但相互组合可以产生非常有效的反馈系统。
公式2. μₘ表示丈量均匀向量。Φ是状态数量的将丈量的均匀值与当前状态干系联。εₘ是丈量噪声,常日以协方差Σₘ分布。
卡尔曼增益增强了丈量的可信性。例如,如果相机失落焦,我们就不会对拍摄内容的质量报太大期望。卡尔曼增益较小意味着丈量对预测的贡献很小并且不可靠,而卡尔曼增益较大则恰好相反。
公式3.卡尔曼增益打算,Σ₊是预测的协方差。
更新过程如下:
公式4. 利用卡尔曼增益的卡尔曼滤波学习过程。图片来自Simon JD Prince(2012)。
虽然这种方法非常有用,但它还存在一些问题。卡尔曼滤波假定单模态分布可以用线性函数表示。办理线性问题的两种方法是扩展卡尔曼滤波器(EFK)和无迹卡尔曼滤波器(UFK)。EFK利用泰勒展开来逼近线性关系,而UFK利用一组质量点近似表示正态,这些质量点具有与原始分布相同的均值和协方差。一旦确定了质量点,算法就通过非线性函数通报质量点以创建一组新的样本,然后将预测分布设置为正态分布,均值和协方差等效于变换点。
由卡尔曼滤波强加的单模分布假设意味着不能表示其他状态假设。粒子滤波是办理这些问题的常用方法。
图片来自Simon JD Prince(2012)
3. 粒子滤波
粒子滤波许可通过空间中的粒子来表示多个假设,高维度须要更多粒子。每个粒子都被授予一个权重,该权重表示其所代表的状态假设中的置信度。预测从原始加权粒子的采样开始,并从该分布中采样预测状态。丈量校正根据粒子与不雅观测数据的同等程度(数据关联任务)来调度权重。末了一步是对结果权重进行归一化,使总和为1,因此它们是0到1的概率分布。
图片来自Simon JD Prince(2012)。粒子滤波的步骤。
由于粒子的数量可以不断增多,因此对该算法的改进集中在如何降落采样的繁芜性。主要性采样和Rao-Blackwellization分区是常用的两种方法。
4. 研究现状
下图来自Fuentes-Pacheco, J., Ruiz-Ascencio, J., & Rendón-Mancha, J. M. (2012)的论文“Visual simultaneous localization and mapping: a survey”,总结了到2010年的SLAM中的一些方法。他们的研究分为几个方面。核心方案是利用学习算法,个中一些在上文谈论过。舆图的类型是捕获环境几何属性的度量图,或者是描述不同位置之间的连接的拓扑图。
在线跟踪中最常用的功能是显著特色和标记。标记是在环境中由3D位置和外不雅观描述的区域(Frintrop和Jensfelt,2008)。显著特色是由2D位置和外不雅观描述的图像区域。深度学习技能常日用于在每个韶光点描述并检测这些显著特色,以向系统添加更多信息。检测是识别环境中的显著元素的过程,描述是将工具转换为特色向量的过程。
表1来自J. Fuentes-Pacheco等人(2012年)。与特色提取干系的研究
运用SLAM的方案有两种,一种是回环检测(loop closure),另一种是“机器人绑架(kidnapped robot)”。回环检测是识别已经访问过的任意长度的循环偏移,“机器人绑架”不该用先前的信息去映射环境。
表2仍旧来自J. Fuentes-Pacheco等人。(2012)针对环境特定的方法。
5. 总结
SLAM是自主导航中常用的状态韶光建模的框架。它紧张基于概率事理,对状态和丈量的后验和先验概率分布以及两者之间的关系进行推断。这种方法的紧张寻衅是打算繁芜。状态越多,丈量越多,打算量越大,在准确性和繁芜性之间进行权衡。
6. 引用
[1] Fuentes-Pacheco, J., Ruiz-Ascencio, J., & Rendón-Mancha, J. M. (2012). Visual simultaneous localization and mapping: a survey. Artificial Intelligence Review, 43(1), 55–81. https://doi.org/10.1007/s10462-012-9365-8
[2] Durrant-Whyte, H., & Bailey, T. (2006). Simultaneous localization and mapping: Part I. IEEE Robotics and Automation Magazine, 13(2), 99–108. https://doi.org/10.1109/MRA.2006.1638022
[3] T. Bailey and H. Durrant-Whyte (2006). “Simultaneous localization and mapping (SLAM): part II,” in IEEE Robotics & Automation Magazine, vol. 13, no. 3, pp. 108–117. doi: 10.1109/MRA.2006.1678144
[4] Simon J. D. Prince (2012). Computer Vision: Models, Learning and Inference. Cambridge University Press.
[5] Murali, V., Chiu, H., & Jan, C. V. (2018). Utilizing Semantic Visual Landmarks for Precise Vehicle Navigation.
[6] Seymour, Z., Sikka, K., Chiu, H.-P., Samarasekera, S., & Kumar, R. (2019). Semantically-Aware Attentive Neural Embeddings for Long-Term 2D Visual Localization. (1).
[7] Fuentes-Pacheco, J., Ruiz-Ascencio, J., & Rendón-Mancha, J. M. (2012). Visual simultaneous localization and mapping: a survey. Artificial Intelligence Review, 43(1), 55–81. https://doi.org/10.1007/s10462-012-9365-8
本文系作者个人观点,不代表本站立场,转载请注明出处!