论文链接:https://arxiv.org/abs/2307.07527
人为失误对导致人员伤亡、车辆损坏和安全问题的道路碰撞的重大影响约占94%(误差为±2.2%),因此需要探索替代方法。自动驾驶汽车(AVs)已经成为一种很有前途的解决方案,它用先进的计算机辅助决策系统取代了人类驾驶员。然而为了让AV有效地在道路上行驶,它们必须具备预测附近交通参与者未来行为的能力,类似于人类驾驶员的预测驾驶能力。建立在现有文献的基础上,对于推进该领域并全面了解自动驾驶背景下的轨迹预测方法至关重要。为了满足这一需求,我们进行了一项全面的综述,重点关注AV的轨迹预测方法,特别强调机器学习技术,包括基于深度学习和强化学习的方法。我们已经广泛研究了200多项与AVs背景下的轨迹预测相关的研究。本文首先介绍了预测车辆轨迹的一般问题,并概述了贯穿始终的关键概念和术语。在简要概述了传统方法之后,本文对几种基于深度学习的技术进行了全面评估。对每种方法进行了简要总结,并对其优缺点进行了详细分析。讨论进一步扩展到基于强化学习的方法。本文还研究了轨迹预测任务中常用的各种数据集和评估指标。为了鼓励进行公正客观的讨论,我们比较了两种主要的学习过程,考虑到具体的功能特征。通过识别现有文献中的挑战并概述潜在的研究方向,这篇综述对AV轨迹预测领域的知识进步做出了重大贡献。其主要目标是简化当前的研究工作,并提供未来的视角,最终有利于该领域的未来发展。
动机
轨道预测已经获得了巨大的发展,一些学者也在这一领域进行研究。表I总结了相关的调查现状,以及不同的分类方法和贡献。
运动预测包括根据所需的抽象水平预测物体的行为、动作或轨迹。“行为”一词包括一般动作及其执行方式,如“跟随道路并保持安全距离”。另一方面,“机动”是指物体可以在不需要详细说明的情况下执行的离散动作,如“右转”,通过描述对象在离散时间步长上的位置来提供最详细的预测类型。先前的调查主要强调自动驾驶汽车领域的运动预测和行为预测。此外,其他综述混合了车辆和行人的轨迹预测。关于自动驾驶轨迹预测机器学习方法的全面而专门的综述仍然相对未被探索。此外,近年来轨迹预测领域的一些进步,包括基于计算机视觉的方法、强化学习等,在现有的调查中没有得到解决,这些调查也需要探索。因此,在这一领域存在着进一步探索和研究的巨大潜力。
趋势
近年来,自动驾驶在汽车行业越来越受欢迎。包括特斯拉、通用汽车和宝马在内的知名汽车制造商进行了大量投资,并专注于自动驾驶汽车的轨迹预测和相关技术,以开发AD技术。与AD相关的关键词的全球搜索趋势,如轨迹预测、驾驶辅助、行为预测、轨迹规划和避障,如图1和图2所示。在图1中,相关关键词的比较显示了在同一时间段内的变化。这表明,驾驶辅助和避障在全球范围内产生了类似程度的兴奋。然而,在AD领域,最近在轨迹预测、轨迹规划和行为预测等关键词方面取得了进展。值得注意的是,轨迹预测专注于自动驾驶中更具体的领域。在图2中,描述了全球范围内与关键字相关的平均搜索次数。值得注意的是,与轨迹预测、轨迹规划和行为预测等其他术语相比,驾驶辅助和避障关键词的搜索次数更高。轨迹预测目前正在AD领域发展,这表明人们对该领域的兴趣和发展越来越大。
主要贡献
总结来说,本文的主要贡献如下:
- 本文对自动驾驶汽车轨迹预测方法进行了实证研究,并广泛关注基于机器学习的方法。为了更好地理解,还简要介绍了AV的轨迹预测问题、相关术语和传统方法;
- 简要评估了轨迹预测中的传统方法,如基于物理的方法、采样方法和概率模型,并讨论了它们的优缺点;
- 对自动驾驶汽车轨迹预测中普遍使用的基于深度学习和强化学习的方法进行了全面评估;
- 为用于评估轨迹预测方法性能的度量和数据集提供了分析总结;
- 对这些方法进行了比较,分析了每种方法的优缺点。此外,还确定了挑战和潜在的研究途径。
轨迹预测方法中的应用技术
自动驾驶中的轨迹预测方法可以大致分为以下几类:
传统方法
传统的轨迹预测方法是指在自动驾驶(AD)中通常用于预测道路使用者未来轨迹的传统方法。这些方法通常依赖于成熟的数学和统计技术,根据历史数据和预定义的模型进行预测。一些常用的常规方法有:
- 基于物理的模型:这些方法依赖于物理定律和运动学原理来预测车辆的未来轨迹。他们考虑了当前位置、速度、加速度和道路限制等因素来估计未来的路径;
- 运动学模型:这些模型假设物体的运动可以用简单的数学方程来描述,例如等速或恒加速度模型。他们根据物体的当前状态及其假定的运动动力学来估计未来的位置;
- 卡尔曼滤波器:卡尔曼滤波器广泛用于跟踪和预测任务。他们将传感器的测量与数学模型的预测相结合,以估计物体的当前状态,并预测其未来轨迹;
- 马尔可夫模型:马尔可夫模型捕捉对象连续状态之间的概率相关性。他们使用历史数据来估计过渡概率,并根据最可能的状态序列进行预测;
- 概率模型:概率方法通过将未来轨迹表示为概率分布来考虑轨迹预测中的不确定性。这些模型利用统计技术来估计最可能的轨迹,并提供置信度度量;
- 贝叶斯滤波器:贝叶斯滤波器,如卡尔曼滤波器和粒子滤波器,广泛用于轨迹预测。这些滤波器将传感器的测量值与动态模型相结合,以估计车辆的未来轨迹。它们可以处理有噪声的传感器数据并提供实时预测。
用于轨迹预测的常规方法通常在计算上高效并且相对容易实现。然而,它们在处理具有复杂交互和不确定性的复杂场景方面可能存在局限性。因此,人们对探索更先进的基于机器学习的方法越来越感兴趣,如深度学习和强化学习,以提高轨迹预测的准确性和稳健性。
基于深度学习的方法
近年来,基于深度学习的方法在自动驾驶汽车(AV)的轨迹预测方面受到了极大的关注。这些方法利用人工神经网络的力量,从大量数据中学习复杂的模式和关系。以下是一些常见的基于深度学习的轨迹预测方法:
- 递归神经网络(RNN):由于其能够对序列数据进行建模,因此在轨迹预测中被广泛使用。长短期记忆(LSTM)和门控递归单元(GRU)等模型可以捕捉时间相关性,并根据过去的观测结果预测未来的轨迹;
- 卷积神经网络(CNNs):CNNs主要用于图像处理任务,但也可以通过将轨迹数据视为类图像表示来应用于轨迹预测。细胞神经网络可以从轨迹数据中提取空间特征,并学习基于这些特征预测未来轨迹;
- 生成对抗性网络(GANs):GANs由生成器网络和鉴别器网络组成。它们可以用于轨迹预测,方法是训练生成器生成真实的未来轨迹,训练鉴别器区分真实轨迹和生成轨迹。GANs可以捕捉训练数据的分布,并生成多样化且合理的轨迹预测;
- 变分自动编码器(VAE):VAE是学习输入数据的潜在表示的生成模型。它们可以通过学习过去轨迹的潜在空间表示并基于该潜在表示生成未来轨迹来用于轨迹预测。VAE能够生成多样化的概率轨迹预测;
- Transformer模型:最初为自然语言处理任务引入的Transformer模型在轨迹预测方面也显示出了前景。这些模型可以捕捉场景中不同代理之间的长期依赖关系和交互。通过关注相关的空间和时间信息,变换器模型可以生成准确的轨迹预测。
与传统方法相比,基于深度学习的方法在捕捉复杂模式、处理不同场景和生成更准确的轨迹预测方面的性能有所提高。然而,它们需要大量标记的训练数据和用于训练和推理的计算资源。此外,学习模型的可解释性可能是一个挑战,因此验证预测并了解模型在现实世界场景中的局限性非常重要。
基于强化学习的方法
强化学习(RL)方法已被探索用于自动驾驶(AD)中的轨迹预测,为学习预测未来轨迹的最优策略提供了一种独特的方法。虽然RL传统上与决策和控制相关,但它也可以用于轨迹预测。以下是一些用于轨迹预测的RL方法:
- 逆强化学习(IRL):IRL背后的关键思想是观察和分析通常由人类驾驶员提供的专家演示,然后推断激励他们行动的潜在奖励函数。这种推断的奖励函数可用于预测与观察到的专家行为一致的未来轨迹;
- 深度逆强化学习(Deep IRL):深度IRL是反向强化学习的扩展,它将深度神经网络与IRL框架相结合,用于预测AD中的轨迹。深度IRL旨在使用深度学习技术从专家演示中推断潜在的奖励函数,从而允许奖励函数的更复杂和高维表示;
- 模仿学习(IL):用于轨迹预测的IL使自主系统能够模仿人类驾驶员的行为,并生成与专家演示一致的轨迹。它利用人类驾驶员的知识和专业知识,做出更像人类的预测,并以类似于人类驾驶的方式在环境中导航。
通过将RL方法应用于轨迹预测,模型可以从数据和与环境的交互中学习,从而对未来轨迹做出准确的预测。然而,重要的是要考虑RL算法的复杂性和训练数据的可用性之间的权衡,以及在现实世界环境中对各种驾驶场景和不确定性进行泛化的挑战。
传统轨迹预测方法
本节将预测方法分为三大类,即基于物理的模型、采样方法和概率模型,表II简要概述了轨迹预测的传统方法及其局限性和优势。在图6中,描述了几种传统方法及其在解决自动驾驶汽车(AV)轨迹预测任务中的作用。对论文的分析表明,在本次调查中,56%的论文关注概率方法,35%的论文关注抽样方法,其余9%的论文致力于抽样方法。
基于物理的方法
第一类建议的基于物理的预测模型使用经典力学的运动方程作为目标物体未来运动建模的基础。可以使用动力学或运动学模型来描述物理行为。动力学模型考虑了引起运动的轮胎横向和纵向力,但通常选择基本动力学模型来平衡预测精度和计算工作量。相比之下,运动学模型由于其简单的形式而更常用,并且卡尔曼滤波(KF)技术可以处理车辆当前条件下的干扰,如不确定性或噪声。例如,张等人提出了一种基于车-车通信和KF的方法,使宿主车辆能够预测远程车辆的轨迹并避开障碍物。
基于采样的方法
这些技术包括对交通参与者的未来状态进行采样。这些方法不是预测单个轨迹,而是生成可能的车辆状态分布,这使它们对噪声和不确定性更具鲁棒性。采样主要有两种类型:生成多个轨迹段或粒子状态。在他们的研究中,Houenou等人将基于机动的方法与假设恒定偏航率和加速度(CYRA)的基于模型的方法相结合,开发了一种轨迹预测方法。他们确定了机动,并从通过最小化成本函数生成的集合中选择了最佳轨迹。
概率模型
轨迹预测中的概率框架是指使用概率论来建模和估计物体或实体(如车辆、行人或其他移动物体)未来轨迹的可能性。它涉及表示预测过程中的不确定性和可变性,并为预测轨迹提供概率分布或置信度度量。在概率框架中,轨迹预测通常被公式化为条件概率问题,其中目标是在给定观察到的过去轨迹、传感器测量和其他相关信息的情况下估计未来轨迹的概率分布。这包括结合概率模型、统计技术和机器学习算法来捕捉数据中的不确定性和相关性。
- 高斯混合模型:高斯混合模型(GMM)是一种概率模型,通常用于轨迹预测,以捕捉数据的不确定性和复杂性。它将轨迹的分布表示为多个高斯分布的组合,每个高斯分布表示轨迹的可能模式或簇。总之,GMM通过捕捉数据中的复杂模式和变化,为轨迹预测提供了一种通用且稳健的方法。它们能够处理多模式分布,这允许表示车辆表现出的不同机动类型或行为模式。然而,需要注意的是,使用GMM进行训练和推理可能需要计算。此外,确定模型中高斯分量或模式的最佳数量可能是一项具有挑战性的任务。
- 高斯过程:当利用高斯过程(GP)进行轨迹预测时,轨迹被视为沿时间轴从GP中提取的样本。这些样本由N个离散点表示,这些离散点被映射到N维空间。在这个N维空间中,样本遵循高斯分布。在建模步骤中,GP模型的主要目标是基于这些样本来估计GP参数。通过将GP与观测到的轨迹样本拟合,该模型捕捉到了数据的基本模式和动态。GP参数,如均值和协方差,定义了GP的特征,并确定了预测轨迹的形状和不确定性。总之,GP是AVs轨迹预测的一种有价值的工具,它具有灵活性、概率预测、适应性以及与其他技术的潜在集成等优点。然而,基于轨迹样本的方法的一个局限性是其对新环境的适用性有限,这阻碍了其对不同场景和环境的适应性。
- 隐马尔可夫模型:在使用隐马尔可夫模型(HMM)的轨迹预测中,观测序列由交通参与者的先前状态组成。HMM算法被应用于基于这些过去的观测来估计最有可能的未来观测序列。总之,HMM对轨迹预测非常有益,因为它能够捕获时间相关性,处理丢失或有噪声的数据,并考虑到预测未来轨迹所涉及的不确定性。然而,HMM的一个假设是隐藏状态是马尔可夫的,这意味着过渡到未来状态的概率仅取决于当前状态。
- 动态贝叶斯网络:通过结合时间序列并利用贝叶斯网络框架,动态贝叶斯网络(DBN)为轨迹预测提供了一种基于机动的方法。DBN和贝叶斯网络共享进行概率推断的基本概念和方法。总之,当用于轨迹预测时,DBN考虑了交通参与者之间的互动,从而提高了传统基于机器学习的方法的性能。然而,DBN在准确识别机动和生成轨迹方面仍然面临挑战。许多现有的方法仅限于区分两个或三个动作,如车道保持和变道,这限制了模型在广泛场景中推广的能力。因此,需要进一步改进基于DBN的方法,以增强其机动识别能力,并提高模型在轨迹预测任务中的泛化能力。
总结
基于深度学习的预测方法
传统的预测技术仅在基本预测场景和短期预测任务中有效。基于深度学习的轨迹预测模型由于能够考虑有助于准确预测的各种因素而广受欢迎。这些模型考虑了物理因素,如车辆的位置、速度、加速度、尺寸和形状。他们还考虑了与道路相关的因素,如交通标志、红绿灯、道路几何形状和道路障碍物。此外,还考虑了与交互相关的因素,包括车辆之间的距离、相对速度和通信系统的存在。图7提供了这些方法的总体概述。以下部分概述了用于自动驾驶汽车(AV)轨迹预测的最流行的基于深度学习的方法。
序列建模
基于深度学习的轨迹预测方法通常涉及使用序列网络从历史轨迹中提取特征,并可以作为输出层。这些网络通常包括递归神经网络(RNN)、时序卷积神经网络(TCN)、注意力机制(AM)和变换器。图8提供了在轨迹预测的顺序建模中使用不同算法的研究论文分布的百分比视觉表示。可以观察到,与RNN、AM和Transformers等其他算法相比,TCN在AV轨迹预测任务中不太常用。
- RNN:递归神经网络(RNN)被设计用于处理时间信息,而传统的机器学习方法和卷积神经网络(CNNs)擅长处理空间信息。它维护过去时间步长数据的记录,并结合输入和隐藏状态以生成所需的输出。然而,当处理大量的时间步长时,RNN的梯度可能会减弱或爆炸,从而引发问题。为了解决这个问题,已经开发了门控RNN,如长短期记忆网络(LSTM)和门控递归单元(GRU)。基于RNN的轨迹预测模型被分类为单个RNN模型或多个RNN模型。为了基于机动或单模态轨迹预测来预测轨迹,使用单RNN模型。此外,它可以被纳入辅助模型中,以促进更复杂的功能,例如感知交互的预测。神经网络的发展导致了各种类型的RNN架构的广泛使用。尽管RNN被广泛用于分析和预测数据序列,如轨迹预测,但它们在模拟空间关系(如车辆交互)和处理类似图像的数据(如驾驶场景的上下文)方面存在局限性。这就是为什么复杂的基于RNN的解决方案通常需要多种技术来克服单个RNN的局限性。总之,RNN通过有效地建模时间相关性,为轨迹预测提供了一种强大的方法。它们可以处理可变长度的序列并提供可解释性。然而,它们可能会受到梯度消失或爆炸以及顺序计算限制的影响。在将RNN应用于轨迹预测任务时,了解这些因素至关重要。表III总结了基于RNN的轨迹预测方法,提供了以秒为单位的预测范围(PH)和预测轨迹数量的信息。该表还包括用于训练和测试的评估指标(EM),并强调了每项研究的优势和劣势。
时序卷积网络
时序卷积网络(TCN)是一种流行的深度神经网络架构,用于轨迹预测任务。在轨迹预测任务中,TCN根据历史轨迹数据进行训练,并用于预测车辆或行人的未来轨迹。
总之,TCN为轨迹预测任务中的时间依赖性建模提供了一种强大的方法。它们擅长捕捉短期和长期动态,执行高效的并行计算,并具有可解释的感受野。然而,空间关系和长期记忆可能需要额外的考虑。表IV概述了基于TCN的轨迹预测方法,包括预测范围(以秒为单位)、预测的轨迹数量以及用于训练和测试的评估指标。该表还强调了每项研究的优势和劣势。
注意力机制
注意力机制(AM)是一种认知模型,通过使用有限的注意力资源从大量数据中有效提取高价值信息,来近似人类的思维过程。它经常用于深度学习任务,,自注意力是一种流行的基于输入序列识别权重和新上下文向量的方法。最近的一些研究已经将注意力机制用于轨迹预测和意图估计。
总之,轨迹预测中的注意力机制提高了模型关注相关信息、处理可变长度序列、提供可解释性以及增强对噪声的鲁棒性的能力。然而,它也存在与计算开销、模型复杂性、注意力偏差和数据依赖性相关的潜在缺点。表五全面总结了基于注意力的轨迹预测方法。它包括重要信息,如预测范围(以秒为单位)、预测轨迹的数量以及用于训练和测试的评估指标。此外,该表还提供了对每项研究的优势和劣势的见解。
Transformer
Transformer是一种利用注意力机制概念的神经网络设计,已被用于各种项目。总之,transformer通过捕捉复杂的依赖关系和交互作用,展示了其在轨迹预测方面的潜力。它们提供了可扩展性、迁移学习功能以及处理多个代理的能力。然而,它们需要大量的计算资源,并且可能在可解释性和数据效率方面存在挑战。表VI总结了基于Transformer的轨迹预测方法,介绍了关键细节,如预测范围(以秒为单位)、预测的轨迹数量以及用于训练和测试的评估指标。此外,该表强调了每项研究的优势和劣势。
基于视觉建模
有两种类型的预测方法,它们在制定预测的方式上有所不同。第一种是鸟瞰图(BEV)方法,它使用一种算法来处理自上而下的类似地图的视图中的数据。第二种是自车相机预测,它涉及通过自车载体的视角来观察世界。然而,由于各种因素,自车相机方法通常比BEV方法更具挑战性。首先,BEV方法提供了更宽的视野和更准确的预测,而自车相机方法的视野更窄,预测范围有限。此外,自车摄像机方法比BEV方法更容易出现障碍。尽管存在这些困难,但自车摄像头方法仍然比纯电动汽车方法更有益,因为大多数车辆都无法使用摄像头来定位道路上的目标代理和纯电动汽车。因此,预测系统应该能够从自车载体的角度看待世界,如图9所示。各种基于视觉的技术及其对解决自动驾驶汽车轨迹预测任务的贡献如图10所示。在AVs研究论文中,每种技术对轨迹预测的贡献大致相等。本节重点介绍了卷积神经网络(CNNs)和图神经网络(GNN)在解决该领域中的应用。
CNN
卷积神经网络已成功应用于各种计算机视觉任务,包括轨迹预测。尽管细胞神经网络主要是为图像数据设计的,但通过将轨迹序列视为结构化网格状输入,它们可以适用于轨迹预测。
然而,大多数使用CNN框架的技术都采用鸟瞰图(BEV)作为输入,显示自上而下的交通状况视图。BEV图像可以使用多个数据源创建,包括激光雷达点云、占用网格(OG)和高精地图(HD地图)。最近的一些研究利用CNN从复杂的BEV表示中提取特征。
总之,CNN在捕捉空间模式和识别轨迹数据中的空间关系方面具有优势。它们在参数共享方面是高效的,并且可以处理更大的数据集。然而,他们可能会在建模时间依赖性和处理可变长度序列方面遇到困难。表VII概述了基于CNN的轨迹预测方法,包括以秒为单位测量的预测范围和预测的轨迹数量。该表还概述了用于训练和测试的评估指标,并强调了每项研究的优势和劣势。以下各节将介绍基于GNN预测车辆轨迹的方法。
GNN
当考虑将交互相关因素考虑在内的预测技术时,环境的每个元素都可以被视为图中的一个节点。然而,许多现实世界的应用程序从非欧几里得空间生成数据,而分析欧几里得空间数据的传统基于深度学习的方法在这种情况下表现不佳。每个场景都可以表示为具有可变大小无序节点的不规则图,并且由于附近节点数量的变化,一些关键操作(如卷积)不直接适用于图。然而,图中的每个节点都通过边连接到其他节点,这可以用来确定各种对象的相互依赖性。图神经网络(GNN)非常适合基于交互相关元素的车辆轨迹预测挑战。方法如图11所示。
- GCN:图卷积网络(GCN)是图神经网络领域中一种流行的技术。它将卷积运算从传统的图像数据处理扩展到了图形数据处理。关键思想是创建一个映射函数,该函数可以从网络中的节点特征及其相邻节点中提取感知交互的特征。总之,GCN通过显式地建模对象之间的空间依赖性和关系,为轨迹预测提供了一种很有前途的方法。它们可以有效地捕捉上下文信息并处理不规则的图形结构。然而,在将GCN应用于轨迹预测任务时,应仔细考虑可扩展性、图构建和时间依赖性建模。表VIII概述了基于GCN的轨迹预测方法,包括以秒为单位测量的预测范围和预测的轨迹数量,以及用于训练和测试的评估指标。该表还强调了每项研究的优势和劣势。
- GAN:从one-hop邻域收集数据的方法在图注意力网络(GAT)和GCN之间变化很大,GAT采用注意力机制代替静态归一化卷积过程。总之,GAT使模型能够关注图中的相关节点(例如,车辆、行人),分配不同的权重来捕捉每个节点特征对预测特定对象轨迹的重要性。然而,GAT的性能在很大程度上取决于图结构的质量和表示。设计合适的图表示并考虑节点和边的选择对于获得最佳结果至关重要。表IX总结了基于GAN的轨迹预测方法,强调了预测的轨迹数量和以秒为单位测量的预测范围。该表还提供了对每项研究的优势和劣势的见解,以及用于训练和测试的评估指标。
- 其他GNN:高精地图在自动驾驶汽车的轨迹预测中起着至关重要的作用。高精地图提供了有关道路网络的详细信息,包括车道标记、交通信号和道路边界,这有助于更准确地预测车辆或行人的未来轨迹。研究人员正在探索整合多种信息来源的方法,包括高精地图、传感器数据和机器学习算法,以提高自动驾驶汽车轨迹预测的准确性和稳健性。表X总结了用于轨迹预测的其他基于图神经网络的方法,重点是预测的轨迹数量和以秒为单位测量的预测范围。该表还提供了每项研究的优势和劣势,以及用于训练和测试的评估指标。
CNN和GNN的结合
一些研究人员提出了使用RNN和CNN的组合来处理轨迹预测的时间和空间信息的模型。表XI总结了基于CNN的轨迹预测方法,强调了预测的轨迹数量和以秒为单位测量的预测范围。该表还强调了每项研究的优势和劣势,包括用于训练和测试的评估指标。
生成式模型
由于结果的潜在多样性,预测多模态轨迹带来了挑战和不确定性。为了解决这个问题,一些研究人员转向生成模型来创建能够捕捉潜在多样性的多模态轨迹。然而,为了使多模态轨迹预测模型有效,其输出分布必须满足一定的要求,包括多样性、社会可接受性和可控性。仅使用一个基本事实来实现最优分布可能很困难,并且可能导致不那么多样化和不可接受的预测。为了克服这一挑战,已经提出了生成对抗性网络(GANs)和变分自动编码器(VAE)作为解决方案。图12说明了两个生成模型在协助自动驾驶汽车(AV)完成轨迹预测任务方面的研究论文的参与情况(以百分比表示)。这两个模型对预测过程的贡献大致相等,显示了它们在生成准确轨迹预测方面的共同责任。
- GAN:在轨迹预测任务中,生成对抗性网络(GANs)用于基于输入数据生成真实的轨迹。生成器将历史轨迹数据作为输入并生成未来轨迹,而鉴别器评估生成的轨迹的真实性。生成器经过训练,通过欺骗鉴别器使其相信生成的轨迹是真实的,来提高生成轨迹的真实性。该方法如图13所示。表XII总结了基于GAN的轨迹预测方法。
- VAE:自动编码器(AE)使用编码器压缩数据,并使用解码器对其进行解码,以产生重建误差最小的重建输出。然而,AE被批评为仅仅“记忆”数据,数据生成能力有限。相反,变分自动编码器(VAE)具有跨越整个空间的生成能力,它解决了自动编码器中的非正则化潜在空间问题。VAE旨在最大限度地减少重建损失和相似性损失。表XIII总结了基于变分自动编码器的轨迹预测方法。
基于强化学习的方法
RL技术用于估计潜在成本函数或直接识别用于轨迹预测的最优策略。在任何一种方法中,都假设被观察的代理总是试图通过利用基于特定成本函数的最优策略来达到其目标。图15说明了RL方法在AV中的应用。在MDP的框架内,基于RL的方法可以分为反向强化学习(IRL)方法、模仿学习(IL)方法和深度IRL方法,如下所述。图14说明了RL的不同变体的研究文章的分布,以百分比表示,以及它们在解决AV中的轨迹预测任务中的参与情况。
Inverse Reinforcement Learning
逆强化学习(IRL)背后的主要思想是学习解释观察到的主体行为的奖励函数。IRL的目的不是直接模仿观察到的轨迹,而是了解驱动这些轨迹的潜在动机或目标。通过推断奖励函数,该算法可以推广到观测到的轨迹之外,并对未来的轨迹进行预测。总之,虽然IRL有潜力提供更深入的见解和更灵活的轨迹预测,但在实际应用中应仔细考虑对专家演示的要求以及与质量和计算复杂性相关的挑战。
Deep Inverse Reinforcement Learning
深度逆强化学习(Deep IRL)是逆强化学习(IRL)的扩展,在企业的深度神经网络(DNN)中,从专家演示中学习奖励函数。
总之,Deep IRL通过利用深度神经网络提供了更强大和自适应的轨迹预测模型的潜力。然而,为了在自动驾驶轨迹预测中成功应用,需要仔细解决与数据需求、计算复杂性、可解释性和过拟合相关的挑战。
模仿学习
反向强化学习(IRL)算法的一个缺点是,它们难以在奖励很少或没有直接奖励函数的情况下进行训练。为了解决这个问题,有人建议将模仿学习(IL)作为一种解决方案。IL旨在根据专家的观察快速确定政策,而不需要成本函数。总之,IL和GAIL是很有前途的方法,可以在奖励有限或没有直接奖励函数的情况下解决训练RL算法的挑战。他们在建模人类驾驶行为和生成真实预测方面的成功为他们在其他现实世界场景中的应用开辟了可能性。表XIV总结了基于强化学习的轨迹预测方法,并强调了每项研究的优势和劣势。
数据集
数据集汇总如下表:
评价指标汇总如下表:
讨论
在本节中,通过对代表性模型的比较,对所提出的模型进行了公平的评估。所选择的标准包括与轨迹预测任务有关的不同因素,以及在该领域使用模型的总体先决条件。尽管如此,该比较揭示了普遍的模式,并提供了对特定特征和使用场景的理解。应比较基于深度学习的模型和基于强化学习的方法。比较结果汇总在表XVII中。
基于深度学习的模型已经证明了它们在很长一段时间内产生准确预测的能力,因为它们可以进行长达8秒的长期预测。然而,这些模型通常由神经网络组成,因此被视为黑匣子模型,这降低了它们的可解释性,并可能在验证和批准方面带来挑战。尽管如此,这些模型具有整体性的优势,因为它们可以将来自多个来源的各种特征(包括对象交互和语义数据)集成到神经网络中。然而,为了获得良好的预测性能,仔细选择有效的特征是至关重要的。空间特征和相应表示的使用使得能够考虑主体之间的交互,这使得交互意识成为可能。基于深度学习的模型能够以不同的抽象级别描述复杂的过程,并能够将轨迹作为预测结果输出。然而,这些模型需要反映特定应用领域的有效训练数据,以实现全面和稳健的预测。因此,这些模型高度依赖于数据。此外,这些模型的自适应性仅限于模型训练数据范围内的场景。由于其整体方法,基于深度学习的模型通常与高计算成本有关,而高计算成本受所用神经网络大小的强烈影响。然而,在当前的技术状态下,基于深度学习的模型提供了最高的预测精度。
基于强化学习的方法也能够进行长期预测。然而,可解释性的程度因所使用的具体方法而异。间接模型生成一个映射到状态动作元组的成本函数,该函数可用于解释策略的提议输出。尽管如此,解释成本函数是如何从专家的论证中确定的还是很有挑战性的。输出政策的直接模型并没有从演示中明确推导出成本函数,这使得它们不太容易解释。这些模型可以直接将多个对象之间的交互视为输入特征。此外,可以使用广泛的特征,包括来自道路地图的语义信息,作为输入,使这些模型具有整体性。
基于强化学习的模型能够通过利用底层策略来描述复杂的策略。然而,模型的输出通常由离散的操作组成,因为策略包括对象可以执行的状态-动作元组。尽管可以从后续模块中导出显式轨迹,但这些模型在很大程度上依赖于不同的数据,包括演示,用于训练。提取全面的成本函数或稳健策略尤其具有挑战性,因为它强烈依赖于专家的行为观察,因此很难进行正确的训练。基于强化学习的模型旨在推理物体的运动,使其能够很好地适应未知场景。然而,与基于深度学习的模型类似,基于强化学习方法的整体模型具有较高的计算成本。此外,学习鲁棒策略的复杂性会对预测准确性产生负面影响。
挑战和未来趋势
挑战
- 不确定性:流量代理的未来轨迹本质上是不确定的,不可能100%准确地预测。各种因素,如传感器测量中的噪声、不可预测的环境变化和其他交通代理的未知意图,都可能导致这种不确定性。
- 复杂动力学:交通代理的运动可能受到各种物理定律的影响,包括重力、摩擦力和空气动力。这些动力学可能是高度复杂和非线性的,因此很难精确建模。
- 传感器覆盖范围有限:自动驾驶汽车依靠一套传感器来感知环境,包括摄像头、激光雷达和雷达。然而,如图18所示,这些传感器的覆盖范围是有限的,并且可能受到闭塞、天气条件和其他因素的影响,这些因素可能使准确跟踪其他交通代理的运动变得困难。
- 有限的数据:在某些情况下,可用于轨迹预测的数据可能有限或不完整。当传感器出现故障,或者历史数据丢失或损坏时,可能会发生这种情况。
- 长期预测:预测长时间范围(不少于3秒)的轨迹可能具有挑战性,因为初始预测中的小误差可能会加剧,并导致与真实轨迹的显著偏差。
- 复杂的道路环境:自动驾驶汽车在复杂动态的道路环境中运行,包括十字路口、环形交叉路口和拥挤的城市区域。预测这些环境中的轨迹需要能够处理多个主体之间复杂互动的模型,包括其他车辆、行人和骑自行车的人。
- 多模态输出:在自动驾驶中,代理人的行为表现出多模态,其中一个过去的轨迹可以有多个潜在的未来轨迹,如图19所示。
- 稀疏和嘈杂的数据:来自传感器的数据可能稀疏和嘈杂,特别是在城市地区,建筑物和其他结构可能会阻碍传感器和被跟踪物体之间的视线。这可能使得难以准确地对其他交通代理随时间的运动进行建模。
- 多代理交互:在许多现实世界场景中,多个代理相互交互,并且它们的轨迹是相互依赖的。预测一个代理的轨迹可能取决于其他代理的行为,如图20,这使得问题更加具有挑战性。
- 异构环境:异构环境是指包含各种元素的环境,如各种类型的车辆、行人、骑自行车的人、不同的道路类型以及它们之间的复杂交互。为了有效地预测这种环境中的轨迹,预测模型需要考虑不同类型的代理,结合上下文信息,融合传感器数据,建模多个代理之间的交互,估计不确定性,并实现适应性。
- 安全关键应用:自动驾驶汽车是安全关键系统,轨迹预测中的错误可能会产生严重后果,包括事故和伤害。因此,轨迹预测算法需要高度准确和可靠,并具有明确的安全裕度。
- 实时约束:自动驾驶汽车在实时环境中运行,轨迹预测算法需要能够实时处理数据并生成预测。这需要能够处理传感器产生的大量数据的高效算法和硬件架构。
未来方向
- 结合上下文和意图:当前轨迹预测方法的一个局限性是,它们通常只关注其他车辆的运动,而没有未来的研究可以探索如何结合上下文信息,如道路布局和交通规则,以及其他驾驶员的意图,以提高轨迹预测的准确性。
- 多传感器集成:自动驾驶汽车依靠一套传感器来感知环境,未来的研究可以探索如何集成多个传感器的数据,以提高轨迹预测的准确性。这可能涉及开发新的算法来融合来自相机、激光雷达、雷达和其他传感器的数据,以及探索新的传感器模式,如声学或热传感器。
- 不确定性建模:轨迹预测本质上是不确定的,未来的研究可以探索如何通过预测管道建模和传播不确定性。这可能涉及开发新的概率模型,如贝叶斯神经网络,或探索不确定性量化和传播的新技术。
- 人类感知轨迹预测:自动驾驶汽车运行的环境不仅包括其他车辆,还包括行人和骑自行车的人。未来的研究可以探索如何开发轨迹预测方法,这些方法能够感知人类行为,并能够准确预测拥挤城市环境中行人和骑自行车者的运动。
- 实时实现和硬件加速:自动驾驶汽车在实时环境中运行,轨迹预测算法需要能够实时处理数据和生成预测。未来的研究可以探索如何优化轨迹预测算法以实现实时性能,以及开发新的硬件架构以实现高效计算。
- 确保安全性和稳健性:在自动驾驶系统中,安全性至关重要。未来的研究应该致力于开发优先考虑安全性和稳健性的轨迹预测方法。这包括研究处理罕见或异常事件的技术,在具有挑战性的天气条件下提高预测准确性,以及考虑轨迹预测算法中的伦理方面。
- 相对轨迹预测:相对轨迹预测是指预测周围物体或代理相对于自车或坐标系的未来运动或路径的任务。未来的研究应侧重于估计其他车辆、行人和骑自行车的人相对于自车的相对位移、速度和轨迹。
- 随机障碍物感知轨迹预测:这种方法是指在考虑周围环境中存在意外或随机障碍物的情况下预测车辆的未来轨迹。这些障碍物可能是道路之间的动物或物体,行人的突然到来,以及导致道路之间不确定障碍物的道路事故。未来的研究应侧重于将罕见事件纳入预测模型,并收集和分析与这些罕见事件相关的数据,以开发更全面、更稳健的预测模型。
- 具有挑战性的天气条件:恶劣的天气条件,如大雨、雪、雾或低能见度,可能会影响传感器的性能,并限制轨迹预测关键数据的可用性。未来的研究应侧重于结合传感器融合、自适应滤波、概率建模和机器学习等技术,以提高恶劣天气条件下轨迹预测的可靠性和准确性。
- 车辆对车辆(V2V)通信和车辆对一切(V2X)通信策略:V2V通信是指车辆之间直接交换信息。V2X通信扩展到V2V之外,包括与其他实体的通信,如基础设施、行人、骑自行车的人和交通管理系统。通过共享位置、速度、加速度和意图等实时数据,车辆可以协作以增强轨迹预测。
- 几种方法的混合:第3、4和5节提出了解决轨迹预测任务的多种策略。根据具体的环境和要求,混合可以采取不同的形式。这可以带来更准确、更稳健的轨迹预测。