写在前面&笔者的个人理解
运动规划是自动驾驶模块化架构的重要组成部分,是上游感知模块和下游控制信号之间的桥梁。传统的运动规划最初是为特定的自动驾驶功能(ADF)设计的,但高级自动驾驶系统(ADS)的发展趋势需要各种ADF的运动,包括不可预见的运动。这种需求推动了相关“混合”方法的发展,试图通过结合各种技术来提高运动规划性能,如数据驱动(基于学习)和逻辑驱动(分析)方法。最近的研究成果为开发更高效、准确和安全的战术决策(TDM)和轨迹生成(TG)混合方法以及将这些算法集成到运动规划模块中做出了重大贡献。由于混合方法的广泛多样性和潜力,本综述强调了对当前文献的及时和全面的回顾。我们根据混合运动规划包含的组件类型对其进行分类,例如基于采样和基于优化/基于学习的运动规划的组合。通过评估所解决的挑战和局限性,以及评估它们是否侧重于TG和/或TDM,对不同类别进行比较。我们希望这种方法将使该领域的研究人员能够深入了解混合运动规划的当前趋势,并为未来的研究提供有希望的领域。
运动规划背景
模块化系统架构是设计和实现自动驾驶系统(ADS)的常用模型,其中几个子系统专门用于自动驾驶的不同任务。模块化架构将复杂的运动规划问题分解为战术决策(TDM)和轨迹生成(TG)。这简化了运动规划的设计,但也必须考虑TDM和TG之间的相互作用。ADS运动模块的代表性模块化系统架构,包括全局路线规划、TDM和TG之间的相互作用,如图1所示。全局路线规划器模块负责使用离线/在线地图,通过道路和路径,计算起点和终点坐标之间的最佳路线。全局路线通常由路点组成,不提供任何进一步的细节,此外,它只取决于当前坐标、端点和可行路径。全局路线规划仅按需调用(见图1中的输入信号A1),即,每当指定路线不再可行时,例如,由于即将发生的交通堵塞或道路工程。其他两个主要组件,即TDM或行为层,和TG相互作用,为车辆的低电平控制提供参考信号,以激励其致动器(见图1中的信号D和O1)。
接下来,在定义了AV中控制系统的运动规划和I/O中使用的关键技术术语之后,详细描述了TDM和TG模块的作用。
A.术语
- 车辆在2D平面空间中的配置包括其位置和方向,其唯一地确定了车辆的每个点在空间中的位置。配置可以用笛卡尔(全局或局部)坐标表示(图2)、极坐标、Frenet框架等。
- 状态是指车辆的运动学,如位置、速度、加速度等。车辆的配置可以是其状态的子集。
- 根据车辆在车辆周围物理空间中的碰撞检查,车辆的配置空间分为以下三个子集:自由空间、碰撞空间和未知空间。
- 路径被定义为来自自由(或未知)空间的一组配置,与时间等任何其他变量无关。
- 轨迹定义为车辆状态空间中的一组状态。图2中的红色曲线显示了轨迹,该曲线上的每个点都对应于一个特定的状态(作为时间的函数)。
- 运动是指车辆状态的任何变化。
- 动作是可用于操纵车辆运动的所有可能的控制命令。
- 机动是指车辆运动的特征或特征,如摩托车并线、超车、转弯、变道等。
- EGO车辆(EV)是指规划算法针对周围所有其他车辆和道路参与者设计的受控车辆。
- 由于车辆的运动学,非完整约束限制了两种状态之间可能的轨迹。在这样的系统中,导致一个状态的轨迹会影响该状态。在AV的情况下,3D配置(2D位置和偏航方向)仅由两个输入(节气门/制动器和转向角)控制。当约束不能集成到运动方程中时,就会发生这种情况。
- 运动基元是一组预定义/预先计算的离散轨迹,EV可以从给定状态中获取这些轨迹。
B.战术决策(TDM)功能
原则上,TDM功能负责根据感知的驾驶环境计算车辆的最佳行为,例如,在图3所示的示例中,决定是变道还是保持车道。获得对周围区域的全面了解是在动态驾驶环境中做出正确反应的先决条件。上下文感知决策是自动化和自主之间的主要区别,前者的概念是指在特定条件下自动控制系统行为的能力,后者还包括系统对环境中的意外变化做出适当反应的能力。TDM层的传统设计基于有限数量的可能驾驶场景中的有限选择或决策。最近的方法试图在设计中增加自主性,并解决车辆在意外情况下的行为,在这种情况下,驾驶环境无法在任何预定状态下进行分类。第三节进一步阐述了用于运动规划的传统和最新TDM方法。此外,TDM输出也可用于其他目的,例如通过视觉显示激活意图信号,以告知其他道路用户EGO车辆的操纵意图(图1中的信号O2),或通过修改感兴趣的传感器注意力区域(图1的信号O3)来优化传感器覆盖区域。
C.轨迹生成(TG)函数
轨迹通常被定义为物体穿过空间的“路径”,作为“时间”的函数。这就是为什么在一些技术文本中,轨迹也被称为“时空”函数的原因。虽然路径和轨迹在空间域(可驾驶区域)中的几何表示相同(见图2),但轨迹包括车辆的额外运动学(时间)信息(状态)。在AV的情况下,工作空间或物理空间(道路网络)通常是平面的(2D),配置空间是3D的,其中两个坐标表示车辆重心的位置,第三个坐标表示绕法向轴的旋转。不同的TG方法可能需要使用例如Voronoi镶嵌、成本图或状态格的物理空间的不同表示。TG过程负责计算低电平控制要跟踪的最终信号,见图1中的信号D,它将最终动作应用于AV的执行器。然而,在(动态)基于模型的方法中,如后退地平线规划和控制,最终的反馈/前馈控制被集成到规划模块中,输出信号被直接馈送到致动器中。
现有方法的分类
如图四所示现有方法可以分为端到端方法和模块化两大类方法。
A. Traditional Methods
1) TDM Algorithms
- Regulation-based Methods
- Route-based Methods
- Manoeuvre-based Methods
基于规则和路线的TDM方法分别由高级模块(如在线/离线驾驶法规和全球路线规划系统)直接处理,它们被称为基于自动化的决策。这些方法通常独立于TG模块进行设计和操作。相反,基于机动的TDM方法与TG相互作用并影响TG,被称为基于自主的决策。由于TDM和TG之间的相互作用,出现了一些新的挑战,在复杂环境中对车辆进行实时控制的过程中,这些挑战变得更加难以解决。例如,TG过程的输出可能与TDM选择的机动相矛盾,或者,TDM可以在不考虑轨迹的可行性/可容许性的情况下做出决策。一些研究已经通过使用拓扑感知技术将TDM和TG相结合,或者通过为每个机动组生成轨迹来解决这一挑战。因此,不建议在不考虑该过程与TG之间的联系的情况下决定操纵。
2) TG Algorithms
TG算法大多基于局部路径规划。为AV开发的第一个TG过程类似于路径规划方法,这就是为什么一些研究人员表示,TG挑战可以通过能够处理差分约束(考虑额外的时间变量)的路径规划技术来处理。在大量研究中,基于逻辑的TG算法(图4)是使用以下四种方法之一开发的:基于样本、基于搜索、基于优化和势场(PF)方法,这些方法将在以下段落中进一步讨论和审查。
- Sampling Methods:这些方法是为移动机器人运动规划体验开发的首批算法之一。大多数为AV实现这种方法变体的现代参考文献都受到DUC的启发。基于采样的方法通过使用碰撞检测模块的采样方法来探索环境,以决定样本序列是否在物理空间上构造有效配置。示例见图5(b)。采样方法计算高效,易于实现,可以进一步分为随机采样和确定性采样。
- Search Methods:基于搜索的方法通过使用一组运动基元(AV的预先计算的运动)来离散周围环境,例如道路网络,然后应用基于图的搜索策略,例如Dijkstra或A*族算法,以根据运动规划的启发式或目标来找到最佳路径或轨迹。示例见图5(c)。在基于搜索的方法中,处理车辆的运动学约束取决于用于构建搜索图的运动基元。提出了一些修改,如混合状态A*族算法,以考虑AVs中的非完整运动学。与基于样本的方法不同,基于搜索的方法需要提前了解道路网络的拓扑结构。
- Optimization Methods:基于优化的TG旨在解决基于样本和基于搜索的算法的缺点,即分别存在次最优和非光滑性。在基于确定性采样的方法中,候选轨迹是预定义的,并且不符合新环境。相反,基于优化的方法在连续的空间中工作,并且随着环境的变化更加灵活。消极的一面是,它们通常在计算上是昂贵的,并且由于计算周期之间的结果振荡,它们可能会导致不稳定的行为。
- Potential Field (PF) Methods:与其他传统的运动规划方法一样,PF被引入机器人领域。Khatib等人提出了一种避障运动规划方法,在该方法中,他们分别为障碍物和目标分配排斥和吸引PF,并使用它们在机械手和移动机器人的配置空间中导航。基于PF的方法的主要优点在于其简单性,它提供了具有几个障碍物、不规则几何形状和边界的复杂环境的抽象,使它们成为运动规划算法所需要的。然而,尽管有改进版本,它们的主要缺点是存在局部极小陷阱,排斥力和吸引力相互抵消,从而阻碍了实现目标的进展。
B.人工智能与基于学习的方法
在深入研究混合运动规划方法之前,我们在本节中讨论了另一类运动规划器(除了传统的),即数据驱动的运动规划器,根据图4,它可以是端到端的,也可以是模块化的。正如我们将在下一节中很快看到的那样,数据驱动的模块化运动规划可以成为混合方法中使用的组件之一。
数据驱动方法的流行是随着最近处理硬件的突破和各种驾驶场景下道路交通数据集的激增。这些方法大致可分为两大类,即端到端规划或模块化规划。前者指的是运动规划器的输入特征是从激光雷达、雷达、GPS或相机收集的感觉数据的方法,在后者中,感知和运动规划在单独的模块中完成。在模块化方法中,感知模块的输出可以作为运动规划的输入(见图1),例如,提供周围环境的语义表示,例如由边界框表示的其他道路使用者及其速度,以及车道标记的位置和道路几何形状。在模块化和端到端方法中,运动规划的输出可以是用于触发机动的决策、周围环境的状态预测、参考轨迹或控制命令,如转向角和节气门/制动器激活信号。
由于耗时的学习阶段基本上是离线执行的,因此在实时推理过程中,基于学习的方法在计算上是高效的。另一个理想的特征是,在给定足够的训练数据的情况下,它们能够适应各种驾驶场景,而不会对主要结构产生显著变化。主要的挑战是,它们的性能取决于训练阶段提供的数据的质量和多样性,这意味着一旦测试情况偏离训练条件,性能就会开始下降(或至少可靠性水平下降)。此外,由于数据驱动技术中众所周知的可解释性问题,在故障或改进的情况下调试运动规划模块也是困难的。
为了克服上述经典算法的挑战,已经开发了一些其他技术,称为“混合”或“组合”方法。在这些方法中,前面解释的算法的一些缺点可以通过将它们组合在各种混合框架中来解决,这可以进一步提高现实世界应用的运动规划和控制的性能。
C.Hybrid Methods
到目前为止,大多数传统的运动规划方法都不直接适用于SAE 3+级AVs,因为它们不能同时处理所有的运动规划目标,如低计算成本、全局优化、对动态环境的及时反应、对一般驾驶场景的适应性等。为了满足高度ADS的要求,最近发表的运动规划算法是通过结合各种传统方法开发的。由此产生的算法被称为混合运动规划器,它们将TDM和TG分解为更简单的子问题,或者它们试图通过使用专门为特定目标设计的适当选择的方法来分别解决每个运动规划目标。这意味着一种方法的缺点可以通过另一种方法来弥补,从而综合提高整体性能。
为了对混合方法进行分类和回顾,我们将首先探讨ADS中的运动规划算法需要克服的挑战。之后,混合方法将根据其旨在解决的挑战进行分类。如图1所示,假设其他道路使用者的行为感知和预测由其他模块提供给运动规划系统。在这篇综述文章中,我们没有考虑不完美的感知/预测对运动规划的影响,这本身就需要仔细关注。
- 车辆的动力学和可行性挑战:设计运动规划算法的第一个挑战源于受控车辆的运动学和动力学约束。在自动驾驶的情况下,这些约束包括前轮转向系统的非完整运动学以及节流/制动和转向执行器的变化幅度和变化率的控制力饱和。即使在没有任何其他参与者的开放、平坦的可驾驶区域,运动规划系统仍然必须应对这一挑战。忽略车辆的运动学约束可能导致不可行的参考轨迹,随后在低级控制器中出现更多错误。
- 驾驶环境挑战:这一群体与空间结构和驾驶场景或其他影响电动汽车驾驶环境的道路参与者所施加的环境约束有关。驾驶环境可分为结构化(预定义路线,如道路和高速公路)和非结构化空间(停车场和越野)。结构化环境可进一步分为城市和公路驾驶的主要类别,其中城市场景可能包括交叉口和环形交叉口、交通堵塞等,而公路场景可能指超车、变道、车道保持、公路并线或驶离。基于上下文的驾驶挑战在确定哪种运动规划方法适合特定情况方面起着至关重要的作用。克服这一挑战的一种方法是开发通用的运动规划方法,该方法可以在包括意外事件在内的各种驾驶情况下运行。然而,正如文献中现有的方法所强调的那样,实现这一目标并非没有问题,该方法通常假设驾驶场景由一组有限的预先确定的机动动作组成,并随后作为TG和TDM过程的输入。
- 实时挑战:下一个挑战来源于需要规划和实施车辆的运动,使车辆能够尽快采取行动并对环境做出反应,即TG和TDM模块中的计算应实时执行。假定当代传感器的更新速率在100ms的数量级,实时算法应在100ms时间段内至少更新一次(以10Hz或更高的速率操作)。一种方法可以产生适用于各种驾驶环境的最安全、最可靠和交通高效的输出,但其处理时间慢于电动汽车的状态变化率或周围环境的动态,这是绝对没有价值的。因此,运动规划模块的更新率是确定AV的最大行进速度的参数之一。
- 基于安全的挑战:评估运动规划方法的最重要指标之一是所提供的安全级别,这在算法设计中得到了明确考虑。可以使用几个公认的关键性能指标来衡量安全性,如(修改的)碰撞时间(TTC)、到周围车辆的时间和距离,以及在某些情况下冲突区内的侵占后时间。同时,希望提高ADS中的安全性不应损害受控系统的稳定性、乘客舒适性(乘坐质量),并且不应增加对安全驾驶员的不必要接管请求的数量(车辆的故障安全控制)。对于文献中的一些方法,安全度量直接纳入运动规划问题的数学公式中,而另一些方法则通过模拟或实验评估来研究安全标准。
- 基于不确定性的挑战:开发运动规划算法的最后一个挑战是如何处理由其他模块(如感知、预测、定位等)提供的输入数据中的任何类型的缺陷引起的不确定性。
针对上述挑战评估的传统运动规划方法的性能总结在表I中。通过检查该表,很明显,没有一种单一的方法可以解决所有挑战,例如,基于优化的方法在可行性、对驾驶环境的适应性、安全性和对不确定性的弹性方面表现良好,但它们的性能在实时ADS实现中可能会显著降低。这个问题最近引发了所谓的混合技术的大量研究工作,该技术将各种方法结合在一起,旨在提高传统方法的性能。接下来,针对相同的挑战列表,将解释、分类和评估用于运动规划的SOTA混合方法。我们的调查研究结果也显示在表II中。
Decomposed Geometry and Kinematic Planning
简化TG问题的最常见方法是将几何路径与轨迹的运动学特性(如速度、纵向和横向加速度)分开。这样,复杂的时空TG问题可以分解为两个更简单的问题,即路径规划和速度剖面规划,这两个问题可以在分层设计模型中进行处理,见图6的示例。例如,李等人中使用三次B样条生成候选轨迹,以初始细化来自高级路线规划器的输入参考路径,然后,为了解决安全和舒适问题,通过明确考虑运动学约束(如纵向/横向、速度/加速度限值和交通法规)来生成速度剖面。这种方法为速度剖面规划提供了一种闭合形式的解决方案,这可以显著降低所提出算法的实时处理能力(实现的更新率约为70ms)。VisLab AV的运动控制也使用了相同的概念,首先生成圆形几何路径,然后根据路径的最小和最大曲线计算速度曲线,最终选择舒适度(横向加速度)和电动汽车输入控制极限(最大转向角)方面的最佳轨迹。这种方法类似于用于非完整室内移动机器人的多级运动规划,其中轨迹的曲线和速度特征以顺序的方式得到改善。在另一项研究[54]中,使用数据驱动的方法生成路点,这些路点被用作基于贝塞尔曲线对几何路径进行采样的参考,然后计算每条路径的速度剖面。该方法已用于具有挑战性的城市场景,如环形交叉口、十字路口和T形交叉口,时间范围为3 s和6 s,最小更新率为4 Hz。
基于势场的混合方法
人工势场(PF)方法是对影响AV的TDM和TG过程的各种因素进行建模的合适工具。然而,该方法也存在相关挑战,可以通过将PF与其他运动规划算法相结合来缓解这些挑战。
大多数基于PF的混合运动规划器的结构都是为了简化优化过程。例如,在基于优化的技术中,PF可以用作成本函数中的惩罚因子,而不是添加不等式约束来描述复杂的驾驶场景,这会抑制地增加公式化优化问题的计算复杂性。一些研究集中在创建一种基于PF的混合运动规划方法上,其中PF被设计为凸的,以简化优化过程。Rasekhpour等人将方形排斥PF(不可交叉/可交叉)定义为电动汽车和其他参与者之间的相对距离和速度的函数(图7),以及车道标记和道路边界。所得PF用于TG的MPC成本函数,并在不同场景中进行测试,包括并线、变道和超车。Dixit等人使用类PF函数来定义安全区,作为MPC控制器在高速公路穿越机动中的参考。通过使用这种方法,它们弥补了PF和基于优化的方法的缺点,并保证了规划轨迹的可行性,同时对各种道路元素(如车道、边界、周围的汽车及其运动学信息)进行建模。开发了一个类似的框架,将类似人类的驾驶习惯(攻击性/因果关系)添加到AV的运动规划模块中,同时由于算法的MPC部分而保持最佳轨迹。在事故不可避免的情况下,MPC和PF相结合的混合方法也被用于减轻撞车事故的严重程度。Hang等人将MPC和PFs与博弈论框架相结合,对类人决策行为进行建模。这一方面对于AV与人类驾驶车辆共存的混合交通条件可能是重要的。
总之,基于PF的混合运动规划方法背后的主要思想是使用PF的并行优化或基于搜索的方法来描述具有挑战性的环境,如具有弯曲道路、(非凸)边界和低复杂度的密集交通的城市驾驶场景。简单地使用具有高分辨率密集网格的传统优化或基于搜索的方法将导致更高的计算工作量。
基于优化的混合方法
基于优化的方法的主要挑战是它们的高计算开销,这可能使它们不适合实时实现。缓解这一挑战的一种方法是将另一种方法纳入基于优化的框架。Lattarulo等人提出了一种混合运动规划方法,该方法由两个主要步骤组成:首先,计算平滑的标称轨迹,然后使用具有解耦点-质量动态模型的MPC架构,在考虑障碍物施加的约束和道路条件的情况下优化轨迹/机动。在类似的方法中,Wonteak等人开发了一种分层运动规划算法(行为和轨迹),该算法利用了优化和采样方法的优势。具体而言,采样算法负责确定基于高级粗略行为的轨迹,然后考虑到车辆和环境引入的动态约束,生成基于低级优化的轨迹。本质上,采样首先用于TDM,然后对TG进行优化。在这个框架中,优化方法的高性能基本上得到了保留,而总体实现复杂度仍然很低。Hidalgo等人通过将用于路径规划的参数曲线(Be´zier曲线)与用于纵向和横向控制的MPC相结合,提高了环岛合并场景中的运动规划性能。它们成功地降低了总体计算成本,同时保持了MPC所附带的高性能。Gu等人为TG开发了一个多层框架。在第一步中,作者优化了无交通的粗略轨迹(曲线和速度剖面),在接下来的两步中,他们生成了最终的平滑轨迹,并将其他交通参与者的行为作为约束。丁等人和张等人通过使用安全时空走廊(SSC)将可驾驶环境定义为时间的函数,简化了优化问题。
总之,基于优化的混合方法背后的主要思想是通过小心地减小解空间的大小来简化耗时的优化过程。这通常是通过在调用基于优化的技术来生成搜索空间内的最优轨迹之前,使用另一种(传统)运动规划方法修剪一些可行的驾驶行为来实现的。
Combination of Logical and Learning-Based Methods
最近,基于人工智能(AI)的方法与其他众所周知的运动规划算法一起在混合框架中使用,以提高整体性能。在本节中,我们将在以下段落中回顾各种类型的逻辑学习混合运动规划器。
基于优化的轨迹生成方法也可以纳入基于学习的运动规划框架。在[82]中,通过开发人工神经网络(ANN)来减少优化方法的计算时间,该网络经过训练以学习优化算法的输出。优化算法在生成最终轨迹之前监督ANN的输出,以确保满足安全约束。类似地,Alexandru等人使用从非线性MPC获得的轨迹以及相应的输入,并训练替代的ANN来解决基于优化的算法的高计算成本挑战。在另一项研究中,作者在[84]中提出了一种分层结构,解决了计算复杂性的挑战,其中第一层由MPC训练的神经网络组成,下一层负责保证计划轨迹的可行性。在他们的出版物中,电动汽车和人类驾驶车辆之间的互动是在TDM期间通过基于学习的方法捕捉的,而随后的TG过程负责生成优化轨迹,以满足混合交通流背景下的上游决策。
总之,在离线训练期间,基于学习的方法可以监督使用传统的基于优化的方法来实现接近最优性能的运动规划器。同时,PF可以用来降低训练的复杂性,因为它们在以简化的方式描述复杂的驾驶场景/环境方面非常有效。
Hybrid Cooperative Planning
在前面的TG和TDM部分中回顾的方法是基于EV的独立硬件和软件功能。然而,无线车辆到一切(V2X)通信技术的出现,如专用短程通信(DSRC)、ITS-G5和蜂窝V2X(C-V2X),将实现车辆之间或车辆与基础设施或云之间的广泛连接。[106]-[108]中广泛研究了这些通信技术对ADS的影响。具体而言,通过将车载传感器数据与通过V2X通信系统[109]、[110]接收的车外信息融合,可以增强电动汽车在视野有限或闭塞的挑战性驾驶情况下的感知。本小节介绍了利用共享信息进一步提高驾驶效率和改善交通流量的混合运动规划方法。
基于TDM和TG交互的分类
表II中还总结了迄今为止调查的混合运动规划方法,其中可以很容易地检索每种方法的组合元素以及所解决的运动规划挑战。在比较迄今为止文献中出现的各种混合方法之前,我们还想注意的是,这些方法可以根据潜在的TDM和TG过程之间的相互作用进行进一步分类。这可以进一步阐明每种混合方法所针对的运动规划挑战。如表III所示,虽然一些混合运动规划器(单独的)专注于TG或TDM过程,但也有一些混合方法(交互的)导致TG和TDM算法的组合,这两个过程之间存在隐式或显式的交互。根据(i)作为构建块元素的经典方法,(ii)已解决的挑战,以及(iii)TDM和TG的相互作用,对AVs的混合运动规划方法的现有文献进行分类,是这篇综述文章的另一个贡献,也将有助于确定研究空白。
讨论和公开挑战
尽管已调查的混合运动规划方法尚未使用相同的数据集进行评估或比较,但在本节中,将根据其旨在解决的挑战对其性能进行讨论和评估。此外,本节后半部分还强调了研究差距和未来工作的潜在方向。
Performance Assessment and Comparison
表II总结了所述五组下约50项混合运动规划研究的分类,以及对其在五项挑战(“a”至“e”)中的表现的评估。人们可以在那里看到,目前还没有一种混合方法可以解决三个以上的挑战。最流行的类别是“解耦的几何和运动学规划”,它通过单独设计路径(使用参数曲线)和轨迹的运动学特征来减少运动规划的高计算负荷。尽管能够实现实时应用,但计划的轨迹可能是次优的,此外,由于没有明确考虑车辆的非完整约束,其可行性也无法保证。
“利用势场的混合方法”在文献中以各种形式出现,但研究人员主要将PFs纳入“PF优化”和“PF学习”混合结构中,以提高TG和/或TDM的性能。在“PF优化”混合框架中,除了用于量化驾驶安全性和舒适性的其他语义信息(如车道标线)作为成本函数外,还通过抽象可驾驶区域的几何形状和其他道路使用者的相对距离/速度来生成PF。PF与包括车辆动态模型在内的后退视界优化方法相结合,实现了反应性和可行的运动规划。尽管这种混合方法可以用于各种场景的TG(甚至TDM),但由于驾驶上下文的语义信息被高度抽象为标量成本值,因此需要进行微调以适应新的场景。在“PF学习”混合结构中,PF用于修改ANN的输入或输出。在前一种情况下,PF用于将语义信息解释为风险图,以降低端到端算法的复杂性。在后一种情况下,PF用于通过对神经网络输出处的人工排斥力进行编码来确保控制动作(输出)的安全性和合理性。同样,“模糊逻辑”也被用于通过对神经元网络输出中的相关性进行编码来降低基于学习的方法的复杂性,以实现更平滑、更合乎逻辑和更安全的输出。最后,“基于学习的逻辑组合方法”的主要目标是提高可解释性和便于调试,同时提供适用于多种驾驶场景的通用运动规划,只需改变训练数据,而不会对神经网络的结构产生重大变化。
上面讨论的混合方法也被用于“协同控制”。hybrid automata是一种用于协同运动规划的特殊框架,其范围是解决TDM和TG之间的相互作用,这两个系统分别是离散和连续的系统(过程)。尽管一些研究报告称,考虑到排队等分布式系统的运动规划,混合自动机方法具有良好的性能,但该方法可以处理的机动次数相当有限,并且该方法中使用的预定义(原始)运动对规划轨迹的可行性提出了挑战。
研究差距与未来研究的机遇
根据本调查中回顾的工作,混合框架是一种很有前途的方法,可以克服与AV的运动规划问题相关的几个挑战。现有文献大多涵盖了基于车辆和环境的挑战,然而,安全性,尤其是与不确定性相关的挑战还有待深入研究。表二也证明了这一事实,可以看出,到目前为止,挑战“e”(基于不确定性的挑战)并不是研究的主要目标。为了强调各种不确定性对运动规划的影响,例如,考虑由于各种系统/传感器故障引起的感知和定位的可靠性与AVs的故障安全控制密切相关。因此,进一步研究对感知和定位方面的缺陷具有弹性的(混合)运动规划方法是一个很有前途的方向。
此外,由于现有的混合运动规划方法ods仅适用于有限数量的场景,未来的研究可以集中在开发一个通用框架上,在该框架中,考虑各种TDM和TG算法之间的相互作用,以从一种模式或机动安全过渡到另一种模式。这也可能减少向安全驾驶员提出移交(或回退)请求的频率,从而提高SAE的自主权。虽然有几项研究试图设计通用运动规划器并涵盖挑战“b”(驾驶环境挑战),但根据表II,其中只有两项研究同时考虑了生成轨迹的可行性,即挑战“a”(车辆动力学和可行性)。因此,开发通用运动规划器,同时解决剩余的挑战仍然是悬而未决的。
最后,另一个值得追求的研究方向源于运动规划与其他道路使用者的行为/意图预测之间的强耦合。决策应考虑其他道路使用者的预测意图,然而,考虑到电动汽车的决策/行为,他们的意图可能会动态变化,反之亦然。预计这种耦合将进一步增加运动规划和控制算法(挑战“c”)的实时实现要求,特别是在高速环境中,如摩托车并线和摩托车驾驶员。因此,进一步研究混合方法以降低其计算复杂性,将对此类场景非常有益。
总结和结论
这篇综述表明,当前设计AVs运动规划算法的趋势是基于将各种传统算法结合在一起的混合框架。据我们所知,我们定义了四类混合运动规划器,包括现有文献中的所有混合方法,即(i)解耦几何和运动学规划,(ii)使用势场的混合,(iii)基于优化的混合,以及(iv)逻辑和基于学习的方法的组合。我们还将混合动力协同运动规划定义为一个单独的类别,它使用V2X通信来帮助单个车辆进行运动规划或车队的批量控制。对属于上述类别的大约50种混合方法的性能评估表明,将两种或多种传统的运动规划方法结合在一起是一种很有前途的方法,可以帮助消除每种单独方法的缺点,而不会牺牲其组件的优势。根据图8(顶部)所示的时间表,过去两年的主流方法是将逻辑方法和基于学习的方法相结合。随着计算能力和机器学习的不断进步,我们预计这一趋势将持续发展。
此外,我们已经确定了运动规划的以下关键挑战,并将其作为比较不同方法的指标:(a)车辆的动力学和可行性,(b)驾驶环境,(c)实时实施,(d)基于安全的挑战和(e)基于不确定性的挑战。我们的综述表明,现有混合方法的主要重点是对驾驶环境进行适当建模并减少计算时间,以实现可靠、安全的实时运动规划。尽管如此,仍有一些遗留问题需要克服,例如感知和定位方面的不确定性,这些问题可能会影响生成轨迹的安全性。解决基于不确定性的挑战的混合方法在现有文献中的代表性不足。例如,与感知/定位模块的输出相关联的置信区间可以被纳入运动规划器中,以确保安全,这是未来工作的一个有希望的方向。
最后,本综述的另一个贡献是根据战术决策(TDM)和轨迹生成(TG)模块之间的相互作用对混合技术进行分类。这揭示了TDM和TG方法在驾驶场景方面缺乏通用性,这是进一步研究的建议方向。通用运动规划器可以帮助减少安全驾驶员摔倒的频率,并实现更高的SAE自主性水平。目前的趋势是TDM和TG之间的交互式隐含设计,见图8(底部),预计这种设计将继续下去,培养这两个过程之间的全面互动,以涵盖广泛的可能驾驶场景。我们相信,这篇调查论文将引发更多关于模块化自动驾驶系统运动规划的研究活动,并帮助研究人员和行业更好地定位混合运动规划的构建块算法、所解决的挑战以及潜在TDM和TG过程之间的相互作用。