导航：首页> 发电、变电或配电>冲突区障碍物轨迹预测方法、决策信息修正方法及应用

冲突区障碍物轨迹预测方法、决策信息修正方法及应用

文献发布时间：2024-04-18 20:01:23

技术领域

本申请属于自动驾驶技术领域，具体涉及一种冲突区障碍物轨迹预测方法、决策信息修正方法及应用。

背景技术

无人车轨迹预测是自动驾驶技术中的一个关键问题，因为准确的轨迹预测可以帮助车辆更好地理解周围环境，做出更安全、智能的驾驶决策。现有技术中提出了一系列的无人车轨迹预测方案，但并不能较好的适应一些特殊的应用场景，如冲突区障碍物轨迹的预测。

公开于该背景技术部分的信息仅仅旨在增加对本申请的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

发明内容

本申请的目的在于提供一种冲突区障碍物轨迹预测方法，其用于解决现有无人车轨迹预测算法不能适应冲突区场景的问题。

为实现上述目的，本申请提供了一种冲突区障碍物轨迹预测方法，所述方法包括：

获取目标车辆与冲突区的相对位置，其中，所述冲突区由所述目标车辆所处的当前车道和冲突车道交汇形成，所述目标车辆沿当前车道朝向冲突区行驶；

在所述相对位置满足预设条件时，获取所述冲突车道上障碍目标的初始运动状态量，其中，所述初始运动状态量包括障碍目标的位置和速度，所述障碍目标沿冲突车道朝向冲突区行驶；

基于所述障碍目标的初始运动量进行运动状态预测，获得所述障碍目标的当前运动状态预测量；

获取所述障碍目标的当前运动状态观测量以修正所述障碍目标的当前运动状态预测量，获得所述障碍目标的当前运动状态修正量；

基于所述障碍目标在多个时刻的当前运动状态修正量，拟合所述障碍目标的行驶轨迹。

一实施例中，基于所述障碍目标在多个时刻的当前运动状态修正量，拟合所述障碍目标的行驶轨迹，具体包括：

基于三次样条曲线拟合所述障碍目标在多个时刻的位置，以生成所述障碍目标的行驶轨迹，其中，所述三次样条的二次项和三次项施加有正则化约束，且所述三次项的正则化约束大于二次项的正则化约束。

一实施例中，基于所述障碍目标在多个时刻的当前运动状态修正量，拟合所述障碍目标的行驶轨迹，具体包括：

建立所述障碍目标在多个时刻的位置相对三次样条曲线偏差平方和的损失函数；

在所述正则化约束下，以最小化所述损失函数的方向求解所述三次样条曲线的系数矩阵，以生成所述障碍目标的行驶轨迹。

一实施例中，所述冲突车道和目标车辆所处的当前车道在经过冲突区后具有不同的延伸方向，所述障碍目标在冲突车道的转向引导下朝向冲突区行驶，且所述障碍目标的行驶朝向与目标车辆的行驶轨迹有干涉。

一实施例中，所述方法具体包括：

将t时刻障碍目标的当前运动状态修正量作为t+1时刻障碍目标的初始运动状态量，以获得t+1时刻障碍目标的当前运动状态修正量。

一实施例中，基于所述障碍目标的初始运动量进行于运动状态预测，获得所述障碍目标的当前运动状态预测量，具体包括：

使用第一状态转移矩阵和状态控制矩阵对所述障碍目标的初始运动状态量进行运动状态预测，获得所述障碍目标的当前运动状态预测量；

获取所述障碍目标的当前运动状态观测量以修正所述障碍目标的当前运动状态预测量，获得所述障碍目标当前运动状态修正量，具体包括：

使用所述第一状态转移矩阵、过程激励噪声协方差矩阵对障碍目标初始状态协方差矩阵进行预测，获得所述障碍目标的当前协方差预测矩阵；

基于所述障碍目标的当前协方差预测矩阵、第二状态转移矩阵、以及测量噪声矩阵，计算当前的卡尔曼增益；

基于所述当前的卡尔曼增益、以及障碍目标的当前运动状态观测量和当前运动状态预测量的误差，修正所述障碍目标的当前运动状态预测量，获得所述障碍目标的当前运动状态修正量。

本申请还提供一种冲突区障碍物决策信息修正方法，所述方法包括：

基于上述的方法获得障碍目标的行驶轨迹；

基于第一时刻和第二时刻所述障碍目标的运动状态量，确定所述障碍目标在第一时刻和第二时刻的决策信息，其中，所述第二时刻在第一时刻之后，所述运动状态量包括位置、速度和行驶朝向，所述决策信息为障碍目标在对应时刻占据目标车辆所处车道的时间和位置；

基于所述第一时刻和第二时刻的决策信息，判断所述障碍目标是否加速行驶至目标车辆的前方设定位置；

若是，基于所述障碍目标的行驶轨迹，修正所述障碍目标在冲突区的决策信息。

本申请还提供一种冲突区障碍物轨迹预测装置，包括：

第一获取模块，用于获取目标车辆与冲突区的相对位置，其中，所述冲突区由所述目标车辆所处的当前车道和冲突车道交汇形成；

第二获取模块，用于在所述相对位置满足预设条件时，获取所述冲突车道上障碍目标的初始运动状态量，其中，所述初始运动状态量包括障碍目标的位置和速度，所述障碍目标沿冲突车道朝向冲突区行驶；

预测模块，用于基于所述障碍目标的初始运动量进行运动状态预测，获得所述障碍目标的当前运动状态预测量；

第一修正模块，用于获取所述障碍目标的当前运动状态观测量以修正所述障碍目标的当前运动状态预测量，获得所述障碍目标当前运动状态修正量；

拟合模块，用于基于所述障碍目标在多个时刻的当前运动状态修正量，拟合所述障碍目标的行驶轨迹。

本申请还提供一种冲突区障碍物决策信息修正装置，包括：

轨迹预测模块，用于基于上述的方法获得障碍目标的行驶轨迹；

确定模块，用于基于第一时刻和第二时刻所述障碍目标的运动状态量，确定所述障碍目标在第一时刻和第二时刻的决策信息，其中，所述第二时刻在第一时刻之后，所述运动状态量包括位置和速度，所述决策信息为障碍目标在对应时刻占据目标车辆所处车道的时间和位置；

判断模块，用于基于所述第一时刻和第二时刻的决策信息，判断所述障碍目标是否加速行驶至目标车辆的前方设定位置；

第二修正模块，用于在所述障碍目标加速行驶至目标车辆的前方设定位置时，基于所述障碍目标的行驶轨迹，修正所述障碍目标在冲突区的决策信息。

本申请还提供一种无人车，包括：

至少一个处理器；以及

存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如上所述的冲突区障碍物轨迹预测方法或冲突区障碍物决策信息修正方法。

本申请还提供一种机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如上所述的冲突区障碍物轨迹预测方法或冲突区障碍物决策信息修正方法。

与现有技术相比，根据本申请的冲突区障碍物轨迹预测方法，通过获取目标车辆与冲突区的相对位置，并在其满足预设条件时，获取冲突车道上障碍目标的初始状态量进行运动状态预测；进而基于获取的障碍目标的当前运动状态观测量修正当前运动状态预测量，从而获得经滤波后的障碍目标当前运动状态修正量；随后，基于障碍目标在多个时刻的当前运动状态修正量，进行行驶轨迹的拟合，算法高效且针对冲突区场景具有良好的适应性。

在另一个方面，利用三次样条曲线拟合障碍目标的行驶轨迹，且三次样条曲线的二次项、三次项被施加正则化约束，使得拟合出的行驶轨迹可以准确地反应障碍目标的真实意图，且需要用于拟合的数据量更小。

在另一个方面，基于冲突区障碍物的行驶轨迹预测，通过第一时刻和第二时刻障碍目标的运动状态量确定其在对应时刻的决策信息，进而判断障碍目标是否加速行驶至目标车辆的前方设定位置，在此场景下，认为障碍目标的原决策信息不准确，可以使用障碍目标的行驶轨迹，对障碍目标在冲突区的决策信息进行修正，从而为目标车辆的轨迹重新规划或修正提供更为准确的决策信息基础。

附图说明

图1是根据本申请一实施例冲突区障碍物轨迹预测方法和冲突区障碍物决策信息修正方法的应用架构图；

图2是根据本申请一实施例冲突区障碍物轨迹预测方法和冲突区障碍物决策信息修正方法的应用场景图；

图3是在S-T图中的障碍目标决策信息示意图；

图4是在S-T图中的位于目标车辆后方的障碍目标决策信息示意图；

图5是在S-T图中，障碍目标的决策信息加速扫向目标车辆前方设定位置的示意图；

图6是根据本申请一实施例冲突区障碍物轨迹预测方法的流程图；

图7是根据本申请一实施例冲突区障碍物轨迹预测方法冲突区障碍物决策信息修正方法的应用场景图，其中障碍目标具有转弯意图。

图8是根据本申请一实施例冲突区障碍物轨迹预测方法中，仅滤波前后的障碍目标轨迹仿真图；

图9a至图9e是根据本申请一实施例冲突区障碍物轨迹预测方法中，未经过正则化的障碍目标预测轨迹仿真图；

图10a至图10e是根据本申请一实施例冲突区障碍物轨迹预测方法中，经过正则化的障碍目标预测轨迹仿真图；

图11是根据本申请一实施例冲突区障碍物决策信息修正方法的流程图；

图12是根据本申请一实施例冲突区障碍物决策信息修正方法中，对障碍目标的决策信息在S-T图中进行修正的示意图；

图13是根据本申请一实施例冲突区障碍物轨迹预测装置的模块图；

图14是根据本申请一实施例冲突区障碍物决策信息修正装置的模块图；

图15是根据本申请一实施例无人车的硬件结构图。

具体实施方式

以下将结合附图所示的各实施方式对本申请进行详细描述。但该等实施方式并不限制本申请，本领域的普通技术人员根据该等实施方式所做出的结构、方法、或功能上的变换均包含在本申请的保护范围内。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在介绍本申请实施例之前，对本申请实施例涉及的基础技术和一些技术术语进行示意性的解释：

自动驾驶：指不需要测试驾驶员执行物理性驾驶操作的情况下，能够对车辆行驶任务进行指导与决策，并代替测试驾驶员操控行为使车辆完成安全行驶的功能。自动驾驶技术通常包括高精地图、环境感知、行为决策、路径规划、运动控制等技术。

自动驾驶系统：实现车辆的不同级别的自动驾驶功能的系统，例如辅助驾驶系统(L2)、需要人监管的高速自动驾驶系统(L3)和高度/完全自动驾驶系统(L4/L5)。

图1为本申请实施例涉及的系统架构的一个可选的示意图。如图1所示，传感器采集当前环境的障碍目标信息，传感器将采集到的障碍目标信息发送给服务器，服务器接收传感器发送的障碍目标信息，并进行障碍目标运动状态的预测和修正更新。服务器在积累了多个时刻的障碍目标运动状态(经修正)后，进行障碍目标的行驶轨迹的拟合。服务器可以将拟合的行驶轨迹进一步发送给终端设备，如车载终端和用户终端。

上述的架构中，传感器可以安装于路边设备，也可以是车辆上集成的传感器，服务器可以是第三方服务器，例如新石器公司的服务器，该服务器用于根据传感器数据进行冲突区场景下障碍目标的轨迹预测；服务器还可以是车载设备，车载设备根据传感器数据对冲区域场景下障碍目标进行轨迹预测。

继续参图1，应用本申请冲突区障碍物轨迹预测方法的一个具体场景中，可以包括服务器和终端设备。其中，终端设备可以包括车载终端和用户终端。车载终端可以包括行车电脑或车载单元(On BoardUnit，OBU)等。车载终端还可以是终端上的应用程序(application，APP)、智能后视镜上的APP、手机上的APP或小程序等，在此不作限定。用户终端(user equipment，UE)可以是无线终端设备也可以是有线终端设备，无线终端设备可以是指一种具有无线收发功能的设备，用户终端可以是手机(mobilephone)、平板电脑(Pad)、带无线收发功能的电脑、虚拟现实(Virtual Reality，VR)用户设备、增强现实(AugmentedReality，AR)用户设备、智能语音交互设备、智能家电、车载终端、飞行器等，在此不作限定。

终端通过网络与服务器进行通信。数据存储系统可以存储服务器需要处理的数据，数据存储系统可以单独存在，也可以集成在服务器上。服务器获取终端上传的冲突车道上障碍目标的初始运动量，并进行当前运动状态预测；再基于障碍目标的当前运动状态观测量修正当前运动状态预测量；在积累了多个时刻的当前运动状态修正量后，服务器进行障碍目标的行驶轨迹拟合，该行驶轨迹可以指示障碍目标在将来一定时刻内的运动状态。服务器可以将获得障碍目标的行驶轨迹回传至终端。更进一步的，服务器还可以基于该行驶轨迹进行障碍目标在冲突区决策信息的修正。服务器先通过第一时刻和第二时刻障碍目标的运动状态量，确定障碍目标在第一时刻和第二时刻的决策信息，进而判断障碍目标是否加速行驶至目标车辆的前方设定位置；若是，服务器基于上述拟合得到的障碍目标行驶轨迹，对障碍目标在冲突区的决策信息进行修正。服务器还可以基于修正后的决策信息重新规划目标车辆的行驶轨迹，并回传至终端。无人车基于终端接收的新的行驶轨迹，对障碍目标进行避让。

可以理解，以上只是以服务器为例，示范性地解释本申请冲突区障碍物轨迹预测方法和决策信息修正方法的一可能执行主体，在更多的实施例中，也可以是由算力足够的终端设备直接执行冲突区障碍物的轨迹预测和决策信息修正，本申请对此不作限制。并且，无论是何种类型的服务器/终端设备，本申请实施例提供的冲突区障碍物轨迹预测方法和决策信息修正方法都可以适配于无人车的自动驾驶系统，包括L2、L3、L4及以上级别的自动驾驶系统。

在已有的针对无人车轨迹预测的方法中，①基于物体检测的方法：通过使用传感器如激光雷达、摄像头等，对周围环境中的物体进行检测和跟踪，从而预测它们未来的运动轨迹。这种方法可以使用各种目标检测和跟踪算法，如YOLO(You Only Look Once)或Faster R-CNN(Region-based Convolutional Neural Network)；②运动模型：通过对车辆或其它交通参与者的运动行为建模，预测它们未来的轨迹。这可以基于物理学规律，如牛顿定律，也可以使用更高级的运动模型，如常用的匀速直线运动或更复杂的非线性模型。③机器学习方法：使用如循环神经网络(RNN)、长短时记忆网络(LSTM)、或者变分自编码器(VAE)等，对历史轨迹数据进行学习，并预测未来轨迹。这种方法能够捕捉到复杂的非线性关系，适用于处理实际驾驶场景中的不确定性。④社交驾驶模型：考虑到交通参与者之间的相互影响和社交规则，将轨迹预测问题建模为社交驾驶问题。这包括了考虑车辆之间的互动、合作和竞争等因素，使得预测更符合真实道路交通的情况。⑤不确定性建模：考虑实际驾驶场景中的不确定性，专注于对预测结果的不确定性进行建模。这有助于系统更好地理解可能的风险和错误，提高系统的鲁棒性。

尽管有上述多种的轨迹预测方法，但由于无人车实际行驶场景的多样性和复杂性，以及出于轨迹预测的效率和成本等的考量。如何在面对实际的应用场景时，有针对性地给出可靠有效的轨迹预测方法，仍然是自动驾驶领域探索的难点。为了更好地说明本申请各实施例的创造性所在，以下将先对本申请各实施例期望解决的冲突区障碍物轨迹预测进行场景说明。

如图2所示，“冲突区”基于目标车辆T1所处的当前车道A和冲突车道B定义。车道A和冲突车道B具有至少一个交汇区域R，目标车辆T1在车道A上朝向交汇区域R行驶，此时，若冲突车道B上存在另一障碍目标T2(例如其它车辆或行人等)也朝向交汇区域R行驶，则在交汇区域R有产生冲突的可能；因此，对于此时的目标车辆T1而言，该交汇区域R即可以理解为冲突区。对应地，如果目标车辆T1已经驶过了交汇区域R，假定车道上的逆行行为不被允许，则目标车辆T1不会在交汇区域R有和冲突车道B上其它障碍目标产生冲突的可能，这样的场景下，交汇区域R对于目标车辆T1而言，不再被称为本申请各实施例中的“冲突区”。

继续参图2，在一些更具体的场景中，冲突车道B和目标车辆T1所处的当前车道A在经过冲突区后具有不同的延伸方向，并且障碍目标T2在冲突车道B的转向引导下朝向冲突区行驶，障碍目标T2的行驶朝向(如t2、t3、t4时刻的朝向)与目标车辆T1的行驶轨迹有干涉。可以理解的是，这些更具体的场景并非是用于对本申请冲突区障碍物轨迹预测方法的应用场景限制。

配合参图3，目标车辆速度规划的主决策器运行迭代推演算法，输入障碍目标的决策信息，即：障碍目标在未来时刻占据目标车辆所处车道的时间和位置，同时，在S-T图中，决策信息的边界斜率表征为障碍目标的投影速度。配合参图4，迭代推演时可以对目标车辆的前方障碍目标有相对较好的处理，但目标车辆的后方障碍物若以较近的距离和较快的速度跟弛于目标车辆后方，会导致其决策信息从目标车辆的S-T图的横轴下方钻入，迭代推演时纳入该决策信息会导致目标车辆的车速必须大于该后方障碍目标。如此做法的不合理原因在于：在一般规则场景下，后方的障碍目标会因为目标车辆的降速而进行反应(减速)。可以看出，在这样的算法架构下，导致上述不合理的根本原因在于无法获得障碍目标的预测轨迹。

继续参图2，障碍目标T2沿着冲突车道B朝向交汇区域R(即冲突区)行驶，目标车辆可以获知障碍目标T2的速度、位置和行驶朝向(若障碍目标T2为车辆，即可对应车头朝向)。基于匀速直线运动模型，对障碍目标不同时刻的决策信息进行跟踪，在t2、t3和t4时刻，障碍目标的朝向持续扫向目标车辆的车头前方。配合参图5，在与图2场景对应的S-T图中，障碍目标的决策信息表现为不断移动至目标车辆前方设定位置。同时，在目标车辆迭代推演的速度规划连续帧间表现为：障碍目标不断加速移动至目标车辆前方设定位置，t2时刻规划的目标车辆轨迹L2在t3时刻不再适用，T3时刻需要进一步提前降速并重新规划轨迹L3；类似地，可以推演t4时刻的场景，在此不再赘述。由此带来的问题是，若障碍目标具有沿冲突车道转弯的“意图”，目标车辆可能最终减速/刹车不及时，进而与障碍目标产生碰撞。

在一些方面，可以基于物体检测或机器学习等方法，对障碍目标的轨迹进行预测，这些做法的效果未知。在需要考虑预测算法的轻量性、易上车性等诸多问题前提下，选择合适的解决路径，提出一种可适应上述场景冲突区障碍物的轨迹预测方法，其创造性变得显而易见。

具体参图6，介绍本申请冲突区障碍物轨迹预测方法的一实施例。在本实施例中，该方法包括：

S111、获取目标车辆与冲突区的相对位置。

本实施例中，冲突区由目标车辆所处的当前车道和冲突车道交汇形成，目标车辆沿当前车道朝向冲突区行驶。如图7所示，目标车辆T1与冲突区R1的相对位置可以指目标车辆与冲突区R1的距离，具体地，目标车辆与冲突区R1的距离可以是指目标车辆与冲突区外廓的最小间距、又或者可以是指目标车辆与冲突区中心位置的间距等，本申请对此不作限制。

目标车辆T1与冲突区R1的相对位置可以基于地图获取。目标车辆T1可以预先离线存储地图信息，也可以与地图服务器建立无线通信，然后从地图服务器处实时获取地图信息。其中，地图信息可以包括车道中心线、车道边界等。

例如，目标车辆T1基于地图信息获知当前车道A和车道B在前方具有车道线的交汇，即可以将交汇重叠的部分确定为冲突区R1。同时，目标车辆基于地图信息确定其与冲突区R1中心的距离h，并作为此时目标车辆与冲突区R1的相对位置。

S112、在相对位置满足预设条件时，获取冲突车道上障碍目标的初始运动状态量。

本实施例中，该预设条件可以是目标车辆T1与冲突区R1的距离是否小于预设的距离阈值(例如10米)。基于对该预设条件的判断结果，决定是否获取冲突车道B上障碍目标T2的初始运动量，以进行后续的障碍目标行驶轨迹预测。

具体地，可以是目标车辆T1基于自车搭载的传感器，直接获取障碍目标T2的初始运动状态量；又或者，在道路周边设有与传感器有线/无线连接的边缘通信设备，目标车辆T1可以与边缘通信设备建立无线通信，这样目标车辆T1便可以通过边缘通信设备，间接地实时获取传感器感知的数据，进而从中获取障碍目标T2的初始运动状态量。

示范性地，传感器可以为摄像头、超声波雷达、激光雷达、毫米波雷达、全球卫星定位系统(global navigation satellite system，GNSS)、惯性导航系统(inertialnavigationsystem，INS)等器件中一个或多个。

传感器可以安装在车辆的车头、车门、车尾、车顶、车体内等位置上。传感器通过对车辆、车辆所处道路和车辆周围的其它车辆进行检测，以获取车辆的横向速度、纵向速度、横摆角等信息，车辆所处道路是否有车道中心线、车道中心线结构、路沿等信息，车辆周围的每个车辆的横向速度、纵向速度、全局位置、相对位置、刹车灯、左转向灯、右转向灯、瞬时角速度、横摆角、航向角等信息。

本实施例中，障碍目标T2沿冲突车道B朝向冲突区R1行驶，且获取的障碍目标T2的初始运动状态量可以包括障碍目标T2的位置和速度。示范性地，对于毫米波雷达来说，一般包括发送单元、接收单元和处理单元；处理单元可以根据发送单元发送超声波信号与接收单元接收到超声波信号之间的时间差，计算出障碍目标与超声波雷达之间的距离、障碍目标的形状、障碍目标的速度等信息。对于摄像头来说，根据摄像头获取的相邻多个帧图像上障碍目标的位置变化，计算出障碍目标的速度、位置、瞬时角速度、横摆角等信息。

在一些实施例中，可能期望在当前时刻基于障碍目标T2的初始运动状态量执行如下所述的对运动状态的预测，而由于系统的设定或人为偏好等原因，目标车辆T1并未获取/存储有当前时刻之前的运动状态量。在这样的情况下，也可以通过随机初始化的方式，为障碍目标T2的初始运动状态量进行赋值，例如设定：

X＝[1,1,0,0]'

其中，X表示为障碍目标的初始运动状态量，矩阵中的前两项(1,1)为障碍目标的初始位置，后两项(0,0)为障碍目标的初始速度。

S113、基于障碍目标的初始运动量进行运动状态预测，获得障碍目标的当前运动状态预测量。

假设障碍目标T2的初始运动状态量是对障碍目标T2真实的初始运动状态的一个最优估计，那么其状态协方差矩阵可以表示为：

S＝state_uncertain*eye(4)

以p表示位置，v表示速度，该状态协方差矩阵中包括了Σ

考虑到外部因素对障碍目标T2的影响，还可以假设该影响造成的系统误差服从均值为0的高斯分布，那么可以初始化过程激励噪声协方差为：

Q＝[T^2/4,0,T^3/2,0；0,T^2/4,0,T^3/2；T^3/2,0,T^2,0；0,T^3/2,0,T^2]。

在以上设定的基础上，使用第一状态转移矩阵和状态控制矩阵对障碍目标T2的初始运动状态量进行运动状态预测，获得障碍目标T2的当前运动状态预测量，表示为：

X(t)＝A*X(t-1)+B*u(t)+高斯分布均值(设定为0)

其中，A为第一状态转移矩阵，B为状态控制矩阵，u(t)为状态控制向量。状态控制矩阵B代表加减速如何改变障碍目标T2的状态，状态控制向量u(t)代表控制的力度大小和方向，将上述障碍目标T2初运动状态量X带入X(t-1)，即可获得障碍目标T2的当前运动状态预测量。

本实施例中，为了利用障碍目标T2的当前运动状态观测量修正障碍目标T2的当前运动状态预测量，还可以在上述预测过程中，使用第一状态转移矩阵、过程激励噪声协方差矩阵对障碍目标T2的初始状态协方差矩阵进行预测，获得障碍目标T2的当前协方差预测矩阵。障碍目标T2的当前协方差预测矩阵表示为：

S(t)＝A*S(t-1)*A'+Q。

将上述障碍目标T2的初始状态的状态协方差矩阵S带入S(t-1)，即可获得障碍目标T2的当前协方差预测矩阵。

S114、获取障碍目标的当前运动状态观测量以修正障碍目标的当前运动状态预测量，获得障碍目标当前运动状态修正量。

本实施例中，使用障碍目标T2的当前运动状态观测量修正障碍目标T2的当前运动状态预测量，是为了融合预测和观测的结果，充分利用两者的不确定性得到更加准确的估计。

具体地，可以基于障碍目标T2的当前协方差预测矩阵、第二状态转移矩阵、以及测量噪声矩阵，计算当前的卡尔曼增益，再基于当前的卡尔曼增益、以及障碍目标T2的当前运动状态观测量和障碍目标T2的当前运动状态预测量的误差，修正障碍目标T2的当前运动状态预测量，获得障碍目标T2的当前运动状态修正量。

在获得障碍目标T2的当前运动状态预测量后，假定其与障碍目标T2的的真实运动状态之间应该具备特定的关系，类似地，这里可以通过第二状态转移矩阵H描述这个关系。第二状态转移矩阵H可以设置为：

H＝[1,0,0,0；0,1,0,0]'

同时，对于障碍目标T2的当前运动状态观测量而言，由于噪声的干扰，其与障碍目标T2的的真实运动状态之间也必然存在差异。可以假设观测噪声是一个均值为0，协方差矩阵(即测量噪声矩阵)为R的高斯分布，即

R＝meas_uncertain*[1,0；0,1]。

对应的，卡尔曼增益可以表示为：

K＝S*H'*inv(H*S*H'+R)。

障碍目标T2的当前运动状态修正量可以表示为：

X'＝X+K*(input-H*X)

其中，input代表障碍目标T2的当前运动状态观测量，input-H*X代表障碍目标T2的当前运动状态观测量和障碍目标T2的当前运动状态预测量的误差。可以看出，卡尔曼增益可以看做此时的一个修正权重，整个修正的过程即期望排除各种噪声对障碍目标T2的当前真实运动状态的干扰，也即一个滤波的过程。

同样的，可以基于卡尔曼增益，对障碍目标T2的当前协方差预测矩阵进行更新，表示为：

S'＝(eye(4)-K*H)*S。

可以看出，上述的滤波过程可以是不断迭代的，由前一时刻的滤波结果X和输入input，先预测状态X和状态协方差；再由输入对状态和状态协方差进行修正更新；经过多次迭代的修正更新后就能得到较为准确的障碍目标T2的运动状态量。

在以上迭代的过程中，需要关注的是不断迭代的系统变量，分别为障碍目标T2的初始运动状态量、障碍目标T2的当前协方差预测矩阵、以及卡尔曼增益。可以理解的是，在迭代过程中，t时刻的障碍目标T2的当前运动状态修正量会作为t+1时刻的障碍目标T2的初始运动状态量，以获得t+1时刻障碍目标T2的当前运动状态修正量；t时刻的障碍目标T2的当前协方差预测矩阵会作为t+1时刻的障碍目标T2的初始状态协方差矩阵，以获得t+1时刻障碍目标T2的当前协方差预测矩阵。

以上的过程可以视为一次卡尔曼滤波的过程，过程激励噪声协方差Q和观测噪声协方差R的取值可以根据具体场景的需要进行设置和调整。在初始化时，可以将过程激励噪声协方差Q和观测噪声协方差R都设置为较小的正值，并通过观察卡尔曼滤波输出和实际观测值之间的残差和状态预测值评估滤波性能；随后，根据观察结果逐步调整过程激励噪声协方差Q和观测噪声协方差R，其中，增大过程激励噪声协方差Q可以使得系统更快地适应变化，增大观测噪声协方差R可以减小对实际观测值的信任度；通过多次的迭代优化，最终找到合适的过程激励噪声协方差Q和观测噪声协方差R的值。

参图8，可以看出经过上述卡尔曼滤波过程后，障碍目标T2轨迹中的部分折点(受噪声影响较大)被滤除，为后续的行驶轨迹拟合提供了良好的数据基础。

S115、基于障碍目标在多个时刻的当前运动状态修正量，拟合障碍目标的行驶轨迹。

根据目标车辆T1系统的预先设定或者当前用户的风格设定，可以对拟合障碍目标T2所需的数据量进行设定。例如，可以连续地获取3秒内的障碍目标T2的初始运动状态量，并在这段时间内不断地迭代(例如以20Hz的频率)，获得多个时刻的障碍目标T2的当前运动状态修正量。

具体地，可以基于三次样条曲线拟合多个时刻的障碍目标T2的位置(轨迹点)，以生成障碍目标T2的行驶轨迹，其中，该三次样条曲线的二次项和三次项施加有正则化约束，且三次项的正则化约束大于二次项的正则化约束。

如果设定在区间[a，b]上给定一组轨迹点x

本实施例中，三次样条曲线在相邻的两个轨迹点之间可以表示为：

f(x

可以看出，在相邻的两个轨迹点之间的三次样条曲线都有四个未知数(w

本实施例中，通过建立障碍目标T2在多个时刻的位置相对三次样条曲线偏差平方和的损失函数，并在上述正则化的约束下，以最小化该损失函数的方向求解三次样条曲线的系数矩阵，以生成障碍目标T2的行驶轨迹。

损失函数可以表示为：

这样，可以令该损失函数的偏导为0，表示为：

所以，拟合各相邻轨迹点之间的三次样条曲线的系数(w

本实施例中，考虑到障碍目标T2的预测轨迹可以用于后续的障碍物决策信息修正，也可以将多个时刻的障碍目标T2的位置(轨迹点)转换为S-L坐标系。例如，上述的一组轨迹点x

进一步地，在考虑正则化约束时，上述的方程组可以表示为：

其中，rc表示对三次样条曲线的二次项的正则化约束，rd表示对三次样条曲线的三次项的正则化约束。通过这样的正则化设置，可以使得对障碍目标T2的轨迹预测更为准确，其优势特别是在用于拟合的轨迹点数量更少时明显地体现。

参图9a至图9e，为未加入正则化前对障碍目标的行驶轨迹拟合结果。从图9a至图9e，用于拟合行驶轨迹的轨迹点(对应当前运动状态修正量)积累逐渐增多。可以看出，从图9a至图9c，轨迹点实质上表征障碍目标仍然处于直行状态，但拟合出的行驶轨迹在终端产生甩动，表示预测障碍目标会有转弯意图，这可能存在预测的不合理。从图9d至图9e，轨迹点表征障碍目标已经有转弯趋势，此时拟合出的轨迹可以合理的预测障碍目标的这种意图。整体而言，未加入正则化前，需要用于拟合的轨迹点数量更多时可以具有满意的行驶轨迹预测效果。

参图10a至图10e，为加入正则化后对障碍目标的行驶轨迹拟合结果。从图10a至图10e，用于拟合行驶轨迹的轨迹点(对应当前运动状态修正量)积累逐渐增多。可以看出，无论轨迹点的多少，都可以根据当前轨迹点的实际状态趋势，对未来时刻的行驶轨迹进行合理的拟合。因此，在本申请实施例示出的场景中，可以对冲突区障碍目标的意图(是否转弯)有良好的预测效果。

参图11，介绍本申请冲突区障碍物决策信息修正方法的一实施例。在本实施例中，该方法包括：

S121、获得障碍目标的行驶轨迹。

具体地，障碍目标在冲突区的行驶轨迹可以基于上述各实施例进行拟合，在此不再赘述。

S122、基于第一时刻和第二时刻障碍目标的运动状态量，确定障碍目标在第一时刻和第二时刻的决策信息。

S123、基于第一时刻和第二时刻的决策信息，判断障碍目标是否加速行驶至目标车辆的前方设定位置。

障碍目标的运动状态量可以包括障碍目标的速度、位置和行驶朝向，决策信息为障碍目标在对应时刻占据目标车辆所处车道的时间和位置。障碍目标的决策信息可以基于多种方式确定，如匀速直线运动模型、非线性模型等。

以匀速直线运动模型为例，可以假设障碍目标在每一时刻都是以当前速度进行匀速直线运动，这样，结合障碍目标的当前位置和行驶朝向，即可获得障碍目标在将来时刻占据目标车辆所处车道的时间和位置。

由于第二时刻为第一时刻之后的时刻，因此，若第二时刻时障碍物的决策信息相对第一时刻时障碍物的决策信息加速行驶至目标车辆的前方设定位置(例如目标车辆车头前方0.5米处)，则表示此时障碍目标的决策信息不合理，需要进行修正。

S124、基于障碍目标的行驶轨迹，修正障碍目标在冲突区的决策信息。

障碍目标在冲突区的决策信息可以理解为：假定障碍目标的位置处于冲突区的前提，确定障碍目标对应该位置的时刻。由于障碍目标的行驶轨迹已知，可以在例如S-T图中确定修正后障碍目标在冲突区的决策信息。配合图7和图12所示，障碍目标的原决策信息在S-T图中表现为在t2时刻占据目标车辆前方的距离k处，经修正后，障碍目标的决策信息在S-T图中表现在为t1时刻占据目标车辆前方的距离h处。基于修正后的决策信息，目标车辆可以根据合适的轨迹规划方法重新进行轨迹规划或者对原有的规划轨迹进行修正，本申请对此不作限制。

参图13，介绍本申请冲突区障碍物轨迹预测装置的一实施例。在本实施例中，该冲突区障碍物轨迹预测装置包括第一获取模块211、第二获取模块212、预测模块213、第一修正模块214以及拟合模块215。

第一获取模块211用于获取目标车辆与冲突区的相对位置，其中，所述冲突区由所述目标车辆所处的当前车道和冲突车道交汇形成；第二获取模块212用于在所述相对位置满足预设条件时，获取所述冲突车道上障碍目标的初始运动状态量，其中，所述初始运动状态量包括障碍目标的位置和速度，所述障碍目标沿冲突车道朝向冲突区行驶；预测模块213用于基于所述障碍目标的初始运动量进行运动状态预测，获得所述障碍目标的当前运动状态预测量；第一修正模块214用于获取所述障碍目标的当前运动状态观测量以修正所述障碍目标的当前运动状态预测量，获得所述障碍目标当前运动状态修正量；拟合模块215用于基于所述障碍目标在多个时刻的当前运动状态修正量，拟合所述障碍目标的行驶轨迹。

一实施例中，拟合模块215具体用于基于三次样条曲线拟合所述障碍目标在多个时刻的位置，以生成所述障碍目标的行驶轨迹，其中，所述三次样条的二次项和三次项施加有正则化约束，且所述三次项的正则化约束大于二次项的正则化约束。

一实施例中，拟合模块215具体用于建立所述障碍目标在多个时刻的位置相对三次样条曲线偏差平方和的损失函数；在所述正则化约束下，以最小化所述损失函数的方向求解所述三次样条曲线的系数矩阵，以生成所述障碍目标的行驶轨迹。

一实施例中，预测模块213具体用于将t时刻障碍目标的当前运动状态修正量作为t+1时刻障碍目标的初始运动状态量，以获得t+1时刻障碍目标的当前运动状态修正量。

一实施例中，预测模块213具体用于使用第一状态转移矩阵和状态控制矩阵对所述障碍目标的初始运动状态量进行运动状态预测，获得所述障碍目标的当前运动状态预测量；获取所述障碍目标的当前运动状态观测量以修正所述障碍目标的当前运动状态预测量，获得所述障碍目标当前运动状态修正量，具体包括：使用所述第一状态转移矩阵、过程激励噪声协方差矩阵对障碍目标初始状态协方差矩阵进行预测，获得所述障碍目标的当前协方差预测矩阵；基于所述障碍目标的当前协方差预测矩阵、第二状态转移矩阵、以及测量噪声矩阵，计算当前的卡尔曼增益；基于所述当前的卡尔曼增益、以及障碍目标的当前运动状态观测量和当前运动状态预测量的误差，修正所述障碍目标的当前运动状态预测量，获得所述障碍目标的当前运动状态修正量。

参图14，介绍本申请一种冲突区障碍物决策信息修正装置的一实施例。在本实施例中，该冲突区障碍物决策信息修正装置包括轨迹预测模块221、确定模块222、判断模块223以及第二修正模块224。

轨迹预测模块221用于基于上述的方法获得障碍目标的行驶轨迹；确定模块222用于基于第一时刻和第二时刻所述障碍目标的运动状态量，确定所述障碍目标在第一时刻和第二时刻的决策信息，其中，所述第二时刻在第一时刻之后，所述运动状态量包括位置和速度，所述决策信息为障碍目标在对应时刻占据目标车辆所处车道的时间和位置；判断模块223用于基于所述第一时刻和第二时刻的决策信息，判断所述障碍目标是否加速行驶至目标车辆的前方设定位置；第二修正模块224用于在所述障碍目标加速行驶至目标车辆的前方设定位置时，基于所述障碍目标的行驶轨迹，修正所述障碍目标在冲突区的决策信息。

如上参照图1至图12，对根据本说明书实施例冲突区障碍物轨迹预测方法和决策信息修正方法进行了描述。在以上对方法实施例的描述中所提及的细节，同样适用于本说明书实施例的冲突区障碍物轨迹预测装置和决策信息修正装置。上面的冲突区障碍物轨迹预测装置和决策信息修正装置可以采用硬件实现，也可以采用软件或者硬件和软件的组合来实现。

图15示出了根据本说明书的实施例的无人车的硬件结构图。如图9所示，无人车30可以包括至少一个处理器31、存储器32(例如非易失性存储器)、内存33和通信接口34，并且至少一个处理器31、存储器32、内存33和通信接口34经由内部总线35连接在一起。至少一个处理器31执行在存储器32中存储或编码的至少一个计算机可读指令。

应该理解，在存储器32中存储的计算机可执行指令当执行时使得至少一个处理器31进行本说明书的各个实施例中以上结合图1至图12描述的各种操作和功能。

在本说明书的实施例中，无人车30可以配置功能终端承载上述的硬件结构，该终端可以包括但不限于：个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动电子设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴电子设备、消费电子设备等等。

根据一个实施例，提供了一种比如机器可读介质的程序产品。机器可读介质可以具有指令(即，上述以软件形式实现的元素)，该指令当被机器执行时，使得机器执行本说明书的各个实施例中以上结合图1-图12描述的各种操作和功能。具体地，可以提供配有可读存储介质的系统或者装置，在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下，从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此机器可读代码和存储机器可读代码的可读存储介质构成了本说明书的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上或云上下载程序代码。

本领域技术人员应当理解，上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此，本说明书的保护范围应当由所附的权利要求书来限定。

需要说明的是，上述各流程和各系统结构图中不是所有的步骤和单元都是必须的，可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的，可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构，也可以是逻辑结构，即，有些单元可能由同一物理客户实现，或者，有些单元可能分由多个物理客户实现，或者，可以由多个独立设备中的某些部件共同实现。

以上各实施例中，硬件单元或模块可以通过机械方式或电气方式实现。例如，一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器，FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器)，可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上面结合附图阐述的具体实施方式描述了示例性实施例，但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说，对本公开内容进行的各种修改是显而易见的，并且，也可以在不脱离本公开内容的保护范围的情况下，将本文所对应的一般性原理应用于其它变型。因此，本公开内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：新石器(盐城)智能制造有限公司;

上一篇：电流环自适应控制方法以及装置
下一篇：信道接入方法及装置、计算机可读存储介质