连续参考线决策方法及装置、车辆、存储介质

文献发布时间：2023-06-19 16:12:48

技术领域

本发明涉及自动驾驶技术领域，尤其涉及一种连续参考线决策方法、连续参考线决策装置、以及车辆和存储介质。

背景技术

随着人工智能的发展，车辆的自主或半自主驾驶技术逐渐得到广泛应用。而在车辆自动驾驶领域中，参考线是自动驾驶车辆的路径规划的重要参考和依据。其中，在自动驾驶领域，参考线通常是指车道或道路的中心线。

而在实际场景下，由于结构化工况道路的复杂性，自动驾驶车辆在行驶过程中往往需要实时根据驾驶任务及周围环境调整当前行驶车道，因此，在自动驾驶车辆的路径规划过程中，对当前行驶的车道的决策和选择已成为路径规划的重要内容。目前，进行车道决策和选择通常都是以参考线作为依据的，因而在驾驶过程中对车道的决策和选择实际上就是对目标参考线的决策和选择，可见，目标参考线选取的可靠性严重影响着路径规划的安全性、舒适性和路径效率。然而，驾驶环境的复杂多变、上层感知的不确定性以及乘客主观感受的差异等都为目标参考线的选取提出了很大的挑战，因此设计一种安全合理且鲁棒性强的目标参考线选择方法已成为业内亟待解决的迫切需求。

发明内容

本发明实施例提供一种连续参考线决策方案，以解决现有技术中进行路径规划时，难以安全合理选取目标参考线的问题。

第一方面，本发明实施例提供一种连续参考线决策方法，所述方法包括

确定参考线的语义信息，其中，确定的语义信息包括用于意图决策的第一语义信息组和用于方向决策的第二语义信息组；

根据第一语义信息组确定参考线切换意图；

根据参考线切换意图和各参考线的第二语义信息组选择最优参考线；

根据选择的最优参考线确定目标参考线。

第二方面，本发明实施例提供一种连续参考线决策装置，所述装置包括

语义生成模块，用于确定参考线的语义信息，其中，确定的语义信息包括用于意图决策的第一语义信息组和用于方向决策的第二语义信息组；

意图决策模块，用于根据第一语义信息组确定参考线切换意图；

方向决策模块，用于根据参考线切换意图和各参考线的第二语义信息组选择最优参考线；和

目标决策模块，用于根据选择的最优参考线确定目标参考线。

第三方面，本发明实施例提供了另一种连续参考线决策装置，其包括：

存储器，用于存储可执行指令；以及

处理器，用于执行存储器中存储的可执行指令，所述可执行指令在由所述处理器执行时实现本发明任一实施例方法的步骤。

第四方面，本发明实施例提供了一种车辆，其包括：

决策器，用于根据本发明实施例的任一连续参考线决策方法进行目标参考线决策；和

控制器，用于根据所述决策器确定的目标参考线对车辆进行控制。

第五方面，本发明提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任一实施例方法的步骤。

本发明实施例的有益效果在于：本发明实施例提供的方法通过确定参考线的多组语义信息，实现了从不同维度对参考线的状态进行评价，并且本发明实施例提供的方法将参考线决策分为意图决策、方向决策和切换目标决策三个阶段，在决策的各个阶段分别应用部分语义信息进行决策分析，不但使得决策过程清晰直观且具有可解释性，而且能够方便根据需求对决策分析的评价参数即语义信息进行灵活调整，提高参考线代价评估的可调试性和可扩展性，进而能够有效保证决策结果的一致性；此外，本发明实施例的方法采用为参考线确定的语义信息进行参考线决策，还能够直观反映决策过程中不同维度的参考线状态对决策结果的影响，使得决策结果具有可解释性，保证决策结果的合理性和可靠性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施方式的连续参考线决策方法的流程图；

图2示意性地显示了根据高精度地图和感知信息来确定参考线的第一语义选项的具体场景效果展示图；

图3示意性地示出了根据高精度地图和感知信息来确定参考线的第二语义选项的具体处理流程图；

图4示意性地示出了根据高精度地图和感知信息来确定参考线的第二语义选项的具体场景效果展示图，其中，图4A所示为结构化道路工况下的自车与感知到的障碍物的关系地图，图4B所示为对图4A所示的环境地图构建的参考线ST图；

图5示意性地显示了根据高精度地图和感知信息来确定参考线的第三语义选项的具体场景效果展示图；

图6示意性地显示了本发明另一实施例的连续参考线决策方法的流程图；

图7为本发明一实施方式的连续参考线决策装置的原理框图；

图8为本发明另一实施方式的连续参考线决策装置的原理框图；

图9为本发明一实施方式的自动驾驶车辆的原理框图；

图10为本发明的连续参考线决策装置的一实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“装置”、“系统”等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地系统、分布式系统中另一元件交互的，和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明实施例中的连续参考线决策方法可以应用在连续参考线决策装置中，以使得用户或自动驾驶设备能够利用连续参考线决策装置来获取目标参考线，以控制自动驾驶设备根据该目标参考线进行路径规划或执行相应的行驶动作。这些连续参考线决策装置例如包括但不限于自动驾驶车辆上的规划器或决策器、智能平板、个人PC、计算机、云端服务器等。特别地，本发明实施例中的连续参考线决策方法还可以直接应用在自动驾驶车辆等自动驾驶设备上，本发明对此不作限定。

图1示意性地显示了根据本发明一实施方式的连续参考线决策方法，该方法的执行主体可以为自动驾驶车辆上的规划器或控制器或决策器，也可以为智能平板、个人PC、计算机、云端服务器等连续参考线决策装置的处理器，还可以为诸如无人清洁车、无人扫地车、扫地机器人、自动驾驶车辆等自动驾驶设备的处理器，本发明实施例不对此进行限制。本发明实施例优先以执行主体为自动驾驶车辆上的决策器为例进行详细阐述。如图1所示，本发明实施例的方法包括：

步骤S10：确定参考线的语义信息，其中，确定的语义信息包括用于意图决策的第一语义信息组、用于方向决策的第二语义信息组、以及用于可行性决策的第三语义信息组；

步骤S11：根据第一语义信息组确定参考线切换意图；

步骤S12：根据参考线切换意图和各参考线的第二语义信息组选择最优参考线；

步骤S13：根据选择的最优参考线的第三语义信息组确定目标参考线。

由于目标参考线的选取需要考量多方面因素，例如是否属于全局路径，是否可到达、是否具有速度优势等，因而，本发明实施例优选考虑将选取目标参考线的影响因素转换为语义信息，以使得能够根据确定的语义信息来实现目标参考线的决策，保证决策结果的一致性和合理性。其中，在本发明实施例中，转换得到的语义信息是连续且具有明确物理意义的信息，其优选通过具有连续性的可量化的代价值属性来体现，具有连续性是指用于表征其物理意义的代价值为连续量而非离散量。

在步骤S10中，确定参考线的语义信息具体可以根据参考线的影响因素来灵活确定，只要能够实现从多个维度来表征参考线在一段时间内的状态，以使得能够根据该状态进行合理的参考线选取即可。示例性地，本发明实施例中确定的语义信息优选是包括三种类型，即包括用于意图决策的语义信息、用于方向决策的语义信息和用于可行性决策的语义信息，本发明实施例分别称之为第一组语义信息、第二组语义信息和第三组语义信息。其中，在确定参考线的语义信息时，具体可以是根据实时获取的高精度地图和感知信息来确定。由于参考线的影响因素基本均能够通过高精度地图和感知信息来确定和获知，因此，根据获取的高精度地图和感知信息来确定参考线的语义信息也能够保证语义信息的实时性、真实性和有效性等。

具体地，可以根据预先确定的选取参考线的影响因素，来构建参考线的语义信息，其中，构建语义信息的方式可以根据该语义信息的物理意义来实现。之后，根据构建的语义信息从高精度地图和感知信息中提取相关联的数据信息，根据提取出的数据信息来确定参考线的语义信息。下文将会结合确定的具体影响因素和定义的语义信息的物理意义来说明具体如何根据高精度地图和感知信息来确定参考线的语义信息。

在构建和确定了参考线的语义信息后，本发明实施例通过步骤S11～S13三个阶段来实现连续参考线的决策。具体地，在步骤S11中会应用确定的部分语义信息来进行意图决策；在步骤S12中会在存在切换参考线的意图时，应用确定的部分语义信息来进行方向决策，筛选出最优的参考线；而在步骤S13中则会应用确定的部分语义信息对根据方向决策确定的最优参考线进行可行性决策。经过这三个阶段从不同角度的分别评价和决策，能够保证决策结果的一致性且能够使得决策结果更加合理。

需要说明的是，在具体实现中，根据步骤S10确定的参考线的语义信息的具体内容不同，在进行步骤S11～S13三个阶段的决策时，选用的语义信息也可以进行适应性调整。示例性地，可以在三个阶段分别选用不同的部分语义信息来进行相应的决策，也可以在某两个阶段中选用部分交叉重叠、部分不同的部分语义信息来进行相应的决策，在特定情况下，还可以在某两个阶段应用完全相同的部分语义信息来进行相应的决策，本发明实施例对各个决定具体应用的部分语义信息的内容和重合度不进行限制，只要能够实现本发明实施例通过将参考线的影响因素构建为参考线的语义信息，并应用语义信息分三个阶段(意图、方向、可行性决策)来实现连续参考线决策，以确定出更合理、更舒适、鲁棒性更高的目标参考线即可。其中，在本发明实施例中连续参考线决策是指用于参考线决策的参考线语义信息及由此计算得到的参考线的相应代价值是连续量而非离散量。

作为一种优选实施例，本发明实施例在意图决策阶段应用的部分语义信息即第一语义信息组与在方向决策阶段应用的部分语义信息即第二语义信息组是存在部分交叉重叠的，而在可行性决策阶段应用的部分语义信息即第三语义信息组是与第一语义信息组和第二语义信息组均不存在交叉的，即是应用的完全不同的语义信息。在具体实现中，根据确定的语义信息的内容不同，应用的第一语义信息组、第二语义信息组和第三语义信息组中均可以包括至少一个语义选项。

作为更优的实施例，本发明实施例基于对参考线的影响因素的考虑，确定出的语义信息的具体内容实现为包括：用于衡量参考线距离全局路径的远近程度的第一语义选项、用于描述参考线的堵塞程度的第二语义选项、用于衡量由自车当前位置到达参考线的难易程度的第三语义选项、用于描述自车到达参考线对行驶平稳性的影响的第四语义选项和用于描述自车到达参考线所存在的碰撞风险的第五语义选项。

其中，优选地，各语义选项的物理意义可以设置为是通过代价值来表征的，由此，语义信息包括的各语义选项实际上分别代表了一种具有特定意义的代价值。示例性地，根据各语义选项所代表的特定意义，可以为各语义选项做出如下定义：将第一语义选项定义为与车道变换紧迫程度呈正相关，将第二语义选项定义为与车道的拥堵程度呈正相关，将第三语义选项定义为与自车由当前位置到达参考线的难易程度呈正相关，将第四语义选项定义为与自车到达参考线的行驶平稳性呈负相关，将第五语义选项定义为与自车到达参考线所存在的碰撞风险呈正相关。

在预先确定了考虑的影响因素和其物理意义之后，即可根据获取的高精度地图和感知信息来动态、实时确定各参考线的语义信息，其中，各参考线是指所有的可供选取以作为目标参考线的待选取参考线，本发明实施例是通过对所有的可供选取的参考线分别进行语义信息的确定，并根据各个可供选取的参考线的语义信息来确定出可以切换的目标参考线，目标参考线是指可以切换至的目标车道的参考线。

示例性地，以第一语义选项被定义为是理想换道长度与剩余平均换道距离的比值为例，可以通过以下公式计算得到各个参考线的第一语义选项：

cost

其中，cost

由此，以图2所示的场景为例，根据高精度地图和感知信息来确定参考线的第一语义选项就可以实现为包括：如图2所示，可以通过高精度地图和感知信息确定出目前包括三个车道，即第一车道1、第二车道2和第三车道3，每个车道的参考线分别为第一参考线、第二参考线、和第三参考线，同时还可以根据感知信息确定出自车需要在路口右转的信息，因此，根据从高精度地图和感知信息提取出的这些信息，结合第一语义选项的物理意义可以计算出为了在路口右转，自第一参考线需向右进行两次车道变换(num＝2)才能实现全局路径目标，自第二参考线只需向右进行一次车道变换(num＝1)就可以实现全局路径目标，而自第三参考线不需要车道变换(num＝0)就可以实现全局路径目标；同时，根据感知信息和高精度地图还可以提取出目前各参考线距离右转路口的剩余长度，假设为图2所示的100米(s＝100)，理想换道长度也为100米(S＝100)，由此，根据从高精度地图和感知信息提取到的这些信息以及结合公式1，就可以确定出第一参考线的第一语义选项为2，第二参考线的第一语义选项为1，第三参考线的第一语义选项为0。

优选地，本发明实施例通过考虑动静态障碍物对自车可通行空间的影响，来描述各参考线的堵塞程度。具体地，可以是将第二语义选项定义为与障碍物对自车的可通行空间的影响呈正相关，即障碍物对自车可通行空间的影响越大，第二语义选项越大，由此，可以将第二语义选项设计成与障碍物对当前参考线的侵占空间的大小呈正相关。示例性地，以第二语义选项被定义为是障碍物占据空间与自车可通行空间的比值为例，其中，障碍物占据空间为障碍物对当前参考线的侵占空间的大小，其可以通过障碍物在参考线对应的ST图(即位移时间图)上的投影面积和堵塞系数来表征，自车可通行空间为自车按照期望速度行驶在规划时间内可以占据的空间，其可以通过该空间区域在ST图中的投影面积来表征，由此，各参考线的第二语义选项具体通过以下公式计算得到：

cost

其中，cost

α＝max(1,10

其中，d为障碍物到参考线边界的最大距离，w为自车的宽度。由于在能够沿参考线正常行驶的情况下，障碍物到参考线边界的最大距离d是大于自车宽度w的，而当障碍物占据参考线的横向距离变大时，障碍物到参考线边界的最大距离d就会相应变得越小，即为自车留出的可通行路宽就会变窄，当障碍物到参考线边界的最大距离d变小至等于自车的宽度w时，障碍物与边界之间的距离就会达到不足以让自车通过的情况，从而使自车换道的紧迫感达到最大，即此时障碍物对自车的可通行空间的影响达到最大；反之，随着障碍物到参考线边界的最大距离d的增大，障碍物对自车的可通行空间的影响是相应降低的，因此，通过上述公式定义的堵塞系数能够准确反映障碍物对自车可通行空间的影响，将其与障碍物在参考线对应的ST图上的投影面积相叠加，能够更加准确反映障碍物的占据空间，进而更准确反映参考线的拥堵程度。

由此，在具体实现中，如图3所示，根据高精度地图和感知信息来确定参考线的第二语义选项就可以实现为包括：

步骤S30：根据高精度地图和感知信息计算参考线上各障碍物的堵塞系数。

步骤S31：根据高精度地图和感知信息确定参考线上的所有可能与参考线存在冲突的障碍物，并将确定的障碍物按照预设规则投影在参考线对应的ST图上。其中，参照前文对第二语义选项的定义，本发明实施例中，按照预设规则将确定的障碍物投影在参考线对应的ST图上是指将障碍物垂直投影至参考线对应的ST图中获得的原始面积与堵塞系数的乘积作为最终投影面积，以最终投影面积为基础将障碍物投影至参考线对应的ST图上。

步骤S32：根据感知信息和高精度信息确定自车按照期望速度行驶在规划时间内可以占据的空间区域，并将该空间区域投影在参考线的ST图上。

步骤S33：根据参考线的ST图和各障碍物的堵塞系数，计算参考线的障碍物占据空间和自车的可通行空间的区域面积。

步骤S34：根据障碍物占据空间和自车的可通行空间的区域面积计算确定第二语义选项。

下文将以图4所示的场景为例，对图3所示的处理流程进行详细说明。

如图4A所示，在该场景中，通过高精度地图和感知信息可以获知到当前场景中存在三条车道，第一车道1、第二车道2和第三车道3，且在自车A前方存在动态障碍物B沿第二车道2的参考线行驶，在自车A左前方存在静态障碍物C侵占了第二车道2的参考线的一部分空间。基于该高精度地图和感知信息的数据，就可以通过步骤S31来进行参考线ST图建模，示例性地，以第二车道2的参考线为例，以自车在参考线的起点为原点、以自车沿参考线的行驶时间T为横轴即T轴、以参考线方向为纵轴即S轴，在frenet坐标系下构建参考线对应的ST图，将障碍物在t时刻与参考线存在冲突的情况在ST图中的(t,s)处进行投影，得到该参考线对应的ST图如图4B所示，由于动态障碍物B持续占据着自车A前方的可通行空间，因此其在第二车道2的参考线的ST图的投影为上方的平行四边形D，静态障碍物C虽然没有完全阻挡自车A通行，但是自车A在经过时仍然会损失一定速度，因此同样需要投影在该参考线的ST图中，其在ST图中的投影为下方的长方形E。之后，根据高精度地图和感知信息可以规划自车A在规划时间内的行驶速度和避障路径，因此，可以基于此确定自车在该规划时间内的可通行空间，并将其投影在参考线的ST图中，示例性地，根据自车的限速值可以确定每个时刻的最大位移，即为S轴的上限，S轴上限与规划时间共同构成可通行空间，将其投影在参考线ST图中即可得到如图4B中的虚线包含的区域F，其中区域F的上边界表征了t时刻自车行驶过的距离，区域F的下边界表征了S轴上限对应的时刻，区域F的斜率即为自车行驶的速度，上边界、下边界和斜率共同限定的区域F即为自车按照期望速度行驶在规划时间内可以占据的空间区域，由此即可实现步骤S31对自车可通行空间区域的投影。

在实际应用中，作为优选实施例，为了反映各障碍物对参考线不同的侵占程度，还可以根据需要进一步为障碍物在参考线ST图的投影面积增加堵塞系数，其中，以堵塞系数设置为通过以下计算公式得到为例：

α＝max(1,10

在步骤S32中，就可以根据图4A的场景下获取到的高精度地图和感知信息，确定出障碍物到第二车道2的边界的最大距离d和自车的宽度w，由此，通过上述公式就可以计算得到各障碍物的堵塞系数。其中，根据本发明实施例定义的堵塞系数的物理意义不难看出，在本发明实施例中，障碍物到参考线的边界的最大距离d在正常行驶的情况下是大于自车宽度w的，而随着障碍物占据参考线的横向距离越大，障碍物到参考线的边界的最大距离d就越小，此时堵塞系数就越大，当障碍物与车道边界之间的距离d不足以让自车通过时，堵塞系数为1。

根据前述的第二语义选项的物理意义，在步骤S33中，通过计算障碍物在参考线ST图中的投影面积与堵塞系数的乘积即可确定出障碍物的占据空间。而通过计算自车按照期望速度行驶在规划时间内可以占据的空间在参考线ST图中的投影区域的面积，即可确定出自车的可通行空间，之后，在步骤S34中，通过计算障碍物占据空间与自车的可通行空间的比值即可得到第二语义选项。其中，需要说明的是，在障碍物有多个时，可以将各障碍物的占据空间之和作为该参考线的障碍物占据空间，如图4所示的场景下，可以分别计算动态障碍物B和静态障碍物C的占据空间，并将二者的占据空间之和作为第二车道2的参考线的障碍物占据空间，并基于此来确定第二语义选项。

由此，在本发明实施例中通过上述方法，实现了以障碍物投影空间占据自车可通行空间的比例作为参考线的通行效率，且该空间是基于参考线的ST图建模确定的，因此得到的实际上是障碍物的时空占据率，即本发明实施例实现了以障碍物的时空占据率作为参考线的通行效率，据此确定的第二语义选项充分考虑了动静态障碍物对于可通行空间的影响，因而能够准确、合理描述参考线的堵塞程度，保证对参考线选取的影响因素考虑的合理性。

优选地，第三语义选项被定义为通过自车从当前位置到达参考线所需的换道次数来表征。具体地，第三语义选项通过以下公式计算得到：

其中，cost

在具体实现中，可以根据高精度地图和感知信息判断自车是否能够从当前位置到达参考线i，如果判断自车可以到达参考线i，则将第三语义选项确定为自车由当前位置到达该参考线所需要换道的最少次数即可，否则就将第三语义选项确定为无穷大。由此即可实现对第三语义选项的确定。其中，示例性地，换道可行性及具体次数主要受到静态障碍物和虚实线的影响，因此，针对获取到的高精度地图和感知信息采用现有技术中的图搜索或采样算法就可以粗略得到自车到达每条参考线的可行性和最少换道次数。图5示意性地显示了在具体场景中确定第三语义选项的实施例，如图5所示，根据高精度地图和感知信息，可以确定自车A在第二车道2中行驶，第一车道1中存在静态障碍物C，因此利用现有的图搜索或采样算法的方式，自车无法搜索到与第一车道1的参考线的无碰撞路径，说明自车自当前位置无法到达第一车道的参考线，因此将第一车道的参考线的第三语义选项确定为无穷大，相应地，自车搜索到其到达第二车道2的参考线需要借道，即需要进行2次换道才能到达，因此将第二车道的参考线的第三语义选项确定为2，同理，由于搜索到自车到达第三车道3的参考线需要向右换道1次，因此将第三车道的参考线的第三语义选项确定为1。

由此，本发明实施例即可通过上述方法确定参考线的第三语义选项。由于在确定第三语义选项的过程中考虑了自车是否能够到达参考线以及到达参考线的执行难度，因而能够根据第三语义选项来进行合理的参考线决策，例如在第三语义选项显示执行难度增加时，倾向于车道保持，以避免因外界环境波动而导致的频繁更换参考线的缺陷和不良。

优选地，第四语义选项被定义为通过自车当前行驶状态与稳定车道保持状态的偏差来表征，其中，稳定车道保持状态是指在车道上保持稳定行驶的理想状态。具体地，自车当前行驶状态与稳定车道保持状态可以通过自车距离参考线的横向距离、自车航向与参考线角度的偏差和距离上一次更换参考线的时间间隔来体现，由此，各参考线的第四语义选项具体可以通过以下公式计算得到：

cost

其中，cost

作为一种优选实施例，可以根据感知输入的感知信息来获取自车距离参考线的横向距离、自车航向与参考线角度的偏差和距离上一次更换参考线的时间，这些均可以利用前端感知模块(包括但不限于摄像头、激光雷达、超声波雷达等)获取到，故在此不再赘述。在获取到相应的信息后，根据第四语义选项的物理意义即可计算确定出参考线的第四语义选项。由此，本发明实施例在确定参考线的语义信息时，可以通过考虑距离项、角度项和时间项来确定出第四语义选项，通过设置距离项和角度项可以提升自车在更换参考线时的跟踪状态，通过设置时间项可以尽可能避免连续换道和多次避障等行为，因此，基于此进行连续参考线决策能够实现在跟踪误差较大时尽量避免较大的机动行为，从而有效保证控制的稳定性及乘坐的舒适性。

优选地，第五语义选项被定义为由自车与参考线上自车前方和后方的障碍物的碰撞风险表征，其中，碰撞风险可以基于间隙理论来描述，间隙理论的具体内容可以参照现有技术，在此不再赘述。示例性地，各参考线的第五语义选项具体通过以下公式计算得到：

cost

其中，cost

作为一种优选实施例，可以根据感知输入的感知信息来获取自车与障碍物的绝对距离和自车与障碍物的碰撞时间，这些均可以利用前端感知模块和/或规划模块获取到，故在此不再赘述。在获取到相应的信息后，根据第五语义选项的物理意义即可计算确定出参考线的第五语义选项。由此，本发明实施例在确定参考线的语义信息时，可以通过设置距离项和碰撞时间项来确定第五语义选项，并实现通过选择参考线上自车前方和后方最近的障碍物，对其距离项和碰撞时间项计算求和来确定第五语义选项，基于此，当参考线上不存在对应的障碍物时则不需计算其代价，即无障碍物状态下，无需计算参考线上的第五语义选项。本发明实施例在确定第五语义选项时通过设置距离项可以使自车在切换参考线执行变道时能够充分考虑空间的大小，通过设置碰撞时间项可以使自车在切换参考线执行变道时能够充分考虑时间的合理性，因此，确定出的第五语义选项通过考虑距离和碰撞时间的代价可以使自车能够寻求更大的空间和时间间隙执行车道变换，提高参考线决策的合理性和舒适性。

由此，本发明实施例即可实现基于对是否属于全局路径、是否可到达、及是否具有速度优势等影响因素来预先确定出同时包括偏离程度、行驶效率、执行难度、稳定性和安全性的语义信息。同时，本发明实施例还为这些语义信息定义用于表征其物理意义的代价值属性，由此确定出用于表征偏离程度的第一语义选项、用于表征行驶效率的第二语义选项、用于表征执行难度的第三语义选项、用于表征稳定性的第四语义选项和用于表征安全性的第五语义选项等语义选项的语义信息，以使得本发明实施例能够根据获取的高精度地图和感知信息来构建和确定参考线的各语义选项，使得语义信息在关联特定影响因素的情况下还能够被量化评价，因而基于此进行的参考线决策和选择也更具有可解释性、合理性和一致性，进而也保证了驾驶的舒适性和安全性。另外，根据前文各语义信息的物理含义可以知道，由此计算出的参考线的各代价值均为连续量而非离散量，因而也使得做出的参考线决策具有连续性，进而保证参考线决策的合理性。

考虑到在实际应用中，更改目标参考线通常是由于强制换道或自由换道引起的，例如，当前参考线偏离了全局路径或者难以达到期望速度则需要重新选择目标参考线，进行换道。因此作为一种优选实施例，可以基于偏离程度和通行效率进行切换意图决策。示例性地，在本发明实施例中，将用于衡量参考线距离全局路径的远近程度的第一语义选项和用于描述参考线的堵塞程度的第二语义选项确定为用于意图决策的语义信息，即将第一语义信息组设置为包括第一语义选项和第二语义选项，以根据第一语义选项和第二语义选项来进行参考线切换意图的决策。

以第一语义信息组设置为包括第一语义选项和第二语义选项为例，上述步骤S11中根据第一语义信息组确定参考线切换意图可以实现为是根据第一语义选项与预设阈值的比较结果来确定参考线的切换意图；或者也可以实现为是根据第二语义选项与预设阈值的比较结果来确定参考线的切换意图；当然还可以实现为是同时根据第一语义选项与预设阈值的比较结果、以及第二语义选项与预设阈值的比较结果来确定参考线的切换意图。

以前文确定的第一语义选项和第二语义选项的物理意义为例，在优选实施例中，可以基于第一语义选项与预设阈值的比较结果和/或第二语义选项与预设阈值的比较结果来确定参考线的切换意图。具体地，由于第一语义选项体现了偏离程度，而偏离程度反映了强制换道的紧迫程度，因此，根据第一语义选项的物理意义，当剩余换道距离小于理想换道距离时，将产生尽快回到全局路径的需求，因此，可以为第一语义选项设置预设阈值，例如可以将第一语义选项的预设阈值设置为1，并将确定的第一语义选项与预设阈值1进行比较，在第一语义选项大于1时，将参考线的切换意图确定为存在切换参考线的意图，否则将参考线的切换意图确定为不存在切换意图。而由于第二语义选项体现了行驶效率和参考线被侵占的程度，因此，根据第二语义选项的物理意义，若当前参考线被侵占的空间较大，同样会产生切换参考线的意图，因此，可以为第二语义选项设置预设阈值，例如将第二语义选项的预设阈值设置为0.2，由此在确定出第二语义选项时，将第二语义选项与预设阈值0.2进行比较，并在判断第二语义选项小于0.2时，将参考线的切换意图确定为存在切换参考线的意图，否则将参考线的切换意图确定为不存在切换意图。其中，需要说明的是，由于第一语义选项的阈值为偏离程度阈值，第二语义选项的阈值为行驶效率阈值，二者分别代表和反映了强制换道和自由换道的激进程度，可以根据期望的驾驶风格进行调节和设置，本发明实施例对其具体设定值不进行限制，如第二语义选项的阈值表征了参考线在S轴被侵占的比例，可以根据驾驶风格进行调整，激进的可以增大，保守的可以减小。

优选地，上述步骤S12中根据参考线切换意图和各参考线的第二语义信息组选择最优参考线可以实现为是在存在切换参考线的意图时，根据各参考线的所述第二语义信息组计算每条参考线的总代价值，根据所述总代价值选择出最优参考线。其中，最优参考线是指根据计算出的每条参考线的总代价值确定的当前最优的参考线。由于评价参考线时需要综合考虑距离全局路径的远近，行驶效率的高低以及到达参考线的代价，因此本发明实施例优选将第二语义信息组设置为包括用于衡量每条参考线偏离程度的第一语义选项、用于衡量每条参考线行驶效率的第二语义选项和用于衡量每条参考线执行难度的第三语义选项，以根据这三者来综合评价每条参考线的代价，使得方向意图决策能够准确反映参考线的合理性和舒适性，在方向决策层面进一步保证参考线决策结果的合理性和一致性。

以前文确定的第一语义选项、第二语义选项和第三语义选项的物理意义为例，由于第一语义选项、第二语义选项和第三语义选项的语义信息都无量纲且数量级相近，因此，在优选实施例中，根据各参考线的所述第二语义信息组计算每条参考线的总代价值可以实现为是直接对第二语义信息组的各语义选项进行求和，并以第二语义信息组的各语义选项之和作为参考线的总代价值。而根据总代价值选择出最优参考线则可以实现为是从中选择代价值最低的参考线作为最优参考线，由此以实现方向决策。在本发明实施例中，通过合理设置第二语义信息组中的语义选项，并结合各语义选项的物理意义通过对各语义选项进行求和的方式来计算参考线总代价值，不但综合考虑了各重要影响因素对参考线选取的影响程度，同时实现方式简单，使得对参考线的方向决策具备了合理性和可解释性，使得参考线决策结果能保证一致性。

在其他优选实施例中，根据对参考线各影响因素的关注程度的差异和决策时考虑因素的差异，在进行参考线总代价值计算时，还可以根据需求对第二语义信息组中的各个语义选项分别设置权重，即对第一语义选项、第二语义选项和第三语义选项进行加权计算，以提升某个因素对于决策结果的影响。

作为一种优选实施例，经过上述步骤确定出当前最优的参考线后，还可以进一步对切换的时机进行判断，即进一步判断当前时刻更换参考线的可行性和合理性，以根据可行性和合理性来确定目标参考线。由于在实际场景中，准备换道状态下主要关注目标车道是否存在足够的间隙以及自车当前状态是否稳定，因此，可以根据上述第四语义选项和第五语义选项来判断参考线的安全性和稳定性是否满足需求，由此来实现根据可行性和合理性来确定目标参考线。基于此，本发明优选实施例中可以将第三语义信息组设置为包括第四语义选项和第五语义选项。

以第三语义信息组设置为包括第四语义选项和第五语义选项为例，上述步骤S13中根据选择的最优参考线的第三语义信息组确定目标参考线可以实现为是根据选择的最优参考线的第四语义选项与预设阈值的比较结果来确定目标参考线；或者也可以实现为是根据选择的最优参考线的第五语义选项与预设阈值的比较结果来确定目标参考线；当然还可以实现为是同时根据选择的最优参考线的第四语义选项与预设阈值的比较结果、以及选择的最优参考线的第五语义选项与预设阈值的比较结果来确定目标参考线。

以前文确定的第四语义选项和第五语义选项的物理意义为例，在优选实施例中，可以基于第四语义选项与预设阈值的比较结果和第五语义选项与预设阈值的比较结果来确定目标参考线。具体地，可以实现为：在判断第四语义选项低于预设阈值且第五语义选项低于预设阈值时，直接将选择的最优参考线更改为新的目标参考线，否则表示当前不适合换道(可行性和合理性均不够好)，暂不更改目标参考线，即目标参考线继续确定为当前正在行驶的参考线。示例性地，可以根据工程经验数据来设置第四语义选项和第五语义选项的预设阈值。

在优选实施例中，当根据第三语义信息组判断当前不适合换道时，还可以进一步执行换道辅助操作，以为换道做出准备或提示，示例性地，执行的换道辅助操作可以为先根据选择的最优参考线点亮目标方向的转向灯，以继续执行步骤S13的判断以寻求更好的换道时机，并在步骤S13判断适合换道时，立即执行更改目标参考线的操作。

在其他实施例中，也可以不执行上述步骤S13的合理性和可行性的判断处理，而是直接根据选择的最优参考线确定目标参考线。

图6示意性地显示了另一种实施方式的连续参考线决策方法流程，如图6所示，其实现为包括：

步骤S60：确定参考线的语义信息，其中，确定的语义信息包括用于意图决策的第一语义信息组和用于方向决策的第二语义信息组；

步骤S61：根据第一语义信息组确定参考线切换意图；

步骤S62：根据参考线切换意图和各参考线的第二语义信息组选择最优参考线；

步骤S63：根据选择的最优参考线确定目标参考线。

其中，本发明实施例的步骤S60～步骤S62的具体实施方式可以参照前文叙述，与图1所示实施例不同的是，本发明实施例在步骤S60中仅确定出第一语义信息组和第二语义信息组，在步骤S62之后，即选择出当前最优参考线之后，是直接根据选择的最优参考线来确定目标参考线。

在具体实现中，示例性地，在步骤S63中，可以根据选择的最优参考线进行判断，如可以判断自车由当前车道到达目标参考线是否需要通过车道变换，如根据第三语义选项来判断，并在判断不需要经过车道变换就可以到达目标参考线，那么就直接将当前最优参考线作为目标参考线。

示例性地，在步骤S63中，还可以是在选择出当前最优参考线后，直接执行更改目标参考线的操作，即直接将目标参考线确定为选择的当前最优参考线。由此，在经过上述步骤S62确定出当前最优的参考线后，就可以根据确定出的最优参考线进行车道变换，即将确定出的最优参考线作为目标参考线，直接切换至目标参考线所在的车道行驶。其中，目标参考线是指确定出的需要切换至的车道的参考线。

其中，需要说明的是，在根据选择的最优参考线进行是否需要通过车道变换的判断，并根据判断结果来确定目标参考线和执行车道更换操作时，可以将步骤S63和上述图1所示实施例的步骤S13进行结合，以形成新的更优实施例，该新的更优实施例例如可以是：在选择出当前最优参考线后，判断自车由当前车道到达最优参考线是否需要通过车道变换，在判断不需要经过车道变换就可以到达最优参考线，那么就直接将当前最优参考线作为目标参考线，即将目标参考线更改为最优参考线；而在判断需要经过车道变换才可以到达最优参考线时，执行步骤S13的合理性和可行性判断，并根据步骤S13的合理性和可行性判断结果来确定是否将目标参考线更改为当前最优参考线。

在其他实施例中，在进行步骤S13的合理性和可行性判断时，还可以不以第四语义选项和第五语义选项分别与预设阈值进行比较以实现可行性决策，而是可以将第四语义选项或第五语义选项的物理意义中选用的某些参数作为约束单独进行判断。

由此，本发明实施例即可实现基于参考线的语义信息来进行参考线决策，基于语义信息得到的代价值平滑连续，能够保证决策结果的一致性。而且，由于本发明实施例将参考线决策分为多个阶段，每个阶段采用部分语义信息进行简单的比较，决策过程清晰直观且具有可解释性。另外，由于本发明实施例在进行语义信息的确定时，选用的参数都存在明确的物理意义和取值规律，因此可以根据需求快速灵活的调整参数，以实现基于参考线的影响因素进行灵活的语义信息确定，以保证决策结果的合理性和符合需求性。

图7示意性地显示了本发明一种实施方式的连续参考线决策装置，如图7所示，该装置包括

语义生成模块70，用于确定参考线的语义信息，其中，确定的语义信息包括用于意图决策的第一语义信息组和用于方向决策的第二语义信息组；

意图决策模块71，用于根据第一语义信息组确定参考线切换意图；

方向决策模块72，用于根据参考线切换意图和各参考线的第二语义信息组选择最优参考线；和

目标决策模块73，用于根据选择的最优参考线确定目标参考线。

作为一种优选实施例，所述第一语义信息组和所述第二语义信息组中至少存在部分相同语义选项。

在优选实施例中，所述第一语义信息组包括用于衡量参考线距离全局路径的远近程度的第一语义选项和用于衡量参考线的堵塞程度的第二语义选项；所述第二语义信息组包括用于衡量参考线距离全局路径的远近程度的第一语义选项、用于衡量参考线的堵塞程度的第二语义选项、和用于衡量由自车当前位置到达参考线的难易程度的第三语义选项。

其中，优选地，所述第一语义选项和第二语义选项均被定义为与车道变换紧迫程度呈正相关。示例性地，所述第一语义选项被定义为是理想换道长度与平均剩余换道距离的比值。所述第二语义选项被定义为与障碍物对自车的可通行空间的影响呈正相关，即与障碍物对当前参考线的侵占空间的大小呈正相关。具体地，所述第二语义选项被定义为是障碍物占据空间与自车可通行空间的比值，其中，障碍物占据空间为障碍物对当前参考线的侵占空间的大小，自车可通行空间为自车按照期望速度行驶在规划时间内可以占据的空间。

在另一优选实施例中，确定的语义信息还包括用于可行性决策的第三语义信息组，所述目标决策模块具体用于根据选择的最优参考线的第三语义信息组确定目标参考线。

作为一种优选实施例，所述第三语义信息组包括用于衡量自车到达参考线对行驶平稳性的影响的第四语义选项和用于衡量自车到达参考线所存在的碰撞风险的第五语义选项。示例性地，第四语义选项被定义为是由自车在更换参考线时的跟踪状态、换道频率和避障频率来共同表征；第五语义选项被定义为由参考线上自车前方和后方的障碍物状态表征。

在另一优选实施例中，所述目标决策模块具体用于根据选择的最优参考线的第二语义信息组和第三语义信息组确定目标参考线。

在其他优选实施例中，所述目标决策模块具体还可以用于根据选择的最优参考线直接确定目标参考线。

其中，需要说明的是，本发明实施例中连续参考线决策装置的各个模块的具体实现过程以及各语义信息的定义，均可以参照前文方法部分的叙述，故在此不再赘述。

图8示意性地显示了本发明另一实施方式的连续参考线决策装置，如图8所示，其实现为包括：

存储器80，用于存储可执行指令；以及

处理器81，用于执行存储器中存储的可执行指令，所述可执行指令在由所述处理器执行时实现前述任一项实施例所述的连续参考线决策方法的步骤。

在具体实践中，上述连续参考线决策装置示例性地可以应用在自动驾驶车辆、无人驾驶清洁器、无人驾驶扫地机、机器人等自动驾驶设备上，以实现对这些设备的参考线进行选择和切换，以提高无人驾驶的舒适性，具体地，上述连续参考线决策装置可以实现为自动驾驶车辆等自动驾驶设备上的决策器或控制器或规划器等。

图9示意性地显示了本发明一种实施方式的车辆，如图9所示，该车辆包括：

决策器90，用于根据上述任一实施例的方法进行目标参考线确定；和

控制器91，用于根据所述决策器90确定的目标参考线对车辆进行控制，如进行方向控制、路径规划、转向灯控制等。

在其他实施例中，车辆中的决策器和控制器还可以集成为一个控制模块。可选地，在实际应用中车辆还可以包括感知识别模块和其他规划控制模块，如路径规划控制器、底层控制器等，示例性地，车辆可以是自动驾驶车辆或半自主驾驶车辆等，本发明实施例对此不进行限制。

在一些实施例中，本发明实施例提供一种非易失性计算机可读存储介质，所述存储介质中存储有一个或多个包括执行指令的程序，所述执行指令能够被电子设备(包括但不限于计算机，服务器，或者网络设备等)读取并执行，以用于执行本发明上述任一项实施例的连续参考线决策方法。

在一些实施例中，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任一项实施例的连续参考线决策方法。

在一些实施例中，本发明实施例还提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述任一实施例的连续参考线决策方法。

在一些实施例中，本发明实施例还提供一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项实施例的连续参考线决策方法。

图10是本发明另一实施例提供的连续参考线决策装置的硬件结构示意图，上述连续参考线决策装置可以该图所示的结构实现，如图10所示，该连续参考线决策装置包括：

一个或多个处理器610以及存储器620，图10中以一个处理器610为例。

连续参考线决策装置还可以包括：输入装置630和输出装置640。

处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接，图10中以通过总线连接为例。

存储器620作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的连续参考线决策方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的连续参考线决策方法。

存储器620可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据路径规划方法的使用所创建的数据等。此外，存储器620可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器620可选包括相对于处理器610远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置630可接收输入的数字或字符信息，以及产生与图像处理设备的用户设置以及功能控制有关的信号。输出装置640可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器620中，当被所述一个或者多个处理器610执行时，执行上述任意方法实施例中的连续参考线决策方法。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本申请实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张双琳;
专利申请人：北京智行者科技有限公司;