掌桥专利:专业的专利平台
掌桥专利
首页

使用雷达的扩展对象跟踪

文献发布时间:2023-06-19 10:16:30


使用雷达的扩展对象跟踪

技术领域

本说明书通常涉及运载工具的操作,并且具体涉及对象跟踪。

背景技术

扩展对象跟踪(Extended Object Tracking,EOT)是指在针对各对象存在多于一个的返回点时、跟踪现实世界的对象。随着高分辨率传感器出现和用在汽车应用中以检测对象,针对各对象的多个返回点是常见的。针对各对象的多个返回点允许对对象的形状和大小及其运动状态(例如,位置、速度和航向)进行推断。EOT将多个返回点分组在一起,从而围绕分组后的返回点绘制限界框、并且跟踪这些返回点或随时间经过的大量返回点。现有EOT解决方案的一些挑战包括但不限于:1)将来自同一对象的返回点分组在一起、而不是将属于不同对象的返回点分组;(2)将新返回点与现有踪迹(track)相关联;3)基于新的一组返回点来更新(一个或多个)现有踪迹;以及(4)检测并拒绝作为噪声的返回点。

发明内容

提供了用于仅使用RADAR(雷达)返回点的扩展对象跟踪的技术。这些技术包括:使用运载工具的一个或多个处理器,从所述运载工具的至少一个RADAR传感器即雷达传感器接收返回点;使用所述一个或多个处理器,生成所述返回点的一个或多个簇;使用所述一个或多个处理器,计算所述一个或多个簇中的各簇的估计位置和速度;使用所述一个或多个处理器,确定所述一个或多个簇是否与现有对象踪迹相关联;以及根据所述一个或多个簇与所述现有对象踪迹相关联,至少使用与所述现有对象踪迹相关联的所述一个或多个簇的相应位置来更新所述现有对象踪迹。

在实施例中,大于离诸如道路边界等的先验地图特征的阈值距离的返回点被滤除。

在实施例中,自我运动补偿距离变化率(range rate)小于阈值距离变化率的返回点被滤除。

在实施例中,在生成一个或多个簇之前,累积多个RADAR(雷达)时间步长或帧的返回点以增加RADAR点云的点密度。

在实施例中,生成所述返回点的所述一个或多个簇包括:使用诸如DBSCAN等的基于密度的空间聚类来对所述返回点进行聚类。

在实施例中,所述基于密度的空间聚类使用围绕所述返回点的椭圆区域来扩展所述一个或多个簇,并且所述椭圆区域的长轴平行于交通流。

在实施例中,在生成所述一个或多个簇之后,计算各簇的长度、宽度和中心,其中,所述中心是所述簇的代表位置,并且假定属于所述簇的所有返回点都集中在所述中心。

在实施例中,该中心是使用利用簇的极值点适合该簇的限界框来确定的。

在实施例中,使用所述一个或多个簇中的各簇的相应速度来计算所述一个或多个簇中的该簇的航向。

在实施例中,所述长度被定义为所述航向的方向上的返回点之间的最大距离。

在实施例中,所述宽度被定义为与所述航向垂直的返回点之间的最大距离。

在实施例中,在计算所述长度、所述宽度和所述中心之前,使所述返回点与全球参考框架的轴对齐。

在实施例中,通过以下来确定所述一个或多个簇中的各簇是否与现有对象踪迹相关联:计算所述一个或多个簇的相应估计位置和速度与所述现有对象踪迹的预测位置和速度之间的差;以及确定所述差是否低于位置和速度的相应阈值。

在实施例中,计算所述一个或多个簇中的各簇的估计速度还包括:使用一个或多个递归最小二乘(RLS)滤波器来估计所述簇的速度。

在实施例中,将所述一个或多个簇中的该簇的更新后的估计速度与阈值速度进行比较,并且在所述更新后的估计速度超过所述阈值速度的情况下,过滤导致所述更新后的估计速度超过所述阈值速度的返回点。

在实施例中,使用RLS滤波器的集合来估计簇速度,其中使用根据簇累积历史计算出的速度来对各RLS滤波器的速度进行初始化,该速度是通过估计将返回点已移动了多少除以时间步长或帧之间的时间差的结果来获得的。此外,簇中的返回点被打乱成处于不同的随机顺序以更新RLS滤波器的集合。

在实施例中,如果两个或更多个簇与现有对象踪迹相关联,则使来自两个或更多个簇的返回点同化成单个更大簇,并且计算该单个更大簇的估计位置和速度。

在实施例中,如果一个或多个簇不与现有对象踪迹相关联,则利用该簇的位置、速度对新对象踪迹进行初始化,并且将该踪迹的长度和宽度指派到预定义的值。

在实施例中,使用卡尔曼滤波器来维持和更新所述现有对象踪迹的状态,并且所述状态包括正跟踪的对象的估计位置、速度、长度和宽度。

在实施例中,所述卡尔曼滤波器是采用恒定速度运动模型进行模型预测的线性卡尔曼滤波器。

在实施例中,使用所述簇的估计速度来更新所述卡尔曼滤波器的速度状态。

在实施例中,如果现有对象踪迹不与簇相关联并持续N次迭代,则现有对象踪迹被终止(例如,从存储器中被擦除)。

所公开的实施例中的一个或多个提供了以下优点中的一个或多个。EOT实施例:1)除了提供对象的位置和速度之外、还提供对象的范围(长度和宽度)的准确计算;2)实现了对如卡车和公共汽车那样的可能与多个簇相关联的长对象的更好跟踪;3)实现了对正转弯的对象的更好跟踪;4)减少了对聚类算法的准确性的依赖;以及5)提供准确的瞬时速度估计值,从而由于使用LKF来代替其非线性对应物,因此减少了踪迹管理的计算。

这些和其它方面、特征和实现可被表示为方法、设备、系统、组件、程序产品、用于进行功能的方法或步骤以及其它方式。

从以下的包括权利要求书的说明书,这些和其它方面、特征和实现将变得明显。

附图说明

图1示出根据一个或多个实施例的具有自主能力的自主运载工具(AV)的示例。

图2例示根据一个或多个实施例的示例“云”计算环境。

图3例示根据一个或多个实施例的计算机系统。

图4示出根据一个或多个实施例的AV的示例架构。

图5示出根据一个或多个实施例的感知模块可以使用的输入和输出的示例。

图6示出根据一个或多个实施例的LiDAR系统的示例。

图7示出根据一个或多个实施例的操作中的LiDAR系统。

图8示出根据一个或多个实施例的LiDAR系统的操作的附加细节。

图9示出根据一个或多个实施例的规划模块的输入和输出之间的关系的框图。

图10示出根据一个或多个实施例的路径规划中所使用的有向图。

图11示出根据一个或多个实施例的控制模块的输入和输出的框图。

图12示出根据一个或多个实施例的控制器的输入、输出和组件的框图。

图13A是根据一个或多个实施例的用于使用RADAR的扩展对象跟踪的处理的流程图。

图13B例示根据实施例的在估计簇的中心时涉及的步骤。

图14例示根据一个或多个实施例的如何在全局坐标系中定义返回点的速度和方位(bearing)。

图15是例示根据一个或多个实施例的使用递归最小二乘(RLS)滤波器的集合的簇速度估计的框图。

图16A-16C例示根据一个或多个实施例的使用利用RADAR的扩展对象跟踪所产生的限界框。

图17是根据一个或多个实施例的用于仅使用RADAR返回点的扩展对象跟踪的处理的流程图。

图18是根据一个或多个实施例的用以计算簇的瞬时速度的处理的流程图。

具体实施方式

在以下描述中,为了解释的目的,阐述了许多具体细节,以便提供对本发明的透彻理解。然而,显而易见的是,本发明可以在没有这些具体细节的情况下实施。在其它实例中,众所周知的构造和装置是以框图形式示出的,以避免不必要地使本发明模糊。

在附图中,为了便于描述,显示了示意要素的具体安排或次序,例如表示设备、模块、指令块和数据要素的那些要素。然而,本领域技术人员应当理解,附图中示意要素的具体排序或安排并不意味着要求特定的处理顺序或序列、或处理过程的分离。此外,在附图中包含示意性要素并不意味着在所有实施例中都需要这种要素,也不意味着由这种要素表示的特征不能包括在一些实施例中或不能在一些实施例中与其它要素结合。

此外,在附图中,连接要素、例如实线或虚线或箭头用于说明两个或两个以上其它示意要素之间的连接、关系或关联,没有任何此类连接要素并不意味着不能存在连接、关系或关联。换句话说,一些要素之间的连接、关系或关联未在附图中显示,以便不掩盖本发明。此外,为了便于说明,使用单个连接要素来表示要素之间的多个连接、关系或关联。例如,如果连接元件代表信号、数据或指令的通信,本领域技术人员应理解,该元件代表影响通信可能需要的一个或多个信号路径(例如,总线)。

现在将详细参考实施例,其示例在附图中示出。在下面的详细描述中,阐述了许多具体细节,以便提供对所描述的各种实施例的透彻理解。然而,对于本领域的普通技术人员来说明显的是,可以在没有这些具体细节的情况下实施所描述的各种实施例。在其它情况下,没有详细描述众所周知的方法、程序、组件、电路和网络,以便不会不必要地掩盖实施例的方面。

下面描述的若干特征可以彼此独立地使用,也可以与其它特征的任何组合一起使用。但是,任何个别特征可能不能解决上述任何问题,或者只能解决上述问题之一。上文讨论的一些问题可能不能通过本文所述的任何一个特征得到充分解决。虽然提供了标题,但在本说明的其它地方也可以找到与某一标题有关但在该标题部分未找到的信息。本文根据以下概要描述实施例:

1.总体概述

2.系统概述

3.自主运载工具架构

4.自主运载工具输入

5.自主运载工具规划

6.自主运载工具控制

7.仅使用RADAR的扩展对象跟踪

自主运载工具(AV)仅使用RADAR传感器来在其操作环境中检测对象和离对象的距离并跟踪对象,以避免与对象发生碰撞。本文所公开的扩展对象跟踪(EOT)技术除了估计对象的位置和速度之外,还估计对象的长度和宽度。EOT是使用从广义上分类为以下四个部分的处理流水线来实现:1)预处理、2)聚类、3)簇速度估计和4)簇-踪迹关联和踪迹管理。

预处理部分包括静态点去除和点云累积这两个子部分。在前者阶段,仅保留移动的RADAR返回点(以下也简称为“点”)并且丢弃其余的点。这样做是为了将噪声点和其它难以辨别的点从RADAR点云中滤除。然而,该过滤也去除了补偿距离变化率小于预定义的距离变化率阈值的非噪声点,但这种非噪声点的遗漏不会影响跟踪器的性能。此外,由于RADAR点云非常稀疏,因此从一个时间步长或RADAR帧检测和跟踪对象是具有挑战性的。为了避免稀疏检测,通过累积多个时间步长/帧(例如,3个时间步长/帧)上的点来增加RADAR点云的密度。累积多个时间步长/帧上的点使得对象的检测和跟踪更容易,并且为估计对象的瞬时速度提供了良好的先验。

在流水线的第二部分,使用聚类算法对来自所累积的RADAR点云的点进行聚类。在实施例中,聚类算法是基于密度的聚类算法,其基于距离度量(例如,欧几里德距离度量)将彼此接近的点分组在一起,并且将存在于低密度区域中的点标记为离群点。示例的基于密度的聚类算法是DBSCAN聚类算法,其适应变化的簇形状并且高效地处理离群点和其它噪声点。在实施例中,修改DBSCAN,使得将在长轴与交通流对齐的椭圆区域内的点分组在一起。交通流可以从带注释的先验地图获得。当交通流量不明确(例如,在交叉路口中)时,使用圆形区域来将点分组在一起。

在流水线的第三部分中,确定各簇的中心和速度。假设簇的中心是簇中的所有点的几何中心。该几何中心是通过计算围绕簇中的所有点的可能的最紧密矩形限界框的中心来获得的。然后,位置创新(position innovation)是踪迹的预测位置和簇的计算位置之间的平方距离。

不同于从RADAR传感器直接获得的位置,使用该传感器的其它输出来显式地计算簇的速度。例如,典型的RADAR传感器除了提供其位置之外,还提供点相对于传感器的距离变化率和方位。距离变化率定义点正朝向传感器前进或正远离传感器移动的速率,并且方位是指从传感器垂直向外延伸的光线与直接指向目标的线之间的角度。假定对象上的所有点都具有相同的速度向量,即世界上的所有对象都是刚性的,则可以通过对线性方程组进行求解来计算簇的速度。当在簇中存在多于两个的不同点时,获得对线性方程组的解。

在实施例中,使用递归最小二乘(RLS)滤波器来估计簇的速度。RLS滤波器是递归地更新参数以使加权最小二乘代价函数最小化的自适应滤波算法。RLS算法通过使用簇累积历史对估计簇速度进行初始化而开始。该算法由于其仅使用状态向量和新数据点来更新参数,因此表现出非常快速的收敛性并且从计算速度上非常快。在实施例中,根据簇累积历史来计算初始速度估计值。由于来自RADAR传感器的位置估计值准确,因此可以通过计算位置的变化并将该变化除以两个帧之间的时间来估计初始速度。

RLS算法的更新步骤用于确定点是否是离群点以及是否应使用其滤波器更新。如果点的更新得到大于预定义的阈值的速度变化,则该点被认为是离群点。为了允许初始化时的一些不准确,在滤波器的多次更新之后进行该检查。为了说明离群点进行多次更新、这导致所有的正确测量值被分类为离群点的情况的原因,对RLS滤波器的集合(例如,10个RLS滤波器)进行初始化,其中各滤波器被提供了随机顺序的点作为输入。速度分量值得到最小重投影距离变化率误差的滤波器“胜出”,并且其速度被认为是簇的速度。

一旦计算出簇的中心和速度,流水线的第四部分就确定新计算出的簇中的任何簇是否是来自已由对象跟踪器跟踪的对象的返回点。该第四部分并不容易,因为并不知晓哪些返回点来自哪些对象,反之亦然。在实施例中,使用两个参数(例如,位置和速度)来计算簇和踪迹之间的关联。在实施例中,如果踪迹的预测参数与簇的估计位置(中心)和速度之间的创新小于预定义的阈值,则簇与踪迹相关联,并且这两个参数之间的创新的总和在所有的潜在踪迹中最小。

在实施例中,使用记录至少但不限于位置、速度和范围的6维状态向量来维持踪迹状态。例如,使用线性卡尔曼滤波器(LKF)或无迹卡尔曼滤波器(UKF)来维持踪迹,其中预测步骤使用例如恒定速度运动模型或者恒定速度和转速(CTRV)模型等的包括航向、速率和方位角的任何期望的运动模型。优选LKF,因为可以直接根据原始的或导出的RADAR测量值以线性方式更新所有的状态参数。在一些实施例中,估计诸如传感器偏差或漂移等的附加状态。

当簇不与任何踪迹相关联时,创建新踪迹,其中使用该簇的相应值来对状态参数进行初始化。由于道路上的大多数移动对象都是运载工具,因此利用预定数据来对状态参数进行初始化。为了防止噪声和其它随机反射干扰踪迹列表,新踪迹最初被设置为INVALID(无效)状态,其在踪迹与簇相关联并持续至少N次迭代(例如,3次迭代)时变为有效。

当位置和速度这两者的创新都降至低于预定义的阈值时,簇与踪迹相关联,并且创新的总和对于该踪迹而言是最少的。由于两个或更多个簇可以与同一踪迹相关联,因此第一步骤是将属于一个踪迹的所有点同化成单个簇、并且重新计算更大的单个簇的所有参数。然后,使用该更新后的更大簇的参数来进行状态更新步骤。

当现有踪迹不与任何簇相关联时,使用运动模型来传播踪迹,并且对该踪迹进行标记以表示该踪迹无关联。如果该踪迹被连续标记并持续了多个时间步长/帧(例如,6个时间步长/帧),则假定该踪迹是过时的并且被终止(例如,从存储器中删除)。

图1示出具有自主能力的自主运载工具100的示例。

如本文所使用的,术语“自主能力”是指一种功能、特征或设施,该功能、特征或设施使运载工具能够部分地或完全地运行,而无需实时的人类干预,包括但不限于完全自主运载工具、高度自主运载工具、部分自主运载工具和有条件自主运载工具。

如本文所使用的,自主运载工具(AV)是一种具有自主能力的运载工具。

如本文所使用的,“运载工具”包括货物或人员的运输方式。例如,小汽车、公共汽车、火车、飞机、无人机、卡车、船只、舰艇、潜水器、飞船等。无人驾驶的小汽车是运载工具的示例。

如本文所使用的,“轨迹”是指从第一时空地点操作到第二时空地点的路径或路线。在实施例中,第一时空地点被称为初始地点或起始地点,第二时空地点被称为目的地、最终地点、目标、目标位置或目标地点。在一些示例中,轨迹由一个或多个路段(例如,道路的数段)组成,并且各路段由一个或多个块(例如,车道或交叉路口的一部分)组成。在实施例中,时空地点对应于真实世界地点。例如,时空地点是上车或下车地点,以使人员或货物上车或下车。

如本文所使用的,“(一个或多个)传感器”包括一个或多个硬件组件,用于检测与传感器周围环境有关的信息。一些硬件部件可包括感测部件(例如,图像传感器、生物测量传感器)、发送和/或接收部件(例如,激光或射频波发射器和接收器)、电子部件(例如,模数转换器)、数据存储装置(例如,RAM和/或非易失性存储器)、软件或固件部件和数据处理部件(例如,专用集成电路)、微处理器和/或微控制器。

如本文所使用的,“场景描述”是一种数据结构(例如,列表)或数据流,其包括由AV运载工具上的一个或多个传感器检测到的一个或多个分类或标记的对象,或由AV外部的源提供的一个或多个分类或标记的对象。

如本文所使用的,“道路”是一个可以被运载工具穿过的物理区域,并且可以对应于已命名的通道(例如,城市街道、州际高速公路等)或可对应于未命名的通道(例如,房屋或办公楼内的行车道、停车场的一段、空置停车场的一段、乡村地区的污物通道等)。因为有些运载工具(如四轮驱动的小卡车、越野车(SUV)等)能够穿越各种不特别适合运载工具行驶的物理区域,因此“道路”可以是任何市政当局或其它政府或行政机构没有正式界定为一条通道的物理区域。

如本文所使用的,“车道”是道路的可被运载工具穿过的部分,并且可对应于车道标记之间的大部分或全部空间,或仅对应于车道标记之间的部分空间(例如,小于50%)。例如,具有相距很远的车道标记的道路可能容纳两个或两个以上的运载工具,使得一个运载工具可以在不穿过车道标记的情况下超过另一个运载工具,因此可被解释为车道比车道标记之间的空间窄,或车道之间有两个车道。在没有车道标记的情况下,也可以对车道进行解释。例如,可以基于环境的物理特征(例如,农村地区的岩石和沿着大道的树木)来定义车道。

“一个或多个”包括由一个要素执行的功能,由多个要素执行的功能、例如以分布式的方式,由一个要素执行的几个功能,由几个要素执行的几个功能,或上述的任意组合。

还将理解的是,尽管在某些情况下,术语“第一”、“第二”等是用来描述各种要素的,但这些要素不应受到这些术语的限制。这些术语仅用于区分一个要素与另一个要素。例如,在未背离各种所述实施例的范围的情况下,第一触点可被称为第二触点,并且同样,第二触点可被称为第一触点。第一触点和第二触点都是触点,但这两者不是相同触点。

此处描述的各种实施例的描述中使用的术语仅用于描述特定实施例,而不是意在限制。正如在所描述的各种实施例和所附权利要求书的描述中所使用的,单数形式“a”、“an”和“the”也意在包括复数形式,除非上下文另有明确说明。还应理解,本文所用的"和/或"一词是指并且包括一个或多个相关清单项目的任何和所有可能的组合。还应理解的是,在本说明中使用的术语“包括”、“包含”、“具备”和/或“具有”具体说明存在所述的特征、整数、步骤、操作、要素和/或组成部分,但并不排除存在或添加一个或多个其它特征、整数、步骤、操作、要素、组成部分、和/或上述的组。

如本文所使用的,“如果”一词可选择地理解为在该情况下、在当时、或者响应于检测到、或响应于确定为,视上下文而定。同样,“如果已确定”或“如果[所述条件或事件]已被检测到”这一短语,视情境而定,可以理解为“在确定时”或“响应于确定为“或”在检测到[所述条件或事件]时”或“响应于检测到[所述条件或事件]”。

如本文所使用的,AV系统是指AV以及实时生成的支持AV操作的硬件、软件、存储的数据和实时生成的支持AV运作的数据。在实施例中,AV系统并入在AV内。在实施例中,AV系统跨多个地点分布。例如,AV系统的一些软件是在类似于下面结合图3描述的云计算环境300的云计算环境中实现的。

一般而言,本文件描述了适用于任何具有一种或多种自主能力的运载工具的技术,包括完全自主运载工具、高度自主运载工具和有条件自主运载工具,如所谓的第5级、第4级和第3级运载工具(见SAE国际标准J3016:道路上机动车自动驾驶系统相关术语的分类和定义,通过引用将其全部内容纳入本说明,以了解运载工具自主权等级的更多详细信息)。本说明所述技术也适用于部分自主运载工具和驾驶员辅助运载工具,如所谓的2级和1级运载工具(见SAE国际标准J3016:道路上机动车自动驾驶系统相关术语的分类和定义)。在实施例中,一个或多个1级、2级、3级、4级和5级运载工具系统可根据对传感器输入的处理,在某些操作条件下自动执行某些运载工具操作(例如,转向、制动和使用地图)。本文件中所述的技术可以使从完全自主运载工具到人类操作的运载工具的各级运载工具受益。

参考图1,AV系统120使AV 100沿着轨迹198运行,穿过环境190至目的地199(有时称为最终地点),同时避开对象(例如,自然障碍物191、运载工具193、行人192、骑车者和其它障碍物)和遵守道路规则(例如,操作规则或驾驶偏好)。

在实施例中,AV系统120包括用于从计算机处理器146接收操作命令并对其进行操作的装置101。在实施例中,计算处理器146与下面参考图3描述的处理器304相似。装置101的示例包括转向控制器102、制动器103、挡位、加速踏板或其它加速控制机构、挡风玻璃雨刮器、侧门锁、窗控器和转向指示器。

在实施例中,AV系统120包括用于测量或推断AV 100的状态或条件的属性的传感器121,这些属性例如是AV的位置、线速度和加速度及角速度和加速度、以及航向(例如,AV100的前端的方向)。传感器121的示例包括GNSS、以及测量运载工具线性加速度和角速率的惯性测量单元(IMU)、用于测量或估计车轮滑移率的车轮速率传感器、车轮制动压力或制动扭矩传感器、引擎扭矩或车轮扭矩传感器以及转向角度和角速率传感器。

在实施例中,传感器121还包括用于感测或测量AV的环境的属性的传感器。例如,可见光、红外或热(或两者兼有)光谱的单目或立体摄像机122、LiDAR 123、RADAR、超声波传感器、飞行时间(TOF)深度传感器、速率传感器、温度传感器、湿度传感器和降水传感器。

在实施例中,AV系统120包括数据存储单元142和存储器144,用于存储与计算机处理器146或由传感器121收集的数据相关的机器指令。在实施例中,数据存储单元142与以下结合图3描述的ROM 308或存储装置310类似。在实施例中,存储器144与下面描述的主存储器306类似。在实施例中,数据存储单元142和存储器144存储有关环境190的历史、实时和/或预测性信息。在实施例中,存储的信息包括地图、驾驶性能、交通拥堵更新或天气条件。在实施例中,与环境190有关的数据通过来自远程数据库134的通信通道传输到AV100。

在实施例中,AV系统120包括通信装置140,用于将对其它运载工具的状态和条件(诸如位置、线性和角速度、线性和角加速度以及线性和角航向等)的测量到或推断的属性传送到AV 100。这些装置包括运载工具到运载工具(V2V)和运载工具到基础设施(V2I)通信装置以及用于通过点对点或自组织(ad hoc)网络或两者兼而有之进行无线通信的装置。在实施例中,通信装置140跨电磁频谱(包括无线电和光通信)或其它介质(例如,空气和声学介质)进行通信。运载工具对运载工具(V2V)、运载工具对基础设施(V2I)通信(以及在一些实施例中为一种或多种其它类型的通信)的组合有时被称为运载工具对所有事物(V2X)通信。V2X通信通常符合一个或多个通信标准,用于与自主运载工具进行的和在自主运载工具之间的通信。

在实施例中,通信装置140包括通信接口。例如,有线、无线、WiMAX、Wi-Fi、蓝牙、卫星、蜂窝、光、近场、红外或无线电接口。通信接口将数据从远程数据库134传输到AV系统120。在实施例中,远程数据库134嵌入云计算环境200中,如图2中所述。通信接口140将从传感器121收集的数据或与AV 100操作有关的其它数据传输到远程数据库134。在实施例中,通信接口140向AV 100传输与远程操作有关的信息。在一些实施例中,AV 100与其它远程(例如,“云”)服务器136通信。

在实施例中,远程数据库134还存储和传输数字数据(例如,存储道路和街道地点等的数据)。这些数据存储在AV 100上的存储器144中,或者通过通信通道从远程数据库134传输到AV 100。

在实施例中,远程数据库134存储和传输与以前在一天中类似时间沿着轨迹198行驶的运载工具的驾驶属性有关的历史信息(例如,速率和加速率分布)。在一个实现中,这种数据可以存储在AV 100上的存储器144中,或者通过通信通道从远程数据库134传输到AV100。

位于AV 100上的计算装置146基于实时传感器数据和先验信息以算法方式生成控制动作,使得AV系统120能够执行其自主驾驶能力。

在实施例中,AV系统120包括连接到计算装置146的计算机外围设备132,用于向AV100的用户(例如,乘员或远程用户)提供信息和提醒并接收来自该用户的输入。在实施例中,外围设备132类似于下面参考图3讨论的显示器312、输入装置314和光标控制器316。连接是无线的或有线的。任意两个或更多的接口设备可以集成到单个设备中。

图2例示示例“云”计算环境。云计算是一种服务交付模式,可以方便、按需地在网络上访问共享的可配置计算资源池(例如网络、网络带宽、服务器、处理、内存、存储、应用程序、虚拟机和服务)。在典型的云计算系统中,一个或多个大型云数据中心容纳用于递送云所提供的服务的机器。现在参考图2,云计算环境200包括通过云202互连的云数据中心204a、204b和204c。数据中心204a、204b和204c为连接到云202的计算机系统206a、206b、206c、206d、206e和206f提供云计算服务。

云计算环境200包括一个或多个云数据中心。通常,云数据中心(例如图2中所示的云数据中心204a)是指构成云(例如图2中所示的云202或云的特定部分)的服务器的物理排列。例如,服务器在云数据中心中物理排列成房间、组、行和机架。云数据中心有一个或多个区域,其中包括一个或多个服务器房间。每个房间有一行或多行服务器,每行都包括一个或多个机架。每个机架包括一个或多个单独的服务器节点。在一些实现中,区域、房间、机架和/或行中的服务器根据数据中心设施的物理基础设施要求(包括电力、能源、热力、热源和/或其它要求)分为若干组。在实施例中,服务器节点类似于图3中描述的计算机系统。数据中心204a具有许多分布在多个机架上的计算系统。

云202包括云数据中心204a、204b和204c以及用于连接云数据中心204a、204b和204c并有助于促进计算系统206a-f对云计算服务的访问的网络和网络资源(例如,网络设备、节点、路由器、交换机和网络电缆)。在实施例中,该网络表示一个或多个本地网络、广域网或通过使用地面或卫星连接部署的有线或无线链路连接的网际网络的任意组合。通过网络交换的数据采用多种网络层协议(如Internet协议(IP)、多协议标签交换(MPLS)、异步传输模式(ATM)、帧中继(FrameRelay)等)进行传输。此外,在网络代表多个子网络的组合的实施例中,在每个底层子网络上使用不同的网络层协议。在一些实施例中,网络代表一个或多个互连网际网络(例如公共互联网等)。

计算系统206a-f或云计算服务消费者通过网络链路和网络适配器连接到云202。在实施例中,计算系统206a-f被实现为各种计算装置,例如服务器、台式机、膝上型计算机、平板电脑、智能手机、物联网(IoT)设备、自主运载工具(包括小汽车、无人机、航天飞机、火车、公共汽车等)和消费电子产品。在实施例中,计算系统206a-f在其它系统中实现或作为其它系统的一部分实现。

图3例示计算机系统300。在实现中,计算机系统300是一种专用计算装置。专用计算装置被硬连线以执行这些技术,或包括诸如一个或多个专用集成电路(ASIC)或现场可编程门阵列(FPGA)等的被持久编程为进行上述技术的数字电子装置,或可包括一个或多个通用硬件处理器,这些硬件处理器经编程以根据固件、存储器、其它存储器、或者组合中的程序指令执行这些技术。这种专用的计算装置还可以将定制的硬线逻辑、ASIC或FPGA与定制的编程相结合来完成这些技术。在各种实施例中,专用计算装置是台式计算机系统、便携式计算机系统、手持设备、网络设备或包含硬线和/或程序逻辑以实现这些技术的任何其它设备。

在实施例中,计算机系统300包括总线302或用于通信信息的其它通信机制、以及与总线302连接以处理信息的硬件处理器304。硬件处理器304是例如通用微处理器。计算机系统300还包括主存储器306,例如随机存取存储器(RAM)或其它动态存储装置,连接到总线302以存储信息和指令,该信息和指令由处理器304执行。在一个实现中,主存储器306用于在执行要由处理器304执行的指令期间存储临时变量或其它中间信息。当这些指令存储在处理器304可访问的非暂时性存储介质中时,使计算机系统300变成一个专用机器,该机器被定制以执行指令中指定的操作。

在实施例中,计算机系统300还包括只读存储器(ROM)308或连接到总线302的其它静态存储装置,用于存储处理器304的静态信息和指令。提供诸如磁盘、光盘、固态驱动器或三维交叉点存储器等的存储装置310,并连接到总线302以存储信息和指令。

在实施例中,计算机系统300通过总线302连接到诸如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、发光二极管(LED)显示器或用于向计算机用户显示信息的有机发光二极管(OLED)显示器等的显示器312。包括字母数字键和其它键的输入装置314连接到总线302,用于向处理器304传送信息和命令选择。另一种类型的用户输入装置是光标控制器316,例如鼠标、轨迹球、触控显示器或光标方向键,用于将方向信息和命令选择传送到处理器304,并用于控制光标在显示器312上的移动。这种输入装置通常具有两个轴线上的两个自由度,第一轴线(例如,x轴)和第二轴线(例如,y轴),这两个轴线允许装置指定平面上的位置。

根据一个实施例,这里的技术由计算机系统300执行,以响应处理器304执行主存储器306中包含的一个或多个指令的一个或多个序列。这些指令从诸如存储装置310等的另一存储介质读入主存储器306。执行主存储器306中包含的指令序列使处理器304执行本文所述的处理步骤。在替代实施例中,使用硬连线电路代替或与软件指令结合使用。

此处使用的术语“存储介质”是指存储数据和/或指令的任何非暂时性介质,这些数据和/或指令使机器以特定方式运行。这种存储介质包括非易失性介质和/或易失性介质。非易失性介质例如包括诸如存储装置310等的光盘、磁盘、固态驱动器或三维交叉点存储器。易失性介质包括动态存储器,诸如主存储器306等。存储介质的常见形式包括例如软盘、软盘、硬盘、固态驱动器、磁带或任何其它磁数据存储介质、CD-ROM、任何其它光数据存储介质、任何具有孔型的物理介质、RAM、PROM和EPROM、FLASH-EPROM、NV-RAM、或任何其它存储芯片或存储盒。

存储介质有别于传输介质,但可以与传输介质相结合使用。传输介质参与存储介质之间的信息传输。例如,传输介质包括同轴电缆、铜线和光纤,其包括具备总线302的电线。传输介质也可以采取声波或光波的形式,如在无线电波和红外数据通信过程中产生的声波或光波。

在实施例中,各种形式的介质涉及向处理器304携带一个或多个指令序列以供执行。例如,这些指令最初是在远程计算机的磁盘或固态驱动器上执行的。远程计算机将指令加载到其动态存储器中,并使用调制解调器通过电话线路发送指令。计算机系统300的本地调制解调器接收电话线路上的数据,并使用红外发射机将数据转换为红外信号。红外检测器接收红外信号中携带的数据,并且适当的电路将数据放置在总线302上。总线302将数据承载到主存储器306,处理器304从主存储器306检索并执行指令。主存储器306接收的指令可以任选地在处理器304执行之前或之后存储在存储装置310上。

计算机系统300还包括连接到总线302的通信接口318。通信接口318提供耦合到连接至本地网络322的网络链路320多双向数据通信。例如,通信接口318是综合业务数字网(ISDN)卡、电缆调制解调器、卫星调制解调器或用以提供与相应类型电话线路的数据通信连接的调制解调器。作为另一示例,通信接口318是局域网(LAN)卡,用于提供与兼容LAN的数据通信连接。在一些实现中,无线链路也被实现。在任何这种实现中,通信接口318发送和接收承载代表各种信息的数字数据流的电、电磁或光信号。

网络链路320通常通过一个或多个网络向其它数据装置提供数据通信。例如,网络链路320通过本地网络322提供与主计算机324或与由因特网服务提供商(ISP)326运营的云数据中心或设备的连接。ISP 326又通过现在通常称为“因特网”的世界范围分组数据通信网络来提供数据通信服务。本地网络322和因特网328都使用携带数字数据流的电、电磁或光信号。通过各种网络的信号以及网络链路320上并通过通信接口318的信号是传输介质的示例形式,其中通信接口318承载了进出计算机系统300的数字数据。在实施例中,网络320包含上述云202或云202的一部分。

计算机系统300通过(一个或多个)网络、网络链路320和通信接口318发送消息和接收包括程序代码的数据。在实施例中,计算机系统300接收用于处理的代码。接收到的代码在接收到时由处理器304执行,和/或存储在存储装置310中,或存储在其它非易失性存储装置中以便以后执行。

图4示出用于自主运载工具(例如,图1所示的AV 100)的示例架构400。架构400包括感知模块402(有时称为感知电路)、规划模块404(有时称为规划电路)、控制模块406(有时称为控制电路)、定位模块408(有时称为定位电路)和数据库模块410(有时称为数据库电路)。各模块在AV 100的操作中发挥作用。共同地,模块402、404、406、408和410可以是图1所示的AV系统120的一部分。在一些实施例中,模块402、404、406、408和410中的任何模块是计算机软件(例如,计算机可读介质上所存储的可执行代码)和计算机硬件(例如,一个或多个微处理器、微控制器、专用集成电路[ASIC]、硬件存储器装置、其它类型的集成电路、其它类型的计算机硬件、或者这些硬件中的任何或所有的组合)的组合。

在使用中,规划模块404接收表示目的地412的数据,并且确定表示AV 100为了到达(例如,抵达)目的地412而可以行驶的轨迹414(有时称为路线)的数据。为了使规划模块404确定表示轨迹414的数据,规划模块404从感知模块402、定位模块408和数据库模块410接收数据。

感知模块402使用例如也如图1所示的一个或多个传感器121来识别附近的物理对象。将对象分类(例如,分组成诸如行人、自行车、汽车、交通标志等的类型),并且将包括经分类的对象416的场景描述提供至规划模块404。

规划模块404还从定位模块408接收表示AV位置418的数据。定位模块408通过使用来自传感器121的数据和来自数据库模块410的数据(例如,地理数据)以计算位置来确定AV位置。例如,定位模块408使用来自GNSS(全球操作卫星系统)传感器的数据和地理数据来计算AV的经度和纬度。在实施例中,定位模块408所使用的数据包括具有行车道几何属性的高精度地图、描述道路网络连接属性的地图、描述行车道物理属性(诸如交通速率、交通量、运载工具和自行车车道的数量、车道宽度、车道交通方向、或车道标记类型和地点,或者它们的组合)的地图、以及描述道路特征(诸如十字路口、交通标志或各种类型的其它行驶信号等)的空间地点的地图。

控制模块406接收表示轨迹414的数据和表示AV位置418的数据,并且以将使得AV100行驶轨迹414到达目的地412的方式来操作AV的控制功能420a~420c(例如,转向、油门、制动、点火)。例如,如果轨迹414包括左转,则控制模块406将以如下方式操作控制功能420a~420c:转向功能的转向角度将使得AV 100左转,并且油门和制动将使得AV 100在进行转弯之前暂停并等待经过的行人或运载工具。

图5示出感知模块402(图4)所使用的输入502a-502d(例如,图1中所示的传感器121)和输出504a-504d(例如,传感器数据)的示例。一个输入502a是LiDAR(光检测和测距)系统(例如,图1所示的LiDAR 123)。LiDAR是使用光(例如,诸如红外光等的一道光)来获得与其视线中的物理对象有关的数据的技术。LiDAR系统产生LiDAR数据作为输出504a。例如,LiDAR数据是用于构造环境190的表现的3D或2D点(也称为点云)的集合。

另一输入502b是RADAR(雷达)系统。RADAR是使用无线电波来获得与附近的物理对象有关的数据的技术。RADAR可以获得与不在LiDAR系统的视线内的对象有关的数据。RADAR系统502b产生RADAR数据作为输出504b。例如,RADAR数据是用于构造环境190的表现的一个或多个射频电磁信号。

另一输入502c是照相机系统。照相机系统使用一个或多个照相机(例如,使用诸如电荷耦合器件[CCD]等的光传感器的数字照相机)来获取与附近的物理对象有关的信息。照相机系统产生照相机数据作为输出504c。照相机数据通常采用图像数据的形式(例如,诸如RAW、JPEG、PNG等的图像数据格式的数据)。在一些示例中,照相机系统具有例如为了立体影像(立体视觉)的目的的多个独立照相机,这使得照相机系统能够感知深度。尽管照相机系统所感知的对象在这里被描述为“附近”,但这是相对于AV而言的。在使用中,照相机系统可被配置为“看见”远处的(例如,AV前方的远至1公里以上的)对象。因此,照相机系统可以具有为了感知遥远的对象而优化的诸如传感器和透镜等的特征。

另一输入502d是交通灯检测(TLD)系统。TLD系统使用一个或多个照相机来获得与交通灯、街道标志和提供视觉操作信息的其它物理对象有关的信息。TLD系统产生TLD数据作为输出504d。TLD数据经常采用图像数据的形式(例如,诸如RAW、JPEG、PNG等的图像数据格式的数据)。TLD系统与包含照相机的系统的不同之处在于:TLD系统使用具有宽视场(例如,使用广角镜头或鱼眼镜头)的照相机,以获得与尽可能多的提供视觉操作信息的物理对象有关的信息,使得AV 100有权访问这些对象所提供的所有相关操作信息。例如,TLD系统的视角可以为约120度以上。

在一些实施例中,使用传感器融合技术来组合输出504a-504d。因而,将个体输出504a-504d提供至AV 100的其它系统(例如,提供至如图4所示的规划模块404),或者采用相同类型(例如,使用相同组合技术或组合相同输出或者这两者)或不同类型(例如,使用不同的各个组合技术或组合不同的各个输出或者这两者)的单个组合输出或多个组合输出的形式,可以将组合输出提供至其它系统。在一些实施例中,使用早期融合技术。早期融合技术的特征在于:将输出组合,之后将一个或多个数据处理步骤应用到组合输出。在一些实施例中,使用后期融合技术。后期融合技术的特征在于:在将一个或多个数据处理步骤应用到个体输出之后,将输出组合。

图6示出LiDAR系统602的示例(例如,图5所示的输入502a)。LiDAR系统602从发光器606(例如,激光发射器)发射光604a-604c。LiDAR系统所发射的光通常不在可见光谱中;例如,经常使用红外光。所发射的光604b中的一些光遇到物理对象608(例如,运载工具)并且反射回到LiDAR系统602。(从LiDAR系统发射的光通常不会穿透物理对象,例如,实心形式的物理对象。)LiDAR系统602还具有用于检测反射光的一个或多个光检测器610。在实施例中,与LiDAR系统相关联的一个或多个数据处理系统生成表示LiDAR系统的视场614的图像612。图像612包括表示物理对象608的边界616的信息。这样,图像612用于确定AV附近的一个或多个物理对象的边界616。

图7示出操作中的LiDAR系统602。在该图所示的情境中,AV 100接收采用图像702的形式的照相机系统输出504c和采用LiDAR数据点704的形式的LiDAR系统输出504a。在使用中,AV 100的数据处理系统将图像702与数据点704进行比较。特别地,在数据点704中也识别出在图像702中识别出的物理对象706。这样,AV 100基于数据点704的轮廓和密度来感知物理对象的边界。

图8示出LiDAR系统602的操作的附加细节。如上所述,AV 100基于LiDAR系统602所检测到的数据点的特性来检测物理对象的边界。如图8所示,诸如地面802等的平坦对象将以一致的方式反射从LiDAR系统602发射的光804a-804d。换句话说,由于LiDAR系统602使用一致的间隔发射光,因此地面802将以相同的一致间隔将光反射回到LiDAR系统602。在AV100在地面802上行驶时,在没有东西阻挡道路的情况下,LiDAR系统602将继续检测到由下一个有效地面点806反射的光。然而,如果对象808阻挡道路,则LiDAR系统602所发射的光804e-804f将以不符合预期一致方式的方式从点810a-810b反射。根据该信息,AV 100可以确定为存在对象808。

图9示出(例如,如图4所示的)规划模块404的输入和输出之间的关系的框图900。通常,规划模块404的输出是从起点904(例如,源地点或初始地点)到终点906(例如,目的地或最终地点)的路线902。路线902通常由一个或多个路段定义。例如,路段是指要行驶经过街道、道路、公路、行车道或适合汽车行驶的其它物理区域的至少一部分的距离。在一些示例中,例如,如果AV 100是诸如四轮驱动(4WD)或全轮驱动(AWD)小汽车、SUV或小型卡车等的越野运载工具,则路线902包括诸如未铺面道路或开阔田野等的“越野”路段。

除路线902之外,规划模块还输出车道级路线规划数据908。车道级路线规划数据908用于在特定时间基于路线902的路段的条件来驶过这些路段。例如,如果路线902包括多车道公路,则车道级路线规划数据908包括轨迹规划数据910,其中AV 100可以使用该轨迹规划数据910以例如基于出口是否临近、多个车道中的一个以上的车道是否存在其它运载工具、或者在几分钟或更少时间的过程中变化的其它因素,来从这多个车道中选择某车道。同样地,在一些实现中,车道级路线规划数据908包括路线902的某路段特有的速率约束912。例如,如果该路段包括行人或非预期交通,则速率约束912可以将AV 100限制到比预期速率慢的行驶速率,例如基于该路段的限速数据的速率。

在实施例中,向规划模块404的输入包括(例如,来自图4所示的数据库模块410的)数据库数据914、当前地点数据916(例如,图4所示的AV位置418)、(例如,用于图4所示的目的地412的)目的地数据918和对象数据920(例如,如图4所示的感知模块402所感知的经分类的对象416)。在一些实施例中,数据库数据914包括规划时所使用的规则。规则是使用形式语言(例如,使用布尔逻辑)指定的。在AV 100所遇到的任何给定情形中,这些规则中的至少一些规则将适用于该情形。如果规则具有基于AV 100可用的信息(例如,与周围环境有关的信息)所满足的条件,则该规则适用于给定情形。规则可以具有优先级。例如,“如果公路是高速公路,则移动到最左侧车道”这一规则与“如果出口在一英里内临近,则移动到最右侧车道”相比可以具有更低的优先级。

图10示出在路径规划中(例如,由规划模块404(图4))使用的有向图1000。通常,如图10所示的有向图那样的有向图1000用于确定任何起点1002和终点1004之间的路径。在现实世界中,分隔起点1002和终点1004的距离可能相对较大(例如,在两个不同的都市区域中),或者可能相对较小(例如,毗邻城市街区的两个十字路口或多车道道路的两条车道)。

在实施例中,有向图1000具有表示起点1002和终点1004之间的AV 100可能占用的不同地点的节点1006a-1006d。在一些示例中,例如,在起点1002和终点1004表示不同的都市区域时,节点1006a-1006d表示道路的路段。在一些示例中,例如,在起点1002和终点1004表示相同道路上的不同地点时,节点1006a-1006d表示该道路上的不同位置。这样,有向图1000包括不同粒度级别的信息。在实施例中,具有高粒度的有向图也是具有更大规模的另一有向图的子图。例如,起点1002和终点1004相距远(例如,相距许多英里)的有向图的大部分信息处于低粒度,并且该有向图是基于所存储的数据,但该有向图还包括供该有向图中的表示AV 100的视场中的物理地点的一部分用的一些高粒度信息。

节点1006a-1006d不同于无法与节点重叠的对象1008a-1008b。在实施例中,在粒度低时,对象1008a-1008b表示汽车不能驶过的地区,例如无街道或道路的区域。在粒度高时,对象1008a-1008b表示AV 100的视场中的物理对象,例如其它汽车、行人、或AV 100不能与之共用物理空间的其它实体。在实施例中,对象1008a-1008b的一部分或全部是静态对象(例如,不改变位置的对象,诸如街灯或电线杆等)或动态对象(例如,能够改变位置的对象,诸如行人或其它小汽车等)。

节点1006a-1006d通过边缘1010a-1010c连接。如果两个节点1006a-1006b通过边缘1010a连接,则AV 100可以在一个节点1006a和另一节点1006b之间行驶,例如,而不必在到达另一节点1006b之前行驶到中间节点。(当提到AV 100在节点之间行驶时,意味着AV100在由相应节点表示的两个物理位置之间行驶。)边缘1010a-1010c通常是双向的,从某种意义上,AV 100从第一节点行驶到第二节点,或者从第二节点行驶到第一节点。在实施例中,边缘1010a-1010c是单向的,从某种意义上,AV 100可以从第一节点行驶到第二节点,然而AV 100不能从第二节点行驶到第一节点。在边缘1010a-1010c表示例如单向街道、街道、道路或公路的单独车道、或者由于法律或物理约束因而仅能沿一个方向驶过的其它特征的情况下,边缘1010a-1010c是单向的。

在实施例中,规划模块404使用有向图1000来识别由起点1002和终点1004之间的节点和边缘组成的路径1012。

边缘1010a-1010c具有关联成本1014a-1014b。成本1014a-1014b是表示在AV 100选择该边缘的情况下将花费的资源的值。典型的资源是时间。例如,如果一个边缘1010a所表示的物理距离是另一边缘1010b所表示的物理距离的两倍,则第一边缘1010a的关联成本1014a可以是第二边缘1010b的关联成本1014b的两倍。影响时间的其它因素包括预期交通、十字路口的数量、限速等。另一典型的资源是燃料经济性。两个边缘1010a-1010b可以表示相同的物理距离,但例如由于道路条件、预期天气等,因此一个边缘1010a与另一边缘1010b相比需要更多的燃料。

在规划模块404识别起点1002和终点1004之间的路径1012时,规划模块404通常选择针对成本优化的路径,例如,在将边缘的各个成本相加到一起时具有最小总成本的路径。

图11示出(例如,如图4所示的)控制模块406的输入和输出的框图1100。控制模块根据控制器1102而工作,该控制器1102例如包括:与处理器304类似的一个或多个处理器(例如,诸如微处理器或微控制器或这两者等的一个或多个计算机处理器);与主存储器306、ROM 308和存储装置310类似的短期和/或长期数据存储装置(例如,存储器随机存取存储器或闪速存储器或这两者);以及存储器中所存储的指令,这些指令在(例如,由一个或多个处理器)执行时执行控制器1102的操作。

在实施例中,控制器1102接收表示期望输出1104的数据。期望输出1104通常包括速度,例如速率和航向。期望输出1104例如可以基于从(例如,如图4所示的)规划模块404接收到的数据。根据期望输出1104,控制器1102产生可用作油门输入1106和转向输入1108的数据。油门输入1106表示例如通过接合转向踏板或接合另一油门控件来接合AV 100的油门(例如,加速控制)以实现期望输出1104的大小。在一些示例中,油门输入1106还包括可用于接合AV 100的制动器(例如,减速控制)的数据。转向输入1108表示转向角度,例如AV的转向控制(例如,方向盘、转向角致动器或用于控制转向角度的其它功能)应被定位成实现期望输出1104的角度。

在实施例中,控制器1102接收在调整提供至油门和转向的输入时使用的反馈。例如,如果AV 100遇到诸如山丘等的干扰1110,则AV 100的测量速率1112降至低于期望输出速率。在实施例中,任何测量输出1114均被提供至控制器1102,使得例如基于测量速率和期望输出之间的差分1113来进行所需的调整。测量输出1114包括测量位置1116、测量速度1118(包括速率和航向)、测量加速度1120和AV 100的传感器可测量的其它输出。

在实施例中,例如通过诸如照相机或LiDAR传感器等的传感器预先检测与干扰1110有关的信息,并且该信息被提供至预测性反馈模块1122。然后,预测性反馈模块1122将控制器1102可用于相应地调整的信息提供至控制器1102。例如,如果AV 100的传感器检测到(“看见”)山丘,则控制器1102可以使用该信息来准备在适当时间接合油门,以避免显著减速。

图12示出控制器1102的输入、输出和组件的框图1200。控制器1102具有影响油门/制动器控制器1204的操作的速率分析器1202。例如,速率分析器1202根据例如由控制器1102接收到并由速率分析器1202处理后的反馈,来指示油门/制动器控制器1204使用油门/制动器1206进行加速或进行减速。

控制器1102还具有影响方向盘控制器1210的操作的横向跟踪控制器1208。例如,横向跟踪控制器1208根据例如由控制器1102接收到并由横向跟踪控制器1208处理后的反馈,来指示方向盘控制器1210调整转向角致动器1212的位置。

控制器1102接收用于确定如何控制油门/制动器1206和转向角致动器1212的多个输入。规划模块404提供控制器1102例如选择AV 100开始操作时的航向并确定在AV 100到达十字交叉路口时驶过哪个道路路段所使用的信息。定位模块408例如将描述AV 100的当前地点的信息提供至控制器1102,使得控制器1102可以确定AV 100是否处于基于正控制油门/制动器1206和转向角致动器1212的方式而预期所处的地点。在实施例中,控制器1102接收来自其它输入1214的信息,例如从数据库、计算机网络等接收到的信息。

图13A是根据一个或多个实施例的用于使用RADAR的扩展对象跟踪的处理1300的流程图。处理从对原始RADAR返回点(以下也简称为“点”)进行预处理而开始(1301)。在该步骤中,所输入的原始RADAR点云中的比离先验地图特征(例如,道路边界)的阈值距离远的所有点、以及补偿距离变化率小于Y米/秒(例如,1米/秒)的这些点被滤除并被排除在跟踪中的使用之外。

处理1300继续以下:累积多个时间步长或帧上的点(1303)。例如,在实施例中,使用滚动缓冲器或其它合适的数据结构在N个RADAR时间步长/帧内累积过滤后的点,其中N是大于1的正整数。该步骤暗示着,每当RADAR传感器提供来自新时间步长/帧的点时,来自最早时间步长/帧的一组点被当前或最新时间步长/帧的新的一组点所替代。如以下进一步详细所述,累积N个时间步长/帧的点将RADAR点云的密度提高了N倍,并且使簇速度估计步骤更容易。然后,将过滤和累积后的点发送至跟踪算法以供进一步处理。

处理1300继续以下:使用基于密度的聚类算法来将点分组成对象的跟踪算法(1304)。在实施例中,使用基于点之间的欧几里德距离对点进行分组的众所周知的DBSCAN(具有噪声的应用的基于密度的空间聚类)算法来对预处理后的点进行聚类。DBSCAN算法从单点簇开始,其中这些单点簇在其附近存在点时大小增长。使用DBSCAN是因为对象(簇中心)的数量和各簇的点的数量均不是预先已知的。簇的增长和将点分类为含噪声这两者都由eps和min_elts这两个参数控制。如果新点在簇中的任何点的eps距离内,则该新点成为现有簇的一部分,并且如果簇内的点的数量小于min_elts,则该簇被分类为离群点。

DBSCAN在新点处于具有eps半径的圆内的情况下扩展簇(使用围绕点的圆形区域来使簇增长)。由于道路上的大多数AV沿交通流的方向行驶、并且长但不宽,因此在实施例中,圆被长轴与交通流的方向平行的椭圆替代。使用椭圆允许将属于AV的点分组在一起,并且防止将彼此相邻的AV分组在一起。

一旦对所有点进行了聚类,就针对各个簇计算簇级度量,其包括计算簇的速度和航向(1305)以及计算簇的中心和范围(例如,长度、宽度)(1307)。簇的中心是簇的代表位置,并且假定属于簇的所有点都集中在该中心。

在实施例中,根据方程[1]使用簇的速度估计值来计算簇的航向θ:

由于速度分量v

参考图13B,确定来自原始点簇1317的极值点1308a、...、1308d,并且经由极值点1308a、...、1308d绘制矩形限界框1319。簇的中心是矩形限界框1319的几何中心。在实施例中,根据方程[2]和[3]来计算中心点坐标:

其中:c

处理1300继续以下:使用恒定速度运动模型来传播现有对象踪迹(1302),并且将这些簇与现有对象踪迹相关联(1306)。将新簇与现有对象踪迹相关联并不容易,因为并不知晓哪个点属于哪个对象,反之亦然。在RADAR的情况下,使用位置和速度来将在当前迭代中计算出的簇与现有对象踪迹相关联。如果预测估计的踪迹和簇之间的创新最低、并且各个参数的创新低于预定义的阈值,则簇与踪迹相关联。如方程[4]所示,计算位置估计值的创新I

I

其中:x

如方程[5]所示,计算速度估计值的创新I

其中,

RADAR传感器给出点相对于RADAR传感器的位置、径向速度(距离变化率)和方位。考虑到从对象反射的所有点都以相同速度移动(即,世界上的所有对象都是刚性的)这一假设,通过对线性方程组[6]进行求解来计算簇的速度:

v

v

v

在方程[6]中,如图14所示,v

φ

其中:φ

在实施例中,如方程[10]所示,通过首先计算RADAR传感器所经历的自我运载工具的距离变化率、然后加上所测量到的距离变化率,来计算估计簇速度所需的补偿距离变化率。反过来,如方程[8]和[9]所示,通过首先使用自我运载工具的已知速度计算RADAR传感器处的运动、然后将已知速度投影到连接RADAR传感器和反射点的线上,来估计自我运载工具的距离变化率:

这里,

当在簇中存在多于两个的不同点时,可以对线性方程组[6]进行求解。然而,挑战来自于雷达测量值的噪声非常大、并且使用方程[6]和[7]将导致不正确的速度估计值这一事实。在实施例中,使用最小二乘法来计算簇的速度。该方法使平方误差最小化以计算最优解。然而,该方法对点云中的离群点和噪声敏感,并且即使在存在单个离群点的情况下也会产生错误的结果。由于输入数据的噪声非常大、并且该输入数据具有大量反射(例如,轮舱和AV的其它随机部位),因此该方法可能会提供不准确的簇速度估计值。然而,有利的方面是,最小二乘法是快速的,一次消耗所有的点,并且在每次提供相同的一组点作为输入时保证相同的输出。

为了从簇中去除离群点,在实施例中,可以使用基于RANSAC的方法。RANSAC算法通过从簇中随机选择两个点并使用这两个点对方程[4]的线性系统进行求解来工作。然后,对簇中的所有点计算投影误差,并且将这些点分类为内点或离群点。通过考虑到v

其中:

RANSAC算法仅用于将离群点与该组内点区分开,之后通过最小二乘算法计算簇的实际速度。RANSAC通常在存在许多点(大部分点是内点)的情况下良好地工作,但在我们的情况下,各簇的点的数量非常少,并且经常发生离群点的数量与内点的数量相当的情况。此外,由于多次运行最小二乘算法(各迭代一次),因此进行RANSAC算法在计算上是昂贵的。

在实施例中,使用RLS滤波器来估计簇速度。RLS滤波器是递归地更新参数以使加权最小二乘代价函数与用于求均值最小二乘解的普通最小二乘(OLS)相比最小化的自适应滤波器。RLS算法从速度和关联协方差的初始估计值开始,然后在每次来自簇的新点进入滤波器时,更新这两者。RLS滤波器快速收敛且速度很快,因为它是递归的,并且无需在每次迭代时使用簇中的所有点来重新计算速度(状态向量从直到此时为止看到的所有点捕获信息)。通过以下给出RLS更新方程[13]和[14]:

在方程[13]和[14]中,

在实施例中,将

并非特定于零初始化的另一主要误差来源是簇中的大量离群点。离群点是从与运载工具本身相比正更慢/更快地移动的运载工具的轮胎、轮舱、以及其它部分反射的点。如果不考虑这些点,则这些点可能导致滤波器收敛于不正确的值。由于不能直接确定哪个点是离群点测量值、而哪个点不是离群点测量值,因此在实施例中,使用RLS滤波器更新步骤来对点进行分类,并将分类后的离群点排除在进一步处理之外。

在前N(例如,3)个步骤(根据经验观察为滤波器收敛于足够稳定的估计值所需的点的数量)之后,如果更新步骤使v

为了解决零初始化的问题,代替使RLS滤波器从0开始并将其迭代到真实值,将滤波器初始化成接近其最终值,并且允许滤波器将该最终值改进为真实估计值。用以将速度估计值初始化成接近其最终值的一个方法是从簇中随机选择两个点、并且使用这两个点来对线性方程组进行求解。有时可能发生选取了离群点并且初始速度估计值与真实值相差很远的情况,但这通过以下在很大程度上得到缓解:使用不同对的数据点来对N个RLS滤波器进行初始化,或者仅当初始速度估计值的范数在某个预定义的阈值内时才接受初始值(离群点通常导致非常大的速度估计值范数)。

这种方法提高了速度估计的性能,但由于该方法重用来自簇的信息、并且在处理中没有学习新的信息(初始化和滤波器使用相同的一组点),因此该方法变差。此外,当簇中的点的数量少时,滤波器本身没有剩余足够的点,并且可能最终停滞在初始值处。

在实施例中,使用来自簇历史的信息来对RLS滤波器进行初始化。如前面所述,累积来自多个时间步长/帧的点以增加RADAR点云的密度。可以利用该点云累积,并且可以通过在将该累积内的点除以在最早时间步长/帧和最新时间步长/帧之间经过的时间的情况下计算这些时间步长/帧之间的簇中心的位置变化来估计滤波器的初始速度。假定给定时间步长/帧的簇中心是在该时间步长/帧在该簇中存在的所有点的均值。

该方法的一个关键优点是:该方法不使用点的易错距离变化率测量值,而是仅使用来自RADAR传感器的更可靠的位置估计值。这减轻了由仅在RADAR传感器的距离变化率测量值中主导存在的离群点引起的大部分问题。然而,初始化的问题可能仍然存在,因为在可能过高或过低地估计初始速度估计值的所有时间步长/帧中没有获得来自对象上的相同位置的返回。例如,如果第一时间步长/帧仅具有碰巧来自对象的左前方的一个返回、并且最后一个时间步长/帧仅具有来自对象的右前方的返回,则由于使用对象上的不同点而引起的误差,因此初始速度估计值具有在与对象的真实航向垂直的方向上的分量。然而,注意到,初始测量值的该误差并不影响最终速度估计值,并且大多数滤波器收敛于真实速度估计值。

一旦估计出簇的速度,就计算簇的速度和踪迹的预测速度之间的创新。该创新与踪迹的位置估计和预测位置之间的创新相结合用来确定簇是否属于踪迹。

一旦簇-踪迹关联完成,就基于簇是与踪迹相关联、不与踪迹相关联、还是踪迹不与簇相关联以三个单独方式来处理踪迹和簇。

当簇的位置和速度这两者的创新都降至低于预定义的阈值时,簇与创新总和最小的踪迹相关联。两个或更多个簇可以与同一踪迹相关联,因此第一步骤是使来自与同一踪迹相关联的所有簇的点同化(1308)。点的同化包括:将所有的点分组在一起、并且重新计算较大簇的如位置、速度和范围那样的参数。

在实施例中,使用记录踪迹的位置、速度和尺寸的6D向量来维持该踪迹的状态。从数学上,该状态可被表示为[x,y,v

在实施例中,LKF的状态向量可以包括要估计的附加状态参数,其包括但不限于传感器偏差和漂移误差。

当簇不与任何踪迹相关联时,利用使用簇的相应参数进行初始化后的所有状态参数来创建新踪迹(1309)。由于大部分观察对象是AV,因此踪迹的长度和宽度分别被实例化为4米和2米。对新踪迹进行初始化,其中踪迹状况被设置为NEW(新)(1312),并且该新踪迹保持无效,直到该踪迹已与簇关联并持续多次迭代(例如,3次迭代)为止。这是为了防止噪声和其它随机反射进行可能会影响RADAR跟踪器的最终输出的踪迹的创建。

当现有踪迹未与任何簇相关联时,踪迹状况从“NEW”或“UPDATED”改变为“COASTED(滑行)”(1310)。踪迹在簇-踪迹关联阶段之前已被传播,因此无需进行附加计算。在同一踪迹未与任何簇相关联并持续了多次连续迭代(例如,6次迭代)时,该踪迹被认为是过时的,其状况改变为INVALID,并且该踪迹终止(例如,从存储器中被删除)。

图15是根据一个或多个实施例的簇速度估计处理1500的流程图。如前面所述,为了应对离群点进行前三次更新、这使得所有其它的正确测量值被分类为离群点的情况,使用RLS滤波器1、...、N的集合(例如,10个RLS滤波器)。

处理1500从对RLS滤波器1、...、N的集合的参数(例如,

针对各RLS滤波器,打乱点顺序(1502-1、1502-2、...、1502-N),更新各点的参数值(1503-1、1503-2、...、1503-N),如果更新之后的参数的改变太大,则拒绝各点的更新(1504-1、1504-2、...、1504-N)。选择了v

图16A-16C示出根据一个或多个实施例的使用利用RADAR的扩展对象跟踪所产生的限界框。参考图16A和16B,与正不正确地将转弯对象(例如,改变车道的运载工具)跟踪为直线行驶的非EOT限界框1602相比,EOT限界框1601正正确地跟踪该对象的点。还注意,EOT限界框1601与非EOT限界框1602相比更准确地测量对象的长度和宽度。参考图16C,与正不正确地将相同的两个簇跟踪为不同对象的非EOT限界框1602a、1602b相比,EOT限界框1601正通过组合这两个簇来正确地跟踪单个扩展对象(例如,长卡车或公共汽车)。

因而,如图16A-16C所示,所公开的EOT实施例除了提供对象的位置和速度之外,还提供对象的范围(长度和宽度)的准确计算,实现了对如卡车和公共汽车那样的可能与多个簇相关联的长对象的更好跟踪,实现了对正转弯的对象的更好跟踪,并且减少了对聚类算法的准确性的依赖。

图17是根据一个或多个实施例的用于仅使用RADAR返回点的扩展对象跟踪的处理1700的流程图。

处理1700从以下开始:使用运载工具的一个或多个计算机处理器来从运载工具的至少一个RADAR传感器的RADAR传输接收返回点(1701),并且使用一个或多个计算机处理器生成返回点的一个或多个簇(1702)。例如,可以使用基于密度的聚类算法(诸如被修改为使用长轴在交通流的方向上的椭圆区域来使簇生长的DBSCAN等)来生成簇。

处理1700继续以下:使用一个或多个计算机处理器来计算一个或多个簇中的各簇的估计位置和速度(1703)。例如,如参考图15和图18详细所述,可以使用RLS滤波器的集合来估计簇速度。可以如参考图15和图18所述对滤波器进行初始化。

处理1700继续以下:使用一个或多个处理器来确定一个或多个簇是否与现有对象踪迹相关联(1704)。例如,如参考图13A所述,可以使用位置和速度的创新来将簇与现有对象踪迹相关联。

处理1700继续以下:如果一个或多个簇与现有对象踪迹相关联,则使用与现有对象踪迹相关联的一个或多个簇的相应位置和估计速度来更新现有对象踪迹(1705)。例如,LKF用于使用簇位置和估计簇速度来维持和更新现有对象踪迹。

图18是根据一个或多个实施例的用以计算簇的瞬时速度的处理1800的流程图。处理1800包括初始化1801、参数更新1802和滤波器选择1803这三个阶段。在初始化阶段1801中,使用踪迹历史来对RLS滤波器参数进行初始化(1804)。

在参数更新阶段1802中,打乱点顺序(1805)并且计算潜在的更新参数(1806)。如果点索引大于N(例如,3)(1807)、并且参数变化大于预定义的阈值(1808),则返回点被认为是离群点并被拒绝进行进一步处理(1810)。如果点索引小于或等于N(1807),则更新滤波器参数(1809)。

在滤波器选择阶段1803中,针对各滤波器计算重投影误差(1811),并且确定具有最小重投影误差的滤波器(1812)。在后续处理中,使用具有最小重投影误差的滤波器的估计速度作为簇的估计速度。

在先前描述中,已经参考许多具体细节描述了本发明的实施例,这些具体细节可因实现而不同。因此,说明书和附图应被视为说明性的,而非限制性意义的。本发明范围的唯一且排他的指示、以及申请人期望是本发明范围的内容是以授权权利要求的具体形式从本申请授权的权利要求书的字面和等同范围,包括任何后续修正。本文中明确阐述的用于被包括在此类权利要求中的术语的任何定义应当以此类术语如在权利要求书中所使用的意义为准。另外,当在先前的说明书或所附权利要求书使用术语“还包括”时,该短语的下文可以是附加的步骤或实体、或先前所述的步骤或实体的子步骤/子实体。

相关技术
  • 使用雷达的扩展对象跟踪
  • 运动对象跟踪装置、运动对象跟踪系统及运动对象跟踪方法
技术分类

06120112482567