掌桥专利:专业的专利平台
掌桥专利
首页

一种自动驾驶决策危险场景生成方法、系统、设备及介质

文献发布时间:2023-06-19 18:49:33


一种自动驾驶决策危险场景生成方法、系统、设备及介质

技术领域

本发明涉及智能车辆领域,特别是关于一种自动驾驶决策危险场景生成方法、系统、设备及介质。

背景技术

近年来,智能车辆的高速发展得到越来越多人的关注,高等级的自动驾驶已经无需任何乘员操作。伴随着自动驾驶系统的复杂化,其安全性也成为人们最为关心的问题。决策作为自动驾驶系统重要的组成部分之一,在开发和部署之前有必要进行有效的测试。

总体上,自动驾驶的测试方法包括实车道路测试和模拟仿真测试,前者更具有代表性,但是安全性和成本问题十分受限;后者则成本更低且不存在安全问题,因此亦是实车测试前必不可少的过程。利用模拟仿真测试评估自动驾驶决策算法的表现并找出其失效问题具有重大的意义。模拟仿真测试的核心是构建仿真测试环境,面向决策算法开发阶段,则希望利用仿真测试环境找出决策算法的失效场景,又称为危险场景,从而为算法优化与提升做基础。

危险场景的生成方法大致包括两种,一是无数据情况下设计环境中交通参与者的对抗性行为模型,从而构建危险场景;但是由于没有真实数据的支撑,场景的设计与初始状态缺乏一定的可解释性。二是利用海量驾驶数据,通过改变对数据的采样,搜索并构建危险场景;这种方法能够高效生成危险场景,但是海量的数据在实车道路测试中难以获得。因此,高效合理地在仿真环境中构建面向决策测试的危险场景仍需要探索和研究。

发明内容

针对上述问题,本发明的目的是提供一种自动驾驶决策危险场景生成方法、系统、设备及介质,能够高效合理地在仿真环境中构建面向决策测试的危险场景。

为实现上述目的,本发明采取以下技术方案:第一方面,提供一种自动驾驶决策危险场景生成方法,包括:

提取实车道路测试中自动驾驶车辆发生司机接管情况时的场景的静态要素信息和动态要素信息;

根据提取的静态要素信息和动态要素信息,建立动态要素行为模型;

设定动态要素行为模型的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景;

对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域。

进一步地,所述实车道路测试中自动驾驶车辆发生司机接管情况时的场景包括自动驾驶车辆自车和环境车的实时位置和速度以及环境车的种类和车道线位置。

进一步地,所述根据提取的静态要素信息和动态要素信息,建立动态要素行为模型,包括:

根据提取的静态要素信息和动态要素信息,建立场景的初始状态空间;

根据场景的初始状态空间,建立场景中各个环境车辆的动态要素行为模型。

进一步地,所述场景的初始状态空间S

S

其中,q

进一步地,每一动态要素的物理状态为q={x,y,v

静态要素中的道路结构表示为l={g,w,c,(r

进一步地,所述设定动态要素行为模型的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景,包括:

设定动态要素行为模型的参数空间;

对设定的参数空间以一定的步长进行离散化;

采用优化搜索方法,根据离散化后的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果。

进一步地,所述采用优化搜索方法,根据离散化后的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果,包括:

采用Metropolis准则,离散化后的参数空间中选择一组参数组合,并以一定的搜索半径在与其相邻的参数范围内确定新的参数组合;

检测确定的新参数组合是否与已测试参数重复,如果重复,则重新随机选择;

根据检测后的参数组合,构建危险场景,并记录试验结果。

第二方面,提供一种自动驾驶决策危险场景生成系统,包括:

场景信息提取模块,用于提取实车道路测试中自动驾驶车辆发生司机接管情况时的场景的静态要素信息和动态要素信息;

模型构建模块,用于根据提取的静态要素信息和动态要素信息,建立动态要素行为模型;

参数组合确定模块,用于设定动态要素行为模型的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景;

危险场景区域确定模块,用于对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域。

第三方面,提供一种处理设备,包括计算机程序指令,其中,所述计算机程序指令被处理设备执行时用于实现上述自动驾驶决策危险场景生成方法对应的步骤。

第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时用于实现上述自动驾驶决策危险场景生成方法对应的步骤。

本发明由于采取以上技术方案,其具有以下优点:

1、本发明利用少量的道路测试接管数据在模拟仿真测试中构建多个危险场景,仿真环境的构建依托于真实测试数据,仿真中的静态要素和初始状态空间来源于真实场景,能够实现危险场景的高效生成,从而加速决策算法的开发和验证。

2、本发明在仿真中构建的危险场景基于实车道路测试中采集的数据,是决策在道路中遇到的问题场景衍生而来,仿真场景中的静态要素与动态要素的初始状态均来源于真实接管数据,相对于人为设计场景,更具有合理性和代表性。

3、本发明在构建危险场景时,采用优化搜索方法确定每次模拟仿真测试中动态要素行为模型的参数组合,与遍历参数空间的方法相比,优化搜索方法在保留随机探索性的情况下,增强了对于危险场景的行为模型参数的局部探索,能够提高在全部参数空间中搜索危险场景对应的行为模型参数的效率,从而实现加速生成面向决策的危险场景。

综上所述,本发明可以广泛应用于智能车辆领域中。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在整个附图中,用相同的附图标记表示相同的部件。在附图中:

图1是本发明一实施例提供的方法流程示意图;

图2是本发明一实施例提供的优化搜索方法的框架示意图;

图3是本发明一实施例提供的场景中车辆初始位置状态的示意图;

图4是本发明一实施例提供的相同危险场景生成数量下采用优化搜索方法和随机搜索方法的对比示意图;

图5是本发明一实施例提供的相同试验次数下采用优化搜索方法和随机搜索方法的对比示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施方式。虽然附图中显示了本发明的示例性实施方式,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本发明,并且能够将本发明的范围完整地传达给本领域的技术人员。

应理解的是,文中使用的术语仅出于描述特定示例实施方式的目的,而无意于进行限制。除非上下文另外明确地指出,否则如文中使用的单数形式“一”、“一个”以及“所述”也可以表示包括复数形式。术语“包括”、“包含”、“含有”以及“具有”是包含性的,并且因此指明所陈述的特征、步骤、操作、元件和/或部件的存在,但并不排除存在或者添加一个或多个其它特征、步骤、操作、元件、部件、和/或它们的组合。文中描述的方法步骤、过程、以及操作不解释为必须要求它们以所描述或说明的特定顺序执行,除非明确指出执行顺序。还应当理解,可以使用另外或者替代的步骤。

尽管可以在文中使用术语第一、第二、第三等来描述多个元件、部件、区域、层和/或部段,但是,这些元件、部件、区域、层和/或部段不应被这些术语所限制。这些术语可以仅用来将一个元件、部件、区域、层或部段与另一区域、层或部段区分开。除非上下文明确地指出,否则诸如“第一”、“第二”之类的术语以及其它数字术语在文中使用时并不暗示顺序或者次序。因此,以下讨论的第一元件、部件、区域、层或部段在不脱离示例实施方式的教导的情况下可以被称作第二元件、部件、区域、层或部段。

本发明实施例提供的自动驾驶决策危险场景生成方法、系统、设备及介质,利用实车道路测试中自动驾驶车辆发生司机接管情况时的场景,在模拟仿真测试中进行场景的重构,从而确定场景中的道路结构以及初始状态空间等,然后采用优化搜索方法构建危险场景,最终利用真实道路测试中遇到的偶发接管数据,进行场景衍生生成,找出该状态空间下尽可能多的危险场景,生成危险场景区域。

实施例1

如图1所示,本实施例提供一种自动驾驶决策危险场景生成方法,包括以下步骤:

1)提取实车道路测试中自动驾驶车辆发生司机接管情况时的场景的静态要素信息和动态要素信息。

2)根据提取的静态要素信息和动态要素信息,建立场景的初始状态空间,并建立动态要素行为模型。

3)设定动态要素行为模型的参数空间,并采用优化搜索方法,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果。

4)对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域。

本发明的方法实际上整个过程均需要进行仿真环境的构建,每一步均提供了仿真环境构建的一些信息,步骤1)提供了仿真构建时需要的基本信息,步骤2)在仿真中设定了仿真环境的初始状态,步骤3)在此基础上设定不同的参数,从而在构建的仿真场景中更高效地搜索危险场景,步骤4)在此基础上,对步骤3)确定的参数组合进行聚类和拟合。

上述步骤1)中,静态要素信息包括天气、道路类型、道路结构和静态障碍物位置等,动态要素信息包括动态交通参与者(例如车辆、行人)每一时刻的位置和速度。

上述步骤1)中,实车道路测试中自动驾驶车辆发生司机接管情况时的场景即为真实数据,发生司机接管则说明这类场景对于自动驾驶车辆而言是难以处理的,即为危险场景。

具体地,真实数据包括自动驾驶车辆自车和环境车的实时位置和速度以及环境车的种类和车道线位置等,每一动态要素的物理状态表示为q={x,y,v

上述步骤2)中,若能够获得测试区域的高精度地图,则可以直接将高精度地图导入进行场景构建;若无法获得测试区域的高精度地图,则从现有仿真平台提供的地图和道路结构中选择与真实数据相似的道路区域(例如十字路口、高速汇入匝道、双车道直路等)。

上述步骤2)中,根据提取的静态要素信息和动态要素信息,建立场景的初始状态空间,并建立动态要素行为模型,具体过程为:

2.1)根据提取的静态要素信息和动态要素信息,建立场景的初始状态空间S

S

其中,q

2.2)根据场景的初始状态空间S

具体地,在初始状态确定的情况下,动态场景的生成取决于环境中的动态要素行为模型,该动态要素行为模型可以为基于学习的行为模型或设定的典型行为模型。

具体地,以跟车场景为例,其中,前方环境车辆的动态要素行为模型可以定义为:以初始速度v

上述步骤3)中,设定动态要素行为模型的参数空间,并采用优化搜索方法,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果,具体过程为:

3.1)设定动态要素行为模型的参数空间。

具体地,不同种类的动态要素行为模型的参数不尽相同,可以根据实际情况进行设定,例如:行人的动态要素行为模型的参数空间可以定义为{v

具体地,在步骤2)中建立动态要素行为模型后,需要模型对应的参数才能确定最后的动态要素行为模型,模型的全部参数及其取值范围便构成参数空间。

具体地,例如在上述步骤2)中示例的动态要素行为模型中,共存在初始速度v

3.2)对设定的参数空间以一定的步长进行离散化。

具体地,最终仿真测试环境的构建需要从参数空间中选取一组确定的参数,从而生成动态的危险场景。为方便采样选择,可以将设定的参数空间以一定的步长进行离散化,从而将参数空间中的参数有限化。

具体地,例如对于参数空间p={d,a},可以取距离d的范围[5,50]m,以1为离散步长;取加速度a范围[0.5,5]m/s

3.3)如图2所示,采用优化搜索方法,根据离散化后的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果。

具体地,本步骤中为避免陷入局部最优问题,每次的参数在随机空间或已知危险场景周边进行选择,选择的准则为Metropolis准则,其核心思想是以一定的概率P接受新状态,概率P为:

P=exp(-k/b) (2)

其中,k表示当前试验次数,b表示与参数空间范围有关的一个可调节参数,且b=n/m,n为总试验次数,m为可调节的常参数。因此,概率P在试验初期,即当前试验次数k较小时,在整个参数空间内随机探索的概率更大;而随着试验次数k的增加,在危险场景周边进行参数选择的概率也在增加;即整体上,参数的确定有从随机探索到搜索危险场景的趋势。

因此,本步骤中,在局部危险场景周边选择参数时,具体过程为:

3.3.1)采用Metropolis准则,从离散化后的参数空间中选择一组参数组合,并以一定的搜索半径r在与其相邻的参数范围内确定新的参数组合,其中,每一次试验后,均会记录试验结果,其中的危险参数会被归为一类记录下来。

3.3.2)在整个参数空间随机探索时,检测确定的新参数组合是否与已测试参数重复,如果重复,则重新随机选择。

3.3.3)根据检测后的参数组合,构建危险场景,并记录试验结果。

具体地,危险场景的定义可以根据实际需求制定,例如当自动驾驶车辆与其他动态要素距离小于一定阈值时设定为危险场景,或者当碰撞时间(Time To Collision,TTC)大于一定阈值时设定为危险场景。相对于遍历搜索方法,本实施例采用的基于试验结果的参数移动选择,能够极大地提高参数搜索效率,更快速地找出自动驾驶算法的危险场景。

需要说明的是,上述提到的“已知危险场景周边”中的“周边”指的是与危险场景的参数差距小于一定阈值的参数,具体阈值依据具体的行为模型及其参数范围确定,具体可以定义一个搜索半径r,危险场景周边参数即是在距离危险场景参数±r的范围内。

上述步骤4)中,对于不同维度的空间可以采用不同的拟合方式,例如对于上述示例中的二维参数空间,则可以采用高斯混合模型(Gaussian Mixture Model),这种模型在聚类应用中较为常见,用多个高斯模型的组合来表示聚类的分布和边界;最终可以实现在二维参数空间中绘制多个椭圆,以表示危险场景区域。

按照上述步骤即可找出参数空间中的危险场景区域,在仿真环境中构建危险场景,从而找出自动驾驶算法的问题,并为其进一步优化提供方向。

下面通过具体实施例详细说明本发明的自动驾驶决策危险场景生成方法:

1)根据实车道路测试中自动驾驶车辆发生司机接管情况时的场景,提取场景中静态要素和动态要素的信息:

本实例利用中国冬奥首钢园区内的无人驾驶车辆道路测试接管数据之一,将首钢园区的高精度地图导入CARLA仿真平台中,确定发生接管数据的道路区域为无保护路口,依据数据记录的车辆位置及速度,确定场景中动态要素为三辆环境车,其初始位置状态如图3所示。

2)根据提取的静态要素信息和动态要素信息,建立场景的初始状态空间,并建立动态要素行为模型:

此时状态空间维度较高,包括四辆车(三辆环境车和自动驾驶车辆自身)的位置和各自的速度,设定自动驾驶车辆自车为EgoVehicle,前车为Leading Vehicle,右方来车(Vehicle coming from right side)和左方来车(Vehicle coming from left side)分别简记为Right Vehicle和Left Vehicle,由于自动驾驶车辆不是仅沿直路行驶,故其位置状态不能仅用一维坐标表示;而其余车辆仍然沿当前道路行驶,则初始状态空间可以表示为:

S

在自动驾驶车辆自车左转时,左方来车和右方来车是主要的冲突来源,因此,本实施例主要针对左方来车和右方来车进行行为模型参数的搜索及调整,左方来车和右方来车的动态要素行为模型为:左侧车辆和右侧车辆分别从特定的位置以v

3)设定动态要素行为模型的参数空间,并采用优化搜索方法,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果:

将动态要素行为模型中的加速度转化为对车辆的油门和刹车的控制,设定参数空间的范围如下:d∈[10,20]m、v∈[10,30]km/h、a∈[-0.7,0.3],其中,a为加速度,表示对油门和刹车的控制,a为正即是加速,a为负即是减速,其大小模拟了实际踩下油门和刹车的百分比;设置各参数离散步长分别为1m、1km/h以及0.1,最终参数空间为:

S

该场景下,采用DTC(Distance To Collision,碰撞距离)作为衡量场景危险程度的指标,设定危险场景阈值为3.6m,即在自车左转过程中,与两辆可能冲突车辆之间的碰撞距离小于3.6m时,认为场景危险。设定动态要素行为模型的参数空间,并采用优化搜索方法,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景以及记录试验结果。如图4和图5所示,优化搜索在2000次试验中,搜索到286个危险场景;随机搜索找到相同数量的危险场景,所需要的试验次数为3376次;即优化搜索方法所需要的测试次数约为原来的60%左右,搜索危险场景的速度约为随机搜索的1.7倍。同时,在相同的2000次试验次数下,随机搜索所找到的危险场景数量为151个,优化搜索所找到的危险场景数量为286个,约为随机搜索的1.9倍;即优化搜索相较于随机搜索,可以加速危险场景的发现与生成。

4)对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域。

实施例2

本实施例提供一种自动驾驶决策危险场景生成系统,包括:

场景信息提取模块,用于提取实车道路测试中自动驾驶车辆发生司机接管情况时的场景的静态要素信息和动态要素信息。

模型构建模块,用于根据提取的静态要素信息和动态要素信息,建立动态要素行为模型。

参数组合确定模块,用于设定动态要素行为模型的参数空间,确定每次模拟仿真测试中动态要素行为模型的参数组合,并构建危险场景。

危险场景区域确定模块,用于对构建出危险场景的参数组合进行聚类和拟合,生成该参数组合下的危险场景区域。

本实施例提供的系统是用于执行上述各方法实施例,具体流程和详细内容请参照上述实施例,此处不再赘述。

实施例3

本实施例提供一种与本实施例1所提供的自动驾驶决策危险场景生成方法对应的处理设备,处理设备可以适用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行实施例1的方法。

所述处理设备包括处理器、存储器、通信接口和总线,处理器、存储器和通信接口通过总线连接,以完成相互间的通信。存储器中存储有可在处理设备上运行的计算机程序,处理设备运行计算机程序时执行本实施例1所提供的自动驾驶决策危险场景生成方法。

在一些实现中,存储器可以是高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。

在另一些实现中,处理器可以为中央处理器(CPU)、数字信号处理器(DSP)等各种类型通用处理器,在此不做限定。

此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以理解,上述计算设备的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算设备的限定,具体的计算设备可以包括更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

实施例4

本实施例提供一种与本实施例1所提供的自动驾驶决策危险场景生成方法对应的计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本实施例1所述的自动驾驶决策危险场景生成方法的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。

上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

上述各实施例仅用于说明本发明,其中各部件的结构、连接方式和制作工艺等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。

相关技术
  • 一种三维场景地图的生成方法、装置、设备及存储介质
  • 一种自动驾驶系统性能评估方法、装置、设备及存储介质
  • 一种场景运动目标分割方法、系统、存储介质及设备
  • 一种数据血缘的生成方法、系统、电子设备和存储介质
  • 一种数据汇总文档生成的方法、设备、系统及介质
  • 面向自动驾驶决策规划系统仿真测试场景自动化生成方法
  • 面向自动驾驶决策规划系统仿真测试场景自动化生成方法
技术分类

06120115707736