掌桥专利:专业的专利平台
掌桥专利
首页

自动驾驶车辆驾驶场景重构及决策推演评估方法和系统

文献发布时间:2023-06-19 18:46:07


自动驾驶车辆驾驶场景重构及决策推演评估方法和系统

技术领域

本发明属于智能车辆领域,具体涉及一种基于反应式模型的自动驾驶车辆驾驶场景重构及决策推演评估方法和系统。

背景技术

近年来,人工智能技术在智能交通和车辆领域逐渐开始商业化应用,智能网联车辆逐渐走入人们的视野。一般来说,自动驾驶车辆的自动驾驶系统可以分为感知、定位、决策和控制四个模块。其中,决策模块中配置的决策算法相当于自动驾驶车辆的大脑,对于实现高级别自动驾驶乃至无人驾驶起到至关重要的作用。

由于在真实环境中对决策算法进行测试和训练的成本较高,因此在虚拟环境中利用真实数据重构驾驶场景是一种有潜力的方案。目前主流的驾驶场景重构方法是将采集的真实数据直接在虚拟环境中回放,然而这种情况下,虚拟环境中的人、车不会对自动驾驶车辆的不同决策做出相应的反应,因此不能很好的评价和模拟可能的真实情况。

发明内容

针对上述问题,本发明的目的是提供一种自动驾驶车辆驾驶场景重构及决策推演评估方法和系统,通过反应式模型模拟真实环境中其他人、车等物体对自动驾驶车辆驾驶决策结果的反应,能够有效提高自动驾驶车辆的决策效果。

为实现上述目的,本发明采取以下技术方案:

第一方面,本发明提供一种自动驾驶车辆驾驶场景重构及决策推演评估方法,包括以下步骤:

利用真实驾驶场景中某一时刻的驾驶数据在虚拟环境中重构该驾驶场景,并以该时刻作为虚拟环境的起始时刻,利用场景反应式模型对下一时刻虚拟环境中驾驶场景内所有元素的状态信息进行更新,迭代后得到一系列连续时刻的虚拟环境的驾驶场景;

其中,所述场景反应式模型基于采集的自动驾驶车辆在真实世界驾驶场景中多个连续时刻的驾驶数据,预先训练而成;

基于得到的一系列连续时刻的虚拟环境的驾驶场景,对自动驾驶车辆的自动驾驶决策效果进行评估。

进一步,所述真实世界驾驶场景中每一时刻的驾驶数据,包括该驾驶场景中各元素的当前时刻状态,每个元素的状态以预设维度的向量表示,所述驾驶场景中的元素包括动态元素和静态元素,所述动态元素包括行人、车辆,所述静态元素包括车道拓扑和交通规则。

进一步,所述场景反应式模型包括自动驾驶车辆的车辆动力学模型以及其他车辆和行人的反应模型;

所述自动驾驶车辆的车辆动力学模型的输入为自动驾驶车辆在当前时刻的状态信息以及决策动作;输出为自动驾驶车辆在下一时刻的状态信息;所述自动驾驶车辆在当前时刻的状态信息,包括车辆的位置、角度和速度;

所述其他车辆和行人的反应模型的输入为当前时刻的环境状态信息,包括当前时刻驾驶环境中所包含的动态元素和静态元素的状态信息;输出为下一时刻驾驶环境中所包含的动态元素和静态元素的状态信息。

进一步,所述自动驾驶车辆的车辆动力学模型基于神经网络建立;所述其他车辆和行人的反应模型基于图神经网络建立。

进一步,所述利用真实驾驶场景中某一时刻的驾驶数据在虚拟环境中重构该驾驶场景,并以该时刻作为虚拟环境的起始时刻,利用场景反应式模型对下一时刻虚拟环境中驾驶场景内所有元素的状态信息进行更新,迭代后得到一系列连续时刻的虚拟环境的驾驶场景的方法,包括:

以真实世界驾驶场景中某一时刻的驾驶数据为基础,在虚拟环境中进行驾驶场景重构,并将其作为重构起始时刻的虚拟驾驶场景;

以重构起始时刻的虚拟驾驶场景中所有元素的状态信息及自动驾驶车辆决策动作输入训练好的场景反应式模型,得到下一时刻虚拟驾驶场景中所有元素的状态信息;

重复上一步骤,得到一系列连续时刻的虚拟驾驶场景,每一时刻都包含虚拟驾驶场景所有元素的状态信息。

进一步,所述基于得到的一系列连续时刻的虚拟环境的驾驶场景,对自动驾驶车辆的自动驾驶决策效果进行推演评估的方法,包括:

基于评价函数对得到的一系列连续时刻的虚拟驾驶场景进行计算,得到一系列连续时刻的虚拟驾驶场景的代价值;

基于得到的一系列连续时刻的虚拟场景的代价值,得到自动驾驶决策效果的综合评价结果。

进一步,所述基于得到的一系列连续时刻的虚拟场景的代价值,得到自动驾驶决策效果的综合评价结果,包括:将一系列连续时刻的虚拟场景的代价值进行加和,基于总代价值对自动驾驶决策效果进行评价。

第二方面,本发明提供一种自动驾驶车辆驾驶场景重构及决策推演评估系统,包括:

场景重构模块,用于利用真实驾驶场景中某一时刻的驾驶数据在虚拟环境中重构该驾驶场景,并以该时刻作为虚拟环境的起始时刻,利用场景反应式模型对下一时刻虚拟环境中驾驶场景内所有元素的状态信息进行更新,迭代后得到一系列连续时刻的虚拟环境的驾驶场景;其中,所述场景反应式模型基于采集的自动驾驶车辆在真实世界驾驶场景中多个连续时刻的驾驶数据,预先训练而成;

效果评估模块,用于基于得到的一系列连续时刻的虚拟环境的驾驶场景,对自动驾驶车辆的自动驾驶决策效果进行推演评估。

第三方面,本发明提供一种处理设备,所述处理设备至少包括处理器和存储器,所述存储器上存储有计算机程序,所述处理器运行所述计算机程序时执行以实现所述自动驾驶车辆驾驶场景重构及决策推演评估方法的步骤。

第四方面,本发明提供一种计算机存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现所述自动驾驶车辆驾驶场景重构及决策推演评估方法的步骤。

本发明由于采取以上技术方案,其具有以下优点:本发明提供的驾驶场景重构方法,通过反应式模型模拟真实环境中其他人、车等物体对自动驾驶车辆驾驶决策结果的反应,进而评价自动驾驶车辆的决策效果。避免了在真实世界中评价和测试自动驾驶车辆的决策效果。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在整个附图中,用相同的附图标记表示相同的部件。在附图中:

图1是本发明实施例提供的自动驾驶车辆驾驶场景重构方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本发明的一些实施例中,提供一种自动驾驶车辆驾驶场景重构及决策推演评估方法,在采集真实场景驾驶数据后,包括周边环境中障碍物的位置、速度等信息,通过反应式模型构建自车周边环境中其他人、车等物体对自动驾驶车辆驾驶决策结果的反应,实现对真实驾驶场景的重构。通过反应式模型模拟真实环境中其他人、车等物体对自动驾驶车辆驾驶决策结果的反应,进而评价自动驾驶车辆的决策效果。避免了在真实世界中评价和测试自动驾驶车辆的决策效果。

与之相对应地,本发明的另一些实施例中提供一种自动驾驶车辆驾驶场景重构及决策推演评估系统、设备和介质。

实施例1

如图1所示,本实施例提供一种自动驾驶车辆驾驶场景重构及决策推演评估方法,包括以下步骤:

S1:基于采集的自动驾驶车辆在真实世界驾驶场景中多个连续时刻的驾驶数据,对预先构建的场景反应式模型进行训练。

S2:利用某一时刻的驾驶数据在虚拟环境中重构该驾驶场景,并以该时刻作为虚拟环境的起始时刻,利用步骤S2中的场景反应式模型对下一时刻虚拟环境中驾驶场景内所有元素的状态信息进行更新,迭代后得到一系列连续时刻的虚拟环境的驾驶场景,作为推演结果。

S3:基于得到的一系列连续时刻的虚拟环境的驾驶场景,对自动驾驶车辆的自动驾驶决策效果进行评估。

优选地,上述步骤S1中,每一时刻的驾驶数据包括真实世界驾驶场景中各元素的当前时刻状态,每个元素的状态维度一定。其中,真实世界驾驶场景中元素包括动态元素和静态元素,动态元素包括行人、车辆等,静态元素包括车道拓扑和交通规则等,例如红绿灯的灯色状态等。

优选地,上述步骤S1中,预先构建的场景反应式模型包括自动驾驶车辆的车辆动力学模型以及驾驶环境中其他车辆和行人的反应模型。

优选地,上述自动驾驶车辆的车辆动力学模型的输入为自动驾驶车辆在当前时刻的状态信息以及决策动作a,输出为自动驾驶车辆在下一时刻的状态信息。其中,自动驾驶车辆在当前时刻的状态信息,包括车辆的位置、角度和速度(x,y,vx,vy,yaw),x,y分别为自动驾驶车辆的坐标,vx,vy分别是自动驾驶车辆在x,y两个方向上的速度,yaw为自动驾驶车辆当前朝向角。

优选地,自动驾驶车辆的车辆动力学模型可以使用神经网络方法或其他基于学习的方法构建,只需输入输出与上述一致。

优选地,上述其他车辆和行人的反应模型基于图神经网络构建。其中,图神经网络由多个节点及节点间的连接关系组成,每个节点代表当前时刻驾驶环境中的一个元素。图神经网络的输入为当前时刻的环境状态信息,包括当前时刻驾驶环境中所包含的人、车等动态元素及车道、车道边界、红绿灯、人行横道等静态元素的状态;输出为下一时刻的环境状态信息。

优选地,上述步骤S2可以通过以下步骤实现:

步骤S21:以真实世界驾驶场景中某一时刻的驾驶数据为基础,在虚拟环境中进行驾驶场景重构,并将其作为重构起始时刻的虚拟驾驶场景。

其中,在虚拟环境中重构该驾驶场景指在虚拟环境中构建与真实世界驾驶场景完全一致的驾驶场景作为重构起始时刻,这意味着虚拟环境的重构起始时刻包含了真实世界驾驶场景中某一时刻的所有元素状态信息。可以将真实世界驾驶场景中的任意一帧作为该虚拟环境的重构起始时刻。

步骤S22:以重构起始时刻的虚拟驾驶场景中所有元素的状态信息及自动驾驶车辆决策动作a输入训练好的场景反应式模型,得到下一时刻虚拟驾驶场景中所有元素的状态信息。

步骤S23:重复步骤S22,得到一系列连续时刻的虚拟驾驶场景,每一时刻都包含训驾驶场景中所有元素的状态信息。

优选地,上述步骤S3可以通过以下步骤实现:

步骤S31:基于评价函数对步骤S2中得到的一系列连续时刻的虚拟驾驶场景进行计算,得到一系列连续时刻的虚拟驾驶场景的代价值。

其中,基于评价函数计算各时刻对应的虚拟驾驶场景的代价值时,可以根据设计需求选取,例如评价函数可以定义为:奖励较快的驾驶速度等。

步骤S32:基于得到的一系列连续时刻的虚拟场景的代价值,得到自动驾驶决策效果的综合评价结果。

其中,在对自动驾驶决策效果进行综合评价时,将一系列连续时刻的虚拟场景的代价值进行加和,总代价值越低自动驾驶决策效果越好。

实施例2

上述实施例1提供了自动驾驶车辆驾驶场景重构及决策推演评估方法,与之相对应地,本实施例提供一种自动驾驶车辆驾驶场景重构及决策推演评估系统。本实施例提供的系统可以实施实施例1的自动驾驶车辆驾驶场景重构及决策推演评估方法,该系统可以通过软件、硬件或软硬结合的方式来实现。例如,该系统可以包括集成的或分开的功能模块或功能单元来执行实施例1各方法中的对应步骤。由于本实施例的系统基本相似于方法实施例,所以本实施例描述过程比较简单,相关之处可以参见实施例1的部分说明即可,本实施例提供的系统的实施例仅仅是示意性的。

本实施例提供的一种自动驾驶车辆驾驶场景重构及决策推演评估系统,包括:

场景重构模块,用于利用真实驾驶场景中某一时刻的驾驶数据在虚拟环境中重构该驾驶场景,并以该时刻作为虚拟环境的起始时刻,利用场景反应式模型对下一时刻虚拟环境中驾驶场景内所有元素的状态信息进行更新,迭代后得到一系列连续时刻的虚拟环境的驾驶场景;其中,所述场景反应式模型基于采集的自动驾驶车辆在真实世界驾驶场景中多个连续时刻的驾驶数据,预先训练而成;

效果评估模块,用于基于得到的一系列连续时刻的虚拟环境的驾驶场景,对自动驾驶车辆的自动驾驶决策效果进行推演评估。

实施例3

本实施例提供一种与本实施例1所提供的自动驾驶车辆驾驶场景重构及决策推演评估方法对应的处理设备,处理设备可以是用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行实施例1的方法。

所述处理设备包括处理器、存储器、通信接口和总线,处理器、存储器和通信接口通过总线连接,以完成相互间的通信。存储器中存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行本实施例1所提供的自动驾驶车辆驾驶场景重构及决策推演评估方法。

在一些实施例中,存储器可以是高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。

在另一些实施例中,处理器可以为中央处理器(CPU)、数字信号处理器(DSP)等各种类型通用处理器,在此不做限定。

实施例4

本实施例1的自动驾驶车辆驾驶场景重构方法可被具体实现为一种计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本实施例1所述的自动驾驶车辆驾驶场景重构及决策推演评估方法的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120115687582