掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及无人驾驶汽车决策技术领域,尤其涉及一种基于动机与风险评估的无人驾驶车辆智能决策方法。

背景技术

随着计算机与通讯技术的飞速发展,自动驾驶汽车获得了越来越多的关注。全球各大汽车公司也在加大对自动驾驶更高等级技术的研发力度。为了应对不同场景而研发的如BSD、CTA、IACC等高级辅助技术和决策算法相继投入市场。其中,面临各种交通环境以及应急情况的行为决策与规划是保证车辆安全、高效行驶的核心技术。目前驾驶行为决策主要以基于规则的或是基于学习算法的决策系统为主。基于规则的行为决策方法将无人驾驶车辆的行为进行划分,根据行驶规则、知识、经验以及交通规则等建立行为规则库,根据不同的环境信息划分车辆状态,不同的车辆状态间依据规则逻辑由不同的驾驶行为进行转换。其中以有限状态机模型(FSM)应用较为广泛。例如中国专利申请号CN201911389109.8,名称“基于深度学习的智能驾驶决策方法及系统”中将实时外部环境数据和实时内部运行数据输入深度学习模块以获取车辆实时控制指令;中国专利申请号CN201811524283.4,名称“一种基于规则与学习模型的无人驾驶汽车驶离高速的方法”中将规则模型与学习模型在不同环境下切换决策实现无人驾驶汽车安全下匝道任务。以上专利的决策系统依托神经网络模型或有限状态机模型进行决策,但神经网络需要的样本数量往往很大且容易过拟合,参数不易确定。有限状态机模型没有充分考虑环境的不确定性,在复杂的环境中,许多因素往往不能提前精确建模且在复杂环境下涉及状态增多时不便于管理。同时现有方法大多需要进行全局搜索,即在每一次决策步长内对每一个可能到达位置,每一条候选轨迹进行筛选。而在实际人类驾驶员驾驶时,其并不是每时每刻都在头脑中规划所有可行的轨迹,这极大地降低了计算效率以及实时性。

发明内容

本发明所要解决的技术问题是针对背景技术中所涉及到的缺陷,提供一种基于动机与风险评估的无人驾驶车辆智能决策方法。

本发明为解决上述技术问题采用以下技术方案:

本发明所要解决的技术问题是针对于上述现有技术的不足,提供一种基于动机与风险评估的无人驾驶车辆智能决策方法,包括以下步骤:

步骤1),利用NGSIM数据库中的数据计算得到数据库中记录的每一辆无人驾驶车辆在高速环境下的侧向速度、侧向位置、周围可行驶空间,并将行驶状态改变时无人驾驶车辆的速度、位置变化作为先验知识进行总结归类,得到第一至第三触发条件;所述周围可行驶空间为向量形式、包含自车行驶方向上与左前、前、右前、左后、右后车辆的距离;所述第一触发条件为:期望车速值与自车实际车速值相差大于3m/s;所述第二触发条件为:车前空间小于最小安全碰撞距离;所述第三触发条件为:车辆驶入驶出匝道;

步骤2),将步骤1)中的第一至第三触发条件作为动机决策算法依据,利用激光雷达及摄像头识别周围车辆状态信息并与归类结果进行匹配,通过NGSIM数据库获取的先验知识输出每种匹配结果可行的候选执行动作;

步骤3),建立风险评估模型,将执行动作中所包含的加速度、侧向位置信息映射到基于其他车辆行为预测的风险评估模型中,进行动态环境验证,利用风险评估的动态验证过程筛选满足决策方式的所有候选执行动作,去除风险值高于预设安全阈值的候选动作;

步骤4),根据风险度与驾驶规则建立执行动作评价函数,将候选执行动作代入评价函数中比较,选取评价函数值最大的执行动作计算最优目标终点,并根据最优目标终点对无人驾驶车辆速度与路径进行动态规划。

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤1)中的NGSIM数据库选用US-101数据集,其数据包括:车辆进入检测路段先后编号、开始检测时刻为起点的时间序列编号、车头中心距路段左侧边缘距离X、车头中心距路段起点距离Y、车辆瞬时速度、车辆瞬时加速度;首先将数据进行绘图分析,计算车辆改变行驶状态时的侧向速度、侧向加速度以及周围可行驶空间,然后记录车辆状态发生改变后的速度、位置信息并将其作为先验知识进行总结归类。

上述三种触发条件为NGSIM数据库离线归类得到,在车辆实际行驶过程中,需要依据周围车辆状态信息以及自车状态在线实时计算期望车速、最小安全碰撞距离值。

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤2)中,针对第一触发条件,利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速,并根据环境条件进行加减速操作;针对第二触发条件和第三触发条件,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障,以保证行驶安全。

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速的具体步骤为:

根据NGSIM数据库获取的先验知识选取自车车速v

d

式中,||X

由K-均值聚类法确定好隐含层中心参数后,对RBF网络进行训练;初始化隐含层到输出层的权值和各中心参数对应的宽度向量,利用梯度下降法对参数进行训练以决定每个聚类中心所代表的特征在输出中的占比:

式中,Δw

由RBF网络预测的期望车速表达式如下:

式中,X=[v

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障的具体计算过程如下:

采用正弦函数曲线模拟车辆换道路线,计算碰撞时间t

式中,W为前车车宽;τ为安全裕度;L

自车与障碍物不发生碰撞的必要条件是自车与前车在纵向方向还未发生碰撞时,车辆转过的侧向位移要大于前车车宽;因此,匀速换道避障和减速换道避障时的最小安全距离分别为:

式中,

以相对速度和车前距离作为三种行动的转换指标;则紧急情况下采取的三种行动的概率分别为:

式中,v

式中,

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤3)中的风险评估模型通过对下一时刻可行驶范围内的状态点进行评估而求得自车周围的风险情况,从而建立风险map图,每一个状态点在t时刻表示为:

式中,

通过计算车头时距Th和碰撞时间TTC对每个状态点进行评估:

式中,D(t)表示t时刻自车与前车的距离;V

风险评估模型ξ(s,T)为:

式中,s为周围车辆个数;ω

作为本发明一种基于动机与风险评估的无人驾驶车辆智能决策方法进一步的优化方案,所述步骤3)中利用风险评估模型动态验证筛选候选动作的过程为,将所有候选执行动作都通过不同的加速度与侧向位置序列表示:

式中

在加速度与侧向位置的候选序列基础上建立目标函数,寻找最适合当前交通环境,兼顾安全性与高效性的目标点:

式中,

由安全性要求产生决策行为的加速度与侧向位置序列,

式中,D

式中,q

RBF模拟驾驶员主观动机产生当前时刻的期望速度,由这一决策行为产生的加速度、侧向位置序列如下:

式中,

根据风险度与驾驶规则建立评价函数,对上述产生的候选序列进行筛选选取局部最优点:

式中,J是评价函数计算得到的候选序列的评价值,(a-a

最后利用评价函数对每个候选点进行评估,通过比较找到评价函数最大值所对应的加速度与侧向位置值,二者所组成的坐标(a,q|J

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

1.本发明提出的基于动机与风险评估的无人驾驶车辆智能决策方法,适用于无人驾驶汽车高速环境下的智能决策。将高速环境下车辆需要进行状态改变时的周围环境条件、动机作为智能决策的核心,在有动机触发时才进行决策,而其他情况下仍保持当前行驶状态,更加符合人类驾驶员决策行为;同时,其可以避免过多无意义决策,大大提高计算效率,保证决策过程的实时性要求;

2.本发明提出的风险评估动态验证过程充分考虑了交通环境的动态变化性,是对以动机为核心的决策算法的进一步完善。利用加速度与侧向位置序列具体化候选决策行为,通过评价函数判断决策的合理性,大大提高了无人驾驶车辆行驶的安全性。

附图说明

图1为本发明决策方法的原理图;

图2为本发明基于RBF网络求期望速度的原理图;

图3为本发明风险评估模型原理图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明:

本发明可以以许多不同的形式实现,而不应当认为限于这里所述的实施例。相反,提供这些实施例以便使本公开透彻且完整,并且将向本领域技术人员充分表达本发明的范围。在附图中,为了清楚起见放大了组件。

参照图1所示,本发明的一种基于动机与风险评估的无人驾驶车辆智能决策方法,通过分析并提取正常驾驶员在高速环境下改变当前驾驶状态时的触发动机,参考其作为智能决策的核心可以避免过多无意义决策,提高计算效率。同时,利用可以反映未来时域的风险评估模型,将所提出的基于动机的决策方法映射到风险评估中,去寻找满足当前决策的局部最优点作为下一时刻的目标终点;具体包括以下步骤:

步骤1),利用NGSIM数据库中的数据计算得到数据库中记录的每一辆无人驾驶车辆在高速环境下的侧向速度、侧向位置、周围可行驶空间,并将行驶状态改变时无人驾驶车辆的速度、位置变化作为先验知识进行总结归类,得到第一至第三触发条件;所述周围可行驶空间为向量形式、包含自车行驶方向上与左前、前、右前、左后、右后车辆的距离;所述第一触发条件为:期望车速值与自车实际车速值相差大于3m/s;所述第二触发条件为:车前空间小于最小安全碰撞距离;所述第三触发条件为:车辆驶入驶出匝道;

步骤2),将步骤1)中的第一至第三触发条件作为动机决策算法依据,利用激光雷达及摄像头识别周围车辆状态信息并与归类结果进行匹配,通过NGSIM数据库获取的先验知识输出每种匹配结果可行的候选执行动作;

步骤3),建立风险评估模型,将执行动作中所包含的加速度、侧向位置信息映射到基于其他车辆行为预测的风险评估模型中,进行动态环境验证,利用风险评估的动态验证过程筛选满足决策方式的所有候选执行动作,去除风险值高于预设安全阈值的候选动作;

步骤4),根据风险度与驾驶规则建立执行动作评价函数,将候选执行动作代入评价函数中比较,选取评价函数值最大的执行动作计算最优目标终点,并根据最优目标终点对无人驾驶车辆速度与路径进行动态规划。

所述步骤1)中的NGSIM数据库选用US-101数据集,其数据包括:车辆进入检测路段先后编号、开始检测时刻为起点的时间序列编号、车头中心距路段左侧边缘距离X、车头中心距路段起点距离Y、车辆瞬时速度、车辆瞬时加速度;首先将数据进行绘图分析,计算车辆改变行驶状态时的侧向速度、侧向加速度以及周围可行驶空间,然后记录车辆状态发生改变后的速度、位置信息并将其作为先验知识进行总结归类。

上述三种触发条件为NGSIM数据库离线归类得到,在车辆实际行驶过程中,需要依据周围车辆状态信息以及自车状态在线实时计算期望车速、最小安全碰撞距离值。

所述步骤2)中,针对第一触发条件,利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速,并根据环境条件进行加减速操作;针对第二触发条件和第三触发条件,计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障,以保证行驶安全。

如图2所示,所述利用径向基神经网络即RBF网络模拟行驶状态改变时车速变化过程计算出期望车速的具体步骤为:

根据NGSIM数据库获取的先验知识选取自车车速v

d

式中,||X

由K-均值聚类法确定好隐含层中心参数后,对RBF网络进行训练;初始化隐含层到输出层的权值和各中心参数对应的宽度向量,利用梯度下降法对参数进行训练以决定每个聚类中心所代表的特征在输出中的占比:

式中,Δw

由RBF网络预测的期望车速表达式如下:

式中,X=[v

计算当前车速条件下最小安全碰撞距离,采用制动转向相结合进行避障的具体计算过程如下:

采用正弦函数曲线模拟车辆换道路线,计算碰撞时间t

式中,W为前车车宽;τ为安全裕度;L

自车与障碍物不发生碰撞的必要条件是自车与前车在纵向方向还未发生碰撞时,车辆转过的侧向位移要大于前车车宽。因此,匀速换道避障和减速换道避障时的最小安全距离分别为:

式中,

以相对速度和车前距离作为三种行动的转换指标。则紧急情况下采取的三种行动的概率分别为:

式中,v

式中,

如图3所示,所述步骤3)中的风险评估模型通过对下一时刻可行驶范围内的状态点进行评估而求得自车周围的风险情况,从而建立风险map图,每一个状态点在t时刻表示为:

式中,

通过计算车头时距Th和碰撞时间TTC对每个状态点进行评估:

式中,D(t)表示t时刻自车与前车的距离;V

风险评估模型ξ(s,T)为:

式中,s为周围车辆个数;ω

所述步骤3)中利用风险评估模型动态验证筛选候选动作的过程为,将所有候选执行动作都通过不同的加速度与侧向位置序列表示:

式中

在加速度与侧向位置的候选序列基础上建立目标函数,寻找最适合当前交通环境,兼顾安全性与高效性的目标点:

式中,

由安全性要求产生决策行为的加速度与侧向位置序列,

式中,D

式中,q

RBF模拟驾驶员主观动机产生当前时刻的期望速度,由这一决策行为产生的加速度、侧向位置序列如下:

式中,

根据风险度与驾驶规则建立评价函数,对上述产生的候选序列进行筛选选取局部最优点:

式中,J是评价函数计算得到的候选序列的评价值,(a-a

最后利用评价函数对每个候选点进行评估,通过比较找到评价函数最大值所对应的加速度与侧向位置值,二者所组成的坐标(a,q|J

本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 基于动机与风险评估的无人驾驶车辆智能决策方法
  • 基于动机与风险评估的无人驾驶车辆智能决策方法
技术分类

06120112231910