掌桥专利:专业的专利平台
掌桥专利
首页

一种基于Resnet-AM网络的仿人轨迹规划方法

文献发布时间:2024-01-17 01:27:33


一种基于Resnet-AM网络的仿人轨迹规划方法

技术领域

本发明涉及车辆智能驾驶控制技术领域,具体涉及一种基于残差-注意力机制网络(Resnet-AM)的仿人轨迹规划方法。

背景技术

目前很多轨迹规划方法已经被开发出来,其中较为实用的一种为A*轨迹规划方法,它可以保证运动的可行性,并处理一般的动力学约束。其优点是引入启发式函数,使得搜索方向优先朝向目标点发展,减少搜索的次数,从而使计算速度大幅提升,基于A*的各种规划方法都是对状态空间进行启发式搜索,并以快速和安全的方式生成可行轨迹。

然而,上述轨迹规划方法与人类驾驶操控出的轨迹相比有很大的不同,随着人工智能的发展,在深度学习与自动驾驶相结合的领域中,很多研究都集中在了车辆转弯和换道的控制问题上。Chang等人将真实人类驾驶数据与基于车辆动力学的运动规划方法相结合设计出了仿人自动驾驶框架,该框架考虑U型转弯和五点转弯的最小操作宽度后,将结果推广到N点转弯场景,并且设计了转向机动函数评估最可行转向路径。Li等人利用二元线性回归和GRNN网络建立了轨迹规划模型,通过对弯曲道路驾驶时采集的车速、视距、道路曲率信息进行学习后,模型可以提供较好的类人驾驶体验。Chen等人提出了应用于换道驾驶行为和左转向驾驶行为的个性化轨迹规划及跟踪控制方法,通过历史公路驾驶数据生成轨迹点从而提高驾驶舒适性。

此外,Yang等人将人类驾驶员的个性化因素和交通环境因素同时进行考虑,设计出仿人换道轨迹规划模型,从而规划出纵向行驶速度以及横向个性化轨迹,通过仿真结果表明该模型可以较好的实现类人化、个性化换道轨迹规划。Yao等人基于存储在数据库中的真实驾驶人驾驶数据,提出了驾驶人在产生换道意图时的轨迹规划方法,并通过参考数据库中k个最接近的人类驾驶实例来生成参数化的换道轨迹。实验验证了基于数据驱动的方法可以产生类似于真实驾驶人的换道轨迹,但是还需要和基于数学机理的轨迹生成算法相结合,来改进预测效果。Chowdhuri等人运用Z2Color网络对车辆不同行驶模式进行研究,将原始立体相机图片作为输入,下一时刻速度和转向角度作为输出,使用不同环境下采集的驾驶数据进行训练后可以初步规划出拟人化行驶策略。

上述方法只对车辆转弯或者换道的控制问题上进行了研究,没有对避障过程中的各种场景进行考虑,并且虽然在拟人化驾驶控制方面取得了一定的成果,但是规划出的轨迹越长、轨迹点越密将更有利于局部动态决策避障,进而有利于保障局部地图场景下轨迹规划的平顺性。

发明内容

本发明针对特种车辆自动行驶过程中所规划轨迹的平顺性问题,利用多头注意力机制和MLP对Resnet网络进行改进设计,提出一种仿人驾驶的轨迹规划方法,该方法所规划出的轨迹更符合人类的驾驶轨迹,具有较好的平顺性。

一种基于Resnet-AM网络的仿人轨迹规划方法,该方法由以下步骤实现:

步骤一、采集专业驾驶员的操作数据,构建可行域地图,在所述可行域地图中设置起点和终点,对采集的操作数据提取行驶过程的轨迹信息,将所述可行域地图作为训练网络的输入,将轨迹信息作为训练网络的输出,构建驾驶数据集;

步骤二、将步骤一所述的可行域地图转换为一个张量后输入轨迹规划网络后,加载大型图像数据集中预训练的模型权重值,对图像的特征进行提取,获得可行域提取特征矩阵;

步骤三、对可行域提取特征矩阵进行预处理转换,采用多头注意力机制,在多个不同的线性投影空间中建立不同的投影信息,将投影后获得的空间张量输入多头注意力机制,获得一个自注意力单元的输出向量;

步骤四、根据步骤三获得的一个自注意力单元的输出向量,对多个独立的子注意力过程进行融合,将多头注意力机制搭配跳连接与多层感知机构成BLOCK,并采用五个BLOCK串联的形式输出特征;

步骤五、根据步骤四输出的特征,通过映射块1、映射块2映射出x、y未来多步的数值,输出后的数值按照标签数据进行误差补偿。

进一步地,步骤一中,可行域地图构建过程为:

将获取的点云信息从激光雷达坐标系转换到像素坐标系,获得数字图像上的点云坐标后对可行驶区域进行提取,通过坐标逆变换得到激光雷达坐标系下可行域地图,将所述可行域地图作为训练网络的输入数据;

可行域地图构建公式为:

式中,x

进一步地,步骤二中,对可行域地图特征进行提取的过程为:将可行域地图由一通道镜像为三通道,然后经过卷积层、归一化、激活函数、最大池化操作将图像转换成一个l

对图像的特征进行提取,在正向传播中,每一层通过跃层映射与高层进行连接;在反向传播中,误差沿神经网络的主干路进行逐层的反向传播,且高层的误差通过Resblock的短路连接跳过两层直接传到低层,残差映射表达式如下式:

y

x

式中,x

x

则残差映射表示为:

x

第L个Resblock与第l个Resblock的关系表示为:

式中,x

进一步地,步骤三中,一个自注意力单元在本线性投影空间中建立输入向量中不同特征之间的交互关系如下式:

式中,Q=XW

进一步地,步骤四中,对多个独立的子注意力过程进行融合,如下式:

head

MultiHeadAttention(Q,K,V)=Concat(head

式中,head

进一步地,步骤五中,映射块1由4个全连接网络块和随机降采样和线性化组成,其中的全连接网络块将输入的特征维度分成主干和支路两个路径,主干路径对传入的数据进行归一化操作,支路路径首先通过降采样和线性化操作将输入维度扩大3倍,经过激活函数、归一化、随机梯度下降、线性化的操作将输出维度降低3倍,然后支路采用跳连的方式与干路相加;映射块2则由8个全连接网络块以及随机降采样和线性化组成。

进一步地,步骤五中,采用参与训练的误差补偿方式将网络输出点进行补偿,网络的输出点为

式中,

本发明的有益效果:

本发明所述的方法从提升智能车辆局部轨迹规划稳定性的角度来解决车辆自动行驶过程中规划轨迹不平滑的问题。本发明方法提出的轨迹规划方法除了有利于提升规划轨迹质量外,对于其他类似工程领域中与未来多时间步状态变化的预测问题,如行人未来行走轨迹预判、工程人员未来施工姿态预判、其他车辆未来行驶轨迹等都是有帮助的。此外,本发明中采用擅长对空间信息高维特征进行提取的Resnet模型,提取出高维信息特征可以较好表征空间位置关系,这也使得其可以在其他的涉及特征提取步骤的智能驾驶任务中得以应用,例如目标检测,目标分类,行为预测等任务。

本发明所述的AM网络,相较于目前存在的映射网络,从寻找提取出高维特征相关性的角度提升了网络提取特征的能力,实验结果表明,本发明方法在动态局部规划轨迹稳定性方面相较于当前的传统轨迹规划方法和基于深度学习的规划方法具有更好的效果。

本发明所述的方法中,采用的AM网络来增强特征间的相关性,并且通过补偿网络对输出轨迹精度进行提高,实现平稳轨迹的规划。

附图说明

图1为本发明所述的一种基于Resnet-AM网络的仿人轨迹规划方法的流程图。

图2为本发明方法中可行域地图构建过程原理图。

图3为本发明方法中可行域地图特征提取网络结构图。

图4为本发明方法中基于AM网络的轨迹规划流程图。

具体实施方式

结合图1至图4说明本实施方式,一种基于Resnet-AM网络的仿人轨迹规划方法,该方法包括以下步骤:

S1、采集经验丰富的专业驾驶员对避障行驶通过性、稳定性、绕行方式等方面的认知判断等操作数据,构建可行域地图,地图构建过程如图2所示,其中,X

可行域地图构建方法如公式(1)所示:

式中,x

在每张可行域地图中设置出起点和终点后,对采集到的人类操控数据提取出行驶过程轨迹信息,将可行域地图作为训练网络的输入,轨迹信息作为输出,从而构建出人类驾驶数据集,从数据驱动角度对数据集中人类的行为特征进行挖掘。

S2、对可行域地图特征进行提取,其网络(特征提取网络,特征映射网络,补偿网络,这三个网络在一起构成轨迹规划网络)结构图如图3所示,将可行域地图由1通道镜像为3通道,之后经过卷积层、归一化、激活函数、最大池化操作将图像转换成一个l

y

x

式中,x

x

则残差映射可以表示为公式(5):

x

第L个Resblock与第l个Resblock的关系可表示为公式(6):

式中,x

根据导数的链式法则,损失函数ε相对于x

式中,第l个因子

S3、如图4所示,对可行域提取特征矩阵后,将其维度进行预处理转换成[l

式中,Q=XW

S4、得到一个自注意力单元的输出向量后,对多个独立的子注意力过程进行融合,如公式(9)、公式(10)所示:

head

MultiHeadAttention(Q,K,V)=Concat(head

式中,head

将多头注意力机制搭配跳连接与多层感知机(MLP)一起构成BLOCK,使用5个BLOCK串联的形式输出特征(即:将从可行域中提取的特征经过多头注意力机制寻找特征间的相关性之后,与多层感知机构成BLOCK,经过5个BLOCK之后处理出来的特征),多层感知机映射如公式(11):

O=(SM

式中,S表示一个小批量样本,M

S5、以S4中得到的多头连接块(BLOCK)输出为基础,通过映射块1(FC1)、映射块2(FC2)映射出x、y未来多步的数值坐标,输出后的数值按照标签数据进行误差补偿。

如图4所示,本实施方式中,FC1由4个全连接网络块(FC_BLOCK)和随机降采样和线性化组成,其中的FC_BLOCK是将输入的特征维度分成主干和支路两个路径,主干路径是对传入的数据进行归一化操作,支路路径首先通过降采样和线性化操作将输入维度扩大3倍,经过激活函数、归一化、随机梯度下降、线性化的操作将输出维度降低3倍,之后支路采用跳连的方式与干路相加。FC2则由8个FC_BLOCK以及随机降采样和线性化组成,其中x

训练过程中网络的输出点为

式中,

上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

相关技术
  • 一种基于深度学习的机器人避障轨迹规划方法及系统
  • 一种基于四阶三次B样条函数的机器人轨迹规划方法及仿人机器人平台
  • 基于仿人轨迹的静态路径规划方法、装置及系统
技术分类

06120116224902