掌桥专利:专业的专利平台
掌桥专利
首页

一种无人车数据驱动控制方法和装置

文献发布时间:2023-06-19 11:29:13


一种无人车数据驱动控制方法和装置

技术领域

本申请涉及无人车技术领域,特别是涉及一种无人车数据驱动控制方法、装置、计算机设备和存储介质。

背景技术

随着无人车技术的发展,无人车有了越来越多的应用。无人车的动力学是高度非线性的,设计基于优化的控制方法具有一定的挑战。当前的控制方法均有各自的局限性,绝大部分工作控制器的设计均需要动力学模型信息,但实际应用中精确模型难以获取。目前机器学习的建模与控制是一个热点方向,但基于机器学习的建模方法求解得到的模型是高度非线性的网络模型;此外,多数基于机器学习特别是深度学习的建模方法还存在鲁棒性和泛化能力不强的问题。基于上述模型设计基于优化的预测控制算法需要求解一个含有非线性约束的复杂优化问题,求解计算量大,且求解的可靠性无法保证。因此,在复杂路况下,无人车预测控制方法存在控制效果不佳的问题。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提升无人车自主驾驶对路面适应性能的无人车数据驱动控制方法、装置、计算机设备和存储介质。

一种无人车数据驱动控制方法,所述方法包括:

通过传感器获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;

构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;

在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型。

在其中一个实施例中,还包括:构建非线性静态映射模型为:

其中,

构建高维线性动态演化模型为:

其中,A,B表示高维线性动态演化模型的参数;C表示高维线性空间到低维非线性原状态空间的映射关系参数;u(k)表示k时刻的控制量;

在其中一个实施例中,还包括:构建求解高维线性动态演化模型参数A,B的一种最优化目标函数为:

其中,M表示所述多组数据对信息的组数;x

构建求解高维线性动态演化模型参数C的一种最优化目标函数为:

其中,β>0是一个常数。

在其中一个实施例中,还包括:当非线性映射函数

其中,γ>0是一个常数。

在其中一个实施例中,还包括:在任意k时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:

subject to:

Cz(k+i|k)∈X,i=0,…,N-1

u(k+i|k)∈U,i=0,…,N-1

其中,

在其中一个实施例中,还包括:通过二次型优化求解器求解所述模型预测控制最优化模型。

在其中一个实施例中,状态量包括车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量包括车辆的方向盘转角、以及油门或刹车量。

一种无人车数据驱动控制装置,所述装置包括:

初始数据获取模块,用于通过传感器获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;

高维特征空间模型确定模块,用于构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;

模型预测控制最优化模型求解模块,用于在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

通过传感器获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;

构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;

在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

通过传感器获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;

构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;

在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。

上述无人车数据驱动控制方法、装置、计算机设备和存储介质,通过传感器获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。本发明通过非线性映射将系统的原状态空间映射到高维特征空间,在高维特征空间对动力学特性进行线性逼近。再设计模型预测控制器实现基于数据驱动的模型预测控制算法,可以实现无人车的预测控制。其中,非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。这样做的好处可以有效降低映射到高维特征空间的维数,不仅可以减轻模型预测控制器的在线计算负荷、而且还可以提升模型预测控制器的控制性能。

附图说明

图1为一个实施例中无人车数据驱动控制方法的应用场景图;

图2为一个实施例中车辆四轮模型的受力图;

图3为一个具体实施例中数据驱动的无人车控制模型示意图;

图4为一个具体实施例中数据驱动的车辆动力学模型示意图;

图5为一个实施例中无人车数据驱动控制装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的无人车数据驱动控制方法,可以应用于如下应用环境中。通过无人车上的控制终端执行一种无人车数据驱动控制方法,通过传感器获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。其中,终端可以但不限于是嵌入无人车的计算机、平板电脑。

在一个实施例中,如图1所示,提供了一种无人车数据驱动控制方法,包括以下步骤:

步骤102,通过传感器获取无人车在行驶状态下的多组数据对信息。

多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量。

利用传感器采集车辆状态量x=[v

步骤104,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题,求解高维线性动态演化模型,得到高维线性动态演化模型的参数信息。

构建的非线性静态映射模型需要满足

考虑四轮车辆模型,并假设车体为刚体,如图2所示为车辆四轮模型的受力图。车辆动力学系统描述成一个连续时间非线性系统:

式中x=[v

给定一个采样间隔,可以写出上述系统在离散时间下的模型形式:

x(k+1)=f(x(k),u(k))

其中k是离散时间指针。

由于模型未知,采用数据驱动的方式对系统进行建模,首先构建非线性静态映射模型为:

其中,

在上述基础上,通过一个非线性的特征映射把原系统映射到一个高维特征空间上,在此空间构建一个线性模型来替代原模型,可以把非线性控制问题转化成高维线性空间的线性控制问题进行求解,那么高维空间下原系统可以表示成:

构建有监督回归优化问题,根据M组数据对(u x x

通过一个线性模型替代原始的非线性模型的优势是,线性模型的求解更加高效,可以提高算法的时效性,可以通过增加非线性映射的维度增加非线性映射的准确性,模型具有较好的可扩展性,有利于提升无人车的控制精度。

步骤106,在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。

在无人车实际控制中,通常目标是让车辆状态量跟踪一条时变的期望轨迹x

Cz(k+i|k)∈X

u(k+i|k)∈U

以及满足模型约束:

采用模型预测控制算法,可以以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,根据所述多组数据对信息通过优化求解器求解模型预测控制最优化模型,确定无人车在预测时域内控制量序列

模型预测控制(MPC)是一类特殊的控制。它的当前控制动作是在每一个采样瞬间通过求解一个有限时域开环最优控制问题而获得。过程的当前状态作为最优控制问题的初始状态,解得的最优控制序列只实施第一个控制作用。通过模型预测控制算法预测控制时域内无人车的控制量有利于使模型失配、畸变、扰动等引起的不确定性及时得到弥补,从而得到较好的动态控制性能,从而提高系统的鲁棒性。

上述无人车数据驱动控制方法中,通过传感器获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。本发明通过非线性映射将系统的原状态空间映射到高维特征空间,在高维特征空间对动力学特性进行线性逼近,再设计模型预测控制器实现基于数据驱动的模型预测控制算法,可以实现无人车的预测控制。

在其中一个实施例中,还包括:构建非线性静态映射模型为:

其中,

构建高维线性动态演化模型为:

其中,A,B表示高维线性动态演化模型的参数;C表示高维线性空间到低维非线性原状态空间的映射关系参数;u(k)表示k时刻的控制量;

在其中一个实施例中,还包括:构建求解高维线性动态演化模型参数A,B的一种最优化目标函数为:

其中,M表示多组数据对信息的组数;x

构建求解高维线性动态演化模型参数C的一种最优化目标函数为:

其中,β>0是一个常数。

在其中一个实施例中,还包括:为了降低在线计算复杂度,可以选择较低维数的非线性映射函数

同时满足约束:

其中α

在其中一个实施例中,还包括:当非线性映射函数

其中,γ>0是一个常数。

通过深度神经网络构建非线性映射函数,只需要保证深度神经网络的每一层的偏置权值为零和激活函数

在其中一个实施例中,还包括:当车辆动力学系统存在外部干扰时,也就是x(k+1)=f(x(k),u(k))+d(k),其中d(k)是外部干扰;构建求解高维线性动态演化模型参数A,B的一种最优化目标函数为:

其中,M表示多组数据对信息的组数;x

在其中一个实施例中,还包括:当非线性映射函数

其中,γ>0是一个常数。

在其中一个实施例中,还包括:在任意k时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:

subject to:

Cz(k+i|k)∈X,i=0,…,N-1

u(k+i|k)∈U,i=0,…,N-1

其中,

在其中一个实施例中,还包括:通过优化求解器Quadprog或其他二次型优化求解器求解模型预测控制最优化模型。

Quadprog是在MATLAB中求解二次规划的函数,可以用于求解本发明所设计的模型预测控制最优化模型。

在其中一个实施例中,状态量包括车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量包括车辆的方向盘转角、以及油门或刹车量。

在一个具体实施例中,数据驱动的无人车模型预测控制模型如图3所示,通过非线性静态映射模型将原状态空间n维的状态量x(k)转换为高维特征空间

在另一个具体实施例中,数据驱动的车辆动力学模型如图4所述,在车辆行驶状态下采集M组数据对

在另一个具体实施例中,提供了一种无人车数据驱动控制方法,包括:

1.利用传感器采集车辆状态量x=[v

2.采用最小二乘算法离线构建高维线性动态演化模型对应的最优化问题求解A,B,C;

3.采用基函数或深度神经网络构建非线性静态映射模型,若所述非线性静态映射模型设计为基函数形式时,可利用最小二乘法等有监督回归算法离线构建高维线性动态演化模型对应的最优化问题求解模型参数A,B,C;若所述非线性静态映射模型设计为深度神经网络时,也可利用最小二乘法等有监督回归算法离线构建高维线性动态演化模型和非线性静态映射模型对应的最优化问题求解模型参数A,B,C和深度神经网络权值W。在线控制时在每个时刻k利用优化求解器Quadprog等二次型求解器在线求解模型预测控制最优化模型得到最优的

4.把u(k|k)应用到无人车系统。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种无人车数据驱动控制装置,包括:初始数据获取模块502、高维特征空间模型确定模块504和模型预测控制最优化模型求解模块506,其中:

初始数据获取模块502,用于通过传感器获取无人车在行驶状态下的多组数据对信息;多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;

高维特征空间模型确定模块504,用于构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数。

模型预测控制最优化模型求解模块506,用于在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。

高维特征空间模型确定模块504还用于构建非线性静态映射模型为:

其中,

构建高维线性动态演化模型为:

其中,A,B表示高维线性动态演化模型的参数;C表示高维线性空间到低维非线性原状态空间的映射关系参数;u(k)表示k时刻的控制量;

高维特征空间模型确定模块504还用于构建求解高维线性动态演化模型参数A,B的一种最优化目标函数为:

其中,M表示多组数据对信息的组数;x

构建求解高维线性动态演化模型参数C的一种最优化目标函数为:

其中,β>0是一个常数。

高维特征空间模型确定模块504还用于当非线性映射函数

其中,γ>0是一个常数。

模型预测控制最优化模型求解模块506还用于在任意k时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:

subject to:

Cz(k+i|k)∈X,i=0,…,N-1

u(k+i|k)∈U,i=0,…,N-1

其中,

模型预测控制最优化模型求解模块506还用于通过二次型优化求解器求解模型预测控制最优化模型。

关于无人车数据驱动控制装置的具体限定可以参见上文中对于无人车数据驱动控制方法的限定,在此不再赘述。上述无人车数据驱动控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种无人车数据驱动控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种无人车数据驱动自适应控制方法和装置
  • 一种无人车数据驱动控制方法和装置
技术分类

06120112941050