掌桥专利:专业的专利平台
掌桥专利
首页

一种车辆巡航控制方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 19:30:30


一种车辆巡航控制方法、装置、电子设备及存储介质

技术领域

本发明涉及车辆控制技术领域,尤其涉及一种车辆巡航控制方法、装置、电子设备及存储介质。

背景技术

为了最大化避免道路交通事故的频繁发生减少由人为原因造成的人身及物质损失,驾驶安全系统应运而生。主动安全系统可以从根本上防止事故的发生。其中,与只操控本车行驶速度不变的传统定速巡航系统不同,装配有自适应巡航系统的车辆可以通过多种方式获得前车速度,随着前车速度的变化而调整本车速度,同时使两车安全间距随车速自适应改变,从而能够适应多变的交通场景与工况。

现有技术中的自适应巡航系统,需要根据自适应巡航系统的动力学模型计算控制输入。但是由于动力学模型存在误差,而这些会造成系统的控制偏差,因此导致自适应巡航系统的控制精度较差。

发明内容

本发明实施例提供一种车辆巡航控制方法、装置、电子设备及存储介质,能够无需利用巡航系统的动力学模型,只需根据巡航系统的输入和输出数据就能迭代求解控制输入的最优反馈控制增益,这样就能够避免由于动力学模型可能存在误差引起的系统控制偏差,保证控制的精确度。

第一方面,本发明实施例提供一种车辆巡航控制方法,包括:建立车辆的巡航系统的线性状态空间方程,线性状态空间方程包括状态变量以及期望控制输入;根据线性状态空间方程,采用线性二次调节器最优设计方法,利用预设方程设计得到巡航系统的反馈控制器;利用反馈控制器根据状态变量以及期望控制输入计算得到期望控制输入的值;以及,根据期望控制输入的值对车辆进行巡航控制;其中利用预设方程设计得到巡航系统的反馈控制器的过程包括:利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解预设方程进而得到反馈控制器。

第二方面,本发明实施例提供一种车辆巡航控制装置,包括:

空间方程建立模块,用于建立车辆的巡航系统的线性状态空间方程,线性状态空间方程包括状态变量以及期望控制输入;反馈控制器设计模块,用于根据线性状态空间方程,采用线性二次调节器最优设计方法,利用雅普诺夫方程以及黎卡提方程设计得到巡航系统的反馈控制器;控制输入值计算模块,用于利用反馈控制器根据状态变量以及期望控制输入计算得到期望控制输入的值;以及,巡航控制模块,用于根据期望控制输入的值对车辆进行巡航控制;其中利用预设方程设计得到巡航系统的反馈控制器的过程包括:利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解预设方程进而得到反馈控制器。

第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的车辆巡航控制方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的车辆巡航控制方法。

本发明提供的一种车辆巡航控制方法、装置、电子设备及存储介质,能够无需利用巡航系统的动力学模型,只需根据巡航系统的输入和输出数据就能迭代求解控制输入的最优反馈控制增益,这样就能够避免由于动力学模型可能存在误差引起的系统控制偏差,保证巡航系统的控制的精确度。

附图说明

图1是本发明实施例提供的车辆巡航控制方法的一个流程示意图;

图2是本发明实施例提供的车辆巡航控制方法的另一个流程示意图;

图3是本发明实施例提供的车辆巡航控制方法的另一个流程示意图;

图4是本发明实施例提供的车辆巡航控制方法的另一个流程示意图

图5是本发明实施例提供的车辆巡航控制的一个结构示意图;

图6是本发明实施例提供的电子设备的一个结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

为了最大化避免道路交通事故的频繁发生减少由人为原因造成的人身及物质损失,驾驶安全系统应运而生。主动安全系统可以从根本上防止事故的发生。其中,与只操控本车行驶速度不变的传统定速巡航系统不同,装配有自适应巡航系统的车辆可以通过多种方式获得前车速度,随着前车速度的变化而调整本车速度,同时使两车安全间距随车速自适应改变,从而能够适应多变的交通场景与工况。

现有技术中的自适应巡航系统,需要根据自适应巡航系统的动力学模型计算控制输入。但是由于动力学模型存在误差,而这些会造成系统的控制偏差,因此导致自适应巡航系统的控制精度较差。

本发明提供了一种车辆巡航控制方法、装置、电子设备及存储介质,能够无需利用巡航系统的动力学模型,只需根据巡航系统的输入和输出数据就能迭代求解控制输入的最优反馈控制增益,这样就能够避免由于动力学模型可能存在误差引起的系统控制偏差,保证控制的精确度。

图1为本发明实施例提供的车辆巡航控制方法的一个流程示意图,该方法可以由本发明实施例提供的车辆巡航控制装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在电子设备中,电子设备比如可以是计算机、服务器等。以下实施例将以该装置集成在电子设备中为例进行说明。参考图1,该方法具体可以包括如下步骤:

步骤101,建立车辆的巡航系统的线性状态空间方程,线性状态空间方程包括状态变量以及期望控制输入,以建立上述状态变量以及期望控制输入的线性约束关系,进而根据上述线性约束关系下的状态变量以及期望控制输入,采用线性二次调节器最优设计方法设计得到巡航系统的反馈控制器。

可选的,上述状态变量包括上述车辆和上述车辆所跟随的前车之间的期望车间距与实际车间距之间的间距差变量、前车和上述车辆的速度差变量、以及前车相对于上述车辆的加速度变量。

可选的,上述建立车辆的巡航系统的线性状态空间方程的过程包括:根据预设的固定车头时距建立线性状态空间方程。

优选的,上述建立车辆的巡航系统的线性状态空间方程的过程包括:根据预设的固定车头时距建立上述线性状态空间方程。

具体的,车头时距代表着前后两辆车的前端通过同一地点的时间差,一般可使用前后车的车头间距除以后车速度来计算。现有技术中的巡航控制方法多采用固定车间距的策略。当车辆速度发生变化时,尤其当车辆速度较快时固定车间距会存在较大的安全隐患,可能会引发碰撞。因此本发明实施例采用固定车头时距的安全距离策略,能够摆脱固定车间距策略的困境,可实现自适应驾驶工况的变化调节安全距离。

具体的,上述建立车辆的巡航系统的线性状态空间方程的过程可以包括如下过程:

根据车辆的纵向动力学模型,设p

其中:

其中,τ

为了线性化上式中的加速度等式,将发动机输入定义为如下形式:

u

对于不同的车辆,跟踪期望加速度时的未知延时常数τ

期望车间距的计算方式为:

其中d

为了保持巡航队列的稳定性,通常h

d

其中,p

因此,可以求出实际间距与期望间距之间的间距误差δ

两车之间的速度差可以表示为:

Δv

结合式(4),(7),及(8),可以得到如下巡航系统的线性状态空间表达式:

其中,x

可以看出,因为跟踪期望加速度时的未知的延时常数τ

步骤102,根据线性状态空间方程,采用线性二次调节器最优设计方法,利用预设方程设计得到巡航系统的反馈控制器,这样就能够根据反馈控制器,以及实时获取的车辆的状态变量计算得到车辆的期望控制输入的值,进而进行车辆的巡航控制。

可选的,上述预设方程可以包括李雅普诺夫方程以及黎卡提方程,也可以包括其他适用于线性二次调节器最优设计方法设计得到反馈控制器的方程。

可选的,上述根据线性状态空间方程,采用线性二次调节器最优设计方法,利用预设方程设计得到巡航系统的反馈控制器的过程包括如图2所示的:

1021,根据线性状态空间方程,利用状态变量以及期望控制输入建立二次型目标函数。

具体的,针对上述巡航系统,对于时刻t的状态变量x

其中,u

1022,基于李雅普诺夫稳定性理论利用状态变量以及期望控制输入得到反馈控制器的控制输入函数,并利用线性状态空间方程的系数矩阵、二次型目标函数的权重矩阵以及控制输入函数的反馈增益矩阵建立李雅普诺夫方程。

具体的,上述反馈控制器的控制输入函数可以表示为:u

具体的,如果线性状态空间方程的系数矩阵A

(A

其中的,P

1023,利用线性状态空间方程的系数矩阵以及二次型目标函数的权重矩阵建立黎卡提方程。

具体的,式(13)中P

可以得到最优反馈增益的表示式:

1024,利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出,在线迭代求解黎卡提方程以及李雅普诺夫方程,得到最优反馈增益矩阵,使得根据最优反馈矩阵计算得到的二次型目标函数值最小。

具体的,等式(13)对于P

具体的,上述反馈增益矩阵为使前述巡航系统稳定的矩阵。

具体的,上述迭代求解的过程包括对K

现有技术进行迭代求解时,首先需要设定K

A-BK是赫尔维茨矩阵;P

我们可以看出,此方法是由Lyapunov李雅普诺夫方程迭代求解P

而本发明实施例利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出,在线迭代求解黎卡提方程以及李雅普诺夫方程,保证控制的精确度。

可选的,上述利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出,在线迭代求解黎卡提方程以及李雅普诺夫方程的过程包括:

根据线性状态空间方程,李雅普诺夫方程以及控制输入函数,将二次型目标函数取最小值并变形后得到二次型目标函数变形等式,二次型目标函数变形等式不包括线性状态空间方程的不确定系数矩阵;将二次型目标函数变形等式利用克罗内克积进行重新描述得到迭代等式;以及利用迭代等式对黎卡提方程以及李雅普诺夫方程进行迭代求解。

可选的,上述二次型目标函数的变形等式不包括线性状态空间方程的不确定系数矩阵A

具体的,可以通过如下方式获取上述迭代等式:

将巡航系统的线性状态空间表达式(9)重新写为:

其中,对于j=1,2,…,控制增益K

令P

并且,K

那么根据式(14),式(15),式(16),将式(11)变形为:

利用利用克罗内克积重新描述等式(17),将其转化为向量形式,可以得到:

定义如下进行数据处理的矩阵:

通过公式(18)-(23)的转化,公式(17)可以重新写为:

其中上角标j表示求解李雅普诺夫方程(15)的迭代次数,并且

需要注意的是,上式变换成立并且存在唯一解的充分条件为,矩阵

数据处理矩阵满足上式(26)后,可得到等式(24)的唯一解

1025,根据最优反馈增益矩阵得到反馈控制器。

具体的,可以根据最优反馈矩阵

步骤103,利用反馈控制器根据状态变量以及期望控制输入计算得到期望控制输入的值,这样能够得到精确的期望控制输入值,利于后续根据期望控制输入值对车辆进行巡航控制。

可选的,利用反馈控制器

具体的,上述车载感知设备可以包括车载雷达,例如激光雷达等感知设备。上述通信设备可是包括车-车通信(V2V)。

可选的,上述车辆和前车的运行状态包括,车辆和前车的当前位置,当前运行速度以及当前运行加速度。

步骤104,根据期望控制输入的值对车辆进行巡航控制,能够根据精确的期望控制输入值对车辆进行精确的控制。

具体的,上述期望控制输入的值可以是上述车辆的加速度的值。根据加速度的值,对车辆进行加速或者减速,就可以调节车辆与其所跟随的前车的距离,使得两车的距离符合固定车头时距,保证上述车辆在运行时的安全。

本发明实施例提供的车辆巡航控制方法,在巡航控制的过程中,能够无需利用巡航系统的动力学模型,只需根据巡航系统的输入和输出数据就能迭代求解控制输入的最优反馈控制增益,这样就能够避免由于动力学模型可能存在误差引起的系统控制偏差,保证控制的精确度。

下面进一步介绍本发明车辆巡航控制方法。

在本发明的优选具体实施例中,上述利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出,在线迭代求解黎卡提方程以及李雅普诺夫方程的过程包括的过程包括:采用固定点策略利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解雅普诺夫方程以及黎卡提方程。

具体的,如图3所示,上述采用固定点策略(Off-Policy)利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解雅普诺夫方程以及黎卡提方程,得到最优反馈增益矩阵的过程可以包括:

初始化步骤:找到K

在线数据采集步骤:从t=t

策略评价与改进步骤:根据式(27)

求解/>

迭代步骤:令k→k+1,重复策略评价与改进步骤,直到满足k≥1时|P

采用固定点策略可有效减小计算负担,获得全局最优解。

在本发明的可选具体实施例中,上述利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出,在线迭代求解黎卡提方程以及李雅普诺夫方程的过程包括的过程包括:采用连续性策略利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解雅普诺夫方程以及黎卡提方程。

具体的,如图4所示,上述采用连续性策略(On-policy)利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解雅普诺夫方程以及黎卡提方程的过程可以包括:

初始化步骤:找到K

在线数据采集步骤:从t=t

策略评价与改进步骤:根据式(27)

求解/>

停止步骤:如果k≥1时,满足|P

具体的,连续性学习策略中直接使用在线信息进行优化,学习得到的是局部最优;而固定点学习策略区分了目标策略和行为策略,学习得到的是全局最优。同时,连续性学习策略以较长的学习过程为代价,将计算负担分散到不同的迭代时间点上;固定点可以通过充分利用在线测量来实现更快的学习,而不是在单个迭代时间点上付出更大的努力去计算。因此,针对自适应巡航系统而言,固定点学习策略更加高效。

图5是本发明实施例提供的车辆巡航控制装置的一个结构图,该装置适用于执行本发明实施例提供的车辆巡航控制装置方法。如图5所示,该装置具体可以包括:

空间方程建立模块501,用于建立车辆的巡航系统的线性状态空间方程,线性状态空间方程包括状态变量以及期望控制输入,可以建立上述状态变量以及期望控制输入的线性约束关系,进而根据上述线性约束关系下的状态变量以及期望控制输入,采用线性二次调节器最优设计方法设计得到巡航系统的反馈控制器。

反馈控制器设计模块502,用于根据线性状态空间方程,采用线性二次调节器最优设计方法,利用雅普诺夫方程以及黎卡提方程设计得到巡航系统的反馈控制器。其中上述利用预设方程设计得到巡航系统的反馈控制器的过程包括:利用激励车辆的巡航系统得到的激励控制输入和激励状态变量输出在线迭代求解预设方程进而得到反馈控制器。这样能够便于根据所获取的这样就能够根据反馈控制器,以及实时获取的车辆的状态变量计算得到车辆的期望控制输入的值,进而进行车辆的巡航控制。

控制输入值计算模块503,用于利用反馈控制器根据状态变量以及期望控制输入计算得到期望控制输入的值,能够得到精确的期望控制输入值,利于后续根据期望控制输入值对车辆进行巡航控制。

巡航控制模块504,用于根据期望控制输入的值对车辆进行巡航控制,能够根据精确的期望控制输入值对车辆进行精确的控制。

本发明实施例提供的车辆巡航装置,在巡航控制的过程中,能够无需利用巡航系统的动力学模型,只需根据巡航系统的输入和输出数据就能迭代求解控制输入的最优反馈控制增益,这样就能够避免由于动力学模型可能存在误差引起的系统控制偏差,保证控制的精确度。

本领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述功能模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例提供的车辆巡航控制方法。

本发明实施例还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例提供的车辆巡航控制方法。

下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括梯度空间方程建立模块、反馈控制器设计模块、控制输入值计算模块以及巡航控制模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 车辆及其定速巡航控制方法、装置和计算机可读存储介质
  • 一种车辆行驶风险预警方法、装置、存储介质及电子设备
  • 一种车辆预警方法、装置、电子设备及存储介质
  • 一种车位确定方法、装置、电子设备、车辆及存储介质
  • 一种车辆定位方法、装置、电子设备及存储介质
  • 车辆巡航控制方法和装置、电子设备和存储介质
  • 车辆预测巡航控制方法、装置、电子设备和存储介质
技术分类

06120115930658