掌桥专利:专业的专利平台
掌桥专利
首页

基于贝叶斯优化的运载体控制器自动优化方法、介质及设备

文献发布时间:2023-06-19 18:46:07


基于贝叶斯优化的运载体控制器自动优化方法、介质及设备

技术领域

本发明属于智能汽车自动驾驶技术领域,具体涉及到一种基于贝叶斯优化的运载体自动驾驶控制器自动优化方法、介质及设备。

背景技术

近年来,随着运载体车辆智能化水平的迅速提升,自动驾驶相关技术得到了蓬勃发展,部署有控制算法的控制器是自动驾驶车辆系统的必备模块之一,其可以有效的控制运载体车辆追踪参考轨迹向前行驶,通常,控制算法的设计需要对车辆动力学进行建模,并根据所建模型进行构建,而在此过程中,需要对模型进行线性化和离散化,故而所设计的控制算法需要对其多项参数进行调节标定,以使得控制算法性能达到要求。以往,控制算法参数的调节都通过手动调节、或者网格搜索等方法进行,其效率低下,且参数调节空间有限,无法趋向最优控制性能。

为优化控制算法性能并提升该优化过程的效率,学者们进行了一些相关研究和探索。A.Marco等人发表在IEEE International Conference on Robotics and Automation,2016的论文"Automatic LQR Tuning Based on Gaussian Process GlobalOptimization",提出了一种基于高斯过程贝叶斯优化的LQR控制器自动寻优方法,其贝叶斯优化使用了熵搜索作为代理函数,可以自动化、高效迅捷的对LQR控制器进行最优参数组的搜索;Su,Jie等人发表在IEEE Transactions on Vehicular Technology,2018的论文"Autonomous vehicle control through the dynamics and controller learning",对高斯过程贝叶斯优化进行LQR控制器性能寻优进行了更进一步的考虑,针对系统运行的时变特性,设计时变的下置信界函数作为贝叶斯优化的代理函数,对于运载体的时变特性场景具有更好的适用性;Riboni,A.等人发表在nature,2022的科学汇报"Bayesianoptimization and deep learning for steering wheel angle prediction",针对自动驾驶车辆的转向控制,使用LSTM为骨干网络设计控制器,并使用贝叶斯优化作为控制器参数进行自动优化搜索。

上述研究成果可以一定程度上提升控制器性能优化效率,但这些方法仍然存在一定的局限性,比如:上述研究成果皆考虑单过程序列化决策实例,故而使用解析的代理函数进行贝叶斯优化流程的设计,无法做到并行化。如上文所述的Riboni,A.等人设计的深度学习类控制算法,其待调参数众多,会使得贝叶斯优化的参数组空间维度非常高;另外,部分控制参数的取值空间具有致密连续性特征,使得待搜索参数组的数量急剧增加,这为优化搜索任务的效率带来进一步挑战。

发明内容

针对上述问题,本发明的主要目的在于设计一种基于贝叶斯优化的运载体自动驾驶控制器自动优化方法、介质及设备,考虑使用多批次并行化的期望改善函数作为贝叶斯优化的代理函数,为自动驾驶控制算法的优化搜索带来更优解决方案。

为了实现上述目的本发明采用如下技术方案:

一种基于贝叶斯优化的自动驾驶运载体控制器优化方法,包括如下步骤:

S1:初始化采样数据集

S2:对数据集

建立贝叶斯优化代理函数,循环以下步骤:

S21:通过代理模型回归得到后验分布均值和方差;

S22:通过贝叶斯优化代理函数,得到待评估参数组;

S23:将得到的待评估参数组在运载车体车辆上进行验证,并将该参数组的数据扩增至采样数据集

S3:待评估参数组达到终止条件,则退出S2的循环步骤,结束并得到控制器所求指标参数。

作为本发明进一步的描述,S1:对待评估的控制器性能指标进行建模,得到评价函数;根据指标中待优化参数集合的可达域,选择n个可行组合作为待评估参数组集,通过待评估参数在运载体车辆上进行控制器性能效果实验,并收集效果指标数据集

S2:将S1待评估参数组集X={θ

S21:通过代理模型回归得到效果指标数据集

S22:将S21所得后验分布的均值函数和方差函数代入贝叶斯优化代理函数,得到代理函数预测的推荐解θ

S23:将S22得到的推荐解所表征的参数组,在运载体车辆上进行控制器性能效果实验,收集效果指标

S3:当控制器效果指标与理想指标之差小于设定阈值,或者后验分布均值与设定阈值之差小于设定阈值时,退出循环步骤,所得推荐解即为控制器所求指标参数。

作为本发明进一步的描述,S1所述运载体车辆系统控制性能指标的评价函数建模方式为:

其中,

作为本发明进一步的描述,S1中所述待优化参数集合的可达域空间为混合空间,混合空间包括离散空间和连续空间,待优化的部分参数集隶属于离散空间,部分参数集隶属于连续空间。

作为本发明进一步的描述,S2所述代理模型为高斯过程,所述高斯过程由均值函数μ(X)和协方差函数K(X,X)完备描述;

所述均值函数μ(X)为:

其中,Ψ(X)表示p阶多项式函数,α

所述协方差函数K(X,X)为:

其中,核函数k(θ

其中,对角阵

所述代理模型回归的目标函数为边缘似然分布的对数,如下所示:

其中,

作为本发明进一步的描述,所述贝叶斯优化的代理函数建模为:

其中,AC(X)表示代理函数,N表示蒙特卡洛采样点数,i表示当前采样点序号,q表示并行化总批次数,j表示当前批次;X={X

作为本发明进一步的描述,所述后验均值函数

其中,I表示单位阵,X

所述后验分布协方差

作为本发明进一步的描述,所述的贝叶斯代理函数还包括极大值运算,其取决于对目标函数的需求是极小化或者是极大化;

极小化需求导向具有极小化运算的代理函数,极大化需求导向具有极大化运算的代理函数。

一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的基于贝叶斯优化的自动驾驶运载体控制器优化方法。

一种基于贝叶斯优化的自动驾驶运载体控制器优化设备,包括用于存储计算机程序的存储器和处理器,所述的处理器执行计算机程序时,实现所述的基于贝叶斯优化的自动驾驶运载体控制器优化方法。

相对于现有技术,本发明的技术效果为:

本发明提供了一种基于贝叶斯优化的运载体自动驾驶控制器自动优化方法、介质及设备,使用贝叶斯优化对运载体自动驾驶控制器的性能进行自动优化,取代了原始冗繁、效率低下的手动调参以及网格调参,具有明确的现实意义,并且使用了批次并行化技术对贝叶斯优化的解析式代理函数进行了改进提升,提高运载器自动驾驶控制器性能优化的效率,具有明显的技术先进性和实用性。

附图说明

图1为基于贝叶斯优化的自动驾驶运载体控制器优方法流程图;

图2为贝叶斯优化运行过程中候选参数组相应的控制器性能变化示意图;

图3为使用贝叶斯优化所得参数组设计的LQR控制器轨迹追踪效果示意图。

具体实施方式

下面结合附图对本发明进行详细描述:

一种基于贝叶斯优化的自动驾驶运载体控制器优化方法,参考图1-3所示,包括如下步骤:

S1:初始化采样数据集

S2:对数据集

建立贝叶斯优化代理函数,循环以下步骤:

S21:通过代理模型回归得到后验分布均值和方差;

S22:通过贝叶斯优化代理函数,得到待评估参数组;

S23:将得到的待评估参数组在运载车体车辆上进行验证,并将该参数组的数据扩增至采样数据集

S3:待评估参数组达到终止条件,则退出S2的循环步骤,结束并得到控制器所求指标参数。

具体的,本实施例针对上述步骤进行具体说明:

S1:对待评估的控制器性能指标进行建模,得到评价函数;根据指标中待优化参数集合的可达域,选择n个可行组合作为待评估参数组集,在待评估参数在运载体车辆上进行控制器性能效果实验,并收集效果指标数据集

所述的运载体车辆系统控制性能指标的评价函数建模方式为:

其中,

S2:将S1待评估参数组集X={θ

其中,θ

本实施例,所述的代理模型优选的设置为高斯过程,但是不仅限于高斯过程,所述高斯过程由均值函数μ(X)和协方差函数K(X,X)完备描述;

所述均值函数μ(X)为:

其中,Ψ(X)表示p阶多项式函数,α

所述协方差函数K(X,X)为:

其中,核函数k(θ

其中,对角阵

所述高斯过程回归的目标函数为边缘似然分布的对数,如下所示:

其中,

进一步的,建立贝叶斯优化代理函数,本实施例作为优选的,所述贝叶斯优化的代理函数建模为:

其中,AC(X)表示代理函数,N表示蒙特卡洛采样点数,i表示当前采样点序号,q表示并行化总批次数,j表示当前批次;X={X

在贝叶斯优化代理函数确定后,针对待评估参数组集效果实验循环以下步骤:

S21:通过代理模型回归得到效果指标数据集

所述后验均值函数函数

其中,I表示单位阵,X

所述后验分布协方差

S22:将S21所得后验分布的均值函数和方差函数代入贝叶斯优化代理函数,得到代理函数预测的推荐解θ

S23:将S22得到的推荐解所表征的参数组,在运载体车辆上进行控制器性能效果实验,收集效果指标

S3:当控制器效果指标与理想指标之差小于设定阈值,或者后验分布均值与设定阈值之差小于设定阈值时,退出S2的循环步骤,所得推荐解即为控制器所求指标参数;

需要说明的是,本实施例对于自动驾驶控制器的类型没有限制,可以用于各种参数优化需求的自动驾驶控制器。

在一个实施例中,所述的运载体车辆通常使用单车模型(bicycle model)建模,并线性化、离散化,得到如下形式:

z

其中

矩阵A和B分别如下所示:

其中dt表示离散时间步,v表示车辆速度。

控制性能目标函数建模如下:

其中

其中

所述LQR控制器的表达形式如下所示,

u

其中F

其中P

使用该LQR控制器进行轨迹追踪控制。所述轨迹追踪的参考轨迹,使用如下三次样条插值函数得出:

其中pos表示参考位置,h

为贝叶斯优化的代理模型构建初始数据集

进入贝叶斯优化主循环。

第一步,使用高斯过程回归得到数据集

所述核函数k(θ

其中,对角阵

所述超参数,均通过极小化边缘似然的对数得出:

其中

所述后验均值函数

其中,I表示单位阵,X

所述后验分布协方差

第二步,使用如下代理函数得到贝叶斯优化推荐的下一个待评估点:

其中,AC(X)表示代理函数,N表示蒙特卡洛采样点数,i表示当前采样点序号,q表示并行化总批次数,j表示当前批次。X={X

第三步,将θ

当控制器性能指标与理想指标之差或者代理模型后验分布均值与设定阈值之差小于设定阈值,退出贝叶斯优化主循环,得到所求解。

在计算机介质及设备上对以上算法进行实施部署。在本实施例中,所述计算机介质为笔记本电脑,其硬件配置为CPUi5-10210U,16G内存,软件配置为windows 10操作系统,部署python 3.9.6,pytorch 1.12.1,gpytorch 1.9.0,botorch 0.7.2,numpy 1.23.3,matplotlib 3.6.0。

程序运行参数配置为:车辆轮径0.5m,最大转弯45°。动力学模型离散采样时间为0.1s。高斯过程模型为单任务高斯过程,初始化样本设置为16个。贝叶斯优化共尝试三次,每次都尝试搜索16个回合,代理函数qEI的q设置为1,蒙特卡洛采样样本数量设置为64,搜索边界均设置为[0.0001,100]。

如图2所示,为运行本实施例的方法(即上述S1~S3所述的基于贝叶斯优化的运载体自动驾驶控制算法自动优化方法)所得到的自动化搜索最优参数组的过程中,目标函数(即LQR控制器轨迹追踪的位置误差)变化示意图,结果表明,运用本实施例的方法,能够有效的自动寻优控制器的参数组。

如图3所示,为运行本实施例的方法(即上述S1~S3所述的基于贝叶斯优化的运载体自动驾驶控制算法自动优化方法)得到的参数所设计的LQR控制器的轨迹追踪控制效果。

另外,在其他实施例中,本发明还可以提供一种基于贝叶斯优化的自动驾驶运载体控制器优化设备,其包括存储器和处理器;

所述存储器,用于存储计算机程序;

所述处理器,用于当执行所述计算机程序时,实现如上述S1~S3所述的基于贝叶斯优化的运载体自动驾驶控制器自动优化方法。

另外,在其他实施例中,本发明还可以提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,能实现如上述S1~S3所述的基于贝叶斯优化的运载体自动驾驶控制器自动优化方法。

需要说明的是,上述的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、神经网络处理器(Neural Processor Unit,NPU)等;还可以是数字信号处理器(DigitalSignal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。当然,该装置中还应当具有实现程序运行的必要组件,例如电源、通信总线等等。

以上实施例仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其他修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

技术分类

06120115686528