掌桥专利:专业的专利平台
掌桥专利
首页

基于自适应动态规划的多无人机固定时间最优控制方法

文献发布时间:2024-04-18 19:58:21


基于自适应动态规划的多无人机固定时间最优控制方法

技术领域

本申请涉及无人机技术领域,特别涉及基于自适应动态规划的多无人机固定时间最优控制方法。

背景技术

无人机是一种由动力驱动、机上无人驾驶、可控制、可执行特定任务,并重复使用的航空飞行器。目前,无人机研究成为一个热门课题。面对无人机这样一个复杂系统,如何对其有效控制实现任务目标同时减少控制成本是至关重要且有挑战性的研究内容。最优控制为此提供了一个正解。所谓最优控制是指在一定约束条件下,寻求使性能指标达到极值的控制函数。目前,实现最优控制的有效方法之一是自适应动态规划算法。它的核心思想是利用评判-执行网络近似哈密顿-雅可比-贝尔曼方程的解,从而得到最优控制表达式。

早先的最优控制率设计方法使控制器基于无人机系统信息连续更新。这极大地增加了计算成本和负担,浪费了系统的通信资源。从实际应用角度,如何实现控制目标同时减少资源消耗是至关重要的。事件触发控制机制的提出可以有效的解决这一问题。在事件触发机制中,一个事件触发器被设计用来产生控制器更新时间序列,使信息在必要时更新。这一机制有效地利用了系统资源,降低通信计算负担,扩大通信带宽。

然而,已存在的研究成果中最优控制的实现时间无法估计,或估计时间与无人机系统初始状态有关。当多架无人机初始启动,每架无人机的各个参数都由不同的初始条件,且进行重复试验理论成果在无人机系统的应用时,考虑不同的环境、操作等因素,导致多次实验中无人机系统的初始状态是各不相同的。那么,对无人机系统初始状态的任意变化,这导致多无人机系统实现最优控制的时间也随之变化,进而增加了最优控制时间估计的计算量。

发明内容

本申请提供了基于自适应动态规划的多无人机固定时间最优控制方法,可用于解决现有技术中无人机的最优控制时间难以估计的技术问题。

本申请提供基于自适应动态规划的多无人机固定时间最优控制方法,方法包括:

步骤1,构建无人机系统模型;

步骤2,基于多无人机动力数学模型,引入多无人机误差系统;

步骤3,基于设定的无人机误差系统,设计事件触发固定时间最优控制方案;

步骤4,基于设计的事件触发最优控制机制,引入自适应动态规划算法确定权重向量近似最优控制率。

可选的,构建无人机系统模型,包括:

第i(i=1,2,…,N)架无人机模型如下:

其中x

利用反馈线性化方法,无人机模型改写如下:

式中p

可选的,基于多无人机动力数学模型,引入多无人机误差系统,包括:

设第i架无人机与其他相邻无人机的误差函数为

相应地,Laplacian矩阵表示为

其中L

可选的,基于设定的无人机误差系统,设计事件触发固定时间最优控制方案,包括:

步骤31,构造与误差状态和控制率相关的性能指标函数;

基于所设误差函数e

式中

步骤32,定义Hamiltonian函数,建立最优控制率一般形式;

定义Hamiltonian函数为:

式中最优值函数

最优控制率

步骤33,在固定时间内实现最优控制的事件触发规则和事件触发最优控制率。

其中触发时刻序列由如下触发规则确定:

若多无人机误差状态满足上述不等式,则储存当前时刻状态信息,并更新计算最优控制率;否则保持上一触发时刻状态信息和最优控制率。

可选的,基于设计的事件触发最优控制机制,引入自适应动态规划算法确定权重向量近似最优控制率,包括:

步骤41,构建评判神经网络近似值函数;

基于Weierstrass高阶近似定理,确定评判神经网络近似值函数及其梯度,分别为:

式中

步骤42,估计值函数并提出相对应的最优控制率;

由于权重向量

基于值函数和事件触发最优控制率,Hamiltonian函数及估计为:

步骤43,定义权重误差向量,偏差函数和损失函数E

分别定义权重向量误差

其中

步骤44,确定权重向量更新规则和停息时间方法;

权重向量

基于固定时间稳定性理论,多无人机误差系统稳定的停息时间为:

其中

本申请的优势在于:

1、本技术基于最优控制理论,基于多无人机误差系统构造刻画控制成本最低的性能指标函数,得到最优控制率。

2、针对多无人机系统模型,提出事件触发规则,给出事件触发最优控制率,实现控制成本最小同时系统通信和计算资源消耗最少。

3、提出一种自适应动态规划在线学习方法,建立评判神经网络近似值函数,利用梯度下降法计算权重向量的更新规则,进而得到值函数的表达式,并给出停息时间的计算表达式,解决了对于多无人机系统任意的初始条件下,最优控制的时间估计计算问题。

附图说明

图1为本申请实施例提供的多架无人机间的通信连接网络图;

图2为本申请实施例提供的多架无人机的位置误差图;

图3为本申请实施例提供的多架无人机的速度误差图;

图4为本申请实施例提供的事件触发最优控制律图;

图5为本申请实施例提供的权重向量轨线图;

图6为本申请实施例提供的事件触发时刻图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

下面首先结合图1对本申请实施例进行介绍。

步骤1,构建无人机系统模型。

第i(i=1,2,...,N)架无人机模型如下:

其中x

利用反馈线性化方法,无人机模型改写如下:

式中p

步骤2,基于多无人机动力数学模型,引入多无人机误差系统。

设第i架无人机与其他相邻无人机的误差函数为

相应地,Laplacian矩阵表示为

其中L

步骤3,基于设定的无人机误差系统,设计事件触发固定时间最优控制方案。

为了寻求无人机最优控制率,使无人机由任意的初始状态随时间转移到最优状态,并使与无人机误差状态和控制率相关的性能指标达到最小,从而使多无人机系统实现最优控制所需要的控制成本最小。本步骤首先构造了与误差状态和控制率相关的性能指标函数,随后定义Hamiltonian函数得到最优控制率一般形式,最后为了进一步减少系统资源和降低控制成本,提出固定时间内实现最优控制的事件触发规则和事件触发最优控制率。

步骤31,构造与误差状态和控制率相关的性能指标函数;

基于所设误差函数e

式中

步骤32,定义Hamiltonian函数,建立最优控制率一般形式;

为了探寻多无人机误差系统实现稳定的最优控制律,定义Hamiltonian函数为:

式中最优值函数

最优控制率

步骤33,在固定时间内实现最优控制的事件触发规则和事件触发最优控制率。

在事件触发机制下,事件触发最优控制率表示为:

其中触发时刻序列由如下触发规则确定:

若多无人机误差状态满足上述不等式,则储存当前时刻状态信息,并更新计算最优控制率;否则保持上一触发时刻状态信息和最优控制率。

步骤4,基于设计的事件触发最优控制机制,引入自适应动态规划算法确定权重向量近似最优控制率。

由于无法准确求解值函数得到事件触发最优控制率,提出自适应动态规划在线算法近似最优控制律。具体步骤包括如下:

步骤41,构建评判神经网络近似值函数;

基于Weierstrass高阶近似定理,确定评判神经网络近似值函数及其梯度,分别为:

式中

步骤42,估计值函数并提出相对应的最优控制率;

由于权重向量

基于值函数和事件触发最优控制率,Hamiltonian函数及估计为:

步骤43,定义权重误差向量,偏差函数和损失函数E

分别定义权重向量误差

其中

步骤44,确定权重向量更新规则和停息时间方法;

权重向量

基于固定时间稳定性理论,多无人机误差系统稳定的停息时间为:

其中

下面结合具体实施例阐述本申请。

选取参数a

以上所述的本申请实施方式并不构成对本申请保护范围的限定。

相关技术
  • 基于协状态辅助的自适应动态规划最优控制方法及系统
  • 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法
技术分类

06120116479986