掌桥专利:专业的专利平台
掌桥专利
首页

具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法

文献发布时间:2024-04-18 20:01:30


具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法

技术领域

本发明涉及四旋翼轨迹跟踪控制领域,具体为一种具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法。

背景技术

四旋翼是一种多旋翼飞行器,具有垂直起降、悬停、转向灵活等特点,因此在军事、民用、科研等领域得到广泛应用,如救援、运输和狩猎,对其的研究引起了大量研究人员的强烈兴趣。然而,四旋翼是典型的非线性多输入多输出系统,容易受到外界干扰和参数不确定性的影响,因此在工程实践中,如何设计高性能的轨迹跟踪控制器以实现四旋翼的稳定飞行和精准控制是具有挑战性的问题。而在实际应用中,由于机载能源受限,高性能的轨迹跟踪控制设计需要同时兼顾控制成本与跟踪性能。

目前,四旋翼的轨迹跟踪控制面临以下两大问题:第一,以往的研究主要关注干扰条件下的四旋翼轨迹跟踪性能,而忽略了能源消耗问题,这对于实际机载资源有限的四旋翼系统来说是不可接受的;第二,传统的自适应动态规划大多采用执行-评价双网结构,存在神经网络权值更新计算负担过重的缺陷,且所采用的自适应学习方法普遍利用梯度下降法实现最优控制律的在线逼近,在干扰条件下难以确保神经权值收敛至真值和控制最优性。因此,如何在复杂环境干扰及机载资源受限的条件下开展四旋翼最优轨迹跟踪控制器设计是一个亟待解决并且具有挑战性的课题。

发明内容

本发明为了解决在复杂环境干扰及机载资源受限的条件下开展四旋翼最优轨迹跟踪控制器设计,并能够使四旋翼按照给定的轨迹参考命令实现高精度跟踪的问题,提供了一种具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法。

本发明是通过如下技术方案来实现的:一种具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法,包括如下步骤:

S1:根据四旋翼轨迹回路模型,借助低通滤波操作和代数计算,设计未知系统动力学估计器USDEs来准确估计和抵消四旋翼飞行器的不确定性,根据USDEs提供的估计结果,建立基于干扰估计的前馈控制律,实现对于时变轨迹信号的精确跟踪,具体如下:

首先,建立四旋翼轨迹回路模型如下:

其中:

其中,x=[p

式中,

其次,为处理四旋翼系统中的未知集总干扰,基于USDEs原理,对四旋翼可测状态和输入施加低通滤波操作:

式中x

其中,

式中u

S2:为赋能四旋翼在线学习以协调跟踪性能与控制消耗的能力,利用自适应动态规划ADP策略将S1中的轨迹跟踪转化为误差最优调节问题,通过构建包含误差与能量消耗的性能指标函数,依据最优控制原理,导出哈密顿-雅克比-贝尔曼(HJB)最优控制方程,设计包含权值误差隐式表达的自适应学习律,利用单一评价神经网络在线逼近HJB方程的解析解,构建可确保综合性能最优学习补偿控制律,具体如下:

首先,根据误差动力学方程构建最优性能指标函数与HJB方程:

式中V

其中V(e)为近似性能指标函数,

式中c>0是遗忘因子,设计包含权值误差隐式表达的自适应学习律如下:

式中Γ是一个正定对角矩阵,

S3:将最优学习补偿控制律与前馈控制律结合,计算四旋翼控制输入、总升力、滚转角和滚转角,驱动四旋翼运动学实现期望的质心运动:

与现有技术相比本发明具有以下有益效果:本发明所提供的一种具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法,与公开报道的抗扰控制相比,通过引入在线学习与评价机制,能够实现误差与消耗综合性能最优意义下的智能跟踪与持续优化,可弥补已有方法难协调精度与消耗的缺陷;所提策略是建立在轻量化浅层神经网络结构基础上的,因而计算开销小。此外,所提的在线学习机理具有明确的可解释性,与离线训练/在线应用的深度强化学习范式存在本质区别。本发明在优化了对于给定轨迹跟踪控制的前提下,极大的节约了机载资源;而且只涉及单一评价神经网络在线逼近HJB方程的解析解,相比于执行-评价双网结构,节省了大量的计算资源,减少了网络设计和训练的复杂性,提高了系统的效率和性能,且在干扰条件下神经权值能很快收敛至真值和控制最优性。

附图说明

图1为本发明的四旋翼模型示意图。

图2为本发明提出的四旋翼轨迹跟踪控制结构框图。

图3为本发明所提出的四旋翼轨迹跟踪示意图。

图4为本发明所提出USDE对集总干扰估计值与真实值对比示意图。

图5和图6为本发明所提单网结构与现有方法的位置跟踪误差及速度跟踪误差对比示意图。

图7和图8为本发明所提单网结构与现有方法的神经网络权值向量对比示意图。

图9为本发明所提单网结构与现有方法的性能指标函数演化对比图。

具体实施方式

以下结合具体实施例对本发明作进一步说明。

一种具有敏捷干扰辨识与在线学习能力的四旋翼轨迹跟踪控制方法,如图1所示,包括如下步骤:

S1:根据四旋翼轨迹回路模型,借助低通滤波操作和代数计算,设计未知系统动力学估计器USDEs来准确估计和抵消四旋翼飞行器的不确定性,根据USDEs提供的估计结果,建立基于干扰估计的前馈控制律,实现对于时变轨迹信号的精确跟踪,具体如下:

首先,建立四旋翼轨迹回路模型如下:

其中:

其中,x=[p

式中,

其次,为处理四旋翼系统中的未知集总干扰,基于USDEs原理,对四旋翼可测状态和输入施加低通滤波操作:

式中x

其中,

式中u

S2:为赋能四旋翼在线学习以协调跟踪性能与控制消耗的能力,利用自适应动态规划ADP策略将S1中的轨迹跟踪转化为误差最优调节问题,通过构建包含误差与能量消耗的性能指标函数,依据最优控制原理,导出哈密顿-雅克比-贝尔曼(HJB)最优控制方程,设计包含权值误差隐式表达的自适应学习律,利用单一评价神经网络在线逼近HJB方程的解析解,构建可确保综合性能最优学习补偿控制律,具体如下:

首先,根据误差动力学方程构建最优性能指标函数与HJB方程:

式中V

其中V(e)为近似性能指标函数,

式中c>0是遗忘因子,设计包含权值误差隐式表达的自适应学习律如下:

式中Γ是一个正定对角矩阵,

S3:将最优学习补偿控制律与前馈控制律结合,计算四旋翼控制输入、总升力、滚转角和滚转角,驱动四旋翼运动学实现期望的质心运动:

在以下的对比仿真中,都将以无优化结构和文献Vamvoudakis KG,LewisFL.Online actor-critic algorithm to solve the continuous-time infinitehorizon optimal control problem[J].Automatica,2010,46(5):878–888中所提的执行-评价双网结构作对比。

图3-9为仿真结果。图3为本发明所提出的四旋翼轨迹跟踪示意图,在初始位置跟踪误差非零的情况下,可以完美地跟踪所设定的轨迹参考命令。图4为本发明所提出USDE对集总干扰估计值与真实值对比示意图,从图中可以看出USDE可以很好的估计集总干扰,这为建立基于干扰估计的前馈控制律,实现对于时变轨迹信号的精确跟踪提供了重要的基础。图5与图6为本发明所提单网结构与双网结构的位置跟踪误差和速度跟踪误差对比示意图,从图中可以看出,单网结构和双网结构控都能确保位置和速度跟踪误差收敛到原点附近,但是单网结构的优化效果比双网结构的好。图7为本发明所提单网结构的最优学习补偿控制律与评价神经网络权值向量示意图。图8为双网结构的评价和执行神经网络权值向量示意图。从图7与图8的对比中可以看出单网结构的性能指标函数被最小化,最优学习补偿控制律可以收敛到零。更重要的是,从神经网络权值向量对比图可以看出单网结构的瞬态跟踪性能比双网结构更快,这是因为单网结构对权值误差隐式表达,并且所提出的自适应学习律可以使神经网络权值向量的估计值快速收敛,而双网结构的权值更新律采用的是梯度下降法或者最小二乘法,在存在不确定性的情况下,权值的收敛存在明显的滞后现象。图9为本发明所提单网结构与现有方法的性能指标函数演化对比图,可以看到本发明所提单网结构和现有方法相比在跟踪性能和控制消耗方面具有在线优化能力。

本发明要求保护的范围不限于以上具体实施方式,而且对于本领域技术人员而言,本发明可以有多种变形和更改,凡在本发明的构思与原则之内所作的任何修改、改进和等同替换都应包含在本发明的保护范围之内。

相关技术
  • 电缆导体绞合成型复合模具及电缆导体绞合成型工艺方法
  • 一种液冷线缆及使用其的电动车充电缆线冷却装置
  • 分层绝缘导体的交直流电阻比确定方法及分层绝缘导体电缆的载流量评估方法
  • 一种液冷电缆导体结构加工方法及液冷电缆导体结构
  • 一种管液冷冷却及螺旋导体结构的汽车用液冷充电电缆
技术分类

06120116558008