掌桥专利:专业的专利平台
掌桥专利
首页

一种无人艇预设时间节能运动控制方法

文献发布时间:2024-04-18 20:01:30


一种无人艇预设时间节能运动控制方法

技术领域

本发明涉及无人艇运动控制领域,具体来说涉及一种无人艇预设时间节能运动控制方法。

背景技术

随着海洋事业的不断发展,无人艇作为一种无人水面平台凭借其高机动性、强环境适应性、可拓展性、低成本等众多优势,受到越来越多的广泛关注,并在侦查勘探、环境监测、生态保护、搜索救援、生态保护等领域发挥着举足轻重的作用。

在无人艇航行的过程中,其运动跟踪速度一定程度上影响着任务的实施效率。为了保证无人艇系统的稳定性和时效性,有限时间控制方法能够将系统的状态引导至期望值,但其收敛时间取决于初始条件,不具备快速收敛的能力;固定时间控制方法的目的在于保证系统的快速收敛性,打破依赖与初始条件的禁锢,但往往存在着时间高估与依赖参数设计等缺陷,难以直接人为调节。为了进一步提升固定时间控制的性能,预设时间控制应运而生。

需要指出的是,在使用预设时间控制得以加快系统收敛速度的同时,难免对无人艇施加更多的能量以保证控制精度和收敛时间,从而一定程度上增加控制成本与能源消耗,故综合考虑多项性能指标的优化控制至关重要。目前,优化控制主要有动态规划,最速下降法等方法,但动态规划算法在时间与空间上复杂度高,存在维数爆炸问题;最速下降法易陷入局部极小值,且难以获得最优解。由此可知,如何实现无人艇预设时间最优控制成为一大难点。

综上所述,亟需一种能够在预设时间内以低能耗、高精度实现无人艇指定跟踪精度的最优运动控制系统,使其在保证跟踪误差预期时间收敛的前提下,系统更加具有自主性与节能性。

发明内容

为克服现有控制技术的不足,本发明实施例旨在提供无人艇预设时间节能运动控制方法,方法能够灵活选择所需跟踪时间和跟踪精度,减少对增广系统漂移动态的依赖,使得跟踪误差在预设时间里收敛到预定精度范围内,同时显著降低能源消耗,从而实现无人艇在预设时间内最优运动控制。

第一方面,本申请提供一种无人艇预设时间节能运动控制方法,所述方法包括以下步骤:

步骤1、根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹;

步骤2、构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统;

步骤3、根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数;

步骤4、采用积分强化学习算法近似求解最优控制策略;

步骤5、构造复合的自适应律更新actor-critic网络;

步骤6、构建Lyapunov函数以验证系统的稳定性。

可选的,根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹,包括:

步骤1-1、根据三自由度下无人艇在惯性坐标系和机体坐标系中的二维平面运动特点,运动学和动力学模型通过以下方法表示:

其中,η=[x,y,ψ]

步骤1-2、令f(η,v)=-M

其中,f(η,v)为无人艇中存在的未知非线性项。

步骤1-3、在跟踪任务需求的基础上,给定期望轨迹为如下形式:

其中,

可选的,构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统,包括:

步骤2-1、构造包括预设时间和精度的单调递减辅助函数:

其中,T>0表示预设时间,

步骤2-2、分别构造位姿、速度误差为η

步骤2-3、构造考虑预设时间和精度的误差转换函数ξ

步骤2-4、那么与辅助函数相关的增广系统表示为如下形式:

其中,

其中,

步骤2-5、将增广系统搭载于无人艇的控制器中,进行数据的获取与处理。

可选的,根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数,包括:

其中,r(X,τ)=X(ω)

可选的,采用积分强化学习算法近似求解最优控制策略,包括:

步骤4-1、HJB方程表示为如下形式:

其中,

步骤4-2、定义最优性能指标函数:

若控制策略τ是连续的,当τ能够使得无人艇系统稳定且收敛于集合Ω,同时满足τ(0)=0和V(X)有限,则称控制策略τ可容许,即τ∈φ(Ω)。

利用平稳性条件得最优控制输入为:

步骤4-3、使用神经网络逼近性能指标函数V(X)和梯度▽V

其中,W

其中,

步骤4-4、定义贝尔曼方程误差为:

步骤4-5、使用第二个神经网络以保证系统的稳定性,即τ(X)改写为:

可选的,为自适应地找到最优性能函数与控制策略,设计critic和actor权值更新律,包括:

其中,κ

可选的,构建Lyapunov函数如下:

其中,

发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果。与现有技术相比,本发明具有以下优点:

1)本发明中无人艇预设时间节能运动控制系统,将预设时间控制理论编码到最优控制框架中,该系统有助于无人艇在预设时间范围内跟踪所需期望轨迹,为用户提供指定所需时间和跟踪精度的灵活选择。

2)本发明的方法中,考虑到直接求解HJB方程的固有困难,使用改进积分强化学习算法,并充分考虑控制输入,最大限度地提高能源效率。

3)本发明中结合设计的预设时间节能运动控制,提出一种在线控制算法,该算法可确认最优成本的近似值,并在保证无人艇稳定性的同时设计出最优控制策略,具有较高的工程实用价值。

附图说明

图1为本发明的三自由度无人艇结构示意图;

图2为本发明的无人艇实验结构框架图;

图3为本发明实施例的无人艇预设时间节能运动控制算法示意图;

图4为本发明实施例的实验场地示意图;

图5为本发明实施例的无人艇二维空间轨迹曲线示意图;

图6为本发明实施例的无人艇航向曲线示意图;

图7为本发明实施例的无人艇跟踪误差曲线示意图;

图8为本发明实施例的无人艇成本函数示意图。

图9为本发明仿真的无人艇位置与航向角曲线示意图;

图10为本发明仿真的无人艇位置与航向角误差曲线示意图;

图11为本发明仿真的无人艇速度与角速度误差曲线示意图;

图12为本发明仿真的无人艇控制输入曲线示意图。

具体实施方式

为使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

本实施系统包括以下步骤:

步骤1、根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹;

步骤2、构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统;

步骤3、根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数;

步骤4、采用积分强化学习算法近似求解最优控制策略;

步骤5、构造复合的自适应律更新actor-critic网络;

步骤6、构建Lyapunov函数以验证系统的稳定性。

接下来,围绕团队自研的无人艇系统,对上述实施例的实现过程进行详尽的说明。在图4所示的湖面场地对该系统进行验证,设置无人艇的初始位置和速度状态为[η(0)

如图1所示,为三自由度下无人艇的结构图,且无人艇质量惯性矩阵以及阻尼矩阵的具体参数如下:

其中,M=diag{m

结合图2所示的实验结构框架对图3所示的无人艇预设时间节能运动控制算法进行实例分析,所述系统包括以下步骤:

所述步骤1中,根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹,包括:

步骤1-1、将无人艇轨迹误差增广模块(1)搭载于树莓派上,其与无人艇运动控制模块(2)、无人艇数据采集模块(3)、能源模块(4)有线相连接,通过数据采集模块获取无人艇实时姿态与位置信息,从而获得无人艇数学模型(11)与轨迹误差(12),进一步的将上述两个模块通过编程语言运行在上述嵌入式设备中。其具体原理如下:

其中,η=[x,y,ψ]

步骤1-2、令f(η,v)=-M

其中,f(η,v)为无人艇中存在的未知非线性项。

步骤1-3、在树莓派等嵌入式设备上运行无人艇期望轨迹与姿态生成模块(12),数据采集模块(4)通过串口与树莓派等嵌入式设备进行实时位姿信息数据传输,完成期望轨迹的测算与姿态的生成:

其中,

进一步地,所述步骤2中构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统,包括:

步骤2-1、构造单调递减的辅助函数,构建结合参数辨识模块(11)构造一个新型的与预设时间和精度相关的辅助函数:

其中,T>0表示预设时间,

步骤2-2、分别构造位姿、速度误差为η

步骤2-3、构造考虑预设时间和精度的误差转换函数ξ

步骤2-4、根据参数辨识模块(11)与期望轨迹和姿态生成模块(12)获取的数据信息,构建无人艇轨迹跟踪增广系统:

其中,

其中,

具体而言,数据采集模块(3)为轨迹跟踪增广系统提供实时的无人艇位姿及速度。无人艇运动控制模块(2)为轨迹跟踪增广系统提供实时的操纵控制量。

步骤2-5、将增广系统搭载于无人艇的控制器中,进行数据的获取与处理。

进一步地,所述步骤3中根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数,包括:

其中,r(X,τ)=X(ω)

进一步地,无人艇运动控制模块(2)与无人艇轨迹误差增广模块(1)、无人艇数据采集模块(3)、无人艇动力模块(4)、无人艇能源模块(5)相连接,通过下述步骤完成构建,其中神经网络更新器(21)运行在树莓派上,以及无人艇运动控制器(22)运行在stm32控制板中,保证控制系统的实时性。

所述系统中采用积分强化学习算法近似求解最优控制策略,包括:

步骤4-1、HJB方程表示为如下形式:

其中,

步骤4-2、定义最优性能指标函数:

若控制策略τ是连续的,当τ能够使得无人艇系统稳定且收敛于集合Ω,同时满足τ(0)=0和V(X)有限,则称控制策略τ可容许,即τ∈φ(Ω)。

利用平稳性条件得最优控制输入为:

步骤4-3、在树莓派等嵌入式设备上,运行神经网络更新模块(21)与期望轨迹和姿态生成模块(12)。期望轨迹和姿态生成模块(12)为神经网络更新模块(21)提供期望的无人艇位姿和速度。数据采集模块(3)通过串口通信方式给神经网络更新模块(21)传输无人艇实时的位姿和速度,从而下面可将性能指标函数V(X)和梯度▽V

其中,W

其中,

步骤4-4、定义贝尔曼方程误差为:

步骤4-5、使用第二个神经网络以保证系统的稳定性,即τ(X)改写为:

进一步地,所述步骤5中为自适应地找到最优性能函数与控制策略,设计critic和actor权值更新律,包括:

其中,κ

进一步地,构建Lyapunov函数如下:

其中,

在后续实验验证本发明方法有效性时,本申请还提供构建新型的无人艇节能运动控制系统平台,包括:

无人艇轨迹误差增广模块(1);无人艇运动控制模块(2);无人艇数据采集模块(3);无人艇动力模块(4);无人艇能源模块(5);

无人艇轨迹误差增广模块包括:参数辨识模块(11)、期望轨迹与姿态生成模块(12);

无人艇运动控制模块包括:无人艇神经网络更新模块(21)、无人艇运动控制器(22);

无人艇数据采集模块包括:卫星定位模块(31)、惯性测量元件(32)、功率计(33)。

无人艇轨迹误差增广模块(1)用于执行步骤2,通过接收数据采集模块中传感器的数据,并根据算法求取运动控制模块所需要的控制器参数,生成包含无人艇各类状态信息的增广系统;构造无人艇的运动学以及动力学模型;制定期望轨迹并获取控制系统的期望输入;

无人艇运动控制模块(2)用于执行步骤3、4、5、6,完成对无人艇的实时轨迹控制,通过接收轨迹误差增广模块的控制器参数,与能源模块的能耗情况,完成对无人艇动力模块的控制输入,以及神经网络更新器的更新迭代;

无人艇数据采集模块(3)用于执行步骤1和步骤2,获取无人艇控制必要的传感器数据;传感器数据包括无人艇位置、姿态信息、速度信息以及能源等指标信息;

无人艇动力模块(4)用于执行步骤1,提供无人艇运动控制的动力输入,完成无人艇的实时轨迹控制;

无人艇能源模块(5)用于执行步骤3,完成对能源消耗的动态估计,与性能指标函数的确定;

无人艇数据采集模块(3)与无人艇轨迹误差增广模块(1)、无人艇运动控制模块(2)相连接;通过卫星定位模块(31)获得无人艇实时航行的速度信息(u,v);采用惯性测量模块(32)获取无人艇实时变化的航向角数据ψ,以及航向角速度r的实时变化数据;通过功率计(33)获取能源消耗与剩余情况。

无人艇动力模块(4)与无人艇运动控制模块相连接,包括电机与电调模块,为控制系统提供动力输入;

无人艇能源模块(5)与无人艇轨迹误差增广模块(1)、无人艇运动控制模块(2)、无人艇动力模块(4)相连接,主要为控制系统提供动力能源。

图5至图7给出了无人艇运动控制的实验结果。通过对运行曲线进行分析,可以看出,无人艇在所设计的最优运动控制策略下,实现了在预设时间内以规定精度完成轨迹跟踪的节能运动控制。图8为无人艇成本函数变化曲线图,可以看出,该方法一定程度上节约了资源的消耗。

最后,给出无人艇在模拟环境下的仿真结果。以CyberShipII无人艇模型为例,设置科里奥利和向心力矩阵C(v)中的元素为c

图9至图12给出了模拟环境下无人艇运动控制的仿真结果。根据图9-11可以看出,无人艇的位姿可以在给定时间内高精度的跟踪期望轨迹,且跟踪误差、转换后的跟踪误差均能够快速收敛与镇定。图12给出控制输出的变化曲线,可以清晰看出,无人艇的控制力与力矩能够快速作用以实现轨迹跟踪并逐渐调整实现节能控制。

本方法中无人艇预设时间节能运动控制作为一种新型的控制策略,跟踪效果显著,大大减少了能源和时间的消耗、提高了其执行效率、跟踪精度,能够实现无人艇的自主智能控制。

本申请中,通过构造包含预设时间和跟踪精度的辅助函数与tan型误差转换函数,从而定义囊括坐标变换函数、误差动态和期望动态的增广系统,为后续的研究奠定基础。

本申请中,无人艇系统采用积分强化学习在线算法,在保证稳定性的同时能够实时决策出最优控制策略,将预设时间控制编码到最优控制框架中,实现无人艇在预设时间内以规定精度跟踪自主跟随期望轨迹作业,建立了既具有实际意义又能够引导实现轨迹跟踪的控制框架,具有较高的工程实用价值。

本申请实施例提供的一种无人艇预设时间节能运动控制系统未详述的内容,可参照上述发明内容及实施例中提供的一种无人艇预设时间节能运动控制方法,在此不再赘述。

以上所述仅为本发明的较佳实施例而已,并不用以限定本发明,对于本技术领域的技术人员来说,在不脱离本发明原理的前提下所作的任何修改、改进和等同替换等,均包含在本发明的保护范围内。

技术分类

06120116556647