掌桥专利:专业的专利平台
掌桥专利
首页

弹簧-质量-阻尼关联系统的一种分散式智能评判跟踪控制方法

文献发布时间:2023-06-19 19:30:30


弹簧-质量-阻尼关联系统的一种分散式智能评判跟踪控制方法

技术领域

本发明针对于机械工业系统,研究了其中最常见的机械振动系统,即弹簧-质量-阻尼结构,并提出利用自适应动态规划的方法,解决一类具有外部扰动的连续时间非线性系统的分散跟踪控制问题。

背景技术

随着社会经济的快速发展,涌现出诸多实际工业应用,如电力系统、运输系统、机械系统等等大规模互联系统。其中,弹簧、阻尼器、质量块是组成机械系统的理想元件。由它们组成的弹簧-质量-阻尼系统是最常见的机械振动系统,在生活中具有相当广泛的用途,缓冲器就是其中的一种。缓冲装置是吸收和耗散过程产生能量的主要部件,其吸收耗散能量的能力大小直接关系到系统的安全与稳定。因此,对弹簧-质量-阻尼系统的研究有着非常深的现实意义。然而,当我们继续采用传统集中式的控制方案时,无法解决实际当中的大规模系统等问题,这便引出了分散控制这一控制理论概念。分散控制依赖于局部可用的子系统信息和相关性能指标。其研究对象为大规模系统,将这个大系统划分为一系列可控的子系统是十分有必要的。此外,最优控制方法也被广泛应用于分散控制当中。自适应动态规划(Adaptive dynamic programming,ADP)是一种涉及强化学习和神经网络思想的智能优化方法,且由于神经网络的近似特性,在许多研究当中它被视为一种非常有利的工具。

在存在噪声和不确定的环境当中,实际信号能跟踪上参考信号的状态显得尤为重要,这便引入了最优跟踪控制设计问题。尤其是近年来很多人利用基于值迭代的自适应评判方法来处理跟踪控制问题。此外,随着最优跟踪控制的逐步发展,许多发明将其应用于分散控制系统,即引入了分散跟踪控制(Decentralized tracking control,DTC)问题。其中,大量研究包括具有未知互连的自适应渐近DTC方案,以及将其与事件触发控制等问题相结合。此外,在自适应DTC的基础上,对不确定互联非线性系统的输入量化和时滞等问题的研究也十分有必要。此外,博弈论是研究理性决策者战略行为的相互作用理论。一般来说,它包括合作和非合作博弈两大类,即零和博弈和非零和博弈。值得一提的是,零和博弈问题在跟踪控制方面得到了广泛应用。

在已有的发明中,针对非线性互联系统,零和博弈微分控制与DTC设计相结合的问题研究甚少。因此,本发明提出了一种新的基于ADP的方法来解决一类具有零和博弈的弹簧-质量-阻尼机械系统的DTC问题。更重要的是,为了克服选择初始容许控制的困难,在权值更新过程当中添加了一个稳定项。最后,基于机械系统的弹簧-质量-阻尼结构,给出了相关实例仿真,该仿真结果验证了所提方法的可行性。

发明内容

在这部分当中,将介绍常见的机械振动系统,即弹簧-质量-阻尼器实例系统,其机械系统结构简图如图1所示:

其中,M

对于物体M

其中,

对于物体M

其中,

在此,定义子系统1当中的一个状态分量为物体1的位移,即x

其中,

综上所述,对于弹簧-质量-阻尼关联系统的研究,关键在于通过所设计的分散跟踪控制器,使得机械系统的实际状态跟踪上所期望的设定值。

基于以上对弹簧-质量-阻尼器系统的描述,分散跟踪控制器的设计步骤可划分为三部分。首先,对分散跟踪控制策略的介绍,包括跟踪问题描述以及相关问题转换;然后,采用最优控制方案,给出具体算法的实现过程;最后,详细说明了评判网络在线训练的过程。

本技术的创新之处主要体现在:利用新的ADP方法解决一类带有外部干扰的弹簧-质量-阻尼关联机械系统的跟踪期望轨迹问题。结合DTC相关原理,本发明利用了两个评判网络进行在线训练。整个训练过程中,在传统的权值更新基础上额外引入了一个稳定项,以保证系统的稳定性。整体来说,本发明采用了DTC算法和改进的在线训练方式,最终实现了弹簧-质量-阻尼器机械系统的状态对设定值的有效跟踪。

问题描述及其转化

本发明将弹簧-质量-阻尼器关联系统的跟踪问题进行转化,通过原系统与期望轨迹作差得到误差系统,对误差系统进行调节控制,使得原系统的跟踪误差为零,最终完成原系统的跟踪任务。

上述关联机械系统可以用如下连续时间非线性系统描述:

其中,i=1,2,x

其中,||Z

根据非线性系统(5),研究轨迹跟踪控制问题,其参考系统定义如下:

式中,r

其中,e

其中,y

此时,本发明成功将弹簧-质量-阻尼器关联系统的DTC问题转化为了误差系统的调节问题,并指出需要找到两个控制策略以确保系统(5)的状态最终能够跟踪上期望轨迹的状态。

基于最优控制方案的分散跟踪控制器设计

在这部分当中,详述了求解(Hamilton-Jacobi-Isaacs,HJI)方程的过程,即得到纳什均衡解,获得最优控制律和最坏干扰律。在此,针对弹簧-质量-阻尼器关联系统,采用最优控制方案并阐述了有关ATIS建立的最优DTC策略问题。

由相关研究可知互联系统的分散最优控制与孤立子系统的最优控制有关,因此可采用最优控制方法简化分散控制的设计过程。其中(9)的标称增广系统为:

其中,u

其中,J

其中,

为了获得具有外部扰动的ATIS最优控制方案,需要求得鞍点解

即通过最小最大化代价函数J

其中,

其中,

其中,

其中,

基于以上陈述,可知所得控制律对DTC策略的建立起着至关重要的作用。在带有扰动的情况下,可得出当k

基于自适应评判的ATIS最优控制器设计

由上可知,如果想要获得最优代价函数,求解出HJI方程是关键。然而,由于求解困难,提出了一种基于神经网络的ADP方法来近似最优解。在本节中,主要设计了具有外部干扰的ATIS的近似最优控制器,并给出了具体设计过程。

针对这个弹簧-质量-阻尼器关联系统,本发明采用了单一评判网络来近似代价函数

其中,对于第i个系统,

其中,

其中,

其中,

其中,

其中,

在自适应评判方法中,为了最小化近似误差e

其中,

由式(26)可近似获得

在此,

/>

其中,

本发明利用ADP算法,针对弹簧-质量-阻尼关联机械系统,提出了一类具有外部扰动的最优DTC策略。首先,以ATIS为研究对象,通过在控制策略上增加适当的反馈增益,设计了近似最优控制器。然后,本发明使用了两个评判网络用于求解HJI方程,从而获得ATIS的近似最优控制律和最坏扰动律。其中,在权值更新过程中添加了新的稳定性项,这避免了初始稳定性控制的选择。最后,通过一个仿真实例,即弹簧-质量-阻尼结构系统,证实了所提算法的可行性。

附图说明

图1弹簧-质量-阻尼器结构系统简图

图2ATIS控制结构图

图3子系统1权值收敛曲线

图4子系统2权值收敛曲线

图5子系统1跟踪控制输入曲线

图6子系统2跟踪控制输入曲线

图7子系统1跟踪扰动输入曲线

图8子系统2跟踪扰动输入曲线

图9子系统1跟踪误差轨迹曲线

图10子系统2跟踪误差轨迹曲线

具体实施方式

接下来,通过实验仿真来验证本发明所提算法的有效性。本发明给出了一个常见的机械振动系统,即弹簧-质量-阻尼器实例系统,并通过仿真实验以验证所提DTC算法的有效性。在本节中,为了使系统能够达到稳定,依据工程经验,选择扰动常数

由互联系统的分散最优控制与孤立子系统的最优控制有关,因此,我们以两者的孤立子系统为研究对象,且将这两个孤立子系统的跟踪误差定义为实际状态与期望轨迹之差。其中,两个子系统的跟踪误差表达式为e

基于在线ADP算法,为了解决两个孤立子系统的最优控制问题,构造以下两个评判网络来近似代价函数:

其中,

接下来,为了使系统达到最优跟踪的目的,经过相关理论推导可知,选择反馈增益k

技术分类

06120115929657