一种基于策略切换的航天器护卫问题求解方法
文献发布时间:2023-06-19 19:27:02
技术领域
本发明设计属于航天技术领域,具体涉及一种基于策略切换的航天器护卫问题求解方法。
背景技术
航天器轨道追逃是一种具有广泛应用背景的数学问题,经典轨道追逃问题中的参与者普遍具有相同的目标,即对距离的争夺。然而,一些在轨航天器由于其价值高燃料需要用于在轨工作,因此在受到进攻星威胁时不能自主躲避,需要释放微纳卫星作为防御星进行协同对抗,而自身作为主星主要负责信息的传输。防御星与进攻星之间对于主星的争夺就称为航天器护卫问题,进攻星的目的是竭尽一切努力靠近主星,同时又要保证自身不被防御星拦截破坏;防御星的目的是尽可能在进攻星靠近主星前将其拦截摧毁。
目前对航天器护卫问题的建模与求解大部分使用微分对策方法,但由于其属于博弈类型中的非零和博弈,进攻星和防御星的性能指标并不相同,因此对其最优控制策略的求解往往非常复杂。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于策略切换的航天器护卫问题求解方法,以解决现有技术中对航天器护卫问题的建模与求解中使用微分对策方法,其最优控制策略的求解非常复杂的问题。
为了达到上述目的,本发明采用以下技术方案予以实现:
一种基于策略切换的航天器护卫问题求解方法,包括:
获取主星、进攻星和防御星的航天器护卫问题参数;
根据主星、进攻星和防御星的航天器护卫问题参数建立航天器护卫问题模型;
将获取主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型得到进攻星和防御星在两个阶段的控制策略;
通过实时确定进攻星和防御星所在阶段切换对应的控制策略。
优选地,所述问题参数包括:参考卫星轨道半长轴、进攻星初始状态、防御星初始状态、主星位置、进攻星的加速度大小上限、防御星的加速度大小上限以及进攻星和防御星的安全距离。
优选地,所述根据主星、进攻星和防御星的航天器护卫问题参数建立航天器护卫问题模型具体如下:
当
当
其中,a为进攻星的下标;d为防御星的下标;m为主星的下标;X
优选地,所述对称半正定矩阵
Q=k
式中:
k
A具体形式通过轨道动力学里的CW方程构建,即:
/>
其中,n为参考卫星的轨道角速度;μ为地球引力场系数,a
优选地,所述将获取主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型得到进攻星和防御星在两个阶段的控制策略,具体如下:
S1:主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型;
S2:当
当
S3:采用动态规划法求解S2中阶段α的双边优化问题,得到进攻星和防御星在阶段α的控制策略;
S4:确定进攻星和防御星在阶段β的控制策略。
优选地,S3中,具体步骤为:
S301,定义哈密尔顿函数为:
S302,列写双边优化问题的最优性条件:
S303,将哈密尔顿函数代入上述最优性条件中得双方最优控制策略的形式解:
S304,将双方的最优控制策略解代入哈密尔顿函数中得到哈密尔顿-雅克比方程:
S305,为了得到反馈控制策略,假设最优条件下协态变量有如下形式:
S306,将上述等式代入形式解中得到攻防双方的最优反馈控制策略:
S307,将哈密尔顿-雅克比方程相应进行改写,如下:
整理得:
S308,使用李雅普诺夫迭代法对未知矩阵P进行求解,也即求解上述改写并整理后的哈密尔顿-雅克比方程或称作黎卡提方程,迭代算法如下:
初值选取为:
得到矩阵
S309,最终得到进攻星和防御星在阶段α的控制策略如下:
其中,X为防御星与进攻星的相对状态矢量,λ为构造哈密尔顿函数的协态变量;u
优选地,S4中具体步骤如下:
S401,由于防御星在阶段α和阶段β中的性能指标相同,故设计其在阶段α和阶段β的控制策略相同,即也采用如下的反馈控制律:
阶段β
S402,设计进攻星在阶段β的控制策略,其控制律如下:
u
其中,K
优选地,实时确定进攻星和防御星所在阶段通过进攻星和防御星实时的
当
当
其中,a为进攻星的下标;d为防御星的下标;m为主星的下标;x为相对坐标系下轨道径向的位置分量;y为相对坐标系下飞行方向的位置分量;z为相对坐标系下轨道角动量方向的位置分量;d
与现有技术相比,本发明具有以下有益效果:
本发明提供了一种基于策略切换的航天器护卫问题建模与求解方法,将复杂的性能指标根据距离在时间尺度上进行了分解,根据进攻星与防御星之间的距离与安全距离的大小分为两个阶段。在某一时刻进攻星仅处于一个阶段,仅考虑追逐主星或者躲避防御星这两个目标的其中之一。通过上述方法将护卫问题转化为了追逃博弈问题与轨迹规划问题,使得求解过程大大简化,并在仿真中取得了良好的效果。该模型和方法的应用,可为采用主从星协同的在轨航天器提供有效的防御威胁解决方案。
附图说明
图1是本发明所适用的航天器护卫问题博弈场景;
图2是本发明中航天器护卫问题具体实施流程图;
图3是本发明的仿真轨迹图;
图4本发明的仿真加速度变化图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
一种基于策略切换的航天器护卫问题求解方法,包括:
获取主星、进攻星和防御星的航天器护卫问题参数;
所述问题参数包括:参考卫星轨道半长轴、进攻星初始状态、防御星初始状态、主星位置、进攻星的加速度大小上限、防御星的加速度大小上限以及进攻星和防御星的安全距离。
根据主星、进攻星和防御星的航天器护卫问题参数建立航天器护卫问题模型;
具体如下:
当
当
其中,a为进攻星的下标;d为防御星的下标;m为主星的下标;X
所述对称半正定矩阵
Q=k
式中:
k
A具体形式通过轨道动力学里的CW方程构建,即:
/>
其中,n为参考卫星的轨道角速度;μ为地球引力场系数,a
将获取主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型得到进攻星和防御星在两个阶段的控制策略;
S1:主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型;
S2:当
当
S3:采用动态规划法求解S2中阶段α的双边优化问题,得到进攻星和防御星在阶段α的控制策略;
S301,定义哈密尔顿函数为:
S302,列写双边优化问题的最优性条件:
S303,将哈密尔顿函数代入上述最优性条件中得双方最优控制策略的形式解:
S304,将双方的最优控制策略解代入哈密尔顿函数中得到哈密尔顿-雅克比方程:
S305,为了得到反馈控制策略,假设最优条件下协态变量有如下形式:
S306,将上述等式代入形式解中得到攻防双方的最优反馈控制策略:
S307,将哈密尔顿-雅克比方程相应进行改写,如下:
整理得:
/>
S308,使用李雅普诺夫迭代法对未知矩阵P进行求解,也即求解上述改写并整理后的哈密尔顿-雅克比方程或称作黎卡提方程,迭代算法如下:
初值选取为:
得到矩阵
S309,最终得到进攻星和防御星在阶段α的控制策略如下:
其中,X为防御星与进攻星的相对状态矢量,λ为构造哈密尔顿函数的协态变量;u
S4:确定进攻星和防御星在阶段β的控制策略;
S401,由于防御星在阶段α和阶段β中的性能指标相同,故设计其在阶段α和阶段β的控制策略相同,即也采用如下的反馈控制律:
阶段β
S402,设计进攻星在阶段β的控制策略,其控制律如下:
u
其中,K
通过实时确定进攻星和防御星所在阶段切换对应的控制策略。
【实施例】
获取主星、进攻星和防御星的航天器护卫问题参数,参见图1,假设在某初始时刻t
表1进攻星a与防御星d的初始相对位置速度(m,m/s)
根据上述条件,下面给出本发明的具体实施方式,参见图2。
根据主星、进攻星和防御星的航天器护卫问题参数建立航天器护卫问题模型,其模型如下:
当
当
其中:对称半正定矩阵
Q=k
式中:
k
其中矩阵A表示航天器相对运动动力学约束矩阵,其具体形式通过轨道动力学里的CW方程构建,即:
其中
式(1)至(3)中其他符号的含义为:
a——进攻星的下标;
d——防御星的下标;
m——主星的下标;
X
X
x——相对坐标系(LVLH系)下轨道径向的位置分量;
y——相对坐标系(LVLH系)下飞行方向的位置分量;
z——相对坐标系(LVLH系)下轨道角动量方向的位置分量;
v
v
v
u
u
B——进攻星和防御星的控制矩阵,具体形式为B=[0
d
J
J
J——进攻星和防御星之间距离小于安全距离时双方的性能指标;
u
u
‖s‖——表示对一个三维实向量
将获取主星、进攻星和防御星的航天器护卫问题参数中的初始参数代入航天器护卫问题模型得到进攻星和防御星在两个阶段的控制策略,其求解方法步骤如下:
S1,输入航天器护卫问题的参数,包括参考卫星轨道半长轴a
S2,将航天器护卫问题模型,即公式(1)~(3),分别进行进攻星和防御星的分阶段最优控制策略求解:当
S3,采用动态规划法求解上述阶段α的双边优化问题,具体步骤为:
S301,定义哈密尔顿函数为:
其中,X为防御星与进攻星的相对状态矢量,记作X=X
S302,列写双边优化问题的最优性条件:
S303,将哈密尔顿函数代入上述最优性条件中得双方最优控制策略的形式解:
S304,将双方的最优控制策略解代入哈密尔顿函数中得到哈密尔顿-雅克比方程(HJ方程):
S305,为了得到反馈控制策略,假设最优条件下协态变量有如下形式:
S306,将上述等式代入形式解中得到攻防双方的最优反馈控制策略:
S307,将HJ方程相应进行改写,如下:
整理得:
S308,使用李雅普诺夫迭代法对未知矩阵P进行求解,也即求解上述改写并整理后的HJ方程或称作黎卡提方程,迭代算法如下:
初值选取为:
得到矩阵
S309,最终得到进攻星和防御星在阶段α的控制策略如下:
S4,分别设计进攻星和防御星在阶段β的控制策略,具体步骤如下:
S401,由于防御星在阶段α和阶段β中的性能指标相同,故设计其在阶段α和阶段β的控制策略相同,即也采用如下的反馈控制律:
阶段β
S402,下面设计进攻星在阶段β的控制策略,由于其性能指标仅为与主星之间的距离,且主星为无机动的航天器,因此可以直接使用PD控制方法设计进攻星的控制策略,其控制律如下:
u
其中K
S5,得到进攻星和防御星分别在阶段α和阶段β中的控制策略,其表达式如下:
通过上述公式计算进攻星和防御星的加速度时,如果计算得到某一时刻进攻星的加速度‖u
S6,进攻星和防御星时刻确定
S7,进行数值仿真,得到护卫问题双方的轨迹图(如图3)以及加速度变化曲线(如图4)。
综上所述,本发明公开了一种基于策略切换的航天器护卫问题求解方法、系统及设备,具体内容包括:首先建立了一种基于策略切换的航天器护卫问题模型,包含优化指标、优化变量、动力学约束、加速度能力约束等;其中优化指标采用包含了星间距离和燃料消耗的加权二次型函数描述,优化变量为攻防双方的连续控制力加速度,动力学约束采用相对运动模型下CW方程描述,加速度能力约束采用加速度幅值限制建模。然后建立了上述优化问题的求解方法,具体包括如下步骤:S1,将优化问题根据阶段分为了双边优化问题和轨迹转移;S2,对于双边优化问题,采用动态规划法求解,将双边优化问题转化为两点边值问题,最后通过求解黎卡提方程得到最优反馈控制解;S3,将对于轨迹转移,采用比例微分控制方法设计控制律;S4,得到攻防双方在两个不同阶段的控制律;S5,根据实时确定攻防双方的星间距离确定处于哪个阶段中,并根据阶段的转换同时切换各自的控制策略;S6,输出航天器护卫问题的解。该航天器护卫问题求解方法,可有效解决连续推力作用下的航天器护卫问题,是对现有技术中连续推力护卫问题模型及方法的一种有效拓展。该模型采用了策略切换的方法,因而使得难以求解的加权型性能指标护卫问题求解简化,提高了非零和博弈问题的求解效率。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
- 一种基于LQR和微分对策的航天器护卫问题求解方法
- 基于双循环嵌套优化策略的Job Shop调度问题求解方法及系统