掌桥专利:专业的专利平台
掌桥专利
首页

一种针对碰撞规避的星座智能自主轨道控制方法

文献发布时间:2023-06-19 16:11:11



技术领域

本发明属于卫星轨道控制领域,具体涉及针对碰撞规避的星座智能自主轨道控制方法。

背景技术

随着空间任务的日益复杂,星群控制问题逐步成为了航天工程领域内的热点与难点。星群为包括卫星集群、编队、星座在内的以多星协同的方式解决空间问题的载体,其相较于单一独立的卫星系统,可靠性、任务多样性、功能可扩展性等方面都有显著提高,是未来卫星技术发展的重要方向。

然而,星群处于的空间环境是复杂的,随着卫星数目的增加,卫星在机动过程中,星间碰撞的可能性也会大幅增加,如何很好的综合机动目标与碰撞规避问题,依旧是目前航天工程领域的一个难点,不过幸运的是,随着人工智能,大数据等理论的发展,利用深度神经网络等方法,可以大幅降低计算负担,并实现星上实时智能自主的生成最优控制率的目的,将为含碰撞规避的星上智能自主控制器提供全新的设计方向。

目前,传统的最优控制问题求解有直接法、间接法与形状法,其中,直接法通过直接对系统的状态变量和控制变量进行离散化处理,但其对于复杂问题计算量较大,而间接法利用最优控制理论,虽然能得到精度较高的解,但其对初值极其敏感,形状法则是通过估计小推力转移的轨道,反推出航天器控制策略的方法,虽然有着较快的计算速度,但结果精度依赖于轨道形状的选取。此外,传统含碰撞规避的机动过程大多需要地面计算控制率再上注行星,这样必然面临计算复杂程度随卫星数目增长而爆炸增长的局限性以及,地面上注信息产生的延迟导致的潜在碰撞危险,因此,有必要完成一种灵活的,可实时生成最优控制信息并能实现自主碰撞规避的智能控制器设计。

发明内容

本发明的目的是为了解决现有传统的最优控制问题求解法存在计算量大,对初值极其敏感,或对结果精度依赖于轨道形状的选取等的问题,而提出一种针对碰撞规避的星座智能自主轨道控制方法。

一种针对碰撞规避的星座智能自主轨道控制方法具体过程为:

S1、基于深度学习,构建控制器神经网络模型;具体过程为:

步骤一:通过间接法求解最优轨道转移问题,构建最优控制数据库;

步骤二:设计神经网络结构,包括神经网络的层数,每一层的节点数与激活函数;

步骤三:得到航天器最优控制器模型,实现实时根据当前与期望状态信息(x

S2、基于S1训练好的神经网络模型与人工势函数,构建考虑碰撞规避的卫星星座推力智能自主控制器;具体过程为:

步骤1:利用势函数构建碰撞规避控制器;

步骤2:判断航天器当前状态是否满足状态允许偏差;若否,执行步骤3;若是,执行步骤4;

步骤3:利用S1训练好的神经网络模型对航天器进行控制,执行步骤4;

步骤4:实时判断航天器当前状态是否存在碰撞风险,若航天器存在碰撞风险,则执行步骤5;若航天器不存在碰撞风险,则执行步骤6;

步骤5:利用势函数对航天器进行碰撞规避机动控制,至航天器不在存在碰撞风险,执行步骤6

步骤6:再次判断航天器当前状态是否满足状态允许偏差,若满足,则控制结束,不满足则需要返回步骤2,重复步骤2至步骤6,直至航天器当前所有状态均满足状态允许偏差且不存在碰撞风险,控制结束。

本发明的有益效果:

本发明提出了一种基于神经网络的航天器轨道转移最优控制器设计方案。在本发明中,利用地面生成的神经网络数据,训练设计好结构的神经网络,以实现星上实时智能自主的生成最优控制的略的目的,此外,将神经网络控制器与势函数相结合,实现了星座机动过程中的星上自主碰撞规避的目的。本发明不仅可以解决传统控制在出现扰动需要重新规划的问题,也可以避免由于地面站上传指令至卫星需要等待适当窗口的麻烦,同样此控制器也为太阳系内其他深空任务的轨道转移控制器设计问题与星群乃至巨星星座自主规避星间碰撞问题提供了一个有效的设计思路。

附图说明

图1为本发明基于神经网络的航天器轨道转移最优控制器设计流程图;

图2为本发明基于神经网络的航天器星上自主机动与碰撞规避控制器工作流程图;

图3a为本发明基于神经网络1的航天器轨道转移最优控制器神经网络结构示意图,其中,L

图3b为本发明基于神经网络2的航天器轨道转移最优控制器神经网络结构示意图;

图4a为本发明星群构型运行时间为0s后卫星分布情况图;

图4b为本发明星群构型运行时间为9.68×10

图4c为本发明星群构型运行时间为1.94×10

图4d为本发明星群构型运行时间为2.90×10

图4e为本发明星群构型运行时间为3.87×10

图4f为本发明星群构型运行时间为4.84×10

图5为本发明航天器间相对距离图像。

具体实施方式

具体实施方式一:一种针对碰撞规避的星座智能自主轨道控制方法具体过程为:

本发明设计了一种基于神经网络的智能控制器设计。该算法克服了现有传统方法计算量大等问题,直接利用航天器当前状态与期望状态作为输入量,通过拟合好的神经网络得到当前的最优控制策略,并与基于势函数的碰撞规避环节相结合,实现含碰撞规避的星上智能自主的控制器设计。

本发明的目的在于针对上述现有技术的不足,提供一种基于神经网络的航天器星上自主机动与碰撞规避控制器设计方案,为达到上述目的,本发明采用的技术方案包括以下两个部分:

S1、基于深度学习,构建控制器神经网络模型;具体过程为:

步骤一:通过间接法求解最优轨道转移问题,构建最优控制数据库;

步骤二:设计神经网络结构,包括神经网络的层数,每一层的节点数与激活函数;

步骤三:得到航天器最优控制器模型,实现实时根据当前与期望状态信息(x

S2、基于S1训练好的神经网络模型与人工势函数,构建考虑碰撞规避的卫星星座小推力智能自主控制器;具体过程为:

步骤1:利用势函数构建碰撞规避控制器;

步骤2:判断航天器当前状态是否满足状态允许偏差;若否,执行步骤3;若是,执行步骤4;

步骤3:利用S1训练好的神经网络模型对航天器进行控制(此时对于的当前与期望状态信息输入S1训练好的神经网络模型,输出最优控制策略,基于最优控制策略对航天器进行控制),执行步骤4;

步骤4:实时判断航天器当前状态是否存在碰撞风险(公式11),若航天器存在碰撞风险,则执行步骤5;若航天器不存在碰撞风险,则执行步骤6;

步骤5:利用势函数对航天器进行碰撞规避机动控制(公式12-18)(利用势函数对步骤3基于最优控制策略控制的航天器对于的状态等进行碰撞规避机动控制,得到每次更新的控制率),至航天器不在存在碰撞风险,执行步骤6;

步骤6:再次判断航天器当前状态是否满足状态允许偏差,若满足,则控制结束,不满足则需要返回步骤2,重复步骤2至步骤6,直至航天器当前所有状态均满足状态允许偏差且不存在碰撞风险,控制结束。

具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一中通过间接法求解最优轨道转移问题,构建最优控制数据库;

具体过程为:

步骤一一、航天器的动力学模型选择为二体动力学模型,所采用的二体动力学模型在柱坐标系中可以表达为:

其中,D、B为中间变量,表达式如下:

其中,

步骤一二、时间自由的燃料最优控制问题的指标J可以表示为:

其中,t

获取标称轨道的初始状态和期望状态分别表示为

步骤一三、基于标称轨道的初始状态和期望状态,利用间接法对时间自由的燃料最优控制问题进行求解,得到协态变量初值和转移时间,表示为最优解Λ

步骤一四、获取一组新的标称轨道的初始状态

其中,

步骤一五、将最优解Λ

基于新的标称轨道的初始状态

步骤一六、重复步骤一四、步骤一五,得到多个最优解,多个最优解对应多条最优轨迹;

当δx

建立神经网络数据库,将得到的每条最优轨迹在M个时间离散点中进行采样,采样得到当前与期望状态-最优控制动作对(x

由多条最优轨迹采样得到多组当前与期望状态-最优控制动作对(x

其中x

其它步骤及参数与具体实施方式一相同。

具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤二中设计神经网络结构,包括神经网络的层数,每一层的节点数与激活函数;

具体过程为:

控制器的神经网络模型为前馈全连接神经网络,包括神经网络1模型和神经网络2模型;

控制器的神经网络1、2模型的输入均为航天器当前状态与期望状态[x

神经网络1依次包含一个输入层,3层隐含层,一个输出层,每层隐含层包含128个神经元,并选择Sigmoid函数作为输出层激活函数,在隐含层选取ReLU作为激活函数;神经网络2依次包含一个输入层,9层隐含层,一个输出层,每层隐含层包含128个神经元,选择Tanh函数作为输出层激活函数,在隐含层选取ReLU作为激活函数;

神经网络由权重ω与偏置b参数化,采用训练数据与网络预测结果之间的均方误差(MSE)作为损失函数:

其中Net表示需要训练的神经网络,N为用于训练的样本总数.X

用Adam优化算法来对神经网络中参数进行训练,设置学习率为0.0001。

其它步骤及参数与具体实施方式一或二相同。

具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤三中得到航天器最优控制器模型,实现实时根据当前与期望状态信息(x

提取数据库中数据作为训练集,将训练集输入构建的控制器神经网络模型1,2,对构建的控制器神经网络模型进行训练,得到训练好的两个神经网络模型,得到航天器最优控制器模型;

将当前与期望状态信息[x

式中,

其它步骤及参数与具体实施方式一至三之一相同。

具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤1中利用势函数构建碰撞规避控制器;具体过程为:

设置航天器的安全约束表示为:

||r

其中r

航天器所受的距离其最近的航天器的斥力势为:

其中,U

假设航天器i受到的切向加速度方向为α

其中a

为将切向加速度方向向量转至柱坐标系中,首先将方向向量转置径向S,横向T与轨道面法向W中,令中间变量A,B表示如下:

有:

S=Aα

T=Bα

W=0

其中e表示轨道离心率,

因此,将[S,T,W]

式中,a

借由地心惯性坐标系下加速度方向矢量,可得到柱坐标系下加速度方向矢量α

α

α

α

式中,α

由此法得到的加速度与神经网络控制器得到的加速度做和,可得到需要进行碰撞规避航天器所受到的控制率,即:

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤2~步骤6中的航天器的状态允许偏差以柱坐标的形式给出,航天器状态偏差具体表示方式如下:

式中,|Δr|、|Δθ|、|Δz|、|Δv

若航天器当前状态小于等于允许偏差,仍有可能因为碰撞规避机动偏离航天器期望状态,此时,为避免控制器频繁的切换开关状态,将状态允许偏差以开始极限

当航天器的所有状态偏差均小于等于停止极限时,认为满足状态允许偏差,当航天器任一状态偏差大于开始极限时,则认为状态允许偏差不再满足;

所述开始极限均大于停止极限。

其它步骤及参数与具体实施方式一至五之一相同。

采用以下实施例验证本发明的有益效果:

实施例一:

选取大型星座中的一个轨道平面,假设这一轨道面相位均匀分布着100颗卫星。每颗卫星质量为270kg,采用电推进器,比冲I

表1人工势函数参数及控制极限

机动过程中卫星位置变化如图4a、4b、4c、4d、4e、4f所示,其中编号12345对应于选择的卫星编号[1,23,58,75,88]:

经过4.841×10

同时含碰撞规避的航天器机动耗费燃料为0.09kg-0.32kg,总燃料消耗为1.2917kg。可以看出基于势函数的人工智能控制器有着合理的能量消耗,同时证明了碰撞规避算法的有效性。

并且,相比平均时长需要约2000s计算时间的间接法,神经网络计算一次完整的轨迹仅需约100s,平均神经网络控制器每计算一次控制量仅需要0.0095s。其在计算时间上也表现了足够的优势。

本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

技术分类

06120114730324