掌桥专利:专业的专利平台
掌桥专利
首页

一种非线性马尔可夫跳变系统全参数辨识方法

文献发布时间:2023-06-19 16:12:48



技术领域

本发明属于混杂系统理论、随机过程分析在控制工程与信号处理方面的应用,涉及一种非线性马尔可夫跳变系统全参数辨识方法,涉及粒子平滑估计方法、最大期望算法、随机梯度下降算法、对数似然函数等。

背景技术

当前,我国国防工业、制造业进入高速发展期,成为推动我国持续稳定发展的关键保障,同时也对相关武器装备、生产设施提出了更高的要求。在此趋势下,这些装备设施所涉及的动力系统、运行环境愈发复杂,其内部包含数量庞大的元器件与执行机构,并且整个系统在运行过程中会在不同的工作模式之间切换。这类包含连续动态过程与离散事件过程的混杂系统广泛存在于航空航天、化学工程、能源设施、网络通讯、经济金融等重要领域。而作为混杂系统领域的重要研究分支,非线性马尔可夫跳变系统由于能够以简单的建模方式描述复杂的动态系统过程,受到了学界的广泛关注。而由于该动态系统的复杂性,一般无法完全获取全部参数信息,只能通过辨识手段进行求解。因此,针对非线性马尔可夫跳变系统的参数辨识方法具有重要的实际应用价值。

上述研究方法可有效实现一部分的非线性马尔可夫跳变系统辨识问题,但是仍然存在如下问题:

(1)仅能辨识系统中离散状态转移概率和噪声模型参数这类简单参数,对非线性的连续状态转移函数和观测函数中的参数无法有效辨识

(2)针对很多应用中的案例,连续状态转移函数有时候不包含观测值,仅由未知连续状态决定。导致在辨识连续状态转移函数参数过程中会产生不可预知的计算结果,影响辨识精度。

发明内容

要解决的技术问题

为了避免现有技术的不足之处,本发明提出一种非线性马尔可夫跳变系统全参数辨识方法,解决现有方法只能辨识马尔可夫跳变系统中线性函数参数、离散状态转移概率、噪声模型等简单参数。

技术方案

一种非线性马尔可夫跳变系统全参数辨识方法,其特征在于步骤如下:

步骤1、建立非线性马尔可夫跳变系统模型:

x

y

p(r

其中:R

f

步骤2、确立系统参数:

令系统参数为θ∈Ω={a

步骤3:获取的观测量序列y

步骤4、估计离散状态与连续状态的概率分布:

步骤4.1:建立一种基于离散状态的分布式粒子平滑方法,其粒子为:

其中K为粒子个数,

步骤4.2:使用粒子滤波方法获取基于Rao-Blackwellized分解与Gibbs采样的粒子平滑初始参考轨迹,每一时刻的粒子计算方式为:

其中

根据以上公式计算从n=1到n=N时刻i=1,…,K的所有粒子,得到粒子滤波结果:

令x′

步骤4.3:使用粒子平滑估计获取离散状态与连续状态的概率分布估计:

步骤5:设计基于似然值的损失函数,

其中,

所述

步骤6:根据损失函数L更新参数,其中离散状态转移概率a

而与非线性连续状态转移函数和观测函数相关的参数θ

其中E(·|lk)为在给定观测量序列y

将更新后得到的参数{a

步骤7、判断参数辨识结果:重复执行步骤4—步骤6,当损失函数值L在前后两次迭代中变化小于某一设定值ε时,结束辨识流程,将步骤6计算得到的系统参数作为参数辨识结果。

所述步骤4.3的粒子平滑估计获取离散状态与连续状态的概率分布估计为:

(4.3.1)设置Gibbs采样迭代次数上限为λ,并令k=1;

(4.3.2)输入参考轨迹,令α

(4.3.3)计算从时刻n=2到n=N的粒子取值:首先根据

然后根据

根据得到的K个粒子的连续状态数值

(4.3.4)后向计算所有时刻的离散状态概率,计算公式:

(4.3.5)按照以下公式更新参考轨迹

(4.3.6)如果k<λ,令k=k+1,转至步骤(4.3.2);否则,结束粒子平滑算法;

(4.3.7)计算连续状态与离散状态的平滑估计值,计算公式:

其中,

有益效果

本发明提出的一种非线性马尔可夫跳变系统全参数辨识方法,利用一种新的粒子平滑算法估计未知混合状态及相关统计量信息,设计一种新的基于似然值的损失函数解决连续状态转移函数有时候不包含观测值所带来的辨识不确定性,结合最大期望算法、梯度下降算法估计非线性马尔可夫跳变系统全部参数。

本发明针对系统中离散状态转移概率、非线性连续状态转移函数、非线性观测函数、连续状态与观测量噪声模型等参数进行辨识。利用一种基于离散状态的分布式粒子平滑算法估计未知的离散状态与连续状态概率分布,设计一种新的损失函数形式以应对连续状态转移函数中不包含观测量信息所导致的辨识不确定现象,结合使用最大期望算法与梯度下降搜索方法辨识非线性马尔可夫跳变系统各个参数。与现有方法对比,该方法能够辨识非线性马尔可夫跳变系统全部参数,有效辨识参数并收敛至合理数值。

附图说明

图1是方法流程图

图2是离散状态估计误差随辨识方法迭代次数变化趋势

可以看到示例中的模型辨识结果随着迭代次数的增加离散状态估计准确度也逐渐提高,说明辨识的参数能够很好的原模型。

图3是连续状态估计误差随辨识方法迭代次数变化趋势。

可以看到示例中的模型辨识结果随着迭代次数的增加连续状态估计准确度也逐渐提高,说明辨识的参数能够很好的原模型。

图4是参数辨识结果用于估计得到的离散状态值与真实值的对比。

可以看到最终的使用参数辨识结果进行未知离散状态估计可以准确估计离散状态。

图5是参数辨识结果用于估计得到的连续状态值与真实值的对比。

可以看到最终的使用参数辨识结果进行未知连续状态估计可以准确估计连续状态。

具体实施方式

现结合实施例、附图对本发明作进一步描述:

本例针对以下非线性马尔可夫跳变系统介绍全参数辨识过程,虽然只针对某一特定模型进行辨识,但是整个辨识方法与流程不限于所属范围。

假设离散状态取值集合为Ω={1,2},则该系统参数真实值与辨识算法所用的参数初始值如下表所示

非线性马尔可夫跳变系统参数辨识实现步骤具体如下:

步骤1:根据系统模型获得观测量序列y

计算离散状态概率估计

并令

ζ

步骤2:参数计算

步骤2-1:按照如下公式计算似然函数值

并计算本发明设计的损失函数值

步骤2-2:依照如下公式计算离散状态转移概率a

步骤2-3:依据系统模型得到损失函数关于连续状态转移函数、观测函数与噪声模型相关参数的偏导数,如下

其中

其中

步骤2-4:使用梯度下降搜索方法求解更新A

步骤2-5:得到参数计算值集合{a

步骤3:辨识结果判定。当损失函数值L在前后两次迭代中变化小于某一设定值ε时,结束辨识流程,集合{a

技术分类

06120114743674