掌桥专利:专业的专利平台
掌桥专利
首页

一种多目标跟踪迭代学习方法

文献发布时间:2024-04-18 20:02:40


一种多目标跟踪迭代学习方法

技术领域

本发明涉及迭代学习跟踪控制技术领域,特别是关于一种多目标跟踪迭代学习方法。

背景技术

在现实的工业生产过程中,大部分过程都是在有限的时间间隔内执行给定的生产任务,一次生产一批,这样的过程称之为批生产。批生产有着时间有限与重复执行的特性,迭代学习控制是通过学习历史批次的信息改善当前批次的跟踪性能,随着迭代批次的增加,系统的跟踪误差实现渐进收敛。

在批生产的过程中,通常涉及到多目标跟踪。例如,在化工生产中,需要通过多传感器系统来监测温度、压强或体积。每个传感器的输出都有独立的跟踪轨迹。为了表征生产系统生产的整体状况的跟踪结果,可以利用各个传感器的跟踪误差作加权处理。

然而,本申请的发明人在研究中发现,在对各个传感器的跟踪误差作加权处理时,需要设置各个传感器的权重,现有技术的权重设置方式为人为预先设置一个权重,例如取相等的数值,这些取值相等(或不等)的权重,虽然可以满足迭代到收敛的条件,但不能保证多传感器的跟踪性能在每次更新后都得到改进。

发明内容

针对上述问题,本申请的目的是提供一种多目标跟踪迭代学习方法,能够在两阶段的迭代更新中,自适应地确定Pareto最优解下的各个传感器的权重,基于这些确定的权重进行批生产的迭代控制,不仅能够满足收敛,还能保证多传感器的跟踪性能在每次迭代后都得到Pareto改进。

为实现上述目的,本申请采取以下技术方案:

第一方面,本申请提供一种多目标跟踪迭代学习方法,所述方法包括:

S1,设置多传感器系统中不同传感器对应的目标跟踪轨迹;

S2,对于第一阶段的每次迭代,自适应地确定的各个传感器的权重,对所述多传感器的生产过程进行控制跟踪到弱Pareto最优解;

S3,对于第二阶段的每次迭代,自适应地确定的各个传感器的权重,对所述多传感器的生产过程进行控制跟踪到Pareto最优解。

在本申请的一种实现方式中,在所述S2中,在第一阶段的每一迭代批次,执行下列处理:

S21,获取所述多传感器系统在当前迭代批次下各传感器检测到的系统输出,并结合各个传感器的目标跟踪轨迹计算对应的跟踪误差;

S22,根据预设计的第一自适应权重输入更新律,计算下一迭代批次的系统输入并进行更新;在所述第一自适应权重输入更新律中,所涉及的各传感器的权重通过第一跟踪性能优化问题来求解;

S23,返回S21进行执行,直到所有传感器的跟踪性能无法实现同时改进,此时跟踪到弱Pareto最优解。

在本申请的一种实现方式中,在所述S3中,在第二阶段的每一迭代批次,执行下列处理:

S31,根据当前迭代批次之前得到的弱Pareto最优解,将传感器分成第一部分和第二部分;

S32,根据与分组相应的第二自适应权重输入更新律,计算下一迭代批次的系统输入并进行更新;在所述第二自适应权重输入更新律中,所涉及的各传感器的权重通过第二跟踪性能优化问题来求解;

S33,返回S32进行执行,直到第二部分的传感器的跟踪性能无法实现同时改进,此时得到新的弱Pareto最优解;

S34,返回S31进行执行,直到遍历所有的分组结果都有第二部分的传感器的跟踪性能无法实现同时改进,最终确定的弱Pareto最优解为Pareto最优解。

在本申请的一种实现方式中,所述多传感器系统的系统模型为:

xx

y

其中,k代表迭代批次的序号,t代表离散时间点,i代表传感器的序号,x

在本申请的一种实现方式中,每个传感器跟踪目标轨迹设置为:y

每个传感器的跟踪误差计算为:e

在本申请的一种实现方式中,所述第一自适应权重输入更新律,具体为:

其中,

在本申请的一种实现方式中,求解权重

在本申请的一种实现方式中,将传感器分为第一部分和第二部分,满足:第一部分的传感器集合为

在本申请的一种实现方式中,所述第二自适应权重输入更新律,具体为:

其中,

在本申请的一种实现方式中,其特征在于,求解权重

本发明由于采取以上技术方案,其具有以下优点:

本发明可以克服用户无法提前确定多传感器系统中每个传感器权重的难题;

本发明由于采用了自适应权重的处理方法,保证了每次更新每个传感器的跟踪性能指标都不会得到恶化,并且至少有一个传感器的跟踪性能得到改善。

附图说明

图1为本申请一个实施例中的多目标跟踪迭代学习方法的流程图;

图2是本申请一个更为详细的实施例中的多传感器系统迭代学习的跟踪框架图;

图3是本申请一个算例中使用常规技术中等权重的迭代学习方法所得到的系统每个传感器的跟踪性能指标沿着迭代轴的演化图;

图4是本申请一个算例中使用所提出的多目标跟踪迭代学习方法所得到的系统每个传感器的跟踪性能指标沿着迭代轴的演化图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

本申请技术方案针对一种离散线性时不变的多传感器系统。

其系统模型为:

x

y

其中,k代表迭代批次的序号,t代表离散时间点,i代表传感器的序号,x

迭代学习算法的设计思想是基于跟踪误差对系统输入进行更新,通过新的迭代批次的系统输入,调整计算新的系统状态和系统输出,从而达到对工业生产过程的循环控制。

经典的系统输入的计算公式如下:

其中,λ

然而,对于权重λ

针对上述问题,本申请提供一种多目标跟踪迭代学习方法。

如图1,一种多目标跟踪迭代学习方法,包括:

S1,设置多传感器系统中不同传感器对应的目标跟踪轨迹;

S2,对于第一阶段的每次迭代,自适应地确定的各个传感器的权重,对所述多传感器的生产过程进行控制跟踪到弱Pareto最优解;

S3,对于第二阶段的每次迭代,自适应地确定的各个传感器的权重,对所述多传感器的生产过程进行控制跟踪到Pareto最优解。

结合图2的框图,对上述流程进行更进一步的详细说明。

图2的设计思想,将多目标跟踪问题转化为一个多目标优化问题,其中多目标优化问题的目标函数(跟踪性能)可以选为不同传感器的跟踪误差在所有时间点的平方和。通过迭代学习的方式来对多目标问题的所有目标函数进行Pareto改进。

在图2中,改进分为两个阶段,第一阶段实现全部传感器的跟踪性能的改进,第二阶段保持一部分传感器的跟踪性能不变,同时改善另一部分的跟踪性能。具体阐述如下:

S1,设置多传感器系统中不同传感器对应的目标跟踪轨迹。

具体的,每个传感器跟踪目标轨迹设置为:y

在后续每一迭代批次中,系统状态设置为相同的初值,即x

S2,第一阶段的处理。

具体的,包括:

S21,获取所述多传感器系统在当前迭代批次下各传感器检测到的系统输出,并结合各个传感器的目标跟踪轨迹计算对应的跟踪误差。

其中,跟踪误差为e

S22,根据预设计的第一自适应权重输入更新律,计算下一迭代批次的系统输入并进行更新;在所述第一自适应权重输入更新律中,所涉及的各传感器的权重通过第一跟踪性能优化问题来求解。

第一自适应权重输入更新律,具体为:

其中,P

求解权重

S23,返回S21进行执行,直到所有传感器的跟踪性能无法实现同时改进,此时跟踪到弱P

具体的,分两种情况讨论:

①如果每个传感器的跟踪性能指标可以同时得到优化,即权重值满足

②如果每个传感器的跟踪性能指标无法再同时得到优化,即权重值满足

此时,进入第二阶段的处理。

S3,第二阶段的处理。

具体的,包括:

S31,根据当前迭代批次之前得到的弱Pareto最优解,将传感器分成第一部分和第二部分;

将传感器分为第一部分和第二部分,满足:第一部分的传感器集合为

如果所有的分组的方式均不满足上述条件,则该弱P

S32,根据与分组相应的第二自适应权重输入更新律,计算下一迭代批次的系统输入并进行更新;在所述第二自适应权重输入更新律中,所涉及的各传感器的权重通过第二跟踪性能优化问题来求解;

获得的当前批次的系统的所有传感器的输出为

第二自适应权重输入更新律,具体为:

其中,

求解权重

S33,返回S32进行执行,直到第二部分的传感器的跟踪性能无法实现同时改进,此时得到新的弱Pareto最优解;

分两种情况讨论:

①如果

②如果

S34,返回S31进行执行,直到遍历所有的分组结果都有第二部分的传感器的跟踪性能都无法实现同时改进,最终确定的弱Pareto最优解为Pareto最优解。

将传感器分成与之前不相同的两部分。如果遍历所有的分组第二部分的传感器的跟踪性能指标都无法继续同时优化,则该弱Pareto最优解已经是Pareto最优解。

下面在本申请的一个算例中说明算法流程,并说明其优势。

算例:

对于系统

其中系统矩阵为:

步骤1):确定期望跟踪轨迹为y

确定系统状态初值选取:系统状态初值设为x

确定系统初始迭代输入选取:初始迭代输入设置为u

步骤2):获得的当前批次的系统输出为y

步骤3):选取如下更新律

其中

权重值

步骤4):分情况讨论。

①如果每个传感器的跟踪性能指标可以同时得到优化,即

②如果每个传感器的跟踪性能指标无法再同时得到优化,即

步骤5):将所有传感器分为两个部分,由于是双传感器系统所以只能分为I={1},JI={2}和I={2},JI={1},先讨论第一种情况。这时P

步骤6):获得的当前批次的系统输出为y

步骤7):选取如下更新律

其中

权重值

步骤8):分情况讨论。

①如果

②如果

图3中展示了在用户提前分配好等权重的形况下,利用加权迭代学习控制律所得到的系统不同传感器跟踪性能指标随迭代次数的变化曲线。从图中可以看出,加权迭代学习控制律无法保证每个传感器的跟踪性能指标单调减少。

图4中展示了在用户提前无法分配权重的形况下,利用本申请的两阶段自适应权重的迭代学习控制律所得到的系统不同传感器跟踪性能指标随迭代次数的变化曲线。从图中可以看出,两阶段自适应权重的迭代学习控制律可以保证每个传感器的跟踪性能指标单调减少,并且最终收敛到Pareto最优解。

在本发明所提供的几个实施例中,应该理解到,所揭露的方法,可以通过其它的方式实现。例如,以上所描述的实施例仅仅是示意性的。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例上述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上上述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

相关技术
  • 一种迭代更新轨迹模型的多目标跟踪方法
  • 一种迭代更新轨迹模型的多目标跟踪方法
技术分类

06120116586237