掌桥专利:专业的专利平台
掌桥专利
首页

时序数据模型的重训练方法、装置及计算机设备

文献发布时间:2024-04-18 19:58:26


时序数据模型的重训练方法、装置及计算机设备

技术领域

本申请涉及人工智能技术领域,特别是涉及一种时序数据模型的重训练方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

第三代合作伙伴计划3GPP(3rd Generation Partnership Project)在R18中规定了支持网络数据分析的功能,其中,包括了对物联网设备的时序数据的统计、预测、分析等。目前,由于物联网设备的网络波动或设备故障等原因,会获取到的含有陌生数据信号的时序数据,在将含有陌生数据信号的时序数据作为数据集输入模型进行训练之前,需要对时序数据进行针对性的适配或优化,以降低噪声数据对于模型训练的干扰。

相关技术中,是对含有陌生数据信号的时序数据进行人工筛选,进而去除噪声数据,得到筛选后的时序数据,并基于筛选后的时序数据进行模型训练,得到训练好的模型。由于人工筛选的出错率较高,导致训练好的模型的预测准确度较低。

发明内容

基于此,有必要针对上述技术问题,提供一种时序数据模型的重训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种时序数据模型的重训练方法。所述方法包括:

基于时序数据序列和预测数据序列,确定所述时序数据序列对应的损失参数序列;其中,所述时序数据序列包含按照时间顺序排列的多个时序数据,所述预测数据序列是将所述时序数据序列输入至初始时序数据模型得到的,所述损失参数序列包含多个损失参数,各所述损失参数与各所述时序数据一一对应;

基于字符串匹配算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果;

基于各所述损失参数分别对应的匹配结果,调整所述初始时序数据模型对应的初始损失函数,得到目标损失函数;

基于所述时序数据包含的各时序数据以及所述目标损失函数,对所述初始时序数据模型进行重训练,得到重训练完成的目标时序数据模型。

在其中一个实施例中,所述损失参数为预测状态值,所述损失参数序列为预测状态序列;

所述基于时序数据序列和预测数据序列,确定所述时序数据序列对应的损失参数序列,包括:

基于损失值算法、所述预测数据序列对应的各预测数据,以及所述时序数据序列对应的各所述时序数据,确定损失值序列,所述损失值序列包括各所述时序数据分别对应的损失值;

基于所述损失值序列对应的参考值,确定所述损失值序列对应的预测状态序列;其中,所述预测状态序列包含对各损失值分类后得到的预测状态值。

在其中一个实施例中,所述基于所述损失值序列对应的参考值,确定所述损失值序列对应的预测状态序列,包括:

基于标准参数的算法以及所述损失值序列包含的各损失值,确定所述损失值序列对应的参考值;

针对于多个损失值中的每一个损失值,在多个状态区间中,确定所述损失值对应的目标状态区间,并确定所述目标状态区间对应的预测状态值,所述多个状态区间是基于至少一个状态划分阈值确定出的;

将多个所述损失值对应的预测状态值,作为所述损失值序列对应的预测状态序列。

在其中一个实施例中,所述基于字符串匹配算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果,包括:

根据所述字符串匹配算法,对所述预测状态序列中各所述预测状态值进行字符串匹配,得到各所述预测状态值分别对应的字符串匹配值,并将各所述字符串匹配值作为匹配结果。

在其中一个实施例中,所述基于时序数据序列和预测数据序列,确定所述时序数据序列对应的损失参数序列,包括:

基于损失值算法、所述预测数据序列对应的各预测数据,以及所述时序数据序列对应的各所述时序数据,确定各所述时序数据对应的损失值,并将各所述时序数据对应的损失值,作为所述时序数据序列对应的损失参数序列。

在其中一个实施例中,所述基于各所述损失参数分别对应的匹配结果,调整所述初始时序数据模型对应的初始损失函数,得到目标损失函数,包括:

根据预设的权重计算函数以及各所述损失参数分别对应的匹配结果,确定各所述损失参数对应的权重系数;

基于所述各所述损失参数对应的权重系数以及所述初始损失函数,得到目标损失函数。

在其中一个实施例中,所述基于字符串匹配算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果,包括:

基于KMP算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果。

第二方面,本申请还提供了一种时序数据模型的重训练装置。所述装置包括:

损失参数确定模块,用于基于时序数据序列和预测数据序列,确定所述时序数据序列对应的损失参数序列;其中,所述时序数据序列包含按照时间顺序排列的多个时序数据,所述预测数据序列是将所述时序数据序列输入至初始时序数据模型得到的,所述损失参数序列包含多个损失参数,各所述损失参数与各所述时序数据一一对应;

字符串匹配模块,用于基于字符串匹配算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果;

损失函数调整模块,用于基于各所述损失参数分别对应的匹配结果,调整所述初始时序数据模型对应的初始损失函数,得到目标损失函数;

重训练模块,用于基于所述时序数据包含的各时序数据以及所述目标损失函数,对所述初始时序数据模型进行重训练,得到重训练完成的目标时序数据模型。

在其中一个实施例中,所述损失参数为预测状态值,所述损失参数序列为预测状态序列,所述损失参数确定模块,具体用于:

基于损失值算法、所述预测数据序列对应的各预测数据,以及所述时序数据序列对应的各所述时序数据,确定损失值序列,所述损失值序列包括各所述时序数据分别对应的损失值;

基于所述损失值序列对应的参考值,确定所述损失值序列对应的预测状态序列;其中,所述预测状态序列包含对各损失值分类后得到的预测状态值。

在其中一个实施例中,所述损失参数确定模块,具体还用于:

基于标准参数的算法以及所述损失值序列包含的各损失值,确定所述损失值序列对应的参考值;

针对于多个损失值中的每一个损失值,在多个状态区间中,确定所述损失值对应的目标状态区间,并确定所述目标状态区间对应的预测状态值,所述多个状态区间是基于至少一个状态划分阈值确定出的;

将多个所述损失值对应的预测状态值,作为所述损失值序列对应的预测状态序列。

在其中一个实施例中,所述字符串匹配模块,具体用于:根据所述字符串匹配算法,对所述预测状态序列中各所述预测状态值进行字符串匹配,得到各所述预测状态值分别对应的字符串匹配值,并将各所述字符串匹配值作为匹配结果。

在其中一个实施例中,所述损失参数确定模块,具体还用于:基于损失值算法、所述预测数据序列对应的各预测数据,以及所述时序数据序列对应的各所述时序数据,确定各所述时序数据对应的损失值,并将各所述时序数据对应的损失值,作为所述时序数据序列对应的损失参数序列。

在其中一个实施例中,所述损失函数调整模块,具体用于:

根据预设的权重计算函数以及各所述损失参数分别对应的匹配结果,确定各所述损失参数对应的权重系数;

基于所述各所述损失参数对应的权重系数以及所述初始损失函数,得到目标损失函数。

在其中一个实施例中,所述字符串匹配模块,具体还用于:基于KMP算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果。

第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述方法的步骤。

第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。

第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述方法的步骤。

上述时序数据模型的重训练方法、装置、计算机设备、存储介质和计算机程序产品,通过以下技术手段,基于时序数据序列和预测数据序列,确定所述时序数据序列对应的损失参数序列;其中,所述时序数据序列包含按照时间顺序排列的多个时序数据,所述预测数据序列是将所述时序数据序列输入至初始时序数据模型得到的,所述损失参数序列包含多个损失参数,各所述损失参数与各所述时序数据一一对应;基于字符串匹配算法,对所述损失参数序列中各所述损失参数进行字符串匹配,得到各所述损失参数分别对应的匹配结果;基于各所述损失参数分别对应的匹配结果,调整所述初始时序数据模型对应的初始损失函数,得到目标损失函数;基于所述时序数据包含的各时序数据以及所述目标损失函数,对所述初始时序数据模型进行重训练,得到重训练完成的目标时序数据模型。

可知,通过基于时序数据序列和通过初始时序数据模型得到的预测数据序列,确定时序数据序列对应的损失参数序列;由于物联网设备的时序数据会存在偶发性的噪声数据信号,又由于非噪声数据是重复的连续数据信号,因此,可以采用字符串匹配的策略对损失参数序列进行匹配,使得字符串匹配的多的时序数据(即连续且重复的时序数据)赋予更高的状态值,字符串匹配的少的时序数据(即不连续且不重复的时序数据)赋予更低的状态值。由于连续且重复的时序数据不是噪声数据的可能性较大,不连续且不重复的时序数据是噪声数据的可能性较大,因此,针对各个状态值对应的状态匹配序列,对初始时序数据模块中的损失函数进行调整,从而降低初始时序数据模型在重训练时,噪声数据对训练结果的影响,进而在重训练时序数据模型时,在保证时序数据模型重训练的实时性的基础上,达到提升时序数据模型重训练的预测准确率的效果。

附图说明

图1为一个实施例中时序数据模型的重训练方法的应用环境图;

图2为一个实施例中时序数据模型的重训练方法的流程示意图;

图3为一个实施例中确定损失参数序列步骤的流程示意图;

图4为一个实施例中确定预测状态序列步骤的流程示意图;

图5为一个实施例中确定目标损失函数步骤的流程示意图;

图6为另一个实施例中时序数据模型的重训练方法的流程示意图;

图7为一个实施例中权重计算函数的示意图;

图8为一个实施例中时序数据模型的重训练装置的结构框图;

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的时序数据模型的重训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信,终端102可以实时向服务器104或数据存储系统发送时序数据。数据存储系统可以存储服务器104需要处理的数据,也可以存储服务器104处理后的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种时序数据模型的重训练方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤S202,基于时序数据序列和预测数据序列,确定时序数据序列对应的损失参数序列。

其中,时序数据序列包含按照时间顺序排列的多个时序数据,作为一个示例,时序数据可以是共享单车在预设时间段内每个时间节点的定位数据。预测数据序列是将时序数据序列输入至初始时序数据模型得到的,初始时序数据模型可以是用于对物联网设备数据进行统计、预测和分析的机器学习模型,初始时序数据模型是基于时序数据序列进行训练后得到的。

损失参数序列包含多个损失参数,各损失参数与各时序数据一一对应。损失参数可以是用于评估初始时序数据模型的预测结果(即预测数据序列)与真实结果(时序数据序列)之间的误差程度。通常来说,较小的损失参数表示模型的预测结果与真实结果更接近,较大的损失参数表示模型的预测结果与真实结果的误差较大。因此,损失参数可以用于度量时序数据模型的性能。

具体地,服务器接收终端产生的物联网设备的时序数据,并将时序数据合并,得到时序数据序列。基于此,服务器可以将时序数据序列输入至初始时序数据模型,初始时序模型经过预测得到该时序数据序列包含各时序数据分别对应的预测结果,也就是说,初始时序模型可以输出预测数据序列,服务器可以得到时序数据序列对应的预测数据序列,并基于损失参数计算公式,确定预测数据序列和时序数据序列之间的损失参数序列,其中,每个损失参数和时序数据一一对应。

可选地,基于时序数据序列、预测数据序列以及损失参数计算公式,确定时序数据序列对应的损失参数序列,其中,损失参数计算公式是预设的自定义指标计算公式或损失函数。

可选地,时序数据可以是任何依据时间顺序产生的数据,可以是物联网设备产生的数据,计算机设备产生的数据,通信终端产生的数据,计算机软件产生的数据等。

步骤S204,基于字符串匹配算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果。

其中,字符串匹配算法是在字符串中寻找该字符串对应的子串的算法,损失参数序列可以是字符串,字符串匹配算法可以在损失参数序列对应的字符串中进行子串的匹配。匹配结果可以是损失参数序列经过字符串匹配后得到的字符串匹配值,字符串匹配值中包含了各个损失参数的隐含特征。基于此,匹配结果中匹配程度越高的子串,具有更规律的数据特征,而匹配程度越低的子串,具有偶发性更高的数据特征。各损失参数分别对应的匹配结果可以表示各个损失参数内含的隐含特征,且隐含特征用于后续步骤中调整对应的初始损失函数。

具体地,服务器根据字符串匹配算法,在损失参数序列对应的字符串中,寻找由多个损失参数组成的子串,并得到字符串的匹配结果,匹配结果可以表示损失参数序列中各个损失参数对应的匹配程度。

可选地,服务器可以基于Brute-Force算法、Rabin-Karp Hash算法、KMP(Knuth-Morris-Pratt)算法、Sunday算法中的至少一个算法,将损失参数序列对应的字符串进行匹配,得到匹配结果。

步骤S206,基于各损失参数分别对应的匹配结果,调整初始时序数据模型对应的初始损失函数,得到目标损失函数。

其中,初始时序数据模型包含初始损失函数,初始损失函数是初始时序数据模型在进行训练时不断迭代得到的,在训练时,服务器可以基于初始损失函数对待训练的时序数据模型进行训练,得到初始时序数据模型。基于此,服务器可以基于各损失参数分别对应的匹配结果,对初始损失函数进行调整,得到目标损失函数。在重训练时,服务器可以基于目标损失函数,对初始时序数据模型进行优化,当达到收敛条件或训练结束条件时,得到重训练完成的目标时序数据模型。由于,匹配结果中包含损失参数序列中各个损失参数对应的匹配程度,进而在调整初始损失函数时,会根据匹配结果,对不同的损失参数进行对应的调整,得到不同的目标损失函数。相应地,损失参数序列中各个损失参数与目标损失函数一一对应。

具体地,各损失参数分别对应的匹配结果可以表示各损失参数的隐含特征。作为一个示例,隐含特征可以通过偶发性程度和规律性程度表示,若隐含特征的偶发性程度越高,则说明该损失参数是噪声数据的可能性越大,若隐含特征的规律性程度越高,则说明该损失参数是噪声数据的可能性越小。基于此,对于不同隐含特征的损失参数,可以确定不同的目标损失函数,其中,对于偶发性程度越高的损失参数,该损失参数的目标损失函数对初始时序数据模型的影响越小;对于偶发性程度越低的损失参数,该损失参数的目标损失函数对初始时序数据模型的影响越大。相应地,服务器基于各损失参数分别对应的匹配结果,得到各损失参数分别对应的目标损失函数。

步骤S208,基于时序数据包含的各时序数据以及目标损失函数,对初始时序数据模型进行重训练,得到重训练完成的目标时序数据模型。

其中,初始时序数据模型是在对物联网设备的时序数据进行统计、预测、分析时建立的机器学习模型。目标时序数据模型是在初始时序数据模型的基础上,进一步通过时序数据对初始时序数据模型进行训练、迭代,得到更加精确的时序数据模型。

具体地,服务器在得到各损失参数分别对应的目标损失函数之后,可以分别对损失参数对应的时序数据进行重训练,在重训练时,对不同的时序数据采用对应的目标损失函数进行训练,当达到目标时序数据模型的收敛条件时,完成目标时序数据模型的重训练。作为一个示例,目标时序数据模型和初始时序数据模型的结构相同,并且初始时序数据模型的收敛条件可以作为目标时序数据模型的收敛条件。

上述时序数据模型的重训练方法中,服务器通过基于时序数据序列和通过初始时序数据模型得到的预测数据序列,确定时序数据序列对应的损失参数序列;由于物联网设备的时序数据会存在偶发性的噪声数据信号,又由于非噪声数据是重复的连续数据信号,因此,可以采用字符串匹配的策略对损失参数序列进行匹配,使得字符串匹配的多的时序数据(即连续且重复的时序数据)赋予更高的状态值,字符串匹配的少的时序数据(即不连续且不重复的时序数据)赋予更低的状态值。由于连续且重复的时序数据不是噪声数据的可能性较大,不连续且不重复的时序数据是噪声数据的可能性较大,因此,针对各个状态值对应的状态匹配序列,对初始时序数据模块中的损失函数进行调整,从而降低初始时序数据模型在重训练时,噪声数据对训练结果的影响,进而在重训练时序数据模型时,在保证时序数据模型重训练的实时性的基础上,达到提升时序数据模型重训练的预测准确率的效果。

在一个实施例中,损失参数为预测状态值,损失参数序列为预测状态序列,如图3所示,步骤“基于时序数据序列和预测数据序列,确定时序数据序列对应的损失参数序列”的具体实现过程,包括:

步骤S302,基于损失值算法、预测数据序列对应的各预测数据,以及时序数据序列对应的各时序数据,确定损失值序列。

其中,损失值序列包括各时序数据分别对应的损失值,损失值是基于损失函数得到的;预测数据序列包括各时序数据分别对应的预测数据;服务器通过损失值算法,可以对时序数据序列的各时序数据和预测数据序列的各预测数据计算,得到各时序数据对应的损失值,最终得到由损失值组成的损失值序列。

具体地,服务器将预测数据序列对应的各预测数据、时序数据序列对应的各时序数据输入至初始时序数据模型对应的损失函数,计算得到各时序数据对应的损失值,由各损失值组成损失值序列。

步骤S304,基于损失值序列对应的参考值,确定损失值序列对应的预测状态序列。

其中,损失参数为预测状态值,损失参数序列为预测状态序列,预测状态序列包含对各损失值分类后得到的预测状态值,各个损失值对应的预测状态值是基于损失值序列中的参考值,各个损失值分别对应匹配得到的。预测状态值是对各个损失值进行分类后得到的分类值。损失值序列对应的参考值是损失值序列中多个损失值统一的参考损失值,基于参考值可以确定各损失值的预测状态值。

具体地,服务器确定损失值序列的参考值,并基于参考值以及分类算法,对各个损失值进行分类,得到各个损失值对应的预测状态值,服务器可以基于各个损失值分别对应的预测状态值,组成预测状态序列。

可选地,基于损失值序列对应的参考值,确定损失值序列对应的预测状态序列;其中,参考值可以是损失值序列中各损失值的平均值、中位数中的至少一个。

本实施例中,通过损失函数计算时序数据序列的损失值序列,并对损失值序列分类得到预测状态序列,以作为损失参数序列,能够减少损失参数序列对应的字符串复杂度,达到提升字符串匹配效率和精度的技术手段。

在一个实施例中,如图4所示,基于损失值序列对应的参考值,确定损失值序列对应的预测状态序列的步骤,其具体实现过程,包括:

步骤S402,基于标准参数的算法以及损失值序列包含的各损失值,确定损失值序列对应的参考值。

其中,标准参数的算法用于确定损失值序列对应的参考值。

具体地,将损失值序列包含的各损失值输入至标准参数的算法,得到损失值序列对应的参考值。作为一个示例,将损失值序列包含的各损失值输入至中位数算法,得到损失值序列对应的中位数。

步骤S404,针对于多个损失值中的每一个损失值,在多个状态区间中,确定损失值对应的目标状态区间,并确定目标状态区间对应的预测状态值。

步骤S406,将多个损失值对应的预测状态值,作为损失值序列对应的预测状态序列。

其中,多个状态区间是基于至少一个状态划分阈值确定出的。状态划分阈值可以是基于参考值确定的,一个状态划分阈值可以划分至少两个范围区间,每一个范围区间表示损失值的一种状态类型,并且每一个范围区间对应一个预测状态值。

具体地,服务器在获取损失值序列对应的参考值之后,可以基于参考值设定参考值对应的多个阈值,并根据多个阈值得到多个状态区间,基于此,可以对每个状态区间的损失值确定一个对应的预测状态值。相应地,服务器可以遍历损失值序列,针对每一个损失值,服务器可以判断损失值在多个状态区间中的哪个状态区间范围,并得到损失值对应的状态区间范围,从而得到损失值对应的预测状态值,最终得到损失值序列对应的预测状态序列。

可选地,服务器将第一状态划分阈值和第二状态划分阈值作为状态区间的边界,从而确定第一状态区间、第二状态区间、第三状态区间。服务器确定第一状态区间、第二状态区间、第三状态区间各自对应的预测状态值分别为a,b,c。之后,服务器遍历n个损失值,当遍历到第i个损失值时,服务器可以在三个状态区间中,确定损失值对应的目标状态区间;若服务器确定损失值对应的目标状态区间为第一状态区间,则确定损失值对应的预测状态值是第一状态区间对应的预测状态值,即为a。服务器可以按照对多个损失值的遍历顺序,将各个损失值分别对应的预测状态值分别添加至预测状态序列中。

作为一个示例,服务器可以确定1.1倍参考值、1.3倍参考值为参考值对应的两个阈值,基于此,服务器可以确定低于1.1倍参考值的损失值为第一状态区间,确定高于1.1倍参考值的损失值,且低于1.3倍参考值的损失值为第二状态区间,确定高于1.3倍参考值的损失值为第三状态区间。

本实施例中,通过标准参数的算法计算损失值序列的参考值,并基于参考值将各个损失值分类,并得到分类后的预测状态值,能够减少预测状态序列对应的字符串复杂度,达到提升字符串匹配效率和匹配精度的技术效果。

在一个实施例中,步骤“基于字符串匹配算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果”的具体实现过程,包括:

根据字符串匹配算法,对预测状态序列中各预测状态值进行字符串匹配,得到各预测状态值分别对应的字符串匹配值,并将各字符串匹配值作为匹配结果。

其中,字符串匹配算法是在字符串中寻找该字符串对应的子串的算法,

预测状态序列可以看作一串字符串,字符串匹配算法可以在预测状态序列中匹配由预测状态值组成的子串。匹配结果是预测状态序列经过字符串匹配后得到的字符串匹配值,字符串匹配值中包含了各个预测状态值的隐含特征。基于此,匹配结果中匹配程度越高的子串,具有更规律的数据特征,而匹配程度越低的子串,具有偶发性更高的数据特征。各预测状态值分别对应的匹配结果可以表示各个预测状态值内含的隐含特征,且隐含特征用于后续步骤中调整对应的初始损失函数。

具体地,服务器根据字符串匹配算法,在预测状态序列对应的字符串中,寻找由多个预测状态值组成的子串,并得到字符串匹配值,将各字符串匹配值作为匹配结果,匹配结果中记录了预测状态序列中各个预测状态值对应的匹配程度。

在一个示例中,服务器得到预测状态序列,例如可以是“a,a,b,c,a,a,a,b,c,a”,根据字符串匹配算法,对预测状态序列中的各个预测状态值进行字符串匹配,获取字符串的前i个字符,取其开头和结尾部分的最大匹配数,若i为2,则字符为“a,a”,此时第二个a对应的字符串匹配值为1,若i为4,则字符为“a,a,b,c”,此时,没有能够匹配的字符,所以c对应的字符串匹配值为0,若i为8,则字符为“a,a,b,c,a,a,a,b”,可以得到开头和结尾部分的最大匹配数是3,其中,最大匹配数对应的字符是“a,a,b”,以此类推,当i为10时,最大匹配数为5,最终将多个字符串匹配值合并,得到匹配结果,“0,1,0,0,1,1,2,3,4,5”。

本实施例中,通过字符串匹配算法计算得到各预测状态值对应的字符串匹配值,最终确定匹配结果,达到准确地获取字符串匹配值的效果。

在一个实施例中,基于时序数据序列和预测数据序列,确定时序数据序列对应的损失参数序列的步骤,其具体实现过程,包括:

基于损失值算法、预测数据序列对应的各预测数据,以及时序数据序列对应的各时序数据,确定各时序数据对应的损失值,并将各时序数据对应的损失值,作为时序数据序列对应的损失参数序列。

其中,损失参数为损失值,损失参数序列为损失值序列。损失值序列包括各时序数据分别对应的损失值,损失值是基于损失函数得到的;预测数据序列包括各时序数据分别对应的预测数据;服务器通过损失值算法,可以对时序数据序列的各时序数据和预测数据序列的各预测数据计算,得到各时序数据对应的损失值,最终得到由损失值组成的损失值序列。

具体地,服务器将预测数据序列对应的各预测数据、时序数据序列对应的各时序数据输入至初始时序数据模型对应的损失函数,计算得到各时序数据对应的损失值,由各损失值组成损失值序列,并将损失值序列作为损失参数序列。

本实施例中,通过损失函数计算得到各时序数据对应的损失值,由各损失值组成损失值序列,并将损失值序列作为损失参数序列,能够确定各时序数据的损失值,并作为损失参数,达到高效地获取时序数据的特征的效果。

在一个实施例中,如图5所示,基于各损失参数分别对应的匹配结果,调整初始时序数据模型对应的初始损失函数,得到目标损失函数的步骤,其具体实现过程,包括:

步骤S502,根据预设的权重计算函数以及各损失参数分别对应的匹配结果,确定各损失参数对应的权重系数。

步骤S504,基于各损失参数对应的权重系数以及初始损失函数,得到目标损失函数。

其中,权重计算函数用于计算得到权重系数,作为一个示例,权重计算函数可以是修改后的Sigmoid函数,修改后的Sigmoid函数的取值范围可以是[0,1]。

具体地,服务器各损失参数分别对应的匹配结果,输入至预设的权重计算函数,分别得到各损失参数的权重系数;将各个损失参数分别对应的权重系数作为初始损失函数的权重部分,得到带有权重系数的目标损失函数,作为一个示例,将初始损失函数与权重系数求积,得到目标损失函数。

可选地,损失参数对应的匹配程度的高低与该损失参数对应的权重的大小成正相关;第一损失参数对应的第一匹配结果的匹配程度可以高于第二损失参数对应的第二匹配结果的匹配程度,因此服务器可以通过预设的权重计算函数,确定第一损失参数对应的第一权重系数大于第二损失参数对应的第二权重系数。作为一个实例,若第一匹配结果是4,第二匹配结果是1,根据修改后的Sigmoid函数,计算得到第一匹配结果对应的第一权重系数是1,第二匹配结果对应的第二权重系数是0.5,其中,修改后的Sigmoid函数是一个递增的函数。

本实施例中,通过损失函数计算得到各时序数据对应的损失值,由各损失值组成损失值序列,并将损失值序列作为损失参数序列,能够确定各时序数据的损失值,并作为损失参数,达到高效地获取时序数据的特征的效果。

在一个实施例中,基于字符串匹配算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果的步骤,其具体实现过程,包括:

基于KMP算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果。

其中,KMP算法是一种改进的字符串匹配算法。KMP算法的核心是利用匹配失败后的信息,尽量减少子串与主串的匹配次数以达到快速匹配的目的。KMP算法是在字符串中寻找该字符串对应的子串的算法,损失参数序列可以被看作一串字符串,KMP算法可以在损失参数序列中匹配由损失参数组成的子串。匹配结果是损失参数序列经过字符串匹配后得到的字符串匹配值,字符串匹配值中包含了各个损失参数的隐含特征。

具体地,服务器根据KMP算法,在损失参数序列对应的字符串中,寻找由多个损失参数组成的子串,并得到匹配结果,匹配结果中记录了损失参数序列中各个损失参数对应的匹配程度。

本实施例中,通过KMP算法得到损失参数分别对应的匹配结果,达到获取准确度高的匹配结果的效果。

如图6所示,以下结合一个具体实施例,详细描述上述时序数据模型的重训练方法的具体执行过程。

首先,本申请提出的时序数据模型的重训练过程如图6所示。其具体流程如下:

0、服务器获取终端的时序数据序列,令时序数据序列为T=T

1、固定初始时序数据模型的参数,对时序数据序列T依次进行一轮预测计算,得到预测数据序列y=y

2、将预测数据序列与时序数据序列通过损失函数或其他自定义指标计算公式,得到损失值序列l=l

3、根据损失值序列计算得到其中位数,中位数作为模型对于设备正常运行时的数据预测结果平均精度l

4、根据损失值中位数l

S=a,a,b,d,a,…,a,a,b,d,a,…

5、根据KMP算法对预测状态序列进行状态匹配,得到状态匹配序列S

S

6、使用自定义的函数对状态匹配序列赋予权重,如Sigmoid函数的变体:

从而获得权重系数序列W=w

其自定义函数的特点应表现为:对状态匹配序列的较小预测状态值赋予较低的权重,对状态匹配序列的较大预测状态值赋予较高的权重,区间应限制为[0,1]。上述Sigmoid函数的变体的图像如图7所示。

7、将权重系数序列添加到损失函数中,作为损失函数的额外权重系数,然后开始模型调优训练,得到目标时序数据模型。

本实施例所提供的时序数据模型的重训练方法,可以不引入陌生数据信号的知识,也可以不引入额外的大量计算量,便能够在噪声数据干扰的情况下,完成时序数据模型的重训练。相应地,本实施例所提供的时序数据模型的重训练方法,对时序数据的陌生数据信号检测方法改进,实现包含陌生数据信号检测的端到端的时序数据模型的重训练方法。

本实施例所提供的时序数据模型的重训练方法,还可以减少人工的工作量,提高陌生数据信号检测的准确率,并有效地抑制噪声数据对于时序数据模型的干扰,提升时序数据模型模型抗噪声干扰的能力,提升时序数据模型模型的预测准确率和精确率,以及赋予模型长期的可持续自优化的能力。

应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的时序数据模型的重训练方法的时序数据模型的重训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个时序数据模型的重训练装置实施例中的具体限定可以参见上文中对于时序数据模型的重训练方法的限定,在此不再赘述。

在一个实施例中,如图8所示,提供了一种时序数据模型的重训练装置800,包括:损失参数确定模块801、字符串匹配模块802、损失函数调整模块803和重训练模块804,其中:

损失参数确定模块,用于基于时序数据序列和预测数据序列,确定时序数据序列对应的损失参数序列;其中,时序数据序列包含按照时间顺序排列的多个时序数据,预测数据序列是将时序数据序列输入至初始时序数据模型得到的,损失参数序列包含多个损失参数,各损失参数与各时序数据一一对应;

字符串匹配模块,用于基于字符串匹配算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果;

损失函数调整模块,用于基于各损失参数分别对应的匹配结果,调整初始时序数据模型对应的初始损失函数,得到目标损失函数;

重训练模块,用于基于时序数据包含的各时序数据以及目标损失函数,对初始时序数据模型进行重训练,得到重训练完成的目标时序数据模型。

进一步地,损失参数为预测状态值,损失参数序列为预测状态序列,损失参数确定模块,具体用于:基于损失值算法、预测数据序列对应的各预测数据,以及时序数据序列对应的各时序数据,确定损失值序列,损失值序列包括各时序数据分别对应的损失值;基于损失值序列对应的参考值,确定损失值序列对应的预测状态序列;其中,预测状态序列包含对各损失值分类后得到的预测状态值。

进一步地,损失参数确定模块,具体还用于:基于标准参数的算法以及损失值序列包含的各损失值,确定损失值序列对应的参考值;针对于多个损失值中的每一个损失值,在多个状态区间中,确定损失值对应的目标状态区间,并确定目标状态区间对应的预测状态值,多个状态区间是基于至少一个状态划分阈值确定出的;将多个损失值对应的预测状态值,作为损失值序列对应的预测状态序列。

进一步地,字符串匹配模块,具体用于:根据字符串匹配算法,对预测状态序列中各预测状态值进行字符串匹配,得到各预测状态值分别对应的字符串匹配值,并将各字符串匹配值作为匹配结果。

进一步地,损失参数确定模块,具体还用于:基于损失值算法、预测数据序列对应的各预测数据,以及时序数据序列对应的各时序数据,确定各时序数据对应的损失值,并将各时序数据对应的损失值,作为时序数据序列对应的损失参数序列。

进一步地,损失函数调整模块,具体用于:根据预设的权重计算函数以及各损失参数分别对应的匹配结果,确定各损失参数对应的权重系数;基于各损失参数对应的权重系数以及初始损失函数,得到目标损失函数。

进一步地,字符串匹配模块,具体还用于:基于KMP算法,对损失参数序列中各损失参数进行字符串匹配,得到各损失参数分别对应的匹配结果。

上述时序数据模型的重训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储物联网设备的时序数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种时序数据模型的重训练方法。

本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 信号时序配置方法、装置、计算机设备及存储介质
  • 机器学习模型训练方法、装置、存储介质和计算机设备
  • 语句输出、模型训练方法、装置、计算机设备及存储介质
  • 尿检识别分类器的构造训练方法、装置及计算机设备
  • 一种模型训练方法、装置、及计算机设备
  • 一种数据模型的训练方法、装置、及计算机设备
  • 一种数据模型的训练方法、装置、及计算机设备
技术分类

06120116486816