掌桥专利:专业的专利平台
掌桥专利
首页

时间序列数据相似性确定方法、装置、设备及存储介质

文献发布时间:2023-06-19 13:29:16


时间序列数据相似性确定方法、装置、设备及存储介质

技术领域

本申请涉及计算机应用技术领域,特别是涉及一种时间序列数据相似性确定方法、装置、设备及存储介质。

背景技术

时间序列,或称动态数列是指将同一统计指标的数值按其发生时间的先后顺序排列而成的数列。时间序列数据是一类较为常见的数据,如商品日均价构成的时间序列数据,或者,在基站各小区采集到的终端信号构成的时间序列数据。根据观察时间的不同,时间序列数据中的时间可以是年份、季度、月份或其他任何时间形式。

在很多情况下,如在评价两个商品价格走势是否一致时,可以对相应的时间序列数据进行形态比较,确定相似性。

目前,多是基于欧几里得距离的相似度计算,确定两个时间序列数据的相似性。这种方式存在一定的局限性,其要求两个时间序列数据的长度必须相同,如果两个时间序列数据的长度不同,则将无法进行相似性的确定。所以,如何对时间序列数据的相似性进行准确、有效地确定,是目前本领域技术人员急需解决的技术问题。

发明内容

本申请的目的是提供一种时间序列数据相似性确定方法、装置、设备及存储介质,准确、有效地确定时间序列数据的相似性。

为解决上述技术问题,本申请提供如下技术方案:

一种时间序列数据相似性确定方法,包括:

获得第一时间序列数据和第二时间序列数据;

利用第一自编码器模型将所述第一时间序列数据映射到第一抽象特征空间,获得所述第一时间序列数据的第一抽象特征;

利用第二自编码器模型将所述第二时间序列数据映射到第二抽象特征空间,获得所述第二时间序列数据的第二抽象特征;

基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性;

其中,所述第一抽象特征空间和所述第二抽象特征空间的维度相同。

在本申请的一种具体实施方式中,通过以下步骤训练获得第一自编码器模型:

确定所述第一抽象特征空间的维度;

确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,并构建第一编码函数和第一解码函数;所述第一编码过程的最后一个第一隐藏层的输出维度、所述解码过程的第一个第一隐藏层的输入维度和所述抽象特征空间的维度相同;

利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,并在训练过程中,对所述第一隐藏层的层数及输入输出维度进行调整。

在本申请的一种具体实施方式中,所述利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,包括:

通过最小化损失函数,利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练。

在本申请的一种具体实施方式中,通过以下步骤训练获得第二自编码器模型:

确定所述第二抽象特征空间的维度;

确定第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度,并构建第二编码函数和第二解码函数;所述第二编码过程的最后一个第二隐藏层的输出维度、所述解码过程的第一个第二隐藏层的输入维度和所述抽象特征空间的维度相同;

利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练,并在训练过程中,对所述第二隐藏层的层数及输入输出维度进行调整。

在本申请的一种具体实施方式中,所述利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练,包括:

通过最小化损失函数,利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练。

在本申请的一种具体实施方式中,所述基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性,包括:

计算所述第一抽象特征和所述第二抽象特征的欧氏距离;

根据所述欧氏距离,确定所述第一时间序列数据和所述第二时间序列数据的相似性。

在本申请的一种具体实施方式中,所述根据所述欧氏距离,确定所述第一时间序列数据和所述第二时间序列数据的相似性,包括:

如果所述欧氏距离小于预设距离阈值,则确定所述第一时间序列数据和所述第二时间序列数据相似;

如果所述欧氏距离大于或等于所述距离阈值,则确定所述第一时间序列数据和所述第二时间序列数据不相似。

一种时间序列数据相似性确定装置,包括:

数据获得模块,用于获得第一时间序列数据和第二时间序列数据;

第一抽象特征获得模块,用于利用第一自编码器模型将所述第一时间序列数据映射到第一抽象特征空间,获得所述第一时间序列数据的第一抽象特征;利用第二自编码器模型将所述第二时间序列数据映射到第二抽象特征空间,获得所述第二时间序列数据的第二抽象特征;

相似性确定模块,用于基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性;

其中,所述第一抽象特征空间和所述第二抽象特征空间的维度相同。

一种时间序列数据相似性确定设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现上述任一项所述的时间序列数据相似性确定方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的时间序列数据相似性确定方法的步骤。

应用本申请实施例所提供的技术方案,利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,得到第一时间序列数据的第一抽象特征,利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,得到第二时间序列数据的第二抽象特征。因为第一抽象特征空间和第二抽象特征空间的维度相同,所以获得的第一抽象特征和第二抽象特征的维度也相同。基于维度相同的第一抽象特征和第二抽象特征,可以准确、有效地确定第一时间序列数据和第二时间序列数据的相似性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例中一种时间序列数据相似性确定方法的实施流程图;

图2为本申请实施例中自编码器模型的训练过程的一种示意图;

图3为本申请实施例中自编码器模型的训练过程的另一种示意图;

图4为本申请实施例中时间序列数据的具体示例示意图;

图5为本申请实施例中一种时间序列数据相似性确定装置的结构示意图;

图6为本申请实施例中一种时间序列数据相似性确定设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

参见图1所示,为本申请实施例所提供的一种时间序列数据相似性确定方法的实施流程图,该方法可以包括以下步骤:

S110:获得第一时间序列数据和第二时间序列数据。

在本申请实施例中,第一时间序列数据和第二时间序列数据可以为待进行相似性确定的任意两个时间序列数据,不限定序列长度。

如,在商品价格走势的一致性确定中,第一时间序列数据可以为商品1在一个月内的每日均价构成的数据,第二时间序列数据可以为商品2在15天内的每日均价构成的数据。再如,在对基站的同一小区不同指标的研究中,需要对不同指标历史趋势的相似性进行分析时,第一时间序列数据可以为在一天内按照1秒钟的采集间隔采集到的指标1的数据,第二时间序列数据可以为在一天内按照1分钟的采集间隔采集到的指标2的数据。

在例举的这两个例子中,第一时间序列数据和第二时间序列数据的长度不同。当然,获得的第一时间序列数据和第二时间序列数据的长度也可以相同。本申请实施例对此不做限制。

S120:利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征。

在本申请实施例中,可以预先训练获得第一自编码器模型。

自编码器(AutoEncoder,AE),是一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks,ANNs),其功能是通过将输入数据作为学习目标,对输入数据进行表征学习(representation learning)。自编码器是一种人工神经网络,用于以无监督的方式学习有效的数据编码。自编码器包含编码(encoder)和解码(decoder)两个过程。编码过程中可以建立一个或多个隐藏层,以得到输入数据的低维向量。解码过程可以通过隐藏层的低维向量重构数据。编码过程和解码过程可以理解为有损的压缩与解压。

在获得第一时间序列数据后,可以利用第一时间序列数据训练获得第一自编码器模型,或者在获得第一时间序列数据后,获得第一时间序列数据对应的历史时间序列数据,利用历史时间序列数据训练获得第一自编码器模型。

利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,可以获得第一时间序列数据的第一抽象特征。

S130:利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征。

在本申请实施例中,可以预先训练获得第二自编码器模型。

在获得第二时间序列数据后,可以利用第二时间序列数据训练获得第二自编码器模型,或者在获得第二时间序列数据后,获得第二时间序列数据对应的历史时间序列数据,利用历史时间序列数据训练获得第二自编码器模型。

利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,可以获得第二时间序列数据的第二抽象特征。

S140:基于第一抽象特征和第二抽象特征,确定第一时间序列数据和第二时间序列数据的相似性。

在本申请实施例中,第一抽象特征空间和第二抽象特征空间的维度相同。利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征,并利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征后,因为第一抽象特征空间和第二抽象特征空间的维度相同,所以第一抽象特征和第二抽象特征的维度是相同的。

基于第一抽象特征和第二抽象特征,可以确定第一时间序列数据和第二时间序列数据的相似性。具体的,因为第一抽象特征和第二抽象特征的维度是相同的,所以可以按照传统的相似性度量方式确定第一抽象特征和第二抽象特征的相似性,从而确定出第一时间序列数据和第二时间序列数据的相似性。

应用本申请实施例所提供的方法,利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,得到第一时间序列数据的第一抽象特征,利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,得到第二时间序列数据的第二抽象特征。因为第一抽象特征空间和第二抽象特征空间的维度相同,所以获得的第一抽象特征和第二抽象特征的维度也相同。基于维度相同的第一抽象特征和第二抽象特征,可以准确、有效地确定第一时间序列数据和第二时间序列数据的相似性。

在本申请的一个实施例中,可以通过以下步骤训练获得第一自编码器模型:

步骤一:确定第一抽象特征空间的维度;

步骤二:确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,并构建第一编码函数和第一解码函数;第一编码过程的最后一个第一隐藏层的输出维度、解码过程的第一个第一隐藏层的输入维度和抽象特征空间的维度相同;

步骤三:利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练,并在训练过程中,对第一隐藏层的层数及输入输出维度进行调整。

为方便描述,将上述三个步骤结合起来进行说明。

如图2、图3所示,自编码器模型的总体训练过程可以是,在编码过程中,会建立一个或多个隐藏层,通过编码函数对输入数据x进行降维,将输入数据映射到抽象特征空间z。然后在解码过程中,通过解码函数将抽象特征z映射回原始空间得到重构数据x'。通过最小化损失函数,可以对编码函数和解码函数的参数进行训练,对隐藏层层数及输入输出维度进行调整。

在本申请实施例中,可以先确定第一抽象特征空间的维度,该维度可以设定为任意值,可以根据实际情况进行设定和调整,只要确定的第一抽象特征空间的维度与第二抽象特征空间的维度相同即可。

然后确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,可以基于初始值进行确定,第一编码过程的最后一个第一隐藏层的输出维度、解码过程的第一个第一隐藏层的输入维度和抽象特征空间的维度相同。第一编码过程和第一解码过程的激活函数可以为sigmoid函数。基于此,可以构建第一编码函数和第一解码函数。

获得第一时间序列数据对应的第一训练数据集,第一训练数据集中的数据可以包括第一时间序列数据,还可以包括第一时间序列数据对应的历史时间序列数据,如第一时间序列数据为近一周内商品1的日均价构成的数据,其对应的历史时间序列数据可以有多个,可以是近一个月内,每周商品1的日均价构成的数据。利用第一训练数据集对第一编码函数和第一解码函数的参数进行训练。在训练过程中,可以对第一隐藏层的层数及输入输出维度进行调整。在满足设定条件的情况下,获得第一自编码器模型。

在本申请的一种具体实施方式中,可以通过最小化损失函数,利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练。

损失函数(loss function),也可称为代价函数(cost function),是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在应用中,可以通过最小化损失函数求解和评估模型。

通过损失函数,对第一编码函数和第一解码函数的参数进行训练,并在训练过程中根据损失函数的大小不断调整第一隐藏层的层数及输入输出维度,直到损失函数最小化,得到第一自编码器模型。损失函数可以为均方误差函数。

利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练,并在训练过程中,对第一隐藏层的层数及输入输出维度进行调整,可以得到适合于第一时间序列数据的第一自编码器模型,从而利用第一自编码器模型可以将第一时间序列数据映射到第一抽象特征空间,得到第一抽象特征。

在本申请的一个实施例中,可以通过以下步骤训练获得第二自编码器模型:

第一个步骤:确定第二抽象特征空间的维度;

第二个步骤:确定第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度,并构建第二编码函数和第二解码函数;第二编码过程的最后一个第二隐藏层的输出维度、解码过程的第一个第二隐藏层的输入维度和抽象特征空间的维度相同;

第三个步骤:利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练,并在训练过程中,对第二隐藏层的层数及输入输出维度进行调整。具体的,可以通过最小化损失函数,利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练。

在本申请实施例中,对于第二自编码器模型的训练与第一自编码器模型的训练过程可以相互参考,不再赘述。

不同自编码器模型均利用相应的时间序列数据进行训练,且第一自编码器模型的第一抽象特征空间与第二自编码器模型的第二抽象特征空间的维度一致。

利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练,并在训练过程中,对第二隐藏层的层数及输入输出维度进行调整,可以得到适合于第二时间序列数据的第二自编码器模型,从而利用第二自编码器模型可以将第二时间序列数据映射到第二抽象特征空间,得到第二抽象特征。

本申请实施例对于自编码器模型的训练过程无需使用训练数据的标签,本质上是把训练数据同时作为自编码器模型的输入和输出,通过最小化重构误差希望学习到训练数据的抽象特征。这种无监督的训练方式提升了自编码器模型的通用性。对于基于神经网络的自编码器模型来说,是其编码部分通过逐层降低神经元个数来对数据进行压缩,解码部分基于数据的抽象表示逐层提升神经元数量,最终实现对输入数据的重构。

在本申请的一个实施例中,基于第一抽象特征和第二抽象特征,确定第一时间序列数据和第二时间序列数据的相似性,可以包括以下步骤:

步骤一:计算第一抽象特征和第二抽象特征的欧氏距离;

步骤二:根据欧氏距离,确定第一时间序列数据和第二时间序列数据的相似性。

为方便描述,将上述两个步骤结合起来进行说明。

利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征,利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征后,因为第一抽象特征空间和第二抽象特征空间的维度相同,所以,第一抽象特征和第二抽象特征的维度也相同。

可以基于欧几里得距离的相似度计算方法,计算第一抽象特征和第二抽象特征的欧氏距离。然后根据欧氏距离,确定第一时间序列数据和第二时间序列数据的相似性。

具体的,如果欧氏距离小于预设距离阈值,则确定第一时间序列数据和第二时间序列数据相似,如果欧氏距离大于或等于距离阈值,则确定第一时间序列数据和第二时间序列数据不相似。

距离阈值可以根据实际情况进行设定和调整。

本申请实施例利用自编码器模型对需要进行相似性确定的两个时间序列数据进行重构,在重构的过程中保证抽象特征空间的维度一致。通过计算两个抽象特征的欧氏距离,衡量对应的两个时间序列数据的相似性,可以有效、准确地确定出两个时间序列数据的相似性,且不受时间序列数据的长度的限制。

为方便理解,基于具体示例对本申请实施例进行说明。

假设第一时间序列数据为x={x

1)确定第一抽象特征空间的维度,假设为3;

2)确定第一编码过程中第一隐藏层的层数及输入输出维度,假设第一隐藏层的层数为2,第一个第一隐藏层的输入维度和输出维度分别为数据维度和24,其中,对于第一时间序列数据而言,其数据维度为m,对于第二时间序列数据而言,其数据维度为n,第二个第一隐藏层的输入维度和输出维度分别为24和3;

3)确定第一解码过程中第一隐藏层的层数及维度,可以设定第一解码过程中第一隐藏层层数与第一编码过程中隐藏层层数相等,第一解码过程中输入输出维度与第一编码过程正好相反。假设第一隐藏层的层数为2,第一个第一隐藏层的输入维度和输出维度分别为3和24,第二个第一隐藏层的输入维度和输出维度分别为24和数据维度;

4)设定损失函数为均方误差(mean squared error,MSE),公式如下:

5)对于第一时间序列数据x={x

构建第一解码函数:

z

其中,W表示权重,b表示误差,σ表示激活函数。

6)根据损失函数利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练:

arg min MSE(z

7)根据损失函数的大小不断调整第一隐藏层的层数及输入输出维度,重复上述5)-7)的过程,直到得到最小的MSE。在这个过程中需固定第一抽象特征空间的维度,编码过程中最后一个第一隐藏层的输出维度与解码过程中第一个第一隐藏层的输入维度均与第一抽象特征空间的维度相同;

8)训练结束后,得到第一自编码器模型。如果直接利用第一时间序列数据进行模型训练,则在训练结束后,即可得到第一时间序列数据的第一抽象特征

同样可以参照1)-3)的过程确定第二抽象特征空间的维度、第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度。

9)对于第二时间序列数据y={y

构建第二解码函数:

z

10)根据损失函数利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练:

min MSE(z

11)根据损失函数的大小不断调整第二隐藏层的层数及输入输出维度,重复9)-11)的过程,直到得到最小的MSE。在这个过程中需固定第二抽象特征空间的维度,编码过程中最后一个第二隐藏层的输出维度与解码过程中第一个第二隐藏层的输入维度均与第二抽象特征空间的维度相同;

12)训练结束后,得到第二自编码器模型。如果直接利用第二时间序列数据进行模型训练,则在训练结束后,即可得到第二时间序列数据的第二抽象特征

13)得到第一抽象特征

图4所示为三个时间序列数据,时间序列数据1、时间序列数据2、时间序列数据3的曲线示意图,应用本申请实施例所提供的技术方案对这三个时间序列数据进行抽象特征空间的映射,得到的抽象特征分别为:h

抽象特征的欧几里得空间的L

从欧式距离的结果可以看出,时间序列数据1、2最相似,时间序列数据1、3最不相似。

本申请实施例利用自编码器模型可以对需要确定相似性的两个时间序列数据进行重构,在重构的过程中保证抽象特征空间的维度一致。然后通过计算两个抽象特征的欧几里得距离,来衡量两个时间序列数据的相似性。本申请实施例的技术方案适应于任意长度的时间序列数据的相似性确定,对于趋势完全相同但时间错位的时间序列数据,得到的相似值较小。

相应于上面的方法实施例,本申请实施例还提供了一种时间序列数据相似性确定装置,下文描述的时间序列数据相似性确定装置与上文描述的时间序列数据相似性确定装置方法可相互对应参照。

参见图5所示,该装置可以包括以下模块:

数据获得模块510,用于获得第一时间序列数据和第二时间序列数据;

抽象特征获得模块520,用于利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征;利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征;

相似性确定模块530,用于基于第一抽象特征和第二抽象特征,确定第一时间序列数据和第二时间序列数据的相似性;

其中,第一抽象特征空间和第二抽象特征空间的维度相同。

应用本申请实施例所提供的装置,利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,得到第一时间序列数据的第一抽象特征,利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,得到第二时间序列数据的第二抽象特征。因为第一抽象特征空间和第二抽象特征空间的维度相同,所以获得的第一抽象特征和第二抽象特征的维度也相同。基于维度相同的第一抽象特征和第二抽象特征,可以准确、有效地确定第一时间序列数据和第二时间序列数据的相似性。

在本申请的一种具体实施方式中,还包括第一模型训练模块,用于通过以下步骤训练获得第一自编码器模型:

确定第一抽象特征空间的维度;

确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,并构建第一编码函数和第一解码函数;第一编码过程的最后一个第一隐藏层的输出维度、解码过程的第一个第一隐藏层的输入维度和抽象特征空间的维度相同;

利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练,并在训练过程中,对第一隐藏层的层数及输入输出维度进行调整。

在本申请的一种具体实施方式中,第一模型训练模块,用于:

通过最小化损失函数,利用第一时间序列数据对应的第一训练数据集对第一编码函数和第一解码函数的参数进行训练。

在本申请的一种具体实施方式中,还包括第二模型训练模块,用于通过以下步骤训练获得第二自编码器模型:

确定第二抽象特征空间的维度;

确定第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度,并构建第二编码函数和第二解码函数;第二编码过程的最后一个第二隐藏层的输出维度、解码过程的第一个第二隐藏层的输入维度和抽象特征空间的维度相同;

利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练,并在训练过程中,对第二隐藏层的层数及输入输出维度进行调整。

在本申请的一种具体实施方式中,第二模型训练模块,用于:

通过最小化损失函数,利用第二时间序列数据对应的第二训练数据集对第二编码函数和第二解码函数的参数进行训练。

在本申请的一种具体实施方式中,相似性确定模块530,用于:

计算第一抽象特征和第二抽象特征的欧氏距离;

根据欧氏距离,确定第一时间序列数据和第二时间序列数据的相似性。

在本申请的一种具体实施方式中,相似性确定模块530,用于:

如果欧氏距离小于预设距离阈值,则确定第一时间序列数据和第二时间序列数据相似;

如果欧氏距离大于或等于距离阈值,则确定第一时间序列数据和第二时间序列数据不相似。

相应于上面的方法实施例,本申请实施例还提供了一种时间序列数据相似性确定设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行计算机程序时实现上述时间序列数据相似性确定方法的步骤。

如图6所示,为时间序列数据相似性确定设备的组成结构示意图,时间序列数据相似性确定设备可以包括:处理器10、存储器11、通信接口12和通信总线13。处理器10、存储器11、通信接口12均通过通信总线13完成相互间的通信。

在本申请实施例中,处理器10可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路、数字信号处理器、现场可编程门阵列或者其他可编程逻辑器件等。

处理器10可以调用存储器11中存储的程序,具体的,处理器10可以执行时间序列数据相似性确定方法的实施例中的操作。

存储器11中用于存放一个或者一个以上程序,程序可以包括程序代码,程序代码包括计算机操作指令,在本申请实施例中,存储器11中至少存储有用于实现以下功能的程序:

获得第一时间序列数据和第二时间序列数据;

利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征;

利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征;

基于第一抽象特征和第二抽象特征,确定第一时间序列数据和第二时间序列数据的相似性;

其中,第一抽象特征空间和第二抽象特征空间的维度相同。

在一种可能的实现方式中,存储器11可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及至少一个功能(比如模型调用功能、计算功能)所需的应用程序等;存储数据区可存储使用过程中所创建的数据,如抽象特征数据、相似性结果数据等。

此外,存储器11可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。

通信接口12可以为通信模块的接口,用于与其他设备或者系统连接。

当然,需要说明的是,图6所示的结构并不构成对本申请实施例中时间序列数据相似性确定设备的限定,在实际应用中时间序列数据相似性确定设备可以包括比图6所示的更多或更少的部件,或者组合某些部件。

相应于上面的方法实施例,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述时间序列数据相似性确定方法的步骤。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

相关技术
  • 时间序列数据相似性确定方法、装置、设备及存储介质
  • 图像相似性确定方法、装置、电子设备及可读存储介质
技术分类

06120113692486