掌桥专利:专业的专利平台
掌桥专利
首页

高信噪比时间序列的基线检测方法、设备及存储介质

文献发布时间:2023-06-19 09:51:02


高信噪比时间序列的基线检测方法、设备及存储介质

技术领域

本申请涉及时间序列的基线检测技术领域,具体涉及一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质。

背景技术

随着计算机、数据处理和传感技术的发展,越来越多的智能设备(传感器)被应用到现实生活中。这些设备在给我们提供便利的同时,也按照时间的顺序记录着主体的活动。这些数字化的记录被称为时间序列。时间序列在金融、智慧城市、智慧物流等关注时效规律的领域都发挥着极其重要的作用。使用时间序列进行模式识别或预测时,最大的挑战是来自环境因素的干扰(基线漂移)。如图1所示,时间序列的基线检测会受到大尺度及中尺度的干扰而使得检测出的基线与实际的时间序列之间距有相当程度的飘移/误差。

目前也有许多检测技术,例如中值滤波(Median Filter)方法、迭代多项式拟合方法及求导方法等,运用在时间序列的基线检测上,但是这些方法都不适用于信噪比(Signal-to-Noise Ratio(SNR))高或存在多尺度模式的时间序列。此外,以图2所示,在相同的窗口的时间序列,利用不同的数据特征(例如,如最小值、中值及均值)来提取时间系列的基线也有相当差异。均值基线及中值基线赋予窗口中所有的数据点相同的权值,也就是不对基线与波峰上的数据点区别对待,波峰上的数据点会影响中值及均值,因此均值基线及中值基线无法稳地的呈现信噪比高的时间序列的实际状态。同样地,当所有的波峰都向上时,最小值基线才稳定,一旦遇到双向混合波峰(波峰及波谷),最小值基线也无法呈现时间序列的实际状态。

为了克服现有方法存在的问题,需要一种针对高信噪比时间序列的基线检测方法及设备。

发明内容

本申请实施例提供一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质,根据数据的概率密度分布,对有实际意义的数据点及噪音点进行了有效的区分。本申请实施例适用于高信噪比时间序列的基线检测及自动校正,具有较高的现实应用价值。

第一方面,本申请实施例提供了一种高信噪比时间序列的基线检测方法,包括:

通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;

连接相邻滑动窗口的子序列基线,以获取初步基线模型;及

根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。

在一些实施方式中,所述通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线包括:

通过最小描述长度(MDL)来自动设置滑动窗口长度,将所述原始时间序列划分为所述多个子序列;及

通过核密度估计法(KDE)来分析每一个所述子序列中的数据点,以获得核平滑概率密度分布,所述核平滑概率密度分布包括多个波峰,其中振幅最大的波峰为概率密度最高的点,选定所述概率密度最高的点作为每一个所述子序列的所述子序列基线。

在一些实施方式中,所述连接相邻滑动窗口的子序列基线,以获取初步基线模型包括:

通过最小描述长度(MDL)来计算跨度值,并且根据所述跨度值移动所述滑动窗口;及

通过线性插值连接所述相邻滑动窗口的子序列基线。

在一些实施方式中,所述根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型包括:

延长所述相邻滑动窗口的两个子序列各自的所述子序列基线,以形成两个虚拟子序列基线;

定义所述两个虚拟子序列基线与所述原始时间序列的交点中最相邻的两个为两个转折点,所述两个子序列与所述各自的转折点形成两个更正后子序列;

获取两个更正后子序列基线,并且所述两个转折点之间,以相对应的所述原始时间序列作为转折点基线;及

连接所述两个更正后子序列基线及所述转折点基线,以形成更正后基线模型。

在一些实施方式中,所述高信噪比时间序列的基线检测方法,更包括:

将时间序列在前的第一子序列的所述子序列基线往后延长一个所述滑动窗口长度,以形成第一虚拟子序列基线,及将时间序列在后的第二子序列的所述子序列基线往前延长一个所述滑动窗口长度,以形成一第二虚拟子序列基线;

定义所述第一虚拟子序列基线与所述原始时间序列的最后交点为第一转折点,及定义所述第二虚拟子序列基线与所述原始时间序列的最前交点为第二转折点,其中所述第一子序列与所述第一转折点形成第一更正后子序列,所述第二子序列与所述第二转折点形成第二更正后子序列;

获取所述第一更正后子序列及所述第二更正后子序列各自的第一更正后子序列基线及第二更正后子序列基线,并且所述第一转折点与所述第二转折点之间,以相对应的所述原始时间序列作为转折点基线;及

连接所述第一更正后子序列基线、所述第二更正后子序列基线及所述转折点基线,以形成所述更正后基线模型。

在一些实施方式中,所述阈值为所述子序列的绝对斜率的均值加/减一倍标准差的和。

在一些实施方式中,所述高信噪比时间序列的基线检测方法,还包括:

将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。

第二方面,本申请实施例还提供了一种高信噪比时间序列的基线检测设备,包括处理器及储存器,所述处理器调用所述储存器中的计算机程序以执行本申请实施例提供的任一种高信噪比时间序列的基线检测方法。

在一些实施方式中,所述计算机程序包括:

基线识别模块,用以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;

基线建模模块,用以连接相邻通过滑动窗口的子序列基线,以获取初步基线模型;

基线更正模块,根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型;

基线消除模块,用以将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。

第三方面,本申请还提供一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序适于处理器进行加载,以执行本申请实施例提供的任一种高信噪比时间序列的基线检测方法。

本申请实施例基于MDL的最多穿越法,将时间序列分割成小的子序列,并且对每个子序列进行概率密度分析,以获取子序列的基线。接着把相邻子序列的基线通过线性插值方法连接起来,从而得到整个时间序列的初步基线模型。借助相邻滑动窗口的绝对斜率的密度分布,自动设置阈值,来触发初步基线模型的基线更正操作,以解决其中可能存在的边界问题。藉此,本申请实施例可以对有实际意义的数据点及噪音点进行有效的区分,适用于高信噪比时间序列的基线检测及自动校正。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是多尺度干扰因素对时间序列的基线所造成的飘移现象;

图2是利用不同的数据特征所提取的时间序列的基线的差异;

图3是本申请实施例提供的高信噪比时间序列的基线检测方法的流程示意图;

图4是本申请实施例中所获得的核平滑概率密度分布的示意图;

图5a及图5b是本申请实施例中局部时间序列的初步基线模型及更正后基线模型;

图6a及图6b是本申请实施例中更正初步基线模型的时机;

图7是本申请实施例中更正初步基线模型的操作示意;

图8是根据申请实施例提供的高信噪比时间序列的基线检测方法所提取的时间序列的基线。

图9是本申请实施例提供的高信噪比时间序列的基线检测设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参阅图3至图8,图3是本申请实施例提供的高信噪比时间序列的基线检测方法的流程示意图。图4是本申请实施例中所获得的核平滑概率密度分布的示意图。图5a及图5b是本申请实施例中局部时间序列的初步基线模型及更正后基线模型。图6a及图6b是本申请实施例中更正初步基线模型的时机。图7是本申请实施例中更正初步基线模型的操作示意。图8是根据申请实施例提供的高信噪比时间序列的基线检测方法所提取的时间序列的基线。

所述高信噪比时间序列的基线检测方法的执行主体可以是本申请实施例提供的高信噪比时间序列的基线检测设备。如图3所示,所述高信噪比时间序列的基线检测方法可以包括:

步骤S110、通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;

步骤S120、连接相邻滑动窗口的子序列基线,以获取初步基线模型;以及

步骤S130、根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。

透过分析所述多个子序列,并且连接所述多个子序列各自的子序列基线,可以获得所述初步基线模型。这样一来,可以避免如图1所示,因中尺度干扰或大尺度干扰所造成的大幅度基线飘移。随后透过所述阈值来辨别干扰发生时机,进而更正所述初步基线模型。

所述子序列数量会影响所述初步基线模型的精准度及或获取初步基线模型所耗费的时间(例如所述子序列数量多,所获取的所述初步基线模型的精准度较高,但是需要耗费较多的时间)。因此,为了精准且有效率的划分所述原始时间序列,如图3所示,步骤S110还可以包括:

步骤S112、通过最小描述长度(Minimum Description Length,MDL)来自动设置滑动窗口长度,将所述原始时间序列划分为所述多个子序列;以及

步骤S114、通过核密度估计法(Kernel Density Estimation,KDE)来分析每一个所述子序列中的数据点,以获得核平滑概率密度分布,所述核平滑概率密度分布包括多个波峰,其中振幅最大的波峰为概率密度最高的点,选定所述概率密度最高的点作为每一个所述子序列的所述子序列基线。

在步骤S112中,通常来说,现有技术的分段方法大多根据经验来设置所述滑动窗口长度,而本申请实施例可以透过MDL来自动设定所述滑动窗口长度。根据最小描述长度(MDL)的理论,时间序列T最佳的实例模型IM是能使编码总和L(IM)+L(T/IM)最小的那个。其中,L(IM)是实例模型的描述成本,以位(Bit)为单位;L(T/IM)是去除实例模型能够表示的部分后,时间序列中剩余成分的描述成本,也是以位(Bit)为单位。一般来说,一个复杂的实例模型,能够从目标时间序列中捕捉到更多的细节,从而降低L(T/IM)的描述成本。但是,复杂的模型也意味着高的实例模型成本。因此,总体描述成本促使我们在模型的精确度和复杂度之间做出权衡。意即,步骤S112,透过MDL可以获得机兼具精确度及成本控制的所述滑动窗口长度。

在步骤S114中,所述核密度估计法KDE

其中,K代表核函数、h代表代表平滑参数(也叫带宽)、x

其中的f选用正态分布N(μ,σ

基于上述最优带宽及正态分布,可以获得所述核平滑概率密度分布,如图4所示。其中振幅最大的波峰就是代表对应的所述子序列中最多的穿越点,而且对应最多的穿越点的数值即作为所述子序列的基线常量。如此一来,步骤S114可以避免如图2所示的问题,让所述原始时间序列的实际状态可以完整地呈现。

在步骤S120中、连接相邻滑动窗口的子序列基线,以获取初步基线模型。一般来说可以通过逐点移动所述滑动窗口,便可得到整个所述原始时间序列的基线。但是,这种操作(逐点移动)非常费时,为了更高效地完成基线探测,其中步骤S120还可以包括:

步骤S122、通过最小描述长度(MDL)来计算跨度值,并且根据所述跨度值移动所述滑动窗口。透过MDL所述算出的所述跨度值,可以让所述滑动窗口的移动更有效率。

步骤S124、通过线性插值连接所述相邻滑动窗口的子序列基线。藉此,解决步骤S122可能会产生的子序列基线不连续问题。

如此一来,不需要逐点移动所述滑动窗口,可以更有效率地获得所述初步基线模型。此外,这样的方法并不对基线的形状或功能形式作任何假设,并且即便信噪比较高时,这样的方法也有较好的表现。

在步骤S130中、根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。在现有技术中,所述阈值是根据经验进行人为指定的,可能会受到使用者经验影响而产生误差。而本申请实施例基于绝对斜率的概率密度分布,提出一种智能的阈值选取方法。如图6a及图6b所示,当干扰发生时(例如图6a中的中尺度干扰发生时),图6b中对应的斜率会会明显地高于斜率均值。本申请实施例设定所述阈值为所述子序列的绝对斜率的均值加/减一倍标准差的和。意即当所述子序列的绝对斜率大于所述阈值时,即有干扰产生,这样的干扰会使产生干扰的所述子序列基线与所述原始的时间基线之间发生飘移,如图5a所示,因此,需要调整产生干扰的所述子序列基线来更正所述初步基线模型。应当理解的是,本文中所提到的绝对斜率指的是斜率的绝对值。

因此,为了更正所述初步基线模型,其中步骤S130还可以包括:

步骤S132、延长所述相邻滑动窗口的两个子序列各自的所述子序列基线,以形成两个虚拟子序列基线;

步骤S134、定义所述两个虚拟子序列基线与所述原始时间序列的交点中最相邻的两个为两个转折点,所述两个子序列与所述各自的转折点形成两个更正后子序列;

步骤S136、获取两个更正后子序列基线,并且所述两个转折点之间,以相对应的所述原始时间序列作为转折点基线;以及

步骤S138、连接所述两个更正后子序列基线及所述转折点基线,以形成更正后基线模型。

藉此,可以成功地解决相邻的所述子序列基线之间的边界问题,如图5a中的局部时间序列的所述初步基线模型可以调整为如图5b中的更正后基线模型。

以下将以图7为例,详细的说明更正所述初步基线模型的操作。如图7所示,所述初步基线模型干扰发生的相邻的所述子序列基线有边界问题。也就是时间序列在前的第一子序列的子序列基线TB1的数据点A及时间序列在后的第二子序列的子序列基线TB2的数据点D与所述原始时间序列有误差。

为了修正这样的误差,本申请实施例将时间序列在前的第一子序列的所述子序列基线TB1往后延长一个所述滑动窗口长度,以形成第一虚拟子序列基线VB1,及将时间序列在后的第二子序列的所述子序列基线TB2往前延长一个所述滑动窗口长度,以形成一第二虚拟子序列基线VB2。

定义所述第一虚拟子序列基线VB1与所述原始时间序列的最后交点为第一转折点(即数据点B),及定义所述第二虚拟子序列基线VB2与所述原始时间序列的最前交点为第二转折点(即数据点C),其中所述第一子序列与所述第一转折点(即数据点B)形成第一更正后子序列,所述第二子序列与所述第二转折点(即数据点B)形成第二更正后子序列。

获取所述第一更正后子序列及所述第二更正后子序列各自的第一更正后子序列基线及第二更正后子序列基线,并且所述第一转折点与所述第二转折点之间,以相对应的所述原始时间序列作为转折点基线。

连接所述第一更正后子序列基线、所述第二更正后子序列基线及所述转折点基线,以形成所述更正后基线模型。如图8所示,所述更正后基线模型可以更贴近所述原始时间序列,解决现有技术会面临的飘移/误差问题,也可以呈现时间序列的实际状态。

此外,本申请实施例还可以将所述多个子序列基线、所述初步基线模型从原始时间序列上消除。如此一来,可以让所述原始时间序列及所述更正后基线模型更清晰以利于判读。应当理解的是,为了更清晰的呈现所述原始时间序列也可以删除所述更正后基线模型。

为了更好地实施本申请实施例提供的所述高信噪比时间序列的基线检测方法,本申请实施例还提供一种高信噪比时间序列的基线检测设备,其中名词的含义与前述的高信噪比时间序列的基线检测方法中相同,具体实现细节可以参考方法实施例中的说明。

请参阅图9,图9是本申请实施例提供的高信噪比时间序列的基线检测设备的结构示意图。所述高信噪比时间序列的基线检测设备200可以包括一个或一个以上处理核心的处理器210、一个或一个以上计算机可读存储介质的储存器220、输入单元230、显示单元240、电源250等部件。本领域技术人员可以理解,图9中示出的结构示意图并不构成对高信噪比时间序列的基线检测设备200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

所述处理器210是所述高信噪比时间序列的基线检测设备200的控制中心,利用各种接口和线路连接整个所述高信噪比时间序列的基线检测设备200的各个部分,通过运行或执行存储在所述存储器220内的软件程序和/或模块,以及调用存储在所述存储器220内的数据,执行所述高信噪比时间序列的基线检测设备200的各种功能和处理数据,从而对所述高信噪比时间序列的基线检测设备200进行整体监控。可选的,所述处理器210可包括一个或多个处理核心;优选的,所述处理器210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到所述处理器210中。

所述存储器220可用于存储软件程序以及模块,所述处理器401通过运行存储在所述存储器220的软件程序以及模块,从而执行各种功能应用以及数据处理。所述存储器220可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,所述存储器220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,所述存储器220还可以包括存储器控制器,以提供所述处理器210对所述存储器220的访问。

所述输入单元230可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

所述显示单元240可用于显示由用户输入的信息或提供给用户的信息以及分拣设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元240可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。

所述电源250用以对所述高信噪比时间序列的基线检测设备200的各个部件供电,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

具体在本实施例中,所述高信噪比时间序列的基线检测设备200中的所述处理器210会按照如下的指令,将一个或一个以上的应用程序/模块的进程对应的可执行文件加载到所述存储器220中,并由所述处理器210来运行存储在所述存储器220中的应用程序/模块,从而实现各种功能,如下:

所述处理器调用所述储存器中的计算机程序以执行前述的高信噪比时间序列的基线检测方法。所述计算机程序包括:基线识别模块222、基线建模模块224、基线更正模块226及基线消除模块228。

所述基线识别模块222用以通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线。所述基线建模模块224用以连接相邻通过滑动窗口的子序列基线,以获取初步基线模型。所述基线更正模块226根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。所述基线消除模块228用以将所述多个子序列基线、所述初步基线模型从所述原始时间序列上消除。

所述高信噪比时间序列的基线检测设备的操作的具体实施可参见前面的实施例,在此不再赘述。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,指令可以存储于一计算机可读存储介质中,并由所述处理器进行加载和执行。

为此,本申请实施例还提供一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序适于处理器进行加载,以执行本申请实施例提供所述高信噪比时间序列的基线检测方法。例如,所述计算机程序被所述处理器加载,可以执行如下步骤:

通过滑动窗口将原始时间序列分为多个子序列,获取所述多个子序列各自的子序列基线;连接相邻滑动窗口的子序列基线,以获取初步基线模型;及根据所述子序列的绝对斜率的概率密度分布来设定阈值,当所述子序列的绝对斜率大于所述阈值时,更正所述初步基线模型。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,本领域普通技术人员应当理解,所述存储介质可以包括存储器,例如,只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。

本申请实施例提供的所述存储介质执行存储在其中的计算机程序的有益效果,详见前述实施例,在此不再赘述。

以上对本申请实施例所提供的一种高信噪比时间序列的基线检测方法、高信噪比时间序列的基线检测设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 高信噪比时间序列的基线检测方法、设备及存储介质
  • 一种安全基线检测方法、装置、设备及可读存储介质
技术分类

06120112319840