掌桥专利:专业的专利平台
掌桥专利
首页

熔解曲线异常值处理方法、装置以及电子设备

文献发布时间:2023-06-19 10:35:20


熔解曲线异常值处理方法、装置以及电子设备

技术领域

本申请涉及数据检测技术领域,尤其是涉及一种熔解曲线异常值处理方法、装置以及电子设备。

背景技术

目前,诊断传染病标准的核酸定量方法多采用荧光实时定量PCR,能够量化样品模板的初始值,常被用在基因分析表达、转基因食物检测和癌症检测中。

但是,目前实际的数据调试中,荧光强度偶尔会出现异常值的情况,现有的方法都无法处理荧光强度变化值即熔解曲线的异常值,难以确定平滑后的熔解曲线,目前的方法无法获得较高精度的熔解曲线。

发明内容

本发明的目的在于提供一种熔解曲线异常值处理方法,以缓解无法获得较高精度的熔解曲线的技术问题。

第一方面,本申请实施例提供了一种熔解曲线异常值处理方法,包括:

获取PCR熔解过程中已扩增的荧光强度数据;

利用连续小波变换的方式对所述荧光强度数据进行探测,确定异常值位置;

在所述异常值位置所处的预设邻域范围内,根据可变化窗口值对所述荧光强度数据进行线性拟合,得到拟合曲线;

对所述拟合曲线进行多项式拟合求导,确定熔解曲线。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述利用连续小波变换的方式对所述荧光强度数据进行探测,确定异常值位置的步骤,包括:

利用连续小波变换的方式对所述荧光强度数据进行探测,得到每个尺度下对应的多个模;

分别确定不同所述尺度下对应的模极大值位置;

判断所述模极大值位置是否在预设层数内;

若所述模极大值位置在所述预设层数内,则将所述模极大值位置确定为荧光强度异常值位置。

结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述判断所述模极大值位置是否在预设层数内的步骤,包括:

对所述荧光强度数据进行多次探测,得到与多次探测对应的三层模极大值位置;

判断所述模极大值位置是否在预设顺序层数以及连续层数内。

结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述在所述异常值位置所处的预设邻域范围内,根据可变化窗口值对所述荧光强度数据进行线性拟合,得到拟合曲线的步骤,包括:

在所述异常值位置所处的预设邻域范围内,根据至少两个预设窗口值对所述荧光强度数据进行线性拟合,分别得到与至少两个所述预设窗口值对应的初步拟合曲线;

计算至少两个所述预设窗口值对应的平滑度值,通过对比多个所述平滑度值得到最小平滑度值;

确定与所述最小平滑度值对应的目标预设窗口值;

将所述目标预设窗口值对应的目标初步拟合曲线确定为最终的拟合曲线。

结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述可变化窗口值为奇数。

结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述确定异常值位置的步骤,包括:

当出现多个所述异常值位置时,判断相邻的所述异常值位置之间的距离是否小于或等于预设距离;

若相邻的所述异常值位置之间的距离小于或等于所述预设距离,随机确定一个所述异常值位置。

结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述对所述拟合曲线进行多项式拟合求导,确定熔解曲线的步骤,包括:

对所述拟合曲线进行不同阶次的多项式拟合,得到多个决定系数;

将最大的所述决定系数对应的多项式拟合结果确定为多项式拟合曲线;

确定所述多项式拟合曲线的负导数,并确定所述负导数对应的熔解曲线。

第二方面,本发明实施例提供了一种熔解曲线异常值处理装置,包括:

获取模块,用于获取PCR熔解过程中已扩增的荧光强度数据;

探测模块,用于利用连续小波变换的方式对所述荧光强度数据进行探测,确定异常值位置;

拟合模块,用于在所述异常值位置所处的预设邻域范围内,根据可变化窗口值对所述荧光强度数据进行线性拟合,得到拟合曲线;

确定模块,用于对所述拟合曲线进行多项式拟合求导,确定熔解曲线。

第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。

第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述第一方面所述的方法。

本申请实施例带来了以下有益效果:

本申请实施例提供的一种熔解曲线异常值处理方法、装置以及电子设备,包括:首先获取PCR熔解过程中已扩增的荧光强度数据,然后再利用连续小波变换的方式对荧光强度数据进行探测,确定异常值位置,之后在异常值位置所处的预设邻域范围内,最后再根据可变化窗口值对荧光强度数据进行线性拟合,得到拟合曲线,从而对拟合曲线进行多项式拟合求导,确定熔解曲线,本方案中,通过利用连续小波变换的方式对荧光强度数据进行探测,能够确定异常值位置,再者,根据可变化窗口值对荧光强度数据进行线性拟合,最后实现了对拟合曲线进行多项式拟合求导,确定熔解曲线,缓解了目前无法获得较高精度的熔解曲线的技术问题。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种熔解曲线异常值处理方法的流程示意图;

图2为本申请实施例提供的一种熔解曲线异常值处理方法的另一流程示意图;

图3为本申请实施例提供的一种熔解曲线异常值处理方法中原始荧光强度数据,前25级尺度cwt系数叠加示意图以及各尺度系数对应的cwt系数模极大值位置的示意图;

图4为本申请实施例提供的一种熔解曲线异常值处理方法中对异常值邻域进行局部线性拟合的效果图;

图5为本申请实施例提供的熔解曲线异常值处理方法中最终处理前后的熔解曲线示意图;

图6为本申请实施例提供的一种熔解曲线异常值处理装置的结构示意图;

图7为示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,在PCR扩增反应完成后,常通过逐渐增加温度、使扩增产物发生降解来获得荧光强度变化值即熔解曲线,然后通过熔点峰的位置、高度或熔解曲线的形貌对扩增产物的特异性进行考察。

对于荧光强度的平滑及随之而来的求负导数获得熔解曲线,这一过程并不复杂,目前已有大量研究成果,曾利用Savitzky-Golay求导方法对非等间隔采样荧光强度进行处理,从而获得了平滑过后的熔解曲线,然而在实际的数据调试中,荧光强度偶尔会出现异常值的情况:比如某个采样点温度没有采到,导致荧光强度向下出现一个大的跳空;比如某个采样点的荧光强度因为某种原因向上出现跳动,呈现顿挫形态。而相应的在熔解曲线上就会出现尖锐的波峰或者波谷,影响熔点峰的判别。

目前,最直接的方法可能是加大平滑拟合的窗口大小,但这会带来风险,比如对于多个熔点峰的情况,当某些波峰较小时,容易被抹平。现有的方法都无法获得较高精度的熔解曲线。

基于此,本申请实施例提供了一种熔解曲线异常值处理方法、装置以及电子设备,通过该方法可以缓解目前无法获得较高精度的熔解曲线的技术问题。即首先基于cwt探测出荧光强度所有异常值的位置,其次对异常值邻域进行线性拟合,最后再基于多项式拟合—求导方法,确定平滑后的熔解曲线。从最终的示例结果看,该方法是有效的,也易于理解,容易实现。

实施例一:

图1为本申请实施例提供的一种熔解曲线异常值处理方法的流程示意图。如图1所示,该方法包括:

步骤S110,获取PCR熔解过程中已扩增的荧光强度数据。

步骤S120,利用连续小波变换的方式对荧光强度数据进行探测,确定异常值位置。

步骤S130,在异常值位置所处的预设邻域范围内,根据可变化窗口值对荧光强度数据进行线性拟合,得到拟合曲线。

步骤S140,拟合曲线进行多项式拟合求导,确定熔解曲线。

通过利用连续小波变换的方式对荧光强度数据进行探测,能够确定异常值位置,再者,根据可变化窗口值对荧光强度数据进行线性拟合,最后实现了对拟合曲线进行多项式拟合求导,确定熔解曲线,缓解了目前无法获得较高精度的熔解曲线的技术问题。

在一些实施例中,对于上述步骤S110中获取PCR熔解过程中已扩增的荧光强度数据的步骤,通过采集荧光定量PCR之后扩增子熔解实验中荧光强度数据,如图2所示,按照实际需要,记录下不等间距温度下的荧光强度数据即可,不需刻意保证在等温度间隔下采集荧光强度数据。

在一些实施例中,上述步骤S120中利用连续小波变换的方式对荧光强度数据进行探测,确定异常值位置的步骤,包括:

步骤b),利用连续小波变换的方式对荧光强度数据进行探测,得到每个尺度下对应的多个模。

步骤c),分别确定不同尺度下对应的模极大值位置。

步骤d),判断模极大值位置是否在预设层数内。

步骤e),若模极大值位置在预设层数内,则将模极大值位置确定为荧光强度异常值位置。

需要说明的是,小波变换是一种信号的时间-尺度分析方法,能有效地从信号种提取瞬态突变信息,具体到cwt,通过获得各尺度下的小波系数及相应的模极大值,如果模极大值在各尺度上位置大体一致,特别是在小尺度上保持一致,则该处即为突变位置,如图2所示,也即要探测的异常值位置。为此,可以分三步进行:

1)计算各尺度下荧光强度的cwt;

2)获得各尺度下模极大值位置;

3)比较各尺度下模极大值位置,如果某处模极大值位置在多个尺度上均有体现,且在前三层细节处有体现,则该处荧光强度为异常值,获得其对应位置,如果在三层细节以上才有体现,则该处荧光强度非异常值。当异常值非常靠近、只有1个采样点的距离时,当成1个异常值。

通过利用连续小波变换的方式对荧光强度数据进行探测,既能够得到每个尺度下对应的多个模,又能够根据同尺度下对应的模极大值位置,确定为荧光强度异常值位置,准确的确定异常位置。

在一些实施例中,上述步骤d)具体可以包括如下步骤:

步骤f)对荧光强度数据进行多次探测,得到与多次探测对应的三层模极大值位置。

步骤g)判断模极大值位置是否在预设顺序层数以及连续层数内。

通过对荧光强度数据进行多次探测,能够更加准确的判断极大值位置,使判断模极大值位置更加准确。

在一些实施例中,如图2所示,上述步骤S130具体可以包括如下步骤:

步骤h)在异常值位置所处的预设邻域范围内,根据至少两个预设窗口值对荧光强度数据进行线性拟合,分别得到与至少两个预设窗口值对应的初步拟合曲线。

步骤i)计算至少两个预设窗口值对应的平滑度值,通过对比多个平滑度值得到最小平滑度值。

步骤j)确定与最小平滑度值对应的目标预设窗口值。

步骤k)将目标预设窗口值对应的目标初步拟合曲线确定为最终的拟合曲线。

对于步骤h),示例性的,以异常值位置为中心,对较小邻域内强度数据进行变窗口大小的线性拟合。因为异常值通常只是1-2个采样点的急剧变化,直接采用线性拟合对其进行平滑即可。以异常值为中心,取窗口大小为3或5个采样点(注:为奇数),分别进行线性拟合,并分别获得拟合结果。

对于上述步骤k),能够以平滑度为指标,取最好的线性拟合结果。这里平滑度r是指:

其中,i为序号,f(i)、f^(i)分别表示拟合前后i点的荧光强度,如果异常值位置为n

通过计算至少两个预设窗口值对应的平滑度值,能够确定与最小平滑度值对应的目标预设窗口值,将目标预设窗口值对应的目标初步拟合曲线确定为最终的拟合曲线。

在一些实施例中,在上述步骤S130中,可变化窗口值可以为奇数。因为异常值通常只是1-2个采样点的急剧变化,直接采用线性拟合对其进行平滑即可。以异常值为中心,取窗口大小为3或5个采样点(注:为奇数),分别进行线性拟合,并分别获得拟合结果。

在一些实施例中,上述步骤S120中确定异常值位置的过程,具体可以包括如下步骤:

步骤m)当出现多个异常值位置时,判断相邻的异常值位置之间的距离是否小于或等于预设距离。

步骤n)若相邻的异常值位置之间的距离小于或等于预设距离,随机确定一个所述异常值位置。

通过判断相邻的异常值位置之间的距离是否小于或等于预设距离,能够根据相邻的异常值位置之间的距离随机确定一个所述异常值位置。

在一些实施例中,如图2所示,上述步骤S140中对拟合曲线进行多项式拟合求导,确定熔解曲线的步骤,包括:

步骤o)对拟合曲线进行不同阶次的多项式拟合,得到多个决定系数。

步骤p)将最大的决定系数对应的多项式拟合结果确定为多项式拟合曲线。

步骤q)确定多项式拟合曲线的负导数,并确定负导数对应的熔解曲线。

对于上述步骤p),基于多项式拟合方法,对荧光强度进行不同阶次下的多项式拟合,计算决定系数R

其中,X

如图2所示,通过对拟合曲线进行不同阶次的多项式拟合,能够计算最优多项式拟合曲线负导数,确定平滑后的熔解曲线。

本申请实施例中,可以利用博日荧光定量PCR检测系统进行了多次PCR扩增实验,并对采集到的荧光强度数据进行了分析。下面以其中一次实验一个通道部分代表性孔位数据作为示例进行说明。

图3中的(a)为原始荧光强度数据,图3中的(b)为前25级尺度cwt系数叠加图,由图可见,该份数据具有1个异常值,图3中的(c)为各尺度系数对应的cwt系数模极大值位置,可见,异常值位置为61.6℃处(注:61.6℃、61.7℃均有多次模极大值,但因距离很小,可看成1处,这里取发生次数较多的61.6℃)。

图4为对异常值邻域进行局部线性拟合的效果图,窗口大小为5个采样点。图5为最终处理前后的熔解曲线。可见,因为异常值带来的熔解曲线尖刺谷点基本消除,平滑效果明显。

实施例二:

图6为本申请实施例提供的一种熔解曲线异常值处理装置的结构示意图,如图6所示,扩增曲线基线确定装置600包括:

获取模块601,用于获取PCR熔解过程中已扩增的荧光强度数据;

探测模块602,用于利用连续小波变换的方式对所述荧光强度数据进行探测,确定异常值位置;

拟合模块603,用于在所述异常值位置所处的预设邻域范围内,根据可变化窗口值对所述荧光强度数据进行线性拟合,得到拟合曲线;

确定模块604,用于对所述拟合曲线进行多项式拟合求导,确定熔解曲线。

实施例三:

本申请实施例提供的一种电子设备,如图7所示,电子设备700包括存储器701、处理器702,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。

参见图7,电子设备还包括:总线703和通信接口704,处理器702、通信接口704和存储器701通过总线703连接;处理器702用于执行存储器701中存储的可执行模块,例如计算机程序。

其中,存储器701可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口704(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线703可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器701用于存储程序,所述处理器702在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器702中,或者由处理器702实现。

处理器702可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器702中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器702可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器701,处理器702读取存储器701中的信息,结合其硬件完成上述方法的步骤。

实施例四:

对应于上述熔解曲线异常值处理确定方法,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有机器可运行指令,计算机可运行指令在被处理器调用和运行时,计算机可运行指令促使处理器运行熔解曲线异常值处理确定方法的步骤。

本申请实施例所提供的熔解曲线异常值处理装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述熔解曲线异常值处理方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 熔解曲线异常值处理方法、装置以及电子设备
  • 基于层次聚类的熔解曲线Tm值确定方法、装置以及电子设备
技术分类

06120112606117