掌桥专利:专业的专利平台
掌桥专利
首页

基于单专家标注数据的自动睡眠分期方法及装置

文献发布时间:2023-06-19 18:46:07


基于单专家标注数据的自动睡眠分期方法及装置

技术领域

本发明涉及信号处理和模式识别技术领域,尤其涉及一种基于单专家标注数据的自动睡眠分期方法及装置。

背景技术

睡眠分期是评估睡眠质量和诊断睡眠障碍的重要基础。在临床上,睡眠分期主要依赖于睡眠专家根据多导睡眠图(PSG)信号对整个夜间的睡眠阶段进行手动标记。PSG通常包括多种生理指标信号,用于睡眠分期的信号主要有脑电图(EEG)、眼电图(EOG)、肌电图(EMG)等。根据美国睡眠协会的标准,PSG信号通常被划分为一系列长度为30s的睡眠信号(每30s的睡眠片段称为一个epoch),睡眠专家将每30s的睡眠信号划分为五个睡眠阶段(W、N1、N2、N3、REM)中的一个。

由于睡眠专家手工标注的方法存在效率低、成本高的问题,许多自动睡眠分期方法被提出,其中深度学习模型在这一任务上取得了显著的效果。由于睡眠分期任务中当前时期的分类不仅依赖于其自身特征,而且与其上下文特征相关,2018年以后的主流自动睡眠分期模型通常包含提取当前时期特征的epoch编码器和提取上下文特征的序列编码器,如图1所示。现有的自动睡眠分期工作均默认标签是可靠的。但是,由于睡眠专家主观性和能力的差异,在睡眠分期数据集中通常会出现标签错误,标签错误会降低模型的分类性能。虽然目前的一些研究使用多个专家对同一PSG记录进行标注以减少标签错误,但这种方法在时间和人力上都是昂贵的。一个睡眠专家手动注释一整夜的睡眠记录大约需要两个小时。因此,开发对训练数据中的标签错误具有鲁棒性的训练方法对于睡眠分期任务至关重要。

发明内容

针对自动睡眠分期任务中获取单专家标注数据质量不高、多专家联合标注所需成本较高的问题,本发明实现了一种基于单专家标注数据的自动睡眠分期方法,旨在缓解单专家标注数据中错误标签对自动睡眠分期模型性能的影响,提高在单专家标注数据上训练的自动睡眠分期模型的性能。

为了解决上述技术问题,本发明第一方面提供了基于单专家标注数据的自动睡眠分期方法,包括:

S1:获取原始睡眠信号;

S2:构建自动睡眠分期模型框架,自动睡眠分期模型框架包括两个结构相同的分类模型,两个结构相同的分类模型都包括特征提取器、映射头和分类头,其中特征提取器用于从输入的睡眠信号中提取出特征,得到特征表示向量,映射头用于根据输入的特征表示向量得到特征映射向量,分类头用于根据输入的特征表示向量得到预测结果;

S3:将获取的原始睡眠信号经过不同的数据增强后分别输入自动睡眠分期模型框架中的两个分类模型的特征提取器中,对自动睡眠分期模型框架中的两个分类模型进行联合训练,得到训练好的自动睡眠分期模型,其中,训练过程中根据两个分类模型输出的预测结果计算分类损失和预测一致性损失,根据两个分类模型输出的特征映射向量计算对比损失,并根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,并通过反向传播进行梯度回传;

S4:使用训练好的自动睡眠分期模型对待处理的信号数据进行预测,得到睡眠分期预测结果。

在一种实施方式中,步骤S2构建的自动睡眠分期模型框架中,特征提取器为包含epoch级特征提取器和sequence级特征提取器的模型,或者为仅包含epoch级特征提取器的模型。

在一种实施方式中,步骤S3中训练好的自动睡眠分期模型为包含两个分类模型的模型或者仅包含其中一个分类模型的模型。

在一种实施方式中,步骤S3中根据两个分类模型输出的预测结果计算分类损失,通过下述方式实现:

其中,l

在一种实施方式中,步骤S3中根据两个分类模型输出的预测结果计算预测一致性损失,通过下述方式实现:

其中,

在一种实施方式中,步骤S3中根据两个分类模型输出的特征映射向量计算对比损失,通过下述方式实现:

其中,N为样本数量,

在一种实施方式中,步骤S3中根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,通过下述方式实现:

l=l

其中,l

基于同样的发明构思,本发明第二方面提供了基于单专家标注数据的自动睡眠分期装置,包括:

原始信号获取模块,用于获取原始睡眠信号;

模型构建模块,用于构建自动睡眠分期模型框架,自动睡眠分期模型框架包括两个结构相同的分类模型,两个结构相同的分类模型都包括特征提取器、映射头和分类头,其中特征提取器用于从输入的睡眠信号中提取出特征,得到特征表示向量,映射头用于根据输入的特征表示向量得到特征映射向量,分类头用于根据输入的特征表示向量得到预测结果;

训练模块,用于将获取的原始睡眠信号经过不同的数据增强后分别输入自动睡眠分期模型框架中的两个分类模型的特征提取器中,对自动睡眠分期模型框架中的两个分类模型进行联合训练,得到训练好的自动睡眠分期模型,其中,训练过程中根据两个分类模型输出的预测结果计算分类损失和预测一致性损失,根据两个分类模型输出的特征映射向量计算对比损失,并根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,并通过反向传播进行梯度回传;

预测模块,用于使用训练好的自动睡眠分期模型对待处理的信号数据进行预测,得到睡眠分期预测结果。

基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。

基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。

相对于现有技术,本发明的优点和有益的技术效果如下:

本发明提供的基于单专家标注数据的自动睡眠分期方法,构建了包含两个结构相同的分类模型的自动睡眠分期模型,并对使用两个结构一致但初始化不同的网络模型进行联合训练,将两个分类模型的预测结果用于分类损失和预测一致性损失的计算,两个分类模型输出的特征映射向量用于模型间对比损失的计算,计算出总的目标损失并通过反向传播进行梯度回传,上述训练方法,通过预测一致性损失防止模型过拟合到错误标注标签上,并通过模型间对比学习在不依赖可能带有噪声的标签的情况下增强对特征表示的探索,从而可以提高自动睡眠分期的性能,可以解决单专家标注数据质量不高、多专家联合标注所需成本较高的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是现有技术中自动睡眠分期模型架构图;

图2是本发明实施例中采用的模型框架示意图;

图3是本发明实施例中提供的单专家标注数据的自动睡眠分期方法的流程图;

图4是本发明实施例中单专家标注数据的自动睡眠分期装置的结构框图;

图5为本发明实施例提供的计算机可读存储介质的结构示意图;

图6为本发明实施例提供的计算机设备的结构示意图。

具体实施方式

本发明的目的在于提供一种基于单专家标注数据的自动睡眠分期方法,缓解单专家标注数据中错误标签对自动睡眠分期模型性能的影响,避免了使用多专家联合标注带来的高时间和人力开销。

为了达到上述目的,本发明的构思如下:

提出了基于单专家标注数据的自动睡眠分期方法,使用两个结构一致但初始化不同的网络进行联合训练。该方法将单专家标注标签视为噪声标签,通过约束模型产生接近的预测来防止过拟合到噪声标签上。其基于的基本思想是被错误标记的实例通常更有可能与深度神经网络模型捕获的特征模式相矛盾,这些实例往往需要更长的时间被模型记住,同时在训练过程中更有可能被反复忘记,因此两个不同的网络往往能够对带有错误标签的实例做出不同的预测。此外,受到自监督学习的启发,该方法使用模型间的对比学习来增强模型间的信息交流,并在不依赖可能带有噪声的标签的情况下增强对特征表示的探索。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

本发明实施例提供了基于单专家标注数据的自动睡眠分期方法,包括:

S1:获取原始睡眠信号;

S2:构建自动睡眠分期模型框架,自动睡眠分期模型框架包括两个结构相同的分类模型,两个结构相同的分类模型都包括特征提取器、映射头和分类头,其中特征提取器用于从输入的睡眠信号中提取出特征,得到特征表示向量,映射头用于根据输入的特征表示向量得到特征映射向量,分类头用于根据输入的特征表示向量得到预测结果;

S3:将获取的原始睡眠信号经过不同的数据增强后分别输入自动睡眠分期模型框架中的两个分类模型的特征提取器中,对自动睡眠分期模型框架中的两个分类模型进行联合训练,得到训练好的自动睡眠分期模型,其中,训练过程中根据两个分类模型输出的预测结果计算分类损失和预测一致性损失,根据两个分类模型输出的特征映射向量计算对比损失,并根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,并通过反向传播进行梯度回传;

S4:使用训练好的自动睡眠分期模型对待处理的信号数据进行预测,得到睡眠分期预测结果。

总体来说,步骤S1是原始信号的获取,S2是模型的构建,S3是模型的训练,S4是模型的测试或者应用,流程图请参见图3。

具体实施过程中,原始睡眠信号可以为脑电图(EEG)、眼电图(EOG)、肌电图(EMG)等。

对于给定的一批数据

步骤1:原始睡眠信号X∈R

步骤2:增强后的信号被分别送入到两个用于提取特征的特征提取器得到特征表示向量

步骤3:将得到的表示向量分别送入到对应网络的分类头和映射头中,到模型预测结果

步骤4:将模型预测结果用于分类损失和预测一致性损失的计算,特征映射向量用于模型间对比损失的计算,计算出总的目标损失并通过反向传播进行梯度回传,当满足预设条件或者收敛时,得到训练好的睡眠分期模型。

在一种实施方式中,步骤S2构建的自动睡眠分期模型框架中,特征提取器为包含epoch级特征提取器和sequence级特征提取器的模型,或者为仅包含epoch级特征提取器的模型。

具体来说,睡眠分期模型被解耦成一个提取特征的特征提取器以及一个用于分类的分类头,没有指定特征提取器的类型。具体实施过程中,无论是主流的同时包含epoch级特征提取器和sequence级特征提取器的模型还是仅包含当前epoch特征特征提取器的模型都能很好的适应该框架。在训练阶段,该方法使用两个模型进行联合训练。

在一种实施方式中,步骤S3中训练好的自动睡眠分期模型为包含两个分类模型的模型或者仅包含其中一个分类模型的模型。

最终的模型可以包括两个分类模型,在不考虑额外的开销时,通过两个分类模型进行集成预测可能会带来更好的预测结果。

为了避免增加额外的推理时间,训练完成后在实际使用时可直接选择其中任意一个分类模型作为最终的自动睡眠分期模型。

在一种实施方式中,步骤S3中根据两个分类模型输出的预测结果计算分类损失,通过下述方式实现:

其中,l

具体来说,由于睡眠分期是一个多分类任务,因此本实施方式使用交叉熵损失来最小化分类器预测结果和标签之间的距离。分类损失计算如公式(1)所示。

在一种实施方式中,步骤S3中根据两个分类模型输出的预测结果计算预测一致性损失,通过下述方式实现:

其中,

具体来说,由于深度神经网络更有可能在正确标记的实例上达成一致,而在错误标记的实例上产生分歧,因此该方法通过约束两个神经网络(分类模型)对同一样本的两个增强视图产生一致的预测来防止模型对噪声标记的过拟合。首先计算两种模型的平均预测结果

在一种实施方式中,步骤S3中根据两个分类模型输出的特征映射向量计算对比损失,通过下述方式实现:

其中,N为样本数量,

具体来说,由于单专家标记数据中存在错误标记的标签,受自监督学习的启发,该方法使用模型之间的对比学习来训练模型在不依赖标签的情况下学习特征表示。一方面可以避免标签错标的影响,另一方面可以增强两个网络之间的信息交互,使模型能够更好地学习特征表示。在自动睡眠分期任务中,同一PSG信号的两个不同视图的特征投影

在一种实施方式中,步骤S3中根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,通过下述方式实现:

l=l

其中,l

具体来说,总的目标函数主要由三个部分组成:分类损失、预测一致性损失和模型间的对比损失。最终的目标函数是这三个损失函数的线性加权。

为了验证本发明算法的性能,在两个公开的真实世界数据集DOD-H和DOD-O上将本发明算法应用在三个自动睡眠分期模型上进行实验。表1和表2报告了宏观平均F1分数,整体准确性和每个睡眠阶段的F1分数。

表1在DOD-H数据集上训练的模型的性能比较

对于数据量小、噪声率低的由健康人的PSG记录组成的DOD-H数据集,最容易错标的时期是N1阶段。在DOD-H数据集上,本方法使三个模型的MF1分数相对于基线提高了1.36%-1.8%,使N1阶段的F1分数提高了1.85%-8.85%。

表3.2在DOD-O数据集上训练的模型的性能比较

对于数据量较大、噪声率较高的DOD-O数据集,由于它包含睡眠呼吸暂停受试者的PSG记录,医生在该数据集中对N3期的标记准确性明显下降。与DOD-O数据集的基线相比,本发明将三种模型的MF1分数提高了1.14%-3.31%,总体准确率提高了0.98%-2.91%。对于错误率较高的N1和N3阶段,除了TinySleepNet的表现略低于N1阶段的基线外,使用本发明的这三种模型都有显著的改进。综上所述,实验结果表明,本发明可以有效地提高单专家标注数据集上训练的自动睡眠分期模型的性能。

实施例二

基于同样的发明构思,本实施例提供了基于单专家标注数据的自动睡眠分期装置,请参见图4,该装置包括:

原始信号获取模块201,用于获取原始睡眠信号;

模型构建模块202,用于构建自动睡眠分期模型框架,自动睡眠分期模型框架包括两个结构相同的分类模型,两个结构相同的分类模型都包括特征提取器、映射头和分类头,其中特征提取器用于从输入的睡眠信号中提取出特征,得到特征表示向量,映射头用于根据输入的特征表示向量得到特征映射向量,分类头用于根据输入的特征表示向量得到预测结果;

训练模块203,用于将获取的原始睡眠信号经过不同的数据增强后分别输入自动睡眠分期模型框架中的两个分类模型的特征提取器中,对自动睡眠分期模型框架中的两个分类模型进行联合训练,得到训练好的自动睡眠分期模型,其中,训练过程中根据两个分类模型输出的预测结果计算分类损失和预测一致性损失,根据两个分类模型输出的特征映射向量计算对比损失,并根据分类损失、预测一致性损失以及对比损失计算出总的目标损失,并通过反向传播进行梯度回传;

预测模块204,用于使用训练好的自动睡眠分期模型对待处理的信号数据进行预测,得到睡眠分期预测结果。

由于本发明实施例二所介绍的装置为实施本发明实施例一中基于单专家标注数据的自动睡眠分期方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的装置都属于本发明所欲保护的范围。

实施例三

基于同一发明构思,请参见图5,本发明还提供了一种计算机可读存储介质300,其上存储有计算机程序311,该程序被执行时实现如实施例一中所述的方法。

由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中基于单专家标注数据的自动睡眠分期方法所采用的计算机可读存储介质,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。

实施例四

基于同一发明构思,本申请还提供了一种计算机设备,如图6所示,包括存储器401、处理器402及存储在存储器上并可在处理器上运行的计算机程序403,处理器执行上述程序时实现实施例一中的方法。

由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中基于单专家标注数据的自动睡眠分期方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术分类

06120115687198