掌桥专利:专业的专利平台
掌桥专利
首页

一种基于持续测试时间适应的心率失常分类方法

文献发布时间:2023-06-19 19:30:30


一种基于持续测试时间适应的心率失常分类方法

技术领域

本发明属于数据分类领域,具体涉及一种基于持续测试时间适应的心率失常分类方法。

背景技术

测试时间域适应的目的是通过在测试时间从未标记的测试数据(目标域)中学习来适应源预训练模型。现有的工作主要考虑目标域是静态的情况,然而,真实世界的机器感知系统运行在不稳定且不断变化的环境中,其中目标域分布会随着时间而变化,在这种不断变化的环境下,大多数基于自训练和熵正则化的方法会受到这些不断变化的环境的影响,使得模型性能显著下降。由于隐私问题或法律约束,在测试时间域适应的设置下,源域数据通常被认为在测试期间不可用,这使得它比无监督的域适应更具挑战性,但也是更现实的问题。因此,测试时间域适应对于领域转换下真实世界机器感知系统应用的成功至关重要。

心电图(electrocardiogram,简称ECG)被心脏病专家和医疗从业人员广泛用于监测心脏健康,通过心电图的检查,可以发现有无心律失常。心律失常是心血管疾病的一种典型类型,是指正常心脏节律的不规则变化,几种典型的心律失常包括心房纤维性颤动、早搏、心室纤维性颤动和心动过速。虽然单次心律失常心跳可能不会对生命产生严重影响,但连续心律失常心跳可能会对心脏造成非常严重的威胁,因此,定期监测心律以管理和预防心血管疾病是非常重要的。现有的针对ECG数据分类方法都面临着以下几个棘手的问题:需要依赖于人工标注数据标签、模型不能较好的适用于不断变化的测试环境以及模型容易遭受灾难性遗忘。主要存在以下问题:

1)数据集类不平衡。在深度学习的分类任务中,模型性能很容易受数据集类不平衡的影响,导致最终模型对大类的分类效果很好,而对数目少的小类分类效果极差,在心电图相关数据集中,类不平衡问题尤为突出,因为心电图数据中正常心拍很多,而异常心拍数目非常少,存在严重的类不平衡问题,导致使用传统的深度学习方法在对心电图分类时最终效果不佳。

2)模型泛化能力弱。模型泛化能力的强弱决定了该模型能否很好的应用于现实世界中各种机器感知系统。现有的ECG数据分类方法能够在目标域是静态的情况下表现出良好的性能,但是当目标域不断变化时,模型性能显著下降。

3)标注成本高。基于监督学习的ECG数据分类方法在训练过程中需要用到大量人工标注标签的数据集,然而标注数据标签将消耗大量的人力、物力等资源,标注成本十分昂贵。针对ECG这种特定的时间序列医疗数据集,标注则依赖于经验丰富,有一定专业知识的医护人员,这进一步提高了人工标注的门槛,使得大规模、更复杂的数据集标注工作十分艰难。标签训练数据的缺乏阻碍了监督机器学习在医疗保健中的全面临床影响,因此基于无监督的学习方法变得越来越重要。

4)模型容易遭受灾难性遗忘。灾难性遗忘是指模型学习了新的知识之后,几乎彻底遗忘掉之前习得的内容,在现实世界中,很多任务不可能一次性得到所有的训练数据,这就使得模型必须能够利用不断产生的新数据持续学习新知识,并且不遗忘之前所学过的重要内容。因此,缓解模型的灾难性遗忘对于模型的实际部署应用有很重要的意义。

5)适应过程需要使用源域数据。现有的基于域适应的ECG分类方法通常需要在测试时访问源数据,通常使用源域数据和目标域数据重新训练模型以使得模型适应变化的目标域数据,出于隐私或法律约束方面考虑,这可能并不总是可行的,因为源域数据可能不再可用,在测试期间可用的仅仅是在训练阶段预训练的源预训练模型。

数据预处理过程复杂。心电信号是一种具有强烈的非线性、非平稳性和随机性的微弱信号,在对其采集的过程中,极易受来自体内和体外环境的影响,如人体四肢的运动、呼吸、周边环境中的电磁干扰等等,因此直接采集到的心电信号伴随着大量噪声,常见的噪声有基线漂移、工频干扰、肌电干扰和运动伪迹。传统的ECG数据去噪方法如小波滤波、FIR滤波、中值滤波等方法中一些参数的选择非常依赖研究人员的经验,若参数选择不当,会导致去噪效果不佳,进而影响后续ECG数据分类任务。

发明内容

为了解决上述背景技术提到的技术问题,本发明提出了一种基于持续测试时间适应的心率失常分类方法。

为了实现上述技术目的,本发明的技术方案为:

(基本与权书相同)

采用上述技术方案带来的有益效果:

本发明提出一种基于持续测试时间域适应的ECG数据分类方法,可以在不修改源模型的训练过程,不需要访问源数据以及不需要目标域数据标签的情况下,在测试时使用持续测试时间适应提高模型的泛化性,使得模型能够适应不断变化的测试环境。

本发明提出的持续测试时间域适应的ECG数据分类方法通过在测试时间适应过程中将一部分的模型参数恢复成源模型参数能缓解模型出现灾难性遗忘,且不影响模型的性能。

本发明使用的ECG数据预处理方法很简单,不需要做噪音滤波和特征提取的预处理。传统的ECG数据预处理方法非常依赖于研究人员的经验且效果不佳,由于提取到的特征不理想,在训练模型时模型对噪音信号非常敏感。

附图说明

图1是持续测试时间域适应的ECG数据分类方法的工作流程图;

图2是ECGGAN中的生成器模型和判别器模型图;

图3是ECGGAN训练过程中的Loss变化图;

图4是使用ECGGAN生成的样本与真实样本的室上异位搏动比较图;

图5是使用ECGGAN生成的样本与真实样本的室性异位搏动比较图;

图6是使用ECGGAN生成的样本与真实样本的融合拍比较图;

图7是使用ECGGAN生成的样本与真实样本的不可分类拍比较图;

图8是预训练的卷积神经网络模型图;

图9是持续测试时间域适应过程图。

具体实施方式

以下将结合附图,对本发明的技术方案进行详细说明。

本发明公布了一种基于持续测试时间适应的心率失常分类方法,如图1所示,图1展示了基于持续测试时间域适应的ECG数据分类方法的工作步骤,首先进行ECG数据预处理,通过检测Q峰的位置来定位心拍位置,然后使用生成对抗网络(GAN)生成小类样本扩充数据集,然后在MIT-BIH Arrhythmia Database(以下简称为MITdb)数据集上预训练卷积神经网络并保存模型参数,最后在测试时,加载预训练的卷积神经网络模型作为源模型,MIT-BIH ST Change Database(以下简称为MITst)心律失常数据集上测试,测试过程中使用本发明提出的持续测试时间域适应使得源模型不断适应目标数据,最终完成ECG分类任务。具体执行过程如下:步骤1:数据预处理

1.1通过数据集自身标注的Q峰位置采集心拍。本次实验采用MITdb、MITst心律失常数据库作为数据集,MITdb数据集由47个不同受试者以360Hz采样率记录的心电图记录组成,每一次跳动都至少由两名心脏病专家进行注解。MITdb包含了48条双导联ECG记录,除少数记录外,每条记录的第一个导联都是II导联,每条记录长度为30分钟,采样率360Hz,每条记录都有650000个采样点,MITst数据集包括28条不同长度的心电图记录,其中大部分是在运动压力测试期间记录的。按照美国医疗仪器促进协会提出的标准,所有的心拍可以被分为这五大类:正常心拍(N)、室上异位搏动(S)、室性异位搏动(V)、融合拍(F)以及不可分类拍(Q)。由于Q为不可分类拍,且MITst数据集没有融合拍,所以最终只取N、S、V这三大类,标签编码为0、1、2,将不在这三大类中的其他数据删除。根据数据集的注释文件得到Q峰所在的位置下标索引,然后以Q峰的位置为基准,向左包括150个点,向右包括100个点,然后将这一段数据截取出来作为心拍。

1.2使用ECGGAN生成小类样本扩充数据集。在本发明中,设计了一个适用于ECG数据集的GAN(ECGGAN),ECGGAN是对传统的WGAN的改进,在WGAN的基础上添加了梯度惩罚,并且对于WGAN中一些网络模块进行了改进(在生成器G中,将WGAN中的DeConv模块替换成ConvTranspose模块,并且在全连接层前加了Dropout层,在判别器D中,将WGAN中的BatchNorm模块替换成InstanceNorm层),使其更加适用于ECG数据集这种时间序列数据的生成,且解决了GAN难以训练,WGAN容易出现梯度爆炸,梯度消失等问题,ECGGAN的网络模型图如图2所示,ECGGAN的生成器由五个反卷积层批量归一化层ReLU激活层堆叠的卷积块、反卷积层、Dropout层、全连接层及tanh激活函数层组成,判别器由一维卷积层、LeakReLU激活函数层、由4个一维卷积层实例归一化层ReLU激活层堆叠的卷积块、一维卷积层、Dropout层、全连接层及Sigmoid激活函数层组成。ECGGAN由生成器G和判别器D组成,G用于生成接近真实的样本,D用于判断样本是来自真实样本还是生成样本,在训练过程中,G和D相互对抗,相互学习,训练3000轮后,G生成的样本输入到D中,D完全无法判断该样本是真实样本还是生成样本时,此时表示G生成的样本非常接近真实样本,结束训练,保存G的模型参数用于批量生成小类样本扩充数据集。训练过程中生成器和判别器的损失函数值变化趋势如图3所示,图4、图5、图6和图7分别展示的是SVFQ类别真实样本和生成样本的对比图。

1.3将一维ECG心电数据转换成二维ECG图像。由于最终输入模型的是二维图像而不是一维心电数据,所以将一维ECG心电数据通过Matplotlib绘图工具绘制成二维ECG图像。

1.4划分数据集。为MITdb数据集重新打上标签并打乱重排,将MITdb数据集分为训练集和验证集,取前70%的数据作为训练集,后30%的数据作为验证集。

步骤2:搭建训练阶段的卷积神经网络

2.1搭建训练阶段的卷积神经网络。训练阶段使用的网络模型由6个卷积层,6个批量归一化层,3个最大池化层,1个Flatten层以及2个线性层组成,模型结构图如图5所示。

步骤3:预训练卷积神经网络网络模型

3.1初始化模型参数。设置模型学习率为10

3.2将预处理后的MITdb数据集输入到模型中进行预训练。将预处理后的MITdb数据集输入到模型中,首先初始化模型参数,然后开始训练模型,损失函数的值越来越小直到收敛时,此时初始化的参数会随着发生变化,保存变化后的参数,将经过预训练后的卷积神经网络模型作为源模型。

3.3保存模型。将训练好的模型保存起来,在进行ECG分类任务时,直接将训练好的卷积神经网络模型参数作为ECG分类任务的初始化参数。

步骤4:持续测试时间域适应

4.1权值平均伪标签。持续测试时间域适应方法由三个部分组成,分别是权值平均伪标签、增强平均伪标签以及随机恢复源模型权重,前两个部分是为了缓解模型因为使用伪标签而出现错误积累,使用权值平均伪标签、增强平均伪标签能提高伪标签的质量,进而提高模型性能,随机恢复源模型权重是为了缓解模型在不断适应新的测试环境过程中忘记之前学习到的知识,缓解模型出现灾难性遗忘。受以前方法的启发,权值平均伪标签比直接使用伪标签效果更好,所以我们使用学生模型权重通过指数移动平均来更新教师模型的权重来生成伪标签。在持续测试时间域适应的方法中,有三个模型分别是预训练的源模型f

其中,y

θ′

其中,θ′

权值平均伪标签有两个方面的好处,一方面,通过使用更精确的权值平均预测作为伪标签目标,模型在连续适应期间较少遭受错误累积。另一方面,平均教师预测是对来自过去时间步中的模型的信息进行编码,因此,在长期连续适应中不太可能遭受灾难性遗忘,并且能够提高模型对新的未知领域的泛化能力。

4.2增强平均伪标签。训练期间的数据增强已被广泛应用于改善模型性能,不同的数据增强策略通常是针对不同的数据集手动设计的。虽然测试时数据增强也已被证明能够提高鲁棒性,但增强策略通常是针对特定数据集确定和固定的,而没有考虑测试期间的分布变化。在不断变化的环境下,测试分布可能会发生巨大的变化,这可能会使增强策略无效。在本发明中,我们将测试时域偏移考虑在内,并通过预测置信度来近似领域之间的差异,只有当域差异很大时才应用增强,以减少误差累积。首先求出源模型f

confidence(f

其中,

4.3随机恢复源模型权重。虽然更准确的伪标签可以减轻错误累积,但是通过连续测试时间域适应不可避免地导致错误积累和灾难性遗忘。如果我们在一个数据序列中遇到强的域偏移,灾难性遗忘现象更加明显,因为强的分布偏移导致错误校准甚至错误的预测,这种情况下的自训练可能只会导致强化错误的预测,因此,模型可能会因为不断的适应而无法恢复,即使新数据没有严重偏移,模型也会预测错误。为了进一步解决灾难性遗忘问题,我们提出了一种随机恢复方法,该方法从源预训练模型中显式地恢复知识,权值恢复规则如等式(7)。

W

T~Bernoulli(p)(8)

其中,*表示两个矩阵之间的元素逐个相乘,p是随机恢复的概率,本发明中p设为0.99,T是符合伯努利分布的掩码张量,W代表模型的卷积层卷积核权重,W

4.4 ECG数据分类任务。经过持续测试时间域适应后,源模型不断适应目标数据,在适应的过程中更新源模型的权重参数,将经过调整后的模型用于最终的ECG分类任务。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

相关技术
  • 一种基于自适应多分类马氏田口方法的旋转机械故障诊断方法
  • 一种基于特征迁移和自适应学习的人民调解案例分类系统及方法
  • 一种基于对比测试时间适应的心率失常分类方法
  • 一种基于二维图像的深度学习心率失常分类方法
技术分类

06120115931243