掌桥专利:专业的专利平台
掌桥专利
首页

一种单导联心电异常信号识别方法

文献发布时间:2023-06-19 12:04:09


一种单导联心电异常信号识别方法

技术领域

本发明涉及心电信号识别领域,具体涉及一种基于生成对抗及深度残差收缩网络的单导联心电异常信号识别方法。

背景技术

心血管疾病(cardiovascular disease,简称CVD)指的是与心脏或血管相关的一系列疾病,又称为循环系统疾病。以下是几个世界卫生组织统计的几个重要事实:心血管疾病仍然是全球的头号死因,在所有死亡状况中,每年死于心血管疾病的人数超过任何其它死亡原因。在2016年一年内,估计有1790万人死于心血管疾病,占全球死亡总数的31%左右,其中,又有85%左右死于心脏病和中风。

对于心电疾病的诊断,心电图(Electrocardiogram,ECG或者EKG)是一种经过胸腔的以时间为单位记录心脏的电生理活动、通过安置在皮肤上的电极捕捉其电信号并绘制成线记录下来的诊疗技术。作为一种无创性的记录方式,心电图的应用最为广泛与权威。

近年来,随着模式识别、神经网络等技术水平的提高以及大数据与人工智能的发展,基于心电图信号数据设计的心电自动诊断算法和系统的研究已经很多,但是大部分成果仍然停留在实验阶段,距离真正投入商用仍然有较大一段路需要走。即使是投入商用的部分,由于精度不足,疾病判别不够具体等缺点,对医生们的帮助十分有限。

12导联心电图的PDF目前是医院或医生最容易获得的数据。然而,对于某些心电类型的疾病来说,样本数据量少是一个明显的问题。目前,存在数据集中的样本不平衡的问题,由于数据集中的样本不平衡,就会导致模型对某一类心电疾病的预测效果并不理想。此外,还存在如何有效去除噪声的问题,需要尽量减少噪声对于心电疾病分类诊断的影响。

发明内容

针对现有技术中存在的缺陷,本发明的目的在于提供一种单导联心电异常信号识别方法,解决了数据集中样本不平衡的问题,并能够有效去除噪声,减少噪声对于心电疾病分类诊断的影响,提高心电疾病分类准确率。

为达到以上目的,一方面,采取一种单导联心电异常信号识别方法,包括步骤:

S1、通过深度卷积生成对抗网络DCGAN生成器生成心电数据,加入样本数据量少的心电数据集,得到训练数据集;

S2、搭建通道间共享阈值的深度残差收缩网络DRSN-CS模型,通过预设数量的通道间共享阈值的残差收缩模块RSBU-CS进行堆叠,削减噪声相关的特征;

S3、搭建通道间不共享阈值的深度残差收缩网络DRSN-CW模型,使用软阈值化作为收缩函数,用于线性变化,消除噪声相关信息;

S4、对所述DRSN-CS模型和DRSN-CW模型进行优化,对每层卷积层进行批量归一化,使用LeakyRelu激活函数减轻梯度消失问题;

S5、采用反向传播算法分别训练DRSN-CS模型和DRSN-CW模型,并采用交叉验证循环重复训练多次,基于随机梯度下降算法进行训练;

S6、比较DRSN-CS模型和DRSN-CW模型的分类准确率,选取准确率高的作为最终分类模型,对心电异常信号识别分类。

优选的,所述S1中DCGAN的损失函数为:

其中,G表示生成器,D表示判别器,z表示随机噪声,从该噪声生成图像记作G(z),x表示输入判别器的一幅图像,Pdata(x)=P(x|data)表示从实际数据集中得到x的概率,实际数据集是指样本数据量少的心电数据集;Pz(z)=P(z|Z)表示从生成数据集中得到z的概率,生成数据集是指DCGAN生成的心电数据集;D(x)是判别器的输出,表示x为真实图像的概率;所述判别器用于判断每一个数据实例是否属于真实的训练数据集。

优选的,所述S2中DRSN-CS模型包括三部分,第一部分为卷积神经网络模型,包括5个通道间阈值共享的RSBU-CS;第二部分为双向长短期记忆网络模型BiLSTM;第三部分为注意力机制;DRSN-CS模型还包括一个全连接层,用于输出每个类别的概率。

优选的,所述S2中RSBU-CS用于估计软阈值化所需阈值;所述RSBU-CS中,全局均值池化应用在经过卷积层运算之后的特征图的绝对值上获得一维向量,一维向量被输入到一个两层的全连接网络中,获得一个尺度化参数;通过Sigmoid函数将所述尺度化参数规整到0和1之间;将特征图的绝对值的平均值乘以所述尺度化参数得到阈值。

优选的,所述S3中DRSN-CW模型包括三部分,第一部分为卷积神经网络模型,包括5个通道间阈值不共享的RSBU-CW;第二部分为双向长短期记忆网络模型BiLSTM;第三部分为注意力机制;DRSN-CW模型还包括一个全连接层,用于输出每个类别的概率。

优选的,所述S3中,使用通道间阈值不共享的残差收缩模块RSBU-CW,使经过卷积层运算之后的特征图的每个通道具有独立的阈值,全局均值池化应用在特征图的绝对值上获得一维向量,并输入到一个两层的全连接层中;全连接层的第二层有一个以上神经元,且神经元的个数等于输入特征图的通道数;全连接层的输出被强制到0和1之间,之后计算出阈值,所述阈值始终是正数,且保持在防止输出特征都是零的合理范围内。

优选的,所述S4中对每层卷积层进行批量归一化,包括:

针对每一批输入数据,在网络的每一层输入之前增加归一化处理,其中均值为0,标准差为1,对于任一层的任意一个神经元

其中,k为维度,x

优选的,所述S4中LeakyRelu激活函数为:

其中,a表示斜率,为一个正常数;m表示该激活函数的输入变量。

优选的,所述S5中采用交叉验证循环重复训练多次包括:

将心电数据集随机分成5个相等的部分,选取其中的4个部分用来训练,剩下的一个部分作为测试,循环重复5次。

优选的,所述S5中DRSN-CS和DRSN-CW两个模型的总的损失函数,定义为所有参与训练的心电数据交叉熵损失函数的和,单个心电数据的标签及预测结果分别为label

其中,n表示训练数据集上的样本数据,cross_entropy()表示交叉熵损失函数,prediction

上述技术方案中的一个具有如下有益效果:

1、通过搭建深度卷积生成对抗网络(DCGAN)模型,将心电数据集中样本数据量较少的类别进行数据增强,使得心电数据集中的样本达到相对平衡,解决心电数据集中样本不平衡的问题。

2、使用一维CNN进行卷积操作,使DCGAN模型预测速度更快,更容易训练,只有几十个反向传播(BP)周期。

3、使用了软阈值化(也就是一种流行的收缩方程)作为非线性层,嵌入到神经网络之中,采用通道间共享阈值深度残差收缩网络(DRSN-CS)模型和通道间阈值不共享深度残差收缩网络(DRSN-CW)模型来自适应地设置阈值,从而使每段心电数据信号都有着自己独特的一组阈值,以有效地消除噪声相关的特征。相比传统ECG信号的分析流程来说,省略了去除噪声的操作步骤,节省了时间,提高了工作效率,同时也提升了模型分类的准确率。

4、通过大量数据的反复训练,对算法的不断优化,使得心电异常信号识别分类准确率得到了一定的提升,为医疗人员提供了可靠的辅助与参考,减少误诊、漏诊率。

附图说明

图1为本发明实施例单导联心电异常信号识别方法流程图;

图2为心电信号原始数据与DCGAN生成的生成数据对比图,其中左边为原始数据,右边为生成数据;

图3为GAN网络结构示意图;

图4为DCGAN网络生成器示意图;

图5为通道间共享阈值残差收缩子网络模块RSBU-CS示意图;

图6为通道间共享阈值深度残差收缩网络DRSN-CS模型结构图。

图7为通道间阈值不共享深度残差收缩子网络模块RSBU-CW示意图;

图8为通道间阈值不共享深度残差收缩网络DRSN-CW模型结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示,本发明基于生成对抗及深度残差收缩网络,提供一种单导联心电异常信号识别方法的实施例,包括如下步骤:

S1、搭建DCGAN模型,通过DCGAN生成器生成心电数据,加入样本数据量少的心电数据集,得到训练数据集。如图2所示,为心电信号原始数据与DCGAN生成的生成数据对比图,其中左边为原始数据,右边为生成数据。

如图3所示,为GAN网络结构示意图,包括生成器G和判别器D;其中,生成器G采用图4所示DCGAN网络生成器生成心电数据。图3和图4的结合形成DCGAN模型。

DCGAN的损失函数如下所示:

其中,G表示生成器,D表示判别器,z表示随机噪声,该噪声的生成数据记作G(z),G(z)是图像;x表示真实数据,是输入判别器D的一幅图像,Pdata(x)=P(x|data)表示从实际数据集中得到x的概率,实际数据集是指样本数据量少的心电数据集;Pz(z)=P(z|Z)表示从生成数据集中得到z的概率,生成数据集是指DCGAN生成的心电数据集;D(x)是判别器的输出(即判断结果),表示x为真实图像的概率;上述判别器用于判断每一个数据实例是否属于真实的训练数据集。

生成器的特点包括:

1)去掉一切会丢掉位置信息的结构,如池化层;

2)使用分数步进卷积层(即反卷积层);

3)去掉最后的全连接层;

4)使用批量归一化(即Batch Normalization)和ReLU激活函数。

DCGAN的判别器特点在于:

1)DCGAN的判别器中的多层卷积神经网络不使用池化层,将它替换为步长大于1的卷积层。

2)DCGAN中的判别器中的最后一层不接全连接层,经过扁平化处理之后直接送给Sigmoid输出层。

3)使用Batchnorm层,内部激活函数使用LeakyReLU。。

S2、搭建通道间共享阈值的深度残差收缩网络(DRSN-CS)模型,通过预设数量的通道间共享阈值的残差收缩模块(RSBU-CS)进行堆叠,从而噪声相关的特征被逐渐削减。

具体的,如图6所示,DRSN-CS模型的第一个部分采用卷积神经网络模型,包括5个通道间阈值共享的RSBU-CS;第二部分为双向长短期记忆网络模型(BiLSTM);第三部分为注意力机制(Attention机制)。第二部分主要是对上述RSBU-CS所提炼出来的特征做更进一步的处理操作,由于卷积神经网络所获得的心电数据的特征在时序上是具备着相关性的,所以第二部分采取了双向LSTM模型。第三部分对于提取出来的心电信号数据中的更加有用的特征,赋予更加大的权值,而对于那些心电信号数据中用处不大的特征赋予较小的权值。

DRSN-CS模型的最后还包括一个全连接层,使用的是softmax作为激活函数,输出每一个类别的概率。把几个概率值最大的类别作为模型最后的预测输出类别,从而完成DRSN-CS模型具体的分类功能。

如图5所示,RSBU-CS用于估计软阈值化所需阈值,在述RSBU-CS中,全局均值池化应用在经过卷积层(位于卷积神经网络模型中)运算之后的特征图的绝对值上面,来获得一维向量;这个一维向量被输入到一个两层的全连接网络中,来获得一个尺度化参数。通过Sigmoid函数将这个尺度化参数规整到0和1之间。使用这个尺度化参数,乘以特征图的绝对值得平均值作为阈值,就可以把阈值控制在一个合适的范围内,不会使输出特征全部为零。

S3、搭建通道间不共享阈值的深度残差收缩网络模型(DRSN-CW)模型,使用软阈值化作为收缩函数,用于线性变化,消除噪声相关信息。

具体的,如图7和图8所示,DRSN-CW模型第一部分为卷积神经网络模型,包括5个通道间阈值不共享的RSBU-CW;第二部分为双向长短期记忆网络模型(BiLSTM);第三部分为注意力机制(Attention机制)。第二部分主要是对上述RSBU-CW所提炼出来的特征做更进一步的处理操作,由于卷积神经网络所获得的心电数据的特征在时序上是具备着相关性的,所以第二部分采取了双向LSTM模型。第三部分对于提取出来的心电信号数据中的更加有用的特征,赋予更加大的权值,而对于那些心电信号数据中用处不大的特征赋予较小的权值。

DRSN-CW模型的最后还包括一个全连接层,用于输出每个类别的概率。把几个概率值最大的类别作为模型最后的预测输出类别,从而完成模型具体的分类功能。

在DRSN-CW模型中,使用通道间阈值不共享的残差收缩模块(RSBU-CW),经过卷积层运算之后的特征图的每个通道有着自己独立的阈值。全局均值池化被应用在特征图的绝对值上面,来获得一维向量,并且输入到一个两层的全连接层中。全连接层的第二层有一个以上神经元,且神经元的个数等于输入特征图的通道数;全连接层的输出被强制到0和1之间,之后计算出阈值,阈值始终是正数,并且被保持在一个合理范围内,从而防止输出特征都是零的情况。

S4、对搭建的DRSN-CS模型和DRSN-CW模型进行优化,对每层卷积层进行批量归一化(Batch Normalization),降低对网络初始化的敏感性,使用LeakyRelu激活函数减轻梯度消失问题。

进一步的,LeakyRelu激活函数为:

其中,a表示斜率,一般情况下a表示很小的一个正常数,这样既实现了单侧抑制,又保留了部分负梯度信息不完全丢失;m表示此激活函数的输入变量。

上述Batch Normalization批量归一化方法是针对每一批数据,在网络的每一层输入之前增加归一化处理(均值为0,标准差为1),将所有批数据强制在统一的数据分布下,即对该层的任意一个神经元(假设为第k维)

其中,k为维度,x

S5、采用反向传播算法分别训练DRSN-CS模型和DRSN-CW模型,并采用交叉验证循环重复训练多次,基于随机梯度下降算法进行训练。

具体的,采用交叉验证进行循环训练,将心电数据集随机分成5个相等的部分,选取其中的4部分用来训练,剩下的一部分作为测试,循环重复5次。基于随机梯度下降算法训练分类模型,采用SGD优化器,学习率指数衰减。

所有心电数据的标签均采用one-hot形式,DRSN-CS和DRSN-CW这两个模型总的损失函数定义为所有参与训练的心电数据交叉熵损失函数的和,单个心电数据的标签及预测结果分别为label

其中,n表示训练数据集上的样本数据,cross_entropy()表示交叉熵损失函数,prediction

S6、比较DRSN-CS和DRSN-CW的分类准确率,选取准确率高的作为最终分类模型,对心电异常信号识别分类。

上述实施例中,通过使用了DCGAN进行数据增强,以解决实际生活中常见的数据集样本不平衡的问题,其次使用到了通道间共享阈值的深度残差收缩网络(DRSN-CS)以及通道间阈值不共享的深度残差收缩网络(DRSN-CW)两种网络结构训练模型,使用到了软阈值化(也就是一种流行的收缩方程)作为非线性层,被嵌入到神经网络之中,采用特殊设计的子网络,来自适应地设置阈值,从而使每段心电数据信号都有着自己独特的一组阈值,以有效地消除噪声相关的特征。相比传统心电信号的分析流程来说,省略掉了使用类似于小波变换等去噪步骤,节省了时间,提高了工作效率,同时也提升了模型分类的准确率。使得模型在单导联的短时数据上有明显的改进效果,提高了模型的稳定性,另外使用1-D卷积神经网络提升网络的整体效率,保证模型的鲁棒性。本发明能够提高心电数据中异常数据的检出率、识别精度以及识别的效率,辅助医生诊断,减轻其工作负担,提高诊断效率、为医生提供客观、准确的诊断结果,因此具有较大的社会实用价值。

以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

相关技术
  • 一种单导联心电异常信号识别方法
  • 一种心电图导联的识别方法及心电图训练系统
技术分类

06120113158478