掌桥专利:专业的专利平台
掌桥专利
首页

一种基于RR间期心电数据和集成学习的房颤节律识别方法

文献发布时间:2023-06-19 12:25:57


一种基于RR间期心电数据和集成学习的房颤节律识别方法

技术领域

本发明属于心电信号处理技术领域,尤其涉及一种基于心电RR间期数据,融合了LightGBM和LSTM两种算法的房颤节律智能识别方法。

背景技术

心房颤动节律,简称房颤,是发生率仅次于过早搏动的、最常见的心律失常之一。根据流行病统计资料,最近几年以来,由于人口老龄化和慢性心脏病等因素的影响,在我国房颤患者大约有1000万,其房颤发生率为0.77%,并且随着年龄的增加,其发病率逐渐上升,在老年人中危害尤甚。当前,心房颤动的防治仍是临床心电图生理学研究的前沿课题。

房颤节律会导致心房传导功能紊乱,心室节律不规则,心功能减退;引起血流动力学障碍,是动脉栓塞和脑栓塞的主因之一。但房颤是阵发性疾病,短时心电图检测容易漏诊;并且房颤发病时患者可能表现为心悸、疲劳、头晕和呼吸困难等非特异性症状,导致诊断误导;最终临床只有三分之一的患者会被及时诊断,特别是老年患者,房颤节律确诊难度很大。在临床应用上,心电图信号(ECG) 常受到噪声干扰而导致波形变形,极大影响了基于心房活动分析检测算法的表现。因此基于心室响应分析(即基于RR间期分析)的方法得到更广泛的使用。房颤节律的主要特征表现为P波消失、RR间期绝对不规则以及QRS波形态各异。根据这些不同特征,研究者创造了与之对应的房颤节律识别方法,主要方法包括:基于心房活动特征的识别方法、基于RR间期的识别方法以及两者相结合的识别方法。

发明内容

本发明采用如下技术方案,即一种基于集成学习和RR间期心电数据的房颤节律识别方法,达到减轻人工工作量、提高医生对房颤节律诊断效率的目的。

其技术方案是这样的:一种基于集成学习和RR间期心电数据的房颤节律识别方法,其特征在于,包括以下步骤:

S1:特征提取统计学特征和时频特征;

统计学特征:导入心电信号RR间期数据,提取12个统计学特征;

时频特征:取心电信号RR间期数据的倒数转化为心率信号并进行多项式曲线拟合,通过上采样扩大RR间期的心率信号,对心率信号进行小波散射计算,获取其对应的时频特征;

S2:分类算法:

通过提取的统计学特征,采用LightGBM算法进行分类并得到预测概率,通过提取的时域-频域特征,采用LSTM算法进行分类得到预测概率;

S3:融合策略:

通过加权平均法融合计算出最终的预测概率P,根据P的大小进行阈值判定,测试样本是否为房颤节律。

所述步骤S1具体为:

S1.1:对心电信号RR间期数据进行分析判断是否发生为房颤节律:得到标签为0的非房颤节律数据样本,每个样本包含30个心电信号的RR间期,其中第i个样本的数据记为:s

上述数据来自第二届江苏省大学生生物医学工程创新设计大赛: http://114.220.179.127:81/,共有17247例房颤节律数据样本,标签为1;23237 例的非房颤节律数据样本,标签为0;

S1.2:对导入的数据进行整理后,对于任何一个样本,提取出12个统计学特征值,包括:均值、中值、高四分位、低四分位、标准差、均方差、平均绝对偏差、中值绝对偏差、偏度、峰度、模糊熵、近似熵;

计算公式如下:

表1统计学特征值计算公式

表2是否发生房颤节律情况下的12个统计学特征值

S1.3:对导入的数据进行整理后,对于任何一个样本,计算时频特征,具体步骤为:

S1.3.1:由导入的数据s

S1.3.2:为保留离散心率x

S1.3.3:对对第i个数据的心率变化函数x

进行采样,得到采样后离散的心率变化函数x

S1.3.4:以小波散射的方式,提取时域-频域特征;通过对傅里叶变换以及传统小波变换的结合,对于一个能量有限的有限长时间信号x(t),它的小波散射变换为:

其中,Φ(t)代表母波函数,a为连续比例参数,b为表示母小波沿t域的位移;

通过小波散射变换的公式,得到非线性相关的因子的传播公式如下:

其中,p为散射路径序列,p=(λ

从而可以得到作为输入特征的散射因子集合为:

Sx={S[Φ]x,S[λ

所述步骤S2具体为:

S2.1:采用LightGBM集成学习算法对提取出的12个统计学特征完成模型的训练,得到预测概率P

P

其中F

LightGBM是使用了分布式梯度下降树GBDT和直方图算法的集成学习算法;直方图算法原理:将连续的浮点特征离散成k个离散值,并构造宽度为k的直方图;GBDT算法原理:使用若干个函数F(x)对分类预测,表达式如下:

F

其中m为迭代次数,h(x)为基分类器,系数γ计算公式如下:

得到的最终分类器为:

其中M为迭代的总次数;

S2.2:采用LSTM算法对提取出的时频特征完成模型的训练,得到预测概率 P

(c

其中c为单元格状态,h为输出。

所述步骤S3具体为:

S3.1:将LightGBM集成学习算法和LSTM算法两种算法结合,利用加权平均法计算得到最终的预测概率P:

P=wP

其中,w∈[0,1],P

S3.2:将P以0.5为阈值划分正例与反例;

S3.3:利用数据集的10%作为验证集进行极大似然估计,选择模型最优的结合权重w。

与现有技术相比,本发明的有益效果:

本发明对心电RR间期的数据进行特征提取,融合LightGBM和LSTM算法,采用集成学习的方式进行训练和测试,用以识别样本是否发生房颤节律,并且在测试集上经过10次交叉验证,所提出的集成学习分类算法的准确率达97.14%;本发明具有识别房颤节律准确率高、速度快的优点。

附图说明

图1为本发明的算法流程图;

图2为心电信号的RR间期图像;

图3为多项式拟合后心率变化趋势与散射得到的小波散射因子示意图之一;

图4为多项式拟合后心率变化趋势与散射得到的小波散射因子示意图之二;

图5为训练集的训练准确率的结果图;

图6为验证集的测试准确率的结果图。

具体实施方式

下面结合附图和具体实施方式,进一步阐明本发明。

如图1所示,为本发明公开的基于LightGBM算法与LSTM神经网络模型的心电RR间期数据的房颤节律智能识别方法的流程图,具体包括以下步骤:

首先从excel表导入30个RR间期数据文件,对数据进行预处理。

左侧采用LightGBM集成学习算法,对于每个序列,提取出12个统计学特征值:均值、中值、高四分位、低四分位、标准差、均方差、平均绝对偏差、中值绝对偏差、偏度、峰度、模糊熵、近似熵。完成模型的训练,得到预测概率P

右侧采用LSTM算法,由于原始数据为30个离散的RR间期值,为更好地表征心率的变化情况,进行房颤节律的预测,取心电信号RR间期数据的倒数转化为心率信号,为获取足够的数据,进行多项式曲线拟合,并以3000采样点每段的采样率重新采样,即以上采样的方式扩大RR间期的心率信号,再以小波散射的方式,提取时域-频域特征。算法完成模型的训练,得到预测概率P

将LightGBM集成学习算法和LSTM算法两种算法结合,利用加权平均法计算得到最终的预测概率。并利用数据集的10%作为验证集进行极大似然估计得到最优的权重w。

最终以阈值τ=0.5为界判断有无房颤节律。

根据公式,计算模型的准确率:

单独使用LightGBM算法进行房颤节律预测时,得到的十折交叉验证准确率如图5所示。

单独使用LSTM算法进行房颤节律预测时,得到的十折交叉验证准确率如图 6所示。将LightGBM集成学习算法和LSTM算法两种算法结合,得到的十折交叉验证准确率如图6所示。

实验步骤:

采用具体实施方式中的步骤S1,导入数据库。

数据来自第二届江苏省大学生生物医学工程创新设计大赛,共有17247例房颤节律数据样本,标签记为1,23237例的非房颤节律数据样本,标签记为0,每个样本包含30个心电信号的RR间期;提取每组RR间期的12个统计学特征:均值、中值、高四分位、低四分位、标准差、均方差、平均绝对偏差、中值绝对偏差、偏度、峰度、模糊熵、近似熵;提取每组RR间期的时频特征:取心电信号RR间期数据的倒数转化为心率信号并进行多项式曲线拟合,通过上采样扩大 RR间期的心率信号,同时构建一个最高阶次为1的小波散射网络,散射因子采样间隔为8,得到3×84的时频特征。

采用具体实施方式中的步骤S2,将提取出的12个统计学特征作为输入,使用LightGBM进行分类,得到预测概率P

采用具体实施方式中的步骤S3,通过验证集给出最优的算法结合权重w,将两种算法结合得到最终的预测概率P,并以0.5为分类阈值得到样本分类。

本发明中将总样本划分为十个分块,共进行十折交叉验证,每折交叉验证采用其中的一个划分块作为测试样本,剩余九个划分块作为训练样本;

本发明中,记AF,Atrial Fibrillation为房颤节律,nonAF,non-AtrialFibrillation 为非房颤节律,TP,True Positive,真阳性为被模型预测为AF的AF样本,TN,True Negative,真阴性为被模型预测为nonAF的nonAF样本,FP,False Positive,假阳性为被模型预测为AF的nonAF样本,FN,False Negative,假阴性为被模型预测为nonAF的AF样本,准确率定义为所有样本正确分类的概率。

最终,利用公式计算平均准确率:

其中k=10(十折),得到各算法的准确率如下表:

表3各算法的准确率

如表3所示,两种算法集成后的平均准确率为0.9714,相比于LightGBM和 LSTM两种算法分别提高了0.0217和0.0711。

将LightGBM集成学习算法和LSTM算法两种算法结合的优势如下:准确率更高,通过调整多项式阶数和引入小波散射系数,便于提取所需的统计学特征和时频信息。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为发明的优选例,并不用来限制本发明,在不脱离本发明新型精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

相关技术
  • 一种基于RR间期心电数据和集成学习的房颤节律识别方法
  • 一种基于RR间期比值散点图的动态心电数据处理方法及处理装置
技术分类

06120113298299