掌桥专利:专业的专利平台
掌桥专利
首页

一种通过自动睡眠分期结果的常见睡眠疾病检测方法

文献发布时间:2023-06-19 11:49:09


一种通过自动睡眠分期结果的常见睡眠疾病检测方法

技术领域

本发明属于睡眠检测技术领域,具体涉及一种通过自动睡眠分期结果的常见睡眠疾病检测方法。

背景技术

睡眠是人类生理活动中最重要的昼夜节律之一。睡眠质量会影响许多基本活动的表现,例如学习,记忆和注意力集中。目前,患有睡眠障碍及睡眠疾病的人越来越多。常见的睡眠疾病有夜间癫痫和阻塞性呼吸暂停综合征。夜间癫痫发作症状对睡眠结构有明显影响,表现为睡眠效率的降低和REM睡眠数量的减少,肢体抽搐,意识丧失等。阻塞性呼吸暂停患者记忆力减退,注意力不能集中,引起躁动、多梦、遗尿、阳痿、晨起头痛等。严重持久的病人可并发高血压、心律失常、心肺功能衷竭等。睡眠疾病严重危害到人们的健康。睡眠质量评估最重要的部分是睡眠阶段的分类,即将不同睡眠时间段划分为WAKE、REM、N1、N2和N3期,共五个正常类别。睡眠分期有助于诊断与睡眠有关的疾病。在传统的睡眠分期方法中,受试者必须通过佩戴多导睡眠脑电记录仪记录多导睡眠图。睡眠专家通过监视信号对睡眠阶段进行分类,这费时费力且容易受到睡眠专家的主观影响。所以研究者们开始不断研究自动睡眠分期方法。自动睡眠分期方法的研究算法大致分为两类,传统的机器学习以及应用人工神经网络的深度学习。

早期,研究者们通过提取特征结合机器学习的方式来进行自动睡眠分期。最常见的方法机器学习分类方法包括决策树、随机森林,支持向量机。Fraiwan通过提取时频特征、熵特征结合随机森林分类器进行分类。Zhu提取时频特征,使用支持向量机进行分类。Hassan使用来自可调Q因子小波变换和随机森林分类器进行分类。但是使用特征提取与传统机器学习相结合的算法,普遍存在准确率不高、不适用于大规模训练样本、N1期识别率低、忽略信号以及标签的时间连续性等缺点,实用性不高。

随着人工神经网络的发展,深度学习在睡眠分期领域类逐渐流行,深度学习是机器学习领域中一个新的研究方向,它通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。近年来,深度学习在睡眠分期领域取得了很多成果。2018年,Olesen用大规模多通道数据集,采用50层卷积的CNN方法,得到了84%的准确率,但是其CNN层数太多,耗费计算资源太多,不容易工程化。2019年,Yildirim等人通过19层1D-CNN模型,达到了90%以上的准确率,并且该算法适用于入睡正常与入睡困难人群。然而,CNN提取的时间信息少,且层数多,跳跃性强,忽略了时间连续性。2020年,Wei Qu等人通过CNN提取特征,结合注意力机制与残差神经网络进行睡眠分期,得到了84%以上的准确率,并且解决了上述深度学习因为网络层次太多而耗时过多的问题。但其准确率偏低,且网络结构复杂。

有了自动睡眠分期结果即睡眠状态后,睡眠医生可以根据睡眠状态判断常见睡眠疾病,如夜间癫痫,阻塞性睡眠呼吸暂停等。而现在利用计算机进行自动睡眠疾病检测的研究主要针对单一的睡眠疾病。如Zhao在EEG中提取相关特征,通过卷积网络来判断被试是否患有癫痫。Zarei用ECG通过小波变换和提取熵特征来检测被试是否患有阻塞性睡眠呼吸暂停疾病。但是,目前并没有通过睡眠分期结果直接判断多种睡眠疾病的研究。

发明内容

本发明的目的在于克服现有技术的不足,提供一种采用条件随机场和时间注意力模型,可以有效提取睡眠数据的时间连续性信息,数据量少,且可以完成多种睡眠疾病检测的通过自动睡眠分期结果的常见睡眠疾病检测方法。

本发明的目的是通过以下技术方案来实现的:一种通过自动睡眠分期结果的常见睡眠疾病检测方法,包括以下步骤:

S1、数据集获取:获取健康人的睡眠数据集、患有夜间额叶癫痫的患者的睡眠数据集、患有阻塞性睡眠呼吸暂停的患者的睡眠数据集;

S2、特征提取:将步骤S1获取的数据进行分段处理,以30秒为步长将数据分成相同长度的若干数据段,然后对每个数据段进行特征提取;

S3、采用时间注意力结合条件随机场构建睡眠自动分期模型;

S4、采用迁移学习进行患者数据集分期;

S5、构建睡眠疾病检测模型:将睡眠分期的预测结果作为输入数据,打上相应身体状态的标签,制作睡眠疾病检测数据集;然后通过机器学习Xgboost模型进行训练,得到睡眠疾病检测模型。

进一步地,所述步骤S1具体实现方法为:健康人的数据集为通过睡眠设备采集的多导睡眠图PSG,共5个通道,分别为2个EEG通道,2个EOG通道,1个EMG通道;

患有夜间额叶癫痫的患者的睡眠数据集从Physionet的CAP Sleep Database中获取,包括2个EEG通道,2个EOG通道和1个EMG通道;

患有阻塞性睡眠呼吸暂停的睡眠数据集从Physionet的圣文森特大学医院/都柏林大学学院睡眠呼吸暂停数据库中获取,包括2个EEG通道,2个EOG通道,1个EMG通道。

进一步地,所述步骤S2具体实现方法为:

S21、给健康人数据集打上标签,分别为清醒期WAKE、快速眼动期REM、非快速眼动期第一阶段N1、非快速眼动期第二阶段N2和非快速眼动期第三阶段N3期;

S22、将患有夜间额叶癫痫的患者的睡眠数据集的标签整合,并打上标签;

S23、将患有阻塞性睡眠呼吸暂停的患者的睡眠数据集的标签整合,并打上标签;

S24、以30秒为步长将睡眠数据分成相同长度的若干数据段,并与标签一一对应;

S25、根据各个通道的生理信号进行特征提取,将每30s的睡眠数据提取以下特征:时域特征量、频域特征量和非线性动力学特征量;

时域特征量包含统计学特征量和几何学特征量;频域特征量包括功率谱密度特征量和时频特征量(例如统计峰度、偏度、Hjorth参数);非线性动力学特征量(例如LZ复杂度)包括分形维数特征量和复杂度特征量;

部分特征公式计算如下:

偏度:数据集关于其平均值对称性的度量,公式为:

峰度:四阶标准矩,公式为:

过零率:是指一个信号的符号变化的比率;

Hjorth参数:包括作为时间序列方迁移率Hm和复杂度Hc,表示功率谱标准差比例和频率变化:

LZ复杂度:是一种表征时间序列里出现新模式的速率的方法,设c(n)为序列S的LZ复杂度,满足:当n→∞时,c(n)会趋于定值n/log

进一步地,所述步骤S3具体实现方法为:将提取的特征向量输入Bi-GRU中提取时序特征,通过sigmoid函数给相关度高的时间序列赋高的权重,再与原始输入特征向量相乘,将得到的结果输入到一个FC中,得到条件随机场CRF的输入,公式为Attention(X,X)=Sigmoid(GRU(X))X,其中X为输入的特征向量;将时间注意力机制得到的预测标签输入至CRF,利用CRF线性链方法建模,通过维特比算法解码出最优标签序列路径;修正全部数据及的标签序列,使其不断和专家人工睡眠分期判定结果的标签序列吻合,当二者完全吻合时,得到睡眠自动分期模型。

进一步地,所述步骤S4具体实现方法为:

S41、将健康人睡眠数据作为源域,训练睡眠自动分期模型作为基本模型并保存模型及权重参数;

S42、将患有夜间额叶癫痫的患者的睡眠数据集作为目标域,送入源域的模型,并以源域的权重参数作为目标域训练的初始参数进行微调,并保存结果最好的微调后的模型及参数;

S43、最后将患有阻塞性睡眠呼吸暂停的患者睡眠数据集作为第二个目标域,把步骤S42保存的模型及参数作为此目标域的初始模型及参数,再次进行微调,并保存结果最好的微调后的模型及参数;

S44、将健康人的睡眠数据集、患有夜间额叶癫痫的患者的睡眠数据集、患有阻塞性睡眠呼吸暂停的患者的睡眠数据集分别输入步骤S43训练好的模型中进行分类,得到三种不同类型数据集的睡眠分期测试结果。

本发明的有益效果是:本发明采用条件随机场,提取睡眠状态之间的信息;采用时间注意力模型,可以有效提取睡眠数据的时间连续性信息;引入迁移学习,将睡眠疾病数据集迁移到健康人数据集的网络上;采用上述模型得到的睡眠分期结果作为输入,数据量少,且可以完成多种睡眠疾病检测。

附图说明

图1是自动睡眠分期算法的整体框图;

图2是时间注意力模型的框图;

图3是Bi-GRU网络模型示意图;

图4是GRU节点内部结构;

图5是迁移学习的示意图;

图6是常见睡眠疾病检测的整体框图。

具体实施方式

下面结合附图和具体实施例进一步说明本发明的技术方案。

如图1所示,本发明的一种通过自动睡眠分期结果的常见睡眠疾病检测方法,包括以下步骤:

S1、数据集获取:获取健康人的睡眠数据集、患有夜间额叶癫痫的患者的睡眠数据集、患有阻塞性睡眠呼吸暂停的患者的睡眠数据集;

具体实现方法为:健康人的水面数据集获取方法为:本实施例招募17个健康人作为被试,通过睡眠设备采集了103个晚上的睡眠多导睡眠图PSG,共7个通道,分别为三个EEG通道,两个EOG通道,一个EMG通道以及一个ECG通道;为了与另外两个数据集保持一致性,本实施例只采用2个EEG通道,2个EOG通道,1个EMG通道的数据。

患有夜间额叶癫痫的患者的睡眠数据集从Physionet的CAP Sleep Database中获取。CPA睡眠数据库是108幅多导睡眠图记录的集合,这些记录已在意大利帕尔马的Ospedale Maggiore睡眠障碍中心登记。包括3个EEG通道,2个EOG通道和1个EMG通道,以及双侧胫骨前肌电图,呼吸信号和心电图。其中有16名健康受试者,40例诊断为夜间额叶癫痫的患者,22例REM行为障碍,10例有腿部周期性运动,9例失眠,5例嗜睡症,4例睡眠呼吸紊乱和2例为磨牙症。由于数据集大小的原因,本实施例只采用40例诊断为夜间额叶癫痫的患者的睡眠数据集,通道选取与健康人数据集一致,包括2个EEG通道,2个EOG通道和1个EMG通道。

患有阻塞性睡眠呼吸暂停的睡眠数据集从Physionet的圣文森特大学医院/都柏林大学学院睡眠呼吸暂停数据库中获取,共25名受试者均被诊断阻塞性睡眠呼吸暂停。记录的信号包括:脑电图(C3-A2),脑电图(C4-A1),左眼电图,右眼电图,EMG,ECG,口鼻气流(热敏电阻),胸腔运动,腹部运动表,氧气饱和度和身体位置。本实施例选取的数据包括2个EEG通道,2个EOG通道,1个EMG通道。

S2、特征提取:将步骤S1获取的数据进行分段处理,以30秒为步长将数据分成相同长度的若干数据段,然后对每个数据段进行特征提取;具体实现方法为:

S21、给健康人数据集打上标签,分别为清醒期WAKE、快速眼动期REM、非快速眼动期第一阶段N1、非快速眼动期第二阶段N2和非快速眼动期第三阶段N3期;

S22、将患有夜间额叶癫痫的患者的睡眠数据集的标签整合,并打上标签;

S23、将患有阻塞性睡眠呼吸暂停的患者的睡眠数据集的标签整合,并打上标签;

S24、以30秒为步长将睡眠数据分成相同长度的若干数据段,并与标签一一对应;

S25、根据各个通道的生理信号进行特征提取,将每30s的睡眠数据提取以下特征:时域特征量、频域特征量和非线性动力学特征量;

时域特征量包含统计学特征量和几何学特征量;频域特征量包括功率谱密度特征量和时频特征量(例如统计峰度、偏度、Hjorth参数);非线性动力学特征量(例如LZ复杂度)包括分形维数特征量和复杂度特征量;

部分特征公式计算如下:

偏度:数据集关于其平均值对称性的度量,公式为:

峰度:四阶标准矩,公式为:

过零率:是指一个信号的符号变化的比率,例如信号从正数变成反向,公式为:ZCR=count(n|(x

Hjorth参数:包括作为时间序列方迁移率Hm和复杂度Hc,表示功率谱标准差比例和频率变化:

LZ复杂度:是一种表征时间序列里出现新模式的速率的方法,脑电信号的Lempel-Ziv复杂度反映了脑电信号的信息量的大小,可以揭示大脑活动的相关规律。设c(n)为序列S的LZ复杂度,满足:当n→∞时,c(n)会趋于定值n/log

S3、采用时间注意力结合条件随机场构建睡眠自动分期模型;注意力模型的框图如图2所示。将提取的特征向量输入图3和图4所示的Bi-GRU中提取时序特征,通过sigmoid函数给相关度高的时间序列赋高的权重,再与原始输入特征向量相乘,将得到的结果输入到一个FC中,得到条件随机场CRF的输入,公式为Attention(X,X)=Sigmoid(GRU(X))X,其中X为输入的特征向量;将时间注意力机制得到的预测标签输入至CRF,利用CRF线性链方法建模,通过维特比算法解码出最优标签序列路径;修正全部数据及的标签序列,使其不断和专家人工睡眠分期判定结果的标签序列吻合,当二者完全吻合时,得到睡眠自动分期模型。

S4、采用迁移学习进行患者数据集分期;引入如图5所示的迁移学习方法,具体实现方法为:

S41、将健康人睡眠数据作为源域,训练睡眠自动分期模型作为基本模型并保存模型及权重参数;

S42、将患有夜间额叶癫痫的患者的睡眠数据集作为目标域,送入源域的模型,并以源域的权重参数作为目标域训练的初始参数进行微调,并保存结果最好的微调后的模型及参数;

S43、最后将患有阻塞性睡眠呼吸暂停的患者睡眠数据集作为第二个目标域,把步骤S42保存的模型及参数作为此目标域的初始模型及参数,再次进行微调,并保存结果最好的微调后的模型及参数;

S44、将健康人的睡眠数据集、患有夜间额叶癫痫的患者的睡眠数据集、患有阻塞性睡眠呼吸暂停的患者的睡眠数据集分别输入步骤S43训练好的模型中进行分类,得到三种不同类型数据集的睡眠分期测试结果。

上述步骤S41~S43中,所有模型训练的实验中均采用五折交叉验证方法。

S5、构建睡眠疾病检测模型:如图6所示,将睡眠分期的预测结果作为输入数据,打上相应身体状态的标签,制作睡眠疾病检测数据集,即健康人对应为0,患有夜间额叶癫痫的对应为1,患有阻塞性睡眠呼吸暂停的对应为2;然后通过机器学习Xgboost模型进行训练,得到睡眠疾病检测模型,Xgboost采用网格搜索法寻找最优参数。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

相关技术
  • 一种通过自动睡眠分期结果的常见睡眠疾病检测方法
  • 一种基于睡眠分期的抑郁症自动检测方法
技术分类

06120113061159