掌桥专利:专业的专利平台
掌桥专利
首页

一种单通道脑电睡眠分类模型及构建方法

文献发布时间:2024-04-18 19:58:53


一种单通道脑电睡眠分类模型及构建方法

技术领域

本发明涉及睡眠质量和睡眠疾病诊断领域,具体来说,涉及基于脑电信号进行睡眠分类的技术领域,更具体地说,涉及基于对抗式生成网络增强的、面向普适化环境的单通道脑电睡眠分类模型及构建方法。

背景技术

睡眠监测和分期在人类健康和疾病诊断中具有重要作用,可以提供有关个人睡眠质量和脑和神经系统相关疾病的丰富信息。目前,有两种主要的睡眠阶段分类标准被广泛采用,包括Rechtschaffen&Kales(R&K)标准和美国睡眠学会医学(American Academy ofSleep Medicine,AAS M)标准。R&K标准最早于1968年提出,其基于多导睡眠图(Polysomnography,PSG)的多模态生理时序信号,如脑电(Electroencephalography,EEG)、心电(Electrocardiogram,ECG)、眼电(Electrooculography,EOG)和肌电(electromyography,EMG)。PSG将睡眠分为七个阶段,包括清醒(Wake)、快速眼动(Rapid Eye Movement,REM)和四个非快速眼动(Non-Rapid Eye Movement,NREM)阶段,其中NREM阶段包括阶段1(S1)、阶段2(S2)、阶段3(S3)和阶段4(S4)。前两个阶段被归类为浅睡眠,后两个阶段被称为深度睡眠或慢波睡眠。2007年,AASM对R&K标准进行了改进,将S3和S4阶段合并为S3阶段,并将S1、S2、S3阶段重命名为N1、N2、N3阶段,改进后的AASM标准将睡眠周期分为Wake、REM、N1、N2和N3阶段,共五个睡眠阶段分类。这些国际公认的睡眠阶段分类标准为睡眠监测提供了基础和一致性依据。基于这些标准的睡眠阶段分类在医疗保健和疾病诊断等多个领域中扮演着不可或缺的角色,为人类健康和疾病管理提供了重要的支持。

传统的脑电睡眠阶段分类方法通常使用时频和基于统计的技术对原始信号进行分析。尽管这些方法在一定程度上取得了成果,但它们过于依赖专家的先验知识和手动分析,导致工作量大且分类准确度有限。随着科技的发展,基于机器学习和深度学习的睡眠阶段分类方法简化了模型训练流程,并获得了显著的效果,尤其是利用多通道和多模态的PSG信号进行的睡眠阶段分类,取得了非常好的结果。然而,佩戴多通道PSG或EEG的睡眠监测设备对受试者来说并不舒适,会影响睡眠质量,由此限制了这些设备在普适环境(如家庭环境)中的应用。此外,设备电极数量多导致设备笨重不便携,并且由于佩戴时的不适和睡眠时的人为干扰,信号可能产生偏差。

为了克服上述挑战,人们开发了一些适用的设备和方法。例如,基于单通道脑电图的睡眠监测方法使用特定设计的单通道脑电图设备来感知睡眠数据,并利用机器学习算法对睡眠阶段进行分类。常用的通道包括位于国际10-20系统的左中央C3-A2通道、右中央C4-A1通道和靠近耳朵的通道,因为这些通道的采集位置常伴随着受试者舒适的睡眠姿势。基于此,有人研发了入耳式脑电图设备,并将其用于商业用途中的驾驶员睡意监测。此外,研究人员还在探索基于智能手表、智能手机和智能眼罩的睡眠监测设备。然而,单通道的数据由于只能感知局部位置的信息,包含的信息有限,如果仅简单基于单通道数据进行模型训练以用于睡眠阶段分类会存在准确性不足的问题。针对该问题,目前有一些脑电相关的数据扩充方法,例如申请号为CN202310259223.9的专利申请中,提供了一种用于脑障碍患者康复训练中的神经反馈调制方法及系统,其将脑电EEG序列信号翻译成理想的肌电EMG序列信号,并采用理想的肌电信号与真实的肌电信号对比,来判定脑障碍患者的脑对肌电的控制程度。再例如,申请号为CN202210071629.X的专利申请中提供面向脑卒中患者的跨被试康复训练方法,其使用健康人的运动想象脑电数据生成新的脑电数据,以达到数据扩充的目的,用大量扩充的健康人的脑电数据来辅助脑卒中患者的诊断和康复。

由此可见,充分利用多通道的信息对于睡眠监测非常重要。然而,现有的可穿戴设备中,手环等非脑部监测设备只能感知肢体的活动信息,但无法捕捉真实的大脑状态。而单通道设备(如单通道入耳式脑电图)等信号采集通道较少,只能感知大脑特定位置的有限信息。也有一些研究人员尝试使用脑电数据生成理想的肌电数据并通过对比理想的肌电数据与真实的肌电数据来评估脑障碍患者的康复程度。然而,这一方法面临着生理信号的非平稳性和受试者差异等多个问题,因此直接从原始时序数据生成相应的时序数据并不可靠。另外,虽然生成的数据可以用作原始数据的扩充和增强,但直接将其作为判定依据是不可靠的。基于上述各种方案的睡眠监测效果远不如基于多通道临床设备的睡眠监测效果,所以充分利用多通道数据的丰富信息,使得基于单通道数据的睡眠阶段分类效果逼近基于多通道的睡眠阶段分类效果是目前面临的重要挑战。建立单通道与多通道信息的映射成为解决这一挑战的关键。

发明内容

因此,本发明的目的在于克服上述现有技术的缺陷,提供一种一种单通道脑电睡眠分类模型及构建方法。

根据本发明的第一方面,提供一种单通道脑电睡眠分类模型构建方法,所述方法包括:S1、获取原始PSG数据,所述PSG数据包含多条记录,每条记录包含多个通道数据,所述每条记录对应有睡眠阶段分类标签;S2、以一个预设的脑电通道为目标单通道,以多个其他通道为关联通道,从所述原始PSG数据中的每条记录中筛选出目标单通道数据和原始关联通道数据组成训练数据集;S3、构建初始分类模型,所述初始模型包括特征提取模块、生成式对抗单元、分类单元、融合模块,其中:所述特征提取模块用于提取目标单通道数据的特征以及多个原始关联通道数据的特征;所述生成式对抗单元用于根据所述目标单通道数据的特征生成多个关联通道的特征,其包括多个生成式对抗模块,一个生成式对抗模块对应于一个关联通道,且每个生成式对抗模块包括生成器及对应的鉴别器,所述生成器用于根据所述目标单通道数据的特征生成对应关联通道特征,所述鉴别器用于基于对应原始关联通道数据的特征鉴别其对应生成器生成的关联通道特征的真假;所述分类单元用于根据目标单通道数据的特征、以及基于其生成的多个关联通道的特征分别进行睡眠阶段分类预测以获得多个睡眠阶段分类预测结果;所述融合模块用于将分类单元获得的睡眠阶段分类预测结果进行融合以得到目标单通道数据对应的最终睡眠分类结果;S4、采用训练数据集训练所述初始分类模型至收敛获得以特征提取模块、多个生成器、分类单元、融合模块构成的模型,其中,训练过程中采用每个生成器的损失更新对应生成器的参数,采用每个鉴别器损失更新对应鉴别器的参数,采用分类标签损失更新特征提取模块、分类模块和融合模块的参数。

优选的,所述目标单通道特征提取模块被配置为FeatureNet模型。

优选的,所述分类单元包括多个分类模块,一个分类模块用于根据一个生成器生成的关联通道特征进行睡眠阶段分类。

优选的,所述预设的脑电通道为C3-A2通道或C4-A1通道。

优选的,所述其他多个通道为目标单通道以外的其他脑电通道、心电通道、肌电通道、眼电通道中的多个通道。

优选的,所述其他多个通道为目标单通道以外的其他脑电通道中的2个脑电通道、1个心电通道、2个眼电通道、1个肌电通道。

优选的,所述每个生成器的损失为:

其中,L(G)表示生成器损失,E表示期望,p

优选的,所述每个鉴别器的损失为:

其中,L(D,G)表示鉴别器损失,p

优选的,所述分类标签损失为:

其中,I表示目标单通道数据的数据样本量,N表示生成式对抗模块的数量,L

根据本发明的第二方面,提供一种基于本发明第一方面所述方法的单通道脑电数据睡眠分类模型,所述模型包括:特征提取模块,用于提取目标单通道数据的特征;多个生成器,每一个生成器对应于一个关联通道,且每个生成器用于根据所述目标单通道数据的特征生成对应关联通道特征;分类单元,用于根据目标单通道数据的特征、以及基于其生成的多个关联通道的特征分别进行睡眠阶段分类预测以获得多个睡眠阶段分类预测结果;融合模块,用于将分类单元获得的睡眠阶段分类预测结果进行融合以得到目标单通道数据对应的最终睡眠分类结果。

与现有技术相比,本发明利用GAN的生成器,基于现有的单通道脑电神经网络特征生成其他通道的神经网络特征,并利用多个鉴别器对每个通道的一对一鉴别,帮助生成器实现精准的跨通道映射生成,从而实现基于单通道特征获取多通道信息的目的,生成的多通道特征数据和原始真实特征数据同步融合使用,能够增强基于单通道EEG的普适环境下的睡眠阶段分类效果。

附图说明

以下参照附图对本发明实施例作进一步说明,其中:

图1为根据本发明实施例的一种单通道脑电睡眠分类模型构建方法流程示意图;

图2为根据本发明实施例的初始分类模型结构示意图。

具体实施方式

为了使本发明的目的,技术方案及优点更加清楚明白,以下通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如背景技术中所述的,现有技术中基于单通道数据的睡眠阶段分类方案面临的最重要的挑战就是如何构建单通道信息与多通道之间的映射,从而通过单通道数据采集来获取多通道信息,以便基于单通道数据构建更好的多通道分类模型。本发明的目的在于充分利用现有的多通道数据训练模型,使其能够提升在普适环境下使用单通道数据推理的效果。这其中,跨通道映射是关键,发明人借鉴于生成式对抗网络(Generative AdversarialNetworks,GAN)的原理,将其应用于跨通道映射,使得可以基于单通道脑电数据获得很好的多通道分类模型,并可以将模型应用于普适领域。GAN的生成器和鉴别器组件为跨通道映射和生成提供了有益的思路。

在进行通过多通道数据提升基于单通道EEG信号的睡眠阶段分类效果的研究时,发明人发现构建用于多通道数据训练、单通道数据测试的模型存在训练测试不一致的困难。此外,由于通道之间的相关关系非常复杂,构建一个能够将多通道信息迁移给单通道数据的跨通道关联网络模型的难度非常大。GAN为本发明提供了关联映射的思路。通过使用GAN的特殊生成器和鉴别器结构,模型可以自主学习和判断生理信号的神经网络隐层表征的映射关系。例如,通过鉴别器可以评估生成数据的可信度和所属的通道。为了避免相互干扰,本发明考虑为每个通道设置专属的鉴别器。此外,发明人发现直接生成生理时序信号数据非常困难。因此,决定利用神经网络的特征提取能力,对神经网络预提取的隐藏层特征进行生成。这种方法可以有效地解决直接生成生理时序信号数据的难题。

概括来说,根据本发明的一个实施例,如图1所示,本发明提供一种单通道脑电睡眠分类模型构建方法,所述方法包括:S1、获取原始PSG数据,所述PSG数据包含多条记录,每条记录包含多个通道数据,所述每条记录对应有睡眠阶段分类标签;S2、以一个预设的脑电通道为目标单通道,以多个其他通道为关联通道,从所述原始PSG数据中的每条记录中筛选出目标单通道数据和原始关联通道数据组成训练数据集;S3、构建初始分类模型,根据本发明的一个实施例,如图2所示,所述初始模型包括特征提取模块、生成式对抗单元、分类单元、融合模块,其中:所述特征提取模块用于提取目标单通道数据的特征以及多个原始关联通道数据的特征;所述生成式对抗单元用于根据所述目标单通道数据的特征生成多个关联通道的特征,其包括多个生成式对抗模块,一个生成式对抗模块对应于一个关联通道,且每个生成式对抗模块包括生成器及对应的鉴别器,所述生成器用于根据所述目标单通道数据的特征生成对应关联通道特征,所述鉴别器用于基于对应原始关联通道数据的特征鉴别其对应生成器生成的关联通道特征的真假;所述分类单元用于根据目标单通道数据的特征、以及基于其生成的多个关联通道的特征分别进行睡眠阶段分类预测以获得多个睡眠阶段分类预测结果;所述融合模块用于将分类单元获得的睡眠阶段分类预测结果进行融合以得到目标单通道数据对应的最终睡眠分类结果;S4、采用训练数据集训练所述初始分类模型至收敛获得以特征提取模块、多个生成器、分类单元、融合模块构成的模型,其中,训练过程中采用每个生成器的损失更新对应生成器的参数,采用每个鉴别器损失更新对应鉴别器的参数,采用分类标签损失更新特征提取模块、分类模块和融合模块的参数。

鉴别器在本发明的方案起到了双重作用:一方面,通过对抗训练的方式,使生成器基于单通道特征生成的其他通道特征更加真实可信;另一方面,鉴别器可以对生成特征的通道进行细粒度的判别,从而确定其归属。在本发明中,还采用了基于深度学习网络的方法,通过预提取单通道数据的神经网络隐层特征来生成新的通道特征,并通过GAN的鉴别器仅建立通道之间的映射关系,不仅增加了数据的通道数量,并仍以原始的真实信号为主要依据。不仅扩展了脑电信号的数据量,还同时扩展了多个通道,新的通道与原始通道的时间轴保持一致,并且还可以包含脑电之外的其他模态(如肌电、心电),从而实现通过生成不同PSG通道的特征来增强单通道睡眠阶段分类的效果的目的。

为了更好的理解本发明,下面的实施例从多个方面依次展开来介绍本发明的方案。

1、问题定义

睡眠阶段分类:多导睡眠图PSG信号包括多通道EEG、ECG、EMG和EOG信号,提供有关睡眠阶段的有价值的信息。为了提高睡眠阶段分类的准确性和一致性,这些信号通常分为多个30秒的时期。AASM标准将每个时期的睡眠阶段分为Wake、REM、N1、N2和N3期。睡眠阶段分类模型一般设定为跨被试任务。也就是说,训练集和测试集来自不同的被试者。

生成式对抗网络(GAN):G为生成器,D为鉴别器。E表示期望,x表示真实数据的特征,z表示生成的数据的特征。

2、跨通道映射生成方法

本发明利用神经网络模型进行特征预提取,并提出了一种生成器网络来生成缺失通道的嵌入特征。具体而言,该系统基于从C3-A2通道预先提取的特征,通过生成器网络同步模拟生成其他通道内的特征。多个鉴别器的主要任务是区分真实数据和生成数据。鉴别器将从其他通道的原始数据中提取的特征视为真实的,而将从C3-A2通道生成的特征视为伪造的,帮助生成器生成更加可信的数据。进一步的,由于每个新通道都有自己对应的鉴别器,鉴别器可以同时自主学习和判定通道归属信息,帮助生成器生成更加像某个通道的数据。通过这种方式,系统能够更准确地模拟出其他每个通道的特征,从而实现了多通道之间的一对一映射。通过对抗性的迭代训练过程,生成器的目标是欺骗鉴别器,使其无法区分生成的特征和真实通道数据的特征。当生成的特征能够成功欺骗鉴别器,使其相信生成的特征是源自特定通道的真实原始数据时,训练过程收敛。总而言之,本发明的方法利用神经网络模型进行特征预提取,并通过生成器网络和鉴别器的对抗训练实现了从C3-A2通道到其他通道的特征生成。这种方法可以提供一种可靠的方式来处理缺失通道的数据,并为脑电信号分析提供更全面的信息。

2.1、单通道生理信号的有效表征

为了更好地提取单通道信号的预特征,本发明采用了称为FeatureNet的经典双通道模型作为主干。FeatureNet模型由两个并行的卷积神经网络(CNN)模块组成,其卷积核大小不同,用于提取多分辨率特征,每个CNN模块由五个卷积序列组成。每个卷积序列由一维CNN层、Batchnorm和RELU正则化层以及最大池化层组成。这两个CNN模块的输出被展平并连接在一起作为预提取特征。由于FeatureNet模型的基本原理是本领域技术人员已知的技术,本发明实施例中不对模型本身进行过多赘述。

2.2跨通道的成对映射生成

本发明使用神经网络模型进行特征预提取,并引入生成器网络来生成缺失通道的嵌入特征。本发明设计了多个生成式对抗模块,每个生成式对抗模块包括一个生成器和一个鉴别器,通过一对一鉴别帮助生成器从单个EEG通道的特征一对一地生成其他通道的特征,即建立了一对一的映射生成网络。另外,鉴别器配合生成器的对抗训练也保证了生成器生成的特征的可靠性。基于预先提取的C3-A2通道特征,生成器网络同步生成其他通道内的特征。鉴别器用于区分真实数据和生成数据,将其他通道的真实特征与C3-A2通道生成的特征进行对比,多个鉴别器逐一鉴别生成特征的类别归属和真实性,实现了一对一的可信关联映射。通过对抗性训练,生成器的目标是欺骗鉴别器,使其无法区分生成的特征和真实通道数据的特征。训练过程收敛时,生成的特征成功欺骗鉴别器,使其相信生成的特征源自特定通道的真实原始数据。总体而言,本发明利用神经网络模型进行特征预提取,并通过生成器网络和鉴别器的对抗训练实现了从C3-A2通道到其他通道的特征生成。该方法可靠地处理缺失通道的数据,并为脑电信号分析提供更全面的信息。

鉴别器损失公式:

其中p

生成器损失公式:

生成器希望尽可能被鉴别器识别为真实数据,即D(G(z))足够大,公式2的期望足够小。

每个通道的鉴别器和生成器迭代对抗训练,当生成器生成的特征能够欺骗鉴别器,使其相信生成的特征来自特定通道的原始数据时,训练过程就会收敛,收敛后得到可以从单通道脑电映射生成其他通道特征的生成器模型。基于此同步增广每个通道的数据,以增强睡眠阶段分类效果。

2.3、多通道睡眠阶段分类

为了保护多通道数据信息并保证模型的分类精度,如前所述的,本发明设计了一个朴素的模型,直接在单通道上进行特征提取和分类,而不参与特征分布对齐,此外,构建N个生成器进行特征生成。在推理过程中,睡眠阶段分类是利用来自单通道的数据通过所有N个生成器的输出决策融合来实现的。单通道特征以及基于此生成的其他通道特征分别会有一个预测分类结果,该分类结果是一个睡眠阶段分类概率,在融合时,会将概率最高的一个作为最终的睡眠阶段分类。分类单元一般是通过全连接深度学习模型实现的,即使用原始真实的单通道的特征和生成的其他通道特征,共同通过全连接深度学习模型训练,做睡眠阶段分类预测。由于这种分类方式是本领域技术人员已知的,本发明就不对分类单元进行详细赘述。

3、实验评估

为了更好的验证本发明的效果,本发明在多个数据集上验证了本发明的效果。

3.1数据集和预处理

如表1所示,本发明实验过程中采用了三个数据集:ISRUC-S1和ISRUC-S3(ISRUC-Sleep数据库的两个公共子集)以及睡眠心脏健康研究(SHHS1)数据集。其中:

ISRUC-S3数据集:包含10名健康成年人(九男一女,年龄在30至58岁之间)。

ISRUC-S1数据集:包含100名患有睡眠障碍的成年人(55名男性和45名女性,年龄从20岁到85岁)。

SHHS1数据集:本发明根据呼吸暂停低通气指数(AHI)选择了329名睡眠规律的被试者,并将信号采样频率设置为125Hz。

表1

为了准备数据,PSG记录被分为30秒的时间段,然后由两名专家按照AASM标准进行注释。前两个数据集ISRUC-S1和ISRUC-S3在组成方面具有共同特征,每条记录包括6个EEG通道(C3-A2、C4-A1、F3-A2、F4-A1、O1-A2和O2-A1)、2个EOG通道(LOC-A2和ROC-A1)、3个肌电图通道(下巴肌电、左腿运动、右腿运动)、1个心电图通道。本发明从ISRUC-Sleep数据中选择了所有六个EEG通道来探索跨EEG通道关联的挖掘,并以100Hz的频率对信号进行重新采样。从SHHS1数据集的14个通道中,本发明选择了睡眠阶段分类任务中最常用的6个时间序列生理信号通道(即2个EEG通道、1个ECG通道、1个EMG通道和2个EOG通道)来探索跨PSG信号跨通道映射。需要说明的是,C3-A2、C4-A1两个通道均是不影响受试者睡眠质量的通道,均可作为目标单通道,其他通道可作为关联通道。但是由于右侧卧是睡眠障碍患者比较舒适的睡眠姿势,本发明实验中采用在这种睡姿下完全压迫不到且常被用于睡眠阶段分类的C3-A2通道作为目标单通道脑电图。

3.2评价指标

Accuracy、F1 score(F1)、Macro F1和Kappa是这项工作的评估指标。它们的定义如下:

其中TP表示当前睡眠阶段正确分类的样本数,FP表示来自其他睡眠阶段的样本被错误分类为当前睡眠阶段的数量,FN表示当前睡眠阶段被错误分类为其他阶段的样本数,TN表示来自其他睡眠阶段的、被准确分类为不属于当前睡眠阶段的样本数。F1分数定义为Recall(衡量模型在所有实际属于某一特定阶段的样本中,有多少被成功预测)和Precision(衡量模型在预测为某一特定阶段的样本中,有多少是真正属于这个特定阶段)的调和平均值。r表示具体的睡眠阶段类别,而R表示睡眠阶段类别的总数。p

3.3对比方法

FeatureNet是由双尺度CNN构成的经典睡眠阶段分类模型。为了一致性,在本文三个数据集的实验中,它也作为本发明的方法的特征预提取网络。本发明对比方法中,在每个数据集中,将仅用FeatureNet模型提取的特征进行分类的方法(用FeatureNet表示)、基于FeatureNet模型提取的特征以及基于该特征生成的特征进行分类的方法(用GAN表示)在每个数据集上的表现进行比较。在对比过程中,本发明采用10折交叉验证来划分训练和测试集,即本发明中训练集和测试集的比例是9:1。然后,随机选择训练集中的20%作为验证集,保存在验证集上验证过的最好的模型,并在完全不可见的新用户测试集中进程测试,结果如表2所示。

表2

从实验结果可以看出,使用本发明方法在数据集上做多通道同步数据增广后,相较于没有使用多通道同步数据增广的FeatureNet方法有明显的提升。

与现有技术相比,本发明利用GAN的生成器,基于现有的单通道脑电神经网络特征生成其他通道的神经网络特征,并利用多个鉴别器对每个通道的一对一鉴别,帮助生成器实现精准的跨通道映射生成,从而实现基于单通道特征获取多通道信息的目的,生成的多通道特征数据和原始真实特征数据同步融合使用,能够增强基于单通道EEG的普适环境下的睡眠阶段分类效果。

需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

相关技术
  • 一种基于分层机制构建多分类器融合模型的脑电情感识别方法
  • 一种动物脑电分类模型的构建方法及装置
技术分类

06120116511902