掌桥专利:专业的专利平台
掌桥专利
首页

一种基于稀疏局部嵌入的脑电信号多标签分类方法及系统

文献发布时间:2023-06-19 19:30:30


一种基于稀疏局部嵌入的脑电信号多标签分类方法及系统

技术领域

本发明属于脑电信号分类技术领域,尤其涉及一种基于稀疏局部嵌入的脑电信号多标签分类方法及系统。

背景技术

脑机接口(Brain-computer Interface,BCI)通过提供额外的信号通路,实现大脑直接控制外部设备,在残疾人功能辅助与康复等方面有着广阔的应用前景。脑电(Electroencephalogram,EEG)信号是一种生理电信号,它是由人的自主神经系统控制产生的,在脑电信号识别研究中,识别模型的选择对最终的分类有着至关重要的影响。人类每天都会产生大量的数据,这导致人们越来越需要新的努力来应对大数据给多标签学习带来的巨大挑战。脑电信号数据也不例外,脑部疾病诊断常常需要采集大量的脑电数据来判断,所以对脑电信号的极端大数据的多标签分类研究变得越来越重要。

多标签分类是一个活跃且快速发展的研究领域,它处理具有大量类别或标签的分类任务,利用有限监督的海量数据构建多标签分类模型。此外,如何捕获多标签学习中的标签依赖性,这是解决现实分类任务的关键。然而,传统的多标签分类方法不能很好地满足当今大而复杂的数据结构的日益增长的需求。随着大数据时代的到来,极端多标签分类(Extreme Multi-label Learning Classification,XMLC)成为一个快速发展的新研究领域,它关注具有大量标签的多标签问题。它为每个实例同时分配多个标签,在从蛋白质功能分类和文档分类到自动图像分类的各种领域中都至关重要。例如,图像可以具有“猫”、“树林”和“天空”标签;文件的输出可能涵盖一系列主题,如“新闻”、“金融”和“体育”。

极端多标签学习的目标是训练一个分类器,该分类器可以自动地用一个非常大的标签集中最相关的标签子集标记一个新的数据点。基于嵌入的方法试图通过假设训练标签矩阵是低秩的,并通过将高维标签向量投影到低维线性子空间来减少标签的有效数量。尽管如此,由于在大多数现实应用中违反了低秩假设,领先的嵌入方法仍然无法提供高预测精度,或扩展到大型问题,主要是面临大型数据集中所带来的尾部标签的问题,使得标签矩阵不能通过低维线性子空间很好地映射得到近似的嵌入集合。

发明内容

本发明为了解决上述问题,提出了一种基于稀疏局部嵌入的脑电信号多标签分类方法及系统,本发明将脑电信号进行预处理后,将标签向量映射到一个低维空间上,通过仅保留最近(而不是所有)标签向量之间的成对距离来非线性捕获标签相关性,然后学习一组回归量得到每个样本的嵌入量,最后对每一个样本的嵌入量的集合进行K最近邻(K-NearestNeighbor,KNN)分类运算;在满足大而复杂数据结构的日益增长需求的基础上,提高了分类精度。

为了实现上述目的,本发明是通过如下的技术方案来实现:

第一方面,本发明提供了一种基于稀疏局部嵌入的脑电信号多标签分类方法,包括:

获取脑电信号;

根据获取的脑电信号,以及预设的分类模型,得到分类结果;

其中,分类模型采用K最近邻分类算法;模型训练和预测时,对获取的脑电信号进行特征提取,得到标签向量,将标签向量映射到一个低维空间上,仅保留最近标签向量之间的成对距离来非线性捕获标签相关性。

进一步的,使用4阶零相位巴特沃斯滤波器对获取的脑电信号进行滤波,选定与运动想象有关的频段,剔除高频干扰与工频噪声。

进一步的,取脑电信号的小波系数和样本熵作为特征向量。

进一步的,小波系数表达信号在时域和频域的能量分布,利用小波系数的能量反映脑电信号的时域和频域特征。

进一步的,训练阶段,对训练数据进行特征提取,得到特征数据集,将特征数据集映射到一个低维子线性空间上,并且学习一组回归量来对测试样本进行预测,通过回归量和特征向量的乘积得到测试样本的嵌入。

进一步的,测试阶段,对测试点进行特征提取得到特征值,将训练得到的回归量与特征值相乘得到测试点的嵌入量,然后对脑电信号训练集部分数据提取特征向量,计算嵌入量得到训练集的嵌入集合并执行K最近邻分类算法,得到分类结果。

进一步的,回归量的计算方式为:

其中,Z为嵌入集合;V为回归量;F为特征向量;λ和μ均为正则化系数。

第二方面,本发明还提供了一种基于稀疏局部嵌入的脑电信号多标签分类系统,包括:

数据采集模块,被配置为:获取脑电信号;

分类模块,被配置为:根据获取的脑电信号,以及预设的分类模型,得到分类结果;

其中,分类模型采用K最近邻分类算法;模型训练和预测时,对获取的脑电信号进行特征提取,得到标签向量,将标签向量映射到一个低维空间上,仅保留最近标签向量之间的成对距离来非线性捕获标签相关性。

第三方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了第一方面所述的基于稀疏局部嵌入的脑电信号多标签分类方法的步骤。

第四方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了第一方面所述的基于稀疏局部嵌入的脑电信号多标签分类方法的步骤。

与现有技术相比,本发明的有益效果为:

1、本发明将标签向量映射到一个低维空间上,仅保留最近标签向量之间的成对距离来非线性捕获标签相关性,通过不保留给定标签向量到所有训练点的距离,而是尝试只保留到几个最近邻的距离,减少了有效标签的数量,同时采用K最近邻分类算法进行分类,有效解决了尾部标签问题,提高了分类精度;

2、本发明使用局部嵌入来代替传统的全局嵌入,仅保留与标签向量最近的邻域之间的距离,来捕获标签之间的相关性,极大地提高了训练速度;

3、本发明将极端多标签分类算法应用在脑电信号数据上,将极端分类问题与脑电信号相结合;对脑电信号进行降维,减少有效标签的数量,解决了极端大规模数据中存在计算量大,时间成本高昂的问题,使训练和预测变得易于处理。

附图说明

构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解,本实施例的示意性实施例及其说明用于解释本实施例,并不构成对本实施例的不当限定。

图1为本发明实施例1的流程图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

实施例1:

本实施例提供了一种基于稀疏局部嵌入的脑电信号多标签分类方法,包括:

获取脑电信号;

根据获取的脑电信号,以及预设的分类模型,得到分类结果;

其中,分类模型采用K最近邻分类算法;模型训练和预测时,对获取的脑电信号进行特征提取,得到标签向量,将标签向量映射到一个低维空间上,仅保留最近标签向量之间的成对距离来非线性捕获标签相关性。

本实施例中,将脑电信号进行预处理后,将标签向量映射到一个低维空间上,通过仅保留最近标签向量之间的成对距离来非线性捕获标签相关性,然后学习一组回归量得到每个样本的嵌入量,最后对每一个样本的嵌入量的集合进行KNN分类运算;在满足大而复杂数据结构的日益增长需求的基础上,提高了分类精度;本实施例方法的主要步骤为:

S1、脑电信号的采集和预处理:

可以通过在受试者上佩戴脑电信号电极帽进行相关的运动想象,比如想象左手和想象右手运动,可采集到的脑电信号可表示为

可以使用4阶零相位巴特沃斯滤波器对脑电信号进行滤波,并将带通频段的范围设置为8~30Hz。这样一方面可以选定后续实验所需要的与运动想象有关的频段,另一方面可以剔除高频干扰与工频噪声。在一些实施例中,可以在EEGLAB工具箱内置算法对滤波后的运动想象脑电信号进行去噪处理。

S2、脑电信号特征提取:

对预处理后的脑电信号进行特征提取,本发明提取了脑电信号的小波系数和样本熵作为特征向量。

S2.1、小波系数的提取:

小波变换对处理后的脑电信号进行特征提取,小波系数能表达信号在时域和频域的能量分布,利用小波系数的能量能反映出脑电信号的时域和频域特征,小波变换公式如下:

其中,x(n)为处理后的脑电信号;ψ(n)为小波基函数;j,k分别代表频率分辨率和时间平移量。

S2.2、样本熵的提取:

假定一个时间序列为{x(1),x(2),x(3)...x(N)},其时间间隔τ是一个固定的值,其中N为该序列中包含数据的个数。定义一组向量序列X

d[X

定义样本熵为:

其中,r(r≥0)为阈值;

而A

S2.3、多标签分类方法:

本实施例提出的基于稀疏局部嵌入(Sparse Local Embedding)的脑电信号多标签分类算法流程图如图1所示,设X=[x

在训练阶段,将训练数据首先进行特征提取,得到训练的特征数据集D={(f

在测试阶段,对测试点x

S2.4、学习嵌入:

在面对真实世界中的数据集时,往往会面临大型数据集中所带来的尾部标签的问题,这使得标签矩阵Y不能通过低维线性子空间很好地映射得到近似的嵌入集合Z,但是标签矩阵Y还是可以使用低维非线性流形来精确表示。本实施例中,不保留给定标签向量到所有训练点的距离,而是尝试只保留到几个最近邻的距离。也就是说,希望找到一个L维嵌入矩阵[z

其中,||Z||

求解式(5)得到嵌入Z,其中Ω是希望保留的邻居集,P

得到稀疏嵌入集合Z=[z

其中,μ为L

对式(5)进行优化,通过直接求解(5)但不使用L

其中M=Z

2.5、分类算法

分类算法选择KNN分类器,有效的解决了多标签分类中的尾部标签问题。

K-最近邻(K-Nearest Neighbors,KNN)是一种监督学习机器算法,可用于解决机器学习算法中的回归和分类任务。KNN可根据当前训练数据点的特征对测试数据集进行预测。在假设相似的事物在很近的距离内存在的情况下,通过计算测试数据和训练数据之间的距离来实现这一点。KNN中的“K”是一个参数,表示最近邻的数字。K是一个正整数,通常值很小,一般指定为奇数。K值为数据点创建了一个环境,这样可以更容易地指定哪个数据点属于哪个类别。

通过训练样本学习嵌入得到一组回归量V,提取训练集样本的特征向量F=[f

已知的类别样本为所有训练数据的嵌入矩阵Z=[Z

KNN通过计算数据点之间的距离,对新数据点进行分类。在KNN中计算该距离最常用的方法是欧几里得法、曼哈顿法和明可夫斯基法。本实施例中,KNN模型使用欧式距离来找到最近的“邻居”,通常采用空间两向量的欧式距离表示:

实施例2:

本实施例提供了一种基于稀疏局部嵌入的脑电信号多标签分类系统,包括:

数据采集模块,被配置为:获取脑电信号;

分类模块,被配置为:根据获取的脑电信号,以及预设的分类模型,得到分类结果;

其中,分类模型采用K最近邻分类算法;模型训练和预测时,对获取的脑电信号进行特征提取,得到标签向量,将标签向量映射到一个低维空间上,仅保留最近标签向量之间的成对距离来非线性捕获标签相关性。

所述系统的工作方法与实施例1的基于稀疏局部嵌入的脑电信号多标签分类方法相同,这里不再赘述。

实施例3:

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了实施例1所述的基于稀疏局部嵌入的脑电信号多标签分类方法的步骤。

实施例4:

本实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了实施例1所述的基于稀疏局部嵌入的脑电信号多标签分类方法的步骤。

以上所述仅为本实施例的优选实施例而已,并不用于限制本实施例,对于本领域的技术人员来说,本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实施例的保护范围之内。

相关技术
  • 基于小波变换和稀疏表达的脑电信号分类系统与方法
  • 基于小波变换和稀疏表达的脑电信号分类系统与方法
技术分类

06120115937297