掌桥专利:专业的专利平台
掌桥专利
首页

一种联合相关性和冗余性评估的脑电信号特征优化方法

文献发布时间:2024-04-18 20:01:23


一种联合相关性和冗余性评估的脑电信号特征优化方法

技术领域

本发明属于脑电信号处理领域,具体涉及一种联合相关性和冗余性评估的脑电信号特征优化方法。

背景技术

在脑电信号(EEG)分类识别过程中,随着数据处理的体量越来越大,如何快速有效地选择特征是数据处理中不可避免的问题。通常来说,更全面特征会使得相应问题的分类效果变好,然而太多的特征可能会引发维数灾害。当特征维度偏高时,不仅消耗了计算的时间,降低了计算的效率,而且高维的特征中存在不相关或冗余的特征反而会影响脑电信号的辨识精度。因此,对数据样本量大,维度偏高的情况,从大量特征中除去冗余的特征,并选择最具有代表性的优选特征,是当前脑电信号处理领域研究的热点。

目前,已有许多的特征维度优化算法被提出,如相关特征法、主成分分析法、Fisher方法等,这些在不同应用的场合下具备各自的特性,这与数据类型、提取的特征、识别目标等都有很大的关系。ReliefF算法是一种相关特征选择算法,借用了假设间隔(hypothesis margin)的思想,对各维度上特征的分类能力进行评价,从而找出对分类最有用的特征子集。

在现有的ReliefF算法中,没有考虑样本整体的代表性以及特征之间的冗余性。在分类过程中,不同样本点对于分类的作用往往是不同的。通常认为,类别的中心样本可以很好代表该类数据分布的整体特征,对模型类别判别方向影响显著;同时,靠近分类边界的样本对决策边界的定位也非常关键。此外,在以互信息进行特征冗余度分析时,由于不同个体特征的多样性,其特征之间的相互关联程度也是各不相同的。大多数基于互信息的算法中,粗略的凭借少量经验所确定的阈值可能对特征集之间的相互关系评估不够准确,导致关键特征信息的流失。

发明内容

本发明要解决的技术问题是:现有的ReliefF算法在特征选择的过程中没有充分考虑样本整体的代表性以及特征之间的冗余性,导致关键特征信息的流失,从而导致脑电信号辨识效果较差。

为此,本发明提供一种联合相关性和冗余性评估的脑电信号特征优化方法。

本发明解决其技术问题所采用的技术方案是:

一种联合相关性和冗余性评估的脑电信号特征优化方法,包括以下步骤:

脑电信号数据采集和数据预处理;

提取各子频带的特征并融合成为样本特征;

通过样本加权的ReliefF算法筛选初选特征集;

利用互信息对初选特征集中特征的冗余性进行打分,筛选最优特征集;

将优化后的特征样本划分为训练集和测试集,用训练集训练模型,向所得模型中输入测试集以评估辨识效果。

通过采用上述技术方案,通过计算样本之间的互信息分析样本重要性,通过样本加权的ReliefF算法筛选出类别相关特征,通过互信息对初选特征集中特征的冗余性打分,去除冗余特征得到最优特征集,从而实现脑电信号特征优化,准确选取了更具表征性的特征,进而实现运动想象脑电信号的有效分类识别。

进一步地,利用样本间的互信息值评估各样本在类别判别过程中的重要程度,通过映射的方式计算样本权重,利用样本加权的ReliefF算法分析特征与目标类别间的相关性,保留权重较大的特征作为初选特征集。

进一步地,计算每个样本与其同类样本及异类样本之间的平均互信息之差D

进一步地,样本间互信息I的计算公式为:

进一步地,将所得差值D

进一步地,每次从样本集中随机取出一个样本R,从和样本R同类的样本集中找出k个近邻样本H,从和样本R不同类的样本集中找出k个近邻样本M,结合R的样本权重SW(R),利用样本加权的ReliefF算法计算每个特征的权重,以此来分析特征与目标类别间的相关性,并重复以上过程,直至达到设定的迭代次数,保留权重较大的特征作为初选特征集。

进一步地,计算初选特征集中每个特征之间的互信息,并根据互信息大小更新各特征的冗余性得分,筛选最优特征集。

进一步地,通过互信息分析比较特征间的冗余性,初始化所有特征冗余性得分为0,每次都按样本加权的ReliefF算法所得的特征重要性次序取主特征,并与其之后的每个特征计算互信息,每轮根据互信息的大小统计各个特征的冗余性得分,去除得分较高的冗余特征,最终得到最优维度的特征集。

进一步地,每轮根据互信息的大小统计各个特征的冗余性得分,当为极强相关时,被比较的特征冗余性得分+10分,当为强相关时,被比较的特征冗余性得分+5分,当为中等程度相关时,被比较的特征冗余性得分+2分,累积所有特征的冗余性得分,然后将得分大于0的特征降序排列,去除排名靠前的B个冗余特征,得到最优特征集。

本发明的有益效果是,本发明基于样本重要性和特征冗余性的特点,适当增加ReliefF算法过程中边界和中心样本的权重,降低非核心区域样本的权重,可以减弱表现性不强的样本对权重更新的影响,有效消除不相关特征并保留强相关特征。其次兼顾初选特征之间的冗余性,以特征冗余性得分来代替固定的阈值,更全面的评估特征相对于特征集的冗余性,从而尽可能的找出更具表征性的特征。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明中脑电信号特征优化方法的实施流程图。

图2是本发明中频带划分示意图。

图3是本发明中特征优化算法流程图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

一种联合相关性和冗余性评估的脑电信号特征优化方法,包括以下步骤:

步骤1,获取受试者多类别多通道的运动想象脑电信号并进行预处理,利用巴特沃兹滤波器对所得脑电信号进行带通滤波以及频带、样本划分,利用CSP完成各频带的空域特征提取并进行特征融合,得到多频带融合的样本特征。

S1.1脑电信号数据采集。

在本实施方式中:采集多人的64导联通道数据,信号采样频率为160Hz。实验执行左拳、右拳、双拳和双脚这四种类别任务,每个受试者在上述四类运动想象次数共90次。每次实验持续约8s,其中0~2s时屏幕黑屏,受试者处于放松准备状态,随后的4s中,电脑屏幕的上下左右区域会随机出现目标作为提示(左:左拳运动;右:右拳运动;上:双拳运动;下:双脚运动),根据每一次的屏幕提示,受试者完成运动想象实验,每次运动想象过程中有640个采样点,在受试者进行2s的休息后,进入下一个实验。

S1.2数据预处理。

对每次运动想象数据进行预处理及样本划分。首先使用小波去噪技术去除信号中的噪声,使用共平均参考技术消除信号中的干扰,以及进行基线校正以调整信号的基准线;再使用6阶巴特沃斯滤波器对预处理后的EEG信号进行8~30Hz的带通滤波,并对滤波后的脑电信号进行带宽为4Hz,重叠2Hz的频带划分,共分为10个子频带(A1-A10)如图2所示;最后对于各子频带的样本,采用160点个数据点并重叠50%的窗口进行滑窗样本划分。因此,对于各受试者的每个频带得到共630个样本数据,其数据存储形式为160*64*630(数据采样点数*通道数*样本数)。

S1.3特征的提取。

针对步骤S1.2中划分的10个子频带构建各自对应的一对一CSP模型,四类动作共构建六个CSP模型,利用CSP对各频带下脑电信号进行空域特征提取,进行各子频带特征融合,得到各频带下的融合特征作为样本特征,并进行归一化处理,提取特征的计算过程如下:

通过滤波器W将脑电信号X进行空间滤波,得到滤波后的信号矩阵Z:Z=WX。

其中,X为划分样本后的脑电信号矩阵。

在矩阵Z中,提取前面和后面各U个特征值所对应的特征向量,构成空间滤波信号Z

其中,f

步骤2,筛选类别相关的初选特征集。

对于步骤1所述的样本数据,利用样本间的互信息值评估各样本在分类决策过程中的重要程度,作为样本权重;利用样本加权的ReliefF算法分析特征与目标类别间的相关性,保留权重较大的特征作为初选特征集。

S2.1对于脑电信号特征样本的加权。

如图3所示,计算每个样本R与其类内样本间的互信息以及异类样本间的互信息,分别求取其平均值,并求两者之差,以适当增加ReliefF算法过程中边界和中心样本的权重,降低非核心区域样本的权重,样本R的权重计算公式为:

D

其中,I_within为样本R的平均类内互信息,I_between为样本R的平均类间互信息,D

其中,I_within的计算公式为:

其中,I_between的计算公式为:

两样本间互信息I的计算公式为:

其中,X为所选样本,Y为X的同类或者异类样本,p(x,y)为(X,Y)的联合分布,p(x),p(y)分别为X,Y的边缘分布,x代表X的取值,y代表Y的取值,I(X;Y)为联合分布p(x,y)与边缘分布p(x)p(y)的相对熵。

将所得差值D

其中,D

S2.2获取初选特征。

将映射后的样本权重输入到ReliefF算法特征权重的计算过程中。从样本重要性的角度出发,将样本权重结合到ReliefF算法的特征权重更新公式中,得到各特征的权重。

对于高维脑电信号的特征样本,从样本集中随机取出一个样本R,从和样本R同类的样本集中找出k个近邻样本H;从和样本R不同类的样本集中找出k个近邻样本M;结合步骤S2.1所得样本R的权重SW(R),计算每个特征的权重以此来分析特征与目标类别间的相关性,并重复以上过程,直至达到设定的迭代次数,单次特征权重的更新公式如下:

其中,SW(R

根据所得权重大小对特征进行降序排序,保留特征权重较大的前n个特征作为初选特征集。

步骤3,去除冗余特征获得最优特征集。

对于步骤2所述的初选特征集,通过互信息分析比较特征间的冗余性,每轮统计各个特征的冗余性得分,去除得分较高的冗余特征,最终得到最优维度的特征集。

具体的,对于经过样本加权的ReliefF算法后得到的有序特征集{F

将所得两特征间的互信息缩放到(0,1)区间内,互信息的缩放公式为:

其中,X和Y为两个特征向量,I(X;Y)是X和Y之间的互信息,I

对于缩放后特征之间的互信息I

步骤4,SVM模型训练及测试。

将优化后的特征样本按照8:2的比例划分为训练集和测试集;利用SVM算法构建网络模型,并利用训练特征集对所述网络模型进行训练,利用测试特征集对网络模型进行测试,得到所得模型的分类识别效果。

本发明所提联合相关性和冗余性评估的脑电信号特征优化方法,有效消除了冗余特征并保留类别强相关特征,准确选取了更具表征性的特征,进而实现运动想象脑电信号的有效分类识别。最终本模型的运动想象脑电信号四分类准确率为91.26%,对比同数据库和类似方法有所提升。

以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要如权利要求范围来确定其技术性范围。

相关技术
  • 电动外置活塞式移液器组件
  • 用于电动外置活塞式移液器的注射器
技术分类

06120116554397