掌桥专利:专业的专利平台
掌桥专利
首页

面向精神分裂症的双通道模糊信息粒与特征选择方法

文献发布时间:2024-04-18 20:02:40


面向精神分裂症的双通道模糊信息粒与特征选择方法

技术领域

本发明涉及智慧医疗技术领域,具体涉及面向精神分裂症的双通道模糊信息粒与特征选择方法。

背景技术

精神分裂症精神分裂症,简称精神分裂,是一组病因未明的慢性疾病,多在青壮年缓慢或亚急性起病,临床上往往表现为症状各异的综合征,涉及感知觉、思维、情感和行为等多方面的障碍以及精神活动的不协调。患者一般意识清楚,智能基本正常,但部分患者在疾病过程中会出现认知功能的损害。病程一般迁延,呈反复发作、加重或恶化,部分患者最终出现衰退和精神残疾,但有的患者经过药物治疗与心理治疗后可保持痊愈或基本痊愈状态。症状多不典型,病情进展快,易发生漏诊、错诊。

目前,针对精神分裂症的有关特征选择,张晓斌等人在《DNA甲基化特征和前脉冲抑制特征在精神分裂症诊断中的应用》中提出将DNA甲基化特征和前脉冲抑制特征用作临床生物标志物,应用于诊断鉴别精神分裂症、超高危人群和健康人群,该方法提出了检测精神分裂症时需要提取有用的特征,但是它仅针对DNA甲基化和前脉冲抑制特征,并不涵盖整个脑网络的特征,具有一定的局部性。Juneja Akanksha等人在《A novel fuzzy roughselection of non-linearly extracted features for schizophrenia diagnosisusing fMRI》对特征进行约简时仅采用依赖度计算,从单一角度对精神分裂数据进行样本和特征紧密性的刻画,在一定程度上缺乏精确性。

目前判断精神分裂症病变状况的有效办法是通过精神分裂症病因病机的病理特征实验,然而在实验过程中,病理特征数据过多,亟需一种新的方法能有效地减少精神分裂症数据分类信息中冗余的特征,降低精神分裂症数据的检测时间并提高检测效率,帮助医生有效地分析精神分裂症的病变情况。

因此,如何解决上述技术问题为本发明面临的课题。

发明内容

为了解决上述问题,本发明提供了一种面向精神分裂症的双通道模糊信息粒与特征选择方法,根据稀疏相关性和模糊凸半球两种粒度表示形成模糊相似关系,从不同的角度刻画样本之间的紧密性更具说服力,并依据最大相关最小冗余最大交互策略,对特征进行重要度计算,按此重要度进行排序,最后依据类内类间将不同粒度排序后的特征序列进行重新排序,形成最终的特征序列和约简子集,有效提高了精神分裂症特征选择的效率和精度,对精神分裂症智能辅助诊断具有较强的应用价值。

为了实现以上目的,本发明采取技术方案为:一种面向精神分裂症的双通道模糊信息粒与特征选择方法,包括如下步骤:

S10、读取精神分裂症数据集,并将数据集转化为一个四元组决策信息系统;

S20、根据两种不同的粒度表示形成模糊相似关系,其一是将稀疏表示和双向策略融合形成,其二是根据距离度量构造模糊凸半球形成;

S30、依据最大相关最小冗余最大交互策略,刻画精神分裂症数据的特征重要度,对特征进行排序;

S40、对不同的粒度表示形成的特征序列采用类内类间策略决定最终的特征序列,并得出精神分裂症最终约简特征集合。

进一步地,所述步骤S10包括如下步骤:

S11、读取精神分裂症数据集,确定其特征集和决策分类,所述决策信息系统S=,其中U={x

S12、根据数据集中决策特征D的不同信息值个数,将所述精神分裂症数据集S划分为t个数据子集,且满足

进一步地,所述步骤S20包括如下步骤:

S21、将精神分裂症数据集设置为X,X的重构权重矩阵为W,通过稀疏约束函数计算待考察样本x

S22、根据精神分裂症数据集重构得到的权重矩阵W,看出样本间的稀疏相关性,该值的取值范围为[-1,1],可将W矩阵设定为模糊相关性值,故对于

其中,R

S23、判断精神分裂症数据集的稀疏模糊相似关系是否满足双向策略,即同时满足R

S24、对精神分裂症数据的每个决策j(j=1,2,…,m,m表示精神分裂症数据中的决策类别个数)取中心样本点

S25、计算精神分裂症样本x

S26、根据欧氏距离,对于

其中,p表示样本x

S27、对于

其中,p表示样本x

S28、将两个模糊球进行融合,可得出样本x

S29、根据模糊凸半球和欧氏距离,可得出精神分裂症由模糊凸半球得到的样本x

进一步地,所述步骤S30包括如下步骤:

S31、计算精神分裂症数据的每个决策类别对应的模糊决策,记为

S32、计算精神分裂症当前候选特征与模糊决策之间的相关性Rel,对于

其中,|U|为论域的个数,[x

S33、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,对于

S34、计算精神分裂症当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,对于

S35、计算精神分裂症中每个病理特征

S36、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,再计算当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,并设计特征重要度度量

S37、选择具有最大特征重要性对应的特征a

进一步地,所述步骤S40包括如下步骤:

S41、根据步骤S30可得出精神分裂症数据由稀疏约束得出的特征排序Sort_sparse和由模糊凸半球得出的特征排序Sort_semicircle。

S42、根据步骤S24计算精神分裂症数据的每个决策对应的中心样本点

S43、计算精神分裂症数据样本之间的类内距离CW_dist,具体定义如下:

S44、对精神分裂症的所有样本取中心样本点

S45、计算精神分裂症数据样本之间的类间距离CB_dist,即每个决策对应的中心样本点

S46、根据类内距离CW_dist和类间距离CB_dist,可得出精神分裂症数据的类内类间距离CWB,即类间距离与类内距离之比。

S47、判断当前候选特征是否存在于最终的特征排序Sort_final中,如果已经存在,则跳过该特征;如果判断的特征相同,则直接加入Sort_final,否则将目前的Sort_final与当前判断特征进行组合,分别为Current_sparse和Current_semicircle,计算Current_sparse和Current_semicircle所对应的类内类间值,将具有较大类内类间值对应的特征加入Sort_final中,直到Sort_final中包含了所有的特征。

S48、对于Sort_final中的每个精神分裂症病理特征都有对应的类内类间值,判断该值在k处发生连续多次下降,则在k处进行截断,形成最终的约简子集Red。

与现有技术相比,本发明的有益效果为:

(1)本发明提供的一种面向精神分裂症的双通道模糊信息粒与特征选择方法,首先根据稀疏相关性和模糊凸半球两种粒度表示形成模糊相似关系,从不同的角度刻画样本之间的紧密性更具说服力。

(2)依据最大相关最小冗余最大交互策略,对特征进行重要度计算,按此重要度进行排序,最后依据类内类间将不同粒度排序后的特征序列进行重新排序,形成最终的特征序列和约简子集。该方法提升了对精神分裂症数据特征选择的效率和精度,提高了精神分裂症智能辅助诊断的应用价值。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。

图1为本发明的面向精神分裂症的双通道模糊信息粒与特征选择方法的整体流程图。

图2为本发明的面向精神分裂症的双通道模糊信息粒与特征选择方法的整体数据处理框架图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

实施例1

参见图1至图2,本实施例提供了一种面向精神分裂症的双通道模糊信息粒与特征选择方法,包括如下步骤:

S10、读取精神分裂症数据集,并将数据集转化为一个四元组决策信息系统;

S20、根据两种不同的粒度表示形成模糊相似关系,其一是将稀疏表示和双向策略融合形成,其二是根据距离度量构造模糊凸半球形成;

S30、依据最大相关最小冗余最大交互策略,刻画精神分裂症数据的特征重要度,对特征进行排序;

S40、对不同的粒度表示形成的特征序列采用类内类间策略决定最终的特征序列,并得出精神分裂症最终约简特征集合。

所述步骤S10包括如下步骤:

S11、读取精神分裂症数据集,确定其特征集和决策分类,所述决策信息系统S=,其中U={x

S12、根据数据集中决策特征D的不同信息值个数,将所述精神分裂症数据集S划分为t个数据子集,且满足

将原始数据集转换成一个四元组决策信息系统如下所示:

其中,U={x

具体地,所述步骤S20包括如下步骤:

S21、将精神分裂症数据集设置为X,X的重构权重矩阵为W,通过稀疏约束函数计算待考察样本x

由此可得,稀疏权重矩阵W为10*10的矩阵,每列表示对应的样本与该样本之间存在的相关性,W表示如下:

S22、根据精神分裂症数据集重构得到的权重矩阵W,看出样本间的稀疏相关性,该值的取值范围为[-1,1],可将W矩阵设定为模糊相关性值,故对于

其中,R

在本实施例中,模糊参数ε=0,故由稀疏表示得到样本间的模糊相似关系R

S23、判断精神分裂症数据集的稀疏模糊相似关系是否满足双向策略,即同时满足R

根据双向策略对本实施例得出的R

S24、对精神分裂症数据的每个决策j(j=1,2,…,m,m表示精神分裂症数据中的决策类别个数)取中心样本点

本实施例中,决策类的个数为3,其对应的中心样本为:

S25、计算精神分裂症样本x

本实施例中,样本之间的距离表示如下:

S26、根据欧氏距离,对于

其中,p表示样本x

为了方便理解,此处对实施例中的样本x

S27、对于

其中,p表示样本x

在本实施例中,

S28、将两个模糊球进行融合,可得出样本x

因此,对于实施例中的样本x

S29、根据模糊凸半球和欧氏距离,可得出精神分裂症由模糊凸半球得到的样本x

对每个样本的距离进行计算,判断其是否满足模糊凸半球,可得出样本之间的模糊相似关系:

所述步骤S30包括如下步骤:S31、计算精神分裂症数据的每个决策类别对应的模糊决策,记为

本实施例将分为两个通道进行相关性、冗余性和交互性的计算,在S30中,以模糊凸半球为例,分析其过程。因此,模糊凸半球中对应的模糊决策

S32、计算精神分裂症当前候选特征与模糊决策之间的相关性Rel,对于

其中,|U|为论域的个数,[x

S33、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,对于

S34、计算精神分裂症当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,对于

S35、计算精神分裂症中每个病理特征

在本实施例中,计算可得相对应的Rel=[0.9513 1.1725 0.9784 1.0053 1.36591.4759 1.0249 1.2346 0.6761 0.8870],故最大相关性对应的特征为a

S36、计算精神分裂症当前候选特征与约简特征之间的冗余性Rdd,再计算当前候选特征、剩余候选特征和模糊决策之间的交互性Itrc,并设计特征重要度度量

在本实施例中,计算可得相对应的Rdd=[0.7413 0.9858 1.0903 1.0349 0.94511.0910 0.8231 0.6145 0.7151],Itrc=[3.0747 3.0700 3.0874 3.0886 3.0135 3.00312.9984 2.9275 2.9983],并进行重要性计算。

S37、选择具有最大特征重要性对应的特征a

在本实施例中,选择具有最大重要性的特征为a

所述步骤S40包括如下步骤:S41、根据步骤S30可得出精神分裂症数据由稀疏约束得出的特征排序Sort_sparse和由模糊凸半球得出的特征排序Sort_semicircle。

由此,可得出由稀疏约束得出的特征排序Sort_sparse=[3 6 1 4 7 5 9 8 210],由模糊凸半球得出的特征排序Sort_semicircle=[6 5 8 2 7 4 3 10 1 9]。

S42、根据步骤S24计算精神分裂症数据的每个决策对应的中心样本点

针对实施例,当特征集中只有特征a

S43、计算精神分裂症数据样本之间的类内距离CW_dist,具体定义如下:

由此可得,类内距离为CW_dist=0.2752。

S44、对精神分裂症的所有样本取中心样本点

本实施例中,当特征集中只有特征a

S45、计算精神分裂症数据样本之间的类间距离CB_dist,即每个决策对应的中心样本点

针对实施例,当特征集中只有特征a

S46、根据类内距离CW_dist和类间距离CB_dist,可得出精神分裂症数据的类内类间距离CWB,即类间距离与类内距离之比。

本实施例中,当特征集中只有特征a

S47、判断当前候选特征是否存在于最终的特征排序Sort_final中,如果已经存在,则跳过该特征;如果判断的特征相同,则直接加入Sort_final,否则将目前的Sort_final与当前判断特征进行组合,分别为Current_sparse和Current_semicircle,计算Current_sparse和Current_semicircle所对应的类内类间值,将具有较大类内类间值对应的特征加入Sort_final中,直到Sort_final中包含了所有的特征。

由此,对两个通道得出的特征排序进行融合后排序,得出最终的特征序列为:[6 58 2 3 1 4 7 9 10]。

S48、对于Sort_final中的每个精神分裂症病理特征都有对应的类内类间值,判断该值在k处发生连续多次下降,则在k处进行截断,形成最终的约简子集Red。

在本实施例中,类内类间值在k=4时发生连续三次下降,故在k=4处截断,形成最终的约简子集Red=[6 5 8 2]。

以上所述仅为本发明的示例性实施例,并非因此限制本发明专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种面向时间序列趋势预测的模糊信息粒化方法
  • 一种面向时间序列趋势预测的模糊信息粒化方法
技术分类

06120116586527