掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度对比聚类的糖尿病六分型方法和系统

文献发布时间:2024-04-18 20:02:18


一种基于深度对比聚类的糖尿病六分型方法和系统

技术领域

本发明提出了一种基于深度对比聚类的糖尿病六分型方法和系统,属于糖尿病分型模型构建技术领域。

背景技术

糖尿病是最常见的慢性代谢性疾病之一,其发病率逐年提高治疗老年糖尿病不能仅仅关注血糖控制,更应该注重并发症的预防和早期发现治疗。机器学习方法因其对数据的良好处理能力,在糖尿病的精准医疗任务中具有广泛的应用前景。与传统方法相比,机器学习方法可以基于更多的数据特征进行分析,减少人为因素的干扰,从而提高分型的准确性和稳定性,然而,现有技术中的糖尿病六分型模型聚类的误差累计率较大导致准确性较低的问题存在。

发明内容

本发明提供了一种基于深度对比聚类的糖尿病六分型方法和系统,用以解决现有技术中的糖尿病六分型模型聚类的误差累计率较大导致准确性较低问题,所采取的技术方案如下:

一种基于深度对比聚类的糖尿病六分型方法,所述糖尿病六分型方法包括:

利用病历数据构建老年糖尿病的样本数据集;

通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型;

将实时采集到的患者信息输入至所述训练后的用于糖尿病六分型的网络模型,并利用所述训练后的用于糖尿病六分型的网络模型确定当前患者的糖尿病类型。

进一步地,利用病历数据构建老年糖尿病的样本数据集,包括:

从病历数据中调取老年糖尿病信息;

根据特征选择要求在所述老年糖尿病信息中调取具备特征选择要求的老年糖尿病信息作为目标数据;

对所述目标数据进行预处理,获得预处理后的目标数据;

将所述预处理后的目标数据整合为样本数据集。

进一步地,所述深度学习网络模型包括神经网络单元和所述神经网络单元对应的孪生网络单元;其中,所述神经网络单元和孪生网络单元的网络结构相同,且,所述神经网络单元和孪生网络单元之间进行权重共享,同时,所述神经网络单元和孪生网络单元均包括神经网络本体和聚类约束层。

进一步地,通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型,包括:

通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值;其中,所述深度学习网络模型采用基于孪生网络的二分类聚类网络结构;

利用所述相似度最大值和相似度最小值对所述孪生网络单元对应的神经网络单元进行训练,获得训练后的神经网络单元;其中,所述训练后的神经网络单元即为用于糖尿病六分型的网络模型。

进一步地,通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值,包括:

步骤A1、将样本数据集输入至孪生网络单元;

步骤A2、所述孪生网络单元计算获得所述样本数据集的各样本数据的两两样本数据之间的相似度,获得所述样本数据集对应的包含多个相似度数值的相似度数值集合;

步骤A3、从所述相似度数值集合中提取相似度最大值和相似度最小值;

步骤A4、将所述相似度最大值和相似度最小值打上相似标签;

步骤A5、将带有相似标签的相似度最大值和相似度最小值对应的样本数据组输入至神经网络单元;

步骤A6、在所述带有相似标签的相似度最大值和相似度最小值对应的样本数据组输入至神经网络单元之后,在所述相似度数值集合的剩余的相似度数值中再次挑选相似度最大值和相似度最小值,获得包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值;

步骤A7、对所述包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值打上相似度标签;

步骤A8、将带有相似度标签的所述包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值输入对应的样本数据组至神经网络单元;

步骤A9、重复步骤A6至步骤A8直至所述相似度数值集合中的所有相似度数值均被打上相似度标签,并且,相似度最大值和相似度最小值对应的样本数据组被输入至神经网络。

进一步地,利用所述相似度最大值和相似度最小值对所述孪生网络单元对应的神经网络单元进行训练,获得训练后的神经网络单元,包括:

步骤B1、所述神经网络单元接收到一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组;

步骤B2、利用所述带有相似度标签的相似度最大值和相似度最小值对应的样本数据组进行一次神经网络训练;

步骤B3、在完成一次神经网络训练后,实时监测是否接收到下一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组;

步骤B4、当接收到下一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组时,利用所述带有相似度标签的相似度最大值和相似度最小值对应的样本数据组进行一次神经网络训练;

步骤B5、重复步骤B1至步骤B4直至完成神经网络的训练, 获得训练后的神经网络单元。

进一步地,所述用于进行糖尿病六分型的网络模型中的DAE的解码器部分加入数据重构损失,并且,所述数据重构损失对应的目标函数如下:

其中,

进一步地,所述通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值,还包括:

当获得所述样本数据集对应的包含多个相似度数值的相似度数值集合时,提取所述多个相似度数值,并根据所述相似度数值设置第一相似度阈值;其中,所述第一相似度阈值通过如下公式获取:

其中,

利用所述多个相似度数值和所述第一相似度阈值设置第二相似度阈值;其中,所述第第二相似度阈值通过如下公式获取:

其中,

利用所述第一相似度阈值和第二相似度阈值设置差异阈值;

实时监测相似度数值集合中剩余相似度数值中被选中的相似度最大值和相似度最小值;

将所述相似度最大值和所述相似度最小值进行比较,获得所述相似度最大值和所述相似度最小值之间的差异值;

当所述相似度最大值和所述相似度最小值之间的差异值低于差异阈值时,则将所述差异值低于所述差异阈值的相似度最大值和相似度最小值对应的样本数据组进行样本数据调整;

在所述差异值低于所述差异阈值的相似度最大值和相似度最小值对应的样本数据组进行样本数据调整过程中,实时监控相似度最大值和相似度最小值对应的样本数据组对应的相似度最大值和相似度最小值的变化,直至所述相似度最大值和相似度最小值对应的样本数据组对应的相似度最大值和相似度最小值的差异值低于所述差异阈值的相似度最大值和相似度最小值所对应样本数据组调整后对应的相似度最大值和相似度最小值之间的差异值不低于差异阈值,且,所述相似度最大值和相似度最小值之间的差异值与历史获得的相似度最大值和相似度最小值之间的差异值均不相同。

进一步地,利用所述第一相似度阈值和第二相似度阈值设置差异阈值,包括:

提取所述第一相似度阈值;

将所述相似度数值集合中的相似度数值与所述第一相似度阈值依次进行比较,获得第一差值集合;

提取所述第二相似度阈值;

将所述相似度数值集合中的相似度数值与所述第二相似度阈值依次进行比较,获得第二差值集合;

利用所述第一差值集合和第二差值集合中的差异值参数设置差异阈值。

其中,所述差异阈值通过如下公式获取:

其中,

一种基于深度对比聚类的糖尿病六分型系统,所述糖尿病六分型系统包括:

数据集构建模块,用于利用病历数据构建老年糖尿病的样本数据集;

自监督训练模块,用于通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型;

分型执行模块,用于将实时采集到的患者信息输入至所述训练后的用于糖尿病六分型的网络模型,并利用所述训练后的用于糖尿病六分型的网络模型确定当前患者的糖尿病类型。

本发明有益效果:

本发明提出的一种基于深度对比聚类的糖尿病六分型方法和系统对老年糖尿病患者(Age≥65)进行聚类分析分型并具备极高的验证稳定性;同时,能够以端到端的方式工作,避免了误差累积,并利用高可靠的打标签方式,最大程度降低监督信号的不准确性,有效提高监督信号和聚类的准确性。

附图说明

图1为本发明所述方法的流程图;

图2为本发明所述基于孪生网络的二分类聚类网络结构的结构示意图;

图3为本发明所述孪生网络的结构示意图;

图4为本发明所述系统的系统框图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

本发明实施例提出了一种基于深度对比聚类的糖尿病六分型方法,如图1所示,所述糖尿病六分型方法包括:

S1、利用病历数据构建老年糖尿病的样本数据集;

S2、通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型;其中,如图2和图3所示,所述深度学习网络模型包括神经网络单元和所述神经网络单元对应的孪生网络单元;其中,所述神经网络单元和孪生网络单元的网络结构相同,且,所述神经网络单元和孪生网络单元之间进行权重共享,同时,所述神经网络单元和孪生网络单元均包括神经网络本体和聚类约束层。为了使模型端到端的方式工作,添加一聚类约束层,使网络输出一个k维(k为聚类数量)聚类指示向量,该聚类指示特征在理想情况将趋近于one-hot,因此通过获取该向量的最大响应,即可得输入样本所在类。此即实现了根据神经网络输出直接获得病人所处类,大大简化了聚类过程,避免了误差累积。其中,图2和图3中的非线性激活函数和归一化激活函数(Relu&softmax)是聚类约束层中所应用到的激活函数。

S3、将实时采集到的患者信息输入至所述训练后的用于糖尿病六分型的网络模型,并利用所述训练后的用于糖尿病六分型的网络模型确定当前患者的糖尿病类型。

其中,利用病历数据构建老年糖尿病的样本数据集,包括:

S101、从病历数据中调取老年糖尿病信息;

S102、根据特征选择要求在所述老年糖尿病信息中调取具备特征选择要求的老年糖尿病信息作为目标数据;

S103、对所述目标数据进行预处理,获得预处理后的目标数据;

S104、将所述预处理后的目标数据整合为样本数据集。

上述技术方案的工作原理为:构建老年糖尿病的样本数据集(S1):首先,从病历数据中提取与老年糖尿病相关的信息,这些信息将用于构建模型的训练数据集。

自监督训练深度学习网络模型(S2):使用深度学习网络模型,该模型包括神经网络单元和孪生网络单元,它们具有相同的网络结构。

神经网络单元和孪生网络单元之间共享权重,这有助于学习数据的表示和相似度度量。

利用自监督训练方法,网络模型学习样本数据中两两数据之间的相似度最大值和相似度最小值,以便在无监督情况下对数据进行聚类,特别是将老年糖尿病分为六个不同的类型。

这个模型还包括神经网络本体和聚类约束层,这些层有助于模型的学习和数据聚类。

糖尿病类型的识别(S3):在实际应用中,采集患者的信息,并将这些信息输入到训练好的模型中。模型通过学到的相似度度量和聚类信息来确定当前患者的糖尿病类型。

上述技术方案的效果为:本实施例提出的一种基于深度对比聚类的糖尿病六分型方法和系统对老年糖尿病患者(Age≥65)进行聚类分析分型并具备极高的验证稳定性;同时,能够以端到端的方式工作,避免了误差累积,并利用高可靠的打标签方式,最大程度降低监督信号的不准确性,有效提高监督信号和聚类的准确性。同时,上述技术方案的技术效果还包括:

自监督学习:通过自监督训练,该模型不需要人工标签,而是通过数据本身来学习如何聚类老年糖尿病数据。

糖尿病六分型:该模型的目标是将老年糖尿病分为六个不同的类型,这有助于更好地了解和处理不同病例之间的差异,以实现更精细化的治疗和管理。

实时患者糖尿病类型识别:一旦模型训练完成,它可以用于实时识别患者的糖尿病类型,有助于医疗保健专业人员更好地为患者提供个性化的治疗和建议。

总的来说,这个技术方案利用深度学习和自监督学习的方法,构建了一个用于老年糖尿病分类的模型,为医疗保健提供了一种自动化、精细化的工具。

本发明的一个实施例,通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型,包括:

S201、通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值;其中,所述深度学习网络模型采用基于孪生网络的二分类聚类网络结构;

S202、利用所述相似度最大值和相似度最小值对所述孪生网络单元对应的神经网络单元进行训练,获得训练后的神经网络单元;其中,所述训练后的神经网络单元即为用于糖尿病六分型的网络模型。

具体训练方式为:对孪生网络的训练要求两两样本之间的相似标签r_ij已知,而数据中不存在。针对此,本框架采用自步打标签的方法逐步打标签,以自监督的形式逐步训练得到最终的神经网络。

其中,通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值,包括:

步骤A1、将样本数据集输入至孪生网络单元;

步骤A2、所述孪生网络单元计算获得所述样本数据集的各样本数据的两两样本数据之间的相似度,获得所述样本数据集对应的包含多个相似度数值的相似度数值集合;

步骤A3、从所述相似度数值集合中提取相似度最大值和相似度最小值;

步骤A4、将所述相似度最大值和相似度最小值打上相似标签;

步骤A5、将带有相似标签的相似度最大值和相似度最小值对应的样本数据组输入至神经网络单元;

步骤A6、在所述带有相似标签的相似度最大值和相似度最小值对应的样本数据组输入至神经网络单元之后,在所述相似度数值集合的剩余的相似度数值中再次挑选相似度最大值和相似度最小值,获得包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值;

步骤A7、对所述包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值打上相似度标签;

步骤A8、将带有相似度标签的所述包含剩余的相似度数值的相似度数值集合中的相似度最大值和相似度最小值输入对应的样本数据组至神经网络单元;

步骤A9、重复步骤A6至步骤A8直至所述相似度数值集合中的所有相似度数值均被打上相似度标签,并且,相似度最大值和相似度最小值对应的样本数据组被输入至神经网络。

其中,利用所述相似度最大值和相似度最小值对所述孪生网络单元对应的神经网络单元进行训练,获得训练后的神经网络单元,包括:

步骤B1、所述神经网络单元接收到一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组;

步骤B2、利用所述带有相似度标签的相似度最大值和相似度最小值对应的样本数据组进行一次神经网络训练;

步骤B3、在完成一次神经网络训练后,实时监测是否接收到下一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组;

步骤B4、当接收到下一组带有相似度标签相似度最大值和相似度最小值对应的样本数据组时,利用所述带有相似度标签的相似度最大值和相似度最小值对应的样本数据组进行一次神经网络训练;

步骤B5、重复步骤B1至步骤B4直至完成神经网络的训练, 获得训练后的神经网络单元。

同时,所述用于进行糖尿病六分型的网络模型中的DAE的解码器部分加入数据重构损失,并且,所述数据重构损失对应的目标函数如下:

其中,

上述技术方案的工作原理为:输入无标签样本,经过孪生网络,计算得到两两样本的相似度,每次选择最相似和最不相似的那批样打上标签,并训练当前网络。继续选取剩下样本中相似和最不相似的那批样本来训练直到所有样本都被选择,训练完成。每次选择高置信度的样本对训练当前网络,以高可靠的自监督学习有效缓解了监督信号的不准确性。同时,在自监督训练过程中容易出现退化解。即网络优化时没有考虑数据样本原始空间的特征分布,只是简单的将数据样本映射到一个使损失减少簇,而不是期望的簇。为了进一步提高模型的可靠性,预训练了一个深度自编码器来初始化网络参数,以保障模型初始时的相似度计算结果的高置信度。 针对此,利用DAE的解码器部分,加入数据重构损失,以使数据在特征提取后仍能最大限度的保持原有分布,最终目标函数为本实施例上述目标函数。

上述技术方案的效果为:本实施例的上述技术方案采用了自监督学习方法,不需要外部标签数据。它使用相似度最大值和相似度最小值来自动学习数据的表示和相似性度量。通过步骤A,模型利用孪生网络单元计算样本数据集中的两两数据之间的相似度,然后将这些数据分为相似和不相似的组。这有助于训练模型捕获数据的内在相似性和差异性。在步骤B中,训练后的神经网络单元接收带有相似度标签的相似度最大值和相似度最小值对应的样本数据组,然后进行神经网络训练。这使得神经网络可以学习如何区分相似和不相似的数据点。

本实施例的上述技术方案允许模型不断地接收新的相似度数据对,进行实时监测,然后进行迭代训练。这有助于不断改进模型的性能和适应新数据。模型通过自动标签生成相似度标签,不需要手动为数据分配标签,降低了人工成本。

综上所述,本实施例的上述技术方案的技术效果在于使用自监督学习和孪生网络结构,能够有效地学习数据的相似性,并为神经网络提供有监督训练的标签。这有助于提高模型的性能,使其能够更好地处理相似性和差异性数据,并且能够随着新数据的到来不断改进。

本发明的一个实施例,所述通过深度学习网络模型的孪生网络单元获取述样本数据集中的样本数据的两两数据之间的相似度最大值和相似度最小值,还包括:

第1步、当获得所述样本数据集对应的包含多个相似度数值的相似度数值集合时,提取所述多个相似度数值,并根据所述相似度数值设置第一相似度阈值;其中,所述第一相似度阈值通过如下公式获取:

其中,

第2步、利用所述多个相似度数值和所述第一相似度阈值设置第二相似度阈值;其中,所述第第二相似度阈值通过如下公式获取:

其中,

第3步、利用所述第一相似度阈值和第二相似度阈值设置差异阈值;

第4步、实时监测相似度数值集合中剩余相似度数值中被选中的相似度最大值和相似度最小值;

第5步、将所述相似度最大值和所述相似度最小值进行比较,获得所述相似度最大值和所述相似度最小值之间的差异值;

第6步、当所述相似度最大值和所述相似度最小值之间的差异值低于差异阈值时,则将所述差异值低于所述差异阈值的相似度最大值和相似度最小值对应的样本数据组进行样本数据调整;

第7步、在所述差异值低于所述差异阈值的相似度最大值和相似度最小值对应的样本数据组进行样本数据调整过程中,实时监控相似度最大值和相似度最小值对应的样本数据组对应的相似度最大值和相似度最小值的变化,直至所述相似度最大值和相似度最小值对应的样本数据组对应的相似度最大值和相似度最小值的差异值低于所述差异阈值的相似度最大值和相似度最小值所对应样本数据组调整后对应的相似度最大值和相似度最小值之间的差异值不低于差异阈值,且,所述相似度最大值和相似度最小值之间的差异值与历史获得的相似度最大值和相似度最小值之间的差异值均不相同。

上述技术方案的工作原理为:第一相似度阈值设置(第1步):根据相似度数值集合中的相似度数据,计算第一相似度阈值。这个阈值是通过一定的公式计算得出的,其中包括相似度数据的平均值和一些系数。这个阈值将用于下一步的相似度数据筛选。

第二相似度阈值设置(第2步):基于第一相似度阈值和相似度数据,计算第二相似度阈值。这个阈值的计算方式也包括了相似度数据的平均值和一些系数。

差异阈值设置(第3步):在前两步计算的基础上,设置一个差异阈值,该阈值将用于确定相似度数据是否需要进行调整。

实时监测相似度数据(第4步):在实时监测中,检查剩余相似度数值中被选中的相似度最大值和最小值。

差异值计算(第5步):计算选中的相似度最大值和最小值之间的差异值。

相似度数据调整(第6步):如果差异值低于差异阈值,那么将对应的样本数据组进行调整。

实时监控(第7步):在调整的过程中,实时监控相似度最大值和最小值,直到差异值不低于差异阈值,并且与历史数据的差异值不同。

上述技术方案的效果为:本实施例的上述技术方案允许自动监测和调整相似度数据,以确保相似度最大值和最小值之间的差异值在一定范围内。通过调整不同的阈值(第一相似度阈值、第二相似度阈值和差异阈值),可以根据需要调整数据的筛选和调整过程,提高了灵活性。通过实时监控,可以根据数据的动态变化进行调整,而不仅仅是一次性的静态处理。本实施例的上述技术方案可以自适应地调整相似度数据,以适应不同数据分布和变化。这有助于确保模型的性能稳定性。

同时,利用上述方式实时提高最大相似度数值和最小相似度数值之间的差异性,进而有效提高样本数据之间的差异性,通过样本数据之间差异性的增大而提高模型训练的效率,防止差异性较小导致模型训练过程中出现异常值的概率增大的问题发生。同时,通过上述公式获取的第一相似度阈值和第二相似度阈值,能够最大限度保证差异阈值设置的合理性,防止差异性阈值设置过小导致无法及时的最大化提高样本数据中的相似度最大值和所述相似度最小值之间区别导致模型训练异常值出现概率较大的问题发生,同时,能够防止差异性阈值设置过大,导致样本数据之间的相似度过小,导致神经网络因为样本数据的差异性较大,而无法获得有效的训练,进而对相似度较小的后续数据无法做到有效识别的问题发生。

本发明的一个实施例,利用所述第一相似度阈值和第二相似度阈值设置差异阈值,包括:

第301步、提取所述第一相似度阈值;

第302步、将所述相似度数值集合中的相似度数值与所述第一相似度阈值依次进行比较,获得第一差值集合;

第303步、提取所述第二相似度阈值;

第304步、将所述相似度数值集合中的相似度数值与所述第二相似度阈值依次进行比较,获得第二差值集合;

第305步、利用所述第一差值集合和第二差值集合中的差异值参数设置差异阈值。

其中,所述差异阈值通过如下公式获取:

其中,

上述技术方案的工作原理为:提取第一相似度阈值(第301步):首先,从先前计算的第一相似度阈值中提取一个值。

比较相似度数值与第一相似度阈值(第302步):将相似度数值集合中的每个相似度数值与第一相似度阈值依次进行比较,以获得第一差值集合。这个差值表示每个相似度数值与第一相似度阈值之间的差异。

提取第二相似度阈值(第303步):接着,从先前计算的第二相似度阈值中提取一个值。

比较相似度数值与第二相似度阈值(第304步):将相似度数值集合中的每个相似度数值与第二相似度阈值依次进行比较,以获得第二差值集合。这个差值表示每个相似度数值与第二相似度阈值之间的差异。

使用差异值参数设置差异阈值(第305步):最后,根据第一差值集合和第二差值集合中的差异值参数,设置差异阈值。这个差异阈值将用于决定相似度最大值和最小值之间的差异是否足够小,以触发数据的调整。

上述技术方案的效果为:本实施例的上述技术方案通过比较相似度数值与两个预设的相似度阈值,然后使用这些差值参数来设置差异阈值。这个过程自动地根据相似度数据和预设阈值参数来确定差异阈值。差异阈值的设置是自适应的,可以根据相似度数值的分布和特性来调整,而不需要手动设置。差异阈值允许对相似度最大值和最小值之间的差异进行精细控制,确保只有足够小的差异会触发数据的调整,从而提高模型的稳定性和性能。

同时,利用上述方式实时提高最大相似度数值和最小相似度数值之间的差异性,进而有效提高样本数据之间的差异性,通过样本数据之间差异性的增大而提高模型训练的效率,防止差异性较小导致模型训练过程中出现异常值的概率增大的问题发生。同时,通过上述公式获取的第一相似度阈值和第二相似度阈值,能够最大限度保证差异阈值设置的合理性,防止差异性阈值设置过小导致无法及时的最大化提高样本数据中的相似度最大值和所述相似度最小值之间区别导致模型训练异常值出现概率较大的问题发生,同时,能够防止差异性阈值设置过大,导致样本数据之间的相似度过小,导致神经网络因为样本数据的差异性较大,而无法获得有效的训练,进而对相似度较小的后续数据无法做到有效识别的问题发生。

本发明实施例提出了一种基于深度对比聚类的糖尿病六分型系统,如图2所示,所述糖尿病六分型系统包括:

数据集构建模块,用于利用病历数据构建老年糖尿病的样本数据集;

自监督训练模块,用于通过基于孪生网络的二分类聚类网络结构的深度学习网络模型获取样本数据的两两数据之间的相似度最大值和相似度最小值的方式对深度学习网络模型进行自监督训练,获得具有自监督功能的用于糖尿病六分型的网络模型;

分型执行模块,用于将实时采集到的患者信息输入至所述训练后的用于糖尿病六分型的网络模型,并利用所述训练后的用于糖尿病六分型的网络模型确定当前患者的糖尿病类型。

上述技术方案的工作原理为:首先,从病历数据中提取与老年糖尿病相关的信息,这些信息将用于构建模型的训练数据集。

然后,自监督训练深度学习网络模型:具体的,使用深度学习网络模型,该模型包括神经网络单元和孪生网络单元,它们具有相同的网络结构。

神经网络单元和孪生网络单元之间共享权重,这有助于学习数据的表示和相似度度量。

利用自监督训练方法,网络模型学习样本数据中两两数据之间的相似度最大值和相似度最小值,以便在无监督情况下对数据进行聚类,特别是将老年糖尿病分为六个不同的类型。

这个模型还包括神经网络本体和聚类约束层,这些层有助于模型的学习和数据聚类。

最后,在实际应用中,采集患者的信息,并将这些信息输入到训练好的模型中。模型通过学到的相似度度量和聚类信息来确定当前患者的糖尿病类型。

上述技术方案的效果为:本实施例提出的一种基于深度对比聚类的糖尿病六分型方法和系统对老年糖尿病患者(Age≥65)进行聚类分析分型并具备极高的验证稳定性;同时,能够以端到端的方式工作,避免了误差累积,并利用高可靠的打标签方式,最大程度降低监督信号的不准确性,有效提高监督信号和聚类的准确性。同时,上述技术方案的技术效果还包括:

自监督学习:通过自监督训练,该模型不需要人工标签,而是通过数据本身来学习如何聚类老年糖尿病数据。

糖尿病六分型:该模型的目标是将老年糖尿病分为六个不同的类型,这有助于更好地了解和处理不同病例之间的差异,以实现更精细化的治疗和管理。

实时患者糖尿病类型识别:一旦模型训练完成,它可以用于实时识别患者的糖尿病类型,有助于医疗保健专业人员更好地为患者提供个性化的治疗和建议。

总的来说,这个技术方案利用深度学习和自监督学习的方法,构建了一个用于老年糖尿病分类的模型,为医疗保健提供了一种自动化、精细化的工具。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

技术分类

06120116581487