掌桥专利:专业的专利平台
掌桥专利
首页

一种基于数据挖掘的硬皮病分析系统

文献发布时间:2024-04-18 19:53:33


一种基于数据挖掘的硬皮病分析系统

技术领域

本发明涉及一种疾病数据分析系统,特别是涉及一种基于数据挖掘的硬皮病分析系统,属于硬皮病数据分析系统技术领域。

背景技术

硬皮病是一种皮肤出现进行性硬化特征的结缔组织疾病,在西医方面,病征常见有皮肤和内脏结缔组织局限性或弥散性纤维化、硬化甚至萎缩,临床将硬皮病按照皮肤受累情况分为局限型硬皮病和系统型硬皮病,局限型硬皮病变现为皮肤胶原纤维增生,皮肤损害局限于肢体远端掌指关节或头面部,不累及内脏器官,预后情况较好,系统型硬皮病累及肺、肾等系统器官,皮肤损害分布范围广泛,雷诺现象阳性,能够检测出SSc特异性抗体,预后情况无法确定,硬皮病的发病原因复杂,大部分学者认为硬皮病的发病机制主要包括免疫功能异常、胶原合成异常以及血管损伤,发病病因不明确,发病机制复杂,在缺少大型临床试验的情况下,硬皮病的治疗非常困难,结合病因和发病机制通常把治疗方法分为药物治疗、物理治疗、生物制剂治疗以及整形外科治疗;在中医的认知范围内,以从古至今的中医理论为基础,硬皮病与肺脾肾三脏以及气血密切相关,脏腑虚弱或气血不足均为“本虚”,外界的风寒湿邪或疾病过程中产生的瘀血、痰饮等病理产物皆是“标实”,治疗硬皮病的思路主要是在疾病初起及时祛除外邪,在注重辨虚实的同时调养脏腑气血,在进行汤液内治的同时,运用针、灸、外洗对患处直接作用。

数据挖掘是应时代需求而生的一种数据分析过程,随着数据库广泛应用于金融、销售与生物医药等领域,数据库的数据量爆发式增长,在海量的数据中提取有效信息已经成为一种必要的技术手段,数据挖掘技术就是一种能够从大型数据库的数据中提取隐含的有效信息,并且将其转化为概念、规律、规则、模式以及算法等形式的过程,作为数据库知识发现的核心步骤,在选定适合进行挖掘的数据后根据数据挖掘目标的不同对不同数据进行处理,消除无效值和缺失值,融合不同来源的数据,变换成统一的格式,完成这些数据预处理后,通过特定的算法发现隐藏在数据中的目的知识,识别这些目的知识后对挖掘的知识进行评估,得到满意评估结果后,运用可视化的技术将获得的知识进行展示,根据数据发掘所能发现的规则特征不同,常见的数据挖掘分为分类模式挖掘、聚类模式挖掘、关联规则挖掘、回归模式挖掘、序列模式挖掘以及偏差模式挖掘,主要的数据挖掘算法包括分类模式算法、聚类模式算法以及关联规则算法。关联规则算法能够按照数据维数、数据抽象层次、变量类别处理方法等选取不同算法,能够发现数据中的频繁项集,而中医遣方用药经验、方剂配伍规律以及重要药性研究等领域非常适合这种关联规则算法,关联规则算法能够在实际操作的过程中根据与处理后的数据设置不同的支持度和置信度,支持度能够代表关联规则的覆盖量,代表正确预测的实例数量,置信度代表正确预测实例数量在关联规则应用的全部数据中的占比,在设置不同支持度和置信度的前提下,能够挖掘到数据中高频药物的组合。同时,层次聚类算法和复杂系统熵聚类算法是在中医药研究中常用的聚类分析算法,层次聚类算法能够根据疾病以及证型对中医上研究的疾病进行聚类,分析单一疾病、单一证型下的用药组合,也能够按照药物的性味以及归经等层次对疾病的用药进行聚类分析;复杂熵系统熵聚类算法用于挖掘数据中的核心药物组合及新药处方。分类分析算法能够用于药物疗效、药物靶点、药物安全性的研究:决策树算法能够根据已知药性预测未知或缺失药性,也能用于预测不良反应发生的概率;随机森林法用于预测中药有效成分的作用靶点;在贝叶斯理论的基础上建立网状Meta分析,能够对药物的有效率、安全性等指标进行综合比较。

中医对硬皮病的治疗效果显著,但是中医的用药规律比较复杂,通过人为学习和分析无法快速有效形成新的药方,其形成的新药方也没有对预后症状进行统一评估的标准,因此本发明提出一种基于数据挖掘的硬皮病分析系统,能够结合硬皮病患者的信息和用药数据形成数据库,对数据库中的数据利用关联规则算法、层次聚类算法和复杂系统熵聚类算法进行聚类分析,分析医生用药的规律和经验,并根据中药的药性、药味、归经结合患者的证型进行新药方组合,结合对使用新药方的硬皮症患者的预后皮肤状态进行评估,进而挖掘新药方的使用效果,便于医生根据硬皮症患者使用新药方后的预后皮肤厚度和弹性的评估对新药方的疗效进行定量评估,便于为医生对新药方的使用效果提供定量的评估方法。

发明内容

本发明的主要目的是为了解决中医对硬皮病的治疗效果显著,但是中医的用药规律比较复杂,通过人为学习和分析无法快速有效形成新的药方,其形成的新药方也没有对预后症状进行统一评估的标准的不足,而提供的一种基于数据挖掘的硬皮病分析系统。

本发明的目的可以通过采用如下技术方案达到:

一种基于数据挖掘的硬皮病分析系统,包括药方数据采集模块,所述药方数据采集模块连接有药方数据库构建模块,所述药方数据库构建模块连接有数据预处理模块,所述数据预处理模块连接有数据统计模块,所述数据统计模块连接有数据挖掘模块,所述数据挖掘模块连接有用药经验分析模块,所述用药经验分析模块连接有新药方构建模块,所述新药方构建模块连接有疗效评估模块,所述疗效评估模块通过对硬皮病患者预后三天和预后十天的双侧近端指间关节、双侧掌指关节、双侧手背、双侧前臂、双侧上臂、双侧大腿及双侧小腿的皮肤标定测量部位进行测量,对测量部位的皮肤在患者预后三天和预后十天通过常规超声检查重复测量三次,获取测量部位皮肤预后三天和预后十天的厚度平均值,通过实时剪切波弹性成像检查分别获取患者预后三天以及预后十天测量部位皮肤杨氏模量的最大值以及最小值,获取杨氏模量的均值,每个部位测量三次,设置皮肤厚度评估指标,用于评估硬皮病患者在使用新药方后皮肤厚度发生的改变,皮肤厚度指标与患者预后十天和预后三天的皮肤厚度平均值之差负相关,设置皮肤杨氏模量评估指标,用于评估硬皮病患者在使用新药方后皮肤弹性发生的改变,皮肤样式模量评估指标与预后十天和预后三天硬皮病患者的皮肤杨氏模量均值之差负相关,皮肤厚度评估指标和皮肤杨氏模量评估指标的评估公式分别为:

(1)皮肤厚度评估指标的评估公式:

/>

式中:i记为硬皮病患者检测的身体部位的编号,D

(2)皮肤杨氏模量评估指标的评估公式:

式中:Y

将硬皮病患者近端指间关节、掌指关节、手背、前臂、上臂、大腿及小腿的皮肤测量部位分别进行编序,序号分别为i=1、i=2、i=3、i=4、i=5、i=6以及i=7;

设置皮肤评估综合指标,皮肤评估综合指标与所有测量部位皮肤厚度评估指标之和以及所有测量部位皮肤杨氏模量评估指标的均值均正相关,皮肤评估综合指标的公式为:

式中:I

将硬皮病患者的皮肤评估综合指标I

当0≤f(I

当0.5≤f(I

对每个新药方进行聚类分析,统计使用每个新药方的硬皮病患者预后皮肤的各项数据,结合使用每个新药方的患者预后皮肤评估状态分析新药方的疗效。

作为本发明进一步的方案,所述药方数据采集模块采集医生给硬皮病患者的中药药方数据,对硬皮病患者的选择排除个人信息及病例不完整的患者、合并银屑病以及湿疹等其他皮肤病的患者、皮损伴破溃和感染的患者、妊娠期或哺乳期妇女以及严重心肺功能不全或肝肾功能不全的患者。

作为本发明进一步的方案,所述数据库构建模块通过所述药方数据采集模块采集的患者以及药方的数据信息建立硬皮病评估数据库。

作为本发明进一步的方案,所述数据预处理模块用于将药方中的中药因为剂型、同药异名以及炮制方法不同导致不同命名方式的中药进行统一名称处理。

作为本发明进一步的方案,所述数据统计模块用于进行数据清洗,对患者的年龄、证型、药物使用频次、药物性味归经的信息进行统计,并制成图标进行展示,再设置不同的置信度和支持度进行基于关联规则的药物组合进行分析,然后设置不同的相关度和惩罚度,基于熵方法对药物间关联度进行聚类分析,再基于复杂系统熵聚类对核心药物组合进行分析,基于无监督的熵层次聚类得出新方组合。

作为本发明进一步的方案,所述用药经验分析模块对每种证型的药物频次按药性进行卡方检验,检验不同证型所用药物的用药频次按药性、药味以及归经是否存在统计学差异,对每种证型使用频次前十名的药物进行统计,分析医生的用药经验和方式,对每种证型的药用药归经进行频次统计和降序排名,得出排名前三位的药物归经,对药物性味进行频次统计和降序排名,得出排名前三的三种药性,设置置信度为0.9,将支持度逐渐从20%提升至50%,进行用药规律动态展示,分析硬皮病每个证型的用药规律,进行新方组合分析。

本发明的有益技术效果:按照本发明的基于数据挖掘的硬皮病分析系统,通过数据采集模块的设置,能够采集硬皮病患者和患者的对应证型的药方数据,通过数据库构建模块的设置,能够结合硬皮病患者的信息和用药数据形成数据库,通过数据挖掘模块的设置,对数据库中的数据利用关联规则算法、层次聚类算法和复杂系统熵聚类算法进行聚类分析,通过用药经验分析模块的设置,能够分析医生用药的规律和经验,并根据中药的药性、药味、归经结合患者的证型进行新药方组合,通过疗效评估模的设置,能够结合对使用新药方的硬皮症患者的预后皮肤状态进行评估,进而挖掘新药方的使用效果,便于医生根据硬皮症患者使用新药方后的预后皮肤厚度和弹性的评估对新药方的疗效进行定量评估,便于为医生对新药方的使用效果提供定量的评估方法。

附图说明

图1为按照本发明的基于数据挖掘的硬皮病分析系统的结构框图

具体实施方式

为使本领域技术人员更加清楚和明确本发明的技术方案,下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

如图1所示,本实施例提供的基于数据挖掘的硬皮病分析系统,包括药方数据采集模块,所述药方数据采集模块连接有药方数据库构建模块,所述药方数据库构建模块连接有数据预处理模块,所述数据预处理模块连接有数据统计模块,所述数据统计模块连接有数据挖掘模块,所述数据挖掘模块连接有用药经验分析模块,所述用药经验分析模块连接有新药方构建模块,所述新药方构建模块连接有疗效评估模块,所述疗效评估模块通过对硬皮病患者预后三天和预后十天的双侧近端指间关节、双侧掌指关节、双侧手背、双侧前臂、双侧上臂、双侧大腿及双侧小腿的皮肤标定测量部位进行测量,对测量部位的皮肤在患者预后三天和预后十天通过常规超声检查重复测量三次,获取测量部位皮肤预后三天和预后十天的厚度平均值,通过实时剪切波弹性成像检查分别获取患者预后三天以及预后十天测量部位皮肤杨氏模量的最大值以及最小值,获取杨氏模量的均值,每个部位测量三次,设置皮肤厚度评估指标,用于评估硬皮病患者在使用新药方后皮肤厚度发生的改变,皮肤厚度指标与患者预后十天和预后三天的皮肤厚度平均值之差负相关,设置皮肤杨氏模量评估指标,用于评估硬皮病患者在使用新药方后皮肤弹性发生的改变,皮肤样式模量评估指标与预后十天和预后三天硬皮病患者的皮肤杨氏模量均值之差负相关,皮肤厚度评估指标和皮肤杨氏模量评估指标的评估公式分别为:

(1)皮肤厚度评估指标的评估公式:

式中:i记为硬皮病患者检测的身体部位的编号,D

(2)皮肤杨氏模量评估指标的评估公式:

式中:Y

将硬皮病患者近端指间关节、掌指关节、手背、前臂、上臂、大腿及小腿的皮肤测量部位分别进行编序,序号分别为i=1、i=2、i=3、i=4、i=5、i=6以及i=7;

设置皮肤评估综合指标,皮肤评估综合指标与所有测量部位皮肤厚度评估指标之和以及所有测量部位皮肤杨氏模量评估指标的均值均正相关,皮肤评估综合指标的公式为:

式中:I

将硬皮病患者的皮肤评估综合指标I

当0≤f(I

当0.5≤f(I

对每个新药方进行聚类分析,统计使用每个新药方的硬皮病患者预后皮肤的各项数据,结合使用每个新药方的患者预后皮肤评估状态分析新药方的疗效。

所述药方数据采集模块采集医生给硬皮病患者的中药药方数据,对硬皮病患者的选择排除个人信息及病例不完整的患者、合并银屑病以及湿疹等其他皮肤病的患者、皮损伴破溃和感染的患者、妊娠期或哺乳期妇女以及严重心肺功能不全或肝肾功能不全的患者。

所述数据库构建模块通过所述药方数据采集模块采集的患者以及药方的数据信息建立硬皮病评估数据库。

所述数据预处理模块用于将药方中的中药因为剂型、同药异名以及炮制方法不同导致不同命名方式的中药进行统一名称处理。

所述数据统计模块用于进行数据清洗,对患者的年龄、证型、药物使用频次、药物性味归经的信息进行统计,并制成图标进行展示,再设置不同的置信度和支持度进行基于关联规则的药物组合进行分析,然后设置不同的相关度和惩罚度,基于熵方法对药物间关联度进行聚类分析,再基于复杂系统熵聚类对核心药物组合进行分析,基于无监督的熵层次聚类得出新方组合。

所述用药经验分析模块对每种证型的药物频次按药性进行卡方检验,检验不同证型所用药物的用药频次按药性、药味以及归经是否存在统计学差异,对每种证型使用频次前十名的药物进行统计,分析医生的用药经验和方式,对每种证型的药用药归经进行频次统计和降序排名,得出排名前三位的药物归经,对药物性味进行频次统计和降序排名,得出排名前三的三种药性,设置置信度为0.9,将支持度逐渐从20%提升至50%,进行用药规律动态展示,分析硬皮病每个证型的用药规律,进行新方组合分析。

本发明提出的基于数据挖掘的硬皮病分析系统,通过数据采集模块的设置,能够采集硬皮病患者和患者的对应证型的药方数据,通过数据库构建模块的设置,能够结合硬皮病患者的信息和用药数据形成数据库,通过数据挖掘模块的设置,对数据库中的数据利用关联规则算法、层次聚类算法和复杂系统熵聚类算法进行聚类分析,通过用药经验分析模块的设置,能够分析医生用药的规律和经验,并根据中药的药性、药味、归经结合患者的证型进行新药方组合,通过疗效评估模的设置,能够结合对使用新药方的硬皮症患者的预后皮肤状态进行评估,进而挖掘新药方的使用效果,便于医生根据硬皮症患者使用新药方后的预后皮肤厚度和弹性的评估对新药方的疗效进行定量评估,便于为医生对新药方的使用效果提供定量的评估方法。

以上所述,仅为本发明进一步的实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方案及其构思加以等同替换或改变,都属于本发明的保护范围。

技术分类

06120116339415