掌桥专利:专业的专利平台
掌桥专利
首页

一种基于双向GRUs的单病种临床路径构建方法及系统

文献发布时间:2023-06-19 09:36:59


一种基于双向GRUs的单病种临床路径构建方法及系统

技术领域

本发明涉及医疗信息或医疗数据领域,尤其涉及一种基于双向GRUs的单病种临床路径构建方法及系统。

背景技术

临床路径(Clinical Patlhmays,CP)是指针对某个国际疾病分类法(International Classification of Di seases,ICD)对应的疾病或手术操作,以循证医学为基础、以预期的治疗效果和成本控制为目的制定的有严格工作顺序和准确时间要求的程序化、标准化的诊疗计划。

由于我国开展临床路径处于初始阶段,临床路径的制定主要依靠传统的专家评估评定,耗时较长,成本较高,在临床实践中变异度较大。截至目前为止,由国家卫计委主导制定的临床路径仅有约1200种左右,与我国ICD-10/IC9-9所收录的近40000种疾病相比则相距甚远,远远满足不了临床实践对临床路径的需求。国家发布的临床路径管理标准中包含了适用对象,诊断依据、进入路径的标准、标准住院时长、住院期间的检查项目、住院前准备、治疗方案的选择、出院标准、变异及原因分析。其中关于诊疗方案的选择、具体的用药和费用说明没有确切的指导。

临床路径的数据挖掘的数据源通常是医院常用的信息软件,而医院常用的信息系统有医院信息系统(Hospital Information System,HIS)、电子病历系统(ElectronicMedical Record,EMR)、实验室信息管理系统(Laboratory InformationManagementSystem,LIS)、影像归档和通信系统(Picture Archiving and CommunicationSystems,PACS)系统。其中LIS系统长用于检查检验科,将检验的实验仪器同电脑链接后可获取并分析如血常规检测等众多检查检验项目的数据、生成检测报告。PACS系统被影像科的广泛应用,它可将如CT、核磁共振等日常医学影像电子化存储,同时伴有辅助阵诊断功能。而LIS系统和PACS系统中产生的检验结果、图像结果往往被在HIS系统和EMR系统呈现并利用。

现有技术有通过对医疗数据病人信息、诊断信息、检查信息、费用信息建立多元组模型或图模型来构建临床路径;也有一些利用的自然语言处理或机器学习、专家知识库或医学知识库对文本数据进行挖掘,挖掘内在的关联,以构建临床路径,虽然取得一些效果,但仍存在几个问题:

1.多元组模型或图模型虽然重视病人体征信息、治疗手段、药物的内在关联,甚至利用了推理学习,但其忽视了时序性、变异性差;即同一病人在病人体征信息、治疗手段、药物相同情况下最终的治疗效果也可能存在不同。

2.利用自然语言处理或机器学习的聚类方法通过挖掘医疗数据的文本信息,虽然能获得一定的效果,但其解释性饱受质疑、泛化性差;

综上,现有临床路径构建方法缺乏对医疗数据的时序性、一致性、可变性。

发明内容

本发明针对现有临床路径构建技术中存在的可解释性不强、缺乏时序性、一致性、可变性的技术问题,一方面提供了一种基于双向GRUs的单病种临床路径构建方法,包括如下步骤:

获取待构建的单病种的多源异构的医疗数据,利用PCA、局部线性嵌入LLE或核方法、聚类方法对所述医疗数据进行预处理;所述医疗数据包括医院信息系统的数据、电子病历系统所存储的数据;

以单个诊疗日为基准,根据IP协议报文的数据结构对所述医疗数据进行结构化,得到由若干个第一类路径节点组成的第一类路径节点集合;

根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合;

将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

在本发明的一些实施例中,为了保证由原始医疗数据的一致性和可解释性,利用IP协议报文结构的报头、数据、报尾的格式对所述医疗数据进行进步步结构化:所述第一类路径节点包括作为节点开头的时间信息、作为节点中间的文本数据、作为节点结尾的费用信息;

所述节点中间的文本数据包括病人体征信息的文本数据、诊疗信息的文本数据、药物信息的文本数据。

进一步的,为了挖掘医疗数据之间的关联性,对医疗数据中的文本数据进行挖掘,所述根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合包括如下步骤:

根据文本数据中的不同主题和LDA算法对第一类路径节点集合中的文本数据进行分类,对文本数据中的时间信息、病人状态、治疗费用、药物信息进行标准化、归一化,即:以病人住院日为第一日,将文本数据中的时间信息换算成相应诊疗日,作为时序特征;将病人状态信息划分为差、良好、痊愈,作为病人状态特征;将治疗费用划分为低、适中、高,作为治疗费用特征,得到第二类节点;

然后分别以时序、病人状态、治疗费用、药物信息为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合。

在本发明的一些实施例中,所述将所述第二类路径节点集合划分为训练集、验证集,将所述训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点包括如下步骤:

将所述训练集作为以双向GRUs的连接层,将胶囊网络作为所述双向GRUs的softmax层,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

进一步的,按照费用最小、住院时间最短、病人出院时的状态最好调整损失函数以生成不同的第三类路径节点,保存所述第三类路径节点。

在上述的实施例中,在所述将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点之后还包括:根据所述第三类路径节点和第二类路径节点建立生成式对抗神经网络。

为了提高胶囊网络的准确性,进一步的,所述生成式对抗神经网络包括生成网络、判别网络,所述生成网络包括所述胶囊网络。

另一方面,本发明提供了一种基于双向GRUs的单病种临床路径构建系统,包括预处理模块、第一路径节点模块、第二路径节点模块、第三路径节点模块,

所述预处理模块用于获取待构建的单病种的多源异构的医疗数据,利用PCA、局部线性嵌入LLE或核方法、聚类方法对所述医疗数据进行预处理;所述医疗数据包括医院信息系统的数据、电子病历系统所存储的数据;

所述第一路径节点模块用于以单个诊疗日为基准,根据IP协议报文的数据结构对所述医疗数据进行结构化,得到由若干个第一类路径节点组成的第一类路径节点集合;

第二路径节点模块用于根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合;

第三路径节点模块用于将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

为了使生成的临床路径具有灵活性和实时性,在本发明的一些实施例中,所述第三类路径节点模块包括用户接口、存储单元、路径生成单元,所述用户接口,用于接收用户的输入;所述存储单元,用于保存所述第一类路径节点集合、第二类路径节点集合、第三类路径节点集合;所述路径生成单元,用于根据用户接口的输入以生成不同的第三路径节点集合。

进一步的,所述路径生成单元根据生成树算法生成第三类路径节点。

有益效果:

1.本发明在充分考虑到与临床路径有关的医疗数据的复杂性、关联性、非结构化、时序性,而IP报文也有相似的数据结构,因此,本发明首次提出以IP报文的数据结构对与临床路径有关的医疗数据进行结构化,以使生成的医疗路径具有一致性、时序性。

2.利用主题LDA进行特征提取、聚类,挖掘医疗数据的内在关联同时,保证了其生成的路径可解释性。

3.采用双向GRUs和胶囊网络对带有时序性的数据或序列,进一步地保证了生成的临床路径的时序性。更进一步,利用生成式对抗神经网络提高精确度。

4.极大缩短临床路径的构建时间,降低临床路径的变异度,同时通过构建的临床路径将会持续改进医疗质量、控制医疗成本、缩短住院天数,提高临床工作效率,优化服务流程,将产生良好的社会效益和经济效益,促进医疗水平及服务水平的提高。

附图说明

图1为本发明的一些实施例中的基于双向GRUs的单病种临床路径构建方法的基本原理图;

图2为本发明的一些实施例中的第一类路径节点的数据结构示意图;

图3为本发明的一些实施例中的特征提取示意图;

图4为本发明的一些实施例中的基于双向GRUs的单病种临床路径构建系统的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

一种基于双向GRUs的单病种临床路径构建方法,包括如下步骤:

S101.获取待构建的单病种的多源异构的医疗数据,利用PCA、局部线性嵌入LLE或核方法、聚类方法对所述医疗数据进行预处理;所述医疗数据包括医院信息系统的数据、电子病历系统所存储的数据;

S102.以单个诊疗日为基准,根据IP协议报文的数据结构对所述医疗数据进行结构化,得到由若干个第一类路径节点组成的第一类路径节点集合;

S103.根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合;

S104.将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

在本发明的一些实施例的步骤S102中,为了保证由原始医疗数据的一致性和可解释性,利用IP协议报文结构的报头、数据、报尾的格式对所述医疗数据进行进步步结构化:所述第一类路径节点包括作为节点开头的时间信息、作为节点中间的文本数据、作为节点结尾的费用信息;

所述节点中间的文本数据包括病人体征信息的文本数据、诊疗信息的文本数据、药物信息的文本数据。

进一步的,在步骤S103中,为了挖掘医疗数据之间的关联性,对医疗数据中的文本数据进行挖掘,所述根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合包括如下步骤:

根据文本数据中的不同主题和LDA算法对第一类路径节点集合中的文本数据进行分类,对文本数据中的时间信息、病人状态、治疗费用、药物信息进行标准化、归一化,即:以病人住院日为第一日,将文本数据中的时间信息换算成相应诊疗日,作为时序特征;将病人状态信息划分为差、良好、痊愈,作为病人状态特征;将治疗费用划分为低、适中、高,作为治疗费用特征,得到第二类节点;

然后分别以时序、病人状态、治疗费用、药物信息为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合。

在本发明的一些实施例的步骤S104中,所述将所述第二类路径节点集合划分为训练集、验证集,将所述训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点包括如下步骤:

将所述训练集作为以双向GRUs的连接层,将胶囊网络作为所述双向GRUs的softmax层,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

进一步的,按照费用最小、住院时间最短、病人出院时的状态最好调整损失函数以生成不同的第三类路径节点,保存所述第三类路径节点。

在上述的实施例中,在所述将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点之后还包括:根据所述第三类路径节点和第二类路径节点建立生成式对抗神经网络。

为了提高胶囊网络的准确性,进一步的,所述生成式对抗神经网络包括生成网络、判别网络,所述生成网络包括所述胶囊网络。

另一方面,本发明提供了一种基于双向GRUs的单病种临床路径构建系统1,包括预处理模块11、第一路径节点模块12、第二路径节点模块13、第三路径节点模块14,

所述预处理模块11用于获取待构建的单病种的多源异构的医疗数据,利用PCA、局部线性嵌入LLE或核方法、聚类方法对所述医疗数据进行预处理;所述医疗数据包括医院信息系统的数据、电子病历系统所存储的数据;

所述第一路径节点12模块用于以单个诊疗日为基准,根据IP协议报文的数据结构对所述医疗数据进行结构化,得到由若干个第一类路径节点组成的第一类路径节点集合;

第二路径节点模块13用于根据第一类路径节点中的文本数据的不同主题和LDA算法对所述第一类路径节点进行分类和特征提取,得到第二类路径节点;然后分别以时序、病人状态、治疗费用为中心特征对所述第一类路径节点进行聚类,得到第二类路径节点集合;

第三路径节点模块14用于将所述第二类路径节点集合划分为训练集、验证集,将训练集作为双向GRUs和胶囊网络的输入,根据第二类路径节点的特征值构建损失函数训练所述双向GRUs和胶囊网络直至其输出值达到阈值,得到第三类路径节点。

为了使生成的临床路径具有灵活性和实时性,在本发明的一些实施例中,所述第三类路径节点14模块包括用户接口、存储单元、路径生成单元,所述用户接口,用于接收用户的输入;所述存储单元,用于保存所述第一类路径节点集合、第二类路径节点集合、第三类路径节点集合;所述路径生成单元,用于根据用户接口的输入以生成不同的第三路径节点集合。

进一步的,所述路径生成单元根据生成树算法生成第三类路径节点。

需要说明的是,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如前述实施例中的卷积神经网络的加速方法的步骤。对于本发明提供的计算机可读存储介质的介绍请参照前述的加速方法的实施例,本发明实施例在此不再赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术分类

06120112237905