掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据聚类生成DIP综合病种目录的方法及系统

文献发布时间:2023-06-19 10:55:46


基于大数据聚类生成DIP综合病种目录的方法及系统

技术领域

本公开涉及大数据技术领域,特别涉及一种基于大数据聚类生成DIP综合病种目录的方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。

随着国家医保局不断发文推进按病种分值付费(DIP),多个按分值付费试点城市名单也进行了公布,以及《国家医疗保障按病种分值付费(DIP)技术规范》和《DIP目录库(1.0版)》的发布,DIP的落地已经迫在眉睫。

但是想要实际使用DIP进行付费,最重要的环节是对每一个病例根据手术编码、诊断编码、年龄等特征进行入组,然后才能根据入组的结果制定每组的分值、点值、支付标准等指标的测算。而国家医保局发布的病种目录只含有核心目录,缺少了综合目录的部分。这就对各个医保局、医疗机构的使用造成了障碍,因此我们需要根据各个地方的实际数据进行自行制定本地所需要的病种综合目录。

发明人发现,目前的现状是医保局制定的主目录组合是核心目录+综合目录,但是目前只公布了核心目录而没有公布综合目录,因此就需要利用目前逐渐发展成熟的大数据技术去制定综合目录的生成的方案,这套方案需要考虑到各地的实际数据的不同,核心病种目录也会随之改变,这就使得无法制定固定的目录来使用。

发明内容

为了解决现有技术的不足,本公开提供了一种基于大数据聚类生成DIP综合病种目录的方法及系统,生成的DIP综合病种目录可以随各地数据的不同而改变,进而能够制定出符合各个地方的疾病数据特点的病种目录,提高了按病种分值付费的准确性和实施效率。

为了实现上述目的,本公开采用如下技术方案:

本公开第一方面提供了一种基于大数据聚类生成DIP综合病种目录的方法。

一种基于大数据聚类生成DIP综合病种目录的方法,包括以下步骤:

获取病案数据,并对获取的病案数据进行预处理;

将数据分割为多个子数据,并分配对应个数的Map函数;

数据Map的阶段,对子数据进行聚类;

数据Reduce阶段,对子数据的Map结果进行合并,得到最终的DIP综合病种目录。

本公开第二方面提供了一种基于大数据聚类生成DIP综合病种目录的系统。

一种基于大数据聚类生成DIP综合病种目录的系统,包括:

数据获取模块,被配置为:获取病案数据,并对获取的病案数据进行预处理;

数据分割模块,被配置为:将数据分割为多个子数据,并分配对应个数的Map函数;

数据聚类模块,被配置为:数据Map的阶段,对子数据进行聚类;

数据合并模块,被配置为:数据Reduce阶段,对子数据的Map结果进行合并,得到最终的DIP综合病种目录。

本公开第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的基于大数据聚类生成DIP综合病种目录的方法中的步骤。

本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的基于大数据聚类生成DIP综合病种目录的方法中的步骤。

与现有技术相比,本公开的有益效果是:

1、本公开所述的方法及系统,生成的DIP综合病种目录可以随各地数据的不同而改变,进而能够制定出符合各个地方的疾病数据特点的病种目录,提高了按病种分值付费的准确性和实施效率。

2、本公开所述的方法及系统,解决了DIP综合目录从无到有的问题,能随着传入数据的不同更新DIP综合目录,可以更好的拟合费用,可以最大化的保留各个地区数据的特点可以最大化的满足临床病例的入组需要。

本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1为本公开实施例1提供的基于大数据聚类生成DIP综合病种目录的方法流程示意图。

具体实施方式

下面结合附图与实施例对本公开作进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例1:

如图1所示,本公开实施例1提供了一种基于大数据聚类生成DIP综合病种目录的方法,包括以下步骤:

S1:对病案首页数据进行治理。

S1.1:首先将病案首页数据进行国家下发的核心病种目录的入组,对不能入核心病种目录组的数据拿出来进行处理和整治;

S1.2:调整编码格式,对病案首页版本为“国家临床版2.0疾病诊断编码(ICD-10)”的主要诊断映射为“医疗保障疾病诊断分类及代码(ICD-10)”,将“国家临床版2.0手术操作编码(ICD-9-CM3)”映射为“医疗保障手术操作分类与编码(ICD-9-CM-3)”;

S1.3:对包含错误编码的数据进行舍弃,以免影响正常流程。

S2:根据诊断编码和手术类型制定聚类所需要的数据特征。

S2.1:首先判断每个手术类别所对应的操作类型属性,然后按照操作类型的不同确定每条病案的最严重操作类型(手术操作>治疗操作>诊断操作),得到操作类型集合;

S2.2:对主诊断编码进行处理,分别提取出主诊断编码前三位和主诊断编码第一位,得到主诊断编码集合;

S2.3:综合上面的2个集合,制定出聚类所需要的数据特征,由主诊断编码前三位/第一位+手术操作类型组成。

S3:将数据分割为M个子数据,并分配M个Map函数。

S3.1:对数据进行均等随机切分,每部分数据的数据类型保持完全一致,切分份数可以自己指定,暂定为分为M个子数据;

S3.2:对每个子数据分配一个Map函数,每一个Map任务处理一个数据分片,得到一个Map的结果保留并返回。

S4:数据Map的阶段,对子数据进行聚类。

S4.1:将未包含手术及操作的组合作为保守治疗组合,按照主诊断分类(ICD-10第一位)进行聚类;

S4.2:将操作(ICD-9-CM3医保V1.0版)属性为“诊断性操作”的组合,叠加主诊断类目(ICD-10医保V1.0版前三位)进行聚类,构建诊断性操作组;

S4.3:将操作(ICD9-CM-3医保V1.0版)属性为“治疗性操作”的组合,叠加主诊断类目(ICD-10医保V1.0版前三位)形成治疗性操作组;

S4.4:将操作(ICD9-CM-3医保V1.0版)属性为“手术”的组合,叠加主诊断类目(ICD-10医保V1.0版前三位)聚类形成相关手术组。

S5:Reduce阶段,对子数据的Map结果进行合并.

S5.1:把Map得到的所有的簇合并为一个新的完整的数据集U;

S5.2:对相同key的类进行合并,最后每个簇的聚集的例数大于阈值数量则保留,小于阈值的簇则进行舍弃,最终完成DIP综合目录的生成。

实施例2:

本公开实施例2提供了一种基于大数据聚类生成DIP综合病种目录的系统,包括:

数据获取模块,被配置为:获取病案数据,并对获取的病案数据进行预处理;

数据分割模块,被配置为:将数据分割为多个子数据,并分配对应个数的Map函数;

数据聚类模块,被配置为:数据Map的阶段,对子数据进行聚类;

数据合并模块,被配置为:数据Reduce阶段,对子数据的Map结果进行合并,得到最终的DIP综合病种目录。

所述系统的工作方法与实施例1提供的基于大数据聚类生成DIP综合病种目录的方法相同,这里不再赘述。

实施例3:

本公开实施例3提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的基于大数据聚类生成DIP综合病种目录的方法中的步骤,所述步骤为:

获取病案数据,并对获取的病案数据进行预处理;

将数据分割为多个子数据,并分配对应个数的Map函数;

数据Map的阶段,对子数据进行聚类;

数据Reduce阶段,对子数据的Map结果进行合并,得到最终的DIP综合病种目录。

详细步骤与实施例1提供的基于大数据聚类生成DIP综合病种目录的方法相同,这里不再赘述。

实施例4:

本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的基于大数据聚类生成DIP综合病种目录的方法中的步骤,所述步骤为:

获取病案数据,并对获取的病案数据进行预处理;

将数据分割为多个子数据,并分配对应个数的Map函数;

数据Map的阶段,对子数据进行聚类;

数据Reduce阶段,对子数据的Map结果进行合并,得到最终的DIP综合病种目录。

详细步骤与实施例1提供的基于大数据聚类生成DIP综合病种目录的方法相同,这里不再赘述。

本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

相关技术
  • 基于大数据聚类生成DIP综合病种目录的方法及系统
  • 基于大数据的DIP分值测算方法与系统
技术分类

06120112738364