掌桥专利:专业的专利平台
掌桥专利
首页

基于集成模型的急诊患者早期死亡率预测方法及系统

文献发布时间:2023-06-19 11:26:00


基于集成模型的急诊患者早期死亡率预测方法及系统

技术领域

本发明涉及医学数据挖掘领域,具体是指基于集成模型的急诊患者早期死亡率预测方法及系统。

背景技术

急诊科是医院中重症病人最为集中、病种最多的科室,旨在为危急患者提供专业护理,并持续监控各项生命指标。在早期医疗阶段,有效的资源管理和人员配置常常受到限制,这已经被证明与患者的治疗效果成正相关。通过大量的临床数据对患者危机程度进行及时、准确的评估,可以辅助医生做出及时的治疗手段,潜在的降低患者死亡率。因此,急诊患者早期死亡率预测是临床研究的重要课题之一。

针对该问题提出的传统方法有急诊危重指数(Emergency Severity Index,ESI)和简化急性生理评分-Ⅱ(simplified acute physiology score-Ⅱ,SAPS-Ⅱ)等。这些评分系统通过多种临床变量得到一个严重程度评分值来反映患者的危重度,尽管应用广泛,但是通常要求变量与结果呈现线性关系,在复杂、多变量综合影响的急诊患者上使用时,其准确度较低,且缺乏针对性。

医疗信息化的发展促进了大数据技术的进步和在医疗领域中的应用,现有技术使用电子健康记录中的相关评估变量作为输入,构建各种机器学习模型进行预测。但是由于急诊的临床观察记录不定期,且不同患者、不同指标的测量频率不同,导致现有方法对特征的构建和选择较为粗糙,甚至没有考虑到变量的时序变化性。仅仅将它们作为静态特征来处理,导致部分动态信息的丢失。此外,急诊患者死亡数量与存活数量差异较大,导致采集到的数据类别分布不平衡,现有方法对此差异考虑不足,一定程度上影响了模型最终的预测性能。

发明内容

基于以上问题,本发明提供了基于集成模型的急诊患者早期死亡率预测方法及系统,解决了现有系统预测精度低的问题。

为解决以上技术问题,本发明采用的技术方案如下:

基于集成模型的急诊患者早期死亡率预测系统,包括:

便携式健康监测设备和医疗设备终端,所述便携式健康监测设备和医疗设备终端连接;

患者监控管理系统和电子健康档案,所述患者监控管理系统和电子健康档案连接;

中央业务服务器和中央存储服务器,其中,医疗设备终端和电子健康档案通过移动互联网与基于集成模型的急诊患者早期死亡率预测系统连接;

数据载入模块,用于导入采集到的急诊患者入住期间各项生理指标测量值,所述数据载入模块通过两种方式导入数据,其一为导入采集的原始数据文件,其二为将基于集成模型的急诊患者早期死亡率预测系统作为子系统,集成在医院使用的患者健康管理系统中;

数据预处理模块,用于导入的原始数据进行数据清洗、特征编码和规范化;

特征构建与选择模块,针对不同类型数据,挖掘并构建有效的数据特征,删除冗余特征,提取出最终预测特征;

模型构建与更新模块,用于完成集成模型训练和更新,如果样本出现类别不平衡问题,首先采用SMOTE方法对少样本类别进行过采样,然后再构建集成模型预测急诊患者早期死亡率,所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型;

患者预测模块,利用训练好的集成模型进行预测,并统计预测结果;

患者排序模块,对急诊患者进行实时预测,并将各个患者按照危急程度进行排序;

患者预警模块,根据患者排序模块的结果,对高风险、波动剧烈的患者及时发出预警,通知医护人员采取相应措施。

基于集成模型的急诊患者早期死亡率预测方法,包括如下步骤:

步骤一、采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标,所述步骤一具体包括如下步骤:

S11:从多个维度采集急诊患者从入住到出院或者死亡整个住院期间的各项生理指标测量值,所述各项生理指标主要包括人口统计学信息、生命体征和病理测验;

S12:对获得的原始数据进行数据清洗,包括统一数据格式,删除重复记录,填充缺失数据和处理异常值;

S13:对非数值类预测指标进行编码,并对编码后的所有变量进行规范化;

步骤二、挖掘并构建有效数据特征,删除冗余特征,所述步骤二具体包括如下步骤:

S21、特征构建,从急诊患者各项生理指标测量值构建相关预测特征,作为集成模型后续输入变量;

S22:特征选择,预测特征选择与患者早期死亡率最相关的特征,删除冗余的预测特征;

步骤三、处理数据类别不平衡问题;

步骤四、构建集成模型,并利用集成模型预测急诊患者早期死亡率;

步骤五、统计预测结果。

进一步,所述步骤S11进一步包括:

所述人口统计学信息包括性别、年龄、入院时间和出院(死亡)时间,所述生命体征包括体温、心率、呼吸率、收缩压、舒张压和氧饱和度,所述病理测验包括血常规、生化测试、凝血功能、尿钠肽和心肌标志物。

进一步,所述步骤S12进一步包括:

采用相邻时刻的非空值来插补高采样时序数据的缺失值,采用均值来插补低采样数据的缺失值;同时利用箱型图可视化各个指标的分位数,用正常范围的最大值、最小值来替代超出上、下界分位数的异常值。

进一步,所述步骤S13进一步包括:

对非数值类预测指标分别进行one-hot编码,得到相应的数值变量;然后对所有数值变量采用min-max归一化方法,保留0~1相同数值范围,具体公式为:

进一步,所述步骤S21进一步包括:

利用时序特征提取工具来自动化构建高采样生命体征数据的相关时序特征;对低采样的病理测验数据,提取其均值作为静态特征;同时提取患者的相关人口统计学信息作为静态特征。

进一步,所述步骤S22进一步包括:

采用多重假设检验方法来计算所构建的预测特征与预测结果之间的相关度,初步过滤冗余的预测特征;然后使用集成模型的特征重要性算法,将预测特征按照重要性进行排序,选择与患者早期死亡率最相关的特征用于死亡率预测。

进一步,所述步骤三具体包括如下步骤:

采用SMOTE过采样方法处理死亡患者数据、非死亡患者数据类别不平衡的问题,针对少样本类别构建新样本,其构建公式如下:

其中,x

进一步,所述步骤四具体包括如下步骤:

所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型,所述三个子模型均采用网格搜索方法和五折交叉验证进行超参数调节,并在80%训练集上进行训练,在20%测试集上进行验证,最终的加权融合公式为:

H(x)=exp(w

其中,h

进一步,所述步骤五具体包括如下步骤:

采用5折交叉验证,以及准确率、召回率、精准率和AUC四个性能指标来评估集成模型性能,其计算公式为:

其中,TP、FN表示实际死亡,且预测结果分别为死亡、存活的患者数量;FP、TN表示实际存活,且预测结果分别为死亡、存活的患者数量,Accuracy表示准确率,Recall表示召回率,Precision表示准确率。

与现有技术相比,本发明的有益效果是:通过采集临床数据,将患者各项生理指标值与早期死亡率建立联系,结合静态特征和时序特征共同预测患者早期死亡率,在此基础上,建立了一套完整的临床辅助决策支持系统,不仅可以辅助临床医生做出及时的治疗手段,避免患者错失最佳治疗时机,也可以帮助医院进行更合理的医疗资源管理,具有客观、高效、准确、自动等特点,同时也将为急诊医学的发展提供新的动力,在急诊医学的临床决策、流行病学研究、急诊分级诊疗等各个方面发挥重要作用。

附图说明

图1为本实施例的流程图;

图2为采用的SMOTE过采样方法针对少样本类别生成新样本的原理示意图;

图3为本实施例中核心功能模块结构图。

具体实施方式

下面结合附图对本发明作进一步的说明。本发明的实施方式包括但不限于下列实施例。

本实施例中,基于集成模型的急诊患者早期死亡率预测系统,其包括:

便携式健康监测设备和医疗设备终端,便携式健康监测设备和医疗设备终端连接;

患者监控管理系统和电子健康档案,患者监控管理系统和电子健康档案连接;

中央业务服务器和中央存储服务器,其中,医疗设备终端和电子健康档案通过移动互联网与基于集成模型的急诊患者早期死亡率预测系统连接;

数据载入模块,用于导入采集到的急诊患者入住期间各项生理指标测量值,数据载入模块通过两种方式导入数据,其一为导入便携式健康监测设备采集的原始数据文件,其二为直接从医院对应的患者健康管理系统中导入相应数据记录,对于后者,本系统可作为一个子系统,集成在患者健康管理系统中;

数据预处理模块,用于导入的原始数据进行数据清洗、特征编码和规范化;

特征构建与选择模块,针对不同类型数据,挖掘并构建有效的数据特征,删除冗余特征,提取出最终预测特征;

模型构建与更新模块,用于完成集成模型训练和更新,如果样本出现类别不平衡问题,首先采用SMOTE方法对少样本类别进行过采样,然后再构建集成模型预测急诊患者早期死亡率,所述集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型;

患者预测模块,利用训练好的集成模型进行预测,并统计预测结果;

患者排序模块,对急诊患者进行实时预测,并将各个患者按照危急程度进行排序,其中,患者初入院还未进行检测时,由医生根据经验进行初步判断;

患者预警模块,根据患者排序模块的结果,对高风险、波动剧烈的患者及时发出预警,通知医护人员采取相应措施。

一种基于集成模型的急诊患者早期死亡率预测方法,包括如下步骤:

S1:采集急诊患者入住期间的各项生理指标测量值,并对获得的原始数据进行预处理,提取预测指标;

其中,S1包括如下步骤:

S11:从多个维度采集急诊患者从入住到出院或者死亡整个住院期间的各项生理指标测量值;多维度的信息能更为全面地反映患者的病情,并能挖掘出更多与急诊早期死亡率预测有关的特征,

另外,各项生理指标主要包括人口统计学信息、生命体征和病理测验,其中,人口统计学信息包括性别、年龄、入院时间、出院时间和死亡时间,生命体征包括体温、心率、呼吸率、收缩压、舒张压和氧饱和度,病理测验包括血常规、生化测试、凝血功能、尿钠肽和心肌标志物等相关变量。

S12:对获得的原始数据进行数据清洗,主要包括统一数据格式,删除重复记录,填充缺失数据和处理异常值;合适的数据处理方法能够提高数据质量,对模型的预测性能有明显的提升,需要强调的是,对异常值的判断和处理需要结合数据本身的分布情况;

本实施例中采用相邻时刻的非空值来插补高采样时序数据的缺失值,采用均值来插补低采样数据的缺失值;同时利用箱型图可视化各个指标的分位数,用正常范围的最大值、最小值来替代超出上、下界分位数的异常值。

S13:对非数值类预测指标进行编码,并对编码后的所有变量进行规范化,降低变量不同量纲对集成模型带来的不利影响,具体地,对类别预测指标分别进行one-hot编码,得到相应的数值变量;然后对所有变量采用min-max归一化方法,保留0~1相同数值范围,具体公式为:

S2:挖掘并构建有效数据特征,删除冗余特征;

其中,S2包括如下步骤:

S21:特征构建,从急诊患者各项生理指标测量值构建相关预测特征,作为集成模型后续输入变量,具体地,利用时序特征提取工具Tsfresh来自动化构建高采样生命体征数据的相关时序特征,这些特征包括最大值、最小值、中位数、分位数、近似熵以及傅里叶变换等;对低采样的病理测验数据,提取其均值作为静态特征;同时提取患者的相关人口统计学信息也作为静态特征。

S22:特征选择,预测特征选择与患者早期死亡率最相关的特征,删除冗余的预测特征,有效的预测特征能更好的量化病人的危急程度,提高预测准确度,具体地,首先利用Tsfresh工具提供的多重假设检验方法Mann-Whitney U test和Benjamini-Yekutieliprocedure来计算所构建的特征特征与预测结果之间的相关度,并初步过滤冗余的预测特征;然后使用集成模型的特征重要性算法,将预测特征按照重要性进行排序,选择最相关的特征用于死亡率预测。

S3:采用过采样方法处理数据类别不平衡问题,降低模型过拟合风险,具体地,采用SMOTE过采样方法处理死亡患者数据、非死亡患者数据类别不平衡的问题,针对少样本的类别构建新样本,从而达到平衡的目的,其构建公式如下:

其中,x

S4:结合静态特征和时序特征,共同构建集成模型预测急诊患者早期死亡率,具体地,集成模型采用指数加权平均的处理方式,集成了LightGBM、XGBoost和CatBoost三个基于决策树的子模型,三个子模型都采用网格搜索方法和五折交叉验证进行超参数调节,并在训练集(80%)上进行训练,在测试集(20%)上进行验证,最终的加权融合公式为:

H(x)=exp(w

其中,h

S5:采用准确率、AUC、召回率和精准率等性能度量指标,结合K折交叉验证共同评估模型性能,统计预测结果,具体地,采用5折交叉验证,以及准确率(Accuracy)、召回率(Recall)、精准率(Precision)和AUC(接受者操作特征曲线下面积)四个性能指标来评估整体模型性能,此外,采用平衡准确率(Balanced accuracy)来评估SMOTE过采样方法的实际效果,对于类别平衡的数据,平衡准确率与准确率等价,其计算公式为:

其中,TP、FN表示实际死亡,且预测结果分别为死亡、存活的患者数量;FP、TN表示实际存活,且预测结果分别为死亡、存活的患者数量。

本发明实施例的方法可以显著地提升集成模型在数据类别不平衡数据中的分类性能,通过对三个子模型的加权融合,可以弥补单一模型的不足,最大程度的提高各个指标的预测结果,此外,在特征构建阶段,对高采样生命体征数据的时序特征提取,能有效的反映患者病情的变化情况,进一步提高集成模型的预测性能,本发明实施例的基于集成模型的急诊患者早期死亡率预测系统将整个预测方法流程自动化,同时按照危急程度对急诊患者实时排序,并对高危患者进行及时预警,能够辅助医护人员做出相应的治疗手段,潜在的降低患者死亡率。

综上所述,本发明解决了传统分诊系统预测精度低的缺点,通过采集临床数据,将患者各项生理指标与早期死亡率建立联系,结合静态特征和时序特征共同预测患者早期死亡率,可以辅助临床医生做出及时的治疗手段,避免患者错失最佳治疗时机,也可以帮助医院进行更合理的医疗资源管理,具有客观、高效、准确、自动等特点。

如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

相关技术
  • 基于集成模型的急诊患者早期死亡率预测方法及系统
  • 基于统一动态集成模型和元启发式算法的汽车备件销量预测方法及系统
技术分类

06120112921437