掌桥专利:专业的专利平台
掌桥专利
首页

一种重症预警方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 11:39:06


一种重症预警方法、装置、电子设备及存储介质

技术领域

本发明涉及医疗技术领域,特别涉及一种重症预警方法、装置、电子设备及存储介质。

背景技术

随着科技的进步,生活水平的提高,人们对身体健康越来越关注。有些疾病(如脓毒症)的病情凶险,病死率高,并且治疗花费高,医疗资源消耗大,严重影响人类的生活质量,已经对人类健康造成巨大威胁。因此,及早识别诊断这些疾病并予以有效防治,是提高患者生存率的关键。

相关技术中,临床上医护人员通过记录临床数据,并对临床数据进行分析,得到病症的诊断结果。

然而,依靠医护人员根据临床数据进行分析,会耗用大量时间,诊断效率低,难以在病症早期感染时进行识别并治疗。

发明内容

本发明提供了一种重症预警方法、装置、电子设备及存储介质,用以提升病症诊断效率。

第一方面,本发明实施例提供一种重症预警方法,包括:

对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征;

将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是根据训练数据集训练得到的;

通过以下方式得到所述训练数据集:

获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本;并根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻;基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

上述方案,如果病患样本数据集中的样本对应有表征病症SOFA值,该样本在该SOFA值对应的数据的获得时刻之前的数据在一定程度上反映出了病患发病前的特征;通过基于获得时刻确定该样本的参考时刻,进而基于该样本中获得时刻在上述参考时刻之前的数据训练得到第一预测模型,该第一预测模型就能比较好地学习病患发病之前会有哪些特征,将病患特征输入该第一预测模型后,就能得到待测病患对应的患病概率,这样就能根据病患数据,较为准确地预测病患的未来患病概率,进而能够及早发现疾病并预防。

在一种可能的实现方式中,通过下列过程确定表征病症SOFA值:

针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

在一种可能的实现方式中,根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻之前,还包括:

确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或

确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

上述方案,通过确定选择的样本中在参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或确定选择的样本中在参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据,就能比较准确地确定该样本对应的病患在参考时刻是目标病症发作;这样就排除了其他病症的病患对应的样本的干扰,通过该训练数据集训练得到的第一预测模型预测目标病症的病发概率更加精准。

在一种可能的实现方式中,所述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集;

通过以下方式训练得到所述第一预测模型:

根据第二训练数据集对初始预测模型进行训练,得到第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到;

根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

上述方案,第一预测模型是基于第一病患样本数据集对第二预测模型进行迁移训练得到的,而第二预测模型是基于第二病患样本数据进行训练得到的,由于第二病患样本数据的样本数量大于第一病患样本数据的样本数量,基于第二病患样本数据训练得到的第二预测模型适用性较广,基于第一病患样本数据对第二预测模型进行迁移训练,能够得到准确性更高且针对性更强的第一预测模型,提高病发概率预测的准确度。

在一种可能的实现方式中,生成所述第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域,所述第二病患样本数据集为公共临床数据集,所述第一病患样本数据集的样本数量少于所述第二病患样本数据集的样本数量。

在一种可能的实现方式中,得到所述待测病患对应的病发概率之后,还包括:

通过预设通知方式将所述病发概率进行通知;和/或

将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

上述方案,在得到上述病发概率之后,通过预设通知方式将该病发概率进行通知,使医护人员能够方便获知待测病患的病发概率,以便在病症早期感染时采取相应的治疗措施;如果待测病患的病发概率大于预设概率,说明待测病患的病发概率高,通过预设报警方式进行报警,使医护人员对可能的危险因素采取更加有效的治疗措施。

第二方面,本发明实施例提供的一种重症预警装置,包括:

特征获得模块,用于对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征;

概率确定模块,用于将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是训练模块根据训练数据集训练得到的;

所述训练模块,用于通过以下方式得到所述训练数据集:

获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本;并根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻;基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

在一种可能的实现方式中,所述训练模块通过下列过程确定表征病症SOFA值:

针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

在一种可能的实现方式中,所述训练模块在根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻之前,还用于:

确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或

确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

在一种可能的实现方式中,所述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集;

所述训练模块用于通过以下方式训练得到所述第一预测模型:

根据第二训练数据集对初始预测模型进行训练,得到第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到;

根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

在一种可能的实现方式中,生成所述第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域,所述第二病患样本数据集为公共临床数据集,所述第一病患样本数据集的样本数量少于所述第二病患样本数据集的样本数量。

在一种可能的实现方式中,概率确定模块在得到所述待测病患对应的病发概率之后,还用于:

通过预设通知方式将所述病发概率进行通知;和/或

将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

第三方面,本发明实施例提供的一种电子设备,包括:处理器和存储器;

其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行:

对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征;

将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是根据训练数据集训练得到的;

所述处理器还执行:

获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本;并根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻;基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

在一种可能的实现方式中,所述处理器具体执行:

针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

在一种可能的实现方式中,所述处理器在根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻之前,还执行:

确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或

确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

在一种可能的实现方式中,所述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集;

所述处理器具体执行:

根据第二训练数据集对初始预测模型进行训练,得到第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到;

根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

在一种可能的实现方式中,生成所述第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域,所述第二病患样本数据集为公共临床数据集,所述第一病患样本数据集的样本数量少于所述第二病患样本数据集的样本数量。

在一种可能的实现方式中,所述处理器在得到所述待测病患对应的病发概率之后,还用于:

通过预设通知方式将所述病发概率进行通知;和/或

将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

第四方面,本发明实施例提供一种计算机可存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的医疗评分方法。

另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的第一种重症预警方法的示意流程图;

图2为本发明实施例提供的第一种得到训练数据集的方法示意流程图;

图3为本发明实施例提供的第二种得到训练数据集的方法示意流程图;

图4为本发明实施例提供的一种训练得到第一预测模型的方法示意流程图;

图5为本发明实施例提供的第二种重症预警方法的示意流程图;

图6为本发明实施例提供的一种重症预警装置的结构示意图;

图7为本发明实施例提供的一种电子设备的示意框图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本发明实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是直接相连,也可以通过中间媒介间接相连,可以是两个器件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

有些疾病的病情凶险,病死率高,并且治疗花费高,医疗资源消耗大,严重影响人类的生活质量,已经对人类健康造成巨大威胁。例如:脓毒症是一种危及生命的凶险疾病,是因感染引起的机体免疫反应失调导致的器官功能障碍。全球每天约14,000人死于其并发症,据国外流行病学调查显示,脓毒症的病死率已经超过心肌梗死,成为重症监护病房内非心脏病人死亡的主要原因。近年来,尽管抗感染治疗和器官功能支持技术取得了长足的进步,脓毒症的病死率仍高达30%~70%。及早识别病情凶险的病症并予以有效防治,是提高患者生存率的关键。

相关技术中,临床上医护人员通过记录临床数据,并对临床数据进行分析,得到病症的诊断结果。然而,依靠医护人员根据临床数据进行分析,会耗用大量时间,诊断效率低,难以在病症早期感染时进行识别并治疗。

本发明实施例为了提升病症诊断效率,提供了一种重症预警方法、装置、电子设备及存储介质。下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

图1为本申请实施例提供的第一种重症预警方法的示意流程图,如图1所示,该方法可以包括:

步骤101:对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征。

本申请实施例在获取待测病患的病患数据后,对病患数据进行预处理得到病患特征,将病患特征输入到第一预测模型中,输出待测病患对应的病发概率,从而能够根据病患数据,预测病患的未来病发概率,进而能够及早发现疾病并预防。

对于待测病患(如需要进行脓毒症监测的患者),其病患数据的类型可以包括以下任一类或多类:

由对病患进行体征监测的各医疗器械生成的数据,如病患的心率、平均动脉压、收缩压、呼吸频率、体温等;通过病患的病历记录进行采集得到的数据,如病患的年龄、体重等短时间内不会发生较大变化的数据;通过对病患的血液、组织等进行医学检查生成的数据,如病患的红细胞计数、中性粒细胞计数等;通过对病患进行放射检查生成的数据,如病患的胸片即腹部平片报告、CT检查报告等;通过对病患的药物使用记录进行采集得到的数据,如病患使用的抗生素、使用的血管活性药物等;通过对病患的病历记录、检查报告等进行采集并分析所得到的关键词。

上述获取的待测病患的病患数据可以包括该待测病患进入ICU后生成的数据,以及上述短时间内不会发生较大变化的数据;或者上述获取的待测病患的病患数据可以包括该待测病患预设时长内生成的数据,以及上述短时间内不会发生较大变化的数据,本实施例对此不做具体限定。

在一些具体的实施例中,获取到上述病患数据后,分别统计每小时该病患的各类数据,以获取了某病患N小时内的病患数据为例,统计N次后组成N小时内的病患数据。这种场景中,由于有些数据不会实时获取,可将之前获取该病患的相同字段对应的数据作为后续该字段对应的数据。

一种可选的实施方式中,根据下列方式对上述病患数据进行预处理:

1、从病患数据中提取预设字段对应的数据,获取初始病患特征。

具体实施中,由于病患数据中包含的数据类型较多,根据医生经验,对可能造成感染脓毒症的数据进行提取,例如,从病患数据中提取平均动脉压、心率、收缩压、舒张压、呼吸频率、体温、氧分压、吸氧浓度等字段对应的数据,作为初始病患特征。

2、对初始病患特征做归一化处理,得到病患特征。

具体实施中,可以对初始病患特征中的各个特征采用最小最大规范化方法进行归一化处理,例如,根据下列公式进行归一化处理:

其中,y

上述示例性说明了针对病患数据的一种可能的预处理方式,本实施例也可采用其他预处理方式,如将从病患数据中提取预设字段对应的数据直接作为病患特征;或者直接对病患数据做归一化处理,得到病患特征等,此处不再赘述。

步骤102:将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率。

本实施例,将病患特征输入到第一预测模型中,获取待测病患对应的病发概率,该病发概率为预测的未来一定时长内病患可能患脓毒症的概率。

其中,所述第一预测模型是根据训练数据集训练得到的;

参阅图2所示,得到上述训练数据集的方法可以包括以下步骤:

步骤201:获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本。

步骤202:根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻。

步骤203:基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

本实施例,第一预测模型只有比较好地学习到一些表征病症发生的样本在病发前的特征,才能基于待测病患的病患特征,较为准确地预测该病患的病发概率。

针对任一样本,其对应的SOFA值的变化反映了该样本对应的病患的病情的变化,因此可以确定该样本是否对应有表征病情加重的SOFA值(即上述表征病症SOFA值)。

如果一个样本对应有表征病情加重的SOFA值,该样本在该SOFA值对应的数据的获得时刻之前的数据在一定程度上反映出了表征病症发生的样本在病发前的特征。基于此,本实施例可直接将获得时刻作为参考时刻,或者将获得时刻所在时段的起始时刻作为参考时刻;进而基于该样本中获得时刻在上述参考时刻之前的数据训练得到第一预测模型,该第一预测模型就能比较好地学习表征病症发生的样本在病发前的特征,从而比较准确地得到上述待测病患的病发概率。

在一些可选的实施例中,针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

针对任一SOFA值,如果该SOFA值相对于其对应的数据的获得时刻之前第一设定时长内的SOFA最小值,增量大于或者等于预设增量,就说明样本对应的病患病情加重,其对应的数据的获得时刻就是基于SOFA值预测的发病时刻。基于该时刻,就能精准地选择出表征发病的样本对应的患者在病情加重前获得的数据。

以上述预设增量为2,第一预设时长为24小时为例:

样本1在某天下午4点获得的数据对应的SOFA值(记作SOFA1)为4,在同一天的上午9点获得的数据对应的SOFA值(记作SOFA2)为2,同一天的上午9点在下午4点之前的24小时之内(即下午4点与上午9点相差不到24小时);并且SOFA1较SOFA2的增量ΔSOFA=2(满足增量不小于2),意味着样本1对应的患者在这一天下午4点发病。

通过上述数据,第一预测模型就能准确地学习病患在病发前的特征。一般来说,脓毒症是感染引起的病情加重,其他病症也会引起病情加重。因此,根据上述病发概率可对脓毒症或者其他病症进行识别。

可以理解,上述选择的样本,是病症为阳性的样本,将其作为第一预测模型训练的正样本;为了使第一预测模型的预测结果更加准确,还需要确定第一预测模型训练的负样本,若某一样本不满足阳性条件且该样本对应的患者在ICU连续72小时内SOFA评分不大于1分,说明该患者病情稳定,该样本可作为第一预测模型训练的负样本。

具体实施中,选择上述数据后,还需要对这些数据中进行异常数据处理,异常数据处理可以包括去除异常值、合并重复数据、处理矛盾数据、填补缺失值等处理中的部分或全部,其中若样本中缺失数据,可以根据该样本对应的病患的之前时间段统计的数据对缺失值进行填补,或使用默认值对缺失值进行填补。

选择上述处理后的数据中的预设字段对应的数据作为初始训练特征,具体实施中,可以从上述处理后的数据中,根据数据的获得时刻周期性提取预设字段对应的数据,如以1小时为周期,连续提取多次预设字段的数据作为初始训练特征;对初始训练特征进行归一化处理,得到训练数据。具体实施中,可以采用最小最大规范化方法对初始训练特征进行归一化处理。

上述方案,如果病患样本数据集中的样本对应有表征病症SOFA值,该样本在该SOFA值对应的数据的获得时刻之前的数据在一定程度上反映出了病患发病前的特征;通过基于获得时刻确定该样本的参考时刻,进而基于该样本中获得时刻在上述参考时刻之前的数据训练得到第一预测模型,该第一预测模型就能比较好地学习病患发病之前会有哪些特征,将病患特征输入该第一预测模型后,就能得到待测病患对应的患病概率,这样就能根据病患数据,较为准确地预测病患的未来患病概率,进而能够及早发现疾病并预防。

如上所述,如果一个样本对应有表征病情加重的SOFA值,该样本对应的病患在该SOFA值对应的数据的获得时刻病情加重,可能是脓毒症或者其他病症引起病情加重。即,通过上述训练数据集训练得到的第一预测模型预测的病发概率与患脓毒症的概率之间,会存在一定误差。

基于此,第一预测模型需要学习到表征特定病症(如脓毒症)发生的样本在病发前的特征,才能更准确地得到待测病患的患特定病症(如脓毒症)的概率。参阅图3所示,为本实施例提供的第二种得到训练数据集的方法,包括以下步骤:

步骤301:获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本。

该步骤301与上述步骤201实现方式相同,此处不再赘述。

步骤302:确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

1)针对任一样本,如果该样本在上述参考时刻之前的第二预设时长内获得的数据中有表征目标病症发生的数据,说明在基于SOFA值预测的发病时刻之前,该样本对应的病患就疑似感染了目标病症,在参考时刻预测发病很可能就是患目标病症。

以上述第二预设时长为48小时,参考时刻为某天(记作D1)下午4点为例:

对于样本1,在D1之前的一天(记作D2)上午8点获得了服用抗生素的数据。基于此,确定样本1对应的病患在D2上午8点就已经疑似感染了目标病症。D2上午8点在D1下午4点之前的48小时内(即D2上午8点到D1下午4点没有超过48小时),在D2上午8点~D1下午4点之间该病患没有发病可能是因为药物作用。从而比较准确地确定该病患在参考时刻是患脓毒症。

同样,如果在D1下午4点之前的48小时内获得的数据中,有体液培养结果为脓毒症阳性的数据,也能比较准确地确定该病患在参考时刻是脓毒症发作。

2)针对任一样本,如果该样本在上述参考时刻之后的第三预设时长内获得的数据中有表征目标病症发生的数据,说明在基于SOFA值预测的发病时刻之后,该样本对应的病患就疑似感染了目标病症,在参考时刻预测发病很可能就是患目标病症。

以上述第三预设时长为24小时,参考时刻为某天(记作D1)下午4点为例:

对于样本1,在D1之后的一天(记作D3)上午9点获得了服用抗生素的数据或者体液培养结果为脓毒症阳性的数据,基于此确定样本1对应的病患在D3的上午9点疑似感染了目标病症。就能比较准确地确定样本1在参考时刻是脓毒症发作。

针对任一样本,上述条件中只要满足至少一个条件,就可确定样本对应的患者在参考时刻是目标病症发作。

步骤303:根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻。

步骤304:基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

该步骤303-304与上述步骤202-203实现方式相同,此处不再赘述。

上述方案,通过确定选择的样本中在参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或确定选择的样本中在参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据,就能比较准确地确定该样本对应的病患在参考时刻是目标病症发作;这样就排除了其他病症的病患对应的样本的干扰,通过该训练数据集训练得到的第一预测模型预测目标病症的病发概率更加精准。

本申请实施例还提供一种第一预测模型的训练方法,由于脓毒症等病情凶险的病症多发于ICU中的患者,但ICU病患数据较少,仅使用ICU病患数据进行模型训练有可能导致模型过拟合,恶化模型性能。因此,本申请实施例提供一种迁移训练方法,根据第二病患样本数据集中的第二训练数据集对初始预测模型进行训练得到第二预测模型,再根据第一病患样本数据集中的第一训练数据集对第二预测模型进行迁移训练,得到第一预测模型。也就是说上述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集,第一病患样本数据集的样本数量少于第二病患样本数据集的样本数量。具体的,第一病患样本数据集与第二病患样本数据集可以具有以下特性:

1、第二病患样本数据集为公共临床数据集,如第二病患样本数据集为重症监护医学信息库(Medical Information Mart for Intensive Care,MIMIC)公共数据集。公共临床数据集中大部分样本对应区域与待测病患对应区域不同,不同区域的患者体质差别明显,基于第二病患样本数据集训练得到的第二预测模型无法很好地学习待测病患对应区域的样本特征,因此通过第二预测模型可能无法准确预测待测病患的病发概率。

2、生成第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域。基于第一病患样本数据对第二预测模型进行迁移训练,能够得到准确性更高且针对性更强的第一预测模型,提高预测待测病患的病发概率的准确度。

举例来说,第一病患样本数据集中每个样本包含的病患数据是设备A、设备B和设备C中的至少一个设备生成的,使用第一病患样本数据集对第二预测模型进行迁移训练后得到第一预测模型,上述待测患者的病患数据是设备A和设备B生成的,或者上述待测患者的病患数据是设备D生成的,而设备D与设备A、设备B以及设备C位于同一个区域,例如位于相同ICU,或位于相同病院。

3、第一病患数据集符合预设条件,其中预设条件为样本采集环境条件或设备属性条件。

举例来说,样本采集环境条件可以为采集样本的ICU的空间细菌总数、温度、湿度在预设范围中;医疗设备属性条件可以为生成第一病患数据集的设备的精确度在预设范围中。

可以理解的是,根据符合预设条件的第一病患数据集对第二预测模型进行迁移训练后得到第一预测模型,待测患者的病患数据也满足预设条件时,基于第一预测模型得到的该待测患者的预测病发概率更准确。

本申请实施例提供的第一预测模型的训练方式参照图4,包括以下步骤:

步骤S401:根据第二训练数据集对初始预测模型进行训练,得到所述第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到。

得到第二训练数据集的实现方式可参照上述实施例,此处不再赘述。

一种可选的实施方式为,将第二训练样本数据集拆分为第二训练集、第二验证集以及第二测试集;根据第二验证集从所有初始预测模型中选择AUC指标最大的初始预测模型,其中不同的初始预测模型中的至少一个同类的超参数的值不同;可以理解的是,由于初始预测模型的每个超参数均对应一个选值范围,不同的超参数选值组合对应多个可选的初始预测模型。具体实施中,根据第二训练集对每一个初始预测模型进行迭代训练,并在每次迭代训练后基于第二验证集确定每次迭代训练后的初始预测模型的接受者操作特性曲线(receiver operating characteristic curve,ROC)曲线下面积(Area Under the Curve,AUC)指标,在第N+1次迭代训练后,确定第N次迭代训练后的初始预测模型的AUC指标大于第N-1次迭代训练后的初始预测模型的AUC指标且大于第N+1次迭代训练后的初始预测模型的AUC指标,则将第N次迭代训练后的初始预测模型的AUC指标作为该初始预测模型的AUC指标,重复以上过程,确定所有初始预测模型的AUC指标,并从所有初始预测模型中选择AUC指标最大的初始预测模型。

根据所述第二训练集对选择的初始预测模型进行迭代训练,并在每次迭代训练后基于第二验证集确定每次迭代训练后的初始预测模型的AUC指标,确定M轮迭代训练后的初始预测模型的AUC指标不大于上一轮迭代训练后的初始预测模型的AUC指标时,停止迭代训练,并将M轮迭代训练后的初始预测模型作为目标初始预测模型。

根据第二测试集确定目标初始预测模型的指标参数,例如确定目标初始预测模型的准确度(Accuracy,ACC)指标、AUC指标、敏感度(Sensitivity,SENS)指标、特异度(Specificity,SPEC)指标,在确定目标初始预测模型的指标参数均大于预设阈值时,将目标初始预测模型作为第二预测模型。

步骤S402:根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

得到第一训练数据集的实现方式可参照上述实施例,此处不再赘述。

具体实施中,将第一训练样本数据集拆分为第一训练集、第一验证集和第一测试集。根据第二预测模型确定多个第三预测模型,其中,第三预测模型与第二预测模型的模型参数相同,且不同的第三预测模型中的至少一个同类的超参数的值不同;模型参数为迭代训练中能够根据梯度下降法进行调整的参数。

根据第一验证集选择AUC指标最大的第三预测模型,根据第一训练集对选择的第三预测模型进行迭代训练,得到候选第一预测模型,候选第一预测模型为迭代训练过程中得到的所有模型中AUC指标最大的模型。

根据第一测试集确定候选第一预测模型的指标参数,并确定候选第一预测模型的指标参数大于预设阈值时,将候选第一预测模型作为第一预测模型。

在第一预测模型与目标预测模型训练过程中,可以采用LightGBM方法、XGBoost方法、多层感知器(Multi_Layer Perceptron,MLP)、长短记忆网络(Long Short-TermMemory,LSTM)、支持向量机(Support Vector Machine,SVM)等方法进行模型训练,本申请对此不作限制。

上述方案,第一预测模型是基于第一病患样本数据集对第二预测模型进行迁移训练得到的,而第二预测模型是基于第二病患样本数据进行训练得到的,由于第二病患样本数据的样本数量大于第一病患样本数据的样本数量,基于第二病患样本数据训练得到的第二预测模型适用性较广,基于第一病患样本数据对第二预测模型进行迁移训练,能够得到准确性更高且针对性更强的第一预测模型,提高病发概率预测的准确度。

图5为本申请实施例提供的第二种重症预警方法示意流程图,应用于电子设备,如图5所示,该方法可以包括:

S501:对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征。

S502:将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是根据训练数据集训练得到的。

该步骤501-502与上述步骤101-102实现方式相同,此处不再赘述。

S503:通过预设通知方式将所述病发概率进行通知。

本实施例,对上述预设通知方式不做具体限定,例如:

1)上述电子设备设置有显示屏,通过显示屏将上述病发概率进行显示;

2)将上述病发概率发送给连接的用户终端,用户终端基于病发概率在UI界面进行显示。

上述是两种可行的预设通知方式,本实施例也可预设其他通知方式,通过其他通知方式将病发概率进行通知。

S504:将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

通过预设报警方式进行报警可通过但不限于如下方式实现:

1)电子设备设置有扬声器,通过扬声器发送预设的语音;

2)电子设备将报警信息发送给连接的用户终端,用户终端基于报警信息在UI界面进行显示;或者用户终端基于报警信息通过扬声器发送预设的语音。

上述是两种可行的预设报警方式,本实施例也可通过其他报警方式进行报警。

上述步骤504也可以通过上述用户终端执行。即电子设备将病发概率发送给连接的用户终端;用户终端将接收到的病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。具体报警方式可参照上述实施例,此处不再赘述。

上述预设概率可以根据实际应用场景进行设定,例如:预设该率为40%,避免预设概率过低时触发报警次数较多,影响医护人员工作;也避免预设概率过高导致病患发病的遗漏。

另外,上述步骤503与步骤504没有必然的逻辑关系,即可以只执行这两个步骤中的任一步骤,如果需要执行这两个步骤时,可以先执行步骤503,也可以先执行步骤504,或者同时执行步骤503和504。

上述方案,在得到上述病发概率之后,通过预设通知方式将该病发概率进行通知,使医护人员能够方便获知待测病患的病发概率,以便在病症早期感染时采取相应的治疗措施;如果待测病患的病发概率大于预设概率,说明待测病患的病发概率高,通过预设报警方式进行报警,使医护人员对可能的危险因素采取更加有效的治疗措施。

需要说明的是,本申请实施例提供的重症预警方法,可以应用于脓毒症病症预警,还可以应用于其它病症的病症预警,在应用于其它病症的病症预警时,需要获取其他病症对应的训练样本数据集,并根据本申请实施例提供的模型训练方式进行模型训练,具体实施可以参见上述实施例描述,此处不再赘述。

如图6所示,基于相同的发明构思,本发明实施例提供一种重症预警装置600,包括:特征获得模块601、概率确定模块602和训练模块603。

特征获得模块601,用于对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征;

概率确定模块602,用于将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是训练模块603根据训练数据集训练得到的;

所述训练模块603,用于通过以下方式得到所述训练数据集:

获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本;并根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻;基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

在一种可能的实现方式中,所述训练模块603通过下列过程确定表征病症SOFA值:

针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

在一种可能的实现方式中,所述训练模块603在根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻之前,还用于:

确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或

确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

在一种可能的实现方式中,所述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集;

所述训练模块603用于通过以下方式训练得到所述第一预测模型:

根据第二训练数据集对初始预测模型进行训练,得到第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到;

根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

在一种可能的实现方式中,生成所述第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域,所述第二病患样本数据集为公共临床数据集,所述第一病患样本数据集的样本数量少于所述第二病患样本数据集的样本数量。

在一种可能的实现方式中,概率确定模块602在得到所述待测病患对应的病发概率之后,还用于:

通过预设通知方式将所述病发概率进行通知;和/或

将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

由于该装置即是本发明实施例中的方法中的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。

如图7所示,基于相同的发明构思,本发明实施例提供一种电子设备700包括:处理器701和存储器702;

存储器702,用于存储处理器701执行的计算机程序。存储器702可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器702也可以是非易失性存储器(non-volatile memory),例如只读存储器,快闪存储器(flashmemory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器702是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器702可以是上述存储器的组合。

处理器701,可以包括一个或多个中央处理单元(central processing unit,CPU),图形处理单元(Graphics Processing Unit,GPU)或者为数字处理单元等等。

本发明实施例中不限定上述存储器702和处理器701之间的具体连接介质。本发明实施例在图7中以存储器702和处理器701之间通过总线703连接,总线703在图7中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线703可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

其中,所述存储器702存储有程序代码,当所述程序代码被所述处理器701执行时,使得所述处理器701执行下列过程:

对待测病患的病患数据进行预处理,得到所述待测病患对应的病患特征;

将所述病患特征输入第一预测模型,得到所述待测病患对应的病发概率,其中,所述第一预测模型是根据训练数据集训练得到的;

所述处理器还执行:

获取病患样本数据集,并根据病患样本数据集中各样本对应的SOFA值的变化,选择对应有表征病症SOFA值的样本;并根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻;基于选择的所述样本中获得时刻在所述参考时刻之前的数据,得到所述训练数据集。

在一种可能的实现方式中,所述处理器具体执行:

针对任意一个SOFA值,若所述SOFA值对应的数据的获得时刻之前的第一设定时长内最小的SOFA值,与所述SOFA值的增量不小于预设增量,则将所述SOFA值确定为表征病症SOFA值。

在一种可能的实现方式中,所述处理器在根据选择的所述样本中所述表征病症SOFA值对应的数据的获得时刻,确定选择的所述样本的参考时刻之前,还执行:

确定选择的所述样本中在所述参考时刻之前的第二设定时长内获得的数据中有表征目标病症发生的数据;和/或

确定选择的所述样本中在所述参考时刻之后的第三设定时长内获得的数据中对应有表征目标病症发生的数据。

在一种可能的实现方式中,所述病患样本数据集包括第一病患样本数据集以及第二病患样本数据集;

所述处理器具体执行:

根据第二训练数据集对初始预测模型进行训练,得到第二预测模型,所述第二训练数据集基于所述第二病患样本数据集得到;

根据第一训练数据集对所述第二预测模型进行迁移训练,得到所述第一预测模型,所述第一训练数据集基于所述第一病患样本数据集得到。

在一种可能的实现方式中,生成所述第一病患样本数据集的设备与生成所述待测病患的病患数据的设备位于同一个区域,所述第二病患样本数据集为公共临床数据集,所述第一病患样本数据集的样本数量少于所述第二病患样本数据集的样本数量。

在一种可能的实现方式中,所述处理器在得到所述待测病患对应的病发概率之后,还用于:

通过预设通知方式将所述病发概率进行通知;和/或

将所述病发概率与预设概率进行比对,若所述病发概率大于预设概率,则通过预设报警方式进行报警。

在本发明实施例中,上述电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器等具有一定计算能力的设备。

由于该电子设备即是执行本发明实施例中的方法的电子设备,并且该电子设备解决问题的原理与该方法相似,因此该电子设备的实施可以参见方法的实施,重复之处不再赘述。

本发明实施例提供一种计算机可存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述重症预警方法的步骤。其中,可存储介质可以为非易失可存储介质。

以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。

相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

相关技术
  • 一种重症预警方法、装置、电子设备及存储介质
  • 一种户外预警方法、装置、电子设备及计算机存储介质
技术分类

06120113001157