掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据分析的肾功能恶化的预判系统

文献发布时间:2024-04-18 19:58:30


一种基于大数据分析的肾功能恶化的预判系统

技术领域

本发明涉及电数据处理技术领域,尤其涉及一种基于大数据分析的肾功能恶化的预判系统。

背景技术

高血压肾病系原发性高血压引起的良性小动脉肾硬化和恶性肾小动脉硬化并伴有相应临床表现的高血压病及肾功能衰竭,首发症状常为水肿,而后夜尿增多,尿浓缩功能减退,尿比重变轻,有轻度的蛋白尿,可有镜下血尿及管型,常有高血压的其他靶器官并发症。高血压肾病会造成患者肾脏排毒负担过重,致使肾功能受损加重,导致肾功能减退,由于体内大量毒素刺激红细胞生成减少引起贫血,此外,高血压肾病由于长期高血压的刺激,使得肾小动脉壁长期压力过大,管壁受到冲刷,使肾小动脉管腔狭窄,供血减少导致氧气交换不足,缺血缺氧损伤了肾小球毛细血管壁的内皮细胞,受到破损的内皮细胞暴露在外,从而吸引大量炎症细胞浸润,炎症的长期刺激使细胞结构破坏,进而屏障功能受损。

高血压肾病系原发性高血压引起的肾脏结构和功能损害,分为良性高血压肾硬化症和恶性高血压肾硬化症。前者是由于良性高血压(≥140/90毫米汞柱)长期作用于肾脏所致,后者指在原发性高血压基础上发展为恶性高血压(舒张压>130毫米汞柱)后引起的肾脏损害。高血压和肾损害如果同时存在,会互为因果,互相加重。肾脏本身用于过滤体内毒素,通过尿液排出多余的水和钠盐,同时防止蛋白,血细胞漏出血管。高血压使得血管内血液压力增高,导致蛋白漏出至尿液里,蛋白一旦漏出会对肾脏的滤网系统造成破坏。高血压长久控制不佳,造成的结构破坏难以逆转,就会逐渐出现肾功能损害,甚至慢性肾衰竭,其最后严重的阶段为尿毒症。

现有技术中,肾功能恶化的预测方式为数据匹配,其原理是将患者数据输入系统由系统匹配固定因子数据然后得出肾功能恶化概率,得到的值域偏差大,无法有效对个人的肾功能恶化情况进行准确预测。

因此,需要提供一种基于大数据分析的肾功能恶化的预判系统,用于提高肾功能恶化的准确度。

发明内容

本说明书实施例之一提供本发明提供了一种基于大数据分析的肾功能恶化的预判系统,包括:数据获取模块,用于获取多个样本患者的相关数据,其中,所述样本患者的相关数据至少包括个人特征数据、病情数据及肾功能变化情况;数据分析模块,用于基于所述样本患者的个人特征数据对所述多个样本患者进行聚类,确定多个样本患者簇,基于所述样本患者簇的聚类中心对应的样本患者的个人特征数据,建立样本患者簇画像;模型建立模块,用于对于每个所述样本患者簇,基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,建立恶化预判模型;信息获取模块,用于获取待评估患者的个人特征数据和病情数据,建立所述待评估患者对应的患者画像;恶化预判模块,用于基于所述待评估患者对应的患者画像及所述多个样本患者簇对应的样本患者簇画像,确定目标样本患者簇,通过所述目标样本患者簇对应的恶化预判模型基于所述待评估患者的病情数据预判所述待评估患者的肾功能变化情况。

进一步地,所述样本患者的个人特征数据至少包括年龄、性别、在目标观察周期内的体脂率范围、在所述目标观察周期内的血压范围、饮食偏好及历史病例;所述数据分析模块基于所述样本患者的个人特征数据对所述多个样本患者进行聚类,确定多个样本患者簇,包括:对于任意两个所述样本患者,计算两个所述样本患者的个人特征数据之间的相似度;通过K-means算法基于任意两个所述样本患者的个人特征数据之间的相似度,对所述多个样本患者进行聚类,确定多个样本患者簇。

更进一步地,所述模型建立模块基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,建立恶化预判模型,包括:建立因子数据库,其中,所述因子数据库包括多个候选判定因子;基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,从所述多个候选判定因子中确定所述样本患者簇对应的多个目标判定因子;基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况和所述多个目标判定因子,生成所述样本患者簇对应的多个训练样本;建立初始恶化预判模型;基于所述样本患者簇对应的多个训练样本对所述初始恶化预判模型进行训练,直至训练后的所述初始恶化预判模型满足预设条件,生成所述恶化预判模型。

更进一步地,所述多个候选判定因子包括年龄因子、血压因子、尿液白细胞计数因子、尿蛋白定量因子、尿液的红细胞计数因子、血尿酸因子、血红蛋白因子、B型尿钠肽因子、血白细胞计数因子、血酸碱因子、肾小球滤过率因子、血肌酐因子、尿量因子、血尿素氮因子、血电解质因子、肾小管功能因子及尿比重因子。

更进一步地,所述模型建立模块基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,从所述多个候选判定因子中确定所述样本患者簇对应的多个目标判定因子,包括:基于所述样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,确定每个所述候选判定因子与肾功能之间相关系数,确定多个第一次筛选后的候选判定因子;计算每两个所述第一次筛选后的候选判定因子之间的相关系数,基于每两个所述第一次筛选后的候选判定因子之间的相关系数,对所述多个第一次筛选后的候选判定因子进行第二次筛选,确定所述样本患者簇对应的多个目标判定因子。

更进一步地,所述模型建立模块生成所述样本患者簇对应的多个训练样本,包括:基于所述样本患者簇包括的多个样本患者的肾功能变化情况,对所述样本患者簇包括的多个样本患者进行聚类,生成正样本聚类簇、中性样本聚类簇及负样本聚类簇;基于所述正样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个正训练样本;基于所述中性样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个中性训练样本;基于所述负样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个负训练样本。

更进一步地,所述恶化预判模型包括多个子模型;所述模型建立模块基于所述样本患者簇对应的多个训练样本对所述初始恶化预判模型进行训练,包括:基于所述样本患者簇对应的多个训练样本分别对所述多个子模型进行独立训练,直至训练后的所述多个子模型均满足预设条件。

更进一步地,所述恶化预判模块基于所述待评估患者对应的患者画像及所述多个样本患者簇对应的样本患者簇画像,确定目标样本患者簇,包括:计算所述待评估患者对应的患者画像与每个所述样本患者簇对应的样本患者簇画像之间的画像相似度;基于所述画像相似度,从所述多个样本患者簇中确定所述目标样本患者簇。

更进一步地,所述恶化预判模块通过所述目标样本患者簇对应的恶化预判模型基于所述待评估患者的病情数据预判所述待评估患者的肾功能变化情况,包括:通过所述目标样本患者簇对应的恶化预判模型包括的每个子模型,基于所述待评估患者的病情数据预判所述待评估患者的候选肾功能变化情况;对每个所述子模型预判的所述待评估患者的候选肾功能变化情况进行拟合,确定所述待评估患者的肾功能变化情况。

更进一步地,所述恶化预判模块对每个所述子模型预判的所述待评估患者的候选肾功能变化情况进行拟合,确定所述待评估患者的肾功能变化情况,包括:基于每个所述子模型对应的权重,对每个所述子模型预判的所述待评估患者的候选肾功能变化情况进行拟合,确定所述待评估患者的肾功能变化情况,其中,每个所述子模型对应的权重基于方差倒数法确定。

相比于现有技术,本说明书提供的一种基于大数据分析的肾功能恶化的预判系统,至少具备以下有益效果:

1、通过获取大量的样本患者的相关数据,并基于样本患者的个人特征数据对多个样本患者进行聚类,确定多个样本患者簇,将患者分为几类,并为每个样本患者簇建立对应的恶化预判模型,进一步地,基于待评估患者对应的患者画像及多个样本患者簇对应的样本患者簇画像,确定目标样本患者簇,通过目标样本患者簇对应的恶化预判模型基于待评估患者的病情数据预判待评估患者的肾功能变化情况,相比于直接将患者数据和固定因子进行匹配,本系统在预判上更匹配待评估患者的个性特征,使得预判更加准确;

2、通过建立多个子模型,实现了多种模型联合进行患者的肾功能变化情况的预判,进一步提高了预判的精度;

3、通过因子筛选过程,可以更加准确地确定每个样本患者簇对应的目标判定因子,实现因子个性化,提高预判待评估患者的肾功能变化情况的准确度。

附图说明

本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1是本申请一实施例中示出的一种基于大数据分析的肾功能恶化的预判系统的模块图;

图2是本申请一实施例中示出的确定多个样本患者簇的流程图;

图3是本申请一实施例中示出的建立恶化预判模型的流程图;

图4是本申请一实施例中示出的确定样本患者簇对应的多个目标判定因子的流程图;

图5是本申请一实施例中示出的生成样本患者簇对应的多个训练样本的流程图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。

图1是本申请一实施例中示出的一种基于大数据分析的肾功能恶化的预判系统的模块图,如图1所示,一种基于大数据分析的肾功能恶化的预判系统可以包括数据获取模块、数据分析模块、模型建立模块、信息获取模块及恶化预判模块。

数据获取模块可以用于获取多个样本患者的相关数据,其中,样本患者的相关数据至少包括个人特征数据、病情数据及肾功能变化情况。

样本患者为存在肾功能损伤的患者。

在一些实施例中,样本患者的个人特征数据至少包括年龄、性别、在目标观察周期内的体脂率范围、在目标观察周期内的血压范围、饮食偏好及历史病例。目标观察周期可以为检测患者存在肾功能损伤后的一段时间内(例如,半年、一年、两年)。

在一些实施例中,样本患者病情数据至少包括在目标观察周期内的多个历史时间点的血压数据、尿蛋白数据、血液检测数据及肾脏影像。

在一些实施例中,肾功能变化情况可以表征患者的肾功能在目标观察周期内是否发生肾功能恶化、肾功能恢复或肾功能未继续恶化。

数据分析模块可以用于基于样本患者的个人特征数据对多个样本患者进行聚类,确定多个样本患者簇,基于样本患者簇的聚类中心对应的样本患者的个人特征数据,建立样本患者簇画像。

图2是本申请一实施例中示出的确定多个样本患者簇的流程图,如图2所示,在一些实施例中,数据分析模块基于样本患者的个人特征数据对多个样本患者进行聚类,确定多个样本患者簇,包括:

对于任意两个样本患者,计算两个样本患者的个人特征数据之间的相似度;

通过K-means算法基于任意两个样本患者的个人特征数据之间的相似度,对多个样本患者进行聚类,确定多个样本患者簇。

具体的,对于任意两个样本患者,数据分析模块基于两个样本患者的个人特征数据,建立该两个样本患者分别对应的患者画像,计算该两个样本患者分别对应的患者画像之间的相似度,通过K-means算法基于任意两个样本患者分别对应的患者画像之间的相似度,对多个样本患者进行聚类,确定多个样本患者簇。其中,患者画像包括多个画像标签,例如,年龄标签、性别标签、在目标观察周期内的体脂率范围标签、在目标观察周期内的血压范围标签、饮食偏好及历史病例标签。

基于以下公式计算该两个样本患者分别对应的患者画像之间的余弦相似度:

其中,

模型建立模块用于对于每个样本患者簇,基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,建立恶化预判模型。

在一些实施例中,恶化预判模型为人工神经网络(Artificial Neural Network,ANN)模型、循环神经网络(Recurrent Neural Networks,RNN)模型、长短时记忆网络(LongShort-Term Memory,LSTM)模型、双向循环神经网络(BRNN)模型机器学习模型。

图3是本申请一实施例中示出的建立恶化预判模型的流程图,如图3所示,在一些实施例中,模型建立模块基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,建立恶化预判模型,包括:

建立因子数据库,其中,因子数据库包括多个候选判定因子;

基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,从多个候选判定因子中确定样本患者簇对应的多个目标判定因子;

基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况和多个目标判定因子,生成样本患者簇对应的多个训练样本;

建立初始恶化预判模型;

基于样本患者簇对应的多个训练样本对初始恶化预判模型进行训练,直至训练后的初始恶化预判模型满足预设条件,生成恶化预判模型,其中,预设条件为训练后的初始恶化预判模型的损失函数达到预设值、参数不再变化和/或达到最大迭代次数。

在一些实施例中,多个候选判定因子包括年龄因子、血压因子、尿液白细胞计数因子、尿蛋白定量因子、尿液的红细胞计数因子、血尿酸因子、血红蛋白因子、B型尿钠肽因子、血白细胞计数因子、血酸碱因子、肾小球滤过率因子、血肌酐因子、尿量因子、血尿素氮因子、血电解质因子、肾小管功能因子及尿比重因子。

图4是本申请一实施例中示出的确定样本患者簇对应的多个目标判定因子的流程图,如图4所示,在一些实施例中,模型建立模块基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,从多个候选判定因子中确定样本患者簇对应的多个目标判定因子,包括:

基于样本患者簇包括的多个样本患者的病情数据及肾功能变化情况,确定每个候选判定因子与肾功能之间相关系数(例如,皮尔逊相关系数),确定多个第一次筛选后的候选判定因子;

计算每两个第一次筛选后的候选判定因子之间的相关系数,基于每两个第一次筛选后的候选判定因子之间的相关系数(例如,皮尔逊相关系数),对多个第一次筛选后的候选判定因子进行第二次筛选,确定样本患者簇对应的多个目标判定因子。

例如,将与肾功能之间相关系数大于第一预设相关系数阈值的候选判定因子作为第一次筛选后的候选判定因子,进一步地,若两个第一次筛选后的候选判定因子之间的相关系数大于第二预设相关系数阈值,则比较该两个第一次筛选后的候选判定因子与肾功能之间相关系数,将与肾功能之间相关系数较大的第一次筛选后的候选判定因子作为目标判定因子,并将另一个第一次筛选后的候选判定因子筛除。

通过上述因子筛选过程,更加准确地确定每个样本患者簇对应的目标判定因子,实现因子个性化,提高预判待评估患者的肾功能变化情况的准确度。

图5是本申请一实施例中示出的生成样本患者簇对应的多个训练样本的流程图,如图5所示,在一些实施例中,模型建立模块生成样本患者簇对应的多个训练样本,包括:

基于样本患者簇包括的多个样本患者的肾功能变化情况,对样本患者簇包括的多个样本患者进行聚类,生成正样本聚类簇、中性样本聚类簇及负样本聚类簇;

基于正样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个正训练样本,其中,正训练样本对应肾功能变化情况为肾功能恢复的样本患者;

基于中性样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个中性训练样本,其中,中性训练样本对应肾功能变化情况为肾功能未继续恶化的样本患者;

基于负样本聚类簇包括的多个样本患者的病情数据及肾功能变化情况,生成多个负训练样本,其中,负训练样本对应肾功能变化情况为肾功能恶化的样本患者。

在一些实施例中,恶化预判模型包括多个子模型。

具体的,多个子模型不同。例如,恶化预判模型可以包括三个子模型,其中,第一个子模型为GAM模型,第二个子模型为随机森林模型,第三个子模型为长短时记忆网络模型。

广义相加模型(Generalized Additive Model,GAM)是以广义线性模型(Generalized Linear Model,GLM)为基础的拓展模型。与传统的回归模型不同,GAM是由数据驱动而非统计分布模型驱动的非参数回归模型,可同时对部分解释变量线性拟合,且对其他解释变量进行光滑函数拟合,能更好的描述臭氧浓度与目标气象预报因子之间复杂的非线性和非单调关系,并对臭氧浓度进行更为准确的预测。

GAM模型的目标函数为:

其中,

在一些实施例中,模型建立模块基于样本患者簇对应的多个训练样本对初始恶化预判模型进行训练,包括:

基于样本患者簇对应的多个训练样本分别对多个子模型进行独立训练,直至训练后的多个子模型均满足预设条件,其中,预设条件为子模型的损失函数达到预设值、参数不再变化和/或达到最大迭代次数。

通过建立多个子模型,实现了多种模型联合进行患者的肾功能变化情况的预判,进一步提高了预判的精度。

信息获取模块可以用于获取待评估患者的个人特征数据和病情数据,建立待评估患者对应的患者画像。

待评估患者的病情数据可以包括在多个历史时间点的血压数据、尿蛋白数据、血液检测数据及肾脏影像。

待评估患者对应的患者画像包括多个画像标签。

恶化预判模块用于基于待评估患者对应的患者画像及多个样本患者簇对应的样本患者簇画像,确定目标样本患者簇,通过目标样本患者簇对应的恶化预判模型基于待评估患者的病情数据预判待评估患者的肾功能变化情况。

在一些实施例中,恶化预判模块基于待评估患者对应的患者画像及多个样本患者簇对应的样本患者簇画像,确定目标样本患者簇,包括:

计算待评估患者对应的患者画像与每个样本患者簇对应的样本患者簇画像之间的画像相似度;

基于画像相似度,从多个样本患者簇中确定目标样本患者簇。

具体的,待评估患者对应的患者画像与样本患者簇对应的样本患者簇画像在多个画像标签的相似度,对在多个画像标签的相似度进行加权求和,确定待评估患者对应的患者画像与样本患者簇对应的样本患者簇画像之间的画像相似度,将画像相似度最大值对应的样本患者簇作为目标样本患者簇。

在一些实施例中,恶化预判模块通过目标样本患者簇对应的恶化预判模型基于待评估患者的病情数据预判待评估患者的肾功能变化情况,包括:

通过目标样本患者簇对应的恶化预判模型包括的每个子模型,基于待评估患者的病情数据预判待评估患者的候选肾功能变化情况;

对每个子模型预判的待评估患者的候选肾功能变化情况进行拟合,确定待评估患者的肾功能变化情况。

具体的,目标样本患者簇对应的恶化预判模型包括的每个子模型基于待评估患者的病情数据,分别确定在多个未来时间点的肾功能恶化可能性,对每个子模型输出的在多个未来时间点的肾功能恶化可能性进行拟合,确定在多个未来时间点的肾功能恶化可能性,待评估患者的肾功能变化情况包括在多个未来时间点的肾功能恶化可能性。

在一些实施例中,恶化预判模块对每个子模型预判的待评估患者的候选肾功能变化情况进行拟合,确定待评估患者的肾功能变化情况,包括:

基于每个子模型对应的权重,对每个子模型预判的待评估患者的候选肾功能变化情况进行拟合,确定待评估患者的肾功能变化情况,其中,每个子模型对应的权重基于方差倒数法确定。

例如,基于以下公式对每个子模型预判的待评估患者的候选肾功能变化情况进行拟合,确定在未来时间点的肾功能恶化可能性:

其中,

例如,基于以下公式计算每个子模型对应的权重:

其中,

在一些实施例中,基于其它方式确定每个子模型对应的权重。例如,通过蒙特卡洛模型基于约束条件集生成多种权重设置方案,其中,约束条件集包括各个子模型的权重最大值、各个子模型的权重最小值及各个子模型的权重之和为1。建立多个测试样本,其中,测试样本包括对应的样本患者簇中的样本患者的病情数据及肾功能变化情况,对于每种权重设置方案,可以计算在该权重设置方案下,每个测试样本对应的预判的肾功能变化情况与实际的样本患者的肾功能变化情况之间的差值,基于该差值计算权重设置方案的匹配值,将匹配值最大的权重设置方案作为目标权重设置方案,并根据目标权重设置方案设置多个子模型对应的权重。

基于以下公式计算权重设置方案的匹配值:

其中,

相关技术
  • 基于深度学习的刑事案件预判系统及其构建和预判方法
  • 一种自动预判易挥发化学介质管道泄漏的系统
  • 一种电梯重力感应预判系统
  • 一种基于大数据分析的流量异常预判方法
  • 一种基于大数据分析的流量异常预判方法
技术分类

06120116498648