掌桥专利:专业的专利平台
掌桥专利
首页

一种提高疫情防控精度的方法、装置、电子设备及介质

文献发布时间:2023-06-19 19:27:02


一种提高疫情防控精度的方法、装置、电子设备及介质

技术领域

本申请涉及疫情防控的领域,尤其是涉及一种提高疫情防控精度的方法、装置、电子设备及介质。

背景技术

目前,对于传染病传播的防控多采用仓室模型的机理防控法,仓室模型诞生于19世纪,是以感染者数量研究对象,根据传播机理建立微分方程模型,通过分析最终得到感染者数量与时间的函数关系,从此函数关系中可以得到疫情什么时间进入高爆发期,什么时间能够到达峰值,什么时间可以进入稳定可控阶段,根据不同的传播机理一般常用的仓室模型有SIS,SIR,SIRS,SEIR等模型。

针对于上述相关技术,发明人认为在某区域发生疫情时,虽然可以对该区域的疫情时间以及疫情人数进行预测防控,但难以根据疫情区域的人员流动对其他地区的疫情进行防控,从而存在降低疫情防控精度的缺陷。

发明内容

为了提高疫情防控的准确度,本申请提供一种提高疫情防控精度的方法、装置、电子设备及介质。

第一方面,本申请提供一种提高疫情防控精度的方法,采用如下的技术方案:

一种提高疫情防控精度的方法,包括:

获取过去预设时间段内的疫情灾害信息,所述疫情灾害信息为不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与所述行动轨迹信息相匹配的不同人群类型所发生过的疫情信息;

对所述疫情灾害信息进行分析,确定所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度,并基于所述时间序列长度以及所述类型组合数量对所述疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据;将所述第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的所述疫情特征维度数量与所述第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据;

对所述第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据,并将得到的所述疫情灾害数据输入至预设算法模型中进行数据推算,生成所述不同区域对应的所述类型组合数量中每种组合在未来预设时间段内的疫情发生量。

通过采用上述技术方案,在对不同区域的疫情进行防控时,通过对不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息进行采集,得到疫情灾害信息,然后对疫情灾害信息进行分析,获取疫情灾害信息中的不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,其中,时间序列长度与类型组合数量是一一对应的关系,然后根据时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据,然后将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据,然后对第二疫情矩阵数据中所包含的数据进行一一处理,得到疫情灾害数据,将疫情灾害数据输入至预设算法模型中进行数据推算,生成类型组合数量中每个类型组合在未来预设时间段内的疫情发生量,工作人员根据实际需求设置过去预设时间段以及未来预设时间段,以获取在未来预设时间段内的不同区域对应的类型组合数量中每种组合的疫情发生量,便于后续疫情防控人员根据对不同区域未来的疫情发生量进行疫情防控,从而达到了提高疫情防控准确度的效果。

在另一种可能实现的方式中,对所述疫情灾害信息进行分析,确定所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度,包括:

基于所述疫情灾害信息确定所述不同区域的疫情情处理数据;

分别对所述疫情处理数据进行标签获取,得到每组疫情处理数据中的人群组合数据以及处理时间数据;

根据所述处理时间数据确定所述疫情处理数据是否处理完结,若未处理完结,则将所述疫情处理数据进行数据瓦解,若处理完结,则将所述人群组合数据与所述处理时间数据进行对应绑定,得到疫情绑定数据;

对所述疫情绑定数据进行人群组合类型筛选,得到所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度。

通过上述技术方案,在对疫情灾害信息进行分析时,获取疫情灾害信息中的至少一组疫情处理数据,然后分别对每组疫情处理数据进行标签获取,得到每组疫情处理数据中的人群组合数据以及处理时间数据,然后判断处理时间数据是否处理完结,即截止到目前为止,当前的疫情处理数据的处理状态是否仍在处理中,若未处理完结,则将疫情处理数据进行数据瓦解,不将该疫情处理数据计入到疫情灾害信息中,若处理完结,则将所述人群组合数据与所述处理时间数据进行对应绑定,得到疫情绑定数据,随后对疫情绑定数据进行类型组合类型筛选,以得到类型组合数量以及时间序列长度,通过将未处理完结的疫情处理数据进行瓦解,提高了疫情灾害信息的准确性。

在另一种可能实现的方式中,将所述第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,包括:

基于所述第一疫情矩阵数据确定所述疫情灾害信息中每个疫情事件的事件时间、确诊人员信息、密接人员信息、事件地点以及与所述事件地点对应防疫政策;

分别将所述事件时间、所述确诊人员信息、所述密接人员信息、所述事件地点以及与所述防疫政策输入至所述疫情预测模型进行向量提取,得到与所述事件时间对应的时间特征向量、与所述确诊人员信息、所述密接人员信息以及所述防疫政策信息对应的文本特征向量以及与所述事件地点对应的位置特征向量;

对所述时间特征向量、所述文本特征向量以及所述位置特征向量进行数量统计,得到所述疫情特征维度数量。

通过上述技术方案,在对疫情特征维度数量进行获取时,根据第一疫情矩阵数据确定疫情灾害信息中每个疫情事件的事件时间、确诊人员信息、密接人员信息、事件地点以及与事件地点对应防疫政策,然后分别将事件时间、确诊人员信息、密接人员信息、事件地点以及防疫政策输入至疫情预测模型中进行向量提取,得到与事件时间对应的时间特征向量、与确诊人员信息、密接人员信息以及防疫政策信息对应的文本特征向量以及与事件地点对应的位置特征向量,然后通过对文本特征向量、时间特征向量以及位置特征向量进行数量统计,得到疫情特征维度数量,分别对疫情灾害信息中每个疫情事件的特征维度进行统计,达到了提高疫情特征维度数量的准确度的效果。

在另一种可能实现的方式中,所述将得到的所述疫情特征维度数量与所述第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据,包括:

将所述疫情特征维度数量与所述第一疫情矩阵数据进行整合,生成疫情维度矩阵数据;

对所述疫情维度矩阵数据进行基本数据分布探查,获取所述疫情灾害信息中危害事件发生的相对周期性规律,并基于所述相对周期性规律确定时间周期长度;

基于所述时间周期长度对所述疫情维度矩阵数据进行有监督时间序列数据整理,得到疫情预测矩阵数据;

基于所述疫情预测矩阵数据对未来预设时间段内的疫情发生趋势进行预测,生成第二疫情矩阵数据。

通过上述技术方案,在生成第二疫情矩阵数据时,将疫情特征维度数量与第一疫情矩阵数据进行整合,得到疫情维度矩阵数据,然后对疫情维度矩阵数据进行基本数据分布探查,获取疫情灾害信息中疫情事件发生的相对周期性规律,并根据相对周期性规律确定时间周期长度,然后基于时间周期长度对疫情维度矩阵数据进行有监督时间序列数据整理,得到疫情预测矩阵数据,然后根据疫情预测矩阵数据与未来预设时间段内的疫情发生量趋势进行预判,生成第二疫情矩阵数据,达到了对第一疫情矩阵数据进行时间序列监督的效果。

在另一种可能实现的方式中,所述对所述第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据,包括:

计算所述第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差,并基于所述正态分布均值以及所述正态分布方差确定所述第二疫情矩阵数据的3δ范围;

判断所述数据是否在所述3δ范围之外,若所述数据在所述3δ范围之外,则确定所述数据所在所述第二疫情矩阵数据的第一矩阵序列,根据所述第一矩阵序列计算序列平均值,用所述序列平均值对所述数据进行替换,得到替换后的第二矩阵序列,并对所述第二矩阵序列进行缺失值处理;

对所述第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据。

通过上述技术方案,在获取疫情灾害数据时,通过计算第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差确定第二疫情矩阵数据的3δ范围,确定当前数据是否在3δ范围之外,若是,则将数据进行剔除,同时将序列平均值添加到数据所在第一矩阵序列位置处,得到第二矩阵序列,然后对第二矩阵序列进行缺失值处理,以保证矩阵序列的完整性,然后将第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据,以便后续对疫情灾害数据进行数据处理。

在另一种可能实现的方式中,所述将得到的所述疫情灾害数据输入至预设算法模型中进行数据推算,生成所述不同区域对应的所述类型组合数量中每种组合在未来预设时间段内的疫情发生量,之后还包括:

获取所述类型组合数量中每种类型组合在未来预设时间段内的实际疫情发生量;

基于所述实际疫情发生量对所述疫情发生量进行反归一处理,将所述疫情发生量恢复到所述实际疫情发生量。

通过上述技术方案,在对未来预设时间段内的疫情发生量预测完成后,确定在未来预设时间段内发生的实际疫情发生量,然后通过实际疫情发生量对疫情发生量进行反归一处理,将实际疫情发生量对疫情发生量进行覆盖,从而达到了对疫情发生量进行数据更新的效果。

在另一种可能实现的方式中,所述将所述第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,之后还包括:

基于所述实际疫情发生量以及所述疫情发生量确定疫情发生量均方根误差;

根据所述疫情发生量均方根误差对所述疫情预测模型中的epoch训练模型中的参数进行设置,并对设置后的epoch训练模型进行反向迭代,得到所述疫情预测模型中每一轮的验证集;对所述验证集进行计算评估,生成所述验证集的损失值以及评价指标。

通过上述技术方案,在提取完第一疫情矩阵数据的向量特征后,根据实际疫情发生量与疫情发生量确定出疫情发生量均方根误差,然后根据疫情发生量均方根误差对疫情预测模型中的epoch训练模型进行参数设置,紧接着对epoch训练模型进行反向迭代,以获取疫情预测模型中每一轮的验证集,然后对验证集进行计算评估,生成验证集的损失值以及评价指标,工作人员通过损失值以及评价指标的直观数据,对当前向量特征提取效果进行监测。

第二方面,本申请提供一种提高疫情防控精度的装置,采用如下的技术方案:

一种提高疫情防控精度的装置,包括:

信息获取模块,用于获取过去预设时间段内的疫情灾害信息,所述疫情灾害信息为不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与所述行动轨迹信息相匹配的不同人群类型所发生过的疫情信息;

信息分析模块,用于对所述疫情灾害信息进行分析,确定所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度,并基于所述时间序列长度以及所述类型组合数量对所述疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据;

特征提取模块,用于将所述第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的所述疫情特征维度数量与所述第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据;

数据预测模块,用于对所述第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据,并将得到的所述疫情灾害数据输入至预设算法模型中进行数据推算,生成所述不同区域对应的所述类型组合数量中每种组合在未来预设时间段内的疫情发生量。

通过采用上述技术方案,在对不同区域的疫情进行防控时,通过对不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息进行采集,得到疫情灾害信息,然后对疫情灾害信息进行分析,获取疫情灾害信息中的不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,其中,时间序列长度与类型组合数量是一一对应的关系,然后根据时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据,然后将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据,然后对第二疫情矩阵数据中所包含的数据进行一一处理,得到疫情灾害数据,将疫情灾害数据输入至预设算法模型中进行数据推算,生成类型组合数量中每个类型组合在未来预设时间段内的疫情发生量,工作人员根据实际需求设置过去预设时间段以及未来预设时间段,以获取在未来预设时间段内的不同区域对应的类型组合数量中每种组合的疫情发生量,便于后续疫情防控人员根据对不同区域未来的疫情发生量进行疫情防控,从而达到了提高疫情防控准确度的效果。

在一种可能的实现方式中,所述信息分析模块在对所述疫情灾害信息进行分析,确定所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度时,具体用于:

基于所述疫情灾害信息确定所述不同区域的疫情情处理数据;

分别对所述疫情处理数据进行标签获取,得到每组疫情处理数据中的人群组合数据以及处理时间数据;

根据所述处理时间数据确定所述疫情处理数据是否处理完结,若未处理完结,则将所述疫情处理数据进行数据瓦解,若处理完结,则将所述人群组合数据与所述处理时间数据进行对应绑定,得到疫情绑定数据;

对所述疫情绑定数据进行人群组合类型筛选,得到所述疫情灾害信息中不同人群类型的类型组合数量以及所述类型组合数量中每个类型组合对应的时间序列长度。

在另一种可能的实现方式中,所述特征提取模块在将所述第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量时,具体用于:

基于所述第一疫情矩阵数据确定所述疫情灾害信息中每个疫情事件的事件时间、确诊人员信息、密接人员信息、事件地点以及与所述事件地点对应防疫政策;

分别将所述事件时间、所述确诊人员信息、所述密接人员信息、所述事件地点以及与所述防疫政策输入至所述疫情预测模型进行向量提取,得到与所述事件时间对应的时间特征向量、与所述确诊人员信息、所述密接人员信息以及所述防疫政策信息对应的文本特征向量以及与所述事件地点对应的位置特征向量;

对所述时间特征向量、所述文本特征向量以及所述位置特征向量进行数量统计,得到所述疫情特征维度数量。

在另一种可能的实现方式中,所述特征提取模块在将得到的所述疫情特征维度数量与所述第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据时,具体用于:

将所述疫情特征维度数量与所述第一疫情矩阵数据进行整合,生成疫情维度矩阵数据;

对所述疫情维度矩阵数据进行基本数据分布探查,获取所述疫情灾害信息中危害事件发生的相对周期性规律,并基于所述相对周期性规律确定时间周期长度;

基于所述时间周期长度对所述疫情维度矩阵数据进行有监督时间序列数据整理,得到疫情预测矩阵数据;

基于所述疫情预测矩阵数据对未来预设时间段内的疫情发生趋势进行预测,生成第二疫情矩阵数据。

在另一种可能的实现方式中,所述数据预测模块在对所述第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据时,具体用于:

计算所述第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差,并基于所述正态分布均值以及所述正态分布方差确定所述第二疫情矩阵数据的3δ范围;

判断所述数据是否在所述3δ范围之外,若所述数据在所述3δ范围之外,则确定所述数据所在所述第二疫情矩阵数据的第一矩阵序列,根据所述第一矩阵序列计算序列平均值,用所述序列平均值对所述数据进行替换,得到替换后的第二矩阵序列,并对所述第二矩阵序列进行缺失值处理;

对所述第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据。

在另一种可能的实现方式中,所述装置还包括:真实数据获取模块以及数据归一处理模块,其中,

所述真实数据获取模块,用于获取所述类型组合数量中每种类型组合在未来预设时间段内的实际疫情发生量;

所述数据归一处理模块,用于基于所述实际疫情发生量对所述疫情发生量进行反归一处理,将所述疫情发生量恢复到所述实际疫情发生量。

在另一种可能的实现方式中,所述装置还包括:误差确定模块、数据迭代模块以及计算评估模块,其中,

所述误差确定模块,用于基于所述实际疫情发生量以及所述疫情发生量确定疫情发生量均方根误差;

所述数据迭代模块,用于根据所述疫情发生量均方根误差对所述疫情预测模型中的epoch训练模型中的参数进行设置,并对设置后的epoch训练模型进行反向迭代,得到所述疫情预测模型中每一轮的验证集;

所述计算评估模块,用于对所述验证集进行计算评估,生成所述验证集的损失值以及评价指标。

第三方面,本申请提供一种电子设备,采用如下的技术方案:

一种电子设备,该电子设备包括:

至少一个处理器;

存储器;

至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行上述提高疫情防控精度的方法。

第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:

一种计算机可读存储介质,包括:存储有能够被处理器加载并执行上述提高疫情防控精度的方法的计算机程序。

综上所述,本申请包括以下有益技术效果:

1.在对不同区域的疫情进行防控时,通过对不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息进行采集,得到疫情灾害信息,然后对疫情灾害信息进行分析,获取疫情灾害信息中的不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,其中,时间序列长度与类型组合数量是一一对应的关系,然后根据时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据,然后将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据,然后对第二疫情矩阵数据中所包含的数据进行一一处理,得到疫情灾害数据,将疫情灾害数据输入至预设算法模型中进行数据推算,生成类型组合数量中每个类型组合在未来预设时间段内的疫情发生量,工作人员根据实际需求设置过去预设时间段以及未来预设时间段,以获取在未来预设时间段内的不同区域对应的类型组合数量中每种组合的疫情发生量,便于后续疫情防控人员根据对不同区域未来的疫情发生量进行疫情防控,从而达到了提高疫情防控准确度的效果;2.在获取疫情灾害数据时,通过计算第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差确定第二疫情矩阵数据的3δ范围,确定当前数据是否在3δ范围之外,若是,则将数据进行剔除,同时将序列平均值添加到数据所在第一矩阵序列位置处,得到第二矩阵序列,然后对第二矩阵序列进行缺失值处理,以保证矩阵序列的完整性,然后将第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据,以便后续对疫情灾害数据进行数据处理。

附图说明

图1是本申请实施例一种提高疫情防控精度的方法的流程示意图;

图2是本申请实施例一种提高疫情防控精度的方法的方框示意图;

图3是本申请实施例电子设备的示意图。

具体实施方式

以下结合附图1-3对本申请作进一步详细说明。

领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,一种提高疫情防控精度的方法、装置、电子设备及介质和/或B,可以表示:单独存在一种提高疫情防控精度的方法、装置、电子设备及介质,同时存在一种提高疫情防控精度的方法、装置、电子设备及介质和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。

下面结合说明书附图对本申请实施例作进一步详细描述。

本申请实施例提供了一种提高疫情防控精度的方法,由电子设备执行,该电子设备可以为服务器也可以为终端设备,其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此,该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制,如图1所示,该方法包括:

步骤S10,获取过去预设时间段内的疫情灾害信息。

其中,疫情灾害信息为不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息。

对于本申请实施例来说,过去预设时间段为工作人员通过指定终端设备进行输入的,指定终端设备包括平板、手机以及电脑等。

具体地,工作人员在指定终端设备中输入过去预设时间段(例如:2020年1月1号—2021年10月3号),然后指定终端设备将过去预设时间段发送至电子设备进行处理,在电子设备接收到过去预设时间段后,获取过去预设时间段中不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息。

具体地,实际防疫政策信息为不同区域在单位时间内(24小时)的实际外来人员数量以及外来人员进入该区域的条件,例如:一号区域的进入条件为24小时核酸检测证明,二号区域的进入条件为封闭状态,任何人无法进入。对于一号区域来说,在进入一号区域时,往往对具有24小时核酸检测证明的人员数量进行统计,将该人员数量作为进入到一号区域的实际人数,但这种统计存在人员漏检的情况,因此本申请实施例通过图像识别技术确定进入该区域的外来人员数量,然后通过大数据技术确定具备24小时核酸检测证明的人员数量,将外来人员数量与人员数量进行比对,若出现外来人员数量大于人员数量的情况,即表示存在漏检的情况,因此一号区域的实际防疫政策信息在单位时间内的实际外来人员数量包括符合进入条件的人员数量以及漏检的人员数量。对于二号区域来说,查看是否存在非医护管理部门的人员进入,当存在时,二号区域的实际防疫政策信息即为非法进入该区域的人员数量。

对于本申请实施例来说,采用卷积神经网络技术对确诊人员的行动轨迹信息以及该行动轨迹信息对应的人口迁移数据,将得到的人口迁移数据与行踪轨迹信息进行匹配,利用KL散度计算确诊人员的行动轨迹信息与人口迁移数据的相似度,当某人员的相似度大于80%时,即表示该人员与确诊人员接触的概率高。

在本申请实施例中,我国人口年龄类型包括:幼婴类(1岁-6岁)、少儿类(7岁-12岁)、少年类(13岁-17岁)、青年类(18岁-45岁)、中年类(46岁-69岁)以及老年类(大于69岁)。不同人群类型为不同人口年龄类型中的易感染人群、潜伏人群、感染人群以及已经获得抗体人群。

具体地,获取疫情灾害信息的一种可实施方式为大数据获取方式,通过大数据技术对所有疫情灾害信息进行获取,然后再根据过去预设时间段对所有疫情灾害信息进行筛选,得到该过去预设时间段内的疫情灾害信息。

步骤S11,对疫情灾害信息进行分析,确定疫情灾害信息中不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,并基于时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据。

具体地,时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。

在本申请实施例中,时间序列长度表示的是疫情灾害信息随时间不断变化的长度。

根据时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到以下第一疫情矩阵数据:

其中,m为类型组合数量,n为时间序列长度。

步骤S12,将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据。

具体地,在将第一疫情矩阵数据输入至疫情预测模型中进行向量特征提取,需要预先获取矩阵数据样本,矩阵数据样本包括过往所有疫情灾害信息所形成的第一疫情矩阵数据以及第一疫情矩阵数据中的向量特征,然后创建疫情预测模型,并基于矩阵数据样本对疫情预测模型进行训练,得到训练好的疫情预测模型。

具体地,预研模型为预先训练好的神经网络模型,神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络的发展与神经科学、数理科学、认知科学、计算机科学、人工智能、信息科学、控制论、机器人学、微电子学、心理学、光计算、分子生物学等有关。

具体地,将第一疫情矩阵数据输入至预研模型中进行向量特征提取,并将提取到的向量特征进行统计,得到特征维度数量,其中,向量特征包括疫情灾害信息中的事件文本向量特征、时间向量特征以及类型组合向量特征等,然后将特征维度数量与第一疫情矩阵数据进行数据结合,得到第二疫情矩阵数据。

步骤S13,对第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据,并将得到的疫情灾害数据输入至预设算法模型中进行数据推算,生成不同区域对应的类型组合数量中每种组合在未来预设时间段内的疫情发生量。

对于本申请实施例来说,采用双向LSTM模型为预设算法模型进行举例说明,包括但不仅限于双向LSTM模型。

具体地,预设算法模型构建,模型主体采用双向LSTM作为趋势预测模型,LSTM主要有遗忘门,输入门,输出门构成;

遗忘门:f

输入门:

经过遗忘门和输入门的信息过滤后,将历史的记忆和当前阶段的记忆内容合并,生成的值为:

输出门:

本申请实施例提供了一种提高疫情防控精度的方法,在对不同区域的疫情进行防控时,通过对不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息进行采集,得到疫情灾害信息,然后对疫情灾害信息进行分析,获取疫情灾害信息中的不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,其中,时间序列长度与类型组合数量是一一对应的关系,然后根据时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据,然后将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据,然后对第二疫情矩阵数据中所包含的数据进行一一处理,得到疫情灾害数据,将疫情灾害数据输入至预设算法模型中进行数据推算,生成类型组合数量中每个类型组合在未来预设时间段内的疫情发生量,工作人员根据实际需求设置过去预设时间段以及未来预设时间段,以获取在未来预设时间段内的不同区域对应的类型组合数量中每种组合的疫情发生量,便于后续疫情防控人员根据对不同区域未来的疫情发生量进行疫情防控,从而达到了提高疫情防控准确度的效果。

本申请实施例的一种可能的实现方式,步骤S11具体包括步骤S111(图中未示出)、步骤S112(图中未示出)、步骤S113(图中未示出)以及步骤S114(图中未示出),其中,步骤S111,基于疫情灾害信息确定不同区域的疫情情处理数据。

步骤S112,分别对疫情处理数据进行标签获取,得到每组疫情处理数据中的人群组合数据以及处理时间数据。

具体地,根据至少一组疫情处理数据中的数据标签进行标签获取,获取到指定的标签内容,即通过获取疫情发生地点、疫情详情、疫情发生时间以及疫情结束时间等。

步骤S113,根据处理时间数据确定疫情处理数据是否处理完结,若未处理完结,则将疫情处理数据进行数据瓦解,若处理完结,则将人群组合数据与处理时间数据进行对应绑定,得到疫情绑定数据。

具体地,通过获取到的时间标签所对应的时间信息,确定当前疫情处理数据是否处理完结,例如:在当天12点,查出确诊病历王某,在当前时刻所获取的信息仅是王某个人信息,暂无与王某的密接人员信息以及王某的行动轨迹信息,因此该处理数据即表示未处理完结。

步骤S114,对疫情绑定数据进行人群组合类型筛选,得到疫情灾害信息中不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度。

本申请实施例的一种可能的实现方式,步骤S12具体包括步骤S121(图中未示出)、步骤S122(图中未示出)以及步骤S123(图中未示出),其中,

步骤S121,基于第一疫情矩阵数据确定疫情灾害信息中每个疫情事件的事件时间、确诊人员信息、密接人员信息、事件地点以及与事件地点对应防疫政策。

具体地,根据第一疫情矩阵数据中X确定疫情事件对应的确诊人员信息、密接人员信息、事件地点以及防疫政策,根据第一疫情矩阵数据中n确定疫情事件对应的事件时间,根据第一疫情矩阵数据中m确定疫情事件对应事件类型。

步骤S122,分别将事件时间、确诊人员信息、密接人员信息、事件地点以及与防疫政策输入至疫情预测模型进行向量提取,得到与事件时间对应的时间特征向量、与确诊人员信息、密接人员信息以及防疫政策信息对应的文本特征向量以及与事件地点对应的位置特征向量。

步骤S123,对时间特征向量、文本特征向量以及位置特征向量进行数量统计,得到疫情特征维度数量。

具体地,一个矩阵的特征向量的总数计算方法:个数=n-特征矩阵的秩,个数=n-r(λE-A)其中n是阶数,而不是每个矩阵都能相似对角化的。如果一个矩阵,它的特征值各不相同,那么一定可以对角化。特征向量在基向量上的投影(即坐标),这里假设向量空间为h维。由此,可以直接以坐标向量表示。利用基向量,线性变换也可以用一个简单的矩阵乘法表示。

本申请实施例的一种可能的实现方式,步骤S12具体包括步骤S124(图中未示出)、步骤S125(图中未示出)、步骤S126(图中未示出)以及步骤S127(图中未示出),其中,步骤S124,将疫情特征维度数量与第一疫情矩阵数据进行整合,生成疫情维度矩阵数据。

具体地,将疫情特征维度数量作为维度与第一疫情矩阵数据进行整合,本申请实施例采用pytorch技术进行举例说明,包括但不局限于pytorch技术一种可实现方式。

通过pytorch中的指令“out.unsqueeze(-1)”将疫情特征维度数量以维度的方式添加到第一疫情矩阵数据中,实现维度整合。

具体地,PyTorch是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。它主要由Facebookd的人工智能小组开发,不仅能够实现强大的GPU加速,同时还支持动态神经网络,这一点是现在很多主流框架如TensorFlow都不支持的。PyTorch提供了两个高级功能:1.具有强大的GPU加速的张量计算(如Numpy);2.包含自动求导系统的深度神经网络除了Facebook之外,Twitter、GMU和Salesforce等机构都采用了PyTorch。

将疫情特征维度数量与第一疫情矩阵数据进行整合完毕后,得到以下疫情维度矩阵数据:

其中,

v表示疫情特征维度数量。

步骤S125,对疫情维度矩阵数据进行基本数据分布探查,获取疫情灾害信息中危害事件发生的相对周期性规律,并基于相对周期性规律确定时间周期长度。

具体地,将疫情维度矩阵数据导入到Excel表格中,并且配置Python集成jupyter环境,针对蚁维度矩阵数据中n时间序列做基本数据分布探查,主要目的在于找到对应序列的的相对周期性规律,然后根据相周期性规律确定时间周期长度。

步骤S126,基于时间周期长度对疫情维度矩阵数据进行有监督时间序列数据整理,得到疫情预测矩阵数据。

具体地,用t来代替时间周期性长度,并将疫情维度矩阵数据中的n替换为t,得到新的疫情预测矩阵数据:

步骤S127,基于疫情预测矩阵数据对未来预设时间段内的疫情发生趋势进行预测,生成第二疫情矩阵数据。

具体地,假设预设未来预设时间段为k,即移动步长为k步预测,得到第二疫情矩阵数据:

本申请实施例的一种可能的实现方式,步骤S13具体包括步骤S131(图中未示出)、步骤S132(图中未示出)以及步骤S133(图中未示出),其中,

步骤S131,计算第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差,并基于正态分布均值以及正态分布方差确定第二疫情矩阵数据的3δ范围。

步骤S132,判断数据是否在3δ范围之外,若数据在3δ范围之外,则确定数据所在第二疫情矩阵数据的第一矩阵序列,根据第一矩阵序列计算序列平均值,用序列平均值对数据进行替换,得到替换后的第二矩阵序列,并对第二矩阵序列进行缺失值处理。

具体地,3δ范围是建立在正态分布的等精度重复测量基础上而造成奇异数据的干扰或噪声难以满足正态分布。如果一组测量数据中某个测量值的残余误差的绝对值νi>3δ,则该测量值为坏值,应剔除。通常把等于±3δ的误差作为极限误差,对于正态分布的随机误差,落在±3δ以外的概率只有0.27%,它在有限次测量中发生的可能性很小,故存在3δ准则。3δ准则是最常用也是最简单的粗大误差判别准则,它一般应用于测量次数充分多(n≥30)或当n>10做粗略判别时的情况。

具体地,缺失值是指第二矩阵序列中由于缺少信息而造成的数据聚类、分组、删失或截断,对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补,本申请实施例采用删除存在缺失值的个案对第二矩阵序列进行处理,删除存在缺失值的个案主要有简单删除法和权重法。简单删除法是对缺失值进行处理的最原始方法。它将存在缺失值的个案删除。如果数据缺失问题可以通过简单的删除小部分样本来达到目标,那么这个方法是最有效的。当缺失值的类型为非完全随机缺失的时候,可以通过对完整的数据加权来减小偏差。把数据不完全的个案标记后,将完整的数据个案赋予不同的权重,个案的权重可以通过logistic或probit回归求得。

步骤S133,对第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据。

具体地,归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。

具体处理归一方法为:

本申请实施例的一种可能的实现方式,步骤S13之后还包括:步骤Sa(图中未示出)以及步骤Sb(图中未示出),其中,

步骤Sa,获取类型组合数量中每种类型组合在未来预设时间段内的实际疫情发生量。

具体地,获取未来预设时间段内的实际疫情发生量,例如:未来预设时间段为一个月,那么在过一个月后,获取类型组合数量中每个类型组合的实际疫情发生量。

步骤Sb,基于实际疫情发生量对疫情发生量进行反归一处理,将疫情发生量恢复到实际疫情发生量。

具体地,将疫情发生量进行反归一处理,使得疫情发生量恢复到归一化处理之前的数据,然后将实际疫情发生量对疫情发生量进行覆盖。

本申请实施例的一种可能的实现方式,步骤S12之后还包括:步骤Sd(图中未示出)、步骤Se(图中未示出)以及步骤Sf(图中未示出),其中,

步骤Sd,基于实际疫情发生量以及疫情发生量确定疫情发生量均方根误差。

具体地,均方根误差,它是观测值与真值偏差的平方和观测次数n比值的平方根,均方根误差计算公式:Re=√[∑di^2/n],式中n为测量次数,di为一组实际疫情发生量以及疫情发生量的偏差。

步骤Se,根据疫情发生量均方根误差对疫情预测模型中的epoch训练模型中的参数进行设置,并对设置后的epoch训练模型进行反向迭代,得到疫情预测模型中每一轮的验证集。

具体地,当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次epoch训练模型。一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程。由于一个epoch常常太大,计算机无法负荷,我们会将它分成几个较小的batches。在训练时,将所有数据迭代训练一次是不够的,需要反复多次才能拟合收敛。在实际训练时,我们将所有数据分成几个batch,每次送入一部分数据,梯度下降本身就是一个迭代过程。根据疫情发生量均方根误差对epoch训练模型中的参数进行设置,已得到疫情预测模型中每一轮的验证集,即疫情发生量验证集合。

步骤Sf,对验证集进行计算评估,生成验证集的损失值以及评价指标。

具体地,对验证集的计算评估包括一下步骤:

将验证集与疫情预测模型的训练集进行百分比计算,得到损失值;

将损失值与标准损失值表进行对照,得到评价指标。

例如:当前损失值为50%,标准损失值表对应的50%为2级指标。

上述实施例从方法流程的角度介绍一种提高疫情防控精度的方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种提高疫情防控精度的装置,具体详见下述实施例。

本申请实施例提供一种提高疫情防控精度的装置,如图2所示,该提高疫情防控精度的装置20具体可以包括:信息获取模块21、信息分析模块22、特征提取模块23以及数据预测模块24,其中,

信息获取模块21,用于获取过去预设时间段内的疫情灾害信息,疫情灾害信息为不同区域对应的实际防疫政策信息、确诊人员的行动轨迹信息以及与行动轨迹信息相匹配的不同人群类型所发生过的疫情信息;

信息分析模块22,用于对疫情灾害信息进行分析,确定疫情灾害信息中不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度,并基于时间序列长度以及类型组合数量对疫情灾害信息进行无监督时间序列数据整理,得到第一疫情矩阵数据;特征提取模块23,用于将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量,并将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据;

数据预测模块24,用于对第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据,并将得到的疫情灾害数据输入至预设算法模型中进行数据推算,生成不同区域对应的类型组合数量中每种组合在未来预设时间段内的疫情发生量。

本申请实施例的一种可能的实现方式,信息分析模块22在对疫情灾害信息进行分析,确定疫情灾害信息中不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度时,具体用于:

基于疫情灾害信息确定不同区域的疫情情处理数据;

分别对疫情处理数据进行标签获取,得到每组疫情处理数据中的人群组合数据以及处理时间数据;

根据处理时间数据确定疫情处理数据是否处理完结,若未处理完结,则将疫情处理数据进行数据瓦解,若处理完结,则将人群组合数据与处理时间数据进行对应绑定,得到疫情绑定数据;(处理与确诊人员的密接人员)

对疫情绑定数据进行人群组合类型筛选,得到疫情灾害信息中不同人群类型的类型组合数量以及类型组合数量中每个类型组合对应的时间序列长度。

本申请实施例的另一种可能的实现方式,特征提取模块23在将第一疫情矩阵数据输入至训练好的疫情预测模型进行向量特征提取,得到疫情特征维度数量时,具体用于:

基于第一疫情矩阵数据确定疫情灾害信息中每个疫情事件的事件时间、确诊人员信息、密接人员信息、事件地点以及与事件地点对应防疫政策;

分别将事件时间、确诊人员信息、密接人员信息、事件地点以及与防疫政策输入至疫情预测模型进行向量提取,得到与事件时间对应的时间特征向量、与确诊人员信息、密接人员信息以及防疫政策信息对应的文本特征向量以及与事件地点对应的位置特征向量;

对时间特征向量、文本特征向量以及位置特征向量进行数量统计,得到疫情特征维度数量。

本申请实施例的另一种可能的实现方式,特征提取模块23在将得到的疫情特征维度数量与第一疫情矩阵数据进行数据结合处理,生成第二疫情矩阵数据时,具体用于:

将疫情特征维度数量与第一疫情矩阵数据进行整合,生成疫情维度矩阵数据;

对疫情维度矩阵数据进行基本数据分布探查,获取疫情灾害信息中危害事件发生的相对周期性规律,并基于相对周期性规律确定时间周期长度;

基于时间周期长度对疫情维度矩阵数据进行有监督时间序列数据整理,得到疫情预测矩阵数据;

基于疫情预测矩阵数据对未来预设时间段内的疫情发生趋势进行预测,生成第二疫情矩阵数据。

本申请实施例的另一种可能的实现方式,数据预测模块24在对第二疫情矩阵数据中所包含的数据进行数据处理,得到疫情灾害数据时,具体用于:

计算第二疫情矩阵数据中所包含的数据的正态分布均值以及正态分布方差,并基于正态分布均值以及正态分布方差确定第二疫情矩阵数据的3δ范围;

判断数据是否在3δ范围之外,若数据在3δ范围之外,则确定数据所在第二疫情矩阵数据的第一矩阵序列,根据第一矩阵序列计算序列平均值,用序列平均值对数据进行替换,得到替换后的第二矩阵序列,并对第二矩阵序列进行缺失值处理;

对第二疫情矩阵数据中的第二矩阵序列进行序列的归一化处理,得到疫情灾害数据。

本申请实施例的另一种可能的实现方式,装置20还包括:真实数据获取模块以及数据归一处理模块,其中,真实数据获取模块,用于获取类型组合数量中每种类型组合在未来预设时间段内的实际疫情发生量;

数据归一处理模块,用于基于实际疫情发生量对疫情发生量进行反归一处理,将疫情发生量恢复到实际疫情发生量。

本申请实施例的另一种可能的实现方式,装置20还包括:误差确定模块、数据迭代模块以及计算评估模块,其中,误差确定模块,用于基于实际疫情发生量以及疫情发生量确定疫情发生量均方根误差;

数据迭代模块,用于根据疫情发生量均方根误差对疫情预测模型中的epoch训练模型中的参数进行设置,并对设置后的epoch训练模型进行反向迭代,得到疫情预测模型中每一轮的验证集;

计算评估模块,用于对验证集进行计算评估,生成验证集的损失值以及评价指标。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请实施例还从实体装置的角度介绍了一种电子设备,如图3所示,图3所示的电子设备300除常规配置装置外包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。可选地,电子设备300还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一个,该电子设备300的结构并不构成对本申请实施例的限定。

处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。

总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现前述方法实施例所示的内容。

其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图3示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

技术分类

06120115918209