掌桥专利:专业的专利平台
掌桥专利
首页

基于传播动力学和多项式回归的新冠病毒传播预测方法

文献发布时间:2023-06-19 11:27:38


基于传播动力学和多项式回归的新冠病毒传播预测方法

技术领域

本发明涉及传染病传播技术领域,特别涉及一种基于传播动力学和多项式回归的新冠病 毒传播预测方法。

背景技术

新型冠状病毒肺炎疫情中,众多学者使用不同的算法都取得了很好的效果,为国家的抗 击疫情做出了重大贡献。目前预测新冠肺炎确诊人数的模型大多采用曲线拟合、神经网络和 线性回归。此外,传统的曲线拟合是完全基于数据趋势进行预测,无法考虑传染病的传播速 度、传播模式及各种防控措施的实施带来的转折影响,预测效果并不好。传染病资料的分析 及预测需要特殊的方法,是方法学研究的一个重要领域。这些因素都导致传统的单一算法预 测模型效果不好。

发明内容

本发明针对SEIR传播模型可以有效预测拐点,但在预测实际确诊人数时存在较大误差, 以及多项式回归预测模型在传染病疫情出现拐点时的预测存在较大误差的问题,提出了一种 基于传播动力学和多项式回归的新冠病毒传播预测方法。

为了解决上述技术问题,本发明的技术方案为:

一种基于传播动力学和多项式回归的新冠病毒传播预测方法,包括以下步骤:

S1,收集新冠病毒疫情数据并对数据进行处理;

S2,构建SEIR传播模型;

S3,建立多项式回归预测模型;

S4,使用建立的多项式回归预测模型在SEIR传播模型的预测拐点区间进行数据分析与 预测。

步骤S1中:将从国家卫生健康委员会得到的本次疫情数据进行处理,建立时间和确诊人 数关系图。

较佳的,步骤S2包括以下步骤:

S21,将人群分为易感者S、潜伏者E、感染者I和康复者R,设每日每人接触到的人数为r,易感者S被潜伏者E感染的概率为β,易感者S被感染者I感染的概率为β

S22,根据上述设定,模型详情

S23,整理为迭代形式

I

R

S24,利用当前新冠疫情数据,用上述迭代形式的公式预测出未来一段时间新冠疫情的时 间拐点。

较佳的,步骤S3中:使用polyfit函数对多项式进行曲线拟合,多项式设为y=f(x,y,n), 其中x为横坐标,y为纵坐标,n为拟合的多项式次数,y为感染人数。

较佳的,拟合次数n选取为4。

较佳的,步骤S4包括以下步骤:根据现有新冠疫情数据拟合出的多项式函数y=f(x,y,n) 预测未来在新冠疫情时间拐点之前这一段时间的新增新冠疫情人数。

与现有技术相比,本发明的有益效果是:

本发明首先将疫情信息进行处理,然后使用经典传播动力学模型SEIR模型,对新疆此 次疫情的拐点进行预测,然后在确定拐点的基础上对疫情数据使用多项式回归算法进行拟合, 最终使用拟合的多项式回归函数对接下来的疫情进行预测。实验结果表明,采用传播动力学 模型结合机器学习算法的预测方法相比于线性回归、逻辑回归等单一算法的预测方法有更高 的预测准确率。该发明具有复杂性低、准确率高等优点,在传染病预测和防控以及人们的日 常生活中有着巨大的应用价值。

附图说明

图1为本发明基于传播动力学和多项式回归的新冠病毒传播预测方法的流程图;

图2为本发明多项式回归预测模型的拟合函数曲线图;

图3为本发明多项式回归预测模型的预测效果图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实 施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发 明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。

参考图1,一种基于传播动力学和多项式回归的新冠病毒传播预测方法,包括以下步骤:

S1,收集新冠病毒疫情数据并对数据进行处理;

将从国家卫生健康委员会得到的本次疫情数据进行处理,建立时间和确诊人数关系图。 本实施例选取的数据是国家卫生健康委员会提供的新疆地区2020年7月16日至28日的新冠 疫情数据。在不知道未来一段时间疫情走向的情况下对新冠疫情接下来的疫情数据进行预测。

S2,构建SEIR传播模型;

S21,将人群分为易感者S、潜伏者E、感染者I和康复者R,由于接触、隔离和治疗,这四类人群之间相互转化,设每日每人接触到的人数为r,易感者S被潜伏者E感染的概率为β,易感者S被感染者I感染的概率为β

易感者S为尚未患病的人群,且有与病患接触的可能性;潜伏者E为处于疾病潜伏期的 无症状人群,处于新型冠状病毒潜伏期的人群也具有传染性;感染者I为被感染人群;康复 者R为痊愈病患,本模型认为康复者R不会再次被感染。由于接触、隔离和治疗,这四类人 群是可以相互转换的。为了简化模型,本实施例以固定的概率来体现转化。

S22,根据上述设定,模型为

S23,整理为迭代形式

I

R

通过该模型可以看出,降低每日每人接触到的人数为r的数值,减小易感者S被潜伏者E 感染的概率β以及易感者S被感染者I感染的概率β

S24,利用当前新冠疫情数据,用上述迭代形式的公式预测出未来一段时间新冠疫情的时 间拐点。

结合新疆当地防疫措施以及上述SEIR传播模型计算,可以知道未来的疫情拐点会出现 在2020年8月1日。但是在2020年7月7月29日至31日这几天的疫情数据未知,或者还没有准确的预测数据,因此需要对这几天的疫情数据进行一个精准的预测。

S3,建立多项式回归预测模型;

多项式拟合是用一个多项式展开去拟合包含数个分析格点的一小块分析区域中的所有观 测点,得到观测数据的客观分析场。展开系数用最小二乘拟合确定。

多项式拟合,将一组数据尽可能的映射到一个多项式上,反映这一组数据之间的一个函 数关系。故可以使用多项式拟合方法对于数据的未来走向进行一定程度的预测。

使用polyfit函数对多项式进行曲线拟合,多项式设为y=f(x,y,n),其中x为横坐标,y为 纵坐标,n为拟合的多项式次数,y为感染人数。

由于本发明采用SEIR传播模型对新冠疫情的走势进行一个宏观上的把控,而多项式回 归预测模型只是对局部的精确预测,因此多项式回归预测模型的多项式次数并非是选取4则 具有更好效果,要根据实际的新冠疫情数据而定,当选取多项式次数较小的情况下也能符合 本多项式回归预测模型对新冠感染人数精确预测的需要。

根据提供的新疆地区2020年7月16日至28日的新冠疫情数据构建多项式回归预测模型, 拟合出图2所示的函数曲线。

S4,使用建立的多项式回归预测模型在SEIR传播模型的预测拐点区间进行数据分析与 预测。

根据上述拟合的函数曲线预测未来两天的新冠疫情数据,由于2020年7月31日已经非 常接近8月1日的时间拐点,因此在此并并没有对2020年7月31日进行预测。预测的效果 图见图3,即2020年7月29日和7月30日这两天的新冠病毒每日新增确诊人数的预测数值与实际数值的对比,可见本发明采用的方法预测精确度较高,因此具有广大的社会应用前景。

以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。 对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多 种变化、修改、替换和变型,仍落入本发明的保护范围内。

相关技术
  • 基于传播动力学和多项式回归的新冠病毒传播预测方法
  • 基于长短期记忆网络LSTM模型的新冠病毒传播预测方法
技术分类

06120112938175