掌桥专利:专业的专利平台
掌桥专利
首页

一种基于ARIMA模型的食源性疾病发病预测方法、装置及介质

文献发布时间:2024-04-18 19:58:21


一种基于ARIMA模型的食源性疾病发病预测方法、装置及介质

技术领域

本发明涉及数据预测技术领域,具体涉及一种基于ARIMA模型的食源性疾病发病预测方法、装置及介质。

背景技术

食源性疾病不仅影响人类生命健康,而且损害国民经济和社会发展,是一个重要的公共卫生问题。食源性疾病的分布在空间上和时间上具有一定的相关性,即时空属性。对于食源性疾病的预防控制,评估其发病率的高低和区域聚集情况是重中之重。近年来,食源性疾病呈现出跨区域传播、变化快、难预测的特点。虽然我国已逐步建立了主动监测与被动监测相结合的食源性疾病监测网络,但是对食源性疾病监测数据的分析仍以传统的三间分布(描述疾病流行的规律,疾病在人群、地域和时间上的分布规律,根据疾病的发生规律来帮助找出疾病的病因或危险因)描述为主,多数针对疾病的流行病学特点和病原学监测方面,而对食源性疾病在时间及空间层面的变化考虑不足,无法早期识别食源性疾病高发的时段和区域,也无法较为客观地对某个时段或某个区域范围内发病率进行定量的聚集分析,突出体现在对监测数据的分析缺乏敏感性、及时性和针对性,导致海量食源性疾病监测数据的利用严重不足,这是目前所面临和亟需去解决的问题。

因此,需要发明一种食源性疾病发病预测方法,早期预测食源性疾病的病例聚集,对于疾病的预防控制和部门的监测监管至关重要。

发明内容

为更好的对食源性疾病进行及早预测,本发明提出了一种基于ARIMA模型的食源性疾病发病预测方法,包括:

S1:获取食源性疾病的历年病例数据绘制时序图,并根据时序图进行非平稳序列提取;

S2:通过对非平稳序列进行差分处理,获得差分处理后数据的自相关图和偏自相关图;

S3:根据自相关图和偏自相关图筛选构建ARIMA模型所需的影响因子;

S4:根据筛选的影响因子进行构建ARIMA模型双向参数的各项数值获取;

S5:根据双向参数的各项数值进行ARIMA模型的构建并检验;

S6:通过检验通过的ARIMA模型进行食源性疾病的预测分析。

进一步地,所述S3步骤中,影响因子为季节因素。

进一步地,所述S4步骤中,双向参数的各项数值包括:非季节自回归阶数、非季节差分次数、非季节移动平均阶数、季节自回归阶数、季节差分次数、季节移动平均阶数和季节性周期参数。

进一步地,所述S4步骤中,各项数值获取具体包括如下步骤:

S41:根据筛选的影响因子对时序图进行平稳序列优化下双向参数的差分次数判定;

S42:根据筛选的影响因子对自相关图和偏自相关图进行差分优化下反向参数的自回阶数以及移动平均阶数判定;

S43:根据筛选的影响因子进行基于贝叶斯信息准则约束下正向参数的自回归阶数以及移动平均阶数判定。

进一步地,所述S41步骤中,通过对时序图进行自然对数转换,以及不同次数下季节差分和非季节差分下的差分处理,根据获得的方差和均值选取最稳定状态下的季节差分次数和非季节差分次数组合作为判定结果。

进一步地,所述S42步骤中,通过对自相关图和偏自相关图进行对数转换,以及不同阶数下的一般差分和季节差分处理,根据差分获得的系数选取幅值波动处于预设限值下的非季节自回阶数和非季节移动平均阶数为判定结果。

进一步地,所述S43步骤中,通过逐个模拟分析正向参数不同自回归阶数以及移动平均阶数下的ARIMA模型,将拟合优度结果中贝叶斯值最小ARIMA模型对应的正向参数的自回归阶数以及移动平均阶数作为判定结果。。

还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于ARIMA模型的食源性疾病发病预测方法所述预测方法的步骤。

还包括一种处理数据的装置,包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述存储器中的计算机程序,以实现一种基于ARIMA模型的食源性疾病发病预测方法所述预测方法的步骤。

与现有技术相比,本发明至少含有以下有益效果:

本发明所述的一种基于ARIMA模型的食源性疾病发病预测方法、装置及介质,通过对历年病例数据进行分步特征提取,基于关键影响因素进行数据的模型适应性处理,从而搭建ARIMA模型,利用模型网络进行食源性疾病的及时有效预测,弥补食源性疾病预防防控在时空方面的不足。

附图说明

图1为一种基于ARIMA模型的食源性疾病发病预测方法的步骤图;

图2为历年病例数据时序图;

图3为经对数转换、不同次数下季节差分和非季节差分后的时序图;

图4为经对数转换、不同阶数下的一般差分和季节差分后的自相关图;

图5为经对数转换、不同阶数下的一般差分和季节差分后的偏自相关图。

具体实施方式

以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。

实施例一

为了弥补食源性疾病预防控制在时空方面考虑的缺失,及早对食源性疾病进行预测防控,如图1所示,本发明提出了一种基于ARIMA模型的食源性疾病发病预测方法,包括如下步骤:

S1:获取食源性疾病的历年病例数据绘制时序图,并根据时序图进行非平稳序列提取;

S2:通过对非平稳序列进行差分处理,获得差分处理后数据的自相关图和偏自相关图;

S3:根据自相关图和偏自相关图筛选构建ARIMA模型所需的影响因子;

S4:根据筛选的影响因子进行构建ARIMA模型双向参数的各项数值获取;

S5:根据双向参数的各项数值进行ARIMA模型的构建并检验;

S6:通过检验通过的ARIMA模型进行食源性疾病的预测分析。

其中,S4步骤中,各项数值获取具体包括如下步骤:

S41:根据筛选的影响因子对时序图进行平稳序列优化下双向参数的差分次数判定;

S42:根据筛选的影响因子对自相关图和偏自相关图进行差分优化下反向参数的自回阶数以及移动平均阶数判定;

S43:根据筛选的影响因子进行基于贝叶斯信息准则约束下正向参数的自回归阶数以及移动平均阶数判定。

首先,根据采集的历年病例数据绘制一张时序图,观察其平稳性和随机性。以一地食源性疾病的实际采集数据为例(如图2所示),可以看出疾病发病人数存在以下特点:1、原始序列不是一个平稳的随机过程;2、序列存在明显的季节性,在每年夏秋季节呈现高峰,在冬春季节呈现低谷;3、序列呈现不明显的波动趋势,整体上升或下降趋势不明显。因此,可以看出影响食源性疾病的的一个重要因素是季节因素。

为了实现对食源性疾病在时间上的分布特征以实现对病情的及早预测和控制,本发明选用ARMIA模型对数据进行处理。但在这之前,需要先构建该模型。从原理上来说,ARIMA模型是将数据通过差分转化为平稳数据,再将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。同时,该模型是以AR模型(自回归)、MA模型(移动平均)和ARMA(自回归移动平均)为基础进行创建的,因此其可以表示为ARIMA(p,d,q)(P,D,Q)

这里,考虑到AR模型在建立时需具有平稳性,因此以AR模型为基础设计的ARIMA模型势必也需要考虑到平稳性问题。而要使数据平稳性得以提高,可以采用数据差分处理的方式,如一阶差分的差值,二阶差分为一阶差分基础上再进行一次差分。

因此,如要获取构建ARIMA模型所需的参数值,本发明利用上述获取的历史病例数据的时序图、自相关图(ACF)以及偏自相关图(PACF),通过对时序图进行自然对数转换,以及不同次数下季节差分和非季节差分下的差分处理(如图3所示),根据获得的方差和均值选取最稳定状态下的季节差分次数D和非季节差分次数d组合作为判定结果。通过对自相关图和偏自相关图进行对数转换,以及不同阶数下的一般差分和季节差分处理(如图4和图5所示),根据差分获得的系数选取幅值波动系数处于预设限值内(信任上下限)的非季节自回阶数p和非季节移动平均阶数q为判定结果。

在获取上述参数的基础上,考虑到季节模型的P和Q一般不大于2,分别取0、1、2,由低阶到高阶逐个试验,建立ARIMA(p,d,q)(P,D,Q)

最后,通过假设检验,对构建的ARIMA模型进行验证。验证成功后的模型即可用于食源性疾病的预测分析。

本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于ARIMA模型的食源性疾病发病预测方法所述预测方法的步骤。

还包括一种处理数据的装置,包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述存储器中的计算机程序,以实现一种基于ARIMA模型的食源性疾病发病预测方法所述预测方法的步骤。

综上所述,本发明所述的一种基于ARIMA模型的食源性疾病发病预测方法、装置及介质,通过对历年病例数据进行分步特征提取,基于关键影响因素进行数据的模型适应处理,从而搭建ARIMA模型,利用模型网络进行食源性疾病的及时有效预测。

需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。

另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

相关技术
  • 基于预测模型的年龄预测方法、装置、服务器及存储介质
  • 一种基于ARIMA模型的网络指标预测方法、装置及存储介质
  • 一种基于ARIMA模型的网络指标预测方法、装置及存储介质
技术分类

06120116484017