掌桥专利:专业的专利平台
掌桥专利
首页

模型训练方法、感染人数预测方法、介质及设备

文献发布时间:2023-06-19 19:30:30


模型训练方法、感染人数预测方法、介质及设备

技术领域

本公开涉及人工智能技术领域,具体而言,涉及一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备。

背景技术

当某一地区发生传染病时,准确地预测传染病的感染人数对于控制传染病具有重要意义。比如通过预测感染人数,便于提前做好疾病预防和医疗救助措施,从而减缓或阻止疾病的传播。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开提供一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于感染人数预测模型的预测性能较差而导致感染人数预测的准确性较低的问题。

根据本公开的第一方面,提供一种模型训练方法,包括:

获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;

根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;

利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。

在本公开的一种示例性实施例中,获取目标传染病的第一特征数据之前,所述方法还包括:

获取所述目标传染病的原始特征数据,所述原始特征数据包括所述目标传染病的多个影响因素和所述感染人数;

基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合。

在本公开的一种示例性实施例中,所述多个影响因素集合至少包括第一影响因素集合和第二影响因素集合;

所述基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合,包括:

构造第一空集和第二空集;

轮询各所述影响因素,计算各所述影响因素、所述感染人数、所述第一空集和所述第二空集之间的关联性;

确定所述关联性满足预设关联条件的目标影响因素,并根据所述目标影响因素更新所述第一空集和所述第二空集,得到所述第一影响因素集合和所述第二影响因素集合。

在本公开的一种示例性实施例中,所述根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型,包括:

根据各所述影响因素集合和所述感染人数之间的对应关系得到各所述影响因素集合对应的标注数据和非标注数据;

根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布;

根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布;

对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。

在本公开的一种示例性实施例中,所述根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布,包括:

向量化所述标注数据中的各所述影响因素,得到多个影响因素向量;

利用预设的网络模型对任意两个所述影响因素向量进行计算,得到所述标注数据对应的协方差矩阵;

根据预设的均值向量和所述协方差矩阵确定所述第一高斯分布。

在本公开的一种示例性实施例中,所述利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型,包括:

根据所述多个影响因素集合和所述感染人数之间的对应关系得到所述多个影响因素集合对应的标注数据和非标注数据;

获取所述标注数据对应的感染人数分布和所述非标注数据对应的方差;

根据所述感染人数分布和所述方差构建目标函数;

基于所述目标函数,利用梯度下降算法对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,得到所述非标注数据上方差最小的各所述感染人数预测模型。

在本公开的一种示例性实施例中,得到非标注数据上方差最小的各所述感染人数预测模型之后,所述方法还包括:

将所述非标注数据输入各所述感染人数预测模型中,得到多个预测值集合;

利用各所述预测值集合中出现概率大于预设概率阈值的所述预测值更新各所述感染人数预测模型的训练数据集;

利用更新后的所述训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各所述感染人数预测模型的训练。

根据本公开的第二方面,提供一种感染人数预测方法,包括:

获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;

将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。

在本公开的一种示例性实施例中,所述将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数,包括:

将所述多个影响因素集合输入训练好的各所述感染人数预测模型中,得到所述多个影响因素集合对应的感染人数分布的多个均值参数;

对各所述均值参数进行加权求和得到所述目标时间段内的感染人数。

在本公开的一种示例性实施例中,确定所述目标时间段内的感染人数之后,所述方法还包括:

将所述目标时间段内的感染人数的预测结果输出至终端设备。

根据本公开的第三方面,提供一种模型训练装置,包括:

数据获取模块,用于获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;

模型构建模块,用于根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;

模型训练模块,用于利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。

根据本公开的第四方面,提供一种感染人数预测装置,包括:

数据获取模块,用于获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;

人数预测模块,用于将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。

根据本公开的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理单元执行时实现上述任意一项所述的方法。

根据本公开的第六方面,提供一种电子设备,包括:处理单元;显示单元;以及存储单元,用于存储所述处理单元的可执行指令;其中,所述处理单元配置为经由执行所述可执行指令来执行上述任意一项所述的方法;所述显示单元用于显示执行上述任意一项所述的方法后生成的密文。

本公开示例性实施例可以具有以下部分或全部有益效果:

在本公开示例实施方式所提供的模型训练方法中,通过获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。本公开通过未标注数据来训练和选择方差最小的感染人数预测模型,可以减少训练模型所需标注数据量,提高模型的泛化能力,从而提高模型的预测性能。进一步的,使用训练好的各个感染人数预测模型预测传染病的感染人数时,可以提升感染人数预测的准确性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1示出了可以应用本公开实施例中的模型训练方法和感染人数预测方法的系统架构图;

图2示出了本公开实施例中一种模型训练方法的流程图;

图3示出了本公开实施例中一种构建感染人数预测模型的流程图;

图4示出了本公开实施例中另一种模型训练方法的流程图;

图5示出了本公开实施例中又一种模型训练方法的流程图;

图6示出了本公开实施例中一种模型训练装置的框图;

图7示出了本公开实施例中一种感染人数预测装置的框图;

图8示出了适于用来实现本公开实施例的电子设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1示出了可以应用本公开实施例的一种模型训练方法、感染人数预测方法的系统架构图。

如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。例如,服务器105可以是一个服务器,也可以是多个服务器组成的服务器集群,还可以是云计算平台或者虚拟化中心。

本公开实施例所提供的模型训练方法和感染人数预测方法一般由服务器105执行,相应地,模型训练装置和感染人数预测装置一般设置于服务器105中,服务器可以将感染人数的预测结果发送至终端设备,并由终端设备向用户进行展示。但本领域技术人员容易理解的是,本公开实施例所提供的模型训练方法和感染人数预测方法也可以由终端设备101、102、103中的一个或多个执行,相应的,模型训练装置和感染人数预测装置也可以设置于终端设备101、102、103中,例如,由终端设备执行后可以将感染人数的预测结果直接显示在终端设备的显示屏上,本示例性实施例中对此不做特殊限定。

以下对本公开实施例的技术方案进行详细阐述:

在本公开示例实施方式中,可以以登革热疾病的感染人数预测为例进行说明。登革热疾病是一种蚊媒病毒病,该疾病的传播速度很快,且受降雨量、温度等因素的影响。目前,对登革热疾病没有特异治疗办法,但及早发现和适宜的医疗救助可以降低死亡率。因此,准确地预测登革热的感染人数,并提前做好疾病预防和医疗救助措施有助于控制登革热疾病。需要说明的是,本公开示例中的模型训练方法和感染人数预测方法所适用的疾病类型包括但不限于登革热疾病,还可以是其他传染病,对此本公开不做具体限定。

基于上述一个或多个问题,本示例实施方式提供了一种模型训练方法,利用训练好的感染人数预测模型可以准确地预测登革热疾病的感染人数。参考图2所示,该模型训练方法可以包括以下步骤S210至步骤S230:

步骤S210.获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;

步骤S220.基于各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;

步骤S230.利用由所述多个影响因素集合和所述感染人数组成的非标注数据对各所述感染人数预测模型进行训练,得到方差最小的各所述感染人数预测模型。

在本公开示例实施方式所提供的模型训练方法中,通过获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。本公开通过未标注数据来训练和选择方差最小的感染人数预测模型,可以减少训练模型所需标注数据量,提高模型的泛化能力,从而提高模型的预测性能。进一步的,使用训练好的各个感染人数预测模型预测传染病的感染人数时,可以提升感染人数预测的准确性。

下面,对于本示例实施方式的上述步骤进行更加详细的说明。

在步骤S210中,获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数。

本公开示例实施方式中,可以先获取目标传染病的原始特征数据,目标传染病的原始特征数据可以包括某一时间段内该传染病的多个影响因素和感染人数,记为(a

以目标传染病为登革热疾病为例,登革热疾病主要与所在地区的降雨量、温度、植被指数等影响因素相关。示例性的,与降雨量相关的影响因素可以包括平均相对湿度、平均比湿度、气象站测量的总降水量、卫星测量的总降水量、气候预测系统再分析的总降水量等;与温度相关的影响因素可以包括最高温度、平均温度、最低温度、日气温范围、平均露点温度等;与植被指数相关的影响因素可以包括城市中心东南的植被指数、城市中心西南的植被指数、城市中心东北的植被指数、城市中心西北的植被指数等。

例如,可以获取某一地区最近半年的登革热疾病的原始特征数据,并统计最近半年内该地区每周的最高温度、平均温度、最低温度、气象站测量的总降水量、日气温范围、卫星测量的总降水量、平均露点温度、气候预测系统再分析的总降水量、平均气温、平均相对湿度、平均比湿度以及该地区每周的感染人数。

获取目标传染病的多个影响因素后,可以对多个影响因素进行特征选择,得到多个影响因素集合。本公开示例实施方式中以从多个影响因素中选择两组特征为例进行说明,即得到两个影响因素集合。其中,进行特征选择时,需要满足两个影响因素集合之间的关联性最小,且各影响因素集合和感染人数的关联性最大。

示例性的,对于第一影响因素集合A和第二影响因素集合B,有

c(A,B,T)=corr(A,T)+corr(B,T)-corr(A,B) (1)

其中,T表示感染人数,为多个时间段的感染人数组成的集合,corr()表示相关度,如corr(A,T)表示第一影响因素集合A和感染人数T之间的相关度,用于表征二者之间的关联性大小。可以看出,当目标函数c(A,B,T)最大时,对应的有corr(A,T)和corr(B,T)最大,corr(A,B)最小。

进一步的,可以根据公式(2)计算相关度,以计算corr(A,T)为例:

其中,|A|和|T|分别表示第一影响因素集合A和感染人数T中包含的元素个数,N为元素总个数。在公式(2)中,当第一影响因素集合A为空集或感染人数T为空集时,二者的相关度为0;当第一影响因素集合A和感染人数T均不是空集时,可以利用协方差相关系数来计算二者的相关度。

一种示例实施方式中,可以采用启发式搜索方式来确定第一影响因素集合A和第二影响因素集合B。示例性的,针对第一影响因素集合A和第二影响因素集合B,可以对应的构造两个空集,即第一空集A

示例性的,若原始特征数据中包含n个影响因素,构成影响因素集合为F,有第一空集A

确定集合A

对于集合F中剩余的n-2个影响因素,重复执行类似于确定影响因素为

该示例中,从原始特征数据中选择多组特征,其中各组特征与感染人数关联性最大且各组特征之间的关联性最小。可以看出,后续可以单独利用各组特征和感染人数进行感染人数预测模型训练,也可以使用多组特征和感染人数实现感染人数预测模型的协同训练,以提升模型的预测性能。

在步骤S220中,根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型。

本公开示例实施方式中,可以采用高斯过程预测感染人数。假设N个时间段{t

示例性的,参考图3所示,可以根据步骤S310至步骤S340构建感染人数预测模型。

在步骤S310中,可以根据各影响因素集合和感染人数之间的对应关系得到各影响因素集合对应的标注数据和非标注数据。

对原始特征数据进行特征选择得到多个影响因素集合,如第一影响因素集合A和第二影响因素集合B。例如,可以获取某一地区最近半年内每周的影响因素x

对于标注数据{(x

在步骤S320中,根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布。

可以理解的是,给定一系列标注数据{(x

其中,Y~N(μ(X),K(X,X)),f~N(μ(X

μ

k

类似的,对于第一影响因素集合A对应的标注数据为{(A

示例性的,可以向量化标注数据中的各影响因素,得到多个影响因素向量,利用预设的网络模型对任意两个影响因素向量进行计算,得到标注数据对应的协方差矩阵,以根据预设的均值向量和协方差矩阵确定第一高斯分布。以确定第一高斯分布Y

K(a

其中,f为激活函数,如可以为relu()、sigmoid()、softplus()等激活函数,本公开对此不做限定。W

举例而言,可以对a

v

v

K(a

其中,W

在步骤S330中,根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布。

类似的,对于第一影响因素集合A对应的非标注数据为{(A

在步骤S340中,对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。

基于公式(3)-公式(5),示例性的,对于第一影响因素集合A,其中的非标注数据满足第一高斯分布Y

该示例中,根据相关性较小的多组特征构建了多个感染人数预测模型,便于后续利用多个感染人数预测模型进行协同训练,以不断提升感染人数预测模型的预测性能,进而提高感染人数预测的准确性。

在步骤S230中,利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。

可以理解的是,计算均方差矩阵是涉及到的网络模型的模型参数均需要通过大量数据进行学习来获得。本公开示例实施方式中,对各个感染人数预测模型进行训练意味着对各个感染人数预测模型中涉及的网络模型进行训练。在感染人数预测模型的训练过程中利用大量未标注数据进行半监督训练,以减少模型对标注数据的需求量,从而进一步提高模型的预测性能。

示例性的,可以根据多个影响因素集合和感染人数之间的对应关系得到多个影响因素集合对应的标注数据和非标注数据。例如,得到标注数据{(x

其中,(x

公式(10)中的p(y

p(y

其中,u

μ

K

公式(10)中的var(x

var(x

结合公式(11)和(14),目标函数T又可以写为:

得到目标函数后,可以基于该目标函数,利用梯度下降算法对各感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,得到非标注数据上方差最小的各感染人数预测模型。具体地,根据该目标函数更新各感染人数预测模型的过程中,可以通过梯度下降法,根据反向传播原理,不断计算该目标函数,并根据该目标函数更新模型参数,如θ={W

其中,μ

T对μ

由公式(16)-(18)得到目标函数T对于模型参数θ的梯度,并通过反向传播学习模型参数θ。当满足迭代终止条件时,如当目标函数的值最大时,即在非标注数据上的方差最小时,完成对感染人数预测模型的训练。其它示例中,也可以通过反向迭代式更新模型参数,当满足预设的迭代次数时,完成对所有模型参数的训练。迭代完成后,可以得到优化后的模型参数。

该示例中,利用未标注数据来训练和选择方差最小的感染人数预测模型,可以减少训练模型所需标注数据量,提高模型的泛化能力,从而提高模型的预测性能。

得到训练好的各感染人数预测模型如G

一种示例实施方式中,得到非标注数据上方差最小的各感染人数预测模型之后,还可以对各感染人数预测模型进行协同训练,以进一步提升模型的预测性能。参考图4所示,可以根据步骤S410至步骤S430对对各感染人数预测模型进行协同训练。

在步骤S410中,将所述非标注数据输入各所述感染人数预测模型中,得到多个预测值集合。

示例性的,给定非标注数据{(x

在步骤S420中,利用各所述预测值集合中出现概率大于预设概率阈值的所述预测值更新各所述感染人数预测模型的训练数据集。

可以从两个预测值集合中分别选取出现概率p大于概率阈值γ的预测值,并由各预测值和与各预测值对应的输入数据组成新的标注数据,对应的,可以得到两个集合S

在步骤S430中,利用更新后的所述训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各所述感染人数预测模型的训练。

更新两个感染人数预测模型的训练数据集后,可以利用更新后的训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各感染人数预测模型的训练。

示例性的,可以通过最大似然概率分别对G

可以理解的是,当训练G

该示例中,利用未标注数据和多个感染人数预测模型进行协同训练,可以使得模型学习到更多的特征,进一步提高模型的学习性能,从而提高模型的预测性能。

在本公开示例实施方式所提供的模型训练方法中,通过获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。本公开通过未标注数据来训练和选择方差最小的感染人数预测模型,可以减少训练模型所需标注数据量,提高模型的泛化能力,从而提高模型的预测性能。进一步的,使用训练好的各个感染人数预测模型预测传染病的感染人数时,可以提升感染人数预测的准确性。

本公开示例实施方式还提供了一种感染人数预测方法,该方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图5所示,该感染人数预测方法可以包括以下步骤S510和步骤S520:

步骤S510.获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;

步骤S520.将所述多个影响因素集合输入训练好的多个感染人数预测模型中,并根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。

下面,对于本公开示例实施方式的上述步骤进行更加详细的说明。

在步骤S510中,获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合。

本公开示例实施方式中,目标传染病的第二特征数据可以包括目标时间段内该传染病的多个影响因素集合,目标时间段可以是未来一周或未来一个月,也可以是感染人数未知的任意一个时间段,本公开对此不做限定。例如,可以获取某地区第i周的登革热疾病的两个影响因素集合,记为(A

在步骤S520中,将所述多个影响因素集合输入训练好的多个感染人数预测模型中,并根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。

获取目标时间段内目标传染病的多个影响因素集合后,可以将多个影响因素集合输入训练好的各感染人数预测模型中,得到多个影响因素集合对应的感染人数分布的多个均值参数,并对各均值参数进行加权求和得到目标时间段内的感染人数。示例性的,可以通过λG

需要说明的是,当各感染人数预测模型训练完成后,其中各个模型的模型参数θ已经通过学习获得,进而可以根据模型参数θ计算得到感染人数分布logq(y

在确定了目标时间段内的感染人数后,可以由服务器发送给终端设备进行展示,用户可以根据终端设备展示的感染人数采取相应的预防措施。

在本公开示例实施方式所提供的感染人数预测中,通过获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;将所述多个影响因素集合输入训练好的多个感染人数预测模型中,并根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。本公开的感染人数预测模型能够充分捕获影响因素之间的相关性,使用训练好的感染人数预测模型预测传染病的感染人数时,可以提升感染人数预测的准确性。

应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

进一步的,本示例实施方式中,还提供了一种模型训练装置。该装置可以应用于一服务器或终端设备。参考图6所示,该模型训练装置600可以包括数据获取模块610、模型构建模块620以及模型训练模块630,其中:

数据获取模块610,用于获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;

模型构建模块620,用于根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;

模型训练模块630,用于利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。

在一种可选的实施方式中,模型训练装置600还包括:

原始数据获取模块,用于获取所述目标传染病的原始特征数据,所述原始特征数据包括所述目标传染病的多个影响因素和所述感染人数;

特征选择模块,用于基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合。

在一种可选的实施方式中,所述多个影响因素集合至少包括第一影响因素集合和第二影响因素集合;特征选择模块包括:

集合构造单元,用于构造第一空集和第二空集;

关联计算单元,用于轮询各所述影响因素,计算各所述影响因素、所述感染人数、所述第一空集和所述第二空集之间的关联性;

集合确定单元,用于确定所述关联性满足预设关联条件的目标影响因素,并根据所述目标影响因素更新所述第一空集和所述第二空集,得到所述第一影响因素集合和所述第二影响因素集合。

在一种可选的实施方式中,模型构建模块620包括:

数据获取模块,用于根据各所述影响因素集合和所述感染人数之间的对应关系得到各所述影响因素集合对应的标注数据和非标注数据;

第一分布确定模块,用于根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布;

第二分布确定模块,用于根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布;

预测模型构建模块,用于对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。

在一种可选的实施方式中,第一分布确定模块包括:

向量化单元,用于向量化所述标注数据中的各所述影响因素,得到多个影响因素向量;

参数计算单元,用于利用预设的网络模型对任意两个所述影响因素向量进行计算,得到所述标注数据对应的协方差矩阵;

分布确定单元,用于根据预设的均值向量和所述协方差矩阵确定所述第一高斯分布。

在一种可选的实施方式中,模型训练模块630包括:

第一数据获取子模块,用于根据所述多个影响因素集合和所述感染人数之间的对应关系得到所述多个影响因素集合对应的标注数据和非标注数据;

第二数据获取子模块,用于获取所述标注数据对应的感染人数分布和所述非标注数据对应的方差;

目标函数构建子模块,用于根据所述感染人数分布和所述方差构建目标函数;

模型训练子模块,用于基于所述目标函数,利用梯度下降算法对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,得到所述非标注数据上方差最小的各所述感染人数预测模型。

在一种可选的实施方式中,模型训练装置600还包括协同训练模块,所述协同训练模块被配置为用于将所述非标注数据输入各所述感染人数预测模型中,得到多个预测值集合;利用各所述预测值集合中出现概率大于预设概率阈值的所述预测值更新各所述感染人数预测模型的训练数据集;利用更新后的所述训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各所述感染人数预测模型的训练。

上述模型训练装置中各模块的具体细节已经在对应的模型训练方法中进行了详细的描述,因此此处不再赘述。

进一步的,本示例实施方式中,还提供了一种感染人数预测装置。该装置可以应用于一服务器或终端设备。参考图7所示,该感染人数预测装置700可以包括数据获取模块710和人数预测模块720,其中:

数据获取模块710,用于获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;

人数预测模块720,用于将所述多个影响因素集合输入训练好的多个感染人数预测模型中,并根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。

在一种可选的实施方式中,人数预测模块720包括:

均值参数计算模块,用于将所述多个影响因素集合输入训练好的各所述感染人数预测模型中,得到所述多个影响因素集合对应的感染人数分布的多个均值参数;

感染人数确定模块,用于对各所述均值参数进行加权求和得到所述目标时间段内的感染人数。

在一种可选的实施方式中,确定所述目标时间段内的感染人数之后,感染人数预测装置700还包括输出模块,所述输出模块被配置为用于将所述目标时间段内的感染人数的预测结果输出至终端设备。

上述感染人数预测装置中各模块的具体细节已经在对应的感染人数预测方法中进行了详细的描述,因此此处不再赘述。

上述装置中各模块可以是通用处理器,包括:中央处理器、网络处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。各模块也可以由软件、固件等形式来实现。上述装置中的各处理器可以是独立的处理器,也可以集成在一起。

本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。该程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本公开的示例性实施方式还提供了一种能够实现上述方法的电子设备。下面参照图8来描述根据本公开的这种示例性实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来任何限制。

如图8所示,电子设备800可以以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:至少一个处理单元810、至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830和显示单元840。

存储单元820存储有程序代码,程序代码可以被处理单元810执行,使得处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元810可以执行图2至图5中任意一个或多个方法步骤。

存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(J/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图8中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAJD系统、磁带驱动器以及数据备份存储系统等。

在一些实施例中,可以由电子设备的处理单元810执行本公开中所述的模型训练方法和感染人数预测方法。在一些实施例中,可以通过输入接口850输入目标传染病的第一特征数据和第二特征数据等。例如,通过电子设备的用户交互界面输入某一时间段内目标传染病的多个影响因素和感染人数等。在一些实施例中,可以通过输出接口850将部分/全部训练参数、部分/全部中间结果或最终结果输出。例如,将感染人数的预测结果输出至外部设备900以供用户查看。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施方式的方法。

此外,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

技术分类

06120115930388