掌桥专利:专业的专利平台
掌桥专利
首页

一种连续因果效应的估计方法、装置、设备及存储介质

文献发布时间:2023-06-19 19:30:30


一种连续因果效应的估计方法、装置、设备及存储介质

技术领域

本申请涉及数据分析与挖掘技术领域,尤其涉及一种连续因果效应的估计方法、装置、设备及存储介质。

背景技术

长期以来,人们一方面好奇地追问原因和结果的关系,一方面又苦于这些概念的模糊性,关于因果之间的关系在很长一段时间都仅仅局限在哲学和文学的范围内。随着现代统计学的发展,人们开始使用数学语言精确地描述因果关系,统计学家称之为“因果推断”(causal inference)。具体来说,因果推断研究的是某个干预变量T对于输出Y的影响,一般称之为因果效应。因果效应对于严格的决策以及科学分析是至关重要的,假设正在对病人进行药物治疗,但是无法确定药物剂量对于治疗效果的影响,这里的药物剂量为连续干预,这时,通过因果效应以及对于因果效应的分析,可以确定哪种剂量对病人的治疗效果最好,进而指导用药。由此可见,因果效应的准确估计对科学分析以及决策选择有着重大意义。

发明内容

有鉴于此,本申请实施例提供了一种连续因果效应的估计方法、装置、设备及存储介质,旨在处理连续干预下的因果效应估计问题。

第一方面,本申请实施例提供了一种连续因果效应的估计方法,所述方法包括:

获取待估计数据;

将所述待估计数据输入连续因果效应估计模型,得到结果预测值;

根据所述结果预测值计算连续因果效应。

可选的,所述连续因果效应估计模型通过以下方式得到:

获取样本数据和连续干预变量;

将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据;

将所述表征数据和所述连续干预变量作为加权网络的输入,得到与所述样本数据对应的权重值;

将所述表征数据和所述连续干预变量作为输出预测网络的输入,得到与所述样本数据对应的样本结果预测值;

根据所述样本数据、所述权重值和所述样本结果预测值构建目标函数;

对所述目标函数进行求解,得到神经网络参数值;

根据所述神经网络参数值构建所述连续因果效应估计模型。

可选的,所述表征网络包括输入层、隐藏层和输出层;

所述将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据包括:

所述输入层对所述样本数据进行预处理,得到预处理数据;

所述隐藏层对所述预处理数据进行再处理,得到表征数据;

所述输出层输出所述表征数据。

可选的,所述隐藏层对所述预处理数据进行再处理,得到表征数据包括:

所述隐藏层判断所述预处理数据的数据类型;

根据所述数据类型选择对应的神经网络;

根据所述神经网络对所述预处理数据进行再处理,得到所述表征数据。

可选的,所述对所述目标函数进行求解,得到神经网络参数值包括:

利用梯度下降算法对所述目标函数进行求解,得到所述神经网络参数。

可选的,所述目标函数由所述样本结果预测值的加权误差和基于概率分布距离的积分概率度量的最大值组成。

第二方面,本申请实施例提供了一种连续因果效应的估计装置,所述装置包括:

估计模块,用于获取待估计数据;

预测模块,用于将所述待估计数据输入连续因果效应估计模型,得到结果预测值;

计算模块,用于根据所述结果预测值计算连续因果效应。

可选的,所述连续因果效应估计模型通过以下方式得到:

获取样本数据和连续干预变量;

将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据;

将所述表征数据和所述连续干预变量作为加权网络的输入,得到与所述样本数据对应的权重值;

将所述表征数据和所述连续干预变量作为输出预测网络的输入,得到与所述样本数据对应的样本结果预测值;

根据所述样本数据、所述权重值和所述样本结果预测值构建目标函数;

对所述目标函数进行求解,得到神经网络参数值;

根据所述神经网络参数值构建所述连续因果效应估计模型。

可选的,所述表征网络包括输入层、隐藏层和输出层;

所述将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据包括:

所述输入层对所述样本数据进行预处理,得到预处理数据;

所述隐藏层对所述预处理数据进行再处理,得到表征数据;

所述输出层输出所述表征数据。

可选的,所述隐藏层对所述预处理数据进行再处理,得到表征数据包括:

所述隐藏层判断所述预处理数据的数据类型;

根据所述数据类型选择对应的神经网络;

根据所述神经网络对所述预处理数据进行再处理,得到所述表征数据。

可选的,所述隐藏层对所述预处理数据进行再处理,得到表征数据包括:

所述隐藏层判断所述预处理数据的数据类型;

根据所述数据类型选择对应的神经网络;

根据所述神经网络对所述预处理数据进行再处理,得到所述表征数据。

可选的,所述对所述目标函数进行求解,得到神经网络参数值包括:

利用梯度下降算法对所述目标函数进行求解,得到所述神经网络参数。

可选的,所述目标函数由所述样本结果预测值的加权误差和基于概率分布距离的积分概率度量的最大值组成。

第三方面,本申请实施例提供了一种设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述第一方面中任一项所述的连续因果效应的估计方法。

第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面中任一项所述的连续因果效应的估计方法。

本申请实施例提供了一种连续因果效应的估计方法、装置、设备及存储介质。在执行所述方法时,先获取待估计数据,然后,将所述待估计数据输入连续因果效应估计模型,得到结果预测值,最后,根据所述结果预测值计算连续因果效应,完成连续因果效应的估计。通过上述方法,能够处理大量的数据信息,并且基于连续因果效应估计模型能够处理连续干预下的因果效应估计问题,更加符合实际应用中遇到的问题,能够有效估计出连续干预变量对输出结果的影响,为数据分析提供帮助。

附图说明

为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种连续因果效应的估计方法的流程图;

图2为本申请实施例提供的一种连续因果效应估计模型训练过程的示意图;

图3为本申请实施例提供的一种连续因果效应的估计装置300的结构示意图。

具体实施方式

目前,人们对于因果效应估计展开了相关研究。但目前的因果效应估计存在很大的局限,仅针对干预变量属于离散变量的情况,例如是否接收某种药物,即二元干预,无法解决干预变量属于连续变量的情况,例如无法处理接收药物剂量对治疗结果的影响。并且,目前的因果效应估计算法往往使用逻辑回归这类传统算法,数据量过大时,计算结果的准确度会大打折扣。

针对上述问题,本申请实施例提供了一种连续因果效应的估计方法、装置、设备及存储介质。在执行所述方法时,先获取待估计数据,然后,将所述待估计数据输入连续因果效应估计模型,得到结果预测值,最后,根据所述结果预测值计算连续因果效应,完成连续因果效应的估计。通过上述方法,能够处理大量的数据信息,并且基于连续因果效应估计模型能够处理连续干预下的因果效应估计问题,更加符合实际应用中遇到的问题,能够有效估计出连续干预变量对输出结果的影响,为数据分析提供帮助。

显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

参见图1,图1为本申请实施例提供的一种连续因果效应的估计方法的流程图,包括:

S101:获取待估计数据。

待估计数据为连续因果效应估计中的协变量。例如,在对病人采用某种药物治疗高血压时,病人的相关特征即为协变量,如年龄、性别、身高、体重、血糖和家族遗传。

S102:将所述待估计数据输入连续因果效应估计模型,得到结果预测值。

连续因果效应估计模型为深度神经网络模型,具体的训练过程参见下文,此处不做赘述。将待估计数据输入连续因果效应估计模型中,即可得到对应的结果预测值。承接上文示例,在该过程中,接受药物的剂量为连续干预变量,利用连续因果效应估计模型能够得到不同剂量下的治疗效果,即血压降低的数值。

S103:根据所述结果预测值计算连续因果效应。

根据连续因果效应估计模型输出的结果预测值,能够计算出连续因果效应。

具体的,本申请实施例对计算方式不作限定,优选的,可以通过以下公式计算:

其中,

本申请实施例提供了一种连续因果效应的估计方法。先获取待估计数据,然后,将所述待估计数据输入连续因果效应估计模型,得到结果预测值,最后,根据所述结果预测值计算连续因果效应,完成连续因果效应的估计。通过上述方法,能够处理大量的数据信息,并且基于连续因果效应估计模型能够处理连续干预下的因果效应估计问题,更加符合实际应用中遇到的问题,能够有效估计出连续干预变量对输出结果的影响,为数据分析提供帮助。

下面,将详细介绍上述实施例中连续因果效应估计模型的训练过程。

参见图2,图2为本申请实施例提供的一种连续因果效应估计模型训练过程的示意图。

作为一种优选的实施例,连续因果效应估计模型通过以下方式得到:

步骤1:获取样本数据和连续干预变量。

样本数据可以从开源数据库中获得。作为一种示例,从医院的病历数据库中获取关于某种治疗高血压药物的相关治疗数据,从治疗数据中筛选出接受不同药物剂量治疗的病人的相关数据,其中,病人的特征数据即为样本数据,属于协变量,包括年龄、性别、体重、身高、血糖和家族遗传,接受药物的剂量即为连续干预变量。

步骤2:将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据。

将样本数据作为表征网络的输入,其中,表征网络包括输入层、隐藏层和输出层。当将样本数据输入表征网络后,输入层对样本数据进行预处理,如格式统一、数据清洗和数据筛选,得到预处理数据。然后,隐藏层对预处理数据进行再处理,得到表征数据,具体的,隐藏层判断预处理数据的数据类型,并根据数据类型选择对应的神经网络,进而利用对应的神经网络对预处理数据进行再处理,如:当预处理数据为图片数据时,选择卷积神经网络对预处理数据进行再处理;当预处理数据为文本数据时,选择循环神经网络对预处理数据进行再处理;当预处理数据为数值型数据时,选择多层感知神经网络。最后,由输出层输出表征数据。

步骤3:将所述表征数据和所述连续干预变量作为加权网络的输入,得到与所述样本数据对应的权重值。

将表征网络输出的表征数据和连续干预变量输入加权网络,得到权重值。通过加权网络对表征数据进行加权处理,能够平衡接受不同连续干预变量的群体的概率分布,缓解选择偏差问题。

步骤4:将所述表征数据和所述连续干预变量作为输出预测网络的输入,得到与所述样本数据对应的样本结果预测值。

将表征网络输出的表征数据和连续干预变量输入输出预测网络,得到样本结果预测值。通过输出预测网络能够预测出结果,如上文实施例中的接受某剂量药物后血压降低的数值。

步骤5:根据所述样本数据、所述权重值和所述样本结果预测值构建目标函数。

通过样本数据、权重值和样本结果预测值构建目标函数,其中,目标函数由样本结果预测值的加权误差和基于概率分布距离的积分概率度量的最大值组成。具体地,目标函数为:

其中,

具体地,积分概率度量可以使用最大均值差异进行计算:

和/>

步骤6:对所述目标函数进行求解,得到神经网络参数值。

在构建目标函数后,对该目标函数进行求解,得到神经网络参数值,具体地,可以利用梯度下降算法对目标函数进行优化求解,得到神经网络参数值。

步骤7:根据所述神经网络参数值构建所述连续因果效应估计模型。

最后,在求得神经网络参数值后,即可根据神经网络参数值构建模型,得到用于估计连续因果效应的连续因果效应模型。

本申请实施例提供了一种连续因果效应模型的训练方法,获取样本数据和连续干预变量后,先利用表征网络对样本数据进行处理,得到表征数据,然后将表征数据和连续干预变量作为加权网络以及输出预测网络的输入,得到权重值以及样本结果预测值,进而根据样本数据、权重值和样本结果预测值构建目标函数,并对目标函数求解得到神经网络参数值,最后根据神经网络参数值构建连续因果效应估计模型。通过上述方法得到的连续因果效应估计模型,能够处理大量数据信息,处理连续干预下的因果效应估计问题,更加符合实际应用中遇到的问题;并且基于神经网络参数构建模型,提高了模型输出结果的准确度,能够更好地对连续因果效应进行估计,还可以避免连续干预下的选择偏差问题,使估计结果更加准确。

以上为本申请实施例提供的一种连续因果效应的估计方法的一些具体实现方式,基于此,本申请还提供了对应的装置。下面将从功能模块化的角度对本申请实施例提供的装置进行介绍。

参见图3,图3为本申请实施例提供的一种连续因果效应的估计装置300的结构示意图,该装置300包括估计模块301、预测模块302和计算模块303。

估计模块301,用于获取待估计数据。

预测模块302,用于将所述待估计数据输入连续因果效应估计模型,得到结果预测值。

计算模块303,用于根据所述结果预测值计算连续因果效应。

作为本申请提供的一种可行的实现方式,所述连续因果效应估计模型通过以下方式得到:

获取样本数据和连续干预变量;

将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据;

将所述表征数据和所述连续干预变量作为加权网络的输入,得到与所述样本数据对应的权重值;

将所述表征数据和所述连续干预变量作为输出预测网络的输入,得到与所述样本数据对应的样本结果预测值;

根据所述样本数据、所述权重值和所述样本结果预测值构建目标函数;

对所述目标函数进行求解,得到神经网络参数值;

根据所述神经网络参数值构建所述连续因果效应估计模型。

作为本申请提供的一种可行的实现方式,所述表征网络包括输入层、隐藏层和输出层;

所述将所述样本数据作为表征网络的输入,利用所述表征网络对所述样本数据进行处理,得到表征数据包括:

所述输入层对所述样本数据进行预处理,得到预处理数据;

所述隐藏层对所述预处理数据进行再处理,得到表征数据;

所述输出层输出所述表征数据。

作为本申请提供的一种可行的实现方式,所述隐藏层对所述预处理数据进行再处理,得到表征数据包括:

所述隐藏层判断所述预处理数据的数据类型;

根据所述数据类型选择对应的神经网络;

根据所述神经网络对所述预处理数据进行再处理,得到所述表征数据。

作为本申请提供的一种可行的实现方式,所述对所述目标函数进行求解,得到神经网络参数值包括:

利用梯度下降算法对所述目标函数进行求解,得到所述神经网络参数。

作为本申请提供的一种可行的实现方式,所述目标函数由所述样本结果预测值的加权误差和基于概率分布距离的积分概率度量的最大值组成。

本申请实施例提供了一种连续因果效应的估计装置。先获取待估计数据,然后,将所述待估计数据输入连续因果效应估计模型,得到结果预测值,最后,根据所述结果预测值计算连续因果效应,完成连续因果效应的估计。通过上述方法,能够处理大量的数据信息,并且基于连续因果效应估计模型能够处理连续干预下的因果效应估计问题,更加符合实际应用中遇到的问题,能够有效估计出连续干预变量对输出结果的影响,为数据分析提供帮助。

本申请实施例还提供了对应的设备以及计算机存储介质,用于实现本申请实施例提供的方案。

其中,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行本申请任一实施例所述的连续因果效应的估计方法。

所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现本申请任一实施例所述的连续因果效应的估计方法。

本申请实施例中提到的“第一”“第二”(若存在)等名称中的“第一”“第二”只是用来作名字标识,并不代表顺序上的第一、第二。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述仅是本申请示例性的实施方式,并非用于限定本申请的保护范围。

技术分类

06120115931850