掌桥专利:专业的专利平台
掌桥专利
首页

一种基于生成因果解释模型的城市数据预测方法

文献发布时间:2024-04-18 19:52:40


一种基于生成因果解释模型的城市数据预测方法

技术领域

本发明属于城市数据的预测或优化技术领域,涉及城市复杂系统中时空数据的挖掘和预测,具体为一种基于生成因果解释模型的城市数据预测方法。

背景技术

复杂系统一般指非线性复杂系统,(The Nonlinearand complex system)是指具有高阶次、多回路和非线性信息反馈结构的系统。在自然界中存在非常多的复杂系统,例如生物、生态系统,动植物本身及其赖以生存的环境等。

非线性复杂系统中的反馈回路形成相互联系相互制约的结构。其反馈回路描述了关键变量与其周围其他变量的关系,其决策导致行动,行动改变系统周围的状态,并产生新的信息—未来新决策的依据,如此循环作用形成反馈回路。

对于复杂系统而言,从可观测的时空数据中探索隐式的演化动力学过程是理解、预测、控制自然界中复杂系统的重要手段,广泛应用于电力、交通时空序列预测、异常数据检测、视频分析等多个重要领域。

例如,城市级电力时空数据是城市复杂系统的一种表现形式,反映了城市用电现象的演化规律和动力学过程。城市级复杂系统可以表示为一个复杂图网络,其中空间节点表示为城市中某个区域,节点属性表示为区域随时间演化的可观测时间序列,节点之间的连接表示区域间的相互作用或交互关系。复杂系统在宏观层面上的可观测现象由中观区域间的相互作用涌现而出。为了探索并预测城市级复杂系统内部的动力学过程,大多数方法在中观层面学习区域间隐式的图网络结构,或建立区域内复杂的注意力机制以捕获的长时期时空相关性。然而,中观层面的时空数据是基于区域间的相关性在多种因素的混合影响下产生的观测结果,易受外部环境和系统噪声的干扰,从而掩盖了区域本身的特点。受中观层面自身的局限性,大多数方法停滞于研究区域间显式的相关关系,而忽略了影响区域观测生成原理的隐式因果关系,这不利于真实场景的推广和应用。

相比之下,因果关系被认为是刻画观测现象生成规则的基本公理,在机器学习的背景下,正确地建模和推断因果变量和因果机制可以诱导出更稳健的特征表示,这有助于解释观测数据的生成原理。因而,采用生成因果解释模型对城市级复杂系统进行建模并进而利用其对城市电力时空数据进行预测是一种很好的解决思路。本发明将这种因果隐变量定义为在微观层面上各区域内的因果描述子,其主导了复杂系统的发展趋势、演化行为和物理状态。中观区域层面的可观测数据是由区域内部的微观因果描述子,通过复杂非线性的时空混合生成的表象。通过建模并推断区域内微观的因果描述子及其因果机制,有助于解释系统的观测数据和现象。

现有的因果发现方法过度关注与节点内部因果关系,而忽略了节点间的因果交互。城市复杂系统的动力学过程不仅来自于单个区域内部的因果关系,更体现在区域间因果描述子的动态交互,这使得因果描述子间存在复杂且非线性的时空转移过程。然而,仅通过中观层面的区域相关性无法分析数据生成的影响因子,因此难以将混合的观测数据以因果描述子的方式分解为有意义的物理变量。此外,区域属性作为系统的外生变量,可能随时间动态变化,也导致非平稳的时空观测序列。

发明内容

针对现有技术的问题,本发明提供了一种基于生成因果解释模型的城市数据预测方法。本发明基于表征学习的思想,在时空维度上探索微观因果描述子的潜在因果结构和因果机制,从而揭示城市复杂系统观测数据的生成原理。为此,本发明提出一种生成因果解释模型(Generative Causal Interpretation Model,GCIM)来建模城市复杂系统的观测生成过程,该模型由外生变量、时空条件父变量、受控因果转移函数、时空混合函数四部分组成。城市复杂系统中各区域内的因果描述子在空间维度上具有高度复杂性,且动力学演化过程在外生变量影响下呈现非平稳性,因此从观测数据中推断出潜在的因果结构和因果机制十分具有挑战性。本发明在生成因果解释模型GCIM的基础上提出一种学习框架,目的是从观测数据中推断出模型的因果隐变量(外生变量,因果描述子,时空条件父变量)并拟合相应函数(受控因果转移函数、时空混合函数),并基于估计模型预测城市级时空数据。该学习框架的核心思想是时空维度上因果描述子之间的相互作用(因果结构)和转移过程(因果机制)具有全局稳定性,在适当条件下建模具有可识别性。

本发明完整的技术方案包括:

一种基于生成因果解释模型的城市数据预测方法,所述生成因果解释模型包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数,所述外生变量为由外部状态决定的变量,所述时空混合函数用以从所观测的城市数据中确定因果描述子,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量,所述时空条件父变量为在可学习因果图中,所有与因果描述子有直接连接的变量集合,所述受控因果转移函数用以确定因果描述子的因果传播方式;所述城市数据预测方法具体包括如下步骤:

(1)收集城市进行数据预测区域的时空数据,将数据量化并得到各区域分时段数据集;

(2)采用变分自编解码器中的编码器对步骤(1)中的各区域分时段数据集进行拟合得到时空混合函数并确定因果描述子;具体包括:

其中,

通过上述方式,在编码阶段,从t时刻各个区域的观测数据

(3)采用域适配器从步骤(1)中的各区域分时段数据集中确定域信息集合,并在域信息集合的基础上确定外生变量分布;具体方式为:

其中

MLP是多层感知机,

在域信息的基础上,得到外生变量的分布

其中,

(4)采用多层感知机将时空条件父变量转化为受控因果转移函数的条件参数;具体包括:

表示对因果描述子/>

为受控因果转移函数的条件参数;/>

并使用可逆的神经样条流网络拟合受控因果转换函数

(5)根据步骤(4)构建的生成因果解释模型,采用当前区域下一时刻的外生变量,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数,将外生变量映射到当前区域下一时刻的因果描述子;利用变分自编解码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据,完成对城市数据的预测。

进一步的,所述城市数据为电力数据,所述电力数据包括时间、区域和用电量。

进一步的,所述城市数据为太阳能数据,所述太阳能数据包括时间、区域和单位时间内的太阳能发电量。

进一步的,步骤(2)中,所述时空混合函数为任意非线性但可逆的函数。

进一步的,所述时空混合函数可逆且处处可微,同时受控因果转移函数可逆且二次可微。

进一步的,外生变量分布的变化受域信息集合的控制,在给定域信息集合后,外生变量之间相互独立。

本发明相对于现有技术的优点在于:

(1)不同于传统关注中观区域层面的城市复杂系统建模方法,本发明从时空数据生成原理的角度,提出生成因果解释的数学模型来建模微观层面因果描述子的时空因果结构和因果机制,并模拟时空数据的生成过程。相较于传统的相关性研究,本发明可以将城市复杂系统的观测数据分解为具有物理含义的因果描述子,在稳定的因果结构影响下,可以提升模型整体的鲁棒性和适用性,使得预测结果更加符合城市复杂系统运行情况。

(2)本发明在理论层面上提出了模型的可识别条件,并在该条件约束下提出了一种基于变分推断的生成因果解释模型GCIM学习框架,确保模型可以从观测数据中准确推断出因果描述子,进一步提升模型的可解释性,提升整体的泛化能力。

(3)本发明提出利用域适配器从观测数据中自动挖掘当前区域的域信息,并重点建模了复杂系统中区域内和区域间的因果关系,这有助于捕捉时间和空间因果关系,最大程度恢复城市复杂系统的时空动力学,大幅提升预测的准确度。

(4)在真实数据集的实验表明,生成因果解释模型GCIM成功地识别了潜在的时空因果结构和机制,并有效地预测了未来的数据,这证明了从微观因果关系对时空数据进行建模的重要性。

附图说明

图1为本发明生成因果解释模型GCIM的学习框架示意图。

图2为本发明方法与基线方法在某城区电力数据集上的测试结果对比图。

具体实施方式

下面结合本发明的附图,对本发明的技术方案进行进一步的详细说明,显然,所描述的实施例仅作为例示,并非用于限制本次申请。

本发明提供一种基于生成解释模型的城市级时空数据预测方法,从微观因果描述子层面理解城市复杂系统中观测数据的生成原理,并从历史观测数据中学习该数学模型,以此来预测未来的时空数据。本发明方法包括如下步骤:

步骤1:本发明首先提出一种生成因果解释模型GCIM(GenerativeCausalInterpretation Model,GCIM),通过数学建模对城市复杂系统的观测生成过程进行分析,该模型中包含外生变量、时空条件父变量、受控因果转移函数、时空混合函数,具体形式如下:

(1)

其中

表示/>

为/>

为受控因果转移函数,/>

表示对因果描述子/>

表示域信息集合,R表示域的数量;其中/>

外生变量

外生变量是一种固有属性,其刻画了某个物理概念(如区域属性、天气情况),因此它对因果描述子有直接影响。外生变量的非平稳性也直接导致了因果描述子的分布具有非平稳性。

时空条件父变量

(2)

其中

是由邻接关系决定区域i的局部邻域集合,/>

由于不同区域的局部邻域带来的因果影响不同,因此存在N个不同的区域间因果关系图。在因果充分系统中,在给定时空条件父变量的条件下,因果描述子之间相互独立,因此我们将

受控因果转移函数

时空混合函数

以下就以本实施方式具体涉及到的城市电力复杂系统,对上述模型进行进一步说明,针对区域属性作为系统的外生变量,可能随时间动态变化,导致非平稳的时空观测序列的问题,本发明将区域属性定义为一种域信息。针对多区域用电量时空数据预测,因果描述子是影响区域用电量不可观测的隐变量,本发明利用深度学习技术挖掘该隐变量来建模并解释城市复杂系统中用电量的生成过程。城市复杂系统中各区域用电量的因果描述子可能包括但不限于下列几种情况(人口密度、建筑密度、经济活动强度、交通状况等难以收集等数据),本发明目的是从可观测的城市中各区域用电量数据,推断出可能影响区域内用电量的因果描述子,并建立各个因果描述子之间的因果关系,进而建模并解释城市复杂系统中各区域用电量的生成规律和因果机制。

1.人口密度:人口密度是一个重要的空间特征,因为人口密度高的地区往往需要更多的电力供应,以满足人们的生活和商业需求。比如,大城市的用电量通常比农村地区的用电量高,因为城市有更多的人和商业活动。

2.建筑密度:建筑密度也是一个重要的空间特征,因为建筑密度高的地区需要更多的电力供应,以满足建筑物的照明、空调、电梯等用电需求。比如,商业区的用电量通常比住宅区的用电量高,因为商业区的建筑密度更高。

3.经济活动强度:经济活动强度也是一个影响用电量的重要因素。发达地区往往需要更多的电力供应,以满足更高的生产和消费需求。比如,一个工业化程度较高的地区的用电量可能会比一个农业化程度较高的地区的用电量更高。

4.交通状况:交通状况也可能影响用电量,因为交通状况影响了人们的出行和物流需求。比如,交通状况糟糕的城市可能需要更多的照明和信号灯,以保障交通安全,从而增加用电量。

此外,本发明将区域自身属性、天气状况和区域性聚集活动等变量作为系统之外未知的外生变量,并将各区域用电量的时间序列模式归纳为一种域信息,例如,各区域用电量的时间序列模式具有周期性、趋势性、季节性和突发性,当由于天气等外生变量发生改变时,该区域的用电量时间序列模式也会因此发生变化,同时,突发的区域性聚集活动也会导致区域用电量模式发生动态变化,因此,因果描述子的时空转移过程也受到非平稳外生变量的调节。

步骤2:针对步骤1中的生成因果解释模型GCIM建立可识别条件,具体如下:

定义1(观测等价性):令

通过观测数据可以学习得到估计模型

如果通过估计模型得到的数据分布

定义2(逐分量可识别性):在观测等价性的基础上,真实的时空混合函数

(3)

则称真实的潜在时空因果机制是逐分量可识别的,即模型

此外,如果从观测数据中估计的因果描述子可以达到逐分量可识别的程度,则潜在时空因果结构也具有可识别性,因为在因果充分系统的城市复杂系统中,因果描述子的条件独立性可以完全表征系统内时空因果结构,置换操作和逐分量可逆操作不会破坏因果描述子之间的条件独立性。

在定义1和定义2的保证下,本发明提出使生成因果解释模型GCIM具备可识别性的条件,具体定理如下:

定理1(生成因果解释模型GCIM的可识别性条件):如果生成因果解释模型GCIM的学习框架满足下述条件:

(1)时空混合函数

(2)外生变量分布

(3)对于任意的第i个区域的因果描述子集合

则称生成因果解释模型GCIM具有可识别性,可以从观测数据中学习到真实的潜在时空因果机制和时空因果结构。

步骤3:在可识别性条件约束下搭建一种基于变分推断的生成因果解释模型GCIM学习框架,以此从观测数据中学习估计模型,推断因果描述子。

图1为本发明所属生成因果解释模型的学习框架,如其所示,给定生成因果解释模型(如公式1所示)和相应的可识别条件(如定理1所示),本发明提出了一个基于变分推断的学习框架。在模型学习阶段,将可识别条件作为学习框架的约束条件,以从观察数据中估计潜在的时空因果结构和机制。如图所示,GCIM的估计框架由四个组件组成:变分自编码器、域适配器、条件生成模块(Condition GenerationModule,CGM)和因果解释模块(CausalInterpretationModule,CIM)

下面对各组件的部分进行介绍,首先,本发明建立变分自编码器结构确保时空混合函数的可逆性并满足条件(1),编码器从观测数据中推断因果描述子,解码器对因果描述子进行非线性混合,生成区域的时空数据;其次,为了建模受外生变量影响下的非平稳性并满足条件(2)和条件(3),本发明提出一个域适配器,其将一定时间段内的观测数据分配到对应的域,在同一个域内的外生变量分布一致,在不同域之间的外生变量分布不同;然后,为了捕获时空因果结构,本发明提出了一个条件生成模块(Condition GenerationModule,CGM),通过将区域间的邻接关系作为归纳偏置,捕捉区域内和区域间的因果关系,生成时空条件父变量,并将时空条件父变量转化为因果转移函数的条件参数,控制因果转移函数的具体形式;最后,为了满足受控因果转移函数

具体步骤包括:

步骤(1):根据城市复杂系统内部的时空因果关系,从微观因果描述子层面上定义观测数据的生成过程,建立因果解释模型GCIM的数学原理;同时采集研究区域的多模态数据,将数据量化,构造城市多模态数据,得到各区域分时段数据,作为生成因果解释模型GCIM学习框架的输入。

步骤(2):利用神经网络,搭建生成式解释模型GCIM的学习框架,并将可识别性条件作为神经网络的约束条件,主要目的是从当前系统的观测数据中推断因果描述子,并估计潜在的时空因果结构和时空因果机制,本步骤包含如下步骤(2.1)-步骤(2.5)。

步骤(2.1),为了满足条件(1)中时空混合函数的可逆性,使用变分自动编码器(Variational AutoEncoder,VAE)框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,其定义如下:

(4)

其中,

(5)

其中

和/>

预定义邻接关系定义如下:

(6)

其中,

编码阶段的目的是拟合时空混合函数

步骤(2.2)在大多数情况下,尽管由于域的影响,观测数据表现出非平稳性,但域信息通常是未知的。为了满足条件(2)和条件(3)的约束,本发明提出了一种域适配器来从观测数据中捕获潜在的域信息,并使用Gumbel Softmax方法来确保每个节点的观测仅属于某个域,定义如下:

(7)

其中

根据假设(3),如果因果描述子的数量为

(8)

其中,

步骤(2.3)为了充分捕捉时空因果结构,我们提出了条件生成模块(CGM)。我们将时空因果结构分解为区域内因果关系

根据因果描述子的条件独立性,本发明通过

(9)/>

步骤(2.4) 先前基于VAE的时间序列表征学习方法使用标准的多元高斯先验正则化隐变量的后验,这极大地限制了模型的表达能力。为此,本发明提出了一个因果解释模块,其目的是基于因果转换函数

首先,使用变元定理将先验分布转换到外生变量分布,定义如下:

(10)

其中外生变量

(11)

CIM解释了因果描述子的内在因果机制,并用可学习的先验分布逼近复杂系统内部真实的潜在因果机制,从而规范了因果描述子后验分布,提高了模型的可识别性。

步骤(2.5)基于估计的因果描述子预测系统的未来状态是生成模型的一项重要功能。本发明假设域信息在短时间内不发生变化,因此可以从外生变量分布中采样当前区域下一时刻的外生变量,其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据,其形式化定义如下:

(12)

重构过程:由于后验分部把当前时刻的观测数据作为输入,因此从后验分布

预测过程:先验分布

步骤(3):给定城市复杂系统数据集,本发明使用证据最小下界(Evidence LowerBound,ELBO)和预测损失函数学习生成因果解释模型,然后利用训练好的生成因果解释模型对研究区域内各子区域的数据进行预测。从后验分布采样因果描述子,分别计算采样得到因果描述子在后验分布和先验分布中的对数概率,并对两者差值求期望。

另外,我们使用均方误差(Mean-Squared Error,MSE)作为预测损失,得到最终的损失函数。

步骤4:采集研究场景中的历史数据对所述的生成因果解释模型GCIM学习框架进行训练,将训练好的模型部署在城市系统上,根据研究区域内各子区域历史的用电量,预测每个区域各自未来的用电量,城市电力系统可以根据实际情况来规划和管理发电、输电、配电等方面的资源,从而优化电力系统的运行效率和可靠性。

实施例1

我们在一个真实世界的公开时空数据集上评估了GCIM的可识别性和预测性能,即Electricity Load Diagrams 2011-2014(Electricity)数据集,该数据在UCI机器学习库中开源共享[https://archive.ics.uci.edu/ml/datasets/ElectricityLoadDiagrams20112014]。

该数据集记录了葡萄牙370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。为了时间序列的稳定性,本发明将具有缺失值的区域删除,只保留了2021年到2014年各区域的用电量,并以1小时的间隔分割该数据集,以获得Electricity数据集的26304个样本和321个区域。本发明使用1小时的历史数据来预测未来30分钟的数据。60%的数据用于训练,20%用于验证,其余用于测试。

本发明使用均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)方法来评估模型性能,本发明将因果解释模型与目前先进的时空表示学习方法进行了比较,以验证因果解释模型的预测性能,最终的平均结果如表1所示,

表1 在Electricity数据集上本发明方法与其他方法的定量分析结果

表1显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂,MAPE可以有效地反映模型抵抗随机波动的能力。因此,本发明的GCIM始终优于基线模型。用于基于隐式图挖掘的方法。AGCRN只使用自适应邻接图,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN和RGSL将训练数据中的时空相关性嵌入到隐式图中,并融合显式图来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式图,可以更好地捕捉动态时空相关性。这表明,捕捉动态时空相关性有利于预测。图2显示了本发明GCIM模型和测试集基线的MAE的演变趋势。得益于对系统内因果关系的精确建模,GCIM模型在每个时期表现最好,这反映了其稳定性。

实施例2

我们在一个真实世界的公开时空数据集上评估了GCIM的可识别性和预测性能,即Solar Power Data(Solar-Energy)数据集,该数据在UCI机器学习库中开源共享[https://www.nrel.gov/grid/solar-power-data.html]。

该数据集记录了美国137个发电站在2006年各发电站的太阳能发电量,采样周期为10分钟。本发明并以10分钟的间隔分割该数据集,以获得Solar-Energy数据集的52560个样本和137个区域。本发明使用1小时的历史数据来预测未来30分钟的数据。60%的数据用于训练,20%用于验证,其余用于测试。

本发明使用均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)方法来评估模型性能。将因果解释模型与目前先进的时空表示学习方法进行了比较,以验证因果解释模型的预测性能,最终的平均结果如表2所示,

表2 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果

表2显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂。因此,本发明的GCIM始终优于基线模型。用于基于隐式图挖掘的方法。AGCRN只使用自适应邻接图,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN将训练数据中的时空相关性嵌入到隐式图中,并融合显式图来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式图,可以更好地捕捉动态时空相关性。这表明,捕捉动态时空相关性有利于预测。图2显示了本发明GCIM模型和测试集基线的MAE的演变趋势。得益于对系统内因果关系的精确建模,GCIM模型在每个时期表现最好,这反映了其稳定性。

以上申请的仅为本申请的一些实施方式。对于本领域的普通技术人员来说,在不脱离本申请创造构思的前提下,还可以做出若干变型和改进,这些都属于本申请的保护范围。

相关技术
  • 一种基于生成对抗网络的属性缺失数据集补全与预测方法
  • 一种城市时空数据预测因果模型的评价方法
  • 预测装置、预测方法、预测程序、学习模型输入数据生成装置和学习模型输入数据生成程序
技术分类

06120116335137