掌桥专利:专业的专利平台
掌桥专利
首页

台风灾害下停电持续时间预测方法、系统、设备及介质

文献发布时间:2023-06-19 18:27:32


台风灾害下停电持续时间预测方法、系统、设备及介质

技术领域

本发明涉及电网防灾减灾技术领域,特别是涉及一种台风灾害下停电持续时间预测方法、系统、计算机设备和存储介质。

背景技术

台风灾害所导致的大面积停电会严重危害社会秩序及用户生活质量,电网防灾减灾部门需要针对性制定应对策略,以尽可能减少电网在台风灾害下的受灾损失的同时,有效提高用户优质服务。因此,若能根据台风预报信息提前精准预测出台风灾害下停电时间,不仅能为电网防灾减灾部门提供有效的决策支持,而且能够有效减低电网在台风灾害下的受灾损失,提高相应的防灾减灾能力。

目前,台风灾害下停电时间的预测研究存在着有效数据收集困难且数据处理方法较少不利于精准建模,而且预测模型较为单一,通常使用广义线性回归等较为简单的模型进行预测,准确性较低,并不能为电网防灾减灾部门针对台风灾害制定防灾减灾策略提供可靠依据,应用价值较低。

发明内容

本发明的目的是提供一种台风灾害下停电持续时间预测方法,通过将采用风场模拟获取目标区域的气象数据与电网系统内相关数据进行融合处理得到历史台风灾害预测数据集,并依此对多个机器学习模型进行评估和筛选,得到台风灾害下停电持续时间的最优预测模型,用于后续相应目标区域的台风灾害下停电持续时间预测,有效解决现有技术应用缺陷,从数据收集、数据处理和模型筛选等多方面保障台风灾害下停电持续时间预测的精准性,为电网防灾减灾部门针对台风灾害制定防灾减灾策略提供可靠依据,应用价值较高,具有重要的现实意义。

为了实现上述目的,有必要针对上述技术问题,提供了一种台风灾害下停电持续时间预测方法、系统、计算机设备和存储介质。

第一方面,本发明实施例提供了一种台风灾害下停电持续时间预测方法,所述方法包括以下步骤:

对目标区域进行网格划分,获得目标区域的网格集合;

分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据,并根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集;

根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型;

获取所述目标区域的待分析台风灾害数据,并根据所述待分析台风灾害数据和所述最优预测模型,得到对应的停电持续时间预测结果。

进一步地,所述历史台风灾害多源异构数据包括气象数据、电网数据、地理数据和对应的停电持续时间;所述气象数据包括最大阵风风速;所述电网数据包括变压器数量、10kV杆塔数量和110kV杆塔数量;所述地理数据包括经度、纬度、海拔、坡向、坡位、下垫面类型、地表类型和地表粗糙度。

进一步地,所述分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据的步骤包括:

采用Batts模型对风场进行模拟,收集各个网格的气象数据;

通过电网系统获取各个网格的电网数据、地理数据和对应的停电持续时间。

进一步地,所述采用Batts模型对风场进行模拟,收集各个网格的气象数据的步骤包括:

采用Batts模型进行风场模拟,获得台风过境时各网格的预设时间隔的阵风风速;所述阵风风速表示为:

式中,

R

其中,V表示阵风风速;

根据台风过境时各网格的预设时间隔的阵风风速,筛选得到各网格对应的最大阵风风速。

进一步地,所述根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集的步骤包括:

将各个网格的历史台风灾害多源异构数据,通过ArcGIS可视化和空间融合,得到初始台风灾害预测数据集;

将所述初始台风灾害预测数据集中的气象数据、地理数据与电网数据作为特征变量,停电持续时间作为响应变量,并对各个特征变量进行相关性分析,以及将强相关特征变量删除,得到所述台风灾害预测数据集。

进一步地,所述机器学习模型包括极限树模型、极端梯度提升模型、分布式梯度模型、随机森林模型、梯度提升回归模型、决策树模型和K近邻模型。

进一步地,所述根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型的步骤包括:

根据所述台风灾害多源异构数据集,分别对各个机器学习模型进行训练评估,得到各个机器学习模型对应的误差指标、拟合指标和时间指标;

根据各个机器学习模型对应的误差指标、拟合指标和时间指标,按照预设标准,得到所述最优预测模型。

第二方面,本发明实施例提供了一种台风灾害下停电持续时间预测系统,所述系统包括:

区域划分模块,用于对目标区域进行网格划分,获得目标区域的网格集合;

数据集构建模块,用于分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据,并根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集;

模型筛选模块,用于根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型;

结果预测模块,用于获取所述目标区域的待分析台风灾害数据,并根据所述待分析台风灾害数据和所述最优预测模型,得到对应的停电持续时间预测结果。

第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

上述本申请提供了一种台风灾害下停电持续时间预测方法、系统、计算机设备及存储介质,通过所述方法,实现了对目标区域进行网格划分获得目标区域的网格集合,分别获取网格集合中各个网格对应的历史台风灾害多源异构数据,构建对应台风灾害预测数据集后,根据台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型,用于根据获取的目标区域的待分析台风灾害数据进行预测分析,得到对应的停电持续时间预测结果的技术方案。与现有技术相比,该台风灾害下停电持续时间预测方法,通过将采用风场模拟获取目标区域的气象数据与电网系统内相关数据进行融合处理得到历史台风灾害预测数据集,并依此对多个机器学习模型进行评估和筛选,得到用于台风灾害下停电持续时间预测的最优预测模型,能够从数据收集、数据处理和模型筛选等多方面保障台风灾害下停电持续时间预测的精准性,为电网防灾减灾部门针对台风灾害制定防灾减灾策略提供可靠依据,应用价值较高,具有重要的现实意义。

附图说明

图1是本发明实施例中台风灾害下停电持续时间预测方法的应用场景示意图;

图2是本发明实施例中台风灾害下停电持续时间预测方法的框架示意图;

图3是本发明实施例中台风灾害下停电持续时间预测方法的流程示意图;

图4是本发明实施例中历史台风灾害数据的各特征变量之间皮尔逊相关系数分布图;

图5是本发明实施例中各个机器学习模型的误差指标示意图;

图6为本发明实施例中各个机器学习模型的拟合指标示意图;

图7为本发明实施例中各个机器学习模型的时间指标示意图;

图8为本发明实施例中广东省阳江市经历“查帕卡”的实际停电持续时间分布图;

图9为本发明实施例中ET模型对广东省阳江市经历“查帕卡”的停电持续时间预测结果分布图;

图10是本发明实施例中台风灾害下停电持续时间预测系统的结构示意图;

图11是本发明实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案和有益效果更加清楚明白,下面结合附图及实施例,对本发明作进一步详细说明,显然,以下所描述的实施例是本发明实施例的一部分,仅用于说明本发明,但不用来限制本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的台风灾害下停电持续时间预测方法可以应用于如图 1所示的终端或服务器上。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器可根据本发明方法按照图2所示的框架实现对历史台风灾害多源异构数据的融合处理得到台风灾害预测数据集,并依次对多个机器学习模型的台风灾害持续时间预测效果进行评估,筛选出最优预测模型用于对未来的台风灾害持续停电时间进行预测,以及将对应的预测结果用于服务器后续的应用服务或反馈至终端用户查看使用;下述实施例将对本发明的台风灾害下停电持续时间预测方法进行详细说明。

在一个实施例中,如图3所示,提供了一种台风灾害下停电持续时间预测方法,包括以下步骤:

S11、对目标区域进行网格划分,获得目标区域的网格集合;其中,目标区域根据实际待分析的地区确定,并采用ArcGIS对研究区域进行 1km*1km网格划分,得到目标区域对应的网格集合后,再以各个网格为基础单元收集对应的历史数据进行后续的分析;

S12、分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据,并根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集;其中,所述历史台风灾害多源异构数据包括气象数据、电网数据、地理数据和对应的停电持续时间;所述气象数据包括最大阵风风速;所述电网数据包括变压器数量、10kV杆塔数量和 110kV杆塔数量;所述地理数据包括经度、纬度、海拔、坡向、坡位、下垫面类型、地表类型和地表粗糙度;具体地,所述分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据的步骤包括:

采用Batts模型对风场进行模拟,收集各个网格的气象数据,其中,风场指目标区域历史台风的风场,即通过对目标区域经历的历史台风进行模拟,收集对应的气象数据,保证数据有效性的同时,还降低了数据收集的难度;具体的,所述采用Batts模型对风场进行模拟,收集各个网格的气象数据的步骤包括:采用Batts模型进行风场模拟,获得台风过境时各网格的预设时间隔的阵风风速;所述阵风风速表示为:

式中,

R

其中,V表示待研究网格的阵风风速;V

通过电网系统获取各个网格的电网数据、地理数据和对应的停电持续时间;其中,电网系统会存储与目标区域相关的历史台风过境的电网相关灾害数据,只需根据需要从中提取所需历史台风对应的上述电网数据、地理数据和对应的停电持续时间即可用于构建所需的台风灾害数据集;具体的,所述根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集的步骤包括:

将各个网格的历史台风灾害多源异构数据,通过ArcGIS可视化和空间融合,得到初始台风灾害预测数据集;其中,初始台风灾害预测数据集原则上可以直接用于最优预测模型的筛选,但考虑到数据集中的同类数据变量间极易存在强相关性,进而导致影响预测模型筛选的精准性;本实施例优选地,将得到的初始台风灾害预测数据按照下述步骤进行相关性处理后,得到有效的数据后再用于模型评估和筛选;

将所述初始台风灾害预测数据集中的气象数据、地理数据与电网数据作为特征变量,停电持续时间作为响应变量,并对各个特征变量进行相关性分析,以及将强相关特征变量删除,得到所述台风灾害预测数据集;其中,初始台风灾害预测数据集中变量如表1所示:

表1原始样本数据集

本实施例中对各个特征变量进行相关性分析是通过计算皮尔逊相关系数来实现,且皮尔逊相关系数的取值范围为-1~1,若计算得到的皮尔逊相关系数的绝对值大于0.5则为强相关,需要将其移除,反之,则为弱相关,均可以保留;对应的皮尔逊相关系数的计算公式如下:

其中,m表示样本数量;x

S13、根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型;其中,机器学习模型的选取原则上可以根据数据集类型任意选取,为了保证最优预测模型的预测效果,本实施例优选,所述机器学习模型包括但不限于极限树模型(ET)、极端梯度提升模型(XGBoost)、分布式梯度模型(LightGBM)、随机森林模型(RF)、梯度提升回归模型(GBR)、决策树模型(DT)和K 近邻模型(KNN);

具体的,所述根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型的步骤包括:

根据所述台风灾害多源异构数据集,分别对各个机器学习模型进行训练评估,得到各个机器学习模型对应的误差指标、拟合指标和时间指标;其中,误差指标和拟合指标用于对各个机器学习模型的性能进行评价,时间指标用于反应机器学习模型的响应速度;误差指标包括均方误差(mean square error,MSE)、均方根误差(root mean square error,RMSE)及平均绝对误差(mean absolute deviation,MAE);拟合指标为决定系数(R-Square,R2);时间指标为机器学习模型启动至结束的时间。上述各指标的计算公式如下所示:

其中,S表示测试集样本数量;y

根据各个机器学习模型对应的误差指标、拟合指标和时间指标,按照预设标准,得到所述最优预测模型;其中,预设标准原则可根据实际需要进行设置,本实施例优选地,预设标准为误差指标数值越小越好,拟合指标数值越接近1越好,时间指标数值越小越好,可理解为若某个机器学习模型的误差指标中各个指标值均比其他模型的误差指标小,对应的拟合指标最接近1,且时间指标值不是最大的,则该机器学习模型就可以作为最优预设模型用于后续该目标区域的台风灾害下停电持续时间预测;

S14、获取所述目标区域的待分析台风灾害数据,并根据所述待分析台风灾害数据和所述最优预测模型,得到对应的停电持续时间预测结果;其中,待分析台风灾害数据可以理解为根据目标区域即将经受的台风相关气象(台风登陆路径及强度)模拟得到的各个网格的气象数据(台风过境期间各地区的最大阵风风速),以及相应的电网数据和地理数据;将得到的待分析台风灾害数据输入通过上述方法得到的最优预测模型,即可得到对应各个网格的停电持续时间预测值。

此外,基于最优预测模型得到目标区域各个网格的停电持续时间预测值还可以通过ArcGIS进行可视化展示,不仅便于电网防灾减灾部门快速直观了解目标区域内各个地点的受灾情况,进而提前针对性制定有效的防灾减灾策略,而且方便电网抢修调度部门观察电力负荷受灾情况,制定相应的应急抢修策略。

本实施例通过将采用风场模拟获取目标区域的气象数据与电网系统内相关数据进行融合处理得到历史台风灾害预测数据集,并依此对多个机器学习模型进行评估和筛选,得到用于台风灾害下停电持续时间预测的最优预测模型的方法,能够从数据收集、数据处理和模型筛选等多方面保障台风灾害下停电持续时间预测的精准性,为电网防灾减灾部门针对台风灾害制定防灾减灾策略提供可靠依据,应用价值较高,具有重要的现实意义。

为了便于对本发明实施过程的深入理解,以及对本发明实施效果进行可靠性和有效性验证,下面以“查帕卡”台风在广东省停电持续时间预测为例进行详细说明:

将广东省区域划分1km*1km网格,并在中国台风网下载“查帕卡”台风的移动路径与强度变化数据后,采用Batts模型对“查帕卡”台风进行模拟,获得台风过境时各网格的气象数据最大阵风风速即得到所需的气象数据,再将其与从电网部门获取广东省电网数据及地理数据融合为历史台风灾害多源异构数据:1)气象数据:最大阵风风速X1; 2)地理数据:经度X2、纬度X3、海拔X4、坡向X5、坡位X6、下垫面类型X7、地表类型X8、地表粗糙度X9;3)电网数据:变压器数量X10、10kV杆塔数量X11及110kV杆塔数量X12;再对收集到的历史台风灾害多源异构数据,使用皮尔逊相关系数分析各特征变量之间的相关性,得到图4所示的各特征变量之间皮尔逊相关系数分布图,基于此分析可知,经度X2与纬度X3的相关系数为0.68,具有强相关性,但经度与纬度将用于定位,是可视化阶段不可缺少的数据,因此不予剔除;同时,变压器数量X10与10kV杆塔数量X11相关系数为 0.71,具有强相关性,由于台风易导致10kV杆塔损毁,停电持续时间主要受修复10kV杆塔进程影响,因此剔除变压器数量X10,最终确定输入机器学习模型的台风灾害预测数据集包括:最大阵风风速X1;地理数据:经度X2、纬度X3、海拔X4、坡向X5、坡位X6、下垫面类型X7、地表类型X8、地表粗糙度X9;电网数据:10kV杆塔数量X11 及110kV杆塔数量X12;

将台风灾害预测数据集按照预设比例划分为训练集和测试集后,用于同时对ET、XGBoost、LightGBM、RF、GBR、DT及KNN等7 种机器学习模型进行训练与测试,并根据得到图5所示的3种误差指标,图6所示的1种拟合指标及图7所示的时间指标对各个机器学习模型进行评估发现:在各模型误差指标示意图中,ET模型的MSE、 RMSE及MAE误差指标相比于其他算法而言更优,XGBoost模型的误差次之,KNN模型的误差指标最差;在各模型拟合指标示意图中,ET 模型的R2指标最好,XGBoost模型的拟合效果次之,KNN模型的拟合效果最差;在各模型时间指标示意图中,KNN模型响应最快,DT 模型次之,RF模型最差。基于误差指标的数值越小越好、拟合指标 R2越接近1说明预测效果越好、且时间指标数据越小证明预测模型响应速度越快的原则综合分析时,由于停电持续时间的预测会影响后期抢修策略的制定,因此更在意预测的误差,ET模型的预测误差与拟合效果最好,时间指标还可以,响应速度满足应急防灾减灾的需求,综上所述,ET模型为最优预测模型用于获取持续停电时间预测值;

使用ArcGIS对最优预测模型得到的持续停电时间预测值进行可视化,并与实际的停电持续进行对比分析,基于图8所示的实际停电持续时间分布图与图9所示的ET模型停电持续时间预测结果分布图对比分析发现,对于停电持续时间较长的网格分布基本上一致,但ET模型会将一些未停电的区域预测为停电1小时以内,因此在使用时可将1 小时以内的停电区域确定为低风险区,总体预测效果不错。

在一个实施例中,如图10所示,提供了一种台风灾害下停电持续时间预测系统,所述系统包括:

区域划分模块1,用于对目标区域进行网格划分,获得目标区域的网格集合;

数据集构建模块2,用于分别获取所述网格集合中各个网格对应的历史台风灾害多源异构数据,并根据各个网格的历史台风灾害多源异构数据,构建对应台风灾害预测数据集;

模型筛选模块3,用于根据所述台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型;

结果预测模块4,用于获取所述目标区域的待分析台风灾害数据,并根据所述待分析台风灾害数据和所述最优预测模型,得到对应的停电持续时间预测结果。

关于一种台风灾害下停电持续时间预测系统的具体限定可以参见上文中对于一种台风灾害下停电持续时间预测方法的限定,在此不再赘述。上述一种台风灾害下停电持续时间预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图11示出一个实施例中计算机设备的内部结构图,该计算机设备具体可以是终端或服务器。如图11所示,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示器和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种台风灾害下停电持续时间预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域普通技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。

综上,本发明实施例提供的一种台风灾害下停电持续时间预测方法、系统、计算机设备及存储介质,其台风灾害下停电持续时间预测方法实现了对目标区域进行网格划分获得目标区域的网格集合,分别获取网格集合中各个网格对应的历史台风灾害多源异构数据,构建对应台风灾害预测数据集后,根据台风灾害多源异构数据集,对预设数目个机器学习模型进行训练筛选,得到最优预测模型,用于根据获取的目标区域的待分析台风灾害数据进行预测分析,得到对应的停电持续时间预测结果的技术方案,该方法通过将采用风场模拟获取目标区域的气象数据与电网系统内相关数据进行融合处理得到历史台风灾害预测数据集,并依此对多个机器学习模型进行评估和筛选,得到用于台风灾害下停电持续时间预测的最优预测模型,能够从数据收集、数据处理和模型筛选等多方面保障台风灾害下停电持续时间预测的精准性,为电网防灾减灾部门针对台风灾害制定防灾减灾策略提供可靠依据,应用价值较高,具有重要的现实意义。

本说明书中的各个实施例均采用递进的方式描述,各个实施例直接相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。需要说明的是,上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 锂离子电池循环寿命预测方法、设备、系统及存储介质
  • 台风灾害下停电网格分布预测方法、系统、设备和介质
  • 台风灾害下配网用户停电数量预测方法和预测装置
技术分类

06120115573785