掌桥专利:专业的专利平台
掌桥专利
首页

基于用电时序数据的居民社区特征标签计算方法及系统

文献发布时间:2023-06-19 19:30:30


基于用电时序数据的居民社区特征标签计算方法及系统

技术领域

本发明属于电力数据挖掘领域,具体涉及一种基于用电时序数据的居民社区特征标签计算方法及系统。

背景技术

随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。因此,保障电能的稳定可靠供应,就成为了电力系统最重要的任务之一。

居民社区是电力系统最重要的负载之一;居民社区的特征标签能够有效帮助电力系统进行短时间和长时间的负荷调配、进行发电和运营计划的制定等工作。因此,居民社区的特征标签对于电力系统的稳定可靠运行,具有重要意义。

目前,居民社区的特征标签计算方法,往往采用的是经济数据、交通数据和问卷调查的数据等数据内容,缺乏客观科学的数据支撑;同时,现有技术得到的特征标签数据,准确性不高,也在一定程度上对电力系统的安全稳定运行产生了影响。

发明内容

本发明的目的之一在于提供一种可靠性高、准确性好且客观科学的基于用电时序数据的居民社区特征标签计算方法。

本发明的目的之二在于提供一种实现所述基于用电时序数据的居民社区特征标签计算方法的系统。

本发明提供的这种基于用电时序数据的居民社区特征标签计算方法,包括如下步骤:

S1.获取待分析居民社区的用电时序数据和空间信息数据;

S2.对步骤S1获取的用电时序数据和空间信息数据进行数据清洗,得到居民用电时序数据集和空间信息数据集;

S3.对步骤S2得到的空间信息数据集进行归一化处理,得到归一化空间信息数据集;

S4.对步骤S3得到的归一化空间信息数据集,采用Getis-Ord Gi*分析法进行空间冷热度计算,得到热点位置数据;

S5.将步骤S4得到的热点位置数据,与空间信息数据集、居民用电时序数据集进行关联和二次数据清洗,得到计算样本集;

S6.采用步骤S5得到的计算样本集,采用聚类方法进行数据聚类,得到最终的居民社区特征标签。

步骤S1所述的空间信息数据,具体包括POI热点数据信息、居民房屋估值数据信息、区域居民消费能力数据信息和社区居民档案数据信息。

步骤S2所述的数据清洗,具体包括如下步骤:

将待清洗数据,按照获取来源,分为离线获取类型数据和实时获取类型数据;

采用条件判断法去除待清洗数据中的异常值,得到初步清洗数据;

针对得到的初步清洗数据,采用如下规则进行数据补全,完成数据的清洗:

若数据为离线获取类型数据且在某一日期存在缺失值,则采用同一居民在前一年的相同日期的数据和该居民在本年度与缺失值相邻日期的数据,采用两点加权平均法计算得到缺失值的数据;

若数据为实时获取类型数据且存在1个点的缺失值,则采用缺失值前一个点的数据和缺失值后一个点的数据,采用两点加权平均法计算得到缺失值的数据;

若数据为实时获取类型数据且存在超过1个点的缺失值,则采用2个最近邻点的数据,采用移动加权平均法计算得到缺失值的数据。

步骤S3所述的对步骤S2得到的空间信息数据集进行归一化处理,得到归一化空间信息数据集,具体包括如下步骤:

基于WGS-84坐标系,将POI热点数据信息转化为WGS-84版标准地理经纬度数据,并进行归一化处理,得到归一化POI热点数据信息;

将居民房屋估值数据信息和区域居民消费能力数据信息,依次进行正则化处理和归一化处理,得到归一化居民房屋估值数据信息和归一化区域居民消费能力数据信息;

根据社区居民档案数据信息,获取社区居民年龄数据信息,并对社区居民年龄数据信息进行归一化处理,得到归一化社区居民年龄数据信息;

根据社区居民档案数据信息,获取社区居民性别信息,并对社区居民的性别进行离散化标定,统计社区居民的性别占比,得到社区居民性别比例数据信息;

将得到的归一化POI热点数据信息、归一化居民房屋估值数据信息、归一化区域居民消费能力数据信息、归一化社区居民年龄数据信息和社区居民性别比例数据信息进行规整,得到最终的归一化空间信息数据集。

步骤S4所述的对步骤S3得到的归一化空间信息数据集,采用Getis-Ord Gi*分析法进行空间冷热度计算,得到热点位置数据,具体包括如下步骤:

A.将步骤S3得到的归一化空间信息数据集,进行空间自相关分析:

采用如下算式计算莫兰指数统计Z值:

式中I为莫兰指数计算值,且

若莫兰指数值I大于0.3,则认为存在强烈空间正相关性;

若莫兰指数I值小于-0.3,则认为存在强烈空间负相关性;

若-0.3<莫兰指数I值<0.3,则认为数据不存在相关性;

若莫兰指数统计Z值绝对值超过1.65,则数据通过检验;莫兰指数统计Z值绝对值小于1.65,则认为数据未通过检验;

B.采用如下算式计算热点指标

式中x

若热点指标

若热点指标

步骤S6所述的采用步骤S5得到的计算样本集,采用聚类方法进行数据聚类,得到最终的居民社区特征标签,具体包括如下步骤:

清除异常曲线:针对每条曲线,求该曲线与对应类中其他所有曲线的欧氏距离的平均值,并选出平均值最大的若干条曲线进行删除,完成异常曲线的清除;

确定初始特征曲线:将各条曲线视为离散值,采用曲线拟合的方式得到每一类曲线的拟合曲线,并将拟合曲线作为该类的初始特征曲线;

分别对长期数据、中期数据和短期数据进行聚类:长期数据用于区分居民社区的属性特征,包括居民社区峰谷用电习惯、社区居民四季用电水平和节日用电水平;中期数据用于区分居民社区近期用电峰谷;短期数据用于区分居民社区工作时间段;

采用肘部法则选取突出点,评估时间聚类效果:选取突出点确定簇心K值,并对居民社区的用电情况进行聚类,并依据多维度用电特性打上标签,分类形成居民社区特征标签。

本发明还提供了一种实现所述基于用电时序数据的居民社区特征标签计算方法的系统,包括数据获取模块、数据清洗模块、数据归一化模块、热点位置计算模块、计算样本集获取模块和特征标签获取模块;数据获取模块、数据清洗模块、数据归一化模块、热点位置计算模块、计算样本集获取模块和特征标签获取模块依次串联;数据获取模块用于获取待分析居民社区的用电时序数据和空间信息数据,并将数据上传数据清洗模块;数据清洗模块用于根据接收的数据,对获取的用电时序数据和空间信息数据进行数据清洗,得到居民用电时序数据集和空间信息数据集,并将数据上传数据归一化模块;数据归一化模块用于根据接收的数据,对空间信息数据集进行归一化处理,得到归一化空间信息数据集,并将数据上传热点位置计算模块;热点位置计算模块用于根据接收的数据,对归一化空间信息数据集采用Getis-Ord Gi*分析法进行空间冷热度计算,得到热点位置数据,并将数据上传计算样本集获取模块;计算样本集获取模块用于根据接收的数据,将热点位置数据与空间信息数据集、居民用电时序数据集进行关联和二次数据清洗,得到计算样本集,并将数据上传特征标签获取模块;特征标签获取模块用于根据接收的数据,采用计算样本集,采用聚类方法进行数据聚类,得到最终的居民社区特征标签。

本发明提供的这种基于用电时序数据的居民社区特征标签计算方法及系统,通过使用电力数据建立社区居民画像,采用了实际的电力数据进行实证研究,能够有效减少社区居民用电特征发现的难度,提高居民社区画像特征数据的表征能力,让特征描述更精确,而且本发明的可靠性高、准确性好且客观科学。

附图说明

图1为本发明的方法流程示意图。

图2为本发明的系统功能模块示意图。

具体实施方式

如图1所示为本发明的方法流程示意图:本发明提供的这种基于用电时序数据的居民社区特征标签计算方法,包括如下步骤:

S1.获取待分析居民社区的用电时序数据和空间信息数据;所述的空间信息数据,具体包括POI热点数据信息、居民房屋估值数据信息、区域居民消费能力数据信息和社区居民档案数据信息;

S2.对步骤S1获取的用电时序数据和空间信息数据进行数据清洗,得到居民用电时序数据集和空间信息数据集;

具体实施时,数据清洗包括如下步骤:

将待清洗数据,按照获取来源,分为离线获取类型数据和实时获取类型数据;

采用条件判断法去除待清洗数据中的异常值,得到初步清洗数据;

针对得到的初步清洗数据,采用如下规则进行数据补全,完成数据的清洗:

若数据为离线获取类型数据且在某一日期存在缺失值,则采用同一居民在前一年的相同日期的数据和该居民在本年度与缺失值相邻日期的数据,采用两点加权平均法计算得到缺失值的数据;

若数据为实时获取类型数据且存在1个点的缺失值,则采用缺失值前一个点的数据和缺失值后一个点的数据,采用两点加权平均法计算得到缺失值的数据;

若数据为实时获取类型数据且存在超过1个点的缺失值,则采用2个最近邻点的数据,采用移动加权平均法计算得到缺失值的数据;

S3.对步骤S2得到的空间信息数据集进行归一化处理,得到归一化空间信息数据集;具体包括如下步骤:

基于WGS-84坐标系,将POI热点数据信息转化为WGS-84版标准地理经纬度数据,并进行归一化处理,得到归一化POI热点数据信息;

将居民房屋估值数据信息和区域居民消费能力数据信息,依次进行正则化处理和归一化处理,得到归一化居民房屋估值数据信息和归一化区域居民消费能力数据信息;

根据社区居民档案数据信息,获取社区居民年龄数据信息,并对社区居民年龄数据信息进行归一化处理,得到归一化社区居民年龄数据信息;

根据社区居民档案数据信息,获取社区居民性别信息,并对社区居民的性别进行离散化标定,统计社区居民的性别占比,得到社区居民性别比例数据信息;

将得到的归一化POI热点数据信息、归一化居民房屋估值数据信息、归一化区域居民消费能力数据信息、归一化社区居民年龄数据信息和社区居民性别比例数据信息进行规整,得到最终的归一化空间信息数据集;

S4.对步骤S3得到的归一化空间信息数据集,采用Getis-Ord Gi*分析法进行空间冷热度计算,得到热点位置数据;具体包括如下步骤:

A.将步骤S3得到的归一化空间信息数据集,进行空间自相关分析:

采用如下算式计算莫兰指数统计Z值:

式中I为莫兰指数计算值,且

若莫兰指数值I大于0.3,则认为存在强烈空间正相关性;

若莫兰指数I值小于-0.3,则认为存在强烈空间负相关性;

若-0.3<莫兰指数I值<0.3,则认为数据不存在相关性;

若莫兰指数统计Z值绝对值超过1.65,则数据通过检验;莫兰指数统计Z值绝对值小于1.65,则认为数据未通过检验;

B.采用如下算式计算热点指标

/>

式中x

若热点指标

若热点指标

S5.将步骤S4得到的热点位置数据,与空间信息数据集、居民用电时序数据集进行关联和二次数据清洗,得到计算样本集;

S6.采用步骤S5得到的计算样本集,采用聚类方法进行数据聚类(K-means聚类),得到最终的居民社区特征标签;具体包括如下步骤:

清除异常曲线:针对每条曲线,求该曲线与对应类中其他所有曲线的欧氏距离的平均值,并选出平均值最大的若干条曲线进行删除,完成异常曲线的清除;

确定初始特征曲线:将各条曲线视为离散值,采用曲线拟合的方式得到每一类曲线的拟合曲线,并将拟合曲线作为该类的初始特征曲线;

分别对长期数据、中期数据和短期数据进行聚类:长期数据用于区分居民社区的属性特征,包括居民社区峰谷用电习惯、社区居民四季用电水平和节日用电水平等;中期数据用于区分居民社区近期用电峰谷等特征;短期数据用于区分居民社区工作时间段等特征;

采用肘部法则选取突出点,评估时间聚类效果:选取突出点确定簇心K值,并对居民社区的用电情况进行聚类,并依据多维度用电特性打上标签,分类形成居民社区特征标签。

最后,得到居民社区特征标签后,以长期、中期、短期业务数据表的形式将计算结果存放至业务数据库,进行定期更新。

如图2所示为本发明的系统功能模块示意图:本发明提供的这种实现所述基于用电时序数据的居民社区特征标签计算方法的系统,包括数据获取模块、数据清洗模块、数据归一化模块、热点位置计算模块、计算样本集获取模块和特征标签获取模块;数据获取模块、数据清洗模块、数据归一化模块、热点位置计算模块、计算样本集获取模块和特征标签获取模块依次串联;数据获取模块用于获取待分析居民社区的用电时序数据和空间信息数据,并将数据上传数据清洗模块;数据清洗模块用于根据接收的数据,对获取的用电时序数据和空间信息数据进行数据清洗,得到居民用电时序数据集和空间信息数据集,并将数据上传数据归一化模块;数据归一化模块用于根据接收的数据,对空间信息数据集进行归一化处理,得到归一化空间信息数据集,并将数据上传热点位置计算模块;热点位置计算模块用于根据接收的数据,对归一化空间信息数据集采用Getis-Ord Gi*分析法进行空间冷热度计算,得到热点位置数据,并将数据上传计算样本集获取模块;计算样本集获取模块用于根据接收的数据,将热点位置数据与空间信息数据集、居民用电时序数据集进行关联和二次数据清洗,得到计算样本集,并将数据上传特征标签获取模块;特征标签获取模块用于根据接收的数据,采用计算样本集,采用聚类方法进行数据聚类,得到最终的居民社区特征标签。

相关技术
  • 基于大数据智慧医疗服务的社区居民信息采集分析系统
  • 一种基于大数据的居民社区移动网络基站规划方法及系统
技术分类

06120115938147