掌桥专利:专业的专利平台
掌桥专利
首页

多维度能源用户画像的刻画方法

文献发布时间:2023-06-19 18:27:32


多维度能源用户画像的刻画方法

技术领域

本发明涉及能源互联网技术领域,具体涉及一种多维度能源用户画像的刻画方法。

背景技术

随着能源互联网建设的不断深入,能源相关行业从上到下均积极创新,以促进能源的高效、合理利用发展。在能源互联网的建设过程中,各类能源之间的协调互补能量增强,未来综合能源利用体系将逐步演化为以用户为中心的综合能源系统。其中,用户画像的重要性比重与日俱增,只有将用户的画像刻画的精准,对用户的行为轨迹分析清楚,才能够更好的发挥出数据的价值,才能将用能的价值发挥到最大。

在现有技术中,用户画像的刻画方式主要有如下几类,其一是用户自己填写自己的画像数据,本方式的问题是可能用户填写本身就是错误的或者用户填写的信息不全;其二是使用规则进行客户用户画像,通过用户近一个月的行为数据,通过每天来往的地理位置规则刻画出用户画像;但上述对于能源用户画像的刻画技术不成熟,导致能源用户画像的刻画结果不精准。

发明内容

本发明的主要目的是提供一种多维度能源用户画像的刻画方法,旨在解决现有的对于能源用户画像的全方位的信息刻画技术不成熟,导致能源用户画像的刻画结果不精准的问题。

为了解决以上问题,本发明通过以下技术方案实现:

一种多维度能源用户画像的刻画方法,包括:获取能源管理平台里的数据库,所述数据库中存储有目标用户的基础数据。对所述数据库中的所述基础数据进行预处理。

获取目标用户在第一预设时间段内的基础数据信息。

获取系统用户在第二预设时间段内的基础数据信息;其中,所述第一预设时间段小于所述第二预设时间段,且所述第一预设时间段包含于所述第二预设时间段。

对所述系统用户的基础数据信息和所述目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息。

利用覆盖率和时间段偏好的统计方法计算所述目标用户的第二画像信息。

基于深度学习的GRU算法模型通过所述目标用户的用能行为信息预测得到所述目标用户的第三画像信息。

结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息。

可选地,所述对所述数据库中的所述基础数据进行预处理的步骤包括:

对所述数据库中的所述目标用户的数据信息中的缺失值和异常值进行剔除处理。

可选地,所述系统用户为拥有对应的画像信息的用户。所述画像信息包括标签信息和对应的标签内容。所述基础数据信息包括所属行业信息、户号信息、能源消费信息、电力消费信息、供能单位信息、配电位置信息、地理位置信息以及时间信息。所述能源消费信息包括碳排放量和对应的设备名称。

可选地,所述对系统用户的基础数据信息和目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息的步骤包括:

将所述目标用户的所属行业信息与所述系统用户的所属行业信息进行关联、所述目标用户的户号信息与所述系统用户的户号信息进行关联、所述目标用户的能源消费信息与所述系统用户的能源消费信息进行关联、将所述目标用户的电力消费信息与所述系统用户的电力消费信息进行关联、所述目标用户的供能单位信息与所述系统用户的供能单位信息进行关联、所述目标用户的配电位置信息与所述系统用户的配电位置信息进行关联、将所述目标用户的地理位置信息与所述系统用户的地理位置信息进行关联,将所述目标用户的时间信息与所述系统用户的时间信息进行关联,以得到关联比较结果;

基于所述关联比较结果,确定所述目标用户的第一画像信息。

可选地,所述基于所述关联比较结果,确定所述目标用户的第一画像信息的步骤包括:基于所述关联比较结果,将与所述目标用户的地理位置的距离小于预设距离的系统用户标记为相关用户。基于所述相关用户的画像信息,获取所述目标用户与所述相关用户一致的标签内容,并标记为相关内容。将所述相关内容及对应的标签信息设置为所述目标用户的所述第一画像信息。

可选地,所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤包括:将所述目标用户在某个时刻发生的某类业务行为以及行为状态定义为行为标签T,所述行为标签T为所述第二画像信息。 将每个行为标签T代表的行为特征用频次、平均值、覆盖率、偏离度、平均时间间隔、周期特征及时段偏好特征表示。所述画像信息包括行为标签信息和对应的标签内容。具有所述行为标签T的业务行为包括如下几类:目标用户的月均用能量、年度用能量最高值、年度用能量最低值、用能变化量、用能变化率、用能高峰期以及缴费情况。

可选地,所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤还包括:

目标用户u在某个时间段内发生第j个行为标签的业务行为at

式中,ET-ST为统计的时间长度,sum(at

其中,n表示目标用户u发生at

其中,n表示目标用户u发生at

则所述业务行为at

式中, sum(d

可选地,所述基于深度学习的GRU算法对预测标签信息进行预测,得到目标用户的第三画像信息的步骤包括:将目标用户需预测的标签信息标记为待预测标签。所述待预测标签内容包括:对目标用户的未来某时刻的用能量预测,用能行为预测以及用能变化预测;建立基于深度学习的GRU算法模型;将目标用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练;通过完成训练的基于深度学习的GRU算法模型预测得到目标用户的待预标签和对应的标签内容,并作为所述第三画像信息。

可选地,所述将目标用户的待预测信息作为训练数据对基于深度学习的GRU算法模型进行训练的步骤包括:通过上一个节点传输下来的状态h

将拼接后的数据通过tanh激活函数放缩到[-1~1]的范围内,以得到当前节点状态候选状态h

可选地,所述门控状态包括更新门状态和重置门状态;更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多;重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。

所述将当前节点状态h

其中,z为更新门状态,

可选地,所述结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息的步骤包括:将所述第一画像信息、所述第二画像信息和所述第三画像信息进行打包形成所述目标用户对应的所述最终画像信息。

本发明至少具有以下优点之一:

本发明提出的多维度能源用户画像的刻画方法通过关联数据信息维度确定目标用户的第一画像信息,利用覆盖率和时间段偏好的统计方法确定目标用户的第二画像信息,最后目标能源用户需预测的标签信息通过深度学习获取,进而形成目标用户的第三画像信息,通过这样多维度的计算并将上述第一画像信息、第二画像信息和第三画像信息进行整合就能预测目标用户的最终画像信息,丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。本发明所采用的基础数据信息都属于目标用户的静态用能信息。现在增加了能源供应商等信息,不只是方便目标用户的使用方面,也是将供应商为目标用户的未来用能服务(即第三画像)提供信息依据。

附图说明

图1为本发明提出的一种多维度能源用户画像的刻画方法第一实施例的流程图;

图2为本发明提出的一种多维度能源用户画像的刻画方法第六实施例的GRU算法的输入输出结构图;

图3为本发明提出的一种多维度能源用户画像的刻画方法第七实施例的重置门和更新门的结构示意图;

图4为本发明提出的一种多维度能源用户画像的刻画方法第七实施例的得到当前节点状态h

具体实施方式

以下结合附图和具体实施方式对本发明提出的一种多维度能源用户画像的刻画方法作进一步详细说明。根据下面说明,本发明的优点和特征将更清楚。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的。为了使本发明的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

实施例一

如图1所示,本实施例提供一种多维度能源用户画像的刻画方法,包括:

步骤S100:获取能源管理平台里的数据库,所述数据库中存储有目标用户的基础数据。所述能源管理平台还可以称为“能源大脑”,为运用大数据分析、人工智能、云计算等技术打造的智慧城市能源云平台。

步骤S101、对所述数据库中的所述基础数据进行预处理,在本实施例中,所述步骤S101具体包括:对所述数据库中的所述目标用户的数据信息中的缺失值和异常值进行剔除处理。

可以理解的是,预处理后的数据是可以进行标签定义和操作的。在本实施例中包括基本数据和用能(即静态的和动态的数据),静态数据作为第一画像信息的关联计算的基础,动态数据作为第二画像信息和第三画像信息的基础,进行统计、计算和预测。

步骤S102、获取目标用户在第一预设时间段内的基础数据信息。

获取系统用户在第二预设时间段内的基础数据信息;其中,所述第一预设时间段小于所述第二预设时间段,且所述第一预设时间段包含于所述第二预设时间段。对所述系统用户的基础数据信息和所述目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息。

在本实施例中,这里的第一预设时间段优选为1个月,但本发明不以此为限。这里的基础数据信息可以是通过智能电表远程获取。

例如,获取目标用户A在消费能源时,能源消费信息为{"排放因子":"3","energy_name":"小名家的energy"}、电力消费信息为{"电量等级":"一级","消费等级":"高"}、地理位置信息为{"wm629s9":"A区1000号";交通地名:A路"},第一预设时间为:2021年6月1日-7月1日。

其中,所述系统用户为拥有对应的画像信息的用户,画像信息包括标签信息和对应的标签内容;所述基础数据信息包括所属行业信息、户号信息、能源消费信息、电力消费信息、供能单位信息、配电位置信息、地理位置信息以及时间信息。所述第一预设时间段小于所述第二预设时间段,且第一预设时间段包含于第二预设时间段,所述能源消费信息包括碳排放量和对应的设备名称。

在本实施例中,这里的第二预设时间段为6个月,但本发明不以此为限。

例如,某系统用户Y的能源消费信息为{"排放因子":"3","energy_name":"系统Y0家的energy"}、电力消费信息为{"电量等级":"一级","消费等级":"低"}、地理位置信息为{"wm629s9":"A区10010号";交通地名;A路"},第二预设时间为:2021年1月1日-7月1日。

例如:画像信息中的标签信息包括:基础数据信息、营业额、行业类别、城市分类、供电电压、负荷性质、用能类别、能源活动、能源消费等级、碳排放量、能源占比、电量等级、季节用电高峰、供电质量感知、违法用电程度、用电类别、能源消费种类、抄表方式、抄表周期、账单发布日、缴费期限日和消费等级。

每个标签信息对应有标签内容,例如,营业额的标签内容为XX元;供电电压的标签内容为220V等。

在本实施例中,这里的第一画像信息即是和目标用户距离较近的系统用户的画像信息,因较近距离的用户,在某些画像信息上是一致的,例如基础数据信息中季节用电高峰、电量等级、供电电压、城市分类等。

步骤S103:利用覆盖率和时间段偏好的统计方法计算所述目标用户的第二画像信息。

覆盖率表示某个时间段内该业务行为出现的次数占同类业务行为出现次数总和的比重。行为出现平均时间间隔即行为标签出现时间间隔的平均值。偏离度即行为标签出现的时间间隔的标准差,体现用户产生某种行为的时间均匀程度,偏离度越低,则该行为有可能是一种周期性行为。周期性用来衡量用户某行为是否具有周期性。时段偏好特征表示用户行为产生的时间段偏好。上述特征均从历史态和近态来描述,突出某行为的时间特征。

在本实施例中,所述步骤S103包括:将所述目标用户在某个时刻发生的某类业务行为以及行为状态定义为行为标签T,即将所述行为标签T作为所述第二画像信息; 将每个行为标签T代表的行为特征用频次、平均值、覆盖率、偏离度、平均时间间隔、周期特征及时段偏好特征表示;具有所述行为标签T的业务行为包括如下几类:目标用户的月均用能量、年度用能量最高值、年度用能量最低值、用能变化量、用能变化率、用能高峰期以及缴费情况。

在本实施例中,所述步骤S103还包括:目标用户u在某个时间段内发生第j个行为标签的业务行为at

式中,ET-ST为统计的时间长度,sum(at

目标用户发生第j个行为标签的业务行为at

其中,n表示目标用户u发生at

所述目标用户u发生第j个行为标签的业务行为at

其中,n表示目标用户u发生at

将所述目标用户u发生第j个行为标签的业务行为at

则所述业务行为at

式中,sum(d

如果所述目标用户u的业务行为at

具体的,经过关联计算以及覆盖率和时间段偏好的统计方法得到目标用户的画像信息可能还是不够全面,部分标签信息还是没有,就可以通过深度学习已有画像信息的系统用户的部分标签。 首先生成基于深度学习的GRU算法模型,然后将目标用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练,这里,待预测标签内容主要为对未来某时刻的用能量预测,用能行为预测以及用能变化预测。

步骤S105:结合第一画像信息、第二画像信息以及第三画像信息确定目标用户的最终画像信息。

通过上述步骤,能够得到目标用户的第一画像信息、第二画像信息和第三画像信息,进而得到目标用户的最终画像信息。

本实施例提出的多维度能源用户画像的刻画方法通过关联数据信息维度确定目标用户的第一画像信息,利用覆盖率和时间段偏好的统计方法计算确定目标用户的第二画像信息,最后目标能源用户需预测的标签信息通过深度学习获取,进而形成目标用户的第三画像信息,通过这样多维度的计算并将上述第一画像信息、第二画像信息和第三画像信息进行整合就能预测目标用户的最终画像信息,丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。

实施例二

基于第一实施例,本实施例与实施例一的区别在于,所述步骤S102还包括如下步骤:

步骤S1021:将所述目标用户的所属行业信息与所述系统用户的所属行业信息进行关联、所述目标用户的户号信息与所述系统用户的户号信息进行关联、所述目标用户的能源消费信息与所述系统用户的能源消费信息进行关联、将所述目标用户的电力消费信息与所述系统用户的电力消费信息进行关联、所述目标用户的供能单位信息与所述系统用户的供能单位信息进行关联、所述目标用户的配电位置信息与所述系统用户的配电位置信息进行关联、将所述目标用户的地理位置信息与所述系统用户的地理位置信息进行关联,将所述目标用户的时间信息与所述系统用户的时间信息进行关联,以得到关联比较结果。

步骤S1022:基于所述关联结果,确定目标用户的第一画像信息。

具体的,这里的关联结果就是比较目标用户的能源消费信息与系统用户的所属行业信息,比较目标用户的能源消费信息与系统用户的能源消费信息,比较目标用户的能源消费信息与系统用户的供能单位信息,比较目标用户的能源消费信息与系统用户的配电位置信息,比较目标用户的电力消费信息与系统用户的电力消费信息,比较目标用户的地理位置信息与系统用户的地理位置信息,比较目标用户的时间信息与系统用户的时间信息。

实施例三

基于上述第二实施例,本实施例提出的一种多维度能源用户画像的刻画方法与上述实施例二的区别在于,所述步骤S1022包括如下步骤:

步骤S10221:基于所述关联结果,将与所述目标用户的地理位置的距离小于预设距离的系统用户标记为相关用户。

具体的,所述合理的预设距离可以为1公里,但本发明不以此为限,即通过比较目标用户的地理位置信息与系统用户的地理位置信息,从而将与目标用户的地理位置的距离小于1公里的系统用户标记为相关用户。

若小于预设距离的系统用户有多个,则将距离最小的系统用户标记为相关用户。或者将能源消费信息和电力消费信息更接近的系统用户标记为相关用户。

步骤S10222:基于相关用户的画像信息,获取目标用户与相关用户一致的标签内容,并标记为相关内容。

具体的,因目标用户和相关用户距离比较接近,则会有一些标签内容是一致的,例如:季节用电高峰、电量等级、供电电压、城市分类;这将这些标签内容标记为相关内容。

步骤S10223:将所述相关内容及对应的标签信息设置为目标用户的第一画像信息。

具体的,即将相关用户的季节用电高峰、电量等级、供电电压、城市分类作为目标用户的所述第一画像信息。

实施例四

的第四实施例中,基于第一实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的步骤S104还包括如下步骤:

步骤S1041:将目标用户未拥有的且相关用户拥有的标签信息标记为待预测标签。

具体的,例如:目标用户的画像信息尚未拥有能源消费等级这一标签信息,且相关用户的画像信息用于这一标签信息,则能源消费等级为目标用户对应的待预测标签。

步骤S1042:建立基于深度学习的GRU算法模型。

步骤S1043:将相关用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练。

步骤S1044:通过完成训练的基于深度学习的GRU算法模型预测得到目标用户的待预标签和对应的标签内容,并作为所述第三画像信息。

具体的,通过关联数据信息以及最近邻算法维度得到目标用户的第一画像信息和第二画像信息可能还是不能够全面反映目标用户的画像,即目标用户的部分标签信息还是没有,就可以通过深度学习已有画像信息的相关用户的部分标签。 首先,将相关用户的部分标签信息进行模型训练,生成训练模块,部分标签为目标用户不携带的标签。在本专利中,系统通过多维度已经预测到目标用户的大部分画像信息,其余的可以通过深度学习进行预测。

首先生成基于深度学习的GRU算法模型,然后将已有画像信息的系统用户的部分标签信息对模型进行训练,这里的其中部分标签信息为目标用户尚未拥有的标签信息,例如,通过上述步骤,系统已经预测到目标用户的行业分类,电量等级、营业额以及城市分类等标签信息,但是关于能源活动这个标签信息尚不具备,则可以将与目标用户具有关联性的系统用户的能源活动这一标签信息及对应的标签内容进行深度学习,以得到目标用户的能源活动这一标签信息,以及对的标签内容。并将能源活动这一标签信息,以及对的标签内容作为目标用户的第三画像信息。

GRU算法(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network,RNN)的一种。和LSTM(Long-Short Term Memory)一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。

RNN适合分析处理时间序列数据,因为RNN在网络中引入了循环单元结构,并允许隐藏单元之间的内部连接,使探索非连续数据之间的时间关系成为可能。但RNN存在梯度消失的问题,导致随着时间间隔不断增大,RNN会丧失学习过去较久远信息的能力。

LSTM神经网络的提出解决了RNN梯度消失的问题,已被广泛应用于预测时间序列数据领域中,近年来根据不同的需求也演变出许多变体。GRU作为LSTM的一种变体,采用门控循环神经网络结构,相比 LSTM训练参数较少,又同时保持了LSTM 的预测效果。

GRU算法内部单元与LSTM的内部单元很相似,不同之处为GRU将LSTM中的输入门和遗忘门合成一个单一的更新门。因此,GRU中只有两个门结构,分别为更新门和重置门。更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多。重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。

如附图2所示,GRU算法的输入输出结构与普通的RNN是一样的。

有一个当前节点t的输入值x

结合输入值x

通过上一个节点传输下来的状态h

具体的,如附图3所示,其中,r控制重置的门控(reset gate),z为控制更新的门控(update gate)。

得到门控状态之后,使用重置门控来得到重置之后的数据h

将拼接后的数据通过tanh激活函数放缩到[-1~1]的范围内,以得到当前节点状态候选状态h

具体的,得到当前节点状态h

将当前节点状态候选状态h

具体的,本步骤使用先前得到的更新门控z(update gate),称之为“更新记忆阶段”。

实施例五

的第五实施例中,基于第四实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的所述门控状态包括更新门状态和重置门状态;更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多;重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。

实施例六

基于五实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的所述将当前节点状态h

其中,z为更新门状态,

实施例七

基于第一实施例或第六实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的步骤S105包括如下步骤:

将第一画像信息、第二画像信息和第三画像信息打包形成目标用户对应的最终画像信息。

具体的,通过多维度计算得到目标用户的画像信息,可能会存在类似的数据信息,具体的,系统提取类似的数据信息,将数据信息进行综合整理,统计出最精确的数据信息。

再通过筛选第一画像信息、第二画像信息以及第三画像信息类似的标签信息进行综合;结合第一画像信息、第二画像信息以及第三画像信息确定目标用户的最终画像信息。

综上所述,本实施例利用“能源大脑”丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

相关技术
  • 能源用户的用户画像刻画方法
  • 基于差分演化算法的用户画像刻画方法及服务器
技术分类

06120115571454