掌桥专利:专业的专利平台
掌桥专利
首页

高耗能行业中用电用户的分类与异常行为监测方法及系统

文献发布时间:2023-06-19 18:37:28


高耗能行业中用电用户的分类与异常行为监测方法及系统

技术领域

本发明涉及电力系统领域,更具体的,涉及一种高耗能行业中用电用户的分类与异常行为监测方法、系统、装置及介质。

背景技术

电力能源构成了现代社会人们的生产生活基础,从生活用电到工厂用电,社会发展离不开电力驱动,同时产生大量电力数据。面对未来电网在新能源广泛接入、大电网互联和市场放开环境下运行特征的开放性、不确定性和普遍关联性,大数据能够以全量数据反映系统特征,提供全景式全过程的分析视角。

基于人工智能的高耗能客户行业分类与异常识别方法能够有效弥补在线检测对比方式不能识别复杂用电行为的缺点,人工智能算法能够按数据有无标签分为有监督异常检测和无监督异常检测。有监督检测需要从数据中心获取大批数据,按照一定的合理比例将数据分为训练集与测试集,在利用训练集训练并逐渐优化异常检测模型后,使用测试集验证。背景技术文献Improving SVM-Based Nontechnical Loss Detection in PowerUtility Using the Fuzzy Inference System,Yap K等公开了一种利用支持向量机建立了欺诈检测模型来进行异常检测的方法,这种方法能够研究电力客户消费习惯提取消费特征,检测不规范消费行为,选择可疑客户进行现场检查。Decision Tree and SVM-BasedData Analytics for Theft Detection in Smart,Jindal A等提出了一种基于决策树的方法,能够将决策树处理后的数据作为输入输送到支持向量机分类器中,并实时检测和定位输配电网络各层面的窃电行为,实验结果表明,该方法在一定程度上降低了窃电行为误报率,并具有一定的实时性。利用上述算法的前提条件是为不确定的电力数据集提供相应的用户标签,从而以有监督的形式实现分类与异常检测。

然而,现有技术中,用电数据呈现出海量无规则的特征,仅采用有监督的智能算法,就需要在为用户提供合理标签的过程中消耗大量的资源。但是,随着电力行业中业务模式的快速发展,传统的“人海战术”难以满足现代化管理需求。但是,目前为止,高耗能客户用电监测仍然依赖于现场检查和业务人员的经验,投入人力多,排查周期较长,运营成本较高,核查工作无法高频开展,对于高耗能客户的用电监测和分析无法做到全时度、全覆盖。

在日常工作中,高耗能用电用户为了降低企业用电成本,常常会擅自调整内部运行方式,转移高耗能计量点用电负荷,进而达到规避高耗能上浮电价以及差别电价影响。电力客户受市场影响过程中,部分企业选择厂房租赁、企业转型,导致客户实际行业分类发生变化,然而,在相应的用户管理系统中,这些客户的用电信息并不会非常及时与准确的随之发生变更,这就会导致用户标签不够准确。

除此之外,夏季高温时,居民用电负荷呈上升趋势,局部地区电力供应出现短期缺口,政府联合电力公司采取需求侧响应、有序用电等手段,优先调节高耗能客户用电负荷,保障人民群众基本生活需要。然而,在用能紧张的情况下,部分高耗能客户为获取经济利益,通过引入外部电源方式保证企业正常生产,躲避政府等有关单位检查,这将会导致电力系统在运行过程中发生用能不足的危险,甚至会导致系统故障的发生。

可见,面对不具备用户标签的电力数据集来说,需要进行无监督的异常检测。在无监督异常检测中,为了确定异常客户需要大幅提高检测成本,Sun Y等人在An improvedmethod for detecting outliers in electricity consumption data of electricpower users based on Gaussian kernel function中提出一种组合异常检测方法,首先使用模糊聚类算法将客户初步分类,然后使用主成分分析对高维特征降维,最后使用结合了改进的局部高群因子的算法进行异常检测,结果表明该方法模型稳定,检测准确率较高。另外,Tian L等人在An abnormal analysis algorithm of electricity consumption inpower system based on density clustering technology也使用密度聚类技术,选择离群数据刻画其离群度,然后构造相关法则对当前用电量进行评分,最后通过异常用电百分比来识别异常用电客户,实验结果显示使用的方法能高效识别异常用电客户。Zhuang C等人在Detection of abnormal power consumption patterns of power users based onunsupervised learning中提及,在提取电力客户的高维特征后通过主成分分析降维映射至二维以便于计算出局部离群因子,然后通过网格选择筛出低密度域数据,并对用电行为异常度进行排序,实验结果表明只需检查排序靠前的电力客户即可筛除大多数异常用电客户,提高了检测效率。

然而,上述方法虽然能够采用无监督方式实现用户的分类与异常检测,但是算法复杂度较高,能够容纳的数据量较少。另外,由于原始电力数据的复杂度逐渐升高,数据多样性的逐渐增强,上述方式通常需要剔除大量的形态复杂但判别准确度高的有用数据,同时也难以从原始数据中提取出最为准确的数据特征。

进一步的,随着不同的高耗能行业中用电用户的用电特征具备越来越多的特异性特征,以行业为维度对于用电用户的行为进行分析的需求显得越发重要。但是,以行业为维度对用电用户进行精准划分,就会导致一个地区内的行业用户的样本数据量十分有限,这导致在样本数据稀缺的前提下,数据分类和异常检测的依据不够全面,检测结果不够准确。

针对上述问题,亟需一种高耗能行业中用电用户的分类与异常行为检测方法及系统。

发明内容

为解决现有技术中存在的不足,本发明提供一种高耗能行业中用电用户的分类与异常行为检测方法、系统、装置及介质,通过提取数据特征生成行业样本噪声,并将样本噪声添加至样本数据集中,采用动态时间规整的K-means算法实现用户的分类与异常检测。

本发明采用如下的技术方案。

本发明第一方面,涉及一种高耗能行业中用电用户的分类与异常行为检测方法,方法包括以下步骤:步骤1,采集高耗能行业中用电用户的用电数据并提取数据特征,以将数据特征作为用电样本数据;步骤2,分析高耗能行业的行业特征从而生成行业样本噪声,并将行业样本噪声增加至用电样本数据中,以构建样本数据集;步骤3,以动态时间规整函数的取值作为样本距离,采用K-means聚类算法对样本数据集中的样本进行分类和异常行为检测。

优选的,用电用户的用电数据包括用户档案数据和实时运行数据;其中,实时运行数据中包括用户信息、用户实时功率、用户日电量、用户月电量、用户计量点电流曲线。

优选的,步骤1中还包括:步骤1.1,采用流形学习方法对用电数据进行降维,以对用电数据进行重构;步骤1.2,采用元学习方法从重构后的用电数据中提取元知识;步骤1.3,基于低秩张量分解、多模态生成对抗网络和多模态自编码方法对元知识进行融合,以生成数据特征。

优选的,对于数据特征进行数据清洗;数据清洗包括一致性检验、缺失值处理、无效值处理和数据归一化。

优选的,提取高耗能行业中每一类行业的用电负荷曲线,并基于用电负荷曲线的特征获取行业样本噪声。

优选的,动态时间规整函数的取值为当前样本与聚类中心之间的最短规整路径的距离累积值。

优选的,K-means聚类算法为二分K-means聚类算法。

本发明第二方面,涉及一种高耗能行业中用电用户的分类与异常行为检测系统,系统用于实现本发明第一方面中方法的步骤;并且,系统包括数据采集单元、样本构建单元和数据处理单元;其中,数据采集单元,用于采集高耗能行业中用电用户的用电数据并提取数据特征,以将数据特征作为用电样本数据;样本构建单元,用于分析高耗能行业的行业特征从而生成行业样本噪声,并将行业样本噪声增加至所述用电样本数据中,以构建样本数据集;数据处理单元,用于以动态时间规整函数的取值作为样本距离,采用K-means聚类算法对样本数据集中的样本进行分类和异常行为检测。

本发明第三方面,涉及一种高耗能行业中用电用户的分类与异常行为检测装置,装置包括处理器及存储介质;其中,存储介质用于存储指令;处理器用于根据指令进行操作以执行本发明第一方面中方法的步骤。

本发明第四方面,涉及一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面中方法的步骤。

本发明的有益效果在于,与现有技术相比,本发明中的一种高耗能行业中用电用户的分类与异常行为检测方法、系统、装置及介质,能够提取数据特征生成行业样本噪声,并将样本噪声添加至样本数据集中,从而采用动态时间规整的K-means算法实现用户的分类与异常检测。本发明思路清晰,算法准确,充分扩展了行业用户样本数据,使得样本分类和异常检测能够针对行业特征开展,提高了检测效率与置信度。

本发明的有益效果还包括:

1、本发明能够通过多模态数据融合的方式融合高耗能行业客户用电数据,并研究高耗能行业用电特性,基于特征提取方法获得高耗能行业用电用户的时空特征信息,并通过数据清洗、数据增强等方式构建充足的模型样本数据,使用动态时序规整(DTW)计算不同用电序列间的距离矩阵,使用无监督学习改进K-Means算法对高耗能行业客户用电数据进行聚类,通过无监督聚类完成高耗能行业客户分类与异常用电行为识别。

2、欧式距离在处理时间序列间的距离度量时受限于等长的时间序列,而动态时间规整方法DTW却不存在这样的限制,DTW在分析时序数据时比欧式距离的应用范围更加广泛。所采用的二分K-Means算法克服了传统K-Means算法收敛于局部最小值的问题,提高了模型的稳定性。具体而言,通过借鉴“半监督学习”的思想,为克服难以从无标注信息中进行学习的问题,本模型在标签数据上训练模型,然后使用经过训练的模型来预测无标签数据的标签,从而创建伪标签,也就是本申请中的行业样本噪声,将标签数据和新生成的伪标签数据结合起来作为新的训练数据。

附图说明

图1为本发明一种高耗能行业中用电用户的分类与异常行为检测方法的步骤流程示意图;

图2为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中样本数据集的构建过程示意图;

图3为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中动态时间规整的原理示意图;

图4为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中动态时间规整中样本距离矩阵的示意图;

图5为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中高耗能行业异常客户、正常客户的样本曲线示意图;

图6为本发明一种高耗能行业中用电用户的分类与异常行为检测系统的模块架构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清晰,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本发明所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有做出创造性劳动的前提下,根据本发明中记载的实施例而获得的所有其它本发明中未记载的实施例,都应当属于本发明的保护范围。

图1为本发明一种高耗能行业中用电用户的分类与异常行为检测方法的步骤流程示意图。如图1所示,本发明第一方面,涉及一种高耗能行业中用电用户的分类与异常行为检测方法,方法包括步骤1至3。

步骤1,采集高耗能行业中用电用户的用电数据并提取数据特征,以将数据特征作为用电样本数据。

本发明中的用电用户,可以由国家电网的电量表和计量表等电力检测设备构成的电力信息采集网络采集。具体的,可以通过各个电量表、计量表等电力检测设备所采集的各类别高耗能行业客户实时功率、客户日电量、计量点电流曲线等用电数据。

优选的,用电用户的用电数据包括用户档案数据和实时运行数据;其中,实时运行数据中包括用户信息、用户实时功率、用户日电量、用户月电量、用户计量点电流曲线。

可以理解的是,构建本发明中的分类与异常行为检测模型,需要收集与有关行业用电客户相关的数据信息。本发明中,根据数据的来源和形式的不同可以划分为档案数据和实时运行数据。由于本发明中希望基于行业细分来获取同一个行业下的用户特征,因此,为了保证数据来源的充分性,将现有技术中并不常用的档案数据增加至于用电数据中来,并通过特征提取的方式有效的将格式难以定义、特征难以提取的档案数据中的特征充分挖掘并作为样本数据集的一部分。

本发明中,可以拉取各个行业客户用电曲线数据,存储进数据库指定表中。具体来说,可以截取需要研判的各个行业客户的关键字段,包括客户名称,以及与之对应的电表客户编号,然后利用客户编号从数据中台全量表中拉取待研判全行业客户用电数据,再从全行业客户用电数据中拉取指定行业客户用电数据。

本发明中,原始的用电数据并不能够直接作为样本数据集,而是需要首先提取数据特征。这里可以对所获取的多模态高耗能行业用电数据利用流形学习和元学习方法充分提取高耗能行业用电数据的序列特征。

优选的,步骤1中还包括:步骤1.1,采用流形学习方法对所述用电数据进行降维,以对所述用电数据进行重构;步骤1.2,采用元学习方法从重构后的用电数据中提取元知识;步骤1.3,基于低秩张量分解、多模态生成对抗网络和多模态自编码方法对元知识进行融合,以生成数据特征。

可以理解的是,本发明中为了获取到多个不同行业的行业用户特征,首先需要从原始样本数据中提取数据特征以供判别。具体来说,本发明中可以首先对于用电数据进行数据降维。

在电力系统的实际场景中,数据样本的维度是较高维的,且分布比较复杂,但是局部是具有欧式空间性质的,所以本发明中的数据降维采用流形学习的方式,相较于主成分分析方法能够更好的将数据从高维空间降维到低维空间,还不会过多的损失信息。

另外,本发明采用元学习方法提取特征,并采用低秩张量分解去除冗余数据,减少参数数量。同时,采用多模态生成对抗网络来提高跨域数据的识别程度,并实现了不同来源数据的较好融合。最后,本发明采用多模态自编码方法实现数据的融合与重建,从而最终获取到数据特征。

本发明中这里获取到的数据特征能够充分的表征原始的用电数据,因此可以作为用电样本数据,在添加了行业噪声后,可以形成样本数据集从而实现样本的分类。

步骤2,分析高耗能行业的行业特征从而生成行业样本噪声,并将行业样本噪声增加至用电样本数据中,以构建样本数据集。

本发明中的行业样本噪声,可以是根据已知确定的不同行业的典型用户的用电情况特征曲线等数据获得的。具体来说,高耗能行业指生产过程中能耗强度较大,所消耗的一次能源或二次能源比重比较高的企业。根据《国民经济行业分类》(GB/T4754-2017),高耗能行业共计包括6大行业,分别为石油煤炭及其他燃料加工工业、化学原料和化学制品制造业、非金属矿物制品业、黑色金属冶炼和压延加工业、有色金属冶炼和压延加工业、电力热力生产和供应业。

需要说明的是,本发明中的数据特征不能直接用来作为样本数据集,在此之前还需要进行数据清洗。

图2为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中样本数据集的构建过程示意图。如图2所示,优选的,对于数据特征进行数据清洗;数据清洗包括一致性检验、缺失值处理、无效值处理和数据归一化。

具体的,数据清洗过程的主要加工处理对象是脏数据。脏数据本身具有的不一致和不准确性等特点,直接影响了数据的显式隐式价值,即直接影响了数据的质量。

一致性检验,即检查数据表中各字段与数据源是否存在一一对应关系,检查字段的合法性,检查数据表处理后的结果是否具有唯一性。ICC(Interclass CorrelationCoefficient,组内相关系数)可用于研究评价一致性,评价信度,测量复测信度(重测信度)等。相对于Kappa系数,ICC组内相关系数的适用范围更广,适用于定量或者定类数据,而且可针对双样本或者多样本进行分析一致性。但ICC的分析相对较为复杂,通常需要从三个方面进行分析并且选择最优的ICC模型,分别是模型选择、计算类型和度量标准。因此,本发明综合考虑选用了ICC模型实现对特征数据的一致性检验。

缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。对于电网数据,可能因为计量点的数据收集或者数据保存失败,导致数据缺失问题。关于缺失值处理的方法,本发明中包括:删除、插补、不处理缺失值。

无效值或者异常值是指那些在数据集中存在的不合理的值,数据集中的异常值可能是由于传感器故障、人工录入错误或异常事件导致。这些异常值在某些场景下会导致结论的错误。针对异常值的检测,本发明中可以采用简单统计分析、3σ原则、箱线图等;异常值处理方法包括删除、视为缺失值、平均值修正、盖帽法、分箱法、回归插补、多重插补以及不处理等多种方法。

数据的归一化就是将数据值按照某种数学方法进行处理,将其限制在制定的区间内。通常聚类分类算法中,使用归一化可以避免较大初值的指标相比于较小初值指标其所占权重过大的问题。由于客户用电曲线数据在用电期间随时间序列变化较为稳定,且总体曲线峰值与谷值相差较大,因此本方法中使用Z-score归一化方法对负荷数据进行数据归一化处理。

具体来说,在负荷数据归一化中,假设负荷数据序列L=(l

其中,μ为负荷数据的均值;σ为负荷数据的标准差。

优选的,提取高耗能行业中每一类行业的用电负荷曲线,并基于用电负荷曲线的特征获取所述行业样本噪声。

本发明中,基于电网数据中台构建高耗能行业用电功率表以及曲线图,通过对曲线特征分析发现相同行业客户用电规律相近。如水泥制造行业通常于0点-8点为用电高峰,能耗波动较为平稳,推测为生产时间段,基于该特点采用数据融合的方式形成新特征,即针对不同行业的特征数据生成新的噪声数据,在数据输入模型之前对其进行添加噪声处理,即添加干扰曲线样本,从而提高模型的鲁棒性和泛化性。

步骤3,以动态时间规整函数的取值作为样本距离,采用K-means聚类算法对样本数据集中的样本进行分类和异常行为检测。

该方法中的分类模型基于改进的K-Means聚类算法,传统的K-Means聚类算法具有算法原理简单、收敛速度快、聚类效果较优、算法的可解释性较强等优点,但其对初始选取的K比较敏感,对于K选取不合适时,容易进入局部最小值,得不到全局最优解,且由于每一次迭代过程之中都会产生新的聚类中心,因而时间开销较大。该算法把所有数据初始化为一个簇,将这个簇分为两个簇;同时选择满足条件的可以分解的簇:选择条件需综合考虑簇的元素个数以及聚类代价(误差平方和SSE),误差平方和的公式如下所示,其中w(i)表示权重值,y

随后,使用K-Means算法将可分裂的簇分为两簇;并一直重复上述步骤,直到满足迭代结束条件。

针对电力客户用电数据体量大、分布广的特性,利用改进的二分K-Means自聚类算法建立局部数据模型,对传统聚类算法进行修正,克服了传统K-Means算法对异常数据敏感和初始聚类中心的随机性问题,提高了算法的有效性和高效性,增强了聚类精确度。

优选的,动态时间规整函数的取值为当前样本与聚类中心之间的最短规整路径的距离累积值。

图3为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中动态时间规整的原理示意图。如图3所示。K-Means算法作为基于欧氏距离的传统聚类算法,在处理时序数据时,适用性并不强,因此我们选择更为合适的相似性度量方式即动态时间规整方法(Dynamic Time Warping,DTW)来处理时序数据。本发明中,可以采用动态时间规整的方式来计算每一个样本距离样本中心之间的距离,并根据该距离替代原有的欧式距离。

图4为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中动态时间规整中样本距离矩阵的示意图。如图4所示,本发明通过动态时间规整样本来获得样本距离矩阵,并基于该矩阵求解最短规整路径上的距离累计值,并将该距离累积值作为样本距离,作为聚类的依据。通过DTW对序列数据之间的距离进行规整优化,能有效提高模型分类与异常检查的准确性。

通过上述方法,本发明中可以对用电数据经过模型分类进行研判并实现结果输出。由于同一行业内电力客户用电数据在相同时间序列相同时刻不尽相似,但其整体上具有高度相似性,在本方法中,也可以采用动态时间规整(DTW)作为异常识别模型的相似性度量方式。

高耗能行业分类与异常检查的目标是根据任意给定客户的用电曲线,通过模型对其进行行业分类并给出用电异常概率,从而对各个行业内客户用电进行严格把控。异常识别分析基于各个行业客户的用电曲线,对其分类与异常检查结果进行输出,概率为1则表示该客户的用电规律符合其行业用电特征,概率越低,则表示经过模型判断该客户用电规律越不符合行业用电特征。

图5为本发明一种高耗能行业中用电用户的分类与异常行为检测方法中高耗能行业异常客户、正常客户的样本曲线示意图。如图5所示,其中包含某行业内所有客户研判输出结果及部分正常客户和异常客户用电曲线对比示意图,结合二者可以看出,本方法中的模型具有较好的分类与异常检查效果。

可见,本发明解决了各个行业内高耗能客户分类及用电异常检查等技术问题,实现异常客户用电的有效检测与识别,具有运算效率高,预测精度高强,能充分捕捉客户用电电力特征等优点。本发明可以为客户用电曲线研究提供一种方法,为今后电力系统管控提供思路与理论依据,对客户用电进行精准把控,设定客户用电规范,具有一定的参考价值和实际经济效益。

图6为本发明一种高耗能行业中用电用户的分类与异常行为检测系统的模块架构示意图。如图6所示,本发明第二方面,涉及一种高耗能行业中用电用户的分类与异常行为检测系统,系统用于实现本发明第一方面中方法的步骤;并且,系统包括数据采集单元、样本构建单元和数据处理单元;其中,数据采集单元,用于采集高耗能行业中用电用户的用电数据并提取数据特征,以将数据特征作为用电样本数据;样本构建单元,用于分析高耗能行业的行业特征从而生成行业样本噪声,并将行业样本噪声增加至用电样本数据中,以构建样本数据集;数据处理单元,用于以动态时间规整函数的取值作为样本距离,采用K-means聚类算法对样本数据集中的样本进行分类和异常行为检测。

本发明第三方面,涉及一种高耗能行业中用电用户的分类与异常行为检测装置,装置包括处理器及存储介质;其中,存储介质用于存储指令;处理器用于根据所述指令进行操作以执行根据本发明第一方面中方法的步骤。

可以理解的是,高耗能行业中用电用户的分类与异常行为检测装置为了实现上述本申请实施例提供的方法中的各功能,包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对高耗能行业中用电用户的分类与异常行为检测装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

装置包括至少一个处理器,总线系统以及至少一个通信接口。处理器可以是中央处理器(Central Processing Unit,CPU),还可以由现场可编程逻辑门阵列(FieldProgrammable Gate Array,FPGA)、专用集成电路(Application-specific integratedcircuit,ASIC)或其他硬件代替,或者,FPGA或其他硬件与CPU共同作为处理器。

存储器可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-onlymemory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。

硬盘可以为机械盘或固态硬盘(Solid State Drive,SSD)等。接口卡可以是主机总线适配器(Host Bus Adapter,HBA)、独立硬盘冗余阵列卡(Redundant ArrayofIndependent Disks,RID)、扩展器卡(Expander)或网络接口控制器(NetworkInterfaceController,NIC)等,本发明实施例对此不作限定。硬盘模组中的接口卡与硬盘通信。存储节点与硬盘模组的接口卡通信,从而访问硬盘模组中的硬盘。

硬盘的接口可以为串行连接小型计算机系统接口(Serial AttachedSmallComputer System Interface,SAS)、串行高级技术附件(Serial AdvancedTechnologyAttachment,SATA)或高速串行计算机扩展总线标准(PeripheralComponentInterconnect express,PCIe)等。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,简称DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,简称SSD))等。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

本发明第四方面,涉及一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面中方法的步骤。

本发明的有益效果在于,与现有技术相比,本发明中的一种高耗能行业中用电用户的分类与异常行为检测方法、系统、装置及介质,能够提取数据特征生成行业样本噪声,并将样本噪声添加至样本数据集中,从而采用动态时间规整的K-means算法实现用户的分类与异常检测。本发明思路清晰,算法准确,充分扩展了行业用户样本数据,使得样本分类和异常检测能够针对行业特征开展,提高了检测效率与置信度。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

技术分类

06120115635808