掌桥专利:专业的专利平台
掌桥专利
首页

一种用户用气量异常检测方法及装置

文献发布时间:2023-06-19 12:27:31


一种用户用气量异常检测方法及装置

技术领域

本发明属于燃气检测技术领域,具体涉及一种用户用气量异常检测方法及装置。

背景技术

燃气用户的用气量经常存在异常现象。造成用气量不正常的原因可能是装修、停业、更换设备、偷盗气即用户非法用气等。用户非法用气,是指用气用户通过非法手段影响或破坏表具,使得表具不能正常计数或无法计数;或是通过私自改装燃气供气管道,装载分支管道,使得用户使用的燃气不经过表具计数,实现私自盗气等行为。关于辨识用气异常用户的相关文献非常有限,2019年李曼曼等发表的《餐饮用户用气量异常数据查询方法的研究与验证》一文当中,论述了用最小日用气时间作为辨识餐饮用户用气异常的指标的可行性。

目前,一般采用统计法进行用户用气量异常检测:构建一个概率分布模型,并计算对象符合该模型的概率,将具有低概率的对象视为异常点。比如特征工程中的RobustScaler方法,在做数据特征值缩放的时候,它会利用数据特征的分位数分布,将数据根据分位数划分为多段,只取中间段来做缩放,比如只取25%分位数到75%分位数的数据做缩放。这样减小了异常数据的影响。假设给定的数据集服从一个随机分布(如正态分布等),用不一致性测试识别异常。统计法存在问题是:在许多情况下,用户并不知道这个数据分布;而且现实数据也往往不符合任何一种理想状态的数学分布;即使在低维(一维或二维)时的数据分布已知,在高维情况下,估计数据点的分布是极其困难的。另外,统计法不适应用户正常行为的突然改变。统计法的上述不足导致其误报率和漏报率较高,很难满足异常检测的精度要求。

发明内容

为了解决现有技术中存在的上述问题,本发明提供一种用户用气量异常检测方法及装置。

为了实现上述目的,本发明采用以下技术方案。

第一方面,本发明提供一种用户用气量异常检测方法,包括:

定期获取小区内用户的用气量s和用气时间t,得到每个用户的二维用气数据(s,t);

计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离;

如果所述距离小于设定阈值r的用户数量与小区内用户总数的比小于设定阈值τ,则被检测用户的用气量异常。

进一步地,两个用户的二维用气数据之间的距离按下式计算:

式中,d

进一步地,所述方法还包括:从所述小区中去掉非入住用户后再进行异常检测,非入住用户为一定时间内用气量和用气时间均为0的用户。

进一步地,所述方法还包括:先将所述小区内的用户分为居民用户和非居民用户两类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

进一步地,所述方法还包括:先将所述小区内的用户按照用气量大小分类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

第二方面,本发明提供一种用户用气量异常检测装置,包括:

数据获取模块,用于定期获取小区内用户的用气量s和用气时间t,得到每个用户的二维用气数据(s,t);

距离计算模块,用于计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离;

异常判定模块,用于当所述距离小于设定阈值r的用户数量与小区内用户总数的比小于设定阈值τ时,判定被检测用户的用气量异常。

进一步地,两个用户的二维用气数据之间的距离按下式计算:

式中,d

进一步地,所述装置还包括剔除非入住用户模块,用于从所述小区中去掉非入住用户后再进行异常检测,非入住用户为一定时间内用气量和用气时间均为0的用户。

进一步地,所述装置还包括第一分类模块,用于先将所述小区内的用户分为居民用户和非居民用户两类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

进一步地,所述装置还包括第二分类模块,用于先将所述小区内的用户按照用气量大小分类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

与现有技术相比,本发明具有以下有益效果。

本发明通过定期获取小区内用户的用气量和用气时间,得到每个用户的二维用气数据,计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离,如果所述距离小于设定阈值的用户数量与小区内用户总数的比小于设定阈值,则判定被检测用户的用气量异常,实现了用户用气量是否异常的自动检测。当某一用户的正常用气行为突然改变时,由于其他用户的二维用气数据与该用户的二维用气数据的距离均明显发生改变,因此采用本发明所述方法可有效检测该用户的用气量是否异常,降低了误报率和漏报率,提高了异常检测的精度。

附图说明

图1为本发明的实施例一种用户用气量异常检测方法的流程图。

图2为本发明的实施例一种用户用气量异常检测装置的方框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例一种用户用气量异常检测方法的流程图,所述方法包括以下步骤:

步骤101,定期获取小区内每个用户的用气量s和用气时间t,得到每个用户的二维用气数据(s,t);

步骤102,计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离;

步骤103,如果所述距离小于设定阈值r的用户数量与小区内用户总数的比小于设定阈值τ,则被检测用户的用气量异常。

本实施例中,步骤101主要用于定期获取小区内用户的用气数据。用户的用气数据可以从燃气业务系统中获取。燃气的数据一般不是单一的用气量字段,而是强关联性的结构化类型数据。因此,对于一条燃气数据或一条燃气用户数据,包含了大量的信息结构化数据,如用户ID,用户日用气量,用户卡表类型,用户近一年缴费次数等。值得说明的是,为了提高异常检测的精度,本实施采用二维用气数据,即不仅包括用气量,还包括用气时间。定期的意思是指按照一定的周期进行检测,比如一个月或一季度、一年检测一次。检测周期不宜太短,周期太短容易误判;当然也不宜太长,周期太长不能及时发现异常情况。一般一个月或一季度检测一次。

本实施例中,步骤102主要用于计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离。两个数据之间的距离就是将每个数据用一维数轴或二维平面或多维空间上的点表示后,两点之间的距离。两个数据之间的距离大小反映了两个数据之间的相似程度或接近程度。距离的种类很多,如欧氏距离、切比雪夫距离、闵可夫斯基距离等。最常用的是欧氏距离,两点之间的欧氏距离等于连接这两个点的线段的长度。本实施例对距离的种类不做具体限制。

本实施例中,步骤103主要用于判定被检测用户的用气量是否异常。通俗地讲,本实施例检测用气量是否异常的原理是判断用气数据点是否“合群”,如果不“合群”,则用气量异常。这是基于绝大多数用户的用气量都正常且任意两个正常用户的二维用气数据之间的距离都比较小这一事实设计的检测策略。本实施例的检测方法实际上是:以被检测用户的数据点为圆心,以r为半径画圆,如果位于圆内的数据点数与总数据点数的比值小于设定阈值τ,则认为被检测用户的用气量异常。所述比值越小,说明圆心越不“合群”,用气量异常的可能性越大。r、τ的大小直接影响判定结果,因此二者大小的选取非常重要,一般根据经验和反复实验确定。

本实施例的检测方法非常适用由正常用气突然变为不正常的情况。这种情况发生时,相当于圆心和圆同步向远离“群”的方向偏移,使圆内的数据点数明显减小,从而使所述比值由原来的大于τ变为小于τ。因此,本实施例所述方法可降低误报率和漏报率,提高异常检测的精度。

作为一可选实施例,两个用户的二维用气数据之间的距离按下式计算:

式中,d

本实施例给出了计算两个二维用气数据之间距离的一种技术方案。本实施例采用欧氏距离衡量两个二维用气数据之间的远近。欧氏距离的计算公式如上式所示,实际上是平面解析几何中两点之间距离的计算公式。

作为一可选实施例,所述方法还包括:从所述小区中去掉非入住用户后再进行异常检测,非入住用户为一定时间内用气量和用气时间均为0的用户。

在本实施例中,为了提高检测精度,先从小区中去掉非入住用户,然后再按照前述方法进行异常检测。非入住用户是指在一定时间内用气量和用气时间均为0的用户。显然,非入住用户是不“合群”用户,如果不剔除非入住用户,不但会将非入住用户判为异常,还会因为其影响小区用户总数而对其他用户的异常检测造成影响。

作为一可选实施例,所述方法还包括:先将所述小区内的用户分为居民用户和非居民用户两类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

在本实施例中,将小区内的用户分为居民用户和非居民用户两类。非居民用户包括工厂、饭店、大型商业综合体等。相对居民用户,非居民用户普遍具有用气量大、压力高、人员密集的特点。为了提高检测精度,针对这两类用户分别设置不同的阈值r、τ进行异常检测。

作为一可选实施例,所述方法还包括:先将所述小区内的用户按照用气量大小分类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

本实施例与上一实施例的构思相似,都是通过对小区用户进行分类,对每类用户采用不同的阈值r、τ进行异常检测。与上一实施例不同的是,本实施例直接按照用气量大小或用气量级别对用户进行分类,可以分成两个以上的更多的类别,因此,对提高检测精度也更有利。

图2为本发明实施例用户用气量异常检测装置的组成示意图,所述装置包括:

数据获取模块11,用于定期获取小区内用户的用气量s和用气时间t,得到每个用户的二维用气数据(s,t);

距离计算模块12,用于计算被检测用户的二维用气数据与其他每个用户的二维用气数据之间的距离;

异常判定模块13,用于当所述距离小于设定阈值r的用户数量与小区内用户总数的比小于设定阈值τ时,判定被检测用户的用气量异常。

本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。后面的实施例也是如此,均不再展开说明。

作为一可选实施例,两个用户的二维用气数据之间的距离按下式计算:

式中,d

作为一可选实施例,所述装置还包括剔除非入住用户模块,用于从所述小区中去掉非入住用户后再进行异常检测,非入住用户为一定时间内用气量和用气时间均为0的用户。

作为一可选实施例,所述装置还包括第一分类模块,用于先将所述小区内的用户分为居民用户和非居民用户两类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

作为一可选实施例,所述装置还包括第二分类模块,用于先将所述小区内的用户按照用气量大小分类,然后针对每类用户分别设置不同的阈值r、τ进行异常检测。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种用户用气量异常检测方法及装置
  • 用户用电数据异常检测方法、装置、计算机设备
技术分类

06120113299048