掌桥专利:专业的专利平台
掌桥专利
首页

进行异常检测的方法、装置、设备及存储介质

文献发布时间:2023-06-19 16:08:01



技术领域

本申请涉及互联网技术领域,特别涉及一种进行异常检测的方法、装置、设备及存储介质。

背景技术

随着大数据、互联网技术的发展,企业在日常的运营过程中产生的业务数据越来越多。如该业务数据可以是企业中某个机房中不同的设备的运行参数。其中,不同的业务数据中可包括不同的业务参数,如业务数据为运行参数时,包括的业务参数可以有CPU占用率、耗电量、读取速率、进程数、启动时长等。

一般企业可以对日常的运营过程中产生的业务数据按照相应的时间段进行存储,其中,每个时间段内包括的业务数据可组成一个数据块。企业可以定期对数据块进行异常检测处理,如可以将业务数据中各业务参数对应的参数值组成参数向量,通过参数向量计算对应的业务数据之间的距离值,然后,根据距离值确定数据块中是否存在异常的业务数据。进而根据异常检测处理的检测结果,确定机房中是否存在运行异常的设备。

在目前的异常检测方法中,不同的业务参数对异常检测结果的影响相同。例如可能存在一些业务参数即使浮动较大也属于正常范围。但如此会对业务参数之间的距离值产生较大的影响,进而导致异常检测处理的准确性降低。

发明内容

本申请实施例提供了一种进行异常检测的方法、装置、设备及存储介质,能够提高进行异常检测的准确性。所述技术方案如下:

第一方面,提供了一种进行异常检测的方法,所述方法包括:

确定样本业务数据中多个业务参数对应的第一信息熵;

对于所述多个业务参数中的每个业务参数,计算所述多个业务参数中除所述业务参数外的其他业务参数对应的第二信息熵,基于所述第一信息熵与所述第二信息熵的差值,确定所述业务参数的参数权重值;

获取待进行异常检测的第一数据块,基于每个业务参数对应的参数权重值,对所述第一数据块进行异常检测,得到第一检测结果。

可选的,所述基于每个业务参数对应的参数权重值,对所述第一数据块进行异常检测,得到第一检测结果,包括:

对于所述第一数据块中的每个业务数据,将所述业务数据中每个业务参数的取值与对应的参数权重值相乘,得到所述业务数据对应的异常检测值;

基于所述第一数据块中各业务数据对应的异常检测值,对所述各业务数据进行异常检测,得到所述各业务数据对应第一检测结果。

可选的,所述对所述各业务数据进行异常检测,得到所述各业务数据对应第一检测结果之后,所述方法还包括:

基于所述第一数据块对应的生成时间,将所述第一数据块插入到数据块序列中;

如果所述第一检测结果指示所述第一数据块中存在第一业务数据为异常业务数据,则基于所述第一数据块、所述数据块序列中的第二数据块,对所述第一业务数据进行异常检测,得到第二检测结果,其中,所述第二数据块为所述第一数据块在所述数据块中相邻的数据块。

可选的,所述方法还包括:

如果所述第二检测结果中指示所述第一业务数据为异常业务数据,且确定所述第一数据块在所述数据块序列中相邻的第二数据块更新为第三数据块,则基于所述第一数据块、第三数据块对所述第一业务数据进行异常检测,得到第三检测结果。

可选的,所述方法还包括:

如果确定所述数据块序列中除头部数据块和尾部数据块外,存在预设数目个在生成时间上连续且不包括异常业务数据的第三数据块,则在所述数据块序列中删除所述第三数据块。

可选的,所述基于所述第一数据块中各业务数据对应的异常检测值,对所述各业务数据进行异常检测,得到所述各业务数据对应第一检测结果,包括:

对于所述第一数据块中的任意两个业务数据,确定所述两个业务数据对应的生成时间的时间差;

基于所述时间差,确定所述两个业务数据对应的时间权重值;

基于所述两个业务数据对应的异常检测值、时间权重值,确定所述两个业务数据对应的异常指示值;

对于每个业务数据,基于所述业务数据与其他业务数据对应的异常指示值,确定所述业务数据进行异常检测的第一检测结果。

可选的,所述异常指示值包括欧式距离或角度方差。

可选的,所述获取待进行异常检测的第一数据块,包括:

向存储设备发送数据块获取请求,所述数据块获取请求用于获取生成时间在指定时间段的多个数据块;

每当接收到所述存储设备发送的生成时间在指定时间段的任一数据块后,将所述任一数据块确定为所述第一数据块。

第二方面,提供了一种进行异常检测的装置,所述装置包括:

确定模块,用于确定样本业务数据中多个业务参数对应的第一信息熵;

计算模块,用于对于所述多个业务参数中的每个业务参数,计算所述多个业务参数中除所述业务参数外的其他业务参数对应的第二信息熵,基于所述第一信息熵与所述第二信息熵的差值,确定所述业务参数的参数权重值;

检测模块,用于获取待进行异常检测的第一数据块,基于每个业务参数对应的参数权重值,对所述第一数据块进行异常检测,得到第一检测结果。

可选的,所述检测模块,用于:

对于所述第一数据块中的每个业务数据,将所述业务数据中每个业务参数的取值与对应的参数权重值相乘,得到所述业务数据对应的异常检测值;

基于所述第一数据块中各业务数据对应的异常检测值,对所述各业务数据进行异常检测,得到所述各业务数据对应第一检测结果。

可选的,所述装置还包括插入模块,用于:

基于所述第一数据块对应的生成时间,将所述第一数据块插入到数据块序列中;

如果所述第一检测结果指示所述第一数据块中存在第一业务数据为异常业务数据,则基于所述第一数据块、所述数据块序列中的第二数据块,对所述第一业务数据进行异常检测,得到第二检测结果,其中,所述第二数据块为所述第一数据块在所述数据块中相邻的数据块。

可选的,所述检测模块还用于:

如果所述第二检测结果中指示所述第一业务数据为异常业务数据,且确定所述第一数据块在所述数据块序列中相邻的第二数据块更新为第三数据块,则基于所述第一数据块、第三数据块对所述第一业务数据进行异常检测,得到第三检测结果。

可选的,所述装置还包括删除模块,用于:

如果确定所述数据块序列中除头部数据块和尾部数据块外,存在预设数目个在生成时间上连续且不包括异常业务数据的第三数据块,则在所述数据块序列中删除所述第三数据块。

可选的,所述检测模块,用于:

对于所述第一数据块中的任意两个业务数据,确定所述两个业务数据对应的生成时间的时间差;

基于所述时间差,确定所述两个业务数据对应的时间权重值;

基于所述两个业务数据对应的异常检测值、时间权重值,确定所述两个业务数据对应的异常指示值;

对于每个业务数据,基于所述业务数据与其他业务数据对应的异常指示值,确定所述业务数据进行异常检测的第一检测结果。

可选的,所述异常指示值包括欧式距离或角度方差。

可选的,所述检测模块,用于:

向存储设备发送数据块获取请求,所述数据块获取请求用于获取生成时间在指定时间段的多个数据块;

每当接收到所述存储设备发送的生成时间在指定时间段的任一数据块后,将所述任一数据块确定为所述第一数据块。

第三方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述第一方面所述的进行异常检测的方法所执行的操作。

第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述第一方面所述的进行异常检测的方法所执行的操作。

第五方面,提供了一种计算机程序产品,所述计算机程序产品中包括至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述第一方面所述的进行异常检测的方法所执行的操作。

本申请实施例提供的技术方案带来的有益效果是:

在本申请实施例中对于每个业务参数,计算除去每个业务参数后的剩余其他业务参数的信息熵与所有业务参数的信息熵对应的差值,然后根据每个业务数据对应的差值,确定每个业务参数在所有业务参数中的权重占比(即参数权重值)。如此可以根据每个业务参数对应的参数权重值,对数据块中的业务参数进行异常检测,这样,不同的业务参数对异常检测结果的影响不同,能够提高进行异常检测的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种进行异常检测的方法流程图;

图2是本申请实施例提供的一种进行异常检测的方法流程图;

图3是本申请实施例提供的一种进行异常检测的方法示意图;

图4是本申请实施例提供的一种进行异常检测的方法流程图;

图5是本申请实施例提供的一种进行异常检测的方法示意图;

图6是本申请实施例提供的一种进行异常检测的装置结构图;

图7是本申请实施例提供的一种计算机设备的装置结构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

本申请提供的进行异常检测的方法可以由计算机设备执行。该计算机设备具备处理器和存储器,其中,存储器中可以存储有待进行异常检测的数据块以及用于实现本申请提供的异常检测处理对应的程序代码,处理器可用于加载并执行上述程序代码,对存储器中存储的待进行异常检测的数据块中包括的各业务数据进行异常检测处理。该计算机设备还可以具备通信功能,可以接入互联网等。当该计算机设备为终端时,该计算机设备可以是手机、平板电脑、智能穿戴设备、台式计算机、笔记本电脑等。当该计算机设备为服务器时,该服务器可以是一个单独的服务器也可以是一个服务器组,如果是单独的服务器,该服务器可以负责下述方案中的所有处理,如果是服务器组,服务器组中的不同服务器分别可以负责下述方案中的不同处理,具体的处理分配情况可以由技术人员根据实际需求任意设置,此处不再赘述。

随着大数据、互联网技术的发展,企业在日常的运营过程中产生的业务数据越来越多。如该业务数据可以是企业中某个机房中不同的设备的运行参数。其中,不同的业务数据中可包括不同的业务参数,如业务数据为运行参数时,包括的业务参数可以有CPU占用率、耗电量、读取速率、进程数、启动时长等。

一般企业可以对日常的运营过程中产生的业务数据按照相应的时间段进行存储,其中,每个时间段内包括的业务数据可组成一个数据块。企业可以定期对数据块进行异常检测处理,如可以将业务数据中各业务参数对应的参数值组成参数向量,通过参数向量计算对应的业务数据之间的距离值,然后,根据距离值确定数据块中是否存在异常的业务数据。进而根据异常检测处理的检测结果,确定机房中是否存在运行异常的设备。

在目前的异常检测方法中,不同的业务参数对异常检测结果的影响相同。例如可能存在一些业务参数即使浮动较大也属于正常范围。但如此会对业务参数之间的距离值产生较大的影响,进而导致异常检测处理的准确性降低。

信息熵是用于描述事件不确定性,常用于作为一个系统的信息含量的量化指标,信息熵越小对应的信息含量越高,也说明该信息对所属系统的影响就越大。在本申请实施例中,通过信息熵计算业务参数在业务数据中的权重,再根据业务参数对应的权重值进行异常检测。能够在一定程度上提高对业务数据进行异常检测处理的准确性。

相应的处理可参见的图1,图1为本申请实施例提供的一种确定参数权重值的方法流程图,该方法包括:

步骤101、确定样本业务数据中多个业务参数对应的第一信息熵。

样本业务数据可以在执行相应业务时产生的历史业务数据。例如,样本业务数据可以是机房中各计算机设备产生的业务数据,如可以是计算机设备对应的运行参数,包括周期检测的CPU占用率、进程数、耗电量、读取速率等。其中,在每个周期检测到的运行参数可为作为一条业务数据存储到相应的存储设备中。

样本业务数据可以由进行异常检测的计算机设备从存储业务数据的存储设备中获取,在获取样本业务数据后,计算机设备可以计算业务数据中多个参数对应的信息熵(后续可称为第一信息熵)。对于第一信息熵的计算可参见如下公式。

其中,y为需要进行信息熵计算的业务参数,P为概率函数,S(y)为y的取值范围。

信息熵的计算属于现有技术,本申请中不再进行详细介绍。

步骤102、对于多个业务参数中的每个业务参数,计算多个业务参数中除该业务参数外的其他业务参数对应的第二信息熵。

对应每个业务参数,可以计算除去该业务参数之外的其他业务参数对应的信息熵(后续可称为第二信息熵)。

步骤103、基于第一信息熵与第二信息熵的差值,确定业务参数的参数权重值。

其中,第一信息熵是由业务数据中所有的业务参数进行计算得到的,可用于指示业务数据中所有业务参数的信息量,第二信息熵是由业务数据中除指定业务数据外其他的业务参数进行计算得到的,可用于指示业务数据中除去指定业务参数的信息量。如此将第一信息熵与第二信息熵做差,可以得到指定业务参数相对于所有的业务参数所包括的数据量。如此可以通过该差值表示指定业务参数在业务数据中的重要性。其中,对于第二信息熵的计算可参照步骤101中对第一信息熵进行计算的公式。

在得到第一信息熵和每个指定业务参数对应的第二信息熵之后,可以分别计算每个指定业务参数对应的第二信息熵与第一信息熵的差值,然后根据差值确定每个指定业务参数对应的参数权重值。例如可以对各指定参数对应的差值进行归一化处理,进而得到每个指定业务参数对应的参数权重值。

步骤104、获取待进行异常检测的第一数据块,基于每个业务参数对应的参数权重值,对所述第一数据块进行异常检测,得到第一检测结果。

在得到的每个指定业务参数对应的参数权重值后,可以根据相应的参数权重值对待进行异常检测的数据块进行异常检测处理。

在本申请实施例中对于每个业务参数,计算除去每个业务参数后的剩余其他业务参数的信息熵与所有业务参数的信息熵对应的差值,然后根据每个业务数据对应的差值,确定每个业务参数在所有业务参数中的权重占比(即参数权重值)。如此可以根据每个业务参数对应的参数权重值,对数据块中的业务参数进行异常检测,这样,不同的业务参数对异常检测结果的影响不同,能够提高进行异常检测的准确性。

图2是本申请提供的一种进行异常检测的方法流程图,该方法可利用每个业务参数对应的参数权重值对数据块进行检测,参见图2,该方法包括:

步骤201、获取待进行异常检测的第一数据块。

其中,数据块可以是预设时间段内产生的多个业务数据的集合。例如可以是机房中一个计算机设备在第一天内周期性检测到的所有业务数据。第一数据块可以是任一需要进行异常检测的数据块,例如可以由进行异常检测的计算机设备从存储设备中获取。

步骤202、对于第一数据块中的每个业务数据,将业务数据中每个业务参数的取值与对应的参数权重值相乘,得到业务数据对应的异常检测值。

在获取第一数据块之后,可以根据每个业务参数对应的参数权重值对业务数据中各业务参数对应的权重值进行加权处理。

例如业务参数分别包括CPU占用率、进程数、耗电量、读取速率,分别对应的参数权重值为2.0、0.5、1.0、1.5,如果业务数据中包括的CPU占用率为50%、进程数为10、耗电量为20W、读取速率为5M/s,则根据参数权重值对参数值进行加权计算后,得到异常检测值为100、5、20、30。

步骤203、基于第一数据块中各业务数据对应的异常检测值,对各业务数据进行异常检测,得到各业务数据对应第一检测结果。

在得到各个业务数据对应的异常检测值后,可以将相应的异常检测值组成对应的异常检测向量,然后根据异常检测向量计算对应的业务数据之间的异常指示值。其中,该异常指示值可以是通过异常检测向量计算得到的欧式距离值,或者该异常指示值可以是异常检测向量计算的得到的角度方差。

在异常检测值为欧式距离值时,对于一个数据块中的包括的每个业务数据都可以得到与其他业务数据之间对应的欧式距离值,然后可以计算每个业务数据与他业务数据之间对应的欧式距离值的距离平均值,如果对应的距离平均值超出预设的距离平均值阈值,则将对应的业务数据确定为异常业务数据。

在异常检测值为角度方差时,对于一个数据块中的包括的每个业务数据,都可以根据业务数据对应的异常检测向量确定各业务数据在坐标系中的分布,并可以根据业务数据对应的异常检测向量,计算任意两个业务数据之间与指定方向的夹角,该指定方向可以是坐标系中指定坐标轴的方向。这样在得到每个业务数据与其他业务数据对应的夹角之后,可以计算该业务数据与其他业务数据对应的夹角的角度方差。如果角度方差超出小于的平均值阈值,则将对应的业务数据确定为异常业务数据。

如图3所示,如果业务数据A异常业务数据,则该业务数据A与正常的业务数据之间的距离较远。如此,该业务数据A与其他业务数据对应的角度方差较小。因此对于与他业务数据之间对应的角度方差的夹角平均值的业务数据,可认为是异常业务数据。

在一种可能的情况中,在计算每两个业务数据之间的距离值或角度方差时,可以根据各业务数据分别对应的生成时间,确定业务数据之间的时间权重值。

根据时间权重值对计算得到的距离值或角度方差进行加权处理:

对于第一数据块中的任意两个业务数据,确定两个业务数据对应的生成时间的时间差;基于时间差,确定两个业务数据对应的时间权重值;基于两个业务数据对应的异常检测值、时间权重值,确定两个业务数据对应的异常指示值;对于每个业务数据,基于业务数据与其他业务数据对应的异常指示值,确定业务数据进行异常检测的第一检测结果。

在得到每两个数据之间的异常指示值后,可以根据对应的时间权重值对异常指示值进行加权计算,得到加权计算之后的异常指示值。例如,两个业务数据之间时间权重值可以通过如下公式(2)进行计算:

其中,β

这是由于在业务数据中,存在一些业务参数可能会随着时间进变化,例如处理器的温度、进程数等。如此通过增加时间权重值,能够降低生成时间上较远的两个业务数据之间业务参数差距较大而导致的欧式距离值较远或对应的角度方差较大,进而可以进一步提高进行异常检测处理的准确度。

在本申请实施例中对于每个业务参数,计算除去每个业务参数后的剩余其他业务参数的信息熵与所有业务参数的信息熵对应的差值,然后根据每个业务数据对应的差值,确定每个业务参数在所有业务参数中的权重占比(即参数权重值)。如此可以根据每个业务参数对应的参数权重值,对数据块中的业务参数进行异常检测,这样,不同的业务参数对异常检测结果的影响不同,能够提高进行异常检测的准确性。

随着区块链技术的发展,区块链技术的应用也越来越广泛。越来越多的业务数据可通过区块链技术进行存储。在一种可能的情况中,数据块可以通过数据链的方式存储在存储设备中,该存储设备可以是IPFS。在这种情况下,进行异常检测的方法可以参见图4,相应的处理如下:

步骤401、向存储设备发送数据块的获取请求,其中,获取请求用于获取生成时间在指定时间段的多个数据块。

随着区块链技术的发展,区块链技术的应用也越来越广泛。越来越多的业务数据可通过区块链技术进行存储。在一种应用中,业务数据可以存储在第三方存储介质(如IPFS(InterPlanetary File System,星际文件系统))中,然后将业务数据的索引信息存储在区块链上。在一些业务场景中,每天会有大量的业务数据需要进行存储,例如,机房中每个计算机设备对应的运行参数、购物网站每天的交易信息。

对数据块进行异常检测的计算机设备,可以在相应的区块链上获取需要进行异常检测的数据块对应的索引信息,然后向IPFS发送携带索引信息的数据块获取请求。

步骤402、每当接收到存储设备发送的生成时间在指定时间段的任一数据块后,将任一数据块确定为第一数据块。

IPFS在接收携带索引信息的数据块获取请求后,可以向并行的向计算机设备发送索引信息对应的数据块。为了提高对数据块进行异常检测的效率,每当计算机设备接收完一个数据块之后,可以将该数据块确定为第一数据块,对第一数据块中的各业务数据进行异常检测。

另外,当计算机设备接收到第一数据块后,可以先对第一数据块进行数据预处理,例如可以对第一数据块中的业务数据进行去重、删除缺失过多业务参数的业务数据、或对缺失的业务参数进行数据填充。

步骤403、对于第一数据块中的每个业务数据,将业务数据中每个业务参数的取值与对应的参数权重值相乘,得到业务数据对应的异常检测值。

步骤404、基于第一数据块中各业务数据对应的异常检测值,对各业务数据进行异常检测,得到各业务数据对应第一检测结果。

其中,上述步骤303、304的处理与上述步骤202、203的处理相同,此处不再赘述。

步骤405、基于第一数据块对应的生成时间,将第一数据块插入到数据块序列中。

其中,数据块数列用于存储已进行过一次异常检测的数据块。第一数据块对应的生成时间可以是第一数据块存储至IPFS的时间。在对第一数据块进行异常检测之后,可以将第一数据块插入到数据块序列中。其中在数据块序列插入数据块时,可以根据数据块存储至IPFS的时间顺序插入到数据块序列中。

步骤406、如果第一检测结果指示第一数据块中存在第一业务数据为异常业务数据,则基于第一数据块、数据块序列中的第二数据块,对第一业务数据进行异常检测,得到第二检测结果。

在每次向数据块(第一数据块)序列中插入数据块后,如果第一次对第一数据块进行异常检测的检测结果(第一检测结果)中指出,第一数据块中存在异常的业务数据。则基于第一数据块、数据块序列中的第二数据块,对第一业务数据进行异常检测,得到第二检测结果。其中,第二数据块为第一数据块在数据块中相邻的数据块。

如图5所示,在将存在异常的业务数据的数据块B插入到数据块序列L中,后,可以根据数据块A和数据块C以及数据块B中的业务数据再次对数据块中存在异常的业务数据进行异常检测处理。

在一种可能的情况中,如果第二检测结果中指示第一业务数据为异常业务数据,且确定第一数据块在数据块序列中相邻的第二数据块更新为第三数据块,则基于第一数据块、第三数据块对第一业务数据进行异常检测,得到第三检测结果。

如果根据数据块序列中的第一数据块、第二数据块对第一数据块中存在的异常数据进行异常检测后,得到的第二检测结果中指示第一业务数据为异常。则可以对第一数据块和第一业务数据进行记录。当存在新的数据块插入到数据块序列中后,可以检测新插入的数据块是否与第一数据块相邻。如果确定第一数据块相邻的第二数据块被新插入的数据块(第三数据块)替换后,可以再次根据第一数据块、第三数据块对第一业务数据进行异常检测,得到第三检测结果。如此通过设置数据块序列,对存储在异常的业务数据进行多次异常检测处理,能够进一步提高对数据块进行异常检测处理的准确度。

在另一种可能的情况中,如果确定数据块序列中除头部数据块和尾部数据块外,存在预设数目个在生成时间上连续且不包括异常业务数据的第三数据块,则在数据块序列中删除第三数据块。

其中,头部数据块可以是在数据块序列头部的第一指定数目个数据块,尾部数据块可以是在数据块序列尾部的第二指定数目个数据块,第一指定数目和第二指定数目以及预设数目可以由技术人员预先进行设置。

每当数据块序列中插入新的数据块之后,确定数据块序列中是否存储在施加上连续的预设数目个数据块,且确定该预设数目个数据块非数据块序列中除头部数据块和尾部数据块,则可以将数据块从数据块序列中删除。如此可以减少数据块序列中包括数据块的个数,能够在一定程度上减少计算机设备的内存开销,提高进行异常检测处理的效率。

在本申请实施例中对于每个业务参数,计算除去每个业务参数后的剩余其他业务参数的信息熵与所有业务参数的信息熵对应的差值,然后根据每个业务数据对应的差值,确定每个业务参数在所有业务参数中的权重占比(即参数权重值)。如此可以根据每个业务参数对应的参数权重值,对数据块中的业务参数进行异常检测,这样,不同的业务参数对异常检测结果的影响不同,能够提高进行异常检测的准确性。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

图6是本申请实施例提供的一种进行异常检测的装置,该装置可以是上述实施例的计算机设备,该状态包括:

确定模块610,用于确定样本业务数据中多个业务参数对应的第一信息熵;

计算模块620,用于对于所述多个业务参数中的每个业务参数,计算所述多个业务参数中除所述业务参数外的其他业务参数对应的第二信息熵,基于所述第一信息熵与所述第二信息熵的差值,确定所述业务参数的参数权重值;

检测模块630,用于获取待进行异常检测的第一数据块,基于每个业务参数对应的参数权重值,对所述第一数据块进行异常检测,得到第一检测结果。

可选的,所述检测模块630,用于:

对于所述第一数据块中的每个业务数据,将所述业务数据中每个业务参数的取值与对应的参数权重值相乘,得到所述业务数据对应的异常检测值;

基于所述第一数据块中各业务数据对应的异常检测值,对所述各业务数据进行异常检测,得到所述各业务数据对应第一检测结果。

可选的,所述装置还包括插入模块,用于:

基于所述第一数据块对应的生成时间,将所述第一数据块插入到数据块序列中;

如果所述第一检测结果指示所述第一数据块中存在第一业务数据为异常业务数据,则基于所述第一数据块、所述数据块序列中的第二数据块,对所述第一业务数据进行异常检测,得到第二检测结果,其中,所述第二数据块为所述第一数据块在所述数据块中相邻的数据块。

可选的,所述检测模块630还用于:

如果所述第二检测结果中指示所述第一业务数据为异常业务数据,且确定所述第一数据块在所述数据块序列中相邻的第二数据块更新为第三数据块,则基于所述第一数据块、第三数据块对所述第一业务数据进行异常检测,得到第三检测结果。

可选的,所述装置还包括删除模块,用于:

如果确定所述数据块序列中除头部数据块和尾部数据块外,存在预设数目个在生成时间上连续且不包括异常业务数据的第三数据块,则在所述数据块序列中删除所述第三数据块。

可选的,所述检测模块630,用于:

对于所述第一数据块中的任意两个业务数据,确定所述两个业务数据对应的生成时间的时间差;

基于所述时间差,确定所述两个业务数据对应的时间权重值;

基于所述两个业务数据对应的异常检测值、时间权重值,确定所述两个业务数据对应的异常指示值;

对于每个业务数据,基于所述业务数据与其他业务数据对应的异常指示值,确定所述业务数据进行异常检测的第一检测结果。

可选的,所述异常指示值包括欧式距离或角度方差。

可选的,所述检测模块630,用于:

向存储设备发送数据块获取请求,所述数据块获取请求用于获取生成时间在指定时间段的多个数据块;

每当接收到所述存储设备发送的生成时间在指定时间段的任一数据块后,将所述任一数据块确定为所述第一数据块。

需要说明的是:上述实施例提供的进行异常检测的装置在进行异常检测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的进行异常检测的装置与进行异常检测的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

在本申请实施例中对于每个业务参数,计算除去每个业务参数后的剩余其他业务参数的信息熵与所有业务参数的信息熵对应的差值,然后根据每个业务数据对应的差值,确定每个业务参数在所有业务参数中的权重占比(即参数权重值)。如此可以根据每个业务参数对应的参数权重值,对数据块中的业务参数进行异常检测,这样,不同的业务参数对异常检测结果的影响不同,能够提高进行异常检测的准确性。

图7示出了本申请一个示例性实施例提供的计算机设备700的结构框图。该计算机设备700可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(moving pictureexperts group audio layer III,动态影像专家压缩标准音频层面3)、MP4(movingpicture experts group audio layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。计算机设备700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常,计算机设备700包括有:处理器701和存储器702。

处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(digital signal processing,数字信号处理)、FPGA(field-programmable gate array,现场可编程门阵列)、PLA(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(central processingunit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以集成有GPU(graphics processing unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(artificial intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的进行异常检测方法。

在一些实施例中,计算机设备700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、显示屏705、摄像头组件706、音频电路707、定位组件708和电源709中的至少一种。

外围设备接口703可被用于将I/O(input/output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。

射频电路704用于接收和发射RF(radio frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(near field communication,近距离无线通信)有关的电路,本申请对此不加以限定。

显示屏705用于显示UI(user interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置在计算机设备700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在计算机设备700的不同表面或呈折叠设计;在另一些实施例中,显示屏705可以是柔性显示屏,设置在计算机设备700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(liquid crystal display,液晶显示屏)、OLED(organic light-emittingdiode,有机发光二极管)等材质制备。

摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。

音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在计算机设备700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。

定位组件708用于定位计算机设备700的当前地理位置,以实现导航或LBS(location based service,基于位置的服务)。定位组件708可以是基于美国的GPS(globalpositioning system,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源709用于为计算机设备700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中,计算机设备700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。

加速度传感器711可以检测以计算机设备700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器712可以检测计算机设备700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对计算机设备700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器713可以设置在计算机设备700的侧边框和/或显示屏705的下层。当压力传感器713设置在计算机设备700的侧边框时,可以检测用户对计算机设备700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在显示屏705的下层时,由处理器701根据用户对显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置在计算机设备700的正面、背面或侧面。当计算机设备700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。

光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制显示屏705的显示亮度。具体地,当环境光强度较高时,调高显示屏705的显示亮度;当环境光强度较低时,调低显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。

接近传感器716,也称距离传感器,通常设置在计算机设备700的前面板。接近传感器716用于采集用户与计算机设备700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与计算机设备700的正面之间的距离逐渐变小时,由处理器701控制显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与计算机设备700的正面之间的距离逐渐变大时,由处理器701控制显示屏705从息屏状态切换为亮屏状态。

本领域技术人员可以理解,图7中示出的结构并不构成对计算机设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中进行异常检测的方法。该计算机可读存储介质可以是非暂态的。例如,所述计算机可读存储介质可以是ROM(read-onlymemory,只读存储器)、RAM(random access memory,随机存取存储器)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品中包括至少一条指令,至少一条指令由处理器加载并执行以实现如上述实施例所述的进行异常检测的方法所执行的操作。

需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号(包括但不限于用户终端与其他设备之间传输的信号等),均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的数据块、业务数据、业务参数都是在充分授权的情况下获取的。

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

技术分类

06120114714451