掌桥专利:专业的专利平台
掌桥专利
首页

资产可用性预测方法、装置、设备、介质及程序产品

文献发布时间:2024-04-18 19:57:31


资产可用性预测方法、装置、设备、介质及程序产品

技术领域

本公开涉及资产识别领域,尤其涉及一种资产可用性预测方法、装置、设备、介质及程序产品。

背景技术

就安全态势感知理论研究领域而言,出现了众多的模型,如BLP模型、GM(1,1)模型(灰色系统理论)、ARMA模型(自回归移动平均模型)、Holt-Winter模型,但总体而言偏宏观,对安全态势感知很多重要支撑维度比如资产可用性模型鲜见有相关的研究。

现有相关技术中,通常是采取经验权值与通常的数学统计方法来进行可用性判别,这样的技术往往场景兼容性差,造成效果不好,同时,主观性大,当变量维度众多时,往往效果不好。

发明内容

为克服相关技术中存在的问题,本公开提供一种资产可用性预测方法、装置、设备、介质及程序产品。

根据本公开实施例的第一方面,提供一种资产可用性预测方法,包括:

获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;

基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;

若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级;

若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

在一些实施例中,所述获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据,包括:

基于半监督自学习方法,从日志中学习获取所述资产安全威胁维度数据;

基于网络管理协议探测目标标识符,获取网络、CPU、内存、磁盘的使用情况从而获取所述资产资源紧缺维度数据;

通过获取不同地区的若干点对连接资产服务并对服务响应状况及服务响应速度进行均值处理,从而获取所述资产服务响应速度维度数据。

在一些实施例中,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树,具体包括:

基于预训练的决策树分层模型中的算法,以基尼指数选择最优特征,对所述待识别数据安全等级划分处理,并获取所述待识别数据的CART决策树。

在一些实施例中,若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,具体包括:

当所述待识别数据的安全等级划分小于所述预设的安全级别系数,则判断所述待识别数据安全级别为低,则将所述CART决策树数据输入预训练的第一最大熵识别模型,进一步判断待识别数据的第一安全等级,所述第一安全等级包括低、次低、中。

在一些实施例中,若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级,具体包括:

当所述待识别数据的安全等级划分大于所述预设的安全级别系数,则判断所述待识别数据安全级别为高,则将所述CART决策树数据输入预训练的第二最大熵识别模型,进一步判断待识别数据的第二安全等级,所述第二安全等级包括次高、高。

在一些实施例中,还包括:

在获取待识别数据的安全等级后,基于KNN模型、TS4模型、以聚类算法对所述待识别数据的安全等级重新评价。

根据本公开实施例的第二方面,提供一种资产可用性预测装置,包括:

获取模块,用于获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;

生成模块,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;

安全等级获取模块,若所述待识别数据小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,若所述待识别数据大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

根据本公开实施例的第三方面,提供一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现第一方面任一所述的资产可用性预测方法。

根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行根据第一方面中任一项所述的资产可用性预测方法。

根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行根据第一方面中任一项所述的资产可用性预测方法。

本公开的实施例提供的技术方案可以包括以下有益效果:本申请的待识别数据中具备完备的资产可用性体系,识别更准确,且通过集成机器学习模型来对资产可用性识别预测,提高了资产可用性场景兼容性及识别效果,解决了目前主流厂商产品及技术所面临的场景兼容性差,识别效果不好的现象。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种资产可用性预测方法流程图。

图2是根据一示例性实施例示出的一种资产可用性预测装置框图。

图3是根据一示例性实施例示出的一种电子设备的内部结构图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种资产可用性预测方法的流程图,如图1所示,包括以下步骤:

在步骤S101中,获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据。

具体的,为了能够获取到宏观的资产可用性体系,在对资产进行预测之前,需要获取该预测资产的待识别数据,而待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据。

在一些实施例中,所述获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据,包括:

基于半监督自学习方法,从日志中学习获取所述资产安全威胁维度数据;

基于网络管理协议探测目标标识符,获取网络、CPU、内存、磁盘的使用情况从而获取所述资产资源紧缺维度数据;

通过获取不同地区的若干点对连接资产服务并对服务响应状况及服务响应速度进行均值处理,从而获取所述资产服务响应速度维度数据。

具体的,为了能够准确的获取安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据的信息,可以通过半监督自学习方法,从日志中学习获取所述资产安全威胁维度数据;通过网络管理协议探测目标标识符,获取网络、CPU、内存、磁盘的使用情况从而获取所述资产资源紧缺维度数据;通过获取不同地区的若干点对连接资产服务并对服务响应状况及服务响应速度进行均值处理,从而获取所述资产服务响应速度维度数据。

在步骤S102中,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树。

具体的,预训练的决策树分层模型是通过如下方式进行训练的:

(1)、输入为:

其中样本数据共有n条,每条数据有m+6维(或者说m+6个特征),

在训练测试过程中按照S折交叉验证分成训练样本集与测试样本集。

(2)输出为:

(Y

通过上述的训练方法能够获取预训练的决策树分层模型,在输入待识别数据时,能够生成CART决策树。

在一些实施例中,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树,具体包括:

基于预训练的决策树分层模型中的算法,以基尼指数选择最优特征,对所述待识别数据安全等级划分处理,并获取所述待识别数据的CART决策树。

具体的,而在训练的决策树分层模型中时,加入一种算法,采用CART分类树,用基尼指数选择最优特征,具体算法如下:

根据训练数据集,从根节点开始,递归地对每个节点进行以下操作,构建二叉决策树:

(a)、设节点的训练数据集D,计算现有特征数据集的基尼指数。此时,对每一个特征A,对其可能取的每个值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,利用以下公式计算A=a时的基尼指数。

D

(b)、在所有可能的特征以及它们所有可能的切分点a中,选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点。依最优特征与最优切分点,从现结点生成两个子结点,将训练数据集依特征分配到两个子结点中去。

(c)、对两个子结点递归地调用(a)与(b),直至满足停止条件。

(d)、生成CART决策树。

通过上述方式,当以基尼指数选择最优特征时输入待识别数据,通过上述算法,可以实现对待识别数据的安全等级划分处理,初步判别待识别数据的安全级别为低还是高。

在步骤S103中,若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级。

具体的,通过步骤S102已经能够初步识别待识别数据的安全级别系数,为了能够更精细的获取该待识别数据的安全等级,当所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,从而达到对待识别数据的精准判断。

其中,预训练的最大熵识别模型是通过如下方式进行训练的:

(1)输入:

有监督的学习方法,输入为:

(Y

(2)、输出

能准确分类的最大熵模型,提取出相应的值,为识别预测所用。

(3)、算法

根据按照优化问题的习惯,可以改写为如下:

由于目标函数为凸函数,约束条件为仿射,可以通过求解对偶问题,得到原始问题的最优解,首先引入拉格朗日乘子w0,w1,...,wn,定义拉格朗日函数L(P,w):

原始问题为:

对偶问题为:

令偏导数为0得:

然后将L(Pw,w)代入外层的max函数,即可求解最优的参数w

η是学习率,通过上式就可以调整权值。

(4)、训练流程

(a)、构建特征函数,即把每一个样本数据中的每一维特征所在的序号、特征值与目标值构成一新的记录。

(b)、初始化联合概率分布、边缘概率分布与参数权重。

(c)、设置训练次数Num以及学习率η

(d)、按

(e)、利用训练的权值对测试集进行测试,如果F1达到预期如0.95,则导出权值,便于下一阶段的识别与预测。如果没有达到预期,则转(c),训练次数增加Num*0.2,然后继续训练。

在一些实施例中,若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,具体包括:

当所述待识别数据的安全等级划分小于所述预设的安全级别系数,则判断所述待识别数据安全级别为低,则将所述CART决策树数据输入预训练的第一最大熵识别模型,进一步判断待识别数据的第一安全等级,所述第一安全等级包括低、次低、中。

具体的,当通过预训练的决策树分层模型判断待识别数据的安全等级划分小于所述预设的安全级别系数时,则表明待识别数据安全级别为低,然后将待识别数据的CART决策树数据输入预训练的第一最大熵识别模型中,进一步判断待识别数据的第一安全等级,获取该安全等级,而该第一安全等级的划分是通过如下方式计算得到的:

通过最大熵模型学习导出的数据包含两个部分,一部分是根据f(x,y)与训练数据得出的数据元组表,另一部分是该数据元组表每一项对应的权值。

把待识别的数据按照类别(指低、次低、中)根据f(x,y)与数据元组表匹配到的每一项所对应的权值相加,从而得到每一类的权值总和。

权值总和最大的类就是识别的具体类,

在步骤S104中,若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

具体的,通过步骤S102已经能够初步识别待识别数据的安全级别系数,为了能够更精细的获取该待识别数据的安全等级,当所述待识别数据的安全等级划分大于预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级,从而达到对待识别数据的精准判断。

在一些实施例中,若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级,具体包括:

当所述待识别数据的安全等级划分大于所述预设的安全级别系数,则判断所述待识别数据安全级别为高,则将所述CART决策树数据输入预训练的第二最大熵识别模型,进一步判断待识别数据的第二安全等级,所述第二安全等级包括次高、高。

具体的,当通过预训练的决策树分层模型判断待识别数据的安全等级划分大于所述预设的安全级别系数时,则表明待识别数据安全级别为高,然后将待识别数据的CART决策树数据输入预训练的第二最大熵识别模型中,进一步判断待识别数据的第二安全等级,获取该安全等级,而该第二安全等级的划分是通过如下方式计算得到的:

通过最大熵模型学习导出的数据包含两个部分,一部分是根据f(x,y)与训练数据得出的数据元组表,另一部分是该数据元组表每一项对应的权值。

把待识别的数据按照类别(次高、高)根据f(x,y)与数据元组表匹配到的每一项所对应的权值相加,从而得到每一类的权值总和。

权值总和最大的类就是识别的具体类,

在一些实施例中,还包括:

在获取待识别数据的安全等级后,基于KNN模型、TS4模型、以聚类算法对所述待识别数据的安全等级重新评价。

具体的,为了保证获取待识别数据的安全等级更为准确,因此可以通过KNN模型、TS4模型、以聚类算法对所述待识别数据的安全等级重新评价,避免数据的过拟合与欠拟合,具体如下:

当通过上述过程获取到待识别数据的安全等级后,首先通过KNN模型重新测评,包括:

(a)、起先把经过大量重复验证的数据构成特征类D,共分为11个类(0,1,2,3,4,5,6,7,8,9,10)。

距离度量采用欧式距离

采用交叉验证法选取K值为2。

(b)、根据上述的距离度量,在特征类D中找出与待识别数据x最邻近的K个点,组成邻域,记为N

(c)、根据多数表决就可以确定具体类别

于是就得到了待识别数据的一个具体类别。

再通过TS4模型,把这些特征构成经验特征库。经验特征库通常会动态调整,然后通过特征匹配,就可以得出一个具体的安全级别类型。

而通过上述综合判定时各个模型会出现矛盾结果,因此需要结合以聚类算法,对上述的3个待识别数据的安全等级进行整合,包括:

预处理,如果首次获取的待识别数据的安全等级、KNN识别模型、TS4识别模型得出的安全级别相等,那么就结束,返回任一识别模型的值。否则,

(a)、初始化,随机选取两个点作为初始聚类中心

(b)、然后通过计算第三个点与该初始聚类中心的距离,把第三个点归并到相应的类里。

(c)、数量多的类就是待识别数据的类,类中心的值取整,就是待识别数据的安全级别具体类型。

图2是根据一示例性实施例示出的一种资产可用性预测装置框图。参照图2,该装置包括获取模块201,生成模块202和安全等级获取模块203,其中:

获取模块201,用于获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;

生成模块202,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;

安全等级获取模块203,若所述待识别数据小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,若所述待识别数据大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在一个实施例中,提供了一种电子设备,该电子设备可以是终端,其内部结构图可以如图3所示。该电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该计算机程序被处理器执行时以实现一种资产可用性预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的资产可用性预测装置可以实现为一种计算机程序的形式,计算机程序可在如图3所示的电子设备上运行。电子设备的存储器中可存储组成该资产可用性预测装置的各个程序模块,比如,图2所示的获取模块201,生成模块202和安全等级获取模块203。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的一种资产可用性预测方法中的步骤。

例如,图3所示的电子设备可以通过如图2所示的资产可用性预测装置的获取模块201,用于获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;生成模块202,基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;安全等级获取模块203,若所述待识别数据小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级,若所述待识别数据大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

本申请提供的电子设备通过存储器和处理器可以打开资产可用性预测装置中的各个模块,通过集成机器学习模型来对资产可用性识别预测,提高了资产可用性场景兼容性及识别效果。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级;若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

本申请提供的非临时性计算机可读存储介质通过存储介质中的指令可以执行上述实施例中的一种资产可用性预测方法,通过集成机器学习模型来对资产可用性识别预测,提高了资产可用性场景兼容性及识别效果。

在一个实施例中,提供了一种计算机程序产品,当计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行以下步骤:获取待识别数据,其中所述待识别数据至少包括资产安全威胁维度数据、资产资源紧缺维度数据、资产服务响应速度维度数据;基于预训练的决策树分层模型,对所述待识别数据进行安全等级划分并生成CART决策树;若所述待识别数据的安全等级划分小于预设的安全级别系数,则将所述CART决策树数据输入预训练的第一最大熵识别模型,获取所述待识别数据的第一安全等级;若所述待识别数据的安全等级划分大于所述预设的安全级别系数,则将所述CART决策树数据输入预训练的第二最大熵识别模型,获取所述待识别数据的第二安全等级。

本申请提供的计算机程序产品可以使移动终端执行上述实施例中的资产可用性预测方法,通过集成机器学习模型来对资产可用性识别预测,提高了资产可用性场景兼容性及识别效果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,比如静态随机存取存储器(Static Random Access Memory,SRAM)和动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 目标检测方法和装置、电子设备、存储介质、程序产品
  • 行人再识别方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 资产回收率的预测方法、装置、设备、介质和计算机程序产品
  • 资产评估方法、装置、计算机设备、程序产品和存储介质
技术分类

06120116459095