掌桥专利:专业的专利平台
掌桥专利
首页

一种资产管理全生命周期知识库的构建及应用方法

文献发布时间:2023-06-19 09:46:20


一种资产管理全生命周期知识库的构建及应用方法

技术领域

本申请涉及电力行业信息化技术领域,尤其涉及一种资产管理全生命周期知识库的构建及应用方法。

背景技术

企业的资产管理是一项十分重要的工作,不论对任何企业来说都是如此,资产管理的好坏,能够直接影响企业的经营效果和业绩。随着企业信息化技术的不断发展、资产管理理论和方法的日趋完善,越来越多的企业认识到资产管理的重要性。资产管理的加强,可以有效的将多余的闲置资产得到更多合理化的分流,并且可以视为竞争力的有效杠杆,因此,资产管理的重要性已经逐渐从后勤保障升华为战略层次的要求。

目前,传统的资产管理方式显然已经不能满足企业精细化管理的要求。

发明内容

本申请提供了一种资产管理全生命周期知识库的构建及应用方法,以解决传统的资产管理方式显然已经不能满足企业精细化管理的要求的问题。

本申请采用的技术方案如下:

本申请提供了一种资产管理全生命周期知识库的构建方法,包括以下步骤:

获取资产管理相关数据;

梳理资产管理相关数据设计企业资产全生命管理的业务模型;

梳理资产管理相关数据设计资产数据元模型;

根据企业资产全生命管理的业务模型和资产数据元模型进行知识抽取,并生成资产管理全生命周期涉及的所有知识,构建知识库。

进一步地,所述梳理资产管理涉及的数据中的数据包括:资产种类、企业资产全生命周期设计到的所有流程环节、企业资产全生命周期过程中涉及到的所有业务部门以及企业资产全生命周期过程中涉及到的数据;

所述流程环节包括计划、采购、入库、出库、转固、维护、报废和盘点;

所述企业资产全生命周期过程中涉及到的数据包括数据类型、数据规模、存储方式。

进一步地,所述资产数据元模型指的是某一品类的资产在其全生命周期管理过程的各个环节所包含的数据范围。

进一步地,所述根据企业资产全生命管理的业务模型和资产数据元模型进行知识抽取,并生成资产管理全生命周期涉及的所有知识,构建知识库,还包括:

将企业资产全生命管理的业务模型和资产数据元模型中的数据分为两种数据类型,将两种数据类型分别通过相应的方式进行知识抽取,将两种方式抽取到的知识进行合并,生成资产管理全生命周期涉及的所有知识,构建知识库。

进一步地,所述数据类型包括结构化数据,所述结构化数据一般指的是存储在关系型数据库以及各类具有固定结构的表格中的数据;

所述结构化数据采用编写规则模板的方式对其进行批量知识抽取。

进一步地,所述数据类型还包括非结构化文本数据,非结构化文本数据指的是以报告、文件、论文等形式存储的,以自然语言记录的文本数据;

所述非结构化文本数据采用自然语言处理技术中的实体抽取和关系抽取方法进行知识抽取。

进一步地,所述应用方法包括通过所述知识库中的知识对设备进行故障预测,所述故障预测包括以下步骤:

对所述设备的历史维修数据、设备的状态数据、特征属性等数据进行数据的预处理,使之满足结构化数据的需求;

并将满足结构化数据的需求的数据进行分类,包括训练集和检测集;

将训练集数据采用C4.5算法创建一颗决策树,并由决策树提取出相应的分类规则;

提取的分类规则与测试数据进行比较和评估,核对分类规则的预测的准确率、速度、强壮性和可伸缩性,如果认为提取的分类规则的准确率等指标可以接受,则可以用它对数据进行预测从而得出可能具有潜在故障可能的设备信息。

进一步地,故障预测方法还包括基于Apriori算法的故障关联模型,进行设备故障数据挖掘,分析多故障之间的关联联系。

进一步地,所述进行设备故障数据挖掘包括以下步骤:

将故障数据样本转换成为0-1矩阵形式;

对所述矩阵的行列进行求和,并添加至矩阵中;

根据矩阵中的最小支持度和事务数求出最小支持数;

根据最小支持数的定义求解出频繁项集。

采用本申请的技术方案的有益效果如下:

本发明的一种资产管理全生命周期知识库的构建及应用方法,获取资产管理相关数据;梳理资产管理相关数据设计企业资产全生命管理的业务模型;梳理资产管理相关数据设计资产数据元模型;根据企业资产全生命管理的业务模型和资产数据元模型进行知识抽取,并生成资产管理全生命周期涉及的所有知识,构建知识库。并能够基于故障预测算法,对设备的健康状况进行预测与评估。能够解决经常会遇到的资产管理与设备管理衔接不畅,实物和价值量无法借用成熟的系统或规程进行很好地匹配,资产账物不一致等一系列制约生产计划的问题,另一方面,避免资产闲置及过度采购,以及资产报废处置后也可为企业带来一定经济效益。

附图说明

为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为资产全生命周期的各个阶段的示例;

图2为以IT设备为例构建的资产数据元模型的示例;

图3为从结构化数据中抽取知识采用的模型。

具体实施方式

下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。

参见图1至图3。

本申请提供的一种资产管理全生命周期知识库的构建方法,从资产的立项规划一直到报废的全过程管理信息监控,实现全面、动态的资产全生命周期管理,构建方法包括以下步骤:

S01:获取资产管理相关数据;

如图1所示,资产管理涉及计划、采购、入库、出库、转固、维护、报废和盘点等流程环节,且不同的环节由不同的部门进行管理,在不同部门的信息系统中都有存储有资产相关的数据。由于服务于不同的部门,这些数据的数据类型和存储方式都各有特点,要实现资产全生命周期的管理,关键性的基础工作就是将这些类型各异、分布于不同部门的数据进行有效整合,统一存储。

所述资产管理涉及的数据中的数据包括:

1、资产种类;

2、企业资产全生命周期设计到的所有流程环节;

3、企业资产全生命周期过程中涉及到的所有业务部门;

4、企业资产全生命周期过程中涉及到的数据,企业资产全生命周期过程中涉及到的数据包括数据类型、数据规模、存储方式。

S02:梳理资产管理相关数据设计企业资产全生命管理的业务模型,梳理资产管理相关数据设计资产数据元模型;

对上述的4个方面的资产管理涉及的数据中的数据进行梳理,可以得到企业资产全生命管理所必须的业务模型(资产流转过程图)。

在有关部门获取到资产管理相关的数据后,需要设计资产数据元模型。资产数据元模型指的是某一品类的资产在其全生命周期管理过程的各个阶段所包含的数据范围。图2给出了一个资产数据元模型的示例(以IT设备为例)。

S03:根据企业资产全生命管理的业务模型和资产数据元模型进行知识抽取,并生成资产管理全生命周期涉及的所有知识,构建知识库。

基于S01中梳理得到的企业资产全生命管理的业务模型和资产数据元模型以及资产各部门存储的相关数据,根据数据类型的不同,采用不同的策略进行知识抽取。本发明处理的数据类型包括结构化数据和非结构化文本数据。

S03-1:处理结构化数据

结构化数据一般指的是存储在关系型数据库以及各类具有固定结构的表格中的数据。由于此类数据的规则程度较高,因此可以采用编写规则模板的方式对其进行批量知识抽取。

S03-2:处理非结构化文本数据

非结构化文本数据指的是以报告、文件、论文等形式存储的,以自然语言记录的文本数据。这类数据的特点是没有固定的规则,表达灵活性高,价值密度低。从此类数据中抽取知识,就需要用到自然语言处理相关的技术。

从非结构化文本中抽取得到的知识,一般以三元组的形式进行存储。三元组有诸如“实体-关系-实体”和“实体-属性-值”两种类型。例如,“设备部-管理-计算机”就是形如“实体-关系-实体”的三元组;“计算机-内存-16G”就是形如“实体-属性-值”的三元组。要从文本数据中抽取如上所述的三元组,关键是从中获取到实体、属性及实体间的关系。为此,需要利用自然语言处理中的实体抽取和关系抽取方法。

本发明利用的实体抽取模型为BiLSTM-CRF模型,模型结构如图3所示。该模型主要由四个部分组成:输入层、BiLSTM层、Attention层和CRF层。各层的作用说明如下:

(1)输入层

在自然语言处理相关任务中,最细粒度的是字词,由字词组成句子,最后由句子再组成段落、篇章、文档。因此,在处理自然语言任务时,最先处理的是字词。在神经网络的架构中,往往需要构建f(x)→y的映射,但是这里的函数f(·)只接收数值型的输入,所以需要将词语转换成数值的形式,这种转换方式被称之为词嵌入。通过词嵌入,可以讲汉语词汇转化成定长的向量,然后词语之间的相似度就可以通过向量之间的距离进行计算。

(2)BiLSTM层

BiLSTM是“双向长短记忆网络(Bi-directional Long Short-Term Memory)”的简称,它是循环神经网络的一种,非常适用于对时序数据的建模。在实际应用中,通过使用BiLSTM模型,极大的提升了LSTM模型的性能,使得训练生成的网络模型不仅可以“往前看”还能“往后看”,符合中文命名实体识别任务中密切贴合前后文的要求。

(3)Attention层

即注意力机制,一般可以用作一个神经网络结构中的组件,主要用来进行关键信息的筛选,从而获取局部特征。通过BiLSTM层输入序列至注意力模型,利用注意力机制对每个位置的标签进行生成一组注意力权重参数,并将输出序列进行加权计算后得到标注分数值,从而达到了提取LSTM全局特征以及获得局部特征的综合效果。

(4)CRF层

CRF是“条件随机场(Conditional Random Field)”的简称,使用状态特征作为当前节点的状态分数表示,转移矩阵用上一个节点到当前节点的转移分数表示。CRF层可以对标签之间自动设置一些合法的约束性条件,比如:句中的第一个单词的标签只能是“B-”或者“O”,不能是“I-”;语句中的标签“B-label I-label I-label”中,“label”应该是相同的命名实体标签,这些约束条件是CRF模型自动从训练数据中学习到的。因此,CRF的优点是能对隐含状态建模,学习状态序列的特点,通过在标签之间增加约束性的条件,可以更好的符合语言逻辑的正确性,最终生成符合人类的语言模型。

上述模型本质上是一个有监督的学习模型,仍需要人工标注一部分数据用于训练。训练完成后的模型可以用于预测,即进行知识抽取。抽取到的三元组可以与从结构化数据中抽取到的知识进行合并,生成资产管理全生命周期涉及的所有知识,并按照S1中的模型(资产数据元模型)进行存储,构建生成知识库。

构建生成知识库后,可以利用知识库对设备进行故障检测等,将知识库充分利用起来。

一种资产管理全生命周期知识库的应用方法,所述应用方法包括通过所述知识库中的知识对设备进行故障预测,所述故障预测包括以下步骤:

S01:对所述设备的历史维修数据、设备的状态数据、特征属性等数据进行数据的预处理,使之满足结构化数据的需求;

比如,电脑,购买时间、型号、使用时间、维修次数进行预处理,即表格化处理,使得满足结构化数据的需求,便于实时查看、监测以及预测。

其次数据预处理还包括对数据集(历史维修数据、设备的状态数据、特征属性等)进行相关性分析,必要时需进行数据变换(数据预处理后的数据一般为离散型数值或连续性数值),其中,数据变换比如将美元转换为人民币这种单位转换等以及其他各种类型的转换。

S02:并将满足结构化数据的需求的数据进行分类,包括训练集和检测集;

S03:将训练集数据采用C4.5算法创建一颗决策树,并由决策树提取出相应的分类规则(分类规则以“IF…THEN…”的形式出现);

S04:提取的分类规则与检测集的测试数据进行比较和评估,核对分类规则的预测的准确率、速度、强壮性和可伸缩性,如果认为提取的分类规则的准确率等指标可以接受,则可以用它对数据进行预测从而得出可能具有潜在故障可能的设备信息。

一实施例中,还提供了Apriori算法,即故障预测方法还包括基于Apriori算法的故障关联模型,进行设备故障数据挖掘,分析多故障之间的关联联系。

Apriori算法主要应用范围为根据关系数据或其他信息载体中,寻找项集之间的关联关系或相关性。Apriori算法的算法结构相对简单,而且能产生有效的强关联规则,其推导过程也较为方便且易于理解,但是Apriori算法也存在一定的局限性:(1)对内存需求量较大,尤其是针对数据集庞大的情况时,Apriori算法在进行逐层迭代需要将大量的候选频繁项集驻存在内存中,对计算机内存要求较高;(2)需要对数据集进行重复扫描,扫描的开销成本大;(3)当数据量较为庞大时,设备故障的诊断速度不能满足实时性的需求。

根据以上Apriori算法的局限性,同时将企业的经济性需求作为一大考虑因素,采用Apriori算法的改进算法对对设备的故障诊断进行优化。

基于Apriori改进算法进行设备故障数据挖掘包括以下步骤:

将故障数据样本转换成为0-1矩阵形式;

对所述矩阵的行列进行求和,并添加至矩阵中;

根据矩阵中的最小支持度和事务数求出最小支持数;

根据最小支持数的定义求解出频繁项集。

本实施例针对目前面临的问题本课题的研究将结合企业资产管理的现状,建立全资产企业资产全生命管理的业务模型和资产数据元模型,进行知识抽取,并生成资产管理全生命周期涉及的所有知识,构建知识库;根据预测设备的各种状态数据以及维修记录数据,利用C4.5算法提取分类规则用以指导对潜在故障设备的预测,并将此故障预测模型实际运用到资产的运维模块中,对高故障率及潜在故障设备进行预警,提高设备检修的针对性;基于Apriori算法的故障关联模型,采用特征建模技术描述多故障之间的关联关系,从而对故障的维修有一定的指导意义;以多系统多业务数据集成共享为目的,设计了以中间表及视图的形式来实现系统集成模式,形成基于知识库的管理系统。

同时,通过构建知识库,并能够基于故障预测算法,对设备的健康状况进行预测与评估。能够解决经常会遇到的资产管理与设备管理衔接不畅,实物和价值量无法借用成熟的系统或规程进行很好地匹配,资产账物不一致等一系列制约生产计划的问题,另一方面,避免资产闲置及过度采购,以及资产报废处置后也可为企业带来一定经济效益。

本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

相关技术
  • 一种资产管理全生命周期知识库的构建及应用方法
  • 一种基于数据自动生成的资产管理知识库构建方法
技术分类

06120112296452