掌桥专利:专业的专利平台
掌桥专利
首页

基于IT设备运维的知识图谱构建算法、系统、设备及介质

文献发布时间:2023-06-19 11:42:32


基于IT设备运维的知识图谱构建算法、系统、设备及介质

技术领域

本发明属于IT设备业务数据处理技术领域,尤其涉及一种基于IT设备运维的知识图谱构建算法、系统、设备及介质。

背景技术

据统计电力企业中80%信息属于非结构化数据,这些非结构化信息是企业在日常工作中编写、定期的业务专家分析汇总的经验性文档,包括日常工作报告、工作明细记录、技术文档、标准规范、作业手册和改善报告等形式各异的文档分散存储在企业的文档系统和办公电脑中,即使有文档系统管理,随着数据量剧增,在工作中需要检索到某个具体的章节、段落或条目时,查询检索依然非常不方便,导致查询不到或查询繁琐,效率低下,企业大量的知识蓄能没有被有效发挥应用的数据价值。主要存在以下问题:

(1)、搜索不准

文档系统主要基于文档标签和关键字,无法精准搜索内容,需要逐个翻查,效率低。

(2)、查询繁琐

存储在文档系统或个人电脑和文档柜中,无论在空间上还是操作步骤上,都极其繁琐低效。

(3)、不易共享

非结构化的文档和散落的存储形式,难以有效共享和传播,不利于知识持续创作。

随着电力系统信息化和智能化应用的提高,IT设备故障数据日益呈现出体量大、模态多、价值大、密度低的大数据特点,这种特性日益突显,给IT设备智能故障诊断带来了前所未有的挑战。IT设备智能故障诊断研究亟需做出适应大数据模式的转变。大数据技术毋庸置疑地得到了各个研究领域空前的重视,虽然前面的调查显示有关IT设备故障诊断的大数据研究几乎空白,但近年来基于大数据的知识表示、挖掘和推理的相关研究却非常活跃。

知识图谱已经成为人工智能大数据时代重要的核心技术,基于知识图谱的大数据研究在智能搜索、智能问答、医疗诊断、智能断案中取得了有效的成果。百度知识图谱和谷歌的Probase索引了整个互联网上的知识,包含了数以亿计的高质量实体、全面和动态的数据、数以千亿计的事实和关系,通过高速有效精准的算法,将杂乱无章的海量数据进行分类梳理,在搜索、问答、推荐、对话以及文章自动内容生成方面发挥出关键作用。知识图谱可以让机器具有感知和理解能力,具有进行推理决策的潜能,并被广泛应用于推理预测的研究中。

医学诊断领域专家学者们结合概率图模型的知识图谱展开不确定性推理的研究;Wang运用传播式启发式图搜索算法,连接实体的已有路径来预测实体间的潜在关系;Liu和Wei提出层次化的推理方法HiRi,在全局和局部分别进行关系推理,最终融合推理结果,不仅获得了随机游走模型的执行效率,同时保留了嵌入式表示学习方法的准确率;Shu提出KALE的方法,将知识图谱与逻辑规则进行联合实现嵌入式表示学习。这些理论研究在知识图谱推理技术的计算精度、计算效率和推理结果融合方面做出了贡献,为大数据在决策推断方面的应用奠定了理论基础。

综上所述,目前基于知识图谱技术的IT设备故障智能诊断的大数据研究尚属空白,但在推理诊断预测相关的研究领域有关大数据的研究还是非常火热的,基于知识图谱的大数据表示和推理不仅取得了很多优秀的理论研究成果,还在知识问答、医疗诊断和案件研判等领域得到了应用,产生了社会经济价值,这些都为IT设备大数据模式下的智能故障诊断指引了方向。

发明内容

针对现有技术的不足,本发明的目的在于提供一种基于IT设备运维的知识图谱构建算法、系统、设备及介质,以解决海量文本数据无法充分利用,从而无法有效地利用已有文本数据为IT设备故障智能诊断提供判断依据。

本发明是通过如下的技术方案来解决上述技术问题的:一种基于IT设备运维的知识图谱构建算法,包括以下步骤:

步骤1:获取IT设备业务数据;

步骤2:从所述IT设备业务数据中提取IT设备表象、IT设备缺陷以及缺陷处理建议;

步骤3:识别各所述IT设备表象与各所述IT设备缺陷之间的关系,得到各所述IT设备表象与各所述IT设备缺陷之间的第一映射关系;

步骤4:识别各所述IT设备缺陷与各所述缺陷处理建议之间的关系,得到各所述IT设备缺陷与各所述缺陷处理建议之间的第二映射关系;

步骤5:根据所述第一映射关系和第二映射关系构建包括IT设备表象、IT设备缺陷以及缺陷处理建议之间关联关系的知识图谱。

本发明中,对IT设备业务数据进行智能化分析,识别出如IT设备名称、IT设备表象(即故障现象)、IT设备缺陷、缺陷处理建议等信息,能够有效地从海量数据中提取有用信息,以便实现已有业务数据的充分利用;再根据IT设备表象与IT设备缺陷之间的映射关系、IT设备缺陷与缺陷处理建议之间的映射关系构建知识图谱;基于该知识图谱,输入IT设备表象或IT设备缺陷即可获得对应的缺陷处理建议,为IT设备的故障智能诊断提供了判断依据,大大提高了已有业务数据的利用率,使IT设备运维人员可以便捷、快速地进行故障查询、故障处理,有效地提升了IT设备故障诊断水平,为电厂生产运行保驾护航。

进一步地,所述IT设备业务数据包括ITSM信息(IT服务管理)、IT设备管理专业规程、IT设备故障案例库、IT设备巡检相关信息和专家经验数据。

进一步地,所述步骤2中,提取IT设备表象、IT设备缺陷以及缺陷处理建议的具体过程为:

步骤2.1:基于隐马尔可夫模型,并借助IT设备常用词典,对各类IT设备业务数据进行分词;

步骤2.2:利用TextRank算法从分词后的IT设备业务数据中提取若干个关键词;

步骤2.3:利用word2vec算法将IT设备业务数据的每个词转化为100维的词向量,并提取出步骤2.2中各个关键词的词向量;

步骤2.4:采用k-means聚类算法对关键词的词向量进行聚类,聚类时词向量之间的距离采用词向量的余弦相似度相反数进行表示;

步骤2.5:通过k-means聚类得到3个词向量簇,分别代表IT设备表象、IT设备缺陷以及缺陷处理建议,其中IT设备表象词向量簇中各个词向量对应的词即为描述IT设备表象的关键词,IT设备缺陷词向量簇中各个词向量对应的词即为描述IT设备缺陷的关键词,缺陷处理建议词向量簇中各个词向量对应的词即为描述缺陷处理建议的关键词;

步骤2.6:对关键词进行适当的合并,组成描述IT设备表象、IT设备缺陷以及缺陷处理建议的短语;

步骤2.7:按照业务数据类型,将未参与合并的关键词和合并后的短语再次进行组合,形成3个词语集合D

进一步地,所述步骤2.6包括:

步骤2.6.1读取IT设备表象、IT设备缺陷以及缺陷处理建议的关键词,形成关键词集合,其中IT设备表象关键词集合记为S

步骤2.6.2令变量p和i等于1,变量j等于1,其中p代表正在合并第p个集合S

步骤2.6.3从集合S

步骤2.6.4遍历集合S

进一步地,所述步骤3中,得到各所述IT设备表象与各所述IT设备缺陷之间的第一映射关系的具体实现步骤为:

步骤3.1构建IT设备表象与IT设备缺陷之间第一映射关系的训练集:在IT设备业务数据中,提取同时包含IT设备表象词语和IT设备缺陷词语的句子,作为训练输入样本;同时,对每个训练输入样本中IT设备表象词语和IT设备缺陷词语的关系进行标注,作为该训练输入样本对应的训练输出标签;

步骤3.2基于双向长短期记忆网络,构建IT设备表象与IT设备缺陷的关系识别模型;

步骤3.3利用所述步骤3.1中的训练集,对IT设备表象与IT设备缺陷的关系识别模型进行训练;

步骤3.4将同时包含IT设备表象词语和IT设备缺陷词语的句子输入至训练好的关系识别模型中,识别出句中IT设备表象和IT设备缺陷的第一映射关系。

进一步地,所述步骤3.3包括:

步骤3.3.1对于每个训练输入句子样本,用word2vec方法将句中的每个词语表示为100维的词语向量;

步骤3.3.2引入100维的注意力向量a,分别与各个中间向量u

从而得到对应的一组注意力权重t

步骤3.3.3将各个中间向量u

w

从而得到一组加权向量w

步骤3.3.4将各个加权向量相加,得到关系向量x,即:

步骤3.3.5根据训练输入句子中的IT设备表象词语和IT设备缺陷词语的位置,生成表征两者在句中相对位置的向量q

式中,f

步骤3.3.6将关系向量x和相对位置向量q

y=[x,q

步骤3.3.7将关系向量y输入支持向量机进行分类,输出训练输入样本中IT设备表象词语和IT设备缺陷词语的关系;通过比较输出的关系与步骤3.1所标注的训练输出标签的差异,利用反向传播算法对模型参数进行调整,以进行关系识别模型的训练。

进一步地,所述步骤5中,知识图谱的具体实现步骤为:

步骤5.1:根据IT设备表象与IT设备缺陷之间的第一映射关系,将IT设备表象和IT设备缺陷作为节点,相应的第一映射关系作为边,构建形如“IT设备表象-第一映射关系-IT设备缺陷”的三元组;

步骤5.2:根据IT设备缺陷与缺陷处理建议之间的第一映射关系,将IT设备缺陷和缺陷处理建议作为节点,相应的第二映射关系作为边,构建形如“IT设备缺陷-第二映射关系-缺陷处理建议”的三元组;

步骤5.3:将步骤5.1和5.2所构建的全部三元组进行整合,即把表示同一IT设备表象、IT设备缺陷或缺陷处理建议的节点合并为同一个节点,从而得到IT设备运维知识图谱,并在前端进行显示。

进一步地,所述知识图谱构建算法还包括:对所述知识谱图进行更新和扩展的步骤,具体更新和扩展的步骤为:

从所述知识图谱中获取IT设备表象时对应的最佳缺陷处理建议,并推送专家知识库,专家知识库采用推理算法对该最佳缺陷处理建议进行更新;

对于某个IT设备表象或IT设备缺陷在所述知识图谱中未查询到,则利用专家知识库建立该IT设备表象-IT设备缺陷-缺陷处理建议的知识图谱,并添加到原知识图谱中。

通过不断的更新和扩展,使知识图谱更为准确和完善。

本发明还提供一种基于IT设备运维的知识图谱构建系统,包括:

数据获取单元,用于获取IT设备业务数据;

提取单元,用于从所述IT设备业务数据中提取IT设备表象、IT设备缺陷以及缺陷处理建议;

第一识别单元,用于识别各所述IT设备表象与各所述IT设备缺陷之间的关系,得到各所述IT设备表象与各所述IT设备缺陷之间的第一映射关系;

第二识别单元,用于识别各所述IT设备缺陷与各所述缺陷处理建议之间的关系,得到各所述IT设备缺陷与各所述缺陷处理建议之间的第二映射关系;

构建单元,用于根据所述第一映射关系和第二映射关系构建包括IT设备表象、IT设备缺陷以及缺陷处理建议之间关联关系的知识图谱。

本发明还提供一种设备,包括存储有可执行程序代码的存储器、以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如上所述的一种基于IT设备运维的知识图谱构建算法。

本发明还提供一种介质,其上存储有可执行程序代码,该可执行程序代理被计算设备执行时,所述计算设备执行如上所述的一种基于IT设备运维的知识图谱构建算法。

有益效果

与现有技术相比,本发明所提供的一种基于IT设备运维的知识图谱构建算法、系统、设备及介质,对IT设备业务数据进行智能化分析,识别出如IT设备名称、IT设备表象、IT设备缺陷、缺陷处理建议等信息,能够有效地从海量数据中提取有用信息,以便实现已有业务数据的充分利用;再根据IT设备表象与IT设备缺陷之间的映射关系、IT设备缺陷与缺陷处理建议之间的映射关系构建知识图谱;基于该知识图谱,输入IT设备表象或IT设备缺陷即可获得对应的缺陷处理建议,为IT设备的故障智能诊断提供了判断依据,大大提高了已有业务数据的利用率,使IT设备运维人员可以便捷、快速地进行故障查询、故障处理,有效地提升了IT设备故障诊断水平,为电厂生产运行保驾护航。

附图说明

为了更清楚地说明本发明的技术方案,将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例中一种基于IT设备运维的知识图谱构建算法流程图;

图2是本发明实施例中短语集合构建流程图;

图3是本发明实施例中关系识别模型图;

图4是本发明实施例中知识图谱示意图。

具体实施方式

下面结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本实施例所提供的一种基于IT设备运维的知识图谱构建算法,包括以下步骤:

1、获取IT设备业务数据。

IT设备业务数据来源于ITSM信息、IT设备管理专业规程、IT设备故障案例库、IT设备巡检相关信息和专家经验数据等等。

2、从IT设备业务数据中提取IT设备表象、IT设备缺陷以及缺陷处理建议,具体步骤为:

2.1基于隐马尔可夫模型(Hidden Markov Model,HMM)并借助IT设备常用词典,对各类IT设备业务数据进行分词。

2.2利用TextRank算法从分词后的IT设备业务数据中提取若干个关键词。

2.3利用word2vec算法将IT设备业务数据的每个词转化为100维的词向量,并提取出步骤2.2中各个关键词的词向量。

2.4采用k-means聚类算法对关键词的词向量进行聚类,k-means聚类时词向量之间的距离采用词向量的余弦相似度相反数进行表示。假设两个关键词的词向量分别为z

式中<>表示取两向量的夹角,||表示取向量的模。同时,设定聚类的簇数k为3。

2.5通过k-means聚类可得到3个词向量簇,分别代表IT设备表象、IT设备缺陷以及缺陷处理建议,其中IT设备表象词向量簇中各个词向量对应的词即为描述IT设备表象的关键词,IT设备缺陷词向量簇中各个词向量对应的词即为描述IT设备缺陷的关键词,缺陷处理建议词向量簇中各个词向量对应的词即为描述缺陷处理建议的关键词。

2.6由于IT设备表象、IT设备缺陷以及缺陷处理建议可能由单一的关键词组成,也可能由两个关键词组成的短语共同进行描述,如IT设备“办公电脑”由“办公”、“电脑”两个关键词共同组成,因此需要对关键词进行适当的合并,组成描述IT设备表象、IT设备缺陷以及缺陷处理建议的短语。具体流程如图2所示。

步骤2.6又包括:

2.6.1读取IT设备表象、IT设备缺陷以及缺陷处理建议的关键词,形成关键词集合,其中IT设备表象关键词集合记为S

2.6.2令变量p和i等于1,变量j等于1,其中p代表正在合并第p个集合S

2.6.3从集合S

2.6.4遍历集合S

2.7按照业务数据类型,将未参与合并的关键词和合并后的短语再次进行组合,形成3个词语集合D

3、识别各IT设备表象与各所述IT设备缺陷之间的关系,得到各IT设备表象与各所述IT设备缺陷之间的第一映射关系,具体实现步骤为:

3.1构建IT设备表象与IT设备缺陷之间第一映射关系的训练集。在IT设备业务数据中,提取同时包含IT设备表象词语和IT设备缺陷词语的句子,作为训练输入样本;同时,对每个训练输入样本中IT设备表象词语和IT设备缺陷词语的关系进行标注,作为该训练输入样本对应的训练输出标签。

3.2基于双向长短期记忆(Attention Bidirectional Long Short-Term Memory,BiLSTM)网络,构建IT设备表象与IT设备缺陷的关系识别模型,关系识别模型结构如图3所示。

3.3利用IT设备表象与IT设备缺陷之间第一映射关系的训练集,对IT设备表象与IT设备缺陷的关系识别模型进行训练。

步骤3.3又包括:

3.3.1对于每个训练输入句子样本,用word2vec方法将句中的每个词语表示为100维的词语向量。设句中一共有N个词语,每个词语的词语向量分别为v

3.3.2引入100维的注意力向量a,分别与各个中间向量u

从而得到对应的一组注意力权重t

3.3.3将各个中间向量u

w

从而得到一组加权向量w

3.3.4将各个加权向量相加,得到关系向量x,即:

3.3.5根据训练输入句子中的IT设备表象词语和IT设备缺陷词语的位置,还可以生成表征两者在句中相对位置的向量q

式中f

3.3.6将关系向量x和相对位置向量q

y=[x,q

3.3.7将关系向量y输入支持向量机(Support Vector Machine,SVM)进行分类,可以输出训练输入样本中IT设备表象词语和IT设备缺陷词语的关系。通过比较输出的关系与步骤3.1所标注的训练输出标签的差异,可以利用反向传播(Back Propagation,BP)算法对模型参数进行调整,以进行关系识别模型的训练。

3.4完成IT设备表象和IT设备缺陷的关系识别模型的训练后,将同时包含IT设备表象词语和IT设备缺陷词语的句子输入关系识别模型,即可利用训练好的关系识别模型识别出句中IT设备表象和IT设备缺陷的第一映射关系。

4、识别各IT设备缺陷与各所述缺陷处理建议之间的关系,得到各所述IT设备缺陷与各所述缺陷处理建议之间的第二映射关系,具体实现步骤为:

4.1构建IT设备缺陷与缺陷处理建议之间第二映射关系的训练集。在IT设备业务数据中,提取同时包含IT设备缺陷词语与缺陷处理建议词语的句子,作为训练输入样本;同时,对每个训练输入样本中IT设备缺陷词语与缺陷处理建议词语的关系进行标注,作为该训练输入样本对应的训练输出标签。

4.2构建IT设备缺陷与缺陷处理建议的关系识别模型。模型的结构也为图3所示结构。

4.3利用IT设备缺陷与缺陷处理建议之间第二映射关系的训练集,对IT设备缺陷与缺陷处理建议的关系识别模型进行训练。训练过程与步骤3.3类似,只是将IT设备表象与IT设备缺陷分别替换为IT设备缺陷与缺陷处理建议。

4.4完成IT设备缺陷与缺陷处理建议的关系识别模型的训练后,将同时包含IT设备缺陷词语与缺陷处理建议词语的句子输入关系识别模型,即可利用训练好的关系识别模型识别出句中IT设备缺陷与缺陷处理建议的第二映射关系。

5、根据第一映射关系和第二映射关系构建包括IT设备表象、IT设备缺陷以及缺陷处理建议之间关联关系的知识图谱,具体实现步骤为:

5.1根据IT设备表象与IT设备缺陷之间的第一映射关系,将IT设备表象和IT设备缺陷作为节点,相应的第一映射关系作为边,可构建形如“IT设备表象-第一映射关系-IT设备缺陷”的三元组。

5.2根据IT设备缺陷与缺陷处理建议之间的第一映射关系,将IT设备缺陷和缺陷处理建议作为节点,相应的第二映射关系作为边,可构建形如“IT设备缺陷-第二映射关系-缺陷处理建议”的三元组。

5.3将步骤5.1和5.2所构建的全部三元组进行整合,即把表示同一IT设备表象、IT设备缺陷或缺陷处理建议的节点合并为同一个节点,从而得到如图4所示的IT设备运维知识图谱,并在前端进行显示。

6、对知识谱图进行更新和扩展

从知识图谱中获取IT设备表象时对应的最佳缺陷处理建议,并推送专家知识库,专家知识库采用推理算法对该最佳缺陷处理建议进行更新。

对于某个IT设备表象或IT设备缺陷在知识图谱中未查询到,则利用专家知识库建立该IT设备表象-IT设备缺陷-缺陷处理建议的知识图谱,并添加到原知识图谱中。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 基于IT设备运维的知识图谱构建算法、系统、设备及介质
  • 基于人员信息的知识图谱构建方法、系统、设备及介质
技术分类

06120113022999