掌桥专利:专业的专利平台
掌桥专利
首页

石油集输钢制管道知识图谱构建方法、系统、设备及介质

文献发布时间:2023-06-19 19:23:34


石油集输钢制管道知识图谱构建方法、系统、设备及介质

技术领域

本发明属于知识图谱构建领域,涉及一种石油集输钢制管道知识图谱构建方法、系统、设备及介质。

背景技术

知识图谱是以图的形式表现客观世界中的实体(概念)及其之间关系的知识库,相对于纯文本来说,知识图谱是结构化的,知识图谱由节点和边组成,节点可以是概念、实体或事件,边可以是实体之间的关系或实体的属性。其中,概念是指人们在认识世界过程中形成的对客观事物的概念化表示,如人、动物、组织机构等;实体是客观世界中的具体事物,如篮球运动员姚明、互联网公司腾讯等;事件是客观世界的活动,如地震、买卖行为等。关系描述概念、实体、事件之间客观存在的关联或其属性,如毕业院校描述了个人与其所在院校的关系,运动员和篮球运动员之间概念和子概念的关系,汽车有颜色这一属性等。

知识图谱的应用非常广泛,可以应用到语义搜索、智能问答、知识工程、数据挖掘和数字图书馆等众多领域。根据知识图谱构建过程可将其分为两类,手动构建的知识图谱和自动抽取的知识图谱。前者依赖于专业人士手工构建,规模较小,但其知识质量高,能够保证准确性和完整性,如WordNet、CYC、HowNet等。后者多从开放的互联网信息中自动抽取实体与关系,规模大,但因其数据源的复杂性和自动抽取算法的不完全准确,知识图谱中可能会有大量不完整信息和噪声,如如YAGO、DBPedia等。从知识图谱的覆盖范围看,分为通用知识图谱和行业知识图谱两类。通用知识图谱描述全面的常识性知识,如百科类的DBpedia、zhishi.me和语言学类的WordNet、大词林等。通用知识图谱对知识准确度要求不高,强调知识的广度,侧重实体层的扩充,大部分通用知识图谱难以构建规范的本体层。行业知识图谱面向特定领域,中文的行业知识图谱如科研领域的知识图谱SciKG、影视领域的影视双语知识图谱、医学领域的中医医案知识图谱、中文症状库、中医药知识图谱等,此类知识图谱专业性与准确性较高,有严格的本体层概念,能够进行知识推理。

石油领域的知识量大,高价值知识成果资料呈现出海量、多源、异构的特点,却未被有效利用。如何组织、总结、利用知识以解决知识的查询和重用等问题,是当下该领域知识图谱研究工作的重点。石油领域知识图谱专注于石油勘探、开发、储运、炼化等上中下游领域,从特定的数据源中抽取实体及关系,其所包含的知识具有极强的专业性与针对性,因此,此类图谱着重强调知识精度和准度,构建时具有一定的难度。虽然石油行业知识图谱起步晚、构建难度大,但各方研究人员已经构建出一些石油行业子领域的知识图谱,主要涉及到油气勘探开发、页岩气水力压裂、油藏构造等方面,但没有针对于石油集输钢制管道的知识图谱。

现有的石油集输钢制管道领域的相关知识未经过系统化处理、知识杂乱无章,领域文件以非结构化的文本数据形式存在,其缺乏语义信息,很难在短时间内获得语义层面的管道知识,从而使石油集输钢制管道知识图谱构建存在困难。

发明内容

本发明的目的在于克服上述现有技术的缺点,提供一种石油集输钢制管道知识图谱构建方法、系统、设备及介质。

为达到上述目的,本发明采用以下技术方案予以实现:

本发明一方面,一种石油集输钢制管道知识图谱构建方法,包括以下步骤:

获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本;其中,预设子方向包括选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效以及完整性管理;

从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;

从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。

本发明石油集输钢制管道知识图谱构建方法进一步的改进在于:

所述各子方向的知识概念具体为:

选材及标准的知识概念包括碳钢管道、不锈钢管道、双金属复合管道和非金属管道;腐蚀包括内腐蚀、外腐蚀,腐蚀的知识概念包含腐蚀机理、腐蚀形貌、腐蚀监测、腐蚀直接评价、腐蚀预测以及腐蚀影响因素;防腐方法的知识概念包括使用内涂层、内穿插管、清管、缓蚀剂或非金属管的内防腐方法和使用外防腐层,利用阴极保护的内防腐方法;施工标准规范的知识概念包括施工流程、施工要求和施工作业;加工的知识概念包括焊管的加工以及无缝管的加工;失效的知识概念包括失效原因分析、失效形式以及失效预防方法;完整性管理的知识概念包括数据收集、设计完整性、管道分类分级、高后果区识别、风险评价、检测评价、修复措施、维护及管理以及效能评价。

所述根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架的具体方法为:

根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,获取石油集输钢制管道各知识本体,基于石油集输钢制管道各知识本体构建石油集输钢制管道知识本体模型;针对石油集输钢制管道各知识本体,从高层至低层建立概念层级,各概念层级之间用概念层级关系建立联系;以概念层级关系作为石油集输钢制管道知识图谱的结构,建立石油集输钢制管道知识图谱结构;将石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中,得到石油集输钢制管道的知识图谱总框架。

所述将石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中时,把石油集输钢制管道知识本体模型的概念层级作为树,顶层的概念层级作为根节点,中间的概念层级作为子节点,底层的概念层级作为叶节点,将形成的概念树结构的石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中。

所述构建石油集输钢制管道的知识图谱总框架时,采用protege工具构建石油集输钢制管道的知识图谱总框架。

所述将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中的具体方法为:通过人工抽取方法和/或三元组抽取方法,将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中。

所述通过三元组抽取方法将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中的具体方法为:

将实例输入预设的关系抽取模型中,得到实例的关系类型;将实例以及实例的关系类型,输入预设的实体识别模型中,得到实例中每个词的实体类别;将实例中每个词的实体类别,输入预设的实体分类模型中,得到实例在知识图谱中所对应的知识概念,依据实例在知识图谱中所对应的知识概念,将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中。

本发明第二方面,一种石油集输钢制管道知识图谱构建系统,包括:

获取模块,用于获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本;其中,预设子方向包括选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效以及完整性管理;

框架构建模块,用于从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;

填充模块,用于从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。

本发明第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述石油集输钢制管道知识图谱构建方法的步骤。

本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述石油集输钢制管道知识图谱构建方法的步骤。

与现有技术相比,本发明具有以下有益效果:

本发明石油集输钢制管道知识图谱构建方法,通过获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本,然后从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;最后从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。通过将石油集输钢制管道相关的知识进行梳理总结,将大量实体和关系通过知识图谱进行表达,且随着领域内文献数量的增长以及构建技术的细化,知识图谱的效果越来越好,使得对集输钢制管道知识的灵活、多层次的检索与浏览成为可能。进而,可以清晰地展示石油集输钢制管道语义知识,知识准确性高,并且尽可能降低了员工对于专业管道知识的经验要求。

附图说明

图1是本发明实施例的石油集输钢制管道的知识图谱的结构示意图;

图2是本发明实施例的石油集输钢制管道知识图谱构建方法流程图;

图3是本发明石油集输钢制管道在选材领域的结构示意图;

图4是本发明石油集输钢制管道在选材领域中理化性能概念的结构示意图;

图5是本发明石油集输钢制管道在选材领域中规格概念的结构示意图;

图6是本发明石油集输钢制管道在腐蚀领域的结构示意图;

图7是本发明石油集输钢制管道在防腐领域的结构示意图;

图8是本发明石油集输钢制管道在防腐领域中阴极保护方法概念的结构示意图;

图9是本发明石油集输钢制管道在失效领域的结构示意图;

图10是本发明石油集输钢制管道在施工领域的结构示意图;

图11是本发明石油集输钢制管道在施工领域中施工要求概念的结构示意图;

图12是本发明石油集输钢制管道在施工领域中施工流程概念的结构示意图;

图13是本发明石油集输钢制管道在施工领域中施工流程概念中焊接施工概念的结构示意图;

图14是本发明石油集输钢制管道在加工领域的结构示意图;

图15是本发明石油集输钢制管道在完整性管理领域的结构示意图;

图16是本发明关系抽取运行示意图;

图17是本发明实体识别运行示意图;

图18是本发明实体分类运行示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明一实施例中,提供一种石油集输钢制管道知识图谱构建方法,包括以下步骤:获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本;其中,预设子方向包括选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效以及完整性管理;从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。

具体的,本实施例中,所述各子方向的知识概念具体为:选材及标准的知识概念包括碳钢管道、不锈钢管道、双金属复合管道和非金属管道;腐蚀的知识概念包括内腐蚀、外腐蚀,这是描述某腐蚀发生位置的基本概念。腐蚀包含腐蚀机理、腐蚀形貌、腐蚀监测、腐蚀直接评价、腐蚀预测以及腐蚀影响因素;防腐方法的知识概念包括使用内涂层、内穿插管、清管、缓蚀剂或非金属管的内防腐方法和使用外防腐层,利用阴极保护的内防腐方法;施工标准规范的知识概念包括施工流程、施工要求和施工作业;加工的知识概念包括焊管的加工以及无缝管的加工;失效的知识概念包括失效原因分析、失效形式以及失效预防方法;完整性管理的知识概念包括数据收集、设计完整性、管道分类分级、高后果区识别、风险评价、检测评价、修复措施、维护及管理以及效能评价。

具体的,本实施例中,所述根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架的具体方法为:根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,获取石油集输钢制管道各知识本体,基于石油集输钢制管道各知识本体构建石油集输钢制管道知识本体模型;针对石油集输钢制管道各知识本体,从高层至低层建立概念层级,各概念层级之间用概念层级关系建立联系;以概念层级关系作为石油集输钢制管道知识图谱的结构,建立石油集输钢制管道知识图谱结构;将石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中,得到石油集输钢制管道的知识图谱总框架。

具体的,本实施例中,所述将石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中时,把石油集输钢制管道知识本体模型的概念层级作为树,顶层的概念层级作为根节点,中间的概念层级作为子节点,底层的概念层级作为叶节点,将形成的概念树结构的石油集输钢制管道知识本体模型映射至石油集输钢制管道知识图谱结构中。

具体的,本实施例中,在构建石油集输钢制管道的知识图谱总框架时,采用protege工具构建石油集输钢制管道的知识图谱总框架。

具体的,本实施例中,所述将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中的具体方法为:通过人工抽取方法和/或三元组抽取方法,将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中。其中,通过三元组抽取方法将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中的具体方法为:将实例输入预设的关系抽取模型中,得到实例的关系类型;将实例以及实例的关系类型,输入预设的实体识别模型中,得到实例中每个词的实体类别;将实例中每个词的实体类别,输入预设的实体分类模型中,得到实例在知识图谱中所对应的知识概念,依据实例在知识图谱中所对应的知识概念,将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中。

综上,本发明石油集输钢制管道知识图谱构建方法,通过获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本,然后从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;最后从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。通过将石油集输钢制管道相关的知识进行梳理总结,将大量实体和关系通过知识图谱进行表达,且随着领域内文献数量的增长以及构建技术的细化,知识图谱的效果越来越好,使得对集输钢制管道知识的灵活、多层次的检索与浏览成为可能。进而,可以清晰地展示石油集输钢制管道语义知识,知识准确性高,并且尽可能降低了员工对于专业管道知识的经验要求。

下面结合附图对本发明做进一步详细描述:

如图1所示,本发明再一实施例中,提供一种基于上述石油集输钢制管道知识图谱构建方法构建的知识图谱,该知识图谱将石油集输钢制管道涉及到的七类知识:管道选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效、完整性管理,在本体概念层建立相应关系,详细说明如下。

“管道”概念是该领域图谱的中心概念,所有七类知识围绕“管道”概念展开。管道包含管道标准与管材选用标准,这两类概念隶属于管道选材及标准相关知识。管道选材及标准知识中规定并描述了各种管道的各项参数。管道包含失效预防方法、失效原因分析、失效形式,这三类概念隶属于失效相关知识。失效知识囊括了目前石油集输钢制管道发生失效时的各类情况,描述失效形式、分析失效原因、提出失效方法。其中失效形式包含腐蚀,由于腐蚀在石油集输钢制管道知识中的重要性,在本发明实施例中将其作为七种知识子方向之一,腐蚀部分描述了管道发生腐蚀时的形态、机理、原因等知识。管道包含施工标准规范、满足施工要求,其中施工标准规范包含施工要求和施工流程。以上所述概念皆属于施工相关知识,施工知识描述了石油技术钢制管道修建施工时涉及到的各类知识。其中施工流程的子类有管道防腐及保温等,管道防腐及保温的子类有防腐方法,由于防腐在石油集输钢制管道知识中的重要性,在本发明实施例中将其作为七种知识子方向之一,防腐部分描述了管道防腐时的各种方法。管道包含加工,加工相关知识描述了石油集输钢制管道加工时的要求、流程等信息。管道包含完整性管理,完整性管理指管理者为保证管道在结构和功能上的完整性而进行一系列系统的管理活动。

如图2所示,本发明再一实施例中,提供一种石油集输钢制管道知识图谱构建方法的具体细节流程,包括以下步骤。

S1:收集领域非结构化数据,划分领域子方向。获取石油集输钢制管道领域的非结构化文本数据集,进行知识梳理,对石油集输钢制管道处理的子方向进行划分。具体的,将石油集输钢制管道分为管道选材与标准、腐蚀、防腐方法、施工标准规范、加工、失效以及完整性管理七个方面。

S2:抽象知识本体概念和关系,建立概念层。从相关的非结构化文本中抽象出知识概念和概念类间关系,归纳得到包含石油集输钢制管道上层概念和关系的知识体系。从以上七个子方向分别建立起概念层,并整合为知识图谱总框架。

S3:阅读文本资料抽取实例,建立实例层。每个子方向都根据非结构化文本中,实体在知识图谱中所匹配的概念进行实例化,同时建立实体间的关联关系,最终将概念与实例以owl格式文件存储。

S4:构建三元组抽取模型,标注数据进行有监督训练。通过设计的针对石油集输钢制管道的三元组抽取方法,从非结构化文本(txt格式)抽取这些概念和关系的实例,对知识图谱进行进一步扩充。

具体的,所述步骤S1中,需要领域专家人工对石油集输钢制管道核心资料进行逻辑梳理和上层抽象,构建石油集输钢制管道知识本体模型,针对不同本体从高层至低层建立语义层次,层次之间用关系建立联系。建立石油集输钢制管道知识图谱结构,结构指概念层级关系,表示的是石油集输钢制管道知识本体概念层级结构。本体概念层级关系同时应用于实体层级关系,实体关系表示石油集输钢制管道知识中实体及其之间的关系,以此建立突发事件应急决策知识图谱KG的基本结构。建立石油集输钢制管道知识本体模型与知识图谱结构的映射匹配机制,把石油集输钢制管道知识本体模型的概念层级结构当作树,顶层概念为根节点,多层子概念为子节点,概念最底层的实例为叶节点,将概念树结构完整的映射到知识图谱中。

2、具体的,所述步骤S2包括以下子步骤:

S21:管道作为最上层概念,包含管道选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效、完整性等子概念。

S22:管道选材及标准:管道根据材料可划分为碳钢管道、不锈钢管道、双金属复合管道和非金属管道。每种不同类型的管道材料有其对应的牌号、化学成分、力学性能、金相组织和耐蚀性能,每种性能有其对应的允许偏差、试验方法、试验仪器等,对于碳钢管道而言,常见的材料牌号有20#、L245M、L245NS、L360N、L415M、20G等,对于不锈钢管道而言,常见的材料牌号有316L、304L、2205(22Cr)等。对于管道的规格有直径、公称直径、长度、内径等规格参数。对于集输管线,根据不同的工况类型、温度等条件的不同,其管材的一般选用标准也有所不同。

S23:腐蚀:腐蚀指管道腐蚀,某管道发生某腐蚀。腐蚀的子概念有内腐蚀、外腐蚀,这是描述某腐蚀发生位置的基本概念。腐蚀包含腐蚀机理、腐蚀形貌、腐蚀监测、腐蚀直接评价、腐蚀预测、腐蚀影响因素;在不同环境下,某腐蚀的腐蚀机理、腐蚀形貌、腐蚀影响因素会有所不同,需要根据具体情况分析。腐蚀监测、腐蚀直接评价、腐蚀预测目前只针对内腐蚀而言,其描述了一些科学方法对内腐蚀的处理。

S24:防腐方法:防腐方法是针对管道腐蚀问题应对的方式,属于管道施工的一个子概念。主要分为两大类,一类是使用内涂层、内穿插管、清管、缓蚀剂、非金属管的内防腐方法,一类是使用外防腐层,利用阴极保护的内防腐方法。防腐层概念下分为内防腐层与外防腐层,内涂层方法使用了内防腐层的实例,外防腐层方法使用了外防腐层的实例,各种防腐层应满足防腐层指标概念下的实例要求。阴极保护装置概念下是阴极保护过程中需要的装置及其实例,阴极保护方法的实例使用此概念下的实例,同时满足阴极保护指标概念下的实例要求。防腐材料概念包含填包料概念、缓蚀剂概念,缓蚀剂方法使用缓蚀剂概念下的实例。清管器概念下是各种清管器的实例,清管方法概念下的实例使用此概念下的实例。非金属管概念属于管道下子概念,非金属管方法下实例使用此概念下实例。

S25:施工标准规范:施工标准规范作为上层管道概念的一个子概念,它包含施工流程、施工要求和施工作业三大部分。其中,施工标准规范中要求各类施工作业包含对应的安全技术;施工流程包含施工准备、施工检验、交接桩及测量放线、施工作业带清理及施工、管道运输装卸和保管、管沟开挖、布管、坡口加工、焊接施工、管道下沟及回填、管道穿越、管道清管测径试压及干燥等子流程,各个子流程需要满足一些标准规定;施工要求包含制造要求、设计要求、防腐要求、包装堆放运输要求、技术要求、检验要求、焊接要求、管道安装要求、管道穿越要求以及管道预制要求等具体方面;不同管道类型需要满足不同的施工要求。

S26:加工:加工指管道加工,某类型管道的加工制造。加工包括焊管的加工以及无缝管的加工。其中焊管包括电弧焊管、电阻焊管(高频、低频)、气焊管、炉焊管、直缝焊管、螺旋焊管,无缝管包括热轧管、冷轧管、冷拔管、挤压管、顶管。焊管的加工流程为开卷-平整-端部剪切及焊接-活套-成形-焊接-内外焊珠去除-预校正-感应加热-定径及校直-切断-水压检查-酸洗-最终检查-包装,无缝管的加工流程为管坯-检验-剥皮-检验-加热-穿孔-酸洗-修磨-润滑风干-焊头-冷拔-固溶处理-酸洗-酸洗钝化-检验-冷轧-去油-切头-风干-内抛光-外抛光-检验-标识-发运。

S27:失效:失效是指管道失效,某管道发生某种失效。管道失效包括失效原因分析、失效形式以及失效预防方法。失效原因分析方法包括现场调查、宏观分析、试验分析(外观、断口、理化)、再现性试验、原因分析、结论及反馈、失效分析报告。其中宏观分析又包括整体观察失效件、清洗失效件、重要部分记录、确定取样方案。试验分析主要分析其化学成分、力学性能、金相组织以及断口。失效形式通常包括腐蚀、开裂、变形、磨损、疲劳。常见的失效预防方法有优化制造工艺、升级材质、加强检验、优化生产工艺、提高施工质量、定期检测和监测。不同管道发生的失效类型以及失效形式不一样,对应的失效预防方法也不同。

S28:完整性:完整性指管道完整性管理,即管理者为保证管道在结构和功能上的完整性而进行一系列系统的管理活动。包含数据收集、设计完整性、管道分类分级、高后果区识别、风险评价、检测评价、修复措施、维护及管理、效能评价。上述各概念有其各自的属性,其属性描述了对当前概念的关注要点。

所述步骤S3包括以下子步骤:

S31:管道选材与标准实例:该部分实例主要来源于管道相关标准文件,其中对管道各项参数做以规定与限制。例如理化性能中的力学性能作为一个概念,图谱中它的一个实例为“力学性能_1”。“力学性能_1”的具体属性有:屈服强度为“壁厚不大于16mm时,屈服强度不小于245MPa”;抗拉强度为“410MPa~530MPa”;断后伸长率“20%”;所属标准为“GB/T8163-2018”;管道牌号为“20”等。

S32:腐蚀实例:该部分实例包括两种:与概念层同名的实例、具体腐蚀情形实例。S321.与概念层同名的实例是为了帮助从业人员能快速获得腐蚀部分的概念关系,建立对腐蚀知识点的整体认知。例如腐蚀作为一个概念,图谱中的一个实例为“腐蚀”,“腐蚀”的具体属性有:腐蚀形貌为“点蚀”、“均匀腐蚀”、“晶间腐蚀”、“应力腐蚀开裂”等(内容较多,不逐一列出);腐蚀机理为“硫化氢腐蚀”、“二氧化碳腐蚀”、“细菌腐蚀”、“电偶腐蚀”;腐蚀因素为“硫化氢”、“二氧化碳”、“氧气”、“氯离子”、“温度”等(内容较多,不逐一列出)。“腐蚀”包含着“腐蚀监测”实例、“腐蚀预测”实例、“腐蚀直接评价”实例。这三个实例的具体内容中又将其要点做为属性进行罗列。S322:具体腐蚀情形实例是从石油集输钢制管道相关资料——工程报告、期刊文献、规范指南等文件中获取实际发生的某次腐蚀。例如腐蚀的子概念内腐蚀的一个实例“腐蚀_1”,“腐蚀_1”的属性有:腐蚀机理为“含氯离子环境下的腐蚀”;腐蚀形貌为“点蚀”;牌号为“316L”(指在此牌号管道中发生了本次腐蚀)。同时,“腐蚀_1”包含腐蚀影响因素实例“腐蚀影响因素1-1”、“腐蚀影响因素1-2”、“腐蚀影响因素1-3”和腐蚀预测实例“预测1-1”。以“腐蚀影响因素1-1”为例,它的属性有:Cl离子为“140000mg/L”;pH为“6.5”;现象为“材料耐蚀性降低”等。“预测1-1”的属性模型为“非线性Markov过程模型”。

S33:防腐方法实例:该部分实例主要来源于与防腐有关的各种标准、工程报告等,描述了防腐涉及到的各类概念的具体限制和规定。例如阴极保护指标的子概念电绝缘装置原则的一个实例“电绝缘装置原则_1”,“电绝缘装置原则_1”的属性有:电连续性为“对于钢质管道的非焊接管道连接头,应在管道接头处安装永久性跨接”;电绝缘形式为“绝缘接头(或绝缘法兰)”、“绝缘短管”、“绝缘管接头”、“套管内绝缘支撑”、“管桥上的绝缘支架”等,还有安装位置、一般原则、安装过程、材料等属性及其具体值。其中,各种标准包括国际标准、国家标准、行业标准以及企业标准等。

S34:施工标准规范实例:该部分实例主要来源于与施工有关的各种标准、规范指南、工程报告等。例如施工要求的子概念焊接要求的一个实例“焊缝形式和厚度要求”,“焊缝形式和厚度要求”的属性有:检验方法为“观察检查”、“采用检查尺检查”、“检查管道焊接检查记录”;检验项目为“主控项目”;检验数量为“全部检验”;要求为“安放式焊接支管或插入式焊接支管的接头、整体补强的支管座,应全焊透,角焊缝厚度不应小于填角焊缝有效厚度。”等。

S35:加工实例:该部分实例主要来源于与管道加工有关的各种标准、报告等。加工流程有两部分组成,包括无缝钢管加工流程、焊管加工流程,描述了两种管道加工制造的具体流程。例如焊管加工流程的一个实例“加工流程_1”,“加工流程_1”的属性有:名称、编号,名称为“开卷”,编号为“1”,其中编号描述的为加工流程的时序关系。

S36:失效实例:该部分实例主要来源于与失效有关的各种失效分析报告等。例如失效原因分析的一个实例“失效原因分析_0”,“失效原因分析_0”的属性有:失效分析机构为“石油管工程技术研究院”;失效分析意义为“改进产品性能、修订标准、仲裁”;失效具体原因为“腐蚀穿孔原因是由于封焊的抗点蚀能力差而形成点蚀坑,在焊接残余应力作用下,在蚀坑底部形成裂纹源,扩展后贯穿封焊,腐蚀性介质通过贯穿裂纹进入基管,发生腐蚀穿孔。”;失效分析目的为“明确失效原因,提出改进建议”。

S37:完整性管理实例:该部分实例主要来源于与完整性管理有关的各种标准,对具体的管理重点进行描述和规定。例如高后果区识别的一个实例“输气管道高后果区识别”,“输气管道高后果区识别”的属性有:I级为“其他管道两侧各200m内有特定场所的区域”等;II级为“除三级、四级地区外,管道两侧各200m内有加油站、油库等易燃易爆场所”等;III级为“管道经过的四级地区,地区等级按照GB 50251中相关规定执行”。

如图3所示,本发明实施例提供一种石油集输钢制管道知识中管道选材与标准的概念层结构,主要包含管道标准与管道管材选用标准。管材选用标准有其描述、温度条件、材质类别、牌号及所属标准等条件。对于每个管材选用实例来讲,有其不考虑工况条件下的一般选用原则,在特定的工况条件以及一系列限制条件下,如最高温度、最大H

如图4所示,本发明实施例提供一种石油集输钢制管道知识中管道选材与标准中理化性能的概念层结构,管道标准的第一个主要部分为理化性能,对于每种牌号有其对应的理化性能指标,如耐蚀性能、水压爆破指标、扩口率、化学成分、力学性能、弯曲性能、压扁性能等。每种性能指标下有包含其对应的限定条件及各项指标,如力学性能包含邵氏硬度、里氏硬度等硬度指标,抗拉强度、屈服强度等。金相组织又分为组织、非金属夹杂物、晶粒度等性能成分指标。

如图5所示,本发明实施例提供一种石油集输钢制管道知识中管道选材与标准中规格的概念层结构,管道标准的另一个主要部分为规格,规格包含外径、壁厚、弯曲度等指标,以及其对应的允许偏差。每种概念下又包含具体的性能指标,以及限定条件,如每米弯曲度、钢管种类、S/D等。

如图6所示,本发明实施例提供一种石油集输钢制管道知识中腐蚀的概念层结构,其中,腐蚀属于失效形式的子概念,有腐蚀形貌、腐蚀机理、腐蚀产物、腐蚀类型等属性,上述属性表明了从业人员通常对腐蚀知识关注的要点,腐蚀从位置上可分为两类:内腐蚀和外腐蚀,在本发明实施例中,内腐蚀和外腐蚀以腐蚀的子概念出现。腐蚀包含腐蚀影响因素、腐蚀预测、腐蚀监测、腐蚀直接评价。其中腐蚀影响因素以其多种属性,描述了通常会影响腐蚀的原因,其属性包括:温度、pH值、电偶、流速、应力、保温层、Cl离子、S离子等。腐蚀预测、腐蚀检监测、腐蚀直接评价就目前的技术而言,仅针对于内腐蚀。腐蚀预测的属性有:预测精度、预测误差、模型。腐蚀监测的属性有监测目的、监测方法、监测位置、装置安装、数据采集。腐蚀直接评价知识中,通常针对管道运输介质类型不同而有不同的直接评价,为了描述这种特征,其属性为:管道干湿。

如图7所示,本发明实施例提供一种石油集输钢制管道知识中防腐的概念层结构,其中,管道防腐及保温概念属于施工流程的子概念,有属性施工步骤编号、施工步骤名称、要求等内容来描述其内容。管道防腐及保温的子概念有防腐层检测和防腐方法,防腐方法的子概念包括内防腐方法和外防腐方法,这两种子类分别针对于管道与运输介质接触的管道内壁防腐、管道与运输外部环境接触的管道外壁防腐。内防腐方法的子概念有清管方法、内穿插管方法、非金属管方法、缓蚀剂方法和内涂层方法。在描述这些知识时所关注的重点以概念属性的形式提出,内防腐方法的属性有:使用、质量要求、包括内容、来源、一般规定、原材料质量要求、所属、满足、施工方法、要求。清管方法使用清管器;非金属管方法使用非金属管的制造工艺和制造标准等知识来归纳内防腐时所采用的方法;缓蚀剂方法使用缓蚀剂;内涂层方法使用防腐层的子概念——内防腐层达到防腐目的,内防腐层的子类有熔结环氧粉末内防腐层。外防腐方法的子概念有外防腐层方法和阴极保护方法。外防腐层方法的属性有:满足、进行等,外防腐层方法使用防腐层的子类外防腐层达到防腐目的,外防腐层的子概念有聚乙烯防腐层,聚乙烯防腐层满足防腐层厚度、防腐层指标、聚乙烯专用料的压制片材料性能指标概念要求,防腐层厚度的要求以其的属性体现,属性有:环氧涂层厚度、防腐层类型、机械强度、胶粘剂层厚度、防腐层最小厚度、钢管公称直径DN等;防腐层指标的要求以其的属性体现,属性有:项目、质量指标、试验方法、防腐层类型、机械强度、防腐层最小厚度、温度、防腐层结构、环氧涂层厚度、胶粘剂层厚度、钢管公称直径DN等。聚乙烯专用料的压制片材料性能指标的要求以其属性体现,属性有:性能指标、项目、试验方法、所属标准等。

如图8所示,本发明实施例提供一种石油集输钢制管道知识中防腐中的阴极保护方法的概念层结构,阴极保护方法使用阴极保护装置,阴极保护方法作为外防腐方法的子概念,使用阴极保护装置,详细可分为强制电流阴极保护方法概念与牺牲阳极阴极保护方法概念。这两种概念都需要满足阴极保护指标概念下的阴极保护电位概念的具体参数要求,包括阴极保护电位、适用范围、标准。阴极保护装置概念的子概念有电绝缘装置、牺牲阳极、辅助阳极、电源设备。电绝缘装置参数有描述、所属标准,需要满足阴极保护指标下电绝缘装置要求,电绝缘装置概念下包含参数一般原则、安装位置、安装过程、尺寸、所属标准、材料、来源、电绝缘形式、电连续性、结构、设计。电源设备需要满足阴极保护指标概念下电源相关要求概念,包含参数所属标准。辅助阳极概念参数包括填充料、所属标准、浅埋阳极地床条件、深井阳极地床条件、阳极数量、允许电流密度、密度、寿命、拉脱力数值、接地电阻、气孔率、灰分、电阻率、石墨化程度、阳极引出线接触电阻、阳极电缆长度、锰含量、铁含量、磷含量、碳含量、铬含量、硫含量、硅含量、允许电流密度、类型、阳极引出线长度。牺牲阳极应满足理化性能下子概念电化学性能,参数包含适用条件、类型、实际电容量、密度、开路电压(相对CSE)、消耗率、生电容量、理论电容量、电流效率、来源、所属标准、开路电压(相对SCE)。

如图9所示,本发明实施例提供一种石油集输钢制管道知识中失效的概念层结构,管道包含失效预防方法、失效原因分析以及失效形式。失效预防方法有属性措施来描述其内容;失效原因分析有失效具体原因、失效分析机构、失效分析目的以及失效分析意义等内容来描述其内容;失效形式子概念腐蚀、疲劳、开裂、变形、磨损。失效形式的属性有位置、腐蚀类型以及失效原因,失效原因又是通过位置、灾害类型、腐蚀类型几种属性来描述其内容。同时,失效原因分析的方法包括现场调查、宏观分析、试验分析、再现性试验、原因分析、结论及反馈、失效分析报告。现场调查的属性是调查结果;宏观分析有失效位置这一属性来描述其内容,试验分析、再现性试验以及结论及反馈都是通过结论这一属性来描述其内容,失效分析报告的属性是预防方法及建议等。

如图10所示,本发明实施例提供一种石油集输钢制管道知识中施工的概念层结构,管道满足施工要求,管道包含施工标准规范。施工标准规范包含施工要求、施工流程和施工作业。施工要求属于施工标准规范,施工流程属于施工标准规范,施工作业属于施工标准规范。施工要求与施工流程的子类数量繁多,在后图中做展示和详细说明。施工流程的属性有施工步骤编号和施工步骤名称。施工作业的属性有施工准备工作、施工安全技术要求、施工安全措施及施工注意事项。

如图11所示,本发明实施例提供一种石油集输钢制管道知识中施工中的施工要求的概念层结构,施工要求属于施工标准规范,施工要求的子类有:制造要求、设计要求、防腐要求、包装堆放运输要求、技术要求、焊接要求、检验要求、管道安装要求、管道穿越要求、管道预制要求。各子类都有属性:要求,来描述具体的要求。其中,检验要求的属性有:检验方法、检验数量、检验项目、包括内容等。管道安装要求的属性有检验数量、检验项目、检验方法等。

如图12所示,本发明实施例提供一种石油集输钢制管道知识中施工中的施工流程的概念层结构,施工流程是属于施工标准规范的概念,施工标准规范概念包含施工流程概念,在此将其摘出进行概念层展示。施工流程通过施工步骤编号、施工步骤名称以及要求等属性来描述其子流程,子流程是施工流程中的每一步实施过程。施工流程的子流程主要包括施工准备、施工检验、交接桩及测量放线、施工作业带清理及施工、管道运输装卸及保管、管沟开挖、布管、破口加工、管道防腐及保温、焊接施工、管道下沟及回填、管道穿越以及管道清管测径、试压及干燥等13个步骤,这些在构建知识图谱时是以施工流程的子概念出现的。在描述这些知识时所关注的重点以概念属性的形式提出,因此每个子流程都会有要求属性或者包括内容的属性,表示对这个施工子流程中间实施过程的要求和实施内容。施工检验的子概念有材料检验和设备检验,其中设备检验是对管道或管件材料的检查,材料检验包含对一些证明材料的检查,每种证明材料都含有材料名称的属性。焊接施工作为施工流程的一个子概念,它通过焊接施工步骤名称、焊接施工步骤编号两个属性来区分焊接施工各个步骤的顺序,它的焊接过程通过其子概念体现,在下图中进行介绍。

如图13所示,本发明实施例提供一种石油集输钢制管道知识中施工中的施工流程中的焊接施工的概念层结构,焊接施工是施工流程的一个子概念,通过焊接施工步骤名称、焊接施工步骤编号两个属性来区分焊接施工各个步骤的顺序,焊接施工的子流程包括组对、焊前预热、焊缝热处理、焊接、焊缝返修、无损检测等,这些子流程是以子概念的形式出现,表示在焊接施工过程中的每一步实施过程,都含有要求的属性。其中,焊接前需要进行组对、焊前预热及焊缝热处理,这三项是焊接前的准备工作。无损检测是在不破坏被检查材料或产品的外形、尺寸以及性能的前提下,对其质量进行检验或对其尺寸、性能进行测量的一种技术手段,多种无损检测的方法通过原理、要求和适用范围的属性来进行描述。焊缝返修前需要检查焊接缺陷,然后根据缺陷程度进行返修,因此将焊接缺陷作为概念单独抽出,焊接缺陷的子类包括内部缺陷和外部缺陷,外部缺陷位于焊缝的外表面,直接能够看到,而内部缺陷位于焊缝内部。焊接包含焊接方法、焊接工艺评定、焊口、焊接气体保护等概念,焊接方法的属性有要求、描述、分类、优点、缺点、过程和适用范围,焊接工艺评定的属性有包括内容,焊口的属性有要求,焊接气体保护的属性有描述、目的和分类。在进行焊接气体保护时需要使用到保护气体,保护气体是焊接材料的子概念,保护气体的使用有一定的要求。焊接材料还包含焊丝、焊剂、焊条等子概念,焊丝的属性有分类,焊剂的属性有要求、作用和分类,焊条的属性有包括内容、要求、分类和选用原则等。

如图14所示,本发明实施例提供一种石油集输钢制管道知识中加工的概念层结构,管道包含加工,加工包含加工流程。管道的子类无缝钢管和焊管有其各自的加工流程,无缝钢管包含无缝钢管加工流程,焊管包含焊管加工流程,其具体的加工流程以实例呈现,在例图14里不做表示。

如图15所示,本发明实施例提供一种石油集输钢制管道知识中完整性管理的概念层结构,完整性管理指管理者为保证管道在结构和功能上的完整性而进行一系列系统的管理活动。管道包含完整性管理,完整性管理包含数据收集、设计完整性、管道分类分级、高后果区识别、风险评价、修复措施、效能评价、维护及管理、检测评价,其中检测评价包含内检测、直接评价、压力试验。完整性管理包含的概念较多,每个概念都关注着管道在建设、使用、维护中的重点管理活动,各概念的属性在一定程度上说明了此概念的描述角度,其中,数据收集的属性有:采集内容、台账、生产运行动态监测数据;设计完整性的属性有:合理选材、设计类型;管道分类分级的属性有风险程度、类次;高后果区识别的属性有管理、判断依据;风险评价的属性有评价方法、危害因素、失效可能性分析、失效后果分析;修复措施的属性有管道修复方法、防腐层修复方法;效能评价的属性有:评价指标、周期、覆盖程度、效能改进;维护及管理的属性有:管理内容;内检测的属性有:内检测器类型;直接评价的属性有:CDA方法;压力试验的属性有:压力试验介质。

如图16所示,本发明实例提供一种关系抽取方法。关系抽取模型的输入为非结构化文本,首先模型利用NLP工具对文本进行分词处理、词嵌入、位置嵌入等,通过双向LSTM网络以及Multi-head Self-Attention权重计算后会生成该文本语义向量,进行实体关系分类。其中,关系种类为预先定义好的类别。

如图17所示,本发明实例提供一种实体识别方法。实体识别模型的输入为非结构化文本以及该文本通过关系抽取模型后得到的关系类型。与关系抽取模型的不同是:此模型在形成词向量序列时,将每个词的词向量与该段文本对应的关系进行了融合。然后将融合后的词向量序列输入到一个全连接分类层中,对每个词进行实体分类,输出为句中每个词的实体类别。其简单来看也是一个分类模型,类别是主语、谓语、宾语或O(代表不是实体词)。

如图18所示,本发明实例提供一种实体分类方法。实体分类模型的输入是实体识别模型得到的实体词,与上述关系抽取、实体识别模型的词向量生成过程相同,而后将该实体词的词向量输入到全连接分类层(类别是知识图谱概念层中的概念),从而得到实体在知识图谱中所对应的概念。

最后将以上三个模型串行运行,即可实现从非结构化文本中抽取三元组,即三元组抽取方法。将抽取的三元组存入石油集输钢制管道知识图谱。

下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未纰漏的细节,请参照本发明方法实施例。

本发明再一实施例中,提供一种石油集输钢制管道知识图谱构建系统,能够用于实现上述的石油集输钢制管道知识图谱构建方法,具体的,该石油集输钢制管道知识图谱构建系统包括获取模块、框架构建模块以及填充模块。

获取模块用于获取石油集输钢制管道的非结构化文本数据集,并按照预设子方向进行划分,得到各子方向的非结构化文本;其中,预设子方向包括选材及标准、腐蚀、防腐方法、施工标准规范、加工、失效以及完整性管理;框架构建模块用于从各子方向的非结构化文本中抽取各子方向的知识概念,以及各子方向的知识概念的概念类间关系,根据各子方向的知识概念以及各子方向的知识概念的概念类间关系,构建石油集输钢制管道的知识图谱总框架;填充模块用于从各子方向的非结构化文本中,抽取各子方向的概念实体及概念实体间关联关系的实例,并将各子方向的实例填充至石油集输钢制管道的知识图谱总框架中,得到石油集输钢制管道知识图谱。

本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于石油集输钢制管道知识图谱构建方法的操作。

本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关石油集输钢制管道知识图谱构建方法的相应步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

相关技术
  • 一种疾病知识图谱构建方法和平台系统、设备、存储介质
  • 一种知识图谱推理方法、电子设备、存储介质及系统
  • 知识图谱构建方法、知识图谱构建系统和计算设备
  • 基于知识图谱的政务知识库构建方法、系统、设备及介质
技术分类

06120115892199