掌桥专利:专业的专利平台
掌桥专利
首页

一种石油数据模型建模方法及工具

文献发布时间:2023-06-19 11:08:20


一种石油数据模型建模方法及工具

技术领域

本发明属于石油勘探开发生产技术领域,具体为一种石油数据模型建模方法及工具。

背景技术

石油的勘探开发信息化多年来,不同的油公司根据不同的业务需要,建设了无数的业务应用系统,伴随着建设了无数的业务数据库。数据库建设的前提是需要根据业务需要,构建数据的业务模型和物理模型,传统的方法是:①业务分析调研(石油业务人员);②数据表关系图设计(软件技术人员);③物理表建立(软件技术人员利用mysql等数据库工具);④输出数据字典(输出到office工具,再业务整理);⑤将字典与业务人员审核修改后又重复一轮所有工作。

在实际建模过程中,业务人员没有数据库思维,软件技术人员无法理解专业性非常强的石油专业数据,造成沟通上的困难,最终做出来的模型也总是打了折扣;因此需要一种业务人员能够建模的石油数据模型的建模方法及工具。

传统的数据库建设一般只是立足于某一块业务,是一个个独立的烟囱,石油的勘探开发生产涉及到业务面很广,现在的油公司都在做数据统一平台建设,例如建设数据湖,想利用数据湖技术对历史的数据孤岛进行数据整合,数据湖解决了一些问题:①解决了统一技术平台的问题;②解决了数据统一管理的问题;③解决了业务系统集成的问题;④解决了业务组件沉淀的问题,但是它本质上只是将应用数据库建得更大更全,建设数据库的方法和传统的方法没有区别。

同时,现在这种数据管理应用方式在建模时也有很大的局限性:①缺少一套适用于所有油公司的统一的数据建模标准,会导致前期/后期,不同公司之间的模型不一致;②做数据整合时,需要不停的增加物理表,最终将湖无限扩大,也不可能管理到所有的石油数据,运维的难度大;③数据存储依赖物理模型,缺少业务背景信息及业务关系描述;④很难知道站在石油地质理论角度,到底管理了哪些数据,缺少哪些数据;⑤因为不是基于统一业务模型,很难构建知识图谱,无法满足未来应用。

发明内容

(一)解决的技术问题

为了克服现有技术的上述缺陷,本发明提供了一种石油数据模型建模方法及工具,解决了在实际建模过程中,业务人员没有数据库思维,软件技术人员无法理解专业性非常强的石油专业数据,造成沟通上的困难,最终做出来的模型也总是打了折扣的问题。

(二)技术方案

为实现上述目的,本发明提供如下技术方案:一种石油数据模型建模方法,包括以下步骤:

S1、需首先建设业务坐标体系,并且对坐标体系进行划分五大维度,并定义五大维度的刻度,每个维度通过树形管理方式,能够自动编码,记录有子父级关系和先后顺序,且五大维度如下:

对象域:每一个业务数据需依存于一个业务对象,业务对象为石油业务中的工作组织单元或者工作对象,业务对象类型即按照规定的标准将业务对象进行分类的集合。

业务域:按照石油勘探开发时间维度,划分到工作阶段,每一个工作阶段有明显的边界,并且每个工作阶段有相对固定的成果,不同的业务域不能有工作交叉,只能有先后顺序。

工作域:以在一个时间节点上,划分为多少种工作性质来划分,主要分为工程、研究、管理、经营四个工作域。

工作过程:业务过程为一项具体工作的工作节点划分,且工作环节可以分为多个层级,单个业务过程包含工作顺序、技术方法和工作目的三个要素。

专业域:不同的技术方法可按照石油地质专业划分,具体为工程技术方法、研究技术维度,管理层级及目的,经营方面为人力资源、财务、采购和计划。

S2、其次分别定义五大维度的刻度之间的关系,通过枚举的形式,排列组合并且一一去标记。

S3、建立有关系的五大维度的不同级别刻度,通过后台自动生成组合为各个的业务节点,同时管理工具提供修改维护功能。

S4、将业务积累梳理的对数据字段定义用的枚举附录值表进行统一管理。

S5、将业务积累梳理的对数据字段定义用的量纲表进行统一管理。

S6、将业务积累梳理的对数据字段的属性定义,结合附录量纲表,进行标准化管理。

S7、业务人员结合业务模型定义的业务多点,选择新建所需的业务数据集,业务数据集即可定位到业务坐标体系中。

S8、维护业务数据集的具体数据内容,只需挑选标准数据字段,即可完成石油数据模型建立。

一种石油数据模型建模方法的工具,包括石油数据模型,可通过石油数据模型推导出理论中各种数据,石油数据模型为单个石油数据与其对应的石油勘探开发活动及对象的对应关系,可通过该对应关系即可计算出理论数据的多少,其主要步骤如下:

①、在石油数据模型的基础上建立模型各维度间的关系,维度两两之间需要建立相关或不相关的关系,设对象域刻度为bo、业务域刻度为bd、工作域刻度为bw、工作过程刻度为bp、专业域刻度为ds。

②、在五维度间,任意两维度间的刻度均相关,从每个维度中取出一个刻度进行排列组合,即可获得最大的理论数据集,业务节点sn={bo,bd,bw,bp,ds}。

③、按照石油地质理论,并不是所有的刻度间均能建立相关关系,需要将不能建立相关关系的刻度从理论数据集中去掉,设对象域的bo和业务域的bd不相关,则bo和bd不能同时在业务节点中出现,即:

④、理论业务节点集合sn,将不能同时出现的刻度队从理论业务节点集合sn中删除,即可获得实际的业务节点集合sn。

⑤、每个业务节点上都有且至少有一个成果数据,即可活动理论上的成果数据集合。

通过石油数据模型对数据的虚拟整合及标准化处理提供支持,其数据虚拟整合包括以下步骤:

步骤A:建立节点模型,包含字段X、Y、Z,绑定维度1、维度2、维度3、维度4。

步骤B:数据结构映射,设有整合S1系统、S2系统数据的需求,对此分别配置S1表到M1、S2表到M1的字段映射关系。

步骤C:数据资源注册,通过数据资源注册,生成M1节点实例数据M1S1,M1S1为S1系统中数据,且数据为:a1、b1、c1、d1、d2、d3、d4,及M1S2,M1S2为S2系统中数据,且数据为:e1、f1、g1、d1、d2、d3、d4,提供标准化数据供第三方使用。

通过石油数据模型可构建知识图谱,构建石油数据模型概念图谱的步骤如下:

(1)获取维度实体,概念图谱的实体包括:五维度的刻度值和业务节点,五维度刻度根据石油业务的实际流程进行建立。

(2)获取业务节点实体,业务节点根据五个维度和维度关系系统自动产生,可通过上述①-⑤流程实现。

(3)获取维度刻度的内部关系,维度刻度的内部关系根据石油业务的实际流程建立,系统直接从数据库中获取。

(4)比较五维度的刻度间关系,主要包括如下过程:

a、读取两个业务节点的五维刻度。

b、比较对象域刻度关系,从数据库中读取两个刻度的关系,包括:空间包含、空间被包含、空间交叉、非空间关系及对象。

c、比较业务域的关系,从数据库中读取两个刻度的关系,包括:时间关系、父子关系。

d、比较工作域的关系,从数据库中读取两个刻度的关系,包括:并列关系、父子关系。

e、比较工作过程域的关系,从数据库中读取两个刻度的关系,包括:并列关系、父子关系。

f、比较专业域的关系,从数据库中读取两个刻度的关系,包括:替代关系、包含关系。

(5)根据五个维度的刻度关系,得到业务节点和业务节点间的关系,且业务节点和业务节点间在不同维度会存在多个关系。

(6)即可绘制石油数据模型概念图谱关系图。

(三)有益效果

与现有技术相比,本发明的有益效果在于:

该石油数据模型建模方法及工具,可以基于石油地质理论和行业规范,建立一套通用于所有油公司的石油数据描述模型;能够由业务人员或非软件开发人员直接进行建模,不需要数据库建设相关的专业技能;依托建好的数据模型,能够快速生成石油数据知识图谱;依托建好的数据模型,能够提供数据标准去做数据的虚拟整合;也可以生成物理库表,快速建设小型的应用系统;通过维度刻度的关系计算,能够推算出理论上应该有多少石油行业数据;提供了石油数据的业务坐标体系,能够快速定位,找到关系数据,为各种应用提供了一定的适用性。

附图说明

图1为本发明石油数据模型管理系统示意图;

图2为本发明理论数据计算的流程示意图;

图3为本发明步骤A的示意框图;

图4为本发明步骤B的示意框图;

图5为本发明步骤C的示意框图;

图6为本发明石油数据模型概念图谱关系图;

图7为本发明索引建设示意框图;

图8为本发明知识图谱的示意框图。

具体实施方式

下面结合具体实施方式对本专利的技术方案作进一步详细地说明。

如图1-8所示,本发明提供一种技术方案:一种石油数据模型建模方法,包括以下步骤:

S1、需首先建设业务坐标体系,并且对坐标体系进行划分五大维度,并定义五大维度的刻度,每个维度通过树形管理方式,能够自动编码,记录有子父级关系和先后顺序,且五大维度如下:

对象域:每一个业务数据需依存于一个业务对象,业务对象为石油业务中的工作组织单元或者工作对象,业务对象类型即按照规定的标准将业务对象进行分类的集合。

业务域:按照石油勘探开发时间维度,划分到工作阶段,每一个工作阶段有明显的边界,并且每个工作阶段有相对固定的成果,不同的业务域不能有工作交叉,只能有先后顺序。

工作域:以在一个时间节点上,划分为多少种工作性质来划分,主要分为工程、研究、管理、经营四个工作域。

工作过程:业务过程为一项具体工作的工作节点划分,且工作环节可以分为多个层级,单个业务过程包含工作顺序、技术方法和工作目的三个要素。

专业域:不同的技术方法可按照石油地质专业划分,具体为工程技术方法、研究技术维度,管理层级及目的,经营方面为人力资源、财务、采购和计划。

S2、其次分别定义五大维度的刻度之间的关系,通过枚举的形式,排列组合并且一一去标记。

S3、建立有关系的五大维度的不同级别刻度,通过后台自动生成组合为各个的业务节点,同时管理工具提供修改维护功能。

S4、将业务积累梳理的对数据字段定义用的枚举附录值表进行统一管理。

S5、将业务积累梳理的对数据字段定义用的量纲表进行统一管理。

S6、将业务积累梳理的对数据字段的属性定义,结合附录量纲表,进行标准化管理。

S7、业务人员结合业务模型定义的业务多点,选择新建所需的业务数据集,业务数据集即可定位到业务坐标体系中。

S8、维护业务数据集的具体数据内容,只需挑选标准数据字段,即可完成石油数据模型建立。

一种石油数据模型建模方法的工具,包括石油数据模型,可通过石油数据模型推导出理论中各种数据,石油数据模型为单个石油数据与其对应的石油勘探开发活动及对象的对应关系,可通过该对应关系即可计算出理论数据的多少,其主要步骤如下:

①、在石油数据模型的基础上建立模型各维度间的关系,维度两两之间需要建立相关或不相关的关系,设对象域刻度为bo、业务域刻度为bd、工作域刻度为bw、工作过程刻度为bp、专业域刻度为ds。

②、在五维度间,任意两维度间的刻度均相关,从每个维度中取出一个刻度进行排列组合,即可获得最大的理论数据集,业务节点sn={bo,bd,bw,bp,ds}。

③、按照石油地质理论,并不是所有的刻度间均能建立相关关系,需要将不能建立相关关系的刻度从理论数据集中去掉,设对象域的bo和业务域的bd不相关,则bo和bd不能同时在业务节点中出现,即:

④、理论业务节点集合sn,将不能同时出现的刻度队从理论业务节点集合sn中删除,即可获得实际的业务节点集合sn。

⑤、每个业务节点上都有且至少有一个成果数据,即可活动理论上的成果数据集合。

具体的,如图3-5所示,通过石油数据模型对数据的虚拟整合及标准化处理提供支持,其数据虚拟整合包括以下步骤:

步骤A:建立节点模型,包含字段X、Y、Z,绑定维度1、维度2、维度3、维度4。

步骤B:数据结构映射,设有整合S1系统、S2系统数据的需求,对此分别配置S1表到M1、S2表到M1的字段映射关系。

步骤C:数据资源注册,通过数据资源注册,生成M1节点实例数据M1S1,M1S1为S1系统中数据,且数据为:a1、b1、c1、d1、d2、d3、d4,及M1S2,M1S2为S2系统中数据,且数据为:e1、f1、g1、d1、d2、d3、d4,提供标准化数据供第三方使用。

具体的,如图6-8所示,通过石油数据模型可构建知识图谱,构建石油数据模型概念图谱的步骤如下:

(1)获取维度实体,概念图谱的实体包括:五维度的刻度值和业务节点,五维度刻度根据石油业务的实际流程进行建立。

(2)获取业务节点实体,业务节点根据五个维度和维度关系系统自动产生,可通过上述①-⑤流程实现。

(3)获取维度刻度的内部关系,维度刻度的内部关系根据石油业务的实际流程建立,系统直接从数据库中获取。

(4)比较五维度的刻度间关系,主要包括如下过程:

a、读取两个业务节点的五维刻度。

b、比较对象域刻度关系,从数据库中读取两个刻度的关系,包括:空间包含、空间被包含、空间交叉、非空间关系及对象。

c、比较业务域的关系,从数据库中读取两个刻度的关系,包括:时间关系、父子关系。

d、比较工作域的关系,从数据库中读取两个刻度的关系,包括:并列关系、父子关系。

e、比较工作过程域的关系,从数据库中读取两个刻度的关系,包括:并列关系、父子关系。

f、比较专业域的关系,从数据库中读取两个刻度的关系,包括:替代关系、包含关系。

(5)根据五个维度的刻度关系,得到业务节点和业务节点间的关系,且业务节点和业务节点间在不同维度会存在多个关系。

(6)即可绘制石油数据模型概念图谱关系图。

通过石油数据模型可支持搜索应用:

模型数据在索引中相当于实体数据的位置坐标,搜索过程,以模型数据和模型关系为抓手,可以对目标数据从多个维度快速定位,实现全面精准的搜索。

模型与模型之间通过业务关系进行串联,最后会编辑成一张模型关系数据网,通过网的任何一个节点,都可以找到其相关联的目标数据,利用这个关系网,在搜索中可以为用户提供更加丰富的数据,从模型关系网的一个节点出发,以模型中的任何一个维度为线索,用户可以遍历整个索引库里的内容,且以模型为线索可以为用户提供清晰的数据链路,为用户查询数据提供一个非常清晰的思路。

语义分析:模型中的各类模型词都会同步到搜索词库,可以利用模型词去辅助语义分析,支持同义词转换,词项扩展,语义消歧和语义扩展功能。

同义词转换:找出搜索关键字的同义词,近义词和别名。

词项扩展:根据模型词词性找出相关联的其它词性的数据,为语义消歧提供数据支撑。

语义消歧:对用户输入搜索的关系进行语义解析,对存在矛盾和错误的语义表达进行修改或提示。

语义扩展:以当前关系字为基础,找出业务上语义相关连的其它关键字,丰富搜索的内容。

上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。

相关技术
  • 一种石油数据模型建模方法及工具
  • 一种数据模型双驱动下的海杂波建模与抑制方法
技术分类

06120112809336