掌桥专利:专业的专利平台
掌桥专利
首页

一种面向任务基于本体的数据需求分解和匹配方法、系统

文献发布时间:2024-04-18 20:02:18


一种面向任务基于本体的数据需求分解和匹配方法、系统

技术领域

本发明涉及基于元数据的数据共享交换技术,具体涉及一种面向任务基于本体的数据需求分解和匹配方法、系统。

背景技术

数据极大改善了社会生产生活,激发了数字经济发展;数据共享交换是释放数据价值,激发数据要素活力的重要途径;随着我国数字化转型和数字中国的推进,数据将呈现爆发式增长,如何推进数据需求方与数据供给方的有效匹配,提高数据供给水平是各级各类数据中心亟需解决的问题。元数据是关于数据或数据元素的数据,包括其数据描述,以及关于数据拥有权、存取路径、访问权和数据易变性的数据等。元数据是经过验证的可支撑数据资产可发现、可获取、可理解、可链接、可信任和可互操作的技术手段,也是解决数据需求与供给匹配的重要数据手段支撑。

而目前基于元数据的数据需求与数据供给匹配方面研究较少,尚无与之适应的技术和方法,大多是专用模型或数据匹配方法,尤其是针对数据资源供需匹配研究较少。现有技术中,公开号为CN111815280A的中国专利“一种用于数据资源按需共享的方法和系统”针对各委办局的政务服务的办事事项,人工为主梳理各数据需求,将数据需求形成数据需求清单,再提交至相应的委办局进行数据资源责任确认建立对接关系,后进行数据资源共享。但此类技术缺乏对数据需求的数字化描述,因此在需求与供给匹配中多依赖人工或搜索发现,对复杂任务效率低且复杂。有文献(朱杰等人.利用作战任务本体计算战场环境要素语义相似性[J].武汉大学学报(信息科学版).2019.44(9):1407-1415)基于作战任务本体,提出了战场环境数据概念模型本体表示,解决战场环境数据保障实现主动服务的方法。但该技术缺乏对数据需求与供给的匹配方法,不能适用于数据中心进行快速数据共享交换的场景。

发明内容

发明目的:本发明的目的是提供一种面向任务基于本体的数据需求分解和匹配方法、系统,能够同时适应各类任务数据需求的元数据表达,并对数据需求与数据资源进行匹配关联,显著提高在应对各类任务时间紧任务重等情况下数据资源利用的效率。

技术方案:第一方面,一种面向任务基于本体的数据需求分解和匹配方法,包括以下步骤:

数据需求方向数据协调方提交面向任务的数据共享空间申请,数据协调方基于请求建立数据共享空间,将数据提供方纳入数据共享空间并设置其权限;

数据需求方提出任务需求;

数据协调方获取数据需求方提出的任务需求,基于本体将任务需求分解为任务需求清单,并建立任务需求的元数据表达;根据任务需求清单,细化生成任务数据需求清单,并建立任务数据需求的元数据表达,并基于任务所需能力与配套数据的搜索匹配获得任务对元数据的需求度;

数据协调方将标识了元数据需求度的任务数据需求清单分发给数据提供方,数据提供方对数据需求进行接收和确认,并根据数据需求将数据资产纳入数据共享空间;

数据需求方从数据共享空间获取数据;

数据需求方发布关闭空间的申请,数据协调方基于该申请发布任务数据空间关闭的预告,数据提供方响应于该预告确认退出,数据协调方进行审计和数据存档后,对数据共享空间执行关闭。

进一步地,数据协调方基于请求建立数据共享空间包括:数据协调方对数据共享空间的创建申请进行审查,审查通过后建立数据共享空间。

进一步地,数据协调方基于本体将任务需求分解为任务需求清单,并建立任务需求的元数据表达包括:

构建任务需求,并分解为多个子任务需求,任务需求的组成包括任务标识、任务名称、任务目标、提出人、以及多个子任务需求;

对子任务需求进行分解,子任务需求的组成包括子任务需求标识、子任务需求名称、创建时间、用户ID、用户名称、备注、重要程度、以及多个任务清单描述和对应任务的审核记录;

基于任务本体,将子任务需求细化,完成任务清单描述,每个任务清单资源包括时间要求、空间要求、行动组织需求、人员需求、物资需求、情报信息需求6个方面的需求。

进一步地,数据协调方生成任务数据需求清单,并建立任务数据需求的元数据表达包括:

构建任务数据需求,并分解为多个数据需求清单,任务数据需求的组成包括数据需求标识、数据需求名称、任务清单标识、创建人、以及多个数据需求清单;

对数据需求清单进行分解,数据需求清单的组成包括数据需求清单标识、数据需求清单名称、创建时间、用户ID、用户名称、备注、重要程度、以及多个数据需求清单描述和对应的审核记录;

对于多个数据需求清单描述,建立数据清单需求,包括:空间数据要求、组织数据需求、人员数据需求、物资数据需求;并对每一项数据清单需求,基于任务清单资源需求进行数据资源条件分解和匹配,包括:将任务清单资源的任务时间要求作为时间要求;将任务清单资源的空间要求、行动组织需求、人员需求、物资需求、情报信息需求5个方面的需求分解为数据分类、数据条件和需求描述。

进一步地,数据协调方基于任务所需能力与配套数据的搜索匹配获得任务对元数据的需求度包括:

建立任务与作战能力的对应关系;

建立任务能力与元数据的对应关系;

利用匹配算法基于能力进行任务和元数据集合的匹配。

进一步地,建立任务与作战能力的对应关系包括:对任务清单中的任务与作战能力的对应关系进行分析整理,构建任务-能力对应关系库,使得在输入一个任务后能够查询得出对应的作战能力列表。

进一步地,建立任务能力与元数据的对应关系包括:将元数据清单中的元数据与作战能力的对应关系进行分析整理,构建元数据-能力对应关系库,使得在输入一个元数据后能够查询得出对应的作战能力列表。

进一步地,所述匹配算法采用精准图匹配方法。

进一步地,数据协调方对数据共享空间的审计包括:对数据共享空间中发生的数据资产访问和交换过程进行审计,审计信息包括任务数据共享空间的创建者、创建时间、用户、数据资产、数据操作和空间注销相关信息。

第二方面,一种面向任务基于本体的数据需求分解和匹配系统,包括数据需求方、数据协调方和数据提供方三个角色:

数据需求方,用于向数据协调方提交面向任务的数据共享空间申请;提出数据需求;从数据共享空间获取数据;以及发布关闭空间的申请;

数据协调方,用于基于请求建立数据共享空间,将数据提供方纳入数据共享空间并设置其权限;获取数据需求方提出的任务需求,基于本体将任务需求分解为任务需求清单,并建立任务需求的元数据表达;根据任务需求清单,细化生成任务数据需求清单,并建立任务数据需求的元数据表达,并基于任务所需能力与配套数据的搜索匹配获得任务对元数据的需求度;将标识了元数据需求度的任务数据需求清单分发给数据提供方;基于空间关闭申请发布任务数据空间关闭的预告;以及在所有用户退出之后对数据共享空间进行审计和数据存档,对数据共享空间执行关闭;

数据提供方用于对数据需求进行接收和确认,并根据数据需求将数据资产纳入数据共享空间;以及响应于数据协调方的关闭预告确认退出数据共享空间。

有益效果:(1)本发明基于本体将任务进行自动化分解,形成数据需求清单,能够同时适应各类任务数据需求的元数据表达,并对数据需求与数据资源进行匹配关联,便于统一对数据需求和数据供给的特征表达,从而快速通过映射匹配方法获得任务对元数据的需求度。(2)本发明通过构建面向任务的数据共享空间来链接不同的需求方和提供方,满足对于同一个任务下的不同维度的数据需求的共享和使用,相比于一对一数据交换,为各级单位在实施任务执行过程中提供便利,特别是各类紧急任务的情况下,可极大提高数据共享和数据利用的效率。

附图说明

图1是本发明的面向任务的数据共享空间构建流程;

图2是本发明的任务需求格式组成图;

图3是本发明的任务清单描述格式组成图;

图4是本发明的任务数据需求格式组成图;

图5是本发明的数据需求清单描述格式组成图;

图6是本发明的任务数据需求映射到元数据集合的匹配过程图;

图7是本发明的模式图P示例;

图8是本发明的模式图P在数据G中的精确匹配示例;

图9是本发明的面向任务的数据共享空间使用流程;

图10是本发明的面向任务的数据共享空间关闭流程。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

本发明提供一种面向任务基于本体的数据需求分解和匹配方法,该方法基于包括数据需求方、数据协调方和数据提供方三个角色的数据需求分解和匹配系统,在该系统中,数据需求方是对数据有需求的角色,数据提供方是提供数据源的角色,数据协调方通过建立数据共享空间和对需求的分解,提供对任务的元数据表达并促进供需双方的匹配和链接。需要理解的是,上述的需求方和提供方角色划分并不表示该角色仅具有相应的功能,而是根据场景可以改变的。例如,数据需求方本身也拥有自身的数据,在一些场景下也可以作为数据提供方。例如,数据提供方在有数据需求的情况下,转变为数据需求方。

根据本发明的实施方式,首先面向任务建立数据共享空间,然后在数据共享空间中完成每个任务需求的数据获取,在数据使用之后关闭空间。相应地,数据共享空间包括三个阶段:构建阶段、使用阶段、注销阶段。参照图1,在构建阶段,数据需求方向数据协调方提交面向任务的数据共享空间申请,数据协调方基于请求进行受理审查,审查通过建立数据共享空间,将数据提供方纳入数据共享空间并设置其权限,数据提供方对加入数据空间进行确认。创建时受理审查需求申报人提交的申请表的内容是否完备、申请事项是否真实等。将数据提供方纳入空间,主要为数据提供方提供空间的相关访问权限,如相关目录的读写权限等。

在一个实施例中,任务数据共享空间的构建需要申请人提报任务数据共享空间申请表,详见表1,并提交数据协调方进行任务数据空间建立申请。本文中,数据共享空间、任务数据共享空间、任务数据空间、数据空间可以互换地使用。

表1 数据共享空间申请表

在数据共享空间建立后至注销前,数据协调方应对数据资产访问和交换过程进行审计,审计信息包括任务数据共享空间的创建者、创建时间、用户、数据资产、数据操作和空间注销等相关信息。空间创建后启动审计功能。

在使用阶段,数据需求方提出任务需求。

数据协调方响应于数据需求方提出的任务需求,构建该任务需求对应的数据需求,基于本体将任务需求分解为任务需求清单,并建立任务需求的元数据表达;根据任务需求清单,细化生成任务数据需求清单,并建立任务数据需求的元数据表达,并基于任务所需能力与配套数据的搜索匹配获得任务对元数据的需求度。

根据本发明的实施方式,数据协调方基于本体进行任务需求分解,首先分解为任务清单,然后细化分解子任务清单,再进一步地细化建立任务数据需求清单,并进行元数据表达。具体包括:

步骤101、构建任务需求,并分解为多个子任务需求,任务需求的组成包括任务标识、任务名称、任务目标、提出人、以及多个子任务需求,任务需求格式组成关系如图2所示;

步骤102、对于步骤101的子任务需求进行分解,子任务需求的组成包括子任务需求标识、子任务需求名称、创建时间、用户ID、用户名称、备注、重要程度、多个任务清单描述和审核记录,子任务需求清单格式组成关系如图2所示;

步骤103、对于步骤102的多个任务清单描述,基于任务本体,将子任务需求细化,每个任务清单描述包括任务清单标识、任务清单序号、应用阶段、内容要点、时限要求、责任单位、任务清单资源、创建时间、清单状态、重要程度、备注,其中任务清单资源包括任务时间要求、空间要求、行动组织需求、人员需求、物资需求、情报信息需求等6个方面的需求,任务清单描述格式组成关系如图3所示。

经过步骤101-步骤103的分解,可以从一个任务需求得到多个以元数据形式表达的任务清单。在一个示例中,以xml结构文档的形式建立任务需求的元数据表达的模式文件,形成的文件保存为TaskRequ.xsd,其部分样式的示例如下所示:

根据本发明的实施方式,基于所生成的任务需求清单,细化建立任务数据需求清单,并进行元数据表达,包括以下步骤:

步骤201、构建任务数据需求,并分解为多个数据需求清单,任务数据需求的组成包括数据需求标识、数据需求名称、任务清单标识、创建人、以及多个数据需求清单,任务数据需求格式组成关系如图4所示。

步骤202、对于步骤201的数据需求清单进行分解,数据需求清单的组成包括数据需求清单标识、数据需求清单名称、创建时间、用户ID、用户名称、备注、重要程度、多个数据需求清单描述和审核记录,数据需求清单格式组成关系如图4所示。

步骤203、对于步骤202的多个数据需求清单描述,类似于任务需求清单描述,建立相应的描述项目,包括:数据清单标识、数据清单序号、应用阶段、数据类别、内容要点、时限要求、责任单位、数据清单需求、创建时间、清单状态、重要程度、备注,其中数据清单需求包括:空间数据要求、组织数据需求、人员数据需求、物资数据需求五个方面的需求,且对这五个方面需求中的每一项需求,都建立细化的描述项目,包括时间要求、数据分类、数据条件、需求描述;其中,细化的描述项目是基于步骤103的任务清单资源需求进行数据资源条件分解得到的,其方法包括:

1)将步骤103的任务清单资源的任务时间要求作为时间条件;

2)对步骤103的任务清单资源的空间要求、行动组织需求、人员需求、物资需求、情报信息需求等5个方面的要求,分解为包括数据分类、数据条件和需求描述,清单描述格式组成关系如图5所示。

经过步骤201-步骤203的分解,可以从一项任务需求得到多个以元数据形式表达的数据需求清单。在一个示例中,以xml结构文档的形式建立任务数据需求元数据表达的模式文件的,形成的文件保存为TaskDataRequ.xsd,其部分样式的示例如图下所示:

得到这两个xsd文件之后,一来可以通过模式文件构建任务数据空间目录树,二来可以由数据分类、数据条件、时间要求等条件搜索匹配相关数据资源,提供需求方使用。

根据本发明的实施方式,数据协调方提供一种将任务数据需求映射为任务所需能力计算配套数据的搜索匹配方法,实现从任务数据需求到数据资源的映射。具体地,参照图6,先从任务数据需求到能力计算需求分析,再到元数据集合的匹配过程,可以分为三步:

步骤301、建立任务与作战能力的对应关系。

具体地,将任务清单中的任务与作战能力的对应关系进行分析整理,构建任务-能力对应关系库,在输入一个任务后即可查询得出对应的作战能力列表。

步骤302、建立任务能力与元数据的对应关系。

具体地,将元数据清单中的元数据与作战能力的对应关系进行分析整理,构建元数据-能力对应关系库,在输入一个元数据后即可查询得出对应的作战能力列表。

步骤303、利用匹配算法基于能力进行任务和元数据集合的匹配。

在确定任务与元数据的匹配关系时,需对元数据的需求进行量化分析。即计算任务对能力的需求程度和元数据所对应的能力需求归一化值,然后进行匹配,进而得出任务对元数据的需求度。

此处的匹配算法可采用严格匹配算法中的精确图匹配方法,实现任务与元数据的匹配。首先定义三元组(V,E,L)表示一个图,其中V表示图中节点的集合,E表示图中边的集合,对于任意一条边

参照图7和图8,以G,P,u,v分别表示数据图、模式图和数据图节点、模式图节点,其中P是任务由能力表征的模式图,见图7,是求解的目标对象,V1至V4表示当前输入的任务定义的四类能力属性,其中(Vi,Vj)表示任务中有两种属性综合取值条件,例如任务需要A个单位的能力V1与B个单位的能力V2之和,其可用三元组中的L映射函数定义,例如a为“加”计算函数;G是元数据的能力表征数据图,见图8,其对应的定义方法如前述任务定义模式图P,由此在数据图中搜索出与模式图在结构和节点与边属性上完全匹配的子图,并且遍历所有的数据视图,便可找到任务与元数据的匹配关系列表。

数据协调方将标识了元数据需求的任务数据需求清单分发给数据提供方,数据提供方对数据需求进行接收和确认,并根据数据需求将数据资产纳入数据共享空间,数据需求方从数据共享空间获取数据。数据共享空间的使用流程如图9所示。

数据提供方根据数据需求将数据资产纳入数据共享空间,其实现方式包括:对关联到任务数据空间子目录的数据资产进行确认,并开放该任务数据空间相关方对数据资产的访问权限,使得纳入任务数据共享空间中的使用方均能自主访问该空间内的数据资产,无需再授权审批。

数据使用方即数据需求方可通过任务数据空间子目录发现其所需数据,再通过下载、订阅/发布、请求/响应等方式获取数据,无需再经过数据提供方的授权审批。

数据协调方可以对任务数据空间进行管理,一是相关方管理,包括数据提供方和数据使用方;二是对任务数据空间子目录的管理,包括对目录的增加、删除、修改,特别需补充对目录与数据需求的标注说明等。

在获取数据之后,参照图10,数据需求方发布关闭空间的申请,数据协调方基于该申请发布任务数据空间关闭的预告,数据提供方响应于该预告确认退出,数据协调方进行审计和数据存档后,对数据共享空间执行关闭。

数据协调方对数据空间的使用操作进行审计,包括用户、数据资产、数据操作、时间等信息。

技术分类

06120116576478