掌桥专利:专业的专利平台
掌桥专利
首页

一种地理空间模型自动数据匹配方法、装置及电子设备

文献发布时间:2023-06-19 11:19:16


一种地理空间模型自动数据匹配方法、装置及电子设备

技术领域

本申请涉及地理信息技术领域,尤其是涉及一种地理空间模型自动数据匹配方法、装置及电子设备。

背景技术

目前,地理空间模型是认知地理现象,剖析地理问题,模拟预测地理对象演变过程和发展趋势的重要工具,在地理学研究中发挥着不可替代的作用。由于地理学研究对象本身的复杂性以及随着研究的深入,地理空间模型变得越来越复杂,其输入数据也越来越多。这些输入数据的复杂繁琐制备过程通常需要消耗模型使用者大量的时间和精力,并且该问题已经成为影响地理空间模型应用和发展的严重障碍。因此针对地理空间模型输入需求,研究一种高效便捷的输入数据制备方法变得十分迫切。与此同时,随着数据共享的发展,互联网上已经开放共享了大量的地理空间数据。在现有的技术手段中,在具体应用场景下,从这些数据中自动匹配出符合地理空间模型输入需求的数据成为解决其输入数据制备困难问题的新思路。

然而,由于地理空间模型输入需求通常包含对地理空间数据在内容特征、空间特征、时间特征和形态特征等多项特征上的复杂要求,网络开放共享数据中通常很难找到所有特征都与地理空间模型输入需求完全匹配的数据,大多数相关的数据只在部分特征上满足地理空间模型的输入需求。所以,现有技术无法针对地理空间模型输入需求实现自动数据匹配。

发明内容

本申请的目的在于提供一种地理空间模型自动数据匹配方法、装置及电子设备,以缓解预设地理空间模型输入数据制备较难的技术问题。

第一方面,本申请实施例提供了一种地理空间模型自动数据匹配方法,所述方法包括:

获取针对预设地理空间模型的输入需求;

基于所述输入需求,利用预设相似度算法确定所述输入需求与地理空间数据源中每项地理空间数据之间的相似度,符合需求的所述地理空间数据用于输入所述预设地理空间模型;

确定所述相似度对应的匹配结果集合,所述匹配结果集合包括:每项所述地理空间数据的匹配关系和匹配范围;

基于每项所述地理空间数据的所述相似度,在所述地理空间数据源中确定所述输入需求对应的第一目标地理空间数据。

在一个可能的实现中,在所述确定所述相似度对应的匹配结果集合,所述匹配结果集合包括:每项所述地理空间数据的匹配关系和匹配范围的步骤之后,还包括:

将所述匹配结果集合按照预设匹配结果精准表达结构存储于目标文件中。

在一个可能的实现中,所述基于每项所述地理空间数据的所述相似度,在所述地理空间数据源中确定所述输入需求对应的第一目标地理空间数据的步骤,包括:

对每项所述地理空间数据对应的所述目标文件进行解析;

当所述相似度位于预设相似度范围时,则基于每项所述地理空间数据的所述相似度进行排序,选取最高的所述相似度,在所述地理空间数据源包含的多个地理空间数据中确定所述输入需求对应的第一目标地理空间数据。

在一个可能的实现中,基于所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围,完成所述第一目标地理空间数据的自动处理得到第二目标地理空间数据,包括:

当所述第一目标地理空间数据的相似度位于预设相似度范围时,则建立差异列表;

对所述第一目标地理空间数据的第一相似度进行判断;

如果所述第一目标地理空间数据的第一相似度在预设第一相似度范围内,则将所述第一目标地理空间数据及所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围加入到所述差异列表中,并根据所述差异列表生成差异列表文件;

将所述差异列表文件上传至网络文件服务器,得到所述差异列表文件的网络引用地址。

在一个可能的实现中,所述方法还包括:

根据所述地理空间数据与所述输入需求之间的所述匹配关系,建立所述地理空间数据与所述匹配关系之间的第一对应关系;

预先建立数据处理服务库,所述数据处理服务库包括多种数据处理服务;

基于所述第一对应关系及所述数据处理服务,建立所述匹配关系与所述数据处理服务之间的第二对应关系。

在一个可能的实现中,所述方法还包括:

基于所述第一对应关系,对差异列表文件进行解析,得到所述差异列表文件中每个所述地理空间数据对应的匹配关系,并确定一个目标匹配关系;

基于所述第二对应关系,确定所述目标匹配关系对应的目标数据处理服务;

根据所述目标数据处理服务对所述地理空间数据进行数据处理,得到处理后的第二目标地理空间数据。

在一个可能的实现中,所述方法还包括:

预先对所述地理空间数据特征进行分类,得到不同类型的特征项,每个所述特征项包括多个描述因子;

建立所述特征项与所述描述因子之间的第三对应关系。

在一个可能的实现中,所述基于所述输入需求,利用预设相似度算法确定所述输入需求与地理空间数据之间的相似度的步骤,包括:

当所述输入需求包含目标特征项时,根据所述第三对应关系确定所述目标特征项对应的多个目标描述因子;

利用预设相似度算法确定所述输入需求分别与多个所述地理空间数据在所述目标描述因子上的第一相似度;

根据所述第一相似度分别确定多个所述地理空间数据在所述目标特征项的综合相似度及总相似度;

将所述总相似度确定为所述输入需求与所述地理空间数据之间的所述相似度。

第二方面,提供了一种地理空间模型自动数据匹配装置,所述装置包括:

获取模块,用于获取针对预设地理空间模型的输入需求;

第一确定模块,用于基于所述输入需求,利用预设相似度算法确定所述输入需求与地理空间数据之间的相似度,符合需求的所述地理空间数据用于输入所述预设地理空间模型;

第二确定模块,用于确定所述相似度对应的匹配结果集合,所述匹配结果集合包括:每项所述地理空间数据的匹配关系和匹配范围;

第三确定模块,用于基于每项所述地理空间数据的所述匹配关系和所述匹配范围,在所述地理空间数据中确定所述输入需求对应的第一目标地理空间数据;

第四确定模块,用于基于所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围,完成所述第一目标地理空间数据的自动处理得到第二目标地理空间数据。

第三方面,本申请实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述方法。

第四方面,本申请实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述方法。

本申请实施例带来了以下有益效果:

本申请实施例提供的一种地理空间模型自动数据匹配方法、装置及电子设备,能够获取针对预设地理空间模型的输入需求;基于所述输入需求,利用预设相似度算法确定所述输入需求与地理空间数据源中每项地理空间数据之间的相似度,符合需求的所述地理空间数据用于输入所述预设地理空间模型;确定所述相似度对应的匹配结果集合,所述匹配结果集合包括:每项所述地理空间数据的匹配关系和匹配范围;基于每项所述地理空间数据的所述相似度,在所述地理空间数据源中确定所述输入需求对应的第一目标地理空间数据;基于所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围,完成所述第一目标地理空间数据的自动处理得到第二目标地理空间数据。本方案中,由于利用预设相似度算法计算输入需求与地理空间数据之间的相似度,确定每项地理空间数据的匹配关系和匹配范围,所以能够在多项地理空间数据中确定输入需求对应的第一目标地理空间数据,进而,针对第一目标地理空间数据与地理空间模型输入需求的差异情况完成数据自动处理过程,提高了地理空间数据处理的效率,缓解了预设地理空间模型输入数据制备较难的技术问题。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的地理空间模型自动数据匹配方法的流程示意图;

图2为本申请实施例提供的地理空间数据与多种输入需求的匹配关系和匹配范围的示意图;

图3为本申请实施例提供的地理空间模型自动数据匹配方法的另一流程示意图;

图4为本申请实施例提供的地理空间模型自动数据匹配方法的另一流程示意图;

图5为本申请实施例提供的一种地理空间模型自动数据匹配装置的结构示意图;

图6示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

目前,地理空间模型是认知地理现象,剖析地理问题,模拟预测地理对象演变过程和发展趋势的重要工具,在地理学研究中发挥着不可替代的作用。由于地理学研究对象本身的复杂性以及随着研究的深入,地理空间模型变得越来越复杂,其输入数据也越来越多。这些输入数据的复杂繁琐制备过程通常需要消耗模型使用者大量的时间和精力,并且该问题已经成为影响地理空间模型应用和发展的严重障碍。因此针对地理空间模型输入需求,研究一种高效便捷的输入数据制备方法变得十分迫切。与此同时,随着数据共享的发展,互联网上已经开放共享了大量的地理空间数据。在现有的技术手段中,在具体应用场景下,从这些数据中自动匹配出符合地理空间模型输入需求的数据成为解决其输入数据制备困难问题的新思路。然而,由于地理空间模型输入需求通常包含对地理空间数据在内容特征、空间特征、时间特征和形态特征等多项特征上的复杂要求,网络开放共享数据中通常很难找到所有特征都与地理空间模型输入需求完全匹配的数据,大多数相关的数据只在部分特征上满足地理空间模型的输入需求。所以,现有技术无法针对地理空间模型输入需求实现自动数据匹配。

基于此,本申请实施例提供了一种地理空间模型自动数据匹配方法、装置及电子设备,通过该方法可以缓解预设地理空间模型输入数据制备较难的技术问题。

下面结合附图对本申请实施例进行进一步地介绍。

图1为本申请实施例提供的一种地理空间模型自动数据匹配方法的流程示意图。其中,该方法应用于电子设备。如图1所示,该方法包括:

步骤S110,获取针对预设地理空间模型的输入需求;

需要说明的是,针对预设地理空间模型,需要先获取输入需求,输入需求是指输入地理空间模型的地理空间数据的规范或要求,例如,输入需求中包含时间特征项,时间特征项包括多个描述因子。

步骤S120,基于输入需求,利用预设相似度算法确定输入需求与地理空间数据源中每项地理空间数据之间的相似度;

需要说明的是,预设相似度算法是电子设备预先设定的算法,相似度是指输入需求与地理空间数据之间的匹配程度,例如,相似度的范围是[0,1],相似度越接近1,则表示输入需求与地理空间数据之间的匹配程度越高,相似度越接近0,则表示输入需求与地理空间数据之间的匹配程度越低,当相似度等于0时,则表示输入需求与地理空间数据之间不匹配。

在本步骤中,当输入需求包含时间特征项时,利用预设相似度算法确定输入需求与地理空间数据在时间特征上的相似度,也就是确定输入需求与地理空间数据在时间特征中的描述因子的相似度。类似地,可以确定输入需求中其他特征的相似度。最后,对输入需求包含的所有特征项的相似度进行聚合,得到输入需求与地理空间数据之间的总相似度,符合需求的地理空间数据用于输入预设地理空间模型。

步骤S130,确定相似度对应的匹配结果集合,匹配结果集合包括:每项地理空间数据的匹配关系和匹配范围;

在本步骤中,确定相似度对应的匹配结果集合,匹配结果集合包括:每项地理空间数据与输入需求在时间特征项描述因子上的匹配关系和匹配范围。

示例性地,每项地理空间数据与输入需求在时间特征项描述因子上的匹配关系和匹配范围,如下表1所示,其中SD表示地理空间数据,RD表示输入需求:

表1

步骤S140,基于每项地理空间数据的相似度,在地理空间数据源中确定输入需求对应的第一目标地理空间数据;

在本步骤中,根据每项地理空间数据与输入需求在时间特征项描述因子上的匹配关系和匹配范围,可计算得到每项地理空间数据与输入需求在时间特征项上的综合相似度。类似地,如输入需求还包含其他特征,可依次求出其他特征上的综合相似度。分别对每项地理空间数据的所有特征项的相似度进行聚合可得到其与输入需求的总相似度,即为每项地理空间数据与输入需求的相似度。根据相似度大小排序,选择相似度最大的地理空间数据,即为多项地理空间数据中的第一目标空间数据。如第一目标空间数据与输入需求的相似度为1,表示两者之间不存在差异,则可以输入地理空间模型,否则需进行步骤S150。

步骤S150,基于第一目标地理空间数据对应的匹配关系和匹配范围,完成第一目标地理空间数据的自动处理得到第二目标地理空间数据。

在本步骤中,如第一目标空间数据与输入需求相似度在预设范围内,表示两者之间存在差异,第一目标空间数据不能直接输入预设地理空间模型,需要进一步完成对第一目标空间数据的处理,消除其与输入需求之间的差异得到第二目标地理空间数据,方可输入地理空间模型。

本申请实施例中,可以获取针对预设地理空间模型的输入需求;基于输入需求,利用预设相似度算法确定输入需求与地理空间数据之间的相似度,符合需求的地理空间数据用于输入预设地理空间模型;确定相似度对应的匹配结果集合,匹配结果集合包括:每项地理空间数据的匹配关系和匹配范围;基于每项地理空间数据的相似度,在地理空间数据源中包含的多项地理空间数据确定输入需求对应的第一目标地理空间数据。本方案中,由于利用预设相似度算法计算输入需求与地理空间数据之间的相似度,所以能够在多项地理空间数据中确定输入需求对应的第一目标地理空间数据,实现了根据相似度自动确定出符合输入需求的第一目标地理空间数据。基于第一目标地理空间数据的匹配关系与匹配范围,可针对第一目标地理空间数据与地理空间模型输入需求的差异情况完成数据自动处理过程,提高了地理空间数据处理的效率,缓解了预设地理空间模型输入数据制备较难的技术问题,还能促进预设地理空间模型和地理空间数据的发展以及地理空间数据的增值。

下面对上述步骤进行详细介绍。

示例性地,图2显示的是地理空间数据与输入需求在多种特征项上的匹配关系和匹配范围的示意图。

在一些实施例中,基于上述步骤S130,可以确定相似度对应的匹配结果集合。作为一个示例,在上述步骤S130之后,还可以包括如下步骤:

步骤a),将匹配结果集合按照预设匹配结果精准表达结构存储于目标文件中。

需要说明的是,预设匹配结果精准表达结构包括:相似度、匹配关系及匹配范围,预设匹配结果精准表达结构是:

Result={S

上式中,Result是精准表达结果,假设共有n项描述因子,S

本申请中,将匹配结果集合按照预设匹配结果精准表达结构存储于目标文件中,便于电子设备对匹配结果集合进行解析,并确定输入需求对应的第一目标地理空间数据。

在一些实施例中,基于上述步骤S140,可以对目标文件进行解析,以使电子设备在多项地理空间数据中确定第一目标地理空间数据。作为一个示例,上述步骤S140可以包括以下步骤:

步骤b),对每项所述地理空间数据对应的目标文件进行解析;

步骤c),当相似度位于预设相似度范围时,则基于每项地理空间数据的相似度进行排序,选取最高的相似度,在地理空间数据源中确定输入需求对应的第一目标地理空间数据。

对于上述步骤b),电子设备对多项目标文件进行解析,得到相似度,示例性地,相似度是0.7、0.6、0.5。

对于上述步骤c),基于上述实施例,取相似度的预设相似度范围是(0,1),并分别判断相似度0.7、0.6、0.5是否位于(0,1)内,然后对位于(0,1)范围内的相似度进行排序,选择相似度最大的地理空间数据,即0.7对应的地理空间数据。从而,在地理空间数据源中确定输入需求对应的第一目标地理空间数据。

本申请实施例可以对目标文件进行解析;当相似度位于预设相似度范围时,则基于每项地理空间数据的相似度,在地理空间数据源中确定输入需求对应的第一目标地理空间数据。所以,电子设备可以通过每项地理空间数据的相似度,确定输入需求对应的第一目标地理空间数据。

在一些实施例中,当第一目标地理空间数据位于预设相似度范围内时,需要将其对应的匹配关系和匹配范围加入到差异列表,以使电子设备对差异列表进行自动处理,直至差异列表中对应的差异数据符合输入需求。作为一个示例,上述数据匹配方法还可以包括如下步骤:

步骤d),当第一目标地理空间数据的相似度位于预设相似度范围时,则建立差异列表;

步骤e),对第一目标地理空间数据的第一相似度进行判断;

步骤f),如果第一目标地理空间数据的第一相似度在预设第一相似度范围内时,则将第一目标地理空间数据对应的匹配关系和匹配范围加入到差异列表中,并根据差异列表生成差异列表文件;

步骤g),将差异列表文件上传至网络文件服务器,得到差异列表文件的网络引用地址。

对于上述步骤d),当相似度位于预设相似度范围时,例如,相似度等于0.7,预设相似度范围为(0,1),表示与输入需求存在差异,则建立差异列表。

对于上述步骤e),需要说明的是,相似度是指输入需求与地理空间数据之间的总相似度,第一相似度是指输入需求与地理空间数据在相同单描述因子上的相似度,然后电子设备对每项地理空间数据的第一相似度进行判断。

对于上述步骤f),示例性地,如果第一目标地理空间数据的第一相似度不等于0和1,则将该第一相似度对应的匹配关系和匹配范围加入到差异列表中,形成一项差异项,重复该过程,直到完成匹配结果所有内容的解析,最后基于XML将上述解析结果以及实体数据的位置等信息物化为差异列表文件。

对于上述步骤g),具体的,将差异列表文件上传到网络文件服务器,得到差异列表文件对应的网络引用地址。该方式有利于通过共享文件的方式实现数据处理服务间的信息共享,进而实现数据处理服务间的自动组合。

本申请实施例中,当相似度位于预设相似度范围时,则建立差异列表;对第一目标地理空间数据的第一相似度进行判断;如果第一目标地理空间数据的第一相似度在预设第一相似度范围内时,则将第一目标地理空间数据及第一目标地理空间数据对应的匹配关系和匹配范围加入到差异列表中。所以,电子设备可以根据差异列表生成差异列表文件,便于进一步对差异列表文件进行处理,进而,得到符合输入需求的地理空间数据,即第二目标地理空间数据。

在一些实施例中,可以预先建立与匹配关系对应的数据处理服务,以使电子设备能够根据地理空间数据的匹配关系调用相应的数据处理服务。作为一个示例,上述地理空间模型自动数据匹配方法还可以包括如下步骤:

步骤h),根据地理空间数据与输入需求之间的匹配关系,建立地理空间数据与匹配关系之间的第一对应关系;

步骤i),预先建立数据处理服务库,数据处理服务库包括多种数据处理服务;

步骤j),基于第一对应关系及数据处理服务,建立匹配关系与数据处理服务之间的第二对应关系。

对于上述步骤h),基于上述实施例,根据每项地理空间数据与输入需求之间的匹配关系,建立地理空间数据与匹配关系之间的第一对应关系,以便可以根据地理空间数据识别出对应的匹配关系。

对于上述步骤i),预先建立数据处理服务库,数据处理服务库包括多种数据处理服务,具体的,步骤i)包括:

步骤i1),数据处理服务设计。

数据处理服务的组成结构包括:服务名称设计、输入参数设计和内部处理过程设计,数据处理服务的名称在其部署的服务器上具有唯一性,并且与前述的匹配关系具有对应关系。

其中,输入参数设计是从上述匹配计算结果解析得到的差异列表文件,反应地理空间模型输入需求与地理空间数据之间的完整差异以及差异细节。输入参数(即差异列表文件)的具体结构如图3所示,总体上包括差异列表头和差异列表体两部分,差异列表头包括关联信息和状态信息。其中,关联信息用于记录实体数据的网络位置,用于实现采用网络存储的方式提供大规模数据量输入参数;状态信息用于记录数据处理服务运行时的状态,分为:“Processing”表示运行中、“Success”表示运行成功、“Error”表示运行错误;差异列表体包含了地理空间模型输入需求与空间数据间的所有差异项,由上述匹配计算结果解析获取,具体解析过程由以下内容进行详述。

如图4所示,显示的是内部处理过程设计。首先通过预处理查询首个数据处理服务的地址,并开始启动(存在至少一个差异项,否则无需运行数据处理服务),进入数据处理服务内部后先修改服务状态为“Processing”,用于标记处理服务正在运行,然后解析输入参数,即解析差异列表文件,并下载实体数据;再获取差异列表文件中的首个差异项,然后针对该差异项进行数据处理,该过程与具体差异项相关,不同差异项的处理实现不同,具体的,根据具体差异项的匹配关系调用相应的数据处理服务;针对该差异项完成上述数据处理过程后,更新差异列表,去除已处理的该差异项,更新实体数据链接为该数据处理过程的输出结果地址,此时实体数据已为最新的处理结果;根据最新差异列表判断是否还存在其他的差异项,如果存在则根据匹配关系和数据处理服务的对应关系调用相应的数据处理服务,如果不存在则更新差异列表中的服务状态为“Success”,标记整个数据处理过程完成。整个数据处理过程中,如果出现异常,则更新差异列表中的服务状态为“Error”,用于标记数据处理过程出现错误,并在状态信息中记录下错误信息。

步骤i2),数据处理服务编码实现。

根据前述数据处理服务设计,采用Python等编程语言对其进行具体实现,按照“高内聚,低耦合”的思想对编码进行模块化组织,为功能重用、扩展和优化管理奠定基础。

步骤i3),数据处理服务发布。

以HTTP Post请求的方式向网络开放数据处理服务的查询和调用接口,通过分布式部署和负载均衡等方式强化数据处理服务的可靠性。

对于上述步骤j),基于第一对应关系及数据处理服务,建立匹配关系与数据处理服务之间的第二对应关系,便于根据地理空间数据的匹配关系确定对应的数据处理服务。

示例性地,匹配关系与数据处理服务之间的第二对应关系如下表2所示:

表2

本申请实施例可以根据地理空间数据与输入需求之间的匹配关系,建立地理空间数据与匹配关系之间的第一对应关系;预先建立数据处理服务库,数据处理服务库包括多种数据处理服务;基于第一对应关系及数据处理服务,建立匹配关系与数据处理服务之间的第二对应关系。所以,电子设备可以预先建立数据处理服务库,进而,可以调用数据处理服务库中的数据处理服务对地理空间数据进行处理,以使地理空间数据符合预设地理空间模型的输入需求。

在一些实施例中,可以对差异列表文件对应的地理空间数据进行处理,以使地理空间数据符合预设地理空间模型的输入需求。作为一个示例,上述数据匹配方法还可以包括如下步骤:

步骤k),基于第一对应关系,对差异列表文件进行解析,得到差异列表文件中地理空间数据对应的每个匹配关系,并确定一个目标匹配关系;

步骤l),基于第二对应关系,确定目标匹配关系对应的目标数据处理服务;

步骤m),根据目标数据处理服务对地理空间数据进行数据处理,得到处理后的第二目标地理空间数据。

对于上述步骤k),具体的,对差异列表文件进行解析,得到差异列表文件中第一目标地理空间数据对应的每个匹配关系,确定第一第一目标地理空间数据,基于第一对应关系,确定第一目标地理空间数据对应的目标匹配关系。

对于上述步骤l),基于匹配关系与数据处理服务之间的第二对应关系,确定目标匹配关系对应的目标数据处理服务。

对于上述步骤m),具体的,调用目标数据处理服务对第一目标地理空间数据进行数据处理,得到处理后的符合输入需求的第二目标地理空间数据,将第一个差异项从差异列表文件中删除,更新差异列表文件,然后,通过轮询访问从网络引用地址上获取更新后的差异列表文件,并进行解析,确定一个新的目标匹配关系,及新的目标匹配关系对应的目标数据处理服务,再重复执行步骤m),直至差异列表文件中无差异项,得到数据处理服务的运行状态,并根据运行状态实现对数据处理状态的监控。当运行状态是Success”,标记整个数据处理过程完成,通过关联信息中的实体数据地址下载到数据处理的结果。

本申请实施例可以基于第一对应关系,对差异列表文件进行解析,得到差异列表文件中第一目标地理空间数据对应的匹配关系,并确定一个目标匹配关系;基于第二对应关系,确定目标匹配关系对应的目标数据处理服务;根据目标数据处理服务对第一目标地理空间数据进行数据处理,得到处理后的第二目标地理空间数据。所以,电子设备可以调用数据处理服务对差异列表文件对应的第一目标地理空间数据进行处理,实现了对第一目标地理空间数据的自动转换处理,以使第一目标地理空间数据符合预设地理空间模型的输入需求。

在一些实施例中,可以对地理空间数据的特征进行分类。作为一个示例,上述数据匹配方法还可以包括如下步骤:

步骤n),预先对地理空间数据的特征进行分类,得到不同类型的特征项,每个特征项包括多个描述因子;

步骤o),建立特征项与描述因子之间的第三对应关系。

对于上述步骤n),需要说明的是,特征项的类型包括:时间、空间、内容及形态,且每个特征项均包括多个描述因子,例如,时间特征项包括的描述因子包括时间范围和时间粒度,空间特征项包括空间范围、空间尺度及空间参照系,内容特征项包括内容主题和内容属性,形态特征项包括数据类型和数据格式,所以,电子设备可以预先对地理空间数据的特征进行分类,得到不同类型的特征项,每个特征项包括多个描述因子。

对于上述步骤o),电子设备可以根据建立每种类型的特征项与该类型对应的描述因子之间的第三对应关系。

本申请实施例可以预先对地理空间数据的特征进行分类,得到不同类型的特征项,每个特征项包括多个描述因子;建立特征项与描述因子之间的第三对应关系。所以,电子设备可以根据特征项的类型确定对应的描述因子。

在一些实施例中,可以根据输入需求计算地理空间数据的相似度。作为一个示例,上述步骤S120可以包括以下步骤:

步骤p),当输入需求包含目标特征项时,根据第三对应关系确定目标特征项对应的多个目标描述因子;

步骤q),利用预设相似度算法分别确定输入需求与多个地理空间数据在目标描述因子上的第一相似度;

步骤r),根据第一相似度确定目标特征项的综合相似度及总相似度;

步骤s),将总相似度确定为输入需求与地理空间数据之间的相似度。

对于上述步骤q),具体的,第一相似度是指描述因子与地理空间数据之间的单描述因子相似度,计算单描述因子相似度的方法可以分为3类:第一类是基于语义相似度计算方法,采用编辑距离和映射到本体后的路径关系进行计算,适用于内容特征;第二类是连续值间的相似度计算,采用两者交集除以并集的方式求取,包括时间范围、空间范围特征因子;第三种是离散值的相似度计算,采用专家打分的方式给出相似度,包括数据类型、数据格式和时空粒度等。

对于上述步骤r),计算得到上述单特征因子相似度后,通过对单特征因子相似度进行加权求和得到综合相似度;通过对综合相似度加权求和得到总相似度。两者的具体计算方式如下述公式所示:

当S

本申请实施例中,当输入需求包含目标特征项时,根据第三对应关系确定目标特征项对应的多个目标描述因子;利用预设相似度算法分别确定输入需求与多个地理空间数据在目标描述因子上的第一相似度;根据第一相似度确定目标特征项的综合相似度及总相似度;将总相似度确定为输入需求与地理空间数据之间的相似度。所以,电子设备可以计算出输入需求与地理空间数据之间的相似度,便于根据相似度确定输入需求与地理空间数据之间的匹配程度。

在一些实施例中,可以对输入需求与地理空间数据进行统一描述,以便能够根据输入需求自动匹配合适的地理空间数据。作为一个示例,在上述步骤S110之前,还可以包括以下步骤:

步骤t),确定应用场景中的地理空间模型的输入需求;

步骤u),获取网络共享数据在对应特征上的取值;

步骤v),统一描述对应特征项及其取值;

步骤w),结构化表达统一描述结果。

对于上述步骤t),确定应用场景中的地理空间模型输入需求至少包括以下一种实施方式:

步骤t1),获取地理空间模型的静态输入需求;静态需求是由地理空间模型具体实现形式形成的固定要求,不会随着应用场景的改变而变化,这些要求包括数据的内容、数据类型和数据格式,这些内容通常在模型的用户手册、接口说明等内容中有所阐述,所以,电子设备需要首先从这些内容中获取静态需求。

步骤t2),获取地理空间模型的动态输入需求;动态输入需求是由地理空间模型在明确应用场景后才能决定的输入需求,动态输入需求通常跟随应用场景的不同而变化。动态输入需求由模型使用者通过分析模型的具体应用场景获取并记录。

步骤t3),汇总需求对应的数据特征及其取值。在地理空间模型数据匹配的过程中,上述静态输入需求和动态输入需求都会体现在对地理空间数据相应特征项取值上的要求。故将地理空间模型的静态输入需求和动态输入需求汇总映射为如表3所示的特征项和描述因子:

表3特征项及描述因子

所以,根据前述步骤t1)和步骤t2)获取的静态输入需求和动态输入需求,可以根据表3对应到相应的描述因子,并按照表3中的描述规范对特征因子的值进行表达。

对于上述步骤u),获取地理空间数据在对应特征项上的取值,至少包括以下一种实施方式:从网络共享数据的发布网站或面向用户提供的元数据获取接口得到网络共享数据(即地理空间数据)的元数据内容(即特征项类型及取值);根据上述元数据内容项与地理空间模型输入需求映射得到的地理空间数据特征项的对应关系,抽取到相应的数据特征描述内容和取值。

对于上述步骤v),采用与上述相同的数据特征项的描述规范对地理空间数据的特征项取值进行统一描述。

对于上述步骤w),结构化表达统一描述结果,具体的,采用基于XML的文件对地理空间模型输入需求和地理空间数据统一描述后的内容进行结构化表达,具体过程如下:

步骤w1),电子设备根据上述特征项和描述因子的结构关系以及描述规范构建XMLShema文件,用于对统一描述内容的规范性进行限制。

步骤w2),电子设备创建描述内容的数据文件,引入Schema文件,写入统一描述内容,形成结构化表达文件。

本申请实施例可以确定应用场景中的地理空间模型的输入需求;获取网络共享地理空间数据在对应特征上的取值;统一描述对应特征项及其取值;结构化表达统一描述结果。所以,输入需求与地理空间数据均通过预设输入需求的描述规范进行描述,保证了输入需求与空间数据的格式一致性,消除了输入需求与地理空间数据在语法和语义上的异构性。

图5提供了一种地理空间模型自动数据匹配装置的结构示意图。该装置可以应用于电子设备。如图5所示,地理空间模型自动数据匹配装置500包括:

获取模块501,用于获取针对预设地理空间模型的输入需求;

第一确定模块502,用于基于所述输入需求,利用预设相似度算法确定所述输入需求与地理空间数据源中每项地理空间数据之间的相似度,符合需求的所述地理空间数据用于输入所述预设地理空间模型;

第二确定模块503,用于确定所述相似度对应的匹配结果集合,所述匹配结果集合包括:每项所述地理空间数据的匹配关系和匹配范围;

第三确定模块504,用于基于每项所述地理空间数据的所述相似度,在所述地理空间数据源中确定所述输入需求对应的第一目标地理空间数据。

第四确定模块505,用于基于所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围,完成所述第一目标地理空间数据的自动处理得到第二目标地理空间数据。

在一些实施例中,在第二确定模块之后,还包括存储模块,存储模块用于:

将所述匹配结果集合按照预设匹配结果精准表达结构存储于目标文件中。

在一些实施例中,第三确定模块用于:

对每项所述地理空间数据对应的所述目标文件进行解析;

当所述相似度位于预设相似度范围时,则基于每项所述地理空间数据的所述相似度进行排序,选取最高的所述相似度,在所述地理空间数据源中确定所述输入需求对应的第一目标地理空间数据。

在一些实施例中,第四确定模块用于:

当所述第一目标地理空间数据的相似度位于预设相似度范围时,则建立差异列表;

对所述第一目标地理空间数据的第一相似度进行判断;

如果所述第一目标地理空间数据的第一相似度在预设第一相似度范围内时,则将所述所述第一目标地理空间数据对应的所述匹配关系和所述匹配范围加入到所述差异列表中,并根据所述差异列表生成差异列表文件;

将所述差异列表文件上传至网络文件服务器,得到所述差异列表文件的网络引用地址。

在一些实施例中,数据匹配装置还用于:

根据所述地理空间数据与所述输入需求之间的所述匹配关系,建立所述地理空间数据与所述匹配关系之间的第一对应关系;

预先建立数据处理服务库,所述数据处理服务库包括多种数据处理服务;

基于所述第一对应关系及所述数据处理服务,建立所述匹配关系与所述数据处理服务之间的第二对应关系。

在一些实施例中,数据匹配装置还用于:

基于所述第一对应关系,对所述差异列表文件进行解析,得到所述差异列表文件中所述第一目标地理空间数据对应的匹配关系,并确定一个目标匹配关系;

基于所述第二对应关系,确定所述目标匹配关系对应的目标数据处理服务;

根据所述目标数据处理服务对所述地理空间数据进行数据处理,得到处理后的第二目标地理空间数据。

在一些实施例中,数据匹配装置还用于:

预先对所述地理空间数据特征进行分类,得到不同类型的特征项,每个所述特征项包括多个描述因子;

建立所述特征项与所述描述因子之间的第三对应关系。

在一些实施例中,第一确定模块用于:

当所述输入需求是目标特征项时,根据所述第三对应关系确定所述目标特征项对应的多个所述目标描述因子;

利用预设相似度算法分别确定输入需求与多个所述地理空间数据在目标描述因子上的第一相似度;

根据所述第一相似度确定所述目标特征项的综合相似度及总相似度;

将所述总相似度确定为所述输入需求与所述地理空间数据之间的所述相似度。

本申请实施例提供的数据匹配装置,与上述实施例提供的地理空间模型自动数据匹配方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。

本申请实施例提供的一种电子设备,如图6所示,电子设备600包括存储器601、处理器602,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。

参见图6,电子设备还包括:总线603和通信接口604,处理器602、通信接口604和存储器601通过总线603连接;处理器602用于执行存储器601中存储的可执行模块,例如计算机程序。

其中,存储器601可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口604(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线603可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器601用于存储程序,所述处理器602在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器602中,或者由处理器602实现。

处理器602可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器602中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器602可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器601,处理器602读取存储器601中的信息,结合其硬件完成上述方法的步骤。

对应于上述地理空间模型自动数据匹配方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述数据匹配方法的步骤。

本申请实施例所提供的地理空间模型自动数据匹配装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述数据匹配方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种地理空间模型自动数据匹配方法、装置及电子设备
  • 提取地理位置点空间关系的方法、训练提取模型的方法及装置
技术分类

06120112880871