掌桥专利:专业的专利平台
掌桥专利
首页

元数据表格信息批量填写方法和装置

文献发布时间:2023-06-19 16:04:54



技术领域

本发明属于信息技术应用技术领域,涉及元数据表格信息批量填写方法,具体涉及一种基于空间位置属性一体化特征批量填写元数据表格信息的方法。

背景技术

元数据(Metadata),又称中介数据或中继数据,为描述数据的数据(data aboutdata),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。

当前的大数据时代,面对海量数据,更显得元数据的重要性。元数据的填写一般通过人工填写或编写程序填写两种方式实现。但人工面对大量表格填写时,难免会出现填错写信息,而且如果有个别表格填写错误,很难发现。编写程序填写要求元数据表格要求表格字段内容必须有规则、有规律,对于字段内容不规则、无规律,无法用编程实现。同时,对于一些基层信息填写的人员来讲,编程填写表格门槛太高。

发明内容

本发明针对目前字段内容不规则、无规律,无法用编程实现的表格信息,只能选择人工填写,不仅工作量巨大,而且当人工面对大量表格时,难免会填写错误,如果有个别表格填写错误,很难发现,提供一种元数据表格信息批量填写方法和装置。

为实现以上技术目的,本发明采用了以下技术方案。

一方面,本发明提供了元数据表格信息批量填写方法,包括:

创建特定形状的空间图层数据,特定形状中要素的数量大于等于需要填写的元数据表格数;获得这个空间图层数据的属性表,确定属性表中各个要素的唯一标识值;

获得元数据的基础数据表格,所述基础数据表格的字段包括总信息编码、连接编码和各类属性信息,其中按照元数据表格信息的统计单元分级对基础数据表格中各条目信息进行编码获得所述总信息编码,根据总信息编码对各条目信息进行排序,设置一个字段,根据总信息编码顺序为该字段进行编码生成连接编码,连接编码顺序与总信息编码顺序相同,并且连接编码与各个要素的唯一标识值相同;

根据空间图层数据属性表中各要素的唯一标识值与基础数据表格连接编码进行表连接;通过要素的唯一标识值为每个元数据表格分配一个空间位置,利用元数据的基础数据表格对这个空间图层数据的属性表进行赋值;

对赋值以后的这个空间图层数据,根据每个元数据表格分配的空间位置,分割出需要填写的元数据表格对应的单个的空间图层;检索出所有单个空间图层的属性表,并进行转置,获得需要批量填写的元数据表格信息。

进一步地,按照元数据表格信息的统计单元分级对基础数据表格中各条目信息进行编码获得所述总信息编码;包括:根据元数据表格信息的统计单元分级划分的各个级别进行编码,各个级别的类均用1至

进一步地,所述方法还包括利用其他空间图层数据对这个空间图层数据的属性表进行赋值的方法,具体包括:确定某一字段信息需要从其他空间图层中获得,或者是其他空间图层数据与这个空间图层数据的两个及以上字段函数运算获得时,先对空间图层数据进行空间叠加合并,将所有空间图层合成一个空间图层,各空间图层数据属性表也合成为一个;利用直接赋值或者函数运算方式进行赋值。

进一步地,所述方法还包括:

将包括字段取值与所述空间图层数据的属性表中任意字段值对应相同的其他表格与空间图层数据的属性表进行表连接,用于从表格中获取数据完成元数据表格信息批量填写。

进一步地,对这个空间图层数据的属性表进行赋值的方法还包括:对所有记录的值相同的整个字段进行统一赋值。

进一步地,对这个空间图层数据的属性表进行赋值的方法还包括:

某一字段的属性值是由其他两个及以上字段经过函数运算得到的结果,采用字段计算器中的函数运算方法赋值。

进一步地,利用元数据的基础数据表格对这个空间图层数据的属性表进行赋值,包括根据连接编码和空间图层数据中各要素的唯一标识值,利用表连接将空间图层数据的属性表和元数据的基础数据表格进行表连接,完成表连接赋值。

进一步地,所述方法还包括利用其他空间图层数据对这个空间图层数据的属性表进行赋值的方法,具体包括:当这个空间图层数据的属性表的某一字段的属性值需要从其他空间图层数据的某字段获得,利用这个空间图层数据与其他空间图层数据的各要素的空间位置,将两个空间图层通过空间连接方式进行赋值。

第二方面,本发明提供了元数据表格信息批量填写装置,包括:

空间图层数据创建模块,用于创建特定形状的空间图层数据,特定形状中要素的数量大于等于需要填写的元数据表格数;获得这个空间图层数据的属性表,确定属性表中各个要素的唯一标识值;

基础数据表格获取模块,用于获得元数据的基础数据表格,所述基础数据表格的字段包括总信息编码、连接编码和各类属性信息,其中按照元数据表格信息的统计单元分级对基础数据表格中各条目信息进行编码获得所述总信息编码,根据总信息编码对各条目信息进行排序,设置一个字段,根据总信息编码顺序为该字段进行编码生成连接编码,连接编码顺序与总信息编码顺序相同,并且连接编码与各个要素的唯一标识值相同;

赋值模块,用于根据空间图层数据属性表中各要素的唯一标识值与基础数据表格连接编码进行表连接;通过要素的唯一标识值为每个元数据表格分配一个空间位置,利用元数据的基础数据表格对这个空间图层数据的属性表进行赋值;

信息填写模块,用于对赋值以后的这个空间图层数据,根据每个元数据表格分配的空间位置,分割出需要填写的元数据表格对应的单个的空间图层;检索出所有单个空间图层的属性表,并进行转置,获得需要批量填写的元数据表格信息。

本发明的有益效果:

本发明公开了一种元数据表格信息批量填写方法和装置,创建空间图层数据,确定空间图层数据的属性表中各要素(要素可以为点状、线状或面状)的唯一标识值;对元数据基础数据表格信息进行统一编码,并将元数据基础数据表格与点状、线状、面状空间图层进行表连接,为需要填写的元数据表格分配一个空间点状、线状、面状要素位置;该方法不仅可以对类似于按行政界线划分的区县、乡镇等区划单元的所有空间数据的元数据进行批量填写,也可以通过创建空间图层数据,对非空间数据的元数据进行批量填写,一次性可以生成几十万个表格,极大的提高了利用人工手动填表方式进行表格填写的工作效率;避免了因为手动填写表格而出现个别表格信息填写错误问题。

创建空间图层数据以后,只要需要填写的表格中有与空间属性表字段值一致的字段,都可以将表格与空间图层数据的属性表进行表连接,能够实现从表格中获取数据完成元数据表格信息批量填写。除此之外还通过整个字段统一赋值、两个及以上字段函数运算赋值、多个空间图层数据空间叠加合并或空间连接方式进行赋值等多种方式实现元数据表格信息的填写。

该方法可以通过多种赋值方式对不规则、无规律、无法用编程实现的表格进行批量填写,一次性可以生成几十万个表格;该方法的最大优点在于对跟空间位置无关的所有信息表格,通过分配点状、线状、面状要素空间位置的方法,利用空间位置信息实现批量填写。

本发明按照元数据表格信息的统计单元分级对基础数据表格中各条目信息进行编码获得所述总信息编码,能够利用总信息编码确定统计单元级别,进而实现对元数据表格信息的进行统计、检索以及查询等操作,大大提高了对元数据填写和管理的效率。

附图说明

图1为实施例1提供的元数据表格信息批量填写方法流程图;

图2为实施例1中网格状的矢量图层数据与属性表中记录的对应关系示意图。

具体实施方式

以下结合说明书附图和具体实施例对本发明做进一步说明。

下面结合附图来具体描述本发明的优选实施实例,其中,附图构成本申请一部分,并与本发明的实施实例一起用于阐释本发明的原理。

实施例1:元数据表格信息批量填写方法,包括:

步骤S1:创建空间图层数据,具体实施例中所述空间图层数据可以为矢量图层数据或栅格图层数据,图层数据中的要素可以为点状、线状或面状要素。本实施例中采用网格状的矢量图层数据,获得这个矢量图层数据的属性表,网格的数量M大于等于需要填写的元数据表格数N;确定这个矢量图层数据的属性表中各个网格的唯一标识值;网格的大小和网格区域形状不限,可以是正方形,也可以是长方形,纵向的和横向的都可以,这个矢量图层数据会自带一个属性表,因此称矢量数据为空间属性一体化特征,其属性表有一个OBJECTID字段为关键字段,其值是1-M的整数值,是建立网格数据是自动生成的唯一标识值;

获得元数据的基础数据表格(可新建一个Excel表格,或者获取现有的满足统一编码格式要求的表格),所述基础数据表格的字段包括总信息编码、连接编码和各属性信息,其中按照元数据表格信息的统计单元分级对元数据表格信息进行编码获得所述总信息编码,

根据总信息编码对各条目信息进行排序,设置一个新的字段,根据总信息编码顺序为新字段进行编码生成基础数据表格连接编码,连接编码顺序与总信息编码顺序相同。本实施例中对连接编码依次赋于1-N值,连接编码与各个网格的唯一标识值相同;

根据矢量图层数据属性表的唯一标识值与基础数据表格连接编码进行表连接;通过网格的唯一标识值为每个元数据表格分配一个网格位置,利用元数据的基础数据表格对这个矢量图层数据的属性表进行赋值;对所有元数据信息赋值以后的这个网格状的矢量图层数据,根据每个元数据表格分配的网格位置自动分割出需要填写的元数据表格对应的单个网格矢量图层;检索出所有单个网格矢量图层的属性表,并进行转置,获得需要填写的批量填写的元数据表格信息。

具体实施例中,按照元数据表格信息的空间位置属性对元数据表格信息进行编码获得所述总信息编码;包括:

根据元数据表格信息的统计单元分级划分的各个级别进行编码,各个级别的类均用1至

将所有级别的类均编好码以后形成一个总信息编码,所述总信息编码为第1级的类编码*10

利用矢量数据的属性表OBJECTID字段和新建的Excel表格的关键字段进行表连接,实现矢量网格与需要填写的元数据表格形成一一对应关系,为每个元数据表格分配一个网格位置,即一个需要填写的元数据表格对应于一个矢量网格属性表里的一条记录。

步骤S2:对矢量图层数据的属性表不同的字段信息可以归为以下几种赋值方式,分别是整个字段统一赋值、字段函数运算赋值、空间叠加分析属性赋值、表连接赋值、基于空间位置赋值等赋值方式进行字段信息填写。

其中,(1)整个字段统一赋值是对某一字段所有记录的值相同,或者筛选出来的部分记录值相同时采用的一种赋值方式。在需要填写元数据的网格状的矢量图层数据的属性表中,添加一个字段,字段类型可以是任意类型,如果是长整型、短整型、浮点型或者双精型等字段类型都可以利用ArcGIS字段计算器field calculator直接对某一字段进行赋值。如果是字符型的字段类型需要在字段计算器field calculator中进行赋值,并要求在字符信息两点输入半角双引号。如果字段类型是日期型的,切将日期字段赋值为当前日期,右键点击日期字段并选择“Calculate Values”。如果觉得在编辑操作之外计算可行,点击Yes。在Field Calculator对话框中将“Type”设为“Date”。将字段计算函数设为:NOW(),点击OK来进行计算。整个字段统一赋值方法还可以把一个字段的属性值直接赋给另一个字段。

(2)字段函数运算赋值是某一字段的属性值是由其他两个及以上字段经过函数运算得到的结果,该种赋值方式是采用字段计算器field calculator中的函数运算方法赋值。

(3)空间叠加分析属性赋值是某一字段信息需要从其他矢量图层中获得,或者是其他矢量图层与本图层的两个及以上字段函数运算获得时,需要先对两个及以上图层进行空间叠加分析,将两个及以上图合成一个矢量图层,此时其属性表也变成了一个,可以利用直接赋值或者函数运算方式进行赋值了。

(4)表连接赋值

如果需要将表格数据连接到需要填写元数据的网格状的矢量图层数据的属性表中,要求表格与矢量数据的属性表拥有一个共同的关键字段,可以通过步骤1中网格状的矢量图层数据属性表的OBJECTID字段与Excel表格的关键字段利用Join(合并连接)进行表连接。此时的连接是临时性的连接,如果需要永久连接,需要将矢量图层另存输出。

(5)基于空间位置赋值

当面状矢量数据的某一字段的属性值需要从另一个矢量数据获得,而另一矢量数据为面状、线状或者是点状矢量数据,就需要利用空间位置信息将两个及以上矢量图层数据通过空间连接Spatial Join进行赋值。利用矢量图层数据属性表的唯一标识值与基础数据表格连接编码进行表连接,为每个元数据表格分配的网格位置信息进行空间连接。

步骤S3:通过全部赋值完成以后的网格状的矢量图层数据,利用ArcGIS的Split功能根据根据每个元数据表格分配的网格位置进行自分割,分割出需要填写的元数据表格对应的单个网格矢量图层,即生成N个shapefiles矢量图层文件,利用文件搜索功能,检索出自shapefiles矢量图层文件的dbf表,然后拷贝到一个文件夹中,将其批量转换成Excel表格,再将Excel表格进行批量转置,最后将转置后的表格批量转换成word文档,从而获得最终需要批量元数据信息表格。如果有新的信息增加,只要重复步骤S2和步骤S3即可。

本发明为字段内容不规则、无规律,无法用编程实现元数据表格信息的批量填写提供一种简单的方法。采用此方法即使出现错误也很容易发现,而且可以批量修改错误。该方法适用于所有行业部门大量表格信息的批量填写,该方法的最大优点在于对跟空间位置无关的所有信息表格,通过分配网格位置的方法,利用空间位置信息实现批量填写。根据本发明的一个具体实施实例,以某高校某学院某的所有专业的所有班级的学生信息为例,公开了元数据表格信息批量填写方法,如图1所示,具体包括以下步骤:

步骤S1:南京信息工程大学遥感与测绘工程学院有遥感科学与技术、测绘工程和地理空间信息工程三个专业,以2020级学生为例,遥感科学与技术有两个班,1班有50、人2班有49人,测绘工程一个班55人,地理空间信息工程一个班37人。总共191人,需要创建的网格数要大于191,可以创建14行*14列的网格,共计196个网格。利用ArcGIS的CreateFishnet功能创建14*14网格。创建的网格矢量图层自带属性表格,其中有一个OBJECTID字段是关键字段,其值是从1-196的整数值。新建一个Excel表格,对各个班级的学生进行编码,遥感与测绘工程学院编码为1,如果涉及其他学院的学生以此编码为2、3……;对系编码遥感科学与技术为1、测绘工程为2、地理空间信息工程为3;对班级编码,一班为1、二班为2,详见表1。总信息编码=学院编码*10

表1 南京信息工程大学遥感与测绘工程学院学生信息表

步骤S2:对步骤1最终生成的网格状的矢量图层数据的属性表的字段进行赋值,赋值方式包括整个字段统一赋值、字段函数运算赋值、空间叠加分析属性赋值、表连接赋值、基于空间位置赋值等进行字段信息填写。例如需要填写各类属性信息如学院、系、班级、学号、姓名、籍贯、出生年月、家庭住址、电话号码、课程名称、课程成绩等信息。

利用矢量数据的属性表OBJECTID字段和新建的Excel表格的“连接编码”字段进行表连接,实现矢量网格与需要填写的元数据表格形成一一对应关系,即每一个学生对应于一个网格位置,每个网格位置对应于矢量网格的属性表里的一条记录,属性表的字段用于填写学生的信息,可以添加200多个字段。实现连接以后的属性表里有OBJECTID字段、“连接编码”和“总信息编码”。从“总信息编码”字段可以分解出学生所在学院、系、班级等字段信息,该种赋值方式是采用ArcGIS字段计算器field calculator中的函数运算方法进行赋值。操作是分别添加“学院”、“系”、“班级”字段,对“总信息编码”除以10

其他关于姓名、籍贯、出生年月、家庭住址、电话号码、课程名称、课程成绩等属性信息均可以通过表格数据连接的方式进行赋值,可以利用学院、系、班级和学号编码作为关键字段,利用Join(合并连接)进行表连接,将任何Excel表格与网格状的矢量图层数据的属性表进行连接,实现字段信息的赋值。Excel表格要求有两个以上字段,其一是与网格状的矢量图层数据属性表连接的关键字段可以是学院、系、班级和学号编码任意字段,还有需要连接上来的任何信息字段如姓名、籍贯、出生年月、家庭住址、电话号码、课程名称、课程成绩等信息。

如果一些信息存储在多个网格状的矢量图层数据中,可以通过空间叠加分析属性赋值方式将两个及以上图合成一个矢量图层,此时其属性表也变成了一个,可以利用直接赋值或者函数运算方式进行赋值了。还可以采用基于空间位置赋值的方式,当面状矢量数据的某一字段的属性值需要从另一个矢量数据获得,而另一矢量数据为面状、线状或者是点状矢量数据,就需要利用空间位置信息将两个及以上数据通过空间连接Spatial Join进行赋值。

步骤S3:通过全部赋值完成以后的网格状的矢量图层数据,利用ArcGIS的Split功能根据网格边界进行自分割,生成191个shapefiles矢量图层文件,利用文件搜索功能,检索出自shapefiles矢量图层文件的dbf表,然后拷贝到一个文件夹中,将其批量转换成Excel表格,再将Excel表格进行批量转置,最后将转置后的表格批量转换成word文档,从而获得最终需要填写的批量元数据信息表格。

如果有新的信息增加,只要重复步骤S2和步骤S3即可。

最后获得的元数据表样例如表2所示。

表2元数据表样例

本发明为字段内容不规则、无规律,无法用编程实现元数据表格信息的批量填写提供一种简单的方法。采用此方法即使出现错误也很容易发现,而且可以批量修改错误。该方法适用于所有行业部门大量表格信息的批量填写,该方法的最大优点在于对跟空间位置无关的所有信息表格,通过分配网格位置的方法,利用空间位置信息实现批量填写。与以上实施例提供的元数据表格信息批量填写方法相对应的,本发明实施还提供了元数据表格信息批量填写装置,包括:

空间图层数据创建模块,用于创建特定形状的空间图层数据,特定形状中要素的数量大于等于需要填写的元数据表格数;获得这个空间图层数据的属性表,确定属性表中各个要素的唯一标识值;

基础数据表格获取模块,用于获得元数据的基础数据表格,所述基础数据表格的字段包括总信息编码、连接编码和各类属性信息,其中按照元数据表格信息的统计单元分级对基础数据表格中各条目信息进行编码获得所述总信息编码,根据总信息编码对各条目信息进行排序,设置一个字段,根据总信息编码顺序为该字段进行编码生成连接编码,连接编码顺序与总信息编码顺序相同,并且连接编码与各个要素的唯一标识值相同;

赋值模块,用于根据空间图层数据属性表中各要素的唯一标识值与基础数据表格连接编码进行表连接;通过要素的唯一标识值为每个元数据表格分配一个空间位置,利用元数据的基础数据表格对这个空间图层数据的属性表进行赋值;

信息填写模块,用于对赋值以后的这个空间图层数据,根据每个元数据表格分配的空间位置,分割出需要填写的元数据表格对应的单个的空间图层;基于单个网格矢量图层数据的dbf文件,检索出所有单个空间图层的属性表,并进行转置,获得需要批量填写的元数据表格信息。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

相关技术
  • 元数据表格信息批量填写方法和装置
  • 记录手工填写纸质表格信息的方法及装置
技术分类

06120114690128