掌桥专利:专业的专利平台
掌桥专利
首页

一种元数据处理方法及装置

文献发布时间:2023-06-19 10:38:35


一种元数据处理方法及装置

技术领域

本发明涉及通信领域,具体而言,涉及一种元数据处理方法及装置。

背景技术

在数据中台飞速发展的今天,数据仓库中大量的元数据管理成为一个重要的环节。元数据管理是数据接入,数据治理,数据挖掘的基础。现在比较常规的获取数据仓库的元数据信息的方法就是通过JDBC连接数据仓库进行查询有哪些表,每个表有哪些字段。

针对相关技术中在数据仓库中面对日益增多的元数据时,如何能准确且及时的获取到数据仓库的元数据信息的问题,尚未提出解决方案。

发明内容

本发明实施例提供了一种元数据处理方法及装置,以至少解决相关技术中在数据仓库中面对日益增多的元数据时,如何能准确且及时的获取到数据仓库的元数据信息的问题。

根据本发明的一个实施例,提供了一种元数据处理方法,包括:

获取数据中台待执行的结构化查询语言SQL语句;

按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

将所述元数据信息更新到数据仓库之外的存储介质中。

可选地,按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息包括:

根据预先设置的底座与解析引擎的对应列表确定所述数据仓库底座选择对应的SQL解析引擎;

根据所述SQL解析引擎按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的所述元数据信息。

可选地,将所述元数据信息更新到所述数据仓库之外的所述存储介质中包括:

确定所述元数据信息的类型,其中,所述元数据信息的类型包括修改元数据、新增元数据、修改元数据;

根据所述元数据信息的类型将所述元数据信息更新到所述存储介质中。

可选地,根据所述元数据信息的类型将所述元数据信息更新到所述存储介质中包括:

若所述元数据信息的类型为删除元数据,在所述存储介质的关系型数据库中删除对应的所述元数据信息;

若所述元数据信息的类型为新增元数据,将所述元数据信息存储到所述存储介质的关系型数据库中;

若所述元数据信息的类型为修改元数据,在所述存储介质的关系型数据库中修改对应的所述元数据信息。

可选地,在将所述元数据信息更新到数据仓库之外的存储介质中之后,所述方法还包括:

在所述数据仓库中执行所述SQL语句,以更新所述数据仓库中的元数据信息。

根据本发明的另一个实施例,还提供了一种元数据处理装置,包括:

获取模块,用于获取数据中台待执行的结构化查询语言SQL语句;

解析模块,按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

更新模块,用于将所述元数据信息更新到数据仓库之外的存储介质中。

可选地,所述解析模块包括:

选择子模块,用于根据预先设置的底座与解析引擎的对应列表确定所述数据仓库底座选择对应的SQL解析引擎;

解析子模块,用于根据所述SQL解析引擎按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的所述元数据信息。

可选地,所述更新模块包括:

确定子模块,用于确定所述元数据信息的类型,其中,所述元数据信息的类型包括修改元数据、新增元数据、修改元数据;

更新子模块,用于根据所述元数据信息的类型将所述元数据信息更新到所述存储介质中。

可选地,所述更新子模块包括:

删除单元,用于若所述元数据信息的类型为删除元数据,在所述存储介质的关系型数据库中删除对应的所述元数据信息;

存储单元,用于若所述元数据信息的类型为新增元数据,将所述元数据信息存储到所述存储介质的关系型数据库中;

修改单元,用于若所述元数据信息的类型为修改元数据,在所述存储介质的关系型数据库中修改对应的所述元数据信息。

可选地,所述装置还包括:

执行模块,用于在所述数据仓库中执行所述SQL语句,以更新所述数据仓库中的元数据信息。

根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,获取数据中台待执行的SQL语句;按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;将所述元数据信息更新到数据仓库之外的存储介质中,可以解决相关技术中在数据仓库中面对日益增多的元数据时,如何能准确且及时的获取到数据仓库的元数据信息的问题,通过SQL解析来前置维护数据仓库的元数据信息,元数据信息存储在数据仓库之外的存储介质中,减少数据仓库的压力,提高了元数据信息的获取效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明实施例的元数据处理方法的移动终端的硬件结构框图;

图2是根据本发明实施例的元数据处理方法的流程图;

图3是根据本发明实施例的基于SQL语句解析元数据的流程图;

图4是根据本发明实施例的元数据处理装置的框图;

图5是根据本发明可选实施例的元数据处理装置的框图一;

图6是根据本发明可选实施例的元数据处理装置的框图二。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的元数据处理方法的移动终端的硬件结构框图,如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的元数据处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述移动终端或网络架构的元数据处理方法,图2是根据本发明实施例的元数据处理方法的流程图,如图2所示,该流程包括如下步骤:

步骤S202,获取数据中台待执行的结构化查询语言SQL语句;

步骤S204,按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

本发明实施例中,上述步骤S204具体可以包括:

根据预先设置的底座与解析引擎的对应列表确定所述数据仓库底座选择对应的SQL解析引擎;

根据所述SQL解析引擎按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的所述元数据信息。

步骤S206,将所述元数据信息更新到数据仓库之外的存储介质中。

本发明实施例中,上述步骤S206具体可以包括:

S2061,确定所述元数据信息的类型,其中,所述元数据信息的类型包括修改元数据、新增元数据、修改元数据;

S2062,根据所述元数据信息的类型将所述元数据信息更新到所述存储介质中,进一步的,若所述元数据信息的类型为删除元数据,在所述存储介质的关系型数据库中删除对应的所述元数据信息;若所述元数据信息的类型为新增元数据,将所述元数据信息存储到所述存储介质的关系型数据库中;若所述元数据信息的类型为修改元数据,在所述存储介质的关系型数据库中修改对应的所述元数据信息。

本实施例中元数据的更新具体可以包括新增、删除、修改等,将元数据信息更新到数据仓库之外的存储介质中,减小了数据仓库的处理压力。

通过上述步骤S202至S206,获取数据中台待执行的SQL语句;按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;将所述元数据信息更新到数据仓库之外的存储介质中,可以解决相关技术中在数据仓库中面对日益增多的元数据时,如何能准确且及时的获取到数据仓库的元数据信息的问题,通过SQL解析来前置维护数据仓库的元数据信息,元数据信息存储在数据仓库之外的存储介质中,减少数据仓库的压力,提高了元数据信息的获取效率。

在一可选的实施例中,在将所述元数据信息更新到数据仓库之外的存储介质中之后,在所述数据仓库中执行所述SQL语句,以更新所述数据仓库中的元数据信息,使得数据仓库中的元数据信息与存储介质中的一致。

数据中台的数据底座数据仓库的元数据创建的入口有两个:物理模型管理模块和结构化查询语言(Structured Query Language,简称为SQL)语句。物理模型管理用户通过界面化配置模型名称,字段名称和类型,最终在后端转化为数据定义语言(DataDefinition Languages)DDL语句。SQL语句用户可以编写多样的DDL语句来设计元数据。归根结底元数据管理最终都是通过SQL来实现的。所以从SQL入手来维护数据仓库的物元数据信息。

将所有数据中台的SQL在执行前进行SQL解析来判定对应的SQL语句是否会生成新的元数据,修改元数据,删除元数据。如果SQL语句会改变元数据,直接将这部分元数据信息进行保存。下次需要用到元数据就可以直接从存储中获取,不需要连接中台进行数据扫描。并且元数据的维护是实时的,不存在延时的问题。

图3是根据本发明实施例的基于SQL语句解析元数据的流程图,如图3所示,包括:

步骤S301,获取数据中台所有需要执行的SQL语句;

步骤S302,顺序解析获取到的SQL语句;

步骤S303,根据数据仓库底座选择对应的SQL解析引擎,根据SQL解析引擎解析SQL语句;

步骤S304,判断是否涉及元数据修改,在判断结果为是的情况下,执行步骤S305,否则执行步骤S309;

步骤S305,判断SQL语句的类型,在判断结果为删除元数据的情况下,执行步骤S306,在判断结果为修改元数据的情况下,执行步骤S307,在判断结果为新增元数据的情况下,执行步骤S308;

步骤S306,删除存储介质中对应的元数据信息,之后步骤S309;

步骤S307,在存储介质中修改对应的元数据信息,之后步骤S309;

步骤S308,在存储介质中新增元数据信息,之后步骤S309;

步骤S309,在数据仓库底座中执行SQL语句。

根据上述步骤,可以实时的感知数据仓库中的全量元数据信息。

例如,在数据仓库开发过程中,执行建表语句,例如:

create table表名(字段描述)

create table新表名as select*from表名;

可以实时的在物理模型管理模块看到相应的元数据,平台使用者就能及时感知。

在数据仓库开发过程中,执行修改表结构语句,例如:

Alter table表名change column原字段名称现字段名称数据类型;

alter table表名add columns(字段名数据类型);

ALTER TABLE表名RENAME TO新表名。

在物理模型管理里面可以看到相应的元数据修改,平台使用者就能及时感知。

在数据仓库开发过程中,执行删除语句,例如:

ALTER TABLE表名REPLACE COLUMNS();

drop table if exists表名;

在物理模型管理里面可以看到相应的元数据修改,平台使用者就能及时感知。

本发明实施例通过SQL解析前置元数据分析,并且将元数据信息存储在数据仓库外的存储介质,一方面因为前置分析可以提高元数据信息的实时性,另一个方面由于是通过SQL解析来实现元数据的分析,能最大化的提高元数据信息的准确性。还有就是元数据信息和数据仓库分析,能降低数据仓库的压力。

实施例2

根据本发明的另一个实施例,还提供了一种元数据处理装置,图4是根据本发明实施例的元数据处理装置的框图,如图4所示,包括:

获取模块42,用于获取数据中台待执行的结构化查询语言SQL语句;

解析模块44,用于按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

更新模块46,用于将所述元数据信息更新到数据仓库之外的存储介质中。

图5是根据本发明可选实施例的元数据处理装置的框图一,如图5所示,所述解析模块44包括:

选择子模块52,用于根据预先设置的底座与解析引擎的对应列表确定所述数据仓库底座选择对应的SQL解析引擎;

解析子模块54,用于根据所述SQL解析引擎按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的所述元数据信息。

图6是根据本发明可选实施例的元数据处理装置的框图二,如图6所示,所述更新模块46包括:

确定子模块62,用于确定所述元数据信息的类型,其中,所述元数据信息的类型包括修改元数据、新增元数据、修改元数据;

更新子模块64,用于根据所述元数据信息的类型将所述元数据信息更新到所述存储介质中。

可选地,所述更新子模块64包括:

删除单元,用于若所述元数据信息的类型为删除元数据,在所述存储介质的关系型数据库中删除对应的所述元数据信息;

存储单元,用于若所述元数据信息的类型为新增元数据,将所述元数据信息存储到所述存储介质的关系型数据库中;

修改单元,用于若所述元数据信息的类型为修改元数据,在所述存储介质的关系型数据库中修改对应的所述元数据信息。

可选地,所述装置还包括:

执行模块,用于在所述数据仓库中执行所述SQL语句,以更新所述数据仓库中的元数据信息。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

S1,获取数据中台待执行的结构化查询语言SQL语句;

S2,按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

S3,将所述元数据信息更新到数据仓库之外的存储介质中。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

S1,获取数据中台待执行的结构化查询语言SQL语句;

S2,按照预先设置的解析顺序解析所述SQL语句,得到所述SQL语句对应的元数据信息;

S3,将所述元数据信息更新到数据仓库之外的存储介质中。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 元数据处理方法、元数据处理装置及可读存储介质
  • 一种元数据模块及元数据模块处理方法
技术分类

06120112623967