掌桥专利:专业的专利平台
掌桥专利
首页

SQL转换方法、装置、计算机设备及计算机可读存储介质

文献发布时间:2023-06-19 09:49:27


SQL转换方法、装置、计算机设备及计算机可读存储介质

技术领域

本申请涉及数据处理技术领域,具体涉及一种SQL转换方法、装置、计算机设备及计算机可读存储介质。

背景技术

数据库多种多样,在进行两个不同数据库之间的转换时,需要对SQL语句进行转换。

通常需要开发人员基于不同的SQL语法或数据类型对SQL语句进行修改、转换。如第一个数据库可以执行第一类型的SQL语句,第二个数据库可以执行第二类型的SQL语句,则在进行两个不同数据库之间的转换时,需要将第一类型的SQL语句转换为第二类型的SQL语句。在转换过程中不可避免地会出现转换错误或转换不完全的情况。如何提升SQL转换的准确性成为待解决的问题。

发明内容

鉴于以上内容,有必要提出一种SQL转换方法、装置、计算机设备及计算机可读存储介质,其可以对不同类型的SQL语句进行转换,增加SQL转换的准确性。

本申请的第一方面提供一种SQL转换方法,所述SQL转换方法包括:

获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

接收第一类型的待转换SQL语句;

基于SQL规范将所述待转换SQL语句转换为第二通用语句;

基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

另一种可能的实现方式中,所述基于SQL规范将所述第一SQL语句样本转换为第一通用语句包括:

获取SQL语句的多个预设类型关键字;

获取SQL语句的多个预设对象关键字;

根据所述多个预设类型关键字从所述第一SQL语句样本匹配关键字,得到匹配的类型关键字,根据所述多个预设对象关键字从所述第一SQL语句样本匹配关键字,得到匹配的对象关键字;

根据所述匹配的对象关键字从所述第一SQL语句样本中确定待处理对象,得到确定的待处理对象;

依次组合所述匹配的类型关键字、所述匹配的对象关键字和所述确定的待处理对象,得到所述第一通用样本。

另一种可能的实现方式中,所述根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

基于正则表达式抽取所述第一SQL语句样本中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

关联存储所述第一待处理对象与所述第二待处理对象的对象关联关系;

基于正则表达式抽取所述第一SQL语句样本中的第一SQL关键字和所述第二SQL语句样本中的第二SQL关键字;

关联存储所述第一SQL关键字和所述第二SQL关键字的关键字关联关系,关联存储所述第一SQL关键字与所述第二SQL关键字、所述第一待处理对象与所述第二待处理对象的位置关联关系;

组合所述关键字关联关系和所述位置关联关系,得到所述映射关系。

另一种可能的实现方式中,所述根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

用预设占位符替换所述第一SQL语句样本中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

将替换后的第一SQL语句样本转换为输入向量序列,将替换后的第二SQL语句样本转换为标签向量序列;

将所述输入向量序列输入Transformer模型,通过Transformer模型计算输出向量序列;

根据所述输出向量序列和所述标签向量序列通过反向传播对所述Transformer模型中参数进行优化,得到训练后的Transformer模型,使所述训练后的Transformer模型中存储有所述映射关系。

另一种可能的实现方式中,所述基于所述映射关系将所述待转换SQL语句转换为第二类型的目标SQL语句包括:

根据所述映射关系中的对象关联关系将所述待转换SQL语句中的第三待处理对象转换为第四待处理对象;

根据所述映射关系中的关键字关联关系将所述待转换SQL语句中的第三SQL关键字转换为第四SQL关键字;

根据所述映射关系中的位置关联关系调整所述第四待处理对象和所述第四SQL关键字的位置。

另一种可能的实现方式中,所述映射关系还包括字符串类型关联关系,所述基于所述映射关系将所述待转换SQL语句转换为第二类型的目标SQL语句还包括:

获取预设配置文件中的多个字符串类型关联对,每个字符串关联关系对包括一一对应的第一数据类型和第二数据类型;

从所述多个字符串关联对的多个第一数据类型中匹配与所述第四待处理对象一致的第一数据类型,得到匹配的第一数据类型;

将所述第四待处理对象转换为所述匹配的第一数据类型对应的第二数据类型。

另一种可能的实现方式中,所述基于所述映射关系将所述待转换SQL语句转换为第二类型的目标SQL语句包括:

将所述待转换SQL语句中的第五待处理对象替换为预设占位符;

将替换后的待转换SQL语句转换为待转换向量序列;

将所述待转换向量序列输入所述训练后的Transformer模型,通过所述训练后的Transformer模型计算目标向量序列;

将所述目标向量序列转换为SQL语句,得到转换后的SQL语句;

获取所述待转换SQL语句中的第五待处理对象的目标处理对象;

用所述目标处理对象替换所述转换后的SQL语句中的预设占位符,得到所述目标SQL语句。

本申请的第二方面提供一种SQL转换装置,所述SQL转换装置包括:

获取模块,用于获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

第一转换模块,用于基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

确定模块,用于根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

接收模块,用于接收第一类型的待转换SQL语句;

第二转换模块,用于基于SQL规范将所述待转换SQL语句转换为第二通用语句;

第三转换模块,用于基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

本申请的第三方面提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机可读指令时实现所述SQL转换方法。

本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现所述SQL转换方法。

本申请获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;基于SQL规范将所述第一SQL语句样本转换为第一通用语句;根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;接收第一类型的待转换SQL语句;基于SQL规范将所述待转换SQL语句转换为第二通用语句;基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。本申请增加了SQL转换的准确性。

附图说明

图1是本申请实施例提供的SQL转换方法的流程图。

图2是本申请实施例提供的SQL转换装置的结构图。

图3是本申请实施例提供的计算机设备的示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。

优选地,本申请的SQL转换方法应用在一个或者多个计算机设备中。所述计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本申请实施例一提供的SQL转换方法的流程图。所述SQL转换方法应用于计算机设备,用于对不同类型的SQL语句进行转换,增加SQL转换的准确性。

如图1所示,所述SQL转换方法包括:

101,获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本。

第一类型的SQL(Structured Query Language,结构化查询语言)语句和第二类型的SQL语句可以是不同的两类SQL语句。

例如,第一类型的SQL语句和第二类型的SQL语句可以是oracle类型的SQL语句、mysql类型的SQL语句、sqlServer类型的SQL语句中不同的两类SQL语句。

在一个数据库迁移的应用场景中,需要将第一类型的SQL语句从数据库A迁移至数据库B,数据库B可以执行第二类型的SQL语句;并将第一类型的SQL语句转换为第二类型的SQL语句。

SQL语句包括DDL(Data Definition Language,数据库定义语言)语句、DML(DataManipulation Language,数据操纵语言)语句等。

可以从本地数据库读取所述第一SQL语句样本和所述第二SQL语句样本。还可以从云服务器请求所述第一SQL语句样本和所述第二SQL语句样本。

第一SQL语句样本可以是“DROP INDEX indexName ON tableName”,第二SQL语句样本“DROP INDEX tableName.indexName”。

102,基于SQL规范将所述第一SQL语句样本转换为第一通用语句。

在数据库迁移过程中,需要将第一类型的SQL语句转换为第二类型的SQL语句。可以先将第一类型的SQL语句转换为第一通用语句,第一通用语句包括SQL语句中的通用数据,再将第一类型的SQL语句转换为第二类型的SQL语句。例如,第一SQL语句样本可以是“DROP INDEX indexName ON tableName”,第一通用语句可以是“DROP-INDEX-tableName.indexName”,其中,第一通用语句中的“DROP”为关键字,“INDEX-tableName.indexName”为待处理对象,“INDEX”表示待处理对象为索引,“tableName”表示索引所在的表名,“indexName”表示索引名。

在一具体实施例中,所述基于SQL规范将所述第一SQL语句样本转换为第一通用语句包括:

获取SQL语句的多个预设类型关键字;

获取SQL语句的多个预设对象关键字;

根据所述多个预设类型关键字从所述第一SQL语句样本匹配关键字,得到匹配的类型关键字,根据所述多个预设对象关键字从所述第一SQL语句样本匹配关键字,得到匹配的对象关键字;

根据所述匹配的对象关键字从所述第一SQL语句样本中确定待处理对象,得到确定的待处理对象;

依次组合所述匹配的类型关键字、所述匹配的对象关键字和所述确定的待处理对象,得到所述第一通用样本。

所述多个预设类型关键字可以包括DROP、DELETE、INSERT、UPDATE、SELECT等,用于表示移除类SQL语句、删除类SQL语句、插入类SQL语句、修改类SQL语句、查询类SQL语句等。所述多个预设对象关键字可以包括INDEX、TABLE等,用于表示SQL语句处理的索引对象、数据表对象等。

103,根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系。

第一类型的SQL语句与第二类型的SQL语句的映射关系可以包括第一类型的SQL语句与第二类型的SQL语句的不同表达语法、不同数据类型等。通过映射关系反应对第一类型的SQL语句与第二类型的SQL语句进行转换时需要进行的语法转换、数据类型转换等。

在一具体实施例中,所述根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

基于正则表达式根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;或

基于Transformer模型根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系。

在一具体实施例中,所述基于正则表达式根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

基于正则表达式抽取所述第一通用语句中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

关联存储所述第一待处理对象与所述第二待处理对象的对象关联关系;

基于正则表达式抽取所述第一通用语句中的第一SQL关键字和所述第二SQL语句样本中的第二SQL关键字;

关联存储所述第一SQL关键字和所述第二SQL关键字的关键字关联关系,关联存储所述第一SQL关键字与所述第二SQL关键字、所述第一待处理对象与所述第二待处理对象的位置关联关系;

组合所述关键字关联关系和所述位置关联关系,得到所述映射关系。

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。正则表达式是由普通字符(例如字符a到z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

所述第一待处理对象可以是所述第一通用语句中的待处理对象,例如,所述第一通用语句对应的数据库中的数据表、数据表中的数据列或数据索引等。所述第二待处理对象可以是所述第二SQL语句样本中的待处理对象,例如,所述第一通用语句对应的数据库中的数据表、数据表中的数据列或数据索引等。所述第一SQL关键字和所述第二SQL关键字可以是DROP、DELETE、INSERT、UPDATE、SELECT等。

在另一实施例中,所述基于Transformer模型根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

用预设占位符替换所述第一通用语句中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

将替换后的第一通用语句转换为输入向量序列,将替换后的第二SQL语句样本转换为标签向量序列;

将所述输入向量序列输入Transformer模型,通过Transformer模型计算输出向量序列;

根据所述输出向量序列和所述标签向量序列通过反向传播对所述Transformer模型中参数进行优化,得到训练后的Transformer模型,使所述训练后的Transformer模型中存储有所述映射关系。

Transformer是基于自注意力机制(Self-attention)的深层模型,用于处理NLP任务。Transformer在NLP任务上的处理效果好于RNN,且训练速度更快。

Transformer模型可以通过调整参数适应于第一类型的SQL语句与第二类型的SQL语句进行转换,通过参数存储有SQL语句转换需要的语法转换信息、数据类型转换信息等。

104,接收第一类型的待转换SQL语句。

可以接收用户输入的第一类型的待转换SQL语句;或

从本地数据库中读取第一类型的待转换SQL语句。

当进行数据库迁移时,需要对数据库的sql语句进行转换。所述待转换SQL语句可以是原数据库采用的SQL语句,在更换新数据库后,需要对所述待转换SQL语句进行转换。

105,基于SQL规范将所述待转换SQL语句转换为第二通用语句。

具体地,所述基于SQL规范将所述待转换SQL语句转换为第二通用语句,与所述基于SQL规范将所述第一SQL语句样本转换为第一通用语句同理,此处不再赘述。

106,基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

在一具体实施例中,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句包括:

根据所述映射关系中的对象关联关系将所述第二通用语句中的第三待处理对象转换为第四待处理对象;

根据所述映射关系中的关键字关联关系将所述第二通用语句中的第三SQL关键字转换为第四SQL关键字;

根据所述映射关系中的位置关联关系调整所述第四待处理对象和所述第四SQL关键字的位置。

在一具体实施例中,所述映射关系还包括字符串类型关联关系,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句还包括:

根据所述字符串类型关联关系对所述第四待处理对象进行数据类型转换。

具体地,获取预设配置文件中的多个字符串类型关联对,每个字符串关联关系对包括一一对应的第一数据类型和第二数据类型;从所述多个字符串关联对的多个第一数据类型中匹配与所述第四待处理对象一致的第一数据类型,得到匹配的第一数据类型;将所述第四待处理对象转换为所述匹配的第一数据类型对应的第二数据类型。

具体地,可以接收开发人员输入的json配置文件。所述json配置文件中包括字符串类型关联关系。例如,字符串类型关联关系为“string-varchar”,其中“string”为第二通用语句中的第三待处理对象的数据类型,“varchar”为目标SQL语句中的第四待处理对象的数据类型。字符串类型关联关系还包括“string-blob”、“double-double”等。

可以由开发人员编写所述json配置文件的解析器,使所述解析器可以根据所述json配置文件中的key-value值获取所述字符串类型关联关系。

在另一实施例中,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句包括:

将所述第二通用语句中的第五待处理对象替换为所述预设占位符;

将替换后的第二通用语句转换为待转换向量序列;

将所述待转换向量序列输入所述训练后的Transformer模型,通过所述训练后的Transformer模型计算目标向量序列;

将所述目标向量序列转换为SQL语句,得到转换后的SQL语句;

获取所述第二通用语句中的第五待处理对象的目标处理对象;

用所述目标处理对象替换所述转换后的SQL语句中的预设占位符,得到所述目标SQL语句。

需要强调的是,为进一步保证所述映射关系和所述目标SQL语句的私密和安全性,所述映射关系和所述目标SQL语句还可以存储于一区块链的节点中。

实施例一的SQL转换方法获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;基于SQL规范将所述第一SQL语句样本转换为第一通用语句;根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;接收第一类型的待转换SQL语句;基于SQL规范将所述待转换SQL语句转换为第二通用语句;基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。实施例一增加了SQL转换的准确性。同时避免开发人员对SQL语句进行转换,增加SQL转换的效率。

实施例二

图2是本申请实施例二提供的SQL转换装置的结构图。所述SQL转换装置20应用于计算机设备。所述SQL转换装置20用于对不同类型的SQL语句进行转换,增加SQL转换的准确性。

如图2所示,所述SQL转换装置20可以包括获取模块201、第一转换模块202、确定模块203、接收模块204、第二转换模块205、第三转换模块206。

获取模块201,用于获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本。

第一类型的SQL(Structured Query Language,结构化查询语言)语句和第二类型的SQL语句可以是不同的两类SQL语句。

例如,第一类型的SQL语句和第二类型的SQL语句可以是oracle类型的SQL语句、mysql类型的SQL语句、sqlServer类型的SQL语句中不同的两类SQL语句。

在一个数据库迁移的应用场景中,需要将第一类型的SQL语句从数据库A迁移至数据库B,数据库B可以执行第二类型的SQL语句;并将第一类型的SQL语句转换为第二类型的SQL语句。

SQL语句包括DDL(Data Definition Language,数据库定义语言)语句、DML(DataManipulation Language,数据操纵语言)语句等。

可以从本地数据库读取所述第一SQL语句样本和所述第二SQL语句样本。还可以从云服务器请求所述第一SQL语句样本和所述第二SQL语句样本。

第一SQL语句样本可以是“DROP INDEX indexName ON tableName”,第二SQL语句样本“DROP INDEX tableName.indexName”。

第一转换模块202,用于基于SQL规范将所述第一SQL语句样本转换为第一通用语句。

在数据库迁移过程中,需要将第一类型的SQL语句转换为第二类型的SQL语句。可以先将第一类型的SQL语句转换为第一通用语句,第一通用语句包括SQL语句中的通用数据,再将第一类型的SQL语句转换为第二类型的SQL语句。例如,第一SQL语句样本可以是“DROP INDEX indexName ON tableName”,第一通用语句可以是“DROP-INDEX-tableName.indexName”,其中,第一通用语句中的“DROP”为关键字,“INDEX-tableName.indexName”为待处理对象,“INDEX”表示待处理对象为索引,“tableName”表示索引所在的表名,“indexName”表示索引名。

在一具体实施例中,所述基于SQL规范将所述第一SQL语句样本转换为第一通用语句包括:

获取SQL语句的多个预设类型关键字;

获取SQL语句的多个预设对象关键字;

根据所述多个预设类型关键字从所述第一SQL语句样本匹配关键字,得到匹配的类型关键字,根据所述多个预设对象关键字从所述第一SQL语句样本匹配关键字,得到匹配的对象关键字;

根据所述匹配的对象关键字从所述第一SQL语句样本中确定待处理对象,得到确定的待处理对象;

依次组合所述匹配的类型关键字、所述匹配的对象关键字和所述确定的待处理对象,得到所述第一通用样本。

所述多个预设类型关键字可以包括DROP、DELETE、INSERT、UPDATE、SELECT等,用于表示移除类SQL语句、删除类SQL语句、插入类SQL语句、修改类SQL语句、查询类SQL语句等。所述多个预设对象关键字可以包括INDEX、TABLE等,用于表示SQL语句处理的索引对象、数据表对象等。

确定模块203,用于根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系。

第一类型的SQL语句与第二类型的SQL语句的映射关系可以包括第一类型的SQL语句与第二类型的SQL语句的不同表达语法、不同数据类型等。通过映射关系反应对第一类型的SQL语句与第二类型的SQL语句进行转换时需要进行的语法转换、数据类型转换等。

在一具体实施例中,所述根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

基于正则表达式根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;或

基于Transformer模型根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系。

在一具体实施例中,所述基于正则表达式根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

基于正则表达式抽取所述第一通用语句中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

关联存储所述第一待处理对象与所述第二待处理对象的对象关联关系;

基于正则表达式抽取所述第一通用语句中的第一SQL关键字和所述第二SQL语句样本中的第二SQL关键字;

关联存储所述第一SQL关键字和所述第二SQL关键字的关键字关联关系,关联存储所述第一SQL关键字与所述第二SQL关键字、所述第一待处理对象与所述第二待处理对象的位置关联关系;

组合所述关键字关联关系和所述位置关联关系,得到所述映射关系。

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。正则表达式是由普通字符(例如字符a到z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

所述第一待处理对象可以是所述第一通用语句中的待处理对象,例如,所述第一通用语句对应的数据库中的数据表、数据表中的数据列或数据索引等。所述第二待处理对象可以是所述第二SQL语句样本中的待处理对象,例如,所述第一通用语句对应的数据库中的数据表、数据表中的数据列或数据索引等。所述第一SQL关键字和所述第二SQL关键字可以是DROP、DELETE、INSERT、UPDATE、SELECT等。

在另一实施例中,所述基于Transformer模型根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系包括:

用预设占位符替换所述第一通用语句中的第一待处理对象和所述第二SQL语句样本中的第二待处理对象;

将替换后的第一通用语句转换为输入向量序列,将替换后的第二SQL语句样本转换为标签向量序列;

将所述输入向量序列输入Transformer模型,通过Transformer模型计算输出向量序列;

根据所述输出向量序列和所述标签向量序列通过反向传播对所述Transformer模型中参数进行优化,得到训练后的Transformer模型,使所述训练后的Transformer模型中存储有所述映射关系。

Transformer是基于自注意力机制(Self-attention)的深层模型,用于处理NLP任务。Transformer在NLP任务上的处理效果好于RNN,且训练速度更快。

Transformer模型可以通过调整参数适应于第一类型的SQL语句与第二类型的SQL语句进行转换,通过参数存储有SQL语句转换需要的语法转换信息、数据类型转换信息等。

接收模块204,用于接收第一类型的待转换SQL语句。

可以接收用户输入的第一类型的待转换SQL语句;或

从本地数据库中读取第一类型的待转换SQL语句。

当进行数据库迁移时,需要对数据库的sql语句进行转换。所述待转换SQL语句可以是原数据库采用的SQL语句,在更换新数据库后,需要对所述待转换SQL语句进行转换。

第二转换模块205,用于基于SQL规范将所述待转换SQL语句转换为第二通用语句。

具体地,所述基于SQL规范将所述待转换SQL语句转换为第二通用语句,与所述基于SQL规范将所述第一SQL语句样本转换为第一通用语句同理,此处不再赘述。

第三转换模块206,用于基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

在一具体实施例中,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句包括:

根据所述映射关系中的对象关联关系将所述第二通用语句中的第三待处理对象转换为第四待处理对象;

根据所述映射关系中的关键字关联关系将所述第二通用语句中的第三SQL关键字转换为第四SQL关键字;

根据所述映射关系中的位置关联关系调整所述第四待处理对象和所述第四SQL关键字的位置。

在一具体实施例中,所述映射关系还包括字符串类型关联关系,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句还包括:

根据所述字符串类型关联关系对所述第四待处理对象进行数据类型转换。

具体地,获取预设配置文件中的多个字符串类型关联对,每个字符串关联关系对包括一一对应的第一数据类型和第二数据类型;从所述多个字符串关联对的多个第一数据类型中匹配与所述第四待处理对象一致的第一数据类型,得到匹配的第一数据类型;将所述第四待处理对象转换为所述匹配的第一数据类型对应的第二数据类型。

具体地,可以接收开发人员输入的json配置文件。所述json配置文件中包括字符串类型关联关系。例如,字符串类型关联关系为“string-varchar”,其中“string”为第二通用语句中的第三待处理对象的数据类型,“varchar”为目标SQL语句中的第四待处理对象的数据类型。字符串类型关联关系还包括“string-blob”、“double-double”等。

可以由开发人员编写所述json配置文件的解析器,使所述解析器可以根据所述json配置文件中的key-value值获取所述字符串类型关联关系。

在另一实施例中,所述基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句包括:

将所述第二通用语句中的第五待处理对象替换为所述预设占位符;

将替换后的第二通用语句转换为待转换向量序列;

将所述待转换向量序列输入所述训练后的Transformer模型,通过所述训练后的Transformer模型计算目标向量序列;

将所述目标向量序列转换为SQL语句,得到转换后的SQL语句;

获取所述第二通用语句中的第五待处理对象的目标处理对象;

用所述目标处理对象替换所述转换后的SQL语句中的预设占位符,得到所述目标SQL语句。

需要强调的是,为进一步保证所述映射关系和所述目标SQL语句的私密和安全性,所述映射关系和所述目标SQL语句还可以存储于一区块链的节点中。

实施例二的SQL转换装置20获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;基于SQL规范将所述第一SQL语句样本转换为第一通用语句;根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;接收第一类型的待转换SQL语句;基于SQL规范将所述待转换SQL语句转换为第二通用语句;基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。实施例二增加了SQL转换的准确性。同时避免开发人员对SQL语句进行转换,增加SQL转换的效率。

实施例三

本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时实现上述SQL转换方法实施例中的步骤,例如图1所示的步骤101-106:

101,获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

102,基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

103,根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

104,接收第一类型的待转换SQL语句;

105,基于SQL规范将所述待转换SQL语句转换为第二通用语句;

106,基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

或者,该计算机可读指令被处理器执行时实现上述装置实施例中各模块的功能,例如图2中的模块201-206:

获取模块201,用于获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

第一转换模块202,用于基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

确定模块203,用于根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

接收模块204,用于接收第一类型的待转换SQL语句;

第二转换模块205,用于基于SQL规范将所述待转换SQL语句转换为第二通用语句;

第三转换模块206,用于基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

实施例四

图3为本申请实施例三提供的计算机设备的示意图。所述计算机设备30包括存储器301、处理器302以及存储在所述存储器301中并可在所述处理器302上运行的计算机可读指令,例如SQL转换程序。所述处理器302执行所述计算机可读指令时实现上述SQL转换方法实施例中的步骤,例如图1所示的101-106:

101,获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

102,基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

103,根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

104,接收第一类型的待转换SQL语句;

105,基于SQL规范将所述待转换SQL语句转换为第二通用语句;

106,基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

或者,该计算机可读指令被处理器执行时实现上述装置实施例中各模块的功能,例如图2中的模块201-206:

获取模块201,用于获取第一类型的第一SQL语句样本和第二类型的第二SQL语句样本;

第一转换模块202,用于基于SQL规范将所述第一SQL语句样本转换为第一通用语句;

确定模块203,用于根据所述第一通用语句和所述第二SQL语句样本确定第一类型的SQL语句与第二类型的SQL语句的映射关系;

接收模块204,用于接收第一类型的待转换SQL语句;

第二转换模块205,用于基于SQL规范将所述待转换SQL语句转换为第二通用语句;

第三转换模块206,用于基于所述映射关系将所述第二通用语句转换为第二类型的目标SQL语句。

示例性的,所述计算机可读指令可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器301中,并由所述处理器302执行,以完成本方法。所述一个或多个模块可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令在所述计算机设备30中的执行过程。例如,所述计算机可读指令可以被分割成图2中的获取模块201、第一转换模块202、确定模块203、接收模块204、第二转换模块205、第三转换模块206,各模块具体功能参见实施例二。

本领域技术人员可以理解,所述示意图3仅仅是计算机设备30的示例,并不构成对计算机设备30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备30还可以包括输入输出设备、网络接入设备、总线等。

所称处理器302可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等,所述处理器302是所述计算机设备30的控制中心,利用各种接口和线路连接整个计算机设备30的各个部分。

所述存储器301可用于存储所述计算机可读指令,所述处理器302通过运行或执行存储在所述存储器301内的计算机可读指令或模块,以及调用存储在存储器301内的数据,实现所述计算机设备30的各种功能。所述存储器301可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备30的使用所创建的数据等。此外,存储器301可以包括硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)或其他非易失性/易失性存储器件。

所述计算机设备30集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM)、随机存取存储器(RAM)等。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述SQL转换方法的部分步骤。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他模块或步骤,单数不排除复数。本申请中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。

相关技术
  • SQL转换方法、装置、计算机设备及计算机可读存储介质
  • 文档转换方法、装置、计算机设备和计算机可读存储介质
技术分类

06120112314627