掌桥专利:专业的专利平台
掌桥专利
首页

布局表示网络的预训练方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 19:35:22


布局表示网络的预训练方法、装置、电子设备和存储介质

技术领域

本公开涉及人工智能技术领域,具体为深度学习、自然语言处理技术领域,尤其涉及布局表示网络的预训练方法、装置、电子设备和存储介质。

背景技术

在文档领域,除了文档中的文本信息、图像信息,还有一种非常重要的信息,即文档的布局信息。如何很好的利用文档的布局信息,从而提高下游任务达到的效果是很重要的。

发明内容

本公开提供了一种布局表示网络的预训练方法、装置、电子设备和存储介质。

根据本公开的一方面,提供了一种布局表示网络的预训练方法,所述方法包括:获取至少一个原始文档中多个元素各自的第一空间位置向量,以及所述原始文档对应的增强文档中多个所述元素各自的第二空间位置向量;将多个所述元素各自的第一空间位置向量输入布局表示网络,以获取多个所述元素各自的第一布局特征向量;将多个所述元素各自的第二空间位置向量输入所述布局表示网络,以获取多个所述元素各自的第二布局特征向量;根据多个所述元素各自的第一布局特征向量与多个所述元素各自的第二布局特征向量,对所述布局表示网络进行预训练。

根据本公开的另一方面,提供了一种阅读顺序确定模型的训练方法,所述方法包括:获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个所述元素的参考阅读顺序;将多个所述元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第三布局特征向量,所述布局表示网络采用第一方面所述的方法进行预训练得到;将多个所述元素各自的第三布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的预测阅读顺序,并根据多个所述元素的所述参考阅读顺序与所述预测阅读顺序的差异,对所述阅读顺序确定模型进行训练。

根据本公开的另一方面,提供了一种阅读顺序确定方法,所述方法包括:获取待处理的目标文档中多个元素的第四空间位置向量;将多个所述元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第四布局特征向量;将多个所述元素各自的第四布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的目标阅读顺序。

根据本公开的另一方面,提供了一种布局表示网络的预训练装置,所述装置包括:第一获取模块,用于获取至少一个原始文档中多个元素各自的第一空间位置向量,以及所述原始文档对应的增强文档中多个所述元素各自的第二空间位置向量;第一处理模块,用于将多个所述元素各自的第一空间位置向量输入布局表示网络,以获取多个所述元素各自的第一布局特征向量;第二处理模块,用于将多个所述元素各自的第二空间位置向量输入所述布局表示网络,以获取多个所述元素各自的第二布局特征向量;预训练模块,用于根据多个所述元素各自的第一布局特征向量与多个所述元素各自的第二布局特征向量,对所述布局表示网络进行预训练。

根据本公开的另一方面,提供了一种阅读顺序确定模型的训练装置,所述装置包括:第二获取模块,用于获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个所述元素的参考阅读顺序;第四处理模块,用于将多个所述元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第三布局特征向量,所述布局表示网络采用第一方面所述的方法进行预训练得到;第五处理模块,用于将多个所述元素各自的第三布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;训练模块,用于根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的预测阅读顺序,并根据多个所述元素的所述参考阅读顺序与所述预测阅读顺序的差异,对所述阅读顺序确定模型进行训练。

根据本公开的另一方面,提供了一种阅读顺序确定装置,所述装置包括:第三获取模块,用于获取待处理的目标文档中多个元素的第四空间位置向量;第六处理模块,用于将多个所述元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个所述元素各自的第四布局特征向量;第七处理模块,用于将多个所述元素各自的第四布局特征向量输入所述阅读顺序确定模型中的指针网络,以从多个所述元素中获取多个所述元素各自对应的下一目标元素;排序模块,用于根据多个所述元素各自对应的下一目标元素,对多个所述元素进行排序,得到多个所述元素的目标阅读顺序。

根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的布局表示网络的预训练方法,或者执行本公开的阅读顺序确定模型的训练方法,或者执行本公开的阅读顺序确定方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的布局表示网络的预训练方法,或者执行本公开实施例公开的阅读顺序确定模型的训练方法,或者执行本公开实施例公开的阅读顺序确定方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的布局表示网络的预训练方法的步骤,或者执行时实现本公开的阅读顺序确定模型的训练方法的步骤,执行时实现本公开的阅读顺序确定方法的步骤。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开第一实施例的布局表示网络的预训练方法的流程示意图;

图2是根据本公开第二实施例的布局表示网络的预训练方法的流程示意图;

图3是根据本公开第三实施例的阅读顺序确定模型的训练方法的流程示意图;

图4是根据本公开第三实施例的阅读顺序确定模型的训练方法的示意图;

图5是根据本公开第四实施例的阅读顺序确定方法的流程示意图;

图6是根据本公开第四实施例的布局表示网络与其它网络的连接示意图;

图7是根据本公开第五实施例的布局表示网络的预训练装置的结构示意图;

图8是根据本公开第六实施例的布局表示网络的预训练装置的结构示意图;

图9是根据本公开第七实施例的阅读顺序确定模型的训练装置的结构示意图;

图10是根据本公开第八实施例的阅读顺序确定装置的结构示意图;

图11是用来实现本公开实施例的布局表示网络的预训练方法或阅读顺序确定模型的训练方法或阅读顺序确定方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

在文档领域,除了文档中的文本信息、图像信息,还有一种非常重要的信息,即文档的布局信息。如何很好的利用文档的布局信息,从而提高下游任务达到的效果是很重要的。

相关技术,通常是对文档的布局信息进行随机初始化,得到布局特征向量,再利用确定的布局特征向量进行后续步骤,比如将布局特征向量输入下游任务的任务处理模型,对任务处理模型进行训练,得到可以适用于下游任务的任务处理模型。这种方式,不能很好的利用文档的布局信息,从而导致下游任务达到的效果较差。

本公开实施例提供一种布局表示网络的预训练方法及装置、阅读顺序确定模型的训练方法及装置、阅读顺序确定方法及装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品。其中布局表示网络的预训练方法包括:获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量;将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量;将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量;根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。由此,可以实现对布局表示网络的预训练,该布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

其中,本公开提供的布局表示网络的预训练方法及装置、阅读顺序确定模型的训练方法及装置、阅读顺序确定方法及装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习、自然语言处理技术领域。

其中,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

DL(Deep Learning,深度学习),是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。

NLP(Natural Language Processing,自然语言处理),是使用自然语言同计算机进行通讯的技术,因为处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解,也称为计算语言学。一方面它是语言信息处理的一个分支,另一方面它是人工智能的核心课题之一。

下面参考附图描述本公开实施例的布局表示网络的预训练方法及装置、阅读顺序确定模型的训练方法及装置、阅读顺序确定方法及装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品。

首先对本公开实施例提供的布局表示网络的预训练方法进行说明。

图1是根据本公开第一实施例的布局表示网络的预训练方法的流程示意图。其中,需要说明的是,本实施的布局表示网络的预训练方法,执行主体为布局表示网络的预训练装置,该布局表示网络的预训练装置可以由软件和/或硬件实现,该布局表示网络的预训练装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。

如图1所示,该布局表示网络的预训练方法可以包括如下步骤:

步骤101,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量。

其中,原始文档,为未经过处理的文档,可以为文本文档,也可以为图片文档,或者其它类型的文档,本公开对原始文档的类型不作限制。原始文档的数量可以为一个或多个,本公开对此不作限制。

增强文档,为对原始文档进行数据增强得到的文档。

元素,为原始文档或增强文档的构成元素,可以为原始文档或增强文档中的单个字符、多个字符、图片、或者文本框等,本公开对此不作限制。其中,元素为原始文档或增强文档中的字符时,可以为中文的字符或者其它语言类型的字符,本申请对字符的语言类型不作限制。

原始文档中某个元素的第一空间位置向量,为表示该元素在原始文档中的空间位置信息的向量。其中,元素在原始文档中的空间位置信息,比如可以包括元素的边界框的坐标信息。

增强文档中某个元素的第二空间位置向量,为表示该元素在增强文档中的空间位置信息的向量。其中,元素在增强文档中的空间位置信息,比如可以包括元素的边界框的坐标信息。

需要说明的是,对原始文档进行数据增强,不会减少原始文档中元素的数量,而是会导致同一元素在原始文档和增强文档中的空间位置信息不同,因此,原始文档与对应的增强文档中的元素相同。

需要说明的是,本公开实施例中可以通过各种公开、合法合规的方式获取原始文档,例如可以从公开数据集处获取原始文档,或者也可以在经过用户授权后从用户处获取原始文档,本公开对此不作限制。

步骤102,将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量。

其中,布局表示网络,例如可以为transformer(变压器)网络,或者其它能够实现向量表示的网络,本公开对此不作限制。

其中,某个元素的第一布局特征向量,为表示该元素在原始文档中的布局特征的向量,可以表现出原始文档的布局信息。

以布局表示网络为transformer网络为例,可以将原始文档中所有元素各自的第一空间位置向量输入transformer网络,以获取所有元素各自的第一布局特征向量。其中,元素即token。

步骤103,将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量。

其中,某个元素的第二布局特征向量,为表示该元素在增强文档中的布局特征的向量,可以表现出增强文档的布局信息。

以布局表示网络为transformer网络为例,可以将增强文档中所有元素各自的第二空间位置向量输入transformer网络,以获取所有元素各自的第二布局特征向量。

步骤104,根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。

作为一种可能的实现方式,可以根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,构建布局表示网络的损失函数,再根据损失函数的数值对布局表示网络的模型参数进行调整,得到经过预训练的布局表示网络。

其中,得到经过预训练的布局表示网络之后,可以针对具体的下游任务,结合经过预训练的布局表示网络,构建下游任务的任务处理模型;进而结合下游任务的训练数据对任务处理模型进行训练,得到可以适用于下游任务的任务处理模型。

其中,下游任务例如,文档类型识别任务、阅读顺序确定任务等,可以根据实际需要进行设定。

由于经过预训练的布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

综上,本公开实施例提供的布局表示网络的预训练方法,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量;将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量;将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量;根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。由此,可以实现对布局表示网络的预训练,该布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

下面结合图2,对根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练的过程进行进一步说明。

图2是根据本公开第二实施例的布局表示网络的预训练方法的流程示意图。如图2所示,布局表示网络的预训练方法,可以包括以下步骤:

步骤201,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量。

在本公开的实施例中,对于至少一个原始文档,可以对原始文档进行旋转处理和/或裁剪处理,得到原始文档对应的增强文档。

具体的,可以将每个原始文档旋转某个预设角度比如90度,得到原始文档对应的增强文档。或者,可以将每个原始文档周边的留白区域随机剪裁掉一部分,得到原始文档对应的增强文档。或者,可以将每个原始文档旋转某个预设角度比如90度,并将每个原始文档周边的留白区域随机剪裁掉一部分,得到原始文档对应的增强文档。

通过对原始文档进行旋转处理和/或裁剪处理,实现了对原始文档进行数据增强,且得到的增强文档中的元素与原始文档中元素相同,同一元素在原始文档和增强文档中的空间位置信息不同,为后续基于相同元素的不同空间信息,对布局表示网络进行预训练奠定基础。

在本公开的实施例中,可以通过以下方式,获取至少一个原始文档中多个元素各自的第一空间位置向量:获取至少一个原始文档中多个元素各自的边界框的坐标信息;基于多个元素各自的边界框的坐标信息,生成对应元素的第一空间位置向量。

其中,某个元素的边界框,为包围该元素的边界框,边界框的坐标信息,可以包括边界框相对原始文档左上角的坐标、边界框的宽度和边界框的高度。比如,某个元素的边界框的坐标信息,可以表示为「x,y,w,h」。其中,x,y表示元素的边界框相对原始文档左上角的坐标,w表示边界框的宽度,h表示边界框的高度。

在本公开的实施例中,对于原始文档中的任一元素,可以对x,y,w,h分别进行归一化,比如归一化到0-1000,再将归一化后的x,y,w,h分别初始化为一个向量,并将x,y,w,h分别的向量拼接,得到该元素的第一空间位置向量。

其中,对归一化后的x,y,w,h分别初始化得到的向量的维度,可以根据需要设置。比如在后续需要将布局特征向量与文本特征向量相加时,可以将初始化得到的向量的维度设置为与文本特征向量的维度相同。

其中,对归一化后的x,y,w,h分别初始化的方式,可以为随机初始化。

由此,能够基于原始文档中多个元素各自的边界框的坐标信息,准确生成对应原始的第一空间位置向量。

需要说明的是,获取原始文档对应的增强文档中多个元素各自的第二空间位置向量的方式,与获取原始文档中多个元素各自的第一空间位置向量的方式类似,此处不再赘述。

步骤202,将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量。

步骤203,将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量。

其中,步骤202-步骤203的具体实现过程及原理,可以参考上述实施例的相关描述,此处不再赘述。

步骤204,将多个元素各自的第一布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第一隐表示。

其中,全连接网络,例如可以为FFN(feed-forward network,前馈神经网络),或者其它能够获取元素之间的空间关系的网络,本公开对此不作限制。

步骤205,将多个元素各自的第二布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第二隐表示。

在本公开的实施例中,可以随机抽取原始文档中多个元素各自的第一布局特征向量,将这些元素各自的第一布局特征向量输入全连接网络,以获取这些元素之间的空间关系的第一隐表示。并且,可以将增强文档中这些元素各自的第二布局特征向量输入全连接网络,以获取这些元素之间的空间关系的第二隐表示。

比如,假设原始文档中包括1000个元素,随机抽取100个元素各自的第一布局特征向量,将这些元素各自的第一布局特征向量输入全连接网络,可以获取这100个元素之间的空间关系的第一隐表示。并且,可以将这100个元素各自的第二布局特征向量输入全连接网络,以获取这100个元素之间的空间关系的第二隐表示。

步骤206,根据第一隐表示与第二隐表示之间的差异,调整布局表示网络和全连接网络的模型参数,以对布局表示网络进行预训练。

在本公开的实施例中,可以计算第一隐表示和第二隐表示之间的距离,通过优化布局表示网络和全连接网络的模型参数,来减小第一隐表示和第二隐表示之间的距离,实现对布局表示网络的预训练。

通过将多个元素各自的第一布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第一隐表示,将多个元素各自的第二布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第二隐表示,根据第一隐表示与第二隐表示之间的差异,调整布局表示网络和全连接网络的模型参数,以对布局表示网络进行预训练,可以实现对布局表示网络的预训练,提高训练得到的布局表示网络输出的布局特征向量的准确性,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

综上,本公开实施例提供的布局表示网络的预训练方法,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量,将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量,将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量,将多个元素各自的第一布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第一隐表示,将多个元素各自的第二布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第二隐表示,根据第一隐表示与第二隐表示之间的差异,调整布局表示网络和全连接网络的模型参数,以对布局表示网络进行预训练,可以实现对布局表示网络的预训练,该布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

可以理解的是,通过上述任一实施例所示的布局表示网络的预训练方法训练得到的布局表示网络,可以应用于多种下游任务,其中,针对具体的下游任务,可以结合经过预训练的布局表示网络,构建下游任务的任务处理模型,进而结合下游任务的训练数据对任务处理模型进行训练,得到可以适用于下游任务的任务处理模型。其中,下游任务例如,文档类型识别任务、阅读顺序确定任务等,可以根据实际需要进行设定。

下面以下游任务为阅读顺序确定任务,下游的任务处理模型为阅读顺序确定模型为例,对经过预训练的布局表示网络应用于下游任务的过程进行说明。

参考图3,本公开实施例中基于预训练得到的布局表示网络,提供一种阅读顺序确定模型的训练方法。

图3是根据本公开第三实施例的阅读顺序确定模型的训练方法的流程示意图。如

图3所示,阅读顺序确定模型的训练方法,可以包括以下步骤:

步骤301,获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多5个元素的参考阅读顺序。

其中,样本文档,为未经过处理的文档,可以为文本文档,也可以为图片文档,或者其它类型的文档,本公开对样本文档的类型不作限制。样本文档的数量可以为一个或多个,本公开对此不作限制。

元素,为样本文档的构成元素,可以为样本文档中的单个字符、多个字符、图0片、或者文本框等,本公开对此不作限制。其中,元素为样本文档中的字符时,可以

为中文的字符或者其它语言类型的字符,本申请对字符的语言类型不作限制。

样本文档中某个元素的第三空间位置向量,为表示该元素在样本文档中的空间位置信息的向量。其中,元素在样本文档中的空间位置信息,比如可以包括元素的边界框的坐标信息。

5其中,获取样本文档中多个元素各自的第三空间位置向量的过程,可以参考其它

实施例中获取原始文档中多个元素各自的第一空间位置向量的过程,此处不再赘述。

多个元素的参考阅读顺序,为预先标注好的阅读顺序。

步骤302,将多个元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第三布局特征向量。

0其中,布局表示网络采用前述任一实施例所述的布局表示网络的预训练方法进行

预训练得到。

在本公开的实施例中,可以基于经过预训练的布局表示网络,构建下游任务的阅读顺序确定模型,将样本文档中多个元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,可以获取该多个元素各自的第三布局特征向量。

5其中,某个元素的第三布局特征向量,为表示该元素在样本文档中的布局特征的向量,可以表现出样本文档的布局信息。

步骤303,将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素。

其中,指针网络,可以为任意类型的指针网络,本公开对此不作限制。

具体的,可以将样本文档中各元素的第三布局特征向量输入指针网络,指针网络可以从各元素中确定每个元素对应的下一个目标元素,从而可以得到多个元素各自对应的下一目标元素。

在本公开的实施例中,为了使得对于每个元素,仅确定该元素对应的一个目标元素,即实现一对一匹配,将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络后,可以通过匈牙利匹配方式进行匹配,从多个元素中获取多个元素各自对应的下一目标元素。

即步骤303可以通过以下方式实现:将多个元素各自的第三布局特征向量输入指针网络,以通过匈牙利匹配方式进行匹配,从多个元素中获取多个元素各自对应的下一目标元素。

其中,可以按照任意顺序,将多个元素各自的第三布局特征向量,输入阅读顺序确定模型中的指针网络,本公开对此不作限制。

参考图4,其中,图4中表示start(开始),“2”、“1”、“6”、“3”、“4”、“8”、“5”、“7”表示各元素(即token)。本公开实施例中,将各元素的第三空间位置向量输入布局表示网络,得到各元素的第三布局特征向量后,可以将各元素的第三布局特征向量输入指针网络,从而对于每个元素,可以计算与其它各元素之间的相关度,并将与该元素相关度最高的元素确定为下一目标元素。比如,参考图4,可以确定的下一目标元素为“1”,“1”的下一目标元素为“2”,“2”的下一目标元素为“3”。

步骤304,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的预测阅读顺序,并根据多个元素的参考阅读顺序与预测阅读顺序的差异,对阅读顺序确定模型进行训练。

本公开实施例中,可以根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的预测阅读顺序,并计算预测阅读顺序和参考阅读顺序之间的差异,通过优化阅读顺序确定模型中布局表示网络和指针网络的模型参数,来减小预测阅读顺序和参考阅读顺序之间的差异,实现对阅读顺序确定模型的训练。

由此,通过基于预训练得到的布局表示网络,构建阅读顺序确定模型,并对阅读顺序确定模型进行训练,可以基于布局表示网络输出的布局特征向量学到更多的布局信息,使得阅读顺序确定模型达到更高的准确性。

综上,本公开实施例提供的阅读顺序确定模型的训练方法,获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个元素的参考阅读顺序,将多个元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第三布局特征向量,将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的预测阅读顺序,并根据多个元素的参考阅读顺序与预测阅读顺序的差异,对阅读顺序确定模型进行训练。由此,实现了对阅读顺序确定模型的训练,该阅读顺序确定模型基于经过预训练的布局表示网络构建,可以基于布局表示网络输出的布局特征向量学到更多的布局信息,使得阅读顺序确定任务达到更高的准确性。

基于上述阅读顺序确定模型的训练方法,本公开还提供一种阅读顺序确定方法。下面针对上述情况,结合图5,对本公开提供的阅读顺序确定方法进行说明。

图5是根据本公开第四实施例的阅读顺序确定方法的流程示意图。如图5所示,阅读顺序确定方法,可以包括以下步骤:

步骤501,获取待处理的目标文档中多个元素的第四空间位置向量。

其中,目标文档,为待确定其中元素的阅读顺序的文档,可以为文本文档,也可以为图片文档,或者其它类型的文档,本公开对目标文档的类型不作限制。

元素,为目标文档的构成元素,可以为目标文档中的单个字符、多个字符、图片、或者文本框等,本公开对此不作限制。其中,元素为目标文档中的字符时,可以为中文的字符或者其它语言类型的字符,本申请对字符的语言类型不作限制。

目标文档中某个元素的第四空间位置向量,为表示该元素在目标文档中的空间位置信息的向量。其中,元素在目标文档中的空间位置信息,比如可以包括元素的边界框的坐标信息。

其中,获取目标文档中多个元素各自的第四空间位置向量的过程,可以参考其它实施例中获取原始文档中多个元素各自的第一空间位置向量的过程,此处不再赘述。

步骤502,将多个元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第四布局特征向量。

其中,阅读顺序确定模型,可以采用上述实施例中阅读顺序确定模型的训练方法进行训练得到。

在本公开的实施例中,可以将目标文档中多个元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,得到该多个元素各自的第四布局特征向量。

其中,某个元素的第四布局特征向量,为表示该元素在目标文档中的布局特征的向量,可以表现出目标文档的布局信息。

步骤503,将多个元素各自的第四布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素。

具体的,可以将目标文档中各元素的第四布局特征向量输入指针网络,指针网络可以从各元素中确定每个元素对应的下一个目标元素,从而可以得到多个元素各自对应的下一目标元素。

其中,步骤503的具体实现过程,可以参考前述实施例中将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素的过程,此处不再赘述。

步骤504,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的目标阅读顺序。

可以理解的是,相关技术通常是采用OCR(Optical Character Recognition,光学字符识别)技术,对文档进行识别,并基于从上到下,从左到右的规律进行阅读,但是对于复杂版式如分栏版式整体效果较差。本公开实施例提供的阅读顺序确定方法,可以基于布局表示网络构建阅读顺序确定模型,由于布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而指针网络可以基于布局表示网络输出的布局单模态的布局特征向量,准确确定阅读顺序。

综上,本公开实施例的阅读顺序确定方法,获取待处理的目标文档中多个元素的第四空间位置向量,将多个元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第四布局特征向量,将多个元素各自的第四布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的目标阅读顺序,实现了基于经过训练的阅读顺序确定模型,确定目标文档中各元素的阅读顺序,由于阅读顺序确定模型基于经过预训练的布局表示网络构建,可以基于布局表示网络输出的布局特征向量学到更多的布局信息,从而能够提高确定的阅读顺序的准确性。

上述实施例示出了下游任务为阅读顺序确定任务,下游的任务处理模型为阅读顺序确定模型时,经过预训练的布局表示网络应用于下游任务的过程。作为另一种实现方式,经过预训练的布局表示网络还可以应用于其它下游任务比如文档类型识别任务,经过预训练的布局表示网络可以接入其它模型比如相关技术中的多模态预训练模型中,从而提高多模态预训练模型对布局模态的理解能力,在多模态任务上达到更优的效果。

比如,以布局表示网络为transformer网络为例,可以利用transformer网络的第一层的输入表示层输出的embedding(向量),替换其它多模态预训练模型中的随机初始化得到的输入向量,从而使得其它多模态预训练模型可以基于transformer网络的第一层的输入表示层输出的embedding,学到更多的布局信息,使得下游任务达到更好的效果。

或者,以布局表示网络为transformer网络为例,还可以将该完整的transformer网络与其它transformer网络拼接使用。比如,如图6所示,可以将文档中多个元素各自的二维的空间位置向量与一维位置向量(1D Embedding)相加,输入transformer网络601,得到多个元素各自的布局特征向量,将文档中多个元素各自的二维的文本表示向量(2D TokenEmbedding)与一维位置向量(1D Embedding)相加,输入另一transformer网络602,得到多个元素各自的文本特征向量,两个transformer网络在中间层进行交互(BiACM),再基于多个元素各自的布局特征向量和文本特征向量进行后续处理。其中,图6中的“点乘”(MatMul)、“归一化”(Softmax)、“掩码”(Mask)、“缩放”(Scale),表示transformer网络中的部分层;N

下面结合图7,对本公开提供的布局表示网络的预训练装置进行说明。

图7是根据本公开第五实施例的布局表示网络的预训练装置的结构示意图。

如图7所示,本公开提供的布局表示网络的预训练装置700,包括:第一获取模块701、第一处理模块702、第二处理模块703以及预训练模块704。

其中,第一获取模块701,用于获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量;

第一处理模块702,用于将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量;

第二处理模块703,用于将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量;

预训练模块704,用于根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。

需要说明的是,本实施例提供的布局表示网络的预训练装置700,可以执行前述实施例的布局表示网络的预训练方法。其中,布局表示网络的预训练装置700可以由软件和/或硬件实现,该布局表示网络的预训练装置700可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。

需要说明的是,前述对于布局表示网络的预训练方法的实施例的说明,也适用于本公开提供的布局表示网络的预训练装置,此处不再赘述。

本公开实施例提供的布局表示网络的预训练装置,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量;将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量;将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量;根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。由此,可以实现对布局表示网络的预训练,该布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

下面结合图8,对本公开提供的布局表示网络的预训练装置进行进一步说明。

图8是根据本公开第六实施例的布局表示网络的预训练装置的结构示意图。

如图8所示,本公开提供的布局表示网络的预训练装置800,包括:第一获取模块801、第一处理模块802、第二处理模块803以及预训练模块804。其中,图8中第一获取模块801、第一处理模块802、第二处理模块803以及预训练模块804与图7中第一获取模块701、第一处理模块702、第二处理模块703以及预训练模块704具有相同功能和结构。

在本公开的实施中,预训练模块804,包括:

第一处理单元8041,用于将多个元素各自的第一布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第一隐表示;

第二处理单元8042,用于将多个元素各自的第二布局特征向量输入全连接网络,以获取多个元素之间的空间关系的第二隐表示;

预训练单元8043,用于根据第一隐表示与第二隐表示之间的差异,调整布局表示网络和全连接网络的模型参数,以对布局表示网络进行预训练。

在本公开的实施中,第一获取模块801,包括:

获取单元,用于获取至少一个原始文档中多个元素各自的边界框的坐标信息;

生成单元,用于基于多个元素各自的边界框的坐标信息,生成对应元素的第一空间位置向量。

在本公开的实施中,布局表示网络的预训练装置800还包括:

第三处理模块,用于对至少一个原始文档进行旋转处理和/或裁剪处理,得到原始文档对应的增强文档。

需要说明的是,前述对于布局表示网络的预训练方法的实施例的说明,也适用于本公开提供的布局表示网络的预训练装置,此处不再赘述。

本公开实施例提供的布局表示网络的预训练装置,获取至少一个原始文档中多个元素各自的第一空间位置向量,以及原始文档对应的增强文档中多个元素各自的第二空间位置向量;将多个元素各自的第一空间位置向量输入布局表示网络,以获取多个元素各自的第一布局特征向量;将多个元素各自的第二空间位置向量输入布局表示网络,以获取多个元素各自的第二布局特征向量;根据多个元素各自的第一布局特征向量与多个元素各自的第二布局特征向量,对布局表示网络进行预训练。由此,可以实现对布局表示网络的预训练,该布局表示网络输出的布局特征向量可以很好的表现文档的布局信息,从而将该布局表示网络应用于下游任务时,可以使得下游任务学到更多的布局信息,使得下游任务达到更好的效果。

下面结合图9,对本公开提供的阅读顺序确定模型的训练装置进行说明。

图9是根据本公开第七实施例的阅读顺序确定模型的训练装置的结构示意图。

如图9所示,本公开提供的阅读顺序确定模型的训练装置900,包括:第二获取模块901、第四处理模块902、第五处理模块903以及训练模块904。

其中,第二获取模块901,用于获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个元素的参考阅读顺序;

第四处理模块902,用于将多个元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第三布局特征向量,布局表示网络采用前述实施例中布局表示网络的预训练方法进行预训练得到;

第五处理模块903,用于将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素;

训练模块904,用于根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的预测阅读顺序,并根据多个元素的参考阅读顺序与预测阅读顺序的差异,对阅读顺序确定模型进行训练。

在本公开的实施例中,第五处理模块903,包括:

第三处理单元,用于将多个元素各自的第三布局特征向量输入指针网络,以通过匈牙利匹配方式进行匹配,从多个元素中获取多个元素各自对应的下一目标元素。

需要说明的是,本实施例提供的阅读顺序确定模型的训练装置900,可以执行前述实施例的阅读顺序确定模型的训练方法。其中,阅读顺序确定模型的训练装置900可以由软件和/或硬件实现,该阅读顺序确定模型的训练装置900可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。

需要说明的是,前述对于阅读顺序确定模型的训练方法的实施例的说明,也适用于本公开提供的阅读顺序确定模型的训练装置,此处不再赘述。

本公开实施例提供的阅读顺序确定模型的训练装置,获取至少一个样本文档中多个元素各自的第三空间位置向量,以及多个元素的参考阅读顺序,将多个元素各自的第三空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第三布局特征向量,将多个元素各自的第三布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的预测阅读顺序,并根据多个元素的参考阅读顺序与预测阅读顺序的差异,对阅读顺序确定模型进行训练。由此,实现了对阅读顺序确定模型的训练,该阅读顺序确定模型基于经过预训练的布局表示网络构建,可以基于布局表示网络输出的布局特征向量学到更多的布局信息,使得阅读顺序确定任务达到更高的准确性。

下面结合图10,对本公开提供的阅读顺序确定装置进行说明。

图10是根据本公开第八实施例的阅读顺序确定装置的结构示意图。

如图10所示,本公开提供的阅读顺序确定装置1000,包括:第三获取模块1001、第六处理模块1002、第七处理模块1003以及排序模块1004。

其中,第三获取模块1001,用于获取待处理的目标文档中多个元素的第四空间位置向量;

第六处理模块1002,用于将多个元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第四布局特征向量;

第七处理模块1003,用于将多个元素各自的第四布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素;

排序模块1004,用于根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的目标阅读顺序。

需要说明的是,本实施例提供的阅读顺序确定装置1000,可以执行前述实施例的阅读顺序确定方法。其中,阅读顺序确定装置1000可以由软件和/或硬件实现,该阅读顺序确定装置1000可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。

需要说明的是,前述对于阅读顺序确定方法的实施例的说明,也适用于本公开提供的阅读顺序确定装置,此处不再赘述。

本公开实施例提供的阅读顺序确定装置,获取待处理的目标文档中多个元素的第四空间位置向量,将多个元素各自的第四空间位置向量输入阅读顺序确定模型中的布局表示网络,以获取多个元素各自的第四布局特征向量,将多个元素各自的第四布局特征向量输入阅读顺序确定模型中的指针网络,以从多个元素中获取多个元素各自对应的下一目标元素,根据多个元素各自对应的下一目标元素,对多个元素进行排序,得到多个元素的目标阅读顺序,实现了基于经过训练的阅读顺序确定模型,确定目标文档中各元素的阅读顺序,由于阅读顺序确定模型基于经过预训练的布局表示网络构建,可以基于布局表示网络输出的布局特征向量学到更多的布局信息,从而能够提高确定的阅读顺序的准确性。

基于上述实施例,本公开还提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的布局表示网络的预训练方法,或者执行本公开的阅读顺序确定模型的训练方法,或者执行本公开的阅读顺序确定方法。

基于上述实施例,本公开还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的布局表示网络的预训练方法,或者执行本公开实施例公开的阅读顺序确定模型的训练方法,或者执行本公开实施例公开的阅读顺序确定方法。

基于上述实施例,本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的布局表示网络的预训练方法的步骤,或者执行时实现本公开的阅读顺序确定模型的训练方法,或者执行时实现本公开的阅读顺序确定方法。

根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示,该电子设备1100可以包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如布局表示网络的预训练方法,或者阅读顺序确定模型的训练方法,或者阅读顺序确定方法。例如,在一些实施例中,布局表示网络的预训练方法,或者阅读顺序确定模型的训练方法,或者阅读顺序确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的布局表示网络的预训练方法,或者阅读顺序确定模型的训练方法,或者阅读顺序确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行布局表示网络的预训练方法,或者阅读顺序确定模型的训练方法,或者阅读顺序确定方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 一种书法训练方法、装置、电子设备及存储介质
  • 屏幕布局数据处理方法、装置、电子设备及存储介质
  • 神经网络模型的优化方法及装置、电子设备和存储介质
  • 贝叶斯网络确定方法、装置、存储介质和电子设备
  • 神经网络模型的优化方法及装置、电子设备和存储介质
  • 语义表示模型的预训练方法、装置、电子设备及存储介质
  • 语义表示模型的预训练方法、装置、电子设备和存储介质
技术分类

06120115960160