掌桥专利:专业的专利平台
掌桥专利
首页

基于神经机器翻译的人机协同翻译方法、设备及存储介质

文献发布时间:2023-06-19 18:34:06


基于神经机器翻译的人机协同翻译方法、设备及存储介质

技术领域

本发明涉及翻译技术领域,尤其涉及基于神经机器翻译的人机协同翻译方法、翻译设备及存储介质。

背景技术

随着社会发展,使用不同语言的地区之间的信息交流和业务交流也越来越频繁。人们在与不同语言地区的交流中也会面对不熟悉的语言,产生对于语言的翻译需求。

基于机器翻译快捷和方便易用的优点,目前翻译一般选择使用机器翻译的方式,然而由于实际的使用场景中除了针对语义和语法的翻译外,还存在上下文环境或专业技术领域等因素,只依靠机器翻译没办法达到令人满意的翻译效果。因此,目前使用机器翻译无法为用户提供良好的翻译体验。

发明内容

本发明的主要目的在于提供一种基于神经机器翻译的人机协同翻译方法、翻译设备及存储介质,旨在提高翻译设备翻译的准确性。

为实现上述目的,本发明提供一种基于神经机器翻译的人机协同翻译方法,应用于翻译设备,所述方法包括以下步骤:

获取翻译原文信息;

根据基于神经网络的预设翻译模型翻译所述翻译原文信息获得对应的第一译文信息,输出所述第一译文信息和所述翻译原文信息;

接收所述第一译文信息对应的人工修正信息,根据所述人工修正信息修正所述第一译文信息,获得第二译文信息;

输出所述第二译文信息。

可选地,所述输出所述第二译文信息的步骤之后,还包括:

将所述翻译原文信息、所述第一译文信息和所述第二译文信息关联形成第一语料信息,并将所述第一语料信息添加至语言资产信息,所述语言资产信息包括所述第一语料信息和当前时刻之前获得的语料信息;

根据所述语言资产信息训练所述预设翻译模型。

可选地,所述输出所述第一译文信息和所述翻译原文信息的步骤包括:

确定所述翻译原文信息和所述第一译文信息对应的翻译任务;

匹配所述翻译任务对应的目标客户端;

将所述翻译原文信息和所述第一译文信息发送至所述目标客户端;

所述接收所述第一译文信息对应的人工修正信息的步骤包括:

接收所述目标客户端反馈的所述人工修正信息。

可选地,所述匹配所述翻译任务对应的目标客户端的步骤包括:

根据所述翻译原文信息生成原文特征信息;

确定与所述原文特征信息匹配的用户特征信息,并确定所述用户特征信息的对应客户端为所述目标客户端。

可选地,所述将所述翻译原文信息和所述第一译文信息发送至所述目标客户端的步骤之后,还包括:

当接收到所述目标客户端反馈的关键文本信息时,从所述目标客户端对应的客户端语言资产信息中确定与所述关键文本信息匹配的历史译文信息;

将所述历史译文信息发送至所述目标客户端,以使所述目标客户端将所述历史译文信息和所述关键文本信息关联输出;

所述客户端语言资产信息包括所述目标客户端多个第二语料信息,所述第二语料信息包括对应时刻的翻译原文和第二译文信息关联形成的信息。

可选地,所述接收所述第一译文信息对应的人工修正信息,根据所述人工修正信息修正所述第一译文信息,获得第二译文信息的步骤包括:

接收所述第一译文信息对应的至少两个所述人工修正信息,不同所述人工修正信息由不同目标客户端反馈;

根据每个所述人工修正信息修正所述第一译文信息,获得至少两个第三译文信息,所述第二译文信息包括所述至少两个第三译文信息。

可选地,所述接收所述第一译文信息对应的人工修正信息的步骤之后,还包括:

根据所述人工修正信息确定翻译效果评级,所述翻译效果评级表征所述预设翻译模型翻译获得的所述第一译文信息的翻译准确度;

确定所述翻译原文信息对应的原文类型标识;

更新所述原文类型标识对应的翻译效果评级。

可选地,所述匹配所述翻译任务对应的目标客户端的步骤包括:

根据所述翻译效果评级确定所述目标客户端的目标数量;

匹配所述目标数量对应的用于完成所述翻译任务的所述目标客户端。

此外,为了实现上述目的,本申请还提出一种翻译设备,所述翻译设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于神经机器翻译的人机协同翻译程序,所述基于神经机器翻译的人机协同翻译程序配置为实现如上任一项所述的基于神经机器翻译的人机协同翻译方法的步骤。

此外,为了实现上述目的,本申请还提出一种存储介质,所述存储介质上存储有基于神经机器翻译的人机协同翻译程序,所述基于神经机器翻译的人机协同翻译程序被处理器执行时实现如上任一项所述的基于神经机器翻译的人机协同翻译方法的步骤。

本发明提出一种基于神经机器翻译的人机协同翻译方法,该方法通过获取翻译原文信息;根据基于神经网络的预设翻译模型翻译该翻译原文信息获得对应的第一译文信息,从而获得机器翻译文本,输出第一译文信息和翻译原文信息;然后接收第一译文信息对应的人工修正信息,根据人工修正信息修正第一译文信息,获得第二译文信息,从而将机器翻译文本进行人工修正,获得修正后的翻译文本;继而输出所述第二译文信息。相对于传统利用机器翻译的翻译方法,该方法先通过预设翻译模型获得翻译原文信息的机器翻译文本,继而将机器翻译文本进行人工修正获得最终的第二译文信息,从而弥补机器翻译不准确的缺点,实现在利用机器翻译便捷性高的基础上,结合人工翻译准确性高的优点,提高翻译设备翻译的准确性。

附图说明

图1为本发明翻译设备一实施例运行涉及的硬件结构示意图;

图2为本发明基于神经机器翻译的人机协同翻译方法一实施例的流程示意图;

图3为本发明基于神经机器翻译的人机协同翻译方法另一实施例的流程示意图;

图4为本发明基于神经机器翻译的人机协同翻译方法又一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提出一种翻译设备。如图1所示,该翻译设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-VolatileMemory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对翻译设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括基于神经机器翻译的人机协同翻译程序。在图1所示的翻译设备中,网络接口1004主要用于与其他设备进行数据通信;用户接口1003主要用于与用户进行数据交互;处理器1001可以用于调用存储器1005中存储的基于神经机器翻译的人机协同翻译程序,并执行本发明实施例提供的基于神经机器翻译的人机协同翻译方法。

本发明实施例还提供了一种基于神经机器翻译的人机协同翻译方法,应用于上述翻译设备。

参照图2,提出本申请基于神经机器翻译的人机协同翻译方法一实施例。在本实施例中,所述方法包括:

步骤S10,获取翻译原文信息;

翻译原文信息为需要进行翻译的文本材料,文本材料可以是一个文档或一段文本内容,不限定该文本材料的规模。

可选地,翻译设备获取翻译原文信息,可以是由用户操作翻译设备输入,也可以是从其他设备远程获取。需要说明的是,需要对所输入的原始文本信息进行预处理,例如去重,以避免对后续翻译的步骤产生干扰,影响翻译准确性。

步骤S20,根据基于神经网络的预设翻译模型翻译所述翻译原文信息获得对应的第一译文信息,输出所述第一译文信息和所述翻译原文信息;

预设翻译模型为基于神经网络建立的并且用于翻译的模型,该预设翻译模型在本实施例中已经利用语料资源进行过训练,具备翻译能力。此外,本实施例的翻译方法并不限定译文的语种,译文语种可以是汉语或其他语种。

可选地,翻译原文信息输入预设翻译模型,获得预设翻译模型输出的第一译文信息,从而完成将原文进行机器翻译的步骤;输出第一译文信息和翻译原文信息,可以是在当前翻译设备上输出,也可以是将数据发送至其他设备,在其他设备上根据第一译文信息和翻译原文信息作出处理。

步骤S30,接收所述第一译文信息对应的人工修正信息,根据所述人工修正信息修正所述第一译文信息,获得第二译文信息;输出所述第二译文信息。

人工修正信息为由人工作出的针对第一译文信息的修正信息,示例性的,第一译文信息为一个文本文档,则人工修正信息可以是在该文本文档基础上添加修订痕迹后的文本文档。利用人工参与作出人工修正信息,可以在机器翻译所得的译文上进行人工修正,提高译文准确性。

第二译文信息为在第一译文信息基础上结合人工修正信息所作出的修正后所获得的译文信息,示例性的,若人工修正信息是具备修订痕迹的文本文档,则第二译文信息为接受修改痕迹后的文本文档。

可选地,翻译设备在输出第一译文信息和翻译原文信息后,接收对应的反馈信息即为人工修正信息,示例性的,若在当前翻译设备上输出,则通过接收用户操作当前翻译设备输入的信息获取人工修正信息,若输出于其他设备,则从对应其他设备处接收对应的反馈的人工修正信息。根据人工修正信息对机器翻译获得的第一译文信息作出修正,获得修正后的第二译文信息,第二译文信息即为最终翻译完成的译文信息,输出第二译文信息。

本发明实施例提出一种基于神经机器翻译的人机协同翻译方法,该方法通过获取翻译原文信息;根据基于神经网络的预设翻译模型翻译该翻译原文信息获得对应的第一译文信息,从而获得机器翻译文本,输出第一译文信息和翻译原文信息;然后接收第一译文信息对应的人工修正信息,根据人工修正信息修正第一译文信息,获得第二译文信息,从而将机器翻译文本进行人工修正,获得修正后的翻译文本;继而输出所述第二译文信息。相对于传统利用机器翻译的翻译方法,该方法先通过预设翻译模型获得翻译原文信息的机器翻译文本,继而将机器翻译文本进行人工修正获得最终的第二译文信息,从而弥补机器翻译不准确的缺点,实现在利用机器翻译便捷性高的基础上,结合人工翻译准确性高的优点,提高翻译设备翻译的准确性。

进一步的,在本实施例中,步骤S30之后,还包括:

将所述翻译原文信息、所述第一译文信息和所述第二译文信息关联形成第一语料信息,并将所述第一语料信息添加至语言资产信息,所述语言资产信息包括所述第一语料信息和当前时刻之前获得的语料信息;

根据所述语言资产信息训练所述预设翻译模型。

第一语料信息为当前基于翻译完成后的翻译原文信息、第一译文信息和第二译文信息关联生成的语料,即语言材料,可用于语言学研究,在本实施例中,通过第一语料信息可以确定翻译的原文信息以及基于该原文翻译获得的译文信息,因此第一语料信息可作为参考数据提供给预设翻译模型学习。

语言资产信息为第一语料信息和当前时刻之前获得的语料信息集合组成的信息,每当一次翻译完成,该次获得的语料信息将被添加至语言资产信息,因此语言资产信息包括翻译设备当前时刻之前所翻译获得的所有语料信息。

可选地,在当前翻译完成输出第二译文信息后,将当次翻译的翻译原文信息、第一译文信息和第二译文信息关联生成当次翻译的第一语料信息,将该第一语料信息添加至预先已经存储的语言资产信息中,将更新后的语言资产信息作为预设翻译模型的训练材料,并且随着语言资产信息的不断更新进行持续的训练。

通过将翻译原文信息、第一译文信息和第二译文信息关联为第一语料信息,继而将第一语料信息添加至语言资产信息,并根据语言资产信息训练预设翻译模型,使每次翻译都作为预设翻译模型的训练材料,并且使人工参与修正的第二译文信息也作为训练材料,使预设翻译模型的翻译准确性能够迭代提高,提高翻译设备翻译的准确性。

进一步的,基于上述实施例,提出本申请基于神经机器翻译的人机协同翻译方法另一实施例。在本实施例中,参考图3,所述输出所述第一译文信息和所述翻译原文信息的步骤包括:

步骤S21,确定所述翻译原文信息和所述第一译文信息对应的翻译任务;

翻译任务为针对该翻译原文信息和第一译文信息的翻译任务,确定对应的翻译任务有利于在人工修正时利用翻译任务进行管理和分派。

步骤S22,匹配所述翻译任务对应的目标客户端;

客户端为翻译用户所操作的客户端,翻译用户可通过操作客户端进行人工修正并输入人工修正的信息,而目标客户端则为承接该翻译任务的客户端。客户端的信息可在翻译设备处有记录和存储,便于翻译设备进行匹配确定承接翻译任务的目标客户端。

此外,客户端的选择可以是在预设范围内的客户端,例如,为具备翻译能力的第三方翻译机构提供客户端。

步骤S23,将所述翻译原文信息和所述第一译文信息发送至所述目标客户端;

可选地,匹配翻译任务对应的目标客户端后,将翻译原文信息和第一译文信息发送至目标客户端,以使目标客户端输出翻译原文信息和第一译文信息。目标客户端的翻译用户则可通过操作目标客户端输入对应的人工修正信息,从而实现对第一译文信息的人工修正。

步骤S31,接收所述目标客户端反馈的所述人工修正信息。

可选地,翻译用户在目标客户端上针对第一译文信息修正完成后,反馈对应的人工修正信息至翻译设备,翻译设备接收该人工修正信息,从而完成人工修正。

通过匹配目标客户端处理翻译任务,将翻译原文信息和第一译文信息发送至目标客户端以接收翻译用户修正后反馈的人工修正信息,实现翻译任务的灵活分配,增加人工修正信息的来源选择空间,提高人工修正信息的准确性,从而提高翻译准确性。

进一步的,在本实施例中,步骤S22包括:

根据所述翻译原文信息生成原文特征信息;

确定与所述原文特征信息匹配的用户特征信息,并确定所述用户特征信息的对应客户端为所述目标客户端。

原文特征信息为表征该翻译原文信息的特征的信息,例如包括语种、技术领域和/或原文规模。示例性的,若该翻译原文信息为葡萄牙语化学领域的论文,则原文特征信息可以包括“葡萄牙语”、“化学”、“论文”,从而确定翻译原文信息的特征。

用户特征信息为表征客户端对应翻译用户的特征的信息,由于客户端一般提供给固定的翻译用户使用,与客户端关联的用户特征信息可表征对应翻译用户的特征。示例性的,用户特征信息可以包括该翻译用户的擅长的领域(对应上述示例“化学”)、擅长的语言(对应上述示例“葡萄牙语”)以及可以接受的翻译原文规模(对应上述示例“论文”)。

可选地,匹配目标客户端时,根据翻译原文信息生成原文特征信息,确定原文的特征,继而确定可与根据原文特征信息匹配的用户特征信息,表征该用户特征信息对应客户端的翻译用户能够满足翻译该翻译原文信息的要求,从而确定对应客户端为目标客户端。

通过根据翻译原文信息生成的原文特征信息匹配用户特征信息,继而确定对应的目标客户端,可以针对原文的翻译需求匹配满足条件的翻译用户提供人工修正,提高人工修正信息的准确性,提高翻译准确性。

进一步的,在本实施例中,步骤S23之后,还包括:

当接收到所述目标客户端反馈的关键文本信息时,从所述目标客户端对应的客户端语言资产信息中确定与所述关键文本信息匹配的历史译文信息;

将所述历史译文信息发送至所述目标客户端,以使所述目标客户端将所述历史译文信息和所述关键文本信息关联输出;

所述客户端语言资产信息包括所述目标客户端多个第二语料信息,所述第二语料信息包括对应时刻的翻译原文和第二译文信息关联形成的信息。

需要说明的是,第二语料信息区别于第一语料信息,是与目标客户端相关联的语料信息,因此第二语料信息基于翻译原文和第二译文信息关联形成。

客户端语言资产信息为目标客户端的第二语料信息集合组成的信息,每当一次翻译完成,该次翻译的第二语料信息将被添加至目标客户端的客户端语言资产信息,因此客户端语言资产信息包括目标客户端当前时刻之前所反馈获得的所有第二语料信息。并且由于客户端语言资产信息和目标客户端有关联关系,不同的目标客户端记录有对应不同的客户端语言资产信息。

可选地,翻译用户在目标客户端进行人工修正时,针对翻译用户认为的关键文本,可以将其选定并反馈关键文本信息至翻译设备,翻译设备接收到该关键文本信息后,从目标客户端的对应客户端语言资产信息中确定与关键文本信息匹配的历史译文信息,即从该翻译用户之前翻译的译文信息中查找与关键文本信息匹配的可作为参考的历史译文信息。确定历史译文信息后,将历史译文信息发送至目标客户端,并与关键文本信息关联输出,从而为目标客户端的翻译用户提供参考。

通过客户端语言资产信息,可以提供作为当前翻译关键文本信息的参考的历史译文信息,为翻译用户的翻译工作提供支持,减少目标客户端翻译用户的翻译工作,并提高人工修正信息和第二译文信息的准确性。

进一步的,基于上述实施例,提出本申请基于神经机器翻译的人机协同翻译方法又一实施例。在本实施例中,参考图4,所述接收所述第一译文信息对应的人工修正信息,根据所述人工修正信息修正所述第一译文信息,获得第二译文信息的步骤包括:

步骤S32,接收所述第一译文信息对应的至少两个所述人工修正信息,不同所述人工修正信息由不同目标客户端反馈;

可选地,反馈人工修正信息的目标客户端大于一个,即由不同的目标客户端分别对第一译文信息进行人工修正,并分别进行反馈,继而翻译设备分别从不同目标客户端处接收对应的人工修正信息,从而获得至少两个由不同翻译用户作出的人工修正信息。

步骤S33,根据每个所述人工修正信息修正所述第一译文信息,获得至少两个第三译文信息,所述第二译文信息包括所述至少两个第三译文信息。

可选地,翻译设备从不同目标客户端处获得对应至少两个人工修正信息的反馈后,根据每个人工修正信息对第一译文信息进行修正,对应获得至少两个第三译文信息,即最终翻译结果的第二译文信息包括至少两个第三译文信息;在完成翻译后,输出第三译文信息。

通过接收不同目标客户端反馈的至少两个人工修正信息,并对应修正获得至少两个第三译文信息,可输出基于不同翻译用户作出修正后的译文,为用户提供不同的译文,从而提供对译文进行比对和选择的空间,提高翻译的用户体验。

进一步的,在本实施例中,所述接收所述第一译文信息对应的人工修正信息的步骤之后,还包括:

根据所述人工修正信息确定翻译效果评级,所述翻译效果评级表征所述预设翻译模型翻译获得的所述第一译文信息的翻译准确度;

确定所述翻译原文信息对应的原文类型标识;

更新所述原文类型标识对应的翻译效果评级。

翻译效果评级是针对预设翻译模型翻译获得的第一译文信息的翻译准确度评级,翻译效果评级的设置是可以是百分制评级、十分制评级或字母评级,在本实施例中不作限定。根据人工修正信息确定翻译效果评级的方法可以是根据人工修正信息中修订的字符占比确定,也可根据修订痕迹数量确定,在本实施例中不作限定。例如,人工修正信息中修订的字符占比为20%时,确定翻译效果评级为B评级。

原文类型标识是根据翻译原文信息的特征确定的标识,特征包括翻译原文信息的语种、领域和/或原文规模,此外也可包括其他类型特征。多个类型的特征结合后有对应的原文类型标识,示例性的,葡萄牙语化学领域论文的原文类型标识为101,意大利语化学领域研究报告的原文类型标识为304。

可选地,翻译设备接收到反馈的人工修正信息后,根据人工修正信息确定翻译效果评级,从而确定目前预设翻译模型针对该类型的翻译原文信息的翻译准确度;继而根据翻译原文信息确定原文类型标识,更新该原文类型标识对应的翻译效果评级。

通过根据人工修正信息确定翻译效果评级,将翻译效果评级与对应翻译原文信息的原文类型标识关联并在接收到人工修正信息后更新,可以在机器翻译后更新预设翻译模型针对该类型的翻译原文信息的翻译效果评级,为当前预设翻译模型针对该类型的翻译原文信息的翻译准确度提供一个直观的评级参考,提高用户的翻译体验。

进一步的,在本实施例中,步骤S22包括:

根据所述翻译效果评级确定所述目标客户端的目标数量;

匹配所述目标数量对应的用于完成所述翻译任务的所述目标客户端。

可选地,在匹配目标客户端对第一译文信息作出修正时,可以先确定当前翻译原文信息对应的翻译效果评级,从而确定当前预设翻译模型针对该翻译原文信息的翻译准确度,即确定第一译文信息的翻译准确度。根据其翻译效果评级确定所匹配的目标客户端的数量,示例性的,当翻译效果评级为C时目标数量为5,翻译效果评级为A时目标数量为2,其中评级A的翻译准确度高于评级C。

通过根据翻译效果评级确定匹配的目标客户端的目标数量,可以根据当前机器翻译的翻译准确度调整人工修正的翻译用户数量,以在机器翻译的翻译准确度不同时适配对应目标数量目标客户端以反馈人工修正信息,从而提高第二译文信息的翻译效果,提高翻译的准确性。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于神经机器翻译的人机协同翻译程序,所述基于神经机器翻译的人机协同翻译程序被处理器执行时实现如上基于神经机器翻译的人机协同翻译方法任一实施例的相关步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 限定性神经网络机器翻译方法及存储介质
  • 机器翻译方法、装置及可读存储介质
  • 基于分层码标的无人机降落方法、装置、设备以及可读存储介质
  • 基于神经网络的联邦建模方法、设备及可读存储介质
  • 基于神经网络机器翻译的术语翻译方法、存储介质和装置
  • 机器翻译方法和机器翻译训练方法、电子设备和存储介质
技术分类

06120115613930