掌桥专利:专业的专利平台
掌桥专利
首页

翻译文本一致性校验方法、计算设备及存储介质

文献发布时间:2023-06-19 10:05:17


翻译文本一致性校验方法、计算设备及存储介质

技术领域

本发明涉及数据处理技术领域,具体涉及一种翻译文本一致性校验方法、计算设备及存储介质。

背景技术

电子书形式的书籍由于具有获取方便等优势,受到了大量人们的喜爱。对于有些书籍,还需要将文本内容翻译成外文版本进行发布,以便了解外文的用户进行书籍阅读。其中,针对一本书籍的翻译,尤其是文本内容较多的书籍,为了能够较快地完成整本书籍的翻译,很可能会将整本书籍的文本内容划分成多个翻译任务并分配给不同的用户进行翻译,也就是说,一本书籍的翻译任务是由不同用户承揽的。同一词语很可能会出现在同一书籍的不同位置,例如不同章节或不同段落等,而不同用户对同一词语的翻译结果可能存在差异性,导致同一词语在同一书籍中的翻译结果不一致,翻译质量较差,不便于用户阅读。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的翻译文本一致性校验方法、计算设备及存储介质。

根据本发明的一个方面,提供了一种翻译文本一致性校验方法,该方法包括:

获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语;

在数据库中查找待检测词语对应的目标词语译文;

判断翻译文本内容中是否包含有目标词语译文;

若否,则生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

根据本发明的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;

存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:

获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语;

在数据库中查找待检测词语对应的目标词语译文;

判断翻译文本内容中是否包含有目标词语译文;

若否,则生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

根据本发明实施例的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述翻译文本一致性校验方法对应的操作。

根据本发明提供的技术方案,获取待校验的原文本内容和翻译文本内容,并确定出原文本内容中的待检测词语以及待检测词语在数据库中对应的目标词语译文,通过判断原文本内容是否包含有目标词语译文的方式来确定用户对待检测词语的翻译是否正确,若用户对待检测词语的翻译存在偏差,则能够自动生成并呈现包含有目标词语译文的修正提示信息,以供用户根据修正提示信息能够方便地对翻译文本内容进行编辑修正,有效地保证了同一待检测词语在同一书籍中的翻译的一致性,有效地提高了翻译质量,便于用户阅读。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明实施例一的一种翻译文本一致性校验方法的流程示意图;

图2a示出了根据本发明实施例二的一种翻译文本一致性校验方法的流程示意图;

图2b示出了一种翻译界面的示意图;

图3示出了根据本发明实施例四的一种计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

在实际应用场景中,对于一些电子书服务运营商来说,具有将书籍翻译成不同语言版本的需求,例如需要将中文书籍制作成英文版本,发布到线上供英文用户阅读。在这种场景下,可以面向用户发布翻译任务,由用户来承揽翻译任务,承接翻译任务的用户在基于本发明方法实现的翻译工具中完成翻译工作。其中,一本书籍的翻译任务可由不同的用户进行承揽,例如用户可按照书籍的章节承揽翻译任务,即一本书籍的不同章节可由不同用户进行承揽。考虑到同一词语很可能会出现在书籍的多个位置,而不同用户对同一词语的翻译结果存在一定的差异性,本发明提供了一种翻译文本一致性校验方法,有效地消除了翻译结果的差异性,以保证同一待检测词语在同一书籍中的翻译的一致性,有效地提高了翻译质量,便于用户阅读。下面通过具体的实施例对本发明进行介绍。

实施例一

图1示出了根据本发明实施例一的一种翻译文本一致性校验方法的流程示意图,如图1所示,该方法包括如下步骤:

步骤S101,获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语。

本实施例提供了翻译界面,用户可在翻译界面中进行翻译操作。在用户完成翻译后可对翻译得到的翻译文本内容进行提交,那么在步骤S101中可从书籍的资源文件(例如TXT文件等)中获取用户翻译所针对的原文本内容作为待校验的原文本内容,获取用户提交的翻译文本内容作为待校验的翻译文本内容。其中,资源文件可以是从书籍库或者云端等处获取的。

在获取了待校验的原文本内容之后,可对原文本内容中所包含的各个词语进行分析,从而确定出原文本内容中所包含的待检测词语。具体地,待检测词语可以包括:例如人名、地名、物品名称等命名实体词语,还可以包括在对应书籍中出现的词频超过预设阈值的指定词性的词语。本领域技术人员可根据实际需要对指定词性进行设置,例如指定词性可包括名词、动词、形容词等。

步骤S102,在数据库中查找待检测词语对应的目标词语译文。

在确定出原文本内容中所包含的待检测词语之后,可在数据库中查找待检测词语对应的目标词语译文。其中,数据库可包括预先建立的关键词库和预设翻译工具对应的翻译数据库。关键词库中记录有各个命名实体词语对应的词语译文,还可记录有指定词性的各个词语对应的词语译文。具体地,可优先在关键词库中查找待检测词语对应的词语译文,若在关键词库中未查找到待检测词语对应的词语译文,则再在预设翻译工具对应的翻译数据库中进行查找,从而确定出待检测词语对应的目标词语译文。

步骤S103,判断翻译文本内容中是否包含有目标词语译文;若是,则执行步骤S104;若否,则执行步骤S105。

考虑到不同语言的语法结构可能不同,在将原文本内容翻译成翻译文本内容之后,待检测词语在原文本内容中的位置和待检测词语对应的词语译文在翻译文本内容中的位置可能并不完全一致,导致很难通过位置匹配的方式在翻译文本内容中精准查找出待检测词语对应的词语译文,因此在本实施例中采用模糊检测方式,只要翻译文本内容中包含有步骤S102所确定的待检测词语对应的目标词语译文,则可认为用户对待检测词语的翻译正确。具体地,可判断翻译文本内容中是否包含有目标词语译文;若是,则执行步骤S104;若否,则执行步骤S105。

步骤S104,将翻译文本内容作为目标翻译文本内容。

在经步骤S103判断得到翻译文本内容中包含有目标词语译文的情况下,那么可认为用户对待检测词语的翻译正确,则将翻译文本内容作为目标翻译文本内容,目标翻译文本内容是指最终确定的翻译文本内容。

步骤S105,生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

在经步骤S103判断得到翻译文本内容中不包含有目标词语译文的情况下,那么可认为用户对待检测词语的翻译存在偏差,需要对翻译文本内容进行编辑修正,在步骤S105中可生成包含有目标词语译文的修正提示信息,并在翻译界面中呈现修正提示信息,以供用户能够方便地根据修正提示信息对翻译文本内容进行编辑修正。本领域技术人员可根据实际需要对修正提示信息的具体内容进行设置,此处不做限定。

利用本实施例提供的翻译文本一致性校验方法,获取待校验的原文本内容和翻译文本内容,并确定出原文本内容中的待检测词语以及待检测词语在数据库中对应的目标词语译文,通过判断原文本内容是否包含有目标词语译文的方式来确定用户对待检测词语的翻译是否正确,若用户对待检测词语的翻译存在偏差,则能够自动生成并呈现包含有目标词语译文的修正提示信息,以供用户根据修正提示信息能够方便地对翻译文本内容进行编辑修正,有效地消除了翻译结果的差异性,有效地保证了同一待检测词语在同一书籍中的翻译的一致性,有效地提高了翻译质量,便于用户阅读。

实施例二

图2a示出了根据本发明实施例二的一种翻译文本一致性校验方法的流程示意图,如图2a所示,该方法包括如下步骤:

步骤S201,获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语。

为了便于用户进行翻译,本实施例提供了一种翻译界面,用户可在翻译界面中进行翻译操作。图2b示出了一种翻译界面的示意图,如图2b所示,翻译界面包括第一区域、第二区域、第三区域以及第四区域。其中,将用户所承揽的翻译任务所属的书籍称为指定书籍,用户可承揽指定书籍的至少一个章节的翻译任务。该实施例中是将中文书籍的文本内容翻译为英文,其中,“X”表示中文字符,“*”表示英文字符。具体地,第一区域用于显示用户所承揽的指定书籍的至少一个章节对应的至少一个章节标签元素,章节标签元素可包括章节的序号、标题等相关信息,以便用户查看,如图2b中第一区域内显示了第1章到第10章的各个章节标签元素,其中“第1章XXX”中的“第1章”是章节的序号,“XXX”是章节的标题。用户可通过触发任一章节标签元素来在第二区域中显示该任一章节标签元素对应的各个文本块的原文本内容。

为了便于用户进行翻译,可按照段落或者句子等维度对章节标签元素对应的原文本内容进行文本块划分,得到多个文本块并确定各个文本块的序号标签,以文本块作为最小的翻译单元,有助于提升翻译的准确性和效率。第二区域用于显示任一章节标签元素对应的各个文本块的原文本内容,以供用户在翻译过程中进行对照参考,其中,原文本内容可以是通过指定书籍的资源文件得到的,例如TXT文件等,资源文件可以是从书籍库或者云端等处获取的。如图2b所示,第二区域中表格第一行内的显示内容包括:序号标签1以及序号标签1对应的文本块,表格第二行内的显示内容包括:序号标签2以及序号标签2对应的文本块……。

第三区域和第四区域用于显示各个文本块对应的初始翻译文本内容,各个文本块对应的初始翻译文本内容是通过将各个文本块分别输入至指定翻译工具中进行翻译处理得到的,以供用户翻译时进行参考,有助于提高用户翻译效率。本领域技术人员可根据实际需要对指定翻译工具进行选择,此处不做限定。例如指定翻译工具可为网络在线的翻译工具或者本地的翻译工具。其中,每个文本块的初始翻译文本可单独成行显示。如图2b所示,图2b中第三区域中表格第一行内的显示内容为:序号标签1对应的文本块的初始翻译文本内容,第二行内的显示内容为:序号标签2对应的文本块的初始翻译文本内容,其他的依此类推。

第四区域为翻译的编辑区域,初始化时,第四区域用于显示各个文本块对应的初始翻译文本内容,与第三区域显示的初始翻译文本内容相同,用户可对第四区域内显示的初始翻译文本内容进行增删改等编辑处理,形成经编辑处理的翻译文本内容,并且将经编辑处理的翻译文本内容更新显示在第四区域内,即第四区域还用于显示对初始翻译文本内容经编辑处理的翻译文本内容。若用户认为某个文本块对应的初始翻译文本内容已经翻译的比较准确,无需修改,那么可不对该初始翻译文本内容进行编辑处理。

在用户完成对若干个文本块的翻译后,可通过对第四区域内的选择元素进行勾选等方式确定待提交的初始翻译文本内容或者经编辑处理的翻译文本内容,通过触发翻译界面中的“提交翻译”控件进行提交;或者,在翻译界面中还可针对每个文本块在第四区域内设置对应的用于提交初始翻译文本内容或者经编辑处理的翻译文本内容的提交控件(图2b中未示出),通过触发提交控件将其对应的初始翻译文本内容或者经编辑处理的翻译文本内容进行提交。那么在步骤S201中,响应于用户执行的针对于至少一个文本块对应的初始翻译文本内容或者经编辑处理的翻译文本内容的提交操作,获取至少一个文本块的原文本内容作为待校验的原文本内容,获取至少一个文本块在第四区域内对应的初始翻译文本内容或者经编辑处理的翻译文本内容作为待校验的翻译文本内容。

在获取了待校验的原文本内容之后,需要对原文本内容中所包含的各个词语进行分析,从而确定出原文本内容中所包含的待检测词语。为了能够精准、快捷地确定出原文本内容中所包含的待检测词语,可在确定原文本内容中的待检测词语之前,预先建立指定书籍的待检测词语集合。其中,可将该指定书籍中的例如人名、地名、物品名称等命名实体词语作为待检测词语添加至待检测词语集合中,还可将该指定书籍中出现的词频超过预设阈值的指定词性的词语作为待检测词语添加至待检测词语集合中。具体地,调取指定书籍的资源文件,从资源文件中获取指定书籍的文本内容,对文本内容进行切词得到第二词语集合,在第二词语集合中查找命名实体词语和/或词频超过预设阈值的指定词性的词语,建立包含有多个待检测词语的待检测词语集合。

其中,可在第二词语集合中查找与命名实体词语库相匹配的词语,从而确定出第二词语集合中所包括的命名实体词语,并将确定出的命名实体词语作为待检测词语添加至待检测词语集合中。本领域技术人员可根据实际需要对预设阈值和指定词性进行设置,此处不做限定。例如,可将预设阈值设置为10,将指定词性设置为包括名词、动词和形容词,那么统计第二词语集合中的各个词语在该指定书籍中出现的词频,对于词频超过10的词语进行词性识别,并从中查找词性为名词的词语、词性为动词的词语以及词性为形容词的词语,将查找到的词语作为待检测词语添加至待检测词语集合中;或者,也可对于词频超过10的词语进行词性识别,并从中去除掉副词、介词等词性的词语,将剩余的名词词性的词语、动词词性的词语以及形容词词性的词语作为待检测词语添加至待检测词语集合中。

在完成了指定书籍的待检测词语集合的建立后,对原文本内容进行切词得到第一词语集合,接着在第一词语集合中查找与预先建立的待检测词语集合相匹配的词语,得到原文本内容中的待检测词语,也就是说,将查找到的相匹配的词语作为原文本内容中的待检测词语。

步骤S202,在数据库中查找待检测词语对应的目标词语译文。

数据库包括预先建立的关键词库和预设翻译工具对应的翻译数据库,关键词库中记录有各个命名实体词语对应的词语译文,还可记录有指定词性的各个词语对应的词语译文。具体地,在关键词库中查找是否包含有待检测词语对应的词语译文;若在关键词库中能够查找到待检测词语对应的词语译文,则将查找到的词语译文作为待检测词语对应的目标词语译文;若在关键词库中未查找到待检测词语对应的词语译文,则利用至少两个预设翻译工具在对应的翻译数据库中进行查找,即在至少两个翻译数据库中查找待检测词语对应的词语译文,将查找结果中出现的词频较高的词语译文作为待检测词语对应的目标词语译文,也就是说,将重复度较高的词语译文作为待检测词语对应的目标词语译文。其中,至少两个预设翻译工具可为由不同翻译运营商运营管理的网络在线的翻译工具或者本地的翻译工具等。例如,在两个翻译数据库中查找某个待检测词语对应的词语译文,其中,第一个翻译数据库查找到的词语译文包括“译文1和译文2”,第二个翻译数据库查找到的词语译文包括“译文1、译文3和译文4”,那么译文1在这两个翻译数据库的查找结果中的词频为2,译文2、译文3和译文4在这两个翻译数据库的查找结果中的词频均为1,那么译文1的词频较高,说明译文1更为常用,那么将译文1作为该待检测词语对应的目标词语译文。

步骤S203,判断翻译文本内容中是否包含有目标词语译文;若是,则执行步骤S204;若否,则执行步骤S205。

在本实施例中采用模糊检测方式,只要翻译文本内容中包含有步骤S202所确定的待检测词语对应的目标词语译文,则可认为用户对待检测词语的翻译正确。具体地,可对翻译文本内容进行字符串匹配,判断翻译文本内容中是否包含有目标词语译文;若是,则执行步骤S204;若否,则执行步骤S205。

步骤S204,将翻译文本内容作为目标翻译文本内容。

步骤S205,生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

在经步骤S203判断得到翻译文本内容中不包含有目标词语译文的情况下,那么可认为用户对待检测词语的翻译存在偏差,需要对翻译文本内容进行编辑修正,在步骤S205中可生成包含有目标词语译文的修正提示信息,并在翻译界面中呈现修正提示信息,以供用户能够方便地根据修正提示信息对翻译文本内容进行编辑修正。以待检测词语为“上海”,待检测词语“上海”对应的目标词语译文为“Shanghai”为例,所生成的修正提示信息的具体内容可为“词语“上海”正确的译文应为“Shanghai”,请对翻译文本内容中的相应内容进行修改”。

步骤S206,判断在预设时间段内是否接收到经编辑修正处理的翻译文本内容;若是,则执行步骤S207;若否,则执行步骤S210。

本领域技术人员可根据实际需要对预设时间段进行设置,例如可将预设时间段设置为5分钟等。

步骤S207,检测经编辑修正处理的翻译文本内容中是否包含有目标词语译文;若是,则执行步骤S208;若否,则执行步骤S209。

在接收到经编辑修正处理的翻译文本内容后,检测其是否包含有目标词语译文,实现了对翻译文本内容的二次校验,有效地保证了翻译文本的一致性。

步骤S208,将经编辑修正处理的翻译文本内容作为目标翻译文本内容。

在经步骤S207检测得到经编辑修正处理的翻译文本内容中包含有目标词语译文的情况下,那么可认为用户在编辑修正后对待检测词语的翻译正确,则将经编辑修正处理的翻译文本内容作为目标翻译文本内容。

步骤S209,在经编辑修正处理的翻译文本内容中查找待检测词语对应的词语译文,并将词语译文替换为目标词语译文,得到目标翻译文本内容。

在经步骤S207检测得到经编辑修正处理的翻译文本内容中未包含有目标词语译文的情况下,那么可认为用户在编辑修正后对待检测词语的翻译仍然存在偏差,则可自动地将经编辑修正处理的翻译文本内容中对应于待检测词语的词语译文替换为目标词语译文。

在步骤S209中,可根据待检测词语在原文本内容中的所在行数、句数等位置信息,确定经编辑修正处理的翻译文本内容的检测范围,具体地,可根据待检测词语在原文本内容中的所在行数,在此行数的基础上,上下扩展N个冗余行,将扩展后的范围作为检测范围。例如,当将N设置为1时,若某个待检测词语在原文本内容中的所在行数为第2行,那么以第2行为基础,上下扩展1个冗余行,扩展后的范围为从经编辑修正处理的翻译文本内容的第1行至第3行的范围,将此范围作为检测范围。在确定了检测范围之后,在经编辑修正处理的翻译文本内容的检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合。当翻译文本内容为英文时,考虑到人名的词语译文通常具有首字母大写的特征,那么还可在检测范围中查找具有首字母大写特征的词语译文添加至第一译文集合中。

为了能够精准地从检测范围中查找出对应于待检测词语的词语译文,还需从数据库中获取待检测词语对应的所有词语译文,得到第二译文集合,例如可从预先建立的关键词库和预设翻译工具对应的翻译数据库中获取待检测词语对应的所有词语译文,以获取尽可能多的词语译文,形成第二译文集合。然后在第一译文集合中查找与第二译文集合相匹配的词语译文,将相匹配的词语译文作为在经编辑修正处理的翻译文本内容中待检测词语对应的词语译文,并将该词语译文替换为目标词语译文,得到目标翻译文本内容。

步骤S210,在翻译文本内容中查找待检测词语对应的词语译文,并将词语译文替换为目标词语译文,得到目标翻译文本内容。

若在预设时间段内没有接收到经编辑修正处理的翻译文本内容,则在翻译文本内容中查找待检测词语对应的词语译文,并自动将词语译文替换为目标词语译文。具体地,根据待检测词语在原文本内容中的位置信息,确定翻译文本内容的检测范围,并在检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合;从数据库中获取待检测词语对应的所有词语译文,得到第二译文集合;在第一译文集合中查找与第二译文集合相匹配的词语译文,将相匹配的词语译文作为在翻译文本内容中待检测词语对应的词语译文。这种在翻译文本内容中查找待检测词语对应的词语译文的方式与在经编辑修正处理的翻译文本内容中查找待检测词语对应的词语译文的方式相同,此处不再赘述。

可选地,本实施例还提供了全文翻译搜索功能,翻译界面还包括搜索入口。若用户在对某个文本块进行翻译的过程中,对于某个词语的翻译不能够准确地把握,可以通过全文翻译搜索功能,查看其它用户在其对应的承揽章节中对该词语的翻译结果,用于参考。具体地,用户可在搜索入口中输入搜索词语,通过触发来生成翻译搜索请求,那么响应于通过搜索入口触发的携带有搜索词语的翻译搜索请求,利用该搜索词语,在指定书籍的至少一个章节对应的目标翻译文本内容中查找搜索词语对应的词语译文,生成包含有查找到的词语译文的翻译搜索结果,然后在翻译界面中呈现翻译搜索结果。可选地,翻译搜索结果可通过弹窗页面进行呈现。

利用本实施例提供的翻译文本一致性校验方法,提供了一种包括有四个区域的翻译界面,方便用户对照着原文本内容和初始翻译文本内容进行翻译,有效地提高了翻译效率和翻译准确度;并且还会对用户所完成翻译的文本块对应的原文本内容和翻译文本内容进行校验,通过查询关键词库和翻译数据库,能够精准地确定原文本内容中的待检测词语对应的目标词语译文,通过判断原文本内容是否包含有目标词语译文的方式来确定用户对待检测词语的翻译是否正确,若用户对待检测词语的翻译存在偏差,则能够自动生成并呈现包含有目标词语译文的修正提示信息,以供用户根据修正提示信息能够方便地对翻译文本内容进行编辑修正;若用户没有对翻译文本内容进行编辑修正或者在编辑修正后对待检测词语的翻译仍然存在偏差,可自动地将翻译文本内容中对应于待检测词语的词语译文替换为目标词语译文,有效地保证了同一待检测词语在同一书籍的各个章节中的翻译的一致性,有效地提高了翻译质量,便于用户阅读;另外,还提供了全文翻译搜索功能,使得用户通过搜索查看其它用户在其对应的承揽章节中对词语的翻译结果,用于参考,从而进一步提高了翻译效率和翻译准确度,便于用户翻译。

实施例三

本发明实施例三提供了一种非易失性存储介质,存储介质存储有至少一可执行指令,该可执行指令可执行上述任意方法实施例中的翻译文本一致性校验方法。

可执行指令具体可以用于使得处理器执行以下操作:获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语;在数据库中查找待检测词语对应的目标词语译文;判断翻译文本内容中是否包含有目标词语译文;若否,则生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:对原文本内容进行切词得到第一词语集合,在第一词语集合中查找与预先建立的待检测词语集合相匹配的词语,得到原文本内容中的待检测词语。

在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:获取指定书籍的文本内容,对文本内容进行切词得到第二词语集合;在第二词语集合中查找命名实体词语和/或词频超过预设阈值的指定词性的词语,建立包含有多个待检测词语的待检测词语集合。

在一种可选的实施方式中,数据库包括预先建立的关键词库和预设翻译工具对应的翻译数据库;可执行指令进一步使处理器执行以下操作:在关键词库中查找是否包含有待检测词语对应的词语译文;若是,则将查找到的词语译文作为待检测词语对应的目标词语译文;若否,则在至少两个翻译数据库中查找待检测词语对应的词语译文,将词频较高的词语译文作为待检测词语对应的目标词语译文。

在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:判断在预设时间段内是否接收到经编辑修正处理的翻译文本内容;若否,则在翻译文本内容中查找待检测词语对应的词语译文,并将词语译文替换为目标词语译文,得到目标翻译文本内容。

在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:根据待检测词语在原文本内容中的位置信息,确定翻译文本内容的检测范围,并在检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合;从数据库中获取待检测词语对应的所有词语译文,得到第二译文集合;在第一译文集合中查找与第二译文集合相匹配的词语译文,将相匹配的词语译文作为在翻译文本内容中待检测词语对应的词语译文。

在一种可选的实施方式中,翻译界面包括第一区域、第二区域、第三区域以及第四区域;其中,第一区域用于显示指定书籍的至少一个章节对应的至少一个章节标签元素,第二区域用于显示任一章节标签元素对应的各个文本块的原文本内容,第三区域用于显示各个文本块对应的初始翻译文本内容,第四区域用于显示各个文本块对应的初始翻译文本内容或者对初始翻译文本内容经编辑处理的翻译文本内容。

在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:响应于用户执行的针对于至少一个文本块对应的初始翻译文本内容或者经编辑处理的翻译文本内容的提交操作,获取至少一个文本块的原文本内容作为待校验的原文本内容,获取至少一个文本块在第四区域内对应的初始翻译文本内容或者经编辑处理的翻译文本内容作为待校验的翻译文本内容。

在一种可选的实施方式中,翻译界面还包括搜索入口;可执行指令进一步使处理器执行以下操作:响应于通过搜索入口触发的携带有搜索词语的翻译搜索请求,在指定书籍的至少一个章节对应的目标翻译文本内容中查找搜索词语对应的词语译文;生成包含有查找到的词语译文的翻译搜索结果,在翻译界面中呈现翻译搜索结果。

实施例四

图3示出了根据本发明实施例四的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。

如图3所示,该计算设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中:

处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。

通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器302,用于执行程序310,具体可以执行上述翻译文本一致性校验方法实施例中的相关步骤。

具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。

处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作:获取待校验的原文本内容和翻译文本内容,确定原文本内容中的待检测词语;在数据库中查找待检测词语对应的目标词语译文;判断翻译文本内容中是否包含有目标词语译文;若否,则生成包含有目标词语译文的修正提示信息,在翻译界面中呈现修正提示信息,以供用户根据修正提示信息对翻译文本内容进行编辑修正。

在一种可选的实施方式中,程序310进一步使得处理器302执行以下操作:对原文本内容进行切词得到第一词语集合,在第一词语集合中查找与预先建立的待检测词语集合相匹配的词语,得到原文本内容中的待检测词语。

在一种可选的实施方式中,程序310进一步使得处理器302执行以下操作:获取指定书籍的文本内容,对文本内容进行切词得到第二词语集合;在第二词语集合中查找命名实体词语和/或词频超过预设阈值的指定词性的词语,建立包含有多个待检测词语的待检测词语集合。

在一种可选的实施方式中,数据库包括预先建立的关键词库和预设翻译工具对应的翻译数据库;程序310进一步使得处理器302执行以下操作:在关键词库中查找是否包含有待检测词语对应的词语译文;若是,则将查找到的词语译文作为待检测词语对应的目标词语译文;若否,则在至少两个翻译数据库中查找待检测词语对应的词语译文,将词频较高的词语译文作为待检测词语对应的目标词语译文。

在一种可选的实施方式中,程序310进一步使得处理器302执行以下操作:判断在预设时间段内是否接收到经编辑修正处理的翻译文本内容;若否,则在翻译文本内容中查找待检测词语对应的词语译文,并将词语译文替换为目标词语译文,得到目标翻译文本内容。

在一种可选的实施方式中,程序310进一步使得处理器302执行以下操作:根据待检测词语在原文本内容中的位置信息,确定翻译文本内容的检测范围,并在检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合;从数据库中获取待检测词语对应的所有词语译文,得到第二译文集合;在第一译文集合中查找与第二译文集合相匹配的词语译文,将相匹配的词语译文作为在翻译文本内容中待检测词语对应的词语译文。

在一种可选的实施方式中,翻译界面包括第一区域、第二区域、第三区域以及第四区域;其中,第一区域用于显示指定书籍的至少一个章节对应的至少一个章节标签元素,第二区域用于显示任一章节标签元素对应的各个文本块的原文本内容,第三区域用于显示各个文本块对应的初始翻译文本内容,第四区域用于显示各个文本块对应的初始翻译文本内容或者对初始翻译文本内容经编辑处理的翻译文本内容。

在一种可选的实施方式中,程序310进一步使得处理器302执行以下操作:响应于用户执行的针对于至少一个文本块对应的初始翻译文本内容或者经编辑处理的翻译文本内容的提交操作,获取至少一个文本块的原文本内容作为待校验的原文本内容,获取至少一个文本块在第四区域内对应的初始翻译文本内容或者经编辑处理的翻译文本内容作为待校验的翻译文本内容。

在一种可选的实施方式中,翻译界面还包括搜索入口;程序310进一步使得处理器302执行以下操作:响应于通过搜索入口触发的携带有搜索词语的翻译搜索请求,在指定书籍的至少一个章节对应的目标翻译文本内容中查找搜索词语对应的词语译文;生成包含有查找到的词语译文的翻译搜索结果,在翻译界面中呈现翻译搜索结果。

程序310中各步骤的具体实现可以参见上述翻译文本一致性校验实施例中的相应步骤对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。

通过本实施例提供的方案,确定出原文本内容中的待检测词语以及待检测词语在数据库中对应的目标词语译文,通过判断原文本内容是否包含有目标词语译文的方式来确定用户对待检测词语的翻译是否正确,若用户对待检测词语的翻译存在偏差,则能够自动生成并呈现包含有目标词语译文的修正提示信息,以便提示用户进行编辑修正,有效地保证了同一待检测词语在同一书籍中的翻译的一致性,有效地提高了翻译质量,便于用户阅读。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明公开了:A1.一种翻译文本一致性校验方法,包括:

获取待校验的原文本内容和翻译文本内容,确定所述原文本内容中的待检测词语;

在数据库中查找所述待检测词语对应的目标词语译文;

判断所述翻译文本内容中是否包含有所述目标词语译文;

若否,则生成包含有所述目标词语译文的修正提示信息,在翻译界面中呈现所述修正提示信息,以供用户根据所述修正提示信息对所述翻译文本内容进行编辑修正。

A2.根据A1所述的方法,所述确定所述原文本内容中的待检测词语进一步包括:

对所述原文本内容进行切词得到第一词语集合,在所述第一词语集合中查找与预先建立的待检测词语集合相匹配的词语,得到所述原文本内容中的待检测词语。

A3.根据A2所述的方法,在所述确定所述原文本内容中的待检测词语之前,所述方法还包括:

获取指定书籍的文本内容,对所述文本内容进行切词得到第二词语集合;

在所述第二词语集合中查找命名实体词语和/或词频超过预设阈值的指定词性的词语,建立包含有多个待检测词语的待检测词语集合。

A4.根据A1-A3任一项所述的方法,所述数据库包括预先建立的关键词库和预设翻译工具对应的翻译数据库;所述在数据库中查找所述待检测词语对应的目标词语译文进一步包括:

在所述关键词库中查找是否包含有所述待检测词语对应的词语译文;

若是,则将查找到的词语译文作为所述待检测词语对应的目标词语译文;

若否,则在至少两个翻译数据库中查找所述待检测词语对应的词语译文,将词频较高的词语译文作为所述待检测词语对应的目标词语译文。

A5.根据A1-A4任一项所述的方法,所述方法还包括:

判断在预设时间段内是否接收到经编辑修正处理的翻译文本内容;

若否,则在所述翻译文本内容中查找所述待检测词语对应的词语译文,并将所述词语译文替换为所述目标词语译文,得到目标翻译文本内容。

A6.根据A5所述的方法,所述在所述翻译文本内容中查找所述待检测词语对应的词语译文进一步包括:

根据所述待检测词语在所述原文本内容中的位置信息,确定所述翻译文本内容的检测范围,并在所述检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合;

从数据库中获取所述待检测词语对应的所有词语译文,得到第二译文集合;

在所述第一译文集合中查找与所述第二译文集合相匹配的词语译文,将相匹配的词语译文作为在所述翻译文本内容中所述待检测词语对应的词语译文。

A7.根据A1-A6任一项所述的方法,所述翻译界面包括第一区域、第二区域、第三区域以及第四区域;其中,所述第一区域用于显示指定书籍的至少一个章节对应的至少一个章节标签元素,所述第二区域用于显示任一章节标签元素对应的各个文本块的原文本内容,所述第三区域用于显示各个文本块对应的初始翻译文本内容,所述第四区域用于显示各个文本块对应的初始翻译文本内容或者对所述初始翻译文本内容经编辑处理的翻译文本内容。

A8.根据A7所述的方法,所述获取待校验的原文本内容和翻译文本内容进一步包括:

响应于用户执行的针对于至少一个文本块对应的初始翻译文本内容或者经编辑处理的翻译文本内容的提交操作,获取至少一个文本块的原文本内容作为待校验的原文本内容,获取至少一个文本块在所述第四区域内对应的初始翻译文本内容或者经编辑处理的翻译文本内容作为待校验的翻译文本内容。

A9.根据A1-A8任一项所述的方法,所述翻译界面还包括搜索入口,所述方法还包括:

响应于通过所述搜索入口触发的携带有搜索词语的翻译搜索请求,在指定书籍的至少一个章节对应的目标翻译文本内容中查找所述搜索词语对应的词语译文;

生成包含有查找到的词语译文的翻译搜索结果,在翻译界面中呈现所述翻译搜索结果。

本发明还公开了:B10.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:

获取待校验的原文本内容和翻译文本内容,确定所述原文本内容中的待检测词语;

在数据库中查找所述待检测词语对应的目标词语译文;

判断所述翻译文本内容中是否包含有所述目标词语译文;

若否,则生成包含有所述目标词语译文的修正提示信息,在翻译界面中呈现所述修正提示信息,以供用户根据所述修正提示信息对所述翻译文本内容进行编辑修正。

B11.根据B10所述的计算设备,所述可执行指令进一步使所述处理器执行以下操作:

对所述原文本内容进行切词得到第一词语集合,在所述第一词语集合中查找与预先建立的待检测词语集合相匹配的词语,得到所述原文本内容中的待检测词语。

B12.根据B11所述的计算设备,所述可执行指令进一步使所述处理器执行以下操作:

获取指定书籍的文本内容,对所述文本内容进行切词得到第二词语集合;

在所述第二词语集合中查找命名实体词语和/或词频超过预设阈值的指定词性的词语,建立包含有多个待检测词语的待检测词语集合。

B13.根据B10-B12任一项所述的计算设备,所述数据库包括预先建立的关键词库和预设翻译工具对应的翻译数据库;所述可执行指令进一步使所述处理器执行以下操作:

在所述关键词库中查找是否包含有所述待检测词语对应的词语译文;

若是,则将查找到的词语译文作为所述待检测词语对应的目标词语译文;

若否,则在至少两个翻译数据库中查找所述待检测词语对应的词语译文,将词频较高的词语译文作为所述待检测词语对应的目标词语译文。

B14.根据B10-B13任一项所述的计算设备,所述可执行指令进一步使所述处理器执行以下操作:

判断在预设时间段内是否接收到经编辑修正处理的翻译文本内容;

若否,则在所述翻译文本内容中查找所述待检测词语对应的词语译文,并将所述词语译文替换为所述目标词语译文,得到目标翻译文本内容。

B15.根据B14所述的计算设备,所述可执行指令进一步使所述处理器执行以下操作:

根据所述待检测词语在所述原文本内容中的位置信息,确定所述翻译文本内容的检测范围,并在所述检测范围中查找命名实体词语译文和/或指定词性的词语译文,得到第一译文集合;

从数据库中获取所述待检测词语对应的所有词语译文,得到第二译文集合;

在所述第一译文集合中查找与所述第二译文集合相匹配的词语译文,将相匹配的词语译文作为在所述翻译文本内容中所述待检测词语对应的词语译文。

B16.根据B10-B15任一项所述的计算设备,所述翻译界面包括第一区域、第二区域、第三区域以及第四区域;其中,所述第一区域用于显示指定书籍的至少一个章节对应的至少一个章节标签元素,所述第二区域用于显示任一章节标签元素对应的各个文本块的原文本内容,所述第三区域用于显示各个文本块对应的初始翻译文本内容,所述第四区域用于显示各个文本块对应的初始翻译文本内容或者对所述初始翻译文本内容经编辑处理的翻译文本内容。

B17.根据B16所述的计算设备,所述可执行指令进一步使所述处理器执行以下操作:

响应于用户执行的针对于至少一个文本块对应的初始翻译文本内容或者经编辑处理的翻译文本内容的提交操作,获取至少一个文本块的原文本内容作为待校验的原文本内容,获取至少一个文本块在所述第四区域内对应的初始翻译文本内容或者经编辑处理的翻译文本内容作为待校验的翻译文本内容。

B18.根据B10-B17任一项所述的计算设备,所述翻译界面还包括搜索入口;所述可执行指令进一步使所述处理器执行以下操作:

响应于通过所述搜索入口触发的携带有搜索词语的翻译搜索请求,在指定书籍的至少一个章节对应的目标翻译文本内容中查找所述搜索词语对应的词语译文;

生成包含有查找到的词语译文的翻译搜索结果,在翻译界面中呈现所述翻译搜索结果。

本发明还公开了:C19.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A9中任一项所述的翻译文本一致性校验方法对应的操作。

相关技术
  • 翻译文本一致性校验方法、计算设备及存储介质
  • 基于相似词的文本翻译方法、计算设备及计算机存储介质
技术分类

06120112409621