掌桥专利:专业的专利平台
掌桥专利
首页

文本生成方法和装置

文献发布时间:2023-06-19 12:24:27


文本生成方法和装置

技术领域

本公开涉及文本处理领域,尤其涉及一种文本生成方法和装置。

背景技术

为了考察学生对古诗词的理解,老师会对古诗词设计一些题目。

其中一种题型是,对古诗词的任一句进行挖空,给出其余的诗词句作为题干,或者是给出挖空位置对应的上一句或者下一句作为题干,并设置多个选项,包括正确项和至少一个错误项。错误项中的诗词句跟正确项较为接近,使得学生在没有掌握原古诗词时可能会选中错误项,达到考察目的。

但是,错误项中的诗词句可能不是现有古诗词中的诗词句,因此需要老师耗费较多的精力和时间来编撰,并且老师的撰写能力有限,导致出题的效率较低。

发明内容

为了解决现有技术的问题,本公开实施例提供了一种文本生成方法和装置。技术方案如下:

根据本公开的一方面,提供了一种文本生成方法,所述方法包括:

获取目标文本,所述目标文本至少包括目标韵律信息和题干文本;

调用基于韵律信息构建的押韵文本生成模型,对所述目标文本进行处理,得到至少一个错误项文本,每个错误项文本在所述题干文本中符合所述目标韵律信息对应的韵律规则;

根据所述题干文本、所述至少一个错误项文本和所述题干文本的正确项文本,确定至少一个考察题目。

根据本公开的另一方面,提供了一种文本生成装置,所述装置包括:

获取模块,用于获取目标文本,所述目标文本至少包括目标韵律信息和题干文本;

处理模块,用于调用基于韵律信息构建的押韵文本生成模型,对所述目标文本进行处理,得到至少一个错误项文本,每个错误项文本在所述题干文本中符合所述目标韵律信息对应的韵律规则;

确定模块,用于根据所述题干文本、所述至少一个错误项文本和所述题干文本的正确项文本,确定至少一个考察题目。

根据本公开的另一方面,提供了一种电子设备,包括:

处理器;以及

存储程序的存储器,

其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述文本生成方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述文本生成方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现上述文本生成方法。

本公开实施例中,由于押韵文本生成模型基于韵律信息构建,终端在调用押韵文本生成模型生成错误项文本时,可以将目标韵律信息和题干文本作为模型的输入,输出得到错误项文本。由于模型的输入包括目标韵律信息,终端在模型处理的过程中可以利用该目标韵律信息,使得输出的错误项文本在题干文本中符合该目标韵律信息对应的韵律规则,满足韵律的要求。进而,终端可以根据题干文本、至少一个错误项文本和该题干文本对应的正确项文本,确定至少一个考察题目,提高出题的效率。

附图说明

在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:

图1示出了根据本公开示例性实施例的文本生成方法的流程图;

图2示出了根据本公开示例性实施例的知识库示意图;

图3示出了根据本公开示例性实施例的确定输入编码的流程图;

图4示出了根据本公开示例性实施例的模型结构示意图;

图5示出了根据本公开示例性实施例的模型结构示意图;

图6示出了根据本公开示例性实施例的模型处理示意图;

图7示出了根据本公开示例性实施例的确定综合得分的流程图;

图8示出了根据本公开示例性实施例的训练方法流程图;

图9示出了根据本公开示例性实施例的文本生成装置的示意性框图;

图10示出了根据本公开示例性实施例的文本生成装置的示意性框图;

图11示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。

应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。

本公开实施例提供了一种文本生成方法,该方法可以由终端、服务器和/或其他具备处理能力的设备完成。本公开实施例提供的方法可以由上述任一设备完成,也可以由多个设备共同完成,例如,终端获取到目标文本后传输到服务器,服务器根据目标文本生成至少一个错误项文本,并将生成的错误项文本返回给终端,进而终端可以根据接收到的错误项文本,确定相应的考察题目,本公开对此不作限定。

本公开实施例以终端为例,下面将参照图1所示的文本生成方法的流程图,对文本生成的方法进行介绍。

步骤101,终端获取目标文本。

其中,目标文本至少包括目标韵律信息和题干文本。

韵律信息可以是韵母词汇,例如,单韵母a、o、e、i、u、v(即ü,为了便于编码,可以改写为v,下文同理),复韵母ai、ei、ui、ao、ou、iu、ie、ve、er、an、en、in、un、vn、ang、eng、ing、ong。和/或,韵律信息还可以是平仄信息,例如,平平仄仄平平仄。

题干文本可以是掩盖正确项文本后的诗词文本,例如,床前明月光,[MASK][MASK][MASK][MASK][MASK]。其中,[MASK]对应的诗句即为被掩盖的文本,也是本公开实施例提供的文本生成方法所要生成的文本。

在一种可能的实施方式中,在生成错误项文本之前,可以对待处理的目标文本进行确定。为了考察学生对古诗词的掌握程度,题干文本的来源可以是中小学生需要掌握的课内和课外的所有古诗词。

终端可以获取每一首古诗词对应的文本,对于每一首古诗词,依次对每句诗词进行掩盖,得到多个题干文本,例如,如果古诗有4句,则可以依次对每一句诗进行掩盖,得到4个题干文本。并且,终端还可以获取每一首古诗词的韵律信息,当韵律信息是韵母词汇时,该韵律信息可以是一首诗中每句最后一个字的韵母,例如,《静夜思》的韵律信息为angangveang。每首诗词的韵律信息表示其对应的韵律规则。

对于一个题干文本,终端可以将该题干文本和对应的韵律信息进行整合,得到一个目标文本。终端在对每个题干文本进行整合后,可以得到多个目标文本并进行存储,进而可以基于本公开实施例提供的文本生成方法,生成多个目标文本对应的错误项文本。

当触发生成错误项文本的任务时,终端可以获取当前待处理的一个目标文本,将待处理的目标文本中的韵律信息称为目标韵律信息。示例性的,待处理的目标文本可以为“angangveang \n床前明月光,[MASK] [MASK] [MASK] [MASK] [MASK]。举头望明月,低头思故乡。”其中,\n为换行符,用于划分韵律信息和题干文本。

可选的,目标文本还包括题干文本的关联文本。

其中,关联文本可以是以下一种或多种:作品名称、作者、作品别名、创作年代、作品出处、文学体裁、作品简介。关联文本还可以是与题干文本相关联的其他文本,可以用于描述题干文本,本实施例对此不作限定。

知识库是基于实体-属性构建的数据库,其中可以存储有上述题干文本的关联文本。

在一种可能的实施方式中,终端可以获取知识库中存储的题干文本所对应的关联文本。在上述确定目标文本的过程中,可以将该题干文本和对应的韵律信息、关联文本进行整合,得到一个目标文本。

示例性的,《静夜思》在知识库中的信息如图2所示的知识库示意图,终端可以将知识库中的信息添加到目标文本中,目标文本可以为“angangveang \n静夜思(李白诗作)\n作品简介:《静夜思》是唐代诗人李白所作的一首五言古诗。此诗描写了秋日夜晚,诗人于屋内抬头望月的所感。诗中运用比喻、衬托等手法,表达客居思乡之情,语言清新朴素而韵味含蓄无穷,历来广为传诵。\n作品名称:静夜思\n作品别名:夜思\n作者:李白\n创作年代:盛唐\n作品出处:《李太白集》\n文学体裁:五言古诗\n静夜思\n李白\n床前明月光,[MASK][MASK] [MASK] [MASK] [MASK]。举头望明月,低头思故乡。”

本公开实施例中,目标文本中韵律信息、题干文本和关联文本的顺序不作限定。

当目标文本中包括关联文本时,可以使得押韵文本生成模型在生成文本的处理中,基于更多的信息量来确定错误项文本,从而提高错误项文本与正确项文本的相似程度,提高错误项文本的质量。

步骤102,终端调用基于韵律信息构建的押韵文本生成模型,对目标文本进行处理,得到至少一个错误项文本。

其中,每个错误项文本在题干文本中符合目标韵律信息对应的韵律规则。

在一种可能的实施方式中,终端在构建押韵文本生成模型时,可以将韵律信息添加到押韵文本生成模型中,使得押韵文本生成模型可以对韵律信息进行表示。进而,终端可以将上述待处理的目标文本作为模型的输入,通过押韵文本生成模型对目标文本进行处理,预测上述题干文本中被掩盖的文本,将预测得到的文本作为至少一个错误项文本。

可选的,押韵文本生成模型包括词汇表。

其中,词汇表中存储有多个词汇表示,押韵文本生成模型可以通过词汇表对模型输入和输出的文本进行表示,也即是,词汇表中的词汇是模型可以“理解”和“表达”的词汇。

相对应的,上述步骤102的处理可以如下:终端根据词汇表和目标文本,确定目标文本的输入编码;通过押韵文本生成模型,对输入编码进行处理,确定至少一个错误项文本。

在一种可能的实施方式中,终端在获取到待处理的目标文本后,可以根据词汇表中存储的词汇,对目标文本进行分词。进而,终端可以根据词汇表,对分词后得到的各个词语进行编码,得到相应的输入编码。

可选的,词汇表包括韵律信息,上述将韵律信息添加到押韵文本生成模型中,是指将韵律信息添加到词汇表中。如图3所示的确定输入编码的流程图,终端确定押韵文本生成模型的输入编码的处理可以如下:

步骤301,终端根据词汇表中的韵律信息,确定目标韵律信息的第一词汇向量。

在一种可能的实施方式中,终端可以根据词汇表中韵律信息对目标韵律信息进行分词,进而,查询词汇表中目标韵律信息的每个词汇对应的向量表示,将每个词汇对应的向量表示用于表示目标韵律信息,得到目标韵律信息的第一词汇向量。

步骤302,终端根据词汇表中除韵律信息之外的词汇信息,确定题干文本的第二词汇向量。

在一种可能的实施方式中,终端可以根据词汇表中除韵律信息之外的词汇信息,对题干文本进行分词,进而,查询每个词汇在词汇表中对应的向量表示,将每个词汇对应的向量表示用于表示题干文本,得到题干文本的第二词汇向量。

步骤303,终端根据目标韵律信息在目标文本中的第一位置信息,确定目标韵律信息的第一位置向量。

在一种可能的实施方式中,上述过程中终端在对目标韵律信息进行分词后,可以确定每个词汇在目标文本中的位置信息,进而通过向量对每个词汇的位置信息进行表示,得到目标韵律信息的第一位置向量。

步骤304,终端根据题干文本在目标文本中的第二位置信息,确定题干文本的第二位置向量。

在一种可能的实施方式中,上述过程中终端在对题干文本进行分词后,可以确定每个词汇在目标文本中的位置信息,进而通过向量对每个词汇的位置信息进行表示,得到题干文本的第二位置向量。

步骤305,终端根据第一词汇向量、第二词汇向量、第一位置向量和第二位置向量,确定目标文本的输入编码。

在一种可能的实施方式中,终端可以对上述过程中确定的第一词汇向量、第二词汇向量、第一位置向量和第二位置向量进行整合,得到一个输入向量矩阵,即目标文本的输入编码。该输入编码可以用于表示目标文本中的每个词汇以及每个词汇对应的位置。

终端在确定下目标文本的输入编码后,可以通过押韵文本生成模型,对输入编码进行处理,对每个被掩盖的字符输出得到一个概率矩阵,该概率矩阵表示词汇表中每个词汇被选中的概率。对于一个被掩盖的字符,可以在其对应的概率矩阵中确定前第一数目个概率最高的词汇。进而,终端可以在这第一数目个概率最高的词汇中,根据概率确定第二数目个词汇,也即是,词汇的概率越高,被选中的机会越大。然后,终端可以将预测得到的词汇作为模型输入,对下一个被掩盖的字符进行预测,直到将被掩盖的字符预测完毕。终端可以根据每个预测的词汇构建相对应的文本,即得到至少一个错误项文本。

对于目标文本包括关联文本的情况,终端可以基于与上述相同的方法,根据词汇表中除韵律信息之外的词汇信息,确定关联文本的第三词汇向量;根据关联文本在目标文本中的第三位置信息,确定题干文本的第三位置向量。进而,终端根据第一词汇向量、第二词汇向量、第三词汇向量、第一位置向量、第二位置向量和第三位置向量,确定目标文本的输入编码。具体处理与上述处理相同,此处不再赘述。

示例性的,上述押韵文本生成模型可以是GPT(Generative Pre-Training,生成性预训练)模型,如图4所示的模型结构示意图,GPT模型可以由12层Transformer(转换器)模型解码模块构成。如图5所示的模型结构示意图,每个解码模块由两个子层,第一个子层由带掩码的多头注意力模块和第一残差连接和归一化模块构成,第二个子层由全连接层和第二残差连接和归一化模块构成。

如图6所示的模型处理示意图,模型的输入为“angangveang \n静夜思\n李白\n床前明月光,[MASK] [MASK] [MASK] [MASK] [MASK]。举头望明月,低头思故乡。”为了清晰,利用省略号表示省略的部分,最后一个[SOS]表示开始生成标记,模型接受到这个标记后开始生成第一个[MASK]对应的第一个字。模型的输出为第一个字的概率,比如疑的概率是0.98,然后根据这个概率进行采用,假如采样得到了疑,然后将疑字作为GPT模型的下一个输入,GPT模型输出下一个字的概率,采样得到第二个字,这样下去,直到模型输出[EOS],表示生成结束,输出“疑似夜如霜”“疑似水中央”。

上述押韵文本生成模型还可以是能够实现本实施例提供的文本生成方法的其他模型,本实施例对具体的模型结构不作限定。

步骤103,终端根据题干文本、至少一个错误项文本和题干文本的正确项文本,确定至少一个考察题目。

在一种可能的实施方式中,终端在确定下至少一个错误项文本后,可以将错误项文本和正确项文本组成一个考察题目的选项内容,将题干文本作为考察题目的题干内容,构建相应的考察题目。构建的考察题目如下表1所示:

表1 题目样例

可选的,为了保证考察题目的质量,可以对终端生成的错误项文本进行评分,相应的处理可以如下:终端确定任一错误项文本的综合得分;根据综合得分满足考察条件的至少一个错误项文本、题干文本和题干文本的正确项文本,确定至少一个考察题目。

其中,综合得分的指标包括重要程度、押韵程度和混淆程度。

在一种可能的实施方式中,终端在确定下至少一个错误项文本后,可以对任一错误项文本的重要程度、押韵程度和混淆程度进行评估,得到每一个错误项文本对应的综合得分。综合得分越高,则表明该错误项文本的质量越高,越满足题目的考察目的。

下面将对确定错误项文本的综合得分的方法进行介绍。

可选的,在确定任一错误项文本的综合得分之前,终端还可以对重复的错误项文本进行过滤,相应的处理可以如下:确定每个错误项文本的至少一个文本元素;确定题干文本的至少一个文本元素;如果错误项文本中存在与题干文本相同的文本元素,则删除文本元素相同的错误项文本。

在一种可能的实施方式中,对于每一个错误项文本,终端可以对其划分相邻的两个元素,例如,“疑似夜如霜”的文本元素可以为“疑似”“似夜”“夜如”“如霜”。题干文本的文本元素同理。

然后,终端可以对比错误项文本与其前一句或者后一句的文本元素,如果错误项文本存在相同的文本元素,则删除该错误项文本。

一般而言,在古诗词中,相邻两句诗词不会采用相同的词语。因此,通过上述过滤的处理,使得最后得到的错误项文本更符合古诗词的用语习惯,提高错误项文本的质量。

可选的,如图7所示的确定综合得分的流程图,终端确定任一错误项文本的综合得分的处理可以如下:

步骤701,终端确定正确项文本的第一得分。

其中,第一得分用于表示正确项文本的重要程度。

在一种可能的实施方式中,终端可以根据正确项文本的重要程度,确定第一得分。也即是确定对应的考察题目的重要程度,体现该题目考察的重要性。重要程度越高,越需要学生掌握该考察题目,相应的错误项文本的生成也就越重要。

可选的,确定正确项文本的第一得分的处理可以如下:获取正确项文本在语料库中的第一数目;根据第一数目,确定正确项文本的第一得分。

在一种可能的实施方式中,终端可以在公开的语料库中,统计出正确项文本对应的诗句的出现次数。然后,通过以下公式确定第一得分:

其中,

诗句出现的次数越多,说明这句诗越有名。对于这样的诗句需要重点考察学生是否掌握。

步骤702,终端确定任一错误项文本的第二得分。

其中,第二得分用于表示任一错误项文本在题干文本中的押韵程度。

在一种可能的实施方式中,终端可以确定错误项文本对应的韵律信息,然后,确定其在题干文本中是否押韵,根据押韵结果确定错误项文本的第二得分。

可选的,确定任一错误项文本的第二得分的处理可以如下:获取正确项文本在题干文本中的目标位置信息;获取正确项文本的第一韵律信息;获取任一错误项文本的第二韵律信息;根据目标位置信息、第一韵律信息和第二韵律信息,确定任一错误项文本的第二得分。

在一种可能的实施方式中,终端可以根据正确项文本在题干文本中的位置,也即是确定正确项文本处在题干文本中的第几句,确定正确项文本对应的目标位置信息。然后,终端可以获取正确项文本和错误项文本的韵律信息,并确定两者的韵律信息是否相同。例如,当韵律信息为韵母信息时,终端可以获取正确项文本和错误项文本的最后一个字对应的韵母,并确定两者是否相同。

由于偶数句对押韵的要求比奇数句高,可以对押韵的偶数句赋予更高的分数。令处在偶数句的错误项文本的押韵得分为第一子得分,处在奇数句的错误文本的押韵得分为第二子得分。终端在确定正确项文本和错误项文本的韵律信息相同,即错误项文本押韵时,第一子得分大于第二子得分;在确定正确项文本和错误项文本的韵律信息不相同,即错误项文本不押韵时,第一子得分和第二子得分等于0。

然后,终端可以根据目标位置信息和上述押韵得分,确定错误项文本的第二得分,所使用的公式可以如下:

其中,

步骤703,终端确定任一错误项文本的第三得分。

其中,第三得分用于表示任一错误项文本与正确项文本的混淆程度。

在一种可能的实施方式中,终端可以根据错误项文本与正确项文本重复的字数,对错误项文本与正确项文本的混淆程度进行评分,确定第三得分。重复的字数越多,错误项文本与正确项文本越混淆,越能考察学习对该诗句的掌握程度。

可选的,确定任一错误项文本的第三得分的处理如下:确定任一错误项文本与正确项文本在相同位置处的相同文字的第二数目;根据第二数目和正确项文本的文字总数,确定任一错误项文本的第三得分。

在一种可能的实施方式中,对于每个位置,终端可以分别获取该位置上错误项文本和正确项文本对饮的字符,并确定两者是否相等,对相等的字符进行计数,得到错误项文本在相同位置处的与正确项文本相同文字的数目。然后,终端可以确定该数目与正确项文本的文字总数的比值,得到第三得分,所使用的公式如下所示:

其中,

步骤704,终端根据第一得分、第二得分和第三得分,确定任一错误项文本的综合得分。

在一种可能的实施方式中,终端在确定上述第一得分、第二得分和第三得分后,可以对三者进行相加,得到对应的任一错误项文本的综合得分,所使用的公式如下所示:

其中,

上述公式是本实施例的一个示例,终端还可以是对第一得分、第二得分和第三得分加权求和,或者加权平均,得到的综合评分都可以对错误项文本是否满足考察条件进行评估,因此,本实施例对确定综合得分的具体公式不作限定。

终端在确定每个错误项文本的综合得分后,可以按照综合得分的高低顺序进行排序,获取满足考察条件的错误项文本。该考察条件可以是综合得分超过阈值,也即是获取综合得分超过阈值的错误项文本,作为待构建考察题目的错误项文本。

或者,满足考察条件也可以是指通过人工审核,也即是老师可以对排序后的各个错误项文本进行审核,并对通过审核的错误项文本进行标记。进而,终端可以将通过人工审核的错误项文本,作为待构建考察题目的错误项文本。

然后,终端可以将满足考察条件的错误项文本和正确项文本组成一个考察题目的选项内容,将题干文本作为考察题目的题干内容,构建相应的考察题目,并将构建得到的考察题目加入题目数据库,给用户进行题目练习。

本公开实施例中,由于押韵文本生成模型基于韵律信息构建,终端在调用押韵文本生成模型生成错误项文本时,可以将目标韵律信息和题干文本作为模型的输入,输出得到错误项文本。由于模型的输入包括目标韵律信息,终端在模型处理的过程中可以利用该目标韵律信息,使得输出的错误项文本在题干文本中符合该目标韵律信息对应的韵律规则,满足韵律的要求。进而,终端可以根据题干文本、至少一个错误项文本和该题干文本对应的正确项文本,确定至少一个考察题目,提高出题的效率。

上述公开实施例中所使用的押韵文本生成模型可以是机器学习模型,在使用押韵文本生成模型进行上述处理前,可以对其进行训练。下面将通过如图8所示的训练方法流程图,对押韵文本生成模型的训练方法进行介绍:

步骤801,终端获取韵律信息。

在一种可能的实施方式中,韵律信息可以由技术人员预先进行设置,并且,按照韵律规则划分为不同的词汇。例如,可以将复韵母设置为一个词汇,使得押韵文本生成模型可以对复韵母进行表示。如果不将复韵母设置为一个词汇,则处理过程中可能会将复韵母分为多个词汇,影响押韵文本生成模型对韵律信息的处理。

在构建押韵文本生成模型时,终端可以获取到上述预先设置的韵律信息。

步骤802,终端在初始押韵文本生成模型的词汇表中添加韵律信息,构建初始押韵文本生成模型。

在一种可能的实施方式中,终端可以将上述获取到的韵律信息添加到词汇表中,并将押韵文本生成模型的各个参数设置为初始值,构建初始押韵文本生成模型。

步骤803,终端获取训练样本。

其中,每个训练样本包括训练韵律信息、训练题干文本、训练正确项文本。

在一种可能的实施方式中,训练样本的来源可以是公开的古诗词库,其中存储有多首古诗词,范围远超中小学生需要掌握的课内和课外的所有古诗词。

终端在训练模型之前可以进行数据准备,获取上述古诗词库中的多首古诗词,并通过与上述步骤101相同的方法确定训练过程中的每个模型输入,也即是训练题干文本和对应的训练韵律信息,本实施例中不再进行赘述。将一次处理中的模型输入称为训练目标文本,则一个训练目标文本包括对应的训练韵律信息和训练题干文本。

并且,终端还可以将掩盖的文本作为训练正确项文本,用于模型训练过程中的训练标签。

数据准备完成后,终端可以得到多个训练样本,在触发训练任务时可以获取相应的训练样本。

可选的,每个训练样本还包括训练题干文本的训练关联文本。

在一种可能的实施方式中,终端还可以在训练目标文本中添加相对应的训练关联文本,具体处理已经在上面的实施例中介绍,此处不再赘述。

步骤804,终端根据训练样本,对初始押韵文本生成模型进行训练,得到训练后的押韵文本生成模型。

在一种可能的实施方式中,对于一个训练目标文本,终端可以通过初始押韵文本生成模型进行处理,输出得到至少一个错误项文本,具体过程与上述步骤102同理,此处不再赘述。

然后,终端可以根据得到的每个错误项文本和对应的训练正确项文本,通过交叉熵损失函数确定调整参数,然后再根据调整参数对初始押韵文本生成模型的模型参数进行调整。经过多次训练后,模型输出的错误项文本可以越来越接近对应的训练正确项文本。

当达到训练结束条件时,终端可以获取当前的押韵文本生成模型,作为训练后的押韵文本生成模型。

其中,训练结束条件可以是训练次数达到第一阈值,和/或模型正确率达到第二阈值,和/或损失函数低于第三阈值。上述第一阈值、第二阈值和第三阈值可以根据经验设置。本公开实施例对具体的训练结束条件不作限定。

本公开实施例中,在构建押韵文本生成模型时,由于将韵律信息添加到词汇表中,使得押韵文本生成模型可以表示相应的韵律信息。在模型预测的过程中,由于押韵文本生成模型基于韵律信息构建,终端在调用押韵文本生成模型生成错误项文本时,可以将目标韵律信息和题干文本作为模型的输入,输出得到错误项文本。由于模型的输入包括目标韵律信息,终端在模型处理的过程中可以利用该目标韵律信息,使得输出的错误项文本在题干文本中符合该目标韵律信息对应的韵律规则,满足韵律的要求。进而,终端可以根据题干文本、至少一个错误项文本和该题干文本对应的正确项文本,确定至少一个考察题目,提高出题的效率。

本公开实施例提供了一种文本生成装置,该装置用于实现上述文本生成方法。如图9所示的文本生成装置的示意性框图,该装置包括:

获取模块901,用于获取目标文本,目标文本至少包括目标韵律信息和题干文本;

处理模块902,用于调用基于韵律信息构建的押韵文本生成模型,对目标文本进行处理,得到至少一个错误项文本,每个错误项文本在题干文本中符合目标韵律信息对应的韵律规则;

确定模块903,用于根据题干文本、至少一个错误项文本和题干文本的正确项文本,确定至少一个考察题目。

可选的,押韵文本生成模型包括词汇表;

处理模块902用于:

根据词汇表和目标文本,确定目标文本的输入编码;

通过基于韵律信息构建的押韵文本生成模型,对输入编码进行处理,确定至少一个错误项文本。

可选的,词汇表包括韵律信息,处理模块902用于:

根据词汇表中的韵律信息,确定目标韵律信息的第一词汇向量;

根据词汇表中除韵律信息之外的词汇信息,确定题干文本的第二词汇向量;

根据目标韵律信息在目标文本中的第一位置信息,确定目标韵律信息的第一位置向量;

根据题干文本在目标文本中的第二位置信息,确定题干文本的第二位置向量;

根据第一词汇向量、第二词汇向量、第一位置向量和第二位置向量,确定目标文本的输入编码。

可选的,目标文本还包括题干文本的关联文本。

可选的,确定模块903用于:

确定任一错误项文本的综合得分,综合得分的指标包括重要程度、押韵程度和混淆程度;

根据综合得分满足考察条件的至少一个错误项文本、题干文本和题干文本的正确项文本,确定至少一个考察题目。

可选的,确定模块903用于:

确定正确项文本的第一得分,第一得分用于表示所述正确项文本的重要程度;

确定任一错误项文本的第二得分,第二得分用于表示任一错误项文本在题干文本中的押韵程度;

确定任一错误项文本的第三得分,第三得分用于表示任一错误项文本与正确项文本的混淆程度;

根据第一得分、第二得分和第三得分,确定任一错误项文本的综合得分。

可选的,确定模块903用于:

获取正确项文本在语料库中的第一数目;

根据第一数目,确定正确项文本的第一得分。

可选的,确定模块903用于:

获取正确项文本在题干文本中的目标位置信息;

获取正确项文本的第一韵律信息;

获取任一错误项文本的第二韵律信息;

根据目标位置信息、第一韵律信息和第二韵律信息,确定任一错误项文本的第二得分。

可选的,确定模块903用于:

确定任一错误项文本与正确项文本在相同位置处的相同文字的第二数目;

根据第二数目和正确项文本的文字总数,确定任一错误项文本的第三得分。

可选的,确定模块903还用于:

确定每个错误项文本的至少一个文本元素;

确定题干文本的至少一个文本元素;

如果错误项文本中存在与题干文本相同的文本元素,则删除文本元素相同的错误项文本。

可选的,如图10所示的文本生成装置的示意性框图,该装置还包括训练模块904,训练模块904用于:

获取韵律信息;

在初始押韵文本生成模型的词汇表中添加韵律信息,构建初始押韵文本生成模型;

获取训练样本,每个训练样本包括训练韵律信息、训练题干文本、训练正确项文本;

根据训练样本,对初始押韵文本生成模型进行训练,得到训练后的押韵文本生成模型。

可选的,每个训练样本还包括训练题干文本的训练关联文本。

本公开实施例中,由于押韵文本生成模型基于韵律信息构建,终端在调用押韵文本生成模型生成错误项文本时,可以将目标韵律信息和题干文本作为模型的输入,输出得到错误项文本。由于模型的输入包括目标韵律信息,终端在模型处理的过程中可以利用该目标韵律信息,使得输出的错误项文本在题干文本中符合该目标韵律信息对应的韵律规则,满足韵律的要求。进而,终端可以根据题干文本、至少一个错误项文本和该题干文本对应的正确项文本,确定至少一个考察题目,提高出题的效率。

本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。

本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。

本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。

参考图11,现将描述可以作为本公开的服务器或客户端的电子设备1100的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示,电子设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

电子设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106、输出单元1107、存储单元1108以及通信单元1109。输入单元1106可以是能向电子设备1100输入信息的任何类型的设备,输入单元1106可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1107可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1104可以包括但不限于磁盘、光盘。通信单元1109允许电子设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理。例如,在一些实施例中,文本生成方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到电子设备1100上。在一些实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行文本生成方法。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

相关技术
  • 文本生成模型的训练方法及装置、文本生成方法及装置
  • 文本生成模型的训练方法、文本生成方法和装置
技术分类

06120113283694