掌桥专利:专业的专利平台
掌桥专利
首页

回复文本的生成方法、生成装置及计算机可读存储介质

文献发布时间:2023-06-19 19:30:30


回复文本的生成方法、生成装置及计算机可读存储介质

技术领域

本申请涉及自然语言处理领域,特别是涉及一种回复文本的生成方法、生成装置及计算机可读存储介质。

背景技术

目前有关采用深度学习的方式去生成论辩文本对应的回复文本的研究越来越多,但是在采用深度学习的方式生成论辩文本对应的回复文本时,准确率有待进一步提高。

发明内容

本申请提供一种回复文本的生成方法、生成装置及计算机可读存储介质,能够提高回复文本的生成准确率。

本申请实施例第一方面提供一种回复文本的生成方法,所述方法包括:获取目标论辩文本以及所述目标论辩文本对应的背景知识文本;将所述目标论辩文本划分为多个第一字符,所述多个第一字符按照从前到后的顺序依次进行排列;根据所述目标论辩文本以及所述背景知识文本,生成每个所述第一字符对应的第一回复字符;根据每个所述第一字符对应的所述第一回复字符,生成所述目标论辩文本对应的目标回复文本。

本申请实施例第二方面提供一种回复文本生成装置,所述回复文本生成装置包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现上述方法中的步骤。

本申请实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现上述方法中的步骤。

有益效果是:本申请回复文本的生成方法在获取到目标论辩文本后,结合目标辩论文本对应的背景知识文本,生成目标辩论文本中每个第一字符对应的第一回复字符,能够提高生成的回复文本的准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:

图1是本申请回复文本的生成方法一实施方式的流程示意图;

图2是本申请回复文本生成工具的用户交互界面示意图;

图3是图1中步骤S130的流程示意图;

图4是本申请知识变分插值自编码器模型的结构示意图;

图5是图1中步骤S140的流程示意图;

图6是图5中步骤S146的流程示意图;

图7是本申请目标图谱的结构示意图;

图8是本申请回复文本生成装置一实施方式的结构示意图;

图9是本申请计算机可读存储介质一实施方式的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

需要说明的是,本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

参阅图1,在本申请一实施方式中,回复文本的生成方法包括:

S110:获取目标论辩文本以及目标论辩文本对应的背景知识文本。

具体地,本申请回复文本的生成方法由回复文本生成装置执行,该回复文本生成装置上有一个网页端的回复文本生成工具,其用户交互界面如图2所示,在使用时,用户首先需要在A区输入一段基于特定立场的目标论辩文本,然后在B区输入目标论辩文本对应的背景知识文本,之后回复文本生成装置进行分析,并生成目标论辩文本对应的目标回复文本,最终将目标回复文本显示在C区,接下来介绍的就是回复文本生成装置生成目标论辩文本对应的目标回复文本的过程。

S120:将目标论辩文本划分为多个第一字符,多个第一字符按照从前到后的顺序依次进行排列。

具体地,可以采用现有技术中的任一项技术将目标论辩文本划分为多个第一字符。多个第一字符按照从前到后的顺序依次进行排列指的是,多个第一字符按照在目标论辩文本中的顺序进行排序,具体而言,在划分之前,第一字符A在目标论辩文本中处于第一字符B之前,在划分之后,第一字符A依然处于第一字符B之前。

S130:根据目标论辩文本以及背景知识文本,生成每个第一字符对应的第一回复字符。

具体地,针对每个第一字符,结合目标论辩文本以及背景知识文本,生成其对应的第一回复字符。

在本实施方式中,按照从前到后的顺序,依次确定每个第一字符对应的第一回复字符,也就是说,先确定第一个第一字符对应的第一回复字符,再确定第二个第一字符对应的第一回复字符,接着再确定第三个第一字符对应的第一回复字符,依次类推。

在本实施方式中,参阅图3,步骤S130具体包括:

S131:将背景知识文本输入第一编码器,得到第一向量。

S132:将目标论辩文本输入第二编码器,得到第二向量。

S133:根据第一向量以及第二向量,得到多个第一字符中起始字符的第一状态向量。

S134:根据起始字符的第一状态向量,得到起始字符对应的第一回复字符。

S135:针对起始字符后面的每个第一字符,根据与第一字符相邻的前一个第一字符对应的第一状态向量以及第一回复字符,得到第一字符对应的第一状态向量,并根据第一字符对应的第一状态向量,得到第一字符对应的第一回复字符。

具体地,本申请生成第一字符对应的第一回复字符的方案需要用到图4的知识变分插值自编码器模型,下面先对图4的知识变分插值自编码器模型进行介绍:该知识变分插值自编码器模型包括第一编码器、第二编码器以及第三编码器等结构。

其中,将背景知识文本输入第一编码器(用标号10表示)后,第一编码器输出第一向量,将其记为k。其中,本申请对第一编码器的结构不做限定。可以理解的是,第一向量融合了背景知识文本的全部信息。

其中,将目标论辩文本输入第二编码器(用标号20表示)后,第二编码器输出第二向量,将其记为c。其中,本申请对第二编码器的结构不做限定。可以理解的是,第二向量融合了目标论辩文本的全部信息。

其中,第三编码器(用标号30)为生成文本编码器,如果当前需要生成某一个第一字符的第一回复字符,则需要将该第一字符之前的所有第一字符对应的第一回复字符输入第三编码器,第三编码器输出第三向量,记为y。例如,如果当前需要生成多个第一字符中第五个第一字符对应的第一回复字符(此前已经按照从前到后的顺序,依次生成了第一个第一字符至第四个第一字符对应的第一回复字符),则将第一个第一字符至第四个第一字符对应的第一回复字符均输入第三编码器,得到与第五个第一字符对应的第三向量y。

接着将第一向量k以及第三向量y输入第一变分神经网络,得到第一隐变量z

z=λz

其中,继续参阅图4中虚线框40部分,确定λ的过程有以下两种方式:

第一种方式:将第一向量k、第二向量c以及第三向量y输入MLP网络,得到λ;

第二种方式:首先inference Network和Prior Network预先训练好,inferenceNetwork的输入为第一向量k以及第三向量y,Prior Network的输入为第二向量c以及第三向量y,其中,训练inference Network和Prior Network的过程,就是使两者的输出朝着接近的方向发展。在训练完成后,在使用时,将Prior Network输出的结果作为λ,也就是说,在使用时,将第二向量c以及第三向量y输入Prior Network,得到λ。

其中,可以采用上述两种方式中的任一种方式确定λ。

通过上述内容可知,如果在确定每个第一字符对应的第一回复字符时,都使用上述的知识变分插值自编码器模型,则可以确定每一个第一字符对应的插值隐变量z。

但是在本申请的方案中,为了在确定第一字符对应的第一回复字符时,考虑到上文环境,只针对多个第一字符中的起始字符使用上述的知识变分插值自编码器模型,以得到起始字符对应的插值隐变量z。

具体地,首先为了便于说明,将第一个第一字符对应的第一状态向量记为h

而在使用上述知识变分插值自编码器模型得到起始字符的插值隐变量z后,将起始字符的插值隐变量z输入全连接神经网络,得到起始字符对应的第一状态向量h

在一应用场景中,具体可以按照如下公式确定第一字符的第一状态向量:

当i不等于0时,将h

需要说明的是,在其他实施方式中,针对每个第一字符,也可以根据其对应的插值隐变量z,得到第一字符i对应的第一状态向量h

h

以上介绍了生成第一字符对应的第一状态向量以及第一回复字符的过程,下面介绍步骤S130之后的步骤。

S140:根据每个第一字符对应的第一回复字符,生成目标论辩文本对应的目标回复文本。

其中,在得到每个第一字符对应的第一回复字符后,可以直接利用每个第一字符对应的第一回复字符,生成目标论辩文本对应的目标回复文本,但是为了进一步提高目标文本生成的准确率,本申请还进一步结合论辩立场,生成目标回复文本,参阅图5,该过程包括:

S141:获取目标立场,并生成目标立场的向量表示。

具体地,结合图2,用户在B输入目标立场,该目标立场表示的是,站在该立场,应该在C区生成何种目标回复文本,其中,将目标立场的向量表示记为λ

S142:将背景知识文本划分为多个第二字符。

具体地,与步骤S120类似,此处将背景知识文本t划分为多个第二字符,且多个第二字符按照从前到后的顺序依次排列,其中,可以将多个第二字符用集合{t

S143:针对每个第二字符,根据第二字符的向量表示以及目标立场的向量表示,得到第二字符对应的第一目标向量表示。

具体地,将{t

然后对于每个第二字符而言,将目标立场的向量表示与第二字符的向量表示进行拼接,得到第二字符对应的第一目标向量表示,即对于{l

S144:针对每个第一字符,根据第一字符相邻的前一个第一字符对应的第一状态向量以及每个第二字符对应的第一目标向量表示,确定第一字符对应的第二目标向量表示。

具体地,为了能够更好地结合目标立场以及上文信息,对于每个第一字符而言,根据相邻的前一个第一字符对应的第一状态向量以及每个第二字符对应的第一目标向量表示,确定第一字符对应的第二目标向量表示。

在一应用场景,可以按照如下公式确定第一字符i对应的第二目标向量

其中,/>

其中,

也就是说,在上述应用场景中,确定第一字符对应的第二目标向量的过程包括:针对每个第二字符,计算该第一字符相邻的前一个第一字符对应的第一状态向量与第二字符对应的第一目标向量表示的注意力权重;针对每个第二字符,将第二字符对应的注意力权重与第二字符对应的第一目标向量表示进行相乘,得到积向量;将每个第二字符对应的积向量进行相加,得到第一字符对应的第二目标向量。

S145:针对每个第一字符,根据第一字符对应的第二目标向量表示、第一字符相邻的前一个第一字符对应的第一回复字符的向量表示以及第一字符相邻的前一个第一字符对应的第一状态向量,得到第一字符对应的第二状态向量,并根据第二状态向量,得到第一字符对应的第二回复字符。

具体地,可以按照如下公式确定第一字符i对应的第二状态向量h′

其中,h

在得到第一字符对应的第二状态向量后,对第二状态向量进行解码处理,得到第一字符对应的第二回复字符,其中,将第一字符i对应的第二回复字符记为第二回复字符i,将第二回复字符i对应的向量表示记为y′

S146:根据每个第一字符对应的第二回复字符,生成目标回复文本。

其中,可以直接利用每个第一字符对应的第二回复字符,生成目标回复文本。

但是在本实施方式中,考虑到在上述方案中,只考虑了背景知识文本,可能会使生成目标回复文本的讨论范围集中于单一事件,很难对事件的起因与影响进行深入的讨论,导致论辩说服力不足,因此为了进一步提高生成目标回复文本的准确率,还进一步融合图谱信息对每个第一字符对应的第二回复字符进行改写,结合图6,此时步骤S146具体包括:

S1461:获取目标图谱,目标图谱包括多个节点以及节点之间的连接边。

结合图7,在目标图谱中,有多个节点,不同节点具有不同的含义,同时节点与节点之间通过连接边连接。同时目标图谱与之前生成的多个第二回复字符形成的文本相对应。

S1462:生成目标图谱中每个节点的密向量表示。

具体地,对于目标图谱中的每个节点,都用一个密向量对其进行表示。

在本实施方式中,为了融合全局信息,步骤S1462具体包括:针对每个节点,至少根据节点的向量表示以及节点的邻居节点的向量表示,生成节点的密向量表示。

具体地,节点A的邻居节点指的是通过连接边与节点A连接的节点。

其中,可以首先采用transformer的编码器生成目标图谱中每个节点的向量表示,将节点i对应的向量表示记为v

其中,v

从而得到集合v={v′

其中,生成第二回复字符i的过程可以是:将第二回复字符i输入采用transformer的编码器,得到第二回复字符i的向量表示。

需要说明的是,在其他实施方式中,对于目标图谱中的每个节点而言,也可以直接将对应的向量表示直接作为其密向量表示。

S1463:根据每个节点的密向量表示以及第二回复字符对应的第二状态向量,得到第二回复字符对应的隐状态向量。

具体地,可以按照如下公式确定第二回复字符t对应的隐状态向量h″

其中,

S1464:根据第二回复字符对应的隐状态向量,得到第二回复字符对应的目标概率分布,并根据目标概率分布,得到第二回复字符对应的目标字符。

在一应用场景中,步骤S1464具体包括:将所有第二回复字符的向量表示进行相加,得到总向量;将总向量除以第二回复字符的个数,得到平均向量;根据第二回复字符对应的隐状态向量以及平均向量,得到控制概率参数;将第一概率分布与第一数值相乘,得到第一目标概率分布,其中,第一数值与控制概率参数相等,第一概率分布为从目标论辩文本中复制字符的概率分布;将第二概率分布与第二数值相乘,得到第二目标概率分布,其中,第二数值等于一与控制概率参数的差,第二概率分布为生成新字符的概率分布;将第一目标概率分布和第二目标概率分布进行相加,得到第二回复字符对应的目标概率分布。

上述过程用公式表示为如下过程:

p=γp

其中,γ为文本复制与生成的控制概率,也就是控制概率参数,p

在得到第二回复字符对应的目标概率分布后,将可以在该目标分布中查找最大概率,然后将该最大概率对应的字符,确定为第二回复字符对应的目标字符。

在其他应用场景中,在得到第二回复字符对应的隐状态向量后,还可以直接对第二回复字符对应的隐状态向量进行解码处理,得到第二回复字符对应的目标字符。

S1465:根据每个第二回复字符对应的目标字符,得到目标回复文本。

在得到每个第二回复字符对应的目标字符后,可以用所有目标字符,组成目标回复文本,即最终得到的回复文本。

参阅图8,图8是本申请回复文本生成装置一实施方式的结构示意图。该回复文本生成装置200包括处理器210、存储器220以及通信电路230,处理器210分别耦接存储器220、通信电路230,存储器220中存储有程序数据,处理器210通过执行存储器220内的程序数据以实现上述任一项实施方式方法中的步骤,其中详细的步骤可参见上述实施方式,在此不再赘述。

其中,回复文本生成装置200可以是电脑、手机等任一项具有算法处理能力的装置,在此不做限制。

参阅图9,图9是本申请计算机可读存储介质一实施方式的结构示意图。该计算机可读存储介质400存储有计算机程序410,计算机程序410能够被处理器执行以实现上述任一项方法中的步骤。

其中,计算机可读存储介质400具体可以为U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储计算机程序410的装置,或者也可以为存储有该计算机程序410的服务器,该服务器可将存储的计算机程序410发送给其他设备运行,或者也可以自运行该存储的计算机程序410。

以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

相关技术
  • 为歌词文本生成乐曲的方法、装置及计算机可读存储介质
  • 动态表情生成方法、装置、计算机可读存储介质和计算机设备
  • 网页生成方法、装置、电子设备及计算机可读存储介质
  • IMU测量数据生成方法、系统、计算机装置及可读存储介质
  • 测试用例生成方法、装置及计算机可读存储介质
  • 文本生成方法、文本生成装置及计算机可读存储介质
  • 一种文本生成方法、文本生成装置和可读存储介质
技术分类

06120115938121