构建对话模型的方法、装置、设备及存储介质

文献发布时间：2024-04-18 19:58:26

技术领域

本公开涉及对话模型技术领域，尤其涉及一种构建对话模型的方法、装置及电子设备。

背景技术

现有的对话模型的实现方法主要分为检索式和生成式，其中，基于检索的对话模型：对于用户提出的问题，在对应问答库中进行检索，使用检索到的答案进行回复，回复一般比较精准和具体，且不具有个性色彩；而基于生成的对话模型：使用机器学习的算法模型根据用户的问题端到端进行回复语句的生成，回复相对检索式更加灵活，但是一般也不具有个性色彩。

随着人们生活水平的提高，对于对话功能的使用体验要求也越来越高，越来越多的人开始追求个性化的对话体验，例如，一些用户想要体验影视剧中某个角色的聊天风格，但是，在一部电视剧中，某个角色能构成对话的数量还是非常有限的，一般在2000条左右，使用这个数量级的语料来训练语言模型会导致过拟合的问题。

发明内容

鉴于此，本公开提供一种构建对话模型的方法、装置及电子设备。

根据本公开实施例的第一方面，提供一种构建对话模型的方法，所述方法包括：

获取中文闲聊语料数据集；

基于所述中文闲聊语料数据集对第一预训练模型进行训练，以确定初始对话模型；

获取训练样本集；其中，所述训练样本集包括原始对话集合样本和扩充对话集合样本，所述原始对话集合样本包括目标角色对应的多个原始对话样本，所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本；

基于所述训练样本集，对所述初始对话模型进行训练，以确定所述目标角色对应的目标对话模型。

可选地，所述扩充对话集合样本包括模型扩充对话集合样本和/或预设扩充对话集合样本。

可选地，所述模型扩充对话集合样本通过以下方式确定：

获取所述目标角色对应的台词数据样本；

根据所述台词数据样本，确定所述目标角色对应的回答集合样本；其中，所述回答集合样本包括所述目标角色对应的多个回答样本；

基于所述中文闲聊语料数据集，确定问题数据集；

基于设定对话匹配模型，对所述回答集合样本和所述问题数据集进行处理，以确定所述回答集合样本对应的所述模型扩充对话集合样本。

可选地，所述设定对话匹配模型通过一下方式构建：

基于所述中文闲聊语料数据集，对第二预训练模型进行训练，以确定所述设定对话匹配模型。

可选地，所述基于设定对话匹配模型，对所述回答集合样本和所述问题数据集进行处理，以确定所述回答集合样本对应的所述模型扩充对话集合样本，包括：

根据所述回答集合样本中的回答样本以及所述问题数据集中的问题语句，构建多个扩充对话；

将所述扩充对话输入所述设定对话匹配模型，以确定所述扩充对话对应的置信度；

将同一所述回答样本对应的所述扩充对话中，所述置信度符合要求的所述扩充对话，确定为所述回答样本对应的扩充对话样本；

根据多个所述回答样本对应的所述扩充对话样本，确定所述模型扩充对话集合样本。

可选地，所述将同一所述回答样本对应的所述扩充对话中，所述置信度符合要求的所述扩充对话，确定为所述回答样本对应的扩充对话样本，包括：

将同一所述回答样本对应的所述扩充对话中，所述置信度排行位于前N位的所述扩充对话，确定为所述回答样本对应的所述扩充对话样本。

可选地，所述原始对话集合样本通过以下方式确定：

获取台词数据样本；

根据所述台词数据样本，确定目标人物对应的回答集合样本；其中，所述回答集合样本包括所述目标人物对应的多个回答样本；

根据对话匹配规则和所述回答集合样本，从所述台词数据样本中确定所述回答集合样本对应的所述原始对话集合样本。

根据本公开实施例的第二方面，提供一种构建对话模型的装置，所述装置包括：

获取模块，用于获取中文闲聊语料数据集；

确定模块，用于基于所述中文闲聊语料数据集对第一预训练模型进行训练，以确定初始对话模型；

所述获取模块，还用于获取训练样本集；其中，所述训练样本集包括原始对话集合样本和扩充对话集合样本，所述原始对话集合样本包括目标角色对应的多个原始对话样本，所述扩充对话集合样本包括所述目标角色对应的多个扩充对话样本；

所述确定模块，还用于基于所述训练样本集，对所述初始对话模型进行训练，以确定所述目标角色对应的目标对话模型。

根据本公开实施例的第三方面，提供一种电子设备，所述电子设备包括：

处理器，以及用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行如第一方面所述的方法。

根据本公开实施例的第四方面，提供一种存储介质，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如第一方面所述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：本申请中，可先基于中文闲聊预料数据集对同一语言模型进行训练，以得到具有对话能力的初始对话模型，然后可基于目标角色对应的多个原始问答对样本以及多个扩充问答对样本，得到数据足够丰富的训练样本集，并基于上述语料丰富的训练样本集对初始对话模型进行训练，从而得到与目标角色对应的目标对话模型，从而使得目标对话模型可以实现带有目标角色风格的回答，以便于用户基于目标对话模型实现与目标角色的对话体验，以提升满足用户的个性化求。

例如，用户在观看完电视剧集后，可以进入聊天窗口，选择该剧中的角色，该角色对应的对话模型便可用该角色风格化的语言回答用户的提问，让用户体验和角色互动对话的乐趣，提升用户粘性。

再例如，用户在虚拟助手的聊天对话中可以选择热门剧集的角色，小助手就会基于上述角色对应的对话模型，用相应的风格化语言回复用户，以提升使用体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的构建对话模型的方法的流程图。

图2是根据一示例性实施例示出的构建对话模型的装置的框图。

图3是根据一示例性实施例示出的电子设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是本公开的一些实施方式的装置和方法的例子。

本公开实施例提供了一种构建对话模型的方法。该方法中，可先基于中文闲聊预料数据集对同一语言模型进行训练，以得到具有对话能力的初始对话模型，然后可基于目标角色对应的多个原始问答对样本以及多个扩充问答对样本，得到数据足够丰富的训练样本集，并基于上述语料丰富的训练样本集对初始对话模型进行训练，从而得到与目标角色对应的目标对话模型，从而使得目标对话模型可以实现带有目标角色风格的回答，以便于用户基于目标对话模型实现与目标角色的对话体验，以提升满足用户的个性化求。

在一个示例性实施例中，提供了一种构建对话模型的方法，可应用于电子设备。电子设备可以是台式电脑、笔记本电脑以及其他具有模型训练能力的设备等等，对此不作限定。参考图1所示，该方法可包括：

S110、获取中文闲聊语料数据集；

S120、基于中文闲聊语料数据集对统一语言模型进行训练，以确定初始对话模型；

S130、获取训练样本集；其中，训练样本集包括原始对话集合样本和扩充对话集合样本，原始对话集合样本包括目标角色对应的多个原始对话样本，扩充对话集合样本包括目标角色对应的多个扩充对话样本；

S140、基于训练样本集，对初始对话模型进行训练，以确定目标角色对应的目标对话模型。

在步骤S110中，关于中文闲聊语料数据集(例如LCCC，全称为Large-scaleCleaned Chinese Conversation)，电子设备可以从互联网中获取，也可以从自身的存储器中获取，也可以从其他设备获取，对此不作限定。

在步骤S120中，第一预训练模型可以是统一语言模型(UniLM模型(UnifiedLanguage Model))，也可以是其他模型，对此不作限定。

该步骤中，电子设备得到了中文闲聊语料数据集后，便可基于上述中文闲聊语料数据集，对预训练的统一语言模型进行初始的训练，以实现对统一语言模型的第一次微调，从而得到初始对话模型。该初始对话模型具有一定的对话能力，但是不具有风格化的对话能力。

在步骤S130中，训练样本集用于对初始对话模型进行二次训练，也就是用于对统一语言模型进行第二次微调。

其中，训练样本集中，原始对话集合样本可包括多个原始对话样本，原始对话样本指目标角色在目标角色所在的影视剧中的原始对话。也就是说，该步骤中，可先获取目标角色在对应影视剧中的多个原始对话(可记为原始对话样本)，然后将上述多个原始对话构成的集合，确定为原始对话集合样本。需要说明的是，影视剧可包括电影、电视剧、舞台剧以及话剧等具有角色和台词的表演。

在一些实施方式中，

电视剧A可包括角色a1和角色a2，其中，目标角色可以是角色a1。

电视剧A中可包括如下对话：

“慢走，恕不远送。”

“人家自己会走，哼！”

其中，上述原始对话中的第一句由电视剧A中的角色a2所说，上述原始对话中的第二句由电视剧A中的角色a1所说。

由此，便可将上述原始对话确定为角色a1在电视剧A中原始对话。也就是说，角色a1对应的原始对话集合样本可包括上述原始对话。

其中，训练样本集中，扩充对话集合样本可包括多个扩充对话样本，扩充对话样本指目标角色对应的扩充对话，也即带有目标角色风格的扩充对话。也就是说，该步骤中，可先基于目标角色的风格，得到带有目标角色风格的多个扩充对话(可记为扩充对话样本)，然后将上述多个扩充对话构成的集合，确定为扩充对话集合样本。

在一些实施方式中，

电视剧A可包括角色a1和角色a2，其中，目标角色可以是角色a1。

电视剧A中可包括如下对话：

“慢走，恕不远送。”

“人家自己会走，哼！”

其中，上述原始对话中的第一句由电视剧A中的角色a2所说，上述原始对话中的第二句由电视剧A中的角色a1所说。

该实施方式中，可基于角色a1在电视剧A中风格，得到扩充对话：

“给我走快点，别墨迹！”

“人家自己会走，哼！”

其中，上述扩充对话中的第二句为带有角色a1风格的回答。该实施方式中，上述扩充对话便可作为角色a1对应的扩充对话集合样本中的扩充对话样本。

需要说明的是，之前风格化的对话模型由于高质量风格化数据对的缺少以及模型本身对话能力一般，导致最终风格化的对话效果一般，用户体验较差。该步骤中，在得到了原始对话集合样本和扩充对话集合样本后，便可根据原始对话集合样本和扩充对话集合样本，确定训练样本集。其中，训练样本集中可包括原始对话集合样本中的多个原始对话样本，也可包括扩充对话集合样本中的多个扩充对话样本。

在步骤S140中，电子设备得到了训练样本集以及初始对话模型后，便可基于训练样本集对初始对话模型进行训练，从而得到目标角色对应的目标对话模型。目标对话模型便可实现带有目标角色风格的对话。也就是说，当用户使用目标对话模型进行聊天对话时，目标对话模型便可输出带有目标角色风格的回答，让用户体验和角色互动对话的乐趣，提升用户粘性。

在一些实施方式中，

基于角色a1对应的目标角色模型，可实现表格1中的对话，其中，“输入”列表示输入至目标对话模型的问题语句，“角色a1”列表示角色a1对应的目标对话模型基于对应的问题语句而输出的回答语句。

表格1

在一些实施方式中，

基于角色b1对应的目标角色模型，可实现表格2中的对话，其中，“输入”列表示输入至目标对话模型的问题语句，“角色b1”列表示角色b1对应的目标对话模型基于对应的问题语句而输出的回答语句。

表格2

需要说明的是，由于该方法中得到训练样本集既包括基于电视剧的台词得到的原始对话集合样本，也包括目标角色对应的扩充对话集合样本，因此整个训练样本集可包括更加丰富的带有目标角色风格的语料，便可更好避免模型训练过拟合的问题，可以更好地得到效果较好的目标对话模型。

在一些实施方式中，

目标对话模型可应用于视频类应用程序中。用户在使用视频类应用程序观看完电视剧集后，可以进入聊天窗口，并可选择该剧中的角色作为聊天对象。

该角色对应的目标对话模型便可用该角色风格化的语言回答用户的提问，以让用户体验与上述角色进行互动对话的乐趣，提升用户粘性。

在一些实施方式中，

目标对话模型可应用于虚拟助手类应用程序中。用户在虚拟助手类应用程序的聊天对话中可以选择所喜欢的电视剧中的角色，虚拟助手类应用程序便可基于用户所选择的角色，调用对应的目标对话模型，并用相应的风格化语言回复用户，以提升使用体验。

需要说明的是，该目标对话模型除了可应用于上述场景外，也可应用于其他需要对话的场景，对此不作限定。

该方法中，可先基于中文闲聊预料数据集对同一语言模型进行训练，以得到具有对话能力的初始对话模型，然后可基于目标角色对应的多个原始问答对样本以及多个扩充问答对样本，得到数据足够丰富的训练样本集，并基于上述语料丰富的训练样本集对初始对话模型进行训练，从而得到与目标角色对应的目标对话模型，从而使得目标对话模型可以实现带有目标角色风格的回答，以便于用户基于目标对话模型实现与目标角色的对话体验，以提升满足用户的个性化求。

在一个示例性实施例中，提供了一种构建对话模型的方法，可应用于电子设备。

该方法中，扩充对话集合样本可包括预设扩充对话集合样本。预设扩充对话集合样本可包括多个预设扩充对话样本。预设扩充对话样本可人为基于目标角色的风格进行编写。也就是说，相关人员可基于目标角色的风格编写多个与目标角色的风格匹配的对话(记为预设扩充对话样本)，并由上述多个编写的对话构成预设扩充对话集合样本。

预设扩充对话集合样本可存储于互联网中，也可存储于电子设备的存储器中，也可存储于其他设备中，对此不作赘述。也就是说，电子设备可以从互联网获取预设扩充对话集合样本，也可从自身的存储器中或预设扩充对话集合样本，也可从而其他设备获取预设扩充对话集合样本，对此不作限定。

需要说明的是，通过在训练样本集中增加人为编写的且符合目标角色风格的对话，可以丰富目标角色对应的语料，从而提升目标对话模型的可靠性。

其中，扩充对话集合样本可包括模型扩充对话集合样本。模型扩充对话集合样本可以指基于模型进行扩充得到的对话集合样本。示例地，模型扩充对话集合样本可通过以下方式确定：

S210、获取目标角色对应的台词数据样本；

S220、根据台词数据样本，确定目标角色对应的回答集合样本；其中，回答集合样本包括目标角色对应的多个回答样本；

S230、基于中文闲聊语料数据集，确定问题数据集；

S240、基于设定对话匹配模型，对回答集合样本和问题数据集进行处理，以确定回答集合样本对应的模型扩充对话集合样本。

在步骤S210中，目标角色对应的台词数据样本指，目标角色所在的电视剧的台词数据。可以理解的，电视剧文件中一般包括该电视剧的台词数据文件，台词数据文件可包括该电视剧的全部台词数据。该步骤中，可通过获取上述台词数据文件来获取目标角色对应的台词数据样本。

在步骤S220中，电子设备得到了台词数据样本后，便可对台词数据样本进行分析处理，从中提取出目标角色的台词，作为目标角色对应的回答样本。然后，可将目标角色对应的多个回答样本构成的集合，确定为目标角色对应的回答集合样本。

需要说明的是，本申请中的回答语句(或回答样本)指一组对话中的第二句，其可以是陈述句，也可以问句，也可以是其他类型的语句，对此不作限定。

例如，基于台词数据样本，提取到了目标角色的2000句台词，然后便可将上述2000句台词构成的集合作为目标角色对应的回答集合样本。

再例如，基于台词数据样本，提取到了目标角色的2000句台词，其中，可将2000句台词中的陈述句构成的集合，确定为目标角色对应的回答集合样本。

需要说明的是，除了可通过上述方式得到目标角色对应的回答集合样本外，也可通过其他方式得到目标角色对应的回答集合样本，对此不作限定。

在步骤S230中，电子设备得到了中文闲聊语料数据集后，可对上述中文闲聊语料数据集进行分析处理，从中提取出问题语句，然后基于问题语句得到问题数据集。

需要说明的是，本申请中的问题语句指一组对话中的第一句，其可以是陈述句，也可以问句，也可以是其他类型的语句，对此不作限定。

其中，可以将中文闲聊语料数据集中每一组对话中的第一句作为问题语句，然后将所有的问题语句构成的集合，确定为问题数据集。

需要说明的是，除了通过上述方式得到问题数据集外，也可通过其他方式得到问题数据集，对此不作限定。

在步骤S240中，电子设备得到了问题数据集以及回答集合样本后，便可基于设定对话匹配模型，对上述回答集合样本和问题数据集进行处理，从而得到回答集合样本对应的模型扩充对话集合样本。

其中，可基于中文闲聊语料数据集，对第二预训练模型进行训练，从而得到设定对话匹配模型。设定对话匹配模型可以确定输入对话的置信度。需要说明的是，第二预训练模型可以是基于BERT(一种预训练的语言表征模型)的双塔匹配模型，也可以是其他类型的模型，对此不作限定。

在一些实施方式中，

电子设备得到问题数据集和回答集合样本后，可将回答集合样本中的每一个回答样本分别与问题数据集中的问题语句构成一组扩充对话，从而得到多组扩充对话。然后，将每组扩充对话输入至设定对话匹配模型中，设定对话匹配模型便可输出对应的置信度。置信度可以表征上述扩充对话作为一组真实对话的可信程度。置信度越高，则说明上述扩充对话更像一组真实对话，或者说更有可能作为一组真实存在的对话。

其中，在确定每组扩充对话的置信度后，便可将置信度满足要求(例如置信度大于设定阈值)的扩充对话，确定为扩充对话样本，然后将多个(例如全部)扩充对话样本构成的集合，确定为模型扩充对话集合样本。

需要说明的是，设定阈值可根据实际需求设置，对其具体数值可不作限定。另外，除了可通过上述方式确定模型扩充对话集合样本外，也可通过其他方式确定模型扩充对话集合样本，对此不作限定。

该方法中，可基于人为编写得到与目标角色风格匹配的预设扩充对话集合样本，也可基于设定对话匹配模型，得到与目标角色风格匹配的模型扩充对话集合样本，从而丰富目标角色对应的语料，然后基于更加丰富的语料，便可得到更加靠谱的目标对话模型，使得用户可以更好地体验与目标角色对话的乐趣。

在一个示例性实施例中，提供了中构建对话模型的方法，可应用于电子设备。该方法中，基于设定对话匹配模型，对回答集合样本和问题数据集进行处理，以确定回答集合样本对应的模型扩充对话集合样本，包括：

S310、根据回答集合样本中的回答样本以及问题数据集中的问题语句，构建多个扩充对话；

S320、将扩充对话输入设定对话匹配模型，以确定扩充对话对应的置信度；

S330、将同一回答样本对应的扩充对话中，置信度符合要求的扩充对话，确定为回答样本对应的扩充对话样本；

S340、根据多个回答样本对应的扩充对话样本，确定模型扩充对话集合样本。

在步骤S310中，可将回答集合样本中的每一个回答样本分别与问题数据集中的问题语句构成一组扩充对话，从而得到多个扩充对话。

在一些实施方式中，

回答集合样本可包括X个回答样本，问题数据集可包括Y个问题语句。该实施方式中，可将X个回答样本中每个回答样本分别与Y个问题语句构成一个扩充对话，从而得到X*Y个扩充对话。X和Y分别为大于或等于1的正整数。

在步骤S320中，电子设备得到了多个扩充对话后，便可将扩充对话输入至设定对话匹配模型中，设定对话匹配模型便可对输入的扩充对话进行分析处理，然后输出上述扩充对话对应的置信度。

置信度可以表征上述扩充对话作为一组真实对话的可信程度。置信度越高，则说明上述扩充对话更像一组真实对话，或者说更有可能作为一组真实存在的对话。

在步骤S330中，电子设备得到了全部扩充对话对应的置信度后，可先从多个扩充对话中，确定同一回答样本对应的多个扩充对话，然后将同一回答样本对应的多个扩充对话中，置信度排行位于前N位的扩充对话，确定为该同一回答样本对应的N个扩充对话样本。N为大于或等于1的正整数。例如，N可以是3，也可以是5，对此不作限定。

在步骤S340中，电子设备确定扩充对话样本后，可将同一回答样本对应的扩充对话样本记为同一类型的扩充回答样本，然后，可将多种类型的扩充回答样本构成的集合，确定为模型扩充对话集合样本。

例如，回答样本集合可包括X个回答样本，电子设备得到每个回答样本对应的N个扩充对话样本后，可将X个回答样本中，全部回答样本对应的全部扩充对话样本构成的集合，确定为模型扩充对话集合样本。

需要说明的是，除了可通过上述方式确定模型扩充对话集合样本外，也可通过其他方式确定模型扩充对话集合样本，对此不作限定。

该方法中，可基于目标角色对应的台词得到的回答集合样本，以及中文闲聊语料数据集得到的问题数据集，来确定多个扩充对话，然后可基于设定对话匹配模型得到扩充对话的置信度，然后基于置信度得到与目标角色风格匹配的模型扩充对话集合样本，从而得到可靠性更好地的模型扩充对话集合样本，以更好地丰富目标角色对应的语料，然后基于更加丰富的语料，便可得到更加靠谱的目标对话模型，使得用户可以更好地体验与目标角色对话的乐趣。

在一个示例性实施例中，提供了一种构建对话模型的方法，可应用于电子设备。该方法中，原始对话集合样本可通过以下方式确定：

S410、获取台词数据样本；

S420、根据台词数据样本，确定目标人物对应的回答集合样本；其中，回答集合样本包括目标人物对应的多个回答样本；

S430、根据对话匹配规则和回答集合样本，从台词数据样本中确定回答集合样本对应的原始对话集合样本。

需要说明的是，上述步骤S410和步骤S420可分别参考其他实施例中的步骤S210和步骤S220，对此不作赘述。

在步骤S430中，对话匹配规则可根据实际情况设置，对其具体内容可不作限定。示例地，对话匹配规则可包括与对话顺序以及时间间隔相关的等规则。

该步骤中，电子设备得到了台词数据样本和回答集合样本后，便可基于回答集合样本，从台词数据样本中提取负荷对话匹配规则的对话，然后将提取的对话构成的集合，确定为原始对话集合样本。

在一些实施方式中，

台词数据样本中可包括每句台词的具体内容、该台词对应的角色以及该台词对应的开始时刻和结束时刻。

对话匹配规则可包括：

规则1，当前台词是目标角色的台词；

规则2，前一句台词是非目标角色的台词；

规则3，前一句台词和当前台词的时间间隔小于2s(也可根据实际情况设置为其他设定时长)。

该实施方式中，可先从台词数据样本中定位回答集合样本中的回答样本，然后再判断该回答样本上的前一句台词是否为非目标角色的台词，以及判断前一句台词与该回答样本之间的时间间隔是否小于2s。

若确定该回答样本上的前一句台词为非目标角色的台词，且前一句台词与该回答样本之间的时间间隔小于2s，则将上述前一句台词以及该回答样本构成对话确定为一个原始对话样本。

若确定该回答样本上的前一句台词不是非目标角色的台词，和/或，前一句台词与该回答样本之间的时间间隔不小于2s，则不将上述前一句台词以及该回答样本构成对话确定为一个原始对话样本。

该实施方式中，通过上述方式，便可得到每个回答样本对应的原始对话样本，然后将得到的全部原始对话样本构成的集合，确定为回答集合样本对应的原始对话集合样本。

需要说明的是，除了可通过上述方式得到原始对话集合样本外，也可通过其他方式得到原始对话集合样本，对此不作限定。

该方法中，可基于设定的对话匹配规则从台词数据样本中得到可靠性更好地目标角色的原始对话集合样本，从而得到可靠性更好地目标角色对应的语料，便可得到更加靠谱的目标对话模型，使得用户可以更好地体验与目标角色对话的乐趣。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。该装置可用于实施上述的构建对话模型的方法。示例地，参考图2所示，该装置可包括获取模块10和确定模块20，其中，该装置在实施上述方法的过程中，

获取模块10，用于获取中文闲聊语料数据集；

确定模块20，用于基于中文闲聊语料数据集对第一预训练模型进行训练，以确定初始对话模型；

获取模块10，还用于获取训练样本集；其中，训练样本集包括原始对话集合样本和扩充对话集合样本，原始对话集合样本包括目标角色对应的多个原始对话样本，扩充对话集合样本包括目标角色对应的多个扩充对话样本；

确定模块20，还用于基于训练样本集，对初始对话模型进行训练，以确定目标角色对应的目标对话模型。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。该装置中，扩充对话集合样本包括模型扩充对话集合样本和/或预设扩充对话集合样本。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。参考图2所示，该装置中，

获取模块10，可用于获取目标角色对应的台词数据样本；

确定模块20，可用于根据台词数据样本，确定目标角色对应的回答集合样本；其中，回答集合样本包括目标角色对应的多个回答样本；

还用于基于中文闲聊语料数据集，确定问题数据集；

还用于基于设定对话匹配模型，对回答集合样本和问题数据集进行处理，以确定回答集合样本对应的模型扩充对话集合样本。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。该装置中，设定对话匹配模型通过一下方式构建：

基于中文闲聊语料数据集，对第二预训练模型进行训练，以确定设定对话匹配模型。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。参考图2所示，该装置中，

确定模块20，可用于根据所述回答集合样本中的回答样本以及所述问题数据集中的问题语句，构建多个扩充对话；

还用于将扩充对话输入设定对话匹配模型，以确定扩充对话对应的置信度；

还用于将同一回答样本对应的扩充对话中，置信度符合要求的扩充对话，确定为回答样本对应的扩充对话样本；

根据多个回答样本对应的扩充对话样本，确定模型扩充对话集合样本。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。参考图2所示，该装置中，

确定模块20，还可用于将同一回答样本对应的扩充对话中，置信度排行位于前N位的扩充对话，确定为回答样本对应的扩充对话样本。

在一个示例性实施例中，提供了一种构建对话模型的装置，可应用于电子设备。参考图2所示，该装置中，

获取模块10，可用于获取台词数据样本；

确定模块20，可用于根据台词数据样本，确定目标人物对应的回答集合样本；其中，回答集合样本包括目标人物对应的多个回答样本；

还用于根据对话匹配规则和回答集合样本，从台词数据样本中确定回答集合样本对应的原始对话集合样本。

在一个示例性实施例中，提供了一种电子设备。电子设备可以包括台式电脑、笔记本电脑以及其他具有模型训练能力的设备等等，对此不作限定。

其中，参考图3所示，电子设备100包括：至少一个处理器101、存储器102、至少一个网络接口104和用户接口103。电子设备100中的各个组件通过总线系统105耦合在一起。可理解，总线系统105用于实现这些组件之间的连接通信。总线系统105除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了说明的清楚起见，在图中将各种总线都标为总线系统105。

其中，用户接口103可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball))、触感板或者触摸屏等。

可以理解，本申请实施例中的存储器102可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM，DRRAM)。本文描述的存储器102旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器102存储了如下的元素，可执行单元或者数据结构，或者他们的子集，或者他们的扩展集：操作系统1021和应用程序1022。

其中，操作系统1021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序1022，包含各种应用程序，例如媒体播放器(Media Player)、浏览器(Browser)等，用于实现各种应用业务。实现本申请实施例方法的程序可以包含在应用程序1022中。

在本申请实施例中，通过调用存储器102存储的程序或指令，具体的，可以是应用程序1022中存储的程序或指令，处理器101用于执行各方法实施例所提供的方法步骤。

上述本申请实施例揭示的方法可以应用于处理器101中，或者由处理器101实现。处理器101可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器102，处理器101读取存储器102中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable LogicDevice，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本实施例提供的终端可执行上述的数据处理方法的所有步骤，进而实现上述数据处理方法的技术效果，具体请参照上述数据处理方法的相关描述，为简洁描述，在此不作赘述。

本申请实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中，存储介质可以包括易失性存储器，例如随机存取存储器；存储器也可以包括非易失性存储器，例如只读存储器、快闪存储器、硬盘或固态硬盘；存储器还可以包括上述种类的存储器的组合。

当存储介质中一个或者多个程序可被一个或者多个处理器执行，以实现上述在电子设备侧执行的方法。处理器用于执行存储器中存储的程序，以实现以下在电子设备侧执行的方法。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式，对本申请的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本申请的具体实施方式而已，并不用于限定本申请的保护范围，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京奇艺世纪科技有限公司;

上一篇：图像数据处理方法、装置、计算机设备和存储介质
下一篇：消息处理方法、装置、电子设备及存储介质