模型训练方法、装置、智能机器人和存储介质

文献发布时间：2023-06-19 11:29:13

技术领域

本发明涉及人工智能技术领域，尤其涉及一种模型训练方法、装置、智能机器人和存储介质。

背景技术

随着人工智能技术的发展，各种智能机器人比如服务机器人、清洁机器人、自移动售货机器人等，越来越多地进入人们的生活。智能机器人在接收到用户输入的对话内容后，会利用自身内部配置的对话系统对此对话内容进行自然语言理解、信息抽取、自然语言生成等一系列处理，最终生成与对话内容对应的应答内容，也即是实现了人机交互。

在实际应用中，对话系统是复杂系统，其通常可以由多个预测模型组成，比如文本匹配模型、文本分类模型、文本序列标注模型等等，而每个预测模型输出结果的可靠程度都会对人机交互的效果产生重要影响。

发明内容

本发明实施例提供一种模型训练方法、装置和存储介质，用以提高模型训练的效率。

本发明实施例提供一种模型训练方法，应用于智能机器人，该方法包括：

获取对应于人机交互过程的真实语句；

将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

本发明实施例提供一种模型训练装置，包括：

获取模块，用于获取对应于人机交互过程的真实语句；

输入模块，用于将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定模块，用于确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

训练模块，用于根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

本发明实施例提供一种智能机器人，包括：处理器和存储器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现：

获取对应于人机交互过程的真实语句；

将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

本发明实施例提供了一种存储计算机指令的计算机可读存储介质，当所述计算机指令被一个或多个处理器执行时，致使所述一个或多个处理器至少执行以下的动作：

获取对应于人机交互过程的真实语句；

将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

在本发明实施例中，随着智能机器人的不断使用，可以不断获取到对应于人机交互过程的真实语句。将此真实语句输入至第一模型，以使第一模型输出对应于真实语句的预测结果以及预测结果的置信度。然后，将真实语句中预测结果的置信度大于或等于预设阈值的语句确定为第一语句。相比于真实语句中的其他语句，第一语句的预测结果更为可靠。最终，再将第一语句以及第一语句的预测结果作为训练样本进行模型训练，从而训练出与第一模型具有相同功能的第二模型。

现有技术中，一方面，用于模型训练的样本是需要人工标注的，而上述用于模型训练的第一语句的预测结果即可认为是其的标注结果，并且此标注结果是借助第一模型自动得到的。也就是说使用本发明提供的模型训练方法训练模型时，不需要人工标注，从而可以提高模型训练的效率。另一方面，用于训练模型的样本通常是从网络上收集到的，这些样本的时效性和实用性往往不强，从而导致模型训练的效果不佳。而本发明提供的训练方法中使用的训练样本是在人机交互过程中产生的真实语句，这种语句具有较强的实用性，因此也就能够进一步保证模型训练的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种模型训练方法的流程图；

图2为本发明实施例提供的另一种模型训练方法的流程图；

图3为本发明实施例提供的一种真实语句获取方式的流程图；

图4a为本发明实施例提供的一种第四语句确定方式的流程图；

图4b为本发明实施例提供的另一种第四语句确定方式的流程图；

图4c为本发明实施例提供的又一种第四语句确定方式的流程图；

图4d为本发明实施例提供的又一种第四语句确定方式的流程图；

图5为本发明实施例提供的一种模型训练装置的结构示意图；

图6为与图5所示实施例提供的模型训练装置对应的智能机器人的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式。除非上下文清楚地表示其他含义，“多个”一般包含至少两个。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

下面结合以下的实施例对本文提供的模型训练方法进行详细介绍。同时，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

在实际应用中，该模型训练方法可以由模型训练设备来执行。可选地，此模型训练设备具体可以是诸如清洁机器人、迎宾机器人、自移动售货机器人等智能机器人，也可以是独立于智能机器人的其他训练设备。并且上述的智能机器人是能够在一定空间内自由移动，并完成用户下达的指令的。下面以智能机器人作为模型训练方法的执行主体为例对下述各实施例进行说明。当然这只是一种举例说明，本发明并不对执行主体进行限定。

图1为本发明实施例提供的一种模型训练方法的流程图，该方法的执行主体可以为机器人，如图1所示，该方法可以包括如下步骤：

101、获取对应于人机交互过程的真实语句。

智能机器人可以放置于一使用场景中，然后，用户在进行人机交互的过程中可以产生相应的真实语句。并且智能机器人在每接收到一条真实语句后都会其进行存储，因此在智能机器人使用一段时间后，其便可以获取到用户在这一时间段内产生的至少一条真实语句。

对于真实语句，具体来说，智能机器人可以配置有供用户输入交互语句的操作屏幕，此时，产生的真实语句表现为文字形式。另外，智能机器人上还可以安装有诸如麦克风等拾音器件，当用户说出一条真实语句时，智能机器人便可以通过此拾音器件采集到语音形式的真实语句。当用户产生的是语音形式的真实语句时，智能机器人便会将此语音形式的真实语句转化为文字形式的真实语句，以便对其进行后续处理。

当然，在不同的应用场景中，用户产生的真实语句的内容也是多种多样的。比如当用户想要查询天气情况时，可以对智能机器人发出“明天的天气如何”这样的真实语句。当用户在购物时，可以对智能机器人发出“最近有什么团购吗”这样的真实语句。

102、将真实语句输入至第一模型，以使第一模型输出真实语句的预测结果的置信度。

然后，智能机器人可以将获取到的真实语句输入至第一模型中，此第一模型则会输出真实语句的预测结果以及此预测结果的置信度。预测结果的置信度越高，则表明此预测结果越准确。

可选地，此第一模型可以是智能机器人具有的对话系统中包含的任一种模型，比如文本匹配模型，文本分类模型，文本序列标注模型，文本生成模型等等。其中，文本匹配模型通常适用于单轮对话过程中，文本分类模型、文本序列标注模型以及文本生成模型结合可以适用于多轮对话过程中。

并且此第一模型可以是在智能机器人正式投入使用之前已经训练得到的一个模型。但由于训练第一模型时使用到的训练样本是通过互联网得到的，样本的实用性和时效性都不高，因此，此第一模型实际上只是一个只完成初步训练的模型，此模型的训练效果欠佳。

103、确定预测结果的置信度大于或等于预设阈值的语句为第一语句。

在第一模型输出每条真实语句预测结果的置信度后，智能机器人还可以将其中置信度大于或等于预设阈值的真实语句筛选出来，再将筛选结果确定为第一语句。筛选出的第一语句实际上都是预测结果较为可靠的真实语句。并且可以理解的，第一语句的数量实际上反映了第一模型的训练效果。第一语句的数量越多，则第一模型的训练效果越好。

其中，预设阈值可以设置为0～1中的任一数值，并且其的设定还可以参考第一模型的训练效果。比如，若在训练第一模型时使用到的、网络上获取的训练样本数量较多，则第一模型的训练效果通常也会较好，此时，预设阈值可以设置为一个较小的数值，比如0.6。又比如，若从网络上获取的训练样本数量少，则第一模型的训练效果通常较差，此时，预设阈值可以设置为一个较大的数值，比如0.9。

104、根据第一语句以及第一语句的预测结果进行模型训练模型，以得到与第一模型具有相同功能的第二模型。

最后，再将第一语句以及第一语句的预测结果作为新的训练样本进行模型训练，以得到第二模型。当然，此第二模型与第一模型具有相同的功能。

为了后续描述简洁，可以将由第一语句以及其预测结果组成的训练样本称为第一样本，对于根据第一样本进行模型训练，一种可选地方式，可以根据此第一样本重新训练出一个模型也即是第二模型。由于训练此第二模型使用到的第一样本是预测结果可靠的真实语句，因此，相比于第一模型，重新训练得到的第二模型具有更准确的预测结果。当然，使用这种方式通常适用于第一样本数量较多并且样本内容覆盖范围较广的情况。

另一种可选地方式，还可以在第一模型的基础上，使用第一样本对第一模型进行再训练，以得到第二模型。此种方式也即是用真实语句对第一模型进行优化，从而得到预测结果更准确的第二模型。

在本实施例中，先获取到对应于人机交互过程的真实语句，然后，将此真实语句输入至第一模型，以由第一模型输出对应于真实语句的预测结果以及预测结果的置信度。将预测结果的置信度大于或等于预设阈值的第一语句以及第一语句的预测结果作为训练样本进行模型训练，以训练出与第一模型具有相同功能的第二模型。对于本发明提供的方法，一方面，由于第一语句的预测结果可认为是其的标注结果，并且此标注结果是借助第一模型自动得到的，也就是说此模型训练的过程中不需要人工标注，因此可以提高模型训练的效率。另一方面，在训练模型时使用到的是真实语句，由于这种语句具有较强的实用性和时效性，因此，也能够进一步保证模型训练的效果。

在上述对真实语句进行筛选的过程中，除了置信度大于或等于预设阈值的第一语句，容易理解的，还会存在小于预设阈值的真实语句。为了便于后续描述的简洁，可以将置信度小于预设阈值的语句称为第二语句。并且在上述实施例中，这部分第二语句是被滤除的，并没有参与到第二模型的训练。为了提高真实语句的使用效率，图2为本发明实施例提供的另一种模型训练方法的流程图，如图2所示，在图1所示实施例的基础上，该方法可以包括如下步骤：

201、确定预测结果的置信度小于预设阈值的语句为第二语句。

202、修正第二语句的预测结果，以得到修正结果。

203、根据第二语句以及第二语句的修正结果进行模型训练。

智能机器人在根据预设阈值对真实语句进行筛选的过程中，可以根据置信度将真实语句预测结果的置信度小于预设阈值的语句确定为第二语句。相比与第一语句，此第二语句的预测结果是不可靠的，因此，还可以对第二语句的预测结果进行修正，以得到修正结果，以使第二语句以及第二语句的修正结果能够参与到后续的模型训练过程中。

可选地，对预测结果的修正可以采用人工方式。具体来说，可以由人工对第二语句进行标注，并将标注结果确定为修正结果。此处，第二语句的修正结果可以相当于第一语句的预测结果。最后，将第二语句和第二语句的修正结果作为训练样本进行模型训练。

为了后续描述简洁，可以将由第二语句以及其修正结果组成的训练样本称为第二样本，对于根据第二样本进行模型训练，图2所示的步骤201～203可以放在步骤104之后执行，此时，一种可选地方式，可以在第二模型的基础上，用第二样本对第二模型进行再训练，以得到第三模型。此种方式也即是用真实的第二语句对第二模型进行优化，从而得到预测效果更好的第三模型。

另外，图2所示的步骤201～203还可以在步骤103之后执行，此时，另一种可选地方式，还可以根据此第二样本重新训练出一个模型也即是第三模型。由于训练此第三模型使用的第二样本是修正结果可靠的真实语句，因此，相比于第一模型，重新训练得到的第三模型具有更准确的预测结果。

又一种可选地方式，还可以在第一模型的基础上，用第二样本对第一模型进行再训练，以得到第三模型。此种方式也即是用真实的第二语句对第一模型进行优化，从而得到预测效果更好的第三模型。

在上述两种情况下，可以认为根据第一语句训练出第二模型以及根据第二语句训练出第三模型是两个独立的过程，对于分别训练出的第二模型和第三模型可以根据实际需求选择具体使用哪个。

当然训练出的第三模型都是与上述实施例中的第一模型和第二模型能够实现相同功能的模型。

本实施例中，在模型训练的过程中，对于预测结果可靠度较低的第二语句，通过对其的预测结果的修正，以得到高可靠度的修正结果。然后，再使用第二语句和高可靠度的修正结果来进行模型训练。图1所示实施例能够提高模型的训练效率，在此基础上，通过对预测结果的修正，可以使第二语句也参与到模型训练的过程中。依次使用第一语句和第二语句进行多次训练，也能够进一步优化模型训练的效果。

上述各实施例中提到的用于模型训练的真实语句是用户在使用智能机器人过程中产生的，又因为训练样本越多则训练出模型的准确性也就越好。因此，还可以对用户产生的真实语句进行数据增强，以达到丰富训练样本的效果。与用户产生的真实语句相同的，通过数据增强得到的真实语句同样也认为对应于用户的人机交互过程。

则基于上述各实施例，可选地，一种获取真实语句具体实现方式，也即是步骤101的一种具体实现方式可以如图3所示，该方式包括以下步骤：

301、获取在人机交互过程中用户产生的第三语句。

302、确定与第三语句具有相同语义的第四语句。

303、将第三语句与第四语句确定为真实语句。

在智能机器人获取到用户产生的第三语句后，还可以对此第三语句进行数据增强，也即是自动生成一些与第三语句具有相同语义的第四语句。由第三语句与数据增强后得到的第四语句共同组成对应于人机交互过程的真实语句。

而对于第四语句的确定可以有多种可选地实现方式，比如将第三语句中的词语进行替换，以得到第四语句，其中，此替换词的确定可以根据同义词库或者语言模型得到。又比如使用复述模型生成与第三语句语义相同的第四语句。又比如使用翻译模型对第三语句进行多语言翻译后得到第四语句。而不同方式的具体实现过程可以参见下图4a～图4d中的具体描述。

本实施例中，通过对第三语句进行数据增强，以使得在模型训练中使用到的真实语句的数量大大增加，也即是使得第一语句和第二语句的数量也大大增加，也即是使得模型训练的训练样本的数量大大增加，从而最终提高模型训练的效果。

可选地，一种确定第四语句具体实现方式，也即是步骤302的一种具体实现方式可以如图4a所示，该方式包括以下步骤：

401、对第三语句进行分词处理。

402、若分词结果中的目标词语存在于预先建立的同义词词库中，则在同义词词库中确定目标词语的同义词语，其中，目标词语为第三语句中的任一词语。

403、用同义词语替换目标词语，以得到第四语句。

具体来说，先对用户在人机交互中产生的第三语句进行分词处理，以得到分词结果。然后，再将分词结果中的目标词语与预先建立的同义词词库中的词语进行比对，以确定此目标词语是否存在于同义词词库中。若存在，则进一步在同义词词库中确定此目标词语的同义词。可选地，一个目标词语可以具有至少一个同义词。当目标词语具有N个同义词时，则可以分别用每个同义词来替换目标词语，从而得到N个第四语句。

需要说明的是，对于目标词语，其可以是分词结果中的任意一个，则在实际应用中，可以将分词结果中的每个词语都进行同义词替换处理。由于第三语句中包括目标多个词语，而每个目标词语又都具有至少一个同义词，因此，一个第三语句就可以得到数量众多的第四语句，从而大大扩大了真实语句的数量。

在上述各实施例的基础上，可选地，另一种确定第四语句具体实现方式，也即是步骤302的一种具体实现方式可以如图4b所示，该方式包括以下步骤：

501、对第三语句进行分词处理。

502、将分词结果中的目标词语进行遮盖处理，目标词语为第三语句中的任一词语。

503、将遮盖后的第三语句输入到语言模型中，以使语言模型根据目标词语在第三语句中的位置和位置的上下文词语预测出候选词语。

504、用候选词语替换目标词语，以得到第四语句。

具体来说，与图4a所示方式类似，同样先对用户在人机交互中产生的第三语句进行分词处理，以得到分词结果。再将第三语句中的目标词语进行遮盖处理，此遮盖处理可以理解为将分词结果中的目标词语在第三语句中的位置进行标记，其中，目标词语可以是第三语句中的任一词语。然后，再将遮盖处理后的第三语句输入至智能机器人内部配置的语言模型中。举例来说，遮盖处理可以具体表现为：第三语句为“欢迎购买我行的理财产品A”，假设将目标词语为“欢迎”，则将“欢迎”进行遮盖，遮盖结果为“[MASK]购买我行的理财产品A”。

之后，语言模型则可以根据目标词语所在位置的上下文词语，即非目标词语，预测出与目标词语对应的候选词语。此预测过程具体可以为：语言模型将训练过程中使用到的训练样本中包括的各个词语依次填入到第三语句中的遮盖位置，用以替换目标词语，并基于替换结果计算每个训练样本中包括的词语与此遮盖后的第三语句中的非目标词语之间的匹配值，根据匹配值高低确定候选词语，比如可以将匹配值最高的词语确定为候选词语。此时，智能机器人便可以根据语言模型输出的候选词语得到第四语句。

其中，上述的语言模型具体可以实现为：变换双向编码表示(BidirectionalEncoder Representation From Transformers，简称BERT)模型、增强语义表示(EnhancedRepresentation from kNowledge IntEgration，简称ERNIE)模型等等。

在上述各实施例的基础上，可选地，又一种确定第四语句具体实现方式，也即是步骤302的一种具体实现方式可以如图4c所示，该方式包括以下步骤：

601、将第一语种的第三语句输入至翻译模型，以由翻译模型翻译得到第二语种的第五语句。

602、将第五语句输入至翻译模型，以由翻译模型翻译得到第一语种的第四语句。

具体来说，将第一语句中的第三语句输入至翻译模型中，以由此翻译模型将第一语种的第三语句翻译为第二语种的第五语句。其中，可选地，此翻译模型可以是智能机器人内部预先配置的。接着，再将第二语种的第五语句再次输入至此翻译模型中，翻译模型会再将此第二语种的第五语句翻译回第一语种，此时得到的翻译结果也即是具有第一语种第四语句。

通过上述的语种转换过程可以使得到的第四语句与原始的第三语句具有相同的语义。同时也正是由于这种语种间转换的处理，可以使得第三语句和第四语句具有不同的表达方式，也即是达到了丰富真实语句的效果。

在上述各实施例的基础上，可选地，又一种确定第四语句具体实现方式，也即是步骤302的一种具体实现方式可以如图4d所示，该方式包括以下步骤：

701、将第三语句输入至复述模型的编码器中，以由编码器将第三语句编码成预设长度的语义向量。

702、将语义向量输入至复述模型的解码器中，以由解码器生成第四语句。

具体来说，智能机器人将此第三语句输入至自身配置的复述模型中，以由复述模型中的编码器对第三语句进行编码，以得到对应于第三语句的预设长度的语义向量。然后，再由复述模型中的解码器对语义向量进行解码，解码的结果也即是第四语句。

可选地，上述的复述模型可以具体表现为：序列到序列模型(sequence tosequence，简称seq2seq)模型、遮蔽序列到序列预训练(Masked sequence to sequencepre-training，简称MASS)模型等等。

需要说明的是，复述模型实际上可以认为是一种特殊的翻译模型，其实现的是同种语言之间的翻译。基于此，图4c所示实施例中的翻译模型同样也包括编码器和解码器，此时，可以利用翻译模型中的解码器和编码器来实现将第一语种的第三语句翻译成第二语种的第五语句以及实现将第二语种的第五语句翻译为第一语种的第四语句。

综上所述，对于上述提供的多种第四语句的确定方式也即是多种第三语句的数据增强方式，可以根据实际需求选择使用其中的一种或几种。

另外，需要说明的还有，上述各实施例均是以智能机器人作为执行主体进行描述的。而正如上述描述中提及的，本发明提供的各实施例的执行主体也可以是独立于智能机器人的模型训练设备，因此，当智能机器人采集到产生于一定时间段内的真实语句，可以将此真实语句发送至此模型训练设备，此时，模型训练设备便可以继续执行本发明各实施例提供的模型训练方法。

以下将详细描述本发明的一个或多个实施例的模型训练装置。本领域技术人员可以理解，这些模型训练装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。

图5为本发明实施例提供的一种模型训练装置的结构示意图，如图5所示，该装置包括：

获取模块11，用于获取对应于人机交互过程的真实语句。

输入模块12，用于将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度。

确定模块13，用于确定预测结果的置信度大于或等于预设阈值的语句为第一语句。

训练模块14，用于根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

可选地，该模型训练装置中的确定模块13还可以用于：确定预测结果的置信度小于所述预设阈值的语句为第二语句。

该模型训练装置还可以包括：修正模块21，用于修正所述第二语句的预测结果，以得到修正结果。

该模型训练装置中的训练模型14还可以用于：根据所述第二语句以及所述第二语句的修正结果进行模型训练，以得到与所述第一模型具有相同功能的第三模型。

可选地，该模型训练装置中的获取模块11包括：

获取单元111，用于获取在人机交互过程中用户产生的第三语句。

第一确定单元112，用于确定与所述第三语句具有相同语义的第四语句。

第二确定单元113，用于将所述第三语句与所述第四语句确定为所述真实语句。

为了确定出上述的第四语句，可选地，该模型训练装置中的第一确定单元112具体用于：对所述第三语句进行分词处理；

若分词结果中的目标词语存在于预先建立的同义词词库中，则在所述同义词词库中确定所述目标词语的同义词语，其中，所述目标词语为所述第三语句中的任一词语；

用所述同义词语替换所述目标词语，以得到所述第四语句。

可选地，该模型训练装置中的第一确定单元112具体用于：对所述第三语句进行分词处理；

将分词结果中的目标词语进行遮盖处理，所述目标词语为所述第三语句中的任一词语；

将遮盖后的所述第三语句输入到语言模型中，以使所述语言模型根据所述目标词语在所述第三语句中的位置和所述位置的上下文词语预测出候选词语；

用所述候选词语替换所述目标词语，以得到所述第四语句。

可选地，该模型训练装置中的第一确定单元112具体用于：将第一语种的所述第三语句输入至翻译模型，以由所述翻译模型翻译得到第二语种的第五语句；

将所述第五语句输入至所述翻译模型，以由所述翻译模型翻译得到第一语种的所述第四语句。

可选地，该模型训练装置中的第一确定单元112具体用于：将所述第三语句输入至复述模型的编码器中，以由所述编码器将所述第三语句编码成预设长度的语义向量；

将所述语义向量输入至所述复述模型的解码器中，以由所述解码器生成所述第四语句。

图5所示模型训练装置可以执行前述图1至图4d所示实施例提供的模型训练方法，本实施例未详细描述的部分，可参考对图1至图4d所示实施例的相关说明，在此不再赘述。

以上描述了模型训练装置的内部功能和结构，在一个可能的设计中，模型训练装置的结构可实现为智能机器人中的一部分，如图6所示，该智能机器人可以包括：处理器31和存储器32。其中，所述存储器32用于存储支持该智能机器人执行前述图1至图4d所示实施例中提供的模型训练方法的程序，所述处理器31被配置为用于执行所述存储器32中存储的程序。

所述程序包括一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器21执行时能够实现如下步骤：

获取对应于人机交互过程的真实语句；

将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

可选地，所述处理器31还用于执行前述图1至图4d所示实施例中的全部或部分步骤。

其中，所述智能机器人的结构中还可以包括通信接口33，用于与其他设备或通信网络通信。

另外，本发明实施例提供了一种存储计算机指令的计算机可读存储介质，当所述计算机指令被一个或多个处理器执行时，致使所述一个或多个处理器至少执行以下的动作：

获取对应于人机交互过程的真实语句；

将所述真实语句输入至第一模型，以使所述第一模型输出所述真实语句的预测结果的置信度；

确定预测结果的置信度大于或等于预设阈值的语句为第一语句；

根据所述第一语句以及所述第一语句的预测结果进行模型训练模型，以得到与所述第一模型具有相同功能的第二模型。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现，当然也可以通过硬件和软件结合的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来。

为便于理解，结合如下的应用场景对以上提供的模型训练方法的具体实现进行示例性说明。

以银行这种公共服务场景为例，银行中可能会设置诸如服务机器人等智能终端设备。这种智能机器人内配置的对话系统可以包括能实现各种功能的模型，比如文本匹配模型、文本分类模型、文本生成模型等等。其中，文本分类模型可以用于判断真实语句的类型，比如判断出真实语句的情感类型，这种情感类型也可以认为是真实语句的意图。文本匹配模型可以用于识别真实语句的意图。在不同的使用场景下，文本生成模型可以根据真实语句的意图或者真实语句的类型生成对应的应答语句，从而实现正常的人机交互。

假设是对上述的文本匹配模型训练，则智能机器人在使用一段时间后，能够获取到真实语句A：“我想要兑换美元”、真实语句B：“我想要取款”以及真实语句C：“我想要办理一张银行卡”。这三条语句也即是上述各实施例中的第三语句，它们都属于真实语句。然后，可以将三条真实语句输入第一模型，第一模型可以预测真实语句A的意图是“兑换美元”，预测结果置信度为0.8；真实语句B的意图是“取款”，预测结果置信度为0.85；真实语句C的意图是“办理银行卡”，预测结果置信度为0.4。

当预设阈值为0.6时，则根据此预设阈值可以将真实语句A和真实语句B确定为第一语句。最后，在将真实语句A和真实语句B以及各自对应的预测结果作为训练样本进行模型训练，以得到第二模型，此第二模型也是一个文本分类模型。可选地，此第二模型可以是仅根据真实语句A和真实语句B单独训练出来的模型，也可以根据真实语句A和真实语句B对第一模型进行优化，从而得到第二模型。

由于真实语句A和真实语句B是智能机器人在实际使用过程中产生的，其的实用性和有效性要远远大于那些从网络上搜集来的语句，因此，将此根据真实语句A和真实语句B作为训练样本训练出的第二模型具有更准确的预测结果。

而对于预存结果置信度较低的真实语句C也即是第二语句，还可以对其的预测结果进行修正，以保证修正后得到的修正结果具有较高的置信度。对真实语句C的修正，可选地，可以采用人工方式修正。也即是人工将真实语句C以及其的修正结果输入至智能机器人，此时，智能机器人便可以将真实语句C以及其的修正结果作为训练样本进行模型训练，以得到第三模型。此第三模型也是一个文本分类模型。

可选地，此第三模型可以是仅根据真实语句C单独训练出来的模型，也可以根据真实语句C对第一模型进行优化，从而得到第三模型，也可以根据真实语句C对第二模型进行优化，从而得到第三模型。

上述的真实语句A～真实语句C是用户产生的，也即是上述实施例中的第三语句，并且容易理解的，训练样本越多则训练出的模型的预测结果也越准确。因此，对于上述的真实语句A～真实语句C，还可以对其进行数据增强，以得到与这些第三语句语义相同但表述形式不太相同的语句即第四语句。数据增强的具体实现方式可以参见上述如图4a～图4b所示的实施例。

举例来说，对于真实语句A，当目标词语为“美元”，则经过数据增强后可以得到真实语句A’：“我想要兑换日元”、真实语句A”：“我想要兑换泰铢”等等。真实语句A中的目标词语也可以是语句中的其他词语。

对于真实语句B，当目标词语为“取款”，则经过数据增强后可以得到真实语句B’：“我想要转账”、真实语句B”：“我想要存款”等等。真实语句B中的目标词语也可以是语句中的其他词语。

对于真实语句C，当目标词语为“银行卡”，则经过数据增强后可以得到真实语句C’：“我想要办理储蓄卡”、真实语句C”：“我想要办理工资卡”等等。真实语句C中的目标词语也可以是语句中的其他词语。

上述的这些真实语句A’～真实语句C”即第四语句也可以认为是真实语句。对于真实语句A’～真实语句C”，也可以按照与真实语句A～真实语句C相同的方式进行处理，以利用其进行模型训练，从而最终得到训练效果较好的文本分类模型。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：谢韬;高倩;邵长东;
专利申请人：科沃斯商用机器人有限公司;

上一篇：一种电气连接插子
下一篇：沉积炉管内管、沉积炉管以及沉积方法