掌桥专利:专业的专利平台
掌桥专利
首页

模型训练方法、装置、设备与存储介质

文献发布时间:2023-06-19 13:46:35


模型训练方法、装置、设备与存储介质

技术领域

本申请涉及人工智能技术领域,尤其涉及一种模型训练方法、装置、设备与存储介质。

背景技术

基于常见问题(frequently asked questions,FAQ)的问答系统通常采用检索知识库的方式来匹配客户的问答。整个检索过程通常分为两个部分,分别是召回部分和排序部分。召回部分主要是将知识库中可能的候选文本进行召回,缩小搜索范围,为后面排序阶段做准备。排序部分是将召回的候选文本输入模型得到各个候选文本与待查询文本的得分,从而将得分最高的候选文本所对应的回答文本作为待训文本所对应的回答文本。目前对该模型进行训练时,将两个句子组成句子对输入模型进行训练,从而让该模型学习两个输入的句子是否相似,这种方式只能让模型学习到输入的句子对中两个句子是否相似的特征,从而导致所计算的得分准确性比较低。

发明内容

基于此,有必要针对上述技术问题,提供一种模型训练方法、装置、设备与存储介质,不仅能够让模型学习到样本对中两个样本是否相似的特征,还可以让模型学习到样本对之间的差异特征,从而提高模型计算相似度得分的准确性,以提高相似度匹配的准确性。

第一方面,本申请提供一种模型训练方法,所述方法包括:

获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本;

将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

计算所述第一相似度得分与所述第二相似度得分之间的得分差;

若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

结合第一方面,在一些实施例中,所述正样本与所述输入样本之间的语义相似度大于相似度阈值,所述负样本与所述输入样本之间的语义相似度小于所述相似度阈值。

结合第一方面,在一些实施例中,若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整之前,还包括:

通过逻辑回归sigmoid函数将所述得分差进行归一化,获得归一化函数值;

根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件。

结合第一方面,在一些实施例中,所述预设值为1;

所述根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件,包括:

根据所述归一化函数值与1之间的差值,计算第一损失;

若所述第一损失大于或者等于第一阈值,则确定所述得分差不满足目标条件;

若所述第一损失小于所述第一阈值,则确定所述得分差满足目标条件。

结合第一方面,在一些实施例中,所述将参数调整后的第一模型或第二模型确定为训练好的目标模型之后,还包括:

获取待查询文本和至少两个候选文本;

将所述待查询文本分别与所述至少两个候选文本中的每个候选文本构建文本对,获得至少两个文本对,所述文本对包括所述待查询文本和一个候选文本;

将所述至少两个文本对中每个文本对输入所述训练好的目标模型,获得所述每个文本对的目标相似度得分;

从所述至少两个文本对中选择目标相似度得分最高的文本对,作为目标文本对;

将所述目标文本对中的候选文本所对应的预设文本确定为所述待查询文本的回答文本。

结合第一方面,在一些实施例中,所述从第一训练集中获取输入样本之前,还包括:

获取待训练的第三模型;

获取第二训练集,所述第二训练集包括多个第三样本对,所述第三样本对中包含第一训练样本和第二训练样本,所述第三样本对被标注实际相似度比较结果;

采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,作为所述第一模型。

结合第一方面,在一些实施例中,所述采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,包括:

从所述第二训练集中获取第三样本对,作为待训练样本对,所述第二训练集中包括多个第三样本对,每个第三样本对包括第一训练样本和第二训练样本;

将所述待训练样本对输入所述第三模型,获得所述待训练样本对的第三相似度得分;

基于所述第三相似度得分,确定所述第三样本对的预测相似度比较结果,所述预测相似度比较结果用于指示所述第三样本对中的所述第一训练样本和所述第二训练样本是否相似;

根据所述第三样本对的预测相似度比较结果和所述第三样本对的实际相似度比较结果之间的差异,计算第二损失;

若所述第二损失大于或者等于第二阈值,调整所述第三模型的参数,并从所述第二训练集的剩余样本对中获取第三样本对,作为待训练样本对,直到所述第二损失小于所述第二阈值,将参数调整后的第三模型确定为训练好的第三模型,所述剩余样本对包括所述第二训练集中未被获取的第三样本对。

第二方面,本申请提供一种模型训练装置,该装置包括:

第一获取单元,用于获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本;

第二获取单元,用于将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

第三获取单元,用于将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

计算单元,用于计算所述第一相似度得分与所述第二相似度得分之间的得分差;

第一模型训练单元,用于若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

结合第二方面,在一些实施例中,所述正样本与所述输入样本之间的语义相似度大于相似度阈值,所述负样本与所述输入样本之间的语义相似度小于所述相似度阈值。

结合第二方面,在一些实施例中,所述第一模型训练单元具体用于:

通过逻辑回归sigmoid函数将所述得分差进行归一化,获得归一化函数值;

根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件。

结合第二方面,在一些实施例中,所述预设值为1;

所述第一模型训练单元具体用于:根据所述归一化函数值与1之间的差值,计算第一损失;

若所述第一损失大于或者等于第一阈值,则确定所述得分差不满足目标条件;

若所述第一损失小于所述第一阈值,则确定所述得分差满足目标条件。

结合第二方面,在一些实施例中,所述装置还包括:

第四获取单元,用于获取待查询文本和至少两个候选文本;

第五获取单元,用于将所述待查询文本分别与所述至少两个候选文本中的每个候选文本构建文本对,获得至少两个文本对,所述文本对包括所述待查询文本和一个候选文本;

第六获取单元,用于将所述至少两个文本对中每个文本对输入所述训练好的目标模型,获得所述每个文本对的目标相似度得分;

选择单元,用于从所述至少两个文本对中选择目标相似度得分最高的文本对,作为目标文本对;

确定单元,用于将所述目标文本对中的候选文本所对应的预设文本确定为所述待查询文本的回答文本。

结合第二方面,在一些实施例中,所述装置还包括:

第七获取单元,用于获取待训练的第三模型;

第八获取单元,用于获取第二训练集,所述第二训练集包括多个第三样本对,所述第三样本对中包含第一训练样本和第二训练样本,所述第三样本对被标注实际相似度比较结果;

第二模型训练单元,用于采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,作为所述第一模型。

结合第二方面,在一些实施例中,所述第二模型训练单元具体用于:

从所述第二训练集中获取第三样本对,作为待训练样本对,所述第二训练集中包括多个第三样本对,每个第三样本对包括第一训练样本和第二训练样本;

将所述待训练样本对输入所述第三模型,获得所述待训练样本对的第三相似度得分;

基于所述第三相似度得分,确定所述第三样本对的预测相似度比较结果,所述预测相似度比较结果用于指示所述第三样本对中的所述第一训练样本和所述第二训练样本是否相似;

根据所述第三样本对的预测相似度比较结果和所述第三样本对的实际相似度比较结果之间的差异,计算第二损失;

若所述第二损失大于或者等于第二阈值,调整所述第三模型的参数,并从所述第二训练集的剩余样本对中获取第三样本对,作为待训练样本对,直到所述第二损失小于所述第二阈值,将参数调整后的第三模型确定为训练好的第三模型,所述剩余样本对包括所述第二训练集中未被获取的第三样本对。

第三方面,本申请提供一种模型训练设备,包括处理器、存储器以及通信接口,该处理器、存储器和通信接口相互连接,其中,该通信接口用于接收和发送数据,该存储器用于存储程序代码,该处理器用于调用该程序代码,执行如第一方面以及第一方面中任一可能的实现方式描述的方法。

第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序;当该计算机程序在一个或多个处理器上运行时,使得该终端设备执行如第一方面以及第一方面中任一可能的实现方式描述的方法。

本申请实施例中,获取第一样本对和第二样本对,该第一样本对包含输入样本和与输入样本关联的正样本,第二样本对包含输入样本和与输入样本关联的负样本,将第一样本对输入第一模型,获得第一相似度得分,将第二样本对输入第二模型,获得第二相似度得分,计算第一相似度得分与第二相似度得分之间的得分差,进而根据该得分差,对第一模型和第二模型进行训练,实施本申请对模型的训练方式,不仅能够让模型学习到样本对中两个样本是否相似的特征,还可以让模型学习到样本对之间的差异特征,从而提高模型计算相似度得分的准确性,以提高相似度匹配的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。

图1为本申请实施例提供的一种模型训练方法的流程示意图;

图2为本申请实施例提供的第一样本对和第二样本对的示意图;

图3为本申请实施例提供的一种模型训练过程示意图;

图4为本申请实施例提供的一种相似度得分的计算过程示意图;

图5为本申请实施例提供的另一种模型训练方法的流程示意图;

图6为本申请实施例提供的一种第二训练集中文本对的示意图;

图7为本申请实施例提供的另一种模型训练过程示意图;

图8为本申请实施例提供的一种模型训练装置的示意图;

图9为本申请实施例提供的一种模型训练设备的示意图。

具体实施方式

下面结合附图对本发明作进一步详细描述。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供了一种模型训练方法,为了更清楚地描述本申请的方案,下面对本申请涉及的一些附图作进一步介绍。

请参阅图1,图1为本申请实施例提供的一种模型训练方法的流程示意图。如图1所示,所述方法包括以下步骤:

S101,从第一训练集获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本;

本申请实施例中,可以通过第一训练集中的多个输入样本对模型进行训练,根据输入样本构造第一样本对和第二样本对,一个输入样本可以对应构造一个第一样本对和一个第二样本对,其中,第一样本对中包含该输入样本和与该输入样本关联的正样本,第二样本对中包含该输入样本和与该输入样本关联的负样本。本申请实施例中与输入样本关联的正样本可以是指与输入样本相似的样本,与输入样本关联的负样本可以是指与输入样本不相似的样本。其中,与输入样本相似可以是指与输入样本之间的语义相似度大于相似度阈值,与输入样本不相似可以是指与输入样本之间的语义相似度小于或者等于相似度阈值。

如图2所示,示例性示出第一训练集中的3个输入样本,并分别给出与各个输入样本关联的正样本,以及与各个输入样本关联的负样本。以输入样本“利息多少”作为举例,构建第一样本对,该第一样本对可以包含“利息多少,利息怎么算”,第二样本对可以包含“利息多少,利息好高”。根据各个输入样本,构建得到各个输入样本对应的第一样本对和第二样本对,并采用各个输入样本对应的第一样本对和第二样本对进行模型训练。

S102,将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

S103,将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

本申请实施例中,获取与第一模型完全相同的第二模型,即第二模型的各个参数与第一模型相同,第一模型和第二模型可以是ALBERT模型。其中,该第一模型和第二模型可以是预训练过的模型,具体预训练过程请参照图5实施例的描述,暂不赘述。

将某个输入样本对应的第一样本对输入第一模型,获得第一相似度得分;将该输入样本对应的第二样本对输入第二模型,获得第二相似度得分,其中,相似度得分可以用于表示样本对中两个文本的相似程度。

如图3所示,以输入文本为“利息多少”作为举例,分别将构建的第一样本对“利息多少,利息怎么算”输入第一模型MODEL,获得得分1,即第一相似度得分,将第二样本对“利息多少,利息好高”输入第二模型MODEL,获得得分2,即第二相似度得分。

S104,计算所述第一相似度得分与所述第二相似度得分之间的得分差;

S105,若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

本申请实施例中,获取第一相似度得分与第二相似度得分之间的得分差,进一步通过逻辑回归sigmoid函数将该得分差进行归一化,获得归一化函数值,根据该归一化函数值与预设值之间的差异,调整第一模型和第二模型的参数。

具体可选的,如图3所述,获取得分1与得分2之间的得分差,并通过逻辑回归sigmoid函数对该得分差进行归一化,获得归一化函数值,即将该得分差转换到0到1之间,如果得分1大于得分2,则该归一化函数值应该大于0.5,如果得分1小于或者等于得分2,则该归一化函数值应该小于或者等于0.5,本申请中第一样本对中两个样本之间的语义相似度大于相似度阈值的,第二样本对中两个样本之间的语义相似度小于相似度阈值,即理论上得分1是远大于得分2,因此本申请对模型的训练目标是让该归一化函数值与1无限接近,即让模型学习到输入第一模型的第一样本对中的正样本比第二样本对中的负样本与输入样本更相似,本申请中预设值可以是1。

具体的,根据该归一化函数值与预设值之间的差异,计算第一损失,比如交叉熵损失,如果该第一损失大于或者等于第一阈值,则基于该第一损失调整第一模型和第二模型的参数,该第一模型和第二模型共享相同的参数。然后,再获取另一个输入样本对应的第一样本对和第二样本对,并将第一样本对输入第一模型,获得第一相似度得分,将第二样本对输入第二模型,获得第二相似度得分,以此不断迭代循环上述步骤S101-步骤S105,直到第一损失小于第一阈值,模型收敛,获得训练好的第一模型和训练好的第二模型,该训练好的第一模型和训练好的第二模型相同,因此可以将训练好的第一模型或第二模型作为目标模型,并采用该目标模型进行相似度得分的计算。

在后续使用该训练好的目标模型时,获取待查询文本,该待查询文本可以是对用户的语音数据转换得到的文本,获取从知识库中检索得到与该待查询文本相似的候选集合,该候选集合中包含多个候选文本,分别将待查询文本与各个候选文本组成文本对,获得多个文本对,每个文本对中包含待查询文本和一个候选文本,不同句子对中的候选文本不同。

进一步,将该各个文本对输入到训练好的目标模型,得到该文本对中两个待查询文本和候选文本之间的相似度得分,可以根据各个文本对的相似度得分,按照从高到低的顺序进行排序,并选取相似度得分最高的文本对作为目标文本对,将该目标文本对中的候选文本所对应的预设文本作为待查询文本的回答文本。可选的,还可以是将排序在最前的预设个数的候选文本所对应的意图,确定回答文本。

如图4所示,待查询文本是“你们利息怎么弄的”,检索得到的候选集合中包括多个候选文本,分别是“利率多少,利息有点多…”,分别将待查询文本与各个候选文本组成文本对,将各个文本对输入到训练好的目标模型MODEL,即可得到各个候选文本与待查询文本之间的相似度得分,最后将排序在最前的几个候选文本的意图作为最匹配文本,如图4所示,相似度得分最高的几个候选文本的意图是:利息多少,因此将“利息多少”作为最匹配的文本,最后将该最匹配的文本对应的回答文本作为待查询文本的回答文本。

本申请实施例中,获取第一样本对和第二样本对,该第一样本对包含输入样本和与输入样本关联的正样本,第二样本对包含输入样本和与输入样本关联的负样本,将第一样本对输入第一模型,获得第一相似度得分,将第二样本对输入第二模型,获得第二相似度得分,计算第一相似度得分与第二相似度得分之间的得分差,进而根据该得分差,对第一模型和第二模型进行训练,实施本申请对模型的训练方式,不仅能够让模型学习到样本对中两个样本是否相似的特征,还可以让模型学习到样本对之间的差异特征,从而提高模型计算相似度得分的准确性,以提高相似度匹配的准确性。

请参阅图5,图5为本申请实施例提供的另一种模型训练方法的流程示意图。如图5所示,所述方法包括以下步骤:

S201,获取待训练的第三模型;

本申请实施例中,该第三模型可以包括ALBERT模型。

S202,获取第二训练集,所述第二训练集包括多个第三样本对,所述第三样本对中包含第一训练样本和第二训练样本,所述第三样本对被标注实际相似度比较结果;

S203,采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,作为所述第一模型。

本申请实施例中,第二训练集中可以包括多个第三样本对,每个第三样本对中包括第一训练样本和第二训练样本,该第一训练样本和第二训练样本之间可以相似或者不相似,相似是指该第一训练样本和第二训练样本之间的语义相似度大于相似度阈值,不相似是指该第一训练样本和第二训练样本之间的语义相似度小于或者等于相似度阈值。如图6所示,为本申请提供的多个第三样本对的示例,如图所述,txt1可以是指第三样本对中的第一训练样本,txt2可以是指第三样本对中的第二训练样本。每个第三样本对均被标注实际相似度比较结果,该实际相似度比较结果用于指示该第三样本对中两个样本之间实际是否相似,比如,用于“1”指示该第三样本对中两个样本之间相似,用“0”指示该第三样本对中两个样本之间不相似。

具体可选的,在对第三模型进行训练时,从第二训练集中获取第三样本对,作为待训练样本对,将该待训练样本对输入第三模型,获得该待训练样本对的第三相似度得分,并基于该第三相似度得分确定该第三样本对中两个文本的预测相似度比较结果,基于预测相似度比较结果和实际相似度比较结果之间的差异,计算第二损失,若该第二损失大于或者等于第二阈值,则调整第三模型的参数,并从第二训练集的剩余样本对中获取第三样本对,作为待训练样本对,并将该待训练样本对输入参数调整后的第三模型,从而获得该待训练样本对的第三相似度得分,以此不断迭代循环,直到所计算的第二损失小于第二阈值,则模型收敛,将最后参数调整后的第三模型确定为训练好的第三模型,并将该训练好的第三模型作为第一模型,以进一步对该第一模型继续训练,具体可以参照图1实施例的描述,在此不再赘述。

下面以图7作为举例说明,第三样本对可以包括“利息多少,利息怎么算”,将第三样本对输入到第三模型MODEL,从而获得第三相似度得分,该第三相似度得分可以表明第三样本对中两个文本之间的相似度大小。进一步可以通过分类函数softmax基于该第三相似度得分进行分类,获得该第三样本对的预测相似度比较结果,该预测相似度比较结果可以是0或者1,并通过预测相似度比较结果与实际相似度比较结果之间的差异,确定第二损失,如果该第二损失大于第二阈值,则根据该第二损失调整第三模型的参数,然后再将第二训练集中的另一个第三样本对输入调整后的第三模型进行训练,不断迭代循环,直到第二损失小于第二阈值,模型收敛,本申请将收敛的模型作为第一模型。

S204,从第一训练集获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本;

S205,将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

S206,将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

S207,计算所述第一相似度得分与所述第二相似度得分之间的得分差;

S208,若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

本申请实施例步骤S204-步骤S208请参照图1的实施例步骤S101-步骤S105,在此不再赘述。

本申请通过第二训练集中各个第三样本对进行模型训练,让模型学习到第三样本对中两个样本之间的相似度特征,然后再以该步骤训练好的第一模型作为基础继续进行训练,以让模型进一步学习样本对之间的比较特征,从而提高模型计算相似度得分的准确性。

请参见图8,为本申请实施例提供了一种模型训练装置的结构示意图。如图8所示,该模型训练装置可以包括:

第一获取单元10,用于从第一训练集中获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本,所述输入样本为问答系统中用户的语音数据转换得到的文本数据;

第二获取单元11,用于将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

第三获取单元12,用于将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

计算单元13,用于计算所述第一相似度得分与所述第二相似度得分之间的得分差;

第一模型训练单元14,用于若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

在一种可能的设计中,所述正样本与所述输入样本之间的语义相似度大于相似度阈值,所述负样本与所述输入样本之间的语义相似度小于所述相似度阈值。

在一种可能的设计中,所述第一模型训练单元具体用于:

通过逻辑回归sigmoid函数将所述得分差进行归一化,获得归一化函数值;

根据所述归一化函数值与预设值之间的差异,确定所述得分差是否满足目标条件。

在一种可能的设计中,所述预设值为1;

所述第一模型训练单元具体用于:根据所述归一化函数值与1之间的差值,计算第一损失;

若所述第一损失大于或者等于第一阈值,则确定所述得分差不满足目标条件;

若所述第一损失小于所述第一阈值,则确定所述得分差满足目标条件。

在一种可能的设计中,所述装置还包括:

第四获取单元,用于获取待查询文本和至少两个候选文本;

第五获取单元,用于将所述待查询文本分别与所述至少两个候选文本中的每个候选文本构建文本对,获得至少两个文本对,所述文本对包括所述待查询文本和一个候选文本;

第六获取单元,用于将所述至少两个文本对中每个文本对输入所述训练好的目标模型,获得所述每个文本对的目标相似度得分;

选择单元,用于从所述至少两个文本对中选择目标相似度得分最高的文本对,作为目标文本对;

确定单元,用于将所述目标文本对中的候选文本所对应的预设文本确定为所述待查询文本的回答文本。

在一种可能的设计中,所述装置还包括:

第七获取单元,用于获取待训练的第三模型;

第八获取单元,用于获取第二训练集,所述第二训练集包括多个第三样本对,所述第三样本对中包含第一训练样本和第二训练样本,所述第三样本对被标注实际相似度比较结果;

第二模型训练单元,用于采用所述第二训练集对所述第三模型进行训练,获得训练好的第三模型,作为所述第一模型。

在一种可能的设计中,所述第二模型训练单元具体用于:

从所述第二训练集中获取第三样本对,作为待训练样本对,所述第二训练集中包括多个第三样本对,每个第三样本对包括第一训练样本和第二训练样本;

将所述待训练样本对输入所述第三模型,获得所述待训练样本对的第三相似度得分;

基于所述第三相似度得分,确定所述第三样本对的预测相似度比较结果,所述预测相似度比较结果用于指示所述第三样本对中的所述第一训练样本和所述第二训练样本是否相似;

根据所述第三样本对的预测相似度比较结果和所述第三样本对的实际相似度比较结果之间的差异,计算第二损失;

若所述第二损失大于或者等于第二阈值,调整所述第三模型的参数,并从所述第二训练集的剩余样本对中获取第三样本对,作为待训练样本对,直到所述第二损失小于所述第二阈值,将参数调整后的第三模型确定为训练好的第三模型,所述剩余样本对包括所述第二训练集中未被获取的第三样本对。

其中,图8所示装置实施例的具体描述可以参照前述图1或图5所示方法实施例的具体说明,在此不进行赘述。

请参照图9,为本申请实施例提供的一种模型训练设备的结构示意图,如图9所示,该模型训练设备1000可以包括:至少一个处理器1001,例如CPU,至少一个通信接口1003,存储器1004,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。通信接口1003可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1004可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图4所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信单元以及程序指令。

在图9所示的模型训练设备1000中,处理器1001可以用于加载存储器1004中存储的程序指令,并具体执行以下操作:

从第一训练集获取输入样本,并根据所述输入样本构造第一样本对和第二样本对,所述第一样本对包含所述输入样本和与所述输入样本关联的正样本,所述第二样本对包含所述输入样本和与所述输入样本关联的负样本;

将所述第一样本对输入第一模型,获得所述输入样本与所述正样本之间的第一相似度得分;

将所述第二样本对输入第二模型,获得所述输入样本与所述负样本之间的第二相似度得分,所述第二模型与所述第一模型相同;

计算所述第一相似度得分与所述第二相似度得分之间的得分差;

若所述得分差不满足目标条件,对所述第一模型和所述第二模型的参数进行调整,并从所述第一训练集的剩余样本中获取输入样本,所述剩余样本是所述第一训练集中未被获取的输入样本;根据从所述剩余样本中获取的输入样本构造第一样本对和第二样本对,直到所述得分差满足所述目标条件,将参数调整后的第一模型或第二模型确定为训练好的目标模型。

需要说明的是,具体执行过程可以参见图1或图5所示方法实施例的具体说明,在此不进行赘述。

本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1或图5所示实施例的方法步骤,具体执行过程可以参见图1或图5所示实施例的具体说明,在此不进行赘述。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘)等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

相关技术
  • 模型训练方法、模型训练装置、计算机设备和存储介质
  • 模型训练方法、模型训练装置、终端设备及存储介质
技术分类

06120113807816