掌桥专利:专业的专利平台
掌桥专利
首页

搜索意图识别模型的训练方法、搜索意图识别方法及装置

文献发布时间:2023-06-19 11:16:08


搜索意图识别模型的训练方法、搜索意图识别方法及装置

技术领域

本公开涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、智能推荐等领域,更具体地,涉及一种搜索意图识别模型的训练方法、搜索意图识别方法、基于搜索意图的内容推荐方法、装置、电子设备、介质和程序产品。

背景技术

当用户需要在网络上搜索相关内容时,针对用户的搜索语句,相关技术通常基于用户的搜索语句来识别用户的搜索意图,以便根据用户的搜索意图来为用户推荐相关内容。但是,相关技术难以准确地识别用户的搜索意图,导致所推荐的内容难以满足用户的需求。

发明内容

本公开提供了一种搜索意图识别模型的训练方法、基于搜索意图的内容推荐方法、装置、电子设备、存储介质以及计算机程序产品。

根据本公开的一方面,提供了一种搜索意图识别模型的训练方法,包括:获取多个搜索文本,每个搜索文本具有表征搜索意图的多个标签;将每个搜索文本输入搜索意图识别模型中,其中,所述搜索意图识别模型包括特征提取网络和多个识别网络;利用所述特征提取网络提取所述搜索文本的特征数据;利用所述多个识别网络分别处理所述特征数据,得到与所述多个标签一一对应的多个识别结果;基于所述多个识别结果和与每个识别结果对应的标签,调整所述搜索意图识别模型的模型参数,以得到经训练的搜索意图识别模型。

根据本公开的另一方面,提供了一种搜索意图识别方法,包括:获取待识别搜索文本;使用搜索意图识别模型对所述待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果,其中,所述搜索意图识别模型是使用根据如上所述的方法来训练的。

根据本公开的另一方面,提供了一种基于搜索意图的内容推荐方法,包括:获取待识别搜索文本;使用搜索意图识别模型对所述待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果,其中,所述搜索意图识别模型是使用根据如上所述的方法来训练的;从所述待识别搜索文本中提取用于表征搜索意图的目标子文本;基于所述多个识别结果和所述目标子文本,从多个候选内容中选择至少一个目标内容进行推荐。

根据本公开的另一方面,提供了一种搜索意图识别模型的训练装置,包括:第一获取模块、输入模块、特征提取模块、识别处理模块以及参数调整模块。其中,第一获取模块,用于获取多个搜索文本,每个搜索文本具有表征搜索意图的多个标签。输入模块,用于将每个搜索文本输入搜索意图识别模型中,其中,所述搜索意图识别模型包括特征提取网络和多个识别网络。特征提取模块,用于利用所述特征提取网络提取所述搜索文本的特征数据。识别处理模块,用于利用所述多个识别网络分别处理所述特征数据,得到与所述多个标签一一对应的多个识别结果。参数调整模块,用于基于所述多个识别结果和与每个识别结果对应的标签,调整所述搜索意图识别模型的模型参数,以得到经训练的搜索意图识别模型。

根据本公开的另一方面,提供了一种搜索意图识别装置,包括:第二获取模块和第一识别模块。其中,第二获取模块,用于获取待识别搜索文本。第一识别模块,用于使用搜索意图识别模型对所述待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果,其中,所述搜索意图识别模型是使用根据如上所述的方法来训练的。

根据本公开的另一方面,提供了一种基于搜索意图的内容推荐装置,包括:第三获取模块、第二识别模块、子文本提取模块以及内容推荐模块。其中,第三获取模块,用于获取待识别搜索文本。第二识别模块,用于使用搜索意图识别模型对所述待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果,其中,所述搜索意图识别模型是使用如上所述的方法来训练的。子文本提取模块,用于从所述待识别搜索文本中提取用于表征搜索意图的目标子文本。内容推荐模块,用于基于所述多个识别结果和所述目标子文本,从多个候选内容中选择至少一个目标内容进行推荐。

根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1示意性示出了根据本公开实施例的搜索意图识别模型的训练方法的应用场景;

图2示意性示出了根据本公开一实施例的搜索意图识别模型的训练方法的流程图;

图3示意性示出了根据本公开一实施例的搜索意图识别模型的训练方法的示意图;

图4示意性示出了根据本公开一实施例的获取搜索文本的示意图;

图5示意性示出了根据本公开另一实施例的获取搜索文本的示意图;

图6示意性示出了根据本公开一实施例的搜索意图识别方法的流程图;

图7示意性示出了根据本公开一实施例的基于搜索意图的内容推荐方法的流程图;

图8示意性示出了根据本公开一实施例的基于搜索意图的内容推荐方法的示意图;

图9示意性示出了根据本公开一实施例的搜索意图识别模型的训练装置的框图;

图10示意性示出了根据本公开一实施例的搜索意图识别装置的框图;

图11示意性示出了根据本公开一实施例的基于搜索意图的内容推荐装置的框图;以及

图12是用来实现本公开实施例的搜索意图识别模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

本公开的实施例提供了一种搜索意图识别模型的训练方法,包括:获取多个搜索文本,每个搜索文本具有表征搜索意图的多个标签。然后,将每个搜索文本输入搜索意图识别模型中,搜索意图识别模型包括特征提取网络和多个识别网络。例如利用特征提取网络提取搜索文本的特征数据,利用多个识别网络分别处理特征数据,得到与多个标签一一对应的多个识别结果。接下来,基于多个识别结果和与每个识别结果对应的标签,调整搜索意图识别模型的模型参数,以得到经训练的搜索意图识别模型。

图1示意性示出了根据本公开实施例的搜索意图识别模型的训练方法的应用场景。

如图1所示,本公开的实施例的应用场景100例如包括待训练搜索意图识别模型110和经训练搜索意图识别模型120。

在本公开的实施例中,训练样本111中例如包括多个用于训练待训练搜索意图识别模型110的搜索文本,训练样本111中的每个搜索文本具有标签,该标签例如用于表征对应搜索文本的搜索意图。利用训练样本111对待训练搜索意图识别模型110进行训练,可以得到经训练搜索意图识别模型120。

接下来,可以利用经训练搜索意图识别模型120对待识别搜索文本121进行意图识别。例如,将待识别搜索文本121输入至经训练搜索意图识别模型120中得到针对待识别搜索文本121的识别结果122,该识别结果用于表征搜索意图。

在得到识别结果122之后,基于识别结果122从多个候选内容131中确定满足搜索意图的目标内容132,并向用户推荐目标内容132。

本公开实施例提供了一种搜索意图识别模型的训练方法,下面结合图1的应用场景,参考图2~图5来描述根据本公开示例性实施方式的搜索意图识别模型的训练方法。

图2示意性示出了根据本公开一实施例的搜索意图识别模型的训练方法的流程图。

如图2所示,本公开实施例的搜索意图识别模型的训练方法200例如可以包括操作S201~操作S205。

在操作S201,获取多个搜索文本,每个搜索文本具有表征搜索意图的多个标签。

在操作S202,将每个搜索文本输入搜索意图识别模型中,搜索意图识别模型包括特征提取网络和多个识别网络。

在操作S203,利用特征提取网络提取搜索文本的特征数据。

在操作S204,利用多个识别网络分别处理特征数据,得到与多个标签一一对应的多个识别结果。

在操作S205,基于多个识别结果和与每个识别结果对应的标签,调整搜索意图识别模型的模型参数,以得到经训练的搜索意图识别模型。

根据本公开的实施例,搜索文本例如为用于进行搜索的历史搜索语句。每个搜索文本具有多个标签,以便利用具有标签的多个搜索文本来训练搜索意图识别模型。

搜索意图识别模型包括特征提取网络和多个识别网络。多个识别网络的数量例如与多个标签的数量一致。例如,每个搜索文本具有2个标签,则搜索意图识别模型中包括2个识别网络。

针对多个搜索文本中的每个搜索文本,将该搜索文本输入至搜索意图识别模型中。利用特征提取网络来提取搜索文本的特征数据。然后,将所提取的特征数据分别输入至2个识别网络中,得到2个识别结果,该2个识别结果与2个标签一一对应。

接下来,基于每个识别结果和该识别结果对应的标签,调整搜索意图识别模型的模型参数,以便得到经训练的搜索意图识别模型。搜索意图识别模型的模型参数包括特征提取网络的模型参数和多个识别网络的模型参数。通过调整模型参数,使得后续训练所得到的识别结果更接近对应的标签。例如,当标签和识别结果均以数值来表示时,通过调整模型参数来减小识别结果的数值和标签的数值之间的差值。

根据本公开的实施例,利用具有多个标签的搜索文本来训练搜索意图识别模型,以便利用经训练的搜索意图识别模型来识别用户的搜索意图。可以理解,本公开的实施例实现了较准确地识别用户的搜索意图。另外,本公开实施例的搜索意图识别模型通过相同的特征提取网络来提取搜索文本的特征数据,实现了特征提取网络的参数共享。通过不同的识别网络来识别搜索文本得到针对不同标签的多个识别结果,以便通过多个识别结果来确定用户的搜索意图,使得所确定的搜索意图更加准确。

根据本公开的实施例,搜索意图表征了加盟需求,搜索意图包括多个意图属性,多个标签一一指示了多个意图属性。多个意图属性例如包括意图强度和意图方向。意图强度指示了搜索文本中是否具有加盟品牌信息或加盟行业信息。意图方向指示了搜索文本中加盟行业信息表征的行业类型。

以搜索文本为“XX奶茶加盟”为例,“XX”例如为品牌名称。该搜索文本表征了用户的搜索意图,搜索意图例如为加盟需求。该搜索文本例如包括2个标签。其中第一个标签例如可以是“强意图”、“弱意图”或者“无意图”。第二个标签例如为“餐饮美食”、“美容养生”、“电影演出”或者“无具体行业信息”等。

第一个标签例如指示了意图强度,当搜索文本中具有加盟品牌信息或加盟行业信息时,第一个标签可以是“强意图”。例如,搜索文本“XX奶茶加盟”中的加盟品牌信息为“XX”,加盟行业信息例如为“奶茶”。第二个标签例如为“餐饮美食”,表示搜索文本中加盟行业信息“奶茶”表征的行业类型为“餐饮美食”。

当搜索文本中没有加盟品牌信息或加盟行业信息时,第一个标签可以是“弱意图”或“无意图”。例如,搜索文本“小投资加盟店”中没有加盟品牌信息或加盟行业信息,但该搜索文本在一定程度上还是能够表示用户具有加盟需求的。此时,第一个标签可以是“弱意图”,第二个标签例如可以是“无具体行业信息”。

例如,搜索文本“加盟计划书”中没有加盟品牌信息或加盟行业信息,该搜索文本表示用户没有加盟需求。此时,第一个标签可以是“无意图”,第二个标签例如可以是“无具体行业信息”。

针对每个搜索文本,为每个搜索文本设置两个标签,并利用具有两个标签的搜索文本来训练搜索意图识别模型,从而使得搜索意图识别模型能够识别用户进行搜索的意图强度和意图方向,以便根据意图强度和意图方向准确识别用户的加盟需求。

图3示意性示出了根据本公开一实施例的搜索意图识别模型的训练方法的示意图。

如图3所示,搜索意图识别模型310例如包括特征提取网络310a和多个识别网络。多个识别网络例如包括第一识别网络310b和第二识别网络310c。

将搜索文本进行切词或分词处理之后,将处理后的搜索文本输入至特征提取网络310a中进行特征提取。将提取到的特征数据分别输入第一识别网络310b和第二识别网络310c中进行识别处理。第一识别网络310b处理特征数据后输出的识别结果例如表示意图强度,第二识别网络310c处理特征数据后输出的识别结果例如表示意图方向。

例如,特征提取网络310a包括编码层Embedding、双向长短期记忆网络BiLSTM、Attention网络和TextCNN网络。利用编码层Embedding对搜索文本进行编码,得到针对搜索文本的文本向量。然后,利用BiLSTM网络确定文本向量中的至少一个关键信息,利用Attention网络对至少一个关键信息分别进行加权,例如为不同的关键信息分配不同的权重。接下来,利用TextCNN网络对加权后的文本向量进行卷积计算得到计算结果,将计算结果作为搜索文本的特征数据。

多个识别网络中的每个识别网络均包括至少一个全连接层和Softmax层。例如,第一识别网络310b包括两个全连接层和一个Softmax层。第二识别网络310c包括两个全连接层和一个Softmax层。全连接层用于对特征数据进行识别处理,Softmax层例如对来自全连接层的处理结果进行归一化以得到最终的识别结果。第一识别网络310b例如输出第一识别结果,第二识别网络310c例如输出第二识别结果。

在得到多个识别结果之后,基于多个识别结果和每个识别结果对应的标签,确定与多个识别结果一一对应的多个损失值。例如,基于第一识别结果和第一个标签确定第一损失值,基于第二识别结果和第二个标签确定第二损失值。然后,基于多个损失值(第一损失值和第二损失值)之和,调整搜索意图识别模型的模型参数,使得多个损失值之和最小化。

根据本公开的实施例,双向长短期记忆网络BiLSTM、Attention网络和TextCNN网络在文本处理上具有较好的效果。本公开的实施例将双向长短期记忆网络BiLSTM、Attention网络和TextCNN网络进行结合来对搜索文本进行特征提取,提高了提取特征数据的准确性,进而提高了搜索意图识别模型的训练效果。

以下结合图4和图5来描述如何获取用于训练搜索意图识别模型的搜索文本。

图4示意性示出了根据本公开一实施例的获取搜索文本的示意图。

如图4所示,获取多个初始文本441,以多个初始文本441包括初始文本441a和初始文本441b为例。每个初始文本具有表征搜索意图的多个标签。

接下来,从历史搜索库中获取多个第一历史文本451。多个第一历史文本451例如包括第一历史文本451a~451i,每个第一历史文本例如不具有标签。针对每个初始文本,基于初始文本和多个第一历史文本之间的相似度,从多个第一历史文本中确定至少一个目标历史文本。

例如,将初始文本441a和第一历史文本451a~451i分别进行相似度比较,得到相似度较高的第一历史文本451a和第一历史文本451c作为针对初始文本441a的目标历史文本。然后,为每个目标历史文本(第一历史文本451a和第一历史文本451c)设置标签,每个目标历史文本的标签与初始文本441a的标签相匹配,即,第一历史文本451a和第一历史文本451c的标签与初始文本441a的标签一致。

以初始文本441a为“XX奶茶加盟”为例,例如从多个第一历史文本451中确定相似度较高的“YY奶茶加盟”、“ZZ奶茶加盟”作为针对初始文本441a的目标历史文本。其中,“XX”、“YY”、“ZZ”例如均表示品牌名称。

类似地,将初始文本441b和第一历史文本451a~451i分别进行相似度比较,得到相似度较高的第一历史文本451d和第一历史文本451e作为针对初始文本441b的目标历史文本。第一历史文本451d和第一历史文本451e的标签与初始文本441b的标签一致。

接下来,将多个初始文本441和多个目标历史文本452作为多个搜索文本411。多个目标历史文本452中例如包括第一历史文本451a、451c、451d、451e。

根据本公开的实施例,基于相似度比较的方式基于少量的初始文本来获取大量的目标历史文本,并将初始文本和目标历史文本作为搜索文本,从而提高了搜索文本的丰富程度,提高了搜索意图识别模型的训练精度。

图5示意性示出了根据本公开另一实施例的获取搜索文本的示意图。

如图5所示,获取多个初始文本541,以多个初始文本541包括初始文本541a和初始文本541b为例。每个初始文本具有表征搜索意图的多个标签。

接下来,从历史搜索库中获取多个第一历史文本551。多个第一历史文本551例如包括第一历史文本551a~551i,每个第一历史文本例如不具有标签。针对每个初始文本,基于初始文本和多个第一历史文本之间的相似度,从多个第一历史文本中确定至少一个目标历史文本。

例如,将初始文本541a和第一历史文本551a~551i分别进行相似度比较,得到相似度较高的第一历史文本551a和第一历史文本551c作为针对初始文本541a的目标历史文本。然后,为每个目标历史文本(第一历史文本551a和第一历史文本551c)设置标签,每个目标历史文本的标签与初始文本541a的标签相匹配,即,第一历史文本551a和第一历史文本551c的标签与初始文本541a的标签一致。

类似地,将初始文本541b和第一历史文本551a~551i分别进行相似度比较,得到相似度较高的第一历史文本551d和第一历史文本551e作为针对初始文本541b的目标历史文本。第一历史文本551d和第一历史文本551e的标签与初始文本541b的标签一致。

接下来,将多个初始文本541和多个目标历史文本552作为多个训练文本561。利用训练文本561来训练标签生成模型570。然后,利用经训练的标签生成模型570对多个第二历史文本581中的每个第二历史文本进行标签设置,得到具有标签的多个第二历史文本581。将训练文本561和具有标签的多个第二历史文本581,作为多个搜索文本511。

根据本公开的实施例,基于相似度比较的方式基于少量的初始文本来获取大量的目标历史文本,并将初始文本和目标历史文本作为训练样本来训练标签生成模型,利用标签生成模型来为多个第二历史文本进行打标,从而得到大量的搜索文本。可见,通过本公开的实施例,提高了搜索文本的丰富程度,从而提高了搜索意图识别模型的训练精度。

图6示意性示出了根据本公开一实施例的搜索意图识别方法的流程图。

如图6所示,本公开实施例的搜索意图识别方法600例如可以包括操作S601~操作S602。

在操作S601,获取待识别搜索文本。

在操作S602,使用搜索意图识别模型对待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果。

根据本公开的实施例,待识别搜索文本例如为不具有标签的文本。通过使用上文提及的训练方法来训练得到搜索意图识别模型,然后利用经训练的搜索意图识别模型来识别待识别搜索文本得到识别结果,识别结果例如指示了意图强度和意图方向。

图7示意性示出了根据本公开一实施例的基于搜索意图的内容推荐方法的流程图。

如图7所示,本公开实施例的搜索意图识别方法700例如可以包括操作S701~操作S704。

在操作S701,获取待识别搜索文本。

在操作S702,使用搜索意图识别模型对待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果。

在操作S703,从待识别搜索文本中提取用于表征搜索意图的目标子文本。

在操作S704,基于多个识别结果和目标子文本,从多个候选内容中选择至少一个目标内容进行推荐。

根据本公开的实施例,待识别搜索文本例如为不具有标签的文本。通过使用上文提及的训练方法来训练得到搜索意图识别模型,然后利用经训练的搜索意图识别模型来识别待识别搜索文本得到识别结果,识别结果例如指示了意图强度和意图方向。

从待识别搜索文本中提取的目标子文本例如可以是待识别搜索文本中的实体词,实体词例如包括品牌名称、商标名称等等。

接下来,基于识别结果所表征的意图强度和意图方向,以及目标子文本(实体词),从多个候选内容中选择目标内容进行推荐。目标内容例如是用户所需求的加盟信息。目标内容包括但不仅限于文本、图片、链接、网页。

根据本公开的实施例,利用搜索意图识别模型处理待识别搜索文本,得到意图强度和意图方向,从待识别搜索文本中提取目标子文本(实体词)。基于意图强度、意图方向和实体词来选择目标内容进行推荐,从而提高了内容推荐的准确性。

图8示意性示出了根据本公开一实施例的基于搜索意图的内容推荐方法的示意图。

如图8所示,将待识别搜索文本821输入至搜索意图识别模型820中进行识别,得到识别结果822。识别结果822例如指示了意图强度和意图方向。

对待识别搜索文本821进行分词处理,得到多个子文本。将多个子文本中的每个子文本与预设子文本进行匹配,将匹配成功的子文本作为目标子文本,目标子文本例如为实体词821’。

预设子文本例如是利用命名实体识别NER模型从历史搜索数据中提取的。例如,利用命名实体识别NER模型从历史搜索数据中挖掘多个实体词,基于所挖掘的多个实体词构建实体词表,该实体词表中的实体词即为预设子文本。

然后,利用AC(Aho—Corasick)自动机技术将从待识别搜索文本821中得到多个子文本与实体词表进行多模式匹配,将匹配成功的实体词作为目标子文本(实体词821’)。即,目标子文本(实体词821’)同时存在于待识别搜索文本821和实体词表。

接下来,基于识别结果822和实体词821’,从多个候选内容831中选择目标内容832进行推荐。

例如,当意图强度为预设意图强度时,基于意图方向和目标子文本中的至少一个,从多个候选内容中选择目标内容进行推荐。预设意图强度例如为“强意图”。

例如,当待识别搜索文本821的意图强度为“强意图”时,基于意图方向和目标子文本(实体词821’)来进行推荐。当待识别搜索文本821的意图强度为“弱意图”时,从多个候选内容中选择搜索频率高的加盟内容来进行推荐,搜索频率高的加盟内容例如为热点加盟内容。当待识别搜索文本821的意图强度为“无意图”时,可以不进行推荐。

以待识别搜索文本821为“XX奶茶加盟”为例,当待识别搜索文本821的意图强度为“强意图”时,基于意图方向和目标子文本(实体词821’)来进行推荐。例如,意图方向指示了待识别搜索文本中加盟行业信息表征的行业类型,例如待识别搜索文本中的加盟行业信息包括“奶茶”,加盟行业信息“奶茶”表征的行业类型为“餐饮美食”。目标子文本(实体词821’)例如为“XX”,“XX”例如为品牌信息。基于意图方向和实体词821’进行推荐的目标内容中例如包括目标子文本和/或加盟行业信息。即,推荐的目标内容中包括“XX”和加盟行业信息“奶茶”,该目标内容中的加盟行业信息所表征的行业类型“餐饮美食”与待识别搜索文本中意图方向所指示的行业类型相匹配。

当推荐多个目标内容时,多个目标内容中的第一目标内容包括目标子文本和加盟行业信息,多个目标内容中的第二目标内容包括目标子文本,多个目标内容中的第三目标内容包括加盟行业信息。推荐的目标内容的排列优先级从高至低例如依次为第一目标内容、第二目标内容、第三目标内容。

根据本公开的实施例,以意图强度作为条件,来确定是否基于意图方向和待识别搜索文本中的实体词来进行推荐。可见,通过本公开实施例的技术方案,针对不同搜索意图的用户进行内容推荐,提高了内容推荐效率和推荐准确性,使得所推荐的内容满足用户的真实需求。

图9示意性示出了根据本公开一实施例的搜索意图识别模型的训练装置的框图。

如图9所示,本公开实施例的搜索意图识别模型的训练装置900例如包括第一获取模块910、输入模块920、特征提取模块930、识别处理模块940以及参数调整模块950。

第一获取模块910可以用于获取多个搜索文本,每个搜索文本具有表征搜索意图的多个标签。根据本公开实施例,第一获取模块910例如可以执行上文参考图2描述的操作S201,在此不再赘述。

输入模块920可以用于将每个搜索文本输入搜索意图识别模型中,搜索意图识别模型包括特征提取网络和多个识别网络。根据本公开实施例,输入模块920例如可以执行上文参考图2描述的操作S202,在此不再赘述。

特征提取模块930可以用于利用特征提取网络提取搜索文本的特征数据。根据本公开实施例,特征提取模块930例如可以执行上文参考图2描述的操作S203,在此不再赘述。

识别处理模块940可以用于利用多个识别网络分别处理特征数据,得到与多个标签一一对应的多个识别结果。根据本公开实施例,识别处理模块940例如可以执行上文参考图2描述的操作S204,在此不再赘述。

参数调整模块950可以用于基于多个识别结果和与每个识别结果对应的标签,调整搜索意图识别模型的模型参数,以得到经训练的搜索意图识别模型。根据本公开实施例,参数调整模块950例如可以执行上文参考图2描述的操作S205,在此不再赘述。

根据本公开的实施例,特征提取网络包括编码层、双向长短期记忆网络BiLSTM、Attention网络和TextCNN网络;特征提取模块930包括:编码子模块、信息确定子模块、加权子模块以及计算子模块。编码子模块用于利用编码层对搜索文本进行编码,得到针对搜索文本的文本向量。信息确定子模块用于利用BiLSTM网络确定文本向量中的至少一个关键信息。加权子模块用于利用Attention网络对至少一个关键信息分别进行加权。计算子模块,用于利用TextCNN网络对加权后的文本向量进行卷积计算得到计算结果,作为搜索文本的特征数据。

根据本公开的实施例,参数调整模块950包括:损失值确定子模块和参数调整子模块。损失值确定子模块用于基于多个识别结果和每个识别结果对应的标签,确定与多个识别结果一一对应的多个损失值。参数调整子模块用于基于多个损失值之和,调整搜索意图识别模型的模型参数。

根据本公开的实施例,第一获取模块910包括:第一获取子模块、第一确定子模块、第一设置子模块、第二确定子模块。第一获取子模块用于获取多个初始文本,其中,每个初始文本具有表征搜索意图的多个标签。第一确定子模块用于针对每个初始文本,基于初始文本和多个第一历史文本之间的相似度,从多个第一历史文本中确定至少一个目标历史文本。第一设置子模块用于为至少一个目标历史文本中的每个目标历史文本设置标签,每个目标历史文本的标签与初始文本的标签相匹配。第二确定子模块用于将多个初始文本和多个目标历史文本,作为多个搜索文本。

根据本公开的实施例,第一获取模块910还包括:第二获取子模块、第三确定子模块、第二设置子模块、训练子模块、处理子模块以及第四确定子模块。其中,第二获取子模块用于获取多个初始文本,每个初始文本具有表征搜索意图的多个标签。第三确定子模块用于针对每个初始文本,基于初始文本和多个第一历史文本之间的相似度,从多个第一历史文本中确定至少一个目标历史文本。第二设置子模块用于为至少一个目标历史文本中的每个目标历史文本设置标签,每个目标历史文本的标签与初始文本的标签相匹配。训练子模块用于利用针对多个初始文本的多个目标历史文本,训练标签生成模型。处理子模块,用于利用经训练的标签生成模型处理多个第二历史文本,得到每个第二历史文本的标签。第四确定子模块用于将多个初始文本、多个目标历史文本和多个第二历史文本,作为多个搜索文本。

根据本公开的实施例,针对多个识别网络中的每个识别网络,识别网络包括:至少一个全连接层、Softmax层。

根据本公开的实施例,搜索意图表征了加盟需求,搜索意图包括多个意图属性,多个标签一一指示了多个意图属性;多个意图属性包括以下至少一个:意图强度,意图强度指示了搜索文本中是否具有加盟品牌信息或加盟行业信息;意图方向,意图方向指示了搜索文本中加盟行业信息表征的行业类型。

图10示意性示出了根据本公开一实施例的搜索意图识别装置的框图。

如图10所示,本公开实施例的搜索意图识别装置1000例如包括第二获取模块1010和第一识别模块1020。

第二获取模块1010可以用于获取待识别搜索文本。根据本公开实施例,第二获取模块1010例如可以执行上文参考图6描述的操作S601,在此不再赘述。

第一识别模块1020可以用于使用搜索意图识别模型对待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果。根据本公开实施例,第一识别模块1020例如可以执行上文参考图6描述的操作S602,在此不再赘述。

图11示意性示出了根据本公开一实施例的基于搜索意图的内容推荐装置的框图。

如图11所示,本公开实施例的基于搜索意图的内容推荐装置1100例如包括第三获取模块1110、第二识别模块1120、子文本提取模块1130以及内容推荐模块1140。

第三获取模块1110可以用于获取待识别搜索文本。根据本公开实施例,第三获取模块1110例如可以执行上文参考图7描述的操作S701,在此不再赘述。

第二识别模块1120可以用于使用搜索意图识别模型对待识别搜索文本进行意图识别,得到用于表征搜索意图的多个识别结果。根据本公开实施例,第二识别模块1120例如可以执行上文参考图7描述的操作S702,在此不再赘述。

子文本提取模块1130可以用于从待识别搜索文本中提取用于表征搜索意图的目标子文本。根据本公开实施例,子文本提取模块1130例如可以执行上文参考图7描述的操作S703,在此不再赘述。

内容推荐模块1140可以用于基于多个识别结果和目标子文本,从多个候选内容中选择至少一个目标内容进行推荐。根据本公开实施例,内容推荐模块1140例如可以执行上文参考图7描述的操作S704,在此不再赘述。

根据本公开的实施例,多个识别结果包括意图强度和意图方向;内容推荐模块1140还用于响应于意图强度为预设意图强度,基于意图方向和目标子文本中的至少一个,从多个候选内容中选择目标内容进行推荐。

根据本公开的实施例,意图方向指示了待识别搜索文本中加盟行业信息表征的行业类型;目标内容包括以下至少一项:目标子文本;加盟行业信息,加盟行业信息所表征的行业类型与意图方向所指示的行业类型相匹配。

根据本公开的实施例,子文本提取模块1130包括:分词处理子模块、匹配子模块以及第五确定子模块。分词处理子模块用于对待识别搜索文本进行分词处理,得到多个子文本。匹配子模块用于将多个子文本中的每个子文本与预设子文本进行匹配,预设子文本是利用命名实体识别NER模型从历史搜索数据中提取的。第五确定子模块用于将匹配成功的子文本作为目标子文本。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图12是用来实现本公开实施例的搜索意图识别模型的训练方法的电子设备的框图。

图12示出了可以用来实施本公开实施例的示例电子设备1200的示意性框图。电子设备1200旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示,设备1200包括计算单元1201,其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序,来执行各种适当的动作和处理。在RAM 1203中,还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

设备1200中的多个部件连接至I/O接口1205,包括:输入单元1206,例如键盘、鼠标等;输出单元1207,例如各种类型的显示器、扬声器等;存储单元1208,例如磁盘、光盘等;以及通信单元1209,例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理,例如搜索意图识别模型的训练方法。例如,在一些实施例中,搜索意图识别模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时,可以执行上文描述的搜索意图识别模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行搜索意图识别模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

该电子设备可以用于执行搜索意图识别方法。该电子设备例如可以包括计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元。其中,该电子设备中的计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元例如具有与图12中所示的电子设备的计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元相同或类似的功能,在此不再赘述。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

该电子设备可以用于执行基于搜索意图的内容推荐方法。该电子设备例如可以包括计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元。其中,该电子设备中的计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元例如具有与图12中所示的电子设备的计算单元、ROM、RAM、I/O接口、输入单元、输出单元、存储单元和通信单元相同或类似的功能,在此不再赘述。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 搜索意图识别模型的训练方法、搜索意图识别方法及装置
  • 意图识别模型训练方法、意图识别方法及相关装置
技术分类

06120112859417