掌桥专利:专业的专利平台
掌桥专利
首页

一种召回方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 11:57:35


一种召回方法、装置、电子设备及存储介质

技术领域

本发明涉及计算机技术领域,特别是涉及一种召回方法、装置、电子设备及存储介质。

背景技术

在词条搜索场景中,通常需要获得待搜索词条,并从数据库中搜索内容与上述待搜索词条相关的数据,然后向用户展示上述数据,从而实现对上述待搜索词条对应的搜索结果的召回。

现有技术中,在对待搜索词条对应的搜索结果进行召回时,通常需要获得待搜索词条中的关键词,根据关键词之间的间隔距离计算关键词之间的语义关联程度,例如,假设待搜索词条为“西红柿土豆”,由于其中关键词“西红柿”和“土豆”的位置紧邻,因此认为上述“西红柿”和“土豆”之间的语义关联程度高。最后再利用上述关键词之间的语义关联程度对待搜索词条对应的搜索结果进行召回。

这样根据待搜索词条中关键词的间隔距离计算语义关联程度,可能会使得原本不相关的关键词由于距离靠近而认为语义关联程度较高,从而导致关键词之间的语义关联程度准确度低,进而导致所召回的搜索结果的准确度低,使得所召回的待搜索词条对应的搜索结果不能准确体现用户的实际需求。

发明内容

本发明实施例的目的在于提供一种召回方法、装置、电子设备及存储介质,以提高所召回的搜索结果的准确度。具体技术方案如下:

在本发明实施的第一方面,首先提供了一种召回方法,所述方法包括:

获得待搜索词条;

对所述待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;

针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;

根据各个分词组合对应的搜索数据的历史点击数,召回所述待搜索词条对应的搜索结果。

本发明的一个实施例中,所述根据各个分词组合对应的搜索数据的历史点击数,召回所述待搜索词条对应的搜索结果,包括:

选择对应的搜索数据的历史点击数满足预设的召回条件的分词组合,作为目标分词组合;

确定内容中包含所述目标分词组合的搜索数据,将所确定的搜索数据作为所述待搜索词条的搜索结果进行召回。

本发明的一个实施例中,所述方法还包括:

确定对应的搜索数据的历史点击数不满足所述召回条件的分词组合,作为非目标分词组合;

确定内容中包含至少二非目标分词组合的搜索数据,将所确定的搜索数据作为所述待搜索词条的搜索结果进行召回。

本发明的一个实施例中,所述召回条件包括:

历史点击数大于预设的点击数阈值;和/或

历史点击数占总点击数的比例大于预设的比例阈值,其中,所述总点击数为:各个分词组合对应的搜索数据的历史点击数之和。

本发明的一个实施例中,所述针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,包括:

针对每一分词组合,确定内容中包含该分词组合、且该分词组合对应的各个分词结果相邻排列的搜索数据,作为该分词组合对应的搜索数据;

分别获得各个分词组合对应的搜索数据的历史点击数。

本发明的一个实施例中,所述获得待搜索词条,包括:

接收客户端发送的搜索指令,获得所述搜索指令中携带的词条,作为待搜索词条;或

获得待推荐的预设词条,作为待搜索词条;

在所述召回所述待搜索词条对应的搜索结果步骤之后,所述方法还包括:

建立所述预设词条与所召回的搜索结果之间的关联关系。

本发明的一个实施例中,所述方法还包括:

根据各个分词组合对应的搜索数据的历史点击数,对所召回的搜索结果进行排序。

在本发明实施的第二方面,还提供了一种召回装置,所述装置包括:

词条获得模块,用于获得待搜索词条;

分词处理模块,用于对所述待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;

点击数获得模块,用于针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;

结果召回模块,根据各个分词组合对应的搜索数据的历史点击数,召回所述待搜索词条对应的搜索结果。

在本发明实施的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的召回方法。

在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的召回方法。

本发明实施例提供的方案中,首先获得待搜索词条;对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用本发明实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种召回方法的流程示意图;

图2为本发明实施例提供的另一种召回方法的流程示意图;

图3为本发明实施例提供的一种召回装置的结构示意图;

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

由于现有技术中存在获得的关键词之间的语义关联程度准确度低的问题,为解决这一技术问题,本发明实施例提供了一种召回方法、装置、电子设备及存储介质。

本发明的一个实施例中,提供了一种召回方法,该方法包括:

获得待搜索词条;

对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;

针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;

根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。

上述实施例提供的方案中,由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用上述实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

下面通过具体实施例对本发明实施例提供的召回方法、装置、电子设备及存储介质进行详细介绍。

参见图1,图1为本发明实施例提供的一种召回方法的流程示意图,该方法可以应用于服务器、台式计算机、笔记本电脑、手机等电子设备中,还可以应用于视频搜索、新闻搜索、商品搜索等客户端中,本发明实施例并不对此进行限定。

该方法包括如下步骤S101至S104。

S101,获得待搜索词条。

其中,上述待搜索词条可以为用户输入的、期望进行搜索的词条,还可以是用户从文本中复制的、期望进行搜索的词条。上述待搜索词条中可以包括英文字符、中文字符、数字字符等。

本发明的一个实施例中,上述待搜索词条可以是词语,如人名、动物名、地名、物品名等,还可以是句子,如诗词、文章标题、节目标题等。

S102,对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合。

具体的,可以对待搜索词条进行分词处理,从而得到至少一个分词结果,然后再对上述分词结果进行组合,得到至少一个分词组合。

例如,假设待搜索词条为“电影发布会时间”,对上述待搜索词条进行分词处理,可以得到“电影”、“发布会”、“时间”三个分词结果,然后对上述分词结果进行组合,可以得到“电影+发布会”、“电影+时间”、“发布会+时间”等分词组合。

本发明的一个实施例中,在对待搜索词条进行分词处理时,可以利用预设的分词算法对待搜索词条进行分词,将分词后得到的每一词语作为一分词结果。其中,上述分词算法可以是FMM(Forward Maximum Matching Method,正向最大匹配法)、最短路径分词算法等。

除此之外,还可以利用预先训练完成的分词网络模型对待搜索词条进行分词处理,具体的,可以将待搜索词条输入上述分词网络模型,从而获得该模型输出的分词结果。

本发明的一个实施例中,在对待搜索词条的分词结果进行组合时,可以两两选择分词结果,实现对所有的分词结果进行组合;还可以针对相邻的两个分词结果进行组合,例如,假设待搜索词条为“知识竞赛报名条件”,对应的分词结果为“知识”、“竞赛”、“报名”,针对相邻的两个分词结果进行组合,可以得到的分词组合包括“知识+竞赛”、“竞赛+报名”。

除此之外,本发明的一个实施例中,每一分词组合中还可以包括三个分词结果、四个分词结果等,本发明实施例并不对此进行限定。

S103,针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数。

其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据。上述搜索数据为:数据库中预先存储的、用于作为搜索结果的数据。上述搜索数据的内容中包括该分词组合,可以理解为,搜索数据的标题或者正文中包含该组关键词。

具体的,针对每一分词组合,可以查找内容中包含上述分词组合的搜索数据,作为该分词组合对应的搜索数据,然后获得上述分词组合对应的搜索数据的历史点击数。该点击数可以反映用户对搜索结果的感兴趣程度,历史点击数越高,说明用户对该搜索数据的感兴趣程度越高,进而说明用户对该分词组合的感兴趣程度较高;点击数越低,说明用户对该搜索数据的感兴趣程度越低,进而说明用户对该分词组合的感兴趣程度较低。

其中,在获得搜索数据的历史点击数时,可以从历史点击记录中统计上述搜索数据的历史点击数。历史点击记录中记录有:不同用户对各个搜索数据的点击记录。上述历史点击记录可以从搜索日志中获得。

例如,参见下表1,下表1为本发明实施例提供的一种不同搜索数据历史点击数的示意表。假设待搜索词条为“智能模型”,对应的分词组合为“智能+模型”,如下表1所示为内容中包含上述分词组合的搜索数据,如“智能模型的起源与发展”等,并得到不同用户对每一搜索数据的历史点击数,如用户对搜索数据“人工智能网络模型有哪些”的历史点击数为200。

表1

本发明的一个实施例中,上述历史点击记录可以是:距离当前时间预设时间段内的搜索记录,上述预设时间段可以是一天、一周、一个月等。例如,假设当前时间为20.12.30,上述预设时间段为一周,则历史点击记录可以是20.12.23-20.12.30之间的搜索记录。

这样可以从短时间内的历史点击记录中,获得待搜索词条的不同分词组合的历史点击数。由于短时间内的历史点击记录更具有实时性,因此所得到的不同分词组合的历史点击数更具有表征意义。

除此之外,上述历史点击记录还可以是:在当前时间之前所有的点击记录。这样可以从所有的历史点击记录中获得不同搜索数据的点击数,所获得的点击数更加全面真实。

S104,根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。

具体的,针对每一分词组合,在该分词组合对应的历史点击数越高的情况下,说明用户对该分词组合的感兴趣程度越高,因此可以优先召回该分词组合对应的搜索数据;在该分词组合对应的历史点击数越低的情况下,说明用户对该分词组合的感兴趣程度越低,因此可以不优先召回该分词组合对应的搜索数据,最终实现对待搜索词条的搜索结果的召回。

本发明的一个实施例中,可以选择对应的搜索数据的历史点击数最高的至少一分词组合,作为目标组合,然后查找内容中选择包含上述目标组合的搜索数据,将所查找的搜索数据作为待搜索词条对应的搜索结果进行召回。

除此之外,还可以选择对应的搜索数据的历史点击数超过预设的点击数阈值的分词组合,作为目标组合,然后查找内容中选择包含上述目标组合的搜索数据,将所查找的搜索数据作为待搜索词条对应的搜索结果进行召回。

上述实施例提供的方案中,首先获得待搜索词条;对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用上述实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

本发明的一个实施例中,对于上述步骤S103,在获得每一分词组合对应的历史点击数时,可以针对每一分词组合,确定内容中包含该分词组合、且该分词组合对应的各个分词结果相邻排列的搜索数据,作为该分词组合对应的搜索数据;然后分别获得各个分词组合对应的搜索数据的历史点击数。

具体的,在得到待搜索词条对应的各个分词组合之后,可以查找内容中包含该分词组合、且该分词组合相邻排列的搜索数据,然后获得上述搜索数据的历史点击数。例如,假设待搜索词条的分词组合为“手机”和“贴膜”,其中一个数据的标题为“手机贴膜教程”,由于该数据的标题中上述两个分词结果相邻排列,因此可以将该数据作为上述分词组合对应的搜索数据。

这样由于搜索数据的内容中包含上述分词组合,且分词组合在上述搜索数据的内容中紧密排列,该分词组合对应的搜索数据的历史点击数越高,说明在该分词组合紧密排列的情况下用户对该分词组合对应的搜索数据的感兴趣程度越高,进而说明该分词组合之间的关联程度越高;该分词组合对应的搜索数据的历史点击数越低,说明在该分词组合紧密排列的情况下用户对该分词组合对应的搜索数据的感兴趣程度越低,进而说明该分词组合之间的关联程度越低。

本发明的一个实施例中,每一分词组合对应的搜索数据中包括相邻排列的该分词组合,且该分词组合在对应的搜索数据中的排列顺序与该分词组合在待搜索词条中的排列顺序相同。例如,假设待搜索词条为“科技发展趋势”,其中分词组合包括“科技+发展”,且“科技”在前、“发展”在后,则该分词组合对应的搜索数据中也需要包含上述词语,且“科技”在前、“发展”在后。

本发明的一个实施例中,针对待搜索词条对应的每一分词组合,可以根据内容中包含该分词组合、且该分词组合相邻排列的搜索数据的历史点击数,确定该分词组合的语义关联程度。上述语义关联程度用于表征分词组合内各个分词结果之间的关联程度,可以采用得分、比值等形式表示。

一种实现方式中,可以预先设定历史点击数与语义关联程度之间的对应关系,这样在获得历史点击数后,可以从上述对应关系中查找该历史点击数对应的语义关联程度,作为该分词组合之间的语义关联程度。

例如,参见下表2,下表2为本发明实施例提供的一种历史点击数与语义关联程度之间对应关系的示意表。

表2

假设所获得的一分词组合对应的搜索数据的历史点击数为450,根据上述表2可知,历史点击数处于“301~500”范围内,对应的语义关联程度为50,因此可以确定该分词组合的语义关联程度为50。

另一种实现方式中,还可以计算历史点击数占总搜索数据的历史点击数的比值,作为该分词组合之间的语义关联程度,其中,上述总搜索数据为:与该分词组合相关的搜索数据,例如,可以是内容中包含该分词组合的搜索数据,或者是语义与该分词组合相关的搜索数据等。

具体的,还可以统计分词组合对应的总搜索数据的历史点击数之和,作为目标点击数,在获得一分词组合对应的搜索数据的历史点击数后,可以计算上述历史点击数与上述目标点击数的比值,作为该分词组合之间的语义关联程度。

以上述表1所示实施例为例,待搜索词条为“智能模型”,其中的分词组合为“智能+模型”。其中搜索数据“智能模型的起源与发展”的标题中,上述分词组合相邻排列,因此可以将该搜索数据作为上述分词组合对应的搜索数据,该搜索数据的历史点击数为100。目标点击数为100+400+100+200+200=1000,计算上述历史点击数与目标点击数的比值得到100/1000=0.1,因此可以确定“智能+模型”的语义关联程度为0.1。

本发明的一个实施例中,每一分词组合也可以由待搜索词条中依次相邻的至少两个词语组成。针对待搜索词条中依次相邻的至少两个词语组成的每一分词组合,可以确定该分词组合相邻排列的搜索数据,作为该分词组合对应的搜索数据,然后从所获得的点击数中确定上述搜索数据的点击数,作为历史点击数,根据上述历史点击数获得该分词组合之间的语义关联程度。

例如,参见下表3,下表3为本发明实施例提供的另一种不同搜索数据历史点击数的示意表。假设待搜索词条为“乒乓球赛程安排”,包含“乒乓球”、“赛程、“安排”,其中“乒乓球”与“赛程”位置相邻,“赛程”与“安排”位置相邻,因此可以将“乒乓球”与“赛程”作为一分词组合,将“赛程”与“安排”作为一分词组合。

从下表3中可知,针对分词组合“乒乓球+赛程”,搜索数据“乒乓球赛程安排早知道”、“如何看待当前的乒乓球赛程安排”的标题中,“乒乓球”和“赛程”两个词语相邻排列,因此可以将上述搜索数据作为上述分词组合“乒乓球 +赛程”对应的搜索数据,上述搜索数据的点击数为分别为400、500,因此历史点击数为900。目标点击数为50+400+500+10+40=1000,计算上述历史点击数与目标点击数的比值得到900/1000=0.9,因此可以确定“乒乓球”和“赛程”的语义关联程度为0.9。同样的,可以确定““赛程”和“安排”的语义关联程度也为0.9。

表3

本发明的一个实施例中,在召回搜索结果时,可以选择对应的搜索数据的历史点击数满足预设的召回条件的分词组合,作为目标分词组合,确定内容中包含目标分词组合的搜索数据,将所确定的搜索数据作为待搜索词条的搜索结果进行召回。

具体的,在统计得到待搜索词条的各个分词组合对应的搜索数据的历史点击数之后,可以从中选择对应的历史点击数满足上述召回条件的目标分词组合,进而将内容中包含该目标分词组合的搜索数据,作为召回结果进行召回。

除此之外,还可以确定对应的搜索数据的历史点击数不满足召回条件的分词组合,作为非目标分词组合,确定内容中包含至少二非目标分词组合的搜索数据,将所确定的搜索数据作为待搜索词条的搜索结果进行召回。

具体的,针对目标分词组合,由于目标分词组合对应的搜索数据的历史点击数满足召回条件,说明用户对该目标分词组合的感兴趣程度较高,因此可以直接将内容中包含上述目标分词组合的搜索数据进行召回;

针对非目标分词组合,由于非目标分词组合对应的搜索数据的历史点击数不满足召回条件,说明用户对该目标分词组合的感兴趣程度较低,因此可以查找内容中包含多个非目标分词组合的搜索数据,然后对上述搜索数据进行召回。

本发明的一个实施例中,上述召回条件可以是历史点击数大于预设的点击数阈值。上述点击数阈值可以是500、1000、10000等。

除此之外,上述召回条件还可以是历史点击数占总点击数的比例大于预设的比例阈值。

其中,总点击数为:各个分词组合对应的搜索数据的历史点击数之和。上述比例阈值可以是0.2、0.3、0.5等。

具体的,可以统计待搜索词条的各个分词组合对应的搜索数据的历史点击数之和,作为总点击数,然后针对每一分词组合,计算该分词组合对应的搜索数据的历史点击数占上述总点击数的比例,在上述比例大于比例阈值的情况下,认为该分词组合满足召回条件,否则,认为该分词组合不满足上述召回条件。

本发明的一个实施例中,上述步骤S101在获得待搜索词条时,可以接收客户端发送的搜索指令,获得搜索指令中携带的词条,作为待搜索词条。

具体的,客户端可以向服务器发送搜索指令,上述搜索指令中可以携带期望搜索的词条,服务器接收到上述搜索指令后,可以解析得到指令中携带的词条,作为待搜索词条。

除此之外,还可以获得待推荐的预设词条,作为待搜索词条,在召回待搜索词条对应的搜索结果,还可以建立上述预设词条与所召回的搜索结果之间的关联关系。

具体的,可以获得待向用户推荐的预设词条,如当下的热门词汇、实事要闻、娱乐热点等,作为待搜索词条,获得上述预设词条的召回结果,然后创建预设词条与召回结果之间的关联关系。

这样可以将上述预设词条发送至客户端,由客户端展示给用户,例如可以展示在客户端的搜索框下方、或者直接展示在搜索框中,便于客户端将上述预设词条推荐给用户,在用户点击上述预设词条之后,则服务器可以直接从预先建立的关联关系中获得该预设词条对应的召回结果,然后将召回结果发送至客户端,从而客户端可以将所接收到的召回结果展示给用户,实现高效快捷地向用户展示召回结果,提高用户体验。

参见图2,图2为本发明实施例提供的另一种召回方法的流程示意图,在上述步骤S104获得召回结果之后,还可以包括如下步骤S105:

S105,根据各个分词组合对应的搜索数据的历史点击数,对所召回的搜索结果进行排序。

,具体的,可以按照内容中所包含的分词组合的历史点击数由高到低的顺序,对待搜索词条的各个搜索结果进行排序,这样可以使得搜索结果的排列顺序更有条理性,从而提高用户体验。

其中,可以按照各个搜索数据的标题中所包含的分词组合的历史点击数由高到低的顺序,对待搜索词条的各个搜索结果进行排序;

除此之外,还可以对内容中所包含的分词组合的历史点击数相加,按照历史点击数之和由高到低的顺序,对待搜索词条的各个搜索结果进行排序。

本发明的一个实施例中,还可以针对每一搜索数据,根据该搜索数据所包含的分词组合的排列信息、语义关联程度,确定用户对该搜索数据的感兴趣程度,根据所确定的感兴趣程度,对上述搜索数据进行排序。

其中,排列信息用于反映所包含的分词组合是否相邻排列。搜索数据中所包含的分词组合若相邻排列,通常与待搜索词条关联程度越高,从而可以认为用户对该搜索数据的感兴趣程度越高;

搜索数据中所包含的分词组合的语义关联程度越高,说明用户对包含该分词组合对应的搜索数据的历史点击数越大,从而说明用户可能也会对该搜索数据感兴趣。

具体的,针对每一搜索数据,可以获得该搜索数据所包含的分词组合的排列信息、语义关联程度,评估用户对该搜索数据的感兴趣程度,然后按照感兴趣程度由高到低的顺序,对各个搜索数据进行排序。这样可以实现将用户感兴趣程度较高的搜索数据排列在前、用户感兴趣程度较低的搜索数据排列在后,便于用户阅读上述搜索数据,从而提高用户体验。

上述实施例提供的方案中,首先获得待搜索词条;对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用上述实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

参见图3,图3为本发明实施例提供的一种召回装置的结构示意图,所述装置包括:

词条获得模块301,用于获得待搜索词条;

分词处理模块302,用于对所述待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;

点击数获得模块303,用于针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;

第一结果召回模块304,根据各个分词组合对应的搜索数据的历史点击数,召回所述待搜索词条对应的搜索结果。

本发明的一个实施例中,所述第一结果召回模块,具体用于:

选择对应的搜索数据的历史点击数满足预设的召回条件的分词组合,作为目标分词组合;

确定内容中包含所述目标分词组合的搜索数据,将所确定的搜索数据作为所述待搜索词条的搜索结果进行召回。

本发明的一个实施例中,所述装置还包括第二结果召回模块,用于:

确定对应的搜索数据的历史点击数不满足所述召回条件的分词组合,作为非目标分词组合;

确定内容中包含至少二非目标分词组合的搜索数据,将所确定的搜索数据作为所述待搜索词条的搜索结果进行召回。

本发明的一个实施例中,所述召回条件包括:

历史点击数大于预设的点击数阈值;和/或

历史点击数占总点击数的比例大于预设的比例阈值,其中,所述总点击数为:各个分词组合对应的搜索数据的历史点击数之和。

本发明的一个实施例中,所述点击数获得模块303,具体用于:

针对每一分词组合,确定内容中包含该分词组合、且该分词组合对应的各个分词结果相邻排列的搜索数据,作为该分词组合对应的搜索数据;

分别获得各个分词组合对应的搜索数据的历史点击数。

本发明的一个实施例中,所述词条获得模块301,具体用于:

接收客户端发送的搜索指令,获得所述搜索指令中携带的词条,作为待搜索词条;或

获得待推荐的预设词条,作为待搜索词条;

所述装置还包括关系建立模块,用于:

在召回所述待搜索词条对应的搜索结果之后,建立所述预设词条与所召回的搜索结果之间的关联关系。

本发明的一个实施例中,所述装置还包括结果排序模块,用于:

根据各个分词组合对应的搜索数据的历史点击数,对所召回的搜索结果进行排序。

上述实施例提供的方案中,首先获得待搜索词条;对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用上述实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,

存储器403,用于存放计算机程序;

处理器401,用于执行存储器403上所存放的程序时,实现召回方法。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的召回方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的召回方法。

上述实施例提供的方案中,首先获得待搜索词条;对待搜索词条进行分词处理,对得到的分词结果进行组合,得到分词组合;针对每一分词组合,获得该分词组合对应的搜索数据的历史点击数,其中,每一分词组合对应的搜索数据为:内容中包含该分词组合的搜索数据;根据各个分词组合对应的搜索数据的历史点击数,召回待搜索词条对应的搜索结果。由于每一搜索数据的历史点击数可以反映用户对搜索结果的感兴趣程度,这样基于每一分词组合对应的搜索数据的历史点击数,对待搜索词条对应的搜索结果进行召回,可以使得所召回的搜索词条对应的搜索结果与用户的感兴趣程度相关,提高了召回结果满足用户实际需求的概率。由此可见,应用上述实施例提供的召回方案,可以提高所召回的搜索结果的准确度。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、计算机可读存储介质实施例、计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 一种推荐系统召回率确定方法、装置、电子设备及存储介质
  • 一种召回方法、装置、电子设备及存储介质
技术分类

06120113116888