掌桥专利:专业的专利平台
掌桥专利
首页

一种信息推荐的方法及装置

文献发布时间:2023-06-19 11:22:42


一种信息推荐的方法及装置

技术领域

本说明书涉及计算机技术领域,尤其涉及一种信息推荐的方法及装置。

背景技术

目前,用户可以根据自身的实际需求,向服务器进行信息查询。服务器可以基于用户输入的关键词或搜索语句,向用户进行信息推荐。

在现有技术中,服务器通常需要基于用户输入的关键词或是搜索语句确定出若干的候选推荐信息,并从这些候选推荐信息中选取出部分的候选推荐信息推荐给用户。然而在实际应用中,服务器向用户推荐的信息中可能包含有不符合用户实际需求的推荐信息,或是与用户输入的关键词或是搜索语句关联性较弱的推荐信息,这给用户的信息浏览过程中带来了一定的不便。

因此,如何能够有效地提高信息推荐的准确性以及合理性,则是一个亟待解决的问题。

发明内容

本说明书提供一种信息推荐的方法及装置,以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案:

本说明书提供了一种信息推荐的方法,包括:

获取目标用户的搜索信息;

从预先构建出的各信息关联图中确定所述搜索信息对应的信息关联图,作为目标信息关联图,所述信息关联图用于表示各关键词与各用户已点击的历史推荐信息之间的对应关系;

针对所述搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与所述目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据;

根据所述搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在所述搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率;

根据各候选推荐信息对应的推荐概率,向所述目标用户进行信息推荐。

可选地,从预先构建出的各信息关联图中确定所述搜索信息对应的信息关联图,具体包括:

从所述搜索信息中提取出至少一个关键词,作为目标关键词;

从预先构建出的各信息关联图中查询出包含有所述目标关键词的信息关联图,作为所述搜索信息对应的信息关联图。

可选地,预先构建各信息关联图,具体包括:

获取各用户的历史搜索记录;

根据所述历史搜索记录,确定各用户发送的历史搜索信息中包含的关键词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为基础对应关系;

根据所述基础对应关系,构建各信息关联图。

可选地,根据所述基础对应关系,构建各信息关联图,具体包括:

确定各用户发送的历史搜索信息所对应的相关词;

将所述相关词以及所述历史搜索信息中包含的关键词作为搜索词,并将所述搜索词按照预设的各类别进行分类,得到各类别对应的词集合;

针对每个类别对应的词集合,根据所述基础对应关系,确定该词集合中包含的各搜索词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为该词集合对应的对应关系;

根据该词集合对应的对应关系,构建该类别对应的信息关联图。

可选地,根据所述历史搜索记录,确定各用户发送的历史搜索信息中包含的关键词与选取出的各用户已点击的历史推荐信息之间的对应关系,具体包括:

根据所述历史搜索记录,确定各用户已点击的各历史推荐信息,以及每个历史推荐信息对应的点击次数;

将所述各历史推荐信息中点击次数高于设定次数的历史推荐信息进行选取,并确定选取出的历史推荐信息与各用户发送的历史搜索信息中包含的关键词之间的对应关系。

可选地,训练推荐模型,具体包括:

获取各用户的历史搜索记录;

根据所述历史搜索记录,构建所述推荐模型对应的样本集,针对所述样本集中的每个训练样本,该训练样本中包含历史搜索信息、所述历史搜索信息对应的历史推荐信息,以及所述历史搜索信息对应的标签信息,所述标签信息用于表征所述历史搜索信息对应的历史推荐信息的点击状况;

针对所述样本集中的每个训练样本,根据该训练样本中包含的历史搜索信息,从预先构建出的各信息关联图中确定该训练样本对应的信息关联图;

通过所述推荐模型,对该训练样本中包含的历史推荐信息对应的特征数据与该训练样本对应的信息关联图的特征数据进行融合,得到该训练样本中包含的历史推荐信息对应的融合特征数据;

根据该训练样本中包含的历史搜索信息对应的特征数据与该训练样本中包含的历史推荐信息对应的融合特征数据,确定该训练样本中包含的历史推荐信息对应的推荐概率;

以最小化该训练样本中包含的历史推荐信息对应的推荐概率与该训练样本包含的标签信息之间的偏差为优化目标,对所述推荐模型进行训练。

可选地,训练推荐模型,具体包括:

针对所述推荐模型对应的每轮训练,通过所述推荐模型对应的样本集,对所述推荐模型进行训练,得到该轮训练后对应的推荐模型;

通过该轮训练后对应的推荐模型,对验证集中的训练样本进行识别,并从所述验证集中确定出该轮训练后对应的推荐模型误识别的训练样本,作为补充训练样本;

将所述补充训练样本加入到所述推荐模型对应的样本集中,得到补充后样本集,并通过所述补充后样本集,在该轮训练之后的其他轮训练中对所述推荐模型进行训练。

本说明书提供了一种信息推荐的装置,包括:

获取模块,用于获取目标用户的搜索信息;

确定模块,用于从预先构建出的各信息关联图中确定所述搜索信息对应的信息关联图,作为目标信息关联图,所述信息关联图用于表示各关键词与各用户已点击的历史推荐信息之间的对应关系;

融合模块,用于针对所述搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与所述目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据;

概率模块,用于根据所述搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在所述搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率;

推荐模块,用于根据各候选推荐信息对应的推荐概率,向所述目标用户进行信息推荐。

本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息推荐的方法。

本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述信息推荐的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果:

在本说明书提供的信息推荐的方法中,服务器可以获取目标用户的搜索信息,从预先构建出的各信息关联图中确定搜索信息对应的信息关联图,作为目标信息关联图,信息关联图用于表示各关键词与各用户已点击的历史推荐信息之间的对应关系。其次,针对搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据。而后,根据搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率,最后,根据各候选推荐信息对应的推荐概率,向目标用户进行信息推荐。

从上述方法中可以看出,本方法能够通过确定候选推荐信息与搜索信息之间的对应关系,使得候选推荐信息中与搜索信息不相关或相关性低的候选推荐信息对应的推荐概率降低,从而提高候选推荐信息对应的推荐概率的准确性,进而更准确地向用户进行信息推荐。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:

图1为本说明书中一种信息推荐的方法的流程示意图;

图2为本说明书中一种根据词集合的对应关系构建信息关联图的示意图;

图3为本说明书中一种信息推荐的装置的示意图;

图4为本说明书提供的对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。

以下结合附图,详细说明本说明书各实施例提供的技术方案。

在现有技术中,服务器基于用户输入的关键词或搜索语句,向用户推荐的信息可能无法满足用户的实际需求,例如用户输入关键词为苹果,服务器可能向用户推荐红富士苹果、手机、苹果味汽水等,但是苹果味汽水可能不是用户实际需要的,因此,仅根据关键词或搜索语句向用户进行信息推荐,会导致推荐结果在准确性以及合理性上往往较低。

为了解决以上问题,本说明书提供了一种信息推荐的方法,服务器可以获取目标用户的搜索信息,从预先构建出的各信息关联图中确定搜索信息对应的信息关联图,作为目标信息关联图。根据候选推荐信息对应的特征数据、目标信息关联图对应的特征数据以及搜索信息对应的特征数据,确定在搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率,最后,根据各候选推荐信息对应的推荐概率,向目标用户进行信息推荐。

可以看出,相比于现有技术,本方案能够通过确定候选推荐信息与搜索信息之间的对应关系,使得候选推荐信息中与搜索信息不相关或相关性低的候选推荐信息对应的推荐概率降低,因此,本方法可以提高候选推荐信息对应的推荐概率的准确性,进而更准确地向用户进行信息推荐。

图1为本说明书中一种信息推荐的方法的流程示意图,具体包括以下步骤:

S100:获取目标用户的搜索信息。

本说明书提供的信息推荐的执行主体可以是诸如服务器、由多台电脑构成的设备集群等终端设备。为了便于描述,下面将仅以服务器为执行主体,对本说明书提供的信息推荐的方法进行说明。

在本说明书实施例中,服务器可以获取目标用户的搜索信息。这里提到的搜索信息可以是指用户输入的需要进行搜索的描述信息,该描述信息可以是关键词、语句等文本信息,也可以是目标用户输入的语音形式的信息。若搜索信息为语句,则需要对搜索信息进行分词,确定搜索信息中的关键词,进而在后续过程中,基于得到的关键词,确定出搜索信息对应的信息关联图。

S102:从预先构建出的各信息关联图中确定所述搜索信息对应的信息关联图,作为目标信息关联图,所述信息关联图用于表示各关键词与各用户已点击的历史推荐信息之间的对应关系。

在本说明书实施例中,服务器从预先构建出的各信息关联图中确定搜索信息对应的信息关联图,作为目标信息关联图,若搜索信息为单个的关键词,则可以直接在预先构建出的各信息关联图中查找该字词对应的信息关联图,若搜索信息为语句,则可以先从搜索信息中提取关键词,作为目标关键词,再从预先构建出的各信息关联图中查询出包含有目标关键词的信息关联图,作为搜索信息对应的信息关联图。从搜索信息中可以采用自然语言处理的的方法对搜索信息进行分词,也可以是根据预先构建出的关键词库对搜索信息中的关键词进行匹配。本说明书对提取关键词的方法不作限定。

上述信息关联图可以通过各关键词与各用户已点击的历史推荐信息之间的对应关系得到的。具体的,服务器可以获取各用户的历史搜索记录,这里提到的历史搜索记录包括历史搜索信息、历史搜索信息对应的历史推荐信息、各历史推荐信息对应的点击次数等,这里提到的历史搜索信息对应的历史推荐信息是指历史上根据用户的搜索信息进行推荐的推荐信息。

服务器可以根据历史搜索记录,确定各用户发送的历史搜索信息中包含的关键词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为基础对应关系。也就是说,该基础对应关系记录了历史搜索信息中包含的一个关键词,与一个以该关键词进行搜索的已点击的历史推荐信息之间的对应关系。

例如,历史搜索信息中包含的关键词为辣味、鸡肉,以关键词为辣味、鸡肉进行搜索的已点击的历史推荐信息为宫保鸡丁,则辣味与宫保鸡丁为一个基础对应关系,鸡肉与宫保鸡丁为一个基础对应关系。

进一步地,服务器可以确定各用户发送的历史搜索信息所对应的相关词,并根据确定出的相关词以及关键词,构建各信息关联图。其中,这里提到的相关词可以是指本身并不包含在历史搜索信息中,但是与历史搜索信息密切相关的词。例如,假设历史搜索信息为宫保鸡丁,辣味、鸡肉这些词虽然没有包含在该历史搜索信息中,但是体现出了宫保鸡丁的口味和食材,是和这一历史搜索信息密切相关的,所以可以作为该历史搜索信息的相关词。

基于此,服务器可以将相关词以及历史搜索信息中包含的关键词作为搜索词,并将搜索词按照预设的各类别进行分类,得到各类别对应的词集合。预设的各类别可以是根据实际需求设定的类别,每种类别对应一个词集合,若关键词与相关词相同,在词集合中用同一搜索词来进行表示,而同一搜索词可以对应有多个词集合。其中,对搜索词进行分类的方法可以有多种,如,使用卷积神经网络(Convolutional Neural Networks,CNN)进行分类,或是通过计算搜索词之间的相似度(如欧式距离、杰卡德距离等)来进行分类,本说明书在此不进行限定。

在本说明书实施例中,服务器针对每个类别对应的词集合,根据基础对应关系,确定该词集合中包含的各搜索词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为该词集合对应的对应关系,进而根据该词集合对应的对应关系,构建该类别对应的信息关联图,如图2所示。

图2为本说明书中一种根据词集合的对应关系构建信息关联图的示意图。

服务器将确定出的搜索词按照预设的各类别进行分类,得到图2中类别为口味的词集合。在该词集合中包含的辣味、酸味、麻辣、甜味等搜索词,这些搜索词与历史上用户已点击的历史推荐信息相对应。如,若是用户在历史上以辣味为搜索词,搜索出了宫保鸡丁这一历史推荐信息,并对这一历史推荐信息进行了点击操作,则可以将辣味这一搜索词与宫保鸡丁这一历史推荐信息进行关联。而从图2中可以看出,辣味与宫保鸡丁、甜味与宫保鸡丁、甜味与糖醋排骨等均为服务器通过获取到的历史搜索记录所确定出的基础对应关系,服务器可以通过这些基础对应关系,来构建类别为口味的信息关联图。也就是说,该词集合中的每个搜索词对应的可以是根据该搜索词进行搜索后,所点击的历史推荐信息。

进一步地,在本说明书实施例中,服务器也可以根据历史搜索记录,确定各用户已点击的各历史推荐信息,以及每个历史推荐信息对应的点击次数,将各历史推荐信息中点击次数高于设定次数的历史推荐信息进行选取。也就是说,点击次数较高的历史推荐信息可以认为是较为普遍的点击行为,而根据同一历史搜索记录,点击次数较少的历史推荐信息可能出现误点击,用户被其他信息所干扰的情况,因此,需要过滤点击次数较少的历史推荐信息的干扰,并确定选取出的历史推荐信息与各用户发送的历史搜索信息中包含的关键词之间的对应关系。

从上述内容中可以看出,服务器通过信息关联图可以有效的过滤历史上用户点击次数较少的历史推荐信息,使得基于信息关联图所确定出的推荐信息,是符合大部分用户的意愿需求的,从而提高服务器信息推荐的准确性以及合理性,进而给用户在信息浏览过程中带来了一定的方便,有效地提高了用户的业务体验。

S104:针对所述搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与所述目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据。

在本说明书实施例中,服务器可以根据搜索信息得到若干个候选推荐信息,在若干个候选推荐信息中选取部分候选推荐信息,向用户进行信息推荐。

服务器可以针对搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据。

其中,将候选推荐信息转化为特征数据的方法可以有多种,如,基于变压器的双向编码器表示(Bidirectional Encoder Representation from Transformers,BERT)模型、双向长短期记忆(Bi-directional Long Short-Term Memory,Bi-LSTM)、卷积神经网络(Convolutional Neural Networks,CNN)等方法,本说明书在此不进行限定。若使用的方法为基于变压器的双向编码器表示模型,具体可以是确定候选推荐信息中的每个字的特征数据、候选推荐信息中的每个字的位置的特征数据,以及区分候选推荐信息中的不同内容成分的特征数据,并根据这些特征数据,最终确定出该候选推荐信息对应的特征数据。

上述提到的区分候选推荐信息中的不同内容成分的特征数据,可以是将不同的特征数据分别加在候选推荐信息中的不同内容成分中,来对候选推荐信息中的不同内容成分进行区分,例如,候选推荐信息中包含有商品名、商家名,可以在商品名和商家名中加入不同的特征数据,以对商品名和商家名进行区分,避免商品名和商家名连用降低推荐模型的准确性。

将候选推荐信息转化为特征数据的方法还可以是双向长短期记忆(Bi-directional Long Short-Term Memory,Bi-LSTM)、卷积神经网络(Convolutional NeuralNetworks,CNN)等方法,本说明书在此不进行限定。

将目标信息关联图转化为特征数据的方法可以是从目标信息关联图中提取特征,也可以是图注意力网络(Graph Attention Network,GAT)、图卷积网络(GraphConvolutional Network,GCN)等方法,本说明书在此不进行限定。而将候选推荐信息对应的特征数据与目标信息关联图对应的特征数据进行融合,可以采用基础模型的concat层,深度兴趣网络(Deep Interest Network、DIN)模型的weighted-sum层等网络结构来实现,本说明书在此不进行限定。

在本说明书实施例中,上述提到的推荐模型需要进行预先训练,具体的,在模型训练过程中,服务器可以获取各用户的历史搜索记录,构建推荐模型对应的样本集,训练样本中包含历史搜索信息、历史搜索信息对应的历史推荐信息,以及历史搜索信息对应的标签信息,标签信息用于表征历史搜索信息对应的历史推荐信息的点击状况,也就是说,若历史搜索信息对应的历史推荐信息被点击,则该训练样本为正样本,若历史搜索信息对应的历史推荐信息未被点击,则该训练样本为负样本。

服务器可以针对样本集中的每个训练样本,根据该训练样本中包含的历史搜索信息,从预先构建出的各信息关联图中确定该训练样本对应的信息关联图,其中,由于对于一个历史搜索信息来说,该历史搜索信息中可能包含有多个搜索词,不同搜索词对应的类别可能也不尽相同,因此,服务器可以从预先构建出的各信息关联图中确定出该历史搜索信息对应的多个信息关联图。

服务器可以通过推荐模型,对该训练样本中包含的历史推荐信息对应的特征数据与该训练样本对应的信息关联图的特征数据进行融合,得到该训练样本中包含的历史推荐信息对应的融合特征数据。而后,服务器可以根据该训练样本中包含的历史搜索信息对应的特征数据与该训练样本中包含的历史推荐信息对应的融合特征数据,确定该训练样本中包含的历史推荐信息对应的推荐概率。服务器可以最小化该训练样本中包含的历史推荐信息对应的推荐概率与该训练样本包含的标签信息之间的偏差为优化目标,对推荐模型进行训练。

在实际应用中,服务器通常需要使用样本集,对推荐模型进行多轮训练,而为了进一步地提高模型的准确率,服务器可以针对推荐模型对应的每轮训练,通过推荐模型对应的样本集,对推荐模型进行训练,得到该轮训练后对应的推荐模型,通过该轮训练后对应的推荐模型,对验证集中的训练样本进行识别。

其中,这里提到的验证集可以是该推荐模型在训练过程中使用的样本集,也可以是预先设定的专门用于验证的验证集,还可以是全量样本集。基于此,服务器可以从验证集中确定出该轮训练后对应的推荐模型误识别的训练样本,作为补充训练样本,将补充训练样本加入到推荐模型对应的样本集中,得到补充后样本集。这样可以提高模型训练的效果,从而提高推荐模型确定的推荐概率的准确性。

需要说明的是,若验证集为全量样本集,则该推荐模型在训练过程中使用的样本集,可以是全量样本集中的部分训练样本构成的,当然,推荐模型在训练过程中也可以使用全量样本集进行训练。

服务器可以通过补充后样本集,在该轮训练之后的其他轮训练中对推荐模型进行训练。为了提高模型训练的效率,服务器可以复制该轮训练后对应的推荐模型,使用多个线程或多台机器同时执行对验证集中的训练样本识别以及对推荐模型的训练。

其中,服务器在完成推荐模型的第N轮训练后,可以将第N轮训练后的推荐模型进行复制,并等待复制的推荐模型对验证集中的训练样本的识别。在通过复制的推荐模型得到补充训练样本后,服务器可以将补充训练样本加入到该推荐模型对应的样本集中,再通过补充后样本集,在第N+1轮训练中继续对该推荐模型进行训练。

当然,服务器还可以在完成推荐模型的第N轮训练后,复制第N轮训练后对应的推荐模型,并对推荐模型执行第N+1轮的训练,与此同时,服务器可以通过复制的第N轮训练后的推荐模型对验证集中的训练样本进行识别,以得到补充训练样本,并将补充训练样本加入到第N+1轮训练后的推荐模型所对应的样本集中,得到补充后样本集,进而通过该补充后样本集,对推荐模型执行第N+2轮的训练,其中,N为正整数。

需要说明的是,若验证集中确定出该轮训练后对应的推荐模型误识别的训练样本极少,服务器还可以根据相似特征向量搜索(Faiss),在验证集中得到与历史搜索信息对应的已点击的历史推荐信息(正样本)的特征数据最接近的若干个历史搜索信息对应的未点击的历史推荐信息(负样本),作为补充训练样本,再将补充训练样本加入到推荐模型对应的样本集中,并通过补充后样本集,对推荐模型进行训练。

S106:根据所述搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在所述搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率。

S108:根据各候选推荐信息对应的推荐概率,向所述目标用户进行信息推荐。

在本说明书实施例中,服务器可以根据搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,确定该候选推荐信息对应的推荐概率。在本说明书实施例中,服务器可以根据各候选推荐信息对应的推荐概率,向目标用户进行信息推荐,其中,服务器可以将各候选推荐信息对应的推荐概率高于设定的阈值的候选推荐信息选取出来,推荐给目标用户。

从上述内容中可以看出,服务器通过将确定出的信息关联图的特征数据与候选推荐信息的特征数据进行融合,得到候选推荐信息的融合特征数据,再根据候选推荐信息对应的融合特征数据与搜索信息对应的特征数据,判断候选推荐信息与搜索信息之间的相关性,从而使得候选推荐信息中与搜索信息不相关或相关性低的候选推荐信息对应的推荐概率降低。

也就是说,本说明书提供的信息推荐的方法能够通过历史搜索记录中点击次数较高的历史推荐信息与历史搜索信息来构建信息关联图,而基于信息关联图,服务器可以有效的过滤掉在历史上用户点击次数较少的候选推荐信息。所以,将信息关联图对应的特征数据与候选推荐信息的特征数据相融合,可以降低搜索信息与其不相关或是相关性较低的候选推荐信息之间的相关性,这使得服务器最终确定出的推荐信息是符合大部分用户的意愿需求的,从而保证推荐模型推荐信息的准确性以及合理性,进而给用户的信息浏览过程中带来了一定的方便,提高了用户的业务体验。

以上为本说明书的一个或多个实施例提供的信息推荐的方法,基于同样的思路,本说明书还提供了相应的信息推荐的装置,如图3所示。

图3为本说明书提供的一种信息推荐的装置示意图,具体包括:

获取模块300,用于获取目标用户的搜索信息;

确定模块302,用于从预先构建出的各信息关联图中确定所述搜索信息对应的信息关联图,作为目标信息关联图,所述信息关联图用于表示各关键词与各用户已点击的历史推荐信息之间的对应关系;

融合模块304,用于针对所述搜索信息对应的每个候选推荐信息,通过预先训练的推荐模型,对该候选推荐信息对应的特征数据与所述目标信息关联图对应的特征数据进行融合,得到该候选推荐信息对应的融合特征数据;

概率模块306,用于根据所述搜索信息对应的特征数据以及该候选推荐信息对应的融合特征数据,确定在所述搜索信息包含的关键词与各用户已点击的历史推荐信息之间的对应关系下,该候选推荐信息对应的推荐概率;

推荐模块308,用于根据各候选推荐信息对应的推荐概率,向所述目标用户进行信息推荐。

可选地,所述确定模块302具体用于,从所述搜索信息中提取出至少一个关键词,作为目标关键词,从预先构建出的各信息关联图中查询出包含有所述目标关键词的信息关联图,作为所述搜索信息对应的信息关联图。

可选地,所述确定模块302具体用于,获取各用户的历史搜索记录,根据所述历史搜索记录,确定各用户发送的历史搜索信息中包含的关键词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为基础对应关系,根据所述基础对应关系,构建各信息关联图。

可选地,确定模块302具体用于,确定各用户发送的历史搜索信息所对应的相关词,将所述相关词以及所述历史搜索信息中包含的关键词作为搜索词,并将所述搜索词按照预设的各类别进行分类,得到各类别对应的词集合,针对每个类别对应的词集合,根据所述基础对应关系,确定该词集合中包含的各搜索词与选取出的各用户已点击的历史推荐信息之间的对应关系,作为该词集合对应的对应关系,根据该词集合对应的对应关系,构建该类别对应的信息关联图。

可选地,所述确定模块302具体用于,根据所述历史搜索记录,确定各用户已点击的各历史推荐信息,以及每个历史推荐信息对应的点击次数,将所述各历史推荐信息中点击次数高于设定次数的历史推荐信息进行选取,并确定选取出的历史推荐信息与各用户发送的历史搜索信息中包含的关键词之间的对应关系;

可选地,所述融合模块304具体用于,获取各用户的历史搜索记录,根据所述历史搜索记录,构建所述推荐模型对应的样本集,针对所述样本集中的每个训练样本,该训练样本中包含历史搜索信息、所述历史搜索信息对应的历史推荐信息,以及所述历史搜索信息对应的标签信息,所述标签信息用于表征所述历史搜索信息对应的历史推荐信息的点击状况,针对所述样本集中的每个训练样本,根据该训练样本中包含的历史搜索信息,从预先构建出的各信息关联图中确定该训练样本对应的信息关联图,通过所述推荐模型,对该训练样本中包含的历史推荐信息对应的特征数据与该训练样本对应的信息关联图的特征数据进行融合,得到该训练样本中包含的历史推荐信息对应的融合特征数据,根据该训练样本中包含的历史搜索信息对应的特征数据与该训练样本中包含的历史推荐信息对应的融合特征数据,确定该训练样本中包含的历史推荐信息对应的推荐概率,以最小化该训练样本中包含的历史推荐信息对应的推荐概率与该训练样本包含的标签信息之间的偏差为优化目标,对所述推荐模型进行训练。

可选地,所述融合模块304具体用于,针对所述推荐模型对应的每轮训练,通过所述推荐模型对应的样本集,对所述推荐模型进行训练,得到该轮训练后对应的推荐模型,通过该轮训练后对应的推荐模型,对验证集中的训练样本进行识别,并从所述验证集中确定出该轮训练后对应的推荐模型误识别的训练样本,作为补充训练样本,将所述补充训练样本加入到所述推荐模型对应的样本集中,得到补充后样本集,并通过所述补充后样本集,在该轮训练之后的其他轮训练中对所述推荐模型进行训练。

本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1所示的信息推荐的方法。

本说明书还提供了图4所示的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的信息推荐的方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

相关技术
  • 一种信息推荐方法、装置和用于信息推荐的装置
  • 一种信息推荐方法、装置和用于信息推荐的装置
技术分类

06120112901165