掌桥专利:专业的专利平台
掌桥专利
首页

推荐方法、装置、设备及存储介质

文献发布时间:2024-04-18 19:58:26


推荐方法、装置、设备及存储介质

技术领域

本申请涉及但不限于人工智能技术领域,尤其涉及一种推荐方法、装置、设备及存储介质。

背景技术

当前的社会和商业环境中,信息过载问题越来越严重。用户每天面临大量的信息和选择,如何帮助用户快速、准确地找到他们感兴趣的信息或商品成为了重要的挑战。推荐系统作为一种帮助用户快速、准确地找到感兴趣信息或商品的技术,已经被广泛应用于各种领域,如电商、新闻、音乐、电影、社交等。

传统的推荐系统对所有的用户都采用相同的推荐策略。这种做法忽略了不同用户之间的差异性和复杂性,因此推荐的准确性和个性化程度都有待提高。

发明内容

有鉴于此,本申请实施例至少提供一种推荐方法、装置、设备、存储介质。

本申请实施例的技术方案是这样实现的:

一方面,本申请实施例提供一种推荐方法,所述方法包括:获取当前用户对第一对象的第一交互数据和第一标签数据,并获取第一其他用户对所述第一对象的第一评论信息;基于所述当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型;利用所述当前用户对应的个性化推荐模型,基于多个待推荐对象中各所述待推荐对象的对象信息、第二其他用户对各所述待推荐对象的第二评论信息和所述当前用户的用户信息,生成各所述待推荐对象对应的推荐分数;所述推荐分数表征所述当前用户对所述待推荐对象的感兴趣程度;基于各所述待推荐对象对应的推荐分数,在所述多个待推荐对象中确定目标推荐对象。

在一些实施例中,所述第一交互数据包括所述当前用户的用户信息、所述第一对象的对象信息和所述当前用户针对所述第一对象的第一评论信息;所述基于所述当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型,包括:基于所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息和所述当前用户的用户信息,确定第一一致性偏差;基于第一初始评分和所述第一一致性偏差,确定所述当前用户对所述第一对象的第一预测数据;所述第一初始评分基于所述当前用户的用户信息和所述第一对象的对象信息确定的;通过所述当前用户对第一对象的第一标签数据和所述第一预测数据确定的第一梯度信息,对所述公共推荐模型进行参数调整,得到所述当前用户对应的个性化推荐模型。

在一些实施例中,所述基于所述第一其他用户对所述第一对象的第一评论信息和所述当前用户的用户信息,确定第一一致性偏差,包括:对所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息进行聚类,得到至少一个第一聚类表征;基于每一所述第一聚类表征和所述当前用户的用户信息,确定每一所述第一聚类表征对应的第一偏差;基于每一所述第一聚类表征对应的第一偏差,确定所述第一一致性偏差。

在一些实施例中,所述方法还包括:基于所述第一对象的对象信息确定所述第一对象的对象表征;基于所述当前用户的用户信息确定所述当前用户的用户表征;基于所述当前用户的用户表征和所述第一对象的对象表征,确定第一初始评分。

在一些实施例中,所述利用所述当前用户对应的个性化推荐模型,基于所述待推荐对象的对象信息、第二其他用户对所述待推荐对象的第二评论信息和所述当前用户的用户信息,生成推荐分数,包括:利用所述当前用户对应的个性化推荐模型,基于所述第二其他用户对所述待推荐对象的第二评论信息和所述当前用户的用户信息,确定第二一致性偏差;将基于第二初始评分和所述第二一致性偏差确定的第二预测数据,作为所述推荐分数;所述第二初始评分基于所述当前用户的用户信息和所述待推荐对象的对象信息确定的。

在一些实施例中,所述公共推荐模型的训练方法,包括:获取至少一个第一样本用户中每一所述第一样本用户的训练支持集和每一所述第一样本用户的训练查询集;所述训练支持集包括所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据,所述训练查询集包括所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据;基于每一所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据进行内优化训练,得到每一所述第一样本用户的样本用户推荐模型;基于每一第一样本用户的样本用户推荐模型、每一所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据进行外优化训练,得到公共推荐模型。

在一些实施例中,所述第一样本交互数据包括所述第一样本用户的用户信息、所述第一样本对象的对象信息和所述第一样本用户针对所述第一样本对象的第一样本评论信息;所述基于每一所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据进行内优化训练,得到每一所述第一样本用户的样本用户推荐模型,包括:针对所述至少一个第一样本用户中的目标用户,基于每一第一样本用户针对所述第一样本对象的第一样本评论信息和所述目标用户的用户信息,确定第三一致性偏差;第三一致性偏差表征每一所述第一样本用户针对所述第一样本对象的第一样本评论信息对所述目标用户对所述第一样本对象的感兴趣程度的影响;基于第三初始评分和所述第三一致性偏差,确定所述目标用户对所述第一样本对象的第三预测数据;所述第三初始评分基于所述目标用户的用户信息和所述第一样本对象的对象信息确定的;通过所述目标用户对所述第一样本对象的第一样本标签数据和所述第三预测数据确定的第二梯度信息,对所述目标用户的样本用户推荐模型进行参数调整,直至满足第一预设收敛条件,输出所述目标用户的样本用户推荐模型。

在一些实施例中,所述基于每一第一样本用户的样本用户推荐模型、每一所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据进行外优化训练,得到公共推荐模型,包括:利用每一第一样本用户的样本用户推荐模型,基于每一第一样本用户对第二样本对象的第二样本交互数据,生成每一所述第一样本用户对第二样本对象的第四预测数据;基于每一所述第一样本用户对第二样本对象的第四预测数据和每一所述第一样本用户对第二样本对象的第二样本标签数据,确定每一所述第一样本用户对应的第三梯度信息;基于每一所述第一样本用户对应的第三梯度信息确定综合梯度信息;基于所述综合梯度信息,对所述公共推荐模型进行参数调整,直至满足第二预设收敛条件,输出所述公共推荐模型。

在一些实施例中,所述方法还包括:获取多个用户对样本对象的样本交互数据和样本标签数据;将多个用户中的每一第一样本用户的前N个样本交互数据和样本标签数据作为所述训练支持集;将多个用户中的每一第一样本用户的后M个样本交互数据和样本标签数据作为所述训练查询集;将多个用户中的每一第二样本用户的前P个样本交互数据和样本标签数据作为所述测试支持集;将多个用户中的每一第二样本用户的后Q个样本交互数据和样本标签数据作为所述测试查询集;其中,N、M、O和P均为大于0的整数。

又一方面,本申请实施例提供一种基于元学习的物品推荐模型的训练装置,包括:

获取模块,用于获取当前用户对第一对象的第一交互数据和第一标签数据,并获取第一其他用户对所述第一对象的第一评论信息;

调整模块,用于基于所述当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型;

预测模块,用于利用所述当前用户对应的个性化推荐模型,基于多个待推荐对象中各所述待推荐对象的对象信息、第二其他用户对各所述待推荐对象的第二评论信息和所述当前用户的用户信息,生成各所述待推荐对象对应的推荐分数;所述推荐分数表征所述当前用户对所述待推荐对象的感兴趣程度;

确定模块,用于基于各所述待推荐对象对应的推荐分数,在所述多个待推荐对象中确定目标推荐对象。

再一方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。

又一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请的技术方案。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。

图1为本申请实施例提供的一种推荐方法的实现流程示意图;

图2为本申请实施例提供的一种推荐方法的实现流程示意图;

图3为本申请实施例提供的一种推荐方法的实现流程示意图;

图4为本申请实施例提供的一种推荐方法的实现流程示意图;

图5为本申请实施例提供的一种推荐方法的实现流程示意图;

图6为本申请实施例提供的一种推荐方法的实现流程示意图;

图7为本申请实施例提供的一种推荐方法的实现流程示意图;

图8为本申请实施例提供的一种推荐装置的组成结构示意图;

图9为本申请实施例提供的一种计算机设备的硬件实体示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。所涉及的术语“第一/第二/第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请的目的,不是旨在限制本申请。

本申请实施例提供一种推荐方法,该方法可以由计算机设备的处理器执行。其中,计算机设备指的可以是服务器、笔记本电脑、平板电脑、台式计算机、智能电视、机顶盒、移动设备(例如移动电话、便携式视频播放器、个人数字助理、专用消息设备、便携式游戏设备)等具备数据处理能力的设备。

图1为本申请实施例提供的一种推荐方法的实现流程示意图,如图1所示,该方法包括如下步骤S101至步骤S103:

步骤S101、获取当前用户对第一对象的第一交互数据和第一标签数据,并获取第一其他用户对所述第一对象的第一评论信息。

在本申请实施例中,为了得到当前用户对各个待推荐对象的推荐分数,需要获取该当前用户的历史行为数据,进而基于该历史行为数据对公共推荐模型进行调整,以得到该当前用户对应的个性化推荐模型。这里,当前用户对第一对象的第一交互数据和第一标签数据为历史行为数据。

在一些实施例中,该第一对象与各个待推荐对象的对象类型相同。其中,该第一对象的对象类型可以但不限于是商品对象、新闻对象、视频对象和音乐对象等。

在一些实施例中,当前对象对该第一对象的第一交互数据可以包括以下至少之一:该第一对象的对象信息,该当前用户的用户信息,当前用户针对所述第一对象的第一评论信息。

在一些实施例中,可以从该第一对象的评论列表中获取该第一其他用户对该第一对象的第一评论信息。需要说明的是,这里获取的第一其他用户对该第一对象的第一评论信息的发布时间需要早于该当前用户对该第一对象的第一交互数据的交互时间,同时,当前用户拥有对上述第一评论信息的浏览权限。

在一些实施例中,该第一标签数据表征用户对该第一对象的真实感兴趣程度。例如,该第一标签数据可以是当前用户针对该第一对象的交互过程中的打分分数,在一些场景中,可以以1星至5星中的任意一个级别的打分作为该第一标签数据;又例如,该第一标签数据可以表征当前用户是否针对该第一对象有目标交互动作,在第一对象为商品的场景中,在当前用户购买该第一对象的情况下,将当前用户对第一对象的第一标签数据设置为1,在当前用户将该第一对象加入购物车的情况下,将当前用户对第一对象的第一标签数据设置为0.5,在当前用户未产生对该第一对象的购买行为的情况下,将当前用户对第一对象的第一标签数据设置为0。应当理解的是,为了便于统一不同平台,或不同机制的打分数据/交互动作,可以对不同类型的打分数据/交互动作进行归一化处理,以得到分布在0至1之间的第一标签数据。其中,0表示当前用户对第一对象完全不感兴趣,1表示当前用户对第一对象特别感兴趣。

步骤S102、基于所述当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型。

在本申请实施例中,该公共推荐模型是通过以下方式训练得到的:基于每一所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据进行内优化训练,得到每一所述第一样本用户的样本用户推荐模型;基于每一第一样本用户的样本用户推荐模型、每一所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据进行外优化训练,得到公共推荐模型。其中,内优化训练得到每一所述第一样本用户的样本用户推荐模型的过程可以理解为元学习(Meta-Learing)过程中,通过基学习器(baselearner)完成单个用户的交互数据和标签数据进行模型训练,以了解该用户的兴趣和偏好的过程;外优化训练得到公共推荐模型的过程可以理解为元学习过程中,根据所有基学习器的输出(即多个样本用户推荐模型的输出)进行模型训练,以得到一个公共推荐模型的过程,该公共推荐模型可以快速适应新的用户数据,以满足新用户的推荐需求。

在一些实施例中,上述对公共推荐模型的参数进行调整的过程,可以包括:分别提取第一其他用户对所述第一对象的第一评论信息的评论表征,并提取当前用户对第一对象的第一交互数据的交互表征;通过确定第一其他用户对应的评论表征与当前用户的交互表征之间的相似性,对当前用户对第一对象的感兴趣程度进行预测,并得到对应的预测结果;最后,利用该预测结果和第一标签数据之间的差异确定公共推荐模型的参数的梯度信息,对公共推荐模型的参数进行调整,进而得到当前用户对应的个性化推荐模型。

在另一些实施例中,上述对公共推荐模型的参数进行调整的过程,还可以参阅后续图2对应实施例的实施方式。

步骤S103、利用所述当前用户对应的个性化推荐模型,基于多个待推荐对象中各所述待推荐对象的对象信息、第二其他用户对各所述待推荐对象的第二评论信息和所述当前用户的用户信息,生成各所述待推荐对象对应的推荐分数;所述推荐分数表征所述当前用户对所述待推荐对象的感兴趣程度。

在一些实施例中,针对每一个待推荐对象,可以将该待推荐对象对应的对象信息、第二其他用户对各所述待推荐对象的第二评论信息和所述当前用户的用户信息,输入到该当前用户对应的个性化推荐模型中,得到表征当前用户对所述待推荐对象的感兴趣程度的推荐分数。

其中,上述个性化推荐模型确定所述待推荐对象对应的推荐分数的过程与步骤S102对公共推荐模型的参数进行调整的步骤中生成预测数据的过程类似。在一些实施例中,该个性化推荐模型确定所述待推荐对象对应的推荐分数的过程包括:分别提取第二其他用户对所述待推荐对象的第二评论信息的评论表征,并提取当前用户的用户信息的用户表征;通过确定第二其他用户对应的评论表征与当前用户的用户表征之间的相似性,对当前用户对待推荐对象的感兴趣程度进行预测,并得到待推荐对象对应的推荐分数。在另一些实施例中,还可以参阅后续图3对应实施例的实施方式。

步骤S104、基于各所述待推荐对象对应的推荐分数,在所述多个待推荐对象中确定目标推荐对象。

在一些实施例中,在得到每一个待推荐对象的推荐分数之后,可以基于推荐分数从高到低进行排序,将排序靠前的N个待推荐对象作为目标推荐对象。

在另一些实施例中,在得到每一个待推荐对象的推荐分数之后,还可以与预设的推荐分数阈值进行比对,将超过该推荐分数阈值的待推荐对象作为目标推荐对象。

本申请实施例中,通过当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型,这样,可以基于当前用户的少量行为数据对预先训练好的公共推荐模型进行个性化参数调整,进而快速得到满足当前用户的个性化需求的推荐模型;同时,基于用户的行为数据和评论信息来调整公共推荐模型的参数,可以更加准确地反映当前用户的兴趣和需求,提高推荐的准确性和可靠性。

图2是本申请实施例提供的一种推荐方法的实现流程示意图,该方法可以由计算机设备的处理器执行。基于图1,所述第一交互数据包括所述当前用户的用户信息、所述第一对象的对象信息和所述当前用户针对所述第一对象的第一评论信息;图1中的S102可以更新为S201至S203,将结合图2示出的步骤进行说明。

步骤S201、基于所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息和所述当前用户的用户信息,确定第一一致性偏差。

在一些实施例中,该第一一致性偏差用于表征针对该第一对象的第一评论信息对当前用户的影响程度。具体来说,该第一一致性偏差表征了第一其他用户对该第一对象的第一评论信息,对当前用户针对该第一对象的感兴趣程度的影响程度。也就是说,该第一一致性偏差越大,表示该第一对象的第一评论信息对当前用户针对该第一对象的感兴趣程度的影响越大;该第一一致性偏差越小,表示该第一对象的第一评论信息对当前用户针对该第一对象的感兴趣程度的影响越小。

在一些实施例中,可以通过预先训练好的自然语言模型对所述第一对象的所有第一评论信息进行特征提取;即,对该当前用户针对所述第一对象的第一评论信息进行特征提取,得到当前用户对应的评论表征;并对第一其他用户对所述第一对象的第一评论信息进行特征提取,得到第一其他用户对应的评论表征。

其中,在对第一评论信息进行特征提取之前,还需要对该第一评论信息进行预处理,该预处理包括以下至少之一:去除停用词,去除标点符号等。其中,该停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词。上述预先训练好的自然语言模型可以采用深度双向预训练语言理解模型(Bidirectional Encoder Representations from Transformer,BERT)。

之后,可以分别确定该当前用户对应的评论表征与各第一其他用户对应的评论表征之间的相似度,将相似度之和作为该第一一致性偏差;还可以对第一其他用户对应的评论表征进行聚类,得到至少一个聚类中心,再分别确定该当前用户对应的评论表征与每一聚类中心之间的相似度,将相似度之和作为该第一一致性偏差;在上述实施例确定相似度之前,还可以基于预先训练好的特征提取模型对该当前用户的用户信息进行特征提取,得到该当前用户的用户表征,对该当前用户的用户表征和当前用户对应的评论表征进行融合,得到融合后的评论表征,并确定融合后的评论表征和各第一其他用户对应的评论表征之间的相似度,将相似度之和作为该第一一致性偏差。

在本申请实施例中,该第一交互数据包括当前用户的用户信息,其中,该用户信息可以但不限于是当前用户的标识、昵称、年龄等。

在一些实施例中,可以通过步骤S2011至步骤S2013实现上述基于所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息和所述当前用户的用户信息,确定第一一致性偏差。

步骤S2011、对所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息进行聚类,得到至少一个第一聚类表征。

在一些实施例中,可以通过预先训练好的自然语言模型对所述第一对象的所有第一评论信息进行特征提取;即,对该当前用户针对所述第一对象的第一评论信息进行特征提取,得到当前用户对应的评论表征;并对第一其他用户对所述第一对象的第一评论信息进行特征提取,得到第一其他用户对应的评论表征。利用聚类网络对当前用户对应的评论表征和第一其他用户对应的评论表征进行聚类,即可得到针对该第一对象的所有评论信息的特征聚类结果,该特征聚类结果包括至少一个第一聚类表征。

示例性的,可以采用K-means聚类网络,将其分为K个类别,并获取K个聚类中心作为上述第一聚类表征,K为大于或等于1的正整数。

在本申请实施例中,一个第一聚类表征可以反映所有用户从一个维度对该第一对象的评论特征。上述实施例中采用K-means聚类网络,实际上是认为物品下面有K种不同维度的评论,例如外观、质量、性能等维度,对于外观维度的第一聚类表征可以反映各个用户对于第一对象的外观的感兴趣/偏好程度;对于质量维度的第一聚类表征可以反映各个用户对于第一对象的质量的感兴趣/偏好程度;对于性能维度的第一聚类表征可以反映各个用户对于第一对象的性能的感兴趣/偏好程度。

步骤S2012、基于每一所述第一聚类表征和所述当前用户的用户信息,确定每一所述第一聚类表征对应的第一偏差。

在本申请实施例中,可以基于预先训练好的特征提取网络对该当前用户的用户信息进行特征提取,得到该当前用户的用户表征。

之后,利用偏差计算网络,基于该当前用户的用户表征和每一第一聚类表征,确定每一所述第一聚类表征对应的第一偏差。

这里,该偏差计算网络可以表示为

步骤S2013、基于每一所述第一聚类表征对应的第一偏差,确定所述第一一致性偏差。

在一些实施例中,可以将每一第一聚类表征对应的第一偏差之和,作为该第一一致性偏差。

在另一些实施例中,还可以获取每一所述第一聚类表征对应的权重,基于每一所述第一聚类表征对应的权重,对每一所述第一聚类表征对应的第一偏差进行加权求和,得到该第一一致性偏差。其中,该第一聚类表征对应的权重的大小与该第一聚类表征对应的第一评论信息的数量正相关。

步骤S202、基于第一初始评分和所述第一一致性偏差,确定所述当前用户对所述第一对象的第一预测数据;所述第一初始评分基于所述当前用户的用户信息和所述第一对象的对象信息确定的。

在本申请实施例中,在不考虑第一评论信息对当前用户针对第一对象的感兴趣程度的影响的情况下,基于该所述当前用户的用户信息和所述第一对象的对象信息可以得到该第一初始评分。然而,在实际场景中,由于用户面对该第一对象的同时,会获取到其他用户对该第一对象的第一评论信息,因此,当前用户对该第一对象的感兴趣程度也随之改变,进而基于第一初始评分和所述第一一致性偏差,确定所述当前用户对所述第一对象的第一预测数据。

在一些实施例中,可以将该第一初始评分和第一一致性偏差之和作为该当前用户对所述第一对象的第一预测数据。该第一预测数据表征了考虑第一评论信息对当前用户针对第一对象的感兴趣程度的影响的情况下,当前用户针对第一对象的感兴趣程度。

这里,上述第一预测数据可以通过公式(1)确定。

其中,

在一些实施例中,上述第一初始评分可以通过以下方式获取:基于所述第一对象的对象信息确定所述第一对象的对象表征;基于所述当前用户的用户信息确定所述当前用户的用户表征;基于所述当前用户的用户表征和所述第一对象的对象表征,确定第一初始评分。

在本申请实施例中,可以通过基础的推荐模型基于所述当前用户的用户表征和所述第一对象的对象表征确定第一初始评分。可以理解的是,该基础的推荐模型是不考虑第一评论信息对当前用户针对第一对象的感兴趣程度的影响的,本申请对该基础的推荐模型的实现方式不做限定。

步骤S203、通过所述当前用户对第一对象的第一标签数据和所述第一预测数据确定的第一梯度信息,对所述公共推荐模型进行参数调整,得到所述当前用户对应的个性化推荐模型。

在一些实施例中,该公共推荐模型包括上述自然语言模型、聚类网络、特征提取网络和偏差计算网络。这里确定的第一梯度信息至少用于对该公共推荐模型中的偏差计算网络的网络参数进行调整,即对上述偏差计算网络的网络参数

在一些实施例中,在上述自然语言模型、聚类网络、特征提取网络均不需要调整网络参数的情况下,当前用户对应的个性化推荐模型相较于公共推荐模型,仅变更了偏差计算网络的网络参数;也就是说,该当前用户对应的个性化推荐模型包括调参后的偏差计算网络

在一些实施例中,对偏差计算网络的网络参数进行调整的过程包括:利用预设的损失函数计算当前用户对第一对象的第一标签数据和所述第一预测数据之间的损失值;利用计算的损失值计算该偏差计算网络的网络参数

本申请实施例中,基于当前用户对第一对象的第一评论信息、第一其他用户对第一对象的第一评论信息和当前用户的用户信息,确定第一一致性偏差,能够更准确地捕捉当前用户与其他用户对待推荐对象的评论信息的相似性和差异性;同时,通过第一初始评分和第一一致性偏差来确定当前用户对第一对象的第一预测数据,能够综合考虑当前用户的用户信息和第一对象的对象信息,以及第一其他用户对待推荐对象的评论信息对当前用户对该待推荐对象的感兴趣程度的影响,从而得到更准确、更个性化的预测结果;通过当前用户对第一对象的第一标签数据和第一预测数据确定的第一梯度信息,对公共推荐模型进行参数调整,得到当前用户对应的个性化推荐模型,能够根据用户的个性化需求和偏好调整推荐模型,提高模型调整效率。

图3是本申请实施例提供的一种推荐方法的实现流程示意图,该方法可以由计算机设备的处理器执行。基于图1,图1中的S103可以更新为S301至S303,将结合图3示出的步骤进行说明。

步骤S301、利用所述当前用户对应的个性化推荐模型,基于所述第二其他用户对所述待推荐对象的第二评论信息和所述当前用户的用户信息,确定第二一致性偏差。

在本申请实施例中,针对每一个待推荐对象,可以将各第二其他用户对该待推荐对象的第二评论信息和当前用户的用户信息,输入到该个性化推荐模型,进而得到该待推荐对象对应的第二一致性偏差。其中,该第二一致性偏差表征了第二其他用户对该待推荐对象的第二评论信息,对当前用户针对该待推荐对象的感兴趣程度的影响程度。

在一些实施例中,利用该个性化推荐模型确定该第二一致性偏差的过程与步骤S201中确定第一一致性偏差的方式类似,该过程包括:通过预先训练好的自然语言模型对第二其他用户对所述待推荐对象的第二评论信息进行特征提取,得到第二其他用户对应的评论表征;通过聚类网络对第二其他用户对应的评论表征进行聚类,即可得到针对该待推荐对象的所有评论信息的特征聚类结果,该特征聚类结果包括至少一个第二聚类表征。之后,利用调参后的偏差计算网络

上述方案中,通过自然语言模型对第二其他用户对待推荐对象的第二评论信息进行特征提取,能够得到更具有代表性的评论表征,更好地理解用户对待推荐对象的评价和偏好;通过聚类网络对第二其他用户对应的评论表征进行聚类,可以得到针对该待推荐对象的所有评论信息的特征聚类结果,从而更好地捕捉不同用户对同一待推荐对象的评论信息的差异性和相似性,由此得到的第二一致性偏差可以更加准确的反映其他用户的评论信息对当前用户对该待推荐对象的感兴趣程度的影响。

步骤S302、将基于第二初始评分和所述第二一致性偏差确定的第二预测数据,作为所述推荐分数;所述第二初始评分基于所述当前用户的用户信息和所述待推荐对象的对象信息确定的。

在一些实施例中,上述第二初始评分可以通过以下方式获取:基于所述待推荐对象的对象信息确定所述待推荐对象的对象表征;基于所述当前用户的用户信息确定所述当前用户的用户表征;基于所述当前用户的用户表征和所述待推荐对象的对象表征,确定第一初始评分。在本申请实施例中,可以通过基础的推荐模型确定该第二初始评分。可以理解的是,该基础的推荐模型是不考虑第二评论信息对当前用户针对待推荐对象的感兴趣程度的影响的,本申请对该基础的推荐模型的实现方式不做限定。

本申请实施例中,通过利用个性化推荐模型确定第二一致性偏差,能够考虑到第二其他用户对待推荐对象的第二评论信息对当前用户对该待推荐对象的感兴趣程度的影响。同时,通过将基于第二初始评分和第二一致性偏差确定的第二预测数据作为推荐分数,能够综合考虑当前用户的用户信息和待推荐对象的对象信息,以及第二其他用户对待推荐对象的第二评论信息对当前用户对该待推荐对象的感兴趣程度的影响,从而得到更准确、更个性化的推荐分数。

图4是本申请实施例提供的一种公共推荐模型的训练方法的实现流程示意图,该方法可以由计算机设备的处理器执行。将结合图4示出的步骤进行说明。

步骤S401、获取至少一个第一样本用户中每一所述第一样本用户的训练支持集和每一所述第一样本用户的训练查询集。

其中,所述训练支持集包括所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据,所述训练查询集包括所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据。

在一些实施例中,该第一样本用户对第一样本对象的第一样本交互数据,包括该第一样本用户的用户信息、第一样本对象的对象信息、该第一样本用户对该第一样本对象的第一样本评论信息,相应地,第一样本交互数据对应有第一样本标签数据。该第一样本用户对第二样本对象的第二样本交互数据,包括该第一样本用户的用户信息、第二样本对象的对象信息、该第一样本用户对该第二样本对象的第二样本评论信息,相应地,第二样本交互数据对应有第二样本标签数据。

步骤S402、基于每一所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据进行内优化训练,得到每一所述第一样本用户的样本用户推荐模型。

在一些实施例中,内优化训练(Internal Optimization)是指针对单个第一样本用户的第一样本交互数据和第一样本标签数据进行模型训练的过程。

在这个过程中,模型会根据第一样本用户的实际行为(即第一样本交互数据)和反馈数据(第一样本标签数据)进行学习;通过这个过程,可以得到针对该第一样本用户的样本用户推荐模型,该样本用户推荐模型可以为对应的第一样本用户提供更准确、更符合用户兴趣的推荐服务。

步骤S403、基于每一第一样本用户的样本用户推荐模型、每一所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据进行外优化训练,得到公共推荐模型。

在一些实施例中,外优化训练(External Optimization)是指将多个用户的第二样本交互数据和第二样本标签数据纳入模型训练的过程。

在这个过程中,模型会根据多个用户的第二样本交互数据和第二样本标签数据进行学习。通过这个过程,可以得到一个更普遍适用的公共推荐模型,相较于步骤S402中得到的每一所述第一样本用户的样本用户推荐模型,该公共推荐模型更适应于大众的推荐服务。

在一些实施场景中,步骤S402和步骤S403可以理解为基于元学习的推荐方案,在该方案中,基学习器负责根据单个用户的交互数据和标签数据进行模型训练,以了解该用户的兴趣和偏好。基学习器可以是一种传统的推荐算法,例如矩阵分解、神经网络等。元学习器(meta-learner)负责从多个基学习器中学习如何快速适应新的用户数据。元学习器可以是一种元回归(meta-regression)算法,例如支持向量回归(Support VectorRegression,SVR)等。在步骤S402中,每个第一样本用户都会通过内优化训练得到一个样本用户推荐模型。这个过程可以被看作是基学习器根据第一样本用户的数据进行模型训练的过程。在步骤S403中,元学习器会根据所有基学习器的输出(即多个样本用户推荐模型的输出)进行模型训练,以得到一个公共推荐模型。这个过程可以被看作是元学习器利用多个基学习器的输出作为输入,进行元学习,从而得到如何快速适应新的用户数据的知识。

本申请实施例中,通过内优化训练得到每个第一样本用户的样本用户推荐模型,使得样本用户推荐模型能够捕捉单个用户的个性化需求;同时,根据多个样本用户推荐模型的输出进行外优化训练,得到公共推荐模型,进而通过该公共推荐模型可以快速适应新用户的数据,提高推荐效率。

图5是本申请实施例提供的一种公共推荐模型的训练方法的实现流程示意图,该方法可以由计算机设备的处理器执行。基于图4,图4中的S402可以更新为S501至S503,将结合图5示出的步骤进行说明。

步骤S501、针对所述至少一个第一样本用户中的目标用户,基于每一第一样本用户针对所述第一样本对象的第一样本评论信息和所述目标用户的用户信息,确定第三一致性偏差。

其中,第三一致性偏差表征每一所述第一样本用户针对所述第一样本对象的第一样本评论信息对所述目标用户对所述第一样本对象的感兴趣程度的影响。

在一些实施例中,可以对每一所述第一样本用户针对所述第一样本对象的第一样本评论信息进行聚类,得到至少一个第一样本聚类表征;基于每一所述第一样本聚类表征和所述目标用户的用户信息,确定每一所述第一样本聚类表征对应的第一样本偏差;基于每一所述第一样本聚类表征对应的第一样本偏差,确定所述第三一致性偏差。

这里,可以通过待训练的样本用户推荐模型中的自然语言模型对所述第一样本对象的所有第一样本评论信息进行特征提取,以得到该第一样本对象对应的所有评论表征;并通过待训练的样本用户推荐模型中的聚类网络对该第一样本对象对应的所有评论表征进行聚类,得到至少一个第一样本聚类表征;通过待训练的样本用户推荐模型中的特征提取网络对各个第一样本用户进行特征提取,得到各个第一样本用户对应的用户表征(包括了目标用户对应的用户表征);通过待训练的样本用户推荐模型中的偏差计算网络基于该目标用户对应的用户表征和每一第一样本聚类表征,确定每一所述第一样本聚类表征对应的第一样本偏差;将每一所述第一样本聚类表征对应的第一样本偏差之和,作为该第三一致性偏差。

这里,样本用户推荐模型中的偏差计算网络可以表示为

步骤S502、基于第三初始评分和所述第三一致性偏差,确定所述目标用户对所述第一样本对象的第三预测数据。

其中,所述第三初始评分基于所述目标用户的用户信息和所述第一样本对象的对象信息确定的。

在一些实施例中,上述第三初始评分可以通过以下方式获取:基于所述第一样本对象的对象信息确定所述第一样本对象的对象表征;基于所述目标用户的用户信息确定所述目标用户的用户表征;基于所述目标用户的用户表征和所述第一样本对象的对象表征,确定该第三初始评分。在本申请实施例中,可以通过基础的推荐模型,基于所述目标用户的用户表征和所述第一样本对象的对象表征确定第三初始评分。

在本申请实施例中,将该第三一致性偏差与该第三初始评分的和作为该目标用户对所述第一样本对象的第三预测数据。

步骤S503、通过所述目标用户对所述第一样本对象的第一样本标签数据和所述第三预测数据确定的第二梯度信息,对所述目标用户的样本用户推荐模型进行参数调整,直至满足第一预设收敛条件,输出所述目标用户的样本用户推荐模型。

在一些实施例中,该样本用户推荐模型包括上述自然语言模型、聚类网络、特征提取网络和偏差计算网络。这里确定的第二梯度信息至少用于对该样本用户推荐模型中的偏差计算网络的网络参数进行调整,即对上述偏差计算网络的网络参数θ进行调整,得到目标用户对应的调参后的偏差计算网络

在一些实施例中,对目标用户的样本用户推荐模型的偏差计算网络的网络参数进行调整的过程包括:利用预设的损失函数计算目标用户对第一样本对象的第一样本标签数据和所述第三预测数据之间的损失值;利用计算的损失值计算该目标用户对应的偏差计算网络的网络参数θ对应的第二梯度信息,之后利用梯度下降的方式优化该网络参数θ。

通过上述实施例的方法,可以得到每一第一样本用户对应的调参后的偏差计算网络

在一些实施例中,第一预设收敛条件包括以下至少之一:第二梯度信息小于预设的第二梯度阈值;相邻两次迭代之间的网络参数变化量小于预设的参数阈值;达到预设的最大迭代次数。

本申请实施例中,通过基于每一第一样本用户针对所述第一样本对象的第一样本评论信息和所述目标用户的用户信息,确定第三一致性偏差,由于考虑了第一样本用户针对第一样本对象的第一样本评论信息对目标用户对第一样本对象的感兴趣程度的影响,即第三一致性偏差,这样,基于该第三初始评分和所述第三一致性偏差确定的目标用户对所述第一样本对象的第三预测数据,可以更准确地表征目标用户的兴趣,提高了预测的准确度;同时,利用目标用户对应的第三预测数据和目标用户对所述第一样本对象的第一样本标签数据,训练得到目标用户的样本用户推荐模型,可以使得到的样本用户推荐模型更加符合单个目标用户的推荐需求。

图6是本申请实施例提供的一种公共推荐模型的训练方法的实现流程示意图,该方法可以由计算机设备的处理器执行。基于图4,图4中的S403可以更新为S601至S603,将结合图6示出的步骤进行说明。

步骤S601、利用每一第一样本用户的样本用户推荐模型,基于每一第一样本用户对第二样本对象的第二样本交互数据,生成每一所述第一样本用户对第二样本对象的第四预测数据。

在本申请实施例中,第一样本用户的样本用户推荐模型包括自然语言模型、特征提取网络、聚类网络和该第一样本用户对应的偏差计算网络。可以理解的的是,针对不同的第一样本用户,其对应的自然语言模型、聚类网络、特征提取网络均是相同的,不同的第一样本用户的样本用户推荐模型之间的差异在于偏差计算网络。

基于此,在基于每一第一样本用户对第二样本对象的第二样本交互数据,生成每一所述第一样本用户对第二样本对象的第四预测数据的过程中,可以先基于公共的自然语言模型和聚类网络,生成该第二样本对象对应的所有第二样本交互数据进行特征提取并聚类,得到至少一个第二样本聚类表征。

在一些实施例中,第一样本用户对第二样本对象的第二样本交互数据包括该第一样本用户的用户数据,第二样本对象的对象数据和第一样本用户对第二样本对象的第二样本评论数据。相应地,可以基于公共的自然语言模型对每一第一样本用户对第二样本对象的第二样本评论数据进行特征提取,得到每一第一样本用户对该第二样本对象的评论表征;之后,基于该聚类网络对每一第一样本用户对该第二样本对象的评论表征进行聚类,即可得到至少一个第二样本聚类表征。同时,可以基于公共的特征提取网络对每一第一样本用户的用户数据进行特征提取,得到每一第一样本用户对应的用户表征。

在一些实施例中,在得到至少一个第二样本聚类表征和每一第一样本用户对应的用户表征之后,可以基于每一第一样本用户对应的样本用户推荐模型确定每一所述第一样本用户对第二样本对象的第四预测数据。这里,针对每一第一样本用户,可以将该第一样本用户对应的用户表征和至少一个第二样本聚类表征输入到该第一样本用户对应的偏差计算网络

在一些实施例中,可以基于公共的特征提取网络对第二样本对象的对象信息进行特征提取,得到该第二样本对象的对象表征。基于所述第一样本用户对应的用户表征和所述第二样本对象的对象表征,确定该第四初始评分。在本申请实施例中,可以通过基础的推荐模型,基于所述第一样本用户对应的用户表征和所述第二样本对象的对象表征,确定该第四初始评分。

在本申请实施例中,将该第四一致性偏差与该第四初始评分的和作为该第一样本用户对第二样本对象的第四预测数据。

步骤S602、基于每一所述第一样本用户对第二样本对象的第四预测数据和每一所述第一样本用户对第二样本对象的第二样本标签数据,确定每一所述第一样本用户对应的第三梯度信息。

在本申请实施例中,需要针对每一第一样本用户,确定该第一样本用户对应的第三梯度信息。也就是说,需要利用预设的损失函数计算第一样本用户对第二样本对象的第二样本标签数据和所述第三预测数据之间的损失值;利用计算的损失值计算该第一样本用户对应的偏差计算网络的网络参数θ对应的第三梯度信息。

步骤S603、基于每一所述第一样本用户对应的第三梯度信息确定综合梯度信息。

这里,可以直接计算每一第一样本用户的第三梯度信息的平均值,作为该总和梯度信息。可以理解的是,各个第一样本用户对应的偏差计算网络遵循相同的网络参数分布,因此,可以通过计算第三梯度信息中每一个子参数的梯度平均值,进而确定该综合梯度信息。

步骤S604、基于所述综合梯度信息,对所述公共推荐模型进行参数调整,直至满足第二预设收敛条件,输出所述公共推荐模型。

在本申请实施例中,该公共推荐模型与该样本用户推荐模型的网络结构相同,均包括自然语言模型、聚类网络、特征提取网络和偏差计算网络。上述综合梯度信息用于对所述公共推荐模型中的偏差计算网络进行参数调整,得到调参后的偏差计算网络

在一些实施例中,第二预设收敛条件包括以下至少之一:综合梯度信息小于预设的综合梯度阈值;相邻两次迭代之间的网络参数变化量小于预设的参数阈值;达到预设的最大迭代次数。

需要说明的是,该公共推荐模型中的偏差计算网络与各个第一样本用户对应的偏差计算网络也遵循相同的网络参数分布。在初始状态下,该公共推荐模型中的偏差计算网络的网络参数

本申请实施例中,由于调整该公共推荐模型的偏差计算网络的网络参数

图7是本申请实施例提供的一种公共推荐模型的训练方法的实现流程示意图,该方法可以由计算机设备的处理器执行。基于图4,所述方法还可以包括为S701至S705,将结合图7示出的步骤进行说明。

步骤S701、获取多个用户对样本对象的样本交互数据和样本标签数据。

在一些实施例中,一个用户对一个样本对象的样本交互数据可以包括该用户的用户信息、样本对象的对象信息、该用户对该样本对象的样本评论信息;相应地,该样本交互数据对应一个样本标签数据。在一些场景中,可以从后台数据库中获取上述样本交互数据和样本标签数据。

示例性的,以存在用户1为例,步骤S701获取的多个用户对样本对象的样本交互数据和样本标签数据可以如表1所示。

表1

基于上述示例,用户1对商品1的样本交互数据包括该用户的用户信息“用户1”、样本对象的对象信息“商品1”、该用户对该样本对象的样本评论信息“该产品耐用;但该产品颜色不是很时尚”,与该样本交互数据对应的样本标签数据为“3”。

在本申请实施例中,需要先从用户维度,将多个用户划分为第一样本用户和第二样本用户,利用第一样本用户对应的数据构建训练集,利用第二样本用户对应的数据构建测试集。

步骤S702、将多个用户中的每一第一样本用户的前N个样本交互数据和样本标签数据作为所述训练支持集。

步骤S703、将多个用户中的每一第一样本用户的后M个样本交互数据和样本标签数据作为所述训练查询集。

在一些实施例中,针对得到各个第一样本用户,需要从样本对象的维度,将该第一样本用户的对样本对象的样本交互数据和样本标签数据,划分为训练支持集和训练查询集。在本申请实施例中,以第一样本用户包括(M+N)个样本交互数据和样本标签数据为例,可以将第一样本用户的前N个样本交互数据和样本标签数据作为所述训练支持集,将后M个样本交互数据和样本标签数据作为所述训练查询集。

示例性的,在表1中的用户1为第一样本用户的情况下,可以将“商品1”至“商品5”分别对应的样本交互数据和样本标签数据作为训练支持集;可以将“商品6”至“商品9”分别对应的样本交互数据和样本标签数据作为训练查询集。

步骤S704、将多个用户中的每一第二样本用户的前P个样本交互数据和样本标签数据作为所述测试支持集。

步骤S705、将多个用户中的每一第二样本用户的后Q个样本交互数据和样本标签数据作为所述测试查询集。

在一些实施例中,与第一样本用户的划分方式类似,针对得到各个第二样本用户,需要从样本对象的维度,将该第二样本用户的对样本对象的样本交互数据和样本标签数据,划分为训练支持集和训练查询集。在本申请实施例中,以第一样本用户包括(P+Q)个样本交互数据和样本标签数据为例,可以将第二样本用户的前P个样本交互数据和样本标签数据作为所述训练支持集,将后Q个样本交互数据和样本标签数据作为所述训练查询集。

其中,N、M、O和P均为大于0的整数。

由此,可以得到训练集

需要说明的是,训练集和测试集的样本用户是不重叠的。在一些实施例中,在从样本用户的维度将原始数据划分为第一样本用户和第二样本用户的过程中,第一样本用户和第二样本用户的比例分别为80%和20%。模型的训练流程一般是使用训练集进行模型的参数训练,然后使用测试集检验模型的泛化性能,两种数据集不交叉以避免信息泄露。

在一些实施例中,上述测试支持集用于对训练集得到的公共推荐模型的模型参数进行微调,得到第二样本用户对应的个性化模型。可以理解的是,上述过程与图1实施例中的步骤S102类似。上述测试查询集用于对得到的第二样本用户对应的个性化模型进行测试,在测试结果表征预测准确度满足预设要求的情况下,输出基于训练集得到的公共推荐模型。

基于上述实施例,能够通过获取多个用户的样本交互数据和样本标签数据,以及将数据划分为训练支持集、训练查询集、测试支持集和测试查询集,由此训练得到的推荐模型可以提高推荐准确率、模型的泛化能力和稳定性。

基于前述的实施例,本申请实施例提供一种推荐装置,该装置包括所包括的各单元、以及各单元所包括的各模块,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(Central ProcessingUnit,CPU)、微处理器(Microprocessor Unit,MPU)、数字信号处理器(Digital SignalProcessor,DSP)或现场可编程门阵列(Field Programmable Gate Array,FPGA)等。

图8为本申请实施例提供的一种推荐装置的组成结构示意图,如图8所示,推荐装置800包括:获取模块810、调整模块820、预测模块830和确定模块840,其中:

获取模块810,用于获取当前用户对第一对象的第一交互数据和第一标签数据,并获取第一其他用户对所述第一对象的第一评论信息;

调整模块820,用于基于所述当前用户对第一对象的第一交互数据和第一标签数据、所述第一其他用户对所述第一对象的第一评论信息对公共推荐模型的参数进行调整,得到所述当前用户对应的个性化推荐模型;

预测模块830,用于利用所述当前用户对应的个性化推荐模型,基于多个待推荐对象中各所述待推荐对象的对象信息、第二其他用户对各所述待推荐对象的第二评论信息和所述当前用户的用户信息,生成各所述待推荐对象对应的推荐分数;所述推荐分数表征所述当前用户对所述待推荐对象的感兴趣程度;

确定模块840,用于基于各所述待推荐对象对应的推荐分数,在所述多个待推荐对象中确定目标推荐对象。

在一些实施例中,所述第一交互数据包括所述当前用户的用户信息、所述第一对象的对象信息和所述当前用户针对所述第一对象的第一评论信息;所述调整模块820,还用于:基于所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息和所述当前用户的用户信息,确定第一一致性偏差;基于第一初始评分和所述第一一致性偏差,确定所述当前用户对所述第一对象的第一预测数据;所述第一初始评分基于所述当前用户的用户信息和所述第一对象的对象信息确定的;通过所述当前用户对第一对象的第一标签数据和所述第一预测数据确定的第一梯度信息,对所述公共推荐模型进行参数调整,得到所述当前用户对应的个性化推荐模型。

在一些实施例中,所述调整模块820,还用于:对所述当前用户针对所述第一对象的第一评论信息、所述第一其他用户对所述第一对象的第一评论信息进行聚类,得到至少一个第一聚类表征;基于每一所述第一聚类表征和所述当前用户的用户信息,确定每一所述第一聚类表征对应的第一偏差;基于每一所述第一聚类表征对应的第一偏差,确定所述第一一致性偏差。

在一些实施例中,所述调整模块820,还用于:基于所述第一对象的对象信息确定所述第一对象的对象表征;基于所述当前用户的用户信息确定所述当前用户的用户表征;基于所述当前用户的用户表征和所述第一对象的对象表征,确定第一初始评分。

在一些实施例中,所述预测模块830,还用于:利用所述当前用户对应的个性化推荐模型,基于所述第二其他用户对所述待推荐对象的第二评论信息和所述当前用户的用户信息,确定第二一致性偏差;将基于第二初始评分和所述第二一致性偏差确定的第二预测数据,作为所述推荐分数;所述第二初始评分基于所述当前用户的用户信息和所述待推荐对象的对象信息确定的。

在一些实施例中,所述推荐装置还包括训练模块。

所述训练模块,用于:获取至少一个第一样本用户中每一所述第一样本用户的训练支持集和每一所述第一样本用户的训练查询集;所述训练支持集包括所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据,所述训练查询集包括所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据;基于每一所述第一样本用户对第一样本对象的第一样本交互数据和第一样本标签数据进行内优化训练,得到每一所述第一样本用户的样本用户推荐模型;基于每一第一样本用户的样本用户推荐模型、每一所述第一样本用户对第二样本对象的第二样本交互数据和第二样本标签数据进行外优化训练,得到公共推荐模型。

在一些实施例中,所述第一样本交互数据包括所述第一样本用户的用户信息、所述第一样本对象的对象信息和所述第一样本用户针对所述第一样本对象的第一样本评论信息;所述训练模块,还用于:针对所述至少一个第一样本用户中的目标用户,基于每一第一样本用户针对所述第一样本对象的第一样本评论信息和所述目标用户的用户信息,确定第三一致性偏差;第三一致性偏差表征每一所述第一样本用户针对所述第一样本对象的第一样本评论信息对所述目标用户对所述第一样本对象的感兴趣程度的影响;基于第三初始评分和所述第三一致性偏差,确定所述目标用户对所述第一样本对象的第三预测数据;所述第三初始评分基于所述目标用户的用户信息和所述第一样本对象的对象信息确定的;通过所述目标用户对所述第一样本对象的第一样本标签数据和所述第三预测数据确定的第二梯度信息,对所述目标用户的样本用户推荐模型进行参数调整,直至满足第一预设收敛条件,输出所述目标用户的样本用户推荐模型。

在一些实施例中,所述训练模块,还用于:利用每一第一样本用户的样本用户推荐模型,基于每一第一样本用户对第二样本对象的第二样本交互数据,生成每一所述第一样本用户对第二样本对象的第四预测数据;基于每一所述第一样本用户对第二样本对象的第四预测数据和每一所述第一样本用户对第二样本对象的第二样本标签数据,确定每一所述第一样本用户对应的第三梯度信息;基于每一所述第一样本用户对应的第三梯度信息确定综合梯度信息;基于所述综合梯度信息,对所述公共推荐模型进行参数调整,直至满足第二预设收敛条件,输出所述公共推荐模型。

在一些实施例中,所述训练模块,还用于:获取多个用户对样本对象的样本交互数据和样本标签数据;将多个用户中的每一第一样本用户的前N个样本交互数据和样本标签数据作为所述训练支持集;将多个用户中的每一第一样本用户的后M个样本交互数据和样本标签数据作为所述训练查询集;将多个用户中的每一第二样本用户的前P个样本交互数据和样本标签数据作为所述测试支持集;将多个用户中的每一第二样本用户的后Q个样本交互数据和样本标签数据作为所述测试查询集;其中,N、M、O和P均为大于0的整数。

以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上述方法实施例描述的方法,对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。

需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的推荐方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件、软件或固件,或者硬件、软件、固件三者之间的任意结合。

本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。

本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。

本申请实施例提供一种计算机程序,包括计算机可读代码,在所述计算机可读代码在计算机设备中运行的情况下,所述计算机设备中的处理器执行用于实现上述方法中的部分或全部步骤。

本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一些实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。

这里需要指出的是:上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。

图9为本申请实施例提供的一种计算机设备的硬件实体示意图,如图9所示,该计算机设备900的硬件实体包括:处理器901和存储器902,其中,存储器902存储有可在处理器901上运行的计算机程序,处理器901执行程序时实现上述任一实施例的方法中的步骤。

存储器902存储有可在处理器上运行的计算机程序,存储器902配置为存储由处理器901可执行的指令和应用,还可以缓存待处理器901以及计算机设备900中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。

处理器901执行程序时实现上述任一项的推荐方法的步骤。处理器901通常控制计算机设备900的总体操作。

本申请实施例提供一种计算机存储介质,计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例的推荐方法的步骤。

这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。

上述处理器可以为目标用途集成电路(Application Specific IntegratedCircuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable LogicDevice,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。

上述计算机存储介质/存储器可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。

应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各步骤/过程的序号的大小并不意味着执行顺序的先后,各步骤/过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ReadOnly Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

相关技术
  • 基于车载设备的内容推荐方法、装置、设备和存储介质
  • 一种推荐方法、装置、设备和存储介质
  • 一种餐馆智能推荐方法、装置、设备及存储介质
  • 信息推荐方法、装置、计算机设备及存储介质
  • 应用功能推荐方法、装置、计算机设备和存储介质
  • 一种推荐系统训练方法、推荐方法、装置、电子设备及存储介质
  • 推荐模型训练方法、推荐方法、装置、设备及存储介质
技术分类

06120116486537