一种信息推荐方法、装置、电子设备及可读存储介质

文献发布时间：2023-06-19 09:35:27

技术领域

本申请实施例涉及数据处理技术领域，尤其涉及一种信息推荐方法、装置、电子设备及可读存储介质。

背景技术

目前，信息投放方为提高用户对信息的关注度，会为待投放的信息设计出多种展示形式。例如，广告投放商为提高用户对投放的广告的关注度，会对广告的展示展示形式(例如：大小、颜色、亮度、标题、位置等)进行多样化设计；再例如，某公益组织为吸引用户对某项活动的信息的关注度，会对该项活动的信息的展示形式进行多样化设计。而每个用户的喜好和诉求点不同，用户对不同展示形式的信息的偏好度不同，因此信息展示平台存在着根据用户的偏好度，选择并展示最吸引用户的展示形式的信息的需求。

以信息是广告为例，目前已有的广告多任务预估模型所采用的广告算法主要是挖掘用户行为特征和广告的固有属性等，来选择并展示最吸引用户的广告。例如根据挖掘出的各个广告的用户行为特征和广告的固有属性，确定出各个广告的点击率CTR(Click-Through-Rate)、转化率CVR(Conversion Rate)、成交总额GMV(Gross MerchandiseVolume)等指标，通过对各个指标的评估进而确定出最吸引用户的广告并进行展示。

然而，相关技术中，当广告的展示形式多样化时，忽略了广告的展示形式这一因素，导致预测的各个指标诸如点击率CTR、转化率CVR、单价Price等的精准度较低，因此，无法克服广告的展示形式对用户的偏好度所带来的影响。

发明内容

本申请实施例提供了一种信息推荐方法、装置、电子设备及可读存储介质，通过对信息的展示形式进行分析，能准确地获得用户对展示形式的偏好度，并根据用户的偏好度，选择并展示最吸引用户的展示形式的信息，有效增强了用户的使用体验。

本申请实施例第一方面提供了一种信息推荐方法，所述方法包括：

对多个信息分别进行特征提取，得到所述多个信息各自的通用特征和偏置特征，其中，一个信息的通用特征用于表征该信息的信息内容，一个信息的偏置特征用于表征该信息的展示形式；

将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定所述多个信息各自的推荐得分；

根据所述多个信息各自的推荐得分，得到预备向用户推荐的目标信息；

其中，所述信息推荐模型包括预设任务模型、偏置模型和融合模块，所述预设任务模型以多个样本信息各自的通用特征以及所述多个样本信息各自携带的预设任务对应的标签为输入训练得到的，所述偏置模型以所述多个样本信息各自的偏置特征以及所述多个样本信息各自携带的所述预设任务对应的标签为输入训练得到的，所述融合模块用于对所述预设任务模型输出的通用指标值和所述偏置模型输出的偏置系数进行融合，并输出各个信息各自的推荐得分。

可选地，一个信息的偏置特征包括该信息的多个不同维度的偏置特征；所述偏置模型包括多个偏置专家网络，一个偏置专家网络是以所述多个样本信息的同一维度的偏置特征以及预先对所述多个样本信息分别标注的该维度的偏置因子标签为训练样本，对第一预设网络模型进行训练得到的。

可选地，一个信息的偏置特征包括该信息的多个不同维度的偏置特征；所述预设任务模型包括多个子任务网络；所述偏置模型包括多个门开关网络、多个偏置专家网络和多个融合子模块，一个门开关网络以及一个融合子模块与一个子任务网络对应；

一个融合子模块用于根据一个门开关网络输出的多个不同维度的权重，对多个偏置专家网络各自输出的偏置因子进行融合，并输出各个信息的偏置系数。

可选地，所述多个门开关网络各自输出的同一维度的权重不同。

可选地，所述预设任务模型包括多个子任务网络，所述多个子任务网络表征的多个子任务之间相互关联；每个子任务网络以多个样本信息各自的通用特征以及所述多个样本信息各自携带的子任务对应的标签为输入训练得到的；

对应于一个子任务网络的一个门开关网络是以所述多个样本信息各自的各个维度的偏置特征以及预先对所述多个样本信息分别标注的子任务对应的各个维度的权重标签为训练样本，对第二预设网络模型进行训练得到的。

可选地，所述多个子任务网络表征的多个子任务为以下任意多者的组合：点击率CTR、转化率CVR、成交总额GMV、单价Price、点击且转化率CTCVR。

可选地，一个信息的偏置特征包括以下至少一者：该信息的展示位置、该信息的展示形式、该信息的展示渠道、该信息是否包含图片、该信息中图片的尺寸。

本申请实施例第二方面提供一种信息推荐装置，所述装置包括：

提取模块，用于对多个信息分别进行特征提取，得到所述多个信息各自的通用特征和偏置特征，其中，一个信息的通用特征用于表征该信息的信息内容，一个信息的偏置特征用于表征该信息的展示形式；

输入模块，用于将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定所述多个信息各自的推荐得分；

获得模块，用于根据所述多个信息各自的推荐得分，得到预备向用户推荐的目标信息；

可选地，所述多个门开关网络各自输出的同一维度的权重不同。

可选地，所述多个子任务网络表征的多个子任务为以下任意多者的组合：点击率CTR、转化率CVR、成交总额GMV、单价Price、点击且转化率CTCVR。

可选地，一个信息的偏置特征包括以下至少一者：该信息的展示位置、该信息的样式、该信息的展示渠道、该信息是否包含图片、该信息中图片的尺寸。

本申请实施例第三方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请第一方面所述的信息推荐方法中的步骤。

本申请实施例第四方面提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请第一方面所述的信息推荐方法中的步骤。

通过本实施例的信息推荐方法，首先对多个信息分别进行特征提取，得到多个信息各自的通用特征和偏置特征，其中，一个信息的通用特征用于表征该信息的信息内容，一个信息的偏置特征用于表征该信息的展示形式；然后将多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定多个信息各自的推荐得分；最后根据多个信息各自的推荐得分，得到预备向用户推荐的目标信息。本申请的信息推荐方法具有如下多个有益效果：

一、在传统的多任务预估模型的基础上设置了偏置模型和融合模块，得到了信息推荐模型，通过偏置模型输出的偏置系数对预设任务模型输出的通用指标值进行纠正，提升了信息推荐模型输出的各个指标值的精准度。

二、将信息的展示形式作为偏置特征输入到偏置模型，利用展示形式所带来的影响(量化为偏置系数)对预设任务模型输出的通用指标值进行纠正，充分考虑了信息的展示形式对用户的偏好度的影响，更能真实反映用户对信息的偏好度，降低了目标信息与用户真正感兴趣的信息之间存在的偏差，增强了用户的使用体验。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是相关技术中常规的广告多任务预估模型的示意图；

图2是本申请一实施例示出的一种实施环境示意图；

图3是本申请一实施例示出的一种信息推荐方法的流程图；

图4是本申请一实施例示出的一种信息推荐模型的示意图；

图5是本申请一实施例示出的又一种信息推荐模型的示意图；

图6是本申请一实施例提供的信息推荐装置的结构框图；

图7是本申请一实施例示出的一种电子设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请所指的信息包括多种类型，例如广告投放商所投放的广告、某社会组织投放的活动信息、政府出台的某项政策等，本申请对信息的类型不作具体限制。在此特别说明，为便于陈述后续各个实施例，本申请后文所指的信息均以广告为例，当信息的类型是其它类型时，其推荐原理与广告的推荐原理相同。

以信息是广告为例，相关技术中通过广告多任务预估模型选择并展示广告的过程如图1所示。图1是相关技术中常规的广告多任务预估模型的示意图。

在图1中，设置有两个不同的子任务网络1和子任务网络2，用于处理不同的指标，例如点击率CTR、转化率CVR、成交总额GMV、单价Price等，当然，在多任务预估模型中还可以设置其它多个子任务网络，图1仅示例出了两个子任务网络的情形。广告展示平台在多个待展示的广告中选择目标广告并进行展示时，将多个待展示的广告各自的通用特征输入到各个子任务网络，得到各个子任务网络输出的指标值，再通过对各个指标值的分析，获得目标广告，例如目标广告可以是转化率CVR最高的广告，或者成交总额GMV最高的广告等。

其中，通用特征为不考虑展示形式的特征，可以包括连续特征和类别特征，连续特征一般指数值类特征，类别特征是指可枚举或者类别个数有限的特征

然而，由于通用特征并未考虑广告的展示形式，因此子任务网络输出的指标值的精准度较低，无法真实反映用户对广告的偏好度，导致确定出的目标广告与用户真正感兴趣的广告存在较大的偏差，极大地影响了用户的使用体验。

为克服相关技术中所存在的问题，本申请提出了如下技术构思：利用多个偏置网络对传统的多任务预估模型进行纠正，基于纠正后的模型同时考虑信息的通用特征和展示形式特征，使模型对通用特征和展示形式特征进行综合分析，能够更加精准地预测各个指标值，进而获得更能反映用户真实偏好度的目标信息。

图2是本申请一实施例示出的一种实施环境示意图。在图2中，信息展示平台在获得多个待展示的信息之后，将多个待展示的信息输入到信息推荐模型，获得目标信息，然后将目标信息输入到信息显示层进行显示。其中，信息推荐模型既可以设置于信息展示平台中，也可以设置于其它第三方平台中，当设置于其它第三方平台时，信息展示平台通过与其它第三方平台通信交互获得信息推荐模型输出的目标信息。

下面将详细介绍本申请所提出的信息推荐方法，该方法应用于图2所示的信息展示平台。图3是本申请一实施例示出的一种信息推荐方法的流程图。参照图3，本申请的信息推荐方法可以包括如下步骤：

步骤S11：对多个信息分别进行特征提取，得到所述多个信息各自的通用特征和偏置特征，其中，一个信息的通用特征用于表征该信息的信息内容，一个信息的偏置特征用于表征该信息的展示形式。

在本实施例中，通用特征表示信息的内容。针对信息的文字部分，信息的内容为文字内容；针对信息的图片部分，信息的内容为图片所展示的内容；针对信息的音频部分，信息的内容为音频对应的内容；针对信息的视频部分，信息的内容为视频对应的内容等。一个信息的通用特征可以为文字、图片、音频、视频等一者或多者的组合。

示例地，当信息的文字部分为“季末大促销时”等字样时，信息展示平台对文字部分进行文字识别，得到的信息的内容为“季末大促销时”。当信息的图片部分为涉及各类海鲜的图样时，信息展示平台对图片部分进行图像识别，获得各类海鲜的名称，例如识别为“鱼类”、“虾类”、“贝类”，得到的信息的内容为“鱼类、虾类、贝类”。当信息的音频部分为涉及各类家具的语音内容时，信息展示平台将音频部分转换为文字部分，例如转换为“餐桌”、“沙发”、“组合柜”，得到的信息的内容为“餐桌、沙发、组合柜”。当信息的视频部分为涉及各类服饰的语音内容时，信息展示平台对视频部分进行图像识别，获得各类服饰的名称，例如“帽子”、“围巾”、“眼镜”，得到的信息的内容为“帽子、围巾、眼镜”。

在本实施例中，偏置特征表示信息的展示形式，一个信息的偏置特征包括以下至少一者：该信息的展示位置、该信息的样式、该信息的展示渠道、该信息是否包含图片、该信息中图片的尺寸。

在本实施例中，信息主要是指线上信息。其中，信息的展示位置主要是指线上展示位置，例如屏幕中央、屏幕上方、屏幕右下方等。信息的样式主要是指设计风格，例如卡通、复古、简约、商业等。信息的展示渠道主要是指线上展示渠道，例如资讯媒体、社交媒体、OTV(Online TV，线上电视台)等。当然，偏置特征还可以包括其它多种，例如信息的亮度、是否含有标语、是否含有标题、信息的颜色、信息的摆放形态等，本实施例对此不作具体限制。

在本实施例中，信息展示平台还可以增加图片处理功能，例如旋转、剪裁、镜像、亮度等，如此便可更好地识别出信息中的图片的特征。信息展示平台还可以增加文字处理功能，例如采用NLP(Neuro-Linguistic Programming，神经语言程序学)算法(包括但不限于LDA(Latent Dirichlet Allocation，文档主题生成模型)、word2vec(word to vector)、fasttext(快速文本分类法)等方法)对信息中的标题、标语等进行特征抽取。本申请中可以根据实际需求丰富信息展示平台的功能。

步骤S12：将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定所述多个信息各自的推荐得分。

在一种实施方式中，将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定所述多个信息各自的推荐得分，包括：

将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，获得各个信息的预设指标值。

针对每一个信息，根据其预设指标值，确定对应的推荐得分。

其中，信息推荐模型可以根据实际需求设置任意数量的指标，因而每个信息对应的指标可以有一个，也可以有多个。

具体实施时，可以根据各个指标值所在的区间，确定该指标值对应的分数，将每一个信息的所有的指标值对应的分数之和作为该信息对应的推荐得分。

示例地，以信息推荐模型设置的指标包括点击率CTR、转化率CVR以及成交总额GMV时，多个信息包括信息X和信息Y为例，在获得信息X的推荐得分时，可以首先获得信息X的点击率CTR对应的分数G1、转化率CVR对应的分数G2以及成交总额GMV对应的分数G3，将G1、G2、G3的总和(G1+G2+G3)作为信息X的推荐得分。同理，在获得信息Y的推荐得分时，可以首先获得信息Y的点击率CTR对应的分数G1’、转化率CVR对应的分数G2’以及成交总额GMV对应的分数G3’，将G1’、G2’、G3’的总和(G1’+G2’+G3’)作为信息Y的推荐得分。

通常情况下，指标值与分数成正比，指标值越高，对应的分数越高，相应地，各个指标值之和也越高。因此，推荐得分越高，表示信息产生的效益越大，例如转化率CVR较高，或者成交总额GMV较高等。

在本实施例中，所述信息推荐模型包括预设任务模型、偏置模型和融合模块，所述预设任务模型以多个样本信息各自的通用特征以及所述多个样本信息各自携带的预设任务对应的标签为输入训练得到的，所述偏置模型以所述多个样本信息各自的偏置特征以及所述多个样本信息各自携带的所述预设任务对应的标签为输入训练得到的，所述融合模块用于对所述预设任务模型输出的通用指标值和所述偏置模型输出的偏置系数进行融合，并输出各个信息各自的推荐得分。

在本实施例中，每一个预设任务对应一个指标，例如预设任务为点击率时，对应的指标为点击率CTR；预设任务为转化率时，对应的指标为转化率CVR；预设任务为成交总额时，对应的指标为成交总额GMV。预设任务对应的标签是指用户对输入的信息的行为特征，例如预设任务是点击率时，对应的标签为“点击”或“未点击”，再例如预设任务是转化率时，对应的标签为“转化”或“未转化”。用户对输入的信息的行为特征可以通过分析用户对信息的历史行为数据获得。

其中，根据多个样本信息各自的通用特征以及多个样本信息各自携带的预设任务对应的标签为作为训练样本，对预设网络模型进行训练可以得到预设任务模型，在使用时，将通用特征输入到预设任务模型，可以获得通用指标值。根据多个样本信息各自的偏置特征以及多个样本信息各自携带的预设任务对应的标签为作为训练样本，对预设网络模型进行训练可以得到偏置模型，在使用时，将偏置特征输入到偏置模型，可以获得偏置系数。

在本实施例中，设置偏置模型的目的是对预设任务模型的输出值进行纠正，偏置模型充分考虑了信息的偏置特征，通过输出的偏置系数对通用指标值进行纠正，可以获得精准度更高的指标值，即后文所述的预设指标值。

可以理解的是，通过偏置系数对通用指标值进行纠正的过程，即融合模块对通用指标值和偏置系数获进行融合的过程，包括：将偏置系数与通用指标值进行相乘。

图4是本申请一实施例示出的一种信息推荐模型的示意图。结合图4，在本实施例中，将信息X的通用特征输入到预设任务模型可以获得通用指标值，将信息X的偏置特征输入到偏置模型可以获得偏置系数。融合模块用一方面根据通用指标值和偏置系数获得预设指标值，另一方面根据预设指标值获得信息X的推荐得分。示例地，通过信息推荐模型获得推荐得分的过程可如下表所示：

步骤S13：根据所述多个信息各自的推荐得分，得到预备向用户推荐的目标信息。

在本实施例中，可以将多个信息中推荐得分最高的信息作为目标信息。当存在多个信息的推荐得分相同时，可以选择任意一个信息作为目标信息，也可以按照其他标准对推荐得分相同的信息再次进行评估，例如是否符合当下流行趋势、信息投放商是否为会员等，以获得目标信息。

以信息推荐平台是某外卖平台为例，该外卖平台提供有用户版本的外卖APP，该外卖APP的主页的顶部设置有广告框，用于周期性展示不同的广告，因此外卖平台需要周期性选择目标广告并显示在该广告框中，例如周期性选择不同分类下的代表性广告显示在该广告框中。在某个周期内，外卖平台对指定分类下的众多商家的广告进行特征提取，获得各个广告的通用特征和偏置特征，然后将每个广告的通用特征输入到信息推荐模型的预设任务模型，获得通用指标值，将偏置特征输入到信息推荐模型的偏置模型，获得偏置系数，并根据通用指标值和偏置系数获得每一个广告的精准度较高的预设指标值，接着根据各个预设指标值获得每一个广告的推荐得分，最后将推荐得分最高的广告作为预备在外卖APP的广告框中显示的目标广告。

结合以上实施例，在一种实施方式中，一个信息的偏置特征包括该信息的多个不同维度的偏置特征；所述偏置模型包括多个偏置专家网络，一个偏置专家网络是以所述多个样本信息的同一维度的偏置特征以及预先对所述多个样本信息分别标注的该维度的偏置因子标签为训练样本，对第一预设网络模型进行训练得到的。

在本实施例中，针对一个信息，可以从多个维度获得偏置特征，例如该信息的展示位置、该信息的样式、该信息的展示渠道、该信息是否包含图片、该信息中图片的尺寸等多个维度。

在训练偏置专家网络时，采用的样本数据包括：多个样本信息的同一维度的偏置特征，和预先对多个样本信息分别标注的该维度的偏置因子标签。多个样本信息的同一维度的偏置特征例如可以是广告1的展示位置、广告2的展示位置、广告3的展示位置、……、广告N的展示位置。其网络结构可以采用但不限于MLP(Multi-Layer Perceptron，多层感知器)，本实施例对此不作限制。

在本实施例中，偏置因子可以理解为向量形式的偏置特征，偏置因子标签用于表示相应维度的偏置特征的含义。例如偏置特征的维度为展示位置时，对应的偏置因子标签为“展示位置”，再例如偏置特征的维度为展示渠道时，对应的偏置因子标签为“展示渠道”。偏置因子标签既可以用文字信息进行表示，也可以用其它具有预设含义的符号，例如阿拉伯数字或字母等表示，本申请对此不作具体限制。

结合以上实施例，在一种实施方式中，一个信息的偏置特征包括该信息的多个不同维度的偏置特征；所述预设任务模型包括多个子任务网络；所述偏置模型包括多个门开关网络、多个偏置专家网络和多个融合子模块，一个门开关网络以及一个融合子模块与一个子任务网络对应；

图5是本申请一实施例示出的又一种信息推荐模型的示意图。在图5中，偏置模型为标有阴影部分的模块组成的模型，预设任务模型为子任务网络1和子任务网络2组成的模型，偏置模型包括多个门开关网络(例如门开关网络1和门开关网络2)、多个偏置专家网络(例如偏置专家网络1-偏置专家网络3)和多个融合子模块，其中融合子模块包括输入层和偏置网络(例如输入层1和偏置网络1组成一个融合子模块1，输入层2和偏置网络2组成一个融合子模块2)。图5中仅示出了输入层和偏置网络。在本实施例中，信息推荐模型可以设置多个子任务，图5中仅示出了两个子任务的情形。

其中，偏置网络的训练过程为：利用偏置专家网络和门开关网络输出的交叉结果作为训练样本，对预设网络进行训练。其中，交叉结果的获得方式可以包括：乘积、相减、加权等运算方式，其维度大小可以和偏置专家网络输出的向量大小成线性关系。例如，可以连接(contact)多个偏置专家网络输出的向量以获得交叉结果，或者对多个偏置专家网络输出的向量求相似度以获得交叉结果等。其中，预设网络可以采用但不限于MLP(Multi-LayerPerceptron，多层感知器)，本实施例对此不作限制。

在本实施例中，每一个子任务网络有一个对应的偏置网络(例如子任务网络1对应偏置网络1，子任务网络2对应偏置网络2)，一个门开关网络与一个融合子模块和一个子任务网络对应(例如门开关网络1与融合子模块1和子任务网络1对应，门开关网络2与融合子模块2和子任务网络2对应)。

在本实施例中，门开关网络用于控制偏置专家网络输出的多个不同维度的权重。例如门开关网络1用于控制专家层中各个偏置专家网络针对融合子模块1输入的各个维度的偏置特征的权重。融合子模块用于将门开关网络输出的多个不同维度的权重，和多个偏置专家网络各自输出的偏置因子进行融合，以输出各个信息的偏置系数。

在本实施例中，可以根据需要调整偏置专家网络的个数和网络层数，以满足业务需求。门开关网络中的权重学习可以采用多层全连接，也可以通过attetion机制，本实施例对此不作限制。

在一种实施方式中，所述多个子任务网络表征的多个子任务为以下任意多者的组合：点击率CTR、转化率CVR、成交总额GMV、单价Price、点击且转化率CTCVR。

在本实施例中，一个子任务网络用于执行一个子任务，一个子任务即应一个指标，对应一个指标值。例如子任务网络1用于获得点击率CTR，子任务网络2用于获得转化率CVR。

在本实施例中，偏置专家网络用于将输入的偏置特征转化为向量形式表示，偏置因子可以理解为向量形式的偏置特征，一个偏置专家网络用于对同一个维度的偏置特征进行处理。

在本实施例中，门开关网络用于针对各个子任务，设置各个维度的偏置特征的权重，具体地，门开关网络用于为各个偏置专家网络设置权重值。例如当图5中偏置专家网络1-偏置专家网络3分别对应的偏置特征的维度为信息的展示位置、信息的样式、信息是否包含图片时，门开关网络1可以为子任务网络1对应的子任务1设置权重为{w1、w2、w3}，表示信息的展示位置对子任务1的影响权重为w1，信息的样式对子任务1的影响权重为w2，信息是否包含图片对子任务3的影响权重为w3。

融合子模块对门开关网络输出的多个不同维度的权重，和多个偏置专家网络各自输出的偏置因子进行融合，具体是指：将门开关网络输出的权重与各个偏置专家网络输出的向量形式的偏置特征分别相乘，得到带权重的向量形式的偏置特征。示例地，在图5中，偏置专家网络1-偏置专家网络3向输入层1输入的向量形式的偏置特征为{T1、T2、T3}，门开关网络1向输入层1输出的各个不同维度的权重为{w1、w2、w3}，那么融合子模块1融合后得到的结果为{w1*T1、w2*T2、w3*T3}，对应图5中的{t1、t2、t3}，t1、t2、t3分别为带权重的向量形式的偏置特征。同理，融合子模块2对偏置专家网络1-偏置专家网络3向输入层2输出的向量形式的偏置特征，和门开关网络2向输入层2输出的各个不同维度的权重进行融合后可以得到{t4、t5、t6}。

结合以上实施例，在一种实施方式中，所述多个门开关网络各自输出的同一维度的权重不同。

在本实施例中，门开关网络还可以针对相同维度的偏置特征设置不同的权重值。示例地，在图5中，门开关网络1向输入层1输入的权重为{w1、w2、w3}，门开关网络2向输入层2输入的权重为{w1’、w2’、w3’}，其中，偏置专家网络1-偏置专家网络3各自对应的维度为展示位置、展示样式、展示渠道，那么门开关网络w1和w1’可以不相同，w2和w2’可以不相同，w3和w3’可以不相同。

在本实施例中，当只有一个子任务时，可以不用设置门开关网络，当有多个子任务时，可以针对每一个子任务设置门开关网络，以提升其输出的指标值的精准度。当多个子任务中所有的子任务均没有设置门开关网络时，所有维度的偏置特征对所有的子任务的影响权重相同。

结合以上实施例，在一种实施方式中，所述预设任务模型包括多个子任务网络，所述多个子任务网络表征的多个子任务之间相互关联；每个子任务网络以多个样本信息各自的通用特征以及所述多个样本信息各自携带的子任务对应的标签为输入训练得到的。

在训练子任务网络时，采用的样本数据包括：多个样本信息各自的通用特征，和多个样本信息各自携带的子任务对应的标签。该子任务对应的标签与前文所述的预设任务对应的标签的含义相同，都是指用户对输入的信息的行为特征，例如子任务是点击率时，对应的标签为“点击”或“未点击”，再例如子任务是转化率时，对应的标签为“转化”或“未转化”。其网络结构可使用MLP，主要结合各个业务自身实际需要进行调整，多个子任务间的结构可以存在差异性。

在训练门开关网络时，采用的样本数据包括：多个样本信息的各个维度的偏置特征，和预先对多个样本信息分别标注的子任务对应的各个维度的权重标签。门开关网络可以是MLP结构，也可以是固定值或设计的简单规则，建议层数不用太深、向量输出维度不用太大。

在本实施例中，门开关网络可以采用系统端到端的训练，可以自动学习出在不同子任务下不同偏置专家网络的权重，也可以支持用户在学习出的权重的基础上手动加规则，例如手动设置针对某个偏置专家网络的权重。

下面将结合图5，以一个具体的实施例对本申请的信息推荐方法进行详细说明。

在图5中，假设偏置特征包括展示位置、展示样式、展示渠道，偏置专家网络1用于将展示位置转化为向量形式，得到T1，偏置专家网络2用于将展示样式转化为向量形式，得到T2，偏置专家网络3用于将展示渠道转化为向量形式，得到T3，那么偏置专家网络1-偏置专家网络3向输入层1输入的值为{T1、T2、T3}。门开关网络1为偏置专家网络1设置权重为w1，为偏置专家网络2设置权重为w2，为偏置专家网络3设置权重为w3，那么门开关网络1向输入层1输入的值为{w1、w2、w3}。输入层1将w1和T1相乘，将w2和T2相乘，将w3和T3相乘，得到{w1*T1、w2*T2、w3*T3}，对应图5中的{t1、t2、t3}。输入层1将{t1、t2、t3}输入到偏置网络1，得到一个偏置系数Z1。融合模块将偏置系数Z1与子任务网络1输出的通用指标值相乘，以利用偏置系数Z1对通用指标值进行纠正，得到预设指标值1。

同时，偏置专家网络1-偏置专家网络3向输入层2输入的值为{T1、T2、T3}，门开关网络2为偏置专家网络1设置权重为w4，为偏置专家网络2设置权重为w5，为偏置专家网络3设置权重为w6，那么门开关网络2向输入层2输入的值为{w4、w5、w6}。输入层2将w4和T1相乘，将w5和T2相乘，将w6和T3相乘，得到{w4*T1、w5*T2、w6*T3}，对应图5中的{t4、t5、t6}。输入层2将{t4、t5、t6}输入到偏置网络2，得到一个偏置系数Z2。融合模块将偏置系数Z2与子任务网络2输出的通用指标值相乘，以利用偏置系数Z2对通用指标值进行纠正，得到预设指标值2。

最后，融合模块根据预设指标值1和预设指标值2得到信息的推荐分数，进一步根据各个信息的推荐分数得到目标信息(参照前文所述)。

在本实施例中，多个子任务网络表征的多个子任务之间可以相互关联，例如通过子任务点击率CTR、转化率CVR以及单价Price可以获得成交总额GMV，其关联关系为：预设指标值(GMV)＝预设指标值(CTR)*预设指标值(CVR)*预设指标值(Price)。具体为预设指标值(GMV)＝偏置系数(CTR)*通用指标值(CTR)*偏置系数(CVR)*通用指标值(CVR)*偏置系数(Price)*通用指标值(Price)。

本申请的信息推荐方法具有如下多个有益效果：

一、在本申请中，针对展示形式多样化的信息，在主流的多任务网络中，为每个子任务网络加入了不同的偏置网络，通过偏置专家网络和门开关网络对偏置网络进行学习，能精准的学习到用户的偏好度以及信息的展示形式对用户的影响。

二、在本申请中，使用偏置网络和子任务网络同时训练，既能获取到用户对展示形式的偏好度，又能学习到用户对商品的喜好。

三、在本申请中，信息推荐模型中引入了门开关网络，能够更好地控制每个子任务中偏置网络的拟合精度。

四、在本申请中，信息推荐模型中的偏置专家网络结构和个数可以灵活配置，能更好地满足用户的业务需求，增强用户的使用体验。

基于同一发明构思，本申请一实施例提供一种信息推荐装置600。参考图6，图6是本申请一实施例提供的信息推荐装置的结构框图。如图6所示，该信息推荐装置600包括：

提取模块601，用于对多个信息分别进行特征提取，得到所述多个信息各自的通用特征和偏置特征，其中，一个信息的通用特征用于表征该信息的信息内容，一个信息的偏置特征用于表征该信息的展示形式；

输入模块602，用于将所述多个信息各自的通用特征和偏置特征输入预先训练的信息推荐模型，确定所述多个信息各自的推荐得分；

获得模块603，用于根据所述多个信息各自的推荐得分，得到预备向用户推荐的目标信息；

可选地，所述多个门开关网络各自输出的同一维度的权重不同。

可选地，所述多个子任务网络表征的多个子任务为以下任意多者的组合：点击率CTR、转化率CVR、成交总额GMV、单价Price、点击且转化率CTCVR。

基于同一发明构思，本申请另一实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请上述任一实施例所述的信息推荐方法中的步骤。

基于同一发明构思，本申请另一实施例提供一种电子设备700，如图7所示。图7是本申请一实施例示出的一种电子设备的示意图。该电子设备包括存储器702、处理器701及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请上述任一实施例所述的信息推荐方法中的步骤。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种信息推荐方法、装置、存储介质和电子设备，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：朱尹华;高海涵;谢乾龙;张锦;王兴星;王栋;
专利申请人：北京三快在线科技有限公司;

上一篇：一种木板甲醛吸附降解液及其制备方法
下一篇：行人流量的监测方法、系统、计算机设备和存储介质