掌桥专利:专业的专利平台
掌桥专利
首页

转化率预估模型的训练方法、装置及电子设备

文献发布时间:2023-06-19 11:32:36


转化率预估模型的训练方法、装置及电子设备

技术领域

本公开涉及计算机技术领域,具体涉及深度学习技术领域,尤其涉及一种转化率预估模型的训练方法、装置及电子设备。

背景技术

在互联网平台展示广告的过程中,平台需要根据广告的竞价和对广告转化率的预估来决定广告的投放价格。目前,平台通常是基于转化率预估模型来对广告等多媒体的转化率进行预测,集成学习(Ensemble Learning)和多任务学习(Multi-task Learning,MTL)在模型训练中较为常见,通过把训练集合划分为多个样本子集或特征子集,训练多个弱分类器,再通过加权或者辅助训练来实现对目标任务的增强,以提升模型输出结果的准确率。

发明内容

本公开提供了一种转化率预估模型的训练方法、装置及电子设备。

根据本公开的第一方面,提供了一种转化率预估模型的训练方法,包括:

获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;

基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;

基于所述目标向量得到所述转化率预估模型输出的转化率;

获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。

根据本公开的第二方面,提供了一种转化率预估模型的训练装置,包括:

第一获取模块,用于获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;

筛选模块,用于基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;

第二获取模块,用于基于所述目标向量得到所述转化率预估模型输出的转化率;

训练模块,用于获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。

根据本公开的第三方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中所述的方法。

根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。

根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。

本公开提供的方案,基于多头注意力机制来对特征信息进行筛选提取,剔除无关的特征信息,保留并关注与转化率相关性更高的特征信息,使得转化率预估模型能够对转化率作出更准确的预估。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开一实施例提供的一种转化率预估模型的训练方法的流程图;

图2是根据本公开一实施例适用的一种转化率预估模型的结构图;

图3是根据本公开一实施例提供的一种转化率预估模型的训练装置的结构图;

图4是用来实现本公开实施例的转化率预估模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

为更好地理解本公开的技术方案,以下先对本公开的应用场景进行解释说明。

为增加企业的营收额或是知名度,企业通常会在互联网平台投放如视频、图文等形式的多媒体广告,如产品营销广告、企业宣传广告、企业招聘广告等。互联网平台往往会根据对广告转化率的预估来决定广告的投放价格,广告转化率包括但不限于用户点击互联网平台上广告连接的概率、用户观看广告的概率、用户购买广告对应产品的概率等。为更快速地得到广告转化率,互联网平台可以是基于转化率预估模型来对广告的转化率进行预估。

本公开提供了一种转化率预估模型的训练方法。

请参照图1,图1是本公开一实施例提供的一种转化率预估模型的训练方法的流程图,所述方法可以是应用于电子设备,如笔记本计算机、台式计算机、平板电脑、手机等。需要说明的是,所述电子设备安装有所述转化率预估模型。

如图1所示,所述方法包括以下步骤:

步骤S101、获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数。

本公开实施例中,所述特征子集包括有至少一个特征信息,所述特征信息可以是指与目标多媒体相关的特征参数。其中,所述目标多媒体可以是指目标广告,例如,目标广告的特征信息包括但不限于广告关键词、广告语义信息、广告图文信息、广告组件信息、上下文排序信息、目标多媒体的查询信息、搜索目标多媒体的用户画像信息等等。

可选地,所述特征子集可以是用户自定义设置。例如,用户可以是从特征时序、广告用户特征分布和广告转换标签三个角度来构建特征子集。

针对于特征时序,基于转化率预估模型从广告粗选、广告内容组装、广告展示形式三个方面能获取不同的信号,则可以是分别构建广告粗选、广告内容组装、广告展示形式三个特征子集。其中,广告粗选特征子集可以是包括广告流量、广告用户侧特征、广告关键词、广告语义信息、广告组件信息、上下文排序信息等特征信息。对于广告用户特征分布的特征子集,可以是包括目标多媒体的查询信息、搜索目标多媒体的用户画像信息等特征信息。对于广告转换标签特征子集,可以是包括预设转换行为,如广告对应产品的付费购买、广告产品链接点击等。

本公开实施例中,所述目标多媒体的实际转化标签值,可以是用于表征目标多媒体是否发生预设转化行为。例如,在目标广告发生预设转化行为的情况下,对应的实际转化标签值为1,在目标广告未发生所述预设转化行为的情况下,对应的实际转化标签值为0。这样,通过实际转化标签值,也就能够简单、直观地定义目标多媒体是否发生预设转化行为。

需要说明的是,所述目标多媒体可以是用来对转化率预估模型进行训练的多个广告的统称,每一个用来对转化率预估模型进行训练的广告都可以称为目标多媒体。在该步骤中,可以是获取每一个目标多媒体的M个特征子集,以及该目标多媒体的实际转化标签值。可选地,电子设备在获取到目标多媒体的M个特征子集后,可以是将其转化为M个特征子集向量,并将这M个特征子集向量输入所述转化率预估模型。

步骤S102、基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量。

需要说明地,在将M个特征子集向量输入转化率预估模型后,所述转化率预估模型可以是通过一层神经网络,基于多头注意力机制来对特征子集中的特征向量进行筛选,输出得到目标向量。

注意力(Attention)机制也就是基于注意力函数,能够把一个查询(query),一个关键-价值(key-value)的集合映射成一个输出向量。多头注意力(Multi-head Attention)机制也就能够得到多个输出向量,通过将多个输出向量进行联结,进而以得到目标向量。

其中,输出向量可以认为是values的加权求和,其中分配给每个值的权重通过一个相关函数计算query与key的相关程度。本公开实施例中,基于多头注意力机制,通过注意力函数的计算,能够计算特征子集key向量与query向量之间的相关程度,基于计算得到的相关程度也就能够对特征子集中的特征信息进行筛选。基于多头注意力机制对特征子集中的特征信息进行筛选,得到目标向量的实现过程在后续实施例中会进行具体说明。

步骤S103、基于所述目标向量得到所述转化率预估模型输出的转化率。

本公开实施例中,所述转化率预估模型在基于多头注意力机制得到目标向量后,所述转化率预估模型再经过几层神经网络的计算,输出预估的转化率。其中,所述转化率的取值位于0到1之间。所述转化率预估模型基于神经网络对于目标向量的计算,可以是参照相关技术,本公开实施例对此不做赘述。

步骤S104、获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。

可以理解地,转化率预估模型基于多头注意力机制对目标多媒体特征子集中的特征信息进行筛选,得到目标向量后,再基于目标向量得到转化率,进而转化率也就与目标多媒体的特征信息相关。在得到转化率预估模型输出的转化率后,计算转换率与实际转化标签值之间的损失值,基于所述损失值来对转化率预估模型进行训练。例如,可以是在获得损失值后,通过梯度回传的方式来训练所述转化率预估模型和输入的特征向量,进而以提高转化率预估模型对于输出的转化率的准确性。

本公开实施例中,所述目标多媒体的实际转化标签值可以是用户预先设定的值,或者也可以是根据目标多媒体的实际转化行为来确定。可选地,在所述目标多媒体发生预设转化行为的情况下,所述目标多媒体的实际转化标签值为1;在所述目标多媒体未发生所述预设转化行为的情况下,所述目标多媒体的实际转化标签值为0。

例如,以所述目标多媒体是广告为例,假设该广告投放于互联网搜索平台,该广告的预设转化行为可以是包括但不限于用户点击了显示在互联网搜索平台上的该广告、用户对该广告中的产品进行了付费、用户对该广告中的产品进行了点评等。假设用户点击了显示在互联网搜索平台上的该广告,则该广告的实际转化标签值为1;若该广告没有发生上述任一预设行为,则该广告的实际转化标签值为0。

本公开实施例中,转化率预估模型输出的转化率的取值位于0到1之间,而目标多媒体的实际转化标签值的取值为0或1,进而也就能够计算转化率与实际转化标签值之间的损失值,基于该损失值来对转化率预估模型进行训练。例如,可以是在获得损失值后,通过梯度回传的方式来训练所述转化率预估模型,模型的训练方法及原理可以是参照相关技术中基于损失值对神经网络模型训练的方法及原理,本公开对此不做赘述。

需要说明地,所述M可以为大于1的正整数。这样,也就使得输入转化率预估模型的特征子集更加多样化,能够更好地评估不同特征子集中特征信息对于目标多媒体的转化率的影响。

本公开实施例中,基于多头注意力机制来对特征信息进行筛选提取,剔除无关的特征信息,保留并关注与转化率相关性更高的特征信息,转化率预估模型基于多头注意力机制而输出的转换率,并基于转化率与实际转化标签值之间的损失值来进行学习和训练,提升了转化率预估模型的学习能力,使得转化率预估模型能够学到更加丰富的特征信息,从而对转化率作出更准确的预估。

可选地,所述步骤S102还可以包括如下步骤:

基于多头注意力机制对每一个所述特征子集的特征信息进行筛选,得到输出向量,其中,所述输出向量为基于所述多头注意力机制获取每一个所述特征子集的相似度得分,并基于所述相似度得分进行加权计算得到;

获取多次基于所述多头注意力机制得到的多个输出向量,并将所述多个输出向量进行联结以得到目标向量。

本公开实施例中,在将目标多媒体的M个特征子集输入转化率预估模型后,转化率预估模型可以是基于多头注意力机制获取每一个特征子集的相似度得分,用户归一化的相似度得分来进行加权计算,得到一个注意力attention的输出向量。转化率预估模型可以是进行多次上述输出向量的计算过程,每一次计算过程也就能够得到一个输出向量,这样也就能够得到多个输出向量,进而将多个输出向量进行联结以得到目标向量。例如,假设多次attention计算后得到3个输出向量,每个输出向量都为8维的向量,则这3个输出向量联结后得到的目标向量为512维。这样,也就能够得到更为丰富的目标向量,转化率预估模型也就能够得到更为丰富的特征信息,而相比于只进行一次attention计算,多次attention计算也使得转化率预估模型的决策空间更大、决策能力更强。

可选地,所述基于多头注意力机制对每一个所述特征子集的特征信息进行筛选,得到输出向量,还可以包括以下步骤:

基于多头注意力机制获取每一个所述特征子集的相似度得分;

将所述相似度得分大于或等于预设分值的特征子集中的特征信息进行保留,并将所述相似度得分小于所述预设分值的特征子集中的特征信息进行剔除,以得到输出向量。

本公开实施例中,转化率预估模型在获得输入的M个特征子集后,可以是基于多头注意力机制来获取每一个特征子集的相似度得分,将相似度得分大于或等于预设分值的特征子集中的特征信息进行保留,而对相似度得分小于所述预设分值的特征子集中的特征信息进行剔除。这样,通过基于多头注意力机制的计算,相似度得分高的特征子集的特征信息就会更多地被保留下来,而相似度低的特征子集中的特征信息则会被丢弃,进而也就能够从特征信息中提取与目标多媒体转化率预估更相关的特征信息,以此来提高转化率预估的准确性。

可选地,所述基于多头注意力机制对每一个所述特征子集的特征信息进行筛选,得到输出向量,还可以包括:

获取包含所有特征信息的目标特征子集对应的查询向量,以及获取每一个所述特征子集对应的关键向量和价值向量;

获取每一个所述特征子集对应的关键向量与所述查询向量之间的相似度得分;

根据所述相似度得分对每一个所述特征子集的价值向量进行加权计算,以获取基于多头注意力机制得到的输出向量。

本公开实施例中,转化率预估模型在获得输入的M个特征子集后,可以是通过一层神经网络得到每个特征子集的关键k向量和价值v向量,而这些特征子集都只是包含了目标多媒体的一部分特征信息;除了这些特征子集外,还可以构建一个包含所有特征信息的目标特征子集,并获取该目标特征子集的查询q向量。

进一步地,对每个特征子集的k向量与所述q向量之间的相似度进行相似度打分,以得到每一个特征子集的相似度得分,基于归一化原理根据所述相似度得分对每一个特征子集的v向量进行加权相加,得到一个基于多头注意力机制attention的输出向量。这样,通过attention的计算,相似度高的特征子集的特征信息能够更多地被保留,而相似度低的特征子集的特征信息则会被丢弃,进而也就能够从特征信息中提取与目标多媒体转化率预估更相关的特征信息,以此来提高转化率预估的准确性。

需要说明地,转化率预估模型可以是重复进行多次上述输出向量的计算过程,也就是多次进行获取q向量及每个特征子集的k向量、v向量,计算每一个特征子集的k向量与q向量之间的相似度得分,基于相似度得分对每一个特征子集的v向量进行加权计算,以获得一个输出向量。这样,每一次计算过程也就能够得到一个输出向量,这样也就能够得到多个输出向量,进而将多个输出向量进行联结以得到目标向量。这样,也就能够得到更为丰富的目标向量,转化率预估模型也就能够得到更为丰富的特征信息,而相比于只进行一次attention计算,多次attention计算也使得转化率预估模型的决策空间更大、决策能力更强。

请参照图2,图2是本公开实施例应用的一种转化率预估模型的结构图。以下将结合图2对本公开实施例提供的转化率预估模型的训练方法进行举例说明。其中,B

本公开实施例还提供了一种转化率预估模型的训练装置。

请参照图3,图3是本公开一实施例提供的一种转化率预估模型的训练装置的结构图。如图3所示,转化率预估模型的训练装置300包括:

第一获取模块301,用于获取目标多媒体的M个特征子集及所述目标多媒体的实际转化标签值,其中,每一个所述特征子集包括至少一个特征信息,M为正整数;

筛选模块302,用于基于多头注意力机制对所述特征子集中的特征信息进行筛选,得到目标向量;

第二获取模块303,用于基于所述目标向量得到所述转化率预估模型输出的转化率;

训练模块304,用于获取所述转化率与所述实际转化标签值之间的损失值,基于所述损失值对所述转化率预估模型进行训练。

可选地,所述筛选模块302包括:

筛选单元,用于基于多头注意力机制对每一个所述特征子集的特征信息进行筛选,得到输出向量,其中,所述输出向量为基于所述多头注意力机制获取每一个所述特征子集的相似度得分,并基于所述相似度得分进行加权计算得到;

联结单元,用于获取多次基于所述多头注意力机制得到的多个输出向量,并将所述多个输出向量进行联结以得到目标向量。

可选地,所述筛选单元还用于:

基于多头注意力机制获取每一个所述特征子集的相似度得分;

将所述相似度得分大于或等于预设分值的特征子集中的特征信息进行保留,并将所述相似度得分小于所述预设分值的特征子集中的特征信息进行剔除,以得到输出向量。

可选地,所述筛选单元还用于:

获取包含所有特征信息的目标特征子集对应的查询向量,以及获取每一个所述特征子集对应的关键向量和价值向量;

获取每一个所述特征子集对应的关键向量与所述查询向量之间的相似度得分;

根据所述相似度得分对每一个所述特征子集的价值向量进行加权计算,以获取基于多头注意力机制得到的输出向量。

可选地,在所述目标多媒体发生预设转化行为的情况下,所述目标多媒体的实际转化标签值为1;

在所述目标多媒体未发生所述预设转化行为的情况下,所述目标多媒体的实际转化标签值为0。

需要说明地,本实施例提供的转化率预估模型的训练装置300能够实现上述转化率预估模型的训练方法实施例的全部技术方案,因此至少能够实现上述全部技术效果,此处不再赘述。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图4所示,设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如转化率预估模型的训练方法。例如,在一些实施例中,转化率预估模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时,可以执行上文描述的转化率预估模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行转化率预估模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 转化率预估模型的训练方法、装置及电子设备
  • 满意度预估模型的训练方法、装置、电子设备及存储介质
技术分类

06120112964530