掌桥专利:专业的专利平台
掌桥专利
首页

媒体资源推荐方法、装置、设备及存储介质

文献发布时间:2024-04-18 19:58:30


媒体资源推荐方法、装置、设备及存储介质

技术领域

本申请实施例涉及计算机技术领域,具体涉及一种媒体资源推荐方法、装置、设备及存储介质。

背景技术

随着神经网络技术的快速发展,以及数据处理需求的增长,各种数据处理模型,例如推荐模型随之产生。

以推荐模型为例,在目前的推荐系统中,往往包括成千上万的原始特征,例如覆盖了对象、资源、场景等信息。这些成千上万的原始特征中存在区分度较差的特征,若将所有的原始特征用于资源推荐时,不仅给模型带来一些噪声,并且浪费计算资源。因此,需要对原始特征进行筛选。

目前通过对原始特征中的每一个特征进行打分,进而基于每一个特征的分值,筛选特征。但是,该方法选出的特征相关性较高,即选出的特征可能比较相似,基于相似的特征进行广告等资源推送时,使得资源的推送准确率降低。

发明内容

本申请提供一种媒体资源推荐方法、装置、设备及存储介质,可以提升媒体资源的推荐速度和准确性。

第一方面,本申请提供一种媒体资源推荐方法,包括:

获取目标对象对应的候选媒体资源推荐数据,并提取所述候选媒体资源推荐数据的M个特征域的特征值,所述候选媒体资源推荐数据包括所述目标对象的对象数据以及待推荐的候选媒体资源数据,所述M为大于1的正整数;

获取特征选择模型输出的特征选取参考值,并基于所述特征选取参考值,确定所述M个特征域中被选中的R个特征域,其中所述特征选择模型是基于超网训练得到的,所述超网包括多个子网络,所述多个子网络中的每一个子网络对应一个候选特征子集,所述候选特征子集由历史媒体资源推荐数据所包括的所述M个特征域中的至少一个特征域组成,所述R为小于M的正整数;

从所述候选媒体资源推荐数据的M个特征域的特征值中,选出所述R个特征域的特征值;

基于所述R个特征域的特征值从所述候选媒体资源数据中筛选目标媒体资源数据,向所述目标对象推荐所述目标媒体资源数据。

第二方面,本申请提供一种模型训练装置,包括:

数据获取单元,用于获取目标对象对应的候选媒体资源推荐数据,并提取所述候选媒体资源推荐数据的M个特征域的特征值,所述候选媒体资源推荐数据包括所述目标对象的对象数据以及待推荐的候选媒体资源数据,所述M为大于1的正整数;

特征域选择单元,用于获取特征选择模型输出的特征选取参考值,并基于所述特征选取参考值,确定所述M个特征域中被选中的R个特征域,其中所述特征选择模型是基于超网训练得到的,所述超网包括多个子网络,所述多个子网络中的每一个子网络对应一个候选特征子集,所述候选特征子集由历史媒体资源推荐数据所包括的所述M个特征域中的至少一个特征域组成,所述R为小于M的正整数;

特征值选择单元,用于从所述候选媒体资源推荐数据的M个特征域的特征值中,选出所述R个特征域的特征值;

媒体推荐单元,用于基于所述R个特征域的特征值从所述候选媒体资源数据中筛选目标媒体资源数据,向所述目标对象推荐所述目标媒体资源数据。

第三方面,本申请提供了一种计算设备,包括处理器和存储器。所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行上述第一方面任一方面的方法。

第四方面,提供了一种芯片,用于实现上述第一方面至第四方面中任一方面或其各实现方式中的方法。具体地,所述芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如上述第一方面的方法。

第五方面,提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行上述第一方面的方法。

第六方面,提供了一种计算机程序产品,包括计算机程序指令,所述计算机程序指令使得计算机执行上述第一方面的方法。

第七方面,提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面的方法。

综上,本申请通过获取目标对象对应的候选媒体资源推荐数据,并提取候选媒体资源推荐数据的M个特征域的特征值,该候选媒体资源推荐数据包括目标对象的对象数据以及待推荐的候选媒体资源数据,M为大于1的正整数;获取特征选择模型输出的特征选取参考值,并基于特征选取参考值,确定M个特征域中被选中的R个特征域;从候选媒体资源推荐数据的M个特征域的特征值中,选出R个特征域的特征值,并基于R个特征域的特征值,从候选媒体资源数据中筛选目标媒体资源数据,向目标对象推荐目标媒体资源数据。在本申请实施例中,特征选择模型是基于超网训练得到的,超网中的每一个子网络对应M个特征域的一个候选特征子集,使得特征选择模型直接对特征子集进行评估而不是对特征进行打分排序,能够有效的解决特征共线性带来的效果影响,提升了特征选择的准确性,基于准确选择的特征进行媒体资源推荐时,可以提高媒体资源的推荐准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例涉及的广告推荐示意图;

图2为广告推荐场景中数据处理流程示意图;

图3为本申请实施例涉及的一种应用场景示意图;

图4为本申请一实施例提供的模型训练方法的流程示意图;

图5为本申请实施例的特征选择框架示意图;

图6为本申请实施例涉及的超网示意图;

图7为本申请实施例涉及的超网的模型示意图;

图8为本申请实施例涉及的超网的训练框架示意图;

图9为超网的一种训练过程示意图;

图10为特征选择模型的一种网络结构示意图;

图11为本申请实施例涉及的特征选择模型的一种训练框架示意图;

图12为特征选择模型的一种训练过程示意图;

图13为本申请一实施例提供的一种媒体资源推荐方法流程示意图;

图14为本申请实施例涉及的广告推荐流程示意图;

图15是本申请一实施例提供的媒体资源推荐装置的示意性框图;

图16是本申请实施例提供的计算设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

应理解,在本发明实施例中,“与A对应的B”表示B与A相关联。在一种实现方式中,可以根据A确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。

在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。

另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

本申请实施例提供的联邦学习及数据处理方法,可以应用于人工智能、媒体资源推荐等各种场景。

人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

需要说明的是,本申请实施例除了应用于人工智能、媒体资源推荐等各种场景外,还可以应用于其他场景领域,本申请实施例对此不作限制。

下面对本申请实施例涉及的相关概念进行介绍。

推荐模型:广告推荐系统中,给对象推荐感兴趣的内容所使用的数学模型。

特征ID(feature id):为了更方便的处理特征,一般会把原始特征离散化,并用唯一的ID来标识它,也成为特征值。

特征域(feature field):表示一类特征ID,比如“性别”,“年龄”,一个特征域包含多个特征ID。

Embedding:推荐模型一般会把高维度的特征ID,映射到低纬度向量上,这个向量被称为Embedding向量,也称为特征向量。

Embedding Size:Embedding向量的维度。

AutoML:是一种用来自动化构建机器学习流程的方法,用来解决机器学习与深度学习中过度依赖专家经验的问题。

MLP(Multilayer Perceptron)层:用来进行低阶特征结合与高阶特征抽象,一般由多个全连接层以及相应的激活函数组成。

NAS(Neural architecture search):网络结构搜索,是AutoML领域的研究方向,目标是搜索效果和鲁棒性最好的网络结构。

Transformer:一种基于注意力机制的网络结构,主要用来处理序列信息,在自然语言处理和图像学习中都有广泛的应用。

本申请实施例提供的媒体资源推荐方法可以应用到广告推荐产品中,比如微信朋友圈广告推荐、新闻广告推荐等,也可以应用到信息流推荐产品中,包括视频推荐、图文推荐、商品推荐等。

目前的大规模推荐系统中往往包含上千个原始特征,例如涵盖了对象、物品、场景等信息。特征质量决定了推荐模型的上限,因此,特征评估对于推荐系统的效果至关重要。然而,这些原始特征中可能存在很多区分度较差的特征,不仅容易给模型带来一些噪声影响,而且浪费计算量。因此,需要对特征进行评估并从中选出效果最优的一组特征集合。

以推荐场景为例,如图1所示,向目标对象推送的媒体资源(例如广告),是从千万级别的候选媒体资源库(例如,广告库)里筛选出来的,选择的过程一般包括两个阶段,第一阶段称为召回,通过召回算法从千万级别的广告库中选出上千个候选集;第二阶段称为排序,通过排序模型给召回后的上千个候选广告进行精准排序,最后选出最优的1条或多条广告(可以理解为一个或多个媒体资源),并推送给目标对象。例如,如图1所示的,通过上述广告推荐模型,将满足推送条件的广告1推送至目标对象所在的应用1中,并在应用1的页面中显示广告1的缩略信息(例如,链接,标题,图片),然后通过目标对象对“了解更多”或“跳过”按钮进行点击,确定是否查看为该目标对象推送的广告1。在如图1所示的召回阶段和/或排序阶段,召回阶段上使用的召回模型或者排序阶段排序或召回模型应用流程如图2,依次是:原始数据获取、特征抽取、特征选择、特征嵌入、模型计算、广告排序与选择。其中,原始数据主要包括对象数据(例如用户数据)、候选广告数据和场景数据,特征抽取对象提取对象特征、广告特征和场景特征等。但是,上述特征较多,且存在分度较差的特征,因此进行特征选择,选择一部分特征进行特征嵌入后输入模型进行计算,并基于模型的计算结果对候选广告进行打分,基于打分对候选广告进行排序,并从排序后的广告中选择一分部广告作为召回广告,或者作为待显示的广告。也就是说,在广告的召回或排序阶段,均需要特征选择。

目前常用的特征选择方案,主要分为三类。第一类是过滤法,例如使用卡方检验、互信息、皮尔逊相关系数等统计方法直接评估每个特征与目标的关系。第二类方法是嵌入法,将特征评估过程嵌入到模型训练中,常见方法有LASSO,GBDT,AutoField,这类方法经过一层训练得到特征的贡献度。第三类方法是包裹法,因为在特征选择的过程中会包裹模型训练而得名。最朴素的方式是穷举所有特征子集,每个子集进行一次训练和评估,从中选出效果最优的子集。假设有N个特征域,那搜索空间大小是2

但是,过滤法和嵌入法都会给特征打分排序,选出分数最高的特征。然而,最分最高的几个特征组合起来,并不一定是效果最优的特征集合,因为特征之间可能存在共线性关系,这意味着相关性很高的特征可能因为得分都高而都被选中,从而造成资源浪费和次优结果。而包裹法虽然理论上效果最优,但是由于要反复进行训练和评估,耗时极高,在实际深度学习场景中几乎无法使用。也就是说,目前的特征选择方法不仅耗时、浪费计算资源,且特征选择不准确,进而使得媒体资源的推荐效果差。

为了解决上述技术问题,本申请实施例通过获取目标对象对应的候选媒体资源推荐数据,并提取候选媒体资源推荐数据的M个特征域的特征值,该候选媒体资源推荐数据包括目标对象的对象数据以及待推荐的候选媒体资源数据,M为大于1的正整数;获取特征选择模型输出的特征选取参考值,并基于特征选取参考值,确定M个特征域中被选中的R个特征域;从候选媒体资源推荐数据的M个特征域的特征值中,选出R个特征域的特征值,并基于R个特征域的特征值,从候选媒体资源数据中筛选目标媒体资源数据,向目标对象推荐目标媒体资源数据。也就是说,在本申请实施例中,特征选择模型是基于超网训练得到的,超网中的每一个子网络对应M个特征域的一个候选特征子集,进而将最优特征子集的选择转换为网络结构搜索问题。由上述可知,本申请实施例直接对特征子集进行评估而不是对特征进行打分排序,能够有效的解决特征共线性带来的效果影响,提升了特征选择的准确性,基于准确选择的特征进行媒体资源推荐时,可以提高媒体资源的推荐准确性。

下面对本申请实施例的应用场景进行介绍。

图3为本申请实施例涉及的一种应用场景示意图,包括终端设备101和计算设备102。

如图3所示,本申请实施例的计算设备102中包括超网和特征选择模型。其中,计算设备102先训练超网,接着基于训练后的超网辅助训练特征选择模型,最后得到训练结束时特征选择模型输出的M个特征域的特征选取参考值,以确定M个特征域中被选中的特征域,实现对特征的准确选择。具体是,计算设备102获取待训练的超网,该超网中包括多个子网,其中多个子网中的每一个子网络对一个候选特征子集,每一个特征子集由M个特征域中的至少一个特征域组成。也就是说,在本申请实施例中,待训练的超网是基于候选特征子集构建的,例如有多少个候选特征子集则在超网中构建多少个子网络。接着,计算设备102获取训练样本和验证样本,训练样本用于训练超网,验证样本用于训练特征选择模型。接着,计算设备102通过特征选择模型对验证样本进行处理,得到M个特征域的特征选取参考值,其中特征选取参考值用于指示特征域是否被选中,然后,通过训练后的超网,对验证样本和该验证样本的M个特征域的特征选取参考值进行处理,得到奖励值,并基于该奖励值对特征选择模型的模型参数进行更新,得到训练结束时特征选择模型输出的M个特征域的特征选取参考值,这样可以基于训练结束时特征选择模型输出的M个特征域的特征选取参考值,确定出M个特征域中被选中的特征域。在后续的推荐系统等中,可以基于M个特征域中被选中的特征域实现媒体资源(例如广告)等的推荐,由于本申请实施例直接对特征子集进行评估而不是对特征进行打分排序,能够有效的解决特征共线性带来的效果影响,提升了特征选择的准确性,这样基于准确选择的特征域进行媒体资源等的推荐时,可以提高推荐的准确性。

在一些实施例中,如图3所示,该应用场景还包括数据库103,该数据库103中包括历史媒体资源推荐数据。在本申请实施例中,终端设备101与数据库103通信连接,可以向数据库103中写入数据,计算设备102与数据库102也通信连接,可以从数据库103中读取数据。在一种示例中,在本申请实施例的模型训练过程中,计算设备102在模型时,从数据库103中获取历史媒体资源推荐数据,并将历史媒体资源推荐数据划分为训练样本集和验证样本集。接着,计算设备102使用训练样本对超网进行训练,由于本申请实施例中,超网中的每一个子网络对应一个候选特征子集,且各子网络共享模型参数,因此,对超网的训练也可以理解为对每一个候选特征子集的训练,进而对超网进行训练选出最优的子网络的过程可以理解为从多个候选特征子集中选出最优候选特征子集的过程。接着,计算设备102基于训练后的超网以及验证样本,对特征选择模型进行训练,得到训练结束时该特征选择模型输出的所述M个特征域的特征选取参考值。

在一些实施例中,计算设备102将训练后的特征选择模型输出的M个特征域的特征选取参考值保存在计算设备102中。这样在实际应用过程中,例如实际媒体资源的推荐中,终端设备101获取待处理的目标数据,并将目标数据发送给计算设备102,以使计算设备102对目标数据进行处理。例如,计算设备102使用自身保存的特征选择模型输出的M个特征域的特征选取参考值,从目标数据的M个特征域中选择部分特征域进行数据处理,降低了参与数据处理的特征个数,提升数据处理效率,且上述选择的特征相关性较弱,即不相同,这样基于相关性较弱的特征进行数据处理时,可以提高数据处理的准确性。例如目标数据为目标对象的原始数据,该原始数据中包括待推荐的媒体资源,计算设备102可以从原始数据的M个特征域中选出R个特征域,并基于原始数据的R个特征域的特征值,确定媒体资源的推荐概率,进而基于媒体资源的推荐概率向终端设备101推荐媒体资源,实现媒体资源的准确推荐。

本申请实施例对终端设备101的具体类型不做限制。在一些实施例中,终端设备101可包括但不限于:手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器、可穿戴智能设备、医疗设备等等。设备往往配置有显示装置,显示装置也可为显示器、显示屏、触摸屏等等,触摸屏也可为触控屏、触控面板等等。

在一些实施例中,计算设备102为具有数据处理功能的终端设备,例如手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器、可穿戴智能设备、医疗设备等等。

在一些实施例中,若本申请实施例应用于推荐系统,则本申请实施例的终端设备101上安装有客户端,该客户端可以实现对媒体资源,例如广告的推荐。对应的,计算设备102可以理解为该客户端对应的后台服务器。

在一些实施例中,计算设备102包括服务器。服务器可以是一台或多台。服务器是多台时,存在至少两台服务器用于提供不同的服务,和/或,存在至少两台服务器用于提供相同的服务,比如以负载均衡方式提供同一种服务,本申请实施例对此不加以限定。其中,上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102也可以成为区块链的节点。

本申请实施例中,终端设备101和计算设备102之间可以通过有线通信或者无线通信方式进行直接或间接地连接,本申请在此不做限制。

需要说明的是,本申请实施例的应用场景包括但不限于图1所示。

下面通过一些实施例对本申请实施例的技术方案进行详细说明。下面这几个实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

需要说明的是,在本申请实施例中,在媒体推荐之前,首先完成特征选择模型的训练。本申请实施例的模型训练过程也可以理解为特征域(或特征)选择过程,即将特征选择模型训练结束时所选中的特征域,作为最终选中的特征域。这样在后期的实际应用过程中,直接基于该最终选中的特征域进行相关数据处理,例如进行媒体资源推荐。

首先对本申请实施例的模型训练过程进行介绍。

图4为本申请一实施例提供的模型训练方法的流程示意图。本申请实施例的执行主体为具有训练模型功能的装置,例如为模型训练装置,该模型训练装置可以为媒体资源推荐装置。在一些实施例中,该模型训练装置可以为图3中的计算设备,或者为图3中的终端设备,或者为图3中计算设备和终端设备组成的系统。为了便于描述,本申请实施例以执行主体为计算设备为例进行说明。

如图4所示,本申请实施例的模型包括:

S401、获取历史媒体资源推荐数据,并将历史媒体资源推荐数据划分为训练样本集和验证样本集。

其中,历史媒体资源推荐数据包括历史对象的对象数据,以及向历史对象所推荐的媒体资源数据。

其中,训练样本集和所验证样本集中的样本均包括M个特征域,M为大于1的正整数。

由上述可知,在本申请实施例中,特征域表示为一类特征ID,比如“性别”,“年龄”,在一些实施例中,特征域也称为特征。本申请实施例中,从M个特征域中选出一个或多个特征域,也可以理解为从M个特征中选出一个或多个特征。

本申请的模型训练过程可以理解为特征选择过程,即选出最优候选特征子集的过程。也就是说,本申请实施例中,M个特征域组成多个候选特征子集,每一个候选特征子集对应超网中的一个子网络,通过训练样本对超网进行训练,并在已经训练好的超网中快速找到效果最优的特征子集合。即本申请实施例直接对特征子集进行评估而不是对特征进行打分排序,能够有效的解决特征共线性带来的效果影响,提升了特征选择的准确性,进一步的,本申请实施例使用超网来加速特征子集的训练和评估过程,极大降低了计算耗时。

本申请实施例的历史媒体资源推荐数据包括多个样本,在一种示例中,每一个样本可以记为{(x

在一种示例中,在媒体资源推荐场景中,历史媒体资源推荐数据中的样本i一般是从资源库(例如广告库)中经过一定的策略采样出来的媒体资源跟对象数据组成,若该样本i中对象对该样本i中媒体资源进行一次点击,在将该样本i记为正样本。若该样本i中对象对该样本i中的媒体资源未进行点击,该样本i中的媒体资源得到一次曝光,将该样本i记为负样本。当样本i为正样本时,则y

本申请实施例对计算设备获取历史媒体资源推荐数据的具体方式不做限制。

在一种示例中,计算设备从数据库中获取历史媒体资源推荐数据。假设本申请实施例用于广告推荐场景中,则上述历史媒体资源推荐数据包括对象数据和广告数据,因此,计算设备可以从对象数据库中获取对象数据,从广告数据库中,获得广告数据。

在另一种示例中,计算设备从本地的存储设备中获取历史媒体资源推荐数据。示例性的,假设计算设备为推荐系统的后台服务器,则该服务器上存储有向不同对象所推荐的历史广告数据、各对象对推荐的广告的具体操作(例如点击或未点击)、以及不同对象的对象数据,计算设备可以基于本地存储的对象数据和广告数据,得到历史媒体资源推荐数据。

在本申请实施例中,计算设备得到历史媒体资源推荐数据中,按照预设的比例,随机将历史媒体资源推荐数据所包括的N个样本划分为训练样本集和验证样本集。其中,训练样本集中包括多个训练样本,验证样本集中包括多个验证样本。

可选的,训练样本集和验证样本集不相交,即训练样本集中的训练样本与验证样本集中的各验证样本均不相同。

可选的,训练样本集和验证样本集具有交集,即训练样本集中的部分训练样本与验证样本集中的部分验证样本相同。

在本申请实施例中,训练样本和验证样本均包括M个特征域,记为{F

举例说明,假设样本包括对象数据和广告数据对应的特征值,其中对象数据包括对象画像和对象历史行为,比如年龄、性别、对象点击过的广告等。广告数据是指候选广告的基本信息,主要包括广告ID、广告主信息、创意信息等。对象数据对应的特征域可以包括年龄、性别等,广告数据对应的特征域包括广告ID、广告主信息、创意信息等。

在一些实施例中,样本还包括当前场景信息,例如,对象请求时间、广告展示位置等,其中对象请求时间可以理解为对象点击该广告的时间,或者该广告曝光给对象的时间,广告展示位置可以理解为该广告在终端设备的显示界面上的显示位置。

示例性,在广告推荐场景中,M个特征域如表1所示:

表1

需要说明的是,上述表1只是一种示例,本申请实施例涉及的M个特征域具体根据实际需要确定,本申请实施例对此不做限制。

计算设备获得训练样本集和验证样本集后,执行如下S402的步骤,对模型进行训练。

S402、通过训练样本集对超网进行训练,得到训练后的超网。

其中,超网包括多个子网络,多个子网络中的每一个子网络对应一个候选特征子集,特征子集由M个特征域中的至少一个特征域组成。

图5为本申请实施例的特征选择框架示意图,如图5所示,本申请实施例基于候选特征,例如M个特征域组成2

具体的,本申请实施例将寻找最优候选特征子集,当成是一个网络结构搜索问题,即将每个候选特征子集都是一个候选子网络结构。具体的,如图6所示,本申请实施例中,将M个特征域中的每一个特征域作为超网中的一个节点,每一个候选特征子集对应超网中的一个子网络,组成如图6所示的超网(Super net)。所有子网共享超网参数,每个子网都可以从超网中继承相应的参数,用来加速训练。

本申请实施例对通过训练样本集对超网进行训练,得到训练后的超网的具体方式不做限制。

在一些实施例中,对超网中的所有子网络进行训练,即对2

在一些实施例中,由于超网中包括的子网络较多,对所有子网络均进行训练时,需要花费的时间较多。为了提高超网的训练速度,则本申请实施例在超网训练的每轮迭代中,一般会采样若干个特征域用于超网训练。此时,上述S402包括如下S402-A至S402-D的步骤:

S402-A、对于训练样本集中的每一个训练样本,确定训练样本的M个特征域的第一特征值,并通过超网中的特征嵌入层,将M个特征域的第一特征值转换为M个特征域的第一特征向量。

在该实现方式中,为了提升超网的训练速度,在每一次训练过程中,从M个特征域中采样P个特征域进行超网训练,以降低需要训练的子网络的个数,提升超网的训练速度。具体的,计算设备首先确定训练样本的M个特征域的特征值,为了便于描述,将该特征值记为第一特征值。其中训练样本的M个特征域的第一特征值,也可以称为训练样本在M个特征域中每一个特征域下的特征值,例如,训练样本中所包括的广告数据中的具体的广告ID为广告1,因此,将广告1确定为训练样本在广告ID特征域下的第一特征值。计算设备确定出训练样本在M个特征域下的第一特征值后,将该M个特征域下的第一特征值输入超网的特征嵌入层中,经过查表可以确定出M个特征域下的第一特征值中每一个第一特征值对应的特征向量,将该特征向量记为第一特征向量,进而可以得到训练样本在M个特征域下的第一特征向量。

S402-B、确定训练样本的M个特征域中每一个特征域的采样概率。

需要说明的是,本申请实施例对S402-A和S402-B的具体执行顺序不做限制,例如,S402-B可以在S402-A之前执行,或者在S402-A之后执行,或者与S402-A同步执行,具体根据实际需要确定。

由于不同特征的分布差异很大,比如对象ID这个特征域中的特征值的取值可能上亿,即不同的对象具有不同的对象ID,每个特征值出现频次很低。而性别这个特征域中的特征取值只有3个,即男、女和未知,每个特征值出现频次都很高。这种差异会导致不同特征域收敛速度不同。在超网训练中会成为训练瓶颈。因此,本申请实施例提出了一个收敛公平的采样方案,在训练超网的每一轮,都公平的采样出若干个特征域进行训练。具体的,让取值较多、特征值训练频次低的特征域有更大的概率被采样,让取值较少、特征值训练频次高的特征域采样概率更低。

本申请实施例中,确定训练样本的M个特征域中每一个特征域的采样概率的具体实现方式包括但不限于如下几种:

方式1,本申请实施例基于预设样本集中不同特征域下的特征值的取值范围和出现频次,为不同特征域设置不同的采样概率。

在一种示例中,计算设备确定特征域中特征值的取值范围和出现频次与采样概率的对应关系表,如表2所示:

表2

其中,[a1,a2)、[a1,a3)等表示特征值的取值范围,其中a1、a2、a3、a4……依次增大,即[a1,a3)的取值范围大小[a1,a2)。[b1,b2)、[b2,b3)等表示特征值在预设样本集中的出现频次,b1、b2、b3、b4……依次增大,即[b2,b3)的出现频次大于[b1,b2)。C11至C33等表示采样概率。

需要说明的是,上述采样概率C可以是计算得到的值,也可以是经验值,本申请实施例对此不做限制,只是满足在预设样本集中特征值的取值较多、且出现频次低的特征域的采样概率,大于特征值的取值较少、且出现频次高的特征域的采样概率即可。例如,上述的对象ID特征域的采样概率大于性别特征域的采集概率。

在该方式1中,计算设备可以通过查表1,确定出训练样本的M个特征域中每一个特征域的采样概率。以M个特征域中的第i个特征域为例,首先确定第i个特征域中的特征值在预设样本集中的取值范围,假设取值范围为[a1,a3),并确定该第i个特征域中的特征值在预设样本集中的出现频次,假设出现频次为b2。这样,计算设备可以基于第i个特征域中的特征值在预设样本集中的取值范围[a1,a3),以及第i个特征域中的特征值在预设样本集中的出现频次b2,查询上述表1,得到第i个特征域对应的采样概率为C22。

需要说明的是,在一些实施例中,上述预设样本集可以为全部训练样本集,此时,对于每一个训练样本中的第i个特征域的采样概率均一致。因此,在超网训练时,通过一次查表,可以确定出第i个特征域的采样概率,该第i个特征域的采样概率在超网的训练过程中,每一个训练样本均适用。

在一些实施例中,在超网的训练过程中,在每一次迭代训练过程中,从全部训练样本集中采样一批(batch)训练样本作为当前批训练样本集(也称为mini-batch训练样本集)用于超网的当前轮训练。此时,对于当前批训练样本集中的每一个训练样本中的第i个特征域的采样概率均一致。因此,在超网的每一轮训练中,通过一次查表,可以确定出当前批训练样本集中的第i个特征域的采样概率。

计算设备除了使用上述方式1查表得到训练样本的M个特征域中每一个特征域的采样概率外,还可以通过如下方式2,准确计算出M个特征域中每一个特征域的采样概率。

方式2,计算设备通过如下步骤S402-B1,计算得到训练样本的M个特征域中每一个特征域的采样概率,即上述S402-B包括如下S402-B1:

S402-B1、针对M个特征域中的第i个特征域,基于预设样本集中第i个特征域所包括的各特征值,在预设样本集中的出现频次,确定第i个特征域的采样概率。

其中,i为小于或等于M的正整数,预设样本集为全部训练样本集,或者为当前轮训练时从全部训练样本集中获得的当前批训练样本集。

在本申请实施例中,确定训练样本中M个特征域中每一个特征域的采样概率的方式均一致,为了便于描述,以M个特征域中的第i个特征域为例。

在该方式2中,计算设备在确定第i个特征域的采样概率之前,首先需要确定预设样本集中第i个特征域所包括的各特征值,在该预设样本集中的出现频次。例如第i个特征域为对象ID特征域,经统计在预设样本集中,所有对象ID的出现次数为1000次,其中特征值张三的出现了2次,李四出现了10次,因此,可以确定出特征值张三的出现频次为2/1000,特征值李四的出现频次为10/1000。接着,计算设备基于预设样本集中第i个特征域所包括的各特征值,在预设样本集中的出现频次,确定第i个特征域的采样概率。

本申请实施例对基于预设样本集中第i个特征域所包括的各特征值,在预设样本集中的出现频次,确定第i个特征域的采样概率的具体方式不做限制,只要满足在预设样本集中特征值的取值较多、且出现频次低的特征域的采样概率,大于特征值的取值较少、且出现频次高的特征域的采样概率即可。

在一种可能的实现方式中,S402-B1包括如下S402-B11和S402-B12的步骤:

S402-B11、基于预设样本集中第i个特征域所包括的各特征值,在预设样本集中的出现频次,确定第i个特征域的信息熵;

S402-B12、基于第i个特征域的信息熵,确定第i个特征域的采样概率。

在该实现方式中,假设在预设样本集中,第i个特征域中各特征值的取值为U1、U2……Uni,其中ni表示第i个特征域中所包括的特征值的个数。假设在预设样本集中,第i个特征域中各特征值的出现频次为P

本申请实施例对上述S402-B11中基于预设样本集中第i个特征域所包括的各特征值,在预设样本集中的出现频次,确定第i个特征域的信息熵的具体方式不做限制。

在一种可能的实现方式中,计算设备将第i个特征域所包括的各特征值,在预设样本集中的出现频次的平均值,确定为第i个特征域的信息熵。

在一种可能的实现方式中,针对第i个特征域中的第j个特征值,基于第j个特征值在预设样本集中的出现频次,确定第j个特征值对应的第一值;将第i个特征域所包括的各特征值对应的第一值进行相加,得到第i个特征域的信息熵。

在该实现方式中,对于第i个特征域中的每一个特征值,基于每一个特征值在预设样本集中的出现频次,确定第i个特征域中的每一个特征值对应的第一值,进而将每一个特征值对应的第一值进行相加,得到第i个特征域的信息熵。

本申请实施例对确定第i个特征域中每一个特征值对应的第一值的具体方式不做限制。

例如,对于第i个特征域中的第j个特征值,将该第j个特征值在预设样本集中的出现频次,确定为该第j个特征值对应的第一值。

再例如,对第j个特征值在预设样本集中的出现频次进行对数运算,得到第二值;将第j个特征值在预设样本集中的出现频次,与第二值的乘积,确定为第j个特征值对应的第一值。在此基础上,在一种示例中,计算设备可以根据如下公式(1)确定出第i个特征域的信息熵:

其中,E

需要说明的是,上述公式(1)只是一种示例,本申请实施例中,确定第i个特征域的信息熵的方式包括但不限于上述公式(1)所示。

计算设备基于上述方法确定出第i个特征域的信息熵后,执行上述S402-B12,确定第i个特征域的采样概率。

本申请实施例对上述S402-B12中基于第i个特征域的信息熵,确定第i个特征域的采样概率的具体方式不做限制,只要保证第i个特征域的采样概率与第i个特征域的信息熵呈正相关即可。这是因为第i个特征域的信息熵与第i个特征域下的特征值的取值范围(或取值数量)、特征分布的均匀程度呈正比。因此,若第i个特征域的信息熵越大,第i个特征域的收敛速度越慢,因此,为第i个特征域确定更大的采样概率。相反,若第i个特征域的信息熵越小,第i个特征域的收敛速度越快,因此,为第i个特征域确定更小的采样概率。

在一种可能的实现方式中,计算设备将第i个特征域的信息熵与第一超参数相乘后,与第二超参数进行相加,得到第三值;对第三值进行预设运算,得到第i个特征域的采样概率。

本申请实施例对预设运算的具体类型不做限制,例如预设运算为正相关的一些运算。

在一种示例中,上述预设运算为双曲正切函数运算,此时,计算设备基于如下公式(2)确定第i个特征域的采样概率:

r

其中,r

需要说明的是,在一些实施例中,上述预设样本集可以为全部训练样本集,此时,对于每一个训练样本中的第i个特征域的采样概率均一致。因此,在超网训练时,通过上述采样概率的计算方法,可以确定出全部训练样本集中第i个特征域的采样概率。

在一些实施例中,在超网的训练过程中,在每一次迭代训练过程中,从全部训练样本集中采样一批(batch)训练样本作为当前批训练样本集(也称为mini-batch训练样本集)用于超网的当前轮训练。此时,对于当前批训练样本集中的每一个训练样本中的第i个特征域的采样概率均一致。因此,在超网的每一轮训练中,通过上述采样概率的计算方法,可以确定出当前批训练样本集中的第i个特征域的采样概率。

上述对确定M个特征域中第i个特征域的采样概率的确定过程进行介绍,M个特征域中的其他特征域的采样概率的确定过程与上述第i个特征域的采样概率的确定过程一致,参照上述描述即可。

计算设备确定出M个特征域中每一个特征域的采样概率后,执行如下S402-C的步骤。

S402-C、基于M个特征域中每一个特征域的采样概率,对M个特征域的第一特征向量进行采样,得到P个特征域的第一特征向量。

其中,P为小于M的正整数。

计算设备基于上述S402-A确定出训练样本的M个特征域的第一特征向量,基于上述S402-A确定出训练样本的M个特征域中每一个特征域的采样概率。基于此,计算设备可以基于M个特征域中每一个特征域的采样概率,对M个特征域的第一特征向量进行采样,得到P个特征域的第一特征向量。例如,若第i个特征域的采样概率较高时,则第i个特征域被选中的可能较大,若第i个特征域的采样概率较低时,则第i个特征域被选中的可能较小,这样计算设备可以基于上述确定的M个特征域中每一个特征域的采样概率,从M个特征域中采样出P个特征域,进而使用P个特征域的第一特征向量对超网进行训练,提升对超网的训练速度。

S402-D、基于P个特征域的第一特征向量,对超网进行训练,得到训练后的超网。

具体的,将上述P个特征域的第一特征向量输入超网中,得到超网输出的预测值,基于超网输出的预测值,确定超网的预测损失,进而基于预测损失对超网的模型参数进行更新,选择新的训练样本对参数更新后的超网继续训练,依次类推,直到达到超网的训练结束条件为止。

本申请实施例对超网的具体网络结构不做限制,具体可以根据实际应用场景搭建。

在一些实施例中,如图7所示,超网包括特征嵌入层和网络交叉层,其中特征嵌入层用于将训练样本的M个特征域的特征值转换为M个特征域的特征向量。网络交叉层用来进行低阶特征结合与高阶特征抽象。可选的,网络交叉层包括至少一个MLP,MLP由多个全连接层以及相应的激活函数组成。

如图7所示,计算设备通过超网中的特征嵌入层,将训练样本的M个特征域的第一特征值,转换为M个特征域的第一特征向量。接着,基于确定的M个特征域中每一个特征域的采样概率,对M个特征域的第一特征向量进行采样,得到训练样本的P个特征域的第一特征向量,进而执行上述S402-D。此时,上述S402-D包括如下S402-D1至S402-D3的步骤:

S402-D1、通过超网的网络交叉层,对P个特征域的第一特征向量进行处理,得到训练样本的第一预测值。

其中,第一预测值表示训练样本中的对象对训练样本中的媒体资源进行点击的概率预估值。

具体的,计算设备将上述选择的训练样本的P个特征域的第一特征向量输入超网的网络交叉层,以使超网的网络交叉层对训练样本的P个特征域的第一特征向量进行特征融合和特征抽象,得到训练样本的第一预测值。

S402-D2、通过超网关于训练样本集的损失函数,对训练样本的真实值和第一预测值进行计算,得到超网关于训练样本的预测损失。

本申请实施例对超网关于训练样本集的损失函数的具体表达方式不做限制。

在一些实施例中,超网关于训练样本的损失函数为交叉熵损失函数。

在一种示例中,超网关于训练样本集的损失函数如公式(3)所示:

其中,

S402-D3、若未达到超网的训练结束条件时,则基于训练样本的预测损失对超网的模型参数进行更新。

其中超网的训练结束条件可以是超网对应的预测损失满足预设损失值,或者超网的训练次数达到预设训练次数。

在一些实施例中,若超网的训练结束条件为预测损失小于或等于预测损失,则计算设备在本轮训练过程中,基于上述步骤,确定出超网在本轮的预测损失后,判断本轮的预测损失是否小于或等于预设损失值。若本轮训练中超网的预设损失值小于或等于预设损失值,则说明超网训练结束,将本轮训练得到的超网确定为训练后的超网。若本轮训练中超网的预设损失值大于预设损失值,则说明超网未训练结束,则基于本轮超网的预测损失,确定超网的模型参数更新梯度,并使用模型参数更新梯度,对超网的模型参数进行更新,得到本轮更新后的超网。接着,从训练样本集中采集其他至少一个训练样本,对本轮训练后的超网继续训练。重复上述步骤,直到超网的预测损失小于或等于预测损失为止。

在一些实施例中,若超网的训练结束条件为超网的训练次数达到预设训练次数,则计算设备在本轮训练过程中,基于上述步骤,确定出超网在本轮的预测损失后,判断当前超网的训练次数是否达到预设训练次数,若达到,则基于本轮超网的预测损失,确定超网的模型参数更新梯度,并使用模型参数更新梯度,对超网的模型参数进行更新,得到最终训练后的超网。若当前超网的训练次数未达到预设训练次数,则基于本轮超网的预测损失,确定超网的模型参数更新梯度,并使用模型参数更新梯度,对超网的模型参数进行更新,接着,从训练样本集中采集其他至少一个训练样本,对本轮训练后的超网继续训练。重复上述步骤,直到超网的训练次数达到预设次数为止。

为了进一步说明超网的训练过程,下面结合超网的具体网络结构,对超网的具体训练过程进行介绍。

图8为本申请实施例涉及的超网的训练框架示意图。如图8所示,本申请实施例的超网包括但不限于特征嵌入层、网络交叉层和输出层。

特征嵌入层的输入为训练样本的M个特征域的第一特征值。例如,训练样本的M个特征域的第一特征值包括对象的特征值、广告的特征值及场景的特征值等。示例性的,训练样本的M个特征域F

图8中的SCF表示特征采样,即基于训练样本中M个特征域中每一个特征域的采样概率,对特征嵌入层输出的训练样本的M个特征域的第一特征向量进行采样,得到P个特征域的第一特征向量。

网络交叉层包括由一个待训练的MLP结构,网络交叉层的输入为训练样本的P个特征域的第一特征向量。即,图8中的向量V可以被理解为上述训练样本的M个特征域的第一特征向量V={v

网络交叉层用于对训练样本的P个特征域的第一特征向量V’={v

logits=MLP(v

输出层用于基于网络交叉层输出的预测概率logits进行处理,得到训练样本的第一预测值,例如,该第一预测值可以为训练样本中的对象对训练样本中的媒体资源进行点击的概率预估值。示例性的,可以通过如下公式(5)确定出训练样本的第一预测值p:

p=sigmoid(logits)(5)

图9为超网的一种训练过程示意图,如图9所示,本申请实施例的超网训练包括如下步骤:

步骤11,获取训练样本集,其中训练样本集中包括多个训练样本,每一个训练样本可以表示为(x

步骤12,从训练样本集中采集一批(batch)训练样本,得到当前批训练样本集。

例如,计算设备从训练样本集中随机采集一批训练样本,作为当前批训练样本集,用于本轮超网的训练。

步骤13,确定当前批训练样本集中每一个训练样本的M个特征域的第一特征值。

本申请实施例的训练样本包括M个特征域F

步骤14、通过超网中的特征嵌入层,将当前批训练样本集中每一个训练样本的M个特征域的第一特征值,转换为每一个训练样本的M个特征域的第一特征向量。

如图8所示,针对当前批训练样本集中的每一个训练样本,特征嵌入层用于将训练样本的M个特征域的第一特征值x

步骤15、确定当前批训练样本集中M个特征域中每一个特征域的采样概率。

例如,计算设备基于上述公式(1)和公式(2)确定出当前批训练样本集中M个特征域中每一个特征域的采样概率。其中,公式(1)中的

步骤16、基于当前批训练样本集中M个特征域中每一个特征域的采样概率,对当前训练样本集中每一个训练样本的M个特征域的第一特征向量进行采样,得到当前训练样本集中每一个训练样本的至少一个特征域的第一特征向量。

需要说明的是,在该步骤16中,不同的训练样本采集得到的至少一个特征域可能相同,也可能不同。例如,当前训练样本集包括训练样本1、训练样本2和训练样本2,虽然训练样本1、训练样本2和训练样本3的每一个特征域的采样概率相同,但是这3个训练样本最终采样得到的特征域可能相同,也可能不同。例如,基于上述M个特征域中每一个特征域的采样概率,对训练样本1的M个特征域的第一特征向量进行采样,得到训练样本1的特征域1和特征域2的第一特征向量,对训练样本2的M个特征域的第一特征向量进行采样,得到训练样本2的特征域1和特征域3的第一特征向量,对训练样本3的M个特征域的第一特征向量进行采样,得到训练样本3的特征域1、特征域2和特征域3的第一特征向量。这样在本轮训练中,可以使用训练样本1的特征域1和特征域2的第一特征向量,对特征域1和特征域2构成的候选特征子集对应的子网络进行训练,使用训练样本2的特征域1和特征域3的第一特征向量,对特征域1和特征域3构成的候选特征子集对应的子网络进行训练,使用训练样本3的特征域1、特征域2和特征域3的第一特征向量,对特征域1、特征域2和特征域3构成的候选特征子集对应的子网络进行训练。也就是说,在本轮训练中,采用若干个子网络(即若干个候选特征域)进行训练,提升超网的训练速度。

步骤17、通过超网中的网络交叉层,对当前训练样本集中每一个训练样本的至少一个特征域的第一特征向量进行处理,得到当前训练样本集中每一个训练样本对应的预测概率logits。

例如,通过公式(4)可以计算出每一个训练样本对应的预测概率,例如该预测概率可以为训练样本中的对象对训练样本中的媒体资源执行目标操作的概率。

步骤18,通过超网中的输出层对当前训练样本集中每一个训练样本对应的预测概率进行处理,得到当前训练样本集中每一个训练样本对应的第一预测值。

例如,通过如上述公式(5)确定出当前训练样本集中每一个训练样本的第一预测值p。例如,该第一预测值可以为训练样本中的对象对训练样本中的媒体资源进行点击的概率预估值。

步骤19、通过超网关于训练样本集的损失函数,对当前批训练样本集中的每一个训练样本的真实值和第一预测值进行计算,得到超网关于当前批训练样本集的预测损失。

示例性的,计算设备通过如上公式(3)计算超网关于当前批训练样本集的预测损失。

步骤20、判断是否达到超网的训练结束条件。

若未达到超网的训练结束条件,例如当前批训练样本集的预测损失大于预设损失值,和/或超网的训练次数未达到预设次数,则执行如下步骤21,继续对超网进行训练。

若达到超网的训练结束条件,则执行如下步骤22,停止超网训练,得到训练后的超网。

步骤21、基于超网关于当前批训练样本集的预测损失,对超网的模型参数进行更新,并返回执行上述步骤12。

需要说明的是,在超网的每一轮训练过程中,需要对每一轮中的特征域的采样概率进行更新,具体更新过程如上述步骤15所示。

步骤22、停止训练超网。

上述对超网的具体训练过程进行介绍。在本申请实施例中,在超网训练的每轮迭代中,都公平的采样出若干子网络进行训练,以提升超网的训练速度。

计算设备基于上述步骤,对超网训练介绍后,执行如下S403的步骤。

S403、对于验证样本集中的每一个验证样本,通过特征选择模型对验证样本进行处理,得到验证样本的M个特征域的特征选取参考值。

其中,特征选取参考值用于指示特征域是否被选中。

本申请实施例的特征选择模型输出的是验证样本的M个特征域中每一个特征域的特征选取参考值,该特征选取参考值用于指示该特征域是否被选中。在一些实施例中,特征选取参考值也称为特征状态值。因此,可以理解的是,本申请实施例的特征选择模型输出的是M个特征域中被选中的特征域。

本申请实施例对通过特征选择模型对验证样本进行处理,得到M个特征域的特征选取参考值的具体过程不做限制。

在一些实施例中,确定验证样本的M个特征域的特征值,将该验证样本的M个特征域的特征值输入特征选择模型中,得到特征选择模型预测的该验证样本中M个特征域的特征选取参考值。

在一些实施例中,上述S403中通过特征选择模型对验证样本进行处理,得到M个特征域的特征选取参考值包括如下S403-A和S403-B的步骤:

S403-A、通过特征选择模型中的特征嵌入层对验证样本的M个特征域的编号进行向量转换,得到M个特征域的编号向量;

S403-B、通过特征选择模型中的特征交互层对M个特征域的编号向量进行处理,得到该验证样本的M个特征域的特征选取参考值。

图10为特征选择模型的一种网络结构示意图,如图10所示,本申请实施例的特征选择模型包括但不限于:特征嵌入层和特征交互层。

其中,特征嵌入层用于将验证样本的M个特征域的编号inedx,转换为embedding向量,得到验证样本的M个特征域的编号向量。

特征交互层用于对特征嵌入层输出的M个特征域的编号向量进行处理,得到验证样本的M个特征域中每一个特征域的特征选取参考值。本申请实施例对特征交互层的具体网络结构不做限制。

其中,特征域的特征选取参考值为第一数值时表示特征域被选中,特征域的特征选取参考值为第二数值时表示特征域被丢弃。

本申请实施例对第一数值和第二数值的具体取值不做限制。

可选的,第一数值为1,第二数值为0。例如,对于M个特征域中的第i个特征域,若该第i个特征域的特征选取参考值为1时,则表示该第i个特征域被选中,若第i个特征域的特征选取参考值为0时,则表示该第i个特征域被丢弃。

示例性的,特征交互层输出的验证样本的M个特征域的特征选取参考值可以表示为一个M维的二值向量θ=(θ

计算设备通过特征选择模型对验证样本进行处理,得到验证样本中的M个特征域的特征选取参考值后,执行如下S404。

S404、通过训练后的超网,对验证样本和验证样本的M个特征域的特征选取参考值进行处理,得到奖励值,并基于奖励值对特征选择模型的模型参数进行更新,得到训练后的特征选择型模型。

本申请实施例对通过训练后的超网,对验证样本和该验证样本的M个特征域的特征选取参考值进行处理,得到奖励值的具体方式不做限制。

在一些实施例中,将验证样本的特征值和该验证样本的M个特征域的特征选取参考值输入训练后的超网中,得到超网对该验证样本的预测值,接着,基于该预设值和验证样本的真实值,确定特征选择模型的奖励值。例如,确定验证样本的预设值和验证样本的真实值之间的差值,将该差值的倒数或相反数,确定为特征选择模型的奖励值。

在一些实施例中,上述S404中通过训练后的超网,对验证样本和该验证样本的M个特征域的特征选取参考值进行处理,得到奖励值包括如下S404-A至S404-D的步骤:

S404-A、确定验证样本的M个特征域的第二特征值,并通过训练后的超网中的特征嵌入层,将M个特征域的第二特征值转换为M个特征域的第二特征向量;

图11为本申请实施例涉及的特征选择模型的一种训练框架示意图。如图11所示,计算设备提取验证样本的M个特征域的特征值,即为第二特征值。接着,计算设备将通过训练后的超网中的特征嵌入层,将验证样本的M个特征域的第二特征值转换为验证样本的M个特征域的第二特征向量,例如记为v

同时,计算设备确定验证样本的M个特征域的编号,并通过特征选择模型中的特征嵌入层对验证样本的M个特征域的编号进行向量转换,得到验证样本的M个特征域的编号向量。计算设备通过特征选择模型中的特征交互层对M个特征域的编号向量进行处理,得到M个特征域的特征选取参考值。

S404-B、基于验证样本的M个特征域的特征选取参考值,对M个特征域的第二特征向量进行处理,得到M个特征域的第三特征向量。

本申请实施例对基于验证样本的M个特征域的特征选取参考值,对M个特征域的第二特征向量进行处理,得到M个特征域的第三特征向量的具体方式不做限制。

在一种示例中,若M个特征域中的第i个特征域的特征选取参考值为0时,则确定第i个特征域的第三特征向量为0,若M个特征域中的第i个特征域的特征选取参考值为1时,则确定第i个特征域的第三特征向量为第i个特征域的第二特征向量。

在另一种示例中,将验证样本的M个特征域的特征选取参考值分别与M个特征域的第二特征向量进行相乘,得到M个特征域的第三特征向量。

例如,计算设备通过如下公式(6),确定验证样本的M个特征域的第三特征向量:

v

其中,v

S404-C、通过训练后的超网中的网络交叉层,对M个特征域的第三特征向量进行处理,得到验证样本的第二预测值。

其中,第二预测值表示验证样本中的对象对验证样本中的媒体资源进行点击的概率预估值。

计算设备基于上述步骤,确定出验证样本的M个特征域的第三特征向量后,将验证样本的M个特征域的第三特征向量输入训练后的超网中的网络交叉层中,得到验证样本的第二预测值。其中,确定第二预测值的过程与上述确定第一预测值的过程基本一致,可以参照上述实施例的描述。

S404-D、基于第二预测值和验证样本的真实值,确定奖励值。

本申请实施例对基于第二预测值和验证样本的真实值,确定奖励值的具体方式不做限制,只要保证第二预测值准确度越高(即第二预测值与真实值的差异越小,表示第二预测值的准确度越高),则奖励值越大即可。

在一种可能的实现方式中,计算设备确定验证样本的预设值和验证样本的真实值之间的差值,将该差值的倒数或相反数,确定为特征选择模型的奖励值。

在一种可能的实现方式中,上述S404-D包括如下S404-D1和S404-D2的步骤:

S404-D1、通过超网关于验证样本集的损失函数,对第二预测值和验证样本的真实值进行计算,得到超网关于验证样本的预测损失。

本申请实施例对超网关于验证样本集的损失函数的具体表达方式不做限制。

在一些实施例中,超网关于验证样本集的损失函数为交叉熵损失函数。

在一种示例中,超网关于验证样本集的损失函数如公式(7)所示:

其中,

S404-D2、基于验证样本的预测损失,确定奖励值。

例如,将验证样本的预测损失的倒数,确定为奖励值。

再例如,将验证样本的预测损失的相反数,确定为奖励值。

计算设备基于上述步骤,确定出特征选择模型的奖励值后,基于奖励值对特征选择模型的模型参数进行更新,得到训练后的特征选择模型。例如,基于特征选择模型的奖励值,确定本轮训练过程中特征选择模型的预测损失,并基于该预测损失确定特征选择模型中模型参数的更新梯度,基于该更新参数对特征选择模型中的模型参数进行更新,重复上述步骤,直到特征选择模型训练结束为止。

下面结合图12对特征选择模型的训练过程作进一说明。如图12所示,特征选择模型的训练过包括如下步骤:

步骤31、获取验证样本集。

其中验证样本集中包括多个验证样本,每一个验证样本可以表示为(x

步骤32,从验证样本集中采集一批(batch)验证样本,得到当前批验证样本集。

例如,计算设备从验证样本集中随机采集一批验证样本,作为当前批验证样本集,用于本轮特征选择模型的验证。

步骤33,确定当前批验证样本集中每一个验证样本的M个特征域的第二特征值。

本申请实施例的验证样本包括M个特征域,例如F

步骤34,通过训练后的超网中的特征嵌入层,将当前批验证样本集中每一个验证样本的M个特征域的第二特征值,转换为每一个验证样本的M个特征域的第二特征向量。

例如图11所示,针对当前批验证样本集中的每一个验证样本,训练后的超网中的特征嵌入层将验证样本的M个特征域的第二特征值x

步骤35、确定当前批验证样本集中每一个验证样本的M个特征域的编号。

步骤36、通过特征选择模型中的特征嵌入层,对当前批验证样本集中每一个验证样本的M个特征域的编号进行向量转换,得到当前批验证样本集中每一个验证样本的M个特征域的编号向量。

例如,通过特征选择模型中的特征嵌入层,将当前批验证样本集中每一个验证样本的M个特征域的编号inedx,转换为embedding向量,得到当前批验证样本集中每一个验证样本的M个特征域的编号向量。

步骤37、通过特征选择模型中的特征交互层,对当前批验证样本集中每一个验证样本的M个特征域的编号向量进行处理,得到当前批验证样本集中每一个验证样本的M个特征域的特征选取参考值。

其中,特征域的特征选取参考值为第一数值(例如为1)时表示特征域被选中,特征域的特征选取参考值为第二数值(例如为0)时表示特征域被丢弃。

步骤38、基于当前批验证样本集中每一个验证样本的M个特征域的特征选取参考值,对当前批验证样本集中每一个验证样本的M个特征域的第二特征向量进行处理,得到当前批验证样本集中每一个验证样本的M个特征域的第三特征向量。

例如,将验证样本的M个特征域的特征选取参考值分别与验证样本的M个特征域的第二特征向量进行相乘,得到验证样本的M个特征域的第三特征向量。

步骤39、通过训练后的超网中的网络交叉层,对当前批验证样本集中每一个验证样本的至少一个特征域的第三特征向量进行处理,得到当前批训练样本集中每一个验证样本对应的预测概率logits。

例如,通过公式(4)可以计算出每一个验证样本对应的预测概率,例如该预测概率可以为验证样本中的对象对验证样本中的媒体资源执行目标操作的概率。

步骤40,通过训练后的超网中的输出层对当前批验证样本集中每一个验证样本对应的预测概率进行处理,得到当前批验证样本集中每一个验证样本对应的第二预测值。

例如,通过如上述公式(5)确定出当前批验证样本集中每一个验证样本的第二预测值p。例如,该第二预测值可以为验证样本中的对象对验证样本中的媒体资源进行点击的概率预估值。

步骤41、通过超网关于验证样本集的损失函数,对当前批验证样本集中的每一个验证样本的真实值和第二预测值进行计算,得到超网关于当前批验证样本集的预测损失。

示例性的,计算设备通过如上公式(7)计算超网关于当前批验证样本集的预测损失。

步骤42、基于超网关于当前批验证样本集的预测损失,确定特征选择模型的奖励值。

例如将超网关于当前批验证样本集的预测损失的倒数,确定为特征选择模型的奖励值。

步骤43、基于特征选择模型的奖励值,确定特征选择模型的预测损失。

步骤44、判断是否达到特征选择模型的训练结束条件。

若未达到特征选择模型的训练结束条件,例如当前批验证样本集的预测损失大于预设损失值,和/或特征选择模型的训练次数未达到预设次数,则执行如下步骤45,继续对特征选择模型进行训练。

若达到特征选择模型的训练结束条件,则执行如下步骤46,停止特征选择模型训练,得到训练后的特征选择模型。

步骤45、基于特征选择模型关于当前批验证样本集的预测损失,对特征选择模型的模型参数进行更新,并返回执行上述步骤32。

步骤46、停止训练特征选择模型。

计算设备通过上述方法可以实现对特征选择模型的训练,进而得到训练结束时特征选择模型所输出的M个特征域中每一个特征域的特征选取参考值。这样,可以基于训练结束时特征选择模型所输出的M个特征域中每一个特征域的特征选取参考值,确定出M个特征域中最终被选中的特征域子集。例如,M个特征域包括特征域1、特征域2和特征域3,训练结束时特征选择模型所输出的3个特征域中,特征域1的特征选取参考值为1、特征域2的特征选取参考值为0、特征域3的特征选取参考值为1,因此可以确定出最终选择的特征域为特征域1和特征域3,而特征域2被丢弃,实现特征域的准确选择。

本申请实施例提供的模型训练方法,计算设备通过将M个特征域可能组成的候选特征子集中的每一个候选特征子集作为超网中的一个子网络,将最优特征子集的选择视为超网中模型结构选择的一部分,进而将最优特征子集的选择转换为网络结构搜索问题。具体是,获取历史媒体资源推荐数据,并将历史媒体资源推荐数据划分为训练样本集和验证样本集,其中训练样本集和验证样本集中的样本均包括M个特征域,通过训练样本集对超网进行训练,得到训练后的超网。接着,对于验证样本集中的每一个训练样本,通过特征选择模型对验证样本进行处理,得到验证样本的M个特征域的特征选取参考值,其中特征选取参考值用于指示特征域是否被选中。然后,通过训练后的超网,对验证样本和验证样本的M个特征域的进行处理,得到奖励值,并基于该奖励值对特征选择模型的模型参数进行更新,得到训练后的特征选择模型。这样可以基于训练结束时特征选择模型输出的M个特征域的特征选取参考值,确定出M个特征域中最终被选中的特征域,例如,训练结束时特征选择模型输出的特征域1的特征选取参考值为0时,则表示该特征域1未被选中,若训练结束时特征选择模型输出的特征域1的特征选取参考值为1时,则表示该特征域1被选中。由上述可知,在本申请实施例中,特征选择模型是基于超网训练得到的,超网中的每一个子网络对应M个特征域的一个候选特征子集,使得特征选择模型直接对特征子集进行评估而不是对特征进行打分排序,能够有效的解决特征共线性带来的效果影响,提升了特征选择的准确性,基于准确选择的特征进行媒体资源推荐时,可以提高媒体资源的推荐准确性。

上文结合图2至图12,详细描述了本申请的模型训练方法实施例,即特征选择实施例,下面对本申请实施例提供的媒体资源推荐方法进行介绍。

图13为本申请一实施例提供的一种媒体资源推荐方法流程示意图。本申请实施例的执行主体为具有媒体资源推荐功能的装置,例如为媒体资源推荐装置。在一些实施例中,该媒体资源推荐装置可以为图3中的计算设备,或者为图3中的终端设备,或者为图3中计算设备和终端设备组成的系统。为了便于描述,本申请实施例以执行主体为计算设备为例进行说明,该计算设备与上述进行模型训练的计算设备可以为同一个设备,也可以为不同的设备,本申请实施例对此不做限制。

如图13所示,本申请实施例的方法包括如下步骤:

S501、获取目标对象对应的候选媒体资源推荐数据,并提取候选媒体资源推荐数据的M个特征域的特征值。

其中,候选媒体资源推荐数据包括目标对象的对象数据,以及待推荐的候选媒体资源数据,M均为大于1的正整数。

本申请实施例的候选媒体资源推荐数据包括M个特征域,例如包括对象特征、广告特征、场景特征等等。

以媒体资源为广告为例,对象数据主要包括对象画像和对象历史行为,比如对象年龄、性别、对象点击过的广告等。广告数据是指候选广告的基本信息,主要包括广告ID、广告主信息、创意信息等。

在实际使用过程中,当目标对象访问平台页面(例如访问微信、QQ等页面)时,平台会根据目标对象标识去对象数据库中查找该目标对象的对象数据。同时会根据目标对象点击过的广告编号,去广告数据库中查找所有候选广告的数据信息,得到目标对象对应的候选广告数据。

在一些实施例中,如图14所示,候选媒体资源推荐数据还包括场景信息,比如目标对象的请求时间、候选媒体资源的展示位置等,其中目标对象请求时间为目标对象点击某一候选媒体资源的时间,或者该候选媒体资源曝光给目标对象的时间。候选媒体资源的展示位置包括该候选媒体资源展示给目标对象时,在显示页面中所处的位置,例如位于显示页面的左上方或者位于第i条消息之后或之前。

由上述可知,对象数据除了包括对象画像外,还包括对象历史行为数据。基于此,计算设备可以从目标对象的历史行为数据中,提出场景信息。例如目标对象的历史行为数据中包括目标对象点击广告1的时间t1,以及在点击广告1时,广告1在显示页面中的位置。这样,可以从目标对象的历史行为数据中,提取出广告1对应的目标对象请求时间t1,以及广告1的展示位置。

在本申请实施例中,提取该候选媒体资源推荐数据的M个特征域的特征值。如图14所示,以广告领域为例,通过对对象数据、广告数据和场景信息进行特征抽取,得到“性别”、“年龄”、“广告ID”、“请求时间”等特征域的特征值。

示例性的,提取的对象特征、广告特征和场景特征等M个特征域的特征值,可以记为x

S502、获取特征选择模型输出的特征选取参考值,并基于特征选取参考值,确定M个特征域中被选中的R个特征域。

其中,特征选取参考值用于指示M个特征域中被选中的特征域。

在本申请实施例中,若候选媒体资源推荐数据所包括的原始特征较多,且原始特征中可能存在很多区分度较差的特征。因此,需要对候选媒体资源推荐数据的原始特征进行特征选择,选出一部分特征进入后续的媒体推荐过程。

具体的,获取上述训练后的特征选择模型所输出的M个特征域的特征选取参考值,并基于该特征选取参考值,确定M个特征域中被选中的R个特征域。例如,对于M个特征域中的第i个特征域,若训练结束时特征选择模型输出的第i个特征域的特征选取参考值为0时,则表示该第i个特征域未被选中,若训练结束时特征选择模型输出的第i个特征域的特征选取参考值为1时,则表示该第i个特征域被选中。参照该方法,可以基于训练结束时特征选择模型输出的M个特征域的特征选取参考值,从M个特征域中选出被选中的R个特征域。

S503、从候选媒体资源推荐数据的M个特征域的特征值中,选出R个特征域的特征值。

计算设备基于上述步骤,从M个特征域中选出被选中的R个特征域后,可以从S501确定的候选媒体资源推荐数据的M个特征域的特征值中,选出R个特征域的特征值,用于后续媒体推荐。

以广告为例,假设M个特征域包括姓名、年龄、广告ID和请求时间,这M个特征域中被选中的R个特征域包括年龄和广告ID。这样从上述确定出的候选媒体资源推荐数据的姓名、年龄、广告ID和请求时间这4类特征域的特征值中,选出年龄和广告ID这2类特征域的特征值,进行后续广告推荐流程中。

S504、基于R个特征域的特征值,从候选媒体资源数据中筛选目标媒体资源数据,向目标对象推荐目标媒体资源数据。

在本申请实施例中,候选媒体资源数据值包括多个候选媒体资源的数据,例如包括候选广告1、候选广告2、候选广告3等候选广告的广告数据。基于上述步骤,确定出候选媒体资源推荐数据的R个特征域的特征值后,基于该R个特征域的特征值,从候选广告1、候选广告2、候选广告3等候选广告中,确定出至少一个,例如K个候选广告作为目标广告,并将目标广告的广告数据推荐给目标对象,实现向目标对象准确推荐媒体资源。

本申请实施例对基于R个特征域的特征值,从候选媒体资源数据中筛选目标媒体资源数据的具体过程不做限制。

在一些实施例中,上述S504中基于R个特征域的特征值,从候选媒体资源数据中筛选目标媒体资源数据包括如下S504-A1和S504-A2的步骤:

S504-A1、基于R个特征域的特征值,确定候选媒体资源数据中候选媒体资源的推荐概率。

其中,推荐概率可以表示目标对象对候选媒体资源执行目标操作的概率。

具体的,经过查表将候选媒体资源推荐数据的R个特征域的特征值转换为相应的embedding向量,得到候选媒体资源推荐数据的R个特征域的特征向量。接着,将候选媒体资源推荐数据的R个特征域的特征向量输入推荐模型中进行计算,例如进行广告打分,得到候选媒体资源数据中各候选媒体资源的推荐概率。

示例性的,以广告推荐为例,如图14所示,将R个特征域的特征值转换为相应的特征向量,将R个特征域的特征向量输入广告推荐模型中进行计算,得到候选广告1、候选广告2、候选广告3等各候选广告的推荐概率,其中推荐概率也可以称为分值。

S504-A2、基于推荐概率,从候选媒体资源数据中筛选目标媒体资源数据。

参照上述步骤,可以确定出每一个候选媒体资源的推荐概率。进而根据每一个候选媒体资源的推荐概率,选出K个候选媒体资源,进而将这K个候选媒体资源的数据,确定为目标媒体资源数据。

示例性的,如图14所示,参照上述步骤,可以确定出每一个候选广告的分值。进而根据每一个候选广告的分值,再结合广告出价等信息计算最终的广告排序分,进而基于广告排序分对各候选广告进行排序,选择分值最大的K的广告作为目标广告推荐给目标对象。

本申请实施例,由于特征选择模型直接对特征子集进行评估,能够有效的解决特征共线性带来的效果影响,可以实现特征的准确选择,这样在媒体资源推荐时,基于上述训练得到的特征选择模型所输出的特征选取参考值,可以从候选媒体资源推荐数据的M个特征域中准确选择R个特征域,基于准确选择的R个特征域的特征值,进行媒体资源推荐时,可以提升媒体资源推荐的准确性。

上文结合图4至图14,详细描述了本申请的模型训练和数据处理方法实施例,下文结合图15至图16,详细描述本申请的装置实施例。

图15是本申请一实施例提供的媒体资源推荐装置的示意性框图。该装置10可以应用于计算设备。

如图15所示,媒体资源推荐装置10包括:

数据获取单元11,用于获取目标对象对应的候选媒体资源推荐数据,并提取所述候选媒体资源推荐数据的M个特征域的特征值,所述候选媒体资源推荐数据包括所述目标对象的对象数据以及待推荐的候选媒体资源数据,所述M为大于1的正整数;

特征域选择单元12,用于获取特征选择模型输出的特征选取参考值,并基于所述特征选取参考值,确定所述M个特征域中被选中的R个特征域,其中所述特征选择模型是基于超网训练得到的,所述超网包括多个子网络,所述多个子网络中的每一个子网络对应一个候选特征子集,所述候选特征子集由历史媒体资源推荐数据所包括的所述M个特征域中的至少一个特征域组成,所述R为小于M的正整数;

特征值选择单元13,用于从所述候选媒体资源推荐数据的M个特征域的特征值中,选出所述R个特征域的特征值;

媒体推荐单元14,用于基于所述R个特征域的特征值从所述候选媒体资源数据中筛选目标媒体资源数据,向所述目标对象推荐所述目标媒体资源数据。

在一些实施例中,媒体推荐单元14,具体用于基于所述R个特征域的特征值,确定所述候选媒体资源数据中候选媒体资源的推荐概率;基于所述推荐概率,从所述候选媒体资源数据中筛选所述目标媒体资源数据。

在一些实施例中,特征域选择单元12,在获取特征选择模型输出的特征选取参考值之前,还用于获取所述历史媒体资源推荐数据,并将所述历史媒体资源推荐数据划分为训练样本集和验证样本集,所述历史媒体资源推荐数据包括历史对象的对象数据,以及向所述历史对象所推荐的媒体资源数据,所述训练样本集和所述验证样本集中的样本均包括M个特征域,所述M为大于1的正整数;通过所述训练样本集对超网进行训练,得到训练后的超网;对于所述验证样本集中的每一个验证样本,通过特征选择模型对所述验证样本进行处理,得到所述验证样本的M个特征域的特征选取参考值;通过所述训练后的超网,对所述验证样本和所述验证样本的M个特征域的特征选取参考值进行处理,得到奖励值,并基于所述奖励值对所述特征选择模型的模型参数进行更新,得到训练后的特征选择模型。

在一些实施例中,特征域选择单元12,具体用于对于所述训练样本集中的每一个训练样本,确定所述训练样本的M个特征域的第一特征值,并通过所述超网中的特征嵌入层,将所述M个特征域的第一特征值转换为所述M个特征域的第一特征向量;确定所述训练样本的M个特征域中每一个特征域的采样概率;基于所述M个特征域中每一个特征域的采样概率,对所述M个特征域的第一特征向量进行采样,得到P个特征域的第一特征向量,所述P为小于M的正整数;基于所述P个特征域的第一特征向量,对所述超网进行训练。

在一些实施例中,特征域选择单元12,具体用于针对所述M个特征域中的第i个特征域,基于预设样本集中所述第i个特征域所包括的各特征值,在所述预设样本集中的出现频次,确定所述第i个特征域的采样概率,其中,所述i为小于或等于M的正整数,所述预设样本集为全部训练样本集,或者为当前批训练样本集。

在一些实施例中,特征域选择单元12,具体用于基于所述预设样本集中所述第i个特征域所包括的各特征值,在所述预设样本集中的出现频次,确定所述第i个特征域的信息熵;基于所述第i个特征域的信息熵,确定所述第i个特征域的采样概率。

在一些实施例中,特征域选择单元12,具体用于针对所述第i个特征域中的第j个特征值,基于所述第j个特征值在所述预设样本集中的出现频次,确定所述第j个特征值对应的第一值,所述j为正整数;将所述第i个特征域所包括的各特征值对应的第一值进行相加,得到所述第i个特征域的信息熵。

在一些实施例中,特征域选择单元12,具体用于对所述第j个特征值在所述预设样本集中的出现频次进行对数运算,得到第二值;将所述第j个特征值在所述预设样本集中的出现频次,与所述第二值的乘积,确定为所述第j个特征值对应的第一值。

在一些实施例中,特征域选择单元12,具体用于将所述第i个特征域的信息熵与第一超参数相乘后,与第二超参数进行相加,得到第三值;对所述第三值进行预设运算,得到所述第i个特征域的采样概率。

在一些实施例中,特征域选择单元12,具体用于通过所述超网的网络交叉层,对所述P个特征域的第一特征向量进行处理,得到所述训练样本的第一预测值,所述第一预测值表示所述训练样本中的对象对所述训练样本中的媒体资源进行点击的概率预估值;通过所述超网关于训练样本集的损失函数,对所述训练样本的真实值和所述第一预测值进行计算,得到所述超网关于所述训练样本的预测损失;若未达到所述超网的训练结束条件时,则基于所述训练样本的预测损失对所述超网的模型参数进行更新。

在一些实施例中,特征域选择单元12,具体用于通过所述特征选择模型中的特征嵌入层对所述验证样本的M个特征域的编号进行向量转换,得到所述M个特征域的编号向量;通过所述特征选择模型中的特征交互层对所述M个特征域的编号向量进行处理,得到所述M个特征域的特征选取参考值,所述特征域的特征选取参考值为第一数值时表示所述特征域被选中,所述特征域的特征选取参考值为第二数值时表示所述特征域被丢弃。

在一些实施例中,特征域选择单元12,具体用于确定所述验证样本的M个特征域的第二特征值,并通过所述训练后的超网中的特征嵌入层,将所述M个特征域的第二特征值转换为所述M个特征域的第二特征向量;基于所述验证样本的M个特征域的特征选取参考值,对所述M个特征域的第二特征向量进行处理,得到M个特征域的第三特征向量;通过所述训练后的超网中的网络交叉层,对所述M个特征域的第三特征向量进行处理,得到所述验证样本的第二预测值,所述第二预测值表示所述验证样本中的对象对所述验证样本中的媒体资源进行点击的概率预估值;基于所述第二预测值和所述验证样本的真实值,确定所述奖励值。

在一些实施例中,特征域选择单元12,具体用于将所述验证样本的M个特征域的特征选取参考值分别与所述M个特征域的第二特征向量进行相乘,得到所述M个特征域的第三特征向量,其中,所述特征域的特征选取参考值为1时表示所述特征域被选中,所述特征域的特征选取参考值为0时表示所述特征域被丢弃。

在一些实施例中,特征域选择单元12,具体用于通过所述超网关于验证样本集的损失函数,对所述第二预测值和所述验证样本的真实值进行计算,得到所述超网关于所述验证样本的预测损失;基于所述验证样本的预测损失,确定所述奖励值。

在一些实施例中,特征域选择单元12,具体用于将所述验证样本的预测损失的倒数,确定为所述奖励值。

应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图15所示的装置可以执行上述方法的实施例,并且装置中的各个模块的前述和其它操作和/或功能分别为了实现上述方法实施例,为了简洁,在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。可选地,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。

图16是本申请实施例提供的计算设备的示意性框图,该计算设备用于执行上述媒体资源推荐方法实施例。该计算设备可以为终端设备和/或服务器。

如图16所示,该计算设备50可包括:

存储器51和处理器52,该存储器51用于存储计算机程序53,并将该程序代码53传输给该处理器52。换言之,该处理器52可以从存储器51中调用并运行计算机程序53,以实现本申请实施例中的方法。

例如,该处理器52可用于根据该计算机程序53中的指令执行上述方法步骤。

在本申请的一些实施例中,该处理器52可以包括但不限于:

通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中,该存储器51包括但不限于:

易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。

在本申请的一些实施例中,该计算机程序53可以被分割成一个或多个模块,该一个或者多个模块被存储在该存储器51中,并由该处理器52执行,以完成本申请提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序53在该计算设备中的执行过程。

如图16所示,该计算设备50还可包括:

收发器54,该收发器54可连接至该处理器52或存储器51。

其中,处理器52可以控制该收发器54与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器54可以包括发射机和接收机。收发器54还可以进一步包括天线,天线的数量可以为一个或多个。

应当理解,该计算设备50中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。

根据本申请的一个方面,提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。

本申请实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。

根据本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算设备执行上述方法实施例的方法。

换言之,当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。

以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以该权利要求的保护范围为准。

相关技术
  • 资源推荐方法、装置、设备及存储介质
  • 推荐标签获取方法、媒体内容推荐方法、装置及存储介质
  • 多媒体资源分类方法、装置、计算机设备及存储介质
  • 基于车载设备的内容推荐方法、装置、设备和存储介质
  • 一种推荐方法、装置、设备和存储介质
  • 一种油箱视窗盖密封胶片生产用加热装置
  • 一种多媒体资源推荐的方法、装置、设备和存储介质
技术分类

06120116503364