掌桥专利:专业的专利平台
掌桥专利
首页

模型训练的方法、对象推荐的方法、装置、设备及介质

文献发布时间:2024-04-18 20:00:50


模型训练的方法、对象推荐的方法、装置、设备及介质

技术领域

本申请属于计算机技术领域,具体而言,本申请涉及一种模型训练的方法、对象推荐的方法、装置、设备及介质。

背景技术

在对象推荐的业务中,例如针对实时接口(Real-Time API,RTA)广告业务,合作商家的数据链路出于隐私原因不会被全部地获取到,导致只能获取到点击数据,而后面的转化数据,全由商家提供。而转化数据由于量少,经常存在特征分布异常,比如某些特征的某个取值的分布异常,模型在学习过程中严重倾向该特征,导致模型泛化性能很弱。比如在某面向85后的游戏商家,年龄为85后的人群特征重要性特别高,模型会严重倾向于年龄特征,导致泛化能力弱。

出现这种异常的原因可能是符合业务的分布异常所导致的,因此,如何在符合业务的分布异常的情况下,模型泛化能力弱的问题。

发明内容

本申请实施例的目的旨在提供一种能够在缓解符合业务的分布异常的情况下提升模型泛化能力的模型训练的方法、对象推荐的方法、装置、设备及介质。为了实现上述目的,本申请实施例提供的技术方案如下:

第一方面,提供了一种模型训练的方法,包括:

获取待训练的推荐模型的训练集,所述训练集包括多个训练样本,所述多个训练样本包括第一数量的正样本和第二数量的负样本,每个所述训练样本包括一个样本对象的对象特征,所述对象特征包括至少两个维度的特征值,其中,所述正样本为样本对象对被推荐对象感兴趣的样本,所述待训练的推荐模型用于预测训练样本对应的样本对象对被推荐对象感兴趣的概率;

针对每一维度的每一特征值,确定所述第一数量的正样本中包括该特征值的正样本的第三数量,以及所述第二数量的负样本中包括该特征值的负样本的第四数量;

根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在所述训练集中的异常程度;

将每一所述训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各所述训练样本以及样本对应的各维度的特征值的异常程度,对所述待训练的推荐模型进行训练。

在一种可能的实现方式中,所述根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在所述训练集中的异常程度,包括:

针对每一维度的每一特征值,根据所述第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在所述训练集的正样本中的第一占比,根据所述第二数量和该特征值对应的所述第四数量,确定包含该特征值的负样本在所述训练集的负样本中的第二占比,根据所述第一占比和所述第二占比,确定该特征值的目标信息价值IV值;

针对每一维度的每一特征值,根据该特征值对应的第三数量和第四数量,确定包含该特征值的正样本在包含该特征值的所有样本中的第三占比;

获取每一维度对应的正样本占比第一参考值和正样本占比第二参考值;

针对每一维度的每一特征值,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值;

针对每一维度的每一特征值,根据该特征值对应的IV值和该特征值的正样本率目标偏移值,确定该特征值在所述训练集中的异常程度。

在另一种可能的实现方式中,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值,包括:

根据该特征值对应的第三占比、该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率初始偏移值;

获取所述推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值;

若该特征值的正样本率初始偏移值不小于所述正样本率偏移阈值,则将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值;

若该特征值的正样本率初始偏移值小于所述正样本率偏移阈值,则确定该特征值的正样本率目标偏移值为0。

在另一种可能的实现方式中,对于每一维度,该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值是采用以下方式确定的:

确定各维度分别对应的第四占比,任一维度对应的第四占比为该维度的各个特征值所包含的正样本总数量在该维度的各个特征值所包含的样本总数量的第四占比;

将各维度分别对应的第四占比的均值确定为所述该维度对应的正样本占比第一参考值;

将各维度分别对应的第四占比的标准差确定为所述该维度对应的正样本占比第二参考值。

在另一种可能的实现方式中,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值,包括:

确定所述第三占比和所述第一参考值之间的差值;

根据所述差值和所述第二参考值的比值,确定该特征值的正样本率目标偏移值。

在另一种可能的实现方式中,所述根据所述第一占比和所述第二占比,确定该特征值的目标信息价值IV值,包括:

确定所述第一占比和所述第二占比之间的差值;

根据所述差值,确定该特征值的目标IV值。

在另一种可能的实现方式中,所述根据所述差值,确定该特征值的目标IV值,包括:

根据所述差值,确定该特征值的初始IV值;

获取所述推荐模型所应用的目标场景所对应的特征值的IV阈值;

若所述初始IV值大于所述IV阈值,则将所述初始IV值确定为所述目标IV值;

若所述初始IV值不大于所述IV阈值,则将所述目标IV值确定为0。

在另一种可能的实现方式中,所述将每一所述训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各所述训练样本以及样本对应的各维度的特征值的异常程度,对所述待训练的推荐模型进行训练,包括:

计算所述每一特征值对应的嵌入特征;

基于所述概率断开与该特征值所属维度所对应的神经元的连接;

基于所述每一特征值对应的嵌入特征对断开处理后的模型进行训练。

第二方面,提供了一种对象推荐的方法,包括:

获取各个对象分别对应的对象特征;

基于所述各个对象分别对应的对象特征,并通过训练后的推荐模型,预测各个对象对被推荐对象的感兴趣程度;

基于所述各个对象对被推荐对象的感兴趣程度,确定是否为对象推荐所述被推荐对象;

其中,所述训练后的推荐模型是通过第一方面或者第一方面的任一种可能的实现方式所述的基于异常特征处理的模型训练方法所得到的。

第三方面,提供了一种模型训练的装置,包括:

训练集获取模块,用于获取待训练的推荐模型的训练集,所述训练集包括多个训练样本,所述多个训练样本包括第一数量的正样本和第二数量的负样本,每个所述训练样本包括一个样本对象的对象特征,所述对象特征包括至少两个维度的特征值,其中,所述正样本为样本对象对被推荐对象感兴趣的样本,所述待训练的推荐模型用于预测训练样本对应的样本对象对被推荐对象感兴趣的概率;

第一确定模块,用于针对每一维度的每一特征值,确定所述第一数量的正样本中包括该特征值的正样本的第三数量,以及所述第二数量的负样本中包括该特征值的负样本的第四数量;

第二确定模块,用于根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在所述训练集中的异常程度;

训练模块,用于将每一所述训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各所述训练样本以及样本对应的各维度的特征值的异常程度,对所述待训练的推荐模型进行训练。

在一种可能的实现方式中,所述第二确定模块在根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在所述训练集中的异常程度时,具体用于:

针对每一维度的每一特征值,根据所述第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在所述训练集的正样本中的第一占比,根据所述第二数量和该特征值对应的所述第四数量,确定包含该特征值的负样本在所述训练集的负样本中的第二占比,根据所述第一占比和所述第二占比,确定该特征值的目标信息价值IV值;

针对每一维度的每一特征值,根据该特征值对应的第三数量和第四数量,确定包含该特征值的正样本在包含该特征值的所有样本中的第三占比;

获取每一维度对应的正样本占比第一参考值和正样本占比第二参考值;

针对每一维度的每一特征值,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值;

针对每一维度的每一特征值,根据该特征值对应的IV值和该特征值的正样本率目标偏移值,确定该特征值在所述训练集中的异常程度。

在另一种可能的实现方式中,所述第二确定模块在根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值时,具体用于:

根据该特征值对应的第三占比、该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率初始偏移值;

获取所述推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值;

若该特征值的正样本率初始偏移值不小于所述正样本率偏移阈值,则将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值;

若该特征值的正样本率初始偏移值小于所述正样本率偏移阈值,则确定该特征值的正样本率目标偏移值为0。

在另一种可能的实现方式中,对于每一维度,该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值是采用以下方式确定的:

确定各维度分别对应的第四占比,任一维度对应的第四占比为该维度的各个特征值所包含的正样本总数量在该维度的各个特征值所包含的样本总数量的第四占比;

将各维度分别对应的第四占比的均值确定为所述该维度对应的正样本占比第一参考值;

将各维度分别对应的第四占比的标准差确定为所述该维度对应的正样本占比第二参考值。

在另一种可能的实现方式中,所述第二确定模块在根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值时,具体用于:

确定所述第三占比和所述第一参考值之间的差值;

根据所述差值和所述第二参考值的比值,确定该特征值的正样本率目标偏移值。

在另一种可能的实现方式中,所述第二确定模块在根据所述第一占比和所述第二占比,确定该特征值的目标信息价值IV值时,具体用于:

确定所述第一占比和所述第二占比之间的差值;

根据所述差值,确定该特征值的目标IV值。

在另一种可能的实现方式中,所述第二确定模块在根据所述差值,确定该特征值的目标IV值时,具体用于:

根据所述差值,确定该特征值的初始IV值;

获取所述推荐模型所应用的目标场景所对应的特征值的IV阈值;

若所述初始IV值大于所述IV阈值,则将所述初始IV值确定为所述目标IV值;

若所述初始IV值不大于所述IV阈值,则将所述目标IV值确定为0。

在另一种可能的实现方式中,所述训练模块在所述将每一所述训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各所述训练样本以及样本对应的各维度的特征值的异常程度,对所述待训练的推荐模型进行训练时,具体用于:

计算所述每一特征值对应的嵌入特征;

基于所述概率断开与该特征值所属维度所对应的神经元的连接;

基于所述每一特征值对应的嵌入特征对断开处理后的模型进行训练。

第四方面,提供了一种对象推荐的装置,包括:

对象特征获取模块,用于获取各个对象分别对应的对象特征;

预测模块,用于基于所述各个对象分别对应的对象特征,并通过训练后的推荐模型,预测各个对象对被推荐对象的感兴趣程度;

对象推荐确定模块,用于基于所述各个对象对被推荐对象的感兴趣程度,确定是否为对象推荐所述被推荐对象;

其中,所述训练后的推荐模型是通过第三方面或者第三方面任一可能的实现方式所示的基于异常特征处理的模型训练装置所得到的。

第五方面,本申请实施例还提供了一种电子设备,该电子设备包括存储器和处理器,存储器中存储有计算机程序,处理器执行该计算机程序以实现第一方面任一可能的实现方式所提供的模型训练的方法。

第六方面,本申请实施例还提供了一种电子设备,该电子设备包括存储器和处理器,存储器中存储有计算机程序,处理器执行该计算机程序以实现第二方面任一可能的实现方式所提供的对象推荐的方法。

第七方面,本申请实施例还提供了一种计算机可读存储介质,该存储介质中存储有计算机程序,该计算机程序被处理器执行时实现第一方面或者第一方面任一可能的实现方式所提供的模型训练的方法。

第八方面,本申请实施例还提供了一种计算机可读存储介质,该存储介质中存储有计算机程序,该计算机程序被处理器执行时实现第一方面或者第二方面任一可能的实现方式所提供的对象推荐的方法。

第九方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现第一方面或者第一方面任一可能的实现方式所提供的模型训练的方法。

第十方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现第二方面或者第二方面任一可能的实现方式所提供的对象推荐的方法。

本申请实施例提供的技术方案带来的有益效果如下:

本申请实施例提供了一种模型训练的方法、装置、设备及介质,在本申请实施例中,在获取待训练的推荐模型包含多个训练样本的训练集后,以得到训练集中所包含正样本的第一数量和包含负样本的第二数量,并且训练样本所包含的对象特征中包括至少两个维度的特征值,从而以针对每一维度的每一特征值确定包含该特征值的正样本的第三数量和包含该特征值的负样本的第四数量,能够根据确定出的第三数量和第四数量确定出对应的每一维度的每一特征值在训练集中的异常程度,进而通过将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练,能够在训练的过程中,减少模型对异常特征值的拟合程度,以增加模型的泛化能力。

本申请实施例提供了一种对象推荐的方法、装置、设备及介质,在本申请实施例中,在基于各个对象分别对应的对象特征预测各个对象对被推荐对象的感兴趣程度,以确定是否为对象推荐被推荐对象所依据的推荐模型是通过以下方式训练的:在获取待训练的推荐模型包含多个训练样本的训练集后,以得到训练集中所包含正样本的第一数量和包含负样本的第二数量,并且训练样本所包含的对象特征中包括至少两个维度的特征值,从而以针对每一维度的每一特征值确定包含该特征值的正样本的第三数量和包含该特征值的负样本的第四数量,能够根据确定出的第三数量和第四数量确定出对应的每一维度的每一特征值在训练集中的异常程度,进而通过将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练,也即通过这种训练方式,能够在训练的过程中,减少模型对异常特征值的拟合程度,以增加模型的泛化能力,进而可以提升推荐模型进行预测的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1a是本申请实施例提供的一种对象推荐系统的结构示意图;

图1b是本申请实施例提供的另一种对象推荐系统的结构示意图;

图1c是本申请实施例提供的又一种对象推荐系统的结构示意图;

图1d是本申请实施例提供的一种模型训练的方法流程示意图;

图1e是本申请实施例提供的一种训练集的示例图;

图1f是本申请实施例提供的一种基于特征值的异常程度进行模型拟合的示意图;

图2是本申请实施例提供的另一种模型训练的方法流程示意图;

图3a是本申请实施例提供的一种对象推荐的方法流程示意图;

图3b是本申请实施例提供的结合具体应用场景的方法流程示意图;

图4是本申请实施例提供的一种模型训练的装置结构示意图;

图5是本申请实施例提供的一种对象推荐的装置结构示意图;

图6是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或 “耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。在描述多个(两个或两个以上)项目时,如果没有明确限定多个项目之间的关系,这多个项目之间可以是指多个项目中的一个、多个或者全部,例如,对于“参数A包括A1、A2、A3”的描述,可以实现为参数A包括A1或A2或A3,还可以实现为参数A包括参数A1、A2、A3这三项中的至少两项。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。

需要说明的是,在本申请的可选实施例中,所涉及到的对象信息(训练样本中所包含的对象特征以及在应用过程中各个对象的对象特征)等相关的数据,当本申请中的实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。也就是说,本申请实施例中如果涉及到与对象有关的数据,需要经由对象授权同意、相关部门授权同意、且符合国家和地区的相关法律法规和标准的情况下获取的。实施例中如涉及个人信息,所有个人信息的获取需要获得个人的同意,如涉及到敏感信息,需要征得信息主体的单独同意,实施例也是需要在对象授权同意的情况下实施。

在相关技术中,由于模型的某个取值的分布异常,模型在学习过程中严重倾向于该特征,导致模型泛化能力很弱,除了可能是因为是符合业务的分布异常所导致的,还有可能是数据本身存在问题所导致的异常,后者一般是数据链路中某些环节处理有bug所导致的,本申请实施例所要解决的最主要的问题是因为符合业务的分布异常所导致的模型泛化能力弱的问题。

相关的技术方案,主要有两种做法缓解该问题,一种做法是直接不用这个特征,另一种做法是用复制正样本或负样本以降低其异常程度。

第一种做法的问题如下所述。在表一中,异常的是特征a=0的情况,其他特征值1、2是没有问题的。如果不用这个特征,取值a=1、2的信息都无法利用。在RTA业务中,商家的业务有明显的人群倾向,比如上述提到面向85后的游戏业务、还有汽车类业务面向的是有一定经济能力的人群。有些特征对效果影响特别大,如年龄特征,单纯地丢弃特征的做法会对效果影响很大。

表一

第二种做法的问题如下所述,如果给特征a=0复制负样本,复制的量需要根据经验来设定,通常会人为地调整为跟平均分布一致,相当于这个值在训练中并不会起到太多的作用。并且由于复制了样本,会改变其他特征的分布,导致其他问题。比如表二的样本分布,复制特征a=0的样本,使其变为如表三所示的样本分布:

表二

表三

基于表二和表三则可以看到,本来特征b取值为1的样本只有1条,现在变成了4条,正常特征的分布也被改变了。

请参阅图1a,图1a是本申请实施例提供的一种对象推荐系统的结构示意图。如图1a所示的对象推荐系统包括第一服务器110和终端120。

其中,终端120可以包括但不限于是终端120可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备、便携式可穿戴设备或者沉浸式图像显示设备等中的一种或多种。物联网设备可为智能音箱、智能电视、智能空调、或者智能车载设备等中的一种或多种。便携式可穿戴设备可为智能手表、智能手环、或者头戴设备等中的一种或多种。沉浸式图像显示设备包括但不限于增强现实(AugmentedReality,AR)设备、虚拟现实(VirtualReality,VR)设备等。

其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

具体的,该第一服务器110可以作为训练服务器,获取多个包含多个训练样本的训练集并进行训练,得到训练后的推荐模型。然后,可以将训练后的推荐模型部署在第一服务器110或终端120中。则在需要预测某一对象对被推荐对象的感兴趣程度,以确定是否该对象推荐该被推荐的对象时,可以通过终端120获取该对象的对象特征,进而可以基于训练后的推荐模型来确定出该对象对被推荐对象感兴趣的程度。

可以理解的是,对于训练后的推荐模型部署在第一服务器110来说,终端120获取对象特征后,可以将对象特征发送至第一服务器110,第一服务器110则对对象特征进行预测得到该对象对被推荐对象的感兴趣程度,第一服务器110还可以根据感兴趣程度,确定是否为该对象推荐该被推荐对象,也即若确定为该对象推荐该被推荐对象,则终端120接收第一服务器110反馈的该被推对象,并展示该被推荐对象,例如,该被推荐对象为广告1,也即终端120展示该广告1。再者,第一服务器110在确定出该对象对被推荐对象的感兴趣程度后,还可以将感兴趣程度反馈给终端120,由终端120确定是否为其推荐该被推荐对象,若推荐,则终端120显示被推荐对象,也即显示该广告;对于目标大语言模型部署在终端120来说,则终端120可以直接调用训练后的推荐模型,以确定某一对象对被推荐对象的感兴趣程度,并确定是否为该对象推荐该被推荐的对象,从而得到结果,若推荐,也可以显示该被推荐对象。

需要进行说明的是,对象特征可以是通过终端120获取到的,也可以是从其他设备中获取到的,或者,对象特征还可以是通过终端设备120输入的;在此不做限定。

在一些场景中,也可以是通过第一服务器110进行训练,并将训练好的训练后的推荐模型部署在第一服务器110;此外,还可以是通过终端120进行训练,并将训练好的目标大语言模型部署在终端120;此外,还可以是第一服务器110和终端120服务器协同训练,在此不做限定。

请参阅图1b,图1b是本申请实施例提供的另一种推荐系统的结构示意图。如图1b所示的对象推荐系统,包括第一服务器110、终端120和第二服务器130。在本实施例中,第一服务器110可以作为训练的服务器,第二服务器130可以作为对象推荐服务器,也即在第二服务器130中确定某一对象对被推荐对象的感兴趣程度,以确定是否为该对象推荐该被推荐对象,如上例所示,第二服务器130在确定该某一对象对广告1的感兴趣程度,以确定是否为该对象推荐该广告1。

在一些场景中,也可以是第一服务器110,以及终端120或第二服务器130中的至少一个协同训练,在此不做限定。

具体的,可以通过第一服务器110训练得到推荐模型,并将推荐模型部署在第二服务器130中,则可以通过终端120获取某一对象的对象特征,并向第二服务器130发送该对象特征,第二服务器130进而能够向终端120反馈被推荐对象,也即若第二服务器130确定出被其推荐该被推荐对象,则向终端120反馈该被推荐对象。

请参阅图1c,图1c是本申请实施例提供的另一种对象推荐系统的结构示意图。如图1c所示的对象推荐系统,包括第一服务器110、终端120和多个第二服务器130。

其中,第一服务器110可以训练得到各推荐任务对应的推荐模型,并将各推荐任务对应的目标大语言模型部署在不同的第二服务器130中。则可以通过终端120获取对象特征,并确定具体的推荐任务,例如是为对象推荐广告还是为对象推荐商户,从而将对象特征发送至第二服务器130中,则接收到对象特征的第二服务器130则利用其部署的推荐模型对对象特征进行处理,得到被推荐对象的感兴趣程度,并以确定是否为其推荐,并将推荐结果反馈给终端120;也可以在第二服务器130确定出被推荐对象的感兴趣程度后,将感兴趣程度发送给终端120,由其确定是否推荐被推荐对象,若是,则通过终端120显示该被推荐对象,例如显示广告1;

可以理解的是,以上推荐系统是一些示例的情形,并不构成实现本申请实施例的技术方案的所有情形。

基于此,本申请实施例提出一种基于异常特征处理的模型训练的方法,该方法提出了一种特征异常程度的计算方法来衡量每个特征所有取值的异常程度,然后在模型中以异常程度的概率值让对应的神经元哑火,使模型减少对其拟合程度。它不改变数据的分布,而是在模型上去解决这个问题。

这样做相对于上述两种做法的优势是,异常特征中,正常分布的取值可以继续使用(如上例中的a=1、a=2),分布较异常但符合业务情况的特征值也可以被模型利用,不改变原数据分布,不需要人工干预调整。

具体地,在下述实施例中,结合附图1d详细介绍了一种模型训练的方法,以解决由于符合业务的分布异常的情况下所导致的模型泛化能力弱的问题,进一步地,该方法可以由电子设备执行,该电子设备可以为终端设备,也可以为第一服务器,在本申请实施例中不做限定,在下述实施例中以执行主体为电子设备为例进行介绍,其中,该方法可以包括:

步骤S101、获取待训练的推荐模型的训练集。

其中,训练集包括多个训练样本,多个训练样本包括第一数量的正样本和第二数量的负样本。例如,如图1e所示的训练集,其中包含6个训练样本,该6个训练样本可以包含2个正样本和4个负样本,也即第一数量为2,第二数量为4。

具体地,每个训练样本包括一个样本对象的对象特征,对象特征包括至少两个维度的特征值。在本申请实施例中,不同维度的特征值表征为不同特征的特征值。例如,如图1e所示,针对一个样本对象,对象特征包括5个维度的特征值,例如,1、2、1、3、5分别表征在a,b,c,d,e五个维度的特征值。

其中,正样本为样本对象对被推荐对象感兴趣的样本,负样本为样本对象对被推荐对象不感兴趣的样本。在本申请实施例中,正样本可以为标签(Label)为1的样本,负样本可以为Label为0的样本。

进一步地,待训练的推荐模型用于预测训练样本对应的样本对象对被推荐对象感兴趣的概率。在本申请实施例中,待训练的推荐模型可以为初始模型,以通过本申请实施例所示的方式进行训练,以得到训练后的推荐模型,待训练的推荐模型还可以是初始训练后的推荐模型,以通过本申请实施例所示的方式进行更新,以得到更新后的推荐模型,在本申请实施例中不做限定。

如上可知,推荐系统可以应用于各个场景,也即被推荐对象可以包括广告、商户等。

步骤S102、针对每一维度的每一特征值,确定第一数量的正样本中包括该特征值的正样本的第三数量,以及第二数量的负样本中包括该特征值的负样本的第四数量。

例如,如图1e所示,针对于a特征维度,包含的特征值分别为0,1,2,针对b特征维度,包含的特征值分别为1,2,3,针对于c特征维度,包含的特征值分别为1,2,3,针对于d特征维度,包含的特征值分别为1,3,针对于e特征维度,包含的特征值分别为0,1,5;以a特征维度为例,从第一数量的正样本中确定包含特征值0的正样本的第三数量,也即1,以及确定第二数量的负样本中包含0的负样本的第四数量,也即2;从第一数量的正样本中确定包含特征值1的正样本的第三数量,也即1,以及确定第二数量的负样本中包含1的负样本的第四数量,也即1;从第一数量的正样本中确定包含特征值2的正样本的第三数量,也即0,以及确定第二数量的负样本中包含2的负样本的第四数量,也即1。

需要进行说明的是,针对每一维度的每一特征值,包含该特征值的正样本的第三数量和包含该特征值的负样本的第四数量可以分别从基于第一数量的正样本和第二数量的负样本所确定,还可以从存储中获取,还可以是由管理对象输入的,在本申请实施例中不做限定。

步骤S103、根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在训练集中的异常程度。

对于本申请实施例,在得到各维度的每一特征值对应的第三数量和第四数量后,确定每一维度的每一特征值的异常程度,接上例,针对特征a维度,确定出特征值为0,1,2分别在训练集中的异常程度。

步骤S104、将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练。

对于本申请实施例,待训练的推荐模型中包含异常处理层,在每一训练样本的每一特征值对应的异常程度

下面以最简单的深度神经网络(Deep Neural Networks,DNN)为例。数据首先会输入到异常处理层,该网络会检查当前输入的特征的特征值对应的

具体地,在本申请实施例中,步骤S101中获取待训练的推荐模型的训练集可以如本申请实施例所示的方式,也可以如相关技术所示的方式,以得到待训练的推荐模型的训练集,在本申请实施例中不做限定,进一步地,若待训练的推荐模型为待更新的模型,也即在得到该待更新的模型时本身即存在训练样本,可以称为原始训练样本,也可以说明的是,本申请实施例中所示的训练集中的训练样本可以为该原始训练样本,也可以为新获取的训练样本,还可以部分为原始训练样本,部分为新获取的训练样本,在本申请实施例中不做限定。

进一步地,针对每一维度的每一特征值,确定该特征值所对应的第三数量,以及第四数量后,确定该特征值在训练集中的异常程度。

具体地,如图2所示,步骤S103中根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在训练集中的异常程度,具体可以包括:步骤S1031、步骤S1032、步骤S1033、步骤S1034以及步骤S1035,其中,

步骤S1031、针对每一维度的每一特征值,根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,根据第一占比和第二占比,确定该特征值的目标信息价值(Information Value,IV)值。

对于本申请实施例,针对每一维度的每一特征值,可以先根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,然后再根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,也可以先根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,然后在根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,还可以先根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,同时根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,在本申请实施例中不做限定。

具体地,对一份

基于上述实施例,针对每一维度的每一特征值,第一占比通过

具体地,步骤S1031中根据第一占比和第二占比,确定该特征值的目标信息价值IV值,具体可以包括:确定第一占比和第二占比之间的差值;根据差值,确定该特征值的目标IV值。也就是说,在得到第一占比

具体地,根据差值,确定该特征值的目标IV值,具体可以包括:根据差值,确定该特征值的初始IV值;获取推荐模型所应用的目标场景所对应的特征值的IV阈值;若初始IV值大于IV阈值,则将初始IV值确定为目标IV值;若初始IV值不大于IV阈值,则将目标IV值确定为0。

具体地,通过下述公式(1)确定该特征值的初始IV值,其中,

, 公式(1);

其中,

再进一步地,在本申请实施例中,针对每一维度的每一特征值,其所对应的初始IV值可以作为该特征值的目标特征值,还可以根据该特征值对应的初始IV值与该特征值的IV阈值之间的关系,以确定出目标IV值。

进一步地,在本申请实施例中,推荐模型所应用的场景不同,其所对应的特征值的IV阈值也不同,例如,通常在RTA场景中,特征值的IV阈值可以为0.2。在本申请实施例中,各个场景分别对应的IV阈值可以在本地存储中存储,也可在其它存储设备中存储,可以为管理对象所输入的,在本申请实施例中不做限定。

需要进行说明的是,针对同一场景,不同的维度的特征值所对应的IV阈值可以相同,也可以部分相同,还可以不同,相同维度的不同特征值也可以相同,也可以部分相同,还可以均不相同,在本申请实施例中不做限定。

具体地,在本申请实施例中,以特征值的IV阈值为0.2为例,通过公式(2)介绍了根据该特征值对应的初始IV值与该特征值的IV阈值之间的关系,以确定出目标IV值。其中,

, 公式(2);

其中,

通常在RTA场景中,特征值的IV会在0.2以内,整体特征IV值在0.3左右。并且在RTA业务中,通常无法单用IV值一个指标衡量特征的问题,还需结合正样本率,因此本专利结合IV和正样本率构造出异常程度计算方式,非简单将其相加,而需考虑在具体业务中IV值的范围超过0.2算异常,在公式(2)中做了区别处理。

步骤S1032、针对每一维度的每一特征值,根据该特征值对应的第三数量和第四数量,确定包含该特征值的正样本在包含该特征值的所有样本中的第三占比。

具体地,在得到该特征值对应的第三数量,也即包含该特征值

其中,

, 公式(3);

其中,

需要进行说明的是,步骤S1032可以在步骤S1031之前执行,还可以在步骤S1031之后执行,还可以与步骤S1031同时执行,在本申请实施例中不做限定。

步骤S1033、获取每一维度对应的正样本占比第一参考值和正样本占比第二参考值。

需要进行说明的是,步骤S1033可以在步骤S1032之前执行,也可以在步骤S1032之后执行,还可以与步骤S1032同时执行,在本申请实施例中不做限定。

具体地,对于每一维度,该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值是采用以下方式确定的:确定各维度分别对应的第四占比,任一维度对应的第四占比为该维度的各个特征值所包含的正样本总数量在该维度的各个特征值所包含的样本总数量的第四占比;将各维度分别对应的第四占比的均值确定为该维度对应的正样本占比第一参考值;将各维度分别对应的第四占比的标准差确定为该维度对应的正样本占比第二参考值。

具体地,通过下述公式(4)确定各维度分别对应的第四占比,其中,

=/>

其中,P

进一步地,在得到第i维特征所对应的第四占比后,可以得到其所对应的均值

步骤S1034、针对每一维度的每一特征值,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值。

具体地,针对第i维度,在得到该维度所对应的均值

具体地,步骤S1034中根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值,具体可以包括:确定第三占比和第一参考值之间的差值;根据差值和第二参考值的比值,确定该特征值的正样本率目标偏移值。其中,该特征值的正样本率目标偏移值和比值(差值和第二参考值的比值)呈正相关,在本申请实施例中,基于

具体地,步骤S1034中根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值,具体可以包括:根据该特征值对应的第三占比、该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率初始偏移值;获取推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值;若该特征值的正样本率初始偏移值不小于正样本率偏移阈值,则将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值;若该特征值的正样本率初始偏移值小于正样本率偏移阈值,则确定该特征值的正样本率目标偏移值为0。

具体地,通过下述公式(5)确定该特征值的正样本初始偏移值,其中,

=/>

其中,

进一步地,在得到该特征值的正样本率初始偏移值后,可以将该特征值的正样本率初始偏移值以后,可以将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值,也可以通过获取推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值,以根据该特征值的正样本率初始偏移值以及该特征值的正样本率偏移阈值,确定出该特征值的正样本目标偏移值。

进一步地,在本申请实施例中,推荐模型所应用的场景不同,其所对应的特征值的正样本率偏移阈值也可能不同,例如,通常在RTA场景中,特征值的正样本率偏移阈值可以2。在本申请实施例中,各个场景分别对应的正样本偏移阈值可以在本地存储中存储,也可在其它存储设备中存储,可以为管理对象所输入的,在本申请实施例中不做限定。

需要进行说明的是,针对同一场景,不同的维度的特征值所对应的正样本偏移阈值可以相同,也可以部分相同,还可以不同,相同维度的不同特征值也可以相同,也可以部分相同,还可以均不相同,在本申请实施例中不做限定。

具体地,以该特征值的正样本率偏移阈值为2为例进行介绍,根据该特征值的正样本率初始偏移值以及该特征值的正样本率偏移阈值,确定出该特征值的正样本目标偏移值,可以如公式(6)所示,其中,

, 公式(6);

其中,

步骤S1035、针对每一维度的每一特征值,根据该特征值对应的IV值和该特征值的正样本率目标偏移值,确定该特征值在训练集中的异常程度。

具体地,在本申请实施例中,对每个特征的特征值,都有一个异常程度(通过

具体地,在本申请实施例中,通过下述公式(7),确定该特征值在训练集中的异常程度,其中,

, 公式(7);

其中,

其中,

其中,

进一步地,在通过上述实施例得到各个特征值在训练集中的异常程度后,在本申请实施例中,步骤S104中将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练,具体可以包括:计算每一特征值对应的嵌入特征;基于概率,断开与该特征值所属维度所对应的神经元的连接;基于每一特征值对应的嵌入特征对断开处理后的模型进行训练。其中,可以基于概率断开与该特征值所属维度所对应的神经元的连接,可以理解为,将概率作为特征值对应的神经元断开概率,以执行神经元的断开操作。

具体地,在通过上述实施例得到每个特征值的异常程度

下面以最简单的DNN为例。训练样本首先会输入到异常处理层,该网络会检查当前输入的特征的特征值对应的

例如,继续如图1f中所示,将各个维度(a,b,c,d,e)的特征值1,0,2,3,1通过Embedding层处理,得到各自对应的Embedding向量,其中,黑色的Embedding向量是各正常特征值对应的向量,而白色的没有跟上层网络连接的Embedding向量是特征a取值为1时是异常值,按照一定的概率使该Embedding向量断开连接,这样避免了模型过度拟合该异常值而带来偏差。

进一步地,在本申请实施例中,通过确定特征值的异常程度,从而决定该特征值对应的神经元以一定的概率断开链接,减少模型对异常值的拟合程度,得到更好的泛化性能。

进一步地,上述实施例以训练的角度介绍一种模型训练的方法,以提升模型对训练集中的异常值的拟合程度,以使得训练后的模型有更好的泛化能力,并且使得对象推荐的准确度也更高。

在下述实施例中,从应用的角度中介绍了基于上述训练后的推荐模型进行对象推荐的方式。

本申请实施例还提供了一种对象推荐的方法,如图3a所示,该对象推荐的方法可以由电子设备执行,该电子设备可以为终端设备,也可以为第二服务器,在本申请实施例中不做限定,在下述实施例中以电子设备为执行主体为例进行介绍,其中,该对象推荐的方法可以包括:

步骤S301、获取各个对象分别对应的对象特征。

对于本申请实施例,一个对象的对象特征至少包含两个维度的特征值,如上训练的过程中,一个对象的对象特征至少包含a特征、b特征、c特征、d特征和e特征分别对应的特征值。

例如,获取对象1对应的对象特征以及对象2对应的对象特征,也即获取对象1在a特征、b特征、c特征、d特征和e特征分别对应的特征值,以及,对象2在a特征、b特征、c特征、d特征和e特征分别对应的特征值。

步骤S302、基于各个对象分别对应的对象特征,并通过训练后的推荐模型,预测各个对象对被推荐对象的感兴趣程度。

其中,训练后的推荐模型是通过上述方法实施例所示的基于异常特征处理的模型训练方法所得到的。在本申请实施例中,得到训练后的推荐模型的训练方式具体详见上述实施例。

步骤S303、基于各个对象对被推荐对象的感兴趣程度,确定是否为对象推荐被推荐对象。

需要进行说明的是,被推荐对象可以为任意对象,例如,被推荐对象可以为商户、广告等。

对于本申请实施例,通过上述训练后的推荐模型得到各个对象对被推荐对象的感兴趣程度,以确定是否为对象推荐被推荐对象。在本申请实施例,针对某一对象,若确定出该对象对被推荐对象的感兴趣程度大于预设感兴趣阈值,则可以将被推荐对象(例如目标广告)推荐给该对象,反之,则不为该对象推荐该被推荐对象(例如目标广告)。

在上述实施例的基础上,通过具体的实例介绍模型训练的方法,以及对象推荐的方法,在介绍对象推荐的方法的过程中,将被推荐对象以目标广告为例进行介绍,如图3b所示,具体如下所示:

步骤S401、第一服务器获取待训练的推荐模型的训练集。

其中,训练集包括多个训练样本,多个训练样本包括第一数量(

步骤S402、针对每一维度的每一特征值,第一服务器确定第一数量的正样本中包括该特征值的正样本的第三数量,以及第二数量的负样本中包括该特征值的负样本的第四数量。

其中,各维特征为

步骤S403、针对每一维度的每一特征值,第一服务器根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,确定第一占比和第二占比之间的差值;根据差值,确定该特征值的初始IV值;获取推荐模型所应用的目标场景所对应的特征值的IV阈值;若初始IV值大于IV阈值,则将初始IV值确定为目标IV值;若初始IV值不大于IV阈值,则将目标IV值确定为0。

具体地,通过下述公式(1)确定该特征值的初始IV值,其中,

, 公式(1);

其中,

具体地,在本申请实施例中,以特征值的IV阈值为0.2为例,该特征值

, 公式(2);

其中,

步骤S404、针对每一维度的每一特征值,第一服务器根据该特征值对应的第三数量和第四数量,确定包含该特征值的正样本在包含该特征值的所有样本中的第三占比;根据该特征值对应的第三占比、该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率初始偏移值;获取推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值;若该特征值的正样本率初始偏移值不小于正样本率偏移阈值,则将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值;若该特征值的正样本率初始偏移值小于正样本率偏移阈值,则确定该特征值的正样本率目标偏移值为0。

具体地,通过下述公式(5)确定该特征值的正样本初始偏移值,其中,

=/>

其中,

具体地,以该特征值的正样本率偏移阈值为2为例进行介绍,根据该特征值的正样本率初始偏移值以及该特征值的正样本率偏移阈值,确定出该特征值的正样本目标偏移值,可以如公式(6)所示,其中,

, 公式(6);

其中,

步骤S405、针对每一维度的每一特征值,第一服务器根据该特征值对应的IV值和该特征值的正样本率目标偏移值,确定该特征值在训练集中的异常程度。

具体地,在本申请实施例中,通过下述公式(7),确定该特征值在训练集中的异常程度,其中,

, 公式(7);

其中,

其中,

其中,

步骤S406、第一服务器计算每一特征值对应的嵌入特征;基于概率断开与该特征值所属维度所对应的神经元的连接;基于每一特征值对应的嵌入特征对断开处理后的模型进行训练,以得到训练后的推荐模型。

步骤S407、将训练后的推荐模型部署在第二服务器中;

步骤S408、终端设备获取该对象对应的对象特征,并将该对象对应的对象特征发送给第二服务器;

步骤S409、第二服务器根据该对象对应的对象特征,并通过训练后的推荐模型,预测该对象对目标对象的感兴趣程度,基于感兴趣程度,确定是否为该对象推荐目标广告。

步骤S410、若确定为该对象推荐目标广告,则将该目标广告推送至终端设备;

步骤S411、终端设备显示该目标广告。

基于与本申请实施例提供的模型训练的方法相同的原理,本申请实施例还提供了一种模型训练的装置,该装置可以实现为电子设备,如图4所示,该装置40可以包括:训练集获取模块41、第一确定模块42、第二确定模块43以及训练模块44,其中,

训练集获取模块41,用于获取待训练的推荐模型的训练集,训练集包括多个训练样本,多个训练样本包括第一数量的正样本和第二数量的负样本,每个训练样本包括一个样本对象的对象特征,对象特征包括至少两个维度的特征值,其中,正样本为样本对象对被推荐对象感兴趣的样本,待训练的推荐模型用于预测训练样本对应的样本对象对被推荐对象感兴趣的概率;

第一确定模块42,用于针对每一维度的每一特征值,确定第一数量的正样本中包括该特征值的正样本的第三数量,以及第二数量的负样本中包括该特征值的负样本的第四数量;

第二确定模块43,用于根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在训练集中的异常程度;

训练模块44,用于将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练。

本申请实施例的一种可能的实现方式,第二确定模块43在根据各维度的每一特征值对应的第三数量和第四数量,确定每一维度的每一特征值在训练集中的异常程度时,具体用于:

针对每一维度的每一特征值,根据第一数量和该特征值对应的第三数量,确定包含该特征值的正样本在训练集的正样本中的第一占比,根据第二数量和该特征值对应的第四数量,确定包含该特征值的负样本在训练集的负样本中的第二占比,根据第一占比和第二占比,确定该特征值的目标信息价值IV值;

针对每一维度的每一特征值,根据该特征值对应的第三数量和第四数量,确定包含该特征值的正样本在包含该特征值的所有样本中的第三占比;

获取每一维度对应的正样本占比第一参考值和正样本占比第二参考值;

针对每一维度的每一特征值,根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值;

针对每一维度的每一特征值,根据该特征值对应的IV值和该特征值的正样本率目标偏移值,确定该特征值在训练集中的异常程度。

本申请实施例的另一种可能的实现方式,第二确定模块43在根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值时,具体用于:

根据该特征值对应的第三占比和、该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率初始偏移值;

获取推荐模型所应用的目标场景所对应的特征值的正样本率偏移阈值;

若该特征值的正样本率初始偏移值不小于正样本率偏移阈值,则将该特征值的正样本率初始偏移值确定为该特征值的正样本率目标偏移值;

若该特征值的正样本率初始偏移值小于正样本率偏移阈值,则确定该特征值的正样本率目标偏移值为0。

本申请实施例的一种可能的实现方式,对于每一维度,该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值是采用以下方式确定的:

确定各维度分别对应的第四占比,任一维度对应的第四占比为该维度的各个特征值所包含的正样本总数量在该维度的各个特征值所包含的样本总数量的第四占比;

将各维度分别对应的第四占比的均值确定为该维度对应的正样本占比第一参考值;

将各维度分别对应的第四占比的标准差确定为该维度对应的正样本占比第二参考值。

本申请实施例的一种可能的实现方式,第二确定模块43在根据该特征值对应的第三占比和该维度对应的正样本占比第一参考值和该维度对应的正样本占比第二参考值,确定该特征值的正样本率目标偏移值时,具体用于:

确定第三占比和第一参考值之间的差值;

根据差值和第二参考值的比值,确定该特征值的正样本率目标偏移值。

本申请实施例的一种可能的实现方式,第二确定模块43在根据第一占比和第二占比,确定该特征值的目标信息价值IV值时,具体用于:

确定第一占比和第二占比之间的差值;

根据差值,确定该特征值的目标IV值。

本申请实施例的一种可能的实现方式,第二确定模块43在根据差值,确定该特征值的目标IV值时,具体用于:

根据差值,确定该特征值的初始IV值;

获取推荐模型所应用的目标场景所对应的特征值的IV阈值;

若初始IV值大于IV阈值,则将初始IV值确定为目标IV值;

若初始IV值不大于IV阈值,则将目标IV值确定为0。

本申请实施例的一种可能的实现方式,训练模块44在将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练时,具体用于:

计算每一特征值对应的嵌入特征;

基于概率断开与该特征值所属维度所对应的神经元的连接;

基于每一特征值对应的嵌入特征对断开处理后的模型进行训练。

本申请实施例提供了一种模型训练的装置,在本申请实施例中,在获取待训练的推荐模型包含多个训练样本的训练集后,以得到训练集中所包含正样本的第一数量和包含负样本的第二数量,并且训练样本所包含的对象特征中包括至少两个维度的特征值,从而以针对每一维度的每一特征值确定包含该特征值的正样本的第三数量和包含该特征值的负样本的第四数量,能够根据确定出的第三数量和第四数量确定出对应的每一维度的每一特征值在训练集中的异常程度,进而通过将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练,能够在训练的过程中,减少模型对异常特征值的拟合程度,以增加模型的泛化能力。

基于与本申请实施例提供的对象推荐的方法相同的原理,本申请实施例还提供了一种对象推荐的装置,该装置可以实现为电子设备,如图5所示,该装置50可以包括:对象特征获取模块51、预测模块52、以及对象推荐确定模块53,其中,

对象特征获取模块51,用于获取各个对象分别对应的对象特征;

预测模块52,用于基于各个对象分别对应的对象特征,并通过训练后的推荐模型,预测各个对象对被推荐对象的感兴趣程度;

对象推荐确定模块53,用于基于各个对象对被推荐对象的感兴趣程度,确定是否为对象推荐被推荐对象;

其中,训练后的推荐模型是通过上述实施例所示的模型训练装置所得到的。

本申请实施例提供了一种对象推荐的装置,在本申请实施例中,在基于各个对象分别对应的对象特征预测各个对象对被推荐对象的感兴趣程度,以确定是否为对象推荐被推荐对象所依据的推荐模型是通过以下方式训练的:在获取待训练的推荐模型包含多个训练样本的训练集后,以得到训练集中所包含正样本的第一数量和包含负样本的第二数量,并且训练样本所包含的对象特征中包括至少两个维度的特征值,从而以针对每一维度的每一特征值确定包含该特征值的正样本的第三数量和包含该特征值的负样本的第四数量,能够根据确定出的第三数量和第四数量确定出对应的每一维度的每一特征值在训练集中的异常程度,进而通过将每一训练样本的每一特征值对应的异常程度作为该样本的该特征值不参与模型预测的概率,基于各训练样本以及样本对应的各维度的特征值的异常程度,对待训练的推荐模型进行训练,也即通过这种训练方式,能够在训练的过程中,减少模型对异常特征值的拟合程度,以增加模型的泛化能力,进而可以提升推荐模型进行预测的准确度。

本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。

图6示出了本申请实施例所适用的一种电子设备的结构示意图,如图6所示,该电子设备可以是服务器或用户终端,该电子设备可以用于实施本申请任一实施例中提供的方法。也就是说,该电子设备可以用于实施本申请任一实施例中提供的模型训练的方法,也可以用于实施本申请任一实施例中提供的对象推荐的方法。进一步地,用于实施模型训练的方法的电子设备和用于实施例对象推荐的电子设备可以为相同的电子设备,也可以为不同的电子设备,在本申请实施例中不做限定。

如图6中所示,该电子设备2000主要可以包括至少一个处理器2001(图6中示出了一个)、存储器2002、通信模块2003和输入/输出接口2004等组件,可选的,各组件之间可以通过总线2005实现连接通信。需要说明的是,图6中示出的该电子设备2000的结构只是示意性的,并不构成对本申请实施例提供的方法所适用的电子设备的限定。

其中,存储器2002可以用于存储操作系统和应用程序等,应用程序可以包括在被处理器2001调用时实现本申请实施例所示方法的计算机程序,还可以包括用于实现其他功能或服务的程序。存储器2002可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和计算机程序的其他类型的动态存储设备,也可以是EEPROM(ElectricallyErasable Programmable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(CompactDisc Read Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

处理器2001通过总线2005与存储器2002连接,通过调用存储器2002中所存储的应用程序实现相应的功能。其中,处理器2001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application Specific Integrated Circuit,专用集成电路),FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合,其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器2001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。

电子设备2000可以通过通信模块2003(可以包括但不限于网络接口等组件)连接到网络,以通过网络与其它设备(如用户终端或服务器等)的通信,实现数据的交互,如向其他设备发送数据或从其他设备接收数据。其中,通信模块2003可以包括有线网络接口和/或无线网络接口等,即通信模块可以包括有线通信模块或无线通信模块中的至少一项。

电子设备2000可以通过输入/输出接口2004可以连接所需要的输入/输出设备,如键盘、显示设备等,电子设备200自身可以具有显示设备,还可以通过接口2004外接其他显示设备。可选的,通过该接口2004还可以连接存储装置,如硬盘等,以可以将电子设备2000中的数据存储到存储装置中,或者读取存储装置中的数据,还可以将存储装置中的数据存储到存储器2002中。可以理解的,输入/输出接口2004可以是有线接口,也可以是无线接口。根据实际应用场景的不同,与输入/输出接口2004连接的设备,可以是电子设备2000的组成部分,也可以是在需要时与电子设备2000连接的外接设备。

用于连接各组件的总线2005可以包括一通路,在上述组件之间传送信息。总线2005可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。根据功能的不同,总线2005可以分为地址总线、数据总线、控制总线等。

可选的,对于本申请实施例所提供的方案而言,存储器2002可以用于存储执行本申请方案的计算机程序,并由处理器2001来运行,处理器2001运行该计算机程序时实现本申请实施例提供的方法或装置的动作。

基于与本申请实施例提供的方法相同的原理,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的相应内容。

本申请实施例还提供了一种计算机程序产品,该产品包括计算机程序,该计算机程序被处理器执行时可实现前述方法实施例的相应内容。

本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。

应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。

以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

相关技术
  • 用于在真空沉积工艺中在基板上进行材料沉积的设备、用于在基板上进行溅射沉积的系统和用于制造用于在基板上进行材料沉积的设备的方法
  • 用于在基板上形成层的设备和在基板上形成层的方法
  • 用于处理运动的成件货物的设备和方法,具有用于处理运动的成件货物的设备的输送、处理和/或包装机组
  • 用于闸入基板的处理装置和方法
  • 基板处理设备和检查方法
  • 用于将基板装载到真空处理模块中的设备和方法、用于为真空处理模块中的真空沉积工艺而处理基板的设备和方法和用于对基板的真空处理的系统
  • 用于真空腔室的热处理设备、用于沉积材料于柔性基板上的沉积设备、在真空腔室中热处理柔性基板的方法、及处理柔性基板的方法
技术分类

06120116544906