掌桥专利:专业的专利平台
掌桥专利
首页

一种信息推荐方法及相关装置

文献发布时间:2024-04-18 19:58:30


一种信息推荐方法及相关装置

技术领域

本申请涉及人工智能技术领域,尤其涉及一种信息推荐方法及相关装置。

背景技术

随着互联网电子商务的不断发展,越来越多的消费者选择在线上平台进行商品购物。为提高消费者的购买率,各线上平台会针对消费者的历史购买记录预测消费者感兴趣的商品,然后通过页面显示、信息推送等方式进行商品推荐。

然而,对于历史购买记录较少或者无历史购买记录的用户,往往根据用户的属性信息(例如年龄、性别等)预测用户感兴趣商品,但是对于历史购买记录较少或者无历史购买记录的用户预测的感兴趣商品的准确性较差。

发明内容

本申请实施例提供了一种信息推荐方法以及相关装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

本申请的一方面提供一种信息推荐方法,包括:

获取M个第一对象及N个第二对象,其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,N个第二对象携带N个第二属性信息,M、N、L均为大于1的整数,L小于M;

将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率,其中,第一行为预测模型为根据机器学习分类模型构建的;

根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组,其中,K个配对组携带K个配对信息,K为大于1的整数;

将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率,其中,第二行为预测模型为根据机器学习分类模型构建的;

根据N个第三概率从N个第二对象中确定信息推荐对象;

将第二目标的信息推荐至信息推荐对象。

本申请的另一方面提供了一种信息推荐装置,包括:

对象获取模块,用于获取M个第一对象及N个第二对象,其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,N个第二对象携带N个第二属性信息,M、N、L均为大于1的整数,L小于M;

第一行为预测模块,用于将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率,其中,第一行为预测模型为根据机器学习分类模型构建的;

对象匹配模块,用于根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组,其中,K个配对组携带K个配对信息,K为大于1的整数;

第二行为预测模块,用于将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率,其中,第二行为预测模型为根据机器学习分类模型构建的;

信息推荐对象确定模块,用于根据N个第三概率从N个第二对象中确定信息推荐对象;

信息推荐模块,用于将第二目标的信息推荐至信息推荐对象。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

根据M个第一概率计算M个第一对象对应的M个第一趋势分数;

根据N个第二概率计算N个第二对象对应的N个第二趋势分数;

根据M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组,其中,每个分组对应一个趋势分数区间;

将从K个分组中提取相同数量的第一对象及第二对象进行匹配。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

根据M个第一趋势分数及N个第二趋势分数,生成K个趋势分数区间;

根据K个趋势分数区间、M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组,其中,每个分组内的第一对象对应的第一趋势分数及第二对象对应的第二趋势分数在分组对应的趋势分数区间内。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

获取K个分组中每个分组的对象数量阈值;

根据对象数量阈值,从每个分组中的第一对象提取对象数量阈值的第一提取对象,以及从分组中的第二对象提取对象数量阈值的第二提取对象;

将每个分组中的第一提取对象与第二提取对象进行匹配。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

获取每个分组中第一对象数量及第二对象数量;

若第一对象数量小于第二对象数量,则将第一对象数量作为分组的对象数量阈值;

若第一对象数量大于等于第二对象数量,则将第二对象数量作为分组的对象数量阈值。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

对分组中的第一对象进行标号,得到分组中的每个第一对象对应的标号值;

根据每个第一对象对应的标号值,对分组中的第一对象进行排序,得到第一标号队列;

根据第一标号队列中第一对象的顺序及对象数量阈值,确定第一提取对象;

对分组中的第二对象进行标号,得到分组中的每个第二对象对应的标号值;

根据每个第二对象对应的标号值,对分组中的第二对象进行排序,得到第二标号队列;

根据第二标号队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

根据分组中每个第一对象对应的第一趋势分数,对分组中的第一对象进行排序,生成第一分数队列;

根据第一分数队列中第一对象的顺序及对象数量阈值,确定第一提取对象;

根据分组中每个第二对象对应的第二趋势分数,对分组中的第二对象进行排序,生成第二分数队列;

根据第二分数队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

在本申请实施例的另一种实现方式中,对象匹配模块,还用于:

将M个第一概率乘以第一阈值,得到M个第一乘积值;

将M个第一乘积值进行向下取整,得到M个第一趋势分数;

根据N个第二概率计算N个第二对象对应的N个第二趋势分数,包括将N个第二概率乘以第一阈值,得到N个第二乘积值;

将N个第二乘积值进行向下取整,得到N个第二趋势分数。

在本申请实施例的另一种实现方式中,信息推荐对象确定模块,还用于:

将N个第三概率中大于第三概率阈值的第二对象中确定为信息推荐对象。

本申请的另一方面提供了一种计算机设备,包括:

存储器、收发器、处理器以及总线系统;

其中,存储器用于存储程序;

处理器用于执行存储器中的程序,包括执行上述各方面的方法;

总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。

本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。

本申请的另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方面所提供的方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请提供了一种信息推荐方法以及相关装置,其方法包括:首先,获取M个第一对象及N个第二对象,其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,N个第二对象携带N个第二属性信息;其次,将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率,其中,第一行为预测模型为根据机器学习分类模型构建的;再次,根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组,其中,K个配对组携带K个配对信息;接着,将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率,其中,第二行为预测模型为根据机器学习分类模型构建的;然后,根据N个第三概率从N个第二对象中确定信息推荐对象;最后,将第二目标的信息推荐至信息推荐对象。本申请实施例提供的方法通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

附图说明

图1为本申请某一实施例提供的信息推荐系统的一个架构示意图;

图2为本申请某一实施例提供的信息推荐方法的流程图;

图3为本申请另一实施例提供的信息推荐方法的流程图;

图4为本申请另一实施例提供的信息推荐方法的流程图;

图5为本申请另一实施例提供的信息推荐方法的流程图;

图6为本申请另一实施例提供的信息推荐方法的流程图;

图7为本申请另一实施例提供的信息推荐方法的流程图;

图8为本申请另一实施例提供的信息推荐方法的流程图;

图9为本申请另一实施例提供的信息推荐方法的流程图;

图10为本申请另一实施例提供的信息推荐方法的流程图;

图11为本申请又一实施例提供的信息推荐方法的流程图;

图12为本申请某一实施例提供的信息推荐方法的结构图;

图13为本申请某一实施例提供的信息推荐装置的结构示意图;

图14为本申请某一实施例提供的服务器结构示意图。

具体实施方式

本申请实施例提供了一种信息推荐方法,第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

为便于理解本申请实施例提供的技术方案,这里先对本申请实施例使用的一些关键名词进行解释:

协同过滤:协同过滤是指利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

互补商品:两种商品共同满足一种欲望。对于特定的两个商品A和B,用户在购买商品A后,会更加有意愿去购买商品B,则称商品A与商品B具有互补效应。商品A是商品B的互补商品,商品B是商品A的互补商品。例如,羽毛球和羽毛球拍互为互补商品,汽车和汽油互为互补商品,牙刷和牙膏互为互补商品。

替代商品:两种商品因为功能相似而可以互相代替满足消费者的同一种欲望或需求。对于特定的两个商品A和B,用户在购买商品A后,会降低购买商品B的意愿,称商品A与商品B具有替代效应,商品A是商品B的替代商品,商品B是商品A的替代商品。例如,牛肉和羊肉互为替代商品,苹果和梨互为替代商品,VCD和DVD互为替代商品。

分布式计算:一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论的程序。

在线上平台进行商品售卖时,线上平台得到消费者授权历史购买记录并且对历史购买记录进行隐私处理的情况下,通过历史购买记录预测消费者感兴趣的商品,将预测到的感兴趣商品在平台特定位置进行推送,或者将预测到的感兴趣的商品通过信息推送的方式发送给消费者,以增强消费者的购买率。

现有技术在感兴趣商品预测时,对于消费者的历史购买记录具有很大的依靠性,然而,对于没有历史购买记录或者历史购买记录较少的潜在消费者无法准确预测其感兴趣商品,将预测到的感兴趣较弱的商品进行信息推送,会导致信息推送资源的浪费。

可以理解的是,首先,现有技术无法快速对大规模的销售数据得出互补商品复购影响的分析。其次,现有技术不能从时间的维度说明互补商品对复购的影响,仅采用静态的方式进行用户购买率的预测,不能实现动态最优。

现有技术仅依据用户的购买概率对用户进行推销,没有考虑互补效应与替代效应。当推销的产品存在替代效应时,会导致销量的下降。

本申请实施例提供了一种信息推荐方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

为了便于理解,请参阅图1,图1为本申请实施例中信息推荐方法的应用环境图,如图1所示,本申请实施例中信息推荐方法应用于信息推荐系统。信息推荐系统包括:服务器和终端设备;其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端和服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。

服务器首先获取M个第一对象及N个第二对象,其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,第一目标与第二目标为互补产品;其次,服务器将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率,其中,第一行为预测模型为根据机器学习分类模型构建的,第一概率用于表征第一对象产生第一行为信息的概率,第二概率用于表征第二对象产生第一行为信息的概率;再次,服务器根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组,其中,K个配对组携带K个配对信息,配对信息用于表征第一对象与第二对象的匹配情况,每个配对组包括至少一个第一对象及至少一个第二对象;接着,服务器将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率,其中,第二行为预测模型为根据机器学习分类模型构建的,第三概率用于表征N个第二对象产生第二行为信息的概率;然后,服务器根据N个第三概率从N个第二对象中确定信息推荐对象;最后,服务器将第二目标的信息推荐至信息推荐对象。

下面将从服务器的角度,对本申请中信息推荐方法进行介绍。请参阅图2,本申请实施例提供的信息推荐方法包括:步骤S110至步骤S160。具体的:

S110、获取M个第一对象及N个第二对象。

其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,第一目标与第二目标为互补产品,N个第二对象携带N个第二属性信息,M、N、L均为大于1的整数,L小于M。

需要说明的是,本申请提到的所有与用户有关的信息均为用户授权后经过隐私保护处理后得到的信息。

可以理解的是,M个第一对象包括两类:一类是携带第一属性信息、第一行为信息和第二行为信息的对象,另一类是携带第一属性信息和第一行为信息的对象。第二对象仅仅携带第二属性信息,不携带第一行为信息和第二行为信息。第一行为信息可以理解为干预标签,第一对象携带第一行为信息,可以是第一对象携带第一行为信息的干预标签。第一行为信息可以理解为结果标签,第一对象携带第二行为信息,可以是第一对象携带第二行为信息的结果标签。

在商品推荐场景中,第一目标与第二目标互为互补产品,第一目标为互补产品中的基础商品,第二目标为互补产品中的互补商品,互补商品可以由人工定义,也可以由计算机根据大数据进行匹配得到。第一行为信息可以是购买第一目标的行为产生的数据信息,第二行为信息可以是购买第二目标的行为产生的数据信息。例如,羽毛球拍与羽毛球为互补产品,第一目标为羽毛球拍,第二目标为羽毛球。第一对象包括只购买羽毛球拍的消费者和既购买过羽毛球拍又购买过羽毛球的消费者,全部第一对象均携带购买羽毛球拍的干预标签,部分第一对象均携带购买羽毛球的结果标签。第二对象为未购买过羽毛球拍和羽毛球的用户。本申请实施例的目的可以理解为从未购买过羽毛球拍和羽毛球的用户中确定羽毛球的潜在消费者,对潜在消费者进行羽毛球的商品信息推送。属性信息可以是画像信息,例如年龄、性别、品类喜好、近7天付费金额、近7天相关商品的付费金额、近期活跃时长等。

S120、将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率。

其中,第一行为预测模型为根据机器学习分类模型构建的,第一概率用于表征第一对象产生第一行为信息的概率,第二概率用于表征第二对象产生第一行为信息的概率。

可以理解的是,第一行为预测模型可以为根据XGBoost机器学习分类模型构建的。将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型学习M个第一属性信息、N个第二属性信息与M个第一行为信息之间的关系,进而可以预测M个第一对象的干预概率,得到M个第一概率,以及预测N个第二对象的干预概率,得到N个第二概率。第一概率及第二概率均为0到1之间的小数。

S130、根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组。

其中,K个配对组携带K个配对信息,配对信息用于表征第一对象与第二对象的匹配情况,每个配对组包括至少一个第一对象及至少一个第二对象,K为大于1的整数。

可以理解的是,根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组,可以确定K个概率区间,且满足K个概率区间不相交,且每个概率区间的区间大小相等,将M个第一概率及N个第二概率分布至K个概率区间内,将满足同一区间的第一概率对应的第一对象与第二概率对应的第二对象进行匹配。

例如,如表1,表1为第一对象和第二对象对应的概率值。首先,确定5个概率区间[0,0.2)、[0.2,0.4)、[0.4,0.6)、[0.6,0.8)、[0.8,1.0),接着,将9个第一对象对应的第一概率及10个第二对象对应的第二概率分布至5个概率区间内,得到第一对象A对应的第一概率0.11∈[0,0.2),第一对象B对应的第一概率0.18∈[0,0.2),第一对象C对应的第一概率0.19∈[0,0.2),第二对象a对应的第二概率0.09∈[0,0.2),第二对象b对应的第二概率0.13∈[0,0.2),第二对象c对应的第二概率0.16∈[0,0.2),第二对象d对应的第二概率0.17∈[0,0.2);第一对象D对应的第一概率0.21∈[0.2,0.4),第一对象E对应的第一概率0.35∈[0.2,0.4),第二对象e对应的第二概率0.23∈[0.2,0.4),第二对象f对应的第二概率0.28∈[0.2,0.4),第二对象g对应的第二概率0.37∈[0.2,0.4);第一对象F对应的第一概率0.47∈[0.4,0.6),第一对象G对应的第一概率0.58∈[0.4,0.6),第二对象h对应的第二概率0.56∈[0.4,0.6);第一对象H对应的第一概率0.71∈[0.6,0.8),第二对象i对应的第二概率0.66∈[0.6,0.8);第一对象I对应的第一概率0.92∈[0.8,1.0),第二对象j对应的第二概率0.82∈[0.8,1.0)。然后,将满足同一区间的第一概率对应的第一对象与第二概率对应的第二对象进行匹配,得到5个配对组:第一配对组中第一对象A、B、C与第二对象a、b、c、d匹配,第二配对组中第一对象D、E与第二对象e、f、g匹配,第三配对组中第一对象F、G与第二对象h匹配,第四配对组中第一对象H与第二对象i匹配,第五配对组中第一对象I与第二对象j匹配。

表1

S140、将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率。

其中,第二行为预测模型为根据机器学习分类模型构建的,第三概率用于表征N个第二对象产生第二行为信息的概率。

可以理解的是,第二行为预测模型可以为根据XGBoost机器学习分类模型构建的。将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型学习M个第一属性信息、N个第二属性信息与L个第二行为信息之间的关系,进而可以预测N个第二对象的干预概率,得到N个第三概率。第三概率为0到1之间的小数。

S150、根据N个第三概率从N个第二对象中确定信息推荐对象。

可以理解的是,根据N个第三概率,将第三概率大于预设第三概率阈值的第二对象中确定为信息推荐对象。信息推荐对象为产生第二行为信息的概率较高的对象。

S160、将第二目标的信息推荐至信息推荐对象。

可以理解的是,将第二目标的信息推荐产生第二行为信息的概率较高的对象,实现本申请实施例的目的,即从未购买过羽毛球拍和羽毛球的用户中确定羽毛球的潜在消费者,对潜在消费者进行羽毛球的商品信息推送。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图2对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图3,步骤S130进一步包括子步骤S131至子步骤S134。需要说明的是,子步骤S131与子步骤S132为并列步骤。具体的:

S131、根据M个第一概率计算M个第一对象对应的M个第一趋势分数。

S132、根据N个第二概率计算N个第二对象对应的N个第二趋势分数。

可以理解的是,将概率转换为趋势得分,可以通过将概率值乘以100计算得到趋势得分。具体的,将M个第一概率分别乘以100,得到M个第一对象对应的M个第一趋势分数;将N个第二概率分别乘以100,得到N个第二对象对应的N个第二趋势分数。

S133、根据M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组。

其中,每个分组对应一个趋势分数区间。

可以理解的是,根据M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组,可以确定K个趋势分数区间,且满足趋势分数区间不相交,且每个趋势分数区间的区间大小相等,将M个第一概率及N个第二概率分布至K个概率区间内,将满足同一区间的第一概率对应的第一对象与第二概率对应的第二对象进行匹配。

根据概率计算得到的趋势分数为[0,100]之间的数,确定K个趋势分数区间为[0,100/K)、[100/K,200/K)、[200/K,300/K)…[100(K-1)/K,100),将计算得到的M个第一趋势分数及N个第二趋势分数分布至K个概率区间内,将满足同一区间的第一概率对应的第一对象与第二概率对应的第二对象进行匹配,优选的K=100。

例如,如表2,表2为第一对象和第二对象对应的趋势分数。首先,确定5个趋势分数区间[0,20)、[20,40)、[40,60)、[60,80)、[80,100),接着,将9个第一对象对应的第一趋势分数及10个第二对象对应的第二趋势分数分布至5个趋势分数区间内,得到第一对象A对应的第一趋势分数11∈[0,20),第一对象B对应的第一趋势分数18∈[0,20),第一对象C对应的第一趋势分数19∈[0,20),第二对象a对应的第二趋势分数9∈[0,20),第二对象b对应的第二趋势分数13∈[0,20),第二对象c对应的第二趋势分数16∈[0,20),第二对象d对应的第二趋势分数17∈[0,20);第一对象D对应的第一趋势分数21∈[20,40),第一对象E对应的第一趋势分数35∈[20,40),第二对象e对应的第二趋势分数23∈[20,40),第二对象f对应的第二趋势分数28∈[20,40),第二对象g对应的第二趋势分数37∈[20,40);第一对象F对应的第一趋势分数47∈[40,60),第一对象G对应的第一趋势分数58∈[40,60),第二对象h对应的第二趋势分数56∈[40,60);第一对象H对应的第一趋势分数71∈[60,80),第二对象i对应的第二趋势分数66∈[60,80);第一对象I对应的第一趋势分数92∈[80,100),第二对象j对应的第二趋势分数82∈[80,100)。然后,将满足同一趋势分数区间的第一趋势分数对应的第一对象与第二趋势分数对应的第二对象进行匹配,得到5个分组:第一分组中第一对象A、B、C与第二对象a、b、c、d匹配,第二分组中第一对象D、E与第二对象e、f、g匹配,第三分组中第一对象F、G与第二对象h匹配,第四分组中第一对象H与第二对象i匹配,第五分组中第一对象I与第二对象j匹配。

表2

S134、将从K个分组中提取相同数量的第一对象及第二对象进行匹配。

可以理解的是,对于每个分组,提取数量相同的第一对象和第二对象,将提取出的第一对象和第二对象进行匹配。具体的,可以设置每个分组中提取的第一对象和第二对象的数量,例如可以设置每个分组中仅保留1个第一对象和1个第二对象;还可以依据每个分组中数量较少的对象的数量,作为对象数量阈值进行第一对象和第二对象的提取,举例说明,在第一趋势分数区间[0,20)内,第一对象有3个,第二对象有4个,得到对象数量阈值为3,则可以从3个第一对象中选择3个第一对象,从4个第二对象中选择3个第二对象,将选择出的3个第一对象与3个第二对象进行匹配;在第三趋势分数区间[40,60)内,第一对象有2个,第二对象有1个,得到对象数量阈值为1,从2个第一对象中选择1个第一对象,从1个第二对象中选择1个第二对象,将选择出的1个第一对象和1个第一对象进行匹配。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图3对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图4,子步骤S133进一步包括子步骤S1331至子步骤S1332。具体的:

S1331、根据M个第一趋势分数及N个第二趋势分数,生成K个趋势分数区间。

S1332、根据K个趋势分数区间、M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组。

其中,每个分组内的第一对象对应的第一趋势分数及第二对象对应的第二趋势分数在分组对应的趋势分数区间内。

可以理解的是,根据M个第一趋势分数及N个第二趋势分数,设置K个趋势分数区间,K个趋势分数区间满足趋势分数区间不相交,且每个趋势分数区间的区间大小相等,将M个第一概率及N个第二概率分布至K个概率区间内,对M个第一对象及N个第二对象进行分组,得到K个分组。

趋势分数为[0,100]之间的数,根据趋势分数生成K个趋势分数区间。例如,当K为100时,得到100个趋势分数区间:[0,1)、[1,2)、[2,3)…[99,100)。根据100个趋势分数区间、M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到100个分组。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,将趋势分数满足趋势分数区间的第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图3对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图5,子步骤S134进一步包括子步骤S1341至子步骤S1343。具体的:

S1341、获取K个分组中每个分组的对象数量阈值。

可以理解的是,每个分组的对象数量阈值小于或等于该分组中第一对象的数量与第二对象数量的较小值,且大于0。例如,分组中第一对象的数量为3,第二对象的数量为5,则该分组的对象数量阈值小于等于3,即该分组的对象数量阈值为1或者2或者3。

S1342、根据对象数量阈值,从每个分组中的第一对象提取对象数量阈值的第一提取对象,以及从分组中的第二对象提取对象数量阈值的第二提取对象。

可以理解的是,从每个分组中提取数量相等且为对象数量阈值的第一对象和第二对象。例如,分组中第一对象的数量为3,第二对象的数量为5,若该分组的对象数量阈值等于3,则从3个第一对象中提取3个第一提取对象(将3个第一对象全部作为第一提取对象),以及从5个第二对象中提取3个第二提取对象;若该分组的对象数量阈值等于2,则从3个第一对象中提取2个第一提取对象,以及从5个第二对象中提取2个第二提取对象;若该分组的对象数量阈值等于1,则从3个第一对象中提取1个第一提取对象,以及从5个第二对象中提取1个第二提取对象.

S1343、将每个分组中的第一提取对象与第二提取对象进行匹配。

可以理解的是,对于每个分组提取出的第一提取对象与第二提取对象进行匹配。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,在每个分数区间里进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图5对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图6,子步骤S1341包括子步骤S13411至子步骤S13413。需要说明的是,子步骤S13412与子步骤S13413为并列步骤。具体的:

S13411、获取每个分组中第一对象数量及第二对象数量。

S13412、若第一对象数量小于第二对象数量,则将第一对象数量作为分组的对象数量阈值。

S13413、若第一对象数量大于等于第二对象数量,则将第二对象数量作为分组的对象数量阈值。

可以理解的是,将每个分组中第一对象数量与第二对象数量中的较小值作为分组的对象数量阈值,进而进行后面的对象筛选。具体的,通过统计每个分组中第一对象的数量和第二对象的数量,比较第一对象的数量和第二对象的数量,若第一对象数量小于第二对象数量,则将第一对象数量作为分组的对象数量阈值,若第一对象数量大于等于第二对象数量,则将第二对象数量作为分组的对象数量阈值。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图5对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图7,子步骤S1342进一步包括子步骤S13421至子步骤S13426。可以理解的是,子步骤S13421至子步骤S13425为第一对象提取过程,子步骤S13422至子步骤S13426为第二对象提取过程,子步骤S13421至子步骤S13425与子步骤S13422至子步骤S13426为并列步骤。具体的:

S13421、对分组中的第一对象进行标号,得到分组中的每个第一对象对应的标号值。

S13423、根据每个第一对象对应的标号值,对分组中的第一对象进行排序,得到第一标号队列。

S13425、根据第一标号队列中第一对象的顺序及对象数量阈值,确定第一提取对象。

可以理解的是,本申请实施例提供的从分组中随机选择对象数量阈值的第一提取对象。具体的随机方法是,首先通过随机对分组中每个第一对象进行标号,且满足标号不重复,接着按照标号的大小对第一对象进行排序,得到第一标号队列,然后将第一标号队列中选择排在前位的对象数量阈值个第一对象作为第一提取对象。

例如,分组中有6个第一对象A、第一对象B、第一对象C、第一对象D、第一对象E、第一对象F,对6个第一对象进行标号随机赋值1-6,得到第一对象A的标号为3号,得到第一对象B的标号为6号,得到第一对象C的标号为5号,得到第一对象D的标号为1号,得到第一对象E的标号为2号,得到第一对象F的标号为4号,按照标号对6个第一对象进行排列,得到第一标号队列DEAFCB,若对象数量阈值为3,则确定第一对象D、第一对象E、第一对象A为第一提取对象。

S13422、对分组中的第二对象进行标号,得到分组中的每个第二对象对应的标号值。

S13424、根据每个第二对象对应的标号值,对分组中的第二对象进行排序,得到第二标号队列。

S13426、根据第二标号队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

可以理解的是,本申请实施例提供的从分组中随机选择对象数量阈值的第二提取对象。具体的随机方法是,首先通过随机对分组中每个第二对象进行标号,且满足标号不重复,接着按照标号的大小对第二对象进行排序,得到第二标号队列,然后将第二标号队列中选择排在前位的对象数量阈值个第二对象作为第二提取对象。

例如,分组中有5个第二对象a、第二对象b、第二对象c、第二对象d、第二对象e,对5个第二对象进行标号随机赋值1-5,得到第二对象a的标号为2号,得到第二对象b的标号为4号,得到第二对象c的标号为1号,得到第二对象d的标号为5号,得到第二对象e的标号为3号,按照标号对5个第二对象进行排列,得到第二标号队列caebd,若对象数量阈值为3,则确定第二对象c、第二对象a、第二对象e为第二提取对象。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里通过赋值标号的方法随机进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图5对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图8,子步骤S1342进一步包括子步骤S3421至子步骤S3424。需要说明的是,子步骤S3421至子步骤S3423为第一对象提取过程,子步骤S3422至子步骤S3424为第二对象提取过程,子步骤S3421至子步骤S3423与子步骤S3422至子步骤S3424为并列步骤。具体的:

S3421、根据分组中每个第一对象对应的第一趋势分数,对分组中的第一对象进行排序,生成第一分数队列。

S3423、根据第一分数队列中第一对象的顺序及对象数量阈值,确定第一提取对象。

可以理解的是,本申请实施例提供的从分组中依据趋势分数选择对象数量阈值的第一提取对象。具体的:在每个分组中,依据每个第一对象对应的第一趋势分数对分组中的第一对象进行排序,生成第一分数队列,然后将第一标号队列中选择排在前位的对象数量阈值个第一对象作为第一提取对象。

例如,分组中有6个第一对象A、第一对象B、第一对象C、第一对象D、第一对象E、第一对象F,其中,第一对象A的第一趋势分数为15,第一对象B的第一趋势分数为11,第一对象C的第一趋势分数为18,第一对象D的第一趋势分数为9,第一对象E的第一趋势分数为16,第一对象F的第一趋势分数为12。按照第一趋势分数大小对6个第一对象进行排列,得到第一分数队列DBFACE,若对象数量阈值为3,则确定第一对象D、第一对象B、第一对象F为第一提取对象。

S3422、根据分组中每个第二对象对应的第二趋势分数,对分组中的第二对象进行排序,生成第二分数队列。

S3424、根据第二分数队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

可以理解的是,本申请实施例提供的从分组中依据趋势分数选择对象数量阈值的第二提取对象。具体的:在每个分组中,依据每个第二对象对应的第二趋势分数对分组中的第二对象进行排序,生成第二分数队列,然后将第二标号队列中选择排在前位的对象数量阈值个第二对象作为第二提取对象。

例如,分组中有5个第二对象a、第二对象b、第二对象c、第二对象d、第二对象e,其中,第二对象a的第二趋势分数为8,第二对象b的第二趋势分数为6,第二对象c的第二趋势分数为12,第二对象d的第二趋势分数为19,第二对象e的第二趋势分数为14。按照第二趋势分数大小对5个第二对象进行排列,得到第二分数队列baced,若对象数量阈值为3,则确定第二对象b、第二对象a、第二对象c为第二提取对象。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里通过趋势分数的大小进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图3对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图9,子步骤S131进一步包括子步骤S1311至子步骤S1312,子步骤S132进一步包括子步骤S1321至子步骤S1322。具体的:

S1311、将M个第一概率乘以第一阈值,得到M个第一乘积值。

S1312、将M个第一乘积值进行向下取整,得到M个第一趋势分数。

可以理解的是,通过第一概率计算第一趋势分数,具体为首先将第一概率乘以第一阈值,然后对得到的乘积值进行向下取整,得到第一趋势分数,使得第一趋势分数为整数。

例如,第一概率为0.151,将第一概率乘以第一阈值100,得到第一乘积值15.1,对第一乘积值进行向下取整得到第一趋势分数15。

S1321、将N个第二概率乘以第一阈值,得到N个第二乘积值。

S1322、将N个第二乘积值进行向下取整,得到N个第二趋势分数。

可以理解的是,通过第二概率计算第二趋势分数,具体为首先将第二概率乘以第二阈值,然后对得到的乘积值进行向下取整,得到第二趋势分数,使得第二趋势分数为整数。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率乘以第一阈值并向下取整计算得到第一趋势分数,以及根据第二概率乘以第一阈值并向下取整计算得到第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图2对应的实施例提供的信息推荐方法的一个可选实施例中,请参阅图10,步骤S150进一步包括子步骤S151。具体的:

S151、将N个第三概率中大于第三概率阈值的第二对象中确定为信息推荐对象。

可以理解的是,根据N个第三概率,将第三概率大于预设第三概率阈值的第二对象中确定为信息推荐对象。信息推荐对象为产生第二行为信息的概率较高的对象。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

为了便于理解,下面将结合图11和图12介绍一种信息推荐方法。图11是本申请实施例提供的信息推荐方法的流程图,图12是本申请实施例提供的信息推荐方法的结构图。本申请实施例提供的方法目的在于在不同时间点,进行互补商品的复购人群预测,通过利用分布式计算与直方聚合在首次购买人群中寻找复购人群的相似个体,预测用户在未来指定时间内复购的可能性,进而在已经购买的人群中寻找到高复购概率人群,针对这些高复购概率人群进行重点运营,提升商品复购率与销量。具体地,包括匹配部分与互补商品购买预测部分。在匹配部分中,将销售数据按天切分,在每个天销售数据集中,采用一个分布式机0到100之间的整数,并且向下取整。再通过对以上概率分桶,将用户划分到K个桶内。分别计算干预组(有购买基础商品的群体)与对照组(没有购买基础商品的群体)中每个桶内的个体数量,将两个组中最小的数量取为入选数量。在给定分桶中,分别将干预组与对照组中随机将入选数量的个体放入新的组合数据,实现对照组中可能购买基础产品的用户与干预组中已经购买基础产品用户的匹配。在互补商品购买预测部分中,通过对干预组用户对互补商品的未来N天购买,生成互补商品购买预测模型,然后再通过互补商品购买预测模型来对第一步中的对照组匹配用户进行预测,进而提取出来预测会购买互补商品的用户。

本申请实施例提供的方法首先将有购买基础产品X和没有购买基础产品X的两群用户进行匹配;然后,利用“匹配后的有购买基础产品X”的用户来训练预测购买互补产品Y的模型,然后利用该模型预测“匹配后没有购买基础产品X”用户购买互补产品Y的概率,其中“匹配后没有购买基础产品X”用户购买互补产品Y的概率大于50%的用户为“高潜复购用户”,最后针对“高潜复购用户”推销互补产品Y。

本申请实施例提供的方法对应的算法更新频率为每天更新,预测频率为每天预测,目标用户圈定范围为近14天有登录平台的用户。本申请实施例提供的方法对应的算法的输入包括:属性信息X(例如年龄、性别、品类喜好、近7天付费金额、近7天相关商品的付费金额、近期活跃时长等)、干预标签t,具有干预标签的干预用户为近7天购买基础产品的用户,结果标签y,具有结果标签的干预用户为近7天购买互补产品,分桶数量K,优选K=100。

本申请实施例提供的方法对应的算法的输出为复购匹配人群表PurchaseMatchDf,PurchaseMatchDf包括匹配好的对照组和干预组人群,PurchaseMatchDf表具有以下字段(用户ID,是否干预,结果,用户得分,趋势得分,互补商品购买概率)。对于PurchaseMatchDf表中的干预组用户,在PurchaseMatchDf表中会存在与该用户相同趋势得分的对照组用户;同理,给定对照组的用户ID,也可以通过查找趋势得分进而匹配到干预组的相似用户。通过以“是否干预”为主键对“结果”进行均值计算,可以得到匹配后的干预组与对照组的平均结果,从而评估干预对结果的影响。

本申请实施例提供的方法包括:

步骤一,获取输入数据。具体的,获取M个第一对象及N个第二对象,其中,第一对象为购买过基础产品的干预用户,M个第一对象分为两类,一类是仅仅购买过基础产品,这类用户携带第一行为信息,这类用户具有干预标签;另一类为购买过基础产品且购买过互补产品,这类用户携带第一行为信息和第二行为信息,这类用户同时具有干预标签和结果标签。第二对象为未购买过基础产品和互补产品,这类用户不携带第一行为信息和第二行为信息,且不具有干预标签和结果标签。

步骤二,预测基础产品的干预概率。干预概率指的是用户有多大可能购买基础产品,预测干预概率的目的是将用户不同维度的差异性转化为一维的差异,从而便于比较并且找到相似用户,具体的方法为利用第一行为预测模型(例如机器学习分类模型XGBoost)以属性信息X与干预t建立模型,学习X与t之间的关系,进而可以对不同用户X预测得到不同的干预概率,这个概率是0到1之间的小数。

步骤三,计算趋势得分(Propensity Score,PS),计算的公式是将预测得到的0到1之间干预概率乘以100,并且取整,转化为0到100之间的整数。从而每个用户都会有一个0到100之间的PS(趋势得分),用户的PS越趋向100表示用户更加有趋势被干预。

步骤四,趋势得分分桶(PS分桶),PS分桶的目的是将干预组用户和对照组用户放入相同的PS区间,从而我们可以在给定的PS区间中找到相同PS的干预组用户和对照组用户,干预组如果不分桶直接按照PS第1个单位来切分,可能会导致一些用户无法精确匹配而无法找到相似用户。这里分桶的具体做法是将每一个干预组与对照组的个体的连续PS映射到K个PS分桶。

步骤五,计算干预组与对照组在每个PS分桶的个体数量,计算方法如下:以“是否干预t”与分桶为主键,统计主键下去重用户ID的数量。计算每个PS桶的个体数量原因是:为了寻找到相似用户,需要确保干预组与对照组在每个分桶的用户数量一致,计算干预组与对照组在每个PS分桶的个体数量可以得到哪些分桶中用户数量不同,进而在后面的步骤进行人数筛选。

步骤六,计算每个PS分桶的人数阈值,计算阈值的目的是为了确保匹配后的干预组与对照组人数一致。具体的:在每个PS分桶中,取每个PS分桶中干预组与对照组中的最小个体数量,这里的个体数量指的是在算法步骤3中得到的个体数量。

步骤七,提取干预组数据在每个PS分桶中的个体,提取的数量为阈值数量,具体的做法是在干预组数据在每个PS桶内随机排序,然后将每个PS桶内排序小于该分桶阈值的个体提取出来。例如PS分桶1的阈值为3,那么就在干预组PS分桶1中提取前3的个体。随机方法为:给每个用户赋予随机数,然后对随机数进行排序。

步骤八,提取对照组数据在每个PS分桶中的个体,具体的做法是在对照组数据在每个PS桶内随机排序,然后将每个PS桶内排序小于该分桶阈值的个体提取出来。例如PS分桶1的阈值为3,那么就在对照组PS分桶1中提取前3的个体。随机方法为:给每个用户赋予随机数,然后对随机数进行排序。

步骤九,配平数据:合并步骤七与步骤八的数据。

算法步骤十,训练购买互补产品的预测模型。利用MatchingDf中的有干预用户(有购买基础产品),与(X,y)关联,通过第二行为预测模型(例如机器学习分类模型XGBoost)以属性信息X与实际是否购买互补产品y建立模型,学习X与y之间的关系,进而可以对不同用户X预测得到不同的干预概率,这个概率是0到1之间的小数。这个步骤输出复购模型PurchaseModel。

步骤十一,预测潜在复购用户。利用MatchingDf中的无干预用户(没有购买基础产品),与(X,y)关联,通过复购模型PurchaseModel预测用户购买互补产品的概率,输出复购概率大于0.5的无干预用户的用户ID和复购概率到结果表PurchaseMatchDf。复购概率大于0.5的无干预用户为互补产品信息推荐的目标人群。

步骤十二,对复购概率大于0.5的无干预用户进行互补产品信息推荐。

本申请实施例提供的方法,通过第一行为预测模型预测得出干预组中用户购买基础产品的概率及对照组中用户购买基础产品的概率,根据两个概率值计算得到各自的趋势分数,根据趋势分数生成趋势分数区间,对每个趋势分数区间内,将干预组与对照组进行筛选,并对筛选后的干预组与对照组进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出对照组购买互补产品的概率,根据对照组购买互补产品的概率确定目标人群,对目标人群进行互补产品的信息推荐,提高预测目标人群的准确性,进而提高信息推荐效率。

下面对本申请中的信息推荐装置进行详细描述,请参阅图13。图13为本申请实施例中信息推荐装置10的一个实施例示意图,信息推荐装置10包括:

对象获取模块110,用于获取M个第一对象及N个第二对象.

其中,M个第一对象携带M个第一属性信息、M个第一行为信息及L个第二行为信息,第一行为信息对应于第一目标,第二行为信息对应于第二目标,N个第二对象携带N个第二属性信息,M、N、L均为大于1的整数,L小于M。

第一行为预测模块120,用于将M个第一属性信息、M个第一行为信息及N个第二属性信息作为第一行为预测模型的输入,通过第一行为预测模型的输出M个第一概率及N个第二概率。

其中,第一行为预测模型为根据机器学习分类模型构建的。

对象匹配模块130,用于根据M个第一概率及N个第二概率,将M个第一对象与N个第二对象进行匹配,得到K个配对组。

其中,K个配对组携带K个配对信息,K为大于1的整数。

第二行为预测模块140,用于将M个第一属性信息、L个第二行为信息、N个第二属性信息及K个配对信息作为第二行为预测模型的输入,通过第二行为预测模型输出N个第三概率。

其中,第二行为预测模型为根据机器学习分类模型构建的。

信息推荐对象确定模块150,用于根据N个第三概率从N个第二对象中确定信息推荐对象。

信息推荐模块160,用于将第二目标的信息推荐至信息推荐对象。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

根据M个第一概率计算M个第一对象对应的M个第一趋势分数。

根据N个第二概率计算N个第二对象对应的N个第二趋势分数。

根据M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组。

其中,每个分组对应一个趋势分数区间。

将从K个分组中提取相同数量的第一对象及第二对象进行匹配。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

根据M个第一趋势分数及N个第二趋势分数,生成K个趋势分数区间。

根据K个趋势分数区间、M个第一趋势分数及N个第二趋势分数,对M个第一对象及N个第二对象进行分组,得到K个分组。

其中,每个分组内的第一对象对应的第一趋势分数及第二对象对应的第二趋势分数在分组对应的趋势分数区间内。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,将趋势分数满足趋势分数区间的第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

获取K个分组中每个分组的对象数量阈值。

根据对象数量阈值,从每个分组中的第一对象提取对象数量阈值的第一提取对象,以及从分组中的第二对象提取对象数量阈值的第二提取对象。

将每个分组中的第一提取对象与第二提取对象进行匹配。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,在每个分数区间里进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

获取每个分组中第一对象数量及第二对象数量。

若第一对象数量小于第二对象数量,则将第一对象数量作为分组的对象数量阈值。

若第一对象数量大于等于第二对象数量,则将第二对象数量作为分组的对象数量阈值。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

对分组中的第一对象进行标号,得到分组中的每个第一对象对应的标号值。

根据每个第一对象对应的标号值,对分组中的第一对象进行排序,得到第一标号队列。

根据第一标号队列中第一对象的顺序及对象数量阈值,确定第一提取对象。

对分组中的第二对象进行标号,得到分组中的每个第二对象对应的标号值。

根据每个第二对象对应的标号值,对分组中的第二对象进行排序,得到第二标号队列。

根据第二标号队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里通过赋值标号的方法随机进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

根据分组中每个第一对象对应的第一趋势分数,对分组中的第一对象进行排序,生成第一分数队列;

根据第一分数队列中第一对象的顺序及对象数量阈值,确定第一提取对象;

根据分组中每个第二对象对应的第二趋势分数,对分组中的第二对象进行排序,生成第二分数队列;

根据第二分数队列中第二对象的顺序及对象数量阈值,确定第二提取对象。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率计算第一趋势分数,以及根据第二概率计算第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,统计每个分数区将内的第一对象数量和第二对象数量,将二者中的较小值作为对象数量阈值,在每个分数区间里通过趋势分数的大小进行第一对象和第二对象的提取,使得提取出的第一对象的数量与第二对象数量相等,且为对象数量阈值,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,对象匹配模块130,还用于:

将M个第一概率乘以第一阈值,得到M个第一乘积值。

将M个第一乘积值进行向下取整,得到M个第一趋势分数。

根据N个第二概率计算N个第二对象对应的N个第二趋势分数,包括

将N个第二概率乘以第一阈值,得到N个第二乘积值。

将N个第二乘积值进行向下取整,得到N个第二趋势分数。

本申请实施例提供的装置,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率乘以第一阈值并向下取整计算得到第一趋势分数,以及根据第二概率乘以第一阈值并向下取整计算得到第二趋势分数,根据第一趋势分数及第二趋势分数生成趋势分数区间,对每个趋势分数区间内,将第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

在本申请的图13对应的实施例提供的信息推荐装置的一个可选实施例中,信息推荐对象确定模块150,还用于:

将N个第三概率中大于第三概率阈值的第二对象中确定为信息推荐对象。

本申请实施例提供的方法,通过第一行为预测模型预测得出第一对象产生第一行为信息的第一概率及第二对象产生第一行为信息的第二概率,根据第一概率及第二概率对第一对象与第二对象进行匹配,得到配对信息,将配对信息作为第二行为预测模型的输入,通过第二行为预测模型预测得出第二对象产生第二行为信息的第三概率,根据第三概率确定第二对象中的信息推荐对象,对信息推荐对象进行信息推荐,提高预测第二用户感兴趣目标的准确性,进而提高信息推荐效率。

图14是本申请实施例提供的一种服务器结构示意图,该服务器300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在服务器300上执行存储介质330中的一系列指令操作。

服务器300还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341,例如Windows Server

上述实施例中由服务器所执行的步骤可以基于该图14所示的服务器结构。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

相关技术
  • 一种信息推荐方法、装置、设备及介质
  • 一种向用户推荐信息的方法、装置及终端
  • 一种信息推荐方法及装置
  • 一种信息推荐方法及装置
  • 一种信息推荐方法、装置、设备及介质
  • 一种信息推荐和信息推荐模型训练方法、相关装置
  • 信息推荐方法、信息推荐装置、电子设备及相关产品
技术分类

06120116503620