掌桥专利:专业的专利平台
掌桥专利
首页

一种电商平台动态链接预测方法、系统、设备及存储介质

文献发布时间:2024-04-18 20:01:30


一种电商平台动态链接预测方法、系统、设备及存储介质

技术领域

本发明涉及链接预测技术领域,具体而言,涉及一种电商平台动态链接预测方法、系统、设备及存储介质。

背景技术

在电子商务领域,动态链接推荐系统已经成为一个至关重要的工具,其能够帮助用户在海量的商品中找到他们可能感兴趣的商品,从而提高用户体验和购物满意度。随着社交网络的普及和用户行为数据的增长,社交属性已经融入到电商平台中,购物不再仅仅是一个简单的交易过程,而是一个社交化的过程,用户可以在购物的同时与朋友进行交流和分享。其中,回流行为是社交电商中的一个重要现象,是指当某用户(即分享用户)在社交电商平台上分享了某个商品(或者服务、信息等),然后其他用户(即回流用户)对该分享做出响应,如点击了分享的链接,或者购买了分享的商品。这种现象在社交电商平台上大量存在,体现了用户的社交行为和购物行为的紧密结合。

这种回流行为对于电商平台有着重要的意义,可以帮助电商平台更好地洞察用户的爱好,从而提供更准确的推荐。而且该分享行为还体现了用户的社交影响力,可以帮助电商平台更好地理解用户的社交网络结构和影响力分布,从而进行更有效的社交营销。因此,对于电商平台而言,如何准确预测商品分享行为中可能的回流者,是一个非常重要的问题。通过对用户行为数据进行分析,找到可能的回流者,然后针对这些回流者进行精准的推荐和营销,从而提高平台的转化率和用户满意度。这些信息对于电商用户行为的建模与挖掘、异常用户识别以及电商平台的精准推荐营销、提升用户消费体验等起着重要作用。

现有技术主要通过数据挖掘、标签相似度以及神经网络等方法,对用户历史交互数据和商品数据进行分析,主要存在以下不足:(1)考虑的特征较少,可能无法准确预测那些社交行为较少或购物行为不规律的用户的兴趣偏好;(2)采用复杂的人工智能模型、神经网络模型进行评估,虽然提高了预测的准确性,但是解释性较差,对于用户和商家来说,无法理解推荐的原因;(3)部分现有技术,尤其是基于人工智能、神经网络的模型,存在计算资源和时间消耗很大的问题(4)依赖用户或商品的详细信息,如商品详细介绍用于判断商品间相似度。尽管这些信息都会进行适当的脱敏处理以保护用户和商家的隐私,但它们仍然需要大量的数据输入才能实现最佳的性能。

发明内容

本发明提供一种电商平台动态链接预测方法、系统、设备及存储介质,解决现有技术对用户的历史交互数据和商品数据进行分析时存在的问题。

在第一方面,本发明实施例中提供一种电商平台动态链接预测方法,所述方法流程如下:

获取历史交互数据,以构建交互数据集;

基于交互数据集构建以图结构刻画的交互网络,所述交互网络的节点代表分享用户和回流用户,所述交互网络的边代表分享用户和回流用户之间的交互行为;

基于交互网络寻找每个分享用户在商品属性上的相似用户群体作为潜在回流者,以构造动态链接预测模型;

基于潜在回流者的个体特征、交互强度以及忠诚度对动态链接预测模型进行模型修正,以得到最终回流得分;

基于交互网络和最终回流得分对潜在回流者进行筛选和排序,以得到最终推荐用户。

于上述实施例中,本发明使用了多种特征,使得对用户交互行为的刻画更加充分,能够更全面地反映用户的需求和兴趣;采用的非机器学习模型的方式,使得模型的可解释性强,计算速度快,资源消耗少,可以根据业务规则需要随时灵活调整;本发明不仅考虑了用户的静态特征,还考虑了用户的动态特征,即用户的兴趣和社交网络的变化,使得模型能够更好地适应用户的需求和兴趣的变化,对于新用户或者数据稀疏的用户,也有一定的处理能力,能够提供较好的推荐效果。

作为本申请一些可选实施方式,所述历史交互数据包括以四元组形式记录的分享用户、交互商品、回流用户以及回流时间。

于上述实施例中,本发明通过四元组形式记录历史交互数据,使得数据结构更加清晰,更加便于分析这些数据来理解用户的兴趣、偏好以及关系,从而提供个性化推荐。

作为本申请一些可选实施方式,基于交互网络寻找每个分享用户在商品属性上的相似用户群体作为潜在回流者,以构造动态链接预测模型的流程如下:

基于交互网络计算分享用户与回流用户关于交互商品在商品级别上的相似度评分R

所述相似度评分R

其中,C

当交互商品数量小于商品阈值T

所述相似度修正评分R

R

其中,评分阈值T

于上述实施例中,利用协同过滤寻找相似用户群体,并且衡量用户间相似度,特殊情况下,若潜在回流者数量小于所需给出的可能回流用户数量,则通过扩大协同过滤范围的方式,将用户的交互行为从商品级别扩展到商品属性级别。

作为本申请一些可选实施方式,基于潜在回流者的个体特征对动态链接预测模型进行模型修正的流程如下:

基于潜在回流者关于交互商品在商品属性级别上的交互兴趣构造第一修正系数α

所述第一修正系数α

其中,A为当前交互商品的属性列表,a为当前交互商品的商品属性,w

基于潜在回流者的活跃度构造第二修正系数α

所述第二修正系数α

其中,∑e

基于第一修正系数α

所述初始回流得分R

R

其中,商品属性的权重w

于上述实施例中,本发明通过分析潜在回流者的历史交互行为,可以得知用户对当前商品的偏好,虽然两个用户在很多商品分享上有过重叠,甚至重叠度相似度很高,但是针对当前分享的商品,潜在回流者不一定感兴趣,所以还应进一步刻画潜在回流者对当前分享的商品的兴趣程度以及活跃程度,进而对模型进行修正。

作为本申请一些可选实施方式,基于潜在回流者的交互强度以及忠诚度对动态链接预测模型进行模型修正,以得到最终回流得分的流程如下:

基于潜在回流者的交互强度构造第三修正系数α

所述第三修正系数α

其中,u→v是分享用户响应潜在回流者的交互,v→u是潜在回流者响应分享用户的交互,w和w′是时间衰减因子,表示活跃度得分随时间间隔的衰减速率;

基于潜在回流者的忠诚度构造第四修正系数α

所述第四修正系数α

基于第三修正系数α

于上述实施例中,本发明在基于潜在回流者的个体特征对模型进行模型修正之后,还需要根据潜在回流者与分享用户的交互强度和忠诚度对模型进行模型修正,以使得模型预测更加准确。

作为本申请一些可选实施方式,基于交互网络和最终回流得分对潜在回流者进行筛选和排序,以得到最终推荐用户的流程如下:

将潜在回流者按照交互网络的结构进行等级划分,以得到等级划分结果;

按照潜在回流者的等级划分结果和最终回流得分R

于上述实施例中,本发明将交互网络的邻居节点按照与当前分享用户的交互密切程度,划分为一级邻居、二级邻居、三级邻居、其他高阶邻居等等,这种划分方式帮助理解不同用户与当前分享用户之间的交互紧密程度,进而确保优先推荐和分享用户关系最近的用户,也能在推荐列表中涵盖不同层级的用户。

作为本申请一些可选实施方式,所述潜在回流者的等级划分包括一级潜在回流者、二级潜在回流者、三级潜在回流者、其他潜在回流者。

于上述实施例中,在第二方面,本发明提供一种电商平台动态链接预测系统,所述系统包括:

数据采集单元,所述数据采集单元用于获取历史交互数据,以构建交互数据集;

交互网络构建单元,所述交互网络构建单元基于交互数据集构建以图结构刻画的交互网络,所述交互网络的节点代表分享用户和回流用户,所述交互网络的边代表分享用户和回流用户之间的交互行为;

预测模型构建单元,所述预测模型构建单元基于交互网络寻找每个分享用户在商品属性上的相似用户群体作为潜在回流者,以构造动态链接预测模型;

模型修正单元,所述模型修正单元基于潜在回流者的个体特征、交互强度以及忠诚度对动态链接预测模型进行模型修正,以得到最终回流得分;

推荐用户预测单元,所述推荐用户预测单元基于交互网络和最终回流得分对潜在回流者进行筛选和排序,以得到最终推荐用户。

在第三方面,本发明提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的算机程序,所述处理器执行计算机程序时实现所述一种电商平台动态链接预测方法。

在第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述一种电商平台动态链接预测方法。

本发明的有益效果如下:

(1)特征构造与模型设计方面:本发明使用了多种特征,使得对用户交互行为的刻画更加充分,能够更全面地反映用户的需求和兴趣;采用的非机器学习模型的方式,使得模型的可解释性强,计算速度快,资源消耗少,可以根据业务规则需要随时灵活调整。

(2)时间数据的利用与冷启动问题处理方面:本发明不仅考虑了用户的静态特征,还考虑了用户的动态特征,即用户的兴趣和社交网络的变化,使得模型能够更好地适应用户的需求和兴趣的变化,对于新用户或者数据稀疏的用户,也有一定的处理能力,能够提供较好的推荐效果。

(3)强适应性方面:本发明在小场景下也能方便地迁移到其他用户之间的交互行为场景,具有很强的适应性。

(4)数据处理与数据限制方面:本发明在数据预处理阶段对异常数据进行了预先排除,提高了数据质量和推荐准确性;同时,所有处理的数据均已进行匿名化,不依赖于具体的数据标签,保护了用户隐私,具有更广泛的适用性;此外,本发明对数据质量要求不高,即使数据存在噪声或缺失,也能够得到较好的推荐效果。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1是本发明实施例所述硬件运行环境的计算机设备结构示意图;

图2是本发明实施例所述电商平台动态链接预测方法的流程图;

图3是本发明实施例所述交互网络的局部示意图;

图4是本发明实施例所述电商平台动态链接预测系统的结构框图。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

为了克服现有技术对用户的历史交互数据和商品数据进行分析时存在的问题。本申请提供一种电商平台动态链接预测方法、系统、设备及存储介质,在介绍本申请的具体技术方案之前,先介绍下本申请实施例方案涉及的硬件运行环境。

请参阅图1,图1为本申请实施例方案涉及的硬件运行环境的计算机设备结构示意图。

如图1所示,该计算机设备可以包括:处理器,例如中央处理器(CentralProcessing Unit,CPU),通信总线、用户接口,网络接口,存储器。其中,通信总线用于实现这些组件之间的连接通信。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的,用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如无线保真接口)。存储器可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储(Non-VolatileMemory,NVM),例如磁盘存储器,存储器可选的还可以是独立于前述处理器的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及电子程序。

在图1所示的计算机设备中,网络接口主要用于与网络服务器进行数据通信;用户接口主要用于与用户进行数据交互;本申请计算机设备中的处理器、存储器可以设置在计算机设备中,所述计算机设备通过处理器调用存储器中存储的电商平台动态链接预测系统,并执行本申请实施例提供的电商平台动态链接预测方法。

基于前述实施例的硬件环境,本申请的实施例提供了一种电商平台动态链接预测方法,请参阅图2,图2为电商平台动态链接预测方法的流程图,所述方法流程如下:

(1)针对商品分享行为的回流用户预测,首先需要获取用户在电商平台的历史交互数据,以构建交互数据集。

所述历史交互数据包括以四元组形式记录的分享用户(即发起分享的用户)、交互商品(被分享的商品)、回流用户(对交互进行响应的用户)以及回流时间(响应该分享的时间)。

例如,一条历史交互数据的四元组为:

("User u","Item123","User v

这个四元组信息表明,在2023年7月5日14点30分,分享用户u在电商平台上分享了商品Item123,随后回流用户v

与此同时,在获取历史交互数据之后,需要对数据进行清洗,清洗的方式包括但不限于:修正错误的数据、处理缺失值等,以确保后续的数据分析和模型训练的准确性和有效性。

在对数据进行清洗之后,需要对数据进行预处理,预处理的方式包括但不限于:数据转换、数据集分割等。

(2)基于交互数据集构建和分析以图结构刻画的交互网络。

于本发明实施例中,通过构建交互网络,可以深入了解用户之间的交互模式、关系以及行为,有助于推断用户的偏好、兴趣和社交影响力,进而提供更准确的个性化推荐结果;同时,通过分析交互网络的结构可以揭示交互网络的全局和局部特性,这些分析结果提供关于用户行为和社交关系的深入洞察。

具体的,在获得清洗并预处理后的交互数据集后,本发明实施例将按以下步骤构建交互网络的结构,同时剔除潜在的异常用户:

(2.1)构建交互网络:以图结构刻画交互网络,所述交互网络的节点代表分享用户u和回流用户v

(2.2)分析交互网络:通过统计计算一些复杂网络领域的常见指标(如不同节点的度、网络的聚集系数等),以分析了解析交互网络的全局特性和局部特性。

(2.3)剔除异常用户:电商平台中可能会存在异常用户,其行为与正常用户存在显著差异,可能是机器人或恶意用户,为确保推荐系统的准确性和有效性,需要剔除这些异常用户。

(3)基于交互网络寻找每个分享用户u在商品属性上的相似用户群体作为潜在回流者v,以构造动态链接预测模型。

具体的,构造动态链接预测模型的流程如下:

(3.1)基于交互网络计算分享用户u与回流用户v

所述相似度评分R

其中,C

(3.2)当交互商品数量小于商品阈值T

所述相似度修正评分R

R

其中,评分阈值T

于本发明实施例中,当分享用户u和某个回流用户v

具体的,潜在回流者v是指针对当前场景,分享用户u在某个时刻分享特定商品,其潜在有可能产生回流行为的回流用户v

在本步骤中,本发明基于交互网络,利用协同过滤寻找相似用户群体,并衡量用户间相似度;特殊情况下,若潜在回流者v数量小于所需给出的可能回流用户数量,本发明实施例将扩大协同过滤范围,将用户的交互行为从商品级别扩展到商品属性级别,具体操作是,基于用户交互网络,继续寻找商品属性(大类、小类、品牌等)交互选择上与特定分享用户u有相似性的其他用户,即与特定用户曾交互的商品属性有较大重叠的用户群体,来发现更多潜在的回流用户v

(4)基于潜在回流者v的个体特征、交互强度以及忠诚度对动态链接预测模型进行模型修正,以得到最终回流得分R

具体的,基于潜在回流者v的个体特征对动态链接预测模型进行模型修正的流程如下:

(4.1)通过分析潜在回流者v的历史交互行为,可以得知用户对当前商品的偏好;虽然两个用户在很多商品分享上有过重叠,甚至重叠度相似度很高,但是针对当前分享的商品,潜在回流者v不一定感兴趣,所以还应进一步刻画潜在回流者v对当前分享的商品的兴趣程度,因此,基于潜在回流者v关于交互商品在商品属性级别上的交互兴趣构造第一修正系数α

所述第一修正系数α

其中,A为当前交互商品的属性列表,a为当前交互商品的商品属性,w

(4.2)在计算用户活跃程度时,本发明实施例考虑用户的长期交互行为和近期交互行为,长期交互行为可以帮助了解用户的持久行为倾向,而近期交互行为可以反映用户的当前的兴趣趋向,用户的活跃度决定了回流的可能性;

对于长期活跃程度,潜在回流者v在过去频繁交互,被认为活跃度高;特别地,本发明实施例考虑时间衰减效应对用户活跃度评分,近期的交互活动对用户当前的活跃状态影响更大。

对于近期活跃程度,如用户在短期内频繁与其他用户交互,则其近期活跃度高;综合以上两个因素,基于潜在回流者v的活跃度构造第二修正系数α

所述第二修正系数α

其中,∑e

此公式包含三个部分;对于第一部分∑e

对于第二部分

刻画的是用户近期活跃程度,表示潜在回流者v在近30天的活跃次数与所有用户在近30天的活跃次数的最大值的比值,也就是近30天活跃次数的归一化值,本发明实施例不限于30天内的活跃程度,可以根据实际情况对周期进行调整,这个公式主要是为了突出近期活跃用户的重要性;需要指出,该式中使用了指数函数,从而使得对于近期非常活跃的用户,其近期活跃度会显著高于不太活跃的用户,进一步提升对近期活跃行为的刻画和强调,加大活跃用户和不活跃用户在近期活跃度上的差异。

对于第三部分(1+L

(4.3)基于第一修正系数α

所述初始回流得分R

R

于本发明实施例中,在基于潜在回流者v的个体特征对动态链接预测模型进行模型修正之后,需要根据一级潜在回流者与分享用户的交互强度和忠诚度对动态链接预测模型进行模型修正,修正流程如下:

(4.4)基于潜在回流者v的交互强度构造第三修正系数α

通过分析用户的日常交互强度,即交互频率和活跃度,计算日常交互强度评分;倘若候选一级潜在回流者与分享用户的长期交互频繁,可视为高交互强度;具体采用时间衰减因子对近期和历史交互进行评分,即用户活跃度随时间衰减,近期交互活动对当前活跃状态影响较大:具体的,所述第三修正系数α

其中,u→v是分享用户u响应潜在回流者v的交互,此时权重w为0.02;v→u是潜在回流者v响应分享用户u的交互,此时权重w′为0.1,w和w′是时间衰减因子,表示活跃度得分随时间间隔的衰减速率;

(4.5)基于潜在回流者的忠诚度构造第四修正系数α

通过分析一级潜在回流者与分享用户u的历史交互,可以理解为一级潜在回流者对分享用户的忠诚度,若一级潜在回流者频繁与分享用户u交互,表明其对分享用户u有较高的偏好,这种偏好基于共同兴趣、社区关系、信任或个人喜好,可以预测一级潜在回流者对分享用户u未来分享内容的兴趣;具体的,所述第四修正系数α

(4.6)基于第三修正系数α

类似对初始预测值R

于本发明实施例中,一级潜在回流者是指当前分享用户在这个交互网络中的直接邻居。

本发明实施例特别关注一级潜在回流者是因为他们与分享用户之间的交互程度最高,相互之间的联系最紧密;一级潜在回流者更有可能受到分享用户影响,从而对其分享的内容产生回流行为。

同时考虑一级潜在回流者还有助于模型的计算效率和准确性,当专注于一级潜在回流者时,模型需要处理的数据量会大大减少,同时也能保证预测的准确性,因此,本步骤中选择一级潜在回流者,并把这一策略作为本步骤的核心贡献。

基于构建的交互网络,本发明实施例采用网络遍历的方法寻找当前分享用户在交互网络中的邻居节点,作为与当前分享用户交互紧密的用户群体;同时,本发明实施例进一步将邻居节点按照与当前分享用户的交互密切程度,划分为一级邻居、二级邻居、三级邻居、其他高阶邻居等等,这种划分方式帮助理解不同用户与当前分享用户之间的交互紧密程度。

具体地,对于网络中的每个用户节点,遍历其所有邻居节点(即与当前用户有过交互行为的用户节点);常见的深度优先遍历(DFS)或广度优先遍历(BFS)等方法。优选地,本发明实施例采用广度优先遍历。在进行广度优先遍历时,对于每个用户节点,首先访问该节点的所有直接邻居节点,再逐层访问邻居的邻居节点,并检查是否已经在N阶邻居列表中。这样可以清晰地定义出原始节点的一级邻居、二级邻居、三级邻居,以及其他更高阶的邻居,从而理解用户在网络中的交互结构,并避免重复计算邻居关系。

接着,本发明比较潜在回流者集合与分享用户u的邻居节点集合,通过计算这两个集合的交集,将潜在回流者v,划分为一级潜在回流者、二级潜在回流者、三级潜在回流者、其他潜在回流者四类。

(5)基于交互网络和最终回流得分R

本发明将根据最终回流得分R

(5.1)对于每一类候选用户集合(即一级潜在回流者、二级潜在回流者、三级潜在回流者、其他潜在回流者),根据预测的最终回流得分R

(5.2)首先优先推荐一级潜在回流者,因为他们与分享用户有最直接的联系,回流可能性最高,根据业务需要预设推荐数量,从一级潜在回流者列表中选取得分最高的用户;

(5.3)如果一级潜在回流者数量不足以满足预设的推荐数量,那么按照二级潜在回流者、三级潜在回流者、其他潜在回流者的顺序,依次从各类候选用户列表中选取得分最高的用户,直到推荐用户数量满足预设要求;

(5.4)最后生成的推荐列表将包含一级、二级、三级以及其他候选用户,其都是最有可能对分享用户分享的商品产生回流的用户。

通过这个步骤,不仅可以确保优先推荐和分享用户关系最近的用户,也能在推荐列表中涵盖不同层级的用户,这将有助于提高商品的回流率和购买率。

为了更清楚地展现本发明的目的、技术方案和优点,下面以电商平台上的商品分享和用户回流行为为例,结合附图和具体实施例对本发明进行详细阐述。

应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。

传统的动态链接动态预测过程中,虽然可以根据用户的历史行为和兴趣进行推荐,但往往忽视了用户的社交网络信息和动态行为模式,这使得推荐结果可能无法准确反映用户的当前需求和兴趣;同时统的动态链接动态预测还存在着数据质量要求高、数据要求苛刻、特征构造不足、缺少时间数据的利用等问题。本发明利用社交网络和用户行为分析,能有效预测用户的回流行为,并提供更精准的推荐。

下面以平台记录的某个用户的商品分享行为和其他用户的回流行为数据(示意数据)为例进行分析,阐述本发明方法的详细步骤:

步骤S10:获取电商平台提供的脱敏后的用户注册信息、历史分享交互信息、商品信息,并进行数据清洗,以生成可用于分析的历史分享交互分析数据集;

步骤S101:利用脱敏后的注册信息、历史交互信息、商品信息数据,得到待处理的初始数据。

步骤S102:对于数据缺失严重的记录,将其从数据集中删除。

此处所指的“数据缺失严重”的记录,主要是指那些由于网络等问题导致部分数据项随机缺失的历史分享交互数据记录,与用户分享交互行为并无明显相关性,因此可选用直接删除的方式剔除这类缺失数据,仅保留有效历史分享交互行为数据,使模型训练更精确。

步骤S103:删除极端异常问题数据和重复数据。

在对初始数据进行初步分析后,发现数据集中存在一小部分极端异常数据,这些数据可能源自于一些异常用户,他们的特征是分享数量极高且有固定分享群体,但自身回流极少甚至为零。

这种情况可能是由于这些用户的行为并非出于真实的购买需求,而是为了其他目的(如广告推广、恶意刷单等)而进行的大量分享行为。这类数据会对模型的训练产生负面影响,因为它们并不能反映出正常用户的真实行为模式。

需要注意的是,这只是处理极端异常数据的一种方式,实际的处理步骤可能需要根据具体的数据情况进行调整,此处仅为当前数据集条件下的一个示例。此外,虽然如何更好地处理异常数据是一个值得深入研究的问题,但它并不是本发明的主要关注点。本发明的目标是提出一种电商平台动态链接预测方法,而处理异常数据只是实现这一目标的预处理步骤之一。

步骤S104:对数据进行其他预处理。

时间数据被简化为日期部分以提高模型速度,预处理步骤可能根据数据特性和模型需求进行调整,如处理缺失值或进行数据平衡等,因此需要根据实际情况进行灵活处理。

步骤S20:对步骤S10获得的历史分享交互分析数据集,筛选可用特征,生成可用于训练的数据集;

表1为某购物平台预处理后数据

本发明实施例中,所需的用户信息数据部分主要关注用户的等级,作为评估用户历史活跃度的一个因素,而不考虑用户的年龄、性别等信息。这样做的原因有两个:一是出于对用户隐私的保护,二是因为用户在注册时提供的这些信息可能是虚假的,甚至是错误的、没有提供的;为了确保这些不确定的数据不会对预测结果产生负面影响,本发明实施例不使用这些信息,因此删去这些数据。

步骤S30:构建基于社交网络和用户行为的动态链接预测模型,预测将来的用户间分享交互;

步骤S301:使用数据集进行交互网络构建。

将每一次的交互涉及的用户视为节点,每一次的交互行为视为一个有向边,从而构建出一个交互网络,请参阅图3,图3为交互网络的局部示意图:

①收集与分享事件相关的数据。

②收集与分享事件相关的数据,这些数据可能包括分享事件的分享用户、分享事件的商品、分享事件发生的时间,作为回流场景。

③寻找用户的相似用户群体作为潜在回流者。

④基于现有交互数据集,寻找在商品交互选择上与特定用户有相似性的其他用户;如表1示例数据所示,若要寻找用户'5gnj'的相似用户群体,首先需要找出用户'5gnj'交互过的所有商品。这可以通过在数据集中搜索所有与'5gnj'相关的互动记录(包含分享、回流)来实现。对于表1中的数据,可以看到'5gnj'与商品'dxa'、'mno'、'fgh4'有过交互。接着需要找出那些与这些商品有过交互的其他用户。这些用户可能与'5gnj'有相似的商品选择偏好,因此可以被视为'5gnj'的相似用户;例如,对于商品'fgh4',表1中与之互动过的用户还有'gre4'、'7hkl'、'w4xy';因此,可以认为'gre4'、'7hkl'、'w4xy'是'5gnj'的相似用户之一,即为潜在回流者。

⑤计算用户与相似用户之间的初始回流可能性预测值。

⑥计算用户与每个相似用户之间的相似度评分R

步骤S40:基于S30构建的用户行为构建动态链接预测模型,根据具体情况引入其他特征得到修正参数,对模型进行修正;

步骤S401:引入潜在回流者的个体特征对模型进行修正。

使用交互数据集,首先引入潜在回流者个体在该分享商品属性上的交互兴趣得到第一修正系数α

步骤S402:引入一级潜在回流者与分享用户的交互强度和忠诚度对模型进行进一步的修正。

使用交互数据集,判断该潜在回流者在交互数据集中是否和分享用户直接交互过,即为分享用户的一级潜在回流者,然后引入基于一级潜在回流者与当前分享用户之间的交互强度得到第三修正系数α

步骤S50:根据S30构建的交互网络和S40中的最终回流得分R

步骤S501:基于步骤S30中的交互网络,寻找分享用户的紧密相关用户并对潜在回流者进行分类。

步骤S502:基于构建的用户间交互网络,采用广度优先遍历的方法,寻找当前分享用户在网络中的一级邻居、二级邻居、三级邻居、其他高阶邻居,作为与当前分享用户交互紧密的用户群体,并与S30中的潜在回流者取交集进行分类,得到该分享用户的一级潜在回流者、二级潜在回流者、三级潜在回流者及其他潜在回流者。

步骤S503:对一级潜在回流者、二级潜在回流者、三级潜在回流者及其他潜在回流者的最终回流得分R

步骤S504:根据业务需要确定所需推荐的数量,在本实例中预设为5,即给出回流可能性最高的top5个潜在回流者。

依次从一级潜在回流者、二级潜在回流者、三级潜在回流者及其他潜在回流者中选取候选用户,直到数量满足预设要求。

表2未某新回流场景下预测数据

综上,本发明基于用户的交互网络和行为分析进行动态链接预测,以精准预测和识别商品分享行为中可能得回流用户。

此外,在一种实施例中,基于与前述实施例相同的发明思路,本发明实施例提供了一种电商平台动态链接预测系统,所述系统与实施例1的所述方法一一对应,请参阅图4,图4为电商平台动态链接预测系统的结构框图,所述系统包括:

数据采集单元,所述数据采集单元用于获取历史交互数据,以构建交互数据集;

交互网络构建单元,所述交互网络构建单元基于交互数据集构建以图结构刻画的交互网络,所述交互网络的节点代表分享用户和回流用户,所述交互网络的边代表分享用户和回流用户之间的交互行为;

预测模型构建单元,所述预测模型构建单元基于交互网络寻找每个分享用户在商品属性上的相似用户群体作为潜在回流者,以构造动态链接预测模型;

模型修正单元,所述模型修正单元基于潜在回流者的个体特征、交互强度以及忠诚度对动态链接预测模型进行模型修正,以得到最终回流得分;

推荐用户预测单元,所述推荐用户预测单元基于交互网络和最终回流得分对潜在回流者进行筛选和排序,以得到最终推荐用户。

需要说明的是,本实施例中电商平台动态链接预测系统中各单元是与前述实施例中的电商平台动态链接预测方法中的各步骤一一对应,因此,本实施例的具体实施方式和达到的技术效果可参照前述电商平台动态链接预测方法,这里不再赘述。

此外,在一种实施例中,本申请还提供一种计算机设备,所述计算机设备包括处理器,存储器以及存储在所述存储器中的计算机程序,所述计算机程序被处理器运行时实现前述实施例中方法。

此外,在一种实施例中,本申请还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现前述实施例中方法。

在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。计算机可以是包括智能终端和服务器在内的各种计算设备。

在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。

作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台多媒体终端设备(可以是手机,计算机,电视接收机,或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

相关技术
  • 路线规划方法、装置、电子设备及可读存储介质
  • 游览路线规划方法、装置、设备和存储介质
  • 拼车路线的确定方法及装置、存储介质、计算设备
  • 路径规划方法、装置、电子设备及存储介质
  • 运动规划方法、装置、设备及计算机可读存储介质
  • 路线规划方法及路线规划装置、计算机设备和存储介质
  • 路线规划方法、路线规划装置、机器人及介质
技术分类

06120116559808