掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备和存储介质

文献发布时间:2023-06-19 12:19:35


数据处理方法、装置、设备和存储介质

技术领域

本申请涉及计算机技术领域,特别是涉及一种数据处理方法和装置、一种电子设备和一种存储介质。

背景技术

随着互联网技术的发展,越来越多的用户在网络上执行各种操作,例如与其他交互,基于网络进行购物,通过网络进行线上、线下的支付等。

随着用户在网络中执行的操作越来越多,也可以对用户的行为进行预测,但当前对于用户的预测,往往是基于该用户的行为进行个体行为的预测。例如用户相似行为的用户来预测可能的行为等。

但是,这种预测通常只考虑用户的个体属性,准确性较低。

发明内容

本申请实施例提供了一种数据处理方法,以提高预测的准确性。

相应的,本申请实施例还提供了一种数据处理装置、一种电子设备以及一种存储介质,用以保证上述方法的实现及应用。

为了解决上述问题,本申请实施例公开了一种数据处理方法,所述方法包括:以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;在所述异构关系网络中,确定以目标用户为起点的多条元路径序列;基于第一注意力信息,确定所述元路径序列对应的路径向量;基于第二注意力信息和所述路径向量,预测所述目标用户的特征值。

本申请实施例还公开了一种数据处理方法,所述方法包括:以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的逾期信息;依据所述逾期信息,确定所述目标用户的请求结果。

本申请实施例还公开了一种数据处理方法,所述方法包括:以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值;依据所述特征值,确定所述目标用户的推荐信息,以便为所述目标用户推荐所述推荐信息。

本申请实施例还公开了一种数据处理方法,所述方法包括:以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的虚假信息;依据所述虚假信息,确定所述目标用户的请求结果。

本申请实施例还公开了一种数据处理装置,其特征在于,包括:网络建立模块,用于以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;序列确定模块,用于在所述异构关系网络中,确定以目标用户为起点的多条元路径序列;路径提取模块,用于基于第一注意力信息,从所述元路径序列中提取目标长度的目标路径;特征预测模块,用于基于第二注意力信息和所述目标路径,预测所述目标用户的特征值。

本申请实施例还公开了一种数据处理装置,包括:建立模块,用于建立模块以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户;预测模块,用于依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值,所述特征值包括以下至少一种:逾期信息、推荐信息对应的特征值、虚假信息;反馈模块,用于依据所述特征值,确定所述目标用户的反馈结果,所述反馈结果包括以下至少一种:依据逾期信息确定的请求结果、推荐信息、依据虚假信息确定的请求结果。

本申请实施例还公开了一种电子设备,其特征在于,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。

本申请实施例还公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。

与现有技术相比,本申请实施例包括以下优点:

在本申请实施例中,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户,然后在所述异构关系网络中,确定以目标用户为起点的多条元路径序列,结合注意力机制确定所述元路径序列的路径向量,并预测所述目标用户的特征值,融合个体属性和异构关系网络,提高预测的准确性。

附图说明

图1是本申请实施例的一种数据处理处理示意图;

图2是本申请实施例的一种异构关系网络示例的网络架构示意图;

图3是本申请的一种数据处理方法实施例的步骤流程图;

图4是本申请的另一种数据处理方法实施例的步骤流程图;

图5是本申请的一种数据处理方法实施例中逾期场景示例的步骤流程图;

图6是本申请的一种数据处理方法实施例中推荐场景示例的步骤流程图;

图7是本申请的一种数据处理方法实施例中欺骗用户识别场景示例的步骤流程图;

图8是本申请的一种数据处理装置实施例的结构框图;

图9是本申请的一种数据处理装置可选实施例的结构框图;

图10是本申请的另一种数据处理装置实施例的结构框图;

图11是本申请一实施例提供的装置的结构示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。

本申请实施例中可应用于基于大数据的数据处理领域,通过对用户的分析确定用户的特征预测,从而可基于所需要预测的不同场景而执行相应的场景特征的预测。例如可预测用户的期限遵守类特征,例如逾期预测,守期预测,搜索推荐特征预测,营销预测等,还可预测用户的信用信息、行为特征等。

如图1所示的一种数据处理示意图中。可以基于异构关系网络构建各种用户以及其他对象之间的关联,从而能够基于该异构关系网络确定用户的特征得到相应的特征值,基于该特征值在相应的场景中予以反馈。

步骤102,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

其中,可从多种数据源获取数据,从而基于大数据进行预测分析。例如,可以从各种网站、平台等数据提供方的服务端获取数据对象的对象关系,将数据对象的对象关系作为视图,则基于不同数据提供方所提供的数据关系,可以构建异构关系网络,也可称为多视图异构网络。数据提供方可为各种不同类型的网站、平台等,如社交网站、购物网站、与资金往来相关的平台等,从而由这些不同类型的数据提供方的服务端提供数据,从数据中抽取对象以及对象之间的关系,对象可包括多种类型,如用户、设备和商家等,相应对象之间的关系也包括多种不同的类型,如用户之间的朋友、同事、家人关系,用户和设备之间的所属、使用关系,用户和商家之间的资金往来关系等。相对于对象之间单一的关系,这些关系互相之间互称为异构关系,基于不同中关系所构成的网络称为异构关系网络,因此该异构关系网络可以理解为由多种不同类型的对象以及不同类型的对象之间关系所构成的网络。

可以将对象作为节点,对象之间的关系作为边来建立异构关系网络,在另外一些示例中,节点和边可以通过图形的方式显示,因此可以将节点和边作为一种视图,从而异构关系网络也可称为多视图异构网络。从而可基于对象,对象之间的关系,生成多对象、多关系的异构关系网络。所述节点对应节点属性,所述边对应边属性;所述节点属性包括以下至少一种:信用信息、购买行为、资产信息;所述边属性包括以下至少一种:链接类型、关联时间、互动频率。

如图1中为一种异构关系网络的示例,如图2所示的一种异构关系网络的示意图,为另一种异构关系网络的示例。对象包括用户、设备和商家,其中,设备包括设备D1-D4,用户包括用户U1-U5,商家包括商家M1、M2,在图2中,对象之间不同类型的关系以不同的线条显示,例如社交类的关系通过点划线表示,设备类的关系通过虚线表示,资金类的关系通过点划线表示。

本申请实施例中,还可抽取各种对象的属性,以及对象间关系的属性,从而便于进行用户特征的预测。其中,对象的属性包括以下至少一种:信用信息、购买行为、资产信息,对象间关系的属性包括以下至少一种:链接类型、关联时间、互动频率。具体属性可依据场景需求确定。

本申请实施例中,各种数据可在获取到相关数据源以及用户的允许后获取。其中,可确定训练数据并未训练数据中用户标注相应的特征标签,从而基于训练数据来进行训练,预测用户符合对应特征的概率。

步骤104,在所述异构关系网络中,确定以目标用户为起点的多条元路径序列。

可以确定要预测的目标用户,然后在异构关系网络,提取以目标用户为起点的元路径序列。通常异构关系网络中可记载用户和其他对象之间的多种关系,因此可提取以目标用户为起点,由边和节点所构成的多条路径,将每条路径中的节点和边构成序列,得到多条元路径序列。如图1中,提取4个路径构成元路径序列,又如图2中,以U1为目标用户,可以提取路径A:

本申请实施例中,元路径序列可以理解为连接节点的关系序列,如连接两个节点的关系序列,这两个节点可通过相应的语义关系建立连接。一个可选实施例中,所述确定以目标用户为起点的多条元路径序列,包括:将目标用户对应的节点作为起始节点;分别确定多条从所述起始节点开始,通过边连接的节点对应的路径;依据所述路径确定元路径序列。本申请实施例中,可基于场景的需求设置元路径的定义信息,如元路径定义为包含一种或多种关系的路径,还可定义所需包含的关系等,从而可基于元路径的定义信息,在异构关系网络中提取以目标用户的节点为起点的多条路径,其中,每条路径以目标用户对应节点为起始节点,在异构关系网络中提取由节点和连接节点的边所构成的路径,该路径的起点为该起始节点,从而路径中节点和边可以构成序列,称为元路径序列。如路径A:

步骤106,基于第一注意力信息,确定所述元路径序列对应的路径向量。

本申请实施例的异构关系网络中,节点和边对应有属性,因此可基于属性来确定节点、边之间的互相作用关系,考虑到不同的节点、链路和元路径可能具有不同的重要性,可基于注意机制来模拟用户对它们的偏好。从而分析各种场景特征对应用户的注意力以及偏好。因此可基于注意力机制进行用户特征的分析,基于不同用户的注意力分析不同用户的特征,从而对要分析的场景特征可结合用户的注意力进行预测,预测不同注意力的用户满足相应场景特征的概率。以逾期场景为例,逾期用户可能多使用信用账户,且在多个节点之间转账,而非逾期用户可能多使用现金账户,或者转账的节点地域2~3个等。

其中,注意力机制(Attention Mechanism)源于对人类视觉的研究,在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息,基于这种机制而产生注意力机制。基于注意力机制可以使网络如神经网络具备专注于输入或特征的能力,从而选择特定输入进行处理。

因此可基于注意力机制确定注意力信息,然后采用注意力信息来确定节点、边等对于目标用户的重要程度,再基于该重要程度、节点属性、边属性等确定各元路径序列对应的路径向量。其中,可基于注意力机制构建注意力模型,并进行模型训练,得到训练好的注意力模型作为注意力信息,或称注意力识别器,基于注意力的映射信息等。本申请实施例中,针对节点、边以及路径等可以创建不同的注意力模型,从而得到不同的注意力信息。一个可选实施例中,所述注意力信息包括第一注意力信息和第二注意力信息,所述第一注意力信息用于确定节点、边相对于目标用户的重要度,所述第二注意力信息用于确定路径向量对于所述目标用的路径重要度。

一个可选实施例中,可所述基于第一注意力信息,确定所述元路径序列对应的路径向量,包括:基于第一注意力信息,确定所述元路径序列中目标序列对所述目标用户的重要度;依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。可以基于第一注意力信息确定元路径序列中目标序列对所述目标用户的重要度,其中,目标序列包括由节点构成的节点序列,由边构成的边序列,相应可计算节点序列、边序列对目标用户的重要程度的,得到相应的重要度,再基于重要度和各元路径序列的特征信息,确定元路径序列对应的路径向量。其中,元路径序列的特征信息与该元路径序列的边、节点相关,特征信息可包括边特征和节点特征,边特征依据边属性确定,节点特征依据节点属性确定。如所述边对应边属性;所述节点属性包括以下至少一种:信用信息、购买行为、资产信息;则基于指定节点的节点属性的属性值,可以计算该指定节点的节点特征;所述边属性包括以下至少一种:链接类型、关联时间、互动频率,则基于指定边的边属性的属性值,可以计算该指定边的边特征等。

所述基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度,包括:依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。

可以从元路径序列中提取节点序列,例如从元路径序列

从元路径序列中还可提取边序列,例如从元路径序列

在确定出节点序列对于目标用户的节点重要度,以及边序列对于目标用户的边重要度后,可基于节点重要度和边重要度计算来计算元路径序列的路径向量。因此在一个可选实施例中,所述依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量,包括:依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

在确定出节点序列对于目标用户的节点重要度,以及边序列对于目标用户的边重要度后,可以基于节点重要度和节点特征计算第一向量,如将各节点重要度和节点特征相乘并求和,得到第一向量,还可依据边重要度和边特征计算第二向量,如将各边重要度和边特征相乘并求和,得到第二向量,其中,可以预先指定第一向量和第二向量的长度,从而计算得到定长的向量,然后可以将第一向量和第二向量进行拼接,得到该元路径序列对应的路径向量。

在一些可选实施例中,还可基于池化层(average pooling)对各元路径序列对应的路径向量进行处理,如通过池化层将各元路径序列对应的路径向量进行聚合处理,得到对应的目标路径向量,该目标路径向量可以理解为一种元路径序列的整体表示,用以表示目标用户的特定特性。符合不同场景特征的用户可能对不同的路径有不同的偏好,因此基于注意力机制来捕捉用户的偏好,能够有效的确定出用户所符合的场景特征。

步骤208,基于第二注意力信息和所述路径向量,预测所述目标用户的特征值。

可以基于第二注意力信息和所述路径向量,来预测目标用户的特征值,例如在逾期预测的场景中,可预测用户的逾期概率,作为逾期信息,其中,可以预先确定具有指定场景特征的用户偏好,如逾期用户的逾期特征,虚假用户的虚假用户特征等,以此来构建多层感知器,结合多层感知器来对目标用户进行预测,确定目标用户的特征值,如逾期预测值。

所述基于第二注意力信息和所述路径向量,预测所述目标用户的特征值,包括:基于第二注意力信息,计算所述路径向量对于所述目标用户的路径重要度;通过多层感知器和所述路径重要度,预测所述目标用户的特征值。

第二注意力信息可基于路径注意力(meta-path attention)机制确定,例如基于self_attention构建由节点和边构成的路径的第二注意力信息,计算所述路径向量对于所述目标用户的路径重要度。其中,如果基于池化层对路径向量进行聚合处理,得到目标路径向量,则基于第二注意力信息计算目标路径向量对于所述目标用户的路径重要度,从而可以得到目标用户对于路径的偏好。再基于多层感知器和所述路径重要度进行处理,所述多层感知器(Multilayer Perceptron,MLP)可以理解为一种前馈人工神经网络模型,其可将输入的多个数据集映射到单一的输出的数据集上,从而可基于多个路径向量,或者多个目标路径向量以及相应的路径重要度,预测所述目标用户的特征值,如逾期概率等逾期信息。

本申请实施例的异构关系网络,基于属性来确定节点、边之间的互相作用关系,考虑到不同的节点、链路和元路径可能具有不同的重要性,可基于注意机制来模拟用户对它们的偏好。从而分析各种场景特征对应用户的注意力以及偏好,基于历史数据可确定用户对应的偏好并标注相应的特征标签,从而基于历史数据来训练多层感知器,预测用户的特征概率,作为相应特征值,再基于相应得到特征标签对多层感知器进行调整,直到多层感知器的预测结果达到场景的需求。从而在基于注意力机制确定用户的路径偏好之后,可集合多层感知器进行预测,得到相应的预测中。

本实施例中,多层感知器可以理解为用于预测逾期特征的逾期类多层感知器,从而可预测得到用户的逾期预测值,应用到各种对于用户期限进行分析的场景中,确定用户出现逾期(超期)的概率,从而分析相应场景的风险。

综上,可以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户,然后在所述异构关系网络中,确定以目标用户为起点的多条元路径序列,结合注意力机制从所述元路径序列中提取目标长度的目标路径,并预测预测所述目标用户的特征值,融合个体属性和异构关系网络,提高预测的准确性。

在上述实施例的基础上,本实施例还提供了一种数据处理方法,能够基于多视图属性异构网络,结合用户所关联的一阶、高阶对象的行为特征和关系,来对目标用户的场景特征进行预测。

参照图3,示出了本申请的一种数据处理方法实施例的步骤流程图。

步骤302,以对象为节点,对象之间的关系为边建立异构关系网络。所述对象包括用户、设备和/或商家。所述节点对应节点属性,所述边对应边属性;所述逾期预测值的计算与节点属性、边属性相关。所述节点属性包括以下至少一种:信用信息、购买行为、资产信息;所述边属性包括以下至少一种:链接类型、关联时间、互动频率。

步骤304,在所述异构关系网络中,确定以目标用户为起点的多条元路径序列。

步骤306,基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度。

所述基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度,包括:依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。

步骤308,依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。

所述依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量,包括:依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

步骤310,基于第二注意力信息,计算所述路径向量对于所述目标用的路径重要度。

步骤312,通过多层感知器和所述路径重要度,预测所述目标用户的特征值。

本实施例中各步骤与上述实施例中对应步骤类似,具体可参见上述实施例的论述。

从而能够综合考虑了网络拓扑信息以及个体属性的用户,精确率和召回率都有较大的提升。

在上述实施例的基础上,本实施例还提供了一种数据处理方法,以应用于逾期场景为例,能够基于多视图属性异构网络,结合用户所关联的一阶、高阶对象的行为特征和关系,来对目标用户的逾期概率进行预测。

参照图4,示出了本申请的另一种数据处理方法实施例的步骤流程图。

步骤402,以对象为节点,对象之间的关系为边建立异构关系网络。所述对象包括用户、设备和/或商家。所述节点对应节点属性,所述边对应边属性;所述逾期预测值的计算与节点属性、边属性相关。所述节点属性包括以下至少一种:信用信息、购买行为、资产信息;所述边属性包括以下至少一种:链接类型、关联时间、互动频率。

步骤404,在所述异构关系网络中,确定以目标用户为起点的多条元路径序列。

步骤406,依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度。

步骤408,依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。

步骤410,依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量。

步骤412,将所述第一向量和第二向量进行拼接,确定对应的路径向量。

步骤414,基于池化层对各路径向量进行聚合处理,得到目标路径向量。

步骤416,基于第二注意力信息,计算所述目标路径向量对于所述目标用的路径重要度。

步骤418,通过多层感知器和所述路径重要度,预测所述目标用户的逾期信息。

本实施例中各步骤与上述实施例中对应步骤类似,具体可参见上述实施例的论述。

本申请实施例基于多视图属性异构网络,确定目标用户以及其所关联的一阶、高阶对象的行为特征,考虑到各用户以及关联对象的属性和关系,从而融合个体属性和异构关系网络,并且结合多attention机制,从而综合考虑了网络拓扑信息以及个体属性的用户,精确率和召回率都有较大的提升,鲁棒性好,经过相应的实现测试,准确率得到有效提升。

本申请实施例可应用于各种场景对应特征的额预测中,例如逾期预测,守期预测,搜索推荐特征预测,营销预测等,还可预测用户的信用信息、行为特征等。以下以其中的几个场景为例进行论述。

以逾期、守期预测的场景为例,逾期可以理解为不遵守期限、超期等,守期可以理解为遵守期限,与期限相关的场景均可通过逾期信息来表征用户对于期限遵守与否的特征,如逾期信息为概率或者数值等,则正数可表征超期的可能性,越大则超期概率越大,负数可以表征守期的可能性等,具体可依据实际需求确定,本实施例以逾期信息为例进行论述。

参照图5,示出了本申请的一种数据处理方法实施例中逾期场景示例的步骤流程图。

步骤502,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

步骤504,依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的逾期信息。

其中,所述依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的逾期信息,包括:在所述异构关系网络中,确定以目标用户为起点的多条元路径序列;基于第一注意力信息,确定所述元路径序列对应的路径向量;基于第二注意力信息和所述路径向量,预测所述目标用户的逾期信息。

一个可选实施例中,所述确定以目标用户为起点的多条元路径序列,包括:将目标用户对应的节点作为起始节点;分别确定多条从所述起始节点开始,通过边连接的节点对应的路径;依据所述路径确定元路径序列。

另一个可选实施例中,所述基于第一注意力信息,确定所述元路径序列对应的路径向量,包括:基于第一注意力信息,确定所述元路径序列中目标序列对所述目标用户的重要度;依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。所述基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度,包括:依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。所述依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量,包括:依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

另一个可选实施例中,所述基于第二注意力信息和所述路径向量,预测所述目标用户的逾期信息,包括:基于第二注意力信息,计算所述路径向量对于所述目标用的路径重要度;通过多层感知器和所述路径重要度,预测所述目标用户的逾期信息。

其中,该多层感知器可基于历史数据训练得到,可获取历史数据中逾期用户、守期用户对应的路径数据,从而训练多层感知器,使得该多层感知器可确定逾期用户、守期用户对应的特征,基于用户的路径向量可感知用户的特征,确定用户的逾期概率等逾期信息。例如基于历史数据确定超期用户多使用信用账户,与其他用户之间存在借款关系等,从而可以统计这类用户的路径特征训练多层感知器,则基于目标用户的路径向量和多层感知器,可以预测用户在逾期场景的逾期概率等逾期信息。

本申请实施例的步骤与上述实施例中对应步骤类似,具体可参见上述实施例的描述。

步骤506,依据所述逾期信息,确定所述目标用户的请求结果。

本申请实施例中,目标用户可以为发出与期限相关请求的用户,如借款用户等,在接收到用户的期限相关请求后,可以通过上述步骤预测目标用户的逾期信息。然后依据该逾期信息确定请求的请求结果,例如逾期信息为逾期概率,则逾期概率越大,借款的额度、可能性等就越小,例如逾期概率超过第一阈值,则借款额度可低于第一额度,逾期概率超过第二阈值,可拒绝借款,从而可以据此确定相应的请求结果,并进行反馈。

例如,在金融领域中,可基于该逾期信息识别在线信用支付服务中的违约者,从而对于违约者的借款等金融请求进行拒绝,或者限制借款金额等。

以推荐场景为例,用户可以搜索自己感兴趣的内容,例如在搜索引擎搜索新闻,在交易网站搜索商品等,可在接收到用户的搜索请求后,预测用户的特征值,基于该特征值确定用户感兴趣的内容,从而基于该特征值确定搜索结果。

参照图6,示出了本申请的一种数据处理方法实施例中推荐场景示例的步骤流程图。

步骤602,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

步骤604,依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值。

其中,所述依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值,包括:在所述异构关系网络中,确定以目标用户为起点的多条元路径序列;基于第一注意力信息,确定所述元路径序列对应的路径向量;基于第二注意力信息和所述路径向量,预测所述目标用户的特征值。

一个可选实施例中,所述确定以目标用户为起点的多条元路径序列,包括:将目标用户对应的节点作为起始节点;分别确定多条从所述起始节点开始,通过边连接的节点对应的路径;依据所述路径确定元路径序列。

另一个可选实施例中,所述基于第一注意力信息,确定所述元路径序列对应的路径向量,包括:基于第一注意力信息,确定所述元路径序列中目标序列对所述目标用户的重要度;依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。所述基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度,包括:依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。所述依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量,包括:依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

另一个可选实施例中,所述基于第二注意力信息和所述路径向量,预测所述目标用户的特征值,包括:基于第二注意力信息,计算所述路径向量对于所述目标用的路径重要度;通过多层感知器和所述路径重要度,预测所述目标用户的特征值。

其中,该多层感知器可基于历史数据训练得到,可获取历史数据中用户对应的路径数据,从而训练多层感知器,使得该多层感知器可确定用户对应的个性化特征,基于用户的路径向量可感知用户的个性化特征,例如对于那种类型的新闻、商品等比较感兴趣等。

本申请实施例的步骤与上述实施例中对应步骤类似,具体可参见上述实施例的描述。

步骤606,依据所述特征值,确定所述目标用户的推荐信息,以便为所述目标用户推荐所述推荐信息。

本申请实施例中,在接收到用户的搜索请求、查询请求等请求时,可以基于异构关系网络预测用户的特征值,然后依据该特征值匹配该目标用户的推荐信息,然后在请求结果智能柜添加该推荐信息,以便给用户反馈。另外,在一些用户登录网站、应用程序等情况下,也可预测该用户的特征值并匹配推荐信息,从而给用户推荐所述推荐信息,便于用户查看感兴趣的推荐信息,提高访问效率和点击率。

以营销、欺骗用户识别场景为例,有时一些服务提供方的网站,应用程序等会进行营销推广,比如游戏网站、电子交易网站等,在营销推广活动中,可以向用户推荐相应的商品、对象等,也可以给用户发放一些福利信息,例如游戏礼包、红包、购物券等福利信息,因此需要识别用户并给有效用户发放福利信息。

参照图7,示出了本申请的一种数据处理方法实施例中欺骗用户识别场景示例的步骤流程图。

步骤702,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

步骤704,依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的虚假信息。

其中,所述依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的虚假信息,包括:在所述异构关系网络中,确定以目标用户为起点的多条元路径序列;基于第一注意力信息,确定所述元路径序列对应的路径向量;基于第二注意力信息和所述路径向量,预测所述目标用户的虚假信息。

一个可选实施例中,所述确定以目标用户为起点的多条元路径序列,包括:将目标用户对应的节点作为起始节点;分别确定多条从所述起始节点开始,通过边连接的节点对应的路径;依据所述路径确定元路径序列。

另一个可选实施例中,所述基于第一注意力信息,确定所述元路径序列对应的路径向量,包括:基于第一注意力信息,确定所述元路径序列中目标序列对所述目标用户的重要度;依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。所述基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度,包括:依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。所述依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量,包括:依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

另一个可选实施例中,所述基于第二注意力信息和所述路径向量,预测所述目标用户的虚假信息,包括:基于第二注意力信息,计算所述路径向量对于所述目标用的路径重要度;通过多层感知器和所述路径重要度,预测所述目标用户的虚假信息。

其中,该多层感知器可基于历史数据训练得到,可获取历史数据中虚假用户对应的路径数据,从而训练多层感知器,使得该多层感知器可确定用户对应的特征,基于用户的路径向量可感知特征,确定虚假信息。例如,在虚假用户识别的场景中,通常虚假用户会使用身份证注册多个帐户,每个账户可以称为一个用户,则这些账户(用户)往往存在社交关系,但是,这些帐户往往是在有限的设备上登录,例如一个设备上登录有20个账户,可将账户(用户)、设备等作为对象,结合其所具有的社交关系和设备关系构建异构关系网络,并且确定虚假用户的路径向量来训练多层感知器,从而多层感知器可识别这类虚假用户的虚假信息,而后以其中任一账户为目标用户,确定多条元路径序列后,可以基于结合起来,可以确定出某些目标用户为虚假用户的概率,作为虚假信息。

本申请实施例的步骤与上述实施例中对应步骤类似,具体可参见上述实施例的描述。

步骤706,依据所述虚假信息,确定所述目标用户的请求结果。

得到用户的虚假信息,如用户为虚假用户的概率等,从而可确定相应的营销场景中,福利信息是否可向该用户发放,例如确定一个用户为虚假用户的概率较高,则可不向该用户发放福利信息,生成拒绝请求的请求结果。

另外,对于虚假用户的特征预测的场景,还可应用于金融等场景中,例如确定一个账户是否可能为欺诈账户,从而针对可能的欺诈账户予以限制操作,或者对与欺诈账户进行交互的用户进行风险提醒等,并生成相应的请求结果。另外,在一些社交、通信软件中,有一些群组中也可识别欺诈账户,并进行提醒、限制等操作,,并生成相应的请求结果,以避免用户被欺骗。

本申请实施例可对元路径上的节点序列和边序列进行建模,以及捕捉不同视图网络的重要程度,最后通过分类实现对用户是否逾期的识别。

本申请实施例以逾期特征为例进行论述,实际处理中可应用于各种场景中,识别相应的场景特征,例如应用于搜索推荐场景,欺诈交易场景,红包营销作弊场景等,识别相应的场景特征。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。

在上述实施例的基础上,本实施例还提供了一种数据处理装置,应用于服务端的各种电子设备中。

参照图8,示出了本申请的一种数据处理装置实施例的结构框图,具体可以包括如下模块:

网络建立模块802,用于以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

序列确定模块804,用于在所述异构关系网络中,确定以目标用户为起点的多条元路径序列。

路径提取模块806,用于基于第一注意力信息,确定所述元路径序列对应的路径向量。

特征预测模块808,用于基于第二注意力信息和所述路径向量,预测所述目标用户的特征值。

综上,以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户,然后在所述异构关系网络中,确定以目标用户为起点的多条元路径序列,结合注意力机制从所述元路径序列中提取目标长度的目标路径,并预测预测所述目标用户的特征值,融合个体属性和异构关系网络,提高预测的准确性。

参照图9,示出了本申请的一种数据处理装置实施例的结构框图,具体可以包括如下模块:

网络建立模块802,用于以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

序列确定模块804,用于在所述异构关系网络中,确定以目标用户为起点的多条元路径序列。

路径提取模块806,用于基于第一注意力信息,确定所述元路径序列对应的路径向量。

特征预测模块808,用于基于第二注意力信息和所述路径向量,预测所述目标用户的特征值。

所述序列确定模块804,用于依据元路径的定义信息,确定以目标用户为起点的多条元路径序列。

路径提取模块806,包括:重要度确定子模块8062和向量确定子模块8064,其中:

所述重要度确定子模块8062,用于基于第一注意力信息,确定所述元路径序列中目标序列对所述目标对象的重要度;

所述向量确定子模块8064,用于依据所述重要度和所述元路径序列的特征信息,确定所述元路径序列对应的路径向量。

所述重要度确定子模块8062,用于依据节点注意力信息,计算所述元路径序列中节点序列对所述目标用户的节点重要度;依据边注意力信息,计算所述元路径序列中边序列对所述目标用户的边重要度。

所述向量确定子模块8064,用于依据所述节点重要度和节点特征计算第一向量,并依据边重要度和边特征计算第二向量;将所述第一向量和第二向量进行拼接,确定对应的路径向量。

所述特征预测模块808,包括:注意力处理子模块8082和预测子模块8084,其中:

所述注意力处理子模块8082,用于基于第二注意力信息,计算所述路径向量对于所述目标用的路径重要度;

所述预测子模块8084,用于通过多层感知器和所述路径重要度,预测所述目标用户的特征值。

其中,所述对象还包括:设备和/或商家。

所述节点的节点特征依据节点属性确定,所述边的边特征依据边属性确定。所述节点属性包括以下至少一种:信用信息、购买行为、资产信息;所述边属性包括以下至少一种:链接类型、关联时间、互动频率。

所述特征值包括逾期信息。

在上述实施例的基础上,本实施例的数据处理装置,应用于服务端的电子设备中。

参照图10,示出了本申请的另一种数据处理装置实施例的结构框图,具体可以包括如下模块:

建立模块1002,用于建立模块以对象为节点,对象之间的关系为边建立异构关系网络,所述对象包括用户。

预测模块1004,用于依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值;

反馈模块1006,用于依据所述特征值,确定所述目标用户的反馈结果。

其中,所述建立模块与上述实施例的网络建立模块类似,所述预测模块与上述实施例的序列确定模块、路径提取模块和特征预测模块的功能类似,如一种示例中,所述预测模块包括序列确定模块、路径提取模块和特征预测模块,所述各模块可参照上述实施例中对应模块和方法部分的描述,本申请实施例对此不做限制。

以应用于逾期、守期预测的场景为例,所述特征值包括逾期信息,则所述反馈结果包括依据逾期信息确定的请求结果;所述预测模块1004,用于依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的逾期信息;所述反馈模块1006,用于依据所述逾期信息,确定所述目标用户的请求结果。

以应用于推荐场景为例,所述特征值包括推荐信息对应的特征值,所述反馈结果包括推荐信息,所述预测模块1004,用于依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的特征值;所述反馈模块1006,用于依据所述特征值,确定所述目标用户的推荐信息,以便为所述目标用户推荐所述推荐信息。

以应用于营销、欺骗用户识别的场景为例,所述特征值包括虚假信息,所述反馈结果包括依据虚假信息确定的请求结果,所述预测模块1004,用于依据所述异构关系网络和注意力信息,预测所述异构关系网络中目标用户的虚假信息;所述反馈模块1006,依据所述虚假信息,确定所述目标用户的请求结果。

本申请实施例基于多视图属性异构网络,确定目标用户以及其所关联的一阶、高阶对象的行为特征,考虑到各用户以及关联对象的属性和关系,从而融合个体属性和异构关系网络,并且结合多attention机制,从而综合考虑了网络拓扑信息以及个体属性的用户,精确率和召回率都有较大的提升,鲁棒性好,经过相应的实现测试,准确率得到有效提升。

本申请实施例可对元路径上的节点序列和边序列进行建模,以及捕捉不同视图网络的重要程度,最后通过分类实现对用户是否逾期的识别。

本申请实施例以逾期特征为例进行论述,实际处理中可应用于各种场景中,识别相应的场景特征,例如应用于搜索推荐场景,欺诈交易场景,红包营销作弊场景等,识别相应的场景特征。

本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。

本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括终端设备、服务器(集群)等各类型的设备。

本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括终端设备、服务器(集群)等电子设备。图11示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1100。

对于一个实施例,图11示出了示例性装置1100,该装置具有一个或多个处理器1102、被耦合到(一个或多个)处理器1102中的至少一个的控制模块(芯片组)1104、被耦合到控制模块1104的存储器1106、被耦合到控制模块1104的非易失性存储器(NVM)/存储设备1108、被耦合到控制模块1104的一个或多个输入/输出设备1110,以及被耦合到控制模块1104的网络接口1112。

处理器1102可包括一个或多个单核或多核处理器,处理器1102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1100能够作为本申请实施例中所述终端设备、服务器(集群)等设备。

在一些实施例中,装置1100可包括具有指令1114的一个或多个计算机可读介质(例如,存储器1106或NVM/存储设备1108)以及与该一个或多个计算机可读介质相合并被配置为执行指令1114以实现模块从而执行本公开中所述的动作的一个或多个处理器1102。

对于一个实施例,控制模块1104可包括任意适当的接口控制器,以向(一个或多个)处理器1102中的至少一个和/或与控制模块1104通信的任意适当的设备或组件提供任意适当的接口。

控制模块1104可包括存储器控制器模块,以向存储器1106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

存储器1106可被用于例如为装置1100加载和存储数据和/或指令1114。对于一个实施例,存储器1106可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1106可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例,控制模块1104可包括一个或多个输入/输出控制器,以向NVM/存储设备1108及(一个或多个)输入/输出设备1110提供接口。

例如,NVM/存储设备1108可被用于存储数据和/或指令1114。NVM/存储设备1108可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备1108可包括在物理上作为装置1100被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1108可通过网络经由(一个或多个)输入/输出设备1110进行访问。

(一个或多个)输入/输出设备1110可为装置1100提供接口以与任意其他适当的设备通信,输入/输出设备1110可以包括通信组件、音频组件、传感器组件等。网络接口1112可为装置1100提供接口以通过一个或多个网络通信,装置1100可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。

对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。

在各个实施例中,装置1100可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1100可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1100包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种数据处理方法和装置,一种电子设备和一种存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 移动设备的数据处理方法、装置、存储介质和移动设备
  • 行驶设备的数据处理方法、装置、设备及存储介质
技术分类

06120113255537