掌桥专利:专业的专利平台
掌桥专利
首页

基于社交关系的社交属性数据确定方法、装置及设备

文献发布时间:2023-06-19 11:35:49


基于社交关系的社交属性数据确定方法、装置及设备

技术领域

本公开涉及计算机技术领域,尤其涉及一种基于社交关系的社交属性数据确定方法、装置及设备。

背景技术

相关技术中,常用知识图谱的形式表示社交关系网,社交关系网指社会个体成员之间通过社交关系形成的网络体系,知识图谱是描述真实世界中存在的各种实体概念及其关系的语义网络,对于用知识图谱表示的社交关系网,节点表示对象等实体,边表示社交关系等。

在分析社交关系时,目前基于只能对小规模的社交关系网中找出不同对象间的关系紧密度,对各对象进行模糊的表示,但是对大规模的社交关系网中各对象进行标识时,其各对象的表示的准确度较低,使得根据各对象的表示分析其在社交关系网中的社交属性的效率低下。

发明内容

本公开实施例提供一种基于社交关系的社交属性数据确定方法、装置及设备,用于优化对社交关系网中各对象进行表示的方法。

本公开第一方面,提供一种基于社交关系的社交属性数据确定方法,包括:

获取社交关系数据集,其中所述社交关系数据集包括至少一个对象的社交关系数据,所述社交关系数据用于表示具有社交关系的不同对象间的关系紧密度;

根据所述社交关系数据集确定社交关系网,其中所述社交关系网包括所述至少一个对象的社交属性数据,所述社交属性数据是根据所述社交关系数据确定的,所述社交属性数据用于表示所述至少一个对象在所述社交关系网中的位置;

对所述社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度;

确定调整后的社交关系网中所述至少一个对象的社交属性数据。

在一种可能的实现方式中,所述社交关系数据包括多种关系类型,所述根据所述社交关系数据集确定社交关系网的步骤,包括:

确定所述多种关系类型中各种关系类型的权重;

根据所述社交关系数据集以及所述各种关系类型的权重确定所述社交关系网。

在一种可能的实现方式中,所述社交关系数据集包括目标社交场景下的社交关系数据;

所述确定所述多种关系类型中各种关系类型的权重的步骤,包括:

确定所述各种关系类型与目标社交场景的关联值,并根据所述关联值确定所述各种关系类型的权重;或者

确定所述目标社交场景对应的关系类型和权重的预设映射关系,根据所述关系类型和权重的预设映射关系确定所述各种关系类型的权重。

在一种可能的实现方式中,所述获取社交关系数据集的步骤之后,所述根据所述社交关系数据集确定社交关系网之前,还包括:

若确定所述至少一个对象中的异常对象,则从所述社交关系数据集中删除所述异常对象的社交关系数据,其中所述异常对象为影响所述社交关系网中其它对象的社交属性数据的准确度的对象,所述异常对象是根据对象的社交关系数据的数据量确定的。

在一种可能的实现方式中,所述对所述社交关系网进行调整的步骤,包括:

对所述社交关系网进行分布式调整至满足预设调整停止条件。

在一种可能的实现方式中,所述预设调整停止条件包括:

第一对象的数量达到预设数量,所述第一对象为对所述社交关系网进行调整时,社交属性数据的更新次数达到预设次数的对象;或者

所述社交关系网的目标函数的函数值达到预设函数值,所述目标函数的函数值表示所述社交关系网中不同对象间的关系紧密度的大小。

本公开第二方面,提供一种基于社交关系的社交属性数据确定装置,包括社交关系获取单元、社交关系网确定单元、关系网调整单元和属性数据确定单元,其中:

所述社交关系获取单元被配置为执行获取社交关系数据集,其中所述社交关系数据集包括至少一个对象的社交关系数据,所述社交关系数据用于表示具有社交关系的不同对象间的关系紧密度;

所述社交关系网确定单元被配置为执行根据所述社交关系数据集确定社交关系网,其中所述社交关系网包括所述至少一个对象的社交属性数据,所述社交属性数据是根据所述社交关系数据确定的,所述社交属性数据用于表示所述至少一个对象在所述社交关系网中的位置;

所述关系网调整单元被配置为执行对所述社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度;

所述属性数据确定单元被配置为执行确定调整后的社交关系网中所述至少一个对象的社交属性数据。

在一种可能的实现方式中,所述社交关系数据包括多种关系类型,所述社交关系网确定单元具体被配置为执行:

确定所述多种关系类型中各种关系类型的权重;

根据所述社交关系数据集以及所述各种关系类型的权重确定所述社交关系网。

在一种可能的实现方式中,所述社交关系数据集包括目标社交场景下的社交关系数据;

所述社交关系网确定单元具体被配置为执行:

确定所述各种关系类型与目标社交场景的关联值,并根据所述关联值确定所述各种关系类型的权重;或者

确定所述目标社交场景对应的关系类型和权重的预设映射关系,根据所述关系类型和权重的预设映射关系确定所述各种关系类型的权重。

在一种可能的实现方式中,所述社交关系获取单元还被配置为执行:

在所述获取社交关系数据集的步骤之后,所述根据所述社交关系数据集确定社交关系网之前,若确定所述至少一个对象中的异常对象,则从所述社交关系数据集中删除所述异常对象的社交关系数据,其中所述异常对象为影响所述社交关系网中其它对象的社交属性数据的准确度的对象,所述异常对象是根据对象的社交关系数据的数据量确定的。

在一种可能的实现方式中,所述关系网调整单元被配置为执行:

对所述社交关系网进行分布式调整至满足预设调整停止条件。

在一种可能的实现方式中,所述预设调整停止条件包括:

第一对象的数量达到预设数量,所述第一对象为对所述社交关系网进行调整时,社交属性数据的更新次数达到预设次数的对象;或者

所述社交关系网的目标函数的函数值达到预设函数值,所述目标函数的函数值表示所述社交关系网中不同对象间的关系紧密度的大小。

本公开第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面及一种可能的实施方式中任一所述的方法。

本公开第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面及一种可能的实施方式中任一所述的方法。

本公开的方案至少带来以下的有益效果:

1)本公开中,根据社交关系数据确定了社交关系网中各对象的社交属性数据,并对社交关系网进行调整,将调整后的社交关系网中各对象的社交属性数据作为各对象的表示,提升了对各对象表示的准确度,进而提升了根据社交属性数据针对各对象的社交属性进行分析的效率。

2)本公开中,社交关系数据包括多种关系类型,根据各个关系类型的权重构建社交关系网,并获取调整后的社交关系网中各个对象的社交属性数据,可以实现在多种关系类型下对各对象进行具体表示,进一步提升了对各对象表示的准确度。

3)本公开中,针对不同社交场景确定不同关系类型的权重并构建社交关系网,并获取调整后的社交关系网中各个对象的社交属性数据,可以实现在不同的社交场景下对各对象进行表示,更进一步提升了对各对象表示的准确度,进而提升在不同的社交场景下根据社交属性数据对各对象的社交属性进行分析的效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1为本公开示例性实施例提供的一种基于社交关系的社交属性确定方法的流程示意图;

图2为本公开示例性实施例提供的一种社交关系网中不同关系类型的表示的示意图;

图3为本公开示例性实施例提供的一种不同关系类型的抽象表示的示意图;

图4为本公开示例性实施例提供的一种调整后的社交关系网的示意图;

图5为本公开示例性实施例提供的一种基于社交关系的社交属性数据确定装置的结构示意图;

图6为本公开示例性实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

为了便于本领域技术人员更好地理解本公开的技术方案,下面对本公开涉及的技术术语进行说明。

社交关系分析一般基于社交关系网实现,社交关系网是指社会个体成员之间通过社会关系结成的网络体系,社交关系网一般以知识图谱的形式存在,目的在于基于社交关系网理解人类各种社交关系形成、行为特点、信息传播规律等。

知识图谱(Knowledge Graph):是一种本体论在信息领域的实现方式,是指描述真实世界中存在的各种实体概念及其关系的巨大的语义网络图,它通过实体和关系描述真实事件的物体、事物和联系。其中实体是指可区别性且独立存在的某种事物,在图形化分析中往往以“节点”的形式出现;关系是用来表达实体和实体之间的某种联系,在图形化分析中往往展现为实体节点之间的连线即连接两个点的边,对于用知识图谱形式表示的社交关系网社,节点表示人物、概念等实体,边则表示节点间的社交关系。

embedding数据(嵌入向量数据):用低维向量对实体进行编码且能保留其含义的,即用一个低维的向量表示一个实体,这个实体可以是一个词,或是一个物品,或是一个视频、一个人物等;embedding数据的性质是能使空间中距离相近的向量对应的实体有相近的含义或紧密的关系连接,比如互为亲戚或者好友的两个用户之间的向量距离就会很接近,但两个完全陌生的用户之间的向量距离就会比较远。

关系紧密度:可以理解为不同对象在社交关系网中的关联程度,在以知识图谱的形式构建的社交关系网中,可以理解为社交关系网中不同对象间的空间距离,技术人员可根据实际需求设计不同对象间的空间距离的计算标准。

下面对本公开的设计思想进行说明。

随着互联网技术的发展,每个用户都会在社交平台上与其他用户建立社交关系,如好友关系、关注关系、点赞关系等,相关技术中,社交关系网仅能基于上述几种线性的社交关系单一明确地表示用户的社交属性,如单一地表示用户A是用户B的好友,用户C关注了用户D,但是并不能表示出用户A、用户B、用户C、用户D在整个社交关系网中的整体社交属性或空间位置,社交关系网中对用户的表示能力十分受限。

鉴于此,本公开设计一种基于社交关系的社交属性数据确定方法、装置及设备,用以提供一种对社交关系网中的各个对象进行具体表示的方法,本公开的方法包括:获取社交关系数据集,该社交关系数据集包括至少一个对象的社交关系数据;根据获取的社交关系数据集确定社交关系网,对上述社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度;确定调整后的社交关系网中上述至少一个对象的社交属性数据;其中:

上述社交关系数据用于表示具有社交关系的不同对象间的关系紧密度,上述调整前的社交关系网和调整后的社交关系网都包括上述至少一个对象的社交属性数据。

应当说明的是,本公开实施例中的对象可以理解为社交平台中的用户,本公开文件中对象与用户表示同一含义。

本公开实施例中的社交属性数据是根据上述社交关系数据确定的,用于表示对象在上述社交关系网中的位置,即表示对象在社交关系网这一空间中的空间位置。

以下结合附图对本公开的方案进行详细说明。

请参见图1,提供一种基于社交关系的社交属性确定方法,该方法具体包括:

步骤S101,获取社交关系数据集,上述社交关系数据集包括至少一个对象的社交关系数据。

作为一种实施例,可以通过一个或多个社交平台获取社交关系数据,如通过各社交平台的日志系统和数据挖掘系统,收集各个社交平台中对象的社交关系数据。

上述社交关系数据可以包括多种关系类型,如关注关系、好友关系、互动关系和第三方关系等。

作为一种实施例,为了避免一些异常的社交关系数据对社交关系网的影响,在获取社交关系数据集之后,还可以对社交关系数据集中的社交关系数据进行数据清洗,具体而言,可以判断上述至少一个对象中是否存在异常对象,若存在异常对象,则将异常对象的社交关系数据从社交关系数据集中删除,可以根据对象的社交关系数据的数据量确定异常对象,该异常对象为影响上述社交关系网中其它对象的社交属性数据的准确度的对象;。

作为一种实施例,上述异常对象可以但不局限于包括过多关注对象和低活跃度对象,其中,若关注某一对象的用户的数量超过某一设定值,或者与该对象的社交关系数据的数据量超过某一设定数据量,则将上述某一对象确定为过多关注对象,或者,确定某一对象超过设定时间未登录社交平台上的社交账户时,确定该对象为低活跃度对象;如关注A的用户的数量超过1万或10万时,确定A为异常对象,B若在最近的一个月内未登录其社交账户,则确定B为低活跃度对象,其中A和B各为一个对象。

上述过多关注对象会影响社交关系网的调整,使得调整社交关系网时会使与其具有社交关系的对象的社交属性数据靠近该关注对象的社交属性数据,进而影响到社交关系网中除该多关注对象外的其他对象的社交属性数据的调整;上述低活跃度对象由于其长时间不活跃,则不确定该低活跃度对象的社交关系数据在当前是否有效,影响其他对象在社交关系网中的社交关系,进而会影响其他对象在社交关系网中的社交属性数据。

步骤S102,根据获取的社交关系数据确定社交关系网。

作为一种实施例,可以按照知识图谱的形式构造社交关系网,该社交关系网可以是biggraph模型,社交关系网中包括若干节点和连接节点的边,用节点表示每个对象,用边表示不同对象间的社交关系,上述边可以根据获取社交关系数据确定。

该社交关系网包括上述至少一个对象的社交属性数据,该社交属性数据用于表示对象在社交关系网中的位置,可以根据社交关系数据确定,在本实施例中,社交属性数据可以是对象的embedding数据。

作为一种实施例,当社交关系数据包括多种关系类型时,可以确定多种关系类型中各种关系类型的权重,将多种关系类型进行融合,根据社交关系集和确定的各种关系类型的权重确定上述社交关系网,参见图2,其中关注关系、互动关系和第三方关系的权重分别为5.0、4.5和1.3,在以知识图谱的形式构建社交关系网时,可以用不同形式的边表示不同的关系类型及其权重。

作为一种实施例,上述社交关系数据集可以是针对不同社交场景采集的,社交关系数据集中包括目标社交场景下采集的社交关系数据;可以根据目标社交场景中的各种信息确定各个关系类型的权重,其中上述社交场景可以但不局限于包括不同的社交平台,或者某一社交平台下的具体场景如短视频社区、熟人社区、游戏、电商购物等。

步骤S103,对得到的社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度。

可以将步骤101和步骤102得到的关系类型的数量、具体的关系类型以及各个关系类型的权重作为社交关系网的超参数,对社交关系网进行调整。

由于社交关系网是超大规模多维度的对象表示,社交关系网可能包含数十亿级别的节点和数百亿级别的社交关系,其中的数据量太大,将整个社交关系网放在单个训练节点如服务器上调整,对训练节点造成的压力较大,其次,这种大规模的社交关系网占用的内存资源可能会超过单个训练节点的内存,无法将其装进单个训练节点的内存中,因此可以对社交关系网进行分布式调整至满足预设停止条件。

步骤S104,确定调整后的社交关系网中上述至少一个对象的社交属性数据。

结束社交关系网的调整后,可以从社交关系网中获取各个对象的社交属性数据,用获取的社交属性数据对相应的对象进行表示,如在本实施例中,可以用获取的embedding数据表示对象,embedding数据是将社交关系网中的每个节点转换为低维度的表示信息。

在获取各个对象的embedding数据之后,可以从中找出关系紧密度高的种子用户对调整后的社交关系网的表示能力进行验证,如根据embedding数据计算关系紧密度高的种子用户之间的空间向量距离,若计算出的空间向量距离表示的距离过远,则可以重新对社交关系网进行调整。

以下针对本公开实施例中的关系类型进行详细说明:

关注关系可以包括单向关注关系和双向关注关系;单向关注关系可以理解为A关注了B,但B未关注A的关系;双向关注关系可以理解A和B互相关注;针对关注可以理解为A关注B后,A即可观看到B在社交平台上发布的内容,该内容可以是音频、视频、文字、图片以及主播内容等,其中A和B各表示一个对象。

上述好友关系包括单向好友关系和双向好友关系;单向好友关系可以理解为A是B在社交平台上的社交朋友,但B不是A的社交朋友;双向好友关系可以理解为A和B互相是对方的社交朋友;针对社交朋友可以理解为,A是B的社交朋友,则A可以通过聊天界面等向B发送消息,该消息可以是音频、视频、文字、图片等,其中A和B各表示一个对象。

应当理解的是,上述关注关系与好友关系在一些社交平台上可能等同,而在另一些社交平台两者可能不等同。

上述互动关系可以但不局限于包括点赞/评论关系、组队关系。

点赞/评论关系包括单向点赞/评论关系和双向点赞关系,单向点赞/评论关系可以理解为A对B在社交平台上发表的内容进行点赞/评论行为的关系,但B不存在对A在社交平台上发表的内容进行点赞/评论行为的关系;双向点赞关系可以理解为A和B互相为对方在社交平台上发表的内容进行点赞/评论行为关系,其中,A和B各表示一个对象。

组队关系可以理解为A和B在社交平台的某一活动中,同在一支队伍中参加活动的关系,其中,A和B各表示一个对象。

上述单向关注关系、双向关注关系、单向点赞/评论关系、第三方关系可以在社交关系网中的表示可参见图3,但应当理解的是,图3仅为一种抽象的关系表示,本领域的技术人员可根据实际需求变动。

上述第三方关系可以理解为A和B在当前的社交平台以外的其他社交平台上具有某一种或多种社交关系,其中A和B各表示一个对象。

在上述步骤S102中,可以但不局限于按照下述两种方式,根据目标社交场景中的各种信息确定各个关系类型的权重。

第一种关系类型的权重确定方法:

确定各种关系类型与目标社交场景的关联值,进而根据关联值确定各关系类型的权重。

作为一种实施例,可以预先根据实际需求设置关系类型与目标社交场景的关联值,具体可参照表1所示的方式建立。

表1:

表1中,m仅为区分不同的关系类型而设置的标号,其值为正整数;n为区分不同的社交场景而设置的标号,其值正整数;A1至An、B1至Bn、C1至Cn分别表示不同的关联值;从表1中可以看出,关系类型1与社交场景1、社交场景2以及社交场景n中的关联值分别为A1、A2、An;关系类型2与社交场景1、社交场景2以及社交场景n中的关联值分别为B1、B2、Bn;关系类型m与社交场景1、社交场景2以及社交场景n中的关联值分别为C1、C2、Cn。

上述各关系类型的关联值可由本领域的技术人员根据实际的经验进行设置,此处不做过多限定;在确定出各关系类型和目标社交场景的关联值后,可以按照预设权重计算公式对各关联值进行计算得到各关系类型的权重,对上述预设权重计算公式不做过多限定,本领域的技术人员可根据具体的社交场景进行设计,或者根据社交场景下对象间的互动行为进行设计等。

第二种关系类型的权重确定方法:

确定目标社交场景对应的关系类型和权重的预设映射关系,根据关系类型和权重的预设映射关系确定各种关系类型的权重。

在此种方式中,需要预先建立与各社交场景对应的关系类型和权重的预设映射关系,具体地,可以由本领域的技术人员根据实际的经验,建立与各社交场景对应的关系类型和权重的预设映射关系。

作为一种实施例,若在某社交场景下关系类型包括单向关注关系、双向关注关系、互动关系和第三方关系时,双向关注关系、第三方关系、单向关注关系和互动关系的权重可以依次递减,参见表2,给出一种该社交场景的关系类型和权重的预设映射关系。

表2:某社交场景的关系类型和权重的预设映射关系

表2中表示,在该社交场景下,单向关注关系、双向关注关系、互动关系和第三方关系的权重分别为2.0、5.0、1.3和4.5。

应当说明的是,上述单向关注关系、双向关注关系、互动关系和第三方关系的权重的数值仅为举例,在实际应用过程中,各关系类型的权重可以与表2中完全相同或部分相同或完全不同。

在得到各个关系类型的权重后,可以对得到的权重进行归一化,上述归一化可以理解为将不是整数的数值统一成整数,如若得到权重分别为0.4、1、0.2、0.4时,则可以将每个权重和同一个系数相乘得到整数,如将上述每个权重与系数5相乘,即得到归一化后的权重2、5、1、2。

上述各社交场景下各关系类型的权重可由本领域的技术人员根据实际的经验进行设置,此处不做过多限定。

作为一种实施例,在上述步骤S102,社交关系数据包括多种关系类型且确定各个关系类型的权重后,可以按照如下方法根据社交关系数据及以及各关系类型的权重确定社交关系网:

首先根据获取的社交关系数据,基于biggraph模型的形式构造一个初始的社交关系网,该初始的社交关系网中包括若干节点和连接节点的边,用节点表示每个对象,用不同形式的边表示不同的关系类型。

进而根据归一化后的权重对初始的社交关系网中的边进行调整,如单向关注关系、双向关注关系、互动关系和第三方关系归一化后的权重为2、5、1、2时,将每条表示单向关注关系的边变形为2条表示互动关系的边,将每条表示双向关注关系的边变形为5条表示互动关系的边,将每条表示第三方关系的边变形为2条表示互动关系的边,进而即可得到根据社交关系数据以及各关系类型的权重确定的社交关系网。

应当说明的是,本领域的技术人员还可以按照其他方式,根据社交关系数据以及各关系类型的权重确定社交关系网,如根据社交关系数据确定初始的社交关系网,根据各关系类型的权重调整初始的社交关系网中各条边的长度进行调整等,本实施例列举的方式仅为示意性的例子。

以下对步骤S103中对社交关系网进行调整进行说明。

在调整社交关系网中主要包括划分对象关系样本、设置社交关系网的超参数以及对社交关系网进行分布式调整的过程,此示例中的社交关系网是根据社交关系数据建立的一个biggraph模型,具体如下:

1)划分对象关系样本

社交关系网中的节点可以用对象的标识信息如账户ID等标记,可以根据社交关系网中账户ID将获取的对象关系样本进行划分,将其划分成若干个样本集合,使得每个样本集合中的对象关系样本中都能包含部分对象关系,其中对象关系样本可以理解为社交关系网中对象间的社交关系,即社交关系网中连接节点的边。

2)设置调整社交关系网的超参数

超参数包括定制参数和通用参数。

定制参数可以但不局限于包括:关系类型的数量、具体的关系类型以及各个关系类型的权重,其中,具体的关系类型可以但不局限于包括上述各种关系类型中的一个或多个,如具体的关系可行可以包括单向关注关系、双向关注关系、互动关系(如点赞关系)、第三方关系,其分别对应的权重可以是2、5、1、2等。

通过参数可以但不局限于包括:划分的样本集合的数量、训练节点数量、距离函数、表示维度、目标函数。

上述划分的样本集合的数量可以是训练节点数量的两倍。

上述距离函数用于根据不同对象的社交属性数据计算对象间的空间距离,如根据两个对象的embedding数据,计算两个对象间的空间向量距离,以得到上述两个对象的空间向量距离,根据空间向量距离确定上述两个对象的关系紧密度。

上述表示维度表示对象的社交属性数据能够表达信息量的多少,如社交属性数据为embedding数据时,表示维度为embedding数据的维度,其维度的值越大,代表embedding数据表达的信息越丰富。

上述目标函数代表优化的目标,其函数值表示社交关系网中不同对象间的关系紧密度的大小,其目标致力于使具有社交关系的对象越来越紧凑,使不具有社交关系的对象越来越疏远,目标函数的值越大,表示目标优化的越好,目标函数的函数值达到预设函数值时,表示调整的社交关系网满足了需求,其中,对预设函数值的具体数值不做过多限定,本领域的技术人员可根据实际需求设置。

本公开实施例中给出一种目标函数的示例,请参见公式1:

公式1:

公式1中,G为正样本集合,其包括社交关系网中的正样本,正样本为社交关系网中的边;

S’为负样本集合,其包括社交关系网中的采样的负样本,负样本为采样选取的两个没有边的对象间的样本,如若A与B之间存在边,A和C之间不存在边,则为一个正样本,为一个负样本,其中为边的表示形式,A、B和C均为一个对象;

e为正样本,f(e)为e对应的两个节点的向量内积;

e’为负样本,f(e’)为e’对应的两个节点的向量内积;

L代表社交关系网调整的目标,L的值越大,表示社交关系网中正样本对应的节点更紧凑,负样本对应的节点更疏远。

应当说明的是,应当从社交关系网中样本的整体去理解正样本对应的节点更紧凑,负样本对应的节点更疏远。

3)调整社交关系网

根据划分的样本集合的数量、训练节点数量、表示维度等对社交关系网进行分布式调整,具体可以参照如下过程对社交关系网进行每一次的调整:

在初次调整时,可以根据定制参数、调整社交关系网中各个对象的embedding数据,调整后根据目标函数确定是否满足预设调整停止条件,若不满足,则根据定制参数和目标函数的函数值,通过距离函数调整各个对象的embedding数据,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度直至满足预设停止条件。

调整后的社交关系网中,偏向使具有权重大的关系类型的对象更紧凑,如单向关注关系、双向关注关系、点赞关系、第三方关系分别对应的权重为2、5、1、2,则调整后的社交关系网中,具有双向关注关系的对象更紧凑。

应当说明的是,上述调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度,可以理解为目标函数中的正样本对应的节点更紧凑,负样本对应的节点更疏远。

上述预设停止条件可以但不局限于包括:

第一种预设停止条件:

第一对象的数量达到预设数量,该第一对象为对社交关系网进行调整时社交属性数据的更新次数达到预设次数的对象。

在每次对社交关系网进行调整时,有可能所有对象的社交属性数据都需要调整,但也可能一些对象的社交属性数据不需要调整,此时设置一个预设次数作为调整社交关系网的调整次数,当有预设数量的对象的社交属性数据的更新次数达到预设次数时,即认为达到了社交关系网的调整次数,结束对社交关系网的调整。

对上述预设数量和预设次数不做过多限定,本领域的技术人员可根据实际需求设置。

第二种预设停止条件:

目标函数的函数值达到预设函数值。

当目标函数的函数值达到预设函数值时,即认为表示调整的社交关系网满足了需求,此时即可结束对社交关系网的调整。

请参见图4,给出了一种调整后的社交关系网的示意图,图中表示B和D具有直接的社交关系,A、B、C、D和F之间有直接或间接的社交关系,E和G之间有直接的社交关系,但是E和G与A、B、C、D和F之间没有社交关系;训练后的社交关系网中,B和D比较紧凑,A、B、C、D和F之间相对紧凑,E和G比较紧凑,但是E和G与其他对象相对疏远,A、B、C、D、E和F各为一个对象。

本公开中,可以通过对社交关系数据的融合以及对社交关系网的调整,可以将社交关系网中复杂的对象表示信息转换成低维度简单的社交属性数据,提供了在大规模社交关系网中一种便捷的对象表示方法;且本公开中还可以根据多种关系类型的权重对社交关系网进行调整,可以实现在多种关系类型下对各对象进行具体表示;本公开中还可以针对目标社交场景调整各个关系类型的权重,进而实现在不同的社交场景下对各对象进行表示。

请参见图5,基于相同的发明构思,本公开实施例还提供一种基于社交关系的社交属性数据确定装置500,包括社交关系获取单元501、社交关系网确定单元502、关系网调整单元503和属性数据确定单元504,其中:

上述社交关系获取单元501被配置为执行获取社交关系数据集,其中上述社交关系数据集包括至少一个对象的社交关系数据,上述社交关系数据用于表示具有社交关系的不同对象间的关系紧密度;

上述社交关系网确定单元502被配置为执行根据上述社交关系数据集确定社交关系网,其中上述社交关系网包括上述至少一个对象的社交属性数据,上述社交属性数据是根据上述社交关系数据确定的,上述社交属性数据用于表示上述至少一个对象在上述社交关系网中的位置;

上述关系网调整单元503被配置为执行对上述社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度;

上述属性数据确定单元504被配置为执行确定调整后的社交关系网中上述至少一个对象的社交属性数据。

作为一种可选的实施例,上述社交关系数据包括多种关系类型,上述社交关系网确定单元具体被配置为执行:

确定上述多种关系类型中各种关系类型的权重;

根据上述社交关系数据集以及上述各种关系类型的权重确定上述社交关系网。

作为一种可选的实施例,上述社交关系数据集包括目标社交场景下的社交关系数据;

上述社交关系网确定单元具体被配置为执行:

确定上述各种关系类型与目标社交场景的关联值,并根据上述关联值确定上述各种关系类型的权重;或者

确定上述目标社交场景对应的关系类型和权重的预设映射关系,根据上述关系类型和权重的预设映射关系确定上述各种关系类型的权重。

作为一种可选的实施例,上述社交关系获取单元还被配置为执行:

在上述获取社交关系数据集的步骤之后,上述根据上述社交关系数据集确定社交关系网之前,若确定上述至少一个对象中的异常对象,则从上述社交关系数据集中删除上述异常对象的社交关系数据,其中上述异常对象为影响上述社交关系网中其它对象的社交属性数据的准确度的对象,上述异常对象是根据对象的社交关系数据的数据量确定的。

作为一种可选的实施例,上述关系网调整单元被配置为执行:

对上述社交关系网进行分布式调整至满足预设调整停止条件。

作为一种可选的实施例,上述预设调整停止条件包括:

第一对象的数量达到预设数量,上述第一对象为对上述社交关系网进行调整时,社交属性数据的更新次数达到预设次数的对象;或者

上述社交关系网的目标函数的函数值达到预设函数值,上述目标函数的函数值表示上述社交关系网中不同对象间的关系紧密度的大小。

请参见图6,基于相同的发明构思,本公开实施例还提供一种电子设备600,包括处理器601、用于存储上述处理器可执行指令的存储器602;

其中,上述处理器被配置为执行如下过程:

获取社交关系数据集,其中上述社交关系数据集包括至少一个对象的社交关系数据,上述社交关系数据用于表示具有社交关系的不同对象间的关系紧密度;

根据上述社交关系数据集确定社交关系网,其中上述社交关系网包括上述至少一个对象的社交属性数据,上述社交属性数据是根据上述社交关系数据确定的,上述社交属性数据用于表示上述至少一个对象在上述社交关系网中的位置;

对上述社交关系网进行调整,以使调整后的社交关系网中具有社交关系的不同对象间的关系紧密度高于调整前的关系紧密度;

确定调整后的社交关系网中上述至少一个对象的社交属性数据。

作为一种可选的实施例,上述社交关系数据包括多种关系类型,上述根据上述社交关系数据集确定社交关系网的步骤,包括:

确定上述多种关系类型中各种关系类型的权重;

根据上述社交关系数据集以及上述各种关系类型的权重确定上述社交关系网。

作为一种可选的实施例,上述社交关系数据集包括目标社交场景下的社交关系数据;

上述确定上述多种关系类型中各种关系类型的权重的步骤,包括:

确定上述各种关系类型与目标社交场景的关联值,并根据上述关联值确定上述各种关系类型的权重;或者

确定上述目标社交场景对应的关系类型和权重的预设映射关系,根据上述关系类型和权重的预设映射关系确定上述各种关系类型的权重。

作为一种可选的实施例,上述获取社交关系数据集的步骤之后,上述根据上述社交关系数据集确定社交关系网之前,还包括:

若确定上述至少一个对象中的异常对象,则从上述社交关系数据集中删除上述异常对象的社交关系数据,其中上述异常对象为影响上述社交关系网中其它对象的社交属性数据的准确度的对象,上述异常对象是根据对象的社交关系数据的数据量确定的。

作为一种可选的实施例,上述对上述社交关系网进行调整的步骤,包括:

对上述社交关系网进行分布式调整至满足预设调整停止条件。

作为一种可选的实施例,上述预设调整停止条件包括:

第一对象的数量达到预设数量,上述第一对象为对上述社交关系网进行调整时,社交属性数据的更新次数达到预设次数的对象;或者

上述社交关系网的目标函数的函数值达到预设函数值,上述目标函数的函数值表示上述社交关系网中不同对象间的关系紧密度的大小。

需要说明的是,本公开涉及的用户/账户的信息均为经过用户/账户的授权而采集并进行后续处理分析的。

在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由上述电子设备的处理器执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

相关技术
  • 基于社交关系的社交属性数据确定方法、装置及设备
  • 基于社交关系预测贷款黑中介的方法、装置、电子设备
技术分类

06120112984879