掌桥专利:专业的专利平台
掌桥专利
首页

一种支持增量实体关联的关系图谱计算方法

文献发布时间:2023-06-19 10:16:30


一种支持增量实体关联的关系图谱计算方法

技术领域

本发明涉及数据处理技术领域,具体来说,涉及一种支持增量实体关联的关系图谱计算方法。

背景技术

关系图谱是用来表示每个数据或信息之间的关系,目前的关系图谱存在一次生成后,便无法支持增量更新的问题,对于一些增量数据,需要与存量关系图谱进行更新,最终得到最新正确完整的关系图谱,在增量数据处理的过程中,无法保证执行性能;且现在关联关系主要依赖人工对繁杂的信息分析处理,使得关联关系获取效率降低。

针对相关技术中的问题,目前尚未提出有效的解决方案。

发明内容

针对相关技术中的上述技术问题,本发明提出一种支持增量实体关联的关系图谱计算方法,能够克服现有技术的上述不足。

为实现上述技术目的,本发明的技术方案是这样实现的:一种支持增量实体关联的关系图谱计算方法,包括以下步骤:

S1获取增量数据;

S2对所述增量数据内的证号信息进行串联得到第一关系图谱信息;

S3通过所述证号信息与历史关系图谱信息进行串联,得到历史关系图谱信息和第一关系图谱信息的关系;

S4将所述第一关系图谱信息和所述历史关系图谱信息合并为第二关系图谱信息;并得出第一关系图谱信息与所述第二关系图谱信息的关系、所述历史关系图谱信息与所述第二关系图谱信息的关系;

S5根据S4中所述第一关系图谱信息与所述第二关系图谱信息的关系,所述第一关系图谱信息更新为第三关系图谱信息;

S6根据S4中所述历史关系图谱信息与所述第二关系图谱信息的关系,所述历史关系图谱信息更新为第四关系图谱信息;

S7将所述第三关系图谱信息和所述第四关系图谱信息合并得到第五关系图谱信息。

进一步地,在S1中,按照创建时间、状态位或相关条件获取增量数据。

进一步地,在S2中,每获取依次增量数据,需对增量数据进行串并,将所述增量数据经过hash处理后得到第一关系图谱ID。

进一步地,在S3中,使用证号信息和历史关系图谱信息进行加入关联,得到历史关系图谱ID和第一关系图谱ID的关系映射。

进一步地,在S4中,需要保存第一关系图谱ID和第二关系图谱ID的关系映射及历史关系图谱ID和第二关系图谱ID的关系映射。

进一步地,所述第一关系图谱更新为第三关系图谱。

进一步地,所述历史关系图谱更新为第四关系图谱。

本发明的有益效果:根据多个增量数据的证号信息,可以生成相应的关系图谱;通过与历史关系图谱的关系映射,可以获得新的关系图谱并不会覆盖历史数据;所建立的关系图谱通过向量化、增量学习和特征组合,提高了关系图谱计算的准确性;相比传统的人工分析的方式可以大大提高关联关系获取效率;在动态关系图谱背景下,能够有很好的数据处理性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的一种支持增量实体关联的关系图谱计算方法的流程框图;

图2是根据本发明实施例所述的一种支持增量实体关联的关系图谱计算方法的关系图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,根据本发明实施例所述的一种支持增量实体关联的关系图谱计算方法,包括以下步骤:

S1获取增量数据;

S2对所述增量数据内的证号信息进行串联得到第一关系图谱信息;

S3通过所述证号信息与历史关系图谱信息进行串联,得到历史关系图谱信息和第一关系图谱信息的关系;

S4将所述第一关系图谱信息和所述历史关系图谱信息合并为第二关系图谱信息;并得出第一关系图谱信息与所述第二关系图谱信息的关系、所述历史关系图谱信息与所述第二关系图谱信息的关系;

S5根据S4中所述第一关系图谱信息与所述第二关系图谱信息的关系,所述第一关系图谱信息更新为第三关系图谱信息;

S6根据S4中所述历史关系图谱信息与所述第二关系图谱信息的关系,所述历史关系图谱信息更新为第四关系图谱信息;

S7将所述第三关系图谱信息和所述第四关系图谱信息合并得到第五关系图谱信息。

在本发明的一个具体实施例中,在S1中,按照创建时间、状态位或相关条件获取增量数据。

在本发明的一个具体实施例中,在S2中,每获取依次增量数据,需对增量数据进行串并,将所述增量数据经过hash处理后得到第一关系图谱ID。

在本发明的一个具体实施例中,在S3中,使用证号信息和历史关系图谱信息进行加入关联,得到历史关系图谱ID和第一关系图谱ID的关系映射。

在本发明的一个具体实施例中,在S4中,需要保存第一关系图谱ID和第二关系图谱ID的关系映射及历史关系图谱ID和第二关系图谱ID的关系映射。

在本发明的一个具体实施例中,所述第一关系图谱更新为第三关系图谱。

在本发明的一个具体实施例中,所述历史关系图谱更新为第四关系图谱。

为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。

在具体使用时,根据本发明所述的一种支持增量实体关联的关系图谱计算方法,获取增量数据;按照创建时间或者其他条件、状态位获取增量数据;

通过对增量数据的证号信息进行串联;每获取一批增量数据,首先对增量数据进行串并,即是增量的这部分数据,如:jq1,id1;jq2,id1;jq2,id2;jq3,id2经过hash处理后输id1、id2-->11 jq1、jq2、jq3-->11,这样得到了第一关系图谱ID。

通过证号信息和历史关系图谱进行串联,得到历史关系图谱和第一关系图谱信息的关系;使用id1、id2和存量关系图谱进行关联,得到历史关系图谱ID和第一关系图谱ID的关系映射;

对得到的历史和新关系图谱关系映射,针对老关系图谱关联多个新关系图谱场景,做一遍图遍历,合并为最终的图谱关系。

历史关系图谱信息和第一关系图谱信息关联关系得到第二关系图谱信息,保存历史关系图谱ID和第二关系图谱ID的关系映射及第一关系图谱ID和第二关系图谱ID的关系映射;

通过历史关系图谱和最终关系图谱的ID的关系映射,将历史关系图谱ID更新为第三关系图谱ID;通过第一关系图谱ID和第二关系图谱ID的关系映射,将第一关系图谱ID更新为第四关系图谱ID。

第三关系图谱数据和第四关系图谱数据合并到一起,最终形成成第五关系图谱数据。

如图2所示,警情为例,其他文本串并都可以使用此方法处理;

对警情增量中串联要素,其中,警情主要是使用证号包括:身份证号、电话号码、车牌号、微信号、QQ号或银行卡号,对警情进行证号串联;

输入jq1,id1;jq2,id1;jq2,id2;jq3,id2经过hash处理后输id1、id2-->1 jq1、jq2、jq3-->1;

根据第一关系图谱的数据和历史关系图谱的数据生成临时表,保存历史关系图谱ID和第一关系图谱ID,并将第一关系图谱ID和历史关系图谱ID合并得到第二关系图谱ID;根据第一关系图谱信息和历史关系图谱ID与第二关系图谱信息关系映射,分别得到第三关系图谱ID和第四关系图谱ID,将第三关系图谱ID和第四关系图谱ID合并。

综上所述,借助于本发明的上述技术方案,根据多个增量数据的证号信息,可以生成相应的关系图谱;通过与历史关系图谱的关系映射,可以获得新的关系图谱并不会覆盖历史数据;所建立的关系图谱通过向量化、增量学习和特征组合,提高了关系图谱计算的准确性;相比传统的人工分析的方式可以大大提高关联关系获取效率;在动态关系图谱背景下,能够有很好的数据处理性能。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种支持增量实体关联的关系图谱计算方法
  • 一种支持增量实体关联的关系图谱计算方法
技术分类

06120112481205