一种智慧社区大数据知识图谱网络社团检测方法
文献发布时间:2023-06-19 11:19:16
【技术领域】
本发明属于知识图谱技术领域,特别是涉及一种智慧社区大数据知识图谱网络社团检测方法。
【背景技术】
智慧社区是通过综合运用现代科学技术,整合区域人、地、物、情、事、组织和房屋等信息,统筹公共管理、公共服务和商业服务等资源,以综合信息服务平台为支撑,依托先进的基础设施,提升社区治理和小区管理现代化,促进公共服务和便民利民服务智能化的一种社团管理和服务的创新模式。
智慧社区的功能实现是基于数据的,特别是大数据,大量的数据可以支撑对智慧社区各种类型功能的实现,但也对数据的处理方法提出了更高的要求。基于这样的数据特点,互联网知识图谱构建技术也已经获得了巨大的发展,并展示了其能够起到的非常大的作用。
智慧社区大数据知识图谱能够将社区中的数据流进行规范化的收集、管理与应用。但这样大规模数据构成的知识图谱网络,使用人工的方式进行分析显然无法实现。社团检测是复杂网络分析中的一种常用方法,但由于智慧社区大数据知识图谱的应用还处于起步阶段,存在以下问题:
1)一些经典的图嵌入方法,如局部线性嵌入,表明在真实智慧社团大数据知识图谱网络中顶点之间的关系并不一定是线性的。因此,基于这种线性组合策略的模型在实际网络中仍然存在局限性。
2)传统社区检测将网络划分为不同的子网络,即所有的节点都会被划分到不同的社区中。然而在许多真实应用中,网络中存在许多噪声节点,即很多网络通过边连接了噪声节点,而这些噪声节点掩盖了真实的社区结构。
因此,有必要提供一种新的智慧社区大数据知识图谱网络社团检测方法来解决上述问题。
【发明内容】
本发明的主要目的在于提供一种智慧社区大数据知识图谱网络社团检测方法,提高了算法的效率,实现了智慧社区大数据知识图谱网络的社团检测的实时性要求。
本发明通过如下技术方案实现上述目的:一种智慧社区大数据知识图谱网络社团检测方法,其包括以下步骤:
S1)构建智慧社区大数据知识图谱;
S2)对智慧社区大数据知识图谱进行重构,得到智慧社区知识图谱网络的低维编码;
S3)使用深度学习方法构建深层次的模型进行训练,最终得到社团检测结果。
进一步的,所述步骤S1)中,构建智慧社区大数据知识图谱包括从原始的社区数据出发,通过知识抽取和知识表示从原始数据和第三方数据库中抽取出来社区知识,然后将提取的所述社区知识存入知识库的数据层和模式层中,通过知识融合,解决已有社区知识存在冗余、缺乏逻辑性的问题,对社区知识形成的知识图谱中由于数据源或不同构建方法产生的冲突,根据数据源可靠性或机器学习的方法进行冲突解决,形成所述智慧社区大数据知识图谱。
进一步的,所述智慧社区大数据知识图谱包括:
人员层:包含不同年龄段的社区人员;
行为层:包含相应社区人员的行为特征,所述行为特征包括经济状况、工作情况、加班情况以及出入社区时间;
语义层:包括对应社区人员的一些公开言论。
进一步的,所述步骤S2)中的智慧社区大数据知识图谱进行重构具体包括:
S21)社团检测谱方法的矩阵表示;
S22)基于自动编码器的社团检测谱方法的矩阵重构;
S23)结合连接信息和节点内容的社团检测。
进一步的,所述步骤S21)社团检测谱方法的矩阵表示包括:
S211)将智慧社区知识图谱网络的拓扑结构用G=(V,E)表示,其中,V是包含N个节点的顶点集合{V
S212)将G的邻接矩阵用一非负对称的二进制矩阵
S213)定义模块化矩阵为B={b
S214)假设知识图谱网络具有C个社团,将模块最大化转化为以下优化问题:
s.t.tr(X
其中tr(·)表示矩阵的迹,X=(x
S215)对于智慧社区知识图谱网络的内容信息,使用S={s
S216)使用
s.t.Y
其中,s
进一步的,所述步骤S22)基于自动编码器的社团检测谱方法的矩阵重构包括:
S221)构建一个三层的自动编码器进行模块化矩阵的重建;
S222)在该自编码器中,从第一层到隐藏层,编码器将输入B映射到低维编码
S223)从隐藏层到第三层,解码器将潜在表示H
其中,b
S224)该自编码器通过最小化第一层和第三层数据之间的重构误差,得到矩阵的低维表示为:
其中,
S225)通过对自动编码器的训练,得到参数W,d,然后得到一个低维编码,该低维编码即可作为该网络的图形表示。
进一步的,所述步骤S23)结合连接信息和节点内容的社团检测包括:
S231)定义M=D
S232)定义一个组合矩阵Z=[B,M]
S233)将矩阵Z
S234)使用组合矩阵Z作为自动编码器的输入,编码器将输入数据映射到低维编码
其中,组合矩阵的第i列表示为
其中,W=R
其中,δ={W,d,W
进一步的,所述步骤S3)包括:将步骤S23)中所得到的模型:
按照随机梯度下降法进行迭代,使用深度神经网络进行训练。
与现有技术相比,本发明一种智慧社区大数据知识图谱网络社团检测方法的有益效果在于:对智慧社区大数据知识图谱进行深层次的结构化分析,从复杂的大规模智慧社区知识图谱网络中获取清晰的知识节点社团结构;对社团检测算法进行优化,提高算法的效率,以实现智慧社区大数据知识图谱网络的社团检测的实时性要求。利用自编码器模型结合模块最大化和正态切割方法,从复杂的大规模知识图谱网络中获取清晰的知识节点社团结构;通过构建深层自编码器模型,提高检测的效率。具体的,
1)将人工智能方法应用于智慧社区大数据知识图谱社团检测场景;
2)提出了一种利用自编码器将模极大值模型和正态切割模型的无缝结合的方式,该自编码器模型提供了一种非线性的方法,集成了知识图谱网络的拓扑结构和节点内容信息,同时能对数据在降维过程中的重要因素进行编码,自动学习数据的权值得到各因素之间的关系;
3)结合深度神经网络算法,通过叠加一系列的自编码器,构建了一个多层自编码器,提高了隐藏层编码的泛化能力,可有效地辅助网络社团检测。
【附图说明】
图1为本发明实施例中智慧社区大数据知识图谱体系架构图。
【具体实施方式】
实施例:
请参照图1,本实施例为智慧社区大数据知识图谱网络社团检测方法,其包括以下步骤:
S1)构建智慧社区大数据知识图谱;
S2)对智慧社区大数据知识图谱进行重构,得到智慧社区知识图谱网络的低维编码;
S3)使用深度学习方法构建深层次的模型进行训练,最终得到社团检测结果。
所述步骤S1)中,构建智慧社区大数据知识图谱包括从原始的社区数据出发,通过知识抽取和知识表示从原始数据和第三方数据库中抽取出来社区知识,然后将提取的所述社区知识存入知识库的数据层和模式层中,通过知识融合,包括实体链接和知识合并,解决已有社区知识存在冗余、缺乏逻辑性的问题,提高社区知识质量;对社区知识形成的知识图谱中由于数据源或不同构建方法产生的冲突,根据数据源可靠性或机器学习的方法进行冲突解决,形成所述智慧社区大数据知识图谱。
所述智慧社区大数据知识图谱的构建过程包含:知识抽取、知识表示、知识融合、知识推理四个过程,每次更新的一个周期都包括这四个阶段。知识图谱的构建采用自底向上的方式,先从一些开放链接的数据中提取出实体,然后选择其中可信度较高的知识加入到知识库中,再构建顶层的本体模式。
所述智慧社区大数据知识图谱包括人员层、行为层、语义层。其中人员层包括不同年龄段的社区人员,行为层包含相应社区人员的行为特征,包括经济状况、工作情况、加班情况、出入社区时间等,语义层包括对应社区人员的一些公开言论等。
所述步骤S2)中的智慧社区大数据知识图谱进行重构具体包括:
S21)社团检测谱方法的矩阵表示
S211)将智慧社区知识图谱网络的拓扑结构用G=(V,E)表示,其中,V是包含N个节点的顶点集合{V
S212)将G的邻接矩阵用一非负对称的二进制矩阵
S213)定义模块化矩阵为B∈R
S214)假设知识图谱网络具有C个社团,将模块最大化转化为以下优化问题:
s.t.tr(X
其中tr(·)表示矩阵的迹,X=(x
S215)对于智慧社区知识图谱网络的内容信息,使用S={s
S216)使用正态切割切除相似图G最小的边,使得属于同一社团结构内的顶点具有较高的相似性,而不同社区结构之间的顶点具有较低的相似性。在这个过程中,使用
s.t.Y
其中,s
S22)基于自动编码器的社团检测谱方法的矩阵重构
S221)构建一个三层的自动编码器进行模块化矩阵的重建。
S222)在该自编码器中,从第一层到隐藏层,编码器将输入B映射到低维编码
S223)从隐藏层到第三层,解码器将潜在表示H
其中,b
S224)该自编码器通过最小化第一层和第三层数据之间的重构误差,得到矩阵的低维表示:
其中,
S225)通过对自动编码器的训练,得到参数W,d,然后得到一个低维编码,该低维编码即可作为该网络的图形表示。
S226)另一方面,也可以利用马尔可夫矩阵作为自动编码器的输入,利用内容信息实现智慧社区知识图谱社团检测。在该自动编码器中,该重构的相应损失函数可表示为:
其中,
S23)结合连接信息和节点内容的社团检测
S231)定义M=D
S232)定义一个组合矩阵Z=[B,M]
S233)将矩阵Z
S234)使用组合矩阵Z作为自动编码器的输入,编码器将输入数据映射到低维编码
其中,W=R
其中,δ={W,d,W
所述步骤S3)中,使用深度学习方法构建深层次的模型进行训练,最终得到社团检测结果。实质上是构建深度自编码器进行社团检测。本方案使用随机梯度下降法进行模型参数的学习。
S31)具体的,将步骤S2中所得到的模型
按照随机梯度下降法进行迭代。
S32)将该模型中的参数δ={W,d,W
其中,参数W,d的更新规则的推理如下(W
其中,h
在解码器中,ω
其中sig′(·)是对sig(·)求导所得。
S33)使用深度神经网络进行训练
构造一个深层自编码器,在第一个自编码器通过重构输入矩阵Z训练模型,得到一个最好的潜在表示
本发明一种智慧社区大数据知识图谱网络社团检测方法,利用自编码器模型结合模块最大化和正态切割方法,从复杂的大规模知识图谱网络中获取清晰的知识节点社团结构;通过构建深层自编码器模型,提高检测的效率。具体的,
1)将人工智能方法应用于智慧社区大数据知识图谱社团检测场景;
2)提出了一种利用自编码器将模极大值模型和正态切割模型的无缝结合的方式,该自编码器模型提供了一种非线性的方法,集成了知识图谱网络的拓扑结构和节点内容信息,同时能对数据在降维过程中的重要因素进行编码,自动学习数据的权值得到各因素之间的关系;
3)结合深度神经网络算法,通过叠加一系列的自编码器,构建了一个多层自编码器,提高了隐藏层编码的泛化能力,可有效地辅助网络社团检测。
以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
- 一种智慧社区大数据知识图谱网络社团检测方法
- 基于智慧社区大数据知识图谱的不良舆论传播抑制方法