掌桥专利:专业的专利平台
掌桥专利
首页

基于网络关键节点分析和社区检测的标准需求预测方法及系统

文献发布时间:2024-04-18 19:59:31


基于网络关键节点分析和社区检测的标准需求预测方法及系统

技术领域

本发明涉及标准化技术领域,特别是涉及一种基于网络关键节点分析和社区检测的标准需求预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

一个领域内有多项现行或正在制定中的标准,并且标准经常由不同的标准化组织制定,标准之间缺乏关联性、兼容性,数量繁多的标准之间的关联也不容易厘清,导致数量繁多的标准难以得到体系化的应用实施,不同标准中甚至可能存在对同一标准化对象的冲突的要求,更难以梳理出缺乏的标准。例如智慧城市的规划,从城市整体的角度,对城市空间、设施等进行规划,涉及到城市各个子系统,是一项庞杂的系统工程,规划的编制需要城市规划、数据、工程等各类标准的支撑。但是城市规划相关标准数量多、要求繁杂,标准用户难以有效地收集和使用,给工作带来困难,效率低、效果差。

现有技术中存在以下技术缺点:

(1)专家在领域的标准体系下,分析提出需制定哪些新的标准,这种方法十分依赖于专家的经验,通常缺乏系统性。

(2)无法筛查出领域已有标准中的核心标准以及标准目前关注的侧重点,也无法预测出标准制定可以参考的方向,自然无法得到新的标准需求。

发明内容

针对上述问题,本发明提出了一种基于可视化网络、利用社区检测方法k-核分解的方法,分析领域现有标准,建立标准的关联网络,识别出关键标准节点,再预测缺少的标准,从而识别出需要制定的新标准的需求。具体地,利用标注标准的关键词得到标准的关联网络可视图,利用社区检测k-核算法进行分析,得出新标准的制定需求。

为了实现上述目的,本发明采用如下技术方案:

第一方面,本发明提供一种基于网络关键节点分析和社区检测的标准需求预测方法,包括:

获取标准列表,并采用关键词对标准进行标注;

利用标注标准的关键词,建立标准关联网络模型;

计算标准关联网络模型的参数,进行标准关联网络的分析;

采用社区检测k-核分解算法分析得到标准关联网络的社团核心节点,基于社团核心节点,预测未来标准的研究方向和制定相关的标准。

进一步的技术方案,所述计算标准关联网络模型的参数包括:度和度分布、网络图直径与平均路径长度、网络图直径、聚类系数、介数中心性和模块度;所述标准关联网络的分析为分析标准的关系,识别重要标准节点。

进一步的技术方案,所述度和度分布中网络平均度的计算公式为:

所述网络图直径为标准关联网络模型中两个节点的最大距离,计算公式为:D=maxd

进一步的技术方案,所述聚类系数为与某一节点直接相连的全部节点所构成的子网中的现有边数与最大可能边数之比,计算公式为:

或者,所述聚类系数为与某一节点相连的三角形的数量除以改节点为中心的三元组的数量,计算公式为:

进一步的技术方案,所述介数中心性为在所有最短路径中经过某一节点的路径数目占最短路径总数的占比,计算公式为:

其中,σ

所述模块度用于定量的衡量网络社区划分质量,计算公式为:

其中,m为图中边数,A

进一步的技术方案,所述社区检测k-核分解算法的计算过程为:

输入图G和核心度k;

将图G中度数小于k的顶点全部移除,得到子图G';

将图G'中度数小于k的顶点全部移除,得到新子图G”,该子图G”就是最终k-核划分的结果子图。

进一步的技术方案,采用社区检测k-核分解算法分析标准关联网络的社团核心节点后,与介数中心性排名靠前的节点进行对比,两者的交集是当前标准研究的重点,两者除交集以外的部分为未来标准的需求。

第二方面,本发明提供一种基于网络关键节点分析和社区检测的标准需求预测系统,包括:

标准获取和标签构建模块,被配置为:获取标准列表,并采用关键词对标准进行标注;

标准关联网络模型建立模块,被配置为:利用标注标准的关键词,建立标准关联网络模型;

关联网络参数计算和分析模块,被配置为:计算标准关联网络模型的参数,进行标准关联网络的分析;

核心节点分析和标准需求预测模块,被配置为:采用社区检测k-核分解算法分析得到标准关联网络的社团核心节点,基于社团核心节点,预测未来标准的研究方向和制定相关的标准。

与现有技术相比,本发明的有益效果为:

1、通过可视化网络参数计算,可以直观得出目前该领域标准之间的关系以及重要的标准节点;

2、利用k-核分解法与介数中心性,可以科学、直观得出目前该领域标准的研究热点方向,识别出新标准的制定需求方向。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1为本发明预测方法的总体流程步骤图;

图2为本发明智慧城市标准关联网络;

图3为本发明智慧城市标准局部网络放大图;

图4为本发明核值为33的社团结构。

具体实施方式:

下面结合附图与实施例对本发明做进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

实施例一

本实施例中以智慧城市领域为例,提供了一种基于网络关键节点分析和社区检测的标准需求预测方法,步骤包括:

S1:获取标准列表,并采用关键词对标准进行标注;

S2:利用标注标准的关键词,建立标准关联网络模型;

S3:计算标准关联网络模型的参数,进行标准关联网络的分析;

S4:采用社区检测k-核分解算法分析得到标准关联网络的社团核心节点,基于社团核心节点,预测未来标准的研究方向和制定相关的标准。

其中,在步骤S1中,首先搜集领域相关的标准,形成标准列表,存储到Excel表中。列表中的一行是一项标准的数据,包括标准编号、题目。对列表中的每项标准采用关键词进行标注,关键词包括该项标准的标准化对象、技术特征,其中技术特征可以是标准化对象的技术要求、标准所属领域或子领域。具体为:搜集智慧城市领域相关标准,记录下标准编号、题目,存储在相应Excel表格中。使用标准的标准化对象、技术特征的关键词对每项标准进行如下表1方式标注:

表1:智慧城市领域相关标准及其标注

在步骤S2中,计算标准列表中每行数据与列表中其他每一行数据的相同关键词的个数,得到关键词比较结果列表,输出为csv表格的形式。利用该结果列表,生成可视化软件(例如Gephi)需要的边数据和点数据列表,导入到可视化软件当中,选择算法布局,并设置网络的度值和边值,生成标准的关联网络模型。具体为:利用Python编程工具计算智慧城市标准列表中每行数据与列表中其他每一行数据的相同关键词的个数,得到关键词比较结果列表,输出为csv表格的形式如表2,第一列、第二列表示比较的标准名称,第三列表示两个标准相同关键词的数量。

利用该结果列表,生成Gephi软件需要的边数据和点数据列表,边列表包含四列:源、目标、权重和类型,如表3。“源”和“目标”的值是标准编号。而“源”又与另一个标准“目标”相关。权重的范围是0到n,表示两个标准标签中相同关键字的数量,n表示相同关键字的最大数量。类型的取值范围是“无向”,表示两个标准之间的关系没有方向。点数据列表由所有的标准编号组成,包含序号和标准编号两列。如表4。将两个列表分别导入到Gephi当中。

表2:部分相同关键词数量的标准

表3:表示标准连接的部分边数据

表4:表示标准的部分点数据

将上表3、表4转换为复杂的网络图,导入到可视化软件Gephi中,布局选用改进的弹簧模型(FruchtermanReingold)算法。得到结果如图2,根据经验将节点度的排名设置为8-25。

在步骤S3中,在复杂网络中,如果复杂网络的密度为1,那么说明该网络中的每一个节点都互相连接。在图2智慧城市标准关联网络模型中,共有节点数195个,边有2566条,图密度为0.136,图密度较低,表明标准之间连接不够紧密,结构比较分散。

在本实施例中进一步分析智慧城市标准关联网络模型中的的度和度分布、网络图直径与平均路径长度、聚类系数、介数中心性、模块度等参数,识别当前标准网络的研究脉络和热点问题。

(1)度和度分布

在复杂网络模型中,节点度定义为与当前节点连接的所有节点的数目,通常记为k

其中,N为整个网络模型中的节点数量。

在本实施例中,利用Gephi得出各节点的度值,根据式(1)计算出平均度和平均加权度,平均度为26.318,平均加权度为31.046。其中度的值为0-88,度值前5的是ISO/TR22370:2020安全和智慧—城市智慧—框架和原则,ITU-TY.4200智慧城市平台互操作性要求,ITU-T Y.Suppl.28可持续智慧城市—综合管理,ITU-T X.smdtsc智慧城市数字孪生系统的安全措施,ISO 22326:2018安全性和智慧—应急管理—监测已识别危害的设施的准则,度值分别为88,84,71,69,68,它们与网络中其他标准具有较多的关联,关键词相同数目较多。

(2)网络图直径与平均路径长度

网络图直径代表整个复杂网络模型中两个节点的最大距离,需要经过几条边,网络图直径的计算为式(2):

D=maxd

其中,d

平均路径长度L定义为任意两个节点之间的距离的平均值,网络的平均路径长度也称为网络的特征路径长度或平均距离,计算式为式(3)。

在本实施例中,通过式(2)计算出网络直径为5,平均路径长度为2.024。

(3)聚类系数

在网络中,用节点的聚类系数C

其中,E

或者,按照图形的直观定义,即C

整个网络的聚类系数就是所有节点聚类系数C

(4)介数中心性

介数反映的是节点在在整个网络中的作用与影响力。一个节点的介数中心性数值代表着这个节点在整个网络模型中起到的中介作用大小:在所有最短路径中经过该节点的路径数目占最短路径总数的占比。对于有权图采用Dijkstra算法求最短路径。

节点介数中心性的计算公式如式(6)所示:

其中,σ

在本实施例中,通过上述式(6)介数中心性的计算方法,利用Gephi对智慧城市标准复杂网络模型进行紧密度中心性的分析,得出排名靠前的介数中心性的智慧城市标准节点以及对应的关键词,对应的关键词如表5所示:

表5:介数中心性前五的标准关键词

根据上图可知,介数中心性前5的是ISO/TR 22370:2020安全和智慧—城市智慧—框架和原则,ITU-T Y.4200智慧城市平台互操作性要求,ITU-T Y.4902可持续智慧城市中对信息和通信技术可持续影响的关键绩效指标,ITU-T Y Suppl.28可持续智慧城市—综合管理,IEC SRD 63233-4智慧城市标准清单和映射—第4部分:突发公共卫生事件标准指南。它们在智慧城市规划标准中属于核心的节点,在智慧城市标准网络中起到比较大的影响力,节点关键词也反映出智慧城市需要重点研究的标准内容。

(5)模块度

模块度也被称模块化度量值,是目前常用的一种衡量网络社区结构强度的方法,模块度的定义如式(7)所示:

其中,m为图中边数,A

模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。

在本实施例中,利用Gephi进行模块度的计算,模块化值为0.415,模块化大于0说明,智慧城市标准网络中社区稳定度较高,模块中节点较为集中。

在步骤S4中,设存在图G=(V,L)(V是节点集合,L是边集合)。定义n=|V|,m=|L|。则定义子图H=(W,L|W)当且仅当任意Degree_V(V属于H)>=k,且H是一个具有这样的属性的最大子图的时候,称H为结点集合W诱导的K-核或者说一个K阶核。一个图的最大阶数的核称为主核,一个结点的核阶数为包含此结点的K-核的最大的K。

K-核算法计算过程:

输入:图G,核心度k;

将图G中度数小于k的顶点全部移除,得到子图G';

将图G'中度数小于k的顶点全部移除,得到新子图G”。该子图G”就是最终k-核划分的结果子图。

采用k-核算法得出社团规模较大的社团,以及社团的核心节点,与介数中心性排名靠前的节点进行对比,进一步得出后续标准制定的潜在方向。

在本实施例中,在Gephi中,利用k-核算法对智慧城市标准网络模型进行分析,发现最大k值为36,社团一共有30个,当设置k值为33时,过滤掉大部分的社团,得到社团结构网络图如图4所示,可以发现有3个社团符合,模块化分别是27,24,18,主要是以ITU-TY.4200智慧城市平台互操作性要求,ISO/IEC 30147:2021信息技术—物联网—物联网系统/服务的可信度方法论,ISO/TR 22370:2020安全和智慧—城市智慧—框架和原则为核心的社团结构,是社团中的重要节点,对应的关键词有着重要的影响力,如表6所示:

表6:k-核社团核心标准关键词

根据介数中心性算法排名靠前的核心节点关键词与k-核算法社团核心节点关键词进行比较,两者的交集是目前智慧城市标准研究的重点,两者除交集以外的部分可以作为智慧城市规划新的标准需求:将来进行重点的研究。

具体的:根据表5和表6,目前该领域的标准现状重点在操作、数据、隐私安全、卫生医疗、交通教育等方面。

根据表5和表6,预测未来可以侧重于性能,管理,标准路线图/地图方面进行研究,制定相关的标准.

实施例二

本实施例提供了一种基于网络关键节点分析和社区检测的标准需求预测系统,其具体包括如下模块:

标准获取和标签构建模块,被配置为,获取标准列表,并采用关键词对标准进行标注;

标准关联网络模型建立模块,被配置为,利用标注标准的关键词,建立标准关联网络模型;

关联网络参数计算和分析模块,被配置为,计算标准关联网络模型的参数,进行标准关联网络的分析;

核心节点分析和标准需求预测模块,被配置为,采用社区检测k-核分解算法分析得到标准关联网络的社团核心节点,基于社团核心节点,预测未来标准的研究方向和制定相关的标准。

此处需要说明的是,本实施例中的各个模块与实施例一中的方法一一对应,其具体实施过程相同,此处不再累述。

实施例三

本实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述实施例一所述的基于网络关键节点分析和社区检测的标准需求预测方法中的步骤。

实施例四

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现上述实施例一所述的基于网络关键节点分析和社区检测的标准需求预测方法中的步骤。

以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

相关技术
  • 一种用户信息共享方法、装置、电子设备及存储介质
  • 存储方法、存储系统、电子设备及存储介质
  • 温度信息上传方法、装置、系统、电子设备及存储介质
  • 虚拟货币信息的更新方法、存储介质、电子设备及系统
  • 一种硬件信息采集方法、系统及电子设备和存储介质
  • 吸烟信息共享方法、系统、电子设备及存储介质
  • 汽车共享系统、用于汽车共享的信息处理装置和方法以及存储有汽车共享程序的存储介质
技术分类

06120116521463