掌桥专利:专业的专利平台
掌桥专利
首页

图数据结构中的主干提取方法、装置、电子设备及介质

文献发布时间:2024-04-18 19:58:30


图数据结构中的主干提取方法、装置、电子设备及介质

技术领域

本发明涉及图机器学习与图数据挖掘技术领域,尤其涉及一种图数据结构中的主干提取方法、装置、电子设备及介质。

背景技术

图(graph)是一种由一组对象(结点)及其关系(边)构成的数据结构。作为一种独特的非欧几里德数据结构,图数据结构具有强大的表达能力,能够对现实世界中的各种关系进行建模。在任何图数据结构中,都存在着一种关键的子结构——图的主干,它在整个图中发挥着核心作用。

近年来,图神经网络(Graph Neural Network,GNN)在解决与图数据结构相关的学习问题(如图级任务)方面取得了显著的进展。消息传递范式(message-passing paradigm)作为图神经网络的基础,在多个领域取得了巨大的成功。在消息传递范式中,相邻的结点相互交换消息(即结点和边的特征),从而更新图上各结点的表示。

然而,这种“以结点和边为中心”的传统思维方式也给图级任务(graph-leveltask)带来了一些意想不到的挑战,例如长程问题(long-range problem)、信息瓶颈(information bottleneck)、过度挤压现象(over-squashing phenomenon)和表达能力有限(limited expressivity)等。因此,亟需为图级任务开发一种新的范式,使其能够打破“以结点和边为中心”的传统思维方式,克服传统消息传递范式所面临的上述挑战,同时能够广泛适用于各个领域的图数据结构。

发明内容

本发明提供一种图数据结构中的主干提取方法、装置、电子设备及介质,能够在任意图数据结构中寻找到发挥核心作用的关键图主干,并基于所述图主干处理各种类型的图级任务。

本发明提供一种图数据结构中的主干提取方法,包括:

获取待处理图数据结构;

基于树分解算法从所述待处理图数据结构中提取骨架树;

基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;

基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

根据本发明提供的一种图数据结构中的主干提取方法,所述基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干,包括:

基于所述骨架树中任意两结点间的路径,确定所述任意两结点间的结点影响;

基于所述任意两结点间的最短路径,最大化所述结点影响;

基于最大化后的结点影响,确定所述骨架树中任意路径的路径影响;

基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干。

根据本发明提供的一种图数据结构中的主干提取方法,所述基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干,包括:

基于所述骨架树中任意路径的路径影响,从所述骨架树中确定出路径影响最大的最长最短路径;

将所述最长最短路径作为所述骨架树中的树干。

根据本发明提供的一种图数据结构中的主干提取方法,所述基于所述骨架树中任意两结点间的路径,确定所述任意两结点间的结点影响,包括:

基于如下公式,确定所述任意两结点间的结点影响:

其中,I

根据本发明提供的一种图数据结构中的主干提取方法,所述基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干,之后还包括:

将所述骨架树分解为多级树干,并将所述多级树干中各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示;

基于所述图表示,处理各类图级任务。

根据本发明提供的一种图数据结构中的主干提取方法,所述将所述多级树干中各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示,包括:

基于长短期记忆网络沿着所述各个级别树干的相应路径,学习所述各个级别树干的树干表示;

将所述各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示。

根据本发明提供的一种图数据结构中的主干提取方法,所述基于树分解算法从所述待处理图数据结构中提取骨架树,之后还包括:

将所述骨架树输入至训练好的预测模型中,由所述预测模型得到所述待处理图数据结构的图表示;

基于所述图表示得到所述待处理图数据结构关于具体图级任务的预测结果;

所述预测模型是基于训练数据集中的样本图数据结构,以及所述样本图数据结构关于所述具体图级任务的真值结果训练得到的。

本发明还提供一种图数据结构中的主干提取装置,包括:

获取图数据单元,用于获取待处理图数据结构;

提取骨架树单元,用于基于树分解算法从所述待处理图数据结构中提取骨架树;

确定树干单元,用于基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;

提取图主干单元,用于基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述图数据结构中的主干提取方法。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述图数据结构中的主干提取方法。

本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述图数据结构中的主干提取方法。

本发明提供的图数据结构中的主干提取方法、装置、电子设备及介质,对于任意领域的图数据结构,首先基于树分解算法从待处理图数据结构中提取骨架树,随后在骨架树上寻找树干,最终基于该树干从待处理图数据结构中提取图主干,从而能够在任意图数据结构中寻找到发挥核心作用的关键图主干,并基于所述图主干处理各种类型的图级任务。综合而言,本发明打破了“以结点和边为中心”的传统思维方式,克服了传统消息传递范式面临的主要挑战,包括长程问题、信息瓶颈、过度挤压现象和表达能力有限,可广泛应用于各种领域的图数据结构。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的图数据结构中的主干提取方法的流程示意图;

图2是本发明提供的图数据结构中的主干提取方法中步骤130的流程示意图;

图3是本发明提供的图数据结构中的主干提取装置的结构示意图;

图4是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在任何图数据结构中,都存在着一种关键的子结构——图的主干,它在整个图中发挥着核心作用。例如,有机分子图中的图主干表示有机物的碳骨架,社交网络中的图主干表示社交中的主导群体,蛋白质分子图中的图主干具有明确的生物化学意义,表示蛋白质的一级结构(protein primary structure)。为此,本发明提供一种图数据结构中的主干提取方法,图1是本发明提供的图数据结构中的主干提取方法的流程示意图,如图1所示,该方法包括:

步骤110,获取待处理图数据结构。

具体地,可以获取待处理的图数据结构,此处的待处理图数据结构是指后续需要提取图主干的图数据结构,可以是任意领域的图数据结构。图数据结构具有强大的表达能力,能够对现实世界中的各种关系进行建模。例如,分子图能够对原子之间的化学键进行建模,社交网络能够对社会群体之间的社交互动进行建模,引文网络能够对文献之间的引用和被引用关系进行建模,交通网络能够对交通结点之间的交通线路进行建模。

步骤120,基于树分解算法从所述待处理图数据结构中提取骨架树。

具体地,在获取到待处理的图数据结构之后,可以基于树分解算法从待处理的图数据结构中提取骨架树。

首先简单描述用于提取骨架树的树分解算法:

对于任意一个给定的待处理图数据结构(简称为“图”)

1.图G中的每个结点

2.对于图G中的每条边e=(u,v),树T中都存在一个同时包含该边端点u和v的包

3.如果树T中的两个包b

类似于动物的骨架,骨架树是一个支撑待处理图数据结构主体的树状结构框架,其反映了待处理图数据结构中基本子结构之间的拓扑关系以及待处理图数据结构的拓扑形态。骨架树中的每个结点(即包)代表待处理图数据结构中的基本子结构,包括待处理图数据结构中的边(例如引文网络中的引用关系)、圈(例如有机分子图中的苯环)、团(例如社交网络中的特殊社区)和重要结点(例如运输网络中的交通枢纽);骨架树中的每条边代表这些基本子结构之间的拓扑关系;骨架树的整体则抽象出待处理图数据结构的拓扑形态。

基于上述树分解算法的思想,给定任意图G,首先寻找所有团、圈,以及不属于任何团或圈的边,并将所找到的每个团、每个圈和每条边都视为一个单独的包。随后,再寻找同时属于至少三个包的重要结点,并将所找到的每个结点视为一个“单体”包。接下来,通过在具有公共结点的所有包之间添加赋权边来构建骨架图:对于具有公共结点的任意两个包b和c,令S

步骤130,基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干。

具体地,树干是自然界树木中最重要的部分,它储存水和营养物质、将其输送到树上的各个部位,并为整棵树提供结构支撑。仿照自然界中的树木结构,本发明实施例提出在骨架树寻找一种类似树干的子结构(简称为树干),并利用它在整个骨架树中传输信息(类比水和营养物质)。通过这种方式,树干子结构可以模仿自然界树木中树干的功能,进而从整个骨架树中捕获和存储重要信息。

通常而言,自然界树木中的树干携带了整颗树所需的大部分营养物质。另一方面,自然界树木中的树干在形态上类似于树数据结构中的关键路径。受这些现象的启发,本发明实施例将骨架树中的树干视为骨架树上具有最大信息影响的路径。通过这种方式,可以最大程度地增加树干携带的总信息量,使其能够维持整个骨架树。

为此,定义路径影响(path influence)I(P)以量化任意一条路径P的总体信息影响:

令P表示一条长度为m、结点序列为(v

相应地,可以基于骨架树中任意路径的路径影响,寻找具有最大信息影响

步骤140,基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

具体地,在确定骨架树中的树干之后,可以基于树干从待处理图数据结构中提取待处理图数据结构的图主干。

例如,可以将树干上的包映射回到待处理图数据结构中的结点,并将这些结点视为关键结点。最终,将这些关键结点在待处理图数据结构中的导出子图作为待处理图数据结构中的图主干。

本发明实施例提供的方法,对于任意领域的图数据结构,首先基于树分解算法从待处理图数据结构中提取骨架树,随后在骨架树上寻找树干,最终基于该树干从待处理图数据结构中提取图主干,从而能够在任意图数据结构中寻找到发挥核心作用的关键图主干。

基于上述实施例,图2是本发明提供的图数据结构中的主干提取方法中步骤130的流程示意图,如图2所示,步骤130包括:

步骤131,基于所述骨架树中任意两结点间的路径,确定所述任意两结点间的结点影响;

步骤132,基于所述任意两结点间的最短路径,最大化所述结点影响;

步骤133,基于最大化后的结点影响,确定所述骨架树中任意路径的路径影响;

步骤134,基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干。

具体地,根据前文所述,骨架树中的树干子结构主要模仿自然界树木中树干的功能,从整个骨架树中捕获和存储重要信息,而骨架树(以及更一般的图数据结构)上的信息传输本质上可以认为是树(图)上的一个源结点对树(图)上的另一个目标结点施加影响。为了定量描述任意一对结点u和v之间的信息影响,以随机游走作为一般的信息传播规则,定义结点影响(node influence)如下:

结点影响I(u,v)量化了结点v的信息变化如何影响结点u的信息。为了简化分析,本发明实施例主要考虑无权图,其中所有边的权重均为1,这普遍存在于许多现实世界场景。给定无权图G,在k步随机游走之后,结点v对结点u的结点影响I

其中,d

其中,结点u和v之间至多存在一条长度为k的路径,将其表示为(u,v

以上两式表明,结点影响随着结点间距离k和结点度数的增加而减小。更准确地,结点影响I(u,v)随着结点u和v之间距离的增加而呈指数下降,随着连接结点u和v路径上的结点度数的增加而呈多项式下降。因此,长距离和高度数是导致弱结点影响(即信息瓶颈)的关键因素。

显然,越强的结点影响越能促进一对结点之间的信息传输,故应该尽可能地增强结点影响。

以下将从骨架树和最短路径两个角度说明如何增强并最大化结点影响,从而缓解信息瓶颈。

考虑图G上的任意一对结点u

尤其是在大型图上。

因此,树分解通常使I

另一方面,一般的随机游走规则不存在任何约束,经过多轮游走后可能出现闭途径(closed walk,起点和终点相同的途径),致使信息传播较为分散并弱化了信息影响。为了最大化骨架树中的结点影响I

s.t.d

显然,该问题的最优解为

形态上,自然界树木中的树干类似于树数据结构中的关键路径。此外,上述分析表明,沿着最短路径传输信息可以最大化结点之间的信息影响,从而缓解信息瓶颈。综合考虑这两个因素,可以将骨架树中的树干视作一种特殊的路径。为此,首先量化路径的总体信息影响,然后基于该指标在骨架树中的所有可能路径中寻找树干。定义路径影响(pathinfluence)如下:

令P表示一条长度为m、结点序列为(v

即基于任意两结点间的最短路径,最大化任意两结点间的结点影响,再基于最大化后的结点影响,确定骨架树中任意路径的路径影响,最后基于骨架树中任意路径的路径影响,确定骨架树中的树干。

基于上述实施例,步骤134包括:

步骤1341,基于所述骨架树中任意路径的路径影响,从所述骨架树中确定出路径影响最大的最长最短路径;

步骤1342,将所述最长最短路径作为所述骨架树中的树干。

具体地,可以基于骨架树T中任意路径P的路径影响I(P),从骨架树中确定出具有最大信息影响的路径。令m表示路径P的长度,

该问题的最优解为

特别地,令

通常而言,自然界树木中的树干携带了整颗树所需的大部分营养物质。受这一自然现象的启发,本发明实施例将骨架树上信息影响(类比营养物质)最大的路径,即最长最短路径作为骨架树中的树干。通过这种方式,可以最大程度地增加树干携带的总信息量,使其能够维持整个骨架树。

基于上述实施例,步骤131包括:

基于如下公式,确定所述任意两结点间的结点影响:

其中,I

基于上述实施例,基于以上提出的图数据结构中的主干提取方法,本发明进一步将其应用于处理图级任务,该应用范式所对应的模型称为图主干网络(Graph TrunkNetwork),即步骤140之后还包括:

步骤141,将所述骨架树分解为多级树干,并将所述多级树干中各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示;

步骤142,基于所述图表示,处理各类图级任务。

具体地,在自然界中,一棵树去除主树干后的剩余部分也呈现出树的形态与结构,通常将这种剩余部分称为子树,每棵子树也都有自己的“(子)树干”。因此,在自然界树木中,树干在整棵树上以层次的方式出现。仿照自然界中的树木结构,本发明实施例将整个骨架树分解为不同层次的多级树干,并使用各个级别的树干对整个骨架树进行全面的描述。

具体来说,将第一级树干t

然后,将多级树干中各个级别树干的树干表示相结合,得到待处理图数据结构G的图表示h

最后,基于图表示h

例如,对于图嵌入任务(graph embedding task),假设嵌入维度为D,可以直接将图表示

又例如,对于图分类任务(graph classification task),假设该分类任务共包含C个类别,需进一步将图表示

其中,h

还例如,对于图回归任务(graph regression task),可以直接将图表示

本发明实施例提供的方法,仿照自然界中的树木结构,进一步将骨架树分解为多级树干,通过结合多级树干的树干表示,为待处理图数据结构构建强大的图表示,最终基于所构建的图表示处理相应的图级任务,从而能够将所提出的主干提取方法应用于处理各类图级任务,例如图嵌入任务、图分类任务、图回归任务等。

基于上述实施例,步骤141,包括:

步骤1411,基于长短期记忆网络沿着所述各个级别树干的相应路径,学习所述各个级别树干的树干表示;

步骤1412,将所述各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示。

具体地,可以运用长短期记忆网络(Long Short-Term Memory,LSTM)沿着各个级别树干的相应路径,学习各个级别树干的树干表示,具体公式如下:

其中,

随后,将各个级别树干的树干表示相结合,以构建骨架树T的表示h

其中,W

特别地,对于图嵌入任务,假设嵌入维度为D,令

随后,将以上提出的应用范式与经典的消息传递范式进行对比。在消息传递范式中,每个结点都作为中心对象,在每次聚合迭代中与邻居结点交换消息(即结点和边的特征),以捕获局部邻域内的信息。通常,该范式在堆叠k个消息传递层后执行k次聚合迭代,进而从每个中心结点的k跳局部邻域内收集信息。

然而,图级任务更强调全局图结构,其中包含了丰富的长程信息。为了从距离中心结点较远的k跳邻居中捕获长程信息,消息传递范式需要较大的k值和大量的聚合迭代。否则,相距较远的结点无法感知到彼此。随着迭代次数k的增加,每个结点感受野内的结点数量呈指数增长。此外,更大的k值也增加了遇到高度数结点的可能性,这加速了感受野的扩张。由于指数增长的感受野内的大量信息需要被“挤压”进入固定大小的结点表示向量,这一过程在模型中造成了信息瓶颈。因此,挤压过程中可能会导致远处结点信息的丢失,通常将这一现象称为过度挤压现象。随着k的增加,消息传递范式变得更容易遭受这种过度挤压现象的影响。

与消息传递范式相反,在本发明实施例所提出的应用范式中,由于LSTM能够捕获长程依赖关系,因此能够有效地解决长程问题。此外,根据步骤132的分析与描述,由于将无约束的随机游走限制为沿着最短路径传输信息,感受野内的结点数量和信息量仅随着传播步数线性增加,这显著缓解了信息瓶颈和过度挤压现象。更进一步,本发明实施例所提出的应用范式并未像消息传递范式那样分开设计复杂的聚合(aggregation)和读出(readout)函数,而是将这两种类型的函数整合到单一的传播函数(即LSTM)中,并直接使用该传播函数来生成树干表示。通过这种方式,所提出的应用范式更加注重封装了全局图结构的树干表示,而不是仅捕获局部邻域结构的传统结点表示,从而有效地确保了表达能力。

综合而言,本发明实施例所提出的应用范式打破了“以结点和边为中心”的传统思维方式,克服了传统消息传递范式面临的主要挑战,包括长程问题、信息瓶颈、过度挤压现象和表达能力有限,可广泛应用于各种领域的图数据结构。

基于上述实施例,步骤120,之后还包括:

步骤121,将所述骨架树输入至训练好的预测模型中,由所述预测模型得到所述待处理图数据结构的图表示;

步骤122,基于所述图表示得到所述待处理图数据结构关于具体图级任务的预测结果;

所述预测模型是基于训练数据集中的样本图数据结构,以及所述样本图数据结构关于所述具体图级任务的真值结果训练得到的。

具体地,可以将骨架树输入至训练好的预测模型中,由预测模型得到待处理图数据结构的图表示,然后,基于该图表示得到待处理图数据结构关于具体图级任务的预测结果。

为了获得训练好的预测模型,可以基于如下步骤对预测模型进行训练:

首先,可以预先收集样本图数据结构以构建训练数据集,同时预先获取样本图数据结构的骨架树以及样本图数据结构关于具体图级任务的真值结果。此外,还可以使用Xavier初始化、He初始化等方法对预测模型的参数进行初始化,从而构建初始预测模型。

在获取到训练数据集,以及样本图数据结构的骨架树、样本图数据结构关于具体图级任务的真值结果之后,可以将骨架树输入至初始预测模型中,由初始预测模型得到样本图数据结构的图表示。此处的初始预测模型可以是图主干网络,即可以结合多级树干的表示得到每个样本图数据结构的图表示。

随后,基于图表示得到样本图数据结构关于具体图级任务的预测结果。

在得到具体图级任务的预测结果之后,可以将具体图级任务的预测结果与具体图级任务的真值结果进行比较,并根据此两者之间的差异程度计算对应的图级任务损失,再根据对应的图级任务损失对初始预测模型进行迭代训练与参数优化,直至满足预设的训练结束条件,将训练结束时的预测模型确定为最终的预测模型。

可以理解的是,具体图级任务的预测结果与具体图级任务的真值结果之间的差异程度越大,图级任务损失越大;具体图级任务的预测结果与具体图级任务的真值结果之间的差异程度越小,图级任务损失越小。

下面对本发明提供的图数据结构中的主干提取装置进行描述,下文描述的图数据结构中的主干提取装置与上文描述的图数据结构中的主干提取方法可相互对应参照。

基于上述任一实施例,本发明提供一种图数据结构中的主干提取装置,图3是本发明提供的图数据结构中的主干提取装置的结构示意图,如图3所示,该装置包括:

获取图数据单元310,用于获取待处理图数据结构;

提取骨架树单元320,用于基于树分解算法从所述待处理图数据结构中提取骨架树;

确定树干单元330,用于基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;

提取图主干单元340,用于基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

本发明实施例提供的装置,对于任意领域的图数据结构,首先基于树分解算法从待处理图数据结构中提取骨架树,随后在骨架树上寻找树干,最终基于该树干从待处理图数据结构中提取图主干,从而能够在任意图数据结构中寻找到发挥核心作用的关键图主干。综合而言,本发明打破了“以结点和边为中心”的传统思维方式,克服了传统消息传递范式面临的主要挑战,包括长程问题、信息瓶颈、过度挤压现象和表达能力有限,可广泛应用于各种领域的图数据结构。

基于上述任一实施例,确定树干单元330具体包括:

确定结点影响单元,用于基于所述骨架树中任意两结点间的路径,确定所述任意两结点间的结点影响;

最大化结点影响单元,用于基于所述任意两结点间的最短路径,最大化所述结点影响;

确定路径影响单元,用于基于最大化后的结点影响,确定所述骨架树中任意路径的路径影响;

确定树干子单元,用于基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干。

基于上述任一实施例,确定树干子单元具体用于:

基于所述骨架树中任意路径的路径影响,从所述骨架树中确定出路径影响最大的最长最短路径;

将所述最长最短路径作为所述骨架树中的树干。

基于上述任一实施例,确定结点影响单元具体用于:

基于如下公式,确定所述任意两结点间的结点影响:

其中,I

基于上述任一实施例,还包括任务处理单元,所述任务处理单元具体包括:

确定图表示单元,用于将所述骨架树分解为多级树干,并将所述多级树干中各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示;

图级任务处理单元,用于基于所述图表示,处理各类图级任务。

基于上述任一实施例,确定图表示单元具体用于:

基于长短期记忆网络沿着所述各个级别树干的相应路径,学习所述各个级别树干的树干表示;

将所述各个级别树干的树干表示相结合,得到所述待处理图数据结构的图表示。

基于上述任一实施例,还包括模型预测单元,所述模型预测单元具体用于:

将所述骨架树输入至训练好的预测模型中,由所述预测模型得到所述待处理图数据结构的图表示;

基于所述图表示得到所述待处理图数据结构关于具体图级任务的预测结果;

所述预测模型是基于训练数据集中的样本图数据结构,以及所述样本图数据结构关于所述具体图级任务的真值结果训练得到的。

图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communication interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行图数据结构中的主干提取方法,该方法包括:获取待处理图数据结构;基于树分解算法从所述待处理图数据结构中提取骨架树;基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟、光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的图数据结构中的主干提取方法,该方法包括:获取待处理图数据结构;基于树分解算法从所述待处理图数据结构中提取骨架树;基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的图数据结构中的主干提取方法,该方法包括:获取待处理图数据结构;基于树分解算法从所述待处理图数据结构中提取骨架树;基于所述骨架树中任意路径的路径影响,确定所述骨架树中的树干;基于所述树干从所述待处理图数据结构中提取所述待处理图数据结构的图主干。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM、RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 数据提取方法、数据提取装置、存储介质和电子设备
  • 文本信息提取方法、装置、介质及电子设备
  • 身份信息提取方法、装置、电子设备与存储介质
  • 一种查询图构建方法、装置、电子设备及计算机存储介质
  • 桑基图的生成方法、装置、存储介质和电子设备
  • 地形图数据中建筑图斑提取方法、装置、介质及电子设备
  • 图数据结构中节点邻接关系的特征获取方法、装置及介质
技术分类

06120116503321