掌桥专利:专业的专利平台
掌桥专利
首页

一种大规模快递物流网络最大传播点集挖掘方法

文献发布时间:2024-04-18 20:01:30


一种大规模快递物流网络最大传播点集挖掘方法

技术领域

本发明涉及复杂网络应用技术领域,尤其涉及一种大规模快递物流网络最大传播点集挖掘方法。

背景技术

挖掘快递物流网络中具备最大传播效应的节点城市,可以提升快递物流运行效率和网络通达性、优化物流基础设施布局。目前对节点在网络中传播能力的评估主要基于网络的局部属性、全局属性、位置和随机游走四种视角。基于网络局部属性的典型指标是节点度,主要考虑节点与其临近节点的直连关系,度值高的节点可以直接传播更多的邻点。基于网络全局属性的典型指标则为中介中心性,以网络中经过某节点的最短路径条数,衡量节点在传播过程中的重要性。基于位置和随机游走的指标,如K-core分解算法和PageRank节点排序算法等,多以节点度为基础,对节点传播能力的衡量分别基于节点是否处于网络中的核心位置、节点与邻点的相互影响关系。

上述指标为物流网络关键节点挖掘铺垫了方法基础,但尚存在以下问题:①多关注网络中单个节点的传播能力对比,忽略了节点对于网络实现整体最大传播的作用。在复杂网络中,节点规模较大,节点间联系路径、方向均呈现多元化特征,这意味着网络整体最大传播效应的实现往往不能依托单一节点而是一组节点集。②即使关注到了节点集合,传统研究也多基于节点度等量化结果,顺次拾取最优节点形成点集。这是一种“个体最优”的选择标准,带来的显著问题就是“富人俱乐部”效应,即个体中心度较高的节点抱团形成特定社区,使最紧密的联系路径局限在社区内,无法实现传播最大化。

为解决上述指标带来的问题,社会科学专家Stephen P.Borgatti提出关键节点积极效应模型Key Player Problem-Positive(KPP-Pos)以挖掘一组能最大限度连接到其它节点的关键节点集合(Nodes-set),这是一种集成目标导向的组合优化模型,已被应用于交通拥堵治理、网页信息精确检索、重点专利技术资助等领域。鉴于原始KPP-Pos模型基于无向无权网络提出,为满足复杂加权网络分析,有关学者针对KPP方法的节点选择和求解效率、节点权重和连边权重等问题进行优化。现有研究仍存在一些问题:①对有向网络的节点挖掘模型较少,忽视了节点联系的双向特征;②对加权网络的节点挖掘模型仍在探索之中,缺乏相关实证研究以评估模型有效性;③算法复杂程度较高,尤其在大规模节点网络中,出于运算量级限制而缺乏实操可行性。

综上,基于KPP-Pos模型的特性,其在理论上能够挖掘快递物流网络中的“最大传播点集”,从而为快递物流基础设施布局等提供技术支持,成为建设物流基础设施的重要手段之一,但是,该模型的算法复杂,在大规模节点网络中难以实施。

发明内容

针对上述问题,本发明提出一种大规模快递物流网络最大传播点集挖掘方法,旨在解决原始KPP-Pos模型算法复杂,在大规模节点网络中难以实施的问题。

为解决上述技术问题,本发明第一方面提出了一种大规模快递物流网络最大传播点集挖掘方法,包括以下步骤:

获取快递物流网络信息,并提取所述快递物流网络信息中的有向信息,根据所述有向信息构建有向加权网络;

将原始的KPP-Pos模型关联有向加权网络,并注入方向和权重构建挖掘模型;

采用启发式算法优化所述挖掘模型,直至所述挖掘模型输出最大距离接近度,根据所述最大距离接近度生成最大传播节点集。

在一些实施方式中,所述有向信息至少包含起点城市、终点城市、所述起点城市和所述终点城市之间的运输路径数目。

在一些实施方式中,以起点城市为列、以终点城市为行,构建n×n的所述有向加权网络:

式中,N为有向加权网络,N

在一些实施方式中,所述挖掘模型包括:

其中,K为有向加权网络中选出的k个节点组成的关键节点集,j为有向加权网络中除关键节点集之外中的全部节点组成的剩余节点集,n为有向加权网络的节点总数,w

在一些实施方式中,所述采用启发式算法优化所述挖掘模型包括:选择所述有向加权网络中点重要值最大的节点作为关键节点集中首位成员,在剩余节点集中顺次选择节点加入所述关键节点集,并计算距离接近度,取距离接近度最高的节点填充所述关键节点集,直至所述挖掘模型输出最大距离接近度,根据所述最大距离接近度生成所述最大传播节点集。

本发明第二方面提出了一种大规模快递物流网络最大传播点集挖掘系统,包括:

有向加权网络生成模块,用于获取快递物流网络信息,并提取所述快递物流网络信息中的有向信息,根据所述有向信息构建有向加权网络;

挖掘模型生成模块,用于将原始的KPP-Pos模型关联所述有向加权网络,并注入方向和权重构建挖掘模型;

最大传播节点集生成模块,用于采用启发式算法优化所述挖掘模型,直至所述挖掘模型输出最大距离接近度,根据所述最大距离接近度生成最大传播节点集

本发明第三方面提出了一种大规模快递物流网络最大传播点集挖掘装置,所述装置包括存储器、处理器和通信模块,其中,

所述存储器用于存储可执行程序代码;

所述处理器与所述存储器耦合;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行上述的大规模快递物流网络最大传播点集挖掘方法。

本发明第四方面提出了一种计算机可存储介质,其特征在于,所述计算机可存储介质存储有计算机指令,所述计算机指令被调用时,用于执行上述的大规模快递物流网络最大传播点集挖掘方法。

本发明的有益效果为:通过将原始的KPP-Pos模型关联有向加权网络,并注入方向和权重构建挖掘模型,最后采用启发式算法优化挖掘模型,能够有效提升模型运算效率。

附图说明

图1为发货地和收货地之间的快递物流线路示意图;

图2为关键节点集中“最大传播节点集”的挖掘步骤示意图;

图3为关键节点挖掘的启发式算法流程图;

图4为K集成员及其节点组合的DW-KPP-Pos数值示意图;

图5为点集Kdeg、Kpag和Kbet的传播效率示意图;

图6为实施例三中公开的大规模快递物流网络最大传播点集挖掘装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确,下面结合附图和具体实施方式对本发明的内容做进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。

实施例一

本实施例提出了一种大规模快递物流网络最大传播点集挖掘方法,通过将原始的KPP-Pos模型关联有向加权网络,并注入方向和权重构建挖掘模型,最后采用启发式算法优化挖掘模型,能够有效提升模型运算效率。

本方法包括以下步骤S1-S3:

S1,获取快递物流网络信息,并提取快递物流网络信息中的有向信息,根据有向信息构建有向加权网络。

有向信息至少包含起点城市、终点城市、起点城市和终点城市之间的运输路径数目。在本实施例中,构建有向加权网络的“关系数据”来源于中国智能物流骨干网(ChinaSmart Logistics Network,CSN)。中国智能物流骨干网是主要服务于网络零售业的物流网络,也是电子商务行业重要的基础设施和中国最大的社会化快递物流平台。CSN网络包含起止点城市、数目等快递物流运输线路信息,本方案在其官方网站商家工作台的发货线路查询入口,检索并获取中国各地市之间的有向物流线路数目。如图1,发货城市O到收货城市D之间存在a-c不同的运输路径,物流线路数目统计为3。该线路能准确表征城市间快递物流线路联系。鉴于线路的周期变动,为避免偶然性,在2020年7月5日-9日内采集五批数据,取其平均值。数据的预处理包括去除部分统计重复线路、同城线路和无站点追踪线路,最终实际获取城市之间111366对起止点(O-D)组合,共计21430731条有向线路。

网络矩阵可直接反映快递物流的流向和流向线路的权值特征,是节点挖掘、网络结构分析的必要环节,也是网络绘制和物流要素空间格局分析的基础。本方案基于图论原理(Graph theory)构建有向加权快递物流网络。在此网络结构中,中国各地市为节点(Node),城市间有向快递物流线路为连边(Edge),线路数目为权重。具体的,以起点城市为列、以终点城市为行,构建n×n的有向加权网络:

式中,N为有向加权网络,N

S2,将原始的KPP-Pos模型关联有向加权网络,并注入方向和权重构建挖掘模型。

原始的KPP-Pos模型用于挖掘一组能以最小距离连接所有节点的节点集。即给定一个无权无向的网络G,找到一组k个节点,组成节点集K,使其以最小距离连接剩余节点,也可理解为沿最大传播路径连接剩余节点。经典的KPP-Pos的原始公式基于无权无向网络进行计量,公式如下式(3):

其中,K为k个被选节点组成的关键节点集;j为剩余节点集中的任意节点;d

因此,为了解决复杂节点运算量巨大的问题,本实施例通过以下两个步骤对原始的KPP-Pos模型进行优化。

第一步:考虑节点之间的方向性,即关键节点集中的节点起始发往j节点的快递物流与从j节点起始发往关键节点集中节点的快递物流是两种不同的快递流向,由此形成了双向对称矩阵。此外,本方案对于KPP-Pos模型的改进将基于一步连通性,当城市之间存在两步及以上连通性时,则d

其中,r

第二步:增加权重w,以科学衡量关键节点集中的节点与节点j之间的紧密度,也可理解为距离接近度,以替代0/1指向节点连接与否的简单设定。加权后的算子WD

其中,K为有向加权网络中选出的k个节点组成的关键节点集,j为有向加权网络中除关键节点集之外中的全部节点组成的剩余节点集,n为有向加权网络的节点总数,w

上述的式(4)被定义为DW-KPP-Pos(Directed Weighted-Key Players Problem-Positive)模型,即本实施例中所称的挖掘模型。

上述DW-KPP-Pos节点挖掘模型的原理相对简单,即找到一组和剩余所有节点通过最小距离路径连接,进而实现最大传播效应的节点集,但在实际操作过程中由于要多次重复进行节点的重组、节点间关系的重构,计算难度较高,在进行大规模复杂网络的关键点集挖掘时可行性较低。因此本实施例还设计一种启发式算法降低WDR求解复杂度,如下步骤S3。

S3,采用启发式算法优化挖掘模型,直至挖掘模型输出最大距离接近度,根据最大距离接近度生成最大传播节点集。

采用启发式算法优化挖掘模型包括:选择有向加权网络中点重要值最大的节点作为关键节点集中首位成员,在剩余节点集中顺次选择节点加入关键节点集,并计算距离接近度,取距离接近度最高的节点填充关键节点集,直至挖掘模型输出最大距离接近度,根据最大距离接近度生成最大传播节点集。具体思路如图2:①首先计算网络中所有n个节点的点度数,选择点度数最大的节点作为关键节点集中首位成员。点度数最大节点假设为下图中节点1。②选择第二个节点的思路为:在剩余(n-1)节点中顺次选择节点加入关键节点集,计算WD

本申请提供的DW-KPP-Pos模型,通过设计启发式算法提升模型运行效率,以中国城市快递物流网络为例的实证分析,通过对比DW-KPP-Pos模型和中心度、PageRank算法、中介中心性的节点分析结果,检验模型对于物流网络节点挖掘的有效性。实验结果表明:(1)基于启发式算法的DW-KPP-Pos模型可提升复杂网络节点挖掘的效率。如图4所示,中国快递物流网络的“最大传播点集”包括上海市、重庆市、广州市、北京市、浙江省金华市和香港特别行政区。上述6个城市组成的点集K以最小距离、最全范围连接了外部100%节点。此外,中国快递物流具有明显的等级扩散效应,K集节点多是中国人口和经济规模较大的城市,物流辐射力较强,吸引K集外部城市克服距离摩擦形成最大传播链路。(2)基于“集体最优原则”的DW-KPP-Pos模型所挖掘的点集K传播效率最高,在同样的节点数量约束下,关键节点集相对基于“个体最优原则”依次选择的点度数点集K

实施例二

本实施例提出了一种大规模快递物流网络最大传播点集挖掘系统,包括:

有向加权网络生成模块,用于获取快递物流网络信息,并提取快递物流网络信息中的有向信息,根据有向信息构建有向加权网络;

挖掘模型生成模块,用于将原始的KPP-Pos模型关联有向加权网络,并注入方向和权重构建挖掘模型;

最大传播节点集生成模块,用于采用启发式算法优化挖掘模型,直至挖掘模型输出最大距离接近度,根据最大距离接近度生成最大传播节点集。

本实施例中的有向加权网络生成模块、挖掘模型生成模块,以及最大传播节点集生成模块的数据处理方法请参阅实施例一中的S1-S3,在此不再赘述。

实施例三

请参阅图6,图6是本发明实施例公开的又一种大规模快递物流网络最大传播点集挖掘装置的结构示意图。如图6所示,该控制平台可以包括:

存储有可执行程序代码的存储器301;

与存储器301耦合的处理器302;

处理器302调用存储器301中存储的可执行程序代码,用于执行实施例一所描述的大规模快递物流网络最大传播点集挖掘方法中的步骤。

实施例四

本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一所描述的大规模快递物流网络最大传播点集挖掘方法中的步骤。

以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是:本发明实施例公开的一种大规模快递物流网络最大传播点集挖掘方法所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离奔放各项实施例技术方案的精神和范围。

上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。

技术分类

06120116561910