掌桥专利:专业的专利平台
掌桥专利
首页

应用于城市规划的企业集群确定方法、装置及电子设备

文献发布时间:2024-04-18 19:54:45


应用于城市规划的企业集群确定方法、装置及电子设备

技术领域

本申请属于城市规划技术领域,尤其涉及一种应用于城市规划的企业集群确定方法、应用于城市规划的企业集群确定装置、电子设备及计算机可读存储介质。

背景技术

对各类社会经济活动所需的空间做出合理安排是城市规划的重要任务;而各类社会经济中,产业经济作为城市的支柱,尤为重要。故此,在规划编制、实施评估以及城市研究等具体工作中,需要科学全面地研究判断待规划区域内的产业经济。

企业集群研究是地方产业经济研究中的重要组成部分。因此要科学全面地研究判断规划区域内的产业经济,需要准确确定不同类型的企业集群。

但目前的企业集群确定方法难以对各类型的企业集群做出精确划分,这容易降低城市规划中对产业经济的研究判断的科学性和全面性。故此,一种对所有类型的企业集群确定方法亟待提出。

发明内容

本申请提供了一种应用于城市规划的企业集群确定方法、应用于城市规划的企业集群确定装置、电子设备及计算机可读存储介质,能够对各类型的企业集群做出精确划分,进而提升城市规划中对产业经济的研究判断的科学性和全面性。

第一方面,本申请提供了一种应用于城市规划的企业集群确定方法,包括:

对目标区域内的各个企业的工商注册信息进行预处理,得到包括每个企业对应的基础特征的第一数据集;

基于第一数据集和预先构建的企业标签分类器为每个企业赋予至少三个特征标签,得到第二数据集;

基于第二数据集确定每两个企业之间的关联特征标签,关联特征标签用于表征对应的两个企业之间的产业联系强度;

基于关联特征标签构建企业联系网络;

利用社区发现算法识别企业联系网络中的企业集群。

第二方面,本申请提供了一种应用于城市规划的企业集群确定装置,包括:

预处理模块,用于对目标区域内的各个企业的工商注册信息进行预处理,得到包括每个企业对应的基础特征的第一数据集;

分类模块,用于基于第一数据集和预先构建的企业标签分类器为每个企业赋予至少三个特征标签,得到第二数据集;

第一确定模块,用于基于第二数据集确定每两个企业之间的关联特征标签,关联特征标签用于表征对应的两个企业之间的产业联系强度;

第一构建模块,用于基于关联特征标签构建企业联系网络;

识别模块,用于利用社区发现算法识别企业联系网络中的企业集群。

第三方面,本申请提供了一种电子设备,该电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。

第四方面,本申请提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

第五方面,本申请提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。

本申请与现有技术相比存在的有益效果是:工商注册信息是一种公开的数据,具有较高的时效性。因此,以工商注册信息为数据源来确定目标区域内的企业集群,不仅能够降低数据获取难度,而且能够提升企业集群确定的时效性。具体地,先通过对目标区域内各企业的工商注册信息进行预处理,可以得到包括每个企业对应的基础特征的第一数据集;然后根据该第一数据集和预先构建的企业标签分类器,可为每个企业赋予至少三个特征标签,得到第二数据集;同属于一个企业集群的各个企业中,两两企业之间的产业联系强度均较强;故此,可以先确定第二数据集中每两个企业之间的关联特征标签,用关联特征标签来表征对应的两个企业之间的产业联系强度,并由此构建出对应的企业联系网络。可以认为,在该企业联系网络中,产业联系强度较强的各企业相对聚集。基于此,可根据社区发现算法来准确确定该企业联系网络中的企业集群。

该企业集群确定方法基于各个企业之间的产业联系强度构建出企业联系网络,使得该企业联系网络中,产业关联较强的各企业呈现相对聚集的状态;在此基础上,通过社区发现算法便可准确划分出目标区域内不同类型的企业集群,以提升城市规划中对产业经济的研究判断的科学性和全面性。

可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的企业集群确定方法的流程示意图;

图2是本申请实施例提供的第二数据集的数据形式示意图;

图3是本申请实施例提供的部分地址的编码结果示意图;

图4是本申请实施例提供的某一企业所对应的基础特征示意图;

图5是本申请实施例提供的两种产业关联的示意图;

图6是本申请实施例提供的企业联系网络的示意图;

图7是本申请实施例提供的基于时序的企业集群网络示意图;

图8是本申请实施例提供的基于时序的企业集群表示意图;

图9是本申请实施例提供的基于时序的企业集群演化轨迹示意图;

图10是本申请实施例提供的企业集群确定装置的结构示意图;

图11是本申请实施例提供的电子设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

相关技术中,因不同类型的企业集群难以被准确划分,使得城市规划中对产业经济的研究判断的科学性和全面性偏低。

为了解决该问题,本申请提出了一种应用于城市规划的企业集群确定方法,能够精确划分不同类型的企业集群,提升城市规划中对产业经济的研究判断的科学性和全面性。下面将通过具体的实施例对本申请所提出的确定方法进行说明。

本申请实施例提供的应用于城市规划的企业集群确定方法可以应用于手机、平板电脑、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。

为了说明本申请所提出的技术方案,下面将以电子设备作为执行主体对各个实施例进行说明。

图1示出了本申请提供的应用于城市规划的企业集群确定方法的示意性流程图,该企业集群确定方法包括:

步骤110、对目标区域内的各个企业的工商注册信息进行预处理,得到包括每个企业对应的基础特征的第一数据集。

目标区域可根据城市规划所对应的待规划区域确定。例如待规划区域为一个区,一个县或者一个市;相应地,目标区域也为一个区,一个县或者一个市。

企业为企业集群的最小单元,企业的产业类型、经营领域和产品类型通过上下游交易联系,聚集为企业集群。故此,可以理解,电子设备可基于各企业的产业信息确定企业集群。鉴于工商注册信息不仅包含企业所对应的产业信息,而且是易获得且时效性较高的数据,因此可将工商注册信息作为确定企业集群的数据源。即基于该工商注册信息,电子设备便能够确定出目标区域内的企业集群。其中,工商注册信息可以是预先获取,例如提前1个星期获取;或者根据预设的频率获取,例如每个月获取一次;也可以在特定条件的触发下获取,例如在接收到新企业的工商注册信息或者现存企业变更了工商注册信息之后获取;还可以在需要分析时进行获取。也即,对于工商注册信息的获取时机,在本申请中不做限定,可根据实际需求进行选择。

为了减少干扰数据,提高数据处理效率,在获得工商注册信息之后,电子设备可对目标区域内各个企业的工商注册信息进行预处理。可选地,该预处理可以包括数据格式转换及数据清洗等操作,具体的操作可以根据待处理数据的实际情况进行选择。

电子设备在对工商注册信息进行预处理后,可梳理出每个企业所对应的基础特征,例如企业统一信用代码、企业名称、企业类型、企业资质证书、所属行业、经营范围、经度及纬度。各个企业所对应的基础特征,便可以构成一个数据集。为了与后文中的另一个数据集区分开,可将该数据集记作第一数据集。

步骤120、基于第一数据集和预先构建的企业标签分类器为每个企业赋予至少三个特征标签,得到第二数据集。

为了能够准确表征每个企业的产业特性,电子设备可为每个企业赋予相应的特征标签。由企业的相关规定和标准可知,企业的产业类型、经营领域以及产品类型三个维度的数据,相互之间具有明确的对应关系,且均能够准确反映企业的产业特征。故此,可以将这三个维度所对应的数据作为企业的特征标签。相应地,每个企业可以被赋予至少三个标签,即每个企业在每个维度下,至少包括一个特征标签。

为了能够准确赋予每个企业相应的特征标签,电子设备可根据第一数据集和预先构建的企业标签分类器为每个企业赋予特征标签,以得到新的数据集。同样,为了与前述数据集进行区分,可将该新的数据集记作第二数据集。

可以理解,为了准确表示每个企业与特征标签之间的关系,此处可以保留第一数据集中的企业编码、企业名称以及存续年份。仅作为示例,参阅图2,图2示出了一种可能的第二数据集的数据形式。

步骤130、基于第二数据集确定每两个企业之间的关联特征标签。

由前述内容可知,企业的特征标签是用于表示企业的产业特性的。由此,可以认为,对于两个企业来说,相互之间具备关联特征标签,则说明两个企业的产业特性相近的,相互之间具备一定的产业联系强度,也即可以作为一个企业集群内的企业。基于此,电子设备可以先确定每两个企业之间的关联特征标签,以便于准确确定目标区域内的企业集群。

步骤140、基于关联特征标签构建企业联系网络。

确定出每两个企业之间的关联特征标签,也即确定出每两个企业之间的产业联系强度。故此,电子设备根据关联特征标签准确构建企业联系网络,以准确反映目标区域内各个企业相互之间的产业联系强度。

步骤150、利用社区发现算法识别企业联系网络中的企业集群。

可以认为,在该企业联系网络中,产业联系强度较强的各企业相对聚集。基于此,电子设备可根据社区发现算法来准确确定该企业联系网络中的企业集群。

其中,社区发现算法可以包括传统的社区发现算法,例如图像分割或者聚类算法;可以包括基于分裂的社区发现算法;可以包括基于模块化的社区发现算法,例如纽曼贪婪搜索算法以及FU(Fast unfolding)社区发现算法等,还可以包括重叠社区发现算法或者动态社区算法等。

本申请实施例中,电子设备基于各个企业之间的产业联系强度来构建企业联系网络,可使得产业关联强度较强的各企业在企业联系网络中呈现相对聚集的状态;在此基础上,通过社区发现算法划分出目标区域内企业集群,可精确确定目标区域内不同类型的企业集群,提升城市规划中对产业经济研究判断的科学性和全面性。

在一些实施例中,上述步骤110具体包括:

针对每个企业:

步骤111、对工商注册信息中的地址信息进行编码,得到企业对应的编码信息。

对地址信息进行编码,也即地理编码。是按照一定的地理规则赋予每个企业可识别的编码,从而建立企业地址与标准地址以及空间坐标的映射关系,从而将企业的地址与空间坐标进行自动转换。

仅作为示例,电子设备可调用在线地理编码服务对企业的地址信息进行编码,也即将企业的地址信息作为输入,得到企业所处位置的经纬度。输出结果可参阅图3,图3示出了深圳市部分地址的编码结果。

之所以对每个企业的地理信息进行编码,是为了后续能够从空间维度来对企业集群进行分析。

步骤112、基于编码信息提取企业在对应空间范围内的工商注册数据。

在确定出编码数据后,便可以基于该编码数据提取目标区域内的工商注册数据。

步骤113、对工商注册数据执行数据清洗操作,以得到企业对应的基础特征。

在得到空间范围内的工商注册数据后,电子设备可以对该工商注册数据进行清洗。具体地,电子设备可以先对该工商注册数据去重,并统一各个企业所需保留的数据的字段。其中,字段可以包括企业统一信用代码、企业名称、企业类型、企业资质证书、所属行业、经营范围、成立时间、注销时间、存续年份、经度及纬度等。仅作为示例,参阅图4,图4示出了深圳市某一企业所对应的基础特征。最终,电子设备可得到包括目标区域内各个企业的基础特征的第一数据集。

在一些实施例中,为了能够准确反映每个企业的产业特征,可通过以下步骤构建企业标签分类器:

步骤A1、确定预设基础特征与特征标签之间的对应关系。

由前述步骤可知,特征标签可分为三个维度,即产业类型、经营领域以及产品类型。每个维度下的标签,可根据实际需求进行确定。

仅作为示例,每个维度下的标签可根据相关标准和规定确定。例如行业产业分类标准(例:《国民经济行业分类GBT4754—2017》、《生产性服务业统计分类》)、企业信息登记规定(例:《企业名称登记管理规定》、《企业经营范围登记管理规定》)以及企业资质管理规定(例:《建筑业企业资质管理规定》)等相关标准和规定。

鉴于企业的基础特征中,企业名称、企业资质证书以及企业经营范围等信息与特征标签具有较强的关联性。故此,电子设备可以将这部分基础特征作为预设基础特征,并建立预设基础特征与特征标签之间的对应关系,以便于后续基于企业的基础特征赋予企业相应的特征标签。

可以理解,在实际应用过程中,可通过预设基础特征与特征标签之间的对应关系构建映射规则库,以便于后续构建企业标签分类器。

步骤A2、通过基于规则的分类算法和对应关系建立企业标签分类器。

预设基础特征与特征标签之间的对应关系,也即为企业赋予特征标签的相应规则。基于此,电子设备可以通过基于规则的分类算法和该对应关系来建立企业标签分类器。

在一些实施例中,企业标签分类器可通过重复增量修剪(Repeated IncrementalPruning to Produce Error Reduction,RIPPER)算法构建。

其中,基于RIPPER算法构建分类器的构建原理如下:

(1)、把数据项随机分为增长集和缩减集两个子集。

(2)、扩张规则。先把规则的条件置空,然后加入规则条件,如此反复向规则中加入条件,使信息增益达到最大,直到规则覆盖数据集中的所有的数据项。

(3)、规则缩减。依次删除规则中最后一个条件,使得增益函数最大,重复执行直到增益函数无法增大为止。至此,可得到这条规则,并选择度量公式,删减规则,尽可能使得规则的条件数量最少。

在确定出规则的条件后,便可以基于该规则来实现数据分类,构建得到分类器。该分类器的规则公式可表示为:

R=(r

其中R是规则集,r

基于该构建原理,电子设备可通过Python这一编程语言将步骤A1中得到的映射规则库转换为初始的企业标签分类器;该初始的企业标签分类器在经过覆盖率和准确率验证后,便可得到最终的企业标签分类器。将第一数据集输入至该标签分类器后,可得到每个企业对应的特征标签,以构建第二数据集。

在一些实施例中,将第一数据集输入至该标签分类器后,即可得到每个企业对应的特征标签,可通过以下步骤实现:

针对第一数据集中的每个企业,通过企业标签分类器为企业匹配预设基础特征,并基于预设基础特征为企业赋予对应的特征标签。

在一些实施例中,关联特征标签可以包括相同标签或者表征两个企业之间的供给关系的标签。在此基础上,上述步骤130具体包括:

步骤131、确定第二数据集中的每两个企业之间是否具有相同标签或者可表征两个企业之间供给关系的标签。

其中,表征两个企业之间供给关系的标签也即能够表示两个企业间具有上下游关系的标签。该标签可以通过文本资料整理或者专业人士提供等多种途径确定。

总而言之,关联特征标签可表示了两个企业间的产业关联。在实际应用中,该产业关联可以分为相同产业内部产品关联以及不同产业内部产品关联。参阅图5,图5示出了两种不同的产业关联形式。为了便于表示,该图中的分值不论是上述哪种关联特征标签,一个关联特征标签均可记作1。

步骤132、两个企业之间是否具有相同标签或者可表征两个企业之间供给关系的标签,则将该标签确定为该两个企业之间的关联特征标签。

对于两个企业,只要两者具有相同标签或者可表征两个企业之间供给关系的标签,就可以将对应的标签确定为这两个企业之间的关联特征标签。

在一些实施例中,为了能够量化两两企业之间的产业联系强度,可通过以下步骤构建企业联系网络:

步骤141、在第二特征数据集中,若任意两个企业之间具有关联特征标签,则将两个企业确定为企业组。

经过前述实施例的步骤,电子设备可以确定出任意两个企业之间是否有关联特征标签,以及关联特征标签的数量。对于具有关联特征标签的两个企业,说明两个企业之间具有产业联系性,同属于一个企业集群的可能性较高。为了便于描述,可以将这样的两个企业确定为企业组。

步骤142、针对每个企业组,基于企业组所对应的关联特征标签的个数确定企业组对应的产业联系强度。

对于每个企业组,其对应的关联特征标签可能很多,也可能很少。可以认为,企业组对应的关联标签越多,说明对应的两个企业之间的产业联系强度越强;企业组对应的关联标签越少,说明两个企业之间的产业联系强度越弱。

也就是说,企业组的关联标签的数量在一定程度上象征企业组内两个企业之间产业联系性的强弱。故此,电子设备可以基于每个企业组对应的关联特征标签个数来确定该企业组对应的产业联系强度。

仅作为示例,如果一个企业组1(a企业和b企业)对应3个关联特征标签,那么企业组1的产业联系强度可表示为3;另一个企业组2(a企业和c企业)对应的1个关联特征签,那么企业组2的产业联系强度可表示为1。显然a企业与b企业的产业联系强度大于与c企业的产业联系强度,也即a企业和b企业属于同一个企业集群的可能性更大。

在一些实施例中,可以用分值表示产业联系强度,分值越高,产业联系强度越强。假定一个关联特征标签可以初始化为1分。不同的关联特征标签,其可以表示直接关联,也可以表示间接关联,也即关联程度会有所区别。故此,可以根据关联特征标签所对应的关联程度赋予该分值对应的权重,从而更精确地确定企业组内两个企业的产业联系强度,进而提升企业联系网络识别的准确性。

仅作为示例,假定关联程度分为三个等级,分别为强相关、相关以及弱相关;对于每个等级,可以赋予其一权重值,例如分别为:强相关~0.8、相关~0.5以及弱相关~0.3。现已知一个企业组,其对应了三个关联特征标签,三个关联特征标签的关联程度分别为强相关、相关以及弱相关。要计算企业组的产业联系强度,可根据3个关联特征对应的权重值来确定该企业组的关联强度:1*0.8+1*0.5+1*0.3=1.6(分)。

可以理解,以上相关数据和关联程度的等级划分仅作为示例。实际应用过程中,可以设置更详细的等级划分,对应的等级可以根据实际情况赋予不同的权重值,以准确确定企业组对应的产业联系强度。

步骤143、基于各个企业组对应的产业联系强度构建企业联系网络。

在确定出各个企业组对应的企业产业联系强度后,电子设备可以先将其转换成企业联系表,并将企业联系表转换为企业联系网络。仅作为示例,参阅图6,图6示出了一种企业联系网络的示意图。该企业联系网络中,每个网络节点代表一个企业,节点与节点之间的连线可代表企业之间的产业联系强度。

在一些实施例中,为了提高企业集群识别的准确性,可以通过FU算法来识别企业联系网络中的企业集群。识别步骤具体包括:

步骤151、将企业联系网络中的每个网络节点确定为一个企业社区。

首先,进行初始化。即将企业联系网络中的每个网络节点都作为一个企业社区,参与到后续的计算过程中。

步骤152、针对每个企业社区,确定企业社区与相邻的企业社区执行合并操作后的模块度变化量;

然后,执行模块化:针对每个企业社区,将相邻的企业社区与自身合并,并计算自身的模块度变化量。该模块度变化量可以通过合并操作前企业社区的模块度和合并操作后企业社区的模块度计算而得。

具体地,该模块度的计算公式如下:

把相邻的企业社区i中的网络节点加入到企业社区c中,企业社区c的模块度变化值为:

其中,k

步骤153、若模块度变化量大于0,则接受合并操作,对企业社区进行更新;

可以理解,上述的合并操作为模拟操作,只有当模块度满足对应的条件后,该操作才会被接受,也即真的将企业社区i和企业社区c合并。

为了便于理解,仍以企业社区i和企业社区c的合并为例进行说明。

企业社区i并入企业社区c后,若企业社区c的模块度变化量小于等于0,则说明企业社区i并入企业社区c后,企业社区c无增益,即企业社区的结构质量并未提升,反而可能下降。此时,无需将企业社区i并入企业社区c。即可以拒绝企业社区i和企业社区c所对应的合并操作。

若企业社区c模块度变化量大于0,则说明企业社区i并入企业社区c中,该企业社区c是有增益的,企业社区的结构质量得到了提升。此时,可以将企业社区i并入企业社区c,形成新的企业社区。即可以接受企业社区i和企业社区c所对应的合并操作。

步骤154、在企业社区更新后,返回执行步骤152及其后续步骤,直至模块度变化量小于等于0,拒接合并操作,得到企业集群。

企业社区更新,说明有新的企业社区形成。此时,可以认为各个企业社区的结构还未达到最优。故此,可以返回执行上述步骤152及其后续步骤,直至模块度变化量小于等于0,拒接合并操作。此时说明已经没有企业社区需要被更新,也就是说各个企业社区内的网络节点均不再变化,达到了最优结构。将结构达到最优的每个企业社区确定为一个企业集群,即可准确确定企业联系网络中不同类型的企业集群。

仅作为示例,结构稳定的企业社区的模块度的取值范围可以为(0.3~0.7)。对于每个企业社区,可以基于该取值范围来调整自身结构,以确保得到的每个企业社区的结构均是稳定的。

在一些实施例中,在确定出企业集群后,还可以对企业集群进行分析,以得到企业集群分析结果。其中,企业集群分析结果可以通过多种形式表示,例如企业集群网络和企业集群表等。

在一些实施例中,在发展早期,一般难以识别新型产业所对应的企业集群。为了提升新型产业所对应的企业集群的识别度,可以通过下述步骤进行识别:

步骤B1、基于时序预设置至少2个确定周期。

对于新型产业所对应的企业集群,其在短期内是难以准确将其确定出来的。故此,可以分作至少两个确定周期来确定企业集群。例如,时序可以为2019-2022年,将每一个年度作为一个确定周期。

步骤B2、在每个确定周期内,基于确定周期对应的各个企业的工商注册信息执行上述步骤110-150,得到确定周期对应的企业集群。

相应地,对于不同确定周期,针对同一个目标区域,其对应了不同的工商注册信息。因此可以先针对性地获取每个确定周期所对应的各个企业的工商注册信息,并将该工商注册信息带入步骤110至150中,以得到该确定周期所对应的企业集群。

在一些实施例中,当有至少2个确定周期对应的企业集群时,企业集群分析结果除了网络和表格这类的表现形式外,还可以为企业集群演化轨迹图。且企业集群网络和企业集群表也可以是基于时序的。

仅作为示例,参阅图7至图9,三个图分别示出了基于时序的企业集群网络、企业集群表以及企业集群演化轨迹图。显然,通过不同确定周期所对应的图表,可以清楚地看出新型产业所对应的企业集群,进而提升不同确定周期下新型企业对应的企业集群确定的准确性。

在一些实施例中,还可以基于企业联系网络确定每个企业的资源联系效率,确定步骤具体包括:

步骤C1、基于企业联系网络计算每个网络节点在对应的企业集群中的中介中心性和拓扑深度。

由空间句法理论可知,城市街道的拓扑网络中,各节点代表了街道,节点间的连接线代表了街道的连接关系;通过该拓扑网络可计算每个节点的中介中心性和拓扑深度。

其中,中介中心性,表示拓扑网络中某条街道被任两条街道之间的最短路径通过的次数。可类比某条街道上的店铺被指定区域内最短路径通过的频率,频率越高,收获客流的机会越高。相应地,可以用中介中心性的值来表示该街道的收益;该值越大,街道的收益越高;该值越小,街道的收益越高。

拓扑深度,表示拓扑网络中某条街道和其他所有街道之间的最短路径的拓扑距离之和。可类比指定区域所有道路到达某条街道上的店铺的最短路径的和,和越大,表示越店铺位置越偏远,到达的成本就越高。相应地,可以用拓扑深度的值来表示该街道的成本;该值越大,街道的成本越高;该值越小,街道的成本越低。

也就是说,中介中心性和拓扑深度对应为拓扑网络中各节点的收益和成本。

本申请通过借鉴该理论,对企业的资源联系效率做了不同维度的衡量。具体地,通过计算企业联系网络中各网络节点中介中心性和拓扑深度,表示对应的网络节点的收益和成本计算。

仅作为示例,网络节点i的中介中心性

N是企业联系网络中网络节点的总数,n

网络节点i的拓扑深度

N是企业联系网络中网络节点的总数,d

步骤C2、针对每个网络节点,基于对应的中介中心性、拓扑深度以及预设的计算公式确定网络节点对应的企业的资源联系效率。

收益和成本的比值即为该网络节点的效率,也即对应的企业在目标区域内的资源联系效率。故此,可以将每个网络节点对应的中介中心性和拓扑深度带入预设的计算公式中,确定对应的企业的资源联系效率。该预设公式为:

其中,

由此,便可以得到一年内,所有企业的资源联系效率集合。

在一些实施例中,在确定网络节点对应的企业的资源联系效率之后,还包括:

步骤D1、针对每个企业集群,基于企业集群中各个企业的资源联系效率确定企业集群的平均资源联系效率以及最大资源联系效率。

根据各个企业集群,可以将资源联系效率集合划为不同的资源联系效率子集合,并确定每个企业集群的平均资源联系效率以及最大资源联系效率。

步骤D2、基于各个企业集群对应的平均资源联系效率、最大资源联系效率以及企业数量确定目标区域内的优势产业及弱势产业。

根据各个企业对应的平均资源联系效率、资源联系效率以及企业数量,可以确定该待分析区域内的优势产业以及弱势产业。对于优势产业,可维持该产业的发展;对于弱势产业,结合规划目标,可进行扶持,提升其产业效益,也可进行产业改造升级。

对应于上文实施例的应用于城市规划的企业集群确定方法,图10示出了本申请实施例提供的应用于城市规划的企业集群确定装置1的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。

参照图10,该企业集群确定装置1包括:

预处理模块10,用于对目标区域内的各个企业的工商注册信息进行预处理,得到包括每个企业对应的基础特征的第一数据集;

分类模块11,用于基于第一数据集和预先构建的企业标签分类器为每个企业赋予至少三个特征标签,得到第二数据集;

第一确定模块12,用于基于第二数据集确定每两个企业之间的关联特征标签,关联特征标签用于表征对应的两个企业之间的产业联系强度;

第一构建模块13,用于基于关联特征标签构建企业联系网络;

识别模块14,用于利用社区发现算法识别企业联系网络中的企业集群。

可选地,第一构建模块13可以包括:

第一确定单元,用于在第二特征数据集中,若任意两个企业之间具有关联特征标签,则将两个企业确定为企业组;

第二确定单元,用于针对每个企业组,基于企业组所对应的关联特征标签的个数确定企业组对应的产业联系强度;

构建单元,用于基于各个企业组对应的产业联系强度构建企业联系网络。

可选地,企业集群确定装置1还可以包括:

设置模块,用于基于时序预设置至少2个确定周期;

第一循环模块,用于在每个确定周期内,基于确定周期对应的各个企业的工商注册信息执行对目标区域内的各个企业的工商注册信息进行预处理的步骤及后续步骤,得到确定周期对应的企业集群。

可选地,企业集群确定装置1还可以包括:

分析模块,用于基于至少2个确定周期对应的企业集群生成企业集群分析结果。

可选地,企业联系网络中的一个网络节点代表一个企业,每两个网络节点之间的连线代表对应的两个企业之间的产业联系强度;企业集群确定装置1还可以包括:

第一计算模块,用于基于企业联系网络计算每个网络节点在对应的企业集群中的中介中心性和拓扑深度;

第二确定模块针对每个网络节点,基于对应的中介中心性、拓扑深度以及预设的计算公式确定网络节点对应的企业的资源联系效率。

可选地,企业集群确定装置1还可以包括:

第三确定模块,用于确定预设基础特征与特征标签之间的对应关系;

第二构建模块,用于通过基于规则的分类算法和对应关系建立企业标签分类器。

可选地,识别模块14可以包括:

第四确定模块,用于将企业联系网络中的每个网络节点确定为一个企业社区;

第二计算模块,用于将每个网络节点加入相邻的企业社区内,计算相邻的企业社区的模块度变化量;

更新模块,用于若相邻的企业社区的模块度变化量大于0,则基于对应的网络节点更新相邻的企业社区,基于更新后的相邻的企业社区更新网络节点;

第二循环模块,用于在网络节点更新后,返回执行将每个网络节点加入相邻的企业社区内,计算相邻的企业社区的模块度变化量的步骤及其后续步骤,直至各个相邻的企业社区内的网络节点不再变化,得到企业集群。

需要说明的是,上述装置/单元之间的信息交互和执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。

图11为本申请一实施例提供的电子设备的物理层面的结构示意图。如图11所示,该实施例的电子设备2包括:至少一个处理器20(图11中仅示出一个)、存储器21以及存储在存储器21中并可在至少一个处理器20上运行的计算机程序22,处理器20执行计算机程序22时实现上述任意应用于城市规划的企业集群确定方法实施例中的步骤,例如图1所示出的步骤110-150。

所称处理器20可以是中央处理单元(Central Processing Unit,CPU),该处理器20还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器21在一些实施例中可以是电子设备2的内部存储单元,例如电子设备2的硬盘或内存。存储器21在另一些实施例中也可以是电子设备2的外部存储设备,例如电子设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

进一步地,存储器21还可以既包括电子设备2的内部存储单元也包括外部存储设备。存储器21用于存储操作装置、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如计算机程序的程序代码等。存储器21还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/电子设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

相关技术
  • 配送参数的确定方法、确定装置、存储介质和电子设备
  • 信息推荐方法、情感倾向确定方法及装置和电子设备
  • 基于集群计算的数据批处理方法、装置、电子设备及介质
  • 集群间通信安全因子的生成方法、装置、介质及电子设备
  • 应用于车辆入口的排队方法、装置及电子设备
  • 应用于城市规划的数据处理方法、装置、电子设备及介质
  • 无人机集群的位置确定方法及边缘设备集群系统、存储介质和电子设备
技术分类

06120116384939