掌桥专利:专业的专利平台
掌桥专利
首页

信息匹配方法、装置、设备及存储介质

文献发布时间:2023-06-19 11:32:36


信息匹配方法、装置、设备及存储介质

技术领域

本申请涉及数据处理技术领域,具体涉及一种信息匹配方法、装置、设备及存储介质。

背景技术

目前,国家部委、省、市、区发布的各项政策,一般按政务公开的要求在官网发布公开,供企业查看最新的政策,来查找感兴趣或需要的政策。政策一般只支持查看原文,原文通常篇幅很长,难以快速获取企业关注的核心信息。

目前,一般采用标签体系实现企业信息与政策信息的匹配,或者通过关键字匹配等方式为企业匹配适合的政策信息,上述两种方式不能动态调整企业信息,均需要对大量的政策信息进行逐个梳理或者匹配,耗时长,匹配效率低。

发明内容

本申请实施例提供一种信息匹配方法、装置、设备及存储介质,有利于提高匹配效率。

本申请实施例第一方面提供了一种信息匹配方法,应用于电子设备,包括:

获取目标企业的多个企业信息;

获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点;

根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;

根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。

本申请实施例第二方面提供了一种信息匹配装置,应用于电子设备,所述装置包括:获取单元、加权单元和确定单元,其中,

所述获取单元,用于获取目标企业的多个企业信息;

所述获取单元,还用于获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点;

所述加权单元,用于根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;

所述确定单元,用于根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。

本申请实施例的第三方面提供一种电子设备,所述电子设备包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行本申请实施例第一方面所述的方法。

本申请实施例的第四方面提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面所描述的部分或全部步骤。

本申请实施例的第五方面提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例,至少具有如下有益效果:获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点;根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。如此,将政策信息集生成预设决策树,该预设决策树虽然也是由政策信息及政策特征组成,并根据该预设决策树生成目标决策树,该目标决策树的每一节点均进行权重赋值;进而可基于每一节点对应的权重,进行权重计算,确定该目标企业对应的政策匹配结果,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1A为本申请实施例提供了一种信息匹配系统的架构示意图;

图1B为本申请实施例提供了一种信息匹配方法的流程示意图;

图2为本申请实施例提供了一种信息匹配方法的流程示意图;

图3为本申请实施例提供了一种电子设备的结构示意图;

图4为本申请实施例提供了一种信息匹配装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。

为了能够更好地理解本申请实施例,下面将对应用本申请实施例的方法进行介绍。

本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子设备。

请参见图1A,图1A是本申请实施例提供的一种信息匹配系统的架构示意图,该架构示意图中包括多个服务器,其中可包括:服务器200a(该服务器可为物理服务器或者云端服务器,在此不作限定),后台服务器200b(该服务器可为物理服务器或者云端服务器,在此不作限定),以及多个电子设备,该电子设备可以为智能手机、平板电脑、台式电脑、具备无线通讯功能的可穿戴电子设备等等,具体的在此不作限定。

其中,每一电子设备可与上述服务器200a进行信息交互,该后台服务器200b可与服务器200a建立连接;该服务器200a可与每一电子设备之间可进行通信,该服务器200a中可包括预设决策树,该预设决策树可为用户自行设置或者系统默认,在此不作限定。

其中,上述后台服务器200b可由后台用户对上述信息匹配系统进行维护,例如,可及时的根据新发布的政策信息更新上述预设决策树,以确保目标企业获取的信息为最新信息。

其中,每一电子设备可对应于一个目标企业,每一电子设备可从服务器200a中获取上述预设决策树,并将其对应的多个企业信息,与该预设决策树中每一节点对应的政策信息进行匹配,并对其对应的政策信息对应的节点进行加权,以得到该企业对应的目标决策树,进而,可依据该目标决策树确定其对应的政策匹配结果,从而可及时获取与该企业相关的政策。

具体实现中,目标企业对应的用户可通过电子设备(可为如图1A中任意一个电子设备)获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点;根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。如此,将政策信息集生成预设决策树,该预设决策树虽然也是由政策信息及政策特征组成,并根据该预设决策树生成目标决策树,该目标决策树的每一节点均进行权重赋值;进而可基于每一节点对应的权重,进行权重计算,确定该目标企业对应的政策匹配结果,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

请参见图1B,图1B是本申请实施例提供的一种信息匹配方法的流程示意图,应用于电子设备,所述方法包括以下步骤:

101、获取目标企业的多个企业信息。

其中,上述目标企业可指任意一个需要进行政策匹配的企业。

其中,上述企业信息可包括以下至少一种:企业注册地、企业成立年数、企业注册资金、企业类型、是否上市、企业资质、人员构成、资产总额、净利润、工业总产值、贷款金额、投资金额、发明专利数量、企业规模、企业形态、项目类型、扶持类型、扶持阶段、扶持内容等等,在此不作限定。

其中,上述电子设备可对应于目标企业,该电子设备中可安装上述如图1A所述的信息匹配系统,以实现该目标企业对应的用户可通过上述电子设备(该电子设备可对应于图1A中的电子设备100a,或者电子设备100b,或者电子设备100c)在上述如图1A所示的信息匹配系统中查询或者匹配到与自身对应的多个企业信息相匹配的政策信息,从而可供该目标企业进行进一步的查看并执行相关政策。

102、获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集。

其中,上述预设决策树可为用户自行设置或者系统默认,在此不作限定。该预设决策树中可包括多个政策属性。

其中,上述政策属性可包括以下至少一种:企业注册地、企业成立年数、企业注册资金、企业类型、是否上市、企业资质、人员构成、资产总额、净利润、工业总产值、贷款金额、投资金额、发明专利数量、企业规模、企业形态、项目类型、扶持类型、扶持阶段、扶持内容等等,在此不作限定。

其中,上述预设决策树中可包括多个节点,多个节点可用于存储上述政策信息集;可将该政策信息集进行数据处理以后,对应存储在多个节点中,上述多个节点以及每一节点中存储的信息可构成上述预设政策树。

其中,上述节点可包括以下至少一种:根节点、内容节点、叶子节点等等,在此不作限定。

其中,上述政策数据集可包括多种数据,例如,企业注册地、企业成立年数、企业注册资金、企业类型、是否上市、企业资质、人员构成、资产总额、净利润、工业总产值等等,在此不作限定。

在一种可能的示例中,上述步骤102,所述获取预设决策树,可包括如下步骤:

21、获取多个政策属性;

22、根据所述多个政策属性,将所述政策信息集划分为多个数据集,其中,每一政策属性对应一个数据集;

23、计算每一所述数据集的信息熵,得到多个信息熵;

24、确定所述多个信息熵中最大信息熵对应的数据集为目标数据集;

25、确定所述目标数据集对应的政策属性为目标政策属性;

26、根据所述目标政策属性构建所述预设政策树。

其中,上述政策属性可包括以下至少一种:企业注册地、企业成立年数、企业注册资金、企业类型、是否上市、企业资质、人员构成、资产总额、净利润、工业总产值、贷款金额、投资金额、发明专利数量、企业规模、企业形态、项目类型、扶持类型、扶持阶段、扶持内容等等,在此不作限定。

其中,上述政策信息集P中可包括多个政策属性(P1、P2、…、Pn),可表示为:即P={P1,P2,…,Pn},上述多个政策属性中可对应包括两种类型:分类离散属性,部数值连续类型。针对数值连续类型的属性特征,需要先对该属性特征进行离散化。例如,可采用等宽离散化的方法,将该属性特征的值域分成具有相同宽度的区间,然后用不同的符号或整数数值代表落在每个子区间中的数据值。

举例来说,以政策数据集中的年营业收入为例,假设值域为[500,2000](万元),如果想将该属性的值分为三个区间,则区间的宽度为:

d=(2000-500)/3=500

如此,可得到三个区间[500,1000],[1000,1500],[1500,2000],落入相应区间的数据值分别命名为低营业收入、中等营业收入、高营业收入。

其中,可根据每一政策属性对上述政策信息集进行划分,可得到多个划分方法,进而,可计算每一数据集对应的信息熵,并根据该信息熵确定最佳划分方式,并确定最佳划分方式对应的数据集为目标数据集。

其中,上述信息熵可用于体现每个数据集中的信息特征,当数据集的信息熵越高时,可确定该数据集对应的信息特征越多,那么,可确定最大信息熵对应的数据集的划分方式为最佳划分方式,则可选用最大信息熵对应的数据集为目标数据集。

其中,可根据每一政策属性,将上述政策信息集划分为其对应的数据集,举例来说,若上述政策属性集包括营业收入、是否上市两个属性特征;则可根据属性特征“营业收入”,将政策信息集分为三个集合,分别是面向低营业收入的政策集、面向中营业收入的政策集和面向高营业收入的政策集;可根据属性特征“是否上市”,把政策信息集分为两个集合,分别是面向上市企业的政策集和面向非上市企业的政策集。

在一种可能的示例中,上述步骤26,所述根据所述目标政策属性构建所述预设政策树,可包括如下步骤:

261、确定所述目标政策属性对应的多个特征值;

262、根据所述多个特征值,对所述数据集进行划分,得到多个子数据集;

263、计算所述目标政策属性对每一子数据集进行划分所获得的信息增益,得到多个信息增益;

264、选取所述多个信息增益中最大信息增益对应的特征值为根节点,选取除所述最大信息增益以外剩余的多个信息增益对应的特征值为内部节点,选取每一子数据集作为所述内部节点对应的叶子节点,生成所述预设决策树。

其中,上述计算信息增益的公式为:

其中,Pn表示目标政策属性特征,该目标政策属性特征有V个可能取值,那么用Pn来对样本集进行划分,就会产生V个数据分支,Dv是第v个数据分支所包含的子数据集,该子数据集中可包括样本数据。

其中,上述目标政策属性特征可包括以下至少一种:企业注册地、企业成立年数、企业注册资金、企业类型、是否上市、企业资质、人员构成、资产总额、净利润、工业总产值、贷款金额、投资金额、发明专利数量、企业规模、企业形态、项目类型、扶持类型、扶持阶段、扶持内容等等,在此不作限定。

举例来说,可以从上述目标政策属性特征中选取属性作为根节点和内部节点,但是,在具体应用中,上述叶子节点并非属性值,可为该节点对应的政策信息以及其对应的收益情况;这样构建得到的决策树,就可以直接用于后续与目标企业的企业信息的匹配,可直接获取匹配结果(即适配政策及对应收益)。

103、根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配。

其中,每一节点对应存储有政策信息集中的相关数据,该相关数据可包括上述按照目标政策属性划分得到的多个子数据集、每一子数据集对应的属性特征、该属性特征对应的特征值以及该子数据集对应的信息增益等等数据。

其中,上述目标决策树可对应于该目标企业,由于该目标决策树是依据该目标企业的企业信息生成,因此,该目标决策树与该目标企业一一对应,当发布有新的政策信息时,可也根据上述预设决策树,对该目标决策树进行更新,可在有政策发布以后,立即匹配出与该目标企业匹配的政策信息;如此,采用本申请实施例,可根据不同的企业对应的企业信息定制出该企业对应的政策匹配结果,有利于提高用户体验。

在一种可能的示例中,上述步骤103,所述根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,可包括如下步骤:

31、选取所述多个企业信息中任意一个企业信息i;

32、将所述企业信息i与所述预设决策树中每一节点进行匹配,得到多个第一匹配值;

33、选取所述多个第一匹配值中最大的第一匹配值对应的节点为目标节点;

34、根据所述目标节点,确定所述目标节点对应的权重,并将所述权重标注在所述目标节点中,得到所述目标决策树。

其中,可根据上述方式逐个将每一企业信息与上述预设决策树中的节点进行匹配以及加权,以得到最终的目标决策树,该目标决策树中可包括有与上述多个企业信息匹配的多个政策信息。

其中,上述最大第一匹配度对应的节点可理解为与企业信息i维度最相近的节点,并确定该节点对应的政策属性特征值;该维度指政策属性特征值,即企业信息与政策属性特征值最相近;在实际应用中,有时候会因为企业信息与政策属性特征值表述不一致的情况,例如,高新技术企业,简称高新企业,有时候表述不完全一致,可能需要转换表述,例如,企业成立时间为2018年,政策属性要求企业成立时间小于3年;因此,可将企业信息与预设决策树中每一节点进行匹配,有利于提高数据匹配准确性。

其中,可将任意一个企业信息i与预设决策树中每一根节点以及内部节点进行匹配。

在一种可能的示例中,上述步骤34,所述根据所述目标节点,确定所述目标节点对应的权重,可包括如下步骤:

341、确定所述目标节点对应的政策属性,并确定所述政策属性在所述目标节点对应的特征值;

342、计算所述企业信息i与所述特征值之间的第二匹配值,将所述第二匹配值作为所述目标节点对应的权重。

其中,每一节点可对应有一个政策属性,可根据该目标节点确定其对应的政策属性,并确定该政策属性对应的特征值,该特征值可指该政策属性具体对应的具体数值以及具体条件,例如,针对纳税总额属性,其对应的特征值可为:近3年年纳税总额1000万以上。

举例来说,若目标企业对应的企业信息i为近三年年纳税总额,分别为:793万,1007万,1387万;目标节点对应的政策属性特征为:近3年年纳税总额,其对应的特征值为:1000万以上;那么,该企业信息i与目标节点之间的第二匹配度为0.67,那么,0.67即为该目标节点对应的权重。

其中,可根据上述方法依次类推,可得到与每一企业信息相匹配的多个目标节点,以及每一目标节点对应的权重,将所有权重标注在上述预设决策树中,即可得到目标决策树。

104、根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。

其中,每一节点对应的权重体现了每一企业信息与该节点对应的政策属性之间的匹配值,匹配值越高则表明该企业与该政策属性更匹配。

其中,由于上述每一节点实际对应的是政策属性对应的特征值,因此,可基于上述目标决策树以及每一节点对应的权重,确定该目标企业对应的政策匹配结果。

在一种可能的示例中,上述步骤104,所述根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果,可包括如下步骤:

41、确定所述目标决策树中的多个分支;

42、从所述多个分支中选取多个目标分支,其中,每一所述目标分支中可包括多个目标节点,每一目标节点对应有权重;

43、对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值;

44、根据所述多个概率值,确定所述目标企业对应的政策匹配结果。

其中,上述目标分支中,若每一节点都与目标企业对应的任意一个企业信息相匹配或者对应,即表明该分支的每一个政策特征,该企业都有信息匹配上了。

具体实现中,若目标决策树与预设决策树相比,存在一条分支中每一节点都有匹配到企业信息,则确定该分支为目标分支,该目标分支中每一目标节点都对应有权重。

进一步地,可对上述多个目标分支进行概率计算,以得到每一分支对应的概率值,该概率值可体现与上述预设决策树中多个政策信息的匹配度,概率值越高,那么企业信息与该分支对应的政策信息匹配度越高,则将其作为政策匹配结果的可能性越高。

在一种可能的示例中,上述步骤43,所述对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值,可包括如下步骤:

431、确定所述多个目标分支中任意一个目标分支对应的M个目标节点,其中,M为正整数;

432、确定每一目标节点对应的第三匹配值,得到M个第三匹配值;

433、计算所述M个第三匹配值的乘积,得到所述目标分支对应的概率值。

具体实现中,可对目标决策树中所有匹配到的目标节点进行筛选,获取每个目标节点都匹配到的完整的目标分支,得到目标分支集合M={M1,M2,…,Mn},该目标分支集合中包括多个目标分支;基于目标分支集合M,对每个目标分支进行概率计算,得到每个目标分支对应的概率值。

具体地,假设目标分支(即目标分支集合中任一个目标分支Mn)的总匹配度为Qn,该目标分支共有N个目标节点,每个目标节点的权重依次为p1,p2,…pn,那么,该目标分支对应的概率值为:Qn=p1*p2*…*pn;如此,可依次计算得到概率值集合Q={Q1,Q2,...,Qn},其中,该集合中可包括多个概率值,每一概率值可对应一个目标分支。

可见,采用本申请实施例,可根据不同的企业对应的企业信息定制得到其对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树;并且,当企业对应的企业信息发生更改时,仍旧可以依据上述方式产生专属于该企业的决策树,因此,企业可动态调整其对应的企业信息,从而动态的生成其对应的目标决策树,以实现对政策信息的匹配,有利于提高用户体验。

可选地,上述根据所述多个概率值,确定所述目标企业对应的政策匹配结果,可包括如下步骤:对多个概率值按照从大到小的顺序进行排序;若存在任意两个概率值相等,则对比每一目标节点对应的叶子节点中的收益情况,将收益高的概率值对应的目标节点排列在收益较低的目标节点的前面;得到所述目标企业对应的政策匹配结果,所述政策匹配结果包括目标节点中叶子节点对应的政策信息和收益情况。如此,可得到政策匹配结果,该政策匹配结果中可对应有多个政策信息,以及每一政策信息对应的收益情况,收益越高,其该政策信息的排名越靠前,有利于用户直接查看政策匹配结果。

可以看出,本申请实施例中所描述的信息匹配方法,应用于电子设备,获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。如此,将政策信息集生成预设决策树,该预设决策树虽然也是由政策信息及政策特征组成,并根据该预设决策树生成目标决策树,该目标决策树的每一节点均进行权重赋值;进而可基于每一节点对应的权重,进行权重计算,确定该目标企业对应的政策匹配结果,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

与所述一致地,请参阅图2,图2是本申请实施例公开的一种信息匹配方法的流程示例图,应用于电子设备,该信息匹配方法可包括如下步骤:

201、获取目标企业的多个企业信息。

202、获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集。

203、选取所述多个企业信息中任意一个企业信息i。

204、将所述企业信息i与所述预设决策树中每一节点进行匹配,得到多个第一匹配值。

205、选取所述多个第一匹配值中最大的第一匹配值对应的节点为目标节点。

206、根据所述目标节点,确定所述目标节点对应的权重,并将所述权重标注在所述目标节点中,得到所述目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配。

207、确定所述目标决策树中的多个分支。

208、从所述多个分支中选取多个目标分支,其中,每一所述目标分支中可包括多个目标节点,每一目标节点对应有权重。

209、对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值。

210、根据所述多个概率值,确定所述目标企业对应的政策匹配结果。

其中,上述步骤201-210的具体描述可以参照图1B所述的信息匹配方法的相应描述,在此不再赘述。

可以看出,本申请实施例所描述的信息匹配方法,应用于电子设备,获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;选取所述多个企业信息中任意一个企业信息i;将所述企业信息i与所述预设决策树中每一节点进行匹配,得到多个第一匹配值;选取所述多个第一匹配值中最大的第一匹配值对应的节点为目标节点;根据所述目标节点,确定所述目标节点对应的权重,并将所述权重标注在所述目标节点中,得到所述目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;确定所述目标决策树中的多个分支;从所述多个分支中选取多个目标分支,其中,每一所述目标分支中可包括多个目标节点,每一目标节点对应有权重;对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值;根据所述多个概率值,确定所述目标企业对应的政策匹配结果。如此,可定位出多个企业信息中每一企业信息对应的目标节点,并确定目标分支,该目标分支中的节点全部为目标节点,最后通过计算每一目标分支对应的概率,确定政策匹配结果,不需要对每一分支进行计算筛选,同时通过权重表现企业信息与政策信息的匹配度,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

与所述一致地,请参阅图3,图3为本申请实施例提供的一种电子设备的结构示意图,如图3所示,包括处理器、通信接口、存储器以及一个或多个程序,所述处理器、通信接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,所述一个或多个程序程序包括用于执行以下步骤的指令:

获取目标企业的多个企业信息;

获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;

根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;

根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。

可以看出,本申请实施例中所描述的电子设备,获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。如此,将政策信息集生成预设决策树,该预设决策树虽然也是由政策信息及政策特征组成,并根据该预设决策树生成目标决策树,该目标决策树的每一节点均进行权重赋值;进而可基于每一节点对应的权重,进行权重计算,确定该目标企业对应的政策匹配结果,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

在一个可能的示例中,在所述获取预设决策树方面,所述程序用于执行以下步骤的指令:

获取多个政策属性;

根据所述多个政策属性,将所述政策信息集划分为多个数据集,其中,每一政策属性对应一个数据集;

计算每一所述数据集的信息熵,得到多个信息熵;

确定所述多个信息熵中最大信息熵对应的数据集为目标数据集;

确定所述目标数据集对应的政策属性为目标政策属性;

根据所述目标政策属性构建所述预设政策树。

在一个可能的示例中,在所述根据所述目标政策属性构建所述预设政策树方面,所述程序用于执行以下步骤的指令:

确定所述目标政策属性对应的多个特征值;

根据所述多个特征值,对所述数据集进行划分,得到多个子数据集;

计算所述目标政策属性对每一子数据集进行划分所获得的信息增益,得到多个信息增益;

选取所述多个信息增益中最大信息增益对应的特征值为根节点,选取除所述最大信息增益以外剩余的多个信息增益对应的特征值为内部节点,选取每一子数据集作为所述内部节点对应的叶子节点,生成所述预设决策树。

在一个可能的示例中,在所述根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树方面,所述程序用于执行以下步骤的指令:

选取所述多个企业信息中任意一个企业信息i;

将所述企业信息i与所述预设决策树中每一节点进行匹配,得到多个第一匹配值;

选取所述多个第一匹配值中最大的第一匹配值对应的节点为目标节点;

根据所述目标节点,确定所述目标节点对应的权重,并将所述权重标注在所述目标节点中,得到所述目标决策树。

在一个可能的示例中,在所述根据所述目标节点,确定所述目标节点对应的权重方面,所述程序用于执行以下步骤的指令:

确定所述目标节点对应的政策属性,并确定所述政策属性在所述目标节点对应的特征值;

计算所述企业信息i与所述特征值之间的第二匹配值,将所述第二匹配值作为所述目标节点对应的权重。

在一个可能的示例中,在所述根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果方面,所述程序用于执行以下步骤的指令:

确定所述目标决策树中的多个分支;

从所述多个分支中选取多个目标分支,其中,每一所述目标分支中可包括多个目标节点,每一目标节点对应有权重;

对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值;

根据所述多个概率值,确定所述目标企业对应的政策匹配结果。

在一个可能的示例中,在所述对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值方面,所述程序用于执行以下步骤的指令:

确定所述多个目标分支中任意一个目标分支对应的M个目标节点,其中,M为正整数;

确定每一目标节点对应的第三匹配值,得到M个第三匹配值;

计算所述M个第三匹配值的乘积,得到所述目标分支对应的概率值。

所述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现所述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据所述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

与所述一致地,请参阅图4,图4是本申请实施例公开的一种信息匹配装置的结构示意图,应用于电子设备,该装置包括:获取单元401、加权单元402和确定单元403,其中,

所述获取单元401,用于获取目标企业的多个企业信息;

所述获取单元401,还用于获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;

所述加权单元402,用于根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;

所述确定单元403,用于根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。

可以看出,本申请实施例中所描述的信息匹配装置,应用于电子设备,获取目标企业的多个企业信息;获取预设决策树,所述预设决策树由政策信息集构建得到,所述预设决策树中对应有多个节点,所述多个节点用于存储所述政策信息集;根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树,其中,所述目标决策树中每一节点对应一个权重,每一权重对应一个企业信息,所述企业信息与所述节点中存储的所述政策信息集匹配;根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果。如此,将政策信息集生成预设决策树,该预设决策树虽然也是由政策信息及政策特征组成,并根据该预设决策树生成目标决策树,该目标决策树的每一节点均进行权重赋值;进而可基于每一节点对应的权重,进行权重计算,确定该目标企业对应的政策匹配结果,有利于提高匹配效率;并且,可根据不同的企业对应的企业信息定制得到该企业对应的政策匹配结果,适应于任何一个企业,每一企业均可对应有自己的目标决策树,有利于提高用户体验。

在一个可能的示例中,在所述获取预设决策树方面,所述获取单元401具体用于:

获取多个政策属性;

根据所述多个政策属性,将所述政策信息集划分为多个数据集,其中,每一政策属性对应一个数据集;

计算每一所述数据集的信息熵,得到多个信息熵;

确定所述多个信息熵中最大信息熵对应的数据集为目标数据集;

确定所述目标数据集对应的政策属性为目标政策属性;

根据所述目标政策属性构建所述预设政策树。

在一个可能的示例中,在所述根据所述目标政策属性构建所述预设政策树方面,所述获取单元401具体用于:

确定所述目标政策属性对应的多个特征值;

根据所述多个特征值,对所述数据集进行划分,得到多个子数据集;

计算所述目标政策属性对每一子数据集进行划分所获得的信息增益,得到多个信息增益;

选取所述多个信息增益中最大信息增益对应的特征值为根节点,选取除所述最大信息增益以外剩余的多个信息增益对应的特征值为内部节点,选取每一子数据集作为所述内部节点对应的叶子节点,生成所述预设决策树。

在一个可能的示例中,在所述根据所述多个企业信息,对所述多个节点进行加权,得到目标决策树方面,所述加权单元402具体用于:

选取所述多个企业信息中任意一个企业信息i;

将所述企业信息i与所述预设决策树中每一节点进行匹配,得到多个第一匹配值;

选取所述多个第一匹配值中最大的第一匹配值对应的节点为目标节点;

根据所述目标节点,确定所述目标节点对应的权重,并将所述权重标注在所述目标节点中,得到所述目标决策树。

在一个可能的示例中,在所述根据所述目标节点,确定所述目标节点对应的权重方面,所述加权单元402具体用于:

确定所述目标节点对应的政策属性,并确定所述政策属性在所述目标节点对应的特征值;

计算所述企业信息i与所述特征值之间的第二匹配值,将所述第二匹配值作为所述目标节点对应的权重。

在一个可能的示例中,在所述根据所述目标决策树中每一节点对应的权重,确定所述目标企业对应的政策匹配结果方面,所述确定单元403具体用于:

确定所述目标决策树中的多个分支;

从所述多个分支中选取多个目标分支,其中,每一所述目标分支中可包括多个目标节点,每一目标节点对应有权重;

对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值;

根据所述多个概率值,确定所述目标企业对应的政策匹配结果。

在一个可能的示例中,在所述对所述多个目标分支进行概率计算,得到每一分支对应的概率值,得到多个概率值方面,所述确定单元403具体用于:

确定所述多个目标分支中任意一个目标分支对应的M个目标节点,其中,M为正整数;

确定每一目标节点对应的第三匹配值,得到M个第三匹配值;

计算所述M个第三匹配值的乘积,得到所述目标分支对应的概率值。

本申请实施例还提供一种计算机可读存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如所述方法实施例中记载的任何一种信息匹配方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如所述方法实施例中记载的任何一种信息匹配方法的部分或全部步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在所述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解所述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 匹配信息确定方法、显示方法、装置、设备及存储介质
  • 地名信息匹配方法、信息匹配方法、装置及计算机设备
技术分类

06120112965703