掌桥专利:专业的专利平台
掌桥专利
首页

地址匹配方法、装置、服务器及计算机可读存储介质

文献发布时间:2024-04-18 19:58:26


地址匹配方法、装置、服务器及计算机可读存储介质

技术领域

本申请涉及地理信息处理技术领域,具体涉及一种地址匹配方法、装置、服务器及计算机可读存储介质。

背景技术

随着城镇化进程加快,当村组居住用地被城市包围,或划入某个社区,被纳入当地城镇管理范畴时,相关社区村组所涉及的地物属性将发生变化。

目前,再对此类变化的社区村组相关地址进行关联匹配时,通常使用的文本比对方式无法满足快速精准匹配的应用需求,同时,随着实际生活中人们对地物的描述方式也日益多样化,导致实际地址匹配准确率低下。

因此,如何提高地址匹配准确率,是当前地理信息处理技术领域亟需解决的技术问题。

发明内容

本申请提供一种地址匹配方法、装置、服务器及计算机可读存储介质,旨在解决如何提高地址匹配准确率的技术问题。

一方面,本申请提供一种地址匹配方法,所述方法包括:

获取用户输入的待匹配的原始地址数据对应的地址块信息集合,所述地址块信息集合包括多个行政区划级别的地址块信息;

在预设的目标检索数据库中查询与所述地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;

若所述第一查询结果为查询失败,则对所述第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;

根据所述第二地址块信息,确定所述原始地址数据对应的匹配地址数据。

在本申请一种可能的实现方式中,所述对所述第一地址块信息进行地址转义处理,包括:

获取第一地址块信息对应文本的数量参数;

若所述数量参数等于预设的第一数量阈值且所述第一地址块信息的地址后缀为预设的第一目标地址后缀,则将所述第一地址块信息的地址后缀转义为预设的第二目标地址后缀;

若所述数量参数等于预设的第二数量阈值且所述第一地址块信息的地址后缀为所述第二目标地址后缀,则将所述第一地址块信息的地址后缀转义为所述第一目标地址后缀;

若所述第一地址块信息的地址后缀与所述第一目标地址后缀和所述第二目标地址后缀均不相同,则将所述第一地址块信息的地址后缀转义为所述第一目标地址后缀,或将所述第一地址块信息的地址后缀转义为所述第二目标地址后缀。

在本申请一种可能的实现方式中,所述在预设的目标检索数据库中查询与所述地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果,包括:

将所述地址块信息集合中的各行政区划级别的地址块信息,分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照预设要求进行初级匹配,得到匹配结果;

若所述匹配结果符合预设要求,则将所述多个行政区划级别的地址块信息集合中的第一地址块信息与所述目标检索数据库中对应行政区划级别的地址块信息进行精准匹配,得到第一查询结果。

在本申请一种可能的实现方式中,所述获取用户输入的待匹配的原始地址数据对应的地址块信息集合,包括:

获取用户输入的待匹配的原始地址数据;

对所述原始地址数据进行规范化处理,得到规范化处理后的地址数据;

对规范化处理后的地址数据进行地址分级处理,得到包括有多个行政区划级别的地址块信息的地址块信息集合。

在本申请一种可能的实现方式中,所述对所述原始地址数据进行规范化处理,得到规范化处理后的地址数据,包括:

若所述原始地址数据中存在非目标语言文字,则对所述原始地址数据进行语言文字转化处理;

对语言文字转化处理后的地址数据中的无效非法字符进行清洗;

对清洗后的地址数据进行去重补全处理,得到规范化处理后的地址数据。

在本申请一种可能的实现方式中,所述根据所述第二地址块信息,确定所述原始地址数据对应的匹配地址数据,包括:

在所述目标检索数据库中查询与所述第二地址块信息相匹配的地址块信息,得到第二查询结果;

若所述第二查询结果为查询成功,则确定所述第二查询结果对应的地址数据为所述原始地址数据对应的匹配地址数据。

在本申请一种可能的实现方式中,在所述目标检索数据库中查询与所述第二地址块信息相匹配的地址块信息,得到第二查询结果之后,所述方法还包括:

若所述第二查询结果为查询失败,则将所述地址块信息集合中位于目标行政区划级别之前的所有匹配成功的地址块信息作为所述原始地址数据对应的匹配地址数据。

另一方面,本申请提供一种地址匹配装置,所述装置包括:

第一获取单元,用于获取用户输入的待匹配的原始地址数据对应的地址块信息集合,所述地址块信息集合包括多个行政区划级别的地址块信息;

第一查询单元,用于在预设的目标检索数据库中查询与所述地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;

第一地址转义处理单元,用于若所述第一查询结果为查询失败,则对所述第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;

第一确定单元,用于根据所述第二地址块信息,确定所述原始地址数据对应的匹配地址数据。

在本申请一种可能的实现方式中,所述第一地址转义处理单元,具体用于:

获取第一地址块信息对应文本的数量参数;

若所述数量参数等于预设的第一数量阈值且所述第一地址块信息的地址后缀为预设的第一目标地址后缀,则将所述第一地址块信息的地址后缀转义为预设的第二目标地址后缀;

若所述数量参数等于预设的第二数量阈值且所述第一地址块信息的地址后缀为所述第二目标地址后缀,则将所述第一地址块信息的地址后缀转义为所述第一目标地址后缀;

若所述第一地址块信息的地址后缀与所述第一目标地址后缀和所述第二目标地址后缀均不相同,则将所述第一地址块信息的地址后缀转义为所述第一目标地址后缀,或将所述第一地址块信息的地址后缀转义为所述第二目标地址后缀。

在本申请一种可能的实现方式中,所述第一查询单元,具体用于:

将所述地址块信息集合中的各行政区划级别的地址块信息,分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照预设要求进行初级匹配,得到匹配结果;

若所述匹配结果符合预设要求,则将所述多个行政区划级别的地址块信息集合中的第一地址块信息与所述目标检索数据库中对应行政区划级别的地址块信息进行精准匹配,得到第一查询结果。

在本申请一种可能的实现方式中,所述第一获取单元,具体包括:

第二获取单元,用于获取用户输入的待匹配的原始地址数据;

第一规范化处理单元,用于对所述原始地址数据进行规范化处理,得到规范化处理后的地址数据;

第一地址分级处理单元,用于对规范化处理后的地址数据进行地址分级处理,得到包括有多个行政区划级别的地址块信息的地址块信息集合。

在本申请一种可能的实现方式中,所述第一规范化处理单元,具体用于:

若所述原始地址数据中存在非目标语言文字,则对所述原始地址数据进行语言文字转化处理;

对语言文字转化处理后的地址数据中的无效非法字符进行清洗;

对清洗后的地址数据进行去重补全处理,得到规范化处理后的地址数据。

在本申请一种可能的实现方式中,所述第一确定单元,具体用于:

在所述目标检索数据库中查询与所述第二地址块信息相匹配的地址块信息,得到第二查询结果;

若所述第二查询结果为查询成功,则确定所述第二查询结果对应的地址数据为所述原始地址数据对应的匹配地址数据。

在本申请一种可能的实现方式中,在所述目标检索数据库中查询与所述第二地址块信息相匹配的地址块信息,得到第二查询结果之后,所述装置还用于:

若所述第二查询结果为查询失败,则将所述地址块信息集合中位于目标行政区划级别之前的所有匹配成功的地址块信息作为所述原始地址数据对应的匹配地址数据。

另一方面,本申请还提供一种服务器,所述服务器包括:

一个或多个处理器;

存储器;以及

一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现所述的地址匹配方法。

另一方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行所述的地址匹配方法中的步骤。

本申请提供的地址匹配方法,包括:获取用户输入的待匹配的原始地址数据对应的地址块信息集合,所述地址块信息集合包括多个行政区划级别的地址块信息;在预设的目标检索数据库中查询与所述地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;若所述第一查询结果为查询失败,则对所述第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;根据所述第二地址块信息,确定所述原始地址数据对应的匹配地址数据。相较于传统方法,在城镇化发展下,一些目标行政区划级别地址块会进行调整,而降低地址匹配率的背景下,创造性地提出对查询失败后的第一地址块信息进行地址转义处理,使得地址转义后的地址块信息可以适应因城镇化发展对第一目标级别的地址块信息相适配,提高了匹配率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的地址匹配系统的场景示意图;

图2是本申请实施例中提供的地址匹配方法的一个实施例流程示意图;

图3是本申请实施例中提供的地址匹配方法的另一个实施例流程示意图;

图4是本申请实施例中提供的地址匹配装置的一个实施例结构示意图;

图5是本申请实施例中提供的服务器的一个实施例结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本申请。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本申请的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合本申请所公开的原理和特征的最广范围相一致。

本申请实施例提供一种地址匹配方法、装置、服务器及计算机可读存储介质,以下分别进行详细说明。

如图1所示,图1是本申请实施例提供的地址匹配系统的场景示意图,该地址匹配系统可以包括多个终端100和服务器200,终端100和服务器200网络连接,服务器200中集成有地址匹配装置,如图1中的服务器,终端100可以访问服务器200。

本申请实施例中,该服务器200可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如本申请实施例中所描述的服务器200,其包括但不限于计算机、网络终端、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。本申请的实施例中,服务器与终端之间可通过任何通信方式实现通信,包括但不限于,基于第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)、长期演进(Long Term Evolution,LTE)、全球互通微波访问(Worldwide Interoperability for Microwave Access,WiMAX)的移动通信,或基于TCP/IP协议族(TCP/IP Protocol Suite,TCP/IP)、用户数据报协议(User Datagram Protocol,UDP)的计算机网络通信等。

可以理解的是,本申请实施例中所使用的终端100可以是既包括接收和发射硬件的设备,既具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种终端可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。具体的终端100具体可以是台式终端或移动终端,终端100具体还可以是手机、平板电脑、笔记本电脑等中的一种。

本领域技术人员可以理解,图1中示出的应用环境,仅仅是与本申请方案的一种应用场景,并不构成对本申请方案应用场景的限定,其他的应用环境还可以包括比图1中所示更多或更少的终端,或者服务器网络连接关系,例如图1中仅示出1个服务器和2个终端。可以理解的,该地址匹配系统还可以包括一个或多个其他服务器,或/且一个或多个与服务器网络连接的终端,具体此处不作限定。

另外,如图1所示,该地址匹配系统还可以包括存储器300,用于存储数据,如存储用户输入的待匹配的原始地址数据和地址匹配数据,例如地址匹配系统运行时的地址匹配数据。

需要说明的是,图1所示的地址匹配系统的场景示意图仅仅是一个示例,本申请实施例描述的地址匹配系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着地址匹配系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。

接下来,介绍本申请实施例提供的地址匹配方法。

本申实施例地址匹配方法的实施例中以地址匹配装置作为执行主体,为了简化与便于描述,后续方法实施例中将省略该执行主体,该地址匹配装置应用于服务器。

请参阅图2至图5,图2为本申请实施例中提供的地址匹配方法的一个实施例流程示意图,该地址匹配方法包括步骤201至步骤204:

201、获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息。

本申请实施例中,地址块信息集合是通过对原始地址数据进行一定预处理后得到对应的包括有对各行政区划级别的地址块信息的集合,其中,多个行政区划级别中各行政区划级别最多对应一个地址块信息,例如

在本申请的一些实施例中,获取用户输入的待匹配的原始地址数据对应的地址块信息集合,具体可以包括:获取用户输入的待匹配的原始地址数据;对原始地址数据进行规范化处理,得到规范化处理后的地址数据;对规范化处理后的地址数据进行地址分级处理,得到包括有多个行政区划级别的地址块信息的地址块信息集合。

本申请实施例中,可以通过用户在终端上输入待匹配的原始地址数据至目标程序,然后由此将待匹配的原始地址数据传输至服务器中的地址匹配装置,以使得地址匹配装置可以获取到待匹配的原始地址数据,其中,原始地址数据可以是通过复制粘贴,或者手动书写的方式输入至目标程序中,该目标程序包括一些寄件程序、地址查询程序,但不局限于此。

本申请实施例中,由于用户输入的待匹配的原始地址数据一般存在一些不规范的情况,如存在错别字、中英文夹杂、带有一些无效非法字符等情况,因此,为了提高后续匹配的准确度,可以先对待匹配的原始地址数据进行规范化处理,具体可以包括:若原始地址数据中存在非目标语言文字,则对原始地址数据进行语言文字转化处理;对语言文字转化处理后的地址数据中的无效非法字符进行清洗;对清洗后的地址数据进行去重补全处理,得到规范化处理后的地址数据。在一个具体实施例中,例如,当待匹配的原始地址数据为“xx省--xx市--xx区--xx街道--xx社区(居委会)”,经规范化处理后为“xx省xx市xx区xx街道xx社区居委会”,因此,使得经过规范化处理后的地址数据符合规范化要求。其中,去重补全指的是将地址数据中存在的重复文字进行剔除,将缺少部分内容进行补充。在一个具体实施例中,例如,当待匹配的原始地址数据为“xx省--xx--xx区--xx街道--xx社区区”,其中在省和区之间只有名称没有行政区划级别限定,以及在社区行政区划级别中存在两个“区”,由此,经去重补全后为“xx省xx市xx区xx街道xx社区”,即补充了市级中缺少的“市”和剔除了社区级中重复文字“区”。

本申请实施例中,具体可以通过预设的地址分级模型对规范化处理后的地址数据进行地址分级处理,从而得到包括有多个行政区划级别的地址块信息的地址块信息集合。其中,预设的地址分级模型可以为既有的18级地址分级模型,该模型可以将地址数据按照预设地址分级逻辑进行分级。具体的,18级地址分级情况如下表1所示:

表1:

202、在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果。

本申请实施例中,第一地址块信息是地址块信息集合中多个行政区划级别中指定的某一个目标行政区划级别对应的地址块信息,该目标行政区划级别包括第六级行政区划级别。

需要说明的是,由于目前随着城镇化发展,一般只是多个行政区划级别中的第六级别对应的目标行政区划会进行调整,因此,本申请主要针对第六级的行政区划级别(第六级行政区划级别为社区、村等)进行说明,但不限于此。

在本申请的一些实施例中,在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果,可以包括:将地址块信息集合中的各行政区划级别的地址块信息,分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照预设要求进行初级匹配,得到匹配结果;若匹配结果符合预设要求,则将多个行政区划级别的地址块信息集合中的第一地址块信息与目标检索数据库中对应行政区划级别的地址块信息进行精准匹配,得到第一查询结果。

本申请实施例中,将地址块信息集合中的各行政区划级别的地址块信息,分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照预设要求进行初级匹配,即将地址块信息集合中的各行政区划级别的地址块信息分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照分词等级由高到低进行初级匹配。其中,初级匹配即是从目标检索数据库寻找地址块信息集合中的各行政区划级别的地址块信息对应的各行政区划级别的地址块信息。需要说明的是,地址块信息集合中包括的地址块信息无需包括完整行政区划级别对应的地址块信息,例如,地址块信息集合中包括的地址块信息可以仅仅为“xx省--xx市--xx区--xx街道--xx社区”其中仅对应有第一级、第二级、第三级、第五级以及第六级行政区划级别。

本申请实施例中,匹配结果符合的预设要求为目标检索数据库中存在与地址块信息集合中的各行政区划级别的地址块信息对应的各行政区划级别的地址块信息。例如,地址块信息集合中各行政区划级别的地址块信息为“(xx省xx市xx区xx街道xx社区居委会)”,若目标检索数据库中存在“(xx省xx市xx区xx街道xx社区居委会)”的地址块信息,则确认匹配结果符合预设要求。

在确认匹配结果符合预设要求后,则将多个行政区划级别的地址块信息集合中的第一地址块信息与目标检索数据库中对应行政区划级别的地址块信息进行精准匹配,其中,地址块信息包括多个地址参数,多个地址参数可以包括:文本信息、行政区划编码信息、标签信息(对其行政区划级别进行打标签)以及与上一级的地址块信息之间的空间范围关系。精准匹配即是将地址块信息之间的多个地址参数进行一一匹配。

具体的,上述精准匹配过程具体可以包括:将第一地址块信息中的文本信息、行政区划编码信息、标签信息(对其行政区划级别进行打标签)以及与上一级的地址块信息之间的空间范围关系,分别与目标检索数据库中对应行政区划级别的地址块信息中的文本信息、行政区划编码信息、标签信息以及与上一级的地址块信息之间的空间范围关系进行精准匹配,得到相应的匹配结果,并将该结果作为第一查询结果。其中,文本信息包括文本字数、文本内容以及文本格式,即要求两者在文本字数上相同、文本内容上相同,且文本格式相同。行政区划编码信息中的行政区划代码是国家对能够统治的行施管辖区域进行分级分层进行管辖用信息化手段编制的对各层级行政区划编制的替代数码。与上一级的地址块信息之间的空间范围关系指的是目标行政区划级别的地址块信息与其上一级地址块之间的空间范围关系应该符合预设要求,具体的可以是包含关系,或者两者指定目标之间的直线距离要小于预设阈值。为了便于理解,进行举例说明,例如,当目标行政区划级别的地址块信息为A区,而其上一级地址块信息为B市,而A区和B市之间并非包含关系,其两者各指定目标位置之间的直线距离为200km,大于预设距离100km则说明匹配不成功,各指定目标位置为对应区或市中相应存在的实际地理位置。

203、若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息。

本申请实施例中,当步骤202中的精准匹配过程中的文本信息、行政区划编码信息、标签信息(对其行政区划级别进行打标签)以及与上一级的地址块信息之间的空间范围关系中存在一项匹配不成功,则确认第一查询结果为查询失败。

在本申请的一些实施例中,对第一地址块信息进行地址转义处理,包括:获取第一地址块信息对应文本的数量参数;若数量参数等于预设的第一数量阈值且第一地址块信息的地址后缀为预设的第一目标地址后缀,则将第一地址块信息的地址后缀转义为预设的第二目标地址后缀;若数量参数等于预设的第二数量阈值且第一地址块信息的地址后缀为第二目标地址后缀,则将第一地址块信息的地址后缀转义为第一目标地址后缀;若第一地址块信息的地址后缀与第一目标地址后缀和第二目标地址后缀均不相同,则将第一地址块信息的地址后缀转义为第一目标地址后缀,或将第一地址块信息的地址后缀转义为第二目标地址后缀。其中,第一地址块信息对应文本的数量参数中的数量参数为第一地址块信息对应文本的文字数量,例如,当第一地址块信息对应的目标行政区划为第六级行政区划级别时,即“xx社区”或“xx村”对应的文字数量为4或3,即该文本的数量参数为4或3,具体可以通过内置在地址匹配装置中的文字数量识别设备进行获取;进一步的,第一地址块信息的地址后缀为第一地址块信息对应的行政区划级别,即xx村中的“村”为其地址后缀。

本申请实施例中,在一个具体实施例中,当第一地址块信息对应的目标行政区划为第六级行政区划级别时,将第一数字阈值设定为“3”、第二数字阈值设定为“4”,同时将预设的第一目标地址后缀设定为“村”、第二目标地址后缀设定为“社区”,若获取第一地址块信息(三德村)对应文本的数量参数(3),则符合上述第一种情况“若数量参数等于预设的第一数量阈值且第一地址块信息的地址后缀为预设的第一目标地址后缀”,则将第一地址块信息(三德村)的地址后缀“村”转义为预设的第二目标地址后缀“社区”,得到转义后的地址块为“三德社区”。

在另一个具体实施例中,将第一数字阈值设定为“3”、第二数字阈值设定为“4”,同时将预设的第一目标地址后缀设定为“村”、第二目标地址后缀设定为“社区”,若获取第一地址块信息(三德社区)对应文本的数量参数(4),则符合上述第二种情况“若数量参数等于预设的第二数量阈值且第一地址块信息的地址后缀为第二目标地址后缀”,则将第一地址块信息(三德社区)的地址后缀“社区”转义为第一目标地址后缀“村”,得到转义后的地址块为“三德村”。

在又一个具体实施例中,将第一数字阈值设定为“3”、第二数字阈值设定为“4”,同时将预设的第一目标地址后缀设定为“村”、第二目标地址后缀设定为“社区”,若获取第一地址块信息(三德社区居委会),则符合上述第三种情况“若第一地址块信息的地址后缀与第一目标地址后缀和第二目标地址后缀均不相同”,则将第一地址块信息(三德社区居委会)的地址后缀转义为第一目标地址后缀“村”,得到转义后的地址块为“三德村”;或将第一地址块信息的地址后缀转义为第二目标地址后缀“社区”,得到转义后的地址块为“三德社区”。

204、根据第二地址块信息,确定原始地址数据对应的匹配地址数据。

在本申请的一些实施例中,根据第二地址块信息,确定原始地址数据对应的匹配地址数据,可以包括:在目标检索数据库中查询与第二地址块信息相匹配的地址块信息,得到第二查询结果;若第二查询结果为查询成功,则确定第二查询结果对应的地址数据为原始地址数据对应的匹配地址数据。

本申请实施例中,在目标检索数据库中查询与第二地址块信息相匹配的地址块信息,得到第二查询结果的查询方式与上述步骤202中的查询方式原理相同,在此不做赘述,具体可参阅上述步骤202中包括的所有实施方式。

本申请实施例提供的地址匹配方法,相较于传统方法,在城镇化发展下,一些目标行政区划级别地址块会进行调整,而降低地址匹配率的背景下,创造性地提出对查询失败后的第一地址块信息进行地址转义处理,使得地址转义后的地址块信息可以适应因城镇化发展对第一目标级别的地址块信息相适配,提高了匹配率。

在本申请的另一个实施例中,如图3所示,该方法还包括:

301、获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息。

302、在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果。

303、若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息。

304、在目标检索数据库中查询与第二地址块信息相匹配的地址块信息,得到第二查询结果。

305、若第二查询结果为查询失败,则将地址块信息集合中位于目标行政区划级别之前的所有匹配成功的地址块信息作为原始地址数据对应的匹配地址数据。

本申请实施例中,步骤301至步骤304中的操作原理与上述公开实施例的操作原理相同或相似,具体请参阅上述实施方式,在此不做赘述。

在步骤305中,当第二查询结果为查询失败,即与上述步骤203中判断查询结果是否失败的原理相同,具体可以参阅上述实施例,在此不做赘述。其中,位于目标行政区划级别之前的所有匹配成功的地址块信息可以理解为在匹配地址为“xx省--xx市--xx区--xx街道--xx社区(居委会)”时,其目标行政区划级别为“xx社区(居委会)”,那么将位于目标行政区划级别之前的所有匹配成功的地址块信息“xx省--xx市--xx区--xx街道”作为原始地址数据对应的匹配地址数据。

本申请实施例公开的技术方案,在确认第二查询结果为查询失败时,将地址块信息集合中位于目标行政区划级别之前的所有匹配成功的地址块信息作为原始地址数据对应的匹配地址数据,确保了在多种情况下,都会返回匹配结果,并且返回的结果为确认正确结果,可以有效提示用户主动查阅输入的原始地址数据中位于匹配地址数据中下一级别行政区划对应的地址块数据是否输入错误,提高了查询的便捷性。

为了更好实施本申请实施例中地址匹配方法,在地址匹配方法基础之上,本申请实施例中还提供一种地址匹配装置,如图4所示,地址匹配装置400包括:

第一获取单元401,用于获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息;

第一查询单元402,用于在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;

第一地址转义处理单元403,用于若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;

第一确定单元404,用于根据第二地址块信息,确定原始地址数据对应的匹配地址数据。

在本申请的一些实施例中,第一地址转义处理单元403,具体用于:

获取第一地址块信息对应文本的数量参数;

若数量参数等于预设的第一数量阈值且第一地址块信息的地址后缀为预设的第一目标地址后缀,则将第一地址块信息的地址后缀转义为预设的第二目标地址后缀;

若数量参数等于预设的第二数量阈值且第一地址块信息的地址后缀为第二目标地址后缀,则将第一地址块信息的地址后缀转义为第一目标地址后缀;

若第一地址块信息的地址后缀与第一目标地址后缀和第二目标地址后缀均不相同,则将第一地址块信息的地址后缀转义为第一目标地址后缀,或将第一地址块信息的地址后缀转义为第二目标地址后缀。

在本申请的一些实施例中,第一查询单元402,具体用于:

将地址块信息集合中的各行政区划级别的地址块信息,分别与预设的目标检索数据库中对应各行政区划级别的地址块信息按照预设要求进行初级匹配,得到匹配结果;

若匹配结果符合预设要求,则将多个行政区划级别的地址块信息集合中的第一地址块信息与目标检索数据库中对应行政区划级别的地址块信息进行精准匹配,得到第一查询结果,第一地址块信息为目标行政区划级别的地址块信息。

在本申请的一些实施例中,第一获取单元401,具体包括:

第二获取单元,用于获取用户输入的待匹配的原始地址数据;

第一规范化处理单元,用于对原始地址数据进行规范化处理,得到规范化处理后的地址数据;

第一地址分级处理单元,用于对规范化处理后的地址数据进行地址分级处理,得到包括有多个行政区划级别的地址块信息的地址块信息集合。

在本申请的一些实施例中,第一规范化处理单元,具体用于:

若原始地址数据中存在非目标语言文字,则对原始地址数据进行语言文字转化处理;

对语言文字转化处理后的地址数据中的无效非法字符进行清洗;

对清洗后的地址数据进行去重补全处理,得到规范化处理后的地址数据。

在本申请的一些实施例中,第一确定单元404,具体用于:

在目标检索数据库中查询与第二地址块信息相匹配的地址块信息,得到第二查询结果;

若第二查询结果为查询成功,则确定第二查询结果对应的地址数据为原始地址数据对应的匹配地址数据。

在本申请的一些实施例中,在目标检索数据库中查询与第二地址块信息相匹配的地址块信息,得到第二查询结果之后,装置还用于:

若第二查询结果为查询失败,则将地址块信息集合中位于目标行政区划级别之前的所有匹配成功的地址块信息作为原始地址数据对应的匹配地址数据。

本申请提供的地址匹配装置400,包括:第一获取单元401,用于获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息;第一查询单元402,用于在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;第一地址转义处理单元403,用于若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;第一确定单元404,用于根据第二地址块信息,确定原始地址数据对应的匹配地址数据。相较于传统方法,在城镇化发展下,一些目标行政区划级别地址块会进行调整,而降低地址匹配率的背景下,创造性地提出对查询失败后的第一地址块信息进行地址转义处理,使得地址转义后的地址块信息可以适应因城镇化发展对第一目标级别的地址块信息相适配,提高了匹配率。

除了上述介绍用于地址匹配方法与装置之外,本申请实施例还提供一种服务器,其集成了本申请实施例所提供的任一种地址匹配装置,服务器包括:

一个或多个处理器;

存储器;以及

一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行上述地址匹配方法实施例中任一实施例中的任一方法的操作。

本申请实施例还提供一种服务器,其集成了本申请实施例所提供的任一种地址匹配装置。参阅图5,图5是本申请实施例提供的服务器一个实施例结构示意图。

如图5所示,其示出了本申请实施例所设计的地址匹配装置的结构示意图,具体来讲:

该地址匹配装置可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储单元502、电源503和输入单元504等部件。本领域技术人员可以理解,图5中示出的地址匹配装置结构并不构成对地址匹配装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器501是该地址匹配装置的控制中心,利用各种接口和线路连接整个地址匹配装置的各个部分,通过运行或执行存储在存储单元502内的软件程序和/或模块,以及调用存储在存储单元502的数据,执行地址匹配装置的各种功能和处理数据,从而对地址匹配装置进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。

存储单元502可用于存储软件程序以及模块,处理器501通过运行存储在存储单元502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储单元502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据地址匹配装置的使用所创建的数据等。此外,存储单元502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储单元502还可以包括存储器控制器,以提供处理器501对存储单元502的访问。

地址匹配装置还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该地址匹配装置还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,地址匹配装置还可以包括显示单元等,在此不再赘述。具体在本申请实施例中,地址匹配装置中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储单元502中,并由处理器501来运行存储在存储单元502中的应用程序,从而实现各种功能,如下:

获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息;在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;根据第二地址块信息,确定原始地址数据对应的匹配地址数据。

本申请提供一种地址匹配方法,相较于传统方法,在城镇化发展下,一些目标行政区划级别地址块会进行调整,而降低地址匹配率的背景下,创造性地提出对查询失败后的第一地址块信息进行地址转义处理,使得地址转义后的地址块信息可以适应因城镇化发展对第一目标级别的地址块信息相适配,提高了匹配率。

为此,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random AccessMemory)、磁盘或光盘等。该计算机可读存储介质中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种地址匹配方法中的步骤。例如,该指令可以执行如下步骤:

获取用户输入的待匹配的原始地址数据对应的地址块信息集合,地址块信息集合包括多个行政区划级别的地址块信息;在预设的目标检索数据库中查询与地址块信息集合中的第一地址块信息相匹配的地址块信息,得到第一查询结果;若第一查询结果为查询失败,则对第一地址块信息进行地址转义处理,得到地址转义处理后的第二地址块信息;根据第二地址块信息,确定原始地址数据对应的匹配地址数据。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

以上对本申请实施例所提供的一种地址匹配方法、装置、服务器及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

相关技术
  • 服务器压力调节方法及装置、计算机装置及计算机可读存储介质
  • 服务器启动方法、装置、服务器及计算机可读存储介质
  • 对话装置、对话方法、服务器装置及计算机可读存储介质
  • 一种重复地址检测方法及装置、计算机可读存储介质
  • 地址定位的方法、装置及计算机可读存储介质
  • 地址匹配方法、装置及计算机可读存储介质
  • IP地址匹配方法、装置、设备和计算机可读存储介质
技术分类

06120116490361