掌桥专利:专业的专利平台
掌桥专利
首页

地图数据处理方法、装置、介质及设备

文献发布时间:2024-04-18 19:58:21


地图数据处理方法、装置、介质及设备

技术领域

本申请涉及地图领域,具体涉及地图数据处理方法、装置、介质及设备。

背景技术

随着互联网技术的发展,基于地理位置的服务(Location Based Services,LBS)逐渐丰富多样,如导航服务、本地生活服务等。相应地,对地图数据的精准性也提出了更高的要求。地图数据在采集、处理、绘制、更新等过程中,均有可能产生数据误差,造成兴趣点(Point of Interest,POI)分布不合理、兴趣点数据不准确的情况,而兴趣点数据的准确程度直接影响地图数据的质量以及基于地理位置的服务的效果。

发明内容

为了提升地图数据的精准性,本申请提供了地图数据处理方法、装置、介质及设备。所述技术方案如下:

第一方面,本申请提供了一种地图数据处理方法,所述方法包括:

获取地图的待检测地图数据,所述待检测地图数据包括兴趣点数据、道路数据和背景数据;

根据所述道路数据对所述地图进行划分,得到至少一个封闭区域;

根据所述兴趣点数据、所述道路数据和所述背景数据,确定所述至少一个封闭区域中每一个封闭区域对应的特征信息,所述特征信息指示对应的封闭区域的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息;

根据所述每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,得到所述每一个封闭区域对应的预测指标值,所述预测指标值表征对应的封闭区域内兴趣点分布的准确性;

根据所述每一个封闭区域对应的预测指标值,对所述待检测地图数据中的所述兴趣点数据进行更新,得到所述地图的目标地图数据。

可选的,所述根据所述道路数据对所述地图进行划分,得到至少一个封闭区域,包括:

获取区域管理层级数据;

根据所述区域管理层级数据对所述地图进行划分,得到至少一个管理区域;

根据所述道路数据对所述至少一个管理区域中每一个管理区域进行划分,得到至少一个封闭区域。

可选的,所述根据所述道路数据对所述至少一个管理区域中每一个管理区域进行划分,得到至少一个封闭区域,包括:

根据所述道路数据,确定所述每一个管理区域对应的路网图,所述路网图为以路口为节点,以路口间的道路为边的图;

对所述每一个管理区域对应的路网图进行深度优先搜索处理,确定所述每一个管理区域对应的路网图中的至少一个回路,所述至少一个回路中每一个回路为所述路网图中起点和终点均为同一目标节点的一条路径,所述目标节点为所述路网图中任一节点;

根据所述每一个管理区域对应的路网图中的至少一个回路,对所述每一个管理区域进行划分,得到所述至少一个封闭区域;所述至少一个封闭区域互不重叠。

可选的,所述根据所述兴趣点数据、所述道路数据和所述背景数据,确定所述至少一个封闭区域中每一个封闭区域对应的特征信息,包括:

根据所述兴趣点数据、所述道路数据和所述背景数据,生成地图元素索引信息;

根据所述地图元素索引信息,确定所述每一个封闭区域对应的区域兴趣点数据、所述每一个封闭区域对应的区域道路数据和所述每一个封闭区域对应的区域背景数据;

根据所述每一个封闭区域对应的区域兴趣点数据、所述每一个封闭区域对应的区域道路数据和所述每一个封闭区域对应的区域背景数据,计算得到所述每一个封闭区域对应的特征信息。

可选的,所述根据所述每一个封闭区域对应的区域兴趣点数据、所述每一个封闭区域对应的区域道路数据和所述每一个封闭区域对应的区域背景数据,计算得到所述每一个封闭区域对应的特征信息,包括:

根据所述每一个封闭区域对应的区域兴趣点数据,计算得到所述每一个封闭区域对应的兴趣点分布特征信息,所述兴趣点分布特征信息包括对应的所述封闭区域内兴趣点的个数和类型;

根据所述每一个封闭区域对应的区域道路数据,计算得到所述每一个封闭区域对应的道路线分布特征信息,所述道路线分布特征信息包括对应的所述封闭区域内道路的名称、等级和车道数量;

根据所述每一个封闭区域对应的区域背景数据,计算得到所述每一个封闭区域对应的背景面分布特征信息,所述背景面分布特征信息包括对应的所述封闭期区域内背景的面积和面积占比;

根据所述每一个封闭区域对应的兴趣点分布特征信息、所述每一个封闭区域对应的道路线分布特征信息和所述每一个封闭区域对应的背景面分布特征信息,确定所述每一个封闭区域对应的特征信息。

可选的,所述根据所述每一个封闭区域对应的预测指标值,对所述待检测地图数据中的所述兴趣点数据进行更新,得到所述地图的目标地图数据,包括:

获取预设指标阈值;

根据所述每一个封闭区域对应的预测指标值和所述预设指标阈值,确定至少一个目标封闭区域;所述至少一个目标封闭区域中每一个目标封闭区域对应的预测指标值低于所述预设指标阈值;

根据所述兴趣点数据,确定所述至少一个目标封闭区域对应的区域兴趣点数据;

将所述至少一个目标封闭区域对应的区域兴趣点数据从所述待检测地图数据中删除,得到所述目标地图数据。

可选的,所述根据所述每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,得到所述每一个封闭区域对应的预测指标值,包括:

将所述每一个封闭区域对应的特征信息输入兴趣点分布预测模型,进行特征表征处理,得到所述每一个封闭区域对应的特征表征数据;

根据所述每一个封闭区域对应的特征表征数据,进行针对兴趣点分布准确性的回归预测处理,得到所述每一个封闭区域对应的预测指标值;所述兴趣点分布预测模型为基于梯度提升决策树算法训练得到的回归模型。

可选的,所述方法还包括:

获取样本地图的样本地图数据,所述样本地图数据包括样本兴趣点数据、样本道路数据和样本背景数据;

根据所述样本道路数据对所述样本地图进行划分,得到至少一个样本封闭区域;

根据所述样本兴趣点数据、所述样本道路数据和所述样本背景数据,确定所述至少一个样本封闭区域中每一个样本封闭区域对应的样本特征信息,所述样本特征信息指示对应的样本封闭区域的样本兴趣点分布特征信息、样本道路线分布特征信息和样本背景面分布特征信息;

获取所述每一个样本封闭区域对应的标签数据,所述标签数据表征对应的样本封闭区域内兴趣点分布的准确性;

基于所述每一个样本封闭区域对应的样本特征信息、所述每一个样本封闭区域对应的标签数据和所述梯度提升决策树算法,对预设的机器学习模型进行训练,得到所述兴趣点分布预测模型。

第二方面,本申请提供了一种地图数据处理装置,所述装置包括:

数据获取模块,用于获取地图的待检测地图数据,所述待检测地图数据包括兴趣点数据、道路数据和背景数据;

区域划分模块,用于根据所述道路数据对所述地图进行划分,得到至少一个封闭区域;

特征确定模块,用于根据所述兴趣点数据、所述道路数据和所述背景数据,确定所述至少一个封闭区域中每一个封闭区域对应的特征信息,所述特征信息指示对应的封闭区域的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息;

预测模块,用于根据所述每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,得到所述每一个封闭区域对应的预测指标值,所述预测指标值表征对应的封闭区域内兴趣点分布的准确性;

数据更新模块,用于根据所述每一个封闭区域对应的预测指标值,对所述待检测地图数据中的所述兴趣点数据进行更新,得到所述地图的目标地图数据。

第三方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如第一方面所述的一种地图数据处理方法。

第四方面,本申请提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如第一方面所述的一种地图数据处理方法。

第五方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令被处理器执行时实现如第一方面所述的一种地图数据处理方法。

本申请提供的地图数据处理方法、装置、介质及设备,具有如下技术效果:

本申请提供的方案利用地图的待检测地图数据中的道路数据,将地图划分为至少一个封闭区域,并根据待检测地图数据中的兴趣点数据、道路数据和背景数据,确定每一个封闭区域对应的特征信息,特征信息可以指示对应的封闭区域对应的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息,也即从点、线、面三个维度描述封闭区域内的分布特征;最后,本申请提供的技术方案根据每一个封闭区域对应的特征信息进行针对兴趣点分布准确性的预测处理,得到每一个封闭区域对应的预测指标值,该预测指标值可以指示对应的封闭区域内兴趣点分布的准确性,进而可以根据每一个封闭区域对应的预测指标值,对兴趣点数据进行更新,删除或调整错误的兴趣点数据,得到地图的目标地图数据,使得地图中兴趣点的分布更加合理、目标地图数据中的兴趣点数据更加准确,最终提升目标地图数据的精准性,以更好地满足基于地理位置的服务的应用需求。

本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。

图1是本申请实施例提供的一种地图数据处理方法的实施环境示意图;

图2是本申请实施例提供的一种地图数据处理方法的流程示意图;

图3是本申请实施例提供的一种管理区域的示意图;

图4是本申请实施例提供的一种划分地图得到封闭区域的流程示意图;

图5是本申请实施例提供的一种封闭区域的示意图;

图6是本申请实施例提供的一种确定特征信息的流程示意图;

图7是本申请实施例提供的一种模型训练的流程示意图;

图8是本申请实施例提供的一种更新地图数据的流程示意图;

图9是本申请实施例提供的一种地图数据处理装置的示意图;

图10是本申请实施例提供的用于实现一种地图数据处理方法的设备的硬件结构示意图。

具体实施方式

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。

本申请实施例提供的方案涉及人工智能的机器学习(Machine Learning,ML)等技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。

本申请实施例提供的方案可部署在云端,其中还涉及云技术等。

云技术(Cloud technology):是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称,可以组成资源池,按需所用,灵活便利。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站,伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,因此云技术需要以云计算作为支撑。云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。作为云计算的基础能力提供商,会建立云计算资源池平台,简称云平台,一般称为基础设施即服务 (Infrastructure as a Service,IaaS),在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(可为虚拟化机器,包含操作系统)、存储设备和网络设备。

为了提升地图数据的精准性,本申请实施例提供了地图数据处理方法、装置、介质及设备。下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于理解本申请实施例所述的技术方案及其产生的技术效果,本申请实施例对于涉及到的相关专业名词进行解释:

兴趣点:Point of Interest,可简称为POI,指一些与人们生活密切相关的地标建筑和地理实体的点,如学校、医院、商场、公园。

深度优先搜索:Depth First Search,英文缩写为DFS,深度优先搜索属于图算法的一种,用于在图或树数据结构中遍历所有节点。其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能被访问一次。

梯度提升决策树:Gradient Boosting Decision Tree,英文缩写为GBDT,GBDT是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。

可以理解的是,在本申请的具体实施方式中,涉及到用户位置信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

请参阅图1,其为本申请实施例提供的一种地图数据处理方法的实施环境示意图,如图1所示,该实施环境可以至少包括客户端01和服务器02。

具体的,所述客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、车载终端、数字助理、智能可穿戴设备及语音交互设备等类型的设备,也可以包括运行于设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,所述客户端01可以用于展示目标地图数据,所述客户端01还可以基于自身的定位信息向所述服务器02请求基于地理位置的服务。

具体的,所述服务器02可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。所述服务器02可以包括有网络通信单元、处理器和存储器等等。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。具体的,所述服务器02可以用于预先对地图的待检测地图数据进行地图数据处理,包括根据待检测地图数据中的道路数据对地图进行划分,得到至少一个封闭区域;根据根据待检测地图数据中的兴趣点数据、道路数据和背景数据,确定至少一个封闭区域中每一个封闭区域对应的特征信息,特征信息可以指示对应的封闭区域的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息;将每一个封闭区域对应的特征信息输入兴趣点分布预测模型,进行兴趣点分布的预测处理,得到每一个封闭区域对应的预测指标值,预测指标值可以表征对应的封闭区域内兴趣点分布的准确性;根据每一个封闭区域对应的预测指标值,对待检测地图数据中的兴趣点数据进行更新,得到地图的目标地图数据。具体的,所述服务器02还可以用于将目标地图数据发送至所述客户端01,并接收所述客户端01发送的基于地理位置的服务请求以及进行相应的请求响应处理。

本申请实施例还可以结合云技术实现,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称。云技术需要以云计算作为支撑。云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。具体地,所述服务器02和数据库位于云端,所述服务器02可以是实体机器,也可以是虚拟化机器。

请参阅图2,其为本申请实施例提供的一种地图数据处理方法的流程图,本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。请参照图2,本申请实施例提供的一种地图数据处理方法可以包括如下步骤:

S210:获取地图的待检测地图数据,待检测地图数据包括兴趣点数据、道路数据和背景数据。

地图数据在采集、处理、绘制、更新等过程中,均有可能产生数据误差,造成兴趣点(Point of Interest,POI)分布不合理、兴趣点数据不准确的情况,而兴趣点数据的准确程度直接影响地图数据的质量以及基于地理位置的服务的效果。故有必要对地图数据进行检测和更新。

在本申请实施例中,待检测地图数据包括兴趣点数据、道路数据和背景数据。其中,兴趣点数据表征地图中各兴趣点的属性,可以包括但不限于兴趣点的类型、兴趣点的名称、兴趣点的地理地址、兴趣点的经纬度坐标等;道路数据表征地图中各条道路的属性,可以包括但不限于道路的类型、道路的级别、道路的起终点坐标、道路的车道数量等;背景数据表征地图中如绿地、楼宇、湖泊等背景区域的属性,可以包括但不限于背景区域的类型、背景区域的投影形状、背景区域的投影面积等。可以理解的是,待检测地图数据可以包括描述地图信息的所有数据,通过待检测地图数据可以绘制出完整的地图。本申请实施例主要利用待检测地图数据中的兴趣点数据、道路数据和背景数据对地图数据中兴趣点的分布情况进行检测。

S220:根据道路数据对地图进行划分,得到至少一个封闭区域。

在本申请实施例中,首先对地图所涉及的地理区域进行划分,得到至少一个封闭区域,可以对至少一个封闭区域进行并行处理,提高数据处理的效率。

在本申请实施例中,至少一个封闭区域之间相互不重叠。

在本申请的一个实施例中,步骤S220可以被实施为:

S310:获取区域管理层级数据。

示例性的,管理层级可以包括省、市、县、乡、镇、村、社区、街道等,区域管理层级数据可以指示地图中各管理层级对应的地理区域。

S320:根据区域管理层级数据对地图进行划分,得到至少一个管理区域。

示例性的,划分的最小管理区域层级为街道,根据区域管理层级数据对地图进行划分,所得到的至少一个管理区域均为街道区域。示例性的,所划分得到的管理区域可以如图3所示,各管理区域为街道区域,分别为左侧虚线圈对应的A街道区域和右侧点-虚线圈对应的B街道区域。

S330:根据道路数据对至少一个管理区域中每一个管理区域进行划分,得到至少一个封闭区域。

可行的,可以根据道路数据中每一个管理区域对应的区域道路数据,将每一个管理区域转换为路网图结构,从而基于路网图结构对每一个管理区域进行进一步地划分,得到至少一个封闭区域,封闭区域可以是管理区域内闭环路径所包围的区域。

考虑到封闭区域内的兴趣点的分布情况与该封闭区域的关联程度较高,而与其他封闭区域的关联程度低,故本申请实施例是以封闭区域为检测对象,利用封闭区域内的地图数据检测封闭区域内兴趣点分布的准确性。

上述实施例中,利用当前的区域管理层级数据进行初步的划分,得到至少一个管理区域,并根据道路数据对每一个管理区域进行再次的划分,能够快速准确地得到互不重叠的至少一个封闭区域,以便以闭区域为检测对象,进行针对兴趣点分布准确性的检测。

在本申请的一个实施例中,如图4所示,步骤S330可以被实施为:

S331:根据道路数据,确定每一个管理区域对应的路网图,路网图为以路口为节点,以路口间的道路为边的图。

首先可以获取道路数据中每一个管理区域对应的道路数据;其次根据每一个管理区域对应的道路数据,将每一个管理区域内的路网中的道路转换成边,边的编号可以使用道路的编号,路网中的路口转换成节点,节点的编号可以使用路口的编号,此外边的两个端点分别对应道路的起点和终点,也可以将边的两个端点转换为节点;最后建立节点之间的连接关系,通过边建立每个节点与其相邻的节点之间建立的双向连接,从而构成图结构的路网图。

S332:对每一个管理区域对应的路网图进行深度优先搜索处理,确定每一个管理区域对应的路网图中的至少一个回路,至少一个回路中每一个回路为路网图中起点和终点均为同一目标节点的一条路径,目标节点为路网图中任一节点。

可行的,从路网图中的任意一个节点开始,遍历每个未被访问过的邻居节点,并递归调用深度优先搜索函数,如果在搜索过程中遇到了已经被访问过的节点,则说明该次搜索过程所访问过的节点以及该节点之间的边构成了一个回路,也即回路为路网图中起点和终点均为同一目标节点的路径,且回路中的边没有重复出现。

S333:根据每一个管理区域对应的路网图中的至少一个回路,对每一个管理区域进行划分,得到至少一个封闭区域;至少一个封闭区域互不重叠。

可行的,可以基于回路所覆盖的区域,对每一个管理区域进行划分,得到至少一个封闭区域,封闭区域可以如图5中的虚线包围的区域所示。

上述实施例中,将地图中的各管理区域抽象为路网图,利用图算法进一步进行区域划分,可以高效准确地得到面积更小的封闭区域,从而以封闭区域为检测对象进行检测的效率更高,准确性也更高。

在本申请的另一个实施例中,还可以直接利用图算法对地图进行划分,得到至少一个封闭区域,此处不作赘述。

S230:根据兴趣点数据、道路数据和背景数据,确定至少一个封闭区域中每一个封闭区域对应的特征信息,特征信息指示对应的封闭区域的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息。

在本申请实施例中,每一个封闭区域对应的特征信息表征对应的封闭区域中与兴趣点分布关联程度较高的属性信息,在确定特征信息时可以从点、线、面三个维度进行提取,故特征信息可以包括三方面特征兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息。

在本申请的一个实施例中,如图6所示,步骤S230可以被实施为:

S410:根据兴趣点数据、道路数据和背景数据,生成地图元素索引信息。

可行的,可以利用多维空间点索引算法,如Geohash或Google S2,对兴趣点数据、道路数据和背景数据进行编码,生成地图元素索引信息。

S420:根据地图元素索引信息,确定每一个封闭区域对应的区域兴趣点数据、每一个封闭区域对应的区域道路数据和每一个封闭区域对应的区域背景数据。

也即是根据地图元素索引信息,召回每一个封闭区域内的地图元素对应的数据。需要说明的是,每一个封闭区域对应的区域兴趣点数据、每一个封闭区域对应的区域道路数据和每一个封闭区域对应的区域背景数据均是利用多维空间点索引算法编码后的数据。

S430:根据每一个封闭区域对应的区域兴趣点数据、每一个封闭区域对应的区域道路数据和每一个封闭区域对应的区域背景数据,计算得到每一个封闭区域对应的特征信息。

上述实施例中,根据兴趣点数据、道路数据和背景数据生成地图元素索引信息,从而可以快速地召回每一个封闭区域对应的数据,进而快速确定每一个封闭区域对应的特征信息。

在本申请的一个实施例中,步骤S430可以被实施为:

S431:根据每一个封闭区域对应的区域兴趣点数据,计算得到每一个封闭区域对应的兴趣点分布特征信息,兴趣点分布特征信息包括对应的封闭区域内兴趣点的个数和类型。

S432:根据每一个封闭区域对应的区域道路数据,计算得到每一个封闭区域对应的道路线分布特征信息,道路线分布特征信息包括对应的封闭区域内道路的名称、等级和车道数量。

S433:根据每一个封闭区域对应的区域背景数据,计算得到每一个封闭区域对应的背景面分布特征信息,背景面分布特征信息包括对应的封闭期区域内背景的面积和面积占比。

S434:根据每一个封闭区域对应的兴趣点分布特征信息、每一个封闭区域对应的道路线分布特征信息和每一个封闭区域对应的背景面分布特征信息,确定每一个封闭区域对应的特征信息。

上述实施例中,兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息中所具体包括的信息类型可以视服务需求、实践经验等具体设定,本申请实施例仅作示例。通过确定与兴趣点分布情况关联程度较高的特征信息,可以提升后续检测的准确性。

S240:根据每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,得到每一个封闭区域对应的预测指标值,预测指标值表征对应的封闭区域内兴趣点分布的准确性。

在本申请实施例中,基于每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,若所得到的预测指标值指示封闭区域区域内兴趣点的分布不合理、不准确,则可以认为该封闭区域内的兴趣点数据为错误数据,若预测指标值指示封闭区域区域内兴趣点的分布合理、准确,则可以认为该封闭区域内的兴趣点数据为准确数据。

相关技术中需要计算兴趣点的坐标与道路线、水系面、绿地面和楼块面等各地图元素的距离,然后通过比较距离与预设距离阈值之间的大小判断该兴趣点的分布是否合理准确,该方式本质还是以规则为主,需要依靠领域内专家的经验来设定距离阈值,为了保证最终判断的准确新还需要不断优化距离阈值的设定规则,但由于地理差异,这种检测兴趣点分布是否合理的方式的准确率是有限的,且需要消耗大量的人力和时间。

在本申请的一个实施例中,利用基于机器学习的模型进行针对兴趣点分布准确性的预测处理,具体地,可以包括:

S241:将每一个封闭区域对应的特征信息输入兴趣点分布预测模型,进行特征表征处理,得到每一个封闭区域对应的特征表征数据。

兴趣点分布预测模型可以为基于梯度提升决策树算法训练得到的回归模型,兴趣点分布检测模型被训练为可以用于检测每一个封闭区域内兴趣点分布是否合理准确。

在兴趣点分布预测模型的处理过程中,首选需要将每一个封闭区域对应的特征信息映射至模型所在的特征空间中,也即需要对每一个封闭区域对应的特征信息进行特征表征处理,包括但不限于特征预处理、特征提取或特征嵌入表示等,从而得到每一个封闭区域对应的特征表征数据。

S242:根据每一个封闭区域对应的特征表征数据,进行针对兴趣点分布准确性的回归预测处理,得到每一个封闭区域对应的预测指标值。

兴趣点分布预测模型所执行的针对兴趣点分布准确性的回归预测处理是对每一个封闭区域对应的特征表征数据(自变量)与兴趣点分布准确性(因变量)之间的因果关系进行分析和预测,所得到的预测指标值可以为0与1之间的概率值。

可行地,在兴趣点分布预测模型为基于梯度提升决策树算法训练得到的回归模型的情况下,兴趣点分布预测模型包括多个决策树,每个决策树对应一种特征表征数据与兴趣点分布准确性的因果关系,该因果关系可以指示在该特征表征数据的情况下兴趣点的分布为准确类型的概率值;兴趣点分布预测模型根据每一个封闭区域对应的特征表征数据进行特征拟合,确定每一个封闭区域对应的特征表征数据与各决策树对应的特征表征数据之间的拟合程度,或称相似程度;进而根据每一个封闭区域对应的特征表征数据与各决策树对应的特征表征数据之间的拟合程度,以及各决策树对应的权重,进行加权求和计算,最终得到每一个封闭区域对应的预测指标值,预测指标值可以指示对应的封闭区域内兴趣点分布的准确性。

上述实施例中,利用基于机器学习的回归模型进行针对兴趣点分布准确性的预测处理,避免了判断规则和距离阈值的设定,提升了处理效率,也能够有效提高检测准确率。

在本申请的一个实施例中,兴趣点分布预测模型除了可以为基于梯度提升决策树算法训练得到的回归模型,兴趣点分布预测模型还可以为基于机器学习中的随机森林、神经网络等算法训练得到的回归模型。

在本申请的一个实施例中,还可以基于聚类思想,对每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,从而得到每一个封闭区域对应的预测指标值。具体地,获取多个兴趣点分布准确的历史特征信息聚类和多个兴趣点分布不准确的历史特征信息聚类,将每一个封闭区域对应的特征信息与各历史特征信息聚类的类中心的相似程度作为每一个封闭区域对应的特征信息被归至各历史特征信息聚类的概率,进而根据每一个封闭区域对应的特征信息被归至各历史特征信息聚类的概率,确定每一个封闭区域内兴趣点分布为准确的概率或每一个封闭区域内兴趣点分布为不准确的概率。

在本申请的一个实施例中,还提供了兴趣点分布预测模型的训练过程,如图7所示,可以包括以下步骤:

S510:获取样本地图的样本地图数据,样本地图数据包括样本兴趣点数据、样本道路数据和样本背景数据。

S520:根据样本道路数据对样本地图进行划分,得到至少一个样本封闭区域。

S530:根据样本兴趣点数据、样本道路数据和样本背景数据,确定至少一个样本封闭区域中每一个样本封闭区域对应的样本特征信息,样本特征信息指示对应的样本封闭区域的样本兴趣点分布特征信息、样本道路线分布特征信息和样本背景面分布特征信息。

步骤S510至步骤S530可以参考前述实施例中的步骤S210至步骤S230,此处不作赘述。

S540:获取每一个样本封闭区域对应的标签数据,标签数据表征对应的样本封闭区域内兴趣点分布的准确性。

标签数据可以由人工标注得到,标签数据可以表征对应的样本封闭区域整体是否分布合理准确。在对应的样本封闭区域整体分布合理准确的情况下,也可以认为对应的样本封闭区域内兴趣点分布也是合理准确的;在对应的样本封闭区域整体分布不合理不准确的情况下,也可以认为对应的样本封闭区域内兴趣点分布也是不合理不准确的。

S550:基于每一个样本封闭区域对应的样本特征信息、每一个样本封闭区域对应的标签数据和梯度提升决策树算法,对预设的机器学习模型进行训练,得到兴趣点分布预测模型。

具体地 ,将每一个样本封闭区域对应的样本特征信息输入预设的机器学习模型,进行针对兴趣点分布准确性的预测处理,得到每一个样本封闭区域对应的样本预测指标值;根据每一个样本封闭区域对应的样本预测指标值和每一个样本封闭区域对应的标签数据计算得到损失值,进而基于梯度提升决策树算法,利用损失值对机器学习模型进行迭代训练,直至机器学习模型满足预设的收敛条件。此外还可以结合学习率、树数量等指标对机器学习模型进行优化。

上述实施例中,利用标签数据对模型进行有监督的训练,可以提升模型的预测准确性。

S250:根据每一个封闭区域对应的预测指标值,对待检测地图数据中的兴趣点数据进行更新,得到地图的目标地图数据。

在本申请实施例中,若预测指标值指示封闭区域区域内兴趣点的分布不合理、不准确,则可以认为该封闭区域内的兴趣点数据为错误数据,需要进行删除或修改,若预测指标值指示封闭区域区域内兴趣点的分布合理、准确,则可以认为该封闭区域内的兴趣点数据为准确数据,则无需更新。

本申请实施例可以对存量地图数据进行离线挖掘,找出其中的错误数据并清理,也可以对增量地图数据进行在线检测,识别错误数据并拒绝其错误数据的入库,从而保证地图数据的精准性。

在本申请的一个实施例中,如图8所示,步骤S250可以被实施为:

S610:获取预设指标阈值。

预设指标阈值是预先设定的用于判断分布是否合理准确的临界指标值,如可以设为0.5或0.75。

S620:根据每一个封闭区域对应的预测指标值和预设指标阈值,确定至少一个目标封闭区域,至少一个目标封闭区域中每一个目标封闭区域对应的预测指标值低于预设指标阈值。

每一个封闭区域对应的预测指标值越高,表示对应的封闭区域内兴趣点分布的合理性准确性越高,反之则反。故将每一个封闭区域对应的预测指标值和预设指标阈值进行比较,筛选出至少一个目标封闭区域,各目标封闭区域对应的预测指标值可以不高于或低于预设指标阈值,以及目标区域内兴趣点的分布是不合理、不准确的。

S630:根据兴趣点数据,确定至少一个目标封闭区域对应的区域兴趣点数据。

S640:将至少一个目标封闭区域对应的区域兴趣点数据从待检测地图数据中删除,得到目标地图数据。

上述实施例中,通过将预测指标值与预设指标阈值进行比较,筛选出预测指标值低于预设指标阈值,也即是兴趣点分布存在不合理情况的目标区域,从而通过删除目标区域对应的区域兴趣点数据,可以提升所得到的目标地图的精准性。

由上述实施例可知,本申请提供的一种地图数据处理方法利用地图的待检测地图数据中的道路数据,将地图划分为至少一个封闭区域,并根据待检测地图数据中的兴趣点数据、道路数据和背景数据,确定每一个封闭区域对应的特征信息,特征信息可以指示对应的封闭区域对应的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息,也即从点、线、面三个维度描述封闭区域内的分布特征;最后,本申请提供的技术方案根据每一个封闭区域对应的特征信息进行针对兴趣点分布准确性的预测处理,得到每一个封闭区域对应的预测指标值,该预测指标值可以指示对应的封闭区域内兴趣点分布的准确性,进而可以根据每一个封闭区域对应的预测指标值,对兴趣点数据进行更新,删除或调整错误的兴趣点数据,得到地图的目标地图数据,使得地图中兴趣点的分布更加合理、目标地图数据中的兴趣点数据更加准确,最终提升目标地图数据的精准性,以更好地满足基于地理位置的服务的应用需求。

本申请实施例还提供了一种地图数据处理装置900,如图9所示,所述装置900可以包括:

数据获取模块910,用于获取地图的待检测地图数据,所述待检测地图数据包括兴趣点数据、道路数据和背景数据;

区域划分模块920,用于根据所述道路数据对所述地图进行划分,得到至少一个封闭区域;

特征确定模块930,用于根据所述兴趣点数据、所述道路数据和所述背景数据,确定所述至少一个封闭区域中每一个封闭区域对应的特征信息,所述特征信息指示对应的封闭区域的兴趣点分布特征信息、道路线分布特征信息和背景面分布特征信息;

预测模块940,用于根据所述每一个封闭区域对应的特征信息,进行针对兴趣点分布准确性的预测处理,得到所述每一个封闭区域对应的预测指标值,所述预测指标值表征对应的封闭区域内兴趣点分布的准确性;

数据更新模块950,用于根据所述每一个封闭区域对应的预测指标值,对所述待检测地图数据中的所述兴趣点数据进行更新,得到所述地图的目标地图数据。

在本申请的一个实施例中,所述区域划分模块920可以包括:

第一数据获取单元,用于获取区域管理层级数据;

第一划分单元,用于根据所述区域管理层级数据对所述地图进行划分,得到至少一个管理区域;

第二划分单元,用于根据所述道路数据对所述至少一个管理区域中每一个管理区域进行划分,得到至少一个封闭区域。

在本申请的一个实施例中,所述第二划分单元可以包括:

路网图确定子单元,用于根据所述道路数据,确定所述每一个管理区域对应的路网图,所述路网图为以路口为节点,以路口间的道路为边的图;

深度优先搜索子单元,用于对所述每一个管理区域对应的路网图进行深度优先搜索处理,确定所述每一个管理区域对应的路网图中的至少一个回路,所述至少一个回路中每一个回路为所述路网图中起点和终点均为同一目标节点的一条路径,所述目标节点为所述路网图中任一节点;

划分子单元,用于根据所述每一个管理区域对应的路网图中的至少一个回路,对所述每一个管理区域进行划分,得到所述至少一个封闭区域;所述至少一个封闭区域互不重叠。

在本申请的一个实施例中,所述特征确定模块930可以包括:

索引信息生成单元,用于根据所述兴趣点数据、所述道路数据和所述背景数据,生成地图元素索引信息;

区域数据确定单元,用于根据所述地图元素索引信息,确定所述每一个封闭区域对应的区域兴趣点数据、所述每一个封闭区域对应的区域道路数据和所述每一个封闭区域对应的区域背景数据;

特征信息确定单元,用于根据所述每一个封闭区域对应的区域兴趣点数据、所述每一个封闭区域对应的区域道路数据和所述每一个封闭区域对应的区域背景数据,计算得到所述每一个封闭区域对应的特征信息。

在本申请的一个实施例中,所述特征信息确定单元可以包括:

第一特征信息确定子单元,用于根据所述每一个封闭区域对应的区域兴趣点数据,计算得到所述每一个封闭区域对应的兴趣点分布特征信息,所述兴趣点分布特征信息包括对应的所述封闭区域内兴趣点的个数和类型;

第二特征信息确定子单元,用于根据所述每一个封闭区域对应的区域道路数据,计算得到所述每一个封闭区域对应的道路线分布特征信息,所述道路线分布特征信息包括对应的所述封闭区域内道路的名称、等级和车道数量;

第三特征信息确定子单元,用于根据所述每一个封闭区域对应的区域背景数据,计算得到所述每一个封闭区域对应的背景面分布特征信息,所述背景面分布特征信息包括对应的所述封闭期区域内背景的面积和面积占比;

特征信息确定子单元,用于根据所述每一个封闭区域对应的兴趣点分布特征信息、所述每一个封闭区域对应的道路线分布特征信息和所述每一个封闭区域对应的背景面分布特征信息,确定所述每一个封闭区域对应的特征信息。

在本申请的一个实施例中,所述数据更新模块950可以包括:

第二数据获取单元,用于获取预设指标阈值;

区域筛选单元,用于根据所述每一个封闭区域对应的预测指标值和所述预设指标阈值,确定至少一个目标封闭区域;所述至少一个目标封闭区域中每一个目标封闭区域对应的预测指标值低于所述预设指标阈值;

目标封闭区域数据确定单元,用于根据所述兴趣点数据,确定所述至少一个目标封闭区域对应的区域兴趣点数据;

数据更新单元,用于将所述至少一个目标封闭区域对应的区域兴趣点数据从所述待检测地图数据中删除,得到所述目标地图数据。

在本申请的一个实施例中,所述预测模块940可以包括:

特征表征单元,用于将所述每一个封闭区域对应的特征信息输入兴趣点分布预测模型,进行特征表征处理,得到所述每一个封闭区域对应的特征表征数据;

回归预测单元,用于根据所述每一个封闭区域对应的特征表征数据,进行针对兴趣点分布准确性的回归预测处理,得到所述每一个封闭区域对应的预测指标值;所述兴趣点分布预测模型为基于梯度提升决策树算法训练得到的回归模型。

在本申请的一个实施例中,所述装置900还可以包括:

样本数据获取单元,用于获取样本地图的样本地图数据,所述样本地图数据包括样本兴趣点数据、样本道路数据和样本背景数据;

样本封闭区域划分单元,用于根据所述样本道路数据对所述样本地图进行划分,得到至少一个样本封闭区域;

样本特征确定单元,用于根据所述样本兴趣点数据、所述样本道路数据和所述样本背景数据,确定所述至少一个样本封闭区域中每一个样本封闭区域对应的样本特征信息,所述样本特征信息指示对应的样本封闭区域的样本兴趣点分布特征信息、样本道路线分布特征信息和样本背景面分布特征信息;

标签数据获取单元,用于获取所述每一个样本封闭区域对应的标签数据,所述标签数据表征对应的样本封闭区域内兴趣点分布的准确性;

模型训练单元,用于基于所述每一个样本封闭区域对应的样本特征信息、所述每一个样本封闭区域对应的标签数据和所述梯度提升决策树算法,对预设的机器学习模型进行训练,得到所述兴趣点分布预测模型。

需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本申请实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的一种地图数据处理方法。

图10示出了一种用于实现本申请实施例所提供的一种地图数据处理方法的设备的硬件结构示意图,所述设备可以参与构成或包含本申请实施例所提供的装置或系统。如图10所示,设备10可以包括一个或多个(图中采用1002a、1002b,……,1002n来示出)处理器1002(处理器1002可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1004、以及用于通信功能的传输装置1006。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图10所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,设备10还可包括比图10中所示更多或者更少的组件,或者具有与图10所示不同的配置。

应当注意到的是上述一个或多个处理器1002和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器1004可用于存储应用软件的软件程序以及模块,如本申请实施例中所述的方法对应的程序指令/数据存储装置,处理器1002通过运行存储在存储器1004内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种地图数据处理方法。存储器1004可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1004可进一步包括相对于处理器1002远程设置的存储器,这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1006可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质可设置于服务器之中以保存用于实现方法实施例中一种地图数据处理方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的一种地图数据处理方法。

可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施方式中提供的一种地图数据处理方法。

需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 逻辑地图的数据处理方法、装置、电子设备及存储介质
  • 一种地图数据的处理方法、装置、设备和介质
  • 三维地图处理方法、装置、介质和计算设备
  • 数据仓库内数据处理方法、装置、计算机设备和存储介质
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 地图数据处理方法、地图数据处理装置、存储介质和交通工具上的地图数据处理装置
  • 地图数据生成装置、车载设备、地图数据生成系统、地图数据生成程序、地图数据利用程序以及存储介质
技术分类

06120116481532