掌桥专利:专业的专利平台
掌桥专利
首页

语义化方法、装置、电子设备及可读存储介质

文献发布时间:2023-06-19 13:49:36


语义化方法、装置、电子设备及可读存储介质

技术领域

本公开涉及地理信息系统技术领域,尤其涉及坐标、区域语义化技术领域。

背景技术

在时空大数据场景,坐标语义化是增强坐标语义,丰富坐标信息的重要手段。通过赋予坐标语义化的信息,能更好理解特定地点的空间特征,广泛应用在POI推荐、打车、外卖等时空类应用中。

发明内容

本公开提供了一种语义化方法、装置、电子设备及可读存储介质。

根据本公开的第一方面,提供了一种语义化方法,包括:

确定待语义化位置的目标坐标;

通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;

基于所述目标区域的语义信息确定所述待语义化位置的语义信息。

根据本公开的第二方面,提供了一种语义化装置,包括:

第一确定模块,用于确定待语义化位置的目标坐标;

第二确定模块,用于通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;

第三确定模块,用于基于所述目标区域的语义信息确定所述待语义化位置的语义信息。

根据本公开的第三方面,提供了一种电子设备,该电子设备包括:

至少一个处理器;以及

与上述至少一个处理器通信连接的存储器;其中,

存储器存储有可被上述至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行上述方法。

根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使计算机执行上述方法。

根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述方法。

本公开提供的技术方案带来的有益效果是:

本公开实施例提供的方案,与现有技术需要人工确定坐标对应的语义化信息相比。本公开通过确定待语义化位置的目标坐标;通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;基于所述目标区域的语义信息确定所述待语义化位置的语义信息。即将目标坐标归属的目标区域的语义信息作为目标坐标的语义信息,实现了目标坐标的语义信息的自动化确定;此外,基于预构建的区域空间索引树确定目标区域,时间复杂度低、计算效率高。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开提供的语义化方法流程示意图;

图2是根据本公开提供的空间索引树结构示例图;

图3是根据本公开提供的空间索引树结构示例图;

图4是根据本公开提供的区域视觉中心点示例图;

图5是根据本公开提供的语义化装置的结构示意图;

图6是用来实现本公开实施例的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

实施例一

图1示出了本公开实施例提供的一种语义化方法,如图1所示,包括:

步骤S101,确定待语义化位置的目标坐标;

具体地,待语义化位置可以是一个具体的位置点,也可以是一个区域。目标坐标可以作为该位置点或区域的代表。其中,语义化,也可以理解为起名称,如区域A的语义信息为xx区xx街道。

步骤S102,通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;

具体地,该区域空间索引树可以是R树空间索引,也可以是其他能够实现本申请功能的区域空间索引树,如B树、R+树、R*树、QR树、X树;其中,R树很好的解决了在高维空间搜索等问题。

示例性地,以R树为例,查找20英里以内所有的餐厅,如果没有R树,一般情况下,会把餐厅的坐标(x,y)分为两个字段存放在数据库中,一个字段记录经度,另一个字段记录纬度。这样的话我们就需要遍历所有的餐厅获取其位置信息,然后计算是否满足要求,如果一个地区有100家餐厅的话,需要进行100次位置计算操作了。R树很好的解决了这种高维空间搜索问题,它把B树的思想很好的扩展到了多维空间,采用了B树分割空间的思想,并在添加、删除操作时采用合并、分解结点的方法,保证树的平衡性,因此,R树就是一棵用来存储高维数据的平衡树。示例性地,图2、3示出了R树的一个示例。R树运用了空间分割的理念,R树采用了一种称为MBR(Minimal Bounding Rectangle)的方法,即“最小边界矩形”,从叶子结点开始用矩形(rectangle)将空间框起来,结点越往上,框住的空间就越大,以此对空间进行分割。根据R树的这种数据结构,当需要进行一个高维空间查询时,只需要遍历少数几个叶子结点所包含的指针,查看这些指针指向的数据是否满足要求即可,这种方式使我们不必遍历所有数据即可获得答案,效率显著提高。

步骤S103,基于所述目标区域的语义信息确定所述待语义化位置的语义信息。

具体地,将目标区域的语义信息作为待语义化位置的语义信息。

本公开实施例提供的方案,与现有技术需要人工确定坐标对应的语义化信息相比。本公开通过确定待语义化位置的目标坐标;通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;基于所述目标区域的语义信息确定所述待语义化位置的语义信息。即将目标坐标归属的目标区域的语义信息作为目标坐标的语义信息,实现了目标坐标的语义信息的自动化确定;此外,基于预构建的区域空间索引树确定目标区域,时间复杂度低、计算效率高。

本申请实施例提供了一种可能的实现方式,其中,基于确定的待语义化位置的语义信息进行信息推荐。

具体地,待语义位置的语义信息即目标区域的语义信息,如目标区域的语义信息为xx街道,可以将xx街道作为待语义位置的语义信息;基于目标区域的语义信息,可以确定目标区域的一些基础数据,然后基于该些基础数据构建目标区域的区域画像,并进行推荐应用,如推荐视频、新闻等;也可以根据目标区域的语义信息直接确定目标区域的区域画像信息,然后进行推荐应用。

对于本申请实施例,解决了如何针对待语义位置进行信息推荐的问题。

本申请实施例提供了一种可能的实现方式,其中,所述待语义化位置为一区域,确定待语义化位置的坐标,包括:

确定所述待语义化位置的视觉中心点;

将所述待语义化位置的视觉中心点的坐标作为待语义化位置的目标坐标。

具体地,如果待语义化位置为以区域,可以先确定所述待语义化位置的视觉中心点,然后将待语义化位置的视觉中心点的坐标作为待语义化位置的目标坐标。其中,如果待语义位置为以位置点,可以直接将该位置点的坐标作为目标坐标。其中,所述视觉中心点表示视觉上位于多边形区域中最大内包规则区域的中心点。其中,内包规则区域可以是内包圆、内包矩形、内包三角形等。其中,以视觉中心点代表目标区域,能够解决物理中心点不在多边形区域的内部,不能代表多边形的问题。

其中,示例性地,图4中的centroid对应的点并非视觉中心点,而是物理中心点,what we need对应的点为视觉中心点。本公开利用区域的视觉中心点,而非利用区域的物理中心点,避免出现物理中心点并不属于待语义位置,不能代表目标区域的问题。

对于本申请实施例,解决了待语义位置的目标坐标的确定问题。

本申请实施例提供了一种可能的实现方式,其中,待语义化位置的视觉中心点的确定,包括:

获取表征所述待语义化位置的闭合多边形;

在所述闭合多边形中选取最大可用内包矩形或内包圆;

确定所述最大可用内包矩形或内包圆的几何中心点;

将所述几何中心点确定为所述待语义化位置的视觉中心点。

具体地,确定表征待语义化区域(即待语义化位置)的闭合多边形,具体地,可以通过多个多边形的顶点表征待语义化区域;通过相应的算法确定从所述闭合多边形中选取最大可用内包矩形或内包圆,将最大可用内包矩形或内包圆的几何中心点(如矩形对角线交点或圆心)确定为所述待语义化区域的视觉中心点。

对于本申请示例,解决了目标区域的视觉中心的确定问题。

本申请实施例提供了一种可能的实现方式,其中,预构建的区域空间索引树的构建,包括:

确定至少两级区域的表征各个候选区域的区域坐标信息;

基于确定的各个候选区域的区域坐标信息,确定各个候选区域的MBR;

基于各个候选区域的MBR构建区域空间索引树。

示例性地,可以确定6级区域(如省、市、县、乡、村、街道)的表征各个候选区域的区域坐标信息,其中,该6级区域中对应的候选区域的语义信息是确定好的。给定区域多边形P=POLYGON((x

首先获取区域的MBR,get_mbr_of_region(P):

x

x

y

y

从而MBR为:P

然后,将将各级别区域的MBR,放入Rtree构建空间索引树,从而得到构建的区域空间索引树。

对于本申请实施例,解决了空间索引树的构建问题。

本申请实施例提供了一种可能的实现方式,其中,所述基于各个候选区域的最小边界矩形构建区域空间索引树,包括:

从当前候选区域中确定出至少一个当前最高级别的候选区域;

判断所述当前最高级别的候选区域是否为预定的最高级别的候选区域;

如果当前最高级别的候选区域为预定的最高级别的候选区域,则将所述当前最高级别的候选区域对应的最小边界矩形作为父节点。

进一步,该方法还包括:从当前候选区域中确定出至少一个当前最高级别的候选区域,并将各所述当前最高级别的候选区域对应的最小边界矩形添加作为对应的各当前最高级别的候选区域归属的上一级候选区域对应的最小边界矩形的子节点;

重复执行上述步骤,直至所有候选区域添加完成。

示例性地,候选区域包括3级(如省、市、县),其中,省级的候选区域分别为A、B(其中,省级候选区域A、B为预定的最高级别的候选区域),省级候选区域A包括市级候选区域a、b,省级候选区域B包括市级候选区域c、d,市级候选区域a包括县级候选区域1、2,市级候选区域b包括县级候选区域3、4。

空间索引树的构建过程可以是:第一,从所有的候选区域中确定出的当前最高级别的候选区域为候选区域A、B,由于候选区域A、B为预定的最高级别的候选区域,则将候选区域A、B对应的最小边界矩形分别作为父节点;

第二、从剩余的候选区域中,确定出的当前最高级别的候选区域为候选区域a、b、c、d,且候选区域a、b归属的上一级候选区域为候选区域A、候选区域c、d归属的上一级候选区域为候选区域B,将候选区域a、b对应的最小边界矩形作为候选区域A对应的最小边界矩形的子节点,以及将候选区域c、d对应的最小边界矩形作为候选区域B对应的最小边界矩形的子节点;

重复执行第二步骤,从剩余的候选区域中,确定出的当前最高级别的候选区域为候选区域1、2、3、4,且候选区域1、2归属的上一级候选区域为候选区域a、候选区域3、4归属的上一级候选区域为候选区域b,将候选区域1、2对应的最小边界矩形作为候选区域a对应的最小边界矩形的子节点,以及将候选区域3、4对应的最小边界矩形作为候选区域b对应的最小边界矩形的子节点;继续重复执行步骤2,当没有候选区域时,则空间索引树构建完成。

对于本申请实施例,解决了空间索引树的构建问题。

本申请实施例提供了一种可能的实现方式,其中,通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域,包括:

判断所述待语义化位置的目标坐标是否属于所述预构建的区域空间索引树的节点对应的候选区域;

如果属于所述候选区域,则进一步判断所述候选区域对应的节点是否包含子节点;

如果不包含子节点,则将所述候选区域作为所述目标区域。

示例性地,目标位置与空间索引树进行匹配时,判断目标坐标是否在构建的空间索引树的节点的区域范围内,如果节点在一级节点A的范围内,则进一步判断是否在A的子节点的区域范围内,如果在A的子节点b的范围,则进一步判断是否在b的子节点范围内,如果在b的子节点c的范围内,且c无子节点,则结束,

其中节点c对应的候选区域即确定的与目标位置匹配的目标区域,将c对应的候选区域的语义信息作为给定点的语义信息。

此外,还可以将A、b对应的候选区域的的语义信息也作为给目标坐标的的语义信息

对于本申请实施,解决了目标位置归属的目标区域的确定问题。

实施例二

本公开实施例提供了一种语义化装置,如图5所示,包括:

第一确定模块501,用于确定待语义化位置的目标坐标;

第二确定模块502,用于通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;

第三确定模块503,用于基于所述目标区域的语义信息确定所述待语义化位置的语义信息。

本申请实施例提供了一种可能的实现方式,其中,该装置还包括:

推荐模块,用于基于确定的待语义化位置的语义信息进行信息推荐。

本申请实施例提供了一种可能的实现方式,其中,所述待语义化位置为一区域,该装置还包括:

第四确定模块,用于确定所述待语义化位置的视觉中心点;

作为模块,用于将所述待语义化位置的视觉中心点的坐标作为待语义化位置的目标坐标。

本申请实施例提供了一种可能的实现方式,其中,第四确定模块包括:

获取单元,用于获取表征所述待语义化位置的闭合多边形;

选取单元,用于在所述闭合多边形中选取最大可用内包矩形或内包圆;

第一确定单元,用于确定所述最大可用内包矩形或内包圆的几何中心点;

第二确定单元,用于将所述几何中心点确定为所述待语义化位置的视觉中心点。

本申请实施例提供了一种可能的实现方式,其中,该装置还包括:

第五确定模块,用于确定至少两级区域的表征各个候选区域的区域坐标信息;

第六确定模块,用于基于确定的各个候选区域的区域坐标信息,确定各个候选区域的最小边界矩形;

构建模块,用于基于各个候选区域的最小边界矩形构建区域空间索引树。

本申请实施例提供了一种可能的实现方式,其中,所述构建模块,用于从当前候选区域中确定出至少一个当前最高级别的候选区域,并将各所述当前最高级别的候选区域对应的最小边界矩形添加作为对应的各当前最高级别的候选区域归属的上一级候选区域对应的最小边界矩形的子节点;以及用于重复执行上述步骤,直至所有候选区域添加完成。

本申请实施例提供了一种可能的实现方式,其中,所述构建模块,还用于从当前候选区域中确定出至少一个当前最高级别的候选区域;判断所述当前最高级别的候选区域是否为预定的最高级别的候选区域;如果当前最高级别的候选区域为预定的最高级别的候选区域,则将所述当前最高级别的候选区域对应的最小边界矩形作为父节点。

本申请实施例提供了一种可能的实现方式,其中,所述第二确定模块,包括:

第一判断单元,用于判断所述待语义化位置的目标坐标是否属于所述预构建的区域空间索引树的节点对应的候选区域;

第二判断单元,用于如果属于所述候选区域,则进一步判断所述候选区域对应的节点是否包含子节点;

作为单元,用于如果不包含子节点,则将所述候选区域作为所述目标区域。

对于本申请实施例,其实现的有益效果同上述方法实施例,此处不再赘述。

本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如本公开实施例提供的方法。

该电子设备与现有技术需要人工确定坐标对应的语义化信息相比。本公开通过确定待语义化位置的目标坐标;通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;基于所述目标区域的语义信息确定所述待语义化位置的语义信息。即将目标坐标归属的目标区域的语义信息作为目标坐标的语义信息,实现了目标坐标的语义信息的自动化确定;此外,基于预构建的区域空间索引树确定目标区域,时间复杂度低、计算效率高。

该可读存储介质为存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如本公开实施例提供的方法。

该可读存储介质与现有技术需要人工确定坐标对应的语义化信息相比。本公开通过确定待语义化位置的目标坐标;通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;基于所述目标区域的语义信息确定所述待语义化位置的语义信息。即将目标坐标归属的目标区域的语义信息作为目标坐标的语义信息,实现了目标坐标的语义信息的自动化确定;此外,基于预构建的区域空间索引树确定目标区域,时间复杂度低、计算效率高。

该计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如本公开的第一方面中所示的方法。

该计算机程序产品与现有技术需要人工确定坐标对应的语义化信息相比。本公开通过确定待语义化位置的目标坐标;通过预构建的区域空间索引树,确定所述待语义化位置的目标坐标归属的目标区域;基于所述目标区域的语义信息确定所述待语义化位置的语义信息。即将目标坐标归属的目标区域的语义信息作为目标坐标的语义信息,实现了目标坐标的语义信息的自动化确定;此外,基于预构建的区域空间索引树确定目标区域,时间复杂度低、计算效率高。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口607也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如方法语义化方法。例如,在一些实施例中,方法语义化可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的方法语义化方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法语义化方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 语义化方法、装置、电子设备及可读存储介质
  • 电子设备落水保护方法及装置、电子设备及可读存储介质
技术分类

06120113822244