掌桥专利:专业的专利平台
掌桥专利
首页

基于文本相似度的基站定位方法、系统及可读存储介质

文献发布时间:2024-04-18 19:58:26


基于文本相似度的基站定位方法、系统及可读存储介质

技术领域

本发明涉及工程机械物联网技术领域,尤其涉及一种基于文本相似度的基站定位方法、系统及可读存储介质。

背景技术

随着物联网行业的快速发展,工程机械物联网领域中将存在大量联网的TBox设备,数量庞大。这些Tbox上传基站信息,平台侧依据基站信息进行基站定位进而获取TBox设备所处的位置信息。传统模式下依据基站信息获取基站定位的方法主要有:

1)通过第三方数据提供商接口进行基站定位,其缺点是成本高、性能差。

2)基于信号强度(RSSI)的三角定位、基于时间差(TDOA)的定位或基于到达角度(AOA)的定位、指纹定位。上述定位方法均需要了解具体的基站信息和所在位置,而一般企业无法获得完整的基站数据信息,只能通过第一种方式进行基站定位。

发明内容

本发明的目的在于提供一种基于文本相似度的基站定位方法、系统及可读存储介质,至少解决了现有依据基站信息获取基站定位的方法存在的问题之一。

为达到上述目的,本发明提供一种基于文本相似度的基站定位方法,包括以下步骤:

将历史存储的基站信息和定位位置进行关联,一个所述定位位置关联至少一个所述基站信息;

根据关联情况建立用于基站定位的倒排索引,每个完整的基站信息作为用于查询的文档,所述基站信息中的小区号、位置区域代码及信号强度作为所述倒排索引的分词单元;

根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档;

利用文本相似度算法计算各分词单元在所有筛选文档中的相似度得分,得分最高者对应的基站信息为所需的基站信息。

可选的,根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档的步骤具体包括:

计算各基站信息关联的定位位置的经纬度与所述前一次基站定位的经纬度的空间距离,筛选出所述空间距离小于预设值的基站信息作为所述筛选文档。

可选的,根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息后,将具有最强的信号强度的基站信息单独放到一个字段内。

可选的,利用Elasticsearch建立用于基站定位的倒排索引。

可选的,利用BM25算法计算各分词单元在所有筛选文档中的相似度得分。

可选的,所述倒排索引的分词器为空格分词器。

基于同一技术构思,本发明还提供了一种基于文本相似度的基站定位系统,包括:

本地基站定位库,被配置为存储历史的基站信息和定位位置的关联情况,一个所述定位位置关联至少一个所述基站信息;

索引模块,被配置为根据关联情况建立用于基站定位的倒排索引,每个完整的基站信息作为用于查询的文档,所述基站信息中的小区号、位置区域代码及信号强度作为所述倒排索引的分词单元;

获取模块,被配置为根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档;

计算模块,被配置利用文本相似度算法计算各分词单元在所有筛选文档中的相似度得分,得分最高者对应的基站信息为所需的基站信息。

可选的,所述获取模块被配置为计算各基站信息关联的定位位置的经纬度与所述前一次基站定位的经纬度的空间距离,筛选出所述空间距离小于预设值的基站信息作为所述筛选文档。

可选的,所述计算模块利用BM25算法计算各分词单元在所有筛选文档中的相似度得分。

基于同一技术构思,本发明还提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被执行时能实现如上所述的基于文本相似度的基站定位方法。

在本发明提供的一种基于文本相似度的基站定位方法、系统及可读存储介质中,通过将历史的基站信息和定位位置建立关联,根据关联情况建立用于基站定位的倒排索引,并结合设备前一次的定位结果进行辅助定位,依照文本相似的算法进行相似匹配,从而实现基站的快速定位,有效降低定位偏差。

附图说明

本领域的普通技术人员将会理解,提供的附图用于更好地理解本发明,而不对本发明的范围构成任何限定。其中:

图1为本发明一实施例提供的基于文本相似度的基站定位方法的步骤图。

具体实施方式

实际上,在一定时间内工程机械设备移动并不频繁,定位相对稳定,即在一定时期内,相同的地点,不同设备上报的基站定位信息相同或有较小差异。由于工程机械设备经常在一些卫星信号弱,定位频繁不成功的地域或环境下工作,且定位装置有可能会被损坏,会造成无法定位。

基于此,本发明提供了一种基于文本相似度的基站定位方法、系统及可读存储介质,通过将历史的基站信息和定位位置建立关联,根据关联情况建立用于基站定位的倒排索引,并结合设备前一次的定位结果进行辅助定位,依照文本相似的算法进行相似匹配,从而实现基站的快速定位,有效降低定位偏差。

为使本发明的目的、优点和特征更加清楚,以下结合附图和具体实施例对本发明作进一步详细说明。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的。为了使本发明的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明实施的限定条件,任何结构的修饰、比例关系的改变或大小的调整,在与本发明所能产生的功效及所能达成的目的相同或近似的情况下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。

如在本发明中所使用的,单数形式“一”、“一个”以及“该”包括复数对象,除非内容另外明确指出外。如在本发明中所使用的,术语“或”通常是以包括“和/或”的含义而进行使用的,除非内容另外明确指出外。如在本发明中所使用的,术语“若干”通常是以包括“至少一个”的含义而进行使用的,除非内容另外明确指出外。如在本发明中所使用的,术语“至少两个”通常是以包括“两个或两个以上”的含义而进行使用的,除非内容另外明确指出外。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者至少两个该特征。

在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

请参照图1,本发明实施例提供了一种基于文本相似度的基站定位方法,包括以下步骤:

S1、将历史存储的基站信息和定位位置进行关联,一个定位位置关联至少一个基站信息;

S2、根据关联情况建立用于基站定位的倒排索引,每个完整的基站信息作为用于查询的文档,基站信息中的小区号、位置区域代码及信号强度作为倒排索引的分词单元;

S3、根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档;

S4、利用文本相似度算法计算各分词单元在所有筛选文档中的相似度得分,得分最高者对应的基站信息为所需的基站信息。

具体的,先执行步骤S1,将历史存储的基站信息和定位位置进行关联,一个定位位置关联至少一个基站信息。需要理解的事,此处提及的历史存储的基站信息和定位位置,可以是来源于第三方服务提供商存储的历史数据,在将历史存储的基站信息和定位位置进行关联之后,可以存储在本地基站定位库内。

本实施例中,基站信息通常包括国家代码、运营商代码、小区号、位置区域代码及信号强度,由于国家代码和运营商代码相对固定,故可以合并为一个字段,而小区号、位置区域代码及信号强度是动态变化的,故可以合并为一个字段。

然后执行步骤S2,根据关联情况建立用于基站定位的倒排索引,每个完整的基站信息作为用于查询的文档,基站信息中的小区号、位置区域代码及信号强度作为倒排索引的分词单元。

本实施例中,利用Elasticsearch建立用于基站定位的倒排索引,设置索引的Mapping(映射),采用whitespace(空格)分词器,基站信息中的小区号、位置区域代码及信号强度作为倒排索引的分词单元。

然后执行步骤S3,根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档。由于工程机械设备不会频繁移动位置,通过此步骤能够缩小基站匹配的范围,提高定位精度。

具体的,可通过计算各基站信息关联的定位位置的经纬度与前一次基站定位的经纬度的空间距离,来筛选出空间距离小于预设值的基站信息作为筛选文档。

优选的,根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息后,将具有最强的信号强度的基站信息(主基站)单独放到一个字段内,以确保使用Elasticsearch的Trem查询时,倒排索引与要查询的主基站相匹配,进而确保定位不会偏离太远。

最后执行步骤S4,利用文本相似度算法计算各分词单元在所有筛选文档中的相似度得分,得分最高者对应的基站信息为所需的基站信息。

优选的,利用BM25算法计算各分词单元在所有筛选文档中的相似度得分。

该BM25公式如下:

式中,D表示筛选文档,Q表示查询,k

利用BM25算法计算各分词单元在所有筛选文档中的相似度得分之后,得分最高者对应的基站信息即为所需的基站信息(设备当前所处的基站信息)。

除此之外,还可以根据计算得到的相似度得分,对各基站进行排序,本申请对此不作限制。

实验结果表明,该算法可以满足海量实时定位和工程机械设备在一定定位精度下,定位成功率达到90%以上。

优选的,还可以将上述方法封装成web服务,对外提供搜索api服务,由此不断积累基站定位数据,以丰富本地基站定位库。

基于同一发明构思,本发明实施例还提出一种基于文本相似度的基站定位系统,包括:

本地基站定位库,被配置为存储历史的基站信息和定位位置的关联情况,一个定位位置关联至少一个基站信息;

索引模块,被配置为根据关联情况建立用于基站定位的倒排索引,每个完整的基站信息作为用于查询的文档,基站信息中的小区号、位置区域代码及信号强度作为倒排索引的分词单元;

获取模块,被配置为根据前一次基站定位的经纬度筛选出预设范围内的多个基站信息并作为用于查询的筛选文档;

计算模块,被配置利用文本相似度算法计算各分词单元在所有筛选文档中的相似度得分,得分最高者对应的基站信息为所需的基站信息。

优选的,获取模块被配置为计算各基站信息关联的定位位置的经纬度与前一次基站定位的经纬度的空间距离,筛选出空间距离小于预设值的基站信息作为筛选文档。

优选的,计算模块利用BM25算法计算各分词单元在所有筛选文档中的相似度得分。

基于同一发明构思,本发明实施例还提出一种可读存储介质,其上存储有计算机程序,计算机程序被执行时能实现如上的基于文本相似度的基站定位方法。

可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备,例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所描述的计算机程序可以从可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机程序,并转发该计算机程序,以供存储在各个计算/处理设备中的可读存储介质中。用于执行本发明操作的计算机程序可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机程序可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机程序的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、系统和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序实现。这些计算机程序可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些程序在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机程序存储在可读存储介质中,这些计算机程序使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有该计算机程序的可读存储介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机程序加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的计算机程序实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

综上,本发明实施例提供了一种基于文本相似度的基站定位方法、系统及可读存储介质,通过将历史的基站信息和定位位置建立关联,根据关联情况建立用于基站定位的倒排索引,并结合设备前一次的定位结果进行辅助定位,依照文本相似的算法进行相似匹配,从而实现基站的快速定位,有效降低定位偏差。

上述描述仅是对本发明较佳实施方式的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于本发明的保护范围。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若这些修改和变型属于本发明及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

相关技术
  • 一种基于神经网络的经营数据预测方法、可读存储介质和预测系统
  • 基于商业智能财税管理系统、方法及计算机可读存储介质
  • 基于物联网的火灾报警系统、方法及可读存储介质
  • 基于贝叶斯优化的点云配准方法、系统及可读存储介质
  • 基于人脸识别的租住管理方法及系统、可读存储介质
  • 基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质
  • 基于文本相似度算法的相似问题生成方法、系统、电子装置和存储介质
技术分类

06120116486868