掌桥专利:专业的专利平台
掌桥专利
首页

楼宇定位方法、装置、设备及计算机可读存储介质

文献发布时间:2023-06-19 10:00:31


楼宇定位方法、装置、设备及计算机可读存储介质

技术领域

本发明涉及通信网络技术领域,尤其涉及一种楼宇定位方法、装置、设备及计算机可读存储介质。

背景技术

目前进行用户定位至楼宇的方法主要包括基于终端位置信息测量的定位方法和基于MR(Measurement Report,测量报告)数据的指纹库定位方法。基于终端位置信息测量的定位方法是通过终端侧发起定位请求,由位置服务提供商进行网络运算,将用户定位至楼宇,但此方法过度依赖终端,无法针对全量用户进行,且位置应用场景受限,使得定位结果的准确性较低。基于MR数据的指纹库定位方法是通过通信运营商的基站小区配置,结合三维地图,采用射线追踪模型进行无线信号仿真,构建全网楼宇的立体覆盖指纹库,再根据指纹定位模型,对用户的MR进行指纹匹配,从而实现将用户定位至楼宇,虽然此方法可以针对全量用户进行,但此方法所依赖的建模数据源的质量无法达到要求,导致定位结果的准确性较低。因此如何提高用户定位至楼宇的准确性成为了目前亟待解决的技术问题。

发明内容

本发明的主要目的在于提出一种楼宇定位方法、装置、设备及计算机可读存储介质,旨在解决如何提高用户定位至楼宇的准确性的技术问题。

为实现上述目的,本发明提供一种楼宇定位方法,所述楼宇定位方法包括如下步骤:

采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;

获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;

对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;

基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。

可选地,对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型的步骤,包括:

对所述学习样本集中所有ECI进行特征向量构建,以获取各所述ECI对应的特征序列样本;

遍历各所述ECI,根据遍历的ECI对应的特征序列样本进行模型训练,以获取所述遍历的ECI对应的楼宇定位决策模型。

可选地,根据遍历的ECI对应的特征序列样本进行模型训练,以获取所述遍历的ECI对应的楼宇定位决策模型的步骤,包括:

获取所述遍历的ECI对应的特征序列样本中的样本数量和所有特征,若所述样本数量大于第一预设阈值,则根据预设的基尼系数计算公式和所述样本数量计算各所述特征的基尼系数;

获取各所述基尼系数中数值最小的最小基尼系数,确定各所述特征中所述最小基尼系数对应的最优特征,根据所述最优特征对所述遍历的ECI对应的特征序列样本进行划分,以获取左节点数据集和右节点数据集;

基于所述左节点数据集和所述右节点数据集构建所述遍历的ECI对应的楼宇定位决策模型。

可选地,根据预设的基尼系数计算公式和所述样本数量计算各所述特征的基尼系数的步骤,包括:

根据预设的基尼系数计算公式和所述样本数量计算所述遍历的ECI对应的特征序列样本的目标基尼系数;

若所述目标基尼系数大于第二预设阈值,则获取各所述特征的特征值,根据各所述特征值和所述基尼系数计算公式计算各所述特征的基尼系数。

可选地,对所述学习样本集中所有ECI进行特征向量构建,以获取各所述ECI对应的特征序列样本的步骤,包括:

依次遍历所述学习样本集中所有ECI,确定遍历的ECI对应的所有邻区,获取各所述邻区中预设数量的目标邻区,并确定各所述目标邻区的邻区标识;

根据预设的排序规则对各所述邻区标识进行排序,基于所述排序的排序结果确定遍历的ECI对应的特征序列样本。

可选地,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集的步骤,包括:

对所述静止状态数据和预设的楼宇用户样本进行信息关联,基于所述关联的关联结果获取关联数据集合;

基于预设门限值对所述关联数据集合进行数据清洗,以获取学习样本集。

可选地,基于预设门限值对所述关联数据集合进行数据清洗,以获取学习样本集的步骤,包括:

遍历所述关联数据集合中的所有楼宇,确定遍历的楼宇中所有用户占用的ECI,并计算各所述ECI的位置数据和所述遍历的楼宇的位置数据之间的绝对差值;

若在各所述绝对差值中存在目标绝对差值大于预设门限值,则对所述目标绝对差值对应的ECI进行数据清洗,并将经过数据清洗的所述关联数据集合作为学习样本集。

此外,为实现上述目的,本发明还提供一种楼宇定位装置,所述楼宇定位装置包括:

采集模块,用于采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;

获取模块,用于获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;

训练模块,用于对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;

输入模块,用于基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。

此外,为实现上述目的,本发明还提供一种楼宇定位设备,所述楼宇定位设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的楼宇定位程序,所述楼宇定位程序被所述处理器执行时实现如上所述的楼宇定位方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有楼宇定位程序,所述楼宇定位程序被处理器执行时实现如上所述的楼宇定位方法的步骤。

本发明通过采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。通过采集全量用户的基础位置数据以获取粗略位置数据,并根据粗略位置数据中的静止状态数据和楼宇用户样本获取学习样本集,获取学习样本集中所有ECI对应的楼宇定位决策模型,并将目标用户的基础位置数据输入至目标楼宇定位决策模型中进行训练,以获取楼宇定位结果,从而避免了现有技术中采用终端位置信息测量的定位方法和基于MR数据的指纹库定位方法的定位结果的准确性较低的现象发生,通过构建所有ECI对应的楼宇定位决策模型,再根据各个楼宇定位决策模型进行楼宇定位,提高了用户定位至楼宇的准确性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的楼宇定位设备结构示意图;

图2为本发明楼宇定位方法第一实施例的流程示意图;

图3为本发明楼宇定位装置的装置模块示意图;

图4为本发明楼宇定位方法中的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的楼宇定位设备结构示意图。

本发明实施例楼宇定位设备可以是搭载了虚拟化平台的PC机或服务器(如X86服务器)等终端设备。

如图1所示,该楼宇定位设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及楼宇定位程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的楼宇定位程序,并执行以下安全组件的权限配置方法实施例中的操作。

基于上述硬件结构,提出本发明楼宇定位方法实施例,如下所述。

参照图2,图2为本发明数据定位方法第一实施例的流程示意图,所述数据定位方法包括:

步骤S10,采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;

在本实施例中,为了避免现有技术基于终端位置信息测量的定位方法和基于MR(Measurement Report,测量报告)数据的指纹库定位方法,提出一种基于决策树的楼宇精准定位方法,即数据定位方法,不需要在用户侧安装用于计算的专用软件,也不需要用户处于特殊的环境当中,只要用户终端处于移动通信网络连接状态,即可根据网络侧数据识别用户的归属楼宇。同时,也不依赖网络工参数据,不依赖楼宇材质和内部结构,能有效保障楼宇定位数据的准确性。

在本实施例中,利用配置数据、网络工参数据、网络侧采集的XDR(详细记录)数据、MR数据、楼宇底图图层数据,对各类数据进行分类组织,关联运算,并以基站小区为维度进行楼宇定位模型建模训练,形成基于决策树的楼宇精准定位模型,基于该模型,对全网用户进行楼宇定位。例如,如图4所示,数据定位方法包括100,全量用户MR及XDR采集关联;200,用户驻点状态数据提取;300,获取楼宇用户样本;400,学习样本提取;500,楼宇决策模型构造及训练;600,全量用户楼宇定位。

因此,在进行楼宇定位时,需要先采集全量用户的基础位置数据,基础位置数据包括全量用户MR数据及XDR数据,也就是采集获取通信运营商的MR数据,采集S1-MMR的XDR数据(移动通信运营商建立信令监测系统,从LTE(Long-Term Evolution,无线网络)网络核心网的S1接口采集用户使用时的控制面和用户面信令,形成XDR数据),并进行MR数据和XDR数据关联,形成包含用户标识以及用户MR特性的用户粗略位置信息,即粗略位置数据。并且粗略位置数据包括时间、MSISDN(电话号码)、ECI(网络小区标识)、主服小区RSRP(参考信号接收功率)、主服小区RSRQ(参考信号接收质量)、AOA(Angle of Arrival,天线方向角)、TA(Time Advance,时间提前量)、邻区1标识、邻区1RSRP、邻区2标识、邻区2RSRP、邻区3标识、邻区3RSRP、邻区4标识、邻区4RSRP、邻区5标识、邻区5RSRP、邻区6标识、邻区6RSRP以及其它辅助信息。

步骤S20,获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;

当获取到粗略位置数据后,可以对全量用户的用户状态进行用户状态识别,其中,用户状态包括静止状态,即驻点状态,道路运动状态,并在粗略位置中提取用户状态处于静止状态的数据,即驻点状态数据,将提取后的驻点状态数据作为静止状态数据。

获取预设的楼宇用户样本,由于家宽配置数据包含了家宽用户的MSISDN(电话号码)、用户所在的居民小区、楼宇信息,因此可以提前将家宽用户的配置信息与楼宇图层进行关联,形成楼宇用户样本。其中,楼宇用户样本包括楼宇ID(Identity document,身份标识)、楼宇经纬度、MSISDN以及其它辅助信息。

然后再对静止状态数据和楼宇用户样本进行关联,获取样本用户在楼宇里面的MR特性,形成楼宇定位的学习样本集,该学习样本集可以包括时间、楼宇ID、MSISDN、ECI、主服小区RSRP、主服小区RSRQ、AOA、TA、邻区1标识、邻区1RSRP、邻区2标识、邻区2RSRP、邻区3标识、邻区3RSRP、邻区4标识、邻区4RSRP、邻区5标识、邻区5RSRP、邻区6标识、邻区6RSRP以及其它辅助信息。

步骤S30,对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;

当获取到学习样本集后,可以以ECI为对象构造楼宇定位决策模型,即对学习样本集中所有ECI进行模型训练,以获取各个ECI对应的楼宇定位的楼宇定位决策模型。而获取ECI对应的楼宇定位决策模型的方式可以是,先针对每个ECI进行特征向量构建,以获取各个ECI对应的特征序列样本。并且由于每个ECI对应的邻区不同,对于决策树的特征需要单独进行构建。

当构建好各个ECI对应的特征序列样本后,可以对每个ECI进行决策树训练,以获取各个楼宇定位决策模型。即在对某个ECI进行决策树构建时,可以将该ECI对应的特征序列样本作为样本集D。而且在本实施例中,决策树选用成熟的CART(Classification andRegression Trees,分类与回归树)分类树模型,每一个ECI对应一个CART分类树,对于CART分类树的构建,算法从根节点开始,根据样本集D递归的建立CART树。

因此当获取到样本集D后,可以选取样本集D中的根节点作为当前节点,并检测样本集D中的样本数量是否小于第一预设阈值,若样本数量小于第一预设阈值,或没有特征,则返回决策树,当前节点停止递归。若样本数量大于第一预设阈值,则根据预设的基尼系数计算公式计算样本集的目标基尼系数,检测目标基尼系数是否小于第二预设阈值,则返回决策树,当前节点停止递归。其中,样本集D的基尼系数计算公式可以是

k表示样本集D中样本类别的数量,第k个类别的数量为c

若目标基尼系数大于或等于第二预设阈值,则计算当前节点现有的各个特征的特征值对数据集的基尼系数,即各个样本类别的基尼系数。并在计算出来的各个特征的各个特征值对数据集D的基尼系数中,选择基尼系数最小的特征A(如服务小区RSRP、邻区RSRP、TA、AOA等)和对应的特征值a(具体的特征值)。根据这个最优特征和最优特征值,把数据集划分成两部分D1和D2,同时建立当前节点的左右节点,左节点的数据集D为D1,右节点的数据集D为D2,再对左右节点进行递归运算,即继续进行决策树训练,以获取ECI对应的楼宇定位决策模型。

其中,在特征A的条件下的样本集D的基尼系数计算公式为:

步骤S40,基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。

在本实施例中,当获取到各个楼宇定位决策模型后,可以根据各个楼宇定位决策模型对各个全量用户进行楼宇定位。即可以先确定全量用户中的某个目标用户,并确定目标用户对应的基础位置数据,如目标粗略位置数据,根据此目标粗略位置数据在各个楼宇定位决策模型中确定目标楼宇定位决策模型,再将目标用户的基础位置数据输入到目标楼宇定位决策模型进行训练,以获取目标用户的楼宇定位结果。

在本实施例中是以基站小区ECI为对象构造楼宇定位决策模型,即每个ECI对应一个定位决策模型,对学习样本进行特征转换,对模型进行训练建模,并对用户的MR进行基于决策树的楼宇归属定位,有效的解决了将用户精确定位到楼宇的难题。并且在获取学习样本时,是依据通信运营商的家宽配置数据,结合用户的驻点位置特性,提取出用于楼宇MR特性的精确学习样本,低成本,高质量的解决了用于楼宇决策树定位模型的学习样本收集问题。

在本实施例中,通过采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。通过采集全量用户的基础位置数据以获取粗略位置数据,并根据粗略位置数据中的静止状态数据和楼宇用户样本获取学习样本集,获取学习样本集中所有ECI对应的楼宇定位决策模型,并将目标用户的基础位置数据输入至目标楼宇定位决策模型中进行训练,以获取楼宇定位结果,从而避免了现有技术中采用终端位置信息测量的定位方法和基于MR数据的指纹库定位方法的定位结果的准确性较低的现象发生,通过构建所有ECI对应的楼宇定位决策模型,再根据各个楼宇定位决策模型进行楼宇定位,提高了用户定位至楼宇的准确性。

进一步地,基于上述本发明的第一实施例,提出本发明楼宇定位方法的第二实施例,本实施例中,上述实施例中的步骤S30,对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型的步骤的细化,包括:

步骤a,对所述学习样本集中所有ECI进行特征向量构建,以获取各所述ECI对应的特征序列样本;

在本实施例中,当获取到学习样本集后,可以对学习样本集中所有ECI进行特征向量构建,并且对每个ECI都采用相同的特征向量构建方式,即根据ECI统计邻区的占用次数,形成数据集合,该数据集合包括ECI-邻区标识-样本数,再根据样本数进行排序,获取预设数量(用户提前设置的任意数量,如50)的邻区标识,并对这些邻区标识进行排序,排序方式可以是按照名称进行排序,形成固定的字段序列,并根据此进行特征转换。其中,针对每个特定的ECI,通过统计获取预设数量的邻区后,转换后的特征字段就固定了,将学习样本按照邻区标识转换至特征序列中,得到各个ECI对应的特征序列样本。例如样本S1的邻区A,对应的是邻区2,邻区B对应特征序列邻区8,如果特征序列的邻区RSRP在样本中没有,则赋值NULL。

步骤b,遍历各所述ECI,根据遍历的ECI对应的特征序列样本进行模型训练,以获取所述遍历的ECI对应的楼宇定位决策模型。

当获取到各个ECI对应的特征序列样本后,可以遍历各个ECI,根据遍历的ECI对应的特征序列样本进行模型训练,即进行决策树训练,以获取遍历的ECI对应的楼宇定位决策模型。其中,决策树训练选用成熟的CART分类树模型,每一个ECI对应一个CART分类树,对于CART分类树的构建,算法从根节点开始,根据样本集D递归的建立CART树。

在本实施例中,通过构建学习样本集中所有ECI的特征序列样本,再遍历所有ECI,根据遍历的ECI对应的特征序列样本进行模型训练,以获取遍历的ECI对应的楼宇定位决策模型,从而保障了获取到的楼宇定位决策模型的有效性。

具体地,根据遍历的ECI对应的特征序列样本进行模型训练,以获取所述遍历的ECI对应的楼宇定位决策模型的步骤,包括:

步骤c,获取所述遍历的ECI对应的特征序列样本中的样本数量和所有特征,若所述样本数量大于第一预设阈值,则根据预设的基尼系数计算公式和所述样本数量计算各所述特征的基尼系数;

在本实施例中,在对遍历的ECI进行模型训练时,可以先获取遍历的ECI对应的特征序列样本中的样本数量和所有特征,并检测样本数量是否大于第一预设阈值(用户提前设置的任意阈值),若样本数量小于第一预设阈值,或没有特征,则返回决策树,当前节点停止递归。若样本数量大于第一预设阈值,则根据预设的基尼系数计算公式计算样本集的目标基尼系数,检测目标基尼系数是否小于第二预设阈值(用户提前设置的任意阈值,可以和第一预设阈值相同,也可以不同),若小于,则返回决策树,当前节点停止递归。其中,样本集D的基尼系数计算公式可以是

k表示样本集D中样本类别的数量,第k个类别的数量为C

若目标基尼系数大于或等于第二预设阈值,则计算当前节点现有的各个特征的特征值对数据集的基尼系数。

步骤d,获取各所述基尼系数中数值最小的最小基尼系数,确定各所述特征中所述最小基尼系数对应的最优特征,根据所述最优特征对所述遍历的ECI对应的特征序列样本进行划分,以获取左节点数据集和右节点数据集;

步骤e,基于所述左节点数据集和所述右节点数据集构建所述遍历的ECI对应的楼宇定位决策模型。

在计算出来的各个特征的各个特征值对数据集D的基尼系数中,选择基尼系数最小的特征A(如服务小区RSRP、邻区RSRP、TA、AOA等)和对应的特征值a(具体的特征值)。根据这个最优特征和最优特征值,把数据集划分成两部分D1和D2,同时建立当前节点的左右节点,左节点的数据集D为D1(即左节点数据集),右节点的数据集D为D2(即右节点数据集),再对左右节点进行递归运算,即继续进行决策树训练,以获取ECI对应的楼宇定位决策模型。

其中,在特征A的条件下的样本集D的基尼系数计算公式为:

在本实施例中,通过在遍历的ECI对应的特征序列样本中的样本数量大于第一预设阈值时,计算各个特征的基尼系数,并确定最小基尼系数对应的最优特征,根据最优特征对遍历的ECI对应的特征序列样本进行划分得到左节点数据集和右节点数据集,以便构建遍历的ECI对应的楼宇定位决策模型,从而保障了构建的楼宇定位决策模型的有效性。

具体地,根据预设的基尼系数计算公式和所述样本数量计算各所述特征的基尼系数的步骤,包括:

步骤f,根据预设的基尼系数计算公式和所述样本数量计算所述遍历的ECI对应的特征序列样本的目标基尼系数;

在本实施例中,可以先获取提前设置的基尼系数计算公式,再根据样本数量k来计算遍历的ECI对应的特征序列样本的目标基尼系数。例如,假设有K个类别,第k个类别的数量为C

步骤g,若所述目标基尼系数大于第二预设阈值,则获取各所述特征的特征值,根据各所述特征值和所述基尼系数计算公式计算各所述特征的基尼系数。

当计算得到目标基尼系数后,检测目标基尼系数是否大于第二预设阈值,若目标基尼系数小于第二预设阈值,则返回决策树,当前节点停止递归。若目标基尼系数大于第二预设阈值,则计算当前节点现有的各个特征的特征值对数据集的基尼系数。

例如,对于样本D,如果根据特征A的某个值a,把D分成D1和D2两部分,则在特征A的条件下,D的基尼系数表达式为:

在本实施例中,通过根据基尼系数计算公式和样本数量计算目标基尼系数,并在目标基尼系数大于第二预设阈值时,计算各个特征的基尼系数,从而为后续进行楼宇定位提供了基础。

进一步地,对所述学习样本集中所有ECI进行特征向量构建,以获取各所述ECI对应的特征序列样本的步骤,包括:

步骤h,依次遍历所述学习样本集中所有ECI,确定遍历的ECI对应的所有邻区,获取各所述邻区中预设数量的目标邻区,并确定各所述目标邻区的邻区标识;

在本实施例中,对学习样本集中所有ECI进行特征向量构建时,可以依次遍历学习样本集中所有ECI,并确定遍历的ECI对应的所有邻区,即根据ECI统计邻区的占用次数来确定所有邻区,形成相应的数据集合,该数据集合中包括ECI,邻区标识和样本数。然后在数据集合中获取预设数量(用户提前设置的任意数量,如50)的目标邻区,并确定数据集合中目标邻区的邻区标识。

步骤k,根据预设的排序规则对各所述邻区标识进行排序,基于所述排序的排序结果确定遍历的ECI对应的特征序列样本。

然后再根据提前设置的排序规则对各个邻区标识进行排序,例如按照各个邻区的名称进行排序,形成固定的字段序列,可以将此字段序列作为遍历的ECI对应的特征序列样本。例如,若遍历的ECI的样例如表1所示

表1

当按照预设的排序规则对表1中的各个邻区标识进行排序,并进行特征转换后,可以得到特征序列样本,如表2所示。

表1

在本实施例中,通过遍历学习样本集中所有ECI,在遍历的ECI对应的所有邻区中获取预设数量的目标邻区,并根据预设的排序规则对各个目标邻区的邻区标识进行排序,基本排序结果确定确定遍历的ECI对应的特征序列样本,从而保障了获取到的遍历的ECI对应的特征序列样本的准确性。

进一步地,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集的步骤,包括:

步骤m,对所述静止状态数据和预设的楼宇用户样本进行信息关联,基于所述关联的关联结果获取关联数据集合;

在本实施例中,当获取到静止状态数据,并确定预设的楼宇用户样本后,可以进行信息关联,以获取关联数据集合。其中,关联数据集合包括时间、楼宇ID、MSISDN、ECI、主服小区RSRP、主服小区RSRQ、AOA、TA、邻区1标识、邻区1RSRP、邻区2标识、邻区2RSRP、邻区3标识、邻区3RSRP、邻区4标识、邻区4RSRP、邻区5标识、邻区5RSRP、邻区6标识、邻区6RSRP以及其它辅助信息。

步骤n,基于预设门限值对所述关联数据集合进行数据清洗,以获取学习样本集。

当获取到关联数据集合后,可以根据楼宇ID和MSISDN,对每个用户MSISDN占用的ECI进行统计,识别出对于具体楼宇ID和MSISDN占用最多的ECI,并提取对应的记录作为训练样本数据。再提取训练样本数据中的小区ECI对应的经纬度POS_ECI和楼宇ID对应的经纬度POS_Building,计算POS_ECI和POS_Building之间的距离,对距离超过预设门限值(用户提前设置的任意值)的记录进行滤除,最终得到学习样本数据,字段内容同S_403。其中距离门限根据基站小区的类型区分,城区500米、郊区800米、农村3000米。最后进行学习样本数据的收集积累,得到学习样本集。

在本实施例中,通过对静止状态数据和楼宇用户样本进行信息关联,获取关联数据集合,对关联数据集合进行数据清洗,获取学习样本集,从而保障了获取到的学习样本集的有效性。

具体地,基于预设门限值对所述关联数据集合进行数据清洗,以获取学习样本集的步骤,包括:

步骤x,遍历所述关联数据集合中的所有楼宇,确定遍历的楼宇中所有用户占用的ECI,并计算各所述ECI的位置数据和所述遍历的楼宇的位置数据之间的绝对差值;

在本实施例中,在对关联数据集合进行数据清洗时,可以先遍历关联数据集合中的所有楼宇ID,确定遍历的楼宇中所有用户占用的ECI。需要说明的是,同一个用户可以占用多个ECI,再获取各个ECI的位置数据和遍历的楼宇的位置数据,即每个ECI对应的经纬度POS_ECI和楼宇ID对应的经纬度POS_Building。计算每个ECI的位置数据和遍历的楼宇的位置数据之间的绝对差值。

步骤y,若在各所述绝对差值中存在目标绝对差值大于预设门限值,则对所述目标绝对差值对应的ECI进行数据清洗,并将经过数据清洗的所述关联数据集合作为学习样本集。

当获取到所有的绝对差值后,需要将各个绝对差值和预设门限值进行比较,若在各个绝对差值中存在目标绝对差值大于预设门限值,则可以将目标绝对差值对应的ECI相关的记录进行数据清洗,并将剩下的所有与ECI相关的记录进行收集积累,也就是获取经过数据清洗的关联数据集合,并将经过数据清洗的关联数据集合昨晚学习样本集。

在本实施例中,通过遍历关联数据集合中的所有楼宇,计算遍历的楼宇中各个ECI的位置数据和遍历的楼宇的位置数据之间的绝对差值,并当存在大于预设门限值的目标绝对差值时,对目标绝对差值对应的ECI进行数据清洗,将经过数据清洗的关联数据集合作为学习样本集,从而保障了获取到的学习样本集的有效性。

参照图3,本发明还提供一种楼宇定位装置,本实施例中,所述楼宇定位装置包括:

采集模块A10,用于采集全量用户的基础位置数据,基于所述基础位置数据获取所述全量用户的粗略位置数据;

获取模块A20,用于获取所述粗略位置数据中所述全量用户的用户状态为静止状态时的静止状态数据,对所述静止状态数据和预设的楼宇用户样本进行关联,以获取学习样本集;

训练模块A30,用于对所述学习样本集中所有ECI进行模型训练,以获取各所述ECI对应的楼宇定位决策模型;

输入模块A40,用于基于各所述楼宇定位决策模型确定所述全量用户中目标用户对应的目标楼宇定位决策模型,将所述目标用户的基础位置数据输入至所述目标楼宇定位决策模型中进行训练,以获取所述目标用户的楼宇定位结果。

可选地,训练模块A30,用于:

对所述学习样本集中所有ECI进行特征向量构建,以获取各所述ECI对应的特征序列样本;

遍历各所述ECI,根据遍历的ECI对应的特征序列样本进行模型训练,以获取所述遍历的ECI对应的楼宇定位决策模型。

可选地,训练模块A30,用于:

获取所述遍历的ECI对应的特征序列样本中的样本数量和所有特征,若所述样本数量大于第一预设阈值,则根据预设的基尼系数计算公式和所述样本数量计算各所述特征的基尼系数;

获取各所述基尼系数中数值最小的最小基尼系数,确定各所述特征中所述最小基尼系数对应的最优特征,根据所述最优特征对所述遍历的ECI对应的特征序列样本进行划分,以获取左节点数据集和右节点数据集;

基于所述左节点数据集和所述右节点数据集构建所述遍历的ECI对应的楼宇定位决策模型。

可选地,训练模块A30,用于:

根据预设的基尼系数计算公式和所述样本数量计算所述遍历的ECI对应的特征序列样本的目标基尼系数;

若所述目标基尼系数大于第二预设阈值,则获取各所述特征的特征值,根据各所述特征值和所述基尼系数计算公式计算各所述特征的基尼系数。

可选地,训练模块A30,用于:

依次遍历所述学习样本集中所有ECI,确定遍历的ECI对应的所有邻区,获取各所述邻区中预设数量的目标邻区,并确定各所述目标邻区的邻区标识;

根据预设的排序规则对各所述邻区标识进行排序,基于所述排序的排序结果确定遍历的ECI对应的特征序列样本。

可选地,获取模块A20,用于:

对所述静止状态数据和预设的楼宇用户样本进行信息关联,基于所述关联的关联结果获取关联数据集合;

基于预设门限值对所述关联数据集合进行数据清洗,以获取学习样本集。

可选地,获取模块A20,用于:

遍历所述关联数据集合中的所有楼宇,确定遍历的楼宇中所有用户占用的ECI,并计算各所述ECI的位置数据和所述遍历的楼宇的位置数据之间的绝对差值;

若在各所述绝对差值中存在目标绝对差值大于预设门限值,则对所述目标绝对差值对应的ECI进行数据清洗,并将经过数据清洗的所述关联数据集合作为学习样本集。

上述各功能模块实现的方法可参照本发明楼宇定位方法实施例,此处不再赘述。

本发明还提供一种楼宇定位设备,所述楼宇定位设备包括:存储器、处理器、通信总线以及存储在所述存储器上的楼宇定位程序:

所述通信总线用于实现处理器和存储器之间的连接通信;

所述处理器用于执行所述楼宇定位程序,以实现上述楼宇定位方法各实施例的步骤。

本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有楼宇定位程序,所述楼宇定位程序被处理器执行时实现如上所述的楼宇定位方法的步骤。

其中,在所述处理器上运行的楼宇定位程序被执行时所实现的方法可参照本发明楼宇定位方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 楼宇定位方法、装置、设备及计算机可读存储介质
  • 一种室内或楼宇间的定位、导航方法及装置、以及计算机可读写介质和电子设备
技术分类

06120112383796