掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据信令处理的人口识别方法、系统及存储介质

文献发布时间:2023-06-19 19:32:07


基于大数据信令处理的人口识别方法、系统及存储介质

技术领域

本申请涉及大数据及信令数据处理技术领域,具体而言,涉及基于大数据信令处理的人口识别方法、系统及存储介质。

背景技术

信令数据的采集是一个连续的过程,相应地,信令数据的存储也是连续的过程,各家运营商根据信令获取的时间和业务发生的地点记录信令数据,信令数据中用于标识业务发生地点的数据是信令发生时所连接的基站扇区,基站扇区在网络优化和业务调整过程中会有一定的变化,导致不同时间段的扇区对应的位置信息不一致,另外,使用信令数据进行人口统计或相关分析,需要根据一定的空间纬度进行处理,比如社区、村庄、街镇、重点区域等等,为了避免统计模型的重复开发,方便模型部署,需要利用数据治理技术在底层将数据在空间纬度上处理成标准栅格化式。

现有城市区域针对人口数据统计或流动人口群体类别的识别采取身份登记或二维码信息获取的方式,但易产生采集缺失或统计疏漏的技术漏洞,而对个体信息通过手机注册信息号码的数据识别缺乏识别的时效性和快捷度,获取精准度也难以保证,因此常规对于流动人口个体进行识别统计的系统和手段缺乏针对个体行动情况和通讯信息进行人口类别精准识别判断的机动性、精确度和智能化,同时也缺乏根据信令技术处理识别人口所属类型的技术手段。

针对上述问题,目前亟待有效的技术解决方案。

发明内容

本申请实施例的目的在于提供基于大数据信令处理的人口识别方法、系统及存储介质,可以根据采集获取的终端用户的信令数据信息进行人口属性类别的判断技术,提高对用户个体的人口属性类别有效识别的准确度。

本申请实施例还提供了基于大数据信令处理的人口识别方法,包括以下步骤:

采集获取区域内终端用户的信令数据信息;

根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户;

获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息;

根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据;

根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据;

根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别方法中,所述采集获取区域内终端用户的信令数据信息,根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户,包括:

采集目标区域内的用户终端的信令数据信息,包括信令收发信息、信令交互方信息、信令运营载体信息;

根据所述信令收发信息和信令交互方信息识别所述用户终端的用户注册信息,包括用户ID属性信息、用户注册标识信息以及SIM卡信息;

根据所述信令收发信息、信令运营载体信息以及SIM卡信息获取通讯表数据,并提取通讯交互信息;

根据用户注册标识信息、SIM卡信息以及通讯交互信息按照预设范围进行筛选出第一标记用户。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别方法中,所述获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息,包括:

根据所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据;

所述信令标识地数据包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据;

根据所述基站交互动态数据、信号响应动态数据以及区域覆盖动态数据分别提取预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值;

根据所述基站交互量次值、信号响应度值以及区域响应覆盖值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别方法中,所述根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据,包括:

所述基站扇区交互信息包括基站扇区群集在所述预设时间段内的扇区交集度信息、扇区交集域信息、扇区交集轨迹点信息以及扇区驻留信息;

根据所述基站扇区交互信息提取基站扇区标识动态响应数据,包括扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据;

根据所述扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据输入至训练好的基站扇区栅格动态分布模型中处理获取基站扇区动态栅格数据。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别方法中,所述根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据,包括:

根据所述基站扇区动态栅格数据结合所述扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据计算获得预设时间周期内各时间段节点的轨迹密度数据;

所述轨迹密度数据计算公式为:

/>

其中G为轨迹密度数据,

可选地,在本申请实施例所述的基于大数据信令处理的人口识别方法中,所述根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别,包括:

根据所述轨迹密度数据与预设停驻属性阈值进行阈值对比;

根据阈值对比结果对应所述终端用户的停驻属性级别;

根据所述停驻属性级别对应获得所述终端用户所属人口属性类别。

第二方面,本申请实施例提供了基于大数据信令处理的人口识别系统,该系统包括:存储器及处理器,所述存储器中包括基于大数据信令处理的人口识别方法的程序,所述基于大数据信令处理的人口识别方法的程序被所述处理器执行时实现以下步骤:

采集获取区域内终端用户的信令数据信息;

根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户;

获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息;

根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据;

根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据;

根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别系统中,所述采集获取区域内终端用户的信令数据信息,根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户,包括:

采集目标区域内的用户终端的信令数据信息,包括信令收发信息、信令交互方信息、信令运营载体信息;

根据所述信令收发信息和信令交互方信息识别所述用户终端的用户注册信息,包括用户ID属性信息、用户注册标识信息以及SIM卡信息;

根据所述信令收发信息、信令运营载体信息以及SIM卡信息获取通讯表数据,并提取通讯交互信息;

根据用户注册标识信息、SIM卡信息以及通讯交互信息按照预设范围进行筛选出第一标记用户。

可选地,在本申请实施例所述的基于大数据信令处理的人口识别系统中,所述获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息,包括:

根据所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据;

所述信令标识地数据包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据;

根据所述基站交互动态数据、信号响应动态数据以及区域覆盖动态数据分别提取预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值;

根据所述基站交互量次值、信号响应度值以及区域响应覆盖值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息。

第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中包括基于大数据信令处理的人口识别方法程序,所述基于大数据信令处理的人口识别方法程序被处理器执行时,实现如上述任一项所述的基于大数据信令处理的人口识别方法的步骤。

由上可知,本申请实施例提供的基于大数据信令处理的人口识别方法、系统及存储介质通过终端用户的信令数据信息识别用户注册信息和通讯表数据筛选出第一标记用户并提取信令时间数据和信令标识地数据获取基站动态扇区交互信息,提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据计算获得时间周期内的轨迹密度数据,根据轨迹密度数据进行阈值对比筛选人口属性类别;从而基于大数据信令技术对终端用户信令数据处理获取基站扇区数据和栅格数据计算获得轨迹密度数据对人口属性进行识别,实现根据信令数据进行用户轨迹驻停情况识别判断所属人口属性技术,提高对区域内流动人口属性识别判断的精准度。

本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的基于大数据信令处理的人口识别方法的流程图;

图2为本申请实施例提供的基于大数据信令处理的人口识别方法的筛选出第一标记用户的流程图;

图3为本申请实施例提供的基于大数据信令处理的人口识别方法的获取基站动态扇区交互信息的流程图;

图4为本申请实施例提供的基于大数据信令处理的人口识别系统的结构示意图。

具体实施方式

下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

请参照图1,图1是本申请一些实施例中的基于大数据信令处理的人口识别方法的一种流程图。该基于大数据信令处理的人口识别方法用于终端设备中,例如电脑、手机终端等。该基于大数据信令处理的人口识别方法,包括以下步骤:

S101、采集获取区域内终端用户的信令数据信息;

S102、根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户;

S103、获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息;

S104、根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据;

S105、根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据;

S106、根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别。

需要说明的是,为识别终端用户的人口属性类别,通过采集预设区域内终端用户的信令数据根据用户在预设时间段内的通讯情况和注册信息、通话情况识别用户的属地属性,区分本地居民和非本地居民以及特殊用户,对本地居民进行排除,将非本地居民和特殊用户标记为第一标记用户进行进一步筛分,再根据信令数据信息获取信令对应基站扇区的动态交互信息,得到用户在时间段内所响应的基站扇区,根据各采集时间节点的基站扇区标识信息和多个扇区交集区域驻停信息获得用户在时间段内通过信令响应信号所属的基站扇区有效区域情况,再将基站扇区相关信息数据利用数据治理技术进行动态栅格化处理,即数据治理是通过训练好的基站扇区栅格动态分布模型进行栅格处理获得动态栅格数据,即根据基站扇区或交集区的有效区域面积大小进行适配栅格化调整处理获得适合的大小栅格并获取对应基站扇区动态栅格数据,再计算获得在一定预设时间周期内的基站扇区栅格化的轨迹密度数据,即各分段时间节点对应的基站扇区栅格在预设时间周期内轨迹动态变化的密度情况,反映出用户在观察时间周期内活动轨迹动态变化情况,再通过预设阈值对比识别出该用户所属人口属性类别,即实现了通过采集用户信令响应的基站扇区动态变化情况通过栅格化处理和计算获得用户在周期时间内的轨迹行动变化情况进而识别出该用户属于哪类属性人口,实现对流动人口属性通过信令数据处理识别的智慧手段。

请参照图2,图2是本申请一些实施例中的基于大数据信令处理的人口识别方法的筛选出第一标记用户的流程图。根据本发明实施例,所述采集获取区域内终端用户的信令数据信息,根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户,具体为:

S201、采集目标区域内的用户终端的信令数据信息,包括信令收发信息、信令交互方信息、信令运营载体信息;

S202、根据所述信令收发信息和信令交互方信息识别所述用户终端的用户注册信息,包括用户ID属性信息、用户注册标识信息以及SIM卡信息;

S203、根据所述信令收发信息、信令运营载体信息以及SIM卡信息获取通讯表数据,并提取通讯交互信息;

S204、根据用户注册标识信息、SIM卡信息以及通讯交互信息按照预设范围进行筛选出第一标记用户。

需要说明的是,根据采集的目标区域内用户终端的信令相关数据信息包括交互方、传输、网络、运营商等信息进行用户终端信息识别,获得用户注册地属性、注册标识、注册信息以及SIM卡信息等信息,通过获得的信令收发信息、信令运营载体信息以及SIM卡信息获取用户的通讯表数据即用户信令生成通讯情况并提取通讯交互信息,再根据注册标识信息、SIM卡信息以及通讯交互信息根据需求的预设范围进行筛分出第一标记用户,即通过注册标识、SIM卡信息以及通讯情况根据区域内用户对象的筛分需求进行范围设置获得需要的目标用户,例如,根据C区域的用户情况筛分目标需求将本地注册、本地通讯、机主为本地居民的终端用户筛除,筛选出本地注册、具有本地和外地通话记录以及机主为外地的终端用户作为第一标记用户,通过信令数据信息对用户情况进行识别标记剔除非目标用户人群,筛选出需要的目标用户。

请参照图3,图3是本申请一些实施例中的基于大数据信令处理的获取基站动态扇区交互信息的流程图。根据本发明实施例,所述获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息,具体为:

S301、根据所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据;

S302、所述信令标识地数据包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据;

S303、根据所述基站交互动态数据、信号响应动态数据以及区域覆盖动态数据分别提取预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值;

S304、根据所述基站交互量次值、信号响应度值以及区域响应覆盖值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息。

需要说明的是,为获取用户在时间段内的动态活动情况,对信令数据进行处理获得信令响应的基站覆盖区域的交互信息,该基站覆盖区域是通过信令在基站扇区之间的连续切换情况判断用户的动态活动数据,根据各基站扇区或基站扇区交集覆盖区域的响应度、交互频次以及覆盖域对应的参数值在预设的数据库中进行查询获得符合数值要求的基站扇区群ID以及交互信息,具体为根据第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,信令时间和标识地是信令的重要指标,通过发生时间点和业务发生标识地的数据可提取信令所响应基站的动态数据,包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据,再分别提取对应预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值,各数值反映出信令响应基站扇区交互情况,为各基站扇区或基站扇区交集覆盖区域的交互频次、响应度以及覆盖域对应的参数值,最后根据参数值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息,即通过查询获得满足信令响应基站扇区交互预设要求的若干基站扇区或基站扇区交集覆盖区标记定位以及所对应交互信息,再根据这些区域的交互信息进行进一步处理。

根据本发明实施例,所述根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据,具体为:

所述基站扇区交互信息包括基站扇区群集在所述预设时间段内的扇区交集度信息、扇区交集域信息、扇区交集轨迹点信息以及扇区驻留信息;

根据所述基站扇区交互信息提取基站扇区标识动态响应数据,包括扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据;

根据所述扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据输入至训练好的基站扇区栅格动态分布模型中处理获取基站扇区动态栅格数据。

需要说明的是,根据查询获得的目标基站扇区群集在预设时间段内对应的基站扇区交互信息反映出扇区交集频率、扇区交集区域大小、扇区交集轨迹路线点以及扇区或交集区留停时长的信息,通过基站扇区交互信息提取对应的基站扇区标识动态响应数据反映出信令在各扇区和扇区交集区的动态化的交互频次、交互强度、交互域大小、交互轨迹和路径以及交互时长情况,并将扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据输入至训练好的基站扇区栅格动态分布模型中处理获取基站扇区动态栅格数据,即根据基站扇区动态交互情况进行模型处理的数据治理技术手段获得符合基站扇区或交集区动态交互情况相适配的栅格,实现根据信令在扇区的动态交互情况进行栅格化处理获得适配的大小栅格并获取对应基站扇区动态栅格数据,即通过数据治理对基站扇区动态交互情况进行动态栅格化处理,其中,所述基站扇区栅格动态分布模型是根据大量已有历史基站扇区标识动态响应数据和基站扇区动态栅格数据的数据样本进行训练处理获得的栅格动态分布模型,数据样本越丰富则对模型训练得出的处理结果越准确,根据历史样本的基站扇区标识动态响应数据和基站扇区动态栅格数据输入至初始模型中进行自学习得到输出值,若输出值大于预设阈值则学习停止,获得基站扇区栅格动态分布模型。

根据本发明实施例,所述根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据,具体为:

根据所述基站扇区动态栅格数据结合所述扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据计算获得预设时间周期内各时间段节点的轨迹密度数据;

所述轨迹密度数据计算公式为:

其中G为轨迹密度数据,

需要说明的是,根据基站扇区动态栅格数据结合扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据进行计算获得预设时间周期内各时间段节点的轨迹密度数据,即通过对预设时间周期内各时间段节点对应的基站扇区交互域大小、交互轨迹路径、交互时长进行节点数据累积并结合对应的动态栅格数据进行程序化计算处理获得用户的轨迹密度数据,该轨迹密度数据反映出用户在预设时间周期内各时间节点产生的信令交互区域栅格分布情况,即信令交互目标区域的栅格化轨迹密度,该密度数据反映出用户的信令轨迹密度,可衡量用户停驻情况进而识别出用户的人口属性类别。

根据本发明实施例,所述根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别,具体为:

根据所述轨迹密度数据与预设停驻属性阈值进行阈值对比;

根据阈值对比结果对应所述终端用户的停驻属性级别;

根据所述停驻属性级别对应获得所述终端用户所属人口属性类别。

需要说明的是,建立人口的停驻属性数据库,对不同目标用户进行停驻属性识别,根据对应停驻属性级别区分目标用户的常驻属性获得对应所属人口属性类别,如常驻型人口、间歇停驻人口、流动型人口、异常标识人口等,通过停驻属性数据库获取预设的停驻属性阈值,根据终端用户的轨迹密度数据与停驻属性阈值进行阈值对比,通过落入的阈值区间对应得到终端用户的停驻属性级别,再根据停驻属性级别对应人口属性类别,本方案实施例中设置停驻属性阈值区间分布为[0,30),[30,60),[60,85),[85,100],分别对应停驻属性级别一到四级,一到四级分别对应异常标识人口、流动型人口、间歇停驻人口、常驻型人口的人口属性类别,如某用户A的轨迹密度数据对应阈值为62,则其属于[60,85)的阈值区间对应停驻属性级别为三级,即对应人口属性类别为间歇停驻人口。

如图4所示,本发明还公开了基于大数据信令处理的人口识别系统,包括存储器41和处理器42,所述存储器中包括基于大数据信令处理的人口识别方法程序,所述基于大数据信令处理的人口识别方法程序被所述处理器执行时实现如下步骤:

采集获取区域内终端用户的信令数据信息;

根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户;

获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息;

根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据;

根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据;

根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别。

需要说明的是,为识别终端用户的人口属性类别,通过采集预设区域内终端用户的信令数据根据用户在预设时间段内的通讯情况和注册信息、通话情况识别用户的属地属性,区分本地居民和非本地居民以及特殊用户,对本地居民进行排除,将非本地居民和特殊用户标记为第一标记用户进行进一步筛分,再根据信令数据信息获取信令对应基站扇区的动态交互信息,得到用户在时间段内所响应的基站扇区,根据各采集时间节点的基站扇区标识信息和多个扇区交集区域驻停信息获得用户在时间段内通过信令响应信号所属的基站扇区有效区域情况,再将基站扇区相关信息数据利用数据治理技术进行动态栅格化处理,即数据治理是通过训练好的基站扇区栅格动态分布模型进行栅格处理获得动态栅格数据,即根据基站扇区或交集区的有效区域面积大小进行适配栅格化调整处理获得适合的大小栅格并获取对应基站扇区动态栅格数据,再计算获得在一定预设时间周期内的基站扇区栅格化的轨迹密度数据,即各分段时间节点对应的基站扇区栅格在预设时间周期内轨迹动态变化的密度情况,反映出用户在观察时间周期内活动轨迹动态变化情况,再通过预设阈值对比识别出该用户所属人口属性类别,即实现了通过采集用户信令响应的基站扇区动态变化情况通过栅格化处理和计算获得用户在周期时间内的轨迹行动变化情况进而识别出该用户属于哪类属性人口,实现对流动人口属性通过信令数据处理识别的智慧手段。

根据本发明实施例,所述采集获取区域内终端用户的信令数据信息,根据所述信令数据信息识别用户注册信息和通讯表数据,并结合所述终端用户在预设时间段内通讯交互信息筛选出第一标记用户,具体为:

采集目标区域内的用户终端的信令数据信息,包括信令收发信息、信令交互方信息、信令运营载体信息;

根据所述信令收发信息和信令交互方信息识别所述用户终端的用户注册信息,包括用户ID属性信息、用户注册标识信息以及SIM卡信息;

根据所述信令收发信息、信令运营载体信息以及SIM卡信息获取通讯表数据,并提取通讯交互信息;

根据用户注册标识信息、SIM卡信息以及通讯交互信息按照预设范围进行筛选出第一标记用户。

需要说明的是,根据采集的目标区域内用户终端的信令相关数据信息包括交互方、传输、网络、运营商等信息进行用户终端信息识别,获得用户注册地属性、注册标识、注册信息以及SIM卡信息等信息,通过获得的信令收发信息、信令运营载体信息以及SIM卡信息获取用户的通讯表数据即用户信令生成通讯情况并提取通讯交互信息,再根据注册标识信息、SIM卡信息以及通讯交互信息根据需求的预设范围进行筛分出第一标记用户,即通过注册标识、SIM卡信息以及通讯情况根据区域内用户对象的筛分需求进行范围设置获得需要的目标用户,例如,根据C区域的用户情况筛分目标需求将本地注册、本地通讯、机主为本地居民的终端用户筛除,筛选出本地注册、具有本地和外地通话记录以及机主为外地的终端用户作为第一标记用户,通过信令数据信息对用户情况进行识别标记剔除非目标用户人群,筛选出需要的目标用户。

根据本发明实施例,所述获取所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,根据所述信令标识地数据获取对应基站动态扇区交互信息,具体为:

根据所述第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据;

所述信令标识地数据包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据;

根据所述基站交互动态数据、信号响应动态数据以及区域覆盖动态数据分别提取预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值;

根据所述基站交互量次值、信号响应度值以及区域响应覆盖值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息。

需要说明的是,为获取用户在时间段内的动态活动情况,对信令数据进行处理获得信令响应的基站覆盖区域的交互信息,该基站覆盖区域是通过信令在基站扇区之间的连续切换情况判断用户的动态活动数据,根据各基站扇区或基站扇区交集覆盖区域的响应度、交互频次以及覆盖域对应的参数值在预设的数据库中进行查询获得符合数值要求的基站扇区群ID以及交互信息,具体为根据第一标记用户在预设时间段内的信令数据信息提取信令时间数据和信令标识地数据,信令时间和标识地是信令的重要指标,通过发生时间点和业务发生标识地的数据可提取信令所响应基站的动态数据,包括预设时间段内的基站交互动态数据、信号响应动态数据以及区域覆盖动态数据,再分别提取对应预设时间段内基站交互量次值、信号响应度值以及区域响应覆盖值,各数值反映出信令响应基站扇区交互情况,为各基站扇区或基站扇区交集覆盖区域的交互频次、响应度以及覆盖域对应的参数值,最后根据参数值在基站扇区动态响应数据库中进行查询获得符合数值要求的基站扇区群集并获取对应基站扇区交互信息,即通过查询获得满足信令响应基站扇区交互预设要求的若干基站扇区或基站扇区交集覆盖区标记定位以及所对应交互信息,再根据这些区域的交互信息进行进一步处理。

根据本发明实施例,所述根据所述基站动态扇区交互信息提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据,具体为:

所述基站扇区交互信息包括基站扇区群集在所述预设时间段内的扇区交集度信息、扇区交集域信息、扇区交集轨迹点信息以及扇区驻留信息;

根据所述基站扇区交互信息提取基站扇区标识动态响应数据,包括扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据;

根据所述扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据输入至训练好的基站扇区栅格动态分布模型中处理获取基站扇区动态栅格数据。

需要说明的是,根据查询获得的目标基站扇区群集在预设时间段内对应的基站扇区交互信息反映出扇区交集频率、扇区交集区域大小、扇区交集轨迹路线点以及扇区或交集区留停时长的信息,通过基站扇区交互信息提取对应的基站扇区标识动态响应数据反映出信令在各扇区和扇区交集区的动态化的交互频次、交互强度、交互域大小、交互轨迹和路径以及交互时长情况,并将扇区交集度数据、扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据输入至训练好的基站扇区栅格动态分布模型中处理获取基站扇区动态栅格数据,即根据基站扇区动态交互情况进行模型处理的数据治理技术手段获得符合基站扇区或交集区动态交互情况相适配的栅格,实现根据信令在扇区的动态交互情况进行栅格化处理获得适配的大小栅格并获取对应基站扇区动态栅格数据,即通过数据治理对基站扇区动态交互情况进行动态栅格化处理,其中,所述基站扇区栅格动态分布模型是根据大量已有历史基站扇区标识动态响应数据和基站扇区动态栅格数据的数据样本进行训练处理获得的栅格动态分布模型,数据样本越丰富则对模型训练得出的处理结果越准确,根据历史样本的基站扇区标识动态响应数据和基站扇区动态栅格数据输入至初始模型中进行自学习得到输出值,若输出值大于预设阈值则学习停止,获得基站扇区栅格动态分布模型。

根据本发明实施例,所述根据所述第一标记用户的基站扇区动态栅格数据获取预设时间周期内的轨迹密度数据,具体为:

根据所述基站扇区动态栅格数据结合所述扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据计算获得预设时间周期内各时间段节点的轨迹密度数据;

所述轨迹密度数据计算公式为:

其中G为轨迹密度数据,

需要说明的是,根据基站扇区动态栅格数据结合扇区交集域数据、扇区轨迹流量数据以及扇区驻停数据进行计算获得预设时间周期内各时间段节点的轨迹密度数据,即通过对预设时间周期内各时间段节点对应的基站扇区交互域大小、交互轨迹路径、交互时长进行节点数据累积并结合对应的动态栅格数据进行程序化计算处理获得用户的轨迹密度数据,该轨迹密度数据反映出用户在预设时间周期内各时间节点产生的信令交互区域栅格分布情况,即信令交互目标区域的栅格化轨迹密度,该密度数据反映出用户的信令轨迹密度,可衡量用户停驻情况进而识别出用户的人口属性类别。

根据本发明实施例,所述根据所述轨迹密度数据通过停驻属性阈值对比对所述终端用户进行停驻属性识别筛选出人口属性类别,具体为:

根据所述轨迹密度数据与预设停驻属性阈值进行阈值对比;

根据阈值对比结果对应所述终端用户的停驻属性级别;

根据所述停驻属性级别对应获得所述终端用户所属人口属性类别。

需要说明的是,建立人口的停驻属性数据库,对不同目标用户进行停驻属性识别,根据对应停驻属性级别区分目标用户的常驻属性获得对应所属人口属性类别,如常驻型人口、间歇停驻人口、流动型人口、异常标识人口等,通过停驻属性数据库获取预设的停驻属性阈值,根据终端用户的轨迹密度数据与停驻属性阈值进行阈值对比,通过落入的阈值区间对应得到终端用户的停驻属性级别,再根据停驻属性级别对应人口属性类别,本方案实施例中设置停驻属性阈值区间分布为[0,30),[30,60),[60,85),[85,100],分别对应停驻属性级别一到四级,一到四级分别对应异常标识人口、流动型人口、间歇停驻人口、常驻型人口的人口属性类别,如某用户A的轨迹密度数据对应阈值为62,则其属于[60,85)的阈值区间对应停驻属性级别为三级,即对应人口属性类别为间歇停驻人口。

本发明第三方面提供了一种可读存储介质,所述可读存储介质中包括基于大数据信令处理的人口识别方法程序,所述基于大数据信令处理的人口识别方法程序被处理器执行时,实现如上述任一项所述的基于大数据信令处理的人口识别方法的步骤。

本发明公开的基于大数据信令处理的人口识别方法、系统及存储介质,通过终端用户的信令数据信息识别用户注册信息和通讯表数据筛选出第一标记用户并提取信令时间数据和信令标识地数据获取基站动态扇区交互信息,提取基站扇区标识动态响应数据并根据基站扇区栅格动态分布模型获取对应基站扇区动态栅格数据计算获得时间周期内的轨迹密度数据,根据轨迹密度数据进行阈值对比筛选人口属性类别;从而基于大数据信令技术对终端用户信令数据处理获取基站扇区数据和栅格数据计算获得轨迹密度数据对人口属性进行识别,实现根据信令数据进行用户轨迹驻停情况识别判断所属人口属性技术,提高对区域内流动人口属性识别判断的精准度。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

技术分类

06120115939261