掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据时空标识与关联分析的方法

文献发布时间:2023-06-19 18:37:28


一种基于大数据时空标识与关联分析的方法

技术领域

本发明涉及大数据领域,具体涉及一种基于大数据时空标识与关联分析的方法。

背景技术

传统方法采集的人脸、声纹、实体和其他结构化数据存在数据孤立的问题。例如,虽然采集到了人脸,但是人脸的身份难以确定。

公开号为CN106096631A,公开日为2016-11-09的中国发明专利,公开了一种基于手机大数据的流动人口分类识别分析方法,利用大数据从行为轨迹中提取客观时空信息进行分析挖掘,从空间及时间维度,对人口流动进行观察及识别,区分流动人口群体,并基于该群体行为特征及逗留时长,并从数据使用者的角度考量流动人口不同分类,将其区分为长期流动人口、短期流动人口及短时入境人口。

该技术方案仅仅能够对一定区域内的流动人口进行统计,不能进行多维度的分析。

发明内容

有鉴于此,为解决上述技术问题,本发明的目的在于提出一种基于大数据时空标识与关联分析的方法,其能够提升数据分析价值,在关联分析中,对实体与属性的关联识别更为精准。

所采用的技术方案为:

一种基于大数据时空标识与关联分析的方法,包括如下步骤:

S1.利用智能采集设备采集不同方面的各个数据,形成大数据;

S2.对于形成的大数据基于深度学习后进行时空标识;

S3.对时空标识的大数据进行多维度关联分析。

进一步地,S1中,各个方面的数据包括结构化数据和非结构化数据。

进一步地,所述结构化数据包括经纬度、电子设备I D和操作信息;所述非结构化数据包括视频信息、图像信息和声音信息。

进一步地,S2中,将大数据进行预处理,作为神经网络的输入,利用深度学习进行实体识别和归一化处理,基于同一时空进行数据标识。

进一步地,将实体的各个相关的结构化和非结构化的属性数据进行聚类关联,进行多维度分析。

本发明的有益效果在于:

本发明通过对时空标识的大数据进行多维度关联分析,充分挖掘数据的关联关系,利用关联关系对实体进行多维度分析,从而提升数据分析价值,在关联分析中,对实体与属性的关联识别更为精准。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为一种基于大数据时空标识与关联分析的方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明优选的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1所示,一种基于大数据时空标识与关联分析的方法,包括如下步骤:

S1.利用智能采集设备采集不同方面的各个数据,形成大数据。

不同方面的各个数据包括结构化数据和非结构化数据。结构化数据包括经纬度、电子设备I D和操作信息;非结构化数据包括视频信息、图像信息和声音信息。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。与结构化数据相对的是不适于由数据库二维表来表现的非结构化数据,包括所有格式的视频信息、图像信息和声音信息等。

S2.对于形成的大数据基于深度学习后进行时空标识。

具体的,将大数据进行预处理,作为神经网络的输入,利用深度学习进行实体识别和归一化处理,基于同一时空进行数据标识。

时空标记,能更好地聚类分析,而且搜索支持时空标记,可以方便识别分类,判断相关性。

S3.对时空标识的大数据进行多维度关联分析。

将实体的各个相关的结构化和非结构化的属性数据进行聚类关联,进行多维度分析。

多维度分析包括数据碰撞分析和数据统计分析。

数据碰撞分析包括时空数据碰撞分析和混合轨迹分析。以图像、属性、时间为碰撞范围,获取命中的数据,通过地图显示,支持根据时间范围、区域、采集前端进行筛选检索。混合轨迹伴随分析选择特定时段、区域,可分析该时段区域内实体和属性同时同地出现的伴随情况。

数据统计分析包括采集量统计、档案统计、采集点位统计研究实体属性关联置信度。对所有接入的采集数据分时段按照数据类别统计,包括图数量、属性数量、形成的档案数量、前端采集点位数量和采集量。实体属性关联置信度基于实体属性关联次数,通过关联率算法,依据关联率取值区间给出关联置信度。

关联率P1的计算:

P=X(实体关联次数)÷Y(属性关联次数)x100%

关联率P2的计算:

P2=Y(属性关联次数)÷(实体关联次数)x100%

实体属性关联有两个方向的关联率:一是由实体到属性的关联率,即上述计算方法P1;二是由属性到实体的关联率,按照上述方法取关联次数与实体出现次数比值可得,即上述计算方法P2。

从而本发明通过对时空标识的大数据进行多维度关联分析,充分挖掘数据的关联关系,利用关联关系对实体进行多维度分析,从而提升数据分析价值,在关联分析中,对实体与属性的关联识别更为精准。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施例的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施例或变更均应包含在本发明的保护范围之内。

技术分类

06120115629185