掌桥专利:专业的专利平台
掌桥专利
首页

一种高密度群体轨迹数据的微观可视分析方法

文献发布时间:2023-06-19 10:08:35


一种高密度群体轨迹数据的微观可视分析方法

技术领域

本发明涉及一种高密度群体轨迹数据的微观可视分析方法。

背景技术

人类的生产活动会持续产生大量的时空轨迹数据,充分挖掘时空轨迹数据中隐藏的模式,能够帮助了解人类生产和生活规律。许多学科的研究都涉及了时空轨迹数据,例如,经济学家基于移民流量数据研究了地域经济变化,疾病学家基于人口流动数据研究了疾病在地区和国家之间的传播。

轨迹数据的可视化工作一直以来都是可视化领域的一个重要的挑战,它不仅需要从宏观角度展示时空上的情境,还需要从微观的角度展示某时刻的多维信息。分析轨迹数据的微观变化对资源精细化调整、评估资源精准配置的合理性以及细微模式发现至关重要。许多研究人员对时空轨迹数据的研究重点是从宏观的角度进行探索,然而缺乏对高密度小区域内的个体行为展开的深入分析。例如,将轨迹记录点都映射为最近的街道名称,使用文本分析方法提取出租车数据的话题,从多维度探索微观交通模式和异常行为等。然而这些方法不能同时分析多个交叉口的交通数据,并且当个体间较密集且有规律地频繁移动时,它不能展示轨迹之间的潜在关系。因此,可视化高密度群体轨迹数据来帮助用户理解数据仍然是一个主要的难点。

发明内容

为了克服现有技术的不足,展示轨迹数据在时间、空间等不同维度上的分布情况,展示各个群体之间的时序差异性以及群体的演化趋势,探究高密度群体内部个体之间的差异和详细轨迹信息,探索潜在的异常事件。本发明提出一种多视图结合的可视分析系统以探索和分析高密度群体的微观演化情况。

为了解决上述技术问题,本发明提供如下的技术方案:

一种高密度群体轨迹数据的微观可视分析方法,所述方法包括以下步骤:

1)数据处理;考虑空间属性位置序列表征了轨迹的特征具有实际的意义,为了提高轨迹数据的可扩展性以及提高运行速度,根据空间属性特征将空间进行多层次划分以及热度计算,从而将轨迹数据转化为基于网格热度的空间事件序列;

(1-1)活跃度计算;人流量信息能反映区域间的流动量,但无法描述群体内部人员的移动信息;活跃度

其中:

(1-2)轨迹数据集分析;个体的轨迹信息为S

2)可视分析;在通过以上步骤完成数据处理以后,提供的可视化分析原型组件对高密度群体轨迹数据进行交互式探索和分析;包括4部分:基于small-multiples的特征统计视图,展示高密度轨迹数据在时间和空间维度上的特征分布;采用多分辨率河流视图支持从多层次聚合角度展示高密度轨迹数据的变化;采用轨迹投影视图揭示高密度群体轨迹间的相关性;采用多层次空间地图以展示高密度轨迹数据的具体分布情况;

3)基于高密度群体轨迹数据的模式分析;探索轨迹中坐标转变频率,分析高密度群体内部活跃度;通过改变阈值来快速锁定人流突变节点,根据图元标识符的多分辨率河流视图提前做好应对策略;同时根据个体微观移动轨迹推断异常现象,从而加强对人员的管理。

进一步,所述步骤2)中的过程如下:

(2-1)提供基于small-multiples的特征统计视图分析

对轨迹数据根据空间区域进行四分位统计处理,将每个区域的数据分为最小值、中位数、最大值以及离群值等;采用直方图可视化每个特征的时序流量,采用盒图可视化数据的空间分布特征,将两者结合直观地展示轨迹数据在时间和空间维度上的分布,帮助用户理解数据;

(2-2)提供基于网格轨迹热度的空间层次分布地图

空间层次分布地图系统中提供2种模式,结合视图呈现,帮助用户对群体轨迹数据从概览其分布到具体理解其详细信息:轨迹空间层次分布模式;层次结构是根据空间的属性进行划分;基于网格热度的轨迹图模式;将轨迹数据的原始数据进行可视编码,包括路径、方向、速度和停留时间;不同的颜色编码轨迹不同的日期,线条重叠表示两天及以上具有相同的轨迹路线;本发明采用圆映射人员在相应的位置停留的时间,半径越大,表示停留时间越长,采用三角形映射人员的移动速度,三角形越大,表示移动速度越快;提示栏显示个体的状态,采用动画的方式显示相关个体的移动方向和速度;

(2-3)提供基于MDS的轨迹投影视图分析

使用Levenshtein距离计算轨迹之间的相似度,将两个基于网格热度的两个序列之间的距离定义为“将一个序列转换为另一个序列所需的插入、编辑和删除操作的次数”;若a,b的轨迹序列分别为S

i和j分别代表时间段内的事件序列下标;如果两个事件相同,a

基于式(3)的相似度距离计算,采用MDS算法,将轨迹数据降维并投影到二维平面形成散点图,散点图中的点代表一条轨迹,两点之间的距离代表个体之间的相似度,距离越小代表相似度越高,关系越密切;投影视图帮助用户从概览的角度了解群体之间的相似性与差异性,用户可以通过点击对应的点查看该轨迹的具体路线;构建字形来展示集群特征:利用DBSCAN聚类算法发现集群并定位集群的中心点;进一步通过南丁格尔玫瑰图构建字形:内圆半径代表簇的大小,扇形的颜色代表特征,扇形的大小代表空间特征的贡献度,用户通过字形概览数据的整体分布,获得集群的特征;考虑用户不同的需求,系统支持用户交互式设置面板的参数,以获得适合的集群模式;采用拉索的交互技术探索群体,以弹出框的形式构建了像素轨迹图,展示了感兴趣群体的细节信息,来帮助用户进行个体之间的比较;为了缓解视觉上的混乱,像素轨迹图展示了不同轨迹的时序信息,将空间属性用颜色进行可视化映射,色块的颜色代表空间区域横坐标代表时间,纵坐标为个体编号,用色块的颜色和宽度分别映射区域和逗留时间;

(2-4)提供多分辨率河流图分析

使用图元嵌入的多分辨率河流图,在不同聚合层次上展示数据在时间和空间维度上的信息演变趋势以及突显特殊模式;它的层次结构数目是由轨迹数据的空间分层结构决定的,可以由多个层次结构组成;采用较低层次且拥有较高分辨率的结构可查看局部详细信息,采用较高层次且分辨率较低的结构可概览整体;为了使得层次结构的转变过程缓和,在高、低层数据结构中间加入缓和层;在多分辨率河流视图中显示了2个层次的结构,最高和最低层次;而实际中的层次结构会则是多层;因此为了处理多层次的结构数据,提高系统的可扩展性,本视图在上下文区域中显示高层次结构,在详细层中显示最低层次结构;

多分辨率河流视图展示了不同时空聚合度的时序演化情况;通过拖动滑动条的操作方式,观察最低层次结构下的数据演变的细节信息,效率较低,当时间序列较大时,不能快速精准地筛选到特殊目标信息;因此基于MultiStream构建嵌入式图元来表示急剧增加/减少的特定时刻;若当前时刻数据为C

根据用户设定的急增/急减阈值(分别为T

系统根据获取的急增/急减点的信息,在河流视图的对应区域嵌入图元;用户通过图元的位置快速且准确地捕捉到关键信息节点,缩减探索时间;多分辨率河流图中具有以下功能:层次聚合;为了探索高密度群体轨迹数据在不同的聚合层次的时序演变趋势,系统支持用户浏览层次结构;高亮图元;为了提高用户探索效率,快速发现数据中隐藏的模式,系统自动突显数据的关键点,支持用户自定义调整阈值并定位出急剧增加/减少的区域和时间段;其中红色上升图元表示高于设定的上升阈值,绿色下降图元表示高于设定的下降阈值;由分析可知,图元常出现于峰值或低谷处前;所以图元不仅具有提高探索效率的作用,而且还具有预测的作用,帮助用户提前做好应对策略。

优选的,所述步骤3)中,通过对测试数据的多次检测,验证了系统的有效性。可以帮助用户更好地探索时空轨迹数据的潜在模式,过程如下:

(3-1)群体活跃度探索

探索轨迹中坐标转变频率,对高密度群体内部活跃度的分析具有重要意义。通过对学术会议参会人员轨迹数据集的分析,从群体活跃度演化趋势概览图对比两个峰值发现,在10:44左右黑色框区域热度较小、活跃度较低,且前后时刻维持热度大、活跃度较高的状态。因此,推测参会者从出入口涌入、涌出、再涌入,导致在较短时间内群体活跃度出现2个峰值。为了进一步探究该区域的活跃度在时序上的演变趋势,结合过渡层和详细层,黑色框内的活跃度变化较大,呈U字形,而该时间段内热力图分布变化较小,尤其是10:14左右。人员密度较大而活跃度较小,推测2个峰值之间的时间段内,举办了大型的会议活动,在2个峰值时间段内出现人员聚集。通过拉索选中轨迹投影视图中某位参会人员轨迹路线,发现在签到处具有半径较大的圆,因此该人员为签到工作人员。通过多个工作人员微观轨迹信息总结得出,工作人员在工作期间在各自岗位长时间停留,非工作时间在room6区域逗留,推测room6为工作室。对群体活跃度的探索可以为人员管理和资源配置提供依据。

(3-2)基于流量分析的异常事件探索

考虑人流量大于一定阈值时容易发生踩踏事故,本发明通过改变阈值来快速锁定人流突变节点。对公园来访者数据集进行分析,在多分辨率河流图的高聚合层区域,表示游戏区域人流量变化的条带高度大于表示餐厅和休息区的条带高度,据此分析人员进入公园后更倾向于参加一些游戏项目。同时发现在出入口出现突变点,点击对应时刻的河流图可得到该时刻的热力图,显示B,C出入口区域人流量差别比较大,推测此情况是由于大量游客在早高峰时期进入公园,并且前者比后者距离娱乐项目近。因此,建议公园应该在偏远的出入口附近增加一些娱乐项吸引来访者,以缓解大量来访者在B出入口打卡造成的拥挤压力。在详细层点击条带的急增/减点能快速锁定人员密度异常的现象。例如,点击某区域条带的急增点,得到该区域的热力图,结合前后时间段的热力图分布发现,16:00出现大量游客涌入该区域的异常现象,建议举办方加强对热门区域的管理。因此,热力图分布特征能够帮助举办方合理且精准地分配人力资源,如在人流密度较高区域分配较多的工作人员。图元标识符通常出现在区域流量较高之前,用户能够根据图元出现的时间和地点,提前做好应对策略。例如,在红色上升图元时刻通常出现大量人员涌入,相关人员应该在对应区域分配较多的服务人员;在绿色下降图元时刻通常出现大量人员涌出,相关人员应该在对应的区域做好疏散等工作。同时,本发明根据个体微观移动轨迹推断异常现象,如移动速度异常,相关人员通过轨迹信息判断人员轨迹异常,从而加强对人员的管理。

本发明的技术构思是:为了针对高密度小区域内的个体轨迹数据展开深入分析,分析轨迹数据的微观变化以实现对资源的精细化调整和对资源配置的合理性评估,帮助用户探索时空轨迹数据中的潜在模式;本发明将这一工作分为数据处理、可视化分析和系统实用性探索三大模块:数据处理模块主要实现数据处理和分层,本发明通过计算空间的时序流量来揭示数据的时空特征,以及计算轨迹之间的相似度来揭示数据之间隐藏的相互关系;在可视分析模块构建了多种视图,包括特征统计视图,空间层次分布地图,投影轨迹视图,多分辨率河流视图,并通过丰富的交互使用户得以深入探索轨迹数据。基于small-multiples的特征统计视图,展示轨迹数据在时间和空间维度上的特征分布;采用多分辨率河流视图支持从多层次聚合角度展示轨迹数据的变化;采用轨迹投影视图揭示高密度群体轨迹间的相关性;采用多层次空间地图以展示轨迹数据的具体分布情况。系统实用性探索模块以现实数据集探索了群体活跃度和基于流量分析的异常事件。

本发明构建了一个B/S架构下基于Web平台的可视分析系统以探索轨迹数据,利用流行的d3.js进行绘制可视化组件,与传统的关注于轨迹数据的宏观可视分析不同,本发明提出了针对高密度群体轨迹数据的微观演化情况的探索和分析;用户可以通过可视化组件以及交互式工具,从不同的角度进行细粒度的时空轨迹数据分析,从场景内人员真实的轨迹数据出发,探索时空轨迹数据中的潜在模式和微观演化情况。

本发明的有益效果主要表现在:融合了多维度多层级探索的方法,构建一套交互式可视化分析系统,允许用户交互式探索高密度群体轨迹数据;应用到真实场景中,可以对时空轨迹数据的潜在模式进行探索,例如群体活跃度分析、流量分析、异常事件探索等,为群体行为画像,为资源配置提供依据,为后续高密度群体轨迹数据的可视分析提供一种解决思路。

附图说明

图1为本发明的系统框架概览图;

图2为本发明的特征分布统计视图;

图3为本发明的投影轨迹视图;

图4为本发明的字形位置确定过程图;

图5为本发明的各层次活跃度演进视图;

图6为本发明的不同空间聚合度下群体流量的时序演化图;

具体实施方案

下面结合附图对本发明作进一步说明;

参照图1~图6,一种高密度群体轨迹数据的微观可视分析方法,本发明采用D3.js来绘制前端界面,后台数据通过Java获取;

所述高密度群体轨迹数据的微观可视分析方法,包括以下步骤:

1)数据处理;考虑空间属性位置序列表征了轨迹的特征具有实际的意义,为了提高轨迹数据的可扩展性以及提高运行速度,根据空间属性特征将空间进行多层次划分以及热度计算,从而将轨迹数据转化为基于网格热度的空间事件序列;

(1-1)活跃度计算;人流量信息能反映区域间的流动量,但无法描述群体内部人员的移动信息;活跃度

其中:

(1-2)轨迹数据集分析;个体的轨迹信息为S

2)可视分析;在通过以上步骤完成数据处理以后,通过系统提供的可视化组件对高密度群体轨迹数据进行交互式探索和分析;过程如下:

(2-1)提供基于small-multiples的特征统计视图分析

对轨迹数据根据空间区域进行四分位统计处理,将每个区域的数据分为最小值、中位数、最大值以及离群值等;采用直方图可视化每个特征的时序流量,采用盒图可视化数据的空间分布特征,将两者结合直观地展示轨迹数据在时间和空间维度上的分布,帮助用户理解数据;

(2-2)提供基于网格轨迹热度的空间层次分布地图

空间层次分布地图系统中提供2种模式,结合视图呈现,帮助用户对群体轨迹数据从概览其分布到具体理解其详细信息:轨迹空间层次分布模式;层次结构是根据空间的属性进行划分(如结构属性、功能属性);基于网格热度的轨迹图模式;将轨迹数据的原始数据进行可视编码,包括路径、方向、速度和停留时间等;不同的颜色编码轨迹不同的日期,线条重叠表示两天及以上具有相同的轨迹路线;采用圆映射人员在相应的位置停留的时间,半径越大,表示停留时间越长,采用三角形映射人员的移动速度,三角形越大,表示移动速度越快;提示栏显示个体的状态,采用动画的方式显示相关个体的移动方向和速度;

(2-3)提供基于MDS的轨迹投影视图分析

使用Levenshtein距离计算轨迹之间的相似度;此度量标准是将两个基于网格热度的两个序列之间的距离定义为“将一个序列转换为另一个序列所需的插入、编辑和删除操作的次数”;若a,b的轨迹序列分别为S

i和j分别代表时间段内的事件序列下标;如果两个事件相同,a

基于式(3)的相似度距离计算,采用MDS算法,将轨迹数据降维并投影到二维平面形成散点图,散点图中的点代表一条轨迹,两点之间的距离代表个体之间的相似度,距离越小代表相似度越高,关系越密切;投影视图帮助用户从概览的角度了解群体之间的相似性与差异性,用户可以通过点击对应的点查看该轨迹的具体路线;构建字形来展示集群特征:利用DBSCAN聚类算法发现集群并定位集群的中心点;进一步通过南丁格尔玫瑰图构建字形:内圆半径代表簇的大小,扇形的颜色代表特征,扇形的大小代表空间特征的贡献度,用户通过字形概览数据的整体分布,获得集群的特征;考虑用户不同的需求,系统支持用户交互式设置面板的参数,以获得适合的集群模式;采用拉索的交互技术探索群体,以弹出框的形式构建了像素轨迹图,展示了感兴趣群体的细节信息,来帮助用户进行个体之间的比较;为了缓解视觉上的混乱,像素轨迹图展示了不同轨迹的时序信息,将空间属性用颜色进行可视化映射,色块的颜色代表空间区域横坐标代表时间,纵坐标为个体编号,用色块的颜色和宽度分别映射区域和逗留时间;

(2-4)提供多分辨率河流图分析

使用图元嵌入的多分辨率河流图,在不同聚合层次上展示数据在时间和空间维度上的信息演变趋势以及突显特殊模式(如峰值);它的层次结构数目由轨迹数据的空间分层结构决定的,可以由多个层次结构组成;采用较低层次且拥有较高分辨率的结构可查看局部详细信息,采用较高层次且分辨率较低的结构可概览整体;为了使得层次结构的转变过程缓和,在高、低层数据结构中间加入缓和层;在多分辨率河流视图中显示了2个层次的结构,最高和最低层次;而实际中的层次结构会则是多层;因此为了处理多层次的结构数据,提高系统的可扩展性,本视图在上下文区域中显示高层次结构,在详细层中显示最低层次结构;

多分辨率河流视图展示了不同时空聚合度的时序演化情况;通过拖动滑动条的操作方式,观察最低层次结构下的数据演变的细节信息,效率较低,当时间序列较大时,不能快速精准地筛选到特殊目标信息;因此基于MultiStream构建嵌入式图元来表示急剧增加/减少的特定时刻;若当前时刻数据为C

根据用户设定的急增/急减阈值(分别为T

系统根据获取的急增/急减点的信息,在河流视图的对应区域嵌入图元;用户通过图元的位置快速且准确地捕捉到关键信息节点,缩减探索时间;多分辨率河流图中具有以下功能:层次聚合;为了探索高密度群体轨迹数据在不同的聚合层次的时序演变趋势,系统支持用户浏览层次结构;高亮图元;为了提高用户探索效率,快速发现数据中隐藏的模式,系统自动突显数据的关键点,支持用户自定义调整阈值并定位出急剧增加/减少的区域和时间段;其中红色上升图元表示高于设定的上升阈值,绿色下降图元表示高于设定的下降阈值;由分析可知,图元常出现于峰值或低谷处前;所以图元不仅具有提高探索效率的作用,还具有预测的作用,可帮助用户提前做好应对策略;

3)基于高密度群体轨迹探索的模式分析

通过对测试数据的多次检测,验证了系统的有效性,可以帮助用户更好地探索时空轨迹数据的潜在模式,过程如下:

(3-1)群体活跃度探索

探索轨迹中坐标转变频率,对高密度群体内部活跃度的分析具有重要意义。通过对学术会议参会人员轨迹数据集的分析,从群体活跃度演化趋势概览图对比两个峰值发现,在10:44左右黑色框区域热度较小、活跃度较低,且前后时刻维持热度大、活跃度较高的状态。因此,推测参会者从出入口涌入、涌出、再涌入,导致在较短时间内群体活跃度出现2个峰值。为了进一步探究该区域的活跃度在时序上的演变趋势,结合过渡层和详细层,黑色框内的活跃度变化较大,呈U字形,而该时间段内热力图分布变化较小,尤其是10:14左右。人员密度较大而活跃度较小,推测2个峰值之间的时间段内,举办了大型的会议活动,在2个峰值时间段内出现人员聚集。通过拉索选中轨迹投影视图中某位参会人员轨迹路线,发现在签到处具有半径较大的圆,因此该人员为签到工作人员。通过多个工作人员微观轨迹信息总结得出,工作人员在工作期间在各自岗位长时间停留,非工作时间在room6区域逗留,推测room6为工作室。对群体活跃度的探索可以为人员管理和资源配置提供依据。

(3-2)基于流量分析的异常事件探索

考虑人流量大于一定阈值时容易发生踩踏事故,本发明通过改变阈值来快速锁定人流突变节点。对公园来访者数据集进行分析,在多分辨率河流图的高聚合层区域,表示游戏区域人流量变化的条带高度大于表示餐厅和休息区的条带高度,据此分析人员进入公园后更倾向于参加一些游戏项目。同时发现在出入口出现突变点,点击对应时刻的河流图可得到该时刻的热力图,显示B,C出入口区域人流量差别比较大,推测此情况是由于大量游客在早高峰时期进入公园,并且前者比后者距离娱乐项目近。因此,建议公园应该在偏远的出入口附近增加一些娱乐项吸引来访者,以缓解大量来访者在B出入口打卡造成的拥挤压力。在详细层点击条带的急增/减点能快速锁定人员密度异常的现象。例如,点击某区域条带的急增点,得到该区域的热力图,结合前后时间段的热力图分布发现,16:00出现大量游客涌入该区域的异常现象,建议举办方加强对热门区域的管理。因此,热力图分布特征能够帮助举办方合理且精准地分配人力资源,如在人流密度较高区域分配较多的工作人员。图元标识符通常出现在区域流量较高之前,用户能够根据图元出现的时间和地点,提前做好应对策略。例如,在红色上升图元时刻通常出现大量人员涌入,相关人员应该在对应区域分配较多的服务人员;在绿色下降图元时刻通常出现大量人员涌出,相关人员应该在对应的区域做好疏散等工作。同时,本发明根据个体微观移动轨迹推断异常现象,如移动速度异常,相关人员通过轨迹信息判断人员轨迹异常,从而加强对人员的管理。

本发明构建了一个B/S架构下基于Web平台的可视分析系统以探索轨迹数据,利用流行的d3.js进行绘制可视化组件,与传统的关注于轨迹数据的宏观可视分析不同,本发明提出了针对高密度群体轨迹数据的微观演化情况的探索和分析;用户可以通过可视化组件以及交互式工具,从不同的角度进行细粒度的时空轨迹数据分析,从场景内人员真实的轨迹数据出发,探索时空轨迹数据中的潜在模式和微观演化情况。

本实施例融合了多维度多层级探索的方法,构建一套交互式可视化分析系统,允许用户交互式探索高密度群体轨迹数据;应用到真实场景中,可以对时空轨迹数据的潜在模式进行探索,例如群体活跃度分析、流量分析、异常事件探索等,为群体行为画像,为资源配置提供依据,为后续高密度群体轨迹数据的可视分析提供一种解决思路。

相关技术
  • 一种高密度群体轨迹数据的微观可视分析方法
  • 一种基于用户轨迹数据的群体聚集模式分析方法和系统
技术分类

06120112437221