掌桥专利:专业的专利平台
掌桥专利
首页

一种基于无人巡检的轨道交通运维数据采集方法及装置

文献发布时间:2024-04-18 19:54:45


一种基于无人巡检的轨道交通运维数据采集方法及装置

技术领域

本发明涉及数据采集技术领域,具体而言,涉及一种基于无人巡检的轨道交通运维数据采集方法及装置。

背景技术

随着云计算、大数据、物联网、人工智能、5G、BIM等新兴信息技术的飞速发展,“智能+”技术体系开始被工业领域广泛接纳,为城市轨道交通维护提供新的技术手段。智能运维是指利用先进的检测监测、云计算、物联网、大数据、人工智能等技术手段,推动轨道交通运维模式智能化升级,提高轨道交通运营设备日常运营维护、故障诊断的能力。

目前,一般是通过人工巡检的方式,从轨道交通运营设备,例如,轨道列车的服务器的接口读取布设在轨道列车上的传感器采集的各轨道交通运维数据,带回轨道中继设备进行分析。但目前的轨道交通场景,具有场景复杂、移动高速、电磁环境恶劣、服务质量要求严苛等特征,因此,人工巡检的方式,不仅数据采集效率低,不能满足轨道交通场景的运营需求,还极易造成缺检漏检等问题。

发明内容

有鉴于此,本发明的目的在于提供基于无人巡检的轨道交通运维数据采集方法及装置,以提升数据采集效率。

第一方面,本发明实施例提供了基于无人巡检的轨道交通运维数据采集方法,包括:

在轨道侧布设无人巡检设备,在无人巡检设备中,设置钩子;

在设置的钩子上挂载伯克利数据包过滤器,在所述伯克利数据包过滤器中,设置服务器标识以及可扩展标记语言数据包优化策略;

按照预先设置的采集周期,触发所述钩子,以使钩子上挂载的伯克利数据包过滤器应用程序运行,依据所述可扩展标记语言数据包优化策略,从设置的服务器标识对应的服务器采集轨道交通运维数据;

通过多路传输方式,将采集的轨道交通运维数据上传至中继设备,以使中继设备依据动态调整的采集缓存单元窗口接收

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,

所述依据动态调整的采集缓存单元窗口接收多路传输的数据,包括:

依据包往返在途时间、中继设备处理时间以及信道时延,确定平均采集窗口时间;

基于平均采集窗口时间以及当前网络环境的平均传输速率,确定采集缓存单元窗口,依据所述采集缓存单元窗口接收多路传输的数据。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,在所述确定采集缓存单元窗口之后,依据所述采集缓存单元窗口接收多路传输的数据之前,所述方法还包括:

统计当前周期内处理请求包和响应包的逻辑乱序比例,依据统计的逻辑乱序比例以及预先设置的逻辑乱序包最小允许比例、逻辑乱序包最大允许比例,对确定的采集缓存单元窗口进行调整,以依据进行调整的采集缓存单元窗口接收多路传输的数据。

结合第一方面、第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述方法还包括:

针对每一无人巡检设备,从该无人巡检设备采集的轨道交通运维数据中,提取标识有预先设定的目标人员对应的轨道交通运维数据;

针对每一目标人员对应的轨道交通运维数据,获取该目标人员的通信行为特征向量;

对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心;

针对每一聚类中心,依据该聚类中心包含的目标人员的通信行为特征向量,计算目标人员的异常行为因子,依据计算得到的目标人员的异常行为因子与预先设置的第一异常行为因子阈值,确定通信行为异常的目标人员。

结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述获取该目标人员的通信行为特征向量包括:

基于目标人员对应的轨道交通运维数据,获取该目标人员的小时通信业务量,基于小时通信业务量构建日通信行为特征向量;

在预设时长内,基于同一时段的小时通信业务量进行均值计算,得到小时均值通信业务量,基于小时均值通信业务量,构建通信行为特征向量。

结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心,包括:

初始化各通信行为特征向量为预设第一阈值个模糊类;

针对每一通信行为特征向量,计算该通信行为特征向量分别与各模糊类的距离;

基于通信行为特征向量分别与各模糊类的距离,计算该通信行为特征向量分别与各模糊类的隶属度;

基于通信行为特征向量与模糊类的距离、隶属度以及预先设置的聚类目标函数,获取聚类中心。

结合第一方面、第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述在无人巡检设备中,设置钩子,包括:

在无人巡检设备装载有现场可编程逻辑门阵列的网卡硬件中,设置钩子。

第二方面,本发明实施例提供了基于无人巡检的轨道交通运维数据采集装置,包括:

布设模块,用于在轨道侧布设无人巡检设备,在无人巡检设备中,设置钩子;

采集设置模块,用于在设置的钩子上挂载伯克利数据包过滤器,在所述伯克利数据包过滤器中,设置服务器标识以及可扩展标记语言数据包优化策略;

数据采集模块,用于按照预先设置的采集周期,触发所述钩子,以使钩子上挂载的伯克利数据包过滤器应用程序运行,依据所述可扩展标记语言数据包优化策略,从设置的服务器标识对应的服务器采集轨道交通运维数据;

数据上传模块,用于通过多路传输方式,将采集的轨道交通运维数据上传至中继设备,以使中继设备依据动态调整的采集缓存单元窗口接收多路传输的数据。

第三方面,本发明实施例提供了计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述的基于无人巡检的轨道交通运维数据采集方法的步骤。

第四方面,本发明实施例提供了计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述的基于无人巡检的轨道交通运维数据采集方法的步骤。

本发明实施例提供的基于无人巡检的轨道交通运维数据采集方法及装置,包括:在轨道侧布设无人巡检设备,在无人巡检设备中,设置钩子;在设置的钩子上挂载伯克利数据包过滤器,在所述伯克利数据包过滤器中,设置服务器标识以及可扩展标记语言数据包优化策略;按照预先设置的采集周期,触发所述钩子,以使钩子上挂载的伯克利数据包过滤器应用程序运行,依据所述可扩展标记语言数据包优化策略,从设置的服务器标识对应的服务器采集轨道交通运维数据;通过多路传输方式,将采集的轨道交通运维数据上传至中继设备,以使中继设备依据动态调整的采集缓存单元窗口接收。这样,通过在设置的无人巡检设备上采用可扩展标记语言数据包优化策略,可以进行高速流量采集,同时,依据动态调整的采集缓存单元窗口进行多路数据接收,能够有效提升数据采集效率。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的基于无人巡检的轨道交通运维数据采集方法流程示意图;

图2示出了本发明实施例所提供的基于无人巡检的轨道交通运维数据采集装置结构示意图;

图3为本申请实施例提供的一种计算机设备300的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种基于无人巡检的轨道交通运维数据采集方法及装置,下面通过实施例进行描述。

图1示出了本发明实施例所提供的基于无人巡检的轨道交通运维数据采集方法流程示意图。如图1所示,该方法包括:

步骤101,在轨道侧布设无人巡检设备,在无人巡检设备中,设置钩子;

本发明实施例中,在轨道侧布设无人巡检设备,并对无人巡检设备进行配置,用以与列车上的服务器进行通信,以使无人巡检设备能够自动从服务器采集轨道交通运维数据。其中,列车上布设的各传感器对列车的运维进行监测,获取相应的轨道交通运维数据,传输至该列车上设置的服务器进行存储。

本发明实施例中,在轨道交通环境中,每列列车都部署有大量高性能传感器,用以实时获取轨道交通运维数据,通过在每段轨道部署无人巡检设备。无人巡检设备用以对列车中传感器获取的轨道交通运维数据进行实时全流量采集,并将采集的轨道交通运维数据发送至中继设备,中继设备对接收的轨道交通运维数据进行处理。

步骤102,在设置的钩子上挂载伯克利数据包过滤器,在所述伯克利数据包过滤器中,设置服务器标识以及可扩展标记语言数据包优化策略;

本发明实施例中,无人巡检设备采用可扩展标记语言数据包(XDP,XML DataPackage)优化策略进行数据采集。作为一可选实施例,XDP优化策略为iXDP优化策略,其中,iXDP优化策略是伯克利数据包过滤器(eBPF,PFBerkely Packet Filter)的一种,e BPF上可设置多种应用程序(例如,iXDP优化策略),每种应用程序在系统内核中都有特定的钩子(hook)。

本发明实施例中,通过在hook上挂载用于数据采集的e BPF,在e BPF上设置iXDP优化策略,当触发hook时,对应的应用程序被执行。

本发明实施例中,作为一可选实施例,在无人巡检设备中,设置钩子,包括:

在无人巡检设备装载有现场可编程逻辑门阵列的网卡硬件中,设置钩子。

本发明实施例中,作为另一可选实施例,在无人巡检设备中,设置钩子,包括:

在无人巡检设备的网卡驱动中,设置钩子。

本发明实施例中,作为再一可选实施例,在无人巡检设备中,设置钩子,包括:

若无人巡检设备的驱动不支持可扩展标记语言数据包,在无人巡检设备的内核协议栈中,设置钩子。

本发明实施例中,hook可以设置在内核协议栈(Generic XDP)、网卡驱动(DevXDP)或网卡硬件(HW XDP)中,优选地,在无人巡检设备的网卡硬件中,设置hook,性能最优。Dev XDP模式通过在网卡驱动中加入hook,能够在驱动层面完成数据包的处理,系统开销小;对于驱动不支持XDP的网卡,采用Generic XDP模式设置hook。

本发明实施例中,采用iXDP优化策略实现高速流量采集,其中,iXDP优化策略在数据包处理上,在数据包的协议解析完成之前,就可以处理数据包中的数据,具有非常高的性能,因而,可以有效提升数据采集效率。

步骤103,按照预先设置的采集周期,触发所述钩子,以使钩子上挂载的伯克利数据包过滤器应用程序运行,依据所述可扩展标记语言数据包优化策略,从设置的服务器标识对应的服务器采集轨道交通运维数据;

本发明实施例中,作为一可选实施例,从设置的服务器标识对应的服务器采集轨道交通运维数据,包括:

若确定无人巡检设备的操作系统为Linux系统,利用套接字进行所述轨道交通运维数据采集。

本发明实施例中,对于Linux系统,无人巡检设备的网络应用程序,利用套接字(Socket)与列车进行通信,采集数据包。其中,作为一可选实施例,网络应用程序使用下面的接口建立Socket:

int socket(int family,int type,int protocol)

其中,family表示协议簇,包括但不限于:AF_INET(IPv4通信)、AF_PACKET(获取原始数据包)等。

type表示协议类型,包括但不限于:SOCK_STREAM(流式套接字)、SOCK_DGRAM(数据包式套接字)、SOCK_RAW(原始套接字)等。

protocol表示数据包协议类型。对于协议簇为AF_INET的协议簇,数据包协议类型的值为0;对于协议簇为AF_PACKET的协议簇,数据包协议类型的值为具体的协议名,比如,若proto=0x0800,则表示只接收IPv4的数据包。

本发明实施例中,对于内核中新的网络套接字AF_XDP(也称作XSK),通过Socket()系统调用产生。

fd=socket(AF_XDP,SOCK_RAW,i)

本发明实施例中,在函数调用成功后,返回一个整型值,该整型值表示AF_XDP句柄。这样,绑定了该AF_XDP句柄的应用程序,可以通过e BPF程序的帮助实现快速收取网络数据包。

步骤104,通过多路传输方式,将采集的轨道交通运维数据上传至中继设备,以使中继设备依据动态调整的采集缓存单元窗口接收多路传输的数据。

本发明实施例中,为了提高无人巡检设备的处理吞吐量、加快处理速度,通过分光方式实现多路(至少两路)传输。

本发明实施例中,作为一可选实施例,依据动态调整的采集缓存单元窗口接收多路传输的数据,包括:

A11,依据包往返在途时间、中继设备处理时间以及信道时延,确定平均采集窗口时间;

本发明实施例中,中继设备在接收到多路传输的数据后,需要对多路接受的轨道交通运维数据进行融合,为了保证进行多路流量合并时,不出现数据包逻辑乱序情况,即处理请求包和响应包顺序颠倒,需要首先确定可以对多路流量进行合并处理的平均采集窗口时间。

本发明实施例中,作为一可选实施例,利用下式确定平均采集窗口时间:

T

式中,

T

T

本发明实施例中,作为一可选实施例,包往返在途时间包括:网络中间设备往返时间以及物理链路往返时间,其中,网络中间设备为位于无人巡检设备和中继设备的通信链路上的设备,包括但不限于:交换机、路由器。

本发明实施例中,参考典型网络环境的实时传输(RTT,Real Time Transmit)值、服务器响应时间以及实际经验,可以得出包往返在途时间、中继设备处理时间,从而计算得出平均采集窗口时间。

A12,基于平均采集窗口时间以及当前网络环境的平均传输速率,确定采集缓存单元窗口,依据所述采集缓存单元窗口接收多路传输的数据。

本发明实施例中,作为一可选实施例,利用下式计算采集缓存单元窗口:

S

其中,S

S

本发明实施例中,根据当前网络环境和实际经验积累确定调整系数,调整系数影响缓存单元窗口,调整系数取值越大,采集缓存单元窗口越大,对应的数据处理效率越高,但越容易出现多路合并逻辑乱序,通过选择合适值,可以有效实现流量合并高精确性和流量采集高效性的平衡。

本发明实施例中,作为一可选实施例,在确定采集缓存单元窗口之后,依据所述采集缓存单元窗口接收多路传输的数据之前,该方法还包括:

统计当前周期内处理请求包和响应包的逻辑乱序比例,依据统计的逻辑乱序比例以及预先设置的逻辑乱序包最小允许比例、逻辑乱序包最大允许比例,对确定的采集缓存单元窗口进行调整,以依据进行调整的采集缓存单元窗口接收多路传输的数据。

本发明实施例中,依据确定的采集缓存单元窗口进行数据采集,可能在采集时间内,出现部分时间的实际网络传输速率偏离较大,从而导致多路流量合并出现逻辑乱序,因而,对确定的采集缓存单元窗口进行自适应调整。

本发明实施例中,作为一可选实施例,依据统计的逻辑乱序比例以及预先设置的逻辑乱序包最小允许比例、逻辑乱序包最大允许比例,对确定的采集缓存单元窗口进行调整,包括:

若统计的逻辑乱序比例小于或等于逻辑乱序包最小允许比例,维持确定的采集缓存单元窗口不变;

若统计的逻辑乱序比例大于逻辑乱序包最小允许比例而小于逻辑乱序包最大允许比例,将确定的采集缓存单元窗口减小第一窗口阈值;

若统计的逻辑乱序比例大于或等于逻辑乱序包最大允许比例,将确定的采集缓存单元窗口减小第二窗口阈值,其中,第二窗口阈值大于第一窗口阈值。

本发明实施例中,依据下式对采集缓存单元窗口进行调整:

其中,S'

R

R

S

S

S

本发明实施例中,当逻辑乱序包比例小于或等于逻辑乱序包最小允许比例,采集缓存单元窗口保持不变,当大于逻辑乱序包最小允许比例时,则进行向下调整。

本发明实施例中,通过采用基于改进的精准采集窗口的高流量合并技术,自适应调节采集缓存单元窗口,实现多路流量的高精度时间的流量合并,可以有效降低会话包逻辑乱序的概率。

本发明实施例中,在5G轨道交通网络中,无人巡检设备获取的轨道交通运维数据中,由于列车人员或列车运维人员等轨道交通用户在规定时间内,其活动范围以及感测其活动生成的行为特征数据通常具有一定的规律性,如果列车人员或列车运维人员的活动范围偏离正常的活动范围,传感器感测的行为特征数据会使得无人巡检设备采集的轨道交通运维数据发生异常。因而,作为一可选实施例,该方法还包括:

B11,针对每一无人巡检设备,从该无人巡检设备采集的轨道交通运维数据中,提取标识有预先设定的目标人员对应的轨道交通运维数据;

本发明实施例中,以无人巡检设备为单位进行轨道交通运维数据分析。

B12,针对每一目标人员对应的轨道交通运维数据,获取该目标人员的通信行为特征向量;

本发明实施例中,作为一可选实施例,获取该目标人员的通信行为特征向量,包括:

C11,基于目标人员对应的轨道交通运维数据,获取该目标人员的小时通信业务量,基于小时通信业务量构建日通信行为特征向量;

本发明实施例中,日通信行为特征向量为以小时为单位的特征向量构成,表示如下:

X=(x

其中,X为目标人员的日通信行为特征向量;

x

其中,通信业务量可通过标识有该目标人员对应的轨道交通运维数据进行统计分析得到。

本发明实施例中,作为一可选实施例,利用下式计算目标人员的第h小时到第h+1小时的小时通信业务量:

n为第h小时到第h+1小时的通话次数,σ为目标人员业务系数;

T

C12,在预设时长内,基于同一时段的小时通信业务量进行均值计算,得到小时均值通信业务量,基于小时均值通信业务量,构建通信行为特征向量。

本发明实施例中,为避免偶然事件对结果的影响,对目标人员的日通信行为特征向量统计预设天数后,取平均值,得到该目标人员的通信行为特征向量。

本发明实施例中,利用下式计算目标人员的通信行为特征向量:

其中,

为第i个时间段内目标人员在预设时长(n天)内的小时通信业务量的统计平均值。

B13,对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心;

本发明实施例中,每一无人巡检设备对应一群体,为实现对群体内用户(目标人员)的划分,作为一可选实施例,进行聚类分析的聚类算法采用模糊聚类算法,对群体内各通信行为特征向量进行分析,模糊聚类算法能够让每个数据与多个聚类中心具有隶属关系,然后根据整体情况选取最恰当的聚类中心,该方法能够最大限度保留用户的所有通信行为数据特征,为后续分析研究提供参考。

本发明实施例中,作为一可选实施例,对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心,包括:

D11,初始化各通信行为特征向量为预设第一阈值个模糊类;

D12,针对每一通信行为特征向量,计算该通信行为特征向量分别与各模糊类的距离;

D13,基于通信行为特征向量分别与各模糊类的距离,计算该通信行为特征向量分别与各模糊类的隶属度;

D14,基于通信行为特征向量与模糊类的距离、隶属度以及预先设置的聚类目标函数,获取聚类中心。

本发明实施例中,模糊聚类算法是利用隶属度来衡量每个数据点(通信行为特征向量)属于某个聚类的密切程度的一种聚类方法,通过将n个通信行为特征向量分为c个模糊类,计算每个模糊类的聚类中心和隶属度矩阵,求解使得聚类目标函数J最小的模糊划分矩阵以及聚类中心。

本发明实施例中,作为一可选实施例,聚类目标函数如下所示:

/>

其中,σ为预先设置的隶属度系数,

c

u

U=[u

本发明实施例中,聚类目标函数定义为各通信行为特征向量到模糊类的聚类中心距离的加权平方和,其中,距离采用欧式距离。通过迭代计算隶属度和聚类中心实现聚类目标函数最小。

本发明实施例中,作为一可选实施例,隶属度和聚类中心的计算方法如下:

其中,d

d

本发明实施例中,作为一可选实施例,基于通信行为特征向量与模糊类的距离、隶属度以及预先设置的聚类目标函数,获取聚类中心,包括:

E11,初始化由隶属度构成的隶属度矩阵;

E12,基于通信行为特征向量与模糊类的距离以及第K次的隶属度矩阵,计算第K次的聚类中心;

E13,基于第K次的聚类中心以及第K次的隶属度矩阵,得到第K+1次的隶属度矩阵;

E14,根据第K+1次的隶属度矩阵、第K次的隶属度矩阵以及预先设置的门限值,判断若满足预先设置的迭代条件,得到聚类中心。

本发明实施例中,根据第K+1次的隶属度矩阵、第K次的隶属度矩阵以及预先设置的门限值,判断是否满迭代条件,如果:

|U

终止迭代,否则返回执行步骤E12,继续进行迭代。

B14,针对每一聚类中心,依据该聚类中心包含的目标人员的通信行为特征向量,计算目标人员的异常行为因子,依据计算得到的目标人员的异常行为因子与预先设置的第一异常行为因子阈值,确定通信行为异常的目标人员。

本发明实施例中,作为一可选实施例,依据该聚类中心包含的目标人员的通信行为特征向量,计算目标人员的异常行为因子,包括:

针对聚类中心内的每一目标人员,基于该目标人员的通信行为特征向量以及聚类中心的通信行为特征向量,获取该目标人员的异常行为因子。

本发明实施例中,作为一可选实施例,利用下式计算目标人员的异常行为因子:

式中,ξ

为聚类中心的通信行为特征向量;

为第i个目标人员的通信行为特征向量。其中,

本发明实施例中,针对无人巡检设备的每一聚类中心,获取该聚类中心包含的目标人员,基于目标人员的通信行为特征向量,计算该聚类中心的通信行为特征向量。

本发明实施例中,对每一聚类中心,依据该聚类中心内所有目标人员的通信行为特征向量进行统计,得到该聚类中心的通信行为特征向量,分别计算每一目标人员的通信行为特征向量到聚类中心的通信行为特征向量的距离,得到该目标人员的异常行为因子,并进行归一化处理。若目标人员的异常行为因子大于或等于预先设置的第一异常行为因子阈值,表明该目标人员通信行为异常,触发输出告警信息以作进一步分析。

本发明实施例中,作为另一可选实施例,该方法还包括:

针对无人巡检设备对应的每一聚类中心,依据聚类中心内各目标人员的异常行为因子,获取该聚类中心的异常行为因子;

依据聚类中心的异常行为因子与预先设置的第二异常行为因子阈值,确定通信行为异常的聚类中心。

本发明实施例中,作为一可选实施例,利用下式计算聚类中心的异常行为因子:

其中,m为聚类中心包含的目标人员数,n

本发明实施例中,通过对所有目标人员的通信行为分布规律和每一聚类中心的通信行为分布规律进行统计,利用异常行为分析方法,采用基于分类的群体异常通信行为特征挖掘方法,对异常行为特征进行挖掘,从而利用分类实现对异常通信行为的度量。

本发明实施例中,依据聚类中心的异常行为因子与预先设置的第二异常行为因子阈值,确定该聚类中心是否异常。

本发明实施例中,作为再一可选实施例,该方法还包括:

获取确定的通信行为异常的聚类中心对应的各目标人员的异常行为因子,按照异常行为因子从大至小进行排序,选取排序前N位的异常行为因子对应的目标人员,构建异常用户行为集合。

本发明实施例中,当聚类中心的通信行为异常因子大于第二异常行为因子阈值时,对该聚类中心内各目标人员的通信行为异常因子按降序排序,输出通信行为异常的目标人员,构建异常用户行为集合。

本发明实施例中,针对群体用户的通信行为存在一定的波动性,为实现对群体异常通信行为的挖掘,采用模糊聚类算法,对目标人员的异常行为进行挖掘,通过以无人巡检设备为单位,将无人巡检设备中的目标人员依据通信行为特征进行分类,划分为粒度更小的多个聚类中心;针对各个聚类中心,采用基于距离的异常行为度量方法,利用平均通信行为特征进行异常行为的度量,通过计算通信行为异常因子,建立异常行为度量指标,根据目标人员的通信行为异常因子以及聚类中心的通信行为异常因子,对异常通信行为进行度量,做出判定,输出存在异常行为的目标人员,同时可以对整个聚类中心的异常行为进行判定,有效提高了异常通信行为度量的准确性,挖掘出群体中的异常用户。

本发明实施例中,针对轨道交通段场现状,利用5G无人巡检技术,提出基于5G无人巡检的轨道交通段场智能运维数据采集方法,通过在设置的无人巡检设备上采用iXDP优化策略,进行高速流量采集,实现对高速全流量的采集,实现数据采集智能化,提升数据采集效率,同时,采用基于改进的精准采集窗口的高流量合并技术,实现多路流量的高精度时间的流量合并,保证了巡检设备间可以同步完成巡检任务,能够协助段场人员对设备、场地进行定时、定点、定向的预测性维护与修理,降低维护成本、备品与器件储备,降低段场人员劳动强度,提高轨道交通段场的智能运维水平。

图2示出了本发明实施例所提供的基于无人巡检的轨道交通运维数据采集装置结构示意图。如图2所示,该装置包括:

布设模块201,用于在轨道侧布设无人巡检设备,在无人巡检设备中,设置钩子;

本发明实施例中,作为一可选实施例,在无人巡检设备中,设置钩子,包括:

在无人巡检设备装载有现场可编程逻辑门阵列的网卡硬件中,设置钩子;或,

在无人巡检设备的网卡驱动中,设置钩子;或,

若无人巡检设备的驱动不支持可扩展标记语言数据包,在无人巡检设备的内核协议栈中,设置钩子。

采集设置模块202,用于在设置的钩子上挂载伯克利数据包过滤器,在所述伯克利数据包过滤器中,设置服务器标识以及可扩展标记语言数据包优化策略;

数据采集模块203,用于按照预先设置的采集周期,触发所述钩子,以使钩子上挂载的伯克利数据包过滤器应用程序运行,依据所述可扩展标记语言数据包优化策略,从设置的服务器标识对应的服务器采集轨道交通运维数据;

本发明实施例中,作为一可选实施例,从设置的服务器标识对应的服务器采集轨道交通运维数据,包括:

若确定无人巡检设备的操作系统为Linux系统,利用套接字进行所述轨道交通运维数据采集。

数据上传模块204,用于通过多路传输方式,将采集的轨道交通运维数据上传至中继设备,以使中继设备依据动态调整的采集缓存单元窗口接收多路传输的数据。

本发明实施例中,作为一可选实施例,依据动态调整的采集缓存单元窗口接收多路传输的数据,包括:

依据包往返在途时间、中继设备处理时间以及信道时延,确定平均采集窗口时间;

基于平均采集窗口时间以及当前网络环境的平均传输速率,确定采集缓存单元窗口,依据所述采集缓存单元窗口接收多路传输的数据。

本发明实施例中,作为一可选实施例,数据上传模块204,还用于:

统计当前周期内处理请求包和响应包的逻辑乱序比例,依据统计的逻辑乱序比例以及预先设置的逻辑乱序包最小允许比例、逻辑乱序包最大允许比例,对确定的采集缓存单元窗口进行调整,以依据进行调整的采集缓存单元窗口接收多路传输的数据。

本发明实施例中,作为一可选实施例,依据统计的逻辑乱序比例以及预先设置的逻辑乱序包最小允许比例、逻辑乱序包最大允许比例,对确定的采集缓存单元窗口进行调整,包括:

若统计的逻辑乱序比例小于或等于逻辑乱序包最小允许比例,维持确定的采集缓存单元窗口不变;

若统计的逻辑乱序比例大于逻辑乱序包最小允许比例而小于逻辑乱序包最大允许比例,将确定的采集缓存单元窗口减小第一窗口阈值;

若统计的逻辑乱序比例大于或等于逻辑乱序包最大允许比例,将确定的采集缓存单元窗口减小第二窗口阈值,其中,第二窗口阈值大于第一窗口阈值。

本发明实施例中,作为一可选实施例,该装置还包括:

异常分析模块(图中未示出),用于针对每一无人巡检设备,从该无人巡检设备采集的轨道交通运维数据中,提取标识有预先设定的目标人员对应的轨道交通运维数据;针对每一目标人员对应的轨道交通运维数据,获取该目标人员的通信行为特征向量;对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心;针对每一聚类中心,依据该聚类中心包含的目标人员的通信行为特征向量,计算目标人员的异常行为因子,依据计算得到的目标人员的异常行为因子与预先设置的第一异常行为因子阈值,确定通信行为异常的目标人员。

本发明实施例中,作为一可选实施例,获取该目标人员的通信行为特征向量包括:

基于目标人员对应的轨道交通运维数据,获取该目标人员的小时通信业务量,基于小时通信业务量构建日通信行为特征向量;

在预设时长内,基于同一时段的小时通信业务量进行均值计算,得到小时均值通信业务量,基于小时均值通信业务量,构建通信行为特征向量。

本发明实施例中,作为一可选实施例,对各目标人员的通信行为特征向量进行聚类分析,得到聚类中心,包括:

初始化各通信行为特征向量为预设第一阈值个模糊类;

针对每一通信行为特征向量,计算该通信行为特征向量分别与各模糊类的距离;

基于通信行为特征向量分别与各模糊类的距离,计算该通信行为特征向量分别与各模糊类的隶属度;

基于通信行为特征向量与模糊类的距离、隶属度以及预先设置的聚类目标函数,获取聚类中心。

本发明实施例中,作为一可选实施例,基于通信行为特征向量与模糊类的距离、隶属度以及预先设置的聚类目标函数,获取聚类中心,包括:

初始化由隶属度构成的隶属度矩阵;

基于通信行为特征向量与模糊类的距离以及第K次的隶属度矩阵,计算第K次的聚类中心;

基于第K次的聚类中心以及第K次的隶属度矩阵,得到第K+1次的隶属度矩阵;

根据第K+1次的隶属度矩阵、第K次的隶属度矩阵以及预先设置的门限值,判断若满足预先设置的迭代条件,得到聚类中心。

本发明实施例中,作为一可选实施例,依据该聚类中心包含的目标人员的通信行为特征向量,计算目标人员的异常行为因子,包括:

针对聚类中心内的每一目标人员,基于该目标人员的通信行为特征向量以及聚类中心的通信行为特征向量,获取该目标人员的异常行为因子。

本发明实施例中,作为一可选实施例,异常分析模块还用于:

针对无人巡检设备对应的每一聚类中心,依据聚类中心内各目标人员的异常行为因子,获取该聚类中心的异常行为因子;

依据聚类中心的异常行为因子与预先设置的第二异常行为因子阈值,确定通信行为异常的聚类中心。

本发明实施例中,作为另一可选实施例,异常分析模块还用于:

获取确定的通信行为异常的聚类中心对应的各目标人员的异常行为因子,按照异常行为因子从大至小进行排序,选取排序前N位的异常行为因子对应的目标人员,构建异常用户行为集合。

如图3所示,本申请一实施例提供了一种计算机设备300,用于执行图1中的基于无人巡检的轨道交通运维数据采集方法,该设备包括存储器301、与存储器301通过总线相连的处理器302及存储在该存储器301上并可在该处理器302上运行的计算机程序,其中,上述处理器302执行上述计算机程序时实现上述基于无人巡检的轨道交通运维数据采集方法的步骤。

具体地,上述存储器301和处理器302能够为通用的存储器和处理器,这里不做具体限定,当处理器302运行存储器301存储的计算机程序时,能够执行上述基于无人巡检的轨道交通运维数据采集方法。

对应于图1中的基于无人巡检的轨道交通运维数据采集方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述基于无人巡检的轨道交通运维数据采集方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述基于无人巡检的轨道交通运维数据采集方法。

应该理解到,所揭露系统和方法,可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

技术分类

06120116380371