掌桥专利:专业的专利平台
掌桥专利
首页

一种基于数据仓库预测AFC设备状态的方法

文献发布时间:2024-04-18 20:01:23


一种基于数据仓库预测AFC设备状态的方法

技术领域

本发明涉及轨道交通技术领域,具体涉及一种基于数据仓库预测AFC设备状态的方法。

背景技术

随着城市交通的不断发展,轨道交通凭借运量大、效率高、绿色环保等优点,逐渐成为城市交通运输的主力。在轨道交通快速发展的同时,车站设备数量也随着线路的增加成倍数增长。因新老线路设备运行年代不同,维护需求差异大,给运营人员的日常维护和检修工作带来巨大的麻烦。

运营公司对AFC设备的维护方式以计划性维修为主,计划性维修的特点是无论设备是否出现问题,只要到达了起始规定的维修时间,就必须得对其进行维修管理。这种维修方式不仅无法准确地契合模块的维修需求,而且往往存在过度维修的情况,不仅增加维护成本,而且浪费人力成本。

如何让AFC设备日常维护工作更加科学、高效和经济,是运营公司迫切需要思考和解决的问题。

发明内容

本发明目的:在于提供一种基于数据仓库预测AFC设备状态的方法,通过预测设备的状态,在故障发生或模块寿命终结前,选择合适的维修时机和方式进行维护。

为实现以上功能,本发明设计一种基于数据仓库预测AFC设备状态的方法,执行如下步骤S1-步骤S4,完成目标设备状态的预测:

步骤S1:采集目标设备多个历史时刻的运行和维修历史数据,并进行数据清洗;

步骤S2:根据目标设备运行和维修的历史数据,确定目标设备各历史时刻的特征参数,包括设备基础信息特征参数、设备模块相关参数、维修相关参数;

步骤S3:以目标设备各历史时刻的特征参数构建特征参数集合,并进行预处理;基于多元线性回归算法,拟合特征参数的多元线性回归模型,获取目标设备各特征参数的线性关系;

步骤S4:基于多层感知机,以目标设备各特征参数为输入,获取目标设备各特征参数的非线性关系,将多元线性回归模型和多层感知机进行整合,构建MLR-MLP模型,MLR-MLP模型以目标设备历史时刻的特征参数为输入,以预测的目标设备的特征参数为输出,应用MLR-MLP模型,完成目标设备状态的预测。

作为本发明的一种优选技术方案:步骤S1的具体步骤如下:

步骤S1.1:采用MPP架构数据库,搭建用于存储目标设备运行和维修历史数据的数据仓库;

步骤S1.2:采集目标设备运行数据和维修历史数据,去除重复数据、设备编号异常、设备运行时间异常的历史数据中后存储到数据仓库;

步骤S1.3:对数据仓库所存储的历史数据进行二次清洗,剔除重复、数据格式不符合标准规范的历史数据。

作为本发明的一种优选技术方案:步骤S2所述的设备基础信息特征参数包括设备类型、设备寿命、设备运行时间、设备运行状态、设备可靠度,设备累计故障次数,月故障率和年故障率;

其中设备类型为设备所属类型的预设编号,设备运行状态使用[0,1]值表示,当值为0时表示设备处于正常状态,当值为1时表示设备处于故障状态;

设备可靠度表示设备不发生故障且能正常运行的概率,具体计算公式为:

其中,T

月故障率和年故障率分别表示设备每月和每年发生故障的频率,具体计算公式为:

其中,λ

作为本发明的一种优选技术方案:步骤S2所述的设备模块相关参数包括设备模块类型、设备模块运行状态,设备模块是否原厂,设备模块关联度,设备模块寿命、设备模块运行时间;

其中设备模块类型为设备模块所属类型的预设编号,设备模块运行状态使用[0,1]值表示,当值为0时表示设备模块处于正常状态,当值为1时表示设备模块处于故障状态;

设备模块是否原厂采用[0,1]值进行表示,当值为0时表示为原厂模块,当值为1时表示为非原厂模块;

设备模块关联度表示当前设备模块发生故障时导致其他设备模块发生故障的概率,具体计算公式为:

其中,X

作为本发明的一种优选技术方案:步骤S2所述的维修相关参数包括设备维修次数、设备模块维修次数、维修人员工作年限,设备模块状态;

其中设备模块状态,采用设备维修人员打分、设备模块剩余使用率和设备模块可靠度三个维度进行估计,具体如下式:

其中,f

作为本发明的一种优选技术方案:步骤S2中的特征参数还包括目标设备进出站客流数、设备票卡发售数、温湿度。

作为本发明的一种优选技术方案:步骤S3的具体步骤如下:

步骤S3.1:基于设备基础信息特征参数、设备模块相关参数、维修相关参数,构建特征参数集合X=[S,M,R,E],其中:

S=[s

M=[M

R=[r

E=[e

步骤S3.2:对特征参数集合X进行缺失值处理和归一化处理,缺失值处理采用的方法为多重差补、均值填充;归一化处理使用的方法为最小-最大归一化方法;

步骤S3.3:使用多元线性回归算法,获取特征参数集合的特征回归系数,如下式:

y=b

其中,y为目标特征参数,x

构建多元线性回归模型,并使用最小二乘法求解参数,获取各个特征参数的特征回归系数

式中,X为输入特征参数集合,Y

作为本发明的一种优选技术方案:步骤S4的具体步骤如下:

步骤S4.1:将各特征参数输入多层感知机,得出多层感知机每层隐藏节点的输出为:

h=f(w

其中,f为Sigmod函数,[X

Y

其中W

步骤S4.2:使用加权平均的方式将多元线性回归模型和多层感知机模型进行整合,得最终的MLR-MLP模型为:

Y=W

其中W

步骤S4.3:使用均方根误差计算预测结果值和实际值之间的误差,计算公式为:

其中,v

有益效果:相对于现有技术,本发明的优点包括:

本发明设计了一种基于数据仓库预测AFC设备状态的方法,解决了现有维修方式无法准确地契合设备的维修需求,在保证设备服务质量的前提下,避免了过度维修,节约了维护成本和人力成本。以标准化的维修数据格式为基准,通过检索分析模块的当前状态,并结合历史数据对模块的状态进行预测,主动发起设备保养和维修需求。

附图说明

图1是根据本发明实施例提供的一种基于数据仓库预测AFC设备状态的方法的流程图;

图2是根据本发明实施例提供的数据仓库数据加工流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

本发明实施例提供的一种基于数据仓库预测AFC设备状态的方法,参照图1,执行如下步骤S1-步骤S4,完成目标设备状态的预测:

步骤S1:采集目标设备多个历史时刻的运行和维修历史数据,并进行数据清洗;

步骤S1.1:采用MPP架构数据库,搭建用于存储目标设备运行和维修历史数据的数据仓库,数据仓库数据加工流程图参照图2;

设备运行历史数据和维修历史数据以数据库表的离线数据形式存储于关系数据库中,主要涉及的数据包含设备基础信息、设备运行记录、设备维修记录、设备保养记录、维修人员基础信息。使用ETL工具如DataX或Kettle进行数据的抽取和清洗后,存储到以Apache Cassandra或StarRocks作为MPP数据库的数据仓库中;

步骤S1.2:采集目标设备运行数据和维修历史数据,去除重复数据、设备编号异常、设备运行时间异常的历史数据中后存储到数据仓库;

设备运行数据包括设备运行日志、设备维修记录、设备保养记录、设备状态上报记录,其中,设备运行日志以文件形式存在,采用Filebeat+Kafka的组合方式进行采集。设备维修数据包含设备维修记录、设备保养记录,与设备状态上报记录以数据库表形式存在于关系数据库中,采用FlinkCDC方式进行采集。数据采集过程中对重复数据、设备编号异常、设备运行时间异常等非正常数据进行剔除;

步骤S1.3:对数据仓库所存储的历史数据进行二次清洗,剔除重复、数据格式不符合标准规范的历史数据。

设备基础信息和维修人员基础信息数据作为公共维表(DIM),其他各类数据作为基础明细层(DWD)进行存储。对数据仓库的基础明细层数据(DWD)进行二次清洗,剔除重复、数据格式不符合标准规范的数据,符合规范的数据作为中间层数据(DWM)存储在数据仓库中。

使用Flink或Spark等数据分析工具对数据中间层数据(DWM)进行分析筛选统计。从设备运行状态数据中筛选出设备类型、设备寿命、设备运行状态、设备运行时间、设备可靠度、设备模块关联度、设备模块类型、设备模块运行状态、设备进出站客流量等关键字段数据;从维修数据中筛选出设备模块类型、维修次数、故障等级、故障发生次数、故障时间、维修人员等关键字段数据。从而统计出设备的周故障次数、年故障次数以及维修人员工作年限等关键维度信息,作为数据服务层(DWS)存储在数据仓库中。

步骤S2:根据目标设备运行和维修的历史数据,确定目标设备各历史时刻的特征参数,包括设备基础信息特征参数、设备模块相关参数、维修相关参数;

所述的设备基础信息特征参数包括设备类型、设备寿命、设备运行时间、设备运行状态、设备可靠度,设备累计故障次数,月故障率和年故障率;

其中设备类型为设备所属类型的预设编号,设备运行状态使用[0,1]值表示,当值为0时表示设备处于正常状态,当值为1时表示设备处于故障状态;

设备可靠度表示设备不发生故障且能正常运行的概率,具体计算公式为:

其中,T

月故障率和年故障率分别表示设备每月和每年发生故障的频率,具体计算公式为:

其中,λ

所述的设备模块相关参数包括设备模块类型、设备模块运行状态,设备模块是否原厂,设备模块关联度,设备模块寿命、设备模块运行时间;

其中设备模块类型为设备模块所属类型的预设编号,设备模块运行状态使用[0,1]值表示,当值为0时表示设备模块处于正常状态,当值为1时表示设备模块处于故障状态;

设备模块是否原厂采用[0,1]值进行表示,当值为0时表示为原厂模块,当值为1时表示为非原厂模块;

设备模块关联度表示当前设备模块发生故障时导致其他设备模块发生故障的概率,具体计算公式为:

其中,X

一般情况下设备模块关联度r呈线性关系,可以反应出某一模块运行状态对其他模块运行状态的影响,最终可获得该模块状态与设备状态的间接关系,如模块A发生故障并不会直接导致设备发生故障,但模块A长期故障的情况下会对模块B的健康关系产生影响,最终导致设备发生故障。

所述的维修相关参数包括设备维修次数、设备模块维修次数、维修人员工作年限,设备模块状态;

其中设备模块状态,采用设备维修人员打分、设备模块剩余使用率和设备模块可靠度三个维度进行估计,具体如下式:

其中,f

特征参数还包括目标设备进出站客流数、设备票卡发售数、温湿度。

步骤S3:以目标设备各历史时刻的特征参数构建特征参数集合,并进行预处理;基于多元线性回归算法,拟合特征参数的多元线性回归模型,获取目标设备各特征参数的线性关系;

步骤S3的具体步骤如下:

步骤S3.1:基于设备基础信息特征参数、设备模块相关参数、维修相关参数,构建特征参数集合X=[S,M,R,E],其中:

S=[s

M=[M

R=[r

E=[e

步骤S3.2:对特征参数集合X进行缺失值处理和归一化处理,缺失值处理采用的方法为多重差补、均值填充;归一化处理使用的方法为最小-最大归一化方法,具体如下式;

其中X

步骤S3.3:使用多元线性回归算法(MLR),获取特征参数集合的特征回归系数,如下式:

y=b

其中,y为目标特征参数,x

构建多元线性回归模型,并使用最小二乘法求解参数,获取各个特征参数的特征回归系数

式中,X为输入特征参数集合,Y

由于多元线性回归模型只能对呈线性关系的特征参数进行拟合,对于非线性关系,模型则无法捕捉到,例如本实施例中的设备模块关联度、设备状态、设备进出站客流数、温湿度等复杂结构的数据,则无法使用多元线性回归模型进行捕捉。

为了进一步提高预测的精准度,使用多层感知机(MLP)算法对特征参数的非线性关系进行捕捉。

步骤S4:基于多层感知机,以目标设备各特征参数为输入,获取目标设备各特征参数的非线性关系,将多元线性回归模型和多层感知机进行整合,构建MLR-MLP模型,MLR-MLP模型以目标设备历史时刻的特征参数为输入,以预测的目标设备的特征参数为输出,应用MLR-MLP模型,完成目标设备状态的预测。

步骤S4的具体步骤如下:

步骤S4.1:将各特征参数输入多层感知机,得出多层感知机每层隐藏节点的输出为:

h=f(w

其中,f为Sigmod函数,[X

Y

其中W

步骤S4.2:使用加权平均的方式将多元线性回归模型和多层感知机模型进行整合,得最终的MLR-MLP模型为:

Y=W

其中W

步骤S4.3:使用均方根误差计算预测结果值和实际值之间的误差,计算公式为:

其中,v

针对所构建的MLR-MLP模型,选取80%的特征参数集合作为模型训练集,10%的特征参数集合作为验证集,10%的特征参数集合作为测试集,对MLR-MLP模型进行训练、验证和测试,应用训练好的MLR-MLP模型,完成目标设备状态的预测。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

相关技术
  • 一种设备信息处理方法、电子设备及服务器
  • 一种联网服务设备信息交互系统和信息处理方法
  • 一种服务端测试用例集的生成方法、终端设备及存储介质
  • 一种图片文件处理方法及智能终端
  • 一种电力设备信息的处理方法、智能终端及服务端设备
  • 一种远程监控电力设备的服务端及监控端电力数据处理方法
技术分类

06120116553245