掌桥专利:专业的专利平台
掌桥专利
首页

一种结构健康监测系统时序监测数据异常诊断方法

文献发布时间:2023-06-19 09:29:07


一种结构健康监测系统时序监测数据异常诊断方法

技术领域

本发明涉及结构健康监控技术,尤其涉及一种结构健康监测系统时序监测数据异常诊断方法。

背景技术

我国交通基础设施建设突飞猛进,取得了举世瞩目的成绩,基础设施在使用过程中结构部分会产生劣化和损伤,导致结构性能已经达不到设计要求;如果不严加管控与维护会造成严重的生命与财产损失及恶劣的社会影响;但是采用人力维护的成本过于昂贵。近年来,随着通信网络、信号处理、人工智能等技术的不断发展,加速了结构健康监测系统的实用化和应用研究,结构健康监测是通过对结构状况的监控与评估,为桥梁、隧道、大坝等土木结构在特殊气候、荷载条件下状况异常严重时发出预警信号,为被监测结构的维护维修和管理决策提供依据与指导。现在往往采用健康监测系统来对结构长期、连续、定期或实时的监测,并通过对监测信息的收集和分析处理,对结构的安全性进行评估以及对结构运营中出现的故障进行预警和报警。

人工智能技术与结构健康监控的结合可以更好地确保我们的基础设施安全可靠,同时也在民用基础设施中的广泛应用产生了大量数据。然而,土木结构的恶劣环境条件导致结构健康监控系统测量数据受到多种异常的影响。这些异常现象对损坏或事故的自动报警构成了重大障碍。因此,识别和消除由环境变化引起的数据异常是一个成功的预警系统的重要预处理步骤。

发明内容

本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种结构健康监测系统时序监测数据异常诊断方法。

本发明解决其技术问题所采用的技术方案是:一种结构健康监测系统时序监测数据异常诊断方法,包括以下步骤:

1)以已知结构健康监测结果的基础设施为数据采集对象,通过加速度传感器获取m天的加速度数据;

设共有n个传感器,采样频率为f,获取数据集,每小时的时间序列信号的信号长度为3600*f,标记数据集的维数为24*m*n;

2)对数据集做随机函数平衡抽取之后获得平衡数据集,然后通过数据增强,由平衡数据集的一阶导数导出增强型数据集;平衡数据集和增强数据集构成总数据集;

3)对平衡数据集和增强数据集中的样本进行分段,对数据集做基于等长分割的数据扩充处理;

假设原始样本数据维度为N,通过将之等长分割为p个维度N/p的等长样本,并且固定等长样本与等长样本之间重叠维度为N/q,通过叠加等长样本将样本由N维转化为了(q-1)个N/p的序列;将每小时的时间序列信号表示为(q-1)*N/p的矩阵;

4)利用统计指标作为训练的输入特征,代替分段后的等长片段及其一阶导数序列;

5)将总数据集分为训练样本子集和测试样本子集,训练样本子集分为两部分,即培训样本和验证样本,测试样本子集作为测试样本;

6)根据步骤3)所提出的数据增强方法,将3600*f个维度的原始样本转化为等长分割的矩阵;每个矩阵的第一行由未分割的原始样本及其一阶导数组成,剩余行是一阶导数以及相同的一阶导数片段组成;

7)时序监测数据异常诊断模型建立;

根据两阶段识别不同模式的思想,通过深层cnn依次建立两个基于监督学习的模型;

其中,第一阶段模型用于识别“正常”标签和“异常”标签;第二阶段模型用于识别“异常”标签相对应的详细类别。

按上述方案,所述步骤4)中统计指标选取如下:

4.1)从原始时域信号和经过一阶导后的时域信号中统计得到10个统计指标特征,分别为最大值、最小值、平均值、中位数、标准差、极差、有效值、众数、峰度、偏度;

4.2)根据PIM(Permutation Importance Measure)基于随机森林的策略,评价不同统计指标作为候选特征的贡献重要性;

4.3)根据重要性选择前六项统计指标。

基于随机森林的策略,评价了不同统计指标作为候选特征的贡献重要性。从每种模式随机选择的500个样本中获得的平衡和增强数据集的基于统计的排序结果。根据这一思想,在随后的监督学习模型中,利用PIM值较高的六项统计指标作为训练的输入特征,代替等长片段及其一阶导数序列。

按上述方案,所述步骤4)中统计指标的组合遵循以下原则:

选择六个统计指标来构造样本的组合训练输入时,有三种排列方式:

排列一、基于原始子片段的特征重要性排序中前六位统计指标以及基于其一阶导数序列的特征重要性排序中前六位统计指标的组合;

排列二、基于原始子片段的特征重要性排序中前六位统计指标以及基于原始子片段的特征重要性排序中前六位统计指标的组合;

排列三、基于其一阶导数序列的特征重要性排序中前六位统计指标以及基于其一阶导数序列的特征重要性排序中前六位统计指标的组合;

根据三种排列方式在测试集当中的准确率效果,确定作为训练的输入特征组合。

按上述方案,所述步骤7)中第一阶段模型的训练方法如下:

训练具体步骤如下:

7.1)二分类模型由输入层、隐藏层和输出层组成;设置输入层、输出层节点个数为b,隐藏层节点个数为t,初始化每层连接的权值为0到1之间的随机数矩阵,每层的偏置值为默认值,每层连接的激活函数为sigmoid函数;

7.2)设置模型学习率为c,训练最大次数epoch为s;

7.3)定义模型的损失函数为输入样本数据和输出样本数据的均方误差;

7.4)在训练过程中,通过调整c、s、b、t以及batch_size的大小,使用十倍交叉验证法来评估各个参数的大小对模型效能的影响;完成二分类模型的训练。

本发明产生的有益效果是:

对于实际桥梁结构健康监测系统中已知标签的不平衡振动数据集,一阶导数运算不仅可以使原始数据的规模扩大一倍,而且可以进一步揭示原始样本的特征,有利于提高诊断结果的准确性。对于时间序列信号,将原始样本序列转换为具有固定重叠区域的等长段是一种可行的数据增强方法。

此外,基于PIM排序的统计分析和特征选择有助于简化样本输入表达式,提高模型训练效率。两阶段的数据异常检测,而不是一次对所有模式进行分类。可以根据不同的识别目标,从原始的不平衡数据中选择一个更合适的样本量参与算法训练,有利于提高基于深层卷积模型的预测精度。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例的方法流程图;

图2是本发明实施例的每小时样本点波形示意图;

图3是本发明实施例的基于PIM排序结果的特征组合图;

图4是本发明实施例的二分类模型示意图;

图5是本发明实施例的六分类模型示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,一种结构健康监测系统时序监测数据异常诊断方法,图1是本发明总体流程图,异常模式识别的对象是基于一个月的大跨度斜拉桥的加速度数据,包括以下步骤:

采集装置所采集的原始数据中,共有38个传感器,采样频率为20Hz。对于38个传感器,一个月(31天)的数据,标记数据集的维数为744*38。

对数据集做随机函数平衡抽取之后,通过数据增强,由平衡数据集的一阶导数导出的增强型数据集中任一样本的长度仍然保持在72000,并且数据集的可用样本大小增加了一倍。对数据集做基于等长分割的数据扩充处理,其求导信号利用差分求导求得。

提取切割信号的长度为2400(相当于2分钟信号),下一个切割信号与前一切割信号的交叉长度为1200(相当于1分钟信号),并且利用同样的处理手段处理求导信号,最终获得59个原始信号的切割信号和59个求导信号的切割信号。平衡数据集和增强数据集中的每个72000维样本被分成一系列2400维等长段,其中固定的1200维重叠。因此,每个72000维序列可以被转换成59个2400维序列。

通过叠加这些子段,每小时的时间序列信号可以表示为59*2400的矩阵。

具体地,每小时样本点的波形示意图如图2所示。

为了掌握整体特征分布,在上述数据扩充操作后,输出所有等长线段的最大值、最小值、标准差等各种统计结果。

在统计分析过程中,对于“缺失”模式,在没有收集到数据的情况下,用非空周期的平均值来填充空值,而在样本序列中填充零。

根据PIM基于随机森林的策略,评价了不同统计指标作为候选特征的贡献重要性。根据这一思想,在随后的监督学习模型中,利用PIM值较高的统计指标作为训练的输入特征,代替等长片段及其一阶导数序列。

通过多次实验对比从每种模式随机选择的500个样本中获得的平衡和增强数据集的基于统计的排序结果发现,求导信号中6个统计量的贡献度较高,分别如公式(1)-(6)所示。

极差Range=Max(x)-Min(x) (1)

最大值Max=Max(x) (2)

有效值

标准差

峰度

最小值Min=Min(x) (6)

式中,x

根据这点,利用求导信号中这6个统计量,并且把它扩展到原始信号中。首先提取原始信号的6个统计量,同时提取求导信号的统计量,将他们横向拼接在一起,获取到原始信号的统计量,然后利用同样的处理手段处理切割好的的原始信号和求导信号,最后,把原始信号的统计量和切割信号的统计量纵向拼接在一起,形成了60*12的数据集。

如图3所示,原始子片段及其一阶导数序列的排序结果不同。当选择六个统计指标来构造样本的组合训练输入时,有三种排列方式。

排列一:基于原始子片段的特征重要性排序中前六位统计指标以及基于其一阶导数序列的特征重要性排序中前六位统计指标的组合。

排列二:基于原始子片段的特征重要性排序中前六位统计指标以及基于原始子片段的特征重要性排序中前六位统计指标的组合。

排列三:基于其一阶导数序列的特征重要性排序中前六位统计指标以及基于其一阶导数序列的特征重要性排序中前六位统计指标的组合。

通过反复试验以及比较后,根据模型在测试集当中的准确率效果,选择了第三种方案,进行了随后的两阶段深层卷积网络训练。

总数据集的20%用于测试,其余80%分为两部分,即培训(90%)和验证(10%)。在训练过程中,使用十折交叉验证法来评估模型参数对模型效能的影响。

根据所提出的数据扩充和特征选择策略,将72000个维度的原始样本转化为60*12的矩阵。第一行是未分割的原始样本及其一阶导数的统计,其余59行是等长片段及其相应的一阶导数的统计。

在模型训练前,需要对数据进行进一步的归一化处理,考虑到该数据集并不是传统的数据集,而是由统计量堆叠而成,该数据集的每一列都是由原始信号和切割信号的某一统计量组合而成,如果只是简单的全局归一化处理,由于一些统计量值相对较大,且差值大,一些统计量则相对较小,其差值小。

如果采取简单的归一化,会导致差值更小,影响训练效果,所以需要更换归一化策略。以一纵列进行最大值最小值归一化,并把他们映射到(-1,1)之间,如公式(7)所示。

式中:A代表纵列元素,min表示输入样本数据中的最小值,max表示输入样本数据中的最大值。

本发明利用深度学习中卷积神经网络分别搭建了针对正常数据和异常数据展开识别的二分类模型以及针对异常类型进行识别的六分类模型(对应6种异常类型标记),模型结构示意图如图4以及图5所示。

对二分类CNNs

(1)设置CNNs

(2)将训练集数据作为输入,训练CNNs

(2.1)将输入层训练数据集矩阵D随机分割为num个列向量维度相同的子矩阵batch

(2.2)为了使模型具有更好的鲁棒性,往输入数据中引入噪声,即以一定概率将输入数据随机重置为0。具体地,在每个batch中,batch=batch×(rand(batch_size,d)>k),其中rand(batch_size,d)表示随机生成矩阵,k表示设定的阈值,如果随机生成矩阵中的值小于阈值k,那么将batch中对应的元素重置为0,定义加入噪声后的batch数据集为batch

(2.3)初始化网络的参数,具体地,设置输入层到隐藏层、隐藏层到输出层的权重值均为0到1之间的随机数矩阵,设置网络偏置初始值均为b。

(2.4)设置学习率learning_rate为c,设置最大训练次数epoch为s次;

(2.5)设置输入层到隐藏层连接方式为

(2.6)设置隐藏层到输出层连接方式为z

其中sigmoid为激活函数;w

(2.7)CNNs

式中:等式右边第一项表示网络输入数据类型与输出数据的误差类型总和;第二项为正则化约束项,用于防止训练过拟合;

(2.8)调整学习率c、偏置初始值b以及batch_size大小训练CNNs

(3)训练完二分类的CNNs

(4)重复步骤(2),训练CNNs

最终,十折交叉验证所构成混淆矩阵所示的准确度即为异常模式识别的量化结果指标。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

相关技术
  • 一种结构健康监测系统时序监测数据异常诊断方法
  • 一种基于卷积神经网络与迁移学习的结构健康监测多元数据异常诊断方法
技术分类

06120112188988