掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及轨面状态识别技术领域,特别是涉及一种基于改进深度学习网络的轨面状态识别方法。

背景技术

轨道交通车辆牵引/制动性能的有效发挥依赖于轮轨接触情况,干燥、潮湿、油污等不同轨面状态下的车辆运行性能差异较大。针对传统人工经验为主的钢轨表面即轨面状态识别存在主观性大、滞后严重等问题。轨道交通车辆牵引/制动性能的有效发挥依赖于轮对和轨道相互接触时的黏着利用情况,引起轮轨黏着特征发生改变的重要影响因素是轨面状态的突然变化,因此有效识别出不同轨面状态是精确检测轮轨黏着特征的前提条件。不同轨面状态下的轮轨黏着特性差异较大,如积雪轨面的黏着系数远小于干燥轨面。因我国轨道交通车辆运行区域繁杂,运行过程中的轨面状态突变时有发生,实现轨面状态的有效识别对提高轮轨黏着利用率和轨道车辆运行效率具有重要意义,现有技术中的轨面状态识别常采用网络模型,例如传统ResNet-50模型,采用此方法的轨面状态识别模型提取到的深层网络特征比较多时,会产生大量的多特征问题,比如多数据样本融合问题、特征选取问题等,另外,训练数据样本不足或匮乏的情况下,深度学习网络就无法学习到所需要的样本特征,导致其轨道识别的精度低,误判率大。

公开号为CN111994129A的发明创造专利,公开了一种轮轨列车防滑控制方法及系统,所述的发明创造进行轨道识别时,利用安装于列车车头前方的摄像头实时的获取所述轨道图像;将轨道图像输入至预先训练好的轨道介质识别网络模型,根据轨道介质识别网络模型输出的结果,获取与轨道图像相对应的介质种类;所述发明创造采用常规网络识别模型,例如传统ResNet-50模型,易出现训练数据样本不足或匮乏的情况,此时深度学习网络就无法学习到所需要的样本特征,导致轨道识别的精度低,误判率大。

发明内容

针对上述存在的技术问题,本发明提供了一种基于改进深度学习网络的轨面状态识别的方法。

本发明采用以下具体的技术方案:

基于改进深度学习网络的轨面状态识别的方法,其特征在于,所述方法包括以下步骤:

S1:采集原始轨面状态图像;

S2:基于配准技术对所述原始轨面状态图像进行处理,获取训练图像数据集,采用ResNet-50网络构建轨面状态辨识模型,所述ResNet-50网络构建的轨面状态辨识模型由五个部分组成:一个输入层(Input),五个卷积组(Conv1~Conv5_x),一个平均池化层(Average pool),一个全连接层(fc)和一个输出层(Output),输入的数据通过五个卷积组(Conv1~ConV5_x)进行特征学习,第1个卷积组(Conv1)只含有一次卷积计算,第2-5个卷积组(Conv2_x~Conv5_x)包含多个相同的残差单元;提取特征后通过平均池化层的压缩保留其主要特征传给全连接层进行分类识别,输出其想要的结果;

S3:利用S2中的图像数据集对ResNet50模型进行迁移训练并测试,得到轨面状况识别深度学习网络模型,所述模型以残差网络ResNet-50作为骨干网络,引入迁移学习对网络结构和参数进行改进,所述基于迁移学习的ResNet-50优化过程分为预训练阶段和微调阶段;

其中,步骤S3的具体步骤为:

S3.1:预训练阶段,在ImageNet数据集上对ResNet50模型进行预训练,将ResNet-50网络模型在ImageNet数据集进行训练直至其分类准确率收敛,然后保存其模型参数;

S3.2:微调阶段,将S3.1中预训练好的ResNet-50模型移除最后的分类层,将剩下的ResNet-50模型作为轨面状态图像数据库的轨面图像特征提取器,微调新的ResNet-50网络模型直到轨面状态图像分类准确率收敛,将ImageNet数据集训练好的ResNet-50的模型和参数迁移到自建轨面数据集;

进一步地,所述S1中采集原始轨面状态图像,其轨面状态分为无污染物的干燥轨面、含有水分的潮湿轨面,以及含有润滑油和水混合的油污轨面3种类型。

进一步地,所述步骤S3.1的预训练阶段中,将搭建的网络模型参数进行初始化,并将准备好的图像数据样本集去训练所搭建的网络模型。

进一步地,所述网络模型在训练过程中不断对模型进行调整,使其模型的损伤函数逐渐稳定且趋于0,模型参数在刚开始训练时会不断变化,直到分类准确率收敛的时候,将模型参数保存下来,方便下次对其它图像进行相同操作。

进一步地,所述预训练阶段剩下的ResNet-50模型去除掉了平均池化层和全连接层,替换为由新全局平均池化层和新全连接层组成自定义分类层。

进一步地,所述新全局平均池化层对整个特征图求平均值,并对整个ResNet-50网络从结构上做正则化防止过拟合。

进一步地,所述新全局平均池化层后加入三层新全连接层,新全连接层在模型进行迁移学习过程中,发挥“防火墙”功能。

进一步地,所述在前两层新全连接层引入Dropout控制其参数耦合,有效地防止前两层新全连接层的参数耦合太多,以有效抑制新全连接层过拟合,最后一层新全连接层连接Sigmoid逻辑划分回归器的函数从而对轨面状态进行分类。所述轨面状态分类完成后,输入轨面状态图像数据对处理后新的ResNet-50模型进行训练;在使用优化的ResNet-50模型对轨面状态图像进行训练时,要特别注意的是:开始训练的第一步要先固定没有被替换掉的ResNet-50网络层中的参数,相当于优化后的ResNet-50模型进行前向计算,但进行反向传递时不再更新参数,并且优化后的ResNet-50模型训练过程中只更新自定义的分类新全连接层中的参数。然后,选取一个相对较小的学习率进行训练,比如0.001。最后,可以有选择地在新全连接层的参数学习得差不多的时候,可以解冻没有被替换掉的ResNet-50网络层,再对整个ResNet-50网络进行训练。

进一步地,所述方法采用实验验证其可行性。

本发明的有益效果为:

本发明提出针对轨面状态识别的改进ResNet-50深度学习网络模型,模型使用了残差网络ResNet-50作为骨干网络,引入迁移学习对网络结构和参数进行改进,基于改进后的ResNet-50网络训练轨面状态图像数据,减少了深度学习网络对目标区域中训练集样本数据数量的需求,在保证精确度的前提下减少参数量,提升网络训练速度,优化后ResNet-50轨面辨识模型相比与传统ResNet-50模型更能有效辨识轨面状态,模型性能更优良,模型轨道识别的精度高,误判率小。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为基于改进深度学习网络的轨面状态识别的方法简易流程图;

图2为ResNet-50基本结构图;

图3为测试集的识别结果图;

图4为测试集的识别精度图;

图5为优化后ResNet-50模型和ResNet-50模型训练集的accuracy-Epoch图;

图6为优化后ResNet-50模型和ResNet-50模型训练集的loss-Epoch图。

具体实施方式

下面结合实施例进一步解释和阐明,但具体实施例并不对本发明有任何形式的限定。

实施例1

如图1~2所示,本发明实施例公开了一种基于改进深度学习网络的轨面状态识别的方法,包括以下步骤:

S1:采集原始轨面状态图像,其轨面状态分为无污染物的干燥轨面、含有水分的潮湿轨面,以及含有润滑油和水混合的油污轨面3种类型;

S2:基于配准技术对所述原始轨面状态图像进行处理,获取训练图像数据集,采用ResNet-50网络构建轨面状态辨识模型,如图2所示,所述ResNet-50网络构建的轨面状态辨识模型由五个部分组成:一个输入层(Input),五个卷积组(Conv1~Conv5_x),一个平均池化层(Average pool),一个全连接层(fc)和一个输出层(Output),输入的数据通过五个卷积组(Conv1~ConV5_x)进行特征学习,第1个卷积组(Conv1)只含有一次卷积计算,第2-5个卷积组(Conv2_x~Conv5_x)包含多个相同的残差单元;提取特征后通过平均池化层的压缩保留其主要特征传给全连接层进行分类识别,输出其想要的结果;

S3:利用S2中的图像数据集对ResNet50模型进行迁移训练并测试,得到轨面状况识别深度学习网络模型,所述模型以残差网络ResNet-50作为骨干网络,引入迁移学习对网络结构和参数进行改进,所述基于迁移学习的ResNet-50优化过程分为预训练阶段和微调阶段;

其中,步骤S3的具体步骤为:

S3.1:预训练阶段,在ImageNet数据集上对ResNet50模型进行预训练,将ResNet-50网络模型在ImageNet数据集进行训练直至其分类准确率收敛,然后保存其模型参数,将搭建的网络模型参数进行初始化,并将准备好的图像数据样本集去训练所搭建的网络模型,其网络模型在训练过程中不断对模型进行调整,使其模型的损伤函数逐渐稳定且趋于0,模型参数在刚开始训练时会不断变化,直到分类准确率收敛的时候,将模型参数保存下来,方便下次对其它图像进行相同操作。

S3.2:微调阶段,将S3.1中预训练好的ResNet-50模型移除最后的分类层,预训练阶段剩下的ResNet-50模型保留输入层和前五个卷积层,并将这五个卷积层作为轨面图像数据的特征提取器,微调新的ResNet-50网络模型直到轨面状态图像分类准确率收敛,将ImageNet数据集训练好的ResNet-50的模型和参数迁移到自建轨面数据集;

上述预训练阶段剩下的ResNet-50模型去除掉了平均池化层和全连接层,替换为由全局平均池化层和全连接层组成自定义分类层,新全局平均池化层对整个特征图求平均值,并对整个ResNet-50网络从结构上做正则化防止过拟合;新全局平均池化层后加入三层新全连接层,新全连接层在模型进行迁移学习过程中,发挥“防火墙”功能,所述在前两层新全连接层引入Dropout控制其参数耦合,有效地防止前两层新全连接层的参数耦合太多,以有效抑制新全连接层过拟合,最后一层新全连接层连接Sigmoid逻辑划分回归器的函数从而对轨面状态进行分类。

进一步地,所述轨面状态分类完成后,输入轨面状态图像数据对处理后新的ResNet-50模型进行训练;在使用优化的ResNet-50模型对轨面状态图像进行训练时,要特别注意的是:开始训练的第一步要先固定没有被替换掉的ResNet-50网络层中的参数,相当于优化后的ResNet-50模型进行前向计算,但进行反向传递时不再更新参数,并且优化后的ResNet-50模型训练过程中只更新自定义的分类新全连接层中的参数。然后,选取一个相对较小的学习率进行训练,比如0.001。最后,可以有选择地在新全连接层的参数学习得差不多的时候,可以解冻没有被替换掉的ResNet-50网络层,再对整个ResNet-50网络进行训练。

进一步地,所述基于改进深度学习网络的轨面状态识别的方法采用实验验证其可行性。

本发明提出针对轨面状态识别的改进ResNet-50深度学习网络模型,模型使用了残差网络ResNet-50作为骨干网络,引入迁移学习对网络结构和参数进行改进,基于改进后的ResNet-50网络训练轨面状态图像数据,在保证精确度的前提下减少参数量,提升网络训练速度,优化后ResNet-50轨面辨识模型相比与传统ResNet-50模型更能有效辨识轨面状态,模型性能更优良,模型轨道识别的精度高,误判率小。

实施例2

在实施例1的基础上,为了验证优化后ResNet轨面辨识模型的可行性,应用实施例1的所述方法,采用Sigmoid激活函数分别对轨面图像进行辨识,实验参数设置如下:学习器选用Adam,选取学习率0.001,Dropout(随机关闭神经元概率)=0.5,Epoch(训练所有样本的次数)=50,batch_size(训练样本数量)=6;为了更好地直观识别效果,采用混淆矩阵分别表示测试集的识别结果和识别精度,分别如图3、图4所示。

图3是测试集的识别结果混淆矩阵,横轴代表预测轨面,纵轴代表真实轨面,矩阵每一行元素和代表样本的总数,矩阵对角线上元素分别表示干燥、潮湿、油污轨面识别正确个数。从图3中可以看出干燥、潮湿、油污轨面图像各115张,其中干燥轨面识别正确个数107张,误判成潮湿轨面8张,油污轨面0张;潮湿轨面识别正确个数106张,被误判成干燥轨面6张,油污轨面3张;油污轨面识别正确个数107张,被误判成干燥轨面4张,潮湿轨面4张。由此可知,基于优化的ResNet-50轨面状态辨识模型能有效识别不同轨面状态,误判率较低。

图4是测试集的识别精度混淆矩阵,矩阵对角线上元素分别代表干燥、潮湿、油污轨面识别正确精度。从图4可以观察到,干燥轨面识别正确率为0.9145,潮湿轨面识别正确率为0.8983,油污轨面识别正确率为0.9727。由此可知,采用优化的ResNet-50轨面状态辨识模型识别正确率在0.8983以上,具有较高的识别精度,模型性能表现良好。

实施例3

为了验证实施例1所述优化后ResNet-50模型的有效性,本实验将优化后ResNet-50模型与ResNet-50模型分别对轨面图像进行辨识,应用实施例1的所述方法,采用Sigmoid激活函数分别对轨面图像进行辨识,实验参数设置如下:学习器选用Adam,选取学习率0.001,Dropout(随机关闭神经元概率)=0.5,Epoch(训练所有样本的次数)=50,batch_size(训练样本数量)=6;两种模型对测试集的识别正确率如表1所示,优化后ResNet-50模型和ResNet-50模型随着Epoch(训练样本的次数)从1增加到50训练集的准确率(accuracy)和损失/收敛(loss)分布情况分别如图5、图6所示。

表2三种模型对测试集的识别正确率

从表1可以观察到加入迁移学习优化后的ResNet-50轨面辨识模型比ResNet-50轨面辨识模型精度更高,识别正确率达到92.75%,而ResNet-50轨面辨识模型识别正确率只有79.8%。

图5表示的是优化后ResNet-50模型和ResNet-50模型训练集的accuracy-Epoch(识别准确率)曲线,可以明显看到随着Epoch的增大优化后ResNet-50模型的准确率逐渐接近于1,而ResNet-50模型准确率逐渐接近于0.8。由此可知,优化后ResNet-50模型识别效果更好,性能更优良,模型轨道识别的精度高,误判率小。

图6表示的是优化后ResNet-50模型和ResNet-50模型训练集的loss-Epoch(收敛特性)曲线,可以观察到优化后ResNet-50模型loss收敛更为快速,随着Epoch增大loss呈波动下降趋势并逐渐向0靠近,而ResNet-50模型随着Epoch增大loss缓慢收敛,收敛时间也需更长。由此可知,优化后ResNet-50模型在相同Epoch收敛更为快速,收敛时间更短。

基于上述实验结果分析,本文所采用的优化后ResNet-50轨面辨识模型相比与传统ResNet-50模型更能有效辨识轨面状态,模型性能更优良,识别正确率可达到92.75%。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

技术分类

06120115921955