掌桥专利:专业的专利平台
掌桥专利
首页

一种掘进机刀具磨损大数据样本前处理效果评价方法

文献发布时间:2023-06-19 13:26:15



技术领域

本发明涉及地下工程技术领域中的掘进机刀具磨损控制技术领域,具体涉及掘进机刀具磨损大数据样本前处理效果评价方法。

背景技术

掘进机刀具磨损受到岩石坚硬程度、推力、扭矩、掘进里程等多种因素的影响,所以为了获取在施工现场实测得到的掘进机刀具磨损量样本与岩石坚硬程度、推力、扭矩、掘进里程等多种因素之间的统计学关系,往往通过多元回归分析、深度学习等方法进行统计学习分析。

然而通过多元回归分析、深度学习等方法得到的统计学模型仅仅反映了样本值之间的数学关系,模型泛化能力和可解释性不足。

为了提高掘进机刀具磨损量预测模型的泛化能力和可解释性,目前对掘进机刀具磨损量的前处理方法有:

应用磨损比耗指数预测滚刀磨损量的分层求和法(公开号:CN107180016A,公开日期:2017-09-19)将磨损量除以破岩体积进行前处理;

(秦银平,张竹清,孙振川,等.基于现场试验的TBM滚刀磨损分析及预测[J].隧道建设(中英文),2019,第39卷(11):1914~1921.)将磨损量数据除以破岩轨迹周长进行前处理;

(竺维彬,王晖,鞠世健.复合地层中盾构滚刀磨损原因分析及对策[J].现代隧道技术,2006(04):75~79+85.)将磨损量数据直接作为应变量样本,未进行前处理。

为了能够消除岩石自身性质差异、消耗的计算资源差异对前处理方法适用性评价的影响,科学定量地评价各种滚刀磨损量前处理深度在不同地层中的适用性,需要构造一种可以跨样本比较预测方法适用性的指标。

既有的样本值比较指标,如算术平均值、方差、偏差等统计量,由于没有考虑样本均值水平对样本值比较指标的影响,而掘进机刀具磨损预测偏差绝对值在不同地层中的大小差异较大,受地层条件影响较大,若直接利用这些指标评价预测方法进行评价,计算出来的统计值大小不能够反映预测方法精度的优劣,即既有的统计量不能进行跨样本比较。

所以,在掘进机刀具磨损量样本前处理手段中,目前只是零散的存在着多种数据前处理手段,缺少评价不同数据前处理手段有效性和相应的刀具磨损预测模型泛化能力的指标和方法。

发明内容

针对上述现有技术的不足,本发明提出了一种掘进机刀具磨损大数据样本前处理效果评价方法,通过消除岩石自身性质差异、消耗的计算资源差异对前处理方法适用性评价的影响,具有能够科学定量地评价各种滚刀磨损量前处理深度在不同地层中的适用性的性能。

包括如下步骤:

步骤一定义刀具磨损大数据样本的前处理几何深度;

步骤二构造跨样本误差比;

步骤三修正误差比影响因素;

步骤四构造前处理深度适用性跨样本评价指标;

步骤五优选前处理深度。

进一步地,步骤一具体为:将掘进机刀具磨损量除以1进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度0级;

将掘进机刀具磨损量除以长度物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度1级;

将掘进机刀具磨损量除以面积物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度2级;

将掘进机刀具磨损量除以体积物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度3级。

进一步地,步骤二具体为:通过提出跨样本误差比Re,如式(1),Re去除了量纲单位的影响,变成无量纲表达式,成为纯数,而且消除了样本均值水平对样本值比较指标的影响,将单纯的均方误差改造为Re这个可以进行跨样本比较的误差评价统计量,从而使得不同单位或者量级的指标能够放在同一数量级下进行比较和加权;

使用Re评价不同掘进机刀具磨损预测模型在不同地层中预测精度的大小差异以及预测方法的泛化能力;

式(1)中,MSE为一种预测方法应用于一组样本的预测后得到的均方误差,

avg为一组样本中的样本实测值绝对值的算术平均值。

进一步地,步骤三具体为:定义一个预测模型对一组实测样本进行预测并得到预测结果的全部过程为一次预测运算;

不同预测模型应用于不同样本时预测精度的差异,不但有数据前处理方法不同的因素,也有因消耗的计算资源差异而导致的精度差异;

按式(2)对Re进行计算资源消耗差异的修正,得到跨样本修正误差比CRe,rc为同一次预测运算所消耗的计算资源总量;

一次预测运算所消耗的计算资源总量可取该次预测运算累计占用计算机CPU的主频总数;

CRe=Re×rc (2)

CRe已经对Re中的计算资源差异因素进行了修正,CRe可以表示一种数据前处理方法对一种地层的适用程度。

进一步地,步骤四具体为:定义CRea为一个预测模型应用于样本空间中所有各地层的样本实测值预测后得到的各CRe在样本空间内的算术平均值,sCRe为一个预测模型应用于样本空间中所有各地层的样本实测值预测后得到的各CRe在样本空间内分布的标准差;

构造前处理深度适用性跨样本评价指标SIMS,如式(3),在考虑误差平均水平的同时,计入了误差分布离散程度对前处理方法泛化能力的影响;

所以,SIMS指标可以反映均值水平差异较大的多类样本条件下的不同掘进机刀具磨损量预测模型的数据前处理方法的普适性;

SIMS=|CRea+sCRe| (3)。

进一步地,步骤五具体为:统计得到各类预测模型的SIMS与大数据样本前处理几何深度级别数值之间的映射关系,并对样本空间内的该映射关系进行拟合,得到以大数据样本前处理几何深度级别数值为输入、以SIMS为输出的SIMS预测模型,取样本空间内的SIMS为最小值时的大数据样本前处理几何深度作为优选的前处理深度。

具体实施方法

本发明一种掘进机刀具磨损大数据样本前处理效果评价方法,包括以下步骤:

步骤一 定义刀具磨损大数据样本的前处理几何深度

从既有文献中统计出各种掘进机刀具磨损预测模型,以及各种预测模型所对应的掘进机刀具磨损量样本前处理方法。

统计既有的在不同地层中实测得到的掘进机刀具磨损量样本,在同种地层内获得的掘进机刀具磨损量样本属于同一组样本,统计范畴内的各组样本共同构成样本空间。

将掘进机刀具磨损量除以1进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度0级。

将掘进机刀具磨损量除以长度物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度1级。

将掘进机刀具磨损量除以面积物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度2级。

将掘进机刀具磨损量除以体积物理量进行刀具磨损数据样本前处理的前处理几何深度,定义为大数据样本前处理几何深度3级。

步骤二构造跨样本误差比

通过提出跨样本误差比Re,如式(1),Re去除了量纲单位的影响,变成无量纲表达式,成为纯数,而且消除了样本均值水平对样本值比较指标的影响,将单纯的均方误差改造为Re这个可以进行跨样本比较的误差评价统计量,从而使得不同单位或者量级的指标能够放在同一数量级下进行比较和加权。

所以,可以使用Re评价不同掘进机刀具磨损预测模型在不同地层中预测精度的大小差异以及预测方法的泛化能力。式(1)中,MSE为一种预测方法应用于一组样本的预测后得到的均方误差,avg为一组样本中的样本实测值绝对值的算术平均值。

步骤三修正误差比影响因素

定义一个预测模型对一组实测样本进行预测并得到预测结果的全部过程为一次预测运算。

不同预测模型应用于不同样本时预测精度的差异,不但有数据前处理方法不同的因素,也有因消耗的计算资源差异而导致的精度差异。

所以,按式(2)对Re进行计算资源消耗差异的修正,得到跨样本修正误差比CRe,rc为同一次预测运算所消耗的计算资源总量。

一次预测运算所消耗的计算资源总量可取该次预测运算累计占用计算机CPU的主频总数。

CRe=Re×rc (2)。

CRe已经对Re中的计算资源差异因素进行了修正,CRe可以表示一种数据前处理方法对一种地层的适用程度。

步骤四构造前处理深度适用性跨样本评价指标

定义CRea为一个预测模型应用于样本空间中所有各地层的样本实测值预测后得到的各CRe在样本空间内的算术平均值,sCRe为一个预测模型应用于样本空间中所有各地层的样本实测值预测后得到的各CRe在样本空间内分布的标准差。

构造前处理深度适用性跨样本评价指标SIMS,如式(3),在考虑误差平均水平的同时,计入了误差分布离散程度对前处理方法泛化能力的影响。

当SIMS增大时,相应的数据前处理方法普适性降低,当SIMS降低时,相应的数据前处理方法普适性增强。

所以,SIMS指标可以反映均值水平差异较大的多类样本条件下的不同掘进机刀具磨损量预测模型的数据前处理方法的普适性。

SIMS=|CRea+sCRe| (3)。

步骤五优选前处理深度

统计得到各类预测模型的SIMS与大数据样本前处理几何深度级别数值之间的映射关系,并对样本空间内的该映射关系进行拟合,得到以大数据样本前处理几何深度级别数值为输入、以SIMS为输出的SIMS预测模型,取样本空间内的SIMS为最小值时的大数据样本前处理几何深度作为优选的前处理深度。

相关技术
  • 一种掘进机刀具磨损大数据样本前处理效果评价方法
  • 一种隧道掘进机刀具磨损量评估方法
技术分类

06120113678053