掌桥专利:专业的专利平台
掌桥专利
首页

一种煤质分析模型训练方法、装置、电子设备和存储介质

文献发布时间:2024-04-18 19:58:30


一种煤质分析模型训练方法、装置、电子设备和存储介质

技术领域

本发明实施例涉及煤质检测技术,尤其涉及一种煤质分析模型训练方法、装置、电子设备和存储介质。

背景技术

在燃煤电厂中,入炉煤质检验主要采用离线分析技术,即通过现场采样后,送至实验室进行制备和分析。然而,离线分析技术检测效率低下,难以满足电厂在线/快速煤质检验的优化运行需求。近年来,激光诱导击穿光谱(Laser-Induced BreakdownSpectroscopy,LIBS)凭借其操作简单易行、无需复杂样品预处理和多元素同步在线分析等独特优势,在煤质检验领域备受关注。LIBS进行煤质检验的工作原理是将一束脉冲激光聚焦在样品表面并激发生成等离子体,由高分辨率光谱仪采集等离子体冷却过程发射的光辐射信号,通过分析具有特定波长和强度的光谱获得煤样的元素种类和浓度信息,接着用每个煤样对应的光谱建立煤质分析模型。

目前,基于LIBS建立的煤质分析模型泛化能力不足,容易使模型出现过拟合现象,严重影响煤质分析的准确性。

发明内容

本发明实施例提供一种煤质分析模型训练方法、装置、电子设备和存储介质,可以根据灰分值和挥发分值对燃煤样本进行样本集划分,得到训练集、验证集和测试集。训练集输入算法中,建立待测指标(发热量、含碳量)模型,并通过留一交叉验证进行寻优。利用验证集对模型进一步优化,获得最终的煤质分析模型。该方法增强了煤质分析模型的泛化能力,提高了煤质分析模型的可靠性,避免模型出现过拟合现象。

第一方面,本发明实施例提供一种煤质分析模型训练方法,包括:

若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出所述初始煤质分析模型的训练集、验证集和测试集;其中,所述煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;其中,所述待分析煤质指标包括含碳量和发热量;

根据所述训练集,通过留一交叉验证进行寻优,得到满足所述收敛条件的候选煤质分析模型;

基于所述验证集对所述候选煤质分析模型进行优化,得到最终煤质分析模型。

第二方面,本发明实施例提供一种煤质分析模型训练装置,所述装置包括:

数据整理模块,用于若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出所述初始煤质分析模型的训练集、验证集和测试集;其中,所述煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;其中,所述待分析煤质指标包括含碳量和发热量;

模型训练模块,用于根据所述训练集,通过留一交叉验证进行寻优,得到满足所述收敛条件的候选煤质分析模型;

模型优化模块,用于基于所述验证集对所述候选煤质分析模型进行优化,得到最终煤质分析模型。

第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的煤质分析模型训练方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的煤质分析模型训练方法。

本发明实施例中,若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出初始煤质分析模型的训练集、验证集和测试集;其中,煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;其中,待分析煤质指标包括含碳量和发热量;根据训练集,通过留一交叉验证进行寻优,得到满足收敛条件的候选煤质分析模型;基于验证集对候选煤质分析模型进行优化,得到最终煤质分析模型。即本发明实施例中,可以将燃煤样本划分为训练集、验证集和测试集,用训练集对煤质分析模型进行训练,用验证集对煤质分析模型进行进一步地优化,增强了煤质分析模型的泛化能力,避免模型出现过拟合现象,提高煤质分析模型的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的煤质分析模型训练方法的一个流程图;

图2为本发明实施例提供得到满足收敛条件的候选煤质分析模型的一个流程图;

图3为本发明实施例提供的煤质分析模型训练装置的结构示意图;

图4为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

图1为本发明实施例提供的煤质分析模型训练方法的一个流程图,本发明实施例的方法可以增强煤质分析模型的泛化能力,避免模型出现过拟合现象,提高煤质分析模型的准确性。该方法可以由本发明实施例提供的煤质分析模型训练装置来执行,该装置可采用软件和/或硬件的方式实现。电子设备可以是电动车的控制器等,以下实施例将以该装置集成在电子设备中为例进行说明,参考图1,该方法具体可以包括如下步骤:

步骤101、若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出初始煤质分析模型的训练集、验证集和测试集。

其中,煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值。其待分析煤质指标包括含碳量和发热量。初始煤质分析模型是还未被训练好的模型。训练集是用于训练初始煤质分析模型的样本集合,验证集是用于优化候选煤质分析模型的样本集合。煤质光谱数据指对煤炭进行光谱分析得到的数据,包括可见光谱、红外光谱、紫外光谱等。这些数据可以用于煤炭的定性与定量分析,例如确定煤炭的种类、含碳量和含硫量等参数。另外,煤炭的光谱数据也可以用于研究煤的化学成分、结构特征等方面以便更好地了解煤的本质和应用价值。

在一种可选的实施方式中,在获取到煤质样本库后,根据所有燃煤样本的灰分值和挥发分值对所有燃煤样本进行聚类分组,得到多组燃煤样本;按照预设比例分别从每组燃煤样本中筛选出训练集样本、验证集样本和测试集样本;将所有组燃煤样本的训练集样本进行组合,得到训练集;将所有组燃煤样本的验证集样本进行组合,得到验证集;将所有组燃煤样本的测试集样本进行组合,得到测试集。

步骤102、根据训练集,通过留一交叉验证进行寻优,得到满足收敛条件的候选煤质分析模型。

其中,候选煤质分析模型是通过训练集对初始煤质分析模型进行训练后的模型。具体地,训练集中包括大量的燃煤样本,以及各个燃煤样本对应的待分析煤质指标值。待分析煤质指标值是用户需要得到的燃煤样本的指标值,例如发热量、含碳量等指标。交叉验证是一种常用的模型评估方法,用于评估机器学习模型的性能和泛化能力。留一交叉验证是交叉验证的一种特殊形式。在留一交叉验证中,对于一个包含N个样本的数据集,将会进行N次训练和评估,每次都使用N-1个样本进行训练,然后用被排除的一个样本进行测试。最后,将N次评估的结果取平均作为模型的性能评估指标。

在一种可选的实施方式中,使用当前样本对初始煤质分析模型进行训练,并通过留一交叉验证进行寻优,包括:从训练集中挑选出一个样本作为当前样本,基于当前样本的光谱数据、当前样本对应的待分析煤质指标的指标值建立初始煤质分析模型的光谱矩阵和指标矩阵;计算光谱矩阵的主成分和指标矩阵的主成分的方差,并基于方差确定光谱系数矩阵、光谱残差矩阵、指标系数矩阵和指标残差矩阵;将光谱矩阵的主成分和光谱系数矩阵的转置矩阵的乘积与光谱残差矩阵相加,得到光谱回归矩阵;将指标矩阵的主成分和指标系数矩阵的转置矩阵的乘积与指标残差矩阵相加,得到指标回归矩阵。获取光谱矩阵的主成分和指标矩阵的主成分之间的相关性,当相关性大于预设值时,基于光谱残差矩阵和指标残差矩阵确定目标残差矩阵;基于光谱系数矩阵和指标系数矩阵确定目标系数矩阵;将光谱矩阵的主成分和目标系数矩阵的转置矩阵的乘积,与目标残差矩阵相加,得到目标回归矩阵。当目标残差矩阵的精度小于预设精度,或者,当指标矩阵的主成分的数量小于预设数量时,将光谱残差矩阵更新为光谱矩阵,将目标残差矩阵更新为指标矩阵,基于更新后的指标矩阵调整初始煤质分析模型的模型参数,重复执行从训练集中挑选出一个样本作为当前样本的步骤,直到得到满足收敛条件的候选煤质分析模型。

本方案中,初始煤质分析模型的指标矩阵是根据待分析煤质指标建立的,即根据发热量和含碳量建立的。因此,根据训练集训练出的候选煤质分析模型可以用于分析煤质中的发热量和含碳量。而样本集的划分是根据燃煤样本的灰分值和挥发分值进行聚类分析得到的。即在本方案中,没有直接利用含碳量和发热量对燃煤样本进行分类,而是选择与发热量、含碳量相关性高的灰分值和挥发分值对燃煤样本进行分类。如此,增强了煤质分析模型的泛化能力,得到比直接利用含碳量和发热量对样本进行分组更好的预测分析结果。

步骤103、基于验证集对候选煤质分析模型进行优化,得到最终煤质分析模型。

其中,验证集用于进一步对候选分析煤质模型进行优化。具体地,在用训练集训练初始煤质分析模型,得到候选煤质分析模型后,可以用验证集对候选煤质模型进行评估,找到的最佳的模型参数(即得到最佳的指标矩阵时的模型参数)。进一步地,通过测试集来验证模型的预测结果。

本方案实施例中,可选的,基于验证集对候选煤质分析模型进行优化,得到最终煤质分析模型,包括:将验证集输入至候选煤质分析模型,得到验证集对应的评价指标值;基于验证集对应的评价指标值对候选煤质分析模型进行优化,得到最终煤质分析模型。

本方案中,评价指标包括决定系数、均方根误差以及平均绝对误差。决定系数是一种用于评估回归模型拟合优度的统计指标。它表示因变量的变异性能够由模型解释的比例,即模型对数据的拟合程度。均方根误差是一种常用的衡量模型预测值与实际观测值之间差异的指标,它用于评估模型在给定数据上的拟合程度。均方根误差可以通过计算预测值与实际观测值之间差异的平方的均值,并取其平方根得到。平均绝对误差是一种常用的衡量模型预测值与实际观测值之间差异的指标,用于评估模型在给定数据上的拟合程度。平均绝对误差可以通过计算预测值与实际观测值之间差异的绝对值的平均值得到。

具体地,将验证集中的所有样本输入进候选煤质分析模型,得到候选煤质分析模型输出的验证集的所有样本对应的各个评价指标值,若各个评价指标值没有达到各个预设评价指标值,则对候选煤质模型的模型参数进行调整,直到找到的最佳的模型参数。

本实施例的技术方案,若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出初始煤质分析模型的训练集、验证集和测试集;其中,煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值。根据训练集,通过留一交叉验证进行寻优,得到满足收敛条件的候选煤质分析模型;基于验证集对候选煤质分析模型进行优化,得到最终煤质分析模型。本实施例的技术方案,可以将燃煤样本划分为训练集、验证集和测试集,用训练集对煤质分析模型进行训练,用验证集对煤质分析模型进行进一步优化,增强了煤质分析模型的泛化能力,避免模型出现过拟合现象,提高煤质分析模型的准确性。

图2为本发明实施例提供得到满足收敛条件的候选煤质分析模型的一个流程图,本实施例是在上述实施例的基础上进行细化。具体的方法可如图2所示,该方法可以包括如下步骤:

步骤201、根据所有燃煤样本的灰分值和挥发分值对所有燃煤样本进行聚类分组,得到多组燃煤样本。

其中,聚类分组是对所有燃煤样本进行聚类分析后,根据分析结果得到的分组。聚类分析是将数据分类到不同的类或者簇这样的一个过程,同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。本方案中,可以利用社会科学统计软件(Statistical Package forthe Social Sciences,SPSS)对燃煤样本进行聚类分析。具体包括:在分类过程中将灰分和挥发分作为变量进行聚类分析,按照ward法度量所有样本之间的亲疏程度,将最相近的首先聚成一小类;再度量剩余样本和该小类间的亲疏程度,并将当前最相近的样本或小类再聚成一类,如此反复,直到所有样本聚成一类。判定样本之间亲疏程度的区间距离为欧式距离,标准化数值为0-1。灰分值是指煤在一定温度下完全燃烧后的残留物的量,在实际应用中,各种用途的煤都要求灰分越低越好。灰分增高会使得煤的发热量降低。此外,煤的灰分越高,大量排放护造时也要带走不少热量。因而煤的灰分越高,它在燃烧和气化过程中也就越容易结渣而影响正常操作。

在一种可选的实施方式中,燃煤样本库中包括各个燃煤样本的编号,以及各个燃煤样本的灰分值和挥发分值,将所有燃煤样本的灰分值和挥发分值输入进SPSS中,利用SPSS以灰分值和挥发分值为基准,对所有燃煤样本进行聚类信息,即将灰分值和挥发分值接近的燃煤样本分为一组。进一步地,得到SPSS输出的多组燃煤样本和每组燃煤样本中每个燃煤样本的编号。

步骤202、按照预设比例分别从每组燃煤样本中筛选出训练集样本、验证集样本和测试集样本。

其中,训练集是用于训练初始化煤质分析模型的样本集合,验证集是用于优化候选煤质分析模型的样本集合。预设比例可以是8:1:1。具体地,在得到多组燃煤样本后,可以按照预设比例分别从每组燃煤样本中筛选出训练集样本、验证集样本和测试集样本。

示例性的,假设共有3组燃煤样本,3组燃煤样本中分别有60个、30个、10个燃煤样本。则按照8:1:1的比例,可以从第1组燃煤样本中筛选出48个训练集样本,6个验证集样本,6个测试集样本。从第2组燃煤样本中筛选出24个训练集样本,3个验证集样本,3个测试集样本。从第3组燃煤样本中筛选出8个训练集样本,1个验证集样本,1个测试集样本。

步骤203、将所有组燃煤样本的训练集样本进行组合,得到训练集;将所有组燃煤样本的验证集样本进行组合,得到验证集;将所有组燃煤样本的测试集样本进行组合,得到测试集。

具体地,在得到训练集样本、验证集样本和测试集样本后,分别将各组燃煤样本的训练集样本、验证集样本和测试集样本进行组合,得到训练集、验证集和测试集。示例性的,第1组燃煤样本中筛选出48个训练集样本,6个验证集样本,6个测试集样本。第2组燃煤样本中筛选出24个训练集样本,3个验证集样本,3个测试集样本。第3组燃煤样本中筛选出8个训练集样本,1个验证集样本,1个测试集样本。则训练集包括:第1组的48个训练集样本+第2组的24个训练集样本+第3组的8个训练集样本=80个训练集样本。验证集包括:第1组的6个验证集样本+第2组的3个验证集样本+第3组的1个验证集样本=10个验证集样本。测试集包括:第1组的6个测试集样本+第2组的3个测试集样本+第3组的1个测试集样本=10个测试集样本。

步骤204、从训练集中提取出一个燃煤样本作为当前样本,基于当前样本的光谱数据和当前样本对应的待分析煤质指标的指标值建立初始煤质分析模型的光谱矩阵和指标矩阵。

具体地,待分析煤质指标包括发热量和含碳量,指标矩阵包括含碳量值和发热量值。在提取出当前样本后,基于当前样本的光谱数据建立初始煤质分析模型的光谱矩阵,基于当前样本对应的待分析煤质指标的指标值建立初始煤质分析模型的指标矩阵。其中,光谱矩阵和指标矩阵为成分矩阵,成分矩阵是矩阵的一种。成分矩阵由主成分法得到的因素负荷矩阵,采用同一组被试进行比较时,必须保证两种实验处理之间没有相互影响,同时要平衡位置顺序。成分矩阵包括主成分和轴向量等。

在步骤201-步骤204中,根据与发热量、含碳量相关性高的灰分值和挥发分值对燃煤样本进行了聚类分析,按一定空间距离对样本进行分组,根据分组结果得到训练集、验证集和测试集。构建分组后样本集与待测指标(含碳量、发热量)的指标矩阵,通过训练集获得初始模型,利用验证集对模型进行优化。这样的建模方式增强了煤质分析模型的泛化能力,有效避免了模型过拟合现象的发生。

步骤205、基于光谱矩阵和指标矩阵,确定初始煤质分析模型的光谱回归矩阵和指标回归矩阵。

其中,当前样本的光谱矩阵是通过当前样本的光谱数据得到的矩阵。当前样本的指标矩阵是通过当前样本对应的待分析煤质指标的指标值、灰分值和挥发分值得到的矩阵。本方案中,可选的,基于光谱矩阵和指标矩阵,确定初始煤质分析模型的光谱回归矩阵和指标回归矩阵,包括如下步骤A1-步骤A3:

步骤A1:计算光谱矩阵的主成分和指标矩阵的主成分的方差,并基于方差确定光谱系数矩阵、光谱残差矩阵、指标系数矩阵和指标残差矩阵。

具体地,在建立光谱矩阵和指标矩阵后,可以对光谱矩阵和指标矩阵进行主成分分析。在主成分分析的过程中得到光谱矩阵的主成分和指标矩阵的主成分的方差。

示例性的,根据当前样本的光谱数据建立光谱矩阵为X,指标矩阵为Y,设X的第一个主成分为t

进一步地,利用最小二乘法确定光谱系数矩阵、光谱残差矩阵、光谱残差矩阵和指标残差矩阵。最小二乘残差法是一种常用的线性回归分析方法。它的主要思想是通过寻找最小化数据点与拟合直线之间距离平方和的方法来确定最佳拟合直线的系数。

步骤A2:将光谱矩阵的主成分和光谱系数矩阵的转置矩阵的乘积与光谱残差矩阵相加,得到光谱回归矩阵。

具体地,在确定出光谱系数矩阵与光谱残差矩阵后,将光谱矩阵的主成分和光谱系数矩阵的转置矩阵的乘积与光谱残差矩阵相加,得到光谱回归矩阵。

示例性的,光谱系数矩阵为t

步骤A3:将指标矩阵的主成分和指标系数矩阵的转置矩阵的乘积与指标残差矩阵相加,得到指标回归矩阵。

具体地,在确定出指标系数矩阵与指标残差矩阵后,将指标矩阵的主成分和指标系数矩阵的转置矩阵的乘积与指标残差矩阵相加,得到指标回归矩阵。

示例性的,指标系数矩阵为u

通过上述步骤,可以基于最小二乘法的定量分析方法,实现对复杂样本进行高效分析,准确的得到光谱回归矩阵和指标回归矩阵,为后续调整、优化模型参数奠定了基础。

步骤206、基于光谱回归矩阵和指标回归矩阵确定目标回归矩阵,并根据光谱回归矩和目标回归矩阵更新指标矩阵。

具体地,基于光谱回归矩阵和指标回归矩阵对指标回归矩阵进行回归建模,得到目标回归矩阵。本方案中,可选的,基于光谱回归矩阵和指标回归矩阵确定目标回归矩阵,包括如下步骤B1-步骤B2:

步骤B1:获取光谱矩阵的主成分和指标矩阵的主成分之间的相关性,当相关性大于预设值时,基于光谱残差矩阵和指标残差矩阵确定目标残差矩阵,基于光谱系数矩阵和指标系数矩阵确定目标系数矩阵。

对光谱矩阵的主成分和指标矩阵的主成分继续进行主成分分析,得到光谱矩阵的主成分和指标矩阵的主成分之间的相关性。当其相关性大于预设值时,表示计算过程无异常。进一步地,基于光谱残差矩阵和指标残差矩阵,用最小二乘法计算出目标残差矩阵。基于光谱系数矩阵和指标系数矩阵,用最小二乘法计算出目标系数矩阵。

步骤B2:将光谱矩阵的主成分和目标系数矩阵的转置矩阵的乘积,与目标残差矩阵相加,得到目标回归矩阵。

具体地,在得到目标残差矩阵和目标系数矩阵后,对上一步骤的指标回归矩阵再次进行回归,用目标回归矩阵代替指标回归矩阵。示例性的,根据光谱矩阵的主成分和指标矩阵的主成分之间的相关性,基于主成分t

进一步地,在得到目标回归矩阵后,根据光谱回归矩和目标回归矩阵更新指标矩阵。本方案中,可选的,更新指标矩阵,包括:当目标残差矩阵的精度小于预设精度,或者,当指标矩阵的主成分的数量小于预设数量时,将光谱残差矩阵更新为光谱矩阵,将目标残差矩阵更新为指标矩阵。

具体地,当目标残差矩阵F的精度没有达到预设的精度要求时,或者主成分(即潜变量)数量没有达到上限时,将X中主成分t

进一步地,将X和Y用矩阵表示,得到:

X=TP

在完成训练后,对于验证集和测试集中一个煤样对应的光谱数据x,首先可以利用W计算各主成分,即t

步骤207、基于更新后的指标矩阵调整初始煤质分析模型的模型参数,重复执行从训练集中挑选出一个样本作为当前样本的步骤,直到得到满足收敛条件的候选煤质分析模型。

其中,模型参数可以决定模型的性能。具体地,在得到指标矩阵(即初始煤质模型输出的当前样本的预测指标值)后,利用预先设定的损失函数计算指标矩阵和当前样本的真实指标值之间的差距,并根据该差距不断的调整模型参数,使得模型预测出的值更加接近真实值,以此提高模型的精准度。

上述步骤中,可以准确的确定出目标回归矩阵,并根据光谱回归矩和目标回归矩阵更新指标矩阵,准确的得到初始煤质分析模型输出的当前样本对应的预测指标值,为后续准确的调整模型参数奠定了基础。

本发明实施例中,根据所有燃煤样本的灰分值和挥发分值对所有燃煤样本进行聚类分组,得到多组燃煤样本。按照预设比例分别从每组燃煤样本中筛选出训练集样本、验证集样本和测试集样本。将所有组燃煤样本的训练集样本进行组合,得到训练集;将所有组燃煤样本的验证集样本进行组合,得到验证集;将所有组燃煤样本的测试集样本进行组合,得到测试集。从训练集中提取出一个燃煤样本作为当前样本,基于当前样本的光谱数据和当前样本对应的待分析煤质指标的指标值建立初始煤质分析模型的光谱矩阵和指标矩阵。基于光谱矩阵和指标矩阵,确定初始煤质分析模型的光谱回归矩阵和指标回归矩阵。基于光谱回归矩阵和指标回归矩阵确定目标回归矩阵,并根据光谱回归矩和目标回归矩阵更新指标矩阵,基于更新后的指标矩阵调整初始煤质分析模型的模型参数,重复执行从训练集中挑选出一个样本作为当前样本的步骤,直到得到满足收敛条件的候选煤质分析模型。本实施例的技术方案,将灰分值和挥发分值作为聚类分析变量对所有燃煤样本进行聚类分析,再从每一类燃煤样本中抽取少量样本分别作为验证集和测试集,剩余样本作为训练集对煤质分析模型进行训练,使得模型在训练过程中关注到了每一类燃煤样本。如此,可以增强模型的泛化性,避免模型出现过拟合现象,进一步提高煤质分析模型的准确性。

图3为本发明实施例提供的煤质分析模型训练装置的结构示意图,该装置适用于执行本发明实施例提供的煤质分析模型训练方法。如图3所示,该装置具体可以包括:

数据整理模块301,用于若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出所述初始煤质分析模型的训练集、验证集和测试集;其中,所述煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;

模型训练模块302,用于根据所述训练集,通过留一交叉验证进行寻优,得到满足所述收敛条件的候选煤质分析模型;

模型优化模块303,用于基于所述验证集对所述候选煤质分析模型进行优化,得到最终煤质分析模型。

可选的,模型优化模块303,具体用于:将所述验证集输入至所述候选煤质分析模型,得到所述验证集对应的评价指标值;

基于所述验证集对应的评价指标值对所述候选煤质分析模型进行优化,得到最终煤质分析模型。

可选的,数据整理模块301,具体用于:根据所有燃煤样本的灰分值和挥发分值对所有燃煤样本进行聚类分组,得到多组燃煤样本;

按照预设比例分别从每组燃煤样本中筛选出训练集样本、验证集样本和测试集样本;

将所有组燃煤样本的训练集样本进行组合,得到所述训练集;将所有组燃煤样本的验证集样本进行组合,得到所述验证集;将所有组燃煤样本的测试集样本进行组合,得到所述测试集。

可选的,所述燃煤样本库还包括各个燃煤样本对应的预先获取到的待分析煤质指标的指标值,模型训练模块302,具体用于:从所述训练集中挑选出一个样本作为当前样本,基于所述当前样本的光谱数据和所述当前样本对应的待分析煤质指标的指标值建立所述初始煤质分析模型的光谱矩阵和指标矩阵;

基于所述光谱矩阵和所述指标矩阵,确定所述初始煤质分析模型的光谱回归矩阵和指标回归矩阵,并基于所述光谱回归矩阵和所述指标回归矩阵确定目标回归矩阵;

根据所述光谱回归矩阵和所述目标回归矩阵更新所述指标矩阵,并基于更新后的指标矩阵优化所述初始煤质分析模型的模型参数,重复执行所述从所述训练集中挑选出一个样本作为当前样本的步骤,直到得到满足所述收敛条件的候选煤质分析模型。

可选的,模型训练模块302,还用于:计算所述光谱矩阵的主成分和所述指标矩阵的主成分的方差,并基于所述方差确定光谱系数矩阵、光谱残差矩阵、指标系数矩阵和指标残差矩阵;

将所述光谱矩阵的主成分和所述光谱系数矩阵的转置矩阵的乘积与所述光谱残差矩阵相加,得到所述光谱回归矩阵;

将所述指标矩阵的主成分和所述指标系数矩阵的转置矩阵的乘积与所述指标残差矩阵相加,得到所述指标回归矩阵。

可选的,模型训练模块302,还用于:获取所述光谱矩阵的主成分和所述指标矩阵的主成分之间的相关性,当所述相关性大于预设值时,基于所述光谱残差矩阵和所述指标残差矩阵确定目标残差矩阵;

基于所述光谱系数矩阵和所述指标系数矩阵确定目标系数矩阵;

将所述光谱矩阵的主成分和所述目标系数矩阵的转置矩阵的乘积,与所述目标残差矩阵相加,得到所述目标回归矩阵。

可选的,模型训练模块302,还用于:当所述目标残差矩阵的精度小于预设精度,或者,当所述指标矩阵的主成分的数量达到预设数量时,将所述光谱残差矩阵更新为所述光谱矩阵,将所述目标残差矩阵更新为所述指标矩阵。

本发明实施例所提供的煤质分析装置可执行本发明任意实施例所提供的煤质分析模型训练方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本发明任意方法实施例中的描述。

图4为本发明实施例提供的电子设备的结构示意图,参考图4,其示出了适于用来实现本发明实施例的电子设备的计算机系统12的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的电子设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及煤质分析,例如实现本发明实施例所提供的一种煤质分析模型训练方法:若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出所述初始煤质分析模型的训练集、验证集和测试集;其中,所述煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;根据所述训练集,通过留一交叉验证进行寻优,得到满足所述收敛条件的候选煤质分析模型;基于所述验证集对所述候选煤质分析模型进行优化,得到最终煤质分析模型。

本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明所有发明实施例提供的一种煤质分析模型训练方法:若初始煤质分析模型不满足预先设置的收敛条件,则从预先获取到的煤质样本库的所有燃煤样本中整理出所述初始煤质分析模型的训练集、验证集和测试集;其中,所述煤质样本库至少包括各个燃煤样本的光谱数据、待分析煤质指标、灰分值和挥发分值;根据所述训练集,通过留一交叉验证进行寻优,得到满足所述收敛条件的候选煤质分析模型;基于所述验证集对所述候选煤质分析模型进行优化,得到最终煤质分析模型。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 一种书法训练方法、装置、电子设备及存储介质
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 一种漆面识别方法、装置、存储介质及电子设备
  • 一种植物观赏方法、装置、电子设备和存储介质
  • 一种题目搜索、批改方法、装置、电子设备和存储介质
  • 日志分析模型训练方法、装置、电子设备以及存储介质
  • 用户情感分析模型训练方法、装置、电子设备及存储介质
技术分类

06120116500641