掌桥专利:专业的专利平台
掌桥专利
首页

一种用来探索钙钛矿氧化物的结构,组分和性质的方法

文献发布时间:2023-06-19 12:07:15


一种用来探索钙钛矿氧化物的结构,组分和性质的方法

技术领域

本发明设计钙钛矿材料的结构,组分和性质领域。是一种用来探索钙钛矿氧化物的结构,组分和性质关系的方法。特别地,该方法结合了特征工程和线性回归算法,基于特征工程创建了大量描述符,通过特征选择得到重要的描述符子集,再通过线性回归算法找到最优描述符并得到钙钛矿氧化物的结构,组分和性质的关系。

技术背景

在材料发现中,探索材料的结构,组分和性质之间的关系是非常关键的。材料化合物的巨大组成可能性为理解结构,组分和性质之间的关系提出了巨大的挑战。探索结构,组分和性质之间的关系源于在实验室的大量实验,这些实验通常需要各种各样的设备,需要投入大量的时间和精力,从而使探索材料结构,组分和性质的关系变得非常艰难的。

近5年来,机器学习在材料的发现中得到了广泛的应用,机器学习可以大幅度降低计算成本,缩短开发周期。因此,它是一种最有效的替代实验室实验的方法。然而,机器学习过程的复杂性和模型的可解释性的缺乏,使得很难推导出简单明了的描述材料结构与成分之间关系的公式。因此,寻找一种合理的方法来探讨材料的结构,组分和性质之间的关系就显得尤为重要。

钙钛矿氧化物因其优异的电催化性能在电催化剂和燃料电池中受到广泛关注。钙钛矿氧化物指具有钙钛矿结构类型的ABO

到目前为止,已经报道了一些寻找有效描述符的方法,如符号回归算法。这种方法的目的是在给定的特征空间中寻找几个描述目标属性的重要描述符,或者寻找一些隐藏的数学公式,从而利用这些重要的描述符来预测目标变量。这些方法虽然取得了很好的效果,但需要依赖很多条件,如数据量大、合适的算法等,这对于不熟悉计算机算法的材料科学家来说显然是困难的。因此,这些算法的效率非常低。

发明内容

为了解决现有的技术问题,本发明的目的在于克服已有技术的不足,提供一种用来探索钙钛矿氧化物的结构,组分和性质关系的方法。该方法有助于在没有先验知识的情况下探索钙钛矿氧化物的结构,组分和性质的关系,找到描述结构,组分和性能之间关联的表达式,节约实验时间和资源,加速了材料的设计和优化。本发明采用下述技术方案实现:

一种用来探索钙钛矿氧化物的结构,组分和性质关系的方法,包括以下步骤:

1)从文献中收集钙钛矿氧化物的数据集,作为该方法的数据集样本;

2)再对数据集进行预处理,对缺损数值的样品进行删除处理,并将完整的数据样本值进行皮尔逊相关系数分析,找到与目标变量相关性强的特征;

3)根据步骤2)中挑选的特征,基于特征工程建立新的描述符;

4)对生成的新的描述符进行特征选择,找到最优描述符子集;

5)再对最优描述符子集进行线性回归拟合,找到最优描述符;

6)通过线性回归算法,将找到的最优描述符作为输入变量,得到相应的结构,组分和性质的关系。

现在对以上技术方案实现步骤进行进一步的说明。

所述步骤3)中的特征工程通过变换函数和特征组合构建新的描述符,变换函数有助于缩放特征的大小,或者将特征与目标变量之间的非线性关系转化为线性关系;特征组合是特征工程中非常有用的方法之一,它将两个或多个类特征组合成一个特征;特征组合是所有可能的特征值的交叉乘法,每个组合的特征实际上代表了各自信息的协同作用;有9个变换函数:x,x

进一步地,所述步骤4)中对描述符进行特征选择的方法采用循序向前特征选择方法,算法如下:

选用特征子集训练模型。此处的模型指循序向前特征选择方法采用的底层算法,这里采用梯度提升回归算法。用验证数据集对模型进行评估。依据循序向前搜索算法,对不同的特征子集进行上述操作。依据评估结果,选出最佳的特征子集。

进一步地,所述步骤4)中对描述符进行特征选择的方法采用循序向前特征选择方法,该方法采用梯度提升回归算法作为底层算法,梯度提升回归算法如下:

梯度提升回归算法通过添加新的回归树以最小化每次迭代中的目标函数,每棵新树都是在上一棵树的残差上进行学习,并且都沿着损失函数的负梯度方向进行训练,通过多次迭代,训练多个弱学习器,最终将这些弱学习器进行线性组合产生一个强学习器。

进一步地,所述步骤5)中对最优描述符子集进行回归拟合的方法采用线性回归算法,算法如下:

线性回归使用最小平方法或梯度下降法来找出给定数据集的最优模型系数;最小平方法通过最小化训练数据里每个观察实例的拟合值和实际值之间的平方误差之和来做到;梯度下降法通过每次迭代里更新系数来找出最优模型系数;每次更新都会确保训练数据的模型拟合值和实际值之和是减小的;经过几次迭代,它就会通过向负梯度的方向移动找出局部最小值,从而找到给定数据集的最优模型系数。

本发明与现有技术相比,具有如下显而易见的突出实质性特点和显著优点:

1.该方法有助于在没有先验知识的情况下探索ABO

2.本发明在整个过程中不涉及实验并且不使用化学用品,不产生化学污染,符合绿色环保理念;并且易于实现,适合推广应用;

3.本发明方法简单易行,节约实验时间和资源,成本低,适合推广使用。

附图说明

此处说说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施的限定。在附图中:

图1为本发明实施例1中对数据样本值进行皮尔逊相关系数分析的热力图;每个方框中的填充分数对应相关的皮尔逊相关系数的值。

图2为本发明实施例1中基于特征工程的描述符生成过程图。

图3为本发明施例1中钙钛矿氧化物的最佳描述符与目标变量稳定性的散点图;线表示稳定性的预测值,散点表示稳定性的实际值。

具体实施方式

为使本发明的目的、技术方案和优点更加清除明白,下面结合具体的实施例和符图,对本发明做进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本说明,并不作为对本发明的限定。

实施例一:

在本实施例中,参见图1,一种用来探索钙钛矿氧化物的结构,组分和性质关系的描述符递归自动获取方法,包括如下步骤:

1)从文献中收集了4912组钙钛矿氧化物的数据集,作为该方法的数据集样本;

钙钛矿氧化物数据集描述如表1所示:

表1.钙钛矿氧化物材料数据集描述

2)再对数据集进行预处理,对缺损数值的样品进行删除处理,并将完整的数据样本值进行皮尔逊相关系数分析,找到与目标变量相关性强的特征。图1 显示了钙钛矿的几种特征与目标变量稳定性的相关程度,上述所有特征与目标变量稳定性的相关性都很强,将上述所有特征作为有效特征。

3)根据步骤2)中挑选的特征,基于特征工程建立新的描述符;特征工程通过变换函数和特征组合构建新的描述符,变换函数在给定特征中引入算法和聚合算子以生成新的描述符,变换函数有助于缩放特征的大小,或者将特征与目标变量之间的非线性关系转化为线性关系;特征组合是特征工程中非常有用的方法之一,它将两个或多个类特征组合成一个特征;特征组合是所有可能的特征值的交叉乘法,每个组合的特征实际上代表了各自信息的协同作用。图2表示基于特征工程的特征生成过程。x

4)对生成的新的描述符进行特征选择,找到最优描述符子集;

进一步地,所述步骤4)中对描述符进行特征选择的方法采用循序向前特征选择方法,算法如下:

选用特征子集训练模型。此处的模型指循序向前特征选择方法采用的底层算法,这里采用梯度提升回归算法。用验证数据集对模型进行评估。依据循序向前搜索算法,对不同的特征子集进行上述操作。依据评估结果,选出最佳的特征子集。

进一步地,所述步骤4)中对描述符进行特征选择的方法采用循序向前特征选择方法,该方法采用梯度提升回归算法作为底层算法,算法如下:

梯度提升回归算法通过添加新的回归树以最小化每次迭代中的目标函数,每棵新树都是在上一棵树的残差上进行学习,并且都沿着损失函数的负梯度方向进行训练,通过多次迭代,训练多个弱学习器,最终将这些弱学习器进行线性组合产生一个强学习器。

5)再对最优描述符子集进行线性回归拟合,找到最优描述符;通过线性回归模型选择最佳描述符和相应的评价指标如表2所示:

进一步地,所述步骤5)中对最优描述符子集进行回归拟合的方法采用线性回归算法,算法如下:

线性回归使用最小平方法或梯度下降法来找出给定数据集的最优模型系数;最小平方法通过最小化训练数据里每个观察实例的拟合值和实际值之间的平方误差之和来做到;梯度下降法通过每次迭代里更新系数来找出最优模型系数;每次更新都会确保训练数据的模型拟合值和实际值之和是减小的;经过几次迭代,它就会通过向负梯度的方向移动找出局部最小值,从而找到给定数据集的最优模型系数。

表2.过线性回归模型选择最佳描述符和相应的评价指标

6)通过线性回归算法,将找到的最优描述符

以上所述的具体实施方式结合附图,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,本发明不限于上述实施例,还可以根据本发明的发明创造的目的做出多种变化,凡在本发明技术方案的精神和原理之内,所做的任何修改、修饰、替代、组合、或简化等,均应包含在本发明的保护范围之内。

相关技术
  • 一种用来探索钙钛矿氧化物的结构,组分和性质的方法
  • 基于多组分A位共掺杂镍基钙钛矿氧化物材料及使用方法
技术分类

06120113175116