掌桥专利:专业的专利平台
掌桥专利
首页

一种融合设计知识的采样方法、系统、设备及终端

文献发布时间:2024-04-18 19:58:21


一种融合设计知识的采样方法、系统、设备及终端

技术领域

本发明属于信息技术服务技术领域,尤其涉及一种融合设计知识的采样方法、系统、设备及终端。

背景技术

目前较为流行的采样方法(如优化拉丁方试验设计方法、均匀试验设计方法等)均是以设计空间的几何距离作为判断依据进行样本点的生成,对于已有的设计知识(数据库知识、专家知识等)无法进行集成,也无法实现设计知识指导下的样本点生成。

船型优化过程中会产生大量的仿真数据,并且通过对数据进行分析可以发现会发现某些几何特征参数或设计变量对相关性能指标的影响具有一定的变化规律,如果能够合理地利用这一部分知识,对采样过程进行指导,无疑能够大幅提高优化的效率和精度。

通过上述分析,现有技术存在的问题及缺陷为:

1.现有的采样方法主要以设计空间的几何距离作为判断依据进行样本点的生成,无法充分利用已有的设计知识(数据库知识、专家知识等)进行样本点的生成和优化过程的指导。

2.现有的采样方法无法灵活地适应复杂的设计空间和多维度的设计变量,导致采样点分布不均匀、采样效率低下等问题。

3.现有的采样方法无法很好地处理参数间的相互作用和复杂的非线性关系,无法准确地预测设计变量对性能指标的影响。

4.现有的采样方法需要大量的仿真数据,计算成本高,优化效率低下,同时也有可能存在过拟合和欠拟合等问题。

发明内容

针对现有技术存在的问题,本发明提供了一种融合设计知识的采样方法、系统、设备及终端。

本发明是这样实现的,一种融合设计知识的采样方法,融合设计知识的采样方法包括:

S101,利用已有的专家知识或数据库知识确定Beta分布的参数α和β的取值,构建先验参数分布;

S102,利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点;

S103,计算性能指标,并将数据储存于数据库;

S104,利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差;

S105,判断整个过程是否达到最大迭代次数的终止条件,若达到最大迭代次数,则退出整个过程;若未达到最大迭代次数,则利用后验参数分布推导式进行更新。

进一步,S101中,若不存在专家知识或数据库知识,则直接采样均匀分布作为先验参数分布。

进一步,S104中,样本的均值和方差计算公式如下:

式中,H(x)表示性能指标;

进一步,S105中,后验参数分布的更新公式如下:

式中:

ψ=ζ

进一步,Beta分布及其参数估计包括:

如果随机变量X服从两个形状参数(Shape parameter)α(α>0)和β(β>0)的概率分布,且概率密度函数为:

则称X服从Beta分布,记为X~Be(α,β),式中Γ(·)是Gamma函数,Beta分布的期望和方差分别为:

设X服从Beta分布,则X的一阶原点矩和二阶原点矩分别为:

由样本矩估计总体矩得:

解得α和β的矩估计分别为:

进一步,玻尔兹曼(Boltzmann)参考分布包括:

为了实现优化过程中参数分布的收敛,利用玻尔兹曼(Boltzmann)参考分布指导Beta分布的参数α和β的更新。

Boltzmann分布的表达式为:

式中,T

Boltzmann选取方案的表达式为:

进一步,后验参数分布更新包括:

在Beta参数分布下的参数更新公式进行推导,若采用的参数分布为Beta分布:

式中,

利用混合分布将参考分布映射到便于抽样的参数分布,公式如下:

式中,k为迭代数,系数ζ

采用混合概率分布

通过推导可得:

通过推导可得:

式中:

ψ=ζ

推导后可得到后验参数分布的参数,随着数据不断的增加,Beta分布的PDF曲线在最优解附近的概率不断增大。

本发明的另一目的在于提供一种应用所述的融合设计知识的采样方法的融合设计知识的采样系统,融合设计知识的采样系统包括:

先验参数分布构建模块,用于利用已有的专家知识或数据库知识确定Beta分布的参数和的取值,构建先验参数分布;

样本点生成模块,用于利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点;

性能指标计算模块,用于计算性能指标,并将数据储存于数据库;

均值方差计算模块,用于利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差;

终止模块,用于判断整个过程是否达到最大迭代次数的终止条件,若达到最大迭代次数,则退出整个过程;若未达到最大迭代次数,则利用后验参数分布推导式进行更新。

本发明的另一目的在于提供一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的融合设计知识的采样方法的步骤。

本发明的另一目的在于提供一种信息数据处理终端,信息数据处理终端用于实现所述的融合设计知识的采样系统。

结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:

第一,针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:

本发明将专家知识或数据库知识与Beta分布进行融合,实现了性能指导下的样本点生成,解决了传统基于几何距离的采样方法未能利用设计知识进行采样的问题,从而实现了优化的效率和质量的提高。

第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:

本发明基于专家知识或优化仿真数据库中的知识(均值、方差),提出了一种融入设计知识的采样方法,以实现性能指导下的采样。本发明对给定的问题若存在专家知识(如公式型知识、图像型知识、描述型知识等)或数据库知识,可以通过上述知识确定先验参数分布的参数;利用迭代过程中的数据更新参数分布中控制概率密度函数的参数,使得最佳性能的方案被选中的概率越来越高,从而实现知识指导采样的“按需分配”。本发明实现了将设计知识融入到概率密度函数中指导优化过程中样本的生成。

本发明的技术方案填补了国内外业内技术空白:传统采样方法(如UD方法和LHS方法)未能充分利用仿真样本集中隐含的设计知识信息,导致样本在空间内“分配”不合理。本发明将专家知识和数据库知识融入到参数分布的构建当中,利用Beta分布参数迭代更新公式,实现了优化过程中知识指导下的采样。

第三,每个步骤的具体的技术效果和显著的技术进步具体为:

S101:利用已有的专家知识或数据库知识确定Beta分布的参数和的取值,构建先验参数分布;

技术效果:通过利用已有的设计知识,可以构建更为合理和准确的先验参数分布,提高样本点的采样效率和优化精度。

S102:利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点;

技术效果:通过利用Beta分布的随机数生成器,可以生成满足初始先验分布下的样本点,实现对设计空间的覆盖和采样点的生成。

S103:计算性能指标,并将数据储存于数据库;

技术效果:通过计算性能指标并将其储存于数据库中,可以利用已有的数据进行后续的分析和处理,提高采样效率和优化精度。

S104:利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差;

技术效果:通过利用已有的数据计算满足相应参考分布下的样本均值和方差,可以更好地了解参数的变化规律和参数之间的相互作用关系,提高采样效率和优化精度。

S105:判断整个过程是否达到最大迭代次数的终止条件,若达到最大迭代次数,则退出整个过程;若未达到最大迭代次数,则利用后验参数分布推导式进行更新。

技术效果:通过判断整个过程是否达到最大迭代次数的终止条件,可以实现采样过程的自动化和高效化;利用后验参数分布推导式进行更新,可以不断地优化设计变量,提高优化精度和效率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的融合设计知识的采样方法的流程图;

图2是本发明实施例提供的Beta分布概率密度函数示意图;

图3是本发明实施例提供的函数二维性能空间结构图;其中,(a)为Levy函数,(b)为Griewank函数;

图4是本发明实施例提供的变量PDF曲线变化(Levy函数)示意图;其中,(a)为x

图5是本发明实施例提供的变量PDF曲线变化(Griewank函数)示意图;其中,(a)为x

图6是本发明实施例提供的样本点分布与函数值等高图(Levy函数)示意图;其中,(a)第0次,(b)第5次,(c)第10次,(d)第15次;

图7是本发明实施例提供的样本点分布与函数值等高图(Griewank函数)示意图;其中,(a)第0次,(b)第5次,(c)第10次,(d)第15次。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

针对现有技术存在的问题,本发明提供了一种融合设计知识的采样方法、系统、设备及终端,下面结合附图对本发明作详细的描述。

本发明实施例提供的融合设计知识的采样方法包括:

(1)首先利用已有的专家知识或数据库知识确定Beta分布的参数α和β的取值,构建先验参数分布;若不存在专家知识或数据库知识则直接采样均匀分布作为先验参数分布。

(2)利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点。

(3)计算性能指标,并将数据储存于数据库。

(4)利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差,以满足Bolzman参考分布为例,样本的均值和方差计算公式如下:

式中,H(x)表示性能指标;

(5)判断整个过程是否达到最大迭代次数的终止条件,若达到最大迭代次数,则退出整个过程;若未达到最大迭代次数,则利用后验参数分布推导式进行更新,后验参数分布的更新公式如下:

式中

ψ=ζ

基本原理

1.Beta分布及其参数估计

如果随机变量X服从两个形状参数(Shape parameter)α(α>0)和β(β>0)的概率分布,且概率密度函数为:

则称X服从Beta分布,记为X~Be(α,β),式中Γ(·)是Gamma函数,Beta分布的期望和方差分别为:

其函数图像如图2所示。其中,若参数α和β取为1,PDF图像为直线,此时Beta分布为均匀分布,表示区间内的取值概率处处相等。

设X服从Beta分布,则X的一阶原点矩和二阶原点矩分别为:

由样本矩估计总体矩得:

解得α和β的矩估计分别为:

2.玻尔兹曼(Boltzmann)参考分布

为了实现优化过程中参数分布的收敛,利用玻尔兹曼(Boltzmann)参考分布指导Beta分布的参数α和β的更新。

Boltzmann分布的表达式为:

式中,T

Boltzmann选取方案的表达式为:

3.后验参数分布更新

在Beta参数分布下的参数更新公式进行推导。

若采用的参数分布为Beta分布:

式中,

利用混合分布将参考分布映射到便于抽样的参数分布,公式如下:

式中,k为迭代数,系数ζ

采用混合概率分布

通过推导可得:

通过式(19)和(20)可得:

式中

ψ=ζ

通过式(21)和式(22)即可得到后验参数分布的参数,随着数据不断的增加,Beta分布的PDF曲线在最优解附近的概率不断增大。

作为本发明实施例的具体的实现方案如下:

S101:利用已有的专家知识或数据库知识确定Beta分布的参数和的取值,构建先验参数分布;

实现过程:

1.收集已有的专家知识或数据库知识,包括设计变量的取值范围、变量之间的关系、历史数据等。

2.根据收集到的知识,确定Beta分布的参数和的取值,例如可以使用最大似然估计或贝叶斯方法计算Beta分布的参数。

3.构建先验参数分布,即将Beta分布的参数代入Beta分布公式中,得到先验概率密度函数。

S102:利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点;

实现过程:

1.利用Beta分布的随机数生成器,生成满足Beta分布的随机数。

2.将生成的随机数代入设计变量中,得到初始样本点。

3.根据需要生成的样本点数量,重复执行步骤1和步骤2,生成所需数量的样本点。

S103:计算性能指标,并将数据储存于数据库;

实现过程:

1.将生成的样本点代入相应的仿真模型中进行仿真计算。

2.根据仿真结果计算性能指标。

3.将样本点和对应的性能指标储存于数据库中。

S104:利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差;

实现过程:

1.从数据库中读取所有已有的样本点和对应的性能指标。

2.根据样本点的分布情况,选择相应的参考分布,例如正态分布、Beta分布等。

3.利用已有的数据计算满足相应参考分布下的样本均值和方差,作为后验分布的参数。

S105:判断整个过程是否达到最大迭代次数的终止条件,若达到最大迭代次数,则退出整个过程;若未达到最大迭代次数,则利用后验参数分布推导式进行更新。

实现过程:

1.判断是否达到最大迭代次数,若达到则退出整个过程;若未达到,则继续进行优化。

2.根据已有的数据和后验分布的参数,利用贝叶斯公式推导式计算后验分布的参数。

3.利用计算得到的后验分布的参数,生成新的样本点。

4.重复执行S103和S104,计算新的样本点对应的性能指标和后验分布的参数。

5.返回步骤1,直至达到最大迭代次数或满足其他终止条件。本发明的应用实施例提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行融合设计知识的采样方法的步骤。

本发明的应用实施例提供了一种信息数据处理终端,信息数据处理终端用于实现融合设计知识的采样系统。

本发明实施例在研发或者使用过程中取得了一些积极效果,和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。

选取Levy函数和Griewank函数作为测试函数对融合设计知识的采样方法进行测试。

Levy函数

式中,i=1,…,n,测试维度n=2,变量范围为-10≤x

Griewank函数

式中,i=1,…,n,测试维度n=2,变量范围为-10≤x

图3为函数二维性能空间结构示意图。Levy函数整体空间结构较为简单,空间内仅存在一个全局最优解且分布在设计空间中心;而Griewank函数整体空间较为复杂,空间内存在着众多的局部最优解。因此,对于Levy函数,假设存在先验知识,变量x

每次迭代产生100个样本,共进行15次迭代。迭代过程中,Levy函数的参数变化情况见表1;

表1设计变量先验参数分布的参数值(Levy函数)

Griewank函数的参数变化情况见表2,两个函数的Beta分布参数值整体呈现增大的趋势。

表2设计变量先验参数分布的参数值(Griewank函数)

为了便于观察Beta分布在迭代过程中的变化情况,分别取第0,5,10,15次迭代的参数绘制PDF曲线。随着迭代数的增加,两个函数的设计变量在最优值附近的概率不断增大。Levy函数在15次迭代之后x

Griewank函数在15次迭代之后x

图6是Levy函数的第0、5、10、15次迭代的样本分布与函数值等高图,图中蓝色区域为函数值最小区域,从(a)-(d)的过程可以看出,融合设计知识的采样方法所产生的样本随着知识的增加,样本点向最优点(图像中心位置)不断靠近。至第15次迭代时基本上分布在最优解附近。

图7是Griewank函数的第0、5、10、15次迭代的样本分布与函数值等高图,图7(a)的样本点在空间内呈现四处散乱的状态,随着样本知识的增加,图7(b)和图7(c)的样本点逐渐远离变量空间的边界,向中间区域不断靠近,图7(d)样本点基本上分布在最优点(图像中心位置)较小的区域内。

对比两个函数,Griewank函数迭代之后的效果没有Levy函数好,主要是由于Griewank函数的设计空间较为复杂,存在着较多局部最优解,从而影响了FKDS方法的效率。

实施例1:

在船型优化过程中,针对船体流线和船型设计变量进行优化。利用已有的专家知识或数据库知识,确定Beta分布的参数和的取值,构建先验参数分布。利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点。通过计算性能指标并将其储存于数据库中,利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差。根据判断整个过程是否达到最大迭代次数的终止条件,若未达到最大迭代次数,则利用后验参数分布推导式进行更新,不断优化设计变量,提高优化精度和效率。

实施例2:

在新药物研发过程中,针对药物分子结构进行优化。利用已有的专家知识或数据库知识,确定Beta分布的参数和的取值,构建先验参数分布。利用满足Beta分布的随机数生成器,生成满足初始先验分布下的样本点。通过计算性能指标并将其储存于数据库中,利用数据库中所有的数据计算满足相应参考分布下的样本均值和方差。根据判断整个过程是否达到最大迭代次数的终止条件,若未达到最大迭代次数,则利用后验参数分布推导式进行更新,不断优化药物分子结构,提高优化精度和效率。

应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

相关技术
  • 一种配电网一二次融合设备采样精度测试方法
  • 一种知识问答中答题用户的推荐方法、装置和终端设备
  • 一种知识问答中答题用户的身份验证方法、装置和终端设备
  • 一种车辆安全充电的方法、系统、终端设备及车载设备
  • 一种核电站设备可靠性分析方法、系统及终端设备
  • 知识的自动生成方法、知识的自动生成系统、知识的自动生成程序、自动设计方法及其自动设计系统
  • 知识的自动生成方法、知识的自动生成系统、自动设计方法及其自动设计系统
技术分类

06120116483468