掌桥专利:专业的专利平台
掌桥专利
首页

一种按需快速构建超表面的机器学习方法

文献发布时间:2023-06-19 09:30:39


一种按需快速构建超表面的机器学习方法

技术领域

本发明涉及阵列天线技术领域,特别涉及一种按需快速构建超表面的机器学习方法。

背景技术

超材料是一种由具有显著电磁(EM)特性的亚波长单位元结构组成的人工复合物,通过操纵单位元结构的几何形状和大小,可以调整电磁模式,精确定制光学元件中的电磁波前,因此引起了极大的关注。至今,超材料已迅速发展成为一门与物理、材料科学和通信技术密切相关的学科,并广泛应用于成像、微纳米光学和量子信息领域。超表面作为一种二维的超材料形式,更易于制作和集成,为实现超薄、具有一定电磁特性的组件和系统提供了一种新颖的方法。虽然超表面具有各种奇妙的特性,但由于单位元结构中的多级磁共振,对电磁波反射幅度和相位的影响难以计算。因此,很难为特定的光学响应设计一个完全合适的超表面阵列。

近年来,超表面建模和分析由电磁仿真软件完成,如高频结构模拟器(HFSS)和基于迭代数值全波计算的计算机仿真技术(CST),如矩量法(MOM)、有限元方法(FEM)、有限积分技术(FIT)和时域有限差分法(FDTD)。这些分析方法涉及对单位元进行大量试错,验证每个几何尺寸,然后进行优化。对于涉及有限几何数据集的简单超表面,可以计算精确的光学响应。然而,在高精度超表面的探索中,结构参数在微米尺寸和纳米尺度上,参数与响应的连接变得高度非线性。这种遍历试错的方法不再适用。

自Hebb于1949年启动基于神经心理学的机器学习以来,机器学习在解决不同学科的复杂问题中得到了广泛的应用。在经典的机器学习算法中,K最近邻算法(KNN)在大型样本数据的回归中表现出巨大的潜力。利用该算法,可能揭示几何参数与响应之间的隐藏关系。由此,如何基于K最近邻算法(KNN)设计提供一种可以加快复杂超表面和光学结构的按需设计的模型,用以避免了复杂的建模操作和数值计算成为了申请人亟待解决的技术问题。

发明内容

本发明的目的在于,提供一种按需快速构建超表面的机器学习方法。本发明可以避免复杂的建模操作和数值计算,能够加快复杂超表面和光学结构的按需设计,具有高速度、高精度、高准确性的优点。

为解决上述技术问题,本发明提供的技术方案如下:按需快速构建超表面的机器学习方法,包括以下步骤:

(1)获取超表面结构参数、对应的CST计算的电磁响应集合和工作频率;

(2)建立前向KNN模型,将超表面结构参数以及工作频率进行多项式回归和零均值标准化后作为前向KNN模型的输入,对前向KNN模型进行训练,得到前向PS-KNN模型;

(3)建立反向KNN模型,将电磁响应集合以及工作频率进行多项式回归和零均值标准化后作为反向KNN模型的输入,对反向KNN模型进行训练,得到反向PS-KNN模型;

(4)将前向PS-KNN模型和反向PS-KNN模型进行交叉验证,实现前向PS-KNN模型和反向PS-KNN模型的准确预测。

上述的按需快速构建超表面的机器学习方法,所述的超表面结构参数包括长度、宽度和高度中的一个或多个几何变量。

前述的按需快速构建超表面的机器学习方法,所述电磁响应包括相位以及振幅的实部和虚部;在获取实部和虚部后,通过下式解决反射幅值和相位不连续性问题:

Amplitude=(real

Phase=arctan(imag/real);

式中:Amplitude是振幅,Phase是相位,real是实部,imag是虚部。

前述的按需快速构建超表面的机器学习方法,步骤(2)中,所述多项式回归方程如下:

式中:x

利用多项式回归方程使得原始线性独立问题回到线性相关,输入向量从4个纬度增加到35个纬度,用以提高准确性。

前述的按需快速构建超表面的机器学习方法,所述零均值标准化如下:

式中:μ表示样本数据的平均值,σ是标准差,x是1×35向量。

前述的按需快速构建超表面的机器学习方法,步骤(3)中,所述多项式回归方程如下:

式中:x

前述的按需快速构建超表面的机器学习方法,在前向KNN模型中和反向KNN模型中,距离测量P为2和邻居K的数量为5,并依据平均均方误评估性能。

前述的按需快速构建超表面的机器学习方法,其特征在于:所述的交叉验证是将反向PS-KNN模型输出的超表面结构参数输入到正向PS-KNN模型中,由正向PS-KNN模型输出实部和虚部,用以消除预测结果和目标的差异。

与现有技术相比,本发明具有以下有益效果:

1、本发明通过建立前向KNN模型和反向KNN模型,在两个模型的训练中,由于特征较少且高度非线性,因此通过多项式回归,利用额外的矢量交互可以显著地提高了两个模型的准确性,而且鉴于多项式回归后的数据在特征和维度上差异较大,会造成模型的训练慢和训练效果差的问题,因此本发明还通过对数据进行零均值标准化,用以解决训练速度慢和效果差的问题;本发明将前向PS-KNN模型和反向PS-KNN模型进行交叉验证,实现前向PS-KNN模型和反向PS-KNN模型的准确预测,并且结合前向PS-KNN模型和反向PS-KNN模型的双向结构,既可以根据超表面参数求出电磁响应,又可以根据电磁响应求出超表面参数。与传统的超表面设计相比,本发明避免了基于求解大量微积分公式的基本物理方法,而是转换为数据驱动的方法,节省了大量的仿真,在瞬间实现了按需设计,而且两个模型具有非常好的数值预测效果。

2、本发明在对前向KNN模型的训练中,采用地是振幅以及相位的实部和虚部作为预测目标,而不是振幅和相位,这是因为相位不连续的突变数据会造成前向KNN模型的分化,影响预测的准确性,因此本发明通过实部和虚部与相位以及振幅的关系从而解决了反射磁磁和相位不连续的问题,大大的提高了预测的准确性。

3、本发明在训练过程中优化调整了两个模型的距离测量P和邻居K的数量,由于模型训练过程中,如果K太小,则测试集的泛化错误将放大,如果相邻的实例点恰好是一个噪点,那么预测值将是不正确的,即K的减少意味着整体模型变得更加复杂,并且很容易出现过度拟合。同样,如果K太大,整个体系结构也会过于简单化,数据预测也会有一个不可估量的偏差。因此本发明通过以牺牲了额外的模型构造和反复的试验和误差为代价,不断的进行优化调整,最终确定了最佳参数,实现了预测结果的准确性。

4、本发明还优化了交叉验证的方法,使得前向PS-KNN模型和反向PS-KNN模型之间形成了一个闭环网络,用于进一步消除预测结果和目标之间的差异,提高准确率和预测速率。

附图说明

图1是本发明实施例建立的超表面的单位元结构材料和形状;

图2是超表面的单位元结构样本的反射振幅和相位响应;

图3是虚部和实部对应于振幅和相图;

图4是实部的预测值和模拟值对比图;

图5是虚部的预测值和模拟值对比图;

图6是振幅的预测值和模拟值对比图;

图7是相位的预测值和模拟值对比图;

图8是三个模型的预测值的直方图;

图9是反向PS-KNN模型输出的a、b、c三个几何参数的MSE直方图;

图10是八个单位元结构的表现和顶视图;

图11是本发明设计的聚焦阵列图;

图12是平面波沿-Z方向传播示意原理图;

图13是CST仿真的聚焦远场图;

图14是电场分布图;

图15是Matlab计算的电场图;

图16是聚焦阵列在232THz时二维增益图;

图17是半最大能量密度的全宽度图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明,但并不作为对本发明限制的依据。

实施例1:按需快速构建超表面的机器学习方法:包括以下步骤:

(1)获取超表面结构参数、对应的CST计算的电磁响应集合和工作频率;

(2)建立前向KNN模型,将超表面结构参数以及工作频率进行多项式回归和零均值标准化后作为前向KNN模型的输入,对前向KNN模型进行训练,得到前向PS-KNN模型;

(3)建立反向KNN模型,将电磁响应集合以及工作频率进行多项式回归和零均值标准化后作为反向KNN模型的输入,对反向KNN模型进行训练,得到反向PS-KNN模型;

(4)将前向PS-KNN模型和反向PS-KNN模型进行交叉验证,实现前向PS-KNN模型和反向PS-KNN模型的准确预测。

实施例2:按需快速构建超表面的机器学习方法,包括以下步骤:

(1)获取超表面结构参数、对应的CST计算的电磁响应集合和工作频率;目前绝大多数关于超表面的研究都是基于金属表面分裂环结构的几何形状,金属作为介电基板上的贴片粘贴。为了一般适用性,申请人确认了如图1所示超表面的单位元结构材料和形状,因为它具有高反射振幅和高相位覆盖。银被选为金属材料,并始终用于金属介电超表面。对于介电板,首选介电常数为2.2的Teflon,它是一种耐高温耐腐蚀的合成聚合物材料,广泛应用于天线和光学器件。该超表面具有5个单位元结构参数:h、d、a、b、c。介电板和银片h的高度固定为0.1um,介电板的长度为1um。银片的其他三个参数a、b和c被视为变量,以确定单位元结构的形状。a、b和c的值从0.01um到0.39um,步长为0.01um。为了防止单位元结构发生突变,a大于b或c。频率设置在从220到240THz的近红外波段,并离散成1001工作频率。通过扫描参数空间并附加了所选的频率,产生了大约2.7×10

在建立前向KNN模型之间,通过CST对上述超表面的单位元结构的反射特性进行全面评估,获取超表面的单位元结构的电磁响应(振幅和相位),该如图2所示,该超表面的单位元结构具有高振幅反射,但相位显示234THz谐振频率附近的不连续性(虚线部分),由于相位不连续的突变数据会造成前向KNN模型的分化,影响预测的准确性。相比之下,虚部和实部对应于振幅和相位如图3所示,从图3中可以看出,实部和虚部是光滑和连续的,因此采用相位以及振幅的实部和虚部作为前向NN模型的预测目标,并用以下公式解决反射幅值和相位不连续性问题:

Amplitude=(real

Phase=arctan(imag/real);

式中:Amplitude是振幅,Phase是相位,real是实部,imag是虚部。

(2)建立前向KNN模型,将超表面结构参数以及工作频率进行多项式回归(Polynomial Regression)和零均值标准化(Standardization)后作为前向KNN模型的输入,对前向KNN模型进行训练,得到前向PS-KNN模型;

具体的,所述超表面结构参数包括a、b、c三个几何变量,将a、b、c连同工作频率一同作为前向KNN模型的输入向量,在训练过程中,由于特征少,且高度非线性,因此输入向量的多项式回归是必要的。经过申请人反复验证,将多项式增加至三次方,具有最佳的拟合效果。所述多项式回归方程如下:

式中:x

利用多项式回归方程使得原始线性独立问题回到线性相关,输入向量从4个纬度增加到35个纬度,用以提高准确性。

鉴于多项式回归后的数据在特征和维度上差异较大,会造成模型的训练慢和训练效果差的问题,通过对数据进行零均值标准化,用以解决训练速度慢和效果差的问题;所述零均值标准化如下:

式中:μ表示样本数据的平均值,σ是标准差,x是1×35向量。

在经过零均值标准化后,申请人在训练过程中不断优化调整了两个模型的距离测量P和邻居K的数量,由于模型训练过程中,如果K太小,则测试集的泛化错误将放大,如果相邻的实例点恰好是一个噪点,那么预测值将是不正确的,即K的减少意味着整体模型变得更加复杂,并且很容易出现过度拟合。同样,如果K太大,整个体系结构也会过于简单化,数据预测也会有一个不可估量的偏差。因此本发明通过以牺牲了额外的模型构造和反复的试验和误差为代价,不断的进行优化调整,得到距离测量P为2和邻居K的数量为5的最佳参数。

为了验证经过多项式回归和零均值标准化的前向KNN模型的准确性,申请人采用没有经过多项式回归和零均值标准化的前向KNN模型进行对比,选取220-240THz对应的41个步长为1THz的工作频率进行采样,实部、虚部、振幅和相位的对比结果如图4-7所示。从图4-6中可以看出,上述两个模型的实部、虚部和相位的误差范围相对较小,但是未经过多项式回归和零均值标准化的前向KNN模型的振幅拟合,而且由于泛华效果较差,实部和虚部的MSE(平均均方误差)提高到了0.02198,而经过多项式回归和零均值标准化前向KNN模型(以下简称前向PS-KNN模型)的MSE为3.463×10

此外,申请人还利用了神经网络和决策树回归器分别构造了另外两个预测网络,用于与本实施例的前向PS-KNN模型进行预测准确性对比。在神经网络中,4个几何输入输入两个大小为{100,1024}的全连接层,然后参数转换为1×32×32尺寸,然后进入两个卷积层。卷积层之后,6×8×8数据点均匀向下采样到6×4×4点,以压缩特征量,接下来,向量被平展到1×96尺寸的全连接层,最后预测实部部和虚部。在决策树回归器中构造模型,算法如下:

其中f表示模型输出的回归树值;M是M区域除以输入空间;R代表单元格数据集;m是单位数除以输入空间,这些单位是R

首先,确定最佳分段变量和最佳分片点,也就是说,查找C

其中y(实际和虚部)表示输出变量和x(几何变量:a,b和c)是输入变量。然后根据最优分段变量将输入空间连续划分为两个区域:

最后,重复每个区域的过程,直到满足条件。

申请人在a、b和c的变量范围内,随机选择了三组几何变量;(a)组:a=0.251um、b=0.13um和c=0.348um;(b)组:a=0.223um,b=0.03um,c=0.07um;(c)组:a=0.09um,b=0.238um,c=0.122um。利用神经网络和决策树回归器分别构造两个预测网络以及本实施例中前向PS-KNN模型分别用于预测,和比较预测结果与CST的仿真结果,为了演示直观,申请人绘制如图8所示的三个模型的预测值的直方图,从图8中可以看到,与前向PS-KNN模型相比,使用神经网络建的模型和决策树回归构建的模型的预测结果有一个相当大的误差,其预测结果的MSE上升到2×10

(3)建立反向KNN模型,将电磁响应集合以及工作频率进行多项式回归和零均值标准化后作为反向KNN模型的输入,对反向KNN模型进行训练,得到反向PS-KNN模型;

所述多项式回归方程如下:

式中:x

所述的零均值标准化步骤与步骤(2)中一致;

本步骤借鉴前向PS-KNN模型的经验,交换输入和输出,将实部、虚部和工作频率作为反向KNN模型的输入,a、b、c三个几何变量作为输出,在训练过程中,申请人发现a的MSE小于b和c,如图9所示,a的MSE集中在0.16×10

(4)为了尽量减少数据差异的影响,申请人将前向PS-KNN模型和反向PS-KNN模型进行交叉验证,即将反向PS-KNN模型输出的超表面结构参数输入到正向PS-KNN模型中,由正向PS-KNN模型输出实部和虚部,用以消除预测结果和目标的差异,实现前向PS-KNN模型和反向PS-KNN模型的准确预测。

具体的,申请人将目标设定为8个元原子,相位梯度为45度,为了获得较高的光学效率,将反射振幅的最小阈值设定为0.8。具体设计的值如表1所示:

表1

首先,申请人将实部和虚部输入到反向PS-KNN模型中。在220THz-240THz区间,取相距1THz的21个工作频率进行预测。经过反复试验和误差验证,在232THz条件下,最终的a、b、c的预测值误差最小,拟合最高,CST仿真验证结果如表2所示和图10所示。

表2

从图中我们可以看到,预测的a、b和c的阶段完美地包含了带有232THz的整个2π相位。本发明可以在30s左右就可以得到最佳匹配参数值,而使用传统设计方法,用CST连续逼近可能需要数小时或数天,由此可以大大提高预测速率。

为了进一步地验证本发明可直接用于设计光学器件(聚焦阵列),申请人将Python和CST仿真相结合。在获得了预测的a、b、c之后,CST立即设计了基于VBA语言的Python驱动的数组。基于此,利用本发明设计的聚焦阵列如图11所示,八个元原子由内而外分布。利用CST进行了全波模拟,求解了超表面结构的反射谱,在模拟中,设置平面波沿-Z方向传播,原理图如图12所示。通过计算232THz阵列的远场和近场分布,直观地展示了反射聚焦效应。图13给出了CST仿真的聚焦远场图、图14给出了电场分布图、图15给出了Matlab计算的电场图。由于CST模拟的反射电场中包含入射波,用Matlab将其减去得到实际的电场。电场平面设置在离超表面8um的位置,因为光斑最小,聚焦效果最好,聚焦转换效率约为80%。为了提高聚焦后超表面的清晰度,申请人还绘制了如图16所示的二维增益图和如图17所示的半最大能量密度的全宽度图。从图16和图17可以看出,该聚焦阵列获得了大约25dBi的总增益,半最大能量密度的全宽为1um(0.77λ)。说明利用本实施例中的前向PS-KNN模型和反向PS-KNN模型预测的超表面在232Hz的指定频率下达到了亚波长聚焦,性能良好。

综上所述,本发明通过建立前向KNN模型和反向KNN模型,在两个模型的训练中,由于特征较少且高度非线性,因此通过多项式回归,利用额外的矢量交互可以显著地提高了两个模型的准确性,而且鉴于多项式回归后的数据在特征和维度上差异较大,会造成模型的训练慢和训练效果差的问题,因此本发明还通过对数据进行零均值标准化,用以解决训练速度慢和效果差的问题;本发明将前向PS-KNN模型和反向PS-KNN模型进行交叉验证,实现前向PS-KNN模型和反向PS-KNN模型的准确预测,并且结合前向PS-KNN模型和反向PS-KNN模型的双向结构,既可以根据超表面参数求出电磁响应,又可以根据电磁响应求出超表面参数。与传统的超表面设计相比,本发明避免了基于求解大量微积分公式的基本物理方法,而是转换为数据驱动的方法,节省了大量的仿真,在瞬间实现了按需设计,而且两个模型具有非常好的数值预测效果。本发明的模型架构方法的高速度和精度可以很容易地扩展到其他复杂的电磁设计,如电磁吸收、超透镜等。它打破了传统的电磁波与材料相互作用的束缚,在光子学和光学领域具有广阔的研究前景。

相关技术
  • 一种按需快速构建超表面的机器学习方法
  • 一种快速构建超双疏表面的简易自喷罐
技术分类

06120112190784