掌桥专利:专业的专利平台
掌桥专利
首页

无线网络资源管理优化方法、装置、电子设备及存储介质

文献发布时间:2024-01-17 01:24:51


无线网络资源管理优化方法、装置、电子设备及存储介质

技术领域

本发明涉及信号处理与无线通信技术领域,尤其涉及一种无线网络资源管理优化方法、装置、电子设备及存储介质。

背景技术

信号处理与无线通信中资源管理与优化的问题往往建模为数学优化问题,优化问题的求解往往需要设计复杂的迭代算法,因此计算复杂度较高。超大规模MIMO(多输入多输出)、通信感知一体化等技术已经成为6G中的关键使能技术,随着问题规模的增加(包括优化变量维数及约束数量等增加),计算复杂度问题越来越成为大量算法实时应用的瓶颈。为了降低计算复杂度,研究人员提出了学习优化的思想。一种典型的实现方式是使用深度神经网络建模算法,并基于收集的样本采用端到端的方式进行训练。但是,由于原始优化算法被视为黑盒子,使得获得的算法不仅缺乏可解释性,而且需要海量数据训练构造的深度网络,同时网络的泛化性能也较差,难以适用动态时变场景。

为了解决上述问题,研究人员提出将算法的模型信息融入算法设计,提出了深度展开的学习优化方法。深度展开的基本思想是将优化算法中的迭代步骤视作深度神经网络中的层,选取算法中敏感元素作为可学习参数并使用反向传播方法进行优化。由于融合了原始算法中的模型信息,基于深度展开设计的算法不仅具有良好的可解释性,而且计算复杂度与样本复杂度也较深度神经网络建模算法来说更低,同时泛化性能更好。但是,目前已有的基于深度展开设计的算法最终均基于内点法求解,网络的样本复杂度仍然较高,在小样本的情况下网络性能和优化问题求解的准确度并不理想,限制了其应用范围。

发明内容

针对现有技术存在的问题,本发明提供一种无线网络资源管理优化方法、装置、电子设备及存储介质。

第一方面,本发明提供一种无线网络资源管理优化方法,包括:

确定无线网络资源管理优化问题,并获取所述无线网络资源管理优化问题的输入参数向量;

将所述输入参数向量输入至目标深度展开网络,得到所述无线网络资源管理优化问题的求解结果;

根据所述求解结果,进行无线网络资源的管理优化;

其中,所述目标深度展开网络是基于所述无线网络资源管理优化问题的样本输入参数向量和所述样本输入参数向量对应的优化问题求解结果,对所述目标深度展开网络的超参数进行训练得到的;所述超参数包括优化变量的迭代步长、对偶变量的迭代步长和惩罚参数中的一种或多种。

可选地,所述目标深度展开网络基于以下方式构建得到:

确定所述目标深度展开网络用于求解的目标无线网络资源管理优化问题为光滑优化问题或非光滑优化问题;

基于所述目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,所述可展开迭代格式中包含所述超参数;

基于所述可展开迭代格式,构建所述目标深度展开网络。

可选地,所述基于所述目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在所述目标无线网络资源管理优化问题为光滑优化问题的情况下,使用原始对偶方法或者原始对偶方法和梯度下降方法构造所述目标无线网络资源管理优化问题对应的可展开迭代格式。

可选地,所述基于所述目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在所述目标无线网络资源管理优化问题为非光滑优化问题的情况下,将所述目标无线网络资源管理优化问题转化为一个光滑优化子问题和一个非光滑优化子问题的交替优化求解问题;

使用原始对偶方法或者原始对偶方法和梯度下降方法构造所述光滑优化子问题对应的可展开迭代格式,使用邻近算子方法构造所述非光滑优化子问题对应的可展开迭代格式。

可选地,所述基于所述可展开迭代格式,构建所述目标深度展开网络,包括:

基于所述光滑优化子问题对应的可展开迭代格式,构建原始对偶子网络;

基于所述原始对偶子网络和所述非光滑优化子问题对应的可展开迭代格式,构建所述目标深度展开网络。

可选地,所述基于所述目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在所述目标无线网络资源管理优化问题满足第一条件的情况下,基于所述目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式;

所述第一条件包括:

对于所述目标无线网络资源管理优化问题的每个约束函数,都存在对应的两个凸函数,所述两个凸函数的差等于所述约束函数;并且,

对于所述目标无线网络资源管理优化问题的目标函数,存在一个可微且凸的函数和一个凸但不可微的函数,所述可微且凸的函数和所述凸但不可微的函数的线性加权和等于所述目标函数。

可选地,所述目标深度展开网络的训练方式包括:

固定Θ中除Θ

固定Θ中除Θ

其中,Θ表示所述目标深度展开网络的超参数集合,Θ={Θ

第二方面,本发明还提供一种无线网络资源管理优化装置,包括:

获取模块,用于确定无线网络资源管理优化问题,并获取所述无线网络资源管理优化问题的输入参数向量;

求解模块,用于将所述输入参数向量输入至目标深度展开网络,得到所述无线网络资源管理优化问题的求解结果;

资源管理优化模块,用于根据所述求解结果,进行无线网络资源的管理优化;

其中,所述目标深度展开网络是基于所述无线网络资源管理优化问题的样本输入参数向量和所述样本输入参数向量对应的优化问题求解结果,对所述目标深度展开网络的超参数进行训练得到的;所述超参数包括优化变量的迭代步长、对偶变量的迭代步长和惩罚参数中的一种或多种。

第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述第一方面所述的无线网络资源管理优化方法。

第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述第一方面所述的无线网络资源管理优化方法。

第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述无线网络资源管理优化方法。

本发明提供的无线网络资源管理优化方法、装置、电子设备及存储介质,通过选取迭代步长、惩罚参数等标量参数作为网络超参,构造深度展开网络求解优化问题,使得该深度展开网络的样本复杂度较低,在小样本的情况下也可以训练获得良好的性能,从而扩展了优化问题求解的适用性,提高了小样本优化问题求解的准确度。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的无线网络资源管理优化方法的流程示意图;

图2为本发明提供的原始对偶子网络的结构示意图;

图3为本发明提供的复合优化网络的结构示意图;

图4为本发明提供的不同算法的平均可达速率性能曲线图;

图5为本发明提供的不同算法的归一化均方误差性能曲线图;

图6为本发明提供的不同算法的误符号率性能曲线图;

图7为本发明提供的不同算法的泛化性能曲线图;

图8为本发明提供的不同算法的耗时性能曲线图;

图9为本发明提供的无线网络资源管理优化装置的结构示意图;

图10为本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明提供的无线网络资源管理优化方法的流程示意图,如图1所示,该方法包括如下步骤:

步骤100、确定无线网络资源管理优化问题,并获取无线网络资源管理优化问题的输入参数向量。

步骤101、将输入参数向量输入至目标深度展开网络,得到无线网络资源管理优化问题的求解结果。

步骤102、根据求解结果,进行无线网络资源的管理优化。

其中,目标深度展开网络是基于无线网络资源管理优化问题的样本输入参数向量和样本输入参数向量对应的优化问题求解结果,对目标深度展开网络的超参数进行训练得到的;超参数包括优化变量的迭代步长、对偶变量的迭代步长和惩罚参数中的一种或多种。

具体地,无线网络资源的管理与优化,指的是对各种无线网络资源进行管理和优化,例如:信道配置和优化、功率控制和优化等等。

在信号处理与无线通信领域中,进行无线网络资源管理优化时,往往需要将无线网络资源管理优化问题(例如各类波束形成或预编码问题等)建模为数学优化问题,通过对无线网络资源管理优化问题进行求解,然后根据求解结果便可以进行无线网络资源的管理优化。

本发明提供一种可适用于信号处理与无线通信领域中无线网络资源管理优化问题求解的通用性方法,通过预先根据不同类型的无线网络资源管理优化问题训练好深度展开网络,在需要对某一无线网络资源管理优化问题进行求解时,可以先获取该优化问题的输入参数向量,输入参数向量是优化问题的已知参数向量,例如:对于多用户预编码问题(以传输可达速率最大化为优化目标,以用户预编码向量为优化变量)和多用户符号级预编码问题(以发送功率最小化为优化目标,以发送信号向量为优化变量),输入参数向量都可以包括用户信道向量。

然后,将优化问题的输入参数向量输入到用于求解该优化问题的目标深度展开网络,便可以得到该优化问题的求解结果(例如:对于前文所述多用户预编码问题,求解结果可以是优化的预编码向量;对于前文所述多用户符号级预编码问题,求解结果可以是优化的发送信号向量),从而可以根据求解结果进行无线网络资源的管理优化。

与现有的深度展开网络不同,本发明提供的深度展开网络选取了迭代步长、惩罚参数等标量参数作为网络的超参数(也可以称为可学习参数或可训练参数),因此使用少量样本即可训练出良好性能的模型,网络的样本复杂度低(即具有良好的小样本性能)且泛化性能好。可选地,可以使用反向传播算法对目标深度展开网络的超参数进行训练。

其中,优化变量可以包括原始优化问题中的优化变量,和由该原始优化问题变换的优化问题中的优化变量。在一些实施例中,可以使用原始对偶方法和梯度下降方法对优化变量进行迭代求解,优化变量的迭代步长即梯度下降迭代的步长参数。

在一些实施例中,对偶变量可以包括原始优化问题中不等式约束的对偶变量,和由该原始优化问题变换的优化问题中不等式约束的对偶变量。

在一些实施例中,原始优化问题可通过引入优化变量和等式约束进行等价变换,针对等式约束可进一步引入惩罚参数和对偶变量,以得到等价变换的优化问题的增广拉格朗日(Lagrange)惩罚形式。因此,本发明中可以将该惩罚参数作为深度展开网络的一种超参数。

本发明提供的无线网络资源管理优化方法,通过选取迭代步长、惩罚参数等标量参数作为网络超参,构造深度展开网络求解优化问题,使得该深度展开网络的样本复杂度较低,在小样本的情况下也可以训练获得良好的性能,从而扩展了优化问题求解的适用性,提高了小样本优化问题求解的准确度。

可选地,目标深度展开网络基于以下方式构建得到:

确定目标深度展开网络用于求解的目标无线网络资源管理优化问题为光滑优化问题或非光滑优化问题;

基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,可展开迭代格式中包含超参数;

基于可展开迭代格式,构建目标深度展开网络。

具体地,实际的无线网络资源管理优化问题可能是光滑优化问题或非光滑优化问题,在构建用于求解某一类无线网络资源管理优化问题的目标深度展开网络时,可以先确定该无线网络资源管理优化问题是光滑优化问题还是非光滑优化问题,然后根据该无线网络资源管理优化问题的类型采用不同的方式构造可展开迭代格式。

可展开迭代格式中包含网络的超参数,比如优化变量的迭代步长、对偶变量的迭代步长、惩罚参数等。在一些实施例中,可展开迭代格式包括优化变量的迭代格式和对偶变量的迭代格式,相应的网络超参可以包括优化变量的迭代步长和对偶变量的迭代步长。

基于构造的可展开迭代格式可以得到目标深度展开网络的前向传播公式,从而构建目标深度展开网络。

通过基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,可以有针对性地简化目标深度展开网络的构建过程,提高目标深度展开网络的构建效率。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题满足第一条件的情况下,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式;

第一条件包括:

对于目标无线网络资源管理优化问题的每个约束函数,都存在对应的两个凸函数,两个凸函数的差等于约束函数;并且,

对于目标无线网络资源管理优化问题的目标函数,存在一个可微且凸的函数和一个凸但不可微的函数,可微且凸的函数和凸但不可微的函数的线性加权和等于目标函数。

具体地,本发明在构造可展开迭代格式之前,首先需要判断目标无线网络资源管理优化问题是否满足第一条件,若满足第一条件,则可以基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,否则,可以对目标无线网络资源管理优化问题进行适当的变换(例如:引入新的优化变量、约束函数、目标函数等),在变换后的优化问题满足第一条件的情况下,构造相应的可展开迭代格式。

举例来说,考虑如下一般形式的优化问题:

式中,x表示优化变量,f(x)和R(x)表示x相关的函数,ρ为常数,f(x)+ρR(x)表示优化问题的目标函数,优化问题为优化x使目标函数最小,g

式(1)的优化问题满足第一条件,则表示:

1、每个约束函数g

2、f(·)为可微且凸的函数,否则可以通过引入新的优化变量t、约束函数f(x)≤t和目标函数t+ρR(x),使新的优化问题满足该条件。

3、R(·)为凸的但不可微函数。例如,典型函数包括经典的L1范数等。

在满足上述条件的情况下,式(1)的优化问题可以重新写成如下优化问题:

通过判断目标无线网络资源管理优化问题是否满足第一条件,在满足的情况下再基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,可以提高深度展开网络的求解准确度和构建效率。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题为光滑优化问题的情况下,使用原始对偶方法或者原始对偶方法和梯度下降方法构造目标无线网络资源管理优化问题对应的可展开迭代格式。

具体地,如果目标无线网络资源管理优化问题是光滑优化问题,可直接采用原始对偶方法,或者原始对偶方法结合梯度下降方法构造可展开迭代格式,可以简化网络结构,提高深度展开网络的构建效率。

具体来说,可以引入对偶变量构造目标无线网络资源管理优化问题的Lagrange对偶函数,基于该对偶函数构造对偶变量的迭代格式。

在一些实施例中,对于优化变量比较容易得到解析表达式的优化问题,可以仅使用对偶变量的迭代格式构造目标深度展开网络,以简化网络结构。

在一些实施例中,对于优化变量不存在解析表达式或者解析形式较为复杂的优化问题,可以使用梯度下降方法进行多步迭代,根据对偶函数对各个优化变量的梯度来构造优化变量的迭代格式。

以下通过具体应用场景的实施例进行举例说明。

针对MIMO无线通信中多用户预编码问题,本发明实施例公开了一种低计算和低样本复杂度的深度展开学习优化算法,算法主要包括如下步骤:

步骤1:令

式中,σ

步骤1.1:由于式(3)的优化问题不包含非光滑优化,故无需引入新的优化变量及等式约束。但是,由于该优化问题不满足两个凸函数差的形式,故仍然需要进行变换。引入新的优化变量{p

步骤1.2:求解式(4)的优化问题非常困难,需采用迭代方式求解。令x

步骤2:由于不存在非光滑约束,对式(5)的优化问题,可直接采用原始对偶方法和梯度下降方法构造可展开迭代格式,具体如下。

步骤2.1:对于式(5)的优化问题,相应的Lagrange函数为:

式中,λ、υ

步骤2.2:L({x

式中,I表示单位矩阵。

步骤2.3:优化变量的可展开迭代格式如下:

式中,a

对偶变量的可展开迭代格式如下:

式中,α

步骤3:构造原始对偶网络,即确定前向传播公式与选择可学习参数。

步骤3.1:根据计算的梯度向量构造原始对偶网络。原始变量更新对应的前向传播公式见上式(8),对偶变量更新对应的前向传播公式见上式(9)。

步骤3.2:对于所考虑的MIMO多用户预编码优化问题,可学习参数如下:

式中,K表示优化变量x

步骤4:收集训练样本,并采用机器学习中的反向传播算法以及逐层训练等技巧优化和训练选取的可学习参数。

步骤4.1:式(5)的优化问题是凸优化问题,可以采用内点法直接求解。求解式(3)的优化问题(或等价问题式(4)),需要基于获得的新点构造式(5)的优化问题并求解,重复此过程直至收敛,即可得到式(3)的优化问题的最优解。

步骤4.2:采样信道向量

步骤4.3:定义损失函数为均方误差,采用小批量mini-batch优化可学习参数

步骤5:面对相同或相似环境下新的优化问题(即信道状态信息采样于相同或相似环境),直接通过训练好的深度展开网络(本实施例为前文所述的原始对偶网络)通过前向传播计算得到相应优化问题的高质量近似解。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题为非光滑优化问题的情况下,将目标无线网络资源管理优化问题转化为一个光滑优化子问题和一个非光滑优化子问题的交替优化求解问题;

使用原始对偶方法或者原始对偶方法和梯度下降方法构造光滑优化子问题对应的可展开迭代格式,使用邻近算子方法构造非光滑优化子问题对应的可展开迭代格式。

具体地,如果目标无线网络资源管理优化问题是非光滑优化问题,可以首先将该优化问题转化为一个光滑优化子问题和一个非光滑优化子问题的交替优化求解问题,例如,可以引入新的优化变量并采用增广Lagrange罚函数和交替优化方法,将原始优化问题分成非光滑优化与光滑优化两个子问题。

然后,对于光滑优化子问题,可以使用原始对偶方法或者原始对偶方法和梯度下降方法构造可展开迭代格式,具体可参考前文所述,此处不再赘述。而对于非光滑优化子问题,可以使用邻近算子方法构造可展开迭代格式。

通过将非光滑优化问题分成非光滑优化与光滑优化两个子问题进行交替优化求解,使用原始对偶方法或者原始对偶方法和梯度下降方法构造光滑优化子问题对应的可展开迭代格式,使用邻近算子方法构造非光滑优化子问题对应的可展开迭代格式,可以有效提高用于求解非光滑优化问题的深度展开网络的构建效率。

可选地,基于可展开迭代格式,构建目标深度展开网络,包括:

基于光滑优化子问题对应的可展开迭代格式,构建原始对偶子网络;

基于原始对偶子网络和非光滑优化子问题对应的可展开迭代格式,构建目标深度展开网络。

具体地,构造可展开迭代格式之后,便可以基于这些可展开迭代格式确定网络的前向传播公式,从而构建目标深度展开网络。

在构建目标深度展开网络时,可以先基于光滑优化子问题对应的可展开迭代格式,确定原始对偶子网络的前向传播公式,从而构建原始对偶子网络,然后,再基于原始对偶子网络以及非光滑优化子问题对应的可展开迭代格式,确定最终的目标深度展开网络的前向传播公式,构建得到最终的目标深度展开网络。

通过先构建原始对偶子网络,再基于原始对偶子网络和非光滑优化子问题对应的可展开迭代格式构建目标深度展开网络,可以有效提高深度展开网络的构建效率,且有利于提高深度展开网络的训练效率。

以前文式(2)的优化问题为例进行举例说明,其主要步骤如下。

步骤1:如果优化问题为非光滑优化问题,则引入新的变量并采用增广Lagrange罚函数和交替优化方法,将原始优化问题分成非光滑优化与光滑优化两个子问题。

步骤1.1:如果函数R(·)不是零函数,可引入优化变量z及等式约束x-z,则可得到如下等价优化问题:

针对等式约束进一步引入惩罚参数κ及对偶变量y,则可获得式(11)的优化问题的惩罚形式:

一般而言,直接求解式(12)的优化问题较困难,需采用迭代方式求解。令x

式中,y

步骤1.2:采用交替优化方法求解式(13)的优化问题,则关于优化变量x的优化子问题(此问题为光滑优化问题)为:

关于优化变量z的优化子问题(此问题为非光滑优化问题)为:

式(15)的优化问题可以等价地写成如下优化问题:

步骤1.3:一般而言,关于变量z的非光滑优化子问题式(16)有解析表达式:

式中,z

式中,dom h表示函数h的定义域。

步骤2:对于光滑优化子问题,采用原始对偶方法和梯度下降方法构造可展开迭代格式;对于非光滑优化子问题,采用邻近算子方法构造可展开迭代格式。

步骤2.1:由于式(14)的优化子问题为凸优化问题,在一定约束规格条件下强对偶定理成立,故可以采用原始对偶方法求解。为方便起见,引入J(x)和φ

式(14)的优化子问题的Lagrange对偶函数为:

式中,μ

式(14)的优化子问题的对偶问题定义为:

步骤2.2:采用原始对偶方法求解凸优化问题式(14)。对于任意给定的初始对偶变量

式中,μ

步骤2.3:如果优化问题

式中,η

步骤3:选取迭代格式中的迭代步长、惩罚参数等标量参数作为可学习参数,并且同种类型的约束共享可学习参数,以进一步降低样本复杂度。

步骤3.1:构造原始对偶子网络用于求解式(14)的优化子问题,原始对偶子网络的前向传播公式为:

图2为本发明提供的原始对偶子网络的结构示意图,如图2所示,该原始对偶子网络的前向传播公式为式(24),通过M次对偶迭代可得到优化变量x的解析式x

式中,I表示向量μ

步骤3.2:基于上述原始对偶子网络进一步构造复合优化网络(用于求解式(2)的优化问题),复合优化网络的前向传播格式为(迭代K次):

式中,PDSN(·,·)表示原始对偶子网络,z

步骤4:收集训练样本,并采用机器学习中的反向传播算法以及逐层训练等技巧优化和训练选取的可学习参数Θ。

步骤4.1:训练样本可以通过多种方式获取,一种方法是基于先前构造的迭代格式,并采用增广Lagrange罚函数方法求解优化问题式(11)。

步骤4.1.1:交替求解优化子问题式(14)和式(15)(或者等价问题式(16)),其中,优化子问题式(14)可以通过内点法等方法精确求解,优化子问题式(15)或式(16)存在闭合表达式或通过邻近算子迭代等精确求解。

步骤4.1.2:由于采用增广Lagrange罚函数方法,还需要更新对偶变量y及惩罚参数κ,更新公式如下:

式中,β∈(1,∞)和γ∈(0,1)为常数,用于控制惩罚参数κ的增长速率。算法收敛条件为优化变量x连续两次迭代的差的范数小于某个预先指定的正实数。

步骤4.2:假设获得的训练集

步骤4.3:根据定义的损失函数,采用反向传播算法训练和优化参数Θ。

步骤5:面对同类型的新的优化问题,直接通过训练好的深度展开网络(即前文所述复合优化网络),通过前向传播计算即可以极低的计算复杂度获得相应优化问题的高质量近似解。

可选地,目标深度展开网络的训练方式包括:

固定Θ中除Θ

固定Θ中除Θ

其中,Θ表示目标深度展开网络的超参数集合,Θ={Θ

具体地,对目标深度展开网络进行训练最简单的方法是直接每次更新Θ中全部元素,本发明提供一种分层训练的方法,可提高网络训练的效率。

分层训练的方法可以有两种,以前文所述的复合优化网络训练为例,可学习参数记为

分层训练方法之一:首先固定Θ\Θ

分层训练方法之二:首先固定Θ\Θ

在此需要说明的是,上述两种分层训练方法都可以递归地使用,即当训练任意原始对偶子网络PSDN

以下通过另一具体应用场景的实施例进行举例说明。

针对MIMO无线通信中多用户符号级预编码问题,本发明实施例公开了一种低计算和低样本复杂度的深度展开学习优化算法,算法主要包括如下步骤:

步骤1:令

式中,F表示导频矩阵(通常由波束训练码书构成),ρ为常数,K

步骤1.1:由于式(28)的优化问题包含非光滑优化,故需引入新的优化问题z及等式约束x-z,相应的等价优化问题可以写为:

针对等式约束进一步引入惩罚参数κ及对偶变量y,相应的增广Lagrange惩罚问题为:

步骤1.2:采用交替优化方法求解式(30)的优化问题,其中的光滑优化子问题为:

非光滑优化子问题为:

式(32)的优化问题最优解为:

z

式中,sgn(·)表示复数符号函数,⊙表示Hardmard乘积,上述运算均为逐分量的。

步骤2:由于式(32)的优化问题存在最优解且式(31)的优化问题为凸优化问题,可以直接采用原始对偶方法构造可展开迭代格式。考虑第n次迭代,κ

步骤2.1:令x=x

步骤2.2:为获得更易于处理的形式,进一步定义矩阵和向量如下:

则可得到第n次迭代对应的优化问题:

步骤2.3:式(35)的优化问题的Lagrange函数为:

式中,μ表示不等式约束

步骤3:根据获得的Lagrange函数构造原始对偶子网络,即确定前向传播公式与选择可学习参数。

步骤3.1:原始对偶更新公式为:

式中,

步骤3.2:可学习参数如下:

Θ={α

步骤4:收集训练样本,并采用机器学习中的反向传播算法以及逐层训练等技巧优化和训练选取的可学习参数Θ。

步骤4.1:注意到式(28)的优化问题是凸优化问题,可以采用内点法直接求解。采样信道向量

步骤4.3:定义损失函数函数为均方误差,采用小批量mini-batch和反向传播算法优化可学习参数Θ。由于可学习参数数量较少,可以直接使用反向传播方法。

步骤5:面对相同或相似环境下新的优化问题(即信道状态信息采样于相同或相似环境),直接通过前向传播计算得到相应优化问题的高质量近似解。

为了证明本发明所提出的深度展开学习优化方法的优势,针对两种类型的预编码(即经典的块预编码与符号级预编码),本发明提供了不同预编码优化算法的归一化均方误差(NMSE)、平均可达速率(Average Achievable Sum-rate)和误符号率(SER)等性能。采用的信道模型为FDD(频分双工)大规模MIMO信道模型,用户数为U=3,不同用户信道角度扩展如下(范围为[-1,1]):

情形1:[-33/64,-27/64],[-3/64,3/64],[27/64,33/64];

情形2:[-20/64,-14/64],[-3/64,3/64],[14/64,20/64];

情形3:[-24/64,-13/64],[-6/64,6/64],[13/64,24/64]。

所有学习优化模型均基于情形1中的信道模型进行训练,D表示训练学习模型时训练集大小。对于图4~图8中的所有算法图例,以-AU为后缀表示相应的算法是基于本发明提出的深度展开方法设计的,其余算法均是不同基线算法且完全基于优化方法设计的。

图4为本发明提供的不同算法的平均可达速率性能曲线图,如图4所示,图中示出了完全基于优化的预编码算法和本发明提出的深度展开预编码算法的平均可达速率性能曲线,可以看出,基于本发明提出的深度展开方法的预编码算法与完全基于优化的预编码算法的性能非常接近,但是基于本发明提出的深度展开方法的预编码算法具有极低的计算复杂度,只需要使用目标函数和约束函数的一阶信息,而且仅仅需要3~4次迭代即可。

图5为本发明提供的不同算法的归一化均方误差性能曲线图,如图5所示,在相同的迭代步数下,基于本发明提出的深度展开方法的预编码算法具有更低的均方误差性能,即更加逼近最优解。同时可以看出,当训练样本较少时也可以获得较好的性能,即具有更低的样本复杂度。

图6为本发明提供的不同算法的误符号率性能曲线图,如图6所示,基于本发明提出的深度展开方法的预编码算法与完全基于优化方法设计的预编码算法的性能非常接近。当估计的信道状态信息不精确时,基于本发明提出的深度展开方法的预编码算法甚至能够获得更好的性能。

图7为本发明提供的不同算法的泛化性能曲线图,如图7所示,即使训练模型是基于情形1(Case 1)中的信道模型训练的,但是对于其他两种信道模型依然具有良好的误符号率性能,即本发明提出的深度展开方法具有非常好的泛化性能。

图8为本发明提供的不同算法的耗时(Elapsed Time)性能曲线图,基于深度展开思想设计的算法的重要优势之一是具有非常低的计算复杂度,图8直观地展示了这一重要优势,不论是图8中的(a)情形还是图8中的(b)情形,基于本发明提出的深度展开方法的预编码算法的计算复杂度都显著低于其他算法。本发明设计的预编码算法的计算复杂度方面的优势不仅来自于深度展开,还源于构造的深度展开网络仅仅使用目标函数和约束函数的一阶信息,需要的迭代次数非常少,使得算法的计算复杂度低。

下面对本发明提供的无线网络资源管理优化装置进行描述,下文描述的无线网络资源管理优化装置与上文描述的无线网络资源管理优化方法可相互对应参照。

图9为本发明提供的无线网络资源管理优化装置的结构示意图,如图9所示,该装置包括:

获取模块900,用于确定无线网络资源管理优化问题,并获取无线网络资源管理优化问题的输入参数向量;

求解模块910,用于将输入参数向量输入至目标深度展开网络,得到无线网络资源管理优化问题的求解结果;

资源管理优化模块920,用于根据求解结果,进行无线网络资源的管理优化;

其中,目标深度展开网络是基于无线网络资源管理优化问题的样本输入参数向量和样本输入参数向量对应的优化问题求解结果,对目标深度展开网络的超参数进行训练得到的;超参数包括优化变量的迭代步长、对偶变量的迭代步长和惩罚参数中的一种或多种。

可选地,目标深度展开网络基于以下方式构建得到:

确定目标深度展开网络用于求解的目标无线网络资源管理优化问题为光滑优化问题或非光滑优化问题;

基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,可展开迭代格式中包含超参数;

基于可展开迭代格式,构建目标深度展开网络。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题为光滑优化问题的情况下,使用原始对偶方法或者原始对偶方法和梯度下降方法构造目标无线网络资源管理优化问题对应的可展开迭代格式。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题为非光滑优化问题的情况下,将目标无线网络资源管理优化问题转化为一个光滑优化子问题和一个非光滑优化子问题的交替优化求解问题;

使用原始对偶方法或者原始对偶方法和梯度下降方法构造光滑优化子问题对应的可展开迭代格式,使用邻近算子方法构造非光滑优化子问题对应的可展开迭代格式。

可选地,基于可展开迭代格式,构建目标深度展开网络,包括:

基于光滑优化子问题对应的可展开迭代格式,构建原始对偶子网络;

基于原始对偶子网络和非光滑优化子问题对应的可展开迭代格式,构建目标深度展开网络。

可选地,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式,包括:

在目标无线网络资源管理优化问题满足第一条件的情况下,基于目标无线网络资源管理优化问题的类型构造相应的可展开迭代格式;

第一条件包括:

对于目标无线网络资源管理优化问题的每个约束函数,都存在对应的两个凸函数,两个凸函数的差等于约束函数;并且,

对于目标无线网络资源管理优化问题的目标函数,存在一个可微且凸的函数和一个凸但不可微的函数,可微且凸的函数和凸但不可微的函数的线性加权和等于目标函数。

可选地,目标深度展开网络的训练方式包括:

固定Θ中除Θ

固定Θ中除Θ

其中,Θ表示目标深度展开网络的超参数集合,Θ={Θ

在此需要说明的是,本发明提供的上述装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

图10为本发明提供的电子设备的结构示意图,如图10所示,该电子设备可以包括:处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040,其中,处理器1010,通信接口1020,存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令,以执行上述各实施例提供的任一所述无线网络资源管理优化方法。

此外,上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在此需要说明的是,本发明提供的电子设备,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的任一所述无线网络资源管理优化方法。

在此需要说明的是,本发明提供的非暂态计算机可读存储介质,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 人力资源管理方法、装置、电子设备及存储介质
  • 神经网络模型的优化方法及装置、电子设备和存储介质
  • 神经网络模型的优化方法及装置、电子设备和存储介质
  • 无线网络自主优化方法、装置、设备和存储介质
  • 电子设备的显示控制方法、装置、电子设备和存储介质
  • 无线网络优化方法、装置、电子设备及存储介质
  • 无线网络通信优化方法、装置、电子设备及存储介质
技术分类

06120116194514