掌桥专利:专业的专利平台
掌桥专利
首页

无线通信中基于元自监督学习降低突发误码率的方法

文献发布时间:2023-06-19 19:28:50


无线通信中基于元自监督学习降低突发误码率的方法

技术领域

本发明涉及无线通信、移动通信领域,具体为无线通信中基于元自监督学习算法降低突发误码率的方法。

背景技术

随着第五代移动通信网络的发展与演化,用户对移动数据流量的需求将高速增长。为了缓解业务高峰期云端到通信基站回程链路的压力,提高内容传递的用户体验质量,移动边缘缓存被提出作为一种关键技术,通过在业务低峰期将用户请求内容通过回程预先传送到基站进行存储等方法,旨在将请求的内容及时分发给移动用户,减少响应延迟,提高内容交付质量。

在窄带通信中,平坦衰落信道可能被障碍物阻挡,从而导致深度衰落。突发误差一般存在于信号受突发衰落影响的深度衰落情况下,加上加性高斯白噪声(AWGN),导致接收机处连续出现比特误差。虽然这种错误可以通过信道编码来减少,但这可能会增加系统的编码/解码复杂性,为此我们提出了无线通信中基于元自监督学习降低突发误码率的方法。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了无线通信中基于元自监督学习算法降低突发误码率的方法,解决了上述的问题。

(二)技术方案

为实现上述所述目的,本发明提供如下技术方案:无线通信中基于元自监督学习算法降低突发误码率的方法,包括以下步骤:

第一步:确定每个SBS与其服务用户之间的路径损失函数以及接收信号表达式;

第二步:确定内容流行度分布与缓存模型;

第三步:提出突发误码率机制和优化问题建模;

第四步:通过利用基于元学习的自监督学习算法在线解决联合缓存放置问题。

所述第一步的具体内容如下:

每个SBS与其服务用户之间的路径损失函数表示为P

接收端信号由K条路径组成,每条多径路径的延时为τ

其中,f

所述第二步的具体内容如下:

每个用户所请求的内容共有F个,其中,不同用户内容空间的交集都为空,内容满足Zipf分布模型,γ是Zipf因子,即第m个内容(1≤f≤F)的流行度可以表示为:

基站的容量为C,则C<

所述第三步的具体内容如下:

S1:AFD被定义为接收信号包络低于给定信号可识别阈值Z的平均时间,Z被定义为最低可识别的信噪比的信号功率,AFD表示为

S2:设L

S3:引入BBER的定义,并利用BBER的来评估突发衰落下的通信性能。

事件的突发i个比特的连续错误的概率为p

将用户和云端之间的BBER定义为b

表示第u个用户文件空间中的第f个内容在第t个时刻是否被请求,如果被请求就是1,没被请求就是0,A

所述第三步中的优化问题:

优选的,第四步中的具体的算法流程为:

S1:输入:p(τ):任务的联合分布,α,β:内循环和外循环的学习率;

S2:随机初始化θ;

S3:while not done do;

S4:采样训练样本T

S5:从T

S6:计算自监督目标矩阵并预测网络输出

S7:利用二进制交叉熵损失函数更新内循环的网络参数

S8:从T

S9:利用二进制交叉熵损失函数计算查询集在网络参数

S10:end while。

(三)有益效果

与现有技术相比,本发明提供了无线通信中基于元自监督学习算法的降低突发误码率的方法,具备以下有益效果:

1、基于元自监督学习算法降低突发误码率的方法,引入突发误码率(BBER)作为信道质量的衡量标准,减少信号传输中突发错误造成的传输误差。

2、基于元自监督学习算法降低突发误码率的方法,提出的算法能够通过少量样本的学习快速适应一个新的环境,因此可以更好地适应动态变化的信道。

3、基于元自监督学习降低突发误码率的方法,提出一种新的基于元学习的自监督学习算法解决缓存放置问题。仿真结果表明,该方法具有较快的收敛速度,并且在训练样本很少时有较高的精度。

附图说明

图1为系统模型示意图;

图2为算法参数设置示意图;

图3为不同迭代次数下算法性能对比示意图;

图4为不同内容数量下,各个算法的性能对比示意图;

图5为不同信噪比下,各个算法性能对比示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

系统描述

考虑一个具有M个多天线的小蜂窝基站(SBS)和N个用户的无线系统,其中M个SBS位于固定位置,而用户则位于任意给定的位置,N个用户以随机的速度和方向移动,在SBS服务覆盖的区域内,如图1所示。用户的速度V和方向θ随时间随机变化,但在每个相干时隙内保持不变。每个SBS的发射功率为p

采用简单的自由空间模型,将每个SBS与其服务用户之间的路径损失函数表示为P

其中,f

内容分布与缓存模型。

假设每个用户所请求的内容共有F个,其中,不同用户内容空间的交集都为空。这些内容满足Zipf分布模型,γ是Zipf因子,即第m个内容(1≤f≤F)的流行度可以表示为:

在实际应用环境中,基站的缓存容量远远小于内容总数。假设M个基站,每个基站的容量为C,则C<

在缓存模型中我们要考虑两个约束条件:基站容量和协作关系。要保证每一个基站只能存储C个内容,同时各个基站之间的缓存的内容各不相同。

突发误码率机制和优化问题建模。

制定了一个优化问题,以最小化突发误差为目标部署联合边缘缓存布置方案。基于窄带通信下瑞利信道的突发衰落,引入属于物理层的(平均突发衰落时间)参数AFD来评价用户和SBS之间的信道质量。AFD被定义为信号包络低于给定信号可识别阈值Z的平均时间,Z被定义为最低可识别的信噪比的信号功率(即信噪比低于Z不会满足信号解码,突发错误时的信噪比低于Z)。由,AFD可表示为

同时,我们将用户和云端之间的BBER定义为b

表示第u个用户文件空间中的第f个内容在第t个时刻是否被请求,如果被请求就是1,没被请求就是0。A

我们的目标是最小化公式(5)。以此列出了下面的优化问题:

由于服务区域中的所有SBS相互协作,它们将搜集到的信道信息传输到云端,在云端的服务器确定协作缓存策略,从而有效地避免了多个基站缓存相同内容的缓存冲突。接下来,我们精心设计了一种基于元学习的自监督学习方法来解决所提出的优化问题,参阅下述内容:

元学习最初应用于图像识别,也被称为学习如何去学习,旨在通过训练少量样本快速适应新的环境。模型不可知性元学习(MAML)是一种很有前途的元学习算法,它能够通过少量准备好的训练任务对元模型进行训练,使个性化模型在新的任务中表现得更好。对于问题(P1),我们提出了一种基于元学习的自监督算法,用于集中决定所有SBS的缓存策略。我们的目标是训练一个多层感知机(MLP),通过观测不同信道的在某一时刻的BBER,在内容流行度未知的条件下预测各个基站的缓存布置策略。接下来,我们将详细阐述整个算法的细节。

经典的元学习方法有两个主要过程来更新网络参数:一个是内循环,另一个是外循环。在第i轮迭代中,将少量训练数据分成两个练集来训练,分别是支持集S

众所周知,自监督学习(SSL)是一种非监督学习,用于从未标记的数据中学习有意义的信息作为标签。这些标签可以作为微调训练的目标使用,或者作为模型(如逻辑回归)的固定特征提取器。令J(θ)为代价函数,θ为MLP网络参数。代价函数定义为:

其中x∈R

α为网络参数的学习率,当支持集中的所有任务都经过训练后,元学习内循环的更新就完成了。并在内循环完成时得到了更新后的临时网络参数

其中,计算损失函数的公式为:

L(φ(x;θ),Π(x))=Π(x)logφ(x;θ)+(1-Π(x))log(1-φ(x;θ)) (9)

通过以上损失函数,计算网络参数的梯度,但是并没有在

具体的算法流程为:

输入:p(τ):任务的联合分布;

α,β:内循环和外循环的学习率;

1:随机初始化θ;

2:while not done do;

3:采样训练样本T

4:从T

5:计算在的Π(S

6:利用公式(8)更新内循环的网络参数

7:从T

8:利用公式(10)求出查询集样本在网络上的梯度下降方向并更新到初始网络上;

9:end while。

将所提出方法和现有可对比方法的性能进行试验仿真比较结果。首先,系统模型的参数设置如下表所示。考虑在一个边长为100米的矩形区域中,4个SBS位于矩形的顶点,8个用户随机位置随机分布在矩形区域中,且移动的速度和方向随机,每个用户会请求的内容集不相同。利用预训练和DQN两种传统的深度学习学习、深度强化学习方法作为比较实验。

参阅图3,将所提出的方法和对比方法在不同迭代次数的情况下所取得的缓存布置方案的准确率进行比较,通过每种方法的高斯平滑曲线来更清楚地反映性能,可以观察到,对于设定的用户位置、移动速度和方向均匀随机变化的随机环境,所提出的算法具有更高的学习精度,收敛速度更快。因此,所提出的缓存策略比所比较的算法更优。值得注意的是,即使只使用少量样本进行训练,该方法也可以获得比DQN更好的性能(如图2所示,本文方法的递增梯度比其他方法更陡)。这种特性有利于算法的在线执行,只使用少量样本进行训练并快速适应不同的环境。从学习精度的定义上看,该结果表明,采用该方法的缓存相对于其他方法具有更好的BBER增益,从而减少了传输过程中的突发误码。

参阅图4,将所提出的方法和对比的方法在固定每个用户的内容数量分别是200和1000的条件下,来比对不同迭代次数下,算法计算出的缓存方案所得到的平均BBER性能,当内容空间增大时,每一个内容的请求概率被稀释,所以整体上看F=200时的性能要好于F=1000时的性能。同时可以看出,所提出算法的收敛速度和性能确实好于其他算法。

参阅图5,将所提出的方法和对比的方法在固定500个迭代次数的条件下,在不同信噪比下求得的各个算法缓存布置方案的平均BBER性能,确定了内容量F=200,并研究了在不同信噪比下200次训练得到的性能。可以看到,随着信噪比的增加,所采用的所有方法传输请求内容的平均BBER都会降低。然而,我们提出的方法一直优于两个比较,特别是在高信噪比区域。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 在无线通信网络中基于时间敏感通信辅助信息支持突发到达时间参考时钟的装置和方法
  • 在无线通信系统接收机中估计误码率的方法
技术分类

06120115922905