掌桥专利:专业的专利平台
掌桥专利
首页

CSI反馈方法、装置、设备及存储介质

文献发布时间:2024-04-18 20:00:50


CSI反馈方法、装置、设备及存储介质

本申请涉及移动通信领域,特别涉及一种信道状态信息(Channel State Information,CSI)反馈方法、装置、设备及存储介质。

在目前的新空口(New Radio,NR)系统中,针对CSI反馈方案,终端通常采用基于码本的特征向量反馈,使得基站获取下行信道的CSI。具体地,基站向用户发送下行CSI参考信号(CSI Reference Signals,CSI-RS),终端利用CSI-RS估计得到下行信道的CSI,并对估计得到的下行信道进行特征值分解,得到该下行信道对应的特征向量。进一步地,NR提供Type 1和Type 2两种码本设计方案,其中Type 1码本用于常规精度的CSI反馈以及单用户MIMO(Single-User MIMO,SU-MIMO)和多用户MIMO(Multi-User MIMO,MU-MIMO)的传输,Type 2码本用于提升MU-MIMO的传输性能。

发明内容

本申请实施例提供了一种CSI反馈方法、装置、设备及存储介质,提出了一种基于对抗生成网络的CSI反馈方案。所述技术方案如下。

根据本申请的一个方面,提供了一种CSI反馈方法,应用于终端中,所述方法包括:

使用编码器对CSI进行编码,得到CSI反馈信息;所述编码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的;

向接入网设备发送所述CSI反馈信息。

根据本申请的一个方面,提供了一种CSI反馈方法,应用于接入网设备中,所述方法包括:

接收终端发送的CSI反馈信息,所述CSI反馈信息是所述终端通过编码器对CSI编码得到的;

使用解码器对所述CSI反馈信息进行解码,得到所述终端测量的CSI;所述编码器和所述解码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的;

向接入网设备发送所述CSI反馈信息。

根据本申请的一个方面,提供了一种CSI反馈装置,所述装置包括:

编码模块,用于使用编码器对CSI进行编码,得到CSI反馈信息;所述编码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的;

发送模块,用于向接入网设备发送所述CSI反馈信息。

根据本申请的一个方面,提供了一种CSI反馈装置,所述装置包括:

接收模块,用于接收终端发送的CSI反馈信息,所述CSI反馈信息是所述终端通过编码器对CSI编码得到的;

解码模块,用于使用解码器对所述CSI反馈信息进行解码,得到所述终端测量的CSI;所述编码器和所述解码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的。

根据本申请的一个方面,提供了一种终端,所述终端包括:处理器;与所述处理器相连的收发器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为加载并执行所述可执行指令以实现如上述方面所述的CSI反馈方法。

根据本申请的一个方面,提供了一种网络设备,所述网络设备包括:处理器;与所述处理器相连的收发器;用于存储所述处理器的可执行指令的存储器;其中,所述处理器被配置为加载并执行所述可执行指令以实现如上述方面所述的CSI反馈方法。

根据本申请的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有可执行指令,所述可执行指令由所述处理器加载并执行以实现如上述方面所述的CSI反馈方法。

根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的CSI反馈方法。

根据本申请的一个方面,提供了一种芯片,所述芯片包括可编程逻辑电路或程序,所述芯片用于实现如上述方面所述的CSI反馈方法。

本申请实施例提供的技术方案至少包括如下有益效果:

在真实训练集中的训练样本较少的情况下,利用对抗生成网络来生成补充训练集,从而训练得到性能优秀的编码器和解码器,使用该编码器和解码器完成CSI的反馈,能够提高终端和网络设备之间的CSI反馈精准度,并且使用更少的反馈数据量来代表更完整和详细的信道信息。

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的CSI反馈方法的架构图;

图2是本申请一个示例性实施例提供的CSI反馈方法的流程图;

图3是本申请一个示例性实施例提供的对抗生成网络的流程图;

图4是本申请一个示例性实施例提供的对抗生成网络的训练示意图;

图5是本申请一个示例性实施例提供的编码器和解码器的训练方法的流程图;

图6是本申请一个示例性实施例提供的编码器和解码器的训练示意图;

图7是本申请一个示例性实施例提供的CSI反馈方法的流程图;

图8是本申请一个示例性实施例提供的模型更新方法的流程图;

图9是本申请一个示例性实施例提供的模型更新方法的流程图;

图10是本申请一个示例性实施例提供的模型更新方法的流程图;

图11是本申请一个示例性实施例提供的模型更新方法的流程图;

图12是本申请一个示例性实施例提供的模型更新方法的流程图;

图13是本申请一个示例性实施例提供的CSI反馈装置的结构框图;

图14是本申请一个示例性实施例提供的CSI反馈装置的结构框图;

图15是本申请一个示例性实施例提供的通信设备的结构示意图。

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1示出了本申请一个实施例提供的移动通信系统的示意图。该移动通信系统可以包括:终端10和接入网设备20。

终端10的数量通常为多个,每一个接入网设备20所管理的小区内可以分布一个或多个终端10。终端10可以包括各种具有移动通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备,以及各种形式的用户设备(User Equipment, UE)、移动台(Mobile Station,MS)等等。为方便描述,本申请实施例中,上面提到的设备统称为终端。

接入网设备20是一种部署在接入网中用于为终端10提供移动通信功能的装置。接入网设备20可以包括各种形式的宏基站,微基站,中继站,接入点,定位管理功能实体(Location Management Function,LMF)等等。在采用不同的无线接入技术的系统中,具备接入网设备功能的设备的名称可能会有所不同,例如在5G NR系统中,称为gNodeB或者gNB。随着通信技术的演进,“接入网设备”这一名称可能会变化。为方便描述,本申请实施例中,上述为终端10提供移动通信功能的装置统称为接入网设备。接入网设备20与终端10之间可以通过空口建立连接,从而通过该连接进行通信,包括信令和数据的交互。接入网设备20的数量可以有多个,两个邻近的接入网设备20之间也可以通过有线或者无线的方式进行通信。终端10可以在不同的接入网设备20之间进行切换,也即与不同的接入网设备20建立连接。

本公开实施例中的“5G NR系统”也可以称为5G系统或者NR系统,但本领域技术人员可以理解其含义。本公开实施例描述的技术方案可以适用于5G NR系统,也可以适用于5G NR系统后续的演进系统。

在本申请实施例中,终端10内设置有编码器12,接入网设备20中设置有解码器22。接入网设备120在下行信道向终端10发送CSI-RS。终端10基于CSI-RS,测量得到下行信道的CSI。终端10通过编码器12将CSI进行编码,得到CSI反馈信息。终端10将CSI反馈信息上报给接入网设备20。接入网设备20通过解码器22解码得到终端10的CSI。

由于编码器12和解码器22是基于人工智能的模型,需要使用真实的训练样本进行预先训练得到。但是由于真实训练集中的训练样本比较少,因此本申请还提出了基于对抗生成网络(Generative Adversarial Networks,GAN)的样本补充方案,能够补充出足够数量的训练样本,且补充出的训练样本与真实的训练样本的相似度极高。

图2示出了本申请一个示例性实施例提供的CSI反馈方法的流程图。本实施例以该方法应用于图1所示的终端10和网络设备20中来举例说明。该方法包括:

步骤202:终端使用编码器对CSI进行编码,得到CSI反馈信息;

编码器是用于将CSI编码为CSI反馈信息的AI编码模型。接入网设备在下行信道向终端发送CSI-RS,CSI是终端对CSI-RS进行测量后得到的。

CSI反馈信息是编码器对CSI进行编码后得到的反馈比特序列或反馈码本。终端使用编码器对CSI进行编码或压缩,得到CSI反馈信息。也即,AI编码模型具有非线性拟合能力,利用该非线性拟合能力对CSI进行压缩反馈。编码器也称信道编码器。

示意性的,该CSI反馈信息是反馈码本、特征向量、矩阵、比特序列中的至少一种。

步骤204:终端向接入网设备发送CSI反馈信息;

终端通过上行反馈信道向接入网设备发送CSI反馈信息。该上行反馈信道可以是物理上行控制信道(Physical Uplink Control Channel,PUCCH),该上行反馈信道还可以是物理上行共享信道(Physical Uplink Shared Channel,PUSCH)。

步骤206:接入网设备接收终端发送的CSI反馈信息,CSI反馈信息是终端通过编码器对CSI编码得到的;

接入网设备通过上行反馈信道接收终端发送的CSI反馈信息。

步骤208:接入网设备使用解码器对CSI反馈信息进行解码,得到终端测量的CSI。

其中,编码器和解码器是由真实训练集和第一补充训练集训练得到的,第一补充训练集是对抗生成网络中的生成器生成的,对抗生成网络是基于真实训练集训练得到的。解码器也称信道解码器。编码器和解码器可以合称为CSI自编码器。

接入网设备使用解码器对CSI反馈信息进行解码或重构,得到终端测量的下行信道的CSI。

示意性的,生成器和判别器的神经网络结构,可以采用深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Network,CNN)、长短时记忆(Long short-term memory,LSTM)、门控循环单元(Gate Recurrent Unit,GRU)、循环神经网络(Recurrent Neural Network,RNN)和其它任意可能的神经网络架构中的至少一种,本实施例对生成器和判别器的具体网络架构不进行限定。

综上所述,本实施例提供的方法,在真实训练集中的训练样本较少的情况下,利用对抗生成网络来生成补充训练集,从而训练得到性能优秀的编码器和解码器,使用该编码器和解码器完成CSI的反馈,能够提高终端和网络设备之间的CSI反馈精准度,并且使用更少的反馈数据量来代表更完整和详细的信道信息。

需要说明的是,图2实施例中的步骤202和步骤204可以单独实现成为终端侧的CSI反馈方法,图2实施例中的步骤206和步骤208可以单独实现成为接入网设备侧的CSI反馈方法。同理,在其它实施例中由终端执行的步骤可以单独实现成为终端侧的相应方法,其它实施例中由接入网设备执行的步骤可以单独实现成为接入网设备侧的相应方法。

对抗生成网络的训练过程:

图3示出了本申请一个示例性实施例提供的对抗生成网络的训练方法的流程图。该方法可以由接入网设备或终端或其他设备来执行,该方法包括:

对抗生成网络包括:生成器神经网络(Generator Neural Network)和判别器神经网络(Discriminator Neural Network)。对抗生成网络又称生成式对抗网络。生成器神经网络简称生成器,判别器神经网络简称判别器。

GAN受博弈论中的零和博弈启发,将生成问题视作判别器和生成器这两个网络的对抗和博弈:生成器从给定噪声中(一般是指均匀分布或者正态分布)产生合成数据,判别器分辨生成器的输出和真实数据。前者试图产生更接近真实的数据,相应地,后者试图更完美地分辨真实数据与生成数据。由此,两个网络在对抗中进步,在进步后继续对抗,由生成式网络得的数据也就越来越完美,逼近真实数据,从而可以生成想要得到的数据。

示意性的,生成器和判别器的神经网络结构,可以采用DNN、CNN、LSTM、GRU、RNN和其它任意可能的神经网络架构中的至少一种,本实施例对生成器和判别器的具体网络架构不进行限定。

步骤302:将真实训练集中的训练样本输入判别器,得到第一判别结果;

真实训练集中的训练样本包括以下至少一种:

·CSI

·成对出现的CSI和CSI反馈信息(比如采用高精度量化方式得到的反馈码本)。

本申请对训练样本的形式不加以限定,本实施例以真实训练集中的训练样本为CSI来举例说明。

将真实训练集中的训练样本输入判别器,得到第一判别结果。示意性的,该第一判别结果可以为0或1,0代表假,1代表真。或者,该第一判别结果可以为百分比形式的概率值,用于表示判别结果为真的概率,比如80%表示判别结果为真的概率为80%,超过阈值50%即可视为真,小于50%则视为假。

在本实施例中,判别器也可称为信道鉴别器。

步骤304:将噪声信号输入生成器,得到补充训练样本;

该噪声信号可以是随机噪声,比如符合高斯分布的噪声信号,或符合均匀分布的噪声信号,符合伯努利二维分布的噪声信号,或符合其他分布的噪声信号。该噪声信号还可以是含有已知信息的噪声信号。

将噪声信号输入生成器,生成器将会基于噪声信号生成补充训练样本,该补充训练样本的目标是尽可能与真实训练集中的真实训练样本相似或相同。生成器也可称为信道生成器。

步骤306:将补充训练样本输入判别器,得到第二判别结果;

将补充训练样本输入判别器,得到第二判别结果。

需要说明的是,步骤302和步骤304-306可以是交替执行或同时执行,本申请不限定步骤302和步骤304-306的先后执行顺序。比如,可以先执行步骤302,再执行步骤304-306;还可以先执行步骤304-306,再执行步骤302。再比如,基于不同的训练样本,交替执行步骤302和步骤304-306;或者,执行一次步骤302,执行多次步骤304-306;又或者,执行一次步骤304-306,执行多次步骤302。

结合参考图4,以接入网设备为训练设备为例,接入网设备可以收集多个终端的CSI作为真实训练集31,比如同一地理范围内的多个终端的CSI作为真实训练集31。一方面,将真实训练集31中的真实训练样本32输入至判别器D,判别器D会输出相应的判别结果35,也即第一判别结果。另一方面,将随机噪声33输入至生成器G,生成器G会输出虚假(补充)训练样本34,将该虚假训练样本34输入判别器D,判别器D会输出相应的判别结果35,也即第二判别结果。然后,基于第一判别结果和第二判别结果的损失函数,对生成器和判别器进行训练。

步骤308:基于第一判别结果和第二判别结果,训练得到生成器和判别器。

其中,生成器的损失函数是以第一判别结果和第二判别结果均为真的目标设置的,判别器的损失函数是以第一判别结果为真且第二判别结果为假的目标设置的。

示意性的,在判别器的训练阶段,将固定生成器的神经模型参数不变,基于判别器的损失函数对判别器进行训练;在生成器的训练阶段,将固定判别器的神经模型参数不变,基于生成器的损失函数对生成器进行训练。交替执行上述两个训练过程,直至满足训练结束条件。

示意性的,训练结束条件包括:训练次数达到次数阈值,或者,损失函数收敛。

本实施例对对抗生成网络的训练方式不加以限定,比如还可以采用例如带梯度惩罚的Wasserstein GAN(WGAN-GP)等改进形式实现。

综上所述,本实施例提供的方法,能够基于真实训练集中的真实训练样本,训练得到对抗生成网络。该对抗生成网络能够生成与真实训练样本尽可能相同或相似的虚假训练样本,在真实训练集中的真实训练样本有限的情况下,该对抗生成网络能够生成足够多的虚假训练样本,作为补充训练样本。

编码器和解码器的训练过程:

图5示出了本申请一个示例性实施例提供的编码器和解码器的训练方法的流程图。该方法可以由接入网设备或终端或其他设备来执行,该方法包括:

步骤402:采用对抗生成网络中的生成器生成第一补充训练集;

假设足以支撑训练编码器和解码器所需的训练样本数量为M,而真实训练集(或称原始数据集)中的真实训练样本的数量为m。若真实训练集存在采集限制、时间限制或成本限制,真实训练集的大小m远小于所需训练集的大小M的情况下,即m<<M,则直接使用真实训练集对编码器进行训练,无法获得具有较好性能的编码模型。

在对抗生成网络训练完毕后,生成器具有较好的样本生成能力。基于对抗生成网络中的生成器,能够生成第一补充训练集。第一补充训练集的大小不小于(M-m)。

步骤404:将真实训练集和第一补充训练集进行混合,得到联合训练集;

将真实训练集中的真实训练样本和第一补充训练集中的补充训练样本进行混合,能够得到联合训练集。该联合训练集的大小等于或大于M。

也即,该联合训练集的大小足以支撑编码器和解码器所需要的训练样本数量。

步骤406:采用联合训练集对编码器和/或解码器进行训练,得到训练完毕的编码器和/或解码器。

采用联合训练集对编码器和/或解码器进行训练,得到训练完毕的编码器和/或解码器。

在一个示例中,联合训练集中的每个训练样本均为CSI,采用端到端的训练方式对编码器和解码器进行训练。在另一个示例中,联合训练集中的每个训练样本包括一组CSI和CSI反馈码本,基于每个训练样本可以单独对编码器训练,也可以单独对解码器训练,还可以对编码器和解码器进行端到端联合训练。

本实施例对编码器和/或解码器的训练方式不加以限定。示意性的参考图6,训练设备将真实训练集41和补充训练集42混合为联合训练集43。该联合训练集43包括多个训练样本,比如每个训练样本均为一个CSI,使用该联合训练集43中的CSI对编码器和解码器进行训练。也即将训练样本输入至编码器,编码器对训练样本进行训练得到CSI反馈信息44。解码器对CSI反馈信息44进行解码,输出恢复出的信道45。基于损失函数46计算恢复出的信道45和训练样本之间的误差,利用误差反向传播方法对编码器和解码器进行端到端训练。

综上所述,本实施例提供的方法,通过对抗生成网络生成第一补充训练集,然后使用基于真实训练集和第一补充训练集混合得到的联合训练集,能够使用充分的训练样本训练得到具有较好性能的编码器和解码器,提高CSI反馈时的压缩效率和反馈精度。

基于接入网设备为模型训练设备的CSI反馈过程:

图7示出了本申请一个示例性实施例提供的CSI反馈方法的流程图。该方法可以由接入网设备或终端来执行,该方法包括:

步骤502:接入网设备基于真实训练集,训练得到对抗生成网络;

对抗生成网络的训练过程可以参考上述图3所示实施例示出的训练过程,不再赘述。

步骤504:接入网设备基于联合训练集,训练得到编码器和解码器;

编码器和解码器的训练过程可以参考上述图5所示实施例示出的训练过程,不再赘述。

步骤506:接入网设备向终端下发编码器;

接入网设备通过下行信令向终端下发编码器,或者下发编码器的模型参数,由终端根据编码器的模型参数自行构建编码器。

示意性的,该下行信令包括下行控制信息(Downlink Controllnformation,DCI)、无线资源控制(Radio Resource Control,RRC)、媒体接入控制(Medium Access Control Control Element,MAC CE)中的至少一种。该下行信令还可以是专用于模型下发的专有信令和信道资源,本申请实施例对此不加以限定。

示意性的,编码器和/或解码器的模型参数包括:神经网络类型、神经网络层数、神经网络层的类型、神经网络中的神经元类型、神经网络中的神经元数量、神经网络中的神经元的矩阵权重中的至少一种。

步骤508:终端使用编码器对CSI进行编码,得到CSI反馈信息;

步骤510:终端向接入网设备发送CSI反馈信息;

终端使用上行反馈信道向接入网设备发送CSI反馈信息。

步骤512:接入网设备接收终端发送的CSI反馈信息,CSI反馈信息是终端通过编码器对CSI编码得到的;

步骤514:接入网设备使用解码器对CSI反馈信息进行解码,得到终端测量的CSI。

在另一些实施例中,上述训练设备也可以由终端来执行。终端基于真实训练集,训练得到对抗生成网络;终端基于联合训练集,训练得到编码器和解码器;终端向接入网设备上报解码器或解码器的模型参数。终端使用编码器对CSI进行编码,得到CSI反馈信息。终端向接入网设备发送CSI反馈信息。接入网设备接收终端发送的CSI反馈信息,CSI反馈信息是终端通过编码器对CSI编码得到的。接入网设备使用解码器对CSI反馈信息进行解码,得到终端测量的CSI。

在另一些实施例中,也可以由第一设备训练得到对抗生成网络,向第二设备发送对抗生成网络或对抗生成网络的模型参数。第二设备基于对抗生成网络生成补充训练集,基于联合 训练集训练得到编码器和解码器。第一设备是接入网设备,第二设备是终端;或者,第一设备是终端,第二设备是接入网设备。

综上所述,本实施例提供的方法,通过利用接入网设备具有的较强计算能力,能够快速训练得到具有优秀性能的编码器和解码器。然后由接入网设备向终端下发编码器,完成基于AI的CSI反馈过程,提高CSI反馈时的压缩效率和反馈精度。

基于周期性反馈的编码器和/或解码器的更新训练过程:

受限于编码器的泛化性和信道环境的复杂多变性。当信道环境发生改变,编码器不适配信道环境导致性能降低时,需要对模型参数进行更新。但是由于CSI自编码器的编码器部署在UE侧,而解码器部署在网络侧,因此当发生模型不适配时,网络侧无法通过CSI反馈获取大量变化后的高质量的有效信道数据集。而持续地采用高精度的码本对变化的信道进行压缩反馈,又会引入较高的反馈开销。因此本实施例采用对抗生成网络的方式,降低高精度码本的反馈密度,基于少量信道反馈,生成第二补充数据集,完成编码器的模型更新。

图8示出了本申请一个示例性实施例提供的模型更新方法的流程图。该方法可以由接入网设备和终端来执行,该方法包括:

步骤602:终端周期性向接入网设备发送基于码本量化的第一CSI反馈码本;

第一CSI反馈码本是基于码本量化方式得到的CSI反馈码本,而非基于AI模型或编码器压缩得到的CSI反馈码本。示意性的,第一CSI反馈码本是高质量的CSI反馈码本,能够有效表达发生变化后的信道环境。

由于第一CSI反馈码本也可以是多个,因此第一CSI反馈码本也可称为第二原始训练集、第二真实训练集、更新训练集等名称。

示意性的,第一CSI反馈码本包括多个采样时间点的CSI反馈信息,比如时间窗W内的多个CSI反馈信息,或者时间窗W内按照指定周期采样的多个CSI反馈信息。

示意性的,第一CSI反馈码本包括多个宽带、子带或频率点上的CSI反馈信息,比如频率窗B内的多个CSI反馈信息,或者频率窗B的多个宽带和/或子带上的多个CSI反馈信息。

示意性的,第一CSI反馈码本的反馈周期可以由配置参数T来确定。第一CSI反馈码本的配置参数T还可以携带其它在码本反馈过程中需要的配置信息。

在一个示例中,在步骤602之前,接入网设备向终端发送第一上报配置,比如通过下行信令向终端发送第一上报配置。终端接收接入网设备发送的第一上报配置,第一上报配置用于指示第一CSI反馈码本的第一上报参数。示意性的,第一上报参数包括如下至少之一:时间窗W;频率窗B;第一CSI反馈码本的配置参数T。

在另一个示例中,在步骤602之前,终端自行确定第一上报配置,第一上报配置用于指示第一CSI反馈码本的第一上报参数。终端向接入网设备发送第一上报配置。比如,终端通过上行信令向接入网设备发送第一上报配置。

步骤604:接入网设备接收终端发送的第一CSI反馈码本;

步骤606:接入网设备通过对抗生成网络基于第一CSI反馈码本构建第二补充训练集;

接入网设备通过对抗生成网络基于第一CSI反馈码本构建第二补充训练集;或者,接入网设备确定第一CSI反馈码本对应的CSI,通过对抗生成网络基于第一CSI反馈码本对应的CSI构建第二补充训练集;或者,接入网设备确定第一CSI反馈码本对应的CSI,通过对抗生成网络基于第一CSI反馈码本以及第一CSI反馈码本对应的CSI构建第二补充训练集。

基于第一CSI反馈码本对对抗生成网络进行训练的方式,与图3所示实施例类似,本实施例不再赘述。

在一个示例中,该对抗生成网络即为图3所示实施例示出的对抗生成网络。

在一个实施例中,该对抗生成网络是基于第一CSI反馈码本另外训练的对抗生成网络,该对抗生成网络与图3所示实施例示出的对抗生成网络不同。

步骤608:接入网设备通过第一CSI反馈码本和第二补充训练集,对编码器和解码器中的至少一个进行更新训练;

示意性的,接入网设备通过第一CSI反馈码本和第二补充训练集所组成的第一联合更新训练集,对编码器和解码器进行联合更新训练。更新后的编码器能够与变化后的信道信息进行很好的适配。

接入网设备可以只对编码器进行更新训练;或者,只对解码器进行更新训练;或者,对编码器和解码器进行更新训练。

步骤610:接入网设备向终端下发更新后的编码器。

在对编码器进行更新的情况下,接入网设备向终端下发更新后的编码器,整个过程可以参考图9所示。其中,步骤602中的高精度码本的量化精度可基于Type2码本进行进一步增强,以提高CSI的恢复精度,保证第一CSI反馈码本的准确度;同时,第一CSI反馈码本的反馈相关配置:周期参数T,时间窗W,频率窗B等均可由网络侧配置,并通过DCI通知UE。步骤606中基于第一CSI反馈码本生成第二补充数据集的过程,与图3实施例中的第一补充数据集的生产方法相同。但由于是对模型进行更新,因此所生成的第二补充数据集样本量一般少于图3所示实施例1中的所需数据集样本量M,以保证可以快速的完成对抗生成网络的模型收敛和CSI自编码器模型的快速更新。

在另一个实施例中,用于更新编码器和/或解码器的设备也可以是终端。终端周期性测量第一CSI,形成更新训练集;终端通过对抗生成网络基于更新训练集构建第二补充训练集;终端通过第一CSI反馈码本和第二补充训练集,对编码器和解码器中的至少一个进行更新训练。终端向接入网设备上报更新后的解码器。具体过程与图8所示实施例类似,不再赘述。

综上所述,本实施例提供的方法,通过在CSI自编码器的在线部署过程中,基于周期性更新的方法,通过配置更低密度的高精度码本用于反馈更新数据集,并配合对抗生成网络,可以实现CSI自编码器模型的在线更新,保证CSI反馈和恢复的精度。

基于非周期性反馈的编码器和/或解码器的更新训练过程:

图10示出了本申请一个示例性实施例提供的模型更新方法的流程图。该方法可以由接入网设备和终端来执行,该方法包括:

步骤702:终端在满足触发条件的情况下,向接入网设备发送基于码本量化的第二CSI反馈码本;

第二CSI反馈码本是基于码本量化方式得到的CSI反馈码本,而非基于AI模型或编码器压缩得到的CSI反馈码本。示意性的,第二CSI反馈码本是高质量的CSI反馈码本,能够有效表达发生变化后的信道环境。

由于第二CSI反馈码本也可以是多个,因此第二CSI反馈码本也可称为第二原始训练集、第二真实训练集、更新训练集等名称。

触发条件包括:信道状态或信道信息或信道参数的变化大于预设阈值。信道状态或信道信息或信道参数包括:参考信号接收功率(Reference Signal Received Power,RSRP),参考信号接收质量(Reference Signal Received Quality,RSRQ),接收信号强度指示器(Reference Signal Strength Indicator,RSSI),CSI中的至少一种。

预设阈值可以是通信协议预定义的;或者,预设阈值可以是预配置的;或者,预设阈值可以是接入网设备向终端配置的。

示意性的,第二CSI反馈码本包括多个采样时间点的CSI反馈信息,比如时间窗W内的多个CSI反馈信息,或者时间窗W内按照指定周期采样的多个CSI反馈信息。

示意性的,第二CSI反馈码本包括多个宽带、子带或频率点上的CSI反馈信息,比如频率窗B内的多个CSI反馈信息,或者频率窗B的多个宽带和/或子带上的多个CSI反馈信息。

示意性的,第二CSI反馈码本的反馈周期可以由配置参数T来确定。第二CSI反馈码本 的触发条件还可以携带其它在码本反馈过程中需要的配置信息。

在一个示例中,在步骤702之前,接入网设备向终端发送第二上报配置,比如通过下行信令向终端发送第二上报配置。终端接收接入网设备发送的第二上报配置,第二上报配置用于指示第二CSI反馈码本的第二上报参数。示意性的,第二上报参数包括如下至少之一:时间窗W;频率窗B;第二CSI反馈码本的触发条件,如图11所示。

在另一个示例中,在步骤702之前,终端自行确定第二上报配置,第二上报配置用于指示第二CSI反馈码本的第二上报参数。终端向接入网设备发送第二上报配置。比如,终端通过上行信令向接入网设备发送第二上报配置,如图12所示。

步骤704:接入网设备接收终端发送的第二CSI反馈码本;

步骤706:接入网设备通过对抗生成网络基于第二CSI反馈码本构建第三补充训练集;

接入网设备通过对抗生成网络基于第二CSI反馈码本构建第三补充训练集;或者,接入网设备确定第二CSI反馈码本对应的CSI,通过对抗生成网络基于第二CSI反馈码本对应的CSI构建第三补充训练集;或者,接入网设备确定第二CSI反馈码本对应的CSI,通过对抗生成网络基于第二CSI反馈码本以及第二CSI反馈码本对应的CSI构建第三补充训练集。

基于第二CSI反馈码本对对抗生成网络进行训练的方式,与图3所示实施例类似,本实施例不再赘述。

在一个示例中,该对抗生成网络即为图3所示实施例示出的对抗生成网络。

在一个实施例中,该对抗生成网络是基于第二CSI反馈码本另外训练的对抗生成网络,该对抗生成网络与图3所示实施例示出的对抗生成网络不同。

步骤708:接入网设备通过第二CSI反馈码本和第三补充训练集,对编码器和解码器中的至少一个进行更新训练;

示意性的,接入网设备通过第二CSI反馈码本和第三补充训练集所组成的第二联合更新训练集,对编码器和解码器进行联合更新训练。更新后的编码器能够与变化后的信道信息进行很好的适配。

接入网设备可以只对编码器进行更新训练;或者,只对解码器进行更新训练;或者,对编码器和解码器进行更新训练。

步骤710:接入网设备向终端下发更新后的编码器。

在对编码器进行更新的情况下,接入网设备向终端下发更新后的编码器。其中,步骤702中的高精度码本的量化精度可基于Type2码本进行进一步增强,以提高CSI的恢复精度,保证第二CSI反馈码本的准确度;同时,第二CSI反馈码本的反馈相关配置:周期参数T,时间窗W,频率窗B等均可由网络侧配置,并通过DCI通知UE。步骤706中基于第二CSI反馈码本生成第二补充数据集的过程,与图3实施例中的第一补充数据集的生产方法相同。但由于是对模型进行更新,因此所生成的第二补充数据集样本量一般少于图3所示实施例1中的所需数据集样本量M,以保证可以快速的完成对抗生成网络的模型收敛和CSI自编码器模型的快速更新。

在另一个实施例中,用于更新编码器和/或解码器的设备也可以是终端。终端周期性测量第二CSI,形成更新训练集;终端通过对抗生成网络基于更新训练集构建第三补充训练集;终端通过第二CSI反馈码本和第三补充训练集,对编码器和解码器中的至少一个进行更新训练。终端向接入网设备上报更新后的解码器。具体过程与图8所示实施例类似,不再赘述。

综上所述,本实施例提供的方法,通过在CSI自编码器的在线部署过程中,基于触发条件对CSI自编码器模型进行在线更新,相比于上一实施例,能够减少终端和服务器之间沟通时的通信数据量。

图13示出了本申请一个示例性实施例提供的一种CSI反馈装置的框图,该装置可以实现成为终端或终端内的一个功能模块,所述装置包括:

编码模块1320,用于使用编码器对CSI进行编码,得到CSI反馈信息;所述编码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的;

发送模块1340,用于向接入网设备发送所述CSI反馈信息。

在一个可选的实施例中,所述编码器是采用如下方式训练得到的:

采用所述对抗生成网络中的生成器生成所述第一补充训练集;

将所述真实训练集和所述第一补充训练集进行混合,得到联合训练集;

采用所述联合训练集对所述编码器进行训练,得到训练完毕的所述编码器。

在一个可选的实施例中,所述对抗生成网络包括生成器和判别器,所述对抗生成网络是基于如下方式训练得到的:

将所述真实训练集中的训练样本输入所述判别器,得到第一判别结果;

将噪声信号输入所述生成器,得到补充训练样本;将所述补充训练样本输入所述判别器,得到第二判别结果;

基于所述第一判别结果和所述第二判别结果,训练得到所述生成器和所述判别器;

其中,所述生成器的损失函数是以所述第一判别结果和所述第二判别结果均为真的目标设置的,所述判别器的损失函数是以所述第一判别结果为真且所述第二判别结果为假的目标设置的。

在一个可选的实施例中,所述装置还包括:

接收模块1360,用于接收所述接入网设备下发的所述编码器,所述编码器是由所述接入网设备训练得到的。

在一个可选的实施例中,所述发送模块1340,还用于周期性向所述接入网设备发送基于码本量化的第一CSI反馈码本;所述接收模块1360,用于接收所述接入网设备下发的更新后的编码器,所述更新后的编码器是所述接入网设备基于所述第一CSI反馈码本和第二补充训练集对所述编码器进行更新训练后得到的,所述第二补充训练集是所述对抗生成网络基于所述第一CSI反馈码本所构建的。

在一个可选的实施例中,所述接收模块1360,还用于接收所述接入网设备发送的第一上报配置,所述第一上报配置用于指示所述第一CSI反馈码本的第一上报参数;

或,

所述发送模块1340,还用于向所述接入网设备发送第一上报配置,所述第一上报配置用于指示所述第一CSI反馈码本的第一上报参数。

在一个可选的实施例中,所述第一上报参数包括如下至少之一:时间窗W;频率窗B;所述第一CSI反馈码本的配置参数T。

在一个可选的实施例中,所述发送模块1340,还用于在满足触发条件的情况下,向所述接入网设备发送基于码本量化的第二CSI反馈码本;所述接收模块1360,还用于接收所述接入网设备下发的更新后的编码器,所述更新后的编码器是所述接入网设备基于所述第二CSI反馈码本和第三补充训练集对所述编码器进行更新训练后得到的,所述第三补充训练集是所述对抗生成网络基于所述第二CSI反馈码本所构建的。

在一个可选的实施例中,所述触发条件包括:

信道参数的变化值大于预设阈值;

其中,所述信道状态或信道信息或信道参数包括:RSRP,RSRQ,RSSI、CSI中的至少一种。

在一个可选的实施例中,所述装置还包括:

所述接收模块1360,还用于接收所述接入网设备发送的第二上报配置,所述第二上报配置用于指示所述第二CSI反馈码本的第二上报参数;或,所述发送模块1340,还用于向所述接入网设备发送第二上报配置,所述第二上报配置用于指示所述第二CSI反馈码本的第二上 报参数。

在一个可选的实施例中,所述第二上报参数包括如下至少之一:时间窗W;频率窗B;所述第二CSI反馈码本的触发条件。

图14示出了本申请一个示例性实施例提供的一种CSI反馈装置的框图,该装置可以实现成为接入网设备或接入网设备内的一个功能模块,所述装置包括:

接收模块1420,用于接收终端发送的CSI反馈信息,所述CSI反馈信息是所述终端通过编码器对CSI编码得到的;

解码模块1440,用于使用解码器对所述CSI反馈信息进行解码,得到所述终端测量的CSI;所述编码器和所述解码器是由真实训练集和第一补充训练集训练得到的,所述第一补充训练集是对抗生成网络中的生成器生成的,所述对抗生成网络是基于所述真实训练集训练得到的。

在一个可选的实施例中,所述编码器和所述解码器是采用如下方式训练得到的:

采用所述对抗生成网络中的生成器生成所述第一补充训练集;

将所述真实训练集和所述第一补充训练集进行混合,得到联合训练集;

采用所述联合训练集对所述编码器和所述解码器进行训练,得到训练完毕的所述编码器和所述解码器。

在一个可选的实施例中,所述对抗生成网络包括生成器和判别器,所述对抗生成网络是基于如下方式训练得到的:

将所述真实训练集中的训练样本输入所述判别器,得到第一判别结果;

将噪声信号输入所述生成器,得到补充训练样本;将所述补充训练样本输入所述判别器,得到第二判别结果;

基于所述第一判别结果和所述第二判别结果,训练得到所述生成器和所述判别器;

其中,所述生成器的损失函数是以所述第一判别结果和所述第二判别结果均为真的目标设置的,所述判别器的损失函数是以所述第一判别结果为真且所述第二判别结果为假的目标设置的。

在一个可选的实施例中,发送模块1460,用于向所述终端下发所述编码器。

在一个可选的实施例中,所述接收模块1420,用于周期性接收终端发送的基于码本量化的第一CSI反馈码本;

训练模块1480,用于通过所述对抗生成网络基于所述第一CSI反馈码本构建的第二补充训练集;通过所述第一CSI反馈码本和所述第二补充训练集,对所述编码器和所述解码器中的至少一个进行更新训练。

在一个可选的实施例中,所述接收模块1420,用于接收所述终端发送的第一上报配置,所述第一上报配置用于指示所述第一CSI反馈码本的第一上报参数;或,发送模块1460,用于向所述终端发送第一上报配置,所述第一上报配置用于指示所述第一CSI反馈码本的第一上报参数。

在一个可选的实施例中,所述第一上报参数包括如下至少之一:

时间窗W;

频率窗B;

所述第一CSI反馈码本的配置参数T。

在一个可选的实施例中,所述接收模块1420,用于接收所述终端在满足触发条件的情况下发送的基于码本量化的第二CSI反馈码本;

训练模块1480,用于通过所述对抗生成网络基于所述第一CSI反馈码本构建的第二补充训练集;通过所述第一CSI反馈码本和所述第二补充训练集,对所述编码器和所述解码器中的至少一个进行更新训练。

在一个可选的实施例中,发送模块1460,用于在对所述编码器进行更新训练的情况下,向所述终端下发更新后的编码器。

在一个可选的实施例中,所述触发条件包括:信道参数的变化值大于预设阈值。信道状态或信道信息或信道参数包括:RSRP,RSRQ,RSSI、CSI中的至少一种。

在一个可选的实施例中,所述接收模块1420,用于接收所述终端发送的第二上报配置,所述第二上报配置用于指示所述第二CSI反馈码本的第二上报参数;或,发送模块1460,用于向所述终端发送第二上报配置,所述第二上报配置用于指示所述第二CSI反馈码本的第二上报参数。

在一个可选的实施例中,所述第二上报参数包括如下至少之一:时间窗W;频率窗B;所述第二CSI反馈码本的触发条件。

图15示出了本申请一个示例性实施例提供的通信设备(终端或接入网设备)的结构示意图,该通信设备包括:处理器101、接收器102、发射器103、存储器104和总线105。

处理器101包括一个或者一个以上处理核心,处理器101通过运行软件程序以及模块,从而执行各种功能应用以及信息处理。

接收器102和发射器103可以实现为一个通信组件,该通信组件可以是一块通信芯片。

存储器104通过总线105与处理器101相连。

存储器104可用于存储至少一个指令,处理器101用于执行该至少一个指令,以实现上述方法实施例中的各个步骤。

此外,存储器104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘或光盘,电可擦除可编程只读存储器(Electrically-Erasable Programmable Read Only Memory,EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM),静态随时存取存储器(Static Random Access Memory,SRAM),只读存储器(Read-Only Memory,ROM),磁存储器,快闪存储器,可编程只读存储器(Programmable Read-Only Memory,PROM)。

在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述各个方法实施例提供的由第一终端或第二终端或网络设备执行的CSI反馈方法。

在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中,通信设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该通信设备执行上述方面所述的由第一终端或第二终端或网络设备执行的CSI反馈方法。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种带辅助加热装置的智能化水箱
  • 一种便携式建筑设计用绘图箱
  • 一种建筑设计的智能化辅助绘图装置
  • 一种应用于建筑设计的专用绘图辅助装置
技术分类

06120116543501