掌桥专利:专业的专利平台
掌桥专利
首页

一种用于反馈信道状态信息的模型的在线训练方法和系统

文献发布时间:2023-06-19 19:30:30


一种用于反馈信道状态信息的模型的在线训练方法和系统

技术领域

本申请实施例涉及通信技术领域,尤其涉及一种用于反馈信道状态信息的模型的在线训练方法和系统。

背景技术

未来移动通信系统将满足人们在居住、工作、休闲和交通等各种区域的多样化业务需求,即便在密集住宅区、办公室、体育场、露天集会、地铁、快速路、高铁和广域覆盖等具有超高流量密度、超高连接数密度、超高移动性特征的场景,也可以为用户提供超高清视频、虚拟现实、增强现实、云桌面、在线游戏等极致业务体验。与此同时,未来移动通信系统还将渗透到物联网及各种行业领域,与工业设施、医疗仪器、交通工具等深度融合,有效满足工业、医疗、交通等垂直行业的多样化业务需求,实现真正的“万物互联”。

未来移动通信系统应用场景可以分为两大类,即移动宽带(MBB,MobileBroadband)和物联网(IoT,InternetofThings)。其中,移动宽带接入的主要技术需求是高容量,提供高数据速率,以满足数据业务需求的不断增长。物联网主要是受机器通信(MTC,MachineTypeCommunication)需求的驱动,可以进一步分为两种类型,包括低速率的海量机器通信(MMC,MassiveMachine Communication)和低时延高可靠的机器通信。其中,对于低速率的海量机器通信,海量节点低速率接入,传输的数据包通常较小,间隔时间会相对较长,这类节点的成本和功耗通常也会很低;对于低时延高可靠的机器通信,主要面向实时性和可靠性要求比较高的机器通信,例如实时警报、实时监控等。

在移动通信系统中,与无线信道有关的反馈信息是数据有效传输的基础,如何获取高质量的信道状态信息是目前亟待解决的问题。

发明内容

本申请实施例的目的是提供一种用于反馈信道状态信息的模型的在线训练方法和系统,能在线训练出合适的反馈信道状态信息的模型,以便基站可以获取高质量的信道状态信息,解决基站获取信道状态信息灵活性差的问题,提高了网络的服务质量。

本申请实施例的一个方面提供了一种用于反馈信道状态信息的模型的在线训练方法,包括:

基站将包含第一模型标识的第一模型配置信息发送给终端;

所述终端接收到第一模型配置信息后,使用第一模型生成第一信道状态信息反馈给基站;

所述基站根据第一信道状态信息向所述终端发送数据;以及

所述基站在确定所述终端接收的数据包的错误率大于设定的错误阈值后,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。

较佳地,第一模型配置信息还包括:缺省信道状态信息生成方式的信息;以及,

所述基站在确定所述终端接收的数据包的错误率大于设定的错误阈值后,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端,具体为:

若所述基站确定所述终端接收的数据包的错误率大于设定的错误阈值,则向所述终端发送报告配置信息;

所述终端接收到所述报告配置信息后,向所述基站同时反馈基于所述第一模型生成的第一信道状态信息和基于所述缺省信道状态信息方式生成的缺省信道状态信息;

所述基站计算第一信道状态信息和所述缺省信道状态信息之间的相似度;

若计算的相似度小于设定的相似度阈值,所述基站获取所述终端位置附近的其它终端发送的信息在线训练第一模型后,将训练好的第一模型发送给使用第一模型的终端。

较佳地,所述基站获取所述终端位置附近的其它终端发送的信息在线训练第一模型,具体包括:

所述基站发送位置请求信息给所述终端,并在接收到所述终端返回的位置信息后,根据所述终端的位置信息发送信道状态信息数据收集请求信息给以所述终端的位置为圆心、半径为设定值的圆圈范围内的其它终端;

接收到所述信道状态信息数据收集请求信息的终端向所述基站发送用于训练第一模型的信道状态信息;

所述基站基于接收的信道状态信息训练第一模型。

较佳地,所述信道状态信息数据收集请求信息至少包括发送资源配置信息、数据收集格式;以及,

所述接收到所述信道状态信息数据收集请求信息的终端向所述基站发送用于训练第一模型的信道状态信息,具体包括:

接收到所述信道状态信息数据收集请求信息的终端,根据所述资源配置信息使用对应的资源按照所述数据收集格式将收集好的信道状态信息发送给所述基站。

较佳地,在所述基站基于接收的信道状态信息训练第一模型后,还包括:

所述基站若确认训练完成后的第一模型的性能无法满足要求,则:

所述基站向其覆盖范围内的所有正在使用第一模型工作的终端发送强制信道状态信息数据收集请求信息,要求所有正在使用第一模型工作的终端优先按照所述强制信道状态信息数据收集请求信息进行信道状态信息收集操作并反馈;

所述基站根据其覆盖范围内的所有正在使用第一模型工作的终端反馈的信道状态信息对第一模型继续进行训练;并

将训练完成的第一模型作为更新的第一模型发送给其覆盖范围内的所有使用第一模型的终端。

本申请实施例的一个方面又提供了一种用于反馈信道状态信息的模型的在线训练系统,包括:基站和终端;其中

所述基站用于将包含第一模型标识的第一模型配置信息发送给终端;

所述终端用于接收到第一模型配置信息后,使用第一模型生成第一信道状态信息反馈给基站;

所述基站还用于根据第一信道状态信息向所述终端发送数据;以及

在确定所述终端接收的数据包的错误率大于设定的错误阈值后,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。

本申请实施例的一个方面又提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述用于反馈信道状态信息的模型的在线训练方法的步骤。

本申请实施例提供的技术方案,基站将包含第一模型标识的第一模型配置信息发送给终端;所述终端接收到第一模型配置信息后,使用第一模型生成第一信道状态信息反馈给基站;所述基站根据第一信道状态信息向所述终端发送数据;以及所述基站在确定所述终端接收的数据包的错误率大于设定的错误阈值后,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。由于可以在线训练出适合当前通信环境的的模型,从而可以更便于获取高质量的信道状态信息,解决了基站获取信道状态信息灵活性差的问题,提高了网络的服务质量。

附图说明

图1示意性示出了根据本申请实施例的用于反馈信道状态信息的模型的在线训练系统的架构图;

图2示意性示出了根据本申请实施例的用于反馈信道状态信息的模型的在线训练方法的流程图;

图3示意性示出了根据本申请实施例的获取第一模型使用区域内终端发送的信息在线训练第一模型的方法流程图;

图4示意性示出了根据本申请实施例的适于实现用于反馈信道状态信息的模型的在线训练方法的计算机设备的硬件架构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

需要说明的是,在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。

在本申请的描述中,需要理解的是,步骤前的数字标号并不标识执行步骤的前后顺序,仅用于方便描述本申请及区别每一步骤,因此不能理解为对本申请的限制。

下面结合附图详细说明本发明实施例的技术方案。

图1示意性示出了本申请实施例提供的一种用于反馈信道状态信息的模型的在线训练系统的架构,包括:基站和终端;图2示意性示出了该系统实现本申请实施例的信道状态信息获取方法的具体流程图,包括如下步骤:

步骤S200:基站将第一模型配置信息发送给终端。

本步骤中,基站发送给终端的第一模型配置信息至少包括:第一模型标识;进一步,第一模型配置信息还可包括:缺省信道状态信息生成方式的信息。本文将接收第一模型配置信息的终端称为终端A。

步骤S201:终端接收到第一模型配置信息后,使用第一模型生成第一信道状态信息反馈给基站。

具体地,终端A接收到第一模型配置信息后,根据第一模型标识调用相应的第一模型,使用第一模型生成第一信道状态信息反馈给基站。

其中,第一模型是根据使用第一模型的多个终端发送的信息,在线预先训练得到的。第一模型具体可以是一个深度神经网络,包括若干个卷积层和全连接层;第一模型的输入是终端测量得到的信道,输出是信道状态信息。

步骤S202:基站根据第一信道状态信息向所述终端发送数据包。

步骤S203:基站若确定所述终端接收的数据包的错误率大于设定的错误阈值,则根据如下步骤S204~S207,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。

具体地,基站在基于第一信道状态信息向终端A发送N个数据包后,终端基于每个数据包的接收情况会给基站反馈是否接收成功的指示信息,若基站确认针对N个数据包所述终端有M个数据包接收错误,即终端A接收的数据包的错误率大于错误阈值M/N,则根据如下步骤S204~S207,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。其中,N的取值为大于等于2的整数,M的取值是大于等于1、且小于等于M的整数。

步骤S204:基站向所述终端发送报告配置信息。

具体地,基站发送报告配置信息给终端A,报告配置信息要求终端A同时反馈基于第一模型生成的第一信道状态信息和基于缺省信道状态信息方式生成的缺省信道状态信息。

步骤S205:所述终端接收到所述报告配置信息后,向所述基站同时反馈基于所述第一模型生成的第一信道状态信息和基于所述缺省信道状态信息方式生成的缺省信道状态信息。

其中,第一信道状态信息是终端A对测量得到的信道状态信息进行非线性或多层神经网络运算得到的,缺省信道状态信息包含的比特数是终端A对测量得到的信道状态信息进行线性运算得到的。这样做的原因是希望缺省信道状态信息对信道变化的适应性更好,从而更鲁棒,但信道重构的精度要低于基于第一信道状态信息重构的信道精度。

第一信道状态信息与缺省信道状态信息包含的比特数是相同的,从而尽可能好的控制系统反馈开销。

具体地,终端A接收报告配置信息后,基于第一模型生成第一信道状态信息,基于缺省信道状态信息生成方式生成缺省信道状态信息,并将第一信道状态信息和缺省信道状态信息包含在同一个报告中发送给基站。

作为一个较优的实施方式,终端A可以使用满功率发送包含第一信道状态信息和缺省信道状态信息的报告。这样可以尽可能提升基站成功接收到该报告的概率,从而让基站快速判定是否是第一模型不匹配当前信道环境造成的数据传输失误,而且基站也可以根据需要使用鲁棒的缺省信道状态信息重构的下行信道与终端A通信。

步骤S206:基站计算第一信道状态信息和所述缺省信道状态信息之间的相似度;

具体地,基站接收到报告后,将对第一信道状态信息处理后的结果与缺省信道状态信息进行离散余弦相似度计算。

步骤S207:基站若确定计算的计算的相似度小于设定的相似度阈值,则使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练后,将训练好的第一模型发送给所有之前使用第一模型的终端。

本步骤中,基站若确定计算的离散余弦相似度小于等于相似度阈值T-SGCS,则基站获取第一模型使用区域内终端发送的信息在线训练第一模型后,将训练好的第一模型发送给所有之前使用第一模型的终端。

在一个示例性的实施例中,相似度阈值T-SGCS的取值可以为0.78。该值是通过大量的仿真及外场测试得出,当两个重构信道的相关性0.78时,说明这两个信道大概率是不一样的。

具体地,基站使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练的具体方法流程,如图3所示,包括如下子步骤:

子步骤S301:基站向所述终端发送报告配置信息;

具体地,基站发送报告配置信息给所述终端,报告配置信息要求终端A同时反馈基于第一模型生成的第一信道状态信息和基于缺省信道状态信息方式生成的缺省信道状态信息。

子步骤S302:所述终端接收到所述报告配置信息后,向所述基站同时反馈基于所述第一模型生成的第一信道状态信息和基于所述缺省信道状态信息方式生成的缺省信道状态信息;

具体地,终端A接收到报告配置信息后,基于第一模型生成第一信道状态信息,基于缺省信道状态信息生成方式生成缺省信道状态信息,并将第一信道状态信息和缺省信道状态信息包含在同一个报告中发送给基站。

子步骤S303:基站计算第一信道状态信息和所述缺省信道状态信息之间的相似度;若计算的相似度小于设定的相似度阈值,则采取如下子步骤S304~S306获取所述终端附近的其它终端发送的信息在线训练第一模型;

具体地,基站接收到报告后,对第一信道状态信息与缺省信道状态信息进行离散余弦相似度计算;若计算的离散余弦相似度小于等于相似度阈值T-SGCS,则采取如下子步骤S304~S306使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练。

子步骤S304:所述基站发送位置请求信息给所述终端。

具体地,基站发送位置请求信息给终端A。

子步骤S305:所述终端接收到位置请求信息后,向所述基站返回本终端的5位置信息;

本子步骤中,终端A接收到位置请求信息后,向所述基站返回本终端的位置信息。

子步骤S306:基站根据所述终端的位置信息发送信道状态信息数据收集请

求信息给以所述终端的位置为圆心、半径为设定值的圆圈范围内的其它终端;0具体地,基站接收到终端A的位置信息后,向以终端A所处位置为圆心、半径为设定值的圆圈范围内的其它终端发送信道状态信息数据收集请求信息;

本文将接收到信道状态信息数据收集请求信息的终端称为终端B。

基站发送给终端B的信道状态信息数据收集请求信息中,至少包括发送资

源配置信息、数据收集格式;

5进而终端B向所述基站发送用于训练第一模型的信道状态信息:终端B接

收到信道状态信息数据收集请求信息后,若终端B可用的计算能力资源大于等于终端B的总计算能力资源的70%、终端B完成数据收集操作所需的计算能力不会超过终端B的总计算能力资源的15%,且终端B的剩余电量大于等于终端B总电量的50%,则终端B根据资源配置信息使用对应的资源按照数据收集格0式将收集好的信道状态信息发送给基站。

较佳地,终端B可以使用满功率将收集好的信道状态信息发送给基站。这样可以确保数据收集的可靠性和时效性。

步骤S208:基站若确认训练完成后的第一模型的性能无法满足要求,则使用所有正在以第一模型工作的终端发送的信息继续训练第一模型。

具体地,基站若确认训练完成后的第一模型的性能无法满足要求,则:

所述基站向其覆盖范围内的所有正在使用第一模型工作的终端发送强制信道状态信息数据收集请求信息,要求所有正在使用第一模型工作的终端优先按照所述强制信道状态信息数据收集请求信息进行信道状态信息收集操作并反馈;本文将接收到强制信道状态信息数据收集请求信息的终端称为终端C;

其中,强制信道状态信息数据收集请求信息至少包括第一模型标识,发送强制资源配置信息、强制数据收集格式;

终端C接收到强制信道状态信息数据收集请求信息后,根据强制资源配置信息使用对应的资源按照强制数据收集格式将收集好的信道状态信息发送给基站;其中,数据收集格式具体可以是信道状态信息的时域冲激响应,或数据收集格式为信道状态信息的频域子载波信道,或数据收集格式为信道状态信息的时域冲激响应的右奇异矢量集合。

较佳地,终端C可以使用缺省信道状态信息生成方式生成的缺省信道状态向基站反馈。由于终端C与基站之间的下行信道此时可能已不适合使用第一模型进行压缩,因此需要及时使用更为鲁棒的缺省信道状态信息生成方式,进而确保基站与终端之间的下行通信质量。

较佳地,终端C可以使用满功率将收集好的信道状态信息发送给基站。这样可以确保数据收集的可靠性和时效性。

所述基站根据终端C反馈的信道状态信息对第一模型继续进行训练;并将训练完成的第一模型作为更新的第一模型发送给其覆盖范围内的所有使用第一模型的终端。

本发明实施例的技术方案中,基站将包含第一模型标识的第一模型配置信息发送给终端;所述终端接收到第一模型配置信息后,使用第一模型生成第一信道状态信息反馈给基站;所述基站根据第一信道状态信息向所述终端发送数据;以及所述基站在确定所述终端接收的数据包的错误率大于设定的错误阈值后,使用所述终端位置附近的其它终端发送的信息,对第一模型进行训练,并将训练更新后的第一模型发送给使用第一模型的终端。由于可以在线训练出适合当前通信环境的的模型,从而可以更便于获取高质量的信道状态信息,解决了基站获取信道状态信息灵活性差的问题,提高了网络的服务质量。

图4示意性示出了根据本申请实施例的适于实现用于反馈信道状态信息的模型的在线训练方法的计算机设备1300的硬件架构示意图。本实施例中,计算机设备1300是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。例如,可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图4所示,计算机设备1300至少包括但不限于:可通过系统总线相互通信链接存储器1310、处理器1320、网络接口1330。其中:

存储器1310至少包括一种类型的计算机可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器1310可以是计算机设备1300的内部存储模块,例如该计算机设备1300的硬盘或内存。在另一些实施例中,存储器1310也可以是计算机设备1300的外部存储设备,例如该计算机设备1300上配备的插接式硬盘,智能存储卡(SmartMediaCard,简称为SMC),安全数字(SecureDigital,简称为SD)卡,闪存卡(FlashCard)等。当然,存储器1310还可以既包括计算机设备1300的内部存储模块也包括其外部存储设备。本实施例中,存储器1310通常用于存储安装于计算机设备1300的操作系统和各类应用软件,例如用于反馈信道状态信息的模型的在线训练方法的程序代码等。此外,存储器1310还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器1320在一些实施例中可以是中央处理器(CentralProcessingUnit,简称为CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器1320通常用于控制计算机设备1300的总体操作,例如执行与计算机设备1300进行数据交互或者通信相关的控制和处理等。本实施例中,处理器1320用于运行存储器1310中存储的程序代码或者处理数据。

网络接口1330可包括无线网络接口或有线网络接口,该网络接口1330通常用于在计算机设备1300与其他计算机设备之间建立通信链接。例如,网络接口1330用于通过网络将计算机设备1300与外部终端相连,在计算机设备1300与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(GlobalSystemofMobile communication,简称为GSM)、宽带码分多址(WidebandCodeDivisionMultiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是,图4仅示出了具有部件1310-1330的计算机设备,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。

在本实施例中,存储于存储器1310中的用于反馈信道状态信息的模型的在线训练方法还可以被分割为一个或者多个程序模块,并由一个或多个处理器(本实施例为处理器1320)所执行,以完成本申请实施例。

本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时实现实施例中的用于反馈信道状态信息的模型的在线训练方法的步骤。

本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart MediaCard,简称为SMC),安全数字(SecureDigital,简称为SD)卡,闪存卡(FlashCard)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中用于反馈信道状态信息的模型的在线训练方法的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。

显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

技术分类

06120115933146