掌桥专利:专业的专利平台
掌桥专利
首页

经由知识蒸馏的负载预测的方法和用于该方法的设备

文献发布时间:2024-04-18 20:01:30


经由知识蒸馏的负载预测的方法和用于该方法的设备

技术领域

本公开涉及一种经由知识蒸馏的负载预测的方法和用于该方法的设备,并且更具体地涉及一种用于通过在经由双层优化的知识蒸馏中对多个教师模型进行加权来预测通信负载的方法和用于该方法的设备。

背景技术

对于用于负载预测的许多现实世界应用,难以收集用于被称为目标领域的特定感兴趣的领域的足够的训练数据。同时,大量训练数据可在一些被称为源领域的相关领域上可用。迁移学习旨在通过利用来自目标域和源领域两者的知识来改善目标领域中的学习性能。迁移学习已被证明是用于包括通信业务模式、图像分类、能量管理和室内WiFi定位的若干现实世界应用的有效方法。

通信业务预测对于移动通信系统(诸如第五代(5G)或第六代(6G)的移动通信系统)的性能是必不可少的。取决于预测范围,负载预测的范围从短期(提前几小时或几分钟)到长期(提前几年)。短期负载预测(STLF)主要被用于辅助实时通信业务预测、连接密度预测、峰值数据速率预测、系统关键性能指标(KIP)预测和用户行为预测,而长期负载预测主要被应用于通信基础设施规划。准确的短期负载预测可促进基站之间的有效资源分配和业务分布。在现实世界中,由于通信业务模式实时地动态变化并且每个基站具有有限的资源,因此尽可能接近实际需求地部署资源以维持系统性能并且还避免资源浪费是至关重要的。

计算和致动延迟广泛存在于无线通信系统(诸如第五代(5G)无线通信系统和第六代(6G)无线通信系统)的操作、经营和管理(OAM)平面中。这些延迟可能导致潜在的大的系统性能降级。由于现实世界的约束(诸如传感器与服务器之间的有限带宽以及处理器的有限速度)可能难以消除延迟。为了克服这种延迟,关键系统特性(诸如通信负载)的预测在支持系统功能方面是至关重要的。

最近,基于神经网络(NN)的方法以其强大的从时空通信系统数据学习的能力在提高负载预测能力方面显示出了有效性。大多数现有的NN模型纯粹是在存储在单个目标基站中的数据上被训练。然而,一个BS中的数据量可能远不足以构建准确且鲁棒的NN模型,从而导致潜在的大预测错误。一种可能的解决方案是聚合来自多个基站的数据并在这些新聚合的数据上训练预测模型。然而,数据聚合可能带来大的带宽成本并增加对回程资源的需求。

因此,需要一种解决带宽受限的问题并减少计算和致动延迟的新的NN模型。

发明内容

技术解决方案

示例实施例至少解决了上述问题和/或缺点以及上面未描述的其他缺点。此外,示例实施例不需要克服上述缺点,并且可不克服上述任何问题。

根据本公开的一个方面,一种用于预测未来负载的服务器可包括:至少一个存储器,存储计算机可读指令;以及至少一个处理器,被配置为执行计算机可读指令。所述至少一个处理器被配置为从多个源基站获得基于源业务数据训练的多个教师人工智能(AI)模型。所述至少一个处理器被配置为从目标基站获得目标业务数据。所述至少一个处理器被配置为通过基于教师重要性权重整合所述多个教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测。所述至少一个处理器被配置为获得被训练以使得学生损失收敛的学生AI模型,所述学生损失包括关于目标业务数据的蒸馏知识损失和基准真实损失;更新教师重要性权重以使得学生AI模型关于目标业务数据的学生预测与所述多个教师AI模型关于目标业务数据的整合的教师预测之间的教师损失收敛。所述至少一个处理器被配置为基于更新的教师重要性权重被应用于所述多个教师AI模型的教师预测结果来更新学生AI模型。所述至少一个处理器被配置为使用更新的学生AI模型来预测所述目标基站的通信业务负载。

根据本公开的一个方面,一种用于预测未来负载的方法可包括从多个源基站获得基于源业务数据训练的多个教师人工智能(AI)模型。该方法可包括从目标基站获得目标业务数据。该方法可包括通过基于教师重要性权重整合所述多个教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测。该方法可包括获得被训练以使得学生损失的学生AI模型收敛,所述学生损失包括关于目标业务数据的蒸馏知识损失和基准真实损失。该方法可包括更新教师重要性权重以使得学生AI模型关于目标业务数据的学生预测与所述多个教师AI模型关于目标业务数据的整合的教师预测之间的教师损失收敛。该方法可包括基于更新的教师重要性权重被应用于所述多个教师AI模型的教师预测结果来更新学生AI模型。该方法可包括使用更新的学生AI模型来预测所述目标基站的通信业务负载。

根据本公开的一个方面,提供了一种存储指令的计算机可读存储介质,所述指令在由至少一个处理器执行时使所述至少一个处理器执行用于预测未来负载的方法。

另外的方面将部分地在下面的描述中被阐述,并且部分地将从描述中显而易见,或者可通过实践本公开的所呈现的实施例来被获知。

附图说明

通过以下结合附图的描述,本公开的实施例的上述和其他方面、特征和方面将更加明显,其中:

图1是示出根据实施例的用于预测未来负载的系统的总体概述的图;

图2示出根据实施例的经由源基站、服务器与目标基站之间的通信来预测目标基站的业务负载的方法;

图3是示出根据实施例的用于训练学生网络以预测目标基站的未来业务负载的系统的图;

图4是示出根据实施例的训练学生网络以预测目标基站的未来业务负载的整个处理的流程图;

图5是示出根据实施例的基于教师重要性权重来训练学生网络的方法的流程图;

图6是示出根据实施例的优化教师重要性权重的方法的流程图;

图7是根据实施例的电子装置的框图;

图8示出服务器根据预测的业务负载分配通信频谱的使用应用;

图9示出根据实施例的服务器在不同通信小区之间执行业务负载平衡的使用应用;

图10示出根据实施例的小区重选过程;

图11示出根据实施例的与用户设备(UE)和基站(BS)通信以执行小区重选过程的方法;

图12示出根据实施例的用于预测目标位置处的客户服务中心需求的使用应用;以及

图13示出根据实施例的预测目标基站的业务负载的方法。

具体实施方式

下面参照附图更详细地描述示例实施例。

在下面的描述中,即使在不同的附图中,相同的参考标号也被用于相同的元件。提供说明书中定义的内容(诸如详细的构造和元件)以帮助全面理解示例实施例。然而,显而易见的是,可在没有那些具体限定的事项的情况下实践示例实施例。此外,由于公知的功能或结构将以不必要的细节模糊描述,因此没有详细描述他们。

诸如“……中的至少一个”的表达在元件列表之前时修饰整个元件列表,而不是修饰列表中的各个元件。例如,表达“a、b和c中的至少一个”应被理解为包括仅a、仅b、仅c、a和b两者、a和c两者、b和c两者、a、b和c中的全部或前述示例的任何变型。

虽然可使用诸如“第一”、“第二”等的术语来描述各种元件,但是这些元件不必限于上述术语。上述术语可仅被用于将一个元件与另一个元件区分开。

术语“组件”旨在被广义地解释为硬件、固件或硬件和软件的组合。

显而易见的是,本文描述的系统和/或方法可以以不同形式的硬件、固件或硬件和软件的组合来被实现。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不限制实现方式。因此,本文描述了系统和/或方法的操作和行为,而没有参考特定的软件代码,应当理解,软件和硬件可被设计为基于本文的描述来实现系统和/或方法。

即使在权利要求书中叙述和/或在说明书中公开了特征的特定组合,但是这些组合并不旨在限制可能的实施方式的公开。事实上,这些特征中的许多可以以权利要求书中未具体叙述和/或说明书中未公开的方式被组合。尽管下面列出的每个从属权利要求可直接从属于仅一个权利要求,但是可能的实施方式的公开包括每个从属权利要求与权利要求书中的每个其他权利要求的组合。

除非明确描述如此,否则本文使用的元件、动作或指令不应被解释为关键或必要的。此外,如本文所使用的,冠词旨在包括一个或多个项,并且可与“一个或多个”互换使用。此外,如本文所使用的,术语“集合”意图包括一个或多个项(例如,相关项、不相关项、相关和不相关项的组合等),并且可与“一个或多个”互换使用。在仅意图一个项的情况下,使用术语“一个”或类似语言。此外,如本文所使用的,术语“具有”等意图为开放式术语。此外,除非另有明确说明,否则短语“基于”意图表示“至少部分地基于”。

图1是示出根据实施例的用于预测未来负载的系统100的总体概述的图。图2示出根据实施例的经由系统100预测未来负载的方法200。系统100和方法200可被用于预测具有可被用于预测未来负载的对应信息的任何类型的负载,并且不限于本文讨论的具体示例实施例。例如,系统100和方法200可被用于预测电力负载、通信系统业务负载、运输业务负载等。

系统100可包括负载生成系统110和服务器120。负载生成系统110可指通信系统111、电力公用系统112或运输系统113,但是本公开的实施例不限于此。

通信系统111可包括与服务器120通信的多个基站BST和BSS1-BSS6。在多个基站BST和BSS1-BSS6中,基站BST可被称为目标基站BST,并且基站BSS1-BSS6可被称为源基站BSS1-BSS6,源基站BSS1-BSS6提供用于预测目标基站BST的未来通信负载的源数据。多个基站BST和BSS1-BSS6可向服务器120发送实时系统观察结果,并且服务器120可基于实时系统观察结果来预测目标基站BST的未来负载。

服务器120可从通信系统111接收实时系统观察数据。实时系统观察数据可包括通信系统状态的信息,诸如每个小区中活跃用户设备(UE)数量、小区负载比、每个小区中的互联网协议(IP)吞吐量、以及小区物理资源块(PRB)使用率。

服务器120可被实现为配置为从多个基站BST和BSS1-BSS6接收业务数据的单个服务器,并预测多个基站BST和BSS1-BSS6中的每个的未来通信负载。可选地,服务器120可被实现为多个服务器,其中,多个服务器中的每个预测多个基站BST和BSS1-BSS6中的对应一个的未来通信负载。例如,配置为预测目标基站BST的未来通信负载的目标基站服务器ST可从目标基站BST接收业务数据,并且还可从源基站服务器Ss1-Ss6接收源预测模型Ns1-Ns6。目标基站服务器ST可通过使用源预测模型Ns1-Ns6的预测结果训练目标源模型NT来经由目标源模型NT预测目标基站BST的未来通信负载。服务器120可与目标基站服务器ST对应,或者与目标基站服务器ST和源预测模型Ns1-Ns6的组合对应。

根据实施例,服务器120可从源基站获得教师人工智能(AI)模型,从目标基站获得目标业务数据,通过基于教师重要性权重整合教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测,获得被训练为使得关于目标业务数据的学生损失收敛的学生AI模型,更新教师重要性权重以使得学生AI模型关于目标业务数据的学生预测与教师AI模型关于目标业务数据的整合的教师预测之间的教师损失收敛,基于更新的教师重要性权重被应用于教师AI模型的教师预测结果来更新学生AI模型,并使用更新的学生AI模型预测目标基站的通信业务负载。特别地,可训练学生AI模型以使得包括知识蒸馏损失和基准真实(ground truth)损失的学生损失收敛,其中,知识蒸馏损失可表示整合的教师预测与学生AI模型关于目标业务数据的学生预测之间的差异。基准真实损失可表示学生AI模型的学生预测与关于目标业务数据的基准真实业务负载之间的差异。

电力公用系统112可包括消耗电力的房屋1至房屋N,并且服务器120可从房屋1-N中的每个获得历史时间序列数据。房屋1-N中的一个可以是目标房屋,并且房屋中的其余房屋可以是向服务器120提供历史时间序列数据的源房屋。服务器120可通过将知识从源模型迁移到目标模型来经由目标模型预测目标房屋的未来电力负载,其中,基于源房屋的历史时间序列数据来训练源模型。目标房屋可以是新建造的房屋,并且服务器120可能尚未从目标房屋本身收集足够的历史电力负载消耗数据。服务器120可将目标房屋的历史时间序列数据输入到源模型以获得源模型的预测结果,并且经由基于源模型的预测结果被训练的目标模型来预测目标房屋的未来电力负载。例如,历史时间序列数据可包括与房屋1-N对应的电力负载消耗数据、温度数据、天气数据和星期几(例如,工作日或周末)。历史时间序列数据不限于上述示例,并且可包括可指示未来电力负载的其他类型的数据。

运输系统113可包括引起道路交通的车辆1至车辆N。车辆1-N中的一个可以是目标车辆,并且车辆中的其余车辆可以是向服务器120提供历史交通模式的源车辆。除了目标车辆的历史交通模式之外,服务器120还可基于来自使用源车辆的历史交通模式训练的源模型的知识来预测由目标车辆引起的未来运输交通负载。

为了方便说明,以下描述将讨论预测目标基站的通信业务负载的实施例。

在本公开的实施例中,多个教师模型(而不是来自源基站的源数据)经由多教师知识蒸馏被聚合以创建预测目标基站的未来业务负载的学生预测模型。根据实施例的模型聚合可解决数据聚合的有限带宽问题。包括源基站和目标基站的每个基站在其自己的本地数据上学习预测网络。对于单个基站,它将其自身视为预测目标并将其可达的邻近基站视为源基站。目标基站从源基站收集训练的人工智能(AI)模型(例如,神经网络模型)并使用AI模型作为教师网络。对于这些教师网络,用于目标基站的新学生网络经由知识蒸馏(KD)处理被训练以使得学生网络的预测与基准真实之间的回归损失以及学生网络的预测与教师网络的预测之间的KD损失最小化或收敛。

在本公开的实施例中,从多个教师网络蒸馏的知识(例如,教师预测)以教师重要性权重被整合,教师重要性权重被自适应地调整以从相似的源基站学习更多来提高学生网络的预测准确度。

由于各种基站之间的异构性,基站的数据分布可能是不同的,并且来自各种教师的蒸馏知识可能对学生网络的性能有不同的贡献。学生网络可被训练以从相似的源基站学习更多以提高预测准确度,同时通过从不相似的基站学习来泛化其自身以获得更鲁棒的性能。

为了有效地从多个教师网络中蒸馏多样化知识,本公开的一个或多个实施例提供了一种自适应教师重要性加权方法。对于下层优化,学生网络可基于从目标基站收集的第一数据集(例如,训练数据集)来被更新。在上层中,给定每次迭代的更新学生网络,教师重要性权重经由一步梯度下降被同时优化以使得关于从目标基站收集的第二数据集(例如,验证数据集)的知识蒸馏损失最小化或收敛。通过多次迭代,关键教师网络被分配更大的教师重要性权重以提供更多的用于构建学生网络的知识,这提高了对目标基站的通信负载预测性能。

图2示出根据实施例的经由源基站121、服务器120与目标基站120之间的通信来预测目标基站120的业务负载的方法200。服务器120可基于从源基站121提供的教师网络202和从目标基站120收集的业务数据,经由学生网络预测目标基站120的未来业务负载。

在操作201中,多个源基站121中的每个可收集源业务数据。例如,每个源基站BSS1-BSS6可在每个预设时间(例如,每15分钟)收集其自己的源业务数据DS1-DS6,并且每个源业务数据DS1-DS6可包括通信负载和时间信息(例如,日期和小时)。

在操作202中,多个源基站121可基于收集的源业务数据来训练多个教师网络。例如,教师网络T1-T6可被提供以预测每个源基站BSS1-BSS6的业务负载,并且每个教师网络T1-T6可使用源业务数据DS1-DS6中的对应一个来被训练。具体地,教师网络T1可被训练以基于源业务数据DS1来预测源基站BSS1的业务负载,教师网络T2可被训练以基于源业务数据DS2来预测源基站BSS2的业务负载,并且教师网络T3可被训练以基于源业务数据DS3来预测源基站BSS3的业务负载。

操作202可由被包括在多个源基站121中或者与多个源基站121被分开提供的多个服务器中的每个执行。多个服务器可分别包括多个教师网络。

在操作203中,源基站121(或包括训练的教师网络的服务器)可将训练的教师网络发送到服务器120。在本公开的实施例中,源基站121可不将由源基站121收集的业务数据发送到服务器120,而是可仅发送训练的教师网络,以节省源基站121(或包括训练的教师网络的服务器)与服务器120之间的通信带宽,并节省服务器120的存储器存储。然而,实施例不限于此,并且源基站121可发送收集的业务数据和训练的教师网络两者。此外,在实施例中,教师网络和学生网络的训练处理可在同一服务器120中被执行,并且在这种情况下,可省略操作203。

在操作204中,服务器120可接收教师网络,并且可评估学生网络的预测准确度。具体地,服务器120可计算可包括教师网络的预测结果与学生网络的预测结果之间的蒸馏损失以及学生网络的预测结果与目标基站的基准真实业务负载之间的基准真实损失的学生网络的学生损失,并且可基于蒸馏损失和基准真实损失来确定学生网络的预测准确度。

当服务器120确定学生网络的预测准确度不满足学生网络的预设最小性能时,服务器120可请求目标基站122在操作206中收集业务数据,使得服务器120基于从目标基站122收集的业务数据来训练学生网络,从而将学生损失减少到预设阈值(例如,从0到0.1的范围)。

响应于从服务器120接收到数据收集请求,在操作207中,目标基站122可将收集的业务数据发送到服务器120。在接收到业务数据时,服务器120可将业务数据划分为训练数据集Dtrain和验证数据集Dvalid以分别训练学生网络和验证训练的学生网络。

在操作208中,服务器120可基于训练数据集Dtrain训练学生网络。学生网络通过最小化关于训练数据集Dtrain的学生损失来被训练,其中,学生损失可表示关于训练数据集Dtrain的教师网络的预测结果与学生网络的预测结果之间的蒸馏损失和关于训练数据集Dtrain的学生网络的预测结果与目标基站的基准真实业务负载之间的基准真实损失的总和。服务器120可基于蒸馏损失和基准真实损失来确定学生网络的预测准确度。

根据实施例,服务器120可基于目标基站122的性能来执行操作208。服务器120可监测目标基站122,并且如果目标基站122的性能满足特定条件,则发起学生网络的更新处理。

根据实施例,目标基站122可基于其性能请求服务器120执行操作208。目标基站122可测量其自己的性能。如果目标基站122的性能满足特定条件,则目标基站122可发起学生网络的更新处理。

根据实施例,操作208可周期性地被执行。服务器120可定期发起学生网络的更新处理。

在操作209中,服务器120可通过最小化或收敛关于验证数据集Dvalid的教师损失来确定将被应用于整合教师网络的预测结果的最佳教师重要性权重。教师损失可表示基于当前教师重要性权重的教师预测的加权和与学生网络关于验证数据集Dvalid的预测之间的蒸馏损失,其中,学生网络通过最小化关于训练数据集Dtrain的学生损失来被训练。当学生网络的预测被用于更新教师重要性权重时,学生网络接收验证数据集Dvalid作为输入以执行预测。另一方面,当学生网络的预测被用于更新学生网络时,学生网络接收训练数据集Dtrain作为输入以执行预测。

在操作210中,服务器120可使用训练的学生网络来预测目标基站122的未来业务负载。例如,当学生网络的预测性能收敛或达到预设的最小性能时,服务器120可确定完成学生网络的训练处理,并且在训练处理被完成之后,服务器使用训练的学生网络来预测目标基站122的未来业务负载。当学生损失在迭代训练处理期间不再减少并且因此学生损失具有恒定值时,服务器120可确定学生网络的预测性能收敛。当学生损失在迭代训练处理期间保持完全相同的值(例如,x)时,以及当学生损失的变化在恒定值的预设范围内(例如,从x-0.01x到x+0.01x的范围)时,服务器120可确定学生损失具有恒定值。

图3是示出根据实施例的用于训练学生网络以预测目标基站的未来业务负载的系统300的图。

系统300可包括上层(即,领导者)和下层(即,跟随者)以将知识从上层迁移到下层。具体地,系统300可应用知识蒸馏技术以从广泛且鲁棒的教师网络发掘隐藏知识来指导浅显学生网络的训练。每个教师网络首先在上层中在其自己的数据集上被训练,然后整个训练的教师网络被采用来在下层中基于目标基站的训练数据集进行预测。学生网络被训练为不仅预测关于训练数据集的基准真实,而且还匹配来自教师网络的预测输出。

更具体地,上层被提供以基于从多个源基站(例如,源BS#1-#N)收集的多个源数据集(例如,源数据集#1-#N)来训练多个教师网络T1-TN,并且通过将从目标基站(例如,目标BS)收集的目标数据集输入到多个教师网络T1-TN来从多个教师网络T1-TN获得教师预测结果。

在上层中,教师重要性权重的初始集合被应用于教师预测结果,以基于教师重要性权重的初始集合来获得教师预测结果的加权和。例如,所有教师网络的教师重要性权重w

上层将目标数据集和教师预测结果的加权和提供给下层。

在下层中,学生网络基于目标数据集、教师预测结果的加权和以及目标基站的基准真实业务负载来被训练。具体地,下层可计算教师预测结果的加权和与学生网络的预测结果之间的蒸馏损失以及学生网络的预测结果与目标基站的基准真实业务负载之间的基准真实损失,并且可通过经由梯度下降方法使得蒸馏损失和基准真实损失的组合损失最小化或收敛来训练学生网络。例如,学生网络被迭代地更新,直到组合损失收敛到恒定值或减小到预设阈值(例如,在从0到0.1的范围内的值)。可将教师预测结果的加权和与学生网络的预测结果之间以及学生网络的预测结果与目标基站的基准真实业务负载之间的平均绝对误差(MAE)或均方误差(MSE)分别计算为蒸馏损失和基准真实损失。

更新的学生网络从下层被提供到上层。上层可计算更新的学生网络的预测结果与教师预测结果的加权和之间的教师损失,并且调整教师重要性权重以使得教师损失最小化或收敛。

在系统300中,可用分别包括512、256、128、64和32个隐藏神经元的五个隐藏层构建教师网络T1-TN中的每个。可用比教师网络更小的尺寸构建学生网络,学生网络包括具有128个神经元的一个隐藏层。然而,教师网络T1-TN和学生网络的结构不限于此。例如,教师网络T1-TN和学生网络可在具有不同的网络参数的同时,具有相同的网络结构(例如,相同数量的层和神经元、以及层之间和神经元之间的相同连接)。

例如,当存在具有教师重要性权重w的N个教师网络T、具有网络参数α的学生网络S、具有从目标基站收集的M个样本的训练数据集D

表示当教师重要性权重集合w被给出以整合教师网络T的预测结果并且网络参数α被提供以配置学生网络S时学生网络S的学生损失。L

经由一种基于梯度的双层优化算法,用于每个教师网络的最优教师重要性权重朝向知识蒸馏处理自适应地被学习。双层优化算法被用于针对关于验证数据集D

学生网络参数和教师重要性权重的优化被分别表示为下层(即,跟随者)和上层(即,领导者)。具体地,双层优化可基于以下等式(4)和(5)被执行:

其中,

教师损失

所有教师网络的教师重要性权重被初始化为相同,使得当N是教师网络的数量时,初始化的教师重要性权重w

其中,η表示用于下层优化的学习速率,并且α

在获得更新的学生网络参数α

其中,γ表示用于上层优化的学习速率,并且τ是温度参数。Norm(.)是用于确保更新的教师重要性权重w

根据本公开的实施例,用于训练学生网络的算法的伪代码被提供如下。

根据本公开的实施例,用于自适应地优化教师重要性权重的算法的伪代码被提供如下。

学生网络的训练可基于如算法1中所示的多教师知识蒸馏来被执行。双层优化可经由如算法2中所示的迭代处理来被执行。

具体地,在第t次训练迭代时,计算学生网络参数α

一旦在第(t+1)次迭代中获得最佳学生网络S

图4是示出根据实施例的训练学生网络以预测目标基站的未来业务负载的整个处理的流程图。

在操作401中,服务器可确定被选择用于未来业务负载预测的基站是目标基站还是源基站。如果选择的基站是源基站,则操作401进行到操作402。

在操作402中,数据收集请求可从服务器被发送到源基站,使得源基站响应于数据收集请求收集其自己的本地业务数据。

在操作403中,用于源基站的教师网络可使用由源基站收集的业务数据来被训练。

在操作404中,训练的教师网络从源基站被发送到服务器。

可顺序地或并行地针对多个源基站中的每个执行操作402-404。

返回参考操作401,当选择的基站是目标基站时,操作401进行到操作405。

在操作405中,确定学生网络的预测准确度是否大于预设最小性能TH。学生网络的预测准确度可基于学生网络的预测结果与目标基站的基准真实业务负载之间的基准真实损失被计算,并且(如果提供教师网络)还基于教师预测结果的加权和与学生网络的预测结果之间的蒸馏损失被计算。

如果学生网络的预测准确度大于预设最小性能TH,则操作405进行到操作412以使用学生网络预测目标基站的未来业务负载。否则,操作405进行到操作406。

在操作406中,作为用于训练学生网络的初始阶段,数据收集请求从服务器被发送到目标基站,使得目标基站响应于数据收集请求收集业务数据。

在操作407中,服务器可从目标基站获得业务数据,并且在操作408中,可将业务数据划分为训练数据集和验证数据集。

在操作409中,服务器可使用训练数据集来训练学生网络,并且在操作410中,服务器可确定学生网络的预测性能是否收敛。具体地,当包括蒸馏损失和基准真实损失的学生损失达到恒定值时,服务器可确定学生网络的预测性能收敛。参照图5更详细地描述操作409。

如果学生网络的预测性能收敛,则操作410进行到操作412以完成训练处理并经由训练的学生网络预测目标基站的未来业务负载。

如果学生网络的预测性能没有收敛,则操作410进行到操作411。

在操作411中,服务器可基于验证数据集来调整或更新教师重要性权重,然后可进行到操作409以使用训练数据集和教师重要性权重来进一步训练学生网络,直到学生网络的预测性能在操作410中收敛。参照图6更详细地描述操作411。

图5是示出根据实施例的基于教师重要性权重来训练学生网络的方法的流程图。在实施例中,图4中的操作409可包括图5中的操作4091-4093。

在操作4091中,服务器可基于训练数据集使用多个教师网络中的每个来执行业务预测。

在操作4092中,服务器可基于教师重要性权重的初始集合来整合多个教师网络的业务预测结果。

在操作4093中,服务器可通过计算学生损失并且更新学生网络的网络参数以最小化学生损失(例如,将学生损失减少到预设的最小阈值,或者减少学生损失直到学生损失达到恒定值(即,直到学生损失不再减少))来训练学生网络,其中,学生损失包括教师预测结果的加权和与学生网络的预测结果之间的蒸馏损失以及学生网络的预测结果与目标基站的基准真实业务负载之间的基准真实损失。

在操作410中,当学生损失已经达到当前最小阈值或者学生损失不再减少(即,学生损失具有恒定值)时,服务器可确定学生网络的预测性能收敛,并且在操作412中可使用训练的学生网络来预测目标基站的未来业务负载。

在操作410中,当服务器可确定学生网络的预测性能没有收敛时,在操作411中,服务器可更新教师重要性权重。在图6中进一步描述操作411。

图6是示出根据实施例的优化教师重要性权重的方法的流程图。在实施例中,图4和图5中的操作411可包括图6中的操作4111-4114。

在操作4111中,服务器可基于从目标基站收集的验证数据集使用多个教师网络中的每个来执行业务负载预测。多个教师网络中的每个使用它们自己的本地业务数据来被训练。服务器可将验证数据集馈送到训练的教师网络中的每个,并且可从训练的教师网络中的每个获得对目标基站的未来业务负载的教师预测。经由操作4112-4114,来自教师网络的教师预测被蒸馏到学生网络中以提高学生对目标基站的未来业务负载的预测的准确性。

在操作4112中,服务器可基于教师重要性权重的初始集合来整合教师预测,并且可将整合的教师预测提供给学生网络。

在操作4113中,服务器可基于验证数据集计算多个教师网络的教师损失。教师损失可表示关于验证数据集的蒸馏损失,并且可通过例如使用等式(6)计算关于验证数据集的整合的教师预测与学生预测之间的差异来被获得。

在操作4114中,服务器可通过经由梯度下降方法(例如,使用等式(7))使得教师损失最小化或收敛来更新先前应用的教师重要性权重。

在操作410中,服务器可基于使用更新的教师重要性权重被整合的教师预测来确定学生网络是否收敛。

当服务器在操作410中确定学生网络收敛时,在操作412中,服务器可使用收敛的学生网络来预测目标基站的未来业务负载。否则,服务器进行到操作409以继续训练学生网络。

图7是根据实施例的电子装置1000的框图。

图7仅用于说明,并且在不脱离本公开的范围的情况下,电子装置1000的其他实施例可被使用。例如,电子装置1000可与服务器120对应。

电子装置1000包括总线1010、处理器1020、存储器1030、接口1040和显示器1050。

总线1010包括用于将组件1020至组件1050彼此连接的电路。总线1010用作在组件1020至组件1050之间或在电子装置之间传送数据的通信系统。

处理器1020包括中央处理单元(CPU)、图形处理器单元(GPU)、加速处理单元(APU)、集成众核(MIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)中的一个或多个。处理器1020能够执行对电子装置1000的其他组件中的任何一个或任何组合的控制,并且/或者执行与通信相关的操作或数据处理。例如,处理器1020执行图2中所示的操作204、208、209和210,以及图4-图6中的操作401-412、操作4091-4093和操作411-4114。处理器1020执行存储在存储器1030中的一个或多个程序。

存储器1030可包括易失性和/或非易失性存储器。存储器1030存储与电子装置1000的至少一个其他组件相关并且用于驱动和控制电子装置1000的信息,诸如命令、数据、程序(一个或多个指令)、应用1034等中的一个或多个。例如,命令和/或数据可制定操作系统(OS)1032。存储在存储器1030中的信息可由处理器1020执行。

具体地,存储器1030存储用于通信系统111的基站的操作的数据、计算机可读指令、应用和设置信息。存储器1030可存储关于分配给接入的UE的承载的信息和从接入的UE报告的测量结果。

应用1034包括上面讨论的实施例。这些功能可由单个应用或由每个执行这些功能中的一个或多个的多个应用执行。例如,应用1034可包括用于执行图2中所示的操作204、208、209和210以及图4-图6中的操作401-412、操作4091-4093和操作411-4114的人工智能(AI)模型。具体地,根据本公开的实施例,应用1034可包括被配置为形成和操作学生网络的学生模型,以及被配置为形成和操作教师网络的教师模型。

显示器1050包括例如液晶显示器(LCD)、发光二极管(LED)显示器、有机发光二极管(OLED)显示器、量子点发光二极管(QLED)显示器、微机电系统(MEMS)显示器或电子纸显示器。

接口1040包括输入/输出(I/O)接口1042、通信接口1044和/或一个或多个传感器1046。I/O接口1042用作可例如在用户和/或其他外部装置与电子装置1000的其他组件之间传送命令和/或数据的接口。

通信接口1044可包括收发器1045以经由有线连接、无线连接或有线和无线连接的组合实现电子装置1000与其他外部装置(例如,目标基站、多个源基站和存储教师网络的其他服务器)之间的通信。通信接口1044可允许电子装置1000从另一装置接收信息和/或向另一装置提供信息。例如,通信接口1044可包括以太网接口、光学接口、同轴接口、红外接口、射频(RF)接口、通用串行总线(USB)接口、Wi-Fi接口、蜂窝网络接口等。

通信接口1044的收发器1045可包括射频(RF)电路1045A和基带电路1045B。

基带电路1045B可通过无线信道发送和接收信号,并且可对信号执行频带转换和放大。RF电路1045A可将从基带电路1045B提供的基带信号上变频为RF频带信号,然后通过天线发送转换的信号,并将通过天线接收的RF频带信号下变频为基带信号。例如,RF电路1045A可包括发送滤波器、接收滤波器、放大器、混频器、振荡器、数模转换器(DAC)和模数转换器(ADC)。

收发器1045可被连接到一个或多个天线。收发器1045的RF电路1045A可包括多个RF链并且可执行波束成形。对于波束成形,RF电路1045A可控制通过多个天线或天线元件发送和接收的信号中的每个的相位和大小。RF电路1045A可通过发送一个或多个层来执行下行链路多输入和多输出(MIMO)操作。

基带电路1045A可根据无线电接入技术的物理层标准执行基带信号与比特流之间的转换。例如,当发送数据时,基带电路1045B通过对发送比特流进行编码和调制来生成复值符号。当接收数据时,基带电路1045B通过对从RF电路1045A提供的基带信号进行解调和解码来重建接收比特流。

接口1040的(一个或多个)传感器1046可计量物理量或检测电子装置1000的激活状态,并将计量或检测的信息转换为电信号。例如,(一个或多个)传感器1046可包括用于捕获场景的图像的一个或多个相机或其他成像传感器。(一个或多个)传感器1046还可包括麦克风、键盘、鼠标和用于触摸输入的一个或多个按钮中的任何一个或任何组合。(一个或多个)传感器1046还可包括惯性测量单元。另外,(一个或多个)传感器1046可包括用于控制本文包括的至少一个传感器的控制电路。这些(一个或多个)传感器1046中的任何一个可位于电子装置1000内或耦接到电子装置1000。

返回参考处理器1020,处理器1020可通过RF电路1045A和基带电路1045B发送和接收信号。处理器1020可将数据(例如,目标业务数据、源业务数据和教师网络)记录在存储器1030中并从存储器1030读取数据。

例如,当电子装置1000与服务器120对应时,处理器1020可从通信系统111接收业务数据,诸如关于由基站的每个小区服务的活动UE的数量、小区负载比和每个小区的互联网协议(IP)吞吐量的信息,并且可将活动UE的数量、小区负载比和每个小区的PI吞吐量的信息存储在存储器1030中。处理器1020可控制收发器1045向通信系统111发送对业务数据的请求,并且响应于来自业务数据的请求,从服务器120接收活动UE的数量、小区负载比和每个小区的IP吞吐量的信息。处理器1020可基于通信系统状态信息执行操作401-操作412中的至少一个,并且可将目标基站(例如,图1所示的目标基站BST)的预测通信业务负载或目标基站的多个小区中的每个的预测通信业务负载发送到通信系统111。通信系统111可根据预测的通信业务负载将通信带宽或UE分配给通信系统111的多个基站或目标基站的多个小区,使得业务负载在多个基站之间和/或在目标基站的多个小区之间相对均匀地被分布。

图8示出服务器根据预测的业务负载分配通信频谱的使用应用。

根据本公开的实施例,目标基站的未来业务负载经由来自教师网络的有效知识蒸馏以高准确度被预测。基于目标基站的未来业务负载,服务器可调整分配给目标基站的通信频谱。例如,当服务器预测在下午4点与下午8点之间的峰值业务负载时,服务器可在下午4点与下午8点之间增加分配给目标基站的通信频谱。

图9示出根据实施例的服务器在不同通信小区之间执行业务负载平衡的使用应用。

图9示出了根据实施例的服务器120在不同通信小区之间执行业务负载平衡的使用应用。

参照图9,根据示例实施例的用于执行业务负载平衡的系统包括服务器120、多个基站BS1-BS7以及多个UE,其中,多个基站BS1-BS7中的每个基站服务具有不同小区重选优先级的多个小区,多个UE分别在多个小区中被服务。在多个基站BS1-BS7中,BS1是目标基站,其余的基站BS2-BS7是源基站。

在示例实施例中,目标基站BS1可服务具有不同频带f1-f7和不同小区重选优先级的多个小区C1-C7。

服务器120可与多个基站BS1-BS7通信以接收关于UE在其服务小区中的状态的信息,例如,UE是处于空闲模式还是活动模式、活动UE的数量、以及每个小区的互联网协议(IP)吞吐量。

服务器120可基于经由操作401-412预测的目标基站BS1的预测通信业务负载来确定目标基站BS1的多个小区C1-C7中的每个小区的小区重选优先级。通信业务负载可使用从多个基站BS1-BS7接收的通信系统状态信息来被预测。服务器120可向目标基站BS1发送小区重选优先级。目标基站BS1可将小区重选优先级转发给多个UE,使得多个UE中的一些UE被重新分配给另一小区以在多个小区C1-C7之间分配业务负载。

图10示出根据示例实施例的小区重选过程。

如图10所示,通信系统包括至少一个基站(BS)、通信网络和通过至少一个BS接入通信网络的多个用户设备(UE)。

至少一个BS可与演进节点B(eNB)、下一代节点B(gNB)、6G节点对应。BS可收集UE的状态信息,并且可基于状态信息向UE提供对通信网络的接入。状态信息的示例可包括UE是处于活动模式还是空闲模式的信息,并且还可包括UE中的每个的缓冲器状态、可用发送功率状态和信道状态。

通信系统提供由目标基站BS1服务的第一小区“小区1”和第二小区“小区2”。例如,当六(6)个UE被连接到小区1并且一(1)个小区被连接到小区2时,小区2中的六个UE中的一个或多个UE被重新分配给小区1以在小区1与小区2之间分布通信业务负载。

具体地,在LTE、5G系统或6G系统中,目标基站BS1可通过无线电资源控制释放消息来确定UE应该连接到的每个小区(小区1和小区2)的小区重选优先级。UE可基于小区重选优先级来确定要驻留在其上的目标呼叫。对于每个UE,小区重选过程被执行为基于小区重选优先级的概率过程。当小区1具有高小区重选优先级时,给定空闲模式UE可具有被重选以驻留在小区1上的高概率。通信系统可将空闲UE从过载小区2迁移到负载较少的小区1。

图11示出根据示例实施例的与UE和BS通信以执行小区重选处理的方法。

如图11所示,在操作1101中,处于空闲模式的UE 200可执行初始小区选择。为了选择初始小区,UE 200可扫描其操作频带中的所有射频(RF)信道,并且可基于小区选择标准来选择用于UE驻留的初始小区。例如,UE 200可基于各种参数(诸如例如,小区选择接收(RX)电平值(Srxlev)、小区选择质量值(Squal)、临时应用于小区的偏移(Qoffsettemp)、测量的小区接收电平值(Qqualmeas)、测量的小区质量值(Qrxlevmeas)、小区中的最小需求RX电平(Qrxlevmin)、小区中的最小需求质量水平(Qqualmin))来选择初始小区。UE 200将选择的初始小区的信息发送到管理多个小区的基站122,使得处于空闲模式的UE 200驻留在多个小区中的选择的初始小区上。

在操作1102中,基站122可向服务器120发送包括每个小区的活动模式UE的数量、小区负载比和每个小区的IP吞吐量的业务数据。

在操作1103中,服务器120可基于在操作210或412中由学生网络预测的业务负载来确定小区重选参数,并且可将小区重选参数发送到基站122。小区重选参数可与分配给图9所示的多个小区C1-C7的小区重选优先级对应。

在操作1104中,基站122可向UE 200发送包括小区重选参数的无线电资源控制(RRC)释放消息。

在操作1105中,UE 200随后可基于小区重选参数来选择要驻留的目标小区,并且可向基站122发送选择的目标小区的信息。例如,当第二小区C2具有比多个小区C1-C7中的其他邻近小区C1和C3-C7更高的小区重选优先级时,空闲模式UE 200具有比其他邻近小区C1和C3-C7更高的被重新分配为驻留在第二小区C2上的概率。

图12示出目标位置(例如,纽约市)处的客户服务中心需求使用基于从教师网络T1-TN蒸馏的知识而训练的学生网络来被预测的使用应用。教师网络T1-TN可使用由其本地位置(例如,蒙特利尔和多伦多)处的客户服务中心收集的客户服务需求的数据(例如,给定时间段内的客户呼叫数量和/或客户消息的数量、每个客户呼叫的持续时间、响应每个客户电子邮件所需的时间)来被训练。

学生网络可以以与图3-图6所示相同或基本相同的方式被训练,但是使用不同的输入数据(即,客户服务需求的历史数据)并提供不同的预测数据(即,未来客户服务需求的预测,诸如预测的消费者呼叫量和预测的客户消息量)。

图13示出根据实施例的预测目标基站的业务负载的方法1300。

在操作1310中,方法1300可包括从多个源基站获得多个教师人工智能(AI)模型。教师人工智能(AI)模型可基于来自多个源基站的源业务数据来被训练。

在操作1320中,方法1300可包括从目标基站获得目标业务数据。目标业务数据可包括训练数据集和验证数据集。

在操作1330中,方法1300可包括基于目标业务数据获得整合的教师预测。根据实施例,方法1300可包括通过基于教师重要性权重整合多个教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测。

在操作1340中,方法1300可包括获得被训练以收敛学生损失的学生AI模型。学生损失可包括关于目标业务数据的蒸馏知识损失和基准真实损失。

在操作1350中,方法1300可包括更新教师重要性权重以使得学生预测与整合的教师预测之间的教师损失收敛。可从关于目标业务数据的学生AI模型获得学生预测。可从关于目标业务数据的多个教师AI模型获得整合的教师预测。根据实施例,目标业务数据可包括验证数据集。

在操作1360中,方法1300可包括基于更新的教师重要性权重被应用于多个教师AI模型的教师预测结果来更新学生AI模型。教师预测结果可基于目标业务数据被获得。根据实施例,目标业务数据可包括训练数据集。

在操作1370中,方法1300可包括使用更新的学生AI模型来预测目标基站的通信业务负载。

预测方法可被编写为可被存储在介质中的计算机可执行程序或指令。

介质可连续地存储计算机可执行程序或指令,或者临时存储用于执行或下载的计算机可执行程序或指令。此外,介质可以是其中组合了单件或多件硬件的各种记录介质或存储介质中的任何一种,并且介质不限于直接连接到电子装置100的介质,而是可分布在网络上。介质的示例包括被配置为存储程序指令的磁介质(诸如硬盘、软盘和磁带)、光记录介质(诸如CD-ROM和DVD)、磁光介质(诸如光磁软盘)以及ROM、RAM和闪存。介质的其他示例包括由分发应用的应用商店或由提供或分发其他各种类型的软件的网站、服务器等管理的记录介质和存储介质。

预测方法可以以可下载软件的形式被提供。计算机程序产品可包括通过制造商或电子市场电子分发的软件程序形式的产品(例如,可下载的应用)。对于电子分发,软件程序的至少一部分可被存储在存储介质中或者可被临时生成。在这种情况下,存储介质可以是服务器或服务器的存储介质。

前述公开提供了说明和描述,但并不旨在穷举或将实施方式限制为公开的精确形式。根据上述公开,修改和变化是可能的或者可从实施方式的实践中被获取。

如本文所使用的,术语“组件”旨在被广义地解释为硬件、固件或硬件和软件的组合。

显而易见的是,本文描述的系统和/或方法可以以不同形式的硬件、固件或硬件和软件的组合来被实现。用于实现这些系统和/或方法的实际专用控制硬件或软件代码不限制实现方式。因此,本文描述了系统和/或方法的操作和行为,而没有参考特定的软件代码,应当理解,软件和硬件可被设计为基于本文的描述来实现系统和/或方法。

即使在权利要求书中叙述和/或在说明书中公开了特征的特定组合,但是这些组合并不旨在限制可能的实施方式的公开。事实上,这些特征中的许多可以以权利要求书中未具体叙述和/或说明书中未公开的方式被组合。尽管下面列出的每个从属权利要求可直接从属于仅一个权利要求,但是可能的实施方式的公开包括每个从属权利要求与权利要求书中的每个其他权利要求的组合。

上述本公开的实施例可被编写为可被存储在介质中的计算机可执行程序或指令。

介质可连续地存储计算机可执行程序或指令,或者临时存储用于执行或下载的计算机可执行程序或指令。此外,介质可以是其中组合了单件或多件硬件的各种记录介质或存储介质中的任何一种,并且介质不限于直接连接到电子装置1000的介质,而是可被分布在网络上。介质的示例包括被配置为存储程序指令的磁介质(诸如硬盘、软盘和磁带)、光记录介质(诸如CD-ROM和DVD)、磁光介质(诸如光磁软盘)以及ROM、RAM和闪存。介质的其他示例包括由分发应用的应用商店或由提供或分发其他各种类型的软件的网站、服务器等管理的记录介质和存储介质。

上述方法可以以可下载软件的形式被提供。计算机程序产品可包括通过制造商或电子市场电子分发的软件程序形式的产品(例如,可下载的应用)。对于电子分发,软件程序的至少一部分可被存储在存储介质中或者可被临时生成。在这种情况下,存储介质可以是服务器或电子装置1000的存储介质。

与上述神经网络相关的模型可经由软件模块来被实现。当模型经由软件模块(例如,包括指令的程序模块)被实现时,模型可被存储在计算机可读记录介质中。

此外,模型可以是通过以硬件芯片的形式被集成的上述电子装置1000的一部分。例如,模型可以以用于人工智能的专用硬件芯片的形式被制造,或者可被制造为现有通用处理器(例如,CPU或应用处理器)或图形专用处理器(例如GPU)的一部分。

此外,模型可以以可下载软件的形式被提供。计算机程序产品可包括通过制造商或电子市场电子分发的软件程序形式的产品(例如,可下载的应用)。对于电子分发,软件程序的至少一部分可被存储在存储介质中或者可临时被生成。在这种情况下,存储介质可以是制造商或电子市场的服务器,或者是中继服务器的存储介质。

根据本公开的一个方面,一种用于预测未来负载的服务器可包括:存储计算机可读指令的至少一个存储器;以及至少一个处理器,被配置为执行计算机可读指令。所述至少一个处理器被配置为从多个源基站获得基于源业务数据训练的多个教师人工智能(AI)模型。所述至少一个处理器被配置为从目标基站获得目标业务数据。所述至少一个处理器被配置为通过基于教师重要性权重整合所述多个教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测。所述至少一个处理器被配置为获得被训练以使得学生损失收敛的学生AI模型,所述学生损失包括关于目标业务数据的蒸馏知识损失和基准真实损失;更新教师重要性权重以使得学生AI模型关于目标业务数据的学生预测与所述多个教师AI模型关于目标业务数据的整合的教师预测之间的教师损失收敛。所述至少一个处理器被配置为基于更新的教师重要性权重被应用于所述多个教师AI模型的教师预测结果来更新学生AI模型。所述至少一个处理器被配置为使用更新的学生AI模型来预测所述目标基站的通信业务负载。

根据本公开的实施例,所述至少一个处理器还可被配置为将目标业务数据划分为训练数据集和验证数据集。所述至少一个处理器还可被配置为基于目标业务数据的训练数据集来获得蒸馏知识损失和基准真实损失。所述至少一个处理器还可被配置为基于目标业务数据的验证数据集来获得学生AI模型的学生预测和所述多个教师AI模型的整合的教师预测,以更新教师重要性权重。

根据本公开的实施例,所述至少一个处理器还可被配置为迭代地更新学生AI模型和教师重要性权重,直到学生AI模型的所述学生损失收敛到恒定值。

根据本公开的实施例,所述至少一个处理器还可被配置为将学生AI模型的平均绝对误差计算为所述学生损失。

根据本公开的实施例,所述至少一个处理器还可被配置为基于整合的教师预测与学生AI模型关于目标业务数据的学生预测之间的差异来计算学生AI模型的蒸馏知识损失,并且基于学生AI模型关于目标业务数据的学生预测与基准真实业务负载之间的差异来计算学生AI模型的基准真实损失。

根据本公开的实施例,所述至少一个处理器还可被配置为:确定在当前过去时间窗口期间关于所述目标基站的另外业务负载的预测准确度是否低于准确度阈值。所述至少一个处理器还可被配置为响应于确定预测准确度低于准确度阈值,开始从所述目标基站收集目标业务数据,并且基于所述多个教师AI模型的整合的教师预测来训练学生AI模型。

根据本公开的实施例,所述至少一个处理器还可被配置为将目标业务数据划分为训练数据集和验证数据集。所述至少一个处理器还可被配置为在每次迭代时,经由梯度下降更新教师重要性权重和学生AI模型以分别使得关于验证数据集的教师损失和关于训练数据集的学生损失最小化。

根据本公开的实施例,所述至少一个处理器还可被配置为基于预测的所述目标基站的通信业务负载来调整分配给所述目标基站的频谱。

根据本公开的一个方面,一种用于预测未来负载的方法可包括从多个源基站获得基于源业务数据训练的多个教师人工智能(AI)模型。所述方法可包括从目标基站获得目标业务数据。所述方法可包括通过基于教师重要性权重整合所述多个教师AI模型的教师预测结果来基于目标业务数据获得整合的教师预测。所述方法可包括获得被训练以使得学生损失收敛的学生AI模型,所述学生损失包括关于目标业务数据的蒸馏知识损失和基准真实损失。所述方法可包括更新教师重要性权重以使得学生AI模型关于目标业务数据的学生预测与所述多个教师AI模型关于目标业务数据的整合的教师预测之间的教师损失收敛。所述方法可包括基于更新的教师重要性权重被应用于所述多个教师AI模型的教师预测结果来更新学生AI模型。所述方法可包括使用更新的学生AI模型来预测目标基站的通信业务负载。

根据本公开的实施例,所述方法还可包括将目标业务数据划分为训练数据集和验证数据集。所述方法还可包括基于目标业务数据的训练数据集获得蒸馏知识损失和基准真实损失。所述方法还可包括基于目标业务数据的验证数据集获得学生AI模型的学生预测和所述多个教师AI模型的整合的教师预测,以更新教师重要性权重。

根据本公开的实施例,所述方法还可包括:迭代地更新学生AI模型和教师重要性权重,直到学生AI模型的学生损失收敛到恒定值。

根据本公开的实施例,所述方法还可包括:将学生AI模型的平均绝对误差计算为所述学生损失。

根据本公开的实施例,所述方法还可包括:基于整合的教师预测与学生AI模型关于目标业务数据的学生预测之间的差异来计算学生AI模型的蒸馏知识损失。所述方法还可包括基于学生AI模型关于目标业务数据的学生预测与基准真实业务负载之间的差异来计算学生AI模型的基准真实损失。

根据本公开的实施例,所述方法还可包括:确定在当前过去时间窗口期间关于目标基站的另外业务负载的预测准确度是否低于准确度阈值。所述方法还可包括响应于确定预测准确度低于准确度阈值,开始从目标基站收集目标业务数据,并且基于所述多个教师AI模型的整合的教师预测来训练学生AI模型。

根据本公开的实施例,所述方法还可包括:将目标业务数据划分为训练数据集和验证数据集。所述方法还可包括在每次迭代时,经由梯度下降更新教师重要性权重和学生AI模型以分别使得关于验证数据集的教师损失和关于训练数据集的所述学生损失最小化。

根据本公开的实施例,所述方法还可包括:基于预测的目标基站的通信业务负载来调整分配给目标基站的频谱。

根据本公开的一个方面,提供了一种存储指令的计算机可读存储介质,所述指令在由至少一个处理器执行时使所述至少一个处理器执行用于预测未来负载的方法。

虽然已经参照附图描述了本公开的实施例,但是本领域普通技术人员将理解,在不脱离由所附权利要求限定的精神和范围的情况下,可在其中进行形式和细节上的各种改变。

相关技术
  • 终端设备控制方法、终端设备及计算机可读存储介质
  • 一种终端设备的充电方法、终端设备及计算机存储介质
  • 终端设备的告警方法、终端设备和计算机可读存储介质
  • 一种存储管理方法、计算机可读存储介质及终端设备
  • 一种基于NAND FLASH的数据存储方法、终端设备及存储介质
  • 操作数据同步方法、终端设备及存储介质
  • 数据同步方法、系统、配网终端设备及存储介质
技术分类

06120116556035