掌桥专利:专业的专利平台
掌桥专利
首页

基于蒙特卡洛树搜索的基站系统AISG协议栈实现方法

文献发布时间:2024-04-18 19:58:30


基于蒙特卡洛树搜索的基站系统AISG协议栈实现方法

技术领域

本发明涉及通信技术领域,具体涉及一种基于蒙特卡洛树搜索的基站系统AISG协议栈实现方法。

背景技术

随着移动通信系统网络的不断扩大,对电调天线设备的扫描速度的要求越来越高。AISG(Antenna Interface Stand Group)协议是实现基站天线与基站系统互操作的标准协议,在AISG标准协议中,设备扫描识别是实现电调天线控制系统RCS(RemoteElectrical Tilt Control System)和天线设备ALD(Antenna Line Device)进行通信的基础和前提条件,但是当前的AISG标准协议并没有提及设备的扫描算法,且未提供指导算法涉及的具体方法。针对AISG标准协议这一不足之处,对ALD扫描算法的性质和实现方式进行了深入的研究,形成了许多有意义的结论。

RRU对电调天线设备的实时控制是通过AISG标准协议来实现的,RRU可以通过设备扫描消息来识别接口上的所有无地址状态的设备,RRU通过发送设备扫描帧XID(ExchangeIdentiifcation),通过唯一的匹配码和掩码来扫描设备。当无地址的电调设备收到RRU发送的扫描帧时,设备将自身的UID(Unique Id)和设备的扫描帧中的掩码MASK进行按位与运算,再与设备的UID码进行比较,若匹配成功,设备则响应RRU的扫描帧消息,若匹配不成功,则不响应扫描帧消息,若存在多个电调设备匹配成功,则RRU会依次给设备分配不同的地址,以此作为区分。

若发生扫描事件,电调天线需要通过相关的策略扩展扫描码来缩小扫描范围,直至对唯一的ALD扫描识别,从而获得正确匹配的ALD。基于二叉树的扫描算法,采用增加固定位数的扫描信息方法,来缩小搜索范围,但是发生碰撞时产生的匹配码与ALD ID匹配概率越大,碰撞周期减少,但空闲周期增加;无论是碰撞周期增多还是空闲周期增多,都大大增加了扫描的时间。

发明内容

本发明的目的在于克服现有技术中的不足,实现基于蒙特卡洛树搜索算法的基站系统AISG协议栈实现方法。它结合了随机模拟的一般性和树搜索的准确性,执行一种非对称树的适应搜索空间拓扑结构增长的算法,这个算法会更频繁地访问更加有趣的节点,并将搜索时间聚焦在更加相关的节点上,该算法通过自适应挑选出可能性比较大的节点,并以此展开搜索范围,不断迭代,使其能更快速的扫描到设备。

为实现上述目的,本发明通过以下技术方案来实现的:

一种基于蒙特卡洛树搜索的基站系统AISG协议栈实现方法,基站系统包括基带处理单元BBU、射频拉远单元RRU和远程电调天线RET;基带处理单元BBU与射频拉远单元RRU之间通过光纤相连,使用公共无线接口CPRI协议,射频拉远单元RRU与远程电调天线RET之间通过RS485双绞线缆相连,且远程电调天线RET与远程电调天线RET之间通过RS485相连,形成级联模式;其特征在于,包括如下步骤:

步骤1:保证BBU和RRU之间的光纤连接正常,且CPRI链路已同步;

步骤2:上电后RRU发送一次AISG协议栈扫描事件,其中扫描算法为基于蒙特卡洛树搜索算法进行扫描;

步骤3:扫描完成后,RRU发送一次开工事件,BBU收到RRU发送的开工事件后,发送打开供电开关消息给RRU;

步骤4:RRU收到BBU发送的供电开关打开消息后,打开供电开关,并回复开关打开结果消息给BBU;

步骤5:BBU配置ADD-RET且发送消息给RRU;

步骤6:RRU回复ADD-RET消息给BBU;

步骤7:BBU下发校准CALIBRATION消息给RRU;

步骤8:RRU执行校准CALIBRATION过程并回复消息给BBU。

扫描算法采用蒙特卡洛树搜索算法,此方法优于传统的二叉树算法,自适应挑出可能性比较大的节点,并以此展开搜索范围,不断迭代,使其更快速的扫描到设备。

其中,基于蒙特卡洛树搜索的AISG协议栈扫描算法是一种决策算法,每次模拟分为以下四个步骤:

选择:从根节点出发向下选择出一个急迫需要被拓展的节点;

拓展:将一个新的子节点添加到树中,并添加到在选择过程中最佳到达的那个节点;

模拟:通过选择动作或策略来执行模拟,直到达到结果或预定义状态;

反向传播:确定新添加节点的值后,必须更新剩余的树,因此,执行反向传播过程,它从新节点反向传播到根节点;在此过程中,每个节点中存储的模拟数量递增。

步骤1.选择:

其中,V

步骤2.扩展节点:

一个或多个叶子节点将会被创建。判断目前节点S1(Current Node)是不是叶节点,这里叶节点是指其没有被展开(Expansion)过。

步骤3.模拟:

接下来,按照流程图,需要判断节点S1被访问的系数是否为0。如为0,则要进行Rollout(Rollout其实就是在接下来的步骤中每一步都随机采取动作,直到停止点)。

步骤4.反向传播:

即利用Rollout最终得到的value来更新路径上每个节点的T、N值。(之后把Rollout的结果删除,MCTS的想法就是从出S0出发不断的进行迭代,不断更新节点值,直到达到一定的迭代次数或者时间。)

5.如果没有达到一定的迭代次数或者时间,继续从根节点进行1-4。

相比极大极小法,这个策略假定你的对手发挥了最好的水平,然后以此调整策略来最大化收益。简单地说,给定状态,你想要找到一个设备将自己的UID和设备的扫描帧中的掩码MASK进行按位与运行,若匹配成功,即结束。

与现有技术相比,本发明提出的技术方案具有以下技术效果:

1、本发明能有效减少扫描的次数,大大提升了扫描设备的效率,为指导算法优化提供了参考。

2、本发明支持自动适配AISG协议栈模式和RS485隧道透传模式,且支持基站一对多、多对多交叉控制天线的应用场景,具有良好的可扩展性。

3、本发明结合了随机模拟的一般性和树搜索的准确性,执行一种非对称树的适应搜索空间拓扑结构增长的算法,这个算法会更频繁地访问更加有趣的节点,并将搜索时间聚焦在更加相关的节点上,该算法通过自适应挑选出可能性比较大的节点,并以此展开搜索范围,不断迭代,使其能更快速的扫描到设备。

附图说明

图1为本发明实施例的基于蒙特卡洛树搜索的基站系统机构示意图。

图2为本发明实施例的基于蒙特卡洛树搜索的基站系统AISG协议栈实现方法流程示意图。

图3为本发明实施例的基于蒙特卡洛扫描算法流程示意图。

图4为本发明实施例的蒙特卡洛树搜索算法的实现过程。

图5为本发明实施例的CRC计算流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行更加完整的描述。

如图1所示,射频拉远单元RRU与基带处理单元BBU之间通过光纤相连,使用公共无线接口CPRI协议,射频拉远单元RRU与远程电调天线RET之间通过RS485双绞线缆相连,且远程电调天线RET与远程电调天线RET之间可通过RS485相连,形成级联模式。

BBU与RRU之间通过私有的通信协议,来定义通信的消息格式。BBU与RRU之间的CPRI光纤同步之后,打开电源后,全通过私有通信协议进行传递;RRU与RET之间通过标准天线接口标准组AISG2.0协议进行通信,此协议为标准的RRU与电调设备之间需要遵循的通信协议。

如图2所示,上电后,BBU与RRU之间通过光纤同步后,RRU首先进行一次基于蒙特卡洛树搜索算法的扫描事件,如图4所示,基于蒙特卡洛树搜索算法分为4个步骤:选择、扩展节点、模拟和反向传播,基于此扫描算法具有高效且良好的可扩展性的优点。RRU扫描结束后,会发送一次开工事件给BBU,通知BBU射频拉远单元已做好相关业务流程的准备。BBU收到RRU发送的开工事件之后,首要要做的就是发送打开供电开关的消息给RRU,RRU收到此消息后,打开供电电压,准备执行AISG业务流程。接下来BBU会发送ADD-RET的配置消息给RRU,RRU收到此消息后,回复ADD-RET的配置消息给BBU,BBU下发校准消息给RRU,RRU收到后下发消息给RET设备,RET设备执行校准流程,执行结束后,返回校准结果给RRU,RRU将校准结果上报给BBU。

蒙特卡洛算法是基于概率数理统计理论的,以中心极限定理和大数定律为主要理论基础。中心极限定理是研究随机变量之和的极限分布在何种情形下是正态的,并应用正态分布的良好性质来解决实际问题。设ξ

如图3所示,基于蒙特卡洛树搜索的扫描算法,具体的实现步骤如下所示:1.RRU首先发送disconnect消息给电调设备,如下所示:7E 01 53 81 76 7E

如上所示,均为16进制数显示,且以0x7E开头和0x7E结尾,0x01表现RET设备地址,在Single RET环境,只支持1个电调设备,在级联环境,可支持多个电调设备,如果是支持多个RET设备,disconnect消息可增加,以此内推。0x53表示控制位,0x81 0x76表示循环冗余校验CRC(Cyclic Redundancy Check),CRC采用查表算法,如图5所示:

其中,CRC为最终校验结果,len为要校验数据的长度,aisg_hdlc_crc_tab_array为将要查的表数据,最终计算出CRC。

2.RRU发送reset消息给电调设备:7E FF BF 81F0 02 07 00A4 F3 7E

如上所示,为RRU发送给BBU的reset消息,其中以0x7E开头和结尾,0xFF为广播地址,0xBF为控制位,0x81为FI,0xF0为GI,0x02 0x07 0x00为固定数据,且数据长度为0x05。

3.RRU广播10次扫描的XID帧给电调设备:7E FF BF 81F0 08 01 02FF FF 0302FF FF 0C 43 7E

如上所示,消息分别以0x7E开头和结尾,0xFF为设备的广播地址,0xBF为控制位,0x81为FI,0xF0为GI,0x08为2*n+4,其中n为数据的长度,PI为1,PL为0x02,PV为0xFF 0xFF,PI为3,PL为0x02,UID为0xFF 0xFF,CRC为0x0C0x43。

4.RRU广播基于蒙特卡洛树搜索算法的xid帧。

7E FF BF 81F0 2A 01 13 00 00 00 00 00 00 00 00 00 00 00 00 00 00 0000 00 00 00 03 13 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 80778B 7E

如上所示,此HDLC帧消息以0x7E开头和结尾,0xFF为广播地址,0xBF为控制位,0x81为FI,0xF0为GI,0x2A为GL,GL=2*n+4,可计算出n为19,UID为00 00 00 00 00 00 0000 00 00 00 00 00 00 00 00 00 00 00,PI为0x03,PL为0x13,bit mask为00 00 00 0000 00 00 00 00 00 00 00 00 00 00 00 0000 80,CRC为0x77 0x8B。

设备响应扫描帧的条件是设备的UID按位与扫描帧中的MASK的结果,与设备的UID后两位保持一致,设备即响应此扫描的XID帧。

在此基础上,加入了蒙特卡洛树搜索的扫描算法,此算法的目的在于计算出合理的UID和MASK,以更优的扫描方式,广播给RET设备,蒙特卡洛树搜索算法的具体实现过程:

步骤1:选择:

在这个过程中,MCTS算法使用特定的策略从根节点开始遍历当前树,该策略使用评估函数来优化选择具有最高估计值的节点,MCTS使用应用于树的上置信界限(UCB)公式作为选择过程中的策略来遍历树,它平衡了勘探与开发的权衡。在树的遍历过程中,根据一些返回最大值的参数来选择一个节点。参数的特征在于通常用于此目的的公式如下所示:

Si表示节点i的值,x

在选择阶段,对于被检查的节点而言,有三种可能:

一、该节点所有可行动作都已经被拓展过;

二、该节点有可行动作还未被拓展过;

三、该节点扫描已经结束了,并已满足扫描规则。

如果所有可行动作都已经被拓展过了,那么使用UCB公式计算该节点所有子节点的UCB值,并找到值最大的一个子节点继续检查,反复向下迭代;

如果依然存在没有被拓展的子节点,那么这个节点就是本次迭代的目标节点N,并找出N还未被拓展的动作,然后执行步骤2;

如果被检查到的节点是一个已经结束的节点,那么从该节点直接执行步骤4;

每一个被检查节点的访问次数在这个阶段都会自增;在反复的迭代之后,在搜索树的底端找到一个节点来继续后面的步骤。

在选择阶段结束后,查找到一个最迫切被拓展的单节点N,以及一个尚未拓展的动作A,在搜索树中创建一个新的节点Nn作为N的一个新子节点,Nn的局面就是节点N在执行了动作A之后的局面;为了让Nn得到一个初始的评分,从Nn开始,让游戏随机进行,直到得到一个扫描结局,这个结局将作为Nn的初始评分;使用成功/失败来作为评分,只有1或者0。

在Nn的模拟结束之后,它的父节点N以及从根节点到N的路径上的所有节点都会根据本次模拟的结果来添加自己的累计评分;

每一次迭代都会拓展搜索树,随着迭代次数的增加,搜索树的规模也不断增加;当到了一定的迭代次数或者时间之后结束,选择根节点下的子节点作为本次决策的结果。

步骤2:扩展:

在此过程中,将一个新的子节点添加到树中,并添加到在选择过程中最佳到达的那个节点。

步骤3:模拟:

在此过程中,通过选择动作或策略来执行模拟,直到达到结果或预定义状态。步骤4:反向传播:

确定新添加节点的值后,必须更新剩余的树。因此,执行反向传播过程,它从新节点反向传播到根节点。在此过程中,每个节点中存储的模拟数量递增。此外,如果新节点的模拟结果获胜,则获胜次数也会增加,以上步骤可以通过图4的步骤来直观理解。

步骤5.RRU发送地址分配帧给RRU

7E FF BF 81F0 18 01 13 54 59 30 30 30 30 30 32 33 30 32 31 36 30 303934 42 31 02 01 02FE 76 7E

如上所示,分别以0x7E开头和结尾,0xFF是广播地址,0xBF是控制位,0x81是FI,0xF0是GI,0x18是参数的长度加5,0x01是PI,0x13是PL,UID是0x540x59 0x30 0x30 0x300x30 0x30 0x32 0x33 0x30 0x32 0x31 0x36 0x30 0x30 0x390x34 0x42 0x31,0x02是PI,0x01是PL,0x02是PV,即分配到的地址,0xFE 0x76是CRC校验。

地址分配HDLC帧发送给电调设备之后,电调设备回复一个地址分配响应帧给RRU,至此,RRU的扫描流程结束。

显然,以上述的实施例仅是本发明一部分实施例,而不是全部实施例。基于发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护范围。

相关技术
  • 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统
  • 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统
技术分类

06120116499342