掌桥专利:专业的专利平台
掌桥专利
首页

拥塞控制方法、装置及系统、计算机存储介质

文献发布时间:2024-04-18 20:01:55


拥塞控制方法、装置及系统、计算机存储介质

本申请是分案申请,原申请的申请号是202010358527.7,原申请日是2020年4月29日,原申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及网络技术领域,特别涉及一种拥塞控制方法、装置及系统、计算机存储介质。

背景技术

拥塞控制是提高网络资源利用率以及优化网络传输质量的重要方法。目前的网络中通常基于显式拥塞通知(explicit congestion notification,ECN)机制进行拥塞控制。

当前,发送端和接收端之间通过网络设备转发数据包实现通信。网络设备中通常配置有ECN配置参数,该ECN配置参数中包括ECN水线,ECN水线也可称为ECN阈值(ECNthreshold)。网络基于ECN机制进行拥塞控制的过程包括:发送端发送支持ECN机制的数据包。网络设备根据出端口队列的队列深度与ECN水线的大小,确定是否为待加入该出端口队列的数据包设置ECN标记。ECN水线通常包括ECN上水线和ECN下水线。当出端口队列的队列深度大于ECN上水线时,待加入该出端口队列的数据包被设置ECN标记的概率为1;当出端口队列的队列深度处于ECN下水线与ECN上水线之间时,待加入该出端口队列的数据包被设置ECN标记的概率大于0且小于1,数据包被设置ECN标记的概率与出端口队列的队列深度正相关;当出端口队列的队列深度小于ECN下水线时,待加入该出端口队列的数据包被设置ECN标记的概率为0。接收端接收到设置有ECN标记的数据包后,向发送端发送拥塞通知报文。发送端根据接收到的拥塞通知报文的数量,调整后续数据包的发送速率,以避免网络拥塞。其中,网络设备中的出端口队列也可称为转发队列,该出端口队列用于缓存发送端向接收端传输的数据包。

但是,由于网络设备中的ECN配置参数通常是静态配置的,当ECN水线设置过高时,会使得网络设备中的出端口队列深度较大,导致数据包的传输时延较长;当ECN水线设置过低时,会使得发送端发送数据包的速率较低,导致网络资源利用率较低。因此目前网络拥塞控制的灵活性较低。

发明内容

本申请提供了一种拥塞控制方法、装置及系统、计算机存储介质,可以解决目前网络拥塞控制的灵活性较低的问题。

第一方面,提供了一种拥塞控制方法。该方法包括:网络设备向ECN推理模型输入该网络设备在第一时间段内的第一网络状态信息,以获取ECN推理模型根据该第一网络状态信息输出的推理结果,该推理结果包括原始ECN配置参数以及所述原始ECN配置参数的置信度。网络设备向管理该网络设备的分析设备发送ECN参数样本,该ECN参数样本包括第一网络状态信息以及该第一网络状态信息对应的目标ECN配置参数,该目标ECN配置参数基于ECN推理模型输出的推理结果得到。网络设备接收分析设备发送的更新后的ECN推理模型,该更新后的ECN推理模型基于ECN参数样本训练得到。

可选地,该目标ECN配置参数供网络设备在第二时间段内进行拥塞控制,该第二时间段在时序上位于第一时间段之后。ECN配置参数包括ECN水线。该ECN水线可以包括ECN上水线和ECN下水线。当ECN水线可以包括ECN上水线和ECN下水线时,该ECN配置参数还可以包括ECN标记概率,ECN标记概率指出端口队列的队列深度达到ECN上水线时,对待加入出端口队列的数据包进行ECN标记的概率。

本申请中,网络设备向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,分析设备将更新后的ECN推理模型发送给网络设备,然后网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,网络设备在第二时间段内采用该目标ECN配置参数进行拥塞控制,该第二时间段在时序上位于第一时间段之后。

本申请中,目标ECN配置参数可以为置信度高于或等于置信度阈值的原始ECN配置参数,或者,目标ECN配置参数可以为对网络设备在第一时间段内使用的ECN配置参数进行传输性能优化调整后的ECN配置参数。因此,网络设备在第二时间段内采用目标ECN配置参数进行拥塞控制,可以保证网络设备的传输性能和拥塞控制的可靠性,进而保证网络运行的可靠性。

可选地,在网络设备获取ECN推理模型根据第一网络状态信息输出的推理结果之后,当原始ECN配置参数的置信度低于置信度阈值时,网络设备根据网络设备的传输性能的变化对网络设备在第一时间段内所使用的ECN配置参数进行调整,并将调整后的ECN配置参数作为目标ECN配置参数。

本申请中,当网络设备中的ECN推理模型输出的原始ECN配置参数的置信度低于置信度阈值时,网络设备不使用该原始ECN配置参数,避免网络传输性能发生劣化。网络设备根据该网络设备的传输性能的变化对第一时间段内所使用的ECN配置参数进行调整,使得网络设备采用调整后的ECN配置参数进行拥塞控制时的传输性能优于采用调整前的ECN配置参数进行拥塞控制时的传输性能,网络设备将调整后的ECN配置参数作为目标ECN配置参数,可以保证后续分析设备采用该ECN参数样本训练得到的ECN推理模型的可靠性。

可选地,网络设备根据网络设备的传输性能的变化对网络设备在第一时间段内所使用的ECN配置参数进行调整的实现过程,包括:

当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升时,网络设备上调网络设备在第一时间段内所使用的ECN配置参数中的ECN水线,和/或,下调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率;当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能下降时,网络设备下调网络设备在第一时间段内所使用的ECN配置参数中的ECN水线,和/或,上调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率。其中,第三时间段在时序上位于第一时间段之前。

可选地,网络设备的传输性能由网络状态信息决定。在相同或相似的网络环境下,网络设备的带宽利用率越高、网络设备的出端口队列的队列深度越小和/或网络设备的ECN包占比越小,表示网络设备的传输性能越好。当网络设备在第一时间段内的带宽利用率高于网络设备在第三时间段内的带宽利用率,网络设备在第一时间段内的队列深度小于网络设备在第三时间段内的队列深度,和/或,网络设备在第一时间段内的ECN包占比小于网络设备在第三时间段内的ECN包占比时,网络设备确定网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升。

可选地,在网络设备获取ECN推理模型根据第一网络状态信息输出的推理结果之后,当原始ECN配置参数的置信度高于或等于置信度阈值时,网络设备将原始ECN配置参数作为目标ECN配置参数。

本申请中,当网络设备中的ECN推理模型输出的原始ECN配置参数的置信度高于或等于置信度阈值时,网络设备直接将该原始ECN配置参数作为目标ECN配置参数,可以保证网络传输性能的可靠性。

可选地,在网络设备获取ECN推理模型根据第一网络状态信息输出的推理结果之后,当原始ECN配置参数的置信度低于置信度阈值时,网络设备还可以向分析设备发送目标指示信息,该目标指示信息中包括网络设备的标识,该目标指示信息用于指示网络设备中的ECN推理模型不适配于该网络设备。可选地,目标指示信息中包括原始ECN配置参数的置信度。

本申请中,网络设备通过向分析设备发送目标指示信息以通知分析设备该网络设备中的ECN推理模型不适配于该网络设备,使得分析设备可以及时有效地更新网络设备中的ECN推理模型,提高网络设备中的ECN推理模型的更新灵活性。

可选地,在网络设备接收分析设备发送的更新后的ECN推理模型之后,网络设备采用更新后的ECN推理模型更新网络设备中的ECN推理模型。

本申请中,在网络运行过程中,网络设备向分析设备发送ECN参数样本,分析设备向网络设备发送基于该ECN参数样本训练得到的ECN推理模型,网络设备再基于更新后的ECN推理模型向分析设备发送新的ECN参数样本,分析设备再向网络设备发送基于该新的ECN参数样本训练得到的ECN推理模型,以此往复,实现了对网络设备中的ECN推理模型的动态配置,进而实现对ECN配置参数的动态调整。

可选地,第一网络状态信息包括网络设备在第一时间段内的队列信息、吞吐信息和拥塞信息中的一个或多个。

第二方面,提供了一种拥塞控制方法。该方法包括:分析设备接收该分析设备管理的网络设备发送的ECN参数样本,该ECN参数样本中包括网络设备的网络状态信息以及该网络状态信息对应的目标ECN配置参数。分析设备采用该ECN参数样本,训练得到第一ECN推理模型。分析设备向网络设备发送该第一ECN推理模型。

可选地,分析设备采用ECN参数样本,训练得到第一ECN推理模型的实现过程,包括:

当ECN推理模型更新条件满足时,分析设备采用ECN参数样本,训练得到第一ECN推理模型;其中,ECN推理模型更新条件包括:向分析设备发送目标指示信息的网络设备的数量达到设备数量阈值,分析设备在第一时长内接收到目标指示信息的累计次数达到第一次数阈值,和/或,分析设备在第二时长内接收到分析设备管理的任一网络设备发送的目标指示信息的次数达到第二次数阈值。该目标指示信息中包括发送目标指示信息的网络设备的标识,该目标指示信息用于指示发送目标指示信息的网络设备中的ECN推理模型不适配于该网络设备。

当向分析设备发送目标指示信息的网络设备的数量达到设备数量阈值时,表示分析设备管理的网络中存在多个网络设备的ECN推理模型不适配于自身。当分析设备在第一时长内接收到目标指示信息的累计次数达到第一次数阈值,和/或,分析设备在第二时长内接收到分析设备管理的任一网络设备发送的目标指示信息的次数达到第二次数阈值时,表示该分析设备管理的网络中的一个或多个网络设备频繁出现ECN配置参数的置信度较低的情况。本申请中,当分析设备管理的网络中存在多个网络设备的ECN推理模型不适配于自身,和/或,网络设备自行根据传输性能对ECN配置参数进行调整时,可能无法得到能够使自身传输性能较好的ECN配置参数时,分析设备采用网络设备发送的ECN参数样本训练得到目标ECN推理模型;反之,分析设备无需训练ECN推理模型。在保证分析设备管理的网络设备中的ECN推理模型的可靠性的同时,减少分析设备对ECN推理模型的更新次数,进而可以节约分析设备的计算资源。

可选地,分析设备向网络设备发送第一ECN推理模型的实现过程,包括:当分析设备接收到网络设备发送的目标指示信息,分析设备向网络设备发送第一ECN推理模型。

本申请中,分析设备可以仅向发送过目标指示信息的网络设备(即其中的ECN推理模型输出的ECN配置参数的置信度低于置信度阈值的网络设备)发送目标ECN推理模型,节约传输资源以及ECN推理模型输出的ECN配置参数的置信度高于或等于置信度阈值的网络设备的处理资源。

可选地,在分析设备采用ECN参数样本,训练得到第一ECN推理模型之后,分析设备向云端设备发送ECN消息,该ECN消息中包括第一ECN推理模型以及第一ECN推理模型对应的业务类型的标识。

可选地,ECN消息中还包括网络设备管理的网络的组网信息。

可选地,分析设备还可以向云端设备发送ECN推理模型获取请求,该ECN推理模型获取请求中包括分析设备管理的网络所承载的目标业务类型。分析设备接收云端设备发送的目标业务类型对应的第二ECN推理模型。分析设备向分析设备管理的网络设备发送第二ECN推理模型。

本申请中,分析设备可以在网络部署的初始阶段向云端设备发送ECN推理模型获取请求,以请求获取该分析设备管理的网络中需要配置的初始ECN推理模型。或者,当分析设备管理的网络中频繁出现网络设备的ECN配置参数的置信度较低的情况时,分析设备可以向云端设备发送ECN推理模型获取请求。能够在网络全新开局或组网变更时,为网络设备提供一个良好的初始ECN推理模型。

第三方面,提供了一种拥塞控制方法。该方法包括:云端设备接收云端设备管理的分析设备发送的ECN推理模型获取请求,该ECN推理模型获取请求中包括分析设备管理的网络所承载的目标业务类型。云端设备基于业务类型与ECN推理模型的对应关系,确定目标业务类型对应的第二ECN推理模型,该对应关系中包括一一对应的多个业务类型和多个ECN推理模型。云端设备向分析设备发送该第二ECN推理模型。

本申请中,通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

可选地,云端设备接收该云端设备管理的多个分析设备发送的ECN消息,该ECN消息中包括分析设备中的第一ECN推理模型以及第一ECN推理模型对应的业务类型的标识;云端设备根据多个分析设备发送的ECN消息,生成上述对应关系。

本申请中,分析设备将包含ECN推理模型的ECN信息发送给云端设备,供云端设备生成或更新对应业务类型的ECN推理模型,提高云端设备中存储的ECN推理模型的可靠性。

可选地,云端设备根据多个分析设备发送的ECN消息,生成对应关系的实现过程,包括:云端设备根据业务类型对多个ECN消息中的第一ECN推理模型进行分类,得到一个或多个模型类,同一模型类中的第一ECN推理模型对应的业务类型相同;针对包含多个第一ECN推理模型的每个模型类,云端设备对该模型类中的多个第一ECN推理模型进行模型迭代处理,得到该模型类对应的一个第二ECN推理模型。

第四方面,提供了一种拥塞控制装置,该拥塞控制装置应用于网络设备。所述装置包括多个功能模块,所述多个功能模块相互作用,实现上述第一方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现,且所述多个功能模块可以基于具体实现进行任意组合或分割。

第五方面,提供了一种拥塞控制装置,该拥塞控制装置应用于分析设备。所述装置包括多个功能模块,所述多个功能模块相互作用,实现上述第二方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现,且所述多个功能模块可以基于具体实现进行任意组合或分割。

第六方面,提供了一种拥塞控制装置,该拥塞控制装置应用于云端设备。所述装置包括多个功能模块,所述多个功能模块相互作用,实现上述第三方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现,且所述多个功能模块可以基于具体实现进行任意组合或分割。

第七方面,提供了一种网络设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如第一方面任一所述的拥塞控制方法。

第八方面,提供了一种分析设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如第二方面任一所述的拥塞控制方法。

第九方面,提供了一种云端设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如第三方面任一所述的拥塞控制方法。

第十方面,提供了一种拥塞控制系统,包括:网络设备和分析设备,所述网络设备包括如第四方面所述的拥塞控制装置或如第七方面所述的网络设备,所述分析设备包括如第五方面所述的拥塞控制装置或如第八方面所述的分析设备。

可选地,所述系统还包括:云端设备,所述云端设备包括如第六方面所述的拥塞控制装置或如第九方面所述的云端设备。

第十一方面,提供了一种计算机存储介质,所述计算机存储介质上存储有指令,当所述指令被计算机设备的处理器执行时,实现如第一方面及其各实施方式、第二方面及其各实施方式或第三方面及其各实施方式任一所述的拥塞控制方法。

第十二方面,提供了一种芯片,芯片包括可编程逻辑电路和/或程序指令,当芯片运行时,实现上述第一方面及其各实施方式、第二方面及其各实施方式或第三方面及其各实施方式任一所述的拥塞控制方法。

本申请提供的技术方案带来的有益效果至少包括:

本申请中,网络设备向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,分析设备将更新后的ECN推理模型发送给网络设备,然后网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

云端设备可以根据管理的分析设备发送的ECN信息,确定一个或多个业务类型对应的ECN推理模型。分析设备可以从云端设备获取与该分析设备管理的网络所承载的业务类型对应的ECN推理模型,然后将该ECN推理模型发送给管理的网络设备,实现对网络设备中的ECN推理模型的动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

附图说明

图1是本申请实施例提供的一种拥塞控制系统的结构示意图;

图2是本申请实施例提供的另一种拥塞控制系统的结构示意图;

图3是本申请实施例提供的一种通信网络的结构示意图;

图4是本申请实施例提供的另一种通信网络的结构示意图;

图5是本申请实施例提供的又一种通信网络的结构示意图;

图6是本申请实施例提供的一种数据包被设置ECN标记的概率与出端口队列的队列深度的关系示意图;

图7是本申请实施例提供的一种拥塞控制方法的流程示意图;

图8是本申请实施例提供的一种分析设备与网络设备的数据交互示意图;

图9是本申请实施例提供的另一种拥塞控制方法的流程示意图;

图10是本申请实施例提供的一种云端设备、分析设备与网络设备的数据交互示意图;

图11是本申请实施例提供的一种拥塞控制装置的结构示意图;

图12是本申请实施例提供的另一种拥塞控制装置的结构示意图;

图13是本申请实施例提供的又一种拥塞控制装置的结构示意图;

图14是本申请实施例提供的再一种拥塞控制装置的结构示意图;

图15是本申请实施例提供的一种拥塞控制装置的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的一种拥塞控制系统的结构示意图。如图1所示,该系统包括分析设备101a-101b(统称为分析设备101)和通信网络中的网络设备102a-102d(统称为网络设备102)。分析设备101也可称为设备分析器(device analyzer,DA),用于管理一个或多个网络设备102。示例地,参见图1,分析设备101a用于管理网络设备102a和网络设备102b,分析设备101b用于管理网络设备102c和网络设备102d。图1中分析设备和网络设备的数量仅用作示意,不作为对本申请实施例提供的拥塞控制系统的限制。

分析设备101可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。网络设备102可以是路由器或交换机等。分析设备101与管理的网络设备102之间通过有线网络或无线网络连接。本申请实施例提供的通信网络可以是数据中心网络(data center network,DCN)、城域网络、广域网络或园区网络等,本申请实施例对通信网络的类型不做限定。每个分析设备101管理的网络通常承载一种业务类型,也即是,由一个分析设备101管理的一个或多个网络设备102上运行相同类型的业务。例如,一个分析设备101可以管理一个模块化数据中心(performance optimization datacenter,POD)网络或一个功能子网,并承载一种特定的业务,例如分布式存储业务、高性能计算业务或人工智能(artificial intelligence,AI)推理业务等。

可选地,图2是本申请实施例提供的另一种拥塞控制系统的结构示意图。如图2所示,在如图1所示的拥塞控制系统的基础上,该系统还包括:云端设备103。云端设备103也可称为云端分析器(cloud analyzer,CA),用于管理一个或多个分析设备101。示例地,参见图2,云端设备103用于管理分析设备101a和分析设备101b。云端设备103可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。云端设备103与管理的分析设备101之间通过有线网络或无线网络连接。可选地,云端设备103与分析设备101也可以集成在一台设备中,本申请实施例对此不做限定。

可选地,本申请实施例提供的通信网络可以是一层网络、两层网络或三层网络,本申请实施例对通信网络的网络架构不做限定。

示例地,图3是本申请实施例提供的一种通信网络的结构示意图。如图3所示,该通信网络为一层网络,该通信网络中包括多个网络设备102A1-A4。网络设备102A1-A4用于将工作站接入通信网络。其中,网络设备102A1-A4可以为柜顶(top of rank,TOR)交换机。工作站具体可以是主机、终端、服务器或虚拟机等各种类型的设备。

示例地,图4是本申请实施例提供的另一种通信网络的结构示意图。如图4所示,该通信网络为两层网络,该通信网络包括汇聚层和接入层。汇聚层是通信网络的高速交换主干,接入层用于将工作站接入通信网络。可选地,参见图4,汇聚层包括2个汇聚层网络设备102B1和102B2,接入层包括4个接入层网络设备102C1-102C4。如图4所示的通信网络可以为胖树或脊-叶(fat tree or leaf-spine)拓扑网络,则汇聚层网络设备102B1和102B2为spine交换机,接入层网络设备102C1-102C4为leaf交换机。可选地,每个leaf交换机的上行链路数等于spine交换机的数量,每个spine交换机的下行链路数等于leaf交换机的数量,也即是,每个spine交换机与所有的leaf交换机连接,每个leaf交换机与所有的spine交换机连接,即spine交换机与leaf交换机全互连。

示例地,图5是本申请实施例提供的又一种通信网络的结构示意图。如图5所示,该通信网络为三层网络,该通信网络包括核心层、汇聚层和接入层。核心层是通信网络的高速交换主干,汇聚层用于提供汇聚连接(连接接入层和核心层),接入层用于将工作站接入通信网络。参见图5,核心层包括2个核心网络设备102D1和102D2;汇聚层包括4个汇聚层网络设备102E1-102E4,其中汇聚层网络设备102E1和102E2分为第一组,汇聚层网络设备102E3和102E4分为第二组;接入层包括8个接入层网络设备102F1-102F8,其中4个接入层网络设备102F1-102F4与第一组汇聚层网络设备102E1-102E2连接,另外4个接入层网络设备102F5-102F8与第二组汇聚层网络设备102E3-102E4连接。可选地,该通信网络的汇聚层和接入层可以组成leaf-spine拓扑网络,则汇聚层网络设备102E1-102E4为spine交换机,接入层网络设备102F1-102F8为leaf交换机。

本申请实施例提供的通信网络基于ECN机制进行拥塞控制。网络设备中包括一个或多个出端口队列,出端口队列用于缓存发送端向接收端发送的数据包。发送端和接收端之间通过网络设备转发数据包实现通信。可选地,通信网络中的发送端与接收端之间的通信过程包括:

在S11中,发送端向网络设备发送数据包。

其中,发送端发送的数据包的互联网协议(internet protocol,IP)报头中的ECN字段置为10或01,也即是发送端发送的数据包支持ECN机制。

在S12中,网络设备将接收到的数据包缓存至第一出端口队列。

可选地,第一出端口队列为网络设备中的任一出端口队列。

在S13中,网络设备根据第一出端口队列的队列深度与ECN水线的大小,确定是否为第一出端口队列中的数据包设置ECN标记。

其中,出端口队列的队列深度用于表示出端口队列中缓存的数据包的总字节数。出端口队列的队列深度越大,表示出端口队列被占用的内存越大。数据包的传输时延与出端口队列的队列深度正相关,也即是,出端口队列的队列深度越大,数据包的传输时延越长。

可选地,网络设备中的每个出端口队列均配置有ECN水线。ECN水线通常包括ECN上水线和ECN下水线。当出端口队列的队列深度大于ECN上水线时,待加入该出端口队列的数据包被设置ECN标记的概率为1;当出端口队列的队列深度处于ECN下水线与ECN上水线之间时,待加入该出端口队列的数据包被设置ECN标记的概率大于0且小于1,数据包被设置ECN标记的概率与出端口队列的队列深度正相关;当出端口队列的队列深度小于ECN下水线时,待加入该出端口队列的数据包被设置ECN标记的概率为0。

示例地,图6是本申请实施例提供的一种数据包被设置ECN标记的概率与出端口队列的队列深度的关系示意图。其中,Kmin表示ECN下水线,Kmax表示ECN上水线,Pmax表示ECN标记概率,该ECN标记概率指出端口队列的队列深度达到ECN上水线时,对待加入该出端口队列的数据包进行ECN标记的概率,0

本申请实施例中,ECN配置参数包括ECN水线。可选地,该ECN水线包括ECN上水线和ECN下水线。当ECN水线包括ECN上水线和ECN下水线时,ECN配置参数还可以包括ECN标记概率。或者,ECN配置参数可以仅包括一条ECN水线,该ECN水线即为设置ECN标记的门限值。当出端口队列的队列深度未超出该ECN水线时,待加入该出端口队列的数据包被设置ECN标记的概率为0,即无需为数据包设置ECN标记;当出端口队列的队列深度超出该ECN水线时,待加入该出端口队列的数据包被设置ECN标记概率为1,即需要为每个数据包设置ECN标记。

在S14中,网络设备向接收端发送第一出端口队列中的数据包。

可选地,当接收端接收到设置有ECN标记的数据包时,生成拥塞通知报文,并向发送端发送该拥塞通知报文。进一步的,发送端接收到拥塞通知报文后,根据接收到的拥塞通知报文的数量确定后续数据包的发送速率,后续数据包的发送速率与发送端接收到拥塞通知报文的数量负相关,以避免网络拥塞。其中,当通信网络采用传输控制协议(transmission control protocol,TCP)时,可以将确认字符(acknowledgement,ACK)报文的TCP报头的ECN字段置为1,并采用该ACK报文作为拥塞通知报文;当通信网络采用允许通过以太网使用远程直接内存访问(remote direct memory access over convergedEthernet,RoCE)协议时,接收端可以将拥塞通知包(congestion notification packet,CNP)作为拥塞通知报文向发送端发送。

基于上述通信网络中发送端与接收端之间的通信过程可知,通信网络基于ECN机制进行有效地拥塞控制的关键在于确定ECN配置参数,尤其是ECN水线。由于当前的ECN配置参数通常是静态配置的,当ECN水线设置过高时,会使得网络设备中的出端口队列深度较大,导致数据包的传输时延较长;当ECN水线设置过低时,会使得发送端发送数据包的速率较低,导致网络资源利用率较低。另外,静态配置的ECN水线也无法适用于各种不同的通信网络或实时变化的某个通信网络。因此目前网络拥塞控制的灵活性较低。在本申请实施例提供的拥塞控制方法中,网络设备可以在上电时或转发数据包的过程中向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,然后分析设备将ECN推理模型发送给网络设备,网络设备采用该ECN推理模型确定ECN配置参数,也即是,网络设备中的ECN推理模型可以由分析设备动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,在如图1所示的拥塞控制系统中,可通过分析设备与网络设备之间的数据交互实现对网络设备中的ECN推理模型的动态配置;在如图2所示的拥塞控制系统中,可通过云端设备、分析设备与网络设备之间的数据交互实现对网络设备中的ECN推理模型的动态配置。本申请以下实施例中,提供了如图7所示的拥塞控制方法以及如图9所示的拥塞控制方法,分别对应用于上述两种拥塞控制系统的方法的实现过程进行说明。

图7是本申请实施例提供的一种拥塞控制方法的流程示意图。该方法可以应用于如图1所示的拥塞控制系统中。如图7所示,该方法包括:

步骤701、网络设备获取该网络设备在第一时间段内的第一网络状态信息。

可选地,第一网络状态信息包括网络设备在第一时间段内的队列信息(例如包括出端口队列的队列深度)、吞吐信息(例如包括带宽利用率)和拥塞信息(例如包括ECN包占比)中的一个或多个。其中,网络设备在第一时间段内的ECN包占比,指网络设备在第一时间段内发出的设置有ECN标记的数据包占发出的所有数据包的比例。网络设备可以周期性地获取该网络设备的网络状态信息,例如网络设备可以每隔若干微秒获取一次该网络设备的网络状态信息。第一时间段可以为过去的某个周期。

示例地,网络设备在第一时间段内的出端口队列的队列深度为1KB(千字节),带宽利用率为90%,ECN包占比为0.5%。

步骤702、网络设备向ECN推理模型输入第一网络状态信息,以获取该ECN推理模型根据第一网络状态信息输出的推理结果。

该推理结果包括原始ECN配置参数以及原始ECN配置参数的置信度。本申请实施例中,将ECN推理模型根据输入的网络状态信息输出的ECN配置参数称为原始ECN配置参数。

可选地,该ECN推理模型为网络设备在出厂前预先配置的初始ECN推理模型;或者,该ECN推理模型为由分析设备发送给网络设备的ECN推理模型。本申请实施例中,分析设备向网络设备发送ECN推理模型,包括:分析设备向网络设备发送完整的ECN推理模型数据,包括模型结构数据和模型参数数据等;或者,分析设备向网络设备发送ECN推理模型的模型参数数据和/或模型参数变量等。该ECN推理模型可以是机器学习模型。

ECN推理模型实质上为分类模型,ECN推理模型可以输出多个类别以及每个类别对应的概率,类别对应的概率用于反映该类别的置信度。其中,每个类别包括一组ECN配置参数,也即是,ECN推理模型可以输出多组ECN配置参数以及每组ECN配置参数的概率。本申请实施例中,假设ECN配置参数对应的概率与该ECN配置参数的置信度正相关,网络设备可以选取ECN推理模型输出的概率最大的一组ECN配置参数作为原始ECN配置参数,并将原始ECN配置参数对应的概率作为原始ECN配置参数的置信度。

可选地,原始ECN配置参数的置信度可以采用数字表示。网络设备中可以预先设置有置信度阈值,网络设备将ECN推理模型输出的原始ECN配置参数对应的概率作为该原始ECN配置参数的置信度,然后比较原始ECN配置参数的置信度与置信度阈值的大小。

或者,原始ECN配置参数的置信度也可以采用“高”和“低”进行粗粒度划分。此时,原始ECN配置参数的置信度高,表示该原始ECN配置参数的置信度高于或等于置信度阈值;原始ECN配置参数的置信度低,表示该原始ECN配置参数的置信度低于置信度阈值。示例地,ECN推理模型输出的原始ECN配置参数对应的概率大于或等于概率阈值时,确定该原始ECN配置参数的置信度高;当ECN推理模型输出的原始ECN配置参数对应的概率小于概率阈值时,确定该原始ECN配置参数的置信度低,该概率阈值可以取值为0.5。

ECN配置参数包括ECN水线。可选地,该ECN水线包括ECN上水线和ECN下水线。该ECN配置参数还可以包括ECN标记概率。本申请实施例以ECN配置参数包括ECN上水线、ECN下水线和ECN标记概率为例进行说明。

步骤703、网络设备基于ECN推理模型根据第一网络状态信息输出的推理结果,得到目标ECN配置参数。

可选地,当原始ECN配置参数的置信度低于置信度阈值时,网络设备根据该网络设备的传输性能的变化对网络设备在第一时间段内所使用的ECN配置参数进行调整,并将调整后的ECN配置参数作为目标ECN配置参数。或者,当原始ECN配置参数的置信度高于或等于置信度阈值时,网络设备将该原始ECN配置参数作为目标ECN配置参数。

可选地,网络设备根据网络设备的传输性能的变化对网络设备在第一时间段内所使用的ECN配置参数进行调整的实现过程,包括:

当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升时,网络设备上调网络设备在第一时间段内所使用的ECN配置参数中的ECN水线,和/或,下调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率。当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能下降时,网络设备下调网络设备在第一时间段内所使用的ECN配置参数中的ECN水线,和/或,上调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率。其中,第三时间段在时序上位于第一时间段之前,ECN标记概率指出端口队列的队列深度达到ECN上水线时,对待加入出端口队列的数据包进行ECN标记的概率。

可选地,第三时间段与第一时间段可以是相邻的时间段,也即是,第三时间段的结束时刻等于第一时间段的开始时刻;或者,第三时间段也可以与第一时间段不相邻,也即是,第三时间段的结束时刻在时序上位于第一时间段的开始时刻之前。第三时间段的时长与第一时间段的时长可以相同,也可以不同。示例地,当网络设备周期性地获取该网络设备的网络状态信息时,第三时间段与第一时间段可以是相邻的两个周期。

可选地,网络设备的传输性能由网络状态信息决定。在相同或相似的网络环境下,网络设备的带宽利用率越高、网络设备的出端口队列的队列深度越小和/或网络设备的ECN包占比越小,表示网络设备的传输性能越好。在本申请实施例中,当网络设备在第一时间段内的带宽利用率高于网络设备在第三时间段内的带宽利用率,网络设备在第一时间段内的队列深度小于网络设备在第三时间段内的队列深度,和/或,网络设备在第一时间段内的ECN包占比小于网络设备在第三时间段内的ECN包占比时,网络设备可以确定该网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升。

示例地,当网络设备在第一时间段内的带宽利用率大于网络设备在第三时间段内的带宽利用率时,网络设备可以将第一时间段使用的ECN水线上调5%和/或将第一时间段内使用的ECN标记概率下调1%,得到目标ECN配置参数;当网络设备在第一时间段内的带宽利用率小于网络设备在第三时间段内的带宽利用率时,网络设备可以将第一时间段使用的ECN水线下调5%和/或将第一时间段使用的ECN标记概率上调1%,得到目标ECN配置参数。

步骤704、网络设备在第二时间段内采用目标ECN配置参数进行拥塞控制。

该第二时间段在时序上位于第一时间段之后。第一时间段与第二时间段可以是相邻的时间段,也即是,第一时间段的结束时刻等于第二时间段的开始时刻;或者,第一时间段也可以与第二时间段不相邻,也即是,第一时间段的结束时刻在时序上位于第二时间段的开始时刻之前。第一时间段的时长与第二时间段的时长可以相同,也可以不同。示例地,当网络设备周期性地获取该网络设备的网络状态信息时,第一时间段与第二时间段可以是相邻的两个周期。网络设备在第二时间段内采用目标ECN配置参数进行拥塞控制,指网络设备在第二时间段内将ECN配置参数设置为目标ECN配置参数以转发数据包。

本申请实施例中,由于目标ECN配置参数为置信度高于或等于置信度阈值的原始ECN配置参数,或者,目标ECN配置参数为对网络设备在第一时间段内使用的ECN配置参数进行传输性能优化调整后的ECN配置参数。因此,网络设备在第二时间段内采用目标ECN配置参数进行拥塞控制,可以保证网络设备的传输性能和拥塞控制的可靠性,进而保证网络运行的可靠性。

步骤705、网络设备向分析设备发送ECN参数样本。

该ECN参数样本包括第一网络状态信息以及该第一网络状态信息对应的目标ECN配置参数。该目标ECN配置参数基于ECN推理模型输出的推理结果得到,也即是,该目标ECN配置参数为置信度高于或等于置信度阈值的原始ECN配置参数,或者,该目标ECN配置参数为对网络设备在第一时间段内使用的ECN配置参数进行传输性能优化调整后的ECN配置参数。

可选地,第一网络状态信息包括网络设备在第一时间段内的出端口队列的队列深度、带宽利用率和ECN包占比。示例地,假设网络设备在第一时间段内的出端口队列的队列深度为1KB,带宽利用率为90%,ECN包占比为0.5%,目标ECN配置参数中的ECN上水线为100KB,ECN下水线为1KB,ECN标记概率为5%,则ECN参数样本的内容可以如表1所示。

表1

本申请实施例中,由于网络设备在第一网络状态信息对应的网络状态下,采用目标ECN配置参数进行拥塞控制时可以保证传输性能,因此将第一网络状态信息以及该第一网络状态信息对应的目标ECN配置参数作为ECN参数样本,可以保证后续分析设备采用该ECN参数样本训练得到的ECN推理模型的可靠性。

可选地,当原始ECN配置参数的置信度低于置信度阈值时,网络设备还可以向分析设备发送目标指示信息。该目标指示信息中包括网络设备的标识。该目标指示信息用于指示网络设备中的ECN推理模型不适配于该网络设备。其中,网络设备的标识可以是网络设备的媒体访问控制(Media Access Control,MAC)地址或硬件地址等能够唯一标识网络设备的信息。可选地,目标指示信息中包括原始ECN配置参数的置信度。

步骤706、分析设备采用ECN参数样本,训练得到目标ECN推理模型。

可选地,分析设备在接收到管理的网络设备发送的多个ECN参数样本后,采用该多个ECN参数样本训练得到目标ECN推理模型。该多个ECN参数样本可以由分析设备管理的一个网络设备发送,也可以由分析设备管理的多个网络设备发送。分析设备可以将多个ECN参数样本输入模型训练器,由模型训练器输出该目标ECN推理模型。或者,分析设备中预先存储有初始ECN推理模型,分析设备采用新接收到的ECN参数样本对初始ECN推理模型进行增量训练(或重训练),得到目标ECN推理模型。该目标ECN推理模型的输入为网络状态信息,输出为ECN配置参数以及ECN配置参数的置信度。

可选地,当ECN推理模型更新条件满足时,分析设备采用ECN参数样本,训练得到目标ECN推理模型。其中,ECN推理模型更新条件包括:向分析设备发送目标指示信息的网络设备的数量达到设备数量阈值,分析设备在第一时长内接收到目标指示信息的累计次数达到第一次数阈值,和/或,分析设备在第二时长内接收到分析设备管理的任一网络设备发送的目标指示信息的次数达到第二次数阈值。该目标指示信息中包括发送该目标指示信息的网络设备的标识,该目标指示信息用于指示发送该目标指示信息的网络设备中的ECN推理模型不适配于该网络设备。

可选地,设备数量阈值为大于1的整数,例如设备数量阈值可以取值为2、6或7等,本申请实施例对设备数量阈值的具体取值不做限定。当向分析设备发送目标指示信息的网络设备的数量达到设备数量阈值时,表示分析设备管理的网络中存在多个网络设备的ECN推理模型不适配于自身。当分析设备在第一时长内接收到目标指示信息的累计次数达到第一次数阈值,和/或,分析设备在第二时长内接收到分析设备管理的任一网络设备发送的目标指示信息的次数达到第二次数阈值时,表示该分析设备管理的网络中的一个或多个网络设备频繁出现ECN配置参数的置信度较低的情况,进一步反映该网络设备自行根据传输性能对ECN配置参数进行调整时,可能无法得到能够使自身传输性能较好的ECN配置参数。

本申请实施例中,当分析设备管理的网络中存在多个网络设备的ECN推理模型不适配于自身,和/或,网络设备自行根据传输性能对ECN配置参数进行调整时,可能无法得到能够使自身传输性能较好的ECN配置参数时,分析设备采用网络设备发送的ECN参数样本训练得到目标ECN推理模型;反之,分析设备无需训练ECN推理模型。在保证分析设备管理的网络设备中的ECN推理模型的可靠性的同时,减少分析设备对ECN推理模型的更新次数,进而可以节约分析设备的计算资源。

步骤707、分析设备向网络设备发送目标ECN推理模型。

可选地,当分析设备接收到网络设备发送的目标指示信息,分析设备向该网络设备发送目标ECN推理模型。也即是,分析设备向发送过目标指示信息的网络设备发送目标ECN推理模型。本申请实施例中,若网络设备未向分析设备发送目标指示信息,表示该网络设备中的ECN推理模型的性能较好,此时分析设备可以不向该网络设备发送目标ECN推理模型,节约传输资源和网络设备的处理资源。或者,分析设备在训练得到目标ECN推理模型后,也可以向该分析设备管理的各个网络设备分别发送该目标ECN推理模型,便于对各个网络设备的管理。其中,分析设备向网络设备发送的目标ECN推理模型,可以是该目标ECN推理模型的完整模型数据,或者可以是该目标ECN推理模型的模型参数数据,又或者可以是目标ECN推理模型相对于网络设备中的ECN推理模型的模型参数变量,本申请实施例对分析设备向网络设备发送的目标ECN推理模型中的具体内容不做限定。

步骤708、网络设备采用目标ECN推理模型更新该网络设备中的ECN推理模型。

网络设备接收到的目标ECN推理模型相对于网络设备中的原ECN推理模型而言,为更新后的ECN推理模型。可选地,当网络设备接收到分析设备发送的更新后的ECN推理模型的完整模型数据时,网络设备可以直接采用该更新后的ECN推理模型替代该网络设备中的原ECN推理模型;当网络设备接收到分析设备发送的模型参数数据时,网络设备采用该模型参数数据替代网络设备中的ECN推理模型的模型参数数据,得到更新后的ECN推理模型;当网络设备接收到分析设备发送的模型参数变量时,网络设备采用该模型参数变量修改网络设备中的ECN推理模型的模型参数数据,得到更新后的ECN推理模型,例如,网络设备中的某个模型参数的值为a,接收到该模型参数对应的变化量为+b,则网络设备修改得到该模型参数的更新值为a+b。然后,网络设备基于更新后的ECN推理模型获取新的ECN配置参数。

本申请实施例中,网络设备采用分析设备发送的ECN推理模型更新该网络设备中的ECN推理模型,也即是,网络设备将更新后的ECN推理模型作为该网络设备中的ECN推理模型,然后可以再次执行上述步骤701至步骤708。由于在网络运行过程中,网络设备向分析设备发送ECN参数样本,分析设备向网络设备发送基于该ECN参数样本训练得到的ECN推理模型,网络设备再基于更新后的ECN推理模型向分析设备发送新的ECN参数样本,分析设备再向网络设备发送基于该新的ECN参数样本训练得到的ECN推理模型,以此往复,实现了对网络设备中的ECN推理模型的动态配置,进而实现对ECN配置参数的动态调整。

示例地,图8是本申请实施例提供的一种分析设备与网络设备的数据交互示意图。如图8所示,分析设备包括配置模型优化模块、调优监管模块和样本汇聚模块。其中,样本汇聚模块用于汇总整理网络设备发送的数据,包括ECN参数样本和目标指示信息等;调优监管模块用于评估是否满足ECN推理模型更新条件;配置模型优化模块用于在调优监管模块确定满足ECN推理模型更新条件后,基于样本汇聚模块中的数据,对现有ECN推理模型进行更新,并向网络设备发送优化ECN推理模型。网络设备包括ECN配置推理模块、推理置信评估模块和配置修正模块。其中,ECN配置推理模块用于采集网络状态信息,并将网络状态信息输入ECN推理模型,以得到ECN推理模型输出的ECN配置参数和置信度;推理置信评估模块用于对ECN推理模型输出的ECN配置参数进行置信度评估;配置修正模块用于当ECN推理模型输出的ECN配置参数的置信度低于置信度阈值时,根据网络设备的传输性能的变化对ECN配置参数进行调整,并向分析设备发送ECN参数样本。

综上所述,在本申请实施例提供的拥塞控制方法中,网络设备向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到目标ECN推理模型,分析设备将目标ECN推理模型发送给网络设备,然后网络设备采用该目标ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,当分析设备管理的网络中存在多个网络设备的ECN推理模型不适配于自身,和/或,网络设备自行根据传输性能对ECN配置参数进行调整时,可能无法得到能够使自身传输性能较好的ECN配置参数时,分析设备采用网络设备发送的ECN参数样本训练得到目标ECN推理模型;反之,分析设备无需训练ECN推理模型。在保证分析设备管理的网络设备中的ECN推理模型的可靠性的同时,减少分析设备对ECN推理模型的更新次数,进而可以节约分析设备的计算资源。另外,分析设备还可以仅向ECN推理模型输出的ECN配置参数的置信度低于置信度阈值的网络设备发送目标ECN推理模型,节约传输资源以及ECN推理模型输出的ECN配置参数的置信度高于或等于置信度阈值的网络设备的处理资源。

图9是本申请实施例提供的另一种拥塞控制方法的流程示意图。该方法可以应用于如图2所示的拥塞控制系统中。如图9所示,该方法包括:

步骤901、分析设备向云端设备发送ECN推理模型获取请求。

该ECN推理模型获取请求中包括分析设备管理的网络所承载的目标业务类型。可选地,该分析设备可以是云端设备管理的任一分析设备。该ECN推理模型获取请求中还可以包括分析设备的标识。分析设备的标识可以是分析设备的MAC地址或硬件地址等能够唯一标识分析设备的信息。

可选地,分析设备可以在网络部署的初始阶段向云端设备发送ECN推理模型获取请求,以请求获取该分析设备管理的网络中需要配置的初始ECN推理模型。或者,当分析设备管理的网络中频繁出现网络设备的ECN配置参数的置信度较低的情况时,分析设备可以向云端设备发送ECN推理模型获取请求。本申请实施例对分析设备向云端设备发送ECN推理模型获取请求的触发条件不做限定。

步骤902、云端设备基于业务类型与ECN推理模型的对应关系,确定目标业务类型对应的第二ECN推理模型。

该对应关系中包括一一对应的多个业务类型和多个ECN推理模型。示例地,云端设备中存储的对应关系中包括:分布式存储业务及其对应的一个ECN推理模型,高性能计算业务及其对应的一个ECN推理模型,AI推理业务及其对应的一个ECN推理模型。

可选地,云端设备接收该云端设备管理的多个分析设备发送的ECN消息,该ECN消息中包括分析设备中的第一ECN推理模型以及该第一ECN推理模型对应的业务类型的标识;云端设备根据该多个分析设备发送的ECN消息,生成上述对应关系。其中,分析设备发送的ECN消息中的第一ECN推理模型的获取方式可参考步骤706中目标ECN推理模型的获取方式,本申请实施例在此不再赘述。

本申请实施例中,将分析设备训练得到的ECN推理模型称为第一ECN推理模型,即分析设备向云端设备发送的ECN消息中包含的ECN推理模型为第一ECN推理模型;将云端设备训练得到的ECN推理模型称为第二ECN推理模型,即云端设备向分析设备发送的ECN推理模型为第二ECN推理模型。

可选地,云端设备根据该多个分析设备发送的ECN消息,生成上述对应关系的实现过程可以包括:云端设备根据业务类型对多个ECN消息中的第一ECN推理模型进行分类,得到一个或多个模型类,同一模型类中的第一ECN推理模型对应的业务类型相同。针对包含多个第一ECN推理模型的每个模型类,云端设备对该模型类中的多个第一ECN推理模型进行模型迭代处理,得到该模型类对应的一个第二ECN推理模型。云端设备对多个第一ECN推理模型进行模型迭代处理,可以包括:对该多个第一ECN推理模型进行模型结构优化,和/或,根据该多个第一ECN推理模型的模型参数数据进行模型参数的调整等,最终得到一个第二ECN推理模型。例如,可以对该多个第一ECN推理模型中的同一模型参数的值取其平均值或中值。

示例地,假设云端设备接收到5个分析设备发送的ECN消息,该5个分析设备分别为分析设备1-5。其中,分析设备1管理的网络所承载的业务类型为业务类型1,分析设备2管理的网络所承载的业务类型为业务类型2,分析设备3管理的网络所承载的业务类型为业务类型1,分析设备4管理的网络所承载的业务类型为业务类型1,分析设备5管理的网络所承载的业务类型为业务类型2。则云端设备将分析设备1、分析设备3和分析设备4分别发送的ECN推理模型作为一个模型类,将分析设备2和分析设备5分别发送的ECN推理模型作为另一个模型类,并对2个模型类中的ECN推理模型分别进行模型迭代处理,最终得到业务类型1对应的一个ECN推理模型(称为ECN推理模型1)以及业务类型2对应的一个ECN推理模型(称为ECN推理模型2)。

步骤903、云端设备向分析设备发送该目标业务类型对应的第二ECN推理模型。

示例地,参考步骤902中的例子,假设目标业务类型为业务类型1,则云端设备向分析设备发送ECN推理模型1。可选地,分析设备接收到云端设备发送的ECN推理模型后,采用该ECN推理模型替代原ECN推理模型,即更新分析设备中的ECN推理模型。

步骤904、分析设备向网络设备发送该目标业务类型对应的第二ECN推理模型。

可选地,分析设备可以向该分析设备管理的部分或全部网络设备发送该第二ECN推理模型。例如,当该第二ECN推理模型用作分析设备管理的网络中需要配置的初始ECN推理模型时,分析设备可以向该分析设备管理的所有网络设备分别发送该第二ECN推理模型。

本申请实施例中,云端设备可以根据管理的分析设备发送的ECN信息,确定一个或多个业务类型对应的ECN推理模型。分析设备可以从云端设备获取与该分析设备管理的网络所承载的业务类型对应的ECN推理模型,然后将该ECN推理模型发送给管理的网络设备,实现对网络设备中的ECN推理模型的动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

可选地,网络设备接收到分析设备发送的第二ECN推理模型后,采用该第二ECN推理更新网络设备中的原ECN推理模型。

步骤905、网络设备获取该网络设备在第一时间段内的第一网络状态信息。

步骤906、网络设备向该网络设备中的ECN推理模型输入第一网络状态信息,以获取该ECN推理模型根据第一网络状态信息输出的推理结果。

步骤907、网络设备基于ECN推理模型根据第一网络状态信息输出的推理结果得到目标ECN配置参数。

步骤908、网络设备在第二时间段内采用目标ECN配置参数进行拥塞控制。

步骤909、网络设备向分析设备发送ECN参数样本。

步骤910、分析设备采用ECN参数样本,训练得到第一ECN推理模型。

步骤911、分析设备向网络设备发送第一ECN推理模型。

步骤912、网络设备采用第一ECN推理模型更新该网络设备中的ECN推理模型。

上述步骤905至步骤912的实现过程和相关解释可参考上述步骤701至步骤708的实现过程和相关解释,本申请实施例在此不再赘述。

步骤913、分析设备向云端设备发送ECN消息。

该ECN消息中包括第一ECN推理模型以及该第一ECN推理模型对应的业务类型的标识。可选地,ECN消息中还包括网络设备管理的网络的组网信息。

云端设备接收到分析设备发送的ECN消息后,根据ECN消息中的业务类型的标识对第一ECN推理模型进行分类,并对更新后的模型类重新进行模型迭代处理,得到该模型类对应的新的第二ECN推理模型。

示例地,假设上述分析设备为分析设备6,该分析设备6管理的网络所承载的业务类型为业务类型1,结合步骤902中的例子,云端设备将分析设备6发送的ECN消息中的ECN推理模型添加到分析设备1、分析设备3和分析设备4发送的ECN推理模型所在的模型类中,然后对该模型类重新进行模型迭代处理,得到更新后的业务类型1对应的第二ECN推理模型。

本申请实施例中,由于分析设备与云端设备之间传输的数据包括ECN推理模型和业务类型等脱敏数据,通常不会传输网络状态信息等客户敏感数据,因此可以保证网络的安全性和隐私性。当然,网络设备也可以直接向云端设备发送ECN参数样本,云端设备根据全网大量网络设备发送的ECN参数样本训练得到各个业务类型对应的ECN推理模型,然后将该ECN推理模型直接发送给网络设备。

示例地,图10是本申请实施例提供的一种云端设备、分析设备与网络设备的数据交互示意图。如图10所示,云端设备包括配置模型汇聚模块、场景梳理模块、结构优化模块和模型联合学习模块。其中,配置模型汇聚模块用于收集各个分析设备发送的ECN信息,包括ECN推理模型和业务类型;场景梳理模块用于根据业务类型对ECN推理模型进行分类,得到一个或多个模型类;结构优化模块用于对模型类中的ECN推理模型进行模型结构优化;模型联合学习模块用于对模型类中的多个ECN推理模型中的模型参数进行联合调优,并向分析设备发送与该分析设备管理的网络所承载的业务类型对应的泛化ECN推理模型。分析设备包括配置模型优化模块、调优监管模块和样本汇聚模块。其中,样本汇聚模块用于汇总整理网络设备发送的数据,包括ECN参数样本和目标指示信息等;调优监管模块用于评估是否满足ECN推理模型更新条件;配置模型优化模块用于在调优监管模块确定满足ECN推理模型更新条件后,基于样本汇聚模块中的数据,对现有ECN推理模型进行更新,并向网络设备发送优化ECN推理模型并向云端设备发送包含该优化推理模型的ECN信息,或者,配置模型优化模块直接向网络设备转发云端设备发送的泛化ECN推理模型,即配置模型优化模块可以向网络设备发送优化ECN推理模型或泛化ECN推理模型(简称:优化/泛化ECN推理模型)。网络设备包括ECN配置推理模块、推理置信评估模块和配置修正模块。其中,ECN配置推理模块用于采集网络状态信息,并将网络状态信息输入ECN推理模型,以得到ECN推理模型输出的ECN配置参数和置信度;推理置信评估模块用于对ECN推理模型输出的ECN配置参数进行置信度评估;配置修正模块用于当ECN推理模型输出的ECN配置参数的置信度低于置信度阈值时,根据网络设备的传输性能的变化对ECN配置参数进行调整,并向分析设备发送ECN参数样本。

综上所述,在本申请实施例提供的拥塞控制方法中,云端设备可以根据管理的分析设备发送的ECN信息,确定一个或多个业务类型对应的ECN推理模型。分析设备可以从云端设备获取与该分析设备管理的网络所承载的业务类型对应的ECN推理模型,然后将该ECN推理模型发送给管理的网络设备,实现对网络设备中的ECN推理模型的动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

另外,网络设备可以向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,分析设备将ECN推理模型发送给网络设备,然后网络设备采用该ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,分析设备还可以将包含ECN推理模型的ECN信息发送给云端设备,供云端设备更新对应业务类型的ECN推理模型,提高云端设备中存储的ECN推理模型的可靠性。通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

本申请实施例提供的拥塞控制方法的步骤先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。

图11是本申请实施例提供的一种拥塞控制装置的结构示意图。该装置可以用于如图1或图2所示的拥塞控制系统中的网络设备。如图11所示,该装置110包括:

处理模块1101,用于向ECN推理模型输入网络设备在第一时间段内的第一网络状态信息,以获取ECN推理模型根据第一网络状态信息输出的推理结果,该推理结果包括原始ECN配置参数以及原始ECN配置参数的置信度。

发送模块1102,用于向管理网络设备的分析设备发送ECN参数样本,该ECN参数样本包括第一网络状态信息以及第一网络状态信息对应的目标ECN配置参数,该目标ECN配置参数基于推理结果确定。

接收模块1103,用于接收分析设备发送的更新后的ECN推理模型,该更新后的ECN推理模型基于ECN参数样本训练得到。

综上所述,在本申请实施例提供的拥塞控制装置中,网络设备通过发送模块向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,分析设备将更新后的ECN推理模型发送给网络设备,然后网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,处理模块1101,还用于:在第二时间段内采用目标ECN配置参数进行拥塞控制,该第二时间段在时序上位于第一时间段之后。

可选地,处理模块1101,还用于:当原始ECN配置参数的置信度低于置信度阈值时,根据网络设备的传输性能的变化对网络设备在第一时间段内所使用的ECN配置参数进行调整,并将调整后的ECN配置参数作为目标ECN配置参数。

可选地,处理模块1101,还用于:当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升时,上调网络设备在第一时间段内所使用的配置参数中的ECN水线,和/或,下调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率;当网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能下降时,下调网络设备在第一时间段内所使用的ECN配置参数中的ECN水线,和/或,上调网络设备在第一时间段内所使用的ECN配置参数中的ECN标记概率;其中,第三时间段在时序上位于第一时间段之前,ECN标记概率指出端口队列的队列深度达到ECN上水线时,对待加入出端口队列的数据包进行ECN标记的概率。

可选地,处理模块1101,还用于:当网络设备在第一时间段内的带宽利用率高于网络设备在第三时间段内的带宽利用率,网络设备在第一时间段内的队列深度小于网络设备在第三时间段内的队列深度,和/或,网络设备在第一时间段内的ECN包占比小于网络设备在第三时间段内的ECN包占比时,确定网络设备在第一时间段内的传输性能相较于网络设备在第三时间段内的传输性能提升。

可选地,处理模块1101,还用于:当原始ECN配置参数的置信度高于或等于置信度阈值时,将原始ECN配置参数作为目标ECN配置参数。

可选地,发送模块1102,还用于:当原始ECN配置参数的置信度低于置信度阈值时,向分析设备发送目标指示信息,该目标指示信息中包括网络设备的标识,该目标指示信息用于指示网络设备中的ECN推理模型不适配于网络设备。

可选地,目标指示信息中包括原始ECN配置参数的置信度。

可选地,处理模块1101,还用于:采用更新后的ECN推理模型更新网络设备中的ECN推理模型。

可选地,第一网络状态信息包括网络设备在第一时间段内的队列信息、吞吐信息和拥塞信息中的一个或多个。

综上所述,在本申请实施例提供的拥塞控制装置中,网络设备通过发送模块向分析设备发送ECN参数样本,供分析设备采用该ECN参数样本训练得到ECN推理模型,分析设备将更新后的ECN推理模型发送给网络设备,然后网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,网络设备可以通过发送模块向分析设备发送目标指示信息以通知分析设备该网络设备中的ECN推理模型不适配于该网络设备,使得分析设备可以及时有效地更新网络设备中的ECN推理模型,提高网络设备中的ECN推理模型的更新灵活性。

图12是本申请实施例提供的另一种拥塞控制装置的结构示意图。该装置可以用于如图1或图2所示的拥塞控制系统中的分析设备。如图12所示,该装置120包括:

第一接收模块1201,用于接收分析设备管理的网络设备发送的ECN参数样本,该ECN参数样本中包括网络设备的网络状态信息以及网络状态信息对应的目标ECN配置参数。

处理模块1202,用于采用ECN参数样本,训练得到第一ECN推理模型。

第一发送模块1203,用于向网络设备发送第一ECN推理模型。

综上所述,在本申请实施例提供的拥塞控制装置中,分析设备通过第一接收模块接收网络设备发送ECN参数样本,通过处理模块采用该ECN参数样本训练得到ECN推理模型,然后通过第一发送模块将更新后的ECN推理模型发送给网络设备,使得网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。

可选地,处理模块1202,用于:当ECN推理模型更新条件满足时,采用ECN参数样本,训练得到第一ECN推理模型;其中,ECN推理模型更新条件包括:向分析设备发送目标指示信息的网络设备的数量达到设备数量阈值,分析设备在第一时长内接收到目标指示信息的累计次数达到第一次数阈值,和/或,分析设备在第二时长内接收到分析设备管理的任一网络设备发送的目标指示信息的次数达到第二次数阈值,该目标指示信息中包括发送目标指示信息的网络设备的标识,该目标指示信息用于指示发送目标指示信息的网络设备中的ECN推理模型不适配于网络设备。

可选地,第一发送模块1203,用于:当分析设备接收到网络设备发送的目标指示信息,向网络设备发送第一ECN推理模型。

可选地,如图13所示,装置120还包括:第二发送模块1204。

第二发送模块1024,可以用于向云端设备发送ECN消息,该ECN消息中包括第一ECN推理模型以及第一ECN推理模型对应的业务类型的标识。

可选地,ECN消息中还包括网络设备管理的网络的组网信息。

可选地,继续参见图13,装置120还包括:第二接收模块1205。

第二发送模块1204,可以用于向云端设备发送ECN推理模型获取请求,该ECN推理模型获取请求中包括分析设备管理的网络所承载的目标业务类型;第二接收模块1205,可以用于接收云端设备发送的目标业务类型对应的第二ECN推理模型;第一发送模块1203,还可以用于向分析设备管理的网络设备发送第二ECN推理模型。

综上所述,在本申请实施例提供的拥塞控制装置中,分析设备通过第一接收模块接收网络设备发送ECN参数样本,通过处理模块采用该ECN参数样本训练得到ECN推理模型,然后通过第一发送模块将更新后的ECN推理模型发送给网络设备,使得网络设备可以采用该更新后的ECN推理模型确定新的ECN配置参数,也即是,分析设备可以动态配置网络设备中的ECN推理模型,进而实现网络设备中的ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,网络设备可以向分析设备发送目标指示信息以通知分析设备该网络设备中的ECN推理模型不适配于该网络设备,使得分析设备可以及时有效地更新网络设备中的ECN推理模型,提高网络设备中的ECN推理模型的更新灵活性。分析设备还可以仅向发送过目标指示信息的网络设备发送目标ECN推理模型,节约传输资源以及ECN推理模型输出的ECN配置参数的置信度高于或等于置信度阈值的网络设备的处理资源。

图14是本申请实施例提供的再一种拥塞控制装置的结构示意图。该装置可以用于如图2所示的拥塞控制系统中的云端设备。如图14所示,该装置140包括:

接收模块1401,用于接收云端设备管理的分析设备发送的ECN推理模型获取请求,该ECN推理模型获取请求中包括分析设备管理的网络所承载的目标业务类型。

处理模块1402,用于基于业务类型与ECN推理模型的对应关系,确定目标业务类型对应的第二ECN推理模型,该对应关系中包括一一对应的多个业务类型和多个ECN推理模型。

发送模块1403,用于向分析设备发送第二ECN推理模型。

综上所述,在本申请实施例提供的拥塞控制装置中,云端设备可以通过接收模块接收管理的分析设备发送的ECN信息,并通过处理模块确定一个或多个业务类型对应的ECN推理模型。分析设备可以从云端设备获取与该分析设备管理的网络所承载的业务类型对应的ECN推理模型,然后将该ECN推理模型发送给管理的网络设备,实现对网络设备中的ECN推理模型的动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

可选地,接收模块1401,还用于接收云端设备管理的多个分析设备发送的ECN消息,ECN消息中包括分析设备中的第一ECN推理模型以及第一ECN推理模型对应的业务类型的标识;处理模块1402,还用于根据多个分析设备发送的ECN消息,生成对应关系。

可选地,处理模块1402,还用于:根据业务类型对多个ECN消息中的第一ECN推理模型进行分类,得到一个或多个模型类,同一模型类中的第一ECN推理模型对应的业务类型相同;针对包含多个第一ECN推理模型的每个模型类,对模型类中的多个第一ECN推理模型进行模型迭代处理,得到模型类对应的一个第二ECN推理模型。

综上所述,在本申请实施例提供的拥塞控制装置中,云端设备可以通过接收模块接收管理的分析设备发送的ECN信息,并通过处理模块确定一个或多个业务类型对应的ECN推理模型。分析设备可以从云端设备获取与该分析设备管理的网络所承载的业务类型对应的ECN推理模型,然后将该ECN推理模型发送给管理的网络设备,实现对网络设备中的ECN推理模型的动态配置,进而实现ECN配置参数的动态调整,提高了网络拥塞控制的灵活性。另外,通过在云端设备中存储各个业务类型对应的ECN推理模型,可以为未来网络全新开局或组网变更时,提供一个良好的初始ECN推理模型。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本申请实施例提供了一种网络设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如图7或图9所示的拥塞控制方法中网络设备执行的步骤。

本申请实施例提供了一种分析设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如图7或图9所示的拥塞控制方法中分析设备执行的步骤。

本申请实施例提供了一种云端设备,包括:处理器和存储器;

所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;

所述处理器,用于调用所述计算机程序,实现如图9所示的拥塞控制方法中云端设备执行的步骤。

示例地,图15是本申请实施例提供的一种拥塞控制装置的框图。该拥塞控制装置可以是网络设备、分析设备或云端设备。如图15所示,拥塞控制装置150包括:处理器1501和存储器1502。

存储器1502,用于存储计算机程序,所述计算机程序包括程序指令;

处理器1501,用于调用所述计算机程序,实现如图7或图9所示的拥塞控制方法中网络设备执行的步骤,或者实现如图7或图9所示的拥塞控制方法中分析设备执行的步骤,或者实现如图9所示的拥塞控制方法中云端设备执行的步骤。

可选地,该拥塞控制装置150还包括通信总线1503和通信接口1504。

其中,处理器1501包括一个或者一个以上处理核心,处理器1501通过运行计算机程序,执行各种功能应用以及数据处理。

存储器1502可用于存储计算机程序。可选地,存储器可存储操作系统和至少一个功能所需的应用程序单元。操作系统可以是实时操作系统(Real Time eXecutive,RTX)、LINUX、UNIX、WINDOWS或OS X之类的操作系统。

通信接口1504可以为多个,通信接口1504用于与其它设备进行通信。例如在本申请实施例中,当该拥塞控制装置150为网络设备时,通信接口1504可以用于向分析设备发送ECN参数样本。当该拥塞控制装置150为分析设备时,通信接口1504可以用于向网络设备和/或云端设备发送ECN推理模型。当该拥塞控制装置150为云端设备时,通信接口1504可以用于向分析设备发送ECN推理模型。

存储器1502与通信接口1504分别通过通信总线1503与处理器1501连接。

本申请实施例还提供了一种拥塞控制系统,包括:网络设备和分析设备,所述网络设备包括如图11或图15所示的拥塞控制装置,所述分析设备包括如图12、图13或图15所示的拥塞控制装置。示例地,该拥塞控制系统可以如图1所示。

可选地,该系统还包括:云端设备,所述云端设备包括如图14或图15所示的拥塞控制装置。示例地,该拥塞控制系统可以如图2所示。

本申请实施例还提供了一种计算机存储介质,所述计算机存储介质上存储有指令,当所述指令被计算机设备的处理器执行时,实现如上述方法实施例中所述的拥塞控制方法中网络设备、分析设备或云端设备执行的步骤。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本申请实施例中,术语“第一”、“第二”和“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的构思和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种混合动力汽车的性能检测方法、装置、设备及介质
  • 基于区块链的汽车数据共享方法、装置、设备和存储介质
  • 一种液位检测装置和包含其的设备以及液位检测方法、电子设备及计算机可读存储介质
  • 基于微波的行人检测方法、装置、计算机设备及存储介质
  • 基于自动驾驶车辆的位置检测方法、装置、设备及介质
  • 基于汽车的冷媒量检测方法、装置、设备及介质
  • 基于冷媒传感器的冷媒泄漏检测方法、装置、设备及介质
技术分类

06120116570867