掌桥专利:专业的专利平台
掌桥专利
首页

一种基于嵌入式的智能拥塞管理网络通信设备

文献发布时间:2024-04-29 00:47:01


一种基于嵌入式的智能拥塞管理网络通信设备

技术领域

本发明属于嵌入式计算机网络通信技术领域,具体涉及一种基于嵌入式的智能拥塞管理网络通信设备。

背景技术

为了适应复杂多变的空中环境,适应现代数字化转型要求,存储网络的规模逐日递增,需要处理的数据量越来越大,RDMA(Remote Direct Memory Access,远程直接内存访问功能)成为存储网络的主流技术。

无损以太网是指对使用的以太网协议增强实现数据的高性能传输,通过流量分配实现流量控制、将队列溢出的分组损失消除来实现网络无丢包、低时延、高吞吐的目的。

PFC功能基于dot1p优先级对报文进行流量控制。将一条以太网链路划分为8个虚拟通道,将该8个通道设为8个优先级,同时有8个接口缓存空间(buffer)一一对应,每一个虚拟通道均可单独暂停和重启。

ECN是一种拥塞通知技术,ECN功能利用IP报文头的DS域来标记报文传输路径是否经历过拥塞,支持该功能的终端设备可根据报文的ECN标记状态调整报文的发送速率,从而缓解拥塞。

在RFC2481标准中,IP报文头中DS与最后两个比特被定义为ECN域,

比特位6用于标识发送端设备是否支持ECN功能;

比特位7用于标识报文在传输路径上是否经历过拥塞;

当ECN域为00时,表示该报文不支持ECN功能

当ECN域为01时,表示该报文支持ECN功能;

当ECN域为11时,表示该报文在转发路径中经历了拥塞;

现有的以太网数据流常发生拥塞。

发明内容

有鉴于此,为了实现智能拥塞管理,并且适应大数据量通信及低延迟传输要求的问题,本申请提供一种基于嵌入式的智能拥塞管理网络通信设备,能够实时智能调整ECN值,有效缓解以太网数据流的拥塞。

本发明的技术方案为:

一种基于嵌入式的智能拥塞管理网络通信设备,所述基于嵌入式的智能拥塞管理网络设备包括附带AI组件的SOC芯片、光电收发器、万兆以太网卡以及MCU,其中:

以太网流量数据通过以太网光纤通道协议经过所述光电收发器转换后发送给附带AI组件的SOC芯片,所述SOC芯片配置有DDR4、QSPI FLASH、1TB的SSD以及NVRAM;所述SOC芯片的PS端提取当前网络流量中大小流占比、队列缓存占用率以及流量吞吐状况特征,实时传输给所述AI组件进行数据分析,所述AI组件通过流量模型实时动态的调整ECN门限值,用于缓解网络拥塞;

所述基于嵌入式的智能拥塞管理网络设备使用所述MCU作为健康管理设备;当ECN与PFC同时失效,出现网络瘫痪时,所述SOC芯片的PL端将故障记录在NVRAM中并通过IIC总线将故障信息发送给所述MCU,由所述MCU通过CAN总线将故障上报到端系统,并复位所述SOC芯片;

当完成网络拥塞管理后,所述SOC芯片的PL端进一步完成以太网流量数据转发处理工作;处理结果基于光电收发器转换后发送给下级通信设备。

进一步的,所述光电收发器通过PCIE总线将以太网数据流传输给处理器,所述SOC芯片的PS端提取当前网络流中大小流占比、队列缓存占用率以及流量吞吐状况特征。

进一步的,所述SOC芯片的PL端实时读取PS端所提取的网络流特征信息并判断是否符合流量模型,若符合使用现有模型推理出ECN门限,若不符合流量模型则调用算法得出实时全局最优门限。

进一步的,所述DDR4用于缓存待处理和已经处理完毕的以太网流数据。

进一步的,所述QSPI FLASH用于存储BIT测试程序、BOOT引导程序、操作系统以及应用程序。

进一步的,所述NVRAM用于记录故障信息。

进一步的,所述SSD用于存储训练的以太网流量模型及算法模型数据。

进一步的,所述MCU用于健康监测管理,采用独立供电通道,实时监测所述基于嵌入式的智能拥塞管理网络通信设备内各芯片的电压状况,若出现问题记录故障情况并通过CAN总线上报故障,当ECN与PFC同时失效时,所述MCU上报故障状态并复位SOC芯片。

进一步的,基于嵌入式的智能拥塞管理网络通信设备配置有万兆以太网卡以支持电信号接口通信;所述SOC芯片的处理结果基于所述光电收发器转换后发送给下级通信设备,或基于万兆网卡转换与上位机通信。

进一步的,所述MCU还通过CAN总线将记录的其它硬件故障上报。

本发明具有的优点:

1.当队列中小流占比高时,动态降低ECN触发门限,保证多数小流的低时延特性要求;当队列中大流占比高时,动态提高ECN触发门限,保证多数大流的高吞吐特性要求;

2.采用AI组件利用以太网流量模型及算法模型评估有效的ECN门限,能够实时调整ECN门限值,有效缓解拥塞的同时,降低对网络传输效率的影响,智能化程度高,运算速率快;

3.该设备具有健康监测上报功能,既能检测设备中各器件的功能状态,同时也能记录以太网拥塞管理状态,并在必要时参与网络拥塞状态管理,能够大幅缩短故障定位时间。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本申请提供的一种基于嵌入式的智能拥塞管理网络通信设备的结构示意图;

图2为本申请提供的IPv4报文头的ECN域示意图;

图3为本申请提供的系统运行的流程示意图;

图4为本申请提供的工作流程图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。

在本发明的一个实施例中,提出一种基于嵌入式的智能拥塞管理网络通信设备,参阅图1-图4,所述基于嵌入式的智能拥塞管理网络设备包括附带AI组件的SOC芯片、光电收发器、万兆以太网卡以及MCU,其中:

以太网流量数据通过以太网光纤通道协议经过所述光电收发器转换后发送给附带AI组件的SOC芯片,所述SOC芯片配置有DDR4、QSPI FLASH、1TB的SSD以及NVRAM;所述SOC芯片的PS端提取当前网络流量中大小流占比、队列缓存占用率以及流量吞吐状况特征,实时传输给所述AI组件进行数据分析,所述AI组件通过流量模型实时动态的调整ECN门限值,用于缓解网络拥塞;

所述基于嵌入式的智能拥塞管理网络设备使用所述MCU作为健康管理设备;当ECN与PFC同时失效,出现网络瘫痪时,所述SOC芯片的PL端将故障记录在NVRAM中并通过IIC总线将故障信息发送给所述MCU,由所述MCU通过CAN总线将故障上报到端系统,并复位所述SOC芯片;

当完成网络拥塞管理后,所述SOC芯片的PL端进一步完成以太网流量数据转发处理工作;处理结果基于光电收发器转换后发送给下级通信设备。

在本实施例中,所述光电收发器通过PCIE总线将以太网数据流传输给处理器,所述SOC芯片的PS端提取当前网络流中大小流占比、队列缓存占用率以及流量吞吐状况特征。

在本实施例中,所述SOC芯片的PL端实时读取PS端所提取的网络流特征信息并判断是否符合流量模型,若符合使用现有模型推理出ECN门限,若不符合流量模型则调用算法得出实时全局最优门限。

在本实施例中,所述DDR4用于缓存待处理和已经处理完毕的以太网流数据。

在本实施例中,所述QSPI FLASH用于存储BIT测试程序、BOOT引导程序、操作系统以及应用程序。

在本实施例中,所述NVRAM用于记录故障信息。

在本实施例中,所述SSD用于存储训练的以太网流量模型及算法模型数据。

在本实施例中,所述MCU用于健康监测管理,采用独立供电通道,实时监测所述基于嵌入式的智能拥塞管理网络通信设备内各芯片的电压状况,若出现问题记录故障情况并通过CAN总线上报故障,当ECN与PFC同时失效时,所述MCU上报故障状态并复位SOC芯片。

在本实施例中,基于嵌入式的智能拥塞管理网络通信设备配置有万兆以太网卡以支持电信号接口通信;所述SOC芯片的处理结果基于所述光电收发器转换后发送给下级通信设备,或基于万兆网卡转换与上位机通信。

在本实施例中,所述MCU还通过CAN总线将记录的其它硬件故障上报。

包括光电收发器、附带AI组件的SOC芯片、MCU、万兆以太网卡,其中:

本实施例的种基于嵌入式的智能拥塞管理网络通信设备由光电收发器将以太网数据流完成介质转换后发送给SOC芯片的PS端,PS端提取当前网络流中大小流占比、队列缓存占用率、流量吞吐状况特征,将其数据缓存在PS端DDR中,SOC的PL端通过DMA将所提取的网络流特征信息从PS端DDR实时读取到PL端的DDR中,AI组件从PL端DDR中提取网络流特征信息进行AI运算。

AI组件首先判断网络流特征信息是否符合流量模型,若符合则使用现有模型推理给出ECN门限,若不符合流量模型则调用算法得出实时全局最优门限。

在MAC层当检测到经过设备端流量报文进入队列排队,且队列长度超出ECN低门限时,使用线性丢弃概率修改报文ECN域值并进行转发。当检测到ECN域值为11的报文时,接收端就作为拥塞通知发起设备,按照固定间隔T1将拥塞通知发给报文发起端,要求发送端降低50%报文发送速率;当在间隔T2不再收到ECN域为11的包后,发送拥塞解除通知,恢复发送端发送速率;当间隔T3仍能收到拥塞通知时,进一步降低发送端50%报文发送速率。;当间隔T4仍能收到拥塞通知时,此时认为通过发送端降低报文发送速率已无法解决当前网络拥塞,需PFC同步介入。

当网络拥塞严重需PFC介入时,SOC的PS端检测各通道上队列缓存消耗情况,当间隔T4出现消耗超出缓存门限时,接收端向上游设备发送反压信号(PFC PAUSE帧)。上游设备收到反压信号时,停止发送对应优先级的报文,并将数据存储到本地接口的缓存空间,同时发送端启动死锁检测定时器,在间隔T5检测周期内检测该优先级队列收到的PFC PAUSE帧,当该队列一直处于PFC反压触发门限状态即在检测周期内持续不断收到PFC PAUSE帧,认定处于死锁状态。当检测到某接口死锁,启动自动恢复定时器,在自动恢复期间,关闭PFC功能和PFC死锁检测功能,忽略收到的PFC PAUSE帧。当间隔T6自动恢复定时器超时后,设备打开PFC功能和PFC死锁检测功能,此时若还不断出现PFC死锁现象,SOC的PL端将故障记录在NVRAM中并通过IIC总线将故障信息发送给MCU,由MCU通过CAN总线将故障上报到端系统,并复位SOC芯片。当发送反压信号间隔T7内,队列缓存消耗恢复正常范围内,停止向上游设备发送反压信号。

当完成网络拥塞管理后,在SOC的PL端进一步完成以太网流量数据转发处理其他工作,通过光电收发器转换后发送给下级通信设备,也可以通过万兆网卡转换与上位机通信,从而实现基于嵌入式的智能拥塞管理网络通信设备。

具体的,光电收发器通过PCIE总线以太网数据流传输给SOC芯片,在AI组件中利用专用流量模型及算法实现ECN值估计。

具体的,SOC芯片通过PCIe总线与万兆网卡总线适配器连接。

具体的,SOC芯片通过IIC总线与MCU连接。

具体的,所述DDR4用于缓存待处理和已经处理完毕的以太网流数据。

具体的,所述FLASH用于存储BIT测试程序、BOOT引导程序、操作系统以及应用程序。

具体的,NVRAM用于记录故障信息。

具体的,所述SSD用于存储训练的以太网流量模型及算法模型数据。

如图1所示,本实施例提供一种基于嵌入式的智能拥塞管理网络通信设备,以太网数据流通过光电收发器将介质转换后发送给SOC芯片的PS端,PS端提取当前网络流中大小流占比、队列缓存占用率、流量吞吐状况特征,同步启动特征提取计时器,当超出计时周期,流量特征提取标志寄存器仍为1时,启用PL端参与处理特征提取,使用流水线方式与PS端并行处理。流量特征提取标志寄存器为0时认为当前流量帧特征提取已完成,将其数据缓存在PS端DDR中,SOC的PL端通过DMA将所提取的网络流特征信息从PS端DDR实时读取到PL端的DDR中,AI组件从PL端DDR中提取网络流特征信息进行AI运算。

AI组件首先判断网络流特征信息是否符合流量模型,若符合则使用现有模型推理给出ECN门限,若不符合流量模型则调用算法得出实时全局最优门限。

在MAC层当检测到经过设备端流量报文进入队列排队,且队列长度超出ECN低门限时,使用线性丢弃概率修改报文ECN域值并进行转发。

拥塞管理工作模式如表1所示,

表1拥塞管理工作模式表

S1:当检测到ECN域值为11的报文时,接收端就作为拥塞通知发起设备,按照固定间隔T1将拥塞通知发给报文发起端,要求发送端降低50%报文发送速率;

S2:当在间隔T2不再收到ECN域为11的包后,发送拥塞解除通知,恢复发送端发送速率;

S3:当间隔T3仍能收到拥塞通知时,进一步降低发送端50%报文发送速率;

S4:当间隔T4仍能收到拥塞通知时,此时认为通过发送端降低报文发送速率已无法解决当前网络拥塞,需PFC同步介入。当间隔T4网络拥塞严重需PFC介入时,SOC的PS端检测各通道上队列缓存消耗情况,出现消耗超出缓存门限时,接收端向上游设备发送反压信号(PFC PAUSE帧)。上游设备收到反压信号时,停止发送对应优先级的报文,并将数据存储到本地接口的缓存空间,同时发送端启动死锁检测定时器;

S5:在检测周期T5内检测该优先级队列收到的PFC PAUSE帧,当该队列一直处于PFC反压触发门限状态即在检测周期内持续不断收到PFC PAUSE帧,认定处于死锁状态。当检测到某接口死锁,启动自动恢复定时器,在自动恢复期间,关闭PFC功能和PFC死锁检测功能,忽略收到的PFC PAUSE帧。

S6:当间隔T6自动恢复定时器超时后,设备打开PFC功能和PFC死锁检测功能,此时若还不断出现PFC死锁现象,SOC的PL端将故障记录在NVRAM中并通过IIC总线将故障信息发送给MCU,由MCU通过CAN总线将故障上报到端系统,并复位SOC芯片。

S7:当发送反压信号间隔T7,队列缓存消耗恢复正常范围内,停止向上游设备发送反压信号。

当完成网络拥塞管理后,在SOC的PL端进一步完成以太网流量数据转发处理其他工作后将转发标志位写高,通过光电收发器转换后发送给下级通信设备,也可以通过万兆网卡转换与上位机通信,从而实现基于嵌入式的智能拥塞管理网络通信设备。

以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种基于环形网络通信的声纳智能化供电管理系统
  • 一种基于zigbee网络通信的智能物业管理系统
技术分类

06120116592014