掌桥专利:专业的专利平台
掌桥专利
首页

一种抽屉式高密度FPGA云平台机箱

文献发布时间:2023-06-19 10:14:56


一种抽屉式高密度FPGA云平台机箱

技术领域

本发明涉及计算机体系结构以及FPGA(现场可编程门阵列)异构加速领域,特别涉及一种基于可编程门阵列的云平台服务器。

背景技术

近年来FPGA因其高能效、并行计算和可多次编程等优势,逐渐成为计算机各领域考虑的应用方案之一,尤其在媒体压缩、加解密、AI、大数据处理等领域,FPGA方案较传统CPU和GPU,往往可达到几倍甚至几十倍的能效提升。由于这样的趋势,FPGA云平台应运而生。

FPGA机箱之于FPGA云平台,就像商用标准x86机箱之于云计算平台。作为FPGA云平台的核心硬件组件,FPGA机箱主要以标准的x86服务器为基础、辅以机箱内部x86主板上的PCIe接口形式FPGA硬件插卡。在传统的FPGA云平台机箱内部,电源、风扇、主板、业务板卡等通常放置于同一层或同一平面之上。各模块一般前后放置,并通过线缆连接。这样的组织结构使得机箱装配较为复杂。机箱内的电路板卡组件多是由一块x86服务器主板(控制板卡)以及多块FPGA节点板卡(业务板卡)组成,FPGA节点板卡通过PCIe接口的金手指插入到x86服务器控制板卡中进行数据交互。通常情况下FPGA云平台机箱据自身机箱尺寸以及主板x86服务器PCIe的接口数量,可部署的FPGA节点数量不会超过8个,所以单机箱内可提供服务的FPGA节点资源受限。在现有云计算框架和商用x86服务器机箱的双重限制下,如果进行大规模部署,则需要大量的x86服务器承载FPGA节点板卡,从而导致部署成本提高,机房物理空间利用率降低。因此,在这种传统的FPGA云平台机箱模式下,FPGA节点很难进行大规模、高密度的部署。

此外,目前的商用FPGA云平台通常是将x86服务器与FPGA节点作为一种资源提供给云端用户。用户可以在x86服务器中开发自己的应用软件,也可以在x86服务器中完成FPGA加速逻辑的开发。这种方式对于仅需要FPGA资源的用户将造成资源浪费和成本增加。

第三,现有FPGA节点板卡是通过机箱内的x86服务器主板进行管理和配置,用户必须要先访问x86服务器,然后在x86服务器中启动相关进程才可对FPGA节点板卡进行对应的管理和配置,灵活性不强。

按现有云平台机箱x86+业务板卡的架构,单机箱内无法进行高密度FPGA节点部署。

针对现有的FPGA云平台机箱,机箱安装时板卡供电及数据交互多通过线缆连接,各模块及板卡分立安装,装配难度较大,维护起来不够灵活。

用户无法直接对FPGA节点板卡进行相关配置及应用,若有需求访问FPGA节点板卡,需通过x86服务器才可实现。

在机箱内部FPGA节点板卡相互之间的数据交互无法直接进行。

发明内容

本发明针对现有云平台架构的缺点,有效降低FPGA云平台机箱部署以及维护的成本;在有限空间的机箱内,大幅度提升FPGA节点板卡的部署密度;由于没有使用x86服务器作为FPGA节点的管理板卡,在进行大规模FPGA节点部署时能够节省更多的经济成本;

使用自主研发的控制管理系统,能够更合理、高效的管理配置机箱内的FPGA节点板卡,提高云平台的资源使用效率。

针对现有技术的不足,本发明提出一种抽屉式高密度FPGA云平台机箱,其中包括:

位于该机箱底部的交换模块和位于该交换模块之上的供电模块以及位于该供电模块之上的抽屉结构;

该抽屉结构内设有控制板卡和FPGA节点板卡,该FPGA节点板卡通过预设接口插接于该控制板卡;

该供电模块的输电端电性连接该交换模块和该控制板卡的电源输入接口,该交换模块的网络交换接口与该FPGA节点板卡的网络接口相连,用于交互FPGA节点板卡之间的数据。

所述的抽屉式高密度FPGA云平台机箱,其中该抽屉结构内还包括散热风扇,该抽屉结构的尾部安装有用于装卸的把手。

所述的抽屉式高密度FPGA云平台机箱,其中该FPGA节点板卡还具有PCIe接口,该FPGA节点板卡可通过该PCIe接口连接x86服务器。

所述的抽屉式高密度FPGA云平台机箱,其中该供电模块包括用于备用供电的子供电模块。

所述的抽屉式高密度FPGA云平台机箱,其中该机箱为标准5U服务器机箱。

所述的抽屉式高密度FPGA云平台机箱,其中该机箱侧壁内侧设有滑轨轨道,通过该滑轨轨道与该抽屉结构相连。

所述的抽屉式高密度FPGA云平台机箱,其中该FPGA节点板卡供电模块通过供电铜排连接到该控制板卡的取电夹。

所述的抽屉式高密度FPGA云平台机箱,其中还包括固定该FPGA节点板卡的约束装置,该约束装置包括:位于该FPGA节点板卡一侧的开口网板,位于该FPGA节点板卡另一侧的前面板,位于该FPGA节点板卡上方的盖板。

所述的抽屉式高密度FPGA云平台机箱,其中该机箱内包括并排置于该供电模块之上的多个该抽屉结构。

所述的抽屉式高密度FPGA云平台机箱,其中该控制板卡通过该预设接口对该FPGA节点板卡进行控制和管理并对板卡的工作状态的实时监测。

由以上方案可知,本发明的优点在于:本发明将使得FPGA云平台机箱内的FPGA节点板卡可部署密度大幅度提高。降低机箱内的布线成本,简化组装复杂度,减少维护难度。通过使用自主研发的控制管理系统,为用户提供一个更全面、更便捷的开发环境。对机箱及板卡状态实时监控并减少不必要的接线,提高FPGA云平台机箱的可靠性。

附图说明

图1为本发明整体结构图;

图2为本发明单个抽屉结构的内部构造图;

图3为本发明侧视图;

图4为本发明机箱的局部图。

具体实施方式

本发明针对现有云平台架构的缺点,有效降低FPGA云平台机箱1部署以及维护的成本;使用堆叠式布局、双抽屉结构可在有限的机箱空间内,大幅度提升FPGA节点板卡8的部署密度;通过“一种云端平台计算系统及其应用方法”(申请号201810532745.0)和“一种实现FPGA服务器的方法、装置和系统”(申请号202010019013.9)中设计的控制管理系统,能够更高效的管理配置FPGA节点板卡,给用户提供一个方便快捷、价格更低廉的FPGA资源使用环境。

本发明的技术难点在于,如何在有限的云平台机箱空间内实现高密度FPGA节点的部署,如何有效对机箱内高密度FPGA节点的管理、配置及使用。具体来说本申请包括以下关键点:

关键点1:一体化的抽屉结构轨道见图4,抽屉结构2安装时先沿轨道13垂直的部分向下放,然后再沿轨道13水平部分向里推。轨道13位于机箱1内壁两侧。抽屉结构2内部有一切工作的要素(控制板卡6、高密度业务板卡、散热风扇12等),外接电源后可作为一个独立的系统自行工作;技术效果:使用方便,装配快捷;

关键点2:堆叠式结构布局,将机箱1内抽屉结构2、供电模块3、100G交换模块4上下排布,节省机箱1的深度空间;技术效果:高效利用空间,提高机箱1内节点密度;

关键点3:独立的控制管理单元,通过控制板卡6完成对FPGA节点板卡8的控制和管理并对板卡的工作状态的实时监测;技术效果:合理分配资源,监控板卡状态;

关键点4:预设接口10设计,FPGA节点板卡8的状态信息、控制信息及调试接口均可通过预设接口10交互;技术效果:简化机箱1内部连线。

为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。

如图1和图3所示,整个机箱1以堆叠式结构布局,合理利用机箱1的深度空间使其容纳两个抽屉结构2,实现更高密度的FPGA节点板卡8部署。机箱1整体从上至下分别是双抽屉结构2、供电模块3以及100G交换模块4。如图2所示,两个抽屉结构2构造相同,主要用于放置高密度的业务板卡及其散热系统,尾部安装了两个把手5用于装卸。供电模块3由三个子供电模块组成采用两用一备方式供电,两个子供电模块工作,另外一个子供电模块备用。100G交换模块4放置在机箱1的最底部,用于FPGA节点板卡8之间的数据交互。供电模块3需要给控制板卡6和FPGA节点板卡8供电它们都位于机箱1的上部,将其置于中间会离板卡更近,可缩短供电铜排14的长度。交换模块4主要是和FPGA节点板卡8的网络接口连接,用于FPGA节点板卡8之间的数据交互。

目前机箱1内部可放置两个一体化的抽屉结构2,每个抽屉结构2构成一个小系统,有独立的散热和管理方式,机箱1只需为抽屉结构2提供供电模块3即可,维护方便,更换简单,装卸容易,供电模块3通过供电铜排14连接到抽屉结构2的控制板卡6的取电夹上,具体形式如图4所示。抽屉结构2内的FPGA节点板卡8除了自身的预设接口外还带有标准的PCIex16接口,该接口用于对板卡的控制管理及数据交互,FPGA节点板卡8可通过该接口直接插在目前市面上通用的x86服务器上,兼容性强。

抽屉结构2内部集成了控制板卡6,FPGA节点板卡8通过预设接口10插在控制板卡6上。预设接口10除了为FPGA节点板卡8提供电源外,还集成了以太网通路(可支持支持千兆、万兆及更高速率网络)、监测管理通路、配置调试通路等,实现对FPGA板卡的供电、监测、配置调试等功能。控制板卡6上也可另配备PCIe交换芯片并预留出多个PCIe接口,用于FPGA节点板卡之间的PCIe数据交换。FPGA节点板卡可同时插在预设接口以及PCIe接口上,抽屉结构2内部无需手动连线,可靠性高。抽屉结构2对外仅需提供网络接口,即可实现对FPGA节点板卡8资源的管理及使用。

控制板卡6集成智能管理系统,可实时监测机箱1内的温度、功耗等信息,超过限额后会自动触发安全机制。智能管理系统可动态调度FPGA节点板卡8资源,为用户提供安全可靠的使用环境。结构上控制板卡6亦可起到支撑FPGA节点板卡8的作用。

FPGA节点板卡8安装时上下左右四个方向均有约束对其固定,左侧有机箱1上的开口网板11位置,右侧有FPGA节点板卡8的前面板7,下方的PCIe接口及预设接口10都可支撑,板卡上方有盖板9固定,结构牢固。

每个抽屉结构2都有自己独立的散热系统风扇12,散热风道通畅,控制板卡6没有高性能CPU,不用过多考虑控制板卡6的散热问题,机箱1内放置两个抽屉结构2时两级风扇12共同工作散热,提升散热性能。

本发明的关键点在于通过两个一体化的抽屉式结构大幅度提高了机箱内有限空间的FPGA节点板卡8密度,抽屉结构2自身有散热及给FPGA节点板卡8供电的方式,可脱离机箱1单独工作(需外接电源),抽屉结构2内的控制板卡6与FPGA节点板卡8通过自定义的金手指(预设接口10)互连,去除了传统机箱内部大量的供电模块3和管理网络布线,便于安装和调试。

本发明目前可在一个标准的5U服务器机箱内部署32块高性能的全高四分之三长的FPGA节点板卡8。

机箱1可以根据板卡数量的实际需求或FPGA板卡的物理尺寸,调整为单抽屉或多抽屉结构2。举例来讲,如果FPGA板卡的横向尺寸较短,则抽屉结构2也可以相应缩短。那么在一个标准服务器机箱内可以前后连续放置多个(大于或等于三个)抽屉结构2,从而更大程度提高服务器机架的物理空间利用率。

相关技术
  • 一种抽屉式高密度FPGA云平台机箱
  • 一种抽屉式高密度FPGA云平台机箱
技术分类

06120112475985