掌桥专利:专业的专利平台
掌桥专利
首页

一种支持多GPU卡的服务器

文献发布时间:2024-04-18 19:58:53


一种支持多GPU卡的服务器

技术领域

本发明属于电子设备技术领域,特别涉及一种支持多GPU卡的服务器。

背景技术

目前,GPU服务器在视频编解码、深度学习、科学计算等多种场景有着快速、稳定、弹性的计算,其超强的计算功能可应用于海量数据处理方面的运算,如搜索、大数据推荐、智能输入法等,其单台计算能力远大于通用服务器。

现主流服务器厂商GPU服务器一般为4UGPU,其中,U表示服务器外部尺寸的单位,是unit的缩略语,通常服务器的厚度以4.445cm为基本单位,支持2+2冗余电源配置,CPU或GPU功耗或型号限制,或采用液冷等复杂技术解决功耗高等问题;尤其是,主板或CPU/DIMM维护不便,或维护结构复杂,成本较高等问题。

发明内容

鉴于现有技术中存在的上述问题,本发明提供了一种易于操作、具有良好散热性能及无需停机和额外拆卸便可进行维护的支持多GPU卡的服务器。

为实现上述目的,本发明实施例采用的技术方案是:

提供一种支持多GPU卡的服务器,包括:机箱,具有设于前端的第一容置空间和后端的第二容置空间;2.5硬盘模组,安装于所述第一容置空间的上层;3.5硬盘模组,安装于所述第一容置空间的中间层;GPU模组,安装于所述第二容置空间的上层;第一PSU模组,安装于所述第二容置空间的中间层;第二PSU模组和IO板,并列安装于所述第二容置空间的下层;两组抽拉结构,位于所述第二容置空间,并相对设置于所述机箱的两侧;每组所述抽拉结构包括两根外滑轨和两根内滑轨;两根所述内滑轨分别固设于所述GPU模组和所述第一PSU模组,所述外滑轨对应固设于所述机箱;所述内滑轨与所述外滑轨形成滑动连接,以使所述GPU模组和所述第一PSU模组沿滑道滑动。

在本发明的一些实施例中,所述支持多GPU卡的服务器还包括:风扇模组,安装于所述第一容置空间,并在靠近所述第二容置空间的一侧与所述GPU模组相对设置;2.5硬盘背板,安装于所述第一容置空间的上层,并在靠近所述第二容置空间的一侧与所述2.5硬盘模组形成电连接;3.5硬盘背板,安装于所述第一容置空间的中间层,并在靠近所述第二容置空间的一侧与所述3.5硬盘模组形成电连接;所述2.5硬盘模组包括24块2.5硬盘;所述3.5硬盘模组包括12块3.5硬盘。

在本发明的一些实施例中,所述支持多GPU卡的服务器还包括主板,固设于所述机箱的底部;所述第二PSU模组和所述IO板固设于所述主板上。

在本发明的一些实施例中,所述GPU模组包括多块GPU卡和容置笼;所述GPU卡置于所述容置笼内;所述容置笼搭载设有多个PCIe插槽的PCBA电路板;所述PCBA电路板设于所述容置笼的底部;所述GPU卡插接所述PCIe插槽,以与所述PCBA电路板电连接,并通过线缆电连接所述主板及所述第一PSU模组,以实现数据通信和供电。

在本发明的一些实施例中,所述GPU模组包括10块双宽GPU卡或6块三宽GPU卡;所述PCBA电路板设置为对应于三宽GPU卡的直立式印刷电路板或对应于双宽GPU卡的开关印刷电路板。

在本发明的一些实施例中,所述第一PSU模组包括:电源模块、电源板和容置框;所述电源板设于所述容置框的底部,所述电源模块设于所述电源板上;所述电源模块通过线缆连接所述主板、所述GPU模组、所述2.5硬盘模组和所述3.5硬盘模组。

在本发明的一些实施例中,所述内滑轨固设于所述容置笼的外周面或所述容置框的边框上。

在本发明的一些实施例中,所述支持多GPU卡的服务器还包括导风罩,其位于所述第二容置空间的下层,并位于所述主板上方。

在本发明的一些实施例中,在所述机箱的内壁分别设置与所述第二容置空间上层和中层对应的弹性柱塞;在所述GPU模组和所述第一PSU模组分别开设有与所述弹性柱塞对应的第一通孔和第二通孔;所述弹性柱塞穿过所述第一通孔和所述第二通孔,以将所述GPU模组和所述第一PSU模组锁固在所述第二容置空间内。

在本发明的一些实施例中,在所述机箱的内壁设有与所述第二容置空间上层和中层对应的多个第一螺纹孔;在所述GPU模组和所述第一PSU模组开设有与所述第一螺纹孔对应的第二螺纹孔;在所述GPU模组和所述第一PSU模组置于所述第二容置空间的状态下,螺钉穿过所述第一螺纹孔和所述第二螺纹孔,以使所述GPU模组和所述第一PSU模组与所述机箱形成固定连接。

与现有技术相比较,本发明的有益效果在于:

本发明实施例的支持多GPU卡的服务器,很好地解决了GPU服务器的散热问题,不需要通过外挂风扇或GPU/CPU型号限制解决系统散热问题,进而提升了GPU服务器的性能。

在维护方面,通过设置抽拉结构,以将GPU模组和第一PSU模组抽拉方式让出主板上层空间,解决主板上零部件的维护问题,为售后维修更换主板提供方便,相应地提高了维护效率。同时,本发明的支持多GPU卡的服务器还可以在开机状态下可进行维护,节省排查问题的时间和周期,在工程现场大大降低维护人员的工作量。另外,在GPU模组和第一PSU模组进行维护的同时,通过预留线缆长度可使得在抽拉过程中不需要额外拆卸与主板或其他模块相连接的线缆。

附图说明

在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。

图1为本发明实施例的支持多GPU卡的服务器的立体图;

图2为本发明实施例的支持多GPU卡的服务器的爆炸图;

图3为本发明实施例的支持多GPU卡的服务器的结构示意图;

图4为本发明实施例的支持多GPU卡的服务器的前端视图;

图5为本发明实施例的支持多GPU卡的服务器的后端视图;

图6为本发明实施例的支持多GPU卡的服务器的三宽GPU模组结构示意图;

图7为本发明实施例的支持多GPU卡的服务器的双宽GPU模组结构示意图;

图8为本发明实施例的支持多GPU卡的服务器的PSU模组结构示意图;

图9为本发明实施例的支持多GPU卡的服务器的弹性柱塞与GPU模组解锁状态下的结构示意图;

图10为图9的局部放大图;

图11为本发明实施例的支持多GPU卡的服务器的弹性柱塞与第一PSU模组解锁状态下的结构示意图;

图12为图11的局部放大图;

图13为本发明实施例的支持多GPU卡的服务器的局部结构示意图。

附图标记说明

1-第一螺纹孔;2-第二螺纹孔;

100-机箱;101-3.5硬盘模组;102-3.5硬盘背板;103-2.5硬盘模组;

104-2.5硬盘背板;105-风扇模组;106-导风罩;107-GPU模组;

108-第一PSU模组;109-第二PSU模组;110-IO板;111-主板;

112-外滑轨;113-内滑轨;

201-三宽GPU卡;202-直立式印刷电路板;203-容置笼;

204-双宽GPU卡;205-开关印刷电路板;

301-电源模块;302-电源板;303-容置框;

401-弹性柱塞;402-第一通孔;403-第二通孔。

具体实施方式

下面,结合附图对本发明的具体实施例进行详细的描述,但不作为本发明的限定。为使本领域技术人员更好的理解本公开的技术方案,下面结合附图和具体实施方式对本公开作详细说明。下面结合附图和具体实施例对本公开的实施例作进一步详细描述,但不作为对本公开的限定。

本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

由于GPU服务器具有超强的计算能力,被广泛应用于与运算海量数据相关的技术领域,随着市场需求的快速增加,对于服务器的散热效率及维护能力也提出了更高的要求,为此,本发明提供如下解决方案。

本发明实施例提供一种支持多GPU卡的服务器,结合图1至图3、图6至图9、图11和图13,所述支持多GPU卡的服务器包括:机箱100,具有设于前端的第一容置空间和后端的第二容置空间;2.5硬盘模组103,安装于所述第一容置空间的上层;3.5硬盘模组101,安装于所述第一容置空间的中间层;GPU模组107,安装于所述第二容置空间的上层;第一PSU模组108,安装于所述第二容置空间的中间层;第二PSU模组109和IO板110,并列安装于所述第二容置空间的下层;两组抽拉结构,位于所述第二容置空间,并相对设置于机箱100的两侧;每组所述抽拉结构包括两根外滑轨112和两根内滑轨113;两根内滑轨113分别固设于GPU模组107和第一PSU模组108,外滑轨112对应固设于机箱100;内滑轨113与外滑轨112形成滑动连接,以使GPU模组107和第一PSU模组108沿滑道滑动。在本实施例中,通过合理布置硬盘模组、GPU模组107及PSU模组,有效提高了散热效率,进而提升了GPU服务器的性能;进一步地,通过设置抽拉结构,可方便拉出GPU模组107和第一PSU模组108,让出主板111上层空间,并在开机状态下进行维护,为更换主板111上的零部件及进行其他相关维护工作提供了便利条件,还有效提高了工作效率。可见,本发明所述支持多GPU卡的服务器在兼顾存储和运算等功能的前提下,还能解决维护过程中存在拆卸复杂,或可能导致停机等技术问题。另外,在本实施例中,可将GPU模组107和第一PSU模组108的滑动行程设置在一定区间范围内,这样可以控制二者的稳定性,当然,也可以将GPU模组107和第一PSU模组108整体拉出,具体可根据实际应用场景进行灵活调整。

在本发明的实施例中,数字2.5和3.5用于表示硬盘的尺寸大小,例如,2.5硬盘模组103表示为由大小为2.5寸硬盘构成的硬盘模组,下同。

进一步地,结合图1至图4,所述支持多GPU卡的服务器还包括:风扇模组105,安装于所述第一容置空间,并在靠近所述第二容置空间的一侧与GPU模组107相对设置;2.5硬盘背板104,安装于所述第一容置空间的上层,并在靠近所述第二容置空间的一侧与2.5硬盘模组103形成电连接;3.5硬盘背板102,安装于所述第一容置空间的中间层,并在靠近所述第二容置空间的一侧与3.5硬盘模组101形成电连接;2.5硬盘模组103包括24块2.5硬盘;3.5硬盘模组101包括12块3.5硬盘。在本实施例中,为提高效率,风扇模组105可以被分为4组,每组包括3个风扇;进一步地,为适应不同的需求,可以对风扇模组105进行减配,例如,当有对于低GPU功耗需求的系统时,通过减配顶部4个风扇,即,每组的顶部均减去一个风扇,这样,风扇模组105减配为8个风扇,相应地支持了低GPU功耗需求,进而也降低了成本,使服务器能够满足不同的个性化需求。

进一步地,参见图2,所述支持多GPU卡的服务器还包括主板111,固设于机箱100的底部;第二PSU模组109和IO板110固设于主板111上。通过IO板110可以与外部设备连接,包括有线和无线连接,以便进行数据交换。由于主板111的上方是GPU模组107(107)和第一PSU模组108(108),二者遮挡了主板111上的CPU、双列直插式内存模块(DIMM)及连接器,导致无法进行在线维护,或者在需要将GPU进行拆卸后才能进行修护或更换主板111,而通过抽拉结构能有效解决遮挡问题,且不影响维修效率。

进一步地,结合图2、图3、图6和图7,GPU模组107包括多块GPU卡和容置笼203;所述GPU卡置于容置笼203内;容置笼203搭载设有多个PCIe插槽的PCBA电路板;所述PCBA电路板设于容置笼203的底部;所述GPU卡插接所述PCIe(Peripheral Component InterconnectExpress 高速串行计算机扩展总线)插槽,以与所述PCBA电路板电连接,并通过线缆电连接主板111及第一PSU模组108,以实现数据通信和供电。

进一步地,参见图6和图7,GPU模组107包括10块双宽GPU卡204或6块三宽GPU卡201;所述PCBA电路板设置为对应于三宽GPU卡201的直立式印刷电路板202(Riser PrintedCircuit Board Assembly -PCBA)或对应于双宽GPU卡204的开关印刷电路板205(SwitchBoard PCBA)。具体地,在本实施例中,三宽GPU卡201电连接直立式印刷电路板202,双宽GPU卡204电连接开关印刷电路板205,并且,三宽GPU卡201和双宽GPU卡204通过所述PCIe插槽和电子电路与外部设备电连接。在本发明实施例中,双宽和三宽分别用于表示GPU卡具有两个和三个单位(1U)高度。另外,结合上面的实施例,可以实现容置笼203的共用,即,在不改变容置笼203结构前提下,仅需更换所述PCBA电路板,就能够匹配不同规格的GPU卡,进而在更换或调整GPU卡的过程中,能够有效降低成本。

进一步地,结合图2、图5和图8,第一PSU模组108包括:电源模块301、电源板302和容置框303;电源板302设于容置框303的底部,电源模块301设于电源板302上;电源模块301通过线缆连接主板111、GPU模组107、2.5硬盘模组103和3.5硬盘模组101。在本实施例中,第一PSU模组108与第二PSU模组109具有相同的结构,由此支持支持3+3电源模块301配置,当然,还可以根据情况进行调整,在实际应用中,可以使用3个电源模块301支撑服务器正常工作,即使在3个电源发生故障的情况下,由于还有3个冗余电源,因此 ,服务器或系统依然能够保持正常工作。进一步地,第一PSU模组108的电源模块301通过电源板302可以分别连接主板111、GPU以及位于前端的第一容置空间内的2.5硬盘模组103和3.5硬盘模组101,进而实施供电。

需要说明的是,本发明实施例中,主板111连接GPU模组107和第一PSU模组108108的线缆的长度可根据实际应用场景进行预留,以保证主板111、GPU模组107、第一PSU模组108、电源板302的线缆无需拆卸,就可以直接进行主板111上器件维护或更换主板111。

进一步地,结合图2、图3、图6至图9、图11和图13,内滑轨113固设于容置笼203的外周面或容置框303的边框上。

进一步地,参见图2,所述支持多GPU卡的服务器还包括导风罩106,其位于所述第二容置空间的下层,并位于主板111上方。通过该设置方式,将主板111与上方的GPU模组107和第一PSU模组108分割开,同时,可以根据具体应用的空间结构,通过导风罩106在风扇模组105与主板111之间形成通风管道,既可快速为主板111上器件提供循环空气,集中为空间提供周围空间的凉风,保障器件安全运行,还能阻止主板111产生的热量进入上方GPU模组107和第一PSU模组108所在空间,进而相对避免降低风扇模组105的散热功效。

进一步地,结合图10和图12,在机箱100的内壁分别设置与所述第二容置空间上层和中层对应的弹性柱塞401;在GPU模组107和第一PSU模组108分别开设有与弹性柱塞401对应的第一通孔402和第二通孔403;弹性柱塞401穿过第一通孔402和第二通孔403,以将GPU模组107和第一PSU模组108锁固在所述第二容置空间内。在本实施例中,将弹性柱塞401端部的表面设置为弧面或倾斜面,这样在抽拉或推动GPU模组107和第一PSU模组108的过程中,方便通过挤压弹性柱塞401端部使其收缩,并在弹性柱塞401与第一通孔402和第二通孔403的位置相对时,由于端部所受到的挤压力获得释放,进而在弹力作用下重新插入第一通孔402和第二通孔403,使GPU模组107和第一PSU模组108与机箱100保持位置相对固定,阻止GPU模组107和第一PSU模组108滑出机箱100。

进一步地,考虑到在实际应用过程中存在经常挪动服务器的情况,且由于GPU卡和PSU相对较重,尤其是本发明实施例中使用了较多的GPU卡和PSU,一旦所述支持多GPU卡的服务器发生倾斜,GPU模组107和第一PSU模组108随时可能滑出机箱100,导致模组损坏或伤及使用者,为此,参见图13,在机箱100的内壁设有与所述第二容置空间上层和中层对应的多个第一螺纹孔1;在GPU模组107和第一PSU模组108开设有与第一螺纹孔1对应的第二螺纹孔2;在GPU模组107和第一PSU模组108置于所述第二容置空间的状态下,螺钉穿过第一螺纹孔1和第二螺纹孔2,以使GPU模组107和第一PSU模组108与机箱100形成固定连接。

此外,尽管在此描述了说明性的实施例,但是范围包括具有基于本公开的等效要素、修改、省略、组合(例如,跨各种实施例的方案的组合)、调整或变更的任何和所有实施例。权利要求中的要素将基于权利要求中使用的语言进行宽泛地解释,而不限于本说明书中或在本申请的存续期间描述的示例。此外,所公开的方法的步骤可以以任何方式进行修改,包括通过重新排序步骤或插入或删除步骤。因此,意图仅仅将描述视为例子,真正的范围由以下权利要求及其全部等同范围表示。

以上描述旨在是说明性的而非限制性的。例如,上述示例(或其一个或多个方面)可以彼此组合使用。在阅读以上描述之后,例如本领域普通技术人员可以使用其他实施例。而且,在以上详细描述中,可以将各种特征组合在一起以简化本公开。这不应被解释为意图未请求保护的公开特征对于任何权利要求是必不可少的。因此,以下权利要求作为示例或实施例结合到具体实施方式中,其中每个权利要求自身作为单独的实施例,并且可以预期这些实施例可以以各种组合或置换彼此组合。应参考所附权利要求以及这些权利要求所赋予的等同物的全部范围来确定本发明的范围。

技术分类

06120116514265