掌桥专利:专业的专利平台
掌桥专利
首页

硬件共享系统、硬件共享方法和硬件共享设备

文献发布时间:2024-04-18 19:53:33


硬件共享系统、硬件共享方法和硬件共享设备

技术领域

本申请涉及计算机技术领域,特别涉及一种硬件共享系统、硬件共享方法和硬件共享设备。

背景技术

随着计算机技术的发展,计算任务对服务器的硬件资源的需求越来越高,例如要求服务器具有足够大的内存空间、足够多的协处理器、足够多的专用计算板卡等。为满足计算任务对硬件资源的需求,可以为每台服务器都配备足够多的硬件资源,例如为每台服务器配置足够大的内存空间。但是,服务器并非一直都会执行对硬件资源需求较高的计算任务,在服务器执行对硬件资源需求较低的任务时,硬件资源利用率较低,造成硬件资源浪费,并且,为每台服务器都配备足够多的硬件资源会提高服务器的部署成本。

发明内容

有鉴于此,本申请实施例提供了一种硬件共享系统、硬件共享方法和硬件共享设备。多个计算设备通过光纤和硬件共享设备连接,可以增加计算设备与硬件共享设备间的距离,从而增加连接到硬件共享设备的计算设备的数量,有利于提高硬件共享设备的利用率、降低部署成本。

第一方面,本申请实施例提供了一种硬件共享系统,该硬件共享系统包括硬件共享设备、与硬件共享设备分别通过第一光纤和第二光纤连接的第一计算设备和第二计算设备,并且第一计算设备与第二计算设备间的距离大于预设距离;其中第一计算设备用于通过第一光纤向硬件共享设备发送第一请求,或者通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果;第二计算设备用于通过第二光纤向硬件共享设备发送第二请求,或者通过第二光纤从硬件共享设备接收硬件共享设备响应于第二请求生成的第二结果。

在本申请实施例中,第一计算设备和/或第二计算设可以通过光纤来和硬件共享设备进行通信,从而利用硬件共享设备中的硬件资源来完成计算任务,即通过向硬件共享设备发送计算任务对应的第一请求或第二请求,由硬件共享设备中的硬件资源来响应第一请求或第二请求,并得到相应的第一结果或第二结果。由于硬件共享系统中的第一计算设备与第二计算设备间的距离可以大于预设距离,并且各计算设备通过光纤连接到硬件共享设备中,从而可以增加连接到硬件共享设备中的计算设备的数量,并且连接到硬件共享设备的计算设备的数量越多,硬件共享设备中的硬件资源空闲的可能性就越低,有利于提高硬件共享设备的利用率、降低部署成本。

可以理解,第一请求可以依硬件共享设备中的硬件资源的不同而不同,相应的第一结果也可以是根据第一请求的不同而不同。例如,硬件资源为内存模块的情况下,第一请求可以是数据读取请求或者数据写入请求,从而第一结果可以是从相应的内存模块中读取的数据或写入的结果。又例如,在硬件资源为显卡、FPGA卡、协处理器、DPU卡的情况下,第一请求可以是计算指令(例如图形处理指令、神经网络处理运算指令、数据处理指令等)及该指令相关的数据,从而第一结果可以是该计算指令的计算结果。

在上述第一方面的一种可能实现中,硬件共享系统还包括第一设备端光电转换设备,并且第一设备端光电转换设备的电连接接口连接于第一计算设备的高速接口,第一设备端光电转换设备的光接口连接于第一光纤的一端;并且第一计算设备通过以下方式通过第一光纤向硬件共享设备发送第一请求:第一计算设备利用第一设备端光电转换设备将第一请求对应的电信号转换第一光信号,并将第一光信号通过第一光纤输出;第一计算设备通过以下方式通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果:第一计算设备利用第一设备端光电转换设备从第一光纤接收第一结果对应的第二光信号,并将第二光信号转换为第一电信号。

在本申请实施例中,计算设备是通过设备端光电转换设备将高速接口的电信号转换为光信号,并通过第一光纤将光信号发送给硬件共享设备,或者通过设备端光电转换设备将接收到的光信号转换为电信号,再通过高速接口来接收电信号,来实现和硬件共享设备间的通信。

在上述第一方面的一种可能实现中,第一设备端光电转换设备设置于第一计算设备中。

在上述第一方面的一种可能实现中,硬件共享设备包括管理模块,光交叉模块、至少一个硬件端光电转换设备和至少一个硬件模块,其中,每个硬件端光电转换设备的光接口通过光纤与光交叉模块连接,每个硬件端光电转换设备和至少一个硬件模块电连接,第一光纤的另一端连接于光交叉模块;并且第一计算设备还用于在通过第一光纤向硬件共享设备发送第一请求前,向管理模块发送硬件使用请求,或者在通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果后,向管理模块发送硬件释放请求;管理模块用于响应于硬件使用请求,利用光交叉模块建立第一设备端光电转换设备与第一硬件端光电转换设备的光通信连接,并且由与第一硬件端光电转换设备电连接的至少一个硬件模块来响应第一请求生成第一结果,或者用于响应于硬件释放请求,利用光交叉模块断开第一设备端光电转换设备与第一硬件端光电转换设备的光通信连接,其中第一硬件端光电转换设备为至少一个硬件端光电转换设备中的任意一个。

在本申请实施例中,硬件共享设备是通过光交叉模块来建立第一计算设备与硬件共享设备中的任意一个硬件模块间的通信连接,从而将硬件模块中的硬件资源分配给第一计算设备来使用。

在上述第一方面的一种可能实现中,硬件共享设备还包括控制模块,第一硬件端光电转换设备通过控制模块与至少一个硬件模块电连接;并且控制模块用于在管理模块利用光交叉模块建立第一设备端光电转换设备与第一硬件端光电转换设备的光通信连接后,将与控制模块电连接的至少一个硬件模块中的至少部分资源分配给第一计算设备,并且由分配的硬件资源来响应第一请求生成第一结果。

在本申请实施例中,硬件端光电转换设备是通过控制模块与硬件模块电连接,从而控制模块(例如CXL开关)可以根据硬件使用请求所需求的硬件资源量来确定分配给第一计算设备的硬件资源量,可以提高硬件共享设备分配硬件资源的粒度,避免分配多余的硬件资源给第一计算设备,进一步提高硬件资源的利用率。

在上述第一方面的一种可能实现中,硬件共享设备还包括至少一个控制模块,并且至少一个硬件端光电转换设备中包括至少一个第二硬件端光电转换设备和至少一个第三硬件端光电转换设备,其中,每个第二硬件端光电转换设备通过一个控制模块与至少一个硬件模块电连接,每个第三硬件端光电转换设备通过高速接口与至少一个硬件模块连接;并且在硬件使用请求所请求的硬件资源小于第一预设量的情况下,第一硬件端光电转换设备为至少一个第二硬件端光电转换设备中的任意一个,在在硬件使用请求所请求的硬件资源大于第一预设量的情况下,第一硬件端光电转换设备为至少一个第三硬件端光电转换设备中的任意一个。

在本申请实施例中,硬件共享系统中的部分硬件端光电转换设备(第二硬件端光电转换设备)通过控制模块与硬件模块电连接,部分硬件端光电转换设备(第三硬件端光电转换设备)直接与硬件模块电连接(例如直接通过高速接口与硬件模块电连接),从而硬件共享设备可以在第一计算设备需求的硬件资源较小的情况下(小于第一预设量),通过控制模块分配相应的资源量给第一计算设备,而在第一计算设备需求的硬件资源较大的情况下,将直接与硬件模块电连接的至少一个硬件模块分配给第一计算设备,可以增加硬件共享设备分配硬件资源的灵活性。

在上述第一方面的一种可能实现中,硬件共享系统还包括控制模块,控制模块与至少一个硬件模块电连接,第一设备端光电转换设备的电连接接口通过控制模块电连接于第一计算设备的高速接口;并且第一计算设备在第一请求所需要的硬件资源大于第二预设量的情况下,向管理模块发送硬件使用请求,并且在第一请求所需要的硬件资源大于第二预设量的情况下,通过第一光纤向硬件共享设备发送第一请求,或者通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果;第一计算设备在第一请求所需要的硬件资源小于或等于第二预设量的情况下,向控制模块发送硬件使用请求和第一请求,或者从控制模块接收与控制模块电连接的至少一个硬件模块响应于第一请求得到的第一结果;控制模块用于响应于所硬件使用请求,将与控制模块电连接的到少一个硬件模块的至少部分硬件资源分配给第一计算设备,并且由分配给第一计算设备的硬件资源来响应第一请求得到第一结果。

在本申请实施例中,控制模块及与控制模块电连接的硬件模块可以设置于与第一计算设备较近的位置,从而第一计算设备在需求的硬件资源较少时直接使用该设置于较近的位置的硬件模块来响应第一请求得到第一结果,可以降低该场景下的传输延迟。

在上述第一方面的一种可能实现中,硬件共享设备包括至少一个控制模块,多个硬件端光电转换设备和至少一个硬件模块,其中,每个控制模块与至少一个硬件端光电转换设备电连接、与至少一个硬件模块电连接,第一光纤的另一端连接于第四硬件端光电转换设备的光接口,第四硬件端光电转换设备与第一控制模块电连接,第四硬件端光电转换设备为多个硬件端光电转换设备中的任意一个,第一控制模块为至少一个控制模块中的任意一个;并且第一计算设备还用于在通过第一光纤向硬件共享设备发送第一请求前,向第一控制模块发送硬件使用请求,或者在通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果后,向第一控制模块发送硬件释放请求;第一控制模块用于响应于硬件使用请求,将连接于第一控制模块的至少一个硬件模块中的至少部分硬件资源,分配给第一计算设备,并且由分配的硬件资源来响应第一请求生成第一结果,或者用于响应于硬件释放请求,释放分配给第一计算设备的硬件资源。

在本申请实施例中,硬件共享设备中无需设置光交叉模块,而是直接通过控制模块来将硬件模块分配给第一计算设备来使用。

在上述第一方面的一种可能实现中,上述控制模块包括CXL开关。

在上述第一方面的一种可能实现中,上述硬件模块包括以下硬件模块中的至少一种:内存模块、显卡、协处理器、DPU卡、FPGA卡。

在上述第一方面的一种可能实现中,上述高速接口包括以下接口中的至少一种CXL

在上述第一方面的一种可能实现中,上述第一计算设备和第二计算设备为服务器。

在上述第一方面的一种可能实现中,上述预设距离为大于3米的任意距离。

第二方面,本申请实施例提供了一种硬件共享方法,该方法包括:第一计算设备通过第一光纤向硬件共享设备发送第一请求,或者通过第一光纤从硬件共享设备接收硬件共享设备响应于第一请求生成的第一结果;第二计算设备通过第二光纤向硬件共享设备发送第二请求,或者通过第二光纤从硬件共享设备接收硬件共享设备响应于第二请求生成的第二结果;其中,第一计算设备和第二计算设备间的距离大于预设距离。

在本申请实施例中,第一计算设备和/或第二计算设可以通过光纤来和硬件共享设备进行通信,从而利用硬件共享设备中的硬件资源来完成计算任务,即通过向硬件共享设备发送计算任务对应的第一请求或第二请求,由硬件共享设备中的硬件资源来响应第一请求或第二请求,并得到相应的第一结果或第二结果。由于硬件共享系统中的第一计算设备与第二计算设备间的距离可以大于预设距离,并且各计算设备通过光纤连接到硬件共享设备中,从而可以增加连接到硬件共享设备中的计算设备的数量,并且连接到硬件共享设备的计算设备的数量越多,硬件共享设备中的硬件资源空闲的可能性就越低,有利于提高硬件共享设备的利用率、降低部署成本。

第三方面,本申请实施例提供了一种硬件共享设备,该硬件共享设备包括:多个硬件模块,用于响应从计算设备接收到的第一请求,生成第一请求的第一结果,其中计算设备与硬件共享设备通过光纤连接;至少一个硬件端光电转换设备,用于将第一请求对应的光信号转为第一电信号,并将第一电信号发送给至少一个硬件模块,或者,将第一结果对应的电信号转换为第一光信号并通过光纤发送给计算设备。

在本申请实施例中,计算设备通过光纤来和硬件共享设备进行通信,从而利用硬件共享设备中的硬件资源来完成计算任务,即通过向硬件共享设备发送计算任务对应的第一请求,由硬件共享设备中的硬件资源来响应第一请求,并得到相应的第一结果。由于光信号的传输距离大、衰减小,计算设备与硬件共享设备间的距离可以大于预设距离,从而可以增加连接到硬件共享设备中的计算设备的数量,并且连接到硬件共享设备的计算设备的数量越多,硬件共享设备中的硬件资源空闲的可能性就越低,有利于提高硬件共享设备的利用率、减少硬件共享设备的数量、降低部署成本。

在上述第三方面的一种可能实现中,上述硬件共享设备还包括管理模块,光交叉模块,其中,每个硬件端光电转换设备的光接口通过光纤与光交叉模块连接,每个硬件端光电转换设备和至少一个硬件模块电连接,并且计算设备利用设备端光电转换设备通过光纤与光交叉模块连接;管理模块用于从计算设备接收硬件使用请求,利用光交叉模块建立设备端光电转换设备与第一硬件端光电转换设备的光通信连接,并且由与第一硬件端光电转换设备电连接的至少一个硬件模块来响应第一请求生成第一结果,或者用于从计算设备接收硬件释放请求,并利用光交叉模块断开设备端光电转换设备与第一硬件端光电转换设备的光通信连接,其中第一硬件端光电转换设备为至少一个硬件端光电转换设备中的任意一个。

在上述第三方面的一种可能实现中,上述硬件共享设备还包括控制模块,第一硬件端光电转换设备通过控制模块与至少一个硬件模块电连接;并且控制模块用于在管理模块利用光交叉模块建立设备端光电转换设备与第一硬件端光电转换设备的光通信连接后,将与控制模块电连接的至少一个硬件模块中的至少部分资源分配给计算设备,并且由分配的硬件资源来响应第一请求生成第一结果。

在上述第三方面的一种可能实现中,上述硬件共享设备还包括至少一个控制模块,并且至少一个硬件端光电转换设备中包括至少一个第二硬件端光电转换设备和至少一个第三硬件端光电转换设备,其中,每个第二硬件端光电转换设备通过一个控制模块与至少一个硬件模块电连接,每个第三硬件端光电转换设备通过高速接口与至少一个硬件模块连接;并且在硬件使用请求所请求的硬件资源小于第一预设量的情况下,第一硬件端光电转换设备为至少一个第二硬件端光电转换设备中的任意一个,在在硬件使用请求所请求的硬件资源大于第一预设量的情况下,第一硬件端光电转换设备为至少一个第三硬件端光电转换设备中的任意一个。

在本申请实施例中,硬件共享设备中的部分硬件端光电转换设备(第二硬件端光电转换设备)通过控制模块与硬件模块电连接,部分硬件端光电转换设备(第三硬件端光电转换设备)直接与硬件模块电连接(例如直接通过高速接口与硬件模块电连接),从而硬件共享设备可以在计算设备需求的硬件资源较小的情况下(小于第一预设量),通过控制模块分配相应的资源量给计算设备,而在计算设备需求的硬件资源较大的情况下,将直接与硬件模块电连接的至少一个硬件模块分配给计算设备,可以增加硬件共享设备分配硬件资源的灵活性。

在上述第三方面的一种可能实现中,上述硬件共享设备包括至少一个控制模块,每个控制模块与至少一个硬件端光电转换设备电连接、与至少一个硬件模块电连接,计算设备通过光纤连接于第四硬件端光电转换设备的光接口,第四硬件端光电转换设备与第一控制模块电连接,第四硬件端光电转换设备为多个硬件端光电转换设备中的任意一个,第一控制模块为至少一个控制模块中的任意一个;并且由连接于第一控制模块的至少一个硬件模块中的至少部分硬件资源,来响应第一请求生成第一结果。

附图说明

图1根据本申请的一些实施例,示出了一种硬件共享系统SS-1的部署结构示意图;

图2A根据本申请的一些实施例,示出了一种硬件共享设备PS-1的应用场景示意图;

图2B根据本申请的一些实施例,示出了一种硬件共享设备PS-2的应用场景示意图;

图3A根据本申请的一些实施例,示出了一种硬件共享设备PS-3的应用场景示意图;

图3B根据本申请的一些实施例,示出了一种硬件共享系统SS-2的部署结构示意图;

图4根据本申请的一些实施例,示出了一种硬件共享设备PS-4的应用场景示意图;

图5根据本申请的一些实施例,示出了一种硬件共享设备PS-5的应用场景示意图;

图6根据本申请的一些实施例,示出了一种硬件共享设备PS-6的应用场景示意图;

图7根据本申请的一些实施例,示出了一种硬件共享设备PS-7的应用场景示意图;

图8根据本申请的一些实施例,示出了一种硬件共享设备PS-8的应用场景示意图;

图9根据本申请的一些实施例,示出了一种硬件共享设备PS-9的应用场景示意图;

图10根据本申请的一些实施例,示出了一种硬件共享设备PS-10的应用场景示意图;

图11根据本申请的一些实施例,示出了一种硬件共享设备PS-11的应用场景示意图;

图12根据本申请的一些实施例,示出了一种硬件共享设备PS-12的应用场景示意图。

具体实施方式

本申请的说明性实施例包括但不限于硬件共享系统、硬件共享方法和硬件共享设备和计算设备。

下面结合附图进行说明本申请实施例的技术方案。

为提高服务器的硬件资源利用率,降低部署成本,本申请实施例提供了一种硬件共享设备,通过将硬件模块集中在一个硬件资源池中,得到独立的硬件共享设备,并且服务器通过高速接口与硬件共享设备电连接,从而硬件共享设备可以在某一服务器执行对硬件资源需求较高的计算任务时,将硬件共享设备中的硬件模块分配给该服务器来使用,而在该服务器执行对硬件资源需求较低的计算任务时,释放该服务器对硬件资源池中的硬件模块的占用,并允许其他服务器来使用该服务器释放的硬件模块。如此,无需为每台服务器都配置足够多的硬件资源,也能满足对硬件资源需求较高的计算任务的运行,提高了硬件资源利用率,降低了用户的部署成本。

例如,图1根据本申请的一些实施例,示出了一种大规模部署的服务器系统SS-1的部署结构示意图。参考图1,服务器系统SS-1包括K个机柜(机柜CA-01、机柜CA-02、……、机柜CA-K),每个机柜中包括多个服务器,每个机柜中至少设置有一个硬件共享设备,各机柜中的各服务器与硬件共享设备电连接。如此,服务器在服务器内部的硬件模块不能满足计算任务的需求时,可以利用连接的硬件共享设备中的硬件模块来完成计算任务,从而不需要为每台服务器都配置与一个硬件共享设备等量的硬件模块,减小了部署成本,提升了硬件的利用率。

下面以机柜CA-01中的各服务器和硬件共享设备的部署方式为例进行说明。

具体地,图2A根据本申请的一些实施例,示出了一种硬件共享设备PS-1的应用场景示意图。

如图2A所示,机柜CA-01中包括N台服务器(服务器S-1、服务器S-2、……、服务器S-N)。硬件共享设备PS-1设置于机柜CA-01中,包括控制模块CM-1和硬件资源池1。其中,控制模块CM-1通过高速接口和N台服务器电连接,并且控制模块CM-1通过高速接口和硬件资源池1中的M个硬件模块(硬件模块HD1-1、硬件模块HD1-2、……、硬件模块HD1-M)电连接。控制模块CM-1可以根据各服务器的请求,建立或断开各服务器与各硬件模块的通信连接,使得各服务器可以利用硬件资源池1中的至少一个硬件模块来执行计算任务。

各服务器中的任意一台服务器,例如服务器S-2,可以在服务器S-2内部的硬件资源不能满足计算任务的需求时,向控制模块CM-1发送硬件资源使用请求,而控制模块CM-1可以在接收到硬件资源使用请求时,建立服务器S-2与至少一个硬件模块的通信连接,例如建立服务器S-2与硬件模块HD1-1的通信连接,从而服务器S-2可以利用硬件模块HD1-1来执行计算任务。服务器S-2在执行完计算任务后,向控制模块CM-1发送硬件资源释放请求,从而控制模块CM-1可以在接收到硬件资源释放请求时,断开服务器S-2与硬件模块HD1-1的通信连接,释放服务器S-2对硬件模块HD1-1的占用,使得其他服务器可以使用硬件模块HD1-1来完成计算任务。

通过硬件共享设备PS-1来部署硬件共享系统,各服务器可以根据计算任务对硬件资源的需求,动态地使用硬件资源池中的硬件模块来完成计算任务,而无需为每台服务器都配置足够多的硬件资源,提高了硬件资源池中的硬件模块的利用率,降低了用户的部署成本。

可以理解,前述硬件模块可以是各服务器能够连接的任意硬件模块,包括但不限于内存模块、协处理器(例如神经网络处理器等)、可编程阵列逻辑(Field ProgrammableGate Array,FPGA)卡、图形处理器板卡(又称显卡)、中央处理器分散处理单元(DataProcessing Unit,DPU)卡等。

可以理解,前述高速接口,包括但不限于:外围器件互联(Peripheral ComponentInterconnect express,PCIe)接口、CXL

为便于描述,以下各实施例中,以硬件模块为内存模块、高速接口为CXL

具体地,图2B根据本申请的一些实施例,示出了一种硬件共享设备PS-2的应用场景示意图。

如图2B所示,机柜CA-01中包括N台服务器(服务器S-1、服务器S-2、……、服务器S-N)和硬件共享设备PS-2。其中,硬件共享设备PS-2包括CXL开关CS-1、M个内存控制器(内存控制器MC-1、内存控制器MC-2、……、内存控制器MC-M)和多个存储介质。各服务器的处理器通过CXL

CXL开关CS-1可以通过CXL协议建立各服务器与至少一个内存控制器的高速通信连接,使得各服务器可以使用各内存控制器中的存储介质来完成计算任务。

可以理解,CXL开关可以将连接到CXL开关的内存控制器所连接的存储介质中任意大小的内存空间,分配给连接到CXL开关的至少一台服务器使用。也即是说,一台服务器可以使用一个或多个内存控制器连接的存储介质来完成计算任务,与同一个内存控制器连接的存储介质可以分配给一个或多台服务器使用。

可以理解,内存控制器用于将高速信号(例如电信号)转换为接口,从而通过高速信号连接到内存控制器的处理器可以通过该接口来使用与内存控制器连接的存储介质。在一些实施例中,内存控制器以及与内存控制器所连接的存储介质可以称为内存模块。

N台服务器中的任意一台服务器,例如服务器S-2,在服务器S-2内部的存储介质不能满足计算任务的需求时,可以向CXL开关CS-1发送内存使用请求,CXL开关CS-1在接收到内存使用请求时,将至少一个内存控制器中的至少部分存储介质分配给服务器S-2使用。从而服务器S-2可以向硬件共享设备PS-2发送数据写入请求和待写入的数据,以将待写入的数据存储在分配到的存储介质中,或者向硬件共享设备PS-2发送数据读取请求,以从分配到的存储介质中读取需要的数据。

可以理解,和内存控制器连接的存储介质可以是内存模组,例如双列直插内存模组(Dual In-Line Memory Module,DIMM)、无缓冲双列直插式内存模组(Unbuffered DualIn-Line Memory Module,UDIMM)、带寄存器的双列直插内存模组(Registered Dual In-Line Memory Module,RDIMM)、低负载双列直插内存模组(Load Reduced Dual In-LineMemory Module,LRDIMM)等,也可以是其他的存储介质,例如存储级存储器(Storage ClassMemory,SCM)、内存芯片等在此不做限定。

如前所述,图1至图2B所示的实施例中,各服务器和硬件共享设备通过电连接的方式进行连接,并利用高速电信号来和硬件共享设备中的硬件模块通信。由于高速电信号易衰减,通常在高速电信号的线缆长度在数米范围内才可以保持较好的信号完整性和较低的信号延迟,导致硬件共享设备与各服务器间进行电连接的线缆通常不超过数米(一般为3至5米),限制了硬件共享设备与服务器的部署间距。从而硬件共享设备一般设置于机柜内,而不能与机柜外的其他服务器进行有效连接,限制了连接到硬件共享设备的服务器的数量,在大规模部署的硬件共享系统中,需要多个硬件共享设备PS-2才能满足各服务器对硬件资源的需求,仍会增加部署成本。具体地例如,假设图1所示的硬件共享系统SS-1中的硬件共享设备为上述硬件共享设备PS-2,若每台服务器的性能指标为能够响应内存空间需求量为100GB的计算任务,则硬件共享设备PS-2中的存储介质至少具有100GB的存储空间,中,K个机柜需要设置K×100GB的存储空间。

为增加硬件共享设备与各服务器间的部署间距,从而进一步减小在大规模部署服务器的场景中使用的硬件模块的数量、降低服务器的部署成本,本申请实施例提供了另一种硬件共享设备,通过在各服务器侧和硬件共享设备中增加光电转换设备,并通过光纤来连接各服务器和硬件共享设备,使得服务器可以通过光信号来和硬件共享设备进行数据传输,进而利用硬件共享设备中的硬件模块来完成计算任务。例如,设备端光电转换设备(和服务器进行电连接的光电转换设备)可以将高速接口发送的电信号转换为光信号,通过光纤传送给硬件侧光电转换设备(和硬件模块电连接的光电转换设备),再由硬件侧光电转换设备将光信号转换为电信号,并将电信号发送给硬件共享设备中的硬件模块。类似的,硬件共享设备中的硬件模块可以将电信号发送硬件侧光电转换设备,由硬件侧光电转换设备将电信号转换为光信号后通过光纤发送给设备端光电转换设备,再由设备端光电转换设备将光信号转换为电信号后通过高速接口传输给服务器。

由于光信号在光纤中的衰减较低,可以在数十千米的距离进行有效传输,因此,服务器和硬件模块的部署间隔可以达到数十千米,使得在该范围内的服务器都可以使用硬件共享设备中的硬件模块,有利于减少在大规模部署服务器的场景中使用的硬件模块的数量、降低服务器的部署成本,同时,由于硬件共享设备可连接的服务器数量增加,各服务器都不使用硬件共享设备的可能性较低,可以进一步提高硬件模块的利用率。

具体地,图3A根据本申请的一些实施例,示出了一种硬件共享设备PS-3的应用场景示意图。

如图3A所示,硬件共享设备PS-3包括M个硬件端光电转换设备(光电转换设备OEH-1、光电转换设备OEH-2、……、光电转换设备OEH-M)、光交叉模块OXC-1以及M个硬件模块。

其中,光交叉模块(optical cross-connect,OXC)OXC-1包括第一光接口组(第一光接口组包括N个光接口,即光接口I-1、光接口I-2、……、光接口I-N)和第二光接口组(第二光接口组包括M个光接口,即光接口O-1、光接口O-2、……、光接口O-M),用于建立或断开第一光接口组中任意一个光接口与第二光接口组中的任意一个光接口的光通信连接。

M个硬件端光电转换设备中的各光电转换设备的一端分别与光交叉模块OXC-1的第二光接口组中的一个光接口,另一端分别与一个硬件模块(硬件模块HD-1、硬件模块HD-2、……、硬件模块HD-M中的任意一个)电连接,用于将硬件模块发送的电信号转换为光信号再发送给光交叉模块OXC-1,或将接收到光交叉模块OXC-1发送的光信号转换为电信号再发送给各硬件模块。

光交叉模块OXC-1的第一光接口组中的各光接口,分别通过光纤和N个服务器中的N个设备端光电转换设备(光电转换设备OES-1、光电转换设备OES-2、……、光电转换设备OES-N)。各服务器中的设备端光电转换设备用于将各服务器传送的电信号转换为光信号并发送给光交叉模块OXC-1,或将接收到光交叉模块OXC-1发送的光信号转换为电信号并传送给各服务器。

可以理解,在另一些实施例中,设备端光电转换设备也可以设置于服务器外部,在此不做限定。

各服务器中的任意一个服务器,例如服务器S-2,在服务器S-2内部的硬件模块不能满足计算任务的需求时,服务器S-2可以向光交叉模块OXC-1发送硬件模块使用请求,从而光交叉模块OXC-1可以建立光接口I-2与第二光接口组中空闲的光接口的光通信连接,例如建立光接口I-2和光接口O-1的光通信连接,从而建立服务器S-2与硬件模块HD-1的通信连接,使得服务器S-2可以通过硬件模块HD-1来完成计算任务。此外,在服务器S-2内部的硬件模块能够满足计算任务的需求时或计算任务完成后,服务器S-2可以向光交叉模块OXC-1发判断释放硬件模块的请求,从而光交叉模块OXC-1可以断开光接口I-2与光接口O-1的光通信连接,使得其他服务器可以通过硬件模块HD-1来完成计算任务。

可以理解,服务器S-2可以硬件模块HD-1来完成计算任务的具体内容可以根据硬件模块的类型而不同。例如,在硬件模块HD-1为内存模块的情况下,服务器S-2可以发送数据读取请求,从而服务器S-2可以从硬件模块HD-1中读取数据,或者发送数据写入请求和待写入数据,从而服务器S-2可以将数据写入到硬件模块HD-1中。又例如,在硬件模块HD-1为显卡、FPGA卡、协处理器、DPU卡的情况下,服务器S-2可以计算指令(例如图形处理指令、神经网络处理运算指令、数据处理指令等)及该指令相关的数据,从而硬件模块HD-1可以根据接收到计算指令及该指令相关的数据,得到该计算指令的计算结果,并将计算结果发送给服务器S-2。

由于各服务器是通过光纤与硬件共享设备PS-3通信,可以将各服务器设置于与硬件共享设备PS-3较远的位置,与硬件共享设备PS-3距离小于光纤稳定传输的距离范围内的服务器都可以通过硬件共享设备PS-3中的硬件模块来完成计算任务。也即是说,服务器S-1至服务器S-N可以是设置于不同的机柜中的服务器,从而可以减小在大规模部署服务器的场景中使用的硬件共享设备的数量、降低服务器的部署成本,同时,由于硬件共享设备可连接的服务器数量增加,各服务器都不使用硬件模块的可能性较低,可以进一步提高硬件模块的利用率。

例如,图3B根据本申请的一些实施例,示出了一种大规划部署的硬件共享系统SS-2的部署结构示意图。如图3B所示,硬件共享系统SS-2包括K个机柜(机柜CA-01至机柜CA-K)、至少一个硬件共享设备PS-3。其中,每个机柜中包括N个服务器,每个服务器包括至少一个设备端光电转换设备,各设备端光电转换设备通过光纤连接到光交叉模块OXC-1的第一光接口组中的光接口,光交叉模块OXC-1的第二光接口组中的各光接口通过光纤至少和一个硬件端光电转换设备连接,每个硬件端光电转换设备至少和一个硬件模块电连接。

如此,对于包括K个机柜的硬件共享系统SS-2,最理想的情况下,只需要部署一个硬件共享设备PS-3即可使得硬件共享系统SS-2中的各服务器都能利用硬件共享设备PS-3中的硬件模块。具体地,假设硬件共享系统SS-2中的各服务器的性能指标为能够响应内存空间需求量为100GB的计算任务,则理想情况下硬件共享设备PS-3中的存储介质至少具有100GB的存储空间,相较于前述硬件共享系统SS-1的K×100GB,减少了K倍,降低了部署成本,由于每个服务器都可以利用硬件共享设备PS-3中的硬件模块来完成计算任务,降低了硬件共享设备PS-3中的硬件模块闲置的可能性,提高了硬件资源的利用率。

可以理解,在一些实施例中,设备端光电转换设备也可以于机柜内部但不设备于服务器中,在此不做限定。

可以理解,上述硬件共享系统SS-2的结构只是一种示例,在另一些实施例中,可以增加或减少部分模块、拆分或组合部分模块,在此不做限定。例如每个机柜中的服务器数量可以不同也可以相同、各机柜中的服务器可以只有部分和设备端光电转换设备电连接,还可以部署多个硬件共享设备PS-3,在此不做限定。

可以理解,图3A所示的硬件共享设备PS-3的结构只是一种示例,在另一些实施例中,硬件共享设备PS-3可以包括更多或更少的模块,组合或拆分部分模块,在此不做限定。

例如,参考图4,相较于硬件共享设备PS-3,硬件共享设备PS-4将光交叉模块OCX-1的控制功能拆分给了管理模块MM-1,管理模块MM-1可以与N个服务器进行通信连接,用于接收各服务器的硬件使用请求或硬件释放请求,并根据接收到的硬件使用请求通过光交叉模块OXC-2建立空闲的硬件模块对应的光接口间的光通信连接,或根据硬件释放请求,断开各服务器占用的硬件模块对应的光接口与服务器连接的光接口的光通信连接。

可以理解,在一些实施例中,管理模块MM-1可以为服务器。

又例如,参考图5,相较于图4所示的硬件共享设备PS-4,硬件共享设备PS-5将与硬件模块连接的光电转换设备进行组合,得到硬件装置。例如,将光电转换设备OEH-1与硬件模块HD-1组合得到硬件装置HG-1、将光电转换设备OEH-2与硬件模块HD-2组合得到硬件装置HG-2、……、将光电转换设备OEH-M与硬件模块HD-M组合得到硬件装置HG-M。

再例如,参考图6,相较于图3A所示的硬件共享设备PS-3,硬件共享设备PS-6移除光交叉模块OXC-1并增加控制模块CM-3。在硬件共享设备PS-6中,设备端光电转换设备通过光纤与硬件端光电转换设备直接通过光纤连接,硬件端光电转换设备与控制模块CM-3电连接,各硬件模块分别与控制模块CM-3电连接。其中,控制模块CM-3可以根据各服务器发送的硬件使用请求或硬件释放请求,建立或断开各服务器与各硬件模块的通信连接,使得各服务器可以使用各硬件模块执行计算任务,例如在一些实施例中,控制模块CM-3可以为CXL开关。

以下以高速接口为CXL接口、硬件模块为内存模块为例,进一步介绍本申请实施的技术方案。

图7根据本申请的一些实施例,示出了一种硬件共享设备PS-7的应用场景示意图。

如图7所示,硬件共享设备PS-7包括管理模块MM-2、M个硬件端光电转换设备、光交叉模块OXC-3、M个内存控制器以及若干个存储介质。

其中,管理模块MM-2可以与各服务器以及光交叉模块OXC-3进行通信,用于接收各服务器发送的硬件使用请求或硬件释放请求,并根据接收到的硬件使用请求,控制光交叉模块OXC-3建立空闲的内存控制器对应的光接口与服务器对应的光接口的光通信连接,或者根据接收到的硬件释放请求,控制光交叉模块OXC-3断开服务器对应的光接口与该服务器占用的内存控制器对应的光接口的光通信连接。

例如,管理MM-2可以根据服务器S-2的硬件使用请求,控制光交叉模块OXC-3建立光接口I-2与光接口O-2的光通信连接,从而建立服务器S-2与内存控制器MC-2的通信连接,使得服务器S-2可以通过内存控制器MC-2,来利用与内存控制器MC-2连接的存储介质完成计算任务。

光交叉模块OXC-3包括第一光接口组(第一光接口组包括N个光接口,即光接口I-1、光接口I-2、……、光接口I-N)和第二光接口组(第二光接口组包括M个光接口,即光接口O-1、光接口O-2、……、光接口O-M),用于根据管理模块MM-2的指令,建立或断开第一光接口组中任意一个光接口与第二光接口组中的任意一个光接口的光通信连接。

M个硬件端光电转换设备中的各光电转换设备的一端通过光纤分别与光交叉模块OXC-3的第二光接口组中的一个光接口连接,另一端分别与内存控制器MC-1、内存控制器MC-2、……、内存控制器MC-M中的一个电连接,用于将接收的光信号转换为电信号或将接收到的电信号转换为光信号。

内存控制器MC-1、内存控制器MC-1、……、内存控制器MC-M分别与至少一个存储介质电连接,用于将接收到电信号数据存储到存储介质中或从存储介质中读取数据并通过电信号发送给相连的光电转换设备。

N个设备端光电转换设备中的各光电转换设备的一端通过光纤分别与光交叉模块OXC-1的第一光接口组中的一个光接口连接,另一端分别与各服务器的CXL

光交叉模块OXC-3的第一光接口组中的各光接口,分别通过光纤和N个服务器中的N个设备端光电转换设备(光电转换设备OES-1、光电转换设备OES-2、……、光电转换设备OES-N),每个设备端光电转换设备通过CXL

N个服务器中的任意一个服务器要利用硬件共享设备中的存储介质完成计算任务时,例如服务器S-2要利用硬件共享设备中的存储介质时,可以向管理模块MM-2发送硬件使用请求,管理模块MM-2在接收到硬件使用请求后,确定出空闲的内存控制器(如将光交叉模块OXC-3的第二光接口组中,未与第一光接口组中的光接口连接的光接口对应的内存控制器确定为空闲的内存控制器),例如确定出内存控制器MC-1为空闲的内存控制器,控制光交叉模块OXC-3建立光接口I-2与光接口O-1的光通信连接,从而建立起服务器S-2处理器的CXL

图7所示的实施例中,一台服务器通过一个CXL

例如,参考图8,在相较于图7所示的硬件共享设备PS-7,硬件共享设备PS-8中的光交叉模块OXC-4的第一光接口组包括2N个光接口、第一光接口组包括2K个光接口、2K个硬件端光电转换设备、K个内存控制器,每个硬件端光电转换设备的一端通过光纤与交叉模块OXC-4的第二接口组中的1个光接口连接,另一端与内存控制器电连接,并且一个内存控制器连接有2个硬件端光电转换设备、至少一个存储介质。每一个服务器包括2个设备端光电转换,每个设备端光电转换设备通过光纤与光交叉模块OXC-4的第一接口组中的1个光接口连接;

如此,在N个服务器中的任意一个,例如服务器S-2,需要利用硬件共享设备PS-8中的存储介质时,可以向管理模块MM-3发送硬件使用请求,从而管理模块MM-3可以根据服务器S-2请求的存储介质的空间大小,控制光交叉模块OXC-4建立光接口I-1和/或光接口I-2与光交叉模块OXC-4的第二光接口组中的一个或2个光接口的光通信连接,使得服务器S-2可以访问内存控制器MC-1至内存控制器MC-K中的一个或2个内存控制器连接的存储介质。

在前述各实施例中,硬件端光电转换设备直接和内存控制器电连接,管理模块只可以将与一个内存控制器连接的全部存储介质分配给某一台服务器使用,如此,在该服务器并不需要一个内存控制器对应的全部存储介质时,会造成硬件资源浪费。为此,本申请实施例还提供了一种硬件共享设备,通过在硬件端光电转换设备和内存控制器间增加至少一个CXL开关,每个CXL开关与多个硬件端光电转换设备电连接,并且每个CXL开关至少与一个内存控制器电连接,从而CXL开关可以将与CXL开关电连接的内存控制器对应的存储介质中的任意大小的存储空间,分配给与CXL开关连接的硬件端光电转换设备对应的服务器,如果,硬件共享设备可以根据服务器对内存空间大小的需求来分配存储介质中的存储空间,进一步提高硬件资源的利用率。

具体地,图9根据本申请的一些实施例,示出了一种硬件共享设备PS-9的结构示意图。如图9所示,相较于图8所示的硬件共享设备PS-8,硬件共享设备PS-9增加了Q个CXL开关(CXL开关CS-1、……、CXL开关CS-Q),并将硬件端光电转换设备分为Q组,每组至少一个硬件端光电转换设备,每组中的硬件端光电转换设备与一个CXL开关电连接(例如光电转换设备OEH-1和光电转换设备OEH-2和CXL开并CS-1电连接),并且,一个CXL开关与至少一个内存控制器电连接(例如CXL开关CS-1与M个内存控制器电连接、CXL开关CS-Q与P个内存控制器电连接),每个内存控制器连接有至少一个存储介质。其中,在一些实施例中,每一个CXL开关和与该CXL开关电连接的硬件端光电转换设备可以称为开关模块,从而硬件共享设备PS-9包括Q个开关模块。

可以理解,图9所示的硬件共享设备PS-9的连接方式只是一种示例,单个服务器的CXL

可以理解,图9所示的硬件共享设备PS-9的连接方式只是一种示例,单个CXL开关连接的光电转换设备的数量可以是一个也可是多个,单个CXL开关连接内存控制器的数量也可以是一个或多个,不同CXL开关连接的光电转换设备或内存控制器的数量可以相同也可以不同,在此不做限定。

N个服务器中的任意一个,例如服务器S-2,需要通过硬件共享设备PS-9中的存储介质来完成计算任务时,可以向管理模块MM-4发送的硬件使用请求,从而管理模块MM-4可以控制光交叉模块OXC-5建立光接口I-3和/或光接口I-4与至少一个开关模块对应的光接口的光通信连接,例如管理模块MM4可以控制光交叉模块OXC-5建立光接口I-3和光接口O-2的光通信连接。在光交叉模块OXC-5建立光接口I-3和光接口O-2的光通信连接后,服务器S-1可以向CXL开关CS-1发送需求的内存空间大小,从而CXL开关CS-1可以从内存控制器MC-1-1至内存控制器MC-1-M中的至少一个内存控制器连接的存储介质中,分配出不小于该内存空间大小的存储空间供服务器S-2使用。并且,内存控制器MC-1-1至内存控制器MC-1-M连接的存储介质中,未分配给服务器S-2的存储空间可以供给其他服务器来使用。如此,可以提高硬件共享设备进行存储介质的存储空间的分配的粒度,降低硬件资源浪费,进一步提高硬件资源的利用率。

图9所示的硬件共享设备PS-9中,所有的内存控制器都连接到了CXL开关中,也即是说硬件共享设备PS-9对于每一个内存控制器连接的存储介质的存储空间都可以进行任意分配。但在一些场景中,服务器在部分计算任务时才会需求较小的内存空间,而在另一部分计算任务则需要较大的内存空间,为了使得硬件共享设备能够更灵活地分配内存空间,本申请的实施例还提供了一种硬件共享设备,将硬件共享设备PS-8和硬件共享设备PS-9进行结合,将部分内存控制器与CXL开关电连接,从而使得硬件共享设备可以对该部分内存控制器连接的存储介质的空间进行任意大小的分配,而对于另一部分内存控制器,则直接与硬件端光电转换设备电连接,使得该另一部分内存控制器连接的存储介质,只能以存储控制器为单位进行分配。如此,硬件共享设备可以根据服务器对内存空间的需求,将一个内存控制器连接的存储介质中的部分的存储空间或全部存储空间分配给某一服务器,提高了硬件共享设备对存储介质的空间进行分配的灵活性。

具体地,图10根据本申请的一些实施例,示出了一种硬件共享设备PS-10的结构示意图。如图10所示,相较于硬件共享设备PS-9,硬件共享设备PS-10增加了2P-2Q个硬件端光电转换设备(光电转换设备OEH-2Q+1、光电转换设备OEH-2Q+2、……、光电转换设备OEH-2P)、P-Q个内存控制器(内存控制器MC-Q+1、内存控制器MC-Q+2、……、内存控制器MC-P),并且光交叉模块OXC-6较光交叉模块OXC-5,在第二光接口组增加了2P-2Q个光接口(光接口O-2Q+1、光接口O-2Q+2、……、光接口O-2P)。其中,增加的2P-2Q个硬件端光电转换设备分别与光接口O-2Q+1、光接口O-2Q+2、……、光接口O-2P通过光纤连接,并且每两个硬件端光电转换设备与新增的P-Q个内存控制器中的一个电连接。

可以理解,图10所示的硬件共享设备PS-10的连接方式只是一种示例,单个服务器的CXL

可以理解,图10所示的硬件共享设备PS-10的连接方式只是一种示例,单个CXL开关连接的光电转换设备的数量可以是一个也可是多个,单个CXL开关连接内存控制器的数量也可以是一个或多个,不同CXL开关连接的光电转换设备或内存控制器的数量可以相同也可以不同,在此不做限定。

如此,N个服务器中的任意一个服务器,例如服务器S-2,需要较大的内存空间来执行计算任务时,可以向管理模块MM-5发送需要内存空间较大的硬件使用请求,从而管理模块MM-5可以控制光交叉模块OXC-6建立光接口I-3和/或光接口I-4,与光接口O-2Q+1至光接口O-2P中的一个或两个间的光通信连接,从而服务器S-2可以利用内存控制器MC-Q+1至内存控制器MC-P中的一个或者2个来完成计算任务。而服务器S-2在需要较小的内存空间来执行计算任务时,可以向管理模块MM-5发送需要内存空间较小的硬件使用请求,从而管理模块MM-5可以控制光交叉模块OXC-6建立光接口I-3和/或光接口I-4,与光接口O-1至光接口O-2Q中的一个或两个间的光通信连接,例如建立光接口I-3与光接口O-2Q-1的光通信连接,从而服务器S-2可以向CXL开关CS-Q发送需求的内存空间的大小,进而CXL开关CS-Q可以从与内存控制器MC-Q-1至内存控制器MC-Q-P连接的存储介质中,分配不小于请求的内存空间大小的空间给服务器S-2使用。

在前述各实施例中,内存控制器和存储介质都设置在远离服务器的位置,各服务器在服务器内部的内存空间不能满足计算任务的需求时,都需要利用远离服务器的存储介质来完成任务,虽然通过光纤传输可以将存储介质部署在远离服务器的位置,但可能会增加延迟。为此,本申请实施例还提供了一种硬件共享设备,通过在靠近服务器的位置(例如服务器的机柜内部)和远离服务器的位置都设置内存控制器和存储介质,使得服务器可以在服务器内存的内存空间不满足中计算任务时,先利用靠近服务器的存储介质,在靠近服务器的存储介质不能满足计算任务时,再利用远离服务器的存储介质,如此,可以在一些对内存空间需求大于服务器内部的内存空间但小于靠近服务器的存储介质的空间的场景中,降低延迟,提升计算速度。

具体地,图11根据本申请的一些实施例,示出了一种硬件共享设备PS-11的结构示意图。

如图11所示,硬件共享设备PS-11包括N个CXL开关、管理模块MM-6、光交叉模块OXC-7。其中,

每个CXL开关可以和多个服务器的CXL

每个CXL开关可以和至少一个内存控制器电连接,每个内存控制器可以连接至少一个存储介质,例如,CXL开关CS-1可以和J个内存控制器电连接(内存控制器MC-1-1、……、内存控制器MC-1-J)、CXL开关CS-N可以和K个内存控制器(内存控制器MC-N-1、……、内存控制器MC-N-K)电连接。为便于描述,以下将直接与CXL开关电连接的内存控制器和存储介质称为近端硬件池。

每个CXL开关还可以和至少一个服务端光电转换设备电连接,例如CXL开关CS-1可以分别与光电转换设备OES-1-1、光电转换设备OES-1-2电连接,CXL开关CS-N可以分别与光电转换设备OES-N-1、光电转换设备OES-N-2电连接;

光交叉模块OXC-7的第一光接口组包括2N个光接口(光接口I-1-1、光接口I-1-2、光接口I-N-1、光接口I-N-2)、第二光接口组包括2K个光接口(光接口O-1、光接口O-2、光接口O-2K-1、光接口O-2K),用于建立或断开第一光接口组中的任意一个光接口与第二光接口组中的任意一个光接口的光通信连接。

与CXL开关电连接的服务端光电转换设备(光电转换设备OES-1-1、光电转换设备OES-1-2电连接、光电转换设备OES-2-1、光电转换设备OES-2-2、……、光电转换设备OES-N-1、光电转换设备OES-N-2电连接、电连接)通过光纤与光交叉模块OXC-7的第一光接口组中的光接口建立光通信连接,用于将CXL开关发送的电信号转换为光信号发送给光交叉模块OXC-7或将光交叉模块OXC-7发送的光信号转换为电信号发送给CXL开关。

硬件端光电转换设备(光电转换设备OEH-1至光电转换设备OEH-2K中的任意一个)中的各光电转换设备,一端通过光纤与光交叉模块OXC-7的第二光接口组中的一个光接口建立光通信连接,另一端与内存控制器(内存控制器MC-1至内存控制器MC-K中的任意一个)电连接,并且一个内存控制器至少连接有一个硬件端光电转换设备。为便于描述,以下将直接与硬件端光电转换设备电连接的内存控制器和存储介质称为远端硬件池。

管理模块MM-6可以和各服务器、光交叉模块OXC-7进行通信连接,并在某服务器需要利用远端硬件池中的存储介质时,控制光交叉模块OXC-7建立该服务器对应的光接口与远端硬件池中空闲的内存控制器对应的光接口的光通信连接。

可以理解,图11所示的硬件共享设备PS-11的连接方式只是一种示例,单个服务器的CXL

可以理解,图11所示的硬件共享设备PS-11的连接方式只是一种示例,单个CXL开关连接的光电转换设备的数量可以是一个也可是多个,单个CXL开关连接内存控制器的数量也可以是一个或多个,不同CXL开关连接的光电转换设备或内存控制器的数量可以相同也可以不同,在此不做限定。

可以理解,图11所示的硬件共享设备PS-11的连接方式只是一种示例,远端硬件池中的单个内存控制器连接的光电转换设备的数量可以是一个或多个,不同的内存控制器连接的光电转换设备的数量可以是相同或不同,在此不做限定。

在某一服务器,例如服务器S-1-1,需求的内存空间小于对应的近端硬件池(例如近端硬件池1)的存储介质的存储空间时,服务器S-1-1可以向CXL开关CS-1发送需求的内存空间大小,从而CXL开关CS-1可以从与CXL开关CS-1连接的至少一个内存控制器对应的存储介质中,分配给不小于该需求的内存空间大小的空间给服务器S-1-1使用。

而在服务器S-1-1需求的内存空间大于对应的近端硬件池(例如近端硬件池1)的存储介质的存储空间时,可以以向CXL开关CS-1和管理模块MM-6发送使用远端硬件池中的存储介质的请求,从而CXL开关CS-1可以建立服务器S-1-1与光电转换设备OES-1-1和/或光电转换设备OES-1-2的通信连接,并且管理模块MM-6可以控制光交叉模块OXC-7建立光接口I-1-1和/或I-1-2与光交叉模块OXC-7的第二光接口组中空闲的光接口的光通信连接,例如建立光接口I-1-2与光接口O-2的光通信连接。进而服务器S-1-1可以通过远端硬件池中内存控制器MC-1中的存储空间来执行计算任务。

基于上述硬件共享设备PS-11来部署硬件共享系统,服务器可以根据对内存空间的需求,使用近端硬件池中的存储介质或远端硬件池中的存储介质来完成计算任务,可以降低各服务器在一些场景中(例如命名用近端硬件池中的存储介质来完计算任务时)使用硬件资源的延迟。

可以理解,以上各实施例中以高速接口为CXL

例如,在一些实施例中,高速接口可以为PCIe接口,硬件模块可以将能够连接到PCIe接口的板卡,包括但不限于显卡、FPGA卡、DPU卡等。

具体地,图12示出了一种硬件共享设备PS-12的应用场景示意图。

如图12所示,硬件共享设备包括M个硬件端光电转换设备(光电转换设备OEH-1、光电转换设备OEH-2、……、光电转换设备OES-M)、M张板卡(板卡1、板卡2、……、板卡M)、光交叉模块OXC-8、管理模块MM-7。其中,

光交叉OXC-8包括第一光接口组(第一光接口组包括N个光接口,即光接口I-1、光接口I-2、……、光接口I-N)和第二光接口组(第二光接口组包括M个光接口,即光接口O-1、光接口O-2、……、光接口O-M),用于建立或断开第一光接口组中任意一个光接口与第二光接口组中的任意一个光接口的光通信连接;

M个硬件端光电转换设备中的各光电转换设备的一端与板卡电连接,另一端通过光纤与光交叉模块OXC-8的第二光接口组中光接口建立光通信连接,用于将板卡发送的电信号转换为光信号再发送给光交叉模块OXC-8或将光交叉模块OXC-8发送的光信号转换为电信号再发送给板卡。

管理模块MM-7可以和各服务器、光交叉模块OXC-8进行通信,用于根据某服务器发送的硬件使用请求,控制光交叉模块OXC-8建立该服务器对应的光接口与空闲的板卡对应的光接口的光通信连接,或者根据某服务器发送的硬件释放请求,控制光交叉模块OXC-8断开该服务器对应的光接口与该服务器占用的板卡对应的光接口的光通信连接。

光交叉OXC-8的第一光接口组中的光接口分别通过光纤与N个服务器中的N个设备端光电转换设备(光电转换设备OES-1、光电转换设备OES-2、……、光电转换设备OES-N)连接,每个设备端光电转换设备通过PCIe接口与各服务器电连接。

N个服务器中的任意一个,例如服务器S-2,需要利用硬件共享设备PS-12中的板卡来完成计算任务时,可以向管理模块MM-7发送硬件使用请求,从而管理模块MM-7可以控制光交叉模块OCX-8建立光接口I-2和空间的板卡对应的光接口的光通信连接,例如,建立光接口I-2与光接口O-2的光通信连接,从而服务器S-2可以利用板卡2来完成计算任务。

本申请实施例还提供了一种硬件共享系统,该硬件共享系统包括多台服务器以及前述各实施例提供的至少任意一种硬件共享设备,各服务器通过光纤与硬件共享设备连接。各服务器可以在服务器内部的硬件资源不能完成计算任务时,使用硬件共享设备中的硬件模块来完成计算任务。由于硬件共享设备中是通过光纤来连接服务器,使得硬件共享设备可以部署到与服务器较远的位置,从而可以减小硬件模块的数量,提高硬件共享设备能够连接的服务器的数量,提高硬件模块的利用率。

本申请实施例还提供了一种服务器,该服务器包括处理器、存储器和光电转换设备,其中光电转换设备通过高速接口与处理器电连接,存储器中存储有计算任务对应的指令。处理器在执行计算任务对应的指令时,若检测到服务器连接的硬件资源不足以完成计算任务时,可以通过光电转换设备将计算任务对应的指令和数据转换为光信号,并通过光纤发送给上述各实施例提供的任意一种硬件共享装置。在接收到上述各实施例提供的任意一种硬件共享装置发送的上述计算任务对应的处理结果对应的光信号后,该服务器可以利用光电转换设备将该光信号转换为电信号。

可以理解,上述以服务器作为计算设备来介绍本申请的技术方案只是一种示例,在另一些实施例中,上述服务器也可以是具有高速接口或者通过其他接口设备扩展高速接口的任意计算设备,包括但不限于台式计算机、膝上计算机、平板计算机等,在此不做限定。

需要说明的是,在附图中,可以以特定布置和/或顺序示出一些结构或方法特征。然而,应该理解,可能不需要这样的特定布置和/或排序。而是,在一些实施例中,这些特征可以以不同于说明性附图中所示的方式和/或顺序来布置。另外,在特定图中包括结构或方法特征并不意味着暗示在所有实施例中都需要这样的特征,并且在一些实施例中,可以不包括这些特征或者可以与其他特征组合。

需要说明的是,本申请各实施例可以以硬件、固件、软件或其任何组合来实现。

需要说明的是,本申请各实施例中提到的各单元/模块都是逻辑单元/模块,在物理上,一个逻辑单元/模块可以是一个物理单元/模块,也可以是一个物理单元/模块的一部分,还可以以多个物理单元/模块的组合实现,这些逻辑单元/模块本身的物理实现方式并不是最重要的,这些逻辑单元/模块所实现的功能的组合才是解决本申请所提出的技术问题的关键。此外,为了突出本申请的创新部分,本申请上述各设备实施例并没有将与解决本申请所提出的技术问题关系不太密切的单元/模块引入,这并不表明上述设备实施例并不存在其它的单元/模块。

需要说明的是,术语“设置”、“连接”、“电连接”、“光通信连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。

需要说明的是,在本专利的示例和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然通过参照本申请的某些优选实施例,已经对本申请进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。

相关技术
  • 一种拆卸简单的缠绕机构
  • 一种粗纱缠绕机
  • 一种纺织生产线粗纱加工用粗纱机
技术分类

06120116337358