掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备、系统及存储介质

文献发布时间:2024-04-18 19:58:21


数据处理方法、装置、设备、系统及存储介质

技术领域

本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备、系统及存储介质。

背景技术

随着信息技术的快速发展,网络中需要传输和存储的数据量增长非常迅速,在许多大型业务网络中,需要从多个节点中采集数据并传输到分布式数据处理或存储平台,这些网络中大多采用分布式数据传输系统来传输数据。负载均衡就是一种计算机网络技术,用来在多个计算机、网络连接、CPU、磁碟驱动器或其他资源中分配负载,以达到最佳化资源使用、最大化吞吐率、最小化响应时间、同时避免过载的目的。

现有基于分布式数据传输的负载均衡中通常采用轮询算法,将请求按顺序轮流分配到每个节点上,均衡的对待每个节点。

然而,有些用户对资源分配的稳定性要求很高,其中最重要的是数据网络传输带宽,而采用轮询算法的方式不能满足一些用户的网络传输带宽需求。

发明内容

本申请提供一种数据处理方法、装置、设备、系统及存储介质,用以解决目前的负载均衡方法不能满足一些用户的网络传输带宽需求的技术问题。

第一方面,本申请提供一种数据处理方法,包括:

接收客户端发送的数据传输请求,解析所述数据传输请求,获取存储空间名称;

确定所述存储空间名称对应的用户的所属类型;

若所述用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,并将所述数据传输请求转发至所述专用接入服务器,以供所述专用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作;

或,

若所述用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器,并将所述数据传输请求转发至所述公用接入服务器,以供所述公用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作。

可选地,如上所述的方法,所述确定所述存储空间名称对应的用户的所属类型,包括:

获取预配置的专用用户与存储空间名称的映射关系,并将所述存储空间名称与所述映射关系中的存储空间名称进行匹配;

若所述存储空间名称与所述映射关系中的存储空间名称匹配,则确定所述存储空间名称对应的用户属于预配置的专用用户;

若所述存储空间名称与所述映射关系中的存储空间名称均不匹配,则确定所述存储空间名称对应的用户不属于预配置的专用用户。

可选地,如上所述的方法,所述从专用接入服务器集群中选择与用户对应的专用接入服务器,包括:

根据所述用户的用户标识获取与所述用户标识关联的预配置的专用接入服务器数量;

若所述关联的预配置的专用接入服务器数量为一个,则从专用接入服务器集群中选择该关联的预配置的专用接入服务器;

若关联的预配置的专用接入服务器数量为多个,则从关联的多个专用接入服务器中确定未处理上一次数据传输请求的专用接入服务器,从专用接入服务器集群中选择该专用接入服务器。

可选地,如上所述的方法,所述从公用接入服务器集群中选择公用接入服务器,包括:

基于轮询策略确定处理本次数据传输请求的公用接入服务器标识;

从公用接入服务器集群中选择与公用接入服务器标识匹配的公用接入服务器。

可选地,如上所述的方法,还包括:

接收专用用户配置指令,所述配置指令包括:待配置的存储空间名称;

将所述待配置的存储空间名称对应的用户配置为专用用户,并为所述待配置的存储空间名称对应的用户配置对应的专用接入服务器。

可选地,如上所述的方法,所述配置指令还包括:待配置的用户标识及专用接入服务器配置数量;

其中,所述为所述待配置的存储空间名称对应的用户配置对应的专用接入服务器,包括:

获取所述专用接入服务器集群中各专用接入服务器状态信息;

基于所述各专用接入服务器状态信息从专用接入服务器中选择与所述专用接入服务器配置数量相同,且状态信息为未配置的专用接入服务器,将选择的专用接入服务器与所述用户标识进行关联。

第二方面,本申请提供一种数据处理装置,包括:

收发单元,用于接收客户端发送的数据传输请求,解析所述数据传输请求,获取存储空间名称;

处理单元,用于确定所述存储空间名称对应的用户的所属类型;

处理单元,还用于若所述用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器;

收发单元,还用于将所述数据传输请求转发至所述专用接入服务器,以供所述专用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作;

处理单元,还用于若所述用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器;

收发单元,还用于并将所述数据传输请求转发至所述公用接入服务器,以供所述公用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作。

第三方面,本申请提供一种数据处理系统,所述系统包括:专用接入服务器集群、公共接入集群、存储服务器集群及负载均衡设备;

所述负载均衡设备,用于执行如第一方面所述的方法。

第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

本申请提供的数据处理方法、装置、设备、系统及存储介质,接收客户端发送的数据传输请求,解析所述数据传输请求,获取存储空间名称;确定所述存储空间名称对应的用户的所属类型;若所述用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,并将所述数据传输请求转发至所述专用接入服务器,以供所述专用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作;或,若所述用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器,并将所述数据传输请求转发至所述公用接入服务器,以供所述公用接入服务器基于所述数据传输请求,与存储服务器集群进行相应的数据处理操作,将专用用户和非专用用户分开处理,能够满足不同用户的数据传输请求,采用专用接入服务器不仅满足用户高带宽需求,能够有效提高数据传输及数据处理效率;从公用接入服务器集群选择相应的公用接入服务器,从而处理数据传输请求,在一定程度上也能够提高数据传输及数据处理效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1为为本申请提供的数据处理方法的网络架构示意图;

图2为本申请提供的一种数据处理方法的流程示意图;

图3为本申请提供的另一种数据处理方法的流程示意图;

图4为本申请提供的一种数据处理装置的结构示意图;

图5为用来实现本申请的数据处理方法的负载均衡设备的框图。

通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

现有技术中,基于分布式数据传输的负载均衡中通常采用轮询算法,将请求按顺序轮流分配到每个节点上,均衡的对待每个节点。

然而,有些用户对资源分配的稳定性要求很高,其中最重要的是数据网络传输带宽,而采用轮询算法的方式不能满足一些用户的网络传输带宽需求。

所以针对现有技术中负载均衡方法不能满足一些用户的网络传输带宽需求的,发明人在研究中发现,预先配置专用用户,并为专用用户分配专用的接入服务器,将专用用户和非专用用户的数据传输请求分开处理,具体地,接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称,确定存储空间名称对应的用户的所属类型,若用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,将数据传输请求发送至专用接入服务器,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作;若用户不属于预配置的专用用户,则从公共接入服务器集群中选择公共接入服务器,将数据传输请求发送至公共接入器,公共接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,将专用用户和非专用用户分开处理,能够满足不同用户的数据传输请求,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率;从公用接入服务器集群选择相应的公用接入服务器,从而处理数据传输请求,在一定程度上也能够提高数据传输及数据处理效率。

本申请提供的数据处理方法,旨在解决现有技术的如上技术问题。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

所以发明人基于上述的创造性发现,提出了本申请实施例的技术方案。下面对本申请实施例提供的数据处理方法的网络架构及应用场景进行介绍。

如图1所示,本申请实施例提供的数据处理方法对应的网络架构中包括:客户端、负载均衡设备2,接入服务器集群3、存储服务器集群4及元数据服务器(图1中未示出),其中,负载均衡设备2分别与客户端11、客户端12、客户端13、接入服务器集群2及元数据服务器进行通信连接,接入服务器集群2和存储服务器集群4行通信连接;其中,接入服务器集群3包括:专用用户池1、专用用户池2......专用用户池N及公用用户池,各专用用户池包括:至少一台专用服务器,存储服务器集群4包括:存储服务器1、存储服务器2......存储服务器N。

具体地,客户端11发送数据传输请求至负载均衡设备2,负载均衡设备2接收客户端11发送的数据传输请求,解析数据传输请求,获取存储空间名称;负载均衡设备2基于存储空间名称确定存储空间名称对应的用户的所属类型;若用户属于预配置的专用用户,则负载均衡设备2从接入服务器集群3中用户对应的专用用户池1中选择专用接入服务器,并将数据传输请求转发至专用接入服务器,专用接入服务器基于数据传输请求,与存储服务器集群4进行相应的数据处理操作,具体地,若数据传输请求为数据上传请求,解析数据上传请求,获取待上传的数据,专用接入服务器采用预设纠删码策略对待上传的数据进行切分处理,得到多个待存储的对象分片;进一步地,专用接入服务器从存储服务器集群4中选择与多个待存储的对象分片数量相同的存储服务器。各存储服务器接收到专用接入服务器的待存储的对象分片及对象名称后,各存储服务器将待存储的对象分片及对象名称进行关联,并存储至本地磁盘中;专用接入服务器将对象名称及对象分片的存储路径发送至元数据服务器,元数据服务器对对象名称及对象分片的存储路径进行存储,以便后续下载数据。

具体地,客户端13发送数据传输请求至负载均衡设备2,负载均衡设备2接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称;负载均衡设备2基于存储空间名称确定存储空间名称对应的用户的所属类型;若用户不属于预配置的专用用户,则从公用接入服务器集群3中选择公用接入服务器,并将数据传输请求转发至公用接入服务器,公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,公用接入服务器解析数据传输请求,若数据传输请求为数据下载请求,解析数据下载请求,获取待下载的对象名称,公用接入服务器将对象名称发送至元数据服务器,元数据服务器基于对象名称将与该对象名称关联的多个对象分片的存储路径发送至公用接入服务器;公用接入服务器接收到元数据服务器反馈的多个对象分片的存储路径,基于多个对象分片的存储路径从相应的存储服务器中获取对象名称对应的多个对象分片,公用接入服务器多个对象分片进行还原处理,获得源数据,公用接入服务器将源数据发送至负载均衡设备2,负载均衡设备2接收到源数据反馈至客户端13。将专用用户和非专用用户分开处理,能够满足不同用户的数据传输请求,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率;从公用接入服务器集群选择相应的公用接入服务器,从而处理数据传输请求,在一定程度上也能够提高数据传输及数据处理效率。

以下将参照附图来具体描述本申请的实施例。

图2为本申请提供的一种数据处理方法的流程示意图,该方法应用于负载均衡设备。如图2所示,该方法包括:

步骤201,接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称。

在本实施例中,负载均衡设备接收客户端发送的数据传输请求,数据传输请求分为数据上传请求以及数据下载请求,负载均衡设备解析数据传输请求,获取存储空间名称,该存储空间名称用于确定存储空间名称对应的用户的所属类型。

步骤202,确定存储空间名称对应的用户的所属类型。

在本实施例中,确定存储空间名称对应的用户所属类型,所属类型包括:预配置的专用用户,及非专用用户,其中,预配置的专用用户是指对象存储的大客户,需要占用较高网络带宽资源的一类用户,预配置的专用用户为网络占用带宽大于或等于预设值的用户,其中,预设值可以根据实际情况设置,如,将预设值设置为20Gbps,若用户A需要独占20Gbps网络带宽资源,是对象存储的大客户,则将用户A预先配置为专用用户。

步骤203,若用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,并将数据传输请求转发至专用接入服务器,以供专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。

在本实施例中,负载均衡设备与接入服务器集群通信连接,接入服务器集群包括:专用接入服务器集群和公用接入服务器集群,专用接入服务器集群包括:多台专用接入服务器,公用接入服务器集群包括:多台公用接入服务器;专用接入服务器是指某个用户专用的服务器,公用接入服务器是指多个用户公用使用的服务器,专用接入服务器和公用接入服务器均能基于数据传输请求与存储服务器集群进行相应的数据处理操作,不同的是专用接入服务器通常只为某个用户提供服务,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率。

另外,公用接入服务器集群、专用接入服务器集群均与存储服务器集群,公用接入服务器集群、专用接入服务器集群均与元数据服务器通信连接,其中,存储服务器集群包括:多个存储服务器,存储服务器用于对对象分片进行存储;元数据服务器用于源数据对应的对象分片的存储路径进行存储。

其中,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,专用接入服务器解析数据传输请求,若数据传输请求为数据上传请求,解析数据上传请求,获取待上传的数据,专用接入服务器采用预设纠删码策略对待上传的数据进行切分处理,得到多个待存储的对象分片;其中,纠删码(erasure coding,EC)是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。若待上传的数据数据为32KB,预设纠删码策略为4+2策略,将32KB的数据切分成4个8KB的分片,再生出2个8KB的分片,总计48KB数据,这6个分片为上述多个待存储的对象分片。需要说明的是,预设纠删码策略还可以是2+1,4+2:1,8+2等策略中的任意一种,根据实际情况选择。

进一步地,专用接入服务器从存储服务器集群中选择与多个待存储的对象分片数量相同的存储服务器,如,选择6个不同的存储服务器,专用接入服务器将多个待存储的对象及对象名称发送至多个不同的存储服务器,当任意2个存储服务器故障时,数据是不会丢失的,是可以反算出来源数据的。各存储服务器接收到专用接入服务器的待存储的对象分片及对象名称后,各存储服务器将待存储的对象分片及对象名称进行关联,并存储至本地磁盘中,专用接入服务器将对象名称及对象分片的存储路径发送至元数据服务器,元数据服务器对对象名称及对象分片的存储路径进行存储,以便后续下载数据。

其中,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,专用接入服务器解析数据传输请求,若数据传输请求为数据下载请求,解析数据下载请求,获取待下载的对象名称,专用接入服务器将待下载的对象名称发送至元数据服务器,元数据服务器基于待下载的对象名称将与该对象名称关联的多个对象分片的存储路径发送至专用接入服务器;专用接入服务器接收到元数据服务器反馈的多个对象分片的存储路径,基于多个对象分片的存储路径从相应的存储服务器中获取对象名称对应的多个对象分片,专用接入服务器多个对象分片进行还原处理,获得源数据,专用接入服务器将源数据发送至负载均衡设备,负载均衡设备接收到源数据反馈至客户端。

步骤204,若用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器,并将数据传输请求转发至公用接入服务器,以供公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。

在本实施例中,若用户不属于预设配置的专用用户,说明该用户是非专用用户,则从公用接入服务器集群选择公用接入服务器,并将数据传输请求转发至公用接入服务器,该公共接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,公用接入服务器集群包括多个公用接入服务器集群,采用公用接入服务器同样能满足用户的需求。需要说明的是,公用接入服务器集群中包括多个公用接入服务器,并不是将非专用用户的数据传输请求发送至同一台公用接入服务器,而是从公用接入服务器集群选择相应的公用接入服务器,相比而言,能够提高数据传输及数据处理效率。

其中,公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,公用接入服务器解析数据传输请求,若数据传输请求为数据上传请求,解析数据上传请求,获取待上传的数据,公用接入服务器采用预设纠删码策略对待上传的数据进行切分处理,得到多个待存储的对象分片;其中,纠删码(erasure coding,EC)是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。若待上传的数据数据为32KB,预设纠删码策略为4+2策略,将32KB的数据切分成4个8KB的分片,再生出2个8KB的分片,总计48KB数据,这6个分片为上述多个待存储的对象分片。需要说明的是,预设纠删码策略还可以是2+1,4+2:1,8+2等策略中的任意一种,根据实际情况选择。

进一步地,公用接入服务器从存储服务器集群中选择与多个待存储的对象分片数量相同的存储服务器,如,选择6个不同的存储服务器,公用接入服务器将多个待存储的对象分片及对象名称发送至多个不同的存储服务器,当任意2个存储服务器故障时,数据是不会丢失的,是可以反算出来源数据的。各存储服务器接收到公用接入服务器的待存储的对象分片及对象名称后,各存储服务器将待存储的对象分片及对象名称进行关联,并存储至本地磁盘中,公用服务器将对象名称及对象分片的存储路径发送至元数据服务器,元数据服务器对对象名称及对象分片的存储路径进行存储,以便后续下载数据。

其中,公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,公用接入服务器解析数据传输请求,若数据传输请求为数据下载请求,解析数据下载请求,获取待下载的对象名称,公用接入服务器将待下载的对象名称发送至元数据服务器,元数据服务器基于待下载的对象名称将与该对象名称关联的多个对象分片的存储路径发送至公用接入服务器;公用接入服务器接收到元数据服务器反馈的多个对象分片的存储路径,基于多个对象分片的存储路径从相应的存储服务器中获取对象名称对应的多个对象分片,公用接入服务器多个对象分片进行还原处理,获得源数据,公用接入服务器将源数据发送至负载均衡设备,负载均衡设备接收到源数据反馈至客户端。

本申请,接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称,确定存储空间名称对应的用户的所属类型,若用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,将数据传输请求发送至专用接入服务器,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作;若用户不属于预配置的专用用户,则从公共接入服务器集群中选择公共接入服务器,将数据传输请求发送至公共接入器,公共接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,将专用用户和非专用用户分开处理,能够满足不同用户的数据传输请求,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率;从公用接入服务器集群选择相应的公用接入服务器,从而处理数据传输请求,在一定程度上也能够提高数据传输及数据处理效率。

图3为本申请提供的另一种数据处理方法的流程示意图,该方法应用于负载均衡设备,如图3所示,该方法包括:

步骤301a,接收专用用户配置指令,配置指令包括:待配置的存储空间名称。

步骤301b,将待配置的存储空间名称对应的用户配置为专用用户,并为待配置的存储空间名称对应的用户配置对应的专用接入服务器。

在本实施例中,接收专用用户配置指令,该指令包括待配置的存储空间名称,将待配置的存储空间名称对应的用户配置为专用用户,进一步待配置的存储空间名称对应的用户配置对应的专用接入服务器,存储空间名称具有唯一性,采用存储空间名称有利于区分不同用户。

在一种可能的实现方式中,配置指令还包括:待配置的用户标识及专用接入服务器配置数量;其中,为待配置的存储空间名称对应的用户配置对应的专用接入服务器,包括:

获取专用接入服务器集群中各专用接入服务器状态信息;基于各专用接入服务器状态信息从专用接入服务器中选择与专用接入服务器配置数量相同,且状态信息为未配置的专用接入服务器,将选择的专用接入服务器与用户标识进行关联。

在本实施例中,获取专用接入服务器集群中各专用接入服务器状态信息,状态信息分为:未配置和已配置两种状态,其中,未配置是指专用接入服务器还为配置给用户,已配置是指专用接入服务器已配置给某个用户,由该用户独占该服务器。基于各专用接入服务器状态信息从专用接入服务器中选择与专用接入服务器配置数量相同,且状态信息为未配置的专用接入服务器,将选择的专用接入服务器与用户标识进行关联,并将该服务器对应的状态信息由未配置更新未已配置。

步骤301,接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称。

在本实施例中,负载均衡设备接收客户端发送的数据传输请求,数据传输请求分为数据上传请求以及数据下载请求,负载均衡设备解析数据传输请求,获取存储空间名称,该存储空间名称用于确定存储空间名称对应的用户的所属类型。

步骤302,确定存储空间名称对应的用户的所属类型。

在本实施例中,确定存储空间名称对应的用户所属类型,所属类型包括:预配置的专用用户,及非专用用户,其中,预配置的专用用户是指对象存储的大客户,需要占用较高网络带宽资源的一类用户,预配置的专用用户为网络占用带宽大于或等于预设值的用户,其中,预设值可以根据实际情况设置,如,将预设值设置为20Gbps,若用户A需要独占20Gbps网络带宽资源,是对象存储的大客户,则将用户A预先配置为专用用户。

在一种可能的实现方式中,确定存储空间名称对应的用户的所属类型,包括:

获取预配置的专用用户与存储空间名称的映射关系,并将存储空间名称与映射关系中的存储空间名称进行匹配;若存储空间名称与映射关系中的存储空间名称匹配,则确定存储空间名称对应的用户属于预配置的专用用户;若存储空间名称与映射关系中的存储空间名称均不匹配,则确定存储空间名称对应的用户不属于预配置的专用用户。

在本实施例中,获取预配置的专用用户与存储空间名称的映射关系,并将解析数据请求获得的存储空间名称与映射关系中的存储空间名称进行匹配,根据匹配结果确定存储空间名称对应的用户所属类型,具体地,若存储空间名称与映射关系中的存储空间名称匹配,则确定存储空间名称对应的用户属于预配置的专用用户,预配置的专用用户是指预先配置专用接入服务器的一类用户,这类用户有自己专属的服务器,能够满足用户的高带宽需求;若存储空间名称与映射关系中的存储空间名称均不匹配,则确定存储空间名称对应的用户不属于预配置的专用用户,这类用户并没有自己专属的服务器,采用公用的服务器为其提供数据处理服务,能够满足不同用户的需求。

步骤303,若用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器,并将数据传输请求转发至专用接入服务器,以供专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。

在本实施例中,负载均衡设备与接入服务器集群通信连接,接入服务器集群包括:专用接入服务器集群和公用接入服务器集群,专用接入服务器集群包括:多台专用接入服务器,公用接入服务器集群包括:多台公用接入服务器;专用接入服务器是指某个用户专用的服务器,公用接入服务器是指多个用户公用使用的服务器,专用接入服务器和公用接入服务器均能基于数据传输请求与存储服务器集群进行相应的数据处理操作,不同的是专用接入服务器通常只为某个用户提供服务,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率。

另外,公用接入服务器集群、专用接入服务器集群均与存储服务器集群,公用接入服务器集群、专用接入服务器集群均与元数据服务器通信连接,其中,存储服务器集群包括:多个存储服务器,存储服务器用于对对象分片进行存储;元数据服务器用于源数据对应的对象分片的存储路径进行存储。

其中,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,专用接入服务器解析数据传输请求,若数据传输请求为数据上传请求,解析数据上传请求,获取待上传的数据,专用接入服务器采用预设纠删码策略对待上传的数据进行切分处理,得到多个待存储的对象分片;其中,纠删码(erasure coding,EC)是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。若待上传的数据数据为32KB,预设纠删码策略为4+2策略,将32KB的数据切分成4个8KB的分片,再生出2个8KB的分片,总计48KB数据,这6个分片为上述多个待存储的对象分片。需要说明的是,预设纠删码策略还可以是2+1,4+2:1,8+2等策略中的任意一种,根据实际情况选择。

进一步地,专用接入服务器从存储服务器集群中选择与多个待存储的对象分片数量相同的存储服务器,如,选择6个不同的存储服务器,专用接入服务器将多个待存储的对象分片及对象名称发送至多个不同的存储服务器,当任意2个存储服务器故障时,数据是不会丢失的,是可以反算出来源数据的。各存储服务器接收到专用接入服务器的待存储的对象分片及对象名称后,各存储服务器将待存储的对象分片及对象名称进行关联,并存储至本地磁盘中,专用接入服务器将对象名称及对象分片的存储路径发送至元数据服务器,元数据服务器对对象名称及对象分片的存储路径进行存储,以便后续下载数据。

其中,专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,专用接入服务器解析数据传输请求,若数据传输请求为数据下载请求,解析数据下载请求,获取待下载的对象名称,专用接入服务器将待下载的对象名称发送至元数据服务器,元数据服务器基于待下载的对象名称将与该对象名称关联的多个对象分片的存储路径发送至专用接入服务器;专用接入服务器接收到元数据服务器反馈的多个对象分片的存储路径,基于多个对象分片的存储路径从相应的存储服务器中获取对象名称对应的多个对象分片,专用接入服务器多个对象分片进行还原处理,获得源数据,专用接入服务器将源数据发送至负载均衡设备,负载均衡设备接收到源数据反馈至客户端。

在一种可能的实现方式中,从专用接入服务器集群中选择与用户对应的专用接入服务器,包括:

根据用户的用户标识获取与用户标识关联的预配置的专用接入服务器数量;若关联的预配置的专用接入服务器数量为一个,则从专用接入服务器集群中选择该关联的预配置的专用接入服务器;若关联的预配置的专用接入服务器数量为多个,则从关联的多个专用接入服务器中确定未处理上一次数据传输请求的专用接入服务器,从专用接入服务器集群中选择该专用接入服务器。

在本实施例中,为了更好地满足用户需求,为用户配置至少一台专用接入服务器,在进行数据处理时,选择专用服务器进行处理,根据用户的获取标识获取用户标识关联的预配置的专用接入服务器数量,若关联的预配置的专用接入服务器数量为一个,则从专用接入服务器集群中选择该关联的预配置的专用接入服务器;若关联的预配置的专用接入服务器数量为多个,从多个里选择一个专用服务器,为了将用户的请求发送至不同的服务器,从关联的多个专用接入服务器中确定未处理上一次数据传输请求的专用接入服务器,不仅可以提供吞吐量,也可以避免单一服务器宕机导致不可能的情况出现,使得服务器的负责处于高效稳定的状态。从专用接入服务器集群中选择该专用接入服务器,专用服务器不处理其他用户的数据传输请求,以保证对特定用户对接入服务器带宽的独占。

步骤304,若用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器,并将数据传输请求转发至公用接入服务器,以供公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。

在本实施例中,若用户不属于预设配置的专用用户,说明该用户是非专用用户,则从公用接入服务器集群选择公用接入服务器,并将数据传输请求转发至公用接入服务器,该公共接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,公用接入服务器集群包括多个公用接入服务器集群,采用公用接入服务器同样能满足用户的需求。

其中,公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,公用接入服务器解析数据传输请求,若数据传输请求为数据上传请求,解析数据上传请求,获取待上传的数据,公用接入服务器采用预设纠删码策略对待上传的数据进行切分处理,得到多个待存储的对象分片;其中,纠删码(erasure coding,EC)是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。若待上传的数据数据为32KB,预设纠删码策略为4+2策略,将32KB的数据切分成4个8KB的分片,再生出2个8KB的分片,总计48KB数据,这6个分片为上述多个待存储的对象分片。需要说明的是,预设纠删码策略还可以是2+1,4+2:1,8+2等策略中的任意一种,根据实际情况选择。

进一步地,公用接入服务器从存储服务器集群中选择与多个待存储的对象分片数量相同的存储服务器,如,选择6个不同的存储服务器,公用接入服务器将多个待存储的对象分片及对象名称发送至多个不同的存储服务器,当任意2个存储服务器故障时,数据是不会丢失的,是可以反算出来源数据的。各存储服务器接收到公用接入服务器的待存储的对象分片及对象名称后,各存储服务器将待存储的对象分片及对象名称进行关联,并存储至本地磁盘中,公用服务器将对象名称及对象分片的存储路径发送至元数据服务器,元数据服务器对对象名称及对象分片的存储路径进行存储,以便后续下载数据。

其中,公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作,具体地,公用接入服务器解析数据传输请求,若数据传输请求为数据下载请求,解析数据下载请求,获取待下载的对象名称,公用接入服务器将待下载的对象名称发送至元数据服务器,元数据服务器基于待下载的对象名称将与该对象名称关联的多个对象分片的存储路径发送至公用接入服务器;公用接入服务器接收到元数据服务器反馈的多个对象分片的存储路径,基于多个对象分片的存储路径从相应的存储服务器中获取对象名称对应的多个对象分片,公用接入服务器多个对象分片进行还原处理,获得源数据,公用接入服务器将源数据发送至负载均衡设备,负载均衡设备接收到源数据反馈至客户端。

在一种可能的实现方式中,从公用接入服务器集群中选择公用接入服务器,包括:

基于轮询策略确定处理本次数据传输请求的公用接入服务器标识;从公用接入服务器集群中选择与公用接入服务器标识匹配的公用接入服务器。

在本实施例中,采用用负载均衡算法中的轮询策略进行请求的分配,将数据传输请求分配给公共接入服务器集群中可用服务列表中的每一个公共接入服务器,基于轮询策略从可用服务列表中确定处理本次数据传输请求的公用接入服务器标识,从公用接入服务器集群中选择与公用接入服务器标识匹配的公用接入服务器。

本申请,通过预先为用户配置专用服务器,配置的专用服务器只处理相应用户的数据传输请求,采用专用接入服务器不仅满足用户高带宽需求,而且能够有效提高数据传输及数据处理效率;从公用接入服务器集群选择相应的公用接入服务器,从而处理数据传输请求,在一定程度上也能够提高数据传输及数据处理效率。

图4为本申请提供的一种数据处理装置的结构示意图,如图4所示,本实施例提供的数据处理装置400包括收发单元401,处理单元402。

其中,收发单元401用于接收客户端发送的数据传输请求,解析数据传输请求,获取存储空间名称。处理单元402用于确定存储空间名称对应的用户的所属类型。处理单元402还用于若用户属于预配置的专用用户,则从专用接入服务器集群中选择与用户对应的专用接入服务器。收发单元401还用于将数据传输请求转发至专用接入服务器,以供专用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。处理单元402还用于若用户不属于预配置的专用用户,则从公用接入服务器集群中选择公用接入服务器。收发单元401还用于并将数据传输请求转发至公用接入服务器,以供公用接入服务器基于数据传输请求,与存储服务器集群进行相应的数据处理操作。

可选地,处理单元402还用于获取预配置的专用用户与存储空间名称的映射关系,并将存储空间名称与映射关系中的存储空间名称进行匹配;若存储空间名称与映射关系中的存储空间名称匹配,则确定存储空间名称对应的用户属于预配置的专用用户;若存储空间名称与映射关系中的存储空间名称均不匹配,则确定存储空间名称对应的用户不属于预配置的专用用户。

可选地,处理单元402还用于根据用户的用户标识获取与用户标识关联的预配置的专用接入服务器数量;若关联的预配置的专用接入服务器数量为一个,则从专用接入服务器集群中选择该关联的预配置的专用接入服务器;若关联的预配置的专用接入服务器数量为多个,则从关联的多个专用接入服务器中确定未处理上一次数据传输请求的专用接入服务器,从专用接入服务器集群中选择该专用接入服务器。

可选地,处理单元402还用于基于轮询策略确定处理本次数据传输请求的公用接入服务器标识;从公用接入服务器集群中选择与公用接入服务器标识匹配的公用接入服务器。

可选地,收发单元401还用于接收专用用户配置指令,配置指令包括:待配置的存储空间名称。处理单元402还用于将待配置的存储空间名称对应的用户配置为专用用户,并为待配置的存储空间名称对应的用户配置对应的专用接入服务器。

可选地,处理单元402还用于获取专用接入服务器集群中各专用接入服务器状态信息;基于各专用接入服务器状态信息从专用接入服务器中选择与专用接入服务器配置数量相同,且状态信息为未配置的专用接入服务器,将选择的专用接入服务器与用户标识进行关联。

图5为用来实现本申请的数据处理方法的负载均衡设备的框图,如图5所示,该负载均衡设备500包括:存储器501,处理器502及收发器503。

处理器502,存储器501及收发器503电路互联;

收发器503,用于收发数据;

存储器501存储计算机执行指令;

处理器502执行存储器501存储的计算机执行指令,使得处理器502执行上述任意实施例提供的方法。

本申请还提供一种数据处理系统,系统包括:专用接入服务器集群、公共接入集群、存储服务器集群及负载均衡设备;

负载均衡设备,用于执行执行上述任意一个实施例中的方法。

在示例性实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行上述任意一个实施例中的方法。

在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行上述任意一个实施例中的方法。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。

进一步需要说明的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

应该理解,上述的装置实施例仅是示意性的,本申请的装置还可通过其它的方式实现。例如,上述实施例中单元/模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,多个单元、模块或组件可以结合,或者可以集成到另一个系统,或一些特征可以忽略或不执行。

另外,若无特别说明,在本申请各个实施例中的各功能单元/模块可以集成在一个单元/模块中,也可以是各个单元/模块单独物理存在,也可以两个或两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。

集成的单元/模块如果以硬件的形式实现时,该硬件可以是数字电路,模拟电路等等。硬件结构的物理实现包括但不局限于晶体管,忆阻器等等。若无特别说明,处理器可以是任何适当的硬件处理器,比如CPU、GPU、FPGA、DSP和ASIC等等。若无特别说明,存储单元可以是任何适当的磁存储介质或者磁光存储介质,比如,阻变式存储器RRAM(ResistiveRandom Access Memory)、动态随机存取存储器DRAM(Dynamic Random Access Memory)、静态随机存取存储器SRAM(Static Random-Access Memory)、增强动态随机存取存储器EDRAM(Enhanced Dynamic Random Access Memory)、高带宽内存HBM(High-Bandwidth Memory)、混合存储立方HMC(Hybrid Memory Cube)等等。

集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

相关技术
  • 存储系统的数据处理方法、装置、系统及可读存储介质
  • 数据仓库内数据处理方法、装置、计算机设备和存储介质
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 财报数据处理方法、装置、计算机设备和存储介质
  • 数据访问请求的处理方法、装置和设备及存储介质
  • 数据处理设备、数据处理系统、包、记录介质、存储装置和数据处理方法
  • 数据处理设备、数据处理系统、包、记录介质、存储装置和数据处理方法
技术分类

06120116482507