掌桥专利:专业的专利平台
掌桥专利
首页

深度学习任务处理系统和方法

文献发布时间:2023-06-19 11:26:00


深度学习任务处理系统和方法

技术领域

本申请属于深度学习技术领域,尤其涉及一种深度学习任务处理系统和方法。

背景技术

随着深度学习技术的成熟与计算机运算能力的提升,随着深度学习技术在工程界的应用越来越广泛,如何在最少的硬件资源上实现算法预测的高并发、高可用、高吞吐、低延迟、以及易扩展,显得尤为重要。目前深度学习对硬件的要求十分苛刻,需要使用大量昂贵的GPU服务器,这也是各个厂商深度学习成本居高不下的原因之一。而且为了实现高并发等指标,厂商只能花费大量成本进行GPU服务器基础设施建设。

发明内容

有鉴于此,本申请实施例提供了一种深度学习任务处理系统和方法,以解决现有的深度学习任务处理过程中需要使用大量昂贵的GPU服务器,导致成本高昂的问题。

本申请实施例的第一方面提供了一种深度学习任务处理系统,包括业务逻辑服务器集群和算法服务器集群;

所述业务逻辑服务器集群包括一个以上的CPU服务器,CPU服务器用于对深度学习任务中的业务逻辑进行处理;

所述算法服务器集群包括一个以上的GPU服务器,GPU服务器用于对深度学习任务中的算法进行处理。

进一步地,所述业务逻辑服务器集群还包括业务逻辑任务分发服务器,所述业务逻辑任务分发服务器用于接收深度学习任务请求,并将接收到的深度学习任务请求分发至各个CPU服务器;

CPU服务器还用于在对深度学习任务中的业务逻辑进行处理的过程中,向所述算法服务器集群发送算法任务请求;

所述算法服务器集群还包括算法任务分发服务器,所述算法任务分发服务器用于接收CPU服务器发送的算法任务请求,并将接收到的算法任务请求分发至各个GPU服务器。

进一步地,所述深度学习任务处理系统还可以包括:

算法结果存储数据库,用于对GPU服务器的算法处理结果进行存储;

业务逻辑结果存储数据库,用于对CPU服务器的业务逻辑处理结果进行存储;

GPU服务器还用于在对深度学习任务中的算法进行处理之后,将算法处理结果存储至所述算法结果存储数据库;

CPU服务器还用于从所述算法结果存储数据库中获取算法处理结果,并在完成深度学习任务之后,将深度学习任务的预测结果存储至所述业务逻辑结果存储数据库。

进一步地,所述深度学习任务处理系统还可以包括:

Web服务器,用于接收终端设备发送的深度学习任务请求,并将接收到的深度学习任务请求发送至所述业务逻辑任务分发服务器;监测所述业务逻辑结果存储数据库的状态,当所述业务逻辑结果存储数据库为完成状态时,从所述业务逻辑结果存储数据库获取预测结果,并将预测结果反馈至终端设备。

本申请实施例的第二方面提供了一种深度学习任务处理方法,可以包括:

接收待处理的深度学习任务请求;

将接收到的深度学习任务请求分发至各个业务逻辑处理线程,各个业务逻辑处理线程均部署在预设的CPU服务器集群中,所述CPU服务器集群包括一个以上的CPU服务器;

通过业务逻辑处理线程对深度学习任务中的业务逻辑进行处理,并发起算法任务请求;

将算法任务请求分发至各个算法处理线程,各个算法处理线程均部署在预设的GPU服务器集群中,所述GPU服务器集群包括一个以上的GPU服务器;

通过算法处理线程对深度学习任务中的算法进行处理,得到算法处理结果;

通过业务逻辑处理线程获取算法处理结果,并根据获取到的算法处理结果完成深度学习任务,得到预测结果。

进一步地,所述将接收到的深度学习任务请求分发至各个业务逻辑处理线程包括:

将接收到的深度学习任务请求添加入预设的业务逻辑任务队列中;

通过所述业务逻辑任务队列将接收到的深度学习任务请求分发至各个业务逻辑处理线程。

进一步地,所述将算法任务请求分发至各个算法处理线程包括:

将算法任务请求添加入预设的算法任务队列中;

通过所述算法任务队列将算法任务请求分发至各个算法处理线程。

进一步地,在得到算法处理结果之后,所述深度学习任务处理方法还可以包括:

将算法处理结果存储至预设的算法结果存储数据库;

所述通过业务逻辑处理线程获取算法处理结果包括:

通过业务逻辑处理线程从所述算法结果存储数据库中获取算法处理结果。

进一步地,在得到预测结果之后,所述深度学习任务处理方法还可以包括:

将预测结果存储至预设的业务逻辑结果存储数据库。

进一步地,所述深度学习任务处理方法还可以包括:

监测所述业务逻辑结果存储数据库的状态,当所述业务逻辑结果存储数据库为完成状态时,从所述业务逻辑结果存储数据库获取预测结果,并将预测结果反馈至终端设备。

本申请实施例的第三方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述深度学习任务处理系统中的任一种服务器的功能。

本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述深度学习任务处理系统中的任一种服务器的功能。

本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器实现上述深度学习任务处理系统中的任一种服务器的功能。

本申请实施例与现有技术相比存在的有益效果是:本申请实施例中的深度学习任务处理系统,包括业务逻辑服务器集群和算法服务器集群;所述业务逻辑服务器集群包括一个以上的CPU服务器,CPU服务器用于对深度学习任务中的业务逻辑进行处理;所述算法服务器集群包括一个以上的GPU服务器,GPU服务器用于对深度学习任务中的算法进行处理。通过本申请实施例,采用算法与业务逻辑完全分离的架构,GPU服务器只进行纯粹的算法处理,而将其它的业务逻辑处理均由成本相对较低的CPU服务器进行处理,从而使得GPU服务器资源的利用更加合理,节省了大量的GPU服务器资源,有效降低了处理深度学习任务的成本。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本申请实施例中一种深度学习任务处理系统的一个实施例示意图;

图2为本申请实施例中一种深度学习任务处理系统的另一个实施例示意图;

图3为本申请实施例中一种深度学习任务处理方法的一个实施例流程图;

图4为深度学习任务处理系统的系统交互示意图;

图5为本申请实施例中一种服务器的示意框图。

具体实施方式

为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

图1所示为本申请实施例中一种深度学习任务处理系统的示意图,如图所示,所述深度学习任务处理系统可以包括业务逻辑服务器集群和算法服务器集群。

所述业务逻辑服务器集群包括一个以上的CPU服务器,CPU服务器用于对深度学习任务中的业务逻辑进行处理。

所述算法服务器集群包括一个以上的GPU服务器,GPU服务器用于对深度学习任务中的算法进行处理。

在深度学习任务处理的过程中,除了需要进行深度学习运算(例如,向量、矩阵运算等)之外,还有许多业务逻辑处理过程(例如,将词转换为向量、对图片进行缩放、对语音进行信号处理等)。在本申请实施例中,在进行深度学习任务处理时,GPU服务器仅用于对深度学习任务中的算法进行处理,即只接受向量、矩阵的数值输入,然后给出对应的向量、矩阵的数值输出,而使用CPU服务器对深度学习任务中的业务逻辑进行处理,负责将文字、图片以及语音等信息转换为可供算法运算的向量、矩阵等,最后,再把算法预测得到的向量、矩阵,转换为相应的文字、图片以及语音信息。通过这样的方式,GPU服务器仅用于对深度学习任务中的算法进行处理,业务逻辑的处理过程被剥离开来,由CPU服务器来完成,从而使得GPU服务器的利用效率达到最大。

进一步地,如图2所示,所述业务逻辑服务器集群还可以包括业务逻辑任务分发服务器,所述业务逻辑任务分发服务器用于接收深度学习任务请求,并将接收到的深度学习任务请求分发至各个CPU服务器。

CPU服务器还用于在对深度学习任务中的业务逻辑进行处理的过程中,向所述算法服务器集群发送算法任务请求。

所述算法服务器集群还可以包括算法任务分发服务器,所述算法任务分发服务器用于接收CPU服务器发送的算法任务请求,并将接收到的算法任务请求分发至各个GPU服务器。

进一步地,所述深度学习任务处理系统还可以包括算法结果存储数据库和业务逻辑结果存储数据库。

所述算法结果存储数据库用于对GPU服务器的算法处理结果进行存储。

所述业务逻辑结果存储数据库用于对CPU服务器的业务逻辑处理结果进行存储。

GPU服务器还用于在对深度学习任务中的算法进行处理之后,将算法处理结果存储至所述算法结果存储数据库。

CPU服务器还用于从所述算法结果存储数据库中获取算法处理结果,并在完成深度学习任务之后,将深度学习任务的预测结果存储至所述业务逻辑结果存储数据库。

进一步地,所述深度学习任务处理系统还可以包括Web服务器,所述Web服务器用于接收用户通过其终端设备发送的深度学习任务请求,并将接收到的深度学习任务请求发送至所述业务逻辑任务分发服务器;监测所述业务逻辑结果存储数据库的状态,当所述业务逻辑结果存储数据库为完成状态时,从所述业务逻辑结果存储数据库获取预测结果,并将预测结果反馈至用户的终端设备。

通过本申请实施例,采用算法与业务逻辑完全分离的架构,GPU服务器只进行纯粹的算法处理,而将其它的业务逻辑处理均由成本相对较低的CPU服务器进行处理,从而使得GPU服务器资源的利用更加合理,节省了大量的GPU服务器资源,有效降低了处理深度学习任务的成本。

图3所示为本申请实施例中一种深度学习任务处理方法的示意流程图,所述深度学习任务处理方法应用于所述深度学习任务处理系统中,如图所示,所述深度学习任务处理方法可以包括如下步骤:

步骤S301、接收待处理的深度学习任务请求。

一般地,当用户需要进行图像识别、文本分类等深度学习任务处理时,可以使用其终端设备发起深度学习任务请求,该请求由终端设备通过GRPC协议发送至Web服务器。

步骤S302、将接收到的深度学习任务请求分发至各个业务逻辑处理线程。

其中,各个业务逻辑处理线程均部署在预设的CPU服务器集群中,所述CPU服务器集群包括一个以上的CPU服务器。

所述Web服务器在接收到待处理的深度学习任务请求之后,可以将接收到的深度学习任务添加入预设的业务逻辑任务队列(Logic Process Broker)中,并通过所述业务逻辑任务队列将接收到的深度学习任务请求分发至各个业务逻辑处理线程(Logic ProcessWorker)。其中,每个Worker均具备完整的业务逻辑功能,可以根据并发量弹性扩容,部署在不同的CPU服务器上,整个任务处理机制基于Celery框架进行。

步骤S303、通过业务逻辑处理线程对深度学习任务中的业务逻辑进行处理,并发起算法任务请求。

在深度学习任务的处理过程中,既需要处理其中的业务逻辑部分,又需要处理其中的算法部分,在本申请实施例中,由业务逻辑处理线程对深度学习任务中的业务逻辑进行处理,当需要处理相应算法时,由业务逻辑处理线程发起算法任务请求。

步骤S304、将算法任务请求分发至各个算法处理线程。

各个算法处理线程均部署在预设的GPU服务器集群中,所述GPU服务器集群包括一个以上的GPU服务器。

在业务逻辑处理线程发起算法任务请求后,可以将算法任务请求添加入预设的算法任务队列(Algorithm Predict Broker)中,并通过所述算法任务队列将算法任务请求分发至各个算法处理线程(Algorithm Predict Worker)。其中,每个Worker均具备完整的算法功能,可以根据并发量弹性扩容,部署在不同的GPU服务器上,整个任务处理机制基于Celery框架进行。

步骤S305、通过算法处理线程对深度学习任务中的算法进行处理,得到算法处理结果。

算法处理线程在运算得到算法处理结果之后,可以将算法处理结果存储至预设的算法结果存储数据库(Algorithm Backend),该数据库具体可以使用Redis、RabbitMQ等中间件实现。

步骤S306、通过业务逻辑处理线程获取算法处理结果,并根据获取到的算法处理结果完成深度学习任务,得到预测结果。

当算法处理结果存储到所述算法结果存储数据库中之后,对应的发起算法任务请求的业务逻辑处理线程可以从所述算法结果存储数据库中获取算法处理结果,并完成其它的业务逻辑处理任务,从而得到最终的预测结果。

在得到预测结果后,业务逻辑处理线程可以将其存储至预设的业务逻辑结果存储数据库(Logic Process Backend),该数据库具体可以使用Redis、RabbitMQ等中间件实现。

所述Web服务器可以持续监测所述业务逻辑结果存储数据库的状态,当所述业务逻辑结果存储数据库为完成状态时,所述Web服务器便可以从所述业务逻辑结果存储数据库获取预测结果,并将预测结果反馈至用户的终端设备,从而完成整个深度学习任务处理过程。

图4所示为深度学习任务处理系统的系统交互示意图,图中标号1至8分别代表下述的8个交互流程:

1、用户通过其终端设备采用GRPC协议发起深度学习任务请求,该请求通过Web服务器进入Logic Process Broker。请求完成后,Web服务器会监测Logic Process Backend的状态,当Logic Process Backend有了结果时,Web服务器会将该结果取出,则预测完毕。

2、根据用户的访问情况,Logic Process Broker将请求分发给不同的Worker去处理业务逻辑服务,发送预测请求后,Worker会监测Algorithm Backend的状态,当AlgorithmBackend有了结果时,Logic Process Broker会将该结果取出。

3、业务逻辑处理时,当需要调用相应算法进行预测时,可以向算法任务队列(Algorithm Predict Broker)发起算法任务请求。

4、收到业务逻辑模块的调用后,Algorithm Predict Broker将请求分发给不同的Algorithm Predict Worker去预测算法结果。

5、Algorithm Predict Worker运算出预测结果后,将结果储存于AlgorithmBackend中。

6、当预测结果存储到Algorithm Backend中之后,对应的调用算法的LogicProcess Worker从Algorithm Backend中获取到算法预测的结果,并完成其它的逻辑处理任务。

7、当Logic Process Worker完成其它的业务逻辑处理后,将结果储存于LogicProcess Backend中。

8、Web服务器监控到Logic Process Backend的状态为完成时,从中取出结果,所有预测完成。

综上所述,本申请实施例采用算法与业务逻辑完全分离的架构,可以算法代码和业务逻辑代码分别部署在弹性分布式队列服务中,并能够实时调度和处理分布式预测任务。由于算法预测和业务逻辑处理是分开部署的,当算法的并发达到服务器瓶颈时扩容算法GPU服务器即可,不需要顾虑业务逻辑的扩容。对于业务逻辑也一样,达到并发瓶颈时不需要考虑GPU服务器的扩容。进一步地,可以将业务功能模块化,配置不同的技术人员,算法模块专注优化、维护算法,业务逻辑模块专注于业务逻辑,便于日常的迭代与维护。通过本申请实施例可以大大降低GPU服务的硬件成本,在最少的硬件资源上实现算法预测的高并发、高可用、高吞吐、低延迟、以及易扩展。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

图5示出了本申请实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本申请实施例相关的部分。

如图5所示,该实施例的服务器5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述深度学习任务处理系统中的任一种服务器的功能,例如CPU服务器、GPU服务器、业务逻辑任务分发服务器、算法任务分发服务器、Web服务器等等。

示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述服务器5中的执行过程。

本领域技术人员可以理解,图5仅仅是服务器5的示例,并不构成对服务器5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器5还可以包括输入输出设备、网络接入设备、总线等。

所述处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器51可以是所述服务器5的内部存储单元,例如服务器5的硬盘或内存。所述存储器51也可以是所述服务器5的外部存储设备,例如所述服务器5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述服务器5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述服务器5所需的其它程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的服务器和方法,可以通过其它的方式实现。例如,以上所描述的服务器实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述深度学习任务处理系统中的任一种服务器的功能。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

相关技术
  • 深度学习任务处理系统和方法
  • 基于容器集群的深度学习任务服务质量保证方法和系统
技术分类

06120112923431