掌桥专利:专业的专利平台
掌桥专利
首页

图像处理模型的训练方法、图像处理方法、装置及设备

文献发布时间:2023-06-19 16:04:54



技术领域

本公开涉及计算机技术领域,具体涉及计算机视觉、深度学习、增强现实等人工智能技术领域。

背景技术

随着计算机视觉、计算机技术等相关领域的飞速发展,面部三维重建技术也在不断更新。面部三维重建中除了对面部形状进行重建,还需要生成对应的面部纹理图。相关技术中,基于纹理基底重建纹理图,但是采用这种方式重建出的纹理图依赖于纹理基底的覆盖能力,由于不同风格的开源纹理基底可能不存在,因此重建的纹理图的辨识度较低。

发明内容

本公开提供了一种图像处理模型的训练方法、图像处理方法、装置及设备。

根据本公开的第一方面,提供了一种图像处理模型的训练方法,包括:

将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;

基于纹理系数和纹理基底生成样本面部图的纹理图;

基于纹理图生成样本面部图的渲染图;

确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;

基于第一特征图和第二特征图构建损失函数;

基于损失函数对图像处理模型的参数进行调整。

根据本公开的第二方面,提供了一种图像处理方法,包括:

将待处理面部图输入图像处理模型,获取图像处理模型输出的待处理面部图的目标纹理系数;

基于目标纹理系数和纹理基底生成待处理面部图的目标纹理图;

其中,图像处理模型采用根据第一方面的所述的图像处理模型的训练方法得到。

根据本公开的第三方面,提供了一种图像处理模型的训练装置,包括:

第一获取模块,用于将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;

第一生成模块,用于基于纹理系数和纹理基底生成样本面部图的纹理图;

第二生成模块,用于基于纹理图生成样本面部图的渲染图;

确定模块,用于确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;

构建模块,用于基于第一特征图和第二特征图构建损失函数;

训练模块,用于基于损失函数对图像处理模型的参数进行调整。

根据本公开的第四方面,提供了一种图像处理装置,包括:

第三获取模块,用于将待处理面部图输入图像处理模型,获取图像处理模型输出的待处理面部图的目标纹理系数;

第四生成模块,用于基于目标纹理系数和纹理基底生成待处理面部图的目标纹理图;

其中,图像处理模型采用根据第一方面的所述的图像处理模型的训练方法得到。

根据本公开的第五方面,提供了一种电子设备,包括:

至少一个处理器;以及

与该至少一个处理器通信连接的存储器;其中,

该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行上述第一方面和第二方面所提供的方法。

根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行上述第一方面和第二方面所提供的方法。

根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述第一方面和第二方面所提供的方法。

本公开实施例,能够提高图像处理模型输出的纹理图的辨识度。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开实施例的分布式集群处理场景的示意图;

图2是根据本公开实施例的图像处理模型的训练方法的流程示意图一;

图3是根据本公开实施例的图像处理模型的训练方法的流程示意图二;

图4是根据本公开实施例的图像处理模型的训练框架示意图;

图5是根据本公开实施例的图像处理方法的流程示意图一;

图6是根据本公开实施例的图像处理方法的流程示意图二;

图7为本公开实施例提供的模型训练的场景示意图;

图8为本公开实施例提供的图像处理的场景示意图;

图9是根据本公开实施例的图像处理模型的训练装置的结构示意图;

图10是根据本公开实施例的图像处理装置的结构示意图;

图11是用来实现本公开实施例的图像处理模型的训练方法或图像处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本公开的说明书实施例和权利要求书及上述附图中的术语"第一"、"第二"和"第三"等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语"包括"和"具有"以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1是根据本公开实施例的分布式集群处理场景的示意图,该分布式集群系统为集群系统的一个示例,示例性的描述了可以利用该分布式集群系统进行模型训练,本公开不限于单机或多机上的模型训练,采用分布式的处理可以进一步提高模型训练的精度。如图1所示,在该分布式集群系统中包括多个节点(如服务器集群101、服务器102、服务器集群103、服务器104、服务器105,服务器105还可以连接电子设备,如手机1051及笔记本电脑1052),多个节点间,以及多个节点与连接的电子设备间可以共同执行一个或多个模型训练任务。可选地,该分布式集群系统中的多个节点可以采用数据并行的模型训练方式,则多个节点可以基于相同的训练方式执行模型训练任务,以更好的训练模型;若该分布式集群系统中的多个节点采用的是模型并行的模型训练方式,则多个节点可以基于不同的训练方式执行模型训练任务,以更好的训练模型。可选地,在每一轮模型训练完成后,多个节点之间都可以进行数据交换(如数据同步)。

本公开实施例提供了一种图像处理模型的训练方法,图2是根据本公开实施例的图像处理模型的训练方法的流程示意图,该方法可以应用于图像处理模型的训练装置,例如,该装置可以部署于单机、多机或集群系统中的终端或服务器或其它处理设备执行的情况下,可以实现模型训练等等处理。其中,终端可以为用户设备(UE,User Equipment)、移动设备、个人数字处理(PDA,Personal Digital Assistant)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。在一些可能的实现方式中,该方法可应用于图1所示的集群系统中的任一节点或电子设备(手机或台式机等)中。如图2所示,该图像处理模型的训练方法包括:

S201,将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;

S202,基于纹理系数和纹理基底生成样本面部图的纹理图;

S203,基于纹理图生成样本面部图的渲染图;

S204,确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;

S205,基于第一特征图和第二特征图构建损失函数;

S206,基于损失函数对图像处理模型的参数进行调整。

其中,样本面部图是模型训练采用的样本图像。

其中,样本面部图可以为目标对象的面部图像,其中,目标对象可以为人或动物,样本面部图可以为在线采集的面部图像,比如可以通过网络爬虫技术,在线采集目标对象的面部图像,或者,样本面部图也可以为线下采集的面部图像,或者,样本面部图也可以为实时采集目标对象的面部图像,或者,样本面部图也可以为人工合成的面部图像,等等,本公开实施例对此并不做限制。

其中,图像处理模型包括至少一个网络结构,该至少一个网络结构包括卷积神经网络(Convolutional Neural Networks,CNN)。

其中,纹理基底是单一重建风格的纹理基底,也可以是多个重建风格的纹理基底。这里的重建风格包括但不限于真人风格、卡通风格、搞怪风格等等,本公开对此并不做限制。

其中,纹理基底可以是开源的纹理基底,也可以是经过多轮纹理基底的提取和更新后得到的私有的纹理基底,本公开不对纹理基底的来源做限制。

其中,第一特征图是从样本面部图种提取的面部特征的图,比如,第一特征图为眼睛特征图,或者,第一特征图为鼻子特征图,或者,第一特征图为嘴巴特征图。同理,第二特征图是从标签面部图种提取的面部特征的图,比如,第二特征图为眼睛特征图,或者,第二特征图为鼻子特征图,或者,第二特征图为嘴巴特征图。

需要说明的是,第一特征图和第二特征图所针对的面部区域相同,即第一特征图为眼睛特征图时,第二特征图也为眼睛特征图;第一特征图为嘴巴特征图时,第二特征图也为嘴巴特征图。

在一些实施例,为了提高图像处理模型的精确性,纹理基底的风格与标签渲染图的风格,采用同一种风格。

本公开实施例所述的技术方案,在训练图像处理模型时,确定渲染图的第一特征图和标签渲染图的第二特征图,基于第一特征图和第二特征图构建损失函数,基于损失函数对图像处理模型的参数进行调整,如此,弱化了纹理基底来源不充足或不完全的问题,提高了纹理基底的可迁移性和泛化性,能够提高图像处理模型输出的纹理图的辨识度。

在一些实施例中,确定渲染图的第一特征图和标签渲染图的第二特征图,包括:

将渲染图和标签渲染图输入预先训练的面部识别模型,得到面部识别模型输出的渲染图的第一特征图和标签渲染图的第二特征图。

本公开实施例中,不对面部识别模型具体如何训练进行限定。凡是能够识别图像中的面部特征的模型均可作为面部识别模型。

可以理解,确定渲染图的第一特征图和标签渲染图的第二特征图,并不限于将渲染图和标签渲染图输入面部识别模型这一种实现方式。比如,还可通过特征提取算法分别对渲染图和标签渲染图进行面部特征提取,得到渲染图的第一特征图和标签渲染图的第二特征图。

如此,能够快速确定渲染图的第一特征图和标签渲染图的第二特征图,为后续构建损失函数提供计算基础,从而有助于提高图像处理模型输出的纹理图的辨识度。

本公开实施例提供了一种图像处理模型的训练方法,图3是根据本公开实施例的图像处理模型的训练方法的流程示意图,该方法可以应用于图像处理模型的训练装置,例如,该装置可以部署于单机、多机或集群系统中的终端或服务器或其它处理设备执行的情况下,可以实现模型训练等等处理。其中,终端可以为用户设备、移动设备、个人数字处理、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。在一些可能的实现方式中,该方法可应用于图1所示的集群系统中的任一节点或电子设备(手机或台式机等)中。如图3所示,该图像处理模型的训练方法包括:

S301,将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;

S302,基于纹理系数和纹理基底生成样本面部图的纹理图;

S303,获取图像处理模型输出的样本面部图的外观系数;

S304,根据外观系数和外观基底生成样本面部图的外观模型;

S305,基于纹理图和外观模型生成样本面部图的渲染图;

S306,确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;

S307,基于第一特征图和第二特征图构建损失函数;

S308,基于损失函数对图像处理模型的参数进行调整。

其中,S304位于S303后执行,但S303可位于S302之后执行,也可位于S302之前执行,还可与S302同时执行。

这里,外观系数包括形状(shape)系数,外观模型包括形状模型,外观基底包括形状基底。

本公开实施例中,不对外观基底的维数进行限定。可以理解,外观基底的维数越高,外观模型的精细度越高。

其中,外观基底是单一重建风格的外观基底,也可以是多个重建风格的外观基底。这里的重建风格包括但不限于真人风格、卡通风格、搞怪风格等等,本公开对此并不做限制。

其中,外观基底可以是开源的外观基底,也可以是经过多轮外观基底的提取和更新后得到的私有的外观基底,本公开实施例不对外观基底的来源做限制。

在一些实施例中,为了提高图像处理模型的精度,外观基底的风格与纹理基底的风格,采用同一种风格。

在另一些实施方式中,同一款外观基底对应多种风格的纹理基底。

如此,在训练图像处理模型时,确定渲染图的第一特征图和标签渲染图的第二特征图,基于第一特征图和第二特征图构建损失函数,基于损失函数对图像处理模型的参数进行调整,如此,弱化了纹理基底和外观基底来源不充足或不完全的问题,提高了纹理基底和外观基底的可迁移性和泛化性,不仅能够提高图像处理模型输出的纹理图的辨识度,还能提高标模型输出的外观模型的辨识度,从而进一步提升渲染图的辨识度。

在一些实施例中,基于纹理图生成样本面部图的渲染图,包括:

将纹理图和外观模型输入渲染器,得到渲染器输出的样本面部图的渲染图。

这里,渲染器可以是可微分渲染器。

可以理解,确定渲染图,并不限于将纹理图和外观模型输入渲染器这一种实现方式。比如,还可通过渲染算法对纹理图和外观模型进行渲染,得到渲染图。

如此,能够快速确定渲染图,有助于节省获取渲染图的时间,从而有助于提升训练图像处理模型的速度。

在一些实施例中,基于损失函数对图像处理模型的参数进行调整,包括:

基于损失函数确定样本面部图对应的第一特征图和第二特征图的损失值;

基于损失值逐层调整图像处理模型的各层网络的参数,以使损失值下降至第一预设范围。

这里,图像处理模型包括多层网络,在训练图像处理模型时,需要对多层网络中的至少一层或多层的参数进行调整。

这里,第一预设范围为[0,x],x为大于0的正数。x的值可根据精度需求或速度需求进行设定或调整。

如此,基于单个样本面部图的损失值,对图像处理模型的各层网络的参数进行调整,能够节省图像处理模型的训练时间,提高图像处理模型的训练速度,且能够使得训练好的图像处理模型更好地适应于与样本面部图同类的重建风格。

在一些实施例中,基于损失函数对图像处理模型的参数进行调整,包括:

基于损失函数确定多个样本面部图分别对应的第一特征图和第二特征图的损失值;

基于多个样本面部图分别对应的损失值,确定多个样本面部图的总损失值;

基于总损失值逐层调整图像处理模型的各层网络的参数,以使总损失值下降至第二预设范围。

这里,图像处理模型包括多层网络,在训练图像处理模型时,需要对多层网络中的至少一层或多层的参数进行调整。

这里,第二预设范围为[0,y],y为大于0的正数。y的值可根据精度需求或速度需求进行设定或调整。

如此,基于多个样本面部图的总损失值,对图像处理模型的各层网络的参数进行调整,能够提高图像处理模型的泛化性和可迁移性,且能够使得训练好的图像处理模型适应于各类重建风格。

图4示出了模型训练的架构示意图,如图4所示,将面部图输入图像处理模型,得到纹理系数和外观系数;根据纹理基底和纹理系数生成纹理图;根据外观基底和外观系数生成外观模型;根据纹理图和外观模型生成渲染图;通过预训练好的面部识别模型如人脸识别模型,确定渲染图的第一特征图和标签渲染图的第二特征图;根据第一特征图和第二特征图构建损失函数;根据损失函数对图像处理模型的参数进行调整。

应理解,图4所示的架构图仅仅是示意性的,本领域技术人员可以基于图4的例子进行各种显而易见的变化和/或替换,得到的技术方案仍属于本公开实施例的公开范围。

基于上述图像处理模型的训练方法训练得到的图像处理模型,本公开实施例提供了一种图像处理方法,该图像处理方法应用于电子设备,该电子设备包括但不限于计算机、手机或平板电脑等,本公开不对电子设备的类型进行限定。如图5所示,该图像处理方法包括:

S501,将待处理面部图输入图像处理模型,获取图像处理模型输出的待处理面部图的目标纹理系数;

S502,基于目标纹理系数和纹理基底生成待处理面部图的目标纹理图。

这里,待处理面部图像是需要处理的面部图。

在一些实施方式中,基于目标纹理系数和纹理基底生成待处理面部图的目标纹理图,包括:基于目标纹理系数和纹理基底线性求和生成目标纹理图像。

本公开实施例所述的技术方案,将待处理面部图输入图像处理模型,获取图像处理模型输出的待处理面部图的目标纹理系数;基于目标纹理系数和纹理基底生成目标纹理图,如此,能够提高生成的纹理图的辨识度。

基于上述图像处理模型的训练方法训练得到的图像处理模型,本公开实施例提供了一种图像处理方法,该图像处理方法应用于电子设备,该电子设备包括但不限于计算机、手机或平板电脑等,本公开不对电子设备的类型进行限定。如图6所示,该图像处理方法包括:

S601,将待处理面部图输入图像处理模型,获取图像处理模型输出的该待处理面部图的目标纹理系数;

S602,基于目标纹理系数和纹理基底生成该待处理面部图的目标纹理图;

S603,获取图像处理模型输出的待处理面部图的目标外观系数;

S604,基于目标外观系数和外观基底生成该待处理面部图的目标外观模型;

S605,基于目标纹理图和目标外观模型,得到该待处理面部图的目标渲染图。

其中,S604位于S603后执行,但S603可位于S602之后执行,也可位于S602之前执行,还可与S602同时执行。

本公开实施例所述的技术方案,不仅能够提高待处理面部图的纹理图的辨识度,还能提高待处理面部图的外观模型的辨识度,从而进一步提升渲染图的辨识度。

本公开实施例还提供了一种模型训练的场景示意图,如图7所示,电子设备如云服务器,根据终端发送的训练任务,从多个数据源挖掘符合训练任务的样本面部图和标签面部图。这里,不同终端发送的训练任务,可以是针对不同重建风格的训练任务。不同重建风格的训练任务,所需的样本面部图和标签面部图可能不同。电子设备将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;基于纹理系数和纹理基底生成样本面部图的纹理图;基于纹理图生成样本面部图的渲染图;确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;基于第一特征图和第二特征图构建损失函数;基于损失函数对图像处理模型的参数进行调整;电子设备还负责将训练好的图像处理模型发送至对应的终端,以供终端基于该图像处理模型进行图像处理。

本公开实施例还提供了一种图像处理的场景示意图,如图8所示,电子设备如云服务器,接收终端发送的待处理面部图像,根据终端发送的待处理面部图像以及重建风格,确定纹理图和/或渲染图;向终端返回对应重建风格的纹理图和/或渲染图。

本公开不对终端和电子设备的个数进行限定,实际应用中可包括多个终端、多个电子设备。

应理解,图7和图8所示的场景图仅仅是示意性而非限制性的,本领域技术人员可以基于图7和图8的例子进行各种显而易见的变化和/或替换,得到的技术方案仍属于本公开实施例的公开范围。

需要说明的是,本公开的图像处理模型的训练方法和图像处理方法不是针对某一特定用户的人头模型,并不能反映出某一特定用户的个人信息。

本公开实施例提供了一种图像处理模型的训练装置,如图9所示,该图像处理模型的训练装置可以包括:

第一获取模块910,用于将样本面部图输入图像处理模型,获取图像处理模型输出的样本面部图的纹理系数;

第一生成模块920,用于基于纹理系数和纹理基底生成样本面部图的纹理图;

第二生成模块930,用于基于纹理图生成样本面部图的渲染图;

确定模块940,用于确定渲染图的第一特征图和标签渲染图的第二特征图,标签渲染图是样本面部图的监督渲染图;

构建模块950,用于基于第一特征图和第二特征图构建损失函数;

训练模块960,用于基于损失函数对图像处理模型的参数进行调整。

在一些实施例中,该确定模块940,用于:

将渲染图和标签渲染图输入预先训练的面部识别模型,得到面部识别模型输出的渲染图的第一特征图和标签渲染图的第二特征图。

在一些实施例中,该图像处理模型的训练装置还可包括:

第二获取模块,用于获取图像处理模型输出的样本面部图的外观系数;

第三生成模块,用于根据外观系数和外观基底生成样本面部图的外观模型。

在一些实施例中,该第三生成模块,具体用于:

将纹理图和外观模型输入渲染器,得到渲染器输出的样本面部图的渲染图。

在一些实施例中,该训练模块960,具体用于:

基于损失函数确定样本面部图对应的第一特征图和第二特征图的损失值;

基于损失值逐层调整图像处理模型的各层网络的参数,以使损失值下降至第一预设范围。

在一些实施例中,该训练模块960,具体用于:

基于损失函数确定多个样本面部图分别对应的第一特征图和第二特征图的损失值;

基于多个样本面部图分别对应的损失值,确定多个样本面部图的总损失值;

基于总损失值逐层调整图像处理模型的各层网络的参数,以使总损失值下降至第二预设范围。

本领域技术人员应当理解,本公开实施例的图像处理模型的训练装置中各处理模块的功能,可参照前述的图像处理模型的训练方法的相关描述而理解,本公开实施例的图像处理模型的训练装置中各处理模块,可通过实现本公开实施例所述的功能的模拟电路而实现,也可以通过执行本公开实施例所述的功能的软件在电子设备上的运行而实现。

本公开实施例的图像处理模型的训练装置,能提升图像处理模型输出的纹理图的辨识度。

本公开实施例提供了一种图像处理装置,如图10所示,该图像处理装置可以包括:

第三获取模块1010,用于将待处理面部图输入图像处理模型,获取图像处理模型输出的待处理面部图的目标纹理系数;

第四生成模块1020,用于基于目标纹理系数和纹理基底生成待处理面部图的目标纹理图;

其中,图像处理模型采用上文的图像处理模型的训练方法得到。

在一些实施例中,该图像处理装置还可包括:

第四获取模块,用于获取图像处理模型输出的待处理面部图的目标外观系数;

第五生成模块,用于基于目标外观系数和外观基底生成待处理面部图的目标外观模型;

第六生成模块,用于基于目标纹理图和目标外观模型,得到待处理面部图的目标渲染图。

本领域技术人员应当理解,本公开实施例的图像处理装置中各处理模块的功能,可参照前述的图像处理方法的相关描述而理解,本公开实施例的图像处理装置中各处理模块,可通过实现本公开实施例所述的功能的模拟电路而实现,也可以通过执行本公开实施例所述的功能的软件在电子设备上的运行而实现。

本公开实施例的图像处理装置,能够提高生成的纹理图的辨识度,也能提高生成的渲染图的辨识度。

本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(Read-Only Memory,ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(Random Access Memory,RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM1103通过总线1104彼此相连。输入/输出(Input/Output,I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(Central Processing Unit,CPU)、图形处理单元(Graphics Processing Unit,GPU)、各种专用的人工智能(ArtificialIntelligence,AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(Digital Signal Processor,DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如图像处理模型的训练方法或图像处理方法。例如,在一些实施例中,图像处理模型的训练方法或图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的图像处理模型的训练方法或图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理模型的训练方法或图像处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用标准产品(Application-Specific Standard Products,ASSP)、芯片上系统的系统(System on Chip,SOC)、负载可编程逻辑设备(Complex Programmable Logic Device,CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器、只读存储器、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、快闪存储器、光纤、便捷式紧凑盘只读存储器(Compact Disk Read Only Memory,CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,阴极射线管(Cathode Ray Tube,CRT)或者液晶显示器(Liquid Crystal Display,LCD)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端和服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术分类

06120114693731