由深度可分离卷积生成式对抗神经网络生成人脸的方法

文献发布时间：2024-04-18 19:58:53

技术领域

本发明涉及计算机视觉技术领域，具体涉及一种由深度可分离卷积生成式对抗神经网络生成人脸的方法。

背景技术

在现有技术方法中，主要有生成式对抗网络(GAN)、PixelRNN、VAE、正则流、自回归模型、扩散模型等方法。其中GAN是主要生成图像的方式之一，它由一个生成器和一个判别器组成，生成器负责将随机噪声转化为图像，判别器则用以判断生成的图像真实与否。通过不断训练生成器和判别器，使生成器能够生成接近真实的图像以欺骗判别器。而现有生成式对抗网络生成器的模型参数量通常很大，造成模型迭代时间过长，会耗费过多的计算资源。

发明内容

针对现有技术中的上述不足，本发明提供了一种由深度可分离卷积生成式对抗神经网络生成人脸的方法。

为了达到上述发明目的，本发明采用的技术方案为：

一种由深度可分离卷积生成式对抗神经网络生成人脸的方法，包括以下步骤：

构建包括全连接模块、上采样模块和深度可分离卷积模块的深度可分离卷积生成式对抗网络生成器；

利用深度可分离卷积生成式对抗网络生成器根据服从高斯分布的随机噪声生成人脸图像。

进一步地，所述上采样模块具体包括：

依次连接的第一标准化层、第一上采样层、第一深度可分离卷积单元和第二上采样层。

进一步地，所述第一深度可分离卷积单元具体包括：

第一深度可分离卷积层和第一LeakyReLU激活层。

进一步地，所述深度可分离卷积模块具体包括：

依次连接的第二深度可分离卷积层、第二标准化层、第二LeakyReLU激活层和第二深度可分离卷积单元。

进一步地，所述第二深度可分离卷积单元具体包括：

第三深度可分离卷积层和第一Tanh激活层。

进一步地，所述人脸图像具体包括：

灰色人脸图像和彩色人脸图像。

进一步地，所述利用深度可分离卷积生成式对抗网络生成器根据服从高斯分布的随机噪声生成人脸图像具体包括以下步骤：

将设定维度的服从高斯分布的随机噪声输入全连接模块进行转换，生成第一特征图；

将第一特征图输入上采样模块进行上采样，生成第二特征图；

将第二特征图输入深度可分离卷积模块进行特征提取和激活，生成人脸图像。

本发明具有以下有益效果：

本发明提出一种由深度可分离卷积生成式对抗神经网络生成人脸的方法，通过在深度卷积生成式对抗网络(DCGAN)的基础上加入了深度可分离卷积模块，用来更加高效地生成图像。该深度可分离卷积生成式对抗神经网络可适用于两种情况下的图像生成，分别是Caltech 10000Web Faces数据集的灰度人脸图像和CAS-PEA数据集的彩色图像。该网络由一个生成器和一个判别器构成，其中生成器采用深度可分离卷积模块，判别器维持传统卷积形式。本发明的优点在于：能够相较DCGAN有更加快速的运行速度，以及更加少的模型参数。

附图说明

图1为本发明中一种由深度可分离卷积生成式对抗神经网络生成人脸的方法流程示意图；

图2为本发明中灰色人脸生成器结构示意图；

图3为本发明中彩色人脸生成器结构示意图；

图4为本发明中灰色人脸上采样模块结构示意图；

图5为本发明中彩色人脸上采样模块结构示意图；

图6为本发明中灰色人脸卷积模块结构示意图；

图7为本发明中彩色人脸卷积模块结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1至图7所示，本发明实施例提供了一种由深度可分离卷积生成式对抗神经网络生成人脸的方法，包括以下步骤S1至S2：

S1、构建包括全连接模块、上采样模块和深度可分离卷积模块的深度可分离卷积生成式对抗网络生成器；

在本发明一个可选实施例中，本实施例利用深度可分离卷积构建深度可分离卷积生成式对抗网络的生成器结构。

本实施例构建的深度可分离卷积生成式对抗网络生成器中，全连接模块包括全连接层，其用于将随机噪声转换为初始的第一特征图像。

本实施例构建的深度可分离卷积生成式对抗网络生成器中，上采样模块具体包括：依次连接的第一标准化层、第一上采样层、第一深度可分离卷积单元和第二上采样层。其中第一标准化层用于将初始特征图像进行归一化处理；第一上采样层采用比例因子为2的上采样层，用于将归一化后的特征图像的长宽扩大两倍；第一深度可分离卷积单元具体包括：第一深度可分离卷积层和第一LeakyReLU激活层，其用于将上采样后的特征图像进行深度可分离卷积，并采用斜率为0.2的LeakyReLu激活函数输出激活后的特征图像；第二上采样层采用比例因子为2的上采样层，用于将激活后的特征图像的长宽扩大两倍，得到上采样后的第二特征图像。

本实施例构建的深度可分离卷积生成式对抗网络生成器中，深度可分离卷积模块具体包括：依次连接的第二深度可分离卷积层、第二标准化层、第二LeakyReLU激活层和第二深度可分离卷积单元。其中第二深度可分离卷积层用于将上采样后的第二特征图像进行深度可分离卷积；第二标准化层用于将卷积后的特征图像进行归一化处理；第二LeakyReLU激活层用于采用LeakyReLU激活函数输出激活后的特征图像；第二深度可分离卷积单元具体包括：第三深度可分离卷积层和第一Tanh激活层，其用于将激活后的特征图像进行深度可分离卷积，并采用Tanh激活函数输出激活后的特征图像，从而得到最终的人脸图像。

S2、利用深度可分离卷积生成式对抗网络生成器根据服从高斯分布的随机噪声生成人脸图像。

在本发明的一个可选实施例中，本实施例利用深度可分离卷积生成式对抗网络生成器根据服从高斯分布的随机噪声生成人脸图像具体包括以下步骤：

将设定维度的服从高斯分布的随机噪声输入全连接模块进行转换，生成第一特征图；

将第一特征图输入上采样模块进行上采样，生成第二特征图；

将第二特征图输入深度可分离卷积模块进行特征提取和激活，生成人脸图像。

本实施例中生成的人脸图像具体包括：灰色人脸图像和彩色人脸图像。

具体而言，本实施例生成灰色人脸图像的方法为：

1.全连接模块将1000维服从高斯分布的随机噪声通过全连接层转化为128×80×80的特征图。

2.上采样模块中，1)128×80×80的特征图进入Batchnorm2d进行归一化处理。2)使用一次上采样输出128×160×160的特征图。3)使用深度可分离卷积，并采用斜率为0.2的LeakyReLu激活函数输出128×160×160的特征图。4)使用一次上采样输出128×320×320的特征图。

3.卷积模块中，1)128×320×320的特征图使用深度可分离卷积输出64×320×320的特征图。2)使用Batchnorm2d进行归一化处理。3)使用LeakyReLu激活函数输出。4)使用深度可分离卷积和Tanh激活函数输出1×320×320的灰度图。

本实施例生成彩色人脸图像的方法为：

1.全连接模块将100维服从高斯分布的随机噪声通过全连接层转化为128×160×160的特征图.

2.上采样模块中，1)128×160×160的特征图进入Batchnorm2d进行归一化处理。2)使用一次上采样输出128×320×320的特征图。3)使用深度可分离卷积，并采用斜率为0.2的LeakyReLu激活函数输出128×160×160的特征图。4)使用一次上采样输出128×640×640的特征图。

3.卷积模块中，1)128×640×640的特征图使用深度可分离卷积输出64×640×640的特征图。2)使用Batchnorm2d进行归一化处理。3)使用LeakyReLu激活函数输出。4)使用深度可分离卷积和Tanh激活函数输出3×640×640的彩图。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：电子科技大学;

上一篇：一种防止转炉氧枪升降过程中冲顶事故的控制系统
下一篇：一种果蔬滚刀块成型用切割组件