掌桥专利:专业的专利平台
掌桥专利
首页

图像分割方法、装置、电子设备及计算机可读存储介质

文献发布时间:2023-06-19 11:21:00


图像分割方法、装置、电子设备及计算机可读存储介质

技术领域

本发明涉及图像处理技术领域,尤其涉及基于改进型YOLOv3模型的图像分割方法、装置、电子设备及计算机可读存储介质。

背景技术

在深度学习兴起之后,出现了使用卷积神经网络进行图像处理的技术,如U-Net模型(如图1所示)、YOLOv3模型(如图2所示)等。U-Net模型属于小型的图像分割网络,由于U-Net模型深度不够,如果通过增加下采样模块的个数来提升模型深度,又会有梯度消失的风险,进而增加训练难度,因而U-Net模型一般运用于医学图像分割(因为医学图像语义较为简单、结构较为固定),换言之,U-Net模型适合比较简单的图像分割任务,而YOLOv3模型一般运用于目标检测。针对复杂的图像分割任务,目前还没有有效的解决方案。

发明内容

有鉴于此,有必要提供一种基于改进型YOLOv3模型的图像分割方法、装置、电子设备及计算机可读存储介质,其可对复杂的图像进行图像分割处理。

本发明一实施方式提供一种基于改进型YOLOv3模型的图像分割方法,所述方法包括:

对预设YOLOv3模型进行U形扩展,得到一包含U形采样单元的改进型YOLOv3模型,其中所述U形采样单元包括下采样网络及上采样网络,所述下采样网络与所述上采样网络之间进行跳层连接,所述下采样网络由所述预设YOLOv3模型的Darknet53网络构成,所述上采样网络由所述预设YOLOv3模型中的多个上采样模块串接而成;

利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,得到图像分割模型;及

利用所述图像分割模型对待处理图像进行图像分割处理。

优选地,所述下采样网络与所述上采样网络之间还连接有一卷积-标准化线性模块,所述卷积-标准化线性模块包括五个串接的卷积-标准化线性单元,所述卷积-标准化线性单元由一卷积层、一批标准化层及一泄露修正线性层组成。

优选地,所述下采样网络所包含的残差模块数量与所述上采样网络所包含的上采样模块数量相等。

优选地,所述下采样网络包括一卷积-标准化线性单元及N个残差模块,所述上采样网络包括N个上采样模块,所述下采样网络的卷积-标准化线性单元的输出端跳层连接至第N上采样模块,第一残差模块至第N-1残差模块的输出端分别跳层连接至第N-1上采样模块至第一上采样模块,第N残差模块通过所述卷积-标准化线性模块连接至所述第一上采样模块。

优选地,所述利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,包括:

将所述预设训练样本集的样本图像划分为训练集及测试集;

利用所述训练集对所述改进型YOLOv3模型进行训练;

利用所述测试集对训练完成的改进型YOLOv3模型进行测试,并根据每一测试结果统计得到一模型分割准确率;

判断所述模型分割准确率是否大于预设阈值;

若所述模型分割准确率大于所述预设阈值,则将训练完成的改进型YOLOv3模型作为所述图像分割模型。

优选地,所述将所述预设训练样本集的样本图像划分为训练集及测试集之前,包括:

对所述预设训练样本集的每一样本图像进行随机预处理及归一化处理;

其中所述预处理包括以下一种处理方式:对样本图像进行垂直翻转处理,对样本图像进行水平翻转处理,对样本图像进行垂直与水平翻转处理,对样本图像不进行翻转处理。

优选地,所述改进型YOLOv3模型的损失函数为二进制交叉熵损失函数。

本发明一实施方式提供一种基于改进型YOLOv3模型的图像分割装置,所述装置包括:

扩展模块,用于对预设YOLOv3模型进行U形扩展,得到一包含U形采样单元的改进型YOLOv3模型,其中所述U形采样单元包括下采样网络及上采样网络,所述下采样网络与所述上采样网络之间进行跳层连接,所述下采样网络由所述预设YOLOv3模型的Darknet53网络构成,所述上采样网络由所述预设YOLOv3模型中的多个上采样模块串接而成;

训练模块,用于利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,得到图像分割模型;及

处理模块,用于利用所述图像分割模型对待处理图像进行图像分割处理。

本发明一实施方式提供一种电子设备,包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的基于改进型YOLOv3模型的图像分割方法。

本发明一实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述程序被处理器执行时实现上述的基于改进型YOLOv3模型的图像分割方法。

本申请的上述实施例提供的基于改进型YOLOv3模型的图像分割方法、装置、电子设备及计算机可读存储介质,通过采用包含残差结构的Darknet53作为下采样网络,采样网络深度大,使得模型表达能力强且整个模型易于训练,进而可适用于复杂的图像分割场景,图像分割效果比传统的U-Net模型更优越。

附图说明

图1是现有技术中用于图像分割的U-Net模型的结构示意图;

图2是现有技术中YOLOv3模型的结构示意图;

图3A是本发明一实施方式的图像分割模型的结构示意图;

图3B是本发明一实施方式的卷积-标准化线性单元(CBL)的结构示意图;

图3C是本发明一实施方式的残差单元(Res_unit)的结构示意图;

图3D是本发明一实施方式的残差模块(Resn)的结构示意图;

图3E是本发明一实施方式的上采样模块(UP)的结构示意图;

图4是本发明一实施方式的基于改进型YOLOv3模型的图像分割方法的流程图;

图5是本发明一实施方式的基于改进型YOLOv3模型的图像分割装置的功能模块图;

图6是本发明一实施方式的电子设备的功能模块图。

主要元件符号说明

具体实施方式

如下具体实施方式将结合上述附图进一步说明本发明。

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

进一步需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

请参阅图3A,其示出了可以应用本申请的图像分割方法或图像分割装置的一些实施例的图像分割模型。

如图3A所示,图像分割模型11的基础结构来自于图2所示的YOLOv3模型,通过参考图1的U-Net模型对图2所示的YOLOv3模型进行U形扩展,得到一包含U形采样结构的改进型YOLOv3模型,最后对该包含U形采样结构的改进型的YOLOv3模型进行训练,得到图像分割模型11。图像分割模型11可以像U-Net模型一样用于图像分割任务,且通过使用YOLOv3模型中的Darknet53网络作为下采样部分,可以实现解决复杂的图像分割问题。

由于图像分割模型11的结构模块来自于YOLOv3模型,且使用了U-Net模型的U形结构设计,下述将图像分割模型11简称为YUnet模型。

在一实施方式中,所述YUnet模型包括下采样网络111及上采样网络112,下采样网络111可以由所述YOLOv3模型的Darknet53网络构成,上采样网络112可以由所述YOLOv3模型中的多个上采样模块(图3A中的“UP 1121”)串接而成。如图3A所示,下采样网络111包括一卷积-标准化线性单元(图3A中的“CBL 1111”)及五个残差模块(图3A中的Res1、Res2、Res8、Res8、Res4),其中,Res1表示包含1个残差单元(Res_unit),Res2表示包含2个残差单元、Res8表示包含8个残差单元、Res4表示包含4个残差单元。下采样网络111还通过一卷积-标准化线性模块(图3A中的“CBL*5 1112”)连接至上采样网络112,即下采样网络111的最后一个残差模块Res4通过CBL*5连接至上采样网络112的第一个上采样模块,其中CBL*5表示为五个串接的CBL,即所述卷积-标准化线性模块包含五个串接的卷积-标准化线性单元。上采样网络112的输出还连接有一CBL及卷积层转换单元(图3A中的“Conv 1113”)来调整输出特征映射的厚度,CBL可以先将厚度变为n1,Conv可以将厚度变为n,模型最后的输出即为[416,416,n]。其中,n1和n的取值可根据实际需求进行设定与调整。例如对于两类的分割,CBL可以先将厚度变为2,Conv再将厚度变为1,即模型最后的输出为[416,416,1]。

如图3A所示,下采样网络111中的CBL可以连接至所述YUnet模型的输入端,Conv可以连接至所述YUnet模型的输出端。所述下采样网络111与所述上采样网络112之间还进行了跳层连接,即所述Darknet53网络中的CBL的输出还跳层连接至所述上采样网络112中的最后一个UP,所述Darknet53网络中的残差模块Res1的输出还跳层连接至所述上采样网络112中的倒数第二个UP,所述Darknet53网络中的残差模块Res2的输出还跳层连接至所述上采样网络112中的倒数第三个UP,所述Darknet53网络中的残差模块Res8(第一Res8)的输出还跳层连接至所述上采样网络112中的第二个UP,所述Darknet53网络中的残差模块Res8(第二Res8)的输出还跳层连接至所述上采样网络112中的第一个UP。

如图3B所示,所述卷积-标准化线性单元(CBL)可以由一2D卷积层(ConvolutionalLayer)、一批标准化层(Batch Normalization Layer)及一泄露修正线性层(Leaky ReluLayer)组成,当卷积层的kernel=3,stride=1,pad=1时高宽不变,当kernel=1,stride=1,pad=0时高宽也不变,当卷积层的kernel=3,stride=2,pad=1时高宽减半。如图3C所示,残差单元(Res_unit)为一残差结构,先经过的第一个CBL的输出通道数为输入通道数的一半,且kernel=1,stride=1,pad=0使输出特征映射的高宽不变,第二个CBL的输出通道数为输入通道数的一倍,且kernel=3,stride=1,pad=1使输出特征映射的高宽不变,然后再加上模块的输入构成残差结构,残差单元的总体效果是特征映射的高宽和厚度都不变。如图3D所示,残差模块(Resn,n为正整数),其输入特征映射先经过一个kernel=3,stride=2,pad=1的CBL模块,效果为特征映射的高宽减半,同时通过设置其中卷积层的卷积核个数将输入特征映射的厚度增加一倍,然后再经过n个Res_unit,而该n个Res_unit模块不改变特征映射高宽也不改变厚度,残差模块的总体效果为将特征映射的高宽减半厚度加倍。如图3E所示,上采样模块(UP 1121),其两个输入(采样输入通道与非采样输入通道)的厚度相同,采样输入通道会先进入一个CBL将输入的特征映射的厚度减半,之后再经过一个上采样操作将特征映射的高宽加倍(相当于一个使用线性插值的图像放大操作)然后与非采样通道的输入特征映射进行厚度维度的拼接(concat),拼接结果再经过一个CBL*5模块,进行厚度调整使输出特征映射的厚度为输入特征映射厚度的一半,在图3E中非采样输入通道用粗线表示,上采样模块的总体效果为特征映射的厚度会减半,高宽对齐为非采样输入特征映射的高宽。

举例而言,输入至所述YUnet模型的图像是高宽为416*416的RGB图像,而一般的RGB图像的厚度为3,即输入图像的高、宽、厚可以表示为[416,416,3],进入下采样网络111(Darknet53网络),Darknet53网络与图2所示的YOLOv3中的Darknet53网络相同,通过使用Darknet53网络来提取图像特征,其中Darknet53网络中的CBL将特征映射的厚度变为32(也可以根据实际需求将特征映射的厚度变为其他值,比如变为16或者64等),高宽不变,即得到416*416*32的特征映射;Darknet53网络中的每个残差模块使得特征映射的高宽减半、厚度加倍,如图3A所示共有5个残差模块,每个残差模块得到的特征映射分别为208*208*64、104*104*128、52*52*256、26*26*512、13*13*1024,Darknet53网络中的最后的一个残差模块(Res4)的输出经过一个CBL*5的模块,该CBL*5的模块不会改变特征映射的高宽,会使得厚度减半,即CBL*5输出为13*13*512,CBL*5的输出进入上采样网络112,上采样网络112中的每个上采样模块会将特征映射的厚度减半,高宽对齐至非采样输入的高宽,即恢复到高宽为416*416,如图3A所示共5个UP,每个UP得到的特征映射分别为26*26*256、52*52*128、104*104*64、208*208*32、416*416*16,最后再使用一CBL和一Conv调整最后一个UP所输出的特征映射的厚度,比如,CBL可以先将厚度变为2,得到特征映射为416*416*2,Conv将厚度变为n,n的值可以根据实际使用需求进行确定,得到特征映射为416*416*n,即所述YUnet模型的输出为416*416*n的特征分割图像。比如,对于两类的分割(分割为前景和背景),n取值为1,即所述YUnet模型输出为416*416*1的分割图像。

可以理解的,可以根据实际的使用需求对上采样网络112所包含的上采样模块的数量及下采样网络111所包含的残差模块数量进行调整,上采样网络112所包含的上采样模块的数量优选与下采样网络111所包含的残差模块数量相等。比如,图3A示出的上采样网络112包含5个上采样模块,下采样网络111包含5个残差模块,在本申请的其他实施方式中,下采样网络111可以包含4个或6个残差模块,对应的上采样网络112可以包括4个或6个上采样模块。

可以理解的,还可以根据实际使用需求对下采样网络111中包含的残差模块中n的数量进行变形,比如全部改为Res1模块或者Res4等。

图4是本发明基于改进型YOLOv3模型的图像分割方法一实施例的步骤流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。其中,该基于改进型YOLOv3模型的图像分割方法可以应用于图5所示的基于改进型YOLOv3模型的图像分割装置100。

参阅图4所示,所述基于改进型YOLOv3模型的图像分割方法具体可以包括以下步骤。

步骤S401、对预设YOLOv3模型进行U形扩展,得到一包含U形采样单元的改进型YOLOv3模型。

在一实施方式中,所述预设YOLOv3模型可以是图2所示的YOLOv3模型。通过对所述预设YOLOv3模型进行U形扩展,得到包含U形采样单元的改进型YOLOv3模型,该U形采样单元的结构与图1所示的U-Net模型的U形结构相似。

在一实施方式中,该包含U形采样单元的改进型YOLOv3模型的具体结构可以如图3A所示。所述U形采样单元包括下采样网络111及上采样网络112。所述下采样网络111可以由所述预设YOLOv3模型的Darknet53网络构成,所述上采样网络112可以由所述预设YOLOv3模型中的多个上采样模块串接而成,所述下采样网络111所包含的残差模块数量优选与所述上采样网络112所包含的上采样模块数量相等。所述下采样网络111与所述上采样网络112之间还进行跳层连接,比如,所述下采样网络111包含一CBL及N个残差模块。所述上采样网络112包含N个上采样模块,N的值可以根据实际需求进行设定,在此不作限定,N优选为正整数。所述下采样网络111与所述上采样网络112之间还进行跳层连接。所述下采样网络111的CBL的输出端跳层连接至上采样网络112的第N上采样模块,所述下采样网络111的第一残差模块至第N-1残差模块的输出端分别跳层连接至上采样网络112的第N-1上采样模块至第一上采样模块。

在一实施方式中,所述下采样网络111与所述上采样网络112之间还连接有一卷积-标准化线性模块(CBL*5),即下采样网络111的第N残差模块通过CBL*5连接至上采样网络112的第一上采样模块。

步骤S403、利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,得到图像分割模型。

在一实施方式中,所示预设训练样本集可以根据模型训练需求进行搜集构建或者采用现有技术中所构建的图像样本库,所示预设训练样本集的样本图像的数量同样可以根据实际模型训练需求进行调整,在此不作限定。在进行模型训练时,将所示预设训练样本集的每一样本图像依次输入至所述改进型YOLOv3模型进行训练,训练完成后可以得到所述图像分割模型。

在一实施方式中,可以先将预设训练样本集的样本图像按照预设比例随机划分为训练集及测试集,比如80%的样本图像为训练集,20%的样本图像为测试集;再利用所述训练集对所述改进型YOLOv3模型进行训练,利用所述测试集对训练完成的改进型YOLOv3模型进行测试,并可根据每一测试图像的测试结果统计得到一模型分割准确率;最后判断所述模型分割准确率是否大于预设阈值,若所述模型分割准确率大于所述预设阈值,表明训练完成的改进型YOLOv3模型的图像分割效果满足预设要求,可以将训练完成的改进型YOLOv3模型作为所述图像分割模型。若所述模型分割准确率不大于所述预设阈值,表明训练完成的改进型YOLOv3模型的图像分割效果不能满足预设要求,可以通过调整改进型YOLOv3模型的参数,并对调整后的改进型YOLOv3模型进行重新训练与测试,直至得到所述模型分割准确率大于所述预设阈值。

在一实施方式中,利用所述测试集对训练完成的改进型YOLOv3模型进行测试,还可根据每一测试图像的测试结果统计得到一模型分割平均误差,再判断所述模型分割平均误差是否小于预设误差,若所述模型分割平均误差小于所述预设误差,表明训练完成的改进型YOLOv3模型的图像分割效果满足预设要求,可以将训练完成的改进型YOLOv3模型作为所述图像分割模型;若所述模型分割平均误差不小于所述预设误差,则可以通过调整所述改进型YOLOv3模型的参数再进行训练与测试。

在一实施方式中,为了进一步提高模型的训练效率及训练后的模型分割效果,可以在进行训练集与测试集的划分之前,对所述预设训练样本集的每一样本图像进行随机预处理与归一化处理,也可以在训练集与测试集的划分之后,对训练集与测试集中的每一样本图像进行随机预处理与归一化处理。对样本图像进行归一化处理可以使得后续图像数据处理更方便,且可使得后续模型训练过程中收敛加快。所述预处理包括以下任一种处理方式:对样本图像进行垂直翻转处理,对样本图像进行水平翻转处理,对样本图像进行垂直与水平翻转处理,对样本图像不进行翻转处理。即对于所述预设训练样本集的一样本图像,随机选取一种处理方式对其进行处理,比如所述预设训练样本集的一样本图像I1可能进行了垂直翻转处理,一样本图像I2可能进行了垂直与水平翻转处理,一样本图像I3可能未进行翻转处理。

举例而言,所述预设训练样本集为portrait数据集,该portrait数据集共2000个图像样本,可以将其中的1700例用于训练,300例用于测试,图像样本的图像大小为800*600,由于模型输入的图像大小为416*416,可以将portrait数据集的图像样本拉伸到832*832,然后缩放到416*416,再对图像样本进行随机预处理,并使用均值方差对图像样本进行归一化处理。

在一实施方式中,在对所述改进型YOLOv3模型进行模型训练时,损失函数可以是与图1所示的U-Net模型相同的损失函数,即为现有的二进制交叉熵损失函数,在此不再详述。训练过程中可以使用mini-batch随机梯度下降法+冲量(Momentum)方式进行训练,可以提高模型训练速度,学习率可以为0.01,Momentum可以为0.9,权重衰减(weight_decay)可以为0.0005。学习率衰减因子(Factor)可以为0.5,Patience(没有进步的训练轮数)可以为5。模型训练的Batch Size(一次训练所选取的样本数)可以为8,Epoch(时期)为100,一个时期可以定位为:所有训练样本的一个正向传递和一个反向传递,模型训练过程中可以使用4块GPU(比如型号为1080Ti)进行加速。

在一实施方式中,经过训练得到的图像分割模型能够适用于复杂的图像分割任务,图像分割效果比U-Net模型好,由于YOLO

步骤S405、利用所述图像分割模型对待处理图像进行图像分割处理。

在一实施方式中,当训练得到图像分割模型时,可以利用所述图像分割模型对待处理图像进行图像分割处理。具体地,可以将待处理图像输入至所述图像分割模型,所述图像分割模型的输出可以得到所述待处理图像的图像分割结果。

本实施例提供的方法,通过对预设YOLOv3模型进行U形扩展,得到一包含U形采样单元的改进型YOLOv3模型,而后利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,得到图像分割模型,然后利用所述图像分割模型对待处理图像进行图像分割处理,通过采用包含残差结构的Darknet53作为下采样网络,采样网络深度大,使得模型表达能力强且整个模型易于训练,进而可适用于复杂的图像分割场景,图像分割效果比传统的U-Net模型更优越。

基于上述实施例公开的基于改进型YOLOv3模型的图像分割方法,请参阅图5,本发明还对应公开了一种基于改进型YOLOv3模型的图像分割装置100。

基于改进型YOLOv3模型的图像分割装置100可以包括扩展模块101、训练模块102、处理模块103及预处理模块104。

扩展模块101用于对预设YOLOv3模型进行U形扩展,得到一包含U形采样单元的改进型YOLOv3模型。其中,所述U形采样单元包括下采样网络111及上采样网络112,所述下采样网络111与所述上采样网络112之间进行跳层连接,所述下采样网络111可以由图2所示的YOLOv3模型的Darknet53网络构成,所述上采样网络112可以由图2所示的YOLOv3模型中的多个上采样模块串接而成。

训练模块102用于利用预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,得到图像分割模型。

处理模块103用于利用所述图像分割模型对待处理图像进行图像分割处理。

在本实施例的一些可选的实现方式中,所述下采样网络111与所述上采样网络112之间还连接有一卷积-标准化线性模块(CBL*5),所述卷积-标准化线性模块包括五个串接的卷积-标准化线性单元(CBL),所述卷积-标准化线性单元(CBL)可以由一2D卷积层(Convolutional Layer)、一批标准化层(Batch Normalization Layer)及一泄露修正线性层(Leaky Relu Layer)组成。

在本实施例的一些可选的实现方式中,所述下采样网络111所包含的残差模块数量与所述上采样网络112所包含的上采样模块数量相等。

在本实施例的一些可选的实现方式中,所述下采样网络111包括一卷积-标准化线性单元及N个残差模块,所述上采样网络112包括N个上采样模块,所述下采样网络111的卷积-标准化线性单元(CBL)的输出端跳层连接至第N上采样模块,第一残差模块至第N-1残差模块的输出端分别跳层连接至第N-1上采样模块至第一上采样模块,第N残差模块通过所述卷积-标准化线性模块(CBL*5)连接至所述第一上采样模块。

在本实施例的一些可选的实现方式中,训练模块102利用所述预设训练样本集的样本图像对所述改进型YOLOv3模型进行训练,包括:将所述预设训练样本集的样本图像划分为训练集及测试集;利用所述训练集对所述改进型YOLOv3模型进行训练;利用所述测试集对训练完成的改进型YOLOv3模型进行测试,并根据每一测试结果统计得到一模型分割准确率;判断所述模型分割准确率是否大于预设阈值;若所述模型分割准确率大于所述预设阈值,则将训练完成的改进型YOLOv3模型作为所述图像分割模型。

在本实施例的一些可选的实现方式中,训练模块102在将所述预设训练样本集的样本图像划分为训练集及测试集之前,预处理模块104对所述预设训练样本集的每一样本图像进行随机预处理及归一化处理;其中所述预处理包括以下一种处理方式:对样本图像进行垂直翻转处理,对样本图像进行水平翻转处理,对样本图像进行垂直与水平翻转处理,对样本图像不进行翻转处理。

在本实施例的一些可选的实现方式中,所述改进型YOLOv3模型的损失函数为二进制交叉熵损失函数。

需要说明的是,基于改进型YOLOv3模型的图像分割装置100可以是芯片,组件或模块,基于改进型YOLOv3模型的图像分割装置100可以包括处理器和存储器,扩展模块101、训练模块102、处理模块103和预处理模块104等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中可以包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或多个,通过调整内核参数来实现本申请的以上已描述的技术效果。

存储器可能包括计算机可读存储介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

基于上述实施例公开的基于改进型YOLOv3模型的图像分割方法,请参阅图6,本发明还对应公开了一种电子设备200。

电子设备200可以包括存储器10、处理器20、存储在所述存储器10中并可在所述处理器20上运行的计算机程序30。所述处理器20执行计算机程序30时可以实现上述基于改进型YOLOv3模型的图像分割方法实施例中的步骤,例如图4所示的步骤S401~S405。或者,所述处理器20执行所述计算机程序30时实现基于改进型YOLOv3模型的图像分割装置100实施例中各模块的功能,例如图5中的模块101~104。

计算机程序30可以被分割成一个或多个模块,所述一个或者多个模块被存储在存储器10中,并由处理器20执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序在电子设备200中的执行过程。

可以理解的,所述示意图仅是电子设备200的示例,并不构成对电子设备200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备200还可以包括网络接入设备(图未示)、显示设备(图未示)、通信总线(图未示)等。

处理器20可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者处理器20也可以是任何常规的处理器等。

存储器10可用于存储计算机程序30和/或模块,处理器20通过运行或执行存储在存储器10内的计算机程序30和/或模块,以及调用存储在存储器10内的数据,实现电子设备200的各种功能。存储器10可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上各方法实施例提供的基于改进型YOLOv3模型的图像分割方法。

本发明一实施例提供了一种计算机程序产品,当在数据处理设备上执行时,使得数据处理设备实现以上各方法实施例提供的基于改进型YOLOv3模型的图像分割方法。

上述基于改进型YOLOv3模型的图像分割方法、装置、电子设备及计算机可读存储介质,通过采用包含残差结构的Darknet53作为下采样网络,采样网络深度大,使得模型表达能力强且整个模型易于训练,进而可适用于复杂的图像分割场景,图像分割效果比传统的U-Net模型更优越。

本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备、计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

对本领域的技术人员来说,可以根据本发明的发明方案和发明构思结合生产的实际需要做出其他相应的改变或调整,而这些改变和调整都应属于本发明所公开的范围。

相关技术
  • 图像分割的方法和装置、电子设备及计算机可读存储介质
  • 图像分割方法、装置、电子设备及计算机可读存储介质
技术分类

06120112898976