掌桥专利:专业的专利平台
掌桥专利
首页

图像分割方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 18:46:07


图像分割方法、装置、电子设备及存储介质

技术领域

本发明涉及计算机应用技术领域,尤其涉及一种图像分割方法、装置、电子设备及存储介质。

背景技术

目前,通过训练神经网络模型对图像进行分割的方法已经得到了广泛应用。但在医疗领域,通过训练神经网络模型对多器官图像进行分割的方法具有一定的局限性。例如,在医学图像中存在某一器官分割标签不足,所有的器官都没有呈现在一张图上等训练样本参差不齐等问题。

相关技术中,采用神经网络所获取的分割模型精度较差,所获取的目标分割图像精准度较低。

发明内容

本发明提供了一种图像分割方法、装置、电子设备及存储介质,以解决所获取的目标分割图像精准度较低的技术问题。

根据本发明的一方面,提供了一种图像分割方法,其中,该方法包括:

获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象;

基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;

其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象。

根据本发明的另一方面,提供了一种图像分割装置,其中,该装置包括:

图像获取模块,用于获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象;

图像分割模块,用于基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;

其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象。

根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的图像分割方法。

根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的图像分割方法。

本发明实施例的技术方案,通过获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象,在包括多个待分割对象的所述待分割图像中,能够指示出当前的待分割对象,为模型对待分割对象的精准分割提供了依据;基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象,采用半监督学习的方式能够基于较少的有标签数据训练得到精准度更高的图像分割模型,该技术方案能够适用于各种应用场景下的图像分割,且能够提高图像分割的精确度。

应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一提供的一种图像分割方法的流程图;

图2是根据本发明实施例二提供的一种图像分割方法的流程图;

图3是根据本发明实施例提供的一种判别模型的训练过程示意图;

图4是根据本发明实施例提供的一种生成模型的训练过程示意图;

图5是根据本发明实施例三提供的一种图像分割装置的结构示意图;

图6是实现本发明实施例的图像分割方法的电子设备的结构示意图;

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1为本发明实施例一提供了一种图像分割方法的流程图,本实施例可适用于图像处理情况,该方法可以由图像分割装置来执行,该图像分割装置可以采用硬件和/或软件的形式实现,该图像分割装置可配置于计算机中。如图1所示,该方法包括:

S110、获取待分割图像与所述待分割图像对应的第一指示信息。

其中,所述第一指示信息用于指示所述待分割图像的待分割对象对应的类别,所述待分割图像包括多个类别的待分割对象。所述待分割图像可以理解为待分割的图像。在本发明实施例中,所述待分割图像可以根据场景需求设定,在此不做具体限定。

示例性地,在医学场景中,所述待分割图像可以是待分割的多器官图像或肿瘤图像等;在交通场景中,所述待分割图像可以是待分割的多交通工具图像;在居家场景中,所述待分割图像可以是待分割的多家具图像。示例性的,在医学场景中,所述待分割图像可以是待分割的头颈部器官图像、腹部多器官图像、肝胰肾多器官图像以及肿瘤图像等。在交通场景中,所述待分割图像可以是待分割的高速多交通工具图像或十字路口多交通工具图像等。在居家场景中,所述待分割图像可以是待分割的客厅多家具图像、厨房多家具图像以及卧室多家具图像等。

其中,所述第一指示信息可以理解为用于区分所述待分割图像的多个待分割对象的信息。在本发明实施例中,所述第一指示信息可以用于指示所述待分割图像的待分割对象对应的类别,所述待分割图像包括多个类别的待分割对象。可选的,在医学场景中,所述第一指示信息可以是区分头颈部器官图像中的眼、脑或颈等待分割对象的类别的信息,或者区分肝胰肾多器官图像中的肝、肾或胰等待分割对象的类别的信息。在交通场景中,所述第一指示信息可以是区分高速多交通工具图像中的摩托车、货车或轿车等待分割对象的类别的信息。在居家场景中,所述第一指示信息可以是区分厨房多家具图像中碗、筷或勺等待分割对象的类别的信息。可以理解的是,每一种第一指示信息可以指示一类待分割对象,其中,一类待分割对象可以包括一个或多个待分割对象。示例性的,在所述第一指示信息为指示肝胰肾多器官图像中肾的信息时,所述第一指示信息指示的待分割对象可以是两个。

可选的,所述第一指示信息为所述待分割对象对应的预设编码信息,或者,所述第一指示信息为由所述待分割对象对应的预设编码信息与所述待分割图像拼接得到的信息。在本发明实施例中,可以基于不同所述第一指示信息与所述待分割图像中不同所述待分割对象的指示关系,通过所述图像分割模型对所述待分割图像进行分割,可以提高图像分割的精准性,和适用性。

其中,所述预设编码信息可以理解为预先设置的按照一定方式编码后得到的用于区分类别不同待分割对象的信息。在本发明实施例中,所述预设编码信息可以根据场景需求预设,在此不做具体限定。具体的,可选的,所述预设编码信息包括基于独热编码的方式生成的编码信息。

其中,所述独热编码是使用N位状态寄存器来对N个状态进行编码的方式。在本发明实施例中,基于独热编码的方式生成的编码信息,可以解决分类器不好处理属性数据的问题,起到了扩充特征的作用。可选的,所述预设编码信息可以是第一编码信息、第二编码信息以及第三编码信息等。示例性的,在医学场景的肝胰肾多器官图像中,基于第一编码信息可用于指示待分割器官肝、基于第二编码信息可用于指示待分割器官胰、基于第三编码信息可用于指示待分割器官肾等。在交通场景的高速多交通工具图像中,基于第一编码信息可用于指示摩托车类别的待分割对象、基于第二编码信息可用于指示货车类别的待分割对象、基于第三编码信息可用于指示轿车类别的待分割对象等。

其中,所述待分割对象可以理解为所述待分割图像中待分割的对象,或者,可以理解为所述待分割图像中待分割出来的感兴趣区域。在本发明实施例中,所述待分割对象可以根据场景需求设定,在此不做具体限定。可选的,所述待分割对象可以是所述待分割图像中待分割的器官或肿瘤等。示例性的,在医学场景的肝胰肾多器官图像中,所述待分割对象可以是肝胰肾多器官图像中的肝、胰或肾等。在居家场景的卧室多家具图像中,所述待分割对象可以是卧室多家具图像中的床、衣柜或灯等。

S120、基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像。

其中,所述图像分割模型可以理解为用于分割所述待分割图像的人工智能模型。所述目标分割图像可以理解为针对所述待分割图像和所述第一指示信息,通过所述图像分割模型所确定的图像。可选的,所述目标分割图像可以是所述待分割图像中分割出所述待分割对象的图像。可以理解的是,所述目标分割图像可以是标注出待分割对象的所述待分割图像,或者,是将所述待分割图像中包含有待分割对象的图像区域分割出来得到的图像,即,所述待分割图像的部分图像。

可选的,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到。

其中,所述样本分割图像可以理解为用于训练所述图像分割模型的样本图像。在本发明实施例中,所述样本分割图像可以根据场景需求设定,在此不做具体限定。可选的,所述样本分割图像可以包括一个或多个样本分割对象的训练图像。

其中,所述第二指示信息可以理解为用于指示所述样本分割图像的样本分割对象的信息。在本发明实施例中,所述第二指示信息可以是与所述第一指示信息同类型的信息。在本发明实施例中,与所述样本分割图像对应的第二指示信息,可以对各个所述样本分割对象准确的进行指示。而且,针对包括多个样本分割对象的样本分割图像,可以结合不同的第二指示信息作为训练样本,尤其适合样本量稀缺的训练场景。能够通过较少的样本分割图像训练得到精准度较高的图像分割模型。

其中,所述样本分割对象可以理解为在所述样本分割图像中,与所述第二指示信息对应的对象。在本发明实施例中,所述第二指示信息与所述待分割对象的指示关系可以根据场景需求预设,在此不做具体限定。

可选的,所述初始分割模型为生成对抗模型,所述生成对抗模型包括生成模型和判别模型,所述图像分割模型基于如下方式训练得到:

获取半监督样本集,其中,所述半监督样本集包括第一数量的有标签的样本分割图像以及第二数量的无标签的样本分割图像;

确定与所述样本分割图像对应的第二指示信息,其中,所述第二指示信息用于指示所述样本分割图像的样本分割对象,所述标签为与所述第二指示信息对应的期望分割图像;

基于所述半监督样本集中的样本分割图像以及与所述样本分割图像对应的第二指示信息,对生成对抗模型训练,将训练完成的生成模型作为所述图像分割模型。

其中,所述半监督样本集可以理解为采用半监督学习的方式对初始分割模型进行训练,所需要的样本集。可选的,所述半监督样本集可以包括第一数量的有标签的样本分割图像以及第二数量的无标签的样本分割图像。

其中,所述第一数量可以理解为所述半监督样本集中,有标签的样本分割图像的数量。可选的,所述第一数量和所述第二数量可以是千量集或万量级等。示例性的,所述第一数量可以是1千、5千或1万等。所述第二数量可以理解为所述半监督样本集中,无标签的样本分割图像的数量。在本发明实施例中,所述第一数量和所述第二数量可以根据场景需求预设,在此不做具体限定。所述第一数量和所述第二数量可以相同,也可以不同。

其中,所述标签可以理解为与所述第二指示信息对应的期望分割图像。所述期望分割图像可以理解为针对所述样本分割图像对应的第二指示信息,期望所述初始分割模型输出的图像。考虑到实际应用场景中,例如在医学场景中,可能存在对样本的标签的获取难度较大的情况,可选地,所述第一数量可以小于第二数量。

其中,所述生成对抗模型可以理解为由生成模型和判别模型组成的网络模型。所述生成模型可以理解为用于生成与所述样本分割图像对应的分割图像的模型。所述判别模型可以理解为判断基于所述生成模型生成的与所述样本分割图像相似的图像是否为真实的所述样本分割图像。在本发明实施例中,可以基于所述第一模型输出图像、与所述第一模型输出图像对应的第二指示信息以及与所述第二模型输出图像对应的期望分割图像训练得到所述判别模型。

具体的,基于所述生成对抗模型中生成模型和判别模型的交替迭代,对所述生成模型的模型参数进行调整,以得到所述图像分割模型。

可选的,所述基于所述半监督样本集中样本分割图像以及与所述样本分割图像对应的第二指示信息,对生成对抗模型训练,将训练完成的生成模型作为所述图像分割模型,包括:

将所述半监督样本集中有标签的样本分割图像以及与所述样本分割图像对应的第二指示信息,输入至所述生成对抗模型中的生成模型中,得到第一模型输出图像;

根据所述第一模型输出图像、所述样本分割图像以及与所述样本分割图像对应的期望分割图像,对所述生成模型的模型参数进行调整,以得到初始分割模型;

将所述半监督样本集中无标签的样本分割图像以及与所述样本分割图像对应的第二指示信息输入至所述初始分割模型中,得到第二模型输出图像;

基于训练后的判别模型对所述第一模型输出图像和所述第二模型输出图像的判别结果对所述生成模型的模型参数进行调整,其中,所述判别模型基于所述第一模型输出图像、与所述第一模型输出图像对应的第二指示信息以及与所述第二模型输出图像对应的期望分割图像训练得到;

在检测达到训练结束条件的情况下,将训练完成的生成模型作为所述图像分割模型。

其中,所述第一模型输出图像可以理解为基于有标签的样本分割图像以及与所述样本分割图像对应的第二指示信息,通过生成模型所生成的图像。可以理解的是,所述第一模型输出图像可以是将所述有标签的样本分割图像输入生成模型后,由生成模型输出的分割出第二指示信息对应的样本分割对象的图像。类似地,所述第二模型输出图像可以理解为基于无标签的样本分割图像以及与所述样本分割图像对应的第二指示信息,通过所述初始分割模型所生成的图像。

其中,所述判别结果可以理解为针对通过判别模型判别所述第一模型输出图像和所述第二模型输出图像为真或为假的概率。换言之,所述判别结果可以是判断输入判别模型的图像为模型输出图像或期望分割图像的结果。

其中,所述模型参数可以理解为所述生成模型的配置参数。所述模型参数一般包括层与层之间的权重和偏移值。

其中,所述训练结束条件可以理解为可以结束训练所述生成对抗模型的条件。在本发明实施例中,所述训练结束条件可以根据场景需求预设,在此不做具体限定。可选的,所述训练结束条件可以是所述生成模型的模型参数不再朝同一方向变化,即模型参数收敛;或者,达到预设迭代次数,又或者,判别模型对生成模型的输出图像的判别错误率达到预设值等。

具体的,生成对抗模型的训练方式可以是:

1、训练生成对抗模型的判别模型。先基于第二指示信息、与第二指示信息对应的期望分割图像以及高斯噪声图像,对生成对抗模型的判别模型进行训练。具体地,将所述第二指示信息输入至所述生成对抗模型中的判别模型的第一子模型中,得到初始网络参数,基于初始网络参数更新所述判别模型的第二子模型的网络参数。

2、训练生成对抗模型的生成模型。具体地,先将所述第二指示信息输入至所述生成对抗模型中的生成模型得第一子模型中,得到初始网络参数,基于初始网络参数作为所述生成模型得第二子模型中注意力机制的网络参数;然后,将样本分割图像输入生成模型的第二子模型,得到生成模型输出的模型分割图像。

进一步地,在将样本分割图像输入生成模型的第二子模型的过程中,先采用有标签的样本分割图像输入生成模型的第二子模型,得到第一模型输出图像。然后,将无标签的样本分割图像输入生成模型,得到第二模型输出图像。

3、基于判别结果调整生成模型的模型参数。具体地,可以将第二型输出图像以及与第二型输出图像对应的期望分割图像输入判别模型,得到第二型输出图像对应的判别结果;基于判别结果调整生成模型的模型参数。并可以基于判别结果继续对判别模型进行进一步地训练,得到训练完成的判别模型。进一步地,还可以基于新训练完成的判别模型的判别结果进一步调整生成模型的模型参数。

最后,可以在检测达到模型参数收敛的情况下,将训练完成的生成模型作为所述图像分割模型。

在本发明实施例中,基于所述半监督样本集中样本分割图像以及与所述样本分割图像对应的第二指示信息,对生成对抗模型训练,将训练完成的生成模型作为所述图像分割模型,解决了样本集标签不足的问题,在基于半监督学习的方式训练生成对抗模型的同时,提高了所得到的所述图像分割模型的精准度。

本发明实施例的技术方案,通过获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象,在包括多个待分割对象的所述待分割图像中,能够指示出当前的待分割对象,为模型对待分割对象的精准分割提供了依据;基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象,采用半监督学习的方式能够基于较少的有标签数据训练得到精准度更高的图像分割模型,该技术方案能够适用于各种应用场景下的图像分割,且能够提高图像分割的精确度。

实施例二

图2为本发明实施例二提供的一种图像分割方法的流程图,本实施例是针对上述实施例中所述基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像进行细化。

如图2所示,该方法包括:

S210、获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象。

S220、将所述第一指示信息输入至预先训练的图像分割模型的第一子模型,得到所述图像分割模型的第二子模型的初始网络参数,其中,所述初始网络参数至少包括初始权重和偏移值。

在本发明实施例中,图像分割模型可以包括第一子模型和第二子模型。

其中,所述第一子模型可以理解为基于所述第一指示信息,得到所述图像分割模型的第二子模型的初始网络参数的模型。

其中,所述初始网络参数可以理解为在所述第二子模型训练之前,各个节点的初始权重和偏移值的初始值。所述初始权重可以理解为初始网络参数中,权重的初始值。所述偏移值可以理解为程序的逻辑地址与段首的差值。

可选的,所述第一子模型包括多个卷积层,其中,至少两个卷积层基于非线性激活函数层连接,所述第二子模型中包括注意力机制;

所述基于所述初始网络参数更新所述第二子模型的网络参数,包括:

基于所述初始网络参数用于更新所述注意力机制的网络参数。

其中,所述卷积层可以理解为提取输入的所述第一指示信息的不同特征的网络层。所述非线性激活函数层可以理解为增加所述图像分割模型的非线性的网络层。所述注意力机制可以理解为可以使所述第二子模型专注于输入的第一指示信息所对应的待分割对象即,选择特定的输入的机制。在本发明实施例中,所述注意力机制可以在计算能力有限情况下,对资源进行分配,将计算资源分配给更重要的任务,解决信息超载问题。以提高计算速度,提高获取目标分割图像的效率。

S230、基于所述初始网络参数更新所述第二子模型的网络参数,并将所述待分割图像输入至网络参数更新后的所述第二子模型中,得到与所述待分割对象对应的目标分割图像。

其中,所述第二子模型可以理解为基于所述待分割图像和所述初始网络参数,得到与所述待分割对象对应的目标分割图像的模型。

具体的,将所述第一指示信息输入至预先训练的图像分割模型的第一子模型,得到所述图像分割模型的第二子模型的初始权重和偏移值;基于初始权重和偏移值更新所述第二子模型的网络参数,并将所述待分割图像输入至网络参数更新后的所述第二子模型中,得到与所述待分割对象对应的目标分割图像。

本发明实施例的技术方案,通过将所述第一指示信息输入至预先训练的图像分割模型的第一子模型,得到所述图像分割模型的第二子模型的初始网络参数,其中,所述初始网络参数至少包括初始权重和偏移值;基于所述初始网络参数更新所述第二子模型的网络参数,并将所述待分割图像输入至网络参数更新后的所述第二子模型中,得到与所述待分割对象对应的目标分割图像。通过对待分割图像与所述待分割图像对应的第一指示信息的处理,精准获取了目标分割图像。

可选的,图3是根据本发明实施例提供的一种辨别模型的训练过程示意图;如图3所示,判别模型的训练过程可以是:

1.将第二指示信息输入判别模型的第一子模型,得到第二子模型初始网络参数。基于独热编码的方式将输入器官编号进行任务编码,生成m维独热编码,即第二指示信息;再将第二指示信息输入判别模型的第一子模型,得到n层卷积层的weight(权重)和bias(偏移值),即初始网络参数。

2.将得到的初始网络参数作为判别模型的第二子模型的初始网络参数。

3.基于图像标签(期望分割图像)和高斯噪声图(伪标签图像)对第二子模型进行训练。将图像标签和高斯噪声输入判别模型的第二子模型,得到0或1的判别结果,其中,0可以表征判别结果为伪造图像,1可以表征判别结果为真实图像。

可选的,图4是根据本发明实施例提供的一种生成模型的训练过程示意图;如图4所示,生成模型的训练过程可以是:

1.将第二指示信息输入生成模型的第一子模型,得到第二子模型的初始网络参数。将第二指示信息输入送入生成模型的第一子模型,得到生成模型的n个卷积层的weight(权重)和bias(偏移值),即初始网络参数。

2.将得到的初始网络参数作为生成模型的第二子模型中的注意力机制的初始网络参数。

3.基于有标签的样本分割图像、无标签的样本图像以及判别模型对第二子模型进行训练,得到模型输出图像。将有标签的样本分割图像和无标签的样本图像输入生成模型的第二子模型,得到模型输出图像。在此过程中,结合判别模型的判别结果对第二子模型的模型参数进行调整,以得到训练好的生成模型,即,图像分割模型。

4.将待分割图像和第一指示信息输入训练好的图像分割模型,得到目标分割图像。

本技术方案提出一种基于目标识别的多任务半监督分割方法,可用于单张切片和多张切片的多类别待分割对象分割。与相关的多类别待分割对象分割技术相比,本发明的技术方案不需要提供所有待分割对象的全部标签,也不需要所有待分割对象的标签全部在一张图片上。除了可以更灵活地解决多类别待分割对象分割的标签不足问题,也更利于解决大数据集上的多类别待分割对象分割问题。

实施例三

图5为本发明实施例三提供的一种图像分割装置的结构示意图。如图5所示,该装置包括:图像获取模块310和图像分割模块320。

其中,图像获取模块310,用于获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象;图像分割模块320,用于基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象。

本发明实施例的技术方案,通过获取待分割图像与所述待分割图像对应的第一指示信息,其中,所述第一指示信息用于指示所述待分割图像的待分割对象,在包括多个待分割对象的所述待分割图像中,能够指示出当前的待分割对象,为模型对待分割对象的精准分割提供了依据;基于所述待分割图像、所述第一指示信息以及预先训练的图像分割模型,得到与所述待分割对象对应的目标分割图像;其中,所述图像分割模型基于样本分割图像以及与所述样本分割图像对应的第二指示信息,采用半监督学习的方式对初始分割模型训练得到,所述第二指示信息用于指示所述样本分割图像的样本分割对象,采用半监督学习的方式能够基于较少的有标签数据训练得到精准度更高的图像分割模型,该技术方案能够适用于各种应用场景下的图像分割,且能够提高图像分割的精确度。

可选的,所述图像分割模型包括第一子模型和第二子模型;

图像分割模块320,用于:

将所述第一指示信息输入至预先训练的图像分割模型的第一子模型,得到所述图像分割模型的第二子模型的初始网络参数,其中,所述初始网络参数至少包括初始权重和偏移值;

基于所述初始网络参数更新所述第二子模型的网络参数,并将所述待分割图像输入至网络参数更新后的所述第二子模型中,得到与所述待分割对象对应的目标分割图像。

可选的,所述第一指示信息为所述待分割对象对应的预设编码信息,或者,所述第一指示信息为由所述待分割对象对应的预设编码信息与所述待分割图像拼接得到的信息。

可选的,所述预设编码信息包括基于独热编码的方式生成的编码信息。

可选的,所述第一子模型包括多个卷积层,其中,至少两个卷积层基于非线性激活函数层连接。

可选的,所述初始分割模型为生成对抗模型,所述生成对抗模型包括生成模型和判别模型;所述图像分割模型可基于模型训练模块训练得到,其中,所述模型训练模块包括:样本集获取子模块、指示信息确定子模块和模型训练子模块。

其中,所述样本集获取子模块,用于获取半监督样本集,其中,所述半监督样本集包括第一数量的有标签的样本分割图像以及第二数量的无标签的样本分割图像;

所述指示信息确定子模块,用于确定与所述样本分割图像对应的第二指示信息,其中,所述第二指示信息用于指示所述样本分割图像的样本分割对象,所述标签为与所述第二指示信息对应的期望分割图像;

所述模型训练子模块,用于基于所述半监督样本集中的样本分割图像以及与所述样本分割图像对应的第二指示信息,对生成对抗模型训练,将训练完成的生成模型作为所述图像分割模型。

可选的,所述模型训练子模块,用于:

将所述半监督样本集中有标签的样本分割图像以及与所述样本分割图像对应的第二指示信息,输入至所述生成对抗模型中的生成模型中,得到第一模型输出图像;

根据所述第一模型输出图像、所述样本分割图像以及与所述样本分割图像对应的期望分割图像,对所述生成模型的模型参数进行调整,以得到初始分割模型;

将所述半监督样本集中无标签的样本分割图像以及与所述样本分割图像对应的第二指示信息输入至所述初始分割模型中,得到第二模型输出图像;

基于训练后的判别模型对所述第一模型输出图像和所述第二模型输出图像的判别结果对所述生成模型的模型参数进行调整,其中,所述判别模型基于所述第一模型输出图像、与所述第一模型输出图像对应的第二指示信息以及与所述第二模型输出图像对应的期望分割图像训练得到;

在检测达到训练结束条件的情况下,将训练完成的生成模型作为所述图像分割模型。

本发明实施例所提供的图像分割装置可执行本发明任意实施例所提供的图像分割方法,具备执行方法相应的功能模块和有益效果。

实施例四

图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如图像分割方法。

在一些实施例中,图像分割方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的图像分割方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像分割方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

技术分类

06120115686806