掌桥专利:专业的专利平台
掌桥专利
首页

图像分割方法、装置、设备及存储介质

文献发布时间:2023-06-19 13:46:35


图像分割方法、装置、设备及存储介质

技术领域

本申请实施例涉及人工智能技术领域,特别涉及一种图像分割方法、装置、设备及存储介质。

背景技术

随着人工智能技术的发展,开发人员尝试通过深度学习技术来实现器官内血管的分割任务。

以肝脏内血管分割任务为例,相关技术基于带高质量血管标注的肝脏图像对图像分割模型进行训练,以得到可用于对肝脏内血管进行分割处理的图像分割模型。

然而,由于存在带高质量血管标注的肝脏图像普遍缺乏的问题,相关技术仅仅可以依靠少量带高质量血管标注的肝脏图像对图像分割模型进行训练,导致图像分割模型过拟合,分割结果精度低。

发明内容

本申请实施例提供了一种图像分割方法、装置、设备及存储介质,能够通过教师网络基于带高质量标注的图像样本和带低质量标注的图像样本辅助学生网络进行训练,实现可以在确保学生网络的分割性能的情况下,避免因缺少图像样本而造成的学生网络过拟合问题。所述技术方案如下:

根据本申请实施例的一个方面,提供了一种图像分割方法,所述方法包括:

获取第一样本数据和第二样本数据;其中,所述第一样本数据包括至少一个第一图像样本和所述第一图像样本的标注数据,所述第二样本数据包括至少一个第二图像样本和所述第二图像样本的标注数据,所述第一图像样本的标注数据的质量高于所述第二图像样本的标注数据的质量;

通过图像分割模型的学生网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的学生分割结果和所述第二图像样本的学生分割结果,以及通过所述图像分割模型的教师网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的教师分割结果和所述第二图像样本的教师分割结果;

根据所述第一图像样本的学生分割结果和所述第一图像样本的标注数据,确定监督损失;

根据所述第一图像样本的学生分割结果和所述第一图像样本的教师分割结果之间的差异信息,以及所述第二图像样本的学生分割结果和所述第二图像样本的教师分割结果之间的差异信息,确定一致性损失;

基于所述监督损失和所述一致性损失,对所述学生网络进行训练,以通过训练得到的所述学生网络对目标图像进行分割处理。

根据本申请实施例的一个方面,提供了一种图像分割装置,所述装置包括:

样本数据获取模块,用于获取第一样本数据和第二样本数据;其中,所述第一样本数据包括至少一个第一图像样本和所述第一图像样本的标注数据,所述第二样本数据包括至少一个第二图像样本和所述第二图像样本的标注数据,所述第一图像样本的标注数据的质量高于所述第二图像样本的标注数据的质量;

分割结果获取模块,用于通过图像分割模型的学生网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的学生分割结果和所述第二图像样本的学生分割结果,以及通过所述图像分割模型的教师网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的教师分割结果和所述第二图像样本的教师分割结果;

监督损失确定模块,用于根据所述第一图像样本的学生分割结果和所述第一图像样本的标注数据,确定监督损失;

一致性损失确定模块,用于根据所述第一图像样本的学生分割结果和所述第一图像样本的教师分割结果之间的差异信息,以及所述第二图像样本的学生分割结果和所述第二图像样本的教师分割结果之间的差异信息,确定一致性损失;

学生网络训练模块,用于基于所述监督损失和所述一致性损失,对所述学生网络进行训练,以通过训练得到的所述学生网络对目标图像进行分割处理。

根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述图像分割方法。

根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述图像分割方法。

根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图像分割方法。

本申请实施例提供的技术方案可以包括如下有益效果:

通过将教师网络对带高质量标注的图像样本的预测结果和学生网络对带高质量标注的图像样本的结果进行一致性比对,以及将教师网络对带低质量标注的图像样本的预测结果和学生网络对带低质量标注的图像样本的预测结果进行一致性比对,使得教师网络可以帮助学生网络同时从带高质量标注的图像样本和带低质量标注的图像样本中学习到有用的图像信息,从而可以避免因图像样本缺乏而导致的网络过拟合问题,进而确保了学生网络的分割精度。

另外,由于是通过教师网络帮忙学生网络从带低质量标注的图像样本中学习到有用的图像信息,而不是直接通过学生网络从带低质量标注的图像样本中学习到有用的图像信息,从而可以降低带低质量标注的图像样本对学生网络的影响,进而确保了学生网络的分割性能。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的图像分割方法的流程图;

图2是本申请一个实施例提供的图像分割模型的训练方法的流程图;

图3是本申请另一个实施例提供的图像分割方法的示意图;

图4是本申请一个实施例提供的原始数据集的示意图;

图5是本申请一个实施例提供的最终的3D输出血管分割图的示意图;

图6是本申请一个实施例提供的定量比较结果的示意图;

图7是本申请一个实施例提供的图像分割装置的框图;

图8是本申请另一个实施例提供的图像分割装置的框图;

图9是本申请一个实施例提供的计算机设备的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

本申请实施例提供的技术方案涉及人工智能的机器学习技术,利用机器学习技术训练图像分割模型(如图像分割模型中的学生网络),进而通过训练好的学生网络实现图像的分割任务。可选地,本申请实施例提供技术方案适用于任何难以获取大量带高质量标注的图像样本的分割任务中,诸如医学图像分割任务、器官内血管分割任务等。

示例性地,本申请实施例提供的技术方案,适用于获取任何器官(诸如肝脏、肾脏、心脏等)内血管的分割任务所需的图像分割模型。例如,通过采用本申请实施例提供的技术方案,基于带高质量血管标注的肝脏图像样本和带低质量血管标注的肝脏图像样本,可获得用于分割肝脏内血管的图像分割模型。本申请实施例提供的技术方案能够基于带高质量标注的图像样本和带低质量标注的图像样本对图像分割模型进行训练,实现在确保图像分割模型的分割精度的情况下,避免因图像样本缺乏而导致的图像分割模型的过拟合。

本申请实施例提供的方法,各步骤的执行主体可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备。该计算机设备可以是诸如PC(PersonalComputer,个人计算机)、平板电脑、智能手机、可穿戴设备、智能机器人等终端;也可以是服务器。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。

请参考图1,其示出了本申请一个实施例提供的图像分割方法的流程图,该方法各步骤的执行主体可以是上文介绍的计算机设备,该方法可以包括如下几个步骤(101~105)。

步骤101,获取第一样本数据和第二样本数据;其中,第一样本数据包括至少一个第一图像样本和第一图像样本的标注数据,第二样本数据包括至少一个第二图像样本和第二图像样本的标注数据,第一图像样本的标注数据的质量高于第二图像样本的标注数据的质量。

在本申请实施例中,图像分割模型用于对图像进行分割处理。例如,通过图像分割模型可以将图像中的目标对象标注出来,也可以直接将目标对象分割出来形成只包括目标对象的图像。可选地,该目标对象可以根据分割任务而设定。例如,在医疗领域中,该目标对象可以是诸如人体腔内图像中的目标器官、目标器官图像中的血管等;在自动驾驶领域中,该目标对象可以是诸如图像中的动物、图像中的人等,本申请实施例在此不作限定。

在本申请实施例中,第一图像样本和第二图像样本都用于对图像分割模型进行训练。第一图像样本和第二图像样本可以是分割任务所需的带上述目标对象的CT(ComputedTomography,电子计算机断层扫描)图像,图像、图片、照片等。其中,第一图像样本和第二图像样本中都带有目标对象的标注数据,该标注数据用于标识目标对象。例如,第一图像样本中目标对象对应的各个像素点都带有用于表示属于目标对象的标注数据。可选地,第一图像样本对应的目标对象的标注数据的质量高于第二图像样本中对应的目标对象的标注数据的质量。示例性地,第一图像样本的标注数据为高质量标注数据,也即第一图像样本的标注数据对应的标注错误率极低,第二图像样本的标注数据为低质量标注数据,也即第二图像样本的标注数据中存在一定的错误标注。以肝脏内血管的标注数据为例,肝脏内血管的标注数据的质量很大程度上取决于医疗从业者的经验和技能,且医疗从业者必须手动对肝脏图像中的血管进行标注,且由于CT图中固有噪声、血管的病理变化、对比度差和复杂的血管几何形态,因此高质量的肝脏内血管的标注数据非常有限,也即上述的第一图像样本的标注数据有限,而低质量的肝脏内血管的标注数据却非常丰富,也即上述的第二图像样本的标注数据较丰富。

在一个示例中,第一样本数据和第二样本数据的获取过程可以如下:获取第一原始数据集和第二原始数据集;其中,第一原始数据集包括至少一个第一原始图像和第一原始图像的标注数据,第二原始数据集包括至少一个第二原始图像和第二原始图像的标注数据;分别对第一原始图像和第二原始图像进行预处理,得到处理后的第一原始图像和处理后的第二原始图像;其中,预处理包括以下至少一项:裁剪处理、清晰度调调整处理、归一化处理;获取第一原始图像和第二原始图像分别对应的目标对象概率图,目标对象概率图用于表示目标对象的分布;对处理后的第一原始图像和第一原始图像对应的目标对象概率图进行拼接处理,得到第一图像样本,以及对处理后的第二原始图像和第二原始图像对应的目标对象概率图进行拼接处理,得到第二图像样本。

其中,第一原始数据集用于获取上述第一图像样本和第一图像样本的标注数据,第二原始数据集用于获取上述第二图像样本和第二图像样本的标注数据。第一原始数据集和第二原始数据集都可以提供目标对象的标注数据,第一原始数据集提供的目标对象的标注数据的质量高于第二原始数据集提供的目标对象的标注数据的质量,也即第一原始图像的标注数据的质量高于第二原始图像的标注数据的质量。

目标对象概率图是指目标对象的分布概率图。例如,以肝脏内的血管分布概率图为例,该血管分布概率图可用于表示肝脏内的血管分布。目标对象概率图可用于为图像分割模型提供关于目标对象的辅助信息,诸如位置、数量、边缘等信息。目标对象概率图可采用多尺度目标对象(如血管)增强滤波网络获得。

示例性地,原始图像的预处理过程可以如下:

1、首先对原始图像进行遮罩并裁剪出目标区域。例如,在肝脏内血管的分割任务中,该目标区域可以是肝脏区域。由于第一原始数据集可以提供精细的目标区域的分割掩膜,因此可以直接从第一原始图像中提取出目标区域。由于第二原始数据集无法提目标区域的分割掩膜或者无法提供精细的目标区域的分割掩膜,可以通过训练好的H-DenseUNet(混合密集连接的U型结构网络)来获取第二原始数据集对应的目标区域的分割掩膜,然后基于获取的目标区域的分割掩膜从第二原始图像中提取出目标区域。其中,第一原始图像的目标区域与第二原始图像的目标区域相同,目标区域中包括目标对象。基于目标区域对原始图像进行裁剪,在裁剪的过程中,确保裁剪后的原始图像的尺度大于目标区域的最大边缘尺度。可选地,可以根据实际需求(如图像分割模型对图像样本的尺度要求)将原始图像裁剪至设定的像素大小。在本申请实施例中,在原始图像为3D的CT图像的轴面向2D切片的情况下,由于轴面向2D切片的厚度变化很大(例如1mm-4mm不等),因此不采用任何的重采样操作,以避免插值引起的潜在人为噪声的增加。

2、对裁剪后的原始图像进行清晰度调整,以能够更清楚地观察到目标区域的结构以及其中的目标对象。示例性地。在原始图像为3D的CT图像的轴面向2D切片的情况下,可以在获取裁剪后的第一原始图像和第二原始图像之后,根据放射学专家的经验,将裁剪后的第一原始图像和第二原始图像的亨氏单位HU值截断至[-100,250]的范围内。

3、还可以对经过上述两个步骤处理后的第一原始图像和第二原始图像进行归一化处理。示例性地,以肝脏对应的原始图像为例,可以对肝脏对应的原始图像进行均值为0,方差为1的归一化处理,使肝脏对应的原始图像具有相同的体素分布,以消除每个设备在采集肝脏对应的原始图像时的体素分布差异。

在一个示例中,图像分割模型会对高HU值的区域过于敏感,但高HU值的区域不一定为目标对象对应的区域,从而会影响图像分割模型对目标对象的识别。可选地,可以结合目标对象概率图为图像分割模型提供关于目标对象的辅助信息,其具体方法可以如下:通过计算Hessian矩阵(黑塞矩阵)的特征向量,获取处理后的原始图像与目标对象之间的相似度,检测出目标对象的边缘信息,并可消除3D的CT图像中面状及球状结构,从而潜在的目标对象对应的区域能够被赋予较高的概率,使得处理后的原始图像中目标对象对应的区域表现为更高亮的区域,进而获取该处理后的原始图像对应的目标对象概率图。最后将处理后的原始图像与其对应的目标对象概率图直接在图像分割模型的输入空间中合并在一起,即可获取图像分割模型的图像样本。本实施例通过同时考虑原始图像和其对应的目标对象概率图中的信息,使得图像分割模型可以更鲁棒地感知目标对象信号,从而提高图像分割模型的分割性能。

示例性地,以肝脏内血管的分割任务为例,参考图2,原始数据集包括有限的高质量标注数据(对应第一样本数据)和丰富的低质量嘈杂标注数据(对应第二样本数据)。其中,原始图像201(为CT图像)在经过预处理后得到处理后的原始图像202,将处理后的原始图像202和其对应的血管概率图203进行拼接处理即可得到图像样本。

步骤102,通过图像分割模型的学生网络分别对第一图像样本和第二图像样本进行分割处理,得到第一图像样本的学生分割结果和第二图像样本的学生分割结果,以及通过图像分割模型的教师网络分别对第一图像样本和第二图像样本进行分割处理,得到第一图像样本的教师分割结果和第二图像样本的教师分割结果。

可选地,图像分割模型包括学生网络和教师网络。学生网络为目标训练网络,教师网络用于辅助学生网络训练。可选地,教师网络可以是经过预训练的,相比于学生网络,教师网络具有更优越的分割性能。在图像分割模型的训练过程中,学生网络可以学习到教师网络的优越的分割性能,以及通过教师网络的辅助训练,学生网络可以同时从第一图像样本和第二图像样本中学习到有用的图像信息,以及从第一图像样本的标注数据和第二图像样本的标注数据中学习到有用的标注信息。

可选地,学生网络和教师网络都可以采用U-Net(U型结构网络)架构。U-Net可用于对图像样本中的每个像素点进行分类,可将不同类别的像素点用不同的通道标出。学生网络的网络参数和教师网络的网络参数不相同。可选地,学生网络的网络参数和教师网络的网络参数之间的关系满足EMA(Exponential Moving Average,指数移动平均)策略对应的关系。

第一图像样本的学生分割结果是指学生网络对第一图像样本进行分割处理得到的分割结果,该分割结果用于表示学生网络对第一图像样本中各个像素点的类别的预测结果,各个像素点的类别的预测结果可用预测标注数据(如预测概率值)进行表示,该预测标注数据可用于表示该像素点为某一类别的可能性。第二图像样本的学生分割结果用于表示学生网络对第二图像样本中各个像素点的类别的预测结果。第一图像样本的教师分割结果用于表示教师网络对第一图像样本中各个像素点的类别的预测结果。第二图像样本的教师分割结果用于表示教师网络对第二图像样本中各个像素点的类别的预测结果。

示例性地,学生网络和教师网络对图像样本的分割过程相同,下面以第一图像样本的学生分割结果的获取过程进行介绍,其具体内容可以如下:

在获取第一图像样本之后,学生网络对第一图像样本进行下采样处理,也即利用连续的卷积池化层提取第一图像样本中的特征信息,并逐渐将特征信息映射至高维,得到第一图像样本对应的丰富特征信息。然后再对高维特征信息进行反卷积处理,将高维特征信息映射成低维特征信息,在该过程中,会将反卷积过程中的特征信息与下采样过程中具有相同维度的特征信息进行融合处理,以增强学生网络的分割精度,直到得到与第一图像样本具有相同维度的输出图像,该输出图像可以为只包括目标对象的图像。可选地,第一图像样本的学生分割结果可以为输出图像前的特征图,该特征图可用于表示学生网络对第一图像样本中各个像素点的类别的预测结果。

可选地,学生网络和教师网络还可以采用DenseNet、ResNet等,本申请实施例在此不作限定。

示例性地,参考图2,图像分割模型包括学生网络204和教师网络205。通过学生网络204对第一图像样本进行分割处理,得到第一图像样本的学生分割结果206,通过学生网络204对第二图像样本进行分割处理,得到第二图像样本的学生分割结果207,通过教师网络205对第一图像样本进行分割处理,得到第一图像样本的教师分割结果208,通过教师网络205对第二图像样本进行分割处理,得到第二图像样本的教师分割结果209。

步骤103,根据第一图像样本的学生分割结果和第一图像样本的标注数据,确定监督损失。

在本申请实施例中,监督损失用于学生网络从第一图像样本的标注数据中学习到有用信息(即针对目标对象的标注数据)。可选地,监督损失可以包括以下至少一项:交叉熵损失、Dice损失、边界损失和焦点损失,可以根据实际需求监督损失的内容进行选择。示例性地,将交叉熵损失、Dice损失、边界损失和焦点损失的加权和设置为监督损失。其中,各个损失的权重参数可以分别设置为0.5、0.5、1和0.5。

在一个示例中,监督损失的获取过程可以如下:通过交叉熵损失函数对第一图像样本的学生分割结果和第一图像样本的标注数据进行计算处理,确定第一子监督损失;通过Dice损失函数对第一图像样本的学生分割结果和第一图像样本的标注数据进行计算处理,确定第二子监督损失;通过边界损失函数对第一图像样本的学生分割结果和第一图像样本的标注数据进行计算处理,确定第三子监督损失;通过焦点损失函数对第一图像样本的学生分割结果和第一图像样本的标注数据进行计算处理,确定第四子监督损失;对第一子监督损失、第二子监督损失、第三子监督损失和第四子监督损失进行加权求和,确定监督损失。

其中,第一子监督损失(即交叉熵损失)用于表示第一图像样本的学生分割结果和第一图像样本的标注数据之间的距离,通过最小化第一子监督损失,可拉近第一图像样本的学生分割结果和第一图像样本的标注数据之间的距离,进而使得学生网络学到第一图像样本的标注数据中的有用信息。第二子监督损失(即Dice损失)用于表示第一图像样本的学生分割结果和第一图像样本的标注数据之间的重叠度,通过最小化第二子监督损失,可以提高第一图像样本的学生分割结果和第一图像样本的标注数据之间的重叠度。第三子监督损失(即焦点损失)可以用于在第一图像样本的学生分割结果和第一图像样本的标注数据中减少易分类像素点的权重参数和增加难分类像素点的权重参数,以及同时拉近第一图像样本的学生分割结果和第一图像样本的标注数据之间的距离。第四子监督损失(即边界损失)可用于表示第一图像样本的学生分割结果中目标对象的分割边界与第一图像样本的标注数据中目标对象的分割边界之间的距离,通过最小化第四子监督损失,可以拉近第一图像样本的学生分割结果中目标对象的分割边界与第一图像样本的标注数据中目标对象的分割边界之间的距离。

步骤104,根据第一图像样本的学生分割结果和第一图像样本的教师分割结果之间的差异信息,以及第二图像样本的学生分割结果和第二图像样本的教师分割结果之间的差异信息,确定一致性损失。

一致性损失可表示第一图像样本的学生分割结果和第一图像样本的教师分割结果之间的差异程度,以及第二图像样本的学生分割结果和第二图像样本的教师分割结果之间的差异程度,通过最小化一致性损失,可以降低学生网络和教师网络之间的差异程度,使得学生网络从教师网络中学习到有用信息。例如,教师网络从第一图像样本的标注数据和第二图像样本的标注数据中学习到标注信息,再通过最小化一致性损失,可以使得学生网络基于教师网络间接地从第一图像样本的标注数据和第二图像样本的标注数据中学习到标注信息。如此可以使得学生网络在可以学到额外的图像信息和标注信息时,而不受第二图像样本的标注数据的影响。

在一个示例中,一致性损失的获取过程可以如下:通过均方差函数对第一图像样本的学生分割结果和第一图像样本的教师分割结果之间的差异信息进行计算处理,确定第一子一致性损失;通过均方差函数对第二图像样本的学生分割结果和第二图像样本的教师分割结果之间的差异信息进行计算处理,确定第二子一致性损失;对第一子一致性损失和第二子一致性损失进行加权求和,确定一致性损失。

步骤105,基于监督损失和一致性损失,对学生网络进行训练,以通过训练得到的学生网络对目标图像进行分割处理。

可选地,通过最小化监督损失和一致性损失,来调整图像分割模型的参数,以完成图像分割模型的训练,也即通过调整图像分割模型的学生网络的网络参数和教师网络的网路参数,以完成图像分割模型的训练。

在一个示例中,学生网络和教师网络的训练过程可以如下:基于监督损失和一致性损失对学生网络当前的网络参数进行调整处理,得到调整后的学生网络;获取教师网络当前的网络参数和调整后的学生网络的网络参数之间的参数差异信息;对参数差异信息进行衰减计算处理,得到衰减后的参数差异信息;将教师网络当前的网络参数替换成衰减后的参数差异信息和调整后的学生网络的网络参数的和,得到调整后的教师网络。

示例性地,可以利用EMA策略基于学生网络的网络参数更新教师网络的网络参数。假设在第t次迭代的过程中,调整后的学生网络的网络参数表示为θ

θ′

其中,α是EMA策略对应的衰减率,θ′

可选地,对于相同的图像样本,可以在教师网络获取该图像样本之前,对该图像样本添加扰动。例如,参考图2,在教师网络205对应的图像样本中添加随机噪声ξ(如错误的标注数据),学生网络204则直接对该图像样本进行分割处理,并通过一致性损失使得教师网络205对应的分割结果和学生网络204对应的分割结果保持一致性,以增强学生网络204的鲁棒性,同时使得学生网络204可以更准确地捕获目标对象。

在一个示例中,为了进一步从第二图像样本的标注数据中挖掘出潜在的有用信息,以及减轻第二图像样本的标注数据对学生网络的分割性能的负面影响,图像分割网络的训练损失还可以包括学习损失,学习损失用于学生网络从第二图像样本的校正后标注数据中学习有用信息,学习损失的具体获取过程可以如下:采用第二图像样本的教师分割结果对第二图像样本的标注数据进行校正处理,得到第二图像样本的校正后标注数据;根据第二图像样本的学生分割结果和第二图像样本的校正后标注数据,确定学习损失。其中,第二图像样本的校正后标注数据是指所包含的错误标注被校正后的第二图像样本的标注数据。

示例性地,学习损失可以包括交叉损失和焦点损失。通过交叉熵损失函数对第二图像样本的学生分割结果和第二图像样本的校正后标注数据进行计算处理,确定第一子学习损失;通过焦点损失函数对第二图像样本的学生分割结果和第二图像样本的校正后标注数据进行计算处理,确定第二子学习损失;对第一子学习损失和第二子学习损失进行加权求和,确定学习损失。

可选地,第二图像样本的校正后标注数据的获取过程可以如下:基于第二图像样本的教师分割结果对第二图像样本的标注数据进行辨识处理,得到第二图像样本对应的噪声标志地图,噪声标志地图用于标识出第二图像样本中的错误标注;基于噪声标志地图对第二图像样本的标注数据进行校正处理,得到第二图像样本的校正后标注数据。其中,噪声标志地图可以是二进制形式的。例如,噪声标志地图中的“1”表示该像素点有错误标注数据,噪声标志地图中的“0”表示该像素点对应的标注数据为正确标注数据。

在一个示例中,可以利用置信学习技术在像素级别从第二图像样本的标注数据中识别出错误标注,其具体内容可以如下:基于第二图像样本中各个像素点的标注数据、各个像素点的第一类别的样本外预测概率和第二类别的样本外预测概率,构建第二图像样本的混淆矩阵,混淆矩阵包括被标注为第一类别且第一类别的样本外预测概率大于第一阈值的第一类像素点的数量、被标注为第一类别但第二类别的样本外预测概率大于第二阈值的第二类像素点的数量、被标注为第二类别且第二类别的样本外预测概率大于第二阈值的第三类像素点的数量和被标注为第二类别但第一类别的样本外预测概率大于第一阈值的第四类像素点的数量;基于混淆矩阵,构建第一类别和第二类别对应的联合分布矩阵,联合分布矩阵包括第一类像素点的联合概率、第二类像素点的联合概率,第三类像素点的联合概率和第四类像素点的联合概率;基于第二类像素点的联合概率,得到第二图像样本对应的噪声标志地图。可选地,像素点对应的类别还可以包括第三类别,第四类别等,可根据实际情况而设定,本申请实施例在在此不作限定。

示例性地,以肝脏内血管分割任务为例。在该分割任务中,肝脏图像样本的标注数据可以包括血管和非血管这两类,则可设定血管为第一类别(以下简称为i),非血管为第二类别(以下简称为j)。假设像素点的标注数据为为

像素点为第一类别的样本外预测概率、像素点为第二类别的样本外预测概率和像素点对应的第一类别和第二类别的联合样本外预测概率可以基于第二图像样本的教师分割结果来确定(例如,像素点为第一类别的样本外预测概率可以为第二图像样本的教师分割结果中像素点为第一类别的概率)。

若带有标注数据

进一步地,统计第一图像样本的标注数据中被标注为i但可能为i的像素点数、被标注为i但可能为j的像素点数、被标注为j但可能为i的像素点数和被标注为j但可能为j的像素点数,构建出第一图像样本的标注数据对应的混淆矩阵

其中,

其中,

利用构造的混淆矩阵

可选地,可以利用PBC(Prune by Class,按类修剪)策略来识别出错误标注,其过程可以如下:

对于被标注为i的像素点,按照自信心值(即标注数据对应的为i的概率值)由低到高的顺序进行排序,对n和第二类像素点(即标注为i但可能为j的像素点)的联合概率进行相乘处理,得到期望数值N,期望数值N可以表示如下:

将排序中的前N个像素点对应的标注数据认定为错误标注,进而构建出第二图像样本对应的噪声标志地图。由于置信学习技术的计算非常高效,并且不需要任何额外的超参数,因此不会对图像分割模型的训练效率造成影响。

示例性地,参考图2,可在图像分割模型中设置置信学习网络210,通过置信学习网络210基于第二图像样本的教师分割结果209对第二图像样本的标注数据211进行辨识处理,得到第二图像样本对应的噪声标志地图212。

在一个示例中,由于在错误标注的识别过程中存在不确定性,本申请采用平滑地软校正策略,则第二图像样本的标注数据的校正过程可以如下:

按照如下公式计算第二图像样本的校正后标注数据

其中,II为指示函数,τ∈[0,1]为平滑因子,x为第二图像样本中的像素点,

示例性地,参考图2,可在图像分割模型中设置软校正网络213,软校正网络213基于噪声标志地图212对第二图像样本的标注数据211进行平滑地软校正,得到第二图像样本的校正后标注数据214。

可选地,还可以基于监督损失、一致性损失和学习损失,对学生网络进行训练,以及利用EMA策略基于调整后的学生网络的网络参数对教师网络的网络参数进行调整,得到调整后的教师网络。

示例性地,可以对监督损失、一致性损失和学习损失进行加权求和,得到学生网络的总训练损失,基于总训练损失对学生网络进行训练,总训练损失可以表示如下:

L=L

其中,L

其中,w

可选地,教师网络需要“热身”以提供相对可靠的样本外预测概率,因此在前设定值(例如4000)下的迭代中,可以将学习损失的权重参数设置为0,并在其余次数的迭代过程中,将其修改为0.5。

可选地,还可以基于至少一个第一图像样本、第一图像样本的标注数据、至少一个第二图像样本和第二图像样本的校正后标注数据,对学生网络进行下一轮训练,从而可以进一步降低第二图像样本的标注数据对学生网络的影响,进而保证学生网络的分割性能。

可选地,最后通过训练得到的学生网络对目标图像进行分割处理,即可得到关于目标图像中的目标对象的分割图像,有关目标图像以及目标图像的具体分割过程下文将做具体的说明。

综上所述,本申请实施例提供的技术方案,通过将教师网络对带高质量标注的图像样本的预测结果和学生网络对带高质量标注的图像样本的结果进行一致性比对,以及将教师网络对带低质量标注的图像样本的预测结果和学生网络对带低质量标注的图像样本的预测结果进行一致性比对,使得教师网络可以帮助学生网络同时从带高质量标注的图像样本和带低质量标注的图像样本中学习到有用的图像信息,从而可以避免因图像样本缺乏而导致的网络过拟合问题,进而确保了学生网络的分割精度。

另外,由于是通过教师网络帮忙学生网络从带低质量标注的图像样本中学习到有用的图像信息,而不是直接通过学生网络从带低质量标注的图像样本中学习到有用的图像信息,从而可以降低带低质量标注的图像样本对学生网络的影响,进而确保了学生网络的分割性能。

另外,通过基于第二图像版本的校正后标注数据,确定学生网络的学习损失,使得学生网络可以从带低质量标注的图像样本中学习到有用的标注信息,而不受低质量标注的影响,从而提高了学生网络的分割性能。

另外,通过基于第二图像样本的校正后标注数据,对图像分割模型进行下一轮训练,由于标注数据的质量的提高,使得图像分割模型的分割性能得到了进一步地提升。

请参考图3,其示出了本申请另一个实施例提供的图像分割方法的流程图,该方法各步骤的执行主体可以是上文介绍的计算机设备,该方法可以包括如下几个步骤(301~303)。

步骤301,获取目标图像以及目标图像对应的目标对象概率图,目标对象概率图用于表示目标对象的分布。

在本申请实施例中,目标图像可以是CT图像、图像、图片、照片等。目标图像中包括了目标对象以及目标对象对应的目标区域。目标对象可以根据分割任务而设定。例如,在器官内血管分割任务中,目标区域为器官,目标对象为器官中的血管;在车牌识别任务中,目标区域为车辆,目标对象为车辆上的车牌,本申请实施例在此不作限定。

目标对象概率图是指目标对象的分布概率图。例如,以肝脏内的血管分布概率图为例,该血管分布概率图可用于表示肝脏内的血管分布。目标对象概率图可用于为图像分割模型提供关于目标对象的辅助信息,诸如位置、数量、边缘等信息。目标对象概率图可采用多尺度目标对象(如血管)增强滤波网络获得。

步骤302,将预处理后的目标图像与目标图像对应的目标对象概率图进行拼接处理,得到输入图像;其中,预处理包括以下至少一项:裁剪处理、清晰度调整处理、归一化处理。

可选地,预处理后的目标图像的获取过程可以如下:对目标图像进行遮罩并裁剪出目标区域,得到裁剪后的目标图像,再对裁剪后的目标图像进行清晰度调整处理,得到清晰度调整后的裁剪目标图像,最后对清晰度调整后的裁剪目标图像进行归一化处理,得到预处理后的目标图像。可选地,输入图像用于作为图像分割模型的输入。

步骤303,通过图像分割模型的学生网络对输入图像进行分割处理,得到输出分割图像,输出分割图像包括从输入图像中分割出来的目标对象。

图像分割模型的学生网络从预处理后的目标图像和其对应的目标对象概率图中同时提取特征信息,基于目标对象概率图对应的特征信息对预处理后的目标图像进行分割处理,得到输出分割图像。其中,图像分割模型的学生网络是训练好的网络,具体训练方法这里不再赘述。

示例性地,以肝脏内血管分割任务为例。若输入图像由处理后的肝脏图像和肝脏图像对应的血管概率图拼接而成,则经过图像分割模型的学生网络的分割处理,可以得到只包括血管的输出分割图像。

在一个示例中,目标图像为3D图像的轴向面2D切片。在得到目标图像的输出分割图像之后,可以将3D图像对应的多个输出分割图像进行叠加处理,得到3D输出分割图像;为了过滤一些不合理的预测,还需对3D输出分割图像进行过滤处理,也即将3D输出分割图像中容积小于阈值的连通区域进行删除,以得到最终的3D输出分割图。

进而基于最终的3D输出分割图,获取针对目标对象的指导信息。

在一个示例性实施例中,以肝脏内血管分割任务为例。我们使用了两个公开数据集进行了图像分割模型的训练与测试。其中一个数据集为3DIRCADb数据集,另一个为MSD8数据集。3DIRCADb数据集和MSD8数据集都提供了肝脏内血管的标注数据。3DIRCADb数据集中包括20例带高质量的肝脏标注数据和肝脏内血管标注数据的腹腔CT图像。每张腹腔CT图像的轴向面2D切片大小相同,都为512*512像素,每张腹腔CT图像的轴向面2D切片数量在74到260之间。MSD8数据集中包括443例带低质量肝脏内血管标注数据的腹腔CT图像,该腹腔CT图像的属性与3DIRCADb数据集中腹腔CT图像的属性相似。其中,约有65.5%的体素未被标记,约8.5%的体素被错误标记为血管。参考图4,可见,3DIRCADb数据集401中的肝脏内血管标注数据的质量优于MSD8数据集402中的肝脏内血管标注数据的质量。

可选地,将3DIRCADb数据集中10例CT图像对应的轴向面2D切片以及对应的肝脏内血管标注数据作为第一原始数据集,另外10例CT图像对应的轴向面2D切片以及对应的肝脏内血管标注数据可用于图像分割模型的效果测试。将MSD8数据集中的所有腹腔CT图像对应的轴向面2D切片以及对应的肝脏内血管标注数据作为第二原始数据集。

分别对第一原始数据集中各个轴向面2D切片和第二原始数据集中各个轴向面2D切片进行预处理,得到处理后的第一轴向面2D切片(以下简称处理后的第一原始肝脏图像)和处理后的第二轴向面2D切片(以下简称处理后的第二原始肝脏图像)。

可选地,处理后的第一原始肝脏图像和处理后的第二原始肝脏图像的尺度为320*320像素,处理后的第一原始肝脏图像和处理后的第二原始肝脏图像的HU值位于[-100,250]的范围内,且处理后的第一原始肝脏图像和处理后的第二原始肝脏图像经过均值为0,方差为1的归一化处理。另外,通过多尺度血管增强滤波网络获取处理后的第一原始肝脏图像和处理后的第二原始肝脏图像各自对应的血管概率图。

最后将处理后的第一原始肝脏图像和其对应的血管概率图拼接成第一肝脏图像样本(即3DIRCADb数据集对应的肝脏图像样本),将处理后的第二原始肝脏图像和其对应的血管概率图拼接成第二肝脏图像样本(即MSD8数据集对应的肝脏图像样本)。

采用本申请实施例提供的图像分割方法,基于第一肝脏图像样本、第一肝脏图像样本的肝脏内血管标注数据、第二肝脏图像样本和第二肝脏图像样本的肝脏内血管标注数据,对图像分割模型进行训练,得到训练好的学生网络。

然后将3DIRCADb数据集中剩下的10例CT图像对应的轴向面2D切片以及对应的肝脏内血管标注数据用于图像分割模型的效果测试。通过采用与肝脏图像样本相同的获取方法,基于目标肝脏图像获取输入肝脏图像。最后使用训练好的学生网络对输入肝脏图像进行分割处理,得到输出血管分割图,再将输出血管分割图叠加成3D输出血管分割图,最后对3D输出血管分割图进行过滤处理(例如过滤掉小于整个图像容积的0.1%的连通区域),得到最终的3D输出血管分割图。

可选地,可以通过由图像分割模型得到的预测分割掩膜和真实分割掩膜之间的平均Dice分数、平均表面距离、精度和豪斯多夫距离等评估指标对图像分割模型的分割结果进行综合评估。

在一个示例性实施例中,将本申请提供的图像分割方法与其他的方法进行比对。为了方便描述,用“i”表示处理后的原始肝脏图像以及对应的高质量的肝脏内血管标注数据,“p”表示血管概率图以及对应的高质量的肝脏内血管标注数据,“c”表示处理后的原始肝脏图像和血管概率图拼接而成的输入肝脏图像以及对应的高质量的肝脏内血管标注数据,U-Net(i)表示仅使用“i”训练的U型结构网络,U-Net(p)表示仅使用“p”训练的U型结构网络,U-Net(c)表示为使用“c”训练的U型结构网络,U-Net(c,Mix)为使用“c”和额外的带有低质量肝脏内血管标注数据的样本数据训练得到的U型结构网络,MTCL(c)表示为采用本申请实施例提供的技术方案训练得到的学生网络。

参考图5和图6,图5示出了U-Net(i)的最终的3D输出血管分割图501、U-Net(p)的最终的3D输出血管分割图502、U-Net(c)的最终的3D输出血管分割图503、U-Net(c,Mix)的最终的3D输出血管分割图504和MTCL(c)的最终的3D输出血管分割图505。图6示出了本申请实施例提供的定量比较结果。U-Net(c)在各个评价指标下的分数优于U-Net(i)和U-Net(p),则表明同时考虑“i”和“p”,能够使得图像分割模型更为鲁棒地感知血管信号。U-Net(c,Mix)在各个评价指标下的分数相比于U-Net(c)都有所退化。其中,U-Net(c,Mix)的平均Dice分数从0.6685降至0.6338,而其精确度从0.6699下滑至0.6322,可见,直接引用额外的带有低质量肝脏内血管标注数据的样本数据,会导致图像分割模型的性能严重退化。然而,MTCL(c)在各个评价指标下的分数全面优于U-Net(i)、U-Net(p)、U-Net(c)和U-Net(c,Mix),则表明本申请实施例提供的图像分割方法的效果最优,其不仅可以消除低质量肝脏内血管标注数据对图像分割模型的影响,还能从中提取有用的图像信息和标注信息。

综上所述,本申请实施例提供的技术方案,通过将教师网络对带高质量标注的图像样本的预测结果和学生网络对带高质量标注的图像样本的结果进行一致性比对,以及将教师网络对带低质量标注的图像样本的预测结果和学生网络对带低质量标注的图像样本的预测结果进行一致性比对,使得教师网络可以帮助学生网络同时从带高质量标注的图像样本和带低质量标注的图像样本中学习到有用的图像信息,从而可以避免因图像样本缺乏而导致的网络过拟合问题,进而确保了学生网络的分割精度。

另外,由于是通过教师网络帮忙学生网络从带低质量标注的图像样本中学习到有用的图像信息,而不是直接通过学生网络从带低质量标注的图像样本中学习到有用的图像信息,从而可以降低带低质量标注的图像样本对学生网络的影响,进而确保了学生网络的分割性能。

下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。

参考图7,其示出了本申请一个实施例提供的图像分割模型的训练装置的框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备中。如图7所示,该装置700包括:样本数据获取模块701、分割结果获取模块702、监督损失确定模块703、一致性损失确定模块704和学生网络训练模块705。

样本数据获取模块701,用于获取第一样本数据和第二样本数据;其中,所述第一样本数据包括至少一个第一图像样本和所述第一图像样本的标注数据,所述第二样本数据包括至少一个第二图像样本和所述第二图像样本的标注数据,所述第一图像样本的标注数据的质量高于所述第二图像样本的标注数据的质量。

分割结果获取模块702,用于通过图像分割模型的学生网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的学生分割结果和所述第二图像样本的学生分割结果,以及通过所述图像分割模型的教师网络分别对所述第一图像样本和所述第二图像样本进行分割处理,得到所述第一图像样本的教师分割结果和所述第二图像样本的教师分割结果。

监督损失确定模块703,用于根据所述第一图像样本的学生分割结果和所述第一图像样本的标注数据,确定监督损失。

一致性损失确定模块704,用于根据所述第一图像样本的学生分割结果和所述第一图像样本的教师分割结果之间的差异信息,以及所述第二图像样本的学生分割结果和所述第二图像样本的教师分割结果之间的差异信息,确定一致性损失。

学生网络训练模块705,用于基于所述监督损失和所述一致性损失,对所述学生网络进行训练,以通过训练得到的所述学生网络对目标图像进行分割处理。

在一个示例性实施例中,如图8所示,所述装置700还包括:校正标注获取模块706和学习损失确定模块707。

校正标注获取模块706,用于采用所述第二图像样本的教师分割结果对所述第二图像样本的标注数据进行校正处理,得到所述第二图像样本的校正后标注数据。

学习损失确定模块707,用于根据所述第二图像样本的学生分割结果和所述第二图像样本的校正后标注数据,确定学习损失。

所述学生网络训练模块705,还用于基于所述监督损失、所述一致性损失和所述学习损失,对所述学生网络进行训练。

在一个示例性实施例中,所述校正标注获取模块706,还用于:

基于所述第二图像样本的教师分割结果对所述第二图像样本的标注数据进行辨识处理,得到所述第二图像样本对应的噪声标志地图,所述噪声标志地图用于标识出所述第二图像样本中的错误标注;

基于所述噪声标志地图对所述第二图像样本的标注数据进行校正处理,得到所述第二图像样本的校正后标注数据。

在一个示例性实施例中,所述校正标注获取模块706,还用于:

基于所述第二图像样本中各个像素点的标注数据、所述各个像素点的第一类别的样本外预测概率和第二类别的样本外预测概率,构建所述第二图像样本的混淆矩阵,所述混淆矩阵包括被标注为所述第一类别且所述第一类别的样本外预测概率大于第一阈值的第一类像素点的数量、被标注为所述第一类别但所述第二类别的样本外预测概率大于第二阈值的第二类像素点的数量、被标注为所述第二类别且所述第二类别的样本外预测概率大于所述第二阈值的第三类像素点的数量和被标注为所述第二类别但所述第一类别的样本外预测概率大于所述第一阈值的第四类像素点的数量;

基于所述混淆矩阵,构建所述第一类别和所述第二类别对应的联合分布矩阵,所述联合分布矩阵包括所述第一类像素点的联合概率、所述第二类像素点的联合概率,所述第三类像素点的联合概率和所述第四类像素点的联合概率;

基于所述第二类像素点的联合概率,得到所述第二图像样本对应的噪声标志地图。

在一个示例性实施例中,所述校正标注获取模块706,还用于:

按照如下公式计算所述第二图像样本的校正后标注数据

其中,II为指示函数,τ∈[0,1]为平滑因子,x为所述第二图像样本中的像素点,

在一个示例性实施例中,所述学习损失确定模块707,用于:

通过交叉熵损失函数对所述第二图像样本的学生分割结果和所述第二图像样本的校正后标注数据进行计算处理,确定第一子学习损失;

通过焦点损失函数对所述第二图像样本的学生分割结果和所述第二图像样本的校正后标注数据进行计算处理,确定第二子学习损失;

对所述第一子学习损失和所述第二子学习损失进行加权求和,确定所述学习损失。

在一个示例性实施例中,如图8所示,所述装置700还包括教师网络训练模块708。

所述学生网络训练模块705,还用于基于所述监督损失、所述一致性损失和所述学习损失对所述学生网络当前的网络参数进行调整处理,得到调整后的学生网络。

所述教师网络训练模块708,用于获取所述教师网络当前的网络参数和所述调整后的学生网络的网络参数之间的参数差异信息。

所述教师网络训练模块708,还用于对所述参数差异信息进行衰减计算处理,得到衰减后的参数差异信息。

所述教师网络训练模块708,还用于将所述教师网络当前的网络参数替换成所述衰减后的参数差异信息和所述调整后的学生网络的网络参数的和,得到调整后的教师网络。

在一个示例性实施例中,所述学生网络训练模块705,还用于基于所述至少一个第一图像样本、所述第一图像样本的标注数据、所述至少一个第二图像样本和所述第二图像样本的校正后标注数据,对所述学生网络进行下一轮训练。

在一个示例性实施例中,所述监督损失确定模块703,用于:

通过交叉熵损失函数对所述第一图像样本的学生分割结果和所述第一图像样本的标注数据进行计算处理,确定第一子监督损失;

通过Dice损失函数对所述第一图像样本的学生分割结果和所述第一图像样本的标注数据进行计算处理,确定第二子监督损失;

通过边界损失函数对所述第一图像样本的学生分割结果和所述第一图像样本的标注数据进行计算处理,确定第三子监督损失;

通过焦点损失函数对所述第一图像样本的学生分割结果和所述第一图像样本的标注数据进行计算处理,确定第四子监督损失;

对所述第一子监督损失、所述第二子监督损失、所述第三子监督损失和所述第四子监督损失进行加权求和,确定所述监督损失。

在一个示例性实施例中,所述一致性损失确定模块704,用于:

通过均方差函数对所述第一图像样本的学生分割结果和所述第一图像样本的教师分割结果之间的差异信息进行计算处理,确定第一子一致性损失;

通过所述均方差函数对所述第二图像样本的学生分割结果和所述第二图像样本的教师分割结果之间的差异信息进行计算处理,确定第二子一致性损失;

对所述第一子一致性损失和所述第二子一致性损失进行加权求和,确定所述一致性损失。

在一个示例性实施例中,所述样本数据获取模块701,用于:

获取第一原始数据集和第二原始数据集;其中,所述第一原始数据集包括至少一个第一原始图像和所述第一原始图像的标注数据,所述第二原始数据集包括至少一个第二原始图像和所述第二原始图像的标注数据;

分别对所述第一原始图像和所述第二原始图像进行预处理,得到处理后的第一原始图像和处理后的第二原始图像;其中,所述预处理包括以下至少一项:裁剪处理、清晰度调调整处理、归一化处理;

获取所述第一原始图像和所述第二原始图像分别对应的目标对象概率图,所述目标对象概率图用于表示目标对象的分布;

对所述处理后的第一原始图像和所述第一原始图像对应的目标对象概率图进行拼接处理,得到所述第一图像样本,以及对所述处理后的第二原始图像和所述第二原始图像对应的目标对象概率图进行拼接处理,得到所述第二图像样本。

综上所述,本申请实施例提供的技术方案,通过将教师网络对带高质量标注的图像样本的预测结果和学生网络对带高质量标注的图像样本的结果进行一致性比对,以及将教师网络对带低质量标注的图像样本的预测结果和学生网络对带低质量标注的图像样本的预测结果进行一致性比对,使得教师网络可以帮助学生网络同时从带高质量标注的图像样本和带低质量标注的图像样本中学习到有用的图像信息,从而可以避免因图像样本缺乏而导致的网络过拟合问题,进而确保了学生网络的分割精度。

另外,由于是通过教师网络帮忙学生网络从带低质量标注的图像样本中学习到有用的图像信息,而不是直接通过学生网络从带低质量标注的图像样本中学习到有用的图像信息,从而可以降低带低质量标注的图像样本对学生网络的影响,进而确保了学生网络的分割性能。

需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

请参考图9,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以用于实施上述实施例中提供的图像分割方法。具体可以包括如下内容。

该计算机设备900包括中央处理单元(如CPU(Central Processing Unit,中央处理器)、GPU(Graphics Processing Unit,图形处理器)和FPGA(Field Programmable GateArray,现场可编程逻辑门阵列)等)901、包括RAM(Random-Access Memory,随机存取存储器)902和ROM(Read-Only Memory,只读存储器)903的系统存储器904,以及连接系统存储器904和中央处理单元901的系统总线905。该计算机设备900还包括帮助服务器内的各个器件之间传输信息的基本输入/输出系统(Input Output System,I/O系统)906,和用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备907。

该基本输入/输出系统906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中,该显示器908和输入设备909都通过连接到系统总线905的输入输出控制器910连接到中央处理单元901。该基本输入/输出系统906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。

该大容量存储设备907通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。该大容量存储设备907及其相关联的计算机可读介质为计算机设备900提供非易失性存储。也就是说,该大容量存储设备907可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory,只读光盘)驱动器之类的计算机可读介质(未示出)。

不失一般性,该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦写可编程只读存储器)、闪存或其他固态存储其技术,CD-ROM、DVD(Digital Video Disc,高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备907可以统称为存储器。

根据本申请实施例,该计算机设备900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备900可以通过连接在该系统总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括计算机程序,该计算机程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述图像分割方法。

在一个示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集在被处理器执行时以实现上述图像分割方法。

可选地,该计算机可读存储介质可以包括:ROM(Read-Only Memory,只读存储器)、RAM(Random-Access Memory,随机存储器)、SSD(Solid State Drives,固态硬盘)或光盘等。其中,随机存取记忆体可以包括ReRAM(Resistance Random Access Memory,电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory,动态随机存取存储器)。

在一个示例性实施例中,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质中读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行上述图像分割方法。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。

以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

技术分类

06120113806588