掌桥专利:专业的专利平台
掌桥专利
首页

分割模型的训练方法、图像处理方法、装置、设备及介质

文献发布时间:2023-06-19 13:46:35


分割模型的训练方法、图像处理方法、装置、设备及介质

技术领域

本申请实施例涉及人工智能技术领域,特别涉及一种分割模型的训练方法、图像处理方法、装置、设备及介质。

背景技术

随着人工智能技术的发展,对图像进行处理的应用场景越来越多。其中,一种应用场景为:图像中包括体积小、数量多且排列密集的参考对象的子图像,调用分割模型对此种图像进行处理,以分割出图像中的子图像,得到该图像的目标分割结果。由于参考对象体积小、数量多且排列密集,所以通常通过获取样本图像对应的点标签来节省标注成本,也就是说,用于对图像进行处理的分割模型基于样本图像的点标签训练得到。

相关技术中,直接调用初始分割模型对样本图像进行分割,得到分割结果,然后基于分割结果和点标签对该初始分割模型进行训练,得到用于获取目标分割结果的目标分割模型。由于样本图像用于提供子图像的纹理特征,所以基于此种方式训练得到的分割模型着重考虑纹理特征,考虑的信息较为局限,模型的训练效果较差,利用训练得到的目标分割模型获取的目标分割结果的准确性较差。

发明内容

本申请实施例提供了一种分割模型的训练方法、图像处理方法、装置、设备及介质,可用于提高模型的训练效果,进而提高利用训练好的模型获取的目标分割结果的准确性。所述技术方案如下:

一方面,本申请实施例提供了一种分割模型的训练方法,所述方法包括:

获取样本图像以及获取所述样本图像对应的点标签,所述样本图像包括被第一染色成分染色的参考对象的子图像,所述样本图像对应的点标签基于所述子图像在所述样本图像中所处的区域内的参考点确定,所述样本图像用于提供所述子图像的纹理特征;

基于所述样本图像,获取所述第一染色成分对应的第一通道图像,所述第一通道图像用于提供所述子图像的边界特征;

调用第一初始分割模型对所述样本图像进行分割,得到第一分割结果;调用第二初始分割模型对所述第一通道图像进行分割,得到第二分割结果;

基于所述第一分割结果、所述第二分割结果以及所述点标签,获取目标损失函数;利用所述目标损失函数对所述第一初始分割模型和所述第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型,所述第一目标分割模型和所述第二目标分割模型用于获取待处理图像的目标分割结果。

还提供了一种图像处理方法,所述方法包括:

获取待处理图像、第一目标分割模型和第二目标分割模型,所述待处理图像包括被第一染色成分染色的参考对象的子图像,所述第一目标分割模型和所述第二目标分割模型基于样本图像、基于所述样本图像获取的所述第一染色成分对应的第一通道图像以及所述样本图像对应的点标签训练得到;

基于所述待处理图像,获取所述第一染色成分对应的第二通道图像;

调用所述第一目标分割模型对所述待处理图像进行分割,得到第一分割结果;调用所述第二目标分割模型对所述第二通道图像进行分割,得到第二分割结果;

基于所述第一分割结果和所述第二分割结果,获取所述待处理图像的目标分割结果。

另一方面,提供了一种分割模型的训练装置,所述装置包括:

第一获取单元,用于获取样本图像以及获取所述样本图像对应的点标签,所述样本图像包括被第一染色成分染色的参考对象的子图像,所述样本图像对应的点标签基于所述子图像在所述样本图像中所处的区域内的参考点确定,所述样本图像用于提供所述子图像的纹理特征;

第二获取单元,用于基于所述样本图像,获取所述第一染色成分对应的第一通道图像,所述第一通道图像用于提供所述子图像的边界特征;

调用单元,用于调用第一初始分割模型对所述样本图像进行分割,得到第一分割结果;调用第二初始分割模型对所述第一通道图像进行分割,得到第二分割结果;

第三获取单元,用于基于所述第一分割结果、所述第二分割结果以及所述点标签,获取目标损失函数;

训练单元,用于利用所述目标损失函数对所述第一初始分割模型和所述第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型,所述第一目标分割模型和所述第二目标分割模型用于获取待处理图像的目标分割结果。

在一种可能实现方式中,所述第三获取单元,用于基于所述点标签,获取所述样本图像对应的辅助标签,所述辅助标签提供的监督信息多于所述点标签提供的监督信息;基于所述第一分割结果、所述第二分割结果以及所述辅助标签,获取所述目标损失函数。

在一种可能实现方式中,所述辅助标签包括第一标签;所述第三获取单元,还用于基于所述点标签,确定所述子图像在所述样本图像中所处的区域内的参考点;在所述样本图像中生成与所述参考点对应的泰森多边形;基于所述参考点和所述泰森多边形,获取所述第一标签,所述第一标签包括用于指示位于所述参考点上的像素点属于所述子图像的子标签、用于指示位于所述泰森多边形上的像素点不属于所述子图像的子标签,以及用于指示位于所述参考点以及所述泰森多边形外的像素点属于不确定像素点的子标签。

在一种可能实现方式中,所述辅助标签包括第二标签;所述第三获取单元,还用于基于所述点标签,确定所述子图像在所述样本图像中所处的区域内的参考点;基于所述参考点,获取所述样本图像中的各个像素点分别对应的参考特征;基于所述各个像素点分别对应的参考特征,对所述各个像素点进行聚类,得到聚类结果,所述聚类结果包括第一聚类簇和第二聚类簇;基于所述聚类结果,获取所述第二标签,所述第二标签包括用于指示所述第一聚类簇中的像素点属于所述子图像的子标签、用于指示所述第二聚类簇中的像素点不属于所述子图像的子标签,以及用于指示除所述第一聚类簇和所述第二聚类簇中的像素点外的像素点属于不确定像素点的子标签。

在一种可能实现方式中,所述第三获取单元,还用于对于第一像素点,将所述第一像素点与目标参考点之间的距离作为所述第一像素点对应的距离特征,所述目标参考点为距离所述第一像素点最近的参考点,所述第一像素点为所述各个像素点中的任意一个像素点;基于所述第一像素点对应的距离特征和所述第一像素点具有的颜色特征,获取所述第一像素点对应的参考特征。

在一种可能实现方式中,所述第三获取单元,还用于获取所述第一分割结果与所述辅助标签之间的交叉熵损失函数,以及所述第二分割结果与所述辅助标签之间的交叉熵损失函数;基于所述第一分割结果和所述第二分割结果,获取第一损失函数;基于所述第一分割结果和所述辅助标签之间的交叉熵损失函数、所述第二分割结果和所述辅助标签之间的交叉熵损失函数以及所述第一损失函数,获取所述目标损失函数。

在一种可能实现方式中,所述第三获取单元,还用于获取所述第一分割结果与所述第二分割结果之间的交叉熵损失函数,以及所述第一分割结果与所述第二分割结果之间的散度损失函数;基于所述交叉熵损失函数和所述散度损失函数,获取所述第一损失函数。

在一种可能实现方式中,所述样本图像具有参考对象标签,所述第一获取单元,用于基于所述参考对象标签,确定所述子图像在所述样本图像中所处的区域;确定所述子图像在所述样本图像中所处的区域的区域中心;基于所述区域中心,确定所述参考点;基于所述参考点,确定所述样本图像对应的点标签。

还提供了一种图像处理装置,所述装置包括:

第一获取单元,用于获取待处理图像、第一目标分割模型和第二目标分割模型,所述待处理图像包括被第一染色成分染色的参考对象的子图像,所述第一目标分割模型和所述第二目标分割模型基于样本图像、基于所述样本图像获取的所述第一染色成分对应的第一通道图像以及所述样本图像对应的点标签训练得到;

第二获取单元,用于基于所述待处理图像,获取所述第一染色成分对应的第二通道图像;

调用单元,用于调用所述第一目标分割模型对所述待处理图像进行分割,得到第一分割结果;调用所述第二目标分割模型对所述第二通道图像进行分割,得到第二分割结果;

第三获取单元,用于基于所述第一分割结果和所述第二分割结果,获取所述待处理图像的目标分割结果。

在一种可能实现方式中,所述待处理图像为在第一颜色空间下呈现出的图像,所述第二获取单元,用于将所述待处理图像从所述第一颜色空间映射到所述第一染色成分所在的染色剂对应的颜色空间,得到所述待处理图像中的像素点在所述第一染色成分下对应的通道值;基于所述待处理图像中的像素点在所述第一染色成分下对应的通道值,获取所述第二通道图像。

在一种可能实现方式中,所述第三获取单元,用于获取所述第一分割结果和所述第二分割结果的平均结果,将所述平均结果作为所述待处理图像的目标分割结果。

另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现上述任一所述的分割模型的训练方法或图像处理方法。

另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一所述的分割模型的训练方法或图像处理方法。

另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的分割模型的训练方法或图像处理方法。

本申请实施例提供的技术方案至少带来如下有益效果:

本申请实施例中,在模型训练过程中,除关注了用于提供参考对象的子图像的纹理特征的样本图像外,还关注了用于提供子图像的边界特征的第一通道图像,基于此种方式训练得到的两个目标分割模型能够综合考虑子图像的纹理特征和边界特征,考虑的信息较全面,模型的训练效果较好,从而有利于提高利用训练得到的目标分割模型获取的目标分割结果的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种实施环境的示意图;

图2是本申请实施例提供的一种分割模型的训练方法的流程图;

图3是本申请实施例提供的一种样本图像对应的参考对象标签以及点标签的示意图;

图4是本申请实施例提供的一种样本图像以及第一通道图像的示意图;

图5是本申请实施例提供的一种第一标签的示意图;

图6是本申请实施例提供的一种第二标签的示意图;

图7是本申请实施例提供的一种分割模型的训练过程的示意图;

图8是本申请实施例提供的一种图像处理方法的流程图;

图9是本申请实施例提供的一种对组织病理图像中的细胞核的子图像进行分割的过程的流程图;

图10是本申请实施例提供的一种分割模型的训练装置的示意图;

图11是本申请实施例提供的一种图像处理装置的示意图;

图12是本申请实施例提供的一种服务器的结构示意图;

图13是本申请实施例提供的一种终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

在示例性实施例中,本申请实施例提供的分割模型的训练方法以及图像处理方法能够应用于人工智能技术领域。接下来对人工智能技术进行介绍。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。本申请实施例提供的分割模型的训练方法以及图像处理方法涉及计算机视觉技术和机器学习技术。

计算机视觉(Computer Vision,CV)技术是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR(Optical Character Recognition,光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D(Three Dimensional,三维)技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

在示例性实施例中,本申请实施例中提供的分割模型的训练方法以及图像处理方法在区块链系统中实现,本申请实施例提供的分割模型的训练方法中涉及的样本图像、样本图像对应的点标签、第一初始分割模型、第二初始分割模型、第一目标分割模型、第二目标分割模型等,以及图像处理方法中涉及的待处理图像、目标分割结果等均保存在区块链系统中的区块链上,供区块链系统中的各个节点设备应用,以保证数据的安全性和可靠性。

图1示出了本申请实施例提供的实施环境的示意图。该实施环境可以包括:终端11和服务器12。

本申请实施例提供的分割模型的训练方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本申请实施例对此不加以限定。对于本申请实施例提供的分割模型的训练方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。

本申请实施例提供的图像处理方法可以由终端11执行,也可以由服务器12执行,还可以由终端11和服务器12共同执行,本申请实施例对此不加以限定。对于本申请实施例提供的图像处理方法由终端11和服务器12共同执行的情况,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12承担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。

本申请实施例提供的分割模型的训练方法与图像处理方法可以由相同的设备执行,也可以由不同的设备执行,本申请实施例对此不加以限定。

在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(Personal Computer,个人计算机)、手机、智能手机、PDA(Personal Digital Assistant,个人数字助手)、可穿戴设备、PPC(Pocket PC,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。

本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

基于上述图1所示的实施环境,本申请实施例提供一种分割模型的训练方法,该分割模型的训练方法由计算机设备执行,该计算机设备可以为服务器12,也可以为终端11,本申请实施例对此不加以限定。如图2所示,本申请实施例提供的分割模型的训练方法包括如下步骤201至步骤204:

在步骤201中,获取样本图像以及获取样本图像对应的点标签,样本图像包括被第一染色成分染色的参考对象的子图像,样本图像对应的点标签基于子图像在样本图像中所处的区域内的参考点确定,样本图像用于提供子图像的纹理特征。

样本图像是指训练分割模型所需的图像,样本图像包括被第一染色成分染色的参考对象的子图像,参考对象的子图像是指样本图像中包括的需要关注的图像区域。示例性实施例中,参考对象的体积小、数量多且排列紧密,难以人工对参考对象的子图像进行较为准确的标注。示例性地,样本图像为对病理玻片中的病变组织进行图像采集得的组织病理图像,参考对象为组织病理图像中的某些特定组织(如细胞核、细胞或者血管)等。

病理玻片可以具有特定的特征,例如,该病理玻片可以是发生某种病变的生物组织的病理玻片,如发生特定病变的动植物组织的病理玻片,或人体某个部位的肿瘤组织的病理玻片等。示例性地,病理玻片是经过染色的玻片,示例性地,病理玻片是被HE(Hematoxylin Eosin,苏木精-伊红)染色剂染色得到的玻片,通过对被HE染色剂染色得到的病理玻片中的某一区域视野进行图像采集,可以得到组织病理图像,将组织病理图像作为样本图像。

在本申请实施例中,样本图像中包括被第一染色成分染色的参考对象的子图像,被第一染色成分染色的参考对象的子图像在视觉上能够区别于未被染色的对象的子图像以及被其他染色成分染色的对象的子图像。示例性地,样本图像中除包括被第一染色成分染色的参考对象的子图像外,还可以包括被第二染色成分染色的其他对象的子图像,本申请实施例对此不加以限定。示例性地,样本图像用于提供参考对象的子图像的纹理特征,参考对象的子图像的纹理特征是指参考对象的子图像在纹理方面的特征。

示例性地,参考对象为细胞核,样本图像是通过对被HE染色剂染色得到的病理玻片进行图像采集得到的图像,HE染色剂包括H染色成分和E染色成分,其中,H染色成分用于将病理玻片中的细胞核染成蓝色,E染色成分用于将病理玻片中的细胞外基质和细胞质染成粉红色。也就是说,H染色成分为HE染色剂中的第一染色成分,E染色成分为HE染色剂中的第二染色成分,样本图像包括被H染色成分染成蓝色的细胞核的子图像,还包括被E染色成分染成粉红色的细胞外基质和细胞质的子图像。

需要说明的是,本申请实施例中提到的样本图像是指对第一初始分割模型和第二初始分割模型训练一次所依据的样本图像,样本图像的数量可以为一个,也可以为多个,本申请实施例对此不加以限定。示例性地,样本图像的数量为多个,以保证模型训练效果。

在示例性实施例中,计算机设备获取样本图像的方式为:计算机设备从图像库中提取样本图像。

在示例性实施例中,计算机设备获取样本图像的方式为:计算机设备将某公开数据集中的训练图像作为样本图像,例如,计算机设备将MoNuSeg(Multi-organ NucleusSegmentation,多器官细胞核分割)数据集中的训练图像作为样本图像。MoNuSeg数据集通过对多家医院多名患者不同肿瘤器官的组织病理图像进行精确标注而获得,由从TCGA(TheCancer Genome Atlas,癌症基因组图谱)档案下载的40倍放大的HE染色图像组成。MoNuSeg数据集包含30张训练图像和14张测试图像,每张图像的大小为1000×1000(像素)。训练数据覆盖了乳腺、肝脏、肾脏、前列腺、膀胱、结肠和胃等七个不同的器官,包含大约22000个完整的核边界注释,测试数据覆盖了肾脏、肺、结肠、乳腺、膀胱、前列腺和大脑等七个不同的器官,包含大约7000个完整的核边界注释。

在示例性实施例中,计算机设备获取样本图像的方式为:计算机设备对图像采集设备(如,显微镜、进口扫描仪、国产扫描仪等)采集的原始图像进行处理,得到样本图像。此种情况下,原始图像从图像库中提取,或者由人工上传等,本申请实施例对此不加以限定。对原始图像进行处理的方式包括但不限于裁剪、数据增强等,本申请实施例对此不加以限定。示例性地,对原始图像进行处理的方式与计算机设备的计算能力以及分割模型要求的输入尺寸有关。

样本图像对应的点标签基于参考对象的子图像在样本图像中所处的区域内的参考点确定。由于参考点是位于子图像在样本图像中所处的区域内,所以,参考点能够提供子图像的部分位置信息。示例性地,一个样本图像中包括一个或多个参考对象的子图像,一个参考对象的子图像在样本图像中所处的区域内具有一个参考点,以利用该一个参考点粗略表示该一个参考对象的子图像的位置。一个参考对象的子图像在样本图像中所处的区域内的哪个点为参考点根据经验设置,或者由人工指定,或者根据实际的应用场景灵活调整,本申请实施例对此不加以限定。示例性地,本申请实施例对参考点的尺寸以及形状不加以限定,例如,参考点为1×1(像素)的正方形点;或者,参考点为2×1(像素)的长方形点。

样本图像对应的点标签包括用于指示位于参考点上的像素点属于参考对象的子图像的子标签以及用于指示未位于参考点上像素点不属于参考对象的子图像的子标签。在本申请实施例的模型训练过程中,无需获取样本图像对应的像素级标签,只需获取样本图像对应的点标签即可,从而能够有效减轻人工标注负担。

本申请实施例对样本图像对应的点标签的形式不加以限定。示例性地,样本图像对应的点标签的形式为数值对,数值对由像素点位置坐标以及像素点对应的标签值组成,例如,位于参考点上的像素点(也即属于参考对象的子图像的像素点)对应的标签值为1,未位于参考点上的像素点(也即不属于参考对象的子图像的像素点)对应的标签值为0。此种情况下,用于指示位于参考点上的像素点属于参考对象的子图像的子标签的形式为包括的标签值为1的数值对,用于指示未位于参考点上的像素点不属于参考对象的子图像的子标签的形式为包括的标签值为0的数值对。

示例性地,样本图像对应的点标签的形式为图像,该图像与样本图像的尺寸相同,在该图像中,利用不同的呈现方式呈现位于参考点上的像素点(也即属于参考对象的子图像的像素点)以及未位于参考点上的像素点(也即不属于参考对象的子图像的像素点),例如,利用不同的颜色呈现位于参考点上的像素点以及未位于参考点上的像素点。如,利用白色呈现位于参考点上的像素点,利用黑色呈现未位于参考点上的像素点。此种情况下,用于指示位于参考点上的像素点属于参考对象的子图像的子标签的形式为利用白色呈现的图像;用于指示未位于参考点上的像素点不属于参考对象的子图像的子标签的形式为利用黑色呈现的图像。

在一种可能实现方式中,样本图像对应的点标签由计算机设备基于人工在样本图像中标注出的参考点生成。在另一种可能实现方式中,样本图像对应的点标签与样本图像对应存储,在提取样本图像的同时,能够提取样本图像对应的点标签。

在另一种可能实现方式中,对于样本图像是通过对原始图像进行处理后得到的图像的情况,样本图像对应的点标签可以是指对原始图像对应的点标签进行相应地处理后得到的点标签。原始图像对应的点标签基于原始图像中的参考对象的子图像在原始图像中所处的区域内的参考点确定。例如,对于样本图像是通过对原始图像进行包括裁剪的方式进行处理后得到的图像的情况,样本图像对应的点标签通过从原始图像对应的点标签中提取与裁剪后保留的图像匹配的点标签得到。

在一种可能实现方式中,样本图像具有参考对象标签。也就是说,样本图像与参考对象标签对应存储,在提取样本图像的同时,能够提取参考对象标签。参考对象标签用于指示参考对象的子图像在样本图像中所处的区域。示例性地,参考对象标签根据人工在样本图像中标注出的参考对象的子图像的边界得到,参考对象标签的形式为数值对或图像,本申请实施例对此不加以限定。

在样本图像具有参考对象标签的情况下,获取样本图像对应的点标签的过程包括以下步骤2011至步骤2014:

步骤2011:基于参考对象标签,确定子图像在样本图像中所处的区域。

由于参考对象标签用于指示参考对象的子图像在样本图像中所处的区域,所以基于参考对象标签,能够确定参考对象的子图像在样本图像中所处的区域。

步骤2012:确定子图像在样本图像中所处的区域的区域中心。

在确定参考对象的子图像在样本图像中所处的区域之后,确定参考对象的子图像在样本图像中所处的区域的区域中心。示例性地,参考对象的子图像在样本图像中所处的区域的区域中心是指参考对象的子图像在样本图像中所处的区域的质心。在示例性实施例中,对于样本图像包括多个参考对象的子图像的情况,不同参考对象的子图像在样本图像中所处的区域是不同的,不同区域的区域中心也是不同的。

步骤2013:基于区域中心,确定参考点。

区域中心的位置能够代表参考对象的子图像所处的中心位置,在确定区域中心后,基于区域中心,确定参考点。在示例性实施例中,直接将区域中心作为参考对象的子图像在样本图像中所处的区域内的参考点,此种方式确定参考点的效率较高。

在示例性实施例中,对区域中心进行扩张,得到参考点。示例性地,对区域中心进行3个像素点的扩张;或者,对区域中心进行5个像素点的扩张等。通过对区域中心进行扩张得到的参考点清晰可见。

步骤2014:基于参考点,确定样本图像对应的点标签。

示例性地,对于样本图像对应的点标签的形式为图像的情况,基于参考点,确定样本图像对应的点标签的方式为:利用不同的呈现方式呈现位于参考点上的像素点以及其他像素点,得到样本图像对应的图像形式的点标签。呈现方式根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。示例性地,呈现方式为呈现颜色,如,利用白色呈现位于参考点上的像素点,利用黑色呈现其他像素点。示例性地,呈现方式为呈现条纹,如,利用横条纹呈现位于参考点上的像素点,利用竖条纹呈现其他像素点。

示例性地,对于样本图像对应的点标签为数值对的情况,基于参考点,确定样本图像对应的点标签的方式为:为位置坐标位于参考点上的像素点赋予第一标签值,为位置坐标未位于参考点上像素点赋予第二标签值,将全部像素点的位置坐标-标签值对作为样本图像对应的数值对形式的点标签。第一标签值和第二标签值根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。例如,第一标签值为1,第二标签值为0;或者,第一标签值为0,第二标签值为1。

样本图像对应的点标签能够提供参考对象的子图像的部分位置信息。示例性地,将样本图像对应的点标签称为样本图像的弱标签,基于点标签进行模型训练的过程是指基于弱监督学习的方式进行模型训练的过程。

示例性地,样本图像对应的图像形式的参考对象标签如图3中的(a)所示,在图3中的(a)中,利用白色呈现位于参考对象的子图像所处的区域内的像素点,利用黑色呈现位于参考对象的子图像所处的区域外的像素点。基于图3中的(a)所示的参考对象标签,能够得到如图3中的(b)所示的样本图像对应的图像形式的点标签。在图3中的(b)中,利用白色呈现位于参考点上的像素点,利用黑色呈现未位于参考点上的像素点。

在步骤202中,基于样本图像,获取第一染色成分对应的第一通道图像,第一通道图像用于提供子图像的边界特征。

由于第一染色成分是用于对参考对象进行染色的,所以基于样本图像获取的第一染色成分对应的第一通道图像能够更加突出参考对象的子图像,弱化其他对象的子图像,因此,第一通道图像用于提供参考对象的子图像的边界特征。参考对象的子图像的边界特征是指参考对象的子图像在边界方面的特征,边界方面的特征和纹理方面的特征为参考对象的子图像具有的两个不同方面的特征,两个不同方面的特征能够互补。

在一种可能实现方式中,样本图像为在第一颜色空间下呈现出的图像,基于样本图像,获取第一染色成分对应的第一通道图像的方式为:将样本图像从第一颜色空间映射到第一染色成分所在的染色成分对应的颜色空间,得到样本图像中的各个像素点在第一染色成分下分别对应的通道值;基于样本图像中的各个像素点在第一染色成分下分别对应的通道值,获取第一通道图像。

第一颜色空间为样本图像默认采用的颜色空间,示例性地,第一颜色空间是指RGB(Red Green Blue,红绿蓝)颜色空间。第一染色成分所在的染色剂除包括第一染色成分外,还可能包括一种或多种其他染色成分,本申请实施例对此不加以限定。示例性地,对于参考对象为细胞核的情况,第一染色成分为H染色成分,第一染色成分所在的染色剂为HE染色剂,HE染色剂中除包括H染色成分外,还包括E染色成分。

不同的颜色空间之间可以相互转换,以利用不同的颜色空间表示相同的图像。在一种可能实现方式中,样本图像中的像素点在第一颜色空间中的各个颜色分量下分别对应有通道值,将样本图像从第一颜色空间映射到第一染色成分所在的染色剂对应的颜色空间,得到样本图像中的各个像素点在第一染色成分下分别对应的通道值的方式为:确定染色剂中的各个染色成分在第一颜色空间下分别对应的转换基准;基于染色剂中的各个染色成分在第一颜色空间下分别对应的转换基准,将样本图像中的像素点在第一颜色空间中的各个颜色分量下分别对应的通道值转换成样本图像中的像素点在染色剂中的各个染色成分下分别对应的通道值;从样本图像中的像素点在染色剂中的各个染色成分下分别对应的通道值中,提取样本图像中的像素点在第一染色成分下对应的通道值。

染色剂中的各个染色成分在第一颜色空间下对应的转换基准为预先存储的数据,能够直接提取利用。示例性地,染色成分在第一颜色空间下对应的转换基准包括与第一颜色空间中的各个颜色分量分别匹配的子转换基准。

示例性地,第一颜色空间为RGB颜色空间,染色剂为HE染色剂,RGB颜色空间中的各个颜色分量分别为R分量、G分量和B分量,HE染色剂中的各个染色成分分别为H染色成分和E染色成分。HE染色剂中的H染色成分在第一颜色空间下对应的转换基准包括与RGB颜色空间中的R分量、G分量和B分量分别匹配的子转换基准,示例性地,H染色成分在第一颜色空间下对应的转换基准为[0.644,0.717,0.267],其中,0.644是与R分量匹配的子转换基准,0.717是与G分量匹配的子转换基准,0.267是与B分量匹配的子转换基准。

同理地,HE染色剂中的E染色成分在第一颜色空间下对应的转换基准包括与RGB颜色空间中的R分量、G分量和B分量分别匹配的子转换基准,示例性地,E染色成分在第一颜色空间下对应的转换基准为[0.093,0.954,0.283],其中,0.093是与R分量匹配的子转换基准,0.954是与G分量匹配的子转换基准,0.283是与B分量匹配的子转换基准。

在一种可能实现方式中,以第一颜色空间为RGB颜色空间、染色剂为HE染色剂为例,基于染色剂中的各个染色成分在第一颜色空间下分别对应的转换基准,将样本图像中的像素点在第一颜色空间中的各个颜色分量下分别对应的通道值转换成样本图像中的像素点在染色剂中的各个染色成分下分别对应的通道值的过程基于公式1实现:

其中,HE

公式1以样本图像中的位置坐标为(i,j)的像素点为例进行说明,基于公式1,能够确定样本图像中的全部像素点在染色剂中的各个染色成分下分别对应的通道值。

在得到样本图像中的像素点在染色剂中的各个染色成分下分别对应的通道值后,从样本图像中的像素点在染色剂中的各个染色成分下分别对应的通道值中提取出样本图像中的像素点在第一染色成分下对应的通道值。至此,得到样本图像中的像素点在第一染色成分下对应的通道值。

在得到样本图像中的像素点在第一染色成分下对应的通道值后,基于样本图像中的像素点在第一染色成分下对应的通道值,获取第一通道图像。第一通道图像中的某一位置的像素点具有的像素值即为样本图像中的位于相同位置的像素点在第一染色成分下对应的通道值。示例性地,第一通道图像为基于样本图像中的像素点在第一染色成分下对应的通道值得到的灰度图。

获取第一通道图像的过程可视为应用颜色分解技术,基于比尔-朗伯定律构建颜色表示模型,将RGB颜色空间映射到HE染色的颜色空间,从HE染色的样本图像中提取苏木精成分,得到参考对象的子图像的边界更清晰的成分图的过程。

示例性地,以参考对象为细胞核为例,样本图像以及第一通道图像分别如图4中的(a)和(b)所示。需要说明的是,样本图像为彩色图像,样本图像中的细胞核的子图像为被H染色成分染成蓝色,样本图像中的细胞外基质和细胞质的子图像被E染色成分染成粉红色,图4中的(a)呈现的是将样本图像转换成灰度图像后的图像。根据图4中的(a)和(b)可知,样本图像比第一通道图像更充分地呈现细胞核的子图像的纹理特征,第一通道图像比样本图像更充分地呈现细胞核的子图像的边界特征。图4中的(b)呈现出的细胞核的子图像(黑色区域)具有更清晰地边界。

在一种可能实现方式中,对于样本图像是通过对原始图像进行处理后得到的图像的情况,基于样本图像,获取第一染色成分对应的第一通道图像的方式为:基于原始图像,获取第一染色成分对应的第三通道图像;利用目标处理方式对第三通道图像进行处理,将处理后得到的图像作为第一染色成分对应的第一通道图像。目标处理方式是指对原始图像进行处理得到样本图像所采用的处理方式。例如,目标处理方式为裁剪左上角四分之一的区域以及对裁剪后得到的图像添加噪声。

在步骤203中,调用第一初始分割模型对样本图像进行分割,得到第一分割结果;调用第二初始分割模型对第一通道图像进行分割,得到第二分割结果。

第一初始分割模型和第二初始分割模型为待训练的分割模型,均用于对图像进行分割,以分割出图像中的参考对象的子图像。第一初始分割模型的模型结构可以与第二初始分割模型的模型结构相同,也可以与第二初始分割模型的模型结构不同,本申请实施例对此不加以限定。示例性地,第一初始分割模型的模型结构和第二初始分割模型的模型结构均为Link Net(连接网络);或者,第一初始分割模型的模型结构和第二初始分割模型的模型结构均为FC-Dense Net(Fully Convolutional Dense Net,全卷积密集网络);或者,第一初始分割模型的模型结构为FC-Dense Net,第二初始分割模型的模型结构为MobileNet(移动网络)等。

将样本图像输入第一初始分割模型,由第一初始分割模型对样本图像进行分割,输出第一分割结果。第一分割结果用于指示第一初始分割模型预测的样本图像中的参考对象的子图像在样本图像中所处的区域。

本申请实施例对第一分割结果的形式不加以限定,示例性地,第一分割结果的形式为两通道的概率图,一个通道的概率图用于显示各个像素点属于参考对象的子图像的概率,另外一个通道的概率图用于显示各个像素点不属于参考对象的子图像的概率。示例性地,第一分割结果的形式为数值对,一个像素点对应一个数值对,一个像素点对应的数值对中包括该像素点的位置坐标、该像素点属于参考对象的子图像的概率以及该像素点不属于参考对象的子图像的概率。

示例性地,本申请实施例中对图像进行分割的目标是通过分割模型来判断图像中的每一个像素点是属于参考对象的子图像还是不属于参考对象的子图像。对于每一个像素点来说属于二分类问题。

将第一通道图像输入第二初始分割模型,由第二初始分割模型对第一通道图像进行分割,输出第二分割结果。第二分割结果用于指示第二初始分割模型预测的第一通道图像中的参考对象的子图像在第一通道图像中所处的区域,由于第一通道图像与样本图像的尺寸相同,而且第一通道图像是基于从样本图像获取的通道图像,所以第一通道图像中的参考对象的子图像在第一通道图像中所处的区域与样本图像中的参考对象的子图像在样本图像中所处的区域相同。也就是说,第二分割结果能够用于指示第二初始分割模型预测的样本图像中的参考对象的子图像在样本图像中所处的区域。

在示例性实施例中,第二分割结果的形式与第一分割结果的形式相同,以便于快速计算训练模型所需的损失函数。

需要说明的是,样本图像的数量可以为一个,也可以为多个,本申请实施例对此不加以限定。根据每个样本图像均可以得到一个第一通道图像,也就是说,第一通道图像的数量与样本图像的数量相同。对于样本图像的数量为多个的情况,在该步骤203中,需要调用第一初始分割模型分别对每个样本图像进行分割,得到多个第一分割结果;调用第二初始分割模型分别对每个第一通道图像进行分割,得到多个第二分割结果。多个第一分割结果和多个第二分割结果一一对应。

在步骤204中,基于第一分割结果、第二分割结果以及点标签,获取目标损失函数;利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型,第一目标分割模型和第二目标分割模型用于获取待处理图像的目标分割结果。

在得到第一分割结果、第二分割结果后,基于第一分割结果、第二分割结果以及点标签对第一初始分割模型和第二初始分割模型进行训练。基于第一分割结果、第二分割结果以及点标签对第一初始分割模型和第二初始分割模型进行训练的过程为:基于第一分割结果、第二分割结果以及点标签,获取目标损失函数;利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练。

样本图像的数量为一个或多个,对于样本图像的数量为一个的情况,第一分割结果和第二分割结果的数量均为一个,则直接基于第一分割结果、第二分割结果以及点标签,获取目标损失函数。对于样本图像的数量为多个的情况,第一分割结果和第二分割结果的数量也均为多个,第一分割结果和第二分割结果一一对应。此种情况下,获取目标损失函数的方式为:基于每个第一分割结果、每个第一分割结果对应的第二分割结果以及点标签,均获取一个子损失函数;将获取的全部子损失函数的平均值作为目标损失函数。样本图像的数量为多个的情况下获取一个子损失函数的方式与样本图像的数量为一个的情况下获取目标损失函数的方式相同。本申请实施例以样本图像的数量为一个为例进行说明。

在示例性实施例中,点标签包含参考对象的子图像的部分位置信息,相对于整张样本图像而言,点标签能够提供的监督信息较少,不利于模型训练。因此,在一种可能实现方式中,基于第一分割结果、第二分割结果以及点标签,获取目标损失函数的过程包括以下步骤2041和步骤2042:

步骤2041:基于点标签,获取样本图像对应的辅助标签,辅助标签提供的监督信息多于点标签提供的监督信息。

基于点标签获取能够提供更多地监督信息的辅助标签,有利于利用辅助标签获取能够提供更准确地指导的损失函数。辅助标签可以包括一个或多个标签,本申请实施例对此不加以限定,辅助标签中的每个标签均基于点标签获取得到。示例性地,辅助标签包括但不限于以下三种情况:

情况1:辅助标签包括第一标签。

在此种情况1下,基于点标签获取辅助标签的过程即为基于点标签获取第一标签的过程。在一种可能实现方式中,基于点标签获取第一标签的过程包括以下步骤A至步骤C:

步骤A:基于点标签,确定子图像在样本图像中所处的区域内的参考点。

由于样本图像对应的点标签基于参考对象的子图像在样本图像中所处的区域内的参考点确定,所以基于点标签能够确定子图像在样本图像中所处的区域内的参考点。示例性地,对于点标签的形式为图像的情况,该图像利用白色呈现位于参考点上的像素点,利用黑色呈现其他像素点。此种情况下,能够根据图像中呈现的白色区域确定出参考点。

步骤B:在样本图像中生成与参考点对应的泰森多边形。

泰森多边形是由连接两个相邻点直线的垂直平分线组成的连续多边形,在确定参考点之后,能够将相邻的参考点相连,然后基于连接相邻的参考点的直线的垂直平分线,得到参考点对应的泰森多边形。泰森多边形将样本图像所在的平面划分成理想的多边形块。在本申请实施例中,认为位于泰森多边形上的像素点为不属于参考对象的子图像的像素点,也就是说,泰森多边形能够提供可靠的负样本,可以帮助高度聚集的参考对象的子图像在分割时不重叠。

步骤C:基于参考点和泰森多边形,获取第一标签,第一标签包括用于指示位于参考点上的像素点属于子图像的子标签、用于指示位于泰森多边形上的像素点不属于子图像的子标签,以及用于指示位于参考点以及泰森多边形外的像素点属于不确定像素点的子标签。

在确定参考点以及生成与参考点对应的泰森多边形后,基于参考点和泰森多边形,获取第一标签。根据第一标签能够确定出样本图像中的哪些像素点属于参考对象的子图像,哪些像素点不属于参考对象的子图像,哪些像素点属于不确定像素点,从而能够为模型的训练过程提供有力的监督信息。

基于参考点和泰森多边形,获取第一标签的方式与第一标签的形式有关。示例性地,第一标签的形式为图像,则将利用不同的呈现方式呈现位于参考点上的像素点、位于泰森多边形上的像素点以及其他像素点的与样本图像的尺寸相同的图像作为第一标签。例如,图像形式的第一标签如图5所示,在图5所示的图像中,利用白色呈现位于参考点上的像素点,利用灰色呈现位于泰森多边形上的像素点,利用黑色呈现位于参考点和泰森多边形外的像素点。此种情况下,用于指示位于参考点上的像素点属于子图像的子标签的形式为利用白色呈现的图像;用于指示位于泰森多边形上的像素点不属于子图像的子标签的形式为利用灰色呈现的图像;用于指示位于参考点以及泰森多边形外的像素点属于不确定像素点的子标签的形式为利用黑色呈现的图像。

示例性地,第一标签的形式为数值对,则基于参考点和泰森多边形,获取第一标签的方式为:为位于参考点上的像素点赋予第一值,为位于泰森多边形上的像素点赋予第二值,为位于参考点和泰森多边形外的像素点赋予第三值,将各个像素点的位置坐标-标签值对作为数值对形式的第一标签。此种情况下,用于指示位于参考点上的像素点属于子图像的子标签的形式为包括的标签值为第一值的数值对;用于指示位于泰森多边形上的像素点不属于子图像的子标签的形式为包括的标签值为第二值的数值对;用于指示位于参考点以及泰森多边形外的像素点属于不确定像素点的子标签的形式为包括的标签值为第三值的数值对。第一值、第二值和第三值根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。例如,第一值为1,第二值为0,第三值为-1。

在示例性实施例中,基于参考点和泰森多边形获取的第一标签还可以称为点边标签。

情况2:辅助标签包括第二标签。

在此种情况2下,基于点标签获取辅助标签的过程即为基于点标签获取第二标签的过程。在一种可能实现方式中,基于点标签获取第二标签的过程包括以下步骤a至步骤d:

步骤a:基于点标签,确定子图像在样本图像中所处的区域内的参考点。

该步骤a的实现方式参见上述情况1下的步骤A,此处不再赘述。

步骤b:基于参考点,获取样本图像中的各个像素点分别对应的参考特征。

像素点对应的参考特征是对像素点进行聚类所依据的特征,像素点对应的参考特征是基于参考点确定的,与参考点有关。获取样本图像中的各个像素点分别对应的参考特征的原理相同,以各个像素点中的任意一个像素点(称为第一像素点)为例,介绍基于参考点,获取该第一像素点对应的参考特征的方式。

在一种可能实现方式中,基于参考点,获取第一像素点对应的参考特征的方式为:将第一像素点与目标参考点之间的距离作为第一像素点对应的距离特征,目标参考点为距离第一像素点最近的参考点;基于第一像素点对应的距离特征和第一像素点具有的颜色特征,获取第一像素点对应的参考特征。

通过计算第一像素点与各个参考点的距离,能够确定出距离第一像素点最近的目标参考点。本申请实施例对计算两个点之间的距离的方式不加以限定,示例性地,计算两个点之间的欧式距离。在确定出目标参考点后,将第一像素点与目标参考点之间的距离作为第一像素点对应的距离特征。

由于样本图像中的不同像素点可能被染成不同的颜色,例如,对于参考对象为细胞核、染色剂为HE染色剂的情况,样本图像中的属于细胞核的子图像的像素点被染成蓝色,属于细胞外基质和细胞质的子图像的像素点被染成粉红色。因此,在获取第一像素点对应的参考特征的过程中,除考虑距离特征外,还考虑第一像素点具有的颜色特征。示例性地,第一像素点具有的颜色特征是指第一像素点在第一颜色空间的各个颜色分量下分别具有的颜色值。示例性地,若第一颜色空间为RBG颜色空间,则第一像素点具有的颜色特征可以表示为(r

第一像素点对应的参考特征是基于第一像素点对应的距离特征和第一像素点具有的颜色特征获取的,示例性地,将第一像素点x

属于参考对象的子图像的像素点与不属于参考对象的子图像的像素点之间的颜色差异较大,因此,在获取像素点对应的参考特征的过程中,考虑像素点具有的颜色特征,以便于利用颜色特征在一定程度上将不同类别的像素点划分到不同的聚类簇中。此外,除考虑颜色特征外,还考虑了距离特征,以避免染色不均对聚类结果的不利影响。在颜色相近的前提下,属于同一参考对象的子图像的像素点应该足够接近该参考对象的子图像对应的参考点,不属于参考对象的子图像的像素点不仅与属于参考对象的子图像的像素点具有较大的色差,而且与参考点的距离也足够大,因此,将像素点与距离最近的参考点之间的距离作为距离特征,能够利用距离特征在一定程度上将不同类别的像素点划分到不同的聚类簇中。

参考获取第一像素点对应的参考特征的方式,能够获取样本图像中的各个像素点分别对应的参考特征。

步骤c:基于各个像素点分别对应的参考特征,对各个像素点进行聚类,得到聚类结果,聚类结果包括第一聚类簇和第二聚类簇。

在获取各个像素点分别对应的参考特征之后,基于各个像素点分别对应的参考特征,对各个像素点进行聚类。

在示例性实施例中,在基于各个像素点分别对应的参考特征,对各个像素点进行聚类之前,先指定最终需要获取的聚类簇的数量K(K为不小于1的整数),然后基于K-Means(K-平均)聚类方法实现对各个像素点的聚类。在示例性实施例中,基于K-Means聚类方法对各个像素点进行聚类的过程为:对于给定的包含N(N为不小于1的整数)个像素点(x

其中,μ

在本申请实施例中,K为不小于2的整数,以便于通过聚类将像素点至少划分为属于参考对象的子图像的像素点和不属于参考对象的子图像的像素点这两类像素点,从而得到包括第一聚类簇和第二聚类簇的聚类结果。第一聚类簇为聚类结果中的各个聚类簇中包含的像素点与参考点最接近的聚类簇,第二聚类簇为聚类结果中的各个聚类簇中与参考点最远离的聚类簇。基于此种方式,认为第一聚类簇为属于参考对象的子图像的像素点构成的聚类簇,第二聚类簇为不属于参考对象的子图像的像素点构成的聚类簇。示例性地,计算聚类簇中包含的像素点与参考点的距离的方式为:将聚类簇中的各个像素点分别对应的距离特征的平均值作为聚类簇中包含的像素点与参考点的距离。

步骤d:基于聚类结果,获取第二标签,第二标签包括用于指示第一聚类簇中的像素点属于子图像的子标签、用于指示第二聚类簇中的像素点不属于子图像的子标签,以及用于指示除第一聚类簇和第二聚类簇中的像素点外的像素点属于不确定像素点的子标签。

第二标签基于聚类结果获取得到,根据第二标签能够确定出样本图像中的哪些像素点属于参考对象的子图像,哪些像素点不属于参考对象的子图像,哪些像素点属于不确定像素点,从而能够为模型的训练过程提供有力的监督信息。示例性地,将不属于参考对象的子图像的像素点所处的区域称为背景,将属于不确定像素点的像素点所处的区域称为参考对象的子图像所处的区域与背景交界处的不确定区域。

基于聚类结果,获取第二标签的方式与第二标签的形式有关。示例性地,第二标签的形式为图像,则将利用不同的呈现方式呈现第一聚类簇中的像素点、第二聚类簇中的像素点以及除第一聚类簇和第二聚类簇中的像素点外的像素点的与样本图像的尺寸相同的图像作为第二标签。

在示例性实施例中,在利用不同的呈现方式呈现第一聚类簇中的像素点、第二聚类簇中的像素点以及除第一聚类簇和第二聚类簇中的像素点外的像素点的过程中,可以直接利用不同的呈现方式呈现第一聚类簇中的像素点、第二聚类簇中的像素点以及除第一聚类簇和第二聚类簇中的像素点外的像素点,也可以利用不同的呈现方式呈现对第一聚类簇中的像素点进行形态学开操作后得到的像素点、对第二聚类簇中的像素点进行形态学开操作后得到的像素点以及对除第一聚类簇和第二聚类簇中的像素点外的像素点进行形态学开操作后得到的像素点。

例如,图像形式的第二标签如图6所示。在图6中,利用白色呈现第一聚类簇中的像素点,利用灰色呈现第二聚类簇中的像素点,利用黑色呈现除第一聚类簇和第二聚类簇中的像素点外的像素点。基于此,认为图6中的白色区域内的像素点属于参考对象的子图像,灰色区域内像素点不属于参考对象的子图像,黑色区域内的像素点属于不确定像素点。此种情况下,用于指示第一聚类簇中的像素点属于子图像的子标签的形式为利用白色呈现的图像;用于指示第二聚类簇中的像素点不属于子图像的子标签的形式为利用灰色呈现的图像;用于指示除第一聚类簇和第二聚类簇中的像素点外的像素点属于不确定像素点的子标签的形式为利用黑色呈现的图像。

示例性地,第二标签的形式为数值对,则基于聚类结果,获取第二标签的方式为:为第一聚类簇中的像素点赋予第四值,为第二聚类簇中的像素点赋予第五值,为除第一聚类簇和所述第二聚类簇中的像素点外的像素点赋予第六值,将各个像素点的位置坐标-标签值对作为数值对形式的第二标签。此种情况下,用于指示第一聚类簇中的像素点属于子图像的子标签的形式为包括的标签值为第四值的数值对;用于指示第二聚类簇中的像素点不属于子图像的子标签的形式为包括的标签值为第五值的数值对;用于指示除第一聚类簇和第二聚类簇中的像素点外的像素点属于不确定像素点的子标签的形式为包括的标签值为第六值的数值对。

第四值、第五值和第六值根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。示例性地,第四值与第一值相同(比如1),第五值与第二值相同(比如0),第六值与第三值相同(比如-1)。

基于K-Means聚类方法进行的聚类属于无监督聚类,本申请实施例依靠属于参考对象的子图像的像素点与不属于参考对象的子图像的像素点之间的颜色特征差异和距离特征差异,获取了第二标签。示例性地,第二标签还可以称为聚类标签。

情况3:辅助标签包括第一标签和第二标签。

在此种情况3下,基于点标签获取辅助标签的过程即为基于点标签获取第一标签和第二标签的过程。第一标签是基于参考点和泰森多边形获取的,无法有效提供参考对象的子图像的形状信息;第二标签是通过聚类获取的,能够提供一定的形状信息,利用包括第一标签和第二标签的辅助标签获取的目标损失函数能够提供更加可靠的约束信息。

在一种可能实现方式中,基于点标签获取第一标签和第二标签的过程参考情况1下的步骤A至步骤C以及情况2下的步骤a至步骤d,此处不再赘述。

步骤2042:基于第一分割结果、第二分割结果以及辅助标签,获取目标损失函数。

在基于点标签获取辅助标签后,基于第一分割结果、第二分割结果以及辅助标签,获取目标损失函数。由于辅助标签提供的监督信息多于点标签提供的监督信息,所以利用辅助标签作为弱监督信息获取的目标损失函数能够为模型的训练过程提供更为有效的指导。

在一种可能实现方式中,该步骤2042的实现过程包括以下步骤20421至步骤20423:

步骤20421:获取第一分割结果与辅助标签之间的交叉熵损失函数,以及第二分割结果与辅助标签之间的交叉熵损失函数。

第一分割结果与辅助标签之间的交叉熵损失函数用于体现第一分割结果和辅助标签之间的差异,对于第一样本图像的数量为多个的情况,需要基于每个第一分割结果和辅助标签,均获取一个交叉熵损失函数。本申请实施例以样本图像的数量为一个为例进行说明。

需要说明的是,辅助标签包括第一标签和第二标签中的至少一个,对于辅助标签中仅包括第一标签或仅包括第二标签的情况,直接获取第一分割结果与辅助标签之间的交叉熵损失函数。

在示例性实施例中,在获取第一分割结果与辅助标签之间的交叉熵损失函数的过程中,基于样本图像中的有效像素点计算交叉熵损失函数,忽略样本图像中的无效像素点。示例性地,样本图像中的有效像素点是指辅助标签中的子标签指示的属于参考对象的子图像的像素点(还可称为代表正样本的像素点)以及不属于参考对象的子图像的像素点(还可称为代表负样本的像素点),样本图像中的无效像素点是指辅助标签中的子标签指示的属于不确定像素点的像素点。

示例性地,以辅助标签为图5所示的第一标签,或为图6所示的第二标签为例,样本图像中的有效像素点为图5和图6中的白色区域以及灰色区域内的像素点,样本图像中的无效像素点为图5和图6中的黑色区域内的像素点。

示例性地,第一分割结果与某一标签之间的交叉熵损失函数基于公式3计算得到:

其中,L

对于辅助标签包括第一标签或和第二标签的情况,第一分割结果与辅助标签之间的交叉熵损失函数是指第一分割结果与第一标签之间的交叉熵损失函数以及第一分割结果与第二标签之间的交叉熵损失函数的和或加权和。示例性地,对于辅助标签包括第一标签和第二标签的情况,第一分割结果与辅助标签之间的交叉熵损失函数可以基于公式4计算得到:

其中,

第二分割结果和辅助标签之间的交叉熵损失函数用于体现第二分割结果和辅助标签之间的差异,获取第二分割结果与辅助标签之间的交叉熵损失函数的实现方式参见获取第一分割结果与辅助标签之间的交叉熵损失函数的实现方式,此处不再赘述。

示例性地,对于辅助标签包括第一标签和第二标签的情况,第二分割结果与辅助标签之间的交叉熵损失函数可以基于公式5计算得到:

其中,

步骤20422:基于第一分割结果和第二分割结果,获取第一损失函数。

第一分割结果是第一初始分割模型根据输入的样本图像预测得到的,第二分割结果是第二初始分割模型根据输入的第一通道图像预测得到的,第一损失函数为基于两个模型输出的分割结果获取的损失函数,用于对第一初始分割模型和第二初始分割模型进行协同训练。本申请实施例采用两个模型进行协同训练是为了有效结合样本图像和第一通道图像之间互补的信息,因此,对于训练过程中两个分割模型的预测输出,既要尽可能地一致,又要防止两个分割模型互相欺骗。

在一种可能实现方式中,基于第一分割结果和第二分割结果,获取第一损失函数的过程为:获取第一分割结果与第二分割结果之间的交叉熵损失函数,以及第一分割结果与第二分割结果之间的散度损失函数;基于交叉熵损失函数和散度损失函数,获取第一损失函数。

第一分割结果与第二分割结果之间的交叉熵损失函数用于体现第一分割结果和第二分割结果之间的差异,能够使两个分割模型具有一致的特征分布。示例性地,第一分割结果与第二分割结果之间的交叉熵损失函数基于公式6计算得到:

其中,

示例性地,对分割结果进行变换,得到标签的方式为:根据分割结果中指示的各个像素点属于参考对象的子图像的概率值以及不属于参考对象的子图像的概率值,确定各个像素点是否属于参考对象的子图像;将用于指示各个像素点是否属于参考对象的子图像的标签作为对分割结果进行变换后得到的标签。

本申请实施例对根据分割结果中指示的各个像素点属于参考对象的子图像的概率值以及不属于参考对象的子图像的概率值,确定各个像素点是否属于参考对象的子图像的方式不加以限定。示例性地,若某一像素点属于参考对象的子图像的概率值大于不属于参考对象的子图像的概率值,则认为该像素点属于参考对象的子图像;若某一像素点属于参考对象的子图像的概率值小于不属于参考对象的子图像的概率值,则认为该像素点不属于参考对象的子图像;若某一像素点属于参考对象的子图像的概率值等于不属于参考对象的子图像的概率值,则认为该像素点属于不确定像素点。

示例性地,若某一像素点属于参考对象的子图像的概率值大于不属于参考对象的子图像的概率值且该像素点属于参考对象的子图像的概率值大于第一阈值,则认为该像素点属于参考对象的子图像;若某一像素点属于参考对象的子图像的概率值小于不属于参考对象的子图像的概率值且该像素点属于参考对象的子图像的概率值小于第二阈值,则认为该像素点不属于参考对象的子图像;若某一像素点属于参考对象的子图像的概率值与不属于参考对象的子图像的概率值之间的关系为其他关系,则认为该像素点属于不确定像素点。第一阈值和第二阈值根据经验设置,或者根据应用场景灵活调整,例如,第一阈值为0.7,第二阈值为0.3。

第一分割结果与第二分割结果之间的散度损失函数是为了避免两个分割模型互相欺骗而设置的损失函数。示例性地,第一分割结果与第二分割结果之间的散度损失函数基于公式7计算得到:

其中,

在获取第一分割结果与第二分割结果之间的交叉熵损失函数,以及第一分割结果与第二分割结果之间的散度损失函数之后,基于交叉熵损失函数和散度损失函数,获取第一损失函数。示例性地,基于交叉熵损失函数和散度损失函数,获取第一损失函数的过程基于公式8实现:

其中,L

步骤20423:基于第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数以及第一损失函数,获取目标损失函数。

目标损失函数基于第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数以及第一损失函数获取得到,第一分割结果和辅助标签之间的交叉熵损失函数用于优化第一初始分割模型的分割效果,第二分割结果和辅助标签之间的交叉熵损失函数用于优化第二初始分割模型的分割效果,第一损失函数用于协同优化第一初始分割模型和第二初始分割模型的分割效果。目标损失函数涵盖多方面的损失函数,有利于提高对模型的训练效果。

本申请实施例对基于第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数以及第一损失函数,获取目标损失函数的具体实现方式不加以限定。示例性地,将第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数和第一损失函数的加权和作为目标损失函数。在计算加权和的过程中,第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数和第一损失函数分别对应的权重根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。例如,第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数和第一损失函数分别对应的权重均为1,则目标损失函数为第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数和第一损失函数的和。

需要说明的是,以上所述的获取目标损失函数的方式仅为示例性举例,本申请实施例并不局限于此。在示例性实施例中,还可以不获取辅助标签,直接基于第一分割结果、第二分割结果和点标签,获取目标损失函数。该过程为:获取第一分割结果与点标签之间的交叉熵损失函数,以及第二分割结果与点标签之间的交叉熵损失函数;基于第一分割结果和第二分割结果,获取第二损失函数;基于第一分割结果与点标签之间的交叉熵损失函数、二分割结果与点标签之间的交叉熵损失函数和第二损失函数,获取目标损失函数。该过程的实现原理与上述步骤20421至步骤20423相同,此处不再赘述。

在获取目标损失函数之后,利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型。在示例性实施例中,利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练的过程为迭代过程:利用目标损失函数反向更新第一初始分割模型的参数和第二初始分割模型的参数;每更新一次两个分割模型的参数,则判断一次训练过程是否满足训练终止条件;若训练过程满足训练终止条件,则停止迭代过程,将对第一初始分割模型进行训练得到的模型作为第一目标分割模型,将对第二初始分割模型进行训练得到的模型作为第二目标分割模型。

若训练过程不满足训练终止条件,则根据步骤201至步骤204的方式获取新的目标损失函数,并利用新的目标损失函数反向更新两个分割模型的参数。以此类推,直至训练过程满足训练终止条件,得到第一目标分割模型和第二目标分割模型。需要说明的是,在根据步骤201至步骤204的方式获取新的目标损失函数的过程中,依据的样本图像可以发生变化也可以不变,本申请实施例对此不加以限定。用于对样本图像进行分割的分割模型为对第一初始分割模型的参数进行更新后得到的分割模型,用于对第一通道图像进行分割的分割模型为对第二初始分割模型的参数进行更新后得到的分割模型。

示例性地,分割模型的训练的过程如图7所示。将样本图像输入第一初始分割模型,由第一初始分割模型对样本图像进行分割,得到第一分割结果;将第一通道图像输入第二初始分割模型,由第二初始分割模型对第一通道图像进行分割,得到第二分割结果。根据第一分割结果与点边标签(即第一标签)之间的交叉熵损失函数以及第一分割结果与聚类标签(即第二标签)之间的交叉熵损失函数,得到第一分割结果与辅助标签之间的交叉熵损失函数;根据第二分割结果与点边标签(即第一标签)之间的交叉熵损失函数以及第二分割结果与聚类标签(即第二标签)之间的交叉熵损失函数,得到第一分割结果与辅助标签之间的交叉熵损失函数;基于第一分割结果和第二分割结果,获取第一损失函数,示例性地,该第一损失函数还可以称为协同训练损失函数。利用基于第一分割结果与辅助标签之间的交叉熵、第二分割结果与辅助标签之间的交叉熵和第一损失函数获取的目标损失函数对第一初始分割模型和第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型。

第一目标分割模型和第二目标分割模型为训练好的分割模型,在训练得到第一目标分割模型和第二目标分割模型后,利用第一目标分割模型和第二目标分割模型获取待处理图像的目标分割结果。

在一种可能实现方式中,利用第一目标分割模型和第二目标分割模型获取目标分割结果的过程为:基于待处理图像,获取第一染色成分对应的第二通道图像;调用第一目标分割模型对待处理图像进行分割,得到第一分割结果;调用第二目标分割模型对第二通道图像进行分割,得到第二分割结果;基于第一分割结果和第二分割结果,获取目标分割结果。该过程的实现方式参见图8所示的实施例,此处暂不赘述。

在示例性实施例中,本申请实施例提供的分割模型的训练方法能够在计算机设备的多种操作系统环境下使用,例如,Linux(一种操作系统)、Windows(一种操作系统)以及MacOS(一种操作系统)等。示例性地,计算机设备上配备有GPU(Graphics ProcessingUnit,图像处理器),以大幅度提高计算速度。

本申请实施例中,在模型训练过程中,除关注了用于提供参考对象的子图像的纹理特征的样本图像外,还关注了用于提供子图像的边界特征的第一通道图像,基于此种方式训练得到的两个目标分割模型能够综合考虑子图像的纹理特征和边界特征,考虑的信息较全面,模型的训练效果较好,从而有利于提高利用训练得到的目标分割模型获取的目标分割结果的准确性。

基于上述图1所示的实施环境,本申请实施例提供一种图像处理方法,该图像处理方法由计算机设备执行,该计算机设备可以为服务器12,也可以为终端11,本申请实施例对此不加以限定。如图8所示,本申请实施例提供的图像处理方法包括如下步骤801至步骤804:

在步骤801中,获取待处理图像、第一目标分割模型和第二目标分割模型,待处理图像包括被第一染色成分染色的参考对象的子图像。

其中,第一目标分割模型和第二目标分割模型基于样本图像、基于样本图像获取的第一染色成分对应的第一通道图像以及样本图像对应的点标签训练得到。第一目标分割模型和第二目标分割模型用于对待处理图像进行处理,训练得到第一目标分割模型和第二目标分割模型的方式参见图2所示的实施例,此处不再赘述。本申请实施例中的获取第一目标分割模型和第二目标分割模型可以是指通过实时训练的方式训练得到第一目标分割模型和第二目标分割模型,也可以是指将预先训练好并存储的第一目标分割模型和第二目标分割模型提取出来,本申请实施例对此不加以限定。

待处理图像是需要进行处理,以获取用于指示包括的参考对象的子图像在图像中所处的区域的图像。在示例性实施例中,待处理图像为与图2所示的实施例中的样本图像相同类型、相同尺寸的图像,以保证第一目标分割模型和第二目标分割模型对待处理图像的处理效果。示例性地,对于样本图像为组织病理图像的情况,待处理图像同样为组织病理图像。

本申请实施例对待处理图像的获取方式不加以限定。在示例性实施例中,计算机设备获取待处理图像的方式包括但不限于:计算机设备从图像库中提取待处理图像;与计算机设备建立有通信连接的图像采集设备将采集的待处理图像发送至计算机设备;计算机设备获取人为上传的待处理图像等。

需要说明的是,待处理图像的数量为一个或多个,对于待处理图像的数量为多个的情况,每个待处理图像均根据步骤802至步骤804的方式,获取一个目标分割结果。本申请实施例以待处理图像的数量为一个为例进行说明。

在步骤802中,基于待处理图像,获取第一染色成分对应的第二通道图像。

在一种可能实现方式中,待处理图像为在第一颜色空间下呈现出的图像,基于待处理图像,获取第一染色成分对应的第二通道图像的方式为:将待处理图像从第一颜色空间映射到第一染色成分所在的染色剂对应的颜色空间,得到待处理图像中的像素点在第一染色成分下对应的通道值;基于待处理图像中的像素点在第一染色成分下对应的通道值,获取第二通道图像。该过程的实现方式参见图2所示的实施例中的步骤202,此处不再赘述。

在步骤803中,调用第一目标分割模型对待处理图像进行分割,得到第一分割结果;调用第二目标分割模型对第二通道图像进行分割,得到第二分割结果。

该步骤803的实现方式参见图2所示的实施例中的步骤203,此处不再赘述。

在步骤804中,基于第一分割结果和第二分割结果,获取待处理图像的目标分割结果。

第一分割结果是由第一目标分割模型对待处理图像进行分割得到的,更多关注纹理方面的特征;第二分割结果是由第二目标分割模型对从待处理图像中分解出的更充分体现边界特征的通道图像进行分割得到的,更多关注边界方面的特征。基于第一分割结果和第二分割结果获取目标分割结果,有利于提高目标分割结果的可靠性。目标分割结果用于指示参考对象的子图像在待处理图像中所处的区域。也就是说,根据目标分割结果,能够得知待处理图像中的哪些区域为参考对象的子图像所处的区域。

本申请实施例对基于第一分割结果和第二分割结果,获取目标分割结果的方式不加以限定,只要保证目标分割结果是通过综合第一分割结果和第二分割结果得到的即可。

在一种可能实现方式中,基于第一分割结果和第二分割结果,获取待处理图像的目标分割结果的方式为:获取第一分割结果和第二分割结果的平均结果,将平均结果作为待处理图像的目标分割结果。

示例性地,第一分割结果和第二分割结果均用于指示像素点属于参考对象的子图像的概率以及不属于参考对象的子图像的概率。获取第一分割结果和第二分割结果的平均结果的方式为:将第一分割结果指示的某一像素点属于参考对象的子图像的概率与第二分割结果指示的该同一像素点属于参考对象的子图像的概率的平均值,作为该像素点属于参考对象的子图像的平均概率;将第一分割结果指示的该像素点不属于参考对象的子图像的概率与第二分割结果指示的该像素点不属于参考对象的子图像的概率的平均值,作为该像素点不属于参考对象的子图像的平均概率;将用于指示各个像素点属于参考对象的子图像的平均概率以及不属于参考对象的子图像的平均概率的结果作为平均结果。该平均结果即为待处理图像的目标分割结果。

在一种可能实现方式中,第一分割结果包括各个像素点分别对应的第一分割子结果,任一像素点对应的第一分割子结果用于指示通过对待处理图像进行分割确定的该像素点属于参考对象的子图像的概率以及该像素点不属于参考对象的子图像的概率。第二分割结果包括各个像素点分别对应的第二分割子结果,任一像素点对应的第二分割子结果用于指示通过对第二通道图像进行分割确定的该像素点属于参考对象的子图像的概率以及该像素点不属于参考对象的子图像的概率。

基于第一分割结果和第二分割结果,获取待处理图像的目标分割结果的方式为:对于某一像素点,将第一分割结果中包括的该像素点对应的第一分割子结果和第二分割结果中包括的该像素点对应的第二分割子结果中满足选取条件的分割子结果作为该像素点对应的目标分割子结果;将包括各个像素点分别对应的目标分割子结果的分割结果作为待处理图像的目标分割结果。

满足选取条件的分割子结果根据经验设置,或者根据应用场景灵活调整,本申请实施例对此不加以限定。示例性地,满足选取条件的分割子结果是指第一分割子结果和第二分割子结果中指示的属于参考对象的子图像的概率较大的分割子结果;或者,满足选取条件的分割子结果是指第一分割子结果和第二分割子结果中指示的属于参考对象的子图像的概率较小的分割子结果等。

在一种可能实现方式中,在获取待处理图像的目标分割结果之后,还包括:对目标分割结果进行变换,得到图像处理结果。目标分割结果用于指示各个像素点属于参考对象的子图像的概率以及不属于参考对象的子图像的概率,对目标分割结果进行变换的过程为根据目标分割结果确定各个像素点是否属于参考对象的子图像的过程。将用于指示各个像素点是否属于参考对象的子图像的结果作为图像处理结果。示例性地,图像处理结果的形式可以为图像,也可以为数值对。示例性地,对于图像处理结果的形式为数值对的情况,可以将数值对可视化为图像,以便于直观观察。

本申请实施例中,待处理图像的目标分割结果是通过调用第一目标分割模型和第二目标分割模型获取得到的,第一目标分割模型和第二目标分割模型能够综合考虑参考对象的子图像的纹理特征和边界特征,考虑的信息较丰富,模型的训练效果较好,从而使得获取的目标分割结果的准确性较高。

接下来,介绍本申请实施例在一个实际的应用场景中的示例性应用。

在示例性实施例中,本申请实施例提供的分割模型的训练方法和图像处理方法能够应用于对组织病理图像中的细胞核的子图像进行分割的应用场景中,在此种应用场景下,样本图像以及待处理图像均为组织病理图像,组织病理图像为对利用HE染色剂染色后获得的病理玻片中的某一区域视野进行图像采集得到的图像。样本图像以及待处理图像中包括的被第一染色成分染色的参考对象的子图像是指组织病理图像中被H染色成分染色的细胞核的子图像。

在组织病理图像分析中,细胞核的形状、大小、密度等指标与癌症的诊断和治疗有关,成功的分割结果,特别是精确的细胞核的子图像的分割边界,对于病理诊断、预后等临床预测具有重要意义,因此细胞核的子图像的分割是分析的重要步骤。然而,在组织病理图像中,细胞核体积小、数量多,获取大量完整的细胞核标注是费时费力的,用点标签来标记细胞核的子图像更为省时省力。因此,本申请实施提供了一种基于协同训练的弱监督细胞核的子图像的分割方法。该方法能够在只有点标签的情况下对HE染色的组织病理图像中的细胞核的子图像进行准确的分割,从而在满足分割精度的前提下减轻病理学家的标注负担。

参见图9,基于本申请实施例提供的分割模型的训练方法和图像处理方法,对组织病理图像中的细胞核的子图像进行分割的过程包括以下步骤901至步骤909:

在步骤901中,获取样本组织病理图像和样本组织病理图像对应的点标签,样本组织病理图像包括被苏木精染色成分染色的细胞核的子图像。

在步骤902中,基于样本组织病理图像,获取苏木精染色成分对应的第一通道图像。

在步骤903中,调用第一初始分割模型对样本组织病理图像进行分割,得到第一样本分割结果;调用第二初始分割模型对第一通道图像进行分割,得到第二样本分割结果。

在步骤904中,基于点标签,获取第一标签和第二标签。

在步骤905中,基于第一样本分割结果、第一标签和第二标签,获取第一样本分割结果与辅助标签之间的交叉熵损失函数;基于第二样本分割结果、第一标签和第二标签,获取第二样本分割结果与辅助标签之间的交叉熵损失函数;基于第一样本分割结果和第二样本分割结果,获取第一损失函数;基于第一样本分割结果与辅助标签之间的交叉熵损失函数、第二样本分割结果与辅助标签之间的交叉熵损失函数和第一损失函数,获取目标损失函数;利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型。

在步骤906中,获取待处理组织病理图像、第一目标分割模型和第二目标分割模型,待处理组织病理图像包括被苏木精染色成分染色的细胞核的子图像。

在步骤907中,基于待处理组织病理图像,获取苏木精染色成分对应的第二通道图像。

在步骤908中,调用第一目标分割模型对待处理组织病理图像进行分割,得到第一分割结果;调用第二目标分割模型对第二通道图像进行分割,得到第二分割结果。

在步骤909中,获取第一分割结果和第二分割结果的平均结果,将平均结果作为待处理组织病理图像的目标分割结果。

上述步骤901至步骤905的实现方式参见图2所示的实施例,上述步骤906至步骤909的实现方式参见图8所示的实施例,此处不再赘述。在示例性实施例中,上述步骤901至步骤905的过程在离线阶段执行,上述步骤906至步骤909的过程在线上执行,执行一次上述步骤901至步骤905的过程获取第一目标分割模型和第二目标分割模型之后,可以在线上多次执行上述步骤906至步骤909的过程。

示例性地,通道图像还可以称为成分图。在本申请实施例中,首先从HE染色的样本组织病理图像的颜色空间中提取苏木精成分,得到细胞核的子图像更为清晰的成分图。样本组织病理图像具有更为充分的纹理特征,成分图具有更清晰的细胞核的子图像的边界。然后利用点标签生成辅助标签(第一标签和第二标签),分别基于样本组织病理图像和成分图对两个分割模型进行弱监督学习训练,同时对两个分割模型进行协同训练,学习互补的细胞核信息。

基于弱监督的学习方法减轻了病理学专家的标注负担,有效利用组织病理图像上表示细胞核的子图像的准确位置的点标签来生成辅助标签,为模型提供粗略的学习信息。基于协同训练的方法有效结合了原始的HE染色的彩色组织病理图像和提取苏木精成分的成分图的互补信息,实现较为精确的细胞核的子图像的分割,从而能够为进一步的组织病理图像自动分析奠定基础。

本申请实施例提供的方法可应用于组织病理图像自动分析,通过对细胞核的子图像的分割结果的后续计算可得到细胞核的平均大小、密度、排列等特征,从而实现不同类型的癌症分级、病人的风险分层等癌症的临床诊断和治疗。此外,除细胞核的子图像的分割外,本申请实施例提供的方法还可应用于细胞的子图像的分割,或者体积小、数量多且排列密集的组织的子图像的分割。细胞的子图像的分割以及其他组织的子图像的分割的原理与细胞核的子图像的分割的原理相同,此处不再加以赘述。

参见图10,本申请实施例提供了一种分割模型的训练装置,该装置包括:

第一获取单元1001,用于获取样本图像以及获取样本图像对应的点标签,样本图像包括被第一染色成分染色的参考对象的子图像,样本图像对应的点标签基于子图像在样本图像中所处的区域内的参考点确定,样本图像用于提供子图像的纹理特征;

第二获取单元1002,用于基于样本图像,获取第一染色成分对应的第一通道图像,第一通道图像用于提供子图像的边界特征;

调用单元1003,用于调用第一初始分割模型对样本图像进行分割,得到第一分割结果;调用第二初始分割模型对第一通道图像进行分割,得到第二分割结果;

第三获取单元1004,用于基于第一分割结果、第二分割结果以及点标签,获取目标损失函数;

训练单元1005,用于利用目标损失函数对第一初始分割模型和第二初始分割模型进行训练,得到第一目标分割模型和第二目标分割模型,第一目标分割模型和第二目标分割模型用于获取待处理图像的目标分割结果。

在一种可能实现方式中,第三获取单元1004,用于基于点标签,获取样本图像对应的辅助标签,辅助标签提供的监督信息多于点标签提供的监督信息;基于第一分割结果、第二分割结果以及辅助标签,获取目标损失函数。

在一种可能实现方式中,辅助标签包括第一标签;第三获取单元1004,还用于基于点标签,确定子图像在样本图像中所处的区域内的参考点;在样本图像中生成与参考点对应的泰森多边形;基于参考点和泰森多边形,获取第一标签,第一标签包括用于指示位于参考点上的像素点属于子图像的子标签、用于指示位于泰森多边形上的像素点不属于子图像的子标签,以及用于指示位于参考点以及泰森多边形外的像素点属于不确定像素点的子标签。

在一种可能实现方式中,辅助标签包括第二标签;第三获取单元1004,还用于基于点标签,确定子图像在样本图像中所处的区域内的参考点;基于参考点,获取样本图像中的各个像素点分别对应的参考特征;基于各个像素点分别对应的参考特征,对各个像素点进行聚类,得到聚类结果,聚类结果包括第一聚类簇和第二聚类簇;基于聚类结果,获取第二标签,第二标签包括用于指示第一聚类簇中的像素点属于子图像的子标签、用于指示第二聚类簇中的像素点不属于子图像的子标签,以及用于指示除第一聚类簇和第二聚类簇中的像素点外的像素点属于不确定像素点的子标签。

在一种可能实现方式中,第三获取单元1004,还用于对于第一像素点,将第一像素点与目标参考点之间的距离作为第一像素点对应的距离特征,目标参考点为距离第一像素点最近的参考点,第一像素点为各个像素点中的任意一个像素点;基于第一像素点对应的距离特征和第一像素点具有的颜色特征,获取第一像素点对应的参考特征。

在一种可能实现方式中,第三获取单元1004,还用于获取第一分割结果与辅助标签之间的交叉熵损失函数,以及第二分割结果与辅助标签之间的交叉熵损失函数;基于第一分割结果和第二分割结果,获取第一损失函数;基于第一分割结果和辅助标签之间的交叉熵损失函数、第二分割结果和辅助标签之间的交叉熵损失函数以及第一损失函数,获取目标损失函数。

在一种可能实现方式中,第三获取单元1004,还用于获取第一分割结果与第二分割结果之间的交叉熵损失函数,以及第一分割结果与第二分割结果之间的散度损失函数;基于交叉熵损失函数和散度损失函数,获取第一损失函数。

在一种可能实现方式中,样本图像具有参考对象标签,第一获取单元1001,用于基于参考对象标签,确定子图像在样本图像中所处的区域;确定子图像在样本图像中所处的区域的区域中心;基于区域中心,确定参考点;基于参考点,确定样本图像对应的点标签。

本申请实施例中,在模型训练过程中,除关注了用于提供参考对象的子图像的纹理特征的样本图像外,还关注了用于提供子图像的边界特征的第一通道图像,基于此种方式训练得到的两个目标分割模型能够综合考虑子图像的纹理特征和边界特征,考虑的信息较全面,模型的训练效果较好,从而有利于提高利用训练得到的目标分割模型获取的目标分割结果的准确性。

参见图11,本申请实施例提供了一种图像处理装置,该装置包括:

第一获取单元1101,用于获取待处理图像、第一目标分割模型和第二目标分割模型,待处理图像包括被第一染色成分染色的参考对象的子图像,第一目标分割模型和第二目标分割模型基于样本图像、基于样本图像获取的第一染色成分对应的第一通道图像以及样本图像对应的点标签训练得到;

第二获取单元1102,用于基于待处理图像,获取第一染色成分对应的第二通道图像;

调用单元1103,用于调用第一目标分割模型对待处理图像进行分割,得到第一分割结果;调用第二目标分割模型对第二通道图像进行分割,得到第二分割结果;

第三获取单元1104,用于基于第一分割结果和第二分割结果,获取待处理图像的目标分割结果。

在一种可能实现方式中,待处理图像为在第一颜色空间下呈现出的图像,第二获取单元1102,用于将待处理图像从第一颜色空间映射到第一染色成分所在的染色剂对应的颜色空间,得到待处理图像中的像素点在第一染色成分下对应的通道值;基于待处理图像中的像素点在第一染色成分下对应的通道值,获取第二通道图像。

在一种可能实现方式中,第三获取单元1104,用于获取第一分割结果和第二分割结果的平均结果,将平均结果作为待处理图像的目标分割结果。

本申请实施例中,处理图像的目标分割结果是通过调用第一目标分割模型和第二目标分割模型获取得到的,第一目标分割模型和第二目标分割模型能够综合考虑参考对象的子图像的纹理特征和边界特征,考虑的信息较丰富,模型的训练效果较好,从而使得获取的目标分割结果的准确性较高。

需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行,以使该计算机设备实现上述任一种分割模型的训练方法或图像处理方法。该计算机设备可以为服务器,也可以为终端,本申请实施例对此不加以限定。接下来,分别对服务器和终端的结构进行介绍。

图12是本申请实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)1201和一个或多个存储器1202,其中,该一个或多个存储器1202中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1201加载并执行,以使该服务器实现上述各个方法实施例提供的分割模型的训练方法或图像处理方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。

图13是本申请实施例提供的一种终端的结构示意图。示例性地,该终端可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常,终端包括有:处理器1301和存储器1302。

处理器1301可以包括一个或多个处理核心。处理器1301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1301可以集成有GPU,GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器1302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1301所执行,以使该终端实现本申请中方法实施例提供的分割模型的训练方法或图像处理方法。

在一些实施例中,终端还可选包括有:外围设备接口1303和至少一个外围设备。处理器1301、存储器1302和外围设备接口1303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1303相连。具体地,外围设备包括:射频电路1304、显示屏1305、摄像头组件1306、音频电路1307、定位组件1308和电源1309中的至少一种。

外围设备接口1303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1301和存储器1302。射频电路1304用于接收和发射RF(RadioFrequency,射频)信号,也称电磁信号。射频电路1304通过电磁信号与通信网络以及其他通信设备进行通信。显示屏1305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。摄像头组件1306用于采集图像或视频。

音频电路1307可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1301进行处理,或者输入至射频电路1304以实现语音通信。扬声器则用于将来自处理器1301或射频电路1304的电信号转换为声波。定位组件1308用于定位终端的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。电源1309用于为终端中的各个组件进行供电。电源1309可以是交流电、直流电、一次性电池或可充电电池。

在一些实施例中,终端还包括有一个或多个传感器1310。该一个或多个传感器1310包括但不限于:加速度传感器1311、陀螺仪传感器1312、压力传感器1313、指纹传感器1314、光学传感器1315以及接近传感器1316。

加速度传感器1311可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器1312可以检测终端的机体方向及转动角度,陀螺仪传感器1312可以与加速度传感器1311协同采集用户对终端的3D动作。压力传感器1313可以设置在终端的侧边框和/或显示屏1305的下层。当压力传感器1313设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1301根据压力传感器1313采集的握持信号进行左右手识别或快捷操作。当压力传感器1313设置在显示屏1305的下层时,由处理器1301根据用户对显示屏1305的压力操作,实现对UI界面上的可操作性控件进行控制。

指纹传感器1314用于采集用户的指纹,由处理器1301根据指纹传感器1314采集到的指纹识别用户的身份,或者,由指纹传感器1314根据采集到的指纹识别用户的身份。光学传感器1315用于采集环境光强度。接近传感器1316,也称距离传感器,通常设置在终端的前面板。接近传感器1316用于采集用户与终端的正面之间的距离。

本领域技术人员可以理解,图13中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由计算机设备的处理器加载并执行,以使计算机实现上述任一种分割模型的训练方法或图像处理方法。

在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact DiscRead-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种分割模型的训练方法或图像处理方法。

在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。也即是,上述终端和服务器均可以作为区块链系统中的节点设备。

需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以上示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

技术分类

06120113806536