掌桥专利:专业的专利平台
掌桥专利
首页

乳腺特征提取、检测模型的训练方法、装置

文献发布时间:2023-06-19 16:09:34



技术领域

本申请涉及医学图像处理技术领域,特别是涉及一种乳腺特征提取、检测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

背景技术

在对乳腺组织进行检查时,可以采用钼靶筛查、计算机断层扫描、超声或核磁共振对乳腺进行成像。在成像后,可以通过人工对乳腺成像进行勾画,以标识出可能存在异常的区域。但是,该方式过于费时费力,并且主观性较强,导致判别异常的准确率不高。为了解决该问题,传统技术中引入了基于深度学习、神经网络等构建的检测模型进行异常自动判别。这类检测模型在处理过程中需要进行特征提取,而特征提取的效果与最后的检测准确度息息相关。但是,由于缺少大量的样本集,使得检测模型在训练过程中难以学习并确定哪些区域和乳腺异常相关,从而忽略某些重要区域的特征没有提取,导致检测模型仍无法达到较高的检测精度。

发明内容

基于此,有必要针对上述技术问题,提供一种能够以较少样本量训练出精度较高模型的乳腺特征提取、检测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本发明实施例提供一种乳腺特征提取模型的训练方法,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练方法包括:将原始乳腺图像划分为多个区域;从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像;其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定;利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像;根据还原图像与原始乳腺图像之间的差异,确定第一差异;以缩小第一差异为目标,调整初始特征模型;基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。

在其中一个实施例中,区域属性包括正样本属性和负样本属性,具有正样本属性的区域所包含感兴趣图像的比例大于或等于预设比例阈值,具有负样本属性的区域所包含感兴趣图像的比例小于预设比例阈值,待替换区域包括第一待替换区域和第二待替换区域,目标区域包括第一目标区域和第二目标区域,替换图像包括第一替换图像和第二替换图像;

从多个区域中确定至少一个待替换区域和目标区域包括:

以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域;以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域;

将待替换区域的图像替换为目标区域的图像,以得到多个替换图像包括:

将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

在其中一个实施例中,初始特征模型还包括区域替换模型,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

在其中一个实施例中,以缩小第一差异为目标,调整初始特征模型前还包括:根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异;

以缩小第一差异为目标,调整初始特征模型包括:

以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。

在其中一个实施例中,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像包括:对第一目标区域的图像进行图像变换处理;将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。

在其中一个实施例中,在将原始乳腺图像划分为多个区域之前还包括:对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。

第二方面,本发明实施例提供一种乳腺检测模型的训练方法,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型,训练方法包括:将标注乳腺图像输入乳腺特征提取模型,得到图像特征;标注乳腺图像中的标注用于反映感兴趣图像的检测结果;将图像特征输入特征识别模型,得到预测检测结果;根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异;以缩小第四差异为目标,调整初始检测模型,基于训练结束后的初始检测模型得到乳腺检测模型。

第三方面,本发明实施例提供一种乳腺特征提取模型的训练装置,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练装置包括:区域划分模块,用于将原始乳腺图像划分为多个区域;替换图像获取模块,用于从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像;其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定;图像处理模块,用于利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像;差异确定模块,用于根据还原图像与原始乳腺图像之间的差异,确定第一差异;参数调整模块,用于以缩小第一差异为目标,调整初始特征模型;模型确定模块,用于基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。

第四方面,本发明实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤,或上述的方法的步骤。

第五方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。

第六方面,本发明实施例一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。

基于上述任一实施例,对原始乳腺图像进行区域替换处理,得到与原始乳腺图像对应的多个替换图像,再利用初始特征模型对替换图像进行特征提取以及还原。在调整初始特征模型的过程中,使得还原图像和原始乳腺图像之间的差异逐渐减小,以逐渐提高编码器模型的特征提取能力,保证编码器模型可以关注到易被忽略区域的特征。该方法应用于原始乳腺图像较少,导致训练样本数量不足的场景下,通过区域替换处理可以得到许多有学习价值的图像,为训练提供了大量样本,既保证了高训练精度、节省训练时间,能够以较少的原始乳腺图像进行训练达到和使用大量原始乳腺图像进行训练同样的效果。

附图说明

图1为一个实施例中乳腺特征提取模型的训练方法的流程示意图;

图2为一个实施例中对原始乳腺图像进行区域替换的流程示意图;

图3为另一个实施例中对原始乳腺图像进行区域替换的流程示意图;

图4为一个实施例中乳腺检测模型的训练方法的流程示意图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的乳腺特征提取模型以及乳腺检测模型的训练方法可以应用于终端、物理服务器或云服务器。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。物理服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在乳腺检测模型训练完成后将其布置在终端、物理服务器或云服务器,可以用于对乳腺图像中进行检测,检测任务包括但不限于图像分割、目标检测、图像分类等。在另一种可能实现方式中,终端、物理服务器或云服务器也可以在有检测任务时调用其它终端、物理服务器或云服务器上的乳腺检测模型执行检测任务的过程,本申请实施例对此不作限定。

在一个实施例中,如图1所示,提供了一种乳腺特征提取模型的训练方法,该方法可用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练方法包括步骤S102至步骤S112。

S102,将原始乳腺图像划分为多个区域。

通过医疗影像技术对乳腺组织进行成像可得到乳腺成像,对乳腺成像中的感兴趣图像进行标注即可得到原始乳腺图像。感兴趣图像处的乳腺组织可能出现了病变,根据感兴趣图像的位置确定对应乳腺组织的位置,从而进行进一步的化验检查。标注可以是对乳腺成像进行人工、自动、半自动地勾画进行的。原始乳腺图像中感兴趣图像的标注可以是在乳腺成像上的实际标注框,也可以是感兴趣图像的位置,如坐标。另外,由于原始乳腺图像的尺寸较大,为了保证处理速度,先将原始乳腺图像划分为多个区域,对每个区域的图像分别进行处理可保证效率。可选地,可以通过滑窗法、随机采样法、网格法等方式对原始乳腺图像进行区域划分。另外,本实施例中的输入编码器模型,并不一定是对原始乳腺图像进行了实际的图像裁剪。可以根据初始特征模型的结构,确定是否需要进行实际上的图像裁剪。例如,当初始特征模型采用transformer结构,则需要将输入模型的图像裁剪为小块。但如果初始特征模型采用卷积神经网络的结构且计算性能较好,可以不进行图像裁剪。

S104,从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像。

其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定。具体而言,区域属性包括正样本属性和负样本属性,具有正样本属性的区域所包含感兴趣图像的比例大于或等于预设比例阈值,具有负样本属性的区域所包含感兴趣图像的比例小于预设比例阈值。预设比例阈值可以根据实际情况自行设定,例如选择预设比例阈值为10%。由于原始乳腺图像中存在关于感兴趣图像的标注,因此,可以基于标注确定划分后的每个区域中所包含感兴趣图像的比例。例如,在标注为标注框时,可以确定本区域内的标注框所圈定的感兴趣图像的像素点数量与本区域内所有像素点数量之间的比例。或者在标注为感兴趣图像的位置时,可以确定感兴趣图像位置与本区域的位置的重合比例。

由于对乳腺成像进行标注较为费时费力,所以原始乳腺图像的数量较少。所以可用于进行模型训练的样本数量不足,而本实施例对原始乳腺图像进行区域替换,得到与该原始乳腺图像对应的多个有学习价值的替换图像。具体而言,当待替换区域为具有正样本属性的区域时,该待替换区域对应的目标区域为具有负样本属性的区域,反之也类似。待替换区域与目标区域之间的对应关系可以为一一对应或者两个以上的待替换区域对应一个目标区域,本实施例中不做限定。为了基于一个原始乳腺图像得到多个不同的替换图像,替换的方式有很多。例如,对于同一待替换区域,分别使用不同的目标区域进行替换,可得到多个替换图像。又如,选择不同的待替换区域,使用相同或不同的目标区域进行替换,可得到多个替换图像。替换的方式不限于上述举例,可以使用多种替换方式中的一种或多种只要能得到不同的替换图像即可。

S106,利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。

S108,根据还原图像与原始乳腺图像之间的差异,确定第一差异。

S110,以缩小第一差异为目标,调整初始特征模型。

可以理解,传统技术中包括自编码器神经网络,其由编码器模型和解码器模型组成。对于训练好的自编码器神经网络,将一个对象输入编码器模型进行特征提取,而解码器模型可以将特征提取还原为输入对象。基于该种神经网络技术,本实施例将替换图像输入编码器模型,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。

与常规自编码器神经网络不同的是,本实施例中对初始特征模型的训练并非是希望将替换图像输入后得到的还原图像接近于替换图像,而是希望还原图像可以接近于原始乳腺图像。这是因为,由于替换图像是经过区域替换的原始乳腺图像,如果想将被替换区域的图像还原,则需要从与被替换区域具有相同区域属性的区域学习到该区域属性所具有的特征,才能基于该特征实现还原。所以以缩小第一差异为目标对初始特征模型进行调整的过程中,编码器模型可以了解到具有正样本属性或负样本属性的区域中那些特征最为重要,从而迫使编码器能关注到在样本量较少时未关注到但具有重要特征的区域。

因此,随着第一差异的减小,编码器模型对乳腺相关图像进行特征提取的能力越强,即根据其输出的图像特征与更容易准确判断区域内感兴趣图像的相关情况。具体而言,对初始特征模型进行调整可以基于第一差异构建第一损失函数,以缩小第一损失函数的值为目标,分别调整编码器模型对应的第一参数和解码器模型对应的第二参数。第一损失函数可以为均方差(Mean Squared Error,MSE)损失函数、平均绝对误差(Mean AbsoluteError,MAE)损失函数、dice损失函数、交叉熵损失函数等形式。可以采用其中的一种或多种的组合,在采用多种形式的损失函数时,还可为不同损失函数设定对应的权重。

S112,基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。

在整个训练过程中,步骤S102至S110可以重复多次执行,即可以针对某一原始乳腺图像重复执行,也可以是在重新选择另一原始乳腺图像后重复多次执行,本实施例中不做限定。训练结束的条件可以根据实际情况进行设计,如第一差异小于第一阈值、迭代的次数达到第一预设次数等。训练结束后的编码器模型可以关注到被传统特征提取模型忽略的区域,从而更全面的提取特征。基于训练结束后的编码器模型所得到的乳腺特征提取模型可用于进一步的乳腺检测,例如用于对乳腺图像进行分类、目标检测、图像分割等,由于乳腺特征提取模型的特征提取能力很强,为提高乳腺检测的精准度打下了基础。

基于本实施例中的乳腺特征提取模型的训练方法,对原始乳腺图像进行区域替换处理,得到与原始乳腺图像对应的多个替换图像,再利用初始特征模型对替换图像进行特征提取以及还原。在调整初始特征模型的过程中,使得还原图像和原始乳腺图像之间的差异逐渐减小,以逐渐提高编码器模型的特征提取能力,保证编码器模型可以关注到易被忽略区域的特征。该方法应用于原始乳腺图像较少,导致训练样本数量不足的场景下,通过区域替换处理可以得到许多有学习价值的图像,为训练提供了大量样本,既保证了高训练精度、节省训练时间,能够以较少的原始乳腺图像进行训练达到和使用大量原始乳腺图像进行训练同样的效果。

在其中一个实施例中,待替换区域包括第一待替换区域和第二待替换区域。目标区域包括第一目标区域和第二目标区域。替换图像包括第一替换图像和第二替换图像。请参阅图2,从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像包括S202至步骤S206。

S202,以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域。

从具有负样本属性的区域中选择一个或多个作为第一待替换区域。第一待替换区域中所包含区域的数量与具有负样本属性的区域的总数之间的比可以为第一预设比例。第一预设比例的大小会影响替换图像与原始乳腺图像之间的差异。第一预设比例越大,说明被替换的区域越多,由此得到的替换图像与原始乳腺图像之间的差异越大,反之类似,不再赘述。

S204,以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域。

从具有正样本属性的区域中选择一个或多个作为第二待替换区域。第二待替换区域中所包含区域的数量与具有正样本属性的区域的总数之间的比可以为第二预设比例。第二预设比例的大小会影响替换图像与原始乳腺图像之间的差异。第二预设比例越大,说明被替换的区域越多,由此得到的替换图像与原始乳腺图像之间的差异越大,反之类似,不再赘述。

S206,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

仅对原始乳腺图像中具有负样本属性的区域进行替换可以得到第一替换图像,基于第一替换图像可以进行很好的还原,则说明编码器模型可以从第二替换图像中提取出与正常乳腺组织的图像相关的特征。仅对原始乳腺图像中具有正样本属性的区域进行替换可以得到第二替换图像,基于第二替换图像可以进行很好的还原,则说明编码器模型可以提取出感兴趣图像相关的重要特征。

在其中一个实施例中,初始特征模型还包括区域替换模型,即区域替换的相关处理可以由初始特征模型这一神经网络中的区域替换模型实现。具体而言,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并通过区域替换模型将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

即本实施例中区域替换处理也是由初始特征模型中的一个部分实现的,因此可以在训练初始特征模型的过程中一并调整区域替换模型,从而在多种替换方式中找到学习效果较佳的替换方式。

在其中一个实施例中,以缩小第一差异为目标,调整初始特征模型前还包括:根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异。以缩小第一差异为目标,调整初始特征模型包括:以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。

为了找到较好的区域替换方式,需要在调整编码器模型和解码器模型时一并调整区域替换模型,而为了提高编码器模型和解码器模型的能力,应加大还原难度。因此,区域替换模型可调整的方向即为,将替换图像与原始乳腺图像之间的差异扩大,和/或将第一替换图像和第二替换图像之间的差异扩大。这两种调整方向均可以为还原增加难度,如果编码器模型和解码器模型可以实现完成难度较大的还原任务,则说明编码器模型和解码器模型的能力进一步增强了。具体而言,在构建第一损失函数时,除了第一差异对应的损失项以外,还应增加第二差异和/或第三差异的损失项。但如果是以缩小第一损失函数的值为目标,分别调整编码器模型对应的第一参数、解码器模型对应的第二参数以及区域替换模型对应的第三参数,则应取第二差异和/或第三差异的损失项的负值加入第一损失函数中,才可实现缩小第一差异、且扩大第二差异和/或第三差异。其中,由于第一预设比例或第二预设比例均与替换图像和原始乳腺图像之间的差异相关,第三参数可包括第一预设比例和/或第二预设比例,从而选择出较为合适的第一预设比例和/或第二预设比例。可选地,为了评估上述第一差异、第二差异或第三差异,可以使用常见的图像质量评价指标,例如,PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)、SSIM(Structural Similarity,结构相似性)、MSE(Mean Square Error,均方误差)等。

在其中一个实施例中,请参阅图3,将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像包括S302至步骤S304。

S302,对第一目标区域的图像进行图像变换处理。

S304,将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。

具体而言,由于感兴趣图像在整个原始乳腺图像中的比例较小,所以具有正样本属性的区域的数量较少,使得可用于替换负样本区域的区域数量也较少,从而难以得到大量第一替换图像。为了解决该问题,可以对选择出来的第一目标区域的图像进行图像变换处理,例如随机旋转、翻转、缩放、镜像等,通过图像变换处理拓展了具有正样本属性的区域的数量,无需重新进行乳腺成像以及标注,就可得到额外的具有正样本属性的区域。在通过区域替换模型进行区域替换处理的情况下,本实施例中的步骤也可以由区域替换模型进行。

类似地,在一个实施例中,将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像包括:对第二目标区域的图像进行图像变换处理;将第二待替换区域的图像替换为经过图像变换处理后第二目标区域的图像,得到第二替换图像。考虑到具有负样本属性的区域数量较多,在有些实施例中可以不经过上述图像变换处理进行拓展。

在其中一个实施例中,在将原始乳腺图像划分为多个区域之前还包括:对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。可以理解,背景指的是与乳腺组织无关的图像,例如有些原始乳腺图像中包括的面积较大的黑色背景,从而导致在训练过程中初始特征模型需要处理较多无用图像,影响处理速度。因此,本实施例中通过边界分割处理将背景去除,加快训练速度。而边界分割处理可采用重采样法、阈值限制法、灰度直方图归一化法等进行。

在一个实施例中,如图4所示,提供了一种乳腺检测模型的训练方法,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型,训练方法包括步骤S402至步骤S410。

S402,将标注乳腺图像输入乳腺特征提取模型,得到图像特征。

标注乳腺图像中的标注用于反映感兴趣图像的检测结果。标注可以是对乳腺成像进行人工、自动、半自动等方式进行的。标注乳腺图像中的标注可以是在乳腺成像上对感兴趣图像的标注框,也可以是感兴趣图像的位置,如坐标,还可以是对感兴趣图像的性质分类,如感兴趣图像为良性或恶性、乳腺图像中是否包含感兴趣图像等。感兴趣图像可以为乳腺钙化组织图像、乳腺肿块组织图像等。由于乳腺特征提取模型是经过上述乳腺特征提取模型的训练方法所得到,所以其提取出的图像特征忽略了和感兴趣图像相关的特征的可能性很小,为提高乳腺检测的精准度打下基础。

S404,将图像特征输入特征识别模型,得到预测检测结果。

可以理解,特征识别模型用于根据图像特征输出预测检测结果。预测检测结果有多种形式,可根据需要执行的检测任务以及标注乳腺图像中检测结果的类别选择合适的特征识别模型,以得到对应的预测检测结果。可选地,在标注为标注框或感兴趣图像的位置时,特征识别模型可以为图像分割模型,图像分割模型可将乳腺图像中包含的感兴趣图像分割出来。特征识别模型还可以为目标检测模型,目标检测模型可将乳腺图像中包含的感兴趣图像检测出来。目标检测模型和图像分割模型的差别主要在于,目标检测模型的输出结果可直接在乳腺图像上框选出感兴趣图像,即可在乳腺图像上打上标注框,而图像分割模型的输出为掩膜图像,掩膜图像中感兴趣图像处的像素与其他非感兴趣图像不同,实现图像的分割。图像分割还具体包括语义分割、实例分割等,可根据实际需要选择对应的图像分割模型。可选地,当标注为性质分类时,特征识别模型可以为分类模型,分类模型可对乳腺图像进行分类,例如整个乳腺图像是否包含感兴趣图像、对标注乳腺图像所标注出的感兴趣图像为良性或恶性等。

S406,根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异。

确定第四差异的方式与选择的特征识别模型相关。例如,当特征识别模型为分割模型时,可以根据分割结果所得到的感兴趣图像与标注乳腺图像所标注出的感兴趣图像之间的重合度确定第四差异。当特征识别模型为目标检测模型时,可以根据目标检测结果中的标注框与标注乳腺图像的标注框之间差异确定第四差异。当特征识别模型为分类模型时,还可比较分类模型的分类结果与标注中的实际分类之间的差异确定第四差异。

S408,以缩小第四差异为目标,调整初始检测模型。

可以理解,由于注乳腺图像的标注可以准确反映感兴趣图像的检测结果,随着第四差异的减小,由初始检测模型预测出来的预测检测结果与准确的检测结果逐渐接近,使得自动检测的准确度逐渐提高。具体而言对初始检测模型进行调整,可以基于第四差异构建第二损失函数,以缩小第二损失函数的值为目标,分别调整乳腺特征提取模型对应的第四参数和特征识别模型对应的第五参数。第二损失函数可以为均方差(Mean SquaredError,MSE)损失函数、平均绝对误差(Mean Absolute Error,MAE)损失函数、dice损失函数、交叉熵损失函数等形式,在采用多种形式的损失函数时,还可为不同损失函数设定对应的权重。可选地,考虑到乳腺特征提取模型已经过初步训练,在本实施例中的调整过程中,先不对第四参数进行调整而仅调整第五参数,在满足预设训练条件后(可以为迭代次数达到第二预设次数后、第四差异小于第二阈值等),再同时对第四参数和第五参数进行微调。

S410,基于训练结束后的初始检测模型得到乳腺检测模型。

在整个训练过程中,步骤S402至S408可以重复多次执行,即可以针对某一标注乳腺图像重复执行,也可以是在重新选择另一标注乳腺图像后重复多次执行,本实施例中不做限定。训练结束的条件可以根据实际情况进行设计,如第四差异小于第三阈值、迭代的次数达到第三预设次数等。第三阈值大于或等于第二阈值。第三预设次数大于或等于第二预设次数。

基于本实施例中的乳腺检测模型的训练方法,对包含乳腺特征提取模型和特征识别模型的初始检测模型进行训练,由于乳腺特征提取模型具有很强的特征提取能力,在训练样本数量不足的情况下,仍可保证高训练精度、节省训练时间,能够以较少的标注乳腺图像进行训练达到和使用大量标注乳腺图像进行训练同样的效果。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

本发明实施例提供一种乳腺特征提取模型的训练装置,用于训练初始特征模型,初始特征模型包括编码器模型和解码器模型,训练装置包括区域划分模块、替换图像获取模块、图像处理模块、差异确定模块、参数调整模块以及模型确定模块,其中:

区域划分模块,用于将原始乳腺图像划分为多个区域。

替换图像获取模块,用于从多个区域中确定至少一个待替换区域和目标区域,并将待替换区域的图像替换为目标区域的图像,以得到多个替换图像。其中,目标区域与待替换区域的区域属性不同,区域属性由该区域所包含感兴趣图像的比例确定。

图像处理模块,用于利用编码器模型对替换图像进行特征提取,并利用解码器模型根据特征提取的结果进行图像还原,得到还原图像。

差异确定模块,用于根据还原图像与原始乳腺图像之间的差异,确定第一差异。

参数调整模块,用于以缩小第一差异为目标,调整初始特征模型。

模型确定模块,用于基于训练结束后的初始特征模型中的编码器模型得到乳腺特征提取模型。

在其中一个实施例中,待替换区域包括第一待替换区域和第二待替换区域。目标区域包括第一目标区域和第二目标区域。替换图像包括第一替换图像和第二替换图像。替换图像获取模块用于以至少一个具有负样本属性的区域为第一待替换区域,并以至少一个具有正样本属性的区域为第一目标区域;以至少一个具有正样本属性的区域为第二待替换区域,并以至少一个具有负样本属性的区域为第二目标区域;将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

区域替换处理的过程可以由替换图像获取模块独立执行。在初始特征模型这一神经网络中包括区域替换模型时,区域替换模型可用于进行区域替换处理。因此,替换图像获取模块也可以将原始乳腺图像发送至区域替换模型,通过区域替换模型对原始乳腺图像进行区域替换,替换图像获取模块获取区域替换模型输出的多个替换图像。具体而言,在其中一个实施例中,初始特征模型还包括区域替换模型。替换图像获取模块用于将原始乳腺图像输入区域替换模型,以通过区域替换模型将第一待替换区域的图像替换为第一目标区域的图像,得到第一替换图像,并通过区域替换模型将第二待替换区域的图像替换为第二目标区域的图像,得到第二替换图像。

在其中一个实施例中,差异确定模块用于根据多个替换图像与对应的原始乳腺图像之间差异,确定第二差异,和/或根据第一替换图像与第二替换图像之间的差异,确定第三差异。参数调整模块用于以缩小第一差异、且扩大第二差异和/或第三差异为目标,调整初始特征模型。

在其中一个实施例中,区域替换模型用于对第一目标区域的图像进行图像变换处理;将第一待替换区域的图像替换为经过图像变换处理后第一目标区域的图像,得到第一替换图像。

在其中一个实施例中,区域替换模型用于对第二目标区域的图像进行图像变换处理;将第二待替换区域的图像替换为经过图像变换处理后第二目标区域的图像,得到第二替换图像。

在其中一个实施例中,乳腺特征提取模型的训练装置还包括边界分割模块。边界分割模块用于对原始乳腺图像进行边界分割处理,以去除原始乳腺图像中的背景。

本发明实施例提供一种乳腺检测模型的训练装置,用于训练初始检测模型,初始检测模型包括特征识别模型和如上述的训练方法得到的乳腺特征提取模型。训练装置包括特征提取模块、预测模块、差异确定模块、参数调整模块以及模型确定模块,其中:

特征提取模块,用于将标注乳腺图像输入乳腺特征提取模型,得到图像特征。

预测模块,用于将图像特征输入特征识别模型,得到预测检测结果。

差异确定模块,用于根据预测检测结果与标注乳腺图像的标注之间的差异,确定第四差异。

参数调整模块,用于以缩小第四差异为目标,调整初始检测模型。

模型确定模块,用于基于训练结束后的初始检测模型得到乳腺检测模型。

上述乳腺特征提取模型以及乳腺检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

本发明实施例提供一种计算机设备,该计算机设备可以是服务器、终端等。其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和通信接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种乳腺检测模型或乳腺特征提取模型的训练方法。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的区域图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。

本发明实施例一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤,或上述的方法的步骤。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

技术分类

06120114727185