一种基于迁移学习的乳腺癌图像检测系统及方法

文献发布时间：2023-06-19 09:38:30

技术领域

本发明涉及医学图像处理领域，具体涉及一种基于迁移学习的乳腺癌图像检测系统及方法。

背景技术

恶性肿瘤(癌症)严重威胁着中国人群的健康，近十几年来恶性肿瘤的发病及其死亡率均呈现持续上升的态势，而乳腺癌则位列女性癌症发病率的首位，将近是日前极受人们重视的宫颈癌发病率的三倍。扩大乳腺癌的筛查范围，尽可能地做到及早诊断与治疗，可以在一定程度上降低乳腺癌的死亡率。为此在可预见的未来，需要进行诊断的人次会呈现不断增长的趋势。

医学成像技术在乳腺癌的检测中起着非常重要的作用，通常为超声成像、磁共振成像(MRI)、钼靶X射线成像三种，其中钼靶X射线成像的密度分辨率较高，可以在乳腺组织中出现异常生长的早期发现可疑的肿块或癌变区域。同时因钼靶X射线成像具有操作便捷、对患者的伤害小以及价格便宜的优势可作为乳腺癌检查的首选方式。然而对于钼靶X射线影像的判断目前高度依赖影像科医生的经验判断，准确性因医生而异受制于多重主观因素。与此同时，经过长达三十多年的研究，人工智能辅助图像检测方法的研究在不同疾病的应用中取得了一定的成果，能够辅助提高临床检测，大幅度降低医生的诊断时间。基于大数据背景下迅速成长的深度学习可以实现影像到检测结果的端对端学习。

深度学习的高性能通常依附于庞大的数据集，在数据集较小的运用环境中不能发挥自身的优势。在医学图像处理领域，获取大样本的数据库非常困难，需要耗费极大规模的时间、金钱与医疗人员成本。

发明内容

本发明主要考虑了现阶段乳腺癌数据量小，潜在乳腺癌图像检测数据量大的问题，提出了一种基于迁移学习的乳腺癌图像检测系统及方法，旨在克服乳腺癌大样本的收集难度，并能运用于潜在的大规模乳腺癌筛查中。

本发明针对上述的情况，对获得的已标记样本进行预处理，扩增样本量得到数据集；将Inception-v3模型中的softmax分类器替换成两个支持向量机，使其适用于三分类的问题；使用预训练参数初始化Inception-SVMs中的卷积层，冻结卷积层；采用5折交叉验证进行训练，以RAdam优化器替代随机梯度下降。所述的Inception-SVMs基于Inception-v3模型，将模型中的softmax分类器替换成两个支持向量机。

一种基于迁移学习的乳腺癌图像检测系统，包括数据获取模块、图像处理模块和图像检测模块。

所述的数据获取模块，从DDSM数据集获取已标记好的乳腺钼靶X射线影像，均衡选取健康、良性与恶性三者的样本。

所述的图像处理模块对数据获取模块获得的样本进行处理，首先运用Otsu最大类间方差法对样本进行分割，接着对影像进行旋转、镜像、放缩使得样本量扩增至原样本量的24倍，得到最终的数据集。

所述的图像检测模块采用预先在ImageNet上训练好的Inception-v3模型，修改Inception-v3模型，将模型中的softmax分类器替换成两个支持向量机，命名为Inception-SVMs。

一种基于迁移学习的乳腺癌图像检测系统的使用方法，具体步骤如下：

步骤1：通过数据获取模块从DDSM数据集获取中获得已标记好的乳腺钼靶X射线影像作为样本，均衡选取健康、良性与恶性三者的样本，通过图像处理模块对样本进行预处理，首先运用Otsu最大类间方差法对样本进行分割，接着对影像进行旋转、镜像、放缩使得样本量扩增至原样本量的24倍，得到最终的数据集。

步骤2：下载预先在ImageNet上训练好的Inception-v3模型，修改Inception-v3模型，将模型中的softmax分类器替换成两个支持向量机，命名为Inception-SVMs，作为图像检测模块。

步骤3：对图像处理模块进行训练，使用预训练参数初始化Inception-SVMs中的卷积层，并冻结卷积层作为固定的特征提取器进行训练。训练时采用5折交叉验证，最终返回4次测试结果的均值作为模型的评价指标，并选取准确率最高的模型，以RAdam优化器替代随机梯度下降。

步骤4：将待检测的乳腺癌钼靶X射线影像输入图像检测模块，获得最终的乳腺癌图像检测结果。

本发明有益结果如下：

1.通过图像处理模块对样本进行预处理，增加样本量，降低深度学习过程中的过拟合问题，提升模型的泛化性能。

2.softmax分类器替换成两个支持向量机，使其适用于乳腺癌检测的任务。

3.以RAdam优化器替代随机梯度下降，不需要可调参数预热且能保证收敛速度快的同时，不轻易落入局部最优解。

附图说明

图1为本发明基于迁移学习的乳腺癌图像检测系统的使用方法的流程图；

图2为inception-v3模型；

图3为两个支持向量机分类方式。

具体实施方式：

下面结合附图和实施例对本发明作进一步说明，可使本领域人员对本发明有更加详尽的了解。

如图1所示，一种基于迁移学习的乳腺癌图像检测系统的使用方法，包括如下步骤：

步骤1：通过过数据获取模块获得已标记好的乳腺钼靶X射线影像，包括健康与患病两类影像，其中，患病影像可分为良性与恶性。在保留尽可能多样本的原则下，选取健康、良性与恶性三者的样本使其比例趋近于2：1：1。通过图像处理模块进行样本预处理，根据医学先验知识乳腺钼靶X射线影像即样本的背景是全黑的，乳腺区域的灰度值较大，运用Otsu最大类间方差法对样本进行分割并保存为相同的尺寸A。

由于样本量的增加可以一定程度上降低深度学习过程中的过拟合问题，提升模型的泛化性能，可以采取对影像进行旋转、镜像、放缩的手段增加样本量。具体为对每个影像旋转-90°、90°和180°，做水平镜像、垂直镜像、0.8倍缩小、1.2倍的放大作并保存为相同的尺寸A。由此可将样本量扩增至原样本量的24倍，得到最终的数据集。

步骤2：深度学习的高性能通常依附于庞大的数据集，为了达到满意的结果，考虑采取基于迁移学习的方式。下载预先在ImageNet上训练好的Inception-v3模型，模型结构如图2所示。

在本实例中实现乳腺癌图像的检测可以视为一个三分类问题，同时该三分类问题可分解为先将所有样本分成两个类健康与患病，再对患病子类进一步划分成两个次级子类即良性与恶性，由此可以采用两个支持向量机(SVM)完成分类任务。修改Inception-v3模型，将模型中的softmax分类器替换成两个支持向量机，命名为Inception-SVMs，作为图像检测模块。

图3为两个支持向量机分类方式。

步骤3：对图像检测模块进行训练，使用在ImageNet上预训练的Inception-v3模型的参数来初始化Inception-SVMs中的卷积层，并冻结卷积层作为固定的特征提取器进行训练。

训练时采用5折交叉验证，即对步骤1中获取的数据集划分为5个大小相似的互斥子集，每个子集尽可能保持健康、良性与恶性样本比例趋近一致。然后，每次用4个子集的并集作为训练集，余下的子集作为测试集，从而可进行4次训练和测试，最终返回4次测试结果的均值作为模型的评价指标，并选取准确率最高的模型。以RAdam优化器替代随机梯度下降，RAdam可做到在不需要可调参数预热且能保证收敛速度快的同时，不轻易落入局部最优解。

步骤4：将待检测的乳腺癌钼靶X射线影像输入图像检测模块，获得最终的乳腺癌图像检测结果。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：颜成钢;彭开来;孙垚棋;张继勇;张勇东;
专利申请人：杭州电子科技大学;

上一篇：一种苯系物降解菌及其筛选方法和应用
下一篇：一种有孔电缆托盘桥架及其布线优化结构