掌桥专利:专业的专利平台
掌桥专利
首页

一种基于CT切片的多模型假阳衰减的疾病分类方法及装置

文献发布时间:2023-06-19 11:05:16


一种基于CT切片的多模型假阳衰减的疾病分类方法及装置

技术领域

本发明涉及人工智能领域中的深度学习与医学影像处理技术领域,尤其是涉及一种基于CT切片的多模型假阳衰减的疾病分类方法及装置。

背景技术

目前AI技术进展飞速,特别是深度学习方面的应用日新月异,比如在甲状腺筛查,肺癌拆查,等很多情况下,AI模型的表现能够达到甚至超越人类表现早已不是秘密。在医疗领域同样如此。

目前深度学习在医疗上的应用主要使用CT图片。当使用现有基于深度学习的训练模型对CT图像进行检查时,因为CT图像的分辨率相对不高,仅为数百乘以数百,这个数字虽然可以反应出人体内部疾病的很多情况,但是对比目前普通手机几百万几千万的像素效果明显不足;而且CT图像在造影时会有很多噪点。比如患者为了更好地显示身体内部某些器官的图像需要饮用的造影剂,这些不属于身体本身的东西,本质上属于噪点;另外由于机器的质量的品牌的差异,或者患者在机器上扫描时身体的不慎抖动也会使生成的CT图像有伪影之类的干扰,而这些细小的噪点或者伪影,会对图像的特征造成混淆,从而破坏最终深度学习模型的训练和使用。当人工观察CT图像进行诊断时,医师通过扫描出来的CT图片序列观察判断疾病的存在与否,这对于医师的诊断水平倚赖很大,般水平的医师的诊断可能不够准确,而高水平的医师的时间又没有太多的时间,所以往往导致看病的患者扎堆名医一票难求。

发明内容

本发明的目的在于提供一种基于CT切片的多模型假阳衰减的疾病分类方法及装置,旨在解决现有模型对有些疾病诊断不够准确的问题。

本发明提供一种基于CT切片的多模型假阳衰减的疾病分类方法,包括:

S1.将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

S2.将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据;

S3.选取二次筛查模型,并对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器;

S4.将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

本发明提供一种基于CT切片的多模型假阳衰减的疾病分类装置,包括:

一次筛查模块:用于将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

假阳数据选取模块:用于将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据。

参数设置模块:用于对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器。

二次筛查模块:用于将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

本发明实施例还提供一种基于CT切片的多模型假阳衰减的疾病分类装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述一种基于CT切片的多模型假阳衰减的疾病分类方法的步骤。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述一种基于CT切片的多模型假阳衰减的疾病分类方法的步骤。

采用本发明实施例,针对具体特征具体训练分类模型,使用针对性的假阳衰减模型,进行二次筛查,弥补了粗分类模型的假阳过高的缺陷。假阳衰减模型不需要额外的人工标签,节省了人工标签的获取成本,减少了人力物力的投入;另外,假阳衰减模型的设计和训练比一次筛查时所用的模型简单的多,网络的训练也更加容易,使网络能够更快速地收敛,更加高效。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种基于CT切片的多模型假阳衰减的疾病分类方法的流程图;

图2是本发明实施例一所用的DenseNet50模型结构示意图;

图3是本发明实施例二所用的3D-ResNet18模型中的三维卷积结构示意图;

图4是本发明装置实施例一的基于CT切片的多模型假阳衰减的疾病分类装置的示意图;

图5是本发明装置实施例二的基于CT切片的多模型假阳衰减的疾病分类装置的示意图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

方法实施例

根据本发明实施例,提供了一种基于CT切片的多模型假阳衰减的疾病分类方法,图1是本发明实施例的一种基于CT切片的多模型假阳衰减的疾病分类方法的流程图,如图1所示,根据本发明实施例的一种基于CT切片的多模型假阳衰减的疾病分类方法具体包括:

S1.将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

S2.将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据;

一次筛查模型输出的结果中,每个结果对应一个位置,即疑似病变区域,以及这个位置的一个得分,即置信度,置信度的取值在0-1之间,置信度也可以理解成一次筛查模型即本实施例中的WNet模型对所检出的位置是结节的自信程度,置信值低于预设的最低置信度的部分数据看作模型识别非常不确定的数据,需要单独拿出作为假性数据输入二次筛查模型。

S3.选取二次筛查模型,并对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器;

具体的,本发明实施例中所选取的二次筛查模型选取如ResNet18这样的浅层网络,给选取的二次筛查模型设置的参数具体包括:学习率,在本实施例中所述学习率固定设置为0.001,设置BCEloss为二次筛查模型的损失函数,选择SGD优化器为二次筛查模型的优化器。

S4.将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

以下用三个具体实施例,进一步解释方法实施例中所述一种基于CT切片的多模型假阳衰减的疾病分类方法具体操作:

实例一

在肺结节检测上进行良恶性分类定位:

一次筛查:CT序列图像输入WNet模型后,模型自动对图像进行处理,即通过卷积神经网络对CT序列图像进行特征提取,对疑似结节的特征区域产生响应,进行分割定位,然后输出检出的病变区域。

WNet模型为公司内部开发的模型,WNet模型的结构类似Unet模型+金字塔结构,WNet模型类似于W的前后神经网络连接使得图像中的特征信息能够在不同神经网络层中较好地流通。

在肺结节检测中产生大量假阳的原因是因为结节在CT图像上的一些特性,例如大小,颜色,形状,和另一些常见的东西,比如血管、气管,他们的切面非常类似。而在正常的人体CT图中,血管气管是非常多的。这就让模型在判断病变区域时,如果它的判断依据时大小颜色、形状等属性,那就很容易将血管、气管的切面错误地判断成是病变区域,这时就需要将以此筛查输出的结果进行二次筛查。

二次筛查:将一次筛查输出结果中的假阳性数据补充标签,一起作为数据输入二次筛查模型DenseNet或者Resnet18中,在本实施例中将模型学习率固定设置为0.001,损失函数和优化器的设置分别为BCEloss和SGD进行假阳衰减训练,将假阳性数据再次筛查一遍,实现精准分类,输出真阳性数据。

Resnet18模型是一个小体量的模型,本身的输入可以为不大的小块,如结节或者血管气管的切面,因而要比一次筛查模型,更能够对形状大小都很小巧的数据进行精细的特征提取。Resnet18模型比一次筛查使用的WNet模型更加契合小巧的数据。

DenseNet50模型如图2所示,DenseNet系列模型是继ResNet后引用最为著名的深度学习基础网络,该模型特有的密集链接的结构在工业界有着极为广泛的应用。

本实施例所用肺部CT序列图像由北京301医院提供,本实施例在301医院638例数据上实验,取得了较好效果。

实例二

在口腔缺牙检测上:

一次筛查:CT序列图像输入EfficientDet模型后,模型自动对图像进行卷积等加工,提取图像的特征,并对疑似缺牙的特征区域产生响应,进行分割定位,从而实现缺牙检出。

用来定位的EfficientDet模型为目前检测网络中主流的模型,具体选择EfficientDet-d2模型进行定位,该模型的结构包括一个常规的卷积网络和一个特别定制的BiFPN网络,能够实现图像内信息的高效流动,具有较好的模型检出效果,一般情况下,该模型漏检率较低。

缺牙检测中产生大量假阳的原因是因为缺牙在CT图像上的一些特性。比如很多人的牙齿东倒西歪,间隙较大,间隙的位置就会被判定成缺牙;或者长短差异大,这样模型就会认为短的牙齿的一部分就是缺牙。还有很多病人的上下两排牙齿部分的最外侧,即智齿外面一点点,因为与智齿相邻却没有牙,很可能也被判定成缺牙。

二次筛查:将一次筛查模型输出的假阳性数据单独拿出,补充标签,加上模型原本就有的真阳标签进行处理,使之成为一个3d数据块,将3d数据块输入到二次筛查模型3D-ResNet18,在本实施例中模型学习率初始设置为0.001并随迭代次数不断递减,损失函数和优化器的设置分别为BCEloss和SGD进行假阳衰减训练,将假阳性数据再次筛查一遍,输出真阳性数据。

二次筛查模型3D-ResNet18相比一次筛查模型EfficientDet-d2的优点在于能够将注意力集中在3d数据块内,只根据3d内的信息进行判断,不会受牙齿本身的位置的信息的干扰,从而提高了精度。

3D-ResNet18模型包含跳跃链接,是深度学习的一个经典模型,其中卷积部分为三维卷积,结构如图3所示。

本实施例口腔CT序列数据由江苏省口腔医院提供,包含CT序列1100例。

实例三

在肋骨骨折检测上:

一次筛查:CT序列图像输入nnUNet模型后,模型自动对图像进行卷积等加工,提取图像的特征,并对疑似骨折的特征区域产生响应,进行分割定位,从而实现肋骨骨折检出。

nnUNet模型除了Unet结构外,还包括大量的自动参数搜索的设置,包括各卷积层的结构的参数,这使得该模型能够适应各种各样不同的数据集,有很强的鲁棒性。

肋骨骨折检测产生大量假阳的原因是因为骨折在CT图像上的一些特性。骨折的发生并非是一根骨头发生断裂后分裂成两块,主要是骨头自身收到剧烈冲击后发生挤压,从而导致骨头的错位叠加,从形状上好像是两个骨头更加紧密地连接在一起了,而正常的骨头结构里也有很多地方是连接的。所以就会产生因为图像上的相似而错判。

二次筛查:将一次筛查模型输出的假阳性数据单独拿出,补充标签,加上模型原本就有的真阳标签进行处理,使之成为一个3d数据块,将3d数据块输入到二次筛查模型3D-ResNet18,在本实施例中模型学习率初始设置为0.001并随迭代次数不断递减,损失函数和优化器的设置分别为BCEloss和SGD进行假阳衰减训练,将假阳性数据再次筛查一遍,输出真阳性数据。

二次筛查模型3D-ResNet18相比一次筛查模型nnUNet的优点在于,由于输入只有一个3d数据块,而不是整个序列,因此它的聚焦能力更强,受到的干扰更少,更加容易地判断数据到底是由于挤压发生的骨折式的连接,还是骨头自然生长而发生的正常连接。

本实施例中所用肋骨骨折的数据由公开数据集RibFrac提供,包含170例CT序列。骨折的自动检查在法医鉴定等领域有着非常重要的应用。

综上所述,采用本发明实施例,针对具体特征具体训练分类模型。使用针对性的假阳衰减模型,进行二次筛查,弥补了粗分类模型的假阳过高的缺陷。假阳衰减模型不需要额外的人工标签,节省了人工标签的获取成本,减少了人力物力的投入;另外,假阳衰减模型的设计和训练比一次筛查时所用的模型简单的多,网络的训练也更加容易,使网络能够更快速地收敛,更加高效。

装置实施例一

根据本发明实施例,提供了一种基于CT切片的多模型假阳衰减的疾病分类装置,图4是本发明实施例的一种基于CT切片的多模型假阳衰减的疾病分类装置的示意图,如图4所示,根据本发明实施例的一种基于CT切片的多模型假阳衰减的疾病分类装置具体包括:

一次筛查模块40:用于将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

假阳数据选取模块42:用于将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据。

参数设置模块44:用于对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器。

参数设置模块具体用于,为选取的二次筛查模型设置学习率、损失函数及优化器。

二次筛查模块46:用于将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

本发明实施例是与上述方法实施例对应的装置实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。

装置实施例二

本发明实施例提供一种基于CT切片的多模型假阳衰减的疾病分类装置,如图5所示,包括:存储器50、处理器52及存储在所述存储器50上并可在所述处理器52上运行的计算机程序,所述计算机程序被所述处理器52执行时实现如下方法步骤:

S1.将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

S2.将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据;

一次筛查模型输出的结果中,每个结果对应一个位置,即疑似病变区域,以及这个位置的一个得分,即置信度,置信度的取值在0-1之间,置信度也可以理解成一次筛查模型即本实施例中的WNet模型对所检出的位置是结节的自信程度,置信值低于预设的最低置信度的部分数据看作模型识别非常不确定的数据,需要单独拿出作为假性数据输入二次筛查模型。

S3.选取二次筛查模型,并对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器;

具体的,本发明实施例中所选取的二次筛查模型为ResNet18这样的浅层网络模型,给选取的二次筛查模型设置的参数具体包括:学习率,在本发明实施例中将所述学习率固定设置为0.001,设置BCEloss为二次筛查模型的损失函数,选择SGD优化器为二次筛查模型的优化器。

S4.将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

装置实施例三

本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器52执行时实现如下方法步骤:

S1.将CT序列图像输入一次筛查模型,通过所述一次筛查模型自动对所述CT序列图像进行处理,即使用卷积神经网络对所述CT序列图像进行特征提取,对疑似结节的特征区域进行分割定位,输出一次筛查模型结果;

S2.将所述一次筛查结果中置信度低于最低置信度预设值的部分单独取出,得到假性数据;

一次筛查模型输出的结果中,每个结果对应一个位置,即疑似病变区域,以及这个位置的一个得分,即置信度,置信度的取值在0-1之间,置信度也可以理解成一次筛查模型即本实施例中的WNet模型对所检出的位置是结节的自信程度,置信值低于预设的最低置信度的部分数据看作模型识别非常不确定的数据,需要单独拿出作为假性数据输入二次筛查模型。

S3.选取二次筛查模型,并对选取的二次筛查模型的参数进行设置,选取所用损失函数和优化器;

具体的,本发明实施例中所选取的二次筛查模型为ResNet18这样的浅层网络模型,给选取的二次筛查模型设置的参数具体包括:学习率,在本发明实施例中将所述学习率固定设置为0.001,设置BCEloss为二次筛查模型的损失函数,选择SGD优化器为二次筛查模型的优化器。

S4.将步骤S2中所述假性数据添加所述二次筛查模型的标签作为训练标签,输入到选取的所述二次筛查模型进行训练,进行精准分类,得到假阳性数据和真阳性数据。

本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 一种基于CT切片的多模型假阳衰减的疾病分类方法及装置
  • 基于多模型的切片特征分类方法、装置、设备及介质
技术分类

06120112792239