掌桥专利:专业的专利平台
掌桥专利
首页

一种辅助诊断方法及其应用

文献发布时间:2023-06-19 11:21:00


一种辅助诊断方法及其应用

技术领域

本申请属于人工智能技术领域,特别是涉及一种辅助诊断方法及其应用。

背景技术

随着AI技术的飞速发展,计算机辅助诊断已引起广泛关注,并已成功地应用于医疗保健和医疗的许多应用中。对于某些特定任务,基于学习的系统可以与人类专家的表现相提甚至超越。尽管模型的直觉通常无法明确表示,但令人印象深刻的性能归功于神经网络的良好表达能力和可伸缩性。但是,对于计算机辅助诊断,可解释性非常重要,甚至与诊断精度相同。本发明主要研究如何将多种数据进行融合,并且通过多种数据的融合,提炼出数据之间的关系,从而达到对肺炎诊断模型的可解释性。

目前已经有一些肺炎辅助诊断模型,然而这些诊断模型方法都存在着种种不足之处。这些模型都有着同样的特点,就是输入为胸透图,但是胸透图往往并不能直接作为诊断肺炎的依据。在医生诊断肺炎时,需要了解病人的一些其他临床表现,比如是否咳嗽,是否发热,以及一些进行体格检查,主要是检查是否有啰音。而胸透图虽然是重要的诊断依据,但是其他重要的临床信息也是诊断的重要一环。

在可解释的模型方面,Grad CAMs是目前用的比较广泛的可解释方法。这种可解释的方法可以在诊断时,给医生说明模型在图像上的关注重点,以热成像的方式提供图像的解释性。但是该方法也仅仅是给与图像的解释,并不能对诊断所需的其他信息做出合理的解释。

现有的技术仅能通过图像来诊断肺炎,且缺少大型数据集下训练出的肺炎诊断模型,也不能对肺炎的诊断结果进行合理的解释。

发明内容

1.要解决的技术问题

基于现有的技术仅能通过图像来诊断肺炎,且缺少大型数据集下训练出的肺炎诊断模型,也不能对肺炎的诊断结果进行合理的解释的问题,本申请提供了一种辅助诊断方法及其应用。

2.技术方案

为了达到上述的目的,本申请提供了一种辅助诊断方法,所述方法包括如下步骤:步骤1:收集胸透图数据集;步骤2:将所述胸透图数据集分为第一胸透数据和第二胸透数据,采用所述第一胸透数据训练卷积神经网络模型;然后将所述第二胸透数据输入到训练好的卷积神经网络模型中输出诊断结果的概率值,将所述概率值划分为“0”或者“1”,将“0”或者“1”作为胸透图的特征值;步骤3:从文字报告中提取诊断信息,所述文字报告与所述胸透图数据集对应;步骤4:将所述诊断信息和所述特征值作为新的数据输入解释模型,输出患病概率。

本申请提供的另一种实施方式为:所述预先训练图像分类模型训练3次,得到3个图像分类模型,对三个所述图像分类模型分别进行测试求得性能的平均值,防止训练的模型的产生特例,所以训练三次求模型的平均性能更能说明模型的效果。

本申请提供的另一种实施方式为:采用约登指数作为阈值将图像分类模型的输出从概率值胸透图中得出的特征值。

本申请提供的另一种实施方式为:所述为图像分类模型为密集卷积网络,所述解释模型为基于约束的贝叶斯网络模型。

本申请还提供一种辅助诊断方法的应用,将所述的辅助诊断方法应用于肺炎的诊断,以及例如支气管炎的辅助诊断等一些疾病的辅助诊断,还可以应用在需要通过多模态的输入来识别的场景例如情感分析。

本申请提供的另一种实施方式为:所述诊断信息包括咳嗽、咯血、胸痛、发热、呼吸困难、湿性啰音和干性啰音7维向量。

本申请提供的另一种实施方式为:所述基于约束的贝叶斯网络模型根据收缩算法进行了改进。

本申请提供的另一种实施方式为:所述肺炎包括医院外罹患的感染性肺实质炎症和医院内肺炎。

本申请提供的另一种实施方式为:所述诊断信息的提取包括从主诉和查体中提取信息,采用中文标点来分割主诉,提取保存含有关键字的短句,对短句进行标记,同时对所述短句进行人工审核。

本申请提供的另一种实施方式为:所述基于约束的贝叶斯网络模型够解释各个结点之间的关系,以及诊断过程中,每个结点的参数值。

3.有益效果

与现有技术相比,本申请提供的一种辅助诊断方法的有益效果在于:

本申请提供的辅助诊断方法,通过大型数据集的训练,可以结合图像和诊断报告共同进行诊断,大大增加了诊断的可靠性,且能对结果进行一定的解释。

本申请提供的辅助诊断方法,支持多种数据作为输入,且模型具有一定的可解释性,能够为医生提供更加可信的结果。

本申请提供的辅助诊断方法,使用贝叶斯网模型作为分类模型,能够提供一定的可解释性,通过大量数据集的学习后,能更好的说明每个结点之间的关系,为医生提供更加有利的信息。

本申请提供的辅助诊断方法的应用,辅助医生诊断肺炎,从而减少医生的工作量以及降低医生的误诊率。

附图说明

图1是本申请的辅助诊断方法的系统原理示意图。

具体实施方式

在下文中,将参考附图对本申请的具体实施例进行详细地描述,依照这些详细的描述,所属领域技术人员能够清楚地理解本申请,并能够实施本申请。在不违背本申请原理的情况下,各个不同的实施例中的特征可以进行组合以获得新的实施方式,或者替代某些实施例中的某些特征,获得其它优选的实施方式。

随着人工智能的快速发展,疾病的辅助诊断应用越来越广泛。肺炎作为一种最常见的疾病之一,用人工智能来辅助医生诊断肺炎的需求越来越强烈。本申请主要来辅助医生诊断肺炎,从而减少医生的工作量以及降低医生的误诊率。

贝叶斯网络又称信度网络,是Bayes方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一。从1988年由Pearl提出后,已经成为近几年来研究的热点.。一个贝叶斯网络是一个有向无环图(Directed Acyclic Graph,DAG),由代表变量节点及连接这些节点有向边构成。节点代表随机变量,节点间的有向边代表了节点间的互相关系(由父节点指向其子节点),用条件概率进行表达关系强度,没有父节点的用先验概率进行信息表达。节点变量可以是任何问题的抽象,如:测试值,观测现象,意见征询等。适用于表达和分析不确定性和概率性的事件,应用于有条件地依赖多种控制因素的决策,可以从不完全、不精确或不确定的知识或信息中做出推理。

约登指数(Youden index):也称正确指数,是评价筛查试验真实性的方法,假设其假阴性(漏诊率)和假阳性(误诊率)的危害性同等意义时,即可应用约登指数。约登指数是灵敏度与特异度之和减去1。表示筛检方法发现真正的患者与非患者的总能力。指数越大说明筛查实验的效果越好,真实性越大。

主诉,医学和心理学用语。是病人(来访者)自述自己的症状或(和)体征、性质,以及持续时间等内容。

主诉是住院病历中第一项内容,好的主诉需精炼准确;尽可能用病人自己描述的症状,不用诊断用语;要与现病史一致;遵循客观、实事求是的原则。

查体是医生通过听诊器等进行体格检查。

参见图1,本申请提供一种辅助诊断方法,所述方法包括如下步骤:步骤1:收集胸透图数据集;步骤2:将所述胸透图数据集分为第一胸透数据和第二胸透数据,采用所述第一胸透数据训练卷积神经网络模型;然后将所述第二胸透数据输入到训练好的卷积神经网络模型中输出诊断结果的概率值,将所述概率值划分为“0”或者“1”,将“0”或者“1”作为胸透图的特征值;步骤3:从文字报告中提取诊断信息,所述文字报告与所述胸透图数据集对应;步骤4:将所述诊断信息和所述特征值作为新的数据输入解释模型,输出患病概率。

构建了35389病例数的肺炎数据集,在使用深度学习模型时,大型肺炎数据集极大增加了模型的性能。

进一步地,所述预先训练图像分类模型训练3次,得到3个图像分类模型,然后对三个模型分别进行测试然后求性能的平均值,防止训练的模型的产生特例,所以训练三次求模型的平均性能更能说明模型的效果。

进一步地,采用约登指数作为阈值将图像分类模型的输出从概率值胸透图中得出的特征值。

进一步地,所述为图像分类模型为密集卷积网络,所述解释模型为基于约束的贝叶斯网络模型。构建了能够结合医学常识的基于约束的贝叶斯网络模型,该模型能够更加合理的来构建各个节点之间的关联。

本申请还提供一种辅助诊断方法的应用,将所述的辅助诊断方法应用于肺炎的诊断,以及例如支气管炎的辅助诊断等一些疾病的辅助诊断,还可以应用在需要通过多模态的输入来识别的场景例如情感分析。

进一步地,所述诊断信息包括咳嗽、咯血、胸痛、发热、呼吸困难、湿性啰音和干性啰音7维向量。

所使用的数据不仅仅包含了图像,也包含了诊断报告中提取的信息,先通过卷积神经网络对图像数据进行学习,得到训练好的网络来提供图像中的特征,再从诊断报告中提取“咳嗽”,“咯血”,“胸痛”、“发热”、“呼吸困难”、“湿性啰音”和“干性啰音”7个临床信息,最后将所有特征作为输入训练贝叶斯网的方式,能够结合图像和文字达到多输入,多模态的能力。

进一步地,所述基于约束的贝叶斯网络模型根据收缩算法进行了改进。

进一步地,所述肺炎包括医院外罹患的感染性肺实质炎症和医院内肺炎。

进一步地,所述诊断信息的提取包括从主诉和查体中提取信息,采用中文标点来分割主诉,提取保存含有关键字的短句,对短句进行标记,同时对所述短句进行人工审核。

进一步地,所述基于约束的贝叶斯网络模型够解释各个结点之间的关系,以及诊断过程中,每个结点的参数值。

模型提供了一定的可解释性,相比其他现有的深度学习模型的不可解释性,增加了医生对模型的信任度。贝叶斯网本身作为一种可解释模型,构建贝叶斯网能够解释各个结点之间的关系,以及诊断过程中,每个结点的参数值,由此作为一种解释。

实施例

从患病环境分类,肺炎可分为CAP(医院外罹患的感染性肺实质炎症)和HAP(医院内肺炎)。在这项工作中,主要关注CAP,即院外感染的肺炎,而避免观察那些由于其他重症疾病导致免疫力下降而在院内感染肺炎的复杂又带有极强干扰性的病例。经过询问医生及查看大量病历数据得知,其他科室的肺炎患者,例如心脏科室、骨科、肿瘤科等的肺炎患者有较大可能是住院后在院内交叉感染得的肺炎,因此,数据主要来源于广东省第二人民医院的呼吸内科、呼吸与危重症医学科和儿科三个科室,经人工查看病历及询问医生,可知这三个科室得肺炎患者大多是社区发病。同时,通过病历诊断中编码医生所打的ICD-10的编码值(J12~J18为肺炎类)来识别肺炎病例。

该数据集选取在2016年至2020年(至今)期间住院和门诊的肺炎病例,共计35389例,包括患肺炎病人13482例和普通病人21907例。患肺炎的病例有一些还患有其他疾病,而不患肺炎的病例大多数为患有其他疾病,而并不是未患病。

需要从患者的病历中提取所需的信息,并使其成为贝叶斯网络的有效标记。每个病人(病例)都有自己的标签。根据人卫版教材《内科学》,临床症状上是否有咳嗽,咯血,胸痛、发热、呼吸困难、湿性啰音和干性啰音是重要的诊断肺炎的标准,所以我们在记录的主诉部分提取咳嗽、咯血、胸痛、发热、呼吸困难的相关信息,在记录的查体部分提取湿性啰音和干性啰音的相关信息。如果患者出现其中症状,将标签中对应的位设置为“1”,例如,标记为“1001001”表示患者出现了咳嗽、发热和湿性啰音,而无其他症状。

本申请涉及一个简单的算法来从主诉和查体中提取信息。以“发热”信息为例:首先,医生在记录患者是否发热时,一般会使用“发热”和“不发热”两个词,所以采用中文标点“,”、“、”、“。”和“;”来分割主诉,然后提取保存含有“热”的短句。当句子中的关键字是“热”时,“发热”的位被标记为“1”,否则为“0”。其次,考虑到一些医生可能会有特殊的表达方式,对每个包含“热”的短句进行人工审核,如果发现有特殊的书写形式,对标签进行更正处理。其他症状的提取方法都是与上述相同的思路。

将病例的图像数据放入训练好的图像卷积神经网络模型中跑出预测概率并0/1化后,将同一病例的其他7个临床症状(0/1化)与单纯图像模型的预测结果一起作为输入,贝叶斯网络会自动计算缺省节点(是否患肺炎)的概率。

具体的,一种肺炎的辅助诊断方法,基于大规模胸透图数据集,其步骤包括:

S1、用深度学习的模型在CheXpert上训练一个预先训练的图像分类模型,使用DenseNet121作为模型。与传统网络相比,DenseNet121提出了一种更根本的密集连接机制。所有层均已连接;具体来说,每一层都接受前面的所有层作为其附加输入。这种连接增强了功能的重用性,并允许最终分类器基于整个网络的所有特征来做出决策。使用该数据集训练完成的图像分类模型在CheXpert验证集中测试结果为在受试者工作特征曲线下的面积为0.74。

S2、接下来,使用胸透图图像数据集继续训练该图像分类模型。为了提高实验的可靠性,减少偶然误差,训练三次,得到了3个图像分类模型,平均在受试者工作特征曲线下的面积为0.90。与上一次在ChecXpert验证集上的测试相比,它的在受试者工作特征曲线下的面积值增加了0.16。

S3、通过训练好的DenseNet121来预测胸透图数据集,并使用约登指数作为阈值将图像分类模型的输出从概率值转换为0或1。

S4、从胸透图数据集对应的报告数据集中提取7维向量,该7维向量分别表示是否患有咳嗽、咯血、胸痛、发热、呼吸困难、湿性啰音和干性啰音重要的诊断信息,如果患者出现其中症状,将标签中对应的位设置为“1”,例如,标记为“1001001”表示患者出现了咳嗽、发热和湿性啰音,而无其他症状。

S5、从图像分类模型输出结果与从报告中提取的每个7维向量进行了连接,如图1中构造新的输入,以此作为训练贝叶斯网分类模型的输入来对肺炎进行分类。在训练过程中,共用了17040例病例,包含21881张图片(胸透图),与训练卷积神经网络的数据并不重合。

在构建贝叶斯网时,如何能够结合数据的同时也能够结合医学常识来构建贝叶斯网是关键所在。故构建的贝叶斯网所提取的特征节点包括“咳嗽”、“咯血”、“胸痛”、“发热”、“呼吸困难”、“湿性啰音”、“干性啰音”和“图片”,其中“图片”代表的是胸透图通过训练好的DenseNet121输出的结果,在医学上,这些特征节点都是临床医生诊断所必要的信息,所以特征节点不可以与“肺炎”结点相互独立,相同的特征结点都应该和“肺炎”结点在同一个马尔可夫毯,且所有特征节点都要指向“肺炎”。

为了表示这些医学常识,提出一种新的算法来构造贝叶斯网,该算法根据收缩算法(Grow-Shrink(GS)Algorithm)进行了改进,详细算法描述如下:

1、计算马尔可夫毯:设U为所有结点的集合,即U={“咳嗽”,“咯血”,“胸痛”、“发热”、“呼吸困难”、“湿性啰音”、“干性啰音”、“图片”}先计算除“图片”节点外的所有结点,然后自定义“图片”结点的马尔可夫毯为{“咳嗽”,“咯血”,“胸痛”、“发热”、“呼吸困难”、“湿性啰音”、“干性啰音”},由此可以得到马尔可夫毯B(X)。

2、对有所的结点X∈U,Y∈B(X),设T为B(X)-{Y}与B(Y)-{X}中的较小者,假设对所有的S T,X与Y都与S相互依赖,那么X与Y相连接。

3、对X∈U-{X

S6、对肺炎诊断模型进行了测试,查看模型的性能。

尽管在上文中参考特定的实施例对本申请进行了描述,但是所属领域技术人员应当理解,在本申请公开的原理和范围内,可以针对本申请公开的配置和细节做出许多修改。本申请的保护范围由所附的权利要求来确定,并且权利要求意在涵盖权利要求中技术特征的等同物文字意义或范围所包含的全部修改。

相关技术
  • 一种辅助诊断方法及其应用
  • 一种膀胱癌驱动基因点突变甲基化联合辅助诊断方法、试剂盒、系统及应用
技术分类

06120112898202