掌桥专利:专业的专利平台
掌桥专利
首页

利用定量成像的方法和系统

文献发布时间:2023-06-19 10:22:47



背景技术

本公开涉及定量成像和分析。更具体地,本公开涉及用于利用定量成像来分析病理学的系统和方法。

成像,特别是利用安全且无创的方法进行的成像,表示用于定位疾病起源、捕获其详细病理学、引导疗法并监测健康进展的最强大的方法。成像也是用于通过允许既便宜又具破坏性的适当早期干预来减轻这些人力和财务成本的极其有价值且低成本的方法。

增强的成像技术已经使医学成像成为患者护理的基本组成部分。成像是特别有价值的,因为其使用无创或微创方法提供了在空间上和时间上定位的解剖信息和功能信息。然而,需要用于有效利用增加的时间和空间分辨率的技术,以利用不易于利用人眼评估的数据中的模式或特征以及以此方式管理大量级的数据,以将其有效地集成到临床工作流程中。在没有辅助的情况下,临床医生既没有时间通常也没有能力有效地提取可用的信息内容,并且在任何情况下通常会主观且定性地解释信息。集成用于单独患者管理的定量成像以及用于疗法开发的临床试验需要类新种类的决策支持信息学工具,以使医学界能够在现有工作流程和偿付约束的现实内充分利用随着演变和增长的成像模态可能具备的能力。

来自成像方法的定量结果有可能在常规临床护理和临床试验中用作生物标志物,例如根据广泛接受的NIH共识会议(NIH Consensus Conference)对生物标志物的定义。在临床实践中,定量成像旨在(a)在疗法过程之前、期间或之后检测疾病和表征疾病,并且(b)在有或没有疗法的情况下预测疾病的过程。在临床研究中,成像生物标志物可以用于定义临床试验的终点。

定量建立在成像物理开发的基础上,所述成像物理开发引起空间、时间和对比分辨率的改进以及利用多种能量/序列激发组织,从而产生不同的组织特异性应答的能力。因此,这些改进可以允许进行组织区分和功能评估,并且在例如以下中可明显看到:计算机断层扫描(CT)、双能计算机断层扫描(DECT)、光谱计算机断层扫描(光谱CT)、计算机断层扫描血管造影术(CTA)、心脏计算机断层扫描血管造影术(CCTA)、磁共振成像(MRI)、多对比磁共振成像(多对比MRI)、超声(US)以及具有各种成像模态的靶向或常规造影剂方法。定量成像测量指示一种治疗相对于另一种治疗的有效性、当前治疗如何有效或在患者仍未治疗的情况下其所面临什么风险的特定生物学特性。作为测量装置来看,与所形成图像的图像处理结合的扫描仪具有基于与给定成像方法有关的物理原理来测量组织的特性并且测量不同组织如何对其作出响应的能力。尽管图像形成过程跨模态差异很大,但一些概括帮助框定总体评估,尽管有例外、细微差别和微妙之处,但是所述概括会推动真正的结论并且在所述概括被视为最大机会中的一些机会之前省略所述概括,并且除非其被视为最大机会中的一些机会,否则就省略所述概括。

在新型治疗剂的临床测试的早期阶段中进行成像有助于理解基础生物学途径和药理学作用。其还可以减少开发新型药品和治疗剂所需的成本和时间。在开发的后期阶段中,成像生物标志物可以充当临床受益的重要终点和/或充当用于帮助开处方和/或跟随对于个性化疗法的特定患者状况的伴随诊断。在所有阶段中,成像生物标志物可以用于基于疾病状态选择患者或对患者进行分层,以便于更好地展示治疗效果。

a.

增强的成像技术已经使医学成像成为患者护理的基本组成部分。成像是特别有价值的,因为其使用无创或微创方法提供了在空间上和时间上定位的解剖信息和功能信息。然而,需要处理增加的分辨率的技术,以利用不易于利用人眼评估的数据中的模式或特征以及以此方式管理大量级的数据,以将其有效地集成到临床工作流程中。利用更新的高分辨率成像技术,在无辅助的情况下,放射科医生将“淹没”在数据中。集成用于单独患者管理的定量成像将需要新种类的决策支持信息学工具,以使医学界能够在现有工作流程和补偿约束的现实内充分利用这些新工具的能力。

此外,定量成像方法对(i)临床前研究,(ii)临床研究,(iii)临床试验和(iv)临床实践越来越重要。在新型治疗剂的临床测试的早期阶段中进行成像有助于理解基础生物学途径和药理学作用。其还可以减少开发新型药品和治疗剂所需的成本和时间。在开发的后期阶段,成像生物标志物可以充当临床获益的重要终点。在所有阶段中,成像生物标志物可以用于基于疾病状态选择患者或对患者进行分层,以便于更好地展示治疗效果。

通过使用定量成像改进患者选择会减小给定试验所需的样品大小(通过增加可评价患者的分数和/或减少多余变量的影响)并帮助标识可以从提出的治疗中受益最多的亚群。这将减少新药的开发时间和成本,但也可能引起相应地减少“目标”群体的大小。

疾病并不简单,并且尽管疾病通常使自身局部表现出,但是其往往是全身性的。已经证明客观相关的组织特性的多因素评估是跨医学的有效方法并且在此也是如此,所述多因素评估表示连续指标的面板或“谱”,有时被理想地证明为是将来的“替代”和/或难以测量但被认可的终点。第一或第二读者范例中的使得基于实施在利用现代临床IT系统积极优化互操作性的架构中的表型的定量成像评估通过用于个性化诊断的下一代计算方法之间的跨学科汇聚成为可能的对病变和/或器官生物学的计算机辅助的测量和对组织组成的定量在临床医生跨连续的疾病严重度管理其患者时为临床医生提供了力量,以用于改进跨外科、医学和监视通路的分类。在更接近疾病自身的复杂度而不是坚持假设其可以简化到隐藏基础生物学的水平的粒度和复杂性的水平上,更及时且准确的评估会得到改善的结果以及对医疗保健资源的更加有效的使用,其收益远超过工具成本。

b.

放射学成像通常针对医学状况而被主观和定性解释。医学文献中使用术语表型作为其基因型与环境相的互作用引起的个体的可观测到的特性组。表型通常意味着客观性,即表型可以被称为是真实的而不是主观的。放射学以其可视化特性的能力而众所周知并且其越发地可以被验证为客观真相标准(美国申请序列号14/959,732;美国申请序列号15/237,249;美国申请序列号15/874,474;以及美国申请序列号16/102,042)。因此,放射学图像可以用于确定表型,但是通常缺乏用于确定表型的充足方法。

有利地,表型分型具有真相基础,并且因此可以独立地且客观地评价。此外,表型分型已成为医疗保健行业中用于管理患者治疗决策的被认可的形式体系。因此,表型具有高度的临床相关性。最后,表型分型是消费者相关的。这既允许自我倡导,又充当用于生活方式改变的激励因素。

基于综合面板的连续指标而不是仅作为对单个特征的检测对表型的早期标识将实现迅速干预,以防止不可逆的损伤和死亡。解决方案对于完全先发制人事件或至少对于改进在经历征象和/或症状的诊断准确性至关重要。可以使用自动测量结构并且对组织组成和/或血液动力学进行定量的高效工作流程解决方案来表征处于较高风险下的患者,将对处于较高风险下的患者进行与不处于较高风险下的患者不同的治疗。如果将斑块形态特性与栓塞潜能联系起来,将会有巨大的临床意义。

成像表型在关联研究中可能与基因表达模式相关。这可能会产生临床影响,因为成像通常在临床实践中使用,从而为以低成本改进个性化治疗中的决策支持提供前所未有的机会。将特异性成像表型与大规模基因组学、蛋白质组学、转录组学和/或代谢组学分析相关有可能通过产生更具确定性的且患者特异性的预后以及对药物或其它疗法的应答的测量来影响治疗策略。然而,迄今为止用于提取成像表型的方法大多在本质上是经验性的,并且主要基于人类的观察,尽管是专家的观察。这些方法具有嵌入式人变异性,并且显然不可扩展以支持高通量分析。

同时,汇聚未满足的需要以实现更个性化的医学同时不增加成本-实际上,以通过在预防医学、比较效果、补偿方法等方面主动来更好地控制成本和/或避免不幸事件而不是对不幸事件作出反应对提供能力,而且以同时降低成本的方式递送所述能力的技术进步带来了前所未有的压力。

除了表型分类(对无序类别进行分类)的问题之外,还有结果预测/风险分层(预测风险的定序水平)的问题。两个问题都有临床实用性,但是两者为不同技术装置特性的结果。具体地,一个问题并不严格依赖于另一个问题。

在不限制通用性的情况下,下面提供了包含临床相关性的表型分类实例:

动脉粥样硬化的“稳定斑块”表型的示例表现可以如下描述:

·“愈合性”疾病,对强化的抗他汀类方案应答低

·球囊/支架并发症较少

·有时狭窄较高>50%

·有时Ca更高、更深

·脂质、出血和/或溃疡最小或无脂质、出血和/或溃疡

·外观光滑

此类斑块通常具有比“不稳定斑块”表型更低的不良事件率。

·活动性疾病,可能对强化的脂质降低和/或消抗炎性方案应答高

·球囊/支架并发症较多

·有时狭窄较低<50%

·Ca低或扩散、Ca接近管腔、餐巾环征象和/或微钙化

·有时有脂质含量更高、薄帽的迹象

·有时有出血或斑块内出血(IPH)和/或溃疡的迹象

已经报道此类斑块的不良事件率为稳定表型的3倍到4倍。这两个实例可以在单个患者遇到时进行评估,但是可以通过比较随着时间的推移特性的变化率来确定如“快速进展变数(rapid progressor)”等其它表型,即,通过在某一时间点上静态存在的,并且基于动力学所确定的和/或事物如何改变n次而告知的表型。

c.

深度学习(DL)方法已经非常成功地应用于许多源于复杂现实问题的困难机器学习(ML)和分类任务。值得注意的最近应用包含计算机视觉(例如,光学字符识别、面部识别、卫星图像解释等)、语音识别、自然语言处理、医学图像分析(图像分割、特征提取和分类)、临床和分子数据生物标志物的发现和验证。所述方法的吸引人的特征是其能够应用于无监督的学习任务和有监督的学习任务两者。

广泛地包含卷积神经网络(CNN)、递归卷积神经网络(RCNN)等的神经网络(NN)和深度NN方法已经被示出为基于良好的理论基础,并且在原理被视为表示人类大脑的高级认知功能之后被广义建模。例如,在与许多认知能力相关联的大脑区域新皮质中,感觉信号通过学习表示随时间的推移进行的观察的复杂局部模块化层级传播-这是已经引起对用于即图像分类和特征提取的CNN的一般定义和构建的设计原理。然而,DL网络和方法相比于具有相同数量的拟合参数但没有深度分层架构的框架的优越性能的更根本原因是什么,在某种程度上还是尚未决定的问题。

用于从原始数据进行的图像特征提取和基于图像的学习的常规ML方法有很多限制。值得注意的是,当特征处于汇总水平而不是原始图像的3D水平时,或当其所处的3D水平的程度为其与能够被客观地验证但仅为数学运算符的生物学真相不联系时,在使用特征提取的ML方法中通常难以获得空间上下文。确实含有空间上下文的原始数据集的使用通常缺乏针对所提取特征的客观基准真相标签,但是原始图像数据的使用自身包含很多变化,所述变化相对于手头的分类问题是“噪声”。在成像之外的应用中,此问题通常通过非常大的训练集来缓解,使得网络训练“学习”忽略此变化并且仅集中于显著信息,但是此规模的大的训练集通常在医疗应用中不可用,尤其是由于成本、物流和隐私问题采用基准真相注释的数据集。本公开的系统和方法帮助克服这些限制。

d.

在过去30年中,新治疗在改善结果方面是革命性的,但心血管疾病仍对美国经济施加了每年3200亿美元的负担。有大量患者群体可以受益于对重大不良冠状或脑事件的风险的更好的表征。美国心脏协会(American Heart Association)(AHA)推断了对于群体项目的ACSD(动脉粥样硬化性心血管疾病)风险评分:所有成年人(年龄>20)中的9.4%的不良事件的风险在接下来的10年中大于20%,并且26%风险介于7.5%与20%之间。将此应用于群体得到了2300万高危险患者和5700万中度危险患者。可以将处于风险中的8000万与在避免新事件或复发事件的尝试中目前处于他汀类治疗的3000万美国患者以及被诊断为患有CVD的1650万进行比较。在他汀类的患者中,一些患者将发展闭塞性疾病和急性冠状综合征(ACS)。绝大多数患者在胸部疼痛发作之前没有意识到其疾病进展。冠状动脉疾病的另外的结果和成本改进将由改进无创诊断转向标识哪些患者在一线治疗下具有进展的疾病。

心脏健康可能受到心脏周围的动脉退化的显著影响。多种因素(例如组织特性,如血管生成、新血管形成、炎症、钙化、脂质沉积、坏死、出血、刚性、密度、狭窄、扩张、重塑比率、溃疡、血流(例如,通道中血液的血流)、压力(例如,通道中血液的压力或一个组织挤压另一个组织的压力)、细胞类型(例如,巨噬细胞)、细胞排列(例如,平滑肌细胞的细胞排列)或剪切应力(例如,通道中的血液的剪切应力)、帽厚度和/或曲折度(例如,入口角和出口角))可能会使这些动脉降低其向周围组织传输氧气填充的血液的有效性(图35)。

冠状动脉的功能测试主要有负荷超声心动图和单光子发射计算机断层扫描心肌灌注测试(SPECT MPI)是目前用于诊断阻塞性冠状动脉疾病的主要无创方法。在美国,每年执行超过一千万次功能测试,其中阳性结果驱动了导管实验室的260万访问量,以进行有创血管造影术以确认发现冠状动脉疾病。

评估灌注的另一种方法是确定脉管系统传输氧气的能力。具体地,降低的能力可以被定量为血流储备分数或FFR。FFR不是缺血的直接量度,而是测量跨病变的压力下降比率的替代。在最大充血时由局部血管舒张损伤引起的血管直径相对于同一血管的其它分段的变化会产生显著的血液动力学效应,从而导致异常的FFR测量。在物理FFR测量期间,腺苷的输注会降低下游阻力,以允许增加充血状态下的血流。物理测量FFR需要涉及动脉内的物理压力传感器的有创外科手术程序。由于此水平的创伤会使自身有风险并且不便,因此需要在不需要物理测量的情况下以高准确性估计FFR的方法。无创地执行此测量的能力还会减少明显的“治疗偏差”:一旦患者处于导管实验室中,支架置入就相对容易进行,因此许多人已经注意到过度治疗发生,然而如果可以无创地评估血流储备,则可能改进关于置入支架还是不置入支架的决定。同样地,血流储备也适用于大脑组织的灌注(例如,与大脑中的充血有关)。

功能测试的已知问题为敏感度和特异性。据估计心血管疾病患者中的某些30-50%被误分类并且被过度治疗或治疗不足,金钱和生活质量成本显著。功能测试对于患有预阻塞性疾病的患者也是昂贵、费时且使用受限的。来自无创功能测试的假阳性是在稳定患者中过度使用有创冠状血管造影术和经皮冠状介入两者的重要因素,其在美国、英国和中国是主要的政策问题。对假阴性影响的研究估计,在给予怀疑患有冠状动态疾病(CAD)的美国患者的380万次年度MPI测试中,接近600,000例将报告导致13,700例急性冠状事件的假阴性结果,许多急性冠状事件将是可通过引入适当的药物疗法预防的。功能测试的另一个缺陷在本质上是暂时的:缺血是跟随由疾病进展带来的解剖变化的滞后指标。如果在缺血发作之前可以利用强化的药物疗法来检测并减少未来的罪犯病变,则可以对处于ACS的高风险的患者更好地服务。

冠状计算机断层扫描血管造影术(CCTA),尤其是与定量分析软件串联使用时,正在演进为理想的测试模态,以填补理解进展冠状动脉疾病的程度和速率方面的空白。在过去10年中,大多数国家的CT扫描仪群已升级为能够具有出色的空间分辨率,而不会减慢心脏或广泛的屏气的更高速度、更高检测器计数机器。辐射剂量已大大降低到等于或低于SPECT MPI和有创血管造影术的点。

对来自如SCOT-HEART、PREDICT和PROMISE以及其它的里程碑试验的数据的最近分析已经表明,使用CCTA通过标识未来不良事件的风险增加的患者来检测有时被称为高风险斑块(HRP)或易损斑块的非阻塞性疾病的价值。研究设计有所不同,并且包含将发生心血管(CV)事件的CCTA登记患者与具有类似风险因素/人口统计学的对照进行比较的嵌套病例对照的队列、与FFR的比较以及对大型“测试与治疗”研究的多年随访。NICE将CCTA定位为前线诊断的最近有利确定是基于SCOT-HEART研究的CCTA分支中CV事件的显著减少,所述显著减少归因于药物治疗启动或利用CCTA的斑块发现时的变化。

基于表明最需要评估斑块的PROMISE发现,重要的目标患者群组是患有稳定的胸部疼痛且没有伴有典型或非典型性心绞痛症状的CAD的先前历史(基于SCOT-HEART数据)的那些,以及患有非阻塞性疾病(<70%狭窄)的那些和较为年轻的患者(例如50-65岁群组)。患有非阻塞性CAD的基于CCTA分析发现具有高风险斑块谱的患者可以被分配到最合适的高强度他汀类疗法(尤其是当考虑关于如PCSK9抑制剂等非常昂贵的新脂质降低疗法或如卡那单抗(canakinumab)等抗炎药物的决定时),或增加用于减轻冠状血栓形成的风险的新抗血小板药剂和/或对疗法的可能强化或降级的纵向随访。CCTA是理想的诊断工具,因为其是无创的并且比心脏导管插入需要的放射更少。

关于牵扯在致死性心脏病发作中的罪犯病变的病理学文献指出,临床上非阻塞性CAD相比于往往更稳定的更多闭塞性斑块,更可能成为大多数高风险斑块的家。最近的研究证实了这些发现,所述研究指出了来自经历有创血管造影术的ACS患者的罪犯病变,并将所述罪犯病变与基线CCTA中的前体斑块进行了比较。在接受临床上指示的CCTA的一个队列中,发现患有非阻塞性CAD的患者,如此测试的那些患者中的38%,仍具有中期到长期重大不良心血管和/或脑血管事件(MACCE)的重大风险。发现基于患病分段的数量、与阻塞无关的危害比率是此群组中的MACCE的显著长期预测指标。对临床上非阻塞性CAD的预测价值的一个贡献因素是,这些病变相比于往往更稳定的更多闭塞性斑块,更可能成为大多数高风险斑块的家。

在对他汀类和抗炎药物治疗作用的几项最近发布的纵向研究中,看到了对CCTA在检测和管理阻塞性和预阻塞性动脉粥样硬化病变中的潜在效用的进一步证实,其中在治疗分支中观察到重塑到更稳定的表示的斑块和斑块消退。这证实了在多种降低脂质的药物方案下探索疾病进展和治疗效果的较早血管内超声(IVUS,有时利用“虚拟组织学”VH)、近红外光谱(NIRS)、光学相干断层扫描(OCT)等研究的主体。最近的药物试验提供了用于展示新医学疗法的功效的潜在斑块生物标志物。集成的生物标志物和成像研究-4(IBIS-4)发现钙化随着他汀类的潜在保护作用进展。其它研究发现在他汀类治疗下,脂质丰富的坏死核(LRNC)减少。在这些研究中,临床变量在单独使用时,对标识高风险斑块特性的区分很差。这些研究强调整个冠状树而不是仅罪犯病变的完整表征和评估的重要性,以允许可以济宁适当地分析CCTA的更准确的风险分层。在元分析中,与在评估斑块面积和体积、狭窄面积百分比以及对管腔面积的略微过高估计中具有小差异的IVUS相比,CCTA对于检测冠状斑块具有良好的诊断准确性。还发现增加脂质丰富的坏死核的变化率以及其与管腔的距离具有高的预后价值。另外,ROMICAT II试验的结果示出,对于具有急性胸部疼痛但初始ECG和肌钙蛋白阴性的稳定CAD患者,在CCTA上标识高风险斑块会增加ACS的可能性,而这与重大CAD和临床风险评估无关。已经建立了由CCTA进行的检查,以用于评价冠状粥样硬化斑块。对于有创程序的必要性不确定的患者,无创地预测MACCE利用CCTA将是有益的且可行的,所述预测给出了对疾病负荷和未来事件风险的整体估计。

颈动脉疾病的患病率和CAD是密切相关的。颈动脉粥样硬化已被示出为是MACCE的独立预测指标,即使在没有预先存在的CAD的患者中也是如此。此类发现表明了两种状况中共有的共同基础发病机理,这得到了动脉粥样硬化多民族研究(Multi-Ethnic Study ofAtherosclerosis)(MESA)的进一步支持。动脉粥样硬化贯穿动脉壁病变的演进逐步发展,从而导致胆固醇丰富的脂质的积累和炎症应答。这些在冠状动脉、颈动脉、主动脉和外周动脉中类似地变化(即使不相同)。如大动脉粥样硬化核以及脂质丰富的含量、薄帽、向外重塑、斑块被巨噬细胞和淋巴细胞浸润以及培养基变薄等某些斑块特性容易诱发脆弱性和破裂。

e.

使用CCTA对狭窄的功能显著性的无创评估具有临床和经济利益。病变或血管的几何形状或解剖结构与包括壁和/或壁中的斑块的组织的特性或组成的组合(统称为斑块形态)可以解释具有较高或较低风险斑块(HRP)的病变的结果和或正常和异常血流储备(FFR)的正交考虑。具有大坏死核的病变可能会由于斑块形成期间的外向重塑而发展动态狭窄,从而导致更多的组织延伸、组织变硬或平滑肌层已经延伸到Glagov现象的极限,此后病变逐渐侵袭管腔自身。同样地,炎症损伤和/或氧化应激可能导致局部内皮功能障碍,表现为血管舒张能力受损。

如果构成斑块的组织主要是未组织成坏死核的基质或“脂肪斑纹”,则斑块会充分扩张以跟上需求。然而,如果斑块具有更大的坏死核,则其将无法扩张。血液供应将无法跟上需求。斑块形态会通过评价如LRNC、钙化、出血和溃疡等复杂因素与可以用于验证基础信息的客观真相以其它方法由于缺乏中间测量目标验证而不能做到的方式提高准确性。

但那并不是斑块全部能做的。通常,斑块实际上会破裂,从而突然造成凝块,所述凝块然后可能导致心脏或大脑组织梗塞。斑块形态还可以标识这些高风险斑块并且对这些高风险斑块进行定量。例如,斑块形态可以用于确定坏死核有多接近管腔:这是梗塞风险的关键决定因素。知道病变在应力下是否限制血流并不指示破裂的风险,反之亦然。如计算流体力学(CFD)等其它方法在没有经过客观验证的斑块形态的情况下,可以模拟血流限制但不能模拟梗塞风险。斑块形态的根本优势在于,其准确性取决于对血管结构和组织特性的确定,同时允许确定表型。

关于利用对血流储备的不同评估对患者进行最佳管理的临床指南越来越多。众所周知,具有高风险特征的阻塞性病变(大坏死核和薄帽)预示着未来事件的最大可能性,并且重要的是,相反也是如此。

在未准确评估斑块形态的情况下,已经发布了使用CFD确定FFR的方法。但是基于CFD的血流储备考虑仅管腔,或最多考虑在心动周期的不同部分处管腔表面的变化。最多考虑仅管腔表面需要处理心脏收缩和心脏舒张两者,以得到运动向量(这甚至是大多数可用方法都没有做到的),但是即使没有考虑在应力下发生了什么也是如此,因为这些分析是利用计算机模拟在应力下可能发生什么而不是测量实际应力来进行的,并且不是基于引起血管舒张能力的实际特性而是基于仅血液通道的。一些方法试图模拟力并应用生物力学模型,但所述方法是利用假设而不是经过验证的对壁组织的测量。因此,这些方法无法预期如果应力实际上导致超出基本假设的破裂,可能发生什么。相反,对组织进行表征可以解决这些问题。壁特性,包含由于其壁的可扩张性而对血管的血管舒张能力的影响,被视为是优越的,因为病变的构成确定了柔韧性和能量吸收,稳定的病变仍被过度治疗并且对MACCE风险的评估不完全。使用形态评估FFR的优势包含以下事实:形态是领先指标、FFR滞后以及HRP的存在和程度会更好地告知边缘受试者的治疗。通过研究越来越多地示出形态可以预测FFR但FFR不会预测形态,加强了通过形态解决准确评估的重要性。也就是说,有效评估的形态不仅能够确定FFR,而且还可能产生斑块的使患者从缺血转移到梗塞或HRP的不连续变化。

发明内容

本文提供了系统和方法,所述系统和方法利用层级分析框架来从成像数据中标识生物学性质/分析物并且对所述生物学性质/分析物进行定量,并且然后基于经过定量的生物学性质/分析物标识和表征一种或多种医学状况。在一些实施例中,所述系统和方法将计算机图像分析和数据融合算法与患者临床化学和血液生物标志物数据合并,以提供可以用于在疾病的不同亚型之间进行区分的多因子面板。因此,本公开的系统和方法可以有利地在高级计算模型中实施生物学和临床见解。这些模型然后可以通过指定与对发病机理的日益理解相关联的丰富本体与复杂的图像处理界接,并采取对测量了什么、其是如何测量和评估的以及其如何与临床相关的亚型和可以验证的疾病的阶段进行的严格定义的形式。

人类疾病展现出强大的表型差异,所述表型差异可以通过对所提取特征应用复杂的分类器来理解,所述复杂的分类器捕获可通过成像测量但在无辅助的情况下难以理解的空间、时间和频谱结果。传统计算机辅助的诊断仅在单个步骤中根据图像特征进行推断。相反,本公开的系统和方法采用层级推断方案,所述层级推断方案包含确定形态、组成和结构的生物学目标组成部分的多个级上的空间上分辨的图像特征和时间上分辨的动力学的中间步骤,所述空间上分辨的图像特征和时间上分辨的动力学随后用于得出临床推断。有利地,所述层级推断方案确保可以在层级的每个级上理解、验证和解释所述临床推断。

因此,在示例实施例中,本公开的系统和方法利用层级分析框架,所述层级分析框架包含第一层算法和随后的第二组算法,所述第一级算法测量能够针对独立于成像的真相标准而客观地验证的生物学性质,所述随后的第二组算法用于基于所测量生物学性质确定医学或临床状况。例如此框架以“和/或”方式,即单独地或组合地适用于多种不同的生物学性质,如血管生成、新血管形成、炎症、钙化、脂质沉积、坏死、出血、刚性、密度、狭窄、扩张、重塑比率、溃疡、血流(例如,通道中血液的血流)、压力(例如,通道中血液的压力或一个组织对另一个组织的压力)、细胞类型(例如,巨噬细胞)、细胞排列(例如,平滑肌细胞的细胞排列)或剪切应力(例如,通道中血液的剪切应力)、帽厚度和/或曲折度(例如,入口角和出口角)。可以测量这些性质中的每个性质的被测变量,如性质的数量和/或程度和/或性状。示例状况包含灌注/缺血(如受限的)(例如,大脑或心脏组织的灌注/缺血)、灌注/梗塞(如完全切除)(例如,大脑或心脏组织的灌注/梗塞)、充氧、代谢、血流储备(灌注能力)、恶性、侵害和/或风险分层(无论是作为事件的概率还是作为事件的时间(TTE)),例如主要不良心血管或脑血管事件(MACCE)。真相基础可以包含例如活检、专家组织注释形成所切除组织(例如,动脉内膜切除术或尸检)、对所切除组织的专家表型注释(例如,动脉内膜切除术或尸检)、物理压力线、其它成像模态、生理监测(例如,ECG、Sa02等)、基因组学和/或蛋白质组学和/或代谢组学和/或转录组学测定和/或临床结果。这些性质和/或状况可以在给定的时间点测定和/或可以跨时间变化(纵向)。

在示例实施例中,本申请的系统和方法有利地涉及疾病的计算机辅助表型分型(CAP)。CAP是计算机辅助诊断(CAD)领域的新的且令人兴奋的补充。如本文所公开的,CAP可以将合并了计算机图像分析和数据融合算法的层级推断应用于患者临床化学和血液生物标志物数据,以提供测量的可以用于在将不同地治疗的疾病的不同亚型之间进行区分的多因子面板或“谱”。因此,CAP对鲁棒性特征提取、数据集成和可扩展计算策略实施了新方法,以实施临床决策支持。例如,空间时间纹理(SpTeT)方法捕获相关统计特征,以用于在空间上和动力学上表征组织。空间特征映射到例如与细胞外基质纤维、坏死组织和/或炎性细胞混合的脂质的特性模式。动力学特征映射到例如内皮磁导率、新血管形成、坏死和/或胶原蛋白分解。

与在根据图像特征进行机器分类的单个步骤中进行临床推断的当前CAD方法相比,本申请的系统和方法可以有利地利用层级推断方案,所述层级推断方案不仅可以应用于开始时的空间上分辨的图像特征,而且还可以应用于中间的在形态和结构组成的生物学目标组成部分的多个层上时间上分辨的动力学,并且然后应用于最后的临床推断。这产生了可以在层级中的从底部的低级图像特征到顶部的生物学特征和临床特征的每个层上理解、验证和解释的系统。

本公开的系统和方法对表型分类和结果预测进行了改进。表型分类可以发生在两个层上,一方面是单独解剖位置,并且另一方面是更一般地描述的身体部位。前者的输入数据可以是2D数据集并且后者的输入数据可以是3D数据集。然而对于表型分类,客观真相可以处于任何一个层上,对于结果预测/风险分层,客观真相通常发生在患者层上,但在某些情况下客观真相可能更具体(例如,中风症状表现在的哪一侧上)。这里的含义是相同的输入数据可以用于两个目的,但是模型将由于输入数据所使用的层以及真相注释的基础而显著不同。

虽然可能执行作为输入数据的模型建立读数向量,但性能通常会受到所实施被测变量的限制。本申请有利地利用独特的被测变量(例如,帽厚度、钙深度和溃疡)来改善性能。因此,仅读数向量方法可以在向量包含这些被测变量(例如,与常规被测变量组合)的情况下应用。然而,本公开的系统和方法可以有利地利用深度学习(DL)方法,然而所述深度学习方法可以提供甚至更丰富的数据集。本申请的系统和方法还可以有利地利用无监督学习应用,从而提供跨数据域的更好的可扩展性(考虑到新生物学数据所生成的速度的非常高度期望的特征)。

在本文呈现的示例实施例中,卷积神经网络(CNN)可以用于在可以被表征为利用微调方法的迁移学习的方法中建立分类器。在强大计算平台上对大概要的成像数据进行训练的CNN可以成功地用于对尚未在网络训练中注释的图像进行分类。这是可直观理解的,因为许多常见的特征分类会帮助标识极为不同的对象(即形状、边界、空间中的朝向等)的图像。然后可想象的是,进行训练以使用数以千万计的图像的预先注释的数据集来识别数千个不同对象的CNN将比偶然更好地执行基本图像识别任务,并且在相对小的稍微调整有时被称为'softmax层的最后的分类层之后将具有可与从一开始进行训练的CNN相当的性能。由于这些模型非常大并且已经对大数量的预先注释的图像进行了训练,因此其倾向于“学习”非常独特的、区别性的成像特征。因此,可以使用卷积层作为特征提取器,或者可以稍微调整经过训练的卷积层来适应手头的问题。第一方法被称为迁移学习,并且后一种被称为微调。

CNN擅长于执行许多不同的计算机视觉任务。然而,CNN具有一些缺点。医疗系统的重要性的两个重要缺点为1)需要大量训练和验证数据集,以及2)中间CNN计算不表示任何可测量性质(有时被批评为原理未描述的“黑匣子”)。本文公开的方法可以有利地利用流水线,所述流水线由一个或多个级组成,所述一个或多个级单独地是可生物测量的并且能够独立验证,随后是卷积神经网络,所述卷积神经网络开始于这些级而非仅原始图像。此外,可以应用某些变换来减少与手头的问题无关的变化,如在馈送网络之前,展开甜甜圈状血管的横截面,以变成具有归一化的坐标系的矩形表示。这些前端流水线级同时缓解了使用CNN以用于医学成像的两个缺点两者。

通常,早期卷积层充当增加特异性的特征提取器,并且完全连接的一个或两个最后的层充当分类器(例如,“softmax层”)。典型CNN中的层序列和其功能的示意表示可从许多来源获得。

有利地,本公开的系统和方法利用富集的数据集以使得能够对通过放射学数据集测定的组织进行无创表型分型。富集的一种类型是对数据进行预处理以执行组织分类,并使用“伪颜色”叠加来提供可以客观验证的数据集(与仅使用原始图像相反,使用原始图像不具有此可能性)。富集的另一种类型是在坐标系上使用变换,以在去除噪声变化的同时强调生物学上看似合理的空间上下文以提高分类准确性、允许较小的训练集或两者。

在示例实施例中,本申请的系统和方法可以采用多级流水线:(i)语义分割,所述语义分割用于对所关注区域(例如,其可以表示定量生物学分析物)进行标识和分类,(ii)空间展开,所述空间展开用于将管状结构的横截面(例如,静脉/动脉横截面)转化成矩形;以及(iii)经过训练的CNN的应用,所述应用用于读取所注释矩形并标识其属于哪种表型(例如,稳定或不稳定的斑块和/或正常或异常峰FFR)和/或预测的事件的时间(TTE)。应注意,通过在展开的数据集(在展开的情况下)相对于甜甜圈状数据集(在展开的情况下)的情况下训练和测试CNN,可以证明展开可提高每个特定实施方案的验证准确性。因此,对管状结构(例如,斑块表型分型)或其它结构(例如,肺癌团块亚分型(subtyping))或其它应用的各种实施方案成像可以类似地受益于执行类似的步骤(例如,语义分割、然后是如展开等空间变换(在应用CNN之前))。然而,设想了,在一些替代性实施例中,可以使用未经变换的数据集(例如,未在空间上展开的数据集)来确定表型(例如,结合或独立于未经变换的数据集)。

在示例实施例中,语义分割和空间变换可以涉及以下:可以对图像体积进行预处理,所述预处理包含目标初始化、归一化以及任何其它期望的预压,如去模糊或恢复以形成含有要表型分型的生理目标的所关注区域。值得注意的是,所述所关注区域可以是由穿过体积的横截面构成的所述体积,是可以自动确定或由用户明确提供的身体部位。本质上为管状的身体部位的目标可能会伴随有中心线。中心线在存在时可以有分支。分支可以自动或由用户标记。注意,对中心线概念的概括可以表示解剖学,所述解剖结构不是管状的,但是通过某种结构定向性,例如肿瘤的区域受益。在任何情况下,可以针对体积中的每个横截面确定形心。对于管状结构,形心可以是通道,例如,血管的管腔的中心。对于病变,所述形心可以是肿瘤的团块的中心。可以在笛卡尔数据集(Cartesian data set)中表示(任选地去模糊的或恢复的)图像,在所述笛卡尔数据集中x用于表示离形心多远,y表示旋转θ,并且z表示横截面。每分支或区域将形成一个此笛卡尔集。当使用多个集时,可以将“空”值用于重叠区域,也就是说,每个物理体素可以以在几何上拟合在一起的方式在整个集中仅表示一次。每个数据集可以与具有由可客观验证的组织组成标记的子区域的另外的数据集配对。血管组织的示例标签可以是管腔、钙化、LRNC、IPH等。病变的示例标签可以是坏死的、新血管形成的等。这些标签可以例如通过组织学客观地验证。配对的数据集可以用作用于建立卷积神经网络的训练步骤的输入。在示例实施例中,可以支持分析的两个层,一个层处于单独横截面层并且第二层处于体积层。输出标签表示表型或风险分层。

示例性图像预处理可以包含使用例如特定于患者的点扩散确定算法去模糊或恢复,以减轻由图像形成过程导致的伪像或图像限制。这些伪像和图像限制可能降低确定预测表型的特性的能力。例如,去模糊或恢复可以由于例如,利用关于图像的不同区域的真实潜密度的正则化假设迭代地拟合扫描仪点扩散函数的物理模型而实现。

在示例实施例中,CNN可以是AlexNet、Inception、CaffeNet或其它网络。在一些实施例中,可以对CNN进行重构,例如,在使用相同数量和类型的层,但是输入和输出尺寸改变(如改变纵横比)的情况下。各种示例CNN的示例实施方案作为例如TensorFlow上和/或其它框架中的开放源提供,可用作开放源和/或许可配置。

在示例实施例中,数据集可以增强。例如,在一些实施例中,可以对数据集应用2D或3D旋转。因此,在未经变换的(例如,甜甜圈状)数据集的情况下,增强可以涉及例如随机纵向翻转数据集与随机旋转数据集(如旋转0度与360度之间的随机角度)的结合。类似地,在经过变换的(例如,展开的)数据集的情况下,增强可以涉及例如随机纵向翻转与图像的随机“滚动”的结合,所述随机滚动如范围在0到图像的宽度的随机像素数量(其中滚动类似于围绕θ旋转)。

在示例实施例中,数据集可以通过使用不同的颜色来表示不同组织分析物类型来富集。这些颜色可以选择,以相对于彼此以及相对于非分析物表面(例如,正常壁)以视觉方式对比。在一些实施例中,非分析物表面可以用灰色描绘。在示例实施例中,数据集富集可以引起对组织特性(例如,指示斑块表型的组织特性)的基准真相注释,以及可以提供此类组织特性在横截面中如何呈现的空间上下文(例如,采取与血管的轴线正交)。此类空间上下文可以包含坐标系(例如,基于相对于横截面的形心的极坐标),所述坐标系为相对于组织学横截面的数据集分析提供了共同基础。因此,富集的数据集可以有利地叠加在颜色编码的病理学家注释的顶部上(反之亦然)。有利地,然后可以使用基于所注释数据集的组织学以用于与放射学数据集的图像特征分析结合或独立于放射数据集的图像特征分析的训练(例如,CNN的训练)。值得注意的是,基于所注释数据集的组织学可以提高DL方法的效率,因为基于所注释数据集的组织学使用相对较简单的伪颜色图像代替高分辨率的完整图像而不会丢失空间上下文。在示例实施例中,可以使用单位相量和相量角内部表示坐标方向。在一些实施例中,坐标系可以归一化,例如通过相对于壁厚度对径向坐标进行归一化(如以为将不同直径/厚度的管状结构/横截面进行比较提供共同基础)。例如,归一化的径向距离在内边界(内壁管腔边界)处的值为0并且在外边界(外壁边界)处的值为1。值得注意的是,这可以应用于与血管或其它病理生理有关的管状结构(例如,胃肠道)。

有利地,本申请的富集的数据集提供了基于无创图像的分类(例如,其中组织分类方案可以用于无创地确定表型),所述基于无创图像的分类是基于已知的基准真相。在一些实施例中,已知的基准真相可以是非放射学的(如组织学或另一种基于离体的组织分析)。因此,例如,注释为包含离体基准真相数据的放射学数据集(如组织学信息)可以有利地用作分类器的输入数据。在一些实施例中,在注释富集的数据集时,多个不同的已知基准真相可以彼此结合使用或独立于彼此使用。

如本文所述,在一些实施例中,富集的数据集可以利用归一化的坐标系来避免与例如壁厚和径向表示相关联的非相关变化。此外,如本文所述,在示例实施例中,例如在分类训练之前(例如,使用CNN)和/或对数据集运行训练分类器之前,可以“展开”“甜甜圈状”形状的数据集。值得注意的是,在此类实施例中,训练数据集的分析物注释可以在变换之前,例如在展开之后或两者的组合。例如,在一些实施例中,可以对未经变换的数据集进行注释(例如,使用如组织学信息等离体分类数据),并且然后进行变换,以用于分类器训练。在此类实施例中,基于离体的分类的更精细的粒度可以塌缩,以匹配用于体内放射学分析的较低预期的粒度,以降低计算复杂度,同时解决对于“黑匣子”的批评什么将是另外开放的。

在一些实施例中,可以选择用于使所注释放射学数据集可视化的颜色和/或轴线,以对应于如通常在基于离体基准真相的分类中呈现的相同颜色/轴线(例如,与组织学中使用的相同的颜色/轴线)。在示例实施例中,可以呈现经过变换的富集的数据集(例如,可以针对壁厚进行归一化),其中每种分析物均针对所有非分析物区域,以不同对比颜色并且相对于背景区域(例如,黑色或灰色)以视觉方式表示。值得注意的是,根据实施例,共同背景可能会或可能不会被注释,并且因此可能会或可能不会在血管壁内和外的非分析物区域之间或在背景特征(如管腔表面不规则性、变化的壁厚度等)之间以视觉方式进行区分。因此,在一些实施例中,所注释分析物区域可以相对于均匀(例如,完全黑色、完全灰色、完全白色等)背景以视觉方式描绘(例如,针对壁厚度进行颜色编码和归一化)。在其它实施例中,所注释分析物区域(例如,针对壁厚度进行颜色编码但未进行归一化)可以相对于所注释背景以视觉方式描绘(例如,其中可以使用不同阴影(灰色、黑色和/或白色)来在以下之间进行区分:(i)管状结构的内管腔内部的中心管腔区域,(ii)所述壁内部的非分析物区域和/或(iii)外壁外部的区域)。这可以使得能够分析壁厚的变化(例如,由于溃疡或血栓)。在另外的示例实施例中,所注释数据集可以包含对例如斑块内出血和/或其它形态方面的区域的标识(和可视化)。例如,斑块内出血的区域可以以红色查看,LRNC以黄色查看等。

本申请的系统和方法的一个具体实施方案可以处于引导血管疗法中。可以根据斑块病变的可能动态行为(基于其物理特性或特定机制,例如基于炎症或胆固醇代谢)和/或基于疾病的进展(例如,其自然历史的早期对晚期)来建立分类。此类分类可以用于引导患者治疗。在示例实施例中,AHA所采用的Stary斑块分型(typing)系统可以用作以颜色叠加示出的体内确定的类型的基础。示例映射为[‘I’,‘II’,‘III’,‘IV’,‘V’,‘VI’,‘VII’,‘VIII’],得到类_图=[亚临床、亚临床、亚临床、亚临床、不稳定、不稳定、稳定、稳定]。然而,本公开的系统和方法与Stary无联系。作为另一个实例,已将Virmani系统[“钙化结节”、“CTO”、“FA”、“FCP”、“愈合性斑块破裂”、“PIT”、“IPH”、“破裂”、“TCFA”、“ULC”]与class-map=[稳定、稳定、稳定、稳定、稳定、稳定、不稳定、不稳定、不稳定、不稳定]一起使用,并且其它分型系统可以得到类似的高性能。在示例实施例中,本公开的系统和方法可以合并完全不同的分型系统,可以改变类图,或其它变化。对于FFR表型,可以使用如正常或异常等值和/或可以使用数量,以促进与例如物理FFR的比较。

因此,在示例实施例中,本公开的系统和方法可以基于富集的放射学数据集提供对斑块的表型分类。特别地,一种或多种表型分类可以包含将稳定斑块与不稳定斑块区分开,例如,在分类的基准真相基础是基于如下因素的情况下:(i)管腔变窄(可能通过如曲折度和/或溃疡等另外的措施而增强),(ii)钙含量(可能通过深度、形状和/或其它复杂表示而增强),(iii)脂质含量(可能通过帽厚度和/或其它复杂表示而增强),(iv)解剖学结构或几何形状,和/或(v)IPH或其它含量。值得注意的是,此分类已展示为具有高的总体准确性、敏感度和特异性以及高度的临床相关性(有可能改变经历导管和心血管护理的患者的现有护理标准)。

另一示例实施方案是肺癌,其中可以确定团块的亚型,以便基于明显表型引导对患者最可能的有益治疗。特别地,可以使用预处理和数据集富集来分离出固体对半固体(“磨玻璃”)子区域,所述实心和半实心子区域在恶性程度和表明不同最佳治疗方法方面均有所不同。

在另外的示例实施例中,本公开的系统和方法可以提供CT血管造影术(CTA)诊断图像的图像预处理、图像去噪声和新颖几何表示(例如,仿射变换),以促进并最大化深度学习算法的基于CNN的用于开发一流分类器以及表示程序期间的不良心血管作用的风险的标志物的性能。因此,如本文所公开的,可以使用图像去模糊或恢复来标识所关注的病变并定量地提取斑块组成。此外,可以应用将横截面(沿主轴线血管)分割的图像变换成例如,遵循沿X轴线的确立的管腔的“展开的”矩形参考帧来提供归一化的帧,以允许DL方法最好地学习代表性特征。

尽管本文的示例实施例利用2D注释的横截面以进行分析和表型分型,但应注意,本申请不限于此类实施例。特别地,一些实施例可以利用例如代替单独地处理2D横截面或除了单独地处理2D横截面之外的富集的3D数据集。因此,在示例实施例中,可以对分类器输入数据集应用根据计算机视觉的视频解释。注意依序处理多个横截面,如同在“电影”序列中沿中心线一样,可以概括针对管状结构的这些方法,例如,根据最适合于解剖学的各方面向上和向下移动中心线和/或其它3D表现。

在另外的示例实施例中,富集的数据集中的伪颜色表示跨像素或体素位置可以具有连续值。这可以用于“放射组学”特征(无论有或没有明确的验证)或针对每个体素独立计算的经过验证的组织类型。此一组值可以以任意数量的经过预处理的叠加存在,并且可以馈送到表型分类器中。值得注意的是,在一些实施例中,每个像素/体素的值可以针对不同特征的任何数量(例如,对于不同分析物可以以不同叠加的任何数量表示,其有时被称为“多重占有”)。可替代地,每个像素/体素可以仅分配给一个分析物(例如,分配给仅单个分析物叠加)。此外,在一些实施例中,给定分析物(例如,给定分析物)的像素/体素值可以基于全有或全无分类方案(例如,像素是钙或不是钙)。可替代地,给定分析物的像素/体素值可以是相对值,例如,概率评分。在一些实施例中,像素/体素的相对值跨一组分析物进行归一化(例如,使得总概率加起来高达100%)。

在示例实施例中,可以通过全部或部分地应用如偏微分方程等多尺度建模技术来训练分类模型,以例如表示可能的细胞信号传导通路或看似合理的生物学动机的表示。

其它替代性实施例包含使用例如从多个时间点收集的变化数据,而不是(仅)来自单个时间点的数据。例如,如果阴性细胞类型的量或性质增加,则其可以被称为“进展变数”表型,而“回归变数(regressor)”表型则针对减少。回归变数可以是,例如由于对药物的应答。可替代地,如果例如LRNC的变化速率快,则这可能暗示不同的表型,例如“快速进展变数”。

在一些实施例中,可以将如衍生自其它测定(例如,实验室结果)或人口统计学/风险因素等的非空间信息或从放射学图像提取的其它测量结果馈送到CNN的最终层,以将空间信息与非空间信息组合。

值得注意的是,尽管系统和方法集中于表型分类,但是可以对结果预测应用类似的方法。此类分类可以基于分配到训练数据集的基准真相历史结果。例如,可以使用本申请的系统和方法确定预期寿命、生活质量、治疗功效(包含比较不同的治疗方法)和其它结果预测。

本申请的系统和方法的实例在下面的多个附图和具体实施方式中进行了进一步展示。

在另外的示例实施例中,本公开的系统和方法提供了通过斑块形态的测量对心肌和/或大脑组织中的血流储备分数的确定。本公开的系统和方法可以使用复杂的方法,以通过对影响其可扩张性的组织类型和性状的经过客观验证的确定来表征血管的血管舒张能力。特别地,从血流储备的角度,斑块形态可以用作脉管系统的动态行为的分析的输入(用血流储备真相数据训练模型)。因此,可能的是,确定系统的动态行为而不是(仅)静态描述。狭窄自身被众所周知的是低预测力,因为其仅提供静态描述,为了对动态功能进行最高准确性的基于成像的评估,需要添加准确的斑块形态。本公开提供了确定准确的斑块形态并且然后进行处理以确定动态功能的系统和方法。

在示例实施例中,利用深度学习以便以最佳粒度水平保持组织特性和血管解剖学(统称为斑块形态)的空间上下文,从而避免训练集中过度的非物质变异性,同时保持需要超越机器学习的其它更简单的使用。其它的替代方法使用仅对血管结构的测量,而不是对组织特性的更完整处理。此类方法可以捕获病变长度、狭窄以及可能的入口角和出口角,但是其忽略了血管舒张能力的决定因素。必须作出关于动脉树整体的灵活性的高级假设以使用这些模型,但斑块和其它组织性质会导致冠状树的可扩张性为可以异质方式扩张。树的不同部分或多或少是可扩展的。由于可扩张性是确定FFR的关键因素,因此这些方法是不充分的。尝试进行组织特性的其它方法在以下情况下如此进行:没有关于其准确性的客观验证和/或没有保持对于医学图像深度学习(例如,如展开和经过验证的伪颜色组织类型叠加等变换)来说最优的提供深度学习方法的有效性必须的空间上下文所需的数据富集方法。一些方法尝试通过使用合成数据来增加训练集大小,但这最终受到合成生成所基于的有限数据的限制,并且更受到数据增强方案而不是输入训练集的实际扩展的量的限制。另外,本公开的系统和方法能够产生跨血管长度的连续评估。

本公开的系统和方法有效地利用跨多个动脉床通过组织学验证的客观组织表征。关于与动脉粥样硬化的示例应用的相关性,斑块组成在冠状动脉和颈动脉方面类似,与其年龄无关,并且这将很大程度上确定相对稳定性,表明CCTA处的表示与CTA处类似。各种斑块特征的范围内的微小差异可以包含较厚的帽以及斑块内出血和颈动脉中钙化结节的更高的患病率,然而在斑块组成部分的性质方面没有差异。另外,颈动脉和冠状动脉在对斑块演进有影响的血管张力调节的生理学上有许多相似之处。心肌血液灌注是通过心外膜冠状动脉响应于如NO等各种刺激的血管舒张,从而引起冠状动脉张力的动态变化调节的,所述动态变化可能导致血流的多重变化。以类似方式,颈动脉不仅是支持大脑循环的简单导管;其展示出响应于刺激的血管反应性质,所述血管反应性质包含剪切应力的变化。内皮剪切应力有助于内皮健康和有利的血管壁转录组谱。临床研究已经证明低内皮剪切应力的面积与动脉粥样硬化发展和高风险斑块特征相关联。类似地,在颈动脉中,较低壁剪切应力与斑块发展和定位相关联。(内皮剪切应力自身是有用的测量,但不是代替斑块形态。)重要的是承认技术挑战跨床是不同的(例如,使用门控、血管大小、运动的量和性质),但是这些影响会通过扫描协议缓解,这会导致在0.5-0.75mm范围内的大约面内体素大小,并且冠状(较小血管)的穿透平面分辨率实际上优于而不是次于颈的分辨率(其中体素在冠状中为各向同性的,而在颈部和外围末梢中则不是。

本公开基于尊重奈奎斯特-香农(Nyquist-Shannon)采样定理的坚实数学原理,在与IVUS VH相同的活动领域内利用常规采集的CTA实现了有效的分辨率。IVUS成像具有针对总体结构(即,管腔)的出色空间分辨率,但通常缺乏以高准确性表征斑块组成部分的能力。文献估计使用范围在20-40MHz内的典型换能器,IVUS分辨率为轴向70-200μm,横向为200-400μm。IVUS VH是频谱反向散射分析的方法,其实现了斑块组成分析(以及因此测量)。对于在轴向方向上使用大(例如480μm)移动窗口的IVUS VH方法,此移动窗口的相对大的大小(以及因此组成分析的准确性)根本上受到频谱分析的带宽要求的限制。在IVUS VH图像显示在较小移动窗口(例如,250μm)的情况下,由于每个IVUS像素都被分类为离散类别,因此这限制了此分析的准确性。已经将64层多检测器CCTA扫描描述为处于300-400μm分辨率的范围内。尽管这已经使CCTA分辨率非常接近IVUS VH的分辨率,但是要考虑本发明分析所特有的其它因素。因此,不同于离散地对CCTA像素进行分类,本公开的系统和方法以亚体素精度执行迭代去模糊或恢复建模步骤,例如使用三角形的棋盘格形表面来表示脂质核的真实表面。脂质核面积在393名患者中处于6.5-14.3mm2的范围内(相应的曲率半径为1.4-2.1mm)。使用其中弦以对角线方式跨越单个体素的弦长公式,这表示脂质核的棋盘格形表面表示的误差的上限为44μm。还存在与可能引起准确性的总范围为194-244μm的像素的大约一半的误差的去模糊或恢复分析相关联的另外的因素,所述准确性通常相当于IVUS VH的用于测量帽厚度的准确性。

本公开在处理对将人工智能和深度学习应用于动脉粥样硬化成像数据的分析的基本限制方面也是创新性的。缺乏经过验证的且客观的依据的常规竞争方法以多种方式受到根本性限制。首先,使用任意阈值导致无法评估准确性,除非处于与自身缺乏客观验证的其它标志物的相关性较弱的形式中。第二,此对客观性的缺乏增加了对在环境上基于相关性的大量数据的需求。这对放射学图像的手动注释提出了不可行的要求,所述放射学图像自身是分析的对象(也就是说,与根据独立模态进行验证相反)。第三,由于所产生的模型的可解释性,因此必须将这些模型作为“黑匣子”呈现给如FDA等监管机构,所述“黑匣子”缺乏对可以与传统生物学假说测试联系的作用机制的科学严谨的说明。具体地,尽管CNN已被证明在执行许多不同的计算机视觉任务方面是出色的,但其在应用于放射学数据集时却具有重大缺陷:1)需要大量的训练和验证数据集,以及2)中间物。

CNN计算通常不能表示任何可测量的性质,这使得监管审批变得困难。为了应对这些挑战,利用了由级组成的流水线方法与单独能够在生物学层面上客观地验证以馈送CNN的输出。本发明通过使用流水线克服这些缺点,所述流水线由一个或多个级和随后的较小范围卷积神经网络组成,所述一个或多个级是可生物测量的(即,能够客观验证的),所述随后的较小范围卷积神经网络对这些经过验证的生物学性质进行处理,以输出可以说是不基于主观或定性“图像特征”的期望的输出条件。这些架构能力通过增加可用训练数据的效率来减少缺点,并且使中间步骤能够被客观地验证。本公开的系统和方法使用针对医学成像的CNN通过以下同时减少了缺点:1)将视觉任务的复杂性降低到在用中等大小的数据集训练CNN时可接受的水平内;以及2)产生经过客观验证并且易于由用户或监管机构解释的中间输出。中间CNN计算通常不能表示任何可测量性质,空间上下文在使用特征提取的ML方法中通常难以获得,并且使用确实含有空间上下文的原始数据集通常缺乏所提取特征的客观基准真相标签,无论其是使用传统机器学习还是深度学习方法进行处理的都是如此。同样,原始数据集包含相对于手头的分类问题是“噪声”的变化,所述分类问题在医学以外的计算机视觉应用中通过具有一定规模的通常不可用于医学领域的非常大的训练集,特别是用基准真相注释的数据集而得以克服。

本公开的系统和方法的定量能力使得此类理想用于分析更先进的成像方案(如针对组织表征研究的早期/延迟相位比对、双能和多频谱技术等方案)。

尽管已经参考其示例实施例具体地示出和描述了本公开的系统和方法,但是本领域的技术人员将会理解,在不脱离本公开的范围的情况下,可以在其中做出形式和细节方面的各种改变。

附图说明

前述内容将根据对如在附图中所展示的示例实施例的以下更具体的描述中而变得显而易见,在附图中,相同的附图标记在不同的视图中指代相同的部分。附图不一定按比例绘制,重点相反放在展示本公开的实施例上。

图1描绘了根据本公开的用于通过实施层级分析框架来确定和表征医疗状况的示例性系统的示意图。

图2概述了根据本公开的可以通过本文描述的系统和方法实施的基于重新采样的模型建立方法。

图3描绘了根据本公开的可以通过本文描述的系统和方法输出的样品患者报告。

图4描绘了根据本公开的多尺度血管壁分析物图的示例分割级。

图5描绘了根据本公开的作为一组分析物概率向量的示例性像素级概率质量函数。

图6展示了根据本公开的用于计算推定分析物斑点的技术。

图7描绘了根据本公开的针对示例性血管壁组成模型的归一化血管壁坐标。

图8描绘了根据本公开的组织学样本的去除的斑块与外血管壁之间的示例边缘。

图9展示了根据本公开的可以使用本文描述的技术来解释的一些复杂血管拓扑。

图10描绘了表示根据本公开的在归一化的血管壁坐标分布情况下的示例性分析物斑点。

图11描绘了根据本公开的博客描述符的示例性分布。

图12描绘了根据本公开的用于对在隐藏的基准真相状态与观察到的状态之间进行关联的数据进行成像的示例性模型。

图13描绘了根据本公开的用于将观察到的状态与图像模型中的隐藏状态相关联的示例马尔可夫(Markov)模型/维特比(Viterbi)算法的图。

图14描绘了根据本公开的多个组织学载玻片的每组织学载玻片斑点的总数量的示例频率分布。

图15描绘了根据本公开的1D马尔可夫链的示例性植入。

图16描绘了根据本公开的用于文本概率表的示例一阶马尔可夫链。

图17描绘了根据本公开的第一像素的基于其相邻像素的条件依赖性。

图18描绘了根据本公开的另外的示例性层级分析框架。

图19描绘了根据本公开的引导血管疗法中的表型分型目的的示例应用。所描绘的实例使用AHA所采用的Stary斑块分型系统作为基础,其中体内确定的类型以颜色叠加示出。

图20描绘了根据本公开的对肺癌进行表型分型的示例应用。

图21展示了根据本公开的去模糊或恢复的示例性图像预处理步骤。去模糊或恢复使用患者特异性点扩散确定算法来减轻由图像形成过程引起的伪像或图像限制,所述伪像或图像限制可能会降低确定预测表型的特性的能力。所描绘(底部)的去模糊的或恢复的(经过处理的)图像衍生自斑块(顶部)的CT成像,并且是利用关于图像的不同区域的真实潜密度的正则化假设迭代地拟合扫描仪点扩散函数的物理模型的结果。

图22描绘了根据本公开的展示了动脉粥样硬化斑块表型的富集的数据集的示例性应用。

图23展示了根据本公开的使用单位相量和相量角(以灰色标度编码示出的)的内部表示的切向和径向方向变量,其例示了对与血管相关的管状结构以及与此类结构(例如,胃肠道)相关联的其它病理生理使用归一化轴线。

图24展示了根据本公开的从CTA(轮廓区域)进行的放射学分析应用产生的注释在从组织学(固体区域)进行的病理学家产生的注释的顶部上的示例性叠加。

图25展示了根据本公开的,具体地,利用归一化的坐标系来避免与壁厚度和径向表示相关联的非相关变化的数据富集的另外的步骤。具体地,“甜甜圈状”被“展开”,同时保持病理学家注释。

图26表示根据本公开的与斑块表型分型相关的数据富集的另外的步骤。从展开的形式体系工作,表示了管腔不规则(例如由于溃疡或血栓)和局部变化的壁增厚。

图27表示根据本公开的包含斑块内出血和/或其它形态的数据富集成像(呈未展开和展开形式两者)。

图28表示根据本公开的用数据富集成像的不同变化训练和验证的算法的验证结果。

图29提供了根据本公开的对肺部病变进行表型分型的示例应用。

图30提供了根据本公开的用于对肺部病变进行表型分型的生物学性质(包含例如,组织特性、形态等)的实例。注意,在示例实施例中,伪颜色可以表示为关于这些生物学性质中的一种或多种的连续值而不是离散值。

图31展示了根据本公开的用于与计算机辅助表型分型系统进行用户交互的一种示例方法的高级视图。

图32展示了根据本公开的示例系统架构。

图33展示了根据本公开的示例系统架构的组成部分。

图34是根据本公开的示例数据分析的框图。收集患者的图像,在一组算法中使用原始切片数据以测量可以客观验证的生物学性质,进而将这些生物学性质形成为用于馈送多个CNN之一的富集的数据集,在此实例中其中结果使用递归CNN向前和向后传播以实施约束或产生连续状况(如在整个血管树中从近侧到远侧单调下降的血流储备分数、或局灶性病变中的恒定HRP值或其它约束)。

图35展示了根据本公开的冠状缺血的因果关系和可用的诊断。

图36描绘了根据本公开的表现出胸部疼痛和类似危险因素以及狭窄程度的两个患者的管腔、血管壁和斑块组成部分(LRNC和钙化)的示例性3D分割。左边:在随访时具有NSTEMI的68岁男性。右边:在随访时无事件的65岁男性。本公开的系统和方法正确地预测了其相应结果。

图37描绘了根据本公开的用于客观验证组织组成的示例组织学处理步骤。

图38是根据本公开的可以被处理以提供跨整个扫描的血管树的动态分析的多个横截面的示意描绘,其展示了横截面之间的关系,并且其中一个横截面的处理取决于其近邻。

具体实施方式

本文呈现了用于利用定量成像分析病理学的系统和方法。有利地,本公开的所述系统和方法利用层级分析框架,所述层级分析框架从成像数据中标识生物学性质/分析物并且对所述生物学性质/分析物进行定量,并且然后基于经过定量的生物学性质/分析物标识和表征一种或多种病理学。相对于被配置成在不进行验证步骤和/或不进行本文所述的有利处理的情况下根据原始成像数据直接确定并表征病理学的系统和方法,使用成像来检查作为用于评估病理学的中间物的基础生物学的此层级方法提供了许多分析和处理优势。

例如,一个优势是能够利用与放射学源的训练集结合或独立于放射学源的训练集的来自非放射学源的,例如来自组织样品源的如组织学信息等训练集,以使放射学成像特征与生物学性质相关/使分析物与病理学相关。例如,在一些实施例中,可以在训练算法中使用组织学信息,以用于基于经过定量的生物学性质/分析物来标识和表征一种或多种病理学。更具体地,还可以在放射学数据中标识可在非放射学数据中(如在有创地获得的组织学数据集中或可通过基因表达谱获得的)标识/定量的生物学性质/分析物并且对所述生物学性质/分析物进行定量(这有利地为无创的)。然后可以使用来自非放射学源的信息,例如利用组织学信息、基因表达谱或其它临床丰富的数据集,使这些生物学性质/分析物与关于病理学的临床发现相关。此类临床相关的数据集然后可以充当用于确定/调谐(例如,利用机器学习)算法的训练集或训练集的一部分,所述算法将生物学性质/分析物和与临床结果具有已知关系的病理学相关。然后可以将生物学性质/分析物与利用非放射学源训练集得到的病理学相关的这些算法应用于评价衍生自放射学数据的生物学性质/分析物。因此,本公开的系统和方法可以有利地实现利用放射学成像(有利地可以是成本效益型的且无创的)以提供用于预测临床结果或指导治疗的替代措施。

值得注意的是,在一些情况下,非放射学源(如组织学信息)的训练数据可以比放射学源的训练数据更为准确/可靠。此外,在一些实施例中,可以使用来自非放射学源的训练数据来增强来自放射学源的训练数据。因此,由于更好的数据输入可能会得到更好的数据输出,因此公开的层级分析框架有利地改进了本文公开的算法的可训练性和所产生的可靠性。如上所述,一个主要优点是一旦经过训练,本公开的系统和方法就可以实现衍生与现有组织学和其它非放射学诊断型测试可比较的临床信息,而无需经历有创和/或昂贵的程序。

可替代地,在一些实施例中,放射学源(如非放射学成像源,例如,组织学源和/或非成像源)的训练集可以与放射学源的训练集结合或独立于放射学源的训练集利用,例如,在将图像特征与生物学性质/分析物相关时。例如,在一些实施例中,可以对一个或多个生物学模型进行外推和拟合,以使放射学数据和非放射学数据相关。例如,组织学信息可以基于基础生物学模型与放射学信息相关。此相关性可以在利用非放射学,例如,组织学信息的放射学数据中实现对生物学性质/分析物的训练识别。

在一些实施例中,可以将从互补模态中提取的数据用于使例如图像特征与来自血液面板、物理FFR和/或其它数据源的生物学性质/分析物相关。

在示例实施例中,可以利用从一种成像模态中提取的成像数据来外推和拟合一个或多个生物学模型,所述一种成像模态与另一种成像模态或非成像源(如bloodwork)相关和/或融合。这些生物学模型可以有利地跨基于生物学模型的成像数据集和非成像数据集相关和在成像数据集与非成像数据集之间相关。因此,这些生物学模型可以使得层级分析框架能够利用来自一种成像模态与另一种成像模态或与非成像源的数据来标识一种或多种生物学性质/分析物/对一种或多种生物学性质/分析物进行定量或标识/表征一种或多种医学状况。

本文公开的层级分析框架的另一个优点是能够将来自多个相同或不同类型的数据源的数据合并到基于成像数据标识和表征病理学的过程中。例如,在一些实施例中,一个或多个非成像数据源可以与一个或多个成像数据源结合使用,以标识一组生物学性质/分析物并且对所述一组生物学性质/分析物进行定量。因此,特别地,所述一组生物学性质/分析物可以包含基于一个或多个成像数据源标识和/或定量的一个或多个生物学性质/分析物、基于一个或多个非成像数据源标识和/或定量的一个或多个生物学性质/分析物和/或基于成像和非成像数据源的组合标识和/或定量的一个或多个生物学性质/分析物(注意,出于本公开的定量成像系统和方法的目的,所述一组生物学性质/分析物通常可以包含至少部分地基于成像数据标识和/或定量的至少一个或多个生物学性质/分析物)。在标识一组生物学性质/分析物并且对所述一组生物学性质/分析物进行定量时,利用来自其它成像和/或非成像数据源的信息增强来自成像数据源的信息的能力增加了本文所呈现的系统和方法的鲁棒性,并且使得能够在标识和表征病理学中利用任何和所有相关信息。

层级分析框架的又另一个优点涉及例如,在利用所述数据来评估随后的级之前或之后调整/微调每个级上的数据的能力(注意在一些实施例中这可以是迭代过程)。例如,在一些实施例中,可以以后验方式调整涉及一组所标识和经过定量的生物学性质/分析物的信息(例如,在对其进行初步标识和/或定量之后)。类似地,在一些实施例中,可以以后验方式调整涉及一组所标识和所表征病理学的信息(例如,在对其进行初步标识和/或表征之后)。这些调整可以是自动的或基于用户的并且可以是客观的或主观的。调整/微调每个级上的数据的能力可以有利地提高数据可说明性和可靠性。

在示例实施例中,调整可以基于上下文信息,所述上下文信息可以用于更新影响生物学性质/分析物的确定或定量的一个或多个概率。在示例实施例中,用于以后验方式调整涉及一组所标识和经过定量的生物学性质/分析物的信息的上下文信息可以包含患者人口统计学、生物学性质/分析物之间的相关性或所标识/所表征病理学与生物学性质/分析物之间的相关性。例如,在一些情况下,生物学性质/分析物在第一生物学性质/分析物的标识/定量可以影响与第二生物学性质/分析物的标识/定量有关的概率的意义上可以是相关的。在其它情况下,例如基于初始组的所标识/经过定量的生物学性质/分析物对第一病理学的标识/表征可能会影响与对所述初始组中的生物学性质/分析物或甚至不在第一组中的生物学性质/分析物的标识/定量有关的概率。在另外的情况下,病理学可以是相关的,例如其中对第一病理学的标识/表征可以影响与第一病理学的标识/表征有关的概率。如上所述,涉及对生物学性质/分析物的标识和定量的信息和/或涉及对病理学的标识和表征的信息可以以迭代方式更新,例如直到数据汇聚或阈值/基准实现或针对所选数量的周期为止。

层级分析框架的另外的优点涉及向用户,例如,医师提供涉及病理学以及基础生物学两者的信息的能力。此增加的上下文可以促进临床诊断/评估以及评估/确定下一步骤,例如,疗法/治疗选项或另外的诊断。例如,系统和方法可以被配置成确定与对一种或多种病理学的标识/定量相关的那些生物学参数/分析物是最不确定的/具有最高程度的不确定性(例如,由于缺乏数据或冲突数据)。在此类情况下,可以推荐具体另外的诊断。向用户提供与病理学以及基础生物学两者相关的信息的增加的上下文可以进一步帮助用户评价/误差检查由分析得出的各种临床结论和推荐。

如本文所使用的层级分析框架是指其中一个或多个中间组的数据点被用作中间处理层或初始组的数据点与末端组的数据点之间的中间变换的分析框架。这与其中使用算法以使用多个处理层或另外利用多个变换,如多个非线性变换来对更高级的抽象进行建模的深度学习或层级学习的概念类似。通常,本公开的系统和方法的层级分析框架包含涉及生物学性质/分析物的作为中间处理层或成像数据点与病理学数据点之间的中间变换的数据点,在实例、实施例中,可以包含用于确定成像信息、基础生物学信息和病理学信息中的每一个的多个处理层或多个变换(例如,由多级数据点所体现的)。尽管本文中引入了示例层级分析框架结构(例如,具有具体处理层、变换和数据点),但是本公开的系统和方法不限于此类实施方案。相反,在不脱离本公开的范围和精神的情况下,可以利用任何数量的不同类型的分析框架结构。

在示例实施例中,本申请的层级分析框架可以被概念化为包含作为经验数据层(包含成像数据)与结果层(包含病理学信息)之间的中间物的逻辑数据层。然而,经验数据层表示直接来源的数据,逻辑数据层有利地增加了一定程度的逻辑和推理,所述逻辑和推理可将此原始数据提取到针对所讨论的结果层的一组有用分析物长。因此,例如,原始成像信息等来自诊断的经验信息可以被有利地向下提取到与特定组的生物学特征有关的逻辑信息,所述逻辑信息对于评估所选病理学或病理学群组是相关的(例如,病理学涉及患者的身体的所成像区域)。以此方式,本申请的生物学特征/分析物也可以被视为病理学症状/指标。

本申请的生物学特征/分析物有时在本文中可以被称为生物标志物。尽管术语“生物学”或前缀“生物”用于表征生物学特征或生物标志物,但这仅旨在表示特征或标志物相对于患者的身体具有一定程度的相关性。例如,生物学特征可以是解剖的、形态的、组成的、功能的、化学的、生化的、生理学的、组织学的、遗传学的或涉及患者的身体的任何数量的其它类型的特征。本文公开了本公开的系统和方法的具体实施方案所利用的示例生物学特征(例如,涉及患者的特定解剖区域,如血管系统、呼吸系统、如肺部、心脏或肾脏等器官或其它解剖区域)。

尽管本公开的示例系统和方法可以适应于检测、表征和治疗病理学/疾病,但是本公开的系统和方法的应用不限于病理学/疾病,而是相对于患者的任何临床相关医学状况都可以更普遍地适用,所述临床相关医学状况包含,例如,综合征、病症、创伤、过敏反应等。

在示例性实施例中,本公开的系统和方法涉及计算机辅助表型分型,例如通过使用关于生物学的知识来分析医学图像,以测量已经通过研究确定用于指示进而预测结果的表型的疾病类型之间的差异。因此,在一些实施例中,表征病理学可以包含确定病理学的表型,所述的表型进而可以确定预测结果。

首先参考图1,描绘了示例性系统100的示意图。存在三个基础功能,所述基础功能可以由系统100提供,其表示为训练器模块110、分析仪模块120和队列工具模块130。如所描绘的,分析仪模块120有利地实施层级分析框架,所述框架首先利用(i)来自患者50的一个或多个所采集图像121A的成像特征122,以及(ii)患者50的非成像输入数据121B的组合来标识和定量生物学性质/分析物130,并且然后基于经过定量的生物学性质/分析物123标识和表征一种或多种病理学124(例如,预后表型)。有利地,分析仪模块120可以通过实施一种或多种经过预训练的,例如机器学习的算法以得出其推断而独立于基准真相或验证参考操作。

在示例实施例中,分析仪可以包含用于根据患者50的所采集图像121A计算成像特征122的算法。有利地,图像特征122中的一些图像特征可以在每体素基础上计算,而其它图像特征可以在所关注区域的基础上计算。可以与所采集图像121A一起使用的示例非成像输入121B可以包含来自实验室系统、患者报告的症状或患者历史的数据。

如上所述,图像特征122和非成像输入可以由分析仪模块120用于计算生物学性质/分析物123。值得注意的是,生物学性质/分析物通常是定量的、客观的性质(例如,可客观地验证而不是表述为印象或外观),所述定量的、客观的性质可以表示例如标志物(如化学物质)或如所关注区域的结构、大小或解剖特性等其它测量的存在和程度。在示例实施例中,除了分析仪模块的进一步处理之外或独立于分析仪模块的进一步处理,经过定量的生物学性质/分析物123可以显示或导出,以供用户,例如,供临床医生直接消耗。

在示例实施例中,经过定量的生物学性质/分析物123中的一个或多个可以用作用于确定表型的输入。表型通常以疾病特异性方式定义、独立于成像、通常从与预期的结果存在文档化关系的离体病理生理样品中提取。在示例实施例中,分析仪模块120还可以为确定的表型提供预测结果125。

应当理解,分析仪模块120的示例实施方案在本文中相对于遵循系统100的一般描述的具体实施例进行了进一步描述。具体地,具体成像特征、生物学性质/分析物和病理学/表型是相对于具体医学应用,如相对于血管系统或相对于呼吸系统描述的。

仍然参考图1,队列工具模块130使得能够定义用于其群组分析的患者的队列,例如基于与所讨论的队列研究有关的一组选定的标准。示例队列分析可以针对纳入临床试验的患者的群组,例如其中患者是基于试验的一个或多个分支,例如治疗分支与对照分支而进一步分组的。另一种类型的队列分析可以针对基准真相或参考存在的受试者的集,并且此类型的队列可以进一步分解为训练集或“开发”集以及测试集或“保持”集。可以支持开发集以便训练112分析仪模块120内的算法和模型,并且可以支持保持集以便评价/验证113分析仪模块120内的算法或模型的性能。

继续参考图1,训练器模块110可以用于训练112分析仪模块120内的算法和模型。具体地,训练器模块110可以依赖于基准真相111和/或参考注释114以便于得出权重或模型,例如根据建立的机器学习范例或通过通知算法开发者。在示例实施例中,采用可以高度适应的,例如,能够揭示预测器与应答之间的复杂关系的分类和回归模型。然而,其适应于现有数据内的基础结构的能力可以使得模型能够找到对于受试者的另一样品来说不可再现的模式。适应于现有数据内不可再现的结构通常被称为模型过度拟合。为了避免建立过度拟合模型,可以应用系统方法,所述系统方法防止模型发现假性结构,并使得最终用户能够对最终模型将以评价其模型的数据集预测具有类似程度的准确性的新样本有信心。

连续训练集可以用于确定一个或多个最佳调谐参数,并且测试集可以用于估计算法的或模型的预测性能。训练集可以用于通过随机化的交叉验证来训练分类器中的每个分类器。数据集可以重复地分裂成训练和测试集,并且可以用于确定分类性能和模型参数。数据集分裂成训练集和测试集使用层级化方法或最大相异性方法发生。在示例实施例中,重新采样方法(例如,自举)可以用于训练集内,以便于获得(i)最优参数估计值以及(ii)模型的预测性能的置信区间。

图2概述了可以由本公开的系统和方法利用的基于重新采样的模型建立方法200。首先,在步骤210处,可以定义调谐参数集。接下来,在步骤220处,为了对每个调谐参数集数据进行重新采样,对模型进行了拟合并预测了保持样品。在步骤230处,将重采样估计组合到性能谱中。接下来,在步骤240处,可以确定最终调谐参数。最终,在步骤250处,将整个训练集与最终调谐参数重新拟合。在已根据训练集对每个模型进行调谐之后,可以在测试集上针对预测性能对每个模型进行评价。测试集评价对于每个模型发生一次,以确保模型建立过程不会过度拟合测试集。对于构建的每个模型,可以报告最佳调谐参数估计、重新采样的训练集性能以及测试集性能。然后比较随机分裂之上的模型参数的值,以评价对于训练数据的模型稳定性和鲁棒性。

根据本公开的系统和方法,可以针对基准真相图中表示的生物学性质/分析物(例如,组织类型)中的每一个对多个模型进行调谐。模型应答可以包含例如基于协方差的技术、基于非协方差的技术和基于树的模型。根据其构建,终点可以具有连续应答和分类应答,以上类别中的技术中的一些技术用于分类应答和连续应答两者,然而其它技术则特定于分类应答或连续应答。可以针对每个模型报告最佳调谐参数估计、重新采样的训练集性能以及测试集性。

表1:

以上表1提供了系统100的分析仪模块120的某些示例功能的汇总。即,分析仪模块120可以被配置成描述字段,例如以跨字段对多个数据流进行配准;以分割器官、血管、病变和其它特定于应用的对象;和/或以重新格式化/重新配置解剖学,以用于特定分析。分析仪模块120可以被进一步配置成用于在所描述字段中描述目标,例如病变。描述目标可以包含例如:在一个区域设置处对多个数据流进行配准;执行细粒度分割;测量相关解剖结构的大小和/或其它特性;和/或提取整个目标特征(例如,整个目标区域的生物学性质/分析物特性)。在一些实施例中,还可以描述一个或多个子目标区域,例如,目标区域可以根据特定应用与特定于子目标的计算而被分裂为子目标(例如,子目标区域的生物学性质/分析物特性)。分析仪模块120还可以描述例如特定字段、目标或子目标区域中的组成部分或相关特征(如组合物)。这可以包含分割或重新分割组成部分/特征,计算所分割组成部分/特征的值(例如,组成部分/特征的生物学性质/分析物特性)以及将概率图分配给读数。可以基于经过生物学定量的性质/分析物确定下一病理学,并且例如通过确定病理学的表型和/或预测结果来表征下一病理学。在一些实施例中,分析仪模块120可以被配置成比较跨多个时间点的数据,例如,生物学组成部分/分析物中的一个或多个可以涉及基于时间的定量。在另外的实施例中,可以利用宽的扫描字段来评估多病灶病理学,例如基于所描述字段中跨多个靶的生物学性质/分析物的聚集定量。最后,基于前述分析,分析仪模块120可以被配置成生成患者报告。

样品患者报告300描绘于图3中。如所示出的,样品患者报告300可以包含如与结构310和组成320有关的生物学参数/分析物的定量,以及来自如血液动力学330的非成像源的数据。样品患者报告可以进一步包含可视化340,例如成像数据的2D和/或3D可视化以及如叠加到成像数据上的血液动力学数据等非成像数据的组合可视化。可以显示各种分析350,以用于评估生物学参数/分析物,所述各种分析包含例如用于确定/表征病理学的一个或多个模型(例如,决策树模型)的可视化。可以进一步包含患者背景和标识信息。因此,系统100的分析仪模块120可以有利地向用户,例如临床医生提供用于评估患者的综合反馈。

有利地,本公开的系统和方法可以适于具体应用。在以下章节中更详细地描述了示例血管和肺部应用(但是应当理解,所描述的具体应用相对于许多其它应用具有一般含义和互操作性)。表2提供了利用如本文所述的层级分析框架的血管和肺部相关应用的概述。

表2:

以下章节提供了可以由本公开的系统和方法相对于血管应用使用的定量生物学性质/分析物的具体实例:

解剖结构:血管结构测量,特别是导致对狭窄%的确定的测量,长期以来一直是并且仍是患者护理中的单个最常用的测量。这些测量最初限于内管腔测量,而不是涉及血管壁的内表面和外表面两者的壁测量。然而,主要无创模态中的所有模态与X射线血管造影术不同,可以分辨血管壁并且随着分辨血管壁,进行了可以实现的扩展的测量。类别是广泛的并且测量的对象具有变化的大小,因此应谨慎进行概括。主要考虑因素是空间采样或分辨率的限制。然而,通过利用由于部分体积效应引起的强度水平的细微变化,壁厚度的最小可检测变化可以低于空间采样。此外,规定的分辨率通常是指网格大小和采集后重构的视野而不是成像方案的确定可以分辨的最小特征大小的实际分辨能力。同样,面内分辨率与跨面分辨率可以相同或可以不相同,并且给定特征的大小以及其比例和形状都将驱动测量准确性。最后但同样重要的,在一些情况下,通过将阈值应用于测量得出了分类结论,然后可以根据信号检测理论利用优化敏感度与特异性(在正常意义上不另外指代测量的术语)之间的权衡的能力解释所述分类总结。

组织特性:对包含例如脂质丰富的坏死核(LRNC)、纤维化、斑块内出血(IPH)、磁导率和钙化的动脉粥样硬化斑块的单独成分组成部分的定量评估可以提供关于斑块的相对结构完整性的关键信息,所述关键信息可以在医学疗法或外科手术疗法的过程中辅助医师的决定。从成像技术角度,这样做的能力很少取决于空间分辨率,正如对比分辨率和组织区分,所述组织区分通过使不同地对应于入射能量的组织不同从而产生不同的接收信号而变得可能。每个成像模态在某种程度上这样做;超声中如“透声性”、Hounsfield单位的CT数量以及差异化MR强化等术语随如(但不限于)T1、T2和T2*等各种序列变化。

动态组织行为(例如,磁导率):除了血管壁/斑块的形态特征外,越来越认识到动态特征是血管病理学的有价值的定量指标。其中在多个紧密间隔的时间(称为相位)进行采集的动态序列将库扩大到超出空间分辨的值t,所述空间分辨的值包含可以用于隔室建模或其它技术以确定组织对刺激(如但不限于对造影剂的内洗和外洗)的动态应答的时间分辨的值。通过在颈动脉中使用利用超声或MR的动态对比增强的成像或在冠状动脉中使用延迟对比增强,可以确定所关注的斑块内的新血管生成的微血管网络的相对磁导率(例如,根据动力学分析的Ktrans和Vp参数)的敏感性评估。另外,这些动态数列还可以辅助在增加的血管磁导率与斑块内出血之间进行分区。

血液动力学:循环的基本血液动力学参数对血管病变具有直接影响。血压、血流速度和血管壁剪切应力可以通过范围从非常简单的振荡法到复杂的成像分析等技术测量。使用流体动力学的一般原理,可以确定壁的不同区域的血管壁剪切应力的计算。以类似方式,MRI与US组合或不组合,都已经用于计算壁剪切应力(WSS)并使结果与所关注的血管的结构变化相关。另外,已经对抗高血压药物对血流动力学的影响进行了短期和长期研究。

因此,在示例实施例中,在血管设置中应用本公开的系统和方法的关键方面可以包含评价斑块结构和斑块组成。评价斑块结构可以有利地包含例如管腔测量(其通过提供面积而不是仅直径测量来改善狭窄测量)以及壁测量(例如,壁厚度和血管重塑)。评价斑块组成可以有利地涉及组织特性的定量(例如,脂质核、纤维化、钙化、磁导率等)而不是仅如现有技术中通常发现的“软”或“硬”名称。以下表3和4分别描述了可以由本公开的系统和方法的血管应用利用的示例结构计算和组织特性计算。

表3:本文公开的系统和方法的血管应用支持的血管解剖学的结构计算

与评价血管系统有关的示例系统可以有利地包含/采用用于评价血管结构的算法。因此,系统可以采用例如靶/血管分段/横截面模型以用于分割所成像血管的基础结构。有利地,可以对单独血管分段应用快速行进竞争滤波器。系统可以进一步被配置成处理血管分叉。可以利用Mattes互信息(MR)或均方误差(CT)度量、刚性versor变换、LBFGSB优化器等来应用图像配准。如本文所述,血管分割可有利地包含管腔分割。初始管腔分割可以利用置信连接的滤波器(例如,颈动脉、椎骨、股骨等)来区分管腔。管腔分割可以利用MR成像(如归一化的(例如倒置的)暗反差图像的组合)或CT成像(如使用配准的对比前、对比后CT和2D高斯(Gaussian)分布)来定义血管函数(vessel-ness function)。可以分析各种连接的组成部分,并且可以应用阈值化。血管分割可能进一步需要外壁分割(例如,利用最小曲率(k2)流动来解决管腔不规则性)。在一些实施例中,边缘电势图被计算为对比和非对比两者中的向外-向下梯度。在示例实施例中,外壁分割可以利用速度函数中的累积分布函数(例如,合并壁厚度的先前分布,例如1-2个相邻层级),以允许任何其它边缘信息不存在的情况下的中值厚度。在示例实施例中,可以采用费列直径(ferret diameter)以用于血管表征。在另外的实施例中,壁厚度可以计算为到管腔的距离加上到外壁的距离的总和。在另外的实施例中,可以使用语义分割,使用例如CNN来进行管腔和/或壁分割。

与评价血管系统有关的示例系统可以进一步有利地分析血管组成。例如,在一些实施例中,组成可以基于图像强度和其它图像特征来确定。在一些实施例中,可以利用管腔形状,例如,与确定血栓形成有关。有利地,可以采用分析物斑点模型以更好地分析血管的特定子区域的组成。将分析物斑点定义为生物学分析物的一个类的在2D、3D或4D图像中的空间连续区域。斑点模型可以利用使用等高线的解剖学上对准的坐标系,所述等值线处于例如,从管腔表面到血管壁的外膜表面的归一化径向距离。模型可以有利地标识一个或多个斑点并且分析例如相对于整个血管结构以及相对于其它斑点的每个斑点位置。在示例实施例中,可以使用混合贝叶斯定理(Bayesian)/马尔可夫(Markovian)网络来对斑点的相对位置进行建模。模型可以有利地解释在受隐藏的分析物类别节点的局部邻域影响的像素或体素处观察到的图像强度,从而解释部分体积和扫描仪点扩散函数(PSF)。模型可以进一步允许在分析仪模块推断期间根据分析物概率图动态地描述分析物斑点边界。这是与如超像素方法等预先计算待分析的小区域但无法动态调整这些区域的典型机器视觉方法的主要区别。可以应用利用对分析物概率和斑点边界两者的当前估计的迭代推断程序。在一些实施例中,可以使用参数化建模假设或核密度估计方法来实现用于训练模型的稀疏数据之间的概率密度估计。

本文介绍的是用于对血管斑块组成部分的组成进行分类的新型模型,所述新型模型消除了对组织学到放射学配准的要求。此模型仍利用专家注释的组织学作为参考标准,但是模型的训练不需要与放射学成像的配准。多尺度模型计算给定分析物类型的每个连续区域的统计学,所述统计学可以被称为“斑点”。在穿过血管的横截面内,由两个边界,与管腔的内边界和血管壁的外边界限定壁,从而在横截面中产生甜甜圈状形状。在甜甜圈状形状的壁区域内,存在离散数量的斑点(不同于正常壁组织的默认背景类,所述默认背景类不被视为斑点)。斑点的数量被建模为离散随机变量。然后,对每个斑点分配分析物类型的标签,并且计算各种形状描述符。另外,斑点被视为是成对的。最后,在每个斑点内,每个像素可以产生放射学成像强度值,所述放射学成像强度值被建模为来自特定于每个分析物类型的连续估值分布的独立且相同分布(i.i.d.)的样品。注意,在此最后的步骤中,成像强度分布的参数不是训练过程的一部分。

此模型的一个关键特征是,其考虑了血管内以及还有彼此之间的分析物斑点的空间关系,认识到逐点图像特征(无论根据组织学和/或放射学)不是用于专家确定斑块组成的信息的唯一源。尽管模型允许能够在无需明确的组织学到放射学的配准的情况下训练,但是其也可以应用于配置已知的情形。据信,对动脉粥样硬化斑块组成部分的空间布局进行统计建模以对看不见的斑块进行分类是新颖的概念。

用于根据CT或MR图像估计血管壁组成的示例技术在以下章节进行了进一步阐述。具体地,方法可以采用多尺度贝叶斯分析模型。基本贝叶斯公式如下:

在本公开的上下文中,假设可以基于多尺度血管壁分析物图A,其中观察是根据CT或MR图像强度信息I梳理的。

如图4所描绘的,多尺度血管壁分析物图可以有利地包含壁级分割410(例如,血管的横截面切片)、斑点级分割和像素级分割430(例如,基于单独图像像素)。例如,A=(B,C)可以被定义为血管壁类标签的图(类似于具有顶点B和边缘C的图),其中B为一组斑点(共享一个标签的非背景壁的横截面连续的区域)并且C为一组斑点偶或对。B

类似组成/结构的斑点区域的特性可以有利地提供关于疾病过程的见解。血管的每个切片(例如,横截面切片)可以有利地包含多个斑点。斑点之间的关系可以以成对方式评价。横截面内的斑点的数量被建模为离散随机变量并且也可以具有可定量显著性。在分割的切片级处,相关特性(例如,生物学性质/分析物)可以包含对特定结构/组成分类的斑点和/或多个斑点的总数量的定量、斑点之间的关系,例如,空间关系,如更接近内部。在分割的斑点级处,如结构特性等每个斑点的特性(例如,大小和形状)以及组合特性等可以被评价为充当生物学性质/分析物。最后,在分割的像素级处,可以例如,基于图像强度分布执行单独像素级分析。

可以相对于图4中描绘的多尺度血管壁分析物图应用特性的概率映射。概率映射可以有利地为每个像素建立概率向量,其中向量的分量针对分析物的每个类的概率并且一个分量针对背景组织的概率。在示例实施例中,概率向量集可以表示相互排斥的特性。因此,表示相互排斥的特性的每个概率向量集将共计为1。例如,在一些实施例中,可能已知的是像素应落入一种且仅一种组成类别中(例如,血管的单个坐标不能既是纤维的又是钙化的)。特别应当注意的是,概率映射不假设像素之间的分析物类的独立性。这是因为相邻像素或同一斑点内的像素通常可以具有相同或相似的特性。因此,如本文更详细地描述的概率映射帐户有利地解决了像素之间的依赖性。

f(A=α)可以被定义为映射a的概率密度。f(A)是所有血管壁之上的概率分布函数。f(D

f(c)=Πf(D

f(A)=f(B)f(C)=Πf(D

P(A(x)=a)是像素x的具有标签a的概率。P(A(x))是分析物的概率质量函数(pmf)(患病率)。其可以被视为具体像素x处的概率的向量,或具体类标签值的概率图。

注意:f(A)=P(N)·f(C)·f(B)=P(N)·Πf(C

f(C

图5描绘了作为分析物概率向量集的示例性像素级概率质量函数。如上所述,以下假设可以告知概率质量函数:完整性:在示例实施例中,可以假设足够小的像素必须落入分析物类中的至少一个分析物类中(包含笼统“背景”类别),并且因此概率的总和共计为1。相互排斥性:可以假设足够小的像素属于分析物的仅一个类;如果存在组合(即,LRNC背景下的针状钙),则可以创建新的组合类,以保持相互排斥性。非独立性:可以假设每个像素都高度依赖于其近邻和A的整体结构。

分析物图的替代视图是给定分析物的概率的空间图。在推断期间的任何给定点处,可以使用半峰全宽最大规则定义分析物斑点。使用此规则,对于所述分析物的概率的每个局部最大数,区域向外生长到局部最大数值一半的较低阈值。注意,此50%值是可调参数。可以通过对概率图执行某种曲率的演进来进行斑点的空间正则化,以使边界保持更真实(平滑,具有很少拓扑孔洞)。注意,不同分析物类的不同可能推定斑点通常可以具有空间重叠,因为直到不同可能推定斑点使概率塌缩为止,这些空间重叠都表示对同一像素的替代假设,并且因此修饰语为“推定”。

当迭代推断终止时,存在几种对于结果的表示的选项。首先,可以将连续估值概率图以包含但不限于表面绘图、等值线绘图的几种形式之一,或者使用类似于将PET值可视化为CT的顶部的色相和饱和度的变化的图像融合直接呈现给用户。第二种替代方案是通过为每个像素选择单个分析物标签来使每个像素处的概率图塌缩。这可以通过在每个像素处独立选择最大后验值来最直接进行,从而由此通过向每个分析物标签分配不同的颜色并在放射学图像的顶部上分配完全或部分不透明度创建可视化的分类图。在此第二替代方案下,标签值可以通过基于每个斑点的优先级概率来分辨重叠的推定斑点,而非独立地分配。因此,在给定像素处,如果给定像素属于较高概率的斑点,则可以对标签使用较低优先级的分析物概率。

图6展示了用于计算假推定分析物斑点的技术。在示例实施例中,推定斑点可以具有重叠区域。因此,将分析技术应用于通过推定斑点来分割像素可能是有利的。对于给定分析物的概率,确定概率的局部最大数。然后可以应用半峰全宽最大规则来确定离散斑点。在推断的任何给定迭代中,可以使用全宽半峰最大规则来定义分析物斑点。找到局部最大数,然后区域以0.5*max的较低阈值生长。(50%的值可以是可调参数。)在一些实施例中,斑点的空间正则化也可以应用,例如通过对概率图执行某种曲率演进以便于保持边界光滑并避免孔洞。注意,在此阶段处,不同分析物类的不同可能推定斑点通常可以具有空间重叠,因为直到概率塌缩为止,这些才表示替代假设。因此,计算图像级分析物图,例如基于概率图函数的塌缩。注意,此塌缩可以基于像素级分析物概率图、推定斑点或两者的组合确定。相对于像素级分析物概率图,塌缩可以通过针对每个像素,通过选择具有最大概率A(x):=arg maxa P(A(x)=a)的标签来确定。这类似于实施方案维特比算法。基本上,每个互相排斥的概率向量集的最高概率被锁定(例如,分析物优先级打破了可能的联系)。然后可以将集中的所有其它概率设置为零。在一些实施例中,当使像素级上的数据塌缩时,可以考虑相邻像素/区域的概率。关于推定斑点级塌缩,可以分辨重叠的推定斑点。在一些实施例中,优先化可以基于斑点概率密度f(D

为了在血管壁内对斑点的相对空间定位进行建模,可以选择适当的坐标系以便提供不同图像之间的旋转不变性、平移不变性和尺度不变性。这些不变性对于模型很重要,因为在动脉粥样硬化过程跨不同血管床类似的假设下,其允许能够在一种类型的血管上进行训练(例如,其中动脉内膜切除术样本易于获得的颈动脉)并将模型应用于其它血管床(例如,其中斑块样本通常不易于获得的冠状)。对于管状对象,自然坐标系遵循血管中心线,其中沿中心线的距离提供纵向坐标,并且垂直于中心线的每个平面均具有径向距离和角度的极坐标。然而,由于血管壁几何形状的变异性,特别是可能旨在进行分析的患病患者中,因此可以利用改进的坐标系。沿中心线或沿插值的垂直平面,以使得给予每个3D放射学图像像素一个值的方式计算纵向距离。对于给定斑块,垂直于中心线的近侧平面和远侧平面各自用于在原始图像网格上创建无符号的距离图,所述无符号的距离图表示为P(x)和D(x),其中x分别表示3D坐标。距离图l(x)=P(x)/(P(x)+D(x))表示沿斑块的相对距离,其中在近侧平面处值为0并且在远侧平面处值为1。l轴线的方向通过▽l(x)确定。

因为壁的几何形状可以显著地为非圆形的,所以径向距离可以基于到内管腔表面的最短距离和到外部外膜表面的最短距离来定义。组织学图像的专家注释包含定义管腔和血管的区域(定义为管腔和血管壁的联合)。可以分别针对这些L(x)和V(x)中的每一个创建符号距离函数。惯例是这些区域的内部为阴性,使得在壁中,L为阳性,并且V为阴性。相对径向距离被计算为r(x)=L(x)/(L(x)-V(x))。其在管腔表面处值为0,并且在外膜表面处值为1。r轴线的方向通过由▽r(x)确定。

由于非圆形壁的几何形状,归一化的切向距离可以被定义为沿等值线r(如果以3D进行处理,则等值线1)铺设。t轴线的方向通过▽r×▽l确定。惯例是组织学切片被假设为从近侧到远侧方向看,因此阳性1指向图像里面。注意,与其它不同,t不具有自然原点,因为其围绕血管缠绕到自身。因此,可以针对每个斑点相对于斑点的形心,不同地定义此坐标的原点。

使用的另一个壁坐标是归一化的壁厚度。在某种意义上,这是疾病进展的代用指标。较厚的壁被假设为是由于更重度的疾病。假设分析物的统计学关系随着更重度的疾病而改变。绝对壁厚很容易计算为w

在模型中可以使用或可以不使用前述坐标的程度部分取决于可用训练数据的量。当训练数据有限时,几个选项可用。处理穿个每个斑块的不同区段,相对纵向距离可以忽略,就好像其来自相同的统计分布一样。已经观察到,斑块组成沿纵向轴线变化,其中中间具有更严重的斑块外观。然而,与通过l(x)对分布进行参数化相反,此维度可以塌缩。类似地,相对壁厚度也可以塌缩。已经观察到某些分析物出现在斑块的“肩膀”区域中,其中w(x)将具有中间值。然而,此维度也可以塌缩,直到足够的训练数据可用为止。

如上所述,可以利用血管壁组成模型作为初始假设(例如,在先前的P(A)处)。图7描绘了示例性血管壁组成模型的归一化的血管壁坐标。在所描绘的模型中,1是沿血管目标从近侧到远侧的相对纵向距离,所述纵向举例可以以例如归一化的间隔[0,1]计算。可以利用开始于近侧平面和远侧平面的2次快速行进传播来计算纵向距离,以计算无符号的距离场P和D,其中1=P/(P+D)。l轴线方向是▽l。如所描绘的,r是归一化的径向距离,所述归一化的径向距离也可以以从管腔表面到外膜表面的归一化的间隔[0,1]计算。因此,r=L/(L+(-V)),其中L是管腔符号距离场(SDF)并且V是血管SDF。r轴线方向是▽r。最后,t是归一化的切向距离,所述归一化的切向距离可以以例如归一化的间隔[-0.5,0.5]计算。值得注意的是,在示例实施例中,对于整个壁可能不存在有意义的原点,这是仅对于单独分析物斑点而言(因此,t原点可以在斑点形心处)。切线距离沿1和r的等值线曲线计算。t轴线方向为▽r×▽l。

图9展示了一些复杂的血管拓扑,所述辅助的血管拓扑可以使用本文所述的技术来解决。具体地,当以3D处理CT或MR时,可以有利地单独分析不同的分支,使得适当地忽略单独分支中的分析物斑点之间的关系。因此,如果分割的视图(横截面切片)包含多于一个管腔,则可以通过在r上执行分水岭变换来解释这一点,以便将壁分裂成属于每个管腔的域,然后可以单独考虑/分析每个域。

如上所述,本文所述的许多坐标和概率测量都可以利用归一化的尺度来表示,从而保持尺度不变性,例如不同大小的血管之间。因此,在疾病过程类似并且对于不同口径血管成比例的假设下,所提出的模型可以有利地独立于绝对血管大小。

在一些实施例中,模型可以被配置成表征同心斑块与偏心斑块。值得注意的是,接近于1的归一化的所有厚度都可以指示高度偏心的地方。在进一步的实施例中,可以实施向内斑块表征与向外斑块表征。值得注意的是,关于此特性的组织学信息受变形的阻碍。因此,在一些实施例中,可以利用CT和训练数据来建立用于确定向内斑块表征与向外斑块表征的算法。

如上所述,在示例实施例中,可以利用如组织学数据等非成像数据作为训练集,以用于建立将图像特征链接到生物学性质/分析物的算法。然而,在确保适当的相关性时在需要解决的数据类型之间存在一些差异。例如,组织学和成像之间的以下差异可能会影响适当的相关性:颈动脉内膜切除术(CEA)在假定发现外部外膜表面的患者CT或MR图像分析中留下外膜和某种介质。(参见例如图8,所述图描绘了组织学样本的去除的斑块相对于外血管壁之间的边缘)。值得注意的是,科学文献显示出钙化是否会发生在外膜中的不确定性。可以采用以下技术来解释此差异。组织学可以向外扩张,例如,基于壁中几乎没有分析物遗留的假设。可替代地,图像分割可以向内侵蚀,例如基于对保留的典型或特定边缘的了解。例如,可以利用平均边缘。在一些实施例中,可以将平均边缘归一化为血管的总直径的百分比。在另外的实施例中,可以使用组织学来掩盖成像(例如,基于对准标准叠加)。在此类实施例中,可能需要对组织学数据应用一个或多个变换,以匹配适当的对准。最终,在一些实施例中,差异可以忽略(其等同于被去除的斑块与整个壁的均匀缩放比例)。尽管这可能会诱发一些小误差,但是可推测与CEA患者的斑块相比,遗留的壁可能会薄。

如血管壁组成模型所表示的组织学数据(例如训练集)与成像数据之间还可能存在纵向差异。在示例实施例中,纵向距离可以明确地建模/相关。因此,例如,可以使用组织学切片编号(例如,A-G)以大致确定斑块的所切除部分内的位置。然而,此方法限制了相对于没有对应组织学数据的其它切片的分析。因此,可替代地,在一些实施例中,所有组织学切片可以被视为由相同的分布引起。在示例实施例中,沿纵向方向仍然可以采用某受限的正则化。

如上所述,归一化的壁厚度在某种意义上是疾病进展的不完美代用指标。特别地,假设较厚的壁是由于更重度的疾病,例如基于分析物的统计关系随着更重度的疾病而改变的假设。归一化的壁厚度可以如下计算:可以确定绝对壁厚度T

图10描绘了表示在归一化的血管壁坐标分布情况下的示例性分析物斑点。具体地,t的原点位于斑点形心处。(r,t)坐标是随机向量,其中位置/形状完全由点在内的联合分布来表示。这可以通过考虑边缘分布来简化(因为径向和切向形状特性似乎是相对独立的)。边缘分布可以计算为沿r和t的投影(注意1和T坐标也可以考虑)。值得注意的是,径向方向上的边缘分布可以有利地表示/表征同心层(例如,内侧层、外膜层和内膜层)中的斑块生长。类似地,切线方向上的边缘分布可以有利地表示可以指示疾病的分期的生长因子。在示例实施例中,可以基于边缘分布计算分析物斑点描述符。例如,on可以对边缘分布进行低阶统计(或使用直方图或对参数概率分布函数进行拟合)。

在示例实施例中,可以使用以下分析物斑点描述符以,例如捕获单独斑点的位置、形状或其它结构特性:

–在归一化的血管坐标中的位置

·主要是相对于r

–例如,以便于在浅/深钙化之间进行区分

·t方向忽略;[任选模型l方向]

–归一化的血管坐标上的程度

·有意避免词语“大小”,所述词语暗示绝对测量,然而程度是归一化的值

–不匀称性,所述不匀称性用于表示在分布上不对称的程度

·临床显著性尚不清楚,但其可以帮助针对难以置信的不匀称的形状对形状进行正则化

–对准,所述对准用于表示对平行组织层的限定

·分析物斑点似乎很好地保留在径向层(r的等值线)内,因此这将帮助选择类似的经过图像处理的形状

–斑点所处的壁厚度

·厚(例如,重度)斑块被假设为具有与薄斑块不同的统计

在一些实施例中,也可以利用成对斑点描述符。例如:

–相对位置

·例如,如果纤维化是在LRNC的管腔侧上

–相对程度

·例如,纤维化相对于LRNC有多厚/宽

–环绕

·一个边缘投影与另一个边缘的中间有多近

·例如,餐巾环征象或LRNC周围的纤维化

–相对壁厚度

·用于表示“肩”的程度(肩相比于中央斑块主体将相对地不那么厚)

注意,也可以实施更高阶的交互(例如,在三个斑点之间或在两个斑点与另一特征之间)。然而,可以考虑递减返回并训练限制。

以下是对斑点描述符的示例定量:

·单独斑点描述符

·成对斑点描述符

值得注意的是,一组描述符(例如,8-12个描述符)形成了斑点所在的有限形状空间。然后可以将一群斑点的分布视为此有限空间中的分布。图11描绘了博客描述符的示例性分布。在示例实施例中,斑点描述符的分布可以在整个训练集内计算。在一些实施例中,可以在单独斑点描述符上利用较低阶统计(假设独立性),例如,位置:E[α

如上所述,还可以对每横截面斑点的数量(或每个类的数量)进行建模,例如η不考虑分析物类,并且η

概括上述章节,在示例实施例中,整个血管壁组成模型可以包含以下:

·pmf之前的每像素分析物

–P(A(x)=a

·单独斑点描述符

–B

–B

·成对斑点描述符

-C2=(α

-C2~N(μ

·Blob的数量

-η~泊松(λ

其中:

P(A(x)=a

f(A

如上所述,成像模型可以用作贝叶斯分析模型的可能性(例如,P(I\A))。然后可以确定最大可能性估计。在示例实施例中,这可以考虑每个独立的像素(例如,不考虑模型中的结构的先验概率)来进行。估计的分析物图通常是仅平滑的,因为图像是平滑的(这就是为什么通常不执行预先平滑化)。可以进行独立的逐像素分析,例如,至少直到考虑扫描仪PSF的点为止。利用成像模型来解释不完美的成像数据。例如,对斑块的小组成部分进行成像会对像素值的顶部添加独立的噪声。此外,局部体积效应和扫描仪PSF众所周知应用于小对象。因此,给定模型(例如,分析物区域的水平集表示),通过利用PSF的高斯模糊模拟CT简单且快速。本文描述的成像模型还可以应用于确定(或估计)不同分析物的真实(不模糊)密度的分布。值得注意的是,这不能来自典型的成像研究,因为这些将具有模糊的图像强度。在一些实施例中,可以使用宽的方差来表示不确定性。可替代地,可以根据训练集优化分布参数,但是目标函数将必须基于(分析物区域的)下游读数,例如,除非经过对准的组织学数据可获得。图12描绘了用于对数据进行成像的示例性模型(例如,在隐藏(分类的)状态(A(x))与观察到的(连续)状态(I(x))之间进行关联,由此考虑了随机(例如,分析物密度分布(H(A(x))和确定性(例如,扫描仪模糊*G(x))噪声因子)。θ为H的参数(每种分析物的比例和HU均值/方差)。对于假设正态分布的N个不同分析物类,θ=(τ

·E-步骤:确定给定当前参数的成员概率

·M-步骤:在给定成员概率的情况下最大化参数的可能性

图13描绘了用于在图像模型中使观察到的状态与隐藏状态相关的示例马尔可夫模型/维特比算法的图。具体地,所述图描绘了可以用经验直方图或用高斯或boxcar概率分布函数建模的观察到的状态(灰色)(观察到的图像强度,I(x))和隐藏状态(白色)(纯分析物强度,H(A(x)))。成像系统的PSF建模为高斯G(x)。因此,

I(x)=G(x)*H(A(x))

应当注意,类似维特比的算法可以应用于此,但是卷积将代替可以建模为高斯或均匀的发射概率H。

如上所述,推断程序的一个部分是基于期望最大化(EM)。在EM的典型应用中,数据点被建模为属于未知的几种类之一。每个数据点都具有特征向量并且对于每个类,可以利用如多维高斯等的由均值向量和协方差矩阵表示的参数分布对此特征向量进行建模。在本文呈现的模型的上下文中,直接的EM实施方案将如下工作:

此简单模型的主要问题在于,其不会对像素编码任何更高阶的结构。不存在与更实际的像素布置相关联的先验概率。仅tau确定分析物类的比例。因此,一旦可以使用tau变量以在斑点先验概率模型中插入,尤其是在更新成员概率的步骤中。

因此,可以以复杂得多的贝叶斯先验来应用经过修改的贝叶斯推断程序。在基本EM实施方案中,不存在真正的先验分布。变量tau表示每个类的先验相对比例,但即使如此,此变量在推断程序中也是未指定的和估计的。因此,在基本EM模型中不存在关于类分布的先验信念。在模型中,模先验型由多尺度分析物模型表示。Tau成为位置(和其它变量)的函数,而不仅仅是全局比例。

成员概率函数定义如下:

推断算法如下。在迭代的每个步骤处,成员概率图都被初始化为零,使得所有类的概率均为零。然后对于所有可能的模型配置,成员概率图可以如下添加:

最后,可以在成员概率图中的每个像素处对概率向量进行归一化,以恢复完整性假设。有利地,可以对所有模型配置进行迭代。这是通过将N的值依次考虑为0到相对低的值,例如9进行的,在所述点处,观察到极度少的区段具有如此多的斑点。对于N的每个值,可以检查不同的推定斑点配置。推定斑点可以基于单独的斑点概率而被阈值化为小的数量(N)。然后,考虑N个斑点的排列的所有排列。因此,可以同时考虑最可能的斑点配置中的所有斑点配置,并通过其先验概率对每个模型进行加权。此程序显然是近似推断方案,因为多尺度模型配置的全部空间可能没有考虑。然而,可以假设通过考虑最可能的(就N和斑点两者而言),实现了良好的近似。此程序还假设最可能的配置的加权平均在每个单独像素处提供了良好的估计。另一种替代方案是执行模型配置的受约束的搜索,并且选择最高可能性模型作为MAP(最大后验)估计。

本文还描述了另外的示例性统计模型(例如,后验P(A\I))。在CT血管造影术中,以下信息可用:

·强度

-CT亨氏单位(hounsfield unit)或MR强度

-可能的其它成像特征

·相对于解剖学的位置

-其中在斑块中,像素为

·相邻像素

-例如,用于通过水平集使轮廓平滑化

后验概率可以计算为:

P(A|I)∝P(I|A)·P(A)

因此,以下图像信息可能会影响分析物的概率Ai(x)

I(x)是观察到的图像强度(可能是向量)

T(x)是根据图像分割的观察到的相对壁厚度

F(x)是CT图像特征

S(x)是血管壁形状的特征(例如,管腔凸起)

在一些实施例中,可以利用类似梅特罗波利斯-黑斯廷斯(Metropolis-Hastings)的方法。在其它实施例中,可以应用最大后验方法。

以下是统计分析模型的示例算法可能性。在一些实施例中,模型可以利用置信度传播(AKA最大和、最大乘积、和积消息发送)。因此,例如可以利用维特比(HMM)类型的方法,例如,其中隐藏状态是分析物分配A,观察到的状态是图像强度I。此方法可以有利地发现MAP估计可以是选择机制P(A|I)。在一些实施例中,可以利用软输出维特比算法(SOVA)。注意,每个决定的可靠性可以由所选(幸存者)路径与丢弃路径之间的差异来指示。因此,这可以指示每个像素分析物分类的可靠性。在另外的示例实施例中,可以利用前向/后向鲍姆-韦尔奇(Baum-Welch)(HMM)方法。例如,可以在任何时间点处计算最可能的状态,但不能计算最可能的序列(参见维特比)。

另一种可能的技术是梅特罗波利斯-黑斯廷斯(MCMC)方法,例如,其中一种方法是通过可能性和先验对A进行重复采样并进行加权。在一些实施例中,可以利用用于采样的简单MRF版本。注意,可能特别有利的是,直接对后验进行采样。在示例实施例中,可以建立分析物类的每像素直方图。

其它算法的可能性包含应用吉布斯(Gibbs)采样器、变分贝叶斯(类似于EM)、平均场近似、卡尔曼滤波器或其它技术。

如上所述,在一些实施例中,可以利用期望最大化(EM)后验方法。在此方法下,观察到的数据X是成像值,未知参数θ是由于分析物图(但不包含分析物概率),并且潜变量Z是分析物概率向量。此方法的一个关键特征在于,其由于各自彼此依赖而实现了在估计类成员(Z)与模型参数(θ)之间进行迭代。然而,由于分析物图会分离出分析物概率,因此可以对方法进行修改,从而使得当前的类成员不必影响模型参数(因为这些是在训练步骤中学习的)。因此,EM基本上在其通过当前数据进行迭代时学习模型参数。有利地,EM方法的示例性实施方案迭代地计算最大可能性,但假设扁平先验。

本文还提供了用于表示纵向协方差的技术。由于组织学切片的宽间隔(例如,4mm),因此采样可能无法如实地捕获分析物中的纵向变化。然而,通常会执行3D图像分析,并且假设地,存在一些真实纵向协方差。问题在于,组织学信息通常不是提供用于纵向协方差。尽管如此,本文公开的示例性统计模型可以反映纵向方向中的缓慢变化。

在一些实施例中,可以应用马尔可夫模型/链。图15描绘了用于文本/DNA的1D马尔可夫链的示例性植入。常规地,当应用于MRF中的图像时,马尔可夫链通常是尽可能低阶的。然而,较高阶的链可能是有利的,这是由于条件独立性(马尔可夫性质)。否则数据可能太乱序而没有价值。这是通过如应用于文本的示例性马尔可夫链的1D采样展示的:

·均匀率采样输出:

–earryjnv anr jakroyvnbqkrxtgashqtzifzstqaqwgktlfgidmxxaxmmhzmgbyamjgxnlyattvc rwpsszwfhimovkvgknlgddou nmytnxpvdescbg k syfdhwqdrjjmcovoyodzkcofmlycehpcqpuflje xkcykcwbdaifculiluyqerxfwlmpvtlyqkv

·0阶马尔可夫链输出:

–ooyusdii eltgotoroo tih ohnnattti gyagditghreay nm roefnnasos r naaeuuecocrrfca ayas el s yba anoropnn laeo piileo hssiod idlif beeghecebnnioouhuehinely neiis cnitcwasohs ooglpyocp h trog 1

·第1阶马尔可夫链输出:

–icke inginatenc blof ade and jalorghe y at helmin by hem owery fa stsin r d n cke s t w anks hinioro e orin en s ar whes ore jot j whede chrveblan ted sesourethegebe inaberens s ichath fle watt o

·第2阶马尔可夫链输出:

–he ton th a s my caroodif flows an the er ity thayertione wil ha mothenre re creara quichow mushing whe so mosing bloack abeenem used shesighembs inglis day p wer wharon the graiddid wor thad k

·第3阶马尔可夫链输出:

–es in angull o shoppinjust stees ther a kercourats allech is hotetemal liked be weavy because in coy mrs hand room him rolio und ceran in thathe mound a dishine when what to bitcho way forgot p

图16描绘了文本概率表的示例第一阶马尔可夫链。注意,此类表的大小在阶方面是以指数方式设定的:

D=马尔可夫链的阶

N=字母数量

大小=N

因此,较高阶导致维度问题。有利地,组织学样品具有非常高的分辨率。然而,由于组织学样品不是统计独立的,因此这可能会导致过度拟合,如将在后面更详细地描述的。通常,建模的条件依赖性越高,模型的预测性就越高。

在示例实施例中,可以对像素值使用2D马尔可夫随机场(MRF)而不是如对于字母使用1D序列。图17描绘了第一像素(黑色)基于其相邻像素(灰色)的条件依赖性。在示例实施例中,团可以利用对称性来将依赖性的数量减少一半。在一些实施例中,像素的值可以是简单的图像强度或者可以是分类问题的概率值。典型MRF的使用存在问题。常规MRF几乎总是限于提供条件依赖性的最近邻像素,所述最近临像素极大地降低了所表示的概率空间的特异性,对于非常一般,通常仅黑色/白色斑点,

目的的分割/过滤;极短范围的依赖性。然而,尽管像素是高度离散的,但仅错过一个像素并落入下一像素的斑点可能会完全改变概率分布。因此,真正的图像结构比通常使用MRF所解决的要连续得多。

出于此原因,本公开的系统和方法可以有利地利用推断程序,例如,后验的贝叶斯类型规则:可能性×先验(P(A/I)αP(I/A)×P(A))。使用纵横填字类型类比,由本申请的系统和方法实施的推断程序有点像尝试根据噪声扫描对纵横填字谜进行OCR。知识(甚至是几个正方形的不完美知识)也可以帮助告知纵横填字谜中的未知正方形。通过同时考虑竖直方向和水平方向两者,更加有效地提高了。在示例实施例中,推断程序可以是启发式的。例如,可以在未告知的先验的情况下进行初始化,然后首先解决较简单的问题,这会提供关于之后要解决的较难问题的线索。因此,相对容易地检测如浓钙等生物学性质可以告知用于检测如脂质等分析物的其它更难的问题的存在。推断程序的每个步骤可以缩窄未分辨的像素的概率分布。

如上所述,为了获得可用数据,高阶马尔可夫链是优选的。利用更高阶马尔可夫方法的缺点是,可能没有足够的数据来告知推断程序。在示例实施例中,此问题可以通过利用如帕尔森(Parzen)窗口的密度估计方法或利用克里金(kriging)技术来解决。

为了形成推断程序,可以利用分析物的无条件先验概率进行初始化,并且然后使用最高水平的证据来开始缩窄概率。例如,在一些实施例中,不确定宽度可以与每个分析物概率估计相关联。在其它实施例中,接近1/N可以表示此类不确定性。

应当注意,术语“马尔可夫”在本文中宽松地使用,因为所提出的马尔可夫实施方案不是无记忆的而是明确尝试对长范围(空间)依赖性进行建模。

因为与组织学和斑块解剖学相比CT分辨率低,所以在一些实施例中可能优选的是,利用连续空间(时间)马尔可夫模型而不是离散空间(时间)。这与概率图的水平集表示一起可以良好地工作,因为其自然地与子像素插值一起良好地工作。离散的分析物状态使模型成为离散的空间模型。然而,如果一个模型表示连续概率而不是分析物存在/不存在,那么其成为连续空间模型。

转到基于肺部的应用,以下表4描绘了可以相对于此类应用的层级分析框架利用的示例性生物学性质/分析物。

表5:基于肺部的应用所支持的生物学客观的被测变量

具体地,系统可以被配置成检测肺部病变。因此,示例性系统可以被配置成用于整个肺部分割。在一些实施例中,这可能涉及使用最小曲率演进来解决近胸膜病变问题。在一些实施例中,系统可以实施肺部组分分析(血管、裂隙、支气管、病变等)。有利地,可以利用黑森(Hessian)滤波器来促进肺部组分分析。在一些实施例中,肺部组分分析可以进一步包含例如取决于裂隙几何形状的胸膜受累。在另外的实施例中,也可以考虑附接到解剖结构。除了肺部组分分析外,还可以应用对磨玻璃状态与固体状态的单独分析。这可以包含确定如体积、直径、球形等几何特征、如密度和质量等图像特征以及分形分析。

分形分析可用于推断鳞屑生长模式。为了对非常小的所关注区域执行分形分析,方法自适应地修改对卷积核的支持,以将其限制在所关注区域(即,肺部结节)。出于分形分析的目的,可以掩盖掉相交的血管/支气管以及非病变特征。这是通过在掩盖的局部邻域之上应用IIR高斯滤波器并利用IIR模糊的二进制掩盖进行归一化来进行的。在一些实施例中,分形分析可以进一步包含确定孔隙度(基于局部均值的方差)。这可以相对于肺部病变、病变的子部分而应用。在示例实施例中,可以应用IIR高斯滤波器或圆形邻域。在一些实施例中,可以利用IIR来计算方差。也可以计算局部方差的平均(AVL),例如,如应用于肺部病变。同样,可以计算局部方差的方差。

在示例实施例中,可以计算病变结构和组成两者。有利地,计算病变结构可以利用薄区段的完全体积,从而对计算大小测量变化进行改进。如亚固体和磨玻璃不透明度(GGO)体积等测量也可以被确定为评估病变结构的一部分。转向病变组成,可以计算如巩固、创伤、邻近和灌注等组织特性,由此例如降低相对于常规分析的假阳性率。

现在参考图18,描绘了本公开的系统的另外的示例性层级分析框架1800。图18可以被理解为图1的详细说明,其相对于层级推断系统的示例性中间处理层进行了更详细的阐述。有利地,层级推断仍然从成像数据1810流动到基础生物学信息1820,到临床疾病1800。然而,值得注意的是,框架1800包含用于处理成像数据以便确定生物学性质/分析物的多级数据点。在预处理级1812处,可以确定物理参数、配准变换和区域分割。然后可以利用此经过预处理的成像信息来提取数据点的下一级的成像特征1814,如强度特征、形状、纹理、时间特性等。接下来可以在级1816处利用提取的图像特征,以使一个或多个生物学模型与所成像解剖学拟合。示例模型可以包含贝叶斯/马尔可夫网病变亚结构、分形生长模型或如本文所述的其它模型。生物学模型可以有利地充当用于使成像特征与级1822处的基础生物学性质/分析物相关的桥梁。示例性生物学性质/分析物包含解剖结构、组织组成、生物学功能、基因表达相关性等。最后,在级1832处,可以利用生物学性质/分析物来确定与病理学有关,包含例如与疾病亚型、预后、决策支持等有关的临床发现。

图19是引导血管疗法中表型分型目的的示例应用,所述示例应用使用AHA所采用的Stary斑块分型系统作为基础,其中体内确定的类型以颜色叠加示出。左图示出了基于其物理特性根据斑块病变的可能动态行为进行标记的实例,并且右图展示了使用分类结果以引导患者治疗的实例。示例映射为[‘I’,‘II’,‘III’,‘IV’,‘V’,‘VI’,‘VII’,‘VIII’],从而得到类_图=[亚临床、亚临床、亚临床、亚临床、不稳定、不稳定、稳定、稳定]。此方法与Stary无联系,例如已将Virmani系统[“钙化结节”、“CTO”、“FA”、“FCP”、“愈合性斑块破裂”、“PIT”、“IPH”、“破裂”、“TCFA”、“ULC”]与class-map=[稳定、稳定、稳定、稳定、稳定、稳定、不稳定、不稳定、不稳定、不稳定]一起使用,并且其它分型系统可以得到类似的高性能。在示例实施例中,本公开的系统和方法可以合并完全不同的分型系统,可以改变类图,或其它变化。对于FFR表型,可以使用如正常或异常等值和/或可以使用数量,以促进与例如物理FFR的比较。

图20是不同疾病,例如肺癌的实例。在此实例中,确定团块的亚型,以便基于明显的表型引导对患者最可能的有益治疗。

期望CNN相比于读数向量分类可更好地执行,因为CNN含有提取不包含在(仅)分析物面积测量中的空间上下文的滤波器。尽管减少了训练量,但可能实际的是使用CNN,因为

1)对应于显著不同的治疗替代方案,存在相对少的类(而不是如需要离体组织的研究测定中可以进行的那样是完全颗粒的),例如分类问题的三种表型、结果预测/风险分层问题的三种风险水平,因此问题通常更容易。

2)例如通过水平集或其它算法类将分析物区域处理为伪颜色区域,通过生成分割并为分类器呈现简化的但相当富集的数据集执行图像解释的实质部分。可测量的流水线级减少了数据的维度(降低了CNN必须解决的问题的复杂性),同时还提供了可以增加整个流水线的置信度的可验证中间值。

3)使用归一化坐标系对数据进行重新格式化去除了由于对分类没有实质影响的变量(例如,斑块表型分型实例中的血管大小)而引起的噪声变化。

为了检验此想法,建立了由三个级组成的流水线:

1)语义分割,所述语义分割用于标识生物质的哪些区域落入到某些类中

2)空间展开,所述空间展开用于将静脉/动脉横截面转化为矩形,以及

3)经过训练的CNN,所述经过训练的CNN用于读取所注释矩形,并且标识其属于哪个类(稳定或不稳定)。

在不失一般性的前提下,本文所述的示例系统和方法可以应用空间展开(例如,利用(展开的数据集)和不利用(甜甜圈状数据集)空间展开来训练和测试CNN)。观察到展开可提高验证准确性

语义分割和空间展开:

首先,对图像体积进行预处理。这可以包含目标初始化、归一化和其它预处理,如去模糊或恢复以形成含有要被表型化的生理学目标的所关注区域。所述区域是由穿过所述体积的横截面构成的体积。身体部位自动确定,或由使用者明确提供。本质上为管状的身体部位的目标伴随有中心线。中心线在存在时可以有分支。分支可以自动或由用户标记。对中心线概念的概括可以表示解剖学,所述解剖结构不是管状的,但是通过某种结构定向性,例如肿瘤的区域受益。在任何情况下,确定体积中的每个横截面的形心。对于管状结构,形心将是通道,例如,血管的管腔的中心。对于病变,所述形心将是肿瘤的团块的中心。

图21表示示例性图像预处理步骤,在这种情况下,去模糊或恢复使用患者特异性点扩散确定算法来减轻由图像形成过程引起的伪像或图像限制,所述伪像或图像限制可能会降低确定预测表型的特性的能力。所述图展示了根据CT对斑块的放射学分析应用分析的一部分。此处示出的是去模糊的或恢复的图像,所述去模糊的或恢复的图像是利用关于图像的不同区域的真实潜密度的正则化假设迭代地拟合扫描仪点扩散函数的物理模型的结果。包含此图,以便展示可以执行各种图像处理操作,以辅助能够执行定量步骤,并且绝不指示此方法对于本公开中的具体发明是必需的,而是作为可以采取以改善整体性能的步骤的实例。

在笛卡尔数据集中表示(任选地去模糊的或恢复的)图像,在所述笛卡尔数据集中x用于表示离形心多远,y表示旋转θ,并且z表示横截面。每分支或区域将形成一个此笛卡尔集。当使用多个集时,将“空”值用于重叠区域,也就是说每个物理体素将在整个集中仅呈现一次,以此方式以在几何上拟合在一起。每个数据集将与具有由可客观验证的组织组成标记的子区域的另外的数据集配对(参见例如,图36)。血管组织的示例标签可以是管腔、钙化、LRNC等。病变的示例标签可以是坏死的、新血管形成的等。这些标签可以例如通过组织学客观地验证(参见例如,图37)。配对的数据集将用作用于建立卷积神经网络的训练步骤的输入。支持两层分析,一层在单独横截面层上,任选地其中输出跨相邻横截面连续变化,并且第二层在体积层上(其中单独横截面可以被视为静止帧,并且血管树遍历可以被视为类似于电影)。

示例性CNN设计:

AlexNet是CNN,其在2012年的ImageNet大规模视觉识别挑战赛(ImageNet LargeScale Visual Recognition Challenge)中完成。所述网络实现的前5个误差为15.3%。AlexNet由监督组设计,所述监督组由当时多伦多大学(U Toronto)的Alex Krizhevsky、Geoffrey Hinton和Ilya Sutskever组成。从头开始对AlexNet进行训练,以对一组独立的图像进行分类(在网络训练期间的训练和验证步骤中未使用)。对于展开的数据,使用了400×200像素输入的AlexNet型网络,并且甜甜圈状网络是280×280像素输入的AlexNet型(分辨率大致相同但纵横比不同)。对卷积滤波器值中的所有值进行了初始化,其中权重是从对ImageNet数据集进行训练的AlexNet提取的。虽然ImageNet数据集是自然图像数据集,但这仅用作权重初始化的有效方法。一旦训练开始,就调整所有权重,以更好地拟合新任务。直接从开源AlexNet实施方案中提取了训练计划中的大多数,但是需要一些调整。具体地,对于AlexNet甜甜圈状网络和AlexNet展开网络两者,将基本学习率降低到0.001(solver.prototxt),并且将批量大小降低到32(train_val.prototxt)。将所有模型训练到10,000次迭代,并在训练直到仅2,000次迭代训练后与快照进行比较。尽管可以进行对过度拟合的更深入的研究,但通常发现训练和验证误差两者的降低在2k到10k迭代之间。

替代特征(前缀)可以包含:

·ResNet-https://arxiv.org/abs/1512.03385

·GoogLeNet-https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf

·ResNext-https://arxiv.org/abs/1611.05431

·ShuffleNet V2-https://arxiv.org/abs/1807.11164

·MobileNet V2-https://arxiv.org/abs/1801.04381

可以利用运行时优化,如横截面之间的帧到帧冗余(有时被称为“时间”冗余,但在此种情况下,为一种形式的横截面内冗余)以节省计算(例如,http://arxiv.org/abs/1803.06312)。可以实施对训练或推断的许多优化。

在示例测试实施方案中,对AlexNet进行训练,以基于V和VI的组织学基准真相斑块类型,对两种类别的临床显著性,例如“不稳定”斑块与“稳定”斑块之间的独立图像集进行分类,而后者包含遵守美国心脏协会(AHA)所接受的行业实际标准斑块分类命名并且在Virmani的相关但独特的分型系统上的斑块类型VII和VIII。

在不失一般性的情况下,在所展示的示例中,利用了总准确性和混淆矩阵两者来评估性能。此形式体系是基于在二元分类系统中计算四种概率的概念:真阳性、真阴性、假阳性和假阴性。在示例实施例中,可以使用其它结果变量,然而,例如,可以利用敏感度和特异性作为结果变量或F1评分(精度和敏感度的谐调和平均数)。可替代地,可以对二进制分类器计算AUC特性。此外,分类器不需要是基于二进制的。例如,在一些实施例中,分类器可以基于多于两个可能状态进行分选。

数据集增强:

医师注释的数据昂贵,因此期望人工地增加医学数据集(例如,用于训练和/或验证)。在本文描述的示例实施例中使用了两种不同的增强技术。将甜甜圈随机水平翻转,以及旋转到0到360的随机角度。然后将所产生的经过旋转的甜甜圈修剪到甜甜圈所存在的范围内,并且然后用黑色像素填补,以将图像填充到具有一定正方形纵横比。然后将结果缩放到280×280大小并且保存为PNG。

通过随机水平翻转增强展开的数据集,并且然后以0到图像的宽度的范围使展开的数据集“滚动”随机数量的像素。然后将结果缩放到400×200大小并且保存为PNG。

两个数据集都增加了15倍,意味着增强之后图像的总数量是原始数量的15倍。实施类归一化,意味着最终数据集具有与属于每个类的图像大致相同的数量。这很重要,因为每个类的图像的原始数量可能不同,由此使分类器偏置到在训练集中具有较大数量的图像的类。

在不失一般性的情况下,执行注释的每个放射科医生都可以使用任意数量的组织类型。

图22展示了用于证明本发明的各方面的示例性应用,在此情况下,所述示例性应用为用于动脉粥样硬化斑块表型分类的分类(例如使用具体受试者数据)。不同颜色表示不同组织分析物类型,其中深灰色示出了另外正常的壁。所述图展示了组织特性的基准真相注释的结果,所述结果指示斑块表型以及其如何存在于正交于血管的轴线提取的横截面的空间上下文。其还展示了已经开发,以便于为大量组织学横截面的分析提供共同基础的坐标系。添加了网格线以展示坐标系(切线与径向距离)并将所述网格线叠加在颜色编码的病理学家注释的顶部上。一个重要方面是此种类的数据集可以有效地用于深度学习方法,因为其使用相对较简单的伪彩色图像代替较高分辨率的完整图像来简化信息,但又不会丢失空间上下文,例如以具有对如“餐巾环征象”、近管腔钙、薄(或厚)帽(LRNC与管腔之间的间隔)等此类表示的正式表示。

图23展示了使用单位相量和在此以灰色标度编码示出的相量角的内部表示的切向和径向方向变量,其例示了对与血管相关的管状结构以及与此类结构(例如,胃肠道)相关联的其它病理生理使用归一化轴线。注意,从黑色到白色的竖直条是由于灰度尺度编码的纯任意边界,并且归一化的径向距离在管腔边界处值为0,在外边界处值为1。

图24展示了根据CTA(未填充的颜色轮廓)进行的放射学分析应用产生的注释在根据组织学(实心颜色区域)进行的病理学家产生的注释上的示例性叠加。本文呈现的系统和方法的示例方面在于,体内无创成像的轮廓形式可以与分类方案一起使用,以便无创地确定表型,其中分类器对已知基准真相进行训练。具体地,填充在此图中示出未填充的轮廓(以便于不模糊与对此具体区段的离体注释的关系,所述关系提供以显示对应性)创建了针对分类器的输入数据。

图25展示了具体地,利用归一化的坐标系来避免与壁厚度和径向表示相关联的非相关变化的数据富集的另外的步骤。具体地,“甜甜圈状”被“展开”,同时保持病理学家注释。左图展示了在变形以将切开的“C”形状转化回完整血管壁的体内“O”形状之后,斑块的组织学切片的病理学区域注释。水平轴线是围绕壁的切线方向。竖直轴线是归一化的径向方向(底部是管腔表面,顶部是外表面)。还注意,病理学家注释的更精细的粒度已塌缩,以匹配旨在用于通过体内放射学分析应用(例如LRNC、CALC、IPH)提取的粒度。右图展示了可比较展开的放射学分析应用注释。轴线和颜色与病理学家注释相同。

图26表示与斑块表型分型实例相关的接下来的细化。从展开的形式体系工作,呈现了管腔不规则化(例如,由溃疡或血栓引起)和局部变化的壁增厚。底部的浅灰色表示管腔(在此步骤中添加以表示管腔表面不规则化),并且现在已用深灰色代替先前步骤中使用的黑色,以表示变化的壁增厚。黑色现在完全表示壁外部的区域。

图27表示另外的实例,以便根据需要包含,例如斑块内出血和/或其它形态方面(例如使用具体受试者数据)。左图示出了甜甜圈状表示,并且右图为展开的,其中表示了管腔表面和局部化的壁增厚。

测试的示例CNN包含基于AlexNet和Inception框架的CNN。

AlexNet结果:

在所测试的示例实施例中,对卷积滤波器值进行了初始化,其中权重是从对ImageNet(在此引用)数据集进行训练的AlexNet提取的。虽然ImageNet数据集是自然图像数据集,但这仅用作权重初始化的有效方法。一旦训练开始,就调整所有权重,以更好地拟合新任务。

直接从开源AlexNet实施方案中提取了训练计划中的大多数,但是需要一些调整。具体地,对于alexnet甜甜圈状网络和alexnet展开网络两者,将基本学习率降低到0.001(solver.prototxt),并且将批量大小降低到32(train_val.prototxt)。

将所有模型训练到10,000次迭代,并在训练直到仅2,000次迭代训练后与快照进行比较。尽管可以进行对过度拟合的更深入的研究,但通常发现训练和验证误差两者的降低在2k到10k迭代之间。

全新的AlexNet网络模型从头开始针对两名主要病理学家的基准真相结果的4(四)种不同组合、处理图像的两种不同方式(见上文)以及展开图像和甜甜圈状图像进行训练。结果列示在图28中。在类归一化启用的情况下,每个数据集变化使其训练数据增强了15倍。以此增强的数据对网络进行了训练,并且然后以与所述变化对应的对应未增强的验证数据对网络进行了测试。对于展开的数据,使用了400×200像素输入的AlexNet型网络,并且甜甜圈状网络是280×280像素输入的AlexNet型(分辨率大致相同但纵横比不同)。注意在测试实施例中,常规层以及完全连接层的尺寸改变。因此,AlexNet测试实施例中的网络可以被描述为五卷积层、三完全连接层网络。在不失一般性的情况下,这里是根据这些结果展示的一些高级结论:

1)除了WN_RV数据集外,确实似乎展开的数据更易于数据分析,因为其全面地接收更高的验证准确性

2)非归一化的数据如所预期的,被证明更具代表性。

3)关于WN-RV数据集,最初的想法是池化WN和RV真相数据,以查看分型系统的兼容性以及集可以合并的程度。这样做,在WN与RV数据中观察到了显著差异。WN_RV实验的最初目的是池化来自多个病理学家的训练数据,以查看所述信息是否有助于功效。相反,观察到退化而不是改善。这被确定为是因为颜色方案的变化,所述变化阻碍了数据的此池化。因此,可以考虑对颜色方案进行归一化以实现池化。

示例性替代网络:Inception:

Inception v3 CNN的转移学习重新训练开始于在TensorFlow网站上上传供公众使用的网络的2016年8月8日版本。对所述训练了10,000步。在图像的数量上通过图像增强对训练和验证集进行了归一化,因此两个子集总计具有相同数量的所注释图像。所有其它网络参数均取为其默认值。

可以使用经过预训练的CNN以使用最后的卷积层的输出对成像特征进行分类,在谷歌Inception v3 CNN的情况下,所述输出是维数为2048×2的数字张量。然后,训练了SVM分类器以识别对象。此过程通常是在转移学习和精细调谐步骤之后对Inception模型执行的,在所述转移学习和精细调谐步骤中,最初以ImageNet 2014数据集训练的模型使其最后的softmax层移除并重新训练,以识别新类别的图像。

替代性实施例:

图29提供了用于对潜在癌性肺部病变进行表型分型的替代性实施例。最左侧的图指示经过分割的病变的轮廓,其中进行了预处理以将其分离为固体与半固体区(“磨玻璃”)子区域。中间的图指示其在肺部中的位置,并且最右侧的图示出了其具有伪颜色叠加。在此情况下,病变的3维性质可能被视为是显著的,因此,与单独处理2D横截面相反,可以对分类器输入数据集应用来自计算机视觉的如视频解释等技术。事实上,就如以沿中心线的“电影”序列排列一样顺序处理多个横截面可以概括针对管状结构的这些方法。

另一概括是伪颜色不是选自离散的调色板,而是在像素或体素位置处具有连续值。使用肺部实例,图30示出了一组特征,所述一组特征有时被描述为可以针对每个体素计算的所谓的“放射组学”特征。此一组值可以以任意数量的经过预处理的叠加存在,并且馈送到表型分类器中。

其它替代性实施例包含使用例如从多个时间点收集的变化数据,而不是(仅)来自单个时间点的数据。例如,如果阴性细胞类型的量或性质增加,则其可以被称为“进展变数”表型,而“回归变数”表型则针对减少。回归变数可以是,例如由于对药物的应答。可替代地,如果例如LRNC的变化率快速,则这可能暗示不同的表型。实例扩展到使用δ值或变化率对于本领域技术人员是显而易见的。

作为另外的替代性实施例,可以将如衍生自其它测定(例如,实验室结果)或人口统计学/风险因素等的非空间信息或从放射学图像提取的其它测量结果馈送到CNN的最终层,以将空间信息与非空间信息组合。同样,可以确定定位信息,所述定位信息如通过推断成像处的完整3D坐标,使用压力线以及沿血管的从如分岔或孔等参考的一个或多个某些位置处的读数。

尽管这些实例的焦点在表型分类上,但是作为本发明的另外的实施例,可以对结果预测的问题应用类似方法。

示例实施方案:

本公开的系统和方法可以有利地包括由多个级组成的流水线。图34提供了层级分析框架的另外的示例实施方案。通过语义分割对生物学性质进行了标识和定量,以单独或组合地标识以数字方式方式表示以及处于空间展开的富集数据集中的生物学性质(在示例应用中,为脂质丰富的坏死核、帽厚度、狭窄、扩张、重塑比率、曲折度(例如,入口角和出口角)、钙化、IPH和/或溃疡),以将静脉/动脉横截面转化为矩形,并且然后转化为医疗状况(例如,引起缺血的血流储备分数FFR、高风险表型HRP和/或风险分层事件的时间(TTE)使用一个或多个经过训练的CNN来读取富集的数据集以标识和表征状况。收集患者的图像,在一组算法中使用原始切片数据以测量可以客观验证的生物学性质,进而将这些生物学性质形成为用于馈送多个CNN之一的富集的数据集,在此实例中其中结果使用递归CNN向前和向后传播以实施约束或产生连续状况(如在整个血管树中从近侧到远侧单调下降的血流储备分数、或局灶性病变中的恒定HRP值或其它约束)。HRP的基准真相数据可以随着病理学家确定给定横截面处的已经被确定为离体的斑块类型而存在。FFR的基准真相数据可以来自物理压力线,具有一个或多个测量值以及网络训练,沿中心线的给定测量的近侧的位置被约束为大于或等于测量值,远侧的位置被约束为小于或等于测量值,并且当同一中心线上的两个测量已知时,两个测量值之间的值将限制在间隔内。

这些性质和/或状况可以在给定的时间点测定和/或可以跨时间变化(纵向)。在不失一般性的情况下,在斑块表型分型或其它应用中执行类似步骤的其它实施例将是本发明的实施例。

在示例实施方案中,生物学性质可以包含以下中的一个或多个:

·血管生成

·新血管形成

·炎症

·钙化

·脂质沉积

·坏死

·出血

·溃疡

·刚性

·密度

·狭窄

·扩张

·重塑比率

·曲折度

·血流(例如,血管中血液的血流)

·压力(例如,通道中血液的压力或一个组织压对另一个组织的压力)

·细胞类型(例如巨噬细胞)

·细胞对准(例如,平滑肌细胞的)

·剪切应力(例如,通道中血液的剪切应力)

分析可以包含确定前述生物学性质中的每个生物学性质的数量、程度和/或性状中的一个或多个。

可以基于生物学性质确定的状况可以包含以下中的一种或多种:

·灌注/缺血(如受限的)(例如,大脑或心脏组织的灌注/缺血)

·灌注/梗塞(如切除)(例如,大脑或心脏组织的灌注/梗塞)

·充氧

·代谢

·血流储备(灌注能力),例如FFR(+)与(-)和/或连续数量

·恶性肿瘤

·侵害

·高风险斑块,例如HRP(+)与(-)和/或标记的表型

·风险分层(无论是作为事件的概率还是事件的时间)(例如明确提到的MACCE)

真相基础形式的验证可以包含以下:

·活检

·专家组织注释形成所切的组织(例如,动脉内膜切除术或尸检)

·对所切除组织的专家表型注释(例如,动脉内膜切除术或尸检)

·物理压力线

·其它成像模态

·生理监测(例如ECG、SaO2等)

·基因组学和/或蛋白质组学和/或代谢组学和/或转录组学测定

·临床结果

分析可以处于给定时间点处以及可以是纵向的(即随时间变化)两者

示例性系统架构:

图31展示了根据本公开的系统和方法,与分析平台交互的用户和其它系统的高级视图。此视图的利益相关者包含具有互操作性、安全性、故障转移和灾难恢复、法规问题的系统管理者、支持技术人员。

平台可以以两种主要配置进行部署:预置或远程服务器(图32)。平台部署可以是独立配置(左上)、预置服务器配置(左下)或远程服务器配置(右)。预置部署配置可以具有两个子配置;仅台式或机架式。在远程配置中,平台可以部署在HIPAA合规性数据中心上。客户端在安全HTTP连接之上访问所述API服务器。客户端可以是台式或平板式浏览器。除了运行Web浏览器的计算机之外,在客户站点上未部署硬件。所部署服务器可以在公共云上或使用VPN的客户专用网络的扩展上。

示例性实施例包含客户端和服务器。例如,图33展示了作为C++应用的客户端以及作为Python应用的服务器。这些组件使用HTML 5.0、CSS 5.0和JavaScript进行交互。在可能的情况下,对界面使用开放标准,包含但不限于;HTTP(S)、REST、DICOM、SPARQL和JSON。如此视图所示,还使用了第三方库,所述视图示出了技术堆栈的主要件。本领域的技术人员可以理解许多变化和不同方法。

上述系统和方法的各个实施例可以以数字电子电路系统、以计算机硬件、固件和/或软件来实施。实施方案可以作为计算机程序产品(即有形地体现在信息载体中的计算机程序)。实施方案可以例如在机器可读存储装置中和/或传播的信号中,以用于由数据处理设备执行,或控制数据处理设备的操作。实施方案可以是例如可编程处理器、计算机和/或多个计算机。

计算机程序可以以任何形式的编程语言编写,包含编译和/或解释语言,并且计算机程序可以以任何形式部署,包含作为独立程序或子例程、元件和/或适用于计算环境的其它单元。计算机程序可以被部署为在一台计算机上或一个站点处的多台计算机上执行。

方法步骤可由执行计算机程序的一个或多个可编程处理器来执行,以通过对输入数据进行操作并产生输出来执行本发明的功能。方法步骤也可以由专用逻辑电路系统执行,并且设备可以实施为专用逻辑电路系统。电路系统可以是例如FPGA(现场可编程门阵列)和/或ASIC(专用集成电路)。模块、子例程和软件代理可以指代实施所述功能的计算机程序、处理器、专用电路系统、软件和/或硬件的一部分。

适合于执行计算机程序的处理器包含例如通用微处理器和专用微处理器两者,以及任何种类的数字计算机的任何一种或多种处理器。通常,处理器从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器以及用于存储指令和数据的一个或多个存储器装置。通常,计算机可以包含用于存储数据的一个或多个大容量存储装置(例如,磁盘、磁光盘或光盘)、可操作地耦合以从一个或多个大容量存储装置接收数据和/或将数据传输到一个或多个大容量存储装置。

数据传输和指令也可以发生在通信网络之上。适合于体现计算机程序指令和数据的信息载体包含所有形式的非易失性存储器,包含例如半导体存储器装置。信息载体可以是例如EPROM、EEPROM、闪存装置、磁盘、内部硬盘、可移动磁盘、磁光盘、CD-ROM和/或DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路系统补充和/或并入专用逻辑电路电路中。

为了提供与用户的交互,可以在具有显示装置的计算机上实施上述技术。显示装置可以是例如阴极射线管(CRT)和/或液晶显示器(LCD)监测器。与用户的交互可以是例如向用户展示信息以及用户可以通过其向计算机提供输入(例如,与用户界面元件交互)的键盘和指示装置(例如鼠标或轨迹球)。可以使用其它种类的装置来提供与用户的交互。其它装置可以是例如以任何形式的感觉反馈(例如,视觉反馈、听觉反馈或触觉反馈)提供给用户的反馈。来自用户的输入可以例如以任何形式接收,包含声音输入、语音输入和/或触觉输入。

上述技术可以在包含后端组件的分布式计算系统中实施。后端组件可以是例如数据服务器、中间件组件和/或应用服务器。上述技术可以在包含前端组件的分布式计算系统中实施。前端组件可以是例如具有图形用户界面的客户端计算机、使用者可以利用示例实施方案交互的Web浏览器和/或用于传输装置的其它图形用户界面。系统的组件可以通过任何形式或介质的数字数据通信(例如,通信网络)互连。通信网络的实例包含局域网(LAN)、广域网(WAN)、互联网、有线网络和/或无线网络。

系统可以包含客户端和服务器。客户端和服务器通常彼此远离,并且通常通过通信网络交互。客户端和服务器的关系是借助于在相应计算机上运行并彼此具有客户端-服务器关系的计算机程序产生的。

基于分组的网络可以包含例如因特网、运营商互联网协议(IP)网络(例如,局域网(LAN)、广域网(WAN)、校园区域网络(CAN)、城域网(MAN)、家庭区域网络(HAN)、专用IP网络、IP专用小交换机(IPBX)、无线网络(例如,无线电接入网络(RAN)、802.11网络、802.16网络、通用分组无线电服务(GPRS))网络、HiperLAN)和/或其它基于分组的网络。基于电路的网络可以包含例如公共交换电话网络(PSTN)、专用小交换机(PBX)、无线网络(例如RAN、蓝牙、码分多址(CDMA)网络、时分多址(TDMA)网络、全球移动通信系统(GSM)网络和/或其它基于电路的网络。

计算装置可以包含例如计算机,具有浏览器装置的计算机、电话、IP电话、移动装置(例如,蜂窝电话、个人数字助理(PDA)装置、膝上型计算机、电子邮件装置)和/或其它通信装置。浏览器装置包含,例如,具有万维网浏览器(例如,可从微软公司(MicrosoftCorporation)获得的

尽管在阅读了前面的描述之后,本公开的许多改变和修改对于本领域的普通技术人员而言无疑将变得显而易见,但是应当理解,以图解方式示出和描述的特定实施例绝非旨在被认为是限制性的。进一步地,本主题已参照特定实施例进行了描述,但对于本领域的技术人员来说,将发生本公开的精神和范围内的变化。注意,上述实例仅是出于解释的目的而提供的,并且绝不解释为对本公开的限制。

尽管本公开已参照特定实施例进行了描述,但本公开不旨在限于本文所公开的特定细节;相反,本公开扩展到的对本领域的普通技术人员来说将是显而易见的其所有变化和概括,包含所附权利要求的最宽范围内的那些变化和概括。

相关技术
  • 利用定量成像的方法和系统
  • 高光谱干涉非标记成像方法及活细胞定量断层成像系统
技术分类

06120112525447