掌桥专利:专业的专利平台
掌桥专利
首页

多变量动态列线图预测模型及其应用

文献发布时间:2023-06-19 11:14:36


多变量动态列线图预测模型及其应用

技术领域

本发明涉及计算机编程技术领域、生物信息技术领域,涉及对疾病相关预测因子评分参数的可视化分析,具体涉及一种多变量动态列线图预测模型及其应用。

背景技术

颅内动脉瘤破裂是自发性蛛网膜下腔出血(Subarachnoid hemorrhage,SAH)最常见的原因,简称动脉瘤性蛛网膜下腔出血(Aneurysmal SAH,aSAH),是病人发生严重不良预后的主要事件。急性SAH的主要临床特征是突然发作的非常严重的头痛(通常被描述为患者一生中最严重的头痛),且与脑膜刺激征(脑膜炎,畏光),颅内高压征象(恶心和呕吐,意识下降至昏迷),癫痫发作和局灶性神经功能缺损有关。后者通常反映出颅神经功能障碍,脑实质内出血或迟发性脑缺血(Delayed cerebral ischemia,DCI)发作。

DCI是aSAH后最常见的并发症,约占30%左右。DCI的出现多预示患者预后不佳,包括颅神经功能缺损、偏瘫、失语、甚至死亡。国内外文献报道aSAH后3-14天出现无其他原因造成的神经功能缺损、格拉斯哥昏迷量表(Glasgow Coma Scale,GCS)总评分或单项评分下降≥2分或CT上新出现的低密度灶均可诊断DCI,其中以后者为主要诊断方法。早期时间窗内诊断DCI非常重要,这对指导DCI的临床防治和改善预后意义重大。因此,目前迫切需要开发一种早期(出血后24小时内)预测DCI的模型。

既往有学者认为,Hunt与Hess分级和世界神经外科医师联盟(WorldNeurosurgical Society of Federation,WFNS)分级可早期预测DCI;也有学者认为血清标记物,如:白细胞、中性粒细胞、淋巴细胞也可用于DCI的预测。然而,彼此独立的预测因子建立的预测模型,其诊断效能并不高,且临床实用性不稳定。因此,有必要开发一种诊断效能更高更稳定且能够让神经外科医生快速计算出患者发现DCI概率的预测模型。

发明内容

本发明的目的是基于已有的预测因子现状,提供一种多变量动态列线图预测模型及其应用,该预测模型能对动脉瘤性蛛网膜下腔出血后相关评分参数可视化分析,还涉及到该动态列线图预测模型的具体应用。该模型可用于分析动脉瘤性蛛网膜下腔出血后血凝块CTHU值和血清标记物,将入院检查的相关数据带入模型中,通过动态的列线图,即可得出该患者发生DCI的概率。这有助于早期预测DCI患者,从而进一步指导临床决策,减少发生DCI以及不良预后的风险。

为实现上述目的,本发明的技术方案如下:

本发明提供了一种aSAH后迟发性脑缺血动态Nomogram预测系统;模型算法通过最终概率分析模型的计算机编程实现,在赤池信息准则(Akaike information criterion,AIC)最小值的基础上,本发明使用了向后逐步消除的二元逻辑(logistic)回归分析方法,以简化模型,得到独立预测因子,最终采用动态Nomogram建立模型;

所述的最优模型变量集包括白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法,其中白细胞(WBC)、血凝块CT HU值为独立预测因子。

上述预测模型系统可以对白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法进行综合得分,并在动态Nomogram模型中计算DCI的发生概率。

本发明提供了一种建立aSAH后DCI动态Nomogram预测系统及其临床应用,所建立的模型可用于分析动脉瘤性蛛网膜下腔出血后血凝块CT HU值和血清标记物的评分参数,并以网页版动态列线图的方式呈现,这有助于临床医生对aSAH后DCI的患者实行早前预测,并依据回返的结果做出临床决策。所述的最优模型变量集包括:白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法。

所述的应用包括下列步骤:

(1)制备受试者运行(Receiver Operating Characteristic curve,ROC)特征图,计算预测模型C统计量;

(2)制备预测模型的校准曲线;

(3)制备预测模型的临床决策曲线(Decision CurveAnalysis,DCA)分析;

(4)制备预测模型的自助抽样法(Bootstrap)内部验证曲线。

其中,步骤(1)之前通常先确定预测因子及其权重。

本发明建立的动态Nomogram预测模型,按照多因素logistic回归模型筛选的独立预测因子比值比(OR)值确定权重及其评分,计算最终得分,得到aSAH后DCI的发生概率,从而预测DCI。

具体的,本发明的一种建立aSAH后DCI动态列线图预测模型,其包括下列步骤:

1)确定预测因子,白细胞(WBC)、中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、动脉瘤是否多发、治疗方式,创建DCI预测的动态列线图;

2)制备受试者运行特征(ROC)图;

3)制备预测模型的校准曲线;

4)制作动态Nomogram的决策曲线分析(DCA);

5)制备预测模型的Bootstrap内部验证曲线。

本发明的基本原理如下:

基于动态Nomogram模型的理论知识,该理论通过将复杂的计算公式以“网页版软件”形式的方式展现出来,专科医生只需在软件上选择与患者入院结果相同的数值,模型就可快速计算患者发生DCI的概率,这使的原本复杂的数据集变得简单、直观。动态Nomogram模型优势就在于医生可以更加快速、准确的找到患者数据,与普通列线图相关,进一步降低了操作难度,使其更加简单、精确、可操作性更强,因此在临床实践中有很大的价值。

基于多变量logistic逐步回归(向后法)变量筛选方法,得出赤池信息准则(Akaike Information Criterion,AIC)值最小的模型,最终确定白细胞(WBC)、血凝块CTHU值、动脉瘤数量、治疗方法为最优模型变量集,其中白细胞(WBC)、血凝块CT HU值为独立预测因子。本发明应用R(DynNom)包,建立动态Nomogram预测模型,所建立的基于多变量逻辑回归分析的动态Nomogram预测模型助于确定DCI的风险度。通过风险度进一步来指导临床决策。

本发明的优点及有益效果如下:

本发明的aSAH后DCI动态Nomogram预测模型系统,所建立的模型可用于分析动脉瘤性蛛网膜下腔出血后血凝块CT HU值和血清标记物的评分参数,并以网页版列线图的方式呈现,这有助于临床医生对aSAH后DCI的患者实行早前快速预测,并根据得到的结果做出临床决策。

在开发模型的原始数据集中,应用自主抽样法(Bootstrap)进行模型的内部验证,通过校准图看出黑色实线与45°斜虚线拟合较好,可知模型预测效果较好。同时,我们绘制出了预测迟发性脑缺血的普通列线图,概率0.5对应总分96分,具体到某一个预测因子所得多少分需要拿尺子量,非常繁琐和不准确。相比较动态列线图就直接可以输出概率,非常方便快捷和准确。

本发明的思路来源于实际临床工作中,针对迟发性脑缺血高并发症的预防、预测、诊断缺乏较为统一的标准,特别是识别高风险病人是否发生该并发症有一定困难。基于此,通过筛选的独立预测因子,本发明的技术人员开发了该疾病的概率计算模型(动态列线图),这极大的提升了了该疾病的预测准度和效度,专科医生在动态nomogram中选择患者的检查结果数值,模型即可快速计算出风险概率,这对于基层或者动脉瘤高发地区有广泛的适用性。目前仅有相关文献报道过迟发性脑缺血的独立预测因子,没有国内学者或国外文献报道有预测该疾病的动态列线图模型,因此该创新点有应用价值。

本发明的预测模型是融合了计算机编程技术,生物信息技术,并非常规技术手段,这在一定程度需要发明者有相应的基础。同时本发明所运用的背景知识、编程与生信技术之间并非简单叠加、组合或套用,而是形成一套体系,使得该模型非常独特,更加简便快捷的运用。在设计这个方案过程中,本发明克服了独立预测变量筛选、动态nomogram编程技术以及模型评价等技术障碍。

附图说明

图1-4为使用基于多元逻辑回归的动态列线图预测DCI的概率:

图1为普通列线图的创建;

图2为网页版动态列线图的创建;

图3为预测模型的受试者运行特征(ROC)图;

图4为预测模型的校准曲线;

图5为预测模型的决策曲线分析(DCA);

图6为Bootstrap模型内部验证曲线。

其中:采用白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法4个最优模型预测因子创建了DCI预测的列线图。

具体实施方式

以下将通过附图和具体实施例对本发明进行进一步地详细阐述。需要特别指出的是,这些描述仅仅是示例性的描述,并不构成对本发明范围的限制。

实施例1

采集86例动脉瘤性蛛网膜下腔出血患者,其中,在这些病例中,有32例(37.21%)动脉瘤性蛛网膜下腔患者发生DCI,而54例(62.79%)患者未发生迟发性脑缺血。实例数据的基线资料如下表:

实施例1中,采集85例动脉瘤性蛛网膜下腔出血24小时之内的患者的临床资料,纳入标准及排除标准分别如下:

最终确定白细胞(WBC)、中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、动脉瘤是否多发、治疗方式等变量。其中白细胞(WBC)、中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、动脉瘤是否多发均有下统计学意义(P<0.05),而年龄、性别、高血压、入院血糖等无组间统计学意义(P>0.05)。

采用单因素分析找出DCI组与未发生DCI组之间的差异变量:年龄、性别、入院血糖、白细胞(WBC)、中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、血凝块水肿区CTHU值、动脉瘤大小、是否多发、治疗方式等变量纳入研究,得到白细胞(WBC),中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、血凝块水肿CT HU值、入院WFNS分级、入院Hunt-Hess分级、动脉瘤是否多发在组件有差异。

单因素分析有统计学意义的变量带入多变量logistic回归分析模型,依据AIC最小值,确定最优模型变量集,最终得到白细胞(WBC),中性粒细胞(NC)、中性粒细胞/淋巴细胞比(NLR)、血凝块CT HU值、血凝块水肿CT HU值、入院WFNS分级、入院Hunt-Hess分级、动脉瘤数量在组间有统计学意义,将这些变量带入多变量logistic回归分析模型,依据AIC最小值,确定最优模型变量集,最终得到白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法为模型预测因子。

在多变量逻辑回归分析的基础上,利用白细胞(WBC)、血凝块CT HU值、动脉瘤数量、治疗方法建立了预测DCI的列线图,使用多变量逻辑回归分析对预测因子与DCI的关系进行了评估,结果显示,白细胞(WBC)、血凝块CT HU值与DCI独立相关,并以此作为预测因子,建立蛛网膜下腔出后DCI的列线图预测模型。

如图1所示,列线图中有7行,其中第2-5行代表所包括的变量。4个变量的点数被加在第6行中的总点数中,并与第7行DCI预测中的风险概率相对应,列线图显示了DCI的风险百分比。

图2所示动态列线图,左侧为预测因子选择单元,右侧为输出的预测结果,0.5为临界概率,跨过0.5即提示可能发现DCI,预测值越大DCI发生的可能性越大。

对于获得的列线图,图3所示ROC曲线下面积(AUC)值为0.906,其大于独立预测因子白细胞(WBC)的AUC值0.827、血凝块CT HU值的AUC值0.872,说明模型的区分能力较好。图4所示Nomogram模型的校准曲线,可以看出Nomogram模型预测值的大小和观察到的大小一致性较好,说明该模型的校准度较好。图5所示模型的DCA决策曲线在概率区间净受益率均高于两单独的预测因子DCA曲线,该模型的临床应用性较好。

图6所示通过Bootstrap内部重新抽样的方法,进行模型的内部验证,可以看出内部验证曲线与模型拟合较好,显示DCI的列线图预测概率与DCI的实际概率相似,就DCI的概率而言,表明预测与实际观察结果具有较好的一致性。这些结果还表明,动态列线图对动脉瘤性蛛网膜下腔出血后DCI预测的能力可以推广到其他地区患者,具有一定的临床适用性。

相关技术
  • 多变量动态列线图预测模型及其应用
  • 一种进展期阑尾炎列线图预测模型及其用途
技术分类

06120112856843