掌桥专利:专业的专利平台
掌桥专利
首页

针对肝功能指标正常新冠初治人群的肝损伤风险预测系统

文献发布时间:2023-06-19 18:35:48



一、技术领域:

本申请涉及生物信息学技术领域,特别是涉及一种针对肝功能指标正常新冠初治人群的肝损伤风险预测系统。

二、背景技术:

随着临床诊治的实施,COVID-19合并肝损伤已成为临床普遍关注的热点问题。相关研究报道,在COVID-19患者中有高达76%的病人存在肝生化指标异常。而在此类患者中,重症和死亡的风险显著升高。然而,目前对于COVID-19合并肝损伤的定义、发生率、发病机制、临床表现及诊断和治疗等方面,尚存在较多的不确定性。

现阶段,临床常用的阿比多尔、α-干扰素和利巴韦林等指南推荐一线抗病毒药物均具有一定的肝毒性。但就目前形势而言,经确诊的COVID-19患者因病情需要而无法避免此类药物的服用。如何合理用药(如:药物搭配、停药时机、抗病毒疗程等)对临床诊治效率的提高至关重要,而肝损伤作为COVID-19患者的主要并发症之一,可贯穿疾病的整个发展过程,成为限制临床高效应用抗病毒药物的重要因素。因此,如何实现在上述抗病毒药物处理过程中COVID-19患者肝损伤发生率的精准预测,从而据此进行合理干预及个体化用药方案的优化,对临床诊治效率的提高至关重要。

目前,临床上常用的COVID-19肝损伤诊断指标天冬氨酸转氨酶(Aspartateaminotransferase,AST)、丙氨酸转氨酶(Alanine aminotransferase,ALT)、γ-谷氨酰转肽酶(γ-Glutamyl transpeptidase,GGT)和总胆红素(Total bilirubin,TBIL) 具有一定的局限性。尽管持续监测上述指标可以降低肝损伤的发生率,但部分患者仍因无法避免抗病毒药物诱发的肝衰竭而死亡。因此,单纯依靠临床上常用的肝生化指标并不能准确判断COVID-19患者的肝功能状态。

综上所述,对于入院时ALT、AST、GGT和TBIL指标正常的COVID-19 患者,准确的肝损伤风险预测可以指导医生针对此类高风险人群制定个性化的检查及治疗方案。此外,准确的肝损伤风险预测可以为研发新型的COVID-19抗病毒治疗方案提供重要依据。然而,现阶段的临床实践中尚无理想的针对ALT、 AST、GGT和TBIL正常COVID-19患者后续肝损伤发生风险的预测手段。因此,迫切需要研发一种全面、可靠、稳定的针对此类人群的预测系统。

三、发明内容:

本发明拟开发一种结合新型蛋白标志物、简单可靠且具有高度临床适用性的COVID-19肝损伤风险预测系统,目的是为解决如何早于ALT、AST、GGT及 TBIL等临床常用肝生化指标识别出肝损伤高发的COVID-19人群,为该人群的临床用药及肝功能监测方案提供个体化指导。

本发明所采取的技术方案是提供一种可早于ALT、AST、GGT及TBIL等肝生化指标预测COVID-19肝损伤发生率的预测系统。所述预测系统是一种基于蛋白质组学及实验室检查数据,通过Cox回归分析而构建的Nomogram模型,并基于Nomogram进行可视化,所述预测系统存储有自动化计算程序,所述自动化计算程序被执行时实现对COVID-19肝损伤风险概率的计算结果呈现。所述预测系统包括血管生成素样蛋白-3(Angiopoietin-like 3,ANGL3)和性别两个关键因素。

本发明提供一种可早于ALT、AST、GGT及TBIL等肝生化指标预测 COVID-19肝损伤发生率的预测系统的应用,所述应用包括对ALT、AST、GGT 及TBIL等肝生化指标正常的COVID-19患者进行用药、治疗及肝功能监测方案制定前的风险预测。

本发明提供一种可早于ALT、AST、GGT及TBIL等肝生化指标预测 COVID-19肝损伤发生率的预测系统在制备预测从ANGL3中生存获益的人群的检测试剂盒中的应用。

本发明提供一种可早于ALT、AST、GGT及TBIL等肝生化指标预测 COVID-19肝损伤发生率的预测系统在制备ALT、AST、GGT及TBIL肝生化指标正常患者经预测后是否适合服用某些肝毒性药物(如:洛匹那韦/利托那韦、阿比多尔、α-干扰素和利巴韦林等抗病毒药物)的检测试剂盒中的应用。

本发明提供一种可早于ALT、AST、GGT及TBIL等肝生化指标预测 COVID-19肝损伤发生率的预测系统在制备对准备接受肝毒性药物(如:洛匹那韦/利托那韦、阿比多尔、α-干扰素和利巴韦林等抗病毒药物)患者进行肝损伤发生风险预测的检测试剂盒中的应用。

为实现上述目的,本发明采用如下技术方案:

本发明提供一种针对肝功能指标正常新冠初治人群的肝损伤风险预测系统,包括获取模块和预测模块;所述获取模块与所述预测模块通过无线和/或有线方式连接;

所述获取模块用于获取与肝功能指标正常新冠初治人群的肝损伤风险相关的变量,所述变量包括血液中的血管生成素样蛋白-3(ANGL3)表达水平和性别;

所述预测模块用于根据所述获取模块获得的所述变量预测肝功能指标正常新冠初治人群的肝损伤风险参数,并输出所述肝损伤风险参数;

所述的预测模块预测并输出所述肝损伤风险参数的方法是:将获取的所述变量导入至预先建立的Cox回归模型中,通过所述Cox回归模型计算得出所述肝损伤风险参数,并可视化呈现预测结果。

优选地,所述获取模块包括彼此独立的血液中的血管生成素样蛋白-3表达水平获取子模块和性别获取子模块;所述血管生成素样蛋白-3表达水平获取子模块和性别获取子模块分别通过无线和/或有线方式与所述预测模块连接。

在本发明的一个实施例中,所述获取模块还包括:输出单元,用于将所述变量传输至所述预测模块。

进一步,所述变量仅为血液中的血管生成素样蛋白-3(ANGL3)表达水平和性别。

进一步,所述风险参数包括指定天数的风险概率值,所述的风险概率值是指肝功能指标正常新冠初治人群的肝损伤风险概率。具体地,所述指定天数的风险概率值是指确诊(鼻咽拭子、痰拭子或粪便拭子SARS-CoV-2RNA阳性)后14 天的风险概率值、21天的风险概率值、28天的风险概率值、35天的风险概率值和42天的风险概率值。

在本发明的一个实施例中,所述获取模块为处理器、服务器或电脑主机;所述预测模块为处理器、服务器或电脑主机;或者,所述获取模块和所述预测模块集成于同一处理器、同一服务器或同一电脑主机。

优选地,所述性别获取子模块包括数据转换模块,所述数据转换模块与所述预测模块连接,所述数据转换模块按如下公式将性别转换为数值:

性别为男时,Sex=1,性别为女时,Sex=2。

在本发明的一个实施例中,根据所述变量获得的Cox回归模型为:

其中,P(t)为第t天的风险概率值,S

X

在本发明的一个实施例中,

相比现有技术,本发明具有如下有益效果:

本发明基于COVID-19患者确诊后的临床信息及蛋白质组学检测数据,通过 Cox回归模型构建一个针对确诊后前7天内ALT、AST、GGT及TBIL正常的 COVID-19患者后续肝损伤发生风险的预测系统,一方面可以筛选出COVID-19 肝损伤高发人群,为是否适用具肝毒性抗病毒药物的患者提供临床用药指导;另一方面,可以通过COVID-19肝损伤的风险预测,制定更加个体化的肝功能监测方案。

本发明构建的COVID-19肝损伤预测系统整合了ANGL3和性别2个关键因素,这2个关键因素在临床实践中很容易测量获得。本发明基于Cox模型构建了Nomogram图,该图可为每一位患者创建个体化肝损伤发生率统计预测图,适用于任何临床诊疗场景的风险概率预测。

四、附图说明:

图1为本发明实施例中针对肝功能指标正常新冠初治人群的肝损伤风险预测系统的模块示意图,预测系统主要包括:获取模块1和预测模块2

图2为本发明实施例中针对肝功能指标正常新冠初治人群的肝损伤风险预测系统的模块示意图,预测系统主要包括:获取模块1和预测模块2,获取模块1包括彼此独立的血液中ANGL3表达水平获取子模块11、性别获取子模块12

图3为诺莫图(Nomogram图)

图4为本发明实施例中针对肝功能指标正常新冠初治人群的肝损伤风险预测系统的模块示意图,服务器200和终端100

图5为本发明实施例中训练队列的时间依赖性AUC曲线

图6为本发明实施例中训练队列的校准曲线

图7为本发明实施例中训练队列的决策曲线

图8为本发明实施例中验证队列的预测准确率图

五、具体实施方式:

下面对本申请中使用的术语以及技术手段进行说明:

术语“肝损伤”包括:

轻度肝功能损伤:需同时满足AST≥35U/L,ALT<40U/L,GGT<45U/L, TBIL<20.52μmol/L;中度肝功能损伤:在AST≥35U/L前提下,满足ALT:40-120 U/L,GGT:45-90U/L,TBIL:20.52-41.04中的任意一种或两种及以上;重度肝功能损伤:在AST≥35U/L前提下,满足ALT≥120U/L,GGT≥90U/L,TBIL≥41.04 μmol/L中的任意一种或两种及以上;肝功能损伤:满足轻度肝功能损伤,中度肝功能损伤,重度肝功能损伤标准中的任意一种或两种及以上。该术语也包括预测上述任何一种情况的时限(如多于,少于或等于给定天数,如14,21,28, 35天或更多天)。

如果在本发明中结合给定时期描述肝损伤事件(如多于、少于、等于给定时期或在给定时期以内等),则给定时期优选是在以下范围之一内的时间点:7到 14天、7到21天、7到28天、7到35天、7到42天、14到21天、14到28天、 14到35天、14到42天、21到35天、21到42天或35到42天。前面所述的范围为总括,所以本领域技术人员应当理解,例如,范围为14-28天内的时间点应当被理解为包括该范围的两个端点,使得时间点可以,例如为14天或28天(或者落入这些端点之间的任一时间点,如19天、25天等)。因此,在至少一些实施方案中,提供肝损伤发生风险概率可以包括预测患者的风险概率为(i)多于、少于或等于14天;或(ii)多于、少于或等于21天;或(iii)多于、少于或等于28天;或(iiii)多于、少于或等于35天;(iiiii)多于、少于或等于42天。

术语“确诊”是指患者鼻拭子、咽拭子、痰拭子或粪便拭子中的一种或两种及以上SARS-CoV-2RNA阳性。

术语“COVID-19患者”包括经确诊的所有临床分型的COVID-19患者,如无症状、轻型、普通型和重型。优选地,患者为普通型患者。任选地,患者可以正在接受抗病毒治疗;或者,患者正处于住院期;又或者,患者可以为(a)带毒期患者或(b)康复期患者。

术语“离体样本”来源于血液。优选地,离体样本可以为血清样本。离体样本可以在确诊早期(少于或等于7天)一个或多个时间点获得。任选地,在采用本申请的预测系统分析离体样本之前,可以利用一种或多种收集后制备或储存技术对离体样本进行处理(例如:离心、灭活、提取多肽、除盐、分馏等)。

术语“蛋白标志物”代表血液中的可用于区分肝损伤和非肝损伤的蛋白质。

术语“ANGL3”是指血液中的细胞外名为血管生成素样蛋白-3 (Angiopoietin-like 3,ANGL3)的蛋白质。

本申请实施例利用TMT技术对血清样本进行蛋白质定量分析。ProteomeDiscoverer(Version 2.4.0.305,Thermo Fisher Scientific)软件对获得的质谱数据进行搜库,R3.6.3limma包去除批次效应。

本申请实施例中涉及的所有统计数据均由R-studio 3.6.3和4.0.5执行。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

除非另行定义,文中所使用的所有专业与科学用语与本领域技术人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本申请中。文中所述的较佳实施方法与材料仅作示范之用,但不能限制本申请的内容。

除非另有说明,以下实施例中使用的原料和试剂均为市售商品,或者可以通过本领域已知方法制备。

本申请实施例中涉及的蛋白提取、蛋白标记、蛋白定量以及数据处理均由西湖大学蛋白质组大数据实验室完成。

本申请实施例中涉及的仪器包括Thermo shaker、UltiMate 3000HPLC (Thermo)、超微量核酸蛋白测定仪ScanDrop2(Jena)等,所涉及的试剂盒均购置于赛默飞世尔科技公司。

本申请实施例中所有操作均符合制造商的说明。

如图1所示,本申请实施例提供了一种针对肝功能指标正常新冠初治人群的肝损伤风险预测系统,预测系统主要包括:获取模块1和预测模块2,其中,获取模块1与所述预测模块2之间通过无线和/或有线的方式连接。

具体的,获取模块1用于获取与COVID-19肝损伤相关的变量,变量包括 ANGL3、性别。

预测模块2用于根据获取模块1获得的变量预测COVID-19患者确诊7天后的肝损伤发生风险概率参数,并输出该风险参数。预测模块2预测并输出风险参数的方法是:将获取的一个或多个变量导入至预先建立的Cox回归模型中,通过Cox回归模型计算得出所述风险参数,并采用R语言RMS运算包生成风险概率列线图以可视化呈现预测结果。

风险参数包括指定天数的风险概率值。所述指定天数的风险概率值例如可以是确诊后14天的概率值、21天的概率值、28天的概率值、35天的概率值和42 天的概率值。

在本申请的实施例中,如图2所示,获取模块1包括彼此独立的血液中 ANGL3表达水平获取子模块11、性别获取子模块12。

风险参数为确诊后14天的概率值、21天的概率值、28天的概率值、35天的概率值和42天的概率值,对应地,预测模块2预测并输出风险参数的方法是:将获取的两个变量导入至预先建立的Cox回归模型中,该Cox回归模型用于分析所述两个变量对COVID-19患者肝损伤发生风险概率的影响;通过所述Cox 回归模型计算得出风险参数,并采用R语言RMS运算包生成风险概率列线图以可视化呈现预测结果。如图3所示,风险概率列线图中呈现有得分列线、所述两个变量中每一变量的列线、总风险分值列线、14天风险概率列线、21天风险概率列线、28天风险概率列线、35天风险概率列线和42天风险概率列线。将获取的两个变量分别映射至对应的变量列线的横坐标上,并通过得分列线获得所述两个变量中每一变量的得分,并计算总风险分值,总风险分值即为各个变量得分的累加之和,将总风险分值映射至总风险分值列线上,14天风险概率列线上与总风险分值相对应位置处的数值即为确诊后14天的风险概率值,21天风险概率列线上与总风险分值相对应位置处的数值即为确诊后21天的风险概率值,28天风险概率列线上与总风险分值相对应位置处的数值即为确诊后28天的风险概率值,35天风险概率列线上与总风险分值相对应位置处的数值即为确诊后35天的风险概率值,42天风险概率列线上与总风险分值相对应位置处的数值即为确诊后42天的风险概率值。

需要说明的是,上述无线的连接方式可以是蓝牙连接、无线网 (Wireless-Fidelity,WiFi)连接、红外线连接、移动数据网络连接等,上述有线的连接方式可以是固化线路连接、通用串行总线(Universal Serial Bus,USB)连接等。此外,获取模块的形式具体限定为与COVID-19肝损伤相关的ANGL3表达水平和性别变量。

预测模块2和获取模块1分别为处理器、服务器或电脑主机;或者,预测模块和获取模块集成于同一处理器、同一服务器或同一电脑主机。

其中,服务器可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如,本申请实施例中所描述的服务器包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。

所述处理器可以包括一个或多个处理核心,本申请实施例中所描述的处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecificIntegrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,优选地,所述处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。

在本申请的一个实施例中,如图4所示,COVID-19患者肝损伤发生风险的预测系统包括:服务器200和终端100,所述服务器200集成有获取模块和预测模块。服务器200与终端100之间可通过任何通信方式实现通信,包括但不限于,基于第三代合作伙伴计划(3rdGenerationPartnership Project,3GPP)、长期演进 (Long Term Evolution,LTE)、全球互通微波访问(Worldwide Interoperability for Microwave Access,WiMAX)的移动通信,或基于TCP/IP协议族(TCP/IP Protocol Suite,TCP/IP)、用户数据报协议(UserDatagramProtocol,UDP)的计算机网络通信等。

服务器200包括:多个处理器;一个存储器;以及多个应用程序,其中,多个应用程序被存储于存储器中并配置为由所述处理器执行。

存储器可以用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器例如可以主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。

终端100可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中终端100可以是台式机、便携式电脑、网络服务器、掌上电脑(Personal Dig italAssistant,PDA)、移动手机、平板电脑、无线终端设备、通信设备、嵌入式设备等,本实施例不限定终端100的类型。

本领域技术人员可以理解的是,服务器还可以包括电源、分析模块和输出模块中的一种或多种。所述电源用于给服务器的各个部件供电,优选地,电源可以通过电源管理系统与处理器逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。所述电源还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。分析模块用于接收输入的数字或字符信息,可以是键盘、鼠标、操作杆、人机交互激光笔等。输出模块用于将COVID-19患者的肝损伤风险参数可视化或音频化,可以是显示屏、打印机或音频输出装置。

需要说明的是,图1、图2、图4中示出的预测系统并不构成对本申请的预测系统的具体限定,所述预测系统可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

在本申请的一个实施例中,预测系统中的处理器会按照如下的指令,将多个应用程序的进程对应的可执行文件加载于所述存储器中,并由处理器来运行存储在存储器中的应用程序,从而实现各种功能,如下:

获取与COVID-19患者肝损伤相关的变量,所述变量包括血液中ANGL3表达水平和性别;以及

将获取的所述变量导入至预先建立的Cox回归模型中,通过该Cox回归模型计算得出风险概率参数,并可视化呈现预测结果。

下面通过具体实施例来说明本申请的预测系统。

实施例1:AS预测系统

本实施例提供了一种COVID-19患者肝损伤发生风险的预测系统,该预测系统为如图2中所示的预测系统,并且该预测系统基于ANGL3和性别(Sex)进行预测,因此,将该预测系统命名为AS预测系统。

AS预测系统预测COVID-19肝损伤发生率的方法包括如下步骤:

S1、提供COVID-19患者的离体样本(血清),对离体样本进行ANGL3蛋白浓度的测定,本实施例中采用的是TMT标记定量蛋白质组学检测技术,但所述蛋白浓度测定不限于蛋白质组学技术。

S2、将S1步骤确定的ANGL3蛋白浓度值和患者性别参数(男=1,女=2) 导入预先建立的Cox回归模型中,并基于Cox回归模型计算确诊后14天、21 天、28天、35天和42天的肝损伤发生风险概率。

其中,步骤S1的具体流程如下:

S11、对所有样本进行多肽提取;

S12、对所有样本进行除盐;

1)活化:甲醇

2)第一步平衡:乙腈,1次;1500rpm,2min

3)第二步平衡:乙腈,1次;1500rpm,2min

4)LOAD样本:将样本一次转移到除盐柱上,1000rpm,2min

5)除盐:乙腈,5次;1500rpm,2min

6)洗脱:乙腈,1次

S13、对所有样本进行悬干;

S14、对所有样本进行浓度测定,96孔板内加MS缓冲液后上机测浓度。

S15、TMT标记,本实施例共计660个样本,设计了44个BATCH进行TMT 标记

1)从这些样本中挑出100个,在0.6mL eppi中混到一起做pool;

2)将pool和这些样本在真空离心蒸发浓缩仪中悬干;

3)对于各样本,加入3μL TEAB用于复溶;对于pool样本,加入180μL TEAB 用于复溶;

4)将TMT 16plex试剂平衡至室温,离心,将粉末收集在离心管管底,用 ACN将试剂溶解,每个样本中加入2μL TMT试剂(Sample:TMT=1:8)。在pool 中加入120μL TMT-126;其中27个技术重复;

5)将样本放置在25℃,1200rpm的条件下孵育60min。

6)检测标记效率:

A)取一定量各样本,根据batch合并至装有羟胺的0.6mL离心管中,在 25℃,1200rpm条件下孵育15min,然后在真空离心蒸发浓缩仪中悬干;

B)在干燥样本中各加入一定量MS buffer复溶,涡旋,在15000g条件下离心15min,转移上清至样品瓶,用于后续LC-MS分析;

C)在pFind软件上搜索DDA文件,检查TMT标记效率,当K端标记率>90%, N-term标记率>99%时,认为标记成功。

7)终止反应:在每个标记合格的样本中加入羟胺,在25℃,1200rpm条件下孵育15min。

8)将标记合格的样本按照batch合并至新的1.5mL离心管中,在真空离心蒸发浓缩仪中悬干。

9)除盐:在50mg的C18除盐柱上进行如下操作

S16、分馏;

1)分馏柱:Waters C18 25cm,4.6mm,Buffer A:20mM甲酸铵,pH 10,Buffer B:20mM甲酸铵/98%乙腈pH10,梯度:35min,流速1mL/min,每分钟收集一个馏分;

2)合并馏分:将各样本的馏分等距混合成10个样本,并在真空离心蒸发浓缩仪中悬干,共得到440个干燥样本。

S17、上机(Orbitrap Exploris 480质谱仪);

将干燥样本用20μL MS buffer A复溶,涡旋,在15000g条件下离心15min,转移18μL上清至样品瓶,用于LC-MS分析。

S18、搜库;

LC-MS采集到的数据在Thermo Proteome Discoverer软件(v 2.4.0.305)上进行搜库。

原始数据共鉴定到1589个蛋白:过滤CON开头的污染蛋白后,蛋白数目为1589;过滤蛋白在所有样本表达量为NA的蛋白后,蛋白数目为1517。

S19、数据质控;

1)离群值处理:离群值为超出上四分位数或下四分位数2倍四分位距的观测值,由此计算出大于2.233的数据为离群值,并赋值为2.233。

2)批次效应矫正:使用limma(R)包的RemoveBatchEffect消除批次效应。

其中,Cox回归模型的建立方法包括如下步骤:

S21、从浙江大学医学院附属杭州市西溪医院、浙江省台州医院的生物库中分别获取109例和25例COVID-19患者的离体样本,将获取的离体样本置于-80℃或液氮中冷冻保存。在西溪医院的109例患者中,其中98例作为蛋白标志物发现队列,74例作为训练队列;在台州医院的25例患者中,其中13作为外部验证队列。具体分类详见下表1:

表1:134例患者分类情况一览表

蛋白标志物发现队列基线特征详见表2:

表2.蛋白标志物发现队列98例COVID-19患者的基线特征

训练队列基线特征详见表3:

表3:训练队列74例COVID-19患者基线特征

外部验证队列基线特征详见表4:

表4:外部验证队列13例COVID-19患者基线特征

S22、分析蛋白标志物发现队列的1517个蛋白质,通过随机森林算法筛选贡献度前20的蛋白标志物。

S23、分析临床数据,包括实验室检测信息、病史、人口统计学特征、临床症状等共计31个变量,与S22中的20个蛋白标志物,通过CoxBoost算法确定候选变量;最后通过Cox回归(与肝损伤独立相关,P<0.05)和Roc曲线下面积(计算肝损伤的AUC值>0.7)确定最终变量,对应如ANGL3和性别。

S24、采用训练队列的AS构建Cox回归模型。公式如下:

其中,

S25、采用外部验证队列验证Cox回归模型的有效性。

对于训练队列中的74例COVID-19患者,观察期内任一时间点的AUC值均介于0.6-0.8之间(图5),校准曲线斜率接近1(图6),决策曲线(临床净获益)表现良好(图7)。

根据图8,对于外部验证队列,当阈值分别设定为0.3,0.5和0.7时,AS 在不同时间点的预测准确率分别为69%,69%和73.8%(图8)。

综上所述,在训练队列和验证队列中,AS预测系统区分肝损伤患者和非肝损伤患者的准确度在70%左右,由训练队列和验证队列的预测数据充分说明了构建的所述Cox回归模型的有效性,由此可见,AS可以精确计算ALT、AST、GGT 和TBIL正常COVID-19患者的肝损伤风险概率,进而证明了本实施例的预测系统的有效性。

以上对本申请实施例所提供的一种针对肝功能指标正常新冠初治人群的肝损伤风险预测系统进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的技术方案及其核心思想;本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。

技术分类

06120115628199