掌桥专利:专业的专利平台
掌桥专利
首页

肝脏疾病的疾病分层及相关方法

文献发布时间:2023-06-19 13:46:35


肝脏疾病的疾病分层及相关方法

本申请要求2018年10月26日提交的第62/751,407号美国临时申请和2019年3月14日提交的第62/818,612号美国临时申请的权益,所述临时申请中的每一个均通过引用整体并入本文。

背景技术

肝活检组织的组织学检查可用于诊断NAFLD的阶段,并且已经建立了肝脏疾病诊断最佳实践指南。荟萃分析显示,在已知与NAFLD诊断相关的临床参数如NASH状态、NAS(NAFLD活动评分)和肝脏组织学特征中,纤维化分期可以是NAFLD患者死亡率和肝代偿失调时间的主要预测因素。因此,确定纤维化阶段的能力可用于管理患者健康。肝纤维化可分为四个阶段:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)。已经报道了数种评估NAFLD和相关纤维化的非侵入性方式。由患者年龄、天冬氨酸和丙氨酸转氨酶水平以及血小板计数的测量值衍生的FIB-4(纤维化-4)指数可用来预测纤维化。最近,VCTE(振动控制瞬时弹性成像)超声分析已被FDA批准用于准确评估肝纤维化状态。

本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

发明内容

本文公开了一种评估肝脏的疾病状态的方法。该方法可包括从受试者获得或已经获得样品,其中该样品包含基因表达产物,测量一组基因的基因表达产物,该基因小组(panel)包含选自表3、表4、表5、表6、表7和/或表10的至少一种基因,以及确定肝脏的疾病状态。所述至少一种基因可以是PITPNM2、LIMCHI1、FSCN1、CCND1或CASKIN2中的至少一种。所述样品可以选自唾液、血液、痰、尿液、精液、经阴道液、汗液、母乳、乳房液、粪便、细胞或组织活检物。所述样品可以是血浆。所述基因小组可包含至少5种基因。所述基因小组可包含至少50种基因。所述基因小组可包含至少100种基因。所述基因小组可包含至少200种基因。所述基因表达产物可以是蛋白质。所述基因表达产物可以是RNA。所述RNA可以是无细胞信使RNA。测量基因表达产物可包括测序、阵列杂交或核酸扩增中的一种或多种。测量基因表达产物可包括将无细胞信使RNA逆转录为cDNA,扩增cDNA以产生扩增的cDNA,并使用扩增的cDNA探测含有与肝脏疾病状态相关的基因转录物的微阵列。确定可包括经过训练的分类器,以生成指示肝脏疾病状态的样品分类。确定可包括经过训练的分类器,以生成指示肝脏疾病状态的样品分类。所述经过训练的分类器可由训练集训练,所述训练集包含来自具有经活检证实的肝脏疾病诊断的受试者的血液样品。所述疾病状态可选自:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)以及硬化(F4)。所述方法可进一步包括诊断肝脏疾病。所述方法可进一步包括开出疗程的处方。所述疗程可包括改变饮食、施用药物或施用膳食补充剂。所述疾病可以是非酒精性脂肪肝病(NAFLD)。所述疾病可以是非酒精性脂肪变性(NAFL)。所述疾病可以是非酒精性脂肪性肝炎(NASH)。

本文公开了一种处理或分析来自受试者的样品的方法,该方法包括:(a)从受试者获得或已经获得样品,其中该样品包含基因表达产物;(b)测定所述基因表达产物以产生对应于数据中一种或多种基因表达产物的表达水平的数据,其中所述一种或多种基因表达产物与肝脏疾病状态相关;(c)在程序化计算机中,将来自(b)的包括一种或多种基因表达产物的表达水平的数据输入到经过训练的分类器中,以生成指示肝脏疾病状态的样品分类;以及(d)以电子方式输出报告,该报告将所述样品分类标识为指示肝脏疾病状态。(b)的测定可包括测序、阵列杂交或核酸扩增中的至少一种。所述基因表达产物可以是无细胞信使RNA。所述样品可以选自唾液、血液、痰、尿液、精液、经阴道液、汗液、母乳、乳房液、粪便、细胞或组织活检物。所述样品可以是血浆。所述经过训练的分类器可由训练集训练,所述训练集包含来自具有经活检证实的肝脏疾病诊断的受试者的血液样品。所述基因表达产物可以是RNA。所述基因表达产物可以是mRNA。所述基因表达产物可以是无细胞mRNA。所述测序可包括将无细胞信使RNA逆转录为cDNA,扩增cDNA以产生扩增的cDNA,并使用扩增的cDNA探测含有与肝脏疾病状态相关的基因转录物的微阵列。所述一种或多种基因表达产物可在内皮细胞中高度表达。所述一种或多种基因表达产物可与血管发育、脉管系统和血管生成过程中的至少一种相关。所述测序可包括进一步包括下一代测序平台的全转录组分析。(b)的测定可进一步包括测定包含肝脏特异性转录物的基因表达产物。(b)的测定可进一步包括测定包含来自表7和/或表10的一种或多种基因的基因表达产物。所述一种或多种基因可以选自PITPNM2、LIMCH1、CCND1和CASKIN2。所述特定细胞类型可包括红细胞(RBC)、多形核白细胞(PMN)、血小板以及肝细胞、肝星状细胞、肝细胞。所述经过训练的分类器可包含逻辑回归模型。所述肝脏疾病状态可以选自:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)以及硬化(F4)。

本文公开了一种治疗肝脏疾病患者的方法,该方法包括(a)从所述患者获得或已经获得包含基因表达产物的生物样品;(b)对所述基因表达产物进行或已经进行分析,以确定所述患者是否患有肝脏疾病;以及(c)推荐针对所述肝脏疾病的治疗。所述分析可包括测序、阵列杂交或核酸扩增中的至少一种。所述基因表达产物可以是RNA。所述基因表达产物可以是无细胞mRNA。所述肝脏疾病可以选自:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)以及硬化(F4)。所述样品可以选自唾液、血液、痰、尿液、精液、经阴道液、汗液、母乳、乳房液、粪便、细胞或组织活检物。所述治疗可包括改变饮食、施用药物或施用膳食补充剂。所述方法可进一步在(b)中包括确定所述肝脏疾病的阶段。所述方法可进一步包括(d)施用所述治疗,以及(e)监测所述患者的肝脏疾病进展,其中所述生物样品是第一样品并且所述肝脏疾病的阶段是所述肝脏疾病的第一阶段,并且其中监测包括(i)从所述患者获得或已经获得包含基因表达产物的第二样品;(ii)对所述基因表达产物进行或已经进行分析,以确定所述肝脏疾病的第二阶段;以及(iii)将所述肝脏疾病的第一阶段与所述肝脏疾病的第二阶段进行比较。

本文公开了一种从生物样品确定肝脏疾病的系统,该系统包含(a)包含基因表达小组的分类器,所述基因表达小组进一步包含选自表3、表4、表5、表6、表7和/或表10的至少一种基因;以及(b)计算机系统,其被配置为将所述分类器应用于生物样品的基因表达谱。所述至少一种基因可包括PITPNM2、LIMCH1、FSCN1、CCND1和CASKIN2中的至少一种。所述分类器可包含来自表3、表4、表5、表6、表7和/或表10的至少两种基因、至少三种基因、至少四种基因或至少五种基因。所述基因表达谱可包含测序数据、阵列杂交数据或核酸扩增产物数据中的至少一种。所述基因表达谱可包含测序数据,并且进一步包含基因转录物的水平。所述基因表达谱可包含对应于无细胞mRNA的基因转录物水平的值。所述分类器可将对应于无细胞mRNA的基因转录物水平的值缩放(scale)到管家基因转录物水平。所述生物样品可以选自唾液、血液、痰、尿液、精液、经阴道液、汗液、母乳、乳房液、粪便、细胞或组织活检物。所述肝脏疾病可以选自:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)以及硬化(F4)。所述分类器可包含非负矩阵分解(NMF),以将所述基因表达谱的基因表达产物分类为与特定细胞类型相关。

本文公开了一种检测肝脏的疾病状态的方法,该方法包括:(a)确定从受试者获得的样品中一种或多种标志物的表达水平,其中所述一种或多种标志物选自表3、表4、表5、表6、表7和/或表10;以及(b)将所述表达水平与所述一种或多种标志物的参考水平进行比较;其中所述一种或多种标志物的表达水平相对于所述参考表达水平的升高或降低指示所述受试者具有疾病状态。所述参考水平可以是从健康对照受试者获得的,或是来自一组健康对照受试者的平均水平。所述疾病状态可以是以下至少一种:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)或硬化(F4)。所述方法可进一步包括从同一受试者获得两个或更多个样品,其中所述两个或更多个样品来自不同时间点,并且其中对所述两个或更多个样品中的每一个重复(a),并且其中在步骤(b)中比较所述两个或更多个样品中的每一个的表达水平。所述方法可进一步包括如果所述一种或多种标志物的表达水平相对于所述参考表达水平的升高或降低指示所述受试者具有疾病状态,则治疗所述受试者的疾病状态。所述治疗可以选自施用治疗剂、施用外科介入或其组合。所述治疗剂可以选自靶向脂质代谢、葡萄糖代谢的药物、靶向代谢僵化(inflexibility)的药物、靶向纤维化的药物、抗炎性化合物、乙酰辅酶A羧化酶抑制剂、OCA、elafibranor cenicrivaroc、维生素-e、吡格列酮(plioglitazoe)、PPAR激动剂、FXR激动剂、ASK-1抑制剂、成纤维细胞生长因子、胰岛素敏化剂或胆汁酸调节剂。所述手术介入可以选自与体重减轻相关的手术、肝切除术和肝移植。所述方法可进一步包括如果所述受试者的所述一种或多种标志物的表达水平相对于所述参考表达水平没有升高或降低,则将所述受试者置于非治疗类别中。

本文公开了一种检测肝脏的疾病状态的方法,该方法包括:(a)确定从受试者获得的样品中一种或多种标志物的表达水平,其中所述一种或多种标志物选自表3、表4、表5、表6、表7和/或表10;(b)将分类器算法应用于一种或多种标志物的表达水平和所述一种或多种标志物中每一种的参考水平,以计算量化所述一种或多种标志物中每一种的表达水平与参考水平之间的差异的度量;以及(c)基于所述度量确定肝脏的疾病状态。

本文公开了一种测定活性剂的方法,其包括(a)在第一时间点评估受试者的第一无细胞表达谱;(b)向受试者施用活性剂;以及(c)在第二时间点评估该受试者的第二无细胞表达谱。该方法可以进一步包括比较第一无细胞表达谱与第二无细胞表达谱。第一表达谱与第二表达谱之间的差异可指示治疗的效果。该活性剂可以是用于治疗疾病的药物化合物。该方法可以进一步包括在第三时间点评估该受试者的第三无细胞表达谱。评估可包括测序、阵列杂交或核酸扩增中的一种或多种。该方法可以进一步包括在另外的时间点评估该受试者的另外的无细胞表达谱。第二时间点可以是第一时间点之后一至四周。该方法可以进一步包括在12至24个月的时间段内评估另外的无细胞表达时间点。该时间段可以是约18个月。该方法可以进一步包括跟踪和/或检测一种或多种无细胞表达谱,以测量用于治疗和/或药物发现和/或开发的一种或多种感兴趣的靶标。该方法可以进一步包括在治疗和/或药物发现和开发期间测量用于先导物优化和/或临床开发的药效学。该方法可以进一步包括创建基因表达谱,以表征与用于治疗和/或药物发现和/或开发的特定靶标的参与(engagement)相关的一种或多种药效学效应。该方法可以进一步包括检测用于治疗和/或药物发现和开发的药效学靶标参与的变化。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图,将会对本发明的特征和优点获得更好的理解,在这些附图中:

图1A显示了每百万个中的测序转录物(TPM)与qPCR Ct值(61个个体中的96个基因)之间的比较。

图1B显示了在图1A中进行的下一代测序测定和qPCR之间的比较的示意图。

图2A显示了在测试的3个患者群组中的示例性关键患者临床肝脏疾病状态特征。

图2B显示了在测试的3个患者群组中的示例性关键患者临床纤维化阶段分解特征。

图2C显示了在测试的3个患者群组中的示例性关键患者临床脂肪变性特征。

图2D显示了在测试的3个患者群组中的示例性关键患者临床气球样变(ballooning)特征。

图3A显示了在测试的3个患者群组中另外的示例性关键糖尿病患者临床特征。

图3B显示了在测试的3个患者群组中另外的示例性关键BMI患者临床特征。

图3C显示了在测试的3个患者群组中另外的示例性关键炎症患者临床特征。

图3D显示了在测试的3个患者群组中另一个另外的关键血小板计数患者临床特征。

图3E显示了在测试的3个患者群组中另一个另外的关键AST患者临床特征。

图3F显示了在测试的3个患者群组中另一个另外的关键ALT患者临床特征。

图4A显示了使用Pearson相关性分析,表示技术重复的cf-mRNA转录组之间的相关性的直方图。

图4B显示了如通过ERCC转录物的拷贝数检测阈值测量的检测灵敏度的直方图。

图4C显示了观察到的和预期的ERCC参考基因表达水平之间的Pearson相关系数的直方图。

图4D显示了每个样品检测到的转录物数目(TPM>5)的直方图。

图5显示了使用主成分分析(PCA)分析的样品内与样品间cf-mRNA谱变异性;在这种情况下,从训练群组中随机选择的20个样品的基因表达PCA的前两个成分(PC1和PC2)(5个个体代表:非肝脏疾病、NAFL、低纤维化NASH和高纤维化NASH肝脏疾病类别),其中灰点代表技术重复1,黑色点代表同一血清样品的重复2,同一样品的重复彼此接近。

图6A显示了描绘NASH与健康对照之间cf-mRNA的差异表达分析的火山图。显著失调的基因显示在虚线框中,FDR<0.05和变化倍数>1.4用作截止标准。

图6B显示了使用NASH中显著失调的基因鉴定的前5个上调和下调的经典途径的图示。黑色垂直虚线代表显著性阈值(调整后的p<0.05)。

图6C显示了散点图,其证明与正常对照相比,NASH患者中肝脏特异性转录物水平的系统性上调。

图6D显示了所有样品的一致性矩阵非负矩阵分解(NMF)聚类,进行了基因簇的功能分析并且相应地标记了五个主要簇。

图6E显示了火山图,其描绘了与具有早期纤维化的患者相比,具有晚期纤维化的NAFLD患者中差异表达的基因。黑色水平虚线代表显著性阈值(调整后的p<0.05)。

图6F显示了纤维化阶段F3/F4患者的cf-RNA中上调的基因富集的排名前列的途径。黑色垂直虚线代表显著性阈值(调整后的p<0.05)。

图7显示了在图6D RNA中鉴定的成分6中肝脏特异性基因的示例性富集,标记为肝脏的行用围绕‘肝脏’的框标记。

图8A是如本文实施方案中公开的研究设计的示意图。

图8B显示了使用来自训练群组的血清样品区分NAFL与健康对照的基于cf-mRNA的分类器的ROC曲线,其中阴影区域代表由迭代交叉验证生成的AUC标准误差。

图8C显示了使用来自训练群组的样品区分NASH与健康对照的cf-mRNA分类器的ROC曲线,其中阴影区域代表由迭代交叉验证生成的AUC标准误差。

图8D显示了使用来自训练群组的样品部分来区分NASH与NAFL的cf-mRNA分类器的ROC曲线,其中阴影区域代表由迭代交叉验证生成的AUC标准误差。

图9A显示了使用训练群组中的样品区分“早期”(F0,F1)与“晚期”纤维化(F3,F4)的cf-mRNA分类器的ROC曲线。训练群组数据集中的误差条代表由迭代交叉验证生成的AUC标准误差。

图9B显示了本文公开的另一个示例性纤维化分类器;在这种情况下,NAFL肝脏疾病分类器在3个患者群组中对纤维化分期“早期”(F0,F1)与“晚期”纤维化(F3,F4)进行分层的性能。训练群组数据集中的误差条代表由迭代交叉验证生成的AUC标准误差。

图9C显示了本文公开的又一个示例性纤维化分类器;在这种情况下,NAFL肝脏疾病分类器在3个患者群组中对纤维化分期“早期”(F0,Fl)与“晚期”纤维化(F3,F4)进行分层的性能。训练群组数据集中的误差条代表由迭代交叉验证生成的AUC标准误差。

图10A显示了示例性的5基因分类器AUC;在这种情况下,使用采用逻辑回归模型的5基因模型的纤维化阶段分类(F0、F1与F3、F4)。

图10B显示了纤维化阶段的示例性cf-mRNA基因表达。

图10C显示了纤维化阶段的又一个示例性cf-mRNA基因表达。

图10D显示了纤维化阶段的又一个示例性cf-mRNA基因表达。

图10E显示了纤维化阶段的又一个示例性cf-mRNA基因表达。

图10F显示了纤维化阶段的又一个示例性cf-mRNA基因表达。

图11显示了在晚期纤维化中上调的排名前列的信息性纤维化分类器基因富集于NMF衍生的成分10中;在这种情况下,纤维化分类器中50个最具信息性的基因的负载分数,这些基因在晚期纤维化中上调,分布在所有12种NMF衍生的成分中。

图12显示了富含内皮细胞转录物的成分10基因(Blueprint数据库)。

图13A显示了第一个体的cf-mRNA部分相对于外周血区室中内皮基因的富集;在这种情况下,来自非肝脏病变个体的血浆与外周血部分中NMF衍生的成分10的基因表达。显示了成分负载分数>0.45且TPM>8的基因。

图13B显示了第二个体的cf-mRNA部分相对于外周血区室中的富集;在这种情况下,来自3个非肝脏病变个体的血浆与外周血部分中NMF衍生的成分10的基因表达。显示了成分负载分数>0.45且TPM>8的基因。

图13C显示了第三个体的cf-mRNA部分相对于外周血区室中基因的富集;在这种情况下,来自3个非肝脏病变个体的血浆与外周血部分中NMF衍生的成分10的基因表达。显示了成分负载分数>0.45且TPM>8的基因。

图14A显示了示例性研究设计的示意图。

图14B,来自图9A的基于cf-mRNA的分类器对NAFL/NASH患者中纤维化分层的验证,显示了cf-mRNA分类器的ROC曲线。

图14C显示了纤维化分类器群组分解和性能的表格总结。

图15A显示了ERCC中掺加的预期拷贝数与其观察到的表达水平(TPM)之间的相关性。

图15B显示了跨外显子-内含子连接的平均读取覆盖的图示。

图16A显示了描绘NAFL与健康对照之间cf-mRNA的差异表达分析的火山图。显著失调的基因用灰色正方形表示,FDR<0.05和变化倍数>1.41用作截止标准。

图16B显示了使用NAFL中显著失调的基因鉴定的最显著富集的途径的图示。黑色垂直虚线代表显著性阈值(调整后的p<0.05)。

图16C显示了来自正常对照和NASH患者的血清中三种肝脏特异性转录物的表达水平的图示。

图16D显示了在具有不同肝脏疾病状态的受试者中检测到的肝脏特异性基因数目的图示。

图16E显示了根据纤维化阶段的FSCN1表达水平的图示。

图16F显示了与肝小叶炎症评分相关的炎症组成部分内的基因系数图。

图17显示了分类器区分NASH与NAFL的性能,特别是在轻度纤维化(F0-F1)患者中,显示了区分NASH与低纤维化NAFL患者的分类的平均ROC曲线。

图18显示了用于区分纤维化阶段F2或更高阶段的NASH患者与NAFL患者和纤维化

具体实施方式

循环无细胞信使RNA(cf-mRNA)监测可用于基于血液的肝脏疾病诊断,以阐明不同的生物学环境。cf-mRNA可以表现出与肝脏疾病状态相关的快速转录改变,并提供对潜在分子肝脏疾病机制的深入了解。为了获得对NAFLD阶段的生物学和诊断的了解,可以使用内部开发的NGS(下一代测序)测定,在临床上表征的NAFLD患者群组中进行全转录组无循环信使RNA(cf-mRNA)表达分析。对于这些研究,对来自3个患者群组的369名受试者和来自2个患者群组的303名受试者进行了测试,以证明诊断NAFL和NASH肝脏疾病状态并按纤维化阶段对肝脏疾病进行分层的能力。此外,数据表明,NAFLD的进展可能受到参与肝星状细胞活化、FXR/RXR信号传导、炎症的途径,参与葡萄糖、甘油三酯、胆固醇等的代谢的肝脏特异性途径,内皮血管发育和适应性免疫的调节。本文公开了可以利用全转录组cf-mRNA测定对NAFLD进行诊断和分层并阐明肝脏疾病机制的系统和方法。

本文公开了可以利用全转录组cf-mRNA测定来诊断NAFLD及其阶段并通过肝纤维化分期对NAFLD患者进行分层并阐明肝脏疾病机制的系统和方法。肝纤维化可分为五个阶段:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)。

本文所述的系统和方法可以使用利用直接从样品测量cf-mRNA的测定。该样品可以是唾液、血液、痰、尿液、精液、经阴道液、汗液、母乳、乳房液、粪便、细胞或组织活检物。该样品可以是血浆。该样品可以是血清。

本文公开的方法可以在具有诸如血清储存持续时间(在-80℃下储存长达9年)、溶血水平和细胞污染等不同特征的多个患者群组中具有低样品失败率和优异性能。

本文所述的方法、系统和试剂盒可以涉及使用标志物类型的组合快速、非侵入性检测受试者的肝脏疾病阶段或状况,以便同时确定肝脏疾病的可能阶段,同时考虑由血管生成和参与伤口愈合、肝星状细胞活化、肝纤维化、炎症、肝脏特异性代谢途径如FXR/RXR信号传导、LXR/RXR、急性期反应、PI3K/AKT信号传导和新血管形成的分子过程所带来的基因表达变化。在一些实施方案中,包含基因小组的分类器可应用于受试者的cf-RNA表达谱,该基因小组包含已知在与血管生成和内皮血管发育相关的纤维化中上调的基因。通过本文公开内容的实践,人们可能能够对肝脏疾病身份及其对一种或多种组织的影响程度作出确信的预测,而不需要对组织或怀疑受到影响的组织进行任何侵入性研究。

可以使用分类器来执行本文所述的方法。分类器可包含基因小组(基因小组在本文中与一组基因可互换使用)。分类器可以在用来自已知肝脏疾病阶段的受试者的临床验证样品的样品训练后定义基因小组。样品可以来自经临床验证为具有以下肝脏疾病阶段的受试者:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)。该基因小组可包括以下一种或多种:UGT3B10、KNG1、HRG、CFHR3、ANGPTL3、MTTP、HPD、RTP3、FGG、FGA、FGB、APOC4-APOC2、CFHR1、SERPINA3、RP11-400G3.5、RP4-608O15.3、UGT2B15、CFHR2、ANG、SPP2、HAMP、LECT2、SERPINA6、CPB2、CYP8B1、APCS、C8A、RBP4、IGSF23、SLCO1B3、HABP2、ZNF865、C9、AADAC、FNDC5、SERPINC1、APOA2、F9、ORM2、APOB、CYP2C9、SAA4、INS-IGF2、G6PC、AHSG、THRSP、AFM、SERPIND1、HSD11B1、AMBP、BCAS3、CR1、TRMT112、KIZ、HAUS3、TMEM64、DDX3X、MYL4、PPP3CA、TPD52、CDR1-AS、CRYBG3、WDR81、EIF4G1、AQP3、APOA1、INSR、PLPP3、NAA20、HP、HECTD4、ST6GALNAC4、TUSC2、TRDMT1、KIFAP3、ADAM19、CALM2、RBFOX2、NR1D1、PDE4A、SLC25A38、NDFIP1、ZC3HAV1、AQP1、CELF2、CLSPN、ZNF333、SMU1、LY86、TOX、ALB、RNF123、ALAS2、CCNI、ZMAT3、MAP4K4、ZCCHC3、PER1、SLFN11、BET1L、APOH、XBP1、DHX38、ETFB、GCOM1、HSPG2、SAMD4A、CSTB、VAT1、VAMP3、POLD4、USP31、SLFN14、ALDOB、FAM195B、DDX39A、CUL4A、FN1、SEPN1、APOB、MT2A、EIF2D、NAP1L4、DRG1、KLHL5、SGK1、RPS13、NDUFB1、GRB10、LBR、MRPL41、PTBP3、SDHC、ALOX5、ARHGAP35、REV3L、VWF、HIST1H4I、TNS2、UZCRQ、DNASE1L3、NCL、RAB11B、SGTA、CDC37、PRR14L、ZFAND6、FGL2、OAS2、AKR1A1、PGK1、CCDC50、POLR2C、MLF2、ALDH2、RABIF、MCFD2、B3GNT8、AAK1、BAK1、GCA、BTBD9、SAFB2、KIFC3、PRDX6、LRRC4、ZNF426、VASH1、PDE8A、KIZ、HBA2、ZCCHC9、AHNAK、PRMT7、STT3A、FAM213A、NUDT9、TPGS2、SELPLG、DHRS13、MACF1、TBC1D22B、RIOK3、MOSPD3、MET、PNPO、TYK2、IKZF3、SHQ1、PRP4、C16orf62、AKAP13、UBE2Z、SLC15A3、DCAF12、SERPINB9、CDK4、KNG1、TNFAIP8L1、E2F1、CDC42EP1、INMT、NT5DC2、FSCN1、EVA1B、MLKL、ZNF462、DRAM1、TRIB3、LZTR1、EPB41L4A、RNF25、FAM127B、ZNF438、ACAD9、RASAL2、ANKRD55、WBP5、KCTD13、CD33、FMNL2、RP11-400F19.6、GRAMD4、PLCB3、GALNT10、KALRN、CTTNBP2NL、ING5、MYO10、NOVA2、AGPAT5、IFFO1、ZHX3、FRMD3、HYAL2、C8orf4、ANKRD46、GNA12、CREB3L2、ZNF561、TOR1AIP1、FEZ1、PSMB5、SEH1L、NCKAP5L、MLLT4、RBPMS、FAM114A1、MLLT4、FSCN1、MYO10、GNA12、RDX、FRMD3、BTBD6、MTSS1L、PLEKHA4、HECW2、TRAF3IP1、NDFIP1、ATXN1L、MTMR2、NUTF2、C16orf62、CTNNA1、PPP1R14B、ZNF362、ZNF358、PFKL、TSTA3、LIMCH1、SHANK3、RABGEF1、PDE2A、SNX8、TBC1D9、PITPNM3、METTL9、MAF、TRIO、MINK1、CKDAL1、TGM2、KIAA0355、PXK、CASKIN2、PEA15、CPOX、FBXW5、PNPLA6、SH3PXD2A、SAV1、TSC22D1、AKR1B1、ITSN1、BTBD1、ABCC1、CRHBP、ZNF366、DNASE1L3、FSCN1、TRIP10、ZN608、ACTA2、CCDC80、ADAMT21、IGFBP4、DDR2、HID1、RAPGEF3、AFAP1L1、IL33、PDE2A、GASH1、FEZ1、FERMT2、MAP1B、DLC1、KIAA1462、DPYSL3、PHLDB1、CNN3、CCND1、CDC43IP1、AMOTL2、PTRF、HECW2、MYH10、S100A16、RASIP1、ROBO4、TEAD2、PLK2、MAMA4、BCL6B、KDR、ADGRF5、ARHGEF15、FGD5、SHE、ECSCR、CALCRL、MPDZ、LDB2、APBB2、PTPRB、ARHGAP29、RAI14、TJP1、AKAP12、MYO10、WWTR1、MYO6、SASH1和SEPT10。

在与基因小组进行比较后,可以通过进行有监督或无监督的聚类如非负矩阵分解来进一步分析cf-mRNA表达水平。基因小组中基因的功能类别可以是肝星状细胞活化、LXR/RXR信号传导、成年_内皮_祖细胞、备选_活化的_巨噬细胞、带状_嗜中性粒细胞、母细胞形成单位_红系、CD14-阳性_cd16-阴性_经典_单核细胞、CD3-阴性_cd4-阳性_cd8-阳性_双_阳性_胸腺细胞、CD3-阳性_cdr-阳性_cd8-阳性_双_阳性_胸腺细胞、CD34-阴性_cd41-阳性_cd43_阳性_巨核细胞_细胞、CD38-阴性_幼稚_b_细胞、CD4-阳性_alpha_beta_thermocyte、CD4-阳性_alpha_beta_t_细胞、Cd8-阳性_alpha_beta_thermocyte、CD8-阳性_alpha_beta_t_细胞、中央_记忆_cd4-阳性_alpha_beta_t_细胞、中央_记忆_cd8-阳性_alpha_beta_t_细胞、类别_切换的_记忆_b_细胞、集落_形成_单位_红系、普通_淋巴样_祖细胞、普通_髓样_祖细胞、常规_树突_细胞、细胞毒性_cd56-dim_自然_杀伤_细胞、效应_记忆_cd4-阳性_alpha_beta_t_细胞、效应_记忆_cd8-阳性_alpha_beta_t_细胞、效应_记忆_cd8-阳性_alpha_beta_t_细胞_终末_分化的、脐静脉_内皮_细胞_(增殖)、脐静脉_内皮_细胞_(静息)、成红血细胞、生发_中心_b_细胞、粒细胞_单核细胞_祖细胞_细胞、造血_多能_祖细胞_细胞、造血_干_细胞、未成熟_常规_树突_细胞、炎性_巨噬细胞、晚期_嗜碱性_和_多染性_成红血细胞、b_谱系_淋巴细胞、巨噬细胞、成熟_常规_树突_细胞、成熟_嗜酸性粒细胞、成熟_嗜中性粒细胞、巨核细胞-红系_祖细胞_细胞、记忆_b_细胞、骨髓_间充质_干_细胞、单核细胞、骨髓_单核_细胞_幼稚_b_细胞、neuroplastic_浆_细胞、嗜中性_晚幼粒细胞、嗜中性_nyelocyte、破骨细胞、外周_血_单核_细胞、浆_细胞、调节性_t_细胞和分叶核_嗜中性粒细胞_骨髓、未切换的_记忆_b_细胞。

在多个实施方案中,单个标志物和源自样品的聚集RNA可以均被考虑作为肝脏疾病阶段或状况的指示物。备选地或组合地,可以包括循环DNA,如以肝脏疾病阶段相关方式差异甲基化的DNA,作为肝脏疾病阶段相关标志物的一部分或全部。

同时,也可以测量指示肝脏疾病阶段或状况的标志物。广泛范围的标志物被考虑作为肝脏疾病阶段或状况的指示,包括蛋白质、类固醇、脂质、胆固醇或诸如DNA或RNA等核酸。RNA,如编码与肝脏疾病阶段或状况有关的蛋白质的特定转录物,可能是有用的,具有指示肝脏疾病阶段的甲基化模式的DNA也是如此。通常,但不总是,肝脏疾病阶段标志物也可以是容易通过例如抽血获得的循环标志物。然而,也考虑备选方案如超声、CT扫描、MRI或其他数据作为一些肝脏疾病的标志物。

通过将这些标志物的水平或身份与肝脏疾病阶段或状况的阶段(例如,NALF、没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)、NASH)的参考值或数据集进行比较),可以将患者或患者样品分类为指示患者的特定肝脏疾病阶段或状况。参考值或数据集可根据肝脏疾病阶段或状况而不同,并且可以不同地包括来自一个或多个健康个体、具有不同阶段的病症或组织胁迫的一个或多个个体的数据,来自中间个体的数据,和/或从模型预测的数据。当样品的值单独或共同地高于或低于阈值时,或者当它们与同肝脏疾病阶段或状况相关的参考数据集没有显著差异时,或者当它们与同缺乏肝脏疾病阶段或状况相关的参考数据集有显著差异时,可以将该样品分类为指示肝脏疾病阶段或状况。

例如,本文所述的方法、系统和试剂盒可用来常规地在高危人群中筛查肝脏疾病阶段、状况或多种状况的发展或进展。这对于具有慢性状况如代谢综合征、NAFLD、硬化性胆管炎、胆道阻塞、肝细胞癌、肥胖症、糖尿病或者其中一种或多种组织处于损伤、损害或衰竭风险中的受试者可能是有用的。

代谢综合征和肥胖症影响全世界庞大且比例不断增长的群体。该群体可能处于发生危及生命的并发症如肝硬化的持续且相对较高的风险中。因此,该群体可能处于在一系列器官和组织中发生并发症的持续风险中。在这些情况下,使用传统方法如成像技术和活检常规地评估受试者可能是不切实际的。然而,方法、系统和试剂盒,如本文所述的那些,可允许快速检测受试者的一个或多个器官中的损伤、增加的风险和治疗效果,从而提供了监测具有慢性状况的受试者的急性并发症、肝脏疾病阶段进展和治疗效果的手段。

本文所述的方法、系统和试剂盒可允许检测或量化与肝脏疾病阶段的分子途径相关的一组多核苷酸和/或标志物。基因表达可以在受试者群体内和受试者群体之间(例如,在不同族群之间)发生巨大变化,并且在这类情况下,一组肝脏疾病阶段特异性多核苷酸和/或标志物可能是有用的。虽然每个肝脏疾病阶段相关多核苷酸和标志物的表达水平可能不相似,但如果该小组与鉴定的基因小组足够相似或明显不同,则仍可对受试者的状况或组织作出结论或推论。以这种方式,小组可以提供优于使用单一肝脏疾病阶段标志物或单一疾病相关多核苷酸的优点。在一些情况下,所述方法可包括将受试者在第一时间点的cf-mRNA表达小组与该受试者在第二时间点的cf-mRNA表达小组进行比较。因此,可以控制单个受试者的自然遗传变异和基因表达波动,并且小组间的差异更可能是由于受影响的状况或组织的变化造成的。在一些情况下,该小组可包含非多核苷酸分子。该小组可包含多核苷酸和其他生物分子(例如,肽、脂质、病原体片段等)。

本文所述的方法、试剂盒和系统可用来确定受试者发生肝脏疾病阶段或状况的可能性或风险,肝脏疾病或状况的进展或严重程度,或者疗法或治疗对肝脏疾病或状况的效果。本文公开的试剂盒、系统和方法可能足够灵敏和准确,足以将标志物或肝脏疾病阶段相关多核苷酸的第一水平与该标志物或肝脏疾病阶段相关核酸的第二水平进行比较,以便区分状况的风险、状况的进展阶段或治疗对状况的改善。在一些情况下,标志物或肝脏疾病阶段相关核酸的第一水平可对应于在第一时间点来自受试者的样品,而标志物或肝脏疾病阶段相关核酸的第二水平可对应于在第二时间点来自受试者的第二样品。

可以使用本文公开的试剂盒、系统和方法同时评估肝脏疾病的阶段和受影响的组织。以这种方式,本文公开的试剂盒、系统和方法可用来评估至少一种状况的存在或不存在,并鉴定受影响和未受影响的组织。在一些实施方案中,方法可包括基于通过本文公开的方法、系统或试剂盒产生的结果来选择或推荐医疗行为。在一些实施方案中,基于该确定,可推荐并且/或者采取定制的医疗行为。在一些情况下,定制的医疗行为可包括直接治疗患病的肝脏,例如,通过手术或药物干预。药物干预可包括靶向脂质代谢、葡萄糖代谢的药物、靶向代谢僵化的药物、靶向纤维化的药物、抗炎性化合物、乙酰辅酶A羧化酶抑制剂、OCA、elafibranor cenicrivaroc、维生素-e、吡格列酮、PPAR激动剂、FXR激动剂、ASK-1抑制剂、成纤维细胞生长因子、胰岛素敏化剂或胆汁酸调节剂。医疗行为的非限制性实例包括进行另外的测试(例如,活检、成像、手术等),治疗受试者的肝脏疾病阶段或状况,以及改变受试者的治疗(例如,改变药物组合物的剂量、停止药物组合物的给药、施用不同的或另外的药物组合物等)。

本文公开的系统、方法和试剂盒可允许检测肝脏疾病的阶段。在一些情况下,受试者可具有已知影响肝组织健康的状况,这取决于该状况的程度或严重程度。系统、方法和试剂盒,如本文公开的那些,可允许鉴定和靶向治疗肝脏疾病的阶段。例如,本文公开的系统可提供对用于检测受试者中的炎症并且由于循环肝脏特异性RNA和肝脏疾病阶段特异性RNA的水平而确定肝脏受到炎症影响的标志物的分析。

所述方法可以进一步允许鉴定或区分导致肝损伤的状况,例如BMI与已知的肝脏疾病。如本文所述,鉴定或区分组织变化和肝脏疾病可以取决于量化(例如,不仅仅是检测)疾病相关RNA和量化肝脏疾病的标志物。作为非限制性实例,本文公开了用于检测受试者的肝脏疾病、鉴定引起肝脏疾病的状况、选择治疗受试者的疗法和监测疗法有效性的方法。对应于本文公开的基因,例如PITPNM3、LIMCH1、FSCN1、CCND1或CASKIN2的无细胞RNA可以在受试者的血浆样品中定量。血浆样品中此类RNA的差异表达可指示存在肝损伤。然后可以根据纤维化阶段相关基因的已知表达谱调整受试者的无细胞RNA表达数据。然后可以基于调整后的表达谱进行疗程或诊断。

可以在肝脏疾病的早期阶段确定受试者中肝脏疾病的存在和位置,因为本文所述的系统和方法可提供快速结果、是非侵入性的且便宜的。因此,可以在肝脏疾病进展到与早期阶段相比可能相对更难控制或治疗的晚期阶段之前治疗受试者。例如,本文公开的系统和方法可允许在疾病进展到足以用诸如CT或PET扫描等成像技术可视化之前确定肝纤维化的早期阶段。以这种方式,本文公开的方法和系统可在肝脏疾病的早期阶段提供集中分析和靶向治疗,如药物干预或饮食限制。

所述方法和系统可提供采用对组织损伤程度而言合适或最佳的疗法进行治疗。在一些情况下,该方法可包括对标志物和/或疾病相关多核苷酸进行检测/定量,以评估疗法的有效性或毒性。在一些情况下,该疗法可以继续。在其他情况下,可以停止和/或用另一种疗法替换该疗法。无论如何,由于所述方法和系统的快速和非侵入性质,相对于常规治疗优化,可以更频繁地评估并优化治疗效果。

在一些方面,本公开可提供本文公开的系统、样品、标志物和多核苷酸在确定对用来治疗受试者的肝脏疾病阶段或状况的疗法的反应中的用途。在一些情况下,可以确定在临床前靶标发现中对治疗剂的反应。确定反应可包括确定靶分子在临床前测量中的参与。在一些情况下,可以优化后期评价期间的先导疗法,以供进一步的临床开发。评价可包括制定终点,从而为治疗剂的相对治疗功效设定基准。基准可包括开发cf-mRNA特征以评价治疗剂的毒性。

在一些方面,本公开可提供本文公开的系统、样品、标志物和多核苷酸的用途。在一些情况下,本文公开了体外样品用于非侵入性地检测受胁迫的受试者中的组织或器官以及可能是胁迫原因的肝脏疾病阶段或状况的用途。在一些情况下,本文公开了离体样品用于非侵入性地检测受胁迫的受试者中的组织或器官以及可能是胁迫原因的肝脏疾病阶段或状况的用途。通常,本文公开的用途包括对样品(包括离体样品和体外样品)中的标志物和多核苷酸进行定量。本文公开的一些用途可包括比较第一样品中标志物的量、肝脏疾病阶段相关多核苷酸的量和多核苷酸的量,并将这些量与第二样品中的相应量进行比较。在一些情况下,第一样品来自第一受试者,而第二样品来自对照受试者(例如,健康受试者或具有状况或数据的受试者,该数据获自具有BMI的受试者,其包括受试者的BMI)。在一些情况下,第一样品来自第一时间点的受试者,而第二样品来自第二时间点的同一受试者。可在对受试者施用疗法之前获得第一时间点,并且可在该疗法之后获得第二时间点。因此,本文还提供了样品、标志物、疾病相关多核苷酸、基因小组、分类器、试剂盒和系统的用途,其可用来监测或评价受试者的状况、受试者的组织健康状态或治疗剂的效果。

提供以下描述来帮助理解本文公开的方法、系统和试剂盒。本文使用的术语的以下描述并非旨在限制这些术语的定义。在整个本申请中进一步描述并举例说明这些术语。

本文所述的方法、系统和试剂盒通常对无细胞核酸进行检测和定量。由于这个原因,本文所述的生物样品通常是无细胞生物流体。作为非限制性实例,来自受试者的样品可以是从中去除细胞的血液、血浆、血清、尿液或脊髓液。例如,生物分子可以在受试者的血流中循环,因此可以使用检测试剂对来自受试者的血液或血清样品中的标志物进行检测或定量。除非另有说明,否则术语“血浆”和“血清”在本文中可互换使用。然而,在一些情况下,它们被包括在单个样品物质列表中,以表明两者均被本说明书或权利要求所涵盖。

如本文所用的,术语“疾病阶段相关的多核苷酸”通常是指主要与疾病阶段相关地表达的多核苷酸。本文考虑主要与疾病(如肝脏疾病、心脏病等)阶段相关地表达的多核苷酸。通常,本文公开的方法、系统和试剂盒利用无细胞、疾病相关的多核苷酸。本文所述的无细胞、肝脏疾病阶段相关多核苷酸是以在肝组织损伤时可在生物流体中进行定量的水平表达的多核苷酸。在一些情况下,本文公开的无细胞、肝脏疾病阶段相关多核苷酸在生物流体中的存在是由于在肝脏损伤时释放无细胞、肝脏疾病阶段相关多核苷酸,而不是由于无细胞、肝脏疾病阶段相关多核苷酸的表达的变化。本文公开的无细胞、肝脏疾病阶段相关多核苷酸水平的升高可指示肝脏损伤。在一些情况下,本文公开的无细胞多核苷酸可以在数种组织中表达/产生,但在这些组织的至少一种中以本文定义的肝脏疾病阶段相关水平表达/产生。在一些情况下,本文公开的无细胞多核苷酸可以是肝脏特异性转录物,如MASP2、C8A、C8B、A NGPTL3、APCS、CRP、APOA2、NR1I3、FMO3、SERPINC1、CFHR1、CFHR2、C4BPB、C4BPA、GCKR、PROC、CPS1、SPP2、AGXT、CYP8B1、RTP3、SLC38A3、ITIH1、ITIH3、ITIH4、CP、TM4SF4、SLC2A2、AHSG、FETUB、HRG、KNG1、CPN2、UGT2B10、UGT2B4、GC、ALB、AFM、HSD17B13、ADH4、ADH6、ADH1A、FGB、FGA、FGG、TDO2、F11、C9、ACOT12、LEAP2、LECT2、F12、APOM、CFB、SLC22A7、SLC22A1、PLG、IGFBP1、PON1、PON3、AKR1D1、FGL1、TTPA、BAAT、AMBP、ORM1、ORM2、C5、C8G、AKR1C4、ITIH2、MBL2、MAT1A、RBP4、CYP2C9、CYP2C8、ABCC2、HABP2、CYP2E1、INS-IGF2、HPX、SAA4、SAA2、SAA1、F2、APOA5、APOC3、APOA1、TTC36、SLC38A4、HSD17B6、RDH16、INHBE、PAH、SDS、HPD、CPB2、ANG、SERPINA10、SERPINA6、SERPINA1、ACSM5、TAT、HP、CA5A、GLTPD2、ASGR2、ASGR1、VTN、PIPOX、G6PC、APOH、TTR、CYP2A6、CYP2B6、APOC4、APOC2、ATF5、HAO1、LBP、FTCD、SERPIND1、UPB1或F9。

在一些情况下,本文公开的无细胞多核苷酸可富集于肝脏相关途径,例如,参与胆固醇、甘油三酯和葡萄糖代谢的多效性LXR/RXR和FXR/RXR信号传导途径,以及反映肝损伤和/或炎症的急性期反应。肝脏相关途径可包括PI3K/AKT信号传导、IGF-1信号传导、肝纤维化/肝星状细胞活化、ILK信号传导、IL-7信号传导途径、IL-3信号传导、VEGF信号传导、蛋白激酶A信号传导、EIF2信号传导、FXR/RXR活化、急性相位响应信号传导、eIF4和p70S6K信号传导的调节、LXR/RXR活化、mTOR信号传导、补体系统、Sirtuin信号传导途径、凝血系统、PXR/RXR活化、尼古丁降解II、丙酮降解I(为丙酮醛)、尼古丁降解III、褪黑激素降解I、LPS/IL-1介导的RXR功能抑制、叶酸多聚谷氨酰化、胆汁酸生物合成、中性途径、B细胞发育、整联蛋白信号传导、肝配蛋白受体信号传导、Rho家族GTP酶引起的信号传导、PPARα/RXRα活化、NFAT在调节免疫应答中的作用、ERK/MAPK信号传导、IL-1信号传导、褪黑激素降解的超级途径、PXR/RXR活化、尼古丁降解II、LPS/IL-1介导的RXR功能抑制、胆汁酸生物合成、中性途径、动脉粥样硬化信号传导、氧化磷酸化、巨噬细胞中的IL-12信号传导和产生、整联蛋白信号传导、肌动蛋白细胞骨架信号传导、上皮粘附连接信号传导、PAK信号传导、蛋白激酶A信号传导、ILK信号传导、ARP-WASP复合物引起的肌动蛋白成核、PI3K/AKT信号传导、白细胞外渗信号传导、CXCR4信号传导、ERK/MAPK信号传导或IL-8信号传导。

在一些情况下,本文公开的无细胞多核苷酸可源自肝脏中的肝细胞。在一些情况下,本文公开的无细胞多核苷酸可以是肝脏特异性转录物,如表6中列出的那些。在一些情况下,无细胞多核苷酸可源自肝星状细胞活化(P13K/AKT信号传导途径),后者是肝纤维化的中心生物学事件。在一些情况下,无细胞多核苷酸可源自肌动蛋白成束蛋白。在一些情况下,无细胞多核苷酸可源自负责调节胶原蛋白和基质金属蛋白酶表达的蛋白质。在一些情况下,无细胞多核苷酸可源自炎性过程,如干扰素信号传导。在一些情况下,无细胞多核苷酸可源自在早期和晚期纤维化之间差异调节的经典途径,如图6F中列出的那些。在这些情况下,无细胞、肝脏疾病阶段相关多核苷酸的绝对量或相对量可指示对肝脏或对组织或器官集合的损害。

备选地或者另外地,肝脏疾病阶段相关多核苷酸可以是具有肝脏疾病阶段相关修饰的核酸。作为非限制性实例,本文公开的肝脏疾病阶段相关多核苷酸或标志物可包括具有肝脏疾病阶段相关甲基化模式的DNA分子(例如,基因的一部分或非编码区)。换句话说,所述多核苷酸和标志物可以在许多组织中类似地表达,或者甚至在整个受试者中普遍表达,但是所述修饰可以是肝脏疾病阶段相关的。通常,本文公开的肝脏疾病阶段相关多核苷酸或其水平对肝脏疾病是特异性的。通常,本文公开的肝脏疾病阶段相关多核苷酸编码参与肝脏疾病机制或分子途径的蛋白质。

如本文所用的术语“标志物”通常包括多种生物分子。标志物在本文中也可被称为肝脏疾病阶段标志物或肝脏疾病阶段的标志物。在一些情况下,该标志物可用于与多种肝脏疾病阶段相关的状况。例如,该标志物可用于炎症,该炎症可与肝脏疾病相关。作为非限制性实例,标志物包括肽、激素、脂质、维生素、病原体、细胞碎片、代谢物和核酸。在一些情况下,标志物是无细胞核酸。通常,本文公开的标志物是与肝脏疾病阶段相关的。然而,在一些情况下,所述标志物不与肝脏疾病阶段相关。本文公开的标志物也可被称为肝脏疾病阶段生物标志物。肝脏疾病阶段生物标志物可以是由于肝脏疾病阶段而存在或产生的、由于肝脏疾病阶段而失调的、在机理上与肝脏疾病阶段有关的、在肝脏疾病阶段时突变或修饰的或其任何组合的生物分子。标志物可由受试者产生。标志物也可由其他物种产生。例如,标志物可以是由肝炎病毒或链球菌属细菌生成的核酸或蛋白质。鉴定此类标志物的方法可进一步包括对疾病相关多核苷酸进行检测/定量,以确定哪些组织受到这些病原体的感染或影响,并且达到肝脏受损的程度。

通常,在本文中可互换使用的术语“无细胞多核苷酸”和“无细胞核酸”是指无需从细胞中提取多核苷酸即可以从样品中分离的多核苷酸。本文公开的无细胞多核苷酸通常是已从受损组织或受损器官释放或分泌的多核苷酸,或参与肝脏相关信号传导途径,或参与炎性过程。例如,对组织或器官的损害可能是由于导致细胞溶解的肝脏疾病、损伤或其他状况,从而将无细胞多核苷酸从受损组织的细胞释放到循环中。在一些情况下,本文公开的无细胞多核苷酸是肝脏疾病阶段相关的。在其他情况下,无细胞多核苷酸不是肝脏疾病阶段相关的。在一些情况下,无细胞多核苷酸存在于细胞中或与细胞接触。在一些情况下,无细胞多核苷酸与细胞器、囊泡或外来体接触。在一些情况下,无细胞多核苷酸是无细胞的,意味着无细胞多核苷酸不与细胞接触。除非另有说明,否则本文所述的无细胞多核苷酸是自由循环的。在一些情况下,无细胞多核苷酸是自由循环的,即无细胞多核苷酸不与任何囊泡、细胞器或细胞接触。在一些情况下,无细胞多核苷酸与多核苷酸结合蛋白质(转移酶、核糖体蛋白质等)相缔合,但不与任何其他分子相缔合。

如本文所用的,术语“约”某一数字通常是指该数字加上或减去该数字的10%。如本文所用的,术语“约”某一范围通常是指该范围减去其最低值的10%至加上其最大值的10%。

除非上下文另有明确规定,否则如本说明书和权利要求书中所使用的,单数形式“一个”、“一种”和“该”包括复数指示物。例如,术语“一个样品”包括多个样品,包括其混合物。

术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”在本文中通常可互换使用,以指代测量形式,并且包括确定元素是否存在(例如,检测)。这些术语可包括定量、定性或定量和定性测定。评估是相对的或绝对的。如本文所用的,“检测……的存在”通常包括测定某物的存在量以及确定其存在与否。

如本文所用的,术语“治疗”或“处理”通常用于指代用于在接受者中获得有益或期望的结果的药物或其他干预方案。有益或期望的结果包括但不限于治疗性益处和/或预防性益处。治疗性益处可指症状或正在被治疗的潜在病症的根除或改善。另外,治疗性益处也能如下实现:根除或改善与潜在病症相关的一种或多种生理学症状,使得在受试者中观察到改善,尽管该受试者可能仍受到该潜在病症的折磨。预防性效果可包括延缓、防止或消除肝脏疾病阶段或状况的进展,延缓或消除肝脏疾病阶段或状况的症状发作,减慢、终止或逆转肝脏疾病阶段或状况的进展,或其任意组合。对于预防性益处,具有发生特定肝脏疾病阶段的风险的受试者或报告肝脏疾病阶段的一种或多种生理学症状的受试者可接受治疗,即使可能尚未作出该肝脏疾病阶段的诊断。

方法

如前述和以下描述中所讨论的,本文公开的方法可能旨在非侵入性地检测受胁迫的受试者中的组织或器官,以及确定哪种肝脏疾病阶段或状况正在影响肝脏。本文公开的一些方法可包括确定受试者中的肝脏疾病或状况的阶段或进展。本文公开的一些方法可包括确定对用来治疗受试者中的肝脏疾病阶段或状况的疗法的反应。本文公开的一些方法可包括在临床前靶标发现中确定对治疗剂的反应。本文公开的一些方法可包括确定靶分子在临床前测量中的参与。本文公开的一些方法可包括在后期优化期间优化先导疗法,以供进一步的临床开发。疗法的评价可包括制定终点,以评价治疗剂的相对治疗功效。本文公开的一些方法可包括开发cf-mRNA特征以评价治疗剂的毒性。

本文公开的一些方法可包括确定受试者的肝脏是否被损害、损伤或感染。本文公开的一些方法可包括确定受试者的肝脏是否受到肝脏疾病阶段或状况的影响。本文公开的一些方法可包括对本文公开的生物分子进行检测或定量。本文公开的一些方法可包括对本文公开的标志物和/或疾病相关的多核苷酸进行检测或定量。

本文公开的一些方法可包括检测受试者中的肝脏疾病阶段或状况,并且还检测由于肝脏疾病或状况而受胁迫的任何组织或器官,其中所述方法可包括将生物样品中的标志物和/或无细胞多核苷酸的水平与同肝脏疾病阶段参考相关的标志物和/或无细胞多核苷酸的阈值水平进行比较。

本文公开的一些方法可包括检测、定量和/或分析受试者样品中肝脏疾病阶段或状况的至少一种标志物。该方法可包括检测、定量和/或分析生物样品中的至少一种多核苷酸。该方法可包括检测、定量和/或分析生物样品中的至少一种肝脏疾病阶段相关多核苷酸。该肝脏疾病阶段相关多核苷酸可以是无细胞多核苷酸。该方法可进一步包括将标志物和/或肝脏疾病阶段相关的无细胞多核苷酸的量分别与该标志物的参考水平和该肝脏疾病阶段相关多核苷酸的参考水平进行比较。在一些方面,该方法可提供肝脏疾病阶段或状况的诊断或预后,或评估其进展。

在一些方面,本公开提供了一种确定组织是否已被肝脏疾病或状况损害的方法。该方法可包括:(a)对受试者的第一样品中肝脏疾病阶段或状况的至少一种标志物的水平进行定量或检测该标志物;(b)对受试者的第二样品中至少一种肝脏疾病阶段相关多核苷酸的水平进行定量,其中所述至少一种肝脏疾病阶段相关多核苷酸是无细胞多核苷酸,并且进一步地,其中所述定量可包括选自下组的至少一个过程:逆转录、多核苷酸扩增、实时PCR、测序、探针杂交、微阵列杂交和甲基化特异性修饰;(c)将所述至少一种标志物的水平与该标志物的相应参考水平进行比较;(d)将所述至少一种疾病相关多核苷酸的水平与该肝脏疾病阶段相关多核苷酸的相应参考水平进行比较;以及/或者(e)基于所述比较来确定组织是否已被肝脏疾病阶段或状况损害。第一样品和第二样品可以是相同的。第一样品和第二样品可以是不同的。第一样品和第二样品可以同时获得。第一样品和第二样品可以顺序地获得。作为非限制性实例,所述肝脏疾病或状况可选自肝脏脂肪变性状况(没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4))、其并发状况、其并发症、其风险、其阶段和对其治疗的反应。

在另一方面,本公开提供了一种测量对药物组合物的反应的方法。该药物组合物可以是开发中的治疗肝脏疾病的疗法。该药物组合物可以是针对肝脏疾病以外的适应症的疗法,其中相对肝毒性需要评价。在一些实施方案中,该方法可包括:(a)对受试者的第一样品中至少一种肝脏疾病阶段的至少一种标志物(例如,FSCN1、PITPNM3、LIMCH1、CCND1或CASKIN2)的水平进行定量或检测该标志物,其中第一样品在施用药物组合物后获得;(b)对受试者的第二样品中至少一种肝脏疾病阶段相关多核苷酸(例如,FSCN1、PITPNM3、LIMCH1、CCND1或CASKIN2)的水平进行定量,其中(i)所述至少一种肝脏疾病阶段相关多核苷酸是对组织特异的无细胞多核苷酸;并且(ii)第二样品在施用该药物组合物后获得;(c)将所述至少一种标志物中的每一种的水平与该标志物的相应参考水平进行比较,其中该标志物的参考水平是在施用该药物组合物之前获得的受试者样品中的水平;(d)将所述至少一种肝脏疾病阶段相关多核苷酸的水平与该肝脏疾病阶段相关多核苷酸的相应参考水平进行比较,其中该肝脏疾病阶段相关多核苷酸的参考水平是在施用该药物组合物之前获得的受试者样品中的水平;以及/或者(e)基于步骤(c)和(d)的结果来确定该药物组合物是否具有治疗效果。第一样品和第二样品可以是不同的。第一样品和第二样品可以同时获得。第一样品和第二样品可以顺序地获得。作为非限制性实例,所述肝脏疾病阶段或状况可选自肝脏脂肪变性状况(NAFL、没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)、NASH)、其并发状况、其并发症、其风险、其阶段和对其治疗的反应。

治疗、监测和测试

如前述和以下描述中所讨论的,本文公开的方法、系统和试剂盒可能旨在非侵入性地检测受胁迫的受试者中的组织或器官,以及确定哪种肝脏疾病或状况正在影响受胁迫的组织或器官。在一些情况下,所述方法、系统和试剂盒可提供治疗受试者的肝脏疾病阶段或状况。本文公开的一些方法可包括选择用于治疗受试者的肝脏疾病阶段或状况的方法或疗法。本文公开的一些试剂盒和系统可提供选择用于治疗受试者的肝脏疾病阶段或状况的方法或疗法。本文公开的一些方法可包括监测受试者中的肝脏疾病阶段或状况,和/或施用对肝脏疾病阶段或状况的测试。本文公开的一些试剂盒和系统可提供监测受试者中的肝脏疾病阶段或状况,和/或施用对肝脏疾病阶段或状况的测试。本文公开的一些方法可包括治疗受试者的肝脏疾病阶段或状况,监测受试者中的肝脏疾病阶段或状况,和/或施用对肝脏疾病阶段或状况的测试。在一些情况下,本文公开的方法可包括确定受试者具有肝脏疾病阶段或状况,从而告知该受试者或其医疗保健提供者治疗或测试对于该受试者是适合的、合适的和/或有益的。在一些情况下,本文公开的方法可包括确定受试者患有肝脏疾病或状况并推荐对肝脏疾病或状况的治疗。在一些情况下,本文公开的方法可包括确定受试者患有肝脏疾病或状况,并治疗该受试者的肝脏疾病阶段或状况。在一些情况下,本文公开的方法可包括确定受试者具有肝脏疾病阶段或状况,并监测该受试者的肝脏疾病阶段或状况。在一些情况下,本文公开的方法可包括确定受试者相对于没有肝脏疾病或状况的相同年龄范围内的个体具有增加的具有肝脏疾病阶段或状况的风险或可能性,以及向该受试者施用对该肝脏疾病阶段或状况特异的测试。在一些情况下,本文公开的方法可包括确定受试者相对于没有肝脏疾病阶段或状况的相同年龄范围内的个体具有增加的具有肝脏疾病阶段或状况的风险或可能性,以及向该受试者推荐对该肝脏疾病阶段或状况特异的测试。

本文提供了可用于治疗肝脏疾病和状况的治疗剂、组合物、化合物和药剂。如本文所用的“类似物”通常是指类似于天然存在的化合物的改性或合成化合物,其中至少50%的类似物结构与至少50%的天然存在的化合物相同。

可以在肝脏疾病阶段的早期阶段以更高的准确度确定受试者中肝脏疾病的存在和位置,例如,这是因为本文所述的系统和方法可提供快速结果,考虑肝脏疾病阶段中的基因表达变异,并且可以是非侵入性的和/或便宜的。因此,可以在肝脏疾病阶段进展到与早期阶段相比可能相对更难控制或治疗的晚期阶段之前治疗受试者。例如,本文公开的系统和方法可允许确定受试者在进展为NASH之前是否患有NAFL,并允许确定患者在进展为显著纤维化之前是否患有伴低纤维化的NASH。本文公开的系统和方法可允许确定受试者在进展到肝脏疾病阶段F1之前是否具有肝脏疾病阶段F0。本文公开的系统和方法可允许确定受试者在进展到肝脏疾病阶段F2之前是否具有肝脏疾病阶段F1。本文公开的系统和方法可允许确定受试者在进展到肝脏疾病阶段F3之前是否具有肝脏疾病阶段F2。本文公开的系统和方法可允许确定受试者在进展到肝脏疾病阶段F4之前是否具有肝脏疾病阶段F3。以这种方式,本文公开的方法和系统可在肝脏疾病的早期阶段(例如F0和F1)提供集中分析和靶向治疗。

所述方法和系统可提供采用对个体中存在的组织损伤程度而言合适或最佳的疗法进行治疗。在一些情况下,该方法可包括对标志物和/或肝脏疾病阶段相关多核苷酸进行检测/定量,以评估疗法的有效性和/或毒性。在一些情况下,该疗法可以继续。在其他情况下,可以停止和/或用另一种疗法替换该疗法。无论如何,由于所述方法和系统的快速和非侵入性质,相对于一些常规治疗优化,可以更频繁地评估并优化治疗效果。

在一些方面,本公开提供了本文公开的系统、样品、标志物和肝脏疾病阶段相关多核苷酸的用途。在一些情况下,本文公开了体外样品用于非侵入性地检测受胁迫的受试者的肝脏以及作为胁迫原因的肝脏疾病阶段或状况的用途。在一些情况下,本文公开了离体样品用于通过将基因表达数据与肝脏疾病阶段特异性表达对照进行比较来非侵入性地检测受胁迫的受试者的肝脏以及作为胁迫原因的肝脏疾病阶段或状况的用途。通常,本文公开的用途包括对样品(包括离体样品和体外样品)中的标志物和疾病相关多核苷酸进行定量。本文公开的一些用途包括比较第一样品中标志物的量和肝脏疾病阶段相关多核苷酸的量,并将这些量与第二样品中的相应量进行比较。在一些情况下,第一样品来自第一受试者,而第二样品来自对照受试者(例如,健康受试者或具有临床证实的肝脏疾病阶段的受试者,或健康受试者或具有临床证实的肝脏疾病阶段的受试者,其中该受试者与第一受试者处于相同的年龄范围内)。在一些情况下,第一样品可来自第一时间点的受试者,而第二样品可来自第二时间点的同一受试者。可在对受试者施用疗法之前获得第一时间点,并且可在该疗法之后获得第二时间点。因此,本文还提供了样品、标志物、疾病相关多核苷酸、试剂盒和系统用于监测和/或评价受试者的状况、受试者的组织健康状态和/或治疗剂的效果的用途。

在一些方面,本公开提供了监测具有慢性状况的人类受试者是否存在至少一种组织的至少一种肝脏疾病并发症的方法。在一些方面,本公开提供了对具有慢性肝脏状况的人类受试者监测至少一种组织的至少一种并发症的风险增加的方法。

在一些方面,本公开提供了监测具有慢性代谢状况的人类受试者是否存在与肝脏疾病阶段相关的分子途径的至少一种并发症的方法。在一些方面,本公开提供了对具有慢性代谢状况的人类受试者监测与肝脏疾病阶段相关的分子途径的至少一种并发症的风险增加的方法。

一些方法包括在至少三种组织中的任一种组织中监测人类受试者与肝脏疾病阶段相关的并发症。一些方法包括在至少三种组织中的任一种组织中监测人类受试者与肝脏疾病阶段相关的并发症的风险增加。

一些方法可包括以下步骤:从受试者获得生物流体;测定生物流体中的标志物水平,其中该标志物选自胆固醇、脂质、胰岛素、炎症介质、脂质介质、胰岛素介质和胆固醇介质;以及/或者对来自肝脏、心血管组织、神经系统和肾脏的生物流体中的核糖核酸(RNA)进行定量。在一些情况下,阈值标志物水平和RNA的阈值量可指示在心血管组织、神经系统和肾脏中的至少一个中存在肝脏疾病阶段相关的并发症或该并发症的风险增加。

如本文所用的,术语“慢性状况”通常是指受试者已经经历至少约六个月的状况。在一些情况下,慢性状况可以是受试者已经经历至少约一年的状况。在一些情况下,慢性状况可以是受试者已经经历至少约六个月到至少约一年的状况。在一些情况下,慢性状况可以是受试者已经经历至少约六个月到至少约两年的状况。在一些情况下,该慢性状况可以是慢性代谢状况。在一些情况下,该慢性状况可以是肥胖症。在一些情况下,该慢性状况可以是酗酒。在一些情况下,该慢性状况可以是对可导致肝损伤的物质成瘾。

如本文所用的,术语“并发症”通常包括急性的状况、危及生命的状况、需要立即干预的状况、需要立即注意的状况、立即注意或干预将会防止危及生命的事件的状况及其组合。肝脏疾病阶段相关的并发症的非限制性实例是肾缺血、肾功能衰竭、肝功能衰竭、肝硬化、肝纤维化、非酒精性脂肪性肝炎、病毒性肝炎、动脉血栓形成、动脉闭塞、心脏瓣膜肝病、动脉粥样硬化斑块、动脉瘤、外周动脉肝病、血凝块、心包炎和心肌病。

在一些情况下,至少一种肝脏疾病阶段相关并发症的增加的风险可以是受试者中与不具有肝脏疾病阶段的受试者中所述至少一种并发症的风险相比明显更高的风险。在一些情况下,至少一种并发症的增加的风险可以是具有肝脏疾病阶段的第一受试者中与不具有该肝脏疾病阶段的第二受试者中所述至少一种并发症的风险相比明显更高的风险。

本文公开的基因表达小组共享以下性质:可以使用来源于循环血液的cfRNA表达水平信息作出关于个体组织肝脏疾病阶段的灵敏、特异性的结论。本发明基因标志物小组的益处可以在于,它们使用方便地、非侵入性获得的样品提供灵敏的、特异性的肝脏健康评估。无需依赖于从侵入性活检获得的额外的数据。因此,依从率可以大大提高,并且在其进展的早期可以更容易地认识到肝脏健康问题,从而可以更有效地对其进行治疗。

可以选择本文公开的基因标志物小组,使得它们的预测值显著大于其个体成员的预测值或单独从个体测量的表达值。小组成员可以彼此共同变化。小组成员可能不会彼此共同变化。不共同变化的小组成员可以为小组的整体健康信号提供独立的贡献。因此,小组可能能够大大胜过指示个体组织健康状态的任何单个成分的表现,从而可以获得商业上和医学上相关的置信度(灵敏度和/或特异性)。

分离、定量和检测

本文公开的方法可包括对本文公开的肝脏疾病阶段或状况的标志物的量进行检测或定量,以确定受试者受到相应肝脏疾病阶段或状况的影响,或受试者处于受到相应肝脏疾病阶段或状况的影响的风险中。在一些情况下,对至少1个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少5个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少10个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少15个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少20个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少25个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少30个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少40个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少50个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。在一些情况下,对至少100个拷贝/ml的标志物进行检测或定量可能足以确定受试者受到相应肝脏疾病阶段或状况的影响或处于受到其影响的风险中。

此外,本文公开的方法可包括对本文公开的肝脏疾病阶段相关多核苷酸的量进行检测或定量,以确定肝脏组织正在受到肝脏疾病阶段或状况的影响。在一些情况下,方法可包括对至少1个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少5个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少10个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少15个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少20个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少25个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少30个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少35个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少40个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少45个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少50个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。在一些情况下,方法可包括对至少100个拷贝/ml的肝脏疾病阶段相关多核苷酸进行检测或定量。

本文公开的一些方法可包括对至少一定量的标志物或肝脏疾病阶段相关多核苷酸进行检测或定量,以确定肝脏疾病阶段或状况正在影响相应的组织。在一些情况下,标志物(其中该标志物是多核苷酸)或肝脏疾病阶段相关多核苷酸的量可以是至少约1个拷贝/mL、至少约10个拷贝/mL、至少约20个拷贝/mL、至少约30个拷贝/mL、至少约40个拷贝/mL、或至少约50个拷贝/mL、至少约80个拷贝/细胞、至少约100个拷贝/细胞、至少约120个拷贝/细胞、至少约150个拷贝/细胞或至少约200个拷贝/细胞。在一些情况下,标志物(其中该标志物是蛋白质、脂质或其他非多核苷酸生物分子)的量可以是至少约5pg/mL、至少约10pg/mL、至少约20pg/mL、至少约30pg/mL、至少约50pg/mL、至少约60pg/mL、至少约80pg/mL、至少约100pg/mL、至少约150pg/mL、至少约200pg/mL或至少约500pg/mL。

如前述和以下描述中所讨论的,本文公开的方法和系统可以旨在非侵入性地检测受胁迫的肝脏,以及通过检测、定量或以其他方式分析本文公开的至少一种标志物和至少一种肝脏疾病阶段相关多核苷酸来确定哪种肝脏疾病阶段或状况正在影响受胁迫的组织或器官。在一些情况下,所述至少一种标志物可包含多核苷酸(例如无细胞多核苷酸)或多肽。一些方法可包括通过使多核苷酸或多肽与至少一种探针接触来检测该多核苷酸或多肽。在一些情况下,所述至少一种探针可以仅能够与该多核苷酸或多肽的野生型形式结合。在一些情况下,所述至少一种探针可以仅能够与该多核苷酸或多肽的突变形式结合。在其中标志物是多核苷酸的一些情况下,检测可包括测序。

本文公开的一些方法可包括分离至少一种标志物和/或至少一种肝脏疾病阶段相关多核苷酸。在一些情况下,所述至少一种标志物和/或至少一种肝脏疾病阶段相关多核苷酸可包含无细胞多核苷酸。在一些情况下,分离无细胞多核苷酸可包括从受试者中分级分离样品。一些方法可包括从样品中去除完整细胞。例如,一些方法可包括离心血液样品并收集作为血清或血浆的上清液,或过滤样品以除去细胞。在一些实施方案中,可以分析无细胞多核苷酸而无需从受试者中分级分离样品。例如,尿液、脑脊液或其他含有很少或不含细胞的流体可能不需要分级分离。一些方法可包括充分纯化无细胞多核苷酸,以便检测/定量/分析无细胞多核苷酸。可以使用各种试剂、方法和试剂盒来纯化无细胞多核苷酸。试剂包括但不限于苯酚、苯酚-氯仿、糖原、碘化钠、去污剂和离液盐。试剂盒包括但不限于ThermoFisher

本文公开的一些方法可包括富集样品中的无细胞多核苷酸。例如,感兴趣的样品可含有来自细菌的RNA/DNA。一些方法可包括外来体(exosomal)捕获,从而消除或基本上消除不需要的序列并富集样品中感兴趣的多核苷酸。在一些情况下,外来体捕获可包括基于阵列的捕获或溶液内捕获,分别栓系到表面或珠子的对应于目的RNA的DNA片段。一些方法还可包括从样品中过滤或去除其他生物分子或细胞,如蛋白质或血小板。在一些情况下,富集样品中的无细胞多核苷酸可包括防止血浆样品的血细胞RNA污染。在一些情况下,使用不含EDTA的试管可以防止或减少血浆/血清样品中血细胞RNA的存在。

通常,本文公开的方法可包括定量或检测至少一种标志物和/或至少一种肝脏疾病阶段相关多核苷酸。在一些情况下,定量和/或检测至少一种标志物和/或至少一种肝脏疾病阶段相关多核苷酸可包括扩增所述至少一种标志物和/或至少一种肝脏疾病阶段相关多核苷酸。在涉及无细胞RNA的一些情况下,定量和/或检测至少一种标志物和/或至少一种疾病相关多核苷酸可包括逆转录该无细胞RNA。可以采用多种工艺中的任何一种来对样品中的标志物或肝脏疾病阶段相关多核苷酸进行检测/定量。在涉及无细胞、肝脏疾病阶段相关RNA的一些情况下,可从样品中分离RNA并在进一步操作如扩增和/或测序之前进行逆转录以产生cDNA。在一些实施方案中,扩增可以在3'端开始以及在样品中的整个转录组中随机开始,以允许mRNA和非聚腺苷酸化转录物二者的扩增。用于扩增cDNA的合适的试剂盒包括,例如,

本文公开的一些方法可包括对本文所述的至少一种标志物和/或至少一种疾病相关多核苷酸进行定量。在一些情况下,定量对于确定肝脏疾病的阶段可能是有用的。例如,一些方法可包括将标志物和/或肝脏疾病阶段相关多核苷酸的量与受试者中第一时间的第一样品中的标志物和/或肝脏疾病阶段相关多核苷酸的量进行比较,以及对第二时间的第二样品中的标志物和/或肝脏疾病阶段相关多核苷酸进行定量,其中该受试者在第一时间与第二时间之间经受治疗。一些方法可包括基于定量产生的信息维持疗法或改变疗法(例如,类型、剂量等)。一些方法可包括在另外的时间对另外的样品中的标志物和/或疾病相关多核苷酸进行定量,在这些时间之间调节疗法。

本文公开的一些核酸定量方法可包括对至少一种核酸进行测序。测序可以是靶向测序。在一些情况下,靶向测序可包括特异性扩增本文公开的所选标志物或所选肝脏疾病阶段相关多核苷酸(例如,PITPNM3、LIMCH1、FSCN1、CCND1或CASKIN2)并对扩增产物进行测序。在一些情况下,靶向测序可包括特异性扩增本文公开的选定标志物的子集或选定肝脏疾病阶段相关多核苷酸的子集,并对扩增产物进行测序。或者,包括靶向测序的一些方法可能不包括扩增标志物或肝脏疾病阶段相关多核苷酸。一些方法可包括非靶向测序。在一些情况下,非靶向测序可包括对扩增产物进行测序,其中一部分无细胞核酸不是标志物或肝脏疾病阶段相关多核苷酸。在一些情况下,非靶向测序可包括扩增来自受试者的样品中的无细胞核酸,并对扩增产物进行测序,其中一部分无细胞核酸不是标志物或肝脏疾病阶段相关多核苷酸。在一些情况下,非靶向测序可包括扩增包含本文所述的标志物或肝脏疾病阶段相关多核苷酸的无细胞核酸。测序可提供对应于标志物或肝脏疾病阶段相关多核苷酸的相对量的许多读取。在一些情况下,测序可提供对应于标志物或肝脏疾病阶段相关多核苷酸的绝对量的许多读取。在一些实施方案中,可通过全转录组鸟枪测序(也称为“RNA-Seq”)对扩增的cDNA进行测序。全转录组鸟枪测序(RNA-Seq)可以使用Sanger测序、合成测序、焦磷酸测序、采用纳米孔的测序、高通量测序技术或多种下一代测序平台(例如但不限于Illumina基因组分析仪平台、ABI Solid测序平台或Life Science的454测序平台)完成。

在一些情况下,可通过微阵列如肽阵列或寡核苷酸阵列进行特定靶标的鉴定,其中可寻址结合元件的阵列与相应的靶标特异性结合,并且使用与结合程度成比例的信号来确定样品中靶标的量。在一些情况下,测序可以是定量方法。在一些情况下,测序可允许在没有扩增子干扰的情况下平行探询数千个基因。在一些情况下,使用通过测序进行的定量代替通过Q-PCR进行的定量。在一些情况下,例如,通过Q-PCR对基因表达进行精确定量所需的对照基因如此之多,以至于用Q-PCR进行定量可能是低效的。在其他情况下,测序效率和通过测序进行精确定量可能不受所分析的基因(例如对照基因)数目的影响。至少由于前述原因,测序对于本文公开的一些方法可能是有用的,其中评估多个器官(例如,心脏、肾脏、肝脏等)的健康状态。

本文公开的一些核酸定量方法可包括定量PCR(q-PCR)。在一些情况下,Q-PCR可包括本文所述的无细胞RNA的逆转录反应以产生相应的cDNA。在一些情况下,无细胞RNA可包含标志物、肝脏疾病阶段相关多核苷酸以及/或者既不是标志物也不是肝脏组织特异性多核苷酸的无细胞RNA。一些无细胞RNA可包含本文所述的标志物、本文所述的肝脏疾病阶段相关多核苷酸以及/或者既不是本文所述的标志物也不是肝脏组织特异性多核苷酸的无细胞RNA。在一些情况下,Q-PCR可包括使对应于标志物、肝脏疾病阶段相关多核苷酸或管家基因(例如,ACTB、GAPDH)的cDNA与对该标志物、疾病相关多核苷酸或管家基因具有特异性的PCR引物接触。

本文公开的一些方法包括对“管家”多核苷酸进行定量。本文公开的包括Q-PCR的方法可包括使核酸与对应于血细胞特异性多核苷酸的引物接触。本文公开的一些血细胞特异性多核苷酸可以是主要由一种或多种类型的血细胞表达或甚至仅由其表达的核酸。血细胞的类型通常可分类为白血细胞(也称为白细胞)、红血细胞(也称为红细胞)和血小板。在一些情况下,血细胞特异性多核苷酸还可以在包括对本文公开的疾病相关多核苷酸和肝脏疾病标志物进行定量的方法中用作对照。在一些情况下,采用对应于血细胞特异性多核苷酸的引物无法获得扩增产物可用于证实该方法检测血液、血浆或血清样品中的无细胞RNA,而不检测血细胞中表达的RNA。作为非限制性实例,血细胞特异性多核苷酸包括在白细胞、血小板或红细胞及其组合中表达的多核苷酸。白细胞包括但不限于淋巴细胞、T细胞、B细胞、树突细胞、粒细胞、单核细胞和巨噬细胞。作为非限制性实例,血液特异性多核苷酸可以由选自CD4、TMSB4X、MPO、SOX6、HBA1、HBA2、HBB、DEFA4、GP1BA、CD19、AHSP和/或ALAS2的基因编码。血细胞特异性多核苷酸可以由CD4编码并且主要由白细胞表达。血细胞特异性多核苷酸可以由TMSB4X编码并且由多种血细胞类型(全血)表达。血细胞特异性多核苷酸可以由MPO编码并且主要由嗜中性粒细胞表达。血细胞特异性多核苷酸可以由DEFA4编码并且主要由嗜中性粒细胞表达。血细胞特异性多核苷酸可以由GP1BA编码并且主要由血小板表达。血细胞特异性多核苷酸可以由CD19编码并且主要由B细胞表达。血细胞特异性多核苷酸可以由ALAS2、SOX6、HBA1、HBA2或HBB编码并且主要由红细胞表达。

在一些情况下,ddPCR或Q-PCR是定量方法。Q-PCR可以是更灵敏的方法,因此更精确地对以极低水平存在的RNA进行定量。在一些情况下,使用通过Q-PCR进行的定量代替通过测序进行的定量。在一些情况下,测序可能需要更复杂的RNA样品制备,并且可能需要耗尽或富集核酸以便提供精确定量。

通常,本文公开的方法可包括对标志物的组合或肝脏疾病阶段相关多核苷酸的组合进行检测或定量。在一些情况下,如果检测到多种肝脏特异性、纤维化的或炎症相关的多核苷酸,则可以对受试者进行更具结论性的诊断或评估。在一些情况下,受试者的血液样品中存在每种肝脏特异性或炎症相关多核苷酸不会指示对肝脏的损害。然而,它们的存在可以共同表明对肝脏的损害。类似地,如果检测到多种标志物,则可以对受试者进行更具结论性的诊断或评估。在一些情况下,受试者的血液样品中存在每种标志物不会指示对肝脏的损害。然而,它们的存在可以共同表明肝脏中的状况。所述方法可包括对约2、约3、约4、约5、约6、约7、约8、约9或约10种肝脏特异性或炎症相关多核苷酸进行检测或定量。所述方法可包括对约2、约3、约4、约5、约6、约7、约8、约9或约10种标志物进行检测或定量。可以知道两种或更多种标志物在共同的遗传途径或共同的分子信号传导途径中相互作用。共同的分子信号传导途径可以是相互作用以产生细胞功能的数种蛋白质的网络,作为非限制性实例,该细胞功能例如是炎症应答、肝星状细胞活化、凋亡、胆固醇摄取等。

类似地,在无细胞DNA的情况下,本文公开的一些方法可采用DNA或染色质的肝脏疾病阶段相关修饰来鉴定样品中的疾病相关多核苷酸。例如,肝脏疾病阶段相关的无细胞DNA可包含肝脏疾病阶段相关的甲基化模式。肝脏疾病阶段相关的无细胞DNA可以与指示特定起源组织的蛋白质(例如,已知在特定组织中转录该基因的转录因子)复合。无细胞或循环染色质或染色质片段可具有肝脏疾病阶段相关的组蛋白修饰(例如,甲基化、乙酰化和磷酸化)。在一些这样的情况下,诸如染色质免疫沉淀等方法可适用于对疾病相关多核苷酸进行检测/定量。无细胞的肝脏疾病阶段相关DNA可以是单链或双链DNA。

本文公开的一些方法可包括使用多种检测甲基化模式的方法。DNA可经历化学转化过程,该化学转化过程选择性地修饰甲基化或未甲基化的核苷酸。例如,DNA可以用亚硫酸氢盐处理,亚硫酸氢盐将胞嘧啶残基转化为尿嘧啶(其在PCR后转化为胸苷),但5-甲基胞嘧啶残基不受影响。因此,亚硫酸氢盐处理引入了依赖于单个胞嘧啶残基的甲基化状态的DNA序列的特定变化(“甲基化特异性修饰”),从而产生关于DNA区段的甲基化状态的单核苷酸分辨率信息。可以对改变的序列进行各种分析以检索该信息。检测甲基化模式的其他方法也在本公开的范围内。

本文公开的一些方法可包括在亚硫酸氢盐处理之前使DNA经受氧化或还原条件,以便鉴定其他表观遗传标志物的模式。例如,可以进行氧化亚硫酸氢盐反应。5-甲基胞嘧啶和5-羟甲基胞嘧啶在亚硫酸氢盐测序中均被读取为C。氧化亚硫酸氢盐反应可允许以单碱基分辨率区分5-甲基胞嘧啶和5-羟甲基胞嘧啶。通常,该方法可采用将5-羟甲基胞嘧啶特异性化学氧化成5-甲酰基胞嘧啶,随后在亚硫酸氢盐处理过程中转化为尿嘧啶。于是,被读取为C的唯一碱基是5-甲基胞嘧啶,从而给出DNA样品中真正甲基化状态的图谱。5-羟甲基胞嘧啶的水平也可以通过测量亚硫酸氢盐与氧化亚硫酸氢盐测序之间的差异进行定量。在亚硫酸氢盐处理之前,DNA也可以经受还原条件。还原将样品核苷酸序列中的5-甲酰基胞嘧啶残基转化为5-羟甲基胞嘧啶。如上所述,5-甲酰基胞嘧啶在亚硫酸氢盐处理时转化为尿嘧啶,但5-羟甲基胞嘧啶不转化为尿嘧啶。通过将经受还原性亚硫酸氢盐处理的样品的第一部分与仅经受亚硫酸氢盐处理的样品的第二部分进行比较,可以鉴定5-甲酰基胞嘧啶标志物的位置。

作为基于甲基化诱导序列变化的备选方案,本文公开的方法可包括通过分离或富集包含甲基化的多核苷酸推断甲基化状态,并基于其序列鉴定甲基化的多核苷酸(例如通过测序或探针杂交)。用于富集甲基化序列的一种过程可包括以甲基化特异性方式修饰碱基、富集包含该修饰的多核苷酸(例如通过纯化)、扩增富集的多核苷酸,并且/或者随后鉴定多核苷酸。例如,5-羟甲基修饰的胞嘧啶(5hmC)可以在UDP-葡萄糖分子和β-葡糖基转移酶的存在下选择性糖基化。UDP-葡萄糖分子可包含标记物,使得该标记物在与UDP-葡萄糖反应时与含5hmC的多核苷酸缀合。该标记物可以是结合对(例如,链霉亲和素/生物素或抗原/抗体)的成员,其允许在与结合对的相应成员结合时分离修饰的片段。在鉴定之前,可以进一步富集分离的多核苷酸,如在扩增反应(例如PCR)中。

可以使用任何合适的序列检测方法检测多核苷酸的存在和/或量(相对或绝对的),以及由亚硫酸氢盐处理导致的序列变化。实例包括但不限于探针杂交、引物引导的扩增和测序。可以使用任何方便的低通量或高通量测序技术或平台对多核苷酸进行测序,包括但不限于Sanger测序、Solexa-Illumina测序、基于连接的测序(SOLiD)、焦磷酸测序;频闪测序(SMR);以及半导体阵列测序(Ion Torrent)。Illumina或Solexa测序可以基于可逆染料终止剂。DNA分子通常附接在载玻片上的引物上并进行扩增,从而形成局部克隆集落。随后,可以一次添加一种类型的核苷酸,并洗去未掺入的核苷酸。随后,可以拍摄荧光标记的核苷酸的图像,并且从DNA中化学去除染料,从而允许下一个循环。Applied Biosystems的SOLiD技术采用连接测序。该方法基于使用固定长度的所有可能寡核苷酸的池,这些寡核苷酸根据测序位置进行标记。将这类寡核苷酸退火并连接。随后,DNA连接酶对匹配序列的优先连接通常导致指示该位置处的核苷酸的信号。由于通常通过乳液PCR对DNA进行扩增,因此可以将得到的珠子(每个仅包含相同DNA分子的拷贝)沉积在载玻片上,从而导致与Illumina测序相当的量和长度的序列。

设想的测序方法的另一个实例是焦磷酸测序,特别是454焦磷酸测序,例如基于Roche 454基因组测序仪。该方法扩增在油溶液中小水滴内的DNA,其中每个小液滴含有单个DNA模板,该DNA模板附接在单个引物包被的珠子上,然后形成克隆集落。焦磷酸测序使用萤光素酶生成光以供检测添加至新生DNA中的单个核苷酸,并且使用组合的数据生成序列读出。另一种方法基于Helicos的Heliscope技术,其中片段被栓系在阵列上的聚T寡聚体捕获。在每个测序循环中,添加聚合酶和单荧光标记的核苷酸,并对阵列进行成像。随后移除荧光标签,并重复该循环。合适的测序技术的其他实例是杂交测序、使用纳米孔的测序、基于显微术的测序技术、微流体Sanger测序或基于微芯片的测序方法。高通量测序平台可允许在单个反应容器中生成多个不同的测序读取,如10

本文公开的一些方法、系统和试剂盒可提供对肝脏组织对生物样品的无细胞转录组的相对贡献进行定量。在一些情况下,对肝脏组织对无细胞转录组的相对贡献进行定量可包括对样品中的总RNA进行定量。在一些情况下,对肝脏组织对无细胞转录组的相对贡献进行定量可包括对样品中的总核酸进行定量。在一些情况下,可将组织的相对贡献与对照样品中对照无细胞转录组的相对贡献进行比较。如果肝脏组织的相对贡献类似于对照无细胞转录组的相对贡献,则该肝脏组织可被认为具有与对对照无细胞转录组具有贡献的对照肝脏组织相似的健康状态。如果肝脏组织的相对贡献与对照无细胞转录组的相对贡献不同,则该肝脏组织可被认为具有与对对照无细胞转录组具有贡献的对照肝脏组织不同的健康状态。在一些情况下,对照无细胞转录组可代表健康个体或健康群体,其中对照组织是健康的、无肝脏疾病的和/或无肝脏损伤的。

本文公开的一些方法和系统可提供无细胞转录组的去卷积,以确定受试者的肝脏对无细胞RNA转录组的相对贡献。在一些情况下,可采用以下步骤来确定样品中受试者的肝脏的相对RNA贡献。首先,可以鉴定一组疾病相关的转录物。其次,可以测定来自样品的血浆中的总RNA。第三,可以针对该组肝脏疾病阶段相关转录物评估总RNA,并且总RNA可被认为是这些不同肝脏疾病阶段相关转录物的总和。可以使用二次规划作为约束优化方法来推导不同器官/组织对样品的无细胞转录组的相对最佳贡献。在某些实施方案中,可使用二次规划作为约束优化方法来推导不同器官/组织对样品中的无细胞转录组的相对最佳贡献。二次规划描述于Goldfarb和A.Idnani(1982)Dual and Primal-Dual Methods for SolvingStrictly Convex Quadratic Programs.于J.P.Hennart(编著),Numerical Analysis,Springer-Verlag,Berlin,第226-239页,以及D.Goldfarb和A.Idnani(1983).Anumerically stable dual method for solving strictly convex quadraticprograms.Mathematical Programming,27,1-33。

在一些情况下,所述方法可包括对无细胞转录物值进行归一化。这可涉及将无细胞转录物值相对于管家基因转录物值进行重新调整。接下来,可使用二次规划针对这组疾病相关基因评估样品的总RNA,以便确定对样品的无细胞转录组的疾病相关的相对贡献。在二次规划分析过程中可采用以下约束来获得估计的相对贡献:a)不同组织的RNA贡献大于或等于零,以及b)对无细胞转录组的所有贡献的总和等于一。

本文公开的一些方法、系统和试剂盒可允许确定组织的相对贡献,以确定该组织的参考水平。也就是说,某些受试者群体(例如,患病的或正常的)可以经受去卷积过程,以获得参考群体(也称为对照群体)的疾病相关基因表达的参考水平。当单独考虑相对组织贡献时,对于该特定群体,这些肝脏疾病阶段相关转录物中的每一种的定量可用作该特定组织的参考凋亡率、细胞更新率、衰老速率、核酸释放速率或分泌率的量度。例如,可以分析来自一个或多个健康正常个体的血液,以确定组织对健康正常个体的无细胞RNA转录组的相对RNA贡献。构成正常RNA转录组的组织的每个相对RNA贡献可以是该组织的参考水平。

本文公开的一些方法包括推断不同组织类型的相对贡献。经定量的一组组织特异性转录物可以被认为是来自各种组织的贡献的总和。可以通过将样品组织和参考组织中观察到的转录物水平插入下面的方程式中获得不同组织类型的相对贡献,以确定每个组织的π

其中Y是对于基因i在样品中观察到的转录物量,X是参考组织j中基因i的已知转录物量,而ε是正态分布误差。其他物理约束包括:

1.对观察到的定量有贡献的所有分数的总和为1,由以下条件给出:Σπi=1。

2.来自每个组织类型的所有贡献必须大于或等于零。具有负面贡献没有任何实际意义。这由πi≧0给出,因为Σ被定义为每个组织类型的贡献分数。

因此,为了获得每个组织类型的最佳贡献分数,使最小二乘误差最小化。然后使用R中的二次规划来求解上述方程式,以获得组织类型对参考无细胞RNA转录物的最佳相对贡献。在工作流程中,就从qPCR获得的Ct值而言,相对于管家基因给出RNA转录物的量。因此,Ct值可被认为是测量的转录物量的代替指标。Ct值增加1类似于转录物量的两倍变化,即2的1次方。该过程开始于将CT中的所有数据相对于“管家”基因进行归一化,然后进行二次规划。

试剂盒和系统

如前述和以下描述中所讨论的,本文提供了系统和试剂盒,其可以非侵入性地检测受试者的肝脏是否受到胁迫,以及确定哪个肝脏疾病阶段或状况正在影响受胁迫的肝脏。本文公开了用于检测受试者中的肝脏疾病阶段或状况的试剂盒,该试剂盒可包含用于检测至少一种标志物的至少一种试剂和用于检测至少一种肝脏疾病阶段相关多核苷酸的至少一种试剂。另外地或备选地,本文公开的试剂盒可用来确定受试者中肝脏疾病阶段或状况的位置(例如,组织)和/或进展。另外地或备选地,本文公开的试剂盒可用来确定施用于受试者的疗法是否已影响肝脏疾病阶段或状况的进展。另外地或备选地,本文公开的试剂盒可用来确定施用于受试者的疗法是否已导致任何非预期的毒性或副作用。

本文提供了可包含至少一种本文公开的试剂的试剂盒。用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂可包含用于检测无细胞多核苷酸的至少一种试剂。用于检测至少一种标志物的至少一种试剂可包含用于检测无细胞多核苷酸的至少一种试剂。所述至少一种无细胞多核苷酸可包含无细胞DNA或无细胞RNA。无细胞DNA可具有疾病相关的甲基化模式。无细胞多核苷酸可以是肝脏疾病阶段相关的基因转录物。用于检测至少一种标志物的至少一种试剂和/或用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂可包含多核苷酸探针。多核苷酸探针可以与无细胞多核苷酸结合。多核苷酸探针可以以序列依赖性方式与无细胞多核苷酸结合。多核苷酸探针可以与对应于基因的野生型形式而不对应于基因的突变形式的无细胞多核苷酸结合。或者,多核苷酸探针可以与对应于基因的突变形式而不对应于基因的野生型形式的无细胞多核苷酸结合。多核苷酸探针可以附接或偶联至信号部分。作为非限制性实例,信号部分可选自半抗原、荧光分子和放射性同位素。所述试剂盒可对一种肝脏疾病或状况是特异性的。所述试剂盒可包含少至1、2、3、4或5个多核苷酸探针,以便检测受试者中的肝脏疾病或状况。所述试剂盒可对多种肝脏疾病或状况是特异性的。所述试剂盒可包含约5至约10、约10至约20、约10至约100、约10至约1000、约100至约1000或约100至约10,000个多核苷酸探针。

本文提供了包含至少一种本文公开的试剂的试剂盒。用于检测至少一种标志物的至少一种试剂和/或用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂可包含引物。该引物可以是逆转录酶引物。该引物可以是PCR引物。该引物可以扩增所述至少一种标志物、至少一种疾病相关多核苷酸或其部分。该引物可以以序列依赖性方式扩增无细胞多核苷酸。该引物可以扩增对应于基因的野生型形式而不对应于基因的突变形式的无细胞多核苷酸或其部分。或者,该引物可以扩增对应于基因的突变形式而不对应于基因的野生型形式的无细胞多核苷酸或其部分。所述试剂盒可进一步包含扩增报道分子,该报道分子为试剂盒的用户提供至少一种标志物和/或用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂的量。通常,该量是基于参考样品的相对量。扩增信号试剂可选自嵌入荧光染料或染料。扩增信号试剂可以是SYBR Green。

本文提供了可包含至少一种本文公开的试剂的试剂盒。用于检测至少一种标志物的至少一种试剂和/或用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂可包含与所述至少一种标志物或肝脏疾病阶段相关多核苷酸结合的肽。该肽可以是抗体的一部分,或多核苷酸结合蛋白(例如,转录因子、组蛋白等)。用于检测至少一种标志物的至少一种试剂和/或用于检测肝脏疾病阶段相关多核苷酸的至少一种试剂可包含发射信号的信号部分,其中发射或丢失的信号可指示标志物或肝脏疾病阶段相关多核苷酸的存在或量。信号部分的实例包括但不限于染料、荧光团、酶和放射性颗粒。所述至少一种试剂可进一步包含用于检测信号或其不存在的信号部分检测器。

本文公开了用于检测肝脏是否受肝脏疾病阶段影响的试剂盒,其中该试剂盒可包含至少一种用于该状况标志物的探针或引物。在一些情况下,该试剂盒可包含至少一种探针和至少一种引物。在一些情况下,该标志物可以是多核苷酸,并且该引物或探针可以是与感兴趣的靶标杂交的多核苷酸。在一些情况下,该标志物可以是肽或蛋白质,并且该探针可以是能够结合该肽或蛋白质的抗体或抗体片段。在一些情况下,该探针可以是与标志物结合的小分子。在一些情况下,该探针可以与标签缀合,该标签可用来检索标志物、对标志物进行定量或检测标志物。所述至少一个肝脏疾病阶段还可以包括以下至少一种:炎症、凋亡、坏死、纤维化、感染或自身免疫病。

本文公开了用于检测受试者中的肝脏疾病阶段或状况的试剂盒,该试剂盒包含用于检测至少一种标志物的至少一种试剂和用于检测至少一种肝脏疾病阶段相关多核苷酸的至少一种试剂。该试剂盒可进一步包含固体支持物,其中多核苷酸探针、引物和/或肽附接至固体支持物。该固体支持物可选自珠子、芯片、凝胶、颗粒、孔、柱、管、探针、载玻片、膜和基质。

本文公开了用于检测受试者中的肝脏疾病阶段或状况的试剂盒,该试剂盒可包含用于检测至少一种标志物的至少一种试剂和用于检测至少一种肝脏疾病阶段相关多核苷酸的至少一种试剂。本文公开的试剂盒的两种或更多种组分可以是分开的。本文公开的试剂盒的两种或更多种组分可以是集成的。本文公开的试剂盒的两种或更多种组分可以集成到装置中。该装置可允许用户简单地将来自受试者的至少一种样品添加至装置中,并且接收指示受试者是否具有肝脏疾病阶段或状况和/或受试者的哪些组织受到肝脏疾病阶段或状况的影响的结果。在一些情况下,用户可以向装置添加至少一种试剂。在其他情况下,用户可以不向装置(例如,可以不必向装置)添加任何试剂。

本文公开了用于检测受试者中的肝脏疾病阶段或状况的试剂盒,该试剂盒可包含用于检测至少一种标志物的至少一种试剂和用于检测至少一种肝脏疾病阶段相关多核苷酸的至少一种试剂。所述至少一种肝脏疾病阶段相关多核苷酸或标志物可包含无细胞多核苷酸。所述至少一种标志物可包含RNA。所述至少一种肝脏疾病阶段相关多核苷酸可包含至少一种组织特异性RNA,其中组织特异性RNA是仅在特定组织中表达或在特定组织中比在其他组织中以显著更高水平表达的RNA。例如,组织特异性基因可以是在特定组织或一组组织中的表达至少2倍、5倍、10倍或25倍于其他任何组织或一组组织(例如,任何单独的,或者所有其他组织或一组组织相组合)的基因。所述至少一种疾病相关多核苷酸或标志物可包含至少一种疾病相关的甲基化DNA,其中该疾病相关的甲基化DNA可包含疾病相关的甲基化模式。备选地或另外地,该疾病相关的甲基化DNA可包含具有甲基化模式的DNA,该DNA仅在一种组织中发生或在某组织中比在其他组织中以显著更高的水平发生。如果(a)至少一种标志物的水平高于所述至少一种标志物的参考水平,并且(b)至少一种疾病相关多核苷酸的水平高于所述至少一种疾病相关多核苷酸的参考水平,则可以确定该组织被状况损害。所述至少一种疾病相关多核苷酸可包含两种或更多种多核苷酸,每种多核苷酸对不同组织(例如,2、3、4、5、10、15、25种或更多种不同组织)是特异性的。该组织可以是肝组织。所述标志物和/或肝脏疾病阶段相关多核苷酸可以对应于基因。通常,如果标志物或肝脏疾病阶段相关多核苷酸是包含基因的DNA分子(或其可识别部分),或者是基因的表达产物(例如RNA转录物或蛋白质产物),则该标志物或肝脏疾病阶段相关多核苷酸“对应于基因”。

本文进一步公开了用于实施本公开的方法的系统。通常,该系统可包含能够执行本文公开的方法的步骤的各种单元,例如样品处理单元、扩增单元、测序单元、检测单元、定量单元、比较单元和/或报告单位。在一些实施方案中,该系统可包括:存储单元,其被配置为存储以下测定的结果:(i)用于检测受试者第一样品中的至少一种状况的至少一种标志物的测定,和(ii)用于检测受试者第二样品中的至少一种疾病相关RNA的测定,其中所述至少一种肝脏疾病阶段相关RNA是对组织具有特异性的无细胞RNA;至少一个处理器,其被编程为:(i)对至少一种标志物的水平进行定量;(ii)对至少一种肝脏疾病阶段相关多核苷酸的水平进行定量;(iii)将所述至少一种标志物的水平与该标志物的相应参考水平进行比较;(iv)将所述至少一种肝脏疾病阶段相关多核苷酸的水平与该肝脏疾病阶段相关多核苷酸的相应参考水平进行比较;以及(v)基于所述比较,确定至少一种状况对肝脏的损伤的存在或相对变化;以及向接收者传送报告的输出单元,其中该报告提供步骤(b)的结果。该系统可以基于步骤(b)的结果提供对医疗行为的推荐。该医疗行为可包括治疗。第一样品和第二样品可以是相同的。第一样品和第二样品可以是不同的。第一样品和第二样品的不同可以在于它们在不同时间获得。第一样品和第二样品的不同可以在于它们是不同的流体。第一和/或第二样品可以是选自下组的流体:全血、血浆、血清、血液成分、唾液、痰液、尿液、精液、经阴道液、脑脊液、汗液或乳房液。第一和/或第二样品可以是血浆或血清。

本文公开的系统可以与本文公开的任何一个试剂盒或装置一起使用。该系统可以与本文公开的任何一个试剂盒或装置集成。本文公开的装置可包含任何一种本文公开的系统。在一些实施方案中,该系统可包含计算机系统。该系统中使用的计算机可包含至少一个处理器。处理器可与至少一个控制器、计算单元和/或计算机系统的其他单元相关联,或者根据需要植入到固件中。如果在软件中实现,则例程可以存储在任何计算机可读存储器如RAM、ROM、闪速存储器、磁盘、光盘或其他合适的存储介质中。同样,该软件可通过任何已知的传送方法传送到计算设备中,该传送方法包括,例如,通过诸如电话线、因特网、无线连接等通信信道,或经由诸如计算机可读磁盘、闪存驱动器等可移动介质。各个步骤可以作为各个区块、操作、工具、模块或技术来实现,后者又可以以硬件、固件、软件或者硬件、固件和/或软件的任意组合来实现。当以硬件实现时,一些或所有区块、操作、技术等可以在例如定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、可编程逻辑阵列(PLA)等中实现。可以在系统的实施方案中使用客户端-服务器关系数据库架构。客户端-服务器架构是网络架构,其中网络上的每个计算机或进程都是客户端或服务器。服务器计算机通常是用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)的强力计算机。客户端计算机包括用户运行应用程序的PC(个人计算机)或工作站,以及如本文公开的示例输出设备。客户端计算机依赖服务器计算机来获取资源,如文件、设备甚至处理能力。在一些实施方案中,服务器计算机处理所有数据库功能。客户端计算机可具有处理所有前端数据管理的软件,并且还可以接收来自用户的数据输入。

本文公开的系统可以被配置为接收关于对样品进行检测反应的用户请求。用户请求可以是直接的或间接的。直接请求的实例包括通过输入设备如键盘、鼠标或触摸屏传输的请求。间接请求的实例包括通过通信介质的传输,如通过因特网(有线或无线)的传输。

本文公开的系统可进一步包含报告生成器,后者向接收者发送报告,其中该报告包含本文所述方法的结果。可以实时生成报告,如在测序读取期间或在分析测序数据时,随着过程的进展定期更新。另外或备选地,可以在分析结束时生成报告。在一些实施方案中,该报告响应于来自用户的指令而生成。除了检测或比较的结果之外,报告还可以包含基于这些结果的分析、结论或推荐。例如,检测与肝脏疾病阶段或状况相关的标志物并且肝脏疾病阶段相关多核苷酸的水平高于正常范围,报告可以包括关于该关联的信息,如受试者具有肝脏疾病阶段或状况的可能性、哪些组织受到或不受影响,和/或基于该信息的建议(例如另外的测试、监测或补救措施)。报告可以采用多种形式。可以设想,与本公开相关的数据可以通过这样的网络或连接(或用于传输信息的其他任何合适的手段,包括但不限于邮寄实物报告,如打印的报告)进行传输,以供接收者接收和/或查看。接收者可以是但不限于个体或电子系统(例如,至少一个计算机,和/或至少一个服务器)。

本公开提供了一种包含代码的计算机可读介质,该代码在被至少一个处理器执行时,实现本公开的方法。包含计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,如任何计算机中的任何存储设备等,例如可用来实现数据库等。易失性存储介质包括动态存储器,如这样的计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外线(IR)数据通信期间生成的那些信号或波。因此,计算机可读介质的常见形式包括,例如:软盘、柔性盘、硬盘、磁带、其他任何磁性介质、CD-ROM、DVD或DVD-ROM、其他任何光学介质、穿孔卡片纸带、其他任何具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、其他任何存储器芯片或匣盒、传输数据或指令的载波、传输这类载波的线缆或链路,或者计算机可以从中读取编程代码和/或数据的其他任何介质。这些计算机可读介质形式中的许多形式可以参与将至少一个指令的至少一个序列运载到处理器以供执行。

如前述和以下描述中所讨论的,本文提供了方法、系统和试剂盒,其可以非侵入性地检测受胁迫的肝脏,以及确定哪个肝脏疾病阶段或状况正在影响受胁迫的肝脏。本文提供了采用肝脏疾病相关基因表达、肝脏疾病相关核酸(例如,RNA)和肝脏疾病相关核酸修饰(例如,甲基化模式)的试剂盒、装置、系统和方法。术语“肝脏疾病相关的核酸”和“肝脏疾病相关多核苷酸”如本文所用是可互换的。如本文所用的术语“肝脏疾病相关的”通常用于表征在受试者肝脏的正常功能期间表达的核酸。或者,如本文所用的术语“肝脏疾病相关的”通常用于表征主要在受试者的肝脏中表达的核酸。对于本申请而言,主要表达可以意指肝脏疾病相关核酸以一定的RNA水平表达,该RNA水平在肝脏组织中比在没有肝脏疾病的受试者的肝脏组织中或受胁迫的肝脏中的肝脏疾病相关核酸的RNA水平高至少50%。然而,在一些情况下,以在肝脏组织中比在没有肝脏疾病的受试者的肝脏组织中或受胁迫的肝脏中的RNA水平高至少30%的RNA水平表达的肝脏疾病相关核酸可能足以用于本文公开的方法。在其他情况下,本文公开的方法使用以在具有肝脏疾病阶段的个体中比在没有肝脏疾病阶段的个体中高至少80%的RNA水平表达的疾病相关核酸。

本文提供了用于对来自受试者的样品中的生物分子进行检测或定量的试剂盒、系统和方法,作为非限制性实例,该生物分子包括多核苷酸、肽/蛋白质、脂质和甾醇。本文公开的生物分子可以是与肝脏疾病阶段相关的。如本文所用的术语“肝脏疾病阶段相关的”通常是指生物分子或其修饰,其在肝脏疾病特定阶段的肝脏组织中的表达水平高于在没有肝脏疾病的受试者的肝脏组织中或处于肝脏疾病不同阶段的肝脏中的表达水平。

本文提供了用于对样品中的肝脏疾病阶段相关多核苷酸进行检测或定量的试剂盒、系统和方法。可以使用至少一个遗传信息数据库来鉴定肝脏疾病阶段相关多核苷酸或一组肝脏疾病阶段相关多核苷酸。因此,本公开的各方面提供了用于数据库使用和开发的系统和方法。本公开的方法可以利用包含跨组织类型生成的现有数据的数据库来鉴定疾病相关的基因。这类数据库可用于鉴定肝脏疾病阶段相关的基因。该数据库可以是基于网络的基因表达谱。基于网络的基因表达组库的非限制性实例可公开获得,例如,www.proteinatlas.org上的人类蛋白质图谱(Human Protein Atlas)、biogps.org上的BioGPS和www.ebi.ac.uk/gxa/上的欧洲生物信息学研究所表达图谱(EuropeanBioinformatics Institute Expression Atlas)、ncbi.nlm.nih.gov/geo/的基因表达综合数据库(Gene Expression Omnnibus)(GEO),以上全部内容均通过引用并入本文。此类数据库也可作为印刷期刊和在线期刊上发表的文章公开获取。数据库也可称为图谱,例如,Human 133A/GNF1H Gene Atlas(参见Su等人,Proc Natl Acad Sci U S A,2004,vol.101,pp.6062-7,原始出版物)和RNA-Seq Atlas(参见Krupp等人,Bioinformatics,2012,vol.15,pp.1184-5,原始出版物),两者均通过引用并入本文。这些数据库和网站包含来自许多独立研究的数据,并且经常证实物种中的组织特异性基因表达模式。这样的交叉验证可为本文公开的方法、系统和试剂盒提供有用的肝脏疾病阶段相关多核苷酸。在一些情况下,本文公开的肝脏疾病阶段相关多核苷酸可通过至少两个公开的数据集被鉴定为具有组织特异性表达。在一些情况下,本文公开的肝脏疾病阶段相关多核苷酸可通过至少三个公开的数据集被鉴定为具有组织特异性表达。在一些情况下,本文公开的肝脏疾病阶段相关多核苷酸可通过至少四个公开的数据集被鉴定为具有组织特异性表达。在一些情况下,本文公开的肝脏疾病阶段相关多核苷酸可通过至少五个公开的数据集被鉴定为具有组织特异性表达。为了从至少一个数据库中鉴定肝脏疾病阶段相关的转录物,某些实施方案对数据库采用模板匹配算法。用于过滤数据的模板匹配算法是已知的,参见例如Pavlidis P,Noble WS(2001)Analysis of strain and regional variation in gene expression inmouse brain.Genome Biol 2:research0042.1-0042.15。组织特异性基因的实例包括在通过引用并入本文的US20130252835的图18中出现的基因。

本文提供了用于对样品中的肝脏疾病阶段相关多核苷酸进行检测或定量的试剂盒、系统和方法。肝脏疾病阶段相关核酸可指在受试者群体中的每个受试者的肝脏中表达的核酸。肝脏疾病阶段相关核酸可指主要在受试者群体中的每个受试者的肝脏中表达的核酸。受试者群体可以是健康的。受试者群体可具有共同的肝脏疾病阶段或状况。受试者群体可包含至少两个受试者。受试者群体可包含至少五个受试者。受试者群体可包含至少十个受试者。受试者群体可包含至少二十个受试者。受试者群体可具有共同的种族、共同的遗传背景、共同的BMI、共同的代谢失调、共同的性别、共同的年龄或其组合。肝脏疾病阶段相关核酸可指在肝脏中表达的或主要在肝脏中表达的核酸,如例如公开的研究或数据库所示。公开的研究可采用微阵列技术或RNA-seq概况分析来测定组织特异性核酸水平。在一些情况下,肝脏的损害是由导致肝脏中的细胞凋亡,从而将无细胞肝脏疾病阶段相关核酸释放到受试者的循环流体中的肝脏疾病阶段或状况引起的。肝脏疾病阶段相关核酸可以是在肝脏中足够高度表达的核酸,从而当发生肝脏的损害时,可以在循环生物流体(例如血液、血浆等)中检测到该核酸。肝脏疾病阶段相关核酸可以是在肝脏中足够高度表达的核酸,从而当发生至少约10%、至少约20%、至少约30%、至少约40%或至少约50%的肝脏的损害时,可以在循环生物流体(例如血液、血浆等)中检测到该核酸。

本文公开了用于检测、定量和/或分析肝脏疾病阶段相关多核苷酸的方法、试剂盒和系统。通常,肝脏疾病阶段相关多核苷酸可以是无细胞多核苷酸,其在肝脏损害、炎症或损伤时释放到生物流体(例如,血液、脑脊液、淋巴液、尿液等)中。如本文所用的,肝脏的损害或损伤可能是由于导致肝脏表面内或表面上的至少一个细胞的细胞膜破坏或细胞膜完整性丧失的肝脏疾病阶段或状况所致。肝脏的损害或损伤可能是由于导致与肝脏疾病阶段相关的炎症、肝纤维化或再生的肝脏疾病阶段或状况所致。细胞膜的破坏或细胞膜完整性的丧失可导致细胞内多核苷酸的释放。细胞膜的破坏可能是由于例如坏死、自溶或凋亡。与肝脏疾病阶段相关的再生可导致多核苷酸的释放。肝脏疾病阶段相关多核苷酸的非限制性实例包括肝脏疾病阶段相关RNA和包含疾病相关甲基化模式的DNA。疾病相关RNA可包括但不限于信使RNA(mRNA)、微小RNA(miRNA)、pre-miRNA、pre-miRNA、pre-mRNA、环状RNA(circRNA)、长非编码RNA(lncRNA)和外来体RNA。本文提供了具有肝脏疾病阶段相关表达的基因的实例。

本文提供了用于对来自受试者的样品中的生物分子进行检测或定量以用于以用于研究和开发应用的试剂盒、系统和方法。本文公开的生物分子可以是与肝脏疾病相关的。如本文所用的术语“肝脏疾病相关的”通常是指生物分子或其修饰,其在患有肝脏疾病的受试者中的表达水平高于在没有肝脏疾病或肝脏疾病阶段的受试者中的表达水平。肝脏疾病相关的生物分子可以是本文公开的无细胞mRNA。该疾病可以是肝脏疾病,其中受试者被分类为具有以下肝脏疾病阶段之一:没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)和硬化(F4)。

疾病相关生物分子(例如,肝脏疾病相关生物标志物)的检测或定量可用于临床前治疗靶标发现。疾病相关生物分子的检测或定量可用于靶标参与的临床前测量。疾病相关生物分子的检测或定量可用来跟踪、检测和测量用于治疗/药物发现和开发的感兴趣的靶标。

疾病相关的无细胞mRNA(例如,肝脏疾病相关的无细胞mRNA)的检测或定量可用来确定基因特征和生物标志物发现,以用于临床前和临床研究中的患者分层。

疾病相关的无细胞mRNA(例如,肝脏疾病相关的无细胞mRNA)的检测或定量可用来优化后期先导分子优化,以用于进一步的临床开发。疾病相关的无细胞mRNA的检测或定量可用来测量药效学,以用于治疗/药物发现和开发过程中的先导物优化和临床开发。疾病相关的无细胞mRNA的检测或定量可用来创建基因表达谱,其表征与用于治疗/药物发现和开发的特定靶标的参与相关的药效学效应。疾病相关的无细胞mRNA的检测或定量可用来检测用于治疗/药物发现和开发的药效学靶标参与的变化。

疾病相关的无细胞mRNA(例如,肝脏疾病相关的无细胞mRNA)的检测或定量可用来测量在治疗该疾病的候选药物的早期临床开发中的靶分子参与。疾病相关的无细胞mRNA的检测或定量可以在选择候选物进行IND申请的方法中使用。疾病相关的无细胞mRNA(例如,肝脏疾病相关的无细胞mRNA)的检测或定量可用来在设定的时间段内定期在时间点测量靶分子参与。该时间点可以等于或少于每1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周或其他任何合适的时间段。该时间点可以等于或大于每1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周或其他任何合适的时间段。设定的时间段可以少于或等于1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月、13个月、14个月、15个月、16个月、17个月、18个月、19个月、20个月、21个月、22个月、23个月、2年、3年、4年、5年或10年。设定的时间段可以长于或等于1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月、13个月、14个月、15个月、16个月、17个月、18个月、19个月、20个月、21个月、22个月、23个月、2年、3年、4年、5年或10年。

疾病相关的无细胞mRNA(例如,肝脏疾病相关的无细胞mRNA)的检测或定量可用来制定终点,以评价施用于受试者的治疗剂的相对治疗功效。

无细胞mRNA疾病特征(例如,无细胞mRNA肝脏疾病特征)的发展可用来评价选治疗剂的相对毒性或受试者对治疗剂的反应。例如,接受针对第一疾病的第一处方的受试者然后可以通过监测本文公开的肝脏疾病相关无细胞mRNA基因小组来密切跟踪所给予的第一处方中的药物与候选治疗剂之间的毒性相互作用。

肝脏疾病相关的生物分子可以是生物分子或其修饰,其在肝脏组织中的表达水平高于在受试者的其他任何组织中的表达水平。肝脏疾病相关的生物分子可以是生物分子或其修饰,其在肝脏的肝细胞中以更高水平表达。在一些情况下,其在肝脏组织中的表达比在受试者的其他任何组织中高至少10%。在一些情况下,其在肝脏组织中的表达比在受试者的其他任何组织中高至少20%。在一些情况下,其在肝脏组织中的表达比在受试者的其他任何组织中高至少30%。在一些情况下,其在肝脏组织中的表达比在受试者的其他任何组织中高至少40%。在一些情况下,其在肝脏组织中的表达比在受试者的其他任何组织中高至少50%。因此,可以认为肝脏疾病相关的生物分子主要存在于肝脏组织中或主要在肝脏组织中表达。本文公开的疾病相关生物分子可以是疾病相关多核苷酸。疾病相关多核苷酸是以疾病相关方式表达或修饰的核酸。例如,可能只有单个组织或器官或者一小组组织或器官主要有特定基因的表达(例如,受试者中基因总表达的60-80%、90%、95%或更多)。

在一些情况下,本文公开的方法可包括将单个疾病相关多核苷酸的水平与该疾病相关多核苷酸的相应参考水平进行比较,这可能足以确定组织是否已被肝脏疾病或状况损害。在其他情况下,可以将多种疾病相关多核苷酸的水平与所述疾病相关多核苷酸的相应参考水平进行比较,以确定组织是否已被肝脏疾病或状况损害。本文公开的方法可包括将少至1、2、3、4、5、6、7、8、9或10个疾病相关多核苷酸的水平与相应的参考水平进行比较,以确定组织是否已被肝脏疾病或状况损害。将少至1、2或3个疾病相关多核苷酸与相应的参考水平进行比较可能是有利的。

在一些情况下,本文公开的将疾病相关多核苷酸的水平与疾病相关多核苷酸的相应参考水平进行比较的方法可导致确定疾病相关多核苷酸的水平高于相应的参考水平。在一些情况下,相应的参考水平可以是健康个体中疾病相关多核苷酸的水平,并且疾病相关多核苷酸的水平高于相应的参考水平可指示对受试者中的特定组织、器官或细胞的损害或损伤。疾病相关多核苷酸的水平可以比相应的参考水平高至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约100%、至少约150%或至少约200%。

在一些情况下,本文公开的将疾病相关多核苷酸的水平与疾病相关多核苷酸的相应参考水平进行比较的方法可导致确定疾病相关多核苷酸的水平低于相应的参考水平。在一些情况下,相应的参考水平可以是具有肝脏疾病或状况的个体或群体中疾病相关多核苷酸的水平,并且疾病相关多核苷酸的水平低于相应的参考水平可指示对受试者中特定组织、器官或细胞的损害或损伤不存在或者程度最低。疾病相关多核苷酸的水平可以比相应的参考水平低至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约95%。

定义本文公开的核酸和多肽的任何已知变体和衍生物或可能出现的变体和衍生物的一种方式是通过根据与特定已知序列的同源性来定义变体和衍生物。一般而言,本文公开的核酸和多肽的变体通常与所述序列或天然序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%或99.9%的同源性。本领域技术人员容易理解如何确定两个多肽或核酸的同源性。例如,可以在将两个序列比对后计算同源性,使得同源性处于最高水平。

另一种计算同源性的方式可以通过公开的算法来进行。用于比较的序列最佳比对可以通过Smith and Waterman Adv.Appl.Math.2:482(1981)的局部同源性算法、通过Needleman and Wunsch,J.MoL Biol.48:443(1970)的同源性比对算法、通过Pearson andLipman,Proc.Natl.Acad.Sci.U.S.A.85:2444(1988)的相似性搜索方法、通过这些算法(威斯康星遗传学软件包(Wisconsin Genetics Software Package,Genetics ComputerGroup,575Science Dr.,Madison,Wis.)中的GAP、BESTFIT、FASTA和TFASTA;Tatusova andMadden FEMS Microbiol.Lett.174:247-250(1999)的BLAST算法,可从国家生物技术信息中心(National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/blast/b12seq/b12.html)获得)的计算机化实现或通过观察来进行。

可以通过例如Zuker,M.Science 244:48-52,1989、Jaeger等人.Proc.Natl.Acad.Sci.USA 86:7706-7710,1989、Jaeger等人.Methods Enzymol.183:281-306,1989中公开的算法获得核酸的相同类型的同源性,这些文献中至少与核酸比对相关的材料通过引用并入本文。应当理解,通常可以使用任何方法,并且在某些情况下,这些不同方法的结果可能不同,但是技术人员应当理解,如果使用这些方法中的至少一种发现了同一性,则可以说该序列具有声称的身份。

例如,如本文所用的,被描述为与另一序列具有特定同源性百分比的序列是指具有通过上述任何一种或多种计算方法计算的所述同源性的序列。例如,如果使用Zuker计算方法计算出第一序列与第二序列具有80%的同源性,则第一序列与第二序列具有80%的如本文定义的同源性,即使通过任何其他计算方法计算,第一序列与第二序列不具有80%的同源性。作为另一个实例,如果使用Zuker计算方法以及Pearson和Lipman的计算方法均计算出第一序列与第二序列具有80%的同源性,则第一序列与第二序列具有80%的如本文定义的同源性,即使通过Smith和Waterman的计算方法、Needleman和Wunsch的计算方法、Jaeger计算方法任何其他计算方法计算,第一序列与第二序列不具有80%的同源性。作为又一个实例,如果使用每种计算方法计算出第一序列与第二序列具有80%的同源性(尽管在实践中,不同的计算方法通常会导致不同的计算同源性百分比),则第一序列与第二序列具有80%的如本文定义的同源性。

本文公开的肝脏疾病阶段相关多核苷酸可被描述为“对应于基因”。在一些情况下,如本文所用的短语“对应于基因”通常意指疾病相关多核苷酸由基因转录。因此,在一些情况下,疾病相关多核苷酸是疾病相关的RNA转录物。疾病相关的RNA转录物包括但不限于全长转录物、转录物片段、转录物剪接变体、酶促或化学切割的转录物、来自两个或更多个融合基因的转录物和来自突变基因的转录物。片段和切割的转录物必须保留足够的全长多核苷酸,以便可被识别为对应于基因。在一些情况下,5%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,10%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,15%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,20%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,25%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,30%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,40%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,50%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,短语“对应于基因”意指疾病相关多核苷酸是基因的修饰形式(例如,疾病相关的DNA修饰模式)。

肝脏疾病阶段或状况的标志物

如前述和以下描述中所讨论的,本文提供了方法、系统和试剂盒,其可非侵入性地检测受胁迫的组织或器官,以及确定哪种肝脏疾病阶段或状况正在影响受胁迫的组织或器官。本文公开了用于检测、定量和/或分析肝脏疾病或状况的至少一种标志物的方法、试剂盒和系统。类似于本文公开的肝脏疾病阶段相关多核苷酸,标志物可以是无细胞多核苷酸,其在肝脏损害、损伤或再生时释放到生物流体(例如,血液、脑脊液、淋巴液、尿液等)中。在一些情况下,肝脏疾病阶段或状况的至少一种标志物可包含本文公开的肝脏疾病阶段相关多核苷酸。肝脏的损害或损伤可能是由于导致组织或器官表面之内或之上的细胞溶解的肝脏疾病阶段或状况所致。肝脏的再生可能是由于导致组织或器官表面之内或之上的细胞溶解的肝脏疾病阶段或状况所致。

作为非限制性实例,本文公开的标志物可选自肽、蛋白质、适体、抗体、细胞片段、甾醇(例如,胆固醇)、激素、脂质、磷脂、脂肪酸、糖部分、维生素、代谢物和细胞外基质组分、其复合物及其化学修饰。化学修饰可包括但不限于磷酸化、肉豆蔻酰化、棕榈酰化、乙酰化、甲基化、类泛素化、糖基化和泛素化。本文公开的方法可包括检测这些标志物的测定。可获得多种合适的测定,其选择可取决于待检测标志物的类型。作为非限制性实例,这些测定包括ELISA、Western印迹法、凝胶电泳和报道分子测定。用于任何或多种肝脏疾病或状况的任何合适数目的标志物可以平行地或在单一反应中进行测定。例如,测定可包括检测至少5、10、25、50、75、100、250、500、1000种或更多种标志物,以用于评估至少1、2、3、4、5、10、15、25种或更多种肝脏疾病或状况。可以采用用于此类多重反应的任何方便的测定形式,其实例在本文中提供,包括但不限于微阵列分析和高通量测序方法。

本文公开了用于检测、定量和/或分析肝脏疾病阶段或状况的至少一种标志物的方法、试剂盒和系统,其中该标志物是无细胞多核苷酸。作为标志物的无细胞多核苷酸的非限制性实例包括RNA和DNA(包括包含疾病相关的甲基化模式的DNA)。可用作肝脏疾病或状况标志物的RNA的实例包括但不限于信使RNA(mRNA)、微小RNA(miRNA)、pre-miRNA、pri-miRNA、pre-mRNA、真核RNA、原核RNA、病毒RNA、细菌RNA、寄生虫RNA、真菌RNA、类病毒RNA、拟病毒RNA、环状RNA(circRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、pre-tRNA、长非编码RNA(lncRNA)、小核RNA(snRNA)和外来体RNA。DNA可包括单链DNA、双链DNA、DNA-蛋白质复合物、线粒体DNA、细菌DNA和具有特定化学修饰模式的DNA(例如,甲基化DNA)。细菌DNA/RNA可包括肠道生物体的DNA/RNA,并且可以是饮食敏感性、肠道状况或代谢状况的标志物。

受试者样品中至少一种标志物的存在或相对量或绝对量可以指示肝脏疾病阶段或状况的存在、阶段或进展,对施用于受试者以治疗肝脏疾病阶段或状况的疗法的反应,或指示受试者如何对特定治疗作出反应。在一些情况下,相对于参考水平,样品中至少一种标志物的较低水平可以指示肝脏疾病或状况的存在、阶段或进展,或对施用于受试者以治疗肝脏疾病阶段或状况的疗法的反应。在一些情况下,相对于参考水平,样品中至少一种标志物的较高水平可以指示肝脏疾病阶段或状况的存在、阶段或进展,或对施用于受试者以治疗肝脏疾病阶段或状况的疗法的反应。所述至少一种标志物的突变或特定序列可以指示肝脏疾病阶段或状况的存在或进展,或对施用于受试者以治疗肝脏疾病阶段或状况的疗法的反应。具有特定突变或序列的至少一种标志物的量可以指示肝脏疾病阶段或状况的存在或进展,或对施用于受试者以治疗肝脏疾病阶段或状况的疗法的反应。

本文公开的标志物可被描述为“对应于基因”。在一些情况下,如本文所用的短语“对应于基因”通常意指标志物由基因转录。因此,在一些情况下,标志物是RNA转录物。RNA转录物包括但不限于全长转录物、转录物片段、转录物剪接变体、酶促或化学切割的转录物、来自两个或更多个融合基因的转录物和来自突变基因的转录物。片段和切割的转录物必须保留足够的全长多核苷酸,以便可识别为对应于基因。在一些情况下,5%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,10%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,15%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,20%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,25%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,30%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,40%的全长多核苷酸是足够的全长多核苷酸。在一些情况下,50%的全长多核苷酸是足够的全长多核苷酸。

在一些情况下,如本文所用的短语“对应于基因”通常意指疾病相关多核苷酸是基因的修饰形式(例如,疾病相关的DNA修饰模式)。在一些情况下,如本文所用的短语“对应于基因”通常意指标志物是由基因编码的蛋白质。该蛋白质可以是全长蛋白质、切割的蛋白质、蛋白质片段、蛋白质的前体形式(例如,在天然发生的酶促切割之前)、蛋白质的不溶性形式、可溶性蛋白质、分泌的蛋白质、细胞死亡后从细胞释放的蛋白质或在组织损伤时从组织释放的蛋白质。片段和切割的蛋白质必须保留足够的全长蛋白质,以便可识别为对应于基因。在一些情况下,5%的全长蛋白质是足够的全长蛋白质。在一些情况下,10%的全长蛋白质是足够的全长蛋白质。在一些情况下,15%的全长蛋白质是足够的全长蛋白质。在一些情况下,20%的全长蛋白质是足够的全长蛋白质。在一些情况下,25%的全长蛋白质是足够的全长蛋白质。在一些情况下,30%的全长蛋白质是足够的全长蛋白质。在一些情况下,40%的全长蛋白质是足够的全长蛋白质。在一些情况下,50%的全长蛋白质是足够的全长蛋白质。

肝脏疾病阶段和状况

如前述和以下描述中所讨论的,本文提供了方法、系统和试剂盒,其可以非侵入性地检测受胁迫的肝脏,以及确定哪个肝脏疾病阶段或状况正在影响受胁迫的肝脏。本文公开的方法、试剂盒和系统可提供检测、定量和/或分析肝脏疾病阶段或状况的至少一种标志物。作为非限制性实例,肝脏的反复损伤和再生可导致肝脏的永久性损害或损伤。肝脏损伤可导致细胞死亡、炎症、肝星状细胞活化、细胞裂解或细胞膜破坏,从而导致从相应细胞中释放核酸以及在受试者的生物流体(例如,血液、血浆、血清、脑脊液等)中存在无细胞的疾病相关多核苷酸。可以单独地或组合地使用本公开的方法评估多种肝脏疾病阶段或状况中的任何一种。肝脏疾病阶段或状况的非限制性实例包括NALFD、没有可观察到的纤维化(F0)、无隔膜的门脉纤维化(F1)、具有很少隔膜的门脉纤维化(F2)、中央静脉与门静脉之间的桥接隔膜(F3)、硬化(F4)和NASH。状况可包括受试者的非疾病状况。例如,受试者的状况可包括施用前确定的对治疗方式(例如药物组合物)的反应的可能性,以及施用后对这种治疗的阳性或阴性反应的程度。

实施例

通过参考作为本申请的示例性实施方案而提供的以下非限制性实施例,可以更好地理解本申请。提出以下实施例是为了更全面地说明实施方案,然而绝不应解释为限制本申请的宽泛范围。

实施例1:临床上表征的NAFLD患者群组中全转录组cf-mRNA的分析

使用内部开发的NGS(下一代测序)测定,在临床上表征的NAFLD患者群组中进行全转录组无循环信使RNA(cf-mRNA)表达分析。对来自3个患者群组的369名受试者进行了测试,以通过纤维化对肝脏疾病阶段进行分层。NAFLD进展可通过参与纤维化、炎症、内皮血管发育和适应性免疫、肝星状细胞活化、PI3/AKT信号传导、甲状腺癌信号传导、IGF-1信号传导、G2/M DNA损伤检查点调节、突触发生信号传导途径、上皮粘附连接信号传导、癌症的分子机制、B细胞信号传导中的系统性红斑狼疮、生殖细胞-赛尔托利细胞连接信号传导、FXR/RXR信号传导等的途径来调节。在208名个体的群组中,开发了分类器来从非肝脏疾病受试者中鉴别NAFLD及其进展形式NASH(非酒精性脂肪性肝炎)(AUC分别为0.92和0.93)。患有NAFLD的个体不同于患有NASH的个体(AUC=0.77),并且根据肝纤维化阶段(早期:F0和F1,与晚期:F3和F4)对肝脏疾病进展进行分层的能力得到证明,AUC值为0.8。纤维化分层在前瞻性收集的96名和65名受试者的群组中得到验证(AUC=0.83和0.91),具有高特异性和灵敏度。在一些实施方案中,包含纤维化阶段分类器的基因表明调节血管发育和免疫应答的生物过程可以支持对肝纤维化有贡献的机制。本公开包括一类生物标志物在理解脂肪肝疾病中的首次应用。本文的系统和方法可以使得能够利用该测定来阐明肝脏疾病生物学,并转化为研究和药物发现计划。

所有患者样品收集研究均获得其机构IRB(机构审查委员会)的批准。来自非肝脏疾病个体的血清从San Diego Blood Bank获得。NASH个体的回顾性收集的血清从印第安纳大学医学院获得。NAFLD个体的前瞻性收集的样品从佛罗里达大学和印第安纳大学的CTSI生物库(CTSI biorepositories)收集。

从血清中提取无细胞mRNA并以16uL的体积洗脱。1uL提取的cf-mRNA在AgilentRNA 6000Pico芯片(Agilent Technologies,目录号5067-1513)上进行分析,以确认cf-mRNA的成功分离。将5uL提取的cf-mRNA(Thermo Fisher Scientific,目录号4456740)转化为测序文库。使用基于芯片的电泳对NGS文库制备过程进行定性和定量分析,并使用基于qPCR的定量试剂盒(Roche,目录号KK4824)对文库进行定量。使用配对末端75循环测序,在Illumina NextSeq500平台上进行测序。

对于训练和验证群组,对每个样品的中值为870万的过滤读取(范围为8.1-1620万个读取)进行测序。使用FASTQ Generation Application,在Illumina BaseSpace平台上进行碱基判定。去除衔接子序列,并使用cutadapt(v1.11)修剪低质量碱基。短于15个碱基对的读取被排除在后续分析之外。使用STAR(v2.5.2b)与GENCODE v24基因模型,将长于15个碱基对的读取序列与人类参考基因组GRCh38进行比较。使用samtools(v1.3.1)rmdup命令删除重复的读取。使用RSEM(v1.3.0)从去重复的BAM文件计算基因表达水平。

进行非负矩阵分解(NMF)以将归一化的来自cf-mRNA的基因表达谱分解为12个成分。NMF分解使用sciki-learn Python文库中的“分解.NMF”类别,以使得跨样品共有相似表达模式的基因以无监督的方式分组在一起。可归因于特定成分的>40%负载的基因被认为在该成分中富集。对于每个成分,选择在该成分中富集的基因并检查以下内容:1)它们在GTEx中51个人体组织中的表达水平;2)它们在来自Blueprint Epigenome集合的55种人类造血细胞类型中的表达水平;以及3)它们的潜在基因本体功能富集。通过整合这些数据,可以确定对特定成分/一组基因而言细胞类型的富集。

从“训练群组”样品中,获得了来自样品重复的平均每百万个中的转录物(TPM)。使用这些基因表达值,将具有脊正则化的逻辑回归模型应用于诊断NAFL肝脏疾病样品。使用了scikit-learn Python文库内具有L2正则化的逻辑回归方法来实现分类。通过重复15次的交叉验证来确定元参数。在交叉验证的每次迭代过程中,随机保留群组的40%作为测试集;使用训练集(群组的剩余60%)构建分类器,然后应用于测试集。通过在不同的阈值截止值下将真阳性率相对于假阳性率作图来计算受试者工作特征(ROC)曲线。针对交叉验证的15次迭代中的每一次计算ROC曲线下面积(AUC)。从这15次交叉验证计算平均ROC曲线,并选择具有最佳平均AUC的元参数。对于纤维化分类,将纤维化阶段0和1样品指定为“早期”样品,而将纤维化阶段3和4样品指定为“晚期”样品。将具有所选元参数的分类器拟合于整个“训练群组”,并将衍生的模型应用于验证群组。

在一些实施方案中,本文的系统和方法通过将表达数据与多重qPCR读数(Fluidigm BioMark

表1

为了测试cf-mRNA NGS概况分析在诊断和鉴定NAFLD的肝脏疾病状态中的临床有效性,对来自208个回顾性收集的经活检验证的样品的群组的血清进行了处理,其包含“训练”群组。肝纤维化分类器在2个前瞻性收集的患者群组中重新验证:“重新验证群组#1”(n=96名受试者)和“重新验证群组#2”(n=65名受试者)。这3个研究群组的受试者的关键临床参数在图2A-D和3A-F中突出显示。

对来自提取的血清cf-mRNA的技术重复的全转录组数据分析表明,基因表达测量具有出色的技术重现性(log

在一些实施方案中,使用cf-mRNA表达谱对NAFLD进行诊断和分层。在一些实施方案中,应用NMF(非负矩阵分解)从复杂基因表达数据集中提取生物学相关信息。将NMF应用于包含训练和验证#1群组的受试者cf-mRNA表达谱,鉴定了12种共表达的成分。正如预期的那样,通过对GTEx数据库进行交叉引用,确定了这些NMF衍生成分中的若干成分含有高度富含与血细胞相关的RNA特征的基因,所述血细胞例如是RBC(红细胞)、PMN(多形核白细胞)和血小板(数据未示出)。鉴定了高度富含肝脏特异性转录物的成分(成分6)(图7A和表2)。鉴定了高度富含肝纤维化基因的成分(图6D)。该成分与通过肝活检确定的纤维化阶段相关。鉴定了富含炎性和内皮基因的成分(图6D)。该成分与通过肝活检确定的肝脏炎症相关。

表2

表2显示了来自cf-mRNA的肝脏特异性NMF衍生成分6的前50个基因。

对NMF成分6中的基因进行的更仔细的检查揭示了与非肝脏病变对照(平均64个基因)相比,在NASH(平均113个基因)与NAFLD(平均85个基因)个体的cf-mRNA中检测到数目增加的肝脏特异性基因(P<0.001)。这些分析还表明,与NAFLD相比,在NASH中鉴定的cf-mRNA肝脏特异性基因的数目显著更多(P=0.013)(图7B),从而证明了存在与肝脏疾病严重程度相关的cf-mRNA肝脏特异性基因。从上到下,图7A的纵轴为BL、PC、Plt、PMN、RBC、CD4_TL、甲状腺、睾丸、脑-前扣带回皮层(BA24)、皮肤-未暴露于阳光(耻骨上)、阴道、心脏-心耳、脑-伏核(基底神经节)、脑-尾状核(基底神经节)、食道-肌层、脑-壳核(基底神经节)、垂体、乳房-乳腺组织、肾上腺、子宫颈-宫颈内膜、子宫颈-外宫颈、脑-小脑、食道-粘膜、膀胱、小肠-回肠末端、动脉-冠状动脉、肝脏(突出显示)、食道-胃食管连接、脑-下丘脑、动脉-主动脉、前列腺、脑-杏仁核、胰腺、脑-小脑半球、脂肪-皮下、皮肤-阳光暴露的(小腿)、脾、脑-海马体、心脏-左心室、脑-皮质、动脉-胫动脉、肾-皮质、脑-脊髓(颈C-1)、子宫、胃、卵巢、小唾液腺、全血、结肠-横结肠、输卵管、脑-额皮层(BA9)、脂肪-内脏(网膜)、肺、细胞-转化的成纤维细胞、肌肉-骨骼肌、结肠-乙状结肠、神经0-胫神经、脑-黑质和细胞-EBV转化的淋巴细胞。

接下来,使用cf-mRNA基因表达谱诊断NAFL相关的肝脏疾病状态。使用逻辑回归模型,使用来自训练群组的cf-mRNA基因表达谱对NAFLD进行分类。简言之,将群组中的样品随机分到训练集和测试集中。分类器在训练测试数据上进行训练,由其使用测试集数据计算ROC(受试者工作特征)曲线和相关的AUC(曲线下面积)值。从这些研究中,分别证明了用0.92和0.93的AUC值诊断NAFLD和NASH的能力。此外,用0.77的AUC值实现了NAFLD与NASH的分层(图8B-D)。在该实施方案中,阴影区域表示从迭代交叉验证生成的AUC标准误差。在肝脏疾病分类模型中具有50个最高系数值的基因列于表3-6中。

表3

表4

表5

表6

这些基因中的数种基因代表典型的肝脏特异性转录物,例如白蛋白、载脂蛋白B和表2中列出的那些。

确定纤维化的阶段在NAFLD临床管理中是有用的。使用训练群组样品,测试了该测定对纤维化阶段进行分层的能力。所得分类器能够以0.92的AUC值将非肝脏病变个体与“晚期”纤维化(F3、F4)进行分层。为了在纤维化阶段内分层,将“早期”(F0、F1)与“晚期”(F3、F4)纤维化受试者(不包括中间F2个体)进行比较,导致分类AUC值为0.81(图14C、图9A-9C)。表3-6中列出了具有50个最大纤维化分化系数值的基因。为了进一步测试分类器在独立患者群组中的效用,证明了在重新验证群组#1和#2中的AUC值分别为0.80和0.91的纤维化分类(图14C、图9A-9C)。图14C显示了使用cf-mRNA基因表达谱对NAFLD相关纤维化阶段进行分层的示例性群组特征和AUC值。

为了了解对纤维化阶段进行分层所需的分类器基因的最少数目,鉴定了具有与纤维化阶段正相关的cf-mRNA基因表达的五个基因(PITPNM2、LIMCH1、FSCN1、CCND1和CASKIN2)。这些基因的cf-mRNA基因表达谱的线性组合模型可以在训练群组样品中以0.72的AUC值对“早期”和“晚期”纤维化阶段进行分层(图10A-10F)。

这些研究不仅证明了cf-mRNA肝纤维化分类器的稳健性,而且还表明了使用一小组靶基因使用cf-mRNA基因表达对肝纤维化进行分层的能力。

还评估了与临床诊断相关NAFLD肝脏疾病分类器有关的参数。对于纤维化分层,在重新验证群组1和2中分别以70%和85%的测定灵敏度实现了80%的特异性水平。由于医疗中心之间的转诊率范围变化很大,因此在一定范围的患者转诊率上测试了该测定的阳性和阴性预测值(PPV和NPV),并在图14B中报告。特别值得注意的是,证明了cf-mRNA测定用于肝纤维化分层的出色NPV。图14B显示了在不同的测定灵敏度和特异性阈值下,肝纤维化分类器在2个前瞻性收集的NALF群组中的PPV和NPV。

接下来,寻找生物学相关途径,以鉴定与NAFLD分类器相关的生物学相关途径。通过使用NMF从来自训练群组和重新验证1群组的cf-mRNA数据中鉴定成组共表达的基因,证明了在肝纤维化分类器中具有高预测能力的大多数基因(表3-6)富集在NMF衍生的成分10中(表11,图11)。

表11和图11显示了NMF衍生的成分10中具有最高负载分数的前50个基因,其中前50个基因(从左到右)是MLLT4、FSCN1、MYO10、GNA12、RDX、FRMD3、BTBD6、MTSS1L、PLEKHA4、HECW2、TRAF3IP1、NDFIP1、ATXN1L、MTMR2、NUTF2、C16orf62、CTNNA1、PPP1R14B、ZNF362、ZNF358、PFKL、TSTA3、LIMCH1、SHANK3、RABGEF1、PDE2A、SNX8、TBC1D9、PITPNM3、METTL9、MAF、TRIO、MINK1、CKDAL1、TGM2、KIAA0355、PXK、CASKIN2、PEA15、CPOX、FBXW5、PNPLA6、SH3PXD2A、SAV1、TSC22D1、AKR1B1、ITSN1、BTBD1和ABCC1。

使用GO富集分析和Blueprint RNA-seq数据库,表明该成分中的基因在内皮细胞中高度表达,并且富集于与血管发育、脉管系统和血管生成过程相关的功能类别中(图12)。

根据图12,基因从左到右是CRHBP、ZNF366、DNASE1L3、FSCN1、TRIP10、ZN608、ACTA2、CCDC80、ADAMT21、IGFBP4、DDR2、HID1、RAPGEF3、AFAP1L1、IL33、PDE2A、GASH1、FEZ1、FERMT2、MAP1B、DLC1、KIAA1462、DPYSL3、PHLDB1、CNN3、CCND1、CDC43IP1、AMOTL2、PTRF、HECW2、MYH10、S100A16、RASIP1、ROBO4、TEAD2、PLK2、MAMA4、BCL6B、KDR、ADGRF5、ARHGEF15、FGD5、SHE、ECSCR、CALCRL、MPDZ、LDB2、APBB2、PTPRB、ARHGAP29、RAI14、TJP1、AKAP12、MYO10、WWTR1、MYO6、SASH1和SEPT10。根据图12,功能类别从上到下是成年_内皮_祖细胞、备选_活化的_巨噬细胞(突出显示)、带状_嗜中性粒细胞、母细胞形成单位_红系、CD14-阳性_cd16-阴性_经典_单核细胞、CD3-阴性_cd4-阳性_cd8-阳性_双_阳性_胸腺细胞、CD3-阳性_cdr-阳性_cd8-阳性_双_阳性_胸腺细胞、CD34-阴性_cd41-阳性_cd43_阳性_巨核细胞_细胞、CD38-阴性_幼稚_b_细胞、CD4-阳性_alpha_beta_thermocyte、CD4-阳性_alpha_beta_t_细胞、Cd8-阳性_alpha_beta_thermocyte、CD8-阳性_alpha_beta_t_细胞、中央_记忆_cd4-阳性_alpha_beta_t_细胞、中央_记忆_cd8-阳性_alpha_beta_t_细胞、类别_切换的_记忆_b_细胞、集落_形成_单位_红系、普通_淋巴样_祖细胞、普通_髓样_祖细胞、常规_树突_细胞、细胞毒性_cd56-dim_自然_杀伤_细胞、效应_记忆_cd4-阳性_alpha_beta_t_细胞、效应_记忆_cd8-阳性_alpha_beta_t_细胞、效应_记忆_cd8-阳性_alpha_beta_t_细胞_终末_分化的、脐静脉_内皮_细胞_(增殖)(突出显示)、脐静脉_内皮_细胞_(静息)(突出显示)、成红血细胞、生发_中心_b_细胞、粒细胞_单核细胞_祖细胞_细胞、造血_多能_祖细胞_细胞、造血_干_细胞、未成熟_常规_树突_细胞、炎性_巨噬细胞、晚期_嗜碱性_和_多染性_成红血细胞、b_谱系_淋巴细胞、巨噬细胞、成熟_常规_树突_细胞、成熟_嗜酸性粒细胞、成熟_嗜中性粒细胞、巨核细胞-红系_祖细胞_细胞、记忆_b_细胞、骨髓_间充质_干_细胞、单核细胞、骨髓_单核_细胞_幼稚_b_细胞、neuroplastic_浆_细胞、嗜中性_晚幼粒细胞、嗜中性_nyelocyte、破骨细胞、外周_血_单核_细胞、浆_细胞、调节性_t_细胞和分叶核_嗜中性粒细胞_骨髓、未切换的_记忆_b_细胞。

表7:来自NMF分析的前50个成分#10基因

表8:针对血管发育途径富集成分10基因(GO富集分析)

为了测试这种血管发育特征源自cf-mRNA(相对于全血细胞)的特异性,在血浆部分和外周血的cf-mRNA之间比较了NMF衍生的成分10的基因表达,包含所有血细胞(例如,白细胞(WBC)、嗜中性粒细胞、血小板等)。在3个非肝脏病变个体中,NMF成分10的基因主要存在于血液的血浆部分中(图13A-C)。这些数据表明,特定的cf-mRNA基因表达特征可以为血管发育相关途径在肝纤维化中的参与提供独特的见解。

还对为纤维化分类器贡献最高系数的一组500个基因进行了途径分析(IPA,Qiagen)。对于在晚期相比于早期纤维化中下调的基因,观察到参与T细胞应答的基因在统计学上非常显著的富集,如TCR(T细胞受体)信号传导、IL-2和IL-3细胞因子途径和下游JAK途径(表11)。有趣的是,小鼠和人体研究已经报道了肝脏中的产IgA细胞负责抑制T细胞活化和信号传导,并且表明这种抑制会导致NASH向HCC的转变。因此,使用cf-mRNA对晚期纤维化中T细胞信号传导的抑制的观察可以追踪肝脏疾病的严重程度。

表9:在早期和晚期纤维化中具有富集的基因表达的途径

图例:具有最大纤维化分类器系数的500个基因的途径富集,由在晚期(F3、F4)和早期纤维化(F0、F1)中下调的基因表达(TPM)分隔。P<10E-5,P<10E-3(Fisher t检验;(IPA;Qiagen)。

实施例2:基于cf-mRNA的NGS平台应用于从303名受试者的cf-RNA生成的文库

为了确保基于cf-mRNA的NGS平台可以有效地在肝脏疾病中使用,检查了从303名受试者的cf-RNA生成的文库的技术重现性。技术重复的全转录组比较显示出高相关性,表明有稳健的技术重现性(log

实施例3:循环中的NAFLD和肝纤维化特征的鉴定

为了揭示血清cf-mRNA中NAFLD相关的转录组变化,比较了对照个体与NAFL和NASH患者的循环转录组谱。差异表达分析显示了健康对照与NAFL患者之间的广泛差异(1,254个基因失调的FDR<0.05)(图6A)以及对照与NASH患者之间甚至更严重的差异(2,863个失调基因FDR<0.05,图6A)。采用IPA对失调基因的功能分析揭示,在NAFLD患者中上调的基因主要富集在肝脏相关途径中,如多效性LXR/RXR和FXR/RXR信号传导途径中,其参与胆固醇、甘油三酯和葡萄糖代谢,以及反映肝损伤和/或炎症的急性期反应(图6B和图16B)。与对照样品相比,几乎所有在cf-mRNA中检测到的肝脏特异性转录物(例如,白蛋白、APOA2、APOC3)在NASH患者的血清中都上调(图6C和图16C)。此外,与对照个体相比,观察到在NASH和NAFL患者血清中检测到的肝脏特异性基因数显著增加(图16D)。观察到的肝脏特异性基因和途径的失调表明,cf-mRNA反映了肝脏中NAFLD相关的病理变化。

为了更好地理解由循环转录组捕获的信息,研究了cf-mRNA转录物的相关模式。使用所有样品以及随后鉴定的12个不同基因簇——其中许多富集于某些细胞类型或生物过程中,通过非负矩阵分解(NMF)对cf-mRNA转录组进行无监督分解(图16B)。对五个最突出的簇的功能分析显示在图6D中。首先,与之前的分析一致,发现簇7中的基因(n=664个基因)在肝脏相关途径中富集(图2D)。事实上,根据GTEx数据库(21),簇7中前100个基因中有63%是肝脏特异性的(p值<1e-11,超几何检验),提示这些基因起源于肝脏中的肝细胞(图6D)。其次,簇5中基因(n=527个基因)的排名前列的富集IPA途径是“肝星状细胞活化”(p<0.0001)——肝纤维化的中心生物学事件(参考)。进一步支持这些基因与肝纤维化的相关性,该簇的系数与通过肝活检评估的NAFLD患者的纤维化评分相关(r=0.23且p<0.001)。第三,簇11中的基因(n=510)在炎症过程中富集,最重要的经典途径是“干扰素信号传导”(p<0.001)(图6D)。不受任何特定理论的束缚,这些基因可以反映肝脏炎症,因为它们的水平与通过肝活检确定的组织学炎症评分相关(r=0.21且p=0.004,图16F)。总之,这些结果表明,cf-mRNA转录组概况分析非侵入性地揭示了在NAFLD中失调的组织、细胞类型、生物过程和信号传导途径。

由于肝脏的渐进性瘢痕化是NAFLD患者中与慢性肝脏并发症相关的主要因素,因此通过比较具有通过活检确定的轻度(F0-F1)和晚期(F3-F4)肝纤维化的患者的循环转录组,确定了晚期纤维化的转录组特征。鉴定了253个失调的基因(FDR<0.05,图6E),并且证明了在具有严重肝脏瘢痕形成的患者中上调的基因在参与肝纤维化发作和进展的信号传导途径,如“肝纤维化/肝星状细胞活化”和“PI3K/AKT信号传导途径”(参考)中富集。此外,由于肝纤维化是以不同水平的严重程度为特征的渐进过程,因此对其cf-mRNA水平与纤维化阶段相关的基因进行了从头鉴定。在循环中发现了613个这样的转录物(FDR<0.05,图17)。显示出与纤维化阶段有最佳线性相关性的基因FSCN1(图16E)编码肌动蛋白成束蛋白的一个成员,并且最近被鉴定为肝星状细胞的标志物。此外,FSCN1的表达正调节胶原蛋白和基质金属蛋白酶的表达(参考),这与在具有逐渐加重的肝纤维化的患者中观察到FSCN1水平稳步上升是一致的。

实施例4:cf-mRNA NAFLD诊断分类器的开发

可以利用cf-mRNA概况分析来构建诊断分类器,以区分NAFL和NASH患者与健康个体。将训练群组随机分到“训练集”(60%的样品)中——其中使用各种机器学习模型训练基于cf-mRNA的分类器,以及“测试集”(剩余的40%的样品)中。计算受试者工作特征(ROC)曲线和相关曲线下面积(AUC)值,以评估每个分类的性能(图8A)。此过程重复15次,以获得AUC的样品和模型概化的无偏评价。表3中列出了区分正常对照与NASL的前50个基因。表4中列出了区分正常对照与NASH的前50个基因。cf-mRNA诊断分类器稳健地将NAFL和NASH与健康个体区分开来(平均AUC分别为0.92和0.93,图8A和图8B)。

当前纤维化测试的基本限制之一是它们区分NASH与单纯脂肪变性的能力有限。在cf-mRNA转录组中捕获的信息用于区分这些患者。建立了cf-mRNA分类器,其以0.77的平均AUC((95%CI:0.74.0.78),图8D)区分NAFL患者和NASH患者。此外,具有轻度肝纤维化的NASH患者是高危人群,其将会受益于密切监测,但目前的非侵入性方法通常无法检测到。开发了一种分类器,以在具有低度纤维化(F0-1)的患者中区分NASH与单纯脂肪变性(在118名具有低度纤维化的患者中,n=73名患者被诊断为NASH),平均AUC为0.74(图17)。表5中列出了区分NAFL与NASH的前50个基因。

实施例5:NAFLD纤维化阶段的分层

收集了具有通过肝活检确定的纤维化阶段的患者的“训练”(n=188)和“验证”群组(n=60)(图14B-14C)。开发了用于在训练群组的经活检验证的患者中区分晚期(F3-F4)与轻度(F0-F1)纤维化的分类器。还开发了用于区分轻度(F0-F1)的分类器(图17)。回顾性训练群组内的交叉验证显示平均AUC为0.81(图14A)。表10中列出了区分早期和晚期纤维化的前50个基因。

表10

随后,在前瞻性收集的血清样品中验证了该分类器。通过将该分类器的预测与从肝活检获得的真实纤维化阶段进行比较,证实了纤维化分层分类器的稳健性(AUC=0.83(95%CI:0.71-0.95),图14B)。为了评价cf-mRNA纤维化分层分类器的临床效用,检查了数个临床参数。在前瞻性验证群组中,在约80%的设定特异性水平下,分类器的灵敏度为约80%(图18)。由于医疗中心之间的转诊率范围差异很大,因此还在一定范围的患者转诊率上评价了该分类器的阳性和阴性预测值(PPV和NPV)(图18)。>80%的PPV表明cf-mRNA通过其肝纤维化阶段对NAFLD患者进行分层的潜力(图14C)。

此外,未来NASH疗法的患者合格标准可包括NASH状态和肝纤维化阶段两者。例如,在3期试验中显示出有希望的结果的临床试验涉及具有NASH和纤维化阶段2或更高阶段的患者,可以通过分类器进行患者选择,以便以0.74的AUC具体确定由于NASH导致>F2的患者。在至少40%的患者具有NASH和F2或更高阶段的预先集中的人群中,该试验的PPV将为88%(截止值为0.4)。

虽然本文已经显示并描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,在实施本发明的过程中可以采用本文所述的本发明实施方案的各种替代方案。旨在以所附权利要求书限定本发明的范围,由此涵盖在这些权利要求范围内的方法和结构及其等同物。

技术分类

06120113803575