掌桥专利:专业的专利平台
掌桥专利
首页

鉴定染色体外DNA特征的方法

文献发布时间:2023-06-19 18:27:32



本申请要求2020年3月27日提交的美国临时专利申请号63/001,150和2020年5月12日提交的美国临时专利申请号63/023,731的权益,出于所有意图和目的,所述临时专利申请中的每一个都通过引用而整体并入本文中。

背景技术

染色体外DNA(ecDNA)是存在于细胞核中的与染色体分开的环状DNA。它是癌基因扩增的一种常见机制,允许肿瘤中的细胞达到癌基因的高拷贝数。因此,ecDNA驱动了肿瘤中的细胞中癌基因拷贝数的异质性。在一些情况下,肿瘤中ecDNA的存在已与治疗结果和患者预后相关。

发明内容

本文提供了治疗癌症的方法。在一些实施方案中,所述方法包括获得源自被诊断或怀疑患有癌症的对象的生物样品的生物标志物数据。在一些实施方案中,所述方法包括将所述样品的ecDNA状态分类为ecDNA阳性或ecDNA阴性。在一些实施方案中,所述方法包括基于所述ecDNA状态确定治疗计划。在一些实施方案中,当所述样品为ecDNA阳性时,所述治疗计划不包括施用免疫检查点抑制剂。在一些实施方案中,当所述样品为ecDNA阳性时,所述治疗计划不包括施用免疫检查点抑制剂或不包括施用免疫检查点抑制剂作为一线治疗。在一些实施方案中,当所述样品为ecDNA阴性时,所述治疗计划包括施用免疫检查点抑制剂。在一些实施方案中,所述生物标志物数据选自核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失(indel)频率、插入缺失位置、功能通路突变、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。

本文还提供了对对象对免疫检查点治疗的响应性潜力进行分类的方法。在一些实施方案中,所述方法包括确定取自所述对象的样品的ecDNA阳性状态,其中基于ecDNA特征的阈值确定所述ecDNA阳性状态。在一些实施方案中,所述方法包括当所述样品低于所述ecDNA阳性状态的阈值时,将所述对象分类为潜在响应于免疫检查点治疗。本文另外提供了对对象对免疫检查点治疗的无响应性潜力进行分类的方法,所述方法包括确定取自所述对象的样品的ecDNA阳性状态,其中基于ecDNA特征的阈值确定所述ecDNA阳性状态;以及当所述样品高于所述ecDNA阳性状态的阈值时,将所述对象分类为潜在不响应于免疫检查点治疗。在一些实施方案中,所述ecDNA特征选自核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失频率、插入缺失位置、功能通路突变、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。在一些实施方案中,所述样品包含肿瘤细胞、循环肿瘤细胞、循环囊泡或循环肿瘤DNA。在一些实施方案中,所述样品是血液、血清、血浆、淋巴液、胸腔积液、唾液、尿液、粪便、组织、切除的肿瘤或其组合。

本文还提供了检测ecDNA阳性癌症的方法。在一些实施方案中,所述方法包括:确定来自样品的DNA的限定区域内的碱基置换或插入缺失的第一频率。在一些实施方案中,所述方法包括生成所述第一频率与对照频率的比较。在一些实施方案中,所述方法包括基于所述比较对所述样品的ecDNA状态进行分类。在一些实施方案中,与所述对照频率相比所述第一频率的增加指示ecDNA阳性样品。在一些实施方案中,对ecDNA状态进行分类还包括评估一种或多种ecDNA特征的存在以及基于所述一种或多种ecDNA特征和频率的比较对ecDNA状态进行分类。在一些实施方案中,所述一种或多种ecDNA特征选自核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失频率、插入缺失位置、功能通路突变、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。

本文另外提供了评估癌症治疗的进展的方法。在一些实施方案中,所述方法包括确定来自对象的第一样品的DNA的限定区域内的碱基置换或插入缺失的第一频率。在一些实施方案中,所述方法包括确定来自所述对象的第二样品的DNA的所述限定区域内的碱基置换或插入缺失的第二频率,其中所述第二样品在用靶向癌症治疗剂治疗之后获得。在一些实施方案中,所述方法包括将所述第一频率与第二频率进行比较以鉴定所述样品的ecDNA状态的变化。在一些实施方案中,所述ecDNA状态的变化包括与所述第一频率相比所述第二频率的增加。在一些实施方案中,所述方法还包括基于所述ecDNA状态的变化改变癌症治疗。在一些实施方案中,所述样品包含肿瘤细胞、循环肿瘤细胞、循环囊泡或循环肿瘤DNA。在一些实施方案中,所述样品是血液、血清、血浆、淋巴液、胸腔积液、唾液、尿液、粪便、组织、切除的肿瘤或其组合。

本文还提供了评估对癌症治疗的抗性潜力的方法。在一些实施方案中,所述方法包括确定来自对象的第一样品的DNA的限定区域内的碱基置换或插入缺失的第一频率和位置。在一些实施方案中,所述方法包括确定来自所述对象的第二样品的DNA的所述限定区域内的碱基置换或插入缺失的第二频率和位置,其中所述第二样品在用靶向癌症治疗剂治疗的过程中获得。在一些实施方案中,所述方法包括将所述第一频率和位置与第二频率和位置进行比较,其中当所述第二频率或位置与所述第一频率或位置相比发生改变时,确定所述对象具有对癌症治疗的抗性潜力。在一些实施方案中,所述第一样品、所述第二样品或所述第一样品和第二样品两者包含肿瘤细胞、循环肿瘤细胞、循环囊泡或循环肿瘤DNA。在一些实施方案中,所述第一样品、所述第二样品或所述第一样品和所述第二样品两者是血液、血清、血浆、淋巴液、胸腔积液、唾液、尿液、粪便、组织、切除的肿瘤或其组合。

本文提供了检测对象中的ecDNA阳性癌症的方法。在一些实施方案中,所述方法包括:(a)获得源自所述对象的生物样品的生物标志物数据;(b)用对照生物标志物的数据库对来自所述对象的生物标志物数据进行处理;以及(c)当基于(b)的结果,来自所述对象的生物标志物数据与对照生物标志物的数据库相比显著不同时,将所述对象分类为患有ecDNA阳性癌症。在一些实施方案中,对照生物标志物数据源自未患癌症的对象。在一些实施方案中,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些实施方案中,对照生物标志物数据是预定阈值。在一些实施方案中,生物标志物数据包括以下中的一种或多种:核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失频率、插入缺失位置、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。在一些实施方案中,所述生物标志物数据通过全外显子组测序或靶向测序来测量。在一些实施方案中,所述肿瘤炎症评分在对来自所述对象的癌细胞的基因表达测定中进行测量。在一些实施方案中,PD-L1表达水平通过对来自所述对象的癌细胞的PD-L1 RNA基因表达测定来测量。在一些实施方案中,PD-L1表达水平通过对来自所述对象的癌细胞的PD-L1蛋白质表达测定来测量。在一些实施方案中,微卫星不稳定性通过对来自所述对象的癌细胞的核酸进行测序来测量。在一些实施方案中,肿瘤突变负荷通过对来自所述对象的癌细胞的核酸进行测序来测量。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述方法还包括向所述对象施用治疗剂。在一些实施方案中,所述治疗剂包括阿特珠单抗(atezolizumab)、阿维单抗(avelumab)、西米普利单抗(cemiplimab)、德瓦鲁单抗(durvalumab)、纳武单抗(nivolumab)或派姆单抗(pembrolizumab)。在一些实施方案中,所述治疗剂不包括抗PD-L1或抗PD-1抗体。

本文另外提供了检测对象中的ecDNA阳性癌症的方法,所述方法包括:(a)获得源自所述对象的生物样品的肿瘤炎症评分;(b)利用对照肿瘤炎症评分对来自所述对象的所述肿瘤炎症评分进行计算机处理;以及(c)当基于(b)的结果,来自所述对象的肿瘤炎症评分与所述对照肿瘤炎症评分相比降低时,将所述对象分类为患有ecDNA阳性癌症。在一些实施方案中,所述方法还包括:(d)获得源自所述对象的所述生物样品的PD-L1表达水平;(e)利用对照PD-L1表达水平对来自所述对象的所述PD-L1表达水平进行计算机处理;以及(f)当基于(b)和(e)的结果,来自所述对象的所述肿瘤炎症评分与对照肿瘤炎症相比降低并且所述PD-L1表达水平与所述对照PD-L1表达水平相比降低时,将所述对象分类为患有ecDNA阳性癌症。在一些实施方案中,所述对照肿瘤炎症评分或所述对照PD-L1表达水平源自患有ecDNA阴性癌症的对象。在一些实施方案中,所述对照肿瘤炎症评分或所述对照PD-L1表达水平源自非癌性来源。在一些实施方案中,所述肿瘤炎症评分在对来自所述对象的癌细胞的基因表达测定中进行测量。在一些实施方案中,所述PD-L1表达水平通过测量来自所述对象的癌细胞中的PD-L1 RNA水平来测量。在一些实施方案中,所述PD-L1表达水平通过测量来自所述对象的癌细胞中的PD-L1蛋白水平来测量。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述癌症是胃癌。在一些实施方案中,所述方法还包括向所述对象施用治疗剂。在一些实施方案中,所述治疗剂包括阿特珠单抗、阿维单抗、西米普利单抗、德瓦鲁单抗、纳武单抗或派姆单抗。在一些实施方案中,所述治疗剂不包括抗PD-L1或抗PD-1抗体。

本文还提供了检测对象中的ecDNA阳性癌症的方法,所述方法包括:(a)获得源自所述对象的生物样品的PD-L1表达水平;(b)利用对照PD-L1表达水平对来自所述对象的所述PD-L1表达水平进行计算机处理;以及(c)当基于(b)的结果,所述PD-L1表达水平与所述对照PD-L1表达水平相比降低时,将所述对象分类为患有ecDNA阳性癌症。在一些实施方案中,所述方法还包括:(d)获得源自所述对象的生物样品的肿瘤炎症评分;(e)利用对照肿瘤炎症评分对来自所述对象的所述肿瘤炎症评分进行计算机处理;以及(f)当基于(b)和(e)的结果,所述PD-L1表达水平与所述对照PD-L1表达水平相比降低并且来自所述对象的所述肿瘤炎症评分与所述对照肿瘤炎症评分相比降低时,将所述对象分类为患有ecDNA阳性癌症。在一些实施方案中,所述对照肿瘤炎症评分或所述对照PD-L1表达水平源自患有ecDNA阴性癌症的对象。在一些实施方案中,所述对照肿瘤炎症评分或所述对照PD-L1表达水平源自非癌性来源。在一些实施方案中,所述PD-L1表达水平通过测量来自所述对象的癌细胞中的PD-L1 RNA水平来测量。在一些实施方案中,所述PD-L1表达水平通过测量来自所述对象的癌细胞中的PD-L1蛋白水平来测量。在一些实施方案中,所述肿瘤炎症评分在对来自所述对象的癌细胞的基因表达测定中进行测量。在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,所述癌症是胃癌。在一些实施方案中,所述方法还包括向所述对象施用治疗剂。在一些实施方案中,所述治疗剂包括阿特珠单抗、阿维单抗、西米普利单抗、德瓦鲁单抗、纳武单抗或派姆单抗。在一些实施方案中,所述治疗剂不包括抗PD-L1或抗PD-1抗体。

本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文中,其程度如同每个单独的出版物、专利或专利申请被明确且单独地指示通过引用并入。

附图说明

专利或申请文件包含至少一幅彩色附图。在请求并支付必要的费用后,专利局将提供本专利或专利申请公布的具有彩色附图的副本。

通过参考阐述其中利用本发明的原理的说明性实施方案的以下详细描述和附图将获得对本发明的特征和优点的理解,附图中:

图1显示了WGS和WES/靶向测序之间ecDNA检测数据的概览比较。

图2显示了微卫星不稳定性(MSI)状态与ecDNA阳性癌症之间的重叠。

图3显示了肿瘤炎症评分(TIS)与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。

图4显示了PD-L1表达与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。

图5显示了肿瘤突变负荷(TMB)与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。

图6显示了被编程或以其他方式配置为实现本文提供的方法的计算机系统。

图7显示了通过MSI状态分层的ecDNA+与ecDNA-肿瘤。**和****指示通过卡方检验确定的统计显著性。

图8显示了肿瘤炎症评分(TIS)与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。*、***和****指示通过Wilcoxon秩和检验确定的统计显著性。

图9显示了通过mRNA的PD-L1表达与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。**和***指示通过Wilcoxon秩和检验确定的统计显著性。

图10显示了肿瘤突变负荷(TMB)与微卫星不稳定性(MSI)、EB病毒(EBV)、基因组稳定性(GS)、染色体不稳定性(CIN)和ecDNA的相关性。****指示通过Wilcoxon秩和检验确定的统计显著性。

图11显示了各种分子亚类的ecDNA+状态。

图12显示了来自在癌基因热点中具有拷贝数变异(CNV)增益的每个亚型的患者数量。深红色的患者在预测的ecDNA结构上具有CNV增益。

图13显示了使用生物标志物的组合选择被预测为派姆单抗的响应者或无响应者的患者的ecDNA+和ecDNA-富集的比例。

图14显示了用于分析ecDNA特征的流程图。

图15在上图中显示了使用AmpliconArchitect确定的存在于SNU16细胞中的含有ecDNA的扩增子的结构。在图15的下图中,根据AmpliconArchitect输出,对于对应于ecDNA的三个基因组区域,平均深度由线显示,插入/缺失(插入缺失)率由向上的柱显示,而置换率由向下的柱显示。

图16在上图中显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的置换位置。每个竖直柱代表唯一置换。水平柱突出显示了含有ecDNA的扩增子的位置。在图16的下图中,显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的置换密度(匹配图16上图中所示的基因组坐标)。

图17在上图中显示了与SNU61细胞中的ecDNA对应的三个基因组区域及其周围区域中的插入缺失的位置。每个竖直柱代表唯一插入或缺失。图17的下图显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的插入缺失的密度(匹配图17上图中所示的基因组坐标)。

图18显示了相对于平均读取深度绘制的在与SNU16 ecDNA扩增子对应的基因组区域(空心点)以及500个随机相同大小的连续基因组区域(实心点)上计算的置换和插入缺失率(图18左图)。图18的右图显示了每百万个核苷酸(1e5滑动窗口)的平均深度(线)、插入缺失率(向上的柱)和置换率(向下的柱)。

图19显示了在用英菲格拉替尼(infigratinib)或厄洛替尼(erlotinib)治疗之前和之后从细胞获得的外显子组数据。

图20在上图中显示了使用AmpliconArchitect确定的存在于H2170鳞状细胞癌细胞(ATCC)中的含有ecDNA的扩增子的结构。在图20的下图中,根据AmpliconArchitect输出,显示了在对应于ecDNA的基因组区域中每百万个核苷酸(1e5滑动窗口)的平均深度(线)、插入缺失率(向上的柱)和置换率(向下的柱)。

具体实施方式

已提出染色体外DNA(ecDNA)作为癌基因的局部扩增(focal amplification)机制,是肿瘤发生的关键驱动因素。目前在患者和模型系统中鉴定ecDNA的大部分数据依赖于使用全基因组测序(WGS)来鉴定ecDNA的存在/不存在及其结构(例如,它是否包含驱动癌基因)。这种方法允许软件检查整个基因组背景,包括基因内间隔、非编码区等,以鉴定复杂的ecDNA结构。然而,更广泛使用的并且特别是在临床肿瘤学环境中的测序通常最多使用全外显子组测序(WES)进行,并且更通常包括仅使用专注于最多达数百个目标基因的靶向组(targeted panel)。由于在从WGS切换到WES或靶向组时存在信息丢失,因此当前的信息学管道不足以鉴定ecDNA,因为这样的管道专注于基因和局部突变,而不一定关注WGS提供的周围基因组背景。

为了解决这些限制,本文提供了对可以帮助改进在背景有限的非WGS组中鉴定ecDNA的特征的开发。这些特征通过查看基因拷贝数、基因融合、片段长度、等位基因频率、扩增的基因组位置和与指示ecDNA不存在的其他潜在的响应生物标志物的专属性的组合,采用一般性的方法进行ecDNA鉴定(图1)。

本文提供了用于检测ecDNA阳性癌症的方法和系统。本文还提供了用于开发ecDNA阳性癌症的特征的方法和系统。在一些情况下,这些方法和系统单独或组合地使用一种或多种生物标志物数据来确定对象是否患有ecDNA阳性癌症。

在一个方面,本文提供了检测对象中的染色体外DNA(ecDNA)阳性癌症的方法。在一些情况下,所述方法包括获得源自对象的生物样品的生物标志物数据。接下来,利用对照生物标志物的数据库对来自对象的生物标志物数据进行处理。在一些实施方案中,当来自对象的生物标志物数据与对照生物标志物的数据库相比显著不同时,则将对象分类为患有ecDNA阳性癌症。在一些情况下,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物数据是预定阈值。在一些情况下,对照生物标志物数据源来自未患癌症的对象。

在另一方面,提供了检测ecDNA阳性癌症的方法,该方法包括:确定来自样品的DNA的限定区域内的碱基置换或插入缺失的第一频率;将第一频率与对照频率进行比较;以及基于频率的比较对样品的ecDNA状态进行分类。在一些情况下,与对照频率相比第一频率的增加指示ecDNA阳性样品。在一些情况下,分类步骤还包括评估一种或多种ecDNA生物标志物特征的存在以及基于一种或多种ecDNA特征和频率的比较对ecDNA状态进行分类。在一些情况下,一种或多种ecDNA特征选自核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失频率、插入缺失位置、功能通路突变、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。在一些情况下,功能通路突变包括选自TP53、MDM2、MDM4、CDKN2A(ARF)、PTEN、AKT1和TP53BP1中的一种或多种功能通路基因中的突变。

在本文提供的检测ecDNA阳性癌症的方法中,在一些实施方案中,生物标志物数据包括以下中的一种或多种:核酸拷贝数、共扩增的基因、基因融合、片段长度、SNP/SNV频率、插入缺失频率、插入缺失位置、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。在一些实施方案中,生物标志物数据包括肿瘤炎症评分。在一些实施方案中,生物标志物数据包括PD-L1表达。在一些实施方案中,生物标志物数据包括肿瘤炎症评分和PD-L1表达。

在本文提供的检测ecDNA阳性癌症的方法中,在一些实施方案中,生物标志物数据通过全外显子组测序或靶向测序来测量。在一些实施方案中,生物标志物数据通过全基因组测序来测量。在一些实施方案中,生物标志物数据通过基因表达测定来测量。在一些实施方案中,生物标志物数据通过RNA基因表达测定来测量。在一些实施方案中,生物标志物数据通过蛋白质表达测定来测量。在一些实施方案中,生物标志物数据通过可及染色质测定来测量。

在本文提供的检测ecDNA阳性癌症的方法中,在一些实施方案中,所述癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,癌症是实体瘤。在一些实施方案中,癌症是血癌。在一些实施方案中,癌症是胃癌。

在本文提供的检测ecDNA阳性癌症的方法中,在一些实施方案中,所述方法还包括向对象施用治疗剂。在一些实施方案中,所述方法还包括施用检查点抑制剂。在一些实施方案中,所述方法还包括施用化疗剂。在一些实施方案中,所述方法还包括施用PD-L1抑制剂或PD-1抑制剂。在一些实施方案中,所述方法还包括当未检测到ecDNA阳性癌症时施用PD-L1抑制剂或PD-1抑制剂。在一些实施方案中,所述方法还包括施用阿特珠单抗、阿维单抗、西米普利单抗、德瓦鲁单抗、纳武单抗或派姆单抗。在一些实施方案中,所述方法还包括施用不是PD-1抑制剂或PD-L1抑制剂的治疗剂。在一些实施方案中,所述方法还包括当检测到ecDNA阳性癌症时施用不是PD-1抑制剂或PD-L1抑制剂的治疗剂。

在另一方面,本文提供了开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法。在一些情况下,所述方法包括获得源自患有ecDNA阳性癌症的对象的生物样品的生物标志物数据。接下来,利用对照生物标志物的数据库对来自对象的生物标志物数据进行处理。在一些实施方案中,当来自对象的生物标志物数据与对照生物标志物的数据库相比显著不同时,则将生物标志物数据分类为与ecDNA阳性癌症相关。在一些情况下,对照生物标志物源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物是预定阈值。在一些情况下,对照生物标志物源自未患癌症的对象。

在本文提供的开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法中,在一些实施方案中,生物标志物数据包括以下中的一种或多种:核酸拷贝数、共扩增的基因、功能通路突变、基因融合、片段长度、SNP/SNV频率、微卫星不稳定性、肿瘤炎症评分、PD-L1表达或肿瘤突变负荷。在一些实施方案中,生物标志物数据包括肿瘤炎症评分。在一些实施方案中,生物标志物数据包括PD-L1表达。在一些实施方案中,生物标志物数据包括肿瘤炎症评分和PD-L1表达。

在本文提供的开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法中,在一些实施方案中,生物标志物数据通过全外显子组测序或靶向测序来测量。在一些实施方案中,生物标志物数据通过全基因组测序来测量。在一些实施方案中,生物标志物数据通过基因表达测定来测量。在一些实施方案中,生物标志物数据通过RNA基因表达测定来测量。在一些实施方案中,生物标志物数据通过蛋白质表达测定来测量。在一些实施方案中,生物标志物数据通过可及染色质测定来测量。

在本文提供的开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法中,在一些实施方案中,癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,癌症是实体瘤。在一些实施方案中,癌症是血癌。在一些实施方案中,癌症是胃癌。

在一些情况下,检测患者肿瘤中的ecDNA为新的治疗范例提供信息以改善结果。因此,在一个方面,本文提供了治疗癌症的方法。在一些情况下,所述方法包括获得源自被诊断患有癌症的对象的生物样品的生物标志物数据。在一些情况下,所述方法包括获得源自怀疑患有癌症的对象的生物样品的生物标志物数据。在一些情况下,所述方法包括将样品的ecDNA状态分类为ecDNA阳性或ecDNA阴性。在一些情况下,所述方法包括基于ecDNA状态确定治疗计划。在一些情况下,当样品为ecDNA阳性时,治疗计划不包括施用免疫检查点抑制剂作为治疗或作为一线治疗。在一些情况下,当样品为ecDNA阴性时,治疗计划包括施用免疫检查点抑制剂。

在另一方面,提供了对对象对免疫检查点治疗的响应性潜力进行分类的方法。在一些情况下,所述方法包括确定取自对象的生物样品的ecDNA阳性状态。在一些情况下,基于ecDNA特征的阈值确定ecDNA阳性状态。在一些情况下,所述方法包括当样品的ecDNA特征低于ecDNA阳性状态的阈值时将对象分类为潜在响应于免疫检查点治疗。

在另一方面,提供了对对象对免疫检查点治疗的无响应性潜力进行分类的方法。在一些情况下,所述方法包括确定取自对象的生物样品的ecDNA阳性状态。在一些情况下,基于ecDNA特征的阈值确定ecDNA阳性状态。在一些情况下,所述方法包括当样品的ecDNA特征高于ecDNA阳性状态的阈值时将对象分类为潜在不响应于免疫检查点治疗。

在本文提供的治疗方法的实施方案中,样品包含肿瘤细胞、循环肿瘤细胞、循环囊泡、循环肿瘤DNA或其组合。在一些实施方案中,样品是血液、血清、血浆、淋巴液、唾液、尿液、粪便、组织、切除的肿瘤或其组合。

在本文提供的治疗癌症的方法中,在一些实施方案中,癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,癌症是实体瘤。在一些实施方案中,癌症是血癌。在一些实施方案中,癌症是胃癌。

在一个方面,提供了评估癌症治疗的进展的方法。在一些情况下,所述方法包括确定来自对象的第一样品的DNA的限定区域内的碱基置换或插入缺失的第一频率和/或位置。在一些情况下,所述方法包括确定来自对象的第二样品的DNA的限定区域内的碱基置换或插入缺失的第二频率和/或位置。在一些情况下,第二样品在用靶向癌症治疗剂治疗之后获得。在一些情况下,所述方法包括将第一频率和/或位置与第二频率和/或位置进行比较以鉴定样品的ecDNA状态的变化。在一些情况下,ecDNA状态的变化包括与第一频率相比第二频率的增加。在一些情况下,ecDNA状态的变化包括与第一频率和位置相比第二频率和位置的变化。在一些情况下,所述方法还包括基于ecDNA状态的变化改变癌症治疗。

在另一方面,提供了评估对癌症治疗的抗性潜力的方法。在一些情况下,所述方法包括确定来自对象的第一样品的DNA的限定区域内的碱基置换或插入缺失的第一频率。在一些情况下,所述方法包括确定来自对象的第二样品的DNA的限定区域内的碱基置换或插入缺失的第二频率。在一些情况下,第二样品在使用靶向癌症治疗剂治疗的过程中获得。在一些情况下,所述方法包括将第一频率与第二频率进行比较,其中第二频率与第一频率相比增加。在一些情况下,基于所述比较确定对象对癌症治疗具有抗性潜力。

在本文提供的评估治疗的方法的实施方案中,样品包含肿瘤细胞、循环肿瘤细胞、循环囊泡、循环肿瘤DNA或其组合。在一些实施方案中,样品是血液、血清、血浆、淋巴液、唾液、尿液、粪便、组织、切除的肿瘤或其组合。

在本文提供的评估癌症治疗的方法中,在一些实施方案中,癌症选自结肠癌、非小细胞肺癌、小细胞肺癌、乳腺癌、肝细胞癌、肝癌、皮肤癌、恶性黑色素瘤、子宫内膜癌、食管癌、软组织肉瘤、胃癌、卵巢癌、胰腺癌和脑癌。在一些实施方案中,癌症是实体瘤。在一些实施方案中,癌症是血癌。在一些实施方案中,癌症是胃癌。

根据一些实施方案,对多核苷酸(或其扩增产物,其在一些情况下已经任选地富集)进行测序反应以产生测序读段。在一些情况下,测序是全基因组测序。在一些情况下,测序是全外显子组测序。在一些情况下,测序是靶向测序。在一些实施方案中,通过这样的方法产生的测序读段根据本文公开的其他方法使用。有多种测序方法可用,特别是高通量测序方法。实例包括但不限于Illumina制造的测序系统(测序系统,例如

在一些实施方案中,本公开的测序方法提供了对各种应用有用的信息,例如,鉴定对象中的疾病(例如,癌症)或确定对象患有ecDNA阳性癌症。在一些情况下,测序提供了源自对象的癌症的生物标志物数据。在一些情况下,测序提供了对来自对象的癌症的以下一项或多项的确定:核酸拷贝数、共扩增的基因、功能通路突变、基因融合、片段长度、SNP/SNV频率、插入缺失频率或位置、微卫星不稳定性、肿瘤炎症评分或肿瘤突变负荷。在一些情况下,测序提供了多态性区域的序列。在一些情况下,测序提供了对源自对象的癌症中的微卫星不稳定性的确定。在一些情况下,测序提供了对源自对象的癌症中的肿瘤突变负荷的确定。在一些情况下,测序提供了对源自对象的癌症中的肿瘤炎症评分的确定。

根据本文的实施方案,考虑使用任何合适的方法来测量基因表达。在一些实施方案中,通过量化RNA的量来测量基因表达。在一些实施方案中,通过量化蛋白质的量来测量基因表达。在一些实施方案中,通过用合适的方法量化表达RNA或蛋白质的细胞的数量来测量基因表达。

在本文方法的一些实施方案中,通过量化一种或多种基因的RNA量来测量基因表达。在一些实施方案中,通过一种或多种方法,包括但不限于RT-PCR、定量RT-PCR、实时RT-PCR、Northern印迹、RNA测序、原位杂交和其他合适的方法来测量RNA表达。在一些实施方案中,在量化基因表达之前将样品均质化并纯化RNA。在一些实施方案中,在量化基因表达之前使纯化的RNA经受逆转录酶以产生cDNA。在一些实施方案中,从样品(例如肿瘤样品)制备组织学切片,并使用比色探针、荧光探针、化学发光探针、放射性探针或生物素化探针进行原位杂交以量化基因表达。在一些实施方案中,将样品(例如肿瘤)的细胞解离和固定,然后用荧光核酸探针染色以量化基因表达。

在本文方法的一些实施方案中,通过量化一种或多种基因的蛋白质的量来测量基因表达。在一些实施方案中,通过一种或多种方法,包括但不限于Western印迹、FACS、免疫组织化学、免疫荧光、ELISA、ELISPOT、质谱法、串联质量标签蛋白质组学和其他合适的方法测量蛋白质表达。在一些实施方案中,在量化基因表达之前将样品均质化。在一些实施方案中,在量化基因表达之前从样品中纯化蛋白质。在一些实施方案中,在量化基因表达之前对样品进行SDS-PAGE并任选地转移到膜上。在一些实施方案中,使用抗体来量化基因表达。在一些实施方案中,将样品施加到抗体包被的表面以量化基因表达。在一些实施方案中,从样品(例如肿瘤样品)制备组织学切片,使抗体与固定的样品杂交,并且使用荧光探针、化学发光探针、放射性探针或生物素化探针来检测抗体结合以量化基因表达。在一些实施方案中,将样品(例如肿瘤)的细胞解离和固定,然后用荧光抗体探针染色以量化基因表达。

根据本文的实施方案,考虑了使用任何合适的方法来测量拷贝数变异。在本文方法的一些实施方案中,通过量化一个或多个基因或一个或多个基因座的DNA量来测量拷贝数变异。在一些实施方案中,通过一种或多种方法测量拷贝数变异,包括但不限于PCR、定量PCR、实时PCR、Southern印迹、DNA测序、原位杂交和其他合适的方法。在一些实施方案中,在量化拷贝数变异之前将样品均质化并且纯化DNA。在一些实施方案中,从样品(例如肿瘤样品)制备组织学切片,并且使用比色探针、荧光探针、化学发光探针、放射性探针或生物素化探针进行原位杂交以量化拷贝数变异。在一些实施方案中,将样品(例如肿瘤)的细胞解离和固定,然后用荧光核酸探针染色以量化拷贝数变异。

在本文所述的各种方法的一些实施方案中,样品来自对象。在一些情况下,对象是任何动物,包括但不限于牛、猪、小鼠、大鼠、鸡、猫、狗等,并且通常是哺乳动物,例如人。样品多核苷酸和/或蛋白质通常分离自肿瘤样品、组织样品、器官样品或体液样品中,包括例如血液样品或包含核酸的流体样品(例如唾液)。样品来源的其他实例包括来自血液、尿液、粪便、鼻孔、肺、肠、其他体液或排泄物、源自其的材料或其组合的那些。在一些实施方案中,样品是血液样品或其部分(例如血浆或血清)。在一些实施方案中,来自单个个体的样品被分成多个独立的样品(例如,2、3、4、5、6、7、8、9、10或更多个独立的样品),这些样品独立地经受本公开的方法,例如一式两份、一式三份、一式四份或更多的分析。当样品来自对象时,在一些情况下,参考序列也源自该对象,例如来自被分析样品的共有序列或来自同一对象的另一个样品或组织的多核苷酸序列。例如,在一些情况下,对血液样品分析突变,同时分析来自另一样品(例如口腔或皮肤样品)的细胞DNA以确定参考序列。

可以根据任何合适的方法从样品中提取多核苷酸。有各种试剂盒可用于提取多核苷酸,在一些情况下,它们的选择取决于样品类型或待分离的核酸类型。本文提供了提取方法的实例,例如关于本文公开的各个方面中的任一个所描述的那些。在一个实例中,样品是血液样品,例如收集在EDTA管(例如,BD Vacutainer)中的样品。可以通过离心(例如,在4℃下以1900×g离心10分钟)使血浆与外周血细胞分离。以这种方式对6mL血液样品进行的血浆分离通常会产生2.5至3mL的血浆。可以从血浆样品中提取循环无细胞DNA,例如通过根据制造商的方案使用QIAmp Circulating Nucleic Acid Kit(Qiagen)进行。在一些情况下,然后对DNA(例如,在配备高灵敏度DNA试剂盒(Agilent)的Agilent 2100生物分析仪上)进行定量。例如,来自健康人的这种血浆样品的循环DNA产量可以在每mL血浆1ng至10ng的范围内,在疾病(例如癌症)患者样品中明显更多。

在某些方面,本文提供的方法和系统允许检测染色体外DNA(ecDNA)阳性癌症并允许开发ecDNA阳性癌症的特征。根据本文公开的方法考虑的癌症的实例包括但不限于棘皮瘤、腺泡细胞癌、听神经瘤、肢端雀斑样黑色素瘤(acral lentiginous melanoma)、顶端螺旋瘤(acrospiroma)、急性嗜酸性粒细胞白血病、急性淋巴细胞白血病、急性巨核细胞白血病、急性单核细胞白血病、急性成髓细胞白血病伴成熟(acute myeloblastic leukemiawith maturation)、急性髓性树突状细胞白血病、急性髓性白血病、急性早幼粒细胞白血病、釉质瘤(adamantinoma)、腺癌、腺样囊性癌、腺瘤、牙源性腺瘤样瘤(adenomatoidodontogenic tumor)、肾上腺皮质癌、成人T细胞白血病、侵袭性NK细胞白血病、AIDS相关癌症、AIDS相关淋巴瘤、腺泡状软组织肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、间变性甲状腺癌、血管免疫母细胞性T细胞淋巴瘤、血管平滑肌脂肪瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型畸胎样横纹肌样瘤、基底细胞癌、基底样癌、B细胞白血病、B细胞淋巴瘤、贝利尼导管癌(Bellini duct carcinoma)、胆道癌、膀胱癌、母细胞瘤、骨癌、骨肿瘤、脑干胶质瘤、脑低级别胶质瘤、脑肿瘤、乳腺癌、乳腺浸润癌、布伦纳瘤(Brenner tumor)、支气管肿瘤、细支气管肺泡癌、棕色瘤、伯基特淋巴瘤(Burkitt’s lymphoma)、原发部位不明的癌症、类癌瘤、癌、原位癌、阴茎癌、原发部位不明的癌、癌肉瘤、卡斯尔曼病(Castleman’sdisease)、中枢神经系统胚胎瘤、小脑星形细胞瘤、脑星形细胞瘤、宫颈癌、宫颈鳞状细胞癌、胆管癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞性白血病、慢性单核细胞白血病、慢性髓细胞性白血病、慢性骨髓增生性疾病、慢性中性粒细胞白血病、透明细胞瘤、结肠腺癌、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、德戈斯病(Degos disease)、隆突性皮肤纤维肉瘤(dermatofibrosarcoma protuberans)、皮样囊肿、促纤维增生性小圆细胞瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良性神经上皮瘤、胚胎癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样瘤、肠病相关T细胞淋巴瘤、室管膜母细胞瘤、室管膜瘤、上皮样肉瘤、红白血病、食管癌症、食管癌、嗅神经母细胞瘤(esthesioneuroblastoma)、尤因家族肿瘤、尤因家族肉瘤、尤因肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、乳腺外输卵管癌(extramammary fallopian tubecancer)、胎内胎(fetus in fetu)、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、胆囊癌、神经节细胞胶质瘤(ganglioglioma)、节细胞神经瘤(ganglioneuroma)、胃癌、胃淋巴瘤、胃肠道癌、胃肠道类癌瘤、胃肠道间质瘤、胃肠道间质瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠性绒毛膜癌、妊娠滋养细胞肿瘤、骨巨细胞瘤、多形性胶质母细胞瘤、神经胶质瘤、大脑胶质瘤病(gliomatosis cerebri)、血管球瘤(glomus tumor)、胰高血糖素瘤、性腺母细胞瘤、颗粒细胞瘤、毛细胞白血病、头颈癌、心脏癌(heart cancer)、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、血液恶性病(hematological malignancy)、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺癌-卵巢癌综合征、霍奇金淋巴瘤、下咽癌、下丘脑胶质瘤、炎性乳腺癌、眼内黑色素瘤、胰岛细胞癌、胰岛细胞瘤、幼年型粒单核细胞白血病(juvenilemyelomonocytic leukemia)、卡波西肉瘤(Kaposi’s sarcoma)、肾癌、Klatskin瘤、库肯勃瘤(Krukenberg tumor)、喉癌、喉癌、恶性雀斑样痣黑色素瘤(lentigo malignamelanoma)、白血病、唇癌和口腔癌、脂肪肉瘤、肝肝细胞癌、肺腺癌、肺癌、肺鳞状细胞癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、淋巴样赘生物弥漫性大B细胞淋巴瘤、恶性纤维组织细胞瘤、恶性骨纤维组织细胞瘤、恶性神经胶质瘤、恶性间皮瘤、恶性周围神经鞘瘤、恶性横纹肌样瘤(malignant rhabdoid tumor)、恶性蝾螈瘤(malignant triton tumor)、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞白血病、纵隔生殖细胞肿瘤、纵隔肿瘤、甲状腺髓样癌、髓母细胞瘤、髓上皮瘤、黑色素瘤、脑膜瘤、梅克尔细胞癌(merkel cell carcinoma)、间皮瘤、原发灶隐匿的转移性鳞状颈癌、转移性尿路上皮癌、混合弥勒氏瘤(mixed Mullerian tumor)、单核细胞白血病、口腔癌、粘液瘤、多发性内分泌肿瘤综合征、多发性骨髓瘤、蕈样肉芽肿、蕈样肉芽肿、骨髓增生异常疾病、骨髓增生异常综合征、髓性白血病、髓系肉瘤、骨髓增生性疾病、粘液瘤、鼻腔癌、鼻咽癌症、鼻咽癌、赘生物、神经鞘瘤、神经母细胞瘤、神经纤维瘤、神经瘤、结节性黑色素瘤、非霍奇金淋巴瘤、非黑色素瘤皮肤癌、非小细胞肺癌、眼部肿瘤、少突星形细胞瘤、少突胶质细胞瘤、嗜酸细胞瘤、视神经鞘脑膜瘤、口腔癌、口咽癌、骨肉瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞瘤、卵巢低恶性潜在肿瘤、乳腺佩吉特病、潘科斯特瘤(pancoast tumor)、胰腺癌、乳头状甲状腺癌、乳头状瘤病、副神经节瘤、鼻旁窦癌、甲状旁腺癌、阴茎癌、血管周围上皮样细胞瘤、咽癌、嗜铬细胞瘤、中等分化松果体实质肿瘤、松果体母细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞赘生物、胸膜肺母细胞瘤(pleuropulmonary blastoma)、多胚瘤、前体T淋巴母细胞淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层肿瘤、前列腺癌、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及染色体15上NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化(Richter’s transformation)、骶尾部畸胎瘤、唾液腺癌、肉瘤、神经鞘瘤病(schwannomatosis)、皮脂腺癌、继发性赘生物、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质肿瘤(sex cord-stromal tumor)、塞扎里综合征(Sezary syndrome)、印戒细胞癌、皮肤癌、皮肤黑色素瘤、小蓝圆细胞瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、煤烟疣、脊髓肿瘤、脊柱肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃腺癌、胃癌、浅表扩散性黑色素瘤、幕上原始神经外胚层肿瘤、表面上皮间质瘤、滑膜肉瘤、T细胞急性淋巴细胞白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、终期淋巴癌、睾丸癌、泡膜细胞瘤(thecoma)、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统赘生物、膀胱尿路上皮癌(urothelial bladder carcinoma)、子宫体子宫内膜癌、子宫肉瘤、葡萄膜黑色素瘤、阴道癌、弗纳-莫里森综合征(Verner Morrison syndrome)、疣状癌、视觉通路神经胶质瘤、外阴癌、Waldenstrom巨球蛋白血症、沃辛瘤(Warthin’s tumor)、Wilms瘤及其组合。在一些情况下,癌症包括多形性胶质母细胞瘤、食管癌、肉瘤、膀胱尿路上皮癌、肺鳞状细胞癌、卵巢癌、头颈癌、宫颈鳞状细胞癌、乳腺浸润癌、淋巴样赘生物弥漫性大B细胞淋巴瘤、胃腺癌、肺腺癌、皮肤黑色素瘤、子宫体子宫内膜癌、肝肝细胞癌、脑低级别胶质瘤或结肠腺癌。在一些情况下,癌症对检查点抑制剂治疗有响应。在一些情况下,癌症对检查点抑制剂治疗没有响应。在一些情况下,癌症对抗PD-1或抗PD-L1治疗有响应。在一些情况下,癌症对抗PD-1或抗PD-L1治疗没有响应。在一些情况下,癌症是实体瘤。在一些情况下,癌症是血癌。

在另外的方面,提供了用于检测对象中的染色体外DNA(ecDNA)阳性癌症的系统。在一些实施方案中,系统包括一个或多个计算机处理器,所述计算机处理器被单独或共同编程为相比于对照生物标志物数据的数据库对源自对象的生物样品的生物标志物数据进行处理,从而在来自对象的生物标志物数据与对照生物标志物数据的数据库相比显著不同时将对象分类为患有ecDNA阳性癌症。在一些情况下,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物数据是预定阈值。在一些情况下,对照生物标志物数据源自未患癌症的对象。

在另外的方面,提供了开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法。在一些实施方案中,系统包括一个或多个计算机处理器,所述计算机处理器被单独或共同编程为相比于对照生物标志物数据的数据库对源自患有ecDNA阳性癌症的对象的生物样品的生物标志物数据进行处理,从而在来自对象的生物标志物数据与对照生物标志物的数据库相比显著不同时将生物标志物数据分类为与ecDNA阳性癌症相关。在一些情况下,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物数据是预定阈值。在一些情况下,对照生物标志物数据源自未患癌症的对象。

本文还提供了非暂时性计算机可读介质。在一些实施方案中,非暂时性计算机可读介质包含机器可执行代码,所述机器可执行代码在通过一个或多个计算机处理器执行时,实现用于检测对象中的染色体外DNA(ecDNA)阳性癌症的方法,包括访问包含源自对象的生物样品的生物标志物数据的第一数据库,和访问包含一个或多个对照生物标志物的第二数据库。在一些实施方案中,所述方法包括相比于来自第二数据库的一个或多个对照生物标志物数据对来自第一数据库的来自对象的生物样品的生物标志物数据进行处理,从而在来自对象的生物标志物数据与对照生物标志物的数据库相比显著不同时将生物标志物数据分类为与ecDNA阳性癌症相关。在一些情况下,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物数据是预定阈值。在一些情况下,对照生物标志物数据源自未患癌症的对象。

在一些实施方案中,非暂时性计算机可读介质包含机器可执行代码,所述机器可执行代码在通过一个或多个计算机处理器执行时,实现开发染色体外DNA(ecDNA)阳性癌症的一种或多种特征的方法,包括访问包含源自患有ecDNA阳性癌症的对象的生物样品的生物标志物数据的第一数据库,和访问包含一个或多个对照生物标志物的第二数据库。在一些实施方案中,所述方法包括相比于来自第二数据库的一个或多个对照生物标志物数据对来自第一数据库的来自对象的生物样品的生物标志物数据进行处理,从而在来自对象的生物标志物数据与对照生物标志物的数据库相比显著不同时将对象分类为患有ecDNA阳性癌症。在一些情况下,对照生物标志物数据源自患有ecDNA阴性癌症的对象。在一些情况下,对照生物标志物数据是预定阈值。在一些情况下,对照生物标志物数据源自未患癌症的对象。

用于该系统的计算机可以包括一个或多个处理器。在一些实施方案中,处理器与计算机系统的一个或多个控制器、计算单元和/或其他单元相关联,或根据需要植入固件中。如果在软件中实现,则在一些实施方案中,例程存储在任何计算机可读存储器中,例如RAM、ROM、闪存、磁盘、激光盘或其他合适的存储介质中。同样,在一些实施方案中,该软件通过任何已知的传送方法传送给计算设备,包括例如通过通信信道,例如电话线、互联网、无线连接等,或通过可移动性介质,例如计算机可读盘、闪存驱动器等。在一些实施方案中,各种步骤被实现为各种块、操作、工具、模块和技术,在一些情况下,后者继而在硬件、固件、软件,或硬件、固件和/或软件的任何组合中实现。当在硬件中实现时,在一些情况下,块、操作、技术等中的一些或全部在例如定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、可编程逻辑阵列(PLA)等中实现。在系统的实施方案中可以使用客户端-服务器关系数据库架构。客户端-服务器架构是一种网络架构,其中网络上的每台计算机或进程或者是客户端或者是服务器。服务器计算机通常是功能强大的计算机,专用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)。客户端计算机包括用户在其上运行应用程序的PC(个人计算机)或工作站,以及如本文所公开的示例性输出设备。客户端计算机依赖服务器计算机获取资源,例如文件、设备以及甚至处理能力。在一些实施方案中,服务器计算机处理所有数据库功能。客户端计算机可以拥有处理所有前端数据管理的软件,并且也可以接收来自用户的数据输入。

系统可以被配置为接收用户请求以对样品执行检测反应。在一些实施方案中,用户请求是直接的或间接的。直接请求的实例包括通过输入设备(例如键盘、鼠标或触摸屏)传输的那些。间接请求的实例包括通过通信介质传输,例如通过互联网(有线或无线)传输。

系统还可包括响应于用户请求对样品或其部分进行核酸扩增反应的扩增系统。各种扩增多核苷酸(例如DNA和/或RNA)的方法都是可用的。在一些实施方案中,扩增是线性的、指数的,或在多相扩增过程中涉及线性相和指数相二者。在一些情况下,扩增方法涉及温度变化,例如热变性步骤,或者是不需要热变性的等温过程。本文描述了合适的扩增过程的非限制性实例,例如关于本公开的各个方面中的任一个。用于扩增多核苷酸的各种系统都是可用的,并且在一些情况下,根据待进行的扩增反应的类型而有所不同。例如,对于包括温度变化循环的扩增方法,在一些情况下,扩增系统包括热循环仪。扩增系统可以包括实时扩增和检测仪器,例如Applied Biosystems、Roche和Strategene制造的系统。样品、多核苷酸、引物、聚合酶和其他试剂可以是本文所述的那些中的任一种,例如关于各个方面中的任一个。系统可以被选择和或设计为执行任何这样的方法。

在一些实施方案中,系统还包括测序系统,其生成通过扩增系统扩增的多核苷酸的测序读段并鉴定测序读段和参考序列之间的序列差异。在一些实施方案中,测序系统和扩增系统是相同的,或者包括重叠的设备。例如,在一些情况下,扩增系统和测序系统二者使用同一热循环仪。用于系统中的各种测序平台是可用的,并且在一些实施方案中,基于所选测序方法进行选择。本文描述了测序方法的实例。在一些情况下,扩增和测序涉及使用液体处理器。可以使用若干商业上可获得的液体处理系统来运行这些过程的自动化(参见例如来自作为实例的Perkin-Elmer、Beckman Coulter、Caliper Life Sciences、Tecan、Eppendorf、Apricot Design、Velocity 11的液体处理器)。各种自动化测序仪是商业上可获得的,并且包括由Life Technologies(SOLiD平台和基于pH的检测)、Roche(454平台)、Illumina(例如,基于流动池的系统,例如Genome Analyzer设备)制造的测序仪。在一些情况下,在2、3、4、5或更多个自动化设备之间(例如,在液体处理器和测序设备中的一个或多个之间)的转移是手动或自动化的。

系统还可以包括向接受者发送报告的报告生成器,其中报告包含检测对象中的染色体外DNA(ecDNA)阳性癌症的结果。在一些情况下,实时生成报告,例如在测序读段期间或在正在分析测序数据时,并且随着过程的进展定期更新。附加地或可替代地,在分析结束时生成报告。在一些实施方案中,自动地例如当系统完成将对象分类为患有ecDNA阳性癌症的步骤时生成报告。在一些实施方案中,响应于来自用户的指令生成报告。除了将对象分类为患有ecDNA阳性癌症的结果之外,在一些情况下,报告还包含基于一种或多种生物标志物的分析。例如,基于此信息的建议(例如,额外的测试、监测或补救措施)。报告可以采用各种形式中的任一种。可以设想,与本公开相关的数据可以通过这样的网络或连接(或用于传输信息的任何其他合适的方法,包括但不限于邮寄物理报告,例如打印输出)传输以供接收者接收和/或审阅。接收者可以是但不限于个人或电子系统(例如,一个或多个计算机,和/或一个或多个服务器)。

在替代情况下,包括计算机可执行代码的机器可读介质采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机中的任何存储设备等,例如用于实现数据库等。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的线。在一些情况下,载波传输介质采用电信号或电磁信号的形式,或者采用声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如软磁盘、软盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、带有孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒、传输数据或指令的载波、传输此类载波的电缆或链路、或计算机在一些情况下从中读取编程代码和/或数据的任何其他介质。在一些情况下,许多这些形式的计算机可读介质参与将一个或多个指令的一个或多个序列传送到处理器以供执行。

主题计算机可执行代码可以在包括处理器的任何合适的设备上,包括在服务器、PC或移动设备例如智能手机或平板电脑上执行。任何控制器或计算机任选地包括监视器,其可以是阴极射线管(“CRT”)显示器、平板显示器(例如,有源矩阵液晶显示器、液晶显示器等)或其他。计算机电路通常安置在盒子中,其中包括许多集成电路芯片,例如微处理器、存储器、接口电路及其他。该盒子还任选地包括硬盘驱动器、软盘驱动器、高容量可移动式驱动器例如可写式CD-ROM以及其他常见的外围元件。输入设备例如键盘、鼠标或触敏屏幕任选地提供来自用户的输入。计算机可以包括用于接收用户指令的适当软件,以用户输入到一组参数字段的形式,例如,在GUI中,或以预编程指令的形式,例如为各种不同的特定操作而预编程。

本公开提供了被编程为实现本公开的方法的计算机系统。图6显示了计算机系统601,其被编程或以其他方式配置为检测染色体外DNA(ecDNA)阳性癌症或开发ecDNA阳性癌症的特征。计算机系统601可以调节与本公开中公开的ecDNA阳性癌症相关的生物标志物的检测和分析的各个方面,例如,获得源自对象的生物样品的生物标志物数据,用对照生物标志物数据的数据库或预设阈值对来自对象的生物标志物数据进行处理,以及当来自对象的生物标志物数据与对照生物标志物数据的数据库或预设阈值相比显著不同时,将对象分类为患有ecDNA阳性癌症。计算机系统601可以是用户的电子设备或相对于电子设备位于远程的计算机系统。电子设备可以是移动电子设备。

计算机系统601包括中央处理单元(CPU,在本文中也称为“处理器”和“计算机处理器”)605,其可以是单核或多核处理器,或者用于并行处理的多个处理器。计算机系统601还包括存储器或存储位置610(例如,随机存取存储器、只读存储器、闪存),电子存储单元615(例如,硬盘),用于与一个或多个其他系统通信的通信接口620(例如,网络适配器),以及外围设备625,例如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器610、存储单元615、接口620和外围设备625通过通信总线(实线)例如母板而与CPU 605通信。存储单元615可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统601可以借助于通信接口620而可操作地耦合到计算机网络(“网络”)630。网络630可以是因特网、互联网和/或外联网,或与因特网通信的内联网和/或外联网。在一些情况下,网络630是电信和/或数据网络。网络630可以包括一个或多个计算机服务器,其可以实现分布式计算,例如云计算。在一些情况下,网络630借助于计算机系统601,可以实现对等网络,其可以使耦合到计算机系统601的设备能够充当客户端或服务器。

CPU 605可以执行机器可读指令的序列,所述指令可以体现在程序或软件中。在一些情况下,指令被存储在存储位置例如存储器610中。指令可以被引导到CPU 605,其可以随后将CPU 605编程或以其他方式配置为实现本公开的方法。由CPU 605执行的操作的实例可以包括获取、解码、执行和写回。

CPU 605可以是电路(例如集成电路)的部分。系统601的一个或多个其他组件可以被包括在电路中。在一些情况下,电路是专用集成电路(ASIC)。

存储单元615可以存储文件,例如驱动程序、库和保存的程序。存储单元615可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统601可以包括一个或多个附加数据存储单元,其在计算机系统601外部,例如位于通过内联网或因特网而与计算机系统601通信的远程服务器上。

计算机系统601可以通过网络630而与一个或多个远程计算机系统通信。例如,计算机系统601可以与用户(例如,医疗保健提供者或患者)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、平板触摸或平板PC(例如

如本文所述的方法可以通过在计算机系统601的电子存储位置(例如存储器610或电子存储单元615)上存储的机器(例如,计算机处理器)可执行代码来实现。机器可执行的或机器可读的代码可以以软件的形式提供。在使用期间,代码可以由处理器605执行。在一些情况下,代码可以从存储单元615中检索并存储在存储器610中以供处理器605随时访问。在一些情况下,可以排除电子存储单元615,并且机器可执行指令存储在存储器610上。

代码可以被预编译和配置为与具有适配于执行代码的处理器的机器一起使用,或者可以在运行时被编译。代码可以用编程语言提供,可以选择该编程语言以使代码能够以预编译或编译时的(as-compiled)方式执行。

本文提供的系统和方法(例如计算机系统601)的方面可以体现在编程中。该技术的各个方面可以被认为是“产品”或“制品”,通常为承载在或体现在一种机器可读介质中的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”类型介质可以包括计算机、处理器等或其相关模块的任何或所有有形存储器,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们在一些情况下随时为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,在一些情况下,这样的通信使软件能够从一台计算机或处理器加载到另一台,从管理服务器或主机计算机加载到应用服务器的计算机平台中。因此,在一些实施方案中,承载软件元件的另一类型的介质包括光波、电波和电磁波,例如通过本地设备之间的物理接口、通过有线和光陆线网络以及通过各种空中链路使用。承载这种波的物理元件(例如有线或无线链路、光链路等)在一些情况下也被认为是承载软件的介质。如本文所用,除非限于非暂时性、有形“存储”介质,否则术语诸如计算机或机器“可读介质”是指参与向处理器提供指令以供执行的任何介质。

因此,机器可读介质(例如计算机可执行代码)可以采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,例如任何计算机中的任何存储设备等,在一些情况下用于实现图中所示的数据库等。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的线。在一些实施方案种,载波传输介质采用电信号或电磁信号的形式,或者采用声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如软磁盘、软盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、带有孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒、传输数据或指令的载波、传输此类载波的电缆或链路、或计算机可以从中读取编程代码和/或数据的任何其他介质。在一些实施方案中,许多这些形式的计算机可读介质参与将一个或多个指令的一个或多个序列传送到处理器以供执行。

计算机系统601可以包括电子显示器635或与之通信,电子显示器635包括用于提供例如本公开的方法的结果的用户界面(UI)640。UI的实例包括但不限于图形用户界面(GUI)和基于网络的用户界面。

本公开的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元605执行时通过软件来实现。算法可以是例如经训练的算法(或经训练的机器学习算法),例如支持向量机或神经网络。

如本文所用,术语“约”或“大约”意指在由本领域普通技术人员确定的特定值的可接受误差范围内,这可以部分取决于如何测量或确定该值,即测量系统的限制。例如,根据本领域的实践,“约”可以意指在1个或大于1个标准偏差内。作为另一个实例,“约”可以意指给定值的至多20%、至多10%、至多5%或至多1%的范围。关于生物系统或过程,术语“约”可以意指在值的一个数量级之内,例如在值的5倍或2倍之内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,否则术语“约”是指在该特定值的可接受误差范围内。

如本文所用,术语“对象”通常是指脊椎动物,例如哺乳动物(例如,人)。哺乳动物包括但不限于鼠、猿、人、农场动物、运动动物和宠物(例如,狗或猫)。还包括在体内获得或在体外培养的生物实体的组织、细胞和它们的后代。在一些实施方案中,对象是患者。在一些实施方案中,对象对于疾病(例如,癌症)是有症状的。可替代地,在一些情况下,对象对于疾病是无症状的。在一些情况下,对象未患疾病。

如本文所用,术语“生物样品”通常是指源自或获自对象例如哺乳动物(例如,人)的样品。生物样品被视为包括但不限于毛发、指甲、皮肤、汗液、泪液、眼部流体、鼻拭子或鼻咽洗液、痰、咽拭子、唾液、粘液、血液、血清、血浆、胸腔积液、胎水(placental fluid)、羊水、脐带血、强调液(emphatic fluids)、腔液、耳垢、油、腺体分泌物、胆汁、淋巴液、脓液、微生物群、胎粪、母乳、骨髓、骨、CNS组织、脑脊液、脂肪组织、滑液、粪便、胃液、尿液、精液、阴道分泌物、胃、小肠、大肠、直肠、胰腺、肝、肾、膀胱、肺,以及源自或获得自对象的其他组织和流体。

每当术语“至少”、“大于”或“大于或等于”在两个或更多个数值的系列中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该数值系列中的每个数值。例如,大于或等于1、2或3等同于大于或等于1、大于或等于2、或大于或等于3。

每当术语“不大于”、“小于”或“小于或等于”在两个或更多个数值的系列中的第一个数值之前时,术语“不大于”、“小于”、或“小于或等于”适用于该数值系列中的每个数值。例如,小于或等于3、2或1等同于小于或等于3、小于或等于2、或小于或等于1。

如本文所用,术语“染色体外DNA”或“ecDNA”通常是指未在染色体中发现的环状DNA。染色体外DNA是一种独特的实体,其有时在一些癌细胞的细胞核中观察到,并且在一些情况下,携带驱动癌基因。在一些情况下,染色体外DNA携带超过一个拷贝的驱动癌基因。

如本文所用,术语“生物标志物”通常是指生物状态或状况的可测量性指标。用于本文方法和过程中的示例性生物标志物包括但不限于核酸拷贝数、共扩增的基因、功能通路突变、基因融合、片段长度、SNP/SNV频率、插入缺失频率和位置、微卫星不稳定性、肿瘤炎症评分、基因表达(例如PD-L1表达)和肿瘤突变负荷。

给出以下实施例的目的是为了说明本发明的各种实施方案,并非意在以任何方式限制本发明。本实施例连同本文描述的方法目前代表优选实施方案,是示例性的,并非旨在限制本发明的范围。本领域技术人员将想到涵盖在由权利要求的范围限定的本发明的精神内的其变化和其他用途。

在KEYNOTE-059研究中,抗PD-1检查点抑制剂派姆单抗显示出具有11.6%的适中整体响应性。包括高微卫星不稳定性(MSI-H)、PD-L1表达、肿瘤突变负荷(TMB)或肿瘤炎症特征(TIS)在内的常见响应预测因子单独地不足以富集预测的响应者。最近的泛癌研究已突出显示了独特的癌症患者群体,他们的肿瘤似乎由染色体外DNA(ecDNA)上的癌基因扩增来驱动。这些ecDNA驱动的肿瘤是侵袭性的,其特征是高水平的基因组不稳定性,更具侵袭性,具有更差的预后,并且难以治疗。我们试图了解具有ecDNA的肿瘤是否代表对抗PD-1治疗不响应的患者组的子集。

在本实施例中,使用来自TCGA泛癌数据集的全基因组测序(WGS)确定胃癌患者(N=108)的ecDNA状态。先前已对这些患者针对EBV状态、基因组稳定性(GS)、微卫星不稳定性(MSI)和染色体不稳定性(CIN)进行了亚型分析。无论胃亚型如何,ecDNA阳性的患者都被重新分类为一组。此外,还收集了TMB、TIS和PD-L1表达水平。

百分之三十二的胃癌患者对ecDNA特征呈阳性并且与23%的MSI-H患者相互排斥(图2,图7)。MSI状态(经常报告为MSI-H、MSS或MSI-L)是免疫肿瘤学(IO)治疗中常见的生物标志物(以及用于派姆单抗的经批准的泛实体肿瘤伴随诊断)。还发现ecDNA阳性肿瘤具有与除CIN肿瘤(p值=0.09)之外的所有其他组(p值<0.05)相比在统计学上显著更低的TIS。TIS与肿瘤样本的免疫活性水平成比例,并与对派姆单抗的改善的响应呈正相关。ecDNA阳性肿瘤还具有与除GS肿瘤外的所有肿瘤相比更低的PD-L1表达。PD-L1表达被用作对派姆单抗的阳性响应的生物标志物,并且特定的PD-L1抗体/评分组合是用于派姆单抗的伴随诊断。与其他各组相比,只有MSI-H表现出在统计学上显著更高的TMB评分(p值<0.001);在每对其他组之间没有观察到TMB评分的差异。

比较在各种分子亚类中肿瘤的ecDNA+和ecDNA-状态(图11)。该比较表明ecDNA在对派姆单抗无响应的CIN患者中富集。此外,在派姆单抗响应性亚组EBV/CIN中,ecDNA减少或完全不存在。此观察结果表明,CIN/ecDNA+亚组和其他亚类之间在响应性方面可能存在潜在差异。

将患者的数量按照在各种癌基因热点中具有CNV增益的每个亚型进行分组(图12)。深红色柱表示其中已推断扩增的癌基因在ecDNA上特异性扩增的患者。值得注意的是,经常发现几种关键的免疫相关癌基因(MYC、CDK6、CCNE1、CCND1)在ecDNA+患者中扩增。此外,ERBB2/MDM2经常在ecDNA结构上特异性扩增。

使用生物标志物的组合确定了被预测为派姆单抗的响应者/无响应者的ecDNA+和ecDNA-患者的比例(图13)。在该分析中,发现ecDNA阴性患者在预测的响应者中显著富集。同样,ecDNA阳性患者在预测的无响应者中富集。

这些数据表明,肿瘤为ecDNA阳性的患者代表了独特的群体,该群体表现出与对检查点抑制剂治疗缺乏响应相关的特征,包括MSS、低TIS和PD-L1表达。因此,肿瘤ecDNA状态的确定可用作检查点抑制剂治疗的额外患者选择策略。由于ecDNA不限于胃癌,本研究强调了开发对ecDNA状态的临床诊断测试的重要性,以及进一步研究ecDNA生物学、其对免疫治疗响应的影响以及潜在的ecDNA导向治疗的必要性。

方法的流程图在图14中示出。使用Human Core Exome试剂盒(Twist Bioscience)制备外显子组,并在具有2x150双末端(paired-end)读段配置的Illumina平台上进行测序。

测序数据根据基因组分析工具包(GATK)推荐的实践进行处理(参见gatk.groadinstitute.org/hc/en-us/articles/30035894731-Somatic-short-variant-discovery-SVNs-Indels-)。简而言之,使用Burrows-Wheeler比对器(BWA)最小精确匹配(MEM)将原始读段与人类基因组(版本GRCh37)进行比对。然后使用Mutect2(GATKv4.1.9.0)提取小的体细胞变异,并使用FilterMutectCalls进行过滤。

在R/Bioconductor中对所得变体调用格式(variant call format,VCF)文件进行下游分析。

从SNU16细胞的培养物中获得外显子组数据,并且将通过GATK Mutect2生成的VCF文件用于计算在整个常染色体基因组上在一百万个核苷酸长的基因组窗口中置换、插入和缺失的比率。通过VCF文件中报告的该特定基因组窗口中所有突变的平均深度来估计平均覆盖深度。

所得数据表明,SNU16细胞中的ecDNA区域与高突变率相关。图15在上图中显示了使用AmpliconArchitect确定的存在于SNU16细胞中的含有ecDNA的扩增子的结构。在图15的下图中,根据AmpliconArchitect输出,对于对应于ecDNA的三个基因组区域,平均深度由线显示,插入/缺失(插入缺失)率由向上的柱显示,而置换率由向下的柱显示,显示了反映该基因组区域的拷贝数扩增的覆盖范围增加,以及突变率(尤其是插入缺失)增加。在1e5个核苷酸滑动窗口中计算一百万个核苷酸的突变率。

分析还表明ecDNA区域中的置换率高于周围区域。图16在上图中显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的置换位置。每个竖直柱代表唯一置换。水平柱突出显示了含有ecDNA的扩增子的位置。在图16的下图中,显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的置换密度(匹配图16上图中所示的基因组坐标)。大多数ecDNA区域的特征在于与其周围区域相比更高的置换率。

插入缺失率分析的结果显示在图17中。图17的上图显示了与SNU61细胞中的ecDNA对应的三个基因组区域及其周围区域中的插入缺失的位置。每个竖直柱代表唯一插入或缺失。图17的下图显示了与SNU16细胞中的ecDNA对应的三个基因组区域及其周围区域中的插入缺失的密度(匹配图17上图中所示的基因组坐标)。这些数据表明,ecDNA区域的特征在于与其周围区域相比更高的插入缺失率。

在对应于SNU16 ecDNA扩增子的基因组区域(空心点)以及500个随机相同大小的连续基因组区域(实心点)上计算置换率和插入缺失率,并相对于平均读取深度绘图,表明ecDNA的特征是高读取深度和插入缺失率(图18左图)。图18的右图显示了每百万个核苷酸(1e5滑动窗口)的平均深度(线)、插入缺失率(向上的柱)和置换率(向下的柱),举例说明了具有置换/插入缺失率和读取深度的各种组合的基因组区域,证明突变率不一定与读取深度混淆。

对SNU16细胞培养物进行一系列治疗,开始用英菲格拉替尼治疗,然后用厄洛替尼治疗。在本实验期间在不同时间点从这些细胞中获得外显子组数据:用英菲格拉替尼治疗前,进入用1μM英菲格拉替尼治疗两周,用1μM英菲格拉替尼治疗12周后,用厄洛替尼治疗前,进入用5μM厄洛替尼治疗两周,以及进入用5μM厄洛替尼治疗4周。将通过GATK Mutect2生成的VCF文件用于计算在整个常染色体基因组中在一百万个核苷酸长的基因组窗口中置换、插入和缺失的比率。通过VCF文件中报告的该特定基因组窗口中所有突变的平均深度来估计平均覆盖深度。

图19中的数据表明MYC和PDHX ecDNA拷贝数在治疗期间大部分是稳定的。FGFR2ecDNA拷贝数在用英菲格拉替尼治疗期间适中地减少。EGFR ecDNA拷贝数在用英菲格拉替尼治疗期间大幅增加,但在用厄洛替尼治疗时下降回去。方框突出显示了对应于这些ecDNA的基因组位置,并且表明插入缺失率遵循与ecDNA拷贝数相同的趋势。

对H2170细胞中观察到的突变的分析显示在图20中。上图显示了使用AmpliconArchitect确定的存在于H2170鳞状细胞癌细胞(ATCC)中的含有ecDNA的扩增子的结构。在图20的下图中,根据AmpliconArchitect输出,显示了在对应于ecDNA的基因组区域中每百万个核苷酸(1e5滑动窗口)的平均深度(线)、插入缺失率(向上的柱)和置换率(向下的柱)。该数据显示了反映拷贝数扩增的读取深度增加,以及插入缺失率的略微(ERBB2)至大幅(MYC)增加。

P53通路是一种肿瘤抑制通路,它可以响应于癌基因激活或DNA损伤发出细胞凋亡信号。肿瘤抑制基因TP53的突变或抑制TP53的MDM2的扩增可能使该通路失效。表1表明,与ecDNA-患者相比,ecDNA+患者在统计学上显著可能具有P53通路改变。

数据是从泛癌TCGA数据库中获得的,并且基于已知ecDNA状态(Kim,H.,等人(2020)."Extrachromosomal DNA is associated with oncogene amplification andpoor outcome across multiple cancers."Nature Genetics.)、TP53突变状态(Gao,J.,等人(2013)."Integrative analysis of complex cancer genomics and clinicalprofiles using the cBioPortal."Sci Signal 6(269):pl1.)和MDM2扩增状态(www.cancer.gov/tcga)的1607名癌症患者。通过在WGS数据上运行AmpliconArchitect确定ecDNA状态。从WGS和WXS数据推断TP53突变状态。由Affymetrix SNP 6.0阵列确定MDM2扩增状态。出于该分析的目的,3个或更大的拷贝数被认为是扩增的。本文将P53通路改变的患者归类为任何具有TP53突变或MDM2扩增的患者。所有其他患者均被认为具有P53通路能力。在该分析中相比于推断的ecDNA-患者中的36%,推断的ecDNA+患者中的67%发生了P53通路改变(Pearson卡方;p值<1e-15)。

微卫星不稳定性(MSI)是一种状况,其中调节DNA错配修复的基因不正确地发挥作用,导致基因组中的大量突变。如下所示,ecDNA+癌症与MSI状态呈负相关(表2)。

数据是从泛癌TCGA数据库中获得的,并且基于已知ecDNA状态(Kim,H.,等人(2020)."Extrachromosomal DNA is associated with oncogene amplification andpoor outcome across multiple cancers."Nature Genetics.)、TP53突变状态(Gao,J.,等人(2013)."Integrative analysis of complex cancer genomics and clinicalprofiles using the cBioPortal."Sci Signal 6(269):pl1.)和MSI状态(Kautto,E.A.,等人(2017)."Performance evaluation for rapid detection of pan-cancermicrosatellite instability with MANTIS."Oncotarget 8(5):7452-7463)的1821名癌症患者。通过在WGS数据上运行AmpliconArchitect推断ecDNA状态。通过在WXS数据上运行MANTIS4推断MSI状态(Bonneville,R.,等人(2017)."Landscape of MicrosatelliteInstability Across 39Cancer Types."JCO Precis Oncol 2017)。96%的MSI-H患者是ecDNA-,并且ecDNA-患者是MSI-H的可能性是ecDNA+患者的7倍。该结果表明,ecDNA阳性与MSI状态呈反相关,并且是统计学显著的(Pearson卡方;p值<0.0006)。

尽管本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员来说显而易见的是,这样的实施方案仅作为示例提供。在不背离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替换。应当理解,可以采用本文描述的实施方案的各种替代方案。所附权利要求旨在限定本发明的范围,并且由此覆盖这些权利要求的范围内的方法和结构及其等同方案。

相关技术
  • 染色体外DNA鉴定和使用方法
  • 一种基于DNA特征序列的细菌核酸测序鉴定方法及细菌鉴定试剂盒
技术分类

06120115573232