掌桥专利:专业的专利平台
掌桥专利
首页

基于乳腺癌的分子表征的治疗方法

文献发布时间:2023-06-19 16:08:01



相关申请的交叉引用

本申请要求Christina Curtis等人于2019年9月16日提交的题为“Methods ofTreatments Based Upon Molecular Characterization of Breast Cancer”的美国临时申请系列号62/901,175的优先权,其全部内容通过引用并入本文。

技术领域

本发明一般涉及基于个体乳腺癌的分子表征的诊断和治疗方法,更具体地涉及基于指示侵袭性、乳腺癌复发风险或分子亚型的分子诊断的治疗。

背景

乳腺癌是全世界女性中最常见的癌症诊断和癌症死亡原因,每年有140万例诊断和500,000例死亡。由于新的治疗方法,生存率已显著提高,但相当一部分患者患有侵袭性癌症和/或复发,这可能是无法治愈的。大多数癌症登记不记录复发信息,并且复发率的表征欠佳。回顾性队列和临床试验的分析为复发模式提供了一些见解。例如,一些雌激素受体阳性(ER+)肿瘤在五年过去后继续复发,具有更高的骨转移率,而雌激素受体阴性(ER-)肿瘤更快复发,并且具有更高的内脏转移率。然而,缺乏对复发风险进行可靠分层的方法,以及缺乏针对具有高复发风险或根据其肿瘤分子谱已经复发的早期乳腺癌患者的治疗方法。

概述

各种实施方案涉及基于其分子表征的乳腺癌治疗方法。在各种实施方案中,乳腺癌的分子亚型基于其遗传学来确定。在各种实施方案中,分子亚型指示性乳腺癌侵袭性和复发风险。在各种实施方案中,分子亚型指示乳腺癌的分子病理学。在各种实施方案中,根据侵袭性、复发风险和由其分子亚型确定的分子驱动因子来治疗乳腺癌。

在一个实施方案中,治疗患有乳腺癌的个体。使用风险分层模型将个体的乳腺癌分层为高复发风险亚组。风险分层模型是一种统计模型,它并入了来源于由分子病理学描述的整合亚型集群的特征。通过施用包括化疗、内分泌治疗、靶向治疗或健康专业监测的延长治疗方案,对个体进行治疗以降低复发风险。

在另一个实施方案中,风险分层模型利用多状态半马尔可夫模型、Cox比例风险模型、基于收缩的方法、基于树的方法、贝叶斯方法、基于核的方法或神经网络。

在又一个实施方案中,整合亚型集群特征是给定集群的成员资格或给定集群的成员资格的后验概率。

在进一步的实施方案中,整合亚型集群由并入分子数据作为特征的IntClust分类模型确定。

在又一个实施方案中,分子数据通过基于微阵列的基因表达、基于微阵列/SNP阵列的拷贝数推断、RNA测序、靶向(捕获)RNA测序、外显子组测序、全基因组测序(WES/WGS)、靶向(小组)测序、用于基因表达的Nanostring nCounter、用于拷贝数推断的NanostringnCounter、蛋白质的Nanostring数字空间分析仪测量、原位蛋白质基因表达的Nanostring数字空间分析仪测量、DNA-ISH、RNA-ISH、RNAScope、DNA甲基化测定或ATAC-seq获得。

在又一个实施方案中,分子数据是利用基因小组衍生的。

在更进一步的实施方案中,基因小组是以下之一:Foundation Medicine CDx、Memorial Sloan Kettering Cancer Center Integrated Mutation Profiling ofActionable Cancer Targets(MSK-IMPACT)、Stanford Tumor Actionable MutationPanel(STAMP)或UCSF500Cancer Gene Panel。

在又一个更进一步的实施方案中,风险分层模型利用临床数据例如年龄、癌症分期、肿瘤阳性淋巴结的数量、肿瘤大小、肿瘤分级、所进行的手术、所进行的治疗或基本的分子身份。

在又一个更进一步的实施方案中,风险分层模型利用CTS5算法。

在又一个更进一步的实施方案中,风险分层模型并入了Oncotype DX、ProsignaPAM50、Prosigna ROR、MammaPrint、EndoPredict或乳腺癌指数(BC)。

在又一个更进一步的实施方案中,延长治疗方案包括辅助化疗。

在又一个更进一步的实施方案中,延长治疗方案包括超出标准疗程的治疗。

在一个实施方案中,治疗患有乳腺癌的个体。使用风险分层模型将个体的乳腺癌分层为复发风险较低的亚组。风险分层模型是并入了来源于由分子病理学描绘的整合亚型集群的特征的统计模型。通过施用包括手术或内分泌治疗但不包括化学疗法的治疗方案,对个体进行治疗以减少化学疗法的有害影响。

在另一个实施方案中,风险分层模型利用多状态半马尔可夫模型、Cox比例风险模型、基于收缩的方法、基于树的方法、贝叶斯方法、基于核的方法或神经网络。

在又一个实施方案中,整合亚型集群特征是给定集群的成员资格或给定集群的成员资格的后验概率。

在进一步的实施方案中,整合亚型集群由并入分子数据作为特征的IntClust分类模型确定。

在又一个实施方案中,分子数据通过基于微阵列的基因表达、基于微阵列/SNP阵列的拷贝数推断、RNA测序、靶向(捕获)RNA测序、外显子组测序、全基因组测序(WES/WGS)、靶向(小组)测序、用于基因表达的Nanostring nCounter、用于拷贝数推断的NanostringnCounter、蛋白质的Nanostring数字空间分析仪测量、原位蛋白质基因表达的Nanostring数字空间分析仪测量、DNA-ISH、RNA-ISH、RNAScope、DNA甲基化测定或ATAC-seq获得。

在又一个实施方案中,分子数据是利用基因小组衍生的。

在更进一步的实施方案中,基因小组是以下之一:Foundation Medicine CDx、Memorial Sloan Kettering Cancer Center Integrated Mutation Profiling ofActionable Cancer Targets(MSK-IMPACT)、Stanford Tumor Actionable MutationPanel(STAMP)或UCSF500Cancer Gene Panel。

在又一个更进一步的实施方案中,风险分层模型利用临床数据例如年龄、癌症分期、肿瘤阳性淋巴结的数量、肿瘤大小、肿瘤分级、所进行的手术、所进行的治疗或基本的分子身份。

在又一个更进一步的实施方案中,风险分层模型利用CTS5算法。

在又一个更进一步的实施方案中,风险分层模型并入了Oncotype DX、ProsignaPAM50、Prosigna ROR、MammaPrint、EndoPredict或乳腺癌指数(BC)。

在又一个更进一步的实施方案中,治疗方案包括辅助内分泌治疗。

在一个实施方案中,治疗患有乳腺癌的个体。确定测定的结果,将个体的乳腺癌分类为整合集群(IntClust)亚组。结果表明,乳腺癌被分类为以下之一:IntClust1、IntClust2、IntClust6或IntClust9。用包括化学疗法、内分泌疗法、靶向疗法和健康专业监测的延长治疗方案治疗个体。

在另一个实施方案中,个体乳腺癌的分类是利用分子类别预测工具进行的。

在又一个实施方案中,分子类别预测工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。

在进一步实施方案中,分子类别预测工具并入分子数据作为特征。

在又一个实施方案中,分子数据特征是来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或占据特征。

在又一个实施方案中,分子数据通过基于微阵列的基因表达、基于微阵列/SNP阵列的拷贝数推断、RNA测序、靶向(捕获)RNA测序、外显子组测序、全基因组测序(WES/WGS)、靶向(小组)测序、用于基因表达的Nanostring nCounter、用于拷贝数推断的NanostringnCounter、蛋白质的Nanostring数字空间分析仪测量、原位蛋白质基因表达的Nanostring数字空间分析仪测量、DNA-ISH、RNA-ISH、RNAScope、DNA甲基化测定或ATAC-seq获得。

在更进一步的实施方案中,分子数据是利用基因小组衍生的。

在又一个更进一步的实施方案中,基因小组是Foundation Medicine CDx、Memorial Sloan Kettering Cancer Center Integrated Mutation Profiling ofActionable Cancer Targets(MSK-IMPACT)、Stanford Tumor Actionable MutationPanel(STAMP)或UCSF500Cancer Gene Panel。

在又一个更进一步的实施方案中,对个体的乳腺癌进行辅助化疗。

在又一个更进一步的实施方案中,对个体的乳腺癌进行延长内分泌治疗。

在又一个更进一步的实施方案中,内分泌疗法包括施用选择性雌激素受体调节剂、选择性雌激素受体降解剂、芳香酶抑制剂或PROTAC ARV-471。

在又一个更进一步的实施方案中,选择性雌激素受体调节剂是他莫昔芬、托瑞米芬、雷洛昔芬、欧培米芬或巴多昔芬。

在又一个更进一步的实施方案中,选择性雌激素受体降解剂是氟维司群、布里兰司群(GDC-0810)、依拉司群、GDC-9545、SAR439859(SERD'859)、RG6171或AZD9833。

在又一个更进一步的实施方案中,芳香酶抑制剂是阿那曲唑、依西美坦、来曲唑、伏氯唑、福美坦或法曲唑。

在又一个更进一步的实施方案中,乳腺癌被分类为IntClust1并且向个体施用mTOR途径拮抗剂、AKT1拮抗剂、AKT1/RPS6KB1拮抗剂、RPS6KB1拮抗剂、PI3K拮抗剂、eIF4A拮抗剂或eIF4E拮抗剂。

在又一个更进一步的实施方案中,乳腺癌被分类为IntClust2并且向个体施用CDK4/6拮抗剂、FGFR途径拮抗剂、PARP拮抗剂、同源重组缺陷(HRD)靶向治疗、PAK1拮抗剂、eIF4A拮抗剂或eIF4E拮抗剂。

在又一个更进一步的实施方案中,乳腺癌被分类为IntClust6并且向个体施用FGFR途径拮抗剂、eIF4A拮抗剂或eIF4E拮抗剂。

在又一个更进一步的实施方案中,乳腺癌被分类为IntClust9并且向个体施用选择性雌激素受体降解剂、SRC3拮抗剂、MYC拮抗剂、BET溴结构域拮抗剂、eIF4A拮抗剂或eIF4E拮抗剂。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示mTOR途径。向个体施用mTOR拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,mTOR拮抗剂是依维莫司、西罗莫司、西罗莫司或雷帕霉素。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示AKT1。向个体施用AKT1拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,AKT1拮抗剂是ipatasertib或capivasertib(AZD5363)。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示AKT1/RPS6KB1。向个体施用AKT1/RPS6KB1拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,AKT1/RPS6KB1拮抗剂是M2698。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示RPS6KB1。向个体施用RPS6KB1拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,RPS6KB1拮抗剂是LY2584702。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示PI3K。向个体施用PI3K拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,PI3K拮抗剂是阿培利司、buparlisib(BKM120)或pictilisib(GDC-0941)。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示CDK4/6。向个体施用CDK4/6拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,CDK4/6拮抗剂是帕博西尼、瑞博西尼或阿贝西利。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示FGFR途径。向个体施用FGFR途径拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,FGFR途径拮抗剂是卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877或普纳替尼。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示SRC3。向个体施用SRC3拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该分子类别预测工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,SRC3拮抗剂是SI-2。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示MYC。向个体施用MYC拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,MYC拮抗剂是omomyc。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示BET溴结构域。向个体施用BET溴结构域拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,BET溴结构域拮抗剂是JQ1或PROTAC ARV-771。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示eIF4A。向个体施用eIF4A拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,eIF4A拮抗剂是佐他替芬。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示v。向个体施用eIF4E拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,eIF4E拮抗剂是雷帕霉素、雷帕霉素类似物、利巴韦林或AZD8055。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示PARP。向个体施用PARP拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,PARP拮抗剂是尼拉帕尼或奥拉帕尼。

在一个实施方案中,治疗患有乳腺癌的个体。对个体癌症的致癌病理学进行分类。致癌病理学指示PAK1。向个体施用PAK1拮抗剂。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子预测工具还利用来源于个体乳腺癌的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,PAK1拮抗剂是IPA3。

在一个实施方案中,利用乳腺癌患者来源的类器官评估药物化合物。从一个或多个患者中提取癌细胞。每个患者癌症的致癌病理学被分类为分子病理学亚组。利用提取的癌细胞开发一组患者来源的类器官系。小组的每个患者来源的类器官系在相同的分子病理学亚组内。在患者来源的类器官系上施用多种药物化合物以评估每种药物化合物的毒性。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子类别预测工具还利用来自患者乳腺癌或患者来源类器官系的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,分子病理学亚组是整合集群亚组。

在进一步的实施方案中,评估化合物浓度。

在又一个实施方案中,评估化合物对健康细胞的毒性。

在一个实施方案中,使用乳腺癌患者来源的类器官评估用于个性化治疗的药物化合物。从患者提取癌细胞。患者癌症的致癌病理学被分类为分子病理学亚组。使用提取的癌细胞开发一种或多种患者来源的类器官系。多种药物化合物在一种或多种患者来源的类器官系上施用以评估每种药物化合物的毒性。待施用的药物化合物是与分子病理学亚组相关的候选化合物。

在另一个实施方案中,利用分子类别预测工具对致癌病理学进行分类,该工具利用基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机或神经网络。分子类别预测工具还利用来自患者乳腺癌或患者来源类器官系的DNA或RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征或核小体占据特征。

在又一个实施方案中,分子病理学亚组是整合集群亚组。

在进一步的实施方案中,评估化合物浓度。

在又一个实施方案中,评估化合物对健康细胞的毒性。

在又一个实施方案中,评估药物化合物的至少一种组合。

在更进一步的实施方案中,基于药物化合物对一种或多种患者来源的类器官系的毒性,向患者施用多种药物化合物中的药物化合物。

在又一个实施方案中,药物化合物作为辅助疗法施用。

附图的简要说明

参考所附附图和数据图表将更充分地理解说明书和权利要求,这些附图和数据图表被呈现为本发明的示例性实施方案并且不应被说明为对本发明范围的完整叙述。

图1A至1F提供了根据现有技术的用于乳腺癌表征的基因组测定的列表。

图2A和2B提供了在现有技术中生成并用作参考的染色体拷贝数异常及其在整合集群中的普遍性的图。

图3A和3B提供了条形图,指示在现有技术中生成并用作参考的列出的基因中经历拷贝数增加或扩增的高风险整合集群内的乳腺癌百分比。

图4提供了在现有技术中生成并用作参考的整合集群系统的亚组的复发概率。

图5提供了根据本发明的各种实施方案使用的整合集群系统的ER+亚组随时间的复发概率。

图6提供了条形图,其指示根据本发明的各种实施方案使用的被划分为经历特定基因拷贝数增加的整合集群亚组的乳腺癌的百分比。

图7提供了根据本发明的各种实施方案基于分类为分子亚组来治疗乳腺癌的方法的流程图。

图8提供了在现有技术中生成并用作参考的METABRIC队列临床特征和包含分析的流程图。

图9提供了在现有技术中生成并用作参考的外部验证元队列临床特征和包含分析的流程图。

图10和11提供了在现有技术中生成并用作参考的描绘ER+和ER-患者的累积死亡发生率的数据图。

图12提供了在现有技术中生成并用作参考的详细说明ER+和ER-患者中乳腺癌发病的平均年龄的数据图表。

图13提供了在现有技术中生成并用作参考的乳腺癌进展的多状态马尔可夫模型的图形表示。

图14提供了在现有技术中生成并用作参考的描述在不同疾病状态下临床协变量的预后值的数据图表。

图15提供了在现有技术中生成并用作参考的描述使用引导程序对所有转换上的模型的全局预测的内部验证的数据图表。

图16提供了在现有技术中生成并用作参考的由两个计算模型基于十年的ER状态计算的疾病特异性死亡风险预测的散点图,展示了简单模型的强一致性。

图17提供了在现有技术中产生并用作参考的预测远处复发(dr)、疾病特异性死亡(ds)、死亡(os)和复发(r)的风险的一致性c-指数。

图18和19提供了在现有技术中生成并用作参考的描绘各种亚组随时间复发的概率的数据图表。

图20提供了在现有技术中生成并用作参考的描述在10年局部复发后远处复发的概率与几个临床病理学和分子特征之间的关联的数据图表。

图21至26提供了在现有技术中生成并用作参考的描绘各种亚组中手术后随时间的复发或癌症相关死亡的平均概率的数据图表。

图27提供了在现有技术中生成并用作参考的描述标准临床模型相对于并入了整合集群亚型的模型的预测效用的评估的数据图。

图28提供了在现有技术中生成并用作参考的描述在诊断后5年无复发的ER+/Her2-患者中远处复发或乳腺癌死亡概率的数据图。

图29提供了在现有技术中生成并用作参考的描述相对于诊断后五年无复发的患者的IntClust3,四个晚期复发亚组中个体平均ER+/HER2-患者的远处复发或乳腺特异性死亡的概率的数据图。

图30提供了根据本发明的各种实施方案使用的利用全基因组拷贝数数据的各种计算模型的接受者操作特征和精确度调用(recall)曲线。

图31A和31B各自提供了利用根据本发明的各种实施方案使用的各种测序组对乳腺癌风险进行分层的结果。

图32A提供了用于使用根据本发明的各种实施方案生成的Foundation Medicine靶向测序基因小组来预测高风险IntClust亚组的分类器的敏感性和特异性结果。

图32B提供了用于使用根据本发明的各种实施方案生成的MSK-IMPACT靶向测序基因组来预测高风险IntClust亚组的分类器的敏感性和特异性结果。

图32C提供了使用根据本发明的各种实施方案生成的MSK-IMPACT靶向测序基因组预测的IntClust亚组的分布。

图33提供了根据本发明的各种实施方案使用的在预测乳腺癌复发时各种诊断测试的C-指数评分。

图34至37各自提供根据本发明的各种实施方案使用的预测乳腺癌复发的各种诊断测试的风险比评分。

图38提供了通过根据本发明的各种实施方式使用的各种诊断测试对乳腺癌复发风险进行分层的结果。

图39至43各自提供了根据本发明的各种实施方案使用的利用IntClust分类系统结合各种诊断测试对乳腺癌复发风险进行分层的结果。

图44至51各自提供根据本发明的各种实施方案使用的各种形式的治疗(包括化学疗法、靶向(分子)疗法或内分泌疗法)中的各种高风险致癌分子亚组的无进展生存概率。

图52A和52B提供了根据本发明的各种实施方案生成的来源于患者19006的患者来源的类器官的活力曲线。

图53A和53B提供了根据本发明的各种实施方案生成的来源于患者19004的患者来源的类器官的活力曲线。

详述

现在转向附图和数据,提供了基于癌症的分子病理学确定乳腺癌侵袭性和复发可能性以及治疗乳腺癌的系统、试剂盒和方法。许多实施方案涉及利用诊断测定确定乳腺癌的侵袭性和复发可能性。许多实施方案涉及利用诊断测定确定乳腺癌的分子病理学。在许多实施方案中,然后使用确定乳腺癌的侵袭性和复发可能性和/或分子病理学来确定治疗选择,并相应地治疗该肿瘤。在各种实施方案中,体细胞拷贝数或转录物表达数据提供了乳腺癌分子亚型的指示并因此提供了确定适当治疗的方法。在一些实施方案中,癌症进展的分子驱动因子的基因拷贝数变化或异常表达被确定为癌症病理学的基础。根据多个实施方案,表现出表明高侵袭性和高复发可能性的特定分子病理学的乳腺癌用适当的疗法(例如辅助化学疗法、靶向疗法和/或延长激素/内分泌疗法)积极治疗。此外,在几个实施方案中,在手术和/或化学疗法治疗(包括将癌症降低到不可检测水平的治疗)之后,对具有高复发可能性的癌症个体进行长时间的密切和重复监测。在各种实施方案中,具有特定分子病理学的癌症用针对基因的疗法治疗,所述疗法通过靶向基因、基因产物和/或涉及基因的分子途径对分子病理学进行分类。根据许多实施方案,表现出指示低侵袭性和复发性的分子病理学的乳腺癌被适当地治疗,这可以仅是内分泌疗法或侵袭性较低的化学疗法。

许多实施方案涉及确定个体的分子病理学。在许多实施方案中,拷贝数异常(CNA)是从个体的DNA和/或RNA评估的,其可用于对个体的癌症进行分类。CNA应理解为癌症基因组内一组基因组基因座的扩增(例如,复制)和/或减少(例如,缺失)。在一些实施方案中,癌症通过拷贝数异常分类,所述拷贝数异常包括一组一个或多个分子驱动因子(即,分类为在肿瘤发生中至少部分致病的基因)。各种实施方案利用整合集群(IntClust)分类来确定一组描述乳腺癌发病机制的分子驱动因子。有关IntClust分类系统的更多信息,请参见C.Curtis等人,Nature 486,346–52(2012)和H.R.Ali等人,Genome Biol.15,431(2014),其公开内容各自通过引用并入本文。在许多实施方案中,复发风险由风险分类器确定。

基于最近的发现,分子病理学和癌症进展(包括复发的可能性)之间的联系现在得到了认可,这表明了治疗和监测的过程。因此,各种实施方案涉及将乳腺癌分类为IntClust亚组和/或风险亚组以确定针对特定乳腺癌量身定制的治疗方案。此外,还描述了许多工具和试剂盒以将乳腺癌分类为IntClust和/或风险亚组。

目前有几种诊断测试可用于就监测和治疗乳腺癌患者的方法指导临床医生(图1A至1F)。大多数这些测试利用分子和基因组技术来深入了解肿瘤内的遗传异常和潜在的相关风险,例如复发。此外,这些测试可以为个性化治疗方案提供信息,例如,决定使用化疗(包括新辅助或辅助化疗)、化疗的强度、剂量和持续时间,决定使用内分泌治疗,以及决定使用其他治疗方案(例如,靶向治疗、免疫治疗)。有关可用于乳腺癌的各种诊断测试的详细讨论,请参见O.M Fayanju,K.U.Park,and A.Lucci Ann.Surg.Oncol.25,512-19(2018),其公开内容通过引用并入本文。

诊断测试包括Oncotype Dx(Genomic Health,Redwood City,CA)、Prosigna(NanoString Technologies,Seattle WA)、MammaPrint(Agendia,Irvine,CA)、EndoPredict(Myriad Genetics,Salt Lake City,UT)和乳腺癌指数(BCI)(Biotheranostics,Inc.,San Diego,CA)(参见图1A至1F)。

Oncotype Dx是在美国用于乳腺癌的最常用的诊断测试。该测试检查了21个基因的表达,用于确定是否需要化疗,特别是在患有早期ER+、HER2-、淋巴结阴性(LN-)乳腺癌的个体中。Oncotype Dx定量了10年内远处复发的可能性,提供指示复发可能性高(≥31)、中等(18-30)或低(0-17)的评分。值得注意的是,指示中等复发评分的结果为临床医生提出了关于执行哪种治疗的指示的临床难题。

基于PAM50分类器的Prosigna是确定50个基因表达的诊断测试。Prosigna测试产生复发风险评分(ROR)并将肿瘤分配为四种内在亚型之一:Luminal A、Luminal B、HER2+和Basal样。基于ROR评分和其他临床因素(包括淋巴结状态),确定风险状态。

MammaPrint是一种在微阵列上分析的70个基因表达测定,用于预测ER+/HER2-患者5年内的远处转移。MammaPrint可用于阳性或阴性淋巴结状态的患者。基于表达谱结果,确定低风险或高风险的分子预后谱。

EndoPredict是一种12基因测试,用于预测具有阴性淋巴结状态或阳性淋巴结(1-3)状态的ER+/HER2-患者诊断后10年远处复发的风险。基于表达谱结果,确定低风险或高风险的分子预后谱。

乳腺癌指数(BCI)结合增殖和雌激素信号传导基因表达特征来预测具有阴性淋巴结状态或阳性淋巴结(1-3)状态的ER+患者诊断后5至10年的远处复发。BCI旨在用于确定患者是否能够从延长(>5年)辅助内分泌治疗中受益。

一些个体患有侵袭性癌症,其还可能包括长达二十年或超过二十年的复发和乳腺癌死亡的持续风险。通常,从当前可用的诊断测试中,很难辨别谁有复发风险,尤其是晚期复发(例如,>5年)。例如,一部分患有早期ER+乳腺癌的个体在诊断后20年内具有持续的复发和死亡风险,但目前的诊断方法很难鉴定这一子集。事实上,大多数当前的诊断分析无法可靠地预测超过五年,并且随着时间的推移,临床协变量继续失去预测能力。因此,迫切需要确定比目前可用的测试和标准临床协变量(淋巴结状态、肿瘤大小和分级)更能预测侵袭性和复发风险的肿瘤特征,以确定具有高风险和低风险癌症(包括复发风险)的患者的子集。更好地了解风险和复发可能性有助于确定哪些个体将从各种疗法(例如延长内分泌疗法或更高剂量的化学疗法或分子靶向疗法)中受益。

在此,几个实施方案基于将乳腺癌分类为复发风险亚组(例如,高、中、低)和/或整合集群(IntClust)的分子测试(参见C.Curtis等人,(2012),引用同上)。可以通过多种统计技术进行风险亚组的分类,包括(但不限于)多状态半马尔可夫模型、Cox比例风险模型、基于收缩的方法、基于树的方法、贝叶斯方法、基于核的方法和神经网络。

为了聚类成IntClust亚组,目前描述了总共11个IntClust亚组,这些亚组是利用研究中每个乳腺癌所具有的基因表达和拷贝数谱的无监督联合潜在变量聚类来开发的。总共使用了约1000个早期乳腺癌来开发集群,这些集群在另外约1000个早期乳腺癌中得到验证,结果显示在图2A和2B中。CNA扩增用红色表示,而CNA损失用蓝色表示。注意,描述了10个IntClust亚组,每个亚组由计算建模确定,但是,IntClust4可以进一步分为ER+和ER-以产生11个IntClust亚组。

IntClust亚组各自的特征在于拷贝数异常(CNA)和癌症中包含的并且可能与癌症进展有关的相对基因表达水平(即,乳腺癌的分子驱动因子)。例如,发现IntClust亚组1、2、6和9约占所有ER+肿瘤的25%,并且每个亚组都富含基因组各个区域的特征拷贝数扩增事件(见图2A和2B)。关于IntClust1,现在知道17q23附近的基因(例如,RPS6KB1)被扩增和过表达。同样,IntClust2具有基因CCND1、FGF3(11q13.3)和11q13.2扩增子基因(例如,EMSY、RSF1、PAK1)的扩增,并且基因组的这些区域经常与伴随的基因表达上调共同扩增,表明这些基因座之间的致癌合作。值得注意的是,染色体8p12和11q13的反复扩增表明这些基因座可能协同促进肿瘤的发展和进展。因此,它们可能需要在某些患者中共同靶向。IntClust6表现出8p12附近基因(例如,FGFR1、ZNF703、EIF4EBP1)的扩增。此外,IntClust9具有在8q24(例如,MYC)和20q13(例如,SRC3、NCOA3)附近的基因的扩增和过表达。在类似的分析中,Intclust5的特征在于HER2/ERBB2中的扩增和过度表达,这是一种众所周知的致癌基因,是乳腺癌的分子驱动因子。如图3A和3B所示的是队列中具有定义了已分配的IntClust亚组的基因的CNA增益或扩增的肿瘤的百分比(注:图3A和3B包括根据临床前数据的每个整合集群的致癌驱动因子,其标有星号)。

现在已知特定的IntClust亚组赋予侵袭性和复发的可能性(图4)。换言之,当乳腺癌被分类到特定的IntClust亚组时,可以确定癌症具有侵袭性和复发的可能性。该知识还能够用于确定治疗过程和/或继续监测的必要性。例如,对IntClust亚组进行亚型分型能够告知是否在高危人群中延长内分泌治疗,避免对内在内分泌耐药的患者进行内分泌治疗,应用基于IntClust亚组的分子驱动因子的靶向治疗,以及化疗药物的适当的选择和治疗方案。

与标准临床协变量和当前诊断方法相比,发现使用这些整合集群可以更好地改善对晚期远处复发(尤其是5年后复发)的预测,这在外部验证队列中得到证实。还发现一组三阴性乳腺癌患者在5年后很少复发,而其他人仍处于风险之中。远处复发后,肿瘤亚型继续决定随后的转移率,强调了对肿瘤进行相应分类的重要性。基于这些发现,几个实施方案涉及鉴定具有侵袭性癌症和复发的特定风险的个体,如通过诊断方法确定的。各种实施方案基于个体癌症的侵袭性和复发风险来治疗和/或监测个体。

图4显示了研究每个分类内乳腺癌的侵袭性和复发的研究结果。这里使用非同质(半)马尔可夫链模型来描绘跨IntClust亚组的乳腺癌复发的时空动力学(参见示例性实施方案)。该模型的结果表明,各种亚组复发的可能性要高得多,尤其是在5年甚至10年或15年之后。

图4中显示了11个IntClust亚组中的每一个以及从三个时间点复发的概率:手术、手术后5年且无病,以及手术后10年且无病。结果按复发风险排序,复发风险最低的亚组在左侧和复发风险最高的在右侧。根据这些结果,可以将组划分为高风险组和低风险组。较低风险组包括IntClust3、IntClust7、IntClust8、IntClust4ER+和IntClust10。高风险组包括IntClust4ER-、IntClust1、IntClust6、IntClust9、IntClust2和IntClust5。

在图5中提供的是累积发病率图(即,1-Kaplan Meier估计),显示了基于临床结果数据的ER+/HER2-乳腺癌患者随时间的远处复发风险。从图5的上图中可以看出,IntClust亚组2、9、6和1的远处复发概率增加。图5的下图比较了高风险亚组(IntClust亚组1、2、6和9)与低风险亚组(IntClust亚组3、4ER+、7和8)的比较。结果显示两个亚组之间的风险有明显区别。

IntClust10和IntClust4ER-具有三阴性乳腺癌(TNBC)的临床分类,这意味着它们是ER-、HER2-和PR-。TNBC发生在10%到20%的乳腺癌中,并且更有可能影响年轻人。由于其侵袭性和复发的可能性,TNBC可能难以治疗。然而,IntClust研究的结果表明,IntClust10中的患者在无病5年后复发的可能性非常低。相反,IntClust4ER-复发的可能性相对较高,即使在5年或甚至10年后无病。因此,在许多实施方案中,评估患有TNBC的个体以确定癌症被分类到哪个IntClust亚组,并因此基于结果进行治疗。

IntClust3、IntClust7、IntClust8和IntClust4ER+都是ER+/HER2-并且具有适度的复发风险。另一方面,IntClust1、IntClust6、IntClust9和IntClust2是ER+/HER2-,具有高且持续的复发风险。因此,在各种实施方案中,当癌症被分类为高风险ER+/HER2-时,更积极的治疗方案可能是有益的(例如,除了内分泌治疗之外的辅助化疗)。此外,高风险复发组的致癌基因组驱动因子可以通过特定的靶向治疗直接靶向。例如,在一些实施方案中,IntClust1癌症用mTOR途径拮抗剂(例如,依维莫司、西罗莫司、西罗莫司、雷帕霉素)、AKT1拮抗剂(例如,ipatasertib、capivasertib(AZD5363))、AKT1/RPS6KB1拮抗剂(例如,M2698)、RPS6KB1拮抗剂(例如,LY2584702)、PI3K拮抗剂(例如,阿培利司、buparlisib(BKM120)、pictilisib(GDC-0941))、eIF4A拮抗剂(例如佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或它们的组合治疗。在多个实施方案中,IntClust2癌症用表观遗传学靶向疗法、CDK4/6拮抗剂(例如,帕博西尼、瑞博西尼、阿贝西利)、FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、PARP拮抗剂(例如,尼拉帕尼、奥拉帕尼)、同源重组缺陷(HRD)靶向治疗、PAK1拮抗剂(例如IPA3)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或它们的组合治疗。在一些实施方案中,IntClust6癌症用FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗。并且在各种实施方案中,IntClust9癌症用选择性雌激素受体降解剂(SERD)(例如氟维司群、GDC-9545、SAR439859(SERD'859)、RG6171、AZD9833)、蛋白水解靶向嵌合体(PROTAC)ARV-471、SRC3拮抗剂(例如,SI-2)、MYC拮抗剂(例如,omomyc)、BET溴结构域拮抗剂(例如,JQ1、PROTAC ARV-771)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或它们的组合治疗。

分类和分层乳腺癌的方法

几个实施方案涉及为诊断目的对乳腺癌风险进行分类和/或分层。在一些实施方案中,将乳腺癌分类为特定的IntClust亚组。在一些实施方案中,乳腺癌按潜在风险(例如,低、中或高风险)分层。

在许多实施方案中,乳腺癌被分类为整合集群(IntClust),如在上文引用的C.Curtis等人(2012)中描述的。十一个IntClust亚组中的每一个都具有相对定义的一组CNA,如由聚类分析确定的(图2)。值得注意的是,IntClust4可以进一步分为ER+和ER-以完善11个亚组。通过使用IntClust分类,在各种在实施方案中,乳腺癌被分类为十一个亚组之一。尽管描述了IntClust分类,但根据一些实施方案,可以使用乳腺癌的其他基因组驱动分类方法。

现在可以理解,属于各种IntClust亚组的ER+/HER2-乳腺癌具有高侵袭性,具有高复发风险,包括亚组1、2、6和9。类似地,属于IntClust亚组3、7、8和4ER+的癌症的侵袭性较小,并且复发风险较低。因此,各种实施方案将乳腺癌分类为IntClust亚组以确定癌症的侵袭性和复发风险。以类似的方式,TNBC可分为高风险亚组IntClust4ER-或低风险亚组IntClust10。

为了将个体分类为IntClust,从乳腺癌获得基因表达和/或CNA数据。CNA可以通过多种方法检测。在一些实施方案中,从个体中提取癌症的DNA并对其进行处理以检测CNA水平。在各种实施方案中,提取并处理癌症的RNA以检测许多基因的表达水平,这可用于确定拷贝数的异常。应当进一步理解,各种实施方案可以利用DNA和RNA提取物来确定分子亚型。此外,由于DNA甲基化与染色质可及性(或状态)一样与基因表达高度相关,因此在许多实施方案中使用DNA甲基化或染色质可及性分析(ATAC-seq)来确定整合集群成员资格或整合亚型。

在许多实施方案中,用于确定乳腺癌的整合亚型的特征包括CNA和/或表达数据。因此,计算分类器可以利用拷贝数特征和/或基因表达特征,但也可以使用DNA(基因/CpG)甲基化特征和/或来源于DNA甲基化或染色质(DNA)可及性分析的乳腺癌的可接近DNA峰。在一些实施方案中,拷贝数特征通过基因组位置或基因名称匹配。在各种实施方案中,表达特征或匹配于检测表达的探针。在特征匹配之后,各种实施方案将每个特征缩放至z评分并且可以包括其他归一化方法。在许多实施方案中,匹配的特征被输入到计算分类器中,使得分类器确定乳腺癌属于哪个亚组。在一些实施方案中,使用先前描述的无监督联合潜在变量聚类方法(在C.Curtis等人(2012)的出版物中描述或在H.R.Ali等人(2014)的出版物中描述的整合亚型(iC10)分类器,其可以被发现为CRAN R软件包标记的iC10(https://cran.r-project.org/web/packages/iC10/index.html),引用同上。

在各种实施方案中,分子类别预测模型包括(但不限于)基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机和神经网络,其中的每一个都可以独立用于将乳腺癌分为11个整合亚型。类别预测模型可以基于各种分子特征,包括拷贝数特征和/或基因表达特征、DNA(基因/CpG)甲基化特征和/或来源于乳腺癌染色质可及性分析的可及DNA峰。在一些实施方案中,使用最高得分对(TSP)分类方法(或其变体),其中可以使用其相对排序的变量对来准确地预测样品的类别标签。该方法的一个示例在Rgtsp包中实现(V.Popovici,E.Budinska,and M.Delorenzi,Bioinformatics 27,1729–30(2011),其公开内容通过引用并入本文)。此外,在一些实施方案中,分子类别预测被扩展以执行绝对亚型分配,例如利用Paquet等人描述的AIMS算法。(E.R.Paquet and M.T.Hallet,J.Natl.Cancer Inst.107,357(2014),其公开内容通过引用并入本文)。

如本领域从业人员所理解的,可以通过多种方法在肿瘤的组织活检中和/或从个体的体液(例如,血液、血浆、尿液)中提取或检查核酸或蛋白质。一旦提取,核酸可以被处理并准备用于检测。检测方法包括(但不限于)杂交技术(例如,原位杂交(ISH)、核酸扩增技术和测序。可以使用各种分子技术,包括(但不限于)基于微阵列的基因表达,基于微阵列/SNP阵列的拷贝数推断、RNA测序、靶向(捕获)RNA测序、外显子组测序、全基因组测序(WES/WGS)、靶向(小组)测序、用于基因表达的Nanostring nCounter、用于拷贝数的NanostringnCounter推理、Nanostring数字空间分析(用于原位蛋白质表达/RNA表达)、DNA-ISH、RNA-ISH、RNAScope、DNA甲基化测定和ATAC-seq以及免疫组织化学(IHC)。

在几个实施方案中,CNA和/或表达水平是相对于已知结果定义的。在一些情况下,测试样品的CNA和/或表达水平是相对于对照样品或分子特征(即,具有已知分类的样品/特征)确定的。对照样品/特征可以是健康组织(即空对照)、已知的阳性对照或任何其他所需的对照。因此,当将测试样品的CNA和/或表达水平与一种或多种对照进行比较时,相对CNA和/或表达水平可以确定测试样品属于哪个基因组驱动因子亚组。在一些情况下,基因表达水平是相对于稳定表达的生物标志物(即内源对照)确定的。在一些情况下,当基因表达水平相对于稳定表达的生物标志物超过某个阈值时,表达水平指示特定基因组驱动因子亚组。在一些情况下,CNA和/或表达水平是绝对确定的。在一些情况下,可以设置各种CNA和/或表达水平阈值和范围以对基因组驱动因子亚组进行分类,从而用于指示测试样品属于哪个亚组。应该理解,定义CNA和/或表达水平的方法可以组合,如适用评估所必需的。利用转录物表达水平、CNA水平、DNA甲基化水平、染色质(DNA)可及性峰或其任何组合,可以对乳腺癌进行分类。

根据各种实施方案检测基因组基因座和/或基因。在一些实施方案中,特定组的基因组CNA和/或转录物表达的检测将乳腺癌分类为特定的IntClust亚组。参考图3A和3B,不同基因座中的CNA表明了许多IntClust亚组。例如,发现IntClust亚组1、2、6和9约占所有ER+肿瘤的25%,并且每个亚组都富含基因组各个部分的特征性拷贝数扩增事件。关于IntClust1,现在已知17q23附近的基因(包括(但不限于)RPS6KB1、HASF5、PPM1E、PRR11、DHX40、TUBD1、CA4、C17orf64、BCAS3、TBX2、BRIP1和TBC1D3P2)被扩增。类似地,IntClust2具有CCND1、FGF3(在11q13.3)和11q13.2扩增子基因的扩增,包括(但不限于)EMSY、RSF1、PAK1、CTTN、CLPB、P2RY2、UCP2、CHRDL2、MAP6、OMP和ARS2。IntClust6表现出8p12附近基因的扩增,包括(但不限于)FGFR1、ZNF703、EIF4EBP1、LETM2和STAR。此外,IntClust9具有在8q24附近(包括但不限于MYC、FBXO32、LINC00861、PCAT1、LINC00977、MIR5192和ADCY8)以及在20q13附近(包括(但不限于)SRC3、NCOA3)的基因的扩增。因此,检测基因座或基因或基因座和/或基因的组合的扩增(CNA或表达)可用于指示特定的IntClust分类。

在许多实施方案中,使用基于多个基因组拷贝数异常、多个基因表达谱、DNA甲基化水平、染色质(DNA)可及性峰或其任何组合的计算模型进行乳腺癌分类,这可以提供比单个染色体基因座的拷贝数状态/基因表达更准确的分类。例如,基因RPS6KB1、FGFR1和FGF3的扩增发生在各种乳腺癌IntClust亚组中,包括那些具有低侵袭性和复发风险的亚组。如图6所示,大约50%的具有RPS6KB1增益或扩增的乳腺癌被分类为IntClust1,但是在更多的IntClust亚组中也检测到RPS6KB1拷贝数改变。类似地,大约50%的具有FGFR1扩增的乳腺癌被分类为IntClust6,并且可以在所有其他亚组中检测到扩增。FGF3扩增相当均匀地分布在IntClust亚组之间。因此,使用经过训练的计算模型可能是有益的,这样可以更准确地将乳腺癌分类为适当的亚型(例如,IntClust分类器)。

许多实施方案利用统计计算对乳腺癌复发风险(例如,高、中、低)进行分层。在各种实施方案中,统计计算模型包括(但不限于)多状态半马尔可夫模型、Cox比例风险模型、基于收缩的方法、基于树的方法、贝叶斯方法、基于核的方法和神经网络。在一些实施方案中,阈值用于将较高风险评分与较低风险评分分开。在几个实施方案中,用于训练统计模型和/或预测乳腺癌复发风险的特征包括(但不限于)临床数据、年龄、癌症分期、肿瘤阳性淋巴结的数量、肿瘤大小、肿瘤分级、进行的手术、进行的治疗、基本分子身份和整合亚型分类/成员资格。患者的年龄可以编码为连续值(并可能进行修剪以避免过高的值(例如,年龄>80)。临床阶段(值范围为1-4)可以作为连续值或作为因素包括在内或可以分为高(3-4)与低(1-2)阶段。阳性淋巴结可以作为连续值包括在内(可能会修剪以避免过高的值)。阳性淋巴结的数量也可以是分类为淋巴结阴性相对阳性或在阳性之中分为低(1个阳性淋巴结)、中等(2-3个阳性淋巴结)、高(4-9个阳性淋巴结)、非常高(>=10个阳性淋巴结)或其变化。肿瘤的大小可以作为一个连续值,其可以被修剪以避免过高的值)。也可以对肿瘤的大小进行分类(例如,分期系统:T1<20mm、T2(20-50)、T3(>50))。肿瘤分级可用作连续值或类别(1-3)或高(3)相对低(1,2)。在一些实施方案中,分类器包括CTS5算法,其基于对淋巴结、大小、分级的编码可以如下并入:

0.438x淋巴结+0.988x(0.093x大小-0.001x大小2+0.375x分级+0.017x年龄)

(有关CTS5算法的更多信息,请参见M.Dowsett等人,J.Clin.Oncol.36,1941-48(2018),其公开内容通过引用并入本文)。基本分子身份包括基于临床病理学报告和/或从基因表达数据推断的雌激素受体(ESR1)、孕酮受体(PGR)、人表皮生长因子受体2(HER2/ERBB2)和MKI67的状态。手术类型可以包括保乳或乳房切除术。治疗类型可以包括激素、化学疗法、靶向治疗,其中可以更广泛地指定或分组药剂并且包括治疗持续时间。各种实施方案还利用种系遗传变体、种族、一般健康数据和/或治疗方案。在一些实施方案中,可以在模型中使用预测工具(https://breast.predict.nhs.uk)或其组件。

在一些实施方案中,特征可以从整合的亚型集群(例如,IntClust分类)中衍生并且包括在模型中。这些特征可以是整合亚型成员资格或给定集群成员资格的后验概率。整合亚型被单独编码为逻辑特征。可以利用到每个亚组的质心的距离。也可以使用从IC分类器得出的任何评分。在一些实施方案中,利用对特定亚组的复发风险预测,例如ER+/HER2-患者或三阴性乳腺癌患者。在ER+/HER2-患者中,可以考虑高风险(IntClust1、IntClust2、Intclust6或IntClust10)相对低风险(IntClust3、IntClust4、Intclust7或IntClust8)类别。类似地,分类为IntClust4ER-的TNBC被确定为具有侵袭性并具有高风险,而分类为IntClust10的TNBC被确定为具有较低风险。

在许多实施方案中,使用多状态Cox重置模型,该模型是一种统计模型,它考虑了不同的疾病状态(局部复发和远端复发)、不同的时间尺度(从诊断开始的时间和从复发开始的时间))、相互竞争的死亡原因(癌症死亡或其他原因)、临床协变量或年龄效应,以及不同分子亚组的不同基线危害(参见H.Putter,M.Fiocco,&R.B.Geskus,Stat.Med.26,2389–430(2007);O.Aalen,O.Borgan,&H.Gjessing,Survival and Event History Analysis–AProcess Point of View.(Springer-Verlag New York,2008);和T.M.Therneau&P.M.Grambsh,Modeling Survival Data:Extending the Cox Model.(Springer-VerlagNew York,2000);其公开内容各自通过引用并入本文)。在许多实施方案中,多状态统计模型适合数据集,使得乳腺癌的年表,从原发性肿瘤的手术切除开始,然后是局部区域和/或远处复发的发展,并通过竞争风险进行核算因癌症或其他原因导致的死亡被计算在内。在一些实施方案中,这些状态中的每一个发生的风险用具有两种吸收状态(死亡/癌症和死亡/其他)的非同质半马尔可夫链建模。有关多状态Cox模型的更多信息,请参见示例性实施方案中的描述。

Cox比例风险模型是统计生存模型,其将传递至事件的时间和与该时间量相关联的协变量相关联(参见D.R.Cox,J.R.Stat.Soc.B 34,187-220(1972),其公开内容通过引用并入本文)。为了利用Cox比例风险模型,在一些实施方案中,包括临床、分子和整合亚型特征。在一些实施方案中,特征可以是线性和/或多项式变换的,并且交互可以包括变量选择。在一些实施方案中,为了进一步简化模型,可以将逐步变量选择并入交叉验证方案中。可以使用和/或调整任何适当的计算包,例如(诸如)RMS软件包(https://www.rdocumentation.org/packages/rms)。

基于收缩的方法包括(但不限于)正则化套索(R.Tibshirani Stat.Med.16,385-95(1997),其公开内容以引用方式并入本文)、套索主成分(D.M.Witten and R.TibshiraniAnn.Appl.Stat.2,986-1012(2008),其公开内容通过引用并入本文)和收缩的质心(R.Tibshirani等人,Proc.Natl.Acad.Sci.U S A 99,6567-72(2002),其公开内容通过引用并入本文)。可以使用和/或调整任何适当的计算包,例如(例如)用于收缩质心的PAMR软件包(https://www.rdocumentation.org/packages/pamr/versions/1.56.1)。

基于树的模型包括(但不限于)生存随机森林(H.Ishwaran等人,Ann.Appl.Stat.2,841-60(2008),其公开内容通过引用并入本文)和随机旋转生存森林(L.Zhou,H.Wang,and Q.Xu,Springerplus 5,1425(2016),其公开内容以引用方式并入本文)。在一些实施方案中,超参数对应于为每个树选择的特征的数量。可以使用任何适当的树数设置,例如(诸如)1000个树。可以使用和/或调整任何适当的计算包,例如(例如)用于随机旋转生存森林的RRotSF软件包(https://github.com/whcsu/RRotSF)。

贝叶斯方法包括(但不限于)贝叶斯生存回归(J.G.Ibrahim,M.H.Chen,andD.Sinha,Bayesian Survival Analysis,Springer(2001),其公开内容通过引用并入本文)和贝叶斯混合生存模型(A.Kottas J.Stat.Pan.Inference 3,578-96(2006),其公开内容通过引用并入本文)。在一些实施方案中,使用多元正态分布或单调样条的线性组合执行采样(参见B.Cai,X.Lin,and L.Wang,Comput.Stat.Data Anal.55,2644-51(2011),其公开内容通过引用并入本文)。可以使用和/或调整任何适当的计算包,例如(诸如)ICBayes软件包(https://www.rdocumentation.org/packages/ICBayes/versions/1.0/topics/ICBayes)。

基于核的方法包括(但不限于)生存支持向量机(L.Evers and C.M.Messow,Bioinformatics 24,1632-38(2008),其公开内容通过引用并入本文)、内核Cox回归(H.Liand Y.Luan,Pac.Symp.Biuocomp.65-76(2003),其公开内容通过引用并入本文)以及多核学习(O.Dereli,C.Oguz,and M.Gonen Bioinformatics(2019),其公开内容通过引用并入本文)。应当理解,基于核的方法可以包括支持向量机(SVM)和具有多项式和高斯核的生存支持向量机,其中超参数C指定正则化(参见L.Evers and C.M.Messow,引用同上)。在一些实施方案中,多核学习(MKL)方法结合了核中的特征,包括嵌入临床信息、分子信息和整合亚型的核。可以使用和/或调整任何适当的计算包,例如(诸如)path2surv软件包(https://github.com/mehmetgonen/path2surv)。

神经网络方法包括(但不限于)DeepSurv(J.L.Katzman等人,BMCMed.Res.Methodol.18,24(2018),其公开内容通过引用并入本文)和SuvivalNet(S.Yousefi等人,Sci.Rep.7,11707(2017),其公开内容通过引用并入本文)。可以使用和/或调整任何适当的计算包,例如(诸如)Optunity软件包(pypi.org/project/Optunity/)。

在几个实施方案中,为了确保模型不会过拟合,使用X次和交叉验证的X倍方案(例如,10倍训练、10倍交叉验证)训练模型。样品数据可以拆分为子集,一些数据用于训练模型,一些数据用于评估模型。通过使用这种方法,可以确保所有数据至少验证一次,并且没有样品同时用于训练和验证,同时X倍交叉验证最大限度地减少了抽样偏差。训练/交叉验证方法还使得能够评估通过计算置信区间来确定预测的稳定性,这有助于模型比较。此外,内部交叉验证方案可以用于超参数规范。

虽然上文描述了用于对乳腺癌的风险进行分子分类和分层的过程的具体示例,但是本领域普通技术人员可以理解,该过程的各个步骤可以以不同的顺序进行并且根据一些实施方案某些步骤可以是可选的。因此,应该清楚的是,可以根据具体应用的要求适当地使用该过程的各个步骤。此外,根据各种实施方案,可以使用适合于给定应用的要求的用于分子分类和风险分层的各种过程中的任一种。

许多实施方案涉及将整合亚型信息与其他多基因特征的风险预测模型组合,包括(但不限于)Oncotype Dx(Genomic Health,Redwood City,CA),Prosigna(NanoStringTechnologies,Seattle WA),MammaPrint(Agendia,Irvine,CA),EndoPredict(MyriadGenetics,Salt Lake City,UT),乳腺癌指数(BCI)(Biotheranostics,Inc.,San Diego,CA)。特别感兴趣的是Oncotype Dx与整合亚型(IntClust)的组合。如前所述,Oncotype Dx产生的结果表明以下之一:高、中或低复发可能性,而对于中等可能性的治疗选择对于临床医生来说可能是一个难题。然而,当Oncotype Dx与整合聚类技术相结合时,通常属于中等风险组的乳腺癌可以更好地分层,从而产生高风险和低风险的明确结果。在示例性实施方案部分中描述了将Oncotype Dx与整合聚类技术相结合的细节。如示例性实施方案中详述的,与Prosigna、MammaPrint、BCI和EndoPredict的组合也显示了诊断分层的改进。

检测拷贝数异常和基因表达的方法

如本领域技术人员将理解的,可以通过根据各种实施方案的多种方法检测拷贝数的异常。在几个实施方案中,CNA直接从基因组DNA检测和/或从RNA转录物表达推断。因此,在一些实施方案中,CNA分析用于分类乳腺癌。在一些实施方案中,RNA表达分析用于分类乳腺癌。并且在一些实施方案中,CNA和RNA表达的分析用于分类乳腺癌。

用于确定表达的核酸(例如,DNA和RNA)来源可以从头衍生(即,来自生物来源)。从生物来源中提取核酸的几种方法是众所周知的。通常,从细胞或组织中提取核酸,然后制备用于进一步分析。或者,可以在细胞内观察DNA和/或RNA,这些细胞通常被固定并制备用于进一步分析。如本领域技术人员将理解的,提取核酸或固定组织(通过福尔马林固定和石蜡包埋(FFPE))用于直接检查的决定取决于要进行的测定。在一些实施方案中,从固定的组织中提取DNA和/或RNA。

在几个实施方案中,在待处理的细胞和组织类型中提取和/或检查核酸。在许多情况下,待治疗的细胞是个体乳腺癌的肿瘤细胞,其可以在活检中提取。在一些实施方案中,从血液或血清中提取核酸(其可包括循环肿瘤DNA)用于分析。提取和/或检查核酸的精确来源可能取决于要进行的测定、活检的可用性和从业者的偏好。

已知许多测定来测量和定量基因组基因座拷贝数和转录物表达。CNA和RNA表达水平可以通过许多方法确定,包括(但不限于)杂交技术(例如,原位杂交(ISH)、核酸扩增(proliferation)技术和测序。可以使用各种分子技术,包括(但不限于)基于微阵列的基因表达、基于微阵列/SNP阵列的拷贝数推断、RNA测序、靶向(捕获)RNA测序、外显子组测序、全基因组测序(WES/WGS)、靶向(小组)DNA测序(包括Memorial Sloan Kettering CancerCenter Integrated Mutation Profiling of Actionable Cancer Targets(MSK-IMPACT)、Foundation Medicine CDx、Stanford Tumor Actionable Mutation Panel(STAMP)(参见moleculargenetics.stanford.edu/solid_tumors.htm)、用于基因表达的nanoString nCounter、用于拷贝数推断的Nanostring nCounter、包括蛋白质和RNA表达的nanoString Digital Spatial Profiler、DNA-ISH、RNA-ISH、RNAScope、DNA甲基化测定和ATAC-seq。

几个实施方案涉及从来源于基因小组的靶向测序数据(例如由学术中心(例如,UCSF500 Cancer Gene Panel(San Francisco,CA))或旨在用于其他用途的伴随诊断测定(例如Foundation One CDx(Foundation Medicine,Cambridge,MA)和MSK-IMPACT(Memorial Sloan Kettering Cancer Center,New York,NY)或Stanford TumorActionable Mutation Panel(STAMP)(Stanford,Stanford,CA))建立的那些)对整合亚型进行分类。只要小组内包括足够的基因覆盖率,则可以使用本文描述的算法的各种实施方案。在一些实施方案中,使用为乳腺癌评估设计的基因小组。在一些实施方案中,使用为染色质调节基因评估设计的基因小组。

几个实施方案涉及CNA或基因转录物的靶向检测。因此,在许多实施方案中,探针和/或引物用于直接或通过如本文所述的计算模型检测指示IntClust亚组的特定基因和/或基因组基因座。

如本领域所理解的,可能仅需要检测基因组基因座或基因的一部分以进行阳性检测。在一些情况下,可以通过鉴定少至十个核苷酸来检测基因。在许多杂交技术中,检测探针通常在十个到五十个碱基之间,然而,精确长度将取决于测定条件和测定开发者的偏好。在许多扩增技术中,扩增子通常在五十个到一千个碱基之间,这也取决于测定条件和测定开发者的偏好。在许多测序技术中,基因组基因座和转录物通过十个到数百个碱基之间的序列读数进行鉴定,这再次取决于测定条件和测定开发者的偏好。

应当理解,基因序列和/或测定工具(例如,杂交探针、扩增引物)中的微小变化可能存在,但预期在检测测定中提供相似的结果。这些微小变化将包括(但不限于)插入、缺失、单核苷酸多态性和其他因测定设计而产生的变化。在一些实施方案中,检测测定能够检测具有高度同源性但不是完全同源性(例如,70%、80%、90%或95%同源性)的基因组基因座和转录物。如本领域所理解的,用于杂交的核酸聚合物越长,发生杂交所需的同源性越低。

还应该理解,几个基因转录物具有许多被表达的同种型。如本领域所理解的,许多替代同种型将被理解为赋予分子分类的类似指示,并因此赋予癌症侵袭性和复发风险。因此,在一些实施方案中还涵盖了基因转录物的替代同种型。

在许多实施方案中,测定用于测量和定量CNA和转录物表达。测定结果可用于确定感兴趣的组织的相对CNA和转录物表达。例如,nanoString nCounter(它可以利用一组互补核酸和探针在一个微管中定量多达数百个核酸分子序列)可用于确定一组基因组基因座和/或基因转录物的CNA和转录物表达。得到的拷贝数和表达可用于直接或利用本文所述的计算模型对样品进行分类,从而确定癌症的侵袭性和复发风险。基于癌症的侵袭性和复发风险,可以对癌症进行相应的治疗。

检测拷贝数异常和基因表达的试剂盒

在几个实施方案中,试剂盒用于评估个体的乳腺癌风险,其中试剂盒可用于检测生物标志物的遗传异常和/或制备用于如本文所述的测序反应。例如,该试剂盒可用于检测本文所述的任何一种或多种基因生物标志物,其可用于确定侵袭性和转移潜能。该试剂盒可以包括一种或多种用于确定遗传异常和/或制备测序的试剂、用于容纳从受试者获得的生物样品(例如,肿瘤或液体活检)的容器;以及用于使试剂与生物样品反应以检测来源于样品的生物标志物基因内一种或多种遗传异常的存在或数量的印刷说明。试剂可以包装在分开的容器中。该试剂盒还可以包括用于进行生化测定、酶测定、免疫测定、杂交测定或测序测定的一种或多种对照参考样品和试剂。

试剂盒可以包括一个或多个用于包含在试剂盒中的组合物的容器。组合物可以是液体形式或可以是冻干的。用于组合物的合适容器包括例如瓶子、小瓶、注射器和试管。容器可以由各种材料制成,包括玻璃或塑料。试剂盒还可以包括包装插页,该插页包含检测来自肿瘤和/或液体活检的异常的方法的书面说明。

在几个实施方案中,试剂盒用于测量和定量CNA和转录物表达。根据各种实施方案,核酸检测试剂盒包括对一组基因组基因座和/或表达的转录物特异的一组能够杂交的互补序列和/或扩增引物。在一些情况下,试剂盒将包括足以促进一组基因组基因座和/或表达的转录物的检测和/或定量的其他试剂。在一些情况下,核酸检测试剂盒将能够检测和/或定量至少5、10、15、20、25、30、40或50个基因座和/或基因。在一些情况下,核酸检测试剂盒将包括用于检测和/或定量至少100、200、300、400、500或1000个基因座和/或基因的阵列。在一些情况下,试剂盒将能够通过阵列或测序技术检测和/或定量数千或更多个基因。

在许多实施方案中,一组能够杂交的互补序列被固定在阵列上,例如由Affymetrix或Illumina设计的那些。在许多实施方案中,一组能够杂交的互补序列与“条形码”连接以促进杂交的物质的检测,并且提供使得杂交可以在溶液中进行,例如由nanoString设计的那些。在几个实施方案中,提供了一组引物(在一些情况下是探针)以促进扩增和扩增的物质的检测,使得可以在溶液中进行PCR,例如由ThermoScientific的Applied Biosystems(Foster City,CA)设计的那些。

许多实施方案涉及用作伴随诊断的试剂盒。因此,在各种实施方案中,使用试剂盒对乳腺癌进行分类,然后将其用于确定特定治疗。例如,可以使用试剂盒来确定乳腺癌的侵袭性和复发风险,以确定适当的治疗方法。在一些实施方案中,试剂盒确定乳腺癌是高风险、中等风险还是低风险,然后分别推断出更积极或更不积极的治疗。在一些实施方案中,试剂盒确定乳腺癌的分子病理学,然后推断是否使用直接靶向一种或多种致癌驱动因子的治疗。

由分子表征确定的乳腺癌治疗

许多实施方案涉及分类和治疗乳腺癌。在几个实施方案中,基于其DNA和/或转录物表达对乳腺癌进行分子分类和/或风险分层。在一些实施方案中,使用统计模型基于风险对乳腺癌进行分层。根据一些实施方案,分子分类指示复发的侵袭性和风险。在一些实施方案中,整合集群(IntClust)亚型用于对乳腺癌进行分子分类。在各种实施方案中,一组一个或多个基因的拷贝数和/或转录物表达分析用于将乳腺癌分类为分子病理学亚组。基于分子病理学和/或风险分层,许多实施方案确定了乳腺癌的治疗过程,其可以包括减轻癌症复发和/或促进肿瘤缩小的措施。

图7中提供了对乳腺癌进行分子分类和/或风险分层的方法的实施方案。过程700开始于对来自乳腺癌的核酸进行(701)拷贝数异常(CNA)转录物表达和/或基因甲基化分析。在几个实施方案中,从患有乳腺癌的个体中提取DNA和/或RNA转录物并进行处理以供分析。DNA可用于在各种基因组基因座检测CNA和/或进行甲基化分析,而RNA可用于确定各种基因的表达水平。

CNA可通过本文所述的许多方法检测。在一些实施方案中,从个体中提取癌症的DNA并对其进行处理以检测CNA水平。在各种实施方案中,提取并处理癌症的RNA以检测许多基因的表达水平。在一些情况下,基因表达直接用于进一步分析。在一些情况下,基因表达用于确定拷贝数异常是否影响表达和/或描绘给定患者肿瘤中的驱动基因。在一些情况下,可以从RNA测序数据中推断出CNA水平。可以进行基因甲基化和/或染色质可用性测定,其可用于进一步分析。

如本领域从业人员所理解的,可以通过多种方法从癌症活组织检查和/或从个体的体液(例如血液、血浆)中提取核酸,包括循环肿瘤DNA(ctDNA)。如本文所述,一旦提取,核酸可以被处理和制备用于检测。检测方法包括(但不限于)杂交技术(例如原位杂交(ISH))、核酸扩增技术(例如PCR)和测序(例如外显子组、基因组测序)。

根据本文所述的各种实施方案检测基因组基因座和/或基因。在一些实施方案中,一组探针和/或引物用于鉴定一组特定的基因组CNA和/或表达的转录物。在各种实施方案中,对整个或部分基因组、外显子组和/或转录组进行测序和分析以鉴定一组特定的基因组CNA和/或表达的转录物。在许多实施方案中,一组特定的基因组CNA和/或表达的转录物代表特定的分子分类。在一些实施方案中,分子分类表示癌症的侵袭性和复发风险。在一些实施方案中,分子分类表示癌症的分子病理学。在一些实施方案中,一组特定的基因组CNA和/或转录物的表达代表特定的IntClust亚组。在一些实施方案中,分子分类进一步用于对复发风险进行分层。

过程700基于遗传分析(例如,CNA、转录物表达、甲基化分析)对乳腺癌进行分子分类和/或风险分层(703)。在各种实施方案中,分子类别预测模型包括(但不限于)基于收缩的方法、逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机和神经网络。在各种实施方案中,统计计算模型包括(但不限于)多状态半马尔可夫模型、Cox比例风险模型、基于收缩的方法、基于树的方法、贝叶斯方法、基于核的方法和神经网络。

根据各种实施方案,针对各种IntClust亚组描述的拷贝数扩增用作将癌症分类为本文所述的特定亚组的生物标志物。许多实施方案利用先前训练的计算分类器来将乳腺癌分配到如本文所述的特定分子病理学亚组(例如,IntClust)。各种实施方案可以利用先前训练的风险分层模型来确定乳腺癌复发的风险。因此,计算分类器可以利用来源于患有乳腺癌的个体的DNA和RNA分析的拷贝数特征、基因表达特征、基因组甲基化特征和/或核小体占据特征。在一些实施方案中,拷贝数特征通过基因组位置或基因名称匹配。在各种实施方案中,表达特征与检测表达的探针和/或测序结果相匹配。在匹配特征之后,各种实施方案将每个特征缩放至z评分并且可以包括其他归一化方法。在许多实施方案中,将匹配的特征输入到分子分类器和/或风险分层模型中以揭示如何基于分子分类和/或复发风险来治疗个体。

过程700还基于癌症的分子分类和/或风险分层来治疗(705)乳腺癌。在一些实施方案中,癌症分类为侵袭性和/或晚期复发(例如IntClust亚组1、2、6和9)和/或高风险亚组,可以应用延长激素/内分泌治疗(例如,氟维司群、阿那曲唑、依西美坦、来曲唑、他莫昔芬、GDC9545)。在各种实施方案中,分类为侵袭性和/或晚期复发和/或高风险亚组的癌症用化学疗法治疗。

如前所述,各种IntClust亚组的特征在于特定的分子异常和基因组驱动因子,其中一些可以容易地被治疗靶向。在一些实施方案中,用mTOR途径拮抗剂(例如,依维莫司、西罗莫司、西罗莫司、雷帕霉素)、AKT1拮抗剂(例如,ipatasertib、capivasertib(AZD5363))、AKT1/RPS6KB1拮抗剂(例如,M2698)、RPS6KB1拮抗剂(例如,例如,LY2584702)、PI3K拮抗剂(例如,阿培利司、buparlisib(BKM120)、pictilisib(GDC-0941))、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust1癌症。在多个实施方案中,用表观遗传靶向疗法、CDK4/6拮抗剂(例如,帕博西尼、瑞博西尼、阿贝西利)、FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、PARP抑制剂(例如,尼拉帕尼、奥拉帕尼)、同源重组缺陷(HRD)靶向治疗、PAK1抑制剂(例如,IPA3)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust2癌症。在一些实施方案中,用FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust6癌症。并且在各种实施方案中,用选择性雌激素受体降解剂(SERD)(例如,氟维司群、GDC-9545、SAR439859(SERD'859)、RG6171、AZD9833)、蛋白水解靶向嵌合体(PROTAC)ARV-471、SRC3拮抗剂(例如,SI-2)、MYC拮抗剂(例如,omomyc)、BET溴结构域拮抗剂(例如,JQ1、PROTAC ARV-771)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust9癌症。

虽然上面描述了基于分子分类和/或风险分层来治疗乳腺癌的过程的具体示例,但是本领域普通技术人员可以理解,该过程的各个步骤可以以不同的顺序进行,并且某些根据本发明的一些实施方案,步骤可以是可选的。因此,应该清楚的是,可以根据具体应用的要求适当地使用该过程的各个步骤。此外,根据本发明的各种实施方案,可以利用用于治疗乳腺癌以满足给定应用的要求的多种方法中的任一种。

治疗方法

各种实施方案涉及基于癌症的分子表征和/或风险分层的乳腺癌治疗。如本文所述,通过分子病理学和/或癌症的侵袭性和复发风险对乳腺癌进行分类。基于分类,能够相应地治疗乳腺癌(或患有乳腺癌的个体)。

几个实施方案涉及基于癌症的分子分类和/或风险分层使用药物治疗乳腺癌。在一些实施方案中,药物以治疗有效量作为疗程的一部分施用。如本文所用,“治疗”意指改善待治疗疾病的至少一种症状或提供有益的生理作用。例如,一种这样的症状改善可以是减少肿瘤大小和/或复发风险。

治疗有效量可以是足以预防、减少、改善或消除乳腺癌症状的量。在一些实施方案中,治疗有效量是足以减少乳腺癌生长中的癌症生长的量,其可以通过多种方式确定,包括(但不限于)测量肿瘤大小和测量增殖水平(例如,Ki67+表达)。

许多治疗和药物可用于治疗乳腺癌,包括(但不限于)放射疗法、化学疗法、靶向(分子)疗法、内分泌疗法和免疫疗法。因此,根据各种实施方案,可以通过本文所述的单一药物或药物组合来治疗个体。

抗癌剂或化疗剂的种类可以包括烷化剂、铂剂、紫杉烷、长春花剂、抗雌激素药物、芳香酶抑制剂、卵巢抑制剂、内分泌/激素剂、双膦酸盐治疗剂和靶向生物治疗剂。药物包括(但不限于)环磷酰胺、氟尿嘧啶(或5-氟尿嘧啶或5-FU)、甲氨蝶呤、噻替派、卡铂、顺铂、紫杉烷、紫杉醇、蛋白结合紫杉醇、多西他赛、长春瑞滨、他莫昔芬、雷洛昔芬、托瑞米芬、氟维司群、吉西他滨、伊立替康、伊沙匹隆、替莫唑胺、托泊替康、长春新碱、长春碱、艾日布林、突变霉素、卡培他滨、卡培他滨、阿那曲唑、依西美坦、来曲唑、亮丙瑞林、阿巴瑞克、布舍瑞林、戈舍瑞林、醋酸甲地孕酮、利塞膦酸盐、帕米膦酸盐、伊班膦酸盐、阿仑膦酸盐、唑来磷酸和泰立沙。蒽环类药物包括(但不限于)柔红霉素、多柔比星、表柔比星、伊达比星、伐柔比星和米托蒽醌。

内分泌治疗包括(但不限于)选择性雌激素受体调节剂(SERM)、选择性雌激素受体降解剂(SERD)、芳香酶抑制剂和PROTAC ARV-471。SERM包括(但不限于)他莫昔芬、托瑞米芬、雷洛昔芬、欧培米芬和巴多昔芬。SERD包括(但不限于)氟维司群、布里兰司群(GDC-0810)、依拉司群、GDC-9545、SAR439859(SERD‘859)、RG6171和AZD9833。芳香酶抑制剂包括(但不限于)阿那曲唑、依西美坦、来曲唑、伏氯唑、福美坦和法曲唑。绝经前妇女的内分泌治疗包括(但不限于)施用他莫昔芬、SERD或芳香酶抑制剂。也可以进行卵巢消融和/或卵巢抑制。绝经后妇女的内分泌治疗包括(但不限于)使用SERM或芳香酶抑制剂。

如本领域技术人员所理解的,可对待治疗的乳腺癌施用适当的给药和治疗方案。例如,蒽环类药物可以每周10mg/m

可以治疗任何合适的乳腺癌,包括I、II、III和IV期乳腺癌。对于雌激素受体(ER)、孕酮受体(PR)和人表皮生长因子2(Her2)呈阳性和/或阴性状态的乳腺癌也可以根据本发明的各种实施方案进行治疗。

基于致癌病理学的靶向治疗

几个实施方案针对治疗乳腺癌的靶向(分子)疗法。在许多这些实施方案中,靶向治疗是特异性靶向乳腺癌的分子病理学或致癌驱动因子的治疗,其基于分子分类(例如,分类到IntClust亚组)来确定。因此,靶向疗法是一种减轻致癌驱动因子功能的疗法,例如(诸如)抑制致癌驱动因子活性的拮抗剂。在一些实施方案中,靶向治疗靶向致癌驱动因子的途径。在一些实施方案中,伴随诊断用于确定是否使用其中伴随诊断识别乳腺癌的致癌驱动因子的靶向治疗。

现在认识到,分类到IntClust亚组1、2、6和9的ER+/HER2-乳腺癌是具有高复发可能性的更具侵袭性的癌症。进一步认识到,可以靶向高风险亚组的致癌驱动因子,从而改进对这个难以治疗的组的治疗。如图3A和3B所示,IntClust1的一些致癌驱动因子是RPS6KB1、PRR11和/或BCAS3,IntClust2的一些致癌驱动因子是FGF3/FGF4/FGF19、可能与EMSY、PAK1和/或RSF1组合的CCND1,IntClust6的一些致癌驱动因子是FGFR1、EIF4EBP1和/或ZNF703,IntClust9的致癌驱动因子是MYC和/或NCOA3。

在几个实施方案中,直接靶向致癌病理学。在一些实施方案中,用mTOR途径拮抗剂(例如,依维莫司、西罗莫司、西罗莫司、雷帕霉素)、AKT1拮抗剂(例如,ipatasertib、capivasertib(AZD5363))、AKT1/RPS6KB1拮抗剂(例如,M2698)、RPS6KB1拮抗剂(例如,LY2584702)、PI3K拮抗剂(例如,阿培利司、buparlisib(BKM120)、pictilisib(GDC-0941))、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust1癌症。在多个实施方案中,用表观遗传靶向疗法、CDK4/6拮抗剂(例如,帕博西尼、瑞博西尼、阿贝西利)、FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、PARP抑制剂(例如,尼拉帕尼、奥拉帕尼)、同源重组缺陷(HRD)靶向治疗、PAK1抑制剂(例如IPA3)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust2癌症。在一些实施方案中,用FGFR途径拮抗剂(例如,卢西他尼、多维替尼、AZD4547、厄达替尼、英非替尼(BGJ398)、BAY-1163877、普纳替尼)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust6癌症。并且在各种实施方案中,用选择性雌激素受体降解剂(SERD)(例如,氟维司群、GDC-9545、SAR439859(SERD'859)、RG6171、AZD9833)、蛋白水解靶向嵌合体(PROTAC)ARV-471、SRC3拮抗剂(例如,SI-2)、MYC拮抗剂(例如,omomyc)、BET溴结构域拮抗剂(例如,JQ1、PROTAC ARV-771)、eIF4A拮抗剂(例如,佐他替芬)、eIF4E拮抗剂(例如,雷帕霉素、雷帕霉素类似物、利巴韦林、AZD8055)或其组合治疗IntClust9癌症。

早期ER+/HER2-乳腺癌的分层和治疗

许多实施方案针对早期乳腺癌的治疗方法,其中IntClust分类和/或风险分层用于对治疗进行分层。在当前的方案标准中,乳腺癌筛查提供了关于如何进行的一些初步决定。通常,进行基本的组织学和肿瘤评估以及成像,包括确定癌症分期(即I、II、III和IV期肿瘤类型(即导管、小叶、混合、化生)、肿瘤大小、淋巴结内癌症的存在和基本遗传分析(即孕酮受体(PR)、雌激素受体(ER)和人表皮生长因子受体2(HER2)的状态)。如目前在本领域中实践的那样,基于这些因素,进行特定的治疗。

当ER+/HER2-乳腺癌为I至III期并且淋巴结阴性时,它被认为是早期乳腺癌。根据目前的护理标准,肿瘤小于0.5cm的早期ER+/HER2-乳腺癌采用手术和辅助内分泌治疗进行治疗。当早期ER+/HER2-乳腺癌具有大于0.5cm的肿瘤时,根据当前的护理标准,通常进行分子检测,例如Oncotype Dx,以确定复发风险。当复发风险较低时(例如,Oncotype评分<18),治疗需要手术和辅助内分泌治疗。当复发风险高时(例如,Oncotype评分≥31),治疗需要手术、辅助内分泌治疗和辅助化疗。当复发风险中等时(例如,Oncotype评分为18-30),治疗需要手术和辅助内分泌治疗,也可能还进行辅助化疗。由于该组内缺乏风险分层,辅助化疗在中等风险中的益处尚不清楚。

在许多实施方案中,IntClust分类将用作对早期ER+/HER2-乳腺癌的分子测试,无论它是淋巴结阳性还是阴性。因此,在一些实施方案中,早期ER+/HER2-乳腺癌被分类为高风险IntClust亚组(即,IntClust亚组1、2、6或9),用手术、辅助内分泌疗法和辅助化疗进行治疗。在一些实施方案中,IntClust分类被用作统计模型内的特征以确定复发风险。在一些实施方案中,分层为高风险或分类为高风险IntClust亚组的癌症接受针对IntClust亚组的分子驱动因子的靶向治疗。并且在一些实施方案中,分层为较低风险或分类为较低风险IntClust亚组(即,IntClust亚组3、4ER+、7或8)的早期ER+/HER2-乳腺癌用手术和辅助内分泌治疗而不是化疗治疗以减少与化疗相关的有害影响。

在许多实施方案中,除了对早期ER+/HER2-乳腺癌的经典分子测试之外,还使用风险分层和/或IntClust分类。在一些实施方案中,当通过另一种模型确定复发风险为中等(例如,Oncotype评分为18-30)时,使用风险分层和/或IntClust分类来进一步对这些患者进行分层。因此,在一些实施方案中,当早期ER+/HER2-乳腺癌通过经典方法分类为中等风险组(例如,Oncotype评分为18-30)和通过本文描述的方法分类为高风险(例如,分子分类为高风险IntClust亚组)时,癌症通过手术、辅助内分泌治疗和辅助化疗进行治疗。在一些实施方案中,分级为高风险的癌症还接受针对IntClust亚组的分子驱动因子的靶向治疗。并且在一些实施方案中,当早期ER+/HER2-乳腺癌通过经典方法分类为中等风险组(例如,Oncotype评分为18-30)和通过本文描述的方法分类为低风险(例如,分子分类为较低风险IntClust亚组)时,接受手术和辅助内分泌治疗,但不接受化疗。

应注意,分为低、中和高的分子测试评分(例如Oncotype)的分类可能会改变(参见例如J.A.Sparano等人,N.Engl.J.Med.379,111-121(2018),其公开内容通过引用并入本文)。尽管可能会发生变化,但使用分子驱动因子分类(例如,IntClust分类)来更好地理解评分的提议仍然适用。如示例性实施方案中详述的,与单独的Oncotype相比,与Oncotype结合的分子驱动因子分类的使用产生对复发风险的更好理解。

可以对早期乳腺癌进行几种其他分子分类评估,包括Prosigna、MammaPrint、EndoPredict、BCI。因此,在几个不同的实施方案中,除了Prosigna、MammaPrint、EndoPredict、BCI或其组合之外,还使用了IntClust分类。在许多实施方案中,IntClust分类可以与另一种分子分类组合以确认诊断和/或更好地对患者进行分层以确定适当的治疗策略。

女性的绝经状态也有助于确定适当的治疗,因为雌激素的调节很重要。对于患有ER+/HER2-乳腺癌且复发风险较高(年轻、高分级肿瘤、淋巴结受累或基于复发风险的分子预测因子)的绝经前妇女,根据一些实施方案施用5年的他莫昔芬或芳香酶抑制剂(加上卵巢抑制或消融)。芳香酶抑制剂包括(但不限于)阿那曲唑、依西美坦和来曲唑。

在许多实施方案中,对于绝经后妇女,施用他莫昔芬4.5-6年和长达10年。在一些实施方案中,将芳香酶抑制剂施用于绝经后妇女。作为其治疗计划的一部分,一些绝经后妇女将根据各种实施方案单独使用芳香酶抑制剂。其他人将使用他莫昔芬1-5年,然后根据各种实施方案开始使用芳香酶抑制剂。芳香酶抑制剂包括(但不限于)阿那曲唑、依西美坦和来曲唑。

许多实施方案利用针对早期乳腺癌的靶向治疗。例如,在一些实施方案中,可以施用具有RPS6KB1致癌病理学(例如,IntClust1)、capivasertib(AZD5363)或M2698的早期乳腺癌。在一种治疗方案中,capivasertib以400mg每日两次(2片口服片剂)施用,其以4天施用、3天休息的间歇每周给药方案给予(即在每个28天的治疗周期内的第1、2和3周的第2至5天给药然后停药1周)。它可以与内分泌治疗(如氟维司群(500mg))联合给予,并可能与他莫昔芬联合给予。M2698可以以每天240mg单独施用或每天160mg与他莫昔芬联合施用。在具有FGFR途径致癌病理学(例如,FGFR和FGF致癌基因)的癌症(例如,IntClust2、IntClust6)中,英非替尼可以每天75-125mg施用,施用3周,停用1周。在具有CDK4/6致癌病理学的癌症(例如,IntClust2、IntClust6)中,帕博西尼可以每天125mg施用,施用3周,停用1周。

虽然描述了具体的治疗方案,但这些是作为示例性治疗选项提供的。应当理解,给药量和/或方案的改变将被包括在各种实施方案中。还应该理解,各种治疗组合可以改变、替代和/或与其他治疗组合组合,如本领域技术人员将理解的。例如,可以改变包括氟维司群的各种治疗方案以包括其他SERD、他莫昔芬或芳香酶抑制剂。因为氟维司群的口服利用率低,在一些实施方案中,可以使用PROTAC ARV-471或口服可用的SERD,例如,GDC-9545、SAR439859(SERD’89)、RG6171或AZD9833。

转移性ER+/HER2-乳腺癌的治疗

许多实施方案针对转移性乳腺癌的治疗方法,其中使用了IntClust分类。在当前的方案标准中,乳腺癌筛查提供了一些关于如何进行的初步决定。通常,进行基本的组织学和肿瘤评估,包括确定癌症分期(即I、II、III和IV期肿瘤类型(即导管、小叶、混合、化生)、肿瘤大小、淋巴结内癌症的存在和基本的遗传分析(即孕酮受体(PR)、雌激素受体(ER)和人表皮生长因子受体2(HER2)的状态)。如目前在本领域中实践的那样,基于这些因素,进行特定的治疗。

当ER+/HER2-乳腺癌为IV期和/或淋巴结阳性时,它被认为是转移性乳腺癌。治疗决定取决于女性是绝经前还是绝经后。对于绝经前妇女,治疗包括(但不限于)施用他莫昔芬、托瑞米芬或氟维司群。也可以进行卵巢消融和/或卵巢抑制。对于绝经后妇女,治疗包括(但不限于)施用他莫昔芬和/或芳香酶抑制剂。这些治疗可以进行5年,最长10年。

在许多实施方案中,对转移性癌症施用靶向治疗。例如,在一些实施方案中,可以施用具有RPS6KB1致癌病理学(例如,IntClust1)、capivasertib(AZD5363)或ipatasertib的癌症,并且可以与芳香酶抑制剂和/或其他内分泌疗法组合。考虑了多种治疗方案。在一种方案中,治疗包括capivasertib和芳香酶抑制剂,capivasertib以400mg/天施用4天、停用3天,而每天服用芳香酶抑制剂。在一种方案中,治疗包括capivasertib和氟维司群,capivasertib以400mg/天施用4天、停用3天,而500mg氟维司群将在28天周期的第1天和第15天施用,并在每个后续周期的第1天再次施用。在一种方案中,治疗包括capivasertib和氟维司群和帕博西尼,capivasertib以400mg/天施用4天、停用3天,而500mg氟维司群将在28天周期的第1天和第15天施用,并在每个后续周期的第1天再次施用,和帕博西尼将按施用3周和停用1周的方案口服施用。在一种方案中,治疗包括ipatasertib和芳香酶抑制剂,ipatasertib每天以400mg/天与将每天施用的芳香酶抑制剂一起施用。在一种方案中,治疗包括ipatasertib和氟维司群,ipatasertib以400mg/天每天施用,而500mg氟维司群将在28天周期的第1天和第15天施用,并在每个后续周期的第1天再次施用。在一种方案中,治疗包括ipatasertib和氟维司群和帕博西尼,ipatasertib以400mg/天每天施用,而500mg氟维司群在28天周期的第1天和第15天施用,并在每个后续周期的第1天再次施用和帕博西尼将按施用3周和停用1周的方案口服施用。

在许多实施方案中,对转移性癌症进行靶向治疗,这可以通过IntClust分类来确定。例如,在一些实施方案中,具有FGFR途径(例如,FGFR和/或FGF致癌基因)致癌病理学(例如,IntClust2、IntClust6)的癌症,可以施用英非替尼(BGJ398)并且可以与芳香酶抑制剂和/或其他内分泌治疗或潜在的化疗组合。考虑了多种治疗方案。在一种方案中,治疗包括英非替尼和芳香化酶抑制剂,英非替尼以125mg/天每天施用,持续3周和停用1周,而AI将每天施用。在一种方案中,治疗包括英非替尼和氟维司群,英非替尼以125mg/天每天施用,持续3周和停用1周,而500mg的氟维司群将在28天周期的第1天和第15天施用,然后在每个后续周期的第1天再次施用。在一种方案中,治疗包括英非替尼和氟维司群和帕博西尼,英非替尼以125mg/天每天施用3周和停用1周,而500mg的氟维司群将在28天周期的第1天和第15天施用,然后在每个后续周期的第1天再次施用,和帕博西尼将按施用3周和停用1周的方案口服施用。

虽然描述了具体的治疗方案,但这些是作为示例性治疗选项提供的。应当理解,施用量和/或方案的改变将被包括在各种实施方案中。还应该理解,各种治疗组合可以改变、替代和/或与其他治疗组合组合,如本领域技术人员将理解的。例如,包括帕博西尼的治疗方案可以改变为包括瑞博西尼和/或阿贝西利。

三阴性乳腺癌的治疗

许多实施方案涉及治疗三阴性癌症的方法,其中使用了IntClust分类。在当前的方案标准中,乳腺癌筛查提供了一些关于如何进行的初步决定。通常,进行基本的组织学和肿瘤评估,包括确定癌症分期(即I、II、III和IV期肿瘤类型(即导管、小叶、混合、化生)、肿瘤大小、淋巴结内癌症的存在和基本的遗传分析(即孕酮受体(PR)、雌激素受体(ER)和人表皮生长因子受体2(HER2)的状态)。如目前在本领域中实践的那样,基于这些因素,进行特定的治疗。

当乳腺癌缺乏PR、ER或HER2的扩增(即PR-、ER-和HER2-)时,它被认为是三阴性乳腺癌。对于三阴性乳腺癌(TNBC),靶向激素或HER2的疗法不起作用。相反,根据目前的护理标准,TNBC采用手术、放射疗法和/或化学疗法相结合的方式进行治疗。TNBC的一个新兴选择是使用检查点抑制剂(例如派姆单抗或纳武单抗)和/或针对蛋白质PD-L1或PD1的免疫疗法(例如阿特珠单抗(Tecentriq))进行治疗。在一些实施方案中,分类在IntClust4ER-中的TNBC用阿特珠单抗治疗,因为该分类内的癌症具有高度的免疫浸润和持续的复发风险。在一些实施方案中,分类在IntClust10中的TNBC在放射或化学疗法之后或可能与放射或化学疗法联合地使用阿特珠单抗治疗,以更好地刺激免疫系统并因此对阿特珠单抗治疗更敏感。

患者来源的类器官开发和使用

几个实施方案涉及患者来源的类器官(PDO)的开发和使用,其是来源于患者癌症组织并在体外培养的癌细胞的三维组织,其中三维培养物中的致癌信号传导更好地模拟体内环境。PDO也可以在体内异种移植。PDO概括了患者癌症的生物学特征,因此非常适合研究药物化合物治疗癌症的能力。此外,可以为在现有癌细胞系中没有很好呈现的高风险乳腺癌开发PDO。

在各种实施方案中,PDO系被开发用于一般和/或个人药物化合物治疗研究。因此,在一些实施方案中,PDO系被表征为分子亚组(例如,IntClust亚组)并用作模型以推断候选药物化合物以治疗属于该亚组的患者。在一些实施方案中,研究了具有分子亚组的一组PDO系以推断候选药物化合物来治疗属于该亚组的患者。并且在一些用于个性化评估的实施方案中,PDO系来源于特定患者,然后进行评估以推断治疗该患者的药物化合物。

对于一般药物化合物治疗研究,推断候选药物化合物的方法的实施方案可以如下进行:

·从一名或多名患者提取癌细胞

·将组织的致癌病理学分类为分子亚组

·从一名或多名患者开发一组一个或多个PDO系;小组中的每个PDO系共有相似的分子病理学(例如,IntClust亚组中的一组PDO系)

·管理对小组的药物化合物以确定用于治疗共有相似分子病理学的患者的候选药物化合物

在一些实施方案中,一般药物化合物治疗研究的结果被用作临床前数据或开发针对患者的临床试验。在一些实施方案中,评估化合物浓度(例如,IC

对于个人药物化合物治疗研究,推断候选药物化合物的方法的实施方案可以如下进行:

·从患者提取癌细胞

·任选:将患者的癌症或衍生PDO表征为分子亚组

·从患者开发一组一个或多个PDO系

·测试小组中的药物化合物以确定用于患者特定治疗方案的药物化合物

o任选:待测药物化合物是特定分子亚组的候选化合物

o任选:测试药物化合物的组合以确定治疗方案的更佳药物组合

在一些实施方案中,个人药物化合物治疗研究的结果用于对患者进行个人治疗。在一些实施方案中,评估化合物浓度。在一些实施方案中,评估化合物对患者癌细胞的毒性。在一些实施方案中,评估化合物对患者健康细胞的毒性以确定潜在的脱靶和/或副作用。

示例性实施方案

将通过其中提供的几个实施例更好地理解本发明的实施方案。描述了鉴定乳腺癌复发的分子指标的过程的许多示例性结果。还提供了验证结果。

实施例1:乳腺癌复发的动力学

乳腺癌具有多个进展阶段(即,多状态疾病),具有临床相关的中间终点,例如在局部区域或远处位置的复发。这些复发事件是相关的,一个终点的个体生存分析不能完全捕捉可能与不同预后相关的复发模式。患者的预后可能取决于复发的时间和地点、手术后的时间以及局部或远处复发后的时间而显著不同。正如这里提出的,这些不同的状态和时间尺度通常没有被说明并且推动统一统计框架的发展。

为了克服这些限制,各种实施方案并入了计算模型,该模型说明了不同的临床终点和时间尺度,以及死亡的竞争风险,从而能够描述个体的风险,包括复发的风险。在这些实施方案中的一些实施方案中,使用非同质(半)马尔可夫链模型。将这些模型应用于具有多年临床随访的乳腺癌患者队列,包括许多具有伴随分子数据的患者,可以描述不同分子亚组的乳腺癌复发的时空动力学。特别地,临床亚组、PAM50亚组(C.M.Perou等人,Nature406,747–52(2000),J.S.Parker J.Clin.Oncol.27,1160–67(2009),其公开内容各自通过引用整体并入本文)和基于基因组拷贝数改变和转录谱的整合定义的整合集群(IntClust)(C.Curtis等人,2012,引用同上)的复发模式被评估以鉴定患有侵袭性癌症和高复发风险的患者的分子亚组。值得注意的是,在几个实施方案中,具有特定基因组驱动因子的四个整合亚组在最初诊断后长达二十年具有高复发风险。发现这四个亚组约占所有ER+肿瘤的25%。此外,这四个亚组中的每一个都映射到整合集群之一,并富集了基因组各个部分的特征拷贝数扩增事件,包括11q13(FGF3、CCND1、RSF1)、8p12(FGFR1、ZNF703)、17q23(RPS6KB1)和8q24(MYC)。发现使用这些整合集群可以改善对超出标准临床协变量的晚期远处复发的预测,这在外部验证队列中得到了证实。还发现一组三阴性乳腺癌患者在5年后很少复发,而其他人仍处于风险之中。远处复发后,肿瘤亚型继续决定随后的转移率,强调了对肿瘤进行相应分类的重要性。基于这些发现,几个实施方案涉及鉴定具有侵袭性癌症和复发的特定风险的个体,如通过诊断方法确定的。各种实施方案基于个体的癌症侵袭性和复发风险来治疗和/或监测个体。

来自英国和加拿大的五个肿瘤库的3,240名患者的数据用于本文所述的研究,本文称为完整数据集[FD](中位随访时间为9.75年)。[FD]包括临床和病理变量,并用于定义临床亚型(ER+/HER2+、ER+/HER2-、ER-/HER2+、ER-/HER2-)。对于1,980名患者的子集,先前描述了基于基因表达和拷贝数数据的整合基因组分析,本文称为分子数据集或METABRIC[MD]。对于该队列,肿瘤基于临床亚型、内在亚型(PAM50)(C.M.Perou等人,(2000)和J.S.Parker等人,(2009)引用同上)和整合集群(IntClust)成员资格(C.Curtis等人,(2012)和H.R.Ali等人,(2014),引用同上)。最后,对于经历远处转移的一部分患者(1079名复发患者中的618名),可以获得每次复发日期(而不仅仅是第一次)的完整信息,从而能够分析时空动力学。该数据在本文中称为循环事件数据集[RD]。这三个数据集总结在表1中,临床细节在表2-4、图8中提供。由1380名乳腺癌患者组成的独立队列用于外部验证研究结果(图9)。

从[FD]推导出几个基本参数,这些参数幼稚地描述了乳腺癌的两个关键中间终点:局部复发(LR)和远处复发(DR)。对于此实施例,局部区域复发是局部或区域复发,包括同一乳房、胸部皮肤、腋窝、内乳、腋窝或锁骨上淋巴结中的病变。远处复发被定义为远处转移。

在2297名ER+患者中,312(14%)和718(31%)名患者分别经历了LR或DR,176(8%)名患者同时患有LR和DR,而在850名ER-患者中,140名(16%)经历了LR,335名(39%)经历了DR,111名(13%)两者都有。在复发的患者中,复发的平均时间不同,ER+患者平均5.7年至LR和5.4年至DR,而ER-患者平均2.8年至LR和2.8年至DR。最后,在那些经历过LR的患者中,56%的ER+和79%的ER-患者继续发生DR或乳腺癌死亡。ER+肿瘤患者LR后至DR或乳腺癌死亡的平均时间为2.1年,ER-疾病患者为0.9年。

对数据进行基本质量控制。复发时间为零或复发时间等于最后一次观察时间的观察结果偏移0.1天。远处复发后发生的局部复发被忽略。11例IV期癌症病例也被排除在分析之外。从分析中去除良性和叶状肿瘤。最后一次随访时间或死亡时间是所有患者的最终终点。特别注意从数据集中删除第二个原发性肿瘤。由于临床变量、分子分类等方面的缺失值不同,每个模型中使用的病例总数可能会有所不同。

乳腺癌复发的多状态模型

还检查了并入了LR和DR的中间事件的生存分析。虽然大多数研究检查无病生存期或总生存期,但这种方法有很大的局限性。重要的是,ER+患者的非恶性原因死亡率高于ER-患者,因为他们在诊断时往往年龄较大。

大多数生存分析采用疾病特异性死亡作为主要终点并审查自然死亡,然而,该策略产生的审查机制不独立于在存在几个竞争风险的情况下研究的变量并导致有偏差的Kaplan-Meier生存估计。通过比较仅考虑癌症相关死亡的ER-和ER+患者的癌症相关死亡的幼稚累积发病率(计算为1-生存概率)(图10)相对于具有不同死因的适当累积发病率函数的估计值(图11)证实了队列中偏差的程度。如本实施例所述,癌症相关死亡是死亡证明中已标记为癌症相关的任何死亡。如果死因被标记为其他原因、未知或丢失,则该死亡被视为“其他”原因死亡。这些比较表明,ER+肿瘤的疾病特异性死亡发生率被高估(20年时为0.46相对0.37)。这是因为ER+肿瘤的诊断年龄高于ER-肿瘤(中位数63.9岁相对53.0岁;p值<2.2e-16),因此患者发生非恶性肿瘤相关死亡的风险更大(图12)。使用总生存期作为终点并不能解决这个问题,因为它合并了两种不同的死亡原因并增加了ER+患者的风险。此外,由于病理亚组的基线生存函数是不同的(图13),因此无法用Cox比例风险模型中的单个参数充分总结它们的差异。

为了克服这些挑战,开发了一种统计模型,该模型说明了不同的疾病状态(LR和DR)、不同的时间尺度(从诊断开始的时间和从复发开始的时间)、死亡的竞争性原因(癌症死亡或其他原因)、临床协变量或年龄效应,以及不同分子亚组的不同基线危害(参见H.Putter,M.Fiocco,&R.B.Geskus,Stat.Med.26,2389–430(2007);O.Aalen,O.Borgan,&H.Gjessing,Survival and Event History Analysis–A Process Point of View.(Springer-Verlag New York,2008);和T.M.Therneau&P.M.Grambsh,Modeling SurvivalData:Extending the Cox Model.(Springer-Verlag New York,2000);其公开内容各自引用同上)。多态统计模型(图13)拟合至[FD],从而说明乳腺癌的时间顺序,从原发肿瘤的手术切除开始,然后是局部区域和/或远处复发的发展和说明由于癌症或其他原因导致的死亡的竞争风险。这些状态中的每一个发生的风险都用具有两个吸收状态(死亡/癌症和死亡/其他)的非同质半马尔可夫链建模,并记录了每对状态之间的转换次数(表5-7)。

该模型通过分子亚型分层并使用时钟重置时间尺度,其中当患者进入新状态时时钟停止。尽管有少量从远处复发到局部复发的转变(15例ER+病例和7例ER-),但在这些情况下省略了局部复发,因为它被认为是多余的,并且在我们的模型中只允许从局部复发到远处复发的转变。包括癌症死亡但没有复发的可能性,以说明未检测到转移的情况。R软件包mstate和survival用于拟合数据。有关mstate和survival的更多信息,请参见L.C.deWreede,M.Fiocco,and H.Putter J.Stat Softw.38,1-30(2011),其公开内容通过引用并入本文;和T.M.Therneau and P.M Grambsch,2000,引用同上。

模型中包括了几个协变量:诊断时的年龄、肿瘤分级、肿瘤大小和阳性淋巴结的数量。淋巴结,作为连续变量输入,但上限为10个淋巴结,以避免来自极端情况的有影响的观察。从诊断开始的时间也被包括为连续的。

该模型根据其不同的概况采用针对ER+和ER-疾病的独立的基线危害。对于数据集[FD],根据ER状态分层拟合了Cox模型。对于两个ER值,对于所有转变到死亡/其他原因的年龄具有相同的系数。对于每种ER状态,分级、大小和淋巴结从起始状态到复发/死亡状态具有不同的系数。对于每种ER状态,从诊断开始的时间从复发的起始状态到复发/死亡状态具有不同的系数,和对于每种ER状态,从局部区域复发开始的时间从远处复发状态到癌症相关死亡具有不同的系数。

大多数癌症相关死亡(ER+肿瘤中83%和ER-肿瘤中87%)发生在远处转移之后(表5)。其余病例反映了未发现的复发或患者死于另一种恶性肿瘤的情况。

年龄与转变到其他原因导致的死亡显著相关(p值<0.01)。所有其他变量的对数风险比和95%置信区间的检查表明,每个变量的影响随着疾病进展而降低(图14)。这意味着与原发性肿瘤相关的临床变量对早期转变(例如,从无病状态到复发)的预后要优于后期转变(例如,从DR到死亡)。然而,一些肿瘤特征告知了从LR进展到DR以及从DR进展到死亡的风险。在ER+癌症中,肿瘤分级、肿瘤大小和阳性淋巴结数量都增加了转变为“更糟”状态的风险。然而,手术与LR之间或手术与DR之间的较长时间降低了转变为“更糟”状态的风险,这种降低的风险在ER癌中更为普遍。LR后的时间量不能预测DR的发作。因此,该变量未包括在其余分析中。

广泛验证表明这些模型经过良好校准并且不倾向于过度拟合(图15)。此外,通过ER状态分层的基本模型相对于已建立的工具Predict(图16)显示出很强的一致性,在外部元队列(图17)中具有可比的模型性能(有关Predict的更多信息,请参见G.C.Wishart等人,Breast Cancer Res.12,R1(2010),其公开内容通过引用并入本文)。

乳腺癌分子亚型的不同复发模式

相关终点是经历LR或DR的概率,计算为所有患者中的平均复发概率。一般来说,LR的风险仍然相对较小,而DR的风险随着疾病的发展而变化,如在IntClust组(图4)以及临床(图18)和PAM50(图19)亚组中明显的。这些比较进一步阐明了IntClust4ER-患者相对于IntClust10患者的5年后LR和DR的升高的风险。总的来说,这些数据表明,在三阴性患者中,属于IntClust10且5年后无复发的患者的复发风险可忽略不计,而PAM50基础亚型和ER-/HER2-亚组的差别较小。

LR或DR的概率的比较还揭示了ER+患者中复发轨迹的显著差异,其中IntClust3、IntClust7、IntClust8和IntClust4ER+对应于更好的预后亚组,而IntClust1、IntClust2、IntClust6和IntClust9对应于晚期复发预后不良的患者(图18和22)。这四个亚组占所有ER+病例的26%,并且处于手术后晚期复发的特别高的风险,其中手术后最多20年的DR的平均概率从0.42到0.55不等。当限于ER+/HER2-病例时,趋势相似。因此,这些高风险ER+亚组定义了相当一部分鉴于其疾病的慢性性质可能受益于延长的监测和治疗的女性。

重要的是,四个高风险复发亚组中的每一个都各自富集了跨越假定驱动基因的特征性基因组拷贝数改变,对应于潜在的生物标志物(图3A和3B)。例如,IntClust2肿瘤通过跨越多个推定的癌基因包括FGF3、CCND1、EMSY、PAK1和RSF1的染色体11q13的扩增定义。IntClust2占ER+病例的4.5%,其中96%有RSF1扩增,相比之下其他亚组为0-22%。IntClust6肿瘤的特征在于以FGFR1和ZNF703为中心的8p12的局灶性扩增(IntClust6病例的100%相对其他病例的2-21%),并且占ER+肿瘤的5.5%。IntClust1占ER+肿瘤的8%,并表现出跨越mTOR效应器RPS6KB1(S6K1)的染色体17q23的扩增,其分别在96%和70%的病例中增益或扩增,而扩增在其他组的0-25%中发生。IntClust9占另外8%的ER+病例,并且其特征是跨越MYC癌基因的染色体8q24的扩增,其中89%的IntClust9肿瘤(其他组的3-42%)发生扩增。这些发现一起突出了晚期复发的ER+患者亚组和伴随的基因组生物标志物,其可用于对患者进行分层并确定适当的治疗策略。

分子定义的晚期复发患者亚型的鉴定

通过比较具有LR的患者进展为DR或死亡的平均概率来进一步评估患者结果的轨迹(图20),其通过分层到IntClust亚组(图21)、临床分类亚组(图22)和PAM50亚组(图23)进一步详细说明。根据诊断时原发肿瘤的分子亚型和病理特征,LR后DR的风险差异很大。例如,在IntClust亚组中,风险差异在10年时超过0.6,并且这种分离比PAM50亚组更为极端。类似地,IntClust和PAM50亚组的中位进展时间差异超过5年。

还通过分层到IntClust亚组(图24)、临床分类亚组(图25)和PAM50亚组(图26)来评估和详细说明DR后进展至死亡的平均概率。虽然所有亚型的预后都很差,但中位死亡时间存在显著差异。如下文进一步详述,这些数据表明,病理和分子亚型在远处复发后仍然具有预后性。

整合分型的临床预后值

接下来评估IntClust成员资格是否提供了高于或超出可以从标准临床信息中最佳推断的信息的有关患者晚期远处复发风险的信息。正如在其他队列中所显示的那样,即使在较长的无病间隔之后,诊断时定义的临床变量仍继续决定远处复发结果。结果发现,结合IHC亚型的包括临床变量(年龄、肿瘤大小、分级、阳性淋巴结数量、手术后时间)的IHC模型提供了关于在5年时无复发的患者的远处复发概率的实质信息:10年时的C-指数为0.63(CI 0.58-0.68),15年时为0.62(CI0.58-0.67),20年时为0.61(CI 0.57-0.66)。然而,包括整合亚型显著提高了其预测值:10年时的C-指数为0.70(CI 0.64-0.75;相对于临床模型改善P=0.00011),15年时为0.67(CI 0.63-0.72,P=0.0016),和20年时为0.66(CI 0.62-0.71,P=0.0017)。换言之,通过整合亚型提供的关于晚期复发的动力学的信息可能无法从标准临床变量(包括IHC亚型)中推断出来。尽管随访时间较短(在20年时禁止分析)且样品量较小,但这些趋势在外部验证队列中得到了概括。此外,在肿瘤为ER阳性/HER2阴性的患者亚组中观察到类似的模式(图27-29),在该组中晚期复发和靶向此的策略例如延长内分泌治疗。

手术后与这四个亚组中的每一个中的ER+/Her2-患者相关的明显的复发风险(相对于IntClust3)随时间而变化并且未被标准临床模型捕获(图28)。此外,在诊断后5年未复发的个体ER+/Her2-患者中,DR或乳腺癌死亡的概率在四个晚期复发的IntClust亚组中差异很大(图29),进一步强调了个体化监测策略的重要性。

拟合优度测试

对所有模型进行拟合优度测试。使用surviaval函数cox.zph()使用Schoenfeld残差相对时间对比例风险假设进行了测试。没有一个模型显示出违反假设的协变量,除了其中转移和“其他转移”的数量很显著的转移部位(ER+)模型和其中分级和转移数量很显著的转移部位(ER-)模型。对图的目视检查表明趋势大致平坦,因此违反并不严重。在包含ER的模型中,如前所述,ER违反了比例风险假设。但是,该模型仅用于根据ER测试其他协变量的风险比差异。

ER+高风险整合集群的复发概率的比较

为了测试基于整合集群对风险进行分层的模型,预测了ER+高风险组之间的不同复发概率。当患者在手术后无病时,计算具有远处复发的概率(定义为具有远处复发的概率,无论接下来发生什么),以及计算了IntClust1、2、6和9中的ER+/HER2-患者的局部复发后远处复发/癌症死亡的概率。拟合了具有IntClust成员资格作为自变量的线性模型,并进行了成对比较的Tukey事后检验。

实施例2:用于乳腺癌的风险分层的模型

许多统计模型可用于对乳腺癌的风险进行分层。在许多实施方案中,风险分层并入了分子分类和/或来源于分子分类器(例如,IntClust分类)的预测因子作为特征。分子特征可以基于基因表达和/或拷贝数水平,以及反映转录水平/状态的DNA甲基化或染色质可及性。

在用于从全基因组拷贝数数据确定风险分层的模型性能评估中,建立并测试了以下类型的模型:逻辑回归、具有线性核的SVM、具有高斯核的SVM和神经网络(图30)。

为了进行分析,使用了来自SNP6阵列的基因组拷贝数,该阵列由跨越整个基因组的1,191,855个区段组成。每个区段表示该区域中的平均拷贝数。为了降低维度并获得有用的特征,iClusterPlus R软件包中的CNRegions函数用于合并相邻区域,并为每个样品(数据集中的1285名患者)获得4794个一致拷贝数区域的最终组,其中每个区域具有调整后的平均拷贝数值。这些被用作特征与临床协变量例如诊断时的年龄、肿瘤分级、肿瘤大小和肿瘤阳性淋巴结的数量一起用于机器学习方法中以预测整合亚型或复发标签的二元高[IC1、2、6、9]相对低[IC 3、4、7、8]风险。评估了包括逻辑回归、具有线性核的支持向量机、具有高斯核的支持向量机和神经网络的各种模型的性能以确定它们从全基因组拷贝数数据准确预测整合亚型风险标签的能力(图30)。虽然多个模型表现良好,但神经网络在不同模型中具有最强的性能,具有最高的AUROC和最高的AUPRC。

实施例3:从靶向小组测序预测整合亚型和风险标签

靶向小组测序数据(例如来自MSK-Impact、Foundation Medicine或STAMP)可用于预测整合亚型,并且此类方法的性能可使用具有全基因组拷贝数(和表达数据)的队列进行评估。特别地,METABRIC和TCGA队列先前已用于基于IntClust分类器(基于基因表达和基因组拷贝数数据)的整合亚型分配。IntClust分类器中与感兴趣的小组重叠的基因用于创建由基因x样品组成的矩阵,其中对于每个肿瘤,使用基于循环二进制分割(CBS)算法的分割拷贝数值。或者,对于每个肿瘤可以利用小组上的所有基因,再次产生由基因x样品组成的矩阵,其中对于每个肿瘤,使用基于循环二进制分割(CBS)算法的分割拷贝数值。pamR软件包中的PAM算法用于训练METABRIC(或TCGA训练集)中的分类器,使用交叉验证来选择适当的收缩参数(即优化的F1)。与经过充分验证的IC10分配(基于基因组拷贝数和基因表达数据)相比,乳腺肿瘤被分类为用于训练和保留测试集的类别标签和整合亚型。针对向10个组中的每一个的分配以及针对ER+/Her2-肿瘤中的二元风险类别即高风险(IntClust亚组1、2、6、9)相对低风险(IntClust亚组3、4、7、8)或复发(图31A和31B)评估表现的量度,包括平衡的准确性,并证明了从可通过几种伴随诊断测定获得的靶向(小组)测序数据对整合亚型的稳健分类。

用于从小组测序数据预测整合亚型的替代方法涉及逐步分箱。在这种方法中,使用了使用ASCAT生成的METABRIC的拷贝数估计值(有关ASCAT的更多信息,请参见P.Van Loo等人,Proc Natl Acad Sci U S A.2010;107(39):16910-16915,其公开内容通过引用并入本文)。这些拷贝数调用被分组到FoundationOne小组中的基因。计算基因的改变的基因组分数(FGA),并过滤METABRIC数据以包括FGA>0的样品。这导致510个样品用于训练分类器。然后使用分箱(binning)方法转换拷贝数估计值,以避免过度拟合至特定拷贝数谱。为此,使用了以下箱:0-6、6-10、10-14、14-20、20-60和>60。此外,还并入了与高风险亚组相关的染色体臂的臂水平拷贝数估计值(即8p11、8q24、11q13和17q23)。

IntClust1、IntClust2、IntClust4、IntClust6、IntClust8和IntClust9用于训练,最大化四个高风险类别(即IntClust1、IntClust2、IntClust6和IntClust9)的准确度。该模型使用基于投票的方法,结合弹性网络回归、随机森林和梯度提升树来推断给定样品的IntClust类型。虽然所有亚型中的总体准确度为69%,但如下所示获得了高风险组的相当高的测试准确度。

所有METABRIC样品的总体训练+测试准确度在图32A中示出。对于FoundationMedicine数据,使用了来自Foundation Medicine Inc.提供的临床报告的拷贝数估计值。这些包括6个或更高拷贝的扩增。从报告的CN调用开始,按上述方法进行分箱,并计算感兴趣的染色体臂的臂水平拷贝数估计值。然后将其用作上述分类器的输入,以对FoundationMedicine数据进行预测。

MSK队列包括来自1756名患者的1918个样品,其中分析了1345个ER阳性和HER2阴性样品。为了从MSK数据鉴定整合亚型,使用MSK-IMPACT小组中存在的基因开发了基于分类器的方法。为此,最初的METABRIC队列被用来首先鉴定10个整合亚型。在METABRIC样品中,1363个是ER阳性HER2阴性的,并且这些是用于开发IMPACT-IC分类器的样品。

使用了使用ASCAT生成的METABRIC的拷贝数估计值(P.Van Loo等人,引用同上)。这些拷贝数调用被分组到MSK-IMPACT小组的基因中。计算基因的改变的基因组分数(FGA),并过滤METABRIC数据以包括FGA>0的样品。这导致611个样品用于训练分类器。然后使用分箱方法转换拷贝数估计值,以避免过度拟合至特定拷贝数谱。为此,使用了以下箱:0-6、6-9、9-12、12-15、15-20、20-60和>60。对于对IntClust1预测最重要的基因(如从来自弹性网络回归的特征重要性值确定的),前两个箱降低到0-4、4-9。此外,对于与高风险亚组(即8p11、8q24、11q13和17q23)相关的染色体臂并入了臂水平拷贝数估计值。

尽管所有10个IntClust亚型都用于训练,但最大化了四个高风险类别即IntClust1、IntClust2、IntClust6和IntClust9的准确度。该模型使用基于投票的方法,结合弹性网络回归、随机森林和梯度提升树来推断给定样品的IntClust类型。虽然所有亚型中的总体准确度为68%,但如下所示获得了高风险组的相当高的测试准确度。

所有METABRIC样品的总体训练+测试准确度如图32B所示。IntClust1的精确度相对较低,因为该组的特征在于17q23臂的低水平增益而不是高水平扩增。

对于MSK数据集,使用FACETS生成等位基因特异性拷贝数估计值(参见R.Shen andV.E.Seshan,Nucleic Acids Res.2016;44(16):e131,其公开内容通过引用并入本文)。FACETS结果由Memorial Sloan Kettering Cancer Center提供。进行了拷贝数谱的初始质量控制,并且在存在多种可能拟合的情况下,基于包括纯合缺失率、杂合性丢失率和平衡的染色体区段在内的几个指标选择最佳拟合。尽管用于拷贝数调用的两种方法不同,但它们本质上都是等位基因特异性的,并且在拷贝数估计中对肿瘤纯度是适当的。从FACET调用开始,按上述方法进行分箱,并计算感兴趣的染色体臂的臂水平拷贝数估计值。然后将其用作上述分类器的输入,以对MSK-IMPACT数据进行预测。

在这些患者中使用了3个版本的小组,具有341个基因的IM3、具有410个基因的IM5和具有468个基因的IM6。为了说明这些小组的内容的差异,对一些参数进行了轻微修改以优化具有较少基因的小组版本中的性能。

在作为亚型的1345个样品中,385个属于高风险类别。这与METABRIC中高风险亚型的比例没有显著差异(Fisher确切p值=0.26)。整合集群的整体分布如图32C所示。该结果表明分类器捕获了关键分组。

在来自MSK队列的1344个样品中,728个样品来自原发性肿瘤,其余616个来自转移性病变。在比较原发性和转移性肿瘤的分布时,可以看出转移性样品中高风险整合集群的比例显著高于原发性肿瘤样品中的比例(优势比1.76,Fisher确切p值=3.98e-06),反映了高风险IntClust组确实增加了复发风险的事实。

实施例4:对ER+/HER-乳腺癌的整合亚型分型的性能和临床效用进行基准测试

IntClust分类系统的使用导致在预测远处复发方面的性能比目前市售的诊断测试更好,尤其是在ER+/HER2-乳腺癌中。在本实施例中,整合亚型与Oncotype Dx(GenomicHealth,Redwood City,CA)、Prosigna(NanoString Technologies,Seattle WA)、MammaPrint(Agendia,Irvine,CA)和乳腺癌指数(BCI)(Biotheranostics,Inc.,SanDiego,CA)进行比较。

根据其方案并使用genefu Gene Expression Based Signatures in BreastCancer(D.M.Gendoo等人,http://www.pmgenomics.ca/bhklab/software/genefu)为每个测试生成评分和风险。关于IntClust分类,高风险是分类到IntClust亚组1、2、6或9,低风险是分类到IntClust亚组3、4、7或8。IntClust评分计算为到最近的高风险质心的距离。Prosigna的PAM50用于计算RoR评分,并进一步使用亚组对风险和评分进行分类:高风险分类为LumB,低风险分类为LumA,评分由LumB的概率确定。对于BCI,评分的计算公式为[0.44*(第一PC prolif)+0.4972*(hoxb12/IL17RB比率)–0.09(hoxb12/IL17RB比率)^3]*2+5;如果得分大于6.4则风险高,如果得分小于5则风险低。

METABRIC数据集用于从基因表达数据中生成特征详述于Curtis等人,(2012),引用同上。METABRIC队列的结果关联(包括晚期复发)也如实施例1中详述的那样计算。在本实施例中,数据限于ER+/HER2-样品(n=1398)。晚期复发被定义为5年后发生的复发并且没有手术后复发的任何先前事件(即第5年无复发)。考虑了两种结局:无远处复发生存期和无复发生存期。无远处复发生存期被定义为远处复发的时间。无复发生存期定义为远处复发或疾病特异性死亡的时间。

为了进行结果分析,使用survival软件包(使用survfit函数的模型)和survminer(plt,使用ggsurvplot函数)生成Kaplan Meier图。使用对数秩检验生成P值。使用来自survcomp软件包的hazard.ratio函数计算风险比,其用于测量特征的效应量。使用survcomp软件包中的concordance.index计算一致性指数(C-指数)。曲线下面积用于评估特征在不同时间点的预测性能。来自survAUC软件包的AUC.uno函数的Uno’s AUROC用于计算AUROC。为了更好地比较关于临床协变量的预测的改进,对于每个时间点,使用Cox比例风险模型使用风险或评分以及调整后的临床协变量计算AUC。进行了20X 10倍交叉验证以避免在AUC的过高估计中的过度拟合。

图33中提供了BCI、Prosigna的ROR、Oncotype Dx、Prosigna的PAM50和IntClust分类(IC10)的C-指数评分。计算C-指数评分以预测10年、15年和20年时的晚期复发的能力。可以看出,IntClust分类在每个时间点都优于其他诊断测试。

在图34至37中提供了晚期远处复发的风险比(HR)图。图34提供了ER+/HER2-患者(在一些情况下通过淋巴结状态分层)中晚期远处复发的HR,这些患者在5年时针对不同的多基因特征和相应的风险类别是无复发的。尽管大多数特征的置信区间与等值线(一)重叠,表明它们与晚期远处复发的不同风险没有显著相关性,但高风险相对低风险IntClust分层(IC10)显示显著升高的HR。此外,Oncotype Dx的误差线特别宽。这是因为Oncotype Dx产生的低风险组风险极低并且包括极少数患者的事实。更多的患者被分层为中等风险组(对于其的治疗问题不太清楚)。事实上,在比较不同多基因特征的风险比时,用于将个体分箱为风险类别的任意阈值的使用可产生伪影,使结果的说明复杂化(图34-36)。出于这个原因,优选比较每个特征的评分,如图37所示。在比较C-指数时,这种效应也会得到缓解(图33)。

图35提供了ER+/HER2-、淋巴结阴性患者中晚期远处复发的HR,这些患者在5年时针对不同的多基因特征和相应的风险类别无复发。高风险相对低风险IntClust分层(IC10)在所有特征中表现出最高的HR。

图36提供了ER+/HER2-、淋巴结阳性患者中晚期远处复发的HR,这些患者在5年时针对不同的多基因特征和相应的风险类别无复发。尽管大多数特征的置信区间与等值线(一)重叠,表明它们与晚期远处复发的不同风险没有显著相关性,但高风险相对低风险IntClust分层(IC10)显示显著升高的HR。注意,由于低风险组中的事件数量较少,未显示Oncotype Dx。

图37提供了ER+/HER2-患者中晚期远处复发的HR,这些患者在5年时针对不同的多基因特征没有复发。这里计算了评分以促进每个多基因特征的高风险相对低风险类别之间的比较。尽管大多数特征的置信区间与等值线(一)重叠,表明它们与晚期远处复发的不同风险没有显著相关性,但高风险相对低风险IntClust分层(IC10)显示显著升高的HR,如在所有病例和淋巴结阳性病例中特别明显的(右图)。

实施例5:将整合亚型分型与其他诊断测试相结合

图38中提供了许多诊断测试的晚期远处复发的生存概率曲线,包括IntClust分层(IC10)、Oncotype Dx、PAM50、ROR、BCI、EndoPredict和MammaPrint。为了获得这些曲线,包括ER+/HER2-患者队列的晚期复发数据的METABRIC数据集被用于预测每个诊断测试的风险。METABRIC队列中的患者根据他们的方法被分配到由每个诊断测试确定的风险组。绘制了每个风险组的晚期远处复发生存概率(即超过诊断5年的复发)。

每个诊断测试的特征如下计算:

·IC10:使用来自Curtis等人2012;Rueda等人2019(如上文引用)的IC10分配。分配给IntClust亚组1、2、6和9的样品被认为是高风险的,而分配给IntClust亚组3、4、7和8的样品被认为是低风险。在预测ER+/HER2-疾病复发的风险时,分配到IntClust亚组10和5的样品被丢弃。IC10评分是通过测量属于高风险组的最大后验概率来计算的,其中后验概率是根据pamR软件包的预测函数计算的。

·PAM50:genefu软件包molecular.subtyping函数用于计算METABRIC数据集的PAM50分配。Luminal B/LumB被分配到高风险组,而Luminal A/LumA和Normal样被分配到低风险组。pam50评分被定义为LumB分配的后验概率。

·OncotypeDx:genefu软件包中oncotypedx函数的修改版本用于调用OncotypeDx评分和风险,并利用具有实际oncotypeDX值和可用来重新校准模型的表达数据的外部队列。高于31的值被认为是高风险,低于18的值被认为是低风险,介于两者之间的是中等风险。

·Prosigna ROR(ROR):genefu软件包rorS函数用于计算Prosigna(PAM50)复发风险(ROR)评分,其从1:100缩放。低于29的值被认为是低风险,高于52的被认为是高风险,其余的被认为是中等风险。

·BCI:BCI评分是通过将增殖特征与HOXB13和IL17RB之间的比率(hiratio)相结合来计算的,使得BCI=0.4431*prolif+0.4972*hiratio–0.09hiratio^3)。增殖特征是以下基因的表达的第一主要成分:BUB1B、CENPA、NEK2、RACGAP1和RRM2。BCI通过乘以2并加5来进行缩放。高于6.4的值被认为是高风险,低于5的被认为是低风险,其余的被认为是中等风险。

·Endopredict:genefu软件包中的endopredict函数用于计算Endopredict评分和风险。高于5的值被认为是高风险,其余的被认为是低风险。

·Mammaprint:genefu软件包中的mammaprint函数用于计算Mammaprint评分和风险,其中高于0.3的值被认为是高风险,其余的被认为是低风险。

为了标准化比较,所有评分缩放至均值0,1的标准偏差。

如图38中可见,整合亚型(IC10)在晚期远处复发的生存率方面提供了高风险组和低风险组之间好得多的分层。事实上,IC10是对晚期远处复发的高风险相对低风险进行强有力分层的唯一特征。换言之,使用IC10诊断提供ER+/HER2-患者经历超过5年的复发的风险的更好的指标。MammaPrint提供了第二好的分层,其次是OncotypeDx和ROR,但这些比IC10实现的要温和得多。

在图39至43中提供了许多诊断测试的晚期远处复发的生存概率曲线,包括OncotypeDx、PAM50、ROR、BCI和MammaPrint,以及它们与IC10的组合。为了获得这些曲线,包括ER+/HER2-患者队列的晚期复发数据的METABRIC数据集被用于预测每个诊断测试的风险。METABRIC队列中的患者根据其方法被分配到由每个诊断测试确定的风险组,并与整合亚型IC10相结合。绘制了每个风险组的10年内远处复发和晚期远处复发生存概率(即超过5年的复发)。

如可以在图39至43中看到,将IC10与每个诊断测试相结合改善了患者分层以用于预测晚期远处复发的风险。这些结果提供了整合集群系统与这些基因测试的组合,提高了它们的诊断能力,特别是对于晚期远处复发。

特别感兴趣的是整合集群测试与Oncotype Dx(这是一种流行的诊断测试以确定ER+/HER-乳腺癌的治疗)的组合。该测试检查了21个基因的表达,这些基因用于定制治疗,特别是在患有早期ER+、HER2-乳腺癌的个体中。Oncotype Dx定量了10年内远处复发的可能性,提供了指示复发的高、中或低可能性的评分。值得注意的是,表明中等复发可能性的结果通常可给临床医生带来临床难题,因此不能提供进行哪种治疗的很好的指示。

将IC10分类系统和Oncotype Dx组合产生比单独的Oncotype Dx更好的分层,并且在10年内的远处复发和晚期远处复发中远更清楚地对Oncotype Dx中等风险组进行分层(图39)。与组合的Oncotype Dx中等风险和IntClust低风险组相比,组合的Oncotype Dx中等风险和IntClust高风险组显然远更有可能复发。这一结果表明,将Oncotype Dx与IntClust分类组合可以提供比单独的Oncotype Dx更好的复发风险预测,尤其是对于中等风险组。

将IC10分类与PAM50组合还改善了LumA和LumB组在10年内远处复发和晚期远处复发中的分层(图40)。将IC10分类与ROR组合还改善了10年内远处复发和晚期远处复发中的中等风险组的分层(图41)。将IC10分类与BCI组合还改善了10年内远处复发和晚期远处复发中的中等风险组的分层(图42)。将IC10分类与MammaPrint组合还改善了超过5年的低风险组的分层,特别是对于晚期远处复发(图43)。

实施例6:特定分子亚组的治疗结果

在812名转移性ER阳性乳腺癌患者的前瞻性队列中检查了化学疗法、靶向疗法和内分泌疗法对特定分子亚组内患者的能力。图44提供了对高风险整合集队列(IntClust1、IntClust2、IntClust6和IntClust9)和低风险组(一起平均)施用化疗后无进展生存期的比较。数据表明,与低风险组和其他高风险组相比,IntClust2分子亚组从化疗中极大受益,因为它们的无进展生存概率更高(调整的P=0.045)。

图45提供了在有和没有mTOR拮抗剂治疗的情况下分子亚组IntClust1中的无进展生存率的比较。具体而言,接受mTOR抑制剂依维莫司的患者比未接受mTOR拮抗剂的患者的生存概率要高得多(调整的P值=0.023)。该结果表明,利用mTOR拮抗剂特异性靶向该亚组的致癌驱动因子RPS6KB1能够提高无进展生存概率。

图46提供了在有和没有CDK4/6拮抗剂治疗的情况下分子亚组IntClust2中的无进展生存期的比较。具体而言,接受CDK4/6抑制剂(帕博西尼、瑞博西尼或阿贝西利)的患者比未接受CDK4/6拮抗剂的患者具有显著更高的生存概率(调整的P值=0.016)。该结果表明,利用CDK4/6拮抗剂特异性靶向该亚组的致癌驱动因子CDK4/6能够提高无进展生存概率。

图47提供了对高风险整合集队列(一起平均)和低风险组(一起平均)施用内分泌治疗(氟维司群或他莫昔芬)后的无进展生存期的比较。数据表明,与高风险组相比,低风险组的无进展生存概率更高(调整的P=0.0075)。

图48提供了使用芳香酶抑制剂治疗和使用选择性雌激素受体降解剂(SERD)氟维司群治疗的分子亚组IntClust1、InClust2和IntClust6(一起平均)中的无进展生存期的比较。接受芳香化酶抑制剂的IntClust1、InClust2和IntClust6患者的生存概率高于接受氟维司群的患者(调整的P值=0.004)。这一结果表明,使用芳香酶抑制剂的内分泌治疗能够提高IntClust1、InClust2和IntClust6患者的无进展生存概率。

图49提供了分子亚组IntClust9与芳香酶抑制剂治疗和选择性雌激素受体降解剂(SERD)氟维司群治疗的无进展生存期的比较。接受氟维司群的IntClust9患者与接受芳香酶抑制剂的患者相比具有稍微更高但无关紧要的生存概率(调整的P值=0.361)。该结果表明,与IntClust1、InClust2和IntClust6不同,使用芳香酶抑制剂的内分泌治疗不会增加IntClust9的无进展生存期。因此,应相应调整对各种高危分子亚组的内分泌治疗。

图50提供了使用施用至高风险分子亚组IntClust9的患者和低风险组(一起平均)的芳香酶抑制剂进行内分泌治疗后的无进展生存期的比较。接受芳香酶抑制剂的IntClust9患者的生存概率明显低于接受芳香酶抑制剂的低风险患者(调整的P值=0.0019)。这一结果表明,使用芳香化酶抑制剂的内分泌治疗不会提高IntClust9分子亚组的生存概率,但可能地,代替SERD或PROTAC,ARV-471可能提供更好的结果,因为这些化合物减轻雌激素受体信号传导串扰。

图51提供了使用施用至高风险分子组IntClust9的患者和低风险组的SERD氟维司群的内分泌治疗后无进展生存期的比较(一起平均)。接受氟维司群的IntClust9患者的生存概率与接受氟维司群的低风险患者相似(调整的P值=0.784)。该结果与芳香酶抑制剂的结果相结合,表明使用SERD的内分泌疗法在IntClust9分子组中提供了比使用芳香酶抑制剂的内分泌疗法更好的生存概率。

实施例7:患者来源的类器官

癌症患者来源的类器官(PDO)提供了在临床前环境中测试各种药物对癌细胞的影响的能力。在此实施例中,开发了乳腺癌PDO,每个患者PDO具有属于整合集群分子亚组的分子病理学。向各种开发的PDO施用各种药物化合物以确定它们的反应性。结果鉴定了在临床试验中对属于特定分子亚组的患者进行评估的各种候选化合物。或者,可替代地,PDO可以在临床环境中为患者鉴定特定药物。在这种情况下,从患者提取癌细胞以产生待用各种药物化合物进行治疗的PDO。具有最佳效果的化合物可用于患者的个性化治疗。

为了评估乳腺癌PDO,用TrypLE(Gibco)将类器官消化成单细胞。用100μm过滤器过滤细胞,然后将其以10,000个细胞/孔与10μlβ-巯基乙醇(BME)(Cultrex)接种在黑色透明底部96孔板中,并用100μl乳腺类器官培养基覆盖。细胞生长4天以形成小球体。细胞用6种浓度的不同靶向疗法(包括但不限于capivasertib、ipatasertib、PF4706871、M2698、阿培利司)以及阴性对照(DMSO)和阳性对照(TritonX-100)一式两份处理8天,在第5天更新药物培养基。第8天,在显微镜下手动检查板,以确保阳性对照药物有效杀死类器官,并且阴性对照孔中存在的类器官是健康的。通过将染料以1:10的最终浓度添加到培养基中,然后在37℃下孵育4小时,并使用酶标仪(Molecular Devices)进行发光测量,使用AlamarBlue(Thermofisher)评估细胞活力。IC

分类到IntClust4中的ER阳性PDO的示例性结果在图52A至53B中提供。可以看出,capivasertib、ipatasertib、M22698和阿培利司,而非PF4706871,对于来源于19006患者的PDO,各自提供大约100nM至10μM的IC

等同原则

虽然以上描述包含本发明的许多特定实施方案,但这些不应被解释为对本发明的范围的限制,而是作为其一个实施方案的实例。因此,本发明的范围不应由所示实施方案确定,而应由所附权利要求书及其等同物确定。

技术分类

06120114711718