掌桥专利:专业的专利平台
掌桥专利
首页

基于免疫基因的少突胶质细胞瘤Olig1/Olig2分子分型方法及其应用

文献发布时间:2024-04-18 20:01:23


基于免疫基因的少突胶质细胞瘤Olig1/Olig2分子分型方法及其应用

技术领域

本公开涉及生物医学技术领域,具体地,涉及一种基于免疫基因的少突胶质细胞瘤Olig1/Olig2分子分型方法及其应用。

背景技术

胶质瘤(Glioma)是最常见的成人原发性脑肿瘤,约占成人恶性脑肿瘤的75%。它起源于神经外胚层的胶质或前体细胞,包括星形胶质细胞瘤、少突胶质细胞瘤和室管膜瘤。目前,其治疗手段主要包括手术切除,放疗和化疗。虽然各种先进技术在临床得到广泛应用,胶质瘤患者的预后仍然不尽人意。其中,间变星形细胞瘤5年生存期为30%,10年生存期为20%;而胶质母细胞瘤患者的中位生存期只有15个月,5年存活率仅为5.5%。胶质瘤给社会和患者家庭带来严重经济负担。

少突胶质细胞瘤(Oligodendroglioma),即伴有少突胶质分化的胶质瘤,约占成人弥漫性神经胶质瘤的20%。2016版WHO胶质瘤分型指南将异柠檬酸脱氢酶(IDH)突变和1p/19q共缺失作为少突胶质细胞瘤的分子诊断特征。由于临床,组织学和分子特点的多样性,少突胶质细胞瘤异质性较强,其患者的生存时间跨度从几年至15年以上。同时,除了肿瘤病理级别,临床上并没有能够有效区分少突胶质细胞瘤患者预后的可靠指标,这严重影响这部分患者的诊断和后期治疗选择。近年来,各种癌症的转录组数据已被广泛应用于刻画肿瘤微环境特征以及建立肿瘤免疫亚型,对免疫微环境的精准解析将有助于加速肿瘤免疫治疗特异靶点的开发和设计。基于免疫相关基因的表达谱,弥散低级别胶质瘤以及胶质母细胞瘤可以进一步区分为不同的免疫亚型,各亚型的免疫浸润、基因突变、拷贝数变异以及临床预后表现巨大差异,这将为今后胶质瘤的精准免疫治疗提供理论基础。

因此,针对少突胶质细胞瘤的分子分型工作具有重要临床意义;而基于免疫层面的少突胶质细胞瘤的分子分型也必将为其患者临床诊疗及预后判断提供重要理论依据。

发明内容

本公开的目的是提供一种基于免疫基因的少突胶质细胞瘤Olig1/Olig2分子分型方法及其应用,该方法能够有效区分少突胶质细胞瘤患者的预后,提高该类患者的临床诊疗水平。

为了实现上述目的,第一方面,本公开提供一种用于制备Olig1/Olig2分型预测模型的方法,该方法包括如下步骤:

S1、分别检测n个样本特定基因的表达量;所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

S2、取步骤S1获得的所有样本的特定基因表达量的数据,通过一致性聚类算法将每个少突胶质细胞瘤样本分为Olig1型或Olig2型;

S3、取步骤S1获得的样本的特定基因表达量的数据和步骤S2获得的所有样本的分型结果,通过最邻近收缩中心算法构建以特定基因表达量为输入以分型归属为输出的模型,所述模型为Olig1/Olig2分型预测模型;所述分型归属为某一少突胶质细胞瘤样本为Olig1型或为Olig2型。

可选地,在步骤S1中,所述n个样本为有统计学意义的数量的样本。

第二方面,本公开提供一种用于制备Olig1/Olig2分型预测模型的系统组合,所述系统组合包括:系统甲、系统乙和系统丙;

所述系统甲用于检测n个样本特定基因的表达量,输出每个样本特定基因的表达量的数据;

所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

所述系统乙用于接收系统甲输出的所有样本的特定基因表达量的数据,通过一致性聚类算法将每个样本分为Olig1型或Olig2型;

所述系统丙用于接收系统甲输出的所有样本的基因表达量的数据和系统乙输出的所有样本的分型结果,通过最邻近收缩中心算法构建以特定基因表达量为输入以分型归属概率为输出的模型,所述模型Olig1/Olig2分型预测模型;所述分型归属为某一少突胶质细胞瘤样本为Olig1型或为Olig2型。

第三方面,本公开提供第一方面所述的用于制备Olig1/Olig2分型预测模型的方法在制备用于少突胶质细胞瘤分型或预测少突胶质细胞瘤患者生存期的产品中的应用,所述产品包括:

检测特定基因表达量的物质;存储有Olig1/Olig2分型预测模型的介质;记载有特定方法的载体。

可选地,所述特定方法包括:获得待测患者少突胶质细胞瘤Olig1/Olig2分型的方法A,所述方法A包括如下步骤:

A1、检测待测少突胶质细胞瘤患者特定基因的表达量;

A2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

A3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;或

预测少突胶质细胞瘤患者生存期的方法B,所述方法B包括如下步骤:

B1、检测待测少突胶质细胞瘤患者特定基因的表达量;

B2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

B3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;

B4、根据待测少突胶质细胞瘤患者的分型结果按照如下标准对其进行生存期预后。

第四方面,本公开提供一种用于少突胶质细胞瘤分型或预测少突胶质细胞瘤患者生存期的试剂盒,所述试剂盒包括:

检测特定基因表达量的物质;

所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

存储有Olig1/Olig2分型预测模型的介质;

获得待测患者少突胶质细胞瘤Olig1/Olig2分型的方法A,所述方法A包括如下步骤:

A1、检测待测少突胶质细胞瘤患者特定基因的表达量;

A2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

A3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;或

预测少突胶质细胞瘤患者生存期的方法B,所述方法B包括如下步骤:

B1、检测待测少突胶质细胞瘤患者特定基因的表达量;

B2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

B3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;

B4、根据待测少突胶质细胞瘤患者的分型结果按照如下标准对其进行生存期预后。

本公开从少突胶质细胞瘤免疫微环境角度出发,计算分析免疫生物分子表达谱数据,建立了一种用于少突胶质细胞瘤分型或预测少突胶质细胞瘤患者生存期的方法。针对少突胶质细胞瘤,临床上并没有可靠的分型体系及预后判断指标,本公开方法的建立将为该类患者的临床分类及诊疗提供有效、可靠的分型系统和预后判断模型。使用该系统和模型可快速便捷地完成病人Olig1/Olig2分型及个体化诊断,为患者给出风险分层及个性化治疗的指导。相较于市面上公司的全外显子测序、转录组测序,本公开仅需检测40个免疫生物分子的表达,简单并且费用较低。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1是训练集(TCGA数据库)中使用分型基因进行聚类分析的结果。

图2是使用训练集上述所建立的模型所预测的Olig1及Olig2少突胶质细胞瘤的生存曲线图。

图3是训练集中分析比较Olig1/Olig2分型(Cluster)和病理级别(Grade)预后预测能力的ROC曲线。

图4是验证集(CGGA数据库)使用分子分型模型后聚类分析的结果。

图5是验证集中Olig1及Olig2少突胶质细胞瘤的生存曲线图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。

第一方面,本公开提供一种用于制备Olig1/Olig2分型预测模型的方法,该方法包括如下步骤:

S1、分别检测n个样本特定基因的表达量;所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

S2、取步骤S1获得的所有样本的特定基因表达量的数据,通过一致性聚类算法将每个少突胶质细胞瘤样本分为Olig1型或Olig2型;

S3、取步骤S1获得的样本的特定基因表达量的数据和步骤S2获得的所有样本的分型结果,通过最邻近收缩中心算法构建以特定基因表达量为输入以分型归属为输出的模型,所述模型为Olig1/Olig2分型预测模型;所述分型归属为某一少突胶质细胞瘤样本为Olig1型或为Olig2型。

本公开中,所述Olig1/Olig2分型预测模型的建立使用R语言平台的程序包ConsensusClusterPlus、pamr和clusterRepro完成,使用R语言平台的程序包pamr等构建所述模型的具体方法如下:

(1)导入ConsensusClusterPlus、pamr和clusterRepro等分析所需要的R语言平台的程序包;

(2)从csv、txt等格式的文件中读取训练集样本的基因表达谱;

(3)将表达量数值做log2转化;

(4)将表达数值进行归一化处理;

(5)利用基于层次划分(hc)的一致性聚类算法对训练集样本进行分类;

(6)根据一致性聚类图(Consensus matrix plot)和CDF曲线,选取k=2的分组结果,依据此分组将训练集样本分为两组:Olig1和Olig2;

(7)从csv、txt等格式的文件中读取训练样本的分型标签,将其二分化处理;

(8)使用最邻近收缩中心算法构建分类模型;

(9)利用模型进行100次交叉验证,计算错误发现率(fdr),误分率;

(10)根据交叉验证的结果,寻找最佳阈值,或者使错误率等尽量低的阈值,以及对应的基因集;

(11)从csv、txt等格式的文件中读入验证集样本数据;

(12)将表达量数值做log2转化;

(13)将表达数值进行归一化处理;

(14)使用在训练集中构建的基因集预测验证集中样本的亚型;

(15)利用模型进行500扰动,计算分类的重复性和显著性(p值);

(16)所述基因即为第一方面所述的特定基因。

根据本公开,在步骤S1中,所述n个样本为有统计学意义的数量的样本。本公开中,所述n个样本可以为少突胶质细胞瘤样本。

第二方面,本公开提供一种用于制备Olig1/Olig2分型预测模型的系统组合,所述系统组合包括:系统甲、系统乙和系统丙;

所述系统甲用于检测n个样本特定基因的表达量,输出每个样本特定基因的表达量的数据;

所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

所述系统乙用于接收系统甲输出的所有样本的特定基因表达量的数据,通过一致性聚类算法将每个样本分为Olig1型或Olig2型;

所述系统丙用于接收系统甲输出的所有样本的基因表达量的数据和系统乙输出的所有样本的分型结果,通过最邻近收缩中心算法构建以特定基因表达量为输入以分型归属概率为输出的模型,所述模型Olig1/Olig2分型预测模型;所述分型归属为某一少突胶质细胞瘤样本为Olig1型或为Olig2型。

第三方面,本公开提供第一方面所述的用于制备Olig1/Olig2分型预测模型的方法在制备用于少突胶质细胞瘤分型或预测少突胶质细胞瘤患者生存期的产品中的应用,所述产品包括:

检测特定基因表达量的物质;存储有Olig1/Olig2分型预测模型的介质;记载有特定方法的载体。

根据本公开,所述特定方法包括:获得待测患者少突胶质细胞瘤Olig1/Olig2分型的方法A,所述方法A包括如下步骤:

A1、检测待测少突胶质细胞瘤患者特定基因的表达量;

A2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

A3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;或

预测少突胶质细胞瘤患者生存期的方法B,所述方法B包括如下步骤:

B1、检测待测少突胶质细胞瘤患者特定基因的表达量;

B2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

B3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;

B4、根据待测少突胶质细胞瘤患者的分型结果按照如下标准对其进行生存期预后。

本公开中,Olig1型患者的生存期低于Olig2型患者的生存期。

第四方面,本公开提供一种用于少突胶质细胞瘤分型或预测少突胶质细胞瘤患者生存期的试剂盒,所述试剂盒包括:

检测特定基因表达量的物质;

所述特定基因为40个基因;所述40个基因包括:Olig1基因群Olig2基因群;

所述Olig1基因群由如下14个基因组成:ITGA9、ADCY9、AQP3、PELO、SFXN3、HUNK、MC5R、ISM2、ETS1、LRRC32、ATP5B、CDKN3、F12、COL4A1;

所述Olig2基因群由如下26个基因组成:C11orf75、DAPK2、PSAT1、PDCD6、MBP、PRDX1、CRYBB1、HNMT、HEY1、GPR137B、CD38、HLA-DPB1、GLUD1、CD1D、UBD、KLRF1、HLA-DPA1、MS4A6A、IL32、GPR65、HLA-E、HLA-DQA2、DAPK1、GNG7、SP100、ABCD1;

存储有Olig1/Olig2分型预测模型的介质;

获得待测患者少突胶质细胞瘤Olig1/Olig2分型的方法A,所述方法A包括如下步骤:

A1、检测待测少突胶质细胞瘤患者特定基因的表达量;

A2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

A3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;或

预测少突胶质细胞瘤患者生存期的方法B,所述方法B包括如下步骤:

B1、检测待测少突胶质细胞瘤患者特定基因的表达量;

B2、将待测少突胶质细胞瘤患者特定基因的表达量输入所述Olig1/Olig2分型预测模型,由模型输出待测少突胶质细胞瘤患者的分型归属;

B3、根据待测少突胶质细胞瘤患者的分型归属,获得待测少突胶质细胞瘤患者的分型结果;

B4、根据待测少突胶质细胞瘤患者的分型结果按照如下标准对其进行生存期预后。

本公开中,所述特定基因为如上所述的特定基因;所述Olig1/Olig2分型预测模型按照如上所述的方法获得。

下面通过实施例来进一步说明本公开,但是本公开并不因此而受到任何限制。

实施例1

本实施例用于说明训练集样本Olig1/Olig2分型预测模型的建立及预后判断

病例来源及样本量:具有随访信息的少突胶质细胞瘤患者137例,来源于癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库。患者样本存在染色体1p/19q共缺失,符合纳入标准,采集样本的RNA测序基因表达谱数据。

首先,通过文献检索,获得免疫相关基因集,包括782个基因;基于所述基因的表达谱数据,利用Cox分析其与患者预后的相关性。取p值<0.05,鉴定出84个与患者预后显著相关的基因;选取预后显著相关基因表达数据,利用层次划分(hc)的一致性聚类算法(Consensus Clustering)对训练集样本进行分类,其中MAD取大于0.5。根据一致性聚类图(Consensus matrix plot)和CDF曲线,选取k=2的分组结果,依据此分组将训练集样本分为两组:Olig1和Olig2。

基于一致性聚类的结果,将训练集样本二分类处理;使用最邻近收缩中心算法(pamr)构建分类模型;利用模型进行100次交叉验证,计算错误发现率(fdr),误分率;根据交叉验证的结果,寻找最佳阈值,或者使错误率等尽量低的阈值,以及对应的基因集;该基因集包括:Olig1基因群Olig2基因群;所述Olig1基因群由如下14个基因组成:ITGA9(3680)、ADCY9(115)、AQP3(360)、PELO(53918)、SFXN3(81855)、HUNK(30811)、MC5R(4161)、ISM2(145501)、ETS1(2113)、LRRC32(2615)、ATP5B(11947)、CDKN3(1033)、F12(2161)、COL4A1(1282);所述Olig2基因群由如下26个基因组成:C11orf75(56935)、DAPK2(23604)、PSAT1(29968)、PDCD6(10016)、MBP(4155)、PRDX1(5052)、CRYBB1(1414)、HNMT(3176)、HEY1(23462)、GPR137B(7107)、CD38(952)、HLA-DPB1(3115)、GLUD1(2746)、CD1D(912)、UBD(10537)、KLRF1(51348)、HLA-DPA1(3113)、MS4A6A(64231)、IL32(9235)、GPR65(8477)、HLA-E(3133)、HLA-DQA2(3118)、DAPK1(1612)、GNG7(2788)、SP100(6672)、ABCD1(215)。上述各基因后面括号内的数字为相应基因在NCBI网站上的基因ID。所述40个基因表达如图1所示。利用Kaplan-Meier方法(log-rank)分析训练集中Olig1和Olig2两类患者的预后差异,Olig1患者生存期明显短于Olig2患者(图2)。

实施例2

本实施例用于说明Olig1/Olig2分型与现有少突胶质细胞瘤预后诊断标志物的比较

对于少突胶质瘤的预后诊断目前在临床上标志物缺乏,仅WHO病理分级具有一定的指示作用。所以本发明将Olig1/Olig2分型与病理级别进行比较,分析其对患者预后的预测能力的强弱。利用多因素Cox回归分析比较,纳入患者年龄、性别、病理级别和Olig1/Olig2分型因素。结果发现,Olig1/Olig2分型的风险比率(Hazard ratio)相对于病理级别更高,且具有统计学意义,说明Olig1/Olig2分型的预后预测能力更明显,且预后差异更大(表1)。

表1.Olig1/Olig2分型与患者临床指标的多因素Cox回归分析比较。

随后,利用受试者工作特征曲线(receiver operating characteristic curve,ROC)分析比较Olig1/Olig2分型和病理级别预测患者3年生存期的能力。结果如图3所示,Olig1/Olig2分型(图中用Cluster表示)相比于病理级别具有更高的AUC(Area UnderCurve,线下面积)值,代表Olig1/Olig2分型具有更强的预后预测能力。

实施例3

本实施例用于说明基因Olig1/Olig2分型模型的独立样本预测及分析

病例来源及样本量:具有随访信息的少突胶质细胞瘤患者124例,来源于中国脑胶质瘤基因组图谱(Chinese Glioma Genome Atlas,CGGA)数据库。患者样本存在染色体1p/19q共缺失,符合纳入标准,采集样本的RNA测序基因表达谱数据。

首先,选择Olig1和Olig2基因群准备表达谱数据,依据训练集两类样本核心基因集的平均表达值,采用clusterRepro方法对验证集样本进行分型预测,获得Olig1和Olig2分类归属;利用模型进行500扰动,计算分类的重复性和显著性(p值)。图4显示分类后Olig1和Olig2基因集表达热图。

随后,利用Kaplan-Meier方法(log-rank)分析验证集中Olig1和Olig2两类患者的预后差异,Olig1患者生存期明显短于Olig2患者(图5)。

以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

技术分类

06120116546759