掌桥专利:专业的专利平台
掌桥专利
首页

基于色氨酸代谢基因的肝癌预后评估方法

文献发布时间:2023-06-19 15:47:50



技术领域

本发明涉及肝癌研究领域,尤其是涉及基于色氨酸代谢基因的肝癌预后评估方法。

背景技术

肝癌是异质性高,死亡率最高的难治性恶性肿瘤,其死亡率居肿瘤死亡率第二位,仅次于肺癌。针对肝癌的治疗手段有很多,但治疗后的五年生存率极低,仅为12%左右,有一部分原因是目前不能通过有效手段评估肝癌治疗手段的预后情况,导致肝癌的临床治疗方案具有一定的盲目性,无法针对肝癌患者进行个性化治疗,也无法有效分析治疗数据,为优化肝癌临床治疗方案提供数据支持。

发明内容

本发明目的在于提供一种基于色氨酸代谢基因的肝癌预后评估方法。

为实现上述目的,本发明采取下述技术方案:

本发明所述的基于色氨酸代谢基因的肝癌预后评估方法,包括以下内容:基于公式(1)计算肝癌患者的风险指数;根据阈值“0”划分RiskScore高低风险组,采用Kaplan-Meier法绘制生存曲线,评估肝癌预后效果;

RiskScore=Σβ

其中,i代表基于色氨酸代谢基因与肝癌预后显著相关的第i个基因,β为基因表达水平的Cox回归系数,Exp为基因的表达水平。

进一步地,所述基于色氨酸代谢基因与肝癌预后显著相关的基因包括CDK1,TROAP,G6PD,MMP1,BAIAP2L2,PTTG1,LCAT,CYP2C9,CFHR3,SLC22A10。

进一步地,评估包括预后特征、临床特征、免疫细胞的相对丰度和浸润程度、免疫逃逸的可能性、免疫检查点基因差异表达、对传统的化疗药物的响应程度、基因代谢通路差异性。

本申请所述方法的具体原理如下:

发明人从TCGA GDC API下载TCGA-LIHC的突变数据和拷贝数变异数据,以及TCGA-LIHC的RNA-Seq数据。针对TCGA-LIHC的RNA-Seq数据去掉没有临床随访信息;没有生存时间;没有Status状态的样本,共筛选出包含360例原发肿瘤样本和50例正常样本。

通过GEO数据库获取GSE14520、GSE76427、HCCDB18数据的表达谱数据,经过筛选分别得到242例、115例、389例肝癌样本。筛选原则为:下载对应芯片平台的注释信息,根据注释信息将探针映射到基因上,去除一个探针匹配到多个基因的探针。当多个探针匹配到一个基因时取中位数作为该基因表达值。

通过MSigDB数据库色氨酸代谢通路“KEGG_TRYPTOPHAN_METABOLISM”获取色氨酸代谢基因。

首先,通过三个方面验证色氨酸代谢基因与肝癌患者的生存预后的相关性。

(1)针对色氨酸代谢相关的40个基因,使用hallmark基因集进行了基因集变异分析比较色氨酸代谢基因突变组和非突变组,发现色氨酸代谢基因突变能导致功能改变,提示其影响肝癌患者的生存预后。

(2)通过原发肝癌患者的色氨酸代谢基因拷贝数变异(英文缩写为:CNV)比较,确定CNV增加的患者比CNV丢失的患者表现出更高的色氨酸代谢基因表达水平,提示色氨酸代谢基因表达水平影响肝癌患者的生存预后。

(3)通过比较原发肿瘤组织和癌旁正常组织中色氨酸代谢基因的mRNA(messengerRNA, 信使RNA)变化,确定两者色氨酸代谢基因表达水平存在显著差异,同样提示色氨酸代谢基因表达水平影响肝癌患者的生存预后。

因此,本申请发明人提供了基于色氨酸代谢基因的肝癌预后评估方法,用于评估肝癌治疗手段的预后情况,为有效分析治疗数据,优化肝癌临床治疗方案和制定个性化治疗方案提供数据支持。

发明人通过单变量Cox回归分析,确定了40个色氨酸代谢基因中有8个基因与肝癌预后相关,并在计算了与肝癌预后相关的色氨酸代谢基因在肝癌中的表达之间的成对相关后发现,这8个不同的色氨酸代谢基因之间也存在着显著相关性。于是,基于这8个与肝癌预后相关的色氨酸代谢基因表达谱的一致聚类,对患者进行分类,根据累计分布函数(英文缩写为:CDF)确定最佳聚类个数为2,记为cluster 1和cluster 2。

然后,发明人通过单因素分析,包括预后特征、临床特征、免疫细胞的相对丰度和浸润程度、免疫逃逸的可能性、免疫检查点基因差异表达、对传统的化疗药物的响应程度、基因代谢通路差异性,进一步确认cluster 2预后较好,cluster 1预后较差。

故,通过分析cluster 1和cluster 2的差异基因,找到739个差异基因,通过survival包的coxph函数进行单因素cox分析,共识别出189个对肝癌预后影响较大的基因,再使用lasso回归对这189个差异表达基因进一步压缩,最终选择了lambda= 0.066时的10个基因作为目标监测基因。以这10个基因构建肝癌预后评估模型。基于公式(1)计算肝癌患者的风险指数;根据阈值“0”划分RiskScore高低风险组,即,将公式(1)计算的RiskScore分值以阈值“0”为分界点,划分为高风险组和低风险组。并采用Kaplan-Meier法绘制生存曲线(英文缩写为KM),可用于评估肝癌预后效果。

本发明优点在于根据色氨酸代谢表型的10个关键基因,构建了肝癌临床预后评估模型,该模型具有较强的鲁棒性,并且独立于临床病理学特征,能够独立评估肝癌治疗手段的预后情况,为有效分析治疗数据,优化肝癌临床治疗方案和制定个性化治疗方案提供数据支持。

附图说明

图1是本发明所述方法绘制的KM曲线与ROC曲线对比图。

图2是本发明所述方法的评估结果与临床分级对比图。

图3是本发明所述方法高/低风险组与免疫细胞评分的对比图。

图4是本发明所述方法高/低风险组部分免疫检查点基因表达差异图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明所述的混凝土大坝裂缝可视化交互展示方法,以TCGA数据集样本中10个基于色氨酸代谢基因、与肝癌预后显著相关的基因表达水平,按照公式(1)分别计算每个样本的风险得分,评估患者为高风险组或低风险组,并绘制生存曲线。

(1)验证本申请所述方法1,3,5年的预后预测评估效率

使用 R 软件包 timeROC 对 RiskScore的评估结果进行 ROC 分析, 分别分析了1,3,5年的预后预测评估效率,对 Riskscore 进行 zscore, 将 zscore 化后 Riskscore大于零的样本划分为高风险组, 小于零的样本低风险组, 并绘制 KM 曲线,表明高风险组或低风险组存在极显著的差异 p < 0.0001(如图1所示),说明本申请所述方法的1,3,5年的预后预测评估效率较高。

(2)对比本申请所述方法评估结果与临床分级的一致性

将TNM等级和Stage临床分级与本申请所述方法计算出的RiskScore评分相比,随着临床等级的提升,RiskScore评分也在增大。临床等级越高的样本,具有更高的RiskScore评分(如图2所示)。说明本申请所述方法与临床判断标准吻合,评估准确。

(3)对比本申请所述方法评估结果与患者实际免疫特征的一致性

如图3所示,22种免疫细胞的相对丰度在本申请所述方法确定的高风险组和低风险组中存在显著差异。采用ESTIMATE评估免疫细胞浸润情况,也表明本申请所述方法确定的低风险组中“ImmuneScore”略高于高风险组,具有较高的免疫细胞浸润。说明本申请所述方法能够准确的反应出肝癌患者预后免疫特征。

(4)对比本申请所述方法评估结果与患者实际免疫治疗效果的一致性

如图4所示,本申请所述方法确定的高风险组和低风险组中部分免疫检查点基因表达存在差异。采用TIDE(http://tide.dfci.harvard.edu/)软件评估免疫治疗,表明本申请所述方法确定的高风险组免疫逃逸的可能性较高,从免疫治疗当中获益的可能性较小。

同时本申请所述方法计算的风险得分与TIDE、IFNG、MDSC、Exclusion评分存在正相关,与Dysfunction存在负相关。表明本申请所述方法能够准确的反应肝癌患者的免疫治疗效果。

(5)对比本申请所述方法评估结果与免疫治疗的关系

本申请所述方法中风险得分高的患者在抗PD-L1队列(IMvigor210队列)中,现出显著的临床益处,并且总生存期显著延长,说明本申请所述方法在临床应用上具有很好的预测性能。

技术分类

06120114587276