掌桥专利:专业的专利平台
掌桥专利
首页

早发性结直肠癌生物标志物及应用

文献发布时间:2024-04-18 20:02:18


早发性结直肠癌生物标志物及应用

技术领域

本发明涉及肿瘤学技术领域,特别是涉及一种早发性结直肠癌生物标志物及应用。

背景技术

结直肠癌(Colorectal cancer,CRC)是全球范围内常见的消化系统恶性肿瘤,全球癌症统计报告显示结直肠癌的发病率和死亡率在全球恶性肿瘤中分别排名第三和第二,对人类健康构成严重威胁。自20世纪90年代以来,早发性结直肠癌(Early-onset CRC,EOCRC)定义为年龄小于50岁的个体诊断出的结直肠癌)的发病率在许多国家和地区以每年2-4%的速度增长。相较于晚发性结直肠癌(Late-onset CRC,LOCRC),EOCRC病理上肿瘤分期更晚,病理分化程度更差,且远处转移率更高。

EOCRC患者的预后尚存在争议,有研究认为年轻人群中较易发生CRC预后不良;但是随着诊疗模式的改善,EOCRC患者在治疗过程中的获益甚于老年患者,尽管年轻患者在确诊时更倾向于疾病晚期,但通过积极的治疗生存期可能更长。目前,早发性结直肠癌的特殊分子改变及相关的分子机制亟待研究。

随着癌症研究进入精准医学和个性化医学领域,多组学研究方兴未艾。常见的组学包括基因组、表观遗传组、转录组、蛋白质组和代谢组等。通过整合多组学提供不同层次的生物分子信息,有望将其应用于生物标志物识别、高危患者分层及患者预后预测等研究,最终有助于疾病更好的治疗和预防。目前,关于早发性结直肠癌生物标志物的研究有限,相关的专利数量很少且主要使用单一组学数据进行分子标志物的识别。

中国专利申请号201710505098.X、申请日2017-06-28、专利名称为早发性结直肠癌辅助诊断的遗传生物标志物及其应用的专利申请,该发明基于全基因组关联性研究,纳入了遗传风险位点以构建早发性结直肠癌的遗传风险评分模型,仅用于疾病的早期诊断。

有关早发性结直肠癌发明较少的原因可能是晚发性结直肠癌患者占比较大,早发性结直肠癌没有引起研究者们的广泛关注。此外,由于早发性结直肠癌患者病例数相对较少,多数数据集中含有的早发性结直肠癌患者数量较少,很难进行数据分析;临床上收集相关样本的难度也相对较大。

因此,针对现有技术不足,寻找早发性和晚发性结直肠癌的分子特征,探索与早发性结直肠癌相关的生物标志物及其应用以克服现有技术不足甚为必要。

发明内容

本发明的目的在于避免现有技术的不足之处而提供早发性结直肠癌生物标志物及应用。

本发明的目的通过以下技术措施实现。

提供PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045或FR007639中的至少一种生物标志物在用于判断待测目标对象早发性结直肠癌的生物标志物的用途;

PIWIL1的序列为SEQ ID NO:1;

QRFPR的序列为SEQ ID NO:2;

CHST8的序列为SEQ ID NO:3;

GATA4的序列为SEQ ID NO:4;

MS4A1的序列为SEQ ID NO:5;

WNT3A的序列为SEQ ID NO:6;

FR019019的序列为SEQ ID NO:7;

FR064000的序列为SEQ ID NO:8;

FR019089的序列为SEQ ID NO:9;

FR132879的序列为SEQ ID NO:10;

FR132045的序列为SEQ ID NO:11;

FR007639的序列为SEQ ID NO:12。

当PIWIL1在目标对象中的表达降低,判定目标对象属于EOCRC。

当CHST8、GATA4、MS4A1和WNT3A中的至少一项在目标对象中的表达提高,判定目标对象属于EOCRC。

上述用途,FR019089和FR019019在目标对象组织中表达降低,判定目标对象属于EOCRC。

上述用途,过表达FR019089、FR019019抑制RKO和HCT8细胞侵袭迁移,低表达FR019089、FR019019促进细胞侵袭迁移。

进一步的,FR019089表达水平关联EOCRC患者预后,FR019089作为表征EOCRC患者预后的生物标志物用途。

本发明还提供PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045或FR007639中的至少一种生物标志物在用于判断待测目标对象早发性结直肠癌的诊断试剂盒中的用途。

本发明考虑到早发性结直肠癌的特殊分子改变,采用转录组、基因组、DNA甲基化组等多组学数据集分析了早发性结直肠癌和晚发性结直肠癌的基因组分子特征图谱、差异表达基因、差异DNA甲基化位点和差异piRNA。本发明发现12种差异表达的分子(PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045和FR007639)是早发性结直肠癌的生物标志物,其中FR019089在早发性结直肠癌中与患者预后相关。本发明提供一种直肠癌预后的生物标志物piRNA-FR019089。本发明提供的FR019089作为预后生物标志物能够评估早发性结直肠癌预后。

说明书附图

利用附图对本发明作进一步的说明,但附图中的内容不构成对本发明的任何限制。

图1是TCGA数据库中515例CRC患者的临床特征分布;其中(A)为早发性结直肠癌部分、(B)为晚发性结直肠癌部分。

图2是EOCRC和LOCRC患者的基因组拷贝数变异分布图,chr表示染色体。

图3是EOCRC和LOCRC在基因表达水平的差异结果图。

图4是EOCRC和LOCRC在DNA甲基化水平的差异结果图。

图5是DNA甲基化与基因表达的相关性示意图。匹配绘制了来自癌症基因组图谱的甲基化和基因表达数据,以说明所选甲基化相关基因(MRG)的相关性:(A)PIWIL1,(B)CHST8,(C)QRFPR,(D)GATA4,(E)MS4A1和(F)WNT3A。x轴表示转录起始位点(TSS200)上游200bp MRG区域的β值,该值反映了甲基化程度。y轴表示基因表达水平经log2(1+碱基转录本每百万映射)转化后的值。

图6是PIWIL1的表达水平验证分析结果;TCGA(A)、GSE39582(B)、GSE17536(C)和GSE17537(D)数据集中PIWIL1在EOCRC组和LOCRC组之间的差异表达情况。(E,F)PIWIL在EOCRC患者癌组织和癌旁组织(E)及LOCRC患者癌组织和癌旁组织(F)表达情况。

图7是EOCRC患者组织样本和LOCRC患者组织样本中piRNAs差异表达结果。

图8是FR019089、FR019019在18对结直肠癌和癌旁组织中的表达水平结果。

图9.是FR019089、FR019019对结直肠癌细胞增殖的影响结果。CCK8和平板克隆实验检测在RKO细胞中过表达(A)或低表达(B)FR019089、FR019019后,在HCT8细胞中过表达(C)或低表达(D)FR019089、FR019019后细胞增殖情况。

图10是FR019089、FR019019对结直肠癌细胞侵袭迁移能力的影响。在RKO细胞中过表达(A)或低表达(B)FR019089、FR019019后,在HCT8细胞中过表达(C)或低表达(D)FR019089、FR019019后细胞侵袭、迁移情况。

图11是FR019089在CRC患者中的预后分析结果,EOCRC(A-B)和LOCRC(C-D)患者的总生存期(OS)和无进展生存期(PFS)分别采用Kaplan-Meier检验和log-rank方法进行分析。

具体实施方式

结合以下实施例对本发明作进一步说明。

实施例1。

PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045或FR007639中的至少一种生物标志物在用于判断待测目标对象早发性结直肠癌的生物标志物的用途。其中,PIWIL1的序列为SEQ ID NO:1;QRFPR的序列为SEQ IDNO:2;CHST8的序列为SEQ ID NO:3;GATA4的序列为SEQ ID NO:4;MS4A1的序列为SEQ IDNO:5;WNT3A的序列为SEQ ID NO:6;FR019019的序列为SEQ ID NO:7;FR064000的序列为SEQID NO:8;FR019089的序列为SEQ ID NO:9;FR132879的序列为SEQ ID NO:10;FR132045的序列为SEQ ID NO:11;FR007639的序列为SEQ ID NO:12。

实验验证,当PIWIL1在目标对象中的表达降低,判定目标对象属于EOCRC。可以通过对目标对象中PIWIL1的表达,判定是否患EOCRC。当CHST8、GATA4、MS4A1和WNT3A中的至少一项在目标对象中的表达提高,判定目标对象属于EOCRC。

实验验证,FR019089和FR019019在目标对象组织中表达降低,判定目标对象属于EOCRC。过表达FR019089、FR019019抑制RKO和HCT8细胞侵袭迁移,低表达FR019089、FR019019促进细胞侵袭迁移,可基于此判断EOCRC病患情况。

实验还发现,FR019089表达水平关联EOCRC患者预后,FR019089作为表征EOCRC患者预后的生物标志物用途。

本发明考虑到早发性结直肠癌的特殊分子改变,采用转录组、基因组、DNA甲基化组等多组学数据集分析了早发性结直肠癌和晚发性结直肠癌的基因组分子特征图谱、差异表达基因、差异DNA甲基化位点和差异piRNA。本发明发现12种差异表达的分子(PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045和FR007639)是早发性结直肠癌的生物标志物,其中FR019089在早发性结直肠癌中与患者预后相关。本发明提供一种直肠癌预后的生物标志物piRNA-FR019089。本发明提供的FR019089作为预后生物标志物能够评估早发性结直肠癌预后。

基于本发明的上述实验结果,PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045或FR007639中的至少一种生物标志物在用于判断待测目标对象早发性结直肠癌的诊断试剂盒中的用途,可应用于试剂盒领域进行EOCRC的判断。

实施例2。

结合本发明实验过程对本发明的实验过程详细说明。

1.研究对象

1)数据库:从TCGA(The cancer genome atlas,癌症基因组图谱)获得了69例EOCRC和446

例LOCRC患者样本的基因组、转录组及DNA甲基化组数据。从GEO(基因表达综合)数据库下载GSE39582、GSE17536和GSE17537数据,获取CRC患者的基因表达数据。

2)细胞系:RKO和HCT8细胞购于美国模式培养物集存库,分别在含10%胎牛血清的DMEM和RPMI1640培养基、5%二氧化碳、37℃恒温条件下培养。

3)临床样本:收集2023年01月至2023年10月间于浙江大学附属第一人民医院首次确诊EOCRC或LOCRC并行正规手术治疗的患者癌组织和癌旁组织共18对(6例EOCRC,12例LOCRC)。所有样本于-80℃冷冻保存。

2.实验方法

2.1数据库数据处理

1)数据下载与预处理:由IlluminaHiSeq 2000测序技术平台获得CRC组织样本基因表达数据,利用“TCGABiolinks”R程序包从GDC数据中心下载FPKM(FragmentsPerKilobase Million)表达矩阵和临床数据,然后对数据进行质控和整理。

根据临床病理资料(年龄、性别、随访时间、生存情况、肿瘤位置、是否复发、肿瘤分期、T分期、N分期和M分期)的完整程度,本研究共纳入515例CRC组织样本数据(包括69例EOCRC和446例LOCRC数据)。

2)体细胞突变及拷贝数变异分析:基于R软件包“TCGABiolinks”从TCGA下载CRC患者的体细胞基因变异数据、拷贝数变异数据及临床数据,其中,体细胞突变数据通过CHASM算法计算得到。

同时,利用R软件的“Maftools”程序包进行CRC基因变异数据可视化分析,得到样本中基因变异分类分型占比、单核苷酸变异的分类占比、突变基因占比及突变基因之间的相关性等。

根据突变对基因功能的影响,本研究仅分析九种非同义突变,分别为无义突变(Nonsense Mutation)、错义突变(Missense Mutation)、剪切位点(Splice Site)、转录起始位点(Translation Start Site)、移码插入突变(Frame Shift Insertion)、移码缺失突变(Frame ShiftDeletion)、框内插入(In Frame Insertion)、终止密码子突变(NonstopMutation)和框内缺失(In Frame Deletion)。为确定EOCRC和LOCRC中基因组拷贝数变化,利用GISTIC 2.0软件分析CRC组织样本中拷贝数分布及变化特征,并将显著变化的拷贝数区域与mRNAs(messenger RNA)的基因组区域相对应,进而确定mRNAs的基因组区域的拷贝数变化情况。

3)差异表达分析:TCGA数据集RNA-seq数据采用每千个碱基转录(Transcriptsper million,TPM)方法进行对数标准化处理。为了得到完整准确的mRNA表达数据,利用Genecode(GRCh38.p13)数据库对mRNA-seq数据进行基因注释。

为进行标准的差异分析流程,利用“edgeR”R程序包采用拟合线性模型和经验贝叶斯方法,以|log2FoldChange|(差异倍数取对数,log2FC)>1且调整后的P<0.05(P以Benjamini-Hochberg方法调整后值)为标准,筛选差异基因。

4)差异甲基化分析:TCGA数据库提供了CRC组织样本DNA甲基化信息,利用IlluminaInfinium HumanMethylation450 BeadChip(HM450K芯片)技术平台对每个探针的独特序列检测了485577个不同CpG位点的DNA甲基化水平。使用β值(发生甲基化的reads数占全部reads数的比值)表示每个探针的甲基化水平,Δβ值的范围为0到1,分别代表非甲基化和完全甲基化。使用“CHAMP”R程序包识别EOCRC和LOCRC组织样品中的异常CpGs位点,并计算每个探针甲基化水平的平均差异,采用双侧t检验检测差异CpGs位点。差异甲基化位点(Differential Methylation Points,DMP)定义为Δβ>0.1且调整(Benjamini-Hochberg

方法)后的P<0.05。使用“ggVolcano”R程序包绘制火山图以显示差异甲基化的CpG位点。5)基因表达及甲基化相关性分析:利用TCGA数据库中CRC患者的组织样本编码,匹配DNA甲基化450K微阵列测序数据与转录组表达数据,然后利用R软件进一步筛选DNA甲基化驱动基因。DNA甲基化驱动基因是指同时满足:①Wilcoxon等级累积分布检验P<0.05的DNA甲基化差异基因;②经过线性回归分析,基因DNA甲基化水平与表达水平相关性Cor<-0.3且P<0.05的基因。相关性分析使用“ChAMPdata”R程序包实现;Wilcoxon等级累积分布检验则使用“edgeR”R程序包实现。

6)PIWIL1的表达情况及验证分析:对TCGA数据集和三个GEO外部验证数据集中EOCRC和LOCRC患者的表达数据,包括GSE39582(77例EOCRC和476例LOCRC)、GSE17536

(21例EOCRC和156例LOCRC)和GSE17537(9例EOCRC和46例LOCRC),比较两组间PIWIL1的表达情况。为了得到完整准确的mRNA表达数据,对于GEO微阵列数据集,利用“hgu133plus2.db”程序包对微阵列探针表达矩阵重新注释。此外,为验证PIWIL1基因分别在EOCRC和癌旁组织样本及LOCRC和癌旁组织样本中的表达情况,本研究对其表达水平进行差异表达分析,利用“ggplot2”R程序包用小提琴图展示PIWIL1分别在EOCRC、LOCRC和癌旁样本的表达情况,P<0.05被认为有统计学意义。

7)piRNA上游分析流程:为处理来自肿瘤基因图谱TCGA的Illumina HiseqTM2500RNA-seq原始测序数据,根据“Phred质量评分≥20”和“读取长度≥21个核苷酸”的准则对fastq文件进行裁剪,去掉低质量reads、去污染等过程完成数据初步质量控制,得到干净的序列,通过fastp(v0.23.1)获得与piRNAs对应的高质量比对结果。根据piRNA序列的基因组位置,从功能RNA数据库(Functional RNA Database,v3.4)中获取piRNA参考转录组信息。然后利用STAR软件(v2.7.10a)以“hg38”作为参考基因组对结果进行重新排列或重新映射,通过Featurecounts(v2.0.2)和R软件“edgeR”程序包(v3.18.1)计算每百万映射读取数(CPM)来测量piRNAs的丰度。piRNA的筛选标准为:①有唯一基因座位点;②序列在26-32nt之间;③5’端第一个碱基是“T”;④CPM≥1且在10%以上肿瘤样本中表达。

8)piRNAs差异分析:通过TCGA数据库获取44例EOCRC患者和297例LOCRC患者piRNA的高通量测序数据,进行差异表达分析。同样地,以|log2FoldChange|>1且调整后的P<0.05

(P以Benjamini-Hochberg方法调整后值)为标准筛选差异piRNAs。

9)差异表达piRNAs与早发性结直肠癌预后的相关性分析:为进一步探究差异piRNAs表达水平对EOCRC和LOCRC患者预后的潜在影响,结合TCGA数据集中EOCRC和LOCRC患者的临床资料和预后信息,筛选出含有总生存期(Overall survival,OS)和无进展生存期(Progression-Free Survival,PFS)完整信息的44例EOCRC患者和297例LOCRC患者,以piRNAs达水平的中位数设定截断值,分为piRNAs高表达组和低表达组,绘制生存曲线(Kaplan-Meier曲线),采用log-rank检验进行统计学比较。

2.2细胞实验:

1)RNA提取及qRT-PCR实验:对于临床组织样本,将组织从-80℃冰箱取出后,用Trizol法提取组织总RNA;对于细胞系,使用mimic过表达或inhibitor低表达piRNA-FR019089或piRNA-FR019019后,Trizol法提取细胞总RNA。根据商品化试剂盒说明配置逆转录体系,在逆转录酶的催化及FR019089、FR019019特异性引物的引导下合成与FR019089、FR019019互补的cDNA。最后进行实时定量PCR扩增,检测FR019089和FR019019的表达水平。

2)CCK8实验:将经过mimic或inhibitor瞬转的RKO和HCT8细胞以2000个/孔的密度接种于96孔板中,在细胞贴壁后0h、24h、48h和72h的时间点,加入10ul CCK8试剂,37℃孵育1h后,于450nm检测吸光度。

3)细胞迁移实验:在Transwell小室滤膜背面均匀涂布浓度为5μg/mL的纤维连接蛋白20μL,放置在通风处30min,待其晾干;选取状态良好且处于对数生长期的细胞,胰酶消化后用带有血清的培养基终止消化并离心获得细胞沉淀,弃掉上清液,用无血清的RPMI1640培养基重悬细胞并显微计数;在Transwell小室的上室中加入200μL总计含适量细胞的悬液,下室中加入500μL含10%胎牛血清的培养基,于37℃、5%CO2的条件在培养箱中培养;培养适宜时间后,轻柔吸取并丢弃小室内的培养基。用棉签轻擦净上室内的液体,将小室置于4%的多聚甲醛溶液中固定20min,PBS缓冲液清柔洗涤小室外室3次;用0.1%的结晶紫染色15min,PBS清柔洗涤小室外室3次,棉签轻柔擦干小室外室;倒置显微镜观察结果并进行图像采集。

4)细胞侵袭实验:取50μL的Matrigel胶,置于4℃过夜成液态;在Transwell小室滤膜背面均匀涂布浓度为5μg/mL的纤维连接蛋白20μL,放置在通风处30min,待其晾干;用无血清的培养基稀释Matrigel,按照1:5的比例,取50μL稀释后的Matrigel轻柔加入Transwell小室的内室,37℃静置30min进行包被;后续过程同细胞迁移实验。

5)平板克隆形成实验:将经过mimic或inhibitor瞬转的RKO和HCT8细胞以5000个/孔的密度接种于12孔板中,在完全培养基中培养1周。用4%多聚甲醛固定细胞,结晶紫染色计数。

3.结果

1)TCGA数据库中样本纳入情况

本研究共选取了TCGA数据集中69例EOCRC和446例LOCRC癌组织样本,患者的临床信息如诊断年龄、性别、种族、BMI、美国癌症联合会AJCC肿瘤分期、微卫星状态(MSI)等情况如图1所示。图1是TCGA数据库中515例CRC患者的临床特征分布;其中(A)为早发性结直肠癌部分、(B)为晚发性结直肠癌部分。

2)基因组分子特征图谱

在TCGA数据集中,根据EOCRC和LOCRC患者体细胞突变分析结果,APC、TP53、KRAS基因突变频率在EOCRC患者和LOCRC患者中均较高,且LOCRC突变频率高于EOCRC患者。

拷贝数变异分析结果显示,EOCRC患者和OCRC患者拷贝数扩增主要发生在8号染色体、13号染色体、17号染色体和20号染色体。此外,EOCRC患者拷贝数缺失主要发生在6号染色体、15号染色体和19号染色体,而LOCRC患者拷贝数缺失主要发生在15号染色体,如图2所示。图2是EOCRC和LOCRC患者的基因组拷贝数变异分布,chr表示染色体。

3)转录组及DNA甲基化修饰分子特征差异

利用“edgeR”R程序包进行标准的基因表达差异分析,以|log2FC|>1且调整后的P<0.05为阈值,筛选出676个差异基因,包括在EOCRC组织样本中表达显著上调的409个基因和显著下调的267个基因。

从TCGA数据库获取的CRC甲基化450K芯片数据中共有412481个CpGs探针位点,经过预处理步骤后,获得CRC组织样本的DNA甲基化表达谱。DNA甲基化差异分析分析显示,筛选出在EOCRC患者组织样本中显著上调的11个CpGs和230个下调的CpGs位点。火山图显示所有差异表达基因和差异CpG位点的分布情况,如图3、图4所示。

结合转录组和甲基化组的分析结果,共筛选出6个一致性候选分子,分别为PIWIL1、QRFPR、CHST8、GATA4、MS4A1和WNT3A。

基因表达差异分析结果显示,PIWIL1在EOCRC患者中表达显著降低(log2FC=-1.600,P<0.001);QRFPR(log2FC=1.767,P<0.001)、CHST8(log2FC=1.944,P<0.001)、GATA4(log2FC=1.330,P<0.001)、MS4A1(log2FC=1.147,P<0.001)和WNT3A(log2FC=1.023,P<0.001)在EOCRC患者组织样本中表达显著升高。

4)候选基因在表达和DNA甲基化水平的相关性分析

基于以上结果,进一步探究特定基因启动子区域的甲基化水平是否会影响其表达水平。通过甲基化和基因表达关联分析显示,特定基因启动子区域的甲基化水平与其表达水平呈负相关,即特定基因高甲基化水平使其表达降低。

其中,PIWIL1关联最强,且更为显著(r=-0.54,P<0.001),其他5个特征分子相关性分析结果分别为CHST8(r=-0.20,P<0.001)、QRFPR(r=-0.39,P<0.001)、GATA4(r=-0.44,P<0.001)、MS4A1(r=-0.13,P=0.014)和WNT3A(r=-0.10,P=0.065),如图5结果所示,图5是DNA甲基化与基因表达的相关性示意图。匹配绘制了来自癌症基因组图谱的甲基化和基因表达数据,以说明所选甲基化相关基因(MRG)的相关性:(A)PIWIL1,(B)CHST8,(C)QRFPR,(D)GATA4,(E)MS4A1和(F)WNT3A。x轴表示转录起始位点(TSS200)上游200bp MRG区域的β值,该值反映了甲基化程度。y轴表示基因表达水平经log2(1+碱基转录本每百万映射)转化后的值。

下面,详细描述PIWIL1在EOCRC发生发展中的作用。

5)PIWIL1在不同数据集中的表达情况及验证结果

TCGA和GEO两个数据库中差异分析结果均表明,PIWIL1在EOCRC患者中表达水平较LOCRC患者下调。进一步比较PIWIL1分别在EOCRC、LOCRC和癌旁样本的表达情况,

结果显示,与癌旁组织相比,PIWIL1在EOCRC和LOCRC组织样本中均上调(P<0.001),如图6所示。

6)piRNA的筛选及鉴定

此前文献报道,PIWIL1在激活泛素链接酶促进胰腺癌转移以及CRC、胃癌、乳腺癌等癌症中均有调控作用,且其通常与piRNA结合成复合物发挥促癌作用。为了初步筛选EOCRC相关piRNAs,本研究对TCGA中piRNAs的表达谱进行差异分析。

对数据进行归一化处理,去除在EOCRC和LOCRC组织样本中归一化后表达量均小于1的piRNAs,最终共鉴定出253种piRNAs,将差异表达在1倍(|log2FC|>1)及1倍以上的piRNAs定义为差异的piRNAs。

结果显示,共有6个piRNAs在EOCRC样本中的表达显著低于LOCRC组织样本,分别为FR019019、FR064000、FR019089、FR132879、FR132045、FR007639,如图7所示。

7)FR019089和FR019019促进CRC细胞侵袭迁移

我们收集了6例EOCRC、12例LOCRC患者癌组织和相应的癌旁组织。qRT-PCR检测了癌组织和癌旁组织中我们感兴趣的两个piRNA(FR019089和FR019019)的水平,发现FR019089和FR019019均在癌组织中表达显著降低,如图8所示。

评估FR019089和FR019019的生物学功能,采用CCK8和平板克隆实验研究FR019089和FR019019对CRC细胞增殖的影响,采用细胞侵袭和迁移实验评价FR019089对CRC细胞侵袭、迁移能力的影响。

结果显示,在RKO和HCT8细胞中过表达或低表达FR019089或FR019019不影响CRC细胞的增殖能力,如图9所示。

过表达FR019089、FR019019显著抑制了RKO和HCT8细胞侵袭迁移,相反,低表达FR019089、FR019019促进细胞侵袭迁移,如图10所示。

8)差异表达piRNAs与早发性结直肠癌患者预后相关

为进一步了解piRNAs在EOCRC发生、发展中的作用,研究评估了基于上述结果中6个差异表达的piRNAs与EOCRC的预后关联。

其中,FR019089低表达与EOCRC患者较差的总生存期(P=0.017)和无进展生存期(P=0.026)均有较强相关性,而在LOCRC患者中不显著,如图11所示。

因此,FR019089表达水平与EOCRC患者预后具有显著的关联,可作为表征EOCRC患者预后的生物标志物。

本发明考虑到早发性结直肠癌的特殊分子改变,采用转录组、基因组、DNA甲基化组等多组学数据集分析了早发性结直肠癌和晚发性结直肠癌的基因组分子特征图谱、差异表达基因、差异DNA甲基化位点和差异piRNA。本发明发现12种差异表达的分子(PIWIL1、QRFPR、CHST8、GATA4、MS4A1、WNT3A、FR019019、FR064000、FR019089、FR132879、FR132045和FR007639)是早发性结直肠癌的生物标志物,其中FR019089在早发性结直肠癌中与患者预后相关。本发明提供一种直肠癌预后的生物标志物piRNA-FR019089。

应用分子生物学技术检测了候选生物标志物在早发性结直肠癌组织、晚发性结直肠癌组织和相应的癌旁组织中的表达情况,确认了生物信息学发现,即FR019089和FR019019在结直肠癌组织中表达降低。采用湿实验研究了FR019089和FR019019的生物学功能,发现尽管FR019089和FR019019不影响结直肠癌细胞的增殖能力,但是高表达FR019089和FR019019能抑制结直肠癌细胞的侵袭迁移能力,可以解释早发性结直肠癌相较于晚发性结直肠癌,具有病理分化程度更差、且远处转移率更高的特点。

综上,本发明表征了早发性结直肠癌的分子特征图谱,提供的FR019089作为预后生物标志物能够评估早发性结直肠癌预后;此外,FR019089和FR019019对于早发性结直肠癌患者预后和癌症转移复发的评估有潜在的重要意义。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

技术分类

06120116579996