掌桥专利:专业的专利平台
掌桥专利
首页

分离的多核苷酸及其在癌症诊断中的应用

文献发布时间:2024-04-18 19:58:26


分离的多核苷酸及其在癌症诊断中的应用

技术领域

本申请属于基因检测技术领域,具体涉及一种分离的多核苷酸及其在癌症诊断中的应用。

背景技术

癌症是导致人类死亡的主要原因,也是阻碍人类寿命进一步提高的重要因素。近年来,癌症的发病率和死亡率正在迅速增长,据统计,2020年,全球约有1.93千万的新发病例,有1千万的死亡病例。就发病率而言,排名前十的癌种依次为乳腺癌、肺癌、结直肠癌、前列腺癌、胃癌、肝癌、食管癌、宫颈癌、甲状腺癌和膀胱癌;就死亡率而言,肺癌、结直肠癌、肝癌、胃癌和乳腺癌是死亡率最高的五种癌症。大规模的癌症筛查和早期诊断可以在尚未出现症状的人群中发现恶性肿瘤或癌前病变,从而实现治疗手段的提早介入和干预,有利于肿瘤的有效治疗或治愈。在日本和韩国的胃癌筛查项目中,早期病变的检出率提高至50%,日本和韩国的胃癌患者其5年生存率分别为64.6%和71.5%,高于未进行筛查的国家。因此,有必要推广简单、便捷的恶性肿瘤筛查和早期诊断方式以改善患者的生存质量和生命周期。

现阶段,恶性肿瘤的诊断主要依赖于影像学检测、内镜学检测及组织学检测等,这些检测手段对医疗设备及医师资源有较高的要求,且部分检测为侵入性操作,不适合在人群中进行大规模的筛查和诊断。血清肿瘤标记物检测是一种非侵入性的检测手段,某些肿瘤标志物如癌胚抗原CEA、糖类抗原CA125、糖类抗原CA19-9、甲胎蛋白AFP等的异常表达常被用于恶性肿瘤的诊断和预后监测,但是对于早期癌症,这些血清肿瘤标记物检测的灵敏度和特异性均不高,诊断价值较低。

因此,急需高灵敏度、高特异性的癌症诊断产品,用于早期癌症筛查和诊断。

发明内容

基于此,本申请提供分离的多核苷酸、重组质粒及试剂盒在癌症诊断中的应用,以解决现有的肿瘤标记物在癌症诊断中灵敏度与特异性低的技术问题。

本申请一方面提供一种分离的多核苷酸,选自如下任一组:

(a):包括SEQ ID NO.3的全长或部分片段,所述部分片段包括至少4个如SEQ IDNO.2所示的碱基序列。

(b):与(a)具有90%以上序列一致性,CpG位点与(a)保持一致,且包括至少4个如SEQ ID NO.2所示的碱基序列。

(c):(a)或(b)经亚硫酸氢盐转化后的多核苷酸。

在其中一个实施例中,所述多核苷酸选自包括至少6个如SEQ ID NO.2所示的碱基序列的所述(a)组或(b)组,或包括至少6个如SEQ ID NO.2所示的碱基序列的(a)组或(b)组经亚硫酸氢盐转化后的多核苷酸。

在其中一个实施例中,包括如SEQ ID NO.4、SEQ ID NO.5、SEQ ID NO.6、SEQ IDNO.18或SEQ ID NO.19中任一者的碱基序列。

在其中一个实施例中,其是从生物样本中提取分离的DNA、或人工合成的DNA。

本申请另一方面提供一种载体,其包含所述的多核苷酸。

本申请另一方面提供一种重组质粒,包括所述的多核苷酸或所述的载体。

本申请另一方面提供所述的多核苷酸、所述的载体或所述的重组质粒在制备癌症检测产品中的应用。

在其中一个实施例中,所述癌症选自肺腺癌、肺鳞癌、乳腺癌、肝细胞癌、宫颈癌、膀胱癌、肾癌、结直肠癌、胃癌、食管癌、喉癌、口腔癌、胰腺癌、卵巢癌、胆管癌、胆囊癌或壶腹癌中的一种或多种。

在其中一个实施例中,所述检测产品能够检测所述多核苷酸的甲基化水平。

本申请另一方面还提供一种用于检测癌症诊断检测的试剂盒,所述试剂盒包括所述的多核苷酸、所述的载体、所述的重组质粒,和/或检测所述的多核苷酸甲基化水平的试剂。

在其中一个实施例中,所述试剂包括引物对和/或检测探针。

在其中一个实施例中,所述引物对包括核苷酸序列如SEQ ID NO.7~SEQ IDNO.10所示的任一上游引物,以及核苷酸序列如SEQ ID NO.11~SEQ ID NO.13所示的任一下游引物;可选地,所述检测探针可特异性识别如SEQ ID NO.2所示的碱基序列。

可选地,所述检测探针的核苷酸序列如SEQ ID NO.14所示。

在其中一个实施例中,所述检测探针具有荧光基团和淬灭基团。

本申请的有益效果包括:

本申请所提供的分离的多核苷酸包括SEQ ID NO.3的全长或部分片段,至少包括4个如SEQ ID NO.2所示的碱基序列,或者与其具有90%以上序列一致性的CpG位点与SEQ IDNO.3保持一致,且至少包括4个如SEQ ID NO.2所示的碱基序列,选取该分离的多核苷酸制备的载体或所述的重组质粒用于肿瘤检测能够有效诊断多种癌症,并且与现有的肿瘤血清标志物(如CEA、AFP等)相比,能提升诊断灵敏度和特异性。

附图说明

为了更清楚地说明本申请实施例中的技术方案、更完整地理解本申请及其有益效果,下面将对实施例描述中所需要使用的附图作简单的介绍。

图1为Illumina 450K芯片探针cg11660826在16种癌组织和癌旁正常组织中的甲基化水平;

图2为上游引物1和下游引物2扩增目标区域的扩增曲线;

图3为上游引物1和下游引物2扩增目标区域的熔解曲线。

具体实施方式

下面结合实施方式和实施例,对本申请作进一步详细的说明。应理解,这些实施方式和实施例仅用于说明本申请而不用于限制本申请的范围,提供这些实施方式和实施例的目的是使对本申请公开内容理解更加透彻全面。除非另有定义,本申请所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。

术语

本申请中,以开放式描述的技术特征中,包括所列举特征组成的封闭式技术方案,也包括包含所列举特征的开放式技术方案。

术语“及/或”或“和/或”均是指包括一个或多个相关的所列项目的任意的和所有的组合。

术语“诊断”包括辅助诊断、复发风险评估、癌变风险和癌变程度的评估、预后判断等方面。

术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个脱氧核糖核苷酸或核糖核苷酸的分子,优选多于三个,并且通常多于十个。确切的大小将取决于许多因素,而所述因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以任何方式产生,包括化学合成、DNA复制、逆转录或其组合。DNA的典型脱氧核糖核苷酸是胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型核糖核苷酸是尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。

术语“DNA甲基化”是指在甲基转移酶的作用下,从甲基供体S-腺苷甲硫氨酸上转移一个甲基基团到胞嘧啶的第5位碳原子上。DNA的甲基化不改变DNA的序列,作为最常见的一种表观遗传修饰方式,其在胚胎发育、基因表达和基因组的稳定性中发挥关键作用,且DNA甲基化的改变通常发生在癌变的早期。鉴于肿瘤细胞基因组具有与正常细胞不同的DNA甲基化图谱,检测肿瘤细胞DNA甲基化模式的改变可以从生物样本中筛查和诊断癌症。然而,需要筛选高灵敏度、高特异性的甲基化分子标志物来区分癌症患者和健康人;为了实现无创或微创诊断,这些甲基化分子标志物需在体液样本如血液、唾液、尿液等中仍然具有良好的诊断性能。

术语“甲基化水平”指的是一段DNA序列中一个或多个CpG二核苷酸中的胞嘧啶是否发生甲基化、或发生甲基化的频率/比例/百分数,既代表定性的概念又代表定量的概念。在实际应用中,可根据实际情况采用不同的检测指标比较DNA甲基化水平。如在一些情况下,可根据样本检测的Ct值进行比较;在一些情况下,可计算样本中基因甲基化的比例,即甲基化分子数/(甲基化分子数+非甲基化分子数)×100,然后再进行比较;在一些情况下,还需要对各个指标进行统计学上的分析整合,得出最终的判定指标。

术语“引物”是指可以用在扩增方法(例如聚合酶链式反应PCR)中,基于与目标基因或其一部分区域相对应的多核苷酸序列来扩增目的序列的寡核苷酸。通常,用于扩增多核苷酸序列的PCR引物中的至少一个对于该多核苷酸序列是序列特异性的。引物的确切长度取决于很多因素,包括温度、引物来源以及所用方法等。例如,对于诊断和预后应用,根据靶序列的复杂度,寡核苷酸引物通常含有至少10、15、20、25或更多个核苷酸,但是也可以含有更少的核苷酸。在本公开内容中,术语“引物”是指能与目标DNA分子的双链杂交或能与目标DNA分子中位于待扩增核苷酸序列两翼的区域杂交的一对引物。

术语“甲基化特异性PCR”是目前研究甲基化最敏感的实验技术之一,能发现最低约50pg DNA的甲基化。单链DNA经亚硫酸氢盐转化后,所有未甲基化的胞嘧啶脱氨转变为尿嘧啶,而CpG位点中甲基化的胞嘧啶保持不变,因此分别设计两对针对甲基化和非甲基化序列的引物,通过PCR扩增即可将甲基化与非甲基化的DNA序列区分开来。在本公开内容中,进行实时定量甲基化特异性PCR时加入甲基化引物,若Ct值满足所述要求(例如在组织样本中Ct≤38),则表明目标序列是甲基化的。

术语“甲基化特异性荧光定量PCR(q-MSP)”是将荧光定量PCR技术和甲基化特异性PCR技术相结合的实验技术。该技术也是基于不同甲基化状态的DNA经亚硫酸氢盐转化后的序列差异来设计合适的引物对,从而将甲基化和未甲基化的序列区分开来,但是q-MSP最终的检测指标为荧光信号,因此,在q-MSP反应系统中,除加入甲基化检测引物以外,还需要加入荧光探针或者荧光染料。与传统的甲基化特异性PCR技术相比,q-MSP检测DNA甲基化水平的灵敏度和特异性更高,更适合检测癌症早期患者DNA中混合的痕量的发生异常甲基化的DNA片段,且该技术不需要凝胶电泳检测,操作更加简便。

术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。在一些实施方式中,本发明所述载体中包含基因工程中常用的调控元件,例如增强子、启动子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,或者多腺苷酸化信号和多聚U序列等)。

术语“TaqMan探针”是能够与DNA模板特异性结合的荧光探针,其5’端含有荧光报告基团,3’端含有荧光淬灭基团。在qPCR反应中,TaqMan探针会与DNA模板序列结合,当探针完整时,5’端的荧光报告基团经光源激发的荧光信号被3’端荧光基团淬灭,此时检测不到荧光信号,随着引物的延伸,Taq酶的5’-3’外切酶活性会切割TaqMan探针,使5’端荧光报告基团与3’端荧光淬灭基团分开,荧光报告基团游离于反应体系中,其发出的荧光信号可被qPCR仪器检测到。因此,在常规的TaqMan qPCR反应过程中,一条TaqMan探针与一个模板DNA分子特异性结合,Taq酶每水解一次探针,即可扩增一条DNA链,并生成一个荧光分子。

术语“肿瘤”是指优选形成肿胀或病变的细胞(称为瘤细胞、肿瘤发生性细胞或肿瘤细胞)的异常生长,“肿瘤细胞”意指通过迅速、不受控制的细胞增殖生长并且在引发新生长停止的刺激之后继续生长的异常细胞。肿瘤表现出部分或完全缺乏结构组织和与正常组织的功能协调,并且通常形成独特的组织团块,其可为良性、恶变前或恶性的,在本文中尤其指恶变前或恶性的。癌症(医学术语:恶性赘生物)是一类疾病,其中一组细胞显示出不受控制的生长(分裂超出正常限度)、入侵(侵入和破坏邻近组织),并且有时转移(通过淋巴或血液扩散到身体中的其他位置)。癌症的这三种恶性特性将其与自限性且不入侵或转移的良性肿瘤区分开。大多数癌症形成肿瘤,但一些血液病例如白血病不形成肿瘤。恶性肿瘤(malignancy)、恶性赘生物和恶性肿瘤(malignant tumor)与癌症基本上是同义的。术语“肿瘤”与“癌症”在本文中可互换使用。

“序列一致性”一般指的是两个多核苷酸或多肽序列在特定比较区上在逐残基比较基础上的一致程度,本文中主要是指两个多核苷酸的一致程度。通过在所述比较区上比较两个经最佳对准的序列,测定两个序列中出现一致核酸碱基(在核酸的情况中,例如A、T、C、G、U或I)的位置数以获得匹配位置数,将匹配位置数除以比较区中位置的总数(即窗尺寸),且结果乘以100获得序列一致性百分比,从而计算出术语“序列一致性”百分比。在一些实施例中,窗尺寸为至少20个核苷酸位置,例如至少25-50个核苷酸。在其它实施例中,窗尺寸大于50个核苷酸。在一实施例中,窗尺寸为多核苷酸(a)的全部长度。有许多方法可以测量两个多核苷酸序列之间的一致性,例如,可以使用采用FASTA算法的计算机程序ALIGN进行比对,或者采用NCBI BLAST中的Align工具进行测量。

近年来,体液样本中特异性甲基化分子标志物的分析成为恶性肿瘤诊断的新方法。在癌症早期或癌前病变期,体液中游离DNA(cf DNA)中的循环肿瘤DNA(ct DNA)的含量极低,为癌症的早期诊断带来极大的困难,然而在癌前病变期及癌症早期确诊疾病,对于肿瘤患者来说意义巨大,早期介入能帮助患者把握治愈或有效治疗的时机,可显著提高患者的存活率。

本申请一方面提供一种分离的多核苷酸,选自如下任一组。

(a):包括SEQ ID NO.3的全长或部分片段,所述部分片段包括至少4个如SEQ IDNO.2所示的碱基序列。

其中,SEQ ID NO.2的核苷酸序列为:CGCGATGTTCGGGGA。

其中,SEQ ID NO.3全长的核苷酸序列为:

SEQ ID NO.3的部分片段是来源于SEQ ID NO.3的一部分,可以是SEQ ID NO.3的任何一部分,只要包括至少4个如SEQ ID NO.2所示的碱基序列。在一些实施例中,可以是包括4个、5个、6个或更多个如SEQ ID NO.2所示的碱基序列。

在一实施例中,SEQ ID NO.3来源于Chr6:149965086-149965322负链(GRCh38.p14为参考)。

可选地,该多核苷酸可以是(b):与(a)具有90%以上序列一致性,CpG位点与(a)保持一致,且包括至少4个如SEQ ID NO.2所示的碱基序列。

由于人基因组的多样性,来源于不同个体的基因序列,在一些位置可能存在碱基的突变、缺失或插入。可以理解,如果CpG位点与(a)保持一致,包括至少4个如SEQ ID NO.2所示的碱基序列,即使有少数碱基发生突变、缺失或插入,只需要仍保持与(a)序列具有90%以上序列一致性,也可实现本发明的目的。在一些实施例中,与(a)序列具有95%以上、96%以上、97%以上、98%以上、或99%以上的序列一致性。

可选地,该多核苷酸可以是(c):(a)或(b)经亚硫酸氢盐转化后的多核苷酸。

在一些实施例中,该多核苷酸可以是CpG二核苷酸位点中的胞嘧啶完全甲基化的、完全未甲基化的或者是部分甲基化的。在一个具体的示例中,所述多核苷酸至少包括6个如SEQ ID NO.2所示的碱基序列的所述(a)组或(b)组,或者是至少包括6个如SEQ ID NO.2所示的碱基序列的(a)组或(b)组经亚硫酸氢盐转化后的多核苷酸。

在其中一个实施例中,包括如SEQ ID NO.4、SEQ ID NO.5、或SEQ ID NO.6中任一者的碱基序列。

其中,SEQ ID NO.4(Chr6:149965086-149965322,负链)的核苷酸序列为:

其中,SEQ ID NO.5(Chr6:149965086-149965322,负链,完全甲基化的DNA序列经亚硫酸氢盐转化)的核苷酸序列为:

其中,SEQ ID NO.6(Chr6:149965086-149965322,负链,完全未甲基化的DNA序列经亚硫酸氢盐转化)的核苷酸序列为:

在其中一个实施例中,其是从生物样本中提取分离的、或者是人工合成的DNA。

本申请另一方面提供一种载体,其包含所述的多核苷酸。本申请另一方面提供一种重组质粒,包括所述的多核苷酸或所述的载体。

本申请另一方面提供所述的多核苷酸、所述的载体或所述的重组质粒在制备癌症检测产品中的应用。以上的多核苷酸,可作为人癌症检测的甲基化标志物,应用于癌症检测产品中。

在一些实施例中,(a)组或(b)组所示的多核苷酸是来源于人的离体样本,其作为癌症检测的分子标志物,检测其CpG位点的甲基化水平,以区分患病的个体和未患病的个体。

在一些实施例中,多核苷酸是(c)组所示的多核苷酸,该多核苷酸是(a)组或(b)组所示的多核苷酸经亚硫酸氢盐转化得到。在一具体实施例中,该多核苷酸的碱基序列与完全甲基化的(a)组或(b)组的多核苷酸经亚硫酸氢盐转化后的序列相同。此时,该多核苷酸可作为甲基化水平检测中的阳性对照样本。

本申请还提供一种用于检测癌症诊断检测的试剂盒,所述试剂盒包括所述的多核苷酸、所述的载体或所述的重组质粒。

癌症诊断的类型包括肺腺癌、肺鳞癌、乳腺癌、肝细胞癌、宫颈癌、膀胱癌、肾癌、结直肠癌、胃癌、食管癌、喉癌、口腔癌、胰腺癌、卵巢癌、胆管癌、胆囊癌或壶腹癌。

在一实施例中,该试剂盒可用于一种或多种癌症的检测。至少,当试剂盒的检测结果提示阳性时,提示个体在患有一种或多种癌症方面具有更高的风险。在一实施例中,试剂盒用于本领域理解的泛癌种的检测。

在一个具体的示例中,所述试剂盒还包括核苷酸序列如SEQ ID NO.7~SEQ IDNO.10所示的任一上游引物,以及核苷酸序列如SEQ ID NO.11~SEQ ID NO.13所示的任一下游引物。上述任一上游引物可以和任一下游引物组成引物对,对目标序列进行扩增。优选地,该试剂盒包括SEQ ID NO.7和SEQ ID.NO.12组成的引物对。

其中,所述试剂盒还包括检测探针,所述检测探针可特异性识别如SEQ ID NO.2所示的碱基重复序列。

在一个具体的示例中,所述检测探针的核苷酸序列如SEQ ID NO.14所示。

其中,SEQ ID NO.14的核苷酸序列为:5’-FAM-TCCCCGAACATCGCG-NFQ-3’

可选地,所述检测探针具有荧光基团和淬灭基团。其中,荧光基团位于探针的5’端,淬灭基团位于探针的3’端。例如,检测探针上连接的荧光基团分别独立的选自FAM、HEX、VIC、CY5、ROX、Texsa Red、JOE及Quasar 705中的一种。当然,在同一个反应体系中有两种以上的探针时,不同探针上连接的荧光基团不同。例如,检测探针上连接的淬灭基团分别独立的选自BHQ、BHQ1及TAMRA中的一种。

可以理解的是,目标区域的检测探针和内参基因的检测探针上连接的荧光基团不限于上述,还可以是其他荧光基团。

进一步可选地,所述试剂盒还包括核酸提取试剂、核酸转化试剂、PCR反应试剂、阳性对照样本和阴性对照样本中的至少一种。

下面将结合实施例对本申请的实施方案进行详细描述。应理解,这些实施例仅用于说明本申请而不用于限制本申请的范围。下列实施例中未注明具体条件的实验方法,优先参考本申请中给出的指引,还可以按照本领域的实验手册或常规条件,还可以按照制造厂商所建议的条件,或者参考本领域已知的实验方法。

下述的具体实施例中,涉及原料组分的量度参数,如无特别说明,可能存在称量精度范围内的细微偏差。涉及温度和时间参数,允许仪器测试精度或操作精度导致的可接受的偏差。

实施例1检测标志物的甲基化引物对及探针性能验证

以Chr6:149965086-149965322区域负链(标志物,SEQ ID NO.4,来源于SEQ IDNO.3的部分区域)完全甲基化的DNA经亚硫酸氢盐转化后的序列作为模板(SEQ ID NO.5),分别设计TaqMan MGB检测探针和上、下游甲基化检测引物对。TaqMan MGB检测探针识别的DNA序列为“CGCGATGTTCGGGGA(SEQ ID NO.2)”所示的重复序列,上、下游甲基化检测引物对的核苷酸序列如表1所示,共设计4条上游检测引物和3条下游检测引物。将上述引物分别人工合成备用。

SEQ ID NO.6为Chr6:149965086-149965322区域负链(标志物)完全未甲基化的DNA经亚硫酸氢盐转化后的序列。人工合成SEQ ID NO.5和SEQ ID NO.6的序列,并将其分别构建至pMD18T载体上,获得含甲基化的目标区域的质粒和含非甲基化的目标区域的质粒,将上述两种质粒稀释至合适的浓度备用。

表1SEQ ID NO.4的甲基化检测引物

从4条上游引物中任意选择一条,从3条下游引物中任意选择一条,一共可以形成12种甲基化引物对的组合。基于SYBR qPCR平台(PCR扩增体系如表2所示,PCR扩增程序如表3所示),使用所述12种甲基化引物对分别扩增含甲基化目标区域的质粒和含非甲基化目标区域的质粒,分析使用每种引物对进行PCR反应时的扩增曲线和熔解曲线,根据每对引物对扩增目标区域的荧光强度和特异性筛选最合适的甲基化检测引物。在筛选甲基化检测引物时,要求该引物可以扩增低浓度的含甲基化目标区域的质粒模板,而不扩增高浓度的含非甲基化目标区域的质粒模板(即不起线)。

如图2所示,当使用上游引物1和下游引物2的组合作为引物对时,其对10

表2SYBR qPCR扩增体系

表3SYBR qPCR扩增程序

表4SYBR qPCR中上游引物1和下游引物2扩增各种质粒模板的Ct值

本申请使用的检测探针为TaqMan MGB探针,其识别的DNA序列为SEQ ID NO.2重复序列,其可与目标区域内6个重复序列特异性结合;该探针的5’端荧光基团为FAM,其3’端为非荧光淬灭基团NFQ,该探针的DNA序列为5’-FAM-TCCCCGAACATCGCG-NFQ-3’(SEQ IDNO.14)。

以含SEQ ID NO.5的质粒作为模板,使用上游引物1、下游引物2和如SEQ ID NO.14所示的检测探针,按照表5所示的配方配置TaqMan qPCR反应体系,并按照表6所示的程序进行qPCR反应,待反应结束后,导出Ct值,如表7所示。

以SEQ ID NO.4作为分子标志物,通过检测待测样本中该目标区域的甲基化水平来诊断受试者是否患有癌症。该甲基化分子标志物中存在6个-SEQ ID NO.2的碱基序列。在使用qPCR法检测目标区域的甲基化水平时,将TaqMan探针识别的区域设计为SEQ ID NO.2的重复序列,则在扩增目标区域的过程中,经Taq酶水解后,TaqMan探针可释放6次荧光信号,从而使qPCR反应的Ct值会提前至少2个循环,相较于仅释放1次荧光信号的TaqMan探针,该方法可以显著提高检测痕量甲基化DNA的灵敏度。

考虑到TaqMan探针的成本因素,为了考察TaqMan qPCR反应过程中,检测探针数量在检测灵敏度上的影响,人工合成了如SEQ ID NO.15、SEQ ID NO.16、SEQ ID NO.17、SEQID NO.18、SEQ ID NO.19所示的DNA序列,并将其分别构建至pMD18T载体上,作为模板备用。

SEQ ID NO.15的序列与SEQ ID NO.5的序列相同,但是其第73位、第127位、第145位、第181位和第199位的胞嘧啶脱氧核糖核苷酸突变为腺嘌呤脱氧核糖核苷酸,突变后的目标区域仅可结合一条TaqMan MGB检测探针。

SEQ ID NO.16的序列与SEQ ID NO.5的序列相同,但是其第127位、第145位、第181位和第199位的胞嘧啶脱氧核糖核苷酸突变为腺嘌呤脱氧核糖核苷酸,突变后的目标区域可结合两条TaqMan MGB检测探针。

SEQ ID NO.17的序列与SEQ ID NO.5的序列相同,但是其第145位、第181位和第199位的胞嘧啶脱氧核糖核苷酸突变为腺嘌呤脱氧核糖核苷酸,突变后的目标区域可结合三条TaqMan MGB检测探针。

SEQ ID NO.18的序列与SEQ ID NO.5的序列相同,但是其第181位和第199位的胞嘧啶脱氧核糖核苷酸突变为腺嘌呤脱氧核糖核苷酸,突变后的目标区域可结合四条TaqManMGB检测探针。

SEQ ID NO.19的序列与SEQ ID NO.5的序列相同,但是其第199位的胞嘧啶脱氧核糖核苷酸突变为腺嘌呤脱氧核糖核苷酸,突变后的目标区域仅结合五条TaqMan MGB检测探针。

随后,分别以含SEQ ID NO.15、SEQ ID NO.16、SEQ ID NO.17、SEQ ID NO.18、SEQID NO.19的质粒作为模板,使用上游引物1、下游引物2和如SEQ ID NO.14所示的检测探针按上面的步骤进行qPCR反应,并导出Ct值,如表7所示。

SEQ ID NO.15:

SEQ ID NO.16:

SEQ ID NO.17:

SEQ ID NO.18:

SEQ ID NO.19:

表5TaqMan qPCR扩增体系

表6TaqMan qPCR扩增程序

表7TaqMan qPCR扩增Ct值

/>

由表7可以看出,当目标区域仅可结合1个如SEQ ID NO.14所示的检测探针时,上游引物1和下游引物2扩增目标区域的平均Ct值为26.74,随着目标区域所结合的检测探针数量的增多,引物对扩增目标区域的Ct值逐渐减小,当目标区域仅结合2个如SEQ ID NO.14所示的检测探针时,上游引物1和下游引物2扩增目标区域的平均Ct值为26.42;当目标区域结合4个检测探针时,扩增目标区域的循环数可提前约1个Ct;当目标区域结合6个如SEQ IDNO.14所示的检测探针时,上游引物1和下游引物2扩增目标区域的平均Ct值为24.48。即当目标区域可结合6个检测探针时,TaqMan qPCR扩增目标区域的循环数可提前2.26个Ct。从以上结果可以看出,本申请所选择的含重复DNA片段的甲基化分子标志物较不含重复DNA片段或含少量重复DNA片段的标志物而言,具有更好的检测效果,其有利于提高体液样本中微量的目标片段的检测灵敏度。

实施例2标志物生物信息学性能验证

通过分析TCGA数据库(https://portal.gdc.cancer.gov)中的甲基化数据,在SEQID NO.4下游发现探针cg11660826在癌旁正常组织中处于低甲基化或未甲基化的状态,而在其它常见癌组织中处于高甲基化的状态,即该探针识别的CG位点(Chr6:149965373)在癌组织中的甲基化水平显著高于癌旁正常组织,如图1所示。图1中的癌症组织来源于肺腺癌、肺鳞癌、乳腺癌、肝细胞癌、宫颈癌、膀胱癌、肾癌、结直肠癌、胃癌、食管癌、头颈鳞癌、胰腺癌、卵巢癌、肝内胆管癌等患者。

以GRCh38.p14为参考基因组,探针cg11660826识别的甲基化的胞嘧啶位点为Chr6:149965373,其识别的DNA序列为:

ACACTCCCCCTGGACTGCGGTGCTAGCAGCAGCTGCAGGAAGCGGACTCG(SEQ ID NO.1)

本申请标志物也呈现常见癌组织中处于高甲基化的状态,在健康组织中处于低甲基化或未甲基化的状态,一种可能的解释是与其下游的cg11660826位点发生了共甲基化现象,是甲基化转移酶的连续工作导致的。

实施例3标志物检测组织样本的性能

收集经病理活检确诊的各种癌症患者的组织样本,所述组织样本为经福尔马林浸泡和石蜡包埋的组织样本。对照样本为健康人的血液白细胞样本。所有样本的收集过程经过伦理委员会的审批,所有志愿者都已签署知情同意书,所有样本均采用匿名化处理。各种癌症样本及健康人血液样本的例数如表8所示。

表8组织样本例数

使用QIAamp DNA FFPE Tissue Kit(Qiagen,货号:56404)提取组织样本中的DNA,具体操作按照试剂盒说明书进行。使用红细胞裂解液(天根,货号:TR122)裂解新鲜的抗凝血,随后使用天根血液/细胞/组织基因组DNA提取试剂盒(货号:DP304)提取健康人血液样本中白细胞基因组DNA,具体操作按照试剂盒说明书进行。将提取好的样本DNA进行亚硫酸氢盐转化,所用核酸转化试剂盒为武汉艾米森生命科技有限公司核酸转化试剂(鄂汉械备20200843),具体实验操作见试剂盒说明书。

以经亚硫酸氢盐转化的样本DNA为模板,使用上游引物1、下游引物2和如SEQ IDNO.14所示的检测探针进行TaqMan qPCR反应,以检测待测样本中目标区域的甲基化水平,同时在反应体系中加入内参基因ACTB的检测引物对和检测探针扩增相应的区域作为质控,qPCR的反应体系如表9所示,qPCR仪器的程序设置如表6所示。

ACTB基因的上游引物序列为:5’-AAGGTGGTTGGGTGGTTGTTTTG-3’(SEQ ID NO.20),其下游引物序列为:5’-AATAACACCCCCACCCTGC-3’(SEQ ID NO.21),其检测探针序列为:5’-GGAGTGGTTTTTGGGTTTG-3’(SEQ ID NO.22),ACTB基因的检测探针其5’端荧光基团为VIC,其3’端荧光淬灭基团为BHQ。

表9TaqMan qPCR扩增体系

此外,在每个PCR反应板中,需设置阳性对照孔和阴性对照孔,阳性对照孔的模板为含SEQ ID NO.5(10

按照上述标准,分析以Chr6:149965086-149965322(SEQ ID NO.4)区域负链作为目标区域,使用q-MSP法检测表8中各种样本的性能。灵敏度为病理结果为癌症阳性的样本中甲基化阳性的比例,特异性为健康人样本中甲基化阴性的比例。具体的结果如表10所示。

表10Chr6:149965086-149965322区域负链诊断组织样本的性能

由表10可以看出,1)Chr6:149965086-149965322区域负链在各种癌组织中的甲基化阳性样本的比例高于其在健康人白细胞中的甲基化阳性样本的比例,即所述目标区域在癌症样本的甲基化水平显著高于其在健康人样本中的甲基化水平;2)所述目标区域诊断17种癌症组织样本的灵敏度及其诊断健康人血液样本的特异性良好,具体地,目标区域诊断肺腺癌、肺鳞癌、宫颈癌、结直肠癌、胃癌、食管癌、口腔癌、胆管癌、胆囊癌、壶腹癌组织样本的灵敏度高达100%,其检测乳腺癌、肝细胞癌、喉癌、胰腺癌组织样本的灵敏度大于等于90%,其检测膀胱癌、肾癌、卵巢癌组织样本的灵敏度均大于60%,其检测健康人白细胞样本的特异性为91.67%,表明通过检测含重复序列的目标区域的甲基化水平诊断各种癌组织样本的性能十分优异,所述目标区域可作为诊断广谱性的恶性肿瘤标记物。

实施例4目标区域检测血浆样本的性能

为实现无创或微创诊断,本实施例选择血浆样本作为体液样本的代表。

具体的实验步骤如下所示:

收集经病理活检确认的患有癌症的患者的血液样本共计852例,每种癌症样本的例数如表11所示,对照组为健康人血液样本,共100例。每份血液样本的体积大于8mL。所有样本的收集过程经过伦理委员会的审批,所有志愿者都签署了知情同意书,所有样本均采用匿名化处理。

表11血液样本例数

获得新鲜的抗凝血样本后,离心分离血浆层,使用武汉艾米森生命科技有限公司的核酸提取试剂盒(血浆血清游离DNA)提取试剂盒(货号:AA16,鄂汉械备20210740号)进行血浆cfDNA提取,具体操作按照试剂盒说明书进行。将提取的样本DNA进行亚硫酸氢盐转化,所用核酸转化试剂盒为武汉艾米森生命科技有限公司核酸转化试剂(鄂汉械备20200843),具体实验操作见试剂盒说明书。

qPCR检测步骤如体系配置、程序设置、对照设置及合格样本的筛选同实施例3。对于合格的血浆样本,若其在目标区域的Ct值≤45,则认为该样本在目标区域为甲基化阳性,该样本为癌症阳性;若待测样本在目标区域的Ct值>45,则认为该样本在目标区域为甲基化阴性,该样本为癌症阴性。按照上述标准,分析q-MSP法诊断表11中各种血浆样本的性能,结果如表12所示。

表12Chr6:149965086-149965322区域负链检测各种血浆样本的性能

从上表可以看出,使用q-MSP法检测Chr6:149965086-149965322区域负链的甲基化水平诊断血浆样本的性能也十分优异。相对于组织样本而言,所述目标区域诊断血浆样本的灵敏度降低,但是其仍然具有区分癌症样本和健康样本的能力,比如所述目标区域诊断肺腺癌、肺鳞癌、乳腺癌、宫颈癌、结直肠癌、食管癌、口腔癌、胆管癌、胆囊癌、壶腹癌患者血浆样本的灵敏度均大于等于80%,其检测肝细胞癌、膀胱癌、胃癌、喉癌、胰腺癌患者血浆样本的灵敏度均大于74%,其检测肾癌和卵巢癌患者血浆样本的灵敏度较低,但仍然大于等于50%,且其检测健康人血浆的特异性高达98.97%。

另外,本实施例提供了目前临床上广泛使用的血清肿瘤标志物诊断癌症的性能数据。癌胚抗原(CEA)是肿瘤细胞膜上的一种富含多糖的蛋白复合物。在健康人血液中,作为一种广谱性肿瘤标志物,CEA在多种恶性肿瘤患者(如结直肠癌、胃癌、乳腺癌、肺癌等)体内均有不同程度的升高。在健康人或良性疾病患者体内,CEA含量通常低于2.5-5ng/mL,而在患者体内,CEA水平会有显著增加。

本申请实施例使用生工生物“人癌胚抗原(CEA)ELISA试剂盒”(货号:D711374)定量检测50例肺腺癌(CEA表达升高多见于肺腺癌)、80例乳腺癌、80例结直肠癌、60例胃癌患者的血样CEA含量,并以5ng/mL为阳性判断值,统计CEA诊断上述恶性肿瘤血液样本的性能,如表13所示。

甲胎蛋白(AFP)是常见的用于肝细胞癌诊断的血清标志物,它是一种糖基化蛋白,正常情况下在妊娠期由胎儿肝脏和卵黄囊产生,且成人肝细胞合成AFP的能力丧失,因而AFP在成人血清中维持较低的浓度。但是,肝癌患者AFP含量升高,借此可以区分肝癌患者和非癌患者。

本申请实施例使用生工生物“人甲胎蛋白(α-FP)ELISA试剂盒”(货号:D711034)对50例肝细胞癌患者和100例健康人血浆样本中的AFP进行定量检测,具体的实验步骤见试剂盒说明书。当以20ng/μL作为截断值时,有24例肝细胞癌患者(24/50)和8例健康人(8/100)血清AFP高于截断值,如表13所示。

糖类抗原血清CA19-9是常用的胰腺癌血清肿瘤标志物,也是美国食品和药品监督管理局批准用于胰腺癌诊断和预后评估的肿瘤标志物。根据2022年版胰腺癌诊疗指南,血清CA19-9>37U/mL为阳性。

本申请实施例使用“CA19-9 Human ELISA Kit”(Thermo Fisher,Cat:EHCA199)定量检测50例胰腺癌患者和100例健康人血清中CA19-9的含量,发现有39例胰腺癌患者(39/50)和8例健康人(8/100)血清CA19-9高于阳性判断值,如表13所示。

CA125是一种高分子粘液型跨膜糖蛋白,目前血清CA125水平被引入临床作为卵巢癌的生物标志物,其临界值为35U/mL。

本申请实施例使用“人糖抗原125(CA125)ELISA试剂盒”定量检测50例卵巢癌患者和100例健康人血清中CA125的含量,发现有33例卵巢癌患者(40/50)和14例健康人(14/100)血清CA125水平高于临界值,如表13所示。

表13常用血清肿瘤标志物检测各种血样样本的性能

结合表12和表13可以看出,以CEA作为肿瘤标志物诊断结直肠癌、胃癌、肺腺癌和乳腺癌的灵敏度和特异性均低于Chr6:149965086-149965322区域负链的诊断性能;AFP诊断肝癌的性能也低于Chr6:149965086-149965322区域负链诊断肝癌血浆样本的灵敏度和特异性;血清肿瘤标志物CA19-9的检测胰腺癌的灵敏度与Chr6:149965086-149965322区域负链相差不大;血清肿瘤标志物CA125检测卵巢癌的灵敏度远高于Chr6:149965086-149965322区域负链,但是其检测特异性低于以Chr6:149965086-149965322区域负链。

上述结果表明,与现有的常用的血清肿瘤标志物相比,通过检测Chr6:149965086-149965322区域负链的甲基化水平诊断某些癌种(如肺癌、乳腺癌、结直肠癌、胃癌、肝癌等)时具有更高的诊断灵敏度和特异性。

综上,Chr6:149965086-149965322区域负链可作为一个广谱性肿瘤标志物来诊断超过15种常见且高发的癌症,其适用于检测血液样本,且检测灵敏度和特异性高,有望在临床诊断中提高癌症的检出率,为患者的早诊早治提供机会。

以上所述实施例仅表达了本申请的几种实施方式,便于具体和详细地理解本申请的技术方案,但并不能因此而理解为对申请专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

相关技术
  • 检测WDR74启动子突变的试剂在制备癌症诊断或癌症预后评估的产品中的应用
  • miRNA在制备诊断或辅助诊断哺乳动物前列腺癌症产品中的应用
技术分类

06120116488603