掌桥专利:专业的专利平台
掌桥专利
首页

基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法

文献发布时间:2023-06-19 12:21:13



本申请是中国专利申请201810957432.X的分案申请,原申请的申请日为2018年08月21日,发明名称为基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法。

技术领域

本发明属于基因检测领域,具体地涉及一种基于二代测序平台检测微卫星不稳定性的引物组合物及方法。

背景技术

结直肠癌是常见的消化道恶性肿瘤,在我国常见恶性肿瘤死亡中,结直肠癌患者在男性占第五位,女性占第六位。我国每年结直肠癌新发病例超过25万,死亡病例约14万,新发和死亡病例均占全世界同期结直肠癌病例的20%。因此,降低我国结肠癌的发病率和死亡率是刻不容缓的重大临床科学问题。

结直肠癌根治性切除术后5年生存率24%-58%,平均仅为40%,术后复发和转移是其死亡的重要原因。研究发现,结直肠癌发病机理和基因组不稳定性密切相关,主要包括染色体不稳定性(chromosomal instability,CI)和微卫星不稳定性(microsatelliteinstability,MSI)。

微卫星不稳定性是指由于DNA错配修复(Mismatch Repair,MMR)导致的细胞的超突变状态,出现新的微卫星等位基因现象。它包括在短串联DNA重复序列(微卫星)中插入和缺失突变,以及整个基因组中的核苷酸替换。MSI是一种用于胃肠道、子宫内膜和结直肠肿瘤的诊断标志物。约15%的结直肠癌患者存在MSI现象,其中典型的遗传性非息肉病性结直肠癌(hereditary nonpolyposis colerectal cancer,HNPCC)患者90%以上为MSI型,表明MSI可作为判断HNPCC患者的重要标志物;与MSS(微卫星稳定)型的结肠癌相比,携带有MSI的结直肠癌患者的预后更好,并且二者药物反应也不一样,说明MSI可作为结直肠癌预后的独立预测因子,因此,MSI检测对结直肠癌患者意义重大。最近的研究表明,MSI可能是免疫检查点阻断疗法的一个标记。错配修复是指在含有错配碱基的DNA分子中,使核苷酸序列恢复正常的修复方式。MMR基因家族包含9个基因,主要用来纠正DNA双螺旋上错配的碱基对,还能修复一些因复制打滑而产生的小片段核苷酸插入或缺失。MMR基因突变或启动子甲基化可导致MMR基因功能缺失,从而引起含有错配碱基、核苷酸插入或缺失的DNA分子不能正常修复,最终引起广泛的MSI现象。

在检测癌细胞中MSI时,既可以直接检测MSI序列变化,也可以通过检测MMR基因缺失来确定是否发生MSI。临床上主要利用免疫组织化学(IHC)染色或聚合酶链式反应(PCR)方法检测患者的MSI状态。MMR基因缺陷检测常依赖于免疫组化(蛋白水平),而MSI检测一般依赖于分子手段,PCR检测(DNA水平)。IHC主要是检测MMR蛋白(MLH1、MSH2、MSH6和PMS2)表达情况。免疫组化检测可以直接鉴定出导致MSI发生的MMR缺陷基因,但是约5%-11%的MSI发生并不会出现MMR蛋白的缺陷。某些MMR蛋白错义突变,会损失MMR功能,但能被抗体检测识别,因此这是分子检测的优势。PCR主要是使用特异的引物,对癌组织样本中的微卫星位点进行逐一PCR或多重荧光PCR扩增,扩增产物经过凝胶电泳进行片段大小分析并与正常对照样本相比,查看其序列变化情况,通常对5个位点(NR-27、NR-24、NR-21、BAT-25和BAT-26)进行检测。

MSI可以根据程度被分成高微卫星不稳定性(MSI-H),低卫星不稳定性(MSI-L)或微卫星稳定(MSS)三类。一般来说,若在检测时2个以上的位点是不稳定的,即为MSI-H;如果检测时1个位点不稳定,即为MSI-L;如果没有检测位点是不稳定的,即为MSS。

目前,市场上对于遗传性肿瘤的诊断方法多数停留在单个肿瘤单个或几个位点的检测水平,这些方法都存在不同的缺陷,例如PCR方法有操作繁琐、引物或探针设计复杂、结果不易判读、通量低等问题;而多重PCR检测中,不同引物之间有干扰,在引物的选择及浓度上都有较高的要求;免疫组化的方法特异性和可重复性较低,对样本质量要求高,操作也比较复杂。所以,目前的微卫星不稳定的检测方法难以满足目前检测样本数量大、检测位点多、分布广、检测准确性高等检测要求。因此,急需一种新型的检测手段,不仅在实验上要操作简单、快捷,更要有高灵敏度和可重复性,以满足市场和医疗的需求。

发明内容

为解决现有技术中的至少部分技术问题,本发明提供基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法。本发明提高了诊断的敏感性,且可多样本同时测序,在大样本量筛查的同时极大的降低成本。具体地,本发明包括以下内容。

本发明的第一方面,提供一种引物组合物,其包括上游引物组和下游引物组,且所述上游引物组中的各引物分别包括5’端的UID序列和与PCR通用引物对中的一种引物互补的结合区,所述下游引物组中的各引物分别包括与PCR通用引物对中的另一引物互补的结合区;其中所述上游引物组中的各引物分别特异性结合至下述基因群组中的至少一种基因的突变位点的上游,和所述下游引物组中的各引物分别特异性结合至所述突变位点的下游;所述基因群组包括KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A、DEFB105B、ACVR2A、RNF43、DOCK3、GTF2IP1、LOC100093631、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)。

在某些实施方案中,所述突变位点包括:KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14(dist.=4,175bp)基因的(T)8突变和DDX59(dist.=19,111bp)基因的(T)8突变中的至少一种。

在某些实施方案中,所述上游引物组选自由序列为SEQ ID No:1-18的引物组成的组;所述下游引物组选自由序列为SEQ ID No:19-36的引物组成的组。

本发明的第二方面,提供基于二代测序平台检测微卫星不稳定性的试剂盒,其包括本发明第一方面所述的引物组合物。

本发明的第三方面,提供基于二代测序平台检测微卫星不稳定性的方法,其包括以下步骤:

(1)使组织样本与引物组合物杂交,其中所述引物组合物为根据权利要求1-3任一项所述的引物组合物;

(2)在适于DNA聚合酶或DNA连接酶反应的条件下填平间隙缺口,得到靶标DNA;

(3)以所述靶标DNA为模板利用PCR通用引物对进行扩增,得到测序文库。

在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(4)利用二代测序对所述测序文件进行双端测序,得到样本的双端测序数据。

在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(5)对于所述双端测序数据分别记为R1和R2,并提取R1序列的UID,将提取UID后的文件比对到参考基因组上,过滤比对结果,提取保留的比对结果的双端测序序列,并进行拼接。

在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(6)对于组织样本和对照样本,对每个微卫星位点分别统计拼接后序列的长度以,若所述组织样本和所述对照样本错峰,且中间相差碱基数大于等于2,则认为该位点不稳定。优选地,保留比对结果的条件是唯一比对到参考基因组上,且根据比对位置和随机碱基去重并保留质量最好的一条序列。

在某些实施方案中,基于二代测序平台检测微卫星不稳定性的方法进一步包括(7)判读标准为:不稳定位点数等于0,所述组织样本为MSS型;不稳定位点数等于1,所述组织样本为MSI-L型;不稳定位点数大于等于2,所述组织样本为MSI-H型。

本发明的方法不仅高效、系统、经济简便性,而且最大的优点在于提高了诊断的敏感性。本发明的优势有目标区域小,使测序成本显著降低,测序深度可高达1000×(常规全基因组测序为30×),可发现低频的突变信息。在后基因组时代,对基因组候选区段的重测序需求日益增加,人们对序列的关注超过了少数的SNP,候选区段的范围可能在5Kb-100Kb之间,使用传统PCR法或目标区域杂交捕获测序价格昂贵,通过本发明的方法很好地解决了这一难题。本发明的方法可多样本同时测序,在大样本量筛查的同时极大的降低成本。

具体实施方式

现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。除非另有说明,否则“%”为基于重量的百分数。

本发明所述的“微卫星不稳定”有时也称作“MSI”,是指以DNA微卫星重复序列长度改变为特征的基因突变,是基因组不稳定的一种类型,可导致多种肿瘤,例如结直肠癌。

[引物组合物]

本发明的第一方面,提供一种引物组合物,其用于基于二代测序平台检测微卫星不稳定性。

本发明的引物组合物包括上游引物组和下游引物组,且上游引物组中的各引物分别包括5’端UID序列和与PCR通用引物对中的一种引物互补的结合区,下游引物组中的各引物分别包括与PCR通用引物中的另一引物互补的结合区。其中上游引物组中的各引物分别特异性结合至基因群组中的至少一种基因的突变位点的上游,和下游引物组中的各引物分别特异性结合至所述突变位点的下游。即,上游引物组中的一条引物能够与下游引物组中的一条引物组成引物对,当与对应基因的特异性序列结合后,可扩增该基因中的特定突变位点。优选地,上游引物与其对应的下游引物之间的距离为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。在优选的实施方案中,上游引物组的引物中,5’端UID序列与结合区至少部分重叠或完全重叠。在优选的实施方案中,下游引物组中的引物中,结合区位于所述各引物的3’端。

本发明所述的“UID”是指一种分子标签,是将原始样本进行特异性杂交后,在每一个片段都加上一段特有的标签序列,用来区分同一样本中的不同片段,在后续的数据分析中,就可以通过标签序列来排除由于DNA聚合酶或扩增以及测序过程中所引入的错误。本发明的分子标签通常由50nt以下,更优选25nt以下,还优选20nt以下,进一步优选15nt以下的随机序列(比如NNNNNNN),或者简并碱基(NNNRNYN)组成。另一方面,随机序列有长度优选为3nt以上,更优选5nt以上,进一步优选6nt以上。肿瘤的异质性会限制对驱动突变,特别是低频驱动突变的检测,而本发明引物的设计有利于增加目标区域测序深度,对发现低频突变以及在肿瘤研究与应用中尤为重要。另外,本发明的引物组合物可识别实验过程中引入的错误复制,降低假阳性。

本发明中的基因群组包括KIT、MSH2、BIRC3、SLC7A8、ZNF2、MAP4K3、REEP5、DEFB105A(亦称作DEFB105B)、ACVR2A、RNF43、DOCK3、GTF2IP1(亦称作LOC100093631)、ARHGEF12、NOMO1、PIP5K1A、KIF14(dist.=4,175bp)和DDX59(dist.=19,111bp)中的至少一种。优选地,本发明的基因群组由上述全部基因组成,这样的基因群组对于微卫星不稳定性的检测更加全面,且准确性高。表1示出本发明的基因群组中各基因的信息。

表1. 17个基因及其微卫星位点信息

本发明的上述基因中的突变位点可包括:KIT基因的BAT25突变、MSH2基因的BAT26突变、BIRC3基因的NR27突变、SLC7A8基因的NR21突变、ZNF2基因的NR24突变、MAP4K3基因的MONO-27突变、REEP5基因的D5S346突变、DEFB105A或DEFB105B基因的(A)9突变、ACVR2A基因的(A)8突变、RNF43基因的(C)7突变、DOCK3基因的(C)7突变、GTF2IP1或LOC100093631基因的(T)13突变、ARHGEF12基因的(T)8(C)5突变、NOMO1基因的(A)9突变、PIP5K1A基因的(T)9(C)6突变、KIF14(dist.=4,175bp)基因的(T)8突变和DDX59(dist.=19,111bp)基因的(T)8突变中的至少一种。优选地,本发明的引物组合物对应于上述全部突变位点。在某些实施方案中,本发明的引物组合物的上游引物组选自由序列为SEQ ID No:1-18的引物组成的组。下游引物组选自由序列为SEQ ID No:19-36的引物组成的组。

表2-1.示例性引物组合物的信息

表2-2.示例性引物组合物的信息

注:上游引物或下游引物中,小写字母表示的序列对应于内含子区,大写字母表示的序列对应于外显子区。

需要说明的是,本发明的引物组合物中的各引物均分别能够与特定基因的部分序列特异性结合,但与传统PCR引物用于扩增引物对之间的序列或区域不同,本发明的引物组合物的上游引物中的各引物与其对应的下游引物均结合至同一DNA或基因的单链两侧。例如,对于KIT基因的BAT25突变而言,上游引物组中的上游引物结合于含有BAT25突变位点的单链的上游侧,同时与该上游引物对应的下游引物结合于同一单链(即,含有BAT25突变位点的单链)的下游侧。

本发明的引物组合物的存在形式不特别限定,可以干粉或溶液形式存。本发明引物组合物可以是全部引物组成的混合物形式,也可以是各引物分别单独存在的形式,还可以是两种以上的部分引物组成混合物,以多种不同混合物的形式存在。

[基于二代测序平台检测微卫星不稳定性的试剂盒]

本发明的第二方面,提供一种基于二代测序平台检测微卫星不稳定性的试剂盒(有时也称作“本发明的试剂盒”),基包括本发明第一方面所述的引物组合物。

除了包含本发明第一方面所述的引物组合物外,优选地,本发明的试剂盒还可包含可提供引物延伸和扩增反应的试剂。例如,在一些实施方案中,试剂盒可进一步包括一种或多种下列组分:DNA聚合酶(诸如热稳定性DNA聚合酶等)、聚合酶链式反应缓冲液、逆转录缓冲液和脱氧核苷三磷酸(dNTP)。可选地,试剂盒可包括用于进行杂交分析的试剂。检测试剂可包括核苷酸类似物和/或标记部分,如直接可检测部分如荧光团(荧光染料)或放射性同位素,或者间接可检测部分,如结合对的成员例如生物素,或能够催化非可溶性比色或发光反应(luminometric reaction)的酶。另外,试剂盒可进一步包括包含用于核酸电泳检测用试剂的至少一种容器。此类试剂包括直接检测核酸的那些,如荧光嵌合剂或银染试剂,或用于检测标记的核酸的那些试剂。试剂盒还可包括以政府机构规定的形式与调控制造、使用或销售诊断试剂盒相关的注意事项。试剂盒还可提供有使用、储存和故障排除的详细说明书。试剂盒还可任选地设置在适合的优选用于以高通量设置的机器人操作的装置中。

试剂盒的组分可提供为干粉。当试剂和/或组分提供为干粉时,粉末可通过添加适合的溶剂来恢复原状。预期该溶剂还可设置于另一容器中。容器通常会包括至少一种小瓶、试管、烧瓶、瓶、注射器和/或其它容器手段,其中可选等分地放置溶剂。试剂盒还可包括用于包含无菌、药学上可接受的缓冲液和/或其它溶剂的第二容器手段。

在试剂盒中存在超过一种组分的情况下,该试剂盒还通常会包含另外的组分可单独放置于其中的第二、第三或其它另外的容器。然而,组分的各种组合可包括在容器中。

本发明的试剂盒还可包括保持或维持DNA或RNA的组分,例如抗核酸降解的试剂。此类组分可为例如或无RNase或具有抗RNase的保护的核酸酶。本文所述的任何组合物或试剂可为试剂盒中的组分。

[基于二代测序平台检测微卫星不稳定性的方法]

本发明的第三方面,提供一种基于二代测序平台检测微卫星不稳定性的方法(有时也称作“本发明的方法”),其至少包括下述步骤(1)-(3),可选地还包括步骤(4)-(7)。

本发明的步骤(1)为杂交步骤。具体地,使组织样本与本发明第一方面所述的引物组合物杂交。杂交过程包括使组织样本中的DNA变性,然后梯度降温和恒温杂交。其中DNA变性温度通常为90℃以上至100℃以下,例如,92℃、94℃、96℃、98℃等。变性时间(即,变性温度保持时间)一般为0.5-15分钟,优选1-10分钟,更优选2-5分钟。梯度降温是指由变性温度逐渐降至杂交温度的过程。优选的梯度为0.5-3℃/分钟,更优选1℃/分钟。恒温杂交是指在恒定的杂交温度下进行5-24小时,优选8-15小时的反应过程。

在优选的实施方案中,引物组合物中的上游引物和与其对应的下游引物分别与组织样本中的DNA结合后,两者之间的距离为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。即,需要填平的间隙缺口的大小为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。本发明的组织样本为来自受试者的待测样本,其包含DNA成分。在某些实施方案中,杂交过程在包含引物组合物的杂交混合物溶液中进行。具体地杂交混合物的成分为本领域已知的。可参考例如《分子克隆》等工具书。

本发明的步骤(2)为间隙缺口填平步骤。具体地,在适于DNA聚合酶或DNA连接酶反应的条件下使上游引物与其对应的下游引物之间的间隙缺口填平,从而形成与原单链序列互补且完全体现原序列信息的完整扩增链,即靶标DNA。如上所述,本发明的间隙缺口的大小为100bp-1000kb,优选110bp-500kb,更优选120bp-300kb,进一步优选150bp-250kb。步骤(2)的间隙缺口填平过程为单向扩增的过程。步骤(2)中DNA聚合酶和DNA连接酶可使用本领域已知的酶或商购可得的酶,适于DNA聚合酶或DNA连接酶反应的条件为本领域技术人员根据需要而容易确定的条件。其包括在含DNA聚合酶和DNA连接酶的缓冲液中使杂交后的样本在50-65℃下进行单碱基复制30-120分钟,优选40-100分钟,然后低温(例如4℃)保存。随后35-39℃延伸20-60分钟。最后高温(例如,90-100℃)酶失活。步骤(2)中的缓冲液还可包括dNTPs和NAD等单链延伸所需的物质。

本发明的步骤(3)为PCR扩增步骤。具体地,以所述靶标DNA为模板利用PCR通用引物对进行扩增,得到测序文库。PCR扩增条件为本领域已知的,可根据需要而调整。在某些实施方案中,扩增条件如下:98℃预变性30s,然后进入聚合酶链式反应扩增阶段:98℃变性10s,62℃退火30s,72℃延伸20s,并进行21个循环;最后72℃延伸20s,4℃静置。

本发明的步骤(4)为二代测序步骤。具体地,利用二代测序技术对所述测序文件进行双端测序,得到样本的双端测序数据。二代测序可使用本领域已知的仪器或平台进行。例如,Illumina MiniSeq、NextSeq等。

需要说明的是,本发明的步骤(1)至(3)过程中优选地同时进行阴性对照实验。其中对照样本为受试者血液白细胞DNA。

本发明的步骤(5)-(7)为数据分析和结果判断步骤。在示例性实施方案中,数据分析和结果判断过程如下:

1.测序后,对于每个样本,均得到双端测序数据,分别记为R1和R2。

2.提取R1序列的分子标签,并将提取随机碱基后的文件比对到参考基因组上。

3.过滤比对结果,需要满足以下条件:1)唯一比对到参考基因组上;2)根据比对位置和随机碱基去重并保留质量最好的一条序列。

4.提取保留的比对结果的双端测序序列,并拼接提到的双端测序序列。

5.对于组织样本和对照样本,对每个微卫星位点分别统计拼接后序列的长度。若组织样本和对照样本错峰,且中间相差碱基数大于等于2,则认为该位点不稳定。

6.判读标准:不稳定位点数等于0,该样本为MSS型;不稳定位点数等于1,该样本为MSI-L型;不稳定位点数大于等于2,该样本为MSI-H型。

本发明的方法能有效识别变异,用来分析特定基因组区域内的变异情况、拷贝数变异和微卫星不稳定等。相比于全基因组测序和其他目标区域捕获测序,不仅效率高,而且可以在降低测序成本的同时保证高深度测序。

实施例

1.试剂及样本准备

1.1试剂:AMPure XP Beads,Qubit,80%乙醇(新鲜配置)及low TE或无酶水

1.2准备工作

1.2.1溶解分装20mM NAD+

NAD+粉末性质稳定,初次使用需按下列要求溶解后分装

1)加1000μl无酶水至NAD+粉末中,溶解完全获得20mM NAD+液体。

2)涡旋震荡10秒,若仍有未融物,重复震荡10秒。

3)每管分装20μl 20mM NAD+液体置于冰上。

弃用每日剩余20mM NAD+,不可冻存二次使用。20mM NAD+可于-20℃保存3个月。

1.2.2溶解Oligo Pool(含SEQ ID NO:1-38)

1)加28μl无酶水至Oligo Pool粉末中,涡旋震荡各10秒,溶解完全获得液体。

2)室温静止孵育15分钟至复溶完全。

3)使用200μl移液器加97μlHybInhancer至溶解的Oligo Pool液体中,混合均匀后保存于-15℃至-25℃。单管Oligo Pool/HybInhancer混合液可进行24个反应。

Oligo Pool/HybInhancer混合液可于-15℃至-25℃保存3个月。

1.2.3以Qubit定量为准,起始量为100ng。

1.2.4将酶提前至少10分钟从-20℃取出,置于冰上或4℃冰箱中,使其在使用前达到4℃。

除酶之外的其他试剂,解冻后需短时震荡后离心,置于冰上保存。

2.具体流程

2.1杂交

杂交预定程序如下:

2.1.1混合下列试剂。Buffer H和Oligo Pool/HybInhancer混合液可预混。

混合比例如下:

其中Oligo Pool为可特异识别目标区域的杂交引物池,在杂交过程中,每对上游引物带有10bp UMI,便于后续分析。

2.1.2将上述体系混合均匀后低速离心。置于PCR仪上,热盖开启,运行预设程序。

样品在PCR仪上孵育56℃18小时,在下一步操作前,需一直保持56℃。

2.2 Gap Filling

2.2.1使用无酶水,将dNTPs由10mM五倍稀释至2mM。

2.2.2将下列预混液直接加入至16μl杂交产物中。

弃用当天剩余NAD+和2mM dNTPs。

2.2.3震荡混匀。于PCR仪上运行下列程序:

热盖开启,56℃孵育60分钟,4℃保存。

2.2.4配置下列混合液,直接加入至各反应管中。

2.2.5震荡混匀。热盖开启条件下,于PCR仪上运行下列程序:

2.3 PCR扩增

2.3.1 PCR反应液、所有的酶、冻融试剂和反应混合液需冰上待用。依下表制备PCR预混反应液。震荡混匀,短时离心,置于冰上待用。

2.3.2将PCR预混液和引物加入至0.2ml杂交反应管中(步骤1.2反应物)。

保证引物最后加入反应体系中。

Primer建议使用NEB建库试剂盒配套的PrimerMIX或自制Index primer。

2.3.3上下吹打20次,以便混匀反应液。

2.3.4短时离心后置于冰上。

2.3.5于PCR仪预设以下程序。热盖预热至105℃时,快速转入PCR反应管并运行程序。

2.4文库纯化

2.4.1提前30分钟取出AMPure XP磁珠,震荡混匀,置于室温备用。

2.4.2加65μl重悬过的AMPure XP磁珠至100μl PCR反应液中(若PCR反应液不足100μl,加水补齐)。上下吹打10次以至混匀。

2.4.3室温孵育10分钟。

2.4.4瞬时离心后,置于磁力架上3分钟,分离磁珠与上清。待上清清亮,小心转移上清至新管,弃去磁珠。(注:不可丢弃上清)

2.4.5加30μl重悬后AMPure XP磁珠至上清。混合均匀,室温孵育10分钟。

2.4.6瞬时离心后,置于磁力架上3分钟,分离磁珠与上清。待上清清亮,小心移除上清,保留磁珠。(注:不可丢弃磁珠)

2.4.7加入200μl新鲜配置的80%乙醇至样品管中,样品管需置于磁力架上。置于室温旋转管壁720度,静置至上清清亮,丢弃上清。

2.4.8重复步骤7一次。

2.4.9开盖,室温干燥至磁珠表面哑光色,避免过度干燥。(注:不可过度干燥,会导致低回收率)

2.4.10将反应管从磁力架上移除,加入25μl low TE重悬磁珠。

2.4.11震荡混匀,室温孵育3到5分钟。

2.4.12将反应管置于磁力架上以分离磁珠,孵育至液体清亮。

2.4.13转移上清至新管,标明样本名称、文库类型、建库日期、Index/barcode等信息。

保存文库于-20℃。

3.上机测序

文库构建完成后,对每个文库进行QPCR定量,根据定量结果和每个文库所需的数据量进行混样。将混好的样本池变性稀释到合适的上机浓度。使用illumina公司的MiniSeq测序仪、MiniSeq High Output reagent kit试剂盒、310cycles上机测序,PE*151,Index8bp。可获得用于分析的数据。

4.信息分析

取样本test为例,该样本的癌组织样本记为test_cancer,该样本的正常对照样本记为test_normal,分别进行上机测序,得到双端测序结果test_cancer_1.fq.gz,test_cancer_2.fq.gz,test_normal_1.fq.gz,test_normal_2.fq.gz。测序结果文件格式为FASTQ,FASTQ格式文件每4行表示一条测序序列,其中,第一行为序列标题(read ID),记录测序仪、测序位置、标记样本的index等信息;第二行是DNA模板序列,包含ATGC四种碱基;第三行为“+”符号或者跟第一行一样;第四行为测序质量,与第二行碱基一一对应。

对test_cancer和test_normal分别进行以下步骤,此处以test_cancer为例:1)提取test_cancer_1.fq文件中每个序列的分子标签也就是UMI,并记录下来,结果文件记为test_cancer_1_UMI.fq。对于R2文件的序列不做处理,只记录下R1文件中相对应的UMI,结果文件记为test_cancer_2_UMI.fq。

2)将test_cancer_1_UMI.fq和test_cancer_2_UMI.fq使用比对软件以双端比对模式比对到人类参考基因组hg19.fa上,比对结果为test_cancer.sam。

3)将test_cancer.sam转换为test_cancer.bam格式,然后进行结果排序、选择R1和R2分别唯一比对到参考基因组上的比对结果、根据比对位置和步骤1)中记录的UMI进行比对结果去重,去重后结果记为test_cancer.sort.dedup.bam。如果比对位置和序列的UMI相同,则只保留质量最好的一条结果,这个结果表示一个DNA拷贝。

4)对于每个微卫星位点,根据设计的引物在基因组上的位置,保留满足以下条件的序列:一端序列的比对起始位置和该位点的上游引物在基因组的起始位置相同,且另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置相同。满足条件的序列被认为是成对扩增引物的扩增产物,也就是我们要的目标区域。若一端序列的比对起始位置和该位点的上游引物在基因组的起始位置相同,而另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置不同,则认为符合这种情况的序列不是我们所要求的目标扩增产物。反之,若一端序列的比对起始位置和该位点的上游引物在基因组的起始位置不同,而另一端序列的比对终止位置和该位点的下游引物在基因组的结束位置相同,则认为符合这种情况的序列也不是我们所要求的目标扩增产物。

5)对于每个微卫星位点来说,4)中保留的序列按照序列比对的FLAG分成两个文件分别记为R1_UMI_seq和R2_UMI_seq,将两个文件中序列ID相对应的序列seq1和序列seq2合并为一条序列,合并后的序列储存在Merged_sequence文件中。

对于组织样本和对照样本,分别统计相应的微卫星位点的Merged_sequence文件内的序列长度。若组织样本和对照样本序列长度错峰,且峰值相差碱基数大于等于2,则认为该位点不稳定。

若不稳定位点数等于0,该样本为MSS型;不稳定位点数等于1,该样本为MSI-L型;不稳定位点数大于等于2,该样本为MSI-H型。

5.结果总结

对84例患者,同时进行了传统PCR金标准检测,以验证本发明的检测结果,进行实验稳定性和方法可行性的验证。传统PCR金标准对六个单核苷酸重复位点进行复合扩增,PCR方法最终确定了46例MSI-H样本,1例MSI-L样本和37例MSS样本。与PCR分析结果对比发现,本发明MSI的检测结果与PCR结果完全一致,敏感性100%,特异性100%。

表3. 84例患者使用PCR金标准及本方法判定微卫星不稳定的结果

在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。

序列表

<110> 元码基因科技(苏州)有限公司

<120> 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法

<130> BH2110328

<141> 2021-06-28

<160> 36

<170> SIPOSequenceListing 1.0

<210> 1

<211> 29

<212> DNA

<213> 人工序列()

<400> 1

taccaggtgg caaagggcat ggctttcct 29

<210> 2

<211> 28

<212> DNA

<213> 人工序列()

<400> 2

ttggatattg cagcagtcag agccctta 28

<210> 3

<211> 26

<212> DNA

<213> 人工序列()

<400> 3

tctgtgagat ccaggaaacc atgctt 26

<210> 4

<211> 23

<212> DNA

<213> 人工序列()

<400> 4

ataaaagaga acacgaaaaa tat 23

<210> 5

<211> 28

<212> DNA

<213> 人工序列()

<400> 5

aaaatagctc cctatttagt gaaaaatt 28

<210> 6

<211> 32

<212> DNA

<213> 人工序列()

<400> 6

tcagtgctaa cattctaagg ctatactact ta 32

<210> 7

<211> 22

<212> DNA

<213> 人工序列()

<400> 7

gaatggcatg aacccgggag gc 22

<210> 8

<211> 30

<212> DNA

<213> 人工序列()

<400> 8

atggcatatg aataccagga tagctttata 30

<210> 9

<211> 25

<212> DNA

<213> 人工序列()

<400> 9

cttttcagga cctgtagatg aatac 25

<210> 10

<211> 22

<212> DNA

<213> 人工序列()

<400> 10

ttcctgcatt ttccccgacc aa 22

<210> 11

<211> 27

<212> DNA

<213> 人工序列()

<400> 11

cttggagagt aggaattgcg atgatct 27

<210> 12

<211> 26

<212> DNA

<213> 人工序列()

<400> 12

atcaaggggt gtgcctctgg ggacca 26

<210> 13

<211> 23

<212> DNA

<213> 人工序列()

<400> 13

gttctgttcc ctttgcaggt cat 23

<210> 14

<211> 26

<212> DNA

<213> 人工序列()

<400> 14

actaaagagg tcattcactt gttctc 26

<210> 15

<211> 26

<212> DNA

<213> 人工序列()

<400> 15

atgtcattaa aagatacttt ttaaag 26

<210> 16

<211> 27

<212> DNA

<213> 人工序列()

<400> 16

gtttctttca ccgcagtggg ctaccat 27

<210> 17

<211> 25

<212> DNA

<213> 人工序列()

<400> 17

tacttatgtt tagtttgact caaac 25

<210> 18

<211> 30

<212> DNA

<213> 人工序列()

<400> 18

ccaaagccta gtgagtatcc tatttttaca 30

<210> 19

<211> 29

<212> DNA

<213> 人工序列()

<400> 19

tagagccata gttaaaatgc agaatgtca 29

<210> 20

<211> 32

<212> DNA

<213> 人工序列()

<400> 20

tgaaatatta ttatacttgg attagataac ta 32

<210> 21

<211> 29

<212> DNA

<213> 人工序列()

<400> 21

ggctagtaaa tcataattga gaaattctg 29

<210> 22

<211> 28

<212> DNA

<213> 人工序列()

<400> 22

tagaactgtg ccagcgactc cggctgga 28

<210> 23

<211> 25

<212> DNA

<213> 人工序列()

<400> 23

tctccgctca ctgcaagctc cgcct 25

<210> 24

<211> 31

<212> DNA

<213> 人工序列()

<400> 24

ggcagagtct tgctctgtct cccacgctgg a 31

<210> 25

<211> 24

<212> DNA

<213> 人工序列()

<400> 25

catacagctg atataaaaat ttgt 24

<210> 26

<211> 30

<212> DNA

<213> 人工序列()

<400> 26

ctggttttat cttcaaagcg gagaaacatg 30

<210> 27

<211> 27

<212> DNA

<213> 人工序列()

<400> 27

ctttcttctg caagtatttt ctggaag 27

<210> 28

<211> 24

<212> DNA

<213> 人工序列()

<400> 28

agttaatttt tatgcaacag atca 24

<210> 29

<211> 25

<212> DNA

<213> 人工序列()

<400> 29

aggaaggagt gcttggagaa tgaga 25

<210> 30

<211> 27

<212> DNA

<213> 人工序列()

<400> 30

agatgctgga ggcgtcaact gggccag 27

<210> 31

<211> 23

<212> DNA

<213> 人工序列()

<400> 31

agccctcccc ttcacctctc tcc 23

<210> 32

<211> 26

<212> DNA

<213> 人工序列()

<400> 32

ggctcaagcg atcctcctgc ctaagc 26

<210> 33

<211> 26

<212> DNA

<213> 人工序列()

<400> 33

tacagaacag cctctcaggg gccgca 26

<210> 34

<211> 24

<212> DNA

<213> 工人序列()

<400> 34

caactctaca aaaaatacaa aaat 24

<210> 35

<211> 24

<212> DNA

<213> 人工序列()

<400> 35

ctacttaggt cttggaagct agac 24

<210> 36

<211> 26

<212> DNA

<213> 人工序列()

<400> 36

aatggataat gaaaagcttc aagtca 26

相关技术
  • 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法
  • 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法
技术分类

06120113259795