掌桥专利:专业的专利平台
掌桥专利
首页

基于限制性酶切的CpG岛甲基化富集测序技术

文献发布时间:2023-06-19 19:30:30



技术领域

本发明涉及DNA测序领域。具体地说,本发明涉及基于限制性酶切的CpG岛甲基化富集测序技术。

背景技术

DNA的甲基化修饰(5mC)对正常的基因表达以及细胞功能至关重要,参与调控基因表达、染色质稳定性等最基础的生命活动。基因甲基化多态性是个体表型差异的重要原因,基因的甲基化变异也因此会导致个体表型异常。目前已有大量研究表明相较于正常细胞,肿瘤细胞基因的甲基化特征发生广泛且显著的变化,不同癌种也发现具有癌种特异性的甲基化变异基因。因此,基因的甲基化变异可作为泛癌种的生物标志物。

甲基化肿瘤标志物的发现与研究依赖于对健康组织与癌组织的基因组DNA进行差异甲基化基因分析,目前已有多种成熟的技术能够用于全基因组甲基化检测,包括基于微阵列芯片的Illumina 850K甲基化芯片,基于NGS测序平台的WGBS(Whole-genomebisulfite sequencing,全基因组重亚硫酸盐测序),RRBS(Reduced representationbisulfite sequencing,简化基因组重亚硫酸盐测序)等,基于抗体免疫沉淀的MeDip、MBD-seq技术等;而针对特定位点/区域的甲基化检测,通常使用MSP(Methylation-specificPCR,甲基化特异PCR)、BSP(Bisulfite-Sequencing PCR,甲基化PCR测序)和MSRE-qPCR等方法。

另一方面,作为液体活检关注对象的ctDNA(Plasma Cell-free tumor DNA,ctDNA),同样携带着来自肿瘤组织甲基化信息,对其进行检测,可实现对癌症的筛查、伴随诊断以及预后监测。因ctDNA拷贝数低,降解程度高,对其检测并非易事,微弱的甲基化标志物信号也会掩盖在背景噪音中。早期应用通常依赖于taqman探针qPCR技术,对指定的甲基化位点或单倍型进行检测。近年来,基于NGS的全基因组甲基化测序(WGBS)以及通过探针杂交捕获的目标区域甲基化测序技术也被开发用于组学水平的ctDNA的检测,这类方法能够综合大量位点的甲基化信息,训练数学模型,最大程度提升检测灵敏度与特异性,同时具备组织溯源的特点,因此逐渐成为泛癌种筛查的主流技术。然而在实际运用中,两种方法均存在局限性:WGBS虽可获得全基因组甲基化信息,但因受限于测序成本,测序深度较低,如常见的90G测序量,仅能获得平均20X左右的测序深度,检测准确性与灵敏度较差;基因组中实际可用于指征细胞癌变的甲基化变异区域仅占极小的一部分,全基因组测序无疑是一种性价比较低的策略。基于探针捕获的目标区域甲基化测序,固然弥补了WGBS测序深度不足的缺陷,然而因甲基化复杂的单倍型模式(随着目标区域CpG位点数量的增加,单倍型种类呈指数型上升);实现对目标区域高效、稳定、准确的捕获仍旧存在着诸多技术难题;而额外的探针合成,目标区域杂交捕获步骤,也增加了实验的难度与成本。

因此,本领域需要开发一种简便高效地捕获DNA甲基化序列的方法。

发明内容

本发明的目的就是提供基于限制性酶切的CpG岛甲基化富集测序技术。

在本发明的第一方面,提供了一种DNA甲基化测序文库的构建方法,包括步骤:

S1)提供待测DNA样品;

S2)对待测DNA两端连接接头序列,从而得到带接头的DNA;

S3)对所述带接头的DNA进行AT酶切、非甲基化位点酶切和CT转化,从而得到酶切测序文库。

在另一优选例中,步骤S1)中,所述待测DNA样品包括基因组DNA(gDNA)、或细胞游离DNA(cfDNA)。

在另一优选例中,步骤S1)中,所述待测DNA样品经过片段化处理,优选地被片段化至100-600bp,更优选为200-400bp。

在另一优选例中,步骤S2)中,所述的接头为甲基化接头,其中所有胞嘧啶C均被5-甲基化修饰。

在另一优选例中,所述的接头不包含AATT或TTAA序列。

在另一优选例中,所述的接头包含第一链和第二链,所述的第一链3'端与第二链的5'端部分碱基互补,两条链退火后,第一链单个A碱基突出。

在另一优选例中,所述的第一链5'端经磷酸基团修饰。

在另一优选例中,所述的第一链核苷酸序列如SEQ ID NO.1所示,所述的第二链核苷酸序列如SEQ ID NO.2所示。

在另一优选例中,所述的步骤S2)中,在连接接头前还包括末端修复、加A尾的步骤。

在另一优选例中,步骤S2)中,连接甲基化接头后,还包括分选和/或纯化步骤。

在另一优选例中,所述的分选步骤包括分选DNA插入片段长度,优选长度为200-400bp,更优选为250-350bp。

在另一优选例中,所述纯化步骤包括纯化回收双端连接甲基化接头的DNA片段。

在另一优选例中,所述的分选和/或纯化包括磁珠分选和/或纯化。

在另一优选例中,步骤S3)中,对所述的DNA进行一轮或多轮AT酶切。

在另一优选例中,步骤S3)中,所述AT酶切在CT转化前和/或CT转化后单独进行;或在CT转化前和CT转化后均进行。

在另一优选例中,所述的非甲基化位点酶切在CT转化前进行。

在另一优选例中,所述的非甲基化位点酶切在AT酶切之前进行、或在AT酶切之后进行、或在同一反应体系中与AT酶切同时进行。

在另一优选例中,步骤S3)中,还包括步骤:PCR扩增。

在另一优选例中,步骤S3)包括选自下组的步骤:

i)a.对DNA进行非甲基化位点酶切和AT酶切,

b.对经酶切的DNA进行CT转化,随后进行第一轮PCR扩增,从而得到酶切测序文库;或

ii)a.对DNA进行非甲基化位点酶切,

b.对经酶切的DNA进行CT转化,随后进行第一轮PCR扩增,

c.对经转化的DNA进行AT酶切,随后进行第二轮PCR扩增,从而得到酶切测序文库;或

iii)a.对DNA进行非甲基化位点酶切和第一轮AT酶切,

b.对经酶切的DNA进行CT转化,随后进行第一轮PCR扩增,

c.对经转化的DNA进行AT酶切,随后进行第二轮PCR扩增,从而得到酶切测序文库。

在另一优选例中,步骤S3)中,所述AT酶切使用能够识别切割AT富有序列DNA的酶进行。

在另一优选例中,所述的酶选自下组:限制性内切酶、CRISPR基因编辑酶、ZFN、TALEN、巨型核酸酶、或其组合。

在另一优选例中,所述AT酶切使用的酶选自下组:MluCI、MseI、SspI、PsiI、AseI、DraI、PacI、AnaI、AcsI、AgsI、ApoI、AflII、BfrI、BspTI、BstAFI、EcoRI、EcoRV、FaiI、FauNDI、HpaI、KspAI、MfeI、MspCI、MssI、MunI、NdeI、PmeI、PshBI、SaqAI、SmiI、Sse9I、TasI、Tru1I、Tru9I、TspDTI、Tsp509I、VspI、XapI、HindIII、NsiI、NspV、PagI、PciI、SfuI、SnaBI、BfrBI、ClaI、ScaI、SwaI、或其组合。

在另一优选例中,所述的AT酶切使用酶切识别位点仅包含A和T碱基的限制性内切酶进行,优选地使用MseI单酶切或MluCI单酶切,更优选地使用MseI和MluCI双酶切。

在另一优选例中,步骤S3)中,所述的CT转化包括亚硫酸盐化学转化或APOBEC脱氨酶转化,优选APOBEC脱氨酶转化。

在另一优选例中,所述的CT转化包括步骤:

C1)TET2酶氧化保护5mC碱基;

C2)使用APOBEC脱氨酶将未保护的C碱基(未甲基化修饰的C碱基)全部转化为U碱基。

在另一优选例中,所述的CT转化包括步骤:

直接使用亚硫酸盐将C碱基(未甲基化修饰的C碱基)全部转化为U碱基。

在另一优选例中,步骤S3)中,所述的非甲基化位点酶切使用5mC甲基化敏感型限制性内切酶或内切酶组合进行,优选地使用HpaII单酶切,BstUI单酶切,FspI单酶切、或其组合多酶切。

在另一优选例中,步骤S3)中,所述的第一轮PCR扩增使用能够扩增包含尿嘧啶(U碱基)模板的高保真DNA扩增酶进行。

在另一优选例中,所述的第一轮PCR扩增使用正向引物核苷酸序列如SEQ ID NO.3所示,反向引物核苷酸序列如SEQ ID NO.4所示。

在另一优选例中,所述的第二次PCR扩增使用正向引物核苷酸序列如SEQ ID NO.5所示,反向引物核苷酸序列如SEQ ID NO.6所示。

在另一优选例中,每一个AT酶切和/或非甲基化位点酶切步骤后,均可选地包括分选和/或纯化步骤。

在本发明的第二方面,提供了一种DNA甲基化测序文库,所述甲基化测序文库是用如本发明第一方面所述的方法构建的。

在本发明的第三方面,提供了一种检测样品中DNA甲基化的方法,包括步骤:

利用如本发明第一方面所述的方法构建甲基化文库;

对所述甲基化文库进行测序,从而检测样品中的DNA甲基化。

在另一优选例中,所述测序包括使用Illumina测序平台、或使用华大测序平台。

在本发明的第四方面,提供了一种疾病诊断或预测方法,包括步骤:获取来自待测对象的DNA样本,并使用如本发明第一方面所述的方法检测DNA样本甲基化,从而诊断或预测疾病。

在另一优选例中,所述的疾病为具有甲基化异常的疾病。

在另一优选例中,所述的疾病为肿瘤。

在另一优选例中,所述的对象为人或非人哺乳动物。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。

图1显示了基于限制性酶切的CpG岛甲基化富集测序技术实验流程图。图中

图2显示了实施例2中,第一轮AT酶切后,测序数据在CpG岛的分布示例;CpG岛范围使用灰色长条(峰图下方)表示,A)CpG岛信息均保留,B)CpG岛信息部分保留,C)CpG岛信息完全丢失。上半部分为未酶切文库的测序数据在CpG岛分布,下半部分为第一轮AT酶切后,测序数据在CpG岛分布。

图3显示了实施例2中,相同测序数据量时,经第一轮AT酶切后各CpG岛测序深度与未酶切时深度的比值,以直方图展示。黑色高亮的横坐标[0,1]对应的部分,表示第一轮AT酶切后,测序深度低于未酶切的CpG岛数量。

图4显示了实施例3中经不同处理的3份文库在共同检测到的CpG岛区域的测序深度直方图,横坐标表示测序深度。上中下分别展示“未进行限制性酶切”、“第一轮AT酶切+非甲基化位点酶切”和“第一轮AT酶切+非甲基化位点酶切+第二轮AT酶切”文库。虚线表示文库在这些共有CpG岛测序深度的均值。

图5显示了酶切对于甲基化修饰的CpG岛的富集作用。其中,使用MseI和MluCI进行第一轮AT酶切,HpaII进行非甲基化位点酶切;MseI和MluCI进行第二轮AT酶切后建库测序。展示SEPTIN9启动子区CpG位点富集测序结果:灰色线条代表测序read,NEGATIVE与POSITIVE分别代表正链和负链;黑色方块代表甲基化的CpG位点,白色方块代表非甲基化的CpG位点。

具体实施方式

本发明人经过广泛而深入的研究,开发出一种在建库过程中引入限制性酶切步骤的特殊甲基化二代测序文库构建方式。利用CpG岛富含C、G碱基的特征,通过识别位点,特性不同的限制性酶切组合,实现对发生了甲基化修饰的CpG岛的富集测序,本发明适用于针对CpG岛的甲基化的研究与应用,不仅适合常规基因组DNA,更加适合痕量ctDNA的甲基化组学检测,为依赖ctDNA甲基化进行的肿瘤液体活检领域提供了全新的解决方案。在此基础上,完成了本发明。

本发明综合应用了AT酶切、CT转化和非甲基化位点酶切。通过AT酶切步骤,能够去除大量AT富集片段的干扰,提高测序效率,富集CpG岛。通过使用非甲基化位点酶切,能够去除非甲基化CG片段的干扰,提高测序效率,富集含甲基化位点的CpG岛。通过CT转化步骤,一方面使非甲基化的胞嘧啶被转化,在序列中仅保留了甲基化的胞嘧啶;另一方面,CT转化进一步在序列中产生了新的AT酶切位点,能够进行二次AT酶切以提高富集效率。

术语

如本文所用,术语“甲基化文库”、“酶切测序文库”具有相同的含义,是指双链DNA片段经末端修复,加A,连接Y型甲基化接头后,再进行一个或多个AT酶切、非甲基化位点酶切、CT转化步骤、或其组合,最终PCR富集扩增所获得的文库。

如本文所用,术语“AT酶切”是指使用识别序列仅包含A/T的限制性内切酶对全基因组甲基化测序文库进行限制性内切酶消化。在优选的实施方式中,所述的识别序列仅包含A/T的限制性内切酶包括任意的能够切割AT富集序列的酶,例如但不限于MseI(识别位点为TTAA)和MluCI(识别位点AATT)。

如本文所用,术语“非甲基化位点酶切”是指使用5mC甲基化敏感型限制性内切酶对全基因组甲基化测序文库进行限制性内切酶消化。在优选的实施方式中,所述的5mC甲基化敏感型限制性内切酶包括但不限于HpaII(识别位点为CCGG)。

如本文所用,术语“CT转化”是指胞嘧啶脱氨转化为尿嘧啶或胸腺嘧啶。CT转化可使用传统亚硫酸盐化学处理或APOBEC脱氨酶处理进行,优选酶处理,其较温和,不易造成DNA链断裂。

在本发明中,AT酶切可在CT转化前和/或CT转化后单独进行;也可在CT转化前和CT转化后先后进行;非甲基化位点酶切只可在CT转化前进行,可与AT酶切分开或组合进行。酶切后再使用文库两端通用引物富集插入片段不含上述酶切位点的DNA片段。

技术原理

为了便于理解本发明,本说明书中提供以下原理。应理解,本发明的保护范围并不受到所述原理的限制。

本发明利用CpG岛富含C、G碱基的特征,利用AT酶切和非甲基化位点酶切简化测序文库、保留CpG岛信息,并可以利用CT转化后的序列改变,进行第二轮AT酶切以进一步提高简化效率。非甲基化位点酶切进一步富集发生了甲基化的CpG岛信息。

甲基化文库构建方法

典型地,本发明方法流程可参考图1,包括步骤:

1)DNA片段首先经末端修复,加A尾的步骤,在DNA片段两端连接上甲基化接头;

2)甲基化接头包含第一链和第二链,所有的胞嘧啶C均被5-甲基化修饰,其中第一链5’磷酸基团修饰,第一链3’端与第二链的5端部分碱基互补,两条链退火后,第一链单个A碱基突出;

3)可进行建库的DNA类型可以为基因组DNA(gDNA),或细胞游离DNA(cfDNA);

4)如对基因组DNA进行建库,首先需要将其片段化至目标大小,如200-400bp,或100-600bp;

5)如对cfDNA进行建库,不需要进行片段化步骤;

6)甲基化接头连接后,如对gDNA建库,需使用磁珠分选适当插入片段长度的文库,如250-350bp;次优的,200-400bp;如对cfDNA建库,使用磁珠纯化连接产物,需尽可能多的回收双端连接了甲基化接头的DNA片段;

7)进行第一轮AT酶切,使用酶切识别位点仅包含A和T碱基的限制性内切酶,对上述连接产物进行AT酶切。最优的,使用MseI(识别位点为TTAA)和MluCI(识别位点AATT)双酶切;较优的,分别使用MseI(识别位点为TTAA)和MluCI(识别位点AATT)单酶切;

8)使用5mC甲基化敏感型限制性内切酶,对连接产物进行非甲基化位点酶切。最优的,使用HpaII(CCGG)酶切;

9)如进行第一轮AT酶切和非甲基化位点酶切,可在同一反应体系中同时进行多酶切;

10)酶切产物使用磁珠纯化后,进行CT转化处理。最优的,使用酶法处理,5mC碱基经TET2酶氧化保护后,使用APOBEC脱氨酶将未保护的C碱基(未甲基化修饰的C碱基)全部脱氨转化为U碱基;较优的,使用传统亚硫酸盐处理将未甲基化修饰的C碱基转化为U碱基;

11)CT转化后,使用能够扩增包含尿嘧啶(U碱基)模板的高保真DNA扩增酶,PCR扩增富集插入片段不包含酶切位点的片段,获得单轮酶切测序文库;

12)CT转化后,序列发生改变,可进行第二轮AT酶切,再次使用酶切识别位点仅包含A和T碱基的限制性内切酶,对上述连接产物进行AT酶切。最优的,使用MseI(识别位点为TTAA)和MluCI(识别位点AATT)双酶切;较优的,分别使用MseI(识别位点为TTAA)和MluCI(识别位点AATT)单酶切;

13)第二轮AT酶切后,使用与通用接头匹配的引物,进行第二轮PCR扩增,富集CT转化后,插入片段仍不包含酶切位点的片段,获得两次酶切测序文库;

14)以上第一轮AT酶切,非甲基化位点酶切,第二轮酶切可组合进行;

15)测序文库上机测序,根据连接的甲基化接头,决定上机平台,最优的Illumina测序平台,次优的,华大测序平台。

本发明的主要优点包括:

1)本发明方法相较于传统的全基因组甲基化测序方法,在降低测序成本的同时,尽可能保证了CpG岛有效信息的获取,根据酶切组合的差别,可实现高至10倍的CpG岛富集效果。

2)本发明方法相较于基于探针捕获的目标区域富集甲基化测序方法,省去了复杂、高成本且不确定的甲基化探针设计与捕获步骤。

3)本发明方法能够兼容各种类型的DNA样本,包括基因组DNA与细胞游离DNA。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。

实施例1人基因组富集模拟数据

该实施例模拟使用MseI和MluCI分别进行第一轮AT酶切,CT转化后进而进行第二轮AT酶切,人基因组序列(hg19)中CpG岛的富集倍数。

1)按100bp,200bp,300bp,400bp,500bp,以及ctDNA的特征长度170bp为滑动窗口,步移长度为1个碱基,将基因组序列分割为N个片段;统计序列包含有AATT或TTAA碱基组合的片段数量,记作N1;统计序列包含有AATT,TTAA,AACC,AATC,AACT,CCAA,TCAA,CTAA碱基组合中任意一种的片段数量,记作N2;

2)同样按上述长度的滑动窗口与步移单位,将人CpG岛的序列(数据来源自UCSC数据库),分割为M个片段;统计序列包含有AATT或TTAA碱基组合的片段数量,记作M1;统计序列包含有AATT,TTAA,AACC,AATC,AACT,CCAA,TCAA,CTAA碱基组合中任意一种的片段数量,记作M2;

3)计算单轮AT酶切基因组简化效率R1=N/(N-N1);两轮AT酶切基因组简化效率R2=N/(N-N2),基因组简化效率直接影响测序量,决定实验成本;

4)计算单轮AT酶切CpG岛保留比例K1=(M-M1)/M;两轮AT酶切CpG岛保留比例K2=(M-M2)/M,CpG岛保留比例直接影响能够获得的有效信息;

5)计算结果如下表所示,可见当滑动窗口为170bp时(ctDNA特征长度),经单轮AT酶切后,基因组简化效率达到3.9倍,可保留77%的CpG岛信息;经两轮AT酶切后,基因组简化效率达到10.7倍,但保留的CpG岛信息下降为24%;

6)根据模拟结果,可见无论单轮还是两轮AT酶切,基因组简化效率都与滑动窗口长度呈正相关。单轮AT酶切的基因组简化效率更易受滑动窗口长度的影响,两轮AT酶切基因组简化效率本身高于单轮酶切,但受滑动窗口长度的影响较小。另一方面,经过单轮和两轮酶切的CpG岛信息保留比例均与滑动窗口长度负相关,单轮AT酶切的CpG岛信息保留比例较高,受滑动窗口长度的影响也较小;而两轮AT酶切CpG岛信息保留比例本身低于单轮酶切,并且受滑动窗口长度的影响较大。

该实施例可知,可通过调整文库插入长度,以及AT酶切策略,对基因组简化效率和CpG岛信息保留比例这两个关键参数进行调整,两者需平衡以更贴合实际需求。

表1滑动窗口与简化效率及CpG岛信息保留比例的关系

实施例2:人基因组DNA进行第一轮AT酶切测序结果

1)化学合成下列接头序列,HPLC纯化;

5mC-AD-F:[ROX]ACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO.1)

5mC-AD-R:GATCGGAAGAGCACACGTCTGAACTCCAGTCAC[HEX](SEQ ID NO.2)

以上序列所有C为5mC碱基;

2)使用退火缓冲液(10mM Tris-Cl pH 8.0,1mM EDTA,50mM NaCl)将上述合成的oligo溶解至终浓度100μM。取25μL 5mC-AD-F和25μL 5mC-AD-R,在0.2ml薄壁管内混合为50μL的5mC-AD(终浓度50μM);

3)将上述5mC-AD置于PCR仪退火,条件为95℃变性10min,0.1℃/秒降温至25℃;并在25℃保持2小时,即为制备好的甲基化接头;

4)取30μL 10ng/μL的基因组DNA,使用Covaris超声破碎成200-400bp的DNA片段;

5)使用DNA建库试剂盒(E7120,NEB)进行末端补齐,加A,甲基化接头连接,具体步骤如下:

a.配制如下体系填平末端并加A

/>

反应条件:20℃30分钟,65℃30分钟

b.末端补齐并加A后,进行甲基化接头(5mC-AD)连接,配制如下体系:

反应条件:20℃15分钟;

c.使用磁珠纯化连接产物,最终溶解于50μL H

6)取一半连接产物直接进行步骤9)的PCR扩增步骤,作为未酶切对照;

7)配制如下AT酶切体系:

反应条件,37℃,2小时

8)使用磁珠纯化AT酶切产物,最终溶解于30μL H

9)于冰上配制如下体系,混合均匀并离心,置于PCR仪上反应,对不包含酶切位点的DNA片段扩增富集;

a.反应体系

引物序列为:

NGMPCRF1

AATGATACGGCGACCACCGAGATCTACACACACTCTTTCCCTACACGAC GC(SEQ ID NO.3)

NGMPCRR

CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTGACTGGAGTTCAGA CGTGTGCT(SEQ IDNO.4),其中NNNNNNNN为index序列

b.反应条件:

10)文库经2100质控插入片段长度,并使用qPCR定量摩尔浓度后,IlluminaNovaseq上机;

结果:测序结果统计如下表,分别统计比对到基因组整体的碱基数和比对到CpG区域的碱基数,计算平均测序深度。一轮AT酶切后,每G测序数据在CpG岛测序深度为1.4X相较于未酶切处理文库的0.4X,CpG岛富集效率约3.5倍;

表2酶切对测序效率的影响

同时,相较于未酶切处理,一轮AT酶切后比对到CpG岛的测序数据主要分为以下几种类型;A)CpG岛信息均保留,B)CpG岛信息部分保留,C)CpG岛信息完全丢失(图2)。经计算,相同测序量情况下,27949个CpG岛中,一轮AT酶切后测序,测序深度高于未酶切测序的数量达到25606个,占比91.6%(图3)。

需注意,CpG岛包含的各CpG位点通常具有一致的甲基化模式,因此经限制酶切后,即使CpG岛中只有部分信息被保留,也可被用于推断该CpG岛的甲基化程度。

该实施例可见,单轮AT酶切即可降低超过70%的测序成本,且在超过90%的CpG岛区域获得不亚于全基因组测序的测序深度。

实施例3:cfDNA经两轮AT酶切和非甲基化位点酶切后CpG岛富集测序

1)取30ng的cfDNA,使用DNA建库试剂盒(E7120,NEB)进行末端补齐,加A,甲基化接头连接,具体步骤同实施例2;

2)连接产物使用磁珠纯化连接产物,最终溶解于45μL H

3)配制下列体系同时进行AT酶切和非甲基化位点酶切;

反应条件,37℃,2小时

4)使用磁珠纯化酶切产物后,使用

a.添加400μL TET2 Reaction Buffer至一管TET2 Reaction Buffer Supplement中混合均匀,标记为TET2 Reaction Buffer(reconstituted);

b.稀释Fe(II)Solution:取1μL 500mM Fe(II)Solution(黄色盖子)加入至1249μL水中混合均匀,置于冰上备用;

c.按照下表冰上配制反应体系,混合均匀,短暂离心:

d.在上述已混合体系中添加5μL已稀释的Fe(II)Solution,移液器吹打10次混合均匀并短暂离心,置于PCR仪上进行氧化反应:

反应条件:

e.将氧化反应结束的样本转移至冰上,加入1μL Stop Reagent移液器吹打10次混合均匀并短暂离心,置于PCR仪上进行终止反应:

反应条件:

f.氧化产物经磁珠纯化后,溶解于16μL H

g.按照下表配制反应体系,移液器吹打混匀,盖上盖膜后短暂离心后,置于PCR仪上反应:

反应体系:

反应条件:

h.使用磁珠纯化CT转化产物,最终溶解于H

5)于冰上平行配制如下3个体系,混合均匀并离心,置于PCR仪上反应,对不包含酶切位点的DNA片段及未酶切对照扩增富集;

反应体系

引物序列同实施例2。

反应条件:

6)未酶切对照扩增产物纯化后,直接作为未酶切对照测序文库;2份酶切CT转化扩增产物纯化后,一份作为单轮AT酶切+非甲基化位点酶切的测序文库,另一份配制如下体系进行第二轮AT酶切;

37℃,2小时

7)酶切产物经磁珠纯化后,配制如下体系对不包含酶切位点的DNA片段再次扩增富集;

引物序列:

NEWPCRF AATGATACGGCGACCACCGAGAT(SEQ ID NO.5)

NEWPCRR CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO6)

8)扩增产物经磁珠纯化后作为两轮AT酶切+非甲基化位点酶切测序文库;

9)所有文库经2100质控插入片段长度,并使用qPCR定量摩尔浓度后,IlluminaNovaseq上机。

结果:对测序数据进行统计,当测序测序数据量同为5G:未进行酶切时,总计27949个CpG岛,其中21223个CpG岛测序到至少一条read;进行一轮AT酶切和非甲基化位点酶切后,有17006个CpG岛可检测到至少一条read,测序深度高于未酶切文库的有9349个CpG岛;当继续进行二轮AT酶切后,其中15542个CpG岛可以测到至少一条read,测序深度高于未酶切文库的有10967个CpG岛。

测序结果分别统计比对到基因组整体的碱基数和比对到CpG岛区域的碱基数,并计算每个CpG岛的平均测序深度。因不同处理文库基因组简化效率存在区别,对3份文库测序数据共有的CpG岛进行统计;测序量为5G时,在这些有效区域中,未进行酶切处理平均覆盖深度约1.68X;一轮AT酶切+非甲基化位点酶切后,平均覆盖深度约2.99X;两轮AT酶切+一轮非甲基化位点酶切后,平均覆盖深度为8.25X(图4)。

需注意,经过非甲基化位点酶切后,测序数据对发生了甲基化修饰的CpG岛也有富集作用,如图5所示,位于SEPTIN9基因启动子区的一个CpG岛,在未进行酶切处理时,测到的4条reads均为非甲基化修饰;当经过非甲基化位点酶切后,甲基化修饰的reads被富集出来,测序到的reads数量也随着AT酶切次数的增加而上升。

通过该实例数据可见,本发明方法同样适用于cfDNA,AT酶切能够显著提高CpG岛区域的测序深度,非甲基化位点酶切可对发生甲基化修饰的区域实现富集。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

相关技术
  • 基于焦磷酸测序技术的TIMP3基因启动子区域CPG岛甲基化检测方法
  • 微量DNA中甲基化CpG岛高通量测序方法
技术分类

06120115935752