掌桥专利:专业的专利平台
掌桥专利
首页

生成双链衔接物的方法

文献发布时间:2023-06-19 12:18:04



本申请是申请日为2015年09月24日,申请号为 201580063859.X,发明名称为“样品制备方法”的申请的分案申请。

本申请要求2014年9月24日提交的序列号为62/054,886的美国临时申请和2015年4月20日提交的第14/691,457号美国专利申请的优先权,其通过引用而整体并入本文。

背景技术

尽管近年来核酸测序的成本已经降低,但样品制备仍然费用高昂。只有几种样品制备方法与最流行的测序平台相兼容。这些方法可能费用高昂且又耗时。特别是,文库制备可能需要在核酸片段上生成突出的碱基。该步骤是制备测序文库较为低效的一步步骤。提高该步骤的效率将减少制备测序文库所需的起始核酸的量。需要用于测序的样品制备的新方法,特别是借此提高生成具有突出碱基的核酸片段的效率的方法。

发明内容

本文提供了用于生成核酸片段的衔接子连接的文库的方法。特别地,公开了用于制备部分互补的双链核酸片段的方法,使得一条链延伸超出另一条以产生突出端。这样的突出端可以提高酶促反应和生化反应的效率。例如,这样的突出端可与其互补序列退火,以允许核酸片段的靶向配对。在另一实例中,具有互补突出端的核酸片段的连接比平端核酸片段的连接更有效率。

在一方面,本公开内容提供了用于生成双链核酸分子的衔接子连接的文库的方法,其包括:在单一反应容器或反应混合物中,使多个单链多核苷酸与第一组随机引物相接触,每个随机引物包含可切割5’端;延伸该第一组随机引物以生成与该单链多核苷酸杂交的第一延伸产物,从而形成第一双链双链体;使该第一双链双链体变性为单链;使该第一多核苷酸延伸产物与第二组随机引物杂交(该第一组引物和该第二组引物可以相同或不同);延伸该第二组随机引物以生成与该第一延伸产物杂交的第二延伸产物,从而形成第二双链双链体;切割该第一延伸产物和/或该第二延伸产物的可切割5’端,从而形成具有一个或多个突出端的第二双链双链体;以及使包含3’突出端的一个或多个双链衔接物与先前步骤的第二双链双链体连接,从而形成该衔接子连接的文库。该双链衔接物在一些实例中可以包含核酸条码,诸如样品条码、分子条码或随机化条码。随机引物可以是完全简并或部分简并的。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一些实施方案中,所述单链多核苷酸为ssDNA。在一些实施方案中,该单链多核苷酸为RNA。在一些实施方案中,所述引物是随机的,如随机六聚体。在一些实施方案中,该引物的长度为4 至30个核苷酸的长度。在一些实施方案中,所述可切割5’端为可通过光切割切割的。在一些实施方案中,该可切割5’端为可被核酸酶切割的。在一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的 RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、 rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该切割去除引物的1-5个核苷酸。在一些实施方案中,该切割从引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶,并且3’突出端包含腺嘌呤。在一些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、 dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、 rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核酸条码。在一些实施方案中,该衔接物包含核酸条码序列。在一些情况下,可对该衔接物连接的文库进行测序。在一些实施方案中,所述多核苷酸为古多核苷酸。在一些实施方案中,该多核苷酸包含少于10个核酸拷贝。在一些实施方案中,将所述方法执行两次或更多次。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一方面,本公开内容提供了一种用于生成双链核酸分子的衔接子连接的文库的方法,其包括:在单一反应容器或反应混合物中,使多个单链多核苷酸与第一组靶标特异性引物相接触,每个靶标特异性引物包含可切割5'端;延伸该第一组引物(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)以生成与该单链多核苷酸杂交的第一延伸产物,从而形成第一双链双链体;使该第一双链双链体变性为单链;使该第一多核苷酸延伸产物与第二组靶标特异性引物杂交(该第一和第二组引物可以相同或不同;例如,第一组引物可与该靶核酸(或其上游)特异性杂交。该第二组引物可与同该靶核酸或其上游)互补的序列特异性杂交);延伸该第二组引物以生成与该第一延伸产物杂交的第二延伸产物,从而形成第二双链双链体;切割该第一延伸产物和/或该第二延伸产物的可切割5'端,从而形成具有一个或多个突出端的第二双链双链体;以及使包含3'突出端的一个或多个双链衔接物与先前步骤的第二双链双链体相连接,从而形成衔接子连接的文库,其中所述方法仅包括两个延伸步骤。所述双链衔接物可以包含,例如,核酸条码,诸如样品条码、分子条码或随机化条码。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一些实施方案中,所述靶标特异性引物包含5’随机化尾部。在一些实施方案中,该随机化尾部包含可切割5’端。在一些实施方案中,所述单链多核苷酸为ssDNA。在一些实施方案中,该单链多核苷酸为RNA。在一些实施方案中,所述引物是随机的,如随机六聚体。在一些实施方案中,该引物的长度为4至30个核苷酸的长度。在一些实施方案中,所述可切割5’端是可通过光切割来切割的。在一些实施方案中,该可切割5’端是可被核酸酶切割的。在一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA 聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5个核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、 rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、 rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核酸条码。在一些实施方案中,该衔接物包含核酸条码序列。在一些情况下,可对该衔接物连接的文库进行测序。在一些实施方案中,所述多核苷酸为古多核苷酸。在一些实施方案中,该多核苷酸包含少于10个核酸拷贝。在一些实施方案中,将所述方法执行两次或更多次。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一方面,本公开内容提供了一种用于制备多核苷酸文库的方法,其包括:使多个单链多核苷酸与包含可切割5’端的第一组随机引物相接触;延伸该引物以生成与该多核苷酸杂交的第一延伸产物,从而形成双链双链体;切割可切割5’端,从而生成具有第一突出端的双链双链体;以及使一个或多个衔接子与先前步骤的双链双链体连接,其中该一个或多个衔接子包含与该第一突出端互补的突出端,并且其中该方法仅包括一轮延伸。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一些实施方案中,所述多核苷酸为ssDNA。在一些实施方案中,该多核苷酸为RNA。在一些实施方案中,所述引物是随机的,如随机六聚体。在一些实施方案中,该引物的长度为4至30个核苷酸的长度。在一些实施方案中,所述可切割5’端可通过光切割来切割。在一些实施方案中,该可切割5’端可被核酸酶切割。在一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA 聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中,该可切割5’端来自于1-5个核苷酸。在一些实施方案中,该可切割 5’端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5 个核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、 rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、 rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核酸条码。在一些实施方案中,该衔接物包含由含有可切割3'或5' 端的任一衔接子寡核苷酸生成的核酸随机化条码。在一些实施方案中,所述方法进一步包括对该衔接物连接的文库进行测序。在一些实施方案中,所述多核苷酸为古多核苷酸。在一些实施方案中,起始单链多核苷酸包含少于10个核酸分子拷贝。在一些实施方案中,将所述方法执行两次或更多次。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一方面,本公开内容提供了用于生成双链核酸分子的衔接子连接的文库的方法,其包括:在单一反应容器或反应混合物中,使多个单链多核苷酸与随机引物库接触,每个随机引物包含可切割5’端;延伸该引物以生成与该单链多核苷酸杂交的第一延伸产物,从而形成第一双链双链体;使该第一双链双链体变性为单链;使该第一多核苷酸延伸产物与来自靶标特异性引物库的引物杂交;延伸该引物以生成与该第一延伸产物杂交的第二延伸产物,从而形成第二双链双链体;切割该第一延伸产物或该第二延伸产物的可切割5’端,从而形成具有一个或多个突出端的第二双链双链体;以及使包含3’突出端的一个或多个双链衔接物与先前步骤的第二双链双链体连接,从而形成该衔接子连接的文库,其中所述方法仅包括两个延伸步骤。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一些实施方案中,所述多核苷酸为DNA。在一些实施方案中,该多核苷酸为RNA。在一些实施方案中,所述引物是随机的,如随机六聚体。在一些实施方案中,该引物的长度为4至30个核苷酸的长度。在一些实施方案中,所述可切割5’端可通过光切割来切割。在一些实施方案中,该可切割5’端可被核酸酶来切割。在一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些情况下,该核酸酶可以是切割DNA-RNA杂合分子的RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA 聚合酶I的5’-3’核酸外切酶活性提供。在一些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,所述可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5个核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、 rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、 rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核酸条码。在一些实施方案中,该衔接物包含核酸条码。在一些实施方案中,该衔接物包含核酸条码序列。在一些情况下,可对该衔接物连接的文库进行测序。在一些实施方案中,该多核苷酸为古多核苷酸。在一些实施方案中,所述多核苷酸包含少于10个核酸拷贝。在一些实施方案中,将所述方法执行两次或更多次。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。

在一方面,本公开内容提供了生成具有一个或多个突出端的双链衔接物的方法。可在单一反应混合物或反应容器中生成该双链衔接物。可以通过使两个寡核苷酸库退火来生成该双链衔接物。该第一寡核苷酸库内的每个寡核苷酸可选地包含5’可切割核苷酸。该第二寡核苷酸库内的每个寡核苷酸可包含与该第一个库中的寡核苷酸的一部分互补的序列和5’可切割核苷酸。在一些情况下,来自该第二寡核苷酸库的每个寡核苷酸均可包含介于与该第一个库中的寡核苷酸的一部分互补的序列和该5’可切割核苷酸之间的条码序列。该条码序列可以是随机的。该条码序列可以是非随机的。该条码序列可以是半随机的,诸如例如,通过利用半简并引物合成来制备寡核苷酸。来自该第一库的寡核苷酸可与来自该第二库的寡核苷酸杂交以形成双链体。可以延伸该双链体中来自该第一库的寡核苷酸,从而使来自该第一库的寡核苷酸与同该可选的条码序列互补并且与来自该第二库的寡核苷酸的可切割核苷酸互补的序列共价连接。可以切割位于该衔接物一个或多个末端的一种或多种可切割核苷酸。可在本文任何方法中使用该切割的衔接物用于文库制备和测序。在一些情况下,该第二寡核苷酸库包含超过三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种、12种或更多种、14种或更多种、16种或更多种、18种或更多种、20种或更多种、22种或更多种、24种或更多种、26种或更多种、28种或更多种、30种或更多种、32种或更多种、36种或更多种、42种或更多种、48种或更多种、54种或更多种、60种或更多种、64种或更多种、66种或更多种、72种或更多种、78种或更多种、84种或更多种、90种或更多种、98种或更多种、120种或更多种、128种或更多种、160 种或更多种、200种或更多种、240种或更多种、256种或更多种、 280种或更多种、512种或更多种、1024种或更多种、2048种或更多种或者4096种或更多种不同的序列条码。

所述寡核苷酸可以为4至150个核苷酸的长度。除了随机条码和5’可切割核苷酸之外,该寡核苷酸可以是完全互补的。在一些实施方案中,该寡核苷酸仅部分互补。在一些实例中,该可切割5’端可通过光切割来切割。在一些实施方案中,该可切割5’端可被核酸酶切割。在一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的 RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、 rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含 rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5个核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,该衔接物包含由含有可切割3’或5’端的任一衔接子寡核苷酸生成的核酸随机化条码。在一些实施方案中,该方法进一步包括对该衔接物连接的文库进行测序。

在一方面,本公开内容提供了一种试剂盒,其包含:包含一组随机引物的第一容器,每个随机引物包含可切割5’端;包含聚合酶的第二容器;包含衔接子的第三容器,其中每个衔接子包含与该可切割5’端互补的突出端;以及使用说明书,其中该说明书指示该随机引物用于仅两轮延伸的用法。在一些实施方案中,该试剂盒进一步包含含有连接酶的容器。在一些实施方案中,该试剂盒进一步包含含有缓冲液的容器。

在生成具有突出端的双链核酸片段或具有突出端的双链衔接物的具体实例中,所述5’可切割端包含一个或多个RNA碱基或者一个或多个dU。如果该5’可切割端包含RNA碱基,则该切割在一些情况下可由RNaseH或聚合酶,如DNA聚合酶I的5’→3’核酸外切酶活性来介导。如果该可切割5’端包含dU,则该切割可由尿嘧啶-DNA糖基化酶来介导。在切割该5’可切割端之后,该双链核酸片段或双链衔接物可以具有一个或多个突出端。这些突出端可以提高具有互补突出端的序列的连接反应的效率。然后可使该具有5’突出端的核酸片段与具有互补3’突出端的衔接物相连接,以生成衔接物连接的测序文库。

在一方面,本公开内容提供了一种试剂盒,其包含:包含一组随机引物的第一容器,每个随机引物包含可切割5’端;包含聚合酶的第二容器;包含衔接子的第三容器,其中每个衔接子包含与该可切割5’端互补的突出端;以及使用说明书,其中该说明书指示该随机引物库用于仅一轮延伸的用法。在一些实施方案中,该试剂盒进一步包含含有连接酶的容器。在一些实施方案中,该试剂盒进一步包含含有缓冲液的容器。

本申请提供了以下各项:

1.一种用于生成双链核酸分子的衔接子连接的文库的方法,其包括在单一反应容器或反应混合物中:

(a)由多个单链多核苷酸生成包含一条或两条链的可切割5’端的多个双链DNA分子;

(b)用切割剂切割所述可切割5’端以产生包含一个或多个突出端的双链DNA分子;以及

(c)使包含3’突出端的一个或多个双链衔接物与所述具有一个或多个突出端的双链DNA分子相连接,从而形成所述衔接物连接的文库;以及,可选地,

(d)对所述衔接物连接的文库进行测序,

其中所述多个单链多核苷酸以小于约5纳克的量存在。

2.根据项目1所述的方法,其中所述可切割5’端选自:rA、 rC、rG、rU或dU。

3.根据项目1所述的方法,其中以高于90%的效率进行所述连接。

4.根据项目1所述的方法,其中所述生成包括:

(a)使所述多个单链多核苷酸与第一引物库相接触,其中来自该第一库的每个引物包含可切割5’端;

(b)延伸来自所述第一库的引物以生成与所述单链多核苷酸杂交的第一延伸产物,从而形成第一双链双链体;

(c)使所述第一双链双链体变性为单链;

(d)使所述第一多核苷酸延伸产物与第二引物库杂交,其中来自该第二库的每个引物可选地包含可切割5’端;

(e)延伸来自所述第二库的引物以生成与所述第一延伸产物杂交的第二延伸产物,从而形成第二双链双链体。

5.根据项目4所述的方法,其中所述第一引物库和所述第二引物库为包含5’可切割端的随机引物库。

6.根据项目4所述的方法,其中所述第一引物库包含随机引物,而所述第二库包含靶标特异性引物。

7.根据项目4所述的方法,其中所述第一引物库包含靶标特异性引物,而所述第二库包含随机引物。

8.根据项目4所述的方法,其中所述第一引物库包含靶标特异性引物,而所述第二库包含靶标特异性引物。

9.根据项目6所述的方法,其中所述靶标特异性引物包含位于所述靶标特异性序列上游的随机化条码序列。

10.根据项目7所述的方法,其中所述靶标特异性引物包含位于所述靶标特异性序列上游的随机化条码序列。

11.根据项目8所述的方法,其中所述第一靶标特异性引物库和第二靶标特异性引物库包含位于所述靶标特异性序列上游的条码序列。

12.根据项目1所述的方法,其中所述生成包括:

(a)使多个多核苷酸与包含可切割5’端的引物库相接触;

(b)延伸所述引物以生成与所述多核苷酸杂交的第一延伸产物,从而形成双链双链体;

(c)切割所述可切割5’端,从而生成具有第一突出端的双链双链体;以及

(d)使一个或多个衔接子与(c)中的所述双链双链体相连接,其中所述一个或多个衔接子包含与所述第一突出端互补的突出端,

其中所述方法仅包括一轮延伸。

13.根据项目12所述的方法,其中所述引物库包含随机引物。

14.根据项目12所述的方法,其中所述引物库包含靶标特异性引物。

15.根据项目14所述的方法,其中所述靶标特异性引物包含位于所述靶标特异性序列上游的条码序列。

16.一种用于生成双链核酸分子的衔接子连接的文库的方法,其包括在单一反应容器或反应混合物中:

(a)使所述多个单链多核苷酸与第一引物库相接触,其中来自该第一库的每个引物包含可切割5’端;

(b)延伸来自所述第一库的引物以生成与所述单链多核苷酸杂交的第一延伸产物,从而形成第一双链双链体;

(c)使所述第一双链双链体变性为单链;

(d)使所述第一多核苷酸延伸产物与第二引物库杂交,其中来自该第二库的每个引物可选地包含可切割5’端;

(e)延伸来自所述第二库的引物以生成与所述第一延伸产物杂交的第二延伸产物,从而形成第二双链双链体。

(f)用切割剂来切割所述可切割5’端以产生包含一个或多个突出端的双链DNA分子;以及

(g)使包含3’突出端的一个或多个双链衔接物与所述具有一个或多个突出端的双链DNA分子相连接,从而形成所述衔接物连接的文库;以及,可选地,

(h)对所述衔接物连接的文库进行测序。

17.根据项目16所述的方法,其中所述可切割5’端选自:rA、rC、rG、rU或dU。

18.根据项目16所述的方法,其中所述第一引物库和所述第二引物库为包含5’可切割端的随机引物库。

19.根据项目16所述的方法,其中所述第一引物库包含随机引物,而所述第二库包含靶标特异性引物。

20.根据项目16所述的方法,其中所述第一引物库包含靶标特异性引物,而所述第二库包含随机引物。

21.根据项目16所述的方法,其中所述第一引物库包含靶标特异性引物,而所述第二库包含靶标特异性引物。

22.根据项目19所述的方法,其中所述靶标特异性引物包含位于所述靶标特异性序列上游的随机化条码序列。

23.根据项目20所述的方法,其中所述靶标特异性引物包含位于所述靶标特异性序列上游的随机化条码序列。

24.根据项目21所述的方法,其中所述第一靶标特异性引物库和第二靶标特异性引物库包含位于所述靶标特异性序列上游的条码序列。

25.一种用于生成可选地包含序列条码的双链衔接物的方法,其包括,在单一反应容器或反应混合物中:

(a)将第一寡核苷酸库与第二寡核苷酸库相组合,其中所述第一寡核苷酸库内的每个寡核苷酸可选地包含可切割5’端,其中所述第二库中的每个寡核苷酸包含(i)与所述第一库中的寡核苷酸的一部分互补的序列;(ii)位于与所述第一库中的寡核苷酸的该部分互补的序列上游的可选条码序列;和(iii)位于所述条码上游的可切割 5’端;

(b)使来自所述第一库的寡核苷酸与来自所述第二库的寡核苷酸杂交以形成双链体;

(c)延伸来自所述第一库的寡核苷酸,从而使来自所述第一库的寡核苷酸与同所述可选的条码序列互补并且与来自所述第二库的寡核苷酸的可切割5’端互补的序列共价连接;

(d)切割所述可切割5’端以产生包含所述可选条码序列并包含一个或多个突出端的双链衔接物;以及,可选地,

(e)使所述双链衔接物与包含一个或多个突出端的多个双链核酸分子相连接。

26.根据项目25所述的方法,其中所述第二寡核苷酸库包含十二种或更多种不同的条码序列。

27.根据项目25所述的方法,其中所述5’可切割端选自:rA、 rC、rG、rU或dU。

28.根据项目25所述的方法,其中所述条码序列是随机的。

29.根据项目25所述的方法,其中所述条码序列是非随机的。

30.根据项目25所述的方法,其中所述条码序列是半简并的。

本说明书中提到的所有出版物、专利和专利申请均通过引用而并入本文,其程度犹如特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图,将获得对本发明的特征和优点的更好的理解,在这些附图中:

图1描绘了本公开内容的双扩增法的示例性实施方案。

图2描绘了本公开内容的单扩增法的示例性实施方案。

图3描绘了示出本公开内容的未优化双扩增法的1.5%琼脂糖凝胶。

图4阐释了来自图3的样品在1.5%琼脂糖凝胶上的再扩增产物。

图5描绘了描述具有适当对照的双扩增过程的第二次重复尝试的1.5%琼脂糖凝胶。

图6描绘了本公开内容的双扩增法在1.5%琼脂糖凝胶上的重复。

图7示出了本公开内容的双扩增法在1.5%琼脂糖凝胶上的重复。

图8描绘了来自图7的重复结果。x轴为DNA输入,y轴为来自重复实验的DNA输出浓度。圆形和正方形表示平均值,而条棒则对应于最小和最大输出范围。圆形表示150ng的DNA输入,正方形表示75ng的DNA输入。

图9图示了本公开内容的单扩增法。

图10图示了本公开内容的双扩增法。

图11图示了本公开内容的示例性引物延伸方法。

图12描绘了本公开内容的示例性靶向引物延伸方法。

图13描述了通过两个单链DNA分子的退火而导致的衔接物生成。

图14描绘了含有来自不完全互补寡核苷酸的随机条码的衔接物的生成。

图15描绘了含有来自完全互补寡核苷酸的随机条码的衔接物的生成。

具体实施方式

定义

如本文所使用的,“可切割端”可以指可切割的核酸的3’或5’端或其附近的核苷酸。可以通过包括化学、热或光解在内的非酶促或酶促手段来切割可切割端,以使可切割端能够释放。可切割端既可以指可选择性切割的官能团也可以指其经保护的形式。例如,可切割端可以位于聚合物主链(即,经修饰的3’-5’核苷酸间连接代替其中一个磷酸二酯基团),作为寡核苷酸引物其中一个碱基或糖的取代基或替代物,并且/或者作为3’末端残基(例如,寡脱氧核糖核苷酸引物3’端的核糖核苷酸)。在引物固定、杂交、引物延伸和洗涤条件期间,可切割端在标准固相DNA合成条件下可以是稳定的。可切割端还可包含可被诸如核酸酶等酶切割的核苷酸。例如,可切割端可以是限制性内切核酸酶位点。用于在可切割端切割的示例性限制性内切核酸酶可以包括BpmI、BsgI、BseRI、BsmFI和FokI。

可切割端还可以是能够通过具有5’至3’核酸外切酶活性的酶,如T7基因6核酸外切酶来阻断或终止5’至3’酶促消化的核苷酸或系列核苷酸。代表性的阻断核苷酸可以是包含硫代磷酸酯、硼酸- 磷酸酯或肽基团的核苷酸。阻断核苷酸和/或可切割端可以是不抑制引物的酶促延伸的核苷酸。

如本文所使用的,术语“衔接子”或“衔接物”可互换使用,并且可以指可与核酸末端连接的寡核苷酸。衔接子序列可以包含,例如,启动位点、启动位点的互补体、核酸内切酶的识别位点、共同序列和启动子。衔接子还可并入修饰衔接子序列性质的经修饰的核苷酸。例如,可将硫代磷酸酯基团并入其中一个衔接子链中。

如本文所使用的术语“库”或“组”可以可互换地使用,并且可以指分子的集合。组中的分子彼此间可以相同或不同。

如本文所使用的术语“互补”可以指核苷酸或核酸之间的杂交或碱基配对,诸如例如,双链DNA分子的两条链之间或者寡核苷酸引物与待测序或待扩增的单链核酸上的引物结合位点之间。互补核苷酸通常可以是A(腺嘌呤)和T(胸腺嘧啶)(或A和U)或者C(胞嘧啶)和G(鸟嘌呤)。当一条链的核苷酸经最佳比对和比较并经适当的核苷酸插入或缺失与另一条链的核苷酸配对时,两条单链RNA或DNA分子可以是互补的。当RNA或DNA链在选择性杂交条件下与其互补体杂交时,可以存在互补性。

如本文所使用的术语“引物”可以指,在在适当条件下,例如缓冲液和温度、存在四种不同的核苷三磷酸和用于聚合的试剂,诸如例如DNA或RNA聚合酶或逆转录酶,能够充当模板指导的DNA 合成起始点的单链寡核苷酸。引物可以充分互补以与这样的模板杂交。引物可以包含引物位点,其可以指引物与靶核酸杂交的引物区域。引物可以是引物库中的引物。引物可以是引物对的一部分。引物对(例如靶标特异性引物)可以包含与待扩增序列的5’端杂交的 5’上游引物和与待扩增序列的3’端互补体杂交的3’下游引物。

总体概述

在一些实施方案中,本公开内容提供了使一个或多个衔接物与双链核酸连接的方法。图1描绘了本公开内容的方法的示例性实施方案。单链核酸105可与引物或随机引物库110相接触。引物可以包含可切割5’端115。可以延伸120引物以形成第一双链双链体125。可使第一双链双链体125变性130成为第一双链双链体125的单链 135。然后可使第一接触步骤中所用的相同(或不同)引物与变性单链135接触140。可以延伸145引物以生成第二双链双链体150。第二双链双链体150的一个或多个5’可切割端可与切割剂155接触,切割剂155可以切割160一个或多个5’可切割端,从而生成一个或多个突出端165。一个或多个突出端165可与双链核酸175(例如测序衔接物)相连接170,双链核酸175包含与第二双链双链体150 的一个或多个突出端互补的突出端。优选地在单一反应容器或反应混合物中来执行所有上述步骤。可在连接之前采用单个清理步骤来执行所述方法。可采用单个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。清理可以指将靶核酸分子与杂质、缓冲液或不需要的核酸分子如未连接的衔接物相分离的方法。清理方法可以包括柱,如Qiagen DNA柱或Qiagen MinElute反应清理试剂盒,或基于珠子的方法,如Ampure XP珠子。

在一些实施方案中,本公开内容的方法提供了使一个或多个衔接物与双链核酸连接的方法,其中该方法仅使用一轮延伸(例如扩增)。图2描绘了其中仅使用一轮延伸的本公开内容方法的示例性实施方案。单链核酸205可与引物(例如随机引物库的引物)210 相接触。引物可以包含可切割5’端215。可以延伸220引物以形成第一双链双链体225。第二双链双链体225的一个或多个5’可切割端可与切割剂230接触,切割剂230可以切割235该一个或多个5’可切割端,从而生成一个或多个突出端240。一个或多个突出端240 可与双链核酸250(例如测序衔接物)连接245,双链核酸250包含与第一双链双链体225的一个或多个突出端互补的突出端。

引物

本公开内容提供了包含一个或多个修饰(例如可切割的核苷酸) 的引物。一个或多个修饰(例如可切割的核苷酸)可以在5’端。一个或多个修饰(例如可切割的核苷酸)可以在3’端。一个或多个修饰(例如可切割的核苷酸)可以在引物的末端之间。在一些情况下,一个或多个修饰(例如可切割的核苷酸)在5’端。

一个或多个可切割的核苷酸可以包含至少1、2、3、4、5、6、 7、8、9或10个或更多个核苷酸。一种或多种可切割的核苷酸可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。示例性可切割的核苷酸可以包括RNA、DNA、PNA或LNA、dU、 dA、dT、dC和dG或其任何组合。在一些实施方案中,可切割的核苷酸为RNA核苷酸。

可切割的核苷酸可以包含修饰。不可切割的核苷酸可以包含使其能够被切割的修饰。示例性修饰可以包括但不限于生物素化核苷酸、甲基化核苷酸、乙酰化核苷酸、PNA核苷酸、多聚腺苷酸化、多聚尿苷酸化和LNA核苷酸。在一些情况下,示例性修饰为可由鸟苷酸转移酶添加的5

引物可以为至少1、2、3、4、5、6、7、8、9或10个或更多个核苷酸的长度。引物可以为至多1、2、3、4、5、6、7、8、9或 10个或更多个核苷酸的长度。在一些情况下,引物为6个核苷酸(六聚体)的长度。

引物可以是引物库的部分。引物库可以包含至少100、500、1000、1500、2000、2500、3000、3500、4000、4500或5000种或更多种引物。引物库可以包含至多100、500、1000、1500、2000、 2500、3000、3500、4000、4500或5000种或更多种引物。

引物可以是随机引物(例如随机六聚体引物)。随机引物库可以包含基本上彼此不同的引物。随机引物库可与靶核酸内的多个位置杂交。随机引物库可具有多个引物,其中每个引物与其他引物各不相同。随机引物库中的引物可与随机引物库中的另一引物具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更多的互补性和/或同一性。随机引物库中的引物可与随机引物库中的另一引物具有至多1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更多的互补性和/或同一性。

引物可以是靶标特异性引物。靶标特异性引物可以是设计为与靶核酸的特定区域杂交的引物。靶标特异性引物可与具有至少30%、 40%、50%、60%、70%、80%、90%、95%或100%互补性的靶核酸杂交。靶标特异性引物可与具有至多30%、40%、50%、60%、70%、80%、90%、95%或100%互补性的靶核酸杂交。靶标特异性引物可在超过至少10%、20%、30%、40%、50%、60%、70%、80%、 90%或100%的引物长度上与靶核酸杂交。靶标特异性引物可在超过至多10%、20%、30%、40%、50%、60%、70%、80%、90%或 100%的引物长度上与靶核酸杂交。靶标特异性引物可与靶核酸杂交,并具有至少1、2、3、4、5、6、7、8、9或10个或更多个错配。靶标特异性引物可与靶核酸杂交,并具有至多1、2、3、4、5、 6、7、8、9或10个或更多个错配。

在一些情况下,靶标特异性引物包含尾部。尾部可以为至少1、 2、3、4、5、6、7、8、9、10个或更多个核苷酸的长度。尾部可以为至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸的长度。尾部可以为1-5个核苷酸、1-10个核苷酸、1-15个核苷酸、 1-30个核苷酸、5-10个核苷酸、5-15个核苷酸或5-30个核苷酸的长度。尾部可以包含随机序列。尾部可以包含随机六聚体。包含随机序列的尾部可以是本公开内容的任何随机序列。例如,随机尾部序列可以包含核苷酸,诸如例如荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP、由鸟苷酸转移酶添加的5’7-甲基鸟苷,或限制酶靶序列。

方法

本公开内容提供了用于样品制备的方法(例如,用于测序的衔接子连接)。可使包含单链核酸(例如RNA和/或DNA)的样品与本公开内容的引物接触。引物可以包含修饰(例如,其5’端的可切割核苷酸)。引物(或引物库中的引物)可与靶核酸(例如片段化的靶核酸)库内的一个或多个位置结合。引物(或引物库中的引物)可与靶核酸库内的特定位置结合。

可以延伸引物(例如,使用dNTP,含有dUTP、rA、rU、rG、 rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)。在某些情况下,引物延伸仅发生一次。引物延伸的长度可取决于用来进行延伸的聚合酶的类型。可用于延伸的示例性聚合酶可以包括但不限于DNA聚合酶、 RNA聚合酶、逆转录酶、DNA聚合酶I、polyA聚合酶、Bst聚合酶大片段、Bst 2.0(NEB)、Bst 2.0Warmstart聚合酶、Klenow(exo-)、 Klenow大片段、DNA聚合酶I大(Klenow)片段、T4 DNA聚合酶、Bsu聚合酶大片段、Sulfolobus DNA聚合酶、Deep Vent(exo-) DNA聚合酶(NEB)、Deep Vent DNA聚合酶(NEB)、Vent DNA 聚合酶、Taq、phi29、T7 RNA聚合酶、转移酶(例如,添加5’7- 甲基鸟苷的鸟苷酸转移酶,甲基转移酶、酰基转移酶、硒基转移酶、转酮酶、糖基转移酶、酰基转移酶)和rTth DNA聚合酶。引物延伸产物的长度可以是至少100、200、300、400、500、600、700、 800、900、1000、1100、1200、1300、1400、1500、1600、1700、 1800、1900或2000个或更多个碱基。引物延伸产物的长度可以是至多100、200、300、400、500、600、700、800、900、1000、1100、 1200、1300、1400、1500、1600、1700、1800、1900或2000个或更多个碱基。引物延伸可以产生双链双链体,其中一条链包含可切割5’端。延伸可在室温下进行。延伸可在不改变反应温度的情况下进行。

在一些情况下,所述方法包括第二轮延伸。第二轮延伸包括使包含可切割5’端的双链双链体变性成其相应的单链。变性的双链双链体的一条链可对应于原始的单链靶核酸。变性的双链双链体的一条链可对应于并入可切割5’端的引物延伸产物。在第二轮延伸中,来自引物库的引物可与引物延伸产物上的一个或多个区域杂交。可通过引物延伸来延伸引物。引物延伸的长度可取决于用来进行延伸的聚合酶的类型。可用于延伸的示例性聚合酶可以包括但不限于 DNA聚合酶、RNA聚合酶、逆转录酶、DNA聚合酶I、polyA聚合酶、Bst聚合酶大片段、Bst 2.0(NEB)、Bst 2.0Warmstart聚合酶、Klenow(exo-)、Klenow大片段、DNA聚合酶I大(Klenow) 片段、T4 DNA聚合酶、Bsu聚合酶大片段、Sulfolobus DNA聚合酶、Deep Vent(exo-)DNA聚合酶(NEB)、Deep Vent DNA聚合酶(NEB)、Vent DNA聚合酶、Taq、phi29、T7 RNA聚合酶、转移酶(例如,添加5’7-甲基鸟苷的鸟苷酸转移酶,甲基转移酶、酰基转移酶、硒基转移酶、转酮酶、糖基转移酶、酰基转移酶)和 rTth DNA聚合酶。第二引物延伸产物的长度可以是至少100、200、 300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个或更多个碱基。第二引物延伸产物的长度可以是至多100、200、300、400、500、 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、 1700、1800、1900或2000个或更多个碱基。引物延伸可产生双链双链体,其中两条链均包含可切割的5’端。

当存在两轮引物延伸时,可用靶标特异性引物来执行第一轮延伸,可用随机引物来执行第二轮延伸。当存在两轮引物延伸时,可用随机引物来执行第一轮延伸,可用靶标特异性引物来执行第二轮延伸。

在一些情况下,可以存在多轮引物延伸。引物延伸的轮数可以为至少1、2、3、4、5、6、7、8、9或10或更多。引物延伸的轮数可以为至多1、2、3、4、5、6、7、8、9或10或更多。在一些情况下,执行一轮引物延伸。在一些情况下,执行两轮引物延伸。

衔接子的连接

可用切割剂来切割包含一个或两个可切割端的双链双链体以去除可切割端。切割剂对于5’可切割端上的可切割核苷酸可以是特异性的。例如,如果核苷酸为尿嘧啶,则可切割剂可以是尿嘧啶 -DNA糖基化酶(UDG)。示例性尿嘧啶-DNA糖基化酶可以包括但不限于大肠杆菌(E.coli)尿嘧啶-DNA糖基化酶(NEB)、尿嘧啶DNA-糖基化酶(Life Technologies)、Afu尿嘧啶-DNA糖基化酶、南极热敏尿嘧啶DNA-糖基化酶、Epicenter HK-尿嘧啶-N- 糖基化酶、热敏尿嘧啶-N-糖基化酶,或尿嘧啶-DNA切割混合物,或ThermoScientific尿嘧啶-DNA糖基化酶。切割剂对于特定序列可以是非特异性的。例如,切割剂可以是维持其5’→3’核酸外切酶活性的原核DNA聚合酶I。DNA聚合酶I可以来自不同的生物体 (例如大肠杆菌、枯草芽孢杆菌(B.subtilis)和水生栖热菌(Thermus aquaticus))。此类DNA聚合酶I可购自,例如,New England BioLabs、 Life Technologies和Epicentre。在其他实例中,切割剂可以是切割 DNA-RNA杂交分子的RNA部分的核酸酶。此类核酸酶可以包括但不限于核糖核酸酶杂化酶热稳定RNAse H(Epicentre)、RBase HII、 RNase If、RNAse A、Rnase I、RnaseP、RNase T1和Riboshredder Rnase Blend。切割剂可以切割可切割核苷酸和相邻的不可切割核苷酸之间的磷酸二酯键。切割剂可以切掉一个或多个5’可切割端的至少1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。切割剂可以切掉一个或多个5’可切割端的至多12、3、4、5、6、7、8、9 或10个或更多个核苷酸。在特别优选的实施方案中,切割产生具有相同序列的突出端,从而允许衔接物与互补突出端的连接。

所述切割剂可以为核酸酶。核酸酶可以为核酸内切酶。核酸内切酶的实例包括限制酶、I型核酸内切酶、II型核酸内切酶、T7核酸内切酶、T4核酸内切酶、Bal 31核酸内切酶、S1核酸酶、AP核酸内切酶、DNaseI和Endo R。核酸酶可以为核酸外切酶。核酸外切酶的实例包括5’-3’核酸外切酶、3’-5’核酸外切酶、核酸外切酶I、核酸外切酶II、核酸外切酶III、核酸外切酶IV、核酸外切酶V、 T7核酸外切酶和λ核酸外切酶。核酸酶可以为DNA核酸酶。核酸酶可以为RNA核酸酶。RNA核酸酶的实例可以包括RNaseA、 RNaseH和RNase T1。核酸酶可以切割DNA。核酸酶可以切割RNA。核酸酶可以切割一条或多条RNA-DNA杂合链。

5’可切割端的切割可产生突出端。突出端可以为至少1、2、3、 4、5、6、7、8、9或10个或更多个核苷酸的长度。突出端可以为至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸的长度。突出端可以为1-5个核苷酸、1-10个核苷酸、1-15个核苷酸、1-30 个核苷酸、5-10个核苷酸、5-15个核苷酸或5-30个核苷酸。突出端可以包含具有修饰的一个或多个核苷酸。示例性修饰可以包括,例如,荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、 dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列。

在一些情况下,突出端为一个核苷酸的长度。一个核苷酸突出端可以为A、T、G、C或U。在一些情况下,一个核苷酸突出端为 A。在一些情况下,一个核苷酸突出端为T。

待连接的衔接子可以包含突出端。衔接子的突出端可与可切割端的突出端互补(即,衔接子的突出端可通过形成粘性末端与可切割端的突出端杂交)。

待连接的衔接子可以包括测序衔接子(例如,用于深度测序)。待连接的衔接子可以包含核酸条码序列(例如,用于标记核酸样品)。衔接物可以包含由含有可切割3’或5’端的任一衔接子寡核苷酸生成的核酸随机条码。衔接子可以包含任何核酸序列(例如限制酶序列、经修饰的核苷酸、可切割的核苷酸、不可切割的核苷酸)。衔接子可以全部为双链或基本上为双链。衔接子可以包含二级结构。双链衔接子可以包含至少部分互补的两个寡核苷酸。可使衔接子在一条或两条链上磷酸化或非磷酸化。衔接子可以包含双链部分和与突出端完全或部分互补的单链突出端部分。例如,当用限制酶EcoRI 来消化DNA时,所得到的双链片段可在任一末端与单链突出端 5’-AATT-3’侧接,携带单链突出端5’-AATT-3’的衔接子可通过突出区域之间的互补性与该片段杂交。这种衔接子与片段的“粘性末端”杂交可以有助于衔接子与片段的连接。平端连接也可以是可能的。可以利用Klenow片段的核酸外切酶活性将平端转化为粘性末端。例如,当用PvuII消化DNA时,通过在dTTP和dCTP存在的情况下以Klenow温育片段,可将平端转化为两个碱基对突出端。通过填补突出端或去除突出端也可将突出端转化为平端。

可以通过使用连接酶进行连接。示例性连接酶可以包括 Ampligase热稳定DNA连接酶、大肠杆菌DNA连接酶、Taq DNA 连接酶、T7 DNA连接酶、T3 DNA连接酶、9°N DNA连接酶、 ElectroLigase(NEB)、DNA连接酶、RNA连接酶、T4 DNA连接酶、DNA连接酶I、DNA连接酶III和DNA连接酶IV。连接方法可以包括利用T4 DNA连接酶,其催化具有平端和粘性末端的双链体DNA或RNA中并列的5’磷酸和3’羟基末端之间形成磷酸二酯键;Taq DNA连接酶,其催化与互补靶DNA杂交的两个相邻寡核苷酸的并列5’磷酸和3’羟基末端之间形成磷酸二酯键;大肠杆菌 DNA连接酶,其催化含有粘性末端的双链体DNA中并列的5’磷酸和3’羟基末端之间形成磷酸二酯键;和T4 RNA连接酶,其通过形成3’至5’磷酸二酯键来催化5’磷酰基封端的核酸供体与3’羟基封端的核酸受体的连接。将衔接物与具有通过切割可切割5’核苷酸所生成的突出端的核酸连接的任何公开方法的连接效率可以为>50%、 >60%、>70%、>80%、>90%、>95%、>98%、>99%或>99.5%。

在一些实施方案中,采用双链衔接子,并且仅一条链与引物延伸产物相连接。可以选择性地阻断衔接子一条链的连接。例如,可将衔接子的一条链设计成在衔接子该链的5’端和靶核酸的3’端之间引入一个或多个核苷酸的缺口。衔接子5’端磷酸的缺失可以阻断此5’端与可获取的3’OH的连接。

测序

可对包含与衔接子连接的单链多核苷酸的双链产物进行测序。示例性测序技术可以包括,例如乳液PCR(来自Roche 454的焦磷酸测序、来自Ion Torrent的半导体测序、来自Life Technologies的 SOLiD连接测序、来自Intelligent Biosystems的合成测序),流动池上的桥式扩增(例如Solexa/lllumina)、Wildfire technology的等温测序(LifeTechnologies)或通过滚环扩增生成的滚环集落 (rolonies)/纳米球(CompleteGenomics、Intelligent Biosystems、 Polonator)。测序技术,如允许在无需提前克隆扩增的情况下直接对单个分子进行测序的Heliscope(Helicos)、SMRT技术(PacificBiosciences)或纳米孔测序(Oxford Nanopore)可以是合适的测序平台。

样品

在本公开内容的方法中所用的样品可以包括含有核酸的各种来源和组合物。样品可以为生物样品,但该术语还包括其他样品,例如,包含核酸,诸如例如包含已纯化核酸的PCR产物或组合物的人造样品。示例性样品可以包括但不限于全血;血液制品;红血球;白血球;白膜层;拭子;尿;痰;唾液;精液;淋巴液;羊水;脑脊液;腹腔积液;胸腔积液;活检样品;囊肿液;滑液;玻璃体液;房水;囊液;眼清洗液;眼吸出物;血浆;血清;肺灌洗液;肺吸出物;动物,包括人类或植物组织,包括但不限于肝脏、脾脏、肾脏、肺、肠、脑、心脏、肌肉、胰腺、细胞培养物,以及从上述样品或者可能存在于样品之上或之中的任何细胞和微生物以及病毒获得的裂解物、提取物或物质和级分。从含有核酸的临床或法医环境获得的材料也可在术语“样品”意指的含义内。样品可以为来源于人类、动物、植物、细菌或真菌的生物样品。样品可以源自细胞、组织和/或器官。样品还可以是经处理的样品,诸如保存的、固定的和/或稳定的样品。样品可以包含RNA。样品可以包含DNA。

试剂盒

本公开内容提供了试剂盒。试剂盒可以包含用于实施本公开内容的方法的试剂。试剂盒可以包含本公开内容的引物(例如,具有 5’可切割端的引物)。试剂盒可以包含引物(例如随机引物)库。试剂盒可以包含靶标特异性引物。试剂盒可以包含不同的靶标特异性引物库。

试剂盒可以包含一种或多种衔接子、聚合酶、切割剂和/或连接酶。试剂盒可以包含用于引物延伸的试剂,如dNTP和/或NTP。试剂盒可以包含缓冲液。缓冲液可用于试剂盒中所有物品的稀释、激活和/或重构。可将试剂盒维持在室温下。可将试剂盒维持在4℃。可将试剂盒冷冻。

试剂盒可以包含使用说明书。说明书可以是手写的或电子的。使用说明书可以描述如何在本公开内容的方法中使用试剂盒。例如,使用说明书可以描述以下方法:使单链多核苷酸样品与来自试剂盒的随机引物库相接触;延伸该引物以生成与单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;使该双链双链体变性为其单个链;使引物库与单个第一延伸产物链杂交;延伸该引物以生成与第一延伸产物杂交的第二延伸产物,从而产生第二双链双链体;切割该第二双链双链体的一个或多个5’可切割端,从而生成一个或多个核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸突出端相连接。

在一些情况下,使用说明书可以描述以下方法:使单链多核苷酸样品与来自试剂盒的靶标特异性引物库接触;延伸该引物以生成与单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;使该双链双链体变性为其单个链;使引物库与单个第一延伸产物链杂交;延伸该引物以生成与第一延伸产物杂交的第二延伸产物,从而产生第二双链双链体;切割第二双链双链体的一个或多个5’可切割端,从而生成一个或多个核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸突出端相连接,其中仅执行两个延伸步骤。

在一些情况下,使用说明书可以描述以下方法:使单链多核苷酸样品与来自试剂盒的随机引物库相接触;延伸该引物以生成与单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;切割第二双链双链体的一个或多个5’可切割端,从而生成一个或多个核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸突出端相连接,其中仅执行一轮引物延伸。

在一些情况下,使用说明书可以描述以下方法:使单链多核苷酸样品与来自试剂盒的随机引物库相接触;延伸该引物以生成与单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;使双链双链体变性为其单个链;使靶标特异性引物库与单个第一延伸产物链杂交;延伸该引物以生成与第一延伸产物杂交的第二延伸产物,从而产生第二双链双链体;切割第二双链双链体的一个或多个5’可切割端,从而生成一个或多个核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸突出端相连接,其中仅执行两个延伸步骤。

尽管本文中已经示出并描述了本发明的优选实施方式,但对于本领域技术人员显而易见的是,这些实施方式仅以示例的方式提供。本领域技术人员现将在不偏离本发明的情况下想到许多变形、改变和替换。应当理解,在实践本发明的过程中可以采用对本文所描述的本发明实施方式的各种替代方案。旨在以所附权利要求来限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同项。

实施例

实施例1:DNA的单扩增

按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP (或含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。按照适用于聚合酶的温育时间和条件,由经修饰的六聚体进行单延伸。采用具有5’-3’核酸酶活性的DNA聚合酶I来去除由于延伸而超出模板分子的突出端。在延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接子包含第二配对端衔接子的序列,该第二配对端衔接子包含与延伸产物上的突出端互补的突出端。第二衔接子包含第一配对端衔接子的序列,该第一配对端衔接子包含将与延伸产物两端之一的平端连接的平端。然后可选地,选择该反应产物的大小并将反应直接置于可根据所使用的衔接子进行选择的索引化(indexing)PCR反应中。在可选PCR后,选择样品的大小以适合新一代测序的大小范围。图9中示出了本公开内容的单次扩增法的示例性图解。

实施例2:DNA的双扩增

图10中示出了本公开内容的单扩增法的示例性图解。按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。从经修饰的六聚体开始的第一延伸遵循适用于聚合酶的温育时间和条件。一旦延伸完成,样品即变性,并且如果必要,则将额外的聚合酶加入样品。第二延伸遵循与第一延伸相同的条件。在第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有衔接子(例如Illumina衔接子)的TA连接反应。然后可选地,选择该反应产物的大小并按照标准索引化 PCR程序将反应产物直接置于索引化PCR反应中。备选地,可以将改变的衔接子与非基于PCR的方法一起使用。在PCR后,选择样品的大小以适合新一代测序的大小范围。

例如,图3描绘了通过双扩增方法来制备的样品制备。第一泳道含有O’GeneRuler1kb加DNA梯。次亮的条带为500bp。下面的条带对应于400、300和200bp。第二泳道示出了以150ng DNA开始的测试样品。然后利用双扩增法处理样品以产生衔接物连接的核酸片段。第三泳道以75ng DNA开始,然后利用双扩增法处理以产生衔接物连接的核酸片段。第四泳道以150ng DNA开始,然后利用双扩增法处理以产生衔接物连接的核酸片段。第五泳道以75ngDNA开始,然后利用双扩增法处理以产生衔接物连接的核酸片段。第五泳道是与第一泳道中使用的相同的分子量标准梯。PCR之后的每种最终产物的浓度为:泳道2:21ng/μl;泳道3:34.3ng/μl;泳道4:25.8ng/μl;泳道5:27.5ng/μl。

图4图示了来自图3的样品在1.5%琼脂糖凝胶上的再扩增产物。为了从图3中低于200bp所示的衔接子-衔接子产物中去除衔接物连接的核酸文库片段,通过约220-350bp的凝胶切除对样品的大小进行选择,该范围对应于最亮尺寸范围的最小值和最大值。对凝胶切除的样品进行柱纯化,并将其用作再扩增PCR反应的模板。第一泳道含有O’GeneRuler1kb加DNA梯。最亮的条带下方为 500bp。下面的条带对应于400、300和200bp。第二泳道示出了来自图3第二泳道、经大小选择的产物的再扩增产物,其以按照双扩增法处理的150ng模板开始。第三泳道示出了来自图3第三泳道、经大小选择的产物的再扩增产物,其以按照双扩增法处理的75ng 模板开始。第四泳道示出了来自图3第四泳道、经大小选择的产物的再扩增产物,其以按照双扩增法处理的150ng模板开始。第五泳道示出了来自图3第五泳道、经大小选择的产物的再扩增产物,其以按照双扩增法处理的75ng模板开始。第六泳道是与第一泳道中使用的相同的分子量标准梯。定性地,样品显示在大小选择后得以扩增。

图5描绘了描述具有适当对照的双扩增程序的第二次重复尝试的1.5%琼脂糖凝胶。第一泳道含有O’GeneRuler 1kb加DNA梯。最亮的条带下方对应于500bp。下面的条带对应于400、300和200bp。第二泳道示出了以150ng DNA开始的测试样品。然后利用双扩增法处理样品以产生衔接物连接的核酸片段。第三泳道为150ng DNA,其被片段化但没有经历双扩增法,并在琼脂糖凝胶上立即流出。第四泳道在不存在DNA和经修饰的六聚体的情况下经历双扩增法,但含有Illumina衔接子。第五泳道在不存在DNA的情况下经历双扩增方案,但含有经修饰的六聚体和Illumina衔接子。第六泳道经历双扩增过程,但缺少DNA输入且仅含有在连接反应期间的衔接子。第七泳道为阴性对照反应,其在不存在任何DNA、经修饰的六聚体和衔接子的情况下经历双扩增方案。第八泳道与第一泳道相同。

图6描绘了图3中的程序条件在1.5%琼脂糖凝胶上的重复。第一泳道含有O’GeneRuler 1kb加DNA梯。最亮的条带下方对应于500bp。下面的条带对应于400、300和200bp。第二泳道示出了具有150ng起始DNA的样品。第三泳道示出了具有150bp起始 DNA的样品。第四泳道示出了具有75ng起始DNA的样品。第五泳道示出了具有75ng DNA的样品,该DNA被片段化但没有经历双重扩增方案,并立即流出琼脂糖凝胶。第六泳道为不含DNA的阴性对照。第七泳道与第一泳道相同。

图7示出了图3中的程序条件在1.5%琼脂糖凝胶上的重复。第一泳道含有O’GeneRuler 1kb加DNA分子量标准梯。最亮的条带下方对应于500bp。下面的条带对应于400、300和200bp。泳道 2-7是按照双扩增方案处理的150ng起始DNA的产物。泳道八与泳道一相同。泳道9-14是利用双扩增方案处理的75ng起始DNA 的产物。泳道15与泳道一相同。利用Qubit HS dsDNA试剂盒对每个泳道中的dsDNA产物的浓度进行定量,并在图8中示出。

图8描绘了来自图7的重复结果。x轴为DNA输入,y轴为来自重复的双扩增方案的DNA输出浓度。圆形和正方形表示平均值,而条棒则对应于最小和最大输出范围。圆形表示按照双扩增方案所处理的150ng输入DNA的产物,正方形表示按照双扩增方案处理的75ng输入DNA的产物。

为了确定能够成功生成文库的DNA的量,根据单扩增法来处理15ng、5ng和500pg的DNA。如通过安捷伦生物分析仪和qPCR 所测量的,采用15ng和5ng样品均产生成功的文库。500pg样品的结果则不确定。

实施例3:单一反应混合物或容器中的RNA双扩增

按照新一代测序的标准样品制备程序将mRNA片段化。在可逆修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的 dNTP)、逆转录酶(RT)、RNAse抑制剂和缓冲液的混合物加入样品。从经修饰的六聚体开始的第一延伸遵循适用于RT的温育时间和条件。一旦延伸完成,样品即变性并猝灭,并将聚合酶加入样品。第二延伸遵循适用于聚合酶的条件。在第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有衔接子(例如Illumina) 的TA连接反应。然后可选地,选择该反应产物的大小并按照标准索引化PCR程序将反应产物直接置于索引化PCR反应中。备选地,可以将改变的衔接子与非基于PCR的方法一起使用。在PCR后,选择样品的大小以适合新一代测序的大小范围。

实施例4:RNA的双纯化双扩增

按照新一代测序的标准样品制备程序将mRNA片段化。在随机六聚体存在的情况下,将样品立即变性。将dNTP、逆转录酶(RT) 和缓冲液的混合物加入样品。从六聚体开始的第一延伸遵循适用于 RT的温育时间和条件。一旦延伸完成,即按照标准程序来纯化样品。接下来,将可逆修饰的随机六聚体加入样品并使其变性,并将聚合酶加入样品。第二延伸遵循适用于利用dNTP,含有dUTP、rA、 rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP的聚合酶的条件。在第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如,来自Illumina)的TA/平端连接反应。一个衔接子包含第二配对端衔接子的序列,该第二配对端衔接子含有与双延伸产物上的突出端互补的突出端。第二衔接子包含第一配对端衔接子的序列,该第一配对端衔接子包含可与延伸产物一侧上的平端连接的平端。可选地,选择该反应产物的大小并将反应产物直接置于可根据所使用的衔接子进行选择的索引化PCR反应中。在可选的PCR后,选择样品的大小以适合新一代测序的大小范围。

实施例5:采用具有可逆修饰随机六聚体引物的单延伸的靶向扩增

按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰的随机六聚体存在的情况下,将样品立即变性,并将 dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。按照适用于聚合酶的温育时间和条件,从经修饰的六聚体进行单延伸。在延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接子包含与第二配对端衔接子相似的经修饰的序列,该第二配对端衔接子包含与延伸产物上的突出端互补的突出端。第二衔接子包含第一配对端衔接子的经修饰的序列,该第一配对端衔接子包含将与延伸产物两端之一的平端连接的平端。

如果这些衔接子不足以结合用于测序的流动池,则可以执行索引化PCR反应以并入适当的序列。索引化PCR反应可用于给样品加上标记或条码。可选地,选择连接反应产物的大小并将反应产物直接置于索引化PCR反应中。该反应包含索引化引物、多重引物和包含用于结合流动池的适当的测序寡核苷酸序列的靶标特异性引物。在PCR反应后,选择样品的大小以适合新一代测序的大小范围。

实施例6:采用具有可逆修饰随机六聚体的双扩增的靶向扩增替代方法

按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰的随机六聚体存在的情况下,将样品立即变性、猝灭,并将dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。从经修饰的六聚体开始的第一延伸遵循适用于聚合酶的温育时间和条件。一旦延伸完成,即将样品变性、猝灭,并将额外的聚合酶加入样品。第二延伸遵循与第一延伸相同的条件。在第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如 Illumina衔接子)的TA连接反应。

如果这些衔接子不足以结合用于测序的流动池,则可以执行索引化反应以并入适当的序列。可选地,选择连接反应产物的大小,并将反应产物直接置于索引化PCR反应中。该反应包含索引化引物、多重引物和含有用于结合流动池的适当寡核苷酸序列的靶标特异性引物。在PCR后,选择样品的大小以适合新一代测序的大小范围。

实施例7:靶向扩增的替代方法-具有可逆修饰靶向引物的单扩增

图11中示出了本公开内容的单扩增法的示例性图解。按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰靶向引物存在的情况下,将样品立即变性、猝灭,并将dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的 dNTP)、聚合酶和缓冲液的混合物加入样品。从经修饰的靶向引物开始的第一延伸遵循适用于聚合酶的温育时间和条件。在聚合酶延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接子包含第二配对端衔接子,如第二Illumina衔接子的序列,该第二配对端衔接子包含与延伸产物上的突出端互补的突出端。第二衔接子包含第一配对端衔接子,如第一Illumina衔接子的序列,该第一配对端衔接子包含将与延伸产物两端之一的平端连接的平端。然后可选地,选择该反应产物的大小,并将反应产物直接置于可根据所使用的衔接子进行选择的索引化PCR反应中。在可选PCR后,选择样品的大小以适合新一代测序的大小范围。

实施例8:靶向扩增的替代方法-具有可逆修饰靶向引物的双扩增

图12中示出了本公开内容的单扩增法的示例性图解。按照新一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰靶向引物存在的情况下,将样品立即变性,并将dNTP(或含有dUTP、 rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。一旦延伸完成,即将经修饰的随机六聚体加入样品并使其变性、猝灭,并将额外的聚合酶加入样品。第二延伸遵循与第一延伸相同的条件。在第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处理),并将样品加入含有衔接子(例如Illumina衔接子)的 TA连接反应。然后可选地,选择该反应产物的大小并按照标准索引化PCR程序将反应产物直接置于索引化PCR反应中。备选地,可以将改变的衔接子与非基于PCR的方法一起使用。在PCR后,选择样品的大小以适合新一代测序的大小范围。

实施例9:生成包含突出端和随机条码的衔接物

图13示出了用来形成用于制备新一代测序文库的衔接物的标准方法。在图13中,包含互补序列的两个寡核苷酸在选择性条件下杂交以产生双链衔接物。图14是使用本公开内容的方法产生包含随机条码序列的衔接物的方法的示例性图解。第一寡核苷酸库(1410)包含含有与第二寡核苷酸库(1415)中的序列互补的序列的寡核苷酸。除了所述互补序列之外,第二寡核苷酸还包含通过在其5’端合成而并入的随机核苷酸,在其更5’侧是一个或多个可切割核苷酸。此类可切割核苷酸可以为RNA核苷酸。将两个寡核苷酸库混合并允许其杂交。用dNTP、缓冲液和聚合酶来处理双链产物 (1420),以便延伸第一寡核苷酸使其包含与随机条码和可切割的 5’核苷酸(1425)互补的序列。然后切割(1430)包含选自rU、rA、 rC、rG或dU的核苷酸的可切割5’核苷酸。通过用RNaseH处理,或在dU的情况下,通过用尿嘧啶-DNA糖基化酶处理来完成切割以生成包含至少一个突出端的最终衔接子产物(1430)。图15示出了与图14相同的程序,不同之处在于寡核苷酸2(1515)包含寡核苷酸1(1510)的序列,此外寡核苷酸2仅具有额外的随机条码和其5’端的一个或多个可切割核苷酸。

实施例10:制备没有扩增错误的文库

按照新一代测序的标准样品制备程序将基因组DNA片段化。在经修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP 和一种多种可切割的dNTP、聚合酶和缓冲液的混合物加入样品。按照适用于聚合酶的温育时间和条件,从经修饰的六聚体进行单延伸。利用具有5’-3’核酸酶活性的DNA聚合酶I来去除由于延伸而超出模板分子的突出端。在延伸完成之后,用生成突出端的切割剂处理样品并切割延伸链内的一个或多个核苷酸。然后利用标准纯化程序来纯化样品。处理和纯化后,文库包含两端均具有衔接物序列的单链模板序列,同时延伸链被切割,使得文库具有衔接物序列的两端不再是连续的。通过该方法制备的文库没有延伸或PCR诱导的错误,因为只有模板链具有桥式扩增和测序所必需的两个衔接物序列。

技术分类

06120113244214