掌桥专利:专业的专利平台
掌桥专利
首页

产生随机寡核苷酸并确定其序列的方法

文献发布时间:2023-06-19 11:55:48



相关申请的交叉引用

本申请要求于2018年11月30日提交的共同待决的美国临时专利申请号62/773,671的优先权,所述专利申请的全部内容通过引用并入本文。

背景技术

通过组合不同的核酸,可以产生大量不同的寡核苷酸/多核苷酸。当前,这些分子的合成需要精确度,因此在产生寡核苷酸之前所述分子中存在的核苷酸碱基的序列是已知的。

在某些情况下,需要大量的随机寡核苷酸。例如,寡核苷酸可以充当独特的分子标签,标记单个DNA分子。这种独特的标记可用于一些分析,例如,在扩增之前标记分子以提高分析的准确性。参见Zheng等人,(2014)用于靶向下一代测序的锚定多重PCR(Anchoredmultiplex PCR for targeted next-generation sequencing),Nature Medicine20:1479-84。最近的一项发明将独特的分子标签用于密码术(参见Sawaya的PCT/US17/058076申请,PCT公开WO 2018/081113)。这种密码术技术需要生成大量独特的分子标签,并且还需要知晓这些标签的序列。

因此,需要尽可能便宜且高效地产生大量具有已知序列的独特寡核苷酸。

发明内容

本文描述的本发明涉及寡核苷酸和/或多核苷酸的合成。本文描述的方法涉及核酸的随机序列的产生,从而产生寡核苷酸,其中寡核苷酸的序列在产生后直到全部或部分确定之前都是未知的。在一个方面,本发明的某些实施方式包括产生寡核苷酸的方法,所述方法包括三个步骤:a)通过随机地将核苷酸添加至分子来产生寡核苷酸和/或多核苷酸;b)确定存在于所产生的分子中的核苷酸序列;以及c)将所产生的分子加工成有用的形式。

为了产生随机寡核苷酸,某些实施方式使用亚磷酰胺化学来合成核苷酸。在一些实施方式中,通过自动化仪器实现对亚磷酰胺反应的控制,所述自动化仪器例如但不限于调节反应中使用的化学试剂的微流体柱和/或用于定位反应的微阵列和/或微孔。

在一些实施方式中,当产生随机寡核苷酸时,使用空间控制来最小化反应中使用的试剂和/或材料。空间控制方法可以由本领域技术人员选择,并且可以包括但不限于用于控制基于光的反应的微镜装置和/或用于调节反应中使用的试剂的喷墨技术。

在一些实施方式中,当产生随机寡核苷酸时,使用酶促方法合成寡核苷酸,例如使用末端脱氧核苷酸转移酶。在这样的实施方式中,可以设计酶以优化反应并确保寡核苷酸是随机产生的。

在一些实施方式中,产生相对短的随机寡核苷酸,然后随机组合以形成较长的随机寡核苷酸。在一些实施方式中,随机寡核苷酸的这种随机组合是多步骤过程,其中将多个短随机寡核苷酸组合以形成较长的随机寡核苷酸,继而将所述较长的随机核苷酸组合以形成更长的寡核苷酸,依此类推直到产生所需大小的分子。

在一些实施方式中,产生的随机寡核苷酸的长度比期望的长。在这样的实施方式中,将所产生的分子切割、消化和/或裂解以形成较短的分子。

在一些实施方式中,在随机寡核苷酸产生后将其按大小分开。在这些实施方式中的一些中,不需要的大小的随机产生的分子被丢弃或重新用于该过程的先前阶段,例如用于随机产生更多的分子。

在一些实施方式中,随机寡核苷酸附接至其他寡核苷酸。在这些实施方式中,其他寡核苷酸可以用作在随机产生分子的应用中利用的功能元件。在一些实施方式中,随机寡核苷酸直接在其他寡核苷酸上产生。例如,包含一组已知寡核苷酸的微阵列可以用作可在其上随机产生寡核苷酸的底物,从而产生具有部分已知序列和部分未知序列的分子。

在一些实施方式中,所产生的随机寡核苷酸仅是部分随机的,因此在分子产生期间,所述分子的部分不完全是随机的。在这些实施方式中,所产生的分子的不完全随机方面可能是完全已知的、部分已知的和/或部分估计的。

在一些实施方式中,过滤随机寡核苷酸以去除特定的不需要的分子。这些不需要的分子可以包括不需要的大小和/或不需要的序列组成和/或具有对于那些分子的预期用途不需要的任何其他性质的分子。

在一些实施方式中,随机寡核苷酸必须在确定其序列之前加工和/或修饰,例如,将它们连接到其他寡核苷酸以适配给定序列技术中使用的方案。

为了确定随机产生的分子的核苷酸序列,某些实施方式在产生随机寡核苷酸时直接确定序列。也就是说,在一个或多个核苷酸被添加至分子之后立即或之后不久,确定、测量或更新随机产生的分子的序列。在这样的实施方式中,可以使用例如产生可观测反应副产物的微孔定位反应来直接观测添加所述核苷酸的反应。

在一些实施方式中,在分子已经全部产生之后确定随机产生的分子的序列。所述序列的确定需要某些设备,例如来自Pacific Biosciences的实时测序仪和/或纳米孔测序仪,它们可以准确地对单个分子进行测序。确定序列后,可以回收具有所需序列的分子。

在某些情况下,关于随机产生的分子中存在的确切核苷酸序列,仍然存在不确定性。与多核苷酸测序的大多数应用通常预期的低不确定性相比,这种不确定性可以保持相对较高。

在一些实施方式中,获得了随机寡核苷酸的识别标志(signature),其对应于寡核苷酸的序列,但是不代表分子中存在的核苷酸的确切序列。例如,随机寡核苷酸可以穿过可获得识别标志的纳米孔。这种识别标志可能不足以获得随机寡核苷酸的确切序列,但是如果再次将随机寡核苷酸传送通过类似的纳米孔或类似的装置,则识别标志可用于鉴定所述随机寡核苷酸。

在一些实施方式中,使用例如但不限于柱分离的方法,通过选择大小来加工随机产生的分子。在某些实施方式中,筛选寡核苷酸的特定核苷酸序列,去除具有不需要序列的寡核苷酸。在这些实施方式中,可以将具有与不需要的寡核苷酸互补的序列的寡核苷酸附接至例如微阵列的表面,或者通过使用附接至寡核苷酸的磁珠,并且这可用于从需要的寡核苷酸中过滤不需要的寡核苷酸。

在一些实施方式中,使用限制酶来消化具有特定序列的寡核苷酸。这种消化减小了寡核苷酸的大小,将它们分成较小的寡核苷酸。在一些实施方式中,可以对这些较小的寡核苷酸进行大小选择并将其与较大的寡核苷酸分离。

在一些实施方式中,使用例如T-A连接或本领域技术人员使用的任何其他方法,将随机产生的寡核苷酸连接到其他寡核苷酸上。这种连接可以用于将随机寡核苷酸并入用于其他目的的技术中。

在一些实施方式中,随机产生的寡核苷酸是单链的,并且产生了互补链,使得最终分子全部都是完全双链的。在一些实施方式中,使用聚合酶和随机的简并引物产生互补链。在一些实施方式中,已经产生的分子是部分双链的,并且聚合酶不需要引物以产生互补链的其余部分。

附图说明

图1描绘了如本文所述的在底物上产生随机寡核苷酸的工作流程图。

图2描绘了如本文所述的从较小的寡核苷酸产生随机寡核苷酸的工作流程图。

图3A-3C描绘了如本文所述的可以产生随机寡核苷酸并随后确定其序列的阶段。

图4A-4C描绘了如本文所述的可以产生随机寡核苷酸并随后确定其序列的阶段。

具体实施方式

本文描述了各种实施方式,并且本领域技术人员应认识到,本文描述的实施方式仅作为实例提供。本领域技术人员可以在不脱离本发明的情况下改变、替代和/或变更本发明的某些方面。本文描述的本发明不限于特定的材料、试剂或特定的方法。本文使用的术语用于描述实现本发明所需的本发明的各个方面,而无意于进行限制。

本文描述的技术经常使用单数形式“一个”、“一种”或“所述”来引用特定例子,但是以单数形式引用这些例子并不将本发明限于这些例子孤立或单独地出现的应用。本领域技术人员可以确定这些例子对于本发明的应用必须多久出现一次,以及这些例子是并行出现还是串联出现。

如本文所用,当提及分子时,“随机”或“随机产生”是指具有随机核苷酸序列的分子,例如寡核苷酸和/或多核苷酸,因为该分子是通过随机地向分子添加核苷酸而产生的。

如本文所用,术语“寡核苷酸”是指包含通过某种形式的糖磷酸主链连接在一起的核苷酸或核苷酸碱基序列的分子。连接在一起的核苷酸的数目可以是任何数目,小至两个,大至一千或更多个。如本文所用,术语“寡核苷酸”可与术语“多核苷酸”互换。术语“寡核苷酸”或“多核苷酸”所指的核酸聚合物的确切长度可以由本领域技术人员确定。

如本文所用,术语“识别标志”是指可以对分子进行的任何化学、生物学或物理测量,然后所述测量可以在将来在存在或不存在完全鉴定下用于测量该分子。

当前的核苷酸合成方法具有至少两种特性。首先,使用已知序列的核酸产生所需的寡核苷酸。通常期望以非常高的精度,例如高于99%精度,创建新产生的寡核苷酸。其次,通常期望寡核苷酸的产生大量进行,即,许多相同的寡核苷酸同时产生。

根据本文描述的本发明,在产生随机寡核苷酸之前,不一定需要知道所述随机寡核苷酸的序列,只要可以在其使用前确定其序列。此外,对于一些应用,例如但不限于如2017年10月24日提交的Sawaya的PCT/US17/058076,PCT申请公开号WO 2018/081113(其通过引用并入本文)中描述的分子密码术,所述寡核苷酸的确切序列不需要完全或全部已知。对于一些应用,仅需要足够的序列知识即可将其与其他随机寡核苷酸区分开。实际上,寡核苷酸的核苷酸序列不需要已知,只要在使用寡核苷酸使用之前就已经确定了所述寡核苷酸的“识别标志”并且所述识别标志足够不同以使所述寡核苷酸与其他随机寡核苷酸区分开即可。

对于一些应用,随机寡核苷酸的唯一性也是必需的。在这些应用中,例如分子密码术(PCT/US17/058076,PCT申请公开号WO2018/081113)中,具有多于一个具有完全相同序列的寡核苷酸是不太理想的。尽管这些应用中的一些应用可以容忍非唯一寡核苷酸的存在,但是具有许多(例如数千、数万、或数百万或更多个)具有完全相同序列的寡核苷酸几乎没有用。因此,与现有的核苷酸合成方法相比,本发明采用了独特的方法并解决了独特的挑战。

本发明通过以下步骤产生独特的、随机的寡核苷酸:a)通过随机地将至少一个核苷酸添加至分子而产生至少一个包含核酸的分子,其中所产生的分子是随机寡核苷酸;b)确定所述随机寡核苷酸的核苷酸序列;以及c)使用所述随机寡核苷酸的某些特征来选择随机寡核苷酸。在某些实施方式中,选择随机寡核苷酸是加工寡核苷酸以准备将其用于各种用途的一部分。在某些实施方式中,测量所述分子。在某些实施方式中,可以使用用于测量寡核苷酸的类似或相同的测量技术来鉴定随机寡核苷酸。

可以通过本领域技术人员已知的一系列方法来实现分子和寡核苷酸的合成以产生如本文所述的分子。这些方法可以包括但不限于亚磷酰胺化学和/或基于酶的合成。

多种方法可用于寡核苷酸合成,如Hughes和Ellington(2017)“合成DNA的合成和组装:将合成物纳入合成生物学(Synthetic DNA synthesis and assembly:putting thesynthetic in synthetic biology)”.Perspect.Biol.;9:a023812中所述;以及Kosuri和Church(2014)“大规模的从头DNA合成:技术和应用(Large-scale de novo DNAsynthesis:technologies and applications).”Nature Methods;11:499-507中所述,各自通过引用并入本文。这些方法可单独利用或组合利用以生成随机寡核苷酸。本文描述的产生随机寡核苷酸的方法是可以在本发明中利用的实例,但是本发明不限于特定的寡核苷酸合成方法。随着寡核苷酸合成技术的发展,在本发明中随机寡核苷酸的产生中可以利用寡核苷酸合成的替代方法。

当前,使用亚磷酰胺化学在微阵列合成仪上进行大规模、低成本的核苷酸合成。用这种方法进行的合成允许以高序列精度并行产生多个寡核苷酸。关于这些方法的细节描述于Heller(2002)DNA微阵列技术:装置、系统和应用(DNA microarray technology:devices,systems,and applications).Annu Rev Biomed Eng.,4:129-53;以及LeProust等人,(2010)通过新型脱嘌呤控制方法合成长(150个单元)寡核苷酸的高质量文库(Synthesis of high-quality libraries of long(150mer)oligonucleotides by anovel depurination controlled process).Nucleic Acids Res.38(8):2522-40,各自通过引用并入本文。

在某些实施方式中,使用亚磷酰胺合成在微阵列上或在微孔中并行合成具有特定序列的寡核苷酸(利用当前技术,例如但不限于上述LeProust;以及Bruhn等人的美国专利号6,458,583;Gao等人的美国专利号7,544,793;Banyai等人的美国专利号9,555,388,所述文献各自通过引用并入本文),并且这些相同的寡核苷酸用作底物,然后在其上产生随机寡核苷酸。

参看图1,步骤101在接头分子103上产生底物寡核苷酸102,所述接头分子103可以与例如但不限于微阵列或磁珠104连接。在步骤105中,在底物寡核苷酸102上产生随机寡核苷酸106。在步骤107中,在生长的分子上产生非随机或已知的寡核苷酸108。步骤109可以是所产生分子供使用而进行的加工,或者以任何组合重复步骤105或107,其可以根据需要重复多次。

在一些实施方式中,底物寡核苷酸102可以具有促进随机寡核苷酸的未来使用的性质。例如,底物寡核苷酸102可以包含合适的序列,其可以用作在聚合酶链反应(PCR)方案中用于核苷酸扩增的引物。在一些实施方式中,这些底物寡核苷酸102还可以用作索引以帮助鉴定所产生的寡核苷酸。此外,在一些实施方式中,这些底物寡核苷酸102还可以充当衔接子,或者提供不限于本文所讨论功能的其他功能。在一些实施方式中,与已知序列的寡核苷酸连接的所产生的随机寡核苷酸106然后可以充当底物,以产生具有特定的已知序列的寡核苷酸108。在此之后,在一些实施方式中,还可以在该分子上产生更多的随机寡核苷酸106,并且在一些实施方式中,然后可以产生更多的已知序列的寡核苷酸,并且以此类推,在已知和未知的随机序列部分的产生之间交替,直到产生所需的分子。

在一些实施方式中,在微阵列上串联合成一组相同的寡核苷酸以用作合成随机寡核苷酸的底物后,使用亚磷酰胺合成在这些底物寡核苷酸102上进行随机寡核苷酸合成。与传统的微阵列上合成相反,用于产生随机寡核苷酸106的随机合成是无方向的,或者在一些实施方式中是部分定向的,使得所产生的确切序列是完全未知的,或者当部分定向时是部分未知的。如本文所用,“部分定向”是指以并非完全随机的方式将选择的核苷酸或寡核苷酸添加至寡核苷酸。

在一些实施方式中,使用酶促合成DNA的蛋白质,例如末端脱氧核苷酸转移酶(TdT),来合成随机寡核苷酸。在一些实施方式中,这些蛋白质酶经过专门设计以合成随机寡核苷酸,使得它们不会合成依赖于先前由该酶产生的随机寡核苷酸的任何序列部分的特定寡核苷酸。

在一些实施方式中,在一个系统中的微孔内合成随机寡核苷酸,该系统类似于但不限于Williams的美国专利号9,845,501;和Turner等人的美国专利号7,302,146,所述专利各自通过引用并入本文。在这样的实施方式中,随机寡核苷酸的合成包括标记分子的使用,例如在Williams的美国专利号9,845,501和Korlach的美国专利号8,580,539中讨论的标记技术,所述专利各自通过引用并入本文。所述分子的标记用于确定在将核苷酸添加至随机寡核苷酸之后立即或之后不久合成的随机寡核苷酸的序列。在这些实施方式中,通过该方法产生的随机寡核苷酸仅在短时间内是未知序列。新添加的核苷酸变成已知的并由此确定寡核苷酸的序列。在这些实施方式中,新产生的寡核苷酸变成底物寡核苷酸化学键合另一随机寡核苷酸或核苷酸的底物寡核苷酸。然后在添加随机寡核苷酸或核苷酸后确定序列。以这种方式继续进行,直到产生具有大致已知长度和大致已知或完全已知序列的随机寡核苷酸。在这样的实施方式中,所述方法在(a)随机产生寡核苷酸和(b)确定该寡核苷酸的序列之间交替。在这样的实施方式中,用于确定寡核苷酸的序列的方法在下文关于确定随机产生的寡核苷酸的序列组成的方法进一步详细讨论。

寡核苷酸的完全无方向的合成可能导致产生一些对于这些寡核苷酸的未来使用可能是有问题的随机寡核苷酸。例如,均聚物连串,例如具有“CCCC”核苷酸序列的寡核苷酸,可能导致非特异性退火和/或在某些测序平台上的测序问题(参见Xu等人,(2009)240,000个正交25个单元的DNA条形码探针的设计(Design of 240,000orthogonal25mer DNAbarcode probes),PNAS,第107卷第7期,第2289-2294页)。为了在合成之前避免这些和其他不太理想的随机寡核苷酸,在某些实施方式中可以使用喷墨技术将反应中使用的试剂进行部分定向,例如如Caren等人的美国专利号6,221,653;Okamoto等人的美国专利号6,476,215;和Schleifer等人的美国专利号6,077,674;以及Dellinger等人的美国专利号7,572,907中所述,所述专利各自通过引用并入本文。

在某些实施方式中,还可以使用微镜来调节光控反应以部分地定向反应,例如在Sandstrom的美国专利号6,545,758和Cerrina等人的美国专利号7,157,229中所述,所述专利各自通过引用并入本文。对寡核苷酸的随机合成进行部分控制的一个实例是限制给定核苷酸碱基的数量。例如,如果对于给定的应用,一连串均聚物胞嘧啶不太理想,则在合成随机寡核苷酸时,可以使用例如喷墨技术有利地定向胞嘧啶以外的核苷酸碱基。此外,可以用微镜调节光控反应。使用光控反应,可以根据在接近反应的溶液中估计或已知存在的核苷酸碱基来有利于或不有利于特定的核酸碱基。

在某些实施方式中,在产生随机寡核苷酸之后,通过直接在所述随机寡核苷酸上产生和/或将非随机寡核苷酸通过连接附接至所述随机寡核苷酸,将非随机寡核苷酸或核苷酸附接至随机寡核苷酸。

在某些实施方式中,以多步骤法产生随机寡核苷酸。所述方法包括产生至少一种较短的随机寡核苷酸。然后将较短的随机寡核苷酸组合以产生较长的随机寡核苷酸。然后可以将较长的随机寡核苷酸组合以产生更长的寡核苷酸。例如,通过使用酶的连接或通过亚磷酰胺化学定向的分子键合来组合随机核苷酸,以产生较长的寡核苷酸。在某些实施方式中,在随机寡核苷酸产生的一个或多个阶段,使用过滤步骤除去不需要的随机寡核苷酸。在某些实施方式中,所述多步骤方法包括:通过随机地将一个核苷酸添加至另一核苷酸来产生随机寡核苷酸;将第一随机寡核苷酸与另一随机寡核苷酸随机组合;筛选所述随机寡核苷酸的某些特征;去除具有某些特征的随机寡核苷酸;以及将剩余的随机寡核苷酸随机组合。筛选、去除和组合步骤可以重复以创建具有所需特征的随机寡核苷酸。

参看图2,在某些实施方式中,随机寡核苷酸包含二聚体或二聚物。二聚体202是包含两个核苷酸的寡核苷酸。考虑到存在四种不同类型的核酸碱基,A=腺苷,T=胸苷,C=胞嘧啶和G=鸟嘌呤,存在两个核苷酸的16种不同组合。因此,二聚体可以是十六种不同序列之一:AT、TA、CG、GC、CA、AC、CT、TC、GA、AG、GT、TG、AA、TT、CC、GG。

四聚体203是包含四个核苷酸的寡核苷酸。四聚体寡核苷酸具有16

在某些实施方式中,筛选不需要的寡核苷酸发生在随机寡核苷酸的产生期间。通过使用与不需要的寡核苷酸具有互补序列的寡核苷酸作为过滤器来进行筛选,所述过滤器与不需要的寡核苷酸结合以从随机寡核苷酸溶液中将它们去除。

如图2所示,一个示例性实施方式将二聚体201随机组合(202)以产生四聚体寡核苷酸203。存在16

在某些实施方式中,随机寡核苷酸与已知序列的寡核苷酸化学键合。在一些实施方式中,这些已知的寡核苷酸可以连接至随机寡核苷酸的3’和/或5’端。在一些实施方式中,该过程发生多次,从而产生包含随机寡核苷酸和已知序列的寡核苷酸的组合的寡核苷酸。

在一些实施方式中,在已经产生随机寡核苷酸之后,可以将它们过滤以去除不需要的寡核苷酸。不需要的寡核苷酸的过滤可以在随机核苷酸已经与其他寡核苷酸物理连接之前或之后进行。所述其他寡核苷酸可以具有已知序列、部分随机序列或完全未知序列。这种过滤可以通过去除不需要的寡核苷酸来进行。可以例如通过使用例如基于柱的大小分离技术基于大小过滤所产生的寡核苷酸,来去除不需要的寡核苷酸。

在某些实施方式中,去除不需要的寡核苷酸可以与其他过滤方法组合进行,例如过滤不需要的序列。不需要的序列的过滤可以通过以下任何一种方法或其组合来实现:将不需要的寡核苷酸与结合到表面或珠粒的互补寡核苷酸结合,随后从不需要的寡核苷酸洗出所需的寡核苷酸;将不需要的寡核苷酸与互补寡核苷酸结合,所述互补寡核苷酸与可以促进不需要的寡核苷酸降解的蛋白质结合;通过使用限制性核酸内切酶来切割不需要的寡核苷酸,从而减小其大小,允许随后根据大小过滤以去除不需要的寡核苷酸;和/或使用本领域技术人员已知的任何其他方法来过滤出具有不需要序列的寡核苷酸。

为了确定所产生的随机寡核苷酸的核苷酸序列,可以单独或组合使用多种测序技术。本领域技术人员可以确定最佳的、优选的测序技术,并且随着测序技术的进展,可以将那些技术用于确定根据本发明的序列。重要的是,用于确定随机寡核苷酸的核苷酸序列的测序技术必须允许随机寡核苷酸在测序后被收集以供使用,或者产生可以在随机寡核苷酸测序后被收集的拷贝或互补寡核苷酸。这种要求允许所产生的随机寡核苷酸在其序列确定后被使用。

在某些实施方式中,随机寡核苷酸必须在确定其序列之前进行加工。如本领域技术人员可以理解的,这种加工可以包括但不限于向随机寡核苷酸添加核苷酸,基于其大小或序列去除特定寡核苷酸,和/或改变存在随机寡核苷酸的溶液。加工随机寡核苷酸以准备将其用于测序的具体方法取决于要使用的测序方法。随着用于核酸链测序的方法改变,加工随机寡核苷酸以准备将其用于测序的方法也可以改变,并且本领域技术人员可以确定用于加工随机寡核苷酸以准备将其用于测序的适当方法。

在某些实施方式中,需要在测序后收集所述随机寡核苷酸。允许在测序后收集核苷酸的测序仪的一个潜在选择是Pacific Biosciences单分子实时测序仪,例如在Eid等人,(2009)“从单一聚合酶分子进行实时DNA测序(Real-Time DNA Sequencing fromSingle Polymerase Molecules)”,Science 323(5910):133-38中讨论的。其中描述的测序仪使用指示剂分子实时观测复制多核苷酸的聚合酶,该指示剂分子可以唯一地鉴定核苷酸,随着所述核苷酸在多核苷酸被复制时被并入到多核苷酸中。

对于某些可以使用本发明的情况,结果不太理想,因为在对这些多核苷酸进行测序后提取这些多核苷酸将产生超过一个拷贝的原始测序的多核苷酸。例如,如果将随机产生的寡核苷酸用于例如在申请PCT/US17/058076、WO公开WO 2018/081113中所述的分子密码术中,则重复的寡核苷酸不太理想。尽管在一些实施方式中,可以使用珠粒与被测序的多核苷酸或寡核苷酸的附接将合成的多核苷酸与原始多核苷酸分离,其他方法可能提供更好的产率。

在一些实施方式中,将合成的多核苷酸与原始多核苷酸分离的方法是随机产生单链多核苷酸或寡核苷酸,或者部分单链多核苷酸。在这样的实施方式中,在测序期间产生的分子的拷贝将是对随机产生的寡核苷酸的互补分子。假设被测序的分子不含发夹环(例如目前在Pacific Biosciences序列制备中所使用的,Travers等人的美国专利号9,404,146,各自通过引用并入本文),新合成的多核苷酸和原始的互补分子将是具有已知序列的可从测序仪中提取的随机生成的双链寡核苷酸。

在某些实施方式中,测序技术可用于直接产生随机寡核苷酸,然后立即确定其序列。测序技术通过观测指示剂分子来观测聚合酶与多核苷酸之间的反应,所述指示剂分子指示给定的核苷酸碱基已经并入待测序的多核苷酸中。在某些实施方式中,所述反应理想地由例如TdT的酶定向,其延伸随机产生的寡核苷酸。

参看图3A-C,在一些实施方式中,所述反应在含有酶“a”302的微孔301中发生。在某些实施方式中,酶302是TdT。

参看图3B,在某些实施方式中,酶302(“a”),以及在核苷酸“b”303被随机添加至寡核苷酸304之后立即或之后不久,指示剂分子“c”305可以被观测到306。

参看图3C,在某些实施方式中,使用微流体将试剂添加至307并从微孔301去除。

在一些实施方式中,随机地添加新核苷酸至寡核苷酸,因为在酶附近的溶液含有大约等量的各种核苷酸碱基。在其他实施方式中,合成随机寡核苷酸的酶周围的溶液不含相等比例的核苷酸碱基,因此,尽管仍然是随机的,但预计寡核苷酸的组成中每个核苷酸碱基的比例不相等。在一些实施方式中,酶周围的溶液经定向以含有特定比率的核苷酸碱基,以便定向随机寡核苷酸的产生。该定向可以例如有利于某些核苷酸碱基相对于其他的并入,以控制随机寡核苷酸的组成。

另一种能够在确定寡核苷酸序列后回收寡核苷酸的测序技术是纳米孔测序仪,例如通过引用并入本文的Loman和Watson(2015)“纳米孔测序的成功测试启动(Successfultest launch for nanopore sequencing)”Nature Methods第12卷,第303-304页中所述。在某些实施方式中,随机寡核苷酸是整体产生的,然后使用纳米孔测序仪确定序列,该纳米孔测序仪可直接确定随机寡核苷酸的序列,在测序后回收寡核苷酸。

在其他实施方式中,纳米孔技术用于通过使用指示剂分子来观测随机核苷酸向寡核苷酸的并入,与通过引用并入本文的Fuller等人(2016),“通过使用纳米孔阵列上带有聚合物标记的核苷酸来合成而进行的实时单分子电子DNA测序(Real-time single-moleculeelectronic DNA sequencing by synthesis using polymer-tagged nucleotides onananopore array),”PNAS,2016年5月10日,第113卷第19期,第5233-5238页(可从www.pnas.org/cgi/doi/10.1073/pnas.1601782113获得)类似但不相同。

图4A-C示出了通过使用纳米孔阵列上的聚合物标记的核苷酸来合成而进行的实时单分子电子DNA测序。这允许观测随机寡核苷酸的产生,并且在其产生之后不久或之后立即确定其序列。

参看图4A,分子401附接至紧邻纳米孔403的膜402。随机寡核苷酸406附接至分子401。在某些实施方式中,分子401是酶TdT。

参看图4B-C,在分子“a”401向随机寡核苷酸406随机地添加核苷酸404“b”之后,指示剂分子“c”405自由通过纳米孔403,产生信号。

在一些实施方式中,需要调节反应溶液中的核苷酸碱基以确保所产生的寡核苷酸的序列是完全随机的。由于序列是完全随机的,在随机寡核苷酸的任何给定位置上一个核苷酸碱基的存在不能用于预测在随机寡核苷酸的另一位置上核苷酸碱基的存在或不存在。

在已产生寡核苷酸之后立即或之后不久确定寡核苷酸的序列或者在当前正在产生寡核苷酸时确定寡核苷酸序列的实施方式中,可以在一些实施方式中控制该产生周围的溶液。在一些实施方式中,使用微流体控制机制,其中微通道调节反应溶液,允许溶液流过反应区域或微孔。在一些实施方式中,利用喷墨技术实时调节反应溶液。在一些实施方式中,将含有特定浓度的核苷酸碱基的溶液流洗经反应性表面或微孔。在一些实施方式中,使用微镜和/或对影响反应的能量方向的其他形式的控制来控制例如基于热或光的反应的定向能量。

在一些实施方式中,未确实确定随机寡核苷酸的确切序列。对于随机寡核苷酸的某些用途,可能不需要知道随机寡核苷酸的确切序列。对于随机寡核苷酸的某些用途,关于给定随机寡核苷酸的序列的不完全信息足以将使该寡核苷酸与其他随机产生的寡核苷酸区分开。因此,在一些实施方式中,从随机产生的寡核苷酸获得部分序列信息或部分不准确的序列信息。在一些实施方式中,从测序仪获得随机寡核苷酸的“识别标志”,其然后可用于鉴定随机产生的寡核苷酸和/或将其与其他随机寡核苷酸区分开。该识别标志可以是例如但不限于从随机寡核苷酸通过嵌入膜中的孔获得的电信号,或者从所述其分子与另一种分子或酶的相互作用获得的所述分子的动力学识别标志。从给定的测序方法获得的识别标志然后可以用于鉴定随机寡核苷酸。例如,当在相同或类似的测序平台上对组合的寡核苷酸进行测序时,可以在以下方案中鉴定随机寡核苷酸:将其中所述随机寡核苷酸用作已连接至所述随机寡核苷酸的另一寡核苷酸的鉴定符的方案中鉴定所述随机寡核苷酸。

通过本发明的方法产生的随机寡核苷酸可以用于各种技术中,例如分子密码术(PCT申请号PCT/US17/058076或其他需要分子水平鉴定的方法,例如美国专利公开号2015/0211050;和2015/0211061中所述的方法,所述文献各自通过引用并入本文。加工随机产生的分子的方法取决于使用随机产生的分子的技术。

在一些实施方式中,通过选择具有某些特征的某些寡核苷酸,在确定其序列之前,对随机寡核苷酸进行加工。所述加工允许有效的测序,并且由测序仪产生的核苷酸序列是准确的,并且仅对有用的寡核苷酸产生。然而,在一些实施方式中,还可能希望在已经确定寡核苷酸的序列后也对其进行加工。例如,当所产生的寡核苷酸的序列在产生之后立即或之后不久确定时,这是需要的。当产生大的随机寡核苷酸并随后确定其序列时,这也可能是需要的,并且在使用前必须将这种大的随机寡核苷酸加工成较小的寡核苷酸。

在一些实施方式中,使用选择技术,例如但不限于柱分离,通过选择大小来加工随机寡核苷酸。在需要时,可以将不需要大小的分子与所需大小的分子分离,以选择含有特定数量核苷酸碱基的分子。

在一些实施方式中,通过去除具有不太理想和/或不需要序列的寡核苷酸来筛选随机寡核苷酸的特定序列。在这些实施方式中,可以将具有与不需要的寡核苷酸互补的核苷酸序列的随机寡核苷酸附接至例如微阵列的表面,或者通过使用附接至随机寡核苷酸的磁珠。然后可以通过在微阵列上洗涤随机寡核苷酸将其引入该表面,或引入到含有磁珠的溶液中。在所述溶液已经在微阵列上洗涤后,所需的随机寡核苷酸保留在溶液中,或者当去除磁珠时保留在溶液中。本领域技术人员可以确定筛选特定寡核苷酸序列的最佳技术,以避免最终混合物中存在这些不需要的分子。

在一些实施方式中,使用限制酶来消化具有特定序列的随机寡核苷酸。这种消化减小了所述寡核苷酸的大小,将它们分成较小的寡核苷酸。这些较小的分子可以进行大小选择并与较大的寡核苷酸分开。

在一些实施方式中,使用例如T-A连接或本领域技术人员使用的任何其他方法,将随机寡核苷酸连接和/或以其他方式附接至其他寡核苷酸。这种连接可用于将随机寡核苷酸并入用于其他目的的技术中,例如美国专利公开号2015/0211050;和2015/0211061中公开的目的。

在一些实施方式中,所产生的随机寡核苷酸是单链的。在一些实施方式中,确定随机寡核苷酸的序列的方法产生单链随机寡核苷酸。如果测序的随机寡核苷酸是完全单链的并且它们的期望用途要求它们是双链的,则在一些实施方式中,使用一种技术来产生具有互补序列的链。一种这样的技术可以是使用DNA聚合酶与随机的简并引物一起产生匹配链。随机引物并非总是需要的。在一些实施方式中,在确定序列之前或期间,将随机产生的单链寡核苷酸附接至双链DNA分子。在某些实施方式中,在确定了随机产生的单链寡核苷酸的序列后,将其连接至双链DNA分子。在一些实施方式中,将随机寡核苷酸附接至具有已知序列部分的分子,可以设计特异性引物以使用聚合酶来产生互补链。

在一些实施方式中,在将随机寡核苷酸加工成它们所需的形式后,可以将它们包装并且可以用溶液中存在的序列标记该包装。在一些实施方式中,当将随机产生的分子用于分子密码术时(参见PCT/US17/058076),溶液中分子的确切序列和/或识别标志必须保持安全,并且在这些实施方式中,关于存在的序列的信息不与分子溶液包装在一起,而是可以在分开的包装中传送和/或将含有序列信息的数据文件安全地传递给合适的参与者。

尽管已经参考某些优选实施方式详细描述了本发明,但是在所描述的本发明的一个或多个独立方面的范围和精神内存在变化和修改。

相关技术
  • 产生随机寡核苷酸并确定其序列的方法
  • 将使用伪随机序列的随机数产生器解相关的方法和仪器
技术分类

06120113108787