掌桥专利:专业的专利平台
掌桥专利
首页

通过桥式扩增进行簇生成的方法和组合物

文献发布时间:2023-06-19 10:35:20


通过桥式扩增进行簇生成的方法和组合物

发明领域

本公开尤其涉及靶核酸的扩增以产生用于测序的扩增子簇,特别是在减少从样品获得序列信息中涉及的步骤的情况下。

发明背景

下一代测序(NGS)技术依赖于从单一靶核酸产生的扩增子单克隆群体的高度平行测序。NGS方法大大提高了测序速度和数据输出,从而导致当前测序平台的大量样品通量。进一步减少对模板进行测序的时间是非常期望的,但是有必要维持有用的信噪比、强度以及增加的通过滤器的簇的百分比,它们都有助于增加的数据输出和数据质量。可以通过组合分开的步骤来实现减少对测序进行模板的时间;然而,由于不相容性,通常不能组合分开的步骤。例如,一种酶的活性可以被另一种酶的产物抑制,因此需要在分开的步骤中使用酶。

发明概述

下一代测序(NGS)技术依赖于从单一靶核酸产生的扩增子单克隆群体的高度平行测序。产生扩增子的单克隆群体和进行测序需要多个步骤,并且每个步骤都增加可对样品获得有用的序列数据前需要的总时间。例如,产生扩增子的单克隆群体必需多个步骤,包括附着并随后扩增存在于阵列的扩增位点处的靶核酸。发明人已经发现,可以将用于产生单克隆扩增子的两个分开的步骤组合。在标准常规方法中,在产生单克隆扩增子期间,将扩增位点用外切核酸酶处理,然后在分开的步骤中用糖基化酶处理,所述糖基化酶在预定的位置处选择性产生单一核苷酸缺口。步骤以该顺序进行,因为产生单一核苷酸缺口也产生抑制外切核酸酶活性的结构,即3’-磷酸。出乎意料的是,发明人发现外切核酸酶和糖基化酶可以组合成一个步骤,对主要度量、读段质量、双重索引化(indexing)或基因组构建度量几乎没有不利影响或没有不利影响。由于现在可以同时进行两个步骤,因此这导致更快的测序。它还具有减少试剂数目和量的优点,从而减少消费者的总成本。

本文提供了组合物。在一个实施方案中,组合物包括尿嘧啶DNA糖基化酶、内切核酸酶和具有3'至5'单链DNA外切核酸酶活性的外切核酸酶。

还提供了方法。在一个实施方案中,方法用于制备用于测序反应的核酸。该方法包括提供具有多个扩增位点的阵列。扩增位点包括附着于扩增位点的多个捕获核酸,其中多个捕获核酸的第一群体包括切割位点。扩增位点还包括多个克隆的双链修饰的靶核酸,其中每个双链靶核酸的两条链均在其5'端附着于捕获核酸,其中一条链附着于包含切割位点的捕获核酸,且其中切割位点位于每个双链分子的双链区中。该方法还包括使阵列与组合物接触,所述组合物包含至少一种在切割位点处产生无碱基位点的酶和具有3'至5'单链DNA外切核酸酶活性的外切核酸酶,其中在切割位点处发生切割,其中切割将双链靶核酸的一条链转化为附着于扩增位点的第一链和未附着于扩增位点的第二链,并且其中包含游离3'末端的单链捕获核酸的长度被由外切核酸酶缩短。

定义

除非另有规定,否则本文中使用的术语应理解为具有相关领域中的普通含义。下面列出本文中使用的几个术语及其含义。

如本文所用,术语“扩增子”在用于指核酸时指对核酸复制的产物,其中产物具有与核酸的核苷酸序列的至少一部分相同或互补的核苷酸序列。扩增子可以通过使用核酸,例如靶核酸或其扩增子作为模板的多种扩增方法中的任一种来产生,所述方法包括例如聚合酶延伸、聚合酶链式反应(PCR)、滚环扩增(RCA)、连接延伸或连接链式反应。扩增子可以是具有特定核苷酸序列的单拷贝(例如聚合酶延伸产物)或核苷酸序列的多个拷贝(例如RCA的多联体(concatameric)产物)的核酸分子。靶核酸的第一扩增子通常是互补拷贝。后续的扩增子是在产生第一扩增子后从靶核酸或从第一扩增子创建的拷贝。后续的扩增子可具有与靶核酸基本上互补或与靶核酸基本上相同的序列。

如本文所用,术语“扩增位点”是指阵列中或阵列上可产生一个或多个扩增子的位点。扩增位点可以进一步配置为含有、保持或附着在该位点处产生的至少一个扩增子。

如本文所用,术语“阵列”是指可以根据相对位置彼此区分的位点群体。可以根据阵列中位点的位置将位于阵列的不同位点处的不同分子彼此区分。阵列的单独位点可包括一个或多个特定类型的分子。例如,位点可以包括具有特定序列的单一靶核酸分子,或者位点可以包含具有相同序列(和/或其互补序列)的几个核酸分子。阵列的位点可以是位于同一基底上的不同特征。示例性特征包括但不限于,基底中的孔、基底中或基底上的珠(或其他颗粒)、从基底的突起、基底上的脊或基底中的通道。阵列的位点可以是各自带有不同分子的分开的底物。可以根据在与基底缔合的表面上基底位置或者根据液体或凝胶中基底的位置鉴定附着于分开的基底的不同分子。分开的基底位于表面上的示例性阵列包括但不限于在孔中具有珠的那些阵列。

如本文所用,术语“容量”当用于提及位点和核酸材料时指可以占据位点的最大量的核酸材料,例如源自靶核酸的扩增子。例如,该术语可以指在特定条件下可以占据该位点的核酸分子的总数。也可以使用其他测量,包括例如核酸材料的总质量或在特定条件下可占据该位点的特定核苷酸序列的拷贝总数。通常,靶核酸的位点的容量将基本上等同于靶核酸的扩增子的位点的容量。

如本文所用,术语“捕获剂”是指能够附着、保留或结合靶分子(例如靶核酸)的材料、化学物质、分子或其部分。示例性捕获剂包括但不限于与经修饰的靶核酸的至少一部分互补的捕获核酸(例如通用捕获结合序列)、能够结合经修饰的靶核酸(或附着于它的连接部分)的受体-配体结合对的成员(例如抗生物素蛋白、链霉抗生物素蛋白、生物素、凝集素、碳水化合物、核酸结合蛋白、表位、抗体等),或能够与经修饰的靶核酸(或附着于它的连接部分)形成共价键的化学试剂。在一个实施方案中,捕获剂是核酸。核酸捕获剂也可以用作扩增引物。

当提及核酸捕获剂时,可以使用术语“P5”和“P7”。术语“P5’”(P5 prime)和“P7’”(P7 prime)分别是指P5和P7的互补物。应当理解的是,任何合适的核酸捕获剂可用于本文提出的方法中,并且P5和P7的使用仅是示例性的实施方案。如WO 2007/010251、WO 2006/064199、WO 2005/065814、WO 2015/106941、WO 1998/044151和WO 2000/018957的公开示例,流动池上核酸捕获剂诸如P5和P7的使用是本领域中已知的。本领域技术人员将认识到,核酸捕获剂也可以发挥扩增引物的功能。例如,任何合适的核酸捕获剂都可以起正向扩增引物的作用,无论是固定化的还是在溶液中,并且可以用于本文提出的方法以与序列(例如,通用捕获结合序列)杂交和序列扩增。类似地,任何合适的核酸捕获剂都可以起反向扩增引物的作用,无论是固定化的还是溶液中,并且可以用于本文提出的方法以与序列杂交(例如,通用捕获结合序列)和扩增序列。鉴于可获得的常识和本公开的教导,本领域技术人员将理解如何设计和使用适合于捕获和扩增如本文所提出的靶核酸的序列。

如本文所用,术语“通用序列”是指两个或更多个靶核酸共有的序列区域,其中分子还具有彼此不同的序列区域。存在于分子集合的不同成员中的通用序列可以允许使用与通用序列(例如通用捕获结合序列)的一部分互补的捕获核酸群体来捕获多个不同的核酸。通用捕获结合序列的非限制性实例包括与P5和P7引物相同或互补的序列。类似地,存在于分子集合的不同成员中的通用序列可以允许使用与通用序列,例如通用引物结合位点的一部分互补的通用引物群体来复制或扩增多个不同的核酸。如本文所述,可以修饰靶核酸分子以在例如不同靶序列的一个或两个末端附着通用衔接子(在本文中也称为衔接子)。

如本文所用,术语“衔接子”及其衍生物,例如通用衔接子,通常是指可以与靶核酸连接的任何线性寡核苷酸。在一些实施方案中,衔接子基本上与样品中存在的任何靶序列的3’末端或5’末端非互补。在一些实施方案中,合适的衔接子长度在约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸的范围内。通常,衔接子可以包括核苷酸和/或核酸的任何组合。在一些方面,衔接子可在一个或多个位置处包含一个或多个可切割基团。在另一方面,衔接子可以包含与引物,例如捕获核酸的至少一部分基本上相同或基本上互补的序列。在一些实施方案中,衔接子可以包括条形码,也称为索引或标签,以辅助下游校正、鉴定或测序。术语“衔接头”和“衔接子”可互换使用。

如本文所定义,“样品”及其衍生物以其最广泛的含义使用,并且包括怀疑包括靶核酸的任何样品、培养物等。在一些实施方案中,样品包含DNA、RNA、PNA、LNA、核酸的嵌合或杂合形式。样品可以包括任何含有一种或多种核酸的基于生物、临床、外科、农业、大气或水生的样品。该术语还包括任何分离的核酸样品,例如基因组DNA、新鲜冷冻的或福尔马林固定的石蜡包埋的核酸样本。还涵盖的是样品可以来自单一个体、来自遗传相关成员的核酸样品的集合、来自遗传无关成员的核酸样品、来自单一个体的核酸样品(匹配),例如肿瘤样品和正常组织样品,或来自含有遗传材料的两种独特形式,诸如从母体受试者获得的母体和胎儿DNA的单一来源的样品,或者在含有植物或动物DNA的样品中污染性细菌DNA的存在。在一些实施方案中,核酸材料的来源可以包括获自新生儿的核酸,例如通常用于新生儿筛查的核酸。

如本文所用,术语“克隆群体”和“单克隆群体”可互换使用,并且是指就特定核苷酸序列而言同质的核酸群体。同源序列通常长至少10个核苷酸,但是甚至可以更长,包括例如至少50、至少100、至少250、至少500或至少1000个核苷酸长。克隆群体可以源自单一靶核酸。通常,克隆群体中的所有核酸将具有相同的核苷酸序列。应当理解,在不脱离克隆性的情况下,少数突变(例如由于扩增伪像(artifacts))可以在克隆群体中发生。还应理解,在不脱离克隆性的情况下,少数不同的靶核酸(例如由于未扩增或以有限程度扩增的靶核酸)可以在克隆群体中发生。

如本文所用,术语“不同”在用于提及核酸时指核酸具有彼此不同的核苷酸序列。两个或更多个核酸可以具有沿其整个长度不同的核苷酸序列。或者,两个或更多个核酸可以具有沿着其长度的实质性部分不同的核苷酸序列。例如,两个或更多个核酸可以具有彼此不同的靶核苷酸序列部分,同时还具有彼此相同的通用序列区域。如本文所用,术语“不同”当用于指扩增位点时指扩增位点存在于同一阵列上的独特的分开位置处。

如本文所用,术语“流体通路(fluidic access)”在用于指流体中的分子和与流体接触的位点时指分子在流体中或通过流体移动以接触或进入该位点的能力。该术语还可以指分子与位点分离或离开位点以进入溶液的能力。当没有障碍物时可以发生流体通路,所述障碍物阻止分子进入位点,接触位点,与位点分离和/或离开位点。然而,只要不绝对防止进入,即使扩散被延迟,减少或改变,也理解存在流体通路。

如本文所用,术语“双链”在用于指核酸分子时是指核酸分子中基本上所有的核苷酸都与互补核苷酸氢键键合。部分双链核酸可以具有其与互补核苷酸氢键键合的核苷酸的至少10%、至少25%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。

如本文所用,术语“各(each)”当用于指项集合时意图鉴定该集合中的个别项,但是不一定指该集合中的每个项,除非上下文清楚地指示其他事项。

如本文所用,术语“排除体积”是指由特定分子占据而排除其他此类分子的空间的体积。

如本文所用,术语“间隙区域”是指基底中或表面上的与基底或表面的其他区域分开的区域。例如,间隙区域可以将阵列的一个特征与阵列的另一特征分开。彼此分开的两个区域可以是离散的,缺乏彼此接触。在另一个示例中,间隙区域可以将特征的第一部分与特征的第二部分分开。由间隙区域提供的分开可以是部分分开或完全分开。间隙区域通常将具有与表面上的特征的表面材料不同的表面材料。例如,阵列的特征可具有的捕获剂的量或浓度超过间隙区域中存在的量或浓度。在一些实施方案中,捕获剂可以不存在于间隙区域处。

如本文所用,术语“聚合酶”意图与其在本领域中的用途一致,并且包括例如使用核酸作为模板链产生核酸分子的互补重复的酶。通常,DNA聚合酶结合模板链,然后沿着模板链向下移动,从而在核酸的生长链的3'端顺序向游离羟基添加核苷酸。DNA聚合酶通常从DNA模板合成互补DNA分子,而RNA聚合酶通常从DNA模板合成RNA分子(转录)。聚合酶可以使用称为引物的短RNA或DNA链来开始链生长。如本文中详细描述的,可以在扩增过程中使用聚合酶以产生克隆簇,可以在测序反应过程中使用聚合酶以确定核酸的序列,并且在这些的各方面中可以使用不同的聚合酶。一些聚合酶可以置换位点上游的链,在该位点处它们正在将碱基添加到链。认为此类聚合酶是链置换的,意味着它们具有从聚合酶读取的模板链中除去互补链的活性。具有链置换活性的示例性聚合酶包括但不限于Bsu(枯草芽孢杆菌(Bacillus subtilis))、Bst(嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))聚合酶、exo-Klenow聚合酶或测序级T7 exo-聚合酶的大片段。一些聚合酶降解它们前面的链,从而有效地将其替换为后面的增长链(5’外切核酸酶活性)。一些聚合酶具有降解其后面的链的活性(3’外切核酸酶活性)。一些有用的聚合酶已经通过突变或其他方式进行了修饰,以减少或消除3’和/或5’外切核酸酶活性。

如本文所用,术语“核酸”意图与其在本领域中的使用一致,并且包括天然存在的核酸及其功能类似物。特别有用的功能类似物能够以序列特异性的方式与核酸杂交或者能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似物结构可具有交替的主链连接,包括本领域已知的多种主链连接之任一种。天然存在的核酸通常具有脱氧核糖(例如在脱氧核糖核酸(DNA)中发现)或核糖(例如在核糖核酸(RNA)中发现)。核酸可含有本领域已知的这些糖部分的多种类似物中的任一种。核酸可包括天然或非天然碱基。在这方面,天然脱氧核糖核酸可以具有选自腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤的一种或多种碱基,并且核糖核酸可以具有选自尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤的一种或多种碱基。可以包含在核酸中的有用的非天然碱基是本领域已知的。当用于指核酸时,术语“靶物”在本文所述方法或组合物的上下文中意图作为核酸的语义标识符,并不一定限制超出其他情况下明确指示的情况的核酸结构或功能。具有每个末端的通用序列,例如在每个末端的通用衔接子的靶核酸可以称为经修饰的靶核酸。

如本文所用,术语“转运”是指分子通过流体的移动。该术语可包括被动转运,例如分子沿其浓度梯度的移动(例如被动扩散)。该术语还可以包括主动转运,由此分子可以沿着分子的浓度梯度或逆着其浓度梯度移动。因此,转运可包括施加能量以使一个或多个分子沿期望的方向移动或移动至期望的位置,例如扩增位点。

如本文所用,术语“速率”当用于指转运、扩增、捕获或其他化学过程时,意图与其在化学动力学和生化动力学中的含义一致。可以就最大速率(例如,在饱和时)、稳态前速率(例如,在平衡之前)、动力学速率常数或本领域已知的其他度量而言比较两个过程的速率。在具体的实施方案中,可以就完成过程的总时间而言确定特定过程的速率。例如,可以就完成扩增所花费的时间而言确定扩增速率。但是,不需要就完成过程的总时间而言确定特定过程的速率。

术语“和/或”是指所列元件中的一个或全部或所列元件中任何两个或更多个的组合。

词语“优选的”和“优选地”是指在某些情况下可以提供某些益处的本发明的实施方案。然而,在相同或其他情况下,其他实施方案也可以是优选的。此外,对一个或多个优选实施方案的叙述并不意味着其他实施方案不可用,并且不意图从本发明的范围排除其他实施方案。

术语“包括”及其变型在说明书和权利要求书中出现这些术语时不具有限制意义。

应当理解的是,无论何处用语言“包括”等描述实施方案,也提供了以术语“由……组成”和/或“基本上由……组成”描述的其他方面类似的实施方案。

除非另有规定,否则“一个”、“一种”,“所述/该”和“至少一个”可互换使用并且表示一个/种或超过一个/种。

“适合”于事件发生的条件,例如外切核酸酶介导的核酸消化,或“适合”条件是不阻止此类事件发生的条件。因此,这些条件允许、增强、促进和/或有利于该事件。

如本文所用,在组合物、制品或核酸的上下文中“提供”指制备组合物、制品或核酸,购买组合物、制品或核酸,或以其他方式获得化合物、组合物、制品、核酸。

还有,在本文中,通过端点叙述数值范围包括该范围内所包含的所有数字(例如1至5包括1、1.5、2、2.75、3、3.80、4、5等)。

在整个说明书中提及“一个实施方案”、“实施方案”、“某些实施方案”或“一些实施方案”等意味着本公开的至少一个实施方案中包括结合该实施方案描述的特定特征、配置、组成或特性。因此,在整个说明书中这些短语在各个地方的出现不一定是指本公开的相同实施方案。此外,在一个或多个实施方案中,可以以任何合适的方式组合特定的特征、配置、组成或特性。

在本文的描述中,为了清楚起见,可以独立地描述具体的实施方案。除非另外明确指出具体实施方案的特征与另一个实施方案的特征不相容,否则某些实施方案可以包括本文结合一个或多个实施方案描述的相容特征的组合。

对于本文公开的包括离散步骤的任何方法,步骤可以以任何可行的顺序进行。并且,适当时,可以同时进行两个或更多个步骤的任何组合。

本发明的以上概述并非意图描述本发明的各个公开的实施方案或每个实施方式。下面的描述更具体地举例说明了示例性实施方案。在整个申请中的多个地方,通过示例列表提供了指导,这些示例可以以各种组合使用。在各种情况下,所列举的列表仅充当代表组,而不应解释为排他性列表。

附图简述

当结合以下附图阅读时,可以最佳理解本公开的示例性实施方案的以下详细描述。

图1A-1D显示了根据本文呈现的本公开的各个方面的制备用于测序的核酸的实施方案的示意图。

图2显示了3’-磷酸和DNA糖基化酶对外切核酸酶I活性的影响。左图显示了流动池的各泳道中DNA糖基化酶和外切核酸酶的存在。首先添加DNA糖基化酶,然后添加外切核酸酶。例外是第4道,其中同时添加DNA糖基化酶和外切核酸酶。中间图显示了流动池,第1-8道从上到下编号,第3-5道中缺乏信号。右图显示了各道的荧光结果,第3-5道基本上没有荧光。

图3显示了如实施例1和3中所述的测序运行的结果。

示意图不一定按比例绘制。附图中使用的相同数字指代相同的组件、步骤等。然而,应当理解,在给定附图中使用数字来指代组件并非意图限制另一附图中用相同数字标记的组件。另外,使用不同的数字来指代组件并非意图指示不同编号的组件不能与其他编号的组件相同或相似。

发明详述

本文提出了与对核酸进行测序有关的方法和组合物。本公开提供了方法,包括制备用于测序反应的核酸,产生克隆簇以及在表面上制作核酸阵列。在一个实施方案中,方法包括提供包含多个扩增位点的阵列。每个扩增位点包括多个双链扩增子。例如,在图1A中,显示了具有多个双链扩增子11的一个成员的扩增位点10。

多个捕获核酸附着于扩增位点的表面。存在至少两个捕获核酸群体,并且在一些实施方案中,存在三个或更多个群体。捕获核酸的至少一个群体包括切割位点。在一个实施方案中,切割位点包括尿嘧啶残基。每个双链扩增子分子处于桥连结构中,其中它们在其5’末端附着于捕获核酸而不在其3’末端附着于阵列。切割位点位于各个双链分子的双链区中。例如,如图1A中显示,显示了捕获核酸的两个群体。显示了一个群体,在各个扩增子的一个末端附着13或与扩增位点10的表面结合13’但未附着于扩增子11。还显示了捕获核酸的第二群体,在各个扩增子的另一末端附着14或与扩增位点10的表面结合14’但未附着于扩增子11。图1A中还显示了切割位点(在捕获核酸13上用X标记)。

方法还包括使阵列的扩增位点与在切割位点处切割一条DNA链的酶和具有3’至5’单链DNA外切核酸酶活性的外切核酸酶接触。外切核酸酶作用为消化包含游离3’-OH末端的单链捕获核酸。例如,如图1B所示,扩增子11中的切割位点X被切割,留下缩短的捕获核酸13”。未附着的捕获核酸13’和14’不再存在于扩增位点10处。

在一个实施方案中,可以通过使用具有链置换活性的DNA聚合酶来确定附着链的序列,其中将缩短的捕获核酸(图1B中的13”)的3’末端用作引物启动DNA合成。在一些实施方案中,在切割位点处切割一条DNA链的酶将修饰缩短的捕获核酸的3’末端以终止于3’-磷酸。在开始测序反应之前,可以通过磷酸酶除去3’-磷酸。

替代对附着链进行测序,方法还可以包括使切割的双链扩增子经历变性条件,以除去未附着于阵列的切割链的部分(图1B中的15’)。这导致固定化的单链核酸。例如,在图1C中,未附着的DNA链不再与附着链16杂交并且已经丢失。

在一个实施方案中,可以将固定化的单链核酸再退火至缩短的捕获核酸13”。例如,如图1D所示,将附着的DNA链16再退火至缩短的捕获核酸13”。

在本文所述方法中使用的扩增位点的阵列可以作为一种或多种基底存在。可以用于阵列的基底材料的示例类型包括玻璃、改性玻璃、功能化玻璃、无机玻璃、微球(例如惰性和/或磁性颗粒)、塑料、多糖、尼龙、硝化纤维素、陶瓷、树脂、二氧化硅、基于二氧化硅的材料、碳、金属、光纤或光纤束、聚合物和多孔(例如微量滴定)板。示例性塑料包括丙烯酸、聚苯乙烯、苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯和Teflon

在具体的实施方案中,基底可以在诸如孔、管、通道、皿、培养皿、瓶等的容器之内或是该容器的部分。特别有用的容器是流动池,例如,如美国专利No.8,241,573或Bentley等人,Nature 456:53-59(2008)中所述。示例性的流动池是可购自Illumina,Inc.(SanDiego,Calif.)的流动池。另一个特别有用的容器是多孔板或微量滴定板中的孔。

在一些实施方案中,阵列的扩增位点可以被配置为表面上的特征。这些特征可以以多种期望形式中的任一种存在。例如,位点可以是孔、坑、通道、脊、凸起区域、钉、柱等。在一个实施方案中,扩增位点可以含有珠。但是,在具体的实施方案中,位点不需要含有珠或颗粒。示例性位点包括存在于用于由454LifeSciences(Roche,Basel Switzerland的子公司)或Ion Torrent(Life Technologies,Carlsbad,CA,USA的子公司)出售的商业测序平台的基底的孔。具有孔的其他基底包括例如蚀刻的光纤和其它基底,记载于美国专利No.6,266,459;美国专利No.6,355,431;美国专利No.6,770,441;美国专利No.6,859,570;美国专利No.6,210,891;美国专利No.6,258,568;美国专利No.6,274,320;美国专利No.8,262,900;美国专利No.7,948,015;美国专利公开文本No.2010/0137143;美国专利No.8,349,167,或PCT公开文本No.WO 00/63437。在几种情况下,在这些参考文献中举例说明在孔中应用珠的基底。在本公开的方法或组合物中,含孔的基底可以与或不与珠一起使用。在一些实施方案中,基底的孔可以包含凝胶材料(具有或不具有珠),如美国专利No.9,512,422中所述。

阵列的扩增位点可以是非金属表面上的金属特征,例如玻璃、塑料或本文示例的其他材料。可以使用本领域已知的方法将金属层沉积在表面上,例如湿法等离子体蚀刻、干法等离子体蚀刻、原子层沉积、离子束蚀刻、化学气相沉积、真空溅射等。可以适当地使用多种商业仪器中的任一种,包括例如

特征阵列可以以斑点或斑块的网格出现。特征可以以重复图案或不规则的非重复图案定位。特别有用的图案是六边形图案、直线图案、网格图案、具有反射对称性的图案、具有旋转对称性的图案等。不对称图案也可以是有用的。在不同对的最近邻特征之间的间距可以是相同的,或者在不同对的最近邻特征之间的间距可以存在变化。在具体的实施方案中,阵列的特征可各自具有大于约100nm

对于在表面上包括特征阵列的实施方案,特征可以是离散的,被间隙区域隔开。特征的大小和/或区域之间的间隔可以存在变化,使得阵列可以是高密度、中密度或较低密度的。高密度阵列的特征为具有间隔小于约15μm的区域。中密度阵列具有间隔约15至30μm的区域,而低密度阵列具有间隔大于30μm的区域。在本公开中有用的阵列可以具有间隔小于100μm、50μm、10μm、5μm、1μm或0.5μm的区域。

在具体的实施方案中,阵列可以包括珠或其他颗粒的集合。可以将颗粒悬浮于溶液中或者可以将它们定位于基底的表面上。溶液中的珠阵列的例子是那些由Luminex(Austin,TX,USA)商业化的。具有位于表面上的珠的阵列的例子包括其中珠位于孔中的阵列,例如BeadChip阵列(Illumina Inc.,San Diego,CA,USA)或用于来自454LifeSciences(Roche,Basel,Switzerland的子公司)或Ion Torrent(Life Technologies,Carlsbad,CAUSA的子公司)的测序平台中的基底。具有位于表面上的珠的其他阵列记载于美国专利No.6,266,459;美国专利No.6,355,431;美国专利No.6,770,441;美国专利No.6,859,570;美国专利No.6,210,891;美国专利No.6,258,568;美国专利No.6,274,320;美国专利公开文本No.2009/0026082 A1;美国专利公开文本No.2009/0127589 A1;美国专利公开文本No.2010/0137143 A1;美国专利公开文本No.2010/0282617 A1;或PCT公开文本No.WO 00/63437。上面的几个参考文献描述了在阵列基底中或阵列基底上加载珠之前将靶核酸附着于珠的方法。然而,应当理解,可将珠制成包含扩增引物,然后可将珠用于加载阵列,从而形成用于本文所述方法的扩增位点。如本文先前所述,可以在没有珠的情况下使用基底。例如,可以直接将扩增引物附着于孔或孔中的凝胶材料。因此,参考文献例示了可以被修改以用于本文所述的方法和组合物中的材料、组合物或装置。

阵列的扩增位点可以包含多种能够结合靶核酸的捕获剂。在一个实施方案中,捕获剂包括捕获核酸。捕获核酸的核苷酸序列与靶核酸的通用序列互补。在一些实施方案中,捕获核酸还可以充当用于扩增靶核酸的引物。在一些实施方案中,一个捕获核酸群体包括P5引物或其互补物。在一些实施方案中,扩增位点还包含多个第二捕获核酸,并且此第二捕获核酸可以包含P7引物或其互补物。在一些实施方案中,捕获核酸可以包括切割位点。在本文中更详细地描述了捕获核酸中的切割位点。

在具体的实施方案中,可以将捕获剂如捕获核酸附着于扩增位点。例如,可以见捕获剂附着于阵列特征的表面。附着可以通过中间结构,例如珠、颗粒或凝胶。通过凝胶将捕获核酸附着于阵列的例子描述于美国专利No.8,895,249,并进一步以可购自IlluminaInc.(San Diego,CA,USA)或在WO 2008/093098中描述的流动池举例说明。可以在本文所述的方法和装置中使用的示例性凝胶包括但不限于具有胶体结构的那些,例如琼脂糖;聚合物网状结构,例如明胶;或交联的聚合物结构,例如聚丙烯酰胺,SFA(例如,参见美国专利公开文本No.2011/0059865 A1)或PAZAM(例如,参见美国临时专利申请序列流水No.61/753,833和美国专利No.9,012,022)。经由珠的附着可如在本文先前所述的描述和引用的参考文献中举例说明的那样实现。

在一些实施方案中,阵列基底的表面上的特征是不连续的,被表面的间隙区域隔开。与阵列的特征相比,具有基本上较低数量或浓度的捕获剂的间隙区域是有利的。缺少捕获剂的间隙区域是特别有利的。例如,在间隙区域处相对少量或不存在捕获部分有利于将靶核酸以及随后产生的簇定位于期望的特征。在具体的实施方案中,特征可以是表面(例如孔)中的凹形特征,并且特征可以含有凝胶材料。含有凝胶的特征可以由表面上的间隙区域彼此分开,在所述间隙区域中基本上不存在凝胶,或者若存在的话,凝胶基本上不能支持核酸的定位。在美国临时申请No.61/769,289中阐述了制备和使用具有含凝胶的特征如孔的基底的方法和组合物。

本文所述方法中使用的阵列包括双链修饰的靶核酸。术语“靶核酸”、“靶片段”、“靶核酸片段”、“靶分子”和“靶核酸分子”可互换使用,指期望鉴定其核苷酸序列的核酸分子。靶核酸基本上可以是已知或未知序列的任何核酸。例如,它可以是基因组DNA或cDNA的片段。测序可导致测定全部或部分靶分子的序列。靶物可以源自已经随机片段化的初级核酸样品。在一个实施方案中,可以通过在各个靶标片段的末端放置通用扩增序列,例如通用衔接头中存在的序列,将靶标加工成适合于扩增的模板。在各个末端具有通用衔接子的靶核酸可以称为“经修饰的靶核酸”。在本文详述了通用衔接子。

初级核酸样品可以源自来自样品的双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)或者可以以单链形式源自样品(如DNA或RNA)并转换为dsDNA形式。举例来说,可以使用本领域公知的标准技术将mRNA分子复制成适用于本文所述方法的双链cDNA。来自初级核酸样品的多核苷酸分子的精确序列通常对本公开内容并不重要,并且可以是已知的或未知的。

在一个实施方案中,来自初级核酸样品的初级多核苷酸分子是DNA分子。更特别地,初级多核苷酸分子代表生物体的整个遗传互补物,并且是基因组DNA分子,其既包括内含子和外显子序列,又包括非编码调控序列,例如启动子和增强子序列。在一个实施方案中,可以使用多核苷酸序列或基因组DNA的特定子集,诸如例如特定的染色体。更特别地,初级多核苷酸分子的序列是未知的。仍然更特别地,初级多核苷酸分子是人基因组DNA分子。可以在任何随机片段化过程之前或之后,以及在通用衔接头序列连接之前或之后,化学或酶处理DNA靶片段。

核酸样品可以包括高分子量材料,例如基因组DNA(gDNA)。样品可以包括低分子量材料,例如从福尔马林固定的石蜡包埋或存档的DNA样品中获得的核酸分子。在另一个实施方案中,低分子量材料包括酶或机械片段化的DNA。样品可以包含无细胞的循环DNA。在一些实施方案中,样品可包括获自活组织检查、肿瘤、刮擦物、拭、血液、粘液、尿液、血浆、精液、毛发、激光捕获显微切割、手术切除以及其他临床或实验室获得的样品的核酸分子。在一些实施方案中,样品可以是流行病学、农业、法医或病原学样品。在一些实施方案中,样品可以包括获自诸如人类或哺乳动物来源的动物的核酸分子。在另一个实施方案中,样品可以包括获自非哺乳动物来源如植物、细菌、病毒或真菌的核酸分子。在一些实施方案中,核酸分子的来源可以是已存档或耗尽的样品或种类。

此外,本文公开的方法和组合物可用于扩增具有低质量核酸分子的核酸样品,例如来自法医样品的降解和/或片段化的基因组DNA。在一个实施方案中,法医样品可以包括从犯罪现场、失踪人员DNA数据库、与法医调查相关的实验室、或从执法机构、一个或多个军事部门或任何此类人员获得的法医样品获得的核酸。核酸样品可以是纯化的样品或含有粗DNA的裂解物,例如源自口腔拭子、纸、织物或其他可以用唾液、血液或其他体液浸渍的基底。因此,在一些实施方案中,核酸样品可以包括少量的DNA(例如基因组DNA)或该DNA的片段化部分。在一些实施方案中,靶序列可以存在于一种或多种体液中,包括但不限于血液、痰液、血浆、精液、尿液和血清。在一些实施方案中,靶序列可获自受害者的毛发、皮肤、组织样品、尸检或遗骸。在一些实施方案中,可以从已故的动物或人获得包括一个或多个靶序列的核酸。在一些实施方案中,靶序列可包括获自非人DNA的核酸,例如微生物、植物或昆虫学DNA。在一些实施方案中,靶序列或扩增的靶序列针对人类鉴定的目的。在一些实施方案中,本文描述的方法可以用于鉴定法医样品的特征。在一些实施方案中,本文描述的方法可以用于使用一种或多种靶物特异性引物或使用已知引物设计标准设计的一种或多种靶物特异性引物的人鉴定方法。在一个实施方案中,可以使用任何一种或多种靶物特异性引物扩增包含至少一个靶序列的法医或人鉴定样品,所述靶物特异性引物使用已知的引物标准得到。

生物样品来源的其他非限制性实例可包括完整的生物体以及从患者获得的样品。生物样品可以从任何生物流体或组织获得,并且可以为多种形式,包括液体流体和组织、实体组织和保存形式,例如干燥、冷冻和固定形式。样品可以是任何生物组织、细胞或体液的。此类样品包括但不限于痰液、血液、血清、血浆、血细胞(例如白细胞)、腹水、尿液、唾液、泪液、痰液、阴道液(排出)、在医疗程序期间获得的清洗液(例如,在活组织检查、内窥镜检查或手术期间获得的骨盆或其他清洗物)、组织、乳头抽吸物、核心或细针活组织检查样品、含细胞的体液、游离的浮动核酸、腹膜液和胸膜液,或来自它们的细胞。生物样品还可以包括组织切片,例如出于组织学目的而采取的冷冻切片或固定切片,或者显微切割的细胞或其细胞外部分。在一些实施方案中,样品可以是血液样品,诸如例如全血样品。在另一个实例中,样品是未处理的干燥血斑样品。在另一个实例中,样品是福尔马林固定的石蜡包埋的样品。在又一个实例中,样品是唾液样品。在又一个实例中,样品是干燥唾液斑样品。

可以衍生靶核酸的示例性生物学样品包括,例如,来自真核生物的样品,例如哺乳动物,例如啮齿动物、小鼠、大鼠、兔、豚鼠、有蹄动物、马、绵羊、猪、山羊、牛、猫、狗、灵长类动物、人或非人灵长类;植物,如拟南芥(Arabidopsis thaliana)、玉米、高粱、燕麦、小麦、稻、芥花或大豆;藻,例如莱茵衣藻(Chlamydomonas reinhardtii);线虫,如秀丽隐杆线虫(Caenorhabditis elegans);昆虫,如黑腹果蝇(Drosophila melanogaster)、蚊、果蝇、蜜蜂或蜘蛛;鱼,例如斑马鱼;爬行动物;两栖动物,例如青蛙或非洲爪蟾(Xenopus laevis);盘基网柄菌(Dictyostelium discoideum);真菌,如卡氏肺囊虫(Pneumocystis carinii)、红鳍东方鲀(Takifugu rubripes)、酵母如酿酒酵母(Saccharamoyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe);或恶性疟原虫(Plasmodium falciparum)。靶核酸还可以源自原核生物,例如细菌、大肠杆菌、葡萄球菌或肺炎支原体(Mycoplasmapneumoniae);古菌(archaeon);病毒,如人丙型肝炎病毒或人类免疫缺陷病毒;或类病毒。靶核酸可以源自生物体的均质培养物或群体,或者可替代地源自例如社区或生态系统中的几种不同生物体的集合。

随机片段化指通过酶促、化学或机械方法以无序方式片段化来自初级核酸样品的多核苷酸分子。磁力片段化方法是本领域已知的,并使用标准方法(Sambrook andRussell,Molecular Cloning,A Laboratory Manual,第三版)。在一个实施方案中,可以使用通常被称为标签片段化(tagmentation)的过程来实现片段化。标签片段化使用转座体复合物,并组合成一步片段化和连接以添加通用衔接子(Gunderson等,WO 2016/130704)。为了清楚起见,通过较大片段的核酸序列保持完整(即,保留完整的核酸序列),通过特异性PCR扩增较小片段产生较大段核酸的此类较小片段并不等同于将较大段核酸进行片段化,因为较大段核酸序列保持完整(即不被PCR扩增片段化)。此外,设计随机片段化以产生片段,而与包含和/或围绕断裂的核苷酸的序列同一性或位置无关。更特别地,随机片段化是通过机械手段,例如雾化或超声处理,以产生长度为约50个碱基对至长度为约1500个碱基对的片段,还更特别地长度为50-700个碱基对,更特别地长度为50-400个碱基对。最特别地,该方法用于产生长度为50-150个碱基对的较小片段。

通过机械手段(例如雾化,超声处理和Hydroshear)将多核苷酸分子片段化产生具有平端和3’-和5’-突出端的异质混合的片段。因此,期望使用本领域已知的方法或试剂盒(例如Lucigen DNA终止剂末端修复试剂盒)来修复片段末端,以产生对于插入例如克隆载体的平位点中而言最佳的末端。在一个具体的实施方案中,核酸群体的片段末端是平末端的。更特别地,片段末端是平末端并磷酸化的。可以通过酶处理来引入磷酸部分,所述酶处理例如使用多核苷酸激酶。

靶核酸群体可以具有对于本文所述方法或组合物的特定应用而言期望或合适的平均链长度。例如,平均链长度可以小于约100,000个核苷酸、50,000个核苷酸、10,000个核苷酸、5,000个核苷酸、1,000个核苷酸、500个核苷酸、100个核苷酸或50个核苷酸。或者/另外,平均链长度可以大于约10个核苷酸、50个核苷酸、100个核苷酸、500个核苷酸、1,000个核苷酸、5,000个核苷酸、10,000个核苷酸、50,000个核苷酸或100,000个核苷酸。靶核酸群体的平均链长可以在本文所述的最大值和最小值之间的范围内。应当理解,在扩增位点处产生(或在本文中以其它方式制备或使用)的扩增子可以具有在选自上文示例者的上限和下限之间的范围内的平均链长度。

在某些情况下,靶核酸群体可以在一定条件下产生或以其他方式配置为具有其成员的最大长度。例如,用于本文所述方法的一个或多个步骤中或存在于特定组合物中的成员的最大长度可以小于100,000个核苷酸、小于50,000个核苷酸、小于10,000个核苷酸、小于5,000个核苷酸、小于1,000个核苷酸、小于500个核苷酸、小于100个核苷酸或小于50个核苷酸。或者/另外,靶核酸群体可以在一定条件下产生或以其他方式配置为具有其靶成员的最小长度。例如,用于本文所述方法的一个或多个步骤中或存在于特定组合物中的成员的最小长度可以是大于10个核苷酸、大于50个核苷酸、大于100个核苷酸、大于100个核苷酸、大于500个核苷酸、大于1000个核苷酸、大于5,000个核苷酸、大于10,000个核苷酸、大于50,000个核苷酸或大于100,000个核苷酸。群体中靶核酸的最大和最小链长度可以在上文阐述的最大和最小值之间的范围内。应当理解,在扩增位点处产生(或在本文中以其它方式制备或使用)的扩增子可以具有在以上示例者的上限和下限之间的范围内的最大和/或最小链长度。

在一个具体的实施方案中,通过例如某些类型的DNA聚合酶如Taq聚合酶或Klenowexo minus聚合酶的活性制备具有单一突出的核苷酸的靶片段序列,所述聚合酶具有非模板依赖性的末端转移酶活性,该活性将单一脱氧核苷酸,例如脱氧腺苷(A)添加到DNA分子(例如PCR产物)的3’末端。此类酶可用于在双链靶片段的各条链的平末端3’端添加单核苷酸“A”。因此,可以通过与Taq或Klenow exo minus聚合酶反应在双链靶片段的每个末端修复链的3’末端添加“A”,而通用衔接子多核苷酸构建体可以是T构建体,其具有通用衔接子的双链核酸的各个区域的3’末端存在的相容性“T”突出端。此末端修饰还防止载体和靶标两者的自身连接,使得存在对在各个末端处具有通用衔接子的靶核酸形成的偏爱。

在一些情况下,在用于本文的方法或组合物之前,可以扩增源自此类来源的靶核酸。可以使用多种已知扩增技术中的任一种,包括但不限于聚合酶链式反应(PCR)、滚环扩增(RCA)、多置换扩增(MDA)或随机引发扩增(random prime amplification,RPA)。应当理解,在用于本文所述方法或组合物之前,靶核酸的扩增是任选的。因此,在用于本文所述的方法和组合物的一些实施方案之前,可不扩增靶核酸。靶核酸可以任选地源自合成文库。合成的核酸可以具有天然的DNA或RNA组成或者可以是其类似物。

本文所述的方法或组合物中使用的靶核酸包括附着于各个末端的通用衔接子。在各个末端具有通用衔接子的靶核酸可以称为“经修饰的靶核酸”。在本文描述的方法中使用的将通用衔接子附着于靶核酸的各个末端的方法是本领域技术人员已知的。可以通过使用连接的标准文库制备技术(美国专利公开文本No.2018/0305753),或通过使用转座酶复合物的标签片段化(Gunderson等人,WO 2016/130704)进行连接。

在一个实施方案中,通过首先将相同的通用衔接子分子(“错配的衔接子”,其一般特征在下面定义,并且在Gormley等人,美国专利No.7,741,463和Bignell等人,美国专利No.8,053,192中进一步描述)连接至双链靶核酸的5’和3’末端来处理来自样品,例如片段化的样品的双链靶核酸。在一个实施方案中,通用衔接子包括将靶核酸固定化在阵列上以进行后续测序所必需的通用捕获结合序列。在另一个实施方案中,在固定化和测序之前,使用PCR步骤进一步修饰存在于靶核酸的各个末端的通用衔接子。例如,使用通用引物结合位点进行初始引物延伸反应,其中形成与各个单独靶核酸的两条链互补的延伸产物并添加通用捕获结合序列。所得的引物延伸产物和任选的其扩增的拷贝共同提供了可被固定化,然后测序的经修饰的靶核酸的文库。术语“文库”是指在其3’和5’末端含有已知的共同序列的靶核酸的集合,并且也可以称为3’和5’修饰的文库。

在本公开的方法中使用的通用衔接子称为“错配”衔接头,因为如本文中详细解释的,衔接头包含序列错配的区域,即,它们不通过退火完全互补的多核苷酸链形成。

如下形成用于本文的错配衔接头,即退火两条部分互补的多核苷酸链,以在两条链退火时提供至少一个双链区(也称为双链核酸区域)和至少一个不匹配的单链区,也称为单链非互补核酸链的区域。

通用衔接子的双链区是短的双链区,通常包含5个或更多个连续碱基对,其通过退火两个部分互补的多核苷酸链形成。该术语指两条链退火的核酸双链区,并不意味着任何特定的结构构象。

通常有利的是,双链区在不损失功能的情况下尽可能短。在本文中,“功能”指双链区在酶催化的核酸连接反应的标准反应条件下形成稳定双链体的能力,所述条件对于熟练的读者是公知的(例如,在适合于酶的连接缓冲液中在4℃至25℃的范围内的温度温育),从而形成通用衔接子的两条链在通用衔接子与靶分子的连接期间保持部分退火。双链区在引物延伸或PCR反应的退火步骤中通常使用的条件下稳定不是绝对必要的。

通用衔接子的双链区通常在连接中使用的所有通用衔接子中是相同的。因为通用衔接子与各个靶分子的两个末端连接,所以经修饰的靶核酸侧翼可以有源自通用衔接子的双链区的互补序列。在经修饰的靶核酸构建体中双链区以及由其衍生的互补序列越长,经修饰的靶核酸构建体能够在引物延伸和/或PCR中使用的退火条件下在内部自身互补性的这些区域内向后折叠并且与其自身进行碱基配对的可能性越大。因此,通常优选的是双链区的长度为20或更小、15或更小或10或更小的碱基对,以降低此效应。可以通过包含比标准Watson-Crick碱基对表现出更强的碱基配对的非天然核苷酸增加双链区的稳定性,并因此潜在缩短其长度。

在一个实施方案中,通用衔接子的两条链在双链区中100%互补。应当理解的是,可以在双链区内容许一个或多个核苷酸错配,条件是两条链能够在标准连接条件下形成稳定的双链体。

用于本文的通用衔接子通常可包括形成衔接头的“可连接”末端的双链区,例如在连接反应中与双链靶核酸连接的末端。通用衔接头的可连接末端可以是平端,或者在其他实施方案中,可以存在一个或多个核苷酸的短5’或3’突出端,以便于/促进连接。通用衔接子的可连接末端的5’端核苷酸通常被磷酸化以实现与靶多核苷酸上的3’羟基的磷酸二酯连接。

术语“不匹配区”是指通用衔接头的区域,单链非互补核酸链的区域,其中形成通用衔接头的两条多核苷酸链的序列表现出一定程度的非互补性,使得在引物延伸或PCR反应的标准退火条件下,两条链不能完全彼此退火。在酶催化的连接反应的标准反应条件下,不匹配区可以表现出一定程度的退火,只要两条链在扩增反应中的退火条件下转化为单链形式。

应当理解,“不匹配区”由形成双链区的相同两条多核苷酸链的不同部分提供。衔接头构建体中的错配可以采取一条链长于另一条链的形式,使得其中一条链上存在单链区,或者采用如下的序列,该序列选择为使得两条链不杂交,从而在两条链上形成单链区。错配也可以采取“气泡”的形式,其中通用衔接子构建体的两个末端能够彼此杂交并形成双链体,而中心区域则不能。在将相同两条链的其他部分退火以形成一个或多个双链区的条件下,形成不匹配区的链部分不退火。为了避免疑问,应当理解,在本公开的上下文中,随后经历与靶序列的连接的多核苷酸双链体的3’末端的单链或单碱基突出端不构成“不匹配区”。

不匹配区长度的下限通常由功能决定,例如提供适合于以下项的序列的需要:i)引物结合以进行引物延伸、PCR和/或测序(例如,引物与通用引物结合位点的结合),或者ii)通用捕获结合序列与捕获核酸的结合,以将经修饰的靶核酸固定化于表面。理论上,不匹配区的长度没有上限,只是通常有利的是使通用衔接子的总长度最小化,例如,以便于在连接步骤后将未结合的通用衔接子与经修饰的靶核酸构建体分开。因此,通常优选的是,不匹配区的长度应小于50、或小于40、或小于30、或小于25个连续核苷酸。

单链非互补核酸链的区域在3’末端包含至少一个通用捕获结合序列。通用衔接子的3’末端包含通用捕获结合序列,其将与存在于阵列扩增位点处的捕获核酸杂交。任选地,通用衔接子的5’末端包含附着于靶核酸的各个末端的第二通用捕获结合序列,其中第二通用捕获结合序列将与存在于阵列的扩增位点处的不同捕获核酸杂交。

单链非互补核酸链的区域通常还包括至少一个通用引物结合位点。通用引物结合位点是通用序列,其可用于扩增和/或测序与通用接头连接的靶核酸。

单链非互补核酸链的区域也可以包括至少一个索引。索引可用作阵列上特定靶核酸来源特征性的标志物(美国专利No.8,053,192)。通常,索引是作为通用衔接子的一部分的核苷酸的合成序列,所述通用衔接子作为文库制备步骤的一部分添加至靶核酸。因此,索引是附着于特定样品的各个靶分子的核酸序列,其存在指示或用于鉴定分离出靶分子的样品或来源。在一个实施方案中,可以使用双索引系统。在双索引系统中,附着于靶核酸的通用接头包括两个不同的索引序列(美国专利公开文本No.2018/0305750,美国专利公开文本No.2018/0305751,美国专利公开文本No.2018/0305752和美国专利公开文本No.2018/0305753)。

优选地,索引的长度可以高达20个核苷酸,更优选地为1-10个核苷酸,并且最优选地长度为4-6个核苷酸。4核苷酸索引给出同一阵列上多路复用256个样品的可能性,6碱基索引实现同一阵列上处理4096个样品。

在一个实施方案中,当通用捕获结合序列与双链靶片段连接时,它是通用衔接子的一部分,并且在另一个实施方案中,在通用衔接子与双链靶片段连接后,将通用引物延伸结合位点添加到通用衔接子。可以使用常规方法来完成添加,包括基于扩增的方法,例如PCR。

通用衔接子的精确核苷酸序列通常对本公开内容不重要,并且可以由用户选择,使得期望的序列元件最终包括在多个不同的经修饰的靶核酸的共同序列中,例如,以提供通用捕获结合序列和用于特定组的通用扩增引物和/或测序引物的结合位点。可以包括其他序列元件,例如,以提供用于测序引物的结合位点,例如在固体支持物上,所述测序引物最终会用于文库中靶核酸的测序,索引测序或源自文库中靶核酸扩增的产物。

尽管通用衔接子的精确核苷酸序列通常不限于本公开,但是在不匹配区中的单独链的序列应使得任何单独链均不表现出任何内部自互补性,其在标准退火条件下可以导致自退火、形成发夹结构等。应当避免在不匹配区中链的自退火,因为它可以阻止或减少扩增引物与此链的特异性结合。

错配的衔接子优选自两条DNA链形成,但可以包括通过磷酸二酯和非磷酸二酯主链连接的混合物连接的天然和非天然核苷酸(例如一个或多个核糖核苷酸)的混合物。

连接方法是本领域已知的并且使用标准方法。此类方法使用连接酶,例如DNA连接酶来实现或催化在此种情况下通用衔接子和双链靶核酸的两条多核苷酸链的末端的连接,从而形成共价连接。通用接头可含有5’-磷酸部分,以促进与靶片段上存在的3’-OH的连接。双链靶核酸含有5’-磷酸部分,自剪切过程残留或者使用酶处理步骤添加,并已进行末端修复,并任选地通过一个或多个突出碱基进行延伸,从而给出适合于连接的3’-OH。在本上下文中,连接指先前未共价连接的多核苷酸链的共价连接。在本公开的特定方面,此类连接通过在两条多核苷酸链之间形成磷酸二酯连接而发生,但是可以使用其他共价连接的方式(例如非磷酸二酯主链连接)。

如本文所讨论,在一个实施方案中,用于连接的通用衔接子是完整的,并且包括通用捕获结合序列和其他通用序列,例如通用引物结合位点和索引序列。所得的多个经修饰的靶核酸可用于制备固定化的样品用于测序。

同样如本文所讨论,在一个实施方案中,用于连接的通用衔接头包含通用引物结合位点和索引序列,并且不包含通用捕获结合序列。所得的多个经修饰的靶核酸可以进一步修饰以包括特定序列,例如通用捕获结合序列。用于向与双链靶片段连接的通用引物添加特定序列,如通用捕获结合序列的方法包括基于扩增的方法,例如PCR,并且在本领域中是已知的,并且例如描述于:Bignell等人(US 8,053,192)和Gunderson等人(WO2016/130704)。

在通用接头被修饰的实施方案中,制备扩增反应。扩增反应的内容物是本领域技术人员已知的,并且包括扩增反应所需要的合适的底物(例如dNTP)、酶(例如DNA聚合酶)和缓冲液组分。通常,扩增反应需要至少两个扩增引物,通常表示为“正向”和“反向”引物(引物寡核苷酸),它们能够在扩增反应的各个循环的引物退火步骤中遇到的条件下与待扩增的多核苷酸序列(例如经修饰的靶核酸)的一部分特异性退火。应当理解,如果引物含有在第一扩增循环中不与经修饰的靶核酸退火的任何核苷酸序列,则可以将此序列复制到扩增产物中。例如,使用具有通用捕获结合序列,例如不与经修饰的靶核酸退火的序列的引物,通用捕获结合序列将被掺入所得的扩增子中。

扩增引物通常是单链多核苷酸结构。它们也可以含有天然和非天然碱基以及天然和非天然主链连接的混合物,条件是任何非天然修饰均不排除作为引物的功能——定义为在扩增反应的条件期间与模板多核苷酸链退火的能力并且作用为合成与模板链互补的新多核苷酸链的起始点。另外,引物可以包含非核苷酸化学修饰,例如硫代磷酸酯以增加外切核酸酶抗性,再次条件是使得修饰不阻止引物功能。

可以使用本领域技术人员已知的方法来产生包括扩增位点的阵列,各个扩增位点包含双链扩增子的克隆群体(也称为簇)。在一个实施方案中,使用等温扩增方法,并且包括从已经接种该位点的单独靶核酸产生双链扩增子的克隆群体。在一些实施方案中,扩增反应进行到产生足够数量的扩增子以填充相应扩增位点的容量。以此种方式填充已经接种的位点至容量排除随后的靶核酸落于该位点处,从而在该位点处产生扩增子的克隆群体。因此,在一些实施方案中,期望的是产生扩增子以填充扩增位点容量的速率超过将单独靶核酸转运至单独扩增位点的速率。

在一些实施方案中,扩增方法包括但不限于固相扩增、polony扩增、集落扩增、乳液PCR、珠RCA、表面RCA或表面SDA。在一些实施方案中,使用扩增方法,其导致溶液中游离DNA分子的扩增或仅通过DNA分子的一个末端拴系到合适的基质。在一些实施方案中,使用依赖于桥式PCR的方法,其中两个PCR引物都附着于表面(参见例如WO 2000/018957,美国专利No.7,972,820;美国专利No.7,790,418和Adessi等人,Nucleic Acids Research(2000):28(20):E87)。在一些实施方案中,本发明的方法可以创建“聚合酶集落技术”或“polony”,指维持相同扩增子的空间聚簇的多重扩增(参见Harvard Molecular Technology Groupand Lipper Center for Computational Genetics website)。这些包括例如原位polony(Mitra and Church,Nucleic Acid Research 27,e34,Dec.15,1999)、原位滚动圈扩增(RCA)(Lizardi等人,Nature Genetics 19,225,1998年7月)、桥式PCR(美国专利No.5,641,658)、皮升PCR(Leamon等人,Electrophoresis 24,3769,2003年11月)和乳液PCR(Dressman等人,PNAS 100,8817,2003年7月22日)。在一些实施方案中,使用依赖于动力学排除的方法,其中重组酶促进的扩增和等温条件扩增文库(美国专利No.9,309,502,美国专利No.8,895,249,美国专利No.8,071,308)。

在一些实施方案中,即使在第二靶核酸在该位点处开始扩增之前未将扩增位点填充至容量,也可以实现明显的克隆性。在某些条件下,第一靶核酸的扩增可以进行到如下的点,即产生足够数量的拷贝以有效胜过或压倒自转运至该位点的第二靶核酸的拷贝产生。例如,在对直径小于500nm的圆形特征上使用桥式扩增过程的实施方案中,已经确定在对第一靶核酸进行14轮指数扩增的循环之后,来自相同位点处的第二靶核酸的污染将产生数量不足的污染性扩增子以对Illumina测序平台上的合成测序分析产生不利影响。

在所有实施方案中,阵列中的扩增位点不需要是完全克隆的。相反,对于某些应用,单独的扩增位点可以主要填充有来自第一靶核酸的扩增子,并且还可以具有低水平的来自第二靶核酸的污染性扩增子。阵列可以具有一个或多个具有低水平污染扩增子的扩增位点,只要污染水平不对阵列的后续使用产生不可接受的影响。例如,当阵列要用于检测应用时,可接受的污染水平是不以不可接受的方式影响信噪比或检测技术的分辨率的水平。因此,表观克隆性通常与通过本文所述方法制成的阵列的特定用途或应用有关。对于特定应用在单独的扩增位点处可接受的污染的示例性水平包括但不限于最多0.1%、0.5%、1%、5%、10%或25%的污染扩增子。阵列可以包括一个或多个具有这些示例性水平的污染扩增子的扩增位点。例如,阵列中多达5%、10%、25%、50%、75%或甚至100%的扩增位点可以具有一些污染性扩增子。

在一些实施方案中,可以在发生扩增时将靶核酸转运(例如通过扩散)至扩增位点的条件下进行制备可用于本文所述方法的阵列的方法。因此,一些扩增方法可以利用相对于随后的扩增子形成的相对较慢的转运速率和相对较慢的第一扩增子的产生两者。例如,可以进行本文所述的扩增反应,使得与以下项同时将靶核酸从溶液中转移到扩增位点:(i)产生第一扩增子,和(ii)在阵列的其他位点处产生随后的扩增子。在具体的实施方案中,在扩增位点处产生随后扩增子的平均速率可以超过将靶核酸从溶液转运至扩增位点的平均速率。在某些情况下,可以从单独的扩增位点处的单一靶核酸产生足够数量的扩增子,以填充相应扩增位点的容量。产生扩增子以填充相应扩增位点的容量的速率可以例如超过将单独的靶核酸从溶液转运至扩增位点的速率。

用于在扩增位点处扩增靶核酸的组合物,在本文中称为“扩增试剂”,通常能够快速地在扩增位点处制备靶核酸拷贝。在本公开内容的方法中使用的扩增试剂通常将包括聚合酶和核苷酸三磷酸(NTP)。可以使用本领域已知的多种聚合酶中的任一种,但是在一些实施方案中,可以优选使用外切核酸酶阴性的聚合酶。适用于本发明实施方案的核酸聚合酶的实例包括但不限于DNA聚合酶(例如Klenow片段、T4 DNA聚合酶、Bst(嗜热脂肪芽孢杆菌)聚合酶)、热稳定性DNA聚合酶(例如Taq、Vent、Deep Vent、Pfu、Tfl和9°N DNA聚合酶)及其遗传修饰的衍生物(TaqGold、VENTexo、Pfu exo)。在一些实施方案中,扩增试剂还可以包括重组酶、辅助蛋白和单链DNA结合(SSB)蛋白,用于重组酶促进的扩增。

对于产生DNA拷贝的实施方案,NTP可以是脱氧核糖核苷酸三磷酸(dNTP)。通常,DNA扩增试剂中将存在四种天然种类dATP、dTTP、dGTP和dCTP。但是,若想要的话,可以使用类似物。对于产生RNA拷贝的实施方案,NTP可以是核糖核苷酸三磷酸(rNTP)。通常,RNA扩增试剂中存在四种天然种类rATP、rUTP、rGTP和rCTP。但是,若想要的话,可以使用类似物。可以用荧光或放射性基团修饰NTP。为了增加核酸的可检测性和/或功能多样性,已经开发出用于化学和生物学方法的极其多种合成修饰的核酸。这些官能化/修饰的分子(例如核苷酸类似物)可以与天然聚合酶完全相容,从而维持天然对应物的碱基配对和复制特性。

因此,将扩增溶液的其他成分添加到聚合酶的选择,并且它们基本上对应于本领域已知为有效支持各种聚合酶活性的化合物。化合物诸如二甲基亚砜(DMSO)、牛血清白蛋白(BSA)、聚乙二醇(PEG)、甜菜碱、Triton X-100、变性剂(例如甲酰胺)或MgCl

可以通过增加扩增反应的一种或多种活性成分的浓度或量来增加扩增反应发生的速率。例如,聚合酶、核苷酸三磷酸或引物的量或浓度。在一些情况下,量或浓度增加(或在本文所述的方法中以其他方式操作)的扩增反应的一种或多种活性成分是扩增反应的非核酸成分。

还可以通过调节温度在本文所述的方法中提高扩增速率。例如,可通过将一个或多个位点处的温度升高至由于变性或其他不良事件导致反应速率降低的最大温度来提高一个或多个扩增位点处的扩增速率。最佳温度或期望温度可以从使用的扩增组分的已知特性或者对于给定扩增反应混合物凭经验确定。可以基于引物解链温度(Tm)的先验预测或凭经验进行此类调整。在某些实施方案中,扩增反应的温度为至少35℃至不大于70℃。例如,扩增反应可以为至少35℃至不大于42℃,或至少57℃至不大于63℃。

可以通过增加一种或多种扩增试剂的活性来增加发生扩增反应的速率。例如,可以将增加聚合酶的延伸速率的辅因子添加到使用该聚合酶的反应中。在一些实施方案中,可以将金属辅助因子例如镁、锌或锰添加至聚合酶反应或可以添加甜菜碱。

桥接扩增的结果是在扩增位点处的克隆“桥接”扩增产物的群体。扩增子酸的两条链在5’末端固定化在扩增位点的表面上,其中此附着源自捕获核酸的原始附着(例如,参见图1A,其中双链扩增子11以“桥接”方向描绘)。扩增位点内的扩增子将是克隆的,并源自单一靶核酸的扩增,或具有可接受水平的如本文所述的另一种扩增子。

除桥接的双链扩增子的各条链的游离3’末端外,大量未使用的捕获核酸在扩增后保留在扩增位点的表面上,以形成桥接的扩增产物的克隆簇。未使用的捕获核酸的存在可促成增加的噪声,因此通常通过在适合于核酸酶消化未使用的捕获核酸的条件下使阵列与核酸酶接触而除去。在一个实施方案中,核酸酶是外切核酸酶,例如具有3’至5’单链DNA外切核酸酶活性的外切核酸酶。此类外切核酸酶的例子是外切核酸酶I。核酸酶处理之后,洗涤阵列以从扩增位点除去核酸酶和所得的核苷酸和/或核酸。

为了促进测序,可以从表面选择性除去双链桥结构的链之一,以允许测序引物与剩余的固定化链的有效杂交。特定链的选择性除去在本文中称为“线性化”。本文描述了合适的线性化方法的实例,并在申请号WO 2007/010251和美国专利申请公开文本2012/0309634中更加详细描述。

在一个实施方案中,如下实现线性化:通过切割桥接双链扩增子的一条链,然后使所得的结构经受除去不再附着于扩增位点表面的链的条件。可以通过使用包含切割位点的捕获核酸来完成切割。切割位点通常位于导致桥接结构的一条链的大部分没有扩增位点表面——不再固定化——并且易于在除去步骤后丢失的位置中。例如,如图1B所示,扩增子11中的切割位点X被切割,留下缩短的捕获核酸13”。桥接结构的一条链16在其5’末端保持固定化到扩增位点10,并且另一条链15’由于在X处的切割而不再固定化。在一个实施方案中,链16的3’末端保持与缩短的捕获核酸13”的互补碱基退火,从而在线性化后维持桥结构。维持桥结构的链16的3’末端和缩短的捕获核酸13”之间的互补碱基的数目随着普遍条件而变化,并且可以由技术人员确定。

在一个实施方案中,处理切割位点以除去核苷酸并形成无碱基位点。“无碱基位点”是核酸中已除去碱基成分的核苷酸位置。无碱基位点可以在人工条件下或通过酶的作用化学形成。一旦形成,可以切割无碱基位点(例如通过用内切核酸酶或其他单链切割酶、暴露于热或碱处理),从而提供核酸的位点特异性切割的手段。

在一个实施方案中,可以在固定化的扩增子的一条链上的预定位置处创建无碱基位点。例如,这可以通过在预定位置处掺入特定核苷酸来实现。

在一个实施方案中,将脱氧尿苷(U)掺入附着至扩增位点表面的捕获核酸之一中。然后,可以使用尿嘧啶酶DNA糖基化酶(UDG)除去尿嘧啶碱基,在一条链上产生无碱基位点。然后可以通过用内切核酸酶(例如,DNA糖基化酶-裂合酶内切核酸酶VIII)、热或碱处理,将包括无碱基位点的多核苷酸链在无碱基位点处切割。在一个具体的实施方案中,使用可购自New Englad New Englad Biolabs(NEB#M5505S)的USER试剂在固定化者中的尿嘧啶碱基处创建单个核苷酸缺口。在一个实施方案中,将扩增位点暴露于含有合适糖基化酶和一种或多种合适的内切核酸酶的混合物,通常为至少约2:1的活性比率。用内切核酸酶处理在切割位点处产生3’-磷酸部分,其可用合适的磷酸酶如碱性磷酸酶除去。例如,如图1B所示,若切割位点X是使用USER试剂产生的,则缩短的捕获核酸13”将以3’-磷酸基团终止。

在一个实施方案中,将8-氧代鸟嘌呤掺入附着于扩增位点表面的捕获核酸之一中。然后,可以使用FPG糖基化酶除去8-氧代鸟嘌呤碱基,在一条链上产生无碱基位点。在另一个实施方案中,将脱氧肌苷掺入附着于扩增位点表面的捕获核酸之一中,然后可以使用酶AlkA糖基化酶除去脱氧肌苷碱基,从而在一条链上产生无碱基位点。

此方法的优点包括在切割链上释放游离的3’磷酸基团的选项,其在磷酸酶处理后可以提供用于对互补链的区域进行测序的起始点(例如,对图1B的链16的区域进行测序)。由于切割反应需要DNA中不天然存在,但是在其它情况下不依赖于序列背景的残基,例如脱氧尿苷,若仅包含一个非天然碱基,则在双链体中不想要的位置处在其它地方发生糖基化酶介导的切割没有可能性。通过UDG对尿嘧啶的作用而产生的固定化扩增子的双链区中的无碱基位点的切割而获得的另一个优点是,在通过切割形成的游离3’羟基处启动的合成测序反应中掺入的第一个碱基总会是T。因此,对于以此种方式切割以产生测序模板的阵列的不同扩增位点处的所有克隆簇,在整个阵列中普遍掺入的第一个碱基将为T。这可以提供测序运行开始时单独簇强度的不依赖于序列的测定法。

添加外切核酸酶和线性化的步骤是本领域技术人员已知为一定是分开的步骤。用内切核酸酶处理在切割位点处产生3’-磷酸部分,并且已知3’磷酸的存在抑制外切核酸酶I的活性(Lehman and Nussbaum,1964,J.Biol.Chem.,239:2628-2636)。发明人做出了出乎意料和令人惊讶的发现,即可以通过将酶进行组合同时发生外切核酸酶和线性化步骤两者。将这两个步骤简化为一个步骤导致更快的测序运行,因为现在同时进行两个步骤。此外,将这两个步骤组合不对主要度量,读段质量、双重索引化或基因组构建度量产生不利影响。

无碱基位点产生和切割导致链上的游离5’末端,其不再固定化到表面(例如,如图1B所示,桥接结构的一条链16在其5’末端保持固定化到扩增位点10,并且另一条链15’由于X处的切割而不再固定化)。可以通过将扩增位点暴露于合适的条件从表面完全除去此链。在一个实施方案中,通过变性除去。变性可以以热或等温进行,例如使用化学变性。化学变性剂可以是尿素、氢氧化物或甲酰胺或其他类似的试剂。在另一个实施方案中,可以通过用具有5’-3’活性的外切核酸酶,如lambda或T7外切核酸酶处理来实现除去。除去未附着的链导致剩余的单链,其可以充当聚合酶的模板。

任选地,修复扩增位点处的核酸的3’末端。外切核酸酶可以在线性化后除去核酸3’末端的一些核苷酸。在不意图限制的情况下,可能的是3’末端是略微“呼吸(breathing)”,导致少量核苷酸变为单链并且可用于外切核酸酶消化。可以通过将核苷酸暴露于DNA聚合酶,例如用于桥接扩增的DNA聚合酶来实现修复。

除去未附着的链是任选的。在一个实施方案中,除去生成无碱基位点后剩余的3’-磷酸基团以在切割的捕获核酸的末端留下3’-羟基(图1B,缩短的捕获核酸13”。此捕获核酸可以用作具有链置换活性的聚合酶的引物。由于聚合酶使用固定化链(图1B,链16)作为模板来合成互补链,它置换未附着的链(图1B,链15’)。

在本文所述的扩增聚簇方法期间或之后,可以得到不同的组合物。在一个实施方案中,组合物包含糖基化酶、内切核酸酶和外切核酸酶。在一个实施方案中,外切核酸酶具有3’至5’单链DNA外切核酸酶活性,例如外切核酸酶I。在一个实施方案中,可以存在于组合物中的一类糖基化酶是尿嘧啶DNA糖基化酶,而内切核酸酶是DNA糖基化酶-裂合酶内切核酸酶VIII。在一个实施方案中,可以存在于组合物中的一类糖基化酶是FPG糖基化酶,并且内切核酸酶是DNA糖基化酶-裂合酶内切核酸酶VIII。在一个实施方案中,可以存在于组合物中的一类糖基化酶是AlkA糖基化酶,并且内切核酸酶是DNA糖基化酶-裂合酶内切核酸酶VIII。该组合物可以包括双链DNA底物,其包括尿嘧啶切割位点、8-氧代鸟嘌呤切割位点或脱氧肌苷切割位点。该组合物可以包含含有无碱基位点的双链DNA底物。在一些实施方案中,组合物双链DNA底物可以包含单链区,其中尿嘧啶切割位点和无碱基位点存在于双链区中。还提供了包括多个扩增位点的阵列,其中各个扩增位点包含附着于扩增位点的多个双链DNA底物。

已经通过本文所述方法产生并且在扩增位点处包括扩增且线性化的扩增子的本公开的阵列可以用于多种应用中的任一种。特别有用的应用是核酸测序。一个例子是合成测序(SBS)。在SBS中,监测核酸引物沿核酸模板(例如靶核酸或其扩增子)的延伸,以确定模板中核苷酸的序列。潜在的化学过程可以是聚合反应(例如,如通过聚合酶催化)。在特定的基于聚合酶的SBS实施方案中,将荧光标记的核苷酸以模板依赖的方式添加到引物(从而延伸引物),以便可以使用添加到引物的核苷酸的顺序和类型的检测来确定模板的序列。在本文所述的阵列的不同位点处的多个不同模板可以在由于其在阵列中的位置而可以区分针对不同模板发生的事件的条件下经受SBS技术。

流动池提供了容纳阵列的便利形式,该阵列通过本公开的方法生产,并经过SBS或其他检测技术,其涉及循环中试剂的重复递送。例如,为了启动第一个SBS循环,可以将一个或多个标记的核苷酸,DNA聚合酶等流入/流到容纳核酸模板阵列的流动池。可以检测引物延伸导致掺入标记核苷酸的阵列的那些位点。任选地,标记的核苷酸可以进一步包括可逆的终止性质,一旦已经将核苷酸添加到引物,该可逆的终止性质终止进一步的引物延伸。例如,可以将具有可逆终止剂部分的核苷酸类似物添加至引物,使得随后的延伸直到递送解封闭剂来除去该部分时才发生。因此,对于使用可逆终止的实施方案,可以(在发生检测之前或之后)将解封闭剂递送至流动池。可以在各个递送步骤之间进行洗涤。然后可以将循环重复n次以将引物延伸n个核苷酸,从而检测长度n的序列。可以容易地适合于与通过本公开的方法生产的阵列一起使用的示例性SBS程序、流体系统和检测平台描述于例如Bentley等人,Nature 456:53-59(2008),WO 04/018497;美国专利No.7,057,026;WO 91/06678;WO07/123,744;美国专利No.7,329,492;美国专利No.7,211,414;美国专利No.7,315,019;美国专利No.7,405,281,和美国专利No.8,343,746。

可以使用其他使用循环反应的测序程序,例如焦磷酸测序。焦磷酸测序检测在特定的核苷酸被掺入新生核酸链中时无机焦磷酸盐(PPi)的释放(Ronaghi,等人,AnalyticalBiochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等人Science 281(5375),363(1998);美国专利号6,210,891;6,258,568和6,274,320)。在焦磷酸测序中,释放的PPi可以通过被ATP硫化酶立即转化为三磷酸腺苷(ATP)来检测,并且产生的ATP的水平可以通过萤光素酶产生的光子进行检测。因此,可以通过发光检测系统监测测序反应。焦磷酸测序程序不必需用于基于荧光的检测系统的激发辐射源。可用于将焦磷酸测序应用于本公开的阵列的有用的流体系统、检测器和程序描述于例如WIPO公开的专利申请2012/058096、US 2005/0191698 A1、美国专利No.7,595,883和美国专利No.7,244,559。

连接测序反应也是有用的,包括例如Shendure等人Science309:1728-1732(2005);美国专利No.5,599,675;和美国专利No.5,750,341中描述的。一些实施方案可以包括杂交测序程序,如记载于Bains等人,Journal of Theoretical Biology 135(3),303-7(1988);Drmanac等人,Nature Biotechnology 16,54-58(1998);Fodor等人,Science 251(4995),767-773(1995);和WO 1989/10977。在连接测序和杂交测序程序两者中,对存在于阵列位点处的模板核酸(例如,靶核酸或其扩增子)进行寡核苷酸递送和检测的重复循环。如本文所述或本文引用的参考文献中所述的用于SBS方法的流体系统可以容易地适于递送试剂以用于连接测序或杂交测序程序。通常,寡核苷酸被荧光标记并且可以使用荧光检测器检测,所述荧光检测器类似于就本文或本文引用的参考文献中的SBS程序而言描述的荧光检测器。

一些实施方案可以使用涉及实时监测DNA聚合酶活性的方法。例如,可以通过携带荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用或使用零模波导来检测核苷酸掺入。用于基于FRET的测序的技术和试剂描述于例如Levene等人Science 299,682-686(2003);Lundquist等人Opt.Lett.33,1026-1028(2008);Korlach等人Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)。

一些SBS实施方案包括检测将核苷酸掺入延伸产物后释放的质子。例如,基于释放的质子的检测的测序可以使用电检测器和可购自Ion Torrent(Guilford,Conn.,a LifeTechnologies子公司)的相关技术或US 2009/0026082 A1;US 2009/0127589 A1;US 2010/0137143 A1;或US 2010/0282617 A1中描述的测序方法和系统。用于扩增靶核酸的本文所述的方法可以容易地应用于用于检测光子的基底。更具体地,本文所述的方法可以用于在用于检测光子的阵列的位点处的扩增子的克隆群体。

例如已经通过本文所述方法产生的本公开的阵列的有用应用是基因表达分析。可以使用RNA测序技术,如那些称为数字RNA测序的技术检测或定量基因表达。RNA测序技术可以使用本领域已知的测序方法进行,例如上述方法。还可以使用通过与阵列直接杂交进行的杂交技术或使用在阵列上检测其产物的多重测定法来检测或定量基因表达。例如,已经通过本文所述方法产生的本公开的阵列还可用于确定来自一个或多个个体的基因组DNA样品的基因型。可在本公开的阵列上进行的用于基于阵列的表达和基因型分型分析的示例性方法记载于美国专利No.7,582,420;6,890,741;6,913,884或6,355,431或美国专利公开文本No.2005/0053980 A1;2009/0186349 A1或US 2005/0181440 A1。

已经通过本文所述方法产生的阵列的另一个有用应用是单细胞测序。当与索引化方法组合时,可以在染色质可及性测定法中使用单细胞测序,以在数千个单细胞中产生活性调控元件的概况,并且可以产生单细胞全基因组文库。可以在本公开的阵列上进行的单细胞测序的实例记载于美国公布的专利申请2018/0023119 A1,美国临时申请流水号62/673,023和流水号62/680,259。

本文所述方法的优点在于它们提供了从多种核酸文库中的任一种快速且有效创建阵列。因此,本公开提供了集成系统,其能够使用本文中阐述的一种或多种方法来制备阵列并且还能够使用本领域中已知的技术(例如本文中举例说明的那些)来检测阵列上的核酸。因此,本公开的集成系统可以包括能够将扩增试剂递送到扩增位点阵列的流体组件,例如泵、阀、储器、流体线等。特别有用的流体成分是流动池。流动池可以在集成系统中配置和/或使用以创建本公开的阵列并检测该阵列。示例性流动池描述于例如US 2010/0111768A1和美国专利No.8,951,781。如流动池例示,集成系统的一个或多个流体组件可用于扩增方法和检测方法。以核酸测序实施方案为例,集成系统的一种或多种流体组件可用于本文所述的扩增方法和用于测序方法诸如本文所述的测序方法中的测序试剂的递送。或者,集成系统可以包括分开的流体系统以进行扩增方法和进行检测方法。能够创建核酸阵列并确定核酸序列的集成测序系统的例子包括但不限于来自Illumina,Inc.(San Diego,CA)的MiSeq

能够进行本文所述方法的系统不需要与检测装置集成在一起。相反,也可以是独立系统或与其他装置集成的系统。在此类实施方案中可以使用与以上在集成系统的上下文中例示的那些类似的流体组件。

无论与检测能力集成与否,能够进行本文提出的方法的系统可以包括系统控制器,该系统控制器能够执行一组指令以进行本文所述的方法、技术或过程的一个或多个步骤。例如,指令可以指导在桥式扩增条件下创建阵列的步骤的进行。任选地,指令可以进一步指导使用本文先前所述的方法检测核酸的步骤的进行。有用的系统控制器可以包括任何基于处理器或基于微处理器的系统,包括使用微控制器、精简指令集计算机(RISC)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑电路、和任何其他能够执行本文所述功能的电路或处理器的系统。用于系统控制器的一组指令可以是软件程序的形式。如本文所使用,术语“软件”和“固件”是可互换的,并且包括存储在存储器中以供计算机执行的任何计算机程序,包括RAM存储器、ROM存储器、EPROM存储器、EEPROM存储器和非易失性RAM(NVRAM)存储器。软件可以采用各种形式,例如系统软件或应用软件。此外,软件可以采取单独程序的集合,或较大程序内的程序模块或程序模块的一部分的形式。软件还可以包括面向对象编程形式的模块化编程。

应当理解,例如已经通过本文所述方法生产的本公开的阵列不需要用于检测方法。相反,该阵列可用于储存核酸文库。因此,可以以在其中保存核酸的状态储存阵列。例如,阵列可以以干燥状态、冷冻状态(例如在液氮中)或在保护核酸的溶液中储存。或者/另外,阵列可用于复制核酸文库。例如,阵列可以用于从阵列上一个或多个位点创建重复扩增子。

现在参考图1A,显示了具有多个双链扩增子11的一个成员的扩增位点10的示意图。描绘的双链扩增子11包含第一链15和第二链16。还显示了两个捕获核酸群体。显示了第一群体,在第一链15的一个末端附着13或者与扩增位点10的表面结合13’。也显示捕获核酸的第二群体,在第二链16的一个末端附着14,或与扩增位点10的表面结合14’。图1A中还显示切割位点(在捕获核酸13上用X标记)。在一个实施方案中,捕获核酸13可包含P5捕获核酸,而另一个捕获核酸14可以包含P7捕获核酸。

图1B显示了在附着于第一链的捕获核酸13中的切割位点X的切割。捕获核酸13的切割导致(i)缩短的链15’和(ii)缩短的捕获核酸13’。缩短的链15’不再附着于扩增位点10。缩短的捕获核酸13’可以以3’磷酸为末端。在所描绘的实施方案中,存在于链16的3’末端的核苷酸保持与存在于缩短的捕获核酸13”的3’末端的核苷酸退火。由于外切核酸酶,例如外切核酸酶I的作用,未附着的捕获核酸13’和14’不再存在于扩增位点10。

图1C显示了将图1B的扩增子暴露于变性条件的结果。从链16除去未附着于扩增位点10的缩短的链15’,并且链16的3’末端的核苷酸不与存在于缩短的捕获核酸13”的3’末端的核苷酸退火。

图1D显示了再退火的结果。附着的链16再退火为缩短的捕获核酸13”。

示例性实施方案

实施方案1.组合物,其包含:

尿嘧啶DNA糖基化酶,

内切核酸酶,和

具有3’至5’单链DNA外切核酸酶活性的外切核酸酶。

实施方案2.实施方案1的组合物,其中所述外切核酸酶是外切核酸酶I。

实施方案3.实施方案1或2的组合物,其中所述内切核酸酶是DNA糖基化酶-裂合酶内切核酸酶VIII。

实施方案4.实施方案1-3中任一项的组合物,其进一步包含双链DNA底物,所述双链DNA底物包含尿嘧啶切割位点。

实施方案5.实施方案1-4中任一项的组合物,其进一步包含双链DNA底物,所述双链DNA底物包含无碱基位点。

实施方案6.实施方案4-5中任一项的组合物,其中所述双链DNA底物包含单链区,并且其中所述尿嘧啶切割位点和所述无碱基位点存在于所述双链区中。

实施方案7.实施方案4至6中任一项的组合物,其还包括包含多个扩增位点的阵列,其中每个扩增位点包含附着于所述扩增位点的多个所述双链DNA底物。

实施方案8.制备用于测序反应的核酸的方法,所述方法包括:

(a)提供包含多个扩增位点的阵列,其中扩增位点包含

(i)附着于所述扩增位点的多个捕获核酸,

其中所述多个捕获核酸的第一群体包含切割位点,和

(ii)多个克隆双链修饰的靶核酸,

其中每个双链靶核酸的两条链在其5’末端附着于捕获核酸,

其中一条链附着于包含所述切割位点的捕获核酸,和

其中所述切割位点位于每个双链分子的双链区中;

(b)使所述阵列与组合物接触,所述组合物包含至少一种在所述切割位点处产生无碱基位点的酶和包含3’至5’单链DNA外切核酸酶活性的外切核酸酶,

其中在所述切割位点处发生切割,

其中切割将双链靶核酸的一条链转化为附着于所述扩增位点的第

一链和未附着于所述扩增位点的第二链;和

其中包含游离3’末端的单链捕获核酸的长度被所述外切核酸酶缩短。

实施方案9.实施方案8的方法,其中所述至少一种在切割位点处产生无碱基位点的酶包括尿嘧啶DNA糖基化酶和内切核酸酶。

实施方案10.实施方案8或9的方法,其中所述内切核酸酶是DNA糖基化酶-裂合酶内切核酸酶VIII。

实施方案11.实施方案8至10中任一项的方法,其还包括从所述阵列除去所述至少一种在切割位点处产生无碱基位点的酶和所述外切核酸酶。

实施方案12.实施方案8-11中任一项的方法,其还包括使切割的双链靶核酸经受除去未附着于所述扩增位点的所述第二链的条件。

实施方案13.实施方案12的方法,其中所述除去第二链的条件包含变性剂,其中所述变性剂导致固定化的单链核酸,所述单链核酸包含共价附着于捕获核酸的第二群体的靶核酸,其中所述捕获核酸的第二群体附着于所述扩增位点。

实施方案14.实施方案11-14中任一项的方法,其中所述变性剂包括甲酰胺。

实施方案15.实施方案11-14中任一项的方法,其还包括将所述固定化的单链核酸再退火至所述捕获核酸的第一群体的成员,以产生固定化的部分单链核酸。

实施方案16.实施方案8-15中任一项的方法,其中所述切割位点位于每个双链靶核酸的双链区的捕获核酸区域中。

实施方案17.实施方案8-16中任一项的方法,其中所述切割位点包含尿嘧啶,其中所述尿嘧啶DNA糖基化酶产生无碱基位点,并且其中所述内切核酸酶切割所述无碱基位点。

实施方案18.实施方案8-17中任一项的方法,其中所述外切核酸酶是外切核酸酶I。

实施方案19.实施方案13或15中任一项的方法,其还包括使测序引物与实施方案13的固定化的单链核酸或实施方案15的固定化的部分单链核酸的单链区杂交,从而制备用于测序反应的单链核酸。

实施方案20.实施方案19的方法,其还包括进行测序反应以确定所述固定化的单链核酸或所述固定化的部分单链核酸的至少一个区域的序列。

实施方案21.实施方案19的方法,其中所述测序反应包括合成测序。

实施方案22.实施方案8至21中任一项的方法,其中通过使用所述捕获核酸作为扩增引物来扩增多个靶核酸来产生所述阵列。

实施方案23.实施方案22的方法,其中扩增包括排除扩增。

实施例

通过以下实施例说明本发明。应当理解的是,具体的例子、材料、数量和程序将根据本文所述的本发明的范围和精神来广义地解释。

实施例1

一般测定方法和条件

除非另有说明,否则这描述了本文所述实施例中使用的一般测定条件。

在cBot(ILMN)上使用v2.5 HiSeqX流动池(ILMN)运行实验。对于图2,使用P5和P7表面引物作为底物来测试酶活性,在不扩增簇的情况下使用流动池。在实验过程中,将各种酶混合物泵入流动池中,并在37℃温育15分钟。外切核酸酶I和USER酶均由New EnglandBiolabs提供。温育后,用HT2洗涤缓冲液(Illumina)洗涤流动池泳道,然后在HT1杂交缓冲液(Illumina)中通过荧光团TET标记的P5’和P7’寡聚物杂交确定表面引物存在或不存在。通过在Typhoon长平台成像仪(GE Healthcare Life Sciences)上扫描来检测荧光信号。

对于图3,通过在ExAmp混合物中混合变性的DNA模板(人TruSeq Nano文库)至终浓度300pM,实现簇接种和扩增,然后将这泵入流动池中,并在37℃温育1小时。如图中详述,然后用酶和处理的不同组合处理流动池的不同泳道。“修复”是指通常3个桥式扩增循环,其通常为了填充可在外切核酸酶步骤期间被咬掉的链末端而进行。“USERExo”是指USER和ExoI的组合混合物。这些步骤之后,将簇与测序引物杂交,并使用标准方法和试剂(ILMN)在HiSeqX上测序。

实施例2

可以组合外切核酸酶和线性化反应

产生可用于基因组测序的簇的标准方法包括将靶核酸与簇杂交,扩增靶核酸,然后用外切核酸酶I处理簇以除去过量的游离表面引物。然后,在一个分开的步骤中,通过在双链DNA(dsDNA)的特定区域中产生单一核苷酸缺口使固定化的链线性化,以产生用于测序的模板。我们测试了是否可以组合外切核酸酶和线性化步骤。用外切核酸酶1、在dsDNA的特定区域中产生单一核苷酸缺口的酶(尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII的组合)或者两者处理具有含有附着的表面引物的扩增位点的流动池的泳道。

图2显示无处理(第1和8道)或用尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII(第2道)的处理不导致表面引物的损失,而用外切核酸酶I处理(第5道)导致实质上所有表面引物的损失。用尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII,接着用外切核酸酶I的处理(第3道)和用外切核酸酶与尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII组合的混合物的处理(第4道)导致基本上所有表面引物的丧失。这是出乎意料且令人惊讶的,因为用尿嘧啶DNA糖基化酶和DNA糖基化酶-裂合酶内切核酸酶VIII组合处理dsDNA产生3’磷酸,并且已知3’磷酸的存在抑制外切核酸酶I的活性(Lehmanand Nussbaum,1964,J.Biol.Chem.,239:2628-2636)。

实施例3

同时外切核酸酶处理和线性化产生可用于测序的模板

为了确定同时使用DNA糖基化酶和外切核酸酶是否对测序度量具有任何不利影响,对流动池进行了测序运行,该流动池含有使用DNA糖基化酶和外切核酸酶的不同组合产生的簇。一式四份确定每次运行的质量得分,并在图3中显示。如所预期的,包含与P5引物地点进行的序列反应的标准泳道(无外切核酸酶,无修复)具有50s中期中的Q30值(参见箭头,图3)。所有其他泳道大致等同,并且在单一步骤中使用DNA糖基化酶和外切核酸酶进行的这些反应产生最佳的R2读数,Q30为约93%。

本文中引用的所有专利、专利申请和出版物以及电子可获得的材料(包括例如在例如GenBank和RefSeq中的核苷酸序列提交以及在例如SwissProt,PIR,PRF,PDB中的氨基酸序列提交,以及来自GenBank和RefSeq中带注释的编码区的翻译)的完整公开通过引用整体并入。出版物中引用的补充材料(例如补充表,补充图,补充材料和方法和/或补充实验数据)同样通过引用完整并入。在本申请的公开与通过引用并入本文的任何文件的公开之间存在任何不一致的情况下,以本申请的公开为准。仅出于清楚理解的目的给出了前面的详细描述和示例。不应从它们理解不必要的限制。本发明不限于所示出和描述的确切细节,对于本领域技术人员显而易见的变化将包括在由权利要求书限定的本发明之内。

除非另有说明,否则在说明书和权利要求书中使用的所有表示组分数量,分子量等的数字在所有情况下均应理解为由术语“约”修饰。因此,除非另有相反指示,否则说明书和权利要求书中列出的数字参数是近似值,其可以根据本发明试图获得的期望性质而变化。无论如何,不作为将等同原则限于权利要求范围的尝试,每个数字参数应至少根据所报告的有效数字的数目并通过应用普通的舍入技术来解释。

尽管阐述本发明的广泛范围的数值范围和参数是近似值,然而在具体实施例中阐述的数值尽可能精确报告。然而,所有数值固有含有一定范围,该范围必然是由存在于它们各自的测试测量中的标准偏差得出的。

除非另有说明,否则所有标题都是为了方便读者阅读,并且不应用于限制标题后面的文本的含义。

相关技术
  • 通过桥式扩增进行簇生成的方法和组合物
  • 扩增造血干细胞的组合物、扩增方法、药物组合物和用途
技术分类

06120112603763