掌桥专利:专业的专利平台
掌桥专利
首页

包含内部5’-5’连接的5’衔接子

文献发布时间:2023-06-19 11:27:38


包含内部5’-5’连接的5’衔接子

交叉引用

本申请要求2018年9月28日提交的美国专利申请序列号16/145,908的权益,该申请通过引用并入本文。

背景技术

许多RNA-seq工作流程都涉及5’连接步骤,其中将RNA衔接子的3’末端连接至RNA分子(例如,mRNA的片段或小RNA)的5’末端上。该连接步骤效率不高,并且已知会引入明显的偏倚,使得给定的RNA种类在生成的cDNA文库中可能过量或过低代表多达几百倍。希望提高5’衔接子连接的效率并减少偏倚,因为除其他外,这将通过允许在更浅的测序深度鉴定更多数量的RNA来降低测序成本。

从理论上讲,可以使用具有互补区域的3’和5’衔接子解决此问题。在这种方法中,将3’衔接子连接至RNA分子,然后添加5’衔接子将使5’衔接子与RNA的5’末端接近,从而促进5’衔接子的连接并减少在5’连接期间引入偏倚。但是,使用此类衔接子会导致逆转录产物也包含互补序列。这样的互补序列具有产生二级结构的潜力,并且因此能够降低该方法的整体效率。

因此,需要更好的方法来降低cDNA文库制备中的偏倚。

发明内容

本公开内容尤其提供了式3’*-X-(5’5’)-Y-3’的5’衔接子,其中:3’*是阻断的3’末端,X是合成序列,(5’5’)是内部5’-5’连接,Y是衔接子序列,以及3’是羟基化的3’末端。在使用中,序列X与式R-X’的RNA分子群体中的序列X’杂交。据信这些序列的杂交提高了5’衔接子与核酸分子连接的效率并减少了偏倚。

如下面将更详细描述的,在逆转录连接产物中,衔接子中的内部5’-5’连接防止衔接子的序列X被逆转录,从而消除了来自逆转录产物的二级结构的潜在来源。没有这种二级结构,可以有效地扩增逆转录产物并且没有显著的偏倚。

提供了将5’衔接子连接至RNA的方法。在一些实施方案中,该方法可包括:在使得5’衔接子的序列X与核酸分子的序列X’杂交以产生复合物的条件下,孵育包含以下的反应混合物:(i)式3’*-X-(5’5’)-Y-3’的5’衔接子,其中:3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接,Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端;(ii)序列5’-R-X’-3’的核酸分子群体,其中R是5’-磷酸化的RNA并且X’与5’衔接子中的序列X互补;以及(iii)能够将5’磷酸连接至3’羟基的连接酶,并且在复合物中,5’衔接子的羟基化的3’末端连接至核酸分子的5’末端以产生式3’*-X-(5’5’)-Y-R-X’-3’的产物分子。

还提供了5’衔接子。在一些实施方案中,该衔接子是式3’*-X-(5’5’)-Y-3’,其中:3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接;Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端。

还提供了包含5’衔接子的试剂盒。在一些实施方案中,所述试剂盒可包括包含序列X’的3’衔接子和/或能够将序列X’的均聚物尾添加至RNA的聚合酶。

还提供了式:3’*-X-(5’5’)-Y-Z-3’的寡核苷酸,其中:3’*是阻断的3’末端,X是至少8个核苷酸的均聚物或至少8个核苷酸的合成序列,5’5’是内部5’-5’连接,Y是至少8个核苷酸的衔接子序列,Z是至少2个核苷酸的随机序列;以及3’是羟基化的3’末端。

附图说明

当结合附图阅读时,根据以下详细描述可以最好地理解本发明的一些方面。要强调的是,根据惯例,附图的各个特征未按比例绘制。实际上,为了清楚起见,各种特征的尺寸被任意地扩大或缩小。附图中包括以下附图。

图1示意性地示例显示了本发明5’衔接子的实施方案。

图2示意性地示例显示了通过图1中所示例显示的5’衔接子与式R-X’的核酸分子杂交形成的复合物。

图3示意性地示例显示了所述方法如何可以用于产生式*3’-X-(5’-5’)-Y-R-X’-3’的连接产物。

图4示意性地示例显示了如何可以逆转录图3中所示的连接产物。

图5示意性地示例显示了如何可以扩增图4中所示的逆转录产物。一种或两种PCR引物可以具有5’尾。

图6是显示实施例中所述的实验结果的图。

定义

在更详细地描述示例性实施方案之前,阐述以下定义以示例说明和定义在说明书中使用的术语的含义和范围。

数字范围包括定义范围的数字。除非另有说明,分别地核酸以5’至3’方向从左至右书写;并且氨基酸序列以氨基至羧基的方向从左至右书写。

除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。Singleton等人,Dictionary Of Microbiology AndMolecular Biology,2d Ed.,John Wiley and Sons,New York(1994),以及Hale&Markham,The Harper Collins Dictionary Of Biology,Harper Perennial,N.Y.(1991)为本领域技术人员提供了本文中使用的许多术语的一般含义。尽管如此,为了清楚和易于参考,在下面定义了某些术语。

必须注意的是,如本文和所附权利要求书中所使用的,单数形式的“一个”、“一种”和“该”包括复数指示物,除非上下文另外明确指出。例如,术语“引物”是指一个或多个引物,即单个引物和多个引物。还应注意的是,权利要求书可以撰写为排除任何可选要素。因此,本声明旨在作为与权利要求要素的叙述相关联地使用诸如“只”,“仅”等排他性术语,或使用“否定”限制的先行基础。

如本文所使用的术语“RNA样品”涉及材料的混合物,通常(尽管不一定)以液体形式(例如以水溶液的形式)包含一个或多个RNA分子。例如,可以从细胞(例如哺乳动物细胞)获得RNA样品。RNA样品可以包含任意数量的可区分的RNA分子。例如,在一些实施方案中,RNA样品可包含不同RNA分子的群体,在这种情况下,所述RNA样品可包含超过1000个、超过10,000个、超过50,000个、超过100,000个或多至1百万个或更多不同种类的RNA,即不同序列的RNA分子。RNA样品可包含长RNA分子,例如mRNA分子,其长度通常为至少100个核苷酸(nt)(例如,长度为200nt至10kb),并且中值长度在500-5000nt的范围内,以及例如长基因间非编码RNA(lincRNA)。RNA样品可另外地包含各种小的非编码调节性RNA,其在本文中可通称为“小RNA”,例如,微RNA、小的非编码RNA、piwi-相互作用的小RNA(piRNA)、小调节性RNA和小核仁RNA(snoRNA)等。小RNA通常是长度低于100nt,中值长度在20nt至40nt的范围内。RNA样品可另外地包含rRNA分子、tRNA分子、pre-miRNA分子和长的非编码RNA分子,例如大的基因间RNA(lincRNA)分子。除非另有说明,“RNA样品”可以具有任何类型的天然存在的RNA,包括上面描述的那些和潜在的其他RNA。

术语“核苷酸”旨在包括不仅含有已知嘌呤和嘧啶碱基,而且含有经修饰的其它杂环碱基的那些部分。这些修饰包括甲基化的嘌呤或嘧啶、酰化的嘌呤或嘧啶、烷基化的核糖或其它杂环。此外,术语“核苷酸”包括包含半抗原或荧光标记的那些部分,并且可以不仅包含常规核糖和脱氧核糖,还包含其他糖。经修饰的核苷或核苷酸还包括在糖部分上的修饰,例如其中一个或多个羟基被卤素原子或脂肪族基团取代,官能化为醚、胺等。核苷酸可以包括当掺入核酸的延伸链时能够持续延伸的核苷酸(非链终止核苷酸)和阻止随后延伸的核苷酸(例如链终止子)。提及由IUPAC代码定义的任何核苷酸(例如,R、Y、S、W、K、M、B、D、H、V和N)包括具有相同碱基配对特征的其类似物。

术语“核酸”和“多核苷酸”在本文中可互换地用于描述任何长度的聚合物,例如,大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、多至约10,000个或更多个碱基,其由核苷酸,例如脱氧核糖核苷酸或核糖核苷酸组成,并且可以酶促或合成产生(例如,如美国专利号5,948,902和其中引用的参考文献中所述的PNA),其可以以类似于两种天然存在的核酸的序列特异性方式与天然存在的核酸杂交,例如,可以参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶(G、C、A、T和U)。

如本文所使用的术语“核糖核酸”和“RNA”是指由核糖核苷酸组成的聚合物。

如本文所使用的术语“脱氧核糖核酸”和“DNA”是指由脱氧核糖核苷酸组成的聚合物。

“分离的”或“纯化的”通常是指物质(化合物、多核苷酸、蛋白质、多肽、多肽组合物)的分离,使得该物质占其所存在的样品的显著百分比(例如,大于1%、大于2%、大于5%、大于10%、大于20%、大于50%或更多,通常多至约90%-100%)。在一些情况下,分离的物质可溶解在液体,例如水溶液中。在某些实施方案中,基本上纯化的组分占样品的至少50%、80%-85%或90-95%。用于纯化感兴趣的多核苷酸和多肽的技术在本领域中是众所周知的,并且包括例如离子交换色谱法、亲和色谱法、根据密度的沉降、沉淀、溶剂萃取和使用柱或珠的固相纯化。一般来说,当一种物质存在于样品中的量相对于样品中的其他组分不是天然存在的时候,该物质是纯化的。

如本文所使用的术语“寡核苷酸”表示约2至500个核苷酸(例如,2至200个核苷酸)的核苷酸单链多聚体。寡核苷酸可以是合成的或可以酶促制备,并且在一些实施方案中,长度为4至50个核苷酸。寡核苷酸可以包含核糖核苷酸单体(即,可以是RNA寡核苷酸)或脱氧核糖核苷酸单体。寡核苷酸例如长度可以为5至20、11至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150或150至200,多至500个核苷酸。如本文所使用的术语“双链体”、“杂交体”或“双链”是指具有通过碱基配对结合在一起的两条链的核酸。

如本文所使用的术语“互补”是指核苷酸序列通过非共价键与感兴趣的靶核酸碱基配对。在经典的沃森-克里克碱基配对中,DNA中的腺嘌呤(A)与胸腺嘧啶(T)形成碱基对,鸟嘌呤(G)与胞嘧啶(C)形成碱基对。在RNA中,胸腺嘧啶被尿嘧啶(U)取代。因此,A与T互补,G与C互补。在RNA中,A与U互补,反之亦然。通常,“互补”是指核苷酸序列至少部分互补。术语“互补”还可涵盖双链体完全互补,使得一条链中的每个核苷酸在相应位置上与另一条链中的每个核苷酸互补。在某些情况下,核苷酸序列可能与靶标部分互补,其中并非所有核苷酸在所有相应位置都与靶核酸中的每个核苷酸互补。

术语“确定”、“测量”、“评价”、“评估”、“分析”和“测定”在本文中可互换使用以指代任何形式的测量或分析,并且包括确定元素是否存在。这些术语包括定量和/或定性的确定。评估可以是相对的或绝对的。“评估存在”包括确定存在的物的量,以及确定它是否存在。

如本文所使用的术语“总细胞RNA”是至少包含tRNA、rRNA、mRNA、lincRNA和小RNA的RNA样品。

如本文所使用的,在已耗尽tRNA、rRNA或其他类型RNA的总细胞RNA样品的上下文中的术语“耗尽”是已从中减去,即去除、降解或实质性减少tRNA、rRNA或其他类型RNA的总细胞RNA样品。

如本文所使用的术语“衔接子”是指可由任何类型的核苷酸组成的寡核苷酸。衔接子可以是例如RNA衔接子、DNA衔接子,或者它可以由核糖核苷酸和脱氧核糖核苷酸或其类似物组成。取决于应用,衔接子可以是5-50个碱基,例如10至30个碱基的长度或更长。取决于应用,衔接子可包含分子条形码、限制性位点和/或引物结合位点。在下面描述的方法中,衔接子的至少3’末端可以是RNA。在一些实施方案中,衔接子可包含分子条形码(例如,“索引”或“检索”序列)。

如本文所使用的术语“3’-OH”和“3’-羟基”是指在核酸的3’末端的核苷酸,其中该核苷酸在3’位置具有羟基。

如本文所使用的术语“5’-P”或“5’-磷酸”是指在指核酸的5’末端的核苷酸,其中该核苷酸在5’位置处具有磷酸基团。

如本文所使用的术语“cDNA文库”是指从模板RNA合成并因此与模板RNA互补的DNA的集合或文库。可以对cDNA文库进行测序、标记、扩增和/或克隆,这取决于将如何使用它。

如本文所使用的术语“RNA:cDNA杂交体”是指使用RNA作为模板,通过逆转录酶催化第一链cDNA合成后的产物。如果cDNA部分包含模板mRNA的5’末端的完整序列,“RNA-cDNA杂交体”可以是全长的。

如本文所使用的术语“模板”是指逆转录酶制备cDNA的底物RNA。模板RNA是RNA分子混合群体中用于富集的靶标。

术语“非天然存在”是指组合物在自然界中不存在。本文所述的任何蛋白质可以是非天然存在的,其中术语“非天然存在”是指具有与处于其天然状态的蛋白质不同的氨基酸序列和/或翻译后修饰模式的蛋白质。例如,非天然存在的蛋白质可在蛋白质的N-末端、C-末端和/或N-末端和C-末端之间具有一个或多个氨基酸的置换、缺失或插入。“非天然存在”的蛋白质可具有与天然存在的氨基酸序列不同的氨基酸序列(即,与天然存在的蛋白质的氨基酸序列具有小于100%的序列同一性),但其与天然存在的氨基酸序列至少为80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%同一。在某些情况下,如果非天然存在的蛋白质是由不同的(例如,细菌)细胞产生的,非天然存在的蛋白质可以包含N-末端甲硫氨酸,或者可以缺少一种或多种翻译后修饰(例如,糖基化、磷酸化等)。“突变体”或“变体”蛋白质可以具有相对于野生型蛋白质的一个或多个氨基酸置换,并且可以包括“融合”蛋白。术语“融合蛋白”是指由多个多肽组分组成的蛋白质,这些多肽组分在其自然状态下不连接。融合蛋白可以是两种、三种或甚至四种或更多种不同蛋白质的组合。术语多肽包括融合蛋白,包括但不限于两个或更多个异源氨基酸序列的融合,多肽与:异源靶向序列、接头、表位标签、可检测的融合伴侣(例如荧光蛋白)、β-半乳糖苷酶、萤光素酶等的融合。融合蛋白可具有添加到蛋白质的N末端、C末端和/或中间部分的一个或多个异源结构域。如果融合蛋白的两个部分是“异源的”,那么它们在其自然状态下就不是同一个蛋白质的部分。在核酸的上下文中,术语“非天然存在”是指包含以下的核酸:a)与处于其天然状态下的核酸不同的核苷酸序列(即,与天然存在的核酸序列具有小于100%的序列同一性),b)一个或多个非天然存在的核苷酸单体(其可导致非天然主链或不是G、A、T或C的糖)和/或c)可包含对核酸的5’末端、3’末端和/或5’末端和3’末端之间的一个或多个其他修饰(例如,添加的标签或其他部分)。内部5’-5’连接是非天然存在的连接。

在组合物的上下文中,术语“非天然存在”是指:a)天然未组合的组分(例如,因为它们位于不同的位置、在不同的细胞或不同的细胞区室中)的组合;b)具有在自然界中未发现的相对浓度的组分的组合;c)缺少通常与自然界中的一种组分相关联的物质的组合;d)以自然界中未发现的形式(例如,干燥的、冷冻干燥的、结晶的、水性)的组合;和/或e)包含自然界中未发现的组分的组合。例如,制备物可包含自然界中未发现的“非天然存在的”缓冲液(例如,Tris、HEPES、TAPS、MOPS、tricine或MES)、洗涤剂、染料、反应增强剂或抑制剂、氧化剂、还原剂、溶剂或防腐剂。

术语“引物”是指天然或合成的寡核苷酸,其在与多核苷酸模板形成双链体时能够作为核酸合成的起始点,并且从其3’末端沿着模板延伸使得形成延伸的双链体。在延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常引物通过DNA聚合酶或逆转录酶延伸。引物的长度通常与其在合成引物延伸产物中的用途相容,并且通常长度在6至100个核苷酸,例如,10至75、15至60、15至40、18至30、20至40、21至50、22至45、25至40等的范围内,更典型地在18至40、20至35、21至30个核苷酸长的范围内,以及所述范围内的任何长度。引物通常是单链的。引物具有3’羟基。

术语“均聚物尾”是指这样的序列,除了最后一个或两个核苷酸可能例外,具有3’末端序列,该3’末端序列具有一串相同的核苷酸(例如,至少8个、至少10个或至少12个),例如一串T、U、A、C或G。该术语包括锚定的均聚物,其可以是序列(T)

术语“oligo-dT引物”是指能够从polyA尾引发cDNA合成的引物。除了最后一个或两个核苷酸之外,oligo-dT引物可以具有3’末端序列,其具有一串胸腺嘧啶。这种引物可以具有5’尾。在一些实施方案中,oligo-dT引物可以被锚定并且可以具有以下序列:TTTTTTTTTTTTTTTVN(SEQ ID NO:1),其中V是G、A或C或其类似物,并且N是任何核苷酸或其类似物。这种寡核苷酸中的T可以是T类似物,因为它能够与A特异性碱基配对。

用于逆转录RNA的术语“序列特异性引物”意指与RNA(例如,mRNA)中的独特序列杂交的引物。序列特异性引物没有随机序列,也不是由单个核苷酸组成的。随机引物和oligo(T)引物不是序列特异性引物。

术语“cDNA拷贝”是指具有RNA分子的反向互补体的DNA分子(即第一链cDNA)或具有与RNA分子相同序列但U是T的DNA分子(即第二链cDNA)。

本文所述的某些多核苷酸可以由式(例如,“3’*-X-(5’5’)-Y-3’”)表示。除非另有说明,否则由式(如3’*-X-(5’5’)-Y-3’的情况)定义的多核苷酸沿5’至3’方向取向。式的组分,例如“X”和“Y”等,是指多核苷酸内核苷酸的可单独定义的序列,其中,除非从上下文中隐含,否则所述序列共价连接在一起,使得式所描述的多核苷酸是单个分子。按照惯例,式中显示的序列的互补体将以典型(’)表示,使得序列“X”的互补体将为“X’”。此外,除非另有说明或从上下文中隐含,否则由式定义的多核苷酸可在其3’末端、其5’末端或3’和5’末端两者具有另外的序列、引物结合位点、分子条形码、启动子或间隔子等。在许多情况下,式中的组分在单个分子中彼此紧邻。在许多情况下,在所列举的组分之间可能存在一个或多个其他序列。显而易见的是,多核苷酸的各种组分序列(例如,X、Y、R、W等)可以独立地是任何所需的长度,只要它们能够执行所需的功能(例如,与另一个序列杂交)。例如,多核苷酸的各种组分序列可以独立地具有8-80个核苷酸,例如10-50个核苷酸范围内的长度。显而易见的是,具有特定式的衔接子、引物或产物由该式描述的衔接子、引物或产物分子的群体组成。例如,如果序列在群体中是“随机”或“可变”的,则该序列由群体中的几个不同序列表示。

术语“内部5’-5’连接”是指其中第一核苷酸的糖的第5位直接或间接(例如,通过磷酸或另一种类型的连接)共价连接到第二核苷酸的糖的第5位的连接。

其他术语的定义可以出现在整个说明书中。

发明详述

在描述各种实施方案之前,应当理解,本公开内容的教导不限于所描述的特定实施方案,并因此当然可以改变。还应理解,本文中使用的术语仅用于描述特定实施方案的目的,而不是旨在限制,因为本教导的范围将仅由所附权利要求书限制。

本文使用的章节标题仅用于组织目的,不得解释为以任何方式限制所描述的主题。虽然结合各种实施方案来描述本教导,但本教导并不打算限于这些实施方案。相反,如本领域技术人员将理解的,本发明的教导包括各种备选方案、修改和等效方案。

除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开内容所属领域的普通技术人员通常理解的相同含义。尽管与本文所描述的方法和材料类似或等效的任何方法和材料也可以用于本教导的实践或测试中,但是现在描述一些示例性方法和材料。

引用任何出版物的目的在于其在申请日之前披露,不应被解释为承认本权利要求无权凭借在先发明而早于所述出版物。此外,所提供的公布日期可以不同于需要独立确认的实际公布日期。

在阅读本公开内容后对本领域技术人员将显而易见的是本文所描述和示例说明的单个实施方案中的每一个具有离散的组件和特征,这些组件和特征可以容易地与任何其他几个实施方案的特征分离或组合,而不脱离本教导的范围或精神。任何所述的方法都可以按照所述的事件的顺序或逻辑上可能的任何其他顺序来执行。

本文所提及的所有专利和出版物,包括在这些专利和出版物中公开的所有序列,均通过引用被明确地并入本文。

图1-3显示了提供将5’衔接子连接至RNA的方法的实例。在一些实施方案中,所述方法可以包括在使得5’衔接子的3’末端与核酸分子的5’末端连接的条件下孵育反应混合物,该反应混合物包括:5’衔接子;核酸分子群体;以及连接酶。如图1示例显示的,衔接子是式3’*-X-(5’5’)-Y-3’,其中3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接,Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端。序列X和Y可以独立地是至少8个、至少10个、至少12个或至少15个核苷酸的长度。序列X和Y的序列和功能将在下面更详细地描述。阻断的3’不可连接,并因此不包含3’羟基。如图1所示,5’衔接子实际上由两个序列X和Y组成,它们通过内部5’到5’连接由它们的5’末端连接,使得衔接子具有两个3’末端。如所示的,3’末端中的一个被阻断,因为它不具有3’羟基,并且不能与5’磷酸连接。5’衔接子可以是在16nt长度(例如,至少20或至少25nt长度)范围内的单链寡核苷酸,尽管也可以使用长度在该范围之外的衔接子。在一些实施方案中,5’衔接子可以是式3’*-X-(5’5’)-Y-Z-3’,其中X和Y如上所总结的,并且Z是至少两个(例如,2、3或4个或更多个)核苷酸(参见,例如,Fuchs等人,PLoS ONE 10:e0126049和例如,US20170137875)的随机序列。除了5’衔接子中的序列X之外,在5’衔接子的3’末端的随机序列可以帮助减少偏倚。

核酸分子群体在图2中示例显示。如所示的,核酸分子群体是式5’-R-X’-3’,其中R是5’-磷酸化RNA并且X’与5’衔接子中的序列X互补。如所示的,序列X’可以是已添加到RNA上的均聚物尾(例如,添加到细胞中的RNA上的polyA尾,或通过poly(A)、poly(G)或poly(U)聚合酶在体外添加到RNA上的poly(A)、poly(G)或poly(U)尾),或已连接到RNA的3’衔接子。显而易见的是,所述方法中使用的连接酶应该能够将5’磷酸连接到3’羟基。5’衔接子可以是RNA寡核苷酸、DNA寡核苷酸或包含DNA和RNA的寡核苷酸。可使用RNA连接酶(例如,T4RNA连接酶)、使用Wang等人(RNA 2007 13:151-159)或Lockhart等人(USPN 6,344,316)等中概述的任何方法将5’衔接子连接到经消化样品的RNA分子上。所述方法中使用的RNA连接酶可以是任何合适的连接酶。在一些实施方案中,可以使用T4 RNA连接酶,尽管可以替代地使用对单链底物具有优先性的各种其他RNA连接酶。在一些实施方案中,所使用的RNA连接酶可以是热稳定的。在这些实施方案中,连接反应可在40℃至80℃范围内的高温下进行。在使得5’衔接子的序列X与核酸分子的序列X’杂交以产生复合物的条件下进行连接,并且在复合物中,5’衔接子的羟基化的3’末端连接到核酸分子的5’末端以产生式3’*-X-(5’5’)-Y-R-X’-3’的产物分子。图2中示例显示了示例性复合体。如图2所示,在复合物中,5’衔接子的序列X与核酸分子中的互补序列(即,X’)杂交以产生复合物,其中5’衔接子的3’末端邻近核酸分子的3’末端,从而以减少序列偏倚的方式促进这些末端的连接。图3示例显示了式3’*-X-(5’5’)-Y-R-X’-3’的产物分子,具有(顶部)和不具有(底部)由X到X’杂交产生的二级结构。

如上所述,衔接子中的序列X和核酸分子中的互补序列X’可以根据该方法的实施方式而变化。如上所述,序列X’可以是例如天然的poly(A)尾(即,添加到从中获得RNA的细胞中的RNA的poly(A)尾)。在这些实施方案中,核酸分子可以是poly(A)

如果所述方法包括添加衔接子或均聚物尾到RNA的3’末端上,则该RNA可以是例如小RNA、原核RNA、片段化的mRNA或原核RNA的片段。

在一些实施方案中,所述方法可以进一步包括逆转录连接产物以产生cDNA,以及然后扩增所述cDNA。这些步骤在图4和图5中示例显示。参考图4,所述方法的一些实施方案可以包括使逆转录引物与连接产物的序列X’杂交。如所示的,逆转录引物应在其3’末端具有与连接产物中的X’互补的序列。如果X’是均聚物,则逆转录引物的3’末端应包含互补的均聚物。在一些实施方案中,逆转录引物可以在3’末端包含锚定的均聚物,其可以是序列(T)

图5显示了如何通过一对引物扩增式3’-Y’-R’-X-W-5’的cDNA,所述引物可包含与cDNA中的序列Y’杂交的第一PCR引物和具有序列W的第二PCR引物。如果需要,这些引物中的一个或两个可以包含5’尾。在一些实施方案中,所使用的引物可以具有与所使用的测序平台兼容的序列(例如,P5和P7序列,所述序列与Illumina的测序平台兼容),并且扩增产物将在其末端具有那些序列(例如,如果使用Illumina测序平台,则P5序列在一个末端,并且P7序列在另一个末端)。

在一些实施方案中,核酸分子的群体通过以下制备:i.使包含RNA的RNA样品暴露于片段化条件以产生RNA片段;和ii.如上所述,例如通过连接或使用poly(A)、poly(G)或poly(U)聚合酶将序列X’添加到RNA片段的3’末端上。RNA样品中的RNA可以以多种不同的方式进行片段化。例如,RNA样品可以包含cDNA:RNA杂交体(即,可以包含使用例如oligo(dT)引物引发的逆转录产物),并且可以通过用RNAseH处理样品来进行对RNA的片段化(参见2017年11月20日提交的美国申请序列号15/818,469,其通过引用并入本文)。也可以通过将随机DNA寡核苷酸与RNA杂交以产生cDNA:RNA杂交体,然后用RNaseH处理所述杂交体来进行片段化。可替代地,可通过在二价阳离子(例如,Mg

在一些实施方案中,除了较长RNA(mRNA和lncRNA)外,初始样品(在片段化之前)可包含长度在20至50个核苷酸范围内并且具有20nt至40nt范围内的中值长度的小RNA。小RNA包括微RNA(miRNA)分子、微小的非编码RNA(tncRNA)分子和小调节性RNA(smRNA)分子等。在这些实施方案中,初始片段化步骤可避免对小RNA的片段化。例如,如果在二价阳离子存在的情况下通过加热对初始RNA进行片段化(其主要切割长RNA,例如mRNA,因为它们含有比短RNA更多的切割位点),则可以在小RNA被显著片段化之前终止切割反应。在其他实施方案中,可以使用RNase H。如果样品中存在小RNA,则mRNA可被片段化成与小RNA的长度相似的中值长度。小RNA长度可以在20-29个核苷酸的范围内,并且许多小RNA长度为约20-29个核苷酸。因此,如果要分析小RNA和较长RNA(例如,mRNA),则较长RNA可以被片段化成20至100个核苷酸(例如,25至50个核苷酸)的中值长度。因此,在一些实施方案中,所述方法可包括将所述样品片段化以产生RNA产物,其中RNA产物包含小RNA和较长RNA的片段。在这些实施方案中,小RNA和RNA片段两者都具有5’磷酸和3’羟基,并因此可以使用如上所述的方法连接到5’衔接子。所得cDNA文库可以包含mRNA片段的cDNA拷贝以及小RNA的cDNA拷贝。这些分子可以一起扩增和分析,并因此所述方法的该实施方案提供了在同一工作流程中分析小RNA和较长RNA(例如,mRNA)的方法。在这些实施方案中,核酸分子的群体可以包含:i.小RNA和RNA片段和ii.序列X’,其中cDNA包括小RNA的cDNA拷贝和RNA片段的cDNA拷贝。

在其中对cDNA测序的实施方案中,可以如上所述使用与添加的序列(或其互补体)杂交的一种或多种引物扩增cDNA文库。测序步骤可以使用任何方便的下一代测序方法完成,并且可以产生至少10,000、至少50,000、至少100,000、至少500,000、至少1百万、至少1千万、至少1亿、至少10亿或至少100亿个序列读数。在一些情况下,读数是配对末端读数。显而易见的是,用于扩增的引物可以与其中使用引物延伸的任何下一代测序平台兼容,例如Illumina的可逆终止子方法、Roche的焦磷酸测序方法(454)、Life Technologies的连接测序(SOLiD平台)、Life Technologies的Ion Torrent平台或Pacific Biosciences的荧光碱基切割方法。在以下参考文献中描述了这样的方法的实例:Margulies等人(Nature2005437:376-80);Ronaghi等人(Analytical Biochemistry 1996242:84-9);Shendure(Science 2005 309:1728);Imelfort等人(Brief Bioinform.2009 10:609-18);Fox等人(Methods Mol Biol.2009;553:79-108);Appleby等人(Methods Mol Biol.2009;513:19-39)English(PLoS One.2012 7:e47768)和Morozova(Genomics.2008 92:255-64),通过引用针对方法和方法的特定步骤的一般描述将其并入本文,包括每个步骤的所有起始产物、试剂和最终产物。

在某些实施方案中,被测序的cDNA可以包含由多个不同RNA样品制成的cDNA文库的集合(pool),其中不同的cDNA文库具有分子条形码(在衔接子或PCR引物中)以指示其来源。在一些实施方案中,被分析的cDNA可以源自单一来源(例如,单一生物、病毒、组织、细胞、受试者等),而在其他实施方案中,被测序的cDNA可以是从多个来源中提取的核酸的集合(例如,来自多个生物、组织、细胞、受试者等的核酸的集合),其中“多个”是指两个或更多个。因此,在某些实施方案中,被测序的cDNA可以含有来自2个或更多个来源,3个或更多个来源,5个或更多个来源,10个或更多个来源,50个或更多个来源,100个或更多个来源,500个或更多个来源,1000个或更多个来源,5000个或更多个来源,以及多至并且包括约10,000个或更多个来源的核酸。分子条形码使得可以在其被分析后区分来自不同来源的序列。序列读数可以由计算机分析,并因此,可以将用于执行以下阐述的步骤的指令阐述为可以记录在合适的物理计算机可读存储介质中的程序。

还提供了各种组合物。在一些实施方案中,组合物可以包含式3’*-X-(5’5’)-Y-3’的5’衔接子,如上所述,其中3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接;Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端。在一些实施方案中,序列X与序列X’的均聚物尾或与包含序列X’的3’衔接子互补。在特定情况下,序列X可以是序列(T)

本公开内容还提供了用于实践主题方法的试剂盒。试剂盒可包含上述任何组分。例如,在一些实施方案中,试剂盒可包含式3’*-X-(5’5’)-Y-3’的5’衔接子,如上所述,其中3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接;Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端。在一些实施方案中,衔接子可以是式:3’*-X-(5’5’)-Y-Z-3’,如上所述,其中:3’*是阻断的3’末端,X是至少8个核苷酸的均聚物或至少8个核苷酸的合成序列;5’5’是内部5’-5’连接;Y是至少8个核苷酸的衔接子序列;以及Z是至少两个核苷酸的随机序列。在一些实施方案中,试剂盒可另外地包括包含序列X’的3’衔接子,和/或能够将序列X’的均聚物尾添加至RNA的聚合酶(例如,poly(A)、poly(G)或poly(U)聚合酶)。在一些实施方案中,试剂盒可以另外地包括逆转录引物,其具有与序列X’互补并因此与序列X’杂交的3’序列和任选地5’尾,所述5’尾包含序列W。在这些实施方案中,与序列X’杂交的3’序列与poly(A)、poly(G)或poly(U)杂交。在一些实施方案中,逆转录引物可以具有序列(T)

试剂盒的各种组分可以存在于单独的容器中,或者根据需要可以将某些兼容的组分预组合到单个容器中。

除上述组分外,主题试剂盒还可包括使用试剂盒的组分实施主题方法的说明。

本文所述的方法可用于分析来自几乎任何生物和/或样品类型的RNA(例如mRNA,以及任选地小RNA),所述生物和/或样品类型包括但不限于植物、动物(例如,爬行动物、哺乳动物、昆虫、蠕虫、鱼类等)、组织样品、尸体组织、考古/古代样品等。在某些实施方案中,所述方法中使用的RNA样品可源自哺乳动物,其中在某些实施方案中,哺乳动物是人。在示例性实施方案中,RNA样品可以含有来自哺乳动物细胞(例如人、小鼠、大鼠或猴细胞)的RNA。样品可以由培养的细胞或临床样品(例如,组织活检、刮擦或灌洗)的细胞或者法医样品的细胞(即在犯罪现场收集的样品的细胞)制成。在特定实施方案中,RNA样品可以获自生物学样品,例如细胞、组织、体液和粪便。感兴趣的体液包括但不限于血液、血清、血浆、唾液、粘液、粘痰、脑脊液、胸膜液、泪液、乳导管液、淋巴液、痰、脑脊髓液、滑液、尿液、羊水和精液。在特定实施方案中,样品可以获自受试者,例如人。在一些实施方案中,分析的样品可以是从血液(例如从怀孕的女性或患者的血液)中获得的cfRNA的样品。

本方法可以用于各种诊断、药物发现和研究应用中,包括但不限于疾病或病况的诊断或监测(其中mRNA和/或小RNA的表达提供了疾病或病况的标志物),药物靶标的发现(其中mRNA和/或小RNA在疾病或病况中差异表达并且可成为药物治疗的靶标),药物筛选(其中通过评估mRNA和/或小RNA的水平来监测药物的效果),确定药物敏感性(其中药物敏感性与mRNA和/或小RNA的特定谱相关)和基础研究(其中需要鉴定样品中是否存在mRNA和/或小RNA,或在某些实施方案中,两个或更多个样品中的特定mRNA和/或小RNA的相对水平)。

在某些实施方案中,可以使用上述方法获得两个或更多个不同小RNA样品中的mRNA和/或小RNA的相对水平,并进行比较。在这些实施方案中,通常将从上述方法获得的结果标准化为样品中RNA的总量或对照RNA(例如组成型RNA),并进行比较。这可以通过比较比率或通过任何其他方式来完成。在特定实施方案中,可以比较两个或更多个不同样品的mRNA和/或小RNA谱,以鉴定与特定疾病或病况相关的mRNA和/或小RNA(例如,由疾病或病况诱导的mRNA和/或小RNA,并因此可以是与该疾病或病况有关的信号转导途径的一部分)。

不同的样品可以由“实验”样品(即感兴趣的样品)和可以与实验样品进行比较的“对照”样品组成。在许多实施方案中,不同样品是成对的细胞类型或其级分,一种细胞类型是感兴趣的细胞类型,例如,异常细胞,而另一种是对照,例如正常细胞。如果比较两个细胞级分,则这些级分通常是来自两个细胞中的每一个的相同级分。然而,在某些实施方案中,可以比较同一细胞的两个级分。示例性的细胞类型对包括,例如,从组织活检(例如,从患有诸如结肠癌、乳腺癌、前列腺癌、肺癌、皮肤癌的疾病或被病原体感染等的组织)中分离的细胞和来自同一组织、通常来自同一患者的正常细胞;在组织培养中生长的、永生的(例如,具有增殖突变或永生化转基因的细胞)、感染病原体的或经过处理的(例如,使用环境或化学制剂,例如肽、激素、温度变化、生长条件、物理应激、细胞转化等)细胞和正常细胞(例如,除了不是永生的、感染的或经处理的等而与实验细胞在其他方面相同的细胞);从患有癌症、疾病的哺乳动物、老年性哺乳动物或暴露于病况的哺乳动物中分离的细胞,以及来自相同的种、优选相同的科的健康或年轻哺乳动物的细胞;以及来自同一哺乳动物的分化细胞和未分化细胞(例如,一个细胞是哺乳动物中另一个细胞的祖细胞)。在一个实施方案中,可以使用不同类型的细胞(例如神经元和非神经元细胞)或不同状态的细胞(例如在对细胞刺激之前和之后)。在本发明的另一个实施方案中,实验材料是易受病原体(例如病毒,例如人免疫缺陷病毒(HIV)等)感染的细胞,而对照材料是对病原体感染具有抗性的细胞。在本发明的另一个实施方案中,样品对由未分化的细胞(例如干细胞)和分化的细胞来代表。

在一些实施方案中,可以分析序列读数以提供对样品中存在哪些序列的定量确定。这可以通过以下完成:例如,根据它们片段化断裂点和/或它们是否含有相同的索引序列(其例如可以存在于5’衔接子中),对序列读数进行计数或可替代地在扩增之前对原始起始分子的数量进行计数。将分子条形码与片段的其他特征(例如,片段的末端序列,其定义断裂点)结合使用以区分片段是已知的。用于计数单个分子的分子条形码和示例性方法在Casbon(Nucl.Acids Res.2011,22e81)和Fu等人(Proc Natl Acad Sci U S A.2011 108:9026-31)等中进行了描述。分子条形码在US 2015/0044687、US 2015/0024950、US 2014/0227705、US 8,835,358和US 7,537,897以及各种其他出版物中有所描述。

还提供了用于鉴定与表型例如疾病、病况或临床结果等相关的模式的方法。在一些实施方案中,该方法可以包括(a)对多个RNA样品进行上述方法,其中RNA样品是从患有已知表型例如疾病、病况或临床结果的患者中分离的,从而确定来自每个患者的哪些RNA;和(b)鉴定与表型相关的特征。

在一些实施方案中,特征可以是诊断性的(例如,可以提供疾病或病况或者疾病或病况的类型或阶段的诊断等)、预后的(例如,指示临床结果,例如在一定时间范围内的存活或死亡)或治疗诊断的(例如,指示哪种治疗最有效)。

还提供了用于分析患者样品的方法。在该实施方案中,所述方法可以包括:(a)使用上述方法鉴定在患者中表达不足和/或过表达的序列;(b)将所鉴定的序列与和表型例如疾病、病况或临床结果等相关的一组特征序列进行比较;和(c)提供指示与表型相关的报告。该实施方案可以进一步包括基于比较结果进行诊断、预后或治疗诊断。

在一些实施方案中,如上所述,所述方法可以涉及创建报告(其电子形式可以已经从远程位置发送)并将该报告发送给医生或其他医疗专业人员以确定患者是否具有表型(例如癌症等)或为患者鉴定合适的疗法。该报告可以用作诊断以确定受试者是否患有疾病或病况,例如癌症。在某些实施方案中,例如,所述方法可以用于确定癌症的分期或类型、鉴定转移的细胞或监测患者对治疗的反应。

在任何实施方案中,报告可以被发送到“远程位置”,其中“远程位置”是指除了检查图像的位置以外的位置。例如,远程位置可以是同一城市中的另一位置(例如办公室、实验室等),不同城市中的另一位置,不同州的另一位置,不同国家的另一位置等。因此,当一个项目被指示为与另一项目“远程”时,意味着这两个项目可以在同一房间中但分开、或者至少在不同的房间或不同的建筑物中,并且可以相隔至少一英里、十英里、或至少一百英里。“通信”信息指的是通过适当的通信信道(例如,专用或公共网络)将表示该信息的数据作为电信号传输。“发送”项目是指通过物理运输该项目或以其他方式(在可能的情况下)将该项目从一个位置移至另一位置的任何方式,并且至少在数据的情况下物理运输携带数据的介质或通信数据。通信介质的实例包括无线电或红外线传输信道以及连接到另一台计算机或联网设备的网络,以及互联网或包括电子邮件传输和记录在网站等上的信息。在某些实施方案中,报告可以由医学博士或其他合格的医学专业人员进行分析,并且可以将基于图像分析结果的报告发送给从其获得样品的患者。

因此,除其他外,本发明方法可以用于将某些基因的表达与某些生理事件联系起来。

实施方案

实施方案1.一种用于将5’衔接子连接至RNA的方法,其包括:

在其中5’衔接子的序列X与核酸分子的序列X’杂交以产生复合物的条件下,孵育包含以下的反应混合物:

(i)式3’*-X-(5’5’)-Y-3’的5’衔接子,

其中:3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接,Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端;

(ii)式5’-R-X’-3’的核酸分子群体,其中R是5’-磷酸化的RNA并且X’与5’衔接子中的序列X互补;以及

(iii)能够将5’磷酸连接至3’羟基的连接酶,

并且在所述复合物中,所述5’衔接子的羟基化的3’末端连接至所述核酸分子的5’末端以产生式3’*-X-(5’5’)-Y-R-X’-3’的产物分子。

实施方案2.实施方案1所述的方法,其中所述核酸分子中的序列X’是均聚物尾。

实施方案3.实施方案1所述的方法,其中所述核酸分子中的序列X’是已经连接至所述RNA的3’衔接子。

实施方案4.前述实施方案中任一项所述的方法,其中(ii)的核酸分子群体是通过以下制备的:i.将RNA样品暴露于片段化条件以产生RNA片段;和ii.将序列X’添加到所述RNA片段的3’末端。

实施方案5.前述实施方案中任一项所述的方法,其进一步包括:逆转录所述产物分子以产生式3’-Y’-R’-X-5’的cDNA,其中内部5’-5’连接阻断所述产物分子的序列X的逆转录。

实施方案6.前述实施方案中任一项所述的方法,其中(ii)的核酸分子群体包括:i.小RNA和RNA片段;和ii.序列X’,其中所述cDNA包括所述小RNA的cDNA拷贝和所述RNA片段的cDNA拷贝。

实施方案7.实施方案5或6所述的方法,其进一步包括扩增所述cDNA。

实施方案8.实施方案5-7中任一项所述的方法,其进一步包括对所述cDNA或其扩增产物进行测序。

实施方案9.前述实施方案中任一项所述的方法,其中(i)的5’衔接子是式3’*-X-(5’5’)-Y-Z-3’,

其中Z是至少两个核苷酸的随机序列。

实施方案10.式3’*-X-(5’5’)-Y-3’的5’衔接子,

其中:3’*是阻断的3’末端,X是至少8个核苷酸的合成序列,(5’5’)是内部5’-5’连接;Y是至少8个核苷酸的衔接子序列,以及3’是羟基化的3’末端。

实施方案11.实施方案10所述的5’衔接子,其中X与序列X’的均聚物尾互补或与包含序列X’的3’衔接子互补。

实施方案12.实施方案10或11所述的5’衔接子,其中X是序列(T)

实施方案13.一种试剂盒,其包括实施方案10-12中任一项所述的5’衔接子。

实施方案14.实施方案13所述的试剂盒,其进一步包括3’衔接子,所述3’衔接子包含序列X’。

实施方案15.实施方案13或14所述的试剂盒,其进一步包括能够将序列X’的均聚物尾添加至RNA的聚合酶。

实施方案16.实施方案13-15中任一项所述的试剂盒,其进一步包括逆转录引物,其具有与序列X’杂交的3’序列以及任选地5’尾,所述5’尾包含序列W。

实施方案17.实施方案16所述的试剂盒,其中所述与序列X’杂交的3’序列与poly(A)、poly(G)或poly(U)杂交。

实施方案18.实施方案13-17中任一项所述的试剂盒,其中所述逆转录引物具有序列(T)

实施方案19.实施方案13-18中任一项所述的试剂盒,其进一步包括至少两个PCR引物,其包括:(i)第一PCR引物,其具有与所述5’衔接子的序列Y的cDNA拷贝互补的3’序列;和(ii)第二PCR引物,其具有序列W的3’末端。

实施方案20.实施方案13-19中的任一项所述的试剂盒,其中所述5’衔接子是式3’*-X-(5’5’)-Y-Z-3’,

其中Z是至少两个核苷酸的随机序列。

实施方案21.一种寡核苷酸,其是式:3’*-X-(5’5’)-Y-Z-3’,

其中:

3’*是阻断的3’末端,

X是至少8个核苷酸的均聚物或至少8个核苷酸的合成序列;

5’5’是内部5’-5’连接;

Y是至少8个核苷酸的衔接子序列;

Z是至少两个核苷酸的随机序列;以及

3’是羟基化的3’末端。

实施例

尽管为了清楚地理解,已经通过图示和示例的方式对上述发明进行了一些详细的描述,根据本发明的教导,对于本领域的普通技术人员显而易见的是,在不脱离所附权利要求的精神或范围的情况下,可以对其进行某些改变和修改。

实施例1

使用以下所示的5’衔接子,基本上如2017年11月20日提交的美国专利申请序列号15/818,469(其通过引用并入本文)中所描述的,将1ng的Miltenyi miRXplore UniversalReference(130-094-407)(其是963个等摩尔混合的miRNA的集合)进行聚腺苷酸化,连接至衔接子,逆转录并扩增:

5’rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrArCrGrArUrCrNrNrNrN3’

3’ddNVTTTTTT5’-5’rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrArCrGrArUrCrNrNrNrN3’

3’ddNVTTTTTTTTTT5’-5’rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrArCrGrArUrCrNrNrNrN3’

使用前将每个衔接子稀释至2.5uM。

在Illumina MiSeq上对文库进行测序。生成Fastq文件,并使用cutadapt修剪读数,然后使用bowtie2将其与miRXplore库中由963个合成miRNA组成的参考进行比对。对所有测序文库进行再次采样至60,589个读数。Samtools idxstats用于生成与每个参考miRNA比对的读取计数。该实验的结果如图6所示。

在该实验中,可以通过观察该等摩尔库中miRNA过度和过低代表的数量和程度来测量偏倚。

图6显示标准5’4N衔接子(其不包含反向连接或oligo-dT区域)比其他衔接子产生更大的偏倚,而最小的偏倚是由包含反向连接和较长oligo-dT区域的衔接子产生的。

序列表

<110> Bioo科技公司

<120> 包含内部5'-5' 连接的5'衔接子

<130> BIOO-004WO

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核甘酸

<220>

<221> misc_feature

<222> (16)..(16)

<223> V是G, A或C

<220>

<221> misc_feature

<222> (17)..(17)

<223> n是a, c, g或t

<400> 1

tttttttttt tttttvn 17

<210> 2

<211> 30

<212> RNA

<213> 人工序列

<220>

<223> 合成寡核甘酸

<220>

<221> misc_feature

<222> (27)..(30)

<223> n是a, c, g或u

<400> 2

guucagaguu cuacaguccg acgaucnnnn 30

<210> 3

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核甘酸

<220>

<221> misc_feature

<222> (1)..(1)

<223> n是a, c, g, t或u

<220>

<221> misc_feature

<222> (2)..(2)

<223> v是G, A或C

<220>

<221> misc_feature

<222> (35)..(38)

<223> n是a, c, g, t或u

<400> 3

nvttttttgu ucagaguucu acaguccgac gaucnnnn 38

<210> 4

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核甘酸

<220>

<221> misc_feature

<222> (1)..(1)

<223> n是a, c, g, t或u

<220>

<221> misc_feature

<222> (2)..(2)

<223> v是a, c或g

<220>

<221> misc_feature

<222> (39)..(42)

<223> n是a, c, g, t或u

<400> 4

nvtttttttt ttguucagag uucuacaguc cgacgaucnn nn 42

相关技术
  • 包含内部5’-5’连接的5’衔接子
  • 具有内部蛋白质衔接子的纳米孔
技术分类

06120112933628