掌桥专利:专业的专利平台
掌桥专利
首页

RNA-指导的核酸酶及其活性片段和变体及其使用方法

文献发布时间:2023-06-19 11:32:36



技术领域

本发明涉及分子生物学和基因编辑领域。

背景技术

靶向基因组编辑或修饰正迅速成为基础研究和应用研究的重要工具。最初的方法涉及工程化核酸酶,例如大范围核酸酶、锌指融合蛋白或TALEN,需要生成具有对每个特定靶序列具有特异性的工程化的、可编程的、序列特异性DNA结合结构域的嵌合核酸酶。RNA-指导的核酸酶(例如CRISPR-cas细菌系统的规律成簇的间隔短回文重复(CRISPR)相关(cas)蛋白)允许通过将核酸酶与指导RNA(其与特定的靶序列特异性杂交)复合来靶向特定序列。与为每个靶序列生成嵌合核酸酶相比,产生靶特异性指导RNA的成本更低并且效率更高。此类RNA-指导的核酸酶可用于通过引入通过易错的非同源末端连接(NHEJ)修复的序列特异性双链断裂以在特定的基因组位置引入突变来编辑基因组。可替代地,可以通过同源介导的修复将异源DNA引入基因组位点。

发明内容

提供了用于结合感兴趣的靶序列的组合物和方法。所述组合物可用于切割或修饰感兴趣的靶序列、检测感兴趣的靶序列和修饰感兴趣的序列的表达。所述组合物包含RNA-指导的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、反式激活CRISPR RNA(tracrRNA)、指导RNA(gRNA)、编码其的核酸分子以及包含所述核酸分子的载体和宿主细胞。还提供了用于结合感兴趣的靶序列的CRISPR系统,其中所述CRISPR系统包含RNA-指导的核酸酶多肽和一种或多种指导RNA。因此,本文公开的方法用于结合感兴趣的靶序列,并且在一些实施方案中,用于切割或修饰感兴趣的靶序列。所述感兴趣的靶序列可以被修饰,例如作为非同源末端连接或用引入的供体序列进行同源性定向修复的结果。

发明详述

受益于前述说明书和相关附图中呈现的教导,本文阐述的本发明的许多修改和其他实施方案将由与这些发明有关的本领域技术人员想到。因此,应当理解,本发明不限于所公开的特定实施方案,并且修改和其他实施方案旨在被包括在所附实施方案的范围内。尽管本文使用了特定术语,但是它们仅在一般和描述性意义上使用,而不是出于限制的目的。

I.概览

RNA-指导的核酸酶(RGN)允许对基因组内的单个位点进行靶向操作并且在用于治疗和研究应用的基因靶向中很有用。在包括哺乳动物的多种生物体中,例如,RNA-指导的核酸酶已通过刺激非同源末端连接和同源重组而被用于基因组工程化。本文所述的组合物和方法可用于在多核苷酸中产生单链或双链断裂、修饰多核苷酸、检测多核苷酸内的特定位点或修饰特定基因的表达。

本文公开的RNA-指导的核酸酶可以通过修饰靶序列来改变基因表达。在特定实施方案中,RNA-指导的核酸酶通过指导RNA(gRNA)(作为规律成簇的间隔短回文重复(CRISPR)RNA-指导的核酸酶系统的一部分)而导向至靶序列。指导RNA与RNA-指导的核酸酶形成复合物以引导RNA-指导的核酸酶结合靶序列并在一些实施方案中在靶序列处引入单链或双链断裂。在靶序列已被切割后,可以修复断裂,从而在修复过程中修饰靶序列的DNA序列。因此,本文提供了用于使用RNA-指导的核酸酶修饰宿主细胞的DNA中的靶序列的方法。例如,RNA-指导的核酸酶可以用于修饰真核细胞或原核细胞的基因组基因座处的靶序列。

II.RNA-指导的核酸酶

本文提供了RNA-指导的核酸酶。术语RNA-指导的核酸酶(RGN)是指以序列特异性方式与特定靶核苷酸序列结合的多肽,其通过与该多肽复合并与靶序列杂交的指导RNA分子而导向至该靶核苷酸序列。尽管RNA-指导的核酸酶可以在结合时能够切割靶序列,但是术语RNA-指导的核酸酶还包括能够结合但不能切割靶序列的核酸酶失活的RNA-指导的核酸酶。RNA-指导的核酸酶对靶序列的切割可导致单链或双链断裂。仅能够切割双链核酸分子的单条链的RNA-指导的核酸酶在本文中被称为切口酶。

本文公开的RNA-指导的核酸酶包括APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1和APG1688.1RNA-指导的核酸酶(其氨基酸序列分别示于SEQ ID NO:1、11、19、27、36、45或54)及其保留以RNA指导的序列特异性方式结合靶核苷酸序列的能力的活性片段或变体。在这些实施方案的一些中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1和APG1688.1 RGN的活性片段或变体能够切割单链或双链靶序列。在一些实施方案中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1或APG1688.1 RGN的活性变体包含与SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列。在某些实施方案中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1或APG1688.1 RGN的活性片段包含SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、750、800、850、900、950、1000、1050个或更多个连续的氨基酸残基。本文提供的RNA-指导的核酸酶可包含至少一个核酸酶结构域(例如,DNase、RNase结构域)和至少一个RNA识别和/或RNA结合结构域以与指导RNA相互作用。在本文提供的RNA-指导的核酸酶中可以发现的其他结构域包括但不限于:DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域。在特定实施方案中,本文提供的RNA-指导的核酸酶可包含DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域中的一个或多个的至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。

靶核苷酸序列与本文提供的RNA-指导的核酸酶结合,并与与RNA-指导的核酸酶缔合的指导RNA杂交。然后,如果多肽具有核酸酶活性,则靶序列随后可被RNA-指导的核酸酶切割。术语“切割”或“裂解”是指靶核苷酸序列的主链内至少一个磷酸二酯键的水解,其可导致靶序列内的单链或双链断裂。本文公开的RGN可以切割多核苷酸内的核苷酸,起核酸内切酶的作用或可以是核酸外切酶,从多核苷酸的末端(5’和/或3’末端)去除连续的核苷酸。在其他实施方案中,所公开的RGN可以在多核苷酸的任何位置内切割靶序列的核苷酸,并因此充当核酸内切酶和核酸外切酶。本文公开的RGN对靶多核苷酸的切割可导致交错的断裂或平末端。

本文公开的RNA-指导的核酸酶可以是来源于细菌或古细菌物种的野生型序列。可替代地,RNA-指导的核酸酶可以是野生型多肽的变体或片段。例如,可以修饰野生型RGN以改变核酸酶活性或改变PAM特异性。在一些实施方案中,RNA-指导的核酸酶不是天然存在的。

在某些实施方案中,RNA-指导的核酸酶起切口酶的作用,仅切割靶核苷酸序列的单条链。这样的RNA-指导的核酸酶具有单个功能性核酸酶结构域。在这些实施方案中的一些中,另外的核酸酶结构域已被突变使得核酸酶活性降低或消除。

在其他实施方案中,RNA-指导的核酸酶完全缺乏核酸酶活性或表现出降低的核酸酶活性,并且在本文中被称为核酸酶失活。用于将突变引入氨基酸序列的本领域已知的任何方法(例如PCR介导的诱变和定点诱变)可以用于生成切口酶或核酸酶失活的RGN。例如,参见,美国公开号2014/0068797和美国专利号9,790,490;其各自通过引用整体并入本文。

缺乏核酸酶活性的RNA-指导的核酸酶可用于将融合的多肽、多核苷酸或小分子有效载荷递送至特定的基因组位置。在这些实施方案的一些中,RGN多肽或指导RNA可以与可检测标记融合以允许检测特定序列。作为非限制性示例,核酸酶失活的RGN可以融合至可检测标记(例如荧光蛋白),并被靶向至与疾病相关的特定序列,以允许检测与疾病相关的序列。

可替代地,可以将核酸酶失活的RGN靶向至特定的基因组位置,以改变所需序列的表达。在一些实施方案中,核酸酶失活的RNA-指导的核酸酶与靶序列的结合通过干扰RNA聚合酶或转录因子在靶基因组区域内的结合而导致靶序列或受到靶序列的转录控制的基因的表达的抑制。在其他实施方案中,RGN(例如,核酸酶失活的RGN)或其复合的指导RNA进一步包含表达调节子,在与靶序列结合后,其用于抑制或激活靶序列或受到靶序列的转录控制的基因的表达。在这些实施方案的一些中,表达调节子通过表观遗传机制调节靶序列或受调节的基因的表达。

在其他实施方案中,可以将核酸酶失活的RGN或仅具有切口酶活性的RGN靶向至特定的基因组位置,以通过与碱基编辑多肽(例如脱氨酶多肽或其使核苷酸碱基脱氨基的活性变体或片段)融合来修饰靶多核苷酸的序列,导致从一个核苷酸碱基向另一核苷酸碱基的转化。碱基编辑多肽可以在其N末端或C末端与RGN融合。另外,可以通过肽接头将碱基编辑多肽与RGN融合。可用于此类组合物和方法的脱氨酶多肽的非限制性示例包括胞苷脱氨酶或腺苷脱氨酶碱基编辑器,其描述于Gaudelli等人,(2017)Nature 551:464-471,美国公开号2017/0121693和2018/0073012,以及国际公开号WO/2018/027078,其各自通过引用整体并入本文。

与多肽或结构域融合的RNA-指导的核酸酶可以通过接头分离或连接。如本文所用,术语“接头”是指连接两个分子或部分(例如核酸酶的结合结构域和切割结构域)的化学基团或分子。在一些实施方案中,接头将RNA-指导的核酸酶的gRNA结合结构域与碱基编辑多肽(例如脱氨酶)连接。在一些实施方案中,接头连接核酸酶失活的RGN和脱氨酶。通常,接头位于两个基团、分子或其他部分之间或由其侧接,并通过共价键连接至每个所述基团、分子或其他部分,从而连接所述基团、分子或其他部分。在一些实施方案中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为5-100个氨基酸,例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可以考虑更长或更短的接头。

本文公开的RNA-指导的核酸酶可包含至少一个核定位信号(NLS)以增强RGN向细胞核的转运。核定位信号在本领域中是已知的,并且通常包含一段碱性氨基酸(例如,参见,Lange等人,J.Biol.Chem.(2007)282:5101-5105)。在特定实施方案中,RGN包含2、3、4、5、6个或更多个核定位信号。一个或多个核定位信号可以是异源NLS。可用于本文公开的RGN的核定位信号的非限制性示例是SV40大T抗原、nucleopasmin和c-Myc的核定位信号(例如,参见,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。在特定实施方案中,RGN包含如SEQ IDNO:67所示的NLS序列。RGN可在其N端、C端或N端和C端两者处包含一个或多个NLS序列。例如,RGN可以在N末端区域包含两个NLS序列,在C末端区域包含四个NLS序列。

本领域已知的将多肽定位于一个或多个特定亚细胞位置的其他定位信号序列也可以用于靶向RGN,包括但不限于质体定位序列、线粒体定位序列和靶向质体和线粒体两者的双重靶向信号序列(例如,参见,Nassoury和Morse(2005)Biochim Biophys Acta 1743:5-19;Kunze和Berger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol5:529-535;Carrie和Small(2013)Biochim Biophys Acta 1833:253-259;Carrie等人,(2009)FEBS J 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;Peeters和Small(2001)Biochim Biophys Acta1541:54-63;Murcha等人,(2014)J Exp Bot65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glaser等人,(1998)Plant Mol Biol 38:311-338)。

在某些实施方案中,本文公开的RNA-指导的核酸酶包含至少一个促进RGN的细胞摄取的细胞穿透结构域。细胞穿透结构域是本领域已知的,并且通常包括一段带正电荷的氨基酸残基(即,聚阳离子细胞穿透结构域)、交替的极性氨基酸残基和非极性氨基酸残基(即,两亲性细胞穿透结构域)、或疏水性氨基酸残基(即,疏水性细胞穿透结构域)(例如,参见,Milletti F.(2012)Drug Discov Today17:850-860)。细胞穿透结构域的非限制性示例是来自人类免疫缺陷病毒1的反式激活转录激活因子(TAT)。

核定位信号、质体定位信号、线粒体定位信号、双重靶向定位信号和/或细胞穿透结构域可以位于RNA-指导的核酸酶的氨基末端(N末端)、羧基末端(C末端)或内部位置。

本文公开的RGN可以直接或通过接头肽间接地融合至效应子结构域,例如切割结构域、脱氨酶结构域或表达调节子结构域。这样的结构域可以位于RNA-指导的核酸酶的N末端、C末端或内部位置。在这些实施方案的一些中,融合蛋白的RGN组分是核酸酶失活的RGN。

在一些实施方案中,RGN融合蛋白包含切割结构域,其是能够切割多核苷酸(即RNA、DNA或RNA/DNA杂合体)的任何结构域,并且包括但不限于限制性核酸内切酶和归巢核酸内切酶,例如IIS型核酸内切酶(例如FokI)(参见,例如,Belfort等人,(1997)NucleicAcids Res.25:3379-3388;Linn等人,(eds.)Nucleases,Cold Spring Harbor LaboratoryPress,1993)。

在其他实施方案中,RGN融合蛋白包含使核苷酸碱基脱氨基的脱氨酶结构域,导致从一个核苷酸碱基向另一核苷酸碱基的转化,并且包括但不限于胞苷脱氨酶或腺苷脱氨酶碱基编辑器(例如,参见,Gaudelli等人(2017)Nature 551:464-471,美国公开号2017/0121693和2018/0073012,美国专利号9,840,699和国际公开号WO/2018/027078)。

在一些实施方案中,RGN融合蛋白的效应子结构域可以是表达调节子结构域,其是用于上调或下调转录的结构域。表达调节子结构域可以是表观遗传修饰结构域、转录抑制结构域或转录激活结构域。

在这些实施方案的一些中,RGN融合蛋白的表达调节子包含表观遗传修饰结构域,其共价修饰DNA或组蛋白以改变组蛋白结构和/或染色体结构而不改变DNA序列,从而导致基因表达的改变(即,上调或下调)。表观遗传修饰的非限制性示例包括赖氨酸残基的乙酰化或甲基化、精氨酸甲基化、丝氨酸和苏氨酸磷酸化以及组蛋白的赖氨酸泛素化和sumo化以及DNA中胞嘧啶残基的甲基化和羟甲基化。表观遗传修饰结构域的非限制性示例包括组蛋白乙酰转移酶结构域、组蛋白脱乙酰基酶结构域、组蛋白甲基转移酶结构域、组蛋白脱甲基酶结构域、DNA甲基转移酶结构域和DNA脱甲基酶结构域。

在其他实施方案中,融合蛋白的表达调节子包含转录抑制结构域,其与转录控制元件和/或转录调节蛋白(例如RNA聚合酶和转录因子)相互作用以减少或终止至少一个基因的转录。转录抑制结构域是本领域已知的,包括但不限于Sp1样抑制物、IκB和Krüppel相关盒(KRAB)结构域。

在其他实施方案中,融合蛋白的表达调节子包含转录激活结构域,其与转录控制元件和/或转录调节蛋白(例如RNA聚合酶和转录因子)相互作用以增加或激活至少一个基因的转录。转录激活结构域是本领域已知的,包括但不限于单纯疱疹病毒VP16激活结构域和NFAT激活结构域。

本文公开的RGN多肽可以包含可检测标记或纯化标签。可检测标记或纯化标签可以直接或经由连接肽间接地位于RNA-指导的核酸酶的N末端、C末端或内部位置。在这些实施方案的一些中,融合蛋白的RGN组分是核酸酶失活的RGN。在其他实施方案中,融合蛋白的RGN组分是具有切口酶活性的RGN。

可检测标记是可以是可视化的或以其他方式被观察到的分子。可检测标记可以作为融合蛋白(例如荧光蛋白)与RGN融合,或者可以是与RGN多肽缀合的小分子,其可以目测或通过其他方式检测。可以作为融合蛋白与本文公开的RGN融合的可检测标记包括任何可检测的蛋白结构域,包括但不限于荧光蛋白或可以用特异性抗体检测的蛋白结构域。荧光蛋白的非限制性示例包括绿色荧光蛋白(例如,GFP、EGFP、ZsGreen1)和黄色荧光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可检测标记的非限制性示例包括放射性标记,例如

RGN多肽还可包含纯化标签,其是可用于从混合物(例如生物样品、培养基)分离蛋白质或融合蛋白的任何分子。纯化标签的非限制性示例包括生物素、myc、麦芽糖结合蛋白(M BP)和谷胱甘肽-S-转移酶(GST)。

II.指导RNA

本公开内容提供了指导RNA和编码该指导RNA的多核苷酸。术语“指导RNA”是指与靶核苷酸序列具有足够互补性以与靶序列杂交并引导相关的RNA-指导的核酸酶与靶核苷酸序列的序列特异性结合的核苷酸序列。因此,RGN各自的指导RNA是一个或多个RNA分子(通常是一个或两个),其可以与RGN结合并指导RGN与特定的靶核苷酸序列结合,并且在其中RGN具有切口酶或核酸酶活性的那些情况下还切割靶核苷酸序列。通常,指导RNA包括CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)。包含crRNA和tracrRNA两者的天然指导RNA通常包含两个单独的RNA分子,其通过crRNA的重复序列和tracrRNA的抗重复序列彼此杂交。

CRISPR阵列内的天然同向重复序列的长度通常在28至37个碱基对的范围内,尽管长度可以在约23bp至约55bp之间变化。CRISPR阵列内的间隔子序列的长度通常在约32bp至约38bp的范围内,尽管长度可以为约21bp至约72bp。每个CRISPR阵列通常包含少于50个单位的CRISPR重复间隔子序列。CRISPR被转录为长转录物的一部分,其被称为初级CRISPR转录物,其包含大部分CRISPR阵列。初级CRISPR转录物被Cas蛋白切割以产生crRNA,或在某些情况下产生pre-crRNA,其被另外的Cas蛋白进一步加工为成熟的crRNA。成熟的crRNA包含间隔子序列和CRISPR重复序列。在其中pre-crRNA被加工为成熟(或经加工的)crRNA的一些实施方案中,成熟涉及去除约1至约6个或更多个5’、3’或5’和3’核苷酸。为了基因组编辑或靶向感兴趣的特定靶核苷酸序列的目的,在pre-crRNA分子的成熟过程中去除的这些核苷酸对于产生或设计指导RNA不是必需的。

CRISPR RNA(crRNA)包含间隔子序列和CRISPR重复序列。“间隔子序列”是与感兴趣的靶核苷酸序列直接杂交的核苷酸序列。间隔子序列被设计为与感兴趣的靶序列完全或部分互补。在各种实施方案中,间隔子序列可包含约8个核苷酸至约30个核苷酸或更多个核苷酸。例如,间隔子序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在一些实施方案中,间隔子序列的长度为约10至约26个核苷酸,或长度为约12至约30个核苷酸。在特定实施方案中,间隔子序列的长度为约30个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,间隔子序列及其对应的靶序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,间隔子序列不具有二级结构,其可以使用本领域已知的任何合适的多核苷酸折叠算法来预测,包括但不限于mFold(例如,参见,Zuker和Stiegler(1981)Nucleic Acids Res.9:133-148)和RNAfold(例如,参见,Gruber等人,(2008)Cell 106(1):23-24)。

RGN蛋白对gRNA中的间隔子序列与其靶序列之间的错配可能具有不同的敏感性,从而影响切割效率。如实施例5中所讨论的,APG05459.1 RGN对间隔子序列和靶序列之间的错配具有异常的敏感性,延伸了PAM位点的5’的至少15个核苷酸。因此,与对间隔子序列和靶序列之间的错配的敏感性较小的其他RGN相比,APG05459.1具有以更高的精度更精细地(即,特异性地)靶向特定序列的潜力。

CRISPR RNA重复序列包含核苷酸序列,该核苷酸序列包含具有足够互补性以与tracrRNA杂交的区域。在各种实施方案中,CRISPR RNA重复序列可包含约8个核苷酸至约30个核苷酸,或更多个核苷酸。例如,CRISPR重复序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在一些实施方案中,CRISPR重复序列的长度为约21个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,CRISPR重复序列包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段,当其包含在指导RNA内时,其能够引导本文提供的相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。在某些实施方案中,野生型序列的活性CRISPR重复序列变体包含与SEQ ID NO:2、12、20、28、37、46或55所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性CRISPR重复序列片段包含SEQ ID NO:2、12、20、28、37、46或55所示的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。

在某些实施方案中,crRNA不是天然存在的。在这些实施方案中的一些中,特异性CRISPR重复序列本质上不与工程化的间隔子序列连接,并且CRISPR重复序列被认为与间隔子序列异源。在某些实施方案中,间隔子序列是非天然存在的工程化序列。

反式激活CRISPR RNA或tracrRNA分子包含核苷酸序列,该核苷酸序列包含具有足够的互补性以与crRNA的CRISPR重复序列杂交的区域,其在本文称为抗重复序列区域。在一些实施方案中,tracrRNA分子进一步包含具有二级结构(例如,茎环)或在与其对应的crRNA杂交时形成二级结构的区域。在特定实施方案中,tracrRNA的与CRISPR重复序列完全或部分互补的区域在分子的5’末端,并且tracrRNA的3’末端包含二级结构。该二级结构区域通常包括数个发夹结构,包括与抗重复序列相邻的连结发夹。连结发夹通常在发夹茎的碱基中具有保守的核苷酸序列,其中在tracrRNA的许多连结发夹中发现基序UNANNG、UNANNU或UNANNA(分别为SEQ ID NO:68、557和558)。在tracrRNA的3’末端经常有末端发夹,其在结构和数量上可能有所不同,但通常包含富含GC的Rho独立转录终止子发夹和随后的在3’末端的一串U'。例如,参见,Briner等人,(2014)Molecular Cell 56:333-339,Briner和Barrangou(2016)Cold Spring Harb Protoc;doi:10.1101/pdb.top090902,和美国公开号2017/0275648,其各自通过引用整体并入本文。

在各种实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复序列区域包含约8个核苷酸至约30个核苷酸,或更多个核苷酸。例如,tracrRNA抗重复序列和CRISPR重复序列之间的碱基配对区域的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在特定实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复序列区域的长度为约20个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA抗重复序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。

在各种实施方案中,整个tracrRNA可包含约60个核苷酸至多于约140个核苷酸。例如,tracrRNA的长度可以为约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140个或更多个核苷酸。在特定实施方案中,tracrRNA的长度为约80至约90个核苷酸,包括约80、约81、约82、约83、约84、约85、约86、约87、约88、约89和约90个核苷酸的长度。在某些实施方案中,tracrRNA的长度为约85个核苷酸。

在特定实施方案中,tracrRNA包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导本文提供的相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。在某些实施方案中,野生型序列的活性tracrRNA序列变体包含与SEQ ID NO:3、13、21、29、38、47或56所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性tracrRNA序列片段包含SEQ ID NO:3、13、21、29、38、47或56所示的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸。

当两个多核苷酸序列在严格条件下彼此杂交时,两个多核苷酸序列可以被认为是基本上互补的。同样,如果在严格条件下与RGN结合的指导RNA与靶序列结合,则认为RGN以序列特异性方式与特定靶序列结合。“严格条件”或“严格杂交条件”是指这样的条件,在该条件下,两个多核苷酸序列彼此杂交的程度将明显大于与其他序列的杂交的程度(例如,是背景的至少2倍)。严格条件是序列依赖性的,并且在不同情况下将有所不同。通常,严格条件将是这样的条件,其中盐浓度小于约1.5M Na离子,通常在pH 7.0至8.3时约0.01至1.0MNa离子浓度(或其他盐),且对于短序列(例如10至50个核苷酸)温度为至少约30℃,和对于长序列(例如大于50个核苷酸)温度为至少约60℃。通过添加去稳定剂(例如甲酰胺)也可以达到严格条件。示例性的低严格条件包括在37℃下使用30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液的杂交,以及在50至55℃下在1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格条件包括在37℃下在40%至45%的甲酰胺、1.0M NaCl、1%SDS中杂交,以及在55至60℃下在0.5X至1X SSC中洗涤。示例性的高严格性条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60至65℃下在0.1X SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%的SDS。杂交的持续时间通常小于约24小时,通常为约4至约12小时。洗涤时间的持续时间将至少是足以达到平衡的时间长度。

Tm是50%的互补靶序列与完全匹配的序列杂交时的温度(在确定的离子强度和pH下)。对于DNA-DNA杂合体,Tm可以从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的等式近似得出:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%甲酰胺)-500/L;其中M是单价阳离子的摩尔浓度,%GC是DNA中鸟嘌呤核苷和胞嘧啶核苷酸的百分比,%甲酰胺是杂交溶液中甲酰胺的百分比,以及L是碱基对中杂合体的长度。通常,严格条件被选择为比特定序列及其互补序列在确定的离子强度和pH下的热熔点(Tm)低约5℃。但是,严重严格条件可以利用在低于热熔点(Tm)1、2、3或4℃下的杂交和/或洗涤;中等严格条件可以利用在低于热熔点(Tm)6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可以利用在低于热熔点(Tm)11、12、13、14、15或20℃下的杂交和/或洗涤。使用该等式、杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将理解,固有地描述了杂交和/或洗涤溶液的严格性的变化。对核酸杂交的广泛指南见于Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology—Hybridization with Nucleic Acid Probes,第I部分,第2章(Elsevier,New York);和Ausubel等人,eds.(1995)Current Protocols in MolecularBiology,第2章(Greene Publishing and Wiley-Interscience,New York)。参见Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Cold Spring HarborLaboratory Press,Plainview,New York)。

指导RNA可以是单指导RNA或双指导RNA系统。单指导RNA包含在单个RNA分子上的crRNA和tracrRNA,而双指导RNA系统包含存在于两个不同RNA分子上的crRNA和tracrRNA,它们通过crRNA的CRISPR重复序列的至少一部分相互杂交和tracrRNA的至少一部分(可以完全或部分与crRNA的CRISPR重复序列互补)彼此杂交。在其中指导RNA是单指导RNA的那些实施方案的一些中,crRNA和tracrRNA被接头核苷酸序列分开。通常,接头核苷酸序列是不包含互补碱基的序列,以避免形成在接头核苷酸序列的核苷酸内或包含接头核苷酸序列的核苷酸的二级结构。在一些实施方案中,crRNA和tracrRNA之间的接头核苷酸序列的长度为至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12个或更多个核苷酸。在特定实施方案中,单指导RNA的接头核苷酸序列的长度为至少4个核苷酸。在某些实施方案中,接头核苷酸序列是SEQ ID NO:63、64或65所示的核苷酸序列。在其他实施方案中,接头核苷酸序列的长度为至少6个核苷酸。在某些实施方案中,接头核苷酸序列是SEQ IDNO:65所示的核苷酸序列。

单指导RNA或双指导RNA可以化学合成或通过体外转录合成。用于确定RGN与指导RNA之间的序列特异性结合的测定是本领域已知的,并且包括但不限于表达的RGN与指导RNA(其可以用可检测标记(例如生物素)进行标记,并用于下拉检测测定中,其中通过可检测标记(例如,使用链霉亲和素珠)捕获指导RNA:RGN复合物)之间的体外结合测定。具有与指导RNA无关的序列或结构的对照指导RNA可以用作RGN与RNA的非特异性结合的阴性对照。在某些实施方案中,指导RNA是SEQ ID NO:10、18、26、35、44、53或62,其中间隔子序列可以是任何序列,并表示为Poly-N序列。

如实施例8中所述,本发明的某些RGN可以共有某些指导RNA。APG05083.1、APG07433.1、APG07513.1和APG08290.1可以各自使用包含含有SEQ ID NO:2、12、20或28的核苷酸序列的crRNA的指导RNA来起作用,其中相应的tracrRNA分别包含SEQ ID NO:3、13、21或29的核苷酸序列。此外,APG04583.1和APG01688.1可各自使用包含含有SEQ ID NO:46或55的核苷酸序列的crRNA的指导RNA来起作用,其中相应的tracrRNA分别包含SEQ 47或56的核苷酸序列。

在某些实施方案中,指导RNA可以作为RNA分子引入靶细胞、细胞器或胚胎。指导RNA可以在体外转录或化学合成。在其他实施方案中,将编码指导RNA的核苷酸序列引入细胞、细胞器或胚胎。在这些实施方案的一些中,编码指导RNA的核苷酸序列与启动子(例如,RNA聚合酶III启动子)可操作地连接。启动子可以是天然启动子,或与指导RNA编码核苷酸序列异源的启动子。

在各种实施方案中,如本文所述,可以将指导RNA作为核糖核蛋白复合物引入靶细胞、细胞器或胚胎,其中指导RNA与RNA-指导的核酸酶多肽结合。

指导RNA通过指导RNA与靶核苷酸序列的杂交将相关的RNA-指导的核酸酶引导至特定的感兴趣的靶核苷酸序列。靶核苷酸序列可以包含DNA、RNA或两者的组合,并且可以是单链或双链的。靶核苷酸序列可以是基因组DNA(即染色体DNA)、质粒DNA或RNA分子(例如信使RNA、核糖体RNA、转移RNA、微RNA、小干扰RNA)。靶核苷酸序列可以在体外或在细胞中被RNA-指导的核酸酶结合(并且在一些实施方案中,被切割)。RGN靶向的染色体序列可以是核、质体或线粒体的染色体序列。在一些实施方案中,靶核苷酸序列在靶基因组中是独特的。

靶核苷酸序列与前间区序列邻近基序(protospacer adjacent motif,PAM)相邻。前间区序列邻近基序通常在距靶核苷酸序列约1至约10个核苷酸内,包括距靶核苷酸序列约1、约2、约3、约4、约5、约6、约7、约8、约9或约10个核苷酸。PAM可以在靶序列的5’或3’。在一些实施方案中,PAM在本文公开的RGN的靶序列的3’。通常,PAM是约3-4个核苷酸的共有序列,但是在特定实施方案中,其长度可以为2、3、4、5、6、7、8、9个或更多个核苷酸。在各种实施方案中,本文公开的RGN识别的PAM序列包含SEQ ID NO:6、32、41、50或59所示的共有序列。非限制性示例性PAM序列是SEQ ID NO:7、69、70、71和72所示的核苷酸序列。

在特定实施方案中,具有SEQ ID NO:1、11、19、27、36、45或54的RNA-指导的核酸酶或其活性变体或片段分别结合与SEQ ID NO:6、32、41、50、59或7所示的PAM序列相邻的靶核苷酸序列。在这些实施方案的一些中,RGN结合指导序列,所述指导序列包含分别如SEQ IDNO:2、12、20、28、37、46或55所示的CRISPR重复序列或其活性变体或片段和分别如SEQ IDNO:3、13、21、29、38、47或56所示的tracrRNA序列或其活性变体或片段。在本说明书的实施例1和表1中进一步描述了RGN系统。

在本领域中众所周知,给定核酸酶的PAM序列特异性受酶浓度的影响(例如,参见,Karvelis等人,(2015)Genome Biol 16:253),其可以通过改变用于表达RGN的启动子或递送到细胞、细胞器或胚胎的核糖核蛋白复合物的量来进行修饰。

识别其相应的PAM序列后,RGN可以在特定切割位点切割靶核苷酸序列。如本文所用,切割位点由靶核苷酸序列内的两个特定核苷酸组成,该核苷酸序列在该特定核苷酸之间被RGN切割。切割位点可以包含在5’或3’方向上距PAM的第一和第二、第二和第三、第三和第四、第四和第五、第五和第六、第七和第八或第八和第九个核苷酸。在一些实施方案中,切割位点可在5′或3′方向上距PAM超过10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,切割位点距PAM 4个核苷酸。在其他实施方案中,切割位点距PAM至少15个核苷酸。由于RGN可以切割靶核苷酸序列而导致交错末端,因此在一些实施方案中,切割位点是基于两个核苷酸在多核苷酸的正(+)链上与PAM的距离和两个核苷酸在多核苷酸的负(-)链上与PAM的距离来定义的。

III.编码RNA-指导的核酸酶、CRISPR RNA和/或tracrRNA的核苷酸

本公开内容提供了包含本文公开的CRISPR RNA、tracrRNA和/或sgRNA的多核苷酸,以及包含编码本文公开的RNA-指导的核酸酶、CRISPR RNA、tracrRNA和/或sgRNA的核苷酸序列的多核苷酸。本文公开的多核苷酸包括包含或编码CRISPR重复序列的那些,所述CRISPR重复序列包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。还公开了包含或编码tracrRNA的多核苷酸,所述tracrRNA包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导相关的RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。还提供了编码RNA-指导的核酸酶的多核苷酸,所述RNA-指导的核酸酶包含SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列以及其保留以RNA指导的序列特异性方式与靶核苷酸序列结合的能力的活性片段或变体。

术语“多核苷酸”的使用无意将本公开内容限制于包含DNA的多核苷酸。本领域普通技术人员将认识到,多核苷酸可包含核糖核苷酸(RNA)以及核糖核苷酸和脱氧核糖核苷酸的组合。这样的脱氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成类似物。这些包括肽核酸(PNA)、PNA-DNA嵌合体、锁核酸(LNA)和硫代磷酸酯连接的序列。本文公开的多核苷酸还涵盖序列的所有形式,包括但不限于单链形式、双链形式、DNA-RNA杂合体、三链体结构、茎和环结构等。

可以对编码RGN的核酸分子进行密码子优化以在感兴趣的生物体中表达。“密码子优化的”编码序列是其密码子使用频率被设计为模仿特定宿主细胞的优选密码子使用频率或转录条件的多核苷酸编码序列。由于一个或多个密码子在核酸水平上的改变而使得翻译的氨基酸序列不发生改变,导致在特定宿主细胞或生物体中的表达得到增强。核酸分子可以全部或部分被密码子优化。提供各种不同的生物体的偏好信息的密码子表和其他参考文献在本领域中是可获得的(对于植物偏好的密码子使用例如参见Campbell和Gowri(1990)Plant Physiol.92:1-11)。在本领域中可获得用于合成植物偏好的基因的方法。例如,参见,美国专利号5,380,831和5,436,391,以及Murray等人,(1989)Nucleic Acids Res.17:477-498,其通过引用并入本文。

可以在表达盒中提供编码本文提供的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸以在体外表达或在感兴趣的细胞、细胞器、胚胎或生物体中表达。该盒将包含与本文提供的编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可操作地连接的5’和3’调节序列,其允许多核苷酸的表达。该盒可另外地包含至少一种另外的基因或遗传元件以共转化入生物体。在包含另外的基因或元件的情况下,这些元件可操作地连接。术语“可操作地连接”旨在表示两个或多个元件之间的功能连接。例如,启动子和感兴趣的编码区(例如,编码RGN、crRNA、tracrRNA和/或sgRNA的区域)之间的可操作连接是允许感兴趣的编码区的表达的功能性连接。可操作地连接的元件可以是连续的或不连续的。当用于指两个蛋白质编码区的连接时,可操作地连接意指编码区在同一阅读框中。可替代地,可以在多个表达盒上提供另外的一个或多个基因或一个或多个元件。例如,编码本文公开的RGN的核苷酸序列可以存在于一个表达盒上,而编码crRNA、tracrRNA或完整的指导RNA的核苷酸序列可以在单独的表达盒上。这样的表达盒被提供为具有多个限制性位点和/或重组位点以用于插入多核苷酸以处于调节区域的转录调节之下。表达盒可以另外地包含选择标记基因。

表达盒将在转录的5’-3’方向上包括转录(并且在一些实施方案中,翻译)起始区域(即启动子)、本发明的RGN-、crRNA-、tracrRNA-和/或sgRNA-编码多核苷酸以及在感兴趣的生物体中起作用的转录(并且在一些实施方案中,翻译)终止区域(即终止区)。本发明的启动子能够引导或驱动编码序列在宿主细胞中的表达。调节区(例如启动子、转录调节区和翻译终止区)对于宿主细胞或彼此可以是内源的或异源的。如本文所用,关于序列的“异源”是来源于外来物种的序列,或者如果来自相同物种,则是通过有意的人为干预从其天然形式在组成和/或基因组基因座上被实质性修饰的序列。如本文所用,嵌合基因包含可操作地连接至与编码序列异源的转录起始区的编码序列。

可从根癌农杆菌(A.tumefaciens)的Ti质粒获得便利的终止区,例如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人,(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人,(1991)Genes Dev.5:141-149;Mogen等人,(1990)Plant Cell 2:1261-1272;Munroe等人,(1990)Gene 91:151-158;Ballas等人,(1989)Nucleic Acids Res.17:7891-7903;和Joshi等人,(1987)Nucleic Acids Res.15:9627-9639。

另外的调节信号包括但不限于转录起始起始位点、操纵子、激活子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。例如,参见,美国专利号5,039,523和4,853,331;EPO0480762A2;Sambrook等人,(1992)Molecular Cloning:A LaboratoryManual,ed.Maniatis等人,(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.),此后称为"Sambrook11";Davis等人,eds.(1980)Advanced BacterialGenetics(Cold Spring Harbor Laboratory Press),Cold Spring Harbor,N.Y.以及其中引用的参考文献。

在制备表达盒时,可以操纵各种DNA片段,以便以适当的方向和视情况而定在适当的阅读框中提供DNA序列。为此,可以使用衔接子或接头来连接DNA片段,或者可以涉及其他操纵以提供方便的限制性位点、去除多余的DNA、去除限制性位点等。为此目的,可能涉及体外诱变、引物修复、限制性酶切、退火、重新置换,例如转换和颠换。

许多启动子可用于实施本发明。可以基于期望的结果选择启动子。核酸可以与组成型、诱导型、生长阶段特异性、细胞类型特异性、组织优选的、组织特异性或其他启动子组合以用于在感兴趣的生物体中的表达。例如,参见,在以下中列出的启动子:WO99/43838和美国专利号:8,575,425;7,790,846;8,147,856;8,586832;7,772,369;7,534,939;6,072,050;5,659,026;5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611;其通过引用并入本文。

为了在植物中表达,组成型启动子还包括CaMV 35S启动子(Odell等人,(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人,(1990)Plant Cell 2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.12:619-632和Christensen等人,(1992)PlantMol.Biol.18:675-689);pEMU(Last等人,(1991)Theor.Appl.Genet.81:581-588);和MAS(Velten等人,(1984)EMBO J.3:2723-2730)。

诱导型启动子的示例是可通过低氧或冷胁迫诱导的Adh1启动子,可通过热胁迫诱导的Hsp70启动子,PPDK启动子和pep羧化酶启动子,两者均可通过光诱导。可化学诱导的启动子也是有用的,例如安全剂诱导的In2-2启动子(美国专利号5,364,780),生长素诱导的和绒毡层特异性的但在愈伤组织中有活性的Axig1启动子(PCT US01/22169),类固醇响应性启动子(例如,参见,Schena等人,(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等人,(1998)Plant J.14(2):247-257中的雌激素诱导的ERE启动子和糖皮质激素诱导型启动子)和四环素诱导型和四环素抑制型启动子(例如,参见,Gatz等人,(1991)Mol.Gen.Genet.227:229-237和美国专利号5,814,618和5,789,156),其通过引用并入本文。

组织特异性或组织优选的启动子可用于表达构建体在特定组织内的靶向表达。在某些实施方案中,组织特异性或组织优选的启动子在植物组织中有活性。在植物中处于发育控制之下的启动子的示例包括优先在某些组织(例如,叶、根、果实、种子或花)中起始转录的启动子。“组织特异性”启动子是仅在某些组织中起始转录的启动子。与基因的组成型表达不同,组织特异性表达是基因调节的几个相互作用水平的结果。这样,来自同源或紧密相关的植物物种的启动子可以优选用于在特定组织中实现转基因的有效和可靠的表达。在一些实施方案中,表达包含组织优选的启动子。“组织优选的”启动子是优先但不一定完全或仅在某些组织中启动转录的启动子。

在一些实施方案中,编码RGN、crRNA和/或tracrRNA的核酸分子包含细胞类型特异性启动子。“细胞类型特异性”启动子是主要驱动一个或多个器官中某些细胞类型中的表达的启动子。在植物中起作用的细胞类型特异性启动子可能主要在其中具有活性的植物细胞的一些示例包括例如BETL细胞,根、叶中的脉管细胞,茎细胞和干细胞。核酸分子还可包含细胞类型优选的启动子。“细胞类型优选的”启动子是主要驱动主要但不一定完全或仅在一个或多个器官的某些细胞类型中的表达的启动子。在植物中起作用的细胞类型优选的启动子可以优先在其中具有活性的植物细胞的一些示例包括例如BETL细胞,根、叶中的脉管细胞,茎细胞和干细胞。

编码RGN、crRNA、tracrRNA和/或sgRNA的核酸序列可以可操作地连接至被噬菌体RNA聚合酶识别的启动子序列,例如用于体外mRNA合成。在这样的实施方案中,可以纯化体外转录的RNA以用于本文所述的方法。例如,启动子序列可以是T7、T3或SP6启动子序列或T7、T3或SP6启动子序列的变体。在这样的实施方案中,可以纯化表达的蛋白质和/或RNA以用于本文所述的基因组修饰方法。

在某些实施方案中,编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸也可以与聚腺苷酸化信号(例如,SV40 polyA信号和在植物中起作用的其他信号)和/或至少一个转录终止序列连接。另外,编码RGN的序列也可以与编码至少一种核定位信号、至少一种细胞穿透结构域和/或至少一种能够将蛋白质运输到特定亚细胞位置的信号肽的序列连接,如本文其他地方描述的。

编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可以存在于一种或多种载体中。“载体”是指用于将核酸转移、递送或引入宿主细胞的多核苷酸组合物。合适的载体包括质粒载体、噬菌粒、粘粒、人工/微型染色体、转座子和病毒载体(例如慢病毒载体、腺相关病毒载体、杆状病毒载体)。载体可以包含另外的表达控制序列(例如,增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列)、选择标记序列(例如,抗生素抗性基因)、复制起点等。其他信息可以在"Current Protocols in Molecular Biology"Ausubel等人,John Wiley&Sons,New York,2003或"Molecular Cloning:A Laboratory Manual"Sambrook&Russell,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,第3版,2001中找到。

载体还可以包含用于选择转化的细胞的选择标记基因。选择标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草化合物(例如草铵膦、溴草腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))的抗性的基因。

在一些实施方案中,包含编码RGN多肽的序列的表达盒或载体可进一步包含编码crRNA和/或tracrRNA的序列,或组合crRNA和tracrRNA以产生指导RNA的序列。可以将编码crRNA和/或tracrRNA的一个或多个序列可操作地连接至至少一个转录控制序列以用于在感兴趣的生物体或宿主细胞中表达crRNA和/或tracrRNA。例如,可以将编码crRNA和/或tracrRNA的多核苷酸可操作地连接至被RNA聚合酶III(Pol III)识别的启动子序列。合适的Pol III启动子的示例包括但不限于哺乳动物U6、U3、H1和7SL RNA启动子以及水稻U6和U3启动子。

如所示的,包含编码RGN、crRNA、tracrRNA和/或sgRNA的核苷酸序列的表达构建体可用于转化感兴趣的生物体。转化方法涉及将核苷酸构建体引入感兴趣的生物体中。“引入”旨在以使得构建体能够进入宿主细胞的内部的方式将核苷酸构建体引入宿主细胞。本发明的方法不需要将核苷酸构建体引入宿主生物体的特定方法,仅需要核苷酸构建体能够进入宿主生物体的至少一个细胞的内部。宿主细胞可以是真核细胞或原核细胞。在特定实施方案中,真核宿主细胞是植物细胞、哺乳动物细胞或昆虫细胞。将核苷酸构建体引入植物和其他宿主细胞的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。

所述方法导致转化的生物体,例如植物,包括整株植物,以及植物器官(例如,叶、茎、根等),种子,植物细胞,繁殖体,胚及其后代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。

“转基因生物体”或“转化的生物体”或“稳定转化的”生物体或细胞或组织是指已掺入或整合了本发明的编码RGN、crRNA和/或tracrRNA的多核苷酸的生物体。已经认识到,其他外源或内源核酸序列或DNA片段也可以掺入宿主细胞中。农杆菌和基因枪介导的转化仍然是植物细胞转化采用的两种主要方法。但是,宿主细胞的转化可以通过感染、转染、显微注射、电穿孔、显微喷射(microprojection)、基因枪或粒子轰击、电穿孔、二氧化硅/碳纤维、超声介导、PEG介导、磷酸钙共沉淀、聚阳离子DMSO技术、DEAE葡聚糖程序以及病毒介导、脂质体介导等进行。病毒介导的编码RGN、crRNA和/或tracrRNA的多核苷酸的引入包括逆转录病毒、慢病毒、腺病毒和腺相关病毒介导的引入和表达,以及使用花椰菜花叶病毒组、双生病毒和RNA植物病毒。

转化方案以及用于将多肽或多核苷酸序列引入植物的方案可以取决于靶向用于转化的宿主细胞(例如单子叶植物或双子叶植物细胞)的类型而变化。转化方法在本领域中是已知的,包括美国专利号:8,575,425;7,692,068;8,802,934;7,541,517(其各自通过引用并入本文)中所示的那些。还参见Rakoczy-Trojanowska,M.(2002)Cell Mol BiolLett.7:849-858;Jones等人,(2005)Plant Methods 1:5;Rivera等人,(2012)Physics ofLife Reviews 9:308-345;Bartlett等人,(2008)Plant Methods 4:1-12;Bates,G.W.(1999)Methods in Molecular Biology 111:359-366;Binns和Thomashow(1988)AnnualReviews in Microbiology 42:575-606;Christou,P.(1992)The Plant Journal 2:275-281;Christou,P.(1995)Euphytica 85:13-27;Tzfira等人,(2004)TRENDS in Genetics20:375-383;Yao等人,(2006)Journal of Experimental Botany 57:3737-3746;Zupan和Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。

转化可导致核酸稳定或瞬时掺入细胞。“稳定转化”意指引入宿主细胞的核苷酸构建体整合到宿主细胞的基因组中,并能够被其后代遗传。“瞬时转化”意指将多核苷酸引入宿主细胞中并且不整合到宿主细胞的基因组中。

转化叶绿体的方法是本领域已知的。例如,参见,Svab等人,(1990)Proc.Nail.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA90:913-917;Svab和Maliga(1993)EMBO J.12:601-606。该方法依赖于含有选择标记的DNA的粒子枪递送,以及通过同源重组将DNA靶向至质体基因组。另外,质体转化可以通过核编码和质体定向的RNA聚合酶的组织优先表达反式激活沉默的质体携带的转基因来实现。这样的系统已报道于McBride等人,(1994)Proc.Natl.Acad.Sci.USA 91:7301-7305。

可以将已转化的细胞根据常规方式生长成转基因生物体,例如植物。例如,参见,McCormick等人,(1986)Plant Cell Reports 5:81-84。然后可以使这些植物生长,并用相同的转化株或不同株进行授粉,并鉴定出具有所需表型特征的组成型表达的所得杂合体。可以生长两代或更多代,以确保稳定地维持和遗传所需表型特征的表达,以及然后收获种子以确保已实现所需表型特征的表达。以这种方式,本发明提供了具有稳定掺入它们的基因组中的本发明的核苷酸构建体(例如本发明的表达盒)的转化的种子(也称为“转基因种子”)。

可替代地,可以将已转化的细胞引入生物体。这些细胞可能起源于生物体,其中细胞以离体方法转化。

本文提供的序列可用于转化任何植物物种,包括但不限于单子叶植物和双子叶植物。感兴趣的植物示例包括但不限于玉米(玉蜀黍)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦和油菜、芸苔属植物的种、苜蓿、黑麦、小米、红花、花生、甘薯、木薯(cassaya)、咖啡、椰子、菠萝、柑桔树、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、番木瓜、腰果、澳洲坚果、杏仁、燕麦、蔬菜、观赏植物和针叶树。

蔬菜包括但不限于番茄、莴苣、青豆、利马豆、豌豆和黄瓜属的成员,例如黄瓜、哈密瓜和香瓜。观赏植物包括但不限于杜鹃花、绣球花、芙蓉、玫瑰、郁金香、水仙花、矮牵牛、康乃馨、一品红和菊花。优选地,本发明的植物是作物植物(例如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。

如本文所用,术语植物包括植物细胞,植物原生质体,可从其再生植物的植物细胞组织培养物,植物愈伤组织,植物块和在植物或植物的部分(例如胚,花粉、胚珠、种子、叶、花、枝、果实、仁、穗、穗轴、果壳、茎、根、根尖、花药等)中完整的植物细胞。谷物旨在表示由商业种植者生产的用于生长或繁殖物种以外的目的的成熟种子。再生的植物的后代、变体和突变体也包括在本发明的范围内,条件是这些部分包含引入的多核苷酸。还提供了保留本文公开的序列的经加工的植物产品或副产品,包括例如豆粕。

编码RGN、crRNA和/或tracrRNA的多核苷酸也可用于转化任何原核物种,包括但不限于古细菌和细菌(例如,芽孢杆菌属(Bacillus)的种、克雷伯菌属(Klebsiella)的种、链霉菌属(Streptomyces)的种、根瘤菌属(Rhizobium)的种、埃希氏菌属(Escherichia)的种、假单胞菌属(Pseudomonas)的种、沙门氏菌属(Salmonella)的种、志贺氏菌属(Shigella)的种、弧菌属(Vibrio)的种、耶尔森菌属(Yersinia)的种、支原体属(Mycoplasma)的种、农杆菌、乳杆菌属(Lactobacillus)的种)。

编码RGN、crRNA和/或tracrRNA的多核苷酸可用于转化任何真核物种,包括但不限于动物(例如哺乳动物、昆虫、鱼类、鸟类和爬行动物)、真菌、变形虫、藻类和酵母。

常规的基于病毒和非基于病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织。此类方法可用于向培养物中或宿主生物体中的细胞施用编码CRISPR系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸和与递送媒介物(例如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,它们在递送至细胞后具有游离基因组或整合的基因组。对于基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel&Feigner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,in Current Topics inMicrobiology and Immunology,Doerfler和Bohm(eds)(1995);和Yu等人,Gene Therapy1:13-26(1994)。

核酸的非病毒递送方法包括脂质转染、核转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒体、和DNA的试剂增强的摄取。脂质转染描述于例如美国专利号5,049,386、4,946,787和4,897,355并且脂质转染试剂在市场上出售(例如Transfectam

使用基于RNA或DNA病毒的系统用于递送核酸利用了高度进化的过程,该过程将病毒靶向到体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可以直接施用至患者(体内),或者它们可以用于体外治疗细胞,并且修饰的细胞可以任选地施用至患者(离体)。基于病毒的常规系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。在宿主基因组中的整合使用逆转录病毒、慢病毒和腺相关病毒基因转移方法是可能的,通常导致插入的转基因的长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。

逆转录病毒的向性可以通过掺入外来包膜蛋白来改变,从而扩大靶细胞的潜在靶群体。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其具有高达6-10kb的外来序列的包装能力。最小的顺式作用LTR足以用于复制和包装载体,然后将其用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的载体(例如,参见,Buchscher等人,J.Viral.66:2731-2739(1992);Johann等人,J.Viral.66:1635-1640(1992);Sommnerfelt等人,Viral.176:58-59(1990);Wilson等人,J.Viral.63:2374-2378(1989);Miller等人,1.Viral.65:2220-2224(1991);PCT/US94/05700)。

在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有很高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。该载体可以在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体还可用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,和用于体内和离体基因治疗程序(例如,参见,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1.Clin.Invest.94:1351(1994))。重组AAV载体的构建在许多出版物中都有描述,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski等人,1.Viral.63:03822-3828(1989)。包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψJ2细胞或PA317细胞。

基因疗法中使用的病毒载体通常是通过产生将核酸载体包装成病毒颗粒的细胞系而生成的。载体通常包含包装和随后整合入宿主所需的最小病毒序列,其他病毒序列被用于待表达的一个或多个多核苷酸的表达盒替代。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗的AAV载体通常仅具有来自AAV基因组的ITR序列,其是包装和整合到宿主基因组中所需要的。病毒DNA在细胞系中包装,该细胞系包含编码其他AAV基因(即rep和cap)但缺少ITR序列的辅助质粒。

细胞系也可以被作为辅助的腺病毒感染。辅助病毒促进AAV载体的复制和AAV基因从辅助质粒的表达。由于缺少ITR序列,因此没有大量包装辅助质粒。腺病毒的污染可以通过例如腺病毒比AAV更敏感的热处理来减少。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。例如,参见,US20030087817,其通过引用并入本文。

在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,转染的细胞取自受试者。在一些实施方案中,细胞来源于取自受试者的细胞,例如细胞系。用于组织培养的广泛多样的细胞系是本领域已知的。细胞系的示例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4.COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮、BALB/3T3小鼠胚胎成纤维细胞、3T3 Swiss、3T3-L1、132-d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY细胞、K562细胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-lA/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见,美国典型培养物保藏中心(ATCC)(Manassas,Va.))。

在一些实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一个或多个载体衍生的序列的新细胞系。在一些实施方案中,用本文所述的CRISPR系统的组分瞬时转染(例如通过一种或多种载体的瞬时转染,或用RNA转染)并通过CRISPR复合物的活性修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的新的细胞系。在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞或来源于此类细胞的细胞系用于评估一种或多种测试化合物。

在一些实施方案中,本文所述的一种或多种载体用于产生非人转基因动物或转基因植物。在一些实施方案中,转基因动物是哺乳动物,例如小鼠、大鼠或兔子。

IV.多肽和多核苷酸的变体和片段

本公开内容提供了天然存在的(即,野生型)RNA-指导的核酸酶的活性变体和片段,其氨基酸序列如SEQ ID NO:1、11、19、27、36、45或54所示,以及天然存在的CRISPR重复序列的活性变体和片段,例如SEQ ID NO:2、12、20、28、37、46或55所示的序列,以及天然存在的tracrRNA,例如SEQ ID NO:3、13、21、29、38、47或56所示的序列,以及编码所述序列的多核苷酸。

尽管与感兴趣的多核苷酸或多肽相比,变体或片段的活性可以改变,但是变体和片段应保留感兴趣的多核苷酸或多肽的功能。例如,当与感兴趣的多核苷酸或多肽相比时,变体或片段可以具有增加的活性、降低的活性、不同的活性范围或活性的任何其他改变。

天然存在的RGN多肽的片段和变体(例如本文公开的那些)将保留序列特异性的、RNA指导的DNA结合活性。在特定实施方案中,天然存在的RGN多肽的片段和变体(例如本文公开的那些)将保留核酸酶活性(单链或双链的)。

天然存在的CRISPR重复序列的片段和变体(例如本文公开的那些)在作为指导RNA的一部分(包含tracrRNA)时将保留以序列特异性方式结合并将RNA-指导的核酸酶(与指导RNA复合)指导至靶核苷酸序列的能力。

天然存在的tracrRNA的片段和变体(例如本文公开的那些)在作为指导RNA的一部分(包含CRISPR RNA)时将保留以序列特异性方式将RNA-指导的核酸酶(与指导RNA复合)指导至靶核苷酸序列的能力。

术语“片段”是指本发明的多核苷酸或多肽序列的一部分。“片段”或“生物活性部分”包括包含足够数量的连续核苷酸以保留生物学活性(即,当包含在指导RNA中时,以序列特异性方式结合RGN并将RGN引导至靶核苷酸序列)的多核苷酸。“片段”或“生物活性部分”包括包含足够数量的连续氨基酸残基以保留生物学活性(即,当与指导RNA复合时以序列特异性方式结合靶核苷酸序列)的多肽。RGN蛋白的片段包括由于使用替代的下游起始位点而比全长序列短的片段。RGN蛋白的生物活性部分可以是包含例如SEQ ID NO:1、11、19、27、36、45或54的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个连续氨基酸残基的多肽。可以通过重组技术制备这样的生物活性部分并针对序列特异性的RNA指导的DNA结合活性进行评估。CRISPR重复序列的生物活性片段可以包含SEQ ID NO:2、12、20、28、37、46或55的至少8个连续氨基酸。CRISPR重复序列的生物活性部分可以是包含例如SEQ ID NO:2、12、20、28、37、46或55的8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸的多核苷酸。tracrRNA的生物活性部分可以是包含例如SEQ ID NO:3、13、21、29、38、47或56的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸的多核苷酸。

通常,“变体”旨在表示基本相似的序列。对于多核苷酸,变体包括在天然多核苷酸的一个或多个内部位点的一个或多个核苷酸的缺失和/或添加和/或在天然多核苷酸的一个或多个位点的一个或多个核苷酸的置换。如本文所用,“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包括那些由于遗传密码的简并性而编码感兴趣的基因的天然氨基酸序列的序列。诸如此类的天然存在的等位基因变体可以通过使用众所周知的分子生物学技术进行鉴定,例如,使用下文概述的聚合酶链反应(PCR)和杂交技术。变体多核苷酸还包括合成衍生的多核苷酸,例如,那些例如通过使用定点诱变产生但仍编码感兴趣的多肽或多核苷酸的多核苷酸。通常,本文公开的特定多核苷酸的变体将与该特定多核苷酸具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,如通过本文中其他地方描述的序列比对程序和参数所确定的。

还可以通过比较由变体多核苷酸编码的多肽与由参考多核苷酸编码的多肽之间的序列同一性百分比来评估本文公开的特定多核苷酸(即,参考多核苷酸)的变体。可以使用本文其他地方描述的序列比对程序和参数来计算任何两个多肽之间的序列同一性百分比。当通过比较它们编码的两个多肽所共有的序列同一性百分比来评估本文公开的任何给定的多核苷酸对时,两个编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。

在特定实施方案中,本文公开的多核苷酸编码RNA-指导的核酸酶多肽,该多肽包含与SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列。

本发明的RGN多肽的生物学活性变体可以在少至约1-15个氨基酸残基,少至约1-10个,例如约6-10个,少至5个,少至4个,少至3个,少至2个或少至1个氨基酸残基上不同。在具体实施方案中,多肽可包含N末端或C末端截短,其可包含从多肽的N或C末端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个氨基酸的缺失。

在某些实施方案中,本文公开的多核苷酸包含或编码CRISPR重复序列,该CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55所示核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。

本文公开的多核苷酸可以包含或编码tracrRNA,其包含与SEQ ID NO:3、13、21、29、38、47或56所示核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%更高的同一性的核苷酸序列。

本发明的CRISPR重复序列或tracrRNA的生物活性变体可以在少至约1-15个核苷酸,少至约1-10个,例如约6-10个,少至5个,少至4个,少至3个,少至2个或少至1个核苷酸上不同。在具体实施方案中,多核苷酸可包含5’或3’截短,其可包含从多核苷酸的5’或3’末端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个核苷酸的缺失。

认可的是,可以对本文提供的RGN多肽、CRISPR重复序列和tracrRNA进行修饰,从而产生变体蛋白和多核苷酸。人为设计的改变可以通过定点诱变技术的应用来引入。可替代地,也可以鉴定与本文公开的序列在结构和/或功能上相关的天然的、未知的或尚未鉴定的多核苷酸和/或多肽。可以在非保守区域中进行不改变RGN蛋白功能的保守氨基酸置换。可替代地,可以进行改善RGN的活性的修饰。

变体多核苷酸和蛋白质还涵盖来源于诱变和重组程序(例如DNA改组)的序列和蛋白质。通过这样的程序,操纵本文公开的一种或多种不同的RGN蛋白(例如,SEQ ID NO:1、11、19、27、36、45或54)以产生具有所需特性的新的RGN蛋白。以这种方式,重组多核苷酸的文库从包含具有实质序列同一性并可以在体外或体内同源重组的序列区域的相关序列多核苷酸的群体中产生。例如,使用这种方法,可以在本文提供的RGN序列和其他已知的RGN基因之间改组编码感兴趣的结构域的序列基序,以获得编码具有改善的感兴趣的性质(例如在酶的情况下增加的K

如本文所用,在两个多核苷酸或多肽序列的上下文中的“序列同一性”或“同一性”是指当在指定的比较窗口上比对以获得最大对应性时两个序列中的残基是相同的。当使用序列同一性百分比来表示蛋白质时,应认识到不相同的残基位置通常因保守的氨基酸置换而不同,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基置换,并因此不会改变分子的功能特性。当序列在保守置换中不同时,可以向上调整序列同一性百分比以校正置换的保守性质。通过这种保守置换而不同的序列被称为具有“序列相似性”或“相似性”。进行这种调整的手段是本领域技术人员众所周知的。通常,这涉及将保守置换评分为部分而不是全部错配,从而增加序列同一性百分比。因此,例如,在相同氨基酸的得分为1,而非保守置换的得分为零的情况下,保守置换的得分为零至1。计算保守置换的得分,例如,如在PC/GENE(Intelligenetics,Mountain View,California)程序中实现的。

如本文所用,“序列同一性百分比”是指通过在比较窗口中比较两个最佳比对的序列而确定的值,其中为了两个序列的最佳比对,比较窗口中的多核苷酸序列的部分与参考序列(其不包括添加或缺失)相比可包括添加或缺失(即缺口)。通过确定两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配位置数、将匹配位置数除以比较窗口中的位置总数和将结果乘以100以得出序列同一性百分比来计算百分比。

除非另有说明,否则本文提供的序列同一性/相似性值是指使用以下参数使用GAP版本10获得的值:使用50的GAP权重和3的长度权重以及nwsgapdna.cmp评分矩阵的核苷酸序列的同一性%和相似性%;使用8的GAP权重和2的长度权重以及BLOSUM62评分矩阵的氨基酸序列的同一性%和相似性%;或其任何等效程序。“等效程序”意指任何序列比较程序,其在与GAP版本10产生的相应比对相比时,对于所考虑的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同序列同一性百分比的比对。

当两个序列被比对用于使用确定的氨基酸置换矩阵(例如,BLOSUM62)、缺口存在罚分和缺口延伸罚分进行相似性评分以达到该对序列可能的最高得分时,所述两个序列被“最佳比对”。氨基酸置换矩阵及其在定量两个序列之间的相似性中的用途是本领域公知的,并例如描述于Dayhoff等人,(1978)"A model of evolutionary change inproteins."In"Atlas of Protein Sequence and Structure,"Vol.5,Suppl.3(ed.M.O.Dayhoff),pp.345-352.Natl.Biomed.Res.Found.,Washington,D.C.和Henikoff等人,(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919。BLOSUM62矩阵通常用作序列比对方案中的默认评分替换矩阵。对于在比对序列之一中引入单个氨基酸缺口,施加缺口存在罚分,并对插入到已经开放的缺口中的每个另外的空氨基酸位置施加缺口延伸罚分。比对通过每个序列的比对开始和结束的氨基酸位置以及任选地通过在一个或两个序列中插入一个或多个缺口以达到最高可能评分来定义。尽管可以手动完成最佳比对和评分,但是通过使用计算机实施的比对算法(例如,Altschul等人,(1997)Nucleic Acids Res.25:3389-3402所述的空位BLAST 2.0)促进了该过程,并在国家生物技术信息中心网站(www.ncbi.nlm.nih.gov)上向公众开放。可以使用例如PSI-BLAST来制备最佳比对,包括多重比对,其可通过www.ncbi.nlm.nih.gov获得并由Altschul等人,(1997)Nucleic AcidsRes.25:3389-3402描述。

关于与参考序列最佳比对的氨基酸序列,氨基酸残基“对应于”参考序列中与该残基在比对中配对的位置。“位置”由数字表示,该数字基于其相对于N端的位置顺序鉴别参考序列中的每个氨基酸。由于在确定最佳比对时必须考虑的缺失、插入、截短、融合等,通过简单地从N端开始计数确定的测试序列中的氨基酸残基数量通常不必与参考序列中其对应位置的数量相同。例如,在比对的测试序列中有缺失的情况下,将不存在与参考序列中缺失位点处的位置相对应的氨基酸。在比对的参考序列中有插入的情况下,该插入将不对应于参考序列中的任何氨基酸位置。在截短或融合的情况下,参考序列或比对序列中可能存在不对应于相应序列中任何氨基酸的氨基酸段。

V.抗体

还涵盖了针对RGN多肽或包含本发明RGN多肽的核糖核蛋白(包括具有SEQ ID NO:1、11、19、27、36、45或54所示氨基酸序列的那些或其活性变体或片段)的抗体。产生抗体的方法是本领域众所周知的(例如,参见,Harlow和Lane(1988)Antibodies:A LaboratoryManual,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.;和美国专利号4,196,265)。这些抗体可用于试剂盒中,用于检测和分离RGN多肽或核糖核蛋白。因此,本公开内容提供了试剂盒,其包含与本文所述的多肽或核糖核蛋白(包括例如具有SEQ ID NO:1、11、19、27、36、45或54的序列的多肽)特异性结合的抗体

VI.用于结合感兴趣的靶序列的系统和核糖核蛋白复合物及其制备方法

本公开内容提供了一种用于结合感兴趣的靶序列的系统,其中所述系统包括至少一种指导RNA或编码该指导RNA的核苷酸序列,以及至少一种RNA-指导的核酸酶或编码其的核苷酸序列。指导RNA与感兴趣的靶序列杂交,并且还与RGN多肽形成复合物,从而引导RGN多肽与靶序列结合。在这些实施方案的一些中,RGN包含SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。在特定实施方案中,系统包含与指导RNA异源的RNA-指导的核酸酶,其中RGN和指导RNA本质上不是天然复合的。

本文提供的用于结合感兴趣的靶序列的系统可以是核糖核蛋白复合物,其是与至少一种蛋白质结合的RNA的至少一个分子。本文提供的核糖核蛋白复合物包含至少一种指导RNA作为RNA组分和RNA-指导的核酸酶作为蛋白质组分。可以从天然表达RGN多肽并已对其进行了工程改造以表达对感兴趣的靶序列具有特异性的特定指导RNA的细胞或生物体中纯化这种核糖核蛋白复合物。可替代地,可以从已经用编码RGN多肽和指导RNA的多核苷酸转化并在允许RGN多肽和指导RNA表达的条件下培养的细胞或生物体中纯化核糖核蛋白复合物。因此,提供了用于制备RGN多肽或RGN核糖核蛋白复合物的方法。此类方法包括在其中表达RGN多肽(和在一些实施方案中,指导RNA)的条件下培养包含编码RGN多肽和在一些实施方案中编码指导RNA的核苷酸序列的细胞。然后可以从培养细胞的裂解物中纯化RGN多肽或RGN核糖核蛋白。

从生物样品的裂解物中纯化RGN多肽或RGN核糖核蛋白复合物的方法是本领域已知的(例如尺寸排阻和/或亲和色谱、2D-PAGE、HPLC、反相色谱、免疫沉淀)。在特定方法中,RGN多肽是重组产生的,并且包含有助于其纯化的纯化标签,包括但不限于谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。通常,使用固定的金属亲和层析纯化标记的RGN多肽或RGN核糖核蛋白复合物。应当理解,可以使用本领域已知的其他类似方法,包括单独或组合使用的其他形式的色谱法或例如免疫沉淀法。

“分离的”或“纯化的”多肽或其生物活性部分实质上或基本上不含在发现其天然存在的环境中通常与多肽伴随或相互作用的组分。因此,分离或纯化的多肽当通过重组技术产生时基本上不含其他细胞材料或培养基,或者当化学合成时基本上不含化学前体或其他化学物质。基本上不含细胞物质的蛋白质包括具有少于约30%、20%、10%、5%或1%(以干重计)污染蛋白质的蛋白质制剂。当重组产生本发明的蛋白质或其生物活性部分时,最佳地,培养基代表少于约30%、20%、10%、5%或1%(以干重计)的化学前体或非感兴趣蛋白质的化学物质。

本文提供的用于结合和/或切割感兴趣的靶序列的特定方法涉及体外组装的RGN核糖核蛋白复合物的使用。RGN核糖核蛋白复合物的体外组装可以使用本领域已知的任何方法进行,其中在允许RGN多肽结合指导RNA的条件下,使RGN多肽与指导RNA接触。如本文所用,“接触”、“触碰”、“交触”是指在适于进行所需反应的条件下将所需反应的组分放在一起。RGN多肽可以从生物样品、细胞裂解物或培养基中纯化、通过体外翻译产生或是化学合成的。指导RNA可以从生物样品、细胞裂解物或培养基中纯化、体外转录或是化学合成的。可以使RGN多肽和指导RNA在溶液(例如,缓冲盐溶液)中接触以允许RGN核糖核蛋白复合物的体外组装。

VII.结合、切割或修饰靶序列的方法

本公开内容提供了用于结合、切割和/或修饰感兴趣的靶核苷酸序列的方法。所述方法包括向靶序列或包含靶序列的细胞、细胞器或胚胎递送包含至少一种指导RNA或编码其的多核苷酸以及至少一种RGN多肽或编码其的多核苷酸的系统。在这些实施方案的一些中,RGN包含SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ IDNO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。系统的RGN可以是核酸酶失活的RGN、具有切口酶活性或者可以是融合多肽。在一些实施方案中,融合多肽包含碱基编辑多肽,例如胞苷脱氨酶或腺苷脱氨酶。在特定实施方案中,RGN和/或指导RNA与引入了RGN和/或指导RNA(或编码RGN和指导RNA中的至少一个的多核苷酸)的细胞、细胞器或胚胎异源。

在其中所述方法包括递送编码指导RNA和/或RGN多肽的多核苷酸的那些实施方案中,然后在其中表达指导RNA和/或RGN多肽的条件下培养细胞或胚胎。在各种实施方案中,所述方法包括使靶序列与RGN核糖核蛋白复合物接触。RGN核糖核蛋白复合物可以包含核酸酶失活或具有切口酶活性的RGN。在一些实施方案中,核糖核蛋白复合物的RGN是包含碱基编辑多肽的融合多肽。在某些实施方案中,所述方法包括将RGN核糖核蛋白复合物引入包含靶序列的细胞、细胞器或胚胎中。RGN核糖核蛋白复合物可以是已从生物学样品中纯化、重组产生并随后纯化或如本文所述体外组装的RGN核糖核蛋白复合物。在其中与靶序列或细胞器或胚胎接触的RGN核糖核蛋白复合物进行体外组装的那些实施方案中,该方法可进一步包括在与靶序列、细胞、细胞器或胚胎接触之前体外组装复合物。

可以使用本领域已知的任何方法(包括但不限于电穿孔)将纯化的或体外组装的RGN核糖核蛋白复合物引入细胞、细胞器或胚胎。可替代地,可以使用本领域已知的任何方法(例如电穿孔)将RGN多肽和/或编码或包含指导RNA的多核苷酸引入细胞、细胞器或胚胎。

在递送至靶序列或包含靶序列的细胞、细胞器或胚胎或与靶序列或包含靶序列的细胞、细胞器或胚胎接触时,指导RNA引导RGN以序列特异性方式结合至靶序列。在其中RGN具有核酸酶活性的那些实施方案中,RGN多肽在结合时切割感兴趣的靶序列。随后可以通过内源性修复机制(例如非同源末端连接或使用提供的供体多核苷酸进行同源性定向修复)来修饰靶序列。

测量RGN多肽与靶序列的结合的方法是本领域已知的,包括染色质免疫沉淀测定、凝胶迁移率变动测定、DNA下拉测定、报告基因测定、微孔板捕获和检测测定。类似地,测量靶序列的切割或修饰的方法在本领域中是已知的,包括体外或体内切割测定,其中使用PCR、测序或凝胶电泳在有或没有附接到靶序列以促进降解产物的检测的适当标记(例如放射性同位素、荧光物质)的情况下确认切割。可替代地,可以使用切口触发的指数扩增反应(NTEXPAR)测定(例如,参见,Zhang等人,(2016)Chem.Sci.7:4951-4957)。可以使用Surveyor测定评估体内切割(Guschin等人,(2010)Methods Mol Biol649:247-256)。

在一些实施方案中,所述方法涉及与多于一种指导RNA复合的单一类型的RGN的使用。所述多于一种指导RNA可以靶向单个基因的不同区域或可以靶向多个基因。

在其中不提供供体多核苷酸的那些实施方案中,可以通过非同源末端连接(NHEJ)修复过程来修复由RGN多肽引入的双链断裂。由于NHEJ的易错性质,双链断裂的修复可导致靶序列的修饰。如本文所用,关于核酸分子的“修饰”是指核酸分子的核苷酸序列的变化,其可以是一个或多个核苷酸的缺失、插入或置换或其组合。靶序列的修饰可导致改变的蛋白质产物的表达或编码序列的失活。

在其中存在供体多核苷酸的那些实施方案中,在修复引入的双链断裂的过程中,可以将供体多核苷酸中的供体序列整合到靶核苷酸序列中或与靶核苷酸序列交换,导致引入外源供体序列。因此,供体多核苷酸包含期望被引入到感兴趣的靶序列中的供体序列。在一些实施方案中,供体序列改变了原始靶核苷酸序列,使得新整合的供体序列将不会被RGN识别和切割。供体序列的整合可以通过在供体多核苷酸中包含侧翼序列而增强,所述侧翼序列与靶核苷酸序列侧翼的序列具有实质的序列同一性,从而允许同源介导的修复过程。在其中RGN多肽引入双链交错断裂的那些实施方案中,供体多核苷酸可以包含由相容性突出端侧接的供体序列,从而允许在修复双链断裂过程中通过非同源修复过程将供体序列与包含突出端的切割的靶核苷酸序列直接连接。

在其中所述方法涉及使用作为切口酶(即,仅能够切割双链多核苷酸的单条链)的RGN的那些实施方案中,该方法可以包括引入靶向相同或重叠靶序列并切割多核苷酸的不同链的两种RGN切口酶。例如,可以将仅切割双链多核苷酸的正(+)链的RGN切口酶与仅切割双链多核苷酸的负(-)链的第二RGN切口酶一起引入。

在各种实施方案中,提供了用于结合靶核苷酸序列并检测靶序列的方法,其中所述方法包括将至少一种指导RNA或编码其的多核苷酸以及至少一种RGN多肽或编码其的多核苷酸引入到细胞、细胞器或胚胎中,表达指导RNA和/或RGN多肽(如果引入了编码序列),其中RGN多肽是核酸酶失活的RGN并且还包含可检测标记,并且该方法进一步包括检测可检测标记。可检测标记可以作为融合蛋白(例如荧光蛋白)与RGN融合,或者可以是缀合至或掺入RGN多肽中的可以目测或通过其他方式检测的小分子。

本文还提供了调节靶序列或在靶序列的调节下的感兴趣的基因的表达的方法。所述方法包括将至少一种指导RNA或编码其的多核苷酸和至少一种RGN多肽或编码其的多核苷酸引入细胞、细胞器或胚胎中,表达指导RNA和/或RGN多肽(如果引入了编码序列),其中RGN多肽是核酸酶失活的RGN。在这些实施方案的一些中,核酸酶失活的RGN是包含本文所述的表达调节结构域(即,表观遗传修饰结构域、转录激活结构域或转录抑制结构域)的融合蛋白。

本公开内容还提供了用于结合和/或修饰感兴趣的靶核苷酸序列的方法。所述方法包括将包含至少一种指导RNA或编码其的多核苷酸和包含本发明的RGN和碱基编辑多肽(例如胞苷脱氨酶或腺苷脱氨酶)的至少一种融合多肽或编码所述融合多肽的多核苷酸的系统递送至靶序列或包含靶序列的细胞、细胞器或胚胎。

本领域普通技术人员将理解,本文公开的任何方法都可用于靶向单个靶序列或多个靶序列。因此,所述方法包括将单个RGN多肽与多个不同的指导RNA(其可以靶向单个基因内的多个不同序列和/或多个基因)组合使用。本文还包括其中将多个不同的指导RNA与多个不同的RGN多肽组合引入的方法。这些指导RNA和指导RNA/RGN多肽系统可以靶向单个基因内的多个不同序列和/或多个基因。

在一个方面,本发明提供了包含上述方法和组合物中公开的任何一种或多种成分的试剂盒。在一些实施方案中,试剂盒包括载体系统和使用试剂盒的说明书。在一些实施方案中,载体系统包含(a)可操作地连接至tracr伴侣序列的第一调节元件和一个或多个用于在tracr伴侣序列上游插入指导序列的插入位点,其中当表达时,指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合,其中所述CRISPR复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配偶序列复合的CRISPR酶;和/或(b)与包含核定位序列的编码所述CRISPR酶的酶编码序列可操作地连接的第二调节元件。元件可以单独地或组合地提供,并且可以提供在任何合适的容器例如小瓶、瓶子或管中。

在一些实施方案中,试剂盒包括一种或多种语言的说明书。在一些实施方案中,试剂盒包含一种或多种试剂,用于在利用本文所述的一种或多种元件的方法中使用。可以在任何合适的容器中提供试剂。例如,试剂盒可以提供一种或多种反应或存储缓冲液。试剂可以以可用于特定测定的形式提供,或者以在使用前需要添加一种或多种其他成分的形式(例如浓缩或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液的pH为约7至约10。

在一些实施方案中,试剂盒包含对应于用于插入载体的指导序列的一种或多种寡核苷酸,以便可操作地连接指导序列和调节元件。在一些实施方案中,试剂盒包含同源重组模板多核苷酸。在一个方面,本发明提供了使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种用途,包括修饰(例如,删除、插入、转运、失活、激活)多种细胞类型中的靶多核苷酸。因此,本发明的CRISPR复合物在例如基因治疗、药物筛选、疾病诊断和预后中具有广泛的应用。示例性的CRISPR复合物包含与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。

VIII.靶多核苷酸

在一个方面,本发明提供了在真核细胞中修饰靶多核苷酸的方法,其可以是体内、离体或体外的。在一些实施方案中,所述方法包括从人或非人动物或植物(包括微藻)中取样细胞或细胞群,并修饰该一个或多个细胞。培养可以在离体的任何阶段进行。所述一个或多个细胞甚至可以被重新引入到非人类动物或植物(包括微藻)中。

利用天然变异性,植物育种者将最有用的基因结合以获得期望的品质,例如产率、品质、均匀性、耐性和针对害虫的抵抗力。这些期望的品质还包括生长、日长偏好、温度要求、花或生殖发育的起始日期、脂肪酸含量、昆虫抗性、抗病性、线虫抗性、真菌抗性、除草剂抗性、对各种环境因素(包括干旱、高温、潮湿、寒冷、风和不利的土壤条件(包括高盐度))的耐受性。这些有用基因的来源包括本地或外来品种、原种品种、野生植物近缘种和诱导的突变,例如,用诱变剂处理植物材料。使用本发明,为植物育种者提供了诱导突变的新工具。因此,本领域技术人员可以分析基因组中有用基因的来源,并且在具有所需特征或性状的品种中,采用本发明以比以前的诱变剂更精确的方式诱导有用基因的产生,从而促进和改善植物育种计划。

RGN系统的靶多核苷酸可以是对真核细胞来说内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节性多核苷酸或垃圾DNA)。不希望受理论的束缚,据信靶序列应与PAM(前间区序列邻近基序)相关;即,由CRISPR复合物识别的短序列。PAM的精确序列和长度要求取决于所使用的CRISPR酶而不同,但PAM通常是与前间区序列(即靶序列)相邻的2-5个碱基对序列。

CRISPR复合物的靶多核苷酸可包括许多与疾病相关的基因和多核苷酸,以及与信号转导生化途径相关的基因和多核苷酸。靶多核苷酸的示例包括与信号转导生化途径相关的序列,例如与信号转导生化途径相关的基因或多核苷酸。靶多核苷酸的示例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于患病组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可以是变得以异常高水平表达的基因;它可以是变得以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。与疾病相关的基因还指具有直接负责疾病的病因(例如因果突变)或与负责疾病的病因(例如因果突变)的一个或多个基因连锁不平衡的一个或多个突变或遗传变异的基因。转录或翻译的产物可能是已知的或未知的,并且还可能处于正常或异常的水平。与疾病相关的基因和多核苷酸的示例可从McKusick-NathansInstitute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.)和National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)获得(可获自万维网)。

尽管CRISPR系统因其相对容易地靶向感兴趣的基因组序列而特别有用,但仍然存在RGN如何解决因果突变的问题。一种方法是在RGN(优选RGN的无活性或切口酶变体)和碱基编辑酶或碱基编辑酶(例如胞苷脱氨酶或腺苷脱氨酶碱基编辑器(美国专利号9,840,699,其通过引用并入本文))的活性结构域之间产生融合蛋白。在一些实施方案中,该方法包括使DNA分子与(a)包含本发明的RGN和碱基编辑多肽(例如脱氨酶)的融合蛋白;和(b)将(a)的融合蛋白靶向至DNA链的靶核苷酸序列的gRNA接触;其中所述DNA分子以有效的量和在适合于核苷酸碱基的脱氨基的条件下与融合蛋白和gRNA接触。在一些实施方案中,靶DNA序列包含与疾病或病症相关的序列,并且其中核苷酸碱基的脱氨基导致与疾病或病症无关的序列。在一些实施方案中,靶DNA序列位于农作物的等位基因中,其中感兴趣的性状的特定等位基因导致农艺价值较低的植物。核苷酸碱基的脱氨基导致改善性状并增加植物的农艺价值的等位基因。

在一些实施方案中,DNA序列包含与疾病或病症相关的T→C或A→G点突变,并且其中突变的C或G碱基的脱氨基导致不与疾病或病症相关的序列。在一些实施方案中,脱氨基纠正序列中与疾病或病症相关的点突变。

在一些实施方案中,与疾病或病症相关的序列编码蛋白质,并且其中脱氨基将终止密码子引入与疾病或病症相关的序列,导致编码的蛋白质的截短。在一些实施方案中,接触是在易患、患有或被诊断出患有疾病或病症的受试者中体内进行的。在一些实施方案中,疾病或病症是与基因组中的点突变或单碱基突变有关的疾病。在一些实施方案中,疾病是遗传性疾病、癌症、代谢性疾病或溶酶体贮积病。

在实施例9和相应的表12中可以找到与某些遗传疾病有因果关系的基因座的其他示例,特别是可以容易地被本发明的RGN或RGN-碱基编辑器融合蛋白靶向的基因座。

Hurler综合征

可以使用依赖于本发明的RGN-碱基编辑器融合蛋白的方法来纠正的遗传性疾病的一个示例是Hurler综合征。Hurler综合征,也称为MPS-1,是α-L-艾杜糖苷酸酶(IDUA)缺乏的结果,导致溶酶体贮积病,其在分子水平上的特征是硫酸皮肤素和硫酸乙酰肝素在溶酶体中的积累。该疾病通常是由编码α-L-艾杜糖苷酸酶的IDUA基因的突变引起的遗传性遗传病。常见的IDUA突变是W402X和Q70X,均是无义突变,导致翻译的提前终止。通过精确的基因组编辑(PGE)方法很好地解决此类突变,因为单个核苷酸的逆转(例如通过碱基编辑方法)将恢复野生型编码序列,并导致受遗传基因座的内源性调节机制控制的蛋白质表达。另外,由于已知杂合子是无症状的,因此靶向这些突变之一的PGE疗法将对大部分患有这种疾病的患者有用,因为仅需要纠正突变的等位基因中的一个(Bunge等人,(1994)Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。

Hurler综合征的当前治疗方法包括酶替代疗法和骨髓移植(Vellodi等人,(1997)Arch.Dis.Child.76(2):92-99;Peters等人,(1998)Blood 91(7):2601-2608,通过引用并入本文)。尽管酶替代疗法对Hurler综合征患者的生存和生活质量产生了显著影响,但这种方法需要每周进行昂贵且费时的输液。另外的方法包括递送在表达载体上的IDUA基因或将该基因插入高表达的基因座,例如血清白蛋白的基因座(美国专利号9,956,247,通过引用并入本文)。但是,这些方法不能将原始IDUA基因座恢复为正确的编码序列。基因组编辑策略将具有许多优势,最显著的是,基因表达的调节将受到健康个体中存在的天然机制的控制。另外,使用碱基编辑并不一定会导致双链DNA断裂,这可能会导致大量染色体重排、细胞死亡或通过肿瘤抑制机制的破坏导致致肿瘤性。实施例10中提供了纠正该疾病的因果突变的方法的可行描述。所述方法是针对使用本发明的RGN-碱基编辑器融合蛋白靶向和纠正人类基因组中的某些引起疾病的突变的一般策略的示例。应该理解的是,也可以采用类似的方法来靶向诸如表12中所述那些疾病。还将认识到,也可以使用本发明的RGN来部署靶向其他物种特别是普通家庭宠物或家畜中的致病突变的类似方法。常见的家庭宠物和家畜包括狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、鱼(包括鲑鱼)和虾。

弗里德赖希共济失调

本发明的RGN在因果突变更复杂时也可用于人类治疗方法。例如,一些疾病例如弗里德赖希共济失调和亨廷顿病是基因的特定区域处的三核苷酸基序的重复次数显著增加的结果,这影响表达的蛋白质发挥功能或被表达的能力。弗里德赖希共济失调(FRDA)是一种常染色体隐性疾病,其导致脊髓中的神经组织的进行性退化。线粒体中的共济蛋白(FXN)的蛋白水平降低导致细胞水平上的氧化损伤和铁缺乏。减少的FXN表达与体细胞和种系FXN基因的内含子1内的GAA三联体扩增有关。在FRDA患者中,GAA重复序列通常由超过70个有时甚至超过1000个(最常见的是600-900个)三联体组成,而未受影响的个体具有约40个或更少的重复序列(Pandolfo等人,(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人,(1996)Science 271:1423-1427;Pandolfo(2002)Adv.Exp.Med.Biol.516:99-118;全部通过引用并入本文)。

导致弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内的确定的遗传基因座中,称为FRDA不稳定性区域。RNA-指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。这种方法需要1)可被编程以靶向人类基因组中的等位基因的RGN和指导RNA序列;和2)用于RGN和指导序列的递送方法。许多用于基因组编辑的核酸酶(例如通常使用的来自化脓性链球菌(S.pyogenes)的Cas9核酸酶(SpCas9))太大而无法包装到腺相关病毒(AAV)载体中,尤其是考虑到除了功能表达盒所需的其他遗传元件外的SpCas9基因和指导RNA的长度时。这使得使用SpCas9的方法更加困难。

本发明的紧凑的RNA-指导的核酸酶(特别是APG07433.1和APG08290.1)独特地非常适合于FRDA不稳定性区域的切除。每个RGN具有在FRDA不稳定性区域附近的PAM要求。另外,这些RGN中的每一个都可以与指导RNA一起包装到AAV载体中。包装两个指导RNA可能需要第二个载体,但是这种方法与较大的核酸酶(例如SpCas9)所需的相比仍然是有利的,后者可能需要将蛋白质序列拆分在两个载体之间。在实施例11中提供了纠正该疾病的因果突变的方法的可行描述。所述方法包括使用本发明的RGN的策略,其中去除了基因组不稳定性区域。这种策略适用于具有相似遗传基础的其他疾病和病症,例如亨廷顿病。使用本发明的RGN的类似策略也可适用于具有农业或经济重要性的非人类动物(包括狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、鱼包括鲑鱼和虾)中的类似疾病和病症。

血红蛋白病

本发明的RGN也可以引入可以导致有益作用的破坏性突变。编码血红蛋白的基因(尤其是β球蛋白链(HBB基因))中的遗传缺陷可能导致许多被称为血红蛋白病的疾病,包括镰状细胞性贫血和地中海贫血。

在成年人中,血红蛋白是异源四聚体,其包含两条α(alpha)样球蛋白链和两条β(beta)样球蛋白链和4个血红素基团。在成人中,α2β2四聚体被称为血红蛋白A(HbA)或成人血红蛋白。通常,α和β球蛋白链以约1:1的比例合成,并且在血红蛋白和红细胞(RBC)稳定性方面,该比例似乎至关重要。在发育中的胎儿中,产生了不同形式的血红蛋白,胎儿血红蛋白(HbF),其对氧的结合亲和力比血红蛋白A高,使得氧可以通过母亲的血流递送到婴儿的系统中。胎儿血红蛋白还包含两条α球蛋白链,但代替成人的β球蛋白链,它具有两条胎儿γ(gamma)球蛋白链(即,胎儿血红蛋白为α2γ2)。从产生γ-球蛋白到β-球蛋白的转换的调节非常复杂,并且主要涉及γ球蛋白转录的下调以及β球蛋白转录的同时上调。在妊娠约30周时,胎儿中γ球蛋白的合成开始下降,而β球蛋白的产量增加。约10个月大时,新生儿的血红蛋白几乎全部为α2β2,尽管一些HbF持续到成年(约占总血红蛋白的1-3%)。在大多数患有血红蛋白病的患者中,仍然存在编码γ球蛋白的基因,但是由于如上所述在分娩附近发生正常的基因抑制,因此表达相对较低。

镰状细胞病是由β球蛋白基因(HBB)中的V6E突变(DNA水平上的GAG到GTG)引起的,其中产生的血红蛋白被称为“血红蛋白S”或“HbS”。在较低的氧气条件下,HbS分子聚集并形成纤维状沉淀。这些聚集体引起RBC的异常或“镰状化”,从而导致细胞柔韧性的丧失。镰状红细胞不再能够挤入毛细管床,并可能导致镰状细胞患者的血管闭塞性危机。另外,镰状RBC比正常RBC更脆弱,并且倾向于溶血,最终导致患者贫血。

镰状细胞患者的治疗和管理是终生主题,涉及抗生素治疗、疼痛管理和急性发作期间的输血。一种方法是使用羟基脲,其部分通过增加γ球蛋白的产生而发挥其作用。慢性羟基脲疗法的长期副作用仍然未知,但是,治疗产生不想要的副作用,并且可在患者间具有可变的功效。尽管镰状细胞疗法的功效有所提高,但患者的预期寿命仍仅在50岁中期至晚期,并且该疾病的相关发病率对患者的生活质量产生深远的影响。

地中海贫血(α地中海贫血和β地中海贫血)也是与血红蛋白有关的疾病,并且通常涉及球蛋白链的降低的表达。这可以通过基因的调节区中的突变或球蛋白编码序列中的导致功能性球蛋白的降低的表达或降低的水平而发生。地中海贫血的治疗通常涉及输血和铁螯合疗法。如果可以鉴别合适的供体,那么骨髓移植也可以用于治疗患有重度地中海贫血的人,但是这种方法可能会有很大的风险。

已建议用于治疗SCD和β地中海贫血的一种方法是增加γ球蛋白的表达,以使HbF在功能上替代异常的成人血红蛋白。如上所述,认为使用羟基脲治疗SCD患者是成功的,部分是因为其对增加γ球蛋白表达的作用(DeSimone(1982)Proc Nat'l Acad Sci USA79(14):4428-31;Ley,等人,(1982)N.Engl.J.Medicine,307:1469-1475;Ley,等人,(1983)Blood 62:370-380;Constantoulakis等人,(1988)Blood 72(6):1961-1967,全部通过引用并入本文)。增加HbF的表达涉及鉴定其产物在调节γ球蛋白表达中起作用的基因。一种这样的基因是BCL11A。BCL11A编码在成体红系前体细胞中表达的锌指蛋白,并且其表达的下调导致γ球蛋白表达的增加(Sankaran等人,(2008)Science 322:1839,通过引用并入本文)。已经提出了针对BCL11A基因的抑制性RNA的使用(例如,美国专利公开2011/0182867,通过引用并入本文),但是该技术具有若干潜在的缺点,包括可能无法实现完全敲低,此类RNA的递送可能是有问题的,并且RNA必须连续存在,从而需要终身的多次治疗。

本发明的RGN可用于靶向BCL11A增强子区域以破坏BCL11A的表达,从而增加γ球蛋白的表达。这种靶向破坏可通过非同源末端连接(NHEJ)来实现,由此本发明的RGN靶向BCL11A增强子区域内的特定序列,产生双链断裂,并且细胞的机构修复该断裂,通常同时引入有害的突变。与针对其他疾病靶标所描述的类似,本发明的RGN由于其相对小的尺寸而具有优于其他已知的RGN的优点,这使得能够将用于RGN及其指导RNA的表达盒包装到单个AAV载体中以用于体内递送。实施例12中提供了对该方法的可行描述。使用本发明的RGN的类似策略也可适用于人类和具有农业或经济重要性的非人类动物中的相似疾病和病症。

IX.包含多核苷酸遗传修饰的细胞

本文提供了包含感兴趣的靶序列的细胞和生物体,所述靶序列已使用本文所述的RGN、crRNA和/或tracrRNA介导的过程进行了修饰。在这些实施方案的一些中,RGN包含SEQID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。

修饰的细胞可以是真核的(例如,哺乳动物、植物、昆虫细胞)或原核的。还提供了包含至少一个核苷酸序列的细胞器和胚胎,所述核苷酸序列已通过利用如本文所述的RGN、crRNA和/或tracrRNA的方法进行了修饰。经遗传修饰的细胞、生物体、细胞器和胚胎对于修饰的核苷酸序列而言可以是杂合的或纯合的。

细胞、生物体、细胞器或胚胎的染色体修饰可导致改变的表达(上调或下调)、失活或改变的蛋白质产物或整合的序列的表达。在其中染色体修饰导致基因失活或无功能蛋白产物表达的那些情况下,遗传修饰的细胞、生物体、细胞器或胚胎被称为“敲除”。敲除表型可以是缺失突变(即,至少一个核苷酸的缺失)、插入突变(即,至少一个核苷酸的插入)或无义突变(即,至少一个核苷酸的置换使得引入终止密码子)的结果。

可替代地,细胞、生物体、细胞器或胚胎的染色体修饰可产生“敲入”,这是由编码蛋白质的核苷酸序列的染色体整合引起的。在这些实施方案的一些中,将编码序列整合到染色体中,使得编码野生型蛋白质的染色体序列失活,但是表达外源导入的蛋白质。

在其他实施方案中,染色体修饰导致变体蛋白质产物的产生。表达的变体蛋白质产物可具有至少一个氨基酸置换和/或至少一个氨基酸的添加或缺失。当与野生型蛋白质相比时,由改变的染色体序列编码的变体蛋白质产物可以表现出修饰的特征或活性,包括但不限于改变的酶活性或底物特异性。

在其他实施方案中,染色体修饰可以导致蛋白质的改变的表达模式。作为非限制性示例,控制蛋白质产物表达的调节区中的染色体改变可导致蛋白质产物的过表达或下调或改变的组织或时间表达模式。

本文所用的冠词“一个”和“一种”是指该冠词的语法对象的一个/一种或多于一个/一种(即,至少一个/一种)。举例来说,“多肽”是指一个或多个/一种或多种多肽。

说明书中提到的所有出版物和专利申请均指示与本公开内容有关的本领域的技术人员的水平。所有出版物和专利申请都以相同的程度通过引用并入本文,就好像每个单独的出版物或专利申请都被具体地和单独地指示通过引用并入一样。

尽管出于清楚理解的目的已经通过说明和示例的方式详细地描述了前述发明,但是明显的是,可以在所附实施方案的范围内实施某些改变和修改。

非限制性实施方案包括:

1.一种核酸分子,其包含编码RNA-指导的核酸酶(RGN)多肽的多核苷酸,其中所述多核苷酸包含编码RGN多肽的核苷酸序列,所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;

其中当所述RGN多肽与能够与所述靶DNA序列杂交的指导RNA(gRNA)结合时,所述RGN多肽以RNA-指导的序列特异性方式结合所述靶DNA序列,和

其中所述编码RGN多肽的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。

2.实施方案1所述的核酸分子,其中所述RGN多肽能够在结合后切割所述靶DNA序列。

3.实施方案2所述的核酸分子,其中通过所述RGN多肽的切割产生双链断裂。

4.实施方案2所述的核酸分子,其中通过所述RGN多肽的切割产生单链断裂。

5.实施方案1-4中任一项所述的核酸分子,其中所述RGN多肽可操作地融合至碱基编辑多肽。

6.实施方案1-5中任一项所述的核酸分子,其中所述RGN多肽包含一个或多个核定位信号。

7.实施方案1-6中任一项所述的核酸分子,其中所述RGN多肽是密码子优化的以在真核细胞中表达。

8.实施方案1-7中任一项所述的核酸分子,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。

9.一种载体,其包含实施方案1-8中任一项所述的核酸分子。

10.实施方案9所述的载体,其进一步包含至少一个核苷酸序列,所述核苷酸序列编码能够与所述靶DNA序列杂交的所述gRNA。

11.实施方案10所述的载体,其中所述gRNA是单指导RNA。

12.实施方案10所述的载体,其中所述gRNA是双指导RNA。

13.实施方案10-12中任一项所述的载体,其中所述指导RNA包含CRISPR RNA,所述CRISPR RNA包含与SEQ ID NO:2、12、20、28、37、46、或55具有至少95%序列同一性的CRISPR重复序列。

14.实施方案10-13中任一项所述的载体,其中所述指导RNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的tracrRNA。

15.一种细胞,其包含实施方案1-8中任一项所述的核酸分子或实施方案9-14中任一项所述的载体。

16.一种用于制备RGN多肽的方法,所述方法包括在其中表达所述RGN多肽的条件下培养实施方案15所述的细胞。

17.一种用于制备RGN多肽的方法,所述方法包括将异源核酸分子引入细胞,所述异源核酸分子包含编码RNA-指导的核酸酶(RGN)多肽的核苷酸序列,所述RNA-指导的核酸酶(RGN)多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;

其中当所述RGN多肽与能够与所述靶DNA序列杂交的指导RNA(gRNA)结合时,所述RGN多肽以RNA-指导的序列特异性方式结合所述靶DNA序列;

以及在其中表达所述RGN多肽的条件下培养所述细胞。

18.实施方案16或17所述的方法,其进一步包括纯化所述RGN多肽。

19.实施方案16或17所述的方法,其中所述细胞进一步表达一种或多种与所述RGN多肽结合以形成RGN核糖核蛋白复合物的指导RNA。

20.实施方案19所述的方法,其进一步包括纯化所述RGN核糖核蛋白复合物。

21.一种核酸分子,其包含编码CRISPR RNA(crRNA)的多核苷酸,其中所述crRNA包含间隔子序列和CRISPR重复序列,其中所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列;

其中指导RNA包含:

a)所述crRNA;和

b)与所述crRNA的所述CRISPR重复序列杂交的反式激活CRISPR RNA(tracrRNA);

当所述指导RNA与RNA-指导的核酸酶(RGN)多肽结合时,能够通过所述crRNA的间隔子序列以序列特异性方式与靶DNA序列杂交,并且

其中所述编码crRNA的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。

22.一种载体,其包含实施方案21所述的核酸分子。

23.实施方案22所述的载体,其中所述载体进一步包含编码所述tracrRNA的多核苷酸。

24.实施方案23所述的载体,其中所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。

25.实施方案23或24所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至同一启动子并被编码为单个指导RNA。

26.实施方案23或24所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至分开的启动子。

27.实施方案22-26中任一项所述的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列。

28.一种核酸分子,其包含编码反式激活CRISPR RNA(tracrRNA)的多核苷酸,所述多核苷酸包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列;

其中指导RNA包含:

a)所述tracrRNA;和

b)包含间隔子序列和CRISPR重复序列的crRNA,其中所述tracrRNA与所述crRNA的所述CRISPR重复序列杂交;

当所述指导RNA与RNA-指导的核酸酶(RGN)多肽结合时,能够通过所述crRNA的间隔子序列以序列特异性方式与靶DNA序列杂交,并且

其中所述编码tracrRNA的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。

29.一种载体,其包含实施方案28所述的核酸分子。

30.实施方案29所述的载体,其中所述载体进一步包含编码所述crRNA的多核苷酸。

31.实施方案30所述的载体,其中所述crRNA的CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。

32.实施方案30或31所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至同一启动子并被编码为单个指导RNA。

33.实施方案30或31所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至分开的启动子。

34.实施方案29-33中任一项所述的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列。

35.一种用于结合靶DNA序列的系统,所述系统包括:

a)能够与所述靶DNA序列杂交的一种或多种指导RNA或编码所述一种或多种指导RNA(gRNA)的一种或多种核苷酸序列;和

b)包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列的RNA-指导的核酸酶(RGN)多肽或编码所述RGN多肽的核苷酸序列;

其中编码所述一种或多种指导RNA的所述核苷酸序列和编码所述RGN多肽的所述核苷酸序列各自可操作地连接至与所述核苷酸序列异源的启动子;

其中所述一种或多种指导RNA与所述靶DNA序列杂交,和

其中所述一种或多种指导RNA与所述RGN多肽形成复合物,从而引导所述RGN多肽与所述靶DNA序列结合。

36.实施方案35所述的系统,其中所述gRNA是单指导RNA(sgRNA)。

37.实施方案35所述的系统,其中所述gRNA是双指导RNA。

38.实施方案35-37中任一项所述的系统,其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。

39.实施方案35-38中任一项所述的系统,其中所述gRNA包含tracrRNA,所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。

40.实施方案35-39中任一项所述的系统,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。

41.实施方案35-40中任一项所述的系统,其中所述靶DNA序列在细胞内。

42.实施方案41所述的系统,其中所述细胞是真核细胞。

43.实施方案42所述的系统,其中所述真核细胞是植物细胞。

44.实施方案42所述的系统,其中所述真核细胞是哺乳动物细胞。

45.实施方案42所述的系统,其中所述真核细胞是昆虫细胞。

46.实施方案41所述的系统,其中所述细胞是原核细胞。

47.实施方案35-46中任一项所述的系统,其中当转录时,所述一种或多种指导RNA与所述靶DNA序列杂交,并且所述指导RNA与所述RGN多肽形成复合物,其导致所述靶DNA序列的切割。

48.实施方案47所述的系统,其中所述切割产生双链断裂。

49.实施方案47所述的系统,其中所述RGN多肽的切割产生单链断裂。

50.实施方案35-49中任一项所述的系统,其中所述RGN多肽可操作地连接至碱基编辑多肽。

51.实施方案35-50中任一项所述的系统,其中所述RGN多肽包含一个或多个核定位信号。

52.实施方案35-51中任一项所述的系统,其中所述RGN多肽是密码子优化的以在真核细胞中表达。

53.实施方案35-52中任一项所述的系统,其中编码一种或多种指导RNA的核苷酸序列和编码RGN多肽的核苷酸序列位于一个载体上。

54.实施方案35-53中任一项所述的系统,其中所述系统进一步包含一种或多种供体多核苷酸或编码所述一种或多种供体多核苷酸的一种或多种核苷酸序列。

55.一种用于结合靶DNA序列的方法,所述方法包括将根据实施方案35-54中任一项所述的系统递送至所述靶DNA序列或包含所述靶DNA序列的细胞。

56.实施方案55所述的方法,其中所述RGN多肽或所述指导RNA进一步包含可检测标记,从而允许检测所述靶DNA序列。

57.实施方案55所述的方法,其中所述指导RNA或所述RGN多肽进一步包含表达调节子,从而调节所述靶DNA序列或在所述靶DNA序列的转录控制下的基因的表达。

58.一种用于切割或修饰靶DNA序列的方法,所述方法包括将根据实施方案35-54中任一项所述的系统递送至所述靶DNA序列或包含所述靶DNA序列的细胞。

59.实施方案58所述的方法,其中所述修饰的靶DNA序列包括异源DNA在所述靶DNA序列中的插入。

60.实施方案58所述的方法,其中所述修饰的靶DNA序列包括至少一个核苷酸从所述靶DNA序列的缺失。

61.实施方案58所述的方法,其中所述修饰的靶DNA序列包括所述靶DNA序列中至少一个核苷酸的突变。

62.一种用于结合靶DNA序列的方法,所述方法包括:

a)通过结合以下在体外组装RNA-指导的核酸酶(RGN)核糖核苷酸复合物:

i)一种或多种指导RNA,其能够与靶DNA序列杂交;和

ii)RGN多肽,其包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;

在适合于形成所述RGN核糖核苷酸复合物的条件下;和

b)使所述靶DNA序列或包含所述靶DNA序列的细胞与体外组装的RGN核糖核苷酸复合物接触;

其中所述一种或多种指导RNA与所述靶DNA序列杂交,从而引导所述RGN多肽与所述靶DNA序列结合。

63.实施方案62所述的方法,其中所述RGN多肽或所述指导RNA进一步包含可检测标记,从而允许检测所述靶DNA序列。

64.实施方案62所述的方法,其中所述指导RNA或所述RGN多肽进一步包含表达调节子,从而允许调节所述靶DNA序列的表达。

65.一种用于切割和/或修饰靶DNA序列的方法,所述方法包括使DNA分子与以下接触:

a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;和

b)一种或多种指导RNA,其能够将(a)的RGN靶向至所述靶DNA序列;

其中所述一种或多种指导RNA与所述靶DNA序列杂交,从而引导所述RGN多肽与所述靶DNA序列结合并发生所述靶DNA序列的切割和/或修饰。

66.实施方案65所述的方法,其中所述修饰的靶DNA序列包括异源DNA在所述靶DNA序列中的插入。

67.实施方案65所述的方法,其中所述修饰的靶DNA序列包括至少一个核苷酸从所述靶DNA序列的缺失。

68.实施方案65所述的方法,其中所述修饰的靶DNA序列包括所述靶DNA序列中至少一个核苷酸的突变。

69.实施方案62-68中任一项所述的方法,其中所述gRNA是单指导RNA(sgRNA)。

70.实施方案62-68中任一项所述的方法,其中所述gRNA是双指导RNA。

71.实施方案62-70中任一项所述的方法,其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。

72.实施方案62-71中任一项所述的方法,其中所述gRNA包含tracrRNA,所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。

73.实施方案62-72中任一项所述的方法,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。

74.实施方案55-73中任一项所述的方法,其中所述靶DNA序列在细胞内。

75.实施方案74所述的方法,其中所述细胞是真核细胞。

76.实施方案75所述的方法,其中所述真核细胞是植物细胞。

77.实施方案75所述的方法,其中所述真核细胞是哺乳动物细胞。

78.实施方案75所述的方法,其中所述真核细胞是昆虫细胞。

79.实施方案74所述的方法,其中所述细胞是原核细胞。

80.实施方案74-79中任一项所述的方法,其进一步包括在其中表达所述RGN多肽并切割靶DNA序列以产生修饰的DNA序列的条件下培养所述细胞;并选择包含所述修饰的DNA序列的细胞。

81.一种细胞,其包含根据实施方案80所述的方法的修饰的靶DNA序列。

82.实施方案81所述的细胞,其中所述细胞是真核细胞。

83.实施方案82所述的细胞,其中所述真核细胞是植物细胞。

84.一种植物,其包含实施方案83所述的细胞。

85.一种种子,其包含实施方案83所述的细胞。

86.实施方案82所述的细胞,其中所述真核细胞是哺乳动物细胞。

87.实施方案82所述的细胞,其中所述真核细胞是昆虫细胞。

88.实施方案81所述的细胞,其中所述细胞是原核细胞。

89.一种用于产生对遗传性遗传病的因果突变进行校正的遗传修饰的细胞的方法,所述方法包括向所述细胞引入:

a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和

b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达

由此,RGN和gRNA靶向因果突变的基因组位置并修饰基因组序列以去除因果突变。

90.实施方案89所述的方法,其中所述RGN与具有碱基编辑活性的多肽融合。

91.实施方案90所述的方法,其中所述具有碱基编辑活性的多肽是胞苷脱氨酶或腺苷脱氨酶。

92.实施方案89所述的方法,其中所述细胞是动物细胞。

93.实施方案89所述的方法,其中所述细胞是哺乳动物细胞。

94.实施方案92所述的方法,其中所述细胞来源于狗、猫、小鼠、大鼠、兔、马、牛、猪或人。

95.实施方案92所述的方法,其中所述遗传性遗传病为表12中所列的疾病。

96.实施方案92所述的方法,其中所述遗传性遗传病为Hurler综合征。

97.实施方案96所述的方法,其中所述gRNA还包含靶向SEQ ID NO:453、454或455的间隔子序列。

98.一种用于产生在致病基因组不稳定性区域中缺失的遗传修饰的细胞的方法,所述方法包括向所述细胞引入:

a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和

b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,并且进一步地,其中所述gRNA包含靶向基因组不稳定性区域的5’侧翼的间隔子序列;和

c)第二指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,并且进一步地,其中所述第二gRNA包含靶向基因组不稳定性区域3’侧翼的间隔子序列;

从而RGN和两个gRNA靶向基因组不稳定性区域,并且去除至少部分基因组不稳定性区域。

99.实施方案98所述的方法,其中所述细胞是动物细胞。

100.实施方案98所述的方法,其中所述细胞是哺乳动物细胞。

101.实施方案100所述的方法,其中所述细胞来源于狗、猫、小鼠、大鼠、兔、马、牛、猪或人。

102.实施方案99所述的方法,其中所述遗传性遗传病是弗里德赖希共济失调或亨廷顿病。

103.实施方案102所述的方法,其中所述第一gRNA还包含靶向SEQ ID NO:468、469或470的间隔子序列。

104.实施方案103所述的方法,其中所述第二gRNA还包含靶向SEQ ID NO:471的间隔子序列。

105.一种用于产生具有降低的BCL11A mRNA和蛋白质表达的遗传修饰的哺乳动物造血祖细胞的方法,所述方法包括向分离的人造血祖细胞引入:

a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和

b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,

由此,RGN和gRNA在细胞中表达并在BCL11A增强子区域切割,导致人造血祖细胞的遗传修饰并降低BCL11A的mRNA和/或蛋白质表达。

106.实施方案105所述的方法,其中所述gRNA还包含靶向SEQ ID NO:473、474、475、476、477或478的间隔子序列。

107.一种用于结合靶DNA序列的系统,所述系统包括:

a)一种或多种指导RNA,其能够与所述靶DNA序列杂交,或编码所述一种或多种指导RNA(gRNA)的一种或多种核苷酸序列;和

b)RNA-指导的核酸酶(RGN)多肽,其包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;

其中所述一种或多种指导RNA与所述靶DNA序列杂交,和

其中所述一种或多种指导RNA与所述RGN多肽形成复合物,从而引导所述RGN多肽与所述靶DNA序列结合。

108.实施方案107所述的系统,其中所述RGN多肽是核酸酶失活的或起切口酶的作用。

109.实施方案107或108所述的系统,其中所述RGN多肽可操作地融合至碱基编辑多肽。

110.实施方案109所述的系统,其中所述碱基编辑多肽是脱氨酶。

111.实施方案110所述的系统,其中所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。

提供以下实施例以举例说明而不是限制。

实施例

实验

实施例1.RNA-指导的核酸酶的鉴定

鉴定了七种不同的CRISPR相关RNA-指导的核酸酶(RGN),并在下表1中进行了描述。表1提供了每种RGN的名称、其氨基酸序列、其衍生来源以及经加工的crRNA和tracrRNA序列。表1还提供了通用的单指导RNA(sgRNA)序列,其中poly-N表示确定sgRNA核酸靶序列的间隔子序列的位置。RGN系统APG系统APG05083.1、APG07433.1、APG08290.1和APG08290.1在tracrRNA的发夹茎碱基中具有保守序列UNANNG(SEQ ID NO:68)。对于AP05459.1系统,在相同位置的序列为UNANNU(SEQ ID NO:557)。对于APG04583.1和APG01688.1系统,该序列为UNANNA(SEQ ID NO:558)。

表1:SEQ ID和CRISPR相关的系统的总结

实施例2:指导RNA鉴定和sgRNA构建

将天然表达所研究的RNA-指导的核酸酶系统的细菌的培养物培养至对数中期(OD600为~0.600)、沉淀并快速冷冻。使用mirVANA miRNA分离试剂盒(LifeTechnologies,Carlsbad,CA)从沉淀物中分离RNA,并使用NEBNext小RNA文库制备试剂盒(NEB,Beverly,MA)从分离的RNA制备测序文库。将文库制备物在6%聚丙烯酰胺凝胶上分离成对应于18-65nt和90-200nt RNA种类的2个尺寸的级分以分别检测crRNA和tracrRNA。通过服务提供商(MoGene,St.Louis,MO)在Next Seq 500(高输出试剂盒)上进行深度测序(较小级分的40bp配对末端,和较大级分的80bp配对末端)。使用Cutadapt对读数进行质量修整,并使用Bowtie2将其映射到参考基因组。以python编写自定义RNAseq流水线以检测crRNA和tracrRNA转录物。通过天然重复间隔区阵列的序列覆盖率确定经加工的crRNA边界。使用允许的BLASTn参数鉴定tracrRNA的抗重复序列部分。RNA测序深度通过鉴定含有抗重复序列的转录物确认经加工的tracrRNA的边界。通过使用RNA折叠软件NUPACK进行二级结构预测来进行RNA的手动管理。sgRNA盒是通过DNA合成制备的,并一般如下设计(5’->3’):20-30bp间隔子序列-crRNA的经加工的重复序列部分-4bp非互补接头(AAAG;SEQ IDNO:63)-经加工的tracrRNA。还可以使用其他的4bp非互补接头,例如GAAA(SEQ ID NO:64)或ACUU(SEQ ID NO:65)。在一些情况下,可以使用6bp核苷酸接头,例如CAAAGG(SEQ ID NO:66)。对于体外测定,通过用GeneArtTM Precision gRNA合成试剂盒(ThermoFisher)体外转录sgRNA盒来合成sgRNA。鉴定了每种RGN多肽的经加工的crRNA和tracrRNA序列,并列于表1中。关于针对PAM文库1和2构建的sgRNA,参见下文。

实施例3:每个RGN的PAM要求的确定

每个RGN的PAM要求使用基本上从Kleinstiver等人,(2015)Nature 523:481-485和Zetsche等人,(2015)Cell 163:759-771改编的PAM消耗测定来确定。简而言之,在pUC18主链(ampR)中生成两个质粒文库(L1和L2),每个质粒文库均含有侧翼为8个随机核苷酸(即PAM区)的独特的30bp前间区(靶)序列。表2列出了每个RGN的文库1和文库2的靶序列和侧翼PAM区。

将文库分别电穿孔到大肠杆菌BL21(DE3)细胞中,该细胞带有pRSF-1b表达载体,该载体包含本发明的RGN(针对大肠杆菌密码子优化的)以及同源sgRNA,该同源sgRNA包含对应于L1或L2中的前间区的间隔子序列。足够的文库质粒用于转化反应中,以获得>10^6cfu。pRSF-1b主链中的RGN和sgRNA都在T7启动子的控制下。允许转化反应物恢复1小时,然后将其稀释到含有羧苄青霉素和卡那霉素的LB培养基中并生长过夜。第二天,将混合物稀释到自诱导的Overnight Express

表2:PAM确定

实施例4:切割确定

使用RNP(核糖核蛋白)从体外切割反应确定切割位点。构建含有与His6或His10标签融合的RGN的表达质粒,并将其转化到大肠杆菌的BL21(DE3)菌株中。表达使用自诱导培养基或使用IPTG诱导进行。裂解和澄清后,通过固定的金属亲和色谱法纯化蛋白质。

核糖核酸复合物(包含核酸酶和sgRNA或crRNA和tracrRNA双链体)是通过在室温下在缓冲溶液中温育核酸酶和RNA 20分钟而形成的。将复合物转移至含有消化缓冲液和PCR扩增的靶标(称为“序列1”)的管中。序列1包含在其3’末端直接连接到每个RGN的相应PAM序列的核苷酸序列(SEQ ID NO:73)。将每个作为核糖核蛋白复合物的RGN与其各自的靶多核苷酸在25℃(APG04583.1)或37℃(所有其他)温育30分钟或60分钟(仅APG05459.1和APG01688.1)。将消化反应热灭活并在琼脂糖凝胶上跑胶。从凝胶上切下切割产物带,并使用Sanger测序法测序。通过将测序结果与PCR产物的预期序列进行比对来鉴定切割位点。结果示于表3中。如表3所示,RGN APG007433.1还可以产生具有不同靶序列的平末端切口。

通过以下针对核酸酶APG07433.1的方法确定序列2(SEQ ID NO:559,在其3’末端可操作地融合到RGN APG0733.1的PAM序列)的切割位点。消化后,将凝胶纯化的DNA产物用DNA末端修复试剂盒(Thermo Scientific K0771)处理,连接到线性平末端载体中,并将所得环状DNA转化到大肠杆菌感受态细胞中。带有5’突出端的交错切口将导致从两个切割产物中检测出克隆中的重叠序列。3’突出端将导致序列缺失,而平末端切口将导致检测到没有重叠的所有原始序列。此实验还验证了上述方法对序列1的发现,即大多数克隆被检测为源自具有5’重叠的切口,因此,不预期平末端切口的发现是利用的这种方法的假象。

表3:RGN切割位点

NTS=非靶标链;TS=靶标链

实施例5:错配敏感度测定

使用紧接在对于评估的核酸酶合适的PAM基序的5’的靶序列(SEQ ID NO:73)设计并获得质粒。还使用在所示位置改变的序列(表4)产生了单错配序列。形成纯化的核酸酶(APG08290.1或APG05459.1)和指导RNA的RNP复合物,并与来自设计的质粒的PCR扩增的线性DNA一起温育。在温育指定时间并灭活核酸酶后,通过琼脂糖凝胶电泳分析样品,以确定剩余的线性PCR产物的分数。对于每个位置的错配,表5显示了切割的完整带的百分比。

表4:针对APG08290.1和APG05459.1的错配敏感度测定所测试的序列

表5:RGN APG08290.1和RGN APG05459.1的错配敏感度

对RGN APG07433.1进行了类似的错配敏感度实验。该实验与上述实验相似,不同之处在于将替代碱基引入了指导RNA,而不是靶DNA。用于错配sgRNA合成的DNA序列示于表6。错配敏感度测定的结果示于表7。

表6:针对RGN APG07433.1的错配敏感度测定所测试的序列

表7:RGN APG07433.1的错配敏感度

RGN APG07433.1和APG08290.1对从PAM的5’的1-10位置中的错配表现出显著的敏感性,但有一些例外(表5和表7)。RGN APG05459.1对该区域中的错配也很敏感,但其切割dsDNA的能力也因远离PAM位点的错配而严重丧失(表5)。对是否发生切割有重要影响的位点的总数在间隔子序列中为至少15个位置。与其他基因组编辑工具(例如来自化脓性链球菌的经过充分研究的Cas9核酸酶,其通常对10-13个碱基对之间敏感(Hsu等人,NatBiotechnol(2013)31(9):827-832))相比,这是有利的。此外,许多废除RGN APG05459.1介导的切割的关键位点与PAM序列相距很远,特别是在13-20bp的范围内,其中许多其他核酸酶对错配显示极低(如果有的话)的敏感度。该特性在靶向与感兴趣的生物体中的其他位点具有紧密序列相似性的遗传基因座中可能格外有用。

实施例6:哺乳动物细胞中的基因编辑活性的证明

产生了RGN表达盒并将其引入载体用于哺乳动物表达。对每个RGN进行密码子优化以用于人类表达(SEQ ID NO:127-133),并在5’末端与SV40核定位序列(NLS;SEQ ID NO:134)和3xFLAG标签(SEQ ID NO:135)可操作地融合,并在3’末端与核质蛋白NLS序列(SEQID NO:136)可操作地融合。每个表达盒都在巨细胞病毒(CMV)启动子(SEQ ID NO:137)的控制下。本领域已知CMV转录增强子(SEQ ID NO:138)也可以包括在包含CMV启动子的构建体中。产生了各自在人RNA聚合酶III U6启动子(SEQ ID NO:139)的控制下编码单gRNA的指导RNA表达构建体,并将其引入pTwist High Copy Amp载体。表9中列出了每个指导物的靶序列的序列。

将上述构建体引入哺乳动物细胞。转染前一天,将1x10

然后分析总基因组DNA以确定针对每个基因组靶标的每个RGN的编辑率。首先,产生寡核苷酸以用于PCR扩增和随后对扩增的基因组靶位点的分析。表8.1至8.5列出了所用的寡核苷酸序列。

所有PCR反应均使用10μL的2X Master Mix Phusion High-Fidelity DNA聚合酶(Thermo Scientific)在包含0.5μM每种引物的20μL反应中进行。首先使用PCR#1引物扩增包含每种靶基因的大基因组区域,使用如下程序:98℃,1分钟;[98℃,10秒;62℃,15秒;72℃,5分钟]的30个循环;72℃,5分钟;一直保持12℃。然后使用特异于每个指导物的引物(PCR#2引物)进一步扩增一微升的该PCR反应,使用如下程序:98℃,1分钟;[98℃,10秒;67℃,15秒;72℃,30秒]的35个循环;72℃,5分钟;一直保持12℃。PCR#2的引物包括用于Illumina测序的Nextera Read 1和Read 2转座酶衔接子突出端序列。

表8.1:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,PCR#1

表8.2:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,针对APG05083.1、APG07433.1、APG07513.1和APG08290.1的PCR#2

表8.3:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG005459.1的PCR#2

表8.4:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG004583.1的PCR#2

表8.5:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG01988.1的PCR#2

对纯化的基因组DNA进行如上所述的PCR#1和PCR#2。第二次PCR扩增后,按照制造商的说明使用PCR清洁试剂盒(Zymo)清洁DNA,并在水中洗脱。将200-500ng纯化的PCR#2产物与2μL的10X NEB Buffer 2和水在20μL的反应中混合,并使用以下程序退火以形成异源双链DNA:95℃,5分钟;95-85℃,以2℃/秒的速度冷却;85-25℃,以0.1℃/秒的速度冷却;一直保持12℃。退火后,移除5μL的DNA作为无酶对照,并添加1μL的T7核酸内切酶I(NEB),并将反应液在37℃下温育1小时。温育后,添加5x FlashGel负载染料(Lonza),并使用凝胶电泳通过2.2%琼脂糖FlashGel(Lonza)分析5μL的每种反应液和对照。凝胶可视化后,使用以下等式确定非同源末端连接(NHEJ)的百分比:%NHEJ事件=100x[1-(1-切割的分数)^(1/2)],其中(切割的分数)定义为:(消化产物的密度)/(消化产物的密度+未消化的亲本条带的密度)。

对于一些样品,使用

重新退火后,按照制造商推荐的方案用

此外,按照Illumina 16S宏基因组测序文库方案,对包含Illumina突出端序列的PCR#2的产物进行文库制备。由服务提供商(MOGene)在Illumina Mi-Seq平台上进行深度测序。每个扩增子通常产生200,000个250bp的配对末端读数(2x 100,000个读数)。使用CRISPResso(Pinello等人,2016Nature Biotech,34:695-697)分析读数以计算编辑率。手工组织输出比对以确认插入和缺失位点以及在重组位点处鉴定微同源位点。编辑率示于表9。所有实验均在人细胞中进行。“靶序列”是基因靶标内的被靶向的序列。对于每个靶序列,取决于所使用的RGN,指导RNA包含互补RNA靶序列和合适的sgRNA。表10.1-10.9中显示了通过指导RNA进行的实验的经选择的分解。

表9:总体编辑率

表10.1-10.7中显示了相应指导物的特定插入和缺失。在这些表中,靶序列由粗体大写字母标识。8mer PAM区用双下划线标出,其中主要的被识别的核苷酸为粗体。插入由小写字母标识。缺失用短划线(---)标识。从靶序列的PAM近端边缘计算INDEL位置,其中边缘为位置0。如果位置在边缘的靶标侧,则位置为正(+);如果位置在边缘的PAM侧,则位置为负(-)。

表10.1:使用RGN APG07433.1的指导物139的特定插入和缺失

表10.2:使用RGN APG07433.1的指导物143的特定插入和缺失

表10.3:使用RGN APG07433.1的指导物190的特定插入和缺失

表10.4:使用RGN APG07433.1的指导物194的特定插入和缺失

表10.5:使用RGN APG08290.1的指导物145的特定插入和缺失

表10.6:使用RGN APG08290.1的指导物188的特定插入和缺失

表10.7:使用RGN APG08290.1的指导物192的特定插入和缺失

表10.8:使用RGN APG08290.1的指导物196的特定插入和缺失

表10.9:使用RGN APG07433.1的指导物190的特定插入和缺失

实施例7:植物细胞中的基因编辑活性的证明

使用从Li,等人,(2013)Nat.Biotech.31:688-691改编的方案在植物细胞中证明了本发明的RGN的RNA-指导的核酸酶活性。简而言之,将包含N末端SV40核定位信号的每个RGN的植物密码子优化形式(SEQ ID NO:169-182)克隆到瞬时转化载体中的强组成型35S启动子之后。将靶向植物PDS基因中的在合适的PAM序列侧翼的一个或多个位点的sgRNA克隆到第二个瞬时表达载体中的植物U6启动子之后。使用PEG介导的转化将表达载体引入本氏烟草(Nicotiana benthamiana)叶肉原生质体中。将转化的原生质体在黑暗中孵育长达36小时。使用DNeasy Plant Mini试剂盒(Qiagen)从原生质体分离基因组DNA。PCR扩增RGN靶位点侧翼的基因组区域,并按照制造商的方案使用QiaQuick Spin Column(Qiagen)纯化产物。将总共200-500ng的纯化的PCR产物与1μl 10×Taq DNA聚合酶PCR缓冲液(Enzymatics)和超纯水混合至10μl的最终体积,并进行重新退火过程以使异源双链体形成:95℃ 10分钟,以-2℃/s从95℃变至85℃,以-0.25℃/s从85℃变至25℃,并在25℃保持1分钟。重新退火后,按照制造商推荐的方案用SURVEYOR核酸酶和SURVEYOR enhancer S(Integrated DNATechnologies)处理产物,并在4-20%Novex TBE聚丙烯酰胺凝胶(Life Technologies)上进行分析。凝胶用SYBR Gold DNA染料(Life Technologies)染色10分钟,并用Gel Doc凝胶成像系统(Bio-rad)成像。定量基于相对条带强度。Indel百分比由公式100×(1-(1-(b+c)/(a+b+c))1/2)确定,其中a是未消化的PCR产物的累积强度,以及b和c是每个切割产物的累积强度。

可替代地,可以对源自被靶向的基因组序列的PCR产物进行类似于实施例6中所述的PCR,使得PCR产物含有Illumina突出端序列并且可以进行文库制备和深度测序。这种方法允许确定编辑率,如表9所示。

实施例8:指导物交叉相容性

为了确定指导RNA在RGN之间的交叉相容性,进行了双质粒干扰实验(Esvelt等人,(2013),Nat.Methods 10(11):1116-21)。第一质粒在卡那霉素抗性主链上包含RGN,其中几个靶标包含确定的PAM。将这些质粒转化到大肠杆菌BL21中,并使转化的菌株成为化学感受态。然后引入在氨苄青霉素抗性主链上包含指导RNA的第二质粒。将细胞铺板在含有两种抗生素的培养基上。如果RGN能够使用第二质粒上的指导物,则卡那霉素抗性质粒被切割并线性化,导致很少或没有菌落形成。如果RGN不能够使用第二质粒上的指导物,则卡那霉素抗性质粒不会被切割,从而导致高水平的菌落形成。还包括化脓性链球菌Cas9(SpyCas9)和金黄色葡萄球菌(Staphylococcus aureus)Cas9(SauCas9)的指导RNA,以确定与这些指导RNA的交叉相容性。

为了计算消耗百分比,将每个指导物转化的菌落数与使用阳性对照的转化效率进行比较。基于此比较,如果RGN可以使用指导物,则消耗百分比应为0,因为没有菌落能够生存。如果RGN不能使用指导物,则消耗百分比应为1,因为所有质粒均保持完整。结果显示在下表11中。“sg”指示所述RGN的指导RNA。

表11:交叉相容性测定

如表11所示,有四组正交系统。RGN可以识别来自其组中的其他系统的指导物,但不能使用来自其他组的指导物。第一组包含APG05083.1、APG07433.1、APG07513.1和APG08290.1。第二组包含SpyCas9和APG05459.1。第三组包含APG04583.1和APG01688.1。第四组包含SauCas9。

实施例9:疾病靶标的鉴定

从NCBI ClinVar数据库(其可通过万维网在NCBI ClinVar网站上获得)获得临床变体的数据库。从该列表鉴定致病性单核苷酸多态性(SNP)。使用基因组基因座信息,鉴定了与每个SNP重叠和围绕每个SNP的区域中的CRISPR靶标。表12中列出了可以使用与本发明的RGN结合的碱基编辑以靶向因果突变来校正的SNP的选择。在表12中,仅列出了每种疾病的一种别名。“RS#”对应于NCBI网站上通过SNP数据库获得的RS登录号。等位基因ID(AlleleID)对应于因果等位基因登录号,并且染色体登录号还提供通过NCBI网站找到的登录参考信息。表12还提供了适于针对每种疾病列出的RGN的基因组靶序列信息。靶序列信息还提供了用于产生针对本发明的相应RGN必需的sgRNA的前间区序列。

表12:本发明的RGN的疾病靶标

实施例10:靶向造成Hurler综合征的突变

下文描述了用于Hurler综合征(也称为MPS-1)的潜在治疗,其使用校正大部分患有疾病的患者中的造成Hurler综合征的突变的RNA引导的碱基编辑系统。这种方法利用了RNA指导的碱基编辑融合蛋白,其可以被包装到单个AAV载体中以递送至多种组织类型。取决于所使用的确切调节元件和碱基编辑结构域,还可以设计编码碱基编辑融合蛋白和单指导RNA两者的单一载体以靶向患病基因座。

实施例10.1:鉴定具有理想PAM的RGN

遗传病MPS-1是一种溶酶体贮积病,其特征在于在分子水平上硫酸皮肤素和硫酸乙酰肝素在溶酶体中的蓄积。该疾病通常是由IDUA基因(NCBI参考序列NG_008103.1)中的突变引起的遗传性遗传病,该基因编码α-L-艾杜糖醛酸酶。该疾病是α-L-艾杜糖醛酸酶缺乏的结果。在北欧背景的个体的研究中发现的最常见的IDUA突变是W402X和Q70X,两者都是无义突变,导致翻译提前终止(Bunge等人,(1994),Hum.Mol.Genet,3(6):861-866,通过引用并入本文)。单个核苷酸的回复将恢复野生型编码序列并导致受遗传基因座的内源调节机制控制的蛋白质表达。

人Idua基因的W402X突变在MPS-1H病例中占很高比例。碱基编辑器可以靶向相对于指导RNA的前间区组件结合位点的狭窄序列窗口,因此,距靶基因座特定距离的PAM序列的存在对于该策略的成功至关重要。鉴于碱基编辑蛋白相互作用期间靶突变必须在暴露的非靶标链(NTS)上以及RGN结构域的足迹将阻止进入PAM附近区域的限制,认为可及的基因座是距PAM 10-30bp。为避免在这个窗口中编辑和诱变其他附近的腺苷碱基,筛选不同的接头。理想窗口为距PAM 12-16bp。

与APG07433.1和APG08290.1相容的PAM序列在遗传基因座和如上文定义的理想碱基编辑窗口内很容易看出。这些核酸酶的PAM序列分别为NNNNCC(SEQ ID NO:6)和NNRNCC(SEQ ID NO:32),并且尺寸紧凑-可能允许通过单个AAV载体递送。这种递送方法相对于其他方法具有多种优势,例如进入各种不同的组织(肝脏、肌肉、CNS)以及良好建立的安全性特征和制造技术。

来自化脓性链球菌的Cas9(SpyCas9)需要NGG(SEQ ID NO:448)的PAM序列,该序列存在于W402X基因座附近,但是,SpyCas9的大小阻止了将编码碱基编辑结构域和SpyCas9核酸酶的融合蛋白的基因包装到单个AAV载体中,因此消除了该方法的上述优势。在该载体上包含指导RNA编码序列的可行性甚至更低,即使要进行重大的技术改进以减小基因调节元件的大小或增加AAV载体的包装极限。尽管可以采用双重递送策略(例如,Ryu等人,(2018),Nat.Biotechnol.,36(6):536-539,通过引用并入本文),但是它将增加显著的制造复杂性和成本。另外,双重病毒载体递送显著降低了基因校正的效率,因为在给定细胞中的成功编辑需要用两种载体感染和在细胞中组装融合蛋白。

相对于SpyCas9,常用的来自金黄色葡萄球菌的Cas9直系同源物(SauCas9)的尺寸要小得多,但具有更复杂的PAM要求-NGRRT(SEQ ID NO:449)。但是,该序列不在预期对致病基因座的碱基编辑有用的范围内。

实施例10.2:RGN融合构建体和sgRNA序列

使用标准的分子生物学技术产生编码具有以下结构域的融合蛋白的DNA序列:1)具有使DNA切割活性灭活(“失活”或“切口酶”)的突变的RGN结构域;2)可用于碱基编辑的腺苷脱氨酶。下表中描述的所有构建体均包含具有碱基编辑活性结构域的融合蛋白,在此实施例中,ADAT(SEQ ID NO:450)可操作地融合至RGN APG08290.1的N末端。本领域已知融合蛋白也可以用在RGN的C末端的碱基编辑酶来制备。另外,融合蛋白的RGN和碱基编辑器通常被接头氨基序列分开。本领域已知标准接头的长度为15-30个氨基酸。此外,本领域已知RGN与碱基编辑酶(例如胞苷脱氨酶)之间的某些融合蛋白还可包含至少一个尿嘧啶糖基化酶抑制剂(UGI)结构域,其可提高碱基编辑效率(US专利号10,167,457,通过引用并入本文)。因此,融合蛋白可包含APG08290.1、碱基修饰酶和至少一种UGI。

表13:RNA靶向的碱基编辑的构建体

RGN的可及编辑位点由PAM序列确定。当将RGN与碱基编辑结构域组合时,用于编辑的靶残基必须位于非靶标链(NTS)上,因为NTS是单链的,而RGN与基因座相关联。评估许多核酸酶和相应的指导RNA使得能够为该特定基因座选择最合适的基因编辑工具。在人Idua基因中,可由上述构建体靶向的几种潜在PAM序列位于负责W402X突变的突变核苷酸附近。还产生了编码包含以下内容的指导RNA转录物的序列:1)与疾病基因座的非编码DNA链互补的“间隔子”;和2)指导RNA与RGN缔合所需的RNA序列。有用的指导RNA序列(sgRNA)显示在下表14中。可以评估这些指导RNA序列的将上述碱基编辑器引导至感兴趣的基因座的效率。

表14:指导RNA的序列

实施例10.3:来自Hurler病患者的细胞中活性的测定

为了验证基因型策略并评估上述构建体,使用了来自Hurler病患者的成纤维细胞。与实施例5中描述的那些载体相似,设计了一种载体,其在融合蛋白编码序列和sgRNA编码序列的上游包含合适的启动子以用于在人细胞中表达这些序列。认识到还可以使用已知在人细胞中具有高水平表达或可在成纤维细胞中特异性表达的启动子和其他DNA元件(例如增强子或终止子)。使用标准技术(例如类似于实施例6中描述的转染)将载体转染到成纤维细胞中。可替代地,可以使用电穿孔。将细胞培养1-3天。使用标准技术分离基因组DNA(gDNA)。如下文进一步所述,通过对纯化的gDNA进行qPCR基因分型测定和/或下一代测序来确定编辑效率。

Taqman

表15:RT-PCR引物和探针

编辑实验后,使用标准方法以及上述引物和探针对gDNA进行qPCR分析。预期的结果显示在表16中。该体外系统可用于方便地评估构建体,并选择具有高编辑效率的构建体用于进一步研究。将与具有和不具有W402X突变的细胞(并且优选与具有对该突变杂合的一些细胞)进行比较以评估该系统。使用染料(例如Sybr green),Ct值将与参考基因或与基因座的总扩增进行比较。

表16:预期的qPCR结果

还可以通过下一代测序分析组织。可以使用引物结合位点,例如以下所示的那些(表17),或可以由本领域技术人员鉴定的其他合适的引物结合位点。PCR扩增后,按照Illumina 16S宏基因组测序文库方案对含有Illumina Nextera XT突出端序列的产物进行文库制备。深度测序是在Illumina Mi-Seq平台上进行的。通常,每个扩增子产生200,000个250bp的配对末端读数(2x 100,000个读数)。使用CRISPResso(Pinello等人,2016)分析读数以计算编辑率。手工组织输出比对以确认插入和缺失位点,以及在重组位点鉴定微同源位点。

表17:NGS引物结合位点

使用抗IDUA抗体对转染的细胞和对照细胞的细胞裂解物进行蛋白质印迹以验证全长蛋白的表达,并使用底物4-甲基伞形酮a-L-艾杜糖醛酸对细胞裂解物进行酶活性测定来验证该酶是否具有催化活性(Hopwood等人,Clin.Chim.ACta(1979),92(2):257-265,通过引用并入本文)。与原始Idua

实施例10.4:鼠模型中的疾病治疗验证

为了验证这种治疗方法的功效,使用在类似氨基酸中具有无义突变的小鼠模型。小鼠品系在其Idua基因(基因ID:15932)中具有W392X突变,其对应于Hurler综合征患者中的同源突变(Bunge等人,(1994),Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。该基因座包含相对于人中的序列不同的核苷酸序列,其缺少先前实施例中描述的用碱基编辑器进行校正所必需的PAM序列,并因此需要设计独特的融合蛋白来进行核苷酸校正。在这种动物中疾病的改善可以验证校正基因递送载体可及的组织中的突变的治疗方法。

对该突变纯合的小鼠表现出类似于Hurler综合征患者的许多表型特征。如上所述的碱基编辑-RGN融合蛋白(表13)与RNA指导序列一起被插入允许在小鼠中进行蛋白质表达和RNA转录的表达载体中。研究设计如下表18所示。该研究包括用高剂量的包含碱基编辑融合蛋白和RNA指导序列的表达载体、低剂量的相同表达载体、对照(其是用不包含碱基编辑融合蛋白或指导RNA的表达载体处理的模型小鼠)以及第二种对照(其是用相同空载体处理的野生型小鼠)处理的组。

表18:鼠模型中的基因组编辑实验

评估的终点包括体重、尿液GAG排泄、血清IDUA酶活性、感兴趣的组织中的IDUA活性、组织病理学、感兴趣的组织的基因分型以验证SNP的校正以及行为和神经学评估。由于一些终点是终末的,因此可以在研究结束之前添加其他组用于评估例如组织病理学和组织IDUA活性。在建立Hurler综合征动物模型的已发表论文中可以找到终点的其他示例(Shull等人,(1994),Proc.Natl.Acad.Sci.U.S.A.,91(26):12937-12941;Wang等人,(2010),Mol.Genet.Metab.,99(1):62-71;Hartung等人,(2004),Mol.Ther.,9(6):866-875;Liu等人,(2005),Mol.Ther.,11(1):35-47;Clarke等人,(1997),Hum.Mol.Genet.6(4):503-511;全部通过引用并入本文)。

一种可能的递送载体利用腺相关病毒(AAV)。产生载体以包含在CMV增强子(SEQID NO:138)和启动子(SEQ ID NO:137)或其他合适的增强子和启动子组合(任选地Kozak序列)之前并在3’末端可操作地融合至终止子序列和聚腺苷酸化序列(例如Levitt,N.;Briggs,D.;Gil,A.;Proudfoot,N.J.Definition of an Efficient Synthetic Poly(A)Site.Genes Dev.1989,3(7),1019–1025中描述的最小序列)的碱基编辑器-dRGN融合蛋白编码序列(例如,SEQ ID NO:452)。载体可进一步包含表达盒,该表达盒编码在其5’末端可操作地连接至人U6启动子(SEQ ID NO:139)或适于产生小的非编码RNA的另一启动子的单指导RNA并且进一步包含用于包装在AAV衣壳中所必需的且本领域众所周知的反向末端重复(ITR)序列。通过标准方法进行生产和病毒包装,例如在美国专利号9,587,250中描述的方法,该专利通过引用并入本文。

其他可能的病毒载体包括通常使用的腺病毒和慢病毒载体,它们将含有相似的元件,具有不同的包装能力和要求。还可以使用非病毒递送方法,例如脂质纳米颗粒包裹的mRNA和sgRNA(Cullis,P.R.和Allen,T.M.(2013),Adv.Drug Deliv.Rev.65(1):36-48;Finn等人,(2018),Cell Rep.22(9):2227-2235,均通过引用并入本文),质粒DNA的流体动力学注射(Suda T和Liu D,(2007)Mol.Ther.15(12):2063-2069,通过引用并入本文)或与金纳米颗粒缔合的sgRNA的核糖核蛋白复合物(Lee,K.;Conboy,M.;Park,H.M.;Jiang,F.;Kim,H.J.;Dewitt,M.A.;Mackley,V.A.;Chang,K.;Rao,A.;Skinner,C.;等人,NanoparticleDelivery of Cas9 Ribonucleoprotein and Donor DNA in Vivo Induces Homology-Directed DNA Repair.Nat.Biomed.Eng.2017,1(11),889–90)。

实施例10.5:具有人源化基因座的鼠模型中的疾病校正

为了评估与用于人类治疗的相同的碱基编辑器构建体的功效,需要一种小鼠模型,其中改变W392附近的核苷酸以匹配人中W402附近的序列。这可以通过多种技术来实现,包括使用RGN和HDR模板以切割和替换小鼠胚胎中的基因座。

由于高度的氨基酸保守性,可以将小鼠基因座中的大多数核苷酸改变为如表19所示的具有沉默突变的人序列的那些核苷酸。导致所得到的工程化小鼠的基因组中改变的编码序列中的唯一的碱基变化在引入终止密码子后发生。

表19:核苷酸突变产生人源化小鼠基因座

在该小鼠品系的工程化后,将如实施例10.4中所述进行类似的实验。

实施例11:造成弗里德赖希共济失调的靶向突变

导致弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内的确定的遗传基因座中,被称为FRDA不稳定性区域。RNA-指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。这种方法需要1)RGN和指导RNA序列,其可被编程以靶向人基因组中的等位基因;和2)用于RGN和指导物序列的递送方法。用于基因组编辑的许多核酸酶(例如常用的来自化脓性链球菌的Cas9核酸酶(SpCas9))太大而无法被包装到腺相关病毒(AAV)载体中,尤其是在考虑除了功能表达盒所需的其他遗传元件以外SpCas9基因和指导RNA的长度时。这使得不太可能使用SpCas9形成可行的方法。

本发明的紧凑的RNA-指导的核酸酶(特别是APG07433.1和APG08290.1)独特地非常适合于FRDA不稳定性区域的切除。每个RGN具有在FRDA不稳定性区域附近的PAM要求。另外,这些RGN中的每一个都可以与指导RNA一起包装到AAV载体中。包装两个指导RNA可能需要第二个载体,但是这种方法与较大的核酸酶(例如SpCas9)所需的相比仍然是有利的,后者可能需要将蛋白质序列拆分在两个载体之间。

表20显示了适合将APG07433.1或APG08290.1靶向至FRDA不稳定性区域的5’和3’侧翼的基因组靶序列的位置。一旦到达基因座,RGN将切除FA不稳定性区域。区域的切除可以使用Illumina测序基因座来验证。

表20:RGN系统的基因组靶序列

实施例12:靶向造成镰状细胞病的突变

BCL11A增强子区域(SEQ ID NO:472)内的靶向序列可提供用于增加胎儿血红蛋白(HbF)以治愈或减轻镰状细胞病的症状的机制。例如,全基因组关联研究已经鉴定了BCL11A处与升高的HbF水平相关的一组遗传变异。这些变异是在用作阶段特异性、谱系限制的增强子区域的BCL11A的非编码区域中发现的SNP的集合。进一步的研究表明,该BCL11A增强子是在红系细胞中BCL11A表达所需的(Bauer等人,(2013)Science 343:253-257,通过引用并入本文)。在BCL11A基因的内含子2内发现增强子区域,并鉴定了内含子2中三个区域的DNAseI超敏反应(通常指示与调节潜能相关的染色质状态)。根据距BCL11A的转录起始位点的千碱基距离,将这三个区域鉴定为“+62”、“+58”和“+55”。这些增强子区域的长度为约350(+55);550(+58);和350(+62)个核苷酸(Bauer等人,2013)。

实施例12.1:鉴定优选的RGN系统

在这里,我们描述了一种使用破坏BCL11A与其在HBB基因座(其是负责在成人血红蛋白中产生β-球蛋白的基因)内的结合位点的结合的RGN系统的用于β-血红蛋白病的潜在治疗方法。这种方法使用在哺乳动物细胞中更有效的NHEJ。另外,此方法使用尺寸足够小的核酸酶,其可以被包装到单个AAV载体中以用于体内递送。

人BCL11A增强子区域(SEQ ID NO:472)中的GATA1增强子基序是用于使用RNA-指导的核酸酶(RGN)进行破坏以减少成人红细胞中的BCL11A表达并同时再表达HbF的理想靶标(Wu等人,(2019)Nat Med 387:2554)。与APG07433.1和APG08290.1相容的几个PAM序列在该GATA1位点周围的遗传基因座上很容易看出。这些核酸酶具有5’-NNNNCC-3’(SEQ ID NO:6)的PAM序列,并且尺寸紧凑,潜在地允许其与适当的指导RNA一起在单个AAV或腺病毒载体中递送。这种递送方法相对于其他方法具有多种优势,例如可以进入造血干细胞以及良好建立的安全性特征和制造技术。

常用的来自化脓性链球菌的Cas9核酸酶(SpyCas9)需要5’-NGG-3’的PAM序列(SEQID NO:448),其中几个存在于GATA1基序附近。但是,SpyCas9的大小阻止了包装到单个AAV或腺病毒载体中,因此消除了该方法的上述优点。尽管可以采用双重递送策略,但会增加显著的制造复杂性和成本。另外,双重病毒载体递送显著降低了基因校正的效率,因为在给定细胞中的成功编辑需要使用两种载体的感染。

类似于实施例6中所描述的,产生了编码人密码子优化的APG07433.1(SEQ ID NO:128)或APG08290.1(SEQ ID NO:130)的表达盒。还产生了表达用于RGN APG07433.1和APG08290.1的指导RNA的表达盒。这些指导RNA包含1)与BCL11A增强子基因座内的非编码或编码DNA链互补的前间区序列(靶序列)和2)指导RNA与RGN缔合所需的RNA序列(对于APG07433.1为SEQ ID NO:18,对于APG08290.1为SEQ ID NO:35)。由于BCL11A GATA1增强子基序周围的APG07433.1或APG08290.1靶向的几种潜在PAM序列,产生了几种潜在的指导RNA构建体以确定产生BCL11A GATA1增强子序列的NHEJ介导的破坏和稳健的切割的最佳前间区序列。评估下表(表21)中的靶基因组序列以将RGN引导至该基因座。

表21:BCL11A GATA1增强子基因座的靶序列

为了评估APG07433.1或APG08290.1产生破坏BCL11A增强子区域的插入或缺失的效率,使用了人类细胞系,例如人类胚胎肾细胞(HEK细胞)。产生包含RGN表达盒(例如,如实施例6中所述)的DNA载体。还产生了包含表达盒的单独载体,所述表达盒包含表21的指导RNA序列的编码序列。如实施例6中所述,这样的表达盒可以进一步包含人RNA聚合酶III U6启动子(SEQ ID NO:139)。可替代地,可以使用包含RGN和指导RNA两者的表达盒的单个载体。使用诸如实施例6中所述的标准技术将载体引入HEK细胞,并将细胞培养1-3天。在该培养期后,如实施例6中所述,分离基因组DNA并通过使用T7核酸内切酶I消化和/或直接DNA测序来确定插入或缺失的频率。

通过使用含有Illumina Nextera XT突出端序列的引物的PCR扩增包含靶BCL11A区域的DNA区域。这些PCR扩增子使用T7核酸内切酶I消化来检查NHEJ形成,或按照Illumina16S宏基因组测序文库方案或类似的下一代测序(NGS)文库制备来进行文库制备。在深度测序后,通过CRISPResso分析产生的读数以计算编辑率。手工组织输出比对以确认插入和缺失位点。该分析鉴定了优选的RGN和相应的优选的指导RNA(sgRNA)。该分析可能导致APG07433.1和APG08290.1被同等优选。另外,该分析可以确定存在多于一种优选的指导RNA,或者表21中的所有靶基因组序列均同等优选。

实施例12.2:胎儿血红蛋白表达的测定

在该实施例中,针对胎儿血红蛋白的表达测定APG07433.1或APG08290.1产生的破坏BCL11A增强子区域的插入或缺失。使用健康的人供体CD34

实施例12.3:减少的镰状细胞形成的测定

在该实施例中,针对减少的镰状细胞形成测定APG07433.1或APG08290.1产生的破坏BCL11A增强子区域的插入或缺失。使用来自罹患镰状细胞病的患者的供体CD34

通过添加偏亚硫酸氢盐在这些分化的红细胞中诱导镰状细胞形成。使用显微镜对镰状红细胞相对正常红细胞的数量进行计数。预期用APG07433.1或APG08290.1加sgRNA处理的细胞中,镰状细胞的数量少于未处理或单独使用RGN处理的细胞中的数量。

实施例12.4:鼠模型中的疾病治疗验证

为了评估使用APG07433.1或APG08290.1破坏BCL11A基因座的功效,使用了合适的镰状细胞性贫血的人源化小鼠模型。将编码优选的RGN和优选的sgRNA的表达盒包装到AAV载体或腺病毒载体中。特别地,腺病毒类型Ad5/35有效靶向HSC。选择合适的包含具有镰状细胞等位基因的人源化HBB基因座的小鼠模型,例如B6;FVB-Tg(LCR-HBA2,LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。这些小鼠用单独的或与普乐沙福组合的粒细胞集落刺激因子治疗以动员HSC进入循环。然后静脉注射携带RGN和指导质粒的AAV或腺病毒,并允许小鼠恢复一周。使用偏亚硫酸氢盐在体外镰状细胞测定中测试从这些小鼠获得的血液,并纵向跟踪小鼠以监测死亡率和造血功能。与用缺乏两种表达盒的病毒或用单独携带RGN表达盒的病毒治疗的小鼠相比,使用携带RGN和指导RNA的AAV或腺病毒的治疗预期将降低镰状化、死亡率并改善造血功能。

序列表

<110> 生命编辑股份有限公司

<120> RNA-指导的核酸酶及其活性片段和变体及其使用方法

<130> L103438 1160WO (0029.8)

<140>

<141>

<150> 62/805,045

<151> 2019-02-13

<150> 62/805,041

<151> 2019-02-13

<150> 62/686,901

<151> 2018-06-19

<150> 62/680,863

<151> 2018-06-05

<150> 62/680,862

<151> 2018-06-05

<150> 62/680,859

<151> 2018-06-05

<150> 62/680,853

<151> 2018-06-05

<150> 62/680,846

<151> 2018-06-05

<150> 62/680,845

<151> 2018-06-05

<160> 651

<170> PatentIn version 3.5

<210> 1

<211> 1070

<212> PRT

<213> Bacillus sp.

<220>

<221> 来源

<223> /注="APG05083.1"

<400> 1

Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser

1 5 10 15

Ile Gly Trp Gly Ile Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Gln

20 25 30

Tyr Glu Lys Ala Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys

35 40 45

Ala Glu Ile Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile

50 55 60

Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys

65 70 75 80

Asp Ile Arg Asn Leu Leu Val Gln His Glu Ile Ile Ser Gln Lys Glu

85 90 95

Leu Ala Ser Leu Tyr Pro Leu Thr Lys Ser Ser Met Asp Ile Trp Asp

100 105 110

Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asp Arg Phe Glu Trp Thr

115 120 125

Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg

130 135 140

Lys Ser Glu Leu Lys Asp Val Glu Thr Gly Lys Val Leu Ser Ser Ile

145 150 155 160

Gln Ala Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met

165 170 175

Trp Met Lys Asn Glu Asp Phe Ser Lys Tyr Asp Lys Arg Arg Asn Ser

180 185 190

Ser Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu

195 200 205

Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala

210 215 220

Ser Ala Asp Leu Gln Lys Thr Tyr Leu Gln Ile Trp Ala His Gln Leu

225 230 235 240

Pro Phe Ala Ser Gly Asn Ala Ile Val Asn Lys Val Gly Tyr Cys Ser

245 250 255

Leu Leu Lys Gly Lys Glu Lys Arg Val Pro Lys Ala Thr Tyr Thr Phe

260 265 270

Gln Tyr Phe Ser Thr Leu Asp Gln Ile Asn Arg Thr Arg Leu Gly Pro

275 280 285

Asn Phe Gln Pro Phe Thr Lys Glu Gln Arg Asp Val Ile Leu Asp Glu

290 295 300

Met Phe Asn Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val

305 310 315 320

Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Ala Leu Asp Glu Thr Ile Gln

325 330 335

Phe Lys Gly Leu Thr Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu

340 345 350

Leu Lys Ser Phe Ile Asn Leu Lys Pro Phe Tyr Glu Ile Lys Lys Val

355 360 365

Val Thr Asn Tyr Ala Lys Lys Thr Asn Glu Ala Phe Ser Thr Leu Asp

370 375 380

Tyr Asp Thr Phe Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp

385 390 395 400

Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Cys Cys Tyr

405 410 415

Asp Asp Gln Leu Ile Glu Glu Leu Leu Thr Leu Ser Tyr Thr Lys Phe

420 425 430

Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln

435 440 445

Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Ala

450 455 460

Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Phe Pro

465 470 475 480

Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg

485 490 495

Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val

500 505 510

His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Thr

515 520 525

Lys Ile Met Lys Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala

530 535 540

Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp

545 550 555 560

Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr

565 570 575

Ser Leu Lys Gln Ile Pro Ala Asn Thr Phe Phe Asn Glu Met Lys Lys

580 585 590

Glu Arg Ser Gly Ser Pro Val Leu Glu Ile Asp His Ile Leu Pro Tyr

595 600 605

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Gly

610 615 620

Asp Glu Asn Gln Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu

625 630 635 640

Glu Gly Asn Lys Asp Trp Glu Ser Phe Glu Ser Tyr Val Arg Leu Asn

645 650 655

Ser Phe Phe Ser Lys Lys Lys Arg Gly Tyr Leu Leu Lys Lys Ala Tyr

660 665 670

Leu Pro Arg Glu Ser Asn Met Ile Lys Glu Arg His Leu Asn Asp Thr

675 680 685

Arg Tyr Ala Ser Ser Tyr Leu Lys Asn Phe Ile Glu Lys Asn Leu Lys

690 695 700

Phe Lys Glu Val Glu Gly Ser Thr Arg Lys Lys His Val Gln Thr Val

705 710 715 720

Asn Gly Ile Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys

725 730 735

Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val

740 745 750

Ala Cys Thr Asp His His Met Val Thr Lys Val Thr Glu Tyr Tyr Gln

755 760 765

Ile Lys Glu Ser Asn Lys Ser Ile Arg Lys Pro Tyr Phe Pro Leu Pro

770 775 780

Trp Val Gly Phe Arg Glu Glu Ile Leu Ser His Leu Ala Arg Gln Pro

785 790 795 800

Ile Ala Arg Lys Ile Ser Glu Glu Leu Lys Ile Gly Tyr Gln Ser Phe

805 810 815

Asp Tyr Ile Leu Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala

820 825 830

Ala His Glu Gln Thr Ile Met Lys Lys Gly Gly Ile Asp Lys Lys Gly

835 840 845

Lys Thr Ile Ile Ile Lys Arg Val Tyr Leu Lys Asp Ile Lys Phe Asp

850 855 860

Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr

865 870 875 880

Tyr Glu Ala Ile Lys Gln Arg Tyr Ile Glu Tyr Gly Lys Glu Ser Lys

885 890 895

Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Lys Gly

900 905 910

Asn Leu Ile Lys Lys Ile Lys Val Glu Val Gln Thr Lys Ser Phe Val

915 920 925

Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val

930 935 940

Asp Leu Phe Glu Lys Asp Asn Arg Tyr Tyr Met Ile Pro Ile Tyr Val

945 950 955 960

Met Asp Thr Val His Ser Glu Leu Pro Asn Lys Ala Val Thr Ser Ser

965 970 975

Lys Gly Tyr Glu Gln Trp Leu Thr Ile Asp Asn Ser Phe Thr Phe Lys

980 985 990

Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu

995 1000 1005

Asp Arg Phe Leu Tyr Phe Ser Thr Leu Asp Ile Asn Ser Asp Arg

1010 1015 1020

Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Ala Glu Asn

1025 1030 1035

Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val

1040 1045 1050

Gly Val Leu Gly Asp Leu Arg Phe Val Arg Gln Glu Ile Arg Lys

1055 1060 1065

Asn Phe

1070

<210> 2

<211> 19

<212> RNA

<213> 芽孢杆菌属(Bacillus)的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 2

gucauaguuc cauuauugc 19

<210> 3

<211> 84

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 3

gcuuugaugu uucuaugaua agggcuuagg cccguggcgu uggggaucgc cugcccauuu 60

uaaugggcuu cuccccaucu auuu 84

<210> 4

<211> 137

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 4

gagcggacag cagcuuccua uaucucguac gucauaguuc cauuauugca aaggcuuuga 60

uguuucuaug auaagggcuu aggcccgugg cguuggggau cgccugccca uuuuaauggg 120

cuucucccca ucuauuu 137

<210> 5

<211> 137

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 5

ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuauugca aaggcuuuga 60

uguuucuaug auaagggcuu aggcccgugg cguuggggau cgccugccca uuuuaauggg 120

cuucucccca ucuauuu 137

<210> 6

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(4)

<223> a, c, t, g, 未知或其他

<400> 6

nnnncc 6

<210> 7

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="示例性PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(4)

<223> a, c, t, g, 未知或其他

<400> 7

nnrncc 6

<210> 8

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 8

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 9

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 9

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 10

<211> 132

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 10

nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua uugcaaaggc uuugauguuu 60

cuaugauaag ggcuuaggcc cguggcguug gggaucgccu gcccauuuua augggcuucu 120

ccccaucuau uu 132

<210> 11

<211> 1071

<212> PRT

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG07433.1"

<400> 11

Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser

1 5 10 15

Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Arg

20 25 30

Tyr Glu Lys Val Arg Ile Val Asp Gln Gly Val Arg Met Phe Asp Arg

35 40 45

Ala Glu Met Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile

50 55 60

Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys

65 70 75 80

Asn Ile Arg Asn Leu Leu Val Gln His Gly Val Ile Thr Gln Glu Glu

85 90 95

Leu Asp Ser Leu Tyr Pro Leu Ser Lys Lys Ser Met Asp Ile Trp Gly

100 105 110

Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Phe Glu Trp Ala

115 120 125

Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg

130 135 140

Lys Ser Glu Leu Lys Asp Thr Glu Thr Gly Lys Val Leu Ser Ser Ile

145 150 155 160

Gln Leu Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met

165 170 175

Trp Met Lys Asp Pro Asp Phe Ser Lys Tyr Asp Arg Lys Arg Asn Ser

180 185 190

Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Glu Leu Glu Lys Glu

195 200 205

Ile Val Thr Leu Phe Ala Ala Gln Arg Arg Phe Gln Ser Pro Tyr Ala

210 215 220

Ser Lys Asp Leu Gln Glu Thr Tyr Leu Gln Ile Trp Thr His Gln Leu

225 230 235 240

Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser

245 250 255

Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe

260 265 270

Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro

275 280 285

Asp Phe Gln Pro Phe Thr Lys Glu Gln Arg Glu Ile Ile Leu Asn Asn

290 295 300

Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val

305 310 315 320

Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln

325 330 335

Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu

340 345 350

Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Asn Lys Val

355 360 365

Val Ala Asn Tyr Ser Glu Arg Thr Asn Glu Thr Phe Ser Thr Leu Asp

370 375 380

Tyr Asp Gly Ile Gly Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp

385 390 395 400

Ile Arg Ser Tyr Leu Lys Ser Ser His Asn Leu Pro Lys Arg Cys Tyr

405 410 415

Asp Asp Gln Leu Ile Glu Glu Leu Leu Ser Leu Ser Tyr Thr Lys Phe

420 425 430

Gly His Leu Ser Leu Lys Ala Ile Asn His Val Leu Ser Ile Met Gln

435 440 445

Lys Gly Asn Thr Tyr Lys Glu Ala Val Asp Gln Leu Gly Tyr Asp Thr

450 455 460

Ser Gly Leu Lys Lys Glu Lys Arg Ser Lys Phe Leu Pro Pro Ile Ser

465 470 475 480

Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg

485 490 495

Lys Val Val Asn Ala Ile Ile Arg Arg His Gly Ser Pro His Ser Val

500 505 510

His Ile Glu Leu Ala Arg Glu Leu Ser Lys Asn His Asp Glu Arg Thr

515 520 525

Lys Ile Val Ser Ala Gln Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala

530 535 540

Ile Ser Ile Leu Ser Glu His Gly Ile Leu Asn Pro Thr Gly Tyr Asp

545 550 555 560

Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr

565 570 575

Ser Leu Lys Glu Ile Pro Ala Asp Thr Phe Phe Asn Glu Leu Lys Lys

580 585 590

Glu Arg Asn Gly Ala Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr

595 600 605

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser

610 615 620

Asp Glu Asn Arg Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu

625 630 635 640

Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn

645 650 655

Lys Phe Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Arg Ala Tyr

660 665 670

Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr

675 680 685

Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln

690 695 700

Phe Lys Glu Ala Glu Asp Asn Pro Arg Lys Arg Arg Val Gln Thr Val

705 710 715 720

Asn Gly Val Ile Thr Ala His Phe Arg Lys Arg Trp Gly Leu Glu Lys

725 730 735

Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val

740 745 750

Ala Cys Thr Asp His His Met Val Thr Arg Val Thr Glu Tyr Tyr Gln

755 760 765

Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro

770 775 780

Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro

785 790 795 800

Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Leu

805 810 815

Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala

820 825 830

Ala His Lys Gln Thr Ile Met Arg Lys Gly Gly Ile Asp Lys Lys Gly

835 840 845

Lys Thr Ile Ile Ile Glu Arg Leu His Leu Lys Asp Ile Lys Phe Asp

850 855 860

Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Met Ala Thr

865 870 875 880

Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Gly Lys Asn Ser Lys

885 890 895

Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly

900 905 910

Asn Leu Ile Lys Arg Val Lys Val Glu Gly Gln Ala Lys Ser Phe Val

915 920 925

Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val

930 935 940

Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val

945 950 955 960

Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Ala Ser Ser

965 970 975

Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys

980 985 990

Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu

995 1000 1005

Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg

1010 1015 1020

Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Lys Asn Glu Tyr

1025 1030 1035

Arg Tyr Ser Leu Lys Thr Ile Glu Asp Leu Glu Lys Tyr Glu Val

1040 1045 1050

Gly Val Leu Gly Asp Leu Arg Leu Val Arg Lys Glu Thr Arg Arg

1055 1060 1065

Asn Phe His

1070

<210> 12

<211> 21

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 12

gucauaguuc cauuaaagcc a 21

<210> 13

<211> 85

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 13

uggcuuugau guuucuauga uaaggguuuc gacccguggc gucggggauc gccugcccau 60

ugaaaugggc uucuccccau uuauu 85

<210> 14

<211> 140

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 14

gagcggacag cagcuuccua uaucucguac gucauaguuc cauuaaagcc agaaauggcu 60

uugauguuuc uaugauaagg guuucgaccc guggcgucgg ggaucgccug cccauugaaa 120

ugggcuucuc cccauuuauu 140

<210> 15

<211> 140

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 15

ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuaaagcc agaaauggcu 60

uugauguuuc uaugauaagg guuucgaccc guggcgucgg ggaucgccug cccauugaaa 120

ugggcuucuc cccauuuauu 140

<210> 16

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 16

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 17

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 17

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 18

<211> 135

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 18

nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua aagccaaaag uggcuuugau 60

guuucuauga uaaggguuuc gacccguggc gucggggauc gccugcccau ugaaaugggc 120

uucuccccau uuauu 135

<210> 19

<211> 1071

<212> PRT

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG07513.1"

<400> 19

Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser

1 5 10 15

Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Gln

20 25 30

Tyr Glu Lys Thr Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys

35 40 45

Ala Glu Ile Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile

50 55 60

Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys

65 70 75 80

Asp Ile Arg Asn Leu Leu Val Gln His Glu Ile Ile Ser Gln Lys Glu

85 90 95

Leu Thr Ser Leu Tyr Pro Leu Ser Lys Ser Ser Met Asp Ile Trp Asp

100 105 110

Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asp Arg Phe Glu Trp Ala

115 120 125

Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg

130 135 140

Lys Ser Glu Leu Lys Asp Val Glu Thr Gly Lys Val Leu Ser Ser Ile

145 150 155 160

Gln Val Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met

165 170 175

Trp Met Lys Asn Ala Asp Cys Ser Lys Tyr Gly Lys Arg Arg Asn Ser

180 185 190

Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu

195 200 205

Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe His Ser Ser Tyr Ala

210 215 220

Ser Val Asp Leu Gln Lys Thr Tyr Ile Gln Ile Trp Ala His Gln Leu

225 230 235 240

Pro Phe Ala Ser Gly Asn Ala Ile Val Asn Lys Val Gly Tyr Cys Ser

245 250 255

Leu Leu Lys Gly Lys Glu Lys Arg Val Pro Lys Ala Thr Tyr Thr Phe

260 265 270

Gln Tyr Phe Asn Thr Leu Asp Gln Ile Asn Arg Thr Arg Leu Gly Pro

275 280 285

Asn Phe Gln Pro Phe Thr Lys Glu Gln Arg Asp Ile Ile Leu Asp Lys

290 295 300

Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val

305 310 315 320

Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Ala Leu Asp Glu Thr Ile Gln

325 330 335

Phe Lys Gly Leu Thr Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu

340 345 350

Met Lys Pro Phe Ile Asn Leu Lys Pro Phe Tyr Glu Ile Lys Lys Val

355 360 365

Val Thr Asn Tyr Ala Lys Lys Thr Asn Glu Val Phe Ser Ala Leu Asp

370 375 380

Tyr Asp Thr Val Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp

385 390 395 400

Ile Arg Ser Tyr Leu Lys Arg Ser Asn Asn Leu Ser Lys Arg Cys Tyr

405 410 415

Asp Asp Gln Leu Ile Glu Glu Leu Leu Thr Leu Ser Tyr Thr Lys Phe

420 425 430

Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln

435 440 445

Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr

450 455 460

Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Ile Ile Pro

465 470 475 480

Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg

485 490 495

Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val

500 505 510

His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys

515 520 525

Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala

530 535 540

Val Ser Ile Leu Ile Asp Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp

545 550 555 560

Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr

565 570 575

Ser Leu Lys Lys Ile Pro Ala Asn Thr Phe Phe Asn Glu Leu Lys Lys

580 585 590

Glu Arg Ser Gly Pro Pro Val Leu Glu Val Asp His Ile Leu Pro Tyr

595 600 605

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Gly

610 615 620

Asp Glu Asn Gln Lys Lys Gly Asn Arg Ile Pro Tyr Thr Phe Phe Ser

625 630 635 640

Glu Glu Asp Lys Glu Trp Glu Ser Phe Glu Ser Tyr Val Arg Ser Asn

645 650 655

Ser Phe Phe Ser Lys Lys Lys Arg Gly Tyr Leu Leu Lys Lys Ala Tyr

660 665 670

Leu Pro Arg Glu Ser Asn Leu Ile Lys Glu Arg His Leu Asn Asp Thr

675 680 685

Arg Tyr Ala Ser Ser Tyr Leu Lys Asn Phe Ile Glu Lys Asn Leu Lys

690 695 700

Phe Lys Glu Ala Val Gly Ile Thr Arg Lys Lys Tyr Val Gln Thr Val

705 710 715 720

Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys

725 730 735

Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val

740 745 750

Ala Cys Thr Asp His His Met Val Thr Lys Val Thr Glu Tyr Tyr Gln

755 760 765

Ile Lys Glu Gly Asn Lys Ser Ile Lys Lys Pro Tyr Phe Pro Leu Pro

770 775 780

Trp Met Gly Phe Arg Glu Glu Ile Leu Ser His Leu Glu Ser Gln Pro

785 790 795 800

Ile Ala Arg Lys Ile Ser Glu Glu Leu Lys Ile Gly Tyr Gln Ser Pro

805 810 815

Asp Tyr Ile Leu Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ser

820 825 830

Ala His Asp Gln Thr Val Met Lys Lys Gly Asp Ile Asp Lys Lys Gly

835 840 845

Lys Thr Ile Ile Ile Lys Arg Val His Leu Lys Asp Ile Lys Phe Asp

850 855 860

Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr

865 870 875 880

Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu Tyr Arg Lys Glu Ser Lys

885 890 895

Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Lys Gly

900 905 910

Asn Leu Ile Lys Lys Ile Lys Val Glu Val Gln Thr Lys Ser Phe Val

915 920 925

Arg Glu Ile Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val

930 935 940

Asp Leu Phe Glu Lys Asp Asn Arg Tyr Tyr Met Val Pro Ile Tyr Val

945 950 955 960

Val Asp Thr Val Arg Ser Glu Leu Pro Asn Lys Ala Val Thr Ser Ser

965 970 975

Lys Gly Tyr Glu Gln Trp Leu Ser Ile Asp Asn Ser Phe Thr Phe Lys

980 985 990

Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu

995 1000 1005

Asp Arg Phe Leu Tyr Phe Ser Thr Leu Asp Ile Asn Ser Asp Arg

1010 1015 1020

Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Ala Glu Tyr

1025 1030 1035

Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Ile

1040 1045 1050

Gly Val Leu Gly Asp Leu Arg Leu Val Arg Gln Glu Thr Arg Lys

1055 1060 1065

Ile Phe Lys

1070

<210> 20

<211> 27

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 20

gucauaguuc cauuaaagcc auugcug 27

<210> 21

<211> 93

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 21

acagcaaugg cuuugauguu ucuaugauaa gggcuucggc ccguggcguu ggggaucgcc 60

ugcccauuuu aaugggcuuc uccccaucua uuu 93

<210> 22

<211> 154

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 22

gagcggacag cagcuuccua uaucucguac gucauaguuc cauuaaagcc auugcugaaa 60

gacagcaaug gcuuugaugu uucuaugaua agggcuucgg cccguggcgu uggggaucgc 120

cugcccauuu uaaugggcuu cuccccaucu auuu 154

<210> 23

<211> 154

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 23

ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuaaagcc auugcugaaa 60

gacagcaaug gcuuugaugu uucuaugaua agggcuucgg cccguggcgu uggggaucgc 120

cugcccauuu uaaugggcuu cuccccaucu auuu 154

<210> 24

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 24

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 25

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 25

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 26

<211> 149

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 26

nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua aagccauugc ugaaagacag 60

caauggcuuu gauguuucua ugauaagggc uucggcccgu ggcguugggg aucgccugcc 120

cauuuuaaug ggcuucuccc caucuauuu 149

<210> 27

<211> 1072

<212> PRT

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG08290.1"

<400> 27

Met Ser Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser

1 5 10 15

Ile Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg

20 25 30

Tyr Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys

35 40 45

Ala Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile

50 55 60

Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys

65 70 75 80

Glu Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu

85 90 95

Leu Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp

100 105 110

Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala

115 120 125

Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg

130 135 140

Lys Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile

145 150 155 160

Gln Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met

165 170 175

Trp Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser

180 185 190

Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu

195 200 205

Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala

210 215 220

Ser Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu

225 230 235 240

Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser

245 250 255

Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe

260 265 270

Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro

275 280 285

Asp Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys

290 295 300

Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val

305 310 315 320

Ser Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln

325 330 335

Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu

340 345 350

Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val

355 360 365

Val Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp

370 375 380

Tyr Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp

385 390 395 400

Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr

405 410 415

Asp Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe

420 425 430

Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln

435 440 445

Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr

450 455 460

Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro

465 470 475 480

Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg

485 490 495

Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val

500 505 510

His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys

515 520 525

Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala

530 535 540

Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp

545 550 555 560

Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr

565 570 575

Ser Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys

580 585 590

Glu Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr

595 600 605

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser

610 615 620

Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu

625 630 635 640

Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn

645 650 655

Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Lys Thr Tyr

660 665 670

Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr

675 680 685

Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln

690 695 700

Phe Lys Glu Val Glu Val Asn Leu Arg Lys Lys Arg Val Gln Thr Val

705 710 715 720

Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys

725 730 735

Asn Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val

740 745 750

Ala Cys Thr Asp His His Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln

755 760 765

Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro

770 775 780

Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro

785 790 795 800

Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser

805 810 815

Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala

820 825 830

Ala His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly

835 840 845

Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe Asp

850 855 860

Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr

865 870 875 880

Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys Asn Ser Lys

885 890 895

Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly

900 905 910

Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln Thr Lys Ala Phe Val

915 920 925

Arg Glu Val Asn Gly Gly Val Ala Gln Asn Ser Asp Leu Val Arg Val

930 935 940

Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val

945 950 955 960

Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Lys Ser Gly

965 970 975

Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys

980 985 990

Ser Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu

995 1000 1005

Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg

1010 1015 1020

Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr

1025 1030 1035

Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val

1040 1045 1050

Gly Val Leu Gly Asp Leu Arg Leu Val Lys Gln Glu Thr Arg Arg

1055 1060 1065

Ile Phe Asn Arg

1070

<210> 28

<211> 21

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 28

gucauaguuc caugaaagcc a 21

<210> 29

<211> 85

<212> RNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 29

uggcuuugau guuucuauga uaaggguuuc ggcccguggc gucggggauc gccugcccau 60

uccgaugggc uucuccccau uuauu 85

<210> 30

<211> 140

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 30

gagcggacag cagcuuccua uaucucguac gucauaguuc caugaaagcc aaaaguggcu 60

uugauguuuc uaugauaagg guuucggccc guggcgucgg ggaucgccug cccauuccga 120

ugggcuucuc cccauuuauu 140

<210> 31

<211> 140

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 31

ccaugauaua gacguugugg cuguuguagu gucauaguuc caugaaagcc aaaaguggcu 60

uugauguuuc uaugauaagg guuucggccc guggcgucgg ggaucgccug cccauuccga 120

ugggcuucuc cccauuuauu 140

<210> 32

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(4)

<223> a, c, t, g, 未知或其他

<400> 32

nnrncc 6

<210> 33

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 33

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 34

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 34

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 35

<211> 135

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 35

nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauga aagccaaaag uggcuuugau 60

guuucuauga uaaggguuuc ggcccguggc gucggggauc gccugcccau uccgaugggc 120

uucuccccau uuauu 135

<210> 36

<211> 1337

<212> PRT

<213> 肠球菌属(Enterococcus)的种

<220>

<221> 来源

<223> /注="APG05459.1"

<400> 36

Met Lys Lys Asp Tyr Val Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Met Thr Glu Asp Tyr Gln Leu Val Lys Lys Lys Met

20 25 30

Pro Ile Tyr Gly Asn Thr Glu Lys Lys Lys Ile Lys Lys Asn Phe Trp

35 40 45

Gly Val Arg Leu Phe Glu Glu Gly His Thr Ala Glu Asp Arg Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Ile Ser Arg Arg Arg Asn Arg Leu Arg

65 70 75 80

Tyr Leu Gln Ala Phe Phe Glu Glu Ala Met Thr Ala Leu Asp Glu Asn

85 90 95

Phe Phe Ala Arg Leu Gln Glu Ser Phe Leu Val Pro Glu Asp Lys Lys

100 105 110

Trp His Arg His Pro Ile Phe Ala Lys Leu Glu Asp Glu Val Ala Tyr

115 120 125

His Glu Thr Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp

130 135 140

Ser Ser Glu Gln Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Ile Val Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Lys Leu Ser Thr

165 170 175

Glu Asn Ile Ser Val Lys Glu Gln Phe Gln Gln Phe Met Ile Ile Tyr

180 185 190

Asn Gln Thr Phe Val Asn Gly Glu Ser Arg Leu Val Ser Ala Pro Leu

195 200 205

Pro Glu Ser Val Leu Ile Glu Glu Glu Leu Thr Glu Lys Ala Ser Arg

210 215 220

Thr Lys Lys Ser Glu Lys Val Leu Gln Gln Phe Pro Gln Glu Lys Ala

225 230 235 240

Asn Gly Leu Phe Gly Gln Phe Leu Lys Leu Met Val Gly Asn Lys Ala

245 250 255

Asp Phe Lys Lys Val Phe Gly Leu Glu Glu Glu Ala Lys Ile Thr Tyr

260 265 270

Ala Ser Glu Ser Tyr Glu Glu Asp Leu Glu Gly Ile Leu Ala Lys Val

275 280 285

Gly Asp Glu Tyr Ser Asp Val Phe Leu Ala Ala Lys Asn Val Tyr Asp

290 295 300

Ala Val Glu Leu Ser Thr Ile Leu Ala Asp Ser Asp Lys Lys Ser His

305 310 315 320

Ala Lys Leu Ser Ser Ser Met Ile Val Arg Phe Thr Glu His Gln Glu

325 330 335

Asp Leu Lys Lys Phe Lys Arg Phe Ile Arg Glu Asn Cys Pro Asp Glu

340 345 350

Tyr Asp Asn Leu Phe Lys Asn Glu Gln Lys Asp Gly Tyr Ala Gly Tyr

355 360 365

Ile Ala His Ala Gly Lys Val Ser Gln Leu Lys Phe Tyr Gln Tyr Val

370 375 380

Lys Lys Ile Ile Gln Asp Ile Ala Gly Ala Glu Tyr Phe Leu Glu Lys

385 390 395 400

Ile Ala Gln Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly

405 410 415

Val Ile Pro His Gln Ile His Leu Ala Glu Leu Gln Ala Ile Ile His

420 425 430

Arg Gln Ala Ala Tyr Tyr Pro Phe Leu Lys Glu Asn Gln Glu Lys Ile

435 440 445

Glu Gln Leu Val Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ser

450 455 460

Lys Gly Asp Ala Ser Thr Phe Ala Trp Leu Lys Arg Gln Ser Glu Glu

465 470 475 480

Pro Ile Arg Pro Trp Asn Leu Gln Glu Thr Val Asp Leu Asp Gln Ser

485 490 495

Ala Thr Ala Phe Ile Glu Arg Met Thr Asn Phe Asp Thr Tyr Leu Pro

500 505 510

Ser Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Lys Phe Met

515 520 525

Val Phe Asn Glu Leu Thr Lys Ile Ser Tyr Thr Asp Asp Arg Gly Ile

530 535 540

Lys Ala Asn Phe Ser Gly Lys Glu Lys Glu Lys Ile Phe Asp Tyr Leu

545 550 555 560

Phe Lys Thr Arg Arg Lys Val Lys Lys Lys Asp Ile Ile Gln Phe Tyr

565 570 575

Arg Asn Glu Tyr Asn Thr Glu Ile Val Thr Leu Ser Gly Leu Glu Glu

580 585 590

Asp Gln Phe Asn Ala Ser Phe Ser Thr Tyr Gln Asp Leu Leu Lys Cys

595 600 605

Gly Leu Thr Arg Ala Glu Leu Asp His Pro Asp Asn Ala Glu Lys Leu

610 615 620

Glu Asp Ile Ile Lys Ile Leu Thr Ile Phe Glu Asp Arg Gln Arg Ile

625 630 635 640

Arg Thr Gln Leu Ser Thr Phe Lys Gly Gln Phe Ser Ala Glu Val Leu

645 650 655

Lys Lys Leu Glu Arg Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys

660 665 670

Lys Leu Ile Asn Gly Ile Tyr Asp Lys Glu Ser Gly Lys Thr Ile Leu

675 680 685

Asp Tyr Leu Ile Lys Asp Asp Gly Val Ser Lys His Tyr Asn Arg Asn

690 695 700

Phe Met Gln Leu Ile Asn Asp Ser Gln Leu Ser Phe Lys Asn Ala Ile

705 710 715 720

Gln Lys Ala Gln Ser Ser Glu His Glu Glu Thr Leu Ser Glu Thr Val

725 730 735

Asn Glu Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Tyr Gln Ser

740 745 750

Leu Lys Ile Val Asp Glu Leu Val Ala Ile Met Gly Tyr Ala Pro Lys

755 760 765

Arg Ile Val Val Glu Met Ala Arg Glu Asn Gln Thr Thr Ser Thr Gly

770 775 780

Lys Arg Arg Ser Ile Gln Arg Leu Lys Ile Val Glu Lys Ala Met Ala

785 790 795 800

Glu Ile Gly Ser Asn Leu Leu Lys Glu Gln Pro Thr Thr Asn Glu Gln

805 810 815

Leu Arg Asp Thr Arg Leu Phe Leu Tyr Tyr Met Gln Asn Gly Lys Asp

820 825 830

Met Tyr Thr Gly Asp Glu Leu Ser Leu His Arg Leu Ser His Tyr Asp

835 840 845

Ile Asp His Ile Ile Pro Gln Ser Phe Met Lys Asp Asp Ser Leu Asp

850 855 860

Asn Leu Val Leu Val Gly Ser Thr Glu Asn Arg Gly Lys Ser Asp Asp

865 870 875 880

Val Pro Ser Lys Glu Val Val Lys Asp Met Lys Ala Tyr Trp Glu Lys

885 890 895

Leu Tyr Ala Ala Gly Leu Ile Ser Gln Arg Lys Phe Gln Arg Leu Thr

900 905 910

Lys Gly Glu Gln Gly Gly Leu Thr Leu Glu Asp Lys Ala His Phe Ile

915 920 925

Gln Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Gly

930 935 940

Ile Leu Asp Gln Arg Tyr Asn Ala Asn Ser Lys Glu Lys Lys Val Gln

945 950 955 960

Ile Ile Thr Leu Lys Ala Ser Leu Thr Ser Gln Phe Arg Ser Ile Phe

965 970 975

Gly Leu Tyr Lys Val Arg Glu Val Asn Asp Tyr His His Gly Gln Asp

980 985 990

Ala Tyr Leu Asn Cys Val Val Ala Thr Thr Leu Leu Lys Val Tyr Pro

995 1000 1005

Asn Leu Ala Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys Phe Gln

1010 1015 1020

Ala Phe Lys Glu Asn Lys Ala Thr Ala Lys Thr Ile Ile Tyr Thr

1025 1030 1035

Asn Leu Met Arg Phe Phe Thr Glu Asp Glu Pro Arg Phe Met Lys

1040 1045 1050

Asp Gly Glu Ile Leu Trp Ser Asn Ser Tyr Leu Lys Asn Ile Lys

1055 1060 1065

Lys Glu Leu Asn Tyr His Gln Met Asn Ile Val Lys Lys Val Glu

1070 1075 1080

Val Gln Lys Gly Gly Phe Ser Lys Glu Ser Ile Lys Pro Lys Gly

1085 1090 1095

Pro Ser Asn Lys Leu Ile Pro Val Lys Asn Gly Leu Asp Pro Gln

1100 1105 1110

Lys Tyr Gly Gly Phe Asp Ser Pro Val Val Ala Tyr Thr Val Leu

1115 1120 1125

Phe Thr His Glu Lys Gly Lys Lys Pro Leu Ile Lys Gln Glu Ile

1130 1135 1140

Leu Gly Ile Thr Ile Met Glu Lys Thr Arg Phe Glu Gln Asn Pro

1145 1150 1155

Ile Leu Phe Leu Glu Glu Lys Gly Phe Leu Arg Pro Arg Val Leu

1160 1165 1170

Met Lys Leu Pro Lys Tyr Thr Leu Tyr Glu Phe Pro Glu Gly Arg

1175 1180 1185

Arg Arg Leu Leu Ala Ser Ala Lys Glu Ala Gln Lys Gly Asn Gln

1190 1195 1200

Met Val Leu Pro Glu His Leu Leu Thr Leu Leu Tyr His Ala Lys

1205 1210 1215

Gln Cys Leu Leu Pro Asn Gln Ser Glu Ser Leu Ala Tyr Val Glu

1220 1225 1230

Gln His Gln Pro Glu Phe Gln Glu Ile Leu Glu Arg Val Val Asp

1235 1240 1245

Phe Ala Glu Val His Thr Leu Ala Lys Ser Lys Val Gln Gln Ile

1250 1255 1260

Val Lys Leu Phe Glu Ala Asn Gln Thr Ala Asp Val Lys Glu Ile

1265 1270 1275

Ala Ala Ser Phe Ile Gln Leu Met Gln Phe Asn Ala Met Gly Ala

1280 1285 1290

Pro Ser Thr Phe Lys Phe Phe Gln Lys Asp Ile Glu Arg Ala Arg

1295 1300 1305

Tyr Thr Ser Ile Lys Glu Ile Phe Asp Ala Thr Ile Ile Tyr Gln

1310 1315 1320

Ser Thr Thr Gly Leu Tyr Glu Thr Arg Arg Lys Val Val Asp

1325 1330 1335

<210> 37

<211> 16

<212> RNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 37

guuuuagagu cauguu 16

<210> 38

<211> 74

<212> RNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 38

aacauagcaa guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg 60

cgcuuuuuuu guuu 74

<210> 39

<211> 124

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 39

gagcggacag cagcuuccua uaucucguac guuuuagagu cauguuaaag aacauagcaa 60

guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg cgcuuuuuuu 120

guuu 124

<210> 40

<211> 124

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 40

ccaugauaua gacguugugg cuguuguagu guuuuagagu cauguuaaag aacauagcaa 60

guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg cgcuuuuuuu 120

guuu 124

<210> 41

<211> 3

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(1)

<223> a, c, t, g, 未知或其他

<400> 41

ngg 3

<210> 42

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 42

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 43

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 43

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 44

<211> 119

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 44

nnnnnnnnnn nnnnnnnnnn nnnnnguuuu agagucaugu uaaagaacau agcaaguuaa 60

aauaagguuu uaaccguaau caacuguaaa guggcgcugu uucggcgcuu uuuuuguuu 119

<210> 45

<211> 1436

<212> PRT

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="APG04583.1"

<400> 45

Met Ala Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly

1 5 10 15

Trp Ala Leu Val Gln Gln Asp Phe Glu Asn Lys Glu Gly Asn Ile Leu

20 25 30

Gly Met Gly Ser Arg Ile Ile Pro Met Ser Gln Asp Ile Leu Gly Glu

35 40 45

Phe Gly Lys Gly Asn Ser Ile Ser Gln Thr Ala Glu Arg Thr Gly Tyr

50 55 60

Arg Gly Val Arg Arg Leu Arg Glu Arg His Leu Leu Arg Arg Glu Arg

65 70 75 80

Leu His Arg Val Leu His Leu Leu Gly Phe Leu Pro Lys His Tyr Asp

85 90 95

Glu Lys Ile Asp Phe Thr Gln Arg Phe Gly Lys Phe Ile Asn Gln Ala

100 105 110

Glu Pro Lys Leu Ala Phe Asp Ser Glu Phe Leu Phe Lys Asp Ser Phe

115 120 125

His Glu Met Leu Ala Asp Phe Lys Gln Asn Gln Pro Glu Phe Leu Lys

130 135 140

Asp Lys Asn Gly Glu Asp Cys Leu Val Pro Tyr Asp Trp Thr Ile Tyr

145 150 155 160

Tyr Leu Arg Lys Lys Ala Leu Thr Gln Lys Ile Glu Lys Tyr Glu Leu

165 170 175

Ala Trp Leu Ile Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu

180 185 190

Arg Gly Glu Glu Glu Lys Glu Asn Pro Asn Lys Leu Val Gly Phe His

195 200 205

Ser Leu Lys Ile Val Asp Val Ile Pro Asp Ala Glu Thr Asn Lys Lys

210 215 220

Gly Glu Thr Trp Tyr Ser Leu His Leu Glu Asn Gly Trp Val Tyr Arg

225 230 235 240

Arg Ser Ser Lys Ile Ser Leu Ala Asp Trp Lys Asp Lys Val Arg Asp

245 250 255

Phe Ile Val Thr Thr Asp Leu Asn Asp Asp Gly Ser Glu Lys Leu Asp

260 265 270

Lys Asp Gly Ile Val Lys Arg Ser Phe Arg Ala Pro Ser Ala Asp Asp

275 280 285

Trp Thr Leu Leu Lys Lys Lys Thr Glu Lys Asp Ile Asp Asn Ser Asn

290 295 300

Lys Thr Val Gly Thr Tyr Ile Tyr Asp Asn Leu Leu Leu Asn Pro Lys

305 310 315 320

Gln Lys Ile Lys Gly Lys Met Val Arg Thr Ile Glu Arg Lys Phe Tyr

325 330 335

Lys Gln Glu Leu Glu Gln Ile Leu Lys Thr Gln Lys Glu Phe His Ser

340 345 350

Glu Leu Gln Ser Glu Asn Leu Leu Gln Asp Cys Val Arg Glu Leu Tyr

355 360 365

Arg Asn Asn Glu Gln His Gln Gln Met Leu Glu Ala Lys Asp Phe Val

370 375 380

His Leu Phe Leu Asn Asp Ile Ile Phe Tyr Gln Arg Pro Leu Arg Ser

385 390 395 400

Gln Lys Ser Ser Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Ser Lys

405 410 415

Asn Glu Asn Gly Glu Glu Val Ile His Arg Leu Lys Val Ile Ala Lys

420 425 430

Ser Asn Pro Tyr Tyr Gln Glu Phe Arg Leu Leu Gln Trp Val Gln Asn

435 440 445

Leu Ala Ile Tyr Thr Lys Asp Asp Asp Lys Asn Val Thr Asn Glu Phe

450 455 460

Leu Lys Ser Thr Gln Asp Trp Glu Asp Leu Leu Arg Trp Leu His Ser

465 470 475 480

Lys Lys Glu Ile Lys Gln Asp Ala Leu Ile Lys Phe Leu Ile Glu Lys

485 490 495

Lys Gly Leu Lys Gly Lys Ala Leu Thr Ile Glu Val Ala Lys Tyr Arg

500 505 510

Trp Asn Tyr Val Gln Asp Lys Asp Tyr Pro Gly Asn Glu Thr Arg Tyr

515 520 525

Leu Ile Gln Ser Arg Leu Asp Lys Val Glu Tyr Ala Pro Lys Asp Phe

530 535 540

Leu Thr Tyr Glu Asn Glu Met Ala Leu Trp His Ile Ile Tyr Ser Ile

545 550 555 560

Asn Asp Lys Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Asn Lys

565 570 575

Lys Gly Leu Asp Glu Val Thr Phe Val Glu Ala Phe Lys Lys Phe Pro

580 585 590

Pro Phe Lys Ser Asp Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys Lys

595 600 605

Leu Leu Pro Leu Met Arg Phe Gly Thr Gln Trp Asn Trp Asp Asn Ile

610 615 620

Asp Gln Asn Ser Lys Glu Arg Ile Gly Lys Ile Leu Thr Gly Glu Tyr

625 630 635 640

Asp Glu Asn Ile Lys Gly Arg Val Arg Glu Lys Ala Arg His Leu Asn

645 650 655

Ser Glu Thr Asp Phe Gln Ala Leu Pro Leu Trp Leu Ala Gln Tyr Val

660 665 670

Val Tyr Gly Arg His Ser Glu Ala Asp Ile Ala Gly Lys Trp Asn Ser

675 680 685

Val Asp Asp Leu Lys Gln Phe Leu Asp Asp Phe Lys Gln His Ser Leu

690 695 700

Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Ala Val

705 710 715 720

Lys Asp Ile Trp Asn Phe Tyr Gly Lys Gly Ala Lys Asp Phe Phe Ser

725 730 735

Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Asn Thr Ala Asp Glu

740 745 750

Arg Lys Arg Ile Thr Thr Met Val Thr Asp Asn Glu Asn Thr Asn Leu

755 760 765

Arg Ile Lys Ala Leu Leu Ala Glu Met Ala Leu Asp Gln Asn Val Asp

770 775 780

Asn Val Arg Pro Tyr Ser Pro Met Gln Gln Glu Ile Leu Lys Ile Tyr

785 790 795 800

Glu Glu Gly Val Leu Asn Ala Glu Glu Asn Ile Asp Asp Asp Ile Leu

805 810 815

Lys Ile Ser Lys Thr Ala Gln Pro Ser Ala Thr Asp Leu Lys Arg Tyr

820 825 830

Lys Leu Trp Leu Glu Gln Lys Tyr Arg Ser Pro Tyr Thr Gly Gln Met

835 840 845

Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His Ile

850 855 860

Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Met Ser Asn Lys Val Ile

865 870 875 880

Cys Glu Ala Ala Val Asn Lys Leu Lys Asp Asn Gln Ile Gly Leu Val

885 890 895

Phe Ile Lys Asn His His Gly Glu Val Val Asp Phe Gly Met Gly Lys

900 905 910

Gln Val Lys Ile Leu Glu Val Ser Asp Tyr Glu Asp Phe Val Lys Gln

915 920 925

Asn Tyr Asn Lys Asn Arg Gly Lys Arg Asn Lys Leu Leu Leu Glu Asp

930 935 940

Ile Pro Glu Lys Met Ile Glu Arg Gln Leu Asn Asp Thr Arg Tyr Ile

945 950 955 960

Ser Lys Tyr Ile Thr Gln Val Leu Ser Asn Ile Val Arg Asp Asp Lys

965 970 975

Glu Gly Ser Lys Asp Asp Gly Val Asn Ser Lys Asn Ile Val Pro Gly

980 985 990

Asn Gly Lys Ile Thr Thr Arg Leu Lys Gln Asp Trp Gly Leu Asn Asp

995 1000 1005

Val Trp Asn Asp Leu Val Leu Pro Arg Phe Glu Arg Met Asn Thr

1010 1015 1020

Leu Thr Asn Ser Asn Asp Phe Thr Ser Lys Asn Thr His Gly Lys

1025 1030 1035

Thr Ile Pro Thr Val Pro Ile Glu Leu Ser Lys Gly Phe Ser Lys

1040 1045 1050

Lys Arg Ile Asp His Arg His His Ala Met Asp Ala Leu Val Ile

1055 1060 1065

Ala Cys Ala Thr Arg Asp His Val Asn Leu Leu Asn Asn Glu Ser

1070 1075 1080

Ser Lys Ser Asp Thr Lys Arg Tyr Asp Leu Asn Arg Lys Leu Arg

1085 1090 1095

Lys Tyr Glu Lys Val Ala Tyr Asn Asp Pro Lys Thr Gly Glu Arg

1100 1105 1110

Ile Glu Lys Glu Val Pro Lys Asp Phe Ile Lys Pro Trp Glu Thr

1115 1120 1125

Phe Thr Glu Asp Thr Arg Thr Leu Leu Glu Asn Ile Val Ile Ser

1130 1135 1140

Phe Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr

1145 1150 1155

Glu Lys Ile Glu Asn Gly Lys Lys Val Lys Val Glu Gln Lys Gly

1160 1165 1170

Ile Asn Trp Ala Val Arg Lys Ala Leu His Lys Glu Thr Val Ser

1175 1180 1185

Gly Gln Val His Leu Asp Arg Ile Lys Val Ala Lys Gly Lys Ile

1190 1195 1200

Leu Thr Ala Thr Arg Lys Thr Leu Asp Ala Ser Phe Asn Glu Lys

1205 1210 1215

Thr Ile Glu Ser Ile Thr Asp Thr Gly Ile Gln Lys Ile Leu Leu

1220 1225 1230

Asn Tyr Leu Lys Ser Lys Asp Asn Asn Pro Glu Val Ala Phe Ser

1235 1240 1245

Pro Glu Gly Ile Glu Glu Leu Asn Lys Asn Ile Arg Leu Tyr Asn

1250 1255 1260

Asp Gly Lys Ala His Gln Pro Ile Leu Lys Val Arg Val Phe Glu

1265 1270 1275

Gln Gly Ser Lys Phe Thr Leu Gly Glu Thr Gly Asn Lys Thr Thr

1280 1285 1290

Lys Phe Val Glu Ala Ala Lys Gly Thr Asn Leu Phe Phe Gly Ile

1295 1300 1305

Tyr Glu Asp Lys Ser Gly Lys Arg Ser Tyr Glu Thr Ile Pro Leu

1310 1315 1320

Asn Ile Val Ile Glu Arg Gln Lys Gln Gly Leu Gln Ala Val Pro

1325 1330 1335

Glu Thr Asn Glu Lys Gly Lys Gln Leu Leu Phe Thr Leu Ser Pro

1340 1345 1350

Asn Asp Leu Val Tyr Val Pro Glu Glu Gly Val Phe Asp Glu Asn

1355 1360 1365

Asn Ile Lys Val Asp Arg Ile Tyr Lys Val Val Ser Phe Ser Thr

1370 1375 1380

Tyr Gln Cys Phe Phe Val Arg Asn Asp Val Ser Thr Ser Val Val

1385 1390 1395

Asn Lys Val Glu Tyr Ser Ala Leu Asn Lys Met Glu Lys Ser Ile

1400 1405 1410

Asp Asn Ile Met Ile Lys Glu Asn Cys Val Lys Leu Asn Val Asp

1415 1420 1425

Arg Leu Gly Lys Ile Ser Lys Ala

1430 1435

<210> 46

<211> 16

<212> RNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 46

guugugaguu ccuuuc 16

<210> 47

<211> 78

<212> RNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 47

gaaaggaacu cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu 60

cggggcuuuu uuauuuuu 78

<210> 48

<211> 128

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 48

gagcggacag cagcuuccua uaucucguac guugugaguu ccuuucacuu gaaaggaacu 60

cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu cggggcuuuu 120

uuauuuuu 128

<210> 49

<211> 128

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 49

ccaugauaua gacguugugg cuguuguagu guugugaguu ccuuucacuu gaaaggaacu 60

cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu cggggcuuuu 120

uuauuuuu 128

<210> 50

<211> 7

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<400> 50

nnraaty 7

<210> 51

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 51

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 52

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 52

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 53

<211> 123

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 53

nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaguuccuuu caaaggaaag gaacucacaa 60

uaaggauuau uccguuguga aaacauuuag cgccucgacu aucuucgggg cuuuuuuauu 120

uuu 123

<210> 54

<211> 1456

<212> PRT

<213> 稳杆菌属(Empedobacter)的种

<220>

<221> 来源

<223> /注="APG01688.1"

<400> 54

Met Met Ile Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile

1 5 10 15

Gly Trp Ala Leu Ile Lys Gln Asp Phe Glu Asn Lys His Gly Glu Ile

20 25 30

Leu Gly Met Gly Ser Arg Ile Ile Pro Met Ser Gln Asp Ile Leu Gly

35 40 45

Asp Phe Gly Lys Gly Asn Ser Ile Ser Gln Thr Ala Asp Arg Thr Lys

50 55 60

Tyr Arg Ser Val Arg Arg Leu Arg Glu Arg Phe Leu Leu Arg Arg Glu

65 70 75 80

Arg Leu His Arg Val Leu His Leu Leu Asn Phe Leu Pro Gln His Tyr

85 90 95

Ala Ser Gln Ile Asp Phe Glu Lys Lys Phe Gly Lys Phe Lys Ser Glu

100 105 110

Thr Glu Pro Lys Leu Ala Trp Glu Asn Trp Gly Gly Lys Phe Ser Phe

115 120 125

Leu Phe Gln Asn Ser Phe Asn Glu Met Leu Glu Asp Phe Lys Ala Ala

130 135 140

Gly Gln Gly Leu Lys Ile Pro Tyr Asp Trp Thr Ile Tyr Tyr Leu Arg

145 150 155 160

Lys Lys Ala Leu Ser Gln Lys Ile Glu Lys Glu Glu Leu Ala Trp Ile

165 170 175

Leu Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu Arg Gly Glu

180 185 190

Glu Glu Glu Glu Asn Pro Asn Lys Leu Val Glu Phe Tyr Ser Leu Lys

195 200 205

Ile Val Asp Val Val Ala Asp Glu Pro Gln Lys Gly Lys Ser Asp Ile

210 215 220

Trp Tyr Ser Leu Ile Leu Glu Asn Gly Trp Val Tyr Arg Arg Ala Ser

225 230 235 240

Lys Ile Pro Leu Phe Asp Trp Lys Asp Lys Thr Arg Asp Phe Ile Val

245 250 255

Thr Thr Asp Leu Asn Asp Asp Arg Ser Val Lys Thr Asp Lys Glu Gly

260 265 270

Asn Glu Lys Arg Ser Phe Arg Ala Pro Ser Glu Asn Asp Trp Thr Leu

275 280 285

Val Lys Lys Lys Thr Glu Gln Glu Ile Asp Gln Ser His Lys Thr Val

290 295 300

Gly Thr Tyr Ile Tyr Glu Thr Leu Leu Leu Asn Pro Lys Gln Lys Ile

305 310 315 320

Lys Gly Lys Leu Val Arg Thr Ile Glu Arg Lys Phe Tyr Lys Asp Glu

325 330 335

Leu Lys Gln Ile Leu Glu Lys Gln Lys Glu Phe His Gln Glu Leu Lys

340 345 350

Asn Asp Asp Leu Tyr Asn Asp Cys Ile Arg Glu Leu Tyr Arg Asn Asn

355 360 365

Glu Ala His Gln Leu Thr Leu Ser Lys Lys Asp Phe Val His Leu Leu

370 375 380

Met Asp Asp Leu Ile Phe Tyr Gln Arg Pro Leu Arg Ser Gln Lys Ser

385 390 395 400

Ser Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Tyr Lys Asp Glu Asn

405 410 415

Gly Ile Glu His Thr Gln Tyr Leu Lys Ala Ile Pro Lys Ser Asn Pro

420 425 430

Tyr Tyr Gln Glu Phe Arg Leu Trp Gln Trp Met Tyr Asn Leu Asn Ile

435 440 445

Tyr Arg Lys Asp Asp Glu Ala Asn Val Thr Lys Glu Phe Leu Asn Thr

450 455 460

Asn Lys Asp Phe Glu Ser Leu Phe Glu Phe Leu Asn Asn Arg Lys Glu

465 470 475 480

Ile Glu Gln Lys Pro Leu Ile Lys Phe Leu Leu Glu Gln Lys Asp Ile

485 490 495

Asn Lys Lys Leu Leu Asn Ala Glu Ala Glu Lys Tyr Arg Trp Asn Tyr

500 505 510

Val Glu Asp Lys Lys Tyr Pro Cys Asn Glu Thr Lys Thr Met Ile Ser

515 520 525

Ser Arg Leu Asp Lys Val Glu Asn Ile Ser Asp Asp Phe Leu Thr Arg

530 535 540

Asp Ile Glu Gln Lys Ile Trp His Ile Ile Tyr Ser Val Asn Asp Lys

545 550 555 560

Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Thr Arg Asn Asp Leu

565 570 575

Asp Glu Asn Ser Phe Ile Glu Ala Phe Lys Lys Phe Ser Pro Phe Lys

580 585 590

Ser Glu Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys Lys Leu Leu Pro

595 600 605

Leu Met Arg Leu Gly Lys Tyr Trp Tyr Glu Asp Glu Ile Val Lys His

610 615 620

Ser Asp Ile Tyr Phe Lys Asn Ile Glu Asn Leu Leu Gly Asp Phe Ser

625 630 635 640

Asn Arg Asp Lys Lys Ile Ser Glu Glu Asp Lys Glu Lys Trp Asn Lys

645 650 655

Ser Ile Asn Leu Lys Leu Gln Glu Glu Leu Lys Asp Phe Gln Thr Ala

660 665 670

Glu Ile Asp Leu Phe Gln Gly Leu Arg Leu His Ile Ala Gln Tyr Leu

675 680 685

Val Tyr Gly Arg His Ser Glu Ala Ser Met Ile Gly Lys Trp Asn Ser

690 695 700

Ala Glu Asp Leu Glu Glu Phe Leu Lys Asp Phe Lys Gln His Ser Leu

705 710 715 720

Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Val Val

725 730 735

Lys Asp Ile Trp Leu Lys Tyr Gly Asn Gly Ala Lys Asp Phe Phe Asn

740 745 750

Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Leu Pro Ala Asp Asp

755 760 765

Arg Lys Lys Leu Thr Asn Gln Ile Ser Glu Asn Glu Asn Thr Asn Phe

770 775 780

Arg Ile Lys Ala Leu Leu Ala Glu Met Met Asn Asp Ser Ser Val Glu

785 790 795 800

Asn Val Arg Pro Phe Ser Pro Met Gln Gln Glu Ile Leu Lys Ile Tyr

805 810 815

Glu Asp Asp Val Leu Lys Ser Asp Ile Glu Ile Glu Asp Asp Ile Leu

820 825 830

Lys Ile Ser Lys Thr Ala Gln Pro Ser Pro Ser Asp Leu Lys Arg Tyr

835 840 845

Lys Leu Trp Leu Glu Gln Lys Tyr Lys Ser Pro Tyr Thr Gly Gln Ile

850 855 860

Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His Ile

865 870 875 880

Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Phe Ser Asn Lys Val Ile

885 890 895

Cys Glu Ser Ala Val Asn Lys Leu Lys Asp Asn Tyr Ile Gly Leu Glu

900 905 910

Phe Ile Lys Gln Phe Gly Gly Thr Ile Ile Glu Leu Gly Phe Gly Lys

915 920 925

Ser Ile Lys Val Phe Glu Thr Lys Glu Tyr Glu Asp Phe Val Lys Lys

930 935 940

His Tyr Ala Asn Asn Gln Gly Lys Arg Asn Lys Leu Leu Met Glu Asp

945 950 955 960

Ile Pro Glu Lys Met Ile Glu Arg Gln Met Asn Asp Thr Arg Tyr Ile

965 970 975

Ser Lys Tyr Ile Ser Gly Val Leu Ser Asn Ile Val Arg Val Glu Asp

980 985 990

Gly Ser Asp Glu Gly Val Asn Ser Lys Asn Ile Val Pro Gly Asn Gly

995 1000 1005

Lys Ile Thr Thr Gln Leu Lys Gln Asp Trp Gly Leu Asn Asp Val

1010 1015 1020

Trp Asn Asp Leu Ile Leu Pro Arg Phe Glu Arg Met Asn Gln Leu

1025 1030 1035

Thr Asn Ser Lys Val Phe Thr Ala Trp Asn Glu Asn Tyr Gln Lys

1040 1045 1050

Phe Leu Pro Thr Val Pro Ile Glu Tyr Ser Lys Gly Phe Ser Lys

1055 1060 1065

Lys Arg Ile Asp His Arg His His Ala Leu Asp Ala Leu Val Ile

1070 1075 1080

Ala Cys Ala Thr Lys Asp His Val Asn Leu Leu Asn Asn Gln Ser

1085 1090 1095

Ala Lys Ser Asp Thr Lys Arg Tyr Asp Leu Lys Lys Lys Ser Met

1100 1105 1110

Lys Phe Glu Lys Val Val Tyr Asn Asp Ala Lys Thr Gly Glu Lys

1115 1120 1125

Ile Glu Arg Glu Val Pro Lys Gln Phe Leu Lys Pro Trp Glu Asn

1130 1135 1140

Phe Thr Leu Asp Val Lys His Asn Leu Glu Thr Ile Ile Val Ser

1145 1150 1155

Phe Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr

1160 1165 1170

Glu Lys Tyr Val Glu Lys Asp Gly Thr Lys Asn Lys Glu Arg Val

1175 1180 1185

Glu Gln Thr Gly Thr Asn Trp Ala Ile Arg Lys Pro Met His Lys

1190 1195 1200

Asp Thr Val Ser Gly Lys Val Asp Leu Pro Trp Val Lys Val Pro

1205 1210 1215

Lys Gly Lys Ile Leu Thr Ala Thr Arg Lys Ser Leu Asp Ser Ser

1220 1225 1230

Phe Asp Leu Lys Ser Ile Gly Ser Ile Thr Asp Thr Gly Ile Gln

1235 1240 1245

Lys Ile Leu Lys Asn Tyr Leu Ala Phe Lys Asp Gly Asn Pro Glu

1250 1255 1260

Leu Ala Phe Ser Pro Glu Gly Ile Asp Asp Leu Asn Lys Asn Ile

1265 1270 1275

Glu Lys Tyr Asn Asp Gly Lys Pro His Gln Pro Ile Asn Lys Val

1280 1285 1290

Arg Val Phe Glu Leu Gly Ser Lys Phe Gln Val Gly Gln Ser Gly

1295 1300 1305

Asn Lys Lys Asp Lys Tyr Val Glu Ala Ala Lys Gly Thr Asn Leu

1310 1315 1320

Phe Phe Ala Val Tyr Glu Asp Glu Lys Gly Lys Arg Asn Tyr Glu

1325 1330 1335

Thr Ile Pro Leu Asn Glu Val Ile Glu Arg Gln Lys Gln Gly Leu

1340 1345 1350

Ser Val Val Asp Leu Lys Gly Thr Asn Asp Phe Tyr Leu Cys Pro

1355 1360 1365

Asn Asp Phe Val Tyr Ile Pro Ser Gly Asp Glu Leu Glu Asn Ile

1370 1375 1380

Asn Asn Val Asp Phe Lys Asp Ile Lys Lys Glu Ile Asn Glu Arg

1385 1390 1395

Ile Tyr Lys Val Val Ser Phe Thr Gly Asn Arg Leu Ser Cys Ile

1400 1405 1410

Pro Tyr Met Val Ala Thr Thr Ile Val Asn Lys Leu Glu Phe Thr

1415 1420 1425

Gln Leu Asn Lys Ile Glu Phe Thr Lys Glu Lys Glu Ile Cys Ile

1430 1435 1440

Lys Leu Asn Val Asp Arg Leu Gly Asn Ile Ser Lys Ala

1445 1450 1455

<210> 55

<211> 18

<212> RNA

<213> 稳杆菌属的种

<220>

<221> 来源

<223> /注="crRNA"

<400> 55

guugugaauu gcuuucaa 18

<210> 56

<211> 75

<212> RNA

<213> 稳杆菌属的种

<220>

<221> 来源

<223> /注="tracrRNA"

<400> 56

uugaaaagca auucacaaua aggauuauuc cguugugaaa acauucaagg cggggcaacu 60

cgucuuuuuu cuuuu 75

<210> 57

<211> 127

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L1"

<400> 57

gagcggacag cagcuuccua uaucucguac guugugaauu gcuuucaaaa aguugaaaag 60

caauucacaa uaaggauuau uccguuguga aaacauucaa ggcggggcaa cucgucuuuu 120

uucuuuu 127

<210> 58

<211> 127

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA L2"

<400> 58

ccaugauaua gacguugugg cuguuguagu guugugaauu gcuuucaaaa aguugaaaag 60

caauucacaa uaaggauuau uccguuguga aaacauucaa ggcggggcaa cucgucuuuu 120

uucuuuu 127

<210> 59

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(5)

<223> a, c, t, g, 未知或其他

<400> 59

nnrnnc 6

<210> 60

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库1的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 60

gagcggacag cagcttccta tatctcgtac nnnnnnnn 38

<210> 61

<211> 38

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="质粒文库2的靶序列和PAM区域"

<220>

<221> 修饰的_碱基

<222> (31)..(38)

<223> a, c, t, g, 未知或其他

<400> 61

ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38

<210> 62

<211> 122

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="带有N's的sgRNA"

<220>

<221> 修饰的_碱基

<222> (1)..(25)

<223> a, c, u, g, 未知或其他

<400> 62

nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaauugcuuu caaaaaguug aaaagcaauu 60

cacaauaagg auuauuccgu ugugaaaaca uucaaggcgg ggcaacucgu cuuuuuucuu 120

uu 122

<210> 63

<211> 4

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="4bp接头"

<400> 63

aaag 4

<210> 64

<211> 4

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="4bp接头"

<400> 64

gaaa 4

<210> 65

<211> 4

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="4bp接头"

<400> 65

acuu 4

<210> 66

<211> 6

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="6bp接头"

<400> 66

caaagg 6

<210> 67

<211> 7

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<220>

<221> 来源

<223> /注="NLS"

<400> 67

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 68

<211> 6

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="tracrRNA发夹茎的碱基中的保守序列"

<220>

<221> 修饰的_碱基

<222> (2)..(2)

<223> a, c, u, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(5)

<223> a, c, u, g, 未知或其他

<400> 68

unanng 6

<210> 69

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="APG05083.1/示例性PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(4)

<223> a, c, t, g, 未知或其他

<400> 69

nnrncc 6

<210> 70

<211> 7

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="APG07433.1/示例性PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(4)

<223> a, c, t, g, 未知或其他

<400> 70

nnnnccr 7

<210> 71

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="APG07513.1/示例性PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(4)

<223> a, c, t, g, 未知或其他

<400> 71

nnrncc 6

<210> 72

<211> 6

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="APG01688.1/示例性PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(2)

<223> a, c, t, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (5)..(5)

<223> a, c, t, g, 未知或其他

<400> 72

nnranc 6

<210> 73

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 73

gagcggacag cagcttccta tatctcgtac 30

<210> 74

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 74

gagcggacag cagcttccta tatctcgtag 30

<210> 75

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 75

gagcggacag cagcttccta tatctcgttc 30

<210> 76

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 76

gagcggacag cagcttccta tatctcgaac 30

<210> 77

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 77

gagcggacag cagcttccta tatctcctac 30

<210> 78

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 78

gagcggacag cagcttccta tatctggtac 30

<210> 79

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 79

gagcggacag cagcttccta tatcacgtac 30

<210> 80

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 80

gagcggacag cagcttccta tatgtcgtac 30

<210> 81

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 81

gagcggacag cagcttccta taactcgtac 30

<210> 82

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 82

gagcggacag cagcttccta tttctcgtac 30

<210> 83

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 83

gagcggacag cagcttccta aatctcgtac 30

<210> 84

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 84

gagcggacag cagcttcctt tatctcgtac 30

<210> 85

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 85

gagcggacag cagcttccaa tatctcgtac 30

<210> 86

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 86

gagcggacag cagcttcgta tatctcgtac 30

<210> 87

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 87

gagcggacag cagcttgcta tatctcgtac 30

<210> 88

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 88

gagcggacag cagctaccta tatctcgtac 30

<210> 89

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 89

gagcggacag cagcatccta tatctcgtac 30

<210> 90

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 90

gagcggacag caggttccta tatctcgtac 30

<210> 91

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 91

gagcggacag caccttccta tatctcgtac 30

<210> 92

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 92

gagcggacag ctgcttccta tatctcgtac 30

<210> 93

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 93

gagcggacag gagcttccta tatctcgtac 30

<210> 94

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 94

gagcggacac cagcttccta tatctcgtac 30

<210> 95

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 95

gagcggactg cagcttccta tatctcgtac 30

<210> 96

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 96

gagcggagag cagcttccta tatctcgtac 30

<210> 97

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 97

gagcggtcag cagcttccta tatctcgtac 30

<210> 98

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 98

gagcgcacag cagcttccta tatctcgtac 30

<210> 99

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 99

gagccgacag cagcttccta tatctcgtac 30

<210> 100

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 100

gaggggacag cagcttccta tatctcgtac 30

<210> 101

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 101

gaccggacag cagcttccta tatctcgtac 30

<210> 102

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 102

gtgcggacag cagcttccta tatctcgtac 30

<210> 103

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表4"

<400> 103

cagcggacag cagcttccta tatctcgtac 30

<210> 104

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 104

gagcggacag cagcttccta tatctcgtat 30

<210> 105

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 105

gagcggacag cagcttccta tatctcgtgc 30

<210> 106

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 106

gagcggacag cagcttccta tatctcgcac 30

<210> 107

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 107

gagcggacag cagcttccta tatctcatac 30

<210> 108

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 108

gagcggacag cagcttccta tatcttgtac 30

<210> 109

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 109

gagcggacag cagcttccta tatcccgtac 30

<210> 110

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 110

gagcggacag cagcttccta tatttcgtac 30

<210> 111

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 111

gagcggacag cagcttccta tacctcgtac 30

<210> 112

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 112

gagcggacag cagcttccta tgtctcgtac 30

<210> 113

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 113

gagcggacag cagcttccta catctcgtac 30

<210> 114

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 114

gagcggacag cagcttcctg tatctcgtac 30

<210> 115

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 115

gagcggacag cagcttccca tatctcgtac 30

<210> 116

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 116

gagcggacag cagcttctta tatctcgtac 30

<210> 117

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 117

gagcggacag cagctttcta tatctcgtac 30

<210> 118

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 118

gagcggacag cagctcccta tatctcgtac 30

<210> 119

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 119

gagcggacag cagcctccta tatctcgtac 30

<210> 120

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 120

gagcggacag cagtttccta tatctcgtac 30

<210> 121

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 121

gagcggacag caacttccta tatctcgtac 30

<210> 122

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 122

gagcggacag cggcttccta tatctcgtac 30

<210> 123

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 123

gagcggacag tagcttccta tatctcgtac 30

<210> 124

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 124

gagcggacaa cagcttccta tatctcgtac 30

<210> 125

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 125

gagcggacgg cagcttccta tatctcgtac 30

<210> 126

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="错配修复表6"

<400> 126

gagcggatag cagcttccta tatctcgtac 30

<210> 127

<211> 3210

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05083.1哺乳动物密码子优化的序列"

<400> 127

atgagagagc tggattaccg gatcggcctg gatatcggga ccaactccat tggatggggc 60

atcatcgagc tgtcttggaa caaagacaga gaacagtacg agaaggcaag aatcgtggac 120

aagggcgtga gaatgttcga caaggccgaa atacccaaga ccggagccag cctggccgag 180

cctagaagaa ttgccagatc aagcagaaga cggctcaaca gaaagtctca gagaaaaaaa 240

gatattcgga acctgctggt ccagcacgag atcatcagcc aaaaggaact cgctagcctg 300

tatcctctga ccaagagcag catggacatt tgggacatca gactggacgg cctggacaga 360

ctgctggata gattcgagtg gaccagattg ctgatccacc tggctcagcg gagaggcttc 420

aaaagcaacc ggaagagcga gctgaaggac gtggaaaccg gcaaggtgct ctccagcatc 480

caggctaatg agaagcggct gtccctgtac agaactgtgg gcgagatgtg gatgaagaat 540

gaagatttta gcaagtacga caaaagaaga aatagtagca acgaatacgt gttctctgtg 600

tcccgggccg acctggaaaa ggaaatcgtg acactgtttg aagctcagcg gaagttccag 660

agcagctatg ccagcgccga tcttcaaaaa acctacctcc agatctgggc ccatcaactg 720

cctttcgcct ctggcaacgc catcgttaac aaggtgggct actgcagcct actgaaaggc 780

aaggagaaga gagttcctaa ggccacctac accttccaat acttcagcac cctggatcag 840

atcaacagaa ccagactggg cccaaacttc cagcccttca ccaaggaaca gagagatgtg 900

atcctggacg agatgtttaa ccggaccgat tattacaaga agaagaccat ccctgaggtg 960

acgtactacg atatcagaaa atggctggcc ctggacgaga caatccagtt caagggcctg 1020

acctacgacc ctaatgaaga actgaagaaa attgagctaa agtcttttat caatctgaag 1080

cctttctacg agataaagaa ggtggtgaca aactacgcca agaagacaaa tgaggccttt 1140

agcacactgg actatgacac ctttgcctac gccctgacag tgtacaagac cgacaaggac 1200

atccgctcct acctgaaaaa gagtaacaac ctgtccaaat gctgctacga cgaccaactg 1260

atcgaggaat tgctgacact gagctacacc aaattcggcc acctgagctt caaggctatc 1320

aaccacgttc tgcctatcat gcaggagggc agaacctacc aggaggccat tcaccagctc 1380

ggctacgatg ccacaaacct caaaaaagag aaccggtcta tgttcctgcc tctgttccct 1440

gacgagatca ccaaccccat cgtgaagagg gccctgaccc aggccaggaa ggtggtcaac 1500

gccatcatca gacgatacgg gtctccaaac agcgtgcaca tcgagctggc cagagagctg 1560

agcaagagcc acgacgagag aacaaagatc atgaaagctc atgatgaaaa ctacaaaaag 1620

aacaagggcg ctatcagcat cctgatcgag aacggtattc tgaatcctac aggttatgac 1680

atcgtccggt acaagctgtg gaaggaacag ggcgagagat gcgcctattc tctgaaacag 1740

atccccgcca acaccttctt caacgaaatg aagaaggagc ggtccggcag ccctgtgctg 1800

gaaatcgatc acatcctgcc ctacagccag agcttcatcg acagctacca caacaaagtg 1860

ctggtgtacg gggatgagaa ccagaaaaag ggcaatagaa tcccgtacac ctacttcctg 1920

gaaggcaaca aggactggga gtctttcgag agctatgtgc gcctgaactc ctttttcagc 1980

aagaaaaagc gaggatatct gctgaagaag gcttacctgc caagagagag taacatgatc 2040

aaggaacggc acctcaacga cacccggtac gccagctcct acctgaagaa cttcatcgag 2100

aagaatctga agttcaagga ggtggaaggc tctacccgga agaagcacgt gcaaaccgtg 2160

aacggcataa tcacagccca cctgagaaag agatggggcc tggaaaagga ccgccaggag 2220

acatatcttc atcacgctat ggacgccatc atcgtggcat gcaccgacca ccacatggtg 2280

acaaaggtga ccgagtacta ccagatcaaa gaaagcaata aatctattag aaagccttac 2340

ttccccctgc cttgggtggg ctttagagag gaaattctgt cccacctggc tcggcagcct 2400

atcgccagaa agatctctga agagctgaag atcggatacc agagcttcga ttacatcctc 2460

gtgtctagaa tgcctaaaag atcagtgacc ggcgccgccc acgagcagac cattatgaaa 2520

aagggaggca tcgacaaaaa aggaaaaacc atcatcatta agcgggtcta cctgaaggat 2580

atcaagttcg acgagaatgg cgatttcaag atggttggaa aggaacagga cctggctacc 2640

tacgaggcca tcaagcagag atacatcgag tacggcaagg aatccaagaa ggccttcgag 2700

acccctctgt ataagcccag caagaaaggc aaaggcaacc tgatcaagaa gatcaaagtg 2760

gaagtgcaaa ccaagagctt tgtgagagaa gtcaacggcg gagtggccca gaacggcgat 2820

ctggtgcggg ttgacctgtt cgagaaggat aatagatact acatgatccc catctacgtg 2880

atggataccg tgcacagcga acttcctaac aaggccgtga ccagcagcaa aggctatgag 2940

caatggctga ccatcgacaa cagcttcacc ttcaagttca gcctataccc ctacgacctg 3000

gtgcggctgg tcaagggtaa cgaggacaga ttcctgtact tttccaccct ggatattaac 3060

agtgatagac tcaacttcaa agacgtcaac aagcccagca agcaggccga gaacagatat 3120

agcctgaaga caatcgaaaa cctggaaaaa tacgaggtgg gcgtcctggg cgacctcaga 3180

tttgtgagac aggagatcag aaagaacttc 3210

<210> 128

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07433.1哺乳动物密码子优化的序列"

<400> 128

atgagagagc tggactacag aattggcctg gacatcggca ccaacagcat cggatggggc 60

gtgatcgagc tgtcctggaa caaagaccgg gagagatacg agaaggtcag aatcgtggat 120

caaggcgtga gaatgttcga cagagccgag atgcccaaga caggcgccag cttagctgaa 180

cccagaagaa tcgccagatc cagcagacgg agactgaatc gcaagtccca gagaaagaaa 240

aacatccgga acctgctggt gcaacacggc gtgatcacac aggaggaact ggatagcctg 300

taccccctga gcaaaaagag catggacatc tggggcattc ggctcgacgg cctggacaga 360

ctcctcaatc atttcgagtg ggccagactg ctgatccacc tggctcagag acggggcttt 420

aagtccaaca gaaagagtga actgaaagat acagagacag gcaaggtgct gagcagcatc 480

caactgaacg agaaacggct gagcttgtat agaaccgtgg gcgagatgtg gatgaaggac 540

cccgacttct ctaaatacga taggaagaga aatagcccca acgaatacgt gttcagcgtg 600

tctagagccg agctggaaaa ggaaatcgtg accctgttcg ccgcccagcg gagattccag 660

agcccttacg ccagcaaaga tctgcaggag acatatctgc agatctggac ccaccaactg 720

cctttcgcca gcggcaatgc catcctgaac aaggtcggat actgctccct gttgaaaggc 780

aaagaaagaa ggattcccaa ggctacatac accttccaat acttctctgc tctggaccag 840

gtgaatcgga ccagactggg acctgatttc cagcccttca ccaaggagca acgggaaatt 900

atcttgaaca acatgttcca gaggacagat tactacaaga agaaaaccat ccccgaggtg 960

acctactatg acatacggaa gtggctggaa ttggacgaga caattcagtt caagggcctg 1020

aactacgacc ctaacgagga actgaagaag atcgagaaga agccttttat caatctgaag 1080

gccttctacg agatcaacaa ggtggtggcc aactacagcg aaagaaccaa cgagaccttc 1140

tccaccctgg actacgacgg catcggctac gccctgaccg tgtacaaaac cgacaaggat 1200

atccgcagct acctgaagag cagtcacaac ctacctaaga gatgctacga cgaccaactg 1260

atcgaggaac tgctgagcct gagctacaca aagttcggcc acctgtccct gaaagccatc 1320

aaccacgtgc tgtctatcat gcagaagggc aatacctaca aggaagccgt ggaccaactg 1380

ggctacgaca ccagcggcct taagaaggag aagaggtcca agttcctgcc acctatttct 1440

gatgaaatca cgaatccaat cgtgaaaagg gccctgaccc aggccagaaa agtggtgaac 1500

gccataatta gaagacacgg atctcctcac tccgtgcaca tcgagctggc cagagagctg 1560

agcaagaacc acgacgagcg gacaaagatc gtcagcgccc aggatgaaaa ctacaagaaa 1620

aacaagggcg ctatcagcat cctgtctgag cacggcatcc tgaaccctac aggctacgac 1680

atcgtgagat acaaactgtg gaaggagcag ggcgaacggt gcgcctacag cctgaaggaa 1740

atccctgccg atacattttt caacgagctg aagaaggaac gcaacggcgc ccctatcctt 1800

gaagtggacc acatcctgcc ctacagccag tccttcatcg actcctacca caacaaggtc 1860

ctggtgtaca gcgacgaaaa ccggaaaaag ggcaacagaa tcccttatac ctacttcctg 1920

gaaaccaaca aggattggga ggcctttgag cggtacgtgc ggagcaacaa attcttctcc 1980

aagaaaaagc gagagtacct tctgaagcgg gcttatctgc ctagagaatc tgagctgatc 2040

aaagaacgcc acctgaacga caccagatac gcctctacct tcctgaagaa cttcatcgag 2100

cagaacctgc agttcaagga agccgaggac aaccccagaa aaagacgggt gcaaaccgtg 2160

aacggcgtta tcaccgccca cttcagaaag cggtggggcc tggagaagga ccggcaggag 2220

acatacctcc atcacgctat ggacgccatc atcgtggctt gtacagacca ccacatggtc 2280

accagagtga ccgagtacta tcagatcaag gaaagcaaca agagcgtgaa gaagccctat 2340

tttcctatgc cttgggaagg cttccgggac gagctgctga gccacttggc ttctcagcct 2400

atcgccaaga aaatcagcga ggaactgaag gccggctacc agagcctgga ctacatcttc 2460

gtgtccagaa tgcctaagag aagcattaca ggcgctgctc ataagcagac catcatgcgg 2520

aagggaggaa ttgacaagaa gggcaaaaca atcatcatcg aacggctgca cctgaaggat 2580

atcaagttcg acgagaacgg agatttcaag atggtgggca aggaacagga catggccaca 2640

tacgaagcta ttaaacagag atacctggag cacggcaaga atagcaagaa ggccttcgag 2700

acccctctgt acaagcccag caaaaagggc acaggtaacc tgatcaagcg ggtgaaggtg 2760

gaaggacagg ccaagagctt tgtgagggaa gtgaacggcg gagtggccca aaatggcgat 2820

ctggttagag ttgatttgtt tgagaaggat gataagtact acatggtccc catctacgtg 2880

ccagacaccg tgtgtagcga gctgcccaaa aaggtggtcg ccagctctaa gggctatgag 2940

cagtggctga cactggataa cagcttcacc tttaagttca gcctgtaccc ttatgatctg 3000

gtgcggctgg tcaagggaga tgaggatcgg ttcctgtact ttggcaccct ggacatcgac 3060

agcgacagac ttaacttcaa ggacgtgaac aagccaagca agaagaacga gtaccggtac 3120

agcttgaaaa ccatcgagga cttggagaag tacgaggtgg gcgtgctggg cgatctaaga 3180

ctggtccgga aggaaactcg aagaaacttc cac 3213

<210> 129

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07513.1哺乳动物密码子优化的序列"

<400> 129

atgcgggaac tggattacag aattggactg gacatcggga ccaactcaat tggctgggga 60

gtgatcgagc tgagctggaa caaggacaga gagcagtacg agaagaccag aatcgtggac 120

aagggcgtta ggatgttcga caaggccgag atccccaaga ccggagccag cctggccgag 180

cctagacgta tcgccagatc ctccagacgt agactgaaca gaaagtccca gaggaagaag 240

gacattcgga acctgctggt gcaacacgag atcattagcc aaaaagaact gaccagcctg 300

taccctctgt ctaaatccag catggacatc tgggacatcc ggctggacgg cctggacaga 360

ctgcttgata gattcgagtg ggcccggctc ctgatccacc tggctcagcg gcggggcttt 420

aaaagcaacc ggaagtctga gcttaaagac gtggaaacag gaaaagttct gtccagcatc 480

caggtgaatg aaaagcggct gagcctgtac agaaccgtgg gcgagatgtg gatgaagaac 540

gccgattgca gcaagtacgg caaacgtaga aatagcccca acgagtacgt gttcagcgtg 600

tctagagccg acttggagaa agaaattgtg acacttttcg aggcccagcg aaaattccac 660

agcagctacg ccagtgtgga cctgcagaag acatacatcc aaatctgggc tcatcaactg 720

ccatttgcct ctggcaatgc cattgtgaac aaggtgggat actgctctct gctgaagggc 780

aaagaaaaga gagtgcctaa ggccacatac acctttcagt attttaacac cctggaccag 840

atcaaccgga caagactggg ccctaacttc caacctttca ccaaggagca gagagatatc 900

atcctagaca aaatgttcca gagaaccgac tactacaaga aaaaaacaat ccctgaggtg 960

acatactacg atatcagaaa gtggctggcc ctggacgaaa ccatccagtt caagggcctg 1020

acctacgatc ctaatgaaga actgaagaag atcgagatga agccattcat caacctgaaa 1080

cctttctacg agatcaagaa ggtggtgacc aactacgcca agaagacaaa cgaggtgttc 1140

tctgccctgg actatgacac cgtggcttat gccctcaccg tgtacaaaac agacaaggat 1200

atcagaagct accttaagcg gtccaacaac ctgagcaaga gatgttacga cgaccaactg 1260

atcgaggaac tgctgacact gagctacacc aagttcggcc acctgtcctt caaggccatc 1320

aatcacgtgc tgcccatcat gcaggagggc agaacctacc aagaggctat tcaccaactg 1380

ggctatgaca cgaccaacct gaagaaggaa aatagaagca tgttcctgcc catcatccct 1440

gacgagatca ccaaccctat cgtgaagcgg gccctgacgc aggcccggaa agtggtgaat 1500

gccatcatcc gcagatacgg ctctcctaat tctgtccaca tcgagctggc cagagagctg 1560

agcaaaagcc acgacgagcg gaagaagatc atgaccgccc acgacgagaa ctacaagaaa 1620

aacaagggcg ccgtgtccat cctgatcgat aacggcatcc tgaatcctac aggatacgat 1680

atcgtgcggt acaagctgtg gaaggaacag ggcgaaagat gcgcctatag cctgaaaaaa 1740

atccccgcca acaccttctt caacgagcta aaaaaggaac ggagcggccc acctgtgctg 1800

gaagtggacc acatcctgcc ctacagccag agcttcatcg acagctacca caacaaggtg 1860

ctggtgtacg gcgacgagaa ccagaagaag ggcaatagaa tcccttacac atttttcagc 1920

gaagaagata aggaatggga gagcttcgag agctacgttc ggagcaacag cttcttcagc 1980

aagaaaaagc gcggctacct gctgaagaag gcctacctgc ccagagaaag caacctgatc 2040

aaggaacggc acctcaacga cacacggtac gccagcagtt acctgaagaa tttcatcgag 2100

aagaacctga agttcaagga agccgtgggg atcacccgga agaagtacgt gcaaaccgtg 2160

aacggcgtga tcaccgccca cctgcggaag cggtggggcc ttgagaagga ccggcaggag 2220

acctacctgc accacgctat ggacgccatc atcgtggcct gcaccgatca ccacatggtg 2280

acgaaggtga ccgagtacta ccagatcaaa gaaggcaata agagcatcaa gaagccttat 2340

tttcctctgc cctggatggg cttcagagaa gaaatcctgt ctcacctgga gtctcaacct 2400

atcgccagaa aaatttctga agagctgaaa attggatacc agtcccccga ttacatcctg 2460

gtcagccgga tgcctaagag aagcgtgacc ggcagcgccc acgatcagac cgtgatgaag 2520

aagggcgata tcgataagaa gggcaagaca atcatcatca agcgggtgca cctgaaggat 2580

atcaagttcg acgaaaatgg cgacttcaaa atggtgggca aggagcagga cctggctaca 2640

tacgaagcta tcaaacagag atacctggag taccggaagg aaagcaagaa ggccttcgag 2700

acccctctgt acaagccatc taaaaaagga aaaggtaacc tgatcaaaaa gatcaaggtg 2760

gaagtgcaaa ccaaatcttt cgtgagagag attaacggcg gagtggccca gaacggcgac 2820

ctggttagag tggatctgtt cgagaaggac aacagatatt acatggtccc catctacgtg 2880

gtggacaccg tgcggtctga actccccaac aaagcagtga caagctccaa aggctatgaa 2940

cagtggctga gcatcgacaa tagtttcacc ttcaagttta gtctgtaccc ctacgacctc 3000

gtgcggctgg tcaagggcga cgaggatcgc ttcctgtact tctccaccct ggatatcaac 3060

agcgacagac tgaacttcaa ggacgtgaac aagcctagca agcaggctga ataccggtac 3120

agcctgaaga cgatcgagaa cctggaaaaa tacgagatcg gtgttctggg agatctgaga 3180

ctcgttagac aggagacaag aaaaattttc aag 3213

<210> 130

<211> 3216

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG08290.1哺乳动物密码子优化的序列"

<400> 130

atgagcgagc tggattatag aatcggcctg gatatcggca ccaattctat cggatgggga 60

gtgatcgagc tgttctggaa caaggatcgg gaacggtacg agaaggtccg catcgtggac 120

aaaggggtca gaatgtttga caaggccgag atccccaaca agggcgccag cctggccgag 180

cctcggagaa tcgcccggag cagcagaaga cgcctgaaca ggaagtccca aaggaagaag 240

gagatccgga acctgctggt gcaacacggc atgatcaccc aagaggaact ggacctcctg 300

taccctctga gcaaaaagtc catcgatatc tgggacatca gactagacgg cctggacaga 360

ctgctgaacc acttagagtg ggctagactg ctgattcacc tggcccagcg gcggggcttc 420

aagagcaacc gcaaaagcga gctgaaggac gctgaaacag gcaaggtgtt gtctagcatc 480

caggtgaacg agaagcggct gttcctgtac agaaccgtgg gggaaatgtg gatcaaggac 540

gcagagttca gcaagtacga caggcgtaga aactccccaa acgaatacgt gttcagcgtg 600

tcaagagccg acctggaaaa ggaaatcgtg acactgtttg aggctcagag aaagttccag 660

agcagctatg cctctaaaaa tctgcaggag acctacctgc agatctgggc ccaccaactg 720

cctttcgcca gcggcaatgc catcctgaac aaagtgggct actgcagcct gctgaaaggg 780

aaggaaaggc ggattcccaa ggccacatac accttccagt acttctccgc cctggatcag 840

gttaaccgga cccggctcgg ccctgacttc caacctttca cccaggaaca aaaggagatc 900

atcctggata agatgttcca gagaacagac tactacaaga agaagaccat ccccgaggtt 960

tcttattatg atatcagaaa gtggctggaa ctcgacgaga caatccagtt taagggactg 1020

aattacgacc ccaacgaaga gctgaagaag atcgaaaaaa aacctttcat caacctgaag 1080

gccttctacg agatcaagaa ggtggttgct aactacgccg aaagaacaaa tgaagccttt 1140

tctaccctgg actacgacgc tatcgcctat gccctgacag tctacaagac cgacaaggac 1200

atccggtcct acctgaagaa atccaacaac ctgtccaagc ggtgctacga tgatcaactg 1260

atcgaggaac tgtttaccct gagctacacc aaattcggcc acctgtcttt caaggccatt 1320

aaccacgtgc tgcctatcat gcaggagggc agaacctacc aggaggccat acaccaactg 1380

ggctacgaca ccaccaacct gaagaaagag aatagaagca tgttcctgcc tctgatccct 1440

gacgagatca caaaccccat tgtgaagcgg gccatcaccc aggccagaaa ggtggtgaac 1500

gccatcatca gaagatacgg ctctcctaac agtgtgcaca tcgaactggc cagagagctg 1560

agcaagagcc acgatgagcg gaaaaagatc atgaccgccc acgacgagaa ctacaagaaa 1620

aataagggcg ctatttctat cctgatcgag aacggcattc tgaaccctac cggctacgac 1680

atcgtgagat acaagctgtg gaaggaacaa ggcgagagat gcgcctacag cctgaaagaa 1740

attccacctg atactttttt caacgagctg aagaaagaaa gaaacggcag ccccattctg 1800

gaagtggacc acatcctgcc ttacagccag tccttcatcg acagctacca caacaaagtg 1860

ctggtgtact ctgacgagaa cagaaacaag ggcaacagaa tcccttacac ctacttcctg 1920

gaaacaaaca aggactggga ggcctttgaa agatacgtgc ggagtaacaa actgttttct 1980

aagaaaaaga gagaatatct gctgaagaag acttacctgc ctagagagtc tgaactaatc 2040

aaggaacggc acctgaacga cactcggtat gcttctacat tcctgaagaa tttcatcgag 2100

cagaatctgc agttcaaaga ggtcgaggtc aatctgagaa aaaagagagt gcaaaccgtg 2160

aatggcgtga tcaccgccca cctcagaaag cgttggggcc tggagaagaa ccggcaggag 2220

acgtacctgc accacgctat ggacgccatc atcgtggctt gtacagacca ccacatggtg 2280

acccggataa cagagtacta ccagatcaag gaatccaaca agagcgtgaa gaaaccttac 2340

ttccccatgc cttgggaggg ctttagagat gagctgttgt ctcacctcgc tagccagcct 2400

atcgcaaaga agatcagcga ggaactgaag gccggctacc agagcagcga ctacatcttc 2460

gtgtccagaa tgcccaagag aagcgtgacc ggcgccgccc atgatcagac catcagaaga 2520

aagggcggca tcgacaagaa gggcaagaca atcatcatta agcgggtgcg gctgaaagat 2580

atcaagttcg acgaaaacgg cgatttcaag atggtgggca aagagcagga cctggcaacc 2640

tacgaggcca tcaagcagag atacctggag cacagaaaga acagtaagaa ggccttcgag 2700

acccctctgt acaaacctag caagaaggga acaggaaacc tgattaagcg ggtgaaaatc 2760

gagggacaga ctaaggcctt cgtgcgggaa gtgaacggag gcgtggccca aaatagcgac 2820

ctggtcagag tggacctgtt cgagaaggac gacaagtact atatggtgcc tatctacgtg 2880

ccagacaccg tgtgtagcga gctgcctaag aaggtggtta agagcggaaa aggctatgag 2940

cagtggctga ccctggacaa cagcttcacc ttcaagtcta gcctgtaccc ctacgatctg 3000

gtgcggctcg tgaagggcaa cgaggacaga ttcctgtact tcggcacact ggacattgac 3060

tccgatagac tgaatttcaa ggatgtgaac aagcccagca agcagaacga gtaccggtac 3120

agcctgaaaa caatcgagaa cctggaaaaa tacgaggttg gagtgctggg agatctgcgg 3180

ctggtgaaac aggagaccag gaggatcttt aacaga 3216

<210> 131

<211> 4011

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05459.1哺乳动物密码子优化的序列"

<400> 131

atgaaaaaag attacgtgat cggcctggac attggcacca acagcgtcgg ctgggccgtg 60

atgacagagg actaccaact ggtgaagaag aagatgccaa tctatggcaa tactgagaag 120

aaaaagataa aaaagaattt ctggggcgtg cggctgtttg aggagggcca caccgccgag 180

gatcggcggc tgaaacggac cgctagaaga cggatctctc gccgcagaaa tagactgaga 240

tatctgcagg ccttcttcga ggaagccatg accgccctgg acgagaactt cttcgccaga 300

ctgcaggaga gcttcctggt gcctgaggac aagaaatggc accggcaccc tatcttcgcc 360

aagctggagg atgaggtggc ctatcacgaa acctacccta caatctacca cctgagaaag 420

aaactggctg attcctctga acaggctgac ctgagactga tctatctggc cctggcccat 480

atcgtgaagt acagaggcca cttcctgatc gaaggaaagc tgagtaccga gaacatcagc 540

gtcaaggagc agttccagca gttcatgatt atctataacc agacatttgt gaacggcgaa 600

agccggctgg tgtctgcccc tctgcctgag agcgtgctga tcgaagaaga gctgaccgaa 660

aaggccagcc ggacaaagaa atctgagaag gtgctgcaac agtttcctca ggagaaagcc 720

aatggactgt tcggccagtt cctgaaactt atggtaggca acaaagccga tttcaagaaa 780

gtctttggcc tggaagaaga ggccaaaata acatacgcca gcgagtccta cgaggaggat 840

ctggaaggca ttctggccaa ggtgggcgac gagtacagcg atgttttcct ggccgctaag 900

aacgtctacg acgccgtgga actgtctacc atcctggccg actccgacaa gaagagccac 960

gccaagttgt ctagtagcat gatcgttaga ttcaccgagc accaggagga cctgaagaag 1020

ttcaagcggt ttatcagaga gaattgcccc gacgagtacg ataacctgtt caagaacgag 1080

caaaaagacg gctacgccgg ctacatcgcc cacgccggca aggtgtccca actgaagttc 1140

taccagtacg tgaagaagat aatccaggac atcgccggcg ccgaatactt cctggagaaa 1200

atcgcccagg agaacttcct gcgaaaacag aggaccttcg acaacggcgt gatcccccac 1260

cagatccacc tggccgagct gcaggccatc atccacagac aggctgctta ctaccctttc 1320

ctgaaggaaa atcaggaaaa gattgagcaa ctggtgacat tcagaatccc ctactacgtc 1380

ggccctctga gcaaaggaga tgccagcacc ttcgcctggc tgaaaagaca aagcgaggaa 1440

cctatccggc cttggaacct gcaagagaca gtggacctgg accagtctgc taccgcattc 1500

atcgagagaa tgaccaactt cgatacctac ctgccttctg agaaggtgct gcccaagcac 1560

agcctgctct acgaaaaatt tatggtgttc aacgagctga ccaagatttc ttacactgat 1620

gacagaggca tcaaggccaa cttcagcggc aaggagaagg agaagatatt cgactacctg 1680

tttaagaccc gccggaaggt gaagaaaaag gatatcatcc agttctaccg gaacgagtac 1740

aacaccgaga tcgtcaccct gtctggcctg gaagaggacc agttcaatgc cagcttcagc 1800

acctaccaag atctgctgaa gtgcggccta actagagccg aactggacca ccctgataat 1860

gccgagaaac tggaggacat cattaagatc ctaaccatct tcgaggatag acagcggatc 1920

agaacacagc tcagcacctt caagggacag ttcagcgccg aggtgctgaa gaagctggaa 1980

cggaagcact acaccggctg gggcagactg tccaagaaac tcatcaacgg catctacgac 2040

aaggaatccg gaaagacaat cctggactac ctgatcaaag atgacggcgt ttctaagcac 2100

tacaacagaa acttcatgca gctaatcaac gacagccaac tgagcttcaa gaacgccatc 2160

cagaaggccc agagcagcga gcatgaggaa accctgtctg agaccgtgaa cgagctggcc 2220

ggcagccctg ccatcaagaa aggcatctac cagagcttaa aaatcgttga tgagctggtt 2280

gccatcatgg gctacgcccc taagagaatc gtggtggaga tggctagaga gaaccagaca 2340

acaagcaccg gaaagagaag aagcatccag aggctgaaga tcgtggaaaa agctatggcc 2400

gagattggaa gcaacctgct caaggaacag cctaccacaa acgagcaact gagagataca 2460

agactcttcc tgtattatat gcagaacggt aaggacatgt acaccggcga cgagctgagc 2520

ctgcacagac tgtctcacta cgacatcgac cacatcattc ctcagtcctt catgaaggac 2580

gattccctgg ataacctggt gctggtgggc agcaccgaga accggggcaa gtctgacgac 2640

gtgcccagca aggaagtggt gaaggacatg aaagcctact gggagaagct ctacgctgct 2700

ggcttgatca gccagcggaa attccagaga ctgacgaagg gcgagcaggg cggcctgacc 2760

ctggaggaca aagctcattt catccagaga caactggtgg agacaagaca gatcaccaag 2820

aacgtggctg gaattctgga tcagagatac aacgccaaca gcaaagaaaa aaaggtgcaa 2880

atcataacac tgaaagcctc tctgaccagc cagttccgga gcatcttcgg cctgtataag 2940

gtcagagaag tgaacgacta tcaccacggc caggatgcgt acctgaactg cgtggtggcc 3000

actacactcc tgaaagtgta ccccaacctg gctcctgagt tcgtgtacgg cgagtacccc 3060

aagtttcagg cctttaagga aaacaaggct acagccaaga ccatcatcta caccaatctg 3120

atgcggtttt tcaccgagga tgaacccaga ttcatgaagg acggcgagat cctgtggagc 3180

aacagctacc tgaagaacat taagaaagaa ctcaactacc atcagatgaa catagtgaaa 3240

aaggtggaag tgcaaaaggg tggcttctcc aaggaaagca tcaagcctaa gggccccagc 3300

aacaagctga tccctgtgaa gaacgggttg gacccccaga aatacggcgg atttgactct 3360

ccagtggtcg cttacacagt gctgtttacc cacgagaagg gcaaaaaacc actgatcaag 3420

caggagatcc tgggaatcac catcatggaa aagaccagat tcgagcagaa tcctatcctg 3480

ttcctggaag aaaaaggctt cctgaggcct agagtgctga tgaagctgcc taaatacacc 3540

ctgtacgagt tccctgaggg aagacggcgg ctgctggcca gcgccaaaga agcccagaaa 3600

gggaatcaga tggtgctccc cgaacacctg ctgaccctgc tgtaccacgc caaacagtgt 3660

ctgctgccta accagagcga atctctcgct tacgtggaac aacaccaacc ggagttccaa 3720

gagatcctgg agagagtggt ggacttcgct gaggtgcaca cactggccaa gagcaaggtg 3780

caacagatcg tgaaactgtt tgaggcaaac cagaccgcag atgtgaagga aatcgccgcc 3840

tccttcatcc aactgatgca gttcaacgca atgggagccc catctacctt taaattcttc 3900

cagaaggaca tcgagcgggc ccggtacact agcatcaagg aaatcttcga cgccaccatc 3960

atctaccaga gcacaaccgg cctctacgag acacggagaa aggtggtgga c 4011

<210> 132

<211> 4308

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG04583.1哺乳动物密码子优化的序列"

<400> 132

atggccaaga atatcctggg cctggatctg ggtacaaaca gcatcggctg ggctctggtc 60

cagcaggact tcgagaacaa ggagggaaac atcctgggca tgggatctag aatcatccct 120

atgagccagg acatcctggg cgaattcggt aagggcaaca gcatcagcca gaccgccgag 180

agaacaggat accggggcgt gcgtagactg agagagagac acctcctgag aagagagaga 240

ctgcatagag tgctgcacct gctcggcttt ctgcctaagc actacgatga aaaaatcgac 300

tttacacaaa gattcggcaa gttcatcaac caggctgagc ctaagctggc ttttgatagc 360

gagttcctgt tcaaggacag cttccacgag atgctggccg acttcaagca gaatcaacct 420

gaattcctga aagacaagaa cggagaggac tgcctggttc cttacgactg gaccatctac 480

tacctgagaa agaaggctct gacccagaag atcgagaaat acgaactagc ttggctgatc 540

ctgaacttca accaaaagcg gggctactac cagcttagag gcgaagaaga gaaggaaaac 600

cctaacaaac tggtgggctt ccactctctg aagattgttg atgtgatccc tgatgccgag 660

accaacaaaa agggcgagac atggtacagc ctgcacctgg aaaacggctg ggtgtacagg 720

cggagcagca agatcagcct ggccgactgg aaggacaagg ttcgggactt catcgtcact 780

acagatctga acgacgatgg cagcgagaag ctggacaagg acggcatcgt gaagaggtcc 840

ttcagagccc cttctgccga cgattggaca ctcctgaaaa aaaagactga gaaggacatc 900

gacaactcca acaagactgt gggcacctac atctacgaca acttgctgct gaaccctaaa 960

cagaagatca aggggaaaat ggtcagaacc atcgaacgaa agttctacaa gcaggagctg 1020

gagcaaatcc tgaaaaccca gaaagaattt cactccgagc tgcagtctga aaacctgctg 1080

caggactgcg tgagggagct gtaccggaac aacgagcagc accagcagat gctggaagcc 1140

aaggattttg tgcacctgtt cctgaacgat atcatcttct accagagacc cctgcgcagc 1200

cagaaaagct ctattagcaa ctgcaccctg gaattccgga agagcaagaa cgagaatgga 1260

gaagaagtga tccaccggct gaaggtgatc gccaagtcca acccctacta tcaagagttt 1320

cggctgctgc agtgggtgca aaacctggct atctacacta aggacgacga caaaaacgtc 1380

acaaacgaat tcctgaagag cacccaggac tgggaggatc tgctgagatg gctgcacagc 1440

aagaaagaaa tcaagcagga tgccctgatc aaattcctga tcgaaaagaa aggcctgaag 1500

ggtaaggccc tgaccattga agtggctaag tacagatgga attacgtgca agacaaggat 1560

tatcctggca acgagacaag atacctgatt cagagccggc tggacaaggt ggaatacgcc 1620

cctaaggact tcctcacgta cgaaaatgag atggccctgt ggcacatcat ctactctatc 1680

aacgataaga tcgaatacga aaaggcccta aagagcttcg ccaacaagaa aggtctcgac 1740

gaggtgacct tcgtggaagc ctttaagaaa ttcccacctt tcaagagcga ttacggcagc 1800

ttcagcgaga aggccatcaa gaagctgctg cctctcatgc ggttcggcac acaatggaac 1860

tgggacaaca tcgaccagaa ctcgaaggaa aggattggaa aaatcctgac cggcgagtac 1920

gacgagaata tcaagggtag agtgcgggaa aaagctagac acctgaacag cgagacggac 1980

tttcaggcgc tccctctgtg gctggcccag tacgtggtgt acggcagaca tagcgaagct 2040

gacatcgccg gcaagtggaa tagtgtggac gacctgaagc agttcttgga cgacttcaag 2100

caacacagcc tgagaaatcc cattgtagaa caggtgatta ctgagacact gcgggccgtg 2160

aaggatatct ggaacttcta cggcaagggc gccaaggact ttttctctga gatccacatc 2220

gagctgggaa gagagatgaa aaacaccgcc gacgagagaa aaaggattac cacaatggtg 2280

acagataatg agaataccaa tctgagaatc aaagctctgc tggctgagat ggccctggat 2340

cagaacgtgg acaatgtgcg gccttacagc cccatgcagc aagaaatcct gaaaatctat 2400

gaggaaggcg tgctgaacgc cgaagagaac atcgacgatg acatcctgaa gatctctaaa 2460

actgctcagc ctagcgctac cgatctgaag agatacaagc tgtggctgga acagaagtac 2520

agaagcccct ataccggaca gatgatccct ctgaacaagc tgttcacccc tgagtatgaa 2580

atcgagcaca ttatccccca gagcagatac ttcgacgatt ctatgagcaa caaggtgatc 2640

tgcgaggccg ccgtgaacaa gctgaaggat aaccagatcg gcctggtgtt catcaagaac 2700

caccacggcg aagtggtgga ctttggcatg ggcaagcagg tgaaaatcct ggaggtgtct 2760

gattacgaag atttcgtgaa gcagaactac aacaaaaaca gaggcaaacg gaacaagctg 2820

ctcctcgaag atatccccga gaaaatgatt gaacggcaac tgaacgatac cagatatatc 2880

agcaagtaca tcactcaggt gctgtctaat atcgtcagag acgacaagga aggctctaag 2940

gatgacggag tgaacagcaa gaacattgtg cccggcaacg gcaagattac aaccagactc 3000

aagcaggatt ggggcctgaa cgatgtgtgg aacgacctgg tgctgcctag attcgagaga 3060

atgaacaccc tcacaaactc caatgatttt acaagcaaga acacacacgg caagaccatt 3120

cctaccgtgc ctatcgagct gagcaagggg ttcagcaaaa agcggatcga tcacagacac 3180

cacgctatgg acgccctggt gatcgcctgc gccacccggg accacgtgaa cctgctgaat 3240

aacgaatcca gcaagtctga cacaaagcgg tacgacctga atagaaaact gagaaaatac 3300

gagaaggtgg cctacaacga ccccaaaacc ggcgagagga ttgaaaaaga agtgccaaaa 3360

gacttcatca agccttggga aacttttacc gaagatacca gaacactgct ggagaatatc 3420

gtgatctcat tcaaacagaa cctgagagtg atcaacaagg ccaccaacta ctacgagaag 3480

atcgagaacg gcaaaaaggt gaaggtggaa caaaagggaa tcaactgggc cgtgagaaag 3540

gctctccata aggagaccgt gtccggccag gtccaccttg acagaatcaa ggtggccaag 3600

ggcaagatcc tgaccgccac aagaaagacc ctggacgctt cttttaacga gaaaaccata 3660

gagagcatca ccgataccgg catccagaag atcctgctga actacctgaa gtcaaaggac 3720

aacaaccctg aggtggcctt ctccccagaa ggaattgagg aactaaacaa gaatatcaga 3780

ctgtacaatg acggcaaggc ccaccagcca atcctaaaag tgcgggtgtt cgagcagggc 3840

agcaagttca cactgggcga gacaggcaac aagacaacca agttcgtgga agctgccaag 3900

ggcaccaatc ttttcttcgg aatctacgag gacaagagcg gaaaacgtag ctacgagacc 3960

atccccctga atatcgttat tgaaagacag aaacagggcc tccaggccgt gcccgagacc 4020

aacgagaagg gcaagcaact gctgttcacc ctgagcccca acgacctggt ctacgtgcca 4080

gaggaaggcg tattcgacga gaacaacatc aaggtggata gaatctacaa ggtcgtgtct 4140

ttcagcacat accaatgttt tttcgtgcgg aacgacgtat ctaccagcgt ggtcaacaag 4200

gtggagtaca gcgccctgaa caagatggaa aaatccatcg acaatatcat gatcaaggaa 4260

aactgtgtga agctgaatgt ggaccggctg ggtaagatca gcaaggcc 4308

<210> 133

<211> 4368

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG01688.1哺乳动物密码子优化的序列"

<400> 133

atgatgatca agaacattct gggactggat ttgggcacaa acagcattgg atgggctctg 60

atcaagcagg acttcgagaa caaacacggc gagatcctgg gcatgggcag cagaatcatc 120

cctatgagcc aggatatcct gggcgatttc ggcaaaggga actcgataag ccagactgct 180

gacagaacca agtacagaag cgtgcggaga ctgagagaaa gattcttgct gcggcgggaa 240

cgcctgcacc gggtgctcca cctgctgaac ttcctccctc aacactacgc ctctcagatc 300

gacttcgaga agaagttcgg caagtttaag tctgagaccg aacctaagct ggcctgggaa 360

aactggggag gtaaattctc tttcctcttc cagaacagct tcaacgagat gctggaagac 420

ttcaaggccg ccggccaggg actcaagatt ccctatgact ggaccatcta ctacctacgg 480

aagaaagctc tgtcccagaa gatcgagaaa gaggagcttg cctggattct gctgaacttc 540

aaccagaagc gaggctacta ccagctcaga ggcgaggaag aagaagagaa cccgaacaag 600

ctggtggagt tctactccct gaagatcgtg gatgtggtcg ccgacgagcc tcagaagggg 660

aagagcgaca tctggtattc tctgatcctg gaaaacggct gggtctaccg cagagccagt 720

aagatcccac tgtttgattg gaaggataag accagagatt tcatcgtcac cacagacctt 780

aatgacgaca gaagcgtgaa gaccgacaaa gagggcaacg agaagcggtc ctttcgggcc 840

cctagcgaaa atgattggac cctggtcaag aagaagacag agcaggagat tgaccagagc 900

cacaagaccg tgggcaccta catctacgag acactgctgc tcaatccaaa gcagaaaatc 960

aagggcaagc tggtgcgaac aatcgagaga aaattttata aggacgagct gaagcaaatc 1020

ctggaaaagc agaaggaatt tcaccaggag ctgaaaaacg acgatctgta caacgactgc 1080

atcagagagc tgtaccggaa caacgaggcc caccaactga ccctgagcaa gaaagatttc 1140

gtgcacctgc tgatggacga tctgatcttc taccaaagac ccctgcgaag ccagaagtcc 1200

agcatctcta actgcaccct ggaattcaga aaatacaagg acgaaaacgg catcgaacac 1260

acccagtacc tgaaggccat cccaaagagt aatccgtact accaagagtt tagactgtgg 1320

cagtggatgt acaacctgaa catctacaga aaggacgacg aggctaatgt gaccaaggaa 1380

ttcctgaaca ccaataagga cttcgagagc ctgtttgagt tcctgaataa tagaaaggaa 1440

atcgaacaga agcctctgat caagttcctc ctggaacaga aagatattaa caagaagctg 1500

ctgaacgccg aggccgaaaa gtatcggtgg aattacgtgg aagataagaa gtatccttgc 1560

aacgaaacga agaccatgat ctccagcaga ctggacaaag tggagaatat ctctgacgac 1620

ttcctgacca gagacattga gcagaagatc tggcacatca tctacagcgt caacgacaag 1680

atagaatacg agaaggccct gaagtccttc gccaccagaa acgatctcga cgagaacagc 1740

tttatcgaag cctttaagaa gttcagccca ttcaagagcg agtacggatc tttttctgag 1800

aaagccatca agaaactgct gcccctgatg agactgggaa agtactggta cgaggacgag 1860

attgtgaagc actctgatat ttactttaag aacatcgaaa atcttctggg cgacttctcc 1920

aacagagata aaaaaatatc tgaggaagac aaagagaaat ggaacaagtc tatcaacctg 1980

aaactgcagg aggaactgaa ggactttcag accgccgaga tcgacctgtt ccagggcctt 2040

agactccata tcgcccagta cctggtgtac ggccggcaca gcgaagccag catgatcgga 2100

aagtggaaca gcgccgagga tctggaagaa ttcctgaagg acttcaagca gcacagcctg 2160

agaaacccca tcgtcgagca agtgatcacc gagaccctga gggtggttaa ggatatatgg 2220

ctgaaatacg gcaacggcgc caaggacttc ttcaacgaga ttcacatcga gctgggcaga 2280

gaaatgaagc tgcctgccga cgaccggaaa aagctgacca accagatcag cgagaacgaa 2340

aacacaaatt tcagaatcaa ggccctgctg gctgaaatga tgaacgacag cagtgtggaa 2400

aatgtgcggc ctttcagccc tatgcagcag gagatcctga agatctatga agatgacgtc 2460

ctgaagtctg acattgaaat cgaggatgac atccttaaga tctctaaaac cgcccagcct 2520

tctcctagcg atctcaagcg atacaagctc tggctggagc agaagtacaa gtctccatac 2580

accggccaga tcatacctct gaacaagctg tttacccctg aatacgagat cgagcacatt 2640

atccctcagt ctagatattt cgacgacagc ttcagcaaca aagtgatctg cgagagcgcc 2700

gtgaacaagc tgaaagacaa ctacattggc ctggaattca tcaagcaatt tggaggcacc 2760

atcatcgaac tgggctttgg caagtccatc aaagtgttcg agaccaaaga gtacgaggac 2820

ttcgtgaaga aacactacgc caacaatcag ggcaagagaa acaagctgct catggaagac 2880

atccccgaga aaatgatcga gagacagatg aacgacacca gatacatctc taagtacatc 2940

agcggagtgc tgagcaacat cgtcagagtg gaagatggat ctgatgaggg cgtgaacagc 3000

aagaacatcg tgcccggcaa cggcaagatt acaacacaac tgaagcagga ctggggcctg 3060

aatgacgtgt ggaacgacct tatcctgccg cggttcgaga gaatgaatca actgaccaac 3120

agcaaggtgt tcacagcctg gaacgaaaac taccagaagt tcctgcctac agtgccaatc 3180

gaatacagca aaggcttcag caagaagcgt atcgatcaca gacaccacgc cctggatgct 3240

ctggttatcg cctgcgccac caaggaccac gtgaacctgc tgaacaacca gtctgccaag 3300

agcgacacca agagatacga cttaaagaaa aaaagtatga aattcgagaa agtggtgtac 3360

aatgatgcca agaccggcga aaagatcgag cgggaagtgc ccaagcagtt cctgaagcct 3420

tgggagaact tcaccctgga tgtgaagcac aacctggaaa cgatcatcgt ctcttttaaa 3480

caaaatctgc gggtgatcaa taaagccacg aactactacg agaagtacgt cgagaaggac 3540

ggcaccaaaa acaaagagcg cgtggagcag acagggacaa actgggccat tagaaagccc 3600

atgcacaagg atacagtgtc cggcaaagtg gaccttcctt gggtgaaggt gcctaaggga 3660

aagatcctga ccgccacacg gaagagcttg gatagcagct tcgacctcaa gagcatcggc 3720

tctataacag atacaggcat tcagaagatc ctaaagaatt acctggcatt caaggacggc 3780

aaccctgagc tggctttcag ccctgagggc atcgacgatc tgaacaagaa catagagaag 3840

tacaacgatg gcaaacctca ccagcctatc aacaaggtgc gagtgtttga gctgggcagc 3900

aagttccagg tgggacaatc tggtaacaag aaggacaagt atgtggaagc tgctaagggc 3960

accaatctct tcttcgccgt gtacgaggat gaaaaaggaa agcggaacta cgagaccatc 4020

cctctcaacg aggtgatcga gagacagaag cagggcctga gcgtggtgga cctgaagggt 4080

acaaacgact tctacctgtg ccctaacgac tttgtgtaca tcccaagcgg cgacgagctg 4140

gaaaacatca acaacgtgga cttcaaggac atcaagaagg agattaacga gcgcatctac 4200

aaagtggtgt cttttacagg caatagactt tcttgtatcc cttacatggt ggccacaacg 4260

atcgtcaaca aactcgaatt cactcaactg aacaaaatcg agtttaccaa ggaaaaagaa 4320

atttgtatca agctcaacgt ggacagactg ggcaatatct ccaaggcc 4368

<210> 134

<211> 21

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="SV40大T抗原核定位序列"

<400> 134

cctaagaaga aaagaaaggt g 21

<210> 135

<211> 66

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="三重FLAG表位标签"

<400> 135

gactacaagg accacgacgg cgactacaaa gatcacgata tcgactacaa ggacgacgat 60

gataag 66

<210> 136

<211> 48

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="核质蛋白核定位序列"

<400> 136

aaaagacctg ccgctacaaa gaaggccggc caggccaaga aaaagaag 48

<210> 137

<211> 203

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="巨细胞病毒哺乳动物转录启动子"

<400> 137

tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 60

caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 120

ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 180

gggaggtcta tataagcaga gct 203

<210> 138

<211> 304

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="巨细胞病毒转录增强子"

<400> 138

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catg 304

<210> 139

<211> 318

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="人U6 RNA启动子"

<400> 139

tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60

gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120

gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180

tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240

gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300

tggaaaggac gaaacacc 318

<210> 140

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物189的靶标"

<400> 140

cctgaatgct gtgcggctct 20

<210> 141

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物185的靶标"

<400> 141

ggacagtgcg catctccctg 20

<210> 142

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物168的靶标"

<400> 142

cacatctcga gcaagacgtt 20

<210> 143

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物135的靶标"

<400> 143

gggccattaa aacctctcca 20

<210> 144

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物139的靶标"

<400> 144

aggttttaat ggcccagcct 20

<210> 145

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物143的靶标"

<400> 145

catggcagta cattagagca 20

<210> 146

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物190的靶标"

<400> 146

cctgaatgct gtgcggctct 20

<210> 147

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物194的靶标"

<400> 147

gccgcacagc attcaggtcg 20

<210> 148

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物165的靶标"

<400> 148

atggggaatg tagcaagacc 20

<210> 149

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物169的靶标"

<400> 149

cacatctcga gcaagacgtt 20

<210> 150

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物173的靶标"

<400> 150

cttctatagc ctccttcccc 20

<210> 151

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物144的靶标"

<400> 151

catggcagta cattagagca 20

<210> 152

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物136的靶标"

<400> 152

gggccattaa aacctctcca 20

<210> 153

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物145的靶标"

<400> 153

catggcagta cattagagca 20

<210> 154

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物188的靶标"

<400> 154

ggacagtgcg catctccctg 20

<210> 155

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物192的靶标"

<400> 155

cctgaatgct gtgcggctct 20

<210> 156

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物196的靶标"

<400> 156

gccgcacagc attcaggtcg 20

<210> 157

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物167的靶标"

<400> 157

atggggaatg tagcaagacc 20

<210> 158

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物171的靶标"

<400> 158

cacatctcga gcaagacgtt 20

<210> 159

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物175的靶标"

<400> 159

cttctatagc ctccttcccc 20

<210> 160

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物197的靶标"

<400> 160

cctcaccccc acgagcttgt aggaa 25

<210> 161

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物199的靶标"

<400> 161

acagtgcgca tctccctggt cacca 25

<210> 162

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物146的靶标"

<400> 162

ggctgggcca ttaaaacctc tccag 25

<210> 163

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物148的靶标"

<400> 163

gaggctgggc cattaaaacc tctcc 25

<210> 164

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物176的靶标"

<400> 164

gaggctgaga caggagagtt gcttg 25

<210> 165

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物177的靶标"

<400> 165

cccacaaacc gatgtagctc aagag 25

<210> 166

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物209的靶标"

<400> 166

tagggtctta ctctgttgtc cacgc 25

<210> 167

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物151的靶标"

<400> 167

ttctcccgag ccaagtacac gtttc 25

<210> 168

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="指导物152的靶标"

<400> 168

gaaaatctgc tcttagggct caagg 25

<210> 169

<211> 3210

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05083.1大豆优化的"

<400> 169

atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat cgggtgggga 60

ataattgagc tgtcctggaa taaagatcgc gagcaatatg aaaaggctag gattgtggat 120

aagggagtga ggatgttcga taaggctgaa attcctaaga ctggagcttc tcttgctgaa 180

ccaagaagaa ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240

gatataagga accttctcgt tcagcatgaa atcatttctc agaaggagct tgcttctctc 300

taccctctaa ccaaatcaag catggacatc tgggatataa ggcttgatgg actcgatagg 360

cttcttgata gatttgagtg gaccaggctt ctaatacacc ttgctcaaag aaggggcttc 420

aaatcaaacc gcaagtccga attaaaggat gttgagactg gaaaggtgct ttcaagcatc 480

caagctaatg aaaagaggct ttctttgtac aggactgttg gggagatgtg gatgaaaaac 540

gaggacttct caaaatacga taaaaggagg aactcctcca acgagtacgt gttctctgtt 600

tctagggctg atcttgagaa ggagattgtg actctttttg aggctcaacg caagttccaa 660

tcaagctacg cttctgctga tcttcaaaag acctaccttc aaatttgggc tcatcagctt 720

ccttttgctt ctggaaacgc cattgtgaat aaagtgggat actgctccct attaaaggga 780

aaggagaaga gagtgcctaa ggctacctat acattccagt acttctctac cctcgatcaa 840

atcaatagaa ctaggcttgg acctaacttc cagcctttta ctaaggagca gagggatgtg 900

atcctcgatg aaatgttcaa caggaccgac tactataaaa agaagaccat tcccgaggtg 960

acctactacg atataagaaa gtggcttgct ctcgatgaaa ccattcagtt caagggacta 1020

acttatgacc ccaacgagga gctgaagaaa atagaactca agtccttcat aaacctcaag 1080

cccttctacg aaatcaagaa ggtggtaacc aactacgcca agaagaccaa cgaagcattc 1140

tctaccctcg attacgatac attcgcttac gctcttaccg tgtataaaac cgacaaggat 1200

ataaggtcct acctcaagaa atcaaacaac ctctccaagt gctgctacga cgatcaatta 1260

attgaggagc ttctcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320

aaccatgtgc ttccaataat gcaagaggga agaacttacc aagaggcaat acaccaactt 1380

ggatacgatg ctaccaacct taagaaggag aacaggtcta tgttccttcc tctcttccct 1440

gatgagatta ctaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500

gctattatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc tagggagctt 1560

tctaagtctc atgatgagag gaccaagatt atgaaggctc acgatgagaa ctacaagaag 1620

aacaaggggg ctatttccat tctcattgag aacggaattc ttaaccctac cggatacgat 1680

attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaagcaa 1740

attcctgcta acaccttctt caacgagatg aagaaggaaa gatcaggatc tcctgtgctt 1800

gagattgatc acattctccc ttactcccag tccttcattg attcttacca caacaaggtg 1860

cttgtttacg gagatgagaa ccaaaagaag gggaacagga ttccttacac ttacttcctt 1920

gagggaaaca aggattggga gtctttcgag tcttacgtga ggcttaactc cttcttctct 1980

aagaagaaga ggggatacct tcttaagaag gcttatcttc ctagggagtc caatatgatt 2040

aaggagaggc acctaaacga taccaggtac gcttcttctt acctcaagaa cttcatcgag 2100

aagaacctta agttcaagga ggttgaggga tctactagga agaagcatgt tcagaccgtg 2160

aacggaatta ttactgctca tcttagaaag aggtggggac ttgagaagga taggcaagag 2220

acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca ccatatggtg 2280

actaaggtta ccgagtacta ccagattaag gagtcaaaca agtccatcag gaagccttat 2340

tttcctcttc cttgggttgg attcagggag gagattcttt ctcatcttgc tagacaacct 2400

atcgctagaa agatttccga ggagcttaag attggatacc agtccttcga ttacattctt 2460

gtgtctagga tgcctaagag gtctgttact ggagctgctc atgagcagac tattatgaag 2520

aagggaggaa ttgataagaa ggggaagacc atcatcatta agagggtgta cctaaaggac 2580

atcaagttcg atgagaacgg ggatttcaag atggttggaa aggagcagga tcttgctact 2640

tacgaggcta ttaagcagag gtacattgag tatggaaagg agtctaagaa ggctttcgag 2700

actcctcttt acaagccttc taagaaggga aaggggaacc tcatcaagaa gattaaggtt 2760

gaggttcaga ctaagtcttt cgttagggag gttaatggag gagttgctca gaatggagat 2820

cttgtgaggg ttgatctatt cgagaaggac aacaggtact acatgatccc tatctacgtg 2880

atggatactg ttcattccga gcttcctaac aaggctgtta cttcttctaa gggatacgag 2940

cagtggctta ccattgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000

gttaggcttg ttaagggaaa cgaggatagg ttcctctact tctccaccct cgatattaac 3060

tctgataggc tcaacttcaa ggatgtgaac aagccttcaa agcaagctga gaacaggtac 3120

tctcttaaga ccattgagaa ccttgagaag tacgaagtgg gagttcttgg agatcttagg 3180

ttcgttaggc aagagattag gaagaacttc 3210

<210> 170

<211> 3210

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05083.1玉米优化的"

<400> 170

atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat aggctggggc 60

atcatcgagc tgagctggaa taaagaccgc gagcagtatg aaaaggccag gatcgtggac 120

aagggcgtga ggatgttcga taaggccgag atcccaaaga caggcgcctc tctggccgaa 180

ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaag 240

gatataagga acctgctggt ccagcatgaa atcatctctc agaaggagct ggccagcctg 300

tacccgctga ccaagtcaag catggacatc tgggatataa ggctggatgg cctggatagg 360

ctgctggata ggttcgagtg gacaaggctg ctgatacatc tggcccagag gaggggcttc 420

aaatcaaata ggaagagcga attaaaggac gtggagacag gcaaggtgct gtcaagcatt 480

caggccaatg aaaagcgcct gagcctgtac aggacagtgg gcgagatgtg gatgaaaaac 540

gaggacttct caaaatacga caagcgccgc aacagcagca acgagtacgt gttcagcgtg 600

agcagggccg acctggagaa ggagatcgtg acactgttcg aggcccagag gaagttccaa 660

tcaagctacg cctctgccga tctgcagaag acatacctgc agatctgggc ccaccagctg 720

ccattcgcta gcggcaatgc catcgtgaat aaagtgggct actgctctct attaaagggc 780

aaggagaaga gggtgccaaa ggccacctat acattccagt acttcagcac cctggaccaa 840

atcaatagga cacgcctggg cccaaacttc cagccattca caaaggagca gcgcgacgtg 900

atcctggatg aaatgttcaa ccgcaccgac tactataaaa agaagaccat cccggaggtg 960

acatactacg atataaggaa gtggctggcc ctggatgaaa ccatccagtt caagggccta 1020

acctacgacc cgaacgagga gctgaagaaa atagaactga agagcttcat aaacctgaag 1080

ccgttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaagcattc 1140

agcaccctgg actacgatac attcgcctac gccctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaagaa atcaaacaac ctgagcaagt gctgctacga cgaccaatta 1260

atcgaggagc tgctgaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320

aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380

ggctacgacg caaccaacct gaagaaggag aaccgaagca tgttcctgcc gctgttcccg 1440

gacgagatca ccaacccgat cgtgaagcgc gccctgaccc aggcccgcaa ggtggtgaac 1500

gccatcatcc gccgctacgg ctcaccgaac agcgtgcaca ttgagctggc ccgcgagctg 1560

agcaagagcc acgacgagcg cacaaagatc atgaaggccc acgacgagaa ctacaagaag 1620

aacaagggcg ccatcagcat cctgatcgag aacggcatcc tgaacccaac aggctacgac 1680

atcgtgaggt acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaagcag 1740

atcccagcca atacattctt caacgagatg aagaaggaga ggtcaggctc tccagtgctg 1800

gagattgatc acatcctgcc atacagccag agcttcatcg acagctacca caacaaggtg 1860

ctggtgtacg gcgatgagaa ccagaagaag ggcaatcgca tcccatacac atacttcctg 1920

gagggcaaca aggattggga gagcttcgag agctacgtga ggctgaacag cttcttcagc 1980

aagaagaaga ggggctacct gctgaagaag gcctacctgc caagggagag caacatgatc 2040

aaggagaggc acctaaacga tacaaggtac gccagcagct acctgaagaa cttcatcgag 2100

aagaacctga agttcaagga ggtggagggc agcacccgta agaagcacgt ccagaccgtg 2160

aacggcatca tcacagccca cctgaggaag aggtggggcc tggagaagga taggcaggag 2220

acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280

acaaaggtga cagagtacta ccagatcaag gagagcaaca agtcaatccg caagccatac 2340

ttcccactgc catgggtggg cttcagggag gagatcctgt ctcacctggc caggcagcca 2400

atcgccagga agatctctga ggagctgaag atcggctacc agtctttcga ttacatcctg 2460

gtgtctagga tgccaaagag gtctgtgaca ggcgccgccc acgagcagac aatcatgaag 2520

aagggcggca tcgataagaa gggcaagaca atcatcatca agagggtgta cctgaaggat 2580

atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tctagccaca 2640

tacgaggcca tcaagcagag gtacatcgag tacggcaagg agtctaagaa ggccttcgag 2700

acaccactgt acaagccatc taagaagggc aagggcaacc tgatcaagaa gatcaaggtg 2760

gaggttcaga ccaagagctt cgtgagggag gtgaatggcg gcgtggccca gaatggcgat 2820

ctggtgaggg tggatctgtt cgagaaggat aacaggtact acatgatccc gatctacgtg 2880

atggatacag tgcacagcga gctgccaaac aaggccgtga catcttctaa gggctacgag 2940

cagtggctaa ccatcgacaa cagcttcacc ttcaagttca gcctgtaccc atacgacctg 3000

gtgaggctgg tgaagggcaa tgaggacagg ttcctgtact tcagcaccct ggacatcaac 3060

agcgacaggc tgaacttcaa ggacgtgaac aagccatcta agcaggccga gaacaggtac 3120

agcctgaaga ccatcgagaa cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180

ttcgtgaggc aggagatcag gaagaatttc 3210

<210> 171

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07433.1大豆优化的"

<400> 171

atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatggggc 60

gtgattgagc tttcctggaa taaagatagg gagcgttatg aaaaggttag gattgtggat 120

cagggagtta ggatgtttga tagagctgag atgcctaaga ctggagcttc attagctgaa 180

ccaagaagga ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240

aatataagga accttcttgt tcagcacgga gttattactc aggaggagct tgattctctc 300

taccctctct ccaagaaatc aatggatatc tggggaatta ggcttgatgg actcgatcgc 360

ctattaaacc attttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420

aaatcaaacc gcaagtccga attaaaggat actgagactg gaaaggtgct ttcaagcatc 480

cagctcaatg aaaagaggct ttctttgtat aggactgttg gggagatgtg gatgaaagat 540

cccgacttct caaaatacga taggaagagg aactctccta acgagtacgt gttttctgtt 600

tctagagctg agcttgagaa ggagattgtg actttgtttg ctgctcaaag gaggttccaa 660

tctccttacg cttctaagga tcttcaagag acctaccttc agatttggac tcatcagctt 720

ccttttgctt ccgggaacgc tattctcaat aaagtgggat actgctcctt attaaaggga 780

aaggagagaa ggattcctaa ggccacctat acattccagt acttctctgc tcttgatcaa 840

gtgaatagaa ctaggcttgg acctgatttc cagcctttta ctaaggagca gcgcgagatc 900

atcctcaata atatgttcca gaggaccgac tactataaaa agaagaccat tcccgaggtg 960

acctactacg atataagaaa gtggcttgag cttgatgaaa ccattcagtt caagggatta 1020

aactacgacc ccaacgagga gctgaagaaa atagagaaga agcccttcat aaacctcaag 1080

gccttctacg aaatcaacaa ggtggtggct aactactctg agcgaaccaa tgaaaccttc 1140

tctaccctcg attacgatgg aattggatac gctcttaccg tgtataaaac cgacaaggat 1200

ataaggtcct acctcaaatc aagccataat ctccctaaga ggtgctacga cgatcaatta 1260

attgaggagc ttctctccct ctcctatact aagttcgggc acctctctct taaggcaatc 1320

aaccatgttc taagcattat gcagaagggg aacacatata aggaggctgt tgatcagctt 1380

ggatacgata cttctggact taagaaggag aagaggtcta agttcctccc tcctatttct 1440

gatgagatta ccaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500

gctattatta ggaggcatgg atctcctcat tctgtgcata ttgagcttgc tagggagctt 1560

tcaaagaatc acgatgagag gactaagatt gtttctgctc aggacgagaa ctacaagaag 1620

aacaaggggg ctatttctat tctctctgag cacggaattc ttaaccctac cggatacgat 1680

attgtgaggt ataagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaaggaa 1740

attcctgctg ataccttctt caacgagctt aagaaggaaa ggaacggtgc tcctattcta 1800

gaggtggatc acattcttcc ttactcccag tccttcattg attcttacca taacaaggtg 1860

cttgtgtatt ccgatgagaa caggaagaag ggaaacagga ttccttacac ctacttcctt 1920

gagactaata aggattggga ggcttttgag aggtacgtga ggtctaacaa gttcttctct 1980

aagaagaaga gggagtacct tcttaagagg gcttatcttc ctagggagtc agagcttatt 2040

aaggagaggc atcttaacga taccaggtac gcttctacct tcctcaagaa cttcattgag 2100

cagaaccttc aattcaagga agctgaggat aatcctagaa agaggagggt tcagactgtg 2160

aacggagtta ttactgctca ttttagaaag aggtggggac ttgagaagga taggcaagag 2220

acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca tcatatggtg 2280

actagggtta ccgagtacta ccagatcaag gagtcaaaca agtctgtgaa gaagccttat 2340

tttcctatgc cttgggaagg attcagggat gagcttcttt ctcatcttgc ttctcagcct 2400

atcgctaaga agatttctga agagcttaag gctggatacc agtcccttga ttacattttc 2460

gtgtctagaa tgcctaagag gtctattact ggagctgctc acaagcagac tattatgagg 2520

aagggaggaa ttgataagaa ggggaagacc atcattattg agaggctcca cctcaaggat 2580

atcaagttcg atgagaacgg agatttcaag atggttggaa aggagcagga tatggctact 2640

tacgaggcta ttaagcagag atatctagag cacggaaaga actctaagaa ggctttcgag 2700

actcctcttt acaagccttc taagaaggga accggaaacc ttattaagag agttaaggtt 2760

gagggacagg ctaagtcttt cgttagagag gttaatggag gagttgctca gaatggagat 2820

cttgtgaggg ttgatctttt cgagaaggac gataagtact acatggtgcc tatctacgtt 2880

cctgatactg tttgttccga gcttcctaag aaggttgttg cttcttctaa gggatacgag 2940

caatggctta cccttgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000

gttaggctag ttaagggaga tgaggatagg ttcctttact tcgggaccct cgatattgat 3060

tctgataggc tcaacttcaa ggatgtgaac aagccttcta agaagaacga gtacaggtac 3120

tctctcaaga ccattgagga tcttgagaag tacgaagtgg gagttcttgg agatcttaga 3180

cttgttagaa aggagactag gaggaacttc cac 3213

<210> 172

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07433.1玉米优化的"

<400> 172

atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat cggctggggc 60

gtgatcgagc tgagctggaa taaagatcgc gagcgctatg aaaaggtgcg catcgtggat 120

cagggcgtta ggatgttcga tagggccgag atgccaaaga caggcgcctc actggccgaa 180

ccaaggagga tagccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaaa 240

aatatcagga acctgctggt tcagcacggc gtgatcacac aggaggagct ggattctctg 300

tacccactga gcaagaaaag catggacatc tggggcatta ggctagatgg cctggaccgc 360

ctattaaacc acttcgagtg ggcccgccta ttaattcacc tggcccagag gaggggcttc 420

aaatcaaata ggaagagcga attaaaggac accgagacag gcaaggtgct gtcaagcatc 480

cagctgaatg aaaagcgcct gagcctgtac aggacagtgg gcgagatgtg gatgaaagac 540

ccggacttct caaaatacga ccgcaagcgc aacagcccga acgagtacgt gttctctgtg 600

tctagggccg agctggagaa ggagatcgtg acactgttcg ccgctcagag gaggttccag 660

tctccatacg cctctaagga tctgcaagag acatacctgc agatctggac acaccagctg 720

ccattcgcct ctggcaatgc catcctgaat aaagtgggct actgctctct attaaagggc 780

aaggagagga ggattccaaa ggccacctat acattccagt acttcagcgc cctggaccag 840

gtgaatagga caaggctggg cccagatttc cagccattca caaaggagca gcgcgagatc 900

atcctgaata atatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960

acatactacg atataaggaa gtggctggag ctggatgaaa ccatccagtt caagggatta 1020

aactacgacc cgaacgagga gctgaagaaa atagagaaga agccgttcat aaacctgaag 1080

gccttctacg aaatcaacaa ggtggtggcc aactacagcg agcgaaccaa cgagaccttc 1140

agcaccctgg actacgacgg catcggctac gccctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaaatc aagccacaac ctgccgaagc gctgctacga cgaccaatta 1260

atcgaggagc tgctgagcct gagctatact aagttcggcc acctgagcct gaaggcaatc 1320

aaccacgtgc taagcatcat gcagaagggc aatacataca aggaggccgt ggaccagctg 1380

ggctacgaca ccagcggcct gaagaaggag aagcgcagca agttcctgcc gccgatcagc 1440

gacgagatca ccaacccgat cgtgaagcgc gccctgaccc aggccaggaa ggtggtgaac 1500

gccatcatca ggaggcacgg ctctccacat agcgtgcaca tcgagctggc cagggagctg 1560

tctaagaatc acgatgagag gacaaagatc gtgtcagccc aggacgagaa ctacaagaag 1620

aataagggcg ccatctctat cctgtctgag cacggcatcc tgaacccaac aggctacgac 1680

atcgtgaggt acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaaggag 1740

atcccagccg atacattctt caatgagctg aagaaggaga ggaatggcgc cccaatcctg 1800

gaggtggatc acatcctgcc atactctcag agcttcatcg attcatacca caacaaggtg 1860

ctggtgtaca gcgacgagaa caggaagaag ggcaatcgca tcccatacac atacttcctg 1920

gagaccaaca aggattggga ggccttcgag aggtacgtgc gcagcaacaa gttcttcagc 1980

aagaagaagc gcgagtacct gctgaagagg gcctacctgc ctagggagtc tgagctgatc 2040

aaggagaggc acctgaatga tacaaggtac gccagcacct tcctgaagaa cttcatcgag 2100

cagaacctac agttcaagga ggccgaggat aacccaagga agaggagggt tcagacagtg 2160

aatggcgtga tcacagccca cttcaggaag aggtggggcc tggagaagga taggcaggag 2220

acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280

acaagggtga cagagtacta ccagatcaag gagagcaaca agagcgtgaa gaagccatac 2340

ttcccaatgc catgggaggg cttcagggat gagctactgt ctcacctggc ctctcagcca 2400

atcgccaaga agatctctga ggagctgaag gccggctacc agtctctgga ttacatcttc 2460

gtgtctagga tgccaaagag gtctatcaca ggcgccgccc acaagcagac aatcatgagg 2520

aagggcggca tcgataagaa gggcaagaca atcatcatcg agaggctgca tctgaaggac 2580

atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tatggccaca 2640

tacgaggcca tcaagcagcg ctacctagag cacggcaaga actctaagaa ggccttcgag 2700

acaccactgt acaagccatc taagaagggc accggcaatc tgatcaagag ggtgaaggtg 2760

gagggccagg ccaagtcttt cgtgagggag gtgaatggcg gcgtggccca gaatggcgat 2820

ctggtgaggg tggatctgtt cgagaaggat gataagtact acatggtgcc aatctacgtg 2880

ccagatacag tgtgctctga gctgccaaag aaggtggtgg cctcttctaa gggctacgag 2940

cagtggctaa cactggataa cagcttcaca ttcaagttca gcctgtaccc atacgatctg 3000

gtgaggctgg tgaagggcga tgaggatagg ttcctgtact tcggcacact ggatatcgat 3060

agcgacaggc tgaacttcaa ggacgtgaac aagccgagca agaagaacga gtaccgctac 3120

agcctgaaga caatcgagga cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180

ctggtgagga aggagacaag gaggaatttc cac 3213

<210> 173

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07513.1大豆优化的"

<400> 173

atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatggggc 60

gtgattgagc tttcctggaa taaagatcgc gagcaatatg aaaagaccag gattgtggat 120

aagggagtga ggatgttcga taaggctgaa attcctaaga ctggagcttc tcttgctgaa 180

ccaagaagaa ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240

gatataagga accttctcgt tcagcatgaa atcatttccc agaaggaatt aacctctctc 300

taccctctct ccaaatcaag catggacatc tgggatataa ggcttgatgg actcgatagg 360

cttcttgata gatttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420

aaatcaaacc gcaagtccga attaaaggat gttgagactg gaaaggtgct ttcaagcatc 480

caggtgaatg aaaagaggct ttctttgtat aggactgttg gggagatgtg gatgaaaaac 540

gccgattgct caaaatatgg aaagaggagg aactctccta acgagtacgt gttttctgtt 600

tctagggctg atcttgagaa ggagattgtg actctttttg aggctcagag gaagttccac 660

tcttcttacg cttctgtgga tctccaaaag acatacattc agatttgggc tcatcagctt 720

ccttttgctt ctggaaacgc cattgtgaat aaagtgggat actgctccct attaaaggga 780

aaggagaaga gagtgcctaa ggctacctat acattccagt acttcaatac cctcgatcaa 840

atcaacagaa ctaggcttgg acctaacttc cagcctttta ctaaggagca gagggatata 900

atcctcgata aaatgttcca gcgcaccgac tactataaaa agaagaccat ccccgaggtg 960

acctactacg atataagaaa gtggcttgct ctcgatgaaa ccattcagtt caagggacta 1020

acttatgacc ccaacgagga gctgaagaaa atagagatga aacccttcat aaacctcaag 1080

cccttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaggtgttc 1140

tctgctcttg attacgatac tgtggcttac gctcttaccg tgtataaaac cgacaaggat 1200

ataaggtctt acctcaagcg ctccaataat ctctctaaga ggtgctacga cgatcaatta 1260

attgaggagc ttctcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320

aaccatgtgc ttccaataat gcaagaggga agaacttacc aagaggcaat acaccagctt 1380

ggatacgata caaccaacct caagaaggag aatagaagca tgttcctccc aatcatccct 1440

gatgaaataa ccaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500

gcaataatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc cagggaatta 1560

agcaagtctc atgatgagag gaagaagatt atgactgctc acgacgagaa ctacaagaag 1620

aacaagggag ctgtgtccat tctcattgat aacggaattc ttaaccctac cggatacgat 1680

attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaagaag 1740

attcctgcta acaccttctt caacgagctt aagaaggaaa gatctggacc tcctgttctt 1800

gaggtggatc acattctacc ttactcccag tccttcattg attcttacca taacaaggtg 1860

cttgtttacg gagatgagaa ccaaaagaag gggaacagga ttccttacac tttcttctct 1920

gaagaagata aggagtggga gtctttcgag tcttacgtga ggtccaactc cttcttctct 1980

aagaagaaga ggggatacct tcttaagaag gcttatcttc ctagggagtc taaccttatt 2040

aaggagaggc accttaacga taccaggtac gcttcatctt acctcaagaa cttcatcgag 2100

aagaacctta agttcaagga ggctgtggga attactagga agaagtacgt tcagactgtg 2160

aacggagtga ttactgctca tcttagaaag agatggggac ttgagaagga taggcaagag 2220

acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca ccatatggtg 2280

actaaggtta ccgagtacta ccaaattaag gaggggaaca agtccatcaa gaagccttat 2340

tttcctctac cttggatggg attcagggag gagattcttt ctcatcttga gtctcaacct 2400

atcgctagaa agatttccga ggagcttaag attggatacc agtcccctga ttacattctt 2460

gtgtctagaa tgcctaagag gtctgttact ggatctgctc atgatcagac tgtgatgaag 2520

aagggggata ttgataagaa ggggaagacc atcattatta agagggtgca cctcaaggac 2580

atcaagttcg atgagaacgg agatttcaag atggttggaa aggagcagga tctagctact 2640

tacgaggcta ttaagcagag gtatcttgag tataggaagg agtctaagaa ggctttcgag 2700

actcctcttt acaagccttc taagaaggga aaggggaacc tcatcaagaa gattaaggtt 2760

gaggttcaga ctaagtcttt cgtgagggag attaatggag gagttgctca gaatggagat 2820

cttgtgaggg ttgatctttt cgagaaggac aacaggtact acatggtgcc tatctacgtt 2880

gttgatactg ttaggtctga gctacctaac aaggctgtta cttcttctaa gggatacgag 2940

cagtggctct ctattgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000

gttaggcttg ttaagggaga tgaggatagg ttcctctact tctccaccct cgatattaac 3060

tctgataggc tcaacttcaa ggatgtgaac aagccttcta agcaagctga gtacaggtac 3120

tctcttaaga ccattgagaa ccttgagaag tacgagattg gagttcttgg agatctaagg 3180

cttgttaggc aggagaccag gaagattttc aag 3213

<210> 174

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07513.1玉米优化的"

<400> 174

atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat cggctggggc 60

gtgatcgagc tgagctggaa taaagatcgc gagcagtatg aaaagaccag gatcgtggac 120

aagggcgtga ggatgttcga taaggccgag atcccaaaga caggcgcctc tctggccgaa 180

ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaag 240

gatataagga acctgctggt ccagcatgaa atcatcagcc agaaggagct gacaagcctg 300

tacccgctga gcaagtcaag catggacatc tgggatataa ggctggatgg cctggatagg 360

ctgctggata ggttcgagtg ggccaggctg ctgatacatc tggcccagag gaggggcttc 420

aaatcaaatc gcaagagcga attaaaggac gtggagacag gcaaggtgct gtcaagcatt 480

caggtgaatg aaaagaggct gagcctgtac aggacagtgg gcgagatgtg gatgaaaaac 540

gccgactgct caaaatacgg caagcgccgc aacagcccaa acgagtacgt gttctctgtg 600

tctagggccg atctggagaa ggagatcgtg acactgttcg aggcccagag gaagttccac 660

tcttcttacg cctctgtgga cctgcagaag acatacatcc agatctgggc ccaccagctg 720

ccattcgcct ctggcaatgc catcgtgaat aaagtgggct actgctctct attaaagggc 780

aaggagaaga gggtgccaaa ggccacctat acattccagt acttcaatac cctggaccaa 840

atcaacagga cccgcctggg cccaaacttc cagccattca caaaggagca gcgcgatata 900

atcctggata aaatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960

acatactacg atataaggaa gtggctggcc ctggatgaaa ccatccagtt caagggccta 1020

acctacgacc cgaacgagga gctgaagaag atcgagatga aaccgttcat aaacctgaag 1080

ccgttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaggtgttc 1140

agcgccctgg actacgacac cgtggcctac gccctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaagcg cagcaataat ctgagcaagc gctgctacga cgaccaatta 1260

atcgaggagc tgctgaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320

aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380

ggctacgaca caaccaacct gaagaaggag aaccgaagca tgttcctgcc aataatcccg 1440

gacgagataa ccaacccgat cgtgaagcgc gccctgaccc aggcccgcaa ggtggtgaac 1500

gcaataatcc gccgctacgg ctcaccgaac agcgtgcaca ttgagctggc ccgcgaatta 1560

agcaagagcc acgacgagcg caagaagatc atgaccgccc acgatgaaaa ctacaagaaa 1620

aataagggcg ccgtgagcat cctgatcgac aacggcatcc tgaacccgac cggctacgac 1680

atcgtgcgct acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaagaag 1740

atcccagcca acaccttctt caacgagctg aagaaggaga ggtctggccc accagtgctg 1800

gaggtggatc acatcctgcc atactcacag agcttcatcg atagctacca caacaaggtg 1860

ctggtgtacg gcgatgagaa ccagaagaag ggcaatcgca tcccatacac attcttcagc 1920

gaggaggata aggagtggga gagcttcgag agctacgtga ggagcaacag cttcttcagc 1980

aagaagaaga ggggctacct gctgaagaag gcctacctgc caagggagtc taacctgatc 2040

aaggagaggc acctgaacga tacaaggtac gccagcagct acctaaagaa cttcatcgag 2100

aagaacctga agttcaagga ggccgtgggc atcacccgca agaagtacgt ccagacagtg 2160

aacggcgtga tcacagccca cctgaggaag aggtggggcc tggagaagga taggcaggag 2220

acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280

acaaaggtga cagagtacta ccagatcaag gagggcaaca agagcatcaa gaagccatac 2340

ttcccactac catggatggg cttcagggag gagatcctgt ctcacctgga gtctcagcca 2400

atcgccagga agatctctga ggagctgaag atcggctacc agtctccaga ttacatcctg 2460

gtgtctagga tgccaaagag gtctgtgaca ggctctgccc acgatcagac agtgatgaag 2520

aagggcgata tcgacaagaa gggcaagacc atcatcatca agagggtgca cctgaaggac 2580

atcaagttcg acgagaacgg cgacttcaag atggtgggca aggagcagga tctagccaca 2640

tacgaggcca tcaagcagcg ctacctggag tacaggaagg agtctaagaa ggccttcgag 2700

acaccactgt acaagccatc taagaagggc aagggcaacc tgatcaagaa gatcaaggtg 2760

gaggtccaga ccaagagctt cgtgagggag atcaatggcg gcgtggccca gaatggcgat 2820

ctggtgaggg tggatctgtt cgagaaggat aacaggtact acatggtgcc aatctacgtg 2880

gtggatacag tgaggagcga gctaccaaac aaggccgtga catcttctaa gggctacgag 2940

cagtggctga gcatcgacaa cagcttcacc ttcaagttca gcctgtaccc atacgatctg 3000

gtgaggctgg tgaagggcga tgaggacagg ttcctgtact tcagcacact ggacatcaac 3060

agcgacaggc tgaacttcaa ggacgtgaac aagccatcta agcaggccga gtacaggtac 3120

agcctgaaga ccatcgagaa cctggagaag tacgagatcg gcgtgctggg cgatctaagg 3180

ctggtgaggc aggagacaag gaagatcttc aag 3213

<210> 175

<211> 3216

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG08290.1大豆优化的"

<400> 175

atgtctgagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatgggga 60

gtgattgagc ttttctggaa taaagatcgc gagcgctatg aaaaggttag gattgtggat 120

aagggagtga ggatgttcga taaggccgag attcctaata aaggagcttc acttgctgaa 180

ccaagaagga ttgctagatc tagcaggagg agattaaaca ggaagtctca gaggaagaag 240

gagattagga accttcttgt tcagcacgga atgattactc aggaggagct tgatcttctc 300

taccctctct ccaagaaatc aatcgatatc tgggatataa ggcttgatgg actcgatagg 360

ctattaaacc atcttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420

aaatcaaacc gcaagtccga attaaaggat gctgagactg gaaaggttct ttcaagcatc 480

caggtgaatg aaaagaggct tttcttgtat aggactgtgg gcgagatgtg gataaaagat 540

gccgagttct caaaatatga taggaggagg aactctccta acgagtacgt gttttctgtt 600

tctagggctg atcttgagaa ggagattgtg actttgtttg aggctcaacg caagttccaa 660

tcaagctacg cttctaagaa ccttcaagag acctaccttc aaatttgggc tcatcagctt 720

ccttttgctt ccgggaacgc tattctcaat aaagtgggat actgctcctt attaaaggga 780

aaggagagaa ggattcctaa ggccacctat acattccagt acttctctgc tcttgatcaa 840

gtgaatagaa ctaggcttgg acctgatttc caacctttca ctcaggagca gaaggaaata 900

atcctcgata aaatgttcca gcgcaccgac tactataaaa agaagaccat ccccgaggtg 960

tcctactacg atataagaaa gtggcttgag cttgatgaaa ccattcagtt caagggatta 1020

aactacgacc ccaacgagga gctgaagaaa atagagaaga agcccttcat aaacctcaag 1080

gccttctacg aaatcaagaa ggtggttgct aactacgctg aacgaaccaa cgaagcattc 1140

tctaccctcg attacgatgc tattgcttac gctcttaccg tgtataaaac cgacaaggat 1200

ataaggtcct acctcaagaa atcaaacaac ctctccaaga ggtgctacga cgatcaatta 1260

atcgaggagc ttttcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320

aaccatgtgc ttcctattat gcaagaggga agaacttacc aagaggctat tcatcagctt 1380

ggatacgata ccaccaacct taagaaggag aacaggtcta tgttcctccc tctcattcct 1440

gatgagatta ctaaccctat tgtgaagagg gctattactc aagctaggaa ggtggtgaat 1500

gctattatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc tagggagctt 1560

tctaagtctc atgatgagag gaagaagatt atgactgctc acgacgagaa ctacaagaag 1620

aacaaggggg ctatttccat tctcattgag aacggaattc ttaaccctac cggatacgat 1680

attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaaggaa 1740

attcctcctg ataccttctt caacgagctt aagaaggaga ggaacggatc acctattctt 1800

gaggtggatc acattcttcc ttactcccag tccttcattg attcttacca taacaaggtg 1860

cttgtgtatt ccgatgagaa caggaacaag ggaaacagga ttccttacac ctacttcctt 1920

gagactaata aggattggga ggcttttgag aggtatgtga ggtctaacaa gctcttctct 1980

aagaagaaga gggagtacct ccttaagaag acttaccttc ctagggagtc tgagcttatt 2040

aaggagaggc atctaaacga taccaggtac gcttctacct tcctcaagaa cttcattgag 2100

cagaaccttc aattcaagga ggttgaggtt aaccttagga agaagagggt tcagactgtg 2160

aacggagtta ttactgctca tcttagaaag agatggggac ttgagaagaa caggcaagag 2220

acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca tcacatggtg 2280

actaggatta ccgagtacta ccagattaag gagtcaaaca agtctgtgaa gaagccttat 2340

tttcctatgc cttgggaggg attcagggat gagcttcttt ctcatcttgc ttctcagcct 2400

atcgctaaga agatttctga agagcttaag gctggatacc agtcctctga ttacattttc 2460

gtgtctagaa tgcctaagag gtctgttact ggagctgctc atgatcaaac tattaggagg 2520

aagggaggaa ttgataagaa ggggaagacc atcattatta agagggtgag gctaaaggac 2580

atcaagttcg atgagaacgg ggatttcaag atggttggaa aggagcagga tcttgctact 2640

tacgaggcta ttaagcagag atatcttgag cacaggaaga actctaagaa ggctttcgag 2700

actcctcttt acaagccttc taagaaggga accggaaacc ttatcaagag agttaagatt 2760

gagggacaga ctaaggcttt cgttagagag gttaatggag gagttgctca gaactctgat 2820

cttgtgaggg ttgatctatt cgagaaggac gataagtact acatggtgcc tatctacgtt 2880

cctgatactg tttgttccga gcttcctaag aaggttgtta agtctggaaa gggatacgag 2940

caatggctta cccttgataa ctctttcacc ttcaagtctt ctctctaccc ttacgatctt 3000

gttaggcttg ttaagggaaa cgaggatagg ttcctttact tcgggaccct cgatattgat 3060

tctgataggc tcaacttcaa ggatgtgaac aagccttcaa agcaaaacga gtacaggtac 3120

tctctcaaga ccattgagaa ccttgagaag tacgaagtgg gagttcttgg agatcttagg 3180

cttgttaagc aagagaccag gaggattttc aatagg 3216

<210> 176

<211> 3216

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG08290.1玉米优化的"

<400> 176

atgtcagagc tggactacag gatcggcctg gacataggca ctaattcaat cggctggggc 60

gtgatcgagc tgttctggaa taaagaccgc gagcgctatg aaaaggtgcg catcgtggac 120

aagggcgtta ggatgttcga taaggccgag atcccgaata aaggcgcctc actagccgaa 180

ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gaggaagaag 240

gagatcagga acctgctggt ccagcacggc atgatcacac aggaggagct ggatctgctg 300

tacccactga gcaagaaaag cattgacatc tgggacatca ggctagatgg cctggacagg 360

ctgctgaatc acctggagtg ggccaggctg ctgatacatc tggcccagag gaggggcttc 420

aaatcaaatc gcaagtctga attaaaggat gccgagacag gcaaggtgct gtcaagcatc 480

caggtgaatg aaaagaggct gttcctctac cgcacagtgg gcgagatgtg gataaaagac 540

gccgagttca gcaagtacga caggaggagg aacagcccaa acgagtacgt gttctctgtg 600

tcaagggccg atctggagaa ggagatcgtg acactgtttg aggctcagcg caagttccaa 660

tcaagctacg ccagcaagaa cctgcaagag acctacctgc agatctgggc ccaccagctg 720

ccattcgcta gcggcaatgc catcctgaat aaagtgggct actgctctct attaaagggc 780

aaggagagga ggattccaaa ggccacctat acattccagt acttcagcgc cctggaccag 840

gtgaatagga caaggctggg cccagatttc cagccattca cacaggagca gaaggaaata 900

atcctggata aaatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960

tcatactacg atataaggaa gtggctggag ctggatgaaa ccatccagtt caagggatta 1020

aactacgacc cgaacgagga gctgaagaaa atagagaaga agccgttcat aaacctgaag 1080

gccttctacg aaatcaagaa ggtggtggcc aactacgccg agcgaaccaa cgaagcattc 1140

agcaccctgg actacgacgc catcgcctac gccctgaccg tgtataaaac cgacaaggat 1200

ataaggtcat acctgaagaa atcaaacaac ctgagcaagc gctgctacga cgaccaatta 1260

atcgaggagc tgttcaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320

aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380

ggctacgaca ccaccaacct gaagaaggag aaccgcagca tgttcctgcc gctaatcccg 1440

gacgagatca ccaacccgat cgtgaagcgc gccatcaccc aggctaggaa ggtggtgaac 1500

gccatcatcc gccgctacgg cagcccgaac agcgtgcaca tcgagctggc ccgcgagctg 1560

agcaagagcc acgacgagcg caagaagatc atgacagccc acgacgagaa ctacaagaag 1620

aacaagggcg ccatctcaat cctgatcgag aacggcatcc tgaacccaac cggctatgac 1680

atcgtgcgct acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaaggag 1740

atcccaccag atacattctt caacgagctg aagaaggaga ggaatggctc tccaatcctg 1800

gaggtggatc acatcctgcc atacagccag tcattcatcg acagctacca caacaaggtg 1860

ctggtgtaca gcgatgagaa caggaacaag ggcaaccgca tcccgtacac atacttcctg 1920

gagaccaaca aggattggga ggccttcgag aggtacgtga ggagcaacaa gctgttcagc 1980

aagaagaagc gcgagtacct gctgaagaag acctacctgc caagggagtc agagctgatc 2040

aaggagaggc acctgaacga tacaaggtac gctagcacct tcctgaagaa cttcatcgag 2100

cagaacctgc agttcaagga ggtggaggtg aacctgagga agaagcgcgt tcagacagtg 2160

aacggcgtga tcacagccca cctgaggaag aggtggggcc tggagaagaa taggcaggag 2220

acatacctac accacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280

acaaggatca cagagtacta ccagatcaag gagagcaaca agagcgtgaa gaagccatac 2340

ttcccaatgc catgggaggg cttcagggat gagctgctgt ctcacctggc ctctcagcca 2400

atcgccaaga agatctcaga ggagctgaag gccggctacc agtcttctga ttacatcttc 2460

gtgtctagga tgccaaagag gtctgtgaca ggcgccgccc acgatcagac aatcaggagg 2520

aagggcggca tcgataagaa gggcaagaca atcatcatca agagggtgag gctgaaggat 2580

atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tctagccaca 2640

tacgaggcca tcaagcagcg ctacctggag cacaggaaga actctaagaa ggccttcgag 2700

acaccactgt acaagccatc taagaagggc accggcaatc tgatcaagag ggtgaagatc 2760

gagggccaga caaaggcctt cgtgagggag gtgaatggcg gcgtggccca gaattctgat 2820

ctggtgaggg tggatctatt cgagaaggac gataagtact acatggtgcc aatctacgtg 2880

ccagatacag tgtgctccga gctgccaaag aaggtggtga agtctggcaa gggctacgag 2940

cagtggctca cactggataa cagcttcaca ttcaagagca gcctgtaccc atacgatctg 3000

gtgaggctgg tgaagggcaa tgaggacagg ttcctgtact tcggcacact agacatcgat 3060

agcgacaggc tgaacttcaa ggacgtgaac aagccaagca agcagaacga gtaccgctac 3120

agcctgaaga ccatcgagaa cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180

ctggtgaagc aggagacaag gaggatcttc aatagg 3216

<210> 177

<211> 4011

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05459.1大豆优化的"

<400> 177

atgaagaagg actacgtgat cggactagat attggaacta actctgtggg atgggctgtt 60

atgactgagg attaccagct agttaagaag aagatgccca tctacgggaa tacagagaag 120

aagaagatca agaagaactt ctggggagtg agactatttg aagagggtca tactgctgag 180

gataggagat taaagagaac tgctaggaga aggatttcta ggaggaggaa caggcttcgt 240

taccttcaag cattctttga agaggctatg accgctctag atgaaaattt cttcgctagg 300

cttcaggagt cttttcttgt gcctgaggat aaaaagtggc acaggcatcc tatttttgct 360

aagttagagg atgaggtggc ttaccatgaa acctacccta ctatctacca ccttaggaag 420

aagttggctg attcttcaga gcaagccgac ttgagattaa tctaccttgc tcttgcccac 480

attgtaaaat ataggggaca cttccttatc gagggaaaac tctccaccga aaatatttca 540

gtgaaggagc agtttcagca gttcatgatc atctataacc aaaccttcgt gaacggagaa 600

tcaaggcttg tgtctgctcc tcttcctgag tccgtattaa ttgaggagga acttactgag 660

aaagcatcca gaaccaagaa gtctgagaag gttcttcaac agtttcctca agagaaggct 720

aacggacttt tcggacagtt cctcaaatta atggtgggga ataaagccga cttcaagaag 780

gtttttggac ttgaggagga ggccaaaata acttacgctt ctgagtctta tgaggaggat 840

cttgagggaa tactagctaa ggtgggagat gaatacagcg atgttttcct tgctgctaag 900

aacgtttacg acgctgtgga attaagcacc atactagctg actccgataa aaagtctcac 960

gccaaactct cttcaagcat gattgttagg ttcactgagc atcaggagga tcttaagaag 1020

ttcaagaggt tcattaggga gaactgccct gatgagtacg ataacctttt caagaacgag 1080

caaaaggatg ggtacgctgg atacattgct catgctggaa aggtgtcaca attaaagttc 1140

taccagtacg tgaagaaaat aatccaggat atcgctggag ccgagtactt ccttgagaaa 1200

atagctcagg agaacttcct taggaagcag aggactttcg ataacggagt gattcctcac 1260

caaatacacc ttgctgagct acaggcaata attcataggc aagctgcata ctatcctttc 1320

ctcaaggaga atcaagagaa aatagagcag ctcgtgacct tcagaattcc atactacgtg 1380

ggacctcttt ctaagggaga tgcttctact tttgcttggc ttaagagaca gtcagaggaa 1440

ccaattaggc cttggaatct tcaagagact gtggatcttg atcaatctgc tactgctttc 1500

atagagagga tgaccaactt cgatacatac cttccttctg agaaggtgct ccctaagcat 1560

tctctcctct atgaaaagtt catggtgttc aacgagctaa ccaaaatatc ctacaccgac 1620

gataggggaa tcaaggctaa tttctctgga aaggagaagg agaaaatatt cgactacctc 1680

ttcaagacca ggaggaaggt gaagaagaag gacataatac agttctaccg caacgaatac 1740

aacaccgaga ttgtgacctt gtcaggactt gaggaggatc aattcaacgc ttctttctct 1800

acctaccagg atctattaaa gtgcggactt actagggctg agcttgatca tcctgataat 1860

gctgagaagc tggaggacat aatcaagata ctaaccatct tcgaggatag gcaaaggatt 1920

aggacccagc tttctacttt caagggacaa ttctctgctg aggttcttaa gaagttggag 1980

aggaagcatt atactggatg gggaaggctc tctaagaagc tcattaacgg aatctacgat 2040

aaggagtcag ggaagaccat cctagattac ctcattaagg atgatggagt gtctaagcac 2100

tacaacagga acttcatgca gctcattaac gattcccagc tctccttcaa gaacgctatt 2160

caaaaggctc aatcttctga gcatgaagag actctttctg agactgttaa cgaattagct 2220

gggtcccctg ctattaagaa gggaatctac cagtctctca agattgtgga tgagcttgtg 2280

gctattatgg gatatgctcc taagaggatt gttgttgaga tggctaggga gaaccaaact 2340

acttctactg gaaagaggag gtctattcag aggctaaaga ttgttgaaaa ggctatggct 2400

gagattggat ctaaccttct taaggagcag cctactacta acgagcaact tagggatacc 2460

aggctcttcc tttactacat gcagaacgga aaggatatgt acactggaga tgagctttct 2520

cttcataggc tctcacacta cgacatagat cacattatcc ctcagtcctt catgaaggat 2580

gattctctcg ataaccttgt gcttgtggga tctactgaga ataggggaaa gtctgatgat 2640

gttccttcta aggaggtggt taaggatatg aaggcttact gggagaaact atacgctgct 2700

ggacttattt ctcaaaggaa gttccagaga cttactaagg gagagcaagg aggacttact 2760

cttgaggata aggctcattt cattcaaagg cagcttgttg agaccaggca gattactaag 2820

aacgtggctg gaattctaga tcaaaggtac aacgctaact ctaaggagaa gaaggttcag 2880

atcattaccc tcaaggcttc tcttacctcc cagttcaggt ctattttcgg actttacaag 2940

gttagggagg tgaacgatta ccatcatgga caagatgctt accttaactg cgtggttgct 3000

actactctac ttaaggttta tcctaacctt gctcctgagt tcgtttacgg agagtatcct 3060

aagttccagg ctttcaagga gaataaggct accgctaaga ccattatcta caccaacctt 3120

atgaggttct ttactgagga tgagcctagg tttatgaagg atggagagat tctctggtca 3180

aactcctacc tcaagaacat caagaaggag cttaactacc accagatgaa cattgtgaag 3240

aaggtggagg ttcaaaaggg aggattctcc aaggagtcta ttaagcctaa gggaccttct 3300

aacaagctca ttcctgtgaa gaacggactt gatcctcaaa agtacggagg attcgattca 3360

cctgttgttg cttacactgt tcttttcact cacgaaaagg ggaagaagcc tctcattaag 3420

caggagattc tcggaattac cattatggag aagactaggt tcgagcagaa ccctattctt 3480

tttctagagg agaagggatt tcttaggcct agggttctta tgaagctccc taagtacact 3540

ctttatgagt ttcctgaggg aagaaggaga cttcttgctt ctgctaagga ggctcaaaag 3600

ggaaaccaaa tggttcttcc tgagcacctt cttactcttc tttaccatgc taagcaatgc 3660

ctacttccta accaatctga gtctcttgct tacgtagaac aacatcaacc tgagttccaa 3720

gagattcttg agagggttgt ggatttcgct gaggttcata cccttgctaa gtctaaggtt 3780

cagcagattg ttaagttgtt cgaggctaac cagactgctg atgttaagga gatcgctgct 3840

tcattcattc agcttatgca attcaatgct atgggtgctc cttctacctt caagttcttc 3900

cagaaggata tagagagggc taggtacacc tccatcaagg agattttcga tgctaccatt 3960

atctaccagt ctactactgg actttatgag actaggagga aggtggttga t 4011

<210> 178

<211> 4011

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05459.1玉米优化的"

<400> 178

atgaaaaagg actacgtgat cggcctggac atcggcacta attcagtggg ctgggccgtg 60

atgacagagg actaccagct ggtgaagaag aagatgccta tctacggcaa cactgagaag 120

aagaagatca agaagaactt ctggggcgtg cgcctattcg aggagggcca cacagccgag 180

gaccgcagat taaagaggac agccaggagg aggatctcta ggaggaggaa taggctgcgc 240

tacctgcaag cattcttcga ggaggccatg acagccctgg atgaaaattt cttcgccagg 300

ctgcaggagt ctttcctagt gccggaggat aaaaagtggc acaggcaccc tatcttcgcc 360

aagctggagg atgaggtggc ctaccatgaa acatacccaa caatctacca cctgaggaag 420

aagctggccg attcttctga gcaggccgac ctgagattaa tctacctggc cctggcccac 480

atcgtcaaat acaggggcca cttcctgatc gagggcaaac tgagcacaga aaatatcagc 540

gtgaaggagc agttccagca gttcatgatc atctataacc aaaccttcgt gaacggcgaa 600

tcaaggctgg tgagcgcccc actgccggag agcgtattaa tcgaggagga actgaccgag 660

aaagcatccc gaaccaagaa gagcgagaag gtgctgcagc agttcccgca agagaaggct 720

aatggcctgt tcggtcagtt cctgaaactg atggtgggca ataaagccga cttcaagaag 780

gtgttcggcc tagaggagga ggccaaaata acctacgcca gcgagagcta cgaggaggac 840

ctggagggca tactagccaa ggtgggcgat gaatacagcg atgtgttcct ggccgccaag 900

aatgtgtacg atgccgtgga gctgtctaca atactagccg acagcgataa aaagagccac 960

gccaagctct cttcaagcat gatcgtgagg ttcacagagc atcaggagga cctgaagaag 1020

ttcaagcgct tcatcaggga gaactgcccg gacgagtacg acaacctgtt caagaacgag 1080

cagaaggatg gctacgccgg atacatcgcc cacgccggta aggtgtccca attaaagttc 1140

taccagtacg tgaagaaaat aatccaggac atcgccggcg ccgagtactt cctggagaaa 1200

atagcccagg agaacttcct gcgcaagcag aggacattcg acaacggcgt catcccgcac 1260

cagatacatc tggccgagct gcaggccatc atacataggc aggccgcata ctacccattc 1320

ctaaaggaga accaagagaa aatagagcag ctggtgacct tccgcatccc atactacgtg 1380

ggcccactgt ctaagggcga tgcctctaca ttcgcctggc tgaagaggca gtctgaggaa 1440

ccaatcaggc catggaatct gcaagagaca gtggatctgg atcagtctgc cacagccttc 1500

atcgagagga tgaccaactt cgatacatac ctaccaagcg agaaggtgct gccaaagcat 1560

agcctgctgt atgaaaagtt catggtgttc aacgagctaa ccaagatcag ctacaccgac 1620

gaccgcggaa tcaaggccaa cttcagcggc aaggagaagg agaaaatatt cgactacctg 1680

ttcaagaccc gccgcaaggt gaagaagaag gacataatac agttctaccg caacgaatac 1740

aacaccgaga tcgtgaccct gagcggcctt gaggaggacc agttcaacgc cagcttctca 1800

acctaccagg acctattaaa gtgcggcctg acccgcgccg agctggacca cccggataac 1860

gccgagaagc tggaggacat aatcaagata ctaaccatct tcgaggaccg ccagcgcatc 1920

cgcacccaat taagcacctt caagggccag ttcagcgccg aggtattaaa gaagctggag 1980

cgcaagcatt acacaggctg gggcaggctg agcaagaagc taatcaacgg catctacgac 2040

aaggagagcg gcaagaccat ccttgactac ctgatcaagg acgatggcgt gagcaagcac 2100

tacaaccgca acttcatgca gctgatcaac gacagccagc tgagcttcaa gaacgccatc 2160

cagaaggccc agtcttctga gcacgaggag acactgtctg agacagtgaa tgagctggcc 2220

ggctcaccag ccatcaagaa gggcatctac cagtctctga agatcgtgga tgagctggtg 2280

gccatcatgg gctacgcccc aaagaggatc gtggtggaga tggccaggga gaatcagaca 2340

acatcaacag gcaagaggag gtctatccag aggctgaaga tcgtggagaa ggccatggcc 2400

gagatcggct ctaatctgct gaaggagcag ccaacaacaa atgagcagct gagggataca 2460

aggctgttcc tgtactacat gcagaatggc aaggatatgt acacaggcga tgagctgtct 2520

ctgcataggc tgagccacta cgacatcgat cacatcatcc cgcagtcatt catgaaggac 2580

gactctctgg ataatctggt gctggtgggc tctacagaga acaggggcaa gagcgatgat 2640

gtgccatcta aggaggtggt gaaggatatg aaggcctact gggagaagct gtacgccgcc 2700

ggcctgatct ctcagaggaa gttccagagg ctgacaaagg gcgagcaggg cggcctgaca 2760

ctggaggata aggcccactt catccagagg cagctagtgg agacaaggca gatcacaaag 2820

aatgtggccg gcatcctgga tcagaggtac aatgccaatt ctaaggagaa gaaggttcag 2880

atcatcacac tgaaggcctc tctgacatct cagttcaggt ctatcttcgg cctgtacaag 2940

gtgcgcgagg tgaatgatta ccaccacggc caggatgcct acctgaattg cgtggtggcc 3000

acaacactac tgaaggtgta cccaaatctg gccccagagt tcgtgtacgg cgagtaccca 3060

aagttccagg ccttcaagga gaataaggcc acagccaaga caatcatcta cacaaacctg 3120

atgaggttct tcacagagga cgagccaagg ttcatgaagg atggcgagat cctgtggagc 3180

aacagctacc tgaagaacat caagaaggag ctgaactacc accagatgaa catcgtgaag 3240

aaggtggagg tccagaaggg cggcttctca aaggagagca tcaagccgaa gggcccgagc 3300

aacaagctga tcccagtgaa gaatggcctg gacccacaga agtacggcgg ctttgattct 3360

ccagtggtgg cctacacagt gctgttcaca cacgagaagg gcaagaagcc actgatcaag 3420

caggagatcc tgggcatcac aatcatggag aagacaaggt tcgagcagaa cccaatcctg 3480

ttcctggagg agaagggctt cctgaggcca agggtgctga tgaagctacc aaagtacaca 3540

ctgtacgagt tcccagaggg caggaggagg ctgctggcct ctgccaagga ggcccagaag 3600

ggcaatcaga tggtgctgcc tgagcacctg ctgacactgc tgtaccacgc caagcagtgc 3660

ctgctgccaa atcagtctga gtctctggcc tacgtggagc agcaccagcc agagttccag 3720

gagatcctgg agagggtggt ggatttcgcc gaggtgcaca cactggctaa gtctaaggtt 3780

cagcagatcg tgaagctgtt cgaggccaat cagacagccg atgtgaagga gatcgccgcc 3840

tcattcatcc agctgatgca gttcaatgcc atgggcgccc catctacatt caagttcttc 3900

cagaaggata tcgagagggc caggtacaca tctatcaagg agatcttcga tgccacaatc 3960

atctaccagt ctacaacagg cctgtacgag acaaggagga aggtggtgga t 4011

<210> 179

<211> 4308

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG04583.1大豆优化的"

<400> 179

atggccaaaa atattctagg actcgatctc ggaaccaact ctattggatg ggctcttgtt 60

cagcaggact ttgaaaataa ggaggggaac atactaggaa tggggtccag aataattcct 120

atgtctcagg atatactagg agagttcggg aagggtaact ctatttctca aactgctgag 180

agaactggat ataggggagt tagaaggtta agggagagac atcttcttag aagggagagg 240

cttcataggg tgcttcatct tcttggattc ctacctaagc attacgacga gaaaatagac 300

ttcactcaga ggttcgggaa gttcatcaat caagctgaac caaagttggc tttcgattca 360

gagttcctct tcaaggactc cttccatgaa atgctagctg acttcaagca gaatcaacct 420

gagttcctca aggataaaaa cggagaggat tgccttgttc cttacgactg gactatatac 480

tacctaagga agaaagcatt gacccagaag atcgaaaaat atgagctggc ctggctcatc 540

ctcaacttca atcaaaagag gggatactat caattaaggg gagaggagga gaaggagaac 600

cctaataaac tcgtggggtt ccactctctc aaaatagtgg atgttattcc tgacgctgaa 660

accaataaaa agggagagac ctggtactca cttcatcttg agaacggatg ggtttatagg 720

aggtcctcca aaatatctct cgctgattgg aaggacaaag tgagggattt cattgtgacc 780

accgatctta atgatgatgg atcagagaag ctcgataagg atggaattgt gaagaggtct 840

tttagggctc cttctgctga tgactggacc ctattaaaga agaagaccga gaaggatatc 900

gacaactcta ataaaaccgt ggggacctac atctacgaca acctcctatt aaaccccaag 960

cagaaaatca agggaaagat ggttaggacc attgagagga agttctacaa gcaagagctg 1020

gagcagatat taaagactca gaaggagttc cattctgagc ttcagtctga gaacttgctt 1080

caagattgcg ttagggagct gtacaggaat aatgagcaac atcaacagat gcttgaggct 1140

aaggatttcg tgcacctctt cctcaacgat ataattttct accagaggcc tcttaggtcc 1200

cagaaatcaa gcatttctaa ttgcaccctt gagttccgca agtccaagaa tgaaaacgga 1260

gaggaggtaa tacacagatt aaaggtgatc gccaaatcaa acccatacta ccaggagttc 1320

aggcttcttc aatgggttca gaacctcgct atctatacta aggacgacga taagaacgta 1380

accaacgagt tcctcaaatc aactcaggat tgggaggatc ttcttaggtg gcttcactct 1440

aagaaggaaa tcaagcagga tgctctaatc aagttcctca ttgagaagaa gggactcaag 1500

gggaaagcat tgactattga ggtggcaaaa tataggtgga actacgttca ggataaggat 1560

taccctggaa atgaaacccg ctacctcatt caatcaaggc ttgataaggt tgagtacgct 1620

cctaaggatt tcctcaccta tgaaaatgaa atggccctct ggcatatcat ctactcaatc 1680

aacgacaaga tcgagtatga aaaggcatta aagtccttcg ccaataaaaa ggggctcgat 1740

gaggtgacct tcgtggaagc attcaagaag ttccctcctt tcaagtccga ttacggatct 1800

ttctctgaga aggcaatcaa gaagctcctt ccattaatga ggttcggaac tcaatggaac 1860

tgggataaca tcgaccaaaa tagcaaggag aggattggaa aaatactaac cggggagtac 1920

gatgaaaata ttaaagggag ggttagggag aaggctaggc accttaactc tgagaccgat 1980

tttcaagcat tacctctttg gcttgctcag tacgttgttt atggaaggca ctctgaagct 2040

gatattgctg gaaagtggaa ctctgtggat gatctcaagc agttccttga tgatttcaag 2100

cagcattcct tgaggaaccc tattgtggag caggttatta ctgagactct tagggctgtt 2160

aaggatattt ggaacttcta cggaaagggg gctaaggatt tcttctcaga aatacacatt 2220

gagcttggga gggagatgaa aaataccgct gatgaaagga agaggattac caccatggtg 2280

accgacaatg aaaataccaa cctcagaatc aaagcattgc ttgctgagat ggctcttgat 2340

cagaacgttg ataacgttag gccttactct cctatgcagc aggagattct taagatctat 2400

gaggagggag ttctaaacgc tgaggagaac atcgatgatg atatcctcaa gatttctaag 2460

actgctcagc cttctgctac cgatcttaag aggtataagt tgtggcttga gcaaaagtac 2520

aggtctcctt acactggaca gatgattcct cttaacaagt tgttcacccc tgagtacgag 2580

atcgagcaca ttattcctca gtctaggtac ttcgacgatt caatgtccaa caaggttatt 2640

tgcgaggctg ctgtgaacaa gttgaaggat aaccagattg gactcgtgtt cattaagaac 2700

catcatggag aggtggttga tttcggaatg ggaaagcagg tgaagattct tgaggtttct 2760

gattacgagg atttcgtgaa gcagaactat aacaagaaca ggggaaagag gaacaagctc 2820

ctcttagagg atatccctga gaagatgatt gagaggcagc ttaacgatac caggtacatc 2880

tctaagtaca ttacccaggt gctttccaac attgttaggg atgataagga gggatctaag 2940

gatgatggag tgaactccaa gaacattgtt cctggaaacg gaaagattac caccaggctt 3000

aaacaggatt ggggacttaa cgatgtgtgg aacgatcttg ttcttcctag gttcgagagg 3060

atgaacactc ttaccaactc taacgatttc acctctaaga acactcacgg aaagactatt 3120

cctactgtgc ctattgagct ttcaaaggga ttctccaaga agaggattga tcacaggcat 3180

catgctatgg atgctcttgt tattgcttgc gctactaggg atcatgtgaa ccttctcaac 3240

aacgagtctt ctaagtctga taccaagagg tacgatctta acaggaagtt gaggaagtac 3300

gagaaggttg cttacaacga tcctaagact ggagagagaa ttgagaagga ggtgcctaag 3360

gattttatta agccttggga gacctttact gaggatacta ggacccttct tgagaacatc 3420

gtgatttctt tcaagcagaa cctcagggtg attaacaagg ctaccaacta ctacgagaag 3480

attgagaacg gaaagaaggt gaaggttgag cagaagggaa ttaattgggc tgttaggaag 3540

gctctacata aggagactgt ttctggacag gtgcaccttg ataggattaa agtggctaag 3600

ggaaagattc ttaccgctac taggaagact cttgatgctt ctttcaacga gaagaccatt 3660

gagtctatta ccgataccgg gattcagaag attctcctca actacctcaa gtccaaggat 3720

aacaatcctg aggttgcttt ctctcctgaa ggaattgagg agcttaacaa gaacatcagg 3780

ctctataacg atggaaaggc tcaccagcct attcttaagg ttagggtttt cgagcaggga 3840

tctaagttta ctcttggaga gactggaaac aagactacta agtttgttga ggctgctaag 3900

ggaaccaacc ttttcttcgg aatctacgag gataagtctg gaaagaggtc ttacgagacc 3960

atccctttga acattgttat tgagaggcaa aagcaaggac tacaagctgt tcctgagact 4020

aacgagaagg gaaagcagct tcttttcacc ctttctccta acgatcttgt ttatgttcct 4080

gaggagggag ttttcgatga gaacaacatc aaggtggata ggatctacaa ggtggtgtct 4140

ttctctactt accaatgctt cttcgtgagg aacgatgtgt ctacttctgt ggttaacaag 4200

gttgagtact ctgctctcaa caagatggag aagtccatcg acaacatcat gattaaggag 4260

aactgcgtga agttgaacgt tgataggctc ggaaagattt ccaaggct 4308

<210> 180

<211> 4308

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG04583.1玉米优化的"

<400> 180

atggccaaga acatactagg cctggacctc ggaaccaatt ctatcggctg ggccctggtt 60

cagcaggact ttgagaacaa ggagggcaac atactaggca tgggcagccg aataatccct 120

atgtctcagg acatactggg cgagttcggt aagggcaaca gcatctcaca gacagccgag 180

aggacaggct accgcggcgt gaggaggctc agggagaggc acctgcttag gagggagagg 240

ctacacaggg tgctgcatct gctgggcttc ctgccaaagc attacgatga aaagatagat 300

ttcacacaga ggttcggcaa gttcatcaat caagccgaac caaagctagc cttcgattct 360

gagttcctgt tcaaggacag cttccatgaa atgctggccg acttcaagca gaatcaaccg 420

gagttcctga aggataaaaa cggcgaggac tgcctagtgc cgtacgactg gaccatatac 480

tacctgcgca agaaggccct cacccagaag atcgaaaaat acgagctggc ctggctgatc 540

cttaacttca accaaaagcg cggatactac cagctacgcg gcgaggagga gaaggagaac 600

ccgaataaac tggtgggctt ccacagcctg aaaatagtgg acgtgatccc ggacgccgag 660

actaataaaa agggcgagac ctggtactca cttcacctgg agaacggctg ggtgtaccgc 720

aggagcagca aaatatctct ggccgactgg aaggataaag tgagggactt catcgtgacc 780

acagacctga acgacgatgg ctcagagaag ctggacaagg atggcatcgt gaagaggtca 840

ttcagggccc catctgccga tgactggacc ctattaaaga agaagaccga gaaggacatc 900

gacaacagca ataaaaccgt gggcacctac atctacgaca acctgctatt aaacccgaag 960

cagaaaatca agggcaagat ggtgcgcacc atcgagcgca agttctacaa gcaggagctg 1020

gagcagatac taaagaccca gaaggagttc cacagcgagc tgcagagcga gaacctgctg 1080

caggactgcg tgcgcgagct gtaccgcaat aatgagcagc accagcagat gctggaggcc 1140

aaggacttcg tgcacctgtt cctgaacgat ataatcttct accagaggcc gctcaggagc 1200

cagaagtcaa gcatcagcaa ttgcaccctg gagttccgca agagcaagaa tgaaaacggc 1260

gaggaggtga tacatcgatt aaaggtgatc gccaagagca acccatacta ccaggagttc 1320

cgcctgctgc agtgggtcca gaacctggcc atctatacta aggacgacga caagaacgta 1380

accaacgagt tcctgaaatc aacccaggac tgggaggacc tgctgcgctg gctccacagc 1440

aagaaggaaa tcaagcagga cgccctaatc aagttcctga tcgagaagaa gggattaaag 1500

ggcaaagcat tgaccatcga ggtggcaaaa tacaggtgga actacgtcca ggacaaggac 1560

tacccgggca atgaaacccg ctacctaata cagagccgcc tggacaaggt ggagtacgcc 1620

ccgaaggact tcctgaccta cgagaatgaa atggccctgt ggcatatcat ctactcaatc 1680

aacgacaaga tcgagtatga aaaggcatta aagagcttcg ccaataaaaa gggcctggac 1740

gaggtgacct tcgtggaagc attcaagaag ttcccgccgt tcaagagcga ctacggcagc 1800

ttcagcgaga aggcaatcaa gaagctgctg ccattaatgc gcttcggcac ccagtggaac 1860

tgggacaaca tcgaccaaaa tagcaaggag cgcatcggca aaatactaac cggcgagtac 1920

gacgagaaca taaagggccg cgtgcgcgag aaggcccgcc acctgaacag cgagaccgac 1980

ttccaagcat tgccgctgtg gctggcccag tacgtggtct acggcaggca cagcgaggcc 2040

gatatcgccg gcaagtggaa cagcgtggat gatctcaagc agttcctgga cgatttcaag 2100

cagcacagcc tgaggaatcc aatcgtggag caggtgatca cagagacact aagggccgtg 2160

aaggacatct ggaatttcta cggcaagggc gccaaggact tcttcagcga gatacatatc 2220

gagctgggcc gcgagatgaa aaacaccgcc gatgaaagga agaggatcac aaccatggtg 2280

accgacaatg aaaacaccaa cctgcgaatc aaggccctgc tggccgagat ggccctggat 2340

cagaacgtgg ataacgtgag gccatactct ccaatgcagc aggagatcct gaaaatatac 2400

gaggagggcg tattaaacgc cgaggaaaat atcgacgacg acatcctgaa aataagcaag 2460

accgcccaac caagcgccac cgacctgaag cgatataagc tgtggctgga gcaaaaatac 2520

aggagcccgt acaccggcca gatgatcccg ctgaataaac tgttcacccc ggagtatgaa 2580

atcgagcata taatccctca gagccgctac ttcgacgaca gcatgagcaa caaggtgatc 2640

tgcgaggccg ccgtgaacaa gctaaaggac aaccagatcg gcctggtgtt catcaagaac 2700

caccacggcg aggtggtgga cttcggcatg ggcaagcagg tgaagatcct ggaggtgagc 2760

gactacgagg acttcgtgaa gcagaactac aacaagaacc gcggcaagag gaacaagctg 2820

ctgctggagg acatccctga gaagatgatc gagaggcagc tgaacgacac ccgctacatc 2880

agcaagtaca tcacacaggt gctgagcaac atcgtgaggg acgataagga gggctcaaag 2940

gatgatggcg tgaacagcaa gaacatcgtg ccaggcaacg gcaagatcac aacaaggctg 3000

aagcaggatt ggggcctgaa cgatgtgtgg aatgatctgg tgctgccaag gttcgagagg 3060

atgaacaccc tgaccaacag caacgacttc acctctaaga acacccacgg caagacaatc 3120

ccaacagtgc cgatcgagct gagcaagggc ttcagcaaga agaggatcga tcacaggcac 3180

cacgccatgg atgccctggt gatcgcctgc gccacaaggg atcacgtgaa tctactgaat 3240

aacgagtcta gcaagagcga tacaaagagg tacgatctga acaggaagct gcgcaagtac 3300

gagaaggtgg cctacaacga tccaaagaca ggcgagagga tcgagaagga ggtgccgaag 3360

gatttcatca agccatggga gacattcaca gaggacacaa ggaccctgct ggagaacatc 3420

gtgatcagct tcaagcagaa cctgcgcgtg atcaacaagg ccaccaacta ctacgagaag 3480

atcgagaacg gcaagaaggt gaaggtggag cagaagggca tcaattgggc cgtgaggaag 3540

gccctacata aggagacagt gtctggccag gtgcacctgg ataggatcaa ggtggccaag 3600

ggcaagatcc tgacagccac aaggaagaca ctggatgcct ctttcaacga gaagacaatc 3660

gagagcatca cagacaccgg catccagaag atcctgctga actacctgaa gagcaaggac 3720

aacaacccag aggtggcctt ctctccagag ggcatcgagg agctgaacaa gaacatcagg 3780

ctgtacaatg atggcaaggc ccaccagcca atcctgaagg tgcgcgtgtt cgagcagggc 3840

tcaaagttca cactgggcga gacaggcaat aagacaacaa agttcgtgga ggccgccaag 3900

ggcacaaatc tgttcttcgg catctacgag gataagtctg gcaagaggtc ttacgagaca 3960

atcccgctga atatcgtgat cgagaggcag aagcagggac tgcaggccgt gccagagaca 4020

aatgagaagg gcaagcagct gctgttcaca ctgtctccaa atgatctggt gtacgtgcca 4080

gaggagggcg tgttcgatga gaacaatatc aaggtggaca ggatctacaa ggtggtgagc 4140

ttctcaacct accagtgctt cttcgtgagg aacgacgtga gcacaagcgt ggtgaacaag 4200

gtggagtaca gcgccctgaa caagatggag aagagcatcg acaacatcat gatcaaggag 4260

aactgcgtga agctgaacgt ggaccgcctg ggcaagatct ctaaggcc 4308

<210> 181

<211> 4368

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG01688.1大豆优化的"

<400> 181

atgatgatca agaacatact aggactcgat ctcggaacca actctatcgg atgggctcta 60

atcaagcagg atttcgagaa caagcatgga gaaatactag ggatgggctc cagaataatt 120

cctatgtccc aggatatact aggagatttc ggaaagggta actctatttc tcagaccgct 180

gatagaacca agtataggtc tgttagaagg cttagggaga gatttcttct taggagagag 240

aggcttcata gggtgctcca cctattaaac ttccttcctc aacactacgc ttctcagatc 300

gatttcgaga agaagttcgg aaagtttaag tctgagaccg aaccaaagtt agcttgggaa 360

aattggggag gaaagttctc tttcctcttc caaaatagct tcaatgaaat gctggaggat 420

ttcaaggctg ctggacaggg gctcaaaata ccttacgact ggaccatata ctatctcagg 480

aagaaagcat tgtcccagaa aatagagaag gaggagctag cttggatact cctcaacttc 540

aatcaaaaga ggggatacta tcaattaaga ggtgaggagg aggaggagaa ccctaataaa 600

ctcgtggagt tctactccct caaaatagtg gatgttgttg ctgatgagcc tcagaaggga 660

aagtccgata tctggtactc attaattctt gagaacggat gggtttatcg cagggcttcc 720

aaaatacctc tcttcgactg gaaggataaa accagggatt tcattgtgac caccgatctt 780

aacgatgata ggtctgtgaa gactgataag gagggaaatg aaaagaggtc ttttagggct 840

ccttcagaga acgattggac tcttgtgaag aagaagactg agcaggagat tgatcagtct 900

cataaaaccg tgggaaccta catctatgaa accctcctat taaaccccaa gcagaaaatc 960

aagggaaagt tggtgaggac cattgagagg aagttctaca aggacgagct taagcagata 1020

ctagagaagc aaaaggagtt ccaccaggaa ttaaagaacg acgacctata taacgactgc 1080

attagggagc tgtacaggaa taatgaggct caccaattaa ccctctccaa gaaggatttc 1140

gtgcacctat taatggacga tctcattttc taccagaggc ctcttaggtc ccagaaatca 1200

agcatttcta attgcaccct ggagttcaga aaatacaagg atgaaaacgg gattgagcac 1260

acccagtacc tcaaggctat cccaaaatca aacccatact accaagagtt taggctttgg 1320

cagtggatgt acaacttgaa catctacaga aaggatgatg aggctaacgt aaccaaggag 1380

ttcctcaaca ccaataaaga cttcgagtct ctcttcgagt tcctcaataa tcgcaaggag 1440

attgagcaga agcccctaat caagttcctt cttgagcaga aggacataaa caagaagcta 1500

ttaaacgccg aggctgagaa atacaggtgg aactacgtgg aggataaaaa gtacccctgc 1560

aatgaaacca agaccatgat ttcctctagg cttgacaagg tggaaaatat ctccgatgat 1620

ttcctcacca gggacatcga gcagaaaata tggcatataa tctactccgt gaacgacaag 1680

atcgagtatg aaaaggcatt aaagtccttc gctaccagga acgacctcga tgaaaatagc 1740

ttcatcgaag cattcaagaa gttctcccct ttcaagtccg agtacggatc tttctctgag 1800

aaggcaatca agaagctcct tccattaatg aggctcggaa aatactggta cgaggatgaa 1860

atcgtgaagc attccgacat ctacttcaaa aatattgaga acctcctcgg ggatttctcc 1920

aaccgcgaca agaaaatatc tgaggaagac aaggagaagt ggaacaagtc aatcaacctt 1980

aagctccagg aggaattaaa ggatttccag accgctgaga ttgatttgtt ccagggactt 2040

aggcttcaca ttgctcagta ccttgtttat ggaaggcact ccgaagcatc tatgattgga 2100

aagtggaatt ctgctgagga tcttgaggag ttccttaagg atttcaagca gcattccctt 2160

aggaacccta ttgtggagca ggttattact gagactctta gggtggttaa ggatatttgg 2220

ctaaagtacg gaaacggggc taaggatttc ttcaacgaga ttcatattga gcttggaagg 2280

gaaatgaagt tgcctgctga tgataggaag aagctcacca accaaatttc tgagaacgag 2340

aacaccaact tcaggattaa ggctctcctt gctgagatga tgaacgattc ttctgttgag 2400

aacgttaggc ctttctctcc tatgcagcag gagattctaa agatctacga ggatgatgtg 2460

ctcaagtccg atatcgagat cgaggatgat atcctcaaga tttctaagac tgctcaacct 2520

tctccttctg atcttaagag gtacaagttg tggcttgagc agaagtacaa gtctccttac 2580

accggacaga ttattcctct taacaagttg ttcacccctg agtacgagat cgagcacatt 2640

attcctcagt caaggtactt cgatgattcc ttctccaata aggtgatttg cgagtctgct 2700

gtgaacaagc tcaaggataa ctacatcggg cttgagttca ttaagcagtt cggaggaact 2760

attattgagc ttggattcgg gaagtctatt aaggtgttcg agactaagga gtacgaggat 2820

ttcgtgaaga agcattacgc taacaaccag ggaaagagga acaagctcct tatggaagat 2880

atccctgaga agatgattga gaggcagatg aacgatacca ggtacatctc aaagtacatt 2940

tctggggtgc tttctaacat tgttagggtg gaagatggat ctgatgaggg agtgaactct 3000

aagaacattg ttcctggaaa cggaaagatt accacccaac ttaagcagga ttggggactt 3060

aacgatgtgt ggaacgatct cattcttcct aggttcgaga ggatgaatca gcttactaac 3120

tctaaggttt tcactgcttg gaacgagaac taccagaagt tccttcctac tgtgcctatt 3180

gagtactcca agggattctc aaagaagagg attgatcaca ggcatcatgc tcttgatgct 3240

cttgttattg cttgcgctac taaggatcac gtgaaccttc ttaacaacca gtctgctaag 3300

tctgatacca agaggtacga tctcaagaag aagtccatga agttcgagaa ggtggtttac 3360

aacgatgcta agactggaga aaagattgag agggaggttc ctaagcaatt tcttaagcct 3420

tgggagaact tcactcttga tgtgaagcac aaccttgaga ccatcattgt gtcattcaag 3480

cagaacctca gggtgattaa caaggctacc aactactacg agaagtacgt tgagaaggat 3540

ggaactaaga ataaggagag ggttgagcaa actggaacta actgggctat taggaagcct 3600

atgcacaagg atactgtgtc tggaaaagtt gatcttcctt gggttaaggt gcctaaggga 3660

aagattctta ctgctaccag gaagtctctc gattcttctt tcgatctcaa gtccattgga 3720

tctattaccg ataccgggat tcagaagatc ctaaagaact acctcgcttt caaggatgga 3780

aatcctgagc ttgctttctc tcctgaggga attgatgacc tcaacaagaa catcgagaag 3840

tataacgatg gaaagcctca ccagcctatt aacaaggtta gggttttcga gcttggatct 3900

aagttccaag ttggacagtc tggaaacaag aaggataagt atgttgaggc tgctaaggga 3960

accaaccttt tcttcgctgt ttatgaggat gagaagggaa agaggaacta cgagactatt 4020

cctctaaacg aggttattga gaggcaaaag cagggacttt ctgtggttga tcttaagggg 4080

accaacgatt tctatctttg ccctaacgat ttcgtgtaca ttccttctgg agatgagctg 4140

gagaacatca acaacgtgga cttcaaggat atcaagaagg agattaacga gaggatctac 4200

aaggtggtgt ctttcactgg aaacaggctt tcttgcattc cttacatggt ggctaccact 4260

attgtgaaca agttggagtt cacccagcta aacaagattg agttcaccaa ggagaaggag 4320

atctgcatta agttgaacgt ggataggctc ggaaacattt ctaaggct 4368

<210> 182

<211> 4368

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG01688.1玉米优化的"

<400> 182

atgatgatca agaacatcct aggcctggac ctcggaacca attctatcgg ctgggccctg 60

atcaagcagg acttcgagaa caagcatggc gagatactag gcatgggcag ccgaataatc 120

ccgatgagcc aggacatact aggcgatttc ggcaagggca atagcatctc tcagaccgcc 180

gacagaacca agtacaggtc tgttaggagg ctgagggaga ggttccttct taggagggag 240

aggctgcata gggtgctcca cctattaaac ttcctgccac agcactacgc cagccagatc 300

gacttcgaga agaagttcgg caagttcaag agcgagacag aaccaaagct ggcttgggaa 360

aactggggcg gcaagttcag cttcctgttc caaaatagct tcaatgaaat gctggaggac 420

ttcaaggccg ccggccaggg attaaagatc ccctacgact ggaccatata ctacctgcgc 480

aagaaagcat tgagccagaa aatagagaag gaggagctgg cctggatact gctgaacttc 540

aaccaaaagc gcggatacta ccagctgcgc ggtgaggagg aggaggagaa cccgaataaa 600

ctggtggagt tctactcact gaaaatagtg gacgtggtgg ccgacgagcc gcagaagggc 660

aagagcgaca tctggtacag cctgatacta gagaacggct gggtgtaccg ccgcgctagc 720

aaaataccgc tgttcgactg gaaggataaa acccgcgact tcatcgtgac caccgacctg 780

aacgacgaca ggagcgtgaa gacagataag gagggcaatg aaaagaggag cttcagggcc 840

ccaagcgaga acgattggac cctggtgaag aagaagacag agcaggagat cgatcagagc 900

cataaaaccg tgggcacata catctatgaa accctgctat taaacccgaa gcagaaaatc 960

aagggcaagc tggtgcgcac catcgagcgc aagttctaca aggacgagct gaagcagata 1020

ctagagaagc agaaggagtt ccaccaggaa ttaaagaacg acgacctata taacgactgc 1080

atccgcgagc tgtaccgcaa taatgaggcc caccaattaa ccctgagcaa gaaggacttc 1140

gtgcacctat taatggacga cctgatcttc taccagcgcc cgctgcgcag ccagaagtca 1200

agcatcagca attgcaccct ggagttccgc aaatacaagg atgaaaacgg catcgagcac 1260

acccagtacc tgaaggccat cccgaagagc aacccatact accaggagtt ccgcctgtgg 1320

cagtggatgt acaacctgaa catctaccgc aaggacgacg aggccaacgt aaccaaggag 1380

ttcctgaata caaataaaga cttcgagagc ctgttcgagt tcctgaataa tcgcaaggag 1440

atcgagcaga agccgctaat caagttcctg ctggagcaga aggacataaa caagaagcta 1500

ttaaacgccg aggccgagaa atacaggtgg aactacgtgg aggataaaaa gtacccgtgc 1560

aacgaaacca agaccatgat cagcagccgc ctggacaagg tggaaaatat cagcgacgac 1620

ttcctgaccc gcgacatcga gcagaaaata tggcatataa tctacagcgt gaacgacaag 1680

atcgagtatg aaaaggcatt aaagagcttc gccacccgca acgacctgga tgaaaacagc 1740

ttcatcgaag cattcaagaa gttcagcccg ttcaagagcg agtacggcag cttcagcgag 1800

aaggcaatca agaagctgct gccattaatg cgcctgggaa aatactggta cgaggacgag 1860

atcgtgaagc atagcgacat ctacttcaaa aatatcgaga acctgctggg cgacttcagc 1920

aaccgcgaca agaaaataag cgaggaggac aaggagaagt ggaacaaaag catcaacctg 1980

aagctgcagg aggaattaaa ggacttccag accgccgaga tcgacctgtt ccagggcctg 2040

cgcctccaca tcgcccagta cctggtgtac ggccgccaca gcgaggcaag catgatcggc 2100

aagtggaaca gcgccgagga cctggaggag ttcctgaagg acttcaagca gcatagcctg 2160

cgcaacccga tcgtggagca ggtgatcacc gagaccctgc gcgtggtgaa ggacatctgg 2220

ctaaaatacg gcaacggcgc caaggacttc ttcaatgaaa ttcacatcga gctgggccgc 2280

gagatgaaac tgccggccga cgaccgcaag aagctgacca accaaatcag cgagaatgaa 2340

aacaccaact tccgaatcaa ggccctgctg gccgagatga tgaacgacag cagcgtggag 2400

aacgtgcgcc cgttcagccc gatgcagcag gagatcctga aaatatacga ggacgacgtg 2460

ctgaagagcg acatcgagat cgaggacgac atcctgaaga tcagcaagac cgcccagccg 2520

agcccgagcg acctgaagcg ctacaagctg tggctggagc agaagtacaa gagcccgtac 2580

accggccaga tcatcccgct aaacaagctg ttcaccccgg agtacgagat cgagcacatc 2640

atcccgcaga gccgctactt cgacgacagc ttcagcaaca aggtgatctg cgagagcgcc 2700

gtgaacaagc tgaaggataa ctacatcggc ctggagttca tcaagcagtt cggcggcacc 2760

atcatcgagc tgggcttcgg caagagcatc aaggtgttcg agaccaagga gtacgaggac 2820

ttcgtgaaga agcactacgc caacaaccag ggcaagcgca acaagctgct gatggaggac 2880

atcccggaga agatgatcga gcgccagatg aacgacaccc gctacatcag caagtacatc 2940

agcggcgtgc tgagcaacat cgtgcgcgtg gaggatggct cagatgaggg cgtgaacagc 3000

aagaacattg tgccgggcaa cggcaagatc acaacacagc ttaagcagga ctggggcctg 3060

aacgatgtgt ggaacgatct gattctgcca aggttcgaga ggatgaacca gctgaccaac 3120

agcaaggtgt tcaccgcctg gaacgagaac taccagaagt tcctgccaac cgtgccaatc 3180

gagtacagca agggcttcag caagaagagg atcgatcaca ggcatcatgc tctggatgct 3240

ctggtgatcg cctgcgctac aaaggatcac gtgaacctgc tgaacaacca gagcgccaag 3300

agcgacacaa agaggtacga cctgaagaag aagagcatga agttcgagaa ggtggtgtac 3360

aacgacgcca agaccggcga gaagattgag agggaggtgc cgaagcagtt cctaaagcca 3420

tgggagaact tcacactgga cgtgaagcac aacctggaga ccatcatcgt gagcttcaag 3480

cagaacctga gggtgatcaa caaggccacc aactactacg agaagtacgt ggagaaggac 3540

ggcaccaaga acaaggagag ggtggagcag acaggcacaa attgggccat ccgcaagcca 3600

atgcacaagg atacagtgtc tggcaaggtg gatctgccat gggttaaggt gccaaagggc 3660

aagatcctga cagccacaag gaagagcctg gatagcagct tcgatctgaa gagcatcggc 3720

tctatcacag acaccggcat ccagaagatc ctgaagaact acctggcctt caaggatggc 3780

aatccagagc tggctttctc tccagagggc atcgacgacc tgaacaagaa catcgagaag 3840

tacaacgacg gcaagccaca ccagccaatc aataaggtgc gcgtgttcga gctaggctct 3900

aagttccagg ttggccagag cggcaacaag aaggataagt acgttgaggc cgccaagggc 3960

acaaatctgt tcttcgctgt gtacgaggat gagaagggca agcgcaacta cgagacaatc 4020

ccactgaacg aggtgatcga aaggcagaag cagggcctgt ctgttgtgga tctgaagggc 4080

accaacgatt tctacctgtg cccgaacgac ttcgtgtaca ttccatctgg cgacgagctg 4140

gagaacatca acaacgtgga cttcaaggac atcaagaagg agatcaacga gcgcatctac 4200

aaggtggtga gcttcaccgg caacaggctg agctgcatcc catacatggt ggccaccacc 4260

atcgtgaaca agctggagtt cacccagctg aacaagatcg agttcaccaa ggagaaggag 4320

atctgcatca agctgaacgt ggacaggctg ggcaacatca gcaaggcc 4368

<210> 183

<211> 3210

<212> DNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG05083.1天然序列"

<400> 183

atgagagagt tggattatcg cataggatta gatattggaa cgaattctat tggctggggg 60

atcattgaat tatcttggaa caaagataga gaacaatatg agaaagcaag aattgtcgac 120

aagggtgttc gtatgtttga taaggctgaa atacctaaga ctggtgcttc tcttgctgaa 180

ccgaggcgta tagcacgctc atcacgtaga agattaaatc gcaaaagcca gagaaaaaaa 240

gatatacgta atttactcgt tcaacatgaa attattagtc aaaaggaatt ggcttcgtta 300

tatcccctga caaaaagttc aatggatatt tgggatattc gcttggatgg attagatcgc 360

ttgttagacc gttttgaatg gactcgatta ttaattcatt tagcgcaaag acgcggtttt 420

aaatcaaatc gaaagtctga actgaaagat gtggagacag gaaaagtatt atcaagtatt 480

caagcaaatg aaaaacgatt atcactgtac cgtacagtgg gagagatgtg gatgaagaat 540

gaagatttta gtaaatatga caaaaggcgt aattcttcta atgagtatgt attttcggtt 600

agccgtgcag atttagaaaa agaaattgtg acactatttg aagcgcaaag aaaatttcag 660

tcatcatatg catcggctga tttacaaaaa acatacttac aaatttgggc acaccaactt 720

ccttttgctt ctgggaatgc aattgtaaat aaagtaggat attgttcatt attaaaaggg 780

aaagaaaaga gagttccgaa agcaacatat acttttcaat atttcagtac actagatcaa 840

ataaatcgaa cacgattagg tcctaatttc caaccattta cgaaggaaca gagagacgtt 900

attttagatg aaatgtttaa tcgaacagat tattataaaa aaaagacaat acccgaagtc 960

acttactatg atattcggaa atggttagca ttagatgaaa caattcaatt taaaggactt 1020

acctatgacc caaatgaaga gctgaaaaaa atagaattga aatcctttat taatttaaag 1080

ccattctatg aaattaaaaa ggtagttact aattacgcca aaaaaacaaa tgaggcattc 1140

tcaacattag actatgatac atttgcatat gctttaacag tttataaaac ggacaaagat 1200

attagatctt atttaaagaa atctaataat ttatcaaaat gttgctacga tgatcaatta 1260

atagaagagc tattaactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320

aatcatgtac tgccaattat gcaagaggga aggacttatc aggaagcaat acaccaatta 1380

ggatatgatg ccactaatct aaaaaaagaa aacagaagta tgttcttgcc cctttttccc 1440

gatgagataa caaatccaat tgttaaaaga gcactaactc aagcacgtaa agttgtaaat 1500

gctattatta gaagatatgg ttcccccaat tctgttcata ttgaactagc tcgtgagctt 1560

tctaaaagtc atgatgagag aacgaaaata atgaaagctc atgatgaaaa ttataagaaa 1620

aataaaggag ccatatcaat tttgattgag aatggaattt taaatccgac aggatatgat 1680

attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gctaaaacag 1740

attcctgcta atacgttttt taatgaaatg aaaaaagagc gaagtggctc cccagttcta 1800

gagatagatc acattttacc gtatagtcag agttttattg atagttatca taataaagta 1860

ctagtttatg gagatgagaa tcaaaaaaag ggaaatcgaa ttccatatac ttatttttta 1920

gaaggaaata aggactggga aagctttgaa agctacgtac gattgaatag ttttttttct 1980

aaaaagaagc gcggatattt attgaaaaaa gcttacttgc caagagagag taacatgatt 2040

aaggagcgtc atttaaatga tactcgatat gctagtagct atttgaaaaa cttcattgag 2100

aaaaatttga aatttaaaga agttgaaggt agtacacgaa aaaaacatgt acagacggtt 2160

aacggtataa ttacagccca tcttcgaaaa agatggggat tagaaaaaga taggcaggaa 2220

acatatttgc atcatgcaat ggacgctatt attgttgctt gtacagacca tcatatggtc 2280

actaaagtaa cggagtacta tcaaataaaa gaaagtaata agtcaataag gaaaccatac 2340

tttcctttgc catgggtggg ctttagagag gaaattttat cacatttagc aaggcagcca 2400

attgctagaa aaattagtga ggaacttaaa attggatatc aatcatttga ttatatactt 2460

gtatcgcgaa tgccaaaaag atctgtcact ggagcagctc atgaacagac aatcatgaaa 2520

aaaggtggta tcgacaaaaa aggaaaaact attatcataa agcgtgtgta cttaaaggat 2580

attaagtttg atgagaatgg cgattttaaa atggttggaa aagaacagga tttagcaact 2640

tatgaagcga taaagcaaag atatatagag tatggaaaag aatcgaaaaa agcatttgaa 2700

acacctttat acaagcctag taaaaaagga aaaggaaacc tcattaaaaa gatcaaagta 2760

gaagtgcaaa ccaaatcttt tgttcgagaa gttaatgggg gcgtagctca aaatggtgat 2820

ttagtaagag tagatttgtt tgaaaaggat aatagatatt atatgatacc tatttatgta 2880

atggatactg ttcattccga actaccaaat aaagctgtaa caagcagtaa aggctatgag 2940

caatggttaa caatagataa cagctttacg ttcaaattca gtttatatcc ttatgattta 3000

gtacgacttg taaaaggtaa tgaagatcgt ttcctatatt ttagtaccct tgatattaat 3060

tcggatcgtc ttaatttcaa agatgtaaac aagccatcaa agcaggctga aaatcgttat 3120

agccttaaaa caattgagaa tttagaaaaa tatgaggttg gtgttttagg tgatttaagg 3180

tttgtgagac aagaaatacg taaaaatttt 3210

<210> 184

<211> 3210

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05083.1大肠杆菌优化的"

<400> 184

atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60

atcatcgaac tgagctggaa taaagaccgc gagcagtatg aaaaggcgcg catcgtggat 120

aaaggcgtgc gcatgttcga caaagcggaa attccgaaaa ccggtgcaag tctggcggaa 180

ccaagacgta ttgcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaag 240

gatataagga acctgctggt ccagcatgaa atcatcagcc agaaggaact ggcgagcctg 300

tacccgctga ccaaatcaag tatggacatc tgggatataa ggctggacgg cctggatcgt 360

ctgctggatc gctttgaatg gacccgccta ttaatccatc tggcacagcg ccgtggcttc 420

aaatcaaacc gcaagagcga attaaaggac gtggagaccg gtaaagtgct gtcaagcatt 480

caggcgaatg aaaagcgcct gagcctgtat cgtaccgtgg gcgagatgtg gatgaaaaac 540

gaggacttct caaaatacga taaaaggcgc aacagcagca acgagtacgt gttcagcgtg 600

agccgcgcgg acctggagaa agaaatcgtg accctgtttg aggcgcagcg caaattccaa 660

tcaagctatg cgagcgcgga tctgcagaaa acctacctgc agatttgggc acatcagctg 720

ccgtttgcaa gcggtaacgc gatcgtgaat aaagtgggct attgcagcct attaaaaggc 780

aaagaaaaac gcgtgccgaa agcgacctat acattccagt acttcagcac cctggaccaa 840

atcaaccgca cccgcctggg cccgaacttc cagccgttca ccaaagaaca gcgcgacgtg 900

atcctggatg aaatgttcaa ccgcaccgac tactataaaa agaaaaccat cccggaggtg 960

acatactacg atataaggaa atggctggcg ctggatgaaa ccatccagtt caaaggctta 1020

acctacgatc cgaacgagga attaaagaag atcgaattaa aatcgttcat taatctgaaa 1080

ccgttctatg aaattaaaaa ggtggtaacc aactacgcga agaaaaccaa cgaagcattc 1140

agcaccctgg actacgatac attcgcgtac gcgctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaagaa atcaaacaac ctgagcaaat gctgctacga cgaccaatta 1260

atcgaagaac tgctgaccct gagctacacc aaattcggcc acctgagctt caaagcgatc 1320

aaccacgtgc tgccgatcat gcaggaaggc cgcacctacc aggaagcgat ccaccagctg 1380

ggctacgatg cgaccaacct gaaaaaggaa aaccgcagca tgttcctgcc gctgttccct 1440

gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa ggtggtgaac 1500

gcgatcatcc gccgctacgg ctcaccgaac agcgtgcaca tcgaactggc gcgcgaactg 1560

agcaaaagcc acgatgaacg caccaaaatc atgaaagcgc acgatgaaaa ctacaaaaag 1620

aacaaaggcg cgatcagcat cctgatcgaa aacggcatcc tgaacccgac cggctacgat 1680

atcgtgcgct acaaactgtg gaaagaacag ggcgaacgct gcgcgtacag cctgaaacag 1740

atcccggcga acaccttctt caacgaaatg aaaaaggaac gctcaggcag cccggtgctg 1800

gaaatcgatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860

ctggtgtacg gcgatgaaaa ccagaaaaag ggcaaccgca tcccgtacac ctacttcctg 1920

gaaggcaaca aagattggga gagcttcgaa agctacgtgc gcctgaacag cttcttcagc 1980

aaaaagaaac gcggctacct gctgaaaaag gcgtacctgc cgcgcgaaag caacatgatc 2040

aaagaacgcc acttaaacga tacccgctac gcgagcagct acctgaaaaa cttcatcgag 2100

aaaaacctga aattcaaaga agtggaaggc agcacccgta aaaagcatgt ccagaccgtg 2160

aacggcatca tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaga tcgccaggaa 2220

acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280

accaaagtga ccgaatatta tcagatcaaa gaaagcaaca aatcaatccg caaaccgtat 2340

tttccgctgc cgtgggtggg ctttcgcgaa gaaatcctga gccatctggc gcgtcagccg 2400

atcgcgcgta aaatcagcga agaactgaaa atcggctatc agagctttga ttatatcctg 2460

gtgagccgca tgccgaaacg cagcgtgacc ggcgcggcgc atgaacagac catcatgaaa 2520

aagggcggca tcgataaaaa gggcaaaacc atcatcatca aacgcgtgta tctgaaagat 2580

atcaaatttg atgaaaacgg cgattttaaa atggtgggca aggaacagga cttagcgacc 2640

tacgaagcga tcaaacagcg ctacatcgag tacggcaaag agagcaaaaa ggcgtttgaa 2700

accccgctgt acaaaccgag caaaaagggc aagggcaacc tgatcaaaaa gatcaaagtg 2760

gaagtccaga ccaaatcgtt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacggcgat 2820

ctggtgcgcg tggatctgtt tgaaaaagat aaccgctact atatgatccc gatctacgtg 2880

atggataccg tgcatagcga gctgccgaac aaagcggtga ccagcagcaa aggctatgaa 2940

cagtggttaa ccatcgataa cagctttacc ttcaaattca gcctgtatcc gtacgacctg 3000

gtgcgcctgg tgaaaggcaa cgaagatcgc ttcctgtatt tcagcaccct ggacatcaac 3060

agcgatcgcc tgaacttcaa ggacgtgaac aaaccgagca aacaggcgga aaaccgctat 3120

agcctgaaga ccatcgagaa cctggagaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180

tttgtgcgcc aggaaattcg caaaaacttc 3210

<210> 185

<211> 3213

<212> DNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG07433.1天然序列"

<400> 185

atgagggagt tggactatcg catagggtta gatattggga cgaattctat tggatggggt 60

gttattgaat tatcctggaa caaggacaga gaacgatatg aaaaagtaag gattgtcgac 120

cagggtgttc gtatgtttga tagggctgaa atgccaaaaa caggtgcttc tcttgctgaa 180

ccgaggcgta tagcacgttc atcacgtaga aggttaaatc gtaaaagtca gaggaagaaa 240

aatatacgta atttacttgt tcaacatggg gtgattactc aagaagagct ggattcgtta 300

tatcctcttt caaaaaaatc aatggatatt tggggtattc gattggatgg attagatcgt 360

ctgctaaatc attttgaatg ggctcgatta ttaattcatt tagctcaaag acgtggtttt 420

aaatcgaatc gtaagtctga actgaaagat acggagacgg ggaaggtatt atcgagtatt 480

caattaaatg aaaaacgatt atcactgtac cgtacagtgg gagaaatgtg gatgaaagat 540

cctgatttta gtaagtatga tagaaaacgg aattctccta atgagtatgt attttcggtt 600

agtcgtgcgg aactagaaaa ggaaatagtt actttatttg cagcacaaag aaggtttcag 660

tcaccatacg catcgaagga tttacaagaa acatatttac aaatttggac acaccaactt 720

ccctttgctt ctgggaatgc aattttaaat aaagtgggat attgttcatt attgaaaggg 780

aaagaaagaa gaattccgaa agcaacatat acttttcagt attttagtgc actagatcaa 840

gtgaatcgaa cacgattagg acctgatttt cagccattta cgaaggaaca aagagaaatt 900

attttaaata acatgtttca acgtacagat tattataaaa aaaagactat acctgaagtt 960

acatactatg atatccggaa atggctagaa ctagatgaaa ctattcaatt taaaggactt 1020

aattatgatc caaacgaaga attgaaaaaa atagaaaaga aaccatttat taatttaaag 1080

gcattctatg aaattaataa ggtagtcgca aattattctg agagaacaaa tgagacattt 1140

tcaacgttag actatgatgg gattggatat gctttaacag tttataaaac ggacaaagat 1200

attaggtctt atttgaagag ctctcataat ttacctaaac gttgttacga tgatcaatta 1260

atagaggaac tattaagtct ttcttataca aagtttggtc acttatcact gaaagcaatc 1320

aatcacgtac tatcgattat gcaaaaaggc aatacttata aagaagcagt agaccagtta 1380

gggtatgata caagcggttt aaagaaagaa aaaagaagta agttcttgcc tcctatttca 1440

gatgagataa cgaatccaat tgttaaaaga gcgttaacac aagcgcgtaa agttgtgaat 1500

gctataatta gaagacatgg ttctccacat tcagttcata ttgaactggc tcgtgaactt 1560

tctaaaaatc atgacgagag aacaaaaata gtgtcagctc aagatgaaaa ttataagaag 1620

aataaagggg ctatatcaat tttaagtgag catggaattt tgaatccaac aggctatgat 1680

attgttcgtt ataagttatg gaaagaacaa ggagaacgat gtgcttattc gttaaaggag 1740

attcctgcgg atacgttttt taatgaatta aaaaaagaac gaaatggtgc tccaattcta 1800

gaggtagatc acattttacc gtacagtcaa agttttattg atagttatca taataaagta 1860

ttagtttaca gtgatgaaaa tcgaaaaaag gggaatcgaa ttccatatac ctatttttta 1920

gagacaaata aggattggga agcttttgaa agatatgtaa gatcaaataa atttttttct 1980

aaaaagaagc gtgagtattt attgaaaaga gcatatttgc caagagaaag tgaactgata 2040

aaggagcgac atttaaatga tacgcgatat gctagtacct ttttgaaaaa cttcattgag 2100

cagaatttgc aatttaaaga agctgaagat aatccgcgta aaagacgtgt acaaacagtt 2160

aacggtgtaa ttacagcaca ttttcgaaaa agatggggat tagaaaaaga tagacaagaa 2220

acatacttac atcatgcaat ggacgctatc attgttgctt gtacagacca tcatatggtt 2280

actagagtaa cagagtatta tcaaataaaa gaaagtaata aatcagtaaa gaaaccgtat 2340

tttcctatgc catgggaggg ctttagagat gaactcttat cacatttagc gagtcagcca 2400

atagctaaaa aaattagtga ggagcttaaa gctggatatc aatcattaga ttatatattt 2460

gtgtctcgaa tgccaaaaag atctatcact ggagcagcac ataaacaaac gatcatgaga 2520

aaaggcggta ttgataaaaa aggaaaaact attattatag agcgtttgca tttaaaggat 2580

attaagtttg atgagaatgg tgattttaaa atggttggca aagaacaaga tatggcaact 2640

tacgaggcga taaagcaaag atatttggag catggaaaaa actcgaaaaa agcatttgaa 2700

acacctctat acaaacctag taaaaaagga acaggaaatc ttattaaaag agttaaagtt 2760

gaaggacaag ctaaatcttt tgttcgagaa gtaaatgggg gcgtagccca aaatggtgat 2820

ttagtgagag ttgatttatt tgaaaaagat gataaatatt acatggtgcc tatttatgta 2880

ccagataccg tttgttcaga attacccaaa aaagttgtgg caagtagtaa gggttatgag 2940

caatggttaa cactagataa cagctttacg tttaaattta gtttataccc ttatgattta 3000

gtacggcttg taaaagggga cgaagatcgt ttcttatact ttggtactct cgatatcgat 3060

tcagatcgtc ttaattttaa agatgtaaat aagccatcaa aaaagaatga atatcgttat 3120

agccttaaaa caattgagga tttagaaaaa tatgaggtgg gtgttttagg agatttaagg 3180

ttagtaagaa aagaaacacg tagaaatttt cac 3213

<210> 186

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07433.1大肠杆菌优化的"

<400> 186

atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60

gtgatcgaac tgagctggaa taaagaccgc gagcgctatg aaaaggtgcg cattgtggat 120

cagggcgtca gaatgtttga tcgtgcggaa atgccgaaaa ccggtgcatc actggcagaa 180

ccaagacgta tagcacgtag tagtcgccgc cgattaaacc gtaaaagcca gcgcaagaaa 240

aatatccgca acctgctggt tcagcatggc gtcatcaccc aggaagaact ggatagcctg 300

tacccgctga gcaagaaatc aatggacatc tggggcattc gtctggatgg tctggaccgc 360

ctattaaacc actttgaatg ggcccgccta ttaattcatc tggcgcagcg ccgcggcttc 420

aaatcaaacc gcaagagcga attaaaggac accgagaccg gtaaagtgct gtcatcgatc 480

cagctgaatg aaaaacgcct gagcctgtat cgcaccgtgg gcgagatgtg gatgaaagac 540

ccggacttct caaaatacga ccgcaaacgc aacagcccga acgaatacgt gtttagcgtt 600

agccgtgcgg aactggagaa agaaatcgtg accctgtttg cagctcagcg ccgttttcag 660

agcccgtatg cgagcaaaga tctgcaagaa acctacctgc agatctggac ccatcagctg 720

ccgtttgcaa gcggtaacgc gatattaaac aaagtgggct attgcagcct attaaaaggc 780

aaagaacgcc gcatcccgaa agcgacctat acattccagt acttcagcgc gctggaccag 840

gtgaaccgta cccgtctggg tccggatttt cagccgttca ccaaagaaca gcgcgagatc 900

atattaaaca acatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaggtg 960

acatattacg atataaggaa atggctggaa ctggatgaaa ccatccagtt caaaggcctg 1020

aactacgatc cgaacgagga gctgaaaaaa atcgagaaaa aaccgttcat taatctgaaa 1080

gcgttctatg aaatcaacaa agtggtggcg aactacagcg aacgcaccaa tgaaaccttc 1140

tcaaccctgg attacgatgg catcggctac gcgctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaaatc aagccacaac ctgccgaaac gctgctacga cgaccaatta 1260

atcgaagaac tgctgagcct gagctatact aagttcggcc acctgtcatt aaaagcgatt 1320

aatcacgtgt taagcatcat gcagaaaggc aacacatata aagaagcggt ggatcagctg 1380

ggctacgata ccagcggatt aaaaaaagaa aaacgcagca aattcctgcc gccgatcagc 1440

gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa agtggtgaac 1500

gcgatcatcc gccgccacgg cagcccgcac agcgtgcaca tcgaactggc gcgcgaactg 1560

agcaaaaacc acgatgaacg caccaaaatc gtgagcgcgc aggatgaaaa ctacaaaaag 1620

aacaaaggcg cgatcagcat cctgtcagaa cacggcatcc tgaacccgac cggctacgat 1680

atcgtgcgct acaaactgtg gaaagagcag ggcgaacgct gcgcgtacag cctgaaagaa 1740

atcccggcgg ataccttctt caacgagctg aaaaaagaac gcaacggcgc cccgatcctg 1800

gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860

ctggtgtaca gcgatgaaaa ccgcaaaaaa ggcaaccgca tcccgtacac ctacttctta 1920

gagaccaaca aagattggga agcgttcgaa cgctacgtgc gcagcaacaa gttcttcagc 1980

aaaaagaagc gcgagtacct gctgaaacgc gcgtacctgc cgcgcgaaag cgaactgatc 2040

aaagaacgcc atctgaacga tacccgctac gcgagcacct tcctgaaaaa cttcatcgaa 2100

cagaacctgc agttcaaaga agcggaagat aacccgcgca aacgccgcgt ccagaccgtg 2160

aacggcgtga tcaccgcgca ttttcgcaaa cgctggggct tagaaaaaga tcgccaggaa 2220

acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280

acccgcgtga ccgaatatta tcagatcaaa gaaagcaaca aaagcgtgaa aaaaccgtat 2340

tttccgatgc cgtgggaagg ctttcgcgat gaactgctga gccatctggc gagccagccg 2400

atcgcgaaaa aaatcagcga agaactgaaa gcgggctatc agagcctgga ttatatcttt 2460

gtgagccgca tgccgaaacg ctcaatcacc ggcgcggcgc ataaacagac catcatgcgc 2520

aaaggcggca tcgataaaaa aggcaaaacc atcatcatcg aacgcctgca tctgaaagat 2580

atcaaatttg atgaaaacgg cgattttaaa atggtgggca aagaacagga catggcgacc 2640

tacgaagcga tcaaacagcg ctatctggag catggcaaga acagcaaaaa agcgtttgag 2700

accccgctgt acaaaccgag caaaaaaggc accggcaacc tgatcaaacg cgtgaaagtg 2760

gaaggccagg cgaaatcatt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacggcgat 2820

ctggtgcgcg tggatctgtt tgaaaaagat gacaaatatt atatggtgcc gatctatgtg 2880

ccggataccg tgtgtagcga actgccgaaa aaagtggtgg cgagcagcaa aggctatgaa 2940

cagtggctga ccctggataa cagctttacc ttcaaattca gcctgtatcc gtatgatctg 3000

gtgcgcctgg tgaaaggcga tgaagatcgc tttctgtatt ttggcaccct ggacatcgat 3060

tcagatcgcc tgaacttcaa ggacgtgaac aaaccgagca aaaagaacga atatcgctat 3120

agcctgaaaa ccattgaaga tctggaaaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180

ctggtgcgca aagagacccg ccgcaacttt cat 3213

<210> 187

<211> 3213

<212> DNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG07513.1天然序列"

<400> 187

atgagagagt tggattatcg cataggatta gatattggaa cgaattctat tggctggggt 60

gttattgaat tatcttggaa caaagataga gaacaatatg agaaaacgag aattgtcgac 120

aagggtgttc gtatgtttga taaggctgaa atacctaaga ctggtgcttc tcttgctgaa 180

ccgagacgta tagcgcgctc atcacgtaga aggttaaatc gtaaaagcca gagaaaaaaa 240

gatatacgta atttacttgt tcaacatgaa attattagcc aaaaggaatt gacttcgtta 300

tatcccctgt caaaaagttc aatggatatt tgggatattc gcttagatgg attagatcgc 360

ttgttagacc gttttgaatg ggctcgatta ttaattcatt tagcacaaag acgcggtttt 420

aaatcaaatc gaaagtctga actgaaagat gtggagacag gaaaagtatt atcaagtatt 480

caagtaaatg aaaaacgatt atctctgtac cgtacagtgg gagagatgtg gatgaagaat 540

gcggattgta gtaaatatgg caaaaggcgt aattctccta atgagtatgt attttcggtt 600

agccgtgcag atttagaaaa ggaaattgtg actctatttg aggcgcaaag aaaattccat 660

tcatcatatg catcggttga tttacaaaaa acatatatac aaatttgggc acaccaactt 720

ccttttgctt ctgggaatgc aattgtaaat aaagtaggat attgttcatt attaaaaggt 780

aaagaaaaga gagttccaaa agcaacatat acttttcaat atttcaatac actagatcaa 840

ataaaccgaa cacgattagg gcccaatttc caaccattta cgaaggaaca gagagacata 900

attttagata aaatgtttca acggacagat tattataaaa aaaagacaat acccgaagtt 960

acttactatg atattcggaa atggttagca ctagatgaaa caattcaatt taaaggactt 1020

acctatgacc caaacgaaga gctgaaaaaa atagaaatga aaccctttat taatttaaag 1080

ccattctatg aaattaaaaa ggtagttact aattacgcaa aaaaaacaaa tgaggtattc 1140

tcagcattag attatgatac agttgcatac gctttaacag tttataaaac ggacaaagat 1200

attagatctt atttgaagag atctaataat ttatcaaaac gttgctacga tgatcaatta 1260

atagaagagc tattaactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320

aatcatgtac tgccaattat gcaagaggga aggacttatc aggaagcaat acaccaatta 1380

gggtatgata ccactaatct taaaaaagaa aacagaagta tgttcttgcc tattattcca 1440

gatgagataa caaatccaat tgttaaaaga gcgttaactc aagcacgtaa agttgtaaat 1500

gctattatta gaagatatgg ttctccaaat tctgttcata ttgaactagc tcgtgagctt 1560

tcgaaaagtc atgacgagag aaaaaaaata atgacagctc atgatgaaaa ttataagaaa 1620

aataaaggag ctgtatcaat tttgatcgat aatggaattt taaatccgac aggatatgat 1680

attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gttaaaaaag 1740

attcctgcta atacgttttt taatgaattg aaaaaagagc gaagtggccc tccggttcta 1800

gaggtagatc acattttacc gtatagtcag agttttattg atagttacca taataaagta 1860

ttagtttatg gggatgaaaa tcaaaaaaag ggaaatcgaa ttccatatac ttttttttca 1920

gaagaagata aggagtggga aagctttgaa agctacgtaa gatcgaatag ttttttttct 1980

aaaaagaagc gcggatattt attgaaaaaa gcttacttgc caagagagag taacttgatt 2040

aaggagcgtc atttaaatga tacccgatat gctagtagct atttgaaaaa cttcattgag 2100

aaaaatttaa aatttaaaga agctgtaggt attacacgaa aaaaatatgt acagacggtt 2160

aacggtgtaa ttacagccca tctgcgaaaa aggtggggtt tagaaaaaga taggcaggaa 2220

acatatttgc atcatgcaat ggacgctatt attgttgctt gtacagatca tcatatggtc 2280

actaaagtaa cggagtacta tcaaataaaa gaaggtaata agtcaataaa gaaaccgtat 2340

tttcctttgc catggatggg atttagagag gaaattttat cacatttaga aagtcagcca 2400

attgctagaa aaattagtga ggaacttaaa attggatatc aatcacctga ttatatactt 2460

gtatcgcgaa tgccaaaaag atctgtcact ggatcagctc atgatcagac agtcatgaaa 2520

aaaggcgata tcgataaaaa aggaaagact attatcataa agcgtgtgca cttaaaggat 2580

attaagtttg atgagaatgg cgattttaaa atggttggca aagaacaaga tttagcaact 2640

tacgaagcga taaagcaaag atatttagag tatagaaaag aatcgaaaaa agcatttgaa 2700

acacctttat acaagcctag taaaaaagga aaaggaaacc tcattaaaaa aattaaagta 2760

gaagtgcaaa ccaaatcttt tgttcgagaa attaatgggg gcgtagctca aaatggtgat 2820

ttagtaagag tagatttgtt tgaaaaggat aataggtatt atatggtgcc tatttacgta 2880

gtagatactg ttcgttccga actaccaaat aaagctgtaa caagcagtaa aggctatgag 2940

caatggttat caatagataa cagctttacg ttcaaattca gtttatatcc ttatgattta 3000

gtacgacttg taaaaggcga tgaagatcgt tttctatact ttagtactct tgatattaat 3060

tcggaccgtc ttaattttaa agatgtaaat aagccatcaa agcaagctga atatcgttat 3120

agtcttaaaa caattgagaa tttagaaaaa tatgagattg gtgttttagg tgatttaagg 3180

ttagtgagac aagaaacacg taaaattttt aaa 3213

<210> 188

<211> 3213

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG07513.1大肠杆菌优化的"

<400> 188

atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60

gtgatcgaac tgagctggaa taaagaccgc gagcagtatg aaaagacccg catcgtggat 120

aaaggcgtgc gcatgttcga caaagcggaa attccgaaaa ccggtgcaag tctggcggaa 180

ccaagacgta ttgcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaag 240

gatatcagga acctgctggt ccagcatgaa atcatcagcc agaaggaatt aaccagcctg 300

tacccgctga gcaaatcaag tatggacatc tgggatataa ggctggacgg cctggaccgc 360

ctgctggatc gttttgaatg ggcccgccta ttaatccatc tggcacagcg ccgtggcttc 420

aaatcaaacc gcaagagcga attaaaggac gtggagaccg gtaaagtgct gtcaagcatt 480

caggtgaatg aaaagcgcct gagcctgtat cgcaccgtgg gcgagatgtg gatgaaaaac 540

gcggactgct caaaatatgg caaacgccgc aacagcccga acgaatacgt gtttagcgtt 600

agccgtgcgg acctggaaaa agaaatcgtg accctgtttg aggcgcagcg caaattccat 660

agcagctatg cgagcgtgga tctgcagaaa acatacatcc agatctgggc acatcagctg 720

ccgtttgcga gcggtaacgc gatcgtgaat aaagtgggct attgcagcct attaaaaggc 780

aaagaaaaac gcgtgccgaa agcgacctat acattccagt acttcaatac actggaccaa 840

atcaaccgca cccgcctggg cccgaacttc cagccgttca ccaaagaaca gcgcgatata 900

atcctggata aaatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaggtg 960

acatactacg atataaggaa atggctggcg ctggatgaaa ccatccagtt caagggctta 1020

acctacgatc cgaacgagga gctgaaaaag atcgagatga aaccgttcat taatctgaaa 1080

ccgttctatg aaattaaaaa ggtggtaacc aactacgcga agaaaaccaa cgaagtgttc 1140

agcgcgctgg attacgatac cgtggcgtac gcgctgaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaaacg cagcaataat ctgagcaaac gctgctacga cgaccaatta 1260

atcgaagaac tgctgaccct gagctatact aagttcggcc acctgagctt caaagcgatt 1320

aatcacgtgc tgccaataat gcaggaaggc cgcacctacc aggaagcaat acaccagctg 1380

ggctacgata caaccaacct gaaaaaggaa aataggagca tgttcctgcc aataatcccg 1440

gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa agtggtgaac 1500

gcaataatcc gccgctacgg ctcaccgaac agcgtgcaca tcgaactggc gcgcgaactg 1560

agcaaaagcc acgatgaacg caaaaagatc atgaccgcgc acgatgaaaa ctacaaaaag 1620

aacaaaggcg cggtgagcat cctgatcgat aacggcatcc tgaacccgac cggctacgat 1680

atcgtgcgct acaaactgtg gaaagaacag ggcgaacgct gcgcgtacag cctgaaaaag 1740

atcccggcga acaccttctt caacgaactg aaaaaggaac gctcaggccc gccggtgctg 1800

gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860

ctggtgtacg gcgacgaaaa ccagaaaaag ggcaaccgca tcccgtacac cttcttcagc 1920

gaagaagaca aagaatggga gagcttcgaa agctacgtgc gcagcaacag cttcttcagc 1980

aaaaagaaac gcggctacct gctgaaaaag gcgtacctgc cgcgcgaaag caacttaatc 2040

aaagaacgcc atctgaacga tacccgctac gcgagcagct acctgaaaaa cttcattgag 2100

aaaaacctga aattcaagga agcggtgggc atcacccgca agaagtacgt ccagaccgtg 2160

aacggcgtga tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaga tcgccaggaa 2220

acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280

accaaagtga ccgaatatta tcagatcaaa gaaggcaaca aatcaatcaa aaagccgtat 2340

tttccgctgc cgtggatggg cttccgcgaa gaaatcctta gccatctgga aagccagccg 2400

atcgcgcgca aaatcagcga agaactgaaa atcggctatc agagcccgga ttatatcctg 2460

gtgagccgca tgccgaaacg cagcgtgacc ggcagcgcgc atgatcagac cgtgatgaaa 2520

aagggcgata tcgataaaaa gggcaaaacc atcatcatca aacgcgtgca tctgaaagac 2580

atcaaattcg acgaaaacgg cgacttcaaa atggtgggca aggaacagga cttagcgacc 2640

tacgaagcga tcaaacagcg ctacctggaa taccgcaaag agagcaaaaa ggcgtttgaa 2700

accccgctgt acaaaccgag caaaaagggc aagggcaacc tgatcaaaaa gatcaaagtg 2760

gaagtccaga ccaaatcgtt tgtgcgcgag atcaacggcg gcgtggcgca gaacggcgat 2820

ctggtgcgcg tggatctgtt tgaaaaagat aaccgctatt atatggtgcc gatctacgtg 2880

gtggataccg tgcgcagcga actgccgaac aaagcggtga ccagcagcaa aggctatgaa 2940

cagtggttaa gcatcgataa cagcttcacc ttcaaattca gcctgtaccc gtatgatctg 3000

gtgcgcctgg tgaaaggcga tgaagatcgc ttcctgtatt ttagcaccct ggacatcaac 3060

agcgatcgcc tgaacttcaa agacgtgaac aaaccgagca aacaggcgga atatcgctac 3120

agcctgaaga ccatcgagaa cctggagaaa tacgaaattg gcgtgctggg cgatctgcgc 3180

ctggtgcgcc aggaaacccg caaaatcttc aaa 3213

<210> 189

<211> 3216

<212> DNA

<213> 芽孢杆菌属的种

<220>

<221> 来源

<223> /注="APG08290.1天然序列"

<400> 189

atgagtgagt tggattaccg catagggttg gatattggta cgaattccat tggctggggt 60

gttattgaat tattttggaa caaggacaga gaacgatatg aaaaagtaag gattgtcgac 120

aagggcgttc gtatgtttga taaggctgaa atacctaata agggtgcttc tcttgctgaa 180

ccgagacgta tagcgcgttc atcacgtaga aggttaaatc gcaaaagtca gaggaagaaa 240

gagatacgta atttacttgt tcaacacgga atgattaccc aagaggaatt ggatttgtta 300

tatcctcttt caaaaaaatc aatagatatt tgggatattc gtttggatgg attagatcgt 360

ctgttgaatc atcttgaatg ggctcgatta ttaattcatt tagcacaaag acgtggtttt 420

aagtcgaatc gaaagtctga attgaaagat gctgagacgg ggaaggtatt atcgagtatt 480

caagtaaatg aaaaacgact atttctgtac cgtacagtgg gggaaatgtg gataaaagat 540

gctgagttta gtaagtatga tagaagacgt aattctccta atgagtatgt attttcggtt 600

agtcgtgcgg acttagaaaa ggaaattgtt actctatttg aagcacaaag aaagtttcag 660

tcatcatacg catcgaagaa cttacaagaa acatatttac aaatttgggc acaccaactt 720

ccttttgctt ctgggaatgc aattttaaac aaagtaggct attgttcatt attgaaaggg 780

aaagaaagga gaattccgaa agcaacatat acttttcaat atttcagtgc actagatcag 840

gtgaatcgaa cacgattagg acctgatttt caaccattta cgcaggaaca gaaagagatt 900

attttagata aaatgtttca acgtacagat tattataaaa aaaagactat acctgaagtt 960

agctactatg atatacggaa atggctagag ttagatgaaa ctattcaatt taaaggactt 1020

aattatgatc caaacgaaga actgaaaaaa atagaaaaaa aaccatttat taatttaaag 1080

gcattctatg aaattaaaaa ggtagttgca aattatgctg agagaacaaa tgaggcattt 1140

tcaacgttag actatgatgc gattgcatat gctttaacag tttataaaac ggacaaagat 1200

attagatctt atttgaagaa atctaataat ttatcaaaac gttgctacga cgatcaatta 1260

atagaagagc tatttactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320

aatcatgtac ttccaattat gcaagaggga aggacttatc aagaagcgat acaccaatta 1380

ggatatgata ccactaatct taaaaaagaa aacagaagta tgttcttgcc tcttattcca 1440

gatgaaataa caaatccaat tgttaaaaga gcgataactc aagcacgtaa agttgtaaac 1500

gctattatta gaagatatgg ttctccaaat tctgttcata ttgaactagc tcgtgagctt 1560

tctaaaagtc atgacgagag aaagaaaata atgacggctc atgatgaaaa ttataagaaa 1620

aataaaggag ctatatccat tttgatcgag aatggaattt taaatccgac aggatatgat 1680

attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gttaaaggag 1740

attcctccgg atacgttttt taatgaatta aaaaaagaac gaaatggttc tccaattcta 1800

gaggtagatc acattttacc gtatagccaa agttttattg atagttatca taataaagta 1860

ttagtttaca gtgatgaaaa tcgaaacaag ggaaatcgaa ttccatatac ctatttttta 1920

gagacaaata aggattggga agcttttgaa aggtatgtaa gatcaaataa gcttttttct 1980

aaaaagaagc gtgagtattt attgaaaaaa acatatttgc caagagagag tgaactaata 2040

aaggagcgac atttaaatga tacgcgatat gctagtacct ttttgaaaaa cttcattgag 2100

cagaacttgc aatttaaaga agttgaagtt aatctgcgta aaaaacgtgt gcaaacagtt 2160

aatggtgtaa ttacagcgca ccttcgaaaa agatggggat tagaaaaaaa tagacaggaa 2220

acatatctgc atcatgcaat ggacgctatc attgttgctt gtacagacca tcatatggtt 2280

actagaataa cagagtatta tcaaataaaa gaaagtaata aatcagtaaa gaaaccatat 2340

tttccgatgc catgggaggg ttttagagat gaactcttat cacatttagc gagccagcca 2400

attgctaaaa aaattagtga ggagcttaaa gctggatatc aatcatctga ttatatattt 2460

gtgtctcgaa tgccaaaaag atctgtcact ggagcagctc atgatcaaac gattaggaga 2520

aaaggtggta ttgataaaaa aggaaaaact attattataa agcgtgtgcg cttaaaggat 2580

attaagtttg atgagaatgg cgattttaaa atggttggaa aagaacaaga tttagcaact 2640

tatgaggcga taaagcaaag atatttggag catagaaaaa actcgaaaaa agcatttgaa 2700

acacctctat acaagcctag taaaaaaggg acaggaaatc tcatcaaaag agttaaaatt 2760

gaaggacaaa ctaaagcttt tgttcgagaa gtaaatgggg gagtagccca aaatagtgat 2820

ttagtaagag ttgatttatt tgaaaaagat gataaatatt acatggtgcc tatttatgta 2880

ccagataccg tttgttcaga attacccaaa aaagttgtga aaagtggtaa gggttatgag 2940

caatggctaa cactagataa cagctttacg tttaaatcta gtttataccc ttatgattta 3000

gtacgtcttg taaaaggtaa tgaagatcgt tttttatact ttggtactct cgatatcgat 3060

tctgaccgtc ttaattttaa agatgtaaat aagccatcaa aacagaatga atatcgttat 3120

agtcttaaaa caattgagaa tttagaaaaa tatgaggttg gtgttttagg tgatttaagg 3180

ttagtgaaac aagaaacacg tagaattttt aataga 3216

<210> 190

<211> 3216

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG08290.1大肠杆菌优化的"

<400> 190

atgagcgagc tagattatcg catcggcctg gatatcggca ctaactcaat aggctggggc 60

gtgatcgaac tgttctggaa taaagaccgc gagcgctatg aaaaggtgcg catcgtggac 120

aaaggcgtca ggatgttcga caaagcggag atcccgaata aaggtgcatc actggcggaa 180

ccaagacgta tagcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaaa 240

gagatccgta acctgctggt tcagcatggc atgatcaccc aggaagaact ggatctgctg 300

tacccgctga gcaagaaatc aatcgacatc tgggatataa ggctggacgg cctggaccgc 360

ctattaaacc atctggaatg ggcccgccta ttaatccatc tggcgcagcg tagaggcttc 420

aaatcaaacc gcaagagcga attaaaggac gcggagaccg gtaaagtgct gtcaagcatt 480

caggtgaatg aaaagcgcct gttcctgtat cgcaccgtgg gcgagatgtg gattaaagac 540

gcggagttct caaaatacga ccgccgtcgc aacagcccga acgaatacgt gtttagcgtt 600

agccgtgcgg acctggagaa agaaatcgtg accctgtttg aagcgcagcg caaattccaa 660

tcaagctacg cgagcaagaa cctgcaagag acctacctgc agatttgggc acatcagctg 720

ccgtttgcaa gcggcaacgc gatattaaac aaagtgggct attgcagcct attaaaaggc 780

aaagaacgcc gcatcccgaa agcgacctat acattccagt acttcagcgc gctggaccag 840

gtgaaccgta cccgtctggg ccctgatttt cagccgttta cccaggaaca gaaagaaata 900

atcctggata aaatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaagtg 960

tcatattacg atataaggaa atggctggag ctggatgaga ccatccagtt caagggcctg 1020

aactacgatc cgaacgagga gctgaaaaaa atcgagaaaa aaccgttcat taatctgaaa 1080

gcgttctatg aaattaaaaa agtggtggcg aactacgcgg aacgaaccaa cgaagcattc 1140

agcaccctgg attacgatgc gatcgcgtac gcgttaaccg tgtataaaac cgacaaggat 1200

ataaggagct acctgaaaaa atcaaacaac ctgagcaaac gctgctacga cgaccaatta 1260

atcgaagaac tgttcaccct gagctatact aagttcggcc acctgagctt caaagcgatt 1320

aatcacgtgc tgccaataat gcaggaaggc cgcacctacc aggaagcgat ccaccagctg 1380

ggctacgata ccaccaacct gaaaaaagaa aaccgcagca tgttcctgcc gctgatcccg 1440

gatgaaatca ccaacccgat cgtgaaacgc gcgatcaccc aggcgcgcaa agtggtgaac 1500

gcgatcatcc gccgctacgg ctcaccgaac agcgtgcaca tcgagctggc gcgcgagctg 1560

agcaaaagcc acgacgagcg caaaaaaatc atgaccgcgc acgacgagaa ctacaagaaa 1620

aacaaaggcg cgatcagcat cctgatcgag aacggcatcc tgaacccgac cggctacgat 1680

atcgtgcgct acaaactgtg gaaagaacag ggtgaacgct gcgcgtacag cctgaaagaa 1740

atcccgccgg ataccttctt caacgaactg aaaaaagaac gcaacggctc accgatcctg 1800

gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860

ctggtgtaca gcgatgaaaa ccgcaacaaa ggcaaccgca tcccgtacac ctacttcctg 1920

gaaaccaaca aagattggga agcgttcgaa cgctacgtgc gcagcaacaa actgttcagc 1980

aaaaagaaac gcgaatacct gctgaaaaaa acctacctgc cgcgcgaaag cgaactgatc 2040

aaagaacgcc acttaaacga tacccgctac gcgagcacct tcctgaaaaa cttcatcgaa 2100

cagaacctgc agttcaaaga agtggaggtg aacctgcgta aaaagcgcgt ccagaccgtg 2160

aacggcgtga tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaaa ccgccaggaa 2220

acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280

acccgcatca ccgaatatta tcagatcaaa gaaagcaaca aatcagtgaa aaaaccgtat 2340

tttccgatgc cgtgggaagg ctttcgcgat gaactgctga gccatctggc gagccagccg 2400

atcgcgaaaa aaatcagcga agaactgaaa gcgggctatc agagcagcga ttatatcttt 2460

gtgagccgca tgccgaaacg cagcgtgacc ggcgcggcgc atgatcagac catccgccgc 2520

aaaggcggca tcgataaaaa aggcaaaacc atcatcatca aacgcgtgcg cctgaaagat 2580

atcaaatttg atgaaaacgg cgattttaaa atggtgggca aagaacagga cttagcgacc 2640

tacgaagcga tcaaacagcg ctatctggag catcgcaaga acagcaaaaa agcgtttgag 2700

accccgctgt acaaaccgag caaaaaaggc accggcaacc tgatcaaacg cgtgaaaatc 2760

gagggccaga ccaaagcgtt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacagcgat 2820

ctggtgcgcg tggatctgtt tgaaaaagat gacaaatatt atatggtgcc gatctatgtg 2880

ccggataccg tgtgtagcga actgccgaaa aaagtggtga aaagcggcaa aggctatgaa 2940

cagtggttaa ccctggataa cagcttcacc ttcaagagca gcctgtaccc gtatgatctg 3000

gtgcgcctgg tgaaaggcaa cgaagatcgc tttctgtatt ttggcaccct ggacatcgat 3060

agcgatcgcc tgaacttcaa agacgtgaac aaaccgagca agcagaacga ataccgctac 3120

agcctgaaga ccatcgagaa cctggagaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180

ctggtgaaac aggaaacccg ccgcattttt aaccgc 3216

<210> 191

<211> 4011

<212> DNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="APG05459.1天然序列"

<400> 191

atgaagaaag actacgttat tggtctggat atagggacta attctgtcgg ctgggcagtt 60

atgacagaag actatcagtt ggtgaagaaa aaaatgccta tttatggaaa cactgaaaaa 120

aagaaaatca agaaaaattt ttggggtgtg cgtttatttg aagaagggca tacagccgaa 180

gatcgccgat taaaaagaac agcacgacga agaattagtc gtcgacggaa tcgtttacgc 240

tacttacaag ctttttttga agaagcgatg acagctttgg atgaaaactt ttttgctcgt 300

ttacaagaga gttttttagt gcctgaagat aagaagtggc acagacatcc gatttttgct 360

aagttggaag atgaagtagc ttaccatgaa acgtatccga caatctacca tttacgcaaa 420

aaattagcag attcatctga gcaagcagat ttacgactaa tttatttggc gttggcacat 480

attgtcaaat atcgtggaca ttttttaatt gaaggaaaat taagtacaga aaatatttct 540

gttaaagaac aatttcaaca atttatgatc atttataacc aaacctttgt gaatggagag 600

agtcgcttag ttagtgcgcc attacctgaa tctgtcttga ttgaggaaga gttgactgaa 660

aaagcttctc gtactaaaaa atctgaaaaa gtcttacaac aatttcctca agaaaaagct 720

aatggcttat ttggtcagtt cttaaagcta atggtaggga ataaagctga ctttaaaaaa 780

gtttttggtt tggaagaaga agccaaaata acctacgcta gtgaaagcta tgaagaagat 840

ttagaaggca ttttagcaaa ggttggggat gaatatagtg acgtgttttt agctgctaaa 900

aatgtgtacg atgcagttga attatcaacg attttagcag attcggataa aaaaagtcac 960

gcgaaattat cttctagcat gattgtccgt tttacagaac atcaagaaga tttaaaaaaa 1020

ttcaaacgat ttattcgtga aaattgtcca gacgaatatg ataatctctt taaaaatgaa 1080

cagaaagacg gctatgcagg ctacattgca cacgcaggta aggtttcaca gcttaaattt 1140

taccagtatg ttaagaaaat cattcaagat attgctggag cagaatattt tttagaaaaa 1200

attgctcaag aaaacttttt aagaaagcaa cggacctttg ataatggggt gattcctcat 1260

caaattcatt tggctgagtt acaagcaatc attcatcgtc aagcggccta ttatccattt 1320

ttaaaagaaa atcaagaaaa aattgaacaa ctggttacat ttcgaattcc ttattatgtc 1380

ggaccattat caaaaggaga tgcaagtacc ttcgcttggc taaaacgtca aagtgaggaa 1440

ccaattcgac cttggaacct tcaagaaacc gttgatttgg accaatcagc gacagccttt 1500

attgaacgaa tgaccaattt tgatacgtat ttaccttctg aaaaagtttt accgaaacat 1560

agtttgttat atgaaaagtt tatggtattt aatgaattga ccaagatttc ttatacggat 1620

gatcgaggaa tcaaagccaa tttttcaggt aaagaaaaag aaaaaatctt tgattatctg 1680

tttaagacgc gtcgaaaagt taagaaaaag gatatcattc aattctatcg aaacgaatat 1740

aatacggaga ttgtcacgct tagtggactt gaagaagacc aatttaatgc tagttttagc 1800

acgtatcagg atttactgaa atgtggttta acaagagctg aattagacca ccctgataat 1860

gccgaaaaat tggaagatat cataaaaatt ttaactattt ttgaagatcg gcaacgaatt 1920

cggacgcaac tttccacatt caaagggcag ttctcagcag aagtactaaa aaaattagaa 1980

cgcaagcact acactggctg gggaagattg tcgaaaaaat taatcaatgg tatctacgat 2040

aaagaatcgg gtaaaacaat tttggactat ttaattaaag atgatggggt ctcaaaacac 2100

tataatcgca attttatgca actgattaat gattcacaat tatcttttaa aaatgctatt 2160

caaaaagcac agtccagtga acatgaagaa acattaagtg aaactgtcaa tgaattagct 2220

ggtagtccag caataaaaaa aggaatttat caaagtttaa aaattgtcga tgaactagtc 2280

gcgattatgg gttatgcgcc caagcggatt gttgtcgaaa tggcacgtga aaatcaaacg 2340

actagcactg gcaagagaag atccatccaa cgcttgaaaa tagttgaaaa agcaatggcc 2400

gaaatcggca gcaatttatt aaaagaacaa ccaacgacta atgaacagtt acgagatacc 2460

cgtcttttcc tttactatat gcaaaatggt aaagatatgt acacgggaga tgaattatcg 2520

cttcatcgtt tatctcacta tgatattgat catattatcc cacaaagctt tatgaaagac 2580

gattcattgg ataacctagt tttagtgggc tctactgaaa atcgagggaa atccgatgat 2640

gtacctagca aggaagttgt taaggatatg aaagcttatt gggagaaatt atatgctgct 2700

ggcttaatta gtcaacggaa attccaacgt ctgaccaagg gggagcaagg tggcttgact 2760

ctcgaagaca aagcgcattt tatccaacga caattagtag aaactcgtca aattaccaaa 2820

aatgttgcag ggatcttaga tcaacgctac aatgctaatt caaaagagaa aaaagtccaa 2880

atcatcacct tgaaagctag tttaacgagc caatttcgtt cgatttttgg cttgtataaa 2940

gttcgtgaag tgaatgatta tcaccatgga caagatgctt atttaaactg tgtggtcgca 3000

accacgttat taaaagttta tcctaattta gcaccagaat ttgtttacgg agaatatcct 3060

aaattccagg cctttaaaga aaataaagcc acggcgaaga ctataattta tacaaatttg 3120

atgcgctttt tcacggaaga tgaaccacgg ttcatgaagg atggcgaaat tctttggagt 3180

aacagttatt taaaaaatat caaaaaagaa ttaaattacc atcaaatgaa tattgtcaaa 3240

aaagtagaag tgcaaaaagg cggtttttca aaagagtcga ttaaacccaa aggaccatcg 3300

aataaattga ttcctgtcaa aaatggtttg gatccccaaa aatatggcgg ttttgatagt 3360

cctgtagttg cttatacagt gttattcacg catgaaaaag gtaaaaaacc tcttattaaa 3420

caggagatac tgggcattac gattatggaa aaaacaaggt ttgaacaaaa tcctattctt 3480

tttttagagg agaaaggctt cctacggcct cgtgtattaa tgaaattgcc taagtataca 3540

ctgtatgaat ttccagaggg gcgcaggcgc ttattagcca gcgctaaaga agcgcaaaaa 3600

gggaaccaga tggttttacc tgaacattta cttacgttac tgtaccatgc gaaacaatgt 3660

ttgttaccaa atcaatcaga aagtttggct tatgtagaac aacatcaacc agaatttcaa 3720

gagattttag agagagtggt tgactttgct gaagtgcata cattagccaa gtcaaaagtc 3780

cagcaaattg tgaaactttt tgaagcaaat caaacagcag atgtgaaaga gattgcggca 3840

tcctttatcc aacttatgca gtttaatgcg atgggcgcac caagtacgtt taaatttttc 3900

caaaaagaca ttgagcgagc acgctacacg tcaatcaaag aaatttttga tgccactatc 3960

atttaccaat cgactacggg actgtatgaa acacgcagaa aggttgtcga c 4011

<210> 192

<211> 4011

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG05459.1大肠杆菌优化的"

<400> 192

atgaaaaagg actacgtgat cggcctagac atcggcacta acagcgttgg ttgggcggtg 60

atgaccgaag attaccagct agtgaagaag aagatgccta tctacggtaa tacagagaag 120

aagaagatta aaaagaactt ctggggcgtg aggctattcg aggagggtca caccgcggag 180

gaccgccgcc tgaagcgcac cgctagacgc cgtatttcac gtcgtcgtaa ccgtctgcgt 240

tacctgcaag cattcttcga agaagcaatg accgcgctgg atgaaaactt cttcgctagg 300

ctgcaggagt catttctggt gccggaggat aaaaagtggc accgtcatcc gatcttcgcg 360

aaactagaag acgaggtggc gtaccatgaa acctacccga ctatctacca cctgcgcaaa 420

aagctggcgg atagcagcga acaagcagac ctgcgattaa tctatctggc gctggcgcac 480

atcgtaaaat acagaggcca cttcctcatc gagggcaaat tatcgaccga aaatattagc 540

gtgaaggagc agttccagca gttcatgatc atctacaacc aaaccttcgt gaacggcgaa 600

tcaaggctgg tgagcgcgcc gctgccggag agcgtattaa ttgaggagga attaaccgag 660

aaagcgagcc gcactaagaa aagcgagaaa gtgcttcagc agttcccgca agaaaaagcg 720

aacggcctgt tcggccagtt cctgaaatta atggtgggca ataaagcgga cttcaaaaag 780

gtgttcggcc tggaagagga ggcgaaaata acctacgcga gcgaaagcta cgaggaagac 840

ctggagggca tactagcgaa agtgggcgac gaatacagtg acgtgttcct ggcggctaaa 900

aacgtgtacg acgcggtgga attaagcacc atactagcgg acagcgataa aaagagtcac 960

gcgaaattaa gctcaagcat gatcgtgcgc ttcaccgaac accaggaaga cctgaaaaag 1020

ttcaaacgct tcatccgcga aaactgcccg gacgaatacg ataacctgtt caaaaacgaa 1080

cagaaagatg gctacgcggg atacatcgcg cacgcgggca aagtgtcaca attaaagttc 1140

taccagtacg tgaagaaaat aatccaggat atcgcgggcg cggaatactt cctggagaaa 1200

atagcgcagg agaacttcct taggaaacag cgcaccttcg acaacggcgt gatcccgcac 1260

caaatacacc tggcggaact acaggcaata attcaccgcc aggcggcata ctacccgttc 1320

ctgaaagaga accaggagaa aatagaacag ctggtgacct tccgcatccc atactacgtg 1380

ggcccgctta gcaaaggcga tgcgagcacc ttcgcgtggc tgaaacgcca gagcgaagaa 1440

ccaatccgcc cgtggaactt acaagaaacc gtggatctgg atcagagcgc gaccgcgttc 1500

atcgaacgca tgaccaactt cgatacatac ctgccgagcg aaaaagtgct gccgaagcat 1560

agcctgctgt atgaaaaatt catggtgttc aacgaactga ccaaaataag ctacaccgat 1620

gatcgcggca ttaaagcgaa cttcagcggc aaagaaaaag agaaaatatt cgattaccta 1680

ttcaaaaccc gccgcaaagt gaaaaagaaa gacataatac agttctaccg caacgaatac 1740

aacaccgaaa tcgtgaccct gagcggcctg gaagaagatc agttcaacgc gagcttcagc 1800

acctaccagg acttattaaa atgcggcctg acccgcgcgg agcttgacca cccggacaac 1860

gcggaaaaac tggaagatat cattaaaata ctgaccatct tcgaagatcg ccagcgcatc 1920

cgcacccagc tgagcacctt caagggccag ttcagcgcgg aagtgctgaa aaagctggaa 1980

cgcaaacatt acaccggctg gggccgcctg agcaaaaagc tgatcaacgg catctacgat 2040

aaagaatcag gcaaaaccat cctggactac ctgatcaaag atgacggcgt gagcaaacac 2100

tacaaccgca acttcatgca gctgatcaac gatagccagc tgagcttcaa gaacgcgatc 2160

cagaaagcgc agagcagcga acatgaagaa accctgagcg aaaccgtgaa cgaactggcg 2220

ggcagcccgg cgatcaaaaa gggcatctat cagagcctga aaatcgtgga tgaattagtg 2280

gcgatcatgg gctatgcgcc gaaacgcatc gtggtggaaa tggcgcgcga aaaccagacc 2340

accagcaccg gcaaacgccg cagcatccag cgcctgaaaa tcgtggaaaa agcgatggcg 2400

gaaatcggca gcaacctgct gaaagaacag ccgaccacca acgaacagct gcgcgatacc 2460

cgcctgtttc tgtattatat gcagaacggc aaagatatgt ataccggcga tgaactgtca 2520

ctgcatcgcc tcagccatta tgatatcgat catatcatcc cgcagagctt tatgaaagat 2580

gatagcctgg ataacctggt gctggtgggc agcaccgaaa accgcggcaa aagcgatgat 2640

gtgccgagca aagaagtggt gaaagatatg aaagcgtatt gggaaaaact gtatgcggcg 2700

ggcctgatca gccagcgcaa atttcagcgc ctgaccaaag gcgaacaggg cggcctgacc 2760

ttagaagata aagcgcattt tatccagcgc cagctggtgg aaacccgcca gatcaccaaa 2820

aacgtggcgg gcatcctgga tcagcgctat aacgcgaaca gcaaagaaaa gaaagtccag 2880

atcatcaccc tgaaagcgag cctgaccagc cagtttcgca gcatctttgg cctgtataaa 2940

gtgcgcgaag tgaacgatta tcatcatggc caggatgcgt atctgaactg cgtggtggcg 3000

accaccttac tgaaagtgta tccgaacctg gcgccggaat ttgtgtatgg cgaatatccg 3060

aaatttcagg cgtttaaaga aaacaaagcg accgcgaaaa ccatcatcta taccaacctg 3120

atgcgcttct ttaccgaaga tgaaccgcgc tttatgaaag atggcgaaat tctgtggagc 3180

aacagctatc tgaaaaacat caaaaaggaa ctgaactacc accagatgaa catcgtgaaa 3240

aaggtggagg tccagaaagg cggcttctca aaggaaagca tcaaaccgaa aggcccgagc 3300

aacaaactga tcccggtgaa aaacggcctg gacccgcaga aatatggcgg ctttgatagc 3360

ccggtggtgg cgtataccgt gctgtttacc catgaaaaag gcaaaaagcc gctgatcaaa 3420

caggaaattc tgggcatcac catcatggag aaaacccgct ttgaacagaa cccgatcctg 3480

ttcctggaag aaaaaggctt tctgcgcccg cgcgtgctga tgaaactgcc gaaatatacc 3540

ctctatgaat ttccggaagg ccgccgccgc ctgctggcga gcgcgaaaga agcgcagaaa 3600

ggcaaccaga tggtgttacc ggaacatctg ctgaccctgc tgtatcatgc gaaacagtgc 3660

ctgctgccga accagagcga aagcctggcg tatgtggaac agcatcagcc ggaatttcag 3720

gaaattctgg aacgcgtggt ggattttgcg gaagtgcata ccctggcgaa aagcaaagtt 3780

cagcagattg ttaaactgtt tgaagcgaac cagaccgcgg atgtgaaaga aattgcggcg 3840

agctttattc agctgatgca gtttaacgcg atgggcgccc cgagcacctt caaattcttt 3900

cagaaagata ttgaacgcgc gcgctatacc agcattaaag aaatttttga tgcgaccatt 3960

atctatcagt caaccaccgg cctgtatgaa acccgccgca aagtggtgga t 4011

<210> 193

<211> 4308

<212> DNA

<213> 肠球菌属的种

<220>

<221> 来源

<223> /注="APG04583.1天然序列"

<400> 193

atggctaaaa atatacttgg attagatttg ggaaccaata gtattggttg ggcgttggta 60

cagcaagact ttgaaaacaa agaaggaaat attcttggaa tgggaagtag gattattccg 120

atgtcgcaag atattttagg agaattcggt aaggggaatt ctatttctca aactgctgaa 180

cgtactggtt atcgtggtgt ccgtcggtta agagaacgac atttattacg tcgtgagcgt 240

ttgcaccgag ttttgcattt gttgggtttc ttgccaaaac attatgatga aaaaatagat 300

tttacacaac gttttgggaa attcattaac caagccgaac ctaaattggc ttttgatagt 360

gaatttcttt ttaaagattc tttccatgaa atgttagctg attttaaaca aaatcaacca 420

gagtttttga aagataaaaa tggagaagat tgtttagttc cttatgattg gacgatttat 480

tatttacgta aaaaagcatt aacgcaaaaa attgagaaat atgaattagc ttggttgatt 540

cttaatttta atcaaaaacg tggttattat caattaagag gtgaagaaga gaaagaaaat 600

ccaaataaat tggtgggatt tcattctttg aaaatcgttg atgttattcc cgatgctgaa 660

acaaataaaa aaggagagac ttggtattct ttgcatttag aaaatggttg ggtatatcgc 720

cgttcttcta aaatttcatt agcggattgg aaagataaag ttcgagattt tattgttacg 780

actgatttaa acgatgatgg ttctgaaaaa ttggataaag atggaattgt gaaacgtagc 840

tttcgtgcac caagtgcgga tgattggact ttgttgaaaa agaaaacaga aaaagatatt 900

gataactcta acaaaactgt tggaacttat atttacgaca atcttttatt gaacccaaaa 960

caaaaaataa aaggaaaaat ggttcgtacc atcgaacgta agttttacaa gcaagaatta 1020

gaacaaattt taaaaactca aaaagaattt cattcagaat tacaaagtga aaatttgcta 1080

caagattgtg ttcgagaatt gtatcgaaat aatgaacaac atcaacaaat gttagaagct 1140

aaagattttg tgcatttgtt cctaaatgat attattttct atcaacgtcc tttgagaagt 1200

caaaaatcca gtatatcgaa ttgtactttg gaatttagaa aatcgaaaaa tgaaaatggt 1260

gaagaagtta ttcatcgttt aaaagtaatt gcaaaatcga atccatatta tcaggaattt 1320

agattgttac aatgggtgca aaatttagca atttatacaa aagatgatga taaaaatgta 1380

acaaacgaat ttctaaagtc tactcaagat tgggaggatt tattgagatg gctacattct 1440

aaaaaagaaa ttaaacagga tgctttaatt aagtttttga ttgaaaagaa aggtttaaaa 1500

ggcaaagctt taactattga agtagcaaaa tatcgttgga attatgttca ggacaaagat 1560

taccctggta atgaaacccg atatttaatt caatctcgtt tggataaagt tgaatatgca 1620

cctaaggatt ttttaactta tgaaaatgaa atggctttgt ggcacatcat ttattcgata 1680

aacgataaaa ttgagtacga aaaagcctta aaatcttttg ccaacaaaaa aggtttggac 1740

gaagtaactt ttgttgaagc gtttaagaaa ttcccgcctt ttaaaagtga ttacggaagt 1800

ttttctgaaa aagcaatcaa gaaattattg cctttgatgc gttttggaac tcaatggaat 1860

tgggataata tcgatcaaaa ttctaaagaa agaattggaa aaatattgac aggcgaatat 1920

gatgaaaaca tcaaaggtcg tgttcgcgaa aaagcaagac atctcaattc tgaaaccgat 1980

tttcaagctt tacctttgtg gttggcgcaa tacgtagttt acggaagaca ttctgaagct 2040

gatattgcag gtaaatggaa ttcggtggat gatttaaagc aatttttaga tgactttaaa 2100

caacattcgc ttcgtaatcc tattgtagag caagtgatta ctgaaacgtt gcgtgcggta 2160

aaagatattt ggaattttta tggaaaaggt gctaaagatt tcttctctga aattcatatc 2220

gagctggggc gtgaaatgaa aaatacggct gatgaacgca agcgtattac tacaatggtt 2280

acggataacg aaaacaccaa tttgcgtatc aaagctttgt tggctgaaat ggctttggat 2340

caaaatgtag ataatgttcg tccatattct ccaatgcaac aagaaatttt gaaaatctat 2400

gaagaaggtg ttttgaatgc tgaagaaaat atcgatgatg atattctgaa aattagtaaa 2460

acggctcaac cttctgctac agatttaaag cgttacaaat tgtggttaga acaaaaatat 2520

cgttcgcctt atacaggtca aatgattcct ttgaataagc tgtttacacc tgaatatgag 2580

attgaacaca taattccgca aagtcgctat tttgatgata gtatgagcaa taaagtgatt 2640

tgcgaagcag cggtgaataa acttaaagac aatcaaattg gtttggtttt cattaagaat 2700

catcacggag aagttgtgga tttcggaatg ggaaaacaag tgaagatttt ggaagtttcc 2760

gattatgagg attttgtaaa acaaaattac aataaaaaca gaggaaaacg taataagttg 2820

ttattggaag atattcctga gaaaatgatt gaacgtcaac taaatgatac acgttacatc 2880

agcaaatata ttacgcaagt gttatcgaat attgttcgtg atgataaaga aggtagtaaa 2940

gatgatggtg taaattctaa aaatattgtt cctggaaacg gaaaaattac cacaagactt 3000

aaacaagatt ggggattgaa tgacgtttgg aatgatttgg ttttacctcg ttttgaacga 3060

atgaatacat tgactaattc aaatgatttt acatcaaaaa atacacatgg aaaaacaatt 3120

ccaacagttc caattgagtt atccaaaggt ttttctaaaa aacgtatcga tcatcgtcat 3180

cacgcaatgg atgcgttggt aattgcctgt gcaacgagag atcacgtgaa tttgttgaat 3240

aacgaaagtt caaaatcgga tacaaaacgt tatgatttga ataggaaatt aagaaaatac 3300

gagaaagtag cttacaatga tcccaaaaca ggcgaacgaa ttgagaaaga agttccaaaa 3360

gacttcatta aaccttggga gacctttacc gaagatacgc gaactttgtt agaaaatatt 3420

gtaattagtt tcaagcaaaa tctacgagtt atcaataaag caaccaatta ttatgaaaaa 3480

attgagaatg ggaaaaaagt aaaagttgaa caaaagggaa taaattgggc tgtaagaaaa 3540

gctttgcata aagaaaccgt ttctggacaa gtgcatttgg atagaataaa agttgcaaaa 3600

ggtaaaatat taacggctac tcgtaaaact ttggatgcct cttttaatga aaaaacaatt 3660

gagtcaatta cggatacagg gattcaaaag attttattga attatttaaa atcaaaagat 3720

aacaatccag aggttgcatt ttcaccagaa ggaatagaag aattaaataa aaatattagg 3780

ctatataatg atggaaaagc acatcaacca attttgaaag ttcgtgtttt tgagcaagga 3840

agcaaattta ctttaggtga gacgggaaat aaaaccacta agtttgtaga agcagcaaag 3900

ggtactaatc tatttttcgg aatttatgaa gacaaatcag gtaagagaag ctacgaaacc 3960

attccattaa atattgtcat cgaaagacaa aaacaaggtc tgcaagctgt tcccgaaacc 4020

aatgagaaag ggaaacaatt gttgtttacg ttatctccaa atgatttggt ttacgttcct 4080

gaagaaggag tttttgatga gaataatatc aaggtagata ggatttataa ggtagtgagt 4140

ttttctacct atcaatgttt ttttgtaaga aatgatgttt ctacttctgt agttaataag 4200

gttgaatatt ccgctttaaa taaaatggaa aaatctattg acaacataat gataaaagaa 4260

aactgcgtca aactgaatgt agaccgttta ggaaagattt caaaagct 4308

<210> 194

<211> 4308

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG04583.1大肠杆菌优化的"

<400> 194

atggcgaaga acatactagg cctggatctc ggaaccaaca gcattggttg ggcactggtc 60

cagcaggact tcgagaataa agagggcaac atactaggca tgggcagccg aataatccct 120

atgagtcagg acatactagg cgagttcggc aagggcaaca gcattagcca gaccgcagaa 180

cgtactggtt atcgtggtgt gcgccgttta cgtgaacgtc atctgttacg tcgtgaacgt 240

ctgcatcgtg ttctgcatct gttaggcttc ctgccgaagc attacgatga aaagatcgac 300

ttcacccagc gcttcggcaa gttcattaat caagcggaac caaagctggc gttcgacagc 360

gagttcctgt tcaaggacag cttccatgaa atgctagcgg acttcaagca gaatcaaccg 420

gagttcctga aggataaaaa cggcgaggac tgcctggtgc cgtacgactg gaccatatac 480

tacctgcgca agaaagcact gacccagaag atcgaaaaat acgagctagc gtggctcatc 540

ctgaacttca atcaaaagcg cggatactac cagcttaggg gcgaggagga gaaagagaac 600

ccgaataaac tggtgggctt ccacagcctg aaaatagtgg acgtgatccc ggacgcggaa 660

accaataaaa agggcgagac ctggtactca ctgcatctgg aaaacggctg ggtgtaccgc 720

cgcagcagca aaataagcct ggcggactgg aaagacaaag tgcgcgactt catcgtgacc 780

accgacctga acgatgacgg cagcgaaaaa ctggacaaag acggcatcgt gaaacgcagc 840

tttcgtgcac cgagcgcaga tgattggacc ctattaaaga aaaagaccga aaaagacatc 900

gacaacagca ataaaaccgt gggcacctac atctacgaca acctgttatt aaacccgaag 960

cagaaaatca aaggcaaaat ggtgcgcacc atcgaacgca aattctacaa acaggagctg 1020

gagcagatcc tgaaaaccca gaaggaattc cacagcgaac tgcagagcga aaacctgctg 1080

caggattgcg tgcgcgaact gtaccgcaat aatgaacagc accagcagat gctggaagcg 1140

aaagatttcg tgcacctgtt cctgaacgat ataatcttct accagcgccc gctgcgcagc 1200

cagaaatcaa gcatcagcaa ttgcaccctg gaattccgca aaagcaagaa tgaaaacggc 1260

gaagaagtga tccaccgcct gaaagtgatc gcgaaaagca acccatacta ccaggaattc 1320

cgcctgctgc agtgggtcca gaacctggcg atctatacta aagacgacga caagaacgta 1380

accaacgagt tcctgaaatc aacccaggac tgggaagatc tgctgcgctg gctgcatagc 1440

aagaaggaga ttaaacagga cgcgctgatc aagttcctga tcgagaaaaa gggcctgaag 1500

ggcaaagcat tgaccatcga ggtggcaaaa taccgctgga actacgtcca ggacaaagat 1560

tacccgggca atgaaacccg ctacctgatc caatcaaggc tggacaaagt ggaatacgcg 1620

ccgaaagatt tcctgaccta cgagaatgaa atggcgctgt ggcacatcat ctacagcatt 1680

aatgataaaa tcgaatatga aaaagcatta aaatcgttcg cgaataaaaa gggcctggat 1740

gaagtgacct tcgtggaagc attcaaaaag ttcccgccgt tcaaaagcga ttacggcagc 1800

ttcagcgaaa aagcgattaa aaagctgctg ccattaatgc gcttcggcac ccagtggaac 1860

tgggataaca tcgatcaaaa tagcaaagaa cgcatcggca aaatactaac cggcgaatac 1920

gatgaaaata ttaaaggccg cgtgcgcgaa aaagcgcgcc atctgaacag cgaaaccgat 1980

ttccaagcat tgccgctgtg gctggcgcag tacgtggtgt acggccgcca tagcgaagcg 2040

gatatcgcgg gcaaatggaa cagcgtggat gatctgaaac agttcctgga tgatttcaaa 2100

cagcatagcc tgcgcaaccc gatcgtggaa caggtgatca ccgaaaccct gcgcgcggtg 2160

aaagatatct ggaacttcta tggcaaaggc gcgaaagatt tcttcagcga aatacacatc 2220

gaactgggcc gcgaaatgaa aaataccgcg gatgaaagaa aacgcatcac caccatggtg 2280

accgataatg aaaataccaa cttacgcatt aaagcattgc tggcggaaat ggcgctggat 2340

cagaacgtgg ataacgtgcg cccgtatagc ccgatgcagc aggaaatcct gaaaatatat 2400

gaagaaggcg tattaaacgc ggaagaaaat atcgacgatg atatcctgaa aataagcaaa 2460

accgcgcaac caagcgcgac cgatctgaaa cgctataaac tgtggctgga acagaaatat 2520

cgcagcccgt ataccggcca gatgatcccg ctgaacaaac tgtttacccc ggaatatgaa 2580

atcgaacata tcatcccgca gagccgctat tttgatgata gcatgagcaa caaagtgatc 2640

tgcgaagcgg cggtgaacaa actgaaagat aaccagatcg gcctggtgtt tatcaaaaac 2700

catcatggcg aagtggtgga ttttggcatg ggcaaacagg tgaaaatcct ggaagtgagc 2760

gattatgaag attttgtgaa acagaactat aacaaaaacc gcggcaaacg caacaaatta 2820

ctgctggaag atatcccgga gaaaatgatc gaacgccagc tgaacgatac ccgctatatc 2880

agcaaatata tcacccaggt gctgagcaac atcgtgcgcg atgataaaga aggcagcaaa 2940

gatgatggcg tgaacagcaa aaacatcgtg ccgggcaacg gcaaaatcac cacccgcctg 3000

aaacaggatt ggggcctgaa cgatgtgtgg aacgatctgg tgctgccgcg ctttgaacgc 3060

atgaacaccc tgaccaacag caacgatttt accagcaaaa acacccatgg caaaaccatt 3120

ccgaccgtgc cgattgaact gagcaaaggc tttagcaaaa agcgcattga tcatcgccat 3180

catgcgatgg atgcgctggt gattgcgtgc gcgacccgcg atcatgtgaa cttactgaac 3240

aacgaaagca gcaaaagcga taccaaacgc tatgatctga accgcaaact gcgcaaatat 3300

gaaaaagtgg cgtataacga tccgaaaacc ggcgaacgca ttgaaaaaga agtgccgaaa 3360

gattttatta aaccgtggga aacctttacc gaagataccc gcaccctgct ggaaaacatt 3420

gtgattagct ttaaacagaa cctgcgcgtg attaacaaag cgaccaacta ttatgagaaa 3480

attgaaaacg gcaaaaaggt gaaagtggaa cagaaaggca ttaactgggc ggtgcgcaaa 3540

gcgctgcata aagaaaccgt gagcggccag gtgcatctgg atcgcattaa agtggcgaaa 3600

ggcaaaattc tgaccgcgac ccgcaaaacc ctggatgcgt cattcaacga gaaaaccatt 3660

gaaagcatta ccgataccgg cattcagaaa attctgctga actatctgaa aagcaaagat 3720

aacaacccgg aagtggcgtt tagcccggaa ggcattgaag aactgaacaa aaacattcgc 3780

ctgtataacg atggcaaagc gcatcagccg attctgaaag tgcgcgtgtt tgaacagggc 3840

agcaaattca ccctgggcga aaccggcaac aaaaccacca aatttgtgga agcggcgaaa 3900

ggcaccaacc tgttctttgg catctatgaa gataaaagcg gcaaacgcag ctatgaaacc 3960

attccgctga acattgtgat tgaacgccag aaacagggcc tgcaagcggt gccggaaacc 4020

aacgaaaaag gcaaacagct gctgtttacc ctgtcaccga acgatctggt gtatgtgccg 4080

gaagaaggcg tgtttgatga aaacaacatt aaagtggatc gcatctataa agtggtgagc 4140

tttagcacct atcagtgctt ctttgtgcgc aacgatgtga gcaccagcgt ggtgaacaaa 4200

gtggaatata gcgcgctgaa caaaatggaa aaatcgattg ataacattat gattaaagaa 4260

aactgcgtga aactgaacgt ggatcgcctg ggcaaaatta gcaaagcg 4308

<210> 195

<211> 4368

<212> DNA

<213> 稳杆菌属的种

<220>

<221> 来源

<223> /注="APG01688.1天然序列"

<400> 195

atgatgatta aaaatatact tggattagat ttggggacta actctattgg gtgggcattg 60

ataaaacaag attttgaaaa taagcatggc gaaattcttg gaatgggtag ccggattatt 120

ccgatgtcac aggatattct gggcgatttt gggaaaggaa attctatttc gcaaaccgct 180

gatcgtacca aatacagaag cgtgagaaga ttacgtgaac gatttttatt gaggagagaa 240

cgactacaca gagttttaca tcttttaaat tttcttccac agcattatgc ttcacaaatt 300

gattttgaaa aaaaattcgg gaagtttaaa tctgaaactg aacccaaatt ggcatgggaa 360

aattggggtg gaaagttttc attccttttc caaaactctt tcaatgaaat gcttgaagat 420

tttaaagcag ctggacaggg tttaaaaatt ccttacgact ggacaattta ttatctccgt 480

aaaaaagcac tttcacaaaa aattgaaaag gaggaactgg cctggattct tttaaacttt 540

aatcagaaac gaggatatta tcaattgcgt ggtgaggaag aagaagagaa tcctaataag 600

ctggttgaat tttattcttt aaaaattgta gatgttgtag cagatgaacc tcaaaaagga 660

aaatctgata tttggtattc tttgatttta gagaatggat gggtttacag acgagcaagc 720

aaaatacccc tatttgactg gaaagataaa acaagagatt ttattgtaac aactgatttg 780

aatgatgaca gaagtgttaa aacagacaaa gaaggaaatg aaaaaagaag tttcagagca 840

ccaagcgaaa acgattggac attggtaaaa aagaaaaccg aacaggaaat cgaccaatct 900

cacaaaaccg ttggaaccta tatctacgaa acacttcttc taaatccgaa acaaaaaatt 960

aaaggaaaat tggttcggac gattgaaaga aaattctata aagatgagct aaaacaaatt 1020

ttagaaaaac aaaaggaatt tcatcaggaa cttaaaaatg atgatttgta taatgattgc 1080

attcgtgagt tgtacagaaa caacgaagca catcagctga ctttgagcaa gaaagatttt 1140

gttcatcttt tgatggatga tcttattttc taccaaagac ctttgagaag ccagaaatca 1200

tctatttcca actgtacgtt agagtttaga aaatataaag atgaaaatgg aatagagcat 1260

acacaatatt taaaagccat tccaaaatcc aatccgtatt atcaggaatt tcgtctttgg 1320

caatggatgt ataatctgaa tatttacaga aaggacgatg aagcgaatgt taccaaagaa 1380

tttttaaata cgaacaaaga ttttgaaagt ctgtttgaat ttttaaataa tagaaaagaa 1440

attgagcaaa agccattgat taaatttctt ttggaacaaa aagatatcaa taaaaaattg 1500

cttaacgctg aagcagaaaa atatcgctgg aactatgtag aagacaagaa atatccttgc 1560

aatgaaacca aaacgatgat ttcttctcgt ttggataaag tcgaaaacat ttctgatgat 1620

ttcctgacaa gggacattga gcagaaaatt tggcacatca tctattccgt caatgataaa 1680

atagaatatg aaaaagcttt gaaatctttt gcaactagaa acgatttgga tgaaaactct 1740

tttatcgaag cgtttaagaa attctcgcct tttaaaagtg aatatggttc tttttcggaa 1800

aaagcaatta aaaagttact gcctttaatg cgattgggta aatattggta tgaagatgaa 1860

attgtaaagc atagtgatat ttatttcaaa aatattgaga atcttttggg tgatttttca 1920

aatagagaca aaaaaatttc tgaagaagac aaagagaaat ggaataaatc tataaatcta 1980

aagttacagg aagagttaaa agattttcaa acagctgaaa tagatttatt tcaaggatta 2040

cgattgcata ttgctcaata ccttgtttat ggaagacatt cagaagcttc aatgattgga 2100

aaatggaatt ccgccgaaga tttagaagaa tttttaaagg attttaaaca gcattcgctt 2160

cgcaacccga ttgtagaaca agtgattaca gaaactttgc gtgttgtaaa agatatttgg 2220

ttgaaatacg gaaatggagc aaaggatttc ttcaatgaaa ttcatattga gttaggaaga 2280

gaaatgaaac ttcccgcaga tgatcgaaaa aaactaacga accagatttc tgaaaacgaa 2340

aataccaatt tccgcatcaa agctctattg gctgaaatga tgaatgacag ttcggtagaa 2400

aatgtccgtc cgttttcgcc gatgcagcaa gaaattttaa aaatttatga agacgatgtt 2460

ttaaaatcag atatagaaat tgaagatgat attctgaaaa tcagcaaaac cgctcaacct 2520

tctccttccg atttgaaacg atataaactt tggttggaac agaaatacaa atcgccttac 2580

acggggcaaa ttattccttt gaataaattg tttacaccag aatacgaaat tgagcacatt 2640

attccgcaga gccgatattt tgatgacagt tttagcaata aagtaatttg tgagtctgcg 2700

gttaataaat tgaaagataa ctacatcgga cttgaattta ttaagcagtt cggaggaacg 2760

attattgaac ttggttttgg taaaagcata aaagtttttg aaacaaaaga atacgaagat 2820

ttcgtcaaaa aacattacgc caacaatcaa ggtaaaagaa acaaactttt gatggaagat 2880

attccagaga aaatgattga acgtcaaatg aacgatacac gatatatcag caaatatatt 2940

tcgggcgttt tgtctaatat tgttcgggta gaagatggtt cagatgaagg ggtaaattct 3000

aaaaatattg ttcccggaaa cggaaaaatc accacacagc tgaaacaaga ttggggattg 3060

aatgatgttt ggaatgattt gattttacca cgctttgaaa gaatgaacca actcaccaat 3120

tcaaaagttt ttactgcctg gaatgagaat tatcaaaagt ttttaccaac tgttcctatt 3180

gaatattcca aagggttttc aaagaaaaga atagaccacc gccatcacgc tttagatgct 3240

ttggtgattg cctgtgctac aaaagatcac gtgaatttat taaataatca atcggcaaaa 3300

tcggatacca aacgatacga tttgaaaaag aaatcgatga agtttgaaaa agtagtttac 3360

aatgatgcca aaacaggaga gaaaatcgaa agggaagtgc caaaacaatt tttaaaacct 3420

tgggaaaatt ttacgctaga tgttaaacat aatttggaaa ctattattgt aagttttaag 3480

caaaatcttc gtgttattaa taaagcgact aattattacg aaaagtatgt tgagaaagac 3540

ggtacaaaaa ataaggaaag agtagagcag accggaacaa actgggcgat taggaaacca 3600

atgcataaag acacggtttc cggtaaagta gatttacctt gggtaaaagt cccaaaaggg 3660

aaaattttaa cagcaacaag gaaaagcctt gatagttcgt ttgacttaaa gtcaataggc 3720

tctattacgg atacaggaat tcagaaaata ctcaaaaatt atttagcatt taaagacgga 3780

aatcctgaac tggctttttc accagaagga attgacgatt tgaataaaaa tattgaaaaa 3840

tacaatgatg gaaaaccgca tcaacccatc aataaagtaa gggtttttga attgggaagt 3900

aaatttcagg taggacaaag tggaaataaa aaagataaat atgtagaagc tgcaaaagga 3960

actaatctat tctttgctgt ttatgaagat gaaaaaggaa agagaaatta tgaaaccatt 4020

cctttgaatg aagtgattga aaggcaaaag caaggtttat ctgtggttga tttaaaaggt 4080

acaaatgatt tctacttatg tccgaatgat tttgtatata ttccatcagg cgacgaactt 4140

gaaaatataa ataatgttga ttttaaagac attaaaaaag agataaacga aagaatttac 4200

aaagtagtaa gttttacagg taatagactt tcctgtattc catatatggt tgcaacaacg 4260

attgttaata aattagagtt tacgcaactt aataaaattg aattcacaaa agaaaaagaa 4320

atttgtataa aactaaatgt cgatcgttta ggtaacattt caaaagcg 4368

<210> 196

<211> 4368

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="APG01688.1大肠杆菌优化的"

<400> 196

atgatgatta aaaatatcct aggcctggac ctgggaacca acagcatcgg ctgggcgctg 60

attaaacagg acttcgaaaa taagcatggc gagatactag gcatgggcag ccgaataatc 120

ccgatgagtc aggacatact aggcgacttc ggcaagggca acagcatcag ccagaccgcg 180

gaccgcacaa aatatcgcag cgtgcgtaga ctgcgcgaac gctttctgtt acgtcgtgaa 240

cgtctgcatc gtgttcttca cctattaaac ttcctgccgc agcattacgc tagccagatc 300

gacttcgaga agaagttcgg caagttcaag agcgagaccg aaccaaaact ggcgtgggaa 360

aactggggcg gcaaattcag cttcctattc caaaatagct tcaacgagat gctagaggac 420

ttcaaggcgg cgggtcaggg attaaaaata ccgtacgact ggaccatata ctacctgcgc 480

aagaaagcgc tgagccagaa gatcgagaag gaggagctgg cgtggatact actgaacttt 540

aatcaaaagc gcggatacta ccagctgcgc ggcgaggagg aggaggagaa cccgaataaa 600

ctggtggagt tctacagcct gaaaatagtg gacgtggtgg cggacgagcc gcagaaaggc 660

aaaagcgaca tctggtactc actcatacta gaaaacggct gggtgtatcg ccgcgcgagc 720

aaaataccgc tgttcgactg gaaagataaa acccgcgact tcatcgtgac caccgacctg 780

aacgacgacc gcagcgtgaa aaccgacaaa gaaggcaatg aaaaacgcag ctttcgcgcg 840

ccgagcgaaa acgattggac cctggtgaaa aagaaaaccg aacaggaaat cgatcagagc 900

cataaaaccg tgggcacata tatctatgaa accctgttat taaacccgaa gcagaagatt 960

aaaggcaaac tggtgcgcac catcgaacgc aaattctaca aagacgaatt aaaacagata 1020

ctagaaaaac agaaagaatt ccaccaggaa ttaaagaacg acgacttata taacgattgc 1080

atccgcgaac tgtaccgcaa taatgaagcg caccaattaa ccctgagcaa aaaggatttc 1140

gtgcacttat taatggatga tctgatcttc taccagcgcc cgctgcgcag ccagaaatca 1200

agcatcagca attgcaccct ggaattccgc aaatacaaag atgaaaacgg catcgaacac 1260

acccagtacc tgaaagcgat cccgaaatca aacccatact accaggaatt ccgcctgtgg 1320

cagtggatgt acaacctgaa catctaccgc aaagatgatg aagcgaacgt aaccaaagaa 1380

ttcctgaaca ccaataaaga tttcgaaagc ctgttcgaat tcctgaataa tcgcaaagaa 1440

atcgaacaga aaccattaat caaattcctg ctggaacaga aagatattaa taaaaagtta 1500

ttaaacgcgg aagcggaaaa atacagatgg aactacgtgg aagataaaaa gtacccgtgc 1560

aatgaaacca aaaccatgat cagcagccgc ctggataaag tggaaaatat cagcgatgat 1620

ttcctgaccc gcgatatcga acagaaaata tggcatataa tctacagcgt gaacgataaa 1680

atcgaatatg aaaaagcatt aaaatcgttc gcgacccgca acgatctgga tgaaaatagc 1740

ttcatcgaag cattcaaaaa gttcagcccg ttcaaaagcg aatacggcag cttcagcgaa 1800

aaagcgatta aaaagctgct gccattaatg cgcctgggaa aatactggta cgaagatgaa 1860

atcgtgaaac acagcgatat ctacttcaaa aacatcgaaa acctgctggg cgatttcagc 1920

aaccgcgata aaaagatcag cgaagaagat aaagaaaaat ggaacaaaag catcaacctg 1980

aaactgcagg aagaactgaa agatttccag accgcggaaa tcgatctgtt ccagggcctg 2040

cgcctgcata tcgcgcagta cctggtgtac ggccgccata gcgaagcgag catgatcggc 2100

aaatggaact cagcggaaga tctggaagaa ttcctgaaag atttcaaaca gcatagcctg 2160

cgcaacccga tcgtggaaca ggtgatcacc gaaaccctgc gcgtggtgaa agatatctgg 2220

ctgaaatatg gcaacggcgc gaaagatttc tttaacgaaa ttcatatcga actgggccgc 2280

gaaatgaaac tgccggcgga tgatcgcaaa aagctgacca accagatcag cgaaaacgaa 2340

aacaccaact ttcgcatcaa agcgctgctg gcggaaatga tgaacgatag cagcgtggaa 2400

aacgtgcgcc cgtttagccc gatgcagcag gaaatcctga aaatctatga agatgatgtg 2460

ctgaaaagcg atatcgaaat cgaagatgat atcttaaaaa tcagcaaaac cgcgcagccg 2520

agcccgagcg atctgaaacg ctataaactg tggctggaac agaaatataa aagcccgtat 2580

accggccaga tcatcccgct gaacaaactg tttaccccgg aatatgaaat cgaacatatc 2640

atcccgcaga gccgctattt tgatgatagc tttagcaaca aagtgatctg cgaaagcgcg 2700

gtgaacaaac tgaaagataa ctatatcggc ctggaattca tcaaacagtt tggcggcacc 2760

atcatcgaac tgggctttgg caaaagcatc aaagtgtttg aaaccaaaga atatgaagat 2820

tttgtgaaaa agcattatgc gaacaaccag ggcaaacgca acaaactgtt aatggaagat 2880

atcccggaga aaatgatcga acgccagatg aacgataccc gctatatcag caaatatatc 2940

agcggcgtgc tgagcaacat cgtgcgcgtg gaagatggca gcgatgaagg cgtgaacagc 3000

aaaaacatcg tgccgggcaa cggcaaaatc accacccagc tgaaacagga ttggggcctg 3060

aacgatgtgt ggaacgatct gatcctgccg cgctttgaac gcatgaacca gctgaccaac 3120

agcaaagtgt ttaccgcgtg gaacgaaaac tatcagaaat ttctgccgac cgtgccgatt 3180

gaatatagca aaggctttag caaaaagcgc attgatcatc gccatcatgc gctggatgcg 3240

ttagtgattg cgtgcgcgac caaagatcat gtgaacctgc tgaacaacca gagcgcgaaa 3300

agcgatacca aacgctatga tctgaaaaag aaaagcatga aatttgaaaa agtggtgtat 3360

aacgatgcga aaaccggcga gaaaattgaa cgcgaagtgc cgaaacagtt tctgaaaccg 3420

tgggaaaact ttaccctgga tgtgaaacat aacctggaaa ccattattgt gagctttaaa 3480

cagaacctgc gcgtgattaa caaagcgacc aactattatg aaaaatatgt ggaaaaagat 3540

ggcaccaaaa acaaagaacg cgtggaacag accggcacca actgggcgat tcgcaaaccg 3600

atgcataaag ataccgtgtc aggcaaagtg gatctgccgt gggtgaaagt gccgaaaggc 3660

aaaattctga ccgcgacccg caaaagcctg gatagcagct ttgatctgaa aagcattggc 3720

agcattaccg ataccggcat tcagaaaatt ctgaaaaact atctggcgtt taaagatggc 3780

aacccggaac tggcgtttag cccggaaggc attgatgatc tgaacaaaaa cattgaaaaa 3840

tataacgatg gcaaaccgca tcagccgatt aacaaagtgc gcgtgtttga actgggcagc 3900

aaatttcagg tgggccagag cggcaacaaa aaggacaaat atgtggaagc ggcgaaaggc 3960

accaacctgt tctttgcggt gtatgaagat gaaaaaggca aacgcaacta tgaaaccatc 4020

ccgttaaacg aagtgattga acgccagaaa cagggcctga gcgtggtgga tctgaaaggc 4080

accaacgatt tttatctgtg cccgaacgat tttgtgtata ttccgagcgg cgatgaactg 4140

gaaaacatta acaacgtgga ttttaaagat attaaaaagg aaattaacga acgcatctat 4200

aaagtggtga gctttaccgg caaccgcctg agctgcattc cgtatatggt ggcgaccacc 4260

attgtgaaca aactggaatt cacccagctg aacaaaattg aattcaccaa agaaaaagaa 4320

atttgcatta aactgaacgt ggatcgcctg ggcaacatta gcaaagcg 4368

<210> 197

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<220>

<221> 来源

<223> /注="共济失调-毛细血管扩张综合征的靶序列"

<400> 197

gaattattcc agaaagccaa agtag 25

<210> 198

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"

<400> 198

ggcttcatga aggtacagga 20

<210> 199

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="T细胞生理异常的靶序列"

<400> 199

ggtgtgctca ccagaatgga gtaca 25

<210> 200

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 200

gcagatcatt ggggtggatc ccgaa 25

<210> 201

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="3-氧-5α-类固醇δ4-脱氢酶缺乏症的靶序列"

<400> 201

ggctgcaagc ttttcaccac cayag 25

<210> 202

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="急性髓性白血病的靶序列"

<400> 202

gggcggcatg aaccggaggc ccatc 25

<210> 203

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="急性髓性白血病的靶序列"

<400> 203

gcatgggcgg catgaaccgg 20

<210> 204

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="皮肤恶性黑色素瘤3的靶序列"

<400> 204

gtggccactg tggggatcac 20

<210> 205

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="α1-抗胰蛋白酶缺乏症的靶序列"

<400> 205

gtgctgacca tcgacgagaa 20

<210> 206

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"

<400> 206

ggcgagctgc atgatctgcg 20

<210> 207

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 207

gcacatgacg gaggttgtga ggcgc 25

<210> 208

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 208

gaggttgtga ggcactgccc ccacc 25

<210> 209

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 209

gcagcatccg gctgcaggta 20

<210> 210

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 210

ggccaagggg atccgcacgc tgctc 25

<210> 211

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 211

gcctgatgac gcaggactgc 20

<210> 212

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="GRACILE综合征的靶序列"

<400> 212

ggtacgaagt ctcgacactg 20

<210> 213

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="增强的s-cone综合征的靶序列"

<400> 213

ggcattggcg gtggacccca 20

<210> 214

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"

<400> 214

gaagaacagg ttctggacgt caaag 25

<210> 215

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"

<400> 215

gaacaggttc tggacgtcaa 20

<210> 216

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="芳基硫酸酯酶a,等位基因a的靶序列"

<400> 216

gacaggtcat agagcagcgg 20

<210> 217

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 217

gaacgtggtc gctctggaca 20

<210> 218

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 218

gaacgtggtc gctctggaca 20

<210> 219

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="阿林顿公园血红蛋白的靶序列"

<400> 219

ggtgcatctg actcctgagg agaag 25

<210> 220

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚性心肌病1的靶序列"

<400> 220

gaagtccgag gctcgccgca 20

<210> 221

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 221

gtcaaggtca tcggtgaggc 20

<210> 222

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 222

ggtcatcagt gaggccggcc ggggt 25

<210> 223

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 223

gtctcagcct tacgcacctt ccgag 25

<210> 224

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 224

gcaccttcca agtcctccgg gccct 25

<210> 225

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 225

gaagccagcc cctcagggca actgac 26

<210> 226

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="丁酰辅酶A脱氢酶缺乏症的靶序列"

<400> 226

ggcgactcat gggttctgaa 20

<210> 227

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="丁酰辅酶A脱氢酶缺乏症的靶序列"

<400> 227

gcgactcacg ggttctgaat ggaac 25

<210> 228

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"

<400> 228

ggaactgcgg gcccagcatg 20

<210> 229

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"

<400> 229

ggacgagtac caggagcttc 20

<210> 230

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="锥杆营养不良6的靶序列"

<400> 230

ggatctgatc cgggagcgca 20

<210> 231

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="锥杆营养不良6的靶序列"

<400> 231

gaatgcacta tgttctattc catcc 25

<210> 232

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Stargardt病1的靶序列"

<400> 232

gagctgctca caggacgaga acatc 25

<210> 233

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="莱伯先天性黑朦2的靶序列"

<400> 233

gtctatccag taagtatctc 20

<210> 234

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="锥杆营养不良3的靶序列"

<400> 234

ggtacgtcca tgccacaccc 20

<210> 235

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="非综合征性眼皮肤白化病的靶序列"

<400> 235

ggacctttac ggcgtaatcc 20

<210> 236

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="苯丙酮尿症的靶序列"

<400> 236

gtcatccttt ggtgaattac 20

<210> 237

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="苯丙酮尿症的靶序列"

<400> 237

gtattacgtg gcagagagtt ttaat 25

<210> 238

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 238

ggacgctctt gtattatctg 20

<210> 239

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="高苯丙氨酸血症,非pku的靶序列"

<400> 239

gcccttctca gttcgctacg accca 25

<210> 240

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="高苯丙氨酸血症,非pku的靶序列"

<400> 240

gctacgaccc atacacccaa 20

<210> 241

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 241

gcgctatgtt ctattccatc 20

<210> 242

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 242

ggggctggta ttcatgaaag gcaac 25

<210> 243

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 243

gcgctatgtt ctattccatc 20

<210> 244

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 244

gtgttctcag gttatcggta agttt 25

<210> 245

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 245

ggaaatgctg ttagtcggta tgtcg 25

<210> 246

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 246

ggaaatgctg ttagtcagta tgtcg 25

<210> 247

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="前节发育不全6的靶序列"

<400> 247

gtggccactg atcggaaacg 20

<210> 248

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 248

gaacctgatc ctggccgtgg tcgca 25

<210> 249

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Brugada综合征的靶序列"

<400> 249

gatcctggcc gtggtcgcaa 20

<210> 250

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="鸟氨酸氨基甲酰基转移酶缺乏症的靶序列"

<400> 250

gaagggccat gaccttctca ctcta 25

<210> 251

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="I型成骨不全的靶序列"

<400> 251

ggtgctcgag gattgcccgg aacag 25

<210> 252

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="I型成骨不全的靶序列"

<400> 252

gctcgaggat tgcccggaac agctg 25

<210> 253

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="便秘的靶序列"

<400> 253

gattccagtt aaatggatgg caatt 25

<210> 254

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="多巴胺β羟化酶缺乏症的靶序列"

<400> 254

ggacactgcc tattttgcgg tgagt 25

<210> 255

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="囊性纤维化的靶序列"

<400> 255

gacttcatcc aggtatgtaa aaata 25

<210> 256

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="苯丙酮尿症的靶序列"

<400> 256

gatgtaaacc tgacccacac tgaat 25

<210> 257

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="UDP葡萄糖-己糖-1-磷酸尿嘧啶转移酶缺乏症的靶序列"

<400> 257

gagcccctga cacccttacc 20

<210> 258

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="淀粉样变性心肌病,转甲状腺素蛋白相关的靶序列"

<400> 258

gtcaccaatc ccaaggaatg 20

<210> 259

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="I型糖缺乏糖蛋白综合征的靶序列"

<400> 259

ggctactcca tgacagcgcc tgagg 25

<210> 260

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="异染性脑白质营养不良的靶序列"

<400> 260

gcatcccgta ctcccacgac cagat 25

<210> 261

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Smith-Lemli-Opitz 综合征的靶序列"

<400> 261

gttcttcaat gggcgccccg ggatc 25

<210> 262

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="耳聋,常染色体隐性1A的靶序列"

<400> 262

gcaggtgagc ccgccggccc 20

<210> 263

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性脐膨出的靶序列"

<400> 263

gccagcgctc ctagtggcca tgcac 25

<210> 264

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性脐膨出的靶序列"

<400> 264

gcgctcctag tggccatgca cgtgg 25

<210> 265

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性脐膨出的靶序列"

<400> 265

gtccacgcca gcgctcctag 20

<210> 266

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性脐膨出的靶序列"

<400> 266

gctcctagtg gccatgcacg 20

<210> 267

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性肌强直,常染色体显性形式的靶序列"

<400> 267

gagaggattc tttgcagcca cgttc 25

<210> 268

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 268

ggtgacccga gagtgggtgt 20

<210> 269

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="乳腺癌和/或卵巢癌的靶序列"

<400> 269

gatgcctgga cagaggacaa 20

<210> 270

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 270

ggacaatggc ttccatggta 20

<210> 271

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 271

gggctagaaa tctgttgcta 20

<210> 272

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 272

ggtgacccga gagtgggtgt 20

<210> 273

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 273

gattctgcaa ctttcaattg 20

<210> 274

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 274

ggacaatggc ttccatggta 20

<210> 275

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 275

gaaagcccga cttatagcca gtaat 25

<210> 276

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 276

gattacatga acaaatgggc 20

<210> 277

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 277

gattacatga acaaatgggc 20

<210> 278

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 278

gactggaaaa ggaatacagt 20

<210> 279

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="乳腺癌和/或卵巢癌的靶序列"

<400> 279

gttggctgat ggtggatggc tcata 25

<210> 280

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 280

gttggctgat ggtggatggc tcata 25

<210> 281

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 281

ggtcagaaga ttattcttca 20

<210> 282

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 282

ggcttctagt ctcttttgtt 20

<210> 283

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 283

ggcttctagt ctcttttgtt 20

<210> 284

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Smith-Lemli-Opitz 综合征的靶序列"

<400> 284

gttgcgattt tgcagccatt 20

<210> 285

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Alport综合征1,X连锁隐性的靶序列"

<400> 285

ggcctatggg tccccctggt ttcgg 25

<210> 286

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="急性神经元病性Gaucher病的靶序列"

<400> 286

ggcatcaggt gagtgagtca 20

<210> 287

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="促性腺激素缺乏症的靶序列"

<400> 287

gtaactctcc agcataccat 20

<210> 288

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="1A型远侧关节挛缩的靶序列"

<400> 288

gaagctggag gaggccgaga 20

<210> 289

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="1A型远侧关节挛缩的靶序列"

<400> 289

gctggaggag gccgagaagg 20

<210> 290

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 290

gctgccacct tcagggcctc 20

<210> 291

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 291

gataaacttc ttgaagagga 20

<210> 292

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="成年早期死亡的靶序列"

<400> 292

gtgttctcca tgttcgaaca gaccc 25

<210> 293

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="成年早期死亡的靶序列"

<400> 293

gttcgaacag acccaaatcc 20

<210> 294

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="儿童期严重常染色体隐性肌肉营养不良-北非型的靶序列"

<400> 294

gaaatctgtg tgtgtccaga 20

<210> 295

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 295

ggtcatcatt gagagcgacc 20

<210> 296

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="I型糖缺乏糖蛋白综合征的靶序列"

<400> 296

gaatgctgaa gatgatcgac 20

<210> 297

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症I型的靶序列"

<400> 297

gaatgctgaa gatgatcgac 20

<210> 298

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 298

gctcagtaca ccaccgtcgg ccgca 25

<210> 299

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 299

gtacaccacc gtcggccgca 20

<210> 300

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性地中海热的靶序列"

<400> 300

ggacacgtga tggagggaag aacac 25

<210> 301

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="耳聋,常染色体隐性遗传2的靶序列"

<400> 301

ggacctttgt caatgggaca cggac 25

<210> 302

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="耳聋,常染色体隐性遗传2的靶序列"

<400> 302

ggacctttgt caatgggaca cagac 25

<210> 303

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="耳聋,X-连锁 2的靶序列"

<400> 303

gcgctcctag tggccatgca cgtgg 25

<210> 304

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="前庭水管扩大的靶序列"

<400> 304

gccaccactg ctctttcccg cacgg 25

<210> 305

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性感音神经性听力障碍的靶序列"

<400> 305

gtggtcatta acacaaactc 20

<210> 306

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="UDP葡萄糖-己糖-1-磷酸尿嘧啶转移酶缺乏症的靶序列"

<400> 306

gccagatatt gcccagcgtg 20

<210> 307

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"

<400> 307

gccactaatc gtacccagtt 20

<210> 308

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 308

gatattccac tggtggtcga 20

<210> 309

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="红细胞丙酮酸激酶缺乏症的靶序列"

<400> 309

ggaagactcc tgggcataag 20

<210> 310

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="常染色体显性进行性眼外肌麻痹伴线粒体DNA缺失1的靶序列"

<400> 310

gaagtcgttg atggatctgg ccaat 25

<210> 311

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"

<400> 311

gaagatcaca gcttttgtgg 20

<210> 312

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="胱氨酸病,眼非肾病的靶序列"

<400> 312

gtccatctcc ttctaccctc 20

<210> 313

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="红细胞丙酮酸激酶缺乏症的靶序列"

<400> 313

gctcagccca gcttctgtct 20

<210> 314

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="远端肌病,立山型的靶序列"

<400> 314

gattgacctg gtgaaccaag acccc 25

<210> 315

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="恶性高热,易感性,1型的靶序列"

<400> 315

ggccctgcgg atccgcgcca tcctc 25

<210> 316

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="恶性高热,易感性,1型的靶序列"

<400> 316

ggatccgcgc catcctccgc tccct 25

<210> 317

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="中枢肌病的靶序列"

<400> 317

ggtctgatca tcgacgcttt tggtg 25

<210> 318

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="中枢肌病的靶序列"

<400> 318

ggtctgatca tcgacgcttt 20

<210> 319

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="中枢肌病的靶序列"

<400> 319

gatcatcgac acttttggtg agctc 25

<210> 320

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="恶性高热,易感性,1型的靶序列"

<400> 320

ggcggaggca ttggggacga gatcg 25

<210> 321

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="神经元蜡样脂褐质沉积症2的靶序列"

<400> 321

gtgacagtgg ggccgggtgt 20

<210> 322

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="神经元蜡样脂褐质沉积症2的靶序列"

<400> 322

ggggccgggt attggtctgt ctctg 25

<210> 323

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="尼曼-匹克病C1型的靶序列"

<400> 323

ggatcgacga ttatttcgac tgggt 25

<210> 324

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="戊二酸尿症,1型的靶序列"

<400> 324

gagtatcacg tgatccggca cgcca 25

<210> 325

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="CAPN3相关病症的靶序列"

<400> 325

gccctgatgc agaagaaccg gcgga 25

<210> 326

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="CAPN3相关病症的靶序列"

<400> 326

gatgcagaag aaccggcgga 20

<210> 327

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="糖原贮积病,II型的靶序列"

<400> 327

gtcccagaac agctcccctc 20

<210> 328

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="非综合征性眼皮肤白化病的靶序列"

<400> 328

gtacagggat ctgccaacga tccta 25

<210> 329

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 329

gcgaagatgg ctcggatgag 20

<210> 330

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 330

gagtggccgc agcgctgtag 20

<210> 331

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="耳聋,常染色体隐性遗传7的靶序列"

<400> 331

ggtctcaagc tctctcttcg 20

<210> 332

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="慢性婴儿神经、皮肤和关节综合征的靶序列"

<400> 332

gacggcttcg atgagctgca 20

<210> 333

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Eichsfeld型先天性肌营养不良的靶序列"

<400> 333

gactctccgg gagactgtcc 20

<210> 334

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 334

gctcaaaagt ggatgagcgc 20

<210> 335

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="高钾性周期性麻痹1型的靶序列"

<400> 335

gcagctgcgg gtcttcaagc 20

<210> 336

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="包涵体肌病2的靶序列"

<400> 336

ggacgtggat gtggtggttt 20

<210> 337

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="ADA缺乏导致的严重APG05083.1、APG07433.1、

APG07513.1,APG08290.1免疫缺陷的靶序列"

<400> 337

gaagagcggc attcaccgta ctgtc 25

<210> 338

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="ADA缺乏导致的严重APG05083.1、APG07433.1、

APG07513.1,APG08290.1免疫缺陷的靶序列"

<400> 338

gcggtacagt ccgcacctgc tggcc 25

<210> 339

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 339

gtgtccgagc agcgccactg 20

<210> 340

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="囊性纤维化的靶序列"

<400> 340

ggacacttcg tgccttcgga 20

<210> 341

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="囊性纤维化的靶序列"

<400> 341

ggacacttcg tgccttcgga 20

<210> 342

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="小儿肾上腺皮质癌的靶序列"

<400> 342

gggcgtgagc acttcgagat gttcc 25

<210> 343

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="延胡索酸酶缺乏症的靶序列"

<400> 343

gattggacgt actcatactc 20

<210> 344

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="前列腺腺癌的靶序列"

<400> 344

gaacactgtc cattggcatg 20

<210> 345

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚性心肌病1的靶序列"

<400> 345

gcatcctcta cggggacttc 20

<210> 346

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="成人低磷酸酯酶症的靶序列"

<400> 346

gacaacgaga tgccccctga ggcct 25

<210> 347

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="成人低磷酸酯酶症的靶序列"

<400> 347

ggtactcaga caacaagatg ccccc 25

<210> 348

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="成人低磷酸酯酶症的靶序列"

<400> 348

gacaacaaga tgccccctga ggcct 25

<210> 349

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 349

gccttcttgg acaacgtcac cacca 25

<210> 350

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天遗传病的靶序列"

<400> 350

ggtttgccat ccgaggggta gtgct 25

<210> 351

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Crouzon综合征的靶序列"

<400> 351

gcaaatgcct ccacagtggt 20

<210> 352

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="丙酰辅酶A羧化酶缺乏症的靶序列"

<400> 352

gacatcatag gcacctccat 20

<210> 353

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 353

ggtggaaggg atcggctacg acttc 25

<210> 354

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="脂肪软骨营养不良的靶序列"

<400> 354

ggagcagctc tgggccgaag tgtcg 25

<210> 355

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="多种硫酸酯酶缺乏症的靶序列"

<400> 355

ggcgactcct ttgtctttga 20

<210> 356

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="双功能过氧化物酶体缺乏症的靶序列"

<400> 356

ggtggtactg gtcaccggcg 20

<210> 357

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="双功能过氧化物酶体缺乏症的靶序列"

<400> 357

gtactggtca ccagcgcggg ggcag 25

<210> 358

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 358

ggaaacttgt aagggcttcg 20

<210> 359

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 359

gtgcagacat tgacgaatgc cgcat 25

<210> 360

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 360

gacattgacg aatgccgcat atctc 25

<210> 361

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肢带型肌营养不良症,2L型的靶序列"

<400> 361

gcatagtagt aaactagacg 20

<210> 362

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 362

gcatcgatgt caacgagggc aaccg 25

<210> 363

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="痉挛性截瘫,隐性的靶序列"

<400> 363

gcactgctgc tcggcccccc 20

<210> 364

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="异戊酰辅酶A脱氢酶缺乏症的靶序列"

<400> 364

ggagcagtgg ggctcagtta 20

<210> 365

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 365

gaggagctgc ctcacaggtg 20

<210> 366

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="生物素酶缺乏症的靶序列"

<400> 366

gctccagcgc ctgagttgta 20

<210> 367

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="生物素酶缺乏症的靶序列"

<400> 367

gcctgagttg tatggccatc 20

<210> 368

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="莱伯先天性黑朦的靶序列"

<400> 368

gcataatttg tacagctcta agagt 25

<210> 369

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胰岛素血症的靶序列"

<400> 369

ggtggctgag cccagcccgg ccccc 25

<210> 370

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌的靶序列"

<400> 370

ggatgcttgg cagtgggaaa aactt 25

<210> 371

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="科恩综合征的靶序列"

<400> 371

ggaggtctac tacaggtctg 20

<210> 372

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 372

gctccctctg tactgtgcag gagtc 25

<210> 373

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="威尔逊病的靶序列"

<400> 373

ggcaatgaac acaaagagca 20

<210> 374

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="威尔逊病的靶序列"

<400> 374

gccctggatg ggctcagcgg ccatg 25

<210> 375

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="威尔逊病的靶序列"

<400> 375

gcagccctgg atgggctcag 20

<210> 376

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 376

gtggcccagc gaagatgcga 20

<210> 377

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 377

gaagatgcga aggtgatttc 20

<210> 378

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Floating-Harbor综合征的靶序列"

<400> 378

gctgaagctg gagtgggtcg 20

<210> 379

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性长QT综合征的靶序列"

<400> 379

gatgctacac gtcgaccgcc aggga 25

<210> 380

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性长QT综合征的靶序列"

<400> 380

gatgctacac gtcgaccgcc 20

<210> 381

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Andersen Tawil 综合征的靶序列"

<400> 381

gaggaagaga tcaaggtcct ttcca 25

<210> 382

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 382

gagctgataa ccaccctgta catcg 25

<210> 383

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 383

ggaaaactgc ggtatgggcg 20

<210> 384

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型"

<400> 384

gtatttgaag gtctcctccg gggtc 25

<210> 385

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="胃肠道间质瘤的靶序列"

<400> 385

gagggctaaa gtgggctcgg 20

<210> 386

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性角化不良的靶序列"

<400> 386

gctgccaagc ctgctggcaa 20

<210> 387

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="先天性角化不良的靶序列"

<400> 387

gccctgcctg tgacttccag cactg 25

<210> 388

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="糖原贮积病IIIa的靶序列"

<400> 388

gatgagtaga acagaaaaat acaag 25

<210> 389

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="扩张型心肌病1DD的靶序列"

<400> 389

gtctcgtagt ccggtgagcc ggtca 25

<210> 390

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肾肉碱转运缺陷的靶序列"

<400> 390

gtggccatgg aatagcgccg 20

<210> 391

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Baraitser-Winter 综合征1的靶序列"

<400> 391

gatcctcacc gagcgcggct acagc 25

<210> 392

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"

<400> 392

gggcatgcat gaccttggcg tgggc 25

<210> 393

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 393

gtcagatttg tccttgcagt 20

<210> 394

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肢带型肌营养不良症,2A型的靶序列"

<400> 394

gtacggggtt gctctgccgg 20

<210> 395

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 395

gacagtagcc cctgctcggc cttcg 25

<210> 396

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="主动脉瘤,家族性胸廓6的靶序列"

<400> 396

gccccatgcc atcatgcgtc 20

<210> 397

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肢端发育不良的靶序列"

<400> 397

gctttgtcat cgacatttat accgg 25

<210> 398

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症2C型的靶序列"

<400> 398

ggcggacatg cggcaccagg actcg 25

<210> 399

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 399

gtgtaactgt atacgtatgg cgttt 25

<210> 400

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"

<400> 400

gatgcctgga cagaggacaa 20

<210> 401

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症2C型 的靶序列C"

<400> 401

gcctaactga tgaggagttt cgagg 25

<210> 402

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="进行性神经性腓骨肌萎缩症2C型 的靶序列"

<400> 402

gcctaactga tgaggagttt caagg 25

<210> 403

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 403

gagcgctgct cagatagcga 20

<210> 404

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="婴幼儿早期癫痫性脑病的靶序列"

<400> 404

gatgatccgc atggaccggc gggga 25

<210> 405

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="婴幼儿早期癫痫性脑病的靶序列"

<400> 405

ggatgatccg catggaccgg 20

<210> 406

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="婴幼儿早期癫痫性脑病的靶序列"

<400> 406

gcggatgatc cgcatggacc agcgg 25

<210> 407

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肢端发育不良的靶序列"

<400> 407

gtacgtgatc catcctaggt 20

<210> 408

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肥厚型心肌病的靶序列"

<400> 408

gacaccacgg tctccctcaa gtggc 25

<210> 409

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 409

gctgtccggg gtagccccaa gatag 25

<210> 410

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 410

gtccacggtg agggggccct ggtgt 25

<210> 411

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="心血管表型的靶序列"

<400> 411

gcctagactg caggacacag ggact 25

<210> 412

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚性心肌病1的靶序列"

<400> 412

gcatctgcag acatagagac ctgtg 25

<210> 413

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"

<400> 413

gccctccaag agcttgcggt 20

<210> 414

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="糖原贮积病,II型的靶序列"

<400> 414

ggccctcacc ctgcgctacg cactc 25

<210> 415

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="弥漫性肾小球膜硬化症的靶序列"

<400> 415

gtttaggcac ttgttttacc tgtat 25

<210> 416

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="缺损性小眼球的靶序列"

<400> 416

gggtcgaggc ggacgccata 20

<210> 417

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="共济失调毛细血管扩张综合征的靶序列"

<400> 417

gtaaatacat atttactact 20

<210> 418

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌的靶序列"

<400> 418

ggctacagca cacagctcgt 20

<210> 419

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肢带型肌营养不良症,2A型的靶序列"

<400> 419

gctacgagat gcaaaatgca gtcaa 25

<210> 420

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 420

gccgcttacc aaaaggagta 20

<210> 421

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="不对称隔膜肥大的靶序列"

<400> 421

gtgctgcagg ttgttggtgc atggc 25

<210> 422

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 422

gtaattctat aactccttag 20

<210> 423

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚型心肌病2的靶序列"

<400> 423

gctaaagtca ccgggcgctg gaaat 25

<210> 424

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚型心肌病2的靶序列"

<400> 424

ggctaaagtc accgggcgct agaaa 25

<210> 425

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性肥厚型心肌病2的靶序列"

<400> 425

gctaaagtca ccgggcgcta gaaat 25

<210> 426

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性红细胞增多症2的靶序列"

<400> 426

gaaagagcaa tgcctccagg ttgtc 25

<210> 427

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="婴儿期死亡的靶序列"

<400> 427

gtattggaat ccggagcatc cacgt 25

<210> 428

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="肌肉疾病的靶序列"

<400> 428

gcatcttccg gatctttgag 20

<210> 429

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 429

gctgcgagca tggggccctg aggct 25

<210> 430

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌的靶序列"

<400> 430

ggcagcgtta cccagtccga 20

<210> 431

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性癌症易感综合征的靶序列"

<400> 431

gtgtaggcaa cttctatagc cacag 25

<210> 432

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 432

ggaactcccg ccaagatcaa gaaag 25

<210> 433

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 433

gcggctgcca gtatctgtgc ctccc 25

<210> 434

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列的靶序列"

<400> 434

gaatgatctg caggtgagcg tcgcc 25

<210> 435

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="包涵体肌病2的靶序列"

<400> 435

gtgctgtagt gcaccaatgt aatct 25

<210> 436

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="共济失调毛细血管扩张综合征的靶序列"

<400> 436

gctttgatgt taacaatcgc 20

<210> 437

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="良性家族性新生儿-小儿惊厥的靶序列"

<400> 437

gtcagttctc cgatcattcc agctg 25

<210> 438

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Marfan综合征/Loeys-Dietz综合征/家族性胸主动脉瘤和夹层的靶序列"

<400> 438

gtatctccat tgtctcctcg 20

<210> 439

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="扩张型心肌病1G的靶序列"

<400> 439

gtttcagatt cccctggccc acgtg 25

<210> 440

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 440

gcggtgagtc tcggtgcagg 20

<210> 441

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"

<400> 441

gatacagtat taattgactg 20

<210> 442

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 442

gcgagtgcat ccactccagc 20

<210> 443

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 443

ggctacaagt gccagtgtga ggaag 25

<210> 444

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 444

gggtggctac aagtgccagc gtgag 25

<210> 445

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性高胆固醇血症的靶序列"

<400> 445

gtacaccagc ctcaccccca acctg 25

<210> 446

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="家族性乳腺癌的靶序列"

<400> 446

gcctgcccga tagacgagcc tcccg 25

<210> 447

<211> 20

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="遗传性出血性毛细血管扩张2型的靶序列"

<400> 447

gatccgcagc gcggtgagtc 20

<210> 448

<211> 3

<212> DNA

<213> 化脓性链球菌(Streptococcus pyogenes)

<220>

<221> 来源

<223> /注="SpyCas9 PAM"

<220>

<221> 修饰的_碱基

<222> (1)..(1)

<223> a, c, t, g, 未知或其他

<400> 448

ngg 3

<210> 449

<211> 5

<212> DNA

<213> 金黄色葡萄球菌(Staphylococcus aureus)

<220>

<221> 来源

<223> /注="SauCas9"

<220>

<221> 修饰的_碱基

<222> (1)..(1)

<223> a, c, t, g, 未知或其他

<400> 449

ngrrt 5

<210> 450

<211> 415

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<220>

<221> 来源

<223> /注="ADAT"

<400> 450

Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys

1 5 10 15

Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala

20 25 30

Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly

35 40 45

Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg

50 55 60

Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu

65 70 75 80

Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr

85 90 95

Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile

100 105 110

His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr

115 120 125

Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn

130 135 140

His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala

145 150 155 160

Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln

165 170 175

Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser

180 185 190

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

195 200 205

Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu

210 215 220

Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu

225 230 235 240

Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile

245 250 255

Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His

260 265 270

Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr

275 280 285

Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met

290 295 300

Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly

305 310 315 320

Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu

325 330 335

His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu

340 345 350

Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg

355 360 365

Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly

370 375 380

Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

385 390 395 400

Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser

405 410 415

<210> 451

<211> 1494

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<220>

<221> 来源

<223> /注="Nuc-ADAT-接头-dAPG08290.1-接头-SV40"

<400> 451

Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys

1 5 10 15

Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala

20 25 30

Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly

35 40 45

Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg

50 55 60

Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu

65 70 75 80

Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr

85 90 95

Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile

100 105 110

His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr

115 120 125

Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn

130 135 140

His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala

145 150 155 160

Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln

165 170 175

Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser

180 185 190

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

195 200 205

Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu

210 215 220

Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu

225 230 235 240

Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile

245 250 255

Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His

260 265 270

Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr

275 280 285

Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met

290 295 300

Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly

305 310 315 320

Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu

325 330 335

His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu

340 345 350

Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg

355 360 365

Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly

370 375 380

Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

385 390 395 400

Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Met

405 410 415

Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser Ile

420 425 430

Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg Tyr

435 440 445

Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys Ala

450 455 460

Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile Ala

465 470 475 480

Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys Glu

485 490 495

Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu Leu

500 505 510

Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp Ile

515 520 525

Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala Arg

530 535 540

Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg Lys

545 550 555 560

Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile Gln

565 570 575

Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met Trp

580 585 590

Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser Pro

595 600 605

Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu Ile

610 615 620

Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala Ser

625 630 635 640

Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu Pro

645 650 655

Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser Leu

660 665 670

Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe Gln

675 680 685

Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro Asp

690 695 700

Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys Met

705 710 715 720

Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val Ser

725 730 735

Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln Phe

740 745 750

Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu Lys

755 760 765

Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val Val

770 775 780

Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp Tyr

785 790 795 800

Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp Ile

805 810 815

Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr Asp

820 825 830

Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe Gly

835 840 845

His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln Glu

850 855 860

Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr Thr

865 870 875 880

Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro Asp

885 890 895

Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg Lys

900 905 910

Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val His

915 920 925

Ile Ala Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys Lys

930 935 940

Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala Ile

945 950 955 960

Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp Ile

965 970 975

Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr Ser

980 985 990

Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys Glu

995 1000 1005

Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr

1010 1015 1020

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr

1025 1030 1035

Ser Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr

1040 1045 1050

Phe Leu Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val

1055 1060 1065

Arg Ser Asn Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu

1070 1075 1080

Lys Lys Thr Tyr Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg

1085 1090 1095

His Leu Asn Asp Thr Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe

1100 1105 1110

Ile Glu Gln Asn Leu Gln Phe Lys Glu Val Glu Val Asn Leu Arg

1115 1120 1125

Lys Lys Arg Val Gln Thr Val Asn Gly Val Ile Thr Ala His Leu

1130 1135 1140

Arg Lys Arg Trp Gly Leu Glu Lys Asn Arg Gln Glu Thr Tyr Leu

1145 1150 1155

His His Ala Met Asp Ala Ile Ile Val Ala Cys Thr Asp His His

1160 1165 1170

Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln Ile Lys Glu Ser Asn

1175 1180 1185

Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro Trp Glu Gly Phe

1190 1195 1200

Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro Ile Ala Lys

1205 1210 1215

Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser Asp Tyr

1220 1225 1230

Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala

1235 1240 1245

His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly

1250 1255 1260

Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe

1265 1270 1275

Asp Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu

1280 1285 1290

Ala Thr Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys

1295 1300 1305

Asn Ser Lys Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys

1310 1315 1320

Lys Gly Thr Gly Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln

1325 1330 1335

Thr Lys Ala Phe Val Arg Glu Val Asn Gly Gly Val Ala Gln Asn

1340 1345 1350

Ser Asp Leu Val Arg Val Asp Leu Phe Glu Lys Asp Asp Lys Tyr

1355 1360 1365

Tyr Met Val Pro Ile Tyr Val Pro Asp Thr Val Cys Ser Glu Leu

1370 1375 1380

Pro Lys Lys Val Val Lys Ser Gly Lys Gly Tyr Glu Gln Trp Leu

1385 1390 1395

Thr Leu Asp Asn Ser Phe Thr Phe Lys Ser Ser Leu Tyr Pro Tyr

1400 1405 1410

Asp Leu Val Arg Leu Val Lys Gly Asn Glu Asp Arg Phe Leu Tyr

1415 1420 1425

Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg Leu Asn Phe Lys Asp

1430 1435 1440

Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr Arg Tyr Ser Leu Lys

1445 1450 1455

Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val Gly Val Leu Gly Asp

1460 1465 1470

Leu Arg Leu Val Lys Gln Glu Thr Arg Arg Ile Phe Asn Arg Pro

1475 1480 1485

Lys Lys Lys Arg Lys Val

1490

<210> 452

<211> 1494

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<220>

<221> 来源

<223> /注="Nuc-ADAT-接头-nAPG08290.1-接头-SV40"

<400> 452

Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys

1 5 10 15

Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala

20 25 30

Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly

35 40 45

Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg

50 55 60

Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu

65 70 75 80

Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr

85 90 95

Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile

100 105 110

His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr

115 120 125

Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn

130 135 140

His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala

145 150 155 160

Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln

165 170 175

Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser

180 185 190

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

195 200 205

Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu

210 215 220

Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu

225 230 235 240

Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile

245 250 255

Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His

260 265 270

Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr

275 280 285

Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met

290 295 300

Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly

305 310 315 320

Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu

325 330 335

His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu

340 345 350

Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg

355 360 365

Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly

370 375 380

Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

385 390 395 400

Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Met

405 410 415

Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser Ile

420 425 430

Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg Tyr

435 440 445

Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys Ala

450 455 460

Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile Ala

465 470 475 480

Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys Glu

485 490 495

Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu Leu

500 505 510

Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp Ile

515 520 525

Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala Arg

530 535 540

Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg Lys

545 550 555 560

Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile Gln

565 570 575

Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met Trp

580 585 590

Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser Pro

595 600 605

Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu Ile

610 615 620

Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala Ser

625 630 635 640

Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu Pro

645 650 655

Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser Leu

660 665 670

Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe Gln

675 680 685

Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro Asp

690 695 700

Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys Met

705 710 715 720

Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val Ser

725 730 735

Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln Phe

740 745 750

Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu Lys

755 760 765

Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val Val

770 775 780

Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp Tyr

785 790 795 800

Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp Ile

805 810 815

Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr Asp

820 825 830

Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe Gly

835 840 845

His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln Glu

850 855 860

Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr Thr

865 870 875 880

Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro Asp

885 890 895

Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg Lys

900 905 910

Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val His

915 920 925

Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys Lys

930 935 940

Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala Ile

945 950 955 960

Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp Ile

965 970 975

Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr Ser

980 985 990

Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys Glu

995 1000 1005

Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr

1010 1015 1020

Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr

1025 1030 1035

Ser Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr

1040 1045 1050

Phe Leu Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val

1055 1060 1065

Arg Ser Asn Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu

1070 1075 1080

Lys Lys Thr Tyr Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg

1085 1090 1095

His Leu Asn Asp Thr Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe

1100 1105 1110

Ile Glu Gln Asn Leu Gln Phe Lys Glu Val Glu Val Asn Leu Arg

1115 1120 1125

Lys Lys Arg Val Gln Thr Val Asn Gly Val Ile Thr Ala His Leu

1130 1135 1140

Arg Lys Arg Trp Gly Leu Glu Lys Asn Arg Gln Glu Thr Tyr Leu

1145 1150 1155

His His Ala Met Asp Ala Ile Ile Val Ala Cys Thr Asp His His

1160 1165 1170

Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln Ile Lys Glu Ser Asn

1175 1180 1185

Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro Trp Glu Gly Phe

1190 1195 1200

Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro Ile Ala Lys

1205 1210 1215

Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser Asp Tyr

1220 1225 1230

Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala

1235 1240 1245

His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly

1250 1255 1260

Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe

1265 1270 1275

Asp Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu

1280 1285 1290

Ala Thr Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys

1295 1300 1305

Asn Ser Lys Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys

1310 1315 1320

Lys Gly Thr Gly Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln

1325 1330 1335

Thr Lys Ala Phe Val Arg Glu Val Asn Gly Gly Val Ala Gln Asn

1340 1345 1350

Ser Asp Leu Val Arg Val Asp Leu Phe Glu Lys Asp Asp Lys Tyr

1355 1360 1365

Tyr Met Val Pro Ile Tyr Val Pro Asp Thr Val Cys Ser Glu Leu

1370 1375 1380

Pro Lys Lys Val Val Lys Ser Gly Lys Gly Tyr Glu Gln Trp Leu

1385 1390 1395

Thr Leu Asp Asn Ser Phe Thr Phe Lys Ser Ser Leu Tyr Pro Tyr

1400 1405 1410

Asp Leu Val Arg Leu Val Lys Gly Asn Glu Asp Arg Phe Leu Tyr

1415 1420 1425

Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg Leu Asn Phe Lys Asp

1430 1435 1440

Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr Arg Tyr Ser Leu Lys

1445 1450 1455

Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val Gly Val Leu Gly Asp

1460 1465 1470

Leu Arg Leu Val Lys Gln Glu Thr Arg Arg Ile Phe Asn Arg Pro

1475 1480 1485

Lys Lys Lys Arg Lys Val

1490

<210> 453

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Hurler靶标1"

<400> 453

ggagcagctc taggccgaag tgtcg 25

<210> 454

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Hurler靶标2"

<400> 454

taggccgaag tgtcgcaggc cggga 25

<210> 455

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="Hurler靶标3"

<400> 455

gctctaggcc gaagtgtcgc aggcc 25

<210> 456

<211> 135

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA Hurler靶标1"

<400> 456

ggagcagctc taggccgaag tgtcggtcat agttccatga aagccaaaag tggctttgat 60

gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120

ttctccccat ttatt 135

<210> 457

<211> 135

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA Hurler靶标2"

<400> 457

taggccgaag tgtcgcaggc cgggagtcat agttccatga aagccaaaag tggctttgat 60

gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120

ttctccccat ttatt 135

<210> 458

<211> 135

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="sgRNA Hurler靶标3"

<400> 458

ggcctgcgac acttcggcct agagcgtcat agttccatga aagccaaaag tggctttgat 60

gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120

ttctccccat ttatt 135

<210> 459

<211> 15

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler正向扩增引物"

<400> 459

gactccttca ccaag 15

<210> 460

<211> 14

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler反向扩增引物"

<400> 460

gtagatcagc accg 14

<210> 461

<211> 14

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler野生型探针"

<400> 461

ctctgggccg aagt 14

<210> 462

<211> 14

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler W402X探针-β"

<400> 462

ctctaggccg aagt 14

<210> 463

<211> 13

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler NGS正向"

<400> 463

acttcctcca gcc 13

<210> 464

<211> 13

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="Hurler NGS反向"

<400> 464

gaaccccggc tta 13

<210> 465

<211> 31

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="人W402X"

<400> 465

ggagcagctc taggccgaag tgtcgcaggc c 31

<210> 466

<211> 31

<212> DNA

<213> 小鼠(Mus musculus)

<220>

<221> 来源

<223> /注="小鼠W392X"

<400> 466

agaacaactc taggcagagg tctcaaaggc t 31

<210> 467

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="人源化小鼠"

<400> 467

ggagcagctc taggccgaag tgtcgcaggc c 31

<210> 468

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="FRDA靶标1"

<400> 468

atcacctgag gtccggagtt caaga 25

<210> 469

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="FRDA靶标2"

<400> 469

gtcttgaact ccggacctca ggtga 25

<210> 470

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="FRDA靶标3"

<400> 470

tgaactccgg acctcaggtg atcca 25

<210> 471

<211> 25

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="FRDA靶标4"

<400> 471

gaaaagttag ccgggcgtgg tgtcg 25

<210> 472

<211> 500

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<220>

<221> 来源

<223> /注="BCL11A增强子区域"

<400> 472

aaaaatggac aattatgagg aggggagagt gcagacaggg gaagcttcac ctcctttaca 60

attttgggag tccacacggc atggcataca aattatttca ttcccattga gaaataaaat 120

ccaattctcc atcaccaaga gagccttccg aaagaggccc ccctgggcaa acggccaccg 180

atggagaggt ctgccagtcc tcttctaccc cacccacgcc cccaccctaa tcagaggcca 240

aacccttcct ggagcctgtg ataaaagcaa ctgttagctt gcactagact agcttcaaag 300

ttgtattgac cctggtgtgt tatgtctaag agtagatgcc atatctcttt tctggcctat 360

gttattacct gtatggactt tgcactggaa tcagctatct gctcttactt atgcacacct 420

ggggcataga gccagccctg tatcgctttt cagccatctc actacagata actcccaagt 480

cctgtctagc tgccttcctt 500

<210> 473

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列1"

<400> 473

gcactagact agcttcaaag ttgtag 26

<210> 474

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列2"

<400> 474

cctaatcaga ggccaaaccc ttcctg 26

<210> 475

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列3"

<400> 475

caagctaaca gttgctttta tcacag 26

<210> 476

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列4"

<400> 476

gcactagact agcttcaaag ttgtag 26

<210> 477

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列5"

<400> 477

cctaatcaga ggccaaaccc ttcctg 26

<210> 478

<211> 26

<212> DNA

<213> 智人

<220>

<221> 来源

<223> /注="SCD靶标序列6"

<400> 478

caagctaaca gttgctttta tcacag 26

<210> 479

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="RelA FWD"

<400> 479

cttagtttca ccgcaggttc ta 22

<210> 480

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="RelA REV"

<400> 480

ctgtgcactc aacactgatc ta 22

<210> 481

<211> 21

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="AurkB FWD"

<400> 481

cccagcccta ggttgtttat t 21

<210> 482

<211> 23

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="AurkB REV"

<400> 482

ctggctacat cttccttgac tac 23

<210> 483

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="HPRT1 FWD"

<400> 483

gtggcagaag cagtgagtaa 20

<210> 484

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="HPRT1 REV"

<400> 484

tcccatctag gcactaggta aa 22

<210> 485

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 134, 指导物 135, 指导物 136, 指导物 137"

<400> 485

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 486

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 134, 指导物 135, 指导物 136, 指导物 137"

<400> 486

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 487

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 138, 指导物 139, 指导物 140, 指导物 141"

<400> 487

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 488

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 138, 指导物 139, 指导物 140, 指导物 141"

<400> 488

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 489

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 142, 指导物 143, 指导物 144, 指导物 145"

<400> 489

tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53

<210> 490

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 142, 指导物 143, 指导物 144, 指导物 145"

<400> 490

gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54

<210> 491

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 164, 指导物 165, 指导物 166, 指导物 167"

<400> 491

tcgtcggcag cgtcagatgt gtataagaga cagctgacct caggtgatac gcc 53

<210> 492

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 164, 指导物 165, 指导物 166, 指导物 167"

<400> 492

gtctcgtggg ctcggagatg tgtataagag acagctttgg gaggctgaga cagg 54

<210> 493

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 168, 指导物 169, 指导物 170, 指导物 171"

<400> 493

tcgtcggcag cgtcagatgt gtataagaga cagtgctcta ttgtccaggc tgg 53

<210> 494

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 168, 指导物 169, 指导物 170, 指导物 171"

<400> 494

gtctcgtggg ctcggagatg tgtataagag acagtccagc aggtcagcaa agaa 54

<210> 495

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 172, 指导物 173, 指导物 174, 指导物 175"

<400> 495

tcgtcggcag cgtcagatgt gtataagaga caggcagtat aactggccag cct 53

<210> 496

<211> 56

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 172, 指导物 173, 指导物 174, 指导物 175"

<400> 496

gtctcgtggg ctcggagatg tgtataagag acagtcagtt gaggagttca gcttaa 56

<210> 497

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 185, 指导物 186, 指导物 187, 指导物 188"

<400> 497

tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53

<210> 498

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 185, 指导物 186, 指导物 187, 指导物 188"

<400> 498

gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54

<210> 499

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 189, 指导物 190, 指导物 191, 指导物 192"

<400> 499

tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53

<210> 500

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 189, 指导物 190, 指导物 191, 指导物 192"

<400> 500

gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54

<210> 501

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 193, 指导物 194, 指导物 195, 指导物 196"

<400> 501

tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53

<210> 502

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 193, 指导物 194, 指导物 195, 指导物 196"

<400> 502

gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54

<210> 503

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 146"

<400> 503

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 504

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 146"

<400> 504

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 505

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 147"

<400> 505

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 506

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 147"

<400> 506

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 507

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 148"

<400> 507

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 508

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 148"

<400> 508

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 509

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 176"

<400> 509

tcgtcggcag cgtcagatgt gtataagaga caggtagctc actgcagcct caa 53

<210> 510

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 176"

<400> 510

gtctcgtggg ctcggagatg tgtataagag acagtgggtg atgaacatac gggt 54

<210> 511

<211> 57

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 177"

<400> 511

tcgtcggcag cgtcagatgt gtataagaga cagtcagact gaagagctat tgtgtga 57

<210> 512

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 177"

<400> 512

gtctcgtggg ctcggagatg tgtataagag acagccccac aaaccgatgt agct 54

<210> 513

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 209"

<400> 513

tcgtcggcag cgtcagatgt gtataagaga cagtggagtg cagtggtgtg atc 53

<210> 514

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 209"

<400> 514

gtctcgtggg ctcggagatg tgtataagag acagttgagg ctgcagtgag ctac 54

<210> 515

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 197"

<400> 515

tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53

<210> 516

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 197"

<400> 516

gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54

<210> 517

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 198"

<400> 517

tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53

<210> 518

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 198"

<400> 518

gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54

<210> 519

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 199"

<400> 519

tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53

<210> 520

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 199"

<400> 520

gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54

<210> 521

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 149"

<400> 521

gtctcgtggg ctcggagatg tgtataagag acagggtaag gggaaactgg aggc 54

<210> 522

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 149"

<400> 522

tcgtcggcag cgtcagatgt gtataagaga cagtccactt tctaagcagg cgg 53

<210> 523

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 150"

<400> 523

gtctcgtggg ctcggagatg tgtataagag acaggtgggc ctggatttcg atct 54

<210> 524

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 150"

<400> 524

tcgtcggcag cgtcagatgt gtataagaga cagatgaaca ggcaggaagt cgg 53

<210> 525

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 151"

<400> 525

tcgtcggcag cgtcagatgt gtataagaga cagcggttct gagttgcctt cct 53

<210> 526

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 151"

<400> 526

gtctcgtggg ctcggagatg tgtataagag acagggtaag gggaaactgg aggc 54

<210> 527

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 179"

<400> 527

tcgtcggcag cgtcagatgt gtataagaga cagtcagtgg tccacatgca agt 53

<210> 528

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 179"

<400> 528

gtctcgtggg ctcggagatg tgtataagag acagaaggca agttgatcgc tcga 54

<210> 529

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 180"

<400> 529

tcgtcggcag cgtcagatgt gtataagaga cagagtggtt ctgttgcaca cgt 53

<210> 530

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 180"

<400> 530

gtctcgtggg ctcggagatg tgtataagag acagtcgctt aagcccagga gttc 54

<210> 531

<211> 55

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 181"

<400> 531

tcgtcggcag cgtcagatgt gtataagaga cagtctggct gatccgtact aatcc 55

<210> 532

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 181"

<400> 532

gtctcgtggg ctcggagatg tgtataagag acagtaggct caagggatgc tcct 54

<210> 533

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 200"

<400> 533

tcgtcggcag cgtcagatgt gtataagaga cagccagagc tgtccttgag gtg 53

<210> 534

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 200"

<400> 534

gtctcgtggg ctcggagatg tgtataagag acaggtccat acccaccttg gcaa 54

<210> 535

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 201"

<400> 535

tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53

<210> 536

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 201"

<400> 536

gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54

<210> 537

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 202"

<400> 537

tcgtcggcag cgtcagatgt gtataagaga cagaggctat cagtcagcgc atc 53

<210> 538

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 202"

<400> 538

gtctcgtggg ctcggagatg tgtataagag acagagcagg ggaagtgggg atat 54

<210> 539

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 152"

<400> 539

gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54

<210> 540

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 152"

<400> 540

tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53

<210> 541

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 153"

<400> 541

gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54

<210> 542

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 153"

<400> 542

tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53

<210> 543

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 154"

<400> 543

gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54

<210> 544

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 154"

<400> 544

tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53

<210> 545

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 182"

<400> 545

gtctcgtggg ctcggagatg tgtataagag acagtgggtg atgaacatac gggt 54

<210> 546

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 182"

<400> 546

tcgtcggcag cgtcagatgt gtataagaga caggtagctc actgcagcct caa 53

<210> 547

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 183"

<400> 547

gtctcgtggg ctcggagatg tgtataagag acagtgcctg tagtcccagc tact 54

<210> 548

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 183"

<400> 548

tcgtcggcag cgtcagatgt gtataagaga cagtcagctc agtgcaacct ctg 53

<210> 549

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 184"

<400> 549

gtctcgtggg ctcggagatg tgtataagag acagctttgg gaggctgaga cagg 54

<210> 550

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 184"

<400> 550

tcgtcggcag cgtcagatgt gtataagaga cagctgacct caggtgatac gcc 53

<210> 551

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 203"

<400> 551

gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54

<210> 552

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 203"

<400> 552

tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53

<210> 553

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 204"

<400> 553

gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54

<210> 554

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 204"

<400> 554

tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53

<210> 555

<211> 54

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="FWD_指导物 205"

<400> 555

gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54

<210> 556

<211> 53

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="REV_指导物 205"

<400> 556

tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53

<210> 557

<211> 6

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="tracrRNA发夹茎的碱基中的序列"

<220>

<221> 修饰的_碱基

<222> (2)..(2)

<223> a, c, u, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(5)

<223> a, c, u, g, 未知或其他

<400> 557

unannu 6

<210> 558

<211> 6

<212> RNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="tracrRNA发夹茎的碱基中的序列"

<220>

<221> 修饰的_碱基

<222> (2)..(2)

<223> a, c, u, g, 未知或其他

<220>

<221> 修饰的_碱基

<222> (4)..(5)

<223> a, c, u, g, 未知或其他

<400> 558

unanna 6

<210> 559

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<220>

<221> 来源

<223> /注="用于切割位点分析的序列2"

<400> 559

ccatgatata gacgttgtgg ctgttgtagt 30

<210> 560

<211> 6

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成6xHis标签"

<400> 560

His His His His His His

1 5

<210> 561

<211> 10

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成10xHis标签"

<400> 561

His His His His His His His His His His

1 5 10

<210> 562

<211> 34

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 562

cctgggtgtg aggctgggcc attaaaacct ctcc 34

<210> 563

<211> 15

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 563

cctgaaaacc tctcc 15

<210> 564

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 564

cctgggtgtg agctgggcca ttaaaacctc tcc 33

<210> 565

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 565

cctgggccat taaaacctct cc 22

<210> 566

<211> 11

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 566

cctggctctc c 11

<210> 567

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 567

cgggccatta aaacctctcc 20

<210> 568

<211> 40

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 568

cctgggtgtg aggccagacc tgggccatta aaacctctcc 40

<210> 569

<211> 79

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 569

cctgggtgtg aggggaagct gacgtccttt ccatggctgc tcgcctgtgt tgccaccgct 60

gggccattaa aacctctcc 79

<210> 570

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 570

cctgggtgtg acctgggcca ttaaaacctc tcc 33

<210> 571

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 571

cctgggtgtg aggactgggc cattaaaacc tctcc 35

<210> 572

<211> 34

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 572

agttggcaga tgctctaatg tactgccatg ggaa 34

<210> 573

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 573

agttggcaga tgcaatgtac tgccatggga a 31

<210> 574

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 574

agttggcaga tgcatgtact gccatgggaa 30

<210> 575

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 575

agttggcaga tgctatgtac tgccatggga a 31

<210> 576

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 576

agttggcaga tgctaatgta ctgccatggg aa 32

<210> 577

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 577

agttggcaga tgctatgtaa tgccatggga a 31

<210> 578

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 578

agttggcaga tgctctatgt actgccatgg gaa 33

<210> 579

<211> 39

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 579

cgacctgaat gctgtgcggc gctctggctt cattcaatc 39

<210> 580

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 580

cgacctgaat gctgtgcggc tctgcttcca ggtga 35

<210> 581

<211> 36

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 581

cgacctgaat gctgtgcggc atctgcttcc aggtga 36

<210> 582

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 582

cgacctgaat gctgcttcca ggtga 25

<210> 583

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 583

cgacctgaat gcttctgctt ccaggtga 28

<210> 584

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 584

cgacctgaat gcttccaggt ga 22

<210> 585

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 585

gcgtggggac tacgacctga atgctgtgcg gctct 35

<210> 586

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 586

gcgacctgaa tgctgtgcgg ctct 24

<210> 587

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 587

gcgtggggac tacgagctgt gcggctct 28

<210> 588

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 588

gcgtggggac tgaatgctgt gcggctct 28

<210> 589

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 589

gcgtggggac tcctgaatgc tgtgcggctc t 31

<210> 590

<211> 36

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 590

gcgtggggac tacgaacctg aatgctgtgc ggctct 36

<210> 591

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 591

gcgtggggac tacgaatgct gtgcggctct 30

<210> 592

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 592

gcgtggggac tacctgaatg ctgtgcggct ct 32

<210> 593

<211> 21

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 593

gcgtgaatgc tgtgcggctc t 21

<210> 594

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 594

gcgacctgac tgctgtgcgg ctct 24

<210> 595

<211> 34

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 595

gcgtggggac tacgcctgaa tgctgtgcgg ctct 34

<210> 596

<211> 42

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 596

atggaggagt tggcagatgc tctaatgtac tgccatggga ag 42

<210> 597

<211> 40

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 597

atggaggagt tggcagatgc taatgtactg ccatgggaag 40

<210> 598

<211> 34

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 598

atggaggagt tggcagatgt actgccatgg gaag 34

<210> 599

<211> 18

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 599

atgtactgcc atgggaag 18

<210> 600

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 600

atggaggagt tggtgtactg ccatgggaag 30

<210> 601

<211> 43

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 601

atggaggagt tggcagatgc tctaaatgta ctgccatggg aag 43

<210> 602

<211> 45

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 602

atggaggagt tggcagatgc tcttctaatg tactgccatg ggaag 45

<210> 603

<211> 44

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 603

atggaggagt tggcagatgc cctctaatgt actgccatgg gaag 44

<210> 604

<211> 40

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 604

atggaggagt tggcagataa tgtactgcca tgggaagaag 40

<210> 605

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 605

atggcgtact gccatgggaa gaag 24

<210> 606

<211> 46

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 606

atggaggagt tggcagatgc ttctaatgta ctgccatggg aagaag 46

<210> 607

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 607

atggaggagt tggcatctgc catgggaaga ag 32

<210> 608

<211> 42

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 608

atggaggagt tggcagatgc aatgtactgc catgggaaga ag 42

<210> 609

<211> 124

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成多核苷酸"

<400> 609

atggaggagt tggcagatgc caaactgaaa aacaaatcaa agcactctta ttgagtgctg 60

gcgatccccg acgccacggg ccgaaaccct tatcatagaa actctaatgt actgccatgg 120

gaag 124

<210> 610

<211> 84

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 610

atggaggagt tggcagatgc tgcttatata gacctcccac cgtacacgcc taccgcccat 60

tttctaatgt actgccatgg gaag 84

<210> 611

<211> 34

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 611

atggaggagt tgtctaatgt actgccatgg gaag 34

<210> 612

<211> 16

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 612

ctgccatggg aagaag 16

<210> 613

<211> 90

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 613

atggaggagt tggcagatgc gcggctgttc ctgtacagaa ccgtgggcga gatgtggatc 60

aaggatgctc taatgtactg ccatgggaag 90

<210> 614

<211> 41

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 614

atggaggagt tggcagatgc ctaatgtact gccatgggaa g 41

<210> 615

<211> 97

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 615

atggaggagt tggcagatgc tgtcatgatc tttttccgct cgtcgtggga cttgctcagt 60

tctctggcca gctcgtctaa tgtactgcca tgggaag 97

<210> 616

<211> 41

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 616

atggaggagt tggcagatgc tctatgtact gccatgggaa g 41

<210> 617

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 617

cagggacagt gcgcatctcc ctggtcacca ag 32

<210> 618

<211> 17

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 618

cagggacagt caccaag 17

<210> 619

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 619

cagggacagt gcgcatctcc tggtcaccaa g 31

<210> 620

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 620

cagggacagt gcgcatctct ggtcaccaag 30

<210> 621

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 621

cagggacagt gcgcatctcc tctggtcacc aag 33

<210> 622

<211> 29

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 622

cagggacagt gcgcatcctg gtcaccaag 29

<210> 623

<211> 17

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 623

cagggacggt caccaag 17

<210> 624

<211> 31

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 624

cggggacagg gcgcatctcc tggtcaccaa g 31

<210> 625

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 625

cgacctgaat gctgtgcggc tctgcttcca gg 32

<210> 626

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 626

cgacctgaat gctgtgcggc atctgcttcc agg 33

<210> 627

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 627

cgacctgaat gctgtgcggc ttctgcttcc agg 33

<210> 628

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 628

cgacctgaat gctgtgtctg cttccagg 28

<210> 629

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 629

cgacctgcat gctgtgcggc atctgcttcc agg 33

<210> 630

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 630

cgacctgcat gctgtgcggc ttctgcttcc agg 33

<210> 631

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 631

cgacctgcat gctgtgtctg cttccagg 28

<210> 632

<211> 33

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 632

cgacctgaat gctgtgcgac atctgcttcc agg 33

<210> 633

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 633

tggggactac gacctgaatg ctgtgcggct ct 32

<210> 634

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 634

tggggactac gaatgctgtg cggctct 27

<210> 635

<211> 66

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 635

tggggactac gagcaggcag aagtatgcaa agcatgcatc tcaattcctg aatgctgtgc 60

ggctct 66

<210> 636

<211> 72

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 636

tggggactac gaagaaggcg atagaaggcc atgcgctgcg aatcgggagc ggcctgaatg 60

ctgtgcggct ct 72

<210> 637

<211> 99

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 637

tggggactac gatgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 60

ctcaaaggcg gtaatacggc ctgaatgctg tgcggctct 99

<210> 638

<211> 14

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 638

tggggtgcgg ctct 14

<210> 639

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 639

tggggactac gactgctgtg cggctct 27

<210> 640

<211> 39

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 640

cgacctgaat gctgtgcggc gctctggctt cattcaatc 39

<210> 641

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 641

cgacctgaat gctgtgcggc tctgcttcca ggtga 35

<210> 642

<211> 36

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 642

cgacctgaat gctgtgcggc atctgcttcc aggtga 36

<210> 643

<211> 25

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 643

cgacctgaat gctgcttcca ggtga 25

<210> 644

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 644

cgacctgaat gcttctgctt ccaggtga 28

<210> 645

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成寡核苷酸"

<400> 645

cgacctgaat gcttccaggt ga 22

<210> 646

<211> 4

<212> PRT

<213> 智人

<400> 646

Glu Glu Gln Leu

1

<210> 647

<211> 6

<212> PRT

<213> 智人

<400> 647

Ala Glu Val Ser Gln Ala

1 5

<210> 648

<211> 4

<212> PRT

<213> 小鼠

<400> 648

Gly Glu Gln Leu

1

<210> 649

<211> 6

<212> PRT

<213> 小鼠

<400> 649

Ala Glu Val Ser Lys Ala

1 5

<210> 650

<211> 4

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<400> 650

Gly Glu Gln Leu

1

<210> 651

<211> 6

<212> PRT

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述:合成肽"

<400> 651

Ala Glu Val Ser Gln Ala

1 5

相关技术
  • RNA-指导的核酸酶及其活性片段和变体及其使用方法
  • 包含内切核酸酶活性的多肽片段及其用途
技术分类

06120112960653