RNA-指导的核酸酶及其活性片段和变体及其使用方法
文献发布时间:2023-06-19 11:32:36
技术领域
本发明涉及分子生物学和基因编辑领域。
背景技术
靶向基因组编辑或修饰正迅速成为基础研究和应用研究的重要工具。最初的方法涉及工程化核酸酶,例如大范围核酸酶、锌指融合蛋白或TALEN,需要生成具有对每个特定靶序列具有特异性的工程化的、可编程的、序列特异性DNA结合结构域的嵌合核酸酶。RNA-指导的核酸酶(例如CRISPR-cas细菌系统的规律成簇的间隔短回文重复(CRISPR)相关(cas)蛋白)允许通过将核酸酶与指导RNA(其与特定的靶序列特异性杂交)复合来靶向特定序列。与为每个靶序列生成嵌合核酸酶相比,产生靶特异性指导RNA的成本更低并且效率更高。此类RNA-指导的核酸酶可用于通过引入通过易错的非同源末端连接(NHEJ)修复的序列特异性双链断裂以在特定的基因组位置引入突变来编辑基因组。可替代地,可以通过同源介导的修复将异源DNA引入基因组位点。
发明内容
提供了用于结合感兴趣的靶序列的组合物和方法。所述组合物可用于切割或修饰感兴趣的靶序列、检测感兴趣的靶序列和修饰感兴趣的序列的表达。所述组合物包含RNA-指导的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、反式激活CRISPR RNA(tracrRNA)、指导RNA(gRNA)、编码其的核酸分子以及包含所述核酸分子的载体和宿主细胞。还提供了用于结合感兴趣的靶序列的CRISPR系统,其中所述CRISPR系统包含RNA-指导的核酸酶多肽和一种或多种指导RNA。因此,本文公开的方法用于结合感兴趣的靶序列,并且在一些实施方案中,用于切割或修饰感兴趣的靶序列。所述感兴趣的靶序列可以被修饰,例如作为非同源末端连接或用引入的供体序列进行同源性定向修复的结果。
发明详述
受益于前述说明书和相关附图中呈现的教导,本文阐述的本发明的许多修改和其他实施方案将由与这些发明有关的本领域技术人员想到。因此,应当理解,本发明不限于所公开的特定实施方案,并且修改和其他实施方案旨在被包括在所附实施方案的范围内。尽管本文使用了特定术语,但是它们仅在一般和描述性意义上使用,而不是出于限制的目的。
I.概览
RNA-指导的核酸酶(RGN)允许对基因组内的单个位点进行靶向操作并且在用于治疗和研究应用的基因靶向中很有用。在包括哺乳动物的多种生物体中,例如,RNA-指导的核酸酶已通过刺激非同源末端连接和同源重组而被用于基因组工程化。本文所述的组合物和方法可用于在多核苷酸中产生单链或双链断裂、修饰多核苷酸、检测多核苷酸内的特定位点或修饰特定基因的表达。
本文公开的RNA-指导的核酸酶可以通过修饰靶序列来改变基因表达。在特定实施方案中,RNA-指导的核酸酶通过指导RNA(gRNA)(作为规律成簇的间隔短回文重复(CRISPR)RNA-指导的核酸酶系统的一部分)而导向至靶序列。指导RNA与RNA-指导的核酸酶形成复合物以引导RNA-指导的核酸酶结合靶序列并在一些实施方案中在靶序列处引入单链或双链断裂。在靶序列已被切割后,可以修复断裂,从而在修复过程中修饰靶序列的DNA序列。因此,本文提供了用于使用RNA-指导的核酸酶修饰宿主细胞的DNA中的靶序列的方法。例如,RNA-指导的核酸酶可以用于修饰真核细胞或原核细胞的基因组基因座处的靶序列。
II.RNA-指导的核酸酶
本文提供了RNA-指导的核酸酶。术语RNA-指导的核酸酶(RGN)是指以序列特异性方式与特定靶核苷酸序列结合的多肽,其通过与该多肽复合并与靶序列杂交的指导RNA分子而导向至该靶核苷酸序列。尽管RNA-指导的核酸酶可以在结合时能够切割靶序列,但是术语RNA-指导的核酸酶还包括能够结合但不能切割靶序列的核酸酶失活的RNA-指导的核酸酶。RNA-指导的核酸酶对靶序列的切割可导致单链或双链断裂。仅能够切割双链核酸分子的单条链的RNA-指导的核酸酶在本文中被称为切口酶。
本文公开的RNA-指导的核酸酶包括APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1和APG1688.1RNA-指导的核酸酶(其氨基酸序列分别示于SEQ ID NO:1、11、19、27、36、45或54)及其保留以RNA指导的序列特异性方式结合靶核苷酸序列的能力的活性片段或变体。在这些实施方案的一些中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1和APG1688.1 RGN的活性片段或变体能够切割单链或双链靶序列。在一些实施方案中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1或APG1688.1 RGN的活性变体包含与SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列。在某些实施方案中,APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1或APG1688.1 RGN的活性片段包含SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、750、800、850、900、950、1000、1050个或更多个连续的氨基酸残基。本文提供的RNA-指导的核酸酶可包含至少一个核酸酶结构域(例如,DNase、RNase结构域)和至少一个RNA识别和/或RNA结合结构域以与指导RNA相互作用。在本文提供的RNA-指导的核酸酶中可以发现的其他结构域包括但不限于:DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域。在特定实施方案中,本文提供的RNA-指导的核酸酶可包含DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域中的一个或多个的至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。
靶核苷酸序列与本文提供的RNA-指导的核酸酶结合,并与与RNA-指导的核酸酶缔合的指导RNA杂交。然后,如果多肽具有核酸酶活性,则靶序列随后可被RNA-指导的核酸酶切割。术语“切割”或“裂解”是指靶核苷酸序列的主链内至少一个磷酸二酯键的水解,其可导致靶序列内的单链或双链断裂。本文公开的RGN可以切割多核苷酸内的核苷酸,起核酸内切酶的作用或可以是核酸外切酶,从多核苷酸的末端(5’和/或3’末端)去除连续的核苷酸。在其他实施方案中,所公开的RGN可以在多核苷酸的任何位置内切割靶序列的核苷酸,并因此充当核酸内切酶和核酸外切酶。本文公开的RGN对靶多核苷酸的切割可导致交错的断裂或平末端。
本文公开的RNA-指导的核酸酶可以是来源于细菌或古细菌物种的野生型序列。可替代地,RNA-指导的核酸酶可以是野生型多肽的变体或片段。例如,可以修饰野生型RGN以改变核酸酶活性或改变PAM特异性。在一些实施方案中,RNA-指导的核酸酶不是天然存在的。
在某些实施方案中,RNA-指导的核酸酶起切口酶的作用,仅切割靶核苷酸序列的单条链。这样的RNA-指导的核酸酶具有单个功能性核酸酶结构域。在这些实施方案中的一些中,另外的核酸酶结构域已被突变使得核酸酶活性降低或消除。
在其他实施方案中,RNA-指导的核酸酶完全缺乏核酸酶活性或表现出降低的核酸酶活性,并且在本文中被称为核酸酶失活。用于将突变引入氨基酸序列的本领域已知的任何方法(例如PCR介导的诱变和定点诱变)可以用于生成切口酶或核酸酶失活的RGN。例如,参见,美国公开号2014/0068797和美国专利号9,790,490;其各自通过引用整体并入本文。
缺乏核酸酶活性的RNA-指导的核酸酶可用于将融合的多肽、多核苷酸或小分子有效载荷递送至特定的基因组位置。在这些实施方案的一些中,RGN多肽或指导RNA可以与可检测标记融合以允许检测特定序列。作为非限制性示例,核酸酶失活的RGN可以融合至可检测标记(例如荧光蛋白),并被靶向至与疾病相关的特定序列,以允许检测与疾病相关的序列。
可替代地,可以将核酸酶失活的RGN靶向至特定的基因组位置,以改变所需序列的表达。在一些实施方案中,核酸酶失活的RNA-指导的核酸酶与靶序列的结合通过干扰RNA聚合酶或转录因子在靶基因组区域内的结合而导致靶序列或受到靶序列的转录控制的基因的表达的抑制。在其他实施方案中,RGN(例如,核酸酶失活的RGN)或其复合的指导RNA进一步包含表达调节子,在与靶序列结合后,其用于抑制或激活靶序列或受到靶序列的转录控制的基因的表达。在这些实施方案的一些中,表达调节子通过表观遗传机制调节靶序列或受调节的基因的表达。
在其他实施方案中,可以将核酸酶失活的RGN或仅具有切口酶活性的RGN靶向至特定的基因组位置,以通过与碱基编辑多肽(例如脱氨酶多肽或其使核苷酸碱基脱氨基的活性变体或片段)融合来修饰靶多核苷酸的序列,导致从一个核苷酸碱基向另一核苷酸碱基的转化。碱基编辑多肽可以在其N末端或C末端与RGN融合。另外,可以通过肽接头将碱基编辑多肽与RGN融合。可用于此类组合物和方法的脱氨酶多肽的非限制性示例包括胞苷脱氨酶或腺苷脱氨酶碱基编辑器,其描述于Gaudelli等人,(2017)Nature 551:464-471,美国公开号2017/0121693和2018/0073012,以及国际公开号WO/2018/027078,其各自通过引用整体并入本文。
与多肽或结构域融合的RNA-指导的核酸酶可以通过接头分离或连接。如本文所用,术语“接头”是指连接两个分子或部分(例如核酸酶的结合结构域和切割结构域)的化学基团或分子。在一些实施方案中,接头将RNA-指导的核酸酶的gRNA结合结构域与碱基编辑多肽(例如脱氨酶)连接。在一些实施方案中,接头连接核酸酶失活的RGN和脱氨酶。通常,接头位于两个基团、分子或其他部分之间或由其侧接,并通过共价键连接至每个所述基团、分子或其他部分,从而连接所述基团、分子或其他部分。在一些实施方案中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为5-100个氨基酸,例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可以考虑更长或更短的接头。
本文公开的RNA-指导的核酸酶可包含至少一个核定位信号(NLS)以增强RGN向细胞核的转运。核定位信号在本领域中是已知的,并且通常包含一段碱性氨基酸(例如,参见,Lange等人,J.Biol.Chem.(2007)282:5101-5105)。在特定实施方案中,RGN包含2、3、4、5、6个或更多个核定位信号。一个或多个核定位信号可以是异源NLS。可用于本文公开的RGN的核定位信号的非限制性示例是SV40大T抗原、nucleopasmin和c-Myc的核定位信号(例如,参见,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。在特定实施方案中,RGN包含如SEQ IDNO:67所示的NLS序列。RGN可在其N端、C端或N端和C端两者处包含一个或多个NLS序列。例如,RGN可以在N末端区域包含两个NLS序列,在C末端区域包含四个NLS序列。
本领域已知的将多肽定位于一个或多个特定亚细胞位置的其他定位信号序列也可以用于靶向RGN,包括但不限于质体定位序列、线粒体定位序列和靶向质体和线粒体两者的双重靶向信号序列(例如,参见,Nassoury和Morse(2005)Biochim Biophys Acta 1743:5-19;Kunze和Berger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol5:529-535;Carrie和Small(2013)Biochim Biophys Acta 1833:253-259;Carrie等人,(2009)FEBS J 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;Peeters和Small(2001)Biochim Biophys Acta1541:54-63;Murcha等人,(2014)J Exp Bot65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glaser等人,(1998)Plant Mol Biol 38:311-338)。
在某些实施方案中,本文公开的RNA-指导的核酸酶包含至少一个促进RGN的细胞摄取的细胞穿透结构域。细胞穿透结构域是本领域已知的,并且通常包括一段带正电荷的氨基酸残基(即,聚阳离子细胞穿透结构域)、交替的极性氨基酸残基和非极性氨基酸残基(即,两亲性细胞穿透结构域)、或疏水性氨基酸残基(即,疏水性细胞穿透结构域)(例如,参见,Milletti F.(2012)Drug Discov Today17:850-860)。细胞穿透结构域的非限制性示例是来自人类免疫缺陷病毒1的反式激活转录激活因子(TAT)。
核定位信号、质体定位信号、线粒体定位信号、双重靶向定位信号和/或细胞穿透结构域可以位于RNA-指导的核酸酶的氨基末端(N末端)、羧基末端(C末端)或内部位置。
本文公开的RGN可以直接或通过接头肽间接地融合至效应子结构域,例如切割结构域、脱氨酶结构域或表达调节子结构域。这样的结构域可以位于RNA-指导的核酸酶的N末端、C末端或内部位置。在这些实施方案的一些中,融合蛋白的RGN组分是核酸酶失活的RGN。
在一些实施方案中,RGN融合蛋白包含切割结构域,其是能够切割多核苷酸(即RNA、DNA或RNA/DNA杂合体)的任何结构域,并且包括但不限于限制性核酸内切酶和归巢核酸内切酶,例如IIS型核酸内切酶(例如FokI)(参见,例如,Belfort等人,(1997)NucleicAcids Res.25:3379-3388;Linn等人,(eds.)Nucleases,Cold Spring Harbor LaboratoryPress,1993)。
在其他实施方案中,RGN融合蛋白包含使核苷酸碱基脱氨基的脱氨酶结构域,导致从一个核苷酸碱基向另一核苷酸碱基的转化,并且包括但不限于胞苷脱氨酶或腺苷脱氨酶碱基编辑器(例如,参见,Gaudelli等人(2017)Nature 551:464-471,美国公开号2017/0121693和2018/0073012,美国专利号9,840,699和国际公开号WO/2018/027078)。
在一些实施方案中,RGN融合蛋白的效应子结构域可以是表达调节子结构域,其是用于上调或下调转录的结构域。表达调节子结构域可以是表观遗传修饰结构域、转录抑制结构域或转录激活结构域。
在这些实施方案的一些中,RGN融合蛋白的表达调节子包含表观遗传修饰结构域,其共价修饰DNA或组蛋白以改变组蛋白结构和/或染色体结构而不改变DNA序列,从而导致基因表达的改变(即,上调或下调)。表观遗传修饰的非限制性示例包括赖氨酸残基的乙酰化或甲基化、精氨酸甲基化、丝氨酸和苏氨酸磷酸化以及组蛋白的赖氨酸泛素化和sumo化以及DNA中胞嘧啶残基的甲基化和羟甲基化。表观遗传修饰结构域的非限制性示例包括组蛋白乙酰转移酶结构域、组蛋白脱乙酰基酶结构域、组蛋白甲基转移酶结构域、组蛋白脱甲基酶结构域、DNA甲基转移酶结构域和DNA脱甲基酶结构域。
在其他实施方案中,融合蛋白的表达调节子包含转录抑制结构域,其与转录控制元件和/或转录调节蛋白(例如RNA聚合酶和转录因子)相互作用以减少或终止至少一个基因的转录。转录抑制结构域是本领域已知的,包括但不限于Sp1样抑制物、IκB和Krüppel相关盒(KRAB)结构域。
在其他实施方案中,融合蛋白的表达调节子包含转录激活结构域,其与转录控制元件和/或转录调节蛋白(例如RNA聚合酶和转录因子)相互作用以增加或激活至少一个基因的转录。转录激活结构域是本领域已知的,包括但不限于单纯疱疹病毒VP16激活结构域和NFAT激活结构域。
本文公开的RGN多肽可以包含可检测标记或纯化标签。可检测标记或纯化标签可以直接或经由连接肽间接地位于RNA-指导的核酸酶的N末端、C末端或内部位置。在这些实施方案的一些中,融合蛋白的RGN组分是核酸酶失活的RGN。在其他实施方案中,融合蛋白的RGN组分是具有切口酶活性的RGN。
可检测标记是可以是可视化的或以其他方式被观察到的分子。可检测标记可以作为融合蛋白(例如荧光蛋白)与RGN融合,或者可以是与RGN多肽缀合的小分子,其可以目测或通过其他方式检测。可以作为融合蛋白与本文公开的RGN融合的可检测标记包括任何可检测的蛋白结构域,包括但不限于荧光蛋白或可以用特异性抗体检测的蛋白结构域。荧光蛋白的非限制性示例包括绿色荧光蛋白(例如,GFP、EGFP、ZsGreen1)和黄色荧光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可检测标记的非限制性示例包括放射性标记,例如
RGN多肽还可包含纯化标签,其是可用于从混合物(例如生物样品、培养基)分离蛋白质或融合蛋白的任何分子。纯化标签的非限制性示例包括生物素、myc、麦芽糖结合蛋白(M BP)和谷胱甘肽-S-转移酶(GST)。
II.指导RNA
本公开内容提供了指导RNA和编码该指导RNA的多核苷酸。术语“指导RNA”是指与靶核苷酸序列具有足够互补性以与靶序列杂交并引导相关的RNA-指导的核酸酶与靶核苷酸序列的序列特异性结合的核苷酸序列。因此,RGN各自的指导RNA是一个或多个RNA分子(通常是一个或两个),其可以与RGN结合并指导RGN与特定的靶核苷酸序列结合,并且在其中RGN具有切口酶或核酸酶活性的那些情况下还切割靶核苷酸序列。通常,指导RNA包括CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)。包含crRNA和tracrRNA两者的天然指导RNA通常包含两个单独的RNA分子,其通过crRNA的重复序列和tracrRNA的抗重复序列彼此杂交。
CRISPR阵列内的天然同向重复序列的长度通常在28至37个碱基对的范围内,尽管长度可以在约23bp至约55bp之间变化。CRISPR阵列内的间隔子序列的长度通常在约32bp至约38bp的范围内,尽管长度可以为约21bp至约72bp。每个CRISPR阵列通常包含少于50个单位的CRISPR重复间隔子序列。CRISPR被转录为长转录物的一部分,其被称为初级CRISPR转录物,其包含大部分CRISPR阵列。初级CRISPR转录物被Cas蛋白切割以产生crRNA,或在某些情况下产生pre-crRNA,其被另外的Cas蛋白进一步加工为成熟的crRNA。成熟的crRNA包含间隔子序列和CRISPR重复序列。在其中pre-crRNA被加工为成熟(或经加工的)crRNA的一些实施方案中,成熟涉及去除约1至约6个或更多个5’、3’或5’和3’核苷酸。为了基因组编辑或靶向感兴趣的特定靶核苷酸序列的目的,在pre-crRNA分子的成熟过程中去除的这些核苷酸对于产生或设计指导RNA不是必需的。
CRISPR RNA(crRNA)包含间隔子序列和CRISPR重复序列。“间隔子序列”是与感兴趣的靶核苷酸序列直接杂交的核苷酸序列。间隔子序列被设计为与感兴趣的靶序列完全或部分互补。在各种实施方案中,间隔子序列可包含约8个核苷酸至约30个核苷酸或更多个核苷酸。例如,间隔子序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在一些实施方案中,间隔子序列的长度为约10至约26个核苷酸,或长度为约12至约30个核苷酸。在特定实施方案中,间隔子序列的长度为约30个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,间隔子序列及其对应的靶序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,间隔子序列不具有二级结构,其可以使用本领域已知的任何合适的多核苷酸折叠算法来预测,包括但不限于mFold(例如,参见,Zuker和Stiegler(1981)Nucleic Acids Res.9:133-148)和RNAfold(例如,参见,Gruber等人,(2008)Cell 106(1):23-24)。
RGN蛋白对gRNA中的间隔子序列与其靶序列之间的错配可能具有不同的敏感性,从而影响切割效率。如实施例5中所讨论的,APG05459.1 RGN对间隔子序列和靶序列之间的错配具有异常的敏感性,延伸了PAM位点的5’的至少15个核苷酸。因此,与对间隔子序列和靶序列之间的错配的敏感性较小的其他RGN相比,APG05459.1具有以更高的精度更精细地(即,特异性地)靶向特定序列的潜力。
CRISPR RNA重复序列包含核苷酸序列,该核苷酸序列包含具有足够互补性以与tracrRNA杂交的区域。在各种实施方案中,CRISPR RNA重复序列可包含约8个核苷酸至约30个核苷酸,或更多个核苷酸。例如,CRISPR重复序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在一些实施方案中,CRISPR重复序列的长度为约21个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,CRISPR重复序列包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段,当其包含在指导RNA内时,其能够引导本文提供的相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。在某些实施方案中,野生型序列的活性CRISPR重复序列变体包含与SEQ ID NO:2、12、20、28、37、46或55所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性CRISPR重复序列片段包含SEQ ID NO:2、12、20、28、37、46或55所示的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。
在某些实施方案中,crRNA不是天然存在的。在这些实施方案中的一些中,特异性CRISPR重复序列本质上不与工程化的间隔子序列连接,并且CRISPR重复序列被认为与间隔子序列异源。在某些实施方案中,间隔子序列是非天然存在的工程化序列。
反式激活CRISPR RNA或tracrRNA分子包含核苷酸序列,该核苷酸序列包含具有足够的互补性以与crRNA的CRISPR重复序列杂交的区域,其在本文称为抗重复序列区域。在一些实施方案中,tracrRNA分子进一步包含具有二级结构(例如,茎环)或在与其对应的crRNA杂交时形成二级结构的区域。在特定实施方案中,tracrRNA的与CRISPR重复序列完全或部分互补的区域在分子的5’末端,并且tracrRNA的3’末端包含二级结构。该二级结构区域通常包括数个发夹结构,包括与抗重复序列相邻的连结发夹。连结发夹通常在发夹茎的碱基中具有保守的核苷酸序列,其中在tracrRNA的许多连结发夹中发现基序UNANNG、UNANNU或UNANNA(分别为SEQ ID NO:68、557和558)。在tracrRNA的3’末端经常有末端发夹,其在结构和数量上可能有所不同,但通常包含富含GC的Rho独立转录终止子发夹和随后的在3’末端的一串U'。例如,参见,Briner等人,(2014)Molecular Cell 56:333-339,Briner和Barrangou(2016)Cold Spring Harb Protoc;doi:10.1101/pdb.top090902,和美国公开号2017/0275648,其各自通过引用整体并入本文。
在各种实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复序列区域包含约8个核苷酸至约30个核苷酸,或更多个核苷酸。例如,tracrRNA抗重复序列和CRISPR重复序列之间的碱基配对区域的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30个或更多个核苷酸。在特定实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复序列区域的长度为约20个核苷酸。在一些实施方案中,当使用合适的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA抗重复序列之间的互补程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。
在各种实施方案中,整个tracrRNA可包含约60个核苷酸至多于约140个核苷酸。例如,tracrRNA的长度可以为约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140个或更多个核苷酸。在特定实施方案中,tracrRNA的长度为约80至约90个核苷酸,包括约80、约81、约82、约83、约84、约85、约86、约87、约88、约89和约90个核苷酸的长度。在某些实施方案中,tracrRNA的长度为约85个核苷酸。
在特定实施方案中,tracrRNA包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导本文提供的相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。在某些实施方案中,野生型序列的活性tracrRNA序列变体包含与SEQ ID NO:3、13、21、29、38、47或56所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性tracrRNA序列片段包含SEQ ID NO:3、13、21、29、38、47或56所示的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸。
当两个多核苷酸序列在严格条件下彼此杂交时,两个多核苷酸序列可以被认为是基本上互补的。同样,如果在严格条件下与RGN结合的指导RNA与靶序列结合,则认为RGN以序列特异性方式与特定靶序列结合。“严格条件”或“严格杂交条件”是指这样的条件,在该条件下,两个多核苷酸序列彼此杂交的程度将明显大于与其他序列的杂交的程度(例如,是背景的至少2倍)。严格条件是序列依赖性的,并且在不同情况下将有所不同。通常,严格条件将是这样的条件,其中盐浓度小于约1.5M Na离子,通常在pH 7.0至8.3时约0.01至1.0MNa离子浓度(或其他盐),且对于短序列(例如10至50个核苷酸)温度为至少约30℃,和对于长序列(例如大于50个核苷酸)温度为至少约60℃。通过添加去稳定剂(例如甲酰胺)也可以达到严格条件。示例性的低严格条件包括在37℃下使用30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液的杂交,以及在50至55℃下在1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格条件包括在37℃下在40%至45%的甲酰胺、1.0M NaCl、1%SDS中杂交,以及在55至60℃下在0.5X至1X SSC中洗涤。示例性的高严格性条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60至65℃下在0.1X SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%的SDS。杂交的持续时间通常小于约24小时,通常为约4至约12小时。洗涤时间的持续时间将至少是足以达到平衡的时间长度。
Tm是50%的互补靶序列与完全匹配的序列杂交时的温度(在确定的离子强度和pH下)。对于DNA-DNA杂合体,Tm可以从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的等式近似得出:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%甲酰胺)-500/L;其中M是单价阳离子的摩尔浓度,%GC是DNA中鸟嘌呤核苷和胞嘧啶核苷酸的百分比,%甲酰胺是杂交溶液中甲酰胺的百分比,以及L是碱基对中杂合体的长度。通常,严格条件被选择为比特定序列及其互补序列在确定的离子强度和pH下的热熔点(Tm)低约5℃。但是,严重严格条件可以利用在低于热熔点(Tm)1、2、3或4℃下的杂交和/或洗涤;中等严格条件可以利用在低于热熔点(Tm)6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可以利用在低于热熔点(Tm)11、12、13、14、15或20℃下的杂交和/或洗涤。使用该等式、杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将理解,固有地描述了杂交和/或洗涤溶液的严格性的变化。对核酸杂交的广泛指南见于Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology—Hybridization with Nucleic Acid Probes,第I部分,第2章(Elsevier,New York);和Ausubel等人,eds.(1995)Current Protocols in MolecularBiology,第2章(Greene Publishing and Wiley-Interscience,New York)。参见Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Cold Spring HarborLaboratory Press,Plainview,New York)。
指导RNA可以是单指导RNA或双指导RNA系统。单指导RNA包含在单个RNA分子上的crRNA和tracrRNA,而双指导RNA系统包含存在于两个不同RNA分子上的crRNA和tracrRNA,它们通过crRNA的CRISPR重复序列的至少一部分相互杂交和tracrRNA的至少一部分(可以完全或部分与crRNA的CRISPR重复序列互补)彼此杂交。在其中指导RNA是单指导RNA的那些实施方案的一些中,crRNA和tracrRNA被接头核苷酸序列分开。通常,接头核苷酸序列是不包含互补碱基的序列,以避免形成在接头核苷酸序列的核苷酸内或包含接头核苷酸序列的核苷酸的二级结构。在一些实施方案中,crRNA和tracrRNA之间的接头核苷酸序列的长度为至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12个或更多个核苷酸。在特定实施方案中,单指导RNA的接头核苷酸序列的长度为至少4个核苷酸。在某些实施方案中,接头核苷酸序列是SEQ ID NO:63、64或65所示的核苷酸序列。在其他实施方案中,接头核苷酸序列的长度为至少6个核苷酸。在某些实施方案中,接头核苷酸序列是SEQ IDNO:65所示的核苷酸序列。
单指导RNA或双指导RNA可以化学合成或通过体外转录合成。用于确定RGN与指导RNA之间的序列特异性结合的测定是本领域已知的,并且包括但不限于表达的RGN与指导RNA(其可以用可检测标记(例如生物素)进行标记,并用于下拉检测测定中,其中通过可检测标记(例如,使用链霉亲和素珠)捕获指导RNA:RGN复合物)之间的体外结合测定。具有与指导RNA无关的序列或结构的对照指导RNA可以用作RGN与RNA的非特异性结合的阴性对照。在某些实施方案中,指导RNA是SEQ ID NO:10、18、26、35、44、53或62,其中间隔子序列可以是任何序列,并表示为Poly-N序列。
如实施例8中所述,本发明的某些RGN可以共有某些指导RNA。APG05083.1、APG07433.1、APG07513.1和APG08290.1可以各自使用包含含有SEQ ID NO:2、12、20或28的核苷酸序列的crRNA的指导RNA来起作用,其中相应的tracrRNA分别包含SEQ ID NO:3、13、21或29的核苷酸序列。此外,APG04583.1和APG01688.1可各自使用包含含有SEQ ID NO:46或55的核苷酸序列的crRNA的指导RNA来起作用,其中相应的tracrRNA分别包含SEQ 47或56的核苷酸序列。
在某些实施方案中,指导RNA可以作为RNA分子引入靶细胞、细胞器或胚胎。指导RNA可以在体外转录或化学合成。在其他实施方案中,将编码指导RNA的核苷酸序列引入细胞、细胞器或胚胎。在这些实施方案的一些中,编码指导RNA的核苷酸序列与启动子(例如,RNA聚合酶III启动子)可操作地连接。启动子可以是天然启动子,或与指导RNA编码核苷酸序列异源的启动子。
在各种实施方案中,如本文所述,可以将指导RNA作为核糖核蛋白复合物引入靶细胞、细胞器或胚胎,其中指导RNA与RNA-指导的核酸酶多肽结合。
指导RNA通过指导RNA与靶核苷酸序列的杂交将相关的RNA-指导的核酸酶引导至特定的感兴趣的靶核苷酸序列。靶核苷酸序列可以包含DNA、RNA或两者的组合,并且可以是单链或双链的。靶核苷酸序列可以是基因组DNA(即染色体DNA)、质粒DNA或RNA分子(例如信使RNA、核糖体RNA、转移RNA、微RNA、小干扰RNA)。靶核苷酸序列可以在体外或在细胞中被RNA-指导的核酸酶结合(并且在一些实施方案中,被切割)。RGN靶向的染色体序列可以是核、质体或线粒体的染色体序列。在一些实施方案中,靶核苷酸序列在靶基因组中是独特的。
靶核苷酸序列与前间区序列邻近基序(protospacer adjacent motif,PAM)相邻。前间区序列邻近基序通常在距靶核苷酸序列约1至约10个核苷酸内,包括距靶核苷酸序列约1、约2、约3、约4、约5、约6、约7、约8、约9或约10个核苷酸。PAM可以在靶序列的5’或3’。在一些实施方案中,PAM在本文公开的RGN的靶序列的3’。通常,PAM是约3-4个核苷酸的共有序列,但是在特定实施方案中,其长度可以为2、3、4、5、6、7、8、9个或更多个核苷酸。在各种实施方案中,本文公开的RGN识别的PAM序列包含SEQ ID NO:6、32、41、50或59所示的共有序列。非限制性示例性PAM序列是SEQ ID NO:7、69、70、71和72所示的核苷酸序列。
在特定实施方案中,具有SEQ ID NO:1、11、19、27、36、45或54的RNA-指导的核酸酶或其活性变体或片段分别结合与SEQ ID NO:6、32、41、50、59或7所示的PAM序列相邻的靶核苷酸序列。在这些实施方案的一些中,RGN结合指导序列,所述指导序列包含分别如SEQ IDNO:2、12、20、28、37、46或55所示的CRISPR重复序列或其活性变体或片段和分别如SEQ IDNO:3、13、21、29、38、47或56所示的tracrRNA序列或其活性变体或片段。在本说明书的实施例1和表1中进一步描述了RGN系统。
在本领域中众所周知,给定核酸酶的PAM序列特异性受酶浓度的影响(例如,参见,Karvelis等人,(2015)Genome Biol 16:253),其可以通过改变用于表达RGN的启动子或递送到细胞、细胞器或胚胎的核糖核蛋白复合物的量来进行修饰。
识别其相应的PAM序列后,RGN可以在特定切割位点切割靶核苷酸序列。如本文所用,切割位点由靶核苷酸序列内的两个特定核苷酸组成,该核苷酸序列在该特定核苷酸之间被RGN切割。切割位点可以包含在5’或3’方向上距PAM的第一和第二、第二和第三、第三和第四、第四和第五、第五和第六、第七和第八或第八和第九个核苷酸。在一些实施方案中,切割位点可在5′或3′方向上距PAM超过10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,切割位点距PAM 4个核苷酸。在其他实施方案中,切割位点距PAM至少15个核苷酸。由于RGN可以切割靶核苷酸序列而导致交错末端,因此在一些实施方案中,切割位点是基于两个核苷酸在多核苷酸的正(+)链上与PAM的距离和两个核苷酸在多核苷酸的负(-)链上与PAM的距离来定义的。
III.编码RNA-指导的核酸酶、CRISPR RNA和/或tracrRNA的核苷酸
本公开内容提供了包含本文公开的CRISPR RNA、tracrRNA和/或sgRNA的多核苷酸,以及包含编码本文公开的RNA-指导的核酸酶、CRISPR RNA、tracrRNA和/或sgRNA的核苷酸序列的多核苷酸。本文公开的多核苷酸包括包含或编码CRISPR重复序列的那些,所述CRISPR重复序列包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导相关RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。还公开了包含或编码tracrRNA的多核苷酸,所述tracrRNA包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段,当其包含在指导RNA中时,其能够引导相关的RNA-指导的核酸酶与感兴趣的靶序列的序列特异性结合。还提供了编码RNA-指导的核酸酶的多核苷酸,所述RNA-指导的核酸酶包含SEQ ID NO:1、11、19、27、36、45或54所示的氨基酸序列以及其保留以RNA指导的序列特异性方式与靶核苷酸序列结合的能力的活性片段或变体。
术语“多核苷酸”的使用无意将本公开内容限制于包含DNA的多核苷酸。本领域普通技术人员将认识到,多核苷酸可包含核糖核苷酸(RNA)以及核糖核苷酸和脱氧核糖核苷酸的组合。这样的脱氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成类似物。这些包括肽核酸(PNA)、PNA-DNA嵌合体、锁核酸(LNA)和硫代磷酸酯连接的序列。本文公开的多核苷酸还涵盖序列的所有形式,包括但不限于单链形式、双链形式、DNA-RNA杂合体、三链体结构、茎和环结构等。
可以对编码RGN的核酸分子进行密码子优化以在感兴趣的生物体中表达。“密码子优化的”编码序列是其密码子使用频率被设计为模仿特定宿主细胞的优选密码子使用频率或转录条件的多核苷酸编码序列。由于一个或多个密码子在核酸水平上的改变而使得翻译的氨基酸序列不发生改变,导致在特定宿主细胞或生物体中的表达得到增强。核酸分子可以全部或部分被密码子优化。提供各种不同的生物体的偏好信息的密码子表和其他参考文献在本领域中是可获得的(对于植物偏好的密码子使用例如参见Campbell和Gowri(1990)Plant Physiol.92:1-11)。在本领域中可获得用于合成植物偏好的基因的方法。例如,参见,美国专利号5,380,831和5,436,391,以及Murray等人,(1989)Nucleic Acids Res.17:477-498,其通过引用并入本文。
可以在表达盒中提供编码本文提供的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸以在体外表达或在感兴趣的细胞、细胞器、胚胎或生物体中表达。该盒将包含与本文提供的编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可操作地连接的5’和3’调节序列,其允许多核苷酸的表达。该盒可另外地包含至少一种另外的基因或遗传元件以共转化入生物体。在包含另外的基因或元件的情况下,这些元件可操作地连接。术语“可操作地连接”旨在表示两个或多个元件之间的功能连接。例如,启动子和感兴趣的编码区(例如,编码RGN、crRNA、tracrRNA和/或sgRNA的区域)之间的可操作连接是允许感兴趣的编码区的表达的功能性连接。可操作地连接的元件可以是连续的或不连续的。当用于指两个蛋白质编码区的连接时,可操作地连接意指编码区在同一阅读框中。可替代地,可以在多个表达盒上提供另外的一个或多个基因或一个或多个元件。例如,编码本文公开的RGN的核苷酸序列可以存在于一个表达盒上,而编码crRNA、tracrRNA或完整的指导RNA的核苷酸序列可以在单独的表达盒上。这样的表达盒被提供为具有多个限制性位点和/或重组位点以用于插入多核苷酸以处于调节区域的转录调节之下。表达盒可以另外地包含选择标记基因。
表达盒将在转录的5’-3’方向上包括转录(并且在一些实施方案中,翻译)起始区域(即启动子)、本发明的RGN-、crRNA-、tracrRNA-和/或sgRNA-编码多核苷酸以及在感兴趣的生物体中起作用的转录(并且在一些实施方案中,翻译)终止区域(即终止区)。本发明的启动子能够引导或驱动编码序列在宿主细胞中的表达。调节区(例如启动子、转录调节区和翻译终止区)对于宿主细胞或彼此可以是内源的或异源的。如本文所用,关于序列的“异源”是来源于外来物种的序列,或者如果来自相同物种,则是通过有意的人为干预从其天然形式在组成和/或基因组基因座上被实质性修饰的序列。如本文所用,嵌合基因包含可操作地连接至与编码序列异源的转录起始区的编码序列。
可从根癌农杆菌(A.tumefaciens)的Ti质粒获得便利的终止区,例如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人,(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人,(1991)Genes Dev.5:141-149;Mogen等人,(1990)Plant Cell 2:1261-1272;Munroe等人,(1990)Gene 91:151-158;Ballas等人,(1989)Nucleic Acids Res.17:7891-7903;和Joshi等人,(1987)Nucleic Acids Res.15:9627-9639。
另外的调节信号包括但不限于转录起始起始位点、操纵子、激活子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。例如,参见,美国专利号5,039,523和4,853,331;EPO0480762A2;Sambrook等人,(1992)Molecular Cloning:A LaboratoryManual,ed.Maniatis等人,(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.),此后称为"Sambrook11";Davis等人,eds.(1980)Advanced BacterialGenetics(Cold Spring Harbor Laboratory Press),Cold Spring Harbor,N.Y.以及其中引用的参考文献。
在制备表达盒时,可以操纵各种DNA片段,以便以适当的方向和视情况而定在适当的阅读框中提供DNA序列。为此,可以使用衔接子或接头来连接DNA片段,或者可以涉及其他操纵以提供方便的限制性位点、去除多余的DNA、去除限制性位点等。为此目的,可能涉及体外诱变、引物修复、限制性酶切、退火、重新置换,例如转换和颠换。
许多启动子可用于实施本发明。可以基于期望的结果选择启动子。核酸可以与组成型、诱导型、生长阶段特异性、细胞类型特异性、组织优选的、组织特异性或其他启动子组合以用于在感兴趣的生物体中的表达。例如,参见,在以下中列出的启动子:WO99/43838和美国专利号:8,575,425;7,790,846;8,147,856;8,586832;7,772,369;7,534,939;6,072,050;5,659,026;5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611;其通过引用并入本文。
为了在植物中表达,组成型启动子还包括CaMV 35S启动子(Odell等人,(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人,(1990)Plant Cell 2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.12:619-632和Christensen等人,(1992)PlantMol.Biol.18:675-689);pEMU(Last等人,(1991)Theor.Appl.Genet.81:581-588);和MAS(Velten等人,(1984)EMBO J.3:2723-2730)。
诱导型启动子的示例是可通过低氧或冷胁迫诱导的Adh1启动子,可通过热胁迫诱导的Hsp70启动子,PPDK启动子和pep羧化酶启动子,两者均可通过光诱导。可化学诱导的启动子也是有用的,例如安全剂诱导的In2-2启动子(美国专利号5,364,780),生长素诱导的和绒毡层特异性的但在愈伤组织中有活性的Axig1启动子(PCT US01/22169),类固醇响应性启动子(例如,参见,Schena等人,(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等人,(1998)Plant J.14(2):247-257中的雌激素诱导的ERE启动子和糖皮质激素诱导型启动子)和四环素诱导型和四环素抑制型启动子(例如,参见,Gatz等人,(1991)Mol.Gen.Genet.227:229-237和美国专利号5,814,618和5,789,156),其通过引用并入本文。
组织特异性或组织优选的启动子可用于表达构建体在特定组织内的靶向表达。在某些实施方案中,组织特异性或组织优选的启动子在植物组织中有活性。在植物中处于发育控制之下的启动子的示例包括优先在某些组织(例如,叶、根、果实、种子或花)中起始转录的启动子。“组织特异性”启动子是仅在某些组织中起始转录的启动子。与基因的组成型表达不同,组织特异性表达是基因调节的几个相互作用水平的结果。这样,来自同源或紧密相关的植物物种的启动子可以优选用于在特定组织中实现转基因的有效和可靠的表达。在一些实施方案中,表达包含组织优选的启动子。“组织优选的”启动子是优先但不一定完全或仅在某些组织中启动转录的启动子。
在一些实施方案中,编码RGN、crRNA和/或tracrRNA的核酸分子包含细胞类型特异性启动子。“细胞类型特异性”启动子是主要驱动一个或多个器官中某些细胞类型中的表达的启动子。在植物中起作用的细胞类型特异性启动子可能主要在其中具有活性的植物细胞的一些示例包括例如BETL细胞,根、叶中的脉管细胞,茎细胞和干细胞。核酸分子还可包含细胞类型优选的启动子。“细胞类型优选的”启动子是主要驱动主要但不一定完全或仅在一个或多个器官的某些细胞类型中的表达的启动子。在植物中起作用的细胞类型优选的启动子可以优先在其中具有活性的植物细胞的一些示例包括例如BETL细胞,根、叶中的脉管细胞,茎细胞和干细胞。
编码RGN、crRNA、tracrRNA和/或sgRNA的核酸序列可以可操作地连接至被噬菌体RNA聚合酶识别的启动子序列,例如用于体外mRNA合成。在这样的实施方案中,可以纯化体外转录的RNA以用于本文所述的方法。例如,启动子序列可以是T7、T3或SP6启动子序列或T7、T3或SP6启动子序列的变体。在这样的实施方案中,可以纯化表达的蛋白质和/或RNA以用于本文所述的基因组修饰方法。
在某些实施方案中,编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸也可以与聚腺苷酸化信号(例如,SV40 polyA信号和在植物中起作用的其他信号)和/或至少一个转录终止序列连接。另外,编码RGN的序列也可以与编码至少一种核定位信号、至少一种细胞穿透结构域和/或至少一种能够将蛋白质运输到特定亚细胞位置的信号肽的序列连接,如本文其他地方描述的。
编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可以存在于一种或多种载体中。“载体”是指用于将核酸转移、递送或引入宿主细胞的多核苷酸组合物。合适的载体包括质粒载体、噬菌粒、粘粒、人工/微型染色体、转座子和病毒载体(例如慢病毒载体、腺相关病毒载体、杆状病毒载体)。载体可以包含另外的表达控制序列(例如,增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列)、选择标记序列(例如,抗生素抗性基因)、复制起点等。其他信息可以在"Current Protocols in Molecular Biology"Ausubel等人,John Wiley&Sons,New York,2003或"Molecular Cloning:A Laboratory Manual"Sambrook&Russell,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,第3版,2001中找到。
载体还可以包含用于选择转化的细胞的选择标记基因。选择标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草化合物(例如草铵膦、溴草腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))的抗性的基因。
在一些实施方案中,包含编码RGN多肽的序列的表达盒或载体可进一步包含编码crRNA和/或tracrRNA的序列,或组合crRNA和tracrRNA以产生指导RNA的序列。可以将编码crRNA和/或tracrRNA的一个或多个序列可操作地连接至至少一个转录控制序列以用于在感兴趣的生物体或宿主细胞中表达crRNA和/或tracrRNA。例如,可以将编码crRNA和/或tracrRNA的多核苷酸可操作地连接至被RNA聚合酶III(Pol III)识别的启动子序列。合适的Pol III启动子的示例包括但不限于哺乳动物U6、U3、H1和7SL RNA启动子以及水稻U6和U3启动子。
如所示的,包含编码RGN、crRNA、tracrRNA和/或sgRNA的核苷酸序列的表达构建体可用于转化感兴趣的生物体。转化方法涉及将核苷酸构建体引入感兴趣的生物体中。“引入”旨在以使得构建体能够进入宿主细胞的内部的方式将核苷酸构建体引入宿主细胞。本发明的方法不需要将核苷酸构建体引入宿主生物体的特定方法,仅需要核苷酸构建体能够进入宿主生物体的至少一个细胞的内部。宿主细胞可以是真核细胞或原核细胞。在特定实施方案中,真核宿主细胞是植物细胞、哺乳动物细胞或昆虫细胞。将核苷酸构建体引入植物和其他宿主细胞的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。
所述方法导致转化的生物体,例如植物,包括整株植物,以及植物器官(例如,叶、茎、根等),种子,植物细胞,繁殖体,胚及其后代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。
“转基因生物体”或“转化的生物体”或“稳定转化的”生物体或细胞或组织是指已掺入或整合了本发明的编码RGN、crRNA和/或tracrRNA的多核苷酸的生物体。已经认识到,其他外源或内源核酸序列或DNA片段也可以掺入宿主细胞中。农杆菌和基因枪介导的转化仍然是植物细胞转化采用的两种主要方法。但是,宿主细胞的转化可以通过感染、转染、显微注射、电穿孔、显微喷射(microprojection)、基因枪或粒子轰击、电穿孔、二氧化硅/碳纤维、超声介导、PEG介导、磷酸钙共沉淀、聚阳离子DMSO技术、DEAE葡聚糖程序以及病毒介导、脂质体介导等进行。病毒介导的编码RGN、crRNA和/或tracrRNA的多核苷酸的引入包括逆转录病毒、慢病毒、腺病毒和腺相关病毒介导的引入和表达,以及使用花椰菜花叶病毒组、双生病毒和RNA植物病毒。
转化方案以及用于将多肽或多核苷酸序列引入植物的方案可以取决于靶向用于转化的宿主细胞(例如单子叶植物或双子叶植物细胞)的类型而变化。转化方法在本领域中是已知的,包括美国专利号:8,575,425;7,692,068;8,802,934;7,541,517(其各自通过引用并入本文)中所示的那些。还参见Rakoczy-Trojanowska,M.(2002)Cell Mol BiolLett.7:849-858;Jones等人,(2005)Plant Methods 1:5;Rivera等人,(2012)Physics ofLife Reviews 9:308-345;Bartlett等人,(2008)Plant Methods 4:1-12;Bates,G.W.(1999)Methods in Molecular Biology 111:359-366;Binns和Thomashow(1988)AnnualReviews in Microbiology 42:575-606;Christou,P.(1992)The Plant Journal 2:275-281;Christou,P.(1995)Euphytica 85:13-27;Tzfira等人,(2004)TRENDS in Genetics20:375-383;Yao等人,(2006)Journal of Experimental Botany 57:3737-3746;Zupan和Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。
转化可导致核酸稳定或瞬时掺入细胞。“稳定转化”意指引入宿主细胞的核苷酸构建体整合到宿主细胞的基因组中,并能够被其后代遗传。“瞬时转化”意指将多核苷酸引入宿主细胞中并且不整合到宿主细胞的基因组中。
转化叶绿体的方法是本领域已知的。例如,参见,Svab等人,(1990)Proc.Nail.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA90:913-917;Svab和Maliga(1993)EMBO J.12:601-606。该方法依赖于含有选择标记的DNA的粒子枪递送,以及通过同源重组将DNA靶向至质体基因组。另外,质体转化可以通过核编码和质体定向的RNA聚合酶的组织优先表达反式激活沉默的质体携带的转基因来实现。这样的系统已报道于McBride等人,(1994)Proc.Natl.Acad.Sci.USA 91:7301-7305。
可以将已转化的细胞根据常规方式生长成转基因生物体,例如植物。例如,参见,McCormick等人,(1986)Plant Cell Reports 5:81-84。然后可以使这些植物生长,并用相同的转化株或不同株进行授粉,并鉴定出具有所需表型特征的组成型表达的所得杂合体。可以生长两代或更多代,以确保稳定地维持和遗传所需表型特征的表达,以及然后收获种子以确保已实现所需表型特征的表达。以这种方式,本发明提供了具有稳定掺入它们的基因组中的本发明的核苷酸构建体(例如本发明的表达盒)的转化的种子(也称为“转基因种子”)。
可替代地,可以将已转化的细胞引入生物体。这些细胞可能起源于生物体,其中细胞以离体方法转化。
本文提供的序列可用于转化任何植物物种,包括但不限于单子叶植物和双子叶植物。感兴趣的植物示例包括但不限于玉米(玉蜀黍)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦和油菜、芸苔属植物的种、苜蓿、黑麦、小米、红花、花生、甘薯、木薯(cassaya)、咖啡、椰子、菠萝、柑桔树、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、番木瓜、腰果、澳洲坚果、杏仁、燕麦、蔬菜、观赏植物和针叶树。
蔬菜包括但不限于番茄、莴苣、青豆、利马豆、豌豆和黄瓜属的成员,例如黄瓜、哈密瓜和香瓜。观赏植物包括但不限于杜鹃花、绣球花、芙蓉、玫瑰、郁金香、水仙花、矮牵牛、康乃馨、一品红和菊花。优选地,本发明的植物是作物植物(例如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。
如本文所用,术语植物包括植物细胞,植物原生质体,可从其再生植物的植物细胞组织培养物,植物愈伤组织,植物块和在植物或植物的部分(例如胚,花粉、胚珠、种子、叶、花、枝、果实、仁、穗、穗轴、果壳、茎、根、根尖、花药等)中完整的植物细胞。谷物旨在表示由商业种植者生产的用于生长或繁殖物种以外的目的的成熟种子。再生的植物的后代、变体和突变体也包括在本发明的范围内,条件是这些部分包含引入的多核苷酸。还提供了保留本文公开的序列的经加工的植物产品或副产品,包括例如豆粕。
编码RGN、crRNA和/或tracrRNA的多核苷酸也可用于转化任何原核物种,包括但不限于古细菌和细菌(例如,芽孢杆菌属(Bacillus)的种、克雷伯菌属(Klebsiella)的种、链霉菌属(Streptomyces)的种、根瘤菌属(Rhizobium)的种、埃希氏菌属(Escherichia)的种、假单胞菌属(Pseudomonas)的种、沙门氏菌属(Salmonella)的种、志贺氏菌属(Shigella)的种、弧菌属(Vibrio)的种、耶尔森菌属(Yersinia)的种、支原体属(Mycoplasma)的种、农杆菌、乳杆菌属(Lactobacillus)的种)。
编码RGN、crRNA和/或tracrRNA的多核苷酸可用于转化任何真核物种,包括但不限于动物(例如哺乳动物、昆虫、鱼类、鸟类和爬行动物)、真菌、变形虫、藻类和酵母。
常规的基于病毒和非基于病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织。此类方法可用于向培养物中或宿主生物体中的细胞施用编码CRISPR系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸和与递送媒介物(例如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,它们在递送至细胞后具有游离基因组或整合的基因组。对于基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel&Feigner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,in Current Topics inMicrobiology and Immunology,Doerfler和Bohm(eds)(1995);和Yu等人,Gene Therapy1:13-26(1994)。
核酸的非病毒递送方法包括脂质转染、核转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒体、和DNA的试剂增强的摄取。脂质转染描述于例如美国专利号5,049,386、4,946,787和4,897,355并且脂质转染试剂在市场上出售(例如Transfectam
使用基于RNA或DNA病毒的系统用于递送核酸利用了高度进化的过程,该过程将病毒靶向到体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可以直接施用至患者(体内),或者它们可以用于体外治疗细胞,并且修饰的细胞可以任选地施用至患者(离体)。基于病毒的常规系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。在宿主基因组中的整合使用逆转录病毒、慢病毒和腺相关病毒基因转移方法是可能的,通常导致插入的转基因的长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。
逆转录病毒的向性可以通过掺入外来包膜蛋白来改变,从而扩大靶细胞的潜在靶群体。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其具有高达6-10kb的外来序列的包装能力。最小的顺式作用LTR足以用于复制和包装载体,然后将其用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的载体(例如,参见,Buchscher等人,J.Viral.66:2731-2739(1992);Johann等人,J.Viral.66:1635-1640(1992);Sommnerfelt等人,Viral.176:58-59(1990);Wilson等人,J.Viral.63:2374-2378(1989);Miller等人,1.Viral.65:2220-2224(1991);PCT/US94/05700)。
在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有很高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。该载体可以在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体还可用于用靶核酸转导细胞,例如在核酸和肽的体外生产中,和用于体内和离体基因治疗程序(例如,参见,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1.Clin.Invest.94:1351(1994))。重组AAV载体的构建在许多出版物中都有描述,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski等人,1.Viral.63:03822-3828(1989)。包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψJ2细胞或PA317细胞。
基因疗法中使用的病毒载体通常是通过产生将核酸载体包装成病毒颗粒的细胞系而生成的。载体通常包含包装和随后整合入宿主所需的最小病毒序列,其他病毒序列被用于待表达的一个或多个多核苷酸的表达盒替代。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗的AAV载体通常仅具有来自AAV基因组的ITR序列,其是包装和整合到宿主基因组中所需要的。病毒DNA在细胞系中包装,该细胞系包含编码其他AAV基因(即rep和cap)但缺少ITR序列的辅助质粒。
细胞系也可以被作为辅助的腺病毒感染。辅助病毒促进AAV载体的复制和AAV基因从辅助质粒的表达。由于缺少ITR序列,因此没有大量包装辅助质粒。腺病毒的污染可以通过例如腺病毒比AAV更敏感的热处理来减少。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。例如,参见,US20030087817,其通过引用并入本文。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,转染的细胞取自受试者。在一些实施方案中,细胞来源于取自受试者的细胞,例如细胞系。用于组织培养的广泛多样的细胞系是本领域已知的。细胞系的示例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4.COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮、BALB/3T3小鼠胚胎成纤维细胞、3T3 Swiss、3T3-L1、132-d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY细胞、K562细胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-lA/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见,美国典型培养物保藏中心(ATCC)(Manassas,Va.))。
在一些实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一个或多个载体衍生的序列的新细胞系。在一些实施方案中,用本文所述的CRISPR系统的组分瞬时转染(例如通过一种或多种载体的瞬时转染,或用RNA转染)并通过CRISPR复合物的活性修饰的细胞用于建立包含含有修饰但缺乏任何其他外源序列的新的细胞系。在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞或来源于此类细胞的细胞系用于评估一种或多种测试化合物。
在一些实施方案中,本文所述的一种或多种载体用于产生非人转基因动物或转基因植物。在一些实施方案中,转基因动物是哺乳动物,例如小鼠、大鼠或兔子。
IV.多肽和多核苷酸的变体和片段
本公开内容提供了天然存在的(即,野生型)RNA-指导的核酸酶的活性变体和片段,其氨基酸序列如SEQ ID NO:1、11、19、27、36、45或54所示,以及天然存在的CRISPR重复序列的活性变体和片段,例如SEQ ID NO:2、12、20、28、37、46或55所示的序列,以及天然存在的tracrRNA,例如SEQ ID NO:3、13、21、29、38、47或56所示的序列,以及编码所述序列的多核苷酸。
尽管与感兴趣的多核苷酸或多肽相比,变体或片段的活性可以改变,但是变体和片段应保留感兴趣的多核苷酸或多肽的功能。例如,当与感兴趣的多核苷酸或多肽相比时,变体或片段可以具有增加的活性、降低的活性、不同的活性范围或活性的任何其他改变。
天然存在的RGN多肽的片段和变体(例如本文公开的那些)将保留序列特异性的、RNA指导的DNA结合活性。在特定实施方案中,天然存在的RGN多肽的片段和变体(例如本文公开的那些)将保留核酸酶活性(单链或双链的)。
天然存在的CRISPR重复序列的片段和变体(例如本文公开的那些)在作为指导RNA的一部分(包含tracrRNA)时将保留以序列特异性方式结合并将RNA-指导的核酸酶(与指导RNA复合)指导至靶核苷酸序列的能力。
天然存在的tracrRNA的片段和变体(例如本文公开的那些)在作为指导RNA的一部分(包含CRISPR RNA)时将保留以序列特异性方式将RNA-指导的核酸酶(与指导RNA复合)指导至靶核苷酸序列的能力。
术语“片段”是指本发明的多核苷酸或多肽序列的一部分。“片段”或“生物活性部分”包括包含足够数量的连续核苷酸以保留生物学活性(即,当包含在指导RNA中时,以序列特异性方式结合RGN并将RGN引导至靶核苷酸序列)的多核苷酸。“片段”或“生物活性部分”包括包含足够数量的连续氨基酸残基以保留生物学活性(即,当与指导RNA复合时以序列特异性方式结合靶核苷酸序列)的多肽。RGN蛋白的片段包括由于使用替代的下游起始位点而比全长序列短的片段。RGN蛋白的生物活性部分可以是包含例如SEQ ID NO:1、11、19、27、36、45或54的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个连续氨基酸残基的多肽。可以通过重组技术制备这样的生物活性部分并针对序列特异性的RNA指导的DNA结合活性进行评估。CRISPR重复序列的生物活性片段可以包含SEQ ID NO:2、12、20、28、37、46或55的至少8个连续氨基酸。CRISPR重复序列的生物活性部分可以是包含例如SEQ ID NO:2、12、20、28、37、46或55的8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸的多核苷酸。tracrRNA的生物活性部分可以是包含例如SEQ ID NO:3、13、21、29、38、47或56的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸的多核苷酸。
通常,“变体”旨在表示基本相似的序列。对于多核苷酸,变体包括在天然多核苷酸的一个或多个内部位点的一个或多个核苷酸的缺失和/或添加和/或在天然多核苷酸的一个或多个位点的一个或多个核苷酸的置换。如本文所用,“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包括那些由于遗传密码的简并性而编码感兴趣的基因的天然氨基酸序列的序列。诸如此类的天然存在的等位基因变体可以通过使用众所周知的分子生物学技术进行鉴定,例如,使用下文概述的聚合酶链反应(PCR)和杂交技术。变体多核苷酸还包括合成衍生的多核苷酸,例如,那些例如通过使用定点诱变产生但仍编码感兴趣的多肽或多核苷酸的多核苷酸。通常,本文公开的特定多核苷酸的变体将与该特定多核苷酸具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,如通过本文中其他地方描述的序列比对程序和参数所确定的。
还可以通过比较由变体多核苷酸编码的多肽与由参考多核苷酸编码的多肽之间的序列同一性百分比来评估本文公开的特定多核苷酸(即,参考多核苷酸)的变体。可以使用本文其他地方描述的序列比对程序和参数来计算任何两个多肽之间的序列同一性百分比。当通过比较它们编码的两个多肽所共有的序列同一性百分比来评估本文公开的任何给定的多核苷酸对时,两个编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
在特定实施方案中,本文公开的多核苷酸编码RNA-指导的核酸酶多肽,该多肽包含与SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列。
本发明的RGN多肽的生物学活性变体可以在少至约1-15个氨基酸残基,少至约1-10个,例如约6-10个,少至5个,少至4个,少至3个,少至2个或少至1个氨基酸残基上不同。在具体实施方案中,多肽可包含N末端或C末端截短,其可包含从多肽的N或C末端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个氨基酸的缺失。
在某些实施方案中,本文公开的多核苷酸包含或编码CRISPR重复序列,该CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55所示核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。
本文公开的多核苷酸可以包含或编码tracrRNA,其包含与SEQ ID NO:3、13、21、29、38、47或56所示核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%更高的同一性的核苷酸序列。
本发明的CRISPR重复序列或tracrRNA的生物活性变体可以在少至约1-15个核苷酸,少至约1-10个,例如约6-10个,少至5个,少至4个,少至3个,少至2个或少至1个核苷酸上不同。在具体实施方案中,多核苷酸可包含5’或3’截短,其可包含从多核苷酸的5’或3’末端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个核苷酸的缺失。
认可的是,可以对本文提供的RGN多肽、CRISPR重复序列和tracrRNA进行修饰,从而产生变体蛋白和多核苷酸。人为设计的改变可以通过定点诱变技术的应用来引入。可替代地,也可以鉴定与本文公开的序列在结构和/或功能上相关的天然的、未知的或尚未鉴定的多核苷酸和/或多肽。可以在非保守区域中进行不改变RGN蛋白功能的保守氨基酸置换。可替代地,可以进行改善RGN的活性的修饰。
变体多核苷酸和蛋白质还涵盖来源于诱变和重组程序(例如DNA改组)的序列和蛋白质。通过这样的程序,操纵本文公开的一种或多种不同的RGN蛋白(例如,SEQ ID NO:1、11、19、27、36、45或54)以产生具有所需特性的新的RGN蛋白。以这种方式,重组多核苷酸的文库从包含具有实质序列同一性并可以在体外或体内同源重组的序列区域的相关序列多核苷酸的群体中产生。例如,使用这种方法,可以在本文提供的RGN序列和其他已知的RGN基因之间改组编码感兴趣的结构域的序列基序,以获得编码具有改善的感兴趣的性质(例如在酶的情况下增加的K
如本文所用,在两个多核苷酸或多肽序列的上下文中的“序列同一性”或“同一性”是指当在指定的比较窗口上比对以获得最大对应性时两个序列中的残基是相同的。当使用序列同一性百分比来表示蛋白质时,应认识到不相同的残基位置通常因保守的氨基酸置换而不同,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基置换,并因此不会改变分子的功能特性。当序列在保守置换中不同时,可以向上调整序列同一性百分比以校正置换的保守性质。通过这种保守置换而不同的序列被称为具有“序列相似性”或“相似性”。进行这种调整的手段是本领域技术人员众所周知的。通常,这涉及将保守置换评分为部分而不是全部错配,从而增加序列同一性百分比。因此,例如,在相同氨基酸的得分为1,而非保守置换的得分为零的情况下,保守置换的得分为零至1。计算保守置换的得分,例如,如在PC/GENE(Intelligenetics,Mountain View,California)程序中实现的。
如本文所用,“序列同一性百分比”是指通过在比较窗口中比较两个最佳比对的序列而确定的值,其中为了两个序列的最佳比对,比较窗口中的多核苷酸序列的部分与参考序列(其不包括添加或缺失)相比可包括添加或缺失(即缺口)。通过确定两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配位置数、将匹配位置数除以比较窗口中的位置总数和将结果乘以100以得出序列同一性百分比来计算百分比。
除非另有说明,否则本文提供的序列同一性/相似性值是指使用以下参数使用GAP版本10获得的值:使用50的GAP权重和3的长度权重以及nwsgapdna.cmp评分矩阵的核苷酸序列的同一性%和相似性%;使用8的GAP权重和2的长度权重以及BLOSUM62评分矩阵的氨基酸序列的同一性%和相似性%;或其任何等效程序。“等效程序”意指任何序列比较程序,其在与GAP版本10产生的相应比对相比时,对于所考虑的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同序列同一性百分比的比对。
当两个序列被比对用于使用确定的氨基酸置换矩阵(例如,BLOSUM62)、缺口存在罚分和缺口延伸罚分进行相似性评分以达到该对序列可能的最高得分时,所述两个序列被“最佳比对”。氨基酸置换矩阵及其在定量两个序列之间的相似性中的用途是本领域公知的,并例如描述于Dayhoff等人,(1978)"A model of evolutionary change inproteins."In"Atlas of Protein Sequence and Structure,"Vol.5,Suppl.3(ed.M.O.Dayhoff),pp.345-352.Natl.Biomed.Res.Found.,Washington,D.C.和Henikoff等人,(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919。BLOSUM62矩阵通常用作序列比对方案中的默认评分替换矩阵。对于在比对序列之一中引入单个氨基酸缺口,施加缺口存在罚分,并对插入到已经开放的缺口中的每个另外的空氨基酸位置施加缺口延伸罚分。比对通过每个序列的比对开始和结束的氨基酸位置以及任选地通过在一个或两个序列中插入一个或多个缺口以达到最高可能评分来定义。尽管可以手动完成最佳比对和评分,但是通过使用计算机实施的比对算法(例如,Altschul等人,(1997)Nucleic Acids Res.25:3389-3402所述的空位BLAST 2.0)促进了该过程,并在国家生物技术信息中心网站(www.ncbi.nlm.nih.gov)上向公众开放。可以使用例如PSI-BLAST来制备最佳比对,包括多重比对,其可通过www.ncbi.nlm.nih.gov获得并由Altschul等人,(1997)Nucleic AcidsRes.25:3389-3402描述。
关于与参考序列最佳比对的氨基酸序列,氨基酸残基“对应于”参考序列中与该残基在比对中配对的位置。“位置”由数字表示,该数字基于其相对于N端的位置顺序鉴别参考序列中的每个氨基酸。由于在确定最佳比对时必须考虑的缺失、插入、截短、融合等,通过简单地从N端开始计数确定的测试序列中的氨基酸残基数量通常不必与参考序列中其对应位置的数量相同。例如,在比对的测试序列中有缺失的情况下,将不存在与参考序列中缺失位点处的位置相对应的氨基酸。在比对的参考序列中有插入的情况下,该插入将不对应于参考序列中的任何氨基酸位置。在截短或融合的情况下,参考序列或比对序列中可能存在不对应于相应序列中任何氨基酸的氨基酸段。
V.抗体
还涵盖了针对RGN多肽或包含本发明RGN多肽的核糖核蛋白(包括具有SEQ ID NO:1、11、19、27、36、45或54所示氨基酸序列的那些或其活性变体或片段)的抗体。产生抗体的方法是本领域众所周知的(例如,参见,Harlow和Lane(1988)Antibodies:A LaboratoryManual,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.;和美国专利号4,196,265)。这些抗体可用于试剂盒中,用于检测和分离RGN多肽或核糖核蛋白。因此,本公开内容提供了试剂盒,其包含与本文所述的多肽或核糖核蛋白(包括例如具有SEQ ID NO:1、11、19、27、36、45或54的序列的多肽)特异性结合的抗体
VI.用于结合感兴趣的靶序列的系统和核糖核蛋白复合物及其制备方法
本公开内容提供了一种用于结合感兴趣的靶序列的系统,其中所述系统包括至少一种指导RNA或编码该指导RNA的核苷酸序列,以及至少一种RNA-指导的核酸酶或编码其的核苷酸序列。指导RNA与感兴趣的靶序列杂交,并且还与RGN多肽形成复合物,从而引导RGN多肽与靶序列结合。在这些实施方案的一些中,RGN包含SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。在特定实施方案中,系统包含与指导RNA异源的RNA-指导的核酸酶,其中RGN和指导RNA本质上不是天然复合的。
本文提供的用于结合感兴趣的靶序列的系统可以是核糖核蛋白复合物,其是与至少一种蛋白质结合的RNA的至少一个分子。本文提供的核糖核蛋白复合物包含至少一种指导RNA作为RNA组分和RNA-指导的核酸酶作为蛋白质组分。可以从天然表达RGN多肽并已对其进行了工程改造以表达对感兴趣的靶序列具有特异性的特定指导RNA的细胞或生物体中纯化这种核糖核蛋白复合物。可替代地,可以从已经用编码RGN多肽和指导RNA的多核苷酸转化并在允许RGN多肽和指导RNA表达的条件下培养的细胞或生物体中纯化核糖核蛋白复合物。因此,提供了用于制备RGN多肽或RGN核糖核蛋白复合物的方法。此类方法包括在其中表达RGN多肽(和在一些实施方案中,指导RNA)的条件下培养包含编码RGN多肽和在一些实施方案中编码指导RNA的核苷酸序列的细胞。然后可以从培养细胞的裂解物中纯化RGN多肽或RGN核糖核蛋白。
从生物样品的裂解物中纯化RGN多肽或RGN核糖核蛋白复合物的方法是本领域已知的(例如尺寸排阻和/或亲和色谱、2D-PAGE、HPLC、反相色谱、免疫沉淀)。在特定方法中,RGN多肽是重组产生的,并且包含有助于其纯化的纯化标签,包括但不限于谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。通常,使用固定的金属亲和层析纯化标记的RGN多肽或RGN核糖核蛋白复合物。应当理解,可以使用本领域已知的其他类似方法,包括单独或组合使用的其他形式的色谱法或例如免疫沉淀法。
“分离的”或“纯化的”多肽或其生物活性部分实质上或基本上不含在发现其天然存在的环境中通常与多肽伴随或相互作用的组分。因此,分离或纯化的多肽当通过重组技术产生时基本上不含其他细胞材料或培养基,或者当化学合成时基本上不含化学前体或其他化学物质。基本上不含细胞物质的蛋白质包括具有少于约30%、20%、10%、5%或1%(以干重计)污染蛋白质的蛋白质制剂。当重组产生本发明的蛋白质或其生物活性部分时,最佳地,培养基代表少于约30%、20%、10%、5%或1%(以干重计)的化学前体或非感兴趣蛋白质的化学物质。
本文提供的用于结合和/或切割感兴趣的靶序列的特定方法涉及体外组装的RGN核糖核蛋白复合物的使用。RGN核糖核蛋白复合物的体外组装可以使用本领域已知的任何方法进行,其中在允许RGN多肽结合指导RNA的条件下,使RGN多肽与指导RNA接触。如本文所用,“接触”、“触碰”、“交触”是指在适于进行所需反应的条件下将所需反应的组分放在一起。RGN多肽可以从生物样品、细胞裂解物或培养基中纯化、通过体外翻译产生或是化学合成的。指导RNA可以从生物样品、细胞裂解物或培养基中纯化、体外转录或是化学合成的。可以使RGN多肽和指导RNA在溶液(例如,缓冲盐溶液)中接触以允许RGN核糖核蛋白复合物的体外组装。
VII.结合、切割或修饰靶序列的方法
本公开内容提供了用于结合、切割和/或修饰感兴趣的靶核苷酸序列的方法。所述方法包括向靶序列或包含靶序列的细胞、细胞器或胚胎递送包含至少一种指导RNA或编码其的多核苷酸以及至少一种RGN多肽或编码其的多核苷酸的系统。在这些实施方案的一些中,RGN包含SEQ ID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ IDNO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。系统的RGN可以是核酸酶失活的RGN、具有切口酶活性或者可以是融合多肽。在一些实施方案中,融合多肽包含碱基编辑多肽,例如胞苷脱氨酶或腺苷脱氨酶。在特定实施方案中,RGN和/或指导RNA与引入了RGN和/或指导RNA(或编码RGN和指导RNA中的至少一个的多核苷酸)的细胞、细胞器或胚胎异源。
在其中所述方法包括递送编码指导RNA和/或RGN多肽的多核苷酸的那些实施方案中,然后在其中表达指导RNA和/或RGN多肽的条件下培养细胞或胚胎。在各种实施方案中,所述方法包括使靶序列与RGN核糖核蛋白复合物接触。RGN核糖核蛋白复合物可以包含核酸酶失活或具有切口酶活性的RGN。在一些实施方案中,核糖核蛋白复合物的RGN是包含碱基编辑多肽的融合多肽。在某些实施方案中,所述方法包括将RGN核糖核蛋白复合物引入包含靶序列的细胞、细胞器或胚胎中。RGN核糖核蛋白复合物可以是已从生物学样品中纯化、重组产生并随后纯化或如本文所述体外组装的RGN核糖核蛋白复合物。在其中与靶序列或细胞器或胚胎接触的RGN核糖核蛋白复合物进行体外组装的那些实施方案中,该方法可进一步包括在与靶序列、细胞、细胞器或胚胎接触之前体外组装复合物。
可以使用本领域已知的任何方法(包括但不限于电穿孔)将纯化的或体外组装的RGN核糖核蛋白复合物引入细胞、细胞器或胚胎。可替代地,可以使用本领域已知的任何方法(例如电穿孔)将RGN多肽和/或编码或包含指导RNA的多核苷酸引入细胞、细胞器或胚胎。
在递送至靶序列或包含靶序列的细胞、细胞器或胚胎或与靶序列或包含靶序列的细胞、细胞器或胚胎接触时,指导RNA引导RGN以序列特异性方式结合至靶序列。在其中RGN具有核酸酶活性的那些实施方案中,RGN多肽在结合时切割感兴趣的靶序列。随后可以通过内源性修复机制(例如非同源末端连接或使用提供的供体多核苷酸进行同源性定向修复)来修饰靶序列。
测量RGN多肽与靶序列的结合的方法是本领域已知的,包括染色质免疫沉淀测定、凝胶迁移率变动测定、DNA下拉测定、报告基因测定、微孔板捕获和检测测定。类似地,测量靶序列的切割或修饰的方法在本领域中是已知的,包括体外或体内切割测定,其中使用PCR、测序或凝胶电泳在有或没有附接到靶序列以促进降解产物的检测的适当标记(例如放射性同位素、荧光物质)的情况下确认切割。可替代地,可以使用切口触发的指数扩增反应(NTEXPAR)测定(例如,参见,Zhang等人,(2016)Chem.Sci.7:4951-4957)。可以使用Surveyor测定评估体内切割(Guschin等人,(2010)Methods Mol Biol649:247-256)。
在一些实施方案中,所述方法涉及与多于一种指导RNA复合的单一类型的RGN的使用。所述多于一种指导RNA可以靶向单个基因的不同区域或可以靶向多个基因。
在其中不提供供体多核苷酸的那些实施方案中,可以通过非同源末端连接(NHEJ)修复过程来修复由RGN多肽引入的双链断裂。由于NHEJ的易错性质,双链断裂的修复可导致靶序列的修饰。如本文所用,关于核酸分子的“修饰”是指核酸分子的核苷酸序列的变化,其可以是一个或多个核苷酸的缺失、插入或置换或其组合。靶序列的修饰可导致改变的蛋白质产物的表达或编码序列的失活。
在其中存在供体多核苷酸的那些实施方案中,在修复引入的双链断裂的过程中,可以将供体多核苷酸中的供体序列整合到靶核苷酸序列中或与靶核苷酸序列交换,导致引入外源供体序列。因此,供体多核苷酸包含期望被引入到感兴趣的靶序列中的供体序列。在一些实施方案中,供体序列改变了原始靶核苷酸序列,使得新整合的供体序列将不会被RGN识别和切割。供体序列的整合可以通过在供体多核苷酸中包含侧翼序列而增强,所述侧翼序列与靶核苷酸序列侧翼的序列具有实质的序列同一性,从而允许同源介导的修复过程。在其中RGN多肽引入双链交错断裂的那些实施方案中,供体多核苷酸可以包含由相容性突出端侧接的供体序列,从而允许在修复双链断裂过程中通过非同源修复过程将供体序列与包含突出端的切割的靶核苷酸序列直接连接。
在其中所述方法涉及使用作为切口酶(即,仅能够切割双链多核苷酸的单条链)的RGN的那些实施方案中,该方法可以包括引入靶向相同或重叠靶序列并切割多核苷酸的不同链的两种RGN切口酶。例如,可以将仅切割双链多核苷酸的正(+)链的RGN切口酶与仅切割双链多核苷酸的负(-)链的第二RGN切口酶一起引入。
在各种实施方案中,提供了用于结合靶核苷酸序列并检测靶序列的方法,其中所述方法包括将至少一种指导RNA或编码其的多核苷酸以及至少一种RGN多肽或编码其的多核苷酸引入到细胞、细胞器或胚胎中,表达指导RNA和/或RGN多肽(如果引入了编码序列),其中RGN多肽是核酸酶失活的RGN并且还包含可检测标记,并且该方法进一步包括检测可检测标记。可检测标记可以作为融合蛋白(例如荧光蛋白)与RGN融合,或者可以是缀合至或掺入RGN多肽中的可以目测或通过其他方式检测的小分子。
本文还提供了调节靶序列或在靶序列的调节下的感兴趣的基因的表达的方法。所述方法包括将至少一种指导RNA或编码其的多核苷酸和至少一种RGN多肽或编码其的多核苷酸引入细胞、细胞器或胚胎中,表达指导RNA和/或RGN多肽(如果引入了编码序列),其中RGN多肽是核酸酶失活的RGN。在这些实施方案的一些中,核酸酶失活的RGN是包含本文所述的表达调节结构域(即,表观遗传修饰结构域、转录激活结构域或转录抑制结构域)的融合蛋白。
本公开内容还提供了用于结合和/或修饰感兴趣的靶核苷酸序列的方法。所述方法包括将包含至少一种指导RNA或编码其的多核苷酸和包含本发明的RGN和碱基编辑多肽(例如胞苷脱氨酶或腺苷脱氨酶)的至少一种融合多肽或编码所述融合多肽的多核苷酸的系统递送至靶序列或包含靶序列的细胞、细胞器或胚胎。
本领域普通技术人员将理解,本文公开的任何方法都可用于靶向单个靶序列或多个靶序列。因此,所述方法包括将单个RGN多肽与多个不同的指导RNA(其可以靶向单个基因内的多个不同序列和/或多个基因)组合使用。本文还包括其中将多个不同的指导RNA与多个不同的RGN多肽组合引入的方法。这些指导RNA和指导RNA/RGN多肽系统可以靶向单个基因内的多个不同序列和/或多个基因。
在一个方面,本发明提供了包含上述方法和组合物中公开的任何一种或多种成分的试剂盒。在一些实施方案中,试剂盒包括载体系统和使用试剂盒的说明书。在一些实施方案中,载体系统包含(a)可操作地连接至tracr伴侣序列的第一调节元件和一个或多个用于在tracr伴侣序列上游插入指导序列的插入位点,其中当表达时,指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合,其中所述CRISPR复合物包含与(1)与靶序列杂交的指导序列和(2)与tracr序列杂交的tracr配偶序列复合的CRISPR酶;和/或(b)与包含核定位序列的编码所述CRISPR酶的酶编码序列可操作地连接的第二调节元件。元件可以单独地或组合地提供,并且可以提供在任何合适的容器例如小瓶、瓶子或管中。
在一些实施方案中,试剂盒包括一种或多种语言的说明书。在一些实施方案中,试剂盒包含一种或多种试剂,用于在利用本文所述的一种或多种元件的方法中使用。可以在任何合适的容器中提供试剂。例如,试剂盒可以提供一种或多种反应或存储缓冲液。试剂可以以可用于特定测定的形式提供,或者以在使用前需要添加一种或多种其他成分的形式(例如浓缩或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液的pH为约7至约10。
在一些实施方案中,试剂盒包含对应于用于插入载体的指导序列的一种或多种寡核苷酸,以便可操作地连接指导序列和调节元件。在一些实施方案中,试剂盒包含同源重组模板多核苷酸。在一个方面,本发明提供了使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种用途,包括修饰(例如,删除、插入、转运、失活、激活)多种细胞类型中的靶多核苷酸。因此,本发明的CRISPR复合物在例如基因治疗、药物筛选、疾病诊断和预后中具有广泛的应用。示例性的CRISPR复合物包含与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。
VIII.靶多核苷酸
在一个方面,本发明提供了在真核细胞中修饰靶多核苷酸的方法,其可以是体内、离体或体外的。在一些实施方案中,所述方法包括从人或非人动物或植物(包括微藻)中取样细胞或细胞群,并修饰该一个或多个细胞。培养可以在离体的任何阶段进行。所述一个或多个细胞甚至可以被重新引入到非人类动物或植物(包括微藻)中。
利用天然变异性,植物育种者将最有用的基因结合以获得期望的品质,例如产率、品质、均匀性、耐性和针对害虫的抵抗力。这些期望的品质还包括生长、日长偏好、温度要求、花或生殖发育的起始日期、脂肪酸含量、昆虫抗性、抗病性、线虫抗性、真菌抗性、除草剂抗性、对各种环境因素(包括干旱、高温、潮湿、寒冷、风和不利的土壤条件(包括高盐度))的耐受性。这些有用基因的来源包括本地或外来品种、原种品种、野生植物近缘种和诱导的突变,例如,用诱变剂处理植物材料。使用本发明,为植物育种者提供了诱导突变的新工具。因此,本领域技术人员可以分析基因组中有用基因的来源,并且在具有所需特征或性状的品种中,采用本发明以比以前的诱变剂更精确的方式诱导有用基因的产生,从而促进和改善植物育种计划。
RGN系统的靶多核苷酸可以是对真核细胞来说内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节性多核苷酸或垃圾DNA)。不希望受理论的束缚,据信靶序列应与PAM(前间区序列邻近基序)相关;即,由CRISPR复合物识别的短序列。PAM的精确序列和长度要求取决于所使用的CRISPR酶而不同,但PAM通常是与前间区序列(即靶序列)相邻的2-5个碱基对序列。
CRISPR复合物的靶多核苷酸可包括许多与疾病相关的基因和多核苷酸,以及与信号转导生化途径相关的基因和多核苷酸。靶多核苷酸的示例包括与信号转导生化途径相关的序列,例如与信号转导生化途径相关的基因或多核苷酸。靶多核苷酸的示例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于患病组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可以是变得以异常高水平表达的基因;它可以是变得以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。与疾病相关的基因还指具有直接负责疾病的病因(例如因果突变)或与负责疾病的病因(例如因果突变)的一个或多个基因连锁不平衡的一个或多个突变或遗传变异的基因。转录或翻译的产物可能是已知的或未知的,并且还可能处于正常或异常的水平。与疾病相关的基因和多核苷酸的示例可从McKusick-NathansInstitute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.)和National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)获得(可获自万维网)。
尽管CRISPR系统因其相对容易地靶向感兴趣的基因组序列而特别有用,但仍然存在RGN如何解决因果突变的问题。一种方法是在RGN(优选RGN的无活性或切口酶变体)和碱基编辑酶或碱基编辑酶(例如胞苷脱氨酶或腺苷脱氨酶碱基编辑器(美国专利号9,840,699,其通过引用并入本文))的活性结构域之间产生融合蛋白。在一些实施方案中,该方法包括使DNA分子与(a)包含本发明的RGN和碱基编辑多肽(例如脱氨酶)的融合蛋白;和(b)将(a)的融合蛋白靶向至DNA链的靶核苷酸序列的gRNA接触;其中所述DNA分子以有效的量和在适合于核苷酸碱基的脱氨基的条件下与融合蛋白和gRNA接触。在一些实施方案中,靶DNA序列包含与疾病或病症相关的序列,并且其中核苷酸碱基的脱氨基导致与疾病或病症无关的序列。在一些实施方案中,靶DNA序列位于农作物的等位基因中,其中感兴趣的性状的特定等位基因导致农艺价值较低的植物。核苷酸碱基的脱氨基导致改善性状并增加植物的农艺价值的等位基因。
在一些实施方案中,DNA序列包含与疾病或病症相关的T→C或A→G点突变,并且其中突变的C或G碱基的脱氨基导致不与疾病或病症相关的序列。在一些实施方案中,脱氨基纠正序列中与疾病或病症相关的点突变。
在一些实施方案中,与疾病或病症相关的序列编码蛋白质,并且其中脱氨基将终止密码子引入与疾病或病症相关的序列,导致编码的蛋白质的截短。在一些实施方案中,接触是在易患、患有或被诊断出患有疾病或病症的受试者中体内进行的。在一些实施方案中,疾病或病症是与基因组中的点突变或单碱基突变有关的疾病。在一些实施方案中,疾病是遗传性疾病、癌症、代谢性疾病或溶酶体贮积病。
在实施例9和相应的表12中可以找到与某些遗传疾病有因果关系的基因座的其他示例,特别是可以容易地被本发明的RGN或RGN-碱基编辑器融合蛋白靶向的基因座。
Hurler综合征
可以使用依赖于本发明的RGN-碱基编辑器融合蛋白的方法来纠正的遗传性疾病的一个示例是Hurler综合征。Hurler综合征,也称为MPS-1,是α-L-艾杜糖苷酸酶(IDUA)缺乏的结果,导致溶酶体贮积病,其在分子水平上的特征是硫酸皮肤素和硫酸乙酰肝素在溶酶体中的积累。该疾病通常是由编码α-L-艾杜糖苷酸酶的IDUA基因的突变引起的遗传性遗传病。常见的IDUA突变是W402X和Q70X,均是无义突变,导致翻译的提前终止。通过精确的基因组编辑(PGE)方法很好地解决此类突变,因为单个核苷酸的逆转(例如通过碱基编辑方法)将恢复野生型编码序列,并导致受遗传基因座的内源性调节机制控制的蛋白质表达。另外,由于已知杂合子是无症状的,因此靶向这些突变之一的PGE疗法将对大部分患有这种疾病的患者有用,因为仅需要纠正突变的等位基因中的一个(Bunge等人,(1994)Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。
Hurler综合征的当前治疗方法包括酶替代疗法和骨髓移植(Vellodi等人,(1997)Arch.Dis.Child.76(2):92-99;Peters等人,(1998)Blood 91(7):2601-2608,通过引用并入本文)。尽管酶替代疗法对Hurler综合征患者的生存和生活质量产生了显著影响,但这种方法需要每周进行昂贵且费时的输液。另外的方法包括递送在表达载体上的IDUA基因或将该基因插入高表达的基因座,例如血清白蛋白的基因座(美国专利号9,956,247,通过引用并入本文)。但是,这些方法不能将原始IDUA基因座恢复为正确的编码序列。基因组编辑策略将具有许多优势,最显著的是,基因表达的调节将受到健康个体中存在的天然机制的控制。另外,使用碱基编辑并不一定会导致双链DNA断裂,这可能会导致大量染色体重排、细胞死亡或通过肿瘤抑制机制的破坏导致致肿瘤性。实施例10中提供了纠正该疾病的因果突变的方法的可行描述。所述方法是针对使用本发明的RGN-碱基编辑器融合蛋白靶向和纠正人类基因组中的某些引起疾病的突变的一般策略的示例。应该理解的是,也可以采用类似的方法来靶向诸如表12中所述那些疾病。还将认识到,也可以使用本发明的RGN来部署靶向其他物种特别是普通家庭宠物或家畜中的致病突变的类似方法。常见的家庭宠物和家畜包括狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、鱼(包括鲑鱼)和虾。
弗里德赖希共济失调
本发明的RGN在因果突变更复杂时也可用于人类治疗方法。例如,一些疾病例如弗里德赖希共济失调和亨廷顿病是基因的特定区域处的三核苷酸基序的重复次数显著增加的结果,这影响表达的蛋白质发挥功能或被表达的能力。弗里德赖希共济失调(FRDA)是一种常染色体隐性疾病,其导致脊髓中的神经组织的进行性退化。线粒体中的共济蛋白(FXN)的蛋白水平降低导致细胞水平上的氧化损伤和铁缺乏。减少的FXN表达与体细胞和种系FXN基因的内含子1内的GAA三联体扩增有关。在FRDA患者中,GAA重复序列通常由超过70个有时甚至超过1000个(最常见的是600-900个)三联体组成,而未受影响的个体具有约40个或更少的重复序列(Pandolfo等人,(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人,(1996)Science 271:1423-1427;Pandolfo(2002)Adv.Exp.Med.Biol.516:99-118;全部通过引用并入本文)。
导致弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内的确定的遗传基因座中,称为FRDA不稳定性区域。RNA-指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。这种方法需要1)可被编程以靶向人类基因组中的等位基因的RGN和指导RNA序列;和2)用于RGN和指导序列的递送方法。许多用于基因组编辑的核酸酶(例如通常使用的来自化脓性链球菌(S.pyogenes)的Cas9核酸酶(SpCas9))太大而无法包装到腺相关病毒(AAV)载体中,尤其是考虑到除了功能表达盒所需的其他遗传元件外的SpCas9基因和指导RNA的长度时。这使得使用SpCas9的方法更加困难。
本发明的紧凑的RNA-指导的核酸酶(特别是APG07433.1和APG08290.1)独特地非常适合于FRDA不稳定性区域的切除。每个RGN具有在FRDA不稳定性区域附近的PAM要求。另外,这些RGN中的每一个都可以与指导RNA一起包装到AAV载体中。包装两个指导RNA可能需要第二个载体,但是这种方法与较大的核酸酶(例如SpCas9)所需的相比仍然是有利的,后者可能需要将蛋白质序列拆分在两个载体之间。在实施例11中提供了纠正该疾病的因果突变的方法的可行描述。所述方法包括使用本发明的RGN的策略,其中去除了基因组不稳定性区域。这种策略适用于具有相似遗传基础的其他疾病和病症,例如亨廷顿病。使用本发明的RGN的类似策略也可适用于具有农业或经济重要性的非人类动物(包括狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、鱼包括鲑鱼和虾)中的类似疾病和病症。
血红蛋白病
本发明的RGN也可以引入可以导致有益作用的破坏性突变。编码血红蛋白的基因(尤其是β球蛋白链(HBB基因))中的遗传缺陷可能导致许多被称为血红蛋白病的疾病,包括镰状细胞性贫血和地中海贫血。
在成年人中,血红蛋白是异源四聚体,其包含两条α(alpha)样球蛋白链和两条β(beta)样球蛋白链和4个血红素基团。在成人中,α2β2四聚体被称为血红蛋白A(HbA)或成人血红蛋白。通常,α和β球蛋白链以约1:1的比例合成,并且在血红蛋白和红细胞(RBC)稳定性方面,该比例似乎至关重要。在发育中的胎儿中,产生了不同形式的血红蛋白,胎儿血红蛋白(HbF),其对氧的结合亲和力比血红蛋白A高,使得氧可以通过母亲的血流递送到婴儿的系统中。胎儿血红蛋白还包含两条α球蛋白链,但代替成人的β球蛋白链,它具有两条胎儿γ(gamma)球蛋白链(即,胎儿血红蛋白为α2γ2)。从产生γ-球蛋白到β-球蛋白的转换的调节非常复杂,并且主要涉及γ球蛋白转录的下调以及β球蛋白转录的同时上调。在妊娠约30周时,胎儿中γ球蛋白的合成开始下降,而β球蛋白的产量增加。约10个月大时,新生儿的血红蛋白几乎全部为α2β2,尽管一些HbF持续到成年(约占总血红蛋白的1-3%)。在大多数患有血红蛋白病的患者中,仍然存在编码γ球蛋白的基因,但是由于如上所述在分娩附近发生正常的基因抑制,因此表达相对较低。
镰状细胞病是由β球蛋白基因(HBB)中的V6E突变(DNA水平上的GAG到GTG)引起的,其中产生的血红蛋白被称为“血红蛋白S”或“HbS”。在较低的氧气条件下,HbS分子聚集并形成纤维状沉淀。这些聚集体引起RBC的异常或“镰状化”,从而导致细胞柔韧性的丧失。镰状红细胞不再能够挤入毛细管床,并可能导致镰状细胞患者的血管闭塞性危机。另外,镰状RBC比正常RBC更脆弱,并且倾向于溶血,最终导致患者贫血。
镰状细胞患者的治疗和管理是终生主题,涉及抗生素治疗、疼痛管理和急性发作期间的输血。一种方法是使用羟基脲,其部分通过增加γ球蛋白的产生而发挥其作用。慢性羟基脲疗法的长期副作用仍然未知,但是,治疗产生不想要的副作用,并且可在患者间具有可变的功效。尽管镰状细胞疗法的功效有所提高,但患者的预期寿命仍仅在50岁中期至晚期,并且该疾病的相关发病率对患者的生活质量产生深远的影响。
地中海贫血(α地中海贫血和β地中海贫血)也是与血红蛋白有关的疾病,并且通常涉及球蛋白链的降低的表达。这可以通过基因的调节区中的突变或球蛋白编码序列中的导致功能性球蛋白的降低的表达或降低的水平而发生。地中海贫血的治疗通常涉及输血和铁螯合疗法。如果可以鉴别合适的供体,那么骨髓移植也可以用于治疗患有重度地中海贫血的人,但是这种方法可能会有很大的风险。
已建议用于治疗SCD和β地中海贫血的一种方法是增加γ球蛋白的表达,以使HbF在功能上替代异常的成人血红蛋白。如上所述,认为使用羟基脲治疗SCD患者是成功的,部分是因为其对增加γ球蛋白表达的作用(DeSimone(1982)Proc Nat'l Acad Sci USA79(14):4428-31;Ley,等人,(1982)N.Engl.J.Medicine,307:1469-1475;Ley,等人,(1983)Blood 62:370-380;Constantoulakis等人,(1988)Blood 72(6):1961-1967,全部通过引用并入本文)。增加HbF的表达涉及鉴定其产物在调节γ球蛋白表达中起作用的基因。一种这样的基因是BCL11A。BCL11A编码在成体红系前体细胞中表达的锌指蛋白,并且其表达的下调导致γ球蛋白表达的增加(Sankaran等人,(2008)Science 322:1839,通过引用并入本文)。已经提出了针对BCL11A基因的抑制性RNA的使用(例如,美国专利公开2011/0182867,通过引用并入本文),但是该技术具有若干潜在的缺点,包括可能无法实现完全敲低,此类RNA的递送可能是有问题的,并且RNA必须连续存在,从而需要终身的多次治疗。
本发明的RGN可用于靶向BCL11A增强子区域以破坏BCL11A的表达,从而增加γ球蛋白的表达。这种靶向破坏可通过非同源末端连接(NHEJ)来实现,由此本发明的RGN靶向BCL11A增强子区域内的特定序列,产生双链断裂,并且细胞的机构修复该断裂,通常同时引入有害的突变。与针对其他疾病靶标所描述的类似,本发明的RGN由于其相对小的尺寸而具有优于其他已知的RGN的优点,这使得能够将用于RGN及其指导RNA的表达盒包装到单个AAV载体中以用于体内递送。实施例12中提供了对该方法的可行描述。使用本发明的RGN的类似策略也可适用于人类和具有农业或经济重要性的非人类动物中的相似疾病和病症。
IX.包含多核苷酸遗传修饰的细胞
本文提供了包含感兴趣的靶序列的细胞和生物体,所述靶序列已使用本文所述的RGN、crRNA和/或tracrRNA介导的过程进行了修饰。在这些实施方案的一些中,RGN包含SEQID NO:1、11、19、27、36、45或54的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包含CRISPR重复序列,其包含SEQ ID NO:2、12、20、28、37、46或55的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包含tracrRNA,其包含SEQ ID NO:3、13、21、29、38、47或56的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。
修饰的细胞可以是真核的(例如,哺乳动物、植物、昆虫细胞)或原核的。还提供了包含至少一个核苷酸序列的细胞器和胚胎,所述核苷酸序列已通过利用如本文所述的RGN、crRNA和/或tracrRNA的方法进行了修饰。经遗传修饰的细胞、生物体、细胞器和胚胎对于修饰的核苷酸序列而言可以是杂合的或纯合的。
细胞、生物体、细胞器或胚胎的染色体修饰可导致改变的表达(上调或下调)、失活或改变的蛋白质产物或整合的序列的表达。在其中染色体修饰导致基因失活或无功能蛋白产物表达的那些情况下,遗传修饰的细胞、生物体、细胞器或胚胎被称为“敲除”。敲除表型可以是缺失突变(即,至少一个核苷酸的缺失)、插入突变(即,至少一个核苷酸的插入)或无义突变(即,至少一个核苷酸的置换使得引入终止密码子)的结果。
可替代地,细胞、生物体、细胞器或胚胎的染色体修饰可产生“敲入”,这是由编码蛋白质的核苷酸序列的染色体整合引起的。在这些实施方案的一些中,将编码序列整合到染色体中,使得编码野生型蛋白质的染色体序列失活,但是表达外源导入的蛋白质。
在其他实施方案中,染色体修饰导致变体蛋白质产物的产生。表达的变体蛋白质产物可具有至少一个氨基酸置换和/或至少一个氨基酸的添加或缺失。当与野生型蛋白质相比时,由改变的染色体序列编码的变体蛋白质产物可以表现出修饰的特征或活性,包括但不限于改变的酶活性或底物特异性。
在其他实施方案中,染色体修饰可以导致蛋白质的改变的表达模式。作为非限制性示例,控制蛋白质产物表达的调节区中的染色体改变可导致蛋白质产物的过表达或下调或改变的组织或时间表达模式。
本文所用的冠词“一个”和“一种”是指该冠词的语法对象的一个/一种或多于一个/一种(即,至少一个/一种)。举例来说,“多肽”是指一个或多个/一种或多种多肽。
说明书中提到的所有出版物和专利申请均指示与本公开内容有关的本领域的技术人员的水平。所有出版物和专利申请都以相同的程度通过引用并入本文,就好像每个单独的出版物或专利申请都被具体地和单独地指示通过引用并入一样。
尽管出于清楚理解的目的已经通过说明和示例的方式详细地描述了前述发明,但是明显的是,可以在所附实施方案的范围内实施某些改变和修改。
非限制性实施方案包括:
1.一种核酸分子,其包含编码RNA-指导的核酸酶(RGN)多肽的多核苷酸,其中所述多核苷酸包含编码RGN多肽的核苷酸序列,所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;
其中当所述RGN多肽与能够与所述靶DNA序列杂交的指导RNA(gRNA)结合时,所述RGN多肽以RNA-指导的序列特异性方式结合所述靶DNA序列,和
其中所述编码RGN多肽的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。
2.实施方案1所述的核酸分子,其中所述RGN多肽能够在结合后切割所述靶DNA序列。
3.实施方案2所述的核酸分子,其中通过所述RGN多肽的切割产生双链断裂。
4.实施方案2所述的核酸分子,其中通过所述RGN多肽的切割产生单链断裂。
5.实施方案1-4中任一项所述的核酸分子,其中所述RGN多肽可操作地融合至碱基编辑多肽。
6.实施方案1-5中任一项所述的核酸分子,其中所述RGN多肽包含一个或多个核定位信号。
7.实施方案1-6中任一项所述的核酸分子,其中所述RGN多肽是密码子优化的以在真核细胞中表达。
8.实施方案1-7中任一项所述的核酸分子,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。
9.一种载体,其包含实施方案1-8中任一项所述的核酸分子。
10.实施方案9所述的载体,其进一步包含至少一个核苷酸序列,所述核苷酸序列编码能够与所述靶DNA序列杂交的所述gRNA。
11.实施方案10所述的载体,其中所述gRNA是单指导RNA。
12.实施方案10所述的载体,其中所述gRNA是双指导RNA。
13.实施方案10-12中任一项所述的载体,其中所述指导RNA包含CRISPR RNA,所述CRISPR RNA包含与SEQ ID NO:2、12、20、28、37、46、或55具有至少95%序列同一性的CRISPR重复序列。
14.实施方案10-13中任一项所述的载体,其中所述指导RNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的tracrRNA。
15.一种细胞,其包含实施方案1-8中任一项所述的核酸分子或实施方案9-14中任一项所述的载体。
16.一种用于制备RGN多肽的方法,所述方法包括在其中表达所述RGN多肽的条件下培养实施方案15所述的细胞。
17.一种用于制备RGN多肽的方法,所述方法包括将异源核酸分子引入细胞,所述异源核酸分子包含编码RNA-指导的核酸酶(RGN)多肽的核苷酸序列,所述RNA-指导的核酸酶(RGN)多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;
其中当所述RGN多肽与能够与所述靶DNA序列杂交的指导RNA(gRNA)结合时,所述RGN多肽以RNA-指导的序列特异性方式结合所述靶DNA序列;
以及在其中表达所述RGN多肽的条件下培养所述细胞。
18.实施方案16或17所述的方法,其进一步包括纯化所述RGN多肽。
19.实施方案16或17所述的方法,其中所述细胞进一步表达一种或多种与所述RGN多肽结合以形成RGN核糖核蛋白复合物的指导RNA。
20.实施方案19所述的方法,其进一步包括纯化所述RGN核糖核蛋白复合物。
21.一种核酸分子,其包含编码CRISPR RNA(crRNA)的多核苷酸,其中所述crRNA包含间隔子序列和CRISPR重复序列,其中所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列;
其中指导RNA包含:
a)所述crRNA;和
b)与所述crRNA的所述CRISPR重复序列杂交的反式激活CRISPR RNA(tracrRNA);
当所述指导RNA与RNA-指导的核酸酶(RGN)多肽结合时,能够通过所述crRNA的间隔子序列以序列特异性方式与靶DNA序列杂交,并且
其中所述编码crRNA的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。
22.一种载体,其包含实施方案21所述的核酸分子。
23.实施方案22所述的载体,其中所述载体进一步包含编码所述tracrRNA的多核苷酸。
24.实施方案23所述的载体,其中所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。
25.实施方案23或24所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至同一启动子并被编码为单个指导RNA。
26.实施方案23或24所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至分开的启动子。
27.实施方案22-26中任一项所述的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列。
28.一种核酸分子,其包含编码反式激活CRISPR RNA(tracrRNA)的多核苷酸,所述多核苷酸包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列;
其中指导RNA包含:
a)所述tracrRNA;和
b)包含间隔子序列和CRISPR重复序列的crRNA,其中所述tracrRNA与所述crRNA的所述CRISPR重复序列杂交;
当所述指导RNA与RNA-指导的核酸酶(RGN)多肽结合时,能够通过所述crRNA的间隔子序列以序列特异性方式与靶DNA序列杂交,并且
其中所述编码tracrRNA的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。
29.一种载体,其包含实施方案28所述的核酸分子。
30.实施方案29所述的载体,其中所述载体进一步包含编码所述crRNA的多核苷酸。
31.实施方案30所述的载体,其中所述crRNA的CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。
32.实施方案30或31所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至同一启动子并被编码为单个指导RNA。
33.实施方案30或31所述的载体,其中所述编码所述crRNA的多核苷酸和所述编码所述tracrRNA的多核苷酸可操作地连接至分开的启动子。
34.实施方案29-33中任一项所述的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列。
35.一种用于结合靶DNA序列的系统,所述系统包括:
a)能够与所述靶DNA序列杂交的一种或多种指导RNA或编码所述一种或多种指导RNA(gRNA)的一种或多种核苷酸序列;和
b)包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列的RNA-指导的核酸酶(RGN)多肽或编码所述RGN多肽的核苷酸序列;
其中编码所述一种或多种指导RNA的所述核苷酸序列和编码所述RGN多肽的所述核苷酸序列各自可操作地连接至与所述核苷酸序列异源的启动子;
其中所述一种或多种指导RNA与所述靶DNA序列杂交,和
其中所述一种或多种指导RNA与所述RGN多肽形成复合物,从而引导所述RGN多肽与所述靶DNA序列结合。
36.实施方案35所述的系统,其中所述gRNA是单指导RNA(sgRNA)。
37.实施方案35所述的系统,其中所述gRNA是双指导RNA。
38.实施方案35-37中任一项所述的系统,其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。
39.实施方案35-38中任一项所述的系统,其中所述gRNA包含tracrRNA,所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。
40.实施方案35-39中任一项所述的系统,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。
41.实施方案35-40中任一项所述的系统,其中所述靶DNA序列在细胞内。
42.实施方案41所述的系统,其中所述细胞是真核细胞。
43.实施方案42所述的系统,其中所述真核细胞是植物细胞。
44.实施方案42所述的系统,其中所述真核细胞是哺乳动物细胞。
45.实施方案42所述的系统,其中所述真核细胞是昆虫细胞。
46.实施方案41所述的系统,其中所述细胞是原核细胞。
47.实施方案35-46中任一项所述的系统,其中当转录时,所述一种或多种指导RNA与所述靶DNA序列杂交,并且所述指导RNA与所述RGN多肽形成复合物,其导致所述靶DNA序列的切割。
48.实施方案47所述的系统,其中所述切割产生双链断裂。
49.实施方案47所述的系统,其中所述RGN多肽的切割产生单链断裂。
50.实施方案35-49中任一项所述的系统,其中所述RGN多肽可操作地连接至碱基编辑多肽。
51.实施方案35-50中任一项所述的系统,其中所述RGN多肽包含一个或多个核定位信号。
52.实施方案35-51中任一项所述的系统,其中所述RGN多肽是密码子优化的以在真核细胞中表达。
53.实施方案35-52中任一项所述的系统,其中编码一种或多种指导RNA的核苷酸序列和编码RGN多肽的核苷酸序列位于一个载体上。
54.实施方案35-53中任一项所述的系统,其中所述系统进一步包含一种或多种供体多核苷酸或编码所述一种或多种供体多核苷酸的一种或多种核苷酸序列。
55.一种用于结合靶DNA序列的方法,所述方法包括将根据实施方案35-54中任一项所述的系统递送至所述靶DNA序列或包含所述靶DNA序列的细胞。
56.实施方案55所述的方法,其中所述RGN多肽或所述指导RNA进一步包含可检测标记,从而允许检测所述靶DNA序列。
57.实施方案55所述的方法,其中所述指导RNA或所述RGN多肽进一步包含表达调节子,从而调节所述靶DNA序列或在所述靶DNA序列的转录控制下的基因的表达。
58.一种用于切割或修饰靶DNA序列的方法,所述方法包括将根据实施方案35-54中任一项所述的系统递送至所述靶DNA序列或包含所述靶DNA序列的细胞。
59.实施方案58所述的方法,其中所述修饰的靶DNA序列包括异源DNA在所述靶DNA序列中的插入。
60.实施方案58所述的方法,其中所述修饰的靶DNA序列包括至少一个核苷酸从所述靶DNA序列的缺失。
61.实施方案58所述的方法,其中所述修饰的靶DNA序列包括所述靶DNA序列中至少一个核苷酸的突变。
62.一种用于结合靶DNA序列的方法,所述方法包括:
a)通过结合以下在体外组装RNA-指导的核酸酶(RGN)核糖核苷酸复合物:
i)一种或多种指导RNA,其能够与靶DNA序列杂交;和
ii)RGN多肽,其包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;
在适合于形成所述RGN核糖核苷酸复合物的条件下;和
b)使所述靶DNA序列或包含所述靶DNA序列的细胞与体外组装的RGN核糖核苷酸复合物接触;
其中所述一种或多种指导RNA与所述靶DNA序列杂交,从而引导所述RGN多肽与所述靶DNA序列结合。
63.实施方案62所述的方法,其中所述RGN多肽或所述指导RNA进一步包含可检测标记,从而允许检测所述靶DNA序列。
64.实施方案62所述的方法,其中所述指导RNA或所述RGN多肽进一步包含表达调节子,从而允许调节所述靶DNA序列的表达。
65.一种用于切割和/或修饰靶DNA序列的方法,所述方法包括使DNA分子与以下接触:
a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;和
b)一种或多种指导RNA,其能够将(a)的RGN靶向至所述靶DNA序列;
其中所述一种或多种指导RNA与所述靶DNA序列杂交,从而引导所述RGN多肽与所述靶DNA序列结合并发生所述靶DNA序列的切割和/或修饰。
66.实施方案65所述的方法,其中所述修饰的靶DNA序列包括异源DNA在所述靶DNA序列中的插入。
67.实施方案65所述的方法,其中所述修饰的靶DNA序列包括至少一个核苷酸从所述靶DNA序列的缺失。
68.实施方案65所述的方法,其中所述修饰的靶DNA序列包括所述靶DNA序列中至少一个核苷酸的突变。
69.实施方案62-68中任一项所述的方法,其中所述gRNA是单指导RNA(sgRNA)。
70.实施方案62-68中任一项所述的方法,其中所述gRNA是双指导RNA。
71.实施方案62-70中任一项所述的方法,其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列。
72.实施方案62-71中任一项所述的方法,其中所述gRNA包含tracrRNA,所述tracrRNA包含与SEQ ID NO:3、13、21、29、38、47或56具有至少95%序列同一性的核苷酸序列。
73.实施方案62-72中任一项所述的方法,其中所述靶DNA序列位于与前间区序列邻近基序(PAM)相邻处。
74.实施方案55-73中任一项所述的方法,其中所述靶DNA序列在细胞内。
75.实施方案74所述的方法,其中所述细胞是真核细胞。
76.实施方案75所述的方法,其中所述真核细胞是植物细胞。
77.实施方案75所述的方法,其中所述真核细胞是哺乳动物细胞。
78.实施方案75所述的方法,其中所述真核细胞是昆虫细胞。
79.实施方案74所述的方法,其中所述细胞是原核细胞。
80.实施方案74-79中任一项所述的方法,其进一步包括在其中表达所述RGN多肽并切割靶DNA序列以产生修饰的DNA序列的条件下培养所述细胞;并选择包含所述修饰的DNA序列的细胞。
81.一种细胞,其包含根据实施方案80所述的方法的修饰的靶DNA序列。
82.实施方案81所述的细胞,其中所述细胞是真核细胞。
83.实施方案82所述的细胞,其中所述真核细胞是植物细胞。
84.一种植物,其包含实施方案83所述的细胞。
85.一种种子,其包含实施方案83所述的细胞。
86.实施方案82所述的细胞,其中所述真核细胞是哺乳动物细胞。
87.实施方案82所述的细胞,其中所述真核细胞是昆虫细胞。
88.实施方案81所述的细胞,其中所述细胞是原核细胞。
89.一种用于产生对遗传性遗传病的因果突变进行校正的遗传修饰的细胞的方法,所述方法包括向所述细胞引入:
a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和
b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达
由此,RGN和gRNA靶向因果突变的基因组位置并修饰基因组序列以去除因果突变。
90.实施方案89所述的方法,其中所述RGN与具有碱基编辑活性的多肽融合。
91.实施方案90所述的方法,其中所述具有碱基编辑活性的多肽是胞苷脱氨酶或腺苷脱氨酶。
92.实施方案89所述的方法,其中所述细胞是动物细胞。
93.实施方案89所述的方法,其中所述细胞是哺乳动物细胞。
94.实施方案92所述的方法,其中所述细胞来源于狗、猫、小鼠、大鼠、兔、马、牛、猪或人。
95.实施方案92所述的方法,其中所述遗传性遗传病为表12中所列的疾病。
96.实施方案92所述的方法,其中所述遗传性遗传病为Hurler综合征。
97.实施方案96所述的方法,其中所述gRNA还包含靶向SEQ ID NO:453、454或455的间隔子序列。
98.一种用于产生在致病基因组不稳定性区域中缺失的遗传修饰的细胞的方法,所述方法包括向所述细胞引入:
a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和
b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,并且进一步地,其中所述gRNA包含靶向基因组不稳定性区域的5’侧翼的间隔子序列;和
c)第二指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,并且进一步地,其中所述第二gRNA包含靶向基因组不稳定性区域3’侧翼的间隔子序列;
从而RGN和两个gRNA靶向基因组不稳定性区域,并且去除至少部分基因组不稳定性区域。
99.实施方案98所述的方法,其中所述细胞是动物细胞。
100.实施方案98所述的方法,其中所述细胞是哺乳动物细胞。
101.实施方案100所述的方法,其中所述细胞来源于狗、猫、小鼠、大鼠、兔、马、牛、猪或人。
102.实施方案99所述的方法,其中所述遗传性遗传病是弗里德赖希共济失调或亨廷顿病。
103.实施方案102所述的方法,其中所述第一gRNA还包含靶向SEQ ID NO:468、469或470的间隔子序列。
104.实施方案103所述的方法,其中所述第二gRNA还包含靶向SEQ ID NO:471的间隔子序列。
105.一种用于产生具有降低的BCL11A mRNA和蛋白质表达的遗传修饰的哺乳动物造血祖细胞的方法,所述方法包括向分离的人造血祖细胞引入:
a)RNA-指导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列,或编码所述RGN多肽的多核苷酸,其中所述编码RGN多肽的多核苷酸可操作地连接至启动子使得所述RGN多肽能够在细胞中表达;和
b)指导RNA(gRNA),其中所述gRNA包含CRISPR重复序列,所述CRISPR重复序列包含与SEQ ID NO:2、12、20、28、37、46或55具有至少95%序列同一性的核苷酸序列,或编码所述gRNA的多核苷酸,其中所述编码gRNA的多核苷酸可操作地连接至启动子使得所述gRNA能够在细胞中表达,
由此,RGN和gRNA在细胞中表达并在BCL11A增强子区域切割,导致人造血祖细胞的遗传修饰并降低BCL11A的mRNA和/或蛋白质表达。
106.实施方案105所述的方法,其中所述gRNA还包含靶向SEQ ID NO:473、474、475、476、477或478的间隔子序列。
107.一种用于结合靶DNA序列的系统,所述系统包括:
a)一种或多种指导RNA,其能够与所述靶DNA序列杂交,或编码所述一种或多种指导RNA(gRNA)的一种或多种核苷酸序列;和
b)RNA-指导的核酸酶(RGN)多肽,其包含与SEQ ID NO:1、11、19、27、36、45或54具有至少95%序列同一性的氨基酸序列;
其中所述一种或多种指导RNA与所述靶DNA序列杂交,和
其中所述一种或多种指导RNA与所述RGN多肽形成复合物,从而引导所述RGN多肽与所述靶DNA序列结合。
108.实施方案107所述的系统,其中所述RGN多肽是核酸酶失活的或起切口酶的作用。
109.实施方案107或108所述的系统,其中所述RGN多肽可操作地融合至碱基编辑多肽。
110.实施方案109所述的系统,其中所述碱基编辑多肽是脱氨酶。
111.实施方案110所述的系统,其中所述脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
提供以下实施例以举例说明而不是限制。
实施例
实验
实施例1.RNA-指导的核酸酶的鉴定
鉴定了七种不同的CRISPR相关RNA-指导的核酸酶(RGN),并在下表1中进行了描述。表1提供了每种RGN的名称、其氨基酸序列、其衍生来源以及经加工的crRNA和tracrRNA序列。表1还提供了通用的单指导RNA(sgRNA)序列,其中poly-N表示确定sgRNA核酸靶序列的间隔子序列的位置。RGN系统APG系统APG05083.1、APG07433.1、APG08290.1和APG08290.1在tracrRNA的发夹茎碱基中具有保守序列UNANNG(SEQ ID NO:68)。对于AP05459.1系统,在相同位置的序列为UNANNU(SEQ ID NO:557)。对于APG04583.1和APG01688.1系统,该序列为UNANNA(SEQ ID NO:558)。
表1:SEQ ID和CRISPR相关的系统的总结
实施例2:指导RNA鉴定和sgRNA构建
将天然表达所研究的RNA-指导的核酸酶系统的细菌的培养物培养至对数中期(OD600为~0.600)、沉淀并快速冷冻。使用mirVANA miRNA分离试剂盒(LifeTechnologies,Carlsbad,CA)从沉淀物中分离RNA,并使用NEBNext小RNA文库制备试剂盒(NEB,Beverly,MA)从分离的RNA制备测序文库。将文库制备物在6%聚丙烯酰胺凝胶上分离成对应于18-65nt和90-200nt RNA种类的2个尺寸的级分以分别检测crRNA和tracrRNA。通过服务提供商(MoGene,St.Louis,MO)在Next Seq 500(高输出试剂盒)上进行深度测序(较小级分的40bp配对末端,和较大级分的80bp配对末端)。使用Cutadapt对读数进行质量修整,并使用Bowtie2将其映射到参考基因组。以python编写自定义RNAseq流水线以检测crRNA和tracrRNA转录物。通过天然重复间隔区阵列的序列覆盖率确定经加工的crRNA边界。使用允许的BLASTn参数鉴定tracrRNA的抗重复序列部分。RNA测序深度通过鉴定含有抗重复序列的转录物确认经加工的tracrRNA的边界。通过使用RNA折叠软件NUPACK进行二级结构预测来进行RNA的手动管理。sgRNA盒是通过DNA合成制备的,并一般如下设计(5’->3’):20-30bp间隔子序列-crRNA的经加工的重复序列部分-4bp非互补接头(AAAG;SEQ IDNO:63)-经加工的tracrRNA。还可以使用其他的4bp非互补接头,例如GAAA(SEQ ID NO:64)或ACUU(SEQ ID NO:65)。在一些情况下,可以使用6bp核苷酸接头,例如CAAAGG(SEQ ID NO:66)。对于体外测定,通过用GeneArtTM Precision gRNA合成试剂盒(ThermoFisher)体外转录sgRNA盒来合成sgRNA。鉴定了每种RGN多肽的经加工的crRNA和tracrRNA序列,并列于表1中。关于针对PAM文库1和2构建的sgRNA,参见下文。
实施例3:每个RGN的PAM要求的确定
每个RGN的PAM要求使用基本上从Kleinstiver等人,(2015)Nature 523:481-485和Zetsche等人,(2015)Cell 163:759-771改编的PAM消耗测定来确定。简而言之,在pUC18主链(ampR)中生成两个质粒文库(L1和L2),每个质粒文库均含有侧翼为8个随机核苷酸(即PAM区)的独特的30bp前间区(靶)序列。表2列出了每个RGN的文库1和文库2的靶序列和侧翼PAM区。
将文库分别电穿孔到大肠杆菌BL21(DE3)细胞中,该细胞带有pRSF-1b表达载体,该载体包含本发明的RGN(针对大肠杆菌密码子优化的)以及同源sgRNA,该同源sgRNA包含对应于L1或L2中的前间区的间隔子序列。足够的文库质粒用于转化反应中,以获得>10^6cfu。pRSF-1b主链中的RGN和sgRNA都在T7启动子的控制下。允许转化反应物恢复1小时,然后将其稀释到含有羧苄青霉素和卡那霉素的LB培养基中并生长过夜。第二天,将混合物稀释到自诱导的Overnight Express
表2:PAM确定
实施例4:切割确定
使用RNP(核糖核蛋白)从体外切割反应确定切割位点。构建含有与His6或His10标签融合的RGN的表达质粒,并将其转化到大肠杆菌的BL21(DE3)菌株中。表达使用自诱导培养基或使用IPTG诱导进行。裂解和澄清后,通过固定的金属亲和色谱法纯化蛋白质。
核糖核酸复合物(包含核酸酶和sgRNA或crRNA和tracrRNA双链体)是通过在室温下在缓冲溶液中温育核酸酶和RNA 20分钟而形成的。将复合物转移至含有消化缓冲液和PCR扩增的靶标(称为“序列1”)的管中。序列1包含在其3’末端直接连接到每个RGN的相应PAM序列的核苷酸序列(SEQ ID NO:73)。将每个作为核糖核蛋白复合物的RGN与其各自的靶多核苷酸在25℃(APG04583.1)或37℃(所有其他)温育30分钟或60分钟(仅APG05459.1和APG01688.1)。将消化反应热灭活并在琼脂糖凝胶上跑胶。从凝胶上切下切割产物带,并使用Sanger测序法测序。通过将测序结果与PCR产物的预期序列进行比对来鉴定切割位点。结果示于表3中。如表3所示,RGN APG007433.1还可以产生具有不同靶序列的平末端切口。
通过以下针对核酸酶APG07433.1的方法确定序列2(SEQ ID NO:559,在其3’末端可操作地融合到RGN APG0733.1的PAM序列)的切割位点。消化后,将凝胶纯化的DNA产物用DNA末端修复试剂盒(Thermo Scientific K0771)处理,连接到线性平末端载体中,并将所得环状DNA转化到大肠杆菌感受态细胞中。带有5’突出端的交错切口将导致从两个切割产物中检测出克隆中的重叠序列。3’突出端将导致序列缺失,而平末端切口将导致检测到没有重叠的所有原始序列。此实验还验证了上述方法对序列1的发现,即大多数克隆被检测为源自具有5’重叠的切口,因此,不预期平末端切口的发现是利用的这种方法的假象。
表3:RGN切割位点
NTS=非靶标链;TS=靶标链
实施例5:错配敏感度测定
使用紧接在对于评估的核酸酶合适的PAM基序的5’的靶序列(SEQ ID NO:73)设计并获得质粒。还使用在所示位置改变的序列(表4)产生了单错配序列。形成纯化的核酸酶(APG08290.1或APG05459.1)和指导RNA的RNP复合物,并与来自设计的质粒的PCR扩增的线性DNA一起温育。在温育指定时间并灭活核酸酶后,通过琼脂糖凝胶电泳分析样品,以确定剩余的线性PCR产物的分数。对于每个位置的错配,表5显示了切割的完整带的百分比。
表4:针对APG08290.1和APG05459.1的错配敏感度测定所测试的序列
表5:RGN APG08290.1和RGN APG05459.1的错配敏感度
对RGN APG07433.1进行了类似的错配敏感度实验。该实验与上述实验相似,不同之处在于将替代碱基引入了指导RNA,而不是靶DNA。用于错配sgRNA合成的DNA序列示于表6。错配敏感度测定的结果示于表7。
表6:针对RGN APG07433.1的错配敏感度测定所测试的序列
表7:RGN APG07433.1的错配敏感度
RGN APG07433.1和APG08290.1对从PAM的5’的1-10位置中的错配表现出显著的敏感性,但有一些例外(表5和表7)。RGN APG05459.1对该区域中的错配也很敏感,但其切割dsDNA的能力也因远离PAM位点的错配而严重丧失(表5)。对是否发生切割有重要影响的位点的总数在间隔子序列中为至少15个位置。与其他基因组编辑工具(例如来自化脓性链球菌的经过充分研究的Cas9核酸酶,其通常对10-13个碱基对之间敏感(Hsu等人,NatBiotechnol(2013)31(9):827-832))相比,这是有利的。此外,许多废除RGN APG05459.1介导的切割的关键位点与PAM序列相距很远,特别是在13-20bp的范围内,其中许多其他核酸酶对错配显示极低(如果有的话)的敏感度。该特性在靶向与感兴趣的生物体中的其他位点具有紧密序列相似性的遗传基因座中可能格外有用。
实施例6:哺乳动物细胞中的基因编辑活性的证明
产生了RGN表达盒并将其引入载体用于哺乳动物表达。对每个RGN进行密码子优化以用于人类表达(SEQ ID NO:127-133),并在5’末端与SV40核定位序列(NLS;SEQ ID NO:134)和3xFLAG标签(SEQ ID NO:135)可操作地融合,并在3’末端与核质蛋白NLS序列(SEQID NO:136)可操作地融合。每个表达盒都在巨细胞病毒(CMV)启动子(SEQ ID NO:137)的控制下。本领域已知CMV转录增强子(SEQ ID NO:138)也可以包括在包含CMV启动子的构建体中。产生了各自在人RNA聚合酶III U6启动子(SEQ ID NO:139)的控制下编码单gRNA的指导RNA表达构建体,并将其引入pTwist High Copy Amp载体。表9中列出了每个指导物的靶序列的序列。
将上述构建体引入哺乳动物细胞。转染前一天,将1x10
然后分析总基因组DNA以确定针对每个基因组靶标的每个RGN的编辑率。首先,产生寡核苷酸以用于PCR扩增和随后对扩增的基因组靶位点的分析。表8.1至8.5列出了所用的寡核苷酸序列。
所有PCR反应均使用10μL的2X Master Mix Phusion High-Fidelity DNA聚合酶(Thermo Scientific)在包含0.5μM每种引物的20μL反应中进行。首先使用PCR#1引物扩增包含每种靶基因的大基因组区域,使用如下程序:98℃,1分钟;[98℃,10秒;62℃,15秒;72℃,5分钟]的30个循环;72℃,5分钟;一直保持12℃。然后使用特异于每个指导物的引物(PCR#2引物)进一步扩增一微升的该PCR反应,使用如下程序:98℃,1分钟;[98℃,10秒;67℃,15秒;72℃,30秒]的35个循环;72℃,5分钟;一直保持12℃。PCR#2的引物包括用于Illumina测序的Nextera Read 1和Read 2转座酶衔接子突出端序列。
表8.1:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,PCR#1
表8.2:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,针对APG05083.1、APG07433.1、APG07513.1和APG08290.1的PCR#2
表8.3:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG005459.1的PCR#2
表8.4:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG004583.1的PCR#2
表8.5:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸,APG01988.1的PCR#2
对纯化的基因组DNA进行如上所述的PCR#1和PCR#2。第二次PCR扩增后,按照制造商的说明使用PCR清洁试剂盒(Zymo)清洁DNA,并在水中洗脱。将200-500ng纯化的PCR#2产物与2μL的10X NEB Buffer 2和水在20μL的反应中混合,并使用以下程序退火以形成异源双链DNA:95℃,5分钟;95-85℃,以2℃/秒的速度冷却;85-25℃,以0.1℃/秒的速度冷却;一直保持12℃。退火后,移除5μL的DNA作为无酶对照,并添加1μL的T7核酸内切酶I(NEB),并将反应液在37℃下温育1小时。温育后,添加5x FlashGel负载染料(Lonza),并使用凝胶电泳通过2.2%琼脂糖FlashGel(Lonza)分析5μL的每种反应液和对照。凝胶可视化后,使用以下等式确定非同源末端连接(NHEJ)的百分比:%NHEJ事件=100x[1-(1-切割的分数)^(1/2)],其中(切割的分数)定义为:(消化产物的密度)/(消化产物的密度+未消化的亲本条带的密度)。
对于一些样品,使用
重新退火后,按照制造商推荐的方案用
此外,按照Illumina 16S宏基因组测序文库方案,对包含Illumina突出端序列的PCR#2的产物进行文库制备。由服务提供商(MOGene)在Illumina Mi-Seq平台上进行深度测序。每个扩增子通常产生200,000个250bp的配对末端读数(2x 100,000个读数)。使用CRISPResso(Pinello等人,2016Nature Biotech,34:695-697)分析读数以计算编辑率。手工组织输出比对以确认插入和缺失位点以及在重组位点处鉴定微同源位点。编辑率示于表9。所有实验均在人细胞中进行。“靶序列”是基因靶标内的被靶向的序列。对于每个靶序列,取决于所使用的RGN,指导RNA包含互补RNA靶序列和合适的sgRNA。表10.1-10.9中显示了通过指导RNA进行的实验的经选择的分解。
表9:总体编辑率
表10.1-10.7中显示了相应指导物的特定插入和缺失。在这些表中,靶序列由粗体大写字母标识。8mer PAM区用双下划线标出,其中主要的被识别的核苷酸为粗体。插入由小写字母标识。缺失用短划线(---)标识。从靶序列的PAM近端边缘计算INDEL位置,其中边缘为位置0。如果位置在边缘的靶标侧,则位置为正(+);如果位置在边缘的PAM侧,则位置为负(-)。
表10.1:使用RGN APG07433.1的指导物139的特定插入和缺失
表10.2:使用RGN APG07433.1的指导物143的特定插入和缺失
表10.3:使用RGN APG07433.1的指导物190的特定插入和缺失
表10.4:使用RGN APG07433.1的指导物194的特定插入和缺失
表10.5:使用RGN APG08290.1的指导物145的特定插入和缺失
表10.6:使用RGN APG08290.1的指导物188的特定插入和缺失
表10.7:使用RGN APG08290.1的指导物192的特定插入和缺失
表10.8:使用RGN APG08290.1的指导物196的特定插入和缺失
表10.9:使用RGN APG07433.1的指导物190的特定插入和缺失
实施例7:植物细胞中的基因编辑活性的证明
使用从Li,等人,(2013)Nat.Biotech.31:688-691改编的方案在植物细胞中证明了本发明的RGN的RNA-指导的核酸酶活性。简而言之,将包含N末端SV40核定位信号的每个RGN的植物密码子优化形式(SEQ ID NO:169-182)克隆到瞬时转化载体中的强组成型35S启动子之后。将靶向植物PDS基因中的在合适的PAM序列侧翼的一个或多个位点的sgRNA克隆到第二个瞬时表达载体中的植物U6启动子之后。使用PEG介导的转化将表达载体引入本氏烟草(Nicotiana benthamiana)叶肉原生质体中。将转化的原生质体在黑暗中孵育长达36小时。使用DNeasy Plant Mini试剂盒(Qiagen)从原生质体分离基因组DNA。PCR扩增RGN靶位点侧翼的基因组区域,并按照制造商的方案使用QiaQuick Spin Column(Qiagen)纯化产物。将总共200-500ng的纯化的PCR产物与1μl 10×Taq DNA聚合酶PCR缓冲液(Enzymatics)和超纯水混合至10μl的最终体积,并进行重新退火过程以使异源双链体形成:95℃ 10分钟,以-2℃/s从95℃变至85℃,以-0.25℃/s从85℃变至25℃,并在25℃保持1分钟。重新退火后,按照制造商推荐的方案用SURVEYOR核酸酶和SURVEYOR enhancer S(Integrated DNATechnologies)处理产物,并在4-20%Novex TBE聚丙烯酰胺凝胶(Life Technologies)上进行分析。凝胶用SYBR Gold DNA染料(Life Technologies)染色10分钟,并用Gel Doc凝胶成像系统(Bio-rad)成像。定量基于相对条带强度。Indel百分比由公式100×(1-(1-(b+c)/(a+b+c))1/2)确定,其中a是未消化的PCR产物的累积强度,以及b和c是每个切割产物的累积强度。
可替代地,可以对源自被靶向的基因组序列的PCR产物进行类似于实施例6中所述的PCR,使得PCR产物含有Illumina突出端序列并且可以进行文库制备和深度测序。这种方法允许确定编辑率,如表9所示。
实施例8:指导物交叉相容性
为了确定指导RNA在RGN之间的交叉相容性,进行了双质粒干扰实验(Esvelt等人,(2013),Nat.Methods 10(11):1116-21)。第一质粒在卡那霉素抗性主链上包含RGN,其中几个靶标包含确定的PAM。将这些质粒转化到大肠杆菌BL21中,并使转化的菌株成为化学感受态。然后引入在氨苄青霉素抗性主链上包含指导RNA的第二质粒。将细胞铺板在含有两种抗生素的培养基上。如果RGN能够使用第二质粒上的指导物,则卡那霉素抗性质粒被切割并线性化,导致很少或没有菌落形成。如果RGN不能够使用第二质粒上的指导物,则卡那霉素抗性质粒不会被切割,从而导致高水平的菌落形成。还包括化脓性链球菌Cas9(SpyCas9)和金黄色葡萄球菌(Staphylococcus aureus)Cas9(SauCas9)的指导RNA,以确定与这些指导RNA的交叉相容性。
为了计算消耗百分比,将每个指导物转化的菌落数与使用阳性对照的转化效率进行比较。基于此比较,如果RGN可以使用指导物,则消耗百分比应为0,因为没有菌落能够生存。如果RGN不能使用指导物,则消耗百分比应为1,因为所有质粒均保持完整。结果显示在下表11中。“sg”指示所述RGN的指导RNA。
表11:交叉相容性测定
如表11所示,有四组正交系统。RGN可以识别来自其组中的其他系统的指导物,但不能使用来自其他组的指导物。第一组包含APG05083.1、APG07433.1、APG07513.1和APG08290.1。第二组包含SpyCas9和APG05459.1。第三组包含APG04583.1和APG01688.1。第四组包含SauCas9。
实施例9:疾病靶标的鉴定
从NCBI ClinVar数据库(其可通过万维网在NCBI ClinVar网站上获得)获得临床变体的数据库。从该列表鉴定致病性单核苷酸多态性(SNP)。使用基因组基因座信息,鉴定了与每个SNP重叠和围绕每个SNP的区域中的CRISPR靶标。表12中列出了可以使用与本发明的RGN结合的碱基编辑以靶向因果突变来校正的SNP的选择。在表12中,仅列出了每种疾病的一种别名。“RS#”对应于NCBI网站上通过SNP数据库获得的RS登录号。等位基因ID(AlleleID)对应于因果等位基因登录号,并且染色体登录号还提供通过NCBI网站找到的登录参考信息。表12还提供了适于针对每种疾病列出的RGN的基因组靶序列信息。靶序列信息还提供了用于产生针对本发明的相应RGN必需的sgRNA的前间区序列。
表12:本发明的RGN的疾病靶标
实施例10:靶向造成Hurler综合征的突变
下文描述了用于Hurler综合征(也称为MPS-1)的潜在治疗,其使用校正大部分患有疾病的患者中的造成Hurler综合征的突变的RNA引导的碱基编辑系统。这种方法利用了RNA指导的碱基编辑融合蛋白,其可以被包装到单个AAV载体中以递送至多种组织类型。取决于所使用的确切调节元件和碱基编辑结构域,还可以设计编码碱基编辑融合蛋白和单指导RNA两者的单一载体以靶向患病基因座。
实施例10.1:鉴定具有理想PAM的RGN
遗传病MPS-1是一种溶酶体贮积病,其特征在于在分子水平上硫酸皮肤素和硫酸乙酰肝素在溶酶体中的蓄积。该疾病通常是由IDUA基因(NCBI参考序列NG_008103.1)中的突变引起的遗传性遗传病,该基因编码α-L-艾杜糖醛酸酶。该疾病是α-L-艾杜糖醛酸酶缺乏的结果。在北欧背景的个体的研究中发现的最常见的IDUA突变是W402X和Q70X,两者都是无义突变,导致翻译提前终止(Bunge等人,(1994),Hum.Mol.Genet,3(6):861-866,通过引用并入本文)。单个核苷酸的回复将恢复野生型编码序列并导致受遗传基因座的内源调节机制控制的蛋白质表达。
人Idua基因的W402X突变在MPS-1H病例中占很高比例。碱基编辑器可以靶向相对于指导RNA的前间区组件结合位点的狭窄序列窗口,因此,距靶基因座特定距离的PAM序列的存在对于该策略的成功至关重要。鉴于碱基编辑蛋白相互作用期间靶突变必须在暴露的非靶标链(NTS)上以及RGN结构域的足迹将阻止进入PAM附近区域的限制,认为可及的基因座是距PAM 10-30bp。为避免在这个窗口中编辑和诱变其他附近的腺苷碱基,筛选不同的接头。理想窗口为距PAM 12-16bp。
与APG07433.1和APG08290.1相容的PAM序列在遗传基因座和如上文定义的理想碱基编辑窗口内很容易看出。这些核酸酶的PAM序列分别为NNNNCC(SEQ ID NO:6)和NNRNCC(SEQ ID NO:32),并且尺寸紧凑-可能允许通过单个AAV载体递送。这种递送方法相对于其他方法具有多种优势,例如进入各种不同的组织(肝脏、肌肉、CNS)以及良好建立的安全性特征和制造技术。
来自化脓性链球菌的Cas9(SpyCas9)需要NGG(SEQ ID NO:448)的PAM序列,该序列存在于W402X基因座附近,但是,SpyCas9的大小阻止了将编码碱基编辑结构域和SpyCas9核酸酶的融合蛋白的基因包装到单个AAV载体中,因此消除了该方法的上述优势。在该载体上包含指导RNA编码序列的可行性甚至更低,即使要进行重大的技术改进以减小基因调节元件的大小或增加AAV载体的包装极限。尽管可以采用双重递送策略(例如,Ryu等人,(2018),Nat.Biotechnol.,36(6):536-539,通过引用并入本文),但是它将增加显著的制造复杂性和成本。另外,双重病毒载体递送显著降低了基因校正的效率,因为在给定细胞中的成功编辑需要用两种载体感染和在细胞中组装融合蛋白。
相对于SpyCas9,常用的来自金黄色葡萄球菌的Cas9直系同源物(SauCas9)的尺寸要小得多,但具有更复杂的PAM要求-NGRRT(SEQ ID NO:449)。但是,该序列不在预期对致病基因座的碱基编辑有用的范围内。
实施例10.2:RGN融合构建体和sgRNA序列
使用标准的分子生物学技术产生编码具有以下结构域的融合蛋白的DNA序列:1)具有使DNA切割活性灭活(“失活”或“切口酶”)的突变的RGN结构域;2)可用于碱基编辑的腺苷脱氨酶。下表中描述的所有构建体均包含具有碱基编辑活性结构域的融合蛋白,在此实施例中,ADAT(SEQ ID NO:450)可操作地融合至RGN APG08290.1的N末端。本领域已知融合蛋白也可以用在RGN的C末端的碱基编辑酶来制备。另外,融合蛋白的RGN和碱基编辑器通常被接头氨基序列分开。本领域已知标准接头的长度为15-30个氨基酸。此外,本领域已知RGN与碱基编辑酶(例如胞苷脱氨酶)之间的某些融合蛋白还可包含至少一个尿嘧啶糖基化酶抑制剂(UGI)结构域,其可提高碱基编辑效率(US专利号10,167,457,通过引用并入本文)。因此,融合蛋白可包含APG08290.1、碱基修饰酶和至少一种UGI。
表13:RNA靶向的碱基编辑的构建体
RGN的可及编辑位点由PAM序列确定。当将RGN与碱基编辑结构域组合时,用于编辑的靶残基必须位于非靶标链(NTS)上,因为NTS是单链的,而RGN与基因座相关联。评估许多核酸酶和相应的指导RNA使得能够为该特定基因座选择最合适的基因编辑工具。在人Idua基因中,可由上述构建体靶向的几种潜在PAM序列位于负责W402X突变的突变核苷酸附近。还产生了编码包含以下内容的指导RNA转录物的序列:1)与疾病基因座的非编码DNA链互补的“间隔子”;和2)指导RNA与RGN缔合所需的RNA序列。有用的指导RNA序列(sgRNA)显示在下表14中。可以评估这些指导RNA序列的将上述碱基编辑器引导至感兴趣的基因座的效率。
表14:指导RNA的序列
实施例10.3:来自Hurler病患者的细胞中活性的测定
为了验证基因型策略并评估上述构建体,使用了来自Hurler病患者的成纤维细胞。与实施例5中描述的那些载体相似,设计了一种载体,其在融合蛋白编码序列和sgRNA编码序列的上游包含合适的启动子以用于在人细胞中表达这些序列。认识到还可以使用已知在人细胞中具有高水平表达或可在成纤维细胞中特异性表达的启动子和其他DNA元件(例如增强子或终止子)。使用标准技术(例如类似于实施例6中描述的转染)将载体转染到成纤维细胞中。可替代地,可以使用电穿孔。将细胞培养1-3天。使用标准技术分离基因组DNA(gDNA)。如下文进一步所述,通过对纯化的gDNA进行qPCR基因分型测定和/或下一代测序来确定编辑效率。
Taqman
表15:RT-PCR引物和探针
编辑实验后,使用标准方法以及上述引物和探针对gDNA进行qPCR分析。预期的结果显示在表16中。该体外系统可用于方便地评估构建体,并选择具有高编辑效率的构建体用于进一步研究。将与具有和不具有W402X突变的细胞(并且优选与具有对该突变杂合的一些细胞)进行比较以评估该系统。使用染料(例如Sybr green),Ct值将与参考基因或与基因座的总扩增进行比较。
表16:预期的qPCR结果
还可以通过下一代测序分析组织。可以使用引物结合位点,例如以下所示的那些(表17),或可以由本领域技术人员鉴定的其他合适的引物结合位点。PCR扩增后,按照Illumina 16S宏基因组测序文库方案对含有Illumina Nextera XT突出端序列的产物进行文库制备。深度测序是在Illumina Mi-Seq平台上进行的。通常,每个扩增子产生200,000个250bp的配对末端读数(2x 100,000个读数)。使用CRISPResso(Pinello等人,2016)分析读数以计算编辑率。手工组织输出比对以确认插入和缺失位点,以及在重组位点鉴定微同源位点。
表17:NGS引物结合位点
使用抗IDUA抗体对转染的细胞和对照细胞的细胞裂解物进行蛋白质印迹以验证全长蛋白的表达,并使用底物4-甲基伞形酮a-L-艾杜糖醛酸对细胞裂解物进行酶活性测定来验证该酶是否具有催化活性(Hopwood等人,Clin.Chim.ACta(1979),92(2):257-265,通过引用并入本文)。与原始Idua
实施例10.4:鼠模型中的疾病治疗验证
为了验证这种治疗方法的功效,使用在类似氨基酸中具有无义突变的小鼠模型。小鼠品系在其Idua基因(基因ID:15932)中具有W392X突变,其对应于Hurler综合征患者中的同源突变(Bunge等人,(1994),Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。该基因座包含相对于人中的序列不同的核苷酸序列,其缺少先前实施例中描述的用碱基编辑器进行校正所必需的PAM序列,并因此需要设计独特的融合蛋白来进行核苷酸校正。在这种动物中疾病的改善可以验证校正基因递送载体可及的组织中的突变的治疗方法。
对该突变纯合的小鼠表现出类似于Hurler综合征患者的许多表型特征。如上所述的碱基编辑-RGN融合蛋白(表13)与RNA指导序列一起被插入允许在小鼠中进行蛋白质表达和RNA转录的表达载体中。研究设计如下表18所示。该研究包括用高剂量的包含碱基编辑融合蛋白和RNA指导序列的表达载体、低剂量的相同表达载体、对照(其是用不包含碱基编辑融合蛋白或指导RNA的表达载体处理的模型小鼠)以及第二种对照(其是用相同空载体处理的野生型小鼠)处理的组。
表18:鼠模型中的基因组编辑实验
评估的终点包括体重、尿液GAG排泄、血清IDUA酶活性、感兴趣的组织中的IDUA活性、组织病理学、感兴趣的组织的基因分型以验证SNP的校正以及行为和神经学评估。由于一些终点是终末的,因此可以在研究结束之前添加其他组用于评估例如组织病理学和组织IDUA活性。在建立Hurler综合征动物模型的已发表论文中可以找到终点的其他示例(Shull等人,(1994),Proc.Natl.Acad.Sci.U.S.A.,91(26):12937-12941;Wang等人,(2010),Mol.Genet.Metab.,99(1):62-71;Hartung等人,(2004),Mol.Ther.,9(6):866-875;Liu等人,(2005),Mol.Ther.,11(1):35-47;Clarke等人,(1997),Hum.Mol.Genet.6(4):503-511;全部通过引用并入本文)。
一种可能的递送载体利用腺相关病毒(AAV)。产生载体以包含在CMV增强子(SEQID NO:138)和启动子(SEQ ID NO:137)或其他合适的增强子和启动子组合(任选地Kozak序列)之前并在3’末端可操作地融合至终止子序列和聚腺苷酸化序列(例如Levitt,N.;Briggs,D.;Gil,A.;Proudfoot,N.J.Definition of an Efficient Synthetic Poly(A)Site.Genes Dev.1989,3(7),1019–1025中描述的最小序列)的碱基编辑器-dRGN融合蛋白编码序列(例如,SEQ ID NO:452)。载体可进一步包含表达盒,该表达盒编码在其5’末端可操作地连接至人U6启动子(SEQ ID NO:139)或适于产生小的非编码RNA的另一启动子的单指导RNA并且进一步包含用于包装在AAV衣壳中所必需的且本领域众所周知的反向末端重复(ITR)序列。通过标准方法进行生产和病毒包装,例如在美国专利号9,587,250中描述的方法,该专利通过引用并入本文。
其他可能的病毒载体包括通常使用的腺病毒和慢病毒载体,它们将含有相似的元件,具有不同的包装能力和要求。还可以使用非病毒递送方法,例如脂质纳米颗粒包裹的mRNA和sgRNA(Cullis,P.R.和Allen,T.M.(2013),Adv.Drug Deliv.Rev.65(1):36-48;Finn等人,(2018),Cell Rep.22(9):2227-2235,均通过引用并入本文),质粒DNA的流体动力学注射(Suda T和Liu D,(2007)Mol.Ther.15(12):2063-2069,通过引用并入本文)或与金纳米颗粒缔合的sgRNA的核糖核蛋白复合物(Lee,K.;Conboy,M.;Park,H.M.;Jiang,F.;Kim,H.J.;Dewitt,M.A.;Mackley,V.A.;Chang,K.;Rao,A.;Skinner,C.;等人,NanoparticleDelivery of Cas9 Ribonucleoprotein and Donor DNA in Vivo Induces Homology-Directed DNA Repair.Nat.Biomed.Eng.2017,1(11),889–90)。
实施例10.5:具有人源化基因座的鼠模型中的疾病校正
为了评估与用于人类治疗的相同的碱基编辑器构建体的功效,需要一种小鼠模型,其中改变W392附近的核苷酸以匹配人中W402附近的序列。这可以通过多种技术来实现,包括使用RGN和HDR模板以切割和替换小鼠胚胎中的基因座。
由于高度的氨基酸保守性,可以将小鼠基因座中的大多数核苷酸改变为如表19所示的具有沉默突变的人序列的那些核苷酸。导致所得到的工程化小鼠的基因组中改变的编码序列中的唯一的碱基变化在引入终止密码子后发生。
表19:核苷酸突变产生人源化小鼠基因座
在该小鼠品系的工程化后,将如实施例10.4中所述进行类似的实验。
实施例11:造成弗里德赖希共济失调的靶向突变
导致弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内的确定的遗传基因座中,被称为FRDA不稳定性区域。RNA-指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。这种方法需要1)RGN和指导RNA序列,其可被编程以靶向人基因组中的等位基因;和2)用于RGN和指导物序列的递送方法。用于基因组编辑的许多核酸酶(例如常用的来自化脓性链球菌的Cas9核酸酶(SpCas9))太大而无法被包装到腺相关病毒(AAV)载体中,尤其是在考虑除了功能表达盒所需的其他遗传元件以外SpCas9基因和指导RNA的长度时。这使得不太可能使用SpCas9形成可行的方法。
本发明的紧凑的RNA-指导的核酸酶(特别是APG07433.1和APG08290.1)独特地非常适合于FRDA不稳定性区域的切除。每个RGN具有在FRDA不稳定性区域附近的PAM要求。另外,这些RGN中的每一个都可以与指导RNA一起包装到AAV载体中。包装两个指导RNA可能需要第二个载体,但是这种方法与较大的核酸酶(例如SpCas9)所需的相比仍然是有利的,后者可能需要将蛋白质序列拆分在两个载体之间。
表20显示了适合将APG07433.1或APG08290.1靶向至FRDA不稳定性区域的5’和3’侧翼的基因组靶序列的位置。一旦到达基因座,RGN将切除FA不稳定性区域。区域的切除可以使用Illumina测序基因座来验证。
表20:RGN系统的基因组靶序列
实施例12:靶向造成镰状细胞病的突变
BCL11A增强子区域(SEQ ID NO:472)内的靶向序列可提供用于增加胎儿血红蛋白(HbF)以治愈或减轻镰状细胞病的症状的机制。例如,全基因组关联研究已经鉴定了BCL11A处与升高的HbF水平相关的一组遗传变异。这些变异是在用作阶段特异性、谱系限制的增强子区域的BCL11A的非编码区域中发现的SNP的集合。进一步的研究表明,该BCL11A增强子是在红系细胞中BCL11A表达所需的(Bauer等人,(2013)Science 343:253-257,通过引用并入本文)。在BCL11A基因的内含子2内发现增强子区域,并鉴定了内含子2中三个区域的DNAseI超敏反应(通常指示与调节潜能相关的染色质状态)。根据距BCL11A的转录起始位点的千碱基距离,将这三个区域鉴定为“+62”、“+58”和“+55”。这些增强子区域的长度为约350(+55);550(+58);和350(+62)个核苷酸(Bauer等人,2013)。
实施例12.1:鉴定优选的RGN系统
在这里,我们描述了一种使用破坏BCL11A与其在HBB基因座(其是负责在成人血红蛋白中产生β-球蛋白的基因)内的结合位点的结合的RGN系统的用于β-血红蛋白病的潜在治疗方法。这种方法使用在哺乳动物细胞中更有效的NHEJ。另外,此方法使用尺寸足够小的核酸酶,其可以被包装到单个AAV载体中以用于体内递送。
人BCL11A增强子区域(SEQ ID NO:472)中的GATA1增强子基序是用于使用RNA-指导的核酸酶(RGN)进行破坏以减少成人红细胞中的BCL11A表达并同时再表达HbF的理想靶标(Wu等人,(2019)Nat Med 387:2554)。与APG07433.1和APG08290.1相容的几个PAM序列在该GATA1位点周围的遗传基因座上很容易看出。这些核酸酶具有5’-NNNNCC-3’(SEQ ID NO:6)的PAM序列,并且尺寸紧凑,潜在地允许其与适当的指导RNA一起在单个AAV或腺病毒载体中递送。这种递送方法相对于其他方法具有多种优势,例如可以进入造血干细胞以及良好建立的安全性特征和制造技术。
常用的来自化脓性链球菌的Cas9核酸酶(SpyCas9)需要5’-NGG-3’的PAM序列(SEQID NO:448),其中几个存在于GATA1基序附近。但是,SpyCas9的大小阻止了包装到单个AAV或腺病毒载体中,因此消除了该方法的上述优点。尽管可以采用双重递送策略,但会增加显著的制造复杂性和成本。另外,双重病毒载体递送显著降低了基因校正的效率,因为在给定细胞中的成功编辑需要使用两种载体的感染。
类似于实施例6中所描述的,产生了编码人密码子优化的APG07433.1(SEQ ID NO:128)或APG08290.1(SEQ ID NO:130)的表达盒。还产生了表达用于RGN APG07433.1和APG08290.1的指导RNA的表达盒。这些指导RNA包含1)与BCL11A增强子基因座内的非编码或编码DNA链互补的前间区序列(靶序列)和2)指导RNA与RGN缔合所需的RNA序列(对于APG07433.1为SEQ ID NO:18,对于APG08290.1为SEQ ID NO:35)。由于BCL11A GATA1增强子基序周围的APG07433.1或APG08290.1靶向的几种潜在PAM序列,产生了几种潜在的指导RNA构建体以确定产生BCL11A GATA1增强子序列的NHEJ介导的破坏和稳健的切割的最佳前间区序列。评估下表(表21)中的靶基因组序列以将RGN引导至该基因座。
表21:BCL11A GATA1增强子基因座的靶序列
为了评估APG07433.1或APG08290.1产生破坏BCL11A增强子区域的插入或缺失的效率,使用了人类细胞系,例如人类胚胎肾细胞(HEK细胞)。产生包含RGN表达盒(例如,如实施例6中所述)的DNA载体。还产生了包含表达盒的单独载体,所述表达盒包含表21的指导RNA序列的编码序列。如实施例6中所述,这样的表达盒可以进一步包含人RNA聚合酶III U6启动子(SEQ ID NO:139)。可替代地,可以使用包含RGN和指导RNA两者的表达盒的单个载体。使用诸如实施例6中所述的标准技术将载体引入HEK细胞,并将细胞培养1-3天。在该培养期后,如实施例6中所述,分离基因组DNA并通过使用T7核酸内切酶I消化和/或直接DNA测序来确定插入或缺失的频率。
通过使用含有Illumina Nextera XT突出端序列的引物的PCR扩增包含靶BCL11A区域的DNA区域。这些PCR扩增子使用T7核酸内切酶I消化来检查NHEJ形成,或按照Illumina16S宏基因组测序文库方案或类似的下一代测序(NGS)文库制备来进行文库制备。在深度测序后,通过CRISPResso分析产生的读数以计算编辑率。手工组织输出比对以确认插入和缺失位点。该分析鉴定了优选的RGN和相应的优选的指导RNA(sgRNA)。该分析可能导致APG07433.1和APG08290.1被同等优选。另外,该分析可以确定存在多于一种优选的指导RNA,或者表21中的所有靶基因组序列均同等优选。
实施例12.2:胎儿血红蛋白表达的测定
在该实施例中,针对胎儿血红蛋白的表达测定APG07433.1或APG08290.1产生的破坏BCL11A增强子区域的插入或缺失。使用健康的人供体CD34
实施例12.3:减少的镰状细胞形成的测定
在该实施例中,针对减少的镰状细胞形成测定APG07433.1或APG08290.1产生的破坏BCL11A增强子区域的插入或缺失。使用来自罹患镰状细胞病的患者的供体CD34
通过添加偏亚硫酸氢盐在这些分化的红细胞中诱导镰状细胞形成。使用显微镜对镰状红细胞相对正常红细胞的数量进行计数。预期用APG07433.1或APG08290.1加sgRNA处理的细胞中,镰状细胞的数量少于未处理或单独使用RGN处理的细胞中的数量。
实施例12.4:鼠模型中的疾病治疗验证
为了评估使用APG07433.1或APG08290.1破坏BCL11A基因座的功效,使用了合适的镰状细胞性贫血的人源化小鼠模型。将编码优选的RGN和优选的sgRNA的表达盒包装到AAV载体或腺病毒载体中。特别地,腺病毒类型Ad5/35有效靶向HSC。选择合适的包含具有镰状细胞等位基因的人源化HBB基因座的小鼠模型,例如B6;FVB-Tg(LCR-HBA2,LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。这些小鼠用单独的或与普乐沙福组合的粒细胞集落刺激因子治疗以动员HSC进入循环。然后静脉注射携带RGN和指导质粒的AAV或腺病毒,并允许小鼠恢复一周。使用偏亚硫酸氢盐在体外镰状细胞测定中测试从这些小鼠获得的血液,并纵向跟踪小鼠以监测死亡率和造血功能。与用缺乏两种表达盒的病毒或用单独携带RGN表达盒的病毒治疗的小鼠相比,使用携带RGN和指导RNA的AAV或腺病毒的治疗预期将降低镰状化、死亡率并改善造血功能。
序列表
<110> 生命编辑股份有限公司
<120> RNA-指导的核酸酶及其活性片段和变体及其使用方法
<130> L103438 1160WO (0029.8)
<140>
<141>
<150> 62/805,045
<151> 2019-02-13
<150> 62/805,041
<151> 2019-02-13
<150> 62/686,901
<151> 2018-06-19
<150> 62/680,863
<151> 2018-06-05
<150> 62/680,862
<151> 2018-06-05
<150> 62/680,859
<151> 2018-06-05
<150> 62/680,853
<151> 2018-06-05
<150> 62/680,846
<151> 2018-06-05
<150> 62/680,845
<151> 2018-06-05
<160> 651
<170> PatentIn version 3.5
<210> 1
<211> 1070
<212> PRT
<213> Bacillus sp.
<220>
<221> 来源
<223> /注="APG05083.1"
<400> 1
Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Ile Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Gln
20 25 30
Tyr Glu Lys Ala Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys
35 40 45
Ala Glu Ile Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Asp Ile Arg Asn Leu Leu Val Gln His Glu Ile Ile Ser Gln Lys Glu
85 90 95
Leu Ala Ser Leu Tyr Pro Leu Thr Lys Ser Ser Met Asp Ile Trp Asp
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asp Arg Phe Glu Trp Thr
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Val Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Ala Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Met Lys Asn Glu Asp Phe Ser Lys Tyr Asp Lys Arg Arg Asn Ser
180 185 190
Ser Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala
210 215 220
Ser Ala Asp Leu Gln Lys Thr Tyr Leu Gln Ile Trp Ala His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Val Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Lys Arg Val Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Ser Thr Leu Asp Gln Ile Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asn Phe Gln Pro Phe Thr Lys Glu Gln Arg Asp Val Ile Leu Asp Glu
290 295 300
Met Phe Asn Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Ala Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Thr Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Leu Lys Ser Phe Ile Asn Leu Lys Pro Phe Tyr Glu Ile Lys Lys Val
355 360 365
Val Thr Asn Tyr Ala Lys Lys Thr Asn Glu Ala Phe Ser Thr Leu Asp
370 375 380
Tyr Asp Thr Phe Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Cys Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Leu Thr Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln
435 440 445
Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Ala
450 455 460
Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Phe Pro
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val
500 505 510
His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Thr
515 520 525
Lys Ile Met Lys Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Gln Ile Pro Ala Asn Thr Phe Phe Asn Glu Met Lys Lys
580 585 590
Glu Arg Ser Gly Ser Pro Val Leu Glu Ile Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Gly
610 615 620
Asp Glu Asn Gln Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu
625 630 635 640
Glu Gly Asn Lys Asp Trp Glu Ser Phe Glu Ser Tyr Val Arg Leu Asn
645 650 655
Ser Phe Phe Ser Lys Lys Lys Arg Gly Tyr Leu Leu Lys Lys Ala Tyr
660 665 670
Leu Pro Arg Glu Ser Asn Met Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Ser Tyr Leu Lys Asn Phe Ile Glu Lys Asn Leu Lys
690 695 700
Phe Lys Glu Val Glu Gly Ser Thr Arg Lys Lys His Val Gln Thr Val
705 710 715 720
Asn Gly Ile Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Lys Val Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Ser Asn Lys Ser Ile Arg Lys Pro Tyr Phe Pro Leu Pro
770 775 780
Trp Val Gly Phe Arg Glu Glu Ile Leu Ser His Leu Ala Arg Gln Pro
785 790 795 800
Ile Ala Arg Lys Ile Ser Glu Glu Leu Lys Ile Gly Tyr Gln Ser Phe
805 810 815
Asp Tyr Ile Leu Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala
820 825 830
Ala His Glu Gln Thr Ile Met Lys Lys Gly Gly Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Lys Arg Val Tyr Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Ile Glu Tyr Gly Lys Glu Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Lys Gly
900 905 910
Asn Leu Ile Lys Lys Ile Lys Val Glu Val Gln Thr Lys Ser Phe Val
915 920 925
Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asn Arg Tyr Tyr Met Ile Pro Ile Tyr Val
945 950 955 960
Met Asp Thr Val His Ser Glu Leu Pro Asn Lys Ala Val Thr Ser Ser
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Thr Ile Asp Asn Ser Phe Thr Phe Lys
980 985 990
Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Ser Thr Leu Asp Ile Asn Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Ala Glu Asn
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Phe Val Arg Gln Glu Ile Arg Lys
1055 1060 1065
Asn Phe
1070
<210> 2
<211> 19
<212> RNA
<213> 芽孢杆菌属(Bacillus)的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 2
gucauaguuc cauuauugc 19
<210> 3
<211> 84
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 3
gcuuugaugu uucuaugaua agggcuuagg cccguggcgu uggggaucgc cugcccauuu 60
uaaugggcuu cuccccaucu auuu 84
<210> 4
<211> 137
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 4
gagcggacag cagcuuccua uaucucguac gucauaguuc cauuauugca aaggcuuuga 60
uguuucuaug auaagggcuu aggcccgugg cguuggggau cgccugccca uuuuaauggg 120
cuucucccca ucuauuu 137
<210> 5
<211> 137
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 5
ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuauugca aaggcuuuga 60
uguuucuaug auaagggcuu aggcccgugg cguuggggau cgccugccca uuuuaauggg 120
cuucucccca ucuauuu 137
<210> 6
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(4)
<223> a, c, t, g, 未知或其他
<400> 6
nnnncc 6
<210> 7
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="示例性PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(4)
<223> a, c, t, g, 未知或其他
<400> 7
nnrncc 6
<210> 8
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 8
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 9
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 9
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 10
<211> 132
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 10
nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua uugcaaaggc uuugauguuu 60
cuaugauaag ggcuuaggcc cguggcguug gggaucgccu gcccauuuua augggcuucu 120
ccccaucuau uu 132
<210> 11
<211> 1071
<212> PRT
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG07433.1"
<400> 11
Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Arg
20 25 30
Tyr Glu Lys Val Arg Ile Val Asp Gln Gly Val Arg Met Phe Asp Arg
35 40 45
Ala Glu Met Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Asn Ile Arg Asn Leu Leu Val Gln His Gly Val Ile Thr Gln Glu Glu
85 90 95
Leu Asp Ser Leu Tyr Pro Leu Ser Lys Lys Ser Met Asp Ile Trp Gly
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Phe Glu Trp Ala
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Thr Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Leu Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Met Lys Asp Pro Asp Phe Ser Lys Tyr Asp Arg Lys Arg Asn Ser
180 185 190
Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Glu Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Ala Ala Gln Arg Arg Phe Gln Ser Pro Tyr Ala
210 215 220
Ser Lys Asp Leu Gln Glu Thr Tyr Leu Gln Ile Trp Thr His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asp Phe Gln Pro Phe Thr Lys Glu Gln Arg Glu Ile Ile Leu Asn Asn
290 295 300
Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Asn Lys Val
355 360 365
Val Ala Asn Tyr Ser Glu Arg Thr Asn Glu Thr Phe Ser Thr Leu Asp
370 375 380
Tyr Asp Gly Ile Gly Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Ser Ser His Asn Leu Pro Lys Arg Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Leu Ser Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Leu Lys Ala Ile Asn His Val Leu Ser Ile Met Gln
435 440 445
Lys Gly Asn Thr Tyr Lys Glu Ala Val Asp Gln Leu Gly Tyr Asp Thr
450 455 460
Ser Gly Leu Lys Lys Glu Lys Arg Ser Lys Phe Leu Pro Pro Ile Ser
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg His Gly Ser Pro His Ser Val
500 505 510
His Ile Glu Leu Ala Arg Glu Leu Ser Lys Asn His Asp Glu Arg Thr
515 520 525
Lys Ile Val Ser Ala Gln Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Ile Ser Ile Leu Ser Glu His Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Glu Ile Pro Ala Asp Thr Phe Phe Asn Glu Leu Lys Lys
580 585 590
Glu Arg Asn Gly Ala Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser
610 615 620
Asp Glu Asn Arg Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu
625 630 635 640
Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn
645 650 655
Lys Phe Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Arg Ala Tyr
660 665 670
Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln
690 695 700
Phe Lys Glu Ala Glu Asp Asn Pro Arg Lys Arg Arg Val Gln Thr Val
705 710 715 720
Asn Gly Val Ile Thr Ala His Phe Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Arg Val Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro
770 775 780
Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro
785 790 795 800
Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Leu
805 810 815
Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala
820 825 830
Ala His Lys Gln Thr Ile Met Arg Lys Gly Gly Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Glu Arg Leu His Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Met Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Gly Lys Asn Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly
900 905 910
Asn Leu Ile Lys Arg Val Lys Val Glu Gly Gln Ala Lys Ser Phe Val
915 920 925
Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val
945 950 955 960
Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Ala Ser Ser
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys
980 985 990
Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Lys Asn Glu Tyr
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asp Leu Glu Lys Tyr Glu Val
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Leu Val Arg Lys Glu Thr Arg Arg
1055 1060 1065
Asn Phe His
1070
<210> 12
<211> 21
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 12
gucauaguuc cauuaaagcc a 21
<210> 13
<211> 85
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 13
uggcuuugau guuucuauga uaaggguuuc gacccguggc gucggggauc gccugcccau 60
ugaaaugggc uucuccccau uuauu 85
<210> 14
<211> 140
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 14
gagcggacag cagcuuccua uaucucguac gucauaguuc cauuaaagcc agaaauggcu 60
uugauguuuc uaugauaagg guuucgaccc guggcgucgg ggaucgccug cccauugaaa 120
ugggcuucuc cccauuuauu 140
<210> 15
<211> 140
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 15
ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuaaagcc agaaauggcu 60
uugauguuuc uaugauaagg guuucgaccc guggcgucgg ggaucgccug cccauugaaa 120
ugggcuucuc cccauuuauu 140
<210> 16
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 16
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 17
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 17
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 18
<211> 135
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 18
nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua aagccaaaag uggcuuugau 60
guuucuauga uaaggguuuc gacccguggc gucggggauc gccugcccau ugaaaugggc 120
uucuccccau uuauu 135
<210> 19
<211> 1071
<212> PRT
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG07513.1"
<400> 19
Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Gln
20 25 30
Tyr Glu Lys Thr Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys
35 40 45
Ala Glu Ile Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Asp Ile Arg Asn Leu Leu Val Gln His Glu Ile Ile Ser Gln Lys Glu
85 90 95
Leu Thr Ser Leu Tyr Pro Leu Ser Lys Ser Ser Met Asp Ile Trp Asp
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asp Arg Phe Glu Trp Ala
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Val Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Val Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Met Lys Asn Ala Asp Cys Ser Lys Tyr Gly Lys Arg Arg Asn Ser
180 185 190
Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe His Ser Ser Tyr Ala
210 215 220
Ser Val Asp Leu Gln Lys Thr Tyr Ile Gln Ile Trp Ala His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Val Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Lys Arg Val Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Asn Thr Leu Asp Gln Ile Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asn Phe Gln Pro Phe Thr Lys Glu Gln Arg Asp Ile Ile Leu Asp Lys
290 295 300
Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Ala Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Thr Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Met Lys Pro Phe Ile Asn Leu Lys Pro Phe Tyr Glu Ile Lys Lys Val
355 360 365
Val Thr Asn Tyr Ala Lys Lys Thr Asn Glu Val Phe Ser Ala Leu Asp
370 375 380
Tyr Asp Thr Val Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Arg Ser Asn Asn Leu Ser Lys Arg Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Leu Thr Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln
435 440 445
Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr
450 455 460
Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Ile Ile Pro
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val
500 505 510
His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys
515 520 525
Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Val Ser Ile Leu Ile Asp Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Lys Ile Pro Ala Asn Thr Phe Phe Asn Glu Leu Lys Lys
580 585 590
Glu Arg Ser Gly Pro Pro Val Leu Glu Val Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Gly
610 615 620
Asp Glu Asn Gln Lys Lys Gly Asn Arg Ile Pro Tyr Thr Phe Phe Ser
625 630 635 640
Glu Glu Asp Lys Glu Trp Glu Ser Phe Glu Ser Tyr Val Arg Ser Asn
645 650 655
Ser Phe Phe Ser Lys Lys Lys Arg Gly Tyr Leu Leu Lys Lys Ala Tyr
660 665 670
Leu Pro Arg Glu Ser Asn Leu Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Ser Tyr Leu Lys Asn Phe Ile Glu Lys Asn Leu Lys
690 695 700
Phe Lys Glu Ala Val Gly Ile Thr Arg Lys Lys Tyr Val Gln Thr Val
705 710 715 720
Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Lys Val Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Gly Asn Lys Ser Ile Lys Lys Pro Tyr Phe Pro Leu Pro
770 775 780
Trp Met Gly Phe Arg Glu Glu Ile Leu Ser His Leu Glu Ser Gln Pro
785 790 795 800
Ile Ala Arg Lys Ile Ser Glu Glu Leu Lys Ile Gly Tyr Gln Ser Pro
805 810 815
Asp Tyr Ile Leu Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ser
820 825 830
Ala His Asp Gln Thr Val Met Lys Lys Gly Asp Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Lys Arg Val His Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu Tyr Arg Lys Glu Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Lys Gly
900 905 910
Asn Leu Ile Lys Lys Ile Lys Val Glu Val Gln Thr Lys Ser Phe Val
915 920 925
Arg Glu Ile Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asn Arg Tyr Tyr Met Val Pro Ile Tyr Val
945 950 955 960
Val Asp Thr Val Arg Ser Glu Leu Pro Asn Lys Ala Val Thr Ser Ser
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Ser Ile Asp Asn Ser Phe Thr Phe Lys
980 985 990
Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Ser Thr Leu Asp Ile Asn Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Ala Glu Tyr
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Ile
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Leu Val Arg Gln Glu Thr Arg Lys
1055 1060 1065
Ile Phe Lys
1070
<210> 20
<211> 27
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 20
gucauaguuc cauuaaagcc auugcug 27
<210> 21
<211> 93
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 21
acagcaaugg cuuugauguu ucuaugauaa gggcuucggc ccguggcguu ggggaucgcc 60
ugcccauuuu aaugggcuuc uccccaucua uuu 93
<210> 22
<211> 154
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 22
gagcggacag cagcuuccua uaucucguac gucauaguuc cauuaaagcc auugcugaaa 60
gacagcaaug gcuuugaugu uucuaugaua agggcuucgg cccguggcgu uggggaucgc 120
cugcccauuu uaaugggcuu cuccccaucu auuu 154
<210> 23
<211> 154
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 23
ccaugauaua gacguugugg cuguuguagu gucauaguuc cauuaaagcc auugcugaaa 60
gacagcaaug gcuuugaugu uucuaugaua agggcuucgg cccguggcgu uggggaucgc 120
cugcccauuu uaaugggcuu cuccccaucu auuu 154
<210> 24
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 24
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 25
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 25
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 26
<211> 149
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 26
nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauua aagccauugc ugaaagacag 60
caauggcuuu gauguuucua ugauaagggc uucggcccgu ggcguugggg aucgccugcc 120
cauuuuaaug ggcuucuccc caucuauuu 149
<210> 27
<211> 1072
<212> PRT
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG08290.1"
<400> 27
Met Ser Glu Leu Asp Tyr Arg Ile Gly Leu Asp Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg
20 25 30
Tyr Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys
35 40 45
Ala Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Glu Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu
85 90 95
Leu Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser
180 185 190
Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala
210 215 220
Ser Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asp Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys
290 295 300
Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Ser Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val
355 360 365
Val Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp
370 375 380
Tyr Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln
435 440 445
Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr
450 455 460
Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val
500 505 510
His Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys
515 520 525
Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys
580 585 590
Glu Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser
610 615 620
Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu
625 630 635 640
Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn
645 650 655
Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Lys Thr Tyr
660 665 670
Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln
690 695 700
Phe Lys Glu Val Glu Val Asn Leu Arg Lys Lys Arg Val Gln Thr Val
705 710 715 720
Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asn Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro
770 775 780
Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro
785 790 795 800
Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser
805 810 815
Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala
820 825 830
Ala His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys Asn Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly
900 905 910
Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln Thr Lys Ala Phe Val
915 920 925
Arg Glu Val Asn Gly Gly Val Ala Gln Asn Ser Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val
945 950 955 960
Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Lys Ser Gly
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys
980 985 990
Ser Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Leu Val Lys Gln Glu Thr Arg Arg
1055 1060 1065
Ile Phe Asn Arg
1070
<210> 28
<211> 21
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 28
gucauaguuc caugaaagcc a 21
<210> 29
<211> 85
<212> RNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 29
uggcuuugau guuucuauga uaaggguuuc ggcccguggc gucggggauc gccugcccau 60
uccgaugggc uucuccccau uuauu 85
<210> 30
<211> 140
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 30
gagcggacag cagcuuccua uaucucguac gucauaguuc caugaaagcc aaaaguggcu 60
uugauguuuc uaugauaagg guuucggccc guggcgucgg ggaucgccug cccauuccga 120
ugggcuucuc cccauuuauu 140
<210> 31
<211> 140
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 31
ccaugauaua gacguugugg cuguuguagu gucauaguuc caugaaagcc aaaaguggcu 60
uugauguuuc uaugauaagg guuucggccc guggcgucgg ggaucgccug cccauuccga 120
ugggcuucuc cccauuuauu 140
<210> 32
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(4)
<223> a, c, t, g, 未知或其他
<400> 32
nnrncc 6
<210> 33
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 33
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 34
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 34
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 35
<211> 135
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 35
nnnnnnnnnn nnnnnnnnnn nnnnngucau aguuccauga aagccaaaag uggcuuugau 60
guuucuauga uaaggguuuc ggcccguggc gucggggauc gccugcccau uccgaugggc 120
uucuccccau uuauu 135
<210> 36
<211> 1337
<212> PRT
<213> 肠球菌属(Enterococcus)的种
<220>
<221> 来源
<223> /注="APG05459.1"
<400> 36
Met Lys Lys Asp Tyr Val Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Met Thr Glu Asp Tyr Gln Leu Val Lys Lys Lys Met
20 25 30
Pro Ile Tyr Gly Asn Thr Glu Lys Lys Lys Ile Lys Lys Asn Phe Trp
35 40 45
Gly Val Arg Leu Phe Glu Glu Gly His Thr Ala Glu Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Ile Ser Arg Arg Arg Asn Arg Leu Arg
65 70 75 80
Tyr Leu Gln Ala Phe Phe Glu Glu Ala Met Thr Ala Leu Asp Glu Asn
85 90 95
Phe Phe Ala Arg Leu Gln Glu Ser Phe Leu Val Pro Glu Asp Lys Lys
100 105 110
Trp His Arg His Pro Ile Phe Ala Lys Leu Glu Asp Glu Val Ala Tyr
115 120 125
His Glu Thr Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Ser Glu Gln Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Val Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Lys Leu Ser Thr
165 170 175
Glu Asn Ile Ser Val Lys Glu Gln Phe Gln Gln Phe Met Ile Ile Tyr
180 185 190
Asn Gln Thr Phe Val Asn Gly Glu Ser Arg Leu Val Ser Ala Pro Leu
195 200 205
Pro Glu Ser Val Leu Ile Glu Glu Glu Leu Thr Glu Lys Ala Ser Arg
210 215 220
Thr Lys Lys Ser Glu Lys Val Leu Gln Gln Phe Pro Gln Glu Lys Ala
225 230 235 240
Asn Gly Leu Phe Gly Gln Phe Leu Lys Leu Met Val Gly Asn Lys Ala
245 250 255
Asp Phe Lys Lys Val Phe Gly Leu Glu Glu Glu Ala Lys Ile Thr Tyr
260 265 270
Ala Ser Glu Ser Tyr Glu Glu Asp Leu Glu Gly Ile Leu Ala Lys Val
275 280 285
Gly Asp Glu Tyr Ser Asp Val Phe Leu Ala Ala Lys Asn Val Tyr Asp
290 295 300
Ala Val Glu Leu Ser Thr Ile Leu Ala Asp Ser Asp Lys Lys Ser His
305 310 315 320
Ala Lys Leu Ser Ser Ser Met Ile Val Arg Phe Thr Glu His Gln Glu
325 330 335
Asp Leu Lys Lys Phe Lys Arg Phe Ile Arg Glu Asn Cys Pro Asp Glu
340 345 350
Tyr Asp Asn Leu Phe Lys Asn Glu Gln Lys Asp Gly Tyr Ala Gly Tyr
355 360 365
Ile Ala His Ala Gly Lys Val Ser Gln Leu Lys Phe Tyr Gln Tyr Val
370 375 380
Lys Lys Ile Ile Gln Asp Ile Ala Gly Ala Glu Tyr Phe Leu Glu Lys
385 390 395 400
Ile Ala Gln Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
405 410 415
Val Ile Pro His Gln Ile His Leu Ala Glu Leu Gln Ala Ile Ile His
420 425 430
Arg Gln Ala Ala Tyr Tyr Pro Phe Leu Lys Glu Asn Gln Glu Lys Ile
435 440 445
Glu Gln Leu Val Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ser
450 455 460
Lys Gly Asp Ala Ser Thr Phe Ala Trp Leu Lys Arg Gln Ser Glu Glu
465 470 475 480
Pro Ile Arg Pro Trp Asn Leu Gln Glu Thr Val Asp Leu Asp Gln Ser
485 490 495
Ala Thr Ala Phe Ile Glu Arg Met Thr Asn Phe Asp Thr Tyr Leu Pro
500 505 510
Ser Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Lys Phe Met
515 520 525
Val Phe Asn Glu Leu Thr Lys Ile Ser Tyr Thr Asp Asp Arg Gly Ile
530 535 540
Lys Ala Asn Phe Ser Gly Lys Glu Lys Glu Lys Ile Phe Asp Tyr Leu
545 550 555 560
Phe Lys Thr Arg Arg Lys Val Lys Lys Lys Asp Ile Ile Gln Phe Tyr
565 570 575
Arg Asn Glu Tyr Asn Thr Glu Ile Val Thr Leu Ser Gly Leu Glu Glu
580 585 590
Asp Gln Phe Asn Ala Ser Phe Ser Thr Tyr Gln Asp Leu Leu Lys Cys
595 600 605
Gly Leu Thr Arg Ala Glu Leu Asp His Pro Asp Asn Ala Glu Lys Leu
610 615 620
Glu Asp Ile Ile Lys Ile Leu Thr Ile Phe Glu Asp Arg Gln Arg Ile
625 630 635 640
Arg Thr Gln Leu Ser Thr Phe Lys Gly Gln Phe Ser Ala Glu Val Leu
645 650 655
Lys Lys Leu Glu Arg Lys His Tyr Thr Gly Trp Gly Arg Leu Ser Lys
660 665 670
Lys Leu Ile Asn Gly Ile Tyr Asp Lys Glu Ser Gly Lys Thr Ile Leu
675 680 685
Asp Tyr Leu Ile Lys Asp Asp Gly Val Ser Lys His Tyr Asn Arg Asn
690 695 700
Phe Met Gln Leu Ile Asn Asp Ser Gln Leu Ser Phe Lys Asn Ala Ile
705 710 715 720
Gln Lys Ala Gln Ser Ser Glu His Glu Glu Thr Leu Ser Glu Thr Val
725 730 735
Asn Glu Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Tyr Gln Ser
740 745 750
Leu Lys Ile Val Asp Glu Leu Val Ala Ile Met Gly Tyr Ala Pro Lys
755 760 765
Arg Ile Val Val Glu Met Ala Arg Glu Asn Gln Thr Thr Ser Thr Gly
770 775 780
Lys Arg Arg Ser Ile Gln Arg Leu Lys Ile Val Glu Lys Ala Met Ala
785 790 795 800
Glu Ile Gly Ser Asn Leu Leu Lys Glu Gln Pro Thr Thr Asn Glu Gln
805 810 815
Leu Arg Asp Thr Arg Leu Phe Leu Tyr Tyr Met Gln Asn Gly Lys Asp
820 825 830
Met Tyr Thr Gly Asp Glu Leu Ser Leu His Arg Leu Ser His Tyr Asp
835 840 845
Ile Asp His Ile Ile Pro Gln Ser Phe Met Lys Asp Asp Ser Leu Asp
850 855 860
Asn Leu Val Leu Val Gly Ser Thr Glu Asn Arg Gly Lys Ser Asp Asp
865 870 875 880
Val Pro Ser Lys Glu Val Val Lys Asp Met Lys Ala Tyr Trp Glu Lys
885 890 895
Leu Tyr Ala Ala Gly Leu Ile Ser Gln Arg Lys Phe Gln Arg Leu Thr
900 905 910
Lys Gly Glu Gln Gly Gly Leu Thr Leu Glu Asp Lys Ala His Phe Ile
915 920 925
Gln Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys Asn Val Ala Gly
930 935 940
Ile Leu Asp Gln Arg Tyr Asn Ala Asn Ser Lys Glu Lys Lys Val Gln
945 950 955 960
Ile Ile Thr Leu Lys Ala Ser Leu Thr Ser Gln Phe Arg Ser Ile Phe
965 970 975
Gly Leu Tyr Lys Val Arg Glu Val Asn Asp Tyr His His Gly Gln Asp
980 985 990
Ala Tyr Leu Asn Cys Val Val Ala Thr Thr Leu Leu Lys Val Tyr Pro
995 1000 1005
Asn Leu Ala Pro Glu Phe Val Tyr Gly Glu Tyr Pro Lys Phe Gln
1010 1015 1020
Ala Phe Lys Glu Asn Lys Ala Thr Ala Lys Thr Ile Ile Tyr Thr
1025 1030 1035
Asn Leu Met Arg Phe Phe Thr Glu Asp Glu Pro Arg Phe Met Lys
1040 1045 1050
Asp Gly Glu Ile Leu Trp Ser Asn Ser Tyr Leu Lys Asn Ile Lys
1055 1060 1065
Lys Glu Leu Asn Tyr His Gln Met Asn Ile Val Lys Lys Val Glu
1070 1075 1080
Val Gln Lys Gly Gly Phe Ser Lys Glu Ser Ile Lys Pro Lys Gly
1085 1090 1095
Pro Ser Asn Lys Leu Ile Pro Val Lys Asn Gly Leu Asp Pro Gln
1100 1105 1110
Lys Tyr Gly Gly Phe Asp Ser Pro Val Val Ala Tyr Thr Val Leu
1115 1120 1125
Phe Thr His Glu Lys Gly Lys Lys Pro Leu Ile Lys Gln Glu Ile
1130 1135 1140
Leu Gly Ile Thr Ile Met Glu Lys Thr Arg Phe Glu Gln Asn Pro
1145 1150 1155
Ile Leu Phe Leu Glu Glu Lys Gly Phe Leu Arg Pro Arg Val Leu
1160 1165 1170
Met Lys Leu Pro Lys Tyr Thr Leu Tyr Glu Phe Pro Glu Gly Arg
1175 1180 1185
Arg Arg Leu Leu Ala Ser Ala Lys Glu Ala Gln Lys Gly Asn Gln
1190 1195 1200
Met Val Leu Pro Glu His Leu Leu Thr Leu Leu Tyr His Ala Lys
1205 1210 1215
Gln Cys Leu Leu Pro Asn Gln Ser Glu Ser Leu Ala Tyr Val Glu
1220 1225 1230
Gln His Gln Pro Glu Phe Gln Glu Ile Leu Glu Arg Val Val Asp
1235 1240 1245
Phe Ala Glu Val His Thr Leu Ala Lys Ser Lys Val Gln Gln Ile
1250 1255 1260
Val Lys Leu Phe Glu Ala Asn Gln Thr Ala Asp Val Lys Glu Ile
1265 1270 1275
Ala Ala Ser Phe Ile Gln Leu Met Gln Phe Asn Ala Met Gly Ala
1280 1285 1290
Pro Ser Thr Phe Lys Phe Phe Gln Lys Asp Ile Glu Arg Ala Arg
1295 1300 1305
Tyr Thr Ser Ile Lys Glu Ile Phe Asp Ala Thr Ile Ile Tyr Gln
1310 1315 1320
Ser Thr Thr Gly Leu Tyr Glu Thr Arg Arg Lys Val Val Asp
1325 1330 1335
<210> 37
<211> 16
<212> RNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 37
guuuuagagu cauguu 16
<210> 38
<211> 74
<212> RNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 38
aacauagcaa guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg 60
cgcuuuuuuu guuu 74
<210> 39
<211> 124
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 39
gagcggacag cagcuuccua uaucucguac guuuuagagu cauguuaaag aacauagcaa 60
guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg cgcuuuuuuu 120
guuu 124
<210> 40
<211> 124
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 40
ccaugauaua gacguugugg cuguuguagu guuuuagagu cauguuaaag aacauagcaa 60
guuaaaauaa gguuuuaacc guaaucaacu guaaaguggc gcuguuucgg cgcuuuuuuu 120
guuu 124
<210> 41
<211> 3
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(1)
<223> a, c, t, g, 未知或其他
<400> 41
ngg 3
<210> 42
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 42
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 43
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 43
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 44
<211> 119
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 44
nnnnnnnnnn nnnnnnnnnn nnnnnguuuu agagucaugu uaaagaacau agcaaguuaa 60
aauaagguuu uaaccguaau caacuguaaa guggcgcugu uucggcgcuu uuuuuguuu 119
<210> 45
<211> 1436
<212> PRT
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="APG04583.1"
<400> 45
Met Ala Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly
1 5 10 15
Trp Ala Leu Val Gln Gln Asp Phe Glu Asn Lys Glu Gly Asn Ile Leu
20 25 30
Gly Met Gly Ser Arg Ile Ile Pro Met Ser Gln Asp Ile Leu Gly Glu
35 40 45
Phe Gly Lys Gly Asn Ser Ile Ser Gln Thr Ala Glu Arg Thr Gly Tyr
50 55 60
Arg Gly Val Arg Arg Leu Arg Glu Arg His Leu Leu Arg Arg Glu Arg
65 70 75 80
Leu His Arg Val Leu His Leu Leu Gly Phe Leu Pro Lys His Tyr Asp
85 90 95
Glu Lys Ile Asp Phe Thr Gln Arg Phe Gly Lys Phe Ile Asn Gln Ala
100 105 110
Glu Pro Lys Leu Ala Phe Asp Ser Glu Phe Leu Phe Lys Asp Ser Phe
115 120 125
His Glu Met Leu Ala Asp Phe Lys Gln Asn Gln Pro Glu Phe Leu Lys
130 135 140
Asp Lys Asn Gly Glu Asp Cys Leu Val Pro Tyr Asp Trp Thr Ile Tyr
145 150 155 160
Tyr Leu Arg Lys Lys Ala Leu Thr Gln Lys Ile Glu Lys Tyr Glu Leu
165 170 175
Ala Trp Leu Ile Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu
180 185 190
Arg Gly Glu Glu Glu Lys Glu Asn Pro Asn Lys Leu Val Gly Phe His
195 200 205
Ser Leu Lys Ile Val Asp Val Ile Pro Asp Ala Glu Thr Asn Lys Lys
210 215 220
Gly Glu Thr Trp Tyr Ser Leu His Leu Glu Asn Gly Trp Val Tyr Arg
225 230 235 240
Arg Ser Ser Lys Ile Ser Leu Ala Asp Trp Lys Asp Lys Val Arg Asp
245 250 255
Phe Ile Val Thr Thr Asp Leu Asn Asp Asp Gly Ser Glu Lys Leu Asp
260 265 270
Lys Asp Gly Ile Val Lys Arg Ser Phe Arg Ala Pro Ser Ala Asp Asp
275 280 285
Trp Thr Leu Leu Lys Lys Lys Thr Glu Lys Asp Ile Asp Asn Ser Asn
290 295 300
Lys Thr Val Gly Thr Tyr Ile Tyr Asp Asn Leu Leu Leu Asn Pro Lys
305 310 315 320
Gln Lys Ile Lys Gly Lys Met Val Arg Thr Ile Glu Arg Lys Phe Tyr
325 330 335
Lys Gln Glu Leu Glu Gln Ile Leu Lys Thr Gln Lys Glu Phe His Ser
340 345 350
Glu Leu Gln Ser Glu Asn Leu Leu Gln Asp Cys Val Arg Glu Leu Tyr
355 360 365
Arg Asn Asn Glu Gln His Gln Gln Met Leu Glu Ala Lys Asp Phe Val
370 375 380
His Leu Phe Leu Asn Asp Ile Ile Phe Tyr Gln Arg Pro Leu Arg Ser
385 390 395 400
Gln Lys Ser Ser Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Ser Lys
405 410 415
Asn Glu Asn Gly Glu Glu Val Ile His Arg Leu Lys Val Ile Ala Lys
420 425 430
Ser Asn Pro Tyr Tyr Gln Glu Phe Arg Leu Leu Gln Trp Val Gln Asn
435 440 445
Leu Ala Ile Tyr Thr Lys Asp Asp Asp Lys Asn Val Thr Asn Glu Phe
450 455 460
Leu Lys Ser Thr Gln Asp Trp Glu Asp Leu Leu Arg Trp Leu His Ser
465 470 475 480
Lys Lys Glu Ile Lys Gln Asp Ala Leu Ile Lys Phe Leu Ile Glu Lys
485 490 495
Lys Gly Leu Lys Gly Lys Ala Leu Thr Ile Glu Val Ala Lys Tyr Arg
500 505 510
Trp Asn Tyr Val Gln Asp Lys Asp Tyr Pro Gly Asn Glu Thr Arg Tyr
515 520 525
Leu Ile Gln Ser Arg Leu Asp Lys Val Glu Tyr Ala Pro Lys Asp Phe
530 535 540
Leu Thr Tyr Glu Asn Glu Met Ala Leu Trp His Ile Ile Tyr Ser Ile
545 550 555 560
Asn Asp Lys Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Asn Lys
565 570 575
Lys Gly Leu Asp Glu Val Thr Phe Val Glu Ala Phe Lys Lys Phe Pro
580 585 590
Pro Phe Lys Ser Asp Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys Lys
595 600 605
Leu Leu Pro Leu Met Arg Phe Gly Thr Gln Trp Asn Trp Asp Asn Ile
610 615 620
Asp Gln Asn Ser Lys Glu Arg Ile Gly Lys Ile Leu Thr Gly Glu Tyr
625 630 635 640
Asp Glu Asn Ile Lys Gly Arg Val Arg Glu Lys Ala Arg His Leu Asn
645 650 655
Ser Glu Thr Asp Phe Gln Ala Leu Pro Leu Trp Leu Ala Gln Tyr Val
660 665 670
Val Tyr Gly Arg His Ser Glu Ala Asp Ile Ala Gly Lys Trp Asn Ser
675 680 685
Val Asp Asp Leu Lys Gln Phe Leu Asp Asp Phe Lys Gln His Ser Leu
690 695 700
Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Ala Val
705 710 715 720
Lys Asp Ile Trp Asn Phe Tyr Gly Lys Gly Ala Lys Asp Phe Phe Ser
725 730 735
Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Asn Thr Ala Asp Glu
740 745 750
Arg Lys Arg Ile Thr Thr Met Val Thr Asp Asn Glu Asn Thr Asn Leu
755 760 765
Arg Ile Lys Ala Leu Leu Ala Glu Met Ala Leu Asp Gln Asn Val Asp
770 775 780
Asn Val Arg Pro Tyr Ser Pro Met Gln Gln Glu Ile Leu Lys Ile Tyr
785 790 795 800
Glu Glu Gly Val Leu Asn Ala Glu Glu Asn Ile Asp Asp Asp Ile Leu
805 810 815
Lys Ile Ser Lys Thr Ala Gln Pro Ser Ala Thr Asp Leu Lys Arg Tyr
820 825 830
Lys Leu Trp Leu Glu Gln Lys Tyr Arg Ser Pro Tyr Thr Gly Gln Met
835 840 845
Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His Ile
850 855 860
Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Met Ser Asn Lys Val Ile
865 870 875 880
Cys Glu Ala Ala Val Asn Lys Leu Lys Asp Asn Gln Ile Gly Leu Val
885 890 895
Phe Ile Lys Asn His His Gly Glu Val Val Asp Phe Gly Met Gly Lys
900 905 910
Gln Val Lys Ile Leu Glu Val Ser Asp Tyr Glu Asp Phe Val Lys Gln
915 920 925
Asn Tyr Asn Lys Asn Arg Gly Lys Arg Asn Lys Leu Leu Leu Glu Asp
930 935 940
Ile Pro Glu Lys Met Ile Glu Arg Gln Leu Asn Asp Thr Arg Tyr Ile
945 950 955 960
Ser Lys Tyr Ile Thr Gln Val Leu Ser Asn Ile Val Arg Asp Asp Lys
965 970 975
Glu Gly Ser Lys Asp Asp Gly Val Asn Ser Lys Asn Ile Val Pro Gly
980 985 990
Asn Gly Lys Ile Thr Thr Arg Leu Lys Gln Asp Trp Gly Leu Asn Asp
995 1000 1005
Val Trp Asn Asp Leu Val Leu Pro Arg Phe Glu Arg Met Asn Thr
1010 1015 1020
Leu Thr Asn Ser Asn Asp Phe Thr Ser Lys Asn Thr His Gly Lys
1025 1030 1035
Thr Ile Pro Thr Val Pro Ile Glu Leu Ser Lys Gly Phe Ser Lys
1040 1045 1050
Lys Arg Ile Asp His Arg His His Ala Met Asp Ala Leu Val Ile
1055 1060 1065
Ala Cys Ala Thr Arg Asp His Val Asn Leu Leu Asn Asn Glu Ser
1070 1075 1080
Ser Lys Ser Asp Thr Lys Arg Tyr Asp Leu Asn Arg Lys Leu Arg
1085 1090 1095
Lys Tyr Glu Lys Val Ala Tyr Asn Asp Pro Lys Thr Gly Glu Arg
1100 1105 1110
Ile Glu Lys Glu Val Pro Lys Asp Phe Ile Lys Pro Trp Glu Thr
1115 1120 1125
Phe Thr Glu Asp Thr Arg Thr Leu Leu Glu Asn Ile Val Ile Ser
1130 1135 1140
Phe Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr
1145 1150 1155
Glu Lys Ile Glu Asn Gly Lys Lys Val Lys Val Glu Gln Lys Gly
1160 1165 1170
Ile Asn Trp Ala Val Arg Lys Ala Leu His Lys Glu Thr Val Ser
1175 1180 1185
Gly Gln Val His Leu Asp Arg Ile Lys Val Ala Lys Gly Lys Ile
1190 1195 1200
Leu Thr Ala Thr Arg Lys Thr Leu Asp Ala Ser Phe Asn Glu Lys
1205 1210 1215
Thr Ile Glu Ser Ile Thr Asp Thr Gly Ile Gln Lys Ile Leu Leu
1220 1225 1230
Asn Tyr Leu Lys Ser Lys Asp Asn Asn Pro Glu Val Ala Phe Ser
1235 1240 1245
Pro Glu Gly Ile Glu Glu Leu Asn Lys Asn Ile Arg Leu Tyr Asn
1250 1255 1260
Asp Gly Lys Ala His Gln Pro Ile Leu Lys Val Arg Val Phe Glu
1265 1270 1275
Gln Gly Ser Lys Phe Thr Leu Gly Glu Thr Gly Asn Lys Thr Thr
1280 1285 1290
Lys Phe Val Glu Ala Ala Lys Gly Thr Asn Leu Phe Phe Gly Ile
1295 1300 1305
Tyr Glu Asp Lys Ser Gly Lys Arg Ser Tyr Glu Thr Ile Pro Leu
1310 1315 1320
Asn Ile Val Ile Glu Arg Gln Lys Gln Gly Leu Gln Ala Val Pro
1325 1330 1335
Glu Thr Asn Glu Lys Gly Lys Gln Leu Leu Phe Thr Leu Ser Pro
1340 1345 1350
Asn Asp Leu Val Tyr Val Pro Glu Glu Gly Val Phe Asp Glu Asn
1355 1360 1365
Asn Ile Lys Val Asp Arg Ile Tyr Lys Val Val Ser Phe Ser Thr
1370 1375 1380
Tyr Gln Cys Phe Phe Val Arg Asn Asp Val Ser Thr Ser Val Val
1385 1390 1395
Asn Lys Val Glu Tyr Ser Ala Leu Asn Lys Met Glu Lys Ser Ile
1400 1405 1410
Asp Asn Ile Met Ile Lys Glu Asn Cys Val Lys Leu Asn Val Asp
1415 1420 1425
Arg Leu Gly Lys Ile Ser Lys Ala
1430 1435
<210> 46
<211> 16
<212> RNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 46
guugugaguu ccuuuc 16
<210> 47
<211> 78
<212> RNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 47
gaaaggaacu cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu 60
cggggcuuuu uuauuuuu 78
<210> 48
<211> 128
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 48
gagcggacag cagcuuccua uaucucguac guugugaguu ccuuucacuu gaaaggaacu 60
cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu cggggcuuuu 120
uuauuuuu 128
<210> 49
<211> 128
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 49
ccaugauaua gacguugugg cuguuguagu guugugaguu ccuuucacuu gaaaggaacu 60
cacaauaagg auuauuccgu ugugaaaaca uuuagcgccu cgacuaucuu cggggcuuuu 120
uuauuuuu 128
<210> 50
<211> 7
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<400> 50
nnraaty 7
<210> 51
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 51
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 52
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 52
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 53
<211> 123
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 53
nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaguuccuuu caaaggaaag gaacucacaa 60
uaaggauuau uccguuguga aaacauuuag cgccucgacu aucuucgggg cuuuuuuauu 120
uuu 123
<210> 54
<211> 1456
<212> PRT
<213> 稳杆菌属(Empedobacter)的种
<220>
<221> 来源
<223> /注="APG01688.1"
<400> 54
Met Met Ile Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile
1 5 10 15
Gly Trp Ala Leu Ile Lys Gln Asp Phe Glu Asn Lys His Gly Glu Ile
20 25 30
Leu Gly Met Gly Ser Arg Ile Ile Pro Met Ser Gln Asp Ile Leu Gly
35 40 45
Asp Phe Gly Lys Gly Asn Ser Ile Ser Gln Thr Ala Asp Arg Thr Lys
50 55 60
Tyr Arg Ser Val Arg Arg Leu Arg Glu Arg Phe Leu Leu Arg Arg Glu
65 70 75 80
Arg Leu His Arg Val Leu His Leu Leu Asn Phe Leu Pro Gln His Tyr
85 90 95
Ala Ser Gln Ile Asp Phe Glu Lys Lys Phe Gly Lys Phe Lys Ser Glu
100 105 110
Thr Glu Pro Lys Leu Ala Trp Glu Asn Trp Gly Gly Lys Phe Ser Phe
115 120 125
Leu Phe Gln Asn Ser Phe Asn Glu Met Leu Glu Asp Phe Lys Ala Ala
130 135 140
Gly Gln Gly Leu Lys Ile Pro Tyr Asp Trp Thr Ile Tyr Tyr Leu Arg
145 150 155 160
Lys Lys Ala Leu Ser Gln Lys Ile Glu Lys Glu Glu Leu Ala Trp Ile
165 170 175
Leu Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu Arg Gly Glu
180 185 190
Glu Glu Glu Glu Asn Pro Asn Lys Leu Val Glu Phe Tyr Ser Leu Lys
195 200 205
Ile Val Asp Val Val Ala Asp Glu Pro Gln Lys Gly Lys Ser Asp Ile
210 215 220
Trp Tyr Ser Leu Ile Leu Glu Asn Gly Trp Val Tyr Arg Arg Ala Ser
225 230 235 240
Lys Ile Pro Leu Phe Asp Trp Lys Asp Lys Thr Arg Asp Phe Ile Val
245 250 255
Thr Thr Asp Leu Asn Asp Asp Arg Ser Val Lys Thr Asp Lys Glu Gly
260 265 270
Asn Glu Lys Arg Ser Phe Arg Ala Pro Ser Glu Asn Asp Trp Thr Leu
275 280 285
Val Lys Lys Lys Thr Glu Gln Glu Ile Asp Gln Ser His Lys Thr Val
290 295 300
Gly Thr Tyr Ile Tyr Glu Thr Leu Leu Leu Asn Pro Lys Gln Lys Ile
305 310 315 320
Lys Gly Lys Leu Val Arg Thr Ile Glu Arg Lys Phe Tyr Lys Asp Glu
325 330 335
Leu Lys Gln Ile Leu Glu Lys Gln Lys Glu Phe His Gln Glu Leu Lys
340 345 350
Asn Asp Asp Leu Tyr Asn Asp Cys Ile Arg Glu Leu Tyr Arg Asn Asn
355 360 365
Glu Ala His Gln Leu Thr Leu Ser Lys Lys Asp Phe Val His Leu Leu
370 375 380
Met Asp Asp Leu Ile Phe Tyr Gln Arg Pro Leu Arg Ser Gln Lys Ser
385 390 395 400
Ser Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Tyr Lys Asp Glu Asn
405 410 415
Gly Ile Glu His Thr Gln Tyr Leu Lys Ala Ile Pro Lys Ser Asn Pro
420 425 430
Tyr Tyr Gln Glu Phe Arg Leu Trp Gln Trp Met Tyr Asn Leu Asn Ile
435 440 445
Tyr Arg Lys Asp Asp Glu Ala Asn Val Thr Lys Glu Phe Leu Asn Thr
450 455 460
Asn Lys Asp Phe Glu Ser Leu Phe Glu Phe Leu Asn Asn Arg Lys Glu
465 470 475 480
Ile Glu Gln Lys Pro Leu Ile Lys Phe Leu Leu Glu Gln Lys Asp Ile
485 490 495
Asn Lys Lys Leu Leu Asn Ala Glu Ala Glu Lys Tyr Arg Trp Asn Tyr
500 505 510
Val Glu Asp Lys Lys Tyr Pro Cys Asn Glu Thr Lys Thr Met Ile Ser
515 520 525
Ser Arg Leu Asp Lys Val Glu Asn Ile Ser Asp Asp Phe Leu Thr Arg
530 535 540
Asp Ile Glu Gln Lys Ile Trp His Ile Ile Tyr Ser Val Asn Asp Lys
545 550 555 560
Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Thr Arg Asn Asp Leu
565 570 575
Asp Glu Asn Ser Phe Ile Glu Ala Phe Lys Lys Phe Ser Pro Phe Lys
580 585 590
Ser Glu Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys Lys Leu Leu Pro
595 600 605
Leu Met Arg Leu Gly Lys Tyr Trp Tyr Glu Asp Glu Ile Val Lys His
610 615 620
Ser Asp Ile Tyr Phe Lys Asn Ile Glu Asn Leu Leu Gly Asp Phe Ser
625 630 635 640
Asn Arg Asp Lys Lys Ile Ser Glu Glu Asp Lys Glu Lys Trp Asn Lys
645 650 655
Ser Ile Asn Leu Lys Leu Gln Glu Glu Leu Lys Asp Phe Gln Thr Ala
660 665 670
Glu Ile Asp Leu Phe Gln Gly Leu Arg Leu His Ile Ala Gln Tyr Leu
675 680 685
Val Tyr Gly Arg His Ser Glu Ala Ser Met Ile Gly Lys Trp Asn Ser
690 695 700
Ala Glu Asp Leu Glu Glu Phe Leu Lys Asp Phe Lys Gln His Ser Leu
705 710 715 720
Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Val Val
725 730 735
Lys Asp Ile Trp Leu Lys Tyr Gly Asn Gly Ala Lys Asp Phe Phe Asn
740 745 750
Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Leu Pro Ala Asp Asp
755 760 765
Arg Lys Lys Leu Thr Asn Gln Ile Ser Glu Asn Glu Asn Thr Asn Phe
770 775 780
Arg Ile Lys Ala Leu Leu Ala Glu Met Met Asn Asp Ser Ser Val Glu
785 790 795 800
Asn Val Arg Pro Phe Ser Pro Met Gln Gln Glu Ile Leu Lys Ile Tyr
805 810 815
Glu Asp Asp Val Leu Lys Ser Asp Ile Glu Ile Glu Asp Asp Ile Leu
820 825 830
Lys Ile Ser Lys Thr Ala Gln Pro Ser Pro Ser Asp Leu Lys Arg Tyr
835 840 845
Lys Leu Trp Leu Glu Gln Lys Tyr Lys Ser Pro Tyr Thr Gly Gln Ile
850 855 860
Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His Ile
865 870 875 880
Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Phe Ser Asn Lys Val Ile
885 890 895
Cys Glu Ser Ala Val Asn Lys Leu Lys Asp Asn Tyr Ile Gly Leu Glu
900 905 910
Phe Ile Lys Gln Phe Gly Gly Thr Ile Ile Glu Leu Gly Phe Gly Lys
915 920 925
Ser Ile Lys Val Phe Glu Thr Lys Glu Tyr Glu Asp Phe Val Lys Lys
930 935 940
His Tyr Ala Asn Asn Gln Gly Lys Arg Asn Lys Leu Leu Met Glu Asp
945 950 955 960
Ile Pro Glu Lys Met Ile Glu Arg Gln Met Asn Asp Thr Arg Tyr Ile
965 970 975
Ser Lys Tyr Ile Ser Gly Val Leu Ser Asn Ile Val Arg Val Glu Asp
980 985 990
Gly Ser Asp Glu Gly Val Asn Ser Lys Asn Ile Val Pro Gly Asn Gly
995 1000 1005
Lys Ile Thr Thr Gln Leu Lys Gln Asp Trp Gly Leu Asn Asp Val
1010 1015 1020
Trp Asn Asp Leu Ile Leu Pro Arg Phe Glu Arg Met Asn Gln Leu
1025 1030 1035
Thr Asn Ser Lys Val Phe Thr Ala Trp Asn Glu Asn Tyr Gln Lys
1040 1045 1050
Phe Leu Pro Thr Val Pro Ile Glu Tyr Ser Lys Gly Phe Ser Lys
1055 1060 1065
Lys Arg Ile Asp His Arg His His Ala Leu Asp Ala Leu Val Ile
1070 1075 1080
Ala Cys Ala Thr Lys Asp His Val Asn Leu Leu Asn Asn Gln Ser
1085 1090 1095
Ala Lys Ser Asp Thr Lys Arg Tyr Asp Leu Lys Lys Lys Ser Met
1100 1105 1110
Lys Phe Glu Lys Val Val Tyr Asn Asp Ala Lys Thr Gly Glu Lys
1115 1120 1125
Ile Glu Arg Glu Val Pro Lys Gln Phe Leu Lys Pro Trp Glu Asn
1130 1135 1140
Phe Thr Leu Asp Val Lys His Asn Leu Glu Thr Ile Ile Val Ser
1145 1150 1155
Phe Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr
1160 1165 1170
Glu Lys Tyr Val Glu Lys Asp Gly Thr Lys Asn Lys Glu Arg Val
1175 1180 1185
Glu Gln Thr Gly Thr Asn Trp Ala Ile Arg Lys Pro Met His Lys
1190 1195 1200
Asp Thr Val Ser Gly Lys Val Asp Leu Pro Trp Val Lys Val Pro
1205 1210 1215
Lys Gly Lys Ile Leu Thr Ala Thr Arg Lys Ser Leu Asp Ser Ser
1220 1225 1230
Phe Asp Leu Lys Ser Ile Gly Ser Ile Thr Asp Thr Gly Ile Gln
1235 1240 1245
Lys Ile Leu Lys Asn Tyr Leu Ala Phe Lys Asp Gly Asn Pro Glu
1250 1255 1260
Leu Ala Phe Ser Pro Glu Gly Ile Asp Asp Leu Asn Lys Asn Ile
1265 1270 1275
Glu Lys Tyr Asn Asp Gly Lys Pro His Gln Pro Ile Asn Lys Val
1280 1285 1290
Arg Val Phe Glu Leu Gly Ser Lys Phe Gln Val Gly Gln Ser Gly
1295 1300 1305
Asn Lys Lys Asp Lys Tyr Val Glu Ala Ala Lys Gly Thr Asn Leu
1310 1315 1320
Phe Phe Ala Val Tyr Glu Asp Glu Lys Gly Lys Arg Asn Tyr Glu
1325 1330 1335
Thr Ile Pro Leu Asn Glu Val Ile Glu Arg Gln Lys Gln Gly Leu
1340 1345 1350
Ser Val Val Asp Leu Lys Gly Thr Asn Asp Phe Tyr Leu Cys Pro
1355 1360 1365
Asn Asp Phe Val Tyr Ile Pro Ser Gly Asp Glu Leu Glu Asn Ile
1370 1375 1380
Asn Asn Val Asp Phe Lys Asp Ile Lys Lys Glu Ile Asn Glu Arg
1385 1390 1395
Ile Tyr Lys Val Val Ser Phe Thr Gly Asn Arg Leu Ser Cys Ile
1400 1405 1410
Pro Tyr Met Val Ala Thr Thr Ile Val Asn Lys Leu Glu Phe Thr
1415 1420 1425
Gln Leu Asn Lys Ile Glu Phe Thr Lys Glu Lys Glu Ile Cys Ile
1430 1435 1440
Lys Leu Asn Val Asp Arg Leu Gly Asn Ile Ser Lys Ala
1445 1450 1455
<210> 55
<211> 18
<212> RNA
<213> 稳杆菌属的种
<220>
<221> 来源
<223> /注="crRNA"
<400> 55
guugugaauu gcuuucaa 18
<210> 56
<211> 75
<212> RNA
<213> 稳杆菌属的种
<220>
<221> 来源
<223> /注="tracrRNA"
<400> 56
uugaaaagca auucacaaua aggauuauuc cguugugaaa acauucaagg cggggcaacu 60
cgucuuuuuu cuuuu 75
<210> 57
<211> 127
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L1"
<400> 57
gagcggacag cagcuuccua uaucucguac guugugaauu gcuuucaaaa aguugaaaag 60
caauucacaa uaaggauuau uccguuguga aaacauucaa ggcggggcaa cucgucuuuu 120
uucuuuu 127
<210> 58
<211> 127
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA L2"
<400> 58
ccaugauaua gacguugugg cuguuguagu guugugaauu gcuuucaaaa aguugaaaag 60
caauucacaa uaaggauuau uccguuguga aaacauucaa ggcggggcaa cucgucuuuu 120
uucuuuu 127
<210> 59
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(5)
<223> a, c, t, g, 未知或其他
<400> 59
nnrnnc 6
<210> 60
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库1的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 60
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 61
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="质粒文库2的靶序列和PAM区域"
<220>
<221> 修饰的_碱基
<222> (31)..(38)
<223> a, c, t, g, 未知或其他
<400> 61
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 62
<211> 122
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="带有N's的sgRNA"
<220>
<221> 修饰的_碱基
<222> (1)..(25)
<223> a, c, u, g, 未知或其他
<400> 62
nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaauugcuuu caaaaaguug aaaagcaauu 60
cacaauaagg auuauuccgu ugugaaaaca uucaaggcgg ggcaacucgu cuuuuuucuu 120
uu 122
<210> 63
<211> 4
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="4bp接头"
<400> 63
aaag 4
<210> 64
<211> 4
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="4bp接头"
<400> 64
gaaa 4
<210> 65
<211> 4
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="4bp接头"
<400> 65
acuu 4
<210> 66
<211> 6
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="6bp接头"
<400> 66
caaagg 6
<210> 67
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<220>
<221> 来源
<223> /注="NLS"
<400> 67
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 68
<211> 6
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="tracrRNA发夹茎的碱基中的保守序列"
<220>
<221> 修饰的_碱基
<222> (2)..(2)
<223> a, c, u, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(5)
<223> a, c, u, g, 未知或其他
<400> 68
unanng 6
<210> 69
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="APG05083.1/示例性PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(4)
<223> a, c, t, g, 未知或其他
<400> 69
nnrncc 6
<210> 70
<211> 7
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="APG07433.1/示例性PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(4)
<223> a, c, t, g, 未知或其他
<400> 70
nnnnccr 7
<210> 71
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="APG07513.1/示例性PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(4)
<223> a, c, t, g, 未知或其他
<400> 71
nnrncc 6
<210> 72
<211> 6
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="APG01688.1/示例性PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(2)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (5)..(5)
<223> a, c, t, g, 未知或其他
<400> 72
nnranc 6
<210> 73
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 73
gagcggacag cagcttccta tatctcgtac 30
<210> 74
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 74
gagcggacag cagcttccta tatctcgtag 30
<210> 75
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 75
gagcggacag cagcttccta tatctcgttc 30
<210> 76
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 76
gagcggacag cagcttccta tatctcgaac 30
<210> 77
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 77
gagcggacag cagcttccta tatctcctac 30
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 78
gagcggacag cagcttccta tatctggtac 30
<210> 79
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 79
gagcggacag cagcttccta tatcacgtac 30
<210> 80
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 80
gagcggacag cagcttccta tatgtcgtac 30
<210> 81
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 81
gagcggacag cagcttccta taactcgtac 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 82
gagcggacag cagcttccta tttctcgtac 30
<210> 83
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 83
gagcggacag cagcttccta aatctcgtac 30
<210> 84
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 84
gagcggacag cagcttcctt tatctcgtac 30
<210> 85
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 85
gagcggacag cagcttccaa tatctcgtac 30
<210> 86
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 86
gagcggacag cagcttcgta tatctcgtac 30
<210> 87
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 87
gagcggacag cagcttgcta tatctcgtac 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 88
gagcggacag cagctaccta tatctcgtac 30
<210> 89
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 89
gagcggacag cagcatccta tatctcgtac 30
<210> 90
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 90
gagcggacag caggttccta tatctcgtac 30
<210> 91
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 91
gagcggacag caccttccta tatctcgtac 30
<210> 92
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 92
gagcggacag ctgcttccta tatctcgtac 30
<210> 93
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 93
gagcggacag gagcttccta tatctcgtac 30
<210> 94
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 94
gagcggacac cagcttccta tatctcgtac 30
<210> 95
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 95
gagcggactg cagcttccta tatctcgtac 30
<210> 96
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 96
gagcggagag cagcttccta tatctcgtac 30
<210> 97
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 97
gagcggtcag cagcttccta tatctcgtac 30
<210> 98
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 98
gagcgcacag cagcttccta tatctcgtac 30
<210> 99
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 99
gagccgacag cagcttccta tatctcgtac 30
<210> 100
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 100
gaggggacag cagcttccta tatctcgtac 30
<210> 101
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 101
gaccggacag cagcttccta tatctcgtac 30
<210> 102
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 102
gtgcggacag cagcttccta tatctcgtac 30
<210> 103
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表4"
<400> 103
cagcggacag cagcttccta tatctcgtac 30
<210> 104
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 104
gagcggacag cagcttccta tatctcgtat 30
<210> 105
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 105
gagcggacag cagcttccta tatctcgtgc 30
<210> 106
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 106
gagcggacag cagcttccta tatctcgcac 30
<210> 107
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 107
gagcggacag cagcttccta tatctcatac 30
<210> 108
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 108
gagcggacag cagcttccta tatcttgtac 30
<210> 109
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 109
gagcggacag cagcttccta tatcccgtac 30
<210> 110
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 110
gagcggacag cagcttccta tatttcgtac 30
<210> 111
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 111
gagcggacag cagcttccta tacctcgtac 30
<210> 112
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 112
gagcggacag cagcttccta tgtctcgtac 30
<210> 113
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 113
gagcggacag cagcttccta catctcgtac 30
<210> 114
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 114
gagcggacag cagcttcctg tatctcgtac 30
<210> 115
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 115
gagcggacag cagcttccca tatctcgtac 30
<210> 116
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 116
gagcggacag cagcttctta tatctcgtac 30
<210> 117
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 117
gagcggacag cagctttcta tatctcgtac 30
<210> 118
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 118
gagcggacag cagctcccta tatctcgtac 30
<210> 119
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 119
gagcggacag cagcctccta tatctcgtac 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 120
gagcggacag cagtttccta tatctcgtac 30
<210> 121
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 121
gagcggacag caacttccta tatctcgtac 30
<210> 122
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 122
gagcggacag cggcttccta tatctcgtac 30
<210> 123
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 123
gagcggacag tagcttccta tatctcgtac 30
<210> 124
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 124
gagcggacaa cagcttccta tatctcgtac 30
<210> 125
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 125
gagcggacgg cagcttccta tatctcgtac 30
<210> 126
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="错配修复表6"
<400> 126
gagcggatag cagcttccta tatctcgtac 30
<210> 127
<211> 3210
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05083.1哺乳动物密码子优化的序列"
<400> 127
atgagagagc tggattaccg gatcggcctg gatatcggga ccaactccat tggatggggc 60
atcatcgagc tgtcttggaa caaagacaga gaacagtacg agaaggcaag aatcgtggac 120
aagggcgtga gaatgttcga caaggccgaa atacccaaga ccggagccag cctggccgag 180
cctagaagaa ttgccagatc aagcagaaga cggctcaaca gaaagtctca gagaaaaaaa 240
gatattcgga acctgctggt ccagcacgag atcatcagcc aaaaggaact cgctagcctg 300
tatcctctga ccaagagcag catggacatt tgggacatca gactggacgg cctggacaga 360
ctgctggata gattcgagtg gaccagattg ctgatccacc tggctcagcg gagaggcttc 420
aaaagcaacc ggaagagcga gctgaaggac gtggaaaccg gcaaggtgct ctccagcatc 480
caggctaatg agaagcggct gtccctgtac agaactgtgg gcgagatgtg gatgaagaat 540
gaagatttta gcaagtacga caaaagaaga aatagtagca acgaatacgt gttctctgtg 600
tcccgggccg acctggaaaa ggaaatcgtg acactgtttg aagctcagcg gaagttccag 660
agcagctatg ccagcgccga tcttcaaaaa acctacctcc agatctgggc ccatcaactg 720
cctttcgcct ctggcaacgc catcgttaac aaggtgggct actgcagcct actgaaaggc 780
aaggagaaga gagttcctaa ggccacctac accttccaat acttcagcac cctggatcag 840
atcaacagaa ccagactggg cccaaacttc cagcccttca ccaaggaaca gagagatgtg 900
atcctggacg agatgtttaa ccggaccgat tattacaaga agaagaccat ccctgaggtg 960
acgtactacg atatcagaaa atggctggcc ctggacgaga caatccagtt caagggcctg 1020
acctacgacc ctaatgaaga actgaagaaa attgagctaa agtcttttat caatctgaag 1080
cctttctacg agataaagaa ggtggtgaca aactacgcca agaagacaaa tgaggccttt 1140
agcacactgg actatgacac ctttgcctac gccctgacag tgtacaagac cgacaaggac 1200
atccgctcct acctgaaaaa gagtaacaac ctgtccaaat gctgctacga cgaccaactg 1260
atcgaggaat tgctgacact gagctacacc aaattcggcc acctgagctt caaggctatc 1320
aaccacgttc tgcctatcat gcaggagggc agaacctacc aggaggccat tcaccagctc 1380
ggctacgatg ccacaaacct caaaaaagag aaccggtcta tgttcctgcc tctgttccct 1440
gacgagatca ccaaccccat cgtgaagagg gccctgaccc aggccaggaa ggtggtcaac 1500
gccatcatca gacgatacgg gtctccaaac agcgtgcaca tcgagctggc cagagagctg 1560
agcaagagcc acgacgagag aacaaagatc atgaaagctc atgatgaaaa ctacaaaaag 1620
aacaagggcg ctatcagcat cctgatcgag aacggtattc tgaatcctac aggttatgac 1680
atcgtccggt acaagctgtg gaaggaacag ggcgagagat gcgcctattc tctgaaacag 1740
atccccgcca acaccttctt caacgaaatg aagaaggagc ggtccggcag ccctgtgctg 1800
gaaatcgatc acatcctgcc ctacagccag agcttcatcg acagctacca caacaaagtg 1860
ctggtgtacg gggatgagaa ccagaaaaag ggcaatagaa tcccgtacac ctacttcctg 1920
gaaggcaaca aggactggga gtctttcgag agctatgtgc gcctgaactc ctttttcagc 1980
aagaaaaagc gaggatatct gctgaagaag gcttacctgc caagagagag taacatgatc 2040
aaggaacggc acctcaacga cacccggtac gccagctcct acctgaagaa cttcatcgag 2100
aagaatctga agttcaagga ggtggaaggc tctacccgga agaagcacgt gcaaaccgtg 2160
aacggcataa tcacagccca cctgagaaag agatggggcc tggaaaagga ccgccaggag 2220
acatatcttc atcacgctat ggacgccatc atcgtggcat gcaccgacca ccacatggtg 2280
acaaaggtga ccgagtacta ccagatcaaa gaaagcaata aatctattag aaagccttac 2340
ttccccctgc cttgggtggg ctttagagag gaaattctgt cccacctggc tcggcagcct 2400
atcgccagaa agatctctga agagctgaag atcggatacc agagcttcga ttacatcctc 2460
gtgtctagaa tgcctaaaag atcagtgacc ggcgccgccc acgagcagac cattatgaaa 2520
aagggaggca tcgacaaaaa aggaaaaacc atcatcatta agcgggtcta cctgaaggat 2580
atcaagttcg acgagaatgg cgatttcaag atggttggaa aggaacagga cctggctacc 2640
tacgaggcca tcaagcagag atacatcgag tacggcaagg aatccaagaa ggccttcgag 2700
acccctctgt ataagcccag caagaaaggc aaaggcaacc tgatcaagaa gatcaaagtg 2760
gaagtgcaaa ccaagagctt tgtgagagaa gtcaacggcg gagtggccca gaacggcgat 2820
ctggtgcggg ttgacctgtt cgagaaggat aatagatact acatgatccc catctacgtg 2880
atggataccg tgcacagcga acttcctaac aaggccgtga ccagcagcaa aggctatgag 2940
caatggctga ccatcgacaa cagcttcacc ttcaagttca gcctataccc ctacgacctg 3000
gtgcggctgg tcaagggtaa cgaggacaga ttcctgtact tttccaccct ggatattaac 3060
agtgatagac tcaacttcaa agacgtcaac aagcccagca agcaggccga gaacagatat 3120
agcctgaaga caatcgaaaa cctggaaaaa tacgaggtgg gcgtcctggg cgacctcaga 3180
tttgtgagac aggagatcag aaagaacttc 3210
<210> 128
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07433.1哺乳动物密码子优化的序列"
<400> 128
atgagagagc tggactacag aattggcctg gacatcggca ccaacagcat cggatggggc 60
gtgatcgagc tgtcctggaa caaagaccgg gagagatacg agaaggtcag aatcgtggat 120
caaggcgtga gaatgttcga cagagccgag atgcccaaga caggcgccag cttagctgaa 180
cccagaagaa tcgccagatc cagcagacgg agactgaatc gcaagtccca gagaaagaaa 240
aacatccgga acctgctggt gcaacacggc gtgatcacac aggaggaact ggatagcctg 300
taccccctga gcaaaaagag catggacatc tggggcattc ggctcgacgg cctggacaga 360
ctcctcaatc atttcgagtg ggccagactg ctgatccacc tggctcagag acggggcttt 420
aagtccaaca gaaagagtga actgaaagat acagagacag gcaaggtgct gagcagcatc 480
caactgaacg agaaacggct gagcttgtat agaaccgtgg gcgagatgtg gatgaaggac 540
cccgacttct ctaaatacga taggaagaga aatagcccca acgaatacgt gttcagcgtg 600
tctagagccg agctggaaaa ggaaatcgtg accctgttcg ccgcccagcg gagattccag 660
agcccttacg ccagcaaaga tctgcaggag acatatctgc agatctggac ccaccaactg 720
cctttcgcca gcggcaatgc catcctgaac aaggtcggat actgctccct gttgaaaggc 780
aaagaaagaa ggattcccaa ggctacatac accttccaat acttctctgc tctggaccag 840
gtgaatcgga ccagactggg acctgatttc cagcccttca ccaaggagca acgggaaatt 900
atcttgaaca acatgttcca gaggacagat tactacaaga agaaaaccat ccccgaggtg 960
acctactatg acatacggaa gtggctggaa ttggacgaga caattcagtt caagggcctg 1020
aactacgacc ctaacgagga actgaagaag atcgagaaga agccttttat caatctgaag 1080
gccttctacg agatcaacaa ggtggtggcc aactacagcg aaagaaccaa cgagaccttc 1140
tccaccctgg actacgacgg catcggctac gccctgaccg tgtacaaaac cgacaaggat 1200
atccgcagct acctgaagag cagtcacaac ctacctaaga gatgctacga cgaccaactg 1260
atcgaggaac tgctgagcct gagctacaca aagttcggcc acctgtccct gaaagccatc 1320
aaccacgtgc tgtctatcat gcagaagggc aatacctaca aggaagccgt ggaccaactg 1380
ggctacgaca ccagcggcct taagaaggag aagaggtcca agttcctgcc acctatttct 1440
gatgaaatca cgaatccaat cgtgaaaagg gccctgaccc aggccagaaa agtggtgaac 1500
gccataatta gaagacacgg atctcctcac tccgtgcaca tcgagctggc cagagagctg 1560
agcaagaacc acgacgagcg gacaaagatc gtcagcgccc aggatgaaaa ctacaagaaa 1620
aacaagggcg ctatcagcat cctgtctgag cacggcatcc tgaaccctac aggctacgac 1680
atcgtgagat acaaactgtg gaaggagcag ggcgaacggt gcgcctacag cctgaaggaa 1740
atccctgccg atacattttt caacgagctg aagaaggaac gcaacggcgc ccctatcctt 1800
gaagtggacc acatcctgcc ctacagccag tccttcatcg actcctacca caacaaggtc 1860
ctggtgtaca gcgacgaaaa ccggaaaaag ggcaacagaa tcccttatac ctacttcctg 1920
gaaaccaaca aggattggga ggcctttgag cggtacgtgc ggagcaacaa attcttctcc 1980
aagaaaaagc gagagtacct tctgaagcgg gcttatctgc ctagagaatc tgagctgatc 2040
aaagaacgcc acctgaacga caccagatac gcctctacct tcctgaagaa cttcatcgag 2100
cagaacctgc agttcaagga agccgaggac aaccccagaa aaagacgggt gcaaaccgtg 2160
aacggcgtta tcaccgccca cttcagaaag cggtggggcc tggagaagga ccggcaggag 2220
acatacctcc atcacgctat ggacgccatc atcgtggctt gtacagacca ccacatggtc 2280
accagagtga ccgagtacta tcagatcaag gaaagcaaca agagcgtgaa gaagccctat 2340
tttcctatgc cttgggaagg cttccgggac gagctgctga gccacttggc ttctcagcct 2400
atcgccaaga aaatcagcga ggaactgaag gccggctacc agagcctgga ctacatcttc 2460
gtgtccagaa tgcctaagag aagcattaca ggcgctgctc ataagcagac catcatgcgg 2520
aagggaggaa ttgacaagaa gggcaaaaca atcatcatcg aacggctgca cctgaaggat 2580
atcaagttcg acgagaacgg agatttcaag atggtgggca aggaacagga catggccaca 2640
tacgaagcta ttaaacagag atacctggag cacggcaaga atagcaagaa ggccttcgag 2700
acccctctgt acaagcccag caaaaagggc acaggtaacc tgatcaagcg ggtgaaggtg 2760
gaaggacagg ccaagagctt tgtgagggaa gtgaacggcg gagtggccca aaatggcgat 2820
ctggttagag ttgatttgtt tgagaaggat gataagtact acatggtccc catctacgtg 2880
ccagacaccg tgtgtagcga gctgcccaaa aaggtggtcg ccagctctaa gggctatgag 2940
cagtggctga cactggataa cagcttcacc tttaagttca gcctgtaccc ttatgatctg 3000
gtgcggctgg tcaagggaga tgaggatcgg ttcctgtact ttggcaccct ggacatcgac 3060
agcgacagac ttaacttcaa ggacgtgaac aagccaagca agaagaacga gtaccggtac 3120
agcttgaaaa ccatcgagga cttggagaag tacgaggtgg gcgtgctggg cgatctaaga 3180
ctggtccgga aggaaactcg aagaaacttc cac 3213
<210> 129
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07513.1哺乳动物密码子优化的序列"
<400> 129
atgcgggaac tggattacag aattggactg gacatcggga ccaactcaat tggctgggga 60
gtgatcgagc tgagctggaa caaggacaga gagcagtacg agaagaccag aatcgtggac 120
aagggcgtta ggatgttcga caaggccgag atccccaaga ccggagccag cctggccgag 180
cctagacgta tcgccagatc ctccagacgt agactgaaca gaaagtccca gaggaagaag 240
gacattcgga acctgctggt gcaacacgag atcattagcc aaaaagaact gaccagcctg 300
taccctctgt ctaaatccag catggacatc tgggacatcc ggctggacgg cctggacaga 360
ctgcttgata gattcgagtg ggcccggctc ctgatccacc tggctcagcg gcggggcttt 420
aaaagcaacc ggaagtctga gcttaaagac gtggaaacag gaaaagttct gtccagcatc 480
caggtgaatg aaaagcggct gagcctgtac agaaccgtgg gcgagatgtg gatgaagaac 540
gccgattgca gcaagtacgg caaacgtaga aatagcccca acgagtacgt gttcagcgtg 600
tctagagccg acttggagaa agaaattgtg acacttttcg aggcccagcg aaaattccac 660
agcagctacg ccagtgtgga cctgcagaag acatacatcc aaatctgggc tcatcaactg 720
ccatttgcct ctggcaatgc cattgtgaac aaggtgggat actgctctct gctgaagggc 780
aaagaaaaga gagtgcctaa ggccacatac acctttcagt attttaacac cctggaccag 840
atcaaccgga caagactggg ccctaacttc caacctttca ccaaggagca gagagatatc 900
atcctagaca aaatgttcca gagaaccgac tactacaaga aaaaaacaat ccctgaggtg 960
acatactacg atatcagaaa gtggctggcc ctggacgaaa ccatccagtt caagggcctg 1020
acctacgatc ctaatgaaga actgaagaag atcgagatga agccattcat caacctgaaa 1080
cctttctacg agatcaagaa ggtggtgacc aactacgcca agaagacaaa cgaggtgttc 1140
tctgccctgg actatgacac cgtggcttat gccctcaccg tgtacaaaac agacaaggat 1200
atcagaagct accttaagcg gtccaacaac ctgagcaaga gatgttacga cgaccaactg 1260
atcgaggaac tgctgacact gagctacacc aagttcggcc acctgtcctt caaggccatc 1320
aatcacgtgc tgcccatcat gcaggagggc agaacctacc aagaggctat tcaccaactg 1380
ggctatgaca cgaccaacct gaagaaggaa aatagaagca tgttcctgcc catcatccct 1440
gacgagatca ccaaccctat cgtgaagcgg gccctgacgc aggcccggaa agtggtgaat 1500
gccatcatcc gcagatacgg ctctcctaat tctgtccaca tcgagctggc cagagagctg 1560
agcaaaagcc acgacgagcg gaagaagatc atgaccgccc acgacgagaa ctacaagaaa 1620
aacaagggcg ccgtgtccat cctgatcgat aacggcatcc tgaatcctac aggatacgat 1680
atcgtgcggt acaagctgtg gaaggaacag ggcgaaagat gcgcctatag cctgaaaaaa 1740
atccccgcca acaccttctt caacgagcta aaaaaggaac ggagcggccc acctgtgctg 1800
gaagtggacc acatcctgcc ctacagccag agcttcatcg acagctacca caacaaggtg 1860
ctggtgtacg gcgacgagaa ccagaagaag ggcaatagaa tcccttacac atttttcagc 1920
gaagaagata aggaatggga gagcttcgag agctacgttc ggagcaacag cttcttcagc 1980
aagaaaaagc gcggctacct gctgaagaag gcctacctgc ccagagaaag caacctgatc 2040
aaggaacggc acctcaacga cacacggtac gccagcagtt acctgaagaa tttcatcgag 2100
aagaacctga agttcaagga agccgtgggg atcacccgga agaagtacgt gcaaaccgtg 2160
aacggcgtga tcaccgccca cctgcggaag cggtggggcc ttgagaagga ccggcaggag 2220
acctacctgc accacgctat ggacgccatc atcgtggcct gcaccgatca ccacatggtg 2280
acgaaggtga ccgagtacta ccagatcaaa gaaggcaata agagcatcaa gaagccttat 2340
tttcctctgc cctggatggg cttcagagaa gaaatcctgt ctcacctgga gtctcaacct 2400
atcgccagaa aaatttctga agagctgaaa attggatacc agtcccccga ttacatcctg 2460
gtcagccgga tgcctaagag aagcgtgacc ggcagcgccc acgatcagac cgtgatgaag 2520
aagggcgata tcgataagaa gggcaagaca atcatcatca agcgggtgca cctgaaggat 2580
atcaagttcg acgaaaatgg cgacttcaaa atggtgggca aggagcagga cctggctaca 2640
tacgaagcta tcaaacagag atacctggag taccggaagg aaagcaagaa ggccttcgag 2700
acccctctgt acaagccatc taaaaaagga aaaggtaacc tgatcaaaaa gatcaaggtg 2760
gaagtgcaaa ccaaatcttt cgtgagagag attaacggcg gagtggccca gaacggcgac 2820
ctggttagag tggatctgtt cgagaaggac aacagatatt acatggtccc catctacgtg 2880
gtggacaccg tgcggtctga actccccaac aaagcagtga caagctccaa aggctatgaa 2940
cagtggctga gcatcgacaa tagtttcacc ttcaagttta gtctgtaccc ctacgacctc 3000
gtgcggctgg tcaagggcga cgaggatcgc ttcctgtact tctccaccct ggatatcaac 3060
agcgacagac tgaacttcaa ggacgtgaac aagcctagca agcaggctga ataccggtac 3120
agcctgaaga cgatcgagaa cctggaaaaa tacgagatcg gtgttctggg agatctgaga 3180
ctcgttagac aggagacaag aaaaattttc aag 3213
<210> 130
<211> 3216
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG08290.1哺乳动物密码子优化的序列"
<400> 130
atgagcgagc tggattatag aatcggcctg gatatcggca ccaattctat cggatgggga 60
gtgatcgagc tgttctggaa caaggatcgg gaacggtacg agaaggtccg catcgtggac 120
aaaggggtca gaatgtttga caaggccgag atccccaaca agggcgccag cctggccgag 180
cctcggagaa tcgcccggag cagcagaaga cgcctgaaca ggaagtccca aaggaagaag 240
gagatccgga acctgctggt gcaacacggc atgatcaccc aagaggaact ggacctcctg 300
taccctctga gcaaaaagtc catcgatatc tgggacatca gactagacgg cctggacaga 360
ctgctgaacc acttagagtg ggctagactg ctgattcacc tggcccagcg gcggggcttc 420
aagagcaacc gcaaaagcga gctgaaggac gctgaaacag gcaaggtgtt gtctagcatc 480
caggtgaacg agaagcggct gttcctgtac agaaccgtgg gggaaatgtg gatcaaggac 540
gcagagttca gcaagtacga caggcgtaga aactccccaa acgaatacgt gttcagcgtg 600
tcaagagccg acctggaaaa ggaaatcgtg acactgtttg aggctcagag aaagttccag 660
agcagctatg cctctaaaaa tctgcaggag acctacctgc agatctgggc ccaccaactg 720
cctttcgcca gcggcaatgc catcctgaac aaagtgggct actgcagcct gctgaaaggg 780
aaggaaaggc ggattcccaa ggccacatac accttccagt acttctccgc cctggatcag 840
gttaaccgga cccggctcgg ccctgacttc caacctttca cccaggaaca aaaggagatc 900
atcctggata agatgttcca gagaacagac tactacaaga agaagaccat ccccgaggtt 960
tcttattatg atatcagaaa gtggctggaa ctcgacgaga caatccagtt taagggactg 1020
aattacgacc ccaacgaaga gctgaagaag atcgaaaaaa aacctttcat caacctgaag 1080
gccttctacg agatcaagaa ggtggttgct aactacgccg aaagaacaaa tgaagccttt 1140
tctaccctgg actacgacgc tatcgcctat gccctgacag tctacaagac cgacaaggac 1200
atccggtcct acctgaagaa atccaacaac ctgtccaagc ggtgctacga tgatcaactg 1260
atcgaggaac tgtttaccct gagctacacc aaattcggcc acctgtcttt caaggccatt 1320
aaccacgtgc tgcctatcat gcaggagggc agaacctacc aggaggccat acaccaactg 1380
ggctacgaca ccaccaacct gaagaaagag aatagaagca tgttcctgcc tctgatccct 1440
gacgagatca caaaccccat tgtgaagcgg gccatcaccc aggccagaaa ggtggtgaac 1500
gccatcatca gaagatacgg ctctcctaac agtgtgcaca tcgaactggc cagagagctg 1560
agcaagagcc acgatgagcg gaaaaagatc atgaccgccc acgacgagaa ctacaagaaa 1620
aataagggcg ctatttctat cctgatcgag aacggcattc tgaaccctac cggctacgac 1680
atcgtgagat acaagctgtg gaaggaacaa ggcgagagat gcgcctacag cctgaaagaa 1740
attccacctg atactttttt caacgagctg aagaaagaaa gaaacggcag ccccattctg 1800
gaagtggacc acatcctgcc ttacagccag tccttcatcg acagctacca caacaaagtg 1860
ctggtgtact ctgacgagaa cagaaacaag ggcaacagaa tcccttacac ctacttcctg 1920
gaaacaaaca aggactggga ggcctttgaa agatacgtgc ggagtaacaa actgttttct 1980
aagaaaaaga gagaatatct gctgaagaag acttacctgc ctagagagtc tgaactaatc 2040
aaggaacggc acctgaacga cactcggtat gcttctacat tcctgaagaa tttcatcgag 2100
cagaatctgc agttcaaaga ggtcgaggtc aatctgagaa aaaagagagt gcaaaccgtg 2160
aatggcgtga tcaccgccca cctcagaaag cgttggggcc tggagaagaa ccggcaggag 2220
acgtacctgc accacgctat ggacgccatc atcgtggctt gtacagacca ccacatggtg 2280
acccggataa cagagtacta ccagatcaag gaatccaaca agagcgtgaa gaaaccttac 2340
ttccccatgc cttgggaggg ctttagagat gagctgttgt ctcacctcgc tagccagcct 2400
atcgcaaaga agatcagcga ggaactgaag gccggctacc agagcagcga ctacatcttc 2460
gtgtccagaa tgcccaagag aagcgtgacc ggcgccgccc atgatcagac catcagaaga 2520
aagggcggca tcgacaagaa gggcaagaca atcatcatta agcgggtgcg gctgaaagat 2580
atcaagttcg acgaaaacgg cgatttcaag atggtgggca aagagcagga cctggcaacc 2640
tacgaggcca tcaagcagag atacctggag cacagaaaga acagtaagaa ggccttcgag 2700
acccctctgt acaaacctag caagaaggga acaggaaacc tgattaagcg ggtgaaaatc 2760
gagggacaga ctaaggcctt cgtgcgggaa gtgaacggag gcgtggccca aaatagcgac 2820
ctggtcagag tggacctgtt cgagaaggac gacaagtact atatggtgcc tatctacgtg 2880
ccagacaccg tgtgtagcga gctgcctaag aaggtggtta agagcggaaa aggctatgag 2940
cagtggctga ccctggacaa cagcttcacc ttcaagtcta gcctgtaccc ctacgatctg 3000
gtgcggctcg tgaagggcaa cgaggacaga ttcctgtact tcggcacact ggacattgac 3060
tccgatagac tgaatttcaa ggatgtgaac aagcccagca agcagaacga gtaccggtac 3120
agcctgaaaa caatcgagaa cctggaaaaa tacgaggttg gagtgctggg agatctgcgg 3180
ctggtgaaac aggagaccag gaggatcttt aacaga 3216
<210> 131
<211> 4011
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05459.1哺乳动物密码子优化的序列"
<400> 131
atgaaaaaag attacgtgat cggcctggac attggcacca acagcgtcgg ctgggccgtg 60
atgacagagg actaccaact ggtgaagaag aagatgccaa tctatggcaa tactgagaag 120
aaaaagataa aaaagaattt ctggggcgtg cggctgtttg aggagggcca caccgccgag 180
gatcggcggc tgaaacggac cgctagaaga cggatctctc gccgcagaaa tagactgaga 240
tatctgcagg ccttcttcga ggaagccatg accgccctgg acgagaactt cttcgccaga 300
ctgcaggaga gcttcctggt gcctgaggac aagaaatggc accggcaccc tatcttcgcc 360
aagctggagg atgaggtggc ctatcacgaa acctacccta caatctacca cctgagaaag 420
aaactggctg attcctctga acaggctgac ctgagactga tctatctggc cctggcccat 480
atcgtgaagt acagaggcca cttcctgatc gaaggaaagc tgagtaccga gaacatcagc 540
gtcaaggagc agttccagca gttcatgatt atctataacc agacatttgt gaacggcgaa 600
agccggctgg tgtctgcccc tctgcctgag agcgtgctga tcgaagaaga gctgaccgaa 660
aaggccagcc ggacaaagaa atctgagaag gtgctgcaac agtttcctca ggagaaagcc 720
aatggactgt tcggccagtt cctgaaactt atggtaggca acaaagccga tttcaagaaa 780
gtctttggcc tggaagaaga ggccaaaata acatacgcca gcgagtccta cgaggaggat 840
ctggaaggca ttctggccaa ggtgggcgac gagtacagcg atgttttcct ggccgctaag 900
aacgtctacg acgccgtgga actgtctacc atcctggccg actccgacaa gaagagccac 960
gccaagttgt ctagtagcat gatcgttaga ttcaccgagc accaggagga cctgaagaag 1020
ttcaagcggt ttatcagaga gaattgcccc gacgagtacg ataacctgtt caagaacgag 1080
caaaaagacg gctacgccgg ctacatcgcc cacgccggca aggtgtccca actgaagttc 1140
taccagtacg tgaagaagat aatccaggac atcgccggcg ccgaatactt cctggagaaa 1200
atcgcccagg agaacttcct gcgaaaacag aggaccttcg acaacggcgt gatcccccac 1260
cagatccacc tggccgagct gcaggccatc atccacagac aggctgctta ctaccctttc 1320
ctgaaggaaa atcaggaaaa gattgagcaa ctggtgacat tcagaatccc ctactacgtc 1380
ggccctctga gcaaaggaga tgccagcacc ttcgcctggc tgaaaagaca aagcgaggaa 1440
cctatccggc cttggaacct gcaagagaca gtggacctgg accagtctgc taccgcattc 1500
atcgagagaa tgaccaactt cgatacctac ctgccttctg agaaggtgct gcccaagcac 1560
agcctgctct acgaaaaatt tatggtgttc aacgagctga ccaagatttc ttacactgat 1620
gacagaggca tcaaggccaa cttcagcggc aaggagaagg agaagatatt cgactacctg 1680
tttaagaccc gccggaaggt gaagaaaaag gatatcatcc agttctaccg gaacgagtac 1740
aacaccgaga tcgtcaccct gtctggcctg gaagaggacc agttcaatgc cagcttcagc 1800
acctaccaag atctgctgaa gtgcggccta actagagccg aactggacca ccctgataat 1860
gccgagaaac tggaggacat cattaagatc ctaaccatct tcgaggatag acagcggatc 1920
agaacacagc tcagcacctt caagggacag ttcagcgccg aggtgctgaa gaagctggaa 1980
cggaagcact acaccggctg gggcagactg tccaagaaac tcatcaacgg catctacgac 2040
aaggaatccg gaaagacaat cctggactac ctgatcaaag atgacggcgt ttctaagcac 2100
tacaacagaa acttcatgca gctaatcaac gacagccaac tgagcttcaa gaacgccatc 2160
cagaaggccc agagcagcga gcatgaggaa accctgtctg agaccgtgaa cgagctggcc 2220
ggcagccctg ccatcaagaa aggcatctac cagagcttaa aaatcgttga tgagctggtt 2280
gccatcatgg gctacgcccc taagagaatc gtggtggaga tggctagaga gaaccagaca 2340
acaagcaccg gaaagagaag aagcatccag aggctgaaga tcgtggaaaa agctatggcc 2400
gagattggaa gcaacctgct caaggaacag cctaccacaa acgagcaact gagagataca 2460
agactcttcc tgtattatat gcagaacggt aaggacatgt acaccggcga cgagctgagc 2520
ctgcacagac tgtctcacta cgacatcgac cacatcattc ctcagtcctt catgaaggac 2580
gattccctgg ataacctggt gctggtgggc agcaccgaga accggggcaa gtctgacgac 2640
gtgcccagca aggaagtggt gaaggacatg aaagcctact gggagaagct ctacgctgct 2700
ggcttgatca gccagcggaa attccagaga ctgacgaagg gcgagcaggg cggcctgacc 2760
ctggaggaca aagctcattt catccagaga caactggtgg agacaagaca gatcaccaag 2820
aacgtggctg gaattctgga tcagagatac aacgccaaca gcaaagaaaa aaaggtgcaa 2880
atcataacac tgaaagcctc tctgaccagc cagttccgga gcatcttcgg cctgtataag 2940
gtcagagaag tgaacgacta tcaccacggc caggatgcgt acctgaactg cgtggtggcc 3000
actacactcc tgaaagtgta ccccaacctg gctcctgagt tcgtgtacgg cgagtacccc 3060
aagtttcagg cctttaagga aaacaaggct acagccaaga ccatcatcta caccaatctg 3120
atgcggtttt tcaccgagga tgaacccaga ttcatgaagg acggcgagat cctgtggagc 3180
aacagctacc tgaagaacat taagaaagaa ctcaactacc atcagatgaa catagtgaaa 3240
aaggtggaag tgcaaaaggg tggcttctcc aaggaaagca tcaagcctaa gggccccagc 3300
aacaagctga tccctgtgaa gaacgggttg gacccccaga aatacggcgg atttgactct 3360
ccagtggtcg cttacacagt gctgtttacc cacgagaagg gcaaaaaacc actgatcaag 3420
caggagatcc tgggaatcac catcatggaa aagaccagat tcgagcagaa tcctatcctg 3480
ttcctggaag aaaaaggctt cctgaggcct agagtgctga tgaagctgcc taaatacacc 3540
ctgtacgagt tccctgaggg aagacggcgg ctgctggcca gcgccaaaga agcccagaaa 3600
gggaatcaga tggtgctccc cgaacacctg ctgaccctgc tgtaccacgc caaacagtgt 3660
ctgctgccta accagagcga atctctcgct tacgtggaac aacaccaacc ggagttccaa 3720
gagatcctgg agagagtggt ggacttcgct gaggtgcaca cactggccaa gagcaaggtg 3780
caacagatcg tgaaactgtt tgaggcaaac cagaccgcag atgtgaagga aatcgccgcc 3840
tccttcatcc aactgatgca gttcaacgca atgggagccc catctacctt taaattcttc 3900
cagaaggaca tcgagcgggc ccggtacact agcatcaagg aaatcttcga cgccaccatc 3960
atctaccaga gcacaaccgg cctctacgag acacggagaa aggtggtgga c 4011
<210> 132
<211> 4308
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG04583.1哺乳动物密码子优化的序列"
<400> 132
atggccaaga atatcctggg cctggatctg ggtacaaaca gcatcggctg ggctctggtc 60
cagcaggact tcgagaacaa ggagggaaac atcctgggca tgggatctag aatcatccct 120
atgagccagg acatcctggg cgaattcggt aagggcaaca gcatcagcca gaccgccgag 180
agaacaggat accggggcgt gcgtagactg agagagagac acctcctgag aagagagaga 240
ctgcatagag tgctgcacct gctcggcttt ctgcctaagc actacgatga aaaaatcgac 300
tttacacaaa gattcggcaa gttcatcaac caggctgagc ctaagctggc ttttgatagc 360
gagttcctgt tcaaggacag cttccacgag atgctggccg acttcaagca gaatcaacct 420
gaattcctga aagacaagaa cggagaggac tgcctggttc cttacgactg gaccatctac 480
tacctgagaa agaaggctct gacccagaag atcgagaaat acgaactagc ttggctgatc 540
ctgaacttca accaaaagcg gggctactac cagcttagag gcgaagaaga gaaggaaaac 600
cctaacaaac tggtgggctt ccactctctg aagattgttg atgtgatccc tgatgccgag 660
accaacaaaa agggcgagac atggtacagc ctgcacctgg aaaacggctg ggtgtacagg 720
cggagcagca agatcagcct ggccgactgg aaggacaagg ttcgggactt catcgtcact 780
acagatctga acgacgatgg cagcgagaag ctggacaagg acggcatcgt gaagaggtcc 840
ttcagagccc cttctgccga cgattggaca ctcctgaaaa aaaagactga gaaggacatc 900
gacaactcca acaagactgt gggcacctac atctacgaca acttgctgct gaaccctaaa 960
cagaagatca aggggaaaat ggtcagaacc atcgaacgaa agttctacaa gcaggagctg 1020
gagcaaatcc tgaaaaccca gaaagaattt cactccgagc tgcagtctga aaacctgctg 1080
caggactgcg tgagggagct gtaccggaac aacgagcagc accagcagat gctggaagcc 1140
aaggattttg tgcacctgtt cctgaacgat atcatcttct accagagacc cctgcgcagc 1200
cagaaaagct ctattagcaa ctgcaccctg gaattccgga agagcaagaa cgagaatgga 1260
gaagaagtga tccaccggct gaaggtgatc gccaagtcca acccctacta tcaagagttt 1320
cggctgctgc agtgggtgca aaacctggct atctacacta aggacgacga caaaaacgtc 1380
acaaacgaat tcctgaagag cacccaggac tgggaggatc tgctgagatg gctgcacagc 1440
aagaaagaaa tcaagcagga tgccctgatc aaattcctga tcgaaaagaa aggcctgaag 1500
ggtaaggccc tgaccattga agtggctaag tacagatgga attacgtgca agacaaggat 1560
tatcctggca acgagacaag atacctgatt cagagccggc tggacaaggt ggaatacgcc 1620
cctaaggact tcctcacgta cgaaaatgag atggccctgt ggcacatcat ctactctatc 1680
aacgataaga tcgaatacga aaaggcccta aagagcttcg ccaacaagaa aggtctcgac 1740
gaggtgacct tcgtggaagc ctttaagaaa ttcccacctt tcaagagcga ttacggcagc 1800
ttcagcgaga aggccatcaa gaagctgctg cctctcatgc ggttcggcac acaatggaac 1860
tgggacaaca tcgaccagaa ctcgaaggaa aggattggaa aaatcctgac cggcgagtac 1920
gacgagaata tcaagggtag agtgcgggaa aaagctagac acctgaacag cgagacggac 1980
tttcaggcgc tccctctgtg gctggcccag tacgtggtgt acggcagaca tagcgaagct 2040
gacatcgccg gcaagtggaa tagtgtggac gacctgaagc agttcttgga cgacttcaag 2100
caacacagcc tgagaaatcc cattgtagaa caggtgatta ctgagacact gcgggccgtg 2160
aaggatatct ggaacttcta cggcaagggc gccaaggact ttttctctga gatccacatc 2220
gagctgggaa gagagatgaa aaacaccgcc gacgagagaa aaaggattac cacaatggtg 2280
acagataatg agaataccaa tctgagaatc aaagctctgc tggctgagat ggccctggat 2340
cagaacgtgg acaatgtgcg gccttacagc cccatgcagc aagaaatcct gaaaatctat 2400
gaggaaggcg tgctgaacgc cgaagagaac atcgacgatg acatcctgaa gatctctaaa 2460
actgctcagc ctagcgctac cgatctgaag agatacaagc tgtggctgga acagaagtac 2520
agaagcccct ataccggaca gatgatccct ctgaacaagc tgttcacccc tgagtatgaa 2580
atcgagcaca ttatccccca gagcagatac ttcgacgatt ctatgagcaa caaggtgatc 2640
tgcgaggccg ccgtgaacaa gctgaaggat aaccagatcg gcctggtgtt catcaagaac 2700
caccacggcg aagtggtgga ctttggcatg ggcaagcagg tgaaaatcct ggaggtgtct 2760
gattacgaag atttcgtgaa gcagaactac aacaaaaaca gaggcaaacg gaacaagctg 2820
ctcctcgaag atatccccga gaaaatgatt gaacggcaac tgaacgatac cagatatatc 2880
agcaagtaca tcactcaggt gctgtctaat atcgtcagag acgacaagga aggctctaag 2940
gatgacggag tgaacagcaa gaacattgtg cccggcaacg gcaagattac aaccagactc 3000
aagcaggatt ggggcctgaa cgatgtgtgg aacgacctgg tgctgcctag attcgagaga 3060
atgaacaccc tcacaaactc caatgatttt acaagcaaga acacacacgg caagaccatt 3120
cctaccgtgc ctatcgagct gagcaagggg ttcagcaaaa agcggatcga tcacagacac 3180
cacgctatgg acgccctggt gatcgcctgc gccacccggg accacgtgaa cctgctgaat 3240
aacgaatcca gcaagtctga cacaaagcgg tacgacctga atagaaaact gagaaaatac 3300
gagaaggtgg cctacaacga ccccaaaacc ggcgagagga ttgaaaaaga agtgccaaaa 3360
gacttcatca agccttggga aacttttacc gaagatacca gaacactgct ggagaatatc 3420
gtgatctcat tcaaacagaa cctgagagtg atcaacaagg ccaccaacta ctacgagaag 3480
atcgagaacg gcaaaaaggt gaaggtggaa caaaagggaa tcaactgggc cgtgagaaag 3540
gctctccata aggagaccgt gtccggccag gtccaccttg acagaatcaa ggtggccaag 3600
ggcaagatcc tgaccgccac aagaaagacc ctggacgctt cttttaacga gaaaaccata 3660
gagagcatca ccgataccgg catccagaag atcctgctga actacctgaa gtcaaaggac 3720
aacaaccctg aggtggcctt ctccccagaa ggaattgagg aactaaacaa gaatatcaga 3780
ctgtacaatg acggcaaggc ccaccagcca atcctaaaag tgcgggtgtt cgagcagggc 3840
agcaagttca cactgggcga gacaggcaac aagacaacca agttcgtgga agctgccaag 3900
ggcaccaatc ttttcttcgg aatctacgag gacaagagcg gaaaacgtag ctacgagacc 3960
atccccctga atatcgttat tgaaagacag aaacagggcc tccaggccgt gcccgagacc 4020
aacgagaagg gcaagcaact gctgttcacc ctgagcccca acgacctggt ctacgtgcca 4080
gaggaaggcg tattcgacga gaacaacatc aaggtggata gaatctacaa ggtcgtgtct 4140
ttcagcacat accaatgttt tttcgtgcgg aacgacgtat ctaccagcgt ggtcaacaag 4200
gtggagtaca gcgccctgaa caagatggaa aaatccatcg acaatatcat gatcaaggaa 4260
aactgtgtga agctgaatgt ggaccggctg ggtaagatca gcaaggcc 4308
<210> 133
<211> 4368
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG01688.1哺乳动物密码子优化的序列"
<400> 133
atgatgatca agaacattct gggactggat ttgggcacaa acagcattgg atgggctctg 60
atcaagcagg acttcgagaa caaacacggc gagatcctgg gcatgggcag cagaatcatc 120
cctatgagcc aggatatcct gggcgatttc ggcaaaggga actcgataag ccagactgct 180
gacagaacca agtacagaag cgtgcggaga ctgagagaaa gattcttgct gcggcgggaa 240
cgcctgcacc gggtgctcca cctgctgaac ttcctccctc aacactacgc ctctcagatc 300
gacttcgaga agaagttcgg caagtttaag tctgagaccg aacctaagct ggcctgggaa 360
aactggggag gtaaattctc tttcctcttc cagaacagct tcaacgagat gctggaagac 420
ttcaaggccg ccggccaggg actcaagatt ccctatgact ggaccatcta ctacctacgg 480
aagaaagctc tgtcccagaa gatcgagaaa gaggagcttg cctggattct gctgaacttc 540
aaccagaagc gaggctacta ccagctcaga ggcgaggaag aagaagagaa cccgaacaag 600
ctggtggagt tctactccct gaagatcgtg gatgtggtcg ccgacgagcc tcagaagggg 660
aagagcgaca tctggtattc tctgatcctg gaaaacggct gggtctaccg cagagccagt 720
aagatcccac tgtttgattg gaaggataag accagagatt tcatcgtcac cacagacctt 780
aatgacgaca gaagcgtgaa gaccgacaaa gagggcaacg agaagcggtc ctttcgggcc 840
cctagcgaaa atgattggac cctggtcaag aagaagacag agcaggagat tgaccagagc 900
cacaagaccg tgggcaccta catctacgag acactgctgc tcaatccaaa gcagaaaatc 960
aagggcaagc tggtgcgaac aatcgagaga aaattttata aggacgagct gaagcaaatc 1020
ctggaaaagc agaaggaatt tcaccaggag ctgaaaaacg acgatctgta caacgactgc 1080
atcagagagc tgtaccggaa caacgaggcc caccaactga ccctgagcaa gaaagatttc 1140
gtgcacctgc tgatggacga tctgatcttc taccaaagac ccctgcgaag ccagaagtcc 1200
agcatctcta actgcaccct ggaattcaga aaatacaagg acgaaaacgg catcgaacac 1260
acccagtacc tgaaggccat cccaaagagt aatccgtact accaagagtt tagactgtgg 1320
cagtggatgt acaacctgaa catctacaga aaggacgacg aggctaatgt gaccaaggaa 1380
ttcctgaaca ccaataagga cttcgagagc ctgtttgagt tcctgaataa tagaaaggaa 1440
atcgaacaga agcctctgat caagttcctc ctggaacaga aagatattaa caagaagctg 1500
ctgaacgccg aggccgaaaa gtatcggtgg aattacgtgg aagataagaa gtatccttgc 1560
aacgaaacga agaccatgat ctccagcaga ctggacaaag tggagaatat ctctgacgac 1620
ttcctgacca gagacattga gcagaagatc tggcacatca tctacagcgt caacgacaag 1680
atagaatacg agaaggccct gaagtccttc gccaccagaa acgatctcga cgagaacagc 1740
tttatcgaag cctttaagaa gttcagccca ttcaagagcg agtacggatc tttttctgag 1800
aaagccatca agaaactgct gcccctgatg agactgggaa agtactggta cgaggacgag 1860
attgtgaagc actctgatat ttactttaag aacatcgaaa atcttctggg cgacttctcc 1920
aacagagata aaaaaatatc tgaggaagac aaagagaaat ggaacaagtc tatcaacctg 1980
aaactgcagg aggaactgaa ggactttcag accgccgaga tcgacctgtt ccagggcctt 2040
agactccata tcgcccagta cctggtgtac ggccggcaca gcgaagccag catgatcgga 2100
aagtggaaca gcgccgagga tctggaagaa ttcctgaagg acttcaagca gcacagcctg 2160
agaaacccca tcgtcgagca agtgatcacc gagaccctga gggtggttaa ggatatatgg 2220
ctgaaatacg gcaacggcgc caaggacttc ttcaacgaga ttcacatcga gctgggcaga 2280
gaaatgaagc tgcctgccga cgaccggaaa aagctgacca accagatcag cgagaacgaa 2340
aacacaaatt tcagaatcaa ggccctgctg gctgaaatga tgaacgacag cagtgtggaa 2400
aatgtgcggc ctttcagccc tatgcagcag gagatcctga agatctatga agatgacgtc 2460
ctgaagtctg acattgaaat cgaggatgac atccttaaga tctctaaaac cgcccagcct 2520
tctcctagcg atctcaagcg atacaagctc tggctggagc agaagtacaa gtctccatac 2580
accggccaga tcatacctct gaacaagctg tttacccctg aatacgagat cgagcacatt 2640
atccctcagt ctagatattt cgacgacagc ttcagcaaca aagtgatctg cgagagcgcc 2700
gtgaacaagc tgaaagacaa ctacattggc ctggaattca tcaagcaatt tggaggcacc 2760
atcatcgaac tgggctttgg caagtccatc aaagtgttcg agaccaaaga gtacgaggac 2820
ttcgtgaaga aacactacgc caacaatcag ggcaagagaa acaagctgct catggaagac 2880
atccccgaga aaatgatcga gagacagatg aacgacacca gatacatctc taagtacatc 2940
agcggagtgc tgagcaacat cgtcagagtg gaagatggat ctgatgaggg cgtgaacagc 3000
aagaacatcg tgcccggcaa cggcaagatt acaacacaac tgaagcagga ctggggcctg 3060
aatgacgtgt ggaacgacct tatcctgccg cggttcgaga gaatgaatca actgaccaac 3120
agcaaggtgt tcacagcctg gaacgaaaac taccagaagt tcctgcctac agtgccaatc 3180
gaatacagca aaggcttcag caagaagcgt atcgatcaca gacaccacgc cctggatgct 3240
ctggttatcg cctgcgccac caaggaccac gtgaacctgc tgaacaacca gtctgccaag 3300
agcgacacca agagatacga cttaaagaaa aaaagtatga aattcgagaa agtggtgtac 3360
aatgatgcca agaccggcga aaagatcgag cgggaagtgc ccaagcagtt cctgaagcct 3420
tgggagaact tcaccctgga tgtgaagcac aacctggaaa cgatcatcgt ctcttttaaa 3480
caaaatctgc gggtgatcaa taaagccacg aactactacg agaagtacgt cgagaaggac 3540
ggcaccaaaa acaaagagcg cgtggagcag acagggacaa actgggccat tagaaagccc 3600
atgcacaagg atacagtgtc cggcaaagtg gaccttcctt gggtgaaggt gcctaaggga 3660
aagatcctga ccgccacacg gaagagcttg gatagcagct tcgacctcaa gagcatcggc 3720
tctataacag atacaggcat tcagaagatc ctaaagaatt acctggcatt caaggacggc 3780
aaccctgagc tggctttcag ccctgagggc atcgacgatc tgaacaagaa catagagaag 3840
tacaacgatg gcaaacctca ccagcctatc aacaaggtgc gagtgtttga gctgggcagc 3900
aagttccagg tgggacaatc tggtaacaag aaggacaagt atgtggaagc tgctaagggc 3960
accaatctct tcttcgccgt gtacgaggat gaaaaaggaa agcggaacta cgagaccatc 4020
cctctcaacg aggtgatcga gagacagaag cagggcctga gcgtggtgga cctgaagggt 4080
acaaacgact tctacctgtg ccctaacgac tttgtgtaca tcccaagcgg cgacgagctg 4140
gaaaacatca acaacgtgga cttcaaggac atcaagaagg agattaacga gcgcatctac 4200
aaagtggtgt cttttacagg caatagactt tcttgtatcc cttacatggt ggccacaacg 4260
atcgtcaaca aactcgaatt cactcaactg aacaaaatcg agtttaccaa ggaaaaagaa 4320
atttgtatca agctcaacgt ggacagactg ggcaatatct ccaaggcc 4368
<210> 134
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="SV40大T抗原核定位序列"
<400> 134
cctaagaaga aaagaaaggt g 21
<210> 135
<211> 66
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="三重FLAG表位标签"
<400> 135
gactacaagg accacgacgg cgactacaaa gatcacgata tcgactacaa ggacgacgat 60
gataag 66
<210> 136
<211> 48
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="核质蛋白核定位序列"
<400> 136
aaaagacctg ccgctacaaa gaaggccggc caggccaaga aaaagaag 48
<210> 137
<211> 203
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="巨细胞病毒哺乳动物转录启动子"
<400> 137
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 60
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 120
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 180
gggaggtcta tataagcaga gct 203
<210> 138
<211> 304
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="巨细胞病毒转录增强子"
<400> 138
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catg 304
<210> 139
<211> 318
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="人U6 RNA启动子"
<400> 139
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacacc 318
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物189的靶标"
<400> 140
cctgaatgct gtgcggctct 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物185的靶标"
<400> 141
ggacagtgcg catctccctg 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物168的靶标"
<400> 142
cacatctcga gcaagacgtt 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物135的靶标"
<400> 143
gggccattaa aacctctcca 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物139的靶标"
<400> 144
aggttttaat ggcccagcct 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物143的靶标"
<400> 145
catggcagta cattagagca 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物190的靶标"
<400> 146
cctgaatgct gtgcggctct 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物194的靶标"
<400> 147
gccgcacagc attcaggtcg 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物165的靶标"
<400> 148
atggggaatg tagcaagacc 20
<210> 149
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物169的靶标"
<400> 149
cacatctcga gcaagacgtt 20
<210> 150
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物173的靶标"
<400> 150
cttctatagc ctccttcccc 20
<210> 151
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物144的靶标"
<400> 151
catggcagta cattagagca 20
<210> 152
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物136的靶标"
<400> 152
gggccattaa aacctctcca 20
<210> 153
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物145的靶标"
<400> 153
catggcagta cattagagca 20
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物188的靶标"
<400> 154
ggacagtgcg catctccctg 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物192的靶标"
<400> 155
cctgaatgct gtgcggctct 20
<210> 156
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物196的靶标"
<400> 156
gccgcacagc attcaggtcg 20
<210> 157
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物167的靶标"
<400> 157
atggggaatg tagcaagacc 20
<210> 158
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物171的靶标"
<400> 158
cacatctcga gcaagacgtt 20
<210> 159
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物175的靶标"
<400> 159
cttctatagc ctccttcccc 20
<210> 160
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物197的靶标"
<400> 160
cctcaccccc acgagcttgt aggaa 25
<210> 161
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物199的靶标"
<400> 161
acagtgcgca tctccctggt cacca 25
<210> 162
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物146的靶标"
<400> 162
ggctgggcca ttaaaacctc tccag 25
<210> 163
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物148的靶标"
<400> 163
gaggctgggc cattaaaacc tctcc 25
<210> 164
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物176的靶标"
<400> 164
gaggctgaga caggagagtt gcttg 25
<210> 165
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物177的靶标"
<400> 165
cccacaaacc gatgtagctc aagag 25
<210> 166
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物209的靶标"
<400> 166
tagggtctta ctctgttgtc cacgc 25
<210> 167
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物151的靶标"
<400> 167
ttctcccgag ccaagtacac gtttc 25
<210> 168
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="指导物152的靶标"
<400> 168
gaaaatctgc tcttagggct caagg 25
<210> 169
<211> 3210
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05083.1大豆优化的"
<400> 169
atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat cgggtgggga 60
ataattgagc tgtcctggaa taaagatcgc gagcaatatg aaaaggctag gattgtggat 120
aagggagtga ggatgttcga taaggctgaa attcctaaga ctggagcttc tcttgctgaa 180
ccaagaagaa ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240
gatataagga accttctcgt tcagcatgaa atcatttctc agaaggagct tgcttctctc 300
taccctctaa ccaaatcaag catggacatc tgggatataa ggcttgatgg actcgatagg 360
cttcttgata gatttgagtg gaccaggctt ctaatacacc ttgctcaaag aaggggcttc 420
aaatcaaacc gcaagtccga attaaaggat gttgagactg gaaaggtgct ttcaagcatc 480
caagctaatg aaaagaggct ttctttgtac aggactgttg gggagatgtg gatgaaaaac 540
gaggacttct caaaatacga taaaaggagg aactcctcca acgagtacgt gttctctgtt 600
tctagggctg atcttgagaa ggagattgtg actctttttg aggctcaacg caagttccaa 660
tcaagctacg cttctgctga tcttcaaaag acctaccttc aaatttgggc tcatcagctt 720
ccttttgctt ctggaaacgc cattgtgaat aaagtgggat actgctccct attaaaggga 780
aaggagaaga gagtgcctaa ggctacctat acattccagt acttctctac cctcgatcaa 840
atcaatagaa ctaggcttgg acctaacttc cagcctttta ctaaggagca gagggatgtg 900
atcctcgatg aaatgttcaa caggaccgac tactataaaa agaagaccat tcccgaggtg 960
acctactacg atataagaaa gtggcttgct ctcgatgaaa ccattcagtt caagggacta 1020
acttatgacc ccaacgagga gctgaagaaa atagaactca agtccttcat aaacctcaag 1080
cccttctacg aaatcaagaa ggtggtaacc aactacgcca agaagaccaa cgaagcattc 1140
tctaccctcg attacgatac attcgcttac gctcttaccg tgtataaaac cgacaaggat 1200
ataaggtcct acctcaagaa atcaaacaac ctctccaagt gctgctacga cgatcaatta 1260
attgaggagc ttctcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320
aaccatgtgc ttccaataat gcaagaggga agaacttacc aagaggcaat acaccaactt 1380
ggatacgatg ctaccaacct taagaaggag aacaggtcta tgttccttcc tctcttccct 1440
gatgagatta ctaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500
gctattatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc tagggagctt 1560
tctaagtctc atgatgagag gaccaagatt atgaaggctc acgatgagaa ctacaagaag 1620
aacaaggggg ctatttccat tctcattgag aacggaattc ttaaccctac cggatacgat 1680
attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaagcaa 1740
attcctgcta acaccttctt caacgagatg aagaaggaaa gatcaggatc tcctgtgctt 1800
gagattgatc acattctccc ttactcccag tccttcattg attcttacca caacaaggtg 1860
cttgtttacg gagatgagaa ccaaaagaag gggaacagga ttccttacac ttacttcctt 1920
gagggaaaca aggattggga gtctttcgag tcttacgtga ggcttaactc cttcttctct 1980
aagaagaaga ggggatacct tcttaagaag gcttatcttc ctagggagtc caatatgatt 2040
aaggagaggc acctaaacga taccaggtac gcttcttctt acctcaagaa cttcatcgag 2100
aagaacctta agttcaagga ggttgaggga tctactagga agaagcatgt tcagaccgtg 2160
aacggaatta ttactgctca tcttagaaag aggtggggac ttgagaagga taggcaagag 2220
acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca ccatatggtg 2280
actaaggtta ccgagtacta ccagattaag gagtcaaaca agtccatcag gaagccttat 2340
tttcctcttc cttgggttgg attcagggag gagattcttt ctcatcttgc tagacaacct 2400
atcgctagaa agatttccga ggagcttaag attggatacc agtccttcga ttacattctt 2460
gtgtctagga tgcctaagag gtctgttact ggagctgctc atgagcagac tattatgaag 2520
aagggaggaa ttgataagaa ggggaagacc atcatcatta agagggtgta cctaaaggac 2580
atcaagttcg atgagaacgg ggatttcaag atggttggaa aggagcagga tcttgctact 2640
tacgaggcta ttaagcagag gtacattgag tatggaaagg agtctaagaa ggctttcgag 2700
actcctcttt acaagccttc taagaaggga aaggggaacc tcatcaagaa gattaaggtt 2760
gaggttcaga ctaagtcttt cgttagggag gttaatggag gagttgctca gaatggagat 2820
cttgtgaggg ttgatctatt cgagaaggac aacaggtact acatgatccc tatctacgtg 2880
atggatactg ttcattccga gcttcctaac aaggctgtta cttcttctaa gggatacgag 2940
cagtggctta ccattgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000
gttaggcttg ttaagggaaa cgaggatagg ttcctctact tctccaccct cgatattaac 3060
tctgataggc tcaacttcaa ggatgtgaac aagccttcaa agcaagctga gaacaggtac 3120
tctcttaaga ccattgagaa ccttgagaag tacgaagtgg gagttcttgg agatcttagg 3180
ttcgttaggc aagagattag gaagaacttc 3210
<210> 170
<211> 3210
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05083.1玉米优化的"
<400> 170
atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat aggctggggc 60
atcatcgagc tgagctggaa taaagaccgc gagcagtatg aaaaggccag gatcgtggac 120
aagggcgtga ggatgttcga taaggccgag atcccaaaga caggcgcctc tctggccgaa 180
ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaag 240
gatataagga acctgctggt ccagcatgaa atcatctctc agaaggagct ggccagcctg 300
tacccgctga ccaagtcaag catggacatc tgggatataa ggctggatgg cctggatagg 360
ctgctggata ggttcgagtg gacaaggctg ctgatacatc tggcccagag gaggggcttc 420
aaatcaaata ggaagagcga attaaaggac gtggagacag gcaaggtgct gtcaagcatt 480
caggccaatg aaaagcgcct gagcctgtac aggacagtgg gcgagatgtg gatgaaaaac 540
gaggacttct caaaatacga caagcgccgc aacagcagca acgagtacgt gttcagcgtg 600
agcagggccg acctggagaa ggagatcgtg acactgttcg aggcccagag gaagttccaa 660
tcaagctacg cctctgccga tctgcagaag acatacctgc agatctgggc ccaccagctg 720
ccattcgcta gcggcaatgc catcgtgaat aaagtgggct actgctctct attaaagggc 780
aaggagaaga gggtgccaaa ggccacctat acattccagt acttcagcac cctggaccaa 840
atcaatagga cacgcctggg cccaaacttc cagccattca caaaggagca gcgcgacgtg 900
atcctggatg aaatgttcaa ccgcaccgac tactataaaa agaagaccat cccggaggtg 960
acatactacg atataaggaa gtggctggcc ctggatgaaa ccatccagtt caagggccta 1020
acctacgacc cgaacgagga gctgaagaaa atagaactga agagcttcat aaacctgaag 1080
ccgttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaagcattc 1140
agcaccctgg actacgatac attcgcctac gccctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaagaa atcaaacaac ctgagcaagt gctgctacga cgaccaatta 1260
atcgaggagc tgctgaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320
aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380
ggctacgacg caaccaacct gaagaaggag aaccgaagca tgttcctgcc gctgttcccg 1440
gacgagatca ccaacccgat cgtgaagcgc gccctgaccc aggcccgcaa ggtggtgaac 1500
gccatcatcc gccgctacgg ctcaccgaac agcgtgcaca ttgagctggc ccgcgagctg 1560
agcaagagcc acgacgagcg cacaaagatc atgaaggccc acgacgagaa ctacaagaag 1620
aacaagggcg ccatcagcat cctgatcgag aacggcatcc tgaacccaac aggctacgac 1680
atcgtgaggt acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaagcag 1740
atcccagcca atacattctt caacgagatg aagaaggaga ggtcaggctc tccagtgctg 1800
gagattgatc acatcctgcc atacagccag agcttcatcg acagctacca caacaaggtg 1860
ctggtgtacg gcgatgagaa ccagaagaag ggcaatcgca tcccatacac atacttcctg 1920
gagggcaaca aggattggga gagcttcgag agctacgtga ggctgaacag cttcttcagc 1980
aagaagaaga ggggctacct gctgaagaag gcctacctgc caagggagag caacatgatc 2040
aaggagaggc acctaaacga tacaaggtac gccagcagct acctgaagaa cttcatcgag 2100
aagaacctga agttcaagga ggtggagggc agcacccgta agaagcacgt ccagaccgtg 2160
aacggcatca tcacagccca cctgaggaag aggtggggcc tggagaagga taggcaggag 2220
acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280
acaaaggtga cagagtacta ccagatcaag gagagcaaca agtcaatccg caagccatac 2340
ttcccactgc catgggtggg cttcagggag gagatcctgt ctcacctggc caggcagcca 2400
atcgccagga agatctctga ggagctgaag atcggctacc agtctttcga ttacatcctg 2460
gtgtctagga tgccaaagag gtctgtgaca ggcgccgccc acgagcagac aatcatgaag 2520
aagggcggca tcgataagaa gggcaagaca atcatcatca agagggtgta cctgaaggat 2580
atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tctagccaca 2640
tacgaggcca tcaagcagag gtacatcgag tacggcaagg agtctaagaa ggccttcgag 2700
acaccactgt acaagccatc taagaagggc aagggcaacc tgatcaagaa gatcaaggtg 2760
gaggttcaga ccaagagctt cgtgagggag gtgaatggcg gcgtggccca gaatggcgat 2820
ctggtgaggg tggatctgtt cgagaaggat aacaggtact acatgatccc gatctacgtg 2880
atggatacag tgcacagcga gctgccaaac aaggccgtga catcttctaa gggctacgag 2940
cagtggctaa ccatcgacaa cagcttcacc ttcaagttca gcctgtaccc atacgacctg 3000
gtgaggctgg tgaagggcaa tgaggacagg ttcctgtact tcagcaccct ggacatcaac 3060
agcgacaggc tgaacttcaa ggacgtgaac aagccatcta agcaggccga gaacaggtac 3120
agcctgaaga ccatcgagaa cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180
ttcgtgaggc aggagatcag gaagaatttc 3210
<210> 171
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07433.1大豆优化的"
<400> 171
atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatggggc 60
gtgattgagc tttcctggaa taaagatagg gagcgttatg aaaaggttag gattgtggat 120
cagggagtta ggatgtttga tagagctgag atgcctaaga ctggagcttc attagctgaa 180
ccaagaagga ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240
aatataagga accttcttgt tcagcacgga gttattactc aggaggagct tgattctctc 300
taccctctct ccaagaaatc aatggatatc tggggaatta ggcttgatgg actcgatcgc 360
ctattaaacc attttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420
aaatcaaacc gcaagtccga attaaaggat actgagactg gaaaggtgct ttcaagcatc 480
cagctcaatg aaaagaggct ttctttgtat aggactgttg gggagatgtg gatgaaagat 540
cccgacttct caaaatacga taggaagagg aactctccta acgagtacgt gttttctgtt 600
tctagagctg agcttgagaa ggagattgtg actttgtttg ctgctcaaag gaggttccaa 660
tctccttacg cttctaagga tcttcaagag acctaccttc agatttggac tcatcagctt 720
ccttttgctt ccgggaacgc tattctcaat aaagtgggat actgctcctt attaaaggga 780
aaggagagaa ggattcctaa ggccacctat acattccagt acttctctgc tcttgatcaa 840
gtgaatagaa ctaggcttgg acctgatttc cagcctttta ctaaggagca gcgcgagatc 900
atcctcaata atatgttcca gaggaccgac tactataaaa agaagaccat tcccgaggtg 960
acctactacg atataagaaa gtggcttgag cttgatgaaa ccattcagtt caagggatta 1020
aactacgacc ccaacgagga gctgaagaaa atagagaaga agcccttcat aaacctcaag 1080
gccttctacg aaatcaacaa ggtggtggct aactactctg agcgaaccaa tgaaaccttc 1140
tctaccctcg attacgatgg aattggatac gctcttaccg tgtataaaac cgacaaggat 1200
ataaggtcct acctcaaatc aagccataat ctccctaaga ggtgctacga cgatcaatta 1260
attgaggagc ttctctccct ctcctatact aagttcgggc acctctctct taaggcaatc 1320
aaccatgttc taagcattat gcagaagggg aacacatata aggaggctgt tgatcagctt 1380
ggatacgata cttctggact taagaaggag aagaggtcta agttcctccc tcctatttct 1440
gatgagatta ccaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500
gctattatta ggaggcatgg atctcctcat tctgtgcata ttgagcttgc tagggagctt 1560
tcaaagaatc acgatgagag gactaagatt gtttctgctc aggacgagaa ctacaagaag 1620
aacaaggggg ctatttctat tctctctgag cacggaattc ttaaccctac cggatacgat 1680
attgtgaggt ataagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaaggaa 1740
attcctgctg ataccttctt caacgagctt aagaaggaaa ggaacggtgc tcctattcta 1800
gaggtggatc acattcttcc ttactcccag tccttcattg attcttacca taacaaggtg 1860
cttgtgtatt ccgatgagaa caggaagaag ggaaacagga ttccttacac ctacttcctt 1920
gagactaata aggattggga ggcttttgag aggtacgtga ggtctaacaa gttcttctct 1980
aagaagaaga gggagtacct tcttaagagg gcttatcttc ctagggagtc agagcttatt 2040
aaggagaggc atcttaacga taccaggtac gcttctacct tcctcaagaa cttcattgag 2100
cagaaccttc aattcaagga agctgaggat aatcctagaa agaggagggt tcagactgtg 2160
aacggagtta ttactgctca ttttagaaag aggtggggac ttgagaagga taggcaagag 2220
acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca tcatatggtg 2280
actagggtta ccgagtacta ccagatcaag gagtcaaaca agtctgtgaa gaagccttat 2340
tttcctatgc cttgggaagg attcagggat gagcttcttt ctcatcttgc ttctcagcct 2400
atcgctaaga agatttctga agagcttaag gctggatacc agtcccttga ttacattttc 2460
gtgtctagaa tgcctaagag gtctattact ggagctgctc acaagcagac tattatgagg 2520
aagggaggaa ttgataagaa ggggaagacc atcattattg agaggctcca cctcaaggat 2580
atcaagttcg atgagaacgg agatttcaag atggttggaa aggagcagga tatggctact 2640
tacgaggcta ttaagcagag atatctagag cacggaaaga actctaagaa ggctttcgag 2700
actcctcttt acaagccttc taagaaggga accggaaacc ttattaagag agttaaggtt 2760
gagggacagg ctaagtcttt cgttagagag gttaatggag gagttgctca gaatggagat 2820
cttgtgaggg ttgatctttt cgagaaggac gataagtact acatggtgcc tatctacgtt 2880
cctgatactg tttgttccga gcttcctaag aaggttgttg cttcttctaa gggatacgag 2940
caatggctta cccttgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000
gttaggctag ttaagggaga tgaggatagg ttcctttact tcgggaccct cgatattgat 3060
tctgataggc tcaacttcaa ggatgtgaac aagccttcta agaagaacga gtacaggtac 3120
tctctcaaga ccattgagga tcttgagaag tacgaagtgg gagttcttgg agatcttaga 3180
cttgttagaa aggagactag gaggaacttc cac 3213
<210> 172
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07433.1玉米优化的"
<400> 172
atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat cggctggggc 60
gtgatcgagc tgagctggaa taaagatcgc gagcgctatg aaaaggtgcg catcgtggat 120
cagggcgtta ggatgttcga tagggccgag atgccaaaga caggcgcctc actggccgaa 180
ccaaggagga tagccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaaa 240
aatatcagga acctgctggt tcagcacggc gtgatcacac aggaggagct ggattctctg 300
tacccactga gcaagaaaag catggacatc tggggcatta ggctagatgg cctggaccgc 360
ctattaaacc acttcgagtg ggcccgccta ttaattcacc tggcccagag gaggggcttc 420
aaatcaaata ggaagagcga attaaaggac accgagacag gcaaggtgct gtcaagcatc 480
cagctgaatg aaaagcgcct gagcctgtac aggacagtgg gcgagatgtg gatgaaagac 540
ccggacttct caaaatacga ccgcaagcgc aacagcccga acgagtacgt gttctctgtg 600
tctagggccg agctggagaa ggagatcgtg acactgttcg ccgctcagag gaggttccag 660
tctccatacg cctctaagga tctgcaagag acatacctgc agatctggac acaccagctg 720
ccattcgcct ctggcaatgc catcctgaat aaagtgggct actgctctct attaaagggc 780
aaggagagga ggattccaaa ggccacctat acattccagt acttcagcgc cctggaccag 840
gtgaatagga caaggctggg cccagatttc cagccattca caaaggagca gcgcgagatc 900
atcctgaata atatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960
acatactacg atataaggaa gtggctggag ctggatgaaa ccatccagtt caagggatta 1020
aactacgacc cgaacgagga gctgaagaaa atagagaaga agccgttcat aaacctgaag 1080
gccttctacg aaatcaacaa ggtggtggcc aactacagcg agcgaaccaa cgagaccttc 1140
agcaccctgg actacgacgg catcggctac gccctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaaatc aagccacaac ctgccgaagc gctgctacga cgaccaatta 1260
atcgaggagc tgctgagcct gagctatact aagttcggcc acctgagcct gaaggcaatc 1320
aaccacgtgc taagcatcat gcagaagggc aatacataca aggaggccgt ggaccagctg 1380
ggctacgaca ccagcggcct gaagaaggag aagcgcagca agttcctgcc gccgatcagc 1440
gacgagatca ccaacccgat cgtgaagcgc gccctgaccc aggccaggaa ggtggtgaac 1500
gccatcatca ggaggcacgg ctctccacat agcgtgcaca tcgagctggc cagggagctg 1560
tctaagaatc acgatgagag gacaaagatc gtgtcagccc aggacgagaa ctacaagaag 1620
aataagggcg ccatctctat cctgtctgag cacggcatcc tgaacccaac aggctacgac 1680
atcgtgaggt acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaaggag 1740
atcccagccg atacattctt caatgagctg aagaaggaga ggaatggcgc cccaatcctg 1800
gaggtggatc acatcctgcc atactctcag agcttcatcg attcatacca caacaaggtg 1860
ctggtgtaca gcgacgagaa caggaagaag ggcaatcgca tcccatacac atacttcctg 1920
gagaccaaca aggattggga ggccttcgag aggtacgtgc gcagcaacaa gttcttcagc 1980
aagaagaagc gcgagtacct gctgaagagg gcctacctgc ctagggagtc tgagctgatc 2040
aaggagaggc acctgaatga tacaaggtac gccagcacct tcctgaagaa cttcatcgag 2100
cagaacctac agttcaagga ggccgaggat aacccaagga agaggagggt tcagacagtg 2160
aatggcgtga tcacagccca cttcaggaag aggtggggcc tggagaagga taggcaggag 2220
acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280
acaagggtga cagagtacta ccagatcaag gagagcaaca agagcgtgaa gaagccatac 2340
ttcccaatgc catgggaggg cttcagggat gagctactgt ctcacctggc ctctcagcca 2400
atcgccaaga agatctctga ggagctgaag gccggctacc agtctctgga ttacatcttc 2460
gtgtctagga tgccaaagag gtctatcaca ggcgccgccc acaagcagac aatcatgagg 2520
aagggcggca tcgataagaa gggcaagaca atcatcatcg agaggctgca tctgaaggac 2580
atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tatggccaca 2640
tacgaggcca tcaagcagcg ctacctagag cacggcaaga actctaagaa ggccttcgag 2700
acaccactgt acaagccatc taagaagggc accggcaatc tgatcaagag ggtgaaggtg 2760
gagggccagg ccaagtcttt cgtgagggag gtgaatggcg gcgtggccca gaatggcgat 2820
ctggtgaggg tggatctgtt cgagaaggat gataagtact acatggtgcc aatctacgtg 2880
ccagatacag tgtgctctga gctgccaaag aaggtggtgg cctcttctaa gggctacgag 2940
cagtggctaa cactggataa cagcttcaca ttcaagttca gcctgtaccc atacgatctg 3000
gtgaggctgg tgaagggcga tgaggatagg ttcctgtact tcggcacact ggatatcgat 3060
agcgacaggc tgaacttcaa ggacgtgaac aagccgagca agaagaacga gtaccgctac 3120
agcctgaaga caatcgagga cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180
ctggtgagga aggagacaag gaggaatttc cac 3213
<210> 173
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07513.1大豆优化的"
<400> 173
atgagagagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatggggc 60
gtgattgagc tttcctggaa taaagatcgc gagcaatatg aaaagaccag gattgtggat 120
aagggagtga ggatgttcga taaggctgaa attcctaaga ctggagcttc tcttgctgaa 180
ccaagaagaa ttgctagatc tagcaggagg agattaaaca ggaagtctca gcgcaagaag 240
gatataagga accttctcgt tcagcatgaa atcatttccc agaaggaatt aacctctctc 300
taccctctct ccaaatcaag catggacatc tgggatataa ggcttgatgg actcgatagg 360
cttcttgata gatttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420
aaatcaaacc gcaagtccga attaaaggat gttgagactg gaaaggtgct ttcaagcatc 480
caggtgaatg aaaagaggct ttctttgtat aggactgttg gggagatgtg gatgaaaaac 540
gccgattgct caaaatatgg aaagaggagg aactctccta acgagtacgt gttttctgtt 600
tctagggctg atcttgagaa ggagattgtg actctttttg aggctcagag gaagttccac 660
tcttcttacg cttctgtgga tctccaaaag acatacattc agatttgggc tcatcagctt 720
ccttttgctt ctggaaacgc cattgtgaat aaagtgggat actgctccct attaaaggga 780
aaggagaaga gagtgcctaa ggctacctat acattccagt acttcaatac cctcgatcaa 840
atcaacagaa ctaggcttgg acctaacttc cagcctttta ctaaggagca gagggatata 900
atcctcgata aaatgttcca gcgcaccgac tactataaaa agaagaccat ccccgaggtg 960
acctactacg atataagaaa gtggcttgct ctcgatgaaa ccattcagtt caagggacta 1020
acttatgacc ccaacgagga gctgaagaaa atagagatga aacccttcat aaacctcaag 1080
cccttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaggtgttc 1140
tctgctcttg attacgatac tgtggcttac gctcttaccg tgtataaaac cgacaaggat 1200
ataaggtctt acctcaagcg ctccaataat ctctctaaga ggtgctacga cgatcaatta 1260
attgaggagc ttctcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320
aaccatgtgc ttccaataat gcaagaggga agaacttacc aagaggcaat acaccagctt 1380
ggatacgata caaccaacct caagaaggag aatagaagca tgttcctccc aatcatccct 1440
gatgaaataa ccaaccctat tgtgaagaga gctttgactc aagctaggaa ggtggtgaat 1500
gcaataatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc cagggaatta 1560
agcaagtctc atgatgagag gaagaagatt atgactgctc acgacgagaa ctacaagaag 1620
aacaagggag ctgtgtccat tctcattgat aacggaattc ttaaccctac cggatacgat 1680
attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaagaag 1740
attcctgcta acaccttctt caacgagctt aagaaggaaa gatctggacc tcctgttctt 1800
gaggtggatc acattctacc ttactcccag tccttcattg attcttacca taacaaggtg 1860
cttgtttacg gagatgagaa ccaaaagaag gggaacagga ttccttacac tttcttctct 1920
gaagaagata aggagtggga gtctttcgag tcttacgtga ggtccaactc cttcttctct 1980
aagaagaaga ggggatacct tcttaagaag gcttatcttc ctagggagtc taaccttatt 2040
aaggagaggc accttaacga taccaggtac gcttcatctt acctcaagaa cttcatcgag 2100
aagaacctta agttcaagga ggctgtggga attactagga agaagtacgt tcagactgtg 2160
aacggagtga ttactgctca tcttagaaag agatggggac ttgagaagga taggcaagag 2220
acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca ccatatggtg 2280
actaaggtta ccgagtacta ccaaattaag gaggggaaca agtccatcaa gaagccttat 2340
tttcctctac cttggatggg attcagggag gagattcttt ctcatcttga gtctcaacct 2400
atcgctagaa agatttccga ggagcttaag attggatacc agtcccctga ttacattctt 2460
gtgtctagaa tgcctaagag gtctgttact ggatctgctc atgatcagac tgtgatgaag 2520
aagggggata ttgataagaa ggggaagacc atcattatta agagggtgca cctcaaggac 2580
atcaagttcg atgagaacgg agatttcaag atggttggaa aggagcagga tctagctact 2640
tacgaggcta ttaagcagag gtatcttgag tataggaagg agtctaagaa ggctttcgag 2700
actcctcttt acaagccttc taagaaggga aaggggaacc tcatcaagaa gattaaggtt 2760
gaggttcaga ctaagtcttt cgtgagggag attaatggag gagttgctca gaatggagat 2820
cttgtgaggg ttgatctttt cgagaaggac aacaggtact acatggtgcc tatctacgtt 2880
gttgatactg ttaggtctga gctacctaac aaggctgtta cttcttctaa gggatacgag 2940
cagtggctct ctattgataa ctctttcacc ttcaagttct ctctctaccc ttacgatctt 3000
gttaggcttg ttaagggaga tgaggatagg ttcctctact tctccaccct cgatattaac 3060
tctgataggc tcaacttcaa ggatgtgaac aagccttcta agcaagctga gtacaggtac 3120
tctcttaaga ccattgagaa ccttgagaag tacgagattg gagttcttgg agatctaagg 3180
cttgttaggc aggagaccag gaagattttc aag 3213
<210> 174
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07513.1玉米优化的"
<400> 174
atgcgcgagc tagattacag gatcggcctg gatatcggca ctaactcaat cggctggggc 60
gtgatcgagc tgagctggaa taaagatcgc gagcagtatg aaaagaccag gatcgtggac 120
aagggcgtga ggatgttcga taaggccgag atcccaaaga caggcgcctc tctggccgaa 180
ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gcgcaagaag 240
gatataagga acctgctggt ccagcatgaa atcatcagcc agaaggagct gacaagcctg 300
tacccgctga gcaagtcaag catggacatc tgggatataa ggctggatgg cctggatagg 360
ctgctggata ggttcgagtg ggccaggctg ctgatacatc tggcccagag gaggggcttc 420
aaatcaaatc gcaagagcga attaaaggac gtggagacag gcaaggtgct gtcaagcatt 480
caggtgaatg aaaagaggct gagcctgtac aggacagtgg gcgagatgtg gatgaaaaac 540
gccgactgct caaaatacgg caagcgccgc aacagcccaa acgagtacgt gttctctgtg 600
tctagggccg atctggagaa ggagatcgtg acactgttcg aggcccagag gaagttccac 660
tcttcttacg cctctgtgga cctgcagaag acatacatcc agatctgggc ccaccagctg 720
ccattcgcct ctggcaatgc catcgtgaat aaagtgggct actgctctct attaaagggc 780
aaggagaaga gggtgccaaa ggccacctat acattccagt acttcaatac cctggaccaa 840
atcaacagga cccgcctggg cccaaacttc cagccattca caaaggagca gcgcgatata 900
atcctggata aaatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960
acatactacg atataaggaa gtggctggcc ctggatgaaa ccatccagtt caagggccta 1020
acctacgacc cgaacgagga gctgaagaag atcgagatga aaccgttcat aaacctgaag 1080
ccgttctacg aaatcaagaa ggtggtaacc aactacgcca agaaaaccaa cgaggtgttc 1140
agcgccctgg actacgacac cgtggcctac gccctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaagcg cagcaataat ctgagcaagc gctgctacga cgaccaatta 1260
atcgaggagc tgctgaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320
aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380
ggctacgaca caaccaacct gaagaaggag aaccgaagca tgttcctgcc aataatcccg 1440
gacgagataa ccaacccgat cgtgaagcgc gccctgaccc aggcccgcaa ggtggtgaac 1500
gcaataatcc gccgctacgg ctcaccgaac agcgtgcaca ttgagctggc ccgcgaatta 1560
agcaagagcc acgacgagcg caagaagatc atgaccgccc acgatgaaaa ctacaagaaa 1620
aataagggcg ccgtgagcat cctgatcgac aacggcatcc tgaacccgac cggctacgac 1680
atcgtgcgct acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaagaag 1740
atcccagcca acaccttctt caacgagctg aagaaggaga ggtctggccc accagtgctg 1800
gaggtggatc acatcctgcc atactcacag agcttcatcg atagctacca caacaaggtg 1860
ctggtgtacg gcgatgagaa ccagaagaag ggcaatcgca tcccatacac attcttcagc 1920
gaggaggata aggagtggga gagcttcgag agctacgtga ggagcaacag cttcttcagc 1980
aagaagaaga ggggctacct gctgaagaag gcctacctgc caagggagtc taacctgatc 2040
aaggagaggc acctgaacga tacaaggtac gccagcagct acctaaagaa cttcatcgag 2100
aagaacctga agttcaagga ggccgtgggc atcacccgca agaagtacgt ccagacagtg 2160
aacggcgtga tcacagccca cctgaggaag aggtggggcc tggagaagga taggcaggag 2220
acatacctgc atcacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280
acaaaggtga cagagtacta ccagatcaag gagggcaaca agagcatcaa gaagccatac 2340
ttcccactac catggatggg cttcagggag gagatcctgt ctcacctgga gtctcagcca 2400
atcgccagga agatctctga ggagctgaag atcggctacc agtctccaga ttacatcctg 2460
gtgtctagga tgccaaagag gtctgtgaca ggctctgccc acgatcagac agtgatgaag 2520
aagggcgata tcgacaagaa gggcaagacc atcatcatca agagggtgca cctgaaggac 2580
atcaagttcg acgagaacgg cgacttcaag atggtgggca aggagcagga tctagccaca 2640
tacgaggcca tcaagcagcg ctacctggag tacaggaagg agtctaagaa ggccttcgag 2700
acaccactgt acaagccatc taagaagggc aagggcaacc tgatcaagaa gatcaaggtg 2760
gaggtccaga ccaagagctt cgtgagggag atcaatggcg gcgtggccca gaatggcgat 2820
ctggtgaggg tggatctgtt cgagaaggat aacaggtact acatggtgcc aatctacgtg 2880
gtggatacag tgaggagcga gctaccaaac aaggccgtga catcttctaa gggctacgag 2940
cagtggctga gcatcgacaa cagcttcacc ttcaagttca gcctgtaccc atacgatctg 3000
gtgaggctgg tgaagggcga tgaggacagg ttcctgtact tcagcacact ggacatcaac 3060
agcgacaggc tgaacttcaa ggacgtgaac aagccatcta agcaggccga gtacaggtac 3120
agcctgaaga ccatcgagaa cctggagaag tacgagatcg gcgtgctggg cgatctaagg 3180
ctggtgaggc aggagacaag gaagatcttc aag 3213
<210> 175
<211> 3216
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG08290.1大豆优化的"
<400> 175
atgtctgagc tagattacag gatcggactc gatatcggaa ctaattcaat tggatgggga 60
gtgattgagc ttttctggaa taaagatcgc gagcgctatg aaaaggttag gattgtggat 120
aagggagtga ggatgttcga taaggccgag attcctaata aaggagcttc acttgctgaa 180
ccaagaagga ttgctagatc tagcaggagg agattaaaca ggaagtctca gaggaagaag 240
gagattagga accttcttgt tcagcacgga atgattactc aggaggagct tgatcttctc 300
taccctctct ccaagaaatc aatcgatatc tgggatataa ggcttgatgg actcgatagg 360
ctattaaacc atcttgagtg ggctaggctt ctaatacacc ttgctcaaag aaggggcttc 420
aaatcaaacc gcaagtccga attaaaggat gctgagactg gaaaggttct ttcaagcatc 480
caggtgaatg aaaagaggct tttcttgtat aggactgtgg gcgagatgtg gataaaagat 540
gccgagttct caaaatatga taggaggagg aactctccta acgagtacgt gttttctgtt 600
tctagggctg atcttgagaa ggagattgtg actttgtttg aggctcaacg caagttccaa 660
tcaagctacg cttctaagaa ccttcaagag acctaccttc aaatttgggc tcatcagctt 720
ccttttgctt ccgggaacgc tattctcaat aaagtgggat actgctcctt attaaaggga 780
aaggagagaa ggattcctaa ggccacctat acattccagt acttctctgc tcttgatcaa 840
gtgaatagaa ctaggcttgg acctgatttc caacctttca ctcaggagca gaaggaaata 900
atcctcgata aaatgttcca gcgcaccgac tactataaaa agaagaccat ccccgaggtg 960
tcctactacg atataagaaa gtggcttgag cttgatgaaa ccattcagtt caagggatta 1020
aactacgacc ccaacgagga gctgaagaaa atagagaaga agcccttcat aaacctcaag 1080
gccttctacg aaatcaagaa ggtggttgct aactacgctg aacgaaccaa cgaagcattc 1140
tctaccctcg attacgatgc tattgcttac gctcttaccg tgtataaaac cgacaaggat 1200
ataaggtcct acctcaagaa atcaaacaac ctctccaaga ggtgctacga cgatcaatta 1260
atcgaggagc ttttcaccct ctcctatact aagttcggac acctctcttt caaggcaatc 1320
aaccatgtgc ttcctattat gcaagaggga agaacttacc aagaggctat tcatcagctt 1380
ggatacgata ccaccaacct taagaaggag aacaggtcta tgttcctccc tctcattcct 1440
gatgagatta ctaaccctat tgtgaagagg gctattactc aagctaggaa ggtggtgaat 1500
gctattatta ggaggtacgg atcacctaac tctgtgcata ttgagcttgc tagggagctt 1560
tctaagtctc atgatgagag gaagaagatt atgactgctc acgacgagaa ctacaagaag 1620
aacaaggggg ctatttccat tctcattgag aacggaattc ttaaccctac cggatacgat 1680
attgtgaggt acaagttgtg gaaggagcaa ggagagagat gcgcttactc tcttaaggaa 1740
attcctcctg ataccttctt caacgagctt aagaaggaga ggaacggatc acctattctt 1800
gaggtggatc acattcttcc ttactcccag tccttcattg attcttacca taacaaggtg 1860
cttgtgtatt ccgatgagaa caggaacaag ggaaacagga ttccttacac ctacttcctt 1920
gagactaata aggattggga ggcttttgag aggtatgtga ggtctaacaa gctcttctct 1980
aagaagaaga gggagtacct ccttaagaag acttaccttc ctagggagtc tgagcttatt 2040
aaggagaggc atctaaacga taccaggtac gcttctacct tcctcaagaa cttcattgag 2100
cagaaccttc aattcaagga ggttgaggtt aaccttagga agaagagggt tcagactgtg 2160
aacggagtta ttactgctca tcttagaaag agatggggac ttgagaagaa caggcaagag 2220
acttaccttc atcacgctat ggatgctatt attgtggctt gcactgatca tcacatggtg 2280
actaggatta ccgagtacta ccagattaag gagtcaaaca agtctgtgaa gaagccttat 2340
tttcctatgc cttgggaggg attcagggat gagcttcttt ctcatcttgc ttctcagcct 2400
atcgctaaga agatttctga agagcttaag gctggatacc agtcctctga ttacattttc 2460
gtgtctagaa tgcctaagag gtctgttact ggagctgctc atgatcaaac tattaggagg 2520
aagggaggaa ttgataagaa ggggaagacc atcattatta agagggtgag gctaaaggac 2580
atcaagttcg atgagaacgg ggatttcaag atggttggaa aggagcagga tcttgctact 2640
tacgaggcta ttaagcagag atatcttgag cacaggaaga actctaagaa ggctttcgag 2700
actcctcttt acaagccttc taagaaggga accggaaacc ttatcaagag agttaagatt 2760
gagggacaga ctaaggcttt cgttagagag gttaatggag gagttgctca gaactctgat 2820
cttgtgaggg ttgatctatt cgagaaggac gataagtact acatggtgcc tatctacgtt 2880
cctgatactg tttgttccga gcttcctaag aaggttgtta agtctggaaa gggatacgag 2940
caatggctta cccttgataa ctctttcacc ttcaagtctt ctctctaccc ttacgatctt 3000
gttaggcttg ttaagggaaa cgaggatagg ttcctttact tcgggaccct cgatattgat 3060
tctgataggc tcaacttcaa ggatgtgaac aagccttcaa agcaaaacga gtacaggtac 3120
tctctcaaga ccattgagaa ccttgagaag tacgaagtgg gagttcttgg agatcttagg 3180
cttgttaagc aagagaccag gaggattttc aatagg 3216
<210> 176
<211> 3216
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG08290.1玉米优化的"
<400> 176
atgtcagagc tggactacag gatcggcctg gacataggca ctaattcaat cggctggggc 60
gtgatcgagc tgttctggaa taaagaccgc gagcgctatg aaaaggtgcg catcgtggac 120
aagggcgtta ggatgttcga taaggccgag atcccgaata aaggcgcctc actagccgaa 180
ccaaggagga tcgccaggtc ttctaggagg agattaaaca ggaagtctca gaggaagaag 240
gagatcagga acctgctggt ccagcacggc atgatcacac aggaggagct ggatctgctg 300
tacccactga gcaagaaaag cattgacatc tgggacatca ggctagatgg cctggacagg 360
ctgctgaatc acctggagtg ggccaggctg ctgatacatc tggcccagag gaggggcttc 420
aaatcaaatc gcaagtctga attaaaggat gccgagacag gcaaggtgct gtcaagcatc 480
caggtgaatg aaaagaggct gttcctctac cgcacagtgg gcgagatgtg gataaaagac 540
gccgagttca gcaagtacga caggaggagg aacagcccaa acgagtacgt gttctctgtg 600
tcaagggccg atctggagaa ggagatcgtg acactgtttg aggctcagcg caagttccaa 660
tcaagctacg ccagcaagaa cctgcaagag acctacctgc agatctgggc ccaccagctg 720
ccattcgcta gcggcaatgc catcctgaat aaagtgggct actgctctct attaaagggc 780
aaggagagga ggattccaaa ggccacctat acattccagt acttcagcgc cctggaccag 840
gtgaatagga caaggctggg cccagatttc cagccattca cacaggagca gaaggaaata 900
atcctggata aaatgttcca gcgcaccgac tactataaaa agaagaccat cccggaggtg 960
tcatactacg atataaggaa gtggctggag ctggatgaaa ccatccagtt caagggatta 1020
aactacgacc cgaacgagga gctgaagaaa atagagaaga agccgttcat aaacctgaag 1080
gccttctacg aaatcaagaa ggtggtggcc aactacgccg agcgaaccaa cgaagcattc 1140
agcaccctgg actacgacgc catcgcctac gccctgaccg tgtataaaac cgacaaggat 1200
ataaggtcat acctgaagaa atcaaacaac ctgagcaagc gctgctacga cgaccaatta 1260
atcgaggagc tgttcaccct gagctatact aagttcggcc acctgagctt caaggcaatc 1320
aaccacgtgc tgccaataat gcaggagggc cgcacctacc aggaggcaat acaccagctg 1380
ggctacgaca ccaccaacct gaagaaggag aaccgcagca tgttcctgcc gctaatcccg 1440
gacgagatca ccaacccgat cgtgaagcgc gccatcaccc aggctaggaa ggtggtgaac 1500
gccatcatcc gccgctacgg cagcccgaac agcgtgcaca tcgagctggc ccgcgagctg 1560
agcaagagcc acgacgagcg caagaagatc atgacagccc acgacgagaa ctacaagaag 1620
aacaagggcg ccatctcaat cctgatcgag aacggcatcc tgaacccaac cggctatgac 1680
atcgtgcgct acaagctgtg gaaggagcag ggcgagaggt gcgcctactc tctgaaggag 1740
atcccaccag atacattctt caacgagctg aagaaggaga ggaatggctc tccaatcctg 1800
gaggtggatc acatcctgcc atacagccag tcattcatcg acagctacca caacaaggtg 1860
ctggtgtaca gcgatgagaa caggaacaag ggcaaccgca tcccgtacac atacttcctg 1920
gagaccaaca aggattggga ggccttcgag aggtacgtga ggagcaacaa gctgttcagc 1980
aagaagaagc gcgagtacct gctgaagaag acctacctgc caagggagtc agagctgatc 2040
aaggagaggc acctgaacga tacaaggtac gctagcacct tcctgaagaa cttcatcgag 2100
cagaacctgc agttcaagga ggtggaggtg aacctgagga agaagcgcgt tcagacagtg 2160
aacggcgtga tcacagccca cctgaggaag aggtggggcc tggagaagaa taggcaggag 2220
acatacctac accacgccat ggatgccatc atcgtggctt gcacagatca ccacatggtg 2280
acaaggatca cagagtacta ccagatcaag gagagcaaca agagcgtgaa gaagccatac 2340
ttcccaatgc catgggaggg cttcagggat gagctgctgt ctcacctggc ctctcagcca 2400
atcgccaaga agatctcaga ggagctgaag gccggctacc agtcttctga ttacatcttc 2460
gtgtctagga tgccaaagag gtctgtgaca ggcgccgccc acgatcagac aatcaggagg 2520
aagggcggca tcgataagaa gggcaagaca atcatcatca agagggtgag gctgaaggat 2580
atcaagttcg atgagaacgg cgatttcaag atggtgggca aggagcagga tctagccaca 2640
tacgaggcca tcaagcagcg ctacctggag cacaggaaga actctaagaa ggccttcgag 2700
acaccactgt acaagccatc taagaagggc accggcaatc tgatcaagag ggtgaagatc 2760
gagggccaga caaaggcctt cgtgagggag gtgaatggcg gcgtggccca gaattctgat 2820
ctggtgaggg tggatctatt cgagaaggac gataagtact acatggtgcc aatctacgtg 2880
ccagatacag tgtgctccga gctgccaaag aaggtggtga agtctggcaa gggctacgag 2940
cagtggctca cactggataa cagcttcaca ttcaagagca gcctgtaccc atacgatctg 3000
gtgaggctgg tgaagggcaa tgaggacagg ttcctgtact tcggcacact agacatcgat 3060
agcgacaggc tgaacttcaa ggacgtgaac aagccaagca agcagaacga gtaccgctac 3120
agcctgaaga ccatcgagaa cctggagaag tacgaggtgg gcgtgctggg cgatctgagg 3180
ctggtgaagc aggagacaag gaggatcttc aatagg 3216
<210> 177
<211> 4011
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05459.1大豆优化的"
<400> 177
atgaagaagg actacgtgat cggactagat attggaacta actctgtggg atgggctgtt 60
atgactgagg attaccagct agttaagaag aagatgccca tctacgggaa tacagagaag 120
aagaagatca agaagaactt ctggggagtg agactatttg aagagggtca tactgctgag 180
gataggagat taaagagaac tgctaggaga aggatttcta ggaggaggaa caggcttcgt 240
taccttcaag cattctttga agaggctatg accgctctag atgaaaattt cttcgctagg 300
cttcaggagt cttttcttgt gcctgaggat aaaaagtggc acaggcatcc tatttttgct 360
aagttagagg atgaggtggc ttaccatgaa acctacccta ctatctacca ccttaggaag 420
aagttggctg attcttcaga gcaagccgac ttgagattaa tctaccttgc tcttgcccac 480
attgtaaaat ataggggaca cttccttatc gagggaaaac tctccaccga aaatatttca 540
gtgaaggagc agtttcagca gttcatgatc atctataacc aaaccttcgt gaacggagaa 600
tcaaggcttg tgtctgctcc tcttcctgag tccgtattaa ttgaggagga acttactgag 660
aaagcatcca gaaccaagaa gtctgagaag gttcttcaac agtttcctca agagaaggct 720
aacggacttt tcggacagtt cctcaaatta atggtgggga ataaagccga cttcaagaag 780
gtttttggac ttgaggagga ggccaaaata acttacgctt ctgagtctta tgaggaggat 840
cttgagggaa tactagctaa ggtgggagat gaatacagcg atgttttcct tgctgctaag 900
aacgtttacg acgctgtgga attaagcacc atactagctg actccgataa aaagtctcac 960
gccaaactct cttcaagcat gattgttagg ttcactgagc atcaggagga tcttaagaag 1020
ttcaagaggt tcattaggga gaactgccct gatgagtacg ataacctttt caagaacgag 1080
caaaaggatg ggtacgctgg atacattgct catgctggaa aggtgtcaca attaaagttc 1140
taccagtacg tgaagaaaat aatccaggat atcgctggag ccgagtactt ccttgagaaa 1200
atagctcagg agaacttcct taggaagcag aggactttcg ataacggagt gattcctcac 1260
caaatacacc ttgctgagct acaggcaata attcataggc aagctgcata ctatcctttc 1320
ctcaaggaga atcaagagaa aatagagcag ctcgtgacct tcagaattcc atactacgtg 1380
ggacctcttt ctaagggaga tgcttctact tttgcttggc ttaagagaca gtcagaggaa 1440
ccaattaggc cttggaatct tcaagagact gtggatcttg atcaatctgc tactgctttc 1500
atagagagga tgaccaactt cgatacatac cttccttctg agaaggtgct ccctaagcat 1560
tctctcctct atgaaaagtt catggtgttc aacgagctaa ccaaaatatc ctacaccgac 1620
gataggggaa tcaaggctaa tttctctgga aaggagaagg agaaaatatt cgactacctc 1680
ttcaagacca ggaggaaggt gaagaagaag gacataatac agttctaccg caacgaatac 1740
aacaccgaga ttgtgacctt gtcaggactt gaggaggatc aattcaacgc ttctttctct 1800
acctaccagg atctattaaa gtgcggactt actagggctg agcttgatca tcctgataat 1860
gctgagaagc tggaggacat aatcaagata ctaaccatct tcgaggatag gcaaaggatt 1920
aggacccagc tttctacttt caagggacaa ttctctgctg aggttcttaa gaagttggag 1980
aggaagcatt atactggatg gggaaggctc tctaagaagc tcattaacgg aatctacgat 2040
aaggagtcag ggaagaccat cctagattac ctcattaagg atgatggagt gtctaagcac 2100
tacaacagga acttcatgca gctcattaac gattcccagc tctccttcaa gaacgctatt 2160
caaaaggctc aatcttctga gcatgaagag actctttctg agactgttaa cgaattagct 2220
gggtcccctg ctattaagaa gggaatctac cagtctctca agattgtgga tgagcttgtg 2280
gctattatgg gatatgctcc taagaggatt gttgttgaga tggctaggga gaaccaaact 2340
acttctactg gaaagaggag gtctattcag aggctaaaga ttgttgaaaa ggctatggct 2400
gagattggat ctaaccttct taaggagcag cctactacta acgagcaact tagggatacc 2460
aggctcttcc tttactacat gcagaacgga aaggatatgt acactggaga tgagctttct 2520
cttcataggc tctcacacta cgacatagat cacattatcc ctcagtcctt catgaaggat 2580
gattctctcg ataaccttgt gcttgtggga tctactgaga ataggggaaa gtctgatgat 2640
gttccttcta aggaggtggt taaggatatg aaggcttact gggagaaact atacgctgct 2700
ggacttattt ctcaaaggaa gttccagaga cttactaagg gagagcaagg aggacttact 2760
cttgaggata aggctcattt cattcaaagg cagcttgttg agaccaggca gattactaag 2820
aacgtggctg gaattctaga tcaaaggtac aacgctaact ctaaggagaa gaaggttcag 2880
atcattaccc tcaaggcttc tcttacctcc cagttcaggt ctattttcgg actttacaag 2940
gttagggagg tgaacgatta ccatcatgga caagatgctt accttaactg cgtggttgct 3000
actactctac ttaaggttta tcctaacctt gctcctgagt tcgtttacgg agagtatcct 3060
aagttccagg ctttcaagga gaataaggct accgctaaga ccattatcta caccaacctt 3120
atgaggttct ttactgagga tgagcctagg tttatgaagg atggagagat tctctggtca 3180
aactcctacc tcaagaacat caagaaggag cttaactacc accagatgaa cattgtgaag 3240
aaggtggagg ttcaaaaggg aggattctcc aaggagtcta ttaagcctaa gggaccttct 3300
aacaagctca ttcctgtgaa gaacggactt gatcctcaaa agtacggagg attcgattca 3360
cctgttgttg cttacactgt tcttttcact cacgaaaagg ggaagaagcc tctcattaag 3420
caggagattc tcggaattac cattatggag aagactaggt tcgagcagaa ccctattctt 3480
tttctagagg agaagggatt tcttaggcct agggttctta tgaagctccc taagtacact 3540
ctttatgagt ttcctgaggg aagaaggaga cttcttgctt ctgctaagga ggctcaaaag 3600
ggaaaccaaa tggttcttcc tgagcacctt cttactcttc tttaccatgc taagcaatgc 3660
ctacttccta accaatctga gtctcttgct tacgtagaac aacatcaacc tgagttccaa 3720
gagattcttg agagggttgt ggatttcgct gaggttcata cccttgctaa gtctaaggtt 3780
cagcagattg ttaagttgtt cgaggctaac cagactgctg atgttaagga gatcgctgct 3840
tcattcattc agcttatgca attcaatgct atgggtgctc cttctacctt caagttcttc 3900
cagaaggata tagagagggc taggtacacc tccatcaagg agattttcga tgctaccatt 3960
atctaccagt ctactactgg actttatgag actaggagga aggtggttga t 4011
<210> 178
<211> 4011
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05459.1玉米优化的"
<400> 178
atgaaaaagg actacgtgat cggcctggac atcggcacta attcagtggg ctgggccgtg 60
atgacagagg actaccagct ggtgaagaag aagatgccta tctacggcaa cactgagaag 120
aagaagatca agaagaactt ctggggcgtg cgcctattcg aggagggcca cacagccgag 180
gaccgcagat taaagaggac agccaggagg aggatctcta ggaggaggaa taggctgcgc 240
tacctgcaag cattcttcga ggaggccatg acagccctgg atgaaaattt cttcgccagg 300
ctgcaggagt ctttcctagt gccggaggat aaaaagtggc acaggcaccc tatcttcgcc 360
aagctggagg atgaggtggc ctaccatgaa acatacccaa caatctacca cctgaggaag 420
aagctggccg attcttctga gcaggccgac ctgagattaa tctacctggc cctggcccac 480
atcgtcaaat acaggggcca cttcctgatc gagggcaaac tgagcacaga aaatatcagc 540
gtgaaggagc agttccagca gttcatgatc atctataacc aaaccttcgt gaacggcgaa 600
tcaaggctgg tgagcgcccc actgccggag agcgtattaa tcgaggagga actgaccgag 660
aaagcatccc gaaccaagaa gagcgagaag gtgctgcagc agttcccgca agagaaggct 720
aatggcctgt tcggtcagtt cctgaaactg atggtgggca ataaagccga cttcaagaag 780
gtgttcggcc tagaggagga ggccaaaata acctacgcca gcgagagcta cgaggaggac 840
ctggagggca tactagccaa ggtgggcgat gaatacagcg atgtgttcct ggccgccaag 900
aatgtgtacg atgccgtgga gctgtctaca atactagccg acagcgataa aaagagccac 960
gccaagctct cttcaagcat gatcgtgagg ttcacagagc atcaggagga cctgaagaag 1020
ttcaagcgct tcatcaggga gaactgcccg gacgagtacg acaacctgtt caagaacgag 1080
cagaaggatg gctacgccgg atacatcgcc cacgccggta aggtgtccca attaaagttc 1140
taccagtacg tgaagaaaat aatccaggac atcgccggcg ccgagtactt cctggagaaa 1200
atagcccagg agaacttcct gcgcaagcag aggacattcg acaacggcgt catcccgcac 1260
cagatacatc tggccgagct gcaggccatc atacataggc aggccgcata ctacccattc 1320
ctaaaggaga accaagagaa aatagagcag ctggtgacct tccgcatccc atactacgtg 1380
ggcccactgt ctaagggcga tgcctctaca ttcgcctggc tgaagaggca gtctgaggaa 1440
ccaatcaggc catggaatct gcaagagaca gtggatctgg atcagtctgc cacagccttc 1500
atcgagagga tgaccaactt cgatacatac ctaccaagcg agaaggtgct gccaaagcat 1560
agcctgctgt atgaaaagtt catggtgttc aacgagctaa ccaagatcag ctacaccgac 1620
gaccgcggaa tcaaggccaa cttcagcggc aaggagaagg agaaaatatt cgactacctg 1680
ttcaagaccc gccgcaaggt gaagaagaag gacataatac agttctaccg caacgaatac 1740
aacaccgaga tcgtgaccct gagcggcctt gaggaggacc agttcaacgc cagcttctca 1800
acctaccagg acctattaaa gtgcggcctg acccgcgccg agctggacca cccggataac 1860
gccgagaagc tggaggacat aatcaagata ctaaccatct tcgaggaccg ccagcgcatc 1920
cgcacccaat taagcacctt caagggccag ttcagcgccg aggtattaaa gaagctggag 1980
cgcaagcatt acacaggctg gggcaggctg agcaagaagc taatcaacgg catctacgac 2040
aaggagagcg gcaagaccat ccttgactac ctgatcaagg acgatggcgt gagcaagcac 2100
tacaaccgca acttcatgca gctgatcaac gacagccagc tgagcttcaa gaacgccatc 2160
cagaaggccc agtcttctga gcacgaggag acactgtctg agacagtgaa tgagctggcc 2220
ggctcaccag ccatcaagaa gggcatctac cagtctctga agatcgtgga tgagctggtg 2280
gccatcatgg gctacgcccc aaagaggatc gtggtggaga tggccaggga gaatcagaca 2340
acatcaacag gcaagaggag gtctatccag aggctgaaga tcgtggagaa ggccatggcc 2400
gagatcggct ctaatctgct gaaggagcag ccaacaacaa atgagcagct gagggataca 2460
aggctgttcc tgtactacat gcagaatggc aaggatatgt acacaggcga tgagctgtct 2520
ctgcataggc tgagccacta cgacatcgat cacatcatcc cgcagtcatt catgaaggac 2580
gactctctgg ataatctggt gctggtgggc tctacagaga acaggggcaa gagcgatgat 2640
gtgccatcta aggaggtggt gaaggatatg aaggcctact gggagaagct gtacgccgcc 2700
ggcctgatct ctcagaggaa gttccagagg ctgacaaagg gcgagcaggg cggcctgaca 2760
ctggaggata aggcccactt catccagagg cagctagtgg agacaaggca gatcacaaag 2820
aatgtggccg gcatcctgga tcagaggtac aatgccaatt ctaaggagaa gaaggttcag 2880
atcatcacac tgaaggcctc tctgacatct cagttcaggt ctatcttcgg cctgtacaag 2940
gtgcgcgagg tgaatgatta ccaccacggc caggatgcct acctgaattg cgtggtggcc 3000
acaacactac tgaaggtgta cccaaatctg gccccagagt tcgtgtacgg cgagtaccca 3060
aagttccagg ccttcaagga gaataaggcc acagccaaga caatcatcta cacaaacctg 3120
atgaggttct tcacagagga cgagccaagg ttcatgaagg atggcgagat cctgtggagc 3180
aacagctacc tgaagaacat caagaaggag ctgaactacc accagatgaa catcgtgaag 3240
aaggtggagg tccagaaggg cggcttctca aaggagagca tcaagccgaa gggcccgagc 3300
aacaagctga tcccagtgaa gaatggcctg gacccacaga agtacggcgg ctttgattct 3360
ccagtggtgg cctacacagt gctgttcaca cacgagaagg gcaagaagcc actgatcaag 3420
caggagatcc tgggcatcac aatcatggag aagacaaggt tcgagcagaa cccaatcctg 3480
ttcctggagg agaagggctt cctgaggcca agggtgctga tgaagctacc aaagtacaca 3540
ctgtacgagt tcccagaggg caggaggagg ctgctggcct ctgccaagga ggcccagaag 3600
ggcaatcaga tggtgctgcc tgagcacctg ctgacactgc tgtaccacgc caagcagtgc 3660
ctgctgccaa atcagtctga gtctctggcc tacgtggagc agcaccagcc agagttccag 3720
gagatcctgg agagggtggt ggatttcgcc gaggtgcaca cactggctaa gtctaaggtt 3780
cagcagatcg tgaagctgtt cgaggccaat cagacagccg atgtgaagga gatcgccgcc 3840
tcattcatcc agctgatgca gttcaatgcc atgggcgccc catctacatt caagttcttc 3900
cagaaggata tcgagagggc caggtacaca tctatcaagg agatcttcga tgccacaatc 3960
atctaccagt ctacaacagg cctgtacgag acaaggagga aggtggtgga t 4011
<210> 179
<211> 4308
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG04583.1大豆优化的"
<400> 179
atggccaaaa atattctagg actcgatctc ggaaccaact ctattggatg ggctcttgtt 60
cagcaggact ttgaaaataa ggaggggaac atactaggaa tggggtccag aataattcct 120
atgtctcagg atatactagg agagttcggg aagggtaact ctatttctca aactgctgag 180
agaactggat ataggggagt tagaaggtta agggagagac atcttcttag aagggagagg 240
cttcataggg tgcttcatct tcttggattc ctacctaagc attacgacga gaaaatagac 300
ttcactcaga ggttcgggaa gttcatcaat caagctgaac caaagttggc tttcgattca 360
gagttcctct tcaaggactc cttccatgaa atgctagctg acttcaagca gaatcaacct 420
gagttcctca aggataaaaa cggagaggat tgccttgttc cttacgactg gactatatac 480
tacctaagga agaaagcatt gacccagaag atcgaaaaat atgagctggc ctggctcatc 540
ctcaacttca atcaaaagag gggatactat caattaaggg gagaggagga gaaggagaac 600
cctaataaac tcgtggggtt ccactctctc aaaatagtgg atgttattcc tgacgctgaa 660
accaataaaa agggagagac ctggtactca cttcatcttg agaacggatg ggtttatagg 720
aggtcctcca aaatatctct cgctgattgg aaggacaaag tgagggattt cattgtgacc 780
accgatctta atgatgatgg atcagagaag ctcgataagg atggaattgt gaagaggtct 840
tttagggctc cttctgctga tgactggacc ctattaaaga agaagaccga gaaggatatc 900
gacaactcta ataaaaccgt ggggacctac atctacgaca acctcctatt aaaccccaag 960
cagaaaatca agggaaagat ggttaggacc attgagagga agttctacaa gcaagagctg 1020
gagcagatat taaagactca gaaggagttc cattctgagc ttcagtctga gaacttgctt 1080
caagattgcg ttagggagct gtacaggaat aatgagcaac atcaacagat gcttgaggct 1140
aaggatttcg tgcacctctt cctcaacgat ataattttct accagaggcc tcttaggtcc 1200
cagaaatcaa gcatttctaa ttgcaccctt gagttccgca agtccaagaa tgaaaacgga 1260
gaggaggtaa tacacagatt aaaggtgatc gccaaatcaa acccatacta ccaggagttc 1320
aggcttcttc aatgggttca gaacctcgct atctatacta aggacgacga taagaacgta 1380
accaacgagt tcctcaaatc aactcaggat tgggaggatc ttcttaggtg gcttcactct 1440
aagaaggaaa tcaagcagga tgctctaatc aagttcctca ttgagaagaa gggactcaag 1500
gggaaagcat tgactattga ggtggcaaaa tataggtgga actacgttca ggataaggat 1560
taccctggaa atgaaacccg ctacctcatt caatcaaggc ttgataaggt tgagtacgct 1620
cctaaggatt tcctcaccta tgaaaatgaa atggccctct ggcatatcat ctactcaatc 1680
aacgacaaga tcgagtatga aaaggcatta aagtccttcg ccaataaaaa ggggctcgat 1740
gaggtgacct tcgtggaagc attcaagaag ttccctcctt tcaagtccga ttacggatct 1800
ttctctgaga aggcaatcaa gaagctcctt ccattaatga ggttcggaac tcaatggaac 1860
tgggataaca tcgaccaaaa tagcaaggag aggattggaa aaatactaac cggggagtac 1920
gatgaaaata ttaaagggag ggttagggag aaggctaggc accttaactc tgagaccgat 1980
tttcaagcat tacctctttg gcttgctcag tacgttgttt atggaaggca ctctgaagct 2040
gatattgctg gaaagtggaa ctctgtggat gatctcaagc agttccttga tgatttcaag 2100
cagcattcct tgaggaaccc tattgtggag caggttatta ctgagactct tagggctgtt 2160
aaggatattt ggaacttcta cggaaagggg gctaaggatt tcttctcaga aatacacatt 2220
gagcttggga gggagatgaa aaataccgct gatgaaagga agaggattac caccatggtg 2280
accgacaatg aaaataccaa cctcagaatc aaagcattgc ttgctgagat ggctcttgat 2340
cagaacgttg ataacgttag gccttactct cctatgcagc aggagattct taagatctat 2400
gaggagggag ttctaaacgc tgaggagaac atcgatgatg atatcctcaa gatttctaag 2460
actgctcagc cttctgctac cgatcttaag aggtataagt tgtggcttga gcaaaagtac 2520
aggtctcctt acactggaca gatgattcct cttaacaagt tgttcacccc tgagtacgag 2580
atcgagcaca ttattcctca gtctaggtac ttcgacgatt caatgtccaa caaggttatt 2640
tgcgaggctg ctgtgaacaa gttgaaggat aaccagattg gactcgtgtt cattaagaac 2700
catcatggag aggtggttga tttcggaatg ggaaagcagg tgaagattct tgaggtttct 2760
gattacgagg atttcgtgaa gcagaactat aacaagaaca ggggaaagag gaacaagctc 2820
ctcttagagg atatccctga gaagatgatt gagaggcagc ttaacgatac caggtacatc 2880
tctaagtaca ttacccaggt gctttccaac attgttaggg atgataagga gggatctaag 2940
gatgatggag tgaactccaa gaacattgtt cctggaaacg gaaagattac caccaggctt 3000
aaacaggatt ggggacttaa cgatgtgtgg aacgatcttg ttcttcctag gttcgagagg 3060
atgaacactc ttaccaactc taacgatttc acctctaaga acactcacgg aaagactatt 3120
cctactgtgc ctattgagct ttcaaaggga ttctccaaga agaggattga tcacaggcat 3180
catgctatgg atgctcttgt tattgcttgc gctactaggg atcatgtgaa ccttctcaac 3240
aacgagtctt ctaagtctga taccaagagg tacgatctta acaggaagtt gaggaagtac 3300
gagaaggttg cttacaacga tcctaagact ggagagagaa ttgagaagga ggtgcctaag 3360
gattttatta agccttggga gacctttact gaggatacta ggacccttct tgagaacatc 3420
gtgatttctt tcaagcagaa cctcagggtg attaacaagg ctaccaacta ctacgagaag 3480
attgagaacg gaaagaaggt gaaggttgag cagaagggaa ttaattgggc tgttaggaag 3540
gctctacata aggagactgt ttctggacag gtgcaccttg ataggattaa agtggctaag 3600
ggaaagattc ttaccgctac taggaagact cttgatgctt ctttcaacga gaagaccatt 3660
gagtctatta ccgataccgg gattcagaag attctcctca actacctcaa gtccaaggat 3720
aacaatcctg aggttgcttt ctctcctgaa ggaattgagg agcttaacaa gaacatcagg 3780
ctctataacg atggaaaggc tcaccagcct attcttaagg ttagggtttt cgagcaggga 3840
tctaagttta ctcttggaga gactggaaac aagactacta agtttgttga ggctgctaag 3900
ggaaccaacc ttttcttcgg aatctacgag gataagtctg gaaagaggtc ttacgagacc 3960
atccctttga acattgttat tgagaggcaa aagcaaggac tacaagctgt tcctgagact 4020
aacgagaagg gaaagcagct tcttttcacc ctttctccta acgatcttgt ttatgttcct 4080
gaggagggag ttttcgatga gaacaacatc aaggtggata ggatctacaa ggtggtgtct 4140
ttctctactt accaatgctt cttcgtgagg aacgatgtgt ctacttctgt ggttaacaag 4200
gttgagtact ctgctctcaa caagatggag aagtccatcg acaacatcat gattaaggag 4260
aactgcgtga agttgaacgt tgataggctc ggaaagattt ccaaggct 4308
<210> 180
<211> 4308
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG04583.1玉米优化的"
<400> 180
atggccaaga acatactagg cctggacctc ggaaccaatt ctatcggctg ggccctggtt 60
cagcaggact ttgagaacaa ggagggcaac atactaggca tgggcagccg aataatccct 120
atgtctcagg acatactggg cgagttcggt aagggcaaca gcatctcaca gacagccgag 180
aggacaggct accgcggcgt gaggaggctc agggagaggc acctgcttag gagggagagg 240
ctacacaggg tgctgcatct gctgggcttc ctgccaaagc attacgatga aaagatagat 300
ttcacacaga ggttcggcaa gttcatcaat caagccgaac caaagctagc cttcgattct 360
gagttcctgt tcaaggacag cttccatgaa atgctggccg acttcaagca gaatcaaccg 420
gagttcctga aggataaaaa cggcgaggac tgcctagtgc cgtacgactg gaccatatac 480
tacctgcgca agaaggccct cacccagaag atcgaaaaat acgagctggc ctggctgatc 540
cttaacttca accaaaagcg cggatactac cagctacgcg gcgaggagga gaaggagaac 600
ccgaataaac tggtgggctt ccacagcctg aaaatagtgg acgtgatccc ggacgccgag 660
actaataaaa agggcgagac ctggtactca cttcacctgg agaacggctg ggtgtaccgc 720
aggagcagca aaatatctct ggccgactgg aaggataaag tgagggactt catcgtgacc 780
acagacctga acgacgatgg ctcagagaag ctggacaagg atggcatcgt gaagaggtca 840
ttcagggccc catctgccga tgactggacc ctattaaaga agaagaccga gaaggacatc 900
gacaacagca ataaaaccgt gggcacctac atctacgaca acctgctatt aaacccgaag 960
cagaaaatca agggcaagat ggtgcgcacc atcgagcgca agttctacaa gcaggagctg 1020
gagcagatac taaagaccca gaaggagttc cacagcgagc tgcagagcga gaacctgctg 1080
caggactgcg tgcgcgagct gtaccgcaat aatgagcagc accagcagat gctggaggcc 1140
aaggacttcg tgcacctgtt cctgaacgat ataatcttct accagaggcc gctcaggagc 1200
cagaagtcaa gcatcagcaa ttgcaccctg gagttccgca agagcaagaa tgaaaacggc 1260
gaggaggtga tacatcgatt aaaggtgatc gccaagagca acccatacta ccaggagttc 1320
cgcctgctgc agtgggtcca gaacctggcc atctatacta aggacgacga caagaacgta 1380
accaacgagt tcctgaaatc aacccaggac tgggaggacc tgctgcgctg gctccacagc 1440
aagaaggaaa tcaagcagga cgccctaatc aagttcctga tcgagaagaa gggattaaag 1500
ggcaaagcat tgaccatcga ggtggcaaaa tacaggtgga actacgtcca ggacaaggac 1560
tacccgggca atgaaacccg ctacctaata cagagccgcc tggacaaggt ggagtacgcc 1620
ccgaaggact tcctgaccta cgagaatgaa atggccctgt ggcatatcat ctactcaatc 1680
aacgacaaga tcgagtatga aaaggcatta aagagcttcg ccaataaaaa gggcctggac 1740
gaggtgacct tcgtggaagc attcaagaag ttcccgccgt tcaagagcga ctacggcagc 1800
ttcagcgaga aggcaatcaa gaagctgctg ccattaatgc gcttcggcac ccagtggaac 1860
tgggacaaca tcgaccaaaa tagcaaggag cgcatcggca aaatactaac cggcgagtac 1920
gacgagaaca taaagggccg cgtgcgcgag aaggcccgcc acctgaacag cgagaccgac 1980
ttccaagcat tgccgctgtg gctggcccag tacgtggtct acggcaggca cagcgaggcc 2040
gatatcgccg gcaagtggaa cagcgtggat gatctcaagc agttcctgga cgatttcaag 2100
cagcacagcc tgaggaatcc aatcgtggag caggtgatca cagagacact aagggccgtg 2160
aaggacatct ggaatttcta cggcaagggc gccaaggact tcttcagcga gatacatatc 2220
gagctgggcc gcgagatgaa aaacaccgcc gatgaaagga agaggatcac aaccatggtg 2280
accgacaatg aaaacaccaa cctgcgaatc aaggccctgc tggccgagat ggccctggat 2340
cagaacgtgg ataacgtgag gccatactct ccaatgcagc aggagatcct gaaaatatac 2400
gaggagggcg tattaaacgc cgaggaaaat atcgacgacg acatcctgaa aataagcaag 2460
accgcccaac caagcgccac cgacctgaag cgatataagc tgtggctgga gcaaaaatac 2520
aggagcccgt acaccggcca gatgatcccg ctgaataaac tgttcacccc ggagtatgaa 2580
atcgagcata taatccctca gagccgctac ttcgacgaca gcatgagcaa caaggtgatc 2640
tgcgaggccg ccgtgaacaa gctaaaggac aaccagatcg gcctggtgtt catcaagaac 2700
caccacggcg aggtggtgga cttcggcatg ggcaagcagg tgaagatcct ggaggtgagc 2760
gactacgagg acttcgtgaa gcagaactac aacaagaacc gcggcaagag gaacaagctg 2820
ctgctggagg acatccctga gaagatgatc gagaggcagc tgaacgacac ccgctacatc 2880
agcaagtaca tcacacaggt gctgagcaac atcgtgaggg acgataagga gggctcaaag 2940
gatgatggcg tgaacagcaa gaacatcgtg ccaggcaacg gcaagatcac aacaaggctg 3000
aagcaggatt ggggcctgaa cgatgtgtgg aatgatctgg tgctgccaag gttcgagagg 3060
atgaacaccc tgaccaacag caacgacttc acctctaaga acacccacgg caagacaatc 3120
ccaacagtgc cgatcgagct gagcaagggc ttcagcaaga agaggatcga tcacaggcac 3180
cacgccatgg atgccctggt gatcgcctgc gccacaaggg atcacgtgaa tctactgaat 3240
aacgagtcta gcaagagcga tacaaagagg tacgatctga acaggaagct gcgcaagtac 3300
gagaaggtgg cctacaacga tccaaagaca ggcgagagga tcgagaagga ggtgccgaag 3360
gatttcatca agccatggga gacattcaca gaggacacaa ggaccctgct ggagaacatc 3420
gtgatcagct tcaagcagaa cctgcgcgtg atcaacaagg ccaccaacta ctacgagaag 3480
atcgagaacg gcaagaaggt gaaggtggag cagaagggca tcaattgggc cgtgaggaag 3540
gccctacata aggagacagt gtctggccag gtgcacctgg ataggatcaa ggtggccaag 3600
ggcaagatcc tgacagccac aaggaagaca ctggatgcct ctttcaacga gaagacaatc 3660
gagagcatca cagacaccgg catccagaag atcctgctga actacctgaa gagcaaggac 3720
aacaacccag aggtggcctt ctctccagag ggcatcgagg agctgaacaa gaacatcagg 3780
ctgtacaatg atggcaaggc ccaccagcca atcctgaagg tgcgcgtgtt cgagcagggc 3840
tcaaagttca cactgggcga gacaggcaat aagacaacaa agttcgtgga ggccgccaag 3900
ggcacaaatc tgttcttcgg catctacgag gataagtctg gcaagaggtc ttacgagaca 3960
atcccgctga atatcgtgat cgagaggcag aagcagggac tgcaggccgt gccagagaca 4020
aatgagaagg gcaagcagct gctgttcaca ctgtctccaa atgatctggt gtacgtgcca 4080
gaggagggcg tgttcgatga gaacaatatc aaggtggaca ggatctacaa ggtggtgagc 4140
ttctcaacct accagtgctt cttcgtgagg aacgacgtga gcacaagcgt ggtgaacaag 4200
gtggagtaca gcgccctgaa caagatggag aagagcatcg acaacatcat gatcaaggag 4260
aactgcgtga agctgaacgt ggaccgcctg ggcaagatct ctaaggcc 4308
<210> 181
<211> 4368
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG01688.1大豆优化的"
<400> 181
atgatgatca agaacatact aggactcgat ctcggaacca actctatcgg atgggctcta 60
atcaagcagg atttcgagaa caagcatgga gaaatactag ggatgggctc cagaataatt 120
cctatgtccc aggatatact aggagatttc ggaaagggta actctatttc tcagaccgct 180
gatagaacca agtataggtc tgttagaagg cttagggaga gatttcttct taggagagag 240
aggcttcata gggtgctcca cctattaaac ttccttcctc aacactacgc ttctcagatc 300
gatttcgaga agaagttcgg aaagtttaag tctgagaccg aaccaaagtt agcttgggaa 360
aattggggag gaaagttctc tttcctcttc caaaatagct tcaatgaaat gctggaggat 420
ttcaaggctg ctggacaggg gctcaaaata ccttacgact ggaccatata ctatctcagg 480
aagaaagcat tgtcccagaa aatagagaag gaggagctag cttggatact cctcaacttc 540
aatcaaaaga ggggatacta tcaattaaga ggtgaggagg aggaggagaa ccctaataaa 600
ctcgtggagt tctactccct caaaatagtg gatgttgttg ctgatgagcc tcagaaggga 660
aagtccgata tctggtactc attaattctt gagaacggat gggtttatcg cagggcttcc 720
aaaatacctc tcttcgactg gaaggataaa accagggatt tcattgtgac caccgatctt 780
aacgatgata ggtctgtgaa gactgataag gagggaaatg aaaagaggtc ttttagggct 840
ccttcagaga acgattggac tcttgtgaag aagaagactg agcaggagat tgatcagtct 900
cataaaaccg tgggaaccta catctatgaa accctcctat taaaccccaa gcagaaaatc 960
aagggaaagt tggtgaggac cattgagagg aagttctaca aggacgagct taagcagata 1020
ctagagaagc aaaaggagtt ccaccaggaa ttaaagaacg acgacctata taacgactgc 1080
attagggagc tgtacaggaa taatgaggct caccaattaa ccctctccaa gaaggatttc 1140
gtgcacctat taatggacga tctcattttc taccagaggc ctcttaggtc ccagaaatca 1200
agcatttcta attgcaccct ggagttcaga aaatacaagg atgaaaacgg gattgagcac 1260
acccagtacc tcaaggctat cccaaaatca aacccatact accaagagtt taggctttgg 1320
cagtggatgt acaacttgaa catctacaga aaggatgatg aggctaacgt aaccaaggag 1380
ttcctcaaca ccaataaaga cttcgagtct ctcttcgagt tcctcaataa tcgcaaggag 1440
attgagcaga agcccctaat caagttcctt cttgagcaga aggacataaa caagaagcta 1500
ttaaacgccg aggctgagaa atacaggtgg aactacgtgg aggataaaaa gtacccctgc 1560
aatgaaacca agaccatgat ttcctctagg cttgacaagg tggaaaatat ctccgatgat 1620
ttcctcacca gggacatcga gcagaaaata tggcatataa tctactccgt gaacgacaag 1680
atcgagtatg aaaaggcatt aaagtccttc gctaccagga acgacctcga tgaaaatagc 1740
ttcatcgaag cattcaagaa gttctcccct ttcaagtccg agtacggatc tttctctgag 1800
aaggcaatca agaagctcct tccattaatg aggctcggaa aatactggta cgaggatgaa 1860
atcgtgaagc attccgacat ctacttcaaa aatattgaga acctcctcgg ggatttctcc 1920
aaccgcgaca agaaaatatc tgaggaagac aaggagaagt ggaacaagtc aatcaacctt 1980
aagctccagg aggaattaaa ggatttccag accgctgaga ttgatttgtt ccagggactt 2040
aggcttcaca ttgctcagta ccttgtttat ggaaggcact ccgaagcatc tatgattgga 2100
aagtggaatt ctgctgagga tcttgaggag ttccttaagg atttcaagca gcattccctt 2160
aggaacccta ttgtggagca ggttattact gagactctta gggtggttaa ggatatttgg 2220
ctaaagtacg gaaacggggc taaggatttc ttcaacgaga ttcatattga gcttggaagg 2280
gaaatgaagt tgcctgctga tgataggaag aagctcacca accaaatttc tgagaacgag 2340
aacaccaact tcaggattaa ggctctcctt gctgagatga tgaacgattc ttctgttgag 2400
aacgttaggc ctttctctcc tatgcagcag gagattctaa agatctacga ggatgatgtg 2460
ctcaagtccg atatcgagat cgaggatgat atcctcaaga tttctaagac tgctcaacct 2520
tctccttctg atcttaagag gtacaagttg tggcttgagc agaagtacaa gtctccttac 2580
accggacaga ttattcctct taacaagttg ttcacccctg agtacgagat cgagcacatt 2640
attcctcagt caaggtactt cgatgattcc ttctccaata aggtgatttg cgagtctgct 2700
gtgaacaagc tcaaggataa ctacatcggg cttgagttca ttaagcagtt cggaggaact 2760
attattgagc ttggattcgg gaagtctatt aaggtgttcg agactaagga gtacgaggat 2820
ttcgtgaaga agcattacgc taacaaccag ggaaagagga acaagctcct tatggaagat 2880
atccctgaga agatgattga gaggcagatg aacgatacca ggtacatctc aaagtacatt 2940
tctggggtgc tttctaacat tgttagggtg gaagatggat ctgatgaggg agtgaactct 3000
aagaacattg ttcctggaaa cggaaagatt accacccaac ttaagcagga ttggggactt 3060
aacgatgtgt ggaacgatct cattcttcct aggttcgaga ggatgaatca gcttactaac 3120
tctaaggttt tcactgcttg gaacgagaac taccagaagt tccttcctac tgtgcctatt 3180
gagtactcca agggattctc aaagaagagg attgatcaca ggcatcatgc tcttgatgct 3240
cttgttattg cttgcgctac taaggatcac gtgaaccttc ttaacaacca gtctgctaag 3300
tctgatacca agaggtacga tctcaagaag aagtccatga agttcgagaa ggtggtttac 3360
aacgatgcta agactggaga aaagattgag agggaggttc ctaagcaatt tcttaagcct 3420
tgggagaact tcactcttga tgtgaagcac aaccttgaga ccatcattgt gtcattcaag 3480
cagaacctca gggtgattaa caaggctacc aactactacg agaagtacgt tgagaaggat 3540
ggaactaaga ataaggagag ggttgagcaa actggaacta actgggctat taggaagcct 3600
atgcacaagg atactgtgtc tggaaaagtt gatcttcctt gggttaaggt gcctaaggga 3660
aagattctta ctgctaccag gaagtctctc gattcttctt tcgatctcaa gtccattgga 3720
tctattaccg ataccgggat tcagaagatc ctaaagaact acctcgcttt caaggatgga 3780
aatcctgagc ttgctttctc tcctgaggga attgatgacc tcaacaagaa catcgagaag 3840
tataacgatg gaaagcctca ccagcctatt aacaaggtta gggttttcga gcttggatct 3900
aagttccaag ttggacagtc tggaaacaag aaggataagt atgttgaggc tgctaaggga 3960
accaaccttt tcttcgctgt ttatgaggat gagaagggaa agaggaacta cgagactatt 4020
cctctaaacg aggttattga gaggcaaaag cagggacttt ctgtggttga tcttaagggg 4080
accaacgatt tctatctttg ccctaacgat ttcgtgtaca ttccttctgg agatgagctg 4140
gagaacatca acaacgtgga cttcaaggat atcaagaagg agattaacga gaggatctac 4200
aaggtggtgt ctttcactgg aaacaggctt tcttgcattc cttacatggt ggctaccact 4260
attgtgaaca agttggagtt cacccagcta aacaagattg agttcaccaa ggagaaggag 4320
atctgcatta agttgaacgt ggataggctc ggaaacattt ctaaggct 4368
<210> 182
<211> 4368
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG01688.1玉米优化的"
<400> 182
atgatgatca agaacatcct aggcctggac ctcggaacca attctatcgg ctgggccctg 60
atcaagcagg acttcgagaa caagcatggc gagatactag gcatgggcag ccgaataatc 120
ccgatgagcc aggacatact aggcgatttc ggcaagggca atagcatctc tcagaccgcc 180
gacagaacca agtacaggtc tgttaggagg ctgagggaga ggttccttct taggagggag 240
aggctgcata gggtgctcca cctattaaac ttcctgccac agcactacgc cagccagatc 300
gacttcgaga agaagttcgg caagttcaag agcgagacag aaccaaagct ggcttgggaa 360
aactggggcg gcaagttcag cttcctgttc caaaatagct tcaatgaaat gctggaggac 420
ttcaaggccg ccggccaggg attaaagatc ccctacgact ggaccatata ctacctgcgc 480
aagaaagcat tgagccagaa aatagagaag gaggagctgg cctggatact gctgaacttc 540
aaccaaaagc gcggatacta ccagctgcgc ggtgaggagg aggaggagaa cccgaataaa 600
ctggtggagt tctactcact gaaaatagtg gacgtggtgg ccgacgagcc gcagaagggc 660
aagagcgaca tctggtacag cctgatacta gagaacggct gggtgtaccg ccgcgctagc 720
aaaataccgc tgttcgactg gaaggataaa acccgcgact tcatcgtgac caccgacctg 780
aacgacgaca ggagcgtgaa gacagataag gagggcaatg aaaagaggag cttcagggcc 840
ccaagcgaga acgattggac cctggtgaag aagaagacag agcaggagat cgatcagagc 900
cataaaaccg tgggcacata catctatgaa accctgctat taaacccgaa gcagaaaatc 960
aagggcaagc tggtgcgcac catcgagcgc aagttctaca aggacgagct gaagcagata 1020
ctagagaagc agaaggagtt ccaccaggaa ttaaagaacg acgacctata taacgactgc 1080
atccgcgagc tgtaccgcaa taatgaggcc caccaattaa ccctgagcaa gaaggacttc 1140
gtgcacctat taatggacga cctgatcttc taccagcgcc cgctgcgcag ccagaagtca 1200
agcatcagca attgcaccct ggagttccgc aaatacaagg atgaaaacgg catcgagcac 1260
acccagtacc tgaaggccat cccgaagagc aacccatact accaggagtt ccgcctgtgg 1320
cagtggatgt acaacctgaa catctaccgc aaggacgacg aggccaacgt aaccaaggag 1380
ttcctgaata caaataaaga cttcgagagc ctgttcgagt tcctgaataa tcgcaaggag 1440
atcgagcaga agccgctaat caagttcctg ctggagcaga aggacataaa caagaagcta 1500
ttaaacgccg aggccgagaa atacaggtgg aactacgtgg aggataaaaa gtacccgtgc 1560
aacgaaacca agaccatgat cagcagccgc ctggacaagg tggaaaatat cagcgacgac 1620
ttcctgaccc gcgacatcga gcagaaaata tggcatataa tctacagcgt gaacgacaag 1680
atcgagtatg aaaaggcatt aaagagcttc gccacccgca acgacctgga tgaaaacagc 1740
ttcatcgaag cattcaagaa gttcagcccg ttcaagagcg agtacggcag cttcagcgag 1800
aaggcaatca agaagctgct gccattaatg cgcctgggaa aatactggta cgaggacgag 1860
atcgtgaagc atagcgacat ctacttcaaa aatatcgaga acctgctggg cgacttcagc 1920
aaccgcgaca agaaaataag cgaggaggac aaggagaagt ggaacaaaag catcaacctg 1980
aagctgcagg aggaattaaa ggacttccag accgccgaga tcgacctgtt ccagggcctg 2040
cgcctccaca tcgcccagta cctggtgtac ggccgccaca gcgaggcaag catgatcggc 2100
aagtggaaca gcgccgagga cctggaggag ttcctgaagg acttcaagca gcatagcctg 2160
cgcaacccga tcgtggagca ggtgatcacc gagaccctgc gcgtggtgaa ggacatctgg 2220
ctaaaatacg gcaacggcgc caaggacttc ttcaatgaaa ttcacatcga gctgggccgc 2280
gagatgaaac tgccggccga cgaccgcaag aagctgacca accaaatcag cgagaatgaa 2340
aacaccaact tccgaatcaa ggccctgctg gccgagatga tgaacgacag cagcgtggag 2400
aacgtgcgcc cgttcagccc gatgcagcag gagatcctga aaatatacga ggacgacgtg 2460
ctgaagagcg acatcgagat cgaggacgac atcctgaaga tcagcaagac cgcccagccg 2520
agcccgagcg acctgaagcg ctacaagctg tggctggagc agaagtacaa gagcccgtac 2580
accggccaga tcatcccgct aaacaagctg ttcaccccgg agtacgagat cgagcacatc 2640
atcccgcaga gccgctactt cgacgacagc ttcagcaaca aggtgatctg cgagagcgcc 2700
gtgaacaagc tgaaggataa ctacatcggc ctggagttca tcaagcagtt cggcggcacc 2760
atcatcgagc tgggcttcgg caagagcatc aaggtgttcg agaccaagga gtacgaggac 2820
ttcgtgaaga agcactacgc caacaaccag ggcaagcgca acaagctgct gatggaggac 2880
atcccggaga agatgatcga gcgccagatg aacgacaccc gctacatcag caagtacatc 2940
agcggcgtgc tgagcaacat cgtgcgcgtg gaggatggct cagatgaggg cgtgaacagc 3000
aagaacattg tgccgggcaa cggcaagatc acaacacagc ttaagcagga ctggggcctg 3060
aacgatgtgt ggaacgatct gattctgcca aggttcgaga ggatgaacca gctgaccaac 3120
agcaaggtgt tcaccgcctg gaacgagaac taccagaagt tcctgccaac cgtgccaatc 3180
gagtacagca agggcttcag caagaagagg atcgatcaca ggcatcatgc tctggatgct 3240
ctggtgatcg cctgcgctac aaaggatcac gtgaacctgc tgaacaacca gagcgccaag 3300
agcgacacaa agaggtacga cctgaagaag aagagcatga agttcgagaa ggtggtgtac 3360
aacgacgcca agaccggcga gaagattgag agggaggtgc cgaagcagtt cctaaagcca 3420
tgggagaact tcacactgga cgtgaagcac aacctggaga ccatcatcgt gagcttcaag 3480
cagaacctga gggtgatcaa caaggccacc aactactacg agaagtacgt ggagaaggac 3540
ggcaccaaga acaaggagag ggtggagcag acaggcacaa attgggccat ccgcaagcca 3600
atgcacaagg atacagtgtc tggcaaggtg gatctgccat gggttaaggt gccaaagggc 3660
aagatcctga cagccacaag gaagagcctg gatagcagct tcgatctgaa gagcatcggc 3720
tctatcacag acaccggcat ccagaagatc ctgaagaact acctggcctt caaggatggc 3780
aatccagagc tggctttctc tccagagggc atcgacgacc tgaacaagaa catcgagaag 3840
tacaacgacg gcaagccaca ccagccaatc aataaggtgc gcgtgttcga gctaggctct 3900
aagttccagg ttggccagag cggcaacaag aaggataagt acgttgaggc cgccaagggc 3960
acaaatctgt tcttcgctgt gtacgaggat gagaagggca agcgcaacta cgagacaatc 4020
ccactgaacg aggtgatcga aaggcagaag cagggcctgt ctgttgtgga tctgaagggc 4080
accaacgatt tctacctgtg cccgaacgac ttcgtgtaca ttccatctgg cgacgagctg 4140
gagaacatca acaacgtgga cttcaaggac atcaagaagg agatcaacga gcgcatctac 4200
aaggtggtga gcttcaccgg caacaggctg agctgcatcc catacatggt ggccaccacc 4260
atcgtgaaca agctggagtt cacccagctg aacaagatcg agttcaccaa ggagaaggag 4320
atctgcatca agctgaacgt ggacaggctg ggcaacatca gcaaggcc 4368
<210> 183
<211> 3210
<212> DNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG05083.1天然序列"
<400> 183
atgagagagt tggattatcg cataggatta gatattggaa cgaattctat tggctggggg 60
atcattgaat tatcttggaa caaagataga gaacaatatg agaaagcaag aattgtcgac 120
aagggtgttc gtatgtttga taaggctgaa atacctaaga ctggtgcttc tcttgctgaa 180
ccgaggcgta tagcacgctc atcacgtaga agattaaatc gcaaaagcca gagaaaaaaa 240
gatatacgta atttactcgt tcaacatgaa attattagtc aaaaggaatt ggcttcgtta 300
tatcccctga caaaaagttc aatggatatt tgggatattc gcttggatgg attagatcgc 360
ttgttagacc gttttgaatg gactcgatta ttaattcatt tagcgcaaag acgcggtttt 420
aaatcaaatc gaaagtctga actgaaagat gtggagacag gaaaagtatt atcaagtatt 480
caagcaaatg aaaaacgatt atcactgtac cgtacagtgg gagagatgtg gatgaagaat 540
gaagatttta gtaaatatga caaaaggcgt aattcttcta atgagtatgt attttcggtt 600
agccgtgcag atttagaaaa agaaattgtg acactatttg aagcgcaaag aaaatttcag 660
tcatcatatg catcggctga tttacaaaaa acatacttac aaatttgggc acaccaactt 720
ccttttgctt ctgggaatgc aattgtaaat aaagtaggat attgttcatt attaaaaggg 780
aaagaaaaga gagttccgaa agcaacatat acttttcaat atttcagtac actagatcaa 840
ataaatcgaa cacgattagg tcctaatttc caaccattta cgaaggaaca gagagacgtt 900
attttagatg aaatgtttaa tcgaacagat tattataaaa aaaagacaat acccgaagtc 960
acttactatg atattcggaa atggttagca ttagatgaaa caattcaatt taaaggactt 1020
acctatgacc caaatgaaga gctgaaaaaa atagaattga aatcctttat taatttaaag 1080
ccattctatg aaattaaaaa ggtagttact aattacgcca aaaaaacaaa tgaggcattc 1140
tcaacattag actatgatac atttgcatat gctttaacag tttataaaac ggacaaagat 1200
attagatctt atttaaagaa atctaataat ttatcaaaat gttgctacga tgatcaatta 1260
atagaagagc tattaactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320
aatcatgtac tgccaattat gcaagaggga aggacttatc aggaagcaat acaccaatta 1380
ggatatgatg ccactaatct aaaaaaagaa aacagaagta tgttcttgcc cctttttccc 1440
gatgagataa caaatccaat tgttaaaaga gcactaactc aagcacgtaa agttgtaaat 1500
gctattatta gaagatatgg ttcccccaat tctgttcata ttgaactagc tcgtgagctt 1560
tctaaaagtc atgatgagag aacgaaaata atgaaagctc atgatgaaaa ttataagaaa 1620
aataaaggag ccatatcaat tttgattgag aatggaattt taaatccgac aggatatgat 1680
attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gctaaaacag 1740
attcctgcta atacgttttt taatgaaatg aaaaaagagc gaagtggctc cccagttcta 1800
gagatagatc acattttacc gtatagtcag agttttattg atagttatca taataaagta 1860
ctagtttatg gagatgagaa tcaaaaaaag ggaaatcgaa ttccatatac ttatttttta 1920
gaaggaaata aggactggga aagctttgaa agctacgtac gattgaatag ttttttttct 1980
aaaaagaagc gcggatattt attgaaaaaa gcttacttgc caagagagag taacatgatt 2040
aaggagcgtc atttaaatga tactcgatat gctagtagct atttgaaaaa cttcattgag 2100
aaaaatttga aatttaaaga agttgaaggt agtacacgaa aaaaacatgt acagacggtt 2160
aacggtataa ttacagccca tcttcgaaaa agatggggat tagaaaaaga taggcaggaa 2220
acatatttgc atcatgcaat ggacgctatt attgttgctt gtacagacca tcatatggtc 2280
actaaagtaa cggagtacta tcaaataaaa gaaagtaata agtcaataag gaaaccatac 2340
tttcctttgc catgggtggg ctttagagag gaaattttat cacatttagc aaggcagcca 2400
attgctagaa aaattagtga ggaacttaaa attggatatc aatcatttga ttatatactt 2460
gtatcgcgaa tgccaaaaag atctgtcact ggagcagctc atgaacagac aatcatgaaa 2520
aaaggtggta tcgacaaaaa aggaaaaact attatcataa agcgtgtgta cttaaaggat 2580
attaagtttg atgagaatgg cgattttaaa atggttggaa aagaacagga tttagcaact 2640
tatgaagcga taaagcaaag atatatagag tatggaaaag aatcgaaaaa agcatttgaa 2700
acacctttat acaagcctag taaaaaagga aaaggaaacc tcattaaaaa gatcaaagta 2760
gaagtgcaaa ccaaatcttt tgttcgagaa gttaatgggg gcgtagctca aaatggtgat 2820
ttagtaagag tagatttgtt tgaaaaggat aatagatatt atatgatacc tatttatgta 2880
atggatactg ttcattccga actaccaaat aaagctgtaa caagcagtaa aggctatgag 2940
caatggttaa caatagataa cagctttacg ttcaaattca gtttatatcc ttatgattta 3000
gtacgacttg taaaaggtaa tgaagatcgt ttcctatatt ttagtaccct tgatattaat 3060
tcggatcgtc ttaatttcaa agatgtaaac aagccatcaa agcaggctga aaatcgttat 3120
agccttaaaa caattgagaa tttagaaaaa tatgaggttg gtgttttagg tgatttaagg 3180
tttgtgagac aagaaatacg taaaaatttt 3210
<210> 184
<211> 3210
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05083.1大肠杆菌优化的"
<400> 184
atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60
atcatcgaac tgagctggaa taaagaccgc gagcagtatg aaaaggcgcg catcgtggat 120
aaaggcgtgc gcatgttcga caaagcggaa attccgaaaa ccggtgcaag tctggcggaa 180
ccaagacgta ttgcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaag 240
gatataagga acctgctggt ccagcatgaa atcatcagcc agaaggaact ggcgagcctg 300
tacccgctga ccaaatcaag tatggacatc tgggatataa ggctggacgg cctggatcgt 360
ctgctggatc gctttgaatg gacccgccta ttaatccatc tggcacagcg ccgtggcttc 420
aaatcaaacc gcaagagcga attaaaggac gtggagaccg gtaaagtgct gtcaagcatt 480
caggcgaatg aaaagcgcct gagcctgtat cgtaccgtgg gcgagatgtg gatgaaaaac 540
gaggacttct caaaatacga taaaaggcgc aacagcagca acgagtacgt gttcagcgtg 600
agccgcgcgg acctggagaa agaaatcgtg accctgtttg aggcgcagcg caaattccaa 660
tcaagctatg cgagcgcgga tctgcagaaa acctacctgc agatttgggc acatcagctg 720
ccgtttgcaa gcggtaacgc gatcgtgaat aaagtgggct attgcagcct attaaaaggc 780
aaagaaaaac gcgtgccgaa agcgacctat acattccagt acttcagcac cctggaccaa 840
atcaaccgca cccgcctggg cccgaacttc cagccgttca ccaaagaaca gcgcgacgtg 900
atcctggatg aaatgttcaa ccgcaccgac tactataaaa agaaaaccat cccggaggtg 960
acatactacg atataaggaa atggctggcg ctggatgaaa ccatccagtt caaaggctta 1020
acctacgatc cgaacgagga attaaagaag atcgaattaa aatcgttcat taatctgaaa 1080
ccgttctatg aaattaaaaa ggtggtaacc aactacgcga agaaaaccaa cgaagcattc 1140
agcaccctgg actacgatac attcgcgtac gcgctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaagaa atcaaacaac ctgagcaaat gctgctacga cgaccaatta 1260
atcgaagaac tgctgaccct gagctacacc aaattcggcc acctgagctt caaagcgatc 1320
aaccacgtgc tgccgatcat gcaggaaggc cgcacctacc aggaagcgat ccaccagctg 1380
ggctacgatg cgaccaacct gaaaaaggaa aaccgcagca tgttcctgcc gctgttccct 1440
gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa ggtggtgaac 1500
gcgatcatcc gccgctacgg ctcaccgaac agcgtgcaca tcgaactggc gcgcgaactg 1560
agcaaaagcc acgatgaacg caccaaaatc atgaaagcgc acgatgaaaa ctacaaaaag 1620
aacaaaggcg cgatcagcat cctgatcgaa aacggcatcc tgaacccgac cggctacgat 1680
atcgtgcgct acaaactgtg gaaagaacag ggcgaacgct gcgcgtacag cctgaaacag 1740
atcccggcga acaccttctt caacgaaatg aaaaaggaac gctcaggcag cccggtgctg 1800
gaaatcgatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860
ctggtgtacg gcgatgaaaa ccagaaaaag ggcaaccgca tcccgtacac ctacttcctg 1920
gaaggcaaca aagattggga gagcttcgaa agctacgtgc gcctgaacag cttcttcagc 1980
aaaaagaaac gcggctacct gctgaaaaag gcgtacctgc cgcgcgaaag caacatgatc 2040
aaagaacgcc acttaaacga tacccgctac gcgagcagct acctgaaaaa cttcatcgag 2100
aaaaacctga aattcaaaga agtggaaggc agcacccgta aaaagcatgt ccagaccgtg 2160
aacggcatca tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaga tcgccaggaa 2220
acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280
accaaagtga ccgaatatta tcagatcaaa gaaagcaaca aatcaatccg caaaccgtat 2340
tttccgctgc cgtgggtggg ctttcgcgaa gaaatcctga gccatctggc gcgtcagccg 2400
atcgcgcgta aaatcagcga agaactgaaa atcggctatc agagctttga ttatatcctg 2460
gtgagccgca tgccgaaacg cagcgtgacc ggcgcggcgc atgaacagac catcatgaaa 2520
aagggcggca tcgataaaaa gggcaaaacc atcatcatca aacgcgtgta tctgaaagat 2580
atcaaatttg atgaaaacgg cgattttaaa atggtgggca aggaacagga cttagcgacc 2640
tacgaagcga tcaaacagcg ctacatcgag tacggcaaag agagcaaaaa ggcgtttgaa 2700
accccgctgt acaaaccgag caaaaagggc aagggcaacc tgatcaaaaa gatcaaagtg 2760
gaagtccaga ccaaatcgtt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacggcgat 2820
ctggtgcgcg tggatctgtt tgaaaaagat aaccgctact atatgatccc gatctacgtg 2880
atggataccg tgcatagcga gctgccgaac aaagcggtga ccagcagcaa aggctatgaa 2940
cagtggttaa ccatcgataa cagctttacc ttcaaattca gcctgtatcc gtacgacctg 3000
gtgcgcctgg tgaaaggcaa cgaagatcgc ttcctgtatt tcagcaccct ggacatcaac 3060
agcgatcgcc tgaacttcaa ggacgtgaac aaaccgagca aacaggcgga aaaccgctat 3120
agcctgaaga ccatcgagaa cctggagaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180
tttgtgcgcc aggaaattcg caaaaacttc 3210
<210> 185
<211> 3213
<212> DNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG07433.1天然序列"
<400> 185
atgagggagt tggactatcg catagggtta gatattggga cgaattctat tggatggggt 60
gttattgaat tatcctggaa caaggacaga gaacgatatg aaaaagtaag gattgtcgac 120
cagggtgttc gtatgtttga tagggctgaa atgccaaaaa caggtgcttc tcttgctgaa 180
ccgaggcgta tagcacgttc atcacgtaga aggttaaatc gtaaaagtca gaggaagaaa 240
aatatacgta atttacttgt tcaacatggg gtgattactc aagaagagct ggattcgtta 300
tatcctcttt caaaaaaatc aatggatatt tggggtattc gattggatgg attagatcgt 360
ctgctaaatc attttgaatg ggctcgatta ttaattcatt tagctcaaag acgtggtttt 420
aaatcgaatc gtaagtctga actgaaagat acggagacgg ggaaggtatt atcgagtatt 480
caattaaatg aaaaacgatt atcactgtac cgtacagtgg gagaaatgtg gatgaaagat 540
cctgatttta gtaagtatga tagaaaacgg aattctccta atgagtatgt attttcggtt 600
agtcgtgcgg aactagaaaa ggaaatagtt actttatttg cagcacaaag aaggtttcag 660
tcaccatacg catcgaagga tttacaagaa acatatttac aaatttggac acaccaactt 720
ccctttgctt ctgggaatgc aattttaaat aaagtgggat attgttcatt attgaaaggg 780
aaagaaagaa gaattccgaa agcaacatat acttttcagt attttagtgc actagatcaa 840
gtgaatcgaa cacgattagg acctgatttt cagccattta cgaaggaaca aagagaaatt 900
attttaaata acatgtttca acgtacagat tattataaaa aaaagactat acctgaagtt 960
acatactatg atatccggaa atggctagaa ctagatgaaa ctattcaatt taaaggactt 1020
aattatgatc caaacgaaga attgaaaaaa atagaaaaga aaccatttat taatttaaag 1080
gcattctatg aaattaataa ggtagtcgca aattattctg agagaacaaa tgagacattt 1140
tcaacgttag actatgatgg gattggatat gctttaacag tttataaaac ggacaaagat 1200
attaggtctt atttgaagag ctctcataat ttacctaaac gttgttacga tgatcaatta 1260
atagaggaac tattaagtct ttcttataca aagtttggtc acttatcact gaaagcaatc 1320
aatcacgtac tatcgattat gcaaaaaggc aatacttata aagaagcagt agaccagtta 1380
gggtatgata caagcggttt aaagaaagaa aaaagaagta agttcttgcc tcctatttca 1440
gatgagataa cgaatccaat tgttaaaaga gcgttaacac aagcgcgtaa agttgtgaat 1500
gctataatta gaagacatgg ttctccacat tcagttcata ttgaactggc tcgtgaactt 1560
tctaaaaatc atgacgagag aacaaaaata gtgtcagctc aagatgaaaa ttataagaag 1620
aataaagggg ctatatcaat tttaagtgag catggaattt tgaatccaac aggctatgat 1680
attgttcgtt ataagttatg gaaagaacaa ggagaacgat gtgcttattc gttaaaggag 1740
attcctgcgg atacgttttt taatgaatta aaaaaagaac gaaatggtgc tccaattcta 1800
gaggtagatc acattttacc gtacagtcaa agttttattg atagttatca taataaagta 1860
ttagtttaca gtgatgaaaa tcgaaaaaag gggaatcgaa ttccatatac ctatttttta 1920
gagacaaata aggattggga agcttttgaa agatatgtaa gatcaaataa atttttttct 1980
aaaaagaagc gtgagtattt attgaaaaga gcatatttgc caagagaaag tgaactgata 2040
aaggagcgac atttaaatga tacgcgatat gctagtacct ttttgaaaaa cttcattgag 2100
cagaatttgc aatttaaaga agctgaagat aatccgcgta aaagacgtgt acaaacagtt 2160
aacggtgtaa ttacagcaca ttttcgaaaa agatggggat tagaaaaaga tagacaagaa 2220
acatacttac atcatgcaat ggacgctatc attgttgctt gtacagacca tcatatggtt 2280
actagagtaa cagagtatta tcaaataaaa gaaagtaata aatcagtaaa gaaaccgtat 2340
tttcctatgc catgggaggg ctttagagat gaactcttat cacatttagc gagtcagcca 2400
atagctaaaa aaattagtga ggagcttaaa gctggatatc aatcattaga ttatatattt 2460
gtgtctcgaa tgccaaaaag atctatcact ggagcagcac ataaacaaac gatcatgaga 2520
aaaggcggta ttgataaaaa aggaaaaact attattatag agcgtttgca tttaaaggat 2580
attaagtttg atgagaatgg tgattttaaa atggttggca aagaacaaga tatggcaact 2640
tacgaggcga taaagcaaag atatttggag catggaaaaa actcgaaaaa agcatttgaa 2700
acacctctat acaaacctag taaaaaagga acaggaaatc ttattaaaag agttaaagtt 2760
gaaggacaag ctaaatcttt tgttcgagaa gtaaatgggg gcgtagccca aaatggtgat 2820
ttagtgagag ttgatttatt tgaaaaagat gataaatatt acatggtgcc tatttatgta 2880
ccagataccg tttgttcaga attacccaaa aaagttgtgg caagtagtaa gggttatgag 2940
caatggttaa cactagataa cagctttacg tttaaattta gtttataccc ttatgattta 3000
gtacggcttg taaaagggga cgaagatcgt ttcttatact ttggtactct cgatatcgat 3060
tcagatcgtc ttaattttaa agatgtaaat aagccatcaa aaaagaatga atatcgttat 3120
agccttaaaa caattgagga tttagaaaaa tatgaggtgg gtgttttagg agatttaagg 3180
ttagtaagaa aagaaacacg tagaaatttt cac 3213
<210> 186
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07433.1大肠杆菌优化的"
<400> 186
atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60
gtgatcgaac tgagctggaa taaagaccgc gagcgctatg aaaaggtgcg cattgtggat 120
cagggcgtca gaatgtttga tcgtgcggaa atgccgaaaa ccggtgcatc actggcagaa 180
ccaagacgta tagcacgtag tagtcgccgc cgattaaacc gtaaaagcca gcgcaagaaa 240
aatatccgca acctgctggt tcagcatggc gtcatcaccc aggaagaact ggatagcctg 300
tacccgctga gcaagaaatc aatggacatc tggggcattc gtctggatgg tctggaccgc 360
ctattaaacc actttgaatg ggcccgccta ttaattcatc tggcgcagcg ccgcggcttc 420
aaatcaaacc gcaagagcga attaaaggac accgagaccg gtaaagtgct gtcatcgatc 480
cagctgaatg aaaaacgcct gagcctgtat cgcaccgtgg gcgagatgtg gatgaaagac 540
ccggacttct caaaatacga ccgcaaacgc aacagcccga acgaatacgt gtttagcgtt 600
agccgtgcgg aactggagaa agaaatcgtg accctgtttg cagctcagcg ccgttttcag 660
agcccgtatg cgagcaaaga tctgcaagaa acctacctgc agatctggac ccatcagctg 720
ccgtttgcaa gcggtaacgc gatattaaac aaagtgggct attgcagcct attaaaaggc 780
aaagaacgcc gcatcccgaa agcgacctat acattccagt acttcagcgc gctggaccag 840
gtgaaccgta cccgtctggg tccggatttt cagccgttca ccaaagaaca gcgcgagatc 900
atattaaaca acatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaggtg 960
acatattacg atataaggaa atggctggaa ctggatgaaa ccatccagtt caaaggcctg 1020
aactacgatc cgaacgagga gctgaaaaaa atcgagaaaa aaccgttcat taatctgaaa 1080
gcgttctatg aaatcaacaa agtggtggcg aactacagcg aacgcaccaa tgaaaccttc 1140
tcaaccctgg attacgatgg catcggctac gcgctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaaatc aagccacaac ctgccgaaac gctgctacga cgaccaatta 1260
atcgaagaac tgctgagcct gagctatact aagttcggcc acctgtcatt aaaagcgatt 1320
aatcacgtgt taagcatcat gcagaaaggc aacacatata aagaagcggt ggatcagctg 1380
ggctacgata ccagcggatt aaaaaaagaa aaacgcagca aattcctgcc gccgatcagc 1440
gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa agtggtgaac 1500
gcgatcatcc gccgccacgg cagcccgcac agcgtgcaca tcgaactggc gcgcgaactg 1560
agcaaaaacc acgatgaacg caccaaaatc gtgagcgcgc aggatgaaaa ctacaaaaag 1620
aacaaaggcg cgatcagcat cctgtcagaa cacggcatcc tgaacccgac cggctacgat 1680
atcgtgcgct acaaactgtg gaaagagcag ggcgaacgct gcgcgtacag cctgaaagaa 1740
atcccggcgg ataccttctt caacgagctg aaaaaagaac gcaacggcgc cccgatcctg 1800
gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860
ctggtgtaca gcgatgaaaa ccgcaaaaaa ggcaaccgca tcccgtacac ctacttctta 1920
gagaccaaca aagattggga agcgttcgaa cgctacgtgc gcagcaacaa gttcttcagc 1980
aaaaagaagc gcgagtacct gctgaaacgc gcgtacctgc cgcgcgaaag cgaactgatc 2040
aaagaacgcc atctgaacga tacccgctac gcgagcacct tcctgaaaaa cttcatcgaa 2100
cagaacctgc agttcaaaga agcggaagat aacccgcgca aacgccgcgt ccagaccgtg 2160
aacggcgtga tcaccgcgca ttttcgcaaa cgctggggct tagaaaaaga tcgccaggaa 2220
acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280
acccgcgtga ccgaatatta tcagatcaaa gaaagcaaca aaagcgtgaa aaaaccgtat 2340
tttccgatgc cgtgggaagg ctttcgcgat gaactgctga gccatctggc gagccagccg 2400
atcgcgaaaa aaatcagcga agaactgaaa gcgggctatc agagcctgga ttatatcttt 2460
gtgagccgca tgccgaaacg ctcaatcacc ggcgcggcgc ataaacagac catcatgcgc 2520
aaaggcggca tcgataaaaa aggcaaaacc atcatcatcg aacgcctgca tctgaaagat 2580
atcaaatttg atgaaaacgg cgattttaaa atggtgggca aagaacagga catggcgacc 2640
tacgaagcga tcaaacagcg ctatctggag catggcaaga acagcaaaaa agcgtttgag 2700
accccgctgt acaaaccgag caaaaaaggc accggcaacc tgatcaaacg cgtgaaagtg 2760
gaaggccagg cgaaatcatt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacggcgat 2820
ctggtgcgcg tggatctgtt tgaaaaagat gacaaatatt atatggtgcc gatctatgtg 2880
ccggataccg tgtgtagcga actgccgaaa aaagtggtgg cgagcagcaa aggctatgaa 2940
cagtggctga ccctggataa cagctttacc ttcaaattca gcctgtatcc gtatgatctg 3000
gtgcgcctgg tgaaaggcga tgaagatcgc tttctgtatt ttggcaccct ggacatcgat 3060
tcagatcgcc tgaacttcaa ggacgtgaac aaaccgagca aaaagaacga atatcgctat 3120
agcctgaaaa ccattgaaga tctggaaaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180
ctggtgcgca aagagacccg ccgcaacttt cat 3213
<210> 187
<211> 3213
<212> DNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG07513.1天然序列"
<400> 187
atgagagagt tggattatcg cataggatta gatattggaa cgaattctat tggctggggt 60
gttattgaat tatcttggaa caaagataga gaacaatatg agaaaacgag aattgtcgac 120
aagggtgttc gtatgtttga taaggctgaa atacctaaga ctggtgcttc tcttgctgaa 180
ccgagacgta tagcgcgctc atcacgtaga aggttaaatc gtaaaagcca gagaaaaaaa 240
gatatacgta atttacttgt tcaacatgaa attattagcc aaaaggaatt gacttcgtta 300
tatcccctgt caaaaagttc aatggatatt tgggatattc gcttagatgg attagatcgc 360
ttgttagacc gttttgaatg ggctcgatta ttaattcatt tagcacaaag acgcggtttt 420
aaatcaaatc gaaagtctga actgaaagat gtggagacag gaaaagtatt atcaagtatt 480
caagtaaatg aaaaacgatt atctctgtac cgtacagtgg gagagatgtg gatgaagaat 540
gcggattgta gtaaatatgg caaaaggcgt aattctccta atgagtatgt attttcggtt 600
agccgtgcag atttagaaaa ggaaattgtg actctatttg aggcgcaaag aaaattccat 660
tcatcatatg catcggttga tttacaaaaa acatatatac aaatttgggc acaccaactt 720
ccttttgctt ctgggaatgc aattgtaaat aaagtaggat attgttcatt attaaaaggt 780
aaagaaaaga gagttccaaa agcaacatat acttttcaat atttcaatac actagatcaa 840
ataaaccgaa cacgattagg gcccaatttc caaccattta cgaaggaaca gagagacata 900
attttagata aaatgtttca acggacagat tattataaaa aaaagacaat acccgaagtt 960
acttactatg atattcggaa atggttagca ctagatgaaa caattcaatt taaaggactt 1020
acctatgacc caaacgaaga gctgaaaaaa atagaaatga aaccctttat taatttaaag 1080
ccattctatg aaattaaaaa ggtagttact aattacgcaa aaaaaacaaa tgaggtattc 1140
tcagcattag attatgatac agttgcatac gctttaacag tttataaaac ggacaaagat 1200
attagatctt atttgaagag atctaataat ttatcaaaac gttgctacga tgatcaatta 1260
atagaagagc tattaactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320
aatcatgtac tgccaattat gcaagaggga aggacttatc aggaagcaat acaccaatta 1380
gggtatgata ccactaatct taaaaaagaa aacagaagta tgttcttgcc tattattcca 1440
gatgagataa caaatccaat tgttaaaaga gcgttaactc aagcacgtaa agttgtaaat 1500
gctattatta gaagatatgg ttctccaaat tctgttcata ttgaactagc tcgtgagctt 1560
tcgaaaagtc atgacgagag aaaaaaaata atgacagctc atgatgaaaa ttataagaaa 1620
aataaaggag ctgtatcaat tttgatcgat aatggaattt taaatccgac aggatatgat 1680
attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gttaaaaaag 1740
attcctgcta atacgttttt taatgaattg aaaaaagagc gaagtggccc tccggttcta 1800
gaggtagatc acattttacc gtatagtcag agttttattg atagttacca taataaagta 1860
ttagtttatg gggatgaaaa tcaaaaaaag ggaaatcgaa ttccatatac ttttttttca 1920
gaagaagata aggagtggga aagctttgaa agctacgtaa gatcgaatag ttttttttct 1980
aaaaagaagc gcggatattt attgaaaaaa gcttacttgc caagagagag taacttgatt 2040
aaggagcgtc atttaaatga tacccgatat gctagtagct atttgaaaaa cttcattgag 2100
aaaaatttaa aatttaaaga agctgtaggt attacacgaa aaaaatatgt acagacggtt 2160
aacggtgtaa ttacagccca tctgcgaaaa aggtggggtt tagaaaaaga taggcaggaa 2220
acatatttgc atcatgcaat ggacgctatt attgttgctt gtacagatca tcatatggtc 2280
actaaagtaa cggagtacta tcaaataaaa gaaggtaata agtcaataaa gaaaccgtat 2340
tttcctttgc catggatggg atttagagag gaaattttat cacatttaga aagtcagcca 2400
attgctagaa aaattagtga ggaacttaaa attggatatc aatcacctga ttatatactt 2460
gtatcgcgaa tgccaaaaag atctgtcact ggatcagctc atgatcagac agtcatgaaa 2520
aaaggcgata tcgataaaaa aggaaagact attatcataa agcgtgtgca cttaaaggat 2580
attaagtttg atgagaatgg cgattttaaa atggttggca aagaacaaga tttagcaact 2640
tacgaagcga taaagcaaag atatttagag tatagaaaag aatcgaaaaa agcatttgaa 2700
acacctttat acaagcctag taaaaaagga aaaggaaacc tcattaaaaa aattaaagta 2760
gaagtgcaaa ccaaatcttt tgttcgagaa attaatgggg gcgtagctca aaatggtgat 2820
ttagtaagag tagatttgtt tgaaaaggat aataggtatt atatggtgcc tatttacgta 2880
gtagatactg ttcgttccga actaccaaat aaagctgtaa caagcagtaa aggctatgag 2940
caatggttat caatagataa cagctttacg ttcaaattca gtttatatcc ttatgattta 3000
gtacgacttg taaaaggcga tgaagatcgt tttctatact ttagtactct tgatattaat 3060
tcggaccgtc ttaattttaa agatgtaaat aagccatcaa agcaagctga atatcgttat 3120
agtcttaaaa caattgagaa tttagaaaaa tatgagattg gtgttttagg tgatttaagg 3180
ttagtgagac aagaaacacg taaaattttt aaa 3213
<210> 188
<211> 3213
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG07513.1大肠杆菌优化的"
<400> 188
atgcgcgagc tagattatcg catcggcctg gatattggca ctaactcaat aggctggggc 60
gtgatcgaac tgagctggaa taaagaccgc gagcagtatg aaaagacccg catcgtggat 120
aaaggcgtgc gcatgttcga caaagcggaa attccgaaaa ccggtgcaag tctggcggaa 180
ccaagacgta ttgcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaag 240
gatatcagga acctgctggt ccagcatgaa atcatcagcc agaaggaatt aaccagcctg 300
tacccgctga gcaaatcaag tatggacatc tgggatataa ggctggacgg cctggaccgc 360
ctgctggatc gttttgaatg ggcccgccta ttaatccatc tggcacagcg ccgtggcttc 420
aaatcaaacc gcaagagcga attaaaggac gtggagaccg gtaaagtgct gtcaagcatt 480
caggtgaatg aaaagcgcct gagcctgtat cgcaccgtgg gcgagatgtg gatgaaaaac 540
gcggactgct caaaatatgg caaacgccgc aacagcccga acgaatacgt gtttagcgtt 600
agccgtgcgg acctggaaaa agaaatcgtg accctgtttg aggcgcagcg caaattccat 660
agcagctatg cgagcgtgga tctgcagaaa acatacatcc agatctgggc acatcagctg 720
ccgtttgcga gcggtaacgc gatcgtgaat aaagtgggct attgcagcct attaaaaggc 780
aaagaaaaac gcgtgccgaa agcgacctat acattccagt acttcaatac actggaccaa 840
atcaaccgca cccgcctggg cccgaacttc cagccgttca ccaaagaaca gcgcgatata 900
atcctggata aaatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaggtg 960
acatactacg atataaggaa atggctggcg ctggatgaaa ccatccagtt caagggctta 1020
acctacgatc cgaacgagga gctgaaaaag atcgagatga aaccgttcat taatctgaaa 1080
ccgttctatg aaattaaaaa ggtggtaacc aactacgcga agaaaaccaa cgaagtgttc 1140
agcgcgctgg attacgatac cgtggcgtac gcgctgaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaaacg cagcaataat ctgagcaaac gctgctacga cgaccaatta 1260
atcgaagaac tgctgaccct gagctatact aagttcggcc acctgagctt caaagcgatt 1320
aatcacgtgc tgccaataat gcaggaaggc cgcacctacc aggaagcaat acaccagctg 1380
ggctacgata caaccaacct gaaaaaggaa aataggagca tgttcctgcc aataatcccg 1440
gatgaaatca ccaacccgat cgtgaaacgc gcgctgaccc aggcgcgcaa agtggtgaac 1500
gcaataatcc gccgctacgg ctcaccgaac agcgtgcaca tcgaactggc gcgcgaactg 1560
agcaaaagcc acgatgaacg caaaaagatc atgaccgcgc acgatgaaaa ctacaaaaag 1620
aacaaaggcg cggtgagcat cctgatcgat aacggcatcc tgaacccgac cggctacgat 1680
atcgtgcgct acaaactgtg gaaagaacag ggcgaacgct gcgcgtacag cctgaaaaag 1740
atcccggcga acaccttctt caacgaactg aaaaaggaac gctcaggccc gccggtgctg 1800
gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860
ctggtgtacg gcgacgaaaa ccagaaaaag ggcaaccgca tcccgtacac cttcttcagc 1920
gaagaagaca aagaatggga gagcttcgaa agctacgtgc gcagcaacag cttcttcagc 1980
aaaaagaaac gcggctacct gctgaaaaag gcgtacctgc cgcgcgaaag caacttaatc 2040
aaagaacgcc atctgaacga tacccgctac gcgagcagct acctgaaaaa cttcattgag 2100
aaaaacctga aattcaagga agcggtgggc atcacccgca agaagtacgt ccagaccgtg 2160
aacggcgtga tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaga tcgccaggaa 2220
acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280
accaaagtga ccgaatatta tcagatcaaa gaaggcaaca aatcaatcaa aaagccgtat 2340
tttccgctgc cgtggatggg cttccgcgaa gaaatcctta gccatctgga aagccagccg 2400
atcgcgcgca aaatcagcga agaactgaaa atcggctatc agagcccgga ttatatcctg 2460
gtgagccgca tgccgaaacg cagcgtgacc ggcagcgcgc atgatcagac cgtgatgaaa 2520
aagggcgata tcgataaaaa gggcaaaacc atcatcatca aacgcgtgca tctgaaagac 2580
atcaaattcg acgaaaacgg cgacttcaaa atggtgggca aggaacagga cttagcgacc 2640
tacgaagcga tcaaacagcg ctacctggaa taccgcaaag agagcaaaaa ggcgtttgaa 2700
accccgctgt acaaaccgag caaaaagggc aagggcaacc tgatcaaaaa gatcaaagtg 2760
gaagtccaga ccaaatcgtt tgtgcgcgag atcaacggcg gcgtggcgca gaacggcgat 2820
ctggtgcgcg tggatctgtt tgaaaaagat aaccgctatt atatggtgcc gatctacgtg 2880
gtggataccg tgcgcagcga actgccgaac aaagcggtga ccagcagcaa aggctatgaa 2940
cagtggttaa gcatcgataa cagcttcacc ttcaaattca gcctgtaccc gtatgatctg 3000
gtgcgcctgg tgaaaggcga tgaagatcgc ttcctgtatt ttagcaccct ggacatcaac 3060
agcgatcgcc tgaacttcaa agacgtgaac aaaccgagca aacaggcgga atatcgctac 3120
agcctgaaga ccatcgagaa cctggagaaa tacgaaattg gcgtgctggg cgatctgcgc 3180
ctggtgcgcc aggaaacccg caaaatcttc aaa 3213
<210> 189
<211> 3216
<212> DNA
<213> 芽孢杆菌属的种
<220>
<221> 来源
<223> /注="APG08290.1天然序列"
<400> 189
atgagtgagt tggattaccg catagggttg gatattggta cgaattccat tggctggggt 60
gttattgaat tattttggaa caaggacaga gaacgatatg aaaaagtaag gattgtcgac 120
aagggcgttc gtatgtttga taaggctgaa atacctaata agggtgcttc tcttgctgaa 180
ccgagacgta tagcgcgttc atcacgtaga aggttaaatc gcaaaagtca gaggaagaaa 240
gagatacgta atttacttgt tcaacacgga atgattaccc aagaggaatt ggatttgtta 300
tatcctcttt caaaaaaatc aatagatatt tgggatattc gtttggatgg attagatcgt 360
ctgttgaatc atcttgaatg ggctcgatta ttaattcatt tagcacaaag acgtggtttt 420
aagtcgaatc gaaagtctga attgaaagat gctgagacgg ggaaggtatt atcgagtatt 480
caagtaaatg aaaaacgact atttctgtac cgtacagtgg gggaaatgtg gataaaagat 540
gctgagttta gtaagtatga tagaagacgt aattctccta atgagtatgt attttcggtt 600
agtcgtgcgg acttagaaaa ggaaattgtt actctatttg aagcacaaag aaagtttcag 660
tcatcatacg catcgaagaa cttacaagaa acatatttac aaatttgggc acaccaactt 720
ccttttgctt ctgggaatgc aattttaaac aaagtaggct attgttcatt attgaaaggg 780
aaagaaagga gaattccgaa agcaacatat acttttcaat atttcagtgc actagatcag 840
gtgaatcgaa cacgattagg acctgatttt caaccattta cgcaggaaca gaaagagatt 900
attttagata aaatgtttca acgtacagat tattataaaa aaaagactat acctgaagtt 960
agctactatg atatacggaa atggctagag ttagatgaaa ctattcaatt taaaggactt 1020
aattatgatc caaacgaaga actgaaaaaa atagaaaaaa aaccatttat taatttaaag 1080
gcattctatg aaattaaaaa ggtagttgca aattatgctg agagaacaaa tgaggcattt 1140
tcaacgttag actatgatgc gattgcatat gctttaacag tttataaaac ggacaaagat 1200
attagatctt atttgaagaa atctaataat ttatcaaaac gttgctacga cgatcaatta 1260
atagaagagc tatttactct ctcctataca aagtttggtc atttatcatt taaagcaatt 1320
aatcatgtac ttccaattat gcaagaggga aggacttatc aagaagcgat acaccaatta 1380
ggatatgata ccactaatct taaaaaagaa aacagaagta tgttcttgcc tcttattcca 1440
gatgaaataa caaatccaat tgttaaaaga gcgataactc aagcacgtaa agttgtaaac 1500
gctattatta gaagatatgg ttctccaaat tctgttcata ttgaactagc tcgtgagctt 1560
tctaaaagtc atgacgagag aaagaaaata atgacggctc atgatgaaaa ttataagaaa 1620
aataaaggag ctatatccat tttgatcgag aatggaattt taaatccgac aggatatgat 1680
attgtacgtt ataagttatg gaaagagcaa ggagaacgat gtgcttattc gttaaaggag 1740
attcctccgg atacgttttt taatgaatta aaaaaagaac gaaatggttc tccaattcta 1800
gaggtagatc acattttacc gtatagccaa agttttattg atagttatca taataaagta 1860
ttagtttaca gtgatgaaaa tcgaaacaag ggaaatcgaa ttccatatac ctatttttta 1920
gagacaaata aggattggga agcttttgaa aggtatgtaa gatcaaataa gcttttttct 1980
aaaaagaagc gtgagtattt attgaaaaaa acatatttgc caagagagag tgaactaata 2040
aaggagcgac atttaaatga tacgcgatat gctagtacct ttttgaaaaa cttcattgag 2100
cagaacttgc aatttaaaga agttgaagtt aatctgcgta aaaaacgtgt gcaaacagtt 2160
aatggtgtaa ttacagcgca ccttcgaaaa agatggggat tagaaaaaaa tagacaggaa 2220
acatatctgc atcatgcaat ggacgctatc attgttgctt gtacagacca tcatatggtt 2280
actagaataa cagagtatta tcaaataaaa gaaagtaata aatcagtaaa gaaaccatat 2340
tttccgatgc catgggaggg ttttagagat gaactcttat cacatttagc gagccagcca 2400
attgctaaaa aaattagtga ggagcttaaa gctggatatc aatcatctga ttatatattt 2460
gtgtctcgaa tgccaaaaag atctgtcact ggagcagctc atgatcaaac gattaggaga 2520
aaaggtggta ttgataaaaa aggaaaaact attattataa agcgtgtgcg cttaaaggat 2580
attaagtttg atgagaatgg cgattttaaa atggttggaa aagaacaaga tttagcaact 2640
tatgaggcga taaagcaaag atatttggag catagaaaaa actcgaaaaa agcatttgaa 2700
acacctctat acaagcctag taaaaaaggg acaggaaatc tcatcaaaag agttaaaatt 2760
gaaggacaaa ctaaagcttt tgttcgagaa gtaaatgggg gagtagccca aaatagtgat 2820
ttagtaagag ttgatttatt tgaaaaagat gataaatatt acatggtgcc tatttatgta 2880
ccagataccg tttgttcaga attacccaaa aaagttgtga aaagtggtaa gggttatgag 2940
caatggctaa cactagataa cagctttacg tttaaatcta gtttataccc ttatgattta 3000
gtacgtcttg taaaaggtaa tgaagatcgt tttttatact ttggtactct cgatatcgat 3060
tctgaccgtc ttaattttaa agatgtaaat aagccatcaa aacagaatga atatcgttat 3120
agtcttaaaa caattgagaa tttagaaaaa tatgaggttg gtgttttagg tgatttaagg 3180
ttagtgaaac aagaaacacg tagaattttt aataga 3216
<210> 190
<211> 3216
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG08290.1大肠杆菌优化的"
<400> 190
atgagcgagc tagattatcg catcggcctg gatatcggca ctaactcaat aggctggggc 60
gtgatcgaac tgttctggaa taaagaccgc gagcgctatg aaaaggtgcg catcgtggac 120
aaaggcgtca ggatgttcga caaagcggag atcccgaata aaggtgcatc actggcggaa 180
ccaagacgta tagcacgtag tagtcgccgc cgattaaacc gcaaaagtca gcgcaagaaa 240
gagatccgta acctgctggt tcagcatggc atgatcaccc aggaagaact ggatctgctg 300
tacccgctga gcaagaaatc aatcgacatc tgggatataa ggctggacgg cctggaccgc 360
ctattaaacc atctggaatg ggcccgccta ttaatccatc tggcgcagcg tagaggcttc 420
aaatcaaacc gcaagagcga attaaaggac gcggagaccg gtaaagtgct gtcaagcatt 480
caggtgaatg aaaagcgcct gttcctgtat cgcaccgtgg gcgagatgtg gattaaagac 540
gcggagttct caaaatacga ccgccgtcgc aacagcccga acgaatacgt gtttagcgtt 600
agccgtgcgg acctggagaa agaaatcgtg accctgtttg aagcgcagcg caaattccaa 660
tcaagctacg cgagcaagaa cctgcaagag acctacctgc agatttgggc acatcagctg 720
ccgtttgcaa gcggcaacgc gatattaaac aaagtgggct attgcagcct attaaaaggc 780
aaagaacgcc gcatcccgaa agcgacctat acattccagt acttcagcgc gctggaccag 840
gtgaaccgta cccgtctggg ccctgatttt cagccgttta cccaggaaca gaaagaaata 900
atcctggata aaatgttcca gcgcaccgac tactataaaa agaaaaccat cccggaagtg 960
tcatattacg atataaggaa atggctggag ctggatgaga ccatccagtt caagggcctg 1020
aactacgatc cgaacgagga gctgaaaaaa atcgagaaaa aaccgttcat taatctgaaa 1080
gcgttctatg aaattaaaaa agtggtggcg aactacgcgg aacgaaccaa cgaagcattc 1140
agcaccctgg attacgatgc gatcgcgtac gcgttaaccg tgtataaaac cgacaaggat 1200
ataaggagct acctgaaaaa atcaaacaac ctgagcaaac gctgctacga cgaccaatta 1260
atcgaagaac tgttcaccct gagctatact aagttcggcc acctgagctt caaagcgatt 1320
aatcacgtgc tgccaataat gcaggaaggc cgcacctacc aggaagcgat ccaccagctg 1380
ggctacgata ccaccaacct gaaaaaagaa aaccgcagca tgttcctgcc gctgatcccg 1440
gatgaaatca ccaacccgat cgtgaaacgc gcgatcaccc aggcgcgcaa agtggtgaac 1500
gcgatcatcc gccgctacgg ctcaccgaac agcgtgcaca tcgagctggc gcgcgagctg 1560
agcaaaagcc acgacgagcg caaaaaaatc atgaccgcgc acgacgagaa ctacaagaaa 1620
aacaaaggcg cgatcagcat cctgatcgag aacggcatcc tgaacccgac cggctacgat 1680
atcgtgcgct acaaactgtg gaaagaacag ggtgaacgct gcgcgtacag cctgaaagaa 1740
atcccgccgg ataccttctt caacgaactg aaaaaagaac gcaacggctc accgatcctg 1800
gaagtggatc acatcctgcc gtacagccag agcttcatcg atagctacca caacaaagtg 1860
ctggtgtaca gcgatgaaaa ccgcaacaaa ggcaaccgca tcccgtacac ctacttcctg 1920
gaaaccaaca aagattggga agcgttcgaa cgctacgtgc gcagcaacaa actgttcagc 1980
aaaaagaaac gcgaatacct gctgaaaaaa acctacctgc cgcgcgaaag cgaactgatc 2040
aaagaacgcc acttaaacga tacccgctac gcgagcacct tcctgaaaaa cttcatcgaa 2100
cagaacctgc agttcaaaga agtggaggtg aacctgcgta aaaagcgcgt ccagaccgtg 2160
aacggcgtga tcaccgcgca tctgcgcaaa cgctggggcc tggaaaaaaa ccgccaggaa 2220
acctatctgc atcatgcgat ggatgcgatc atcgtggcgt gcaccgatca tcatatggtg 2280
acccgcatca ccgaatatta tcagatcaaa gaaagcaaca aatcagtgaa aaaaccgtat 2340
tttccgatgc cgtgggaagg ctttcgcgat gaactgctga gccatctggc gagccagccg 2400
atcgcgaaaa aaatcagcga agaactgaaa gcgggctatc agagcagcga ttatatcttt 2460
gtgagccgca tgccgaaacg cagcgtgacc ggcgcggcgc atgatcagac catccgccgc 2520
aaaggcggca tcgataaaaa aggcaaaacc atcatcatca aacgcgtgcg cctgaaagat 2580
atcaaatttg atgaaaacgg cgattttaaa atggtgggca aagaacagga cttagcgacc 2640
tacgaagcga tcaaacagcg ctatctggag catcgcaaga acagcaaaaa agcgtttgag 2700
accccgctgt acaaaccgag caaaaaaggc accggcaacc tgatcaaacg cgtgaaaatc 2760
gagggccaga ccaaagcgtt tgtgcgcgaa gtgaacggcg gcgtggcgca gaacagcgat 2820
ctggtgcgcg tggatctgtt tgaaaaagat gacaaatatt atatggtgcc gatctatgtg 2880
ccggataccg tgtgtagcga actgccgaaa aaagtggtga aaagcggcaa aggctatgaa 2940
cagtggttaa ccctggataa cagcttcacc ttcaagagca gcctgtaccc gtatgatctg 3000
gtgcgcctgg tgaaaggcaa cgaagatcgc tttctgtatt ttggcaccct ggacatcgat 3060
agcgatcgcc tgaacttcaa agacgtgaac aaaccgagca agcagaacga ataccgctac 3120
agcctgaaga ccatcgagaa cctggagaaa tatgaagtgg gcgtgctggg cgatctgcgc 3180
ctggtgaaac aggaaacccg ccgcattttt aaccgc 3216
<210> 191
<211> 4011
<212> DNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="APG05459.1天然序列"
<400> 191
atgaagaaag actacgttat tggtctggat atagggacta attctgtcgg ctgggcagtt 60
atgacagaag actatcagtt ggtgaagaaa aaaatgccta tttatggaaa cactgaaaaa 120
aagaaaatca agaaaaattt ttggggtgtg cgtttatttg aagaagggca tacagccgaa 180
gatcgccgat taaaaagaac agcacgacga agaattagtc gtcgacggaa tcgtttacgc 240
tacttacaag ctttttttga agaagcgatg acagctttgg atgaaaactt ttttgctcgt 300
ttacaagaga gttttttagt gcctgaagat aagaagtggc acagacatcc gatttttgct 360
aagttggaag atgaagtagc ttaccatgaa acgtatccga caatctacca tttacgcaaa 420
aaattagcag attcatctga gcaagcagat ttacgactaa tttatttggc gttggcacat 480
attgtcaaat atcgtggaca ttttttaatt gaaggaaaat taagtacaga aaatatttct 540
gttaaagaac aatttcaaca atttatgatc atttataacc aaacctttgt gaatggagag 600
agtcgcttag ttagtgcgcc attacctgaa tctgtcttga ttgaggaaga gttgactgaa 660
aaagcttctc gtactaaaaa atctgaaaaa gtcttacaac aatttcctca agaaaaagct 720
aatggcttat ttggtcagtt cttaaagcta atggtaggga ataaagctga ctttaaaaaa 780
gtttttggtt tggaagaaga agccaaaata acctacgcta gtgaaagcta tgaagaagat 840
ttagaaggca ttttagcaaa ggttggggat gaatatagtg acgtgttttt agctgctaaa 900
aatgtgtacg atgcagttga attatcaacg attttagcag attcggataa aaaaagtcac 960
gcgaaattat cttctagcat gattgtccgt tttacagaac atcaagaaga tttaaaaaaa 1020
ttcaaacgat ttattcgtga aaattgtcca gacgaatatg ataatctctt taaaaatgaa 1080
cagaaagacg gctatgcagg ctacattgca cacgcaggta aggtttcaca gcttaaattt 1140
taccagtatg ttaagaaaat cattcaagat attgctggag cagaatattt tttagaaaaa 1200
attgctcaag aaaacttttt aagaaagcaa cggacctttg ataatggggt gattcctcat 1260
caaattcatt tggctgagtt acaagcaatc attcatcgtc aagcggccta ttatccattt 1320
ttaaaagaaa atcaagaaaa aattgaacaa ctggttacat ttcgaattcc ttattatgtc 1380
ggaccattat caaaaggaga tgcaagtacc ttcgcttggc taaaacgtca aagtgaggaa 1440
ccaattcgac cttggaacct tcaagaaacc gttgatttgg accaatcagc gacagccttt 1500
attgaacgaa tgaccaattt tgatacgtat ttaccttctg aaaaagtttt accgaaacat 1560
agtttgttat atgaaaagtt tatggtattt aatgaattga ccaagatttc ttatacggat 1620
gatcgaggaa tcaaagccaa tttttcaggt aaagaaaaag aaaaaatctt tgattatctg 1680
tttaagacgc gtcgaaaagt taagaaaaag gatatcattc aattctatcg aaacgaatat 1740
aatacggaga ttgtcacgct tagtggactt gaagaagacc aatttaatgc tagttttagc 1800
acgtatcagg atttactgaa atgtggttta acaagagctg aattagacca ccctgataat 1860
gccgaaaaat tggaagatat cataaaaatt ttaactattt ttgaagatcg gcaacgaatt 1920
cggacgcaac tttccacatt caaagggcag ttctcagcag aagtactaaa aaaattagaa 1980
cgcaagcact acactggctg gggaagattg tcgaaaaaat taatcaatgg tatctacgat 2040
aaagaatcgg gtaaaacaat tttggactat ttaattaaag atgatggggt ctcaaaacac 2100
tataatcgca attttatgca actgattaat gattcacaat tatcttttaa aaatgctatt 2160
caaaaagcac agtccagtga acatgaagaa acattaagtg aaactgtcaa tgaattagct 2220
ggtagtccag caataaaaaa aggaatttat caaagtttaa aaattgtcga tgaactagtc 2280
gcgattatgg gttatgcgcc caagcggatt gttgtcgaaa tggcacgtga aaatcaaacg 2340
actagcactg gcaagagaag atccatccaa cgcttgaaaa tagttgaaaa agcaatggcc 2400
gaaatcggca gcaatttatt aaaagaacaa ccaacgacta atgaacagtt acgagatacc 2460
cgtcttttcc tttactatat gcaaaatggt aaagatatgt acacgggaga tgaattatcg 2520
cttcatcgtt tatctcacta tgatattgat catattatcc cacaaagctt tatgaaagac 2580
gattcattgg ataacctagt tttagtgggc tctactgaaa atcgagggaa atccgatgat 2640
gtacctagca aggaagttgt taaggatatg aaagcttatt gggagaaatt atatgctgct 2700
ggcttaatta gtcaacggaa attccaacgt ctgaccaagg gggagcaagg tggcttgact 2760
ctcgaagaca aagcgcattt tatccaacga caattagtag aaactcgtca aattaccaaa 2820
aatgttgcag ggatcttaga tcaacgctac aatgctaatt caaaagagaa aaaagtccaa 2880
atcatcacct tgaaagctag tttaacgagc caatttcgtt cgatttttgg cttgtataaa 2940
gttcgtgaag tgaatgatta tcaccatgga caagatgctt atttaaactg tgtggtcgca 3000
accacgttat taaaagttta tcctaattta gcaccagaat ttgtttacgg agaatatcct 3060
aaattccagg cctttaaaga aaataaagcc acggcgaaga ctataattta tacaaatttg 3120
atgcgctttt tcacggaaga tgaaccacgg ttcatgaagg atggcgaaat tctttggagt 3180
aacagttatt taaaaaatat caaaaaagaa ttaaattacc atcaaatgaa tattgtcaaa 3240
aaagtagaag tgcaaaaagg cggtttttca aaagagtcga ttaaacccaa aggaccatcg 3300
aataaattga ttcctgtcaa aaatggtttg gatccccaaa aatatggcgg ttttgatagt 3360
cctgtagttg cttatacagt gttattcacg catgaaaaag gtaaaaaacc tcttattaaa 3420
caggagatac tgggcattac gattatggaa aaaacaaggt ttgaacaaaa tcctattctt 3480
tttttagagg agaaaggctt cctacggcct cgtgtattaa tgaaattgcc taagtataca 3540
ctgtatgaat ttccagaggg gcgcaggcgc ttattagcca gcgctaaaga agcgcaaaaa 3600
gggaaccaga tggttttacc tgaacattta cttacgttac tgtaccatgc gaaacaatgt 3660
ttgttaccaa atcaatcaga aagtttggct tatgtagaac aacatcaacc agaatttcaa 3720
gagattttag agagagtggt tgactttgct gaagtgcata cattagccaa gtcaaaagtc 3780
cagcaaattg tgaaactttt tgaagcaaat caaacagcag atgtgaaaga gattgcggca 3840
tcctttatcc aacttatgca gtttaatgcg atgggcgcac caagtacgtt taaatttttc 3900
caaaaagaca ttgagcgagc acgctacacg tcaatcaaag aaatttttga tgccactatc 3960
atttaccaat cgactacggg actgtatgaa acacgcagaa aggttgtcga c 4011
<210> 192
<211> 4011
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG05459.1大肠杆菌优化的"
<400> 192
atgaaaaagg actacgtgat cggcctagac atcggcacta acagcgttgg ttgggcggtg 60
atgaccgaag attaccagct agtgaagaag aagatgccta tctacggtaa tacagagaag 120
aagaagatta aaaagaactt ctggggcgtg aggctattcg aggagggtca caccgcggag 180
gaccgccgcc tgaagcgcac cgctagacgc cgtatttcac gtcgtcgtaa ccgtctgcgt 240
tacctgcaag cattcttcga agaagcaatg accgcgctgg atgaaaactt cttcgctagg 300
ctgcaggagt catttctggt gccggaggat aaaaagtggc accgtcatcc gatcttcgcg 360
aaactagaag acgaggtggc gtaccatgaa acctacccga ctatctacca cctgcgcaaa 420
aagctggcgg atagcagcga acaagcagac ctgcgattaa tctatctggc gctggcgcac 480
atcgtaaaat acagaggcca cttcctcatc gagggcaaat tatcgaccga aaatattagc 540
gtgaaggagc agttccagca gttcatgatc atctacaacc aaaccttcgt gaacggcgaa 600
tcaaggctgg tgagcgcgcc gctgccggag agcgtattaa ttgaggagga attaaccgag 660
aaagcgagcc gcactaagaa aagcgagaaa gtgcttcagc agttcccgca agaaaaagcg 720
aacggcctgt tcggccagtt cctgaaatta atggtgggca ataaagcgga cttcaaaaag 780
gtgttcggcc tggaagagga ggcgaaaata acctacgcga gcgaaagcta cgaggaagac 840
ctggagggca tactagcgaa agtgggcgac gaatacagtg acgtgttcct ggcggctaaa 900
aacgtgtacg acgcggtgga attaagcacc atactagcgg acagcgataa aaagagtcac 960
gcgaaattaa gctcaagcat gatcgtgcgc ttcaccgaac accaggaaga cctgaaaaag 1020
ttcaaacgct tcatccgcga aaactgcccg gacgaatacg ataacctgtt caaaaacgaa 1080
cagaaagatg gctacgcggg atacatcgcg cacgcgggca aagtgtcaca attaaagttc 1140
taccagtacg tgaagaaaat aatccaggat atcgcgggcg cggaatactt cctggagaaa 1200
atagcgcagg agaacttcct taggaaacag cgcaccttcg acaacggcgt gatcccgcac 1260
caaatacacc tggcggaact acaggcaata attcaccgcc aggcggcata ctacccgttc 1320
ctgaaagaga accaggagaa aatagaacag ctggtgacct tccgcatccc atactacgtg 1380
ggcccgctta gcaaaggcga tgcgagcacc ttcgcgtggc tgaaacgcca gagcgaagaa 1440
ccaatccgcc cgtggaactt acaagaaacc gtggatctgg atcagagcgc gaccgcgttc 1500
atcgaacgca tgaccaactt cgatacatac ctgccgagcg aaaaagtgct gccgaagcat 1560
agcctgctgt atgaaaaatt catggtgttc aacgaactga ccaaaataag ctacaccgat 1620
gatcgcggca ttaaagcgaa cttcagcggc aaagaaaaag agaaaatatt cgattaccta 1680
ttcaaaaccc gccgcaaagt gaaaaagaaa gacataatac agttctaccg caacgaatac 1740
aacaccgaaa tcgtgaccct gagcggcctg gaagaagatc agttcaacgc gagcttcagc 1800
acctaccagg acttattaaa atgcggcctg acccgcgcgg agcttgacca cccggacaac 1860
gcggaaaaac tggaagatat cattaaaata ctgaccatct tcgaagatcg ccagcgcatc 1920
cgcacccagc tgagcacctt caagggccag ttcagcgcgg aagtgctgaa aaagctggaa 1980
cgcaaacatt acaccggctg gggccgcctg agcaaaaagc tgatcaacgg catctacgat 2040
aaagaatcag gcaaaaccat cctggactac ctgatcaaag atgacggcgt gagcaaacac 2100
tacaaccgca acttcatgca gctgatcaac gatagccagc tgagcttcaa gaacgcgatc 2160
cagaaagcgc agagcagcga acatgaagaa accctgagcg aaaccgtgaa cgaactggcg 2220
ggcagcccgg cgatcaaaaa gggcatctat cagagcctga aaatcgtgga tgaattagtg 2280
gcgatcatgg gctatgcgcc gaaacgcatc gtggtggaaa tggcgcgcga aaaccagacc 2340
accagcaccg gcaaacgccg cagcatccag cgcctgaaaa tcgtggaaaa agcgatggcg 2400
gaaatcggca gcaacctgct gaaagaacag ccgaccacca acgaacagct gcgcgatacc 2460
cgcctgtttc tgtattatat gcagaacggc aaagatatgt ataccggcga tgaactgtca 2520
ctgcatcgcc tcagccatta tgatatcgat catatcatcc cgcagagctt tatgaaagat 2580
gatagcctgg ataacctggt gctggtgggc agcaccgaaa accgcggcaa aagcgatgat 2640
gtgccgagca aagaagtggt gaaagatatg aaagcgtatt gggaaaaact gtatgcggcg 2700
ggcctgatca gccagcgcaa atttcagcgc ctgaccaaag gcgaacaggg cggcctgacc 2760
ttagaagata aagcgcattt tatccagcgc cagctggtgg aaacccgcca gatcaccaaa 2820
aacgtggcgg gcatcctgga tcagcgctat aacgcgaaca gcaaagaaaa gaaagtccag 2880
atcatcaccc tgaaagcgag cctgaccagc cagtttcgca gcatctttgg cctgtataaa 2940
gtgcgcgaag tgaacgatta tcatcatggc caggatgcgt atctgaactg cgtggtggcg 3000
accaccttac tgaaagtgta tccgaacctg gcgccggaat ttgtgtatgg cgaatatccg 3060
aaatttcagg cgtttaaaga aaacaaagcg accgcgaaaa ccatcatcta taccaacctg 3120
atgcgcttct ttaccgaaga tgaaccgcgc tttatgaaag atggcgaaat tctgtggagc 3180
aacagctatc tgaaaaacat caaaaaggaa ctgaactacc accagatgaa catcgtgaaa 3240
aaggtggagg tccagaaagg cggcttctca aaggaaagca tcaaaccgaa aggcccgagc 3300
aacaaactga tcccggtgaa aaacggcctg gacccgcaga aatatggcgg ctttgatagc 3360
ccggtggtgg cgtataccgt gctgtttacc catgaaaaag gcaaaaagcc gctgatcaaa 3420
caggaaattc tgggcatcac catcatggag aaaacccgct ttgaacagaa cccgatcctg 3480
ttcctggaag aaaaaggctt tctgcgcccg cgcgtgctga tgaaactgcc gaaatatacc 3540
ctctatgaat ttccggaagg ccgccgccgc ctgctggcga gcgcgaaaga agcgcagaaa 3600
ggcaaccaga tggtgttacc ggaacatctg ctgaccctgc tgtatcatgc gaaacagtgc 3660
ctgctgccga accagagcga aagcctggcg tatgtggaac agcatcagcc ggaatttcag 3720
gaaattctgg aacgcgtggt ggattttgcg gaagtgcata ccctggcgaa aagcaaagtt 3780
cagcagattg ttaaactgtt tgaagcgaac cagaccgcgg atgtgaaaga aattgcggcg 3840
agctttattc agctgatgca gtttaacgcg atgggcgccc cgagcacctt caaattcttt 3900
cagaaagata ttgaacgcgc gcgctatacc agcattaaag aaatttttga tgcgaccatt 3960
atctatcagt caaccaccgg cctgtatgaa acccgccgca aagtggtgga t 4011
<210> 193
<211> 4308
<212> DNA
<213> 肠球菌属的种
<220>
<221> 来源
<223> /注="APG04583.1天然序列"
<400> 193
atggctaaaa atatacttgg attagatttg ggaaccaata gtattggttg ggcgttggta 60
cagcaagact ttgaaaacaa agaaggaaat attcttggaa tgggaagtag gattattccg 120
atgtcgcaag atattttagg agaattcggt aaggggaatt ctatttctca aactgctgaa 180
cgtactggtt atcgtggtgt ccgtcggtta agagaacgac atttattacg tcgtgagcgt 240
ttgcaccgag ttttgcattt gttgggtttc ttgccaaaac attatgatga aaaaatagat 300
tttacacaac gttttgggaa attcattaac caagccgaac ctaaattggc ttttgatagt 360
gaatttcttt ttaaagattc tttccatgaa atgttagctg attttaaaca aaatcaacca 420
gagtttttga aagataaaaa tggagaagat tgtttagttc cttatgattg gacgatttat 480
tatttacgta aaaaagcatt aacgcaaaaa attgagaaat atgaattagc ttggttgatt 540
cttaatttta atcaaaaacg tggttattat caattaagag gtgaagaaga gaaagaaaat 600
ccaaataaat tggtgggatt tcattctttg aaaatcgttg atgttattcc cgatgctgaa 660
acaaataaaa aaggagagac ttggtattct ttgcatttag aaaatggttg ggtatatcgc 720
cgttcttcta aaatttcatt agcggattgg aaagataaag ttcgagattt tattgttacg 780
actgatttaa acgatgatgg ttctgaaaaa ttggataaag atggaattgt gaaacgtagc 840
tttcgtgcac caagtgcgga tgattggact ttgttgaaaa agaaaacaga aaaagatatt 900
gataactcta acaaaactgt tggaacttat atttacgaca atcttttatt gaacccaaaa 960
caaaaaataa aaggaaaaat ggttcgtacc atcgaacgta agttttacaa gcaagaatta 1020
gaacaaattt taaaaactca aaaagaattt cattcagaat tacaaagtga aaatttgcta 1080
caagattgtg ttcgagaatt gtatcgaaat aatgaacaac atcaacaaat gttagaagct 1140
aaagattttg tgcatttgtt cctaaatgat attattttct atcaacgtcc tttgagaagt 1200
caaaaatcca gtatatcgaa ttgtactttg gaatttagaa aatcgaaaaa tgaaaatggt 1260
gaagaagtta ttcatcgttt aaaagtaatt gcaaaatcga atccatatta tcaggaattt 1320
agattgttac aatgggtgca aaatttagca atttatacaa aagatgatga taaaaatgta 1380
acaaacgaat ttctaaagtc tactcaagat tgggaggatt tattgagatg gctacattct 1440
aaaaaagaaa ttaaacagga tgctttaatt aagtttttga ttgaaaagaa aggtttaaaa 1500
ggcaaagctt taactattga agtagcaaaa tatcgttgga attatgttca ggacaaagat 1560
taccctggta atgaaacccg atatttaatt caatctcgtt tggataaagt tgaatatgca 1620
cctaaggatt ttttaactta tgaaaatgaa atggctttgt ggcacatcat ttattcgata 1680
aacgataaaa ttgagtacga aaaagcctta aaatcttttg ccaacaaaaa aggtttggac 1740
gaagtaactt ttgttgaagc gtttaagaaa ttcccgcctt ttaaaagtga ttacggaagt 1800
ttttctgaaa aagcaatcaa gaaattattg cctttgatgc gttttggaac tcaatggaat 1860
tgggataata tcgatcaaaa ttctaaagaa agaattggaa aaatattgac aggcgaatat 1920
gatgaaaaca tcaaaggtcg tgttcgcgaa aaagcaagac atctcaattc tgaaaccgat 1980
tttcaagctt tacctttgtg gttggcgcaa tacgtagttt acggaagaca ttctgaagct 2040
gatattgcag gtaaatggaa ttcggtggat gatttaaagc aatttttaga tgactttaaa 2100
caacattcgc ttcgtaatcc tattgtagag caagtgatta ctgaaacgtt gcgtgcggta 2160
aaagatattt ggaattttta tggaaaaggt gctaaagatt tcttctctga aattcatatc 2220
gagctggggc gtgaaatgaa aaatacggct gatgaacgca agcgtattac tacaatggtt 2280
acggataacg aaaacaccaa tttgcgtatc aaagctttgt tggctgaaat ggctttggat 2340
caaaatgtag ataatgttcg tccatattct ccaatgcaac aagaaatttt gaaaatctat 2400
gaagaaggtg ttttgaatgc tgaagaaaat atcgatgatg atattctgaa aattagtaaa 2460
acggctcaac cttctgctac agatttaaag cgttacaaat tgtggttaga acaaaaatat 2520
cgttcgcctt atacaggtca aatgattcct ttgaataagc tgtttacacc tgaatatgag 2580
attgaacaca taattccgca aagtcgctat tttgatgata gtatgagcaa taaagtgatt 2640
tgcgaagcag cggtgaataa acttaaagac aatcaaattg gtttggtttt cattaagaat 2700
catcacggag aagttgtgga tttcggaatg ggaaaacaag tgaagatttt ggaagtttcc 2760
gattatgagg attttgtaaa acaaaattac aataaaaaca gaggaaaacg taataagttg 2820
ttattggaag atattcctga gaaaatgatt gaacgtcaac taaatgatac acgttacatc 2880
agcaaatata ttacgcaagt gttatcgaat attgttcgtg atgataaaga aggtagtaaa 2940
gatgatggtg taaattctaa aaatattgtt cctggaaacg gaaaaattac cacaagactt 3000
aaacaagatt ggggattgaa tgacgtttgg aatgatttgg ttttacctcg ttttgaacga 3060
atgaatacat tgactaattc aaatgatttt acatcaaaaa atacacatgg aaaaacaatt 3120
ccaacagttc caattgagtt atccaaaggt ttttctaaaa aacgtatcga tcatcgtcat 3180
cacgcaatgg atgcgttggt aattgcctgt gcaacgagag atcacgtgaa tttgttgaat 3240
aacgaaagtt caaaatcgga tacaaaacgt tatgatttga ataggaaatt aagaaaatac 3300
gagaaagtag cttacaatga tcccaaaaca ggcgaacgaa ttgagaaaga agttccaaaa 3360
gacttcatta aaccttggga gacctttacc gaagatacgc gaactttgtt agaaaatatt 3420
gtaattagtt tcaagcaaaa tctacgagtt atcaataaag caaccaatta ttatgaaaaa 3480
attgagaatg ggaaaaaagt aaaagttgaa caaaagggaa taaattgggc tgtaagaaaa 3540
gctttgcata aagaaaccgt ttctggacaa gtgcatttgg atagaataaa agttgcaaaa 3600
ggtaaaatat taacggctac tcgtaaaact ttggatgcct cttttaatga aaaaacaatt 3660
gagtcaatta cggatacagg gattcaaaag attttattga attatttaaa atcaaaagat 3720
aacaatccag aggttgcatt ttcaccagaa ggaatagaag aattaaataa aaatattagg 3780
ctatataatg atggaaaagc acatcaacca attttgaaag ttcgtgtttt tgagcaagga 3840
agcaaattta ctttaggtga gacgggaaat aaaaccacta agtttgtaga agcagcaaag 3900
ggtactaatc tatttttcgg aatttatgaa gacaaatcag gtaagagaag ctacgaaacc 3960
attccattaa atattgtcat cgaaagacaa aaacaaggtc tgcaagctgt tcccgaaacc 4020
aatgagaaag ggaaacaatt gttgtttacg ttatctccaa atgatttggt ttacgttcct 4080
gaagaaggag tttttgatga gaataatatc aaggtagata ggatttataa ggtagtgagt 4140
ttttctacct atcaatgttt ttttgtaaga aatgatgttt ctacttctgt agttaataag 4200
gttgaatatt ccgctttaaa taaaatggaa aaatctattg acaacataat gataaaagaa 4260
aactgcgtca aactgaatgt agaccgttta ggaaagattt caaaagct 4308
<210> 194
<211> 4308
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG04583.1大肠杆菌优化的"
<400> 194
atggcgaaga acatactagg cctggatctc ggaaccaaca gcattggttg ggcactggtc 60
cagcaggact tcgagaataa agagggcaac atactaggca tgggcagccg aataatccct 120
atgagtcagg acatactagg cgagttcggc aagggcaaca gcattagcca gaccgcagaa 180
cgtactggtt atcgtggtgt gcgccgttta cgtgaacgtc atctgttacg tcgtgaacgt 240
ctgcatcgtg ttctgcatct gttaggcttc ctgccgaagc attacgatga aaagatcgac 300
ttcacccagc gcttcggcaa gttcattaat caagcggaac caaagctggc gttcgacagc 360
gagttcctgt tcaaggacag cttccatgaa atgctagcgg acttcaagca gaatcaaccg 420
gagttcctga aggataaaaa cggcgaggac tgcctggtgc cgtacgactg gaccatatac 480
tacctgcgca agaaagcact gacccagaag atcgaaaaat acgagctagc gtggctcatc 540
ctgaacttca atcaaaagcg cggatactac cagcttaggg gcgaggagga gaaagagaac 600
ccgaataaac tggtgggctt ccacagcctg aaaatagtgg acgtgatccc ggacgcggaa 660
accaataaaa agggcgagac ctggtactca ctgcatctgg aaaacggctg ggtgtaccgc 720
cgcagcagca aaataagcct ggcggactgg aaagacaaag tgcgcgactt catcgtgacc 780
accgacctga acgatgacgg cagcgaaaaa ctggacaaag acggcatcgt gaaacgcagc 840
tttcgtgcac cgagcgcaga tgattggacc ctattaaaga aaaagaccga aaaagacatc 900
gacaacagca ataaaaccgt gggcacctac atctacgaca acctgttatt aaacccgaag 960
cagaaaatca aaggcaaaat ggtgcgcacc atcgaacgca aattctacaa acaggagctg 1020
gagcagatcc tgaaaaccca gaaggaattc cacagcgaac tgcagagcga aaacctgctg 1080
caggattgcg tgcgcgaact gtaccgcaat aatgaacagc accagcagat gctggaagcg 1140
aaagatttcg tgcacctgtt cctgaacgat ataatcttct accagcgccc gctgcgcagc 1200
cagaaatcaa gcatcagcaa ttgcaccctg gaattccgca aaagcaagaa tgaaaacggc 1260
gaagaagtga tccaccgcct gaaagtgatc gcgaaaagca acccatacta ccaggaattc 1320
cgcctgctgc agtgggtcca gaacctggcg atctatacta aagacgacga caagaacgta 1380
accaacgagt tcctgaaatc aacccaggac tgggaagatc tgctgcgctg gctgcatagc 1440
aagaaggaga ttaaacagga cgcgctgatc aagttcctga tcgagaaaaa gggcctgaag 1500
ggcaaagcat tgaccatcga ggtggcaaaa taccgctgga actacgtcca ggacaaagat 1560
tacccgggca atgaaacccg ctacctgatc caatcaaggc tggacaaagt ggaatacgcg 1620
ccgaaagatt tcctgaccta cgagaatgaa atggcgctgt ggcacatcat ctacagcatt 1680
aatgataaaa tcgaatatga aaaagcatta aaatcgttcg cgaataaaaa gggcctggat 1740
gaagtgacct tcgtggaagc attcaaaaag ttcccgccgt tcaaaagcga ttacggcagc 1800
ttcagcgaaa aagcgattaa aaagctgctg ccattaatgc gcttcggcac ccagtggaac 1860
tgggataaca tcgatcaaaa tagcaaagaa cgcatcggca aaatactaac cggcgaatac 1920
gatgaaaata ttaaaggccg cgtgcgcgaa aaagcgcgcc atctgaacag cgaaaccgat 1980
ttccaagcat tgccgctgtg gctggcgcag tacgtggtgt acggccgcca tagcgaagcg 2040
gatatcgcgg gcaaatggaa cagcgtggat gatctgaaac agttcctgga tgatttcaaa 2100
cagcatagcc tgcgcaaccc gatcgtggaa caggtgatca ccgaaaccct gcgcgcggtg 2160
aaagatatct ggaacttcta tggcaaaggc gcgaaagatt tcttcagcga aatacacatc 2220
gaactgggcc gcgaaatgaa aaataccgcg gatgaaagaa aacgcatcac caccatggtg 2280
accgataatg aaaataccaa cttacgcatt aaagcattgc tggcggaaat ggcgctggat 2340
cagaacgtgg ataacgtgcg cccgtatagc ccgatgcagc aggaaatcct gaaaatatat 2400
gaagaaggcg tattaaacgc ggaagaaaat atcgacgatg atatcctgaa aataagcaaa 2460
accgcgcaac caagcgcgac cgatctgaaa cgctataaac tgtggctgga acagaaatat 2520
cgcagcccgt ataccggcca gatgatcccg ctgaacaaac tgtttacccc ggaatatgaa 2580
atcgaacata tcatcccgca gagccgctat tttgatgata gcatgagcaa caaagtgatc 2640
tgcgaagcgg cggtgaacaa actgaaagat aaccagatcg gcctggtgtt tatcaaaaac 2700
catcatggcg aagtggtgga ttttggcatg ggcaaacagg tgaaaatcct ggaagtgagc 2760
gattatgaag attttgtgaa acagaactat aacaaaaacc gcggcaaacg caacaaatta 2820
ctgctggaag atatcccgga gaaaatgatc gaacgccagc tgaacgatac ccgctatatc 2880
agcaaatata tcacccaggt gctgagcaac atcgtgcgcg atgataaaga aggcagcaaa 2940
gatgatggcg tgaacagcaa aaacatcgtg ccgggcaacg gcaaaatcac cacccgcctg 3000
aaacaggatt ggggcctgaa cgatgtgtgg aacgatctgg tgctgccgcg ctttgaacgc 3060
atgaacaccc tgaccaacag caacgatttt accagcaaaa acacccatgg caaaaccatt 3120
ccgaccgtgc cgattgaact gagcaaaggc tttagcaaaa agcgcattga tcatcgccat 3180
catgcgatgg atgcgctggt gattgcgtgc gcgacccgcg atcatgtgaa cttactgaac 3240
aacgaaagca gcaaaagcga taccaaacgc tatgatctga accgcaaact gcgcaaatat 3300
gaaaaagtgg cgtataacga tccgaaaacc ggcgaacgca ttgaaaaaga agtgccgaaa 3360
gattttatta aaccgtggga aacctttacc gaagataccc gcaccctgct ggaaaacatt 3420
gtgattagct ttaaacagaa cctgcgcgtg attaacaaag cgaccaacta ttatgagaaa 3480
attgaaaacg gcaaaaaggt gaaagtggaa cagaaaggca ttaactgggc ggtgcgcaaa 3540
gcgctgcata aagaaaccgt gagcggccag gtgcatctgg atcgcattaa agtggcgaaa 3600
ggcaaaattc tgaccgcgac ccgcaaaacc ctggatgcgt cattcaacga gaaaaccatt 3660
gaaagcatta ccgataccgg cattcagaaa attctgctga actatctgaa aagcaaagat 3720
aacaacccgg aagtggcgtt tagcccggaa ggcattgaag aactgaacaa aaacattcgc 3780
ctgtataacg atggcaaagc gcatcagccg attctgaaag tgcgcgtgtt tgaacagggc 3840
agcaaattca ccctgggcga aaccggcaac aaaaccacca aatttgtgga agcggcgaaa 3900
ggcaccaacc tgttctttgg catctatgaa gataaaagcg gcaaacgcag ctatgaaacc 3960
attccgctga acattgtgat tgaacgccag aaacagggcc tgcaagcggt gccggaaacc 4020
aacgaaaaag gcaaacagct gctgtttacc ctgtcaccga acgatctggt gtatgtgccg 4080
gaagaaggcg tgtttgatga aaacaacatt aaagtggatc gcatctataa agtggtgagc 4140
tttagcacct atcagtgctt ctttgtgcgc aacgatgtga gcaccagcgt ggtgaacaaa 4200
gtggaatata gcgcgctgaa caaaatggaa aaatcgattg ataacattat gattaaagaa 4260
aactgcgtga aactgaacgt ggatcgcctg ggcaaaatta gcaaagcg 4308
<210> 195
<211> 4368
<212> DNA
<213> 稳杆菌属的种
<220>
<221> 来源
<223> /注="APG01688.1天然序列"
<400> 195
atgatgatta aaaatatact tggattagat ttggggacta actctattgg gtgggcattg 60
ataaaacaag attttgaaaa taagcatggc gaaattcttg gaatgggtag ccggattatt 120
ccgatgtcac aggatattct gggcgatttt gggaaaggaa attctatttc gcaaaccgct 180
gatcgtacca aatacagaag cgtgagaaga ttacgtgaac gatttttatt gaggagagaa 240
cgactacaca gagttttaca tcttttaaat tttcttccac agcattatgc ttcacaaatt 300
gattttgaaa aaaaattcgg gaagtttaaa tctgaaactg aacccaaatt ggcatgggaa 360
aattggggtg gaaagttttc attccttttc caaaactctt tcaatgaaat gcttgaagat 420
tttaaagcag ctggacaggg tttaaaaatt ccttacgact ggacaattta ttatctccgt 480
aaaaaagcac tttcacaaaa aattgaaaag gaggaactgg cctggattct tttaaacttt 540
aatcagaaac gaggatatta tcaattgcgt ggtgaggaag aagaagagaa tcctaataag 600
ctggttgaat tttattcttt aaaaattgta gatgttgtag cagatgaacc tcaaaaagga 660
aaatctgata tttggtattc tttgatttta gagaatggat gggtttacag acgagcaagc 720
aaaatacccc tatttgactg gaaagataaa acaagagatt ttattgtaac aactgatttg 780
aatgatgaca gaagtgttaa aacagacaaa gaaggaaatg aaaaaagaag tttcagagca 840
ccaagcgaaa acgattggac attggtaaaa aagaaaaccg aacaggaaat cgaccaatct 900
cacaaaaccg ttggaaccta tatctacgaa acacttcttc taaatccgaa acaaaaaatt 960
aaaggaaaat tggttcggac gattgaaaga aaattctata aagatgagct aaaacaaatt 1020
ttagaaaaac aaaaggaatt tcatcaggaa cttaaaaatg atgatttgta taatgattgc 1080
attcgtgagt tgtacagaaa caacgaagca catcagctga ctttgagcaa gaaagatttt 1140
gttcatcttt tgatggatga tcttattttc taccaaagac ctttgagaag ccagaaatca 1200
tctatttcca actgtacgtt agagtttaga aaatataaag atgaaaatgg aatagagcat 1260
acacaatatt taaaagccat tccaaaatcc aatccgtatt atcaggaatt tcgtctttgg 1320
caatggatgt ataatctgaa tatttacaga aaggacgatg aagcgaatgt taccaaagaa 1380
tttttaaata cgaacaaaga ttttgaaagt ctgtttgaat ttttaaataa tagaaaagaa 1440
attgagcaaa agccattgat taaatttctt ttggaacaaa aagatatcaa taaaaaattg 1500
cttaacgctg aagcagaaaa atatcgctgg aactatgtag aagacaagaa atatccttgc 1560
aatgaaacca aaacgatgat ttcttctcgt ttggataaag tcgaaaacat ttctgatgat 1620
ttcctgacaa gggacattga gcagaaaatt tggcacatca tctattccgt caatgataaa 1680
atagaatatg aaaaagcttt gaaatctttt gcaactagaa acgatttgga tgaaaactct 1740
tttatcgaag cgtttaagaa attctcgcct tttaaaagtg aatatggttc tttttcggaa 1800
aaagcaatta aaaagttact gcctttaatg cgattgggta aatattggta tgaagatgaa 1860
attgtaaagc atagtgatat ttatttcaaa aatattgaga atcttttggg tgatttttca 1920
aatagagaca aaaaaatttc tgaagaagac aaagagaaat ggaataaatc tataaatcta 1980
aagttacagg aagagttaaa agattttcaa acagctgaaa tagatttatt tcaaggatta 2040
cgattgcata ttgctcaata ccttgtttat ggaagacatt cagaagcttc aatgattgga 2100
aaatggaatt ccgccgaaga tttagaagaa tttttaaagg attttaaaca gcattcgctt 2160
cgcaacccga ttgtagaaca agtgattaca gaaactttgc gtgttgtaaa agatatttgg 2220
ttgaaatacg gaaatggagc aaaggatttc ttcaatgaaa ttcatattga gttaggaaga 2280
gaaatgaaac ttcccgcaga tgatcgaaaa aaactaacga accagatttc tgaaaacgaa 2340
aataccaatt tccgcatcaa agctctattg gctgaaatga tgaatgacag ttcggtagaa 2400
aatgtccgtc cgttttcgcc gatgcagcaa gaaattttaa aaatttatga agacgatgtt 2460
ttaaaatcag atatagaaat tgaagatgat attctgaaaa tcagcaaaac cgctcaacct 2520
tctccttccg atttgaaacg atataaactt tggttggaac agaaatacaa atcgccttac 2580
acggggcaaa ttattccttt gaataaattg tttacaccag aatacgaaat tgagcacatt 2640
attccgcaga gccgatattt tgatgacagt tttagcaata aagtaatttg tgagtctgcg 2700
gttaataaat tgaaagataa ctacatcgga cttgaattta ttaagcagtt cggaggaacg 2760
attattgaac ttggttttgg taaaagcata aaagtttttg aaacaaaaga atacgaagat 2820
ttcgtcaaaa aacattacgc caacaatcaa ggtaaaagaa acaaactttt gatggaagat 2880
attccagaga aaatgattga acgtcaaatg aacgatacac gatatatcag caaatatatt 2940
tcgggcgttt tgtctaatat tgttcgggta gaagatggtt cagatgaagg ggtaaattct 3000
aaaaatattg ttcccggaaa cggaaaaatc accacacagc tgaaacaaga ttggggattg 3060
aatgatgttt ggaatgattt gattttacca cgctttgaaa gaatgaacca actcaccaat 3120
tcaaaagttt ttactgcctg gaatgagaat tatcaaaagt ttttaccaac tgttcctatt 3180
gaatattcca aagggttttc aaagaaaaga atagaccacc gccatcacgc tttagatgct 3240
ttggtgattg cctgtgctac aaaagatcac gtgaatttat taaataatca atcggcaaaa 3300
tcggatacca aacgatacga tttgaaaaag aaatcgatga agtttgaaaa agtagtttac 3360
aatgatgcca aaacaggaga gaaaatcgaa agggaagtgc caaaacaatt tttaaaacct 3420
tgggaaaatt ttacgctaga tgttaaacat aatttggaaa ctattattgt aagttttaag 3480
caaaatcttc gtgttattaa taaagcgact aattattacg aaaagtatgt tgagaaagac 3540
ggtacaaaaa ataaggaaag agtagagcag accggaacaa actgggcgat taggaaacca 3600
atgcataaag acacggtttc cggtaaagta gatttacctt gggtaaaagt cccaaaaggg 3660
aaaattttaa cagcaacaag gaaaagcctt gatagttcgt ttgacttaaa gtcaataggc 3720
tctattacgg atacaggaat tcagaaaata ctcaaaaatt atttagcatt taaagacgga 3780
aatcctgaac tggctttttc accagaagga attgacgatt tgaataaaaa tattgaaaaa 3840
tacaatgatg gaaaaccgca tcaacccatc aataaagtaa gggtttttga attgggaagt 3900
aaatttcagg taggacaaag tggaaataaa aaagataaat atgtagaagc tgcaaaagga 3960
actaatctat tctttgctgt ttatgaagat gaaaaaggaa agagaaatta tgaaaccatt 4020
cctttgaatg aagtgattga aaggcaaaag caaggtttat ctgtggttga tttaaaaggt 4080
acaaatgatt tctacttatg tccgaatgat tttgtatata ttccatcagg cgacgaactt 4140
gaaaatataa ataatgttga ttttaaagac attaaaaaag agataaacga aagaatttac 4200
aaagtagtaa gttttacagg taatagactt tcctgtattc catatatggt tgcaacaacg 4260
attgttaata aattagagtt tacgcaactt aataaaattg aattcacaaa agaaaaagaa 4320
atttgtataa aactaaatgt cgatcgttta ggtaacattt caaaagcg 4368
<210> 196
<211> 4368
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="APG01688.1大肠杆菌优化的"
<400> 196
atgatgatta aaaatatcct aggcctggac ctgggaacca acagcatcgg ctgggcgctg 60
attaaacagg acttcgaaaa taagcatggc gagatactag gcatgggcag ccgaataatc 120
ccgatgagtc aggacatact aggcgacttc ggcaagggca acagcatcag ccagaccgcg 180
gaccgcacaa aatatcgcag cgtgcgtaga ctgcgcgaac gctttctgtt acgtcgtgaa 240
cgtctgcatc gtgttcttca cctattaaac ttcctgccgc agcattacgc tagccagatc 300
gacttcgaga agaagttcgg caagttcaag agcgagaccg aaccaaaact ggcgtgggaa 360
aactggggcg gcaaattcag cttcctattc caaaatagct tcaacgagat gctagaggac 420
ttcaaggcgg cgggtcaggg attaaaaata ccgtacgact ggaccatata ctacctgcgc 480
aagaaagcgc tgagccagaa gatcgagaag gaggagctgg cgtggatact actgaacttt 540
aatcaaaagc gcggatacta ccagctgcgc ggcgaggagg aggaggagaa cccgaataaa 600
ctggtggagt tctacagcct gaaaatagtg gacgtggtgg cggacgagcc gcagaaaggc 660
aaaagcgaca tctggtactc actcatacta gaaaacggct gggtgtatcg ccgcgcgagc 720
aaaataccgc tgttcgactg gaaagataaa acccgcgact tcatcgtgac caccgacctg 780
aacgacgacc gcagcgtgaa aaccgacaaa gaaggcaatg aaaaacgcag ctttcgcgcg 840
ccgagcgaaa acgattggac cctggtgaaa aagaaaaccg aacaggaaat cgatcagagc 900
cataaaaccg tgggcacata tatctatgaa accctgttat taaacccgaa gcagaagatt 960
aaaggcaaac tggtgcgcac catcgaacgc aaattctaca aagacgaatt aaaacagata 1020
ctagaaaaac agaaagaatt ccaccaggaa ttaaagaacg acgacttata taacgattgc 1080
atccgcgaac tgtaccgcaa taatgaagcg caccaattaa ccctgagcaa aaaggatttc 1140
gtgcacttat taatggatga tctgatcttc taccagcgcc cgctgcgcag ccagaaatca 1200
agcatcagca attgcaccct ggaattccgc aaatacaaag atgaaaacgg catcgaacac 1260
acccagtacc tgaaagcgat cccgaaatca aacccatact accaggaatt ccgcctgtgg 1320
cagtggatgt acaacctgaa catctaccgc aaagatgatg aagcgaacgt aaccaaagaa 1380
ttcctgaaca ccaataaaga tttcgaaagc ctgttcgaat tcctgaataa tcgcaaagaa 1440
atcgaacaga aaccattaat caaattcctg ctggaacaga aagatattaa taaaaagtta 1500
ttaaacgcgg aagcggaaaa atacagatgg aactacgtgg aagataaaaa gtacccgtgc 1560
aatgaaacca aaaccatgat cagcagccgc ctggataaag tggaaaatat cagcgatgat 1620
ttcctgaccc gcgatatcga acagaaaata tggcatataa tctacagcgt gaacgataaa 1680
atcgaatatg aaaaagcatt aaaatcgttc gcgacccgca acgatctgga tgaaaatagc 1740
ttcatcgaag cattcaaaaa gttcagcccg ttcaaaagcg aatacggcag cttcagcgaa 1800
aaagcgatta aaaagctgct gccattaatg cgcctgggaa aatactggta cgaagatgaa 1860
atcgtgaaac acagcgatat ctacttcaaa aacatcgaaa acctgctggg cgatttcagc 1920
aaccgcgata aaaagatcag cgaagaagat aaagaaaaat ggaacaaaag catcaacctg 1980
aaactgcagg aagaactgaa agatttccag accgcggaaa tcgatctgtt ccagggcctg 2040
cgcctgcata tcgcgcagta cctggtgtac ggccgccata gcgaagcgag catgatcggc 2100
aaatggaact cagcggaaga tctggaagaa ttcctgaaag atttcaaaca gcatagcctg 2160
cgcaacccga tcgtggaaca ggtgatcacc gaaaccctgc gcgtggtgaa agatatctgg 2220
ctgaaatatg gcaacggcgc gaaagatttc tttaacgaaa ttcatatcga actgggccgc 2280
gaaatgaaac tgccggcgga tgatcgcaaa aagctgacca accagatcag cgaaaacgaa 2340
aacaccaact ttcgcatcaa agcgctgctg gcggaaatga tgaacgatag cagcgtggaa 2400
aacgtgcgcc cgtttagccc gatgcagcag gaaatcctga aaatctatga agatgatgtg 2460
ctgaaaagcg atatcgaaat cgaagatgat atcttaaaaa tcagcaaaac cgcgcagccg 2520
agcccgagcg atctgaaacg ctataaactg tggctggaac agaaatataa aagcccgtat 2580
accggccaga tcatcccgct gaacaaactg tttaccccgg aatatgaaat cgaacatatc 2640
atcccgcaga gccgctattt tgatgatagc tttagcaaca aagtgatctg cgaaagcgcg 2700
gtgaacaaac tgaaagataa ctatatcggc ctggaattca tcaaacagtt tggcggcacc 2760
atcatcgaac tgggctttgg caaaagcatc aaagtgtttg aaaccaaaga atatgaagat 2820
tttgtgaaaa agcattatgc gaacaaccag ggcaaacgca acaaactgtt aatggaagat 2880
atcccggaga aaatgatcga acgccagatg aacgataccc gctatatcag caaatatatc 2940
agcggcgtgc tgagcaacat cgtgcgcgtg gaagatggca gcgatgaagg cgtgaacagc 3000
aaaaacatcg tgccgggcaa cggcaaaatc accacccagc tgaaacagga ttggggcctg 3060
aacgatgtgt ggaacgatct gatcctgccg cgctttgaac gcatgaacca gctgaccaac 3120
agcaaagtgt ttaccgcgtg gaacgaaaac tatcagaaat ttctgccgac cgtgccgatt 3180
gaatatagca aaggctttag caaaaagcgc attgatcatc gccatcatgc gctggatgcg 3240
ttagtgattg cgtgcgcgac caaagatcat gtgaacctgc tgaacaacca gagcgcgaaa 3300
agcgatacca aacgctatga tctgaaaaag aaaagcatga aatttgaaaa agtggtgtat 3360
aacgatgcga aaaccggcga gaaaattgaa cgcgaagtgc cgaaacagtt tctgaaaccg 3420
tgggaaaact ttaccctgga tgtgaaacat aacctggaaa ccattattgt gagctttaaa 3480
cagaacctgc gcgtgattaa caaagcgacc aactattatg aaaaatatgt ggaaaaagat 3540
ggcaccaaaa acaaagaacg cgtggaacag accggcacca actgggcgat tcgcaaaccg 3600
atgcataaag ataccgtgtc aggcaaagtg gatctgccgt gggtgaaagt gccgaaaggc 3660
aaaattctga ccgcgacccg caaaagcctg gatagcagct ttgatctgaa aagcattggc 3720
agcattaccg ataccggcat tcagaaaatt ctgaaaaact atctggcgtt taaagatggc 3780
aacccggaac tggcgtttag cccggaaggc attgatgatc tgaacaaaaa cattgaaaaa 3840
tataacgatg gcaaaccgca tcagccgatt aacaaagtgc gcgtgtttga actgggcagc 3900
aaatttcagg tgggccagag cggcaacaaa aaggacaaat atgtggaagc ggcgaaaggc 3960
accaacctgt tctttgcggt gtatgaagat gaaaaaggca aacgcaacta tgaaaccatc 4020
ccgttaaacg aagtgattga acgccagaaa cagggcctga gcgtggtgga tctgaaaggc 4080
accaacgatt tttatctgtg cccgaacgat tttgtgtata ttccgagcgg cgatgaactg 4140
gaaaacatta acaacgtgga ttttaaagat attaaaaagg aaattaacga acgcatctat 4200
aaagtggtga gctttaccgg caaccgcctg agctgcattc cgtatatggt ggcgaccacc 4260
attgtgaaca aactggaatt cacccagctg aacaaaattg aattcaccaa agaaaaagaa 4320
atttgcatta aactgaacgt ggatcgcctg ggcaacatta gcaaagcg 4368
<210> 197
<211> 25
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> 来源
<223> /注="共济失调-毛细血管扩张综合征的靶序列"
<400> 197
gaattattcc agaaagccaa agtag 25
<210> 198
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"
<400> 198
ggcttcatga aggtacagga 20
<210> 199
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="T细胞生理异常的靶序列"
<400> 199
ggtgtgctca ccagaatgga gtaca 25
<210> 200
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 200
gcagatcatt ggggtggatc ccgaa 25
<210> 201
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="3-氧-5α-类固醇δ4-脱氢酶缺乏症的靶序列"
<400> 201
ggctgcaagc ttttcaccac cayag 25
<210> 202
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="急性髓性白血病的靶序列"
<400> 202
gggcggcatg aaccggaggc ccatc 25
<210> 203
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="急性髓性白血病的靶序列"
<400> 203
gcatgggcgg catgaaccgg 20
<210> 204
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="皮肤恶性黑色素瘤3的靶序列"
<400> 204
gtggccactg tggggatcac 20
<210> 205
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="α1-抗胰蛋白酶缺乏症的靶序列"
<400> 205
gtgctgacca tcgacgagaa 20
<210> 206
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"
<400> 206
ggcgagctgc atgatctgcg 20
<210> 207
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 207
gcacatgacg gaggttgtga ggcgc 25
<210> 208
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 208
gaggttgtga ggcactgccc ccacc 25
<210> 209
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 209
gcagcatccg gctgcaggta 20
<210> 210
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 210
ggccaagggg atccgcacgc tgctc 25
<210> 211
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 211
gcctgatgac gcaggactgc 20
<210> 212
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="GRACILE综合征的靶序列"
<400> 212
ggtacgaagt ctcgacactg 20
<210> 213
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="增强的s-cone综合征的靶序列"
<400> 213
ggcattggcg gtggacccca 20
<210> 214
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"
<400> 214
gaagaacagg ttctggacgt caaag 25
<210> 215
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症,2型的靶序列"
<400> 215
gaacaggttc tggacgtcaa 20
<210> 216
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="芳基硫酸酯酶a,等位基因a的靶序列"
<400> 216
gacaggtcat agagcagcgg 20
<210> 217
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 217
gaacgtggtc gctctggaca 20
<210> 218
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 218
gaacgtggtc gctctggaca 20
<210> 219
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="阿林顿公园血红蛋白的靶序列"
<400> 219
ggtgcatctg actcctgagg agaag 25
<210> 220
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚性心肌病1的靶序列"
<400> 220
gaagtccgag gctcgccgca 20
<210> 221
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 221
gtcaaggtca tcggtgaggc 20
<210> 222
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 222
ggtcatcagt gaggccggcc ggggt 25
<210> 223
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 223
gtctcagcct tacgcacctt ccgag 25
<210> 224
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 224
gcaccttcca agtcctccgg gccct 25
<210> 225
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 225
gaagccagcc cctcagggca actgac 26
<210> 226
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="丁酰辅酶A脱氢酶缺乏症的靶序列"
<400> 226
ggcgactcat gggttctgaa 20
<210> 227
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="丁酰辅酶A脱氢酶缺乏症的靶序列"
<400> 227
gcgactcacg ggttctgaat ggaac 25
<210> 228
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"
<400> 228
ggaactgcgg gcccagcatg 20
<210> 229
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"
<400> 229
ggacgagtac caggagcttc 20
<210> 230
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="锥杆营养不良6的靶序列"
<400> 230
ggatctgatc cgggagcgca 20
<210> 231
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="锥杆营养不良6的靶序列"
<400> 231
gaatgcacta tgttctattc catcc 25
<210> 232
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Stargardt病1的靶序列"
<400> 232
gagctgctca caggacgaga acatc 25
<210> 233
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="莱伯先天性黑朦2的靶序列"
<400> 233
gtctatccag taagtatctc 20
<210> 234
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="锥杆营养不良3的靶序列"
<400> 234
ggtacgtcca tgccacaccc 20
<210> 235
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="非综合征性眼皮肤白化病的靶序列"
<400> 235
ggacctttac ggcgtaatcc 20
<210> 236
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="苯丙酮尿症的靶序列"
<400> 236
gtcatccttt ggtgaattac 20
<210> 237
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="苯丙酮尿症的靶序列"
<400> 237
gtattacgtg gcagagagtt ttaat 25
<210> 238
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 238
ggacgctctt gtattatctg 20
<210> 239
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="高苯丙氨酸血症,非pku的靶序列"
<400> 239
gcccttctca gttcgctacg accca 25
<210> 240
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="高苯丙氨酸血症,非pku的靶序列"
<400> 240
gctacgaccc atacacccaa 20
<210> 241
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 241
gcgctatgtt ctattccatc 20
<210> 242
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 242
ggggctggta ttcatgaaag gcaac 25
<210> 243
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 243
gcgctatgtt ctattccatc 20
<210> 244
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 244
gtgttctcag gttatcggta agttt 25
<210> 245
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 245
ggaaatgctg ttagtcggta tgtcg 25
<210> 246
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 246
ggaaatgctg ttagtcagta tgtcg 25
<210> 247
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="前节发育不全6的靶序列"
<400> 247
gtggccactg atcggaaacg 20
<210> 248
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 248
gaacctgatc ctggccgtgg tcgca 25
<210> 249
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Brugada综合征的靶序列"
<400> 249
gatcctggcc gtggtcgcaa 20
<210> 250
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="鸟氨酸氨基甲酰基转移酶缺乏症的靶序列"
<400> 250
gaagggccat gaccttctca ctcta 25
<210> 251
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="I型成骨不全的靶序列"
<400> 251
ggtgctcgag gattgcccgg aacag 25
<210> 252
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="I型成骨不全的靶序列"
<400> 252
gctcgaggat tgcccggaac agctg 25
<210> 253
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="便秘的靶序列"
<400> 253
gattccagtt aaatggatgg caatt 25
<210> 254
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="多巴胺β羟化酶缺乏症的靶序列"
<400> 254
ggacactgcc tattttgcgg tgagt 25
<210> 255
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="囊性纤维化的靶序列"
<400> 255
gacttcatcc aggtatgtaa aaata 25
<210> 256
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="苯丙酮尿症的靶序列"
<400> 256
gatgtaaacc tgacccacac tgaat 25
<210> 257
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="UDP葡萄糖-己糖-1-磷酸尿嘧啶转移酶缺乏症的靶序列"
<400> 257
gagcccctga cacccttacc 20
<210> 258
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="淀粉样变性心肌病,转甲状腺素蛋白相关的靶序列"
<400> 258
gtcaccaatc ccaaggaatg 20
<210> 259
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="I型糖缺乏糖蛋白综合征的靶序列"
<400> 259
ggctactcca tgacagcgcc tgagg 25
<210> 260
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="异染性脑白质营养不良的靶序列"
<400> 260
gcatcccgta ctcccacgac cagat 25
<210> 261
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Smith-Lemli-Opitz 综合征的靶序列"
<400> 261
gttcttcaat gggcgccccg ggatc 25
<210> 262
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="耳聋,常染色体隐性1A的靶序列"
<400> 262
gcaggtgagc ccgccggccc 20
<210> 263
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性脐膨出的靶序列"
<400> 263
gccagcgctc ctagtggcca tgcac 25
<210> 264
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性脐膨出的靶序列"
<400> 264
gcgctcctag tggccatgca cgtgg 25
<210> 265
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性脐膨出的靶序列"
<400> 265
gtccacgcca gcgctcctag 20
<210> 266
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性脐膨出的靶序列"
<400> 266
gctcctagtg gccatgcacg 20
<210> 267
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性肌强直,常染色体显性形式的靶序列"
<400> 267
gagaggattc tttgcagcca cgttc 25
<210> 268
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 268
ggtgacccga gagtgggtgt 20
<210> 269
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="乳腺癌和/或卵巢癌的靶序列"
<400> 269
gatgcctgga cagaggacaa 20
<210> 270
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 270
ggacaatggc ttccatggta 20
<210> 271
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 271
gggctagaaa tctgttgcta 20
<210> 272
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 272
ggtgacccga gagtgggtgt 20
<210> 273
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 273
gattctgcaa ctttcaattg 20
<210> 274
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 274
ggacaatggc ttccatggta 20
<210> 275
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 275
gaaagcccga cttatagcca gtaat 25
<210> 276
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 276
gattacatga acaaatgggc 20
<210> 277
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 277
gattacatga acaaatgggc 20
<210> 278
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 278
gactggaaaa ggaatacagt 20
<210> 279
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="乳腺癌和/或卵巢癌的靶序列"
<400> 279
gttggctgat ggtggatggc tcata 25
<210> 280
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 280
gttggctgat ggtggatggc tcata 25
<210> 281
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 281
ggtcagaaga ttattcttca 20
<210> 282
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 282
ggcttctagt ctcttttgtt 20
<210> 283
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 283
ggcttctagt ctcttttgtt 20
<210> 284
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Smith-Lemli-Opitz 综合征的靶序列"
<400> 284
gttgcgattt tgcagccatt 20
<210> 285
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Alport综合征1,X连锁隐性的靶序列"
<400> 285
ggcctatggg tccccctggt ttcgg 25
<210> 286
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="急性神经元病性Gaucher病的靶序列"
<400> 286
ggcatcaggt gagtgagtca 20
<210> 287
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="促性腺激素缺乏症的靶序列"
<400> 287
gtaactctcc agcataccat 20
<210> 288
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="1A型远侧关节挛缩的靶序列"
<400> 288
gaagctggag gaggccgaga 20
<210> 289
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="1A型远侧关节挛缩的靶序列"
<400> 289
gctggaggag gccgagaagg 20
<210> 290
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 290
gctgccacct tcagggcctc 20
<210> 291
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 291
gataaacttc ttgaagagga 20
<210> 292
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="成年早期死亡的靶序列"
<400> 292
gtgttctcca tgttcgaaca gaccc 25
<210> 293
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="成年早期死亡的靶序列"
<400> 293
gttcgaacag acccaaatcc 20
<210> 294
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="儿童期严重常染色体隐性肌肉营养不良-北非型的靶序列"
<400> 294
gaaatctgtg tgtgtccaga 20
<210> 295
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 295
ggtcatcatt gagagcgacc 20
<210> 296
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="I型糖缺乏糖蛋白综合征的靶序列"
<400> 296
gaatgctgaa gatgatcgac 20
<210> 297
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症I型的靶序列"
<400> 297
gaatgctgaa gatgatcgac 20
<210> 298
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 298
gctcagtaca ccaccgtcgg ccgca 25
<210> 299
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 299
gtacaccacc gtcggccgca 20
<210> 300
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性地中海热的靶序列"
<400> 300
ggacacgtga tggagggaag aacac 25
<210> 301
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="耳聋,常染色体隐性遗传2的靶序列"
<400> 301
ggacctttgt caatgggaca cggac 25
<210> 302
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="耳聋,常染色体隐性遗传2的靶序列"
<400> 302
ggacctttgt caatgggaca cagac 25
<210> 303
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="耳聋,X-连锁 2的靶序列"
<400> 303
gcgctcctag tggccatgca cgtgg 25
<210> 304
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="前庭水管扩大的靶序列"
<400> 304
gccaccactg ctctttcccg cacgg 25
<210> 305
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性感音神经性听力障碍的靶序列"
<400> 305
gtggtcatta acacaaactc 20
<210> 306
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="UDP葡萄糖-己糖-1-磷酸尿嘧啶转移酶缺乏症的靶序列"
<400> 306
gccagatatt gcccagcgtg 20
<210> 307
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"
<400> 307
gccactaatc gtacccagtt 20
<210> 308
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 308
gatattccac tggtggtcga 20
<210> 309
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="红细胞丙酮酸激酶缺乏症的靶序列"
<400> 309
ggaagactcc tgggcataag 20
<210> 310
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="常染色体显性进行性眼外肌麻痹伴线粒体DNA缺失1的靶序列"
<400> 310
gaagtcgttg atggatctgg ccaat 25
<210> 311
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"
<400> 311
gaagatcaca gcttttgtgg 20
<210> 312
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="胱氨酸病,眼非肾病的靶序列"
<400> 312
gtccatctcc ttctaccctc 20
<210> 313
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="红细胞丙酮酸激酶缺乏症的靶序列"
<400> 313
gctcagccca gcttctgtct 20
<210> 314
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="远端肌病,立山型的靶序列"
<400> 314
gattgacctg gtgaaccaag acccc 25
<210> 315
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="恶性高热,易感性,1型的靶序列"
<400> 315
ggccctgcgg atccgcgcca tcctc 25
<210> 316
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="恶性高热,易感性,1型的靶序列"
<400> 316
ggatccgcgc catcctccgc tccct 25
<210> 317
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="中枢肌病的靶序列"
<400> 317
ggtctgatca tcgacgcttt tggtg 25
<210> 318
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="中枢肌病的靶序列"
<400> 318
ggtctgatca tcgacgcttt 20
<210> 319
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="中枢肌病的靶序列"
<400> 319
gatcatcgac acttttggtg agctc 25
<210> 320
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="恶性高热,易感性,1型的靶序列"
<400> 320
ggcggaggca ttggggacga gatcg 25
<210> 321
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="神经元蜡样脂褐质沉积症2的靶序列"
<400> 321
gtgacagtgg ggccgggtgt 20
<210> 322
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="神经元蜡样脂褐质沉积症2的靶序列"
<400> 322
ggggccgggt attggtctgt ctctg 25
<210> 323
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="尼曼-匹克病C1型的靶序列"
<400> 323
ggatcgacga ttatttcgac tgggt 25
<210> 324
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="戊二酸尿症,1型的靶序列"
<400> 324
gagtatcacg tgatccggca cgcca 25
<210> 325
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="CAPN3相关病症的靶序列"
<400> 325
gccctgatgc agaagaaccg gcgga 25
<210> 326
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="CAPN3相关病症的靶序列"
<400> 326
gatgcagaag aaccggcgga 20
<210> 327
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="糖原贮积病,II型的靶序列"
<400> 327
gtcccagaac agctcccctc 20
<210> 328
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="非综合征性眼皮肤白化病的靶序列"
<400> 328
gtacagggat ctgccaacga tccta 25
<210> 329
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 329
gcgaagatgg ctcggatgag 20
<210> 330
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 330
gagtggccgc agcgctgtag 20
<210> 331
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="耳聋,常染色体隐性遗传7的靶序列"
<400> 331
ggtctcaagc tctctcttcg 20
<210> 332
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="慢性婴儿神经、皮肤和关节综合征的靶序列"
<400> 332
gacggcttcg atgagctgca 20
<210> 333
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Eichsfeld型先天性肌营养不良的靶序列"
<400> 333
gactctccgg gagactgtcc 20
<210> 334
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 334
gctcaaaagt ggatgagcgc 20
<210> 335
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="高钾性周期性麻痹1型的靶序列"
<400> 335
gcagctgcgg gtcttcaagc 20
<210> 336
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="包涵体肌病2的靶序列"
<400> 336
ggacgtggat gtggtggttt 20
<210> 337
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="ADA缺乏导致的严重APG05083.1、APG07433.1、
APG07513.1,APG08290.1免疫缺陷的靶序列"
<400> 337
gaagagcggc attcaccgta ctgtc 25
<210> 338
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="ADA缺乏导致的严重APG05083.1、APG07433.1、
APG07513.1,APG08290.1免疫缺陷的靶序列"
<400> 338
gcggtacagt ccgcacctgc tggcc 25
<210> 339
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 339
gtgtccgagc agcgccactg 20
<210> 340
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="囊性纤维化的靶序列"
<400> 340
ggacacttcg tgccttcgga 20
<210> 341
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="囊性纤维化的靶序列"
<400> 341
ggacacttcg tgccttcgga 20
<210> 342
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="小儿肾上腺皮质癌的靶序列"
<400> 342
gggcgtgagc acttcgagat gttcc 25
<210> 343
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="延胡索酸酶缺乏症的靶序列"
<400> 343
gattggacgt actcatactc 20
<210> 344
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="前列腺腺癌的靶序列"
<400> 344
gaacactgtc cattggcatg 20
<210> 345
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚性心肌病1的靶序列"
<400> 345
gcatcctcta cggggacttc 20
<210> 346
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="成人低磷酸酯酶症的靶序列"
<400> 346
gacaacgaga tgccccctga ggcct 25
<210> 347
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="成人低磷酸酯酶症的靶序列"
<400> 347
ggtactcaga caacaagatg ccccc 25
<210> 348
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="成人低磷酸酯酶症的靶序列"
<400> 348
gacaacaaga tgccccctga ggcct 25
<210> 349
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 349
gccttcttgg acaacgtcac cacca 25
<210> 350
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天遗传病的靶序列"
<400> 350
ggtttgccat ccgaggggta gtgct 25
<210> 351
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Crouzon综合征的靶序列"
<400> 351
gcaaatgcct ccacagtggt 20
<210> 352
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="丙酰辅酶A羧化酶缺乏症的靶序列"
<400> 352
gacatcatag gcacctccat 20
<210> 353
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 353
ggtggaaggg atcggctacg acttc 25
<210> 354
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="脂肪软骨营养不良的靶序列"
<400> 354
ggagcagctc tgggccgaag tgtcg 25
<210> 355
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="多种硫酸酯酶缺乏症的靶序列"
<400> 355
ggcgactcct ttgtctttga 20
<210> 356
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="双功能过氧化物酶体缺乏症的靶序列"
<400> 356
ggtggtactg gtcaccggcg 20
<210> 357
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="双功能过氧化物酶体缺乏症的靶序列"
<400> 357
gtactggtca ccagcgcggg ggcag 25
<210> 358
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 358
ggaaacttgt aagggcttcg 20
<210> 359
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 359
gtgcagacat tgacgaatgc cgcat 25
<210> 360
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 360
gacattgacg aatgccgcat atctc 25
<210> 361
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肢带型肌营养不良症,2L型的靶序列"
<400> 361
gcatagtagt aaactagacg 20
<210> 362
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 362
gcatcgatgt caacgagggc aaccg 25
<210> 363
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="痉挛性截瘫,隐性的靶序列"
<400> 363
gcactgctgc tcggcccccc 20
<210> 364
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="异戊酰辅酶A脱氢酶缺乏症的靶序列"
<400> 364
ggagcagtgg ggctcagtta 20
<210> 365
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 365
gaggagctgc ctcacaggtg 20
<210> 366
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="生物素酶缺乏症的靶序列"
<400> 366
gctccagcgc ctgagttgta 20
<210> 367
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="生物素酶缺乏症的靶序列"
<400> 367
gcctgagttg tatggccatc 20
<210> 368
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="莱伯先天性黑朦的靶序列"
<400> 368
gcataatttg tacagctcta agagt 25
<210> 369
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胰岛素血症的靶序列"
<400> 369
ggtggctgag cccagcccgg ccccc 25
<210> 370
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌的靶序列"
<400> 370
ggatgcttgg cagtgggaaa aactt 25
<210> 371
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="科恩综合征的靶序列"
<400> 371
ggaggtctac tacaggtctg 20
<210> 372
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 372
gctccctctg tactgtgcag gagtc 25
<210> 373
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="威尔逊病的靶序列"
<400> 373
ggcaatgaac acaaagagca 20
<210> 374
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="威尔逊病的靶序列"
<400> 374
gccctggatg ggctcagcgg ccatg 25
<210> 375
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="威尔逊病的靶序列"
<400> 375
gcagccctgg atgggctcag 20
<210> 376
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 376
gtggcccagc gaagatgcga 20
<210> 377
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 377
gaagatgcga aggtgatttc 20
<210> 378
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Floating-Harbor综合征的靶序列"
<400> 378
gctgaagctg gagtgggtcg 20
<210> 379
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性长QT综合征的靶序列"
<400> 379
gatgctacac gtcgaccgcc aggga 25
<210> 380
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性长QT综合征的靶序列"
<400> 380
gatgctacac gtcgaccgcc 20
<210> 381
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Andersen Tawil 综合征的靶序列"
<400> 381
gaggaagaga tcaaggtcct ttcca 25
<210> 382
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 382
gagctgataa ccaccctgta catcg 25
<210> 383
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 383
ggaaaactgc ggtatgggcg 20
<210> 384
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型"
<400> 384
gtatttgaag gtctcctccg gggtc 25
<210> 385
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="胃肠道间质瘤的靶序列"
<400> 385
gagggctaaa gtgggctcgg 20
<210> 386
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性角化不良的靶序列"
<400> 386
gctgccaagc ctgctggcaa 20
<210> 387
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="先天性角化不良的靶序列"
<400> 387
gccctgcctg tgacttccag cactg 25
<210> 388
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="糖原贮积病IIIa的靶序列"
<400> 388
gatgagtaga acagaaaaat acaag 25
<210> 389
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="扩张型心肌病1DD的靶序列"
<400> 389
gtctcgtagt ccggtgagcc ggtca 25
<210> 390
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肾肉碱转运缺陷的靶序列"
<400> 390
gtggccatgg aatagcgccg 20
<210> 391
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Baraitser-Winter 综合征1的靶序列"
<400> 391
gatcctcacc gagcgcggct acagc 25
<210> 392
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="超长链酰基辅酶A脱氢酶缺乏症的靶序列"
<400> 392
gggcatgcat gaccttggcg tgggc 25
<210> 393
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 393
gtcagatttg tccttgcagt 20
<210> 394
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肢带型肌营养不良症,2A型的靶序列"
<400> 394
gtacggggtt gctctgccgg 20
<210> 395
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 395
gacagtagcc cctgctcggc cttcg 25
<210> 396
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="主动脉瘤,家族性胸廓6的靶序列"
<400> 396
gccccatgcc atcatgcgtc 20
<210> 397
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肢端发育不良的靶序列"
<400> 397
gctttgtcat cgacatttat accgg 25
<210> 398
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症2C型的靶序列"
<400> 398
ggcggacatg cggcaccagg actcg 25
<210> 399
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 399
gtgtaactgt atacgtatgg cgttt 25
<210> 400
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌1型的靶序列"
<400> 400
gatgcctgga cagaggacaa 20
<210> 401
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症2C型 的靶序列C"
<400> 401
gcctaactga tgaggagttt cgagg 25
<210> 402
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="进行性神经性腓骨肌萎缩症2C型 的靶序列"
<400> 402
gcctaactga tgaggagttt caagg 25
<210> 403
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 403
gagcgctgct cagatagcga 20
<210> 404
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="婴幼儿早期癫痫性脑病的靶序列"
<400> 404
gatgatccgc atggaccggc gggga 25
<210> 405
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="婴幼儿早期癫痫性脑病的靶序列"
<400> 405
ggatgatccg catggaccgg 20
<210> 406
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="婴幼儿早期癫痫性脑病的靶序列"
<400> 406
gcggatgatc cgcatggacc agcgg 25
<210> 407
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肢端发育不良的靶序列"
<400> 407
gtacgtgatc catcctaggt 20
<210> 408
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肥厚型心肌病的靶序列"
<400> 408
gacaccacgg tctccctcaa gtggc 25
<210> 409
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 409
gctgtccggg gtagccccaa gatag 25
<210> 410
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 410
gtccacggtg agggggccct ggtgt 25
<210> 411
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="心血管表型的靶序列"
<400> 411
gcctagactg caggacacag ggact 25
<210> 412
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚性心肌病1的靶序列"
<400> 412
gcatctgcag acatagagac ctgtg 25
<210> 413
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="良性肩腓肌营养不良伴心肌病的靶序列"
<400> 413
gccctccaag agcttgcggt 20
<210> 414
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="糖原贮积病,II型的靶序列"
<400> 414
ggccctcacc ctgcgctacg cactc 25
<210> 415
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="弥漫性肾小球膜硬化症的靶序列"
<400> 415
gtttaggcac ttgttttacc tgtat 25
<210> 416
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="缺损性小眼球的靶序列"
<400> 416
gggtcgaggc ggacgccata 20
<210> 417
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="共济失调毛细血管扩张综合征的靶序列"
<400> 417
gtaaatacat atttactact 20
<210> 418
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌的靶序列"
<400> 418
ggctacagca cacagctcgt 20
<210> 419
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肢带型肌营养不良症,2A型的靶序列"
<400> 419
gctacgagat gcaaaatgca gtcaa 25
<210> 420
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 420
gccgcttacc aaaaggagta 20
<210> 421
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="不对称隔膜肥大的靶序列"
<400> 421
gtgctgcagg ttgttggtgc atggc 25
<210> 422
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 422
gtaattctat aactccttag 20
<210> 423
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚型心肌病2的靶序列"
<400> 423
gctaaagtca ccgggcgctg gaaat 25
<210> 424
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚型心肌病2的靶序列"
<400> 424
ggctaaagtc accgggcgct agaaa 25
<210> 425
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性肥厚型心肌病2的靶序列"
<400> 425
gctaaagtca ccgggcgcta gaaat 25
<210> 426
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性红细胞增多症2的靶序列"
<400> 426
gaaagagcaa tgcctccagg ttgtc 25
<210> 427
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="婴儿期死亡的靶序列"
<400> 427
gtattggaat ccggagcatc cacgt 25
<210> 428
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="肌肉疾病的靶序列"
<400> 428
gcatcttccg gatctttgag 20
<210> 429
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 429
gctgcgagca tggggccctg aggct 25
<210> 430
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌的靶序列"
<400> 430
ggcagcgtta cccagtccga 20
<210> 431
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性癌症易感综合征的靶序列"
<400> 431
gtgtaggcaa cttctatagc cacag 25
<210> 432
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 432
ggaactcccg ccaagatcaa gaaag 25
<210> 433
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 433
gcggctgcca gtatctgtgc ctccc 25
<210> 434
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列的靶序列"
<400> 434
gaatgatctg caggtgagcg tcgcc 25
<210> 435
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="包涵体肌病2的靶序列"
<400> 435
gtgctgtagt gcaccaatgt aatct 25
<210> 436
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="共济失调毛细血管扩张综合征的靶序列"
<400> 436
gctttgatgt taacaatcgc 20
<210> 437
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="良性家族性新生儿-小儿惊厥的靶序列"
<400> 437
gtcagttctc cgatcattcc agctg 25
<210> 438
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Marfan综合征/Loeys-Dietz综合征/家族性胸主动脉瘤和夹层的靶序列"
<400> 438
gtatctccat tgtctcctcg 20
<210> 439
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="扩张型心肌病1G的靶序列"
<400> 439
gtttcagatt cccctggccc acgtg 25
<210> 440
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 440
gcggtgagtc tcggtgcagg 20
<210> 441
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌-卵巢癌2型的靶序列"
<400> 441
gatacagtat taattgactg 20
<210> 442
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 442
gcgagtgcat ccactccagc 20
<210> 443
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 443
ggctacaagt gccagtgtga ggaag 25
<210> 444
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 444
gggtggctac aagtgccagc gtgag 25
<210> 445
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性高胆固醇血症的靶序列"
<400> 445
gtacaccagc ctcaccccca acctg 25
<210> 446
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="家族性乳腺癌的靶序列"
<400> 446
gcctgcccga tagacgagcc tcccg 25
<210> 447
<211> 20
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="遗传性出血性毛细血管扩张2型的靶序列"
<400> 447
gatccgcagc gcggtgagtc 20
<210> 448
<211> 3
<212> DNA
<213> 化脓性链球菌(Streptococcus pyogenes)
<220>
<221> 来源
<223> /注="SpyCas9 PAM"
<220>
<221> 修饰的_碱基
<222> (1)..(1)
<223> a, c, t, g, 未知或其他
<400> 448
ngg 3
<210> 449
<211> 5
<212> DNA
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> 来源
<223> /注="SauCas9"
<220>
<221> 修饰的_碱基
<222> (1)..(1)
<223> a, c, t, g, 未知或其他
<400> 449
ngrrt 5
<210> 450
<211> 415
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<220>
<221> 来源
<223> /注="ADAT"
<400> 450
Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1 5 10 15
Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala
20 25 30
Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly
35 40 45
Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
50 55 60
Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
65 70 75 80
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
85 90 95
Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
100 105 110
His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr
115 120 125
Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn
130 135 140
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
145 150 155 160
Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln
165 170 175
Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser
180 185 190
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
195 200 205
Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu
210 215 220
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
225 230 235 240
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
245 250 255
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
260 265 270
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
275 280 285
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
290 295 300
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
305 310 315 320
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
325 330 335
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
340 345 350
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
355 360 365
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly
370 375 380
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
385 390 395 400
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser
405 410 415
<210> 451
<211> 1494
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<220>
<221> 来源
<223> /注="Nuc-ADAT-接头-dAPG08290.1-接头-SV40"
<400> 451
Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1 5 10 15
Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala
20 25 30
Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly
35 40 45
Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
50 55 60
Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
65 70 75 80
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
85 90 95
Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
100 105 110
His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr
115 120 125
Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn
130 135 140
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
145 150 155 160
Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln
165 170 175
Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser
180 185 190
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
195 200 205
Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu
210 215 220
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
225 230 235 240
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
245 250 255
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
260 265 270
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
275 280 285
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
290 295 300
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
305 310 315 320
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
325 330 335
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
340 345 350
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
355 360 365
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly
370 375 380
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
385 390 395 400
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Met
405 410 415
Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser Ile
420 425 430
Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg Tyr
435 440 445
Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys Ala
450 455 460
Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile Ala
465 470 475 480
Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys Glu
485 490 495
Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu Leu
500 505 510
Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp Ile
515 520 525
Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala Arg
530 535 540
Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg Lys
545 550 555 560
Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile Gln
565 570 575
Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met Trp
580 585 590
Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser Pro
595 600 605
Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu Ile
610 615 620
Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala Ser
625 630 635 640
Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu Pro
645 650 655
Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser Leu
660 665 670
Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe Gln
675 680 685
Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro Asp
690 695 700
Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys Met
705 710 715 720
Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val Ser
725 730 735
Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln Phe
740 745 750
Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu Lys
755 760 765
Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val Val
770 775 780
Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp Tyr
785 790 795 800
Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp Ile
805 810 815
Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr Asp
820 825 830
Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe Gly
835 840 845
His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln Glu
850 855 860
Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr Thr
865 870 875 880
Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro Asp
885 890 895
Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg Lys
900 905 910
Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val His
915 920 925
Ile Ala Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys Lys
930 935 940
Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala Ile
945 950 955 960
Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp Ile
965 970 975
Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr Ser
980 985 990
Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys Glu
995 1000 1005
Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
1010 1015 1020
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr
1025 1030 1035
Ser Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr
1040 1045 1050
Phe Leu Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val
1055 1060 1065
Arg Ser Asn Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu
1070 1075 1080
Lys Lys Thr Tyr Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg
1085 1090 1095
His Leu Asn Asp Thr Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe
1100 1105 1110
Ile Glu Gln Asn Leu Gln Phe Lys Glu Val Glu Val Asn Leu Arg
1115 1120 1125
Lys Lys Arg Val Gln Thr Val Asn Gly Val Ile Thr Ala His Leu
1130 1135 1140
Arg Lys Arg Trp Gly Leu Glu Lys Asn Arg Gln Glu Thr Tyr Leu
1145 1150 1155
His His Ala Met Asp Ala Ile Ile Val Ala Cys Thr Asp His His
1160 1165 1170
Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln Ile Lys Glu Ser Asn
1175 1180 1185
Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro Trp Glu Gly Phe
1190 1195 1200
Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro Ile Ala Lys
1205 1210 1215
Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser Asp Tyr
1220 1225 1230
Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala
1235 1240 1245
His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly
1250 1255 1260
Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe
1265 1270 1275
Asp Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu
1280 1285 1290
Ala Thr Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys
1295 1300 1305
Asn Ser Lys Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys
1310 1315 1320
Lys Gly Thr Gly Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln
1325 1330 1335
Thr Lys Ala Phe Val Arg Glu Val Asn Gly Gly Val Ala Gln Asn
1340 1345 1350
Ser Asp Leu Val Arg Val Asp Leu Phe Glu Lys Asp Asp Lys Tyr
1355 1360 1365
Tyr Met Val Pro Ile Tyr Val Pro Asp Thr Val Cys Ser Glu Leu
1370 1375 1380
Pro Lys Lys Val Val Lys Ser Gly Lys Gly Tyr Glu Gln Trp Leu
1385 1390 1395
Thr Leu Asp Asn Ser Phe Thr Phe Lys Ser Ser Leu Tyr Pro Tyr
1400 1405 1410
Asp Leu Val Arg Leu Val Lys Gly Asn Glu Asp Arg Phe Leu Tyr
1415 1420 1425
Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg Leu Asn Phe Lys Asp
1430 1435 1440
Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr Arg Tyr Ser Leu Lys
1445 1450 1455
Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val Gly Val Leu Gly Asp
1460 1465 1470
Leu Arg Leu Val Lys Gln Glu Thr Arg Arg Ile Phe Asn Arg Pro
1475 1480 1485
Lys Lys Lys Arg Lys Val
1490
<210> 452
<211> 1494
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<220>
<221> 来源
<223> /注="Nuc-ADAT-接头-nAPG08290.1-接头-SV40"
<400> 452
Met Ala Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1 5 10 15
Lys Lys Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala
20 25 30
Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly
35 40 45
Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg
50 55 60
Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu
65 70 75 80
Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr
85 90 95
Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile
100 105 110
His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr
115 120 125
Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn
130 135 140
His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala
145 150 155 160
Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln
165 170 175
Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser
180 185 190
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
195 200 205
Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu
210 215 220
Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu
225 230 235 240
Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile
245 250 255
Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His
260 265 270
Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr
275 280 285
Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met
290 295 300
Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly
305 310 315 320
Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu
325 330 335
His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu
340 345 350
Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg
355 360 365
Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly
370 375 380
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
385 390 395 400
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Met
405 410 415
Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser Ile
420 425 430
Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg Tyr
435 440 445
Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys Ala
450 455 460
Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile Ala
465 470 475 480
Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys Glu
485 490 495
Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu Leu
500 505 510
Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp Ile
515 520 525
Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala Arg
530 535 540
Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg Lys
545 550 555 560
Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile Gln
565 570 575
Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met Trp
580 585 590
Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser Pro
595 600 605
Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu Ile
610 615 620
Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala Ser
625 630 635 640
Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu Pro
645 650 655
Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser Leu
660 665 670
Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe Gln
675 680 685
Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro Asp
690 695 700
Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys Met
705 710 715 720
Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val Ser
725 730 735
Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln Phe
740 745 750
Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu Lys
755 760 765
Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val Val
770 775 780
Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp Tyr
785 790 795 800
Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp Ile
805 810 815
Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr Asp
820 825 830
Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe Gly
835 840 845
His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln Glu
850 855 860
Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr Thr
865 870 875 880
Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro Asp
885 890 895
Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg Lys
900 905 910
Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val His
915 920 925
Ile Glu Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys Lys
930 935 940
Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala Ile
945 950 955 960
Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp Ile
965 970 975
Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr Ser
980 985 990
Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys Glu
995 1000 1005
Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
1010 1015 1020
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr
1025 1030 1035
Ser Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr
1040 1045 1050
Phe Leu Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val
1055 1060 1065
Arg Ser Asn Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu
1070 1075 1080
Lys Lys Thr Tyr Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg
1085 1090 1095
His Leu Asn Asp Thr Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe
1100 1105 1110
Ile Glu Gln Asn Leu Gln Phe Lys Glu Val Glu Val Asn Leu Arg
1115 1120 1125
Lys Lys Arg Val Gln Thr Val Asn Gly Val Ile Thr Ala His Leu
1130 1135 1140
Arg Lys Arg Trp Gly Leu Glu Lys Asn Arg Gln Glu Thr Tyr Leu
1145 1150 1155
His His Ala Met Asp Ala Ile Ile Val Ala Cys Thr Asp His His
1160 1165 1170
Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln Ile Lys Glu Ser Asn
1175 1180 1185
Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro Trp Glu Gly Phe
1190 1195 1200
Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro Ile Ala Lys
1205 1210 1215
Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser Asp Tyr
1220 1225 1230
Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala
1235 1240 1245
His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly
1250 1255 1260
Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe
1265 1270 1275
Asp Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu
1280 1285 1290
Ala Thr Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys
1295 1300 1305
Asn Ser Lys Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys
1310 1315 1320
Lys Gly Thr Gly Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln
1325 1330 1335
Thr Lys Ala Phe Val Arg Glu Val Asn Gly Gly Val Ala Gln Asn
1340 1345 1350
Ser Asp Leu Val Arg Val Asp Leu Phe Glu Lys Asp Asp Lys Tyr
1355 1360 1365
Tyr Met Val Pro Ile Tyr Val Pro Asp Thr Val Cys Ser Glu Leu
1370 1375 1380
Pro Lys Lys Val Val Lys Ser Gly Lys Gly Tyr Glu Gln Trp Leu
1385 1390 1395
Thr Leu Asp Asn Ser Phe Thr Phe Lys Ser Ser Leu Tyr Pro Tyr
1400 1405 1410
Asp Leu Val Arg Leu Val Lys Gly Asn Glu Asp Arg Phe Leu Tyr
1415 1420 1425
Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg Leu Asn Phe Lys Asp
1430 1435 1440
Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr Arg Tyr Ser Leu Lys
1445 1450 1455
Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val Gly Val Leu Gly Asp
1460 1465 1470
Leu Arg Leu Val Lys Gln Glu Thr Arg Arg Ile Phe Asn Arg Pro
1475 1480 1485
Lys Lys Lys Arg Lys Val
1490
<210> 453
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Hurler靶标1"
<400> 453
ggagcagctc taggccgaag tgtcg 25
<210> 454
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Hurler靶标2"
<400> 454
taggccgaag tgtcgcaggc cggga 25
<210> 455
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="Hurler靶标3"
<400> 455
gctctaggcc gaagtgtcgc aggcc 25
<210> 456
<211> 135
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA Hurler靶标1"
<400> 456
ggagcagctc taggccgaag tgtcggtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 457
<211> 135
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA Hurler靶标2"
<400> 457
taggccgaag tgtcgcaggc cgggagtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 458
<211> 135
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="sgRNA Hurler靶标3"
<400> 458
ggcctgcgac acttcggcct agagcgtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 459
<211> 15
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler正向扩增引物"
<400> 459
gactccttca ccaag 15
<210> 460
<211> 14
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler反向扩增引物"
<400> 460
gtagatcagc accg 14
<210> 461
<211> 14
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler野生型探针"
<400> 461
ctctgggccg aagt 14
<210> 462
<211> 14
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler W402X探针-β"
<400> 462
ctctaggccg aagt 14
<210> 463
<211> 13
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler NGS正向"
<400> 463
acttcctcca gcc 13
<210> 464
<211> 13
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="Hurler NGS反向"
<400> 464
gaaccccggc tta 13
<210> 465
<211> 31
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="人W402X"
<400> 465
ggagcagctc taggccgaag tgtcgcaggc c 31
<210> 466
<211> 31
<212> DNA
<213> 小鼠(Mus musculus)
<220>
<221> 来源
<223> /注="小鼠W392X"
<400> 466
agaacaactc taggcagagg tctcaaaggc t 31
<210> 467
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="人源化小鼠"
<400> 467
ggagcagctc taggccgaag tgtcgcaggc c 31
<210> 468
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="FRDA靶标1"
<400> 468
atcacctgag gtccggagtt caaga 25
<210> 469
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="FRDA靶标2"
<400> 469
gtcttgaact ccggacctca ggtga 25
<210> 470
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="FRDA靶标3"
<400> 470
tgaactccgg acctcaggtg atcca 25
<210> 471
<211> 25
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="FRDA靶标4"
<400> 471
gaaaagttag ccgggcgtgg tgtcg 25
<210> 472
<211> 500
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<220>
<221> 来源
<223> /注="BCL11A增强子区域"
<400> 472
aaaaatggac aattatgagg aggggagagt gcagacaggg gaagcttcac ctcctttaca 60
attttgggag tccacacggc atggcataca aattatttca ttcccattga gaaataaaat 120
ccaattctcc atcaccaaga gagccttccg aaagaggccc ccctgggcaa acggccaccg 180
atggagaggt ctgccagtcc tcttctaccc cacccacgcc cccaccctaa tcagaggcca 240
aacccttcct ggagcctgtg ataaaagcaa ctgttagctt gcactagact agcttcaaag 300
ttgtattgac cctggtgtgt tatgtctaag agtagatgcc atatctcttt tctggcctat 360
gttattacct gtatggactt tgcactggaa tcagctatct gctcttactt atgcacacct 420
ggggcataga gccagccctg tatcgctttt cagccatctc actacagata actcccaagt 480
cctgtctagc tgccttcctt 500
<210> 473
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列1"
<400> 473
gcactagact agcttcaaag ttgtag 26
<210> 474
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列2"
<400> 474
cctaatcaga ggccaaaccc ttcctg 26
<210> 475
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列3"
<400> 475
caagctaaca gttgctttta tcacag 26
<210> 476
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列4"
<400> 476
gcactagact agcttcaaag ttgtag 26
<210> 477
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列5"
<400> 477
cctaatcaga ggccaaaccc ttcctg 26
<210> 478
<211> 26
<212> DNA
<213> 智人
<220>
<221> 来源
<223> /注="SCD靶标序列6"
<400> 478
caagctaaca gttgctttta tcacag 26
<210> 479
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="RelA FWD"
<400> 479
cttagtttca ccgcaggttc ta 22
<210> 480
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="RelA REV"
<400> 480
ctgtgcactc aacactgatc ta 22
<210> 481
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="AurkB FWD"
<400> 481
cccagcccta ggttgtttat t 21
<210> 482
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="AurkB REV"
<400> 482
ctggctacat cttccttgac tac 23
<210> 483
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="HPRT1 FWD"
<400> 483
gtggcagaag cagtgagtaa 20
<210> 484
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="HPRT1 REV"
<400> 484
tcccatctag gcactaggta aa 22
<210> 485
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 134, 指导物 135, 指导物 136, 指导物 137"
<400> 485
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 486
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 134, 指导物 135, 指导物 136, 指导物 137"
<400> 486
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 487
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 138, 指导物 139, 指导物 140, 指导物 141"
<400> 487
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 488
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 138, 指导物 139, 指导物 140, 指导物 141"
<400> 488
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 489
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 142, 指导物 143, 指导物 144, 指导物 145"
<400> 489
tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53
<210> 490
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 142, 指导物 143, 指导物 144, 指导物 145"
<400> 490
gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54
<210> 491
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 164, 指导物 165, 指导物 166, 指导物 167"
<400> 491
tcgtcggcag cgtcagatgt gtataagaga cagctgacct caggtgatac gcc 53
<210> 492
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 164, 指导物 165, 指导物 166, 指导物 167"
<400> 492
gtctcgtggg ctcggagatg tgtataagag acagctttgg gaggctgaga cagg 54
<210> 493
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 168, 指导物 169, 指导物 170, 指导物 171"
<400> 493
tcgtcggcag cgtcagatgt gtataagaga cagtgctcta ttgtccaggc tgg 53
<210> 494
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 168, 指导物 169, 指导物 170, 指导物 171"
<400> 494
gtctcgtggg ctcggagatg tgtataagag acagtccagc aggtcagcaa agaa 54
<210> 495
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 172, 指导物 173, 指导物 174, 指导物 175"
<400> 495
tcgtcggcag cgtcagatgt gtataagaga caggcagtat aactggccag cct 53
<210> 496
<211> 56
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 172, 指导物 173, 指导物 174, 指导物 175"
<400> 496
gtctcgtggg ctcggagatg tgtataagag acagtcagtt gaggagttca gcttaa 56
<210> 497
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 185, 指导物 186, 指导物 187, 指导物 188"
<400> 497
tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53
<210> 498
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 185, 指导物 186, 指导物 187, 指导物 188"
<400> 498
gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54
<210> 499
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 189, 指导物 190, 指导物 191, 指导物 192"
<400> 499
tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53
<210> 500
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 189, 指导物 190, 指导物 191, 指导物 192"
<400> 500
gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54
<210> 501
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 193, 指导物 194, 指导物 195, 指导物 196"
<400> 501
tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53
<210> 502
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 193, 指导物 194, 指导物 195, 指导物 196"
<400> 502
gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54
<210> 503
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 146"
<400> 503
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 504
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 146"
<400> 504
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 505
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 147"
<400> 505
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 506
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 147"
<400> 506
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 507
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 148"
<400> 507
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 508
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 148"
<400> 508
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 509
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 176"
<400> 509
tcgtcggcag cgtcagatgt gtataagaga caggtagctc actgcagcct caa 53
<210> 510
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 176"
<400> 510
gtctcgtggg ctcggagatg tgtataagag acagtgggtg atgaacatac gggt 54
<210> 511
<211> 57
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 177"
<400> 511
tcgtcggcag cgtcagatgt gtataagaga cagtcagact gaagagctat tgtgtga 57
<210> 512
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 177"
<400> 512
gtctcgtggg ctcggagatg tgtataagag acagccccac aaaccgatgt agct 54
<210> 513
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 209"
<400> 513
tcgtcggcag cgtcagatgt gtataagaga cagtggagtg cagtggtgtg atc 53
<210> 514
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 209"
<400> 514
gtctcgtggg ctcggagatg tgtataagag acagttgagg ctgcagtgag ctac 54
<210> 515
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 197"
<400> 515
tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53
<210> 516
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 197"
<400> 516
gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54
<210> 517
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 198"
<400> 517
tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53
<210> 518
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 198"
<400> 518
gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54
<210> 519
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 199"
<400> 519
tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53
<210> 520
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 199"
<400> 520
gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54
<210> 521
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 149"
<400> 521
gtctcgtggg ctcggagatg tgtataagag acagggtaag gggaaactgg aggc 54
<210> 522
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 149"
<400> 522
tcgtcggcag cgtcagatgt gtataagaga cagtccactt tctaagcagg cgg 53
<210> 523
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 150"
<400> 523
gtctcgtggg ctcggagatg tgtataagag acaggtgggc ctggatttcg atct 54
<210> 524
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 150"
<400> 524
tcgtcggcag cgtcagatgt gtataagaga cagatgaaca ggcaggaagt cgg 53
<210> 525
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 151"
<400> 525
tcgtcggcag cgtcagatgt gtataagaga cagcggttct gagttgcctt cct 53
<210> 526
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 151"
<400> 526
gtctcgtggg ctcggagatg tgtataagag acagggtaag gggaaactgg aggc 54
<210> 527
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 179"
<400> 527
tcgtcggcag cgtcagatgt gtataagaga cagtcagtgg tccacatgca agt 53
<210> 528
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 179"
<400> 528
gtctcgtggg ctcggagatg tgtataagag acagaaggca agttgatcgc tcga 54
<210> 529
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 180"
<400> 529
tcgtcggcag cgtcagatgt gtataagaga cagagtggtt ctgttgcaca cgt 53
<210> 530
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 180"
<400> 530
gtctcgtggg ctcggagatg tgtataagag acagtcgctt aagcccagga gttc 54
<210> 531
<211> 55
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 181"
<400> 531
tcgtcggcag cgtcagatgt gtataagaga cagtctggct gatccgtact aatcc 55
<210> 532
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 181"
<400> 532
gtctcgtggg ctcggagatg tgtataagag acagtaggct caagggatgc tcct 54
<210> 533
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 200"
<400> 533
tcgtcggcag cgtcagatgt gtataagaga cagccagagc tgtccttgag gtg 53
<210> 534
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 200"
<400> 534
gtctcgtggg ctcggagatg tgtataagag acaggtccat acccaccttg gcaa 54
<210> 535
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 201"
<400> 535
tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53
<210> 536
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 201"
<400> 536
gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54
<210> 537
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 202"
<400> 537
tcgtcggcag cgtcagatgt gtataagaga cagaggctat cagtcagcgc atc 53
<210> 538
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 202"
<400> 538
gtctcgtggg ctcggagatg tgtataagag acagagcagg ggaagtgggg atat 54
<210> 539
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 152"
<400> 539
gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54
<210> 540
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 152"
<400> 540
tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53
<210> 541
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 153"
<400> 541
gtctcgtggg ctcggagatg tgtataagag acagacaatt ctcctgcctc agcc 54
<210> 542
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 153"
<400> 542
tcgtcggcag cgtcagatgt gtataagaga cagactgcca tgggaagaag gtg 53
<210> 543
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 154"
<400> 543
gtctcgtggg ctcggagatg tgtataagag acagattaca ggtgtgagcc acgg 54
<210> 544
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 154"
<400> 544
tcgtcggcag cgtcagatgt gtataagaga caggagctgc acatttgacg agc 53
<210> 545
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 182"
<400> 545
gtctcgtggg ctcggagatg tgtataagag acagtgggtg atgaacatac gggt 54
<210> 546
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 182"
<400> 546
tcgtcggcag cgtcagatgt gtataagaga caggtagctc actgcagcct caa 53
<210> 547
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 183"
<400> 547
gtctcgtggg ctcggagatg tgtataagag acagtgcctg tagtcccagc tact 54
<210> 548
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 183"
<400> 548
tcgtcggcag cgtcagatgt gtataagaga cagtcagctc agtgcaacct ctg 53
<210> 549
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 184"
<400> 549
gtctcgtggg ctcggagatg tgtataagag acagctttgg gaggctgaga cagg 54
<210> 550
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 184"
<400> 550
tcgtcggcag cgtcagatgt gtataagaga cagctgacct caggtgatac gcc 53
<210> 551
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 203"
<400> 551
gtctcgtggg ctcggagatg tgtataagag acaggatgcg ctgactgata gcct 54
<210> 552
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 203"
<400> 552
tcgtcggcag cgtcagatgt gtataagaga cagccaagcc gaccaaacaa gtg 53
<210> 553
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 204"
<400> 553
gtctcgtggg ctcggagatg tgtataagag acagcacctc aaggacagct ctgg 54
<210> 554
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 204"
<400> 554
tcgtcggcag cgtcagatgt gtataagaga cagatatccc cacttcccct gct 53
<210> 555
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="FWD_指导物 205"
<400> 555
gtctcgtggg ctcggagatg tgtataagag acagggcaga gctcagcctc atag 54
<210> 556
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="REV_指导物 205"
<400> 556
tcgtcggcag cgtcagatgt gtataagaga cagtggcccc tatgtggaga tca 53
<210> 557
<211> 6
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="tracrRNA发夹茎的碱基中的序列"
<220>
<221> 修饰的_碱基
<222> (2)..(2)
<223> a, c, u, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(5)
<223> a, c, u, g, 未知或其他
<400> 557
unannu 6
<210> 558
<211> 6
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="tracrRNA发夹茎的碱基中的序列"
<220>
<221> 修饰的_碱基
<222> (2)..(2)
<223> a, c, u, g, 未知或其他
<220>
<221> 修饰的_碱基
<222> (4)..(5)
<223> a, c, u, g, 未知或其他
<400> 558
unanna 6
<210> 559
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注="用于切割位点分析的序列2"
<400> 559
ccatgatata gacgttgtgg ctgttgtagt 30
<210> 560
<211> 6
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成6xHis标签"
<400> 560
His His His His His His
1 5
<210> 561
<211> 10
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成10xHis标签"
<400> 561
His His His His His His His His His His
1 5 10
<210> 562
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 562
cctgggtgtg aggctgggcc attaaaacct ctcc 34
<210> 563
<211> 15
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 563
cctgaaaacc tctcc 15
<210> 564
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 564
cctgggtgtg agctgggcca ttaaaacctc tcc 33
<210> 565
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 565
cctgggccat taaaacctct cc 22
<210> 566
<211> 11
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 566
cctggctctc c 11
<210> 567
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 567
cgggccatta aaacctctcc 20
<210> 568
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 568
cctgggtgtg aggccagacc tgggccatta aaacctctcc 40
<210> 569
<211> 79
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 569
cctgggtgtg aggggaagct gacgtccttt ccatggctgc tcgcctgtgt tgccaccgct 60
gggccattaa aacctctcc 79
<210> 570
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 570
cctgggtgtg acctgggcca ttaaaacctc tcc 33
<210> 571
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 571
cctgggtgtg aggactgggc cattaaaacc tctcc 35
<210> 572
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 572
agttggcaga tgctctaatg tactgccatg ggaa 34
<210> 573
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 573
agttggcaga tgcaatgtac tgccatggga a 31
<210> 574
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 574
agttggcaga tgcatgtact gccatgggaa 30
<210> 575
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 575
agttggcaga tgctatgtac tgccatggga a 31
<210> 576
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 576
agttggcaga tgctaatgta ctgccatggg aa 32
<210> 577
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 577
agttggcaga tgctatgtaa tgccatggga a 31
<210> 578
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 578
agttggcaga tgctctatgt actgccatgg gaa 33
<210> 579
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 579
cgacctgaat gctgtgcggc gctctggctt cattcaatc 39
<210> 580
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 580
cgacctgaat gctgtgcggc tctgcttcca ggtga 35
<210> 581
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 581
cgacctgaat gctgtgcggc atctgcttcc aggtga 36
<210> 582
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 582
cgacctgaat gctgcttcca ggtga 25
<210> 583
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 583
cgacctgaat gcttctgctt ccaggtga 28
<210> 584
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 584
cgacctgaat gcttccaggt ga 22
<210> 585
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 585
gcgtggggac tacgacctga atgctgtgcg gctct 35
<210> 586
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 586
gcgacctgaa tgctgtgcgg ctct 24
<210> 587
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 587
gcgtggggac tacgagctgt gcggctct 28
<210> 588
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 588
gcgtggggac tgaatgctgt gcggctct 28
<210> 589
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 589
gcgtggggac tcctgaatgc tgtgcggctc t 31
<210> 590
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 590
gcgtggggac tacgaacctg aatgctgtgc ggctct 36
<210> 591
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 591
gcgtggggac tacgaatgct gtgcggctct 30
<210> 592
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 592
gcgtggggac tacctgaatg ctgtgcggct ct 32
<210> 593
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 593
gcgtgaatgc tgtgcggctc t 21
<210> 594
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 594
gcgacctgac tgctgtgcgg ctct 24
<210> 595
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 595
gcgtggggac tacgcctgaa tgctgtgcgg ctct 34
<210> 596
<211> 42
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 596
atggaggagt tggcagatgc tctaatgtac tgccatggga ag 42
<210> 597
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 597
atggaggagt tggcagatgc taatgtactg ccatgggaag 40
<210> 598
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 598
atggaggagt tggcagatgt actgccatgg gaag 34
<210> 599
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 599
atgtactgcc atgggaag 18
<210> 600
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 600
atggaggagt tggtgtactg ccatgggaag 30
<210> 601
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 601
atggaggagt tggcagatgc tctaaatgta ctgccatggg aag 43
<210> 602
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 602
atggaggagt tggcagatgc tcttctaatg tactgccatg ggaag 45
<210> 603
<211> 44
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 603
atggaggagt tggcagatgc cctctaatgt actgccatgg gaag 44
<210> 604
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 604
atggaggagt tggcagataa tgtactgcca tgggaagaag 40
<210> 605
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 605
atggcgtact gccatgggaa gaag 24
<210> 606
<211> 46
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 606
atggaggagt tggcagatgc ttctaatgta ctgccatggg aagaag 46
<210> 607
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 607
atggaggagt tggcatctgc catgggaaga ag 32
<210> 608
<211> 42
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 608
atggaggagt tggcagatgc aatgtactgc catgggaaga ag 42
<210> 609
<211> 124
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成多核苷酸"
<400> 609
atggaggagt tggcagatgc caaactgaaa aacaaatcaa agcactctta ttgagtgctg 60
gcgatccccg acgccacggg ccgaaaccct tatcatagaa actctaatgt actgccatgg 120
gaag 124
<210> 610
<211> 84
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 610
atggaggagt tggcagatgc tgcttatata gacctcccac cgtacacgcc taccgcccat 60
tttctaatgt actgccatgg gaag 84
<210> 611
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 611
atggaggagt tgtctaatgt actgccatgg gaag 34
<210> 612
<211> 16
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 612
ctgccatggg aagaag 16
<210> 613
<211> 90
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 613
atggaggagt tggcagatgc gcggctgttc ctgtacagaa ccgtgggcga gatgtggatc 60
aaggatgctc taatgtactg ccatgggaag 90
<210> 614
<211> 41
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 614
atggaggagt tggcagatgc ctaatgtact gccatgggaa g 41
<210> 615
<211> 97
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 615
atggaggagt tggcagatgc tgtcatgatc tttttccgct cgtcgtggga cttgctcagt 60
tctctggcca gctcgtctaa tgtactgcca tgggaag 97
<210> 616
<211> 41
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 616
atggaggagt tggcagatgc tctatgtact gccatgggaa g 41
<210> 617
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 617
cagggacagt gcgcatctcc ctggtcacca ag 32
<210> 618
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 618
cagggacagt caccaag 17
<210> 619
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 619
cagggacagt gcgcatctcc tggtcaccaa g 31
<210> 620
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 620
cagggacagt gcgcatctct ggtcaccaag 30
<210> 621
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 621
cagggacagt gcgcatctcc tctggtcacc aag 33
<210> 622
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 622
cagggacagt gcgcatcctg gtcaccaag 29
<210> 623
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 623
cagggacggt caccaag 17
<210> 624
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 624
cggggacagg gcgcatctcc tggtcaccaa g 31
<210> 625
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 625
cgacctgaat gctgtgcggc tctgcttcca gg 32
<210> 626
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 626
cgacctgaat gctgtgcggc atctgcttcc agg 33
<210> 627
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 627
cgacctgaat gctgtgcggc ttctgcttcc agg 33
<210> 628
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 628
cgacctgaat gctgtgtctg cttccagg 28
<210> 629
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 629
cgacctgcat gctgtgcggc atctgcttcc agg 33
<210> 630
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 630
cgacctgcat gctgtgcggc ttctgcttcc agg 33
<210> 631
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 631
cgacctgcat gctgtgtctg cttccagg 28
<210> 632
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 632
cgacctgaat gctgtgcgac atctgcttcc agg 33
<210> 633
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 633
tggggactac gacctgaatg ctgtgcggct ct 32
<210> 634
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 634
tggggactac gaatgctgtg cggctct 27
<210> 635
<211> 66
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 635
tggggactac gagcaggcag aagtatgcaa agcatgcatc tcaattcctg aatgctgtgc 60
ggctct 66
<210> 636
<211> 72
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 636
tggggactac gaagaaggcg atagaaggcc atgcgctgcg aatcgggagc ggcctgaatg 60
ctgtgcggct ct 72
<210> 637
<211> 99
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 637
tggggactac gatgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 60
ctcaaaggcg gtaatacggc ctgaatgctg tgcggctct 99
<210> 638
<211> 14
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 638
tggggtgcgg ctct 14
<210> 639
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 639
tggggactac gactgctgtg cggctct 27
<210> 640
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 640
cgacctgaat gctgtgcggc gctctggctt cattcaatc 39
<210> 641
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 641
cgacctgaat gctgtgcggc tctgcttcca ggtga 35
<210> 642
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 642
cgacctgaat gctgtgcggc atctgcttcc aggtga 36
<210> 643
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 643
cgacctgaat gctgcttcca ggtga 25
<210> 644
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 644
cgacctgaat gcttctgctt ccaggtga 28
<210> 645
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成寡核苷酸"
<400> 645
cgacctgaat gcttccaggt ga 22
<210> 646
<211> 4
<212> PRT
<213> 智人
<400> 646
Glu Glu Gln Leu
1
<210> 647
<211> 6
<212> PRT
<213> 智人
<400> 647
Ala Glu Val Ser Gln Ala
1 5
<210> 648
<211> 4
<212> PRT
<213> 小鼠
<400> 648
Gly Glu Gln Leu
1
<210> 649
<211> 6
<212> PRT
<213> 小鼠
<400> 649
Ala Glu Val Ser Lys Ala
1 5
<210> 650
<211> 4
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<400> 650
Gly Glu Gln Leu
1
<210> 651
<211> 6
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注="人工序列的描述:合成肽"
<400> 651
Ala Glu Val Ser Gln Ala
1 5
- RNA-指导的核酸酶及其活性片段和变体及其使用方法
- 包含内切核酸酶活性的多肽片段及其用途