通过核酸内切酶保护的靶向富集
文献发布时间:2023-06-19 11:55:48
技术领域
本发明属于遗传学研究领域,更具体地,属于靶向核酸分离领域,如用于遗传学研究中进一步分析或加工的文库制备。公开了用于降低核酸样品复杂度或富集核酸样品内靶核酸的新方法和组合物。
发明背景
遗传研究的重要组成是所定义的DNA基因座的序列分析。这可以是对已知变体基因分型,或鉴定序列变化或变体。这类分析通常需要以多重方式完成,如需要在大量样品中分析特定基因座组。用于此的理想试验在需要筛选的样品及基因座数目方面灵活,高精度且适合不同测序平台。尝试提供包括富集步骤的试验但理想的是没有扩增。例如,US2014/0134610描述了降低复杂性的方法,使用II型限制酶以片段化样品中的核酸,然后连接保护性接头且随后用核酸外切酶降解所有非捕获核酸。在WO2016/028887中,此方法如下改善:使用可编程的核酸内切酶,即CRISPR-核酸内切酶,片段化样品中的核酸。
CRISPR(成簇的规律间隔的短回文重复序列)是含多个较短直接重复序列的基因座且在40%经测序的细菌和90%经测序的古生菌内发现。CRISPR重复序列形成获得性细菌免疫系统,抵御遗传学病原体如噬菌体和质粒。当细菌受到病原体攻击时,一小段病原体基因组通过CRISPR相关蛋白(CAS)加工并纳入CRISPR重复序列之间的细菌基因组。CRISPR基因座接着转录并加工形成所谓的crRNA,其包含约30bp与病原体基因组相同的序列。这些RNA分子形成在后续感染之后识别病原体的基础并通过直接消化病原体基因组来导致病原体遗传因子沉默。CAS蛋白Cas9是来自酿脓链球菌(S.pyogenes)的II型CRISPR-CAS系统的主要成分,且在联合crRNA和称为反式激活crRNA(tracrRNA)的第二RNA时形成核酸内切酶,所述核酸内切酶靶向侵入的致病DNA,以通过在crRNA所定义基因组位置处引入DNA双链断裂(DSB)而降解。此II型CRISPR-Cas9系统证明在生物化学中是方便有效的工具,通过靶向引入双链缺口和随后激活内源修复机制,能够在真核基因组感兴趣位点引入修饰。Jinek等.(2012,Science 337:816-820)证明单链嵌合RNA(单引导RNA、sRNA、sgRNA)能够联合Cas9形成功能核酸内切酶,所述单链嵌合RNA通过组合crRNA和tracrRNA基本序列到单一RNA分子内生成。从不同细菌种群中鉴定了许多不同CRISPR-CAS系统(Zetsche等.2015Cell163,759-771;Kim等.2017,Nat.Commun.8,1-7;Ran等.2015.Nature 520,186-191)。
除了RNA指导用于引导核酸内切酶到核酸分子特定位置的CRISPR-CAS系统,本领域已知使用DNA或RNA指导的其他核酸内切酶(Doxzen等.2017,PLOS ONE 12(5):e0177097;Kaya等.2016,PNAS卷113第15号,4057-4062)。
本领域仍然很需要灵活且精确的方法用于降低核酸复杂性。本领域尤其需要就一个或多个靶核酸片段富集样品的通用方法,例如用于遗传学研究的后续分析或加工。
本发明如下详述,允许高度简化的文库制备方法用于下游加工和/或分析。
发明概述
第一方面,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二RNA或DNA指导的核酸内切酶复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,所述RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物。因此,本发明优选涉及从包含核酸分子的样品富集靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二gRNA-CAS复合物切割核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,步骤b)如下进行:将第一和第二gRNA-CAS复合物与核酸分子一起在约10-90℃,优选约37℃温育约1分钟-约18小时,优选约60分钟。
优选地,步骤c)如下进行:将经切割核酸分子与核酸外切酶在约10-90℃,优选约37℃温育约1分钟-约12小时,优选30分钟。
优选地,所述第一和第二gRNA-CAS复合物至少之一包含Cas9蛋白。
优选地,所述第一和第二gRNA-CAS复合物至少之一包含sgRNA。
优选地,所述第一和第二gRNA-CAS复合物至少之一包含作为不同分子的crRNA及tracrRNA。
优选地,所述第一和第二gRNA-CAS复合物至少之一能够诱导DSB。
优选地,所述第一和第二gRNA-CAS复合物都能够诱导DSB。
优选地,在所述步骤b)中,第一和第二gRNA-CAS复合物至少之一使核酸分子的一条链产生缺口,且其中核酸分子与至少第三gRNA-CAS复合物接触,所述第三gRNA-CAS复合物使互补链基本在所述第一或第二gRNA-CAS复合物所形成的缺口的位置的互补位置产生缺口。
第二方面,本发明涉及从包含核酸分子的样品中制备接头连接的靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;
b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;
d)任选地,从步骤c所得消化物纯化包含感兴趣的序列的靶核酸片段;和
e)使接头与靶核酸片段连接。
优选地,所述接头是序列接头。
第三方面,本发明涉及从包含核酸分子的样品测序靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;
b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含所述感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;
d)任选地,从步骤c所得的消化物纯化包含所述感兴趣的序列的靶核酸片段;
e)任选地,使接头与靶核酸片段连接;和
f)测序所述至少一个靶核酸片段。
优选地,本文所定义的方法对多个核酸样品平行进行。
优选地,所述核酸分子是基因组DNA。
优选地,所述核酸分子是可从植物、动物、人或微生物获得的核酸分子。
第四方面,本发明涉及从核酸分子富集靶核酸片段的的成套试剂盒(kit ofparts),所述试剂盒包含:
-至少本文所定义的第一和第二gRNA-CAS复合物以及
-核酸外切酶。
第五方面,本发明涉及本文所定义的第一和第二gRNA-CAS复合物或本文所定义的成套试剂盒用于从核酸分子富集至少一个靶核酸片段的用途。
定义
本说明书和权利要求通篇使用了涉及方法、组合物、应用和本发明其他方面的各种术语。除非另有说明,这样的术语以本发明所属领域的通常意义给出。其他特别定义的术语以与本文所提供定义一致的方式解释。尽管与本文所述类似或等同的任何方法和材料能用于实施本发明测试,但是优选的方法和材料如本文所述。
实施本发明所用常规技术的方法对技术人员是明显的。分子生物学、生物化学、计算化学、细胞培养、重组DNA、生物信息学、基因组学、测序和相关领域的常规技术实施为本领域技术人员熟知,且讨论于例如下列参考文献:Sambrook等.《分子克隆.实验室手册》(Molecular Cloning.A Laboratory Manual),第2版,冷泉港实验室出版社(Cold SpringHarbor Laboratory Press),纽约冷泉港,1989;Ausubel等.《精编分子生物学实验指南》(Current Protocols in Molecular Biology),约翰威利父子公司(John Wiley&Sons),纽约,1987和定期更新;和《酶学方法》系列(the series Methods in Enzymology),学术出版社(Academic Press),圣地亚哥。
除非上下文另有明确说明,“一(a、an)”和“所述”:这些单数形式术语包括复数指示物。因此,例如,提及“一个细胞”包括2个或更多细胞的组合等。
本文所用术语“约”用于描述并解释小变化。例如,该术语能指小于或等于±10%,如小于或等于±5%,小于或等于±4%,小于或等于±3%,小于或等于±2%,小于或等于±1%,小于或等于±0.5%,小于或等于±0.1%或者小于或等于±0.05%。另外,量、比例和其他数值有时在本文中以范围形式表示。应理解这种范围形式出于方便和简洁而使用,其应灵活理解包含明确指定为限值范围的数值,还包含该范围涵盖的所有单独数值或子区间,就如同各数值和子区间被明确指定。例如,约1-约200的范围内比例应理解为包含约1和约200的明确列举界限值,还包含单个比例如约2、约3和约4,以及子区间如约10-约50、约20-约100,等等。
本文所用术语“接头”是单链、双链、部分双链、Y型或发夹核酸分子,其能附着优选连接其他核酸末端,例如双链DNA分子的一条或两条链,且优选长度有限,如约10-约200、或约10-约100碱基、或约10-约80、或约10-约50、或约10-约30碱基对长度,并且优选是化学合成的。接头的双链结构可由彼此碱基配对的2个不同寡核苷酸分子形成,或由单一寡核苷酸链的发夹结构形成。显然,接头的可粘附末端能设计成与悬垂部分相容或任选地能与之连接,所述悬垂部分通过限制酶和/或可编程核酸酶切割来制备,可设计成与加入非模板延伸反应(如3’-A添加)后产生的悬垂部分相容,或可具有钝端。
“和/或”:术语“和/或”指其中所述的情况的一种或多种可能单独发生,或与所述的情况的至少一种,多至所述的情况的全部组合发生的情形。
用于核酸或核酸反应使用,“扩增”是指制备特定核酸如靶核酸或带标签核酸的拷贝的体外方法。多种扩增核酸方法为本领域已知,核酸反应包括聚合酶链式反应、连接酶链式反应、链置换扩增反应、滚环扩增反应、转录介导扩增法如NASBA(例如美国专利号5,409,818)、环介导扩增法(例如使用成环序列的“LAMP”扩增,例如美国专利号6,410,278所述)和等温扩增反应。扩增的核酸可以是DNA,包括以下、由其组成或从其衍生:DNA或RNA或DNA与RNA的混合物,包括经修饰的DNA和/或RNA。,无论起始核酸是DNA、RNA或两者,获自一个或多个核酸分子的扩增的产物(即“扩增产物”)可以是DNA或RNA,或DNA与RNA核苷或核苷酸的混合物,或其能包括经修饰的DNA或RNA核苷或核苷酸。
“拷贝”可以是但不限于某一序列,其与特定序列有全序列互补性或全序列相同性。或者,拷贝不必定与此特定序列具有完美序列互补性或相同性,例如允许一定程序的序列变化。例如,拷贝能包括核苷酸类似物如脱氧肌苷或脱氧尿苷,内部序列变化(如通过引物引入的序列变化,该引物所包含的序列与特定序列可杂交但不互补),和/或扩增期间发生的序列错误。
术语“互补性”在本文中定义为序列与完全互补链(如第二或反链)的序列相同性。例如,100%互补(或全互补)的序列在本文理解为与互补链有100%序列相同性,且例如80%互补的序列在本文理解为与(全)互补链有80%序列相同性。
“包含”:此术语解释为包容性和开放性的,且不是排除性的。特别地,该术语和其变型指包含特定特征、步骤或组分。这些术语不应解释为排除其他特征、步骤或组分的存在。
“构建体”或“核酸构建体”或“载体”:这指人造核酸分子,产生自重组DNA技术的使用且能用于向宿主细胞递送外源DNA,通常目的是在宿主细胞中表达构建体上包含的DNA区域。构建体的载体骨架可以是例如质粒,其中整合了(嵌合)基因,或如果适当转录调节序列(例如(诱导型)启动子)已存在,仅想要的核苷酸序列(如编码序列)整合在所述转录调节序列下游。载体可包含更多遗传因子以促进其在分子克隆中的应用,如选择性标记、多克隆位点等。
本文所用术语“双链”和“双链体”,描述碱基配对即杂交在一起的2条互补多核苷酸。互补核苷酸链在本领域也已知为反向互补。
本文所用术语“有效量”指足以引起想要的生物学效果的生物学活性剂的量。例如,在一些实施方案中,有效量核酸外切酶可指足以诱导未保护的核酸切割的核酸外切酶的量。本领域技术人员会理解,物质(agent)的有效量可根据多种因素变化,如所用的物质、使用所述物质的条件以及想要的生物学效果,例如待检测的核酸酶切割程度。
“示范性”:此术语指“用作示例、实例或说明”,且不应解释为排除本文公开的其他配置。
“表达”:这指其中可操作连接合适调控区尤其是启动子的DNA区域转录成RNA,其进而能翻译成蛋白或肽的过程。
“引导序列”在本文中应理解为指导RNA或DNA引导的核酸内切酶到RNA或DNA分子特定位点的序列。在gRNA-CAS复合物的背景下,“引导序列”进一步在本文理解为sgRNA或crRNA的部分,其是使gRNA-CAS复合物靶向双链DNA特定位点所需的。
gRNA-CAS复合物在本文中应理解为与引导RNA复合或杂交CAS蛋白,也称为CRISPR-核酸内切酶或CRISPR-核酸酶,其中引导RNA可以是crRNA和/或tracrRNA或sgRNA。
“相同性”和“相似性”能通过已知方法容易地计算。“序列相同性”和“序列相似性”能通过比对2个肽或2个核苷酸序列用总体或局部比对算法确定,取决于2个序列的长度。长度类似的序列优选用总体比对算法(如Needleman Wunsch)比对,该算法优选在完整长度上比对序列,而长度显著不同的序列优选用局部比对算法(如Smith Waterman)比对。当序列(优选通过例如程序GAP或BESTFIT用默认参数比对时)共有至少某一最小百分比的序列相同性(如下所定义)时,序列可随后称为“大体相同”或“基本相似”。GAP采用Needleman和Wunsch总体比对算法以在其完整长度(全长)上比对2个序列,使匹配数最大化且缺口数最小化。当2个序列具有相似长度时,总体比对适用于确定序列相同性。一般,采用GAP默认参数,空位产生罚分=50(核苷酸)/8(蛋白)且空位延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,所用默认打分矩阵是nwsgapdna,对于蛋白,默认打分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。序列比对和序列相同性百分比的分数可用计算机程序测定,如GCG Wisconsin包,10.3版,可获自Accelrys公司(Accelrys Inc.),9685Scranton路,圣地亚哥,CA 92121-3752USA,或使用开源软件如程序“needle”(采用总体NeedlemanWunsch算法)或“water”(采用局部Smith Waterman算法),EmbossWIN 2.10.0版,所用参数与上面GAP相同,或使用默认设置(都用于“needle”和“water”且都用于蛋白及DNA比对,默认空格罚分是10.0且默认空位延伸罚分0.5;默认打分矩阵是用于蛋白的Blosum62和用于DNA的DNAFull)。当序列在长度方面显著不同时,优选局部算法如用Smith Waterman算法的那些。
或者,相似性或相同性百分比可通过针对公开数据库搜索来确定,使用算法如FASTA,BLAST等。因此,本发明的核酸和蛋白序列能进一步用作“查询序列”以针对公开数据库执行搜索,例如鉴定其他家族成员或相关序列。这类搜索能用Altschul等.(1990)J.Mol.Biol.215:403—10的BLASTn和BLASTx程序(2.0版)实施。BLAST核苷酸搜索能用NBLAST程序,得分=100,字长=12执行,以获得本发明核酸分子的核苷酸序列同源物。BLAST蛋白搜索能用BLASTx程序,得分=50,字长=3执行,以获得本发明蛋白分子的氨基酸序列同源物。为获得空位比对用于比较目的,空位BLAST能如Altschul等,(1997)NucleicAcids Res.25(17):3389-3402所述使用。当使用BLAST和空位BLAST程序时,能采用各程序(如BLASTx和BLASTn)的默认参数。参见美国国家生物技术信息中心网页http://www.ncbi.nlm.nih.gov/。
术语“核苷酸”包括但不限于天然存在的核苷酸,包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别是G、C、A和T)。术语“核苷酸”还意在包括以下这些部分:其不仅包含已知嘌呤与嘧啶碱基,还含有经修饰的其他杂环碱基。这类修饰包括甲基化嘌呤或嘧啶,酰化嘌呤或嘧啶,烷基化核糖或其他杂环。另外,术语“核苷酸”包含以下这些部分:其包含半抗原或荧光标记且可能不仅包含常规核糖及脱氧核糖,还含有其他糖。修饰核苷或核苷酸还包括糖部分的修饰,例如其中一个或多个羟基用卤素原子或脂族基取代,或作为醚、胺功能化,等等。
术语“核酸”、“多核苷酸”和“核酸分子”在本文中可互换使用以描述任何长度的聚合物,如大于约2个碱基,大于约10个碱基,大于约100个碱基,大于约500个碱基,大于1000个碱基,多至约10,000或更多个由核苷酸如脱氧核苷酸或核糖核苷酸构成的碱基,且可酶促或合成产生(例如PNA,如美国专利号5,948,902和其中所引用参考文献所述)。所述核酸可与天然产生的核酸以序列特异性方式杂交,该方式与2个天然产生的核酸类似,如能参与Watson-Crick碱基配对相互作用。另外,核酸和多核苷酸可分离(且任选随后分段)自细胞、组织和/或体液。核酸可以是例如基因组DNA(gDNA)、线粒体、细胞游离DNA(cfDNA)、来自文库的DNA和/或来自文库的RNA。
本文所用术语“核酸样品”或“包含核酸的样品”指含核酸的任何样品,其中样品涉及材料或材料混合物,通常(尽管不必定)采用液体形式,包含一种或多种感兴趣的靶核苷酸序列。本发明方法中用作起始材料的核酸样品能来自任何来源,例如全基因组、染色体集合、单染色体、来自一个或多个染色体或转录的基因的一个或多个区域,且可直接纯化自生物来源或实验室来源如核酸库。核酸样品能获自同一个体,其可以是人或其他物种(如植物、细菌、真菌、藻类、古生菌等),或来自同一物种的不同个体,或不同物种的不同个体。例如,核酸样品可来自细胞、组织、活组织检查、体液、基因组DNA文库、cDNA文库和/或RNA文库。
术语“感兴趣的序列”、“感兴趣的靶核苷酸序列”和“靶序列”在本文中可互换使用,且包括但不限于优选存在于细胞内的任何基因序列,例如基因、部分基因或者基因内或邻近基因的非编码序列。感兴趣的靶序列可存在于染色体、附加体、细胞器基因组如线粒体或叶绿体基因组或能独立于遗传物质主体而存在的遗传物质,例如感染性病毒基因组、质粒、附加体,如转座子。感兴趣的序列可在基因的编码序列之内,转录的非编码序列之内,例如前导序列、尾随序列或内含子。所述感兴趣的核酸序列可存在于双链核酸或单链核酸。
感兴趣的序列可以是但不限于具有或疑似具有多态性如SNP的序列。
本文所用术语“寡核苷酸”指核苷酸的单链多聚体,长度优选约2-200个核苷酸,或多至500个核苷酸。寡核苷酸可合成或酶促制备,在一些实施方案中,长度为约10-50个核苷酸。寡核苷酸能包含核糖核苷酸单体(即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸可以是约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150、150-200或约200-250个核苷酸长度。
“植物”:这包括植物细胞、植物原生质体、能从其再生植物的植物细胞组织培养物、植物愈伤组织、植物丛以及在植物或植物部分中完整的植物细胞,所述植物部分如胚、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、外壳、梗、根、根尖、花药、谷粒等。植物的非限制性示例包括作物和栽培植物如大麦、卷心菜、油菜(canola)、木薯、花椰菜、菊苣、棉花、黄瓜、茄子、葡萄、辣椒、莴苣、玉米、甜瓜、油菜(oilseed rape)、土豆、南瓜、稻、黑麦、高粱、倭瓜、甘蔗、甜菜、向日葵、甜辣椒、番茄、西瓜、小麦和意大利青瓜。
“前间隔序列”是识别或可与引导RNA内引导序列杂交的序列,更特定是crRNA或在sgRNA情况中,是引导RNA的crRNA部分,且位于靶序列中、处或附近。
“核酸内切酶”是在结合其靶或识别位点后,水解双链DNA中至少一条链或一条RNA分子链的酶,核酸内切酶在本文中应理解为位点特异性核酸内切酶且术语“核酸内切酶”和“核酸酶”在本文中可互换使用。限制性核酸内切酶在本文中应理解为同时水解双链体两条链的核酸内切酶,以在DNA中引入双重链缺口。“切口”核酸内切酶是仅水解双链体中一条链的核酸内切酶,以生成“有切口的”而不是经切割的DNA分子。
“核酸外切酶”在本文中定义为从多核苷酸末端(exo)切割一个或多个核苷酸的任何酶。
“降低复杂性”或“复杂性降低”在本文中应理解为复杂核酸样品减少,如衍生自基因组DNA的样品,衍生自液体活检的cfDNA,分离的RNA样品等。复杂性减少可导致复杂起始材料内所包含的一种或多种特定靶序列或靶核酸片段(本文也命名为靶片段)富集和/或产生样品子集,其中该子集包含复杂起始材料内所包含的一种或多种特定靶序列或片段或者由其组成,而非靶序列或片段的量相较于起始材料即在复杂性减少前非靶序列或片段的量,下降至少20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。降低复杂性一般在进一步分析或方法步骤前实施,如扩增、条形编码、测序、确定表观遗传变异等。复杂性减少优选是可重复的复杂性减少,意味着当同一样品用相同方法降低复杂性时,获得相同或至少相当的子集,这与随机复杂性减少相反。降低复杂性方法的示例包括例如
“序列”或“核苷酸序列”:这指核酸的或核酸内的核苷酸的顺序。换言之,核酸中的任何核苷酸顺序可称为序列或核酸序列。例如,靶序列是DNA双链体单链所包含的核苷酸的顺序。
本文所用术语“测序”指获得多核苷酸中至少10个连续核苷酸特性(如至少20、至少50、至少100或至少200或更多个连续核苷酸特性)的方法。术语“二代测序”指所谓的平行合成测序或连接平台测序,例如依诺米那(Illumina)、美国生命技术公司(LifeTechnologies)、PacBio和罗氏(Roche)等目前所用。二代测序方法还可包括纳米孔测序法,如牛津纳米孔技术公司(Oxford Nanopore Technologies)商品化的那些,或基于电子检测的方法如美国生命技术公司商品化的离子激流技术。
“靶核酸片段”或“靶片段”可以是小或较长延伸片段或选定部分的核酸,单或双链,包含感兴趣的序列或由其组成,其优选是进一步分析或作用的目标,例如但不限于复制、扩增、测序和/或其他核酸检测过程。复杂性减少前,靶核酸片段优选包含在较大核酸分子内,如待分析样品中存在的较大的核酸分子内部。
感兴趣的序列可以是样品核酸内的任何序列,如基因、基因复合物、基因座、假基因、调节区、高重复区、多态性区域或其部分。感兴趣的序列也可以是含遗传或表观遗传变异的区域,所述变异指示表型或疾病。在一些方面,选择一组靶核酸片段进行富集,所述片段包含一种或多种感兴趣的序列,或由其组成。任选地,该组由结构或功能相关靶核酸片段组成。一个或多个靶片段能包含天然或非天然、人工、或非经典核苷酸,包括但不限于DNA、RNA、BNA(桥连核酸)、LNA(锁核酸)、PNA(肽核酸)、吗啉代核酸、乙二醇核酸、苏糖核酸、表观遗传修饰的核苷酸如甲基化DNA以及模拟物和其组合。优选地,这些感兴趣的序列是双链DNA中单链DNA链的小或较长连续核苷酸延伸片段(即多核苷酸),其中所述双链DNA还包含与所述双链DNA互补链中靶序列互补的序列。由感兴趣的序列和其互补链组成的双链DNA在本文中也命名为靶核酸片段双链DNA。优选地,所述双链DNA是基因组DNA(gDNA)和/或细胞游离DNA(cfDNA)。
发明详述
发明人发现功能性gRNA-CAS复合物对经切割的片段具有意外的保护效果。事实上,看来切割后,经切割的片段受到保护抵御核酸外切酶切割。不想受理论约束,此保护归因于在核酸外切酶处理期间仍结合切割片段末端的复合物。因此,本发明方法意外显示例如本文所公开的靶富集的无扩增方法不需要连接保护性接头。
第一方面,提供从包含核酸分子的样品中富集至少一个靶核酸片段的方法。优选地,靶核酸片段包含感兴趣的序列。优选地,所述核酸片段包含在如下文详述的富集步骤前样品中存在的核酸分子内。因此优选地,所述靶核酸片段是样品中核酸分子的片段。
优选地,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:
a)提供包含所述核酸分子的样品,其中所述核酸分子包含感兴趣的序列;
b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;
c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许核酸外切酶消化所述至少一个非靶核酸片段;和
d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。
优选地,步骤b)中的RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物、gRNA-argonaute复合物和gDNA-argonaute复合物至少之一。优选地,步骤b)中的RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物。
优选地,步骤c)中,所述至少第一和第二gRNA-CAS复合物结合靶核酸片段。
优选地,步骤c)中,所述至少第一和第二gRNA-CAS复合物在步骤c)期间或至少部分步骤c)期间保持结合靶核酸片段。
优选地,步骤c)中,靶核酸片段不被核酸外切酶消化,即在步骤c)中,靶核酸片段受到保护抵御核酸外切酶消化。
优选地,步骤c)中,仅一个或多个非靶核酸片段被核酸外切酶消化。
在步骤b)中,用至少第一和第二gRNA-CAS复合物切割所述核酸分子。任选地,步骤b)能在使所述核酸分子接触第一和第二gRNA-CAS复合物的步骤以及允许所述复合物切割所述核酸分子的步骤中进一步说明。因此,在一个实施方案中,步骤b)能进一步如下说明:
b1)使所述核酸分子接触第一和第二gRNA-CAS复合物,其中所述第一复合物的gRNA引导所述第一复合物到感兴趣的序列上游的序列,且其中所述第二复合物的gRNA引导所述第二复合物到感兴趣的序列下游的序列;和
b2)允许所述第一和第二gRNA-CAS复合物切割核酸分子,其中至少一个经切割的核酸分子是靶核酸片段,且至少1个、优选2个经切割的核酸分子是非靶核酸片段。
发明人意外发现向步骤b的消化物加入核酸外切酶,而不采取更多措施以保护靶核酸片段,引起所述感兴趣片段富集。换言之,意外地,不需要通过例如连接惰性接头的进一步保护来保护靶核酸片段免于核酸外切酶降解。因此,本发明方法优选不包括以下进一步步骤:在核酸外切酶处理步骤前,保护靶核酸片段,或靶核酸片段末端。在一个优选实施方案中,本文所定义的方法在核酸外切酶处理前没有加入保护性接头。此背景下,保护性接头在本文中应理解为特别设计成针对核酸外切酶消化保护被接头捕获的靶核酸片段的接头。这种接头优选通过纳入化学部分或阻断基(如硫代磷酸)或缺乏末端核苷酸(发夹或茎环接头或可环化接头)针对核酸外切酶降解提供保护。
本发明的方法例如用于富集核酸样品,优选用于帮助下游加工或分析所述样品内的一个或多个靶核酸片段。富集引起本发明方法步骤a)中用作起始材料的核酸样品复杂性降低和/或本发明方法步骤a)中用作起始材料的核酸样品的一个或多个靶核酸片段子集产生。
因此,本发明第一方面还提供至少:
i)一种用于降低包含感兴趣的序列的核酸样品复杂性的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d);
ii)一种用于提供核酸样品子集的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d),其中所述子集包含一个或多个靶核酸片段;和
iii)一种用于分离或获得包含感兴趣的序列(来自包含所述感兴趣的序列的核酸分子)的片段即靶核酸片段的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d)。
降低核酸样品复杂性在核酸测序应用方面有特别的效用,尤其是在其中靶核酸片段是复杂样品(例如但不限于基因组)内的次要种类的样品中。富集或复杂性降低可显著降低所产生的测序数据的成本,因为复杂样品的大部分在测序前去除,而靶核酸片段被选择性保留,因而更高百分比的序列读取产生自感兴趣的序列。
在优选实施方案中,通过本文方法生成的富集的靶核酸片段用于单分子、实时测序反应,如来自太平洋生物科学公司(Pacific Biosciences)、加利福尼亚州门洛帕克的
所述至少第一和第二gRNA-CAS复合物在本文中应理解为CRISPR相关(CAS)蛋白或CRISPR核酸酶,各自与引导RNA复合。CRISPR核酸酶包含核酸酶结构域和至少一个与引导RNA相互作用的结构域。当与引导RNA复合时,引导RNA将CRISPR核酸酶指引到特定核酸序列。引导RNA与CRISPR核酸酶以及特定靶核酸序列相互作用,从而一旦经引导序列指引到包含特定核酸序列的位点,CRISPR核酸酶能够在靶位点引入断裂。优选地,在核酸酶的1个或2个结构域都具有催化活性的情况中,CRISPR核酸酶分别能够在靶位点引入单或双链断裂。技术人员清楚了解如何设计引导RNA,采用的方式是当联合CRISPR核酸酶时,实现在核酸分子预定的位点处引入单或双链断裂。
基于核心元件含量和序列,CRISPR核酸酶一般可以分成6个主要类型(I-VI型),其进一步细分成亚型(Makarova等,2011,Nat Rev Microbiol 9:467-77和Wright等,2016,Cell 164(1-2):29-44)。一般而言,CRISPR-CAS系统复合物的2个关键元件是CRISPR核酸酶和crRNA。crRNA由短重复序列组成,所述序列散布有衍生自入侵DNA的间隔序列。CAS蛋白具有多种活性如核酸酶活性。因此,gRNA-CAS复合物提供靶向特定序列以及根据序列的某些酶活性的机制。
I型CRISPR-CAS系统通常包含有分开的解旋酶和DNase活性的Cas 3蛋白。例如,在1-E型系统中,crRNA纳入称为Cascade(用于抗病毒防御的CRISPR相关复合物)的多亚基效应复合物内(Brouns等,2008,Science 321:960-4),其特异性结合双螺旋DNA并通过Cas3蛋白激发降解(Sinkunas等,2011,EMSO J 30:1335-1342;Beloglazova等,2011,EMBO J 30:616-627)。
II型CRISPR-CAS系统包含特征性Cas9蛋白,这是一种单一蛋白(约160KDa),能够产生crRNA且特异性切割双螺旋DNA。Cas9蛋白通常包含2个核酸酶结构域,即氨基末端附近的RuvC样核酸酶结构域和蛋白中间附近的HNH(或McrA样)核酸酶结构域。Cas9蛋白的各核酸酶结构域专门用于切割双螺旋的一条链(Jinek等,2012,Science 337(6096):816-821)。Cas9蛋白是II型CRISPR/-CAS系统的CAS蛋白示例并形成核酸内切酶,当联合crRNA和称为反式激活crRNA(tracrRNA)的第二RNA时,其靶向入侵病原体DNA,通过在crRNA所定义的病原体基因组中的位置处引入DNA双链断裂(DSB)进行降解。Jinek等.(2012,Science 337:816-820)证明通过融合crRNA和tracrRNA必要部分而生成的单链嵌合引导RNA(本文的“sgRNA”)能够联合Cas9蛋白形成功能性核酸内切酶。
III型CRISPR-CAS系统包含聚合酶和RAMP组件。III型系统能进一步分成亚型III-A和III-B。III-A型CRISPR-CAS系统显示靶向质粒,III-A型系统的聚合酶样蛋白参与特异性切割DNA(Marraffini和Sontheimer,2008,Science 322:1843-1845)。III-B型CRISPR-CAS系统还显示靶向RNA(Hale等,2009,Cell 139:945-956)。
IV型CRISPR-CAS系统包含Csf1,一种未表征的蛋白质,被提议形成部分Cascade样复合物,不过这些系统通常作为分离cas基因发现,而没有相关CRISPR阵列。
最近描述了V型CRISPR-CAS系统,来自普氏菌(Prevotella)和弗朗西斯氏菌(Francisella)的成簇的规律间隔短回文重复序列1,或CRISPR/Cpf1。Cpf1基因与CRISPR基因座相关且编码使用crRNA来靶向DNA的核酸内切酶。Cpf1是比Cas9更小且更简单的核酸内切酶,其可克服CRISPR-Cas9系统的一些限制。Cpf1是单RNA指导的核酸内切酶,没有tracrRNA,且其使用富含T的前间隔序列毗邻基序。Cpf1经交错DNA双链断裂来切割DNA(Zetsche等(2015)Cell 163(3):759–771)。V型CRISPR-CAS系统优选包含Cpf1、C2c1和C2c3的至少一种。
VI型CRISPR-CAS系统可包含Cas13a蛋白,其包含RNaseA活性。在靶核酸片段是RNA的情况中,本发明方法的至少第一和第二gRNA-CAS复合物可包含Cas13a,例如但不限于来自韦德纤毛菌(Leptotreichia wadee,LwCas13a)或沙氏纤毛菌(Leptotrichia shahii,LshCas13a)的Cas13a,如描述于Gootenberg等,Science.2017年4月28日;356(6336):438-442。
本发明的方法的第一和第二gRNA-CAS复合物可包含上文所定义的任何CRISPR核酸酶。优选地,本发明的方法的第一和第二gRNA-CAS复合物至少之一包含II型CRISPR核酸酶如Cas9(例如SEQ ID NO:1的蛋白,其由SEQ ID NO:2编码,或SEQ ID NO:19的蛋白)或V型CRISPR核酸酶如Cpf1(例如SEQ ID NO:3的蛋白,其由SEQ ID NO:4编码)或Mad7(例如SEQID NO:20或21的蛋白)或其衍生蛋白,与所述蛋白在其全长上具有优选至少约70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性。
优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含II型CRISPR核酸酶,优选Cas9核酸酶。
技术人员了解如何制备CRISPR-CAS系统的不同组分,包括CRISPR核酸酶。在现有技术中,在其设计和应用方面有许多报道。参见例如Haeussler等(J Genet Genomics.(2016)43(5):239-50.doi:10.1016/j.jgg.2016.04.008.)关于设计引导RNA和其与CAS蛋白(初始获自酿脓链球菌(S.pyogenes))组合应用的近期的综述,或Lee等的综述(PlantBiotechnology Journal(2016)14(2)448–462)。
一般地,CRISPR核酸酶如Cas9包含2个催化活性核酸酶结构域。例如,Cas9蛋白能包含RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域一起合作,都切割单链以在DNA中产生双链断裂(Jinek等,Science,337:816-821)。失活CRISPR核酸酶包含修饰,从而没有核酸酶结构域显示切割活性。用于本发明方法的第一和第二gRNA-CAS复合物至少之一的CRISPR核酸酶可以是CRISPR核酸酶变体,其中一个核酸酶结构域突变,从而其不再具有功能(即缺少核酸酶活性),由此产生切口酶。一个示例是具有D10A或H840A突变的SpCas9变体。优选地,第一和第二gRNA-CAS复合物的核酸酶至少之一不是失活核酸酶。优选地,第一gRNA-CAS复合物的CRISPR核酸酶是切口酶或(内切)核酸酶。优选地,第二gRNA-CAS复合物的CRISPR核酸酶是切口酶或(内切)核酸酶。
本发明的方法的至少第一和第二gRNA-CAS复合物可包含完整Cas9蛋白或变体或由其组成,或可包含其片段。优选地,这类片段确实结合crRNA和tracrRNA或sgRNA,但可缺乏核酸酶活性所需的一个或多个残基。
优选地,第一和第二gRNA-CAS复合物至少之一包含Cas9蛋白。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含Cas9蛋白。Cas9蛋白可衍生自酿脓链球菌(Streptococcus pyogenes)(SpCas9;NCBI参考序列NC_017053.1;UniProtKB-Q99ZW2),嗜热脱氮芽孢杆菌(Geobacillus thermodenitrificans)(UniProtKB-A0A178TEJ9),溃疡性棒状杆菌(Corynebacterium ulcerous)(NCBI Refs:NC_015683.1,NC_017317.1);白喉棒状杆菌(Corynebacterium diphtheria)(NCBI Refs:NC_016782.1,NC_016786.1);螺原体(Spiroplasma syrphidicola)(NCBI Ref:NC_021284.1);中间普雷沃菌(Prevotellaintermedia)(NCBI Ref:NC_017861.1);台湾螺原体(Spiroplasma taiwanense)(NCBIRef:NC_021846.1);海豚链球菌(Streptococcus iniae)(NCBI Ref:NC_021314.1);罗的海贝尔氏菌(Belliella baltica)(NCBI Ref:NC_018010.1);扭曲冷弯曲菌(Psychroflexustorquisl)(NCBI Ref:NC_018721.1);嗜热链球菌(Streptococcus thermophilus)(NCBIRef:YP_820832.1);Listeria innocua(NCBI Ref:NP_472073.1);空肠弯曲菌(Campylobacter jejuni)(NCBI Ref:YP_002344900.1);或脑膜炎奈瑟氏菌(Neisseriameningitidis)(NCBI Ref:YP_002342100.1)。涵盖了来自这些的Cas9变体,具有与SpCas9同源的失活的HNH或RuvC结构域,如SpCas9_D10A或SpCas9_H840A,或者在SpCas9蛋白中对应D10或H840的位置处有等价取代的Cas9,产生切口酶。
根据一个优选实施方案,可编程核酸酶能衍生自Cpf1,如来自氨基酸球菌属(Acidaminococcus sp)的Cpf1;UniProtKB-U2UMQ6。该变体可以是有失活的RuvC或NUC结构域的Cpf1-切口酶,其中RuvC或NUC结构域不再具有核酸酶活性。技术人员清楚了解本领域可获得的技术,如定点诱变、PCR介导的突变和全基因合成,其允许失活核酸酶如失活RuvC或NUC结构域。带有失活的NUC结构域的Cpf1切口酶示例是Cpf1 R1226A(参见Gao等.CellResearch(2016)26:901–913,Yamano等.Cell(2016)165(4):949–962)。此变体中,NUC结构域内有精氨酸到丙氨酸(R1226A)转换,这使得NUC结构域失活。
所述至少第一和第二gRNA-CAS复合物还包含指导复合物到核酸样品中限定的位点的CRISPR核酸酶相关的引导RNA,也称为前间隔序列。引导RNA包含使gRNA-CAS复合物靶向前间隔序列的引导序列,所述前间隔序列优选在核酸分子中感兴趣的序列附近、在核酸分子中感兴趣的序列处或在核酸分子中感兴趣的序列内部,且可以是sgRNA或crRNA与tracrRNA的组合(如用于Cas9)或仅crRNA(如在Cpf1情况中)。任选地,在同一实验中可以使用多于一种类型的引导RNA,例如针对2种或更多不同的感兴趣的序列,或甚至针对相同感兴趣的序列。
本文中应理解在用至少第一和第二gRNA-CAS复合物切割前,感兴趣的序列存在于核酸样品。切割核酸样品可产生至少2个或更多核酸片段,其中至少一个核酸片段是靶核酸片段且至少一个核酸片段是非靶核酸片段。靶核酸片段包含感兴趣的序列或由其组成。因此,在切割核酸样品前,技术人员很清楚核酸样品涵盖靶核酸片段且在切割后靶核酸片段从核酸样品释放。发明人发现gRNA-CAS复合物切割的核酸片段受到保护免于消化,优选核酸外切酶消化。
本发明的方法需要第一gRNA-CAS复合物的gRNA指导所述第一复合物到核酸样品中的序列,从而第一gRNA-CAS复合物在感兴趣的序列上游切割核酸样品,且第二复合物的gRNA指导第二gRNA-CAS复合物到核酸样品中的序列,从而第二gRNA-CAS复合物在感兴趣的序列下游切割核酸样品。
优选地,gRNA-CAS复合物包含切割前间隔序列内核酸的CRISPR核酸酶。优选的CRISPR核酸酶是Cas9。
由第一gRNA-CAS复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。同样,由第二gRNA-CAS复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。优选地,前间隔序列是与靶核酸片段和非靶核酸片段重叠的序列,即gRNA-CAS复合物的切割位点在前间隔序列内。
优选地,前间隔序列的位置取决于本发明方法所用的CRISPR核酸酶。作为非限制性示例,CRISPR核酸酶SpCAS9切割前间隔序列内的核酸。因此,当CAS9用于本发明方法时,优选前间隔序列部分位于靶核酸片段且部分位于非靶片段,即前间隔序列在靶核酸片段与非靶核酸片段之间重叠。由此,优选地,第一和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与选自下组的前间隔序列杂交:
A)靶核酸片段中包含的前间隔序列杂交;
B)非靶核酸片段中包含的前间隔序列杂交;和
C)在靶核酸片段与非靶核酸片段之间重叠的前间隔序列。
A)在一个实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与一段序列杂交,所述序列是靶核酸片段的序列或是其部分,或与相反链中的其互补序列杂交,例如在核酸片段是双链的情况中。换言之,在此实施方案中,所述由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列是靶核酸片段的序列或位于其中。优选地,由至少第一gRNA-CAS复合物靶向的前间隔序列是靶核酸片段序列的5’-末端或位置与其毗邻,或其互补序列,且优选由至少第二gRNA-CAS复合物靶向的前间隔序列是靶核酸片段序列的3’-末端或位置毗邻其,或其互补序列。毗邻可以是直接毗邻,或优选距离不大于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500或1000个连续核苷酸。核苷酸数目可以取决于本发明方法所用CRISPR核酸酶。
B)在一个实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与一段序列杂交,所述序列会形成或形成部分非靶核酸片段,或与相反链中的其互补序列杂交,在核酸样品是双链核酸的情况中。换言之,在此实施方案中,所述由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列位置几乎毗邻或直接毗邻在切割后会形成靶核酸片段的序列。优选地,当片段存在于核酸样品或其互补序列时,由第一gRNA-CAS复合物靶向的前间隔序列几乎在靶核酸片段5’-末端侧翼,优选直接在5’-末端侧翼。优选地,当片段存在于核酸样品或其互补序列时,由第二gRNA-CAS复合物靶向的前间隔序列在靶核酸片段3’-末端侧翼,或直接在3’-末端侧翼。优选地,前间隔序列与核酸样品中靶核酸片段序列各5’末端或3’末端之间的距离不超过约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个连续核苷酸。核苷酸数目可能取决于本发明方法所用CRISPR核酸酶。
C)在一个优选实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的引导序列能够与一段序列杂交,所述序列在非靶核酸片段和靶核酸片段之间重叠。优选地,所述至少第一或第二gRNA-CAS复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠。优选地,所述至少第一或第二gRNA-CAS复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段5’末端和靶核酸片段3’末端之间重叠。换言之,在此实施方案中,优选的是,由至少所述第一或第二gRNA-CAS复合物靶向的前间隔序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。
作为非限制性示例,SpCas9可在20nt前间隔序列内位置3与4之间切割。因此,在其3’-末端的靶核酸片段可包含前间隔序列的3nt且在其5’-末端的非靶核酸片段可包含前间隔序列的17nt。同样,如果前间隔序列在互补链上,在其3’-末端的靶核酸片段可包含前间隔序列的17nt且在其5’-末端的非靶核酸片段可包含前间隔序列的3nt。由此,在前间隔序列是20个连续核苷酸的示例中,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15,16、17、18或19个核苷酸可存在于非靶核酸片段3’-末端,并且分别地,前间隔序列的19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列5’-末端,这取决于本发明方法所用CRISPR核酸酶类型。
优选地,由至少第一或第二gRNA-CAS复合物靶向的前间隔序列在非靶核酸片段5’-末端与靶核酸片段3’-末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。作为前间隔序列是20个核苷酸的非限制性示例,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12,13,14、15,16、17、18或19个核苷酸可存在于非靶核酸片段5’-末端,前间隔序列的各19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列3-末端,这取决于本发明方法所用CRISPR核酸酶类型。
在一个优选实施方案中,所述第一和第二gRNA-CAS复合物至少之一结合靶核酸片段内的序列。优选地,所述第一和第二gRNA-CAS复合物都结合靶核酸片段内的序列。
或者或另外,所述第一和第二gRNA-CAS复合物至少之一结合非靶核酸片段内的序列。优选地,所述第一和第二gRNA-CAS复合物都结合非靶核酸片段内的序列。
或者或另外,所述第一和第二gRNA-CAS复合物至少之一结合在靶核酸片段与非靶核酸片段之间重叠的序列。优选地,所述第一和第二gRNA-CAS复合物都结合在靶核酸片段与非靶核酸片段之间重叠的序列。
在一个优选实施方案中,所述第一和第二gRNA-CAS复合物至少之一在切割后仍分别结合靶核酸片段的5’-末端或3’-末端。优选地,在切割后,至少一种gRNA-CAS复合物保持结合靶核酸片段的5’-末端且一种gRNA-CAS复合物保持结合靶核酸片段的3’-末端。不同的是,gRNA-CAS复合物优选在靶核酸片段两边的侧翼。
因为除了前间隔序列,gRNA-CAS复合物还需要前间隔序列邻近基序(PAM)序列用于识别,gRNA应设计成使得所靶向的前间隔序列毗邻这类PAM序列,这取决于所用的gRNA-CAS复合物。PAM序列对CRISPR/Cas核酸内切酶活性是必需的,相对较短,因而通常在一定长度的任意给定序列中多次存在。例如,酿脓链球菌Cas9蛋白的PAM基序是NGG,其确保就任何给定基因组序列而言,存在多种PAM基序且能设计许多不同引导RNA。另外,引导RNA还能设计成靶向同一双链序列的相反链。直接毗邻PAM的序列被纳入引导RNA。根据所用CRISPR-CAS复合物,其可能长度不同。例如,用于在Cas9 sgRNA中靶向序列的最优长度是20nt。根据所用CRISPR/Cas核酸内切酶,复合物随后在离PAM的不同距离处诱导2条DNA链的切口。例如,酿脓链球菌Cas9蛋白在PAM序列上游3bp处诱导2条DNA链的切口,以产生钝性DNA DSB。根据例如所用CRISPR-CAS复合物,用于切割核酸样品的PAM位点可存在于所产生核酸片段或所产生非靶核酸片段。
优选地,核酸样品中的感兴趣的序列侧翼是PAM序列或包含优选在感兴趣的序列末端附近的PAM序列,所述PAM序列已知用于和本文所定义复合物的CRISPR-系统核酸酶相互作用(例如参见Ran等2015,Nature 520:186-191)。另外或替代地,PAM序列优选在由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列侧翼。
例如,若所述CRISPR核酸酶是酿脓链球菌Cas9,PAM序列可具有序列5’-NGG-3’。例如,对于嗜热脱氮芽孢杆菌T12 Cas9(例如参见WO2016/198361),PAM序列可具有序列5’-NNNNCNNA-3’。用于Cas9核酸内切酶的更多已知PAM序列是:IIA型5'-NGGNNNN-3'(酿脓链球菌)、5'-NNGTNNN-3'(巴氏链球菌(Streptococcus pasteurianus))、5'-NNGGAAN-3'(嗜热链球菌(Streptococcus thermophilus))、5'-NNGGGNN-3'(金黄色葡萄球菌(Staphylococcus aureus))以及IIC型5'-NGGNNNN-3'(白喉棒状杆菌(Corynebacteriumdifteriae))、5'-NNGGGTN-3'(红嘴鸥弯曲杆菌(Campylobacter lari))、5'-NNNCATN-3'(细小棒菌(Parvobaculum lavamentivorans))和5'-NNNNGTA-3'(灰色奈瑟球菌(Neiseriacinerea))。本领域技术人员因而能够设计gRNA以使来自样品核酸的靶序列片段化。
适合作为crRNA和tracrRNA用作gRNA-CAS复合物中gRNA的分子为本领域熟知(参见例如WO2013142578和Jinek等,Science(2012)337,816-821)。
在一个实施方案中,所述crRNA至少之一包含能与感兴趣的序列,优选本文所定义感兴趣的序列,杂交或在其附近杂交的序列。因此优选地,所述crRNA至少之一包含与感兴趣的序列中序列完全互补的序列,即感兴趣的序列包含前间隔序列。
在一个实施方案中,所述至少一种crRNA包含能与感兴趣的序列,优选本文所定义感兴趣的序列,的互补序列杂交或在其附近杂交的序列。因此优选地,所述crRNA至少之一包含与感兴趣的序列或部分感兴趣的序列有完全序列相同性的核苷酸序列。
优选地,一种或多种crRNA还能够与tracrRNA复合。用于本发明方法的crRNA至少之一能包含未修饰或天然存在的核苷酸或者由其组成。或者或另外,至少一种crRNA能包含修饰或非天然存在的核苷酸或者由其组成,优选这类化学修饰的核苷酸用于保护crRNA免于降解。在一个实施方案中,所述用于本发明方法的至少2种或所有crRNA能包含修饰或非天然产生核苷酸或者由其组成。
在本发明的一个实施方案中,所述至少一种crRNA可以包含核糖核苷酸和非核糖核苷酸。所述至少一种crRNA能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。
所述至少一种crRNA可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(LNA)核苷酸、桥接核酸(BNA)、2’-O-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰的核苷酸可包含选自但不限于下组的修饰的碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。
所述至少一种crRNA可如下化学修饰:在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、2'-O-甲基3'thioPACE(膦酰乙酸酯)(MSP)或其组合。这种化学修饰crRNA能包含相较未修饰crRNA增加的稳定性和/或活性(Hendel等,2015,NatBiotechnol.33(9);985-989)。在某些实施方案中,所述至少一种crRNA在与前间隔序列杂交的区域中包含核糖核苷酸。在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能并入经工程化的crRNA结构,例如但不限于在与前间隔序列杂交的序列中,在与tracrRNA相互作用的序列中或这些序列之间。
或者或另外,化学修饰核苷酸能位于与前间隔序列杂交的序列5’和/或3’。化学修饰的序列能进一步位于与tracrRNA相互作用的序列的5’和/或3’。
在一个优选实施方案中,所述至少一种crRNA的长度可以是至少约15、20、25、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、65、70、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述至少一种crRNA的长度小于约75、50、45、40、35、30、25或约20个核苷酸。优选地,用于本发明方法的crRNA长度是约20-100、25-80、30-60或约35-50个核苷酸长度。
与前间隔序列杂交的crRNA序列部分设计成与前间隔序列有足够互补性,以与前间隔序列杂交并指导所复合的核酸酶的序列特异性结合。前间隔序列优选毗邻前间隔序列邻近基序(PAM)序列,该PAM序列可与本文所定义的RNA指导的CRISPR系统核酸内切酶复合物中CRISPR核酸酶相互作用。例如,在CRISPR核酸酶是酿脓链球菌Cas9的情况中,PAM序列优选是5’-NGG-3’,其中N可以是T、G、A或C中的任何一种。技术人员能够改造crRNA以靶向任何所需序列,优选通过改造序列成与任何所需前间隔序列至少部分互补,从而与其杂交。优选地,部分crRNA序列与其对应的前间隔序列之间的互补性用适当比对算法最优比对时,是至少约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与前间隔序列互补的部分crRNA序列可以是至少约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸长度。在一些优选实施方案中,与DNA靶序列互补的序列小于约75、50、45、40、35、30、25、20个核苷酸长度。优选地,与DNA序列互补的序列长度是至少17个核苷酸。优选地,互补crRNA序列是约10-30个核苷酸长度,约17–25个核苷酸长度或约15-21个核苷酸长度。与前间隔序列互补的部分crRNA优选是15、16、17、18、19、20、21、22、23、24或25个核苷酸长度,优选20或21个核苷酸,优选20个核苷酸。
与tracrRNA相互作用的crRNA的部分设计成与tracrRNA有足够互补性,以与tracrRNA杂交并指导所复合的核酸酶到前间隔序列。优选地,此部分crRNA序列与其tracrRNA对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与tracrRNA相互作用的部分crRNA优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,与tracrRNA相互作用的部分crRNA小于约60、55、50、45、40、35、30或35个核苷酸长度。优选地,与tracrRNA相互作用的部分crRNA是约5–40、10-35、15-30、20-28个核苷酸长度。与tracrRNA相互作用的部分crRNA长度优选是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。
在一个实施方案中,本发明方法所用的至少第一和第二gRNA-Cas复合物分别包含第一和第二crRNA。然而,第一和第二gRNA-Cas复合物可包含相同的tracrRNA。
tracrRNA优选包含一个或多个结构基序,其能与本文所定义的复合物的CRISPR系统核酸酶相互作用。优选地,tracrRNA还能与本文所定义的crRNA相互作用。tracrRNA和crRNA可通过crRNA与tracrRNA之间碱基配对来杂交。tracrRNA优选能够与CRISPR系统核酸酶和crRNA形成复合物。crRNA能够复合tracrRNA并能与靶序列杂交,从而指导核酸酶到靶序列。
tracrRNA可包含一个或多个茎环结构,如1、2、3或更多个茎环结构。
tracrRNA能包含未修饰或天然存在的核苷酸,或由其组成。或者或另外,tracrRNA能包含修饰或非天然存在的核苷酸,或由其组成,优选这类化学修饰核苷酸用于保护tracrRNA免于降解。
在本发明的一个实施方案中,所述tracrRNA包含核糖核苷酸和非核糖核苷酸。tracrRNA能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。
tracrRNA可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(LNA)核苷酸、桥接核酸(BNA)、2’-O-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰核苷酸可包含选自但不限于下组的修饰碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。
tracrRNA可如下化学修饰:在一个或多个末端核苷酸处纳入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、2'-O-甲基3'thioPACE(膦酰乙酸酯)(MSP)或其组合。这种化学修饰tracrRNA能包含相较未修饰tracrRNA增加的稳定性和/或活性(Hendel等,2015,NatBiotechnol.33(9);985-989)。在某些实施方案中,所述tracrRNA在与crRNA相互作用的区域中包含核糖核苷酸。
在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能纳入改造的tracrRNA结构,例如但不限于在与crRNA相互作用的序列中,在与CRISPR系统核酸酶相互作用的序列中或这些序列之间。
或者或另外,化学修饰核苷酸能位于与crRNA相互作用的序列的5’和/或3’。化学修饰核苷酸能进一步位于与CRISPR系统核酸酶相互作用的序列的5’和/或3’。
在一个优选实施方案中,所述tracrRNA长度可以是约25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100、110、120、130、140、150或更多个核苷酸长度。在一些优选实施方案中,所述tracrRNA小于约200、180、160、140、120、100、95、90、85、80或75个核苷酸长度。tracrRNA长度优选是约30–120、40-100、50-90或约60-80个核苷酸长度。
与CRISPR系统核酸酶相互作用的tracrRNA序列部分设计成足以指导复合核酸酶到靶序列。与CRISPR系统核酸酶相互作用的tracrRNA序列的部分可以是约20、25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述与CRISPR系统核酸酶相互作用的序列小于约120、100、80、72、70、60、55、50、45、40、30或20个核苷酸长度。优选地,与CRISPR系统核酸酶相互作用的tracrRNA序列部分是约20-90、30-85、35-80、40–75或50-72个核苷酸长度。优选地,与CRISPR系统核酸酶相互作用的tracrRNA部分是约40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76个核苷酸长度。
与crRNA相互作用的tracrRNA序列部分设计成与crRNA有足够互补性,以与crRNA杂交并指导所复合的核酸酶到靶序列。优选地,此部分tracrRNA序列与其crRNA对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与crRNA相互作用的tracrRNA的部分优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,所述与crRNA相互作用的tracrRNA的部分小于约60、55、50、45、40、35、30或35个核苷酸长度。在一个优选实施方案中,所述与crRNA相互作用的tracrRNA部分是约5–40、10-35、15-30、20-28个核苷酸长度。优选地,与crRNA相互作用的部分长度是约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。
优选地,crRNA和tracrRNA连接在一起形成sgRNA。crRNA和tracrRNA能连接,优选共价连接,使用本领域已知的任何常规方法。例如,crRNA和tracrRNA的常规连接描述于Jinek等.(同上)和WO13/176772,其通过引用纳入本文。crRNA和tracrRNA能共价连接,使用例如接头核苷酸或通过crRNA 3'末端与tracrRNA 5'末端直接共价连接。优选地,所述至少第一和第二gRNA-CAS复合物的gRNA设计成在核酸样品用至少第一和第二gRNA-CAS复合物温育后,来自核酸样品的核酸内所含靶核酸片段从所述核酸中切下。另外,优选第一gRNA设计成第一gRNA-CAS复合物在核酸样品切割后结合靶核酸片段。另外,优选第二gRNA设计成第二gRNA-CAS复合物在核酸样品切割后结合靶核酸片段。优选地,靶核酸片段存在于核酸样品时,侧翼是至少一个非靶核酸片段。优选地,靶核酸片段存在于核酸样品时,2边侧翼都是非靶核酸片段,即一个非靶核酸片段直接存在于靶核酸片段5’且一个非靶核酸片段直接存在于靶核酸片段3’。
优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含sgRNA用于使CRISPR核酸酶优选Cas9,靶向靶核酸片段中的序列。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一和第二gRNA-CAS复合物靶向靶核酸片段中的序列。本发明方法的第一和第二gRNA-CAS复合物至少之一优选包含sgRNA以用于使CRISPR核酸酶优选Cas9,靶向毗邻优选直接毗邻靶核酸片段的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA用于使各第一或第二gRNA-CAS复合物,靶向毗邻优选直接毗邻靶核酸片段的序列,其中靶核酸包含于核酸样品内。
优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含sgRNA以用于使CRISPR核酸酶优选Cas9,靶向靶核酸片段与非靶核酸片段之间重叠的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一或第二gRNA-CAS复合物,靶向靶核酸片段与非靶核酸片段之间重叠的序列,其中靶核酸包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一或第二gRNA-CAS复合物,分别靶向靶核酸片段5’-末端与非靶核酸片段3’-末端之间重叠的序列以及靶核酸片段3’-末端与非靶核酸片段5’-末端之间重叠的序列,此时靶核酸包含于核酸样品内。
或者,本发明方法的第一和第二gRNA-CAS复合物至少之一包含二元引导RNA以使CRISPR核酸酶优选Cas9,靶向核酸样品中的序列,即靶核酸片段中存在的或非靶核酸片段中存在的前间隔序列。二元引导RNA(dgRNA)在本文中应理解为包含crRNA和tracrRNA作为单独但优选杂交的分子,或由其组成。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含dgRNA用于使各第一或第二gRNA-CAS复合物靶向前间隔序列。
优选地,第一和第二gRNA-CAS复合物至少之一能够诱导双链断裂(DSB)。优选地,第一和第二gRNA-CAS复合物都能够诱导核酸样品中的双链断裂(DSB)。
或者,第一和第二gRNA-CAS复合物至少之一是切口酶,本文表示为第一或第二gRNA-CAS-切口酶复合物,其能够在双螺旋DNA的仅一条链上产生缺口。在本发明的这个实施方案中,步骤b)中,加入额外即第三gRNA-CAS复合物,其能够在双螺旋DNA的互补链上产生缺口,大致在第一或第二gRNA-CAS-切口酶复合物产生缺口的互补位置。大致在互补位置产生缺口优选引起核酸样品中的双链(即钝的或交错的)断裂。
作为非限制性示例,例如第三gRNA-CAS-切口酶的前间隔序列优选是互补链中的序列,该序列与第一gRNA-CAS-切口酶复合物靶向的前间隔序列互补,或在互补链上游或下游方向移动约1、2、3、4、5、6、7、8、9、10、15、20、25或30个核苷酸内的序列。例如,在第一gRNA-CAS复合物是gRNA-CAS-切口酶复合物的情况中,第三gRNA-CAS-切口酶复合物能在步骤b中加入,导致通过所述第一和第三gRNA-CAS-切口酶复合物在感兴趣的序列一侧诱导的双链断裂,其可以是钝端,此时实际相反位置被所述第一和第三复合物形成切口,或可以是交错的,此时被所述第一和第三复合物形成缺口的位置不完全是相反的。同样,除了所述第一和第三gRNA-CAS-切口酶复合物外,使用第二和更多如第四gRNA-CAS-切口酶复合物可产生本发明方法步骤b)所得靶核酸片段的2个钝或交错末端。在一些情况中,例如在后续定向接头连接的情况中,可能需要在本发明方法步骤b所生成靶核酸片段的1个或2个末端处产生交错末端。
本发明的方法的步骤b)可如下进行:将所述至少第一和第二gRNA-CAS复合物与核酸样品一起温育,所用条件和时间适合gRNA-CAS复合物诱导至少一个单链断裂,任选地双链断裂,例如但不限于本文所提供实施例中详述的条件。任选地,所述温育在约10-90℃,优选约37℃进行约1分钟-约18小时,优选约60分钟。
发明人发现由gRNA-CAS切割的靶核酸片段受到保护免于核酸外切酶处理。因此,从核酸切割靶核酸片段后,立即加入核酸外切酶以消化一种或多种非靶核酸。靶核酸片段受到保护免于降解,而未保护片段被降解,引起靶片段富集或复杂性减少。因而,本发明的方法采用去除不需要的(非靶)核酸样品部分的方法,而不是移出感兴趣部分,从而回避了复杂的亲和性选择方案。
核酸外切酶可以是核酸外切酶I、III、V、VII、VIII或相关酶,或其任何组合。核酸外切酶III识别切口并延伸切口到空位,直至形成一段ssDNA。核酸外切酶VII能降解此ssDNA。核酸外切酶I也降解ssDNA。ExoIII和ExoVII是核酸外切酶的优选组合,用于本发明方法步骤c)。
核酸外切酶V能够以3’到5’和5’到3’方向降解ssDNA及dsDNA。因此,在一个优选实施方案中,本发明方法步骤c)的核酸外切酶是能够以3’到5’和5’到3’方向降解ssDNA及dsDNA的核酸外切酶,优选核酸外切酶V。
关于降解非靶序列的更多信息提供于美国专利公开号2014/0134610,其通过引用全文纳入本文以用于所有目的。
另外,核酸内切酶即限制性酶可用于降解未保护片段,与本发明方法步骤c)的核酸外切酶消化一起、之前、之后或其任何组合。本文应理解用于本发明方法的限制性酶优选根据一个或多个感兴趣靶序列选择,所述序列用本发明方法富集,因为一种或多种限制性酶优选不应具有一个或多个感兴趣靶序列内存在的识别位点,但优选应具有剩余核酸样品即一个或多个非靶核酸片段中一个或多个位置处存在的识别位点。在本发明方法步骤c)的核酸外切酶处理之前或甚至步骤b)的切割反应之前,限制性酶消化的益处是这种消化产生片段,如果该片段不受gRNA-CAS复合物保护,则更易由步骤c)的核酸外切酶消化。
实施步骤c)和任选存在的核酸内切酶步骤,所用条件和时间足以使核酸外切酶(和任选存在的核酸内切酶)降解几乎所有未保护片段,例如但不限于本文所提供实施例详述的条件。优选地,以足以使核酸外切酶(和任选存在的核酸内切酶)降解所有未保护的片段的条件和时间实施步骤c)。步骤c)在约10-90℃,优选约37℃,优选进行约1分钟-约12小时,优选30分钟。
在步骤c)后,可以灭活核酸外切酶和任选存在的核酸内切酶,通过例如但不限于至少一种蛋白酶如蛋白酶K处理或者热灭活。这类技术是本领域标准且技术人员直接理解如何灭活核酸外切酶和任选存在的核酸内切酶。优选的灭活步骤是在约50-90℃,优选约75℃的温度加热样品,持续约1–120分钟,优选约10分钟。灭活步骤优选在本发明方法步骤c)与d)之间。
在本发明步骤c)后,富集了一个或多个靶核酸片段的样品可接受纯化步骤如基于AMPure珠的纯化工艺,以去除复合物、酶、游离核苷酸、可能的游离接头和可能的小、非靶核酸片段。靶核酸片段可在纯化后回收,并接受进一步加工和/或分析如单分子测序。
本发明方法还可包含尺寸选择步骤。任选地,尺寸选择步骤在本发明方法步骤b)之前、步骤b)与c)之间或步骤c)之后进行。
靶核酸片段长度可变,但优选至少200、500、1000、3000、5000、7000、10,000、15,000或20,000(多至至少100,000)个碱基长度。长度主要取决于预期用途,在一些最优实施方案中,基于待使用特定测序技术的平均读数长度。
本文中应理解有效量的组分用于本发明方法。例如,步骤b)中加入的至少第一和第二gRNA-CAS复合物以足以诱导样品内一个或多个核酸分子切割的量提供。另外,步骤c)所加入核酸外切酶施用的量足以降解样品或起始材料内至少约75%、80%、85%、90%、95%或100%的非靶核酸片段。
本发明方法可包含一个或多个纯化步骤,优选本文所定义步骤c)之后。任选存在的纯化步骤是蛋白酶K处理。或者或另外,所述纯化可包括下列步骤:
I.使步骤c)后所得的经消化的核酸样品暴露于一个或多个固体支持物,所述支持物特异且有效结合一个或多个靶核酸片段;和任选地,
II.洗涤所述一个或多个固体支持物,并从所述一个或多个固体支持物洗脱靶核酸片段。
所述一个或多个固体支持物可以是但不限于Ampure珠。由于纯化后获得至少一个分离靶核酸片段,本文所定义的方法也可视作从核酸样品分离一个或多个靶核酸片段的方法。
本发明的方法之后可以是测序一个或多个靶核酸片段的步骤。因此,本文所定义方法还可视作测序来自核酸样品的一个或多个靶核酸片段的方法。
任选地,本发明方法还包含扩增步骤。优选地,此扩增在核酸外切酶处理即本文所定义步骤c)后进行。扩增能通过PCR或本领域已知任何扩增方法完成。
本发明的方法也可包括连接一个或多个接头到靶核酸片段的步骤。优选地,这类接头连接在本文所定义步骤c)后进行。这些一个或多个接头可包含功能结构域,优选选自限制性位点结构域、捕获结构域、测序引物结合位点、扩增引物结合位点、检测结构域、条形码序列、转录启动子结构域和PAM序列或其任何组合。条形码可以是但不限于样品条形码或独特的分子标识符(UMI)。
在尤其优选的实施方案中,所述一个或多个接头是测序接头,例如包含的功能结构域允许罗氏454A和454B测序、ILLUMINA
根据接头设计,接头可以是单链、双链、部分双链、Y型、发夹或可环化接头。任选地,能使用一个或多个接头。任选地,能使用一组或多组的2个接头,其中一组的第一接头旨在靶核酸片段5’末端侧连接且组的第二接头旨在靶核酸片段3’末端侧连接。组内第一和第二接头优选各包含相容性引物结合序列,从而接头连接的片段易用相容性引物对扩增或测序。
在一个优选实施方案中,本发明方法没有扩增和/或克隆步骤。减少扩增步骤是有益的,因为表观遗传学信息(例如5-mC、6-mA等)会在扩增子中丧失。进一步扩增能在扩增子中引入变化(如通过扩增期间的错误),从而其核苷酸序列不反映初始样品。类似地,靶区域克隆到另一生物体内通常不维持初始样品核酸中存在的修饰,因此,在优选实施方案中,待富集用于进一步分析的靶序列通常不在本文方法中扩增和/或克隆。
茎环或发夹接头是单链的,但其末端互补,从而接头自身回折以产生双链部分和单链环。茎环接头能连接线性、双链核酸末端。例如,茎环接头连接双链靶核酸片段末端,从而没有末端核苷酸(例如任何空位被填充且连接,分别使用聚合酶和连接酶)时,所得分子缺乏末端核苷酸,而不是在各末端携带单链环。
靶核酸片段能连接可环化接头。此方面中,含靶序列的片段可如下环化:通过相容性结构在片段任一侧自身环化(其可由接头连接或经连接接头的限制性酶消化引起),或通过杂交与所需片段末端互补的选择探针。延伸和最终连接步骤形成了共价闭合的环状,任选地,双链多核苷酸。
本文中应理解核酸样品包含至少一个靶核酸片段。不同的是,核酸样品因而可包含1、2、3、4、5、6、7、8、9、10或更多个靶核酸片段,例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,其中优选样品内的各靶核酸片段具有不同序列。本发明方法可提供来自核酸样品的这些靶核酸片段同步富集。因此任选地,本发明方法步骤b)中,加入多组的至少第一和第二gRNA-CAS复合物以从核酸样品富集、分离或测序多个靶核酸片段。优选地,这些多组的第一和第二gRNA-CAS复合物可包含相同CRISPR核酸酶,但其gRNA不同。例如,对于各靶核酸片段,可使用2个不同gRNA分子,如一个gRNA纳入第一gRNA-CAS复合物,另一gRNA纳入第二gRNA-CAS复合物。对于例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,优选至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多组gRNA分子,优选至少约100、200、300、400、500、600、700、800、900、1000、1500、2000或更多个不同gRNA分子,可用于本发明方法。
任选地,本发明方法是多路的,即同时施用于多个核酸样品,例如用于至少约10、20、30、40、50、60、70、80、90、100、500、1000或更多个核酸样品。所述方法可就多个样品平行实施,其中“平行”在本文中应理解为几乎同时,但各样品在单独反应管或容器中处理。另外或替代地,本发明方法的一个或多个步骤可在合并样品上进行。为追溯富集、分离和/或测序片段到初始样品,片段可用标识符作标签,然后合并样品。这类标识符能是任何可检测实体,例如但不限于放射性或荧光标记,但优选是特定核苷酸序列或核苷酸序列组合,优选具有定义长度。另外或替代地,样品能用聪明的混同策略合并,例如但不限于2D和3D合并策略,从而合并后,各样品分别包含于至少2或3个池。特定靶片段能追溯到初始样品,使用含有特定富集、分离和/或测序靶片段的各池坐标。
本发明方法的核酸样品可来自任何来源,如人、动物、植物、微生物,且可以是任何种类,如细胞内源或外源,例如基因组DNA、染色体DNA、人工染色体、质粒DNA或游离型DNA、cDNA、RNA、线粒体、或人工文库如BAC或YAC等。DNA可以是核或细胞器DNA。DNA优选是染色体DNA,优选细胞内源。
另一方面,本发明提供用于上文所定义的方法的成套试剂盒。优选地,所述试剂盒包含至少以下之一:
-一个或多个小瓶,包含本文所定义的至少第一和第二gRNA-CAS复合物;
-一个或多个小瓶,包含至少第一和第二gRNA,用于复合CRISPR-CAS蛋白形成gRNA-CAS复合物,以及包含所述CRISPR-CAS蛋白的另一小瓶;
-另一小瓶,包含一种或多种核酸外切酶以降解非靶核酸;和
-任选存在的小瓶,包含一种或多种限制性酶以降解非靶核酸。
任选地,试剂盒还包含一个或多个本文所定义接头,有一个或多个上文所示小瓶或在单独小瓶中。试剂盒优选包含至少2、4、10、20、30或50个小瓶,含有本文所定义一种或多种gRNA。试剂盒内任何小瓶的体积优选不超过100mL、50mL、20mL、10mL、5mL、4mL、3mL、2mL或1mL。
试剂可以冻干形式存在,或溶于适当缓冲液。试剂盒还可包含完成本发明所需的任何其他组分,如缓冲液、吸量管、微量滴定板和书面说明。用于本发明的试剂盒的这类其他组分是技术人员已知的。
最后,提供本文所定义的至少第一和第二gRNA-CAS复合物或成套试剂盒用于从核酸样品富集至少一个靶核酸片段的用途。更具体地,提供所述至少第一和第二gRNA-CAS复合物用于保护靶核酸片段免于核酸外切酶降解的用途。
附图说明
图1:λDNA中的PciI限制性核酸内切酶识别位点和Cas9 sgRNA位置。指示片段尺寸以及用Cas9靶向的片段。
图2:经消化的DNA样品的电泳分析。A)PciI消化的λDNA,没有Cas9靶向和保护。B)PciI消化的λDNA,有Cas9靶向和保护。
图3:FEMTO脉冲(Advanced Analytical)分析经消化的甜瓜DNA,使用靶向423个基因组基因座的Cas9,每个基因座具有5.1-5.6kbp的尺寸,池为1406sgRNA。在靶基因座侧翼序列中设计sgRNA。实际靶向区域的总长是~5.5kbp。可见大小为~6.4kbp的清晰峰值。所量的(sized)长度的差异正常,这归因于量度(sizing)的不准确。左侧第一泳道是经消化的甜瓜DNA,第二泳道是标记。
图4:FEMTO脉冲(Advanced Analytical)分析选定尺寸的DNA。从图3所示样品可见,片段选择范围是2.5kbp–10kbp,使用Sage Science BluePippin。左侧第一泳道是经消化且选定尺寸的DNA,第二泳道是标记。
图5:甜瓜(Melon Vedrantais)基因组区域的IGV可视化,将在富集操作后获得的读取进行作图到所述区域。灰盒描述就2个靶基因座而言的相对读数覆盖范围(上部),下面显示作图的读数。靶向基因座指示为作图读数下的黑条。在这些黑条下方,用于这些基因座的所用sgRNA位置以黑线指示。显示的是,富集的读取在选定sgRNA位置开始且完全涵盖靶向基因座。
实施例
材料与方法
共3μgλDNA(SEQ ID NO:5、GenBank登录号J02459.1)(10μl 300ng/μl)用限制性核酸内切酶PciI(新英格兰生物实验室(New England Biolabs))消化,通过加入下列组分、2μl 10x NEB 3.1缓冲液(新英格兰生物实验室)、3μl PciI核酸内切酶(10U/μl)和5μl无核酸酶水进行。所得20μl反应混合物在37℃温育1小时,之后酶通过80℃温育20分钟灭活。λDNA中2个PciI识别位点的概览如图1所示。
PciI限制性酶切的λDNA中的2个特定位点用Cas9和2个为这些靶向位点设计的sgRNA来靶向。第一sgRNA(sgRNA 9)具有SEQ ID NO:13并靶向具有SEQ ID NO:14的前间隔序列。第二sgRNA(sgRNA13)具有SEQ ID NO:15并靶向具有SEQ ID NO:16的前间隔序列。反应条件是:20μl PciI限制性酶切的λDNA(见上)、1μl 10x NEB 3.1缓冲液、3μl 0.3μMsgRNA9、3μl 0.3μM sgRNA13、1.8μl Cas9蛋白(新英格兰生物实验室)和1.2μl无核酸酶水。30μl反应混合物在37℃温育1小时。
未保护片段通过用核酸外切酶V温育来去除。为此,向12.5μl Cas9反应物加入下列组分:1.75μl 10x NEB 3.1缓冲液、3.0μl 10mM ATP(新英格兰生物实验室)、1.0μl 10U/μl ExoV核酸外切酶(新英格兰生物实验室)和11.75μl无核酸酶水。所得30μl反应混合物在37℃温育30分钟。蛋白通过75℃温育10分钟灭活。
进行下列对照反应:
1.仅限制性酶切λDNA。为此,仅实施上述PciI限制性反应。
2.将PciI限制性酶切的λDNA与核酸外切酶V温育。为此,PciI限制性酶切λDNA后,加入下列组分:1.0μl 10x NEB 3.1缓冲液、3.0μl 10mM ATP、1.0μl 10U/μl ExoV核酸外切酶和5.0μl无核酸酶水。30.0μl反应混合物在37℃温育30分钟。核酸外切酶通过75℃温育10分钟灭活。
所有样品用Ampure XP溶液(贝克曼库尔特(Beckman Coultier),美国加利福尼亚布州布雷亚)纯化,珠与样品之比为0.8x。结合后,珠用70%乙醇洗2次,结合的DNA在10μl无核酸酶水洗脱。
洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。
结果
FEMTO脉冲分析结果如图2所示:简言之;
·用PciI限制性酶消化的λDNA显示以下长度的预期片段:~600bp(SEQ ID NO:6)–~9,000bp(SEQ ID NO:8)–~40,000bp(SEQ ID NO:7)
·用PciI限制性酶消化且后续用ExoV核酸外切酶温育的Lambda DNA没有显示剩余片段,表明缺乏核酸外切酶保护
·用PciI限制性酶消化并用带sgRNA9和13的Cas9靶向的λDNA显示以下长度的预期片段:~600bp(SEQ ID NO:6)–~9,000bp(2x)(SEQ ID NO:11和12)–~10,000bp(SEQ IDNO:10)–~20,000bp(SEQ ID NO:9)。SEQ ID NO:9的最后的(3’)~500bp如SEQ ID NO:17所示且SEQ ID NO:11的最初的(5’)~500bp如SEQ ID NO:18所示。SEQ ID NO:10在其5’末端包含SEQ ID NO:14的前间隔序列的部分且在其3’末端包含SEQ ID NO:16的前间隔序列的部分。
·用PciI限制性酶消化并用具有sgRNA9和13的Cas9靶向且后续用ExoV核酸外切酶温育的λDNA意外显示长度~10,000bp的片段(SEQ ID NO:10)。
结论
CRISPR系统核酸酶复合物能够保护DNA免于核酸外切酶降解。
材料、方法与结果
为研究对作物DNA的方法,sgRNA设计成靶向甜瓜(Melon Vedrantais)基因组DNA中的423个基因座,这些靶标各具有5.1-5.9kbp长度。对于各靶标,一对至少2个sgRNA设计成靶向各靶标侧翼500bp的上游和下游区域,其中各sgRNA包含20nt长的引导序列,其在基因组内独特。
总共48个反应,各包含9μl 115.6ng/μl(=~1μg)甜瓜DNA,总体积为25μl,由以下组成:2.5μl 10x NEB 3.1缓冲液(新英格兰生物实验室公司(New England BiolabsInc.))、0.18μl 16.58μM sgRNA混合物、0.15μl 20μM酿脓链球菌(S.pyrogenes)Cas9核酸酶(新英格兰生物实验室公司)和13.17μl无核酸酶水。
反应混合物(16μl)在室温预温育10分钟,然后加入甜瓜DNA(9μl)。25μl反应在37℃温育1小时。未保护片段通过用核酸外切酶V温育来移出。对此,平分25μl Cas9反应,向各12.5μl加入下列组分、2μl 10x NEB 3.1缓冲液、2.0μl 50mM ATP(新英格兰生物实验室公司)、2.5μl 10U/μl核酸外切酶V核酸外切酶(新英格兰生物实验室公司)和1μl无核酸酶水。所得20μl反应混合物在37℃温育60分钟。蛋白通过70℃温育30分钟灭活。
为水解肽键,向20μl反应混合物加入1μl 20mg/ml蛋白酶K(罗氏)并室温温育10分钟。
所有样品用Ampure PB珠溶液(太平洋生物科学公司)纯化,珠与样品之比为0.45x。合并所有96个反应的反应混合物。结合磁体后,珠用70%乙醇洗2次。珠干燥1分钟且结合的DNA在50μl无核酸酶水中洗脱。
洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。结果如图3所示。
使用BluePippin(Sage Science)对洗脱的DNA进行尺寸选定(2.5kbp–10kbp)。作为分离基质,采用BluePippin无染料0.75%琼脂胶盒。特定大小的产物用QIAquick PCR纯化试剂盒(凯杰(Qiagen))纯化。纯化的DNA在10μl无核酸酶水中洗脱。洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。结果如图4所示。
洗脱的DNA用于测序文库制备,用于牛津纳米孔(Oxford Nanopore)MinION系统测序。文库制备和测序根据厂商说明书实施。
所得的序列读取用厂商设置进行质量过滤,通过的读数针对甜瓜全基因组参考序列作图。为将读取作图,使用标准设置的minimap2.11-r797。从作图的读取,仅有单一作图位置的那些用于进一步分析。所得的作图的读取用IGV软件(博德研究所(BroadInstitute))呈现。图5提供此图用于基因组内分开约47kbp的2个靶。在可视化呈现中,还描绘所靶向的基因座和用于靶向基因座的sgRNA的位置。
结论
CRISPR系统核酸酶复合物能够保护DNA免于核酸外切酶降解,导致所靶向的感兴趣的区域的DNA富集。
序列表
<110> 主基因有限公司
<120> 通过核酸内切酶保护的靶向富集
<130> p6080445pct
<150> 18208936.7
<151> 2018-11-28
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> artificial sequence
<220>
<223> Cas9
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 4104
<212> DNA
<213> artificial sequence
<220>
<223> sequence encoding Cas9
<400> 2
atggataaaa aatatagcat tggtctggat attggtacca atagcgttgg ttgggcagtt 60
attaccgatg aatataaagt tccgagcaaa aaatttaaag ttctgggtaa taccgatcgt 120
catagcatta aaaaaaatct gattggtgca ctgctgtttg atagcggtga aaccgcagaa 180
gcaacccgtc tgaaacgtac cgcacgtcgt cgttataccc gtcgtaaaaa tcgtatttgt 240
tatctgcagg aaatttttag caatgaaatg gcaaaagttg atgatagctt ttttcatcgt 300
ctggaagaaa gctttctggt tgaagaagat aaaaaacatg aacgtcatcc gatttttggt 360
aatattgttg atgaagttgc atatcatgaa aaatatccga ccatttatca tctgcgtaaa 420
aaactggttg atagcaccga taaagcagat ctgcgtctga tttatctggc actggcacat 480
atgattaaat ttcgtggtca ttttctgatt gaaggtgatc tgaatccgga taatagcgat 540
gttgataaac tgtttattca gctggttcag acctataatc agctgtttga agaaaatccg 600
attaatgcaa gcggtgttga tgcaaaagca attctgagcg cacgtctgag caaaagccgt 660
cgtctggaaa atctgattgc acagctgccg ggtgaaaaaa aaaatggtct gtttggtaat 720
ctgattgcac tgagcctggg tctgaccccg aattttaaaa gcaattttga tctggcagaa 780
gatgcaaaac tgcagctgag caaagatacc tatgatgatg atctggataa tctgctggca 840
cagattggtg atcagtatgc agatctgttt ctggcagcaa aaaatctgag cgatgcaatt 900
ctgctgagcg atattctgcg tgttaatacc gaaattacca aagcaccgct gagcgcaagc 960
atgattaaac gttatgatga acatcatcag gatctgaccc tgctgaaagc actggttcgt 1020
cagcagctgc cggaaaaata taaagaaatt ttttttgatc agagcaaaaa tggttatgca 1080
ggttatattg atggtggtgc aagccaggaa gaattttata aatttattaa accgattctg 1140
gaaaaaatgg atggtaccga agaactgctg gttaaactga atcgtgaaga tctgctgcgt 1200
aaacagcgta cctttgataa tggtagcatt ccgcatcaga ttcatctggg tgaactgcat 1260
gcaattctgc gtcgtcagga agatttttat ccgtttctga aagataatcg tgaaaaaatt 1320
gaaaaaattc tgacctttcg tattccgtat tatgttggtc cgctggcacg tggtaatagc 1380
cgttttgcat ggatgacccg taaaagcgaa gaaaccatta ccccgtggaa ttttgaagaa 1440
gttgttgata aaggtgcaag cgcacagagc tttattgaac gtatgaccaa ttttgataaa 1500
aatctgccga atgaaaaagt tctgccgaaa catagcctgc tgtatgaata ttttaccgtt 1560
tataatgaac tgaccaaagt taaatatgtt accgaaggta tgcgtaaacc ggcatttctg 1620
agcggtgaac agaaaaaagc aattgttgat ctgctgttta aaaccaatcg taaagttacc 1680
gttaaacagc tgaaagaaga ttattttaaa aaaattgaat gttttgatag cgttgaaatt 1740
agcggtgttg aagatcgttt taatgcaagc ctgggtacct atcatgatct gctgaaaatt 1800
attaaagata aagattttct ggataatgaa gaaaatgaag atattctgga agatattgtt 1860
ctgaccctga ccctgtttga agatcgtgaa atgattgaag aacgtctgaa aacctatgca 1920
catctgtttg atgataaagt tatgaaacag ctgaaacgtc gtcgttatac cggttggggt 1980
cgtctgagcc gtaaactgat taatggtatt cgtgataaac agagcggtaa aaccattctg 2040
gattttctga aaagcgatgg ttttgcaaat cgtaatttta tgcagctgat tcatgatgat 2100
agcctgacct ttaaagaaga tattcagaaa gcacaggtta gcggtcaggg tgatagcctg 2160
catgaacata ttgcaaatct ggcaggtagc ccggcaatta aaaaaggtat tctgcagacc 2220
gttaaagttg ttgatgaact ggttaaagtt atgggtcgtc ataaaccgga aaatattgtt 2280
attgaaatgg cacgtgaaaa tcagaccacc cagaaaggtc agaaaaatag ccgtgaacgt 2340
atgaaacgta ttgaagaagg tattaaagaa ctgggtagcc agattctgaa agaacatccg 2400
gttgaaaata cccagctgca gaatgaaaaa ctgtatctgt attatctgca gaatggtcgt 2460
gatatgtatg ttgatcagga actggatatt aatcgtctga gcgattatga tgttgatcat 2520
attgttccgc agagctttct gaaagatgat agcattgata ataaagttct gacccgtagc 2580
gataaaaatc gtggtaaaag cgataatgtt ccgagcgaag aagttgttaa aaaaatgaaa 2640
aattattggc gtcagctgct gaatgcaaaa ctgattaccc agcgtaaatt tgataatctg 2700
accaaagcag aacgtggtgg tctgagcgaa ctggataaag caggttttat taaacgtcag 2760
ctggttgaaa cccgtcagat taccaaacat gttgcacaga ttctggatag ccgtatgaat 2820
accaaatatg atgaaaatga taaactgatt cgtgaagtta aagttattac cctgaaaagc 2880
aaactggtta gcgattttcg taaagatttt cagttttata aagttcgtga aattaataat 2940
tatcatcatg cacatgatgc atatctgaat gcagttgttg gtaccgcact gattaaaaaa 3000
tatccgaaac tggaaagcga atttgtttat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcaa aaagcgaaca ggaaattggt aaagcaaccg caaaatattt tttttatagc 3120
aatattatga atttttttaa aaccgaaatt accctggcaa atggtgaaat tcgtaaacgt 3180
ccgctgattg aaaccaatgg tgaaaccggt gaaattgttt gggataaagg tcgtgatttt 3240
gcaaccgttc gtaaagttct gagcatgccg caggttaata ttgttaaaaa aaccgaagtt 3300
cagaccggtg gttttagcaa agaaagcatt ctgccgaaac gtaatagcga taaactgatt 3360
gcacgtaaaa aagattggga tccgaaaaaa tatggtggtt ttgatagccc gaccgttgca 3420
tatagcgttc tggttgttgc aaaagttgaa aaaggtaaaa gcaaaaaact gaaaagcgtt 3480
aaagaactgc tgggtattac cattatggaa cgtagcagct ttgaaaaaaa tccgattgat 3540
tttctggaag caaaaggtta taaagaagtt aaaaaagatc tgattattaa actgccgaaa 3600
tatagcctgt ttgaactgga aaatggtcgt aaacgtatgc tggcaagcgc aggtgaactg 3660
cagaaaggta atgaactggc actgccgagc aaatatgtta attttctgta tctggcaagc 3720
cattatgaaa aactgaaagg tagcccggaa gataatgaac agaaacagct gtttgttgaa 3780
cagcataaac attatctgga tgaaattatt gaacagatta gcgaatttag caaacgtgtt 3840
attctggcag atgcaaatct ggataaagtt ctgagcgcat ataataaaca tcgtgataaa 3900
ccgattcgtg aacaggcaga aaatattatt catctgttta ccctgaccaa tctgggtgca 3960
ccggcagcat ttaaatattt tgataccacc attgatcgta aacgttatac cagcaccaaa 4020
gaagttctgg atgcaaccct gattcatcag agcattaccg gtctgtatga aacccgtatt 4080
gatctgagcc agctgggtgg tgat 4104
<210> 3
<211> 1300
<212> PRT
<213> artificial sequence
<220>
<223> FnCpfI
<400> 3
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 4
<211> 3900
<212> DNA
<213> artificial sequence
<220>
<223> sequence encoding FnCpfI
<400> 4
atgagcattt atcaggaatt tgttaataaa tatagcctga gcaaaaccct gcgttttgaa 60
ctgattccgc agggtaaaac cctggaaaat attaaagcac gtggtctgat tctggatgat 120
gaaaaacgtg caaaagatta taaaaaagca aaacagatta ttgataaata tcatcagttt 180
tttattgaag aaattctgag cagcgtttgt attagcgaag atctgctgca gaattatagc 240
gatgtttatt ttaaactgaa aaaaagcgat gatgataatc tgcagaaaga ttttaaaagc 300
gcaaaagata ccattaaaaa acagattagc gaatatatta aagatagcga aaaatttaaa 360
aatctgttta atcagaatct gattgatgca aaaaaaggtc aggaaagcga tctgattctg 420
tggctgaaac agagcaaaga taatggtatt gaactgttta aagcaaatag cgatattacc 480
gatattgatg aagcactgga aattattaaa agctttaaag gttggaccac ctattttaaa 540
ggttttcatg aaaatcgtaa aaatgtttat agcagcaatg atattccgac cagcattatt 600
tatcgtattg ttgatgataa tctgccgaaa tttctggaaa ataaagcaaa atatgaaagc 660
ctgaaagata aagcaccgga agcaattaat tatgaacaga ttaaaaaaga tctggcagaa 720
gaactgacct ttgatattga ttataaaacc agcgaagtta atcagcgtgt ttttagcctg 780
gatgaagttt ttgaaattgc aaattttaat aattatctga atcagagcgg tattaccaaa 840
tttaatacca ttattggtgg taaatttgtt aatggtgaaa ataccaaacg taaaggtatt 900
aatgaatata ttaatctgta tagccagcag attaatgata aaaccctgaa aaaatataaa 960
atgagcgttc tgtttaaaca gattctgagc gataccgaaa gcaaaagctt tgttattgat 1020
aaactggaag atgatagcga tgttgttacc accatgcaga gcttttatga acagattgca 1080
gcatttaaaa ccgttgaaga aaaaagcatt aaagaaaccc tgagcctgct gtttgatgat 1140
ctgaaagcac agaaactgga tctgagcaaa atttatttta aaaatgataa aagcctgacc 1200
gatctgagcc agcaggtttt tgatgattat agcgttattg gtaccgcagt tctggaatat 1260
attacccagc agattgcacc gaaaaatctg gataatccga gcaaaaaaga acaggaactg 1320
attgcaaaaa aaaccgaaaa agcaaaatat ctgagcctgg aaaccattaa actggcactg 1380
gaagaattta ataaacatcg tgatattgat aaacagtgtc gttttgaaga aattctggca 1440
aattttgcag caattccgat gatttttgat gaaattgcac agaataaaga taatctggca 1500
cagattagca ttaaatatca gaatcagggt aaaaaagatc tgctgcaggc aagcgcagaa 1560
gatgatgtta aagcaattaa agatctgctg gatcagacca ataatctgct gcataaactg 1620
aaaatttttc atattagcca gagcgaagat aaagcaaata ttctggataa agatgaacat 1680
ttttatctgg tttttgaaga atgttatttt gaactggcaa atattgttcc gctgtataat 1740
aaaattcgta attatattac ccagaaaccg tatagcgatg aaaaatttaa actgaatttt 1800
gaaaatagca ccctggcaaa tggttgggat aaaaataaag aaccggataa taccgcaatt 1860
ctgtttatta aagatgataa atattatctg ggtgttatga ataaaaaaaa taataaaatt 1920
tttgatgata aagcaattaa agaaaataaa ggtgaaggtt ataaaaaaat tgtttataaa 1980
ctgctgccgg gtgcaaataa aatgctgccg aaagtttttt ttagcgcaaa aagcattaaa 2040
ttttataatc cgagcgaaga tattctgcgt attcgtaatc atagcaccca taccaaaaat 2100
ggtagcccgc agaaaggtta tgaaaaattt gaatttaata ttgaagattg tcgtaaattt 2160
attgattttt ataaacagag cattagcaaa catccggaat ggaaagattt tggttttcgt 2220
tttagcgata cccagcgtta taatagcatt gatgaatttt atcgtgaagt tgaaaatcag 2280
ggttataaac tgacctttga aaatattagc gaaagctata ttgatagcgt tgttaatcag 2340
ggtaaactgt atctgtttca gatttataat aaagatttta gcgcatatag caaaggtcgt 2400
ccgaatctgc ataccctgta ttggaaagca ctgtttgatg aacgtaatct gcaggatgtt 2460
gtttataaac tgaatggtga agcagaactg ttttatcgta aacagagcat tccgaaaaaa 2520
attacccatc cggcaaaaga agcaattgca aataaaaata aagataatcc gaaaaaagaa 2580
agcgtttttg aatatgatct gattaaagat aaacgtttta ccgaagataa attttttttt 2640
cattgtccga ttaccattaa ttttaaaagc agcggtgcaa ataaatttaa tgatgaaatt 2700
aatctgctgc tgaaagaaaa agcaaatgat gttcatattc tgagcattga tcgtggtgaa 2760
cgtcatctgg catattatac cctggttgat ggtaaaggta atattattaa acaggatacc 2820
tttaatatta ttggtaatga tcgtatgaaa accaattatc atgataaact ggcagcaatt 2880
gaaaaagatc gtgatagcgc acgtaaagat tggaaaaaaa ttaataatat taaagaaatg 2940
aaagaaggtt atctgagcca ggttgttcat gaaattgcaa aactggttat tgaatataat 3000
gcaattgttg tttttgaaga tctgaatttt ggttttaaac gtggtcgttt taaagttgaa 3060
aaacaggttt atcagaaact ggaaaaaatg ctgattgaaa aactgaatta tctggttttt 3120
aaagataatg aatttgataa aaccggtggt gttctgcgtg catatcagct gaccgcaccg 3180
tttgaaacct ttaaaaaaat gggtaaacag accggtatta tttattatgt tccggcaggt 3240
tttaccagca aaatttgtcc ggttaccggt tttgttaatc agctgtatcc gaaatatgaa 3300
agcgttagca aaagccagga attttttagc aaatttgata aaatttgtta taatctggat 3360
aaaggttatt ttgaatttag ctttgattat aaaaattttg gtgataaagc agcaaaaggt 3420
aaatggacca ttgcaagctt tggtagccgt ctgattaatt ttcgtaatag cgataaaaat 3480
cataattggg atacccgtga agtttatccg accaaagaac tggaaaaact gctgaaagat 3540
tatagcattg aatatggtca tggtgaatgt attaaagcag caatttgtgg tgaaagcgat 3600
aaaaaatttt ttgcaaaact gaccagcgtt ctgaatacca ttctgcagat gcgtaatagc 3660
aaaaccggta ccgaactgga ttatctgatt agcccggttg cagatgttaa tggtaatttt 3720
tttgatagcc gtcaggcacc gaaaaatatg ccgcaggatg cagatgcaaa tggtgcatat 3780
catattggtc tgaaaggtct gatgctgctg ggtcgtatta aaaataatca ggaaggtaaa 3840
aaactgaatc tggttattaa aaatgaagaa tattttgaat ttgttcagaa tcgtaataat 3900
<210> 5
<211> 48502
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 5
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660
agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720
cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780
ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840
ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900
tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960
aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020
ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080
gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140
cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200
caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260
atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320
cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380
agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440
gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500
cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560
aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620
atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680
ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740
tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800
cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860
attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920
tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980
accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040
ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100
gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160
tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220
gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280
agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340
acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400
agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460
gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520
gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580
ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640
acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700
ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760
gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820
tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880
acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940
cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000
ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060
ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120
tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180
aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240
atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300
acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360
cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420
aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480
ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540
gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600
gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660
gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720
ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780
gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840
ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900
cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960
aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020
tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080
ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140
caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200
gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260
gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320
gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380
gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440
cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500
ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560
cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620
cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680
cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740
cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800
cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860
ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920
tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980
catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040
aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100
ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160
gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220
gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280
tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340
aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400
tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460
gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520
ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580
gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640
tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700
tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760
aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820
cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880
taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940
tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000
tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060
ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120
tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180
aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240
cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300
cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360
gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420
aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480
tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540
ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600
gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660
ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720
atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780
agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840
gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900
agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960
acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020
aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080
gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140
tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200
catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260
tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320
gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380
gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440
tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500
ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560
agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620
ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680
ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740
gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800
tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860
ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920
tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980
ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280
agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340
gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400
aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460
ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520
tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580
actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640
ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700
cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760
tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820
cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880
gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940
aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000
ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060
ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120
acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180
ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240
tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300
cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360
tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420
gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480
ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540
gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600
tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660
ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720
aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780
agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840
accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900
tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960
ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020
tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080
acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140
cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200
atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260
gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320
ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380
agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440
cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500
gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560
atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620
ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680
cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740
ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800
aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860
tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920
cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980
ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040
tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100
cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160
agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220
tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460
ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520
aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580
ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640
ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700
agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760
ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820
aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880
atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940
aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000
agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060
gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120
ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180
acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240
agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300
aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360
cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420
ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480
gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540
cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600
tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660
ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720
ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780
cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840
gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900
cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960
tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020
atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080
tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140
ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200
tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260
ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320
gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380
tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440
cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500
gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560
aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620
ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680
tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740
cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800
gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860
gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920
ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980
agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040
tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100
ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160
cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220
gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020
tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080
gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140
cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200
cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260
gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320
tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380
taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440
aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500
cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560
cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620
gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680
acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740
ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800
tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860
acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920
gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980
aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040
ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100
cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160
ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220
agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280
ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340
aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400
cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460
ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520
gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580
cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640
aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700
tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760
acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820
cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880
gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940
agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000
cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060
gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120
tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180
aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240
ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300
ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360
gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420
gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480
tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540
ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600
aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660
tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720
gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780
tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840
ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900
cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960
gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020
ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080
ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140
gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200
tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260
tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320
gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380
atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440
acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500
gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560
ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620
gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680
atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740
aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800
tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860
ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920
atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980
ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040
gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100
taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160
gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220
attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280
aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340
atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400
attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460
acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520
tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580
tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640
tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700
tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760
tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820
ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880
aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940
tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000
aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060
cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120
ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180
aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240
ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300
ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360
ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420
accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480
gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540
ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600
gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660
atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720
ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780
gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840
ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900
agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960
tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020
caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080
tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140
ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200
ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260
ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320
catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380
gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440
aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500
aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560
taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620
gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680
ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740
gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800
atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860
aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920
tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980
tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040
gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100
aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160
tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220
aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280
tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340
tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400
atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460
gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520
atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580
ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640
ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700
gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760
tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820
gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880
atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940
cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000
accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060
gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120
tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180
tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240
aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300
ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360
ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420
cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480
gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540
aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600
ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720
tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780
gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840
tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900
gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960
gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020
accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080
cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140
tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200
atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260
caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320
ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380
tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440
tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500
gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560
ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620
ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680
ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740
cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800
ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860
catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920
tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980
ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040
cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100
gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160
gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220
ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280
tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340
cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400
agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460
tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520
gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580
agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640
ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700
gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760
catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820
aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880
atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940
tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000
tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060
aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120
tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180
agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240
ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300
accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360
gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420
gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480
gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540
ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600
tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660
cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720
cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780
cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840
atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900
gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960
acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020
tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080
gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140
aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200
cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260
cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320
ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380
ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440
catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500
gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560
ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620
ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680
gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740
ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800
tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860
ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920
ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980
agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040
tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100
tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160
tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220
accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280
cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340
atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400
ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460
atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520
aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580
accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640
ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700
cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760
ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820
cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880
ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940
tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000
ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060
gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120
tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180
agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240
agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300
agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360
cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420
aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480
tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540
cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600
ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660
cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720
gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780
cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840
cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900
acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960
tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020
actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080
ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140
tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200
cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260
ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320
gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380
cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440
ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500
atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560
tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620
atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680
tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740
taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800
aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860
caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920
cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980
ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040
ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100
ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160
atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220
cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280
ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340
cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400
ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460
cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520
ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580
atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640
cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700
ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760
atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820
cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880
tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940
aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000
caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060
ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120
acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180
ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240
gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300
ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360
ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420
aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480
gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540
gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600
cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660
tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720
cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780
tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840
atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900
tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960
ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020
ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080
tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140
tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200
atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260
ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320
agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380
cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440
attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500
tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560
gcatcacctt tggtaaaggt tctaagctca ggtgagaaca tccctgcctg aacatgagaa 37620
aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680
tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740
gcaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800
cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860
ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920
ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980
gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040
atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100
aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160
tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220
aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280
atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340
tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400
gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460
cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520
gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580
tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640
gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700
aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760
gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820
accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880
ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940
tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000
tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060
aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120
acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180
tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240
ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300
aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360
ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420
tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480
acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540
ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600
agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660
acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720
tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780
gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840
caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900
ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960
ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020
cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080
atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140
cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200
gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260
gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320
taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380
tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440
aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500
ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560
taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620
tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680
atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740
tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800
taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860
agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920
gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980
tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040
tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100
ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160
taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220
tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280
cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340
aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400
cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460
tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520
aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580
cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640
catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700
attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760
aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820
ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880
cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940
ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000
ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060
ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120
taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180
tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240
ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300
aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360
tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420
ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480
ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540
cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600
gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660
gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720
gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780
accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840
gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900
gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960
ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020
atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080
agcatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140
aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200
tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260
gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320
atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380
gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440
gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500
ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560
aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620
aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680
ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740
tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800
tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860
tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920
aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980
tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040
ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100
atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160
ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220
gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280
aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340
ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400
ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460
caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520
ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580
tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640
ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700
cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760
aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820
aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880
ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940
cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000
cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060
gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120
tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180
aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240
aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300
gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tggttcattc 45360
gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420
tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480
ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540
tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600
gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660
ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720
taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780
cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840
atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900
cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960
gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020
tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080
aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140
gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200
atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260
gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320
tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380
aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440
gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500
gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560
aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620
agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680
aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740
catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800
aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860
tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920
ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980
tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040
tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100
caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160
ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220
aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280
cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340
agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400
aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460
ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520
ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580
agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640
agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700
aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760
tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820
ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880
aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940
ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000
tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060
aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120
acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180
gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240
catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300
catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360
aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420
gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480
tccggtgatc cgacaggtta cg 48502
<210> 6
<211> 628
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 6
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccga 628
<210> 7
<211> 38767
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 7
catgttgatt tcctgaaacg ggatatcatc aaagccatga acaaagcagc cgcgctggat 60
gaactgatac cggggttgct gagtgaatat atcgaacagt caggttaaca ggctgcggca 120
ttttgtccgc gccgggcttc gctcactgtt caggccggag ccacagaccg ccgttgaatg 180
ggcggatgct aattactatc tcccgaaaga atccgcatac caggaagggc gctgggaaac 240
actgcccttt cagcgggcca tcatgaatgc gatgggcagc gactacatcc gtgaggtgaa 300
tgtggtgaag tctgcccgtg tcggttattc caaaatgctg ctgggtgttt atgcctactt 360
tatagagcat aagcagcgca acacccttat ctggttgccg acggatggtg atgccgagaa 420
ctttatgaaa acccacgttg agccgactat tcgtgatatt ccgtcgctgc tggcgctggc 480
cccgtggtat ggcaaaaagc accgggataa cacgctcacc atgaagcgtt tcactaatgg 540
gcgtggcttc tggtgcctgg gcggtaaagc ggcaaaaaac taccgtgaaa agtcggtgga 600
tgtggcgggt tatgatgaac ttgctgcttt tgatgatgat attgaacagg aaggctctcc 660
gacgttcctg ggtgacaagc gtattgaagg ctcggtctgg ccaaagtcca tccgtggctc 720
cacgccaaaa gtgagaggca cctgtcagat tgagcgtgca gccagtgaat ccccgcattt 780
tatgcgtttt catgttgcct gcccgcattg cggggaggag cagtatctta aatttggcga 840
caaagagacg ccgtttggcc tcaaatggac gccggatgac ccctccagcg tgttttatct 900
ctgcgagcat aatgcctgcg tcatccgcca gcaggagctg gactttactg atgcccgtta 960
tatctgcgaa aagaccggga tctggacccg tgatggcatt ctctggtttt cgtcatccgg 1020
tgaagagatt gagccacctg acagtgtgac ctttcacatc tggacagcgt acagcccgtt 1080
caccacctgg gtgcagattg tcaaagactg gatgaaaacg aaaggggata cgggaaaacg 1140
taaaaccttc gtaaacacca cgctcggtga gacgtgggag gcgaaaattg gcgaacgtcc 1200
ggatgctgaa gtgatggcag agcggaaaga gcattattca gcgcccgttc ctgaccgtgt 1260
ggcttacctg accgccggta tcgactccca gctggaccgc tacgaaatgc gcgtatgggg 1320
atgggggccg ggtgaggaaa gctggctgat tgaccggcag attattatgg gccgccacga 1380
cgatgaacag acgctgctgc gtgtggatga ggccatcaat aaaacctata cccgccggaa 1440
tggtgcagaa atgtcgatat cccgtatctg ctgggatact ggcgggattg acccgaccat 1500
tgtgtatgaa cgctcgaaaa aacatgggct gttccgggtg atccccatta aaggggcatc 1560
cgtctacgga aagccggtgg ccagcatgcc acgtaagcga aacaaaaacg gggtttacct 1620
taccgaaatc ggtacggata ccgcgaaaga gcagatttat aaccgcttca cactgacgcc 1680
ggaaggggat gaaccgcttc ccggtgccgt tcacttcccg aataacccgg atatttttga 1740
tctgaccgaa gcgcagcagc tgactgctga agagcaggtc gaaaaatggg tggatggcag 1800
gaaaaaaata ctgtgggaca gcaaaaagcg acgcaatgag gcactcgact gcttcgttta 1860
tgcgctggcg gcgctgcgca tcagtatttc ccgctggcag ctggatctca gtgcgctgct 1920
ggcgagcctg caggaagagg atggtgcagc aaccaacaag aaaacactgg cagattacgc 1980
ccgtgcctta tccggagagg atgaatgacg cgacaggaag aacttgccgc tgcccgtgcg 2040
gcactgcatg acctgatgac aggtaaacgg gtggcaacag tacagaaaga cggacgaagg 2100
gtggagttta cggccacttc cgtgtctgac ctgaaaaaat atattgcaga gctggaagtg 2160
cagaccggca tgacacagcg acgcagggga cctgcaggat tttatgtatg aaaacgccca 2220
ccattcccac ccttctgggg ccggacggca tgacatcgct gcgcgaatat gccggttatc 2280
acggcggtgg cagcggattt ggagggcagt tgcggtcgtg gaacccaccg agtgaaagtg 2340
tggatgcagc cctgttgccc aactttaccc gtggcaatgc ccgcgcagac gatctggtac 2400
gcaataacgg ctatgccgcc aacgccatcc agctgcatca ggatcatatc gtcgggtctt 2460
ttttccggct cagtcatcgc ccaagctggc gctatctggg catcggggag gaagaagccc 2520
gtgccttttc ccgcgaggtt gaagcggcat ggaaagagtt tgccgaggat gactgctgct 2580
gcattgacgt tgagcgaaaa cgcacgttta ccatgatgat tcgggaaggt gtggccatgc 2640
acgcctttaa cggtgaactg ttcgttcagg ccacctggga taccagttcg tcgcggcttt 2700
tccggacaca gttccggatg gtcagcccga agcgcatcag caacccgaac aataccggcg 2760
acagccggaa ctgccgtgcc ggtgtgcaga ttaatgacag cggtgcggcg ctgggatatt 2820
acgtcagcga ggacgggtat cctggctgga tgccgcagaa atggacatgg ataccccgtg 2880
agttacccgg cgggcgcgcc tcgttcattc acgtttttga acccgtggag gacgggcaga 2940
ctcgcggtgc aaatgtgttt tacagcgtga tggagcagat gaagatgctc gacacgctgc 3000
agaacacgca gctgcagagc gccattgtga aggcgatgta tgccgccacc attgagagtg 3060
agctggatac gcagtcagcg atggatttta ttctgggcgc gaacagtcag gagcagcggg 3120
aaaggctgac cggctggatt ggtgaaattg ccgcgtatta cgccgcagcg ccggtccggc 3180
tgggaggcgc aaaagtaccg cacctgatgc cgggtgactc actgaacctg cagacggctc 3240
aggatacgga taacggctac tccgtgtttg agcagtcact gctgcggtat atcgctgccg 3300
ggctgggtgt ctcgtatgag cagctttccc ggaattacgc ccagatgagc tactccacgg 3360
cacgggccag tgcgaacgag tcgtgggcgt actttatggg gcggcgaaaa ttcgtcgcat 3420
cccgtcaggc gagccagatg tttctgtgct ggctggaaga ggccatcgtt cgccgcgtgg 3480
tgacgttacc ttcaaaagcg cgcttcagtt ttcaggaagc ccgcagtgcc tgggggaact 3540
gcgactggat aggctccggt cgtatggcca tcgatggtct gaaagaagtt caggaagcgg 3600
tgatgctgat agaagccgga ctgagtacct acgagaaaga gtgcgcaaaa cgcggtgacg 3660
actatcagga aatttttgcc cagcaggtcc gtgaaacgat ggagcgccgt gcagccggtc 3720
ttaaaccgcc cgcctgggcg gctgcagcat ttgaatccgg gctgcgacaa tcaacagagg 3780
aggagaagag tgacagcaga gctgcgtaat ctcccgcata ttgccagcat ggcctttaat 3840
gagccgctga tgcttgaacc cgcctatgcg cgggttttct tttgtgcgct tgcaggccag 3900
cttgggatca gcagcctgac ggatgcggtg tccggcgaca gcctgactgc ccaggaggca 3960
ctcgcgacgc tggcattatc cggtgatgat gacggaccac gacaggcccg cagttatcag 4020
gtcatgaacg gcatcgccgt gctgccggtg tccggcacgc tggtcagccg gacgcgggcg 4080
ctgcagccgt actcggggat gaccggttac aacggcatta tcgcccgtct gcaacaggct 4140
gccagcgatc cgatggtgga cggcattctg ctcgatatgg acacgcccgg cgggatggtg 4200
gcgggggcat ttgactgcgc tgacatcatc gcccgtgtgc gtgacataaa accggtatgg 4260
gcgcttgcca acgacatgaa ctgcagtgca ggtcagttgc ttgccagtgc cgcctcccgg 4320
cgtctggtca cgcagaccgc ccggacaggc tccatcggcg tcatgatggc tcacagtaat 4380
tacggtgctg cgctggagaa acagggtgtg gaaatcacgc tgatttacag cggcagccat 4440
aaggtggatg gcaaccccta cagccatctt ccggatgacg tccgggagac actgcagtcc 4500
cggatggacg caacccgcca gatgtttgcg cagaaggtgt cggcatatac cggcctgtcc 4560
gtgcaggttg tgctggatac cgaggctgca gtgtacagcg gtcaggaggc cattgatgcc 4620
ggactggctg atgaacttgt taacagcacc gatgcgatca ccgtcatgcg tgatgcactg 4680
gatgcacgta aatcccgtct ctcaggaggg cgaatgacca aagagactca atcaacaact 4740
gtttcagcca ctgcttcgca ggctgacgtt actgacgtgg tgccagcgac ggagggcgag 4800
aacgccagcg cggcgcagcc ggacgtgaac gcgcagatca ccgcagcggt tgcggcagaa 4860
aacagccgca ttatggggat cctcaactgt gaggaggctc acggacgcga agaacaggca 4920
cgcgtgctgg cagaaacccc cggtatgacc gtgaaaacgg cccgccgcat tctggccgca 4980
gcaccacaga gtgcacaggc gcgcagtgac actgcgctgg atcgtctgat gcagggggca 5040
ccggcaccgc tggctgcagg taacccggca tctgatgccg ttaacgattt gctgaacaca 5100
ccagtgtaag ggatgtttat gacgagcaaa gaaaccttta cccattacca gccgcagggc 5160
aacagtgacc cggctcatac cgcaaccgcg cccggcggat tgagtgcgaa agcgcctgca 5220
atgaccccgc tgatgctgga cacctccagc cgtaagctgg ttgcgtggga tggcaccacc 5280
gacggtgctg ccgttggcat tcttgcggtt gctgctgacc agaccagcac cacgctgacg 5340
ttctacaagt ccggcacgtt ccgttatgag gatgtgctct ggccggaggc tgccagcgac 5400
gagacgaaaa aacggaccgc gtttgccgga acggcaatca gcatcgttta actttaccct 5460
tcatcactaa aggccgcctg tgcggctttt tttacgggat ttttttatgt cgatgtacac 5520
aaccgcccaa ctgctggcgg caaatgagca gaaatttaag tttgatccgc tgtttctgcg 5580
tctctttttc cgtgagagct atcccttcac cacggagaaa gtctatctct cacaaattcc 5640
gggactggta aacatggcgc tgtacgtttc gccgattgtt tccggtgagg ttatccgttc 5700
ccgtggcggc tccacctctg aatttacgcc gggatatgtc aagccgaagc atgaagtgaa 5760
tccgcagatg accctgcgtc gcctgccgga tgaagatccg cagaatctgg cggacccggc 5820
ttaccgccgc cgtcgcatca tcatgcagaa catgcgtgac gaagagctgg ccattgctca 5880
ggtcgaagag atgcaggcag tttctgccgt gcttaagggc aaatacacca tgaccggtga 5940
agccttcgat ccggttgagg tggatatggg ccgcagtgag gagaataaca tcacgcagtc 6000
cggcggcacg gagtggagca agcgtgacaa gtccacgtat gacccgaccg acgatatcga 6060
agcctacgcg ctgaacgcca gcggtgtggt gaatatcatc gtgttcgatc cgaaaggctg 6120
ggcgctgttc cgttccttca aagccgtcaa ggagaagctg gatacccgtc gtggctctaa 6180
ttccgagctg gagacagcgg tgaaagacct gggcaaagcg gtgtcctata aggggatgta 6240
tggcgatgtg gccatcgtcg tgtattccgg acagtacgtg gaaaacggcg tcaaaaagaa 6300
cttcctgccg gacaacacga tggtgctggg gaacactcag gcacgcggtc tgcgcaccta 6360
tggctgcatt caggatgcgg acgcacagcg cgaaggcatt aacgcctctg cccgttaccc 6420
gaaaaactgg gtgaccaccg gcgatccggc gcgtgagttc accatgattc agtcagcacc 6480
gctgatgctg ctggctgacc ctgatgagtt cgtgtccgta caactggcgt aatcatggcc 6540
cttcggggcc attgtttctc tgtggaggag tccatgacga aagatgaact gattgcccgt 6600
ctccgctcgc tgggtgaaca actgaaccgt gatgtcagcc tgacggggac gaaagaagaa 6660
ctggcgctcc gtgtggcaga gctgaaagag gagcttgatg acacggatga aactgccggt 6720
caggacaccc ctctcagccg ggaaaatgtg ctgaccggac atgaaaatga ggtgggatca 6780
gcgcagccgg ataccgtgat tctggatacg tctgaactgg tcacggtcgt ggcactggtg 6840
aagctgcata ctgatgcact tcacgccacg cgggatgaac ctgtggcatt tgtgctgccg 6900
ggaacggcgt ttcgtgtctc tgccggtgtg gcagccgaaa tgacagagcg cggcctggcc 6960
agaatgcaat aacgggaggc gctgtggctg atttcgataa cctgttcgat gctgccattg 7020
cccgcgccga tgaaacgata cgcgggtaca tgggaacgtc agccaccatt acatccggtg 7080
agcagtcagg tgcggtgata cgtggtgttt ttgatgaccc tgaaaatatc agctatgccg 7140
gacagggcgt gcgcgttgaa ggctccagcc cgtccctgtt tgtccggact gatgaggtgc 7200
ggcagctgcg gcgtggagac acgctgacca tcggtgagga aaatttctgg gtagatcggg 7260
tttcgccgga tgatggcgga agttgtcatc tctggcttgg acggggcgta ccgcctgccg 7320
ttaaccgtcg ccgctgaaag ggggatgtat ggccataaaa ggtcttgagc aggccgttga 7380
aaacctcagc cgtatcagca aaacggcggt gcctggtgcc gccgcaatgg ccattaaccg 7440
cgttgcttca tccgcgatat cgcagtcggc gtcacaggtt gcccgtgaga caaaggtacg 7500
ccggaaactg gtaaaggaaa gggccaggct gaaaagggcc acggtcaaaa atccgcaggc 7560
cagaatcaaa gttaaccggg gggatttgcc cgtaatcaag ctgggtaatg cgcgggttgt 7620
cctttcgcgc cgcaggcgtc gtaaaaaggg gcagcgttca tccctgaaag gtggcggcag 7680
cgtgcttgtg gtgggtaacc gtcgtattcc cggcgcgttt attcagcaac tgaaaaatgg 7740
ccggtggcat gtcatgcagc gtgtggctgg gaaaaaccgt taccccattg atgtggtgaa 7800
aatcccgatg gcggtgccgc tgaccacggc gtttaaacaa aatattgagc ggatacggcg 7860
tgaacgtctt ccgaaagagc tgggctatgc gctgcagcat caactgagga tggtaataaa 7920
gcgatgaaac atactgaact ccgtgcagcc gtactggatg cactggagaa gcatgacacc 7980
ggggcgacgt tttttgatgg tcgccccgct gtttttgatg aggcggattt tccggcagtt 8040
gccgtttatc tcaccggcgc tgaatacacg ggcgaagagc tggacagcga tacctggcag 8100
gcggagctgc atatcgaagt tttcctgcct gctcaggtgc cggattcaga gctggatgcg 8160
tggatggagt cccggattta tccggtgatg agcgatatcc cggcactgtc agatttgatc 8220
accagtatgg tggccagcgg ctatgactac cggcgcgacg atgatgcggg cttgtggagt 8280
tcagccgatc tgacttatgt cattacctat gaaatgtgag gacgctatgc ctgtaccaaa 8340
tcctacaatg ccggtgaaag gtgccgggac caccctgtgg gtttataagg ggagcggtga 8400
cccttacgcg aatccgcttt cagacgttga ctggtcgcgt ctggcaaaag ttaaagacct 8460
gacgcccggc gaactgaccg ctgagtccta tgacgacagc tatctcgatg atgaagatgc 8520
agactggact gcgaccgggc aggggcagaa atctgccgga gataccagct tcacgctggc 8580
gtggatgccc ggagagcagg ggcagcaggc gctgctggcg tggtttaatg aaggcgatac 8640
ccgtgcctat aaaatccgct tcccgaacgg cacggtcgat gtgttccgtg gctgggtcag 8700
cagtatcggt aaggcggtga cggcgaagga agtgatcacc cgcacggtga aagtcaccaa 8760
tgtgggacgt ccgtcgatgg cagaagatcg cagcacggta acagcggcaa ccggcatgac 8820
cgtgacgcct gccagcacct cggtggtgaa agggcagagc accacgctga ccgtggcctt 8880
ccagccggag ggcgtaaccg acaagagctt tcgtgcggtg tctgcggata aaacaaaagc 8940
caccgtgtcg gtcagtggta tgaccatcac cgtgaacggc gttgctgcag gcaaggtcaa 9000
cattccggtt gtatccggta atggtgagtt tgctgcggtt gcagaaatta ccgtcaccgc 9060
cagttaatcc ggagagtcag cgatgttcct gaaaaccgaa tcatttgaac ataacggtgt 9120
gaccgtcacg ctttctgaac tgtcagccct gcagcgcatt gagcatctcg ccctgatgaa 9180
acggcaggca gaacaggcgg agtcagacag caaccggaag tttactgtgg aagacgccat 9240
cagaaccggc gcgtttctgg tggcgatgtc cctgtggcat aaccatccgc agaagacgca 9300
gatgccgtcc atgaatgaag ccgttaaaca gattgagcag gaagtgctta ccacctggcc 9360
cacggaggca atttctcatg ctgaaaacgt ggtgtaccgg ctgtctggta tgtatgagtt 9420
tgtggtgaat aatgcccctg aacagacaga ggacgccggg cccgcagagc ctgtttctgc 9480
gggaaagtgt tcgacggtga gctgagtttt gccctgaaac tggcgcgtga gatggggcga 9540
cccgactggc gtgccatgct tgccgggatg tcatccacgg agtatgccga ctggcaccgc 9600
ttttacagta cccattattt tcatgatgtt ctgctggata tgcacttttc cgggctgacg 9660
tacaccgtgc tcagcctgtt tttcagcgat ccggatatgc atccgctgga tttcagtctg 9720
ctgaaccggc gcgaggctga cgaagagcct gaagatgatg tgctgatgca gaaagcggca 9780
gggcttgccg gaggtgtccg ctttggcccg gacgggaatg aagttatccc cgcttccccg 9840
gatgtggcgg acatgacgga ggatgacgta atgctgatga cagtatcaga agggatcgca 9900
ggaggagtcc ggtatggctg aaccggtagg cgatctggtc gttgatttga gtctggatgc 9960
ggccagattt gacgagcaga tggccagagt caggcgtcat ttttctggta cggaaagtga 10020
tgcgaaaaaa acagcggcag tcgttgaaca gtcgctgagc cgacaggcgc tggctgcaca 10080
gaaagcgggg atttccgtcg ggcagtataa agccgccatg cgtatgctgc ctgcacagtt 10140
caccgacgtg gccacgcagc ttgcaggcgg gcaaagtccg tggctgatcc tgctgcaaca 10200
gggggggcag gtgaaggact ccttcggcgg gatgatcccc atgttcaggg ggcttgccgg 10260
tgcgatcacc ctgccgatgg tgggggccac ctcgctggcg gtggcgaccg gtgcgctggc 10320
gtatgcctgg tatcagggca actcaaccct gtccgatttc aacaaaacgc tggtcctttc 10380
cggcaatcag gcgggactga cggcagatcg tatgctggtc ctgtccagag ccgggcaggc 10440
ggcagggctg acgtttaacc agaccagcga gtcactcagc gcactggtta aggcgggggt 10500
aagcggtgag gctcagattg cgtccatcag ccagagtgtg gcgcgtttct cctctgcatc 10560
cggcgtggag gtggacaagg tcgctgaagc cttcgggaag ctgaccacag acccgacgtc 10620
ggggctgacg gcgatggctc gccagttcca taacgtgtcg gcggagcaga ttgcgtatgt 10680
tgctcagttg cagcgttccg gcgatgaagc cggggcattg caggcggcga acgaggccgc 10740
aacgaaaggg tttgatgacc agacccgccg cctgaaagag aacatgggca cgctggagac 10800
ctgggcagac aggactgcgc gggcattcaa atccatgtgg gatgcggtgc tggatattgg 10860
tcgtcctgat accgcgcagg agatgctgat taaggcagag gctgcgtata agaaagcaga 10920
cgacatctgg aatctgcgca aggatgatta ttttgttaac gatgaagcgc gggcgcgtta 10980
ctgggatgat cgtgaaaagg cccgtcttgc gcttgaagcc gcccgaaaga aggctgagca 11040
gcagactcaa caggacaaaa atgcgcagca gcagagcgat accgaagcgt cacggctgaa 11100
atataccgaa gaggcgcaga aggcttacga acggctgcag acgccgctgg agaaatatac 11160
cgcccgtcag gaagaactga acaaggcact gaaagacggg aaaatcctgc aggcggatta 11220
caacacgctg atggcggcgg cgaaaaagga ttatgaagcg acgctgaaaa agccgaaaca 11280
gtccagcgtg aaggtgtctg cgggcgatcg tcaggaagac agtgctcatg ctgccctgct 11340
gacgcttcag gcagaactcc ggacgctgga gaagcatgcc ggagcaaatg agaaaatcag 11400
ccagcagcgc cgggatttgt ggaaggcgga gagtcagttc gcggtactgg aggaggcggc 11460
gcaacgtcgc cagctgtctg cacaggagaa atccctgctg gcgcataaag atgagacgct 11520
ggagtacaaa cgccagctgg ctgcacttgg cgacaaggtt acgtatcagg agcgcctgaa 11580
cgcgctggcg cagcaggcgg ataaattcgc acagcagcaa cgggcaaaac gggccgccat 11640
tgatgcgaaa agccgggggc tgactgaccg gcaggcagaa cgggaagcca cggaacagcg 11700
cctgaaggaa cagtatggcg ataatccgct ggcgctgaat aacgtcatgt cagagcagaa 11760
aaagacctgg gcggctgaag accagcttcg cgggaactgg atggcaggcc tgaagtccgg 11820
ctggagtgag tgggaagaga gcgccacgga cagtatgtcg caggtaaaaa gtgcagccac 11880
gcagaccttt gatggtattg cacagaatat ggcggcgatg ctgaccggca gtgagcagaa 11940
ctggcgcagc ttcacccgtt ccgtgctgtc catgatgaca gaaattctgc ttaagcaggc 12000
aatggtgggg attgtcggga gtatcggcag cgccattggc ggggctgttg gtggcggcgc 12060
atccgcgtca ggcggtacag ccattcaggc cgctgcggcg aaattccatt ttgcaaccgg 12120
aggatttacg ggaaccggcg gcaaatatga gccagcgggg attgttcacc gtggtgagtt 12180
tgtcttcacg aaggaggcaa ccagccggat tggcgtgggg aatctttacc ggctgatgcg 12240
cggctatgcc accggcggtt atgtcggtac accgggcagc atggcagaca gccggtcgca 12300
ggcgtccggg acgtttgagc agaataacca tgtggtgatt aacaacgacg gcacgaacgg 12360
gcagataggt ccggctgctc tgaaggcggt gtatgacatg gcccgcaagg gtgcccgtga 12420
tgaaattcag acacagatgc gtgatggtgg cctgttctcc ggaggtggac gatgaagacc 12480
ttccgctgga aagtgaaacc cggtatggat gtggcttcgg tcccttctgt aagaaaggtg 12540
cgctttggtg atggctattc tcagcgagcg cctgccgggc tgaatgccaa cctgaaaacg 12600
tacagcgtga cgctttctgt cccccgtgag gaggccacgg tactggagtc gtttctggaa 12660
gagcacgggg gctggaaatc ctttctgtgg acgccgcctt atgagtggcg gcagataaag 12720
gtgacctgcg caaaatggtc gtcgcgggtc agtatgctgc gtgttgagtt cagcgcagag 12780
tttgaacagg tggtgaactg atgcaggata tccggcagga aacactgaat gaatgcaccc 12840
gtgcggagca gtcggccagc gtggtgctct gggaaatcga cctgacagag gtcggtggag 12900
aacgttattt tttctgtaat gagcagaacg aaaaaggtga gccggtcacc tggcaggggc 12960
gacagtatca gccgtatccc attcagggga gcggttttga actgaatggc aaaggcacca 13020
gtacgcgccc cacgctgacg gtttctaacc tgtacggtat ggtcaccggg atggcggaag 13080
atatgcagag tctggtcggc ggaacggtgg tccggcgtaa ggtttacgcc cgttttctgg 13140
atgcggtgaa cttcgtcaac ggaaacagtt acgccgatcc ggagcaggag gtgatcagcc 13200
gctggcgcat tgagcagtgc agcgaactga gcgcggtgag tgcctccttt gtactgtcca 13260
cgccgacgga aacggatggc gctgtttttc cgggacgtat catgctggcc aacacctgca 13320
cctggaccta tcgcggtgac gagtgcggtt atagcggtcc ggctgtcgcg gatgaatatg 13380
accagccaac gtccgatatc acgaaggata aatgcagcaa atgcctgagc ggttgtaagt 13440
tccgcaataa cgtcggcaac tttggcggct tcctttccat taacaaactt tcgcagtaaa 13500
tcccatgaca cagacagaat cagcgattct ggcgcacgcc cggcgatgtg cgccagcgga 13560
gtcgtgcggc ttcgtggtaa gcacgccgga gggggaaaga tatttcccct gcgtgaatat 13620
ctccggtgag ccggaggcta tttccgtatg tcgccggaag actggctgca ggcagaaatg 13680
cagggtgaga ttgtggcgct ggtccacagc caccccggtg gtctgccctg gctgagtgag 13740
gccgaccggc ggctgcaggt gcagagtgat ttgccgtggt ggctggtctg ccgggggacg 13800
attcataagt tccgctgtgt gccgcatctc accgggcggc gctttgagca cggtgtgacg 13860
gactgttaca cactgttccg ggatgcttat catctggcgg ggattgagat gccggacttt 13920
catcgtgagg atgactggtg gcgtaacggc cagaatctct atctggataa tctggaggcg 13980
acggggctgt atcaggtgcc gttgtcagcg gcacagccgg gcgatgtgct gctgtgctgt 14040
tttggttcat cagtgccgaa tcacgccgca atttactgcg gcgacggcga gctgctgcac 14100
catattcctg aacaactgag caaacgagag aggtacaccg acaaatggca gcgacgcaca 14160
cactccctct ggcgtcaccg ggcatggcgc gcatctgcct ttacggggat ttacaacgat 14220
ttggtcgccg catcgacctt cgtgtgaaaa cgggggctga agccatccgg gcactggcca 14280
cacagctccc ggcgtttcgt cagaaactga gcgacggctg gtatcaggta cggattgccg 14340
ggcgggacgt cagcacgtcc gggttaacgg cgcagttaca tgagactctg cctgatggcg 14400
ctgtaattca tattgttccc agagtcgccg gggccaagtc aggtggcgta ttccagattg 14460
tcctgggggc tgccgccatt gccggatcat tctttaccgc cggagccacc cttgcagcat 14520
ggggggcagc cattggggcc ggtggtatga ccggcatcct gttttctctc ggtgccagta 14580
tggtgctcgg tggtgtggcg cagatgctgg caccgaaagc cagaactccc cgtatacaga 14640
caacggataa cggtaagcag aacacctatt tctcctcact ggataacatg gttgcccagg 14700
gcaatgttct gcctgttctg tacggggaaa tgcgcgtggg gtcacgcgtg gtttctcagg 14760
agatcagcac ggcagacgaa ggggacggtg gtcaggttgt ggtgattggt cgctgatgca 14820
aaatgtttta tgtgaaaccg cctgcgggcg gttttgtcat ttatggagcg tgaggaatgg 14880
gtaaaggaag cagtaagggg cataccccgc gcgaagcgaa ggacaacctg aagtccacgc 14940
agttgctgag tgtgatcgat gccatcagcg aagggccgat tgaaggtccg gtggatggct 15000
taaaaagcgt gctgctgaac agtacgccgg tgctggacac tgaggggaat accaacatat 15060
ccggtgtcac ggtggtgttc cgggctggtg agcaggagca gactccgccg gagggatttg 15120
aatcctccgg ctccgagacg gtgctgggta cggaagtgaa atatgacacg ccgatcaccc 15180
gcaccattac gtctgcaaac atcgaccgtc tgcgctttac cttcggtgta caggcactgg 15240
tggaaaccac ctcaaagggt gacaggaatc cgtcggaagt ccgcctgctg gttcagatac 15300
aacgtaacgg tggctgggtg acggaaaaag acatcaccat taagggcaaa accacctcgc 15360
agtatctggc ctcggtggtg atgggtaacc tgccgccgcg cccgtttaat atccggatgc 15420
gcaggatgac gccggacagc accacagacc agctgcagaa caaaacgctc tggtcgtcat 15480
acactgaaat catcgatgtg aaacagtgct acccgaacac ggcactggtc ggcgtgcagg 15540
tggactcgga gcagttcggc agccagcagg tgagccgtaa ttatcatctg cgcgggcgta 15600
ttctgcaggt gccgtcgaac tataacccgc agacgcggca atacagcggt atctgggacg 15660
gaacgtttaa accggcatac agcaacaaca tggcctggtg tctgtgggat atgctgaccc 15720
atccgcgcta cggcatgggg aaacgtcttg gtgcggcgga tgtggataaa tgggcgctgt 15780
atgtcatcgg ccagtactgc gaccagtcag tgccggacgg ctttggcggc acggagccgc 15840
gcatcacctg taatgcgtac ctgaccacac agcgtaaggc gtgggatgtg ctcagcgatt 15900
tctgctcggc gatgcgctgt atgccggtat ggaacgggca gacgctgacg ttcgtgcagg 15960
accgaccgtc ggataagacg tggacctata accgcagtaa tgtggtgatg ccggatgatg 16020
gcgcgccgtt ccgctacagc ttcagcgccc tgaaggaccg ccataatgcc gttgaggtga 16080
actggattga cccgaacaac ggctgggaga cggcgacaga gcttgttgaa gatacgcagg 16140
ccattgcccg ttacggtcgt aatgttacga agatggatgc ctttggctgt accagccggg 16200
ggcaggcaca ccgcgccggg ctgtggctga ttaaaacaga actgctggaa acgcagaccg 16260
tggatttcag cgtcggcgca gaagggcttc gccatgtacc gggcgatgtt attgaaatct 16320
gcgatgatga ctatgccggt atcagcaccg gtggtcgtgt gctggcggtg aacagccaga 16380
cccggacgct gacgctcgac cgtgaaatca cgctgccatc ctccggtacc gcgctgataa 16440
gcctggttga cggaagtggc aatccggtca gcgtggaggt tcagtccgtc accgacggcg 16500
tgaaggtaaa agtgagccgt gttcctgacg gtgttgctga atacagcgta tgggagctga 16560
agctgccgac gctgcgccag cgactgttcc gctgcgtgag tatccgtgag aacgacgacg 16620
gcacgtatgc catcaccgcc gtgcagcatg tgccggaaaa agaggccatc gtggataacg 16680
gggcgcactt tgacggcgaa cagagtggca cggtgaatgg tgtcacgccg ccagcggtgc 16740
agcacctgac cgcagaagtc actgcagaca gcggggaata tcaggtgctg gcgcgatggg 16800
acacaccgaa ggtggtgaag ggcgtgagtt tcctgctccg tctgaccgta acagcggacg 16860
acggcagtga gcggctggtc agcacggccc ggacgacgga aaccacatac cgcttcacgc 16920
aactggcgct ggggaactac aggctgacag tccgggcggt aaatgcgtgg gggcagcagg 16980
gcgatccggc gtcggtatcg ttccggattg ccgcaccggc agcaccgtcg aggattgagc 17040
tgacgccggg ctattttcag ataaccgcca cgccgcatct tgccgtttat gacccgacgg 17100
tacagtttga gttctggttc tcggaaaagc agattgcgga tatcagacag gttgaaacca 17160
gcacgcgtta tcttggtacg gcgctgtact ggatagccgc cagtatcaat atcaaaccgg 17220
gccatgatta ttacttttat atccgcagtg tgaacaccgt tggcaaatcg gcattcgtgg 17280
aggccgtcgg tcgggcgagc gatgatgcgg aaggttacct ggattttttc aaaggcaaga 17340
taaccgaatc ccatctcggc aaggagctgc tggaaaaagt cgagctgacg gaggataacg 17400
ccagcagact ggaggagttt tcgaaagagt ggaaggatgc cagtgataag tggaatgcca 17460
tgtgggctgt caaaattgag cagaccaaag acggcaaaca ttatgtcgcg ggtattggcc 17520
tcagcatgga ggacacggag gaaggcaaac tgagccagtt tctggttgcc gccaatcgta 17580
tcgcatttat tgacccggca aacgggaatg aaacgccgat gtttgtggcg cagggcaacc 17640
agatattcat gaacgacgtg ttcctgaagc gcctgacggc ccccaccatt accagcggcg 17700
gcaatcctcc ggccttttcc ctgacaccgg acggaaagct gaccgctaaa aatgcggata 17760
tcagtggcag tgtgaatgcg aactccggga cgctcagtaa tgtgacgata gctgaaaact 17820
gtacgataaa cggtacgctg agggcggaaa aaatcgtcgg ggacattgta aaggcggcga 17880
gcgcggcttt tccgcgccag cgtgaaagca gtgtggactg gccgtcaggt acccgtactg 17940
tcaccgtgac cgatgaccat ccttttgatc gccagatagt ggtgcttccg ctgacgtttc 18000
gcggaagtaa gcgtactgtc agcggcagga caacgtattc gatgtgttat ctgaaagtac 18060
tgatgaacgg tgcggtgatt tatgatggcg cggcgaacga ggcggtacag gtgttctccc 18120
gtattgttga catgccagcg ggtcggggaa acgtgatcct gacgttcacg cttacgtcca 18180
cacggcattc ggcagatatt ccgccgtata cgtttgccag cgatgtgcag gttatggtga 18240
ttaagaaaca ggcgctgggc atcagcgtgg tctgagtgtg ttacagaggt tcgtccggga 18300
acgggcgttt tattataaaa cagtgagagg tgaacgatgc gtaatgtgtg tattgccgtt 18360
gctgtctttg ccgcacttgc ggtgacagtc actccggccc gtgcggaagg tggacatggt 18420
acgtttacgg tgggctattt tcaagtgaaa ccgggtacat tgccgtcgtt gtcgggcggg 18480
gataccggtg tgagtcatct gaaagggatt aacgtgaagt accgttatga gctgacggac 18540
agtgtggggg tgatggcttc cctggggttc gccgcgtcga aaaagagcag cacagtgatg 18600
accggggagg atacgtttca ctatgagagc ctgcgtggac gttatgtgag cgtgatggcc 18660
ggaccggttt tacaaatcag taagcaggtc agtgcgtacg ccatggccgg agtggctcac 18720
agtcggtggt ccggcagtac aatggattac cgtaagacgg aaatcactcc cgggtatatg 18780
aaagagacga ccactgccag ggacgaaagt gcaatgcggc atacctcagt ggcgtggagt 18840
gcaggtatac agattaatcc ggcagcgtcc gtcgttgttg atattgctta tgaaggctcc 18900
ggcagtggcg actggcgtac tgacggattc atcgttgggg tcggttataa attctgatta 18960
gccaggtaac acagtgttat gacagcccgc cggaaccggt gggctttttt gtggggtgaa 19020
tatggcagta aagatttcag gagtcctgaa agacggcaca ggaaaaccgg tacagaactg 19080
caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 19140
agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 19200
catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 19260
ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 19320
ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 19380
ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 19440
ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 19500
acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 19560
cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aaaaacgcgg cggccaccag 19620
tgccggtgcg gcgaaaacgt cagaaacgaa tgctgcagcg tcacaacaat cagccgccac 19680
gtctgcctcc accgcggcca cgaaagcgtc agaggccgcc acttcagcac gagatgcggt 19740
ggcctcaaaa gaggcagcaa aatcatcaga aacgaacgca tcatcaagtg ccggtcgtgc 19800
agcttcctcg gcaacggcgg cagaaaattc tgccagggcg gcaaaaacgt ccgagacgaa 19860
tgccaggtca tctgaaacag cagcggaacg gagcgcctct gccgcggcag acgcaaaaac 19920
agcggcggcg gggagtgcgt caacggcatc cacgaaggcg acagaggctg cgggaagtgc 19980
ggtatcagca tcgcagagca aaagtgcggc agaagcggcg gcaatacgtg caaaaaattc 20040
ggcaaaacgt gcagaagata tagcttcagc tgtcgcgctt gaggatgcgg acacaacgag 20100
aaaggggata gtgcagctca gcagtgcaac caacagcacg tctgaaacgc ttgctgcaac 20160
gccaaaggcg gttaaggtgg taatggatga aacgaacaga aaagcccact ggacagtccg 20220
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 20280
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 20340
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 20400
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 20460
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 20520
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 20580
taccttgggg ccggtgagaa ttcggccttt ccggcaggtg cgccgatccc gtggccatca 20640
gatatcgttc cgtctggcta cgtcctgatg caggggcagg cgtttgacaa atcagcctac 20700
ccaaaacttg ctgtcgcgta tccatcgggt gtgcttcctg atatgcgagg ctggacaatc 20760
aaggggaaac ccgccagcgg tcgtgctgta ttgtctcagg aacaggatgg aattaagtcg 20820
cacacccaca gtgccagtgc atccggtacg gatttgggga cgaaaaccac atcgtcgttt 20880
gattacggga cgaaaacaac aggcagtttc gattacggca ccaaatcgac gaataacacg 20940
ggggctcatg ctcacagtct gagcggttca acaggggccg cgggtgctca tgcccacaca 21000
agtggtttaa ggatgaacag ttctggctgg agtcagtatg gaacagcaac cattacagga 21060
agtttatcca cagttaaagg aaccagcaca cagggtattg cttatttatc gaaaacggac 21120
agtcagggca gccacagtca ctcattgtcc ggtacagccg tgagtgccgg tgcacatgcg 21180
catacagttg gtattggtgc gcaccagcat ccggttgtta tcggtgctca tgcccattct 21240
ttcagtattg gttcacacgg acacaccatc accgttaacg ctgcgggtaa cgcggaaaac 21300
accgtcaaaa acattgcatt taactatatt gtgaggcttg cataatggca ttcagaatga 21360
gtgaacaacc acggaccata aaaatttata atctgctggc cggaactaat gaatttattg 21420
gtgaaggtga cgcatatatt ccgcctcata ccggtctgcc tgcaaacagt accgatattg 21480
caccgccaga tattccggct ggctttgtgg ctgttttcaa cagtgatgag gcatcgtggc 21540
atctcgttga agaccatcgg ggtaaaaccg tctatgacgt ggcttccggc gacgcgttat 21600
ttatttctga actcggtccg ttaccggaaa attttacctg gttatcgccg ggaggggaat 21660
atcagaagtg gaacggcaca gcctgggtga aggatacgga agcagaaaaa ctgttccgga 21720
tccgggaggc ggaagaaaca aaaaaaagcc tgatgcaggt agccagtgag catattgcgc 21780
cgcttcagga tgctgcagat ctggaaattg caacgaagga agaaacctcg ttgctggaag 21840
cctggaagaa gtatcgggtg ttgctgaacc gtgttgatac atcaactgca cctgatattg 21900
agtggcctgc tgtccctgtt atggagtaat cgttttgtga tatgccgcag aaacgttgta 21960
tgaaataacg ttctgcggtt agttagtata ttgtaaagct gagtattggt ttatttggcg 22020
attattatct tcaggagaat aatggaagtt ctatgactca attgttcata gtgtttacat 22080
caccgccaat tgcttttaag actgaacgca tgaaatatgg tttttcgtca tgttttgagt 22140
ctgctgttga tatttctaaa gtcggttttt tttcttcgtt ttctctaact attttccatg 22200
aaatacattt ttgattatta tttgaatcaa ttccaattac ctgaagtctt tcatctataa 22260
ttggcattgt atgtattggt ttattggagt agatgcttgc ttttctgagc catagctctg 22320
atatccaaat gaagccatag gcatttgtta ttttggctct gtcagctgca taacgccaaa 22380
aaatatattt atctgcttga tcttcaaatg ttgtattgat taaatcaatt ggatggaatt 22440
gtttatcata aaaaattaat gtttgaatgt gataaccgtc ctttaaaaaa gtcgtttctg 22500
caagcttggc tgtatagtca actaactctt ctgtcgaagt gatattttta ggcttatcta 22560
ccagttttag acgctcttta atatcttcag gaattatttt attgtcatat tgtatcatgc 22620
taaatgacaa tttgcttatg gagtaatctt ttaattttaa ataagttatt ctcctggctt 22680
catcaaataa agagtcgaat gatgttggcg aaatcacatc gtcacccatt ggattgttta 22740
tttgtatgcc aagagagtta cagcagttat acattctgcc atagattata gctaaggcat 22800
gtaataattc gtaatctttt agcgtattag cgacccatcg tctttctgat ttaataatag 22860
atgattcagt taaatatgaa ggtaatttct tttgtgcaag tctgactaac ttttttatac 22920
caatgtttaa catactttca tttgtaataa actcaatgtc attttcttca atgtaagatg 22980
aaataagagt agcctttgcc tcgctataca tttctaaatc gccttgtttt tctatcgtat 23040
tgcgagaatt tttagcccaa gccattaatg gatcattttt ccatttttca ataacattat 23100
tgttatacca aatgtcatat cctataatct ggtttttgtt tttttgaata ataaatgtta 23160
ctgttcttgc ggtttggagg aattgattca aattcaagcg aaataattca gggtcaaaat 23220
atgtatcaat gcagcatttg agcaagtgcg ataaatcttt aagtcttctt tcccatggtt 23280
ttttagtcat aaaactctcc attttgatag gttgcatgct agatgctgat atattttaga 23340
ggtgataaaa ttaactgctt aactgtcaat gtaatacaag ttgtttgatc tttgcaatga 23400
ttcttatcag aaaccatata gtaaattagt tacacaggaa atttttaata ttattattat 23460
cattcattat gtattaaaat tagagttgtg gcttggctct gctaacacgt tgctcatagg 23520
agatatggta gagccgcaga cacgtcgtat gcaggaacgt gctgcggctg gctggtgaac 23580
ttccgatagt gcgggtgttg aatgatttcc agttgctacc gattttacat attttttgca 23640
tgagagaatt tgtaccacct cccaccgacc atctatgact gtacgccact gtccctagga 23700
ctgctatgtg ccggagcgga cattacaaac gtccttctcg gtgcatgcca ctgttgccaa 23760
tgacctgcct aggaattggt tagcaagtta ctaccggatt ttgtaaaaac agccctcctc 23820
atataaaaag tattcgttca cttccgataa gcgtcgtaat tttctatctt tcatcatatt 23880
ctagatccct ctgaaaaaat cttccgagtt tgctaggcac tgatacataa ctcttttcca 23940
ataattgggg aagtcattca aatctataat aggtttcaga tttgcttcaa taaattctga 24000
ctgtagctgc tgaaacgttg cggttgaact atatttcctt ataactttta cgaaagagtt 24060
tctttgagta atcacttcac tcaagtgctt ccctgcctcc aaacgatacc tgttagcaat 24120
atttaatagc ttgaaatgat gaagagctct gtgtttgtct tcctgcctcc agttcgccgg 24180
gcattcaaca taaaaactga tagcacccgg agttccggaa acgaaatttg catataccca 24240
ttgctcacga aaaaaaatgt ccttgtcgat atagggatga atcgcttggt gtacctcatc 24300
tactgcgaaa acttgacctt tctctcccat attgcagtcg cggcacgatg gaactaaatt 24360
aataggcatc accgaaaatt caggataatg tgcaatagga agaaaatgat ctatattttt 24420
tgtctgtcct atatcaccac aaaatggaca tttttcacct gatgaaacaa gcatgtcatc 24480
gtaatatgtt ctagcgggtt tgtttttatc tcggagatta ttttcataaa gcttttctaa 24540
tttaaccttt gtcaggttac caactactaa ggttgtaggc tcaagagggt gtgtcctgtc 24600
gtaggtaaat aactgacctg tcgagcttaa tattctatat tgttgttctt tctgcaaaaa 24660
agtggggaag tgagtaatga aattatttct aacatttatc tgcatcatac cttccgagca 24720
tttattaagc atttcgctat aagttctcgc tggaagaggt agttttttca ttgtacttta 24780
ccttcatctc tgttcattat catcgctttt aaaacggttc gaccttctaa tcctatctga 24840
ccattataat tttttagaat ggtttcataa gaaagctctg aatcaacgga ctgcgataat 24900
aagtggtggt atccagaatt tgtcacttca agtaaaaaca cctcacgagt taaaacacct 24960
aagttctcac cgaatgtctc aatatccgga cggataatat ttattgcttc tcttgaccgt 25020
aggactttcc acatgcagga ttttggaacc tcttgcagta ctactgggga atgagttgca 25080
attattgcta caccattgcg tgcatcgagt aagtcgctta atgttcgtaa aaaagcagag 25140
agcaaaggtg gatgcagatg aacctctggt tcatcgaata aaactaatga cttttcgcca 25200
acgacatcta ctaatcttgt gatagtaaat aaaacaattg catgtccaga gctcattcga 25260
agcagatatt tctggatatt gtcataaaac aatttagtga atttatcatc gtccacttga 25320
atctgtggtt cattacgtct taactcttca tatttagaaa tgaggctgat gagttccata 25380
tttgaaaagt tttcatcact acttagtttt ttgatagctt caagccagag ttgtcttttt 25440
ctatctactc tcatacaacc aataaatgct gaaatgaatt ctaagcggag atcgcctagt 25500
gattttaaac tattgctggc agcattcttg agtccaatat aaaagtattg tgtacctttt 25560
gctgggtcag gttgttcttt aggaggagta aaaggatcaa atgcactaaa cgaaactgaa 25620
acaagcgatc gaaaatatcc ctttgggatt cttgactcga taagtctatt attttcagag 25680
aaaaaatatt cattgttttc tgggttggtg attgcaccaa tcattccatt caaaattgtt 25740
gttttaccac acccattccg cccgataaaa gcatgaatgt tcgtgctggg catagaatta 25800
accgtcacct caaaaggtat agttaaatca ctgaatccgg gagcactttt tctattaaat 25860
gaaaagtgga aatctgacaa ttctggcaaa ccatttaaca cacgtgcgaa ctgtccatga 25920
atttctgaaa gagttacccc tctaagtaat gaggtgttaa ggacgctttc attttcaatg 25980
tcggctaatc gatttggcca tactactaaa tcctgaatag ctttaagaag gttatgttta 26040
aaaccatcgc ttaatttgct gagattaaca tagtagtcaa tgctttcacc taaggaaaaa 26100
aacatttcag ggagttgact gaatttttta tctattaatg aataagtgct tacttcttct 26160
ttttgaccta caaaaccaat tttaacattt ccgatatcgc atttttcacc atgctcatca 26220
aagacagtaa gataaaacat tgtaacaaag gaatagtcat tccaaccatc tgctcgtagg 26280
aatgccttat ttttttctac tgcaggaata tacccgcctc tttcaataac actaaactcc 26340
aacatatagt aacccttaat tttattaaaa taaccgcaat ttatttggcg gcaacacagg 26400
atctctcttt taagttactc tctattacat acgttttcca tctaaaaatt agtagtattg 26460
aacttaacgg ggcatcgtat tgtagttttc catatttagc tttctgcttc cttttggata 26520
acccactgtt attcatgttg catggtgcac tgtttatacc aacgatatag tctattaatg 26580
catatatagt atcgccgaac gattagctct tcaggcttct gaagaagcgt ttcaagtact 26640
aataagccga tagatagcca cggacttcgt agccattttt cataagtgtt aacttccgct 26700
cctcgctcat aacagacatt cactacagtt atggcggaaa ggtatgcatg ctgggtgtgg 26760
ggaagtcgtg aaagaaaaga agtcagctgc gtcgtttgac atcactgcta tcttcttact 26820
ggttatgcag gtcgtagtgg gtggcacaca aagctttgca ctggattgcg aggctttgtg 26880
cttctctgga gtgcgacagg tttgatgaca aaaaattagc gcaagaagac aaaaatcacc 26940
ttgcgctaat gctctgttac aggtcactaa taccatctaa gtagttgatt catagtgact 27000
gcatatgttg tgttttacag tattatgtag tctgtttttt atgcaaaatc taatttaata 27060
tattgatatt tatatcattt tacgtttctc gttcagcttt tttatactaa gttggcatta 27120
taaaaaagca ttgcttatca atttgttgca acgaacaggt cactatcagt caaaataaaa 27180
tcattatttg atttcaattt tgtcccactc cctgcctctg tcatcacgat actgtgatgc 27240
catggtgtcc gacttatgcc cgagaagatg ttgagcaaac ttatcgctta tctgcttctc 27300
atagagtctt gcagacaaac tgcgcaactc gtgaaaggta ggcggatccc cttcgaagga 27360
aagacctgat gcttttcgtg cgcgcataaa ataccttgat actgtgccgg atgaaagcgg 27420
ttcgcgacga gtagatgcaa ttatggtttc tccgccaaga atctctttgc atttatcaag 27480
tgtttccttc attgatattc cgagagcatc aatatgcaat gctgttggga tggcaatttt 27540
tacgcctgtt ttgctttgct cgacataaag atatccatct acgatatcag accacttcat 27600
ttcgcataaa tcaccaactc gttgcccggt aacaacagcc agttccattg caagtctgag 27660
ccaacatggt gatgattctg ctgcttgata aattttcagg tattcgtcag ccgtaagtct 27720
tgatctcctt acctctgatt ttgctgcgcg agtggcagcg acatggtttg ttgttatatg 27780
gccttcagct attgcctctc ggaatgcatc gctcagtgtt gatctgatta acttggctga 27840
cgccgccttg ccctcgtcta tgtatccatt gagcattgcc gcaatttctt ttgtggtgat 27900
gtcttcaagt ggagcatcag gcagacccct ccttattgct ttaattttgc tcatgtaatt 27960
tatgagtgtc ttctgcttga ttcctctgct ggccaggatt ttttcgtagc gatcaagcca 28020
tgaatgtaac gtaacggaat tatcactgtt gattctcgct gtcagaggct tgtgtttgtg 28080
tcctgaaaat aactcaatgt tggcctgtat agcttcagtg attgcgattc gcctgtctct 28140
gcctaatcca aactctttac ccgtccttgg gtccctgtag cagtaatatc cattgtttct 28200
tatataaagg ttagggggta aatcccggcg ctcatgactt cgccttcttc ccatttctga 28260
tcctcttcaa aaggccacct gttactggtc gatttaagtc aacctttacc gctgattcgt 28320
ggaacagata ctctcttcca tccttaaccg gaggtgggaa tatcctgcat tcccgaaccc 28380
atcgacgaac tgtttcaagg cttcttggac gtcgctggcg tgcgttccac tcctgaagtg 28440
tcaagtacat cgcaaagtct ccgcaattac acgcaagaaa aaaccgccat caggcggctt 28500
ggtgttcttt cagttcttca attcgaatat tggttacgtc tgcatgtgct atctgcgccc 28560
atatcatcca gtggtcgtag cagtcgttga tgttctccgc ttcgataact ctgttgaatg 28620
gctctccatt ccattctcct gtgactcgga agtgcattta tcatctccat aaaacaaaac 28680
ccgccgtagc gagttcagat aaaataaatc cccgcgagtg cgaggattgt tatgtaatat 28740
tgggtttaat catctatatg ttttgtacag agagggcaag tatcgtttcc accgtactcg 28800
tgataataat tttgcacggt atcagtcatt tctcgcacat tgcagaatgg ggatttgtct 28860
tcattagact tataaacctt catggaatat ttgtatgccg actctatatc tataccttca 28920
tctacataaa caccttcgtg atgtctgcat ggagacaaga caccggatct gcacaacatt 28980
gataacgccc aatctttttg ctcagactct aactcattga tactcattta taaactcctt 29040
gcaatgtatg tcgtttcagc taaacggtat cagcaatgtt tatgtaaaga aacagtaaga 29100
taatactcaa cccgatgttt gagtacggtc atcatctgac actacagact ctggcatcgc 29160
tgtgaagacg acgcgaaatt cagcattttc acaagcgtta tcttttacaa aaccgatctc 29220
actctccttt gatgcgaatg ccagcgtcag acatcatatg cagatactca cctgcatcct 29280
gaacccattg acctccaacc ccgtaatagc gatgcgtaat gatgtcgata gttactaacg 29340
ggtcttgttc gattaactgc cgcagaaact cttccaggtc accagtgcag tgcttgataa 29400
caggagtctt cccaggatgg cgaacaacaa gaaactggtt tccgtcttca cggacttcgt 29460
tgctttccag tttagcaata cgcttactcc catccgagat aacaccttcg taatactcac 29520
gctgctcgtt gagttttgat tttgctgttt caagctcaac acgcagtttc cctactgtta 29580
gcgcaatatc ctcgttctcc tggtcgcggc gtttgatgta ttgctggttt ctttcccgtt 29640
catccagcag ttccagcaca atcgatggtg ttaccaattc atggaaaagg tctgcgtcaa 29700
atccccagtc gtcatgcatt gcctgctctg ccgcttcacg cagtgcctga gagttaattt 29760
cgctcacttc gaacctctct gtttactgat aagttccaga tcctcctggc aacttgcaca 29820
agtccgacaa ccctgaacga ccaggcgtct tcgttcatct atcggatcgc cacactcaca 29880
acaatgagtg gcagatatag cctggtggtt caggcggcgc atttttattg ctgtgttgcg 29940
ctgtaattct tctatttctg atgctgaatc aatgatgtct gccatctttc attaatccct 30000
gaactgttgg ttaatacgct tgagggtgaa tgcgaataat aaaaaaggag cctgtagctc 30060
cctgatgatt ttgcttttca tgttcatcgt tccttaaaga cgccgtttaa catgccgatt 30120
gccaggctta aatgagtcgg tgtgaatccc atcagcgtta ccgtttcgcg gtgcttcttc 30180
agtacgctac ggcaaatgtc atcgacgttt ttatccggaa actgctgtct ggcttttttt 30240
gatttcagaa ttagcctgac gggcaatgct gcgaagggcg ttttcctgct gaggtgtcat 30300
tgaacaagtc ccatgtcggc aagcataagc acacagaata tgaagcccgc tgccagaaaa 30360
atgcattccg tggttgtcat acctggtttc tctcatctgc ttctgctttc gccaccatca 30420
tttccagctt ttgtgaaagg gatgcggcta acgtatgaaa ttcttcgtct gtttctactg 30480
gtattggcac aaacctgatt ccaatttgag caaggctatg tgccatctcg atactcgttc 30540
ttaactcaac agaagatgct ttgtgcatac agcccctcgt ttattattta tctcctcagc 30600
cagccgctgt gctttcagtg gatttcggat aacagaaagg ccgggaaata cccagcctcg 30660
ctttgtaacg gagtagacga aagtgattgc gcctacccgg atattatcgt gaggatgcgt 30720
catcgccatt gctccccaaa tacaaaacca atttcagcca gtgcctcgtc cattttttcg 30780
atgaactccg gcacgatctc gtcaaaactc gccatgtact tttcatcccg ctcaatcacg 30840
acataatgca ggccttcacg cttcatacgc gggtcatagt tggcaaagta ccaggcattt 30900
tttcgcgtca cccacatgct gtactgcacc tgggccatgt aagctgactt tatggcctcg 30960
aaaccaccga gccggaactt catgaaatcc cgggaggtaa acgggcattt cagttcaagg 31020
ccgttgccgt cactgcataa accatcggga gagcaggcgg tacgcatact ttcgtcgcga 31080
tagatgatcg gggattcagt aacattcacg ccggaagtga attcaaacag ggttctggcg 31140
tcgttctcgt actgttttcc ccaggccagt gctttagcgt taacttccgg agccacaccg 31200
gtgcaaacct cagcaagcag ggtgtggaag taggacattt tcatgtcagg ccacttcttt 31260
ccggagcggg gttttgctat cacgttgtga acttctgaag cggtgatgac gccgagccgt 31320
aatttgtgcc acgcatcatc cccctgttcg acagctctca catcgatccc ggtacgctgc 31380
aggataatgt ccggtgtcat gctgccacct tctgctctgc ggctttctgt ttcaggaatc 31440
caagagcttt tactgcttcg gcctgtgtca gttctgacga tgcacgaatg tcgcggcgaa 31500
atatctggga acagagcggc aataagtcgt catcccatgt tttatccagg gcgatcagca 31560
gagtgttaat ctcctgcatg gtttcatcgt taaccggagt gatgtcgcgt tccggctgac 31620
gttctgcagt gtatgcagta ttttcgacaa tgcgctcggc ttcatccttg tcatagatac 31680
cagcaaatcc gaaggccaga cgggcacact gaatcatggc tttatgacgt aacatccgtt 31740
tgggatgcga ctgccacggc cccgtgattt ctctgccttc gcgagttttg aatggttcgc 31800
ggcggcattc atccatccat tcggtaacgc agatcggatg attacggtcc ttgcggtaaa 31860
tccggcatgt acaggattca ttgtcctgct caaagtccat gccatcaaac tgctggtttt 31920
cattgatgat gcgggaccag ccatcaacgc ccaccaccgg aacgatgcca ttctgcttat 31980
caggaaaggc gtaaatttct ttcgtccacg gattaaggcc gtactggttg gcaacgatca 32040
gtaatgcgat gaactgcgca tcgctggcat cacctttaaa tgccgtctgg cgaagagtgg 32100
tgatcagttc ctgtgggtcg acagaatcca tgccgacacg ttcagccagc ttcccagcca 32160
gcgttgcgag tgcagtactc attcgtttta tacctctgaa tcaatatcaa cctggtggtg 32220
agcaatggtt tcaaccatgt accggatgtg ttctgccatg cgctcctgaa actcaacatc 32280
gtcatcaaac gcacgggtaa tggatttttt gctggccccg tggcgttgca aatgatcgat 32340
gcatagcgat tcaaacaggt gctggggcag gcctttttcc atgtcgtctg ccagttctgc 32400
ctctttctct tcacgggcga gctgctggta gtgacgcgcc cagctctgag cctcaagacg 32460
atcctgaatg taataagcgt tcatggctga actcctgaaa tagctgtgaa aatatcgccc 32520
gcgaaatgcc gggctgatta ggaaaacagg aaagggggtt agtgaatgct tttgcttgat 32580
ctcagtttca gtattaatat ccatttttta taagcgtcga cggcttcacg aaacatcttt 32640
tcatcgccaa taaaagtggc gatagtgaat ttagtctgga tagccataag tgtttgatcc 32700
attctttggg actcctggct gattaagtat gtcgataagg cgtttccatc cgtcacgtaa 32760
tttacgggtg attcgttcaa gtaaagattc ggaagggcag ccagcaacag gccaccctgc 32820
aatggcatat tgcatggtgt gctccttatt tatacataac gaaaaacgcc tcgagtgaag 32880
cgttattggt atgcggtaaa accgcactca ggcggccttg atagtcatat catctgaatc 32940
aaatattcct gatgtatcga tatcggtaat tcttattcct tcgctaccat ccattggagg 33000
ccatccttcc tgaccatttc catcattcca gtcgaactca cacacaacac catatgcatt 33060
taagtcgctt gaaattgcta taagcagagc atgttgcgcc agcatgatta atacagcatt 33120
taatacagag ccgtgtttat tgagtcggta ttcagagtct gaccagaaat tattaatctg 33180
gtgaagtttt tcctctgtca ttacgtcatg gtcgatttca atttctattg atgctttcca 33240
gtcgtaatca atgatgtatt ttttgatgtt tgacatctgt tcatatcctc acagataaaa 33300
aatcgccctc acactggagg gcaaagaaga tttccaataa tcagaacaag tcggctcctg 33360
tttagttacg agcgacattg ctccgtgtat tcactcgttg gaatgaatac acagtgcagt 33420
gtttattctg ttatttatgc caaaaataaa ggccactatc aggcagcttt gttgttctgt 33480
ttaccaagtt ctctggcaat cattgccgtc gttcgtattg cccatttatc gacatatttc 33540
ccatcttcca ttacaggaaa catttcttca ggcttaacca tgcattccga ttgcagcttg 33600
catccattgc atcgcttgaa ttgtccacac cattgatttt tatcaatagt cgtagtcata 33660
cggatagtcc tggtattgtt ccatcacatc ctgaggatgc tcttcgaact cttcaaattc 33720
ttcttccata tatcacctta aatagtggat tgcggtagta aagattgtgc ctgtctttta 33780
accacatcag gctcggtggt tctcgtgtac ccctacagcg agaaatcgga taaactatta 33840
caacccctac agtttgatga gtatagaaat ggatccactc gttattctcg gacgagtgtt 33900
cagtaatgaa cctctggaga gaaccatgta tatgatcgtt atctgggttg gacttctgct 33960
tttaagccca gataactggc ctgaatatgt taatgagaga atcggtattc ctcatgtgtg 34020
gcatgttttc gtctttgctc ttgcattttc gctagcaatt aatgtgcatc gattatcagc 34080
tattgccagc gccagatata agcgatttaa gctaagaaaa cgcattaaga tgcaaaacga 34140
taaagtgcga tcagtaattc aaaaccttac agaagagcaa tctatggttt tgtgcgcagc 34200
ccttaatgaa ggcaggaagt atgtggttac atcaaaacaa ttcccataca ttagtgagtt 34260
gattgagctt ggtgtgttga acaaaacttt ttcccgatgg aatggaaagc atatattatt 34320
ccctattgag gatatttact ggactgaatt agttgccagc tatgatccat ataatattga 34380
gataaagcca aggccaatat ctaagtaact agataagagg aatcgatttt cccttaattt 34440
tctggcgtcc actgcatgtt atgccgcgtt cgccaggctt gctgtaccat gtgcgctgat 34500
tcttgcgctc aatacgttgc aggttgcttt caatctgttt gtggtattca gccagcactg 34560
taaggtctat cggatttagt gcgctttcta ctcgtgattt cggtttgcga ttcagcgaga 34620
gaatagggcg gttaactggt tttgcgctta ccccaaccaa caggggattt gctgctttcc 34680
attgagcctg tttctctgcg cgacgttcgc ggcggcgtgt ttgtgcatcc atctggattc 34740
tcctgtcagt tagctttggt ggtgtgtggc agttgtagtc ctgaacgaaa accccccgcg 34800
attggcacat tggcagctaa tccggaatcg cacttacggc caatgcttcg tttcgtatca 34860
cacaccccaa agccttctgc tttgaatgct gcccttcttc agggcttaat ttttaagagc 34920
gtcaccttca tggtggtcag tgcgtcctgc tgatgtgctc agtatcaccg ccagtggtat 34980
ttatgtcaac accgccagag ataatttatc accgcagatg gttatctgta tgttttttat 35040
atgaatttat tttttgcagg ggggcattgt ttggtaggtg agagatctga attgctatgt 35100
ttagtgagtt gtatctattt atttttcaat aaatacaatt ggttatgtgt tttgggggcg 35160
atcgtgaggc aaagaaaacc cggcgctgag gccgggttat tcttgttctc tggtcaaatt 35220
atatagttgg aaaacaagga tgcatatatg aatgaacgat gcagaggcaa tgccgatggc 35280
gatagtgggt atcatgtagc cgcttatgct ggaaagaagc aataacccgc agaaaaacaa 35340
agctccaagc tcaacaaaac taagggcata gacaataact accgatgtca tatacccata 35400
ctctctaatc ttggccagtc ggcgcgttct gcttccgatt agaaacgtca aggcagcaat 35460
caggattgca atcatggttc ctgcatatga tgacaatgtc gccccaagac catctctatg 35520
agctgaaaaa gaaacaccag gaatgtagtg gcggaaaagg agatagcaaa tgcttacgat 35580
aacgtaagga attattacta tgtaaacacc aggcatgatt ctgttccgca taattactcc 35640
tgataattaa tccttaactt tgcccacctg ccttttaaaa cattccagta tatcactttt 35700
cattcttgcg tagcaatatg ccatctcttc agctatctca gcattggtga ccttgttcag 35760
aggcgctgag agatggcctt tttctgatag ataatgttct gttaaaatat ctccggcctc 35820
atcttttgcc cgcaggctaa tgtctgaaaa ttgaggtgac gggttaaaaa taatatcctt 35880
ggcaaccttt tttatatccc ttttaaattt tggcttaatg actatatcca atgagtcaaa 35940
aagctcccct tcaatatctg ttgcccctaa gacctttaat atatcgccaa atacaggtag 36000
cttggcttct accttcaccg ttgttcggcc gatgaaatgc atatgcataa catcgtcttt 36060
ggtggttccc ctcatcagtg gctctatctg aacgcgctct ccactgctta atgacattcc 36120
tttcccgatt aaaaaatctg tcagatcgga tgtggtcggc ccgaaaacag ttctggcaaa 36180
accaatggtg tcgccttcaa caaacaaaaa agatgggaat cccaatgatt cgtcatctgc 36240
gaggctgttc ttaatatctt caactgaagc tttagagcga tttatcttct gaaccagact 36300
cttgtcattt gttttggtaa agagaaaagt ttttccatcg attttatgaa tatacaaata 36360
attggagcca acctgcaggt gatgattatc agccagcaga gaattaagga aaacagacag 36420
gtttattgag cgcttatctt tccctttatt tttgctgcgg taagtcgcat aaaaaccatt 36480
cttcataatt caatccattt actatgttat gttctgaggg gagtgaaaat tcccctaatt 36540
cgatgaagat tcttgctcaa ttgttatcag ctatgcgccg accagaacac cttgccgatc 36600
agccaaacgt ctcttcaggc cactgactag cgataacttt ccccacaacg gaacaactct 36660
cattgcatgg gatcattggg tactgtgggt ttagtggttg taaaaacacc tgaccgctat 36720
ccctgatcag tttcttgaag gtaaactcat cacccccaag tctggctatg cagaaatcac 36780
ctggctcaac agcctgctca gggtcaacga gaattaacat tccgtcagga aagcttggct 36840
tggagcctgt tggtgcggtc atggaattac cttcaacctc aagccagaat gcagaatcac 36900
tggctttttt ggttgtgctt acccatctct ccgcatcacc tttggtaaag gttctaagct 36960
caggtgagaa catccctgcc tgaacatgag aaaaaacagg gtactcatac tcacttctaa 37020
gtgacggctg catactaacc gcttcataca tctcgtagat ttctctggcg attgaagggc 37080
taaattcttc aacgctaact ttgagaattt ttgcaagcaa tgcggcgtta taagcattta 37140
atgcattgat gccattaaat aaagcaccaa cgcctgactg ccccatcccc atcttgtctg 37200
cgacagattc ctgggataag ccaagttcat ttttcttttt ttcataaatt gctttaaggc 37260
gacgtgcgtc ctcaagctgc tcttgtgtta atggtttctt ttttgtgctc atacgttaaa 37320
tctatcaccg caagggataa atatctaaca ccgtgcgtgt tgactatttt acctctggcg 37380
gtgataatgg ttgcatgtac taaggaggtt gtatggaaca acgcataacc ctgaaagatt 37440
atgcaatgcg ctttgggcaa accaagacag ctaaagatct cggcgtatat caaagcgcga 37500
tcaacaaggc cattcatgca ggccgaaaga tttttttaac tataaacgct gatggaagcg 37560
tttatgcgga agaggtaaag cccttcccga gtaacaaaaa aacaacagca taaataaccc 37620
cgctcttaca cattccagcc ctgaaaaagg gcatcaaatt aaaccacacc tatggtgtat 37680
gcatttattt gcatacattc aatcaattgt tatctaagga aatacttaca tatggttcgt 37740
gcaaacaaac gcaacgaggc tctacgaatc gagagtgcgt tgcttaacaa aatcgcaatg 37800
cttggaactg agaagacagc ggaagctgtg ggcgttgata agtcgcagat cagcaggtgg 37860
aagagggact ggattccaaa gttctcaatg ctgcttgctg ttcttgaatg gggggtcgtt 37920
gacgacgaca tggctcgatt ggcgcgacaa gttgctgcga ttctcaccaa taaaaaacgc 37980
ccggcggcaa ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc 38040
tatcaacagg agtcattatg acaaatacag caaaaatact caacttcggc agaggtaact 38100
ttgccggaca ggagcgtaat gtggcagatc tcgatgatgg ttacgccaga ctatcaaata 38160
tgctgcttga ggcttattcg ggcgcagatc tgaccaagcg acagtttaaa gtgctgcttg 38220
ccattctgcg taaaacctat gggtggaata aaccaatgga cagaatcacc gattctcaac 38280
ttagcgagat tacaaagtta cctgtcaaac ggtgcaatga agccaagtta gaactcgtca 38340
gaatgaatat tatcaagcag caaggcggca tgtttggacc aaataaaaac atctcagaat 38400
ggtgcatccc tcaaaacgag ggaaaatccc ctaaaacgag ggataaaaca tccctcaaat 38460
tgggggattg ctatccctca aaacaggggg acacaaaaga cactattaca aaagaaaaaa 38520
gaaaagatta ttcgtcagag aattctggcg aatcctctga ccagccagaa aacgaccttt 38580
ctgtggtgaa accggatgct gcaattcaga gcggcagcaa gtgggggaca gcagaagacc 38640
tgaccgccgc agagtggatg tttgacatgg tgaagactat cgcaccatca gccagaaaac 38700
cgaattttgc tgggtgggct aacgatatcc gcctgatgcg tgaacgtgac ggacgtaacc 38760
accgcga 38767
<210> 8
<211> 9107
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 8
catgtgtgtg ctgttccgct gggcatgcca ggacaacttc tggtccggta acgtgctgag 60
cccggccaaa ctccgcgata agtggaccca actcgaaatc aaccgtaaca agcaacaggc 120
aggcgtgaca gccagcaaac caaaactcga cctgacaaac acagactgga tttacggggt 180
ggatctatga aaaacatcgc cgcacagatg gttaactttg accgtgagca gatgcgtcgg 240
atcgccaaca acatgccgga acagtacgac gaaaagccgc aggtacagca ggtagcgcag 300
atcatcaacg gtgtgttcag ccagttactg gcaactttcc cggcgagcct ggctaaccgt 360
gaccagaacg aagtgaacga aatccgtcgc cagtgggttc tggcttttcg ggaaaacggg 420
atcaccacga tggaacaggt taacgcagga atgcgcgtag cccgtcggca gaatcgacca 480
tttctgccat cacccgggca gtttgttgca tggtgccggg aagaagcatc cgttaccgcc 540
ggactgccaa acgtcagcga gctggttgat atggtttacg agtattgccg gaagcgaggc 600
ctgtatccgg atgcggagtc ttatccgtgg aaatcaaacg cgcactactg gctggttacc 660
aacctgtatc agaacatgcg ggccaatgcg cttactgatg cggaattacg ccgtaaggcc 720
gcagatgagc ttgtccatat gactgcgaga attaaccgtg gtgaggcgat ccctgaacca 780
gtaaaacaac ttcctgtcat gggcggtaga cctctaaatc gtgcacaggc tctggcgaag 840
atcgcagaaa tcaaagctaa gttcggactg aaaggagcaa gtgtatgacg ggcaaagagg 900
caattattca ttacctgggg acgcataata gcttctgtgc gccggacgtt gccgcgctaa 960
caggcgcaac agtaaccagc ataaatcagg ccgcggctaa aatggcacgg gcaggtcttc 1020
tggttatcga aggtaaggtc tggcgaacgg tgtattaccg gtttgctacc agggaagaac 1080
gggaaggaaa gatgagcacg aacctggttt ttaaggagtg tcgccagagt gccgcgatga 1140
aacgggtatt ggcggtatat ggagttaaaa gatgaccatc tacattactg agctaataac 1200
aggcctgctg gtaatcgcag gcctttttat ttgggggaga gggaagtcat gaaaaaacta 1260
acctttgaaa ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc 1320
cttccagacc caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac 1380
caaaacagga agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt 1440
cgctggctgg atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat 1500
gttgttccta accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg 1560
cgtgtaggcg aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc 1620
gttaagtggt cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg 1680
gctgcatgat aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc 1740
taatggagca aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt 1800
gtgaacatcc aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc 1860
tcaccgtatt gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat 1920
gggaaccaaa ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa 1980
agaaatatgg cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc 2040
ccttcaccaa atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca 2100
tcagagctga tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac 2160
tgtcagactt tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc 2220
aaataccgga acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg 2280
gacttgcctg caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat 2340
cccatgtgcg tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt 2400
cgctggacgg tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca 2460
tggtacgagc taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag 2520
ggcagcttga tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga 2580
atgcaaagaa gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg 2640
gtgtgaaaga acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg 2700
agacagcgac gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa 2760
cgcaccagaa ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac 2820
acggctcacc tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg 2880
accaaaatcg aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg 2940
gtcagaagct gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga 3000
gcgatccgaa tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga 3060
tgtaaaaacg atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc 3120
tctccagagt gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg 3180
gaaaaagcag cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag 3240
attcgaaaac tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta 3300
aacgccttca tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg 3360
tctgctcagt gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt 3420
aatgaacgca atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc 3480
gttccgtatc gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa 3540
tcaaaccata accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac 3600
caacagaaac tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa 3660
aaaccattcc agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac 3720
tgaaatgtag tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg 3780
ccatcgtcaa cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac 3840
gaaaaaattg atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc 3900
tacacgaacc tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt 3960
atctcggtgg gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc 4020
acattcccct ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta 4080
tcagagcgtg gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc 4140
gattacgaca aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta 4200
atcatcgaac tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt 4260
gacgaatacg agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga 4320
atcagcaact cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt 4380
ggtcatacgc cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc 4440
gcagtgttct gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg 4500
aaagcgtagc taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca 4560
cggcttctga ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac 4620
aagccggatt cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac 4680
aaaaggctat caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg 4740
tggcaaagct tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt 4800
atgcggatta ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta 4860
caggccgtgc ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt 4920
gcggaagatg caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg 4980
tgacgatgct aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt 5040
atgacgctct ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg 5100
cggtcacacg ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga 5160
cttattgaat aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta 5220
gtgagatgaa aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat 5280
cgtctggaac tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt 5340
cgcaggtaat agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg 5400
taagagcatt gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc 5460
cgttgtgctg aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg 5520
tcatcgccgc ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat 5580
tcattagtaa tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag 5640
gaggtcgcgc taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg 5700
attactaaac acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa 5760
tagagcaaat ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg 5820
gccgccattc tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg 5880
taccttcgcg gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg 5940
tgcgccatta tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat 6000
ctcgcttata taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt 6060
atcaaacgct tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg 6120
taaggcgttc ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac 6180
cagaaatcat ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca 6240
ccctcgcaaa cttgtcacgc taaacccaaa actcaaatca acaggcgccg gacgctacca 6300
gcttctttcc cgttggtggg atgcctaccg caagcagctt ggcctgaaag acttctctcc 6360
gaaaagtcag gacgctgtgg cattgcagca gattaaggag cgtggcgctt tacctatgat 6420
tgatcgtggt gatatccgtc aggcaatcga ccgttgcagc aatatctggg cttcactgcc 6480
gggcgctggt tatggtcagt tcgagcataa ggctgacagc ctgattgcaa aattcaaaga 6540
agcgggcgga acggtcagag agattgatgt atgagcagag tcaccgcgat tatctccgct 6600
ctggttatct gcatcatcgt ctgcctgtca tgggctgtta atcattaccg tgataacgcc 6660
attacctaca aagcccagcg cgacaaaaat gccagagaac tgaagctggc gaacgcggca 6720
attactgaca tgcagatgcg tcagcgtgat gttgctgcgc tcgatgcaaa atacacgaag 6780
gagttagctg atgctaaagc tgaaaatgat gctctgcgtg atgatgttgc cgctggtcgt 6840
cgtcggttgc acatcaaagc agtctgtcag tcagtgcgtg aagccaccac cgcctccggc 6900
gtggataatg cagcctcccc ccgactggca gacaccgctg aacgggatta tttcaccctc 6960
agagagaggc tgatcactat gcaaaaacaa ctggaaggaa cccagaagta tattaatgag 7020
cagtgcagat agagttgccc atatcgatgg gcaactcatg caattattgt gagcaataca 7080
cacgcgcttc cagcggagta taaatgccta aagtaataaa accgagcaat ccatttacga 7140
atgtttgctg ggtttctgtt ttaacaacat tttctgcgcc gccacaaatt ttggctgcat 7200
cgacagtttt cttctgccca attccagaaa cgaagaaatg atgggtgatg gtttcctttg 7260
gtgctactgc tgccggtttg ttttgaacag taaacgtctg ttgagcacat cctgtaataa 7320
gcagggccag cgcagtagcg agtagcattt ttttcatggt gttattcccg atgctttttg 7380
aagttcgcag aatcgtatgt gtagaaaatt aaacaaaccc taaacaatga gttgaaattt 7440
catattgtta atatttatta atgtatgtca ggtgcgatga atcgtcattg tattcccgga 7500
ttaactatgt ccacagccct gacggggaac ttctctgcgg gagtgtccgg gaataattaa 7560
aacgatgcac acagggttta gcgcgtacac gtattgcatt atgccaacgc cccggtgctg 7620
acacggaaga aaccggacgt tatgatttag cgtggaaaga tttgtgtagt gttctgaatg 7680
ctctcagtaa atagtaatga attatcaaag gtatagtaat atcttttatg ttcatggata 7740
tttgtaaccc atcggaaaac tcctgcttta gcaagatttt ccctgtattg ctgaaatgtg 7800
atttctcttg atttcaacct atcataggac gtttctataa gatgcgtgtt tcttgagaat 7860
ttaacattta caaccttttt aagtcctttt attaacacgg tgttatcgtt ttctaacacg 7920
atgtgaatat tatctgtggc tagatagtaa atataatgtg agacgttgtg acgttttagt 7980
tcagaataaa acaattcaca gtctaaatct tttcgcactt gatcgaatat ttctttaaaa 8040
atggcaacct gagccattgg taaaaccttc catgtgatac gagggcgcgt agtttgcatt 8100
atcgttttta tcgtttcaat ctggtctgac ctccttgtgt tttgttgatg atttatgtca 8160
aatattagga atgttttcac ttaatagtat tggttgcgta acaaagtgcg gtcctgctgg 8220
cattctggag ggaaatacaa ccgacagatg tatgtaaggc caacgtgctc aaatcttcat 8280
acagaaagat ttgaagtaat attttaaccg ctagatgaag agcaagcgca tggagcgaca 8340
aaatgaataa agaacaatct gctgatgatc cctccgtgga tctgattcgt gtaaaaaata 8400
tgcttaatag caccatttct atgagttacc ctgatgttgt aattgcatgt atagaacata 8460
aggtgtctct ggaagcattc agagcaattg aggcagcgtt ggtgaagcac gataataata 8520
tgaaggatta ttccctggtg gttgactgat caccataact gctaatcatt caaactattt 8580
agtctgtgac agagccaaca cgcagtctgt cactgtcagg aaagtggtaa aactgcaact 8640
caattactgc aatgccctcg taattaagtg aatttacaat atcgtcctgt tcggagggaa 8700
gaacgcggga tgttcattct tcatcacttt taattgatgt atatgctctc ttttctgacg 8760
ttagtctccg acggcaggct tcaatgaccc aggctgagaa attcccggac cctttttgct 8820
caagagcgat gttaatttgt tcaatcattt ggttaggaaa gcggatgttg cgggttgttg 8880
ttctgcgggt tctgttcttc gttgacatga ggttgccccg tattcagtgt cgctgatttg 8940
tattgtctga agttgttttt acgttaagtt gatgcagatc aattaatacg atacctgcgt 9000
cataattgat tatttgacgt ggtttgatgg cctccacgca cgttgtgata tgtagatgat 9060
aatcattatc actttacggg tcctttccgg tgatccgaca ggttacg 9107
<210> 9
<211> 19604
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 9
catgttgatt tcctgaaacg ggatatcatc aaagccatga acaaagcagc cgcgctggat 60
gaactgatac cggggttgct gagtgaatat atcgaacagt caggttaaca ggctgcggca 120
ttttgtccgc gccgggcttc gctcactgtt caggccggag ccacagaccg ccgttgaatg 180
ggcggatgct aattactatc tcccgaaaga atccgcatac caggaagggc gctgggaaac 240
actgcccttt cagcgggcca tcatgaatgc gatgggcagc gactacatcc gtgaggtgaa 300
tgtggtgaag tctgcccgtg tcggttattc caaaatgctg ctgggtgttt atgcctactt 360
tatagagcat aagcagcgca acacccttat ctggttgccg acggatggtg atgccgagaa 420
ctttatgaaa acccacgttg agccgactat tcgtgatatt ccgtcgctgc tggcgctggc 480
cccgtggtat ggcaaaaagc accgggataa cacgctcacc atgaagcgtt tcactaatgg 540
gcgtggcttc tggtgcctgg gcggtaaagc ggcaaaaaac taccgtgaaa agtcggtgga 600
tgtggcgggt tatgatgaac ttgctgcttt tgatgatgat attgaacagg aaggctctcc 660
gacgttcctg ggtgacaagc gtattgaagg ctcggtctgg ccaaagtcca tccgtggctc 720
cacgccaaaa gtgagaggca cctgtcagat tgagcgtgca gccagtgaat ccccgcattt 780
tatgcgtttt catgttgcct gcccgcattg cggggaggag cagtatctta aatttggcga 840
caaagagacg ccgtttggcc tcaaatggac gccggatgac ccctccagcg tgttttatct 900
ctgcgagcat aatgcctgcg tcatccgcca gcaggagctg gactttactg atgcccgtta 960
tatctgcgaa aagaccggga tctggacccg tgatggcatt ctctggtttt cgtcatccgg 1020
tgaagagatt gagccacctg acagtgtgac ctttcacatc tggacagcgt acagcccgtt 1080
caccacctgg gtgcagattg tcaaagactg gatgaaaacg aaaggggata cgggaaaacg 1140
taaaaccttc gtaaacacca cgctcggtga gacgtgggag gcgaaaattg gcgaacgtcc 1200
ggatgctgaa gtgatggcag agcggaaaga gcattattca gcgcccgttc ctgaccgtgt 1260
ggcttacctg accgccggta tcgactccca gctggaccgc tacgaaatgc gcgtatgggg 1320
atgggggccg ggtgaggaaa gctggctgat tgaccggcag attattatgg gccgccacga 1380
cgatgaacag acgctgctgc gtgtggatga ggccatcaat aaaacctata cccgccggaa 1440
tggtgcagaa atgtcgatat cccgtatctg ctgggatact ggcgggattg acccgaccat 1500
tgtgtatgaa cgctcgaaaa aacatgggct gttccgggtg atccccatta aaggggcatc 1560
cgtctacgga aagccggtgg ccagcatgcc acgtaagcga aacaaaaacg gggtttacct 1620
taccgaaatc ggtacggata ccgcgaaaga gcagatttat aaccgcttca cactgacgcc 1680
ggaaggggat gaaccgcttc ccggtgccgt tcacttcccg aataacccgg atatttttga 1740
tctgaccgaa gcgcagcagc tgactgctga agagcaggtc gaaaaatggg tggatggcag 1800
gaaaaaaata ctgtgggaca gcaaaaagcg acgcaatgag gcactcgact gcttcgttta 1860
tgcgctggcg gcgctgcgca tcagtatttc ccgctggcag ctggatctca gtgcgctgct 1920
ggcgagcctg caggaagagg atggtgcagc aaccaacaag aaaacactgg cagattacgc 1980
ccgtgcctta tccggagagg atgaatgacg cgacaggaag aacttgccgc tgcccgtgcg 2040
gcactgcatg acctgatgac aggtaaacgg gtggcaacag tacagaaaga cggacgaagg 2100
gtggagttta cggccacttc cgtgtctgac ctgaaaaaat atattgcaga gctggaagtg 2160
cagaccggca tgacacagcg acgcagggga cctgcaggat tttatgtatg aaaacgccca 2220
ccattcccac ccttctgggg ccggacggca tgacatcgct gcgcgaatat gccggttatc 2280
acggcggtgg cagcggattt ggagggcagt tgcggtcgtg gaacccaccg agtgaaagtg 2340
tggatgcagc cctgttgccc aactttaccc gtggcaatgc ccgcgcagac gatctggtac 2400
gcaataacgg ctatgccgcc aacgccatcc agctgcatca ggatcatatc gtcgggtctt 2460
ttttccggct cagtcatcgc ccaagctggc gctatctggg catcggggag gaagaagccc 2520
gtgccttttc ccgcgaggtt gaagcggcat ggaaagagtt tgccgaggat gactgctgct 2580
gcattgacgt tgagcgaaaa cgcacgttta ccatgatgat tcgggaaggt gtggccatgc 2640
acgcctttaa cggtgaactg ttcgttcagg ccacctggga taccagttcg tcgcggcttt 2700
tccggacaca gttccggatg gtcagcccga agcgcatcag caacccgaac aataccggcg 2760
acagccggaa ctgccgtgcc ggtgtgcaga ttaatgacag cggtgcggcg ctgggatatt 2820
acgtcagcga ggacgggtat cctggctgga tgccgcagaa atggacatgg ataccccgtg 2880
agttacccgg cgggcgcgcc tcgttcattc acgtttttga acccgtggag gacgggcaga 2940
ctcgcggtgc aaatgtgttt tacagcgtga tggagcagat gaagatgctc gacacgctgc 3000
agaacacgca gctgcagagc gccattgtga aggcgatgta tgccgccacc attgagagtg 3060
agctggatac gcagtcagcg atggatttta ttctgggcgc gaacagtcag gagcagcggg 3120
aaaggctgac cggctggatt ggtgaaattg ccgcgtatta cgccgcagcg ccggtccggc 3180
tgggaggcgc aaaagtaccg cacctgatgc cgggtgactc actgaacctg cagacggctc 3240
aggatacgga taacggctac tccgtgtttg agcagtcact gctgcggtat atcgctgccg 3300
ggctgggtgt ctcgtatgag cagctttccc ggaattacgc ccagatgagc tactccacgg 3360
cacgggccag tgcgaacgag tcgtgggcgt actttatggg gcggcgaaaa ttcgtcgcat 3420
cccgtcaggc gagccagatg tttctgtgct ggctggaaga ggccatcgtt cgccgcgtgg 3480
tgacgttacc ttcaaaagcg cgcttcagtt ttcaggaagc ccgcagtgcc tgggggaact 3540
gcgactggat aggctccggt cgtatggcca tcgatggtct gaaagaagtt caggaagcgg 3600
tgatgctgat agaagccgga ctgagtacct acgagaaaga gtgcgcaaaa cgcggtgacg 3660
actatcagga aatttttgcc cagcaggtcc gtgaaacgat ggagcgccgt gcagccggtc 3720
ttaaaccgcc cgcctgggcg gctgcagcat ttgaatccgg gctgcgacaa tcaacagagg 3780
aggagaagag tgacagcaga gctgcgtaat ctcccgcata ttgccagcat ggcctttaat 3840
gagccgctga tgcttgaacc cgcctatgcg cgggttttct tttgtgcgct tgcaggccag 3900
cttgggatca gcagcctgac ggatgcggtg tccggcgaca gcctgactgc ccaggaggca 3960
ctcgcgacgc tggcattatc cggtgatgat gacggaccac gacaggcccg cagttatcag 4020
gtcatgaacg gcatcgccgt gctgccggtg tccggcacgc tggtcagccg gacgcgggcg 4080
ctgcagccgt actcggggat gaccggttac aacggcatta tcgcccgtct gcaacaggct 4140
gccagcgatc cgatggtgga cggcattctg ctcgatatgg acacgcccgg cgggatggtg 4200
gcgggggcat ttgactgcgc tgacatcatc gcccgtgtgc gtgacataaa accggtatgg 4260
gcgcttgcca acgacatgaa ctgcagtgca ggtcagttgc ttgccagtgc cgcctcccgg 4320
cgtctggtca cgcagaccgc ccggacaggc tccatcggcg tcatgatggc tcacagtaat 4380
tacggtgctg cgctggagaa acagggtgtg gaaatcacgc tgatttacag cggcagccat 4440
aaggtggatg gcaaccccta cagccatctt ccggatgacg tccgggagac actgcagtcc 4500
cggatggacg caacccgcca gatgtttgcg cagaaggtgt cggcatatac cggcctgtcc 4560
gtgcaggttg tgctggatac cgaggctgca gtgtacagcg gtcaggaggc cattgatgcc 4620
ggactggctg atgaacttgt taacagcacc gatgcgatca ccgtcatgcg tgatgcactg 4680
gatgcacgta aatcccgtct ctcaggaggg cgaatgacca aagagactca atcaacaact 4740
gtttcagcca ctgcttcgca ggctgacgtt actgacgtgg tgccagcgac ggagggcgag 4800
aacgccagcg cggcgcagcc ggacgtgaac gcgcagatca ccgcagcggt tgcggcagaa 4860
aacagccgca ttatggggat cctcaactgt gaggaggctc acggacgcga agaacaggca 4920
cgcgtgctgg cagaaacccc cggtatgacc gtgaaaacgg cccgccgcat tctggccgca 4980
gcaccacaga gtgcacaggc gcgcagtgac actgcgctgg atcgtctgat gcagggggca 5040
ccggcaccgc tggctgcagg taacccggca tctgatgccg ttaacgattt gctgaacaca 5100
ccagtgtaag ggatgtttat gacgagcaaa gaaaccttta cccattacca gccgcagggc 5160
aacagtgacc cggctcatac cgcaaccgcg cccggcggat tgagtgcgaa agcgcctgca 5220
atgaccccgc tgatgctgga cacctccagc cgtaagctgg ttgcgtggga tggcaccacc 5280
gacggtgctg ccgttggcat tcttgcggtt gctgctgacc agaccagcac cacgctgacg 5340
ttctacaagt ccggcacgtt ccgttatgag gatgtgctct ggccggaggc tgccagcgac 5400
gagacgaaaa aacggaccgc gtttgccgga acggcaatca gcatcgttta actttaccct 5460
tcatcactaa aggccgcctg tgcggctttt tttacgggat ttttttatgt cgatgtacac 5520
aaccgcccaa ctgctggcgg caaatgagca gaaatttaag tttgatccgc tgtttctgcg 5580
tctctttttc cgtgagagct atcccttcac cacggagaaa gtctatctct cacaaattcc 5640
gggactggta aacatggcgc tgtacgtttc gccgattgtt tccggtgagg ttatccgttc 5700
ccgtggcggc tccacctctg aatttacgcc gggatatgtc aagccgaagc atgaagtgaa 5760
tccgcagatg accctgcgtc gcctgccgga tgaagatccg cagaatctgg cggacccggc 5820
ttaccgccgc cgtcgcatca tcatgcagaa catgcgtgac gaagagctgg ccattgctca 5880
ggtcgaagag atgcaggcag tttctgccgt gcttaagggc aaatacacca tgaccggtga 5940
agccttcgat ccggttgagg tggatatggg ccgcagtgag gagaataaca tcacgcagtc 6000
cggcggcacg gagtggagca agcgtgacaa gtccacgtat gacccgaccg acgatatcga 6060
agcctacgcg ctgaacgcca gcggtgtggt gaatatcatc gtgttcgatc cgaaaggctg 6120
ggcgctgttc cgttccttca aagccgtcaa ggagaagctg gatacccgtc gtggctctaa 6180
ttccgagctg gagacagcgg tgaaagacct gggcaaagcg gtgtcctata aggggatgta 6240
tggcgatgtg gccatcgtcg tgtattccgg acagtacgtg gaaaacggcg tcaaaaagaa 6300
cttcctgccg gacaacacga tggtgctggg gaacactcag gcacgcggtc tgcgcaccta 6360
tggctgcatt caggatgcgg acgcacagcg cgaaggcatt aacgcctctg cccgttaccc 6420
gaaaaactgg gtgaccaccg gcgatccggc gcgtgagttc accatgattc agtcagcacc 6480
gctgatgctg ctggctgacc ctgatgagtt cgtgtccgta caactggcgt aatcatggcc 6540
cttcggggcc attgtttctc tgtggaggag tccatgacga aagatgaact gattgcccgt 6600
ctccgctcgc tgggtgaaca actgaaccgt gatgtcagcc tgacggggac gaaagaagaa 6660
ctggcgctcc gtgtggcaga gctgaaagag gagcttgatg acacggatga aactgccggt 6720
caggacaccc ctctcagccg ggaaaatgtg ctgaccggac atgaaaatga ggtgggatca 6780
gcgcagccgg ataccgtgat tctggatacg tctgaactgg tcacggtcgt ggcactggtg 6840
aagctgcata ctgatgcact tcacgccacg cgggatgaac ctgtggcatt tgtgctgccg 6900
ggaacggcgt ttcgtgtctc tgccggtgtg gcagccgaaa tgacagagcg cggcctggcc 6960
agaatgcaat aacgggaggc gctgtggctg atttcgataa cctgttcgat gctgccattg 7020
cccgcgccga tgaaacgata cgcgggtaca tgggaacgtc agccaccatt acatccggtg 7080
agcagtcagg tgcggtgata cgtggtgttt ttgatgaccc tgaaaatatc agctatgccg 7140
gacagggcgt gcgcgttgaa ggctccagcc cgtccctgtt tgtccggact gatgaggtgc 7200
ggcagctgcg gcgtggagac acgctgacca tcggtgagga aaatttctgg gtagatcggg 7260
tttcgccgga tgatggcgga agttgtcatc tctggcttgg acggggcgta ccgcctgccg 7320
ttaaccgtcg ccgctgaaag ggggatgtat ggccataaaa ggtcttgagc aggccgttga 7380
aaacctcagc cgtatcagca aaacggcggt gcctggtgcc gccgcaatgg ccattaaccg 7440
cgttgcttca tccgcgatat cgcagtcggc gtcacaggtt gcccgtgaga caaaggtacg 7500
ccggaaactg gtaaaggaaa gggccaggct gaaaagggcc acggtcaaaa atccgcaggc 7560
cagaatcaaa gttaaccggg gggatttgcc cgtaatcaag ctgggtaatg cgcgggttgt 7620
cctttcgcgc cgcaggcgtc gtaaaaaggg gcagcgttca tccctgaaag gtggcggcag 7680
cgtgcttgtg gtgggtaacc gtcgtattcc cggcgcgttt attcagcaac tgaaaaatgg 7740
ccggtggcat gtcatgcagc gtgtggctgg gaaaaaccgt taccccattg atgtggtgaa 7800
aatcccgatg gcggtgccgc tgaccacggc gtttaaacaa aatattgagc ggatacggcg 7860
tgaacgtctt ccgaaagagc tgggctatgc gctgcagcat caactgagga tggtaataaa 7920
gcgatgaaac atactgaact ccgtgcagcc gtactggatg cactggagaa gcatgacacc 7980
ggggcgacgt tttttgatgg tcgccccgct gtttttgatg aggcggattt tccggcagtt 8040
gccgtttatc tcaccggcgc tgaatacacg ggcgaagagc tggacagcga tacctggcag 8100
gcggagctgc atatcgaagt tttcctgcct gctcaggtgc cggattcaga gctggatgcg 8160
tggatggagt cccggattta tccggtgatg agcgatatcc cggcactgtc agatttgatc 8220
accagtatgg tggccagcgg ctatgactac cggcgcgacg atgatgcggg cttgtggagt 8280
tcagccgatc tgacttatgt cattacctat gaaatgtgag gacgctatgc ctgtaccaaa 8340
tcctacaatg ccggtgaaag gtgccgggac caccctgtgg gtttataagg ggagcggtga 8400
cccttacgcg aatccgcttt cagacgttga ctggtcgcgt ctggcaaaag ttaaagacct 8460
gacgcccggc gaactgaccg ctgagtccta tgacgacagc tatctcgatg atgaagatgc 8520
agactggact gcgaccgggc aggggcagaa atctgccgga gataccagct tcacgctggc 8580
gtggatgccc ggagagcagg ggcagcaggc gctgctggcg tggtttaatg aaggcgatac 8640
ccgtgcctat aaaatccgct tcccgaacgg cacggtcgat gtgttccgtg gctgggtcag 8700
cagtatcggt aaggcggtga cggcgaagga agtgatcacc cgcacggtga aagtcaccaa 8760
tgtgggacgt ccgtcgatgg cagaagatcg cagcacggta acagcggcaa ccggcatgac 8820
cgtgacgcct gccagcacct cggtggtgaa agggcagagc accacgctga ccgtggcctt 8880
ccagccggag ggcgtaaccg acaagagctt tcgtgcggtg tctgcggata aaacaaaagc 8940
caccgtgtcg gtcagtggta tgaccatcac cgtgaacggc gttgctgcag gcaaggtcaa 9000
cattccggtt gtatccggta atggtgagtt tgctgcggtt gcagaaatta ccgtcaccgc 9060
cagttaatcc ggagagtcag cgatgttcct gaaaaccgaa tcatttgaac ataacggtgt 9120
gaccgtcacg ctttctgaac tgtcagccct gcagcgcatt gagcatctcg ccctgatgaa 9180
acggcaggca gaacaggcgg agtcagacag caaccggaag tttactgtgg aagacgccat 9240
cagaaccggc gcgtttctgg tggcgatgtc cctgtggcat aaccatccgc agaagacgca 9300
gatgccgtcc atgaatgaag ccgttaaaca gattgagcag gaagtgctta ccacctggcc 9360
cacggaggca atttctcatg ctgaaaacgt ggtgtaccgg ctgtctggta tgtatgagtt 9420
tgtggtgaat aatgcccctg aacagacaga ggacgccggg cccgcagagc ctgtttctgc 9480
gggaaagtgt tcgacggtga gctgagtttt gccctgaaac tggcgcgtga gatggggcga 9540
cccgactggc gtgccatgct tgccgggatg tcatccacgg agtatgccga ctggcaccgc 9600
ttttacagta cccattattt tcatgatgtt ctgctggata tgcacttttc cgggctgacg 9660
tacaccgtgc tcagcctgtt tttcagcgat ccggatatgc atccgctgga tttcagtctg 9720
ctgaaccggc gcgaggctga cgaagagcct gaagatgatg tgctgatgca gaaagcggca 9780
gggcttgccg gaggtgtccg ctttggcccg gacgggaatg aagttatccc cgcttccccg 9840
gatgtggcgg acatgacgga ggatgacgta atgctgatga cagtatcaga agggatcgca 9900
ggaggagtcc ggtatggctg aaccggtagg cgatctggtc gttgatttga gtctggatgc 9960
ggccagattt gacgagcaga tggccagagt caggcgtcat ttttctggta cggaaagtga 10020
tgcgaaaaaa acagcggcag tcgttgaaca gtcgctgagc cgacaggcgc tggctgcaca 10080
gaaagcgggg atttccgtcg ggcagtataa agccgccatg cgtatgctgc ctgcacagtt 10140
caccgacgtg gccacgcagc ttgcaggcgg gcaaagtccg tggctgatcc tgctgcaaca 10200
gggggggcag gtgaaggact ccttcggcgg gatgatcccc atgttcaggg ggcttgccgg 10260
tgcgatcacc ctgccgatgg tgggggccac ctcgctggcg gtggcgaccg gtgcgctggc 10320
gtatgcctgg tatcagggca actcaaccct gtccgatttc aacaaaacgc tggtcctttc 10380
cggcaatcag gcgggactga cggcagatcg tatgctggtc ctgtccagag ccgggcaggc 10440
ggcagggctg acgtttaacc agaccagcga gtcactcagc gcactggtta aggcgggggt 10500
aagcggtgag gctcagattg cgtccatcag ccagagtgtg gcgcgtttct cctctgcatc 10560
cggcgtggag gtggacaagg tcgctgaagc cttcgggaag ctgaccacag acccgacgtc 10620
ggggctgacg gcgatggctc gccagttcca taacgtgtcg gcggagcaga ttgcgtatgt 10680
tgctcagttg cagcgttccg gcgatgaagc cggggcattg caggcggcga acgaggccgc 10740
aacgaaaggg tttgatgacc agacccgccg cctgaaagag aacatgggca cgctggagac 10800
ctgggcagac aggactgcgc gggcattcaa atccatgtgg gatgcggtgc tggatattgg 10860
tcgtcctgat accgcgcagg agatgctgat taaggcagag gctgcgtata agaaagcaga 10920
cgacatctgg aatctgcgca aggatgatta ttttgttaac gatgaagcgc gggcgcgtta 10980
ctgggatgat cgtgaaaagg cccgtcttgc gcttgaagcc gcccgaaaga aggctgagca 11040
gcagactcaa caggacaaaa atgcgcagca gcagagcgat accgaagcgt cacggctgaa 11100
atataccgaa gaggcgcaga aggcttacga acggctgcag acgccgctgg agaaatatac 11160
cgcccgtcag gaagaactga acaaggcact gaaagacggg aaaatcctgc aggcggatta 11220
caacacgctg atggcggcgg cgaaaaagga ttatgaagcg acgctgaaaa agccgaaaca 11280
gtccagcgtg aaggtgtctg cgggcgatcg tcaggaagac agtgctcatg ctgccctgct 11340
gacgcttcag gcagaactcc ggacgctgga gaagcatgcc ggagcaaatg agaaaatcag 11400
ccagcagcgc cgggatttgt ggaaggcgga gagtcagttc gcggtactgg aggaggcggc 11460
gcaacgtcgc cagctgtctg cacaggagaa atccctgctg gcgcataaag atgagacgct 11520
ggagtacaaa cgccagctgg ctgcacttgg cgacaaggtt acgtatcagg agcgcctgaa 11580
cgcgctggcg cagcaggcgg ataaattcgc acagcagcaa cgggcaaaac gggccgccat 11640
tgatgcgaaa agccgggggc tgactgaccg gcaggcagaa cgggaagcca cggaacagcg 11700
cctgaaggaa cagtatggcg ataatccgct ggcgctgaat aacgtcatgt cagagcagaa 11760
aaagacctgg gcggctgaag accagcttcg cgggaactgg atggcaggcc tgaagtccgg 11820
ctggagtgag tgggaagaga gcgccacgga cagtatgtcg caggtaaaaa gtgcagccac 11880
gcagaccttt gatggtattg cacagaatat ggcggcgatg ctgaccggca gtgagcagaa 11940
ctggcgcagc ttcacccgtt ccgtgctgtc catgatgaca gaaattctgc ttaagcaggc 12000
aatggtgggg attgtcggga gtatcggcag cgccattggc ggggctgttg gtggcggcgc 12060
atccgcgtca ggcggtacag ccattcaggc cgctgcggcg aaattccatt ttgcaaccgg 12120
aggatttacg ggaaccggcg gcaaatatga gccagcgggg attgttcacc gtggtgagtt 12180
tgtcttcacg aaggaggcaa ccagccggat tggcgtgggg aatctttacc ggctgatgcg 12240
cggctatgcc accggcggtt atgtcggtac accgggcagc atggcagaca gccggtcgca 12300
ggcgtccggg acgtttgagc agaataacca tgtggtgatt aacaacgacg gcacgaacgg 12360
gcagataggt ccggctgctc tgaaggcggt gtatgacatg gcccgcaagg gtgcccgtga 12420
tgaaattcag acacagatgc gtgatggtgg cctgttctcc ggaggtggac gatgaagacc 12480
ttccgctgga aagtgaaacc cggtatggat gtggcttcgg tcccttctgt aagaaaggtg 12540
cgctttggtg atggctattc tcagcgagcg cctgccgggc tgaatgccaa cctgaaaacg 12600
tacagcgtga cgctttctgt cccccgtgag gaggccacgg tactggagtc gtttctggaa 12660
gagcacgggg gctggaaatc ctttctgtgg acgccgcctt atgagtggcg gcagataaag 12720
gtgacctgcg caaaatggtc gtcgcgggtc agtatgctgc gtgttgagtt cagcgcagag 12780
tttgaacagg tggtgaactg atgcaggata tccggcagga aacactgaat gaatgcaccc 12840
gtgcggagca gtcggccagc gtggtgctct gggaaatcga cctgacagag gtcggtggag 12900
aacgttattt tttctgtaat gagcagaacg aaaaaggtga gccggtcacc tggcaggggc 12960
gacagtatca gccgtatccc attcagggga gcggttttga actgaatggc aaaggcacca 13020
gtacgcgccc cacgctgacg gtttctaacc tgtacggtat ggtcaccggg atggcggaag 13080
atatgcagag tctggtcggc ggaacggtgg tccggcgtaa ggtttacgcc cgttttctgg 13140
atgcggtgaa cttcgtcaac ggaaacagtt acgccgatcc ggagcaggag gtgatcagcc 13200
gctggcgcat tgagcagtgc agcgaactga gcgcggtgag tgcctccttt gtactgtcca 13260
cgccgacgga aacggatggc gctgtttttc cgggacgtat catgctggcc aacacctgca 13320
cctggaccta tcgcggtgac gagtgcggtt atagcggtcc ggctgtcgcg gatgaatatg 13380
accagccaac gtccgatatc acgaaggata aatgcagcaa atgcctgagc ggttgtaagt 13440
tccgcaataa cgtcggcaac tttggcggct tcctttccat taacaaactt tcgcagtaaa 13500
tcccatgaca cagacagaat cagcgattct ggcgcacgcc cggcgatgtg cgccagcgga 13560
gtcgtgcggc ttcgtggtaa gcacgccgga gggggaaaga tatttcccct gcgtgaatat 13620
ctccggtgag ccggaggcta tttccgtatg tcgccggaag actggctgca ggcagaaatg 13680
cagggtgaga ttgtggcgct ggtccacagc caccccggtg gtctgccctg gctgagtgag 13740
gccgaccggc ggctgcaggt gcagagtgat ttgccgtggt ggctggtctg ccgggggacg 13800
attcataagt tccgctgtgt gccgcatctc accgggcggc gctttgagca cggtgtgacg 13860
gactgttaca cactgttccg ggatgcttat catctggcgg ggattgagat gccggacttt 13920
catcgtgagg atgactggtg gcgtaacggc cagaatctct atctggataa tctggaggcg 13980
acggggctgt atcaggtgcc gttgtcagcg gcacagccgg gcgatgtgct gctgtgctgt 14040
tttggttcat cagtgccgaa tcacgccgca atttactgcg gcgacggcga gctgctgcac 14100
catattcctg aacaactgag caaacgagag aggtacaccg acaaatggca gcgacgcaca 14160
cactccctct ggcgtcaccg ggcatggcgc gcatctgcct ttacggggat ttacaacgat 14220
ttggtcgccg catcgacctt cgtgtgaaaa cgggggctga agccatccgg gcactggcca 14280
cacagctccc ggcgtttcgt cagaaactga gcgacggctg gtatcaggta cggattgccg 14340
ggcgggacgt cagcacgtcc gggttaacgg cgcagttaca tgagactctg cctgatggcg 14400
ctgtaattca tattgttccc agagtcgccg gggccaagtc aggtggcgta ttccagattg 14460
tcctgggggc tgccgccatt gccggatcat tctttaccgc cggagccacc cttgcagcat 14520
ggggggcagc cattggggcc ggtggtatga ccggcatcct gttttctctc ggtgccagta 14580
tggtgctcgg tggtgtggcg cagatgctgg caccgaaagc cagaactccc cgtatacaga 14640
caacggataa cggtaagcag aacacctatt tctcctcact ggataacatg gttgcccagg 14700
gcaatgttct gcctgttctg tacggggaaa tgcgcgtggg gtcacgcgtg gtttctcagg 14760
agatcagcac ggcagacgaa ggggacggtg gtcaggttgt ggtgattggt cgctgatgca 14820
aaatgtttta tgtgaaaccg cctgcgggcg gttttgtcat ttatggagcg tgaggaatgg 14880
gtaaaggaag cagtaagggg cataccccgc gcgaagcgaa ggacaacctg aagtccacgc 14940
agttgctgag tgtgatcgat gccatcagcg aagggccgat tgaaggtccg gtggatggct 15000
taaaaagcgt gctgctgaac agtacgccgg tgctggacac tgaggggaat accaacatat 15060
ccggtgtcac ggtggtgttc cgggctggtg agcaggagca gactccgccg gagggatttg 15120
aatcctccgg ctccgagacg gtgctgggta cggaagtgaa atatgacacg ccgatcaccc 15180
gcaccattac gtctgcaaac atcgaccgtc tgcgctttac cttcggtgta caggcactgg 15240
tggaaaccac ctcaaagggt gacaggaatc cgtcggaagt ccgcctgctg gttcagatac 15300
aacgtaacgg tggctgggtg acggaaaaag acatcaccat taagggcaaa accacctcgc 15360
agtatctggc ctcggtggtg atgggtaacc tgccgccgcg cccgtttaat atccggatgc 15420
gcaggatgac gccggacagc accacagacc agctgcagaa caaaacgctc tggtcgtcat 15480
acactgaaat catcgatgtg aaacagtgct acccgaacac ggcactggtc ggcgtgcagg 15540
tggactcgga gcagttcggc agccagcagg tgagccgtaa ttatcatctg cgcgggcgta 15600
ttctgcaggt gccgtcgaac tataacccgc agacgcggca atacagcggt atctgggacg 15660
gaacgtttaa accggcatac agcaacaaca tggcctggtg tctgtgggat atgctgaccc 15720
atccgcgcta cggcatgggg aaacgtcttg gtgcggcgga tgtggataaa tgggcgctgt 15780
atgtcatcgg ccagtactgc gaccagtcag tgccggacgg ctttggcggc acggagccgc 15840
gcatcacctg taatgcgtac ctgaccacac agcgtaaggc gtgggatgtg ctcagcgatt 15900
tctgctcggc gatgcgctgt atgccggtat ggaacgggca gacgctgacg ttcgtgcagg 15960
accgaccgtc ggataagacg tggacctata accgcagtaa tgtggtgatg ccggatgatg 16020
gcgcgccgtt ccgctacagc ttcagcgccc tgaaggaccg ccataatgcc gttgaggtga 16080
actggattga cccgaacaac ggctgggaga cggcgacaga gcttgttgaa gatacgcagg 16140
ccattgcccg ttacggtcgt aatgttacga agatggatgc ctttggctgt accagccggg 16200
ggcaggcaca ccgcgccggg ctgtggctga ttaaaacaga actgctggaa acgcagaccg 16260
tggatttcag cgtcggcgca gaagggcttc gccatgtacc gggcgatgtt attgaaatct 16320
gcgatgatga ctatgccggt atcagcaccg gtggtcgtgt gctggcggtg aacagccaga 16380
cccggacgct gacgctcgac cgtgaaatca cgctgccatc ctccggtacc gcgctgataa 16440
gcctggttga cggaagtggc aatccggtca gcgtggaggt tcagtccgtc accgacggcg 16500
tgaaggtaaa agtgagccgt gttcctgacg gtgttgctga atacagcgta tgggagctga 16560
agctgccgac gctgcgccag cgactgttcc gctgcgtgag tatccgtgag aacgacgacg 16620
gcacgtatgc catcaccgcc gtgcagcatg tgccggaaaa agaggccatc gtggataacg 16680
gggcgcactt tgacggcgaa cagagtggca cggtgaatgg tgtcacgccg ccagcggtgc 16740
agcacctgac cgcagaagtc actgcagaca gcggggaata tcaggtgctg gcgcgatggg 16800
acacaccgaa ggtggtgaag ggcgtgagtt tcctgctccg tctgaccgta acagcggacg 16860
acggcagtga gcggctggtc agcacggccc ggacgacgga aaccacatac cgcttcacgc 16920
aactggcgct ggggaactac aggctgacag tccgggcggt aaatgcgtgg gggcagcagg 16980
gcgatccggc gtcggtatcg ttccggattg ccgcaccggc agcaccgtcg aggattgagc 17040
tgacgccggg ctattttcag ataaccgcca cgccgcatct tgccgtttat gacccgacgg 17100
tacagtttga gttctggttc tcggaaaagc agattgcgga tatcagacag gttgaaacca 17160
gcacgcgtta tcttggtacg gcgctgtact ggatagccgc cagtatcaat atcaaaccgg 17220
gccatgatta ttacttttat atccgcagtg tgaacaccgt tggcaaatcg gcattcgtgg 17280
aggccgtcgg tcgggcgagc gatgatgcgg aaggttacct ggattttttc aaaggcaaga 17340
taaccgaatc ccatctcggc aaggagctgc tggaaaaagt cgagctgacg gaggataacg 17400
ccagcagact ggaggagttt tcgaaagagt ggaaggatgc cagtgataag tggaatgcca 17460
tgtgggctgt caaaattgag cagaccaaag acggcaaaca ttatgtcgcg ggtattggcc 17520
tcagcatgga ggacacggag gaaggcaaac tgagccagtt tctggttgcc gccaatcgta 17580
tcgcatttat tgacccggca aacgggaatg aaacgccgat gtttgtggcg cagggcaacc 17640
agatattcat gaacgacgtg ttcctgaagc gcctgacggc ccccaccatt accagcggcg 17700
gcaatcctcc ggccttttcc ctgacaccgg acggaaagct gaccgctaaa aatgcggata 17760
tcagtggcag tgtgaatgcg aactccggga cgctcagtaa tgtgacgata gctgaaaact 17820
gtacgataaa cggtacgctg agggcggaaa aaatcgtcgg ggacattgta aaggcggcga 17880
gcgcggcttt tccgcgccag cgtgaaagca gtgtggactg gccgtcaggt acccgtactg 17940
tcaccgtgac cgatgaccat ccttttgatc gccagatagt ggtgcttccg ctgacgtttc 18000
gcggaagtaa gcgtactgtc agcggcagga caacgtattc gatgtgttat ctgaaagtac 18060
tgatgaacgg tgcggtgatt tatgatggcg cggcgaacga ggcggtacag gtgttctccc 18120
gtattgttga catgccagcg ggtcggggaa acgtgatcct gacgttcacg cttacgtcca 18180
cacggcattc ggcagatatt ccgccgtata cgtttgccag cgatgtgcag gttatggtga 18240
ttaagaaaca ggcgctgggc atcagcgtgg tctgagtgtg ttacagaggt tcgtccggga 18300
acgggcgttt tattataaaa cagtgagagg tgaacgatgc gtaatgtgtg tattgccgtt 18360
gctgtctttg ccgcacttgc ggtgacagtc actccggccc gtgcggaagg tggacatggt 18420
acgtttacgg tgggctattt tcaagtgaaa ccgggtacat tgccgtcgtt gtcgggcggg 18480
gataccggtg tgagtcatct gaaagggatt aacgtgaagt accgttatga gctgacggac 18540
agtgtggggg tgatggcttc cctggggttc gccgcgtcga aaaagagcag cacagtgatg 18600
accggggagg atacgtttca ctatgagagc ctgcgtggac gttatgtgag cgtgatggcc 18660
ggaccggttt tacaaatcag taagcaggtc agtgcgtacg ccatggccgg agtggctcac 18720
agtcggtggt ccggcagtac aatggattac cgtaagacgg aaatcactcc cgggtatatg 18780
aaagagacga ccactgccag ggacgaaagt gcaatgcggc atacctcagt ggcgtggagt 18840
gcaggtatac agattaatcc ggcagcgtcc gtcgttgttg atattgctta tgaaggctcc 18900
ggcagtggcg actggcgtac tgacggattc atcgttgggg tcggttataa attctgatta 18960
gccaggtaac acagtgttat gacagcccgc cggaaccggt gggctttttt gtggggtgaa 19020
tatggcagta aagatttcag gagtcctgaa agacggcaca ggaaaaccgg tacagaactg 19080
caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 19140
agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 19200
catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 19260
ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 19320
ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 19380
ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 19440
ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 19500
acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 19560
cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aaaa 19604
<210> 10
<211> 10058
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 10
acgcggcggc caccagtgcc ggtgcggcga aaacgtcaga aacgaatgct gcagcgtcac 60
aacaatcagc cgccacgtct gcctccaccg cggccacgaa agcgtcagag gccgccactt 120
cagcacgaga tgcggtggcc tcaaaagagg cagcaaaatc atcagaaacg aacgcatcat 180
caagtgccgg tcgtgcagct tcctcggcaa cggcggcaga aaattctgcc agggcggcaa 240
aaacgtccga gacgaatgcc aggtcatctg aaacagcagc ggaacggagc gcctctgccg 300
cggcagacgc aaaaacagcg gcggcgggga gtgcgtcaac ggcatccacg aaggcgacag 360
aggctgcggg aagtgcggta tcagcatcgc agagcaaaag tgcggcagaa gcggcggcaa 420
tacgtgcaaa aaattcggca aaacgtgcag aagatatagc ttcagctgtc gcgcttgagg 480
atgcggacac aacgagaaag gggatagtgc agctcagcag tgcaaccaac agcacgtctg 540
aaacgcttgc tgcaacgcca aaggcggtta aggtggtaat ggatgaaacg aacagaaaag 600
cccactggac agtccggcac tgaccggaac gccaacagca ccaaccgcgc tcaggggaac 660
aaacaatacc cagattgcga acaccgcttt tgtactggcc gcgattgcag atgttatcga 720
cgcgtcacct gacgcactga atacgctgaa tgaactggcc gcagcgctcg ggaatgatcc 780
agattttgct accaccatga ctaacgcgct tgcgggtaaa caaccgaaga atgcgacact 840
gacggcgctg gcagggcttt ccacggcgaa aaataaatta ccgtattttg cggaaaatga 900
tgccgccagc ctgactgaac tgactcaggt tggcagggat attctggcaa aaaattccgt 960
tgcagatgtt cttgaatacc ttggggccgg tgagaattcg gcctttccgg caggtgcgcc 1020
gatcccgtgg ccatcagata tcgttccgtc tggctacgtc ctgatgcagg ggcaggcgtt 1080
tgacaaatca gcctacccaa aacttgctgt cgcgtatcca tcgggtgtgc ttcctgatat 1140
gcgaggctgg acaatcaagg ggaaacccgc cagcggtcgt gctgtattgt ctcaggaaca 1200
ggatggaatt aagtcgcaca cccacagtgc cagtgcatcc ggtacggatt tggggacgaa 1260
aaccacatcg tcgtttgatt acgggacgaa aacaacaggc agtttcgatt acggcaccaa 1320
atcgacgaat aacacggggg ctcatgctca cagtctgagc ggttcaacag gggccgcggg 1380
tgctcatgcc cacacaagtg gtttaaggat gaacagttct ggctggagtc agtatggaac 1440
agcaaccatt acaggaagtt tatccacagt taaaggaacc agcacacagg gtattgctta 1500
tttatcgaaa acggacagtc agggcagcca cagtcactca ttgtccggta cagccgtgag 1560
tgccggtgca catgcgcata cagttggtat tggtgcgcac cagcatccgg ttgttatcgg 1620
tgctcatgcc cattctttca gtattggttc acacggacac accatcaccg ttaacgctgc 1680
gggtaacgcg gaaaacaccg tcaaaaacat tgcatttaac tatattgtga ggcttgcata 1740
atggcattca gaatgagtga acaaccacgg accataaaaa tttataatct gctggccgga 1800
actaatgaat ttattggtga aggtgacgca tatattccgc ctcataccgg tctgcctgca 1860
aacagtaccg atattgcacc gccagatatt ccggctggct ttgtggctgt tttcaacagt 1920
gatgaggcat cgtggcatct cgttgaagac catcggggta aaaccgtcta tgacgtggct 1980
tccggcgacg cgttatttat ttctgaactc ggtccgttac cggaaaattt tacctggtta 2040
tcgccgggag gggaatatca gaagtggaac ggcacagcct gggtgaagga tacggaagca 2100
gaaaaactgt tccggatccg ggaggcggaa gaaacaaaaa aaagcctgat gcaggtagcc 2160
agtgagcata ttgcgccgct tcaggatgct gcagatctgg aaattgcaac gaaggaagaa 2220
acctcgttgc tggaagcctg gaagaagtat cgggtgttgc tgaaccgtgt tgatacatca 2280
actgcacctg atattgagtg gcctgctgtc cctgttatgg agtaatcgtt ttgtgatatg 2340
ccgcagaaac gttgtatgaa ataacgttct gcggttagtt agtatattgt aaagctgagt 2400
attggtttat ttggcgatta ttatcttcag gagaataatg gaagttctat gactcaattg 2460
ttcatagtgt ttacatcacc gccaattgct tttaagactg aacgcatgaa atatggtttt 2520
tcgtcatgtt ttgagtctgc tgttgatatt tctaaagtcg gttttttttc ttcgttttct 2580
ctaactattt tccatgaaat acatttttga ttattatttg aatcaattcc aattacctga 2640
agtctttcat ctataattgg cattgtatgt attggtttat tggagtagat gcttgctttt 2700
ctgagccata gctctgatat ccaaatgaag ccataggcat ttgttatttt ggctctgtca 2760
gctgcataac gccaaaaaat atatttatct gcttgatctt caaatgttgt attgattaaa 2820
tcaattggat ggaattgttt atcataaaaa attaatgttt gaatgtgata accgtccttt 2880
aaaaaagtcg tttctgcaag cttggctgta tagtcaacta actcttctgt cgaagtgata 2940
tttttaggct tatctaccag ttttagacgc tctttaatat cttcaggaat tattttattg 3000
tcatattgta tcatgctaaa tgacaatttg cttatggagt aatcttttaa ttttaaataa 3060
gttattctcc tggcttcatc aaataaagag tcgaatgatg ttggcgaaat cacatcgtca 3120
cccattggat tgtttatttg tatgccaaga gagttacagc agttatacat tctgccatag 3180
attatagcta aggcatgtaa taattcgtaa tcttttagcg tattagcgac ccatcgtctt 3240
tctgatttaa taatagatga ttcagttaaa tatgaaggta atttcttttg tgcaagtctg 3300
actaactttt ttataccaat gtttaacata ctttcatttg taataaactc aatgtcattt 3360
tcttcaatgt aagatgaaat aagagtagcc tttgcctcgc tatacatttc taaatcgcct 3420
tgtttttcta tcgtattgcg agaattttta gcccaagcca ttaatggatc atttttccat 3480
ttttcaataa cattattgtt ataccaaatg tcatatccta taatctggtt tttgtttttt 3540
tgaataataa atgttactgt tcttgcggtt tggaggaatt gattcaaatt caagcgaaat 3600
aattcagggt caaaatatgt atcaatgcag catttgagca agtgcgataa atctttaagt 3660
cttctttccc atggtttttt agtcataaaa ctctccattt tgataggttg catgctagat 3720
gctgatatat tttagaggtg ataaaattaa ctgcttaact gtcaatgtaa tacaagttgt 3780
ttgatctttg caatgattct tatcagaaac catatagtaa attagttaca caggaaattt 3840
ttaatattat tattatcatt cattatgtat taaaattaga gttgtggctt ggctctgcta 3900
acacgttgct cataggagat atggtagagc cgcagacacg tcgtatgcag gaacgtgctg 3960
cggctggctg gtgaacttcc gatagtgcgg gtgttgaatg atttccagtt gctaccgatt 4020
ttacatattt tttgcatgag agaatttgta ccacctccca ccgaccatct atgactgtac 4080
gccactgtcc ctaggactgc tatgtgccgg agcggacatt acaaacgtcc ttctcggtgc 4140
atgccactgt tgccaatgac ctgcctagga attggttagc aagttactac cggattttgt 4200
aaaaacagcc ctcctcatat aaaaagtatt cgttcacttc cgataagcgt cgtaattttc 4260
tatctttcat catattctag atccctctga aaaaatcttc cgagtttgct aggcactgat 4320
acataactct tttccaataa ttggggaagt cattcaaatc tataataggt ttcagatttg 4380
cttcaataaa ttctgactgt agctgctgaa acgttgcggt tgaactatat ttccttataa 4440
cttttacgaa agagtttctt tgagtaatca cttcactcaa gtgcttccct gcctccaaac 4500
gatacctgtt agcaatattt aatagcttga aatgatgaag agctctgtgt ttgtcttcct 4560
gcctccagtt cgccgggcat tcaacataaa aactgatagc acccggagtt ccggaaacga 4620
aatttgcata tacccattgc tcacgaaaaa aaatgtcctt gtcgatatag ggatgaatcg 4680
cttggtgtac ctcatctact gcgaaaactt gacctttctc tcccatattg cagtcgcggc 4740
acgatggaac taaattaata ggcatcaccg aaaattcagg ataatgtgca ataggaagaa 4800
aatgatctat attttttgtc tgtcctatat caccacaaaa tggacatttt tcacctgatg 4860
aaacaagcat gtcatcgtaa tatgttctag cgggtttgtt tttatctcgg agattatttt 4920
cataaagctt ttctaattta acctttgtca ggttaccaac tactaaggtt gtaggctcaa 4980
gagggtgtgt cctgtcgtag gtaaataact gacctgtcga gcttaatatt ctatattgtt 5040
gttctttctg caaaaaagtg gggaagtgag taatgaaatt atttctaaca tttatctgca 5100
tcataccttc cgagcattta ttaagcattt cgctataagt tctcgctgga agaggtagtt 5160
ttttcattgt actttacctt catctctgtt cattatcatc gcttttaaaa cggttcgacc 5220
ttctaatcct atctgaccat tataattttt tagaatggtt tcataagaaa gctctgaatc 5280
aacggactgc gataataagt ggtggtatcc agaatttgtc acttcaagta aaaacacctc 5340
acgagttaaa acacctaagt tctcaccgaa tgtctcaata tccggacgga taatatttat 5400
tgcttctctt gaccgtagga ctttccacat gcaggatttt ggaacctctt gcagtactac 5460
tggggaatga gttgcaatta ttgctacacc attgcgtgca tcgagtaagt cgcttaatgt 5520
tcgtaaaaaa gcagagagca aaggtggatg cagatgaacc tctggttcat cgaataaaac 5580
taatgacttt tcgccaacga catctactaa tcttgtgata gtaaataaaa caattgcatg 5640
tccagagctc attcgaagca gatatttctg gatattgtca taaaacaatt tagtgaattt 5700
atcatcgtcc acttgaatct gtggttcatt acgtcttaac tcttcatatt tagaaatgag 5760
gctgatgagt tccatatttg aaaagttttc atcactactt agttttttga tagcttcaag 5820
ccagagttgt ctttttctat ctactctcat acaaccaata aatgctgaaa tgaattctaa 5880
gcggagatcg cctagtgatt ttaaactatt gctggcagca ttcttgagtc caatataaaa 5940
gtattgtgta ccttttgctg ggtcaggttg ttctttagga ggagtaaaag gatcaaatgc 6000
actaaacgaa actgaaacaa gcgatcgaaa atatcccttt gggattcttg actcgataag 6060
tctattattt tcagagaaaa aatattcatt gttttctggg ttggtgattg caccaatcat 6120
tccattcaaa attgttgttt taccacaccc attccgcccg ataaaagcat gaatgttcgt 6180
gctgggcata gaattaaccg tcacctcaaa aggtatagtt aaatcactga atccgggagc 6240
actttttcta ttaaatgaaa agtggaaatc tgacaattct ggcaaaccat ttaacacacg 6300
tgcgaactgt ccatgaattt ctgaaagagt tacccctcta agtaatgagg tgttaaggac 6360
gctttcattt tcaatgtcgg ctaatcgatt tggccatact actaaatcct gaatagcttt 6420
aagaaggtta tgtttaaaac catcgcttaa tttgctgaga ttaacatagt agtcaatgct 6480
ttcacctaag gaaaaaaaca tttcagggag ttgactgaat tttttatcta ttaatgaata 6540
agtgcttact tcttcttttt gacctacaaa accaatttta acatttccga tatcgcattt 6600
ttcaccatgc tcatcaaaga cagtaagata aaacattgta acaaaggaat agtcattcca 6660
accatctgct cgtaggaatg ccttattttt ttctactgca ggaatatacc cgcctctttc 6720
aataacacta aactccaaca tatagtaacc cttaatttta ttaaaataac cgcaatttat 6780
ttggcggcaa cacaggatct ctcttttaag ttactctcta ttacatacgt tttccatcta 6840
aaaattagta gtattgaact taacggggca tcgtattgta gttttccata tttagctttc 6900
tgcttccttt tggataaccc actgttattc atgttgcatg gtgcactgtt tataccaacg 6960
atatagtcta ttaatgcata tatagtatcg ccgaacgatt agctcttcag gcttctgaag 7020
aagcgtttca agtactaata agccgataga tagccacgga cttcgtagcc atttttcata 7080
agtgttaact tccgctcctc gctcataaca gacattcact acagttatgg cggaaaggta 7140
tgcatgctgg gtgtggggaa gtcgtgaaag aaaagaagtc agctgcgtcg tttgacatca 7200
ctgctatctt cttactggtt atgcaggtcg tagtgggtgg cacacaaagc tttgcactgg 7260
attgcgaggc tttgtgcttc tctggagtgc gacaggtttg atgacaaaaa attagcgcaa 7320
gaagacaaaa atcaccttgc gctaatgctc tgttacaggt cactaatacc atctaagtag 7380
ttgattcata gtgactgcat atgttgtgtt ttacagtatt atgtagtctg ttttttatgc 7440
aaaatctaat ttaatatatt gatatttata tcattttacg tttctcgttc agctttttta 7500
tactaagttg gcattataaa aaagcattgc ttatcaattt gttgcaacga acaggtcact 7560
atcagtcaaa ataaaatcat tatttgattt caattttgtc ccactccctg cctctgtcat 7620
cacgatactg tgatgccatg gtgtccgact tatgcccgag aagatgttga gcaaacttat 7680
cgcttatctg cttctcatag agtcttgcag acaaactgcg caactcgtga aaggtaggcg 7740
gatccccttc gaaggaaaga cctgatgctt ttcgtgcgcg cataaaatac cttgatactg 7800
tgccggatga aagcggttcg cgacgagtag atgcaattat ggtttctccg ccaagaatct 7860
ctttgcattt atcaagtgtt tccttcattg atattccgag agcatcaata tgcaatgctg 7920
ttgggatggc aatttttacg cctgttttgc tttgctcgac ataaagatat ccatctacga 7980
tatcagacca cttcatttcg cataaatcac caactcgttg cccggtaaca acagccagtt 8040
ccattgcaag tctgagccaa catggtgatg attctgctgc ttgataaatt ttcaggtatt 8100
cgtcagccgt aagtcttgat ctccttacct ctgattttgc tgcgcgagtg gcagcgacat 8160
ggtttgttgt tatatggcct tcagctattg cctctcggaa tgcatcgctc agtgttgatc 8220
tgattaactt ggctgacgcc gccttgccct cgtctatgta tccattgagc attgccgcaa 8280
tttcttttgt ggtgatgtct tcaagtggag catcaggcag acccctcctt attgctttaa 8340
ttttgctcat gtaatttatg agtgtcttct gcttgattcc tctgctggcc aggatttttt 8400
cgtagcgatc aagccatgaa tgtaacgtaa cggaattatc actgttgatt ctcgctgtca 8460
gaggcttgtg tttgtgtcct gaaaataact caatgttggc ctgtatagct tcagtgattg 8520
cgattcgcct gtctctgcct aatccaaact ctttacccgt ccttgggtcc ctgtagcagt 8580
aatatccatt gtttcttata taaaggttag ggggtaaatc ccggcgctca tgacttcgcc 8640
ttcttcccat ttctgatcct cttcaaaagg ccacctgtta ctggtcgatt taagtcaacc 8700
tttaccgctg attcgtggaa cagatactct cttccatcct taaccggagg tgggaatatc 8760
ctgcattccc gaacccatcg acgaactgtt tcaaggcttc ttggacgtcg ctggcgtgcg 8820
ttccactcct gaagtgtcaa gtacatcgca aagtctccgc aattacacgc aagaaaaaac 8880
cgccatcagg cggcttggtg ttctttcagt tcttcaattc gaatattggt tacgtctgca 8940
tgtgctatct gcgcccatat catccagtgg tcgtagcagt cgttgatgtt ctccgcttcg 9000
ataactctgt tgaatggctc tccattccat tctcctgtga ctcggaagtg catttatcat 9060
ctccataaaa caaaacccgc cgtagcgagt tcagataaaa taaatccccg cgagtgcgag 9120
gattgttatg taatattggg tttaatcatc tatatgtttt gtacagagag ggcaagtatc 9180
gtttccaccg tactcgtgat aataattttg cacggtatca gtcatttctc gcacattgca 9240
gaatggggat ttgtcttcat tagacttata aaccttcatg gaatatttgt atgccgactc 9300
tatatctata ccttcatcta cataaacacc ttcgtgatgt ctgcatggag acaagacacc 9360
ggatctgcac aacattgata acgcccaatc tttttgctca gactctaact cattgatact 9420
catttataaa ctccttgcaa tgtatgtcgt ttcagctaaa cggtatcagc aatgtttatg 9480
taaagaaaca gtaagataat actcaacccg atgtttgagt acggtcatca tctgacacta 9540
cagactctgg catcgctgtg aagacgacgc gaaattcagc attttcacaa gcgttatctt 9600
ttacaaaacc gatctcactc tcctttgatg cgaatgccag cgtcagacat catatgcaga 9660
tactcacctg catcctgaac ccattgacct ccaaccccgt aatagcgatg cgtaatgatg 9720
tcgatagtta ctaacgggtc ttgttcgatt aactgccgca gaaactcttc caggtcacca 9780
gtgcagtgct tgataacagg agtcttccca ggatggcgaa caacaagaaa ctggtttccg 9840
tcttcacgga cttcgttgct ttccagttta gcaatacgct tactcccatc cgagataaca 9900
ccttcgtaat actcacgctg ctcgttgagt tttgattttg ctgtttcaag ctcaacacgc 9960
agtttcccta ctgttagcgc aatatcctcg ttctcctggt cgcggcgttt gatgtattgc 10020
tggtttcttt cccgttcatc cagcagttcc agcacaat 10058
<210> 11
<211> 9105
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 11
cgatggtgtt accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc 60
ctgctctgcc gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt 120
ttactgataa gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc 180
aggcgtcttc gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc 240
tggtggttca ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat 300
gctgaatcaa tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg 360
agggtgaatg cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg 420
ttcatcgttc cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg 480
tgaatcccat cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat 540
cgacgttttt atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg 600
gcaatgctgc gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa 660
gcataagcac acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac 720
ctggtttctc tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga 780
tgcggctaac gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc 840
aatttgagca aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt 900
gtgcatacag cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga 960
tttcggataa cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa 1020
gtgattgcgc ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata 1080
caaaaccaat ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt 1140
caaaactcgc catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct 1200
tcatacgcgg gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt 1260
actgcacctg ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca 1320
tgaaatcccg ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac 1380
catcgggaga gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa 1440
cattcacgcc ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc 1500
aggccagtgc tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg 1560
tgtggaagta ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca 1620
cgttgtgaac ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc 1680
cctgttcgac agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc 1740
tgccaccttc tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc 1800
ctgtgtcagt tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa 1860
taagtcgtca tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt 1920
ttcatcgtta accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt 1980
ttcgacaatg cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg 2040
ggcacactga atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc 2100
cgtgatttct ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc 2160
ggtaacgcag atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt 2220
gtcctgctca aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc 2280
atcaacgccc accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt 2340
cgtccacgga ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc 2400
gctggcatca cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac 2460
agaatccatg ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat 2520
tcgttttata cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac 2580
cggatgtgtt ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg 2640
gattttttgc tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc 2700
tggggcaggc ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc 2760
tgctggtagt gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc 2820
atggctgaac tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg 2880
aaaacaggaa agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc 2940
attttttata agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga 3000
tagtgaattt agtctggata gccataagtg tttgatccat tctttgggac tcctggctga 3060
ttaagtatgt cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt 3120
aaagattcgg aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc 3180
tccttattta tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac 3240
cgcactcagg cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata 3300
tcggtaattc ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca 3360
tcattccagt cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata 3420
agcagagcat gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg 3480
agtcggtatt cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt 3540
acgtcatggt cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt 3600
ttgatgtttg acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc 3660
aaagaagatt tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct 3720
ccgtgtattc actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca 3780
aaaataaagg ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca 3840
ttgccgtcgt tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca 3900
tttcttcagg cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt 3960
gtccacacca ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc 4020
atcacatcct gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa 4080
tagtggattg cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc 4140
tcgtgtaccc ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt 4200
atagaaatgg atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga 4260
accatgtata tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct 4320
gaatatgtta atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt 4380
gcattttcgc tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag 4440
cgatttaagc taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa 4500
aaccttacag aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat 4560
gtggttacat caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac 4620
aaaacttttt cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg 4680
actgaattag ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct 4740
aagtaactag ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat 4800
gccgcgttcg ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag 4860
gttgctttca atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc 4920
gctttctact cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt 4980
tgcgcttacc ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg 5040
acgttcgcgg cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg 5100
tgtgtggcag ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc 5160
cggaatcgca cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt 5220
tgaatgctgc ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg 5280
cgtcctgctg atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat 5340
aatttatcac cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg 5400
ggcattgttt ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat 5460
ttttcaataa atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg 5520
gcgctgaggc cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg 5580
catatatgaa tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg 5640
cttatgctgg aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta 5700
agggcataga caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg 5760
cgcgttctgc ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct 5820
gcatatgatg acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga 5880
atgtagtggc ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg 5940
taaacaccag gcatgattct gttccgcata attactcctg ataattaatc cttaactttg 6000
cccacctgcc ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc 6060
atctcttcag ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt 6120
tctgatagat aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg 6180
tctgaaaatt gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt 6240
ttaaattttg gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt 6300
gcccctaaga cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt 6360
gttcggccga tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc 6420
tctatctgaa cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc 6480
agatcggatg tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca 6540
aacaaaaaag atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca 6600
actgaagctt tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag 6660
agaaaagttt ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga 6720
tgattatcag ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc 6780
cctttatttt tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac 6840
tatgttatgt tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt 6900
gttatcagct atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca 6960
ctgactagcg ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta 7020
ctgtgggttt agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt 7080
aaactcatca cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg 7140
gtcaacgaga attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat 7200
ggaattacct tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac 7260
ccatctctcc gcatcacctt tggtaaaggt tctaagctca ggtgagaaca tccctgcctg 7320
aacatgagaa aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc 7380
ttcatacatc tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt 7440
gagaattttt gcaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa 7500
agcaccaacg cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc 7560
aagttcattt ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc 7620
ttgtgttaat ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat 7680
atctaacacc gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta 7740
aggaggttgt atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac 7800
caagacagct aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg 7860
ccgaaagatt tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc 7920
cttcccgagt aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct 7980
gaaaaagggc atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa 8040
tcaattgtta tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc 8100
tacgaatcga gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg 8160
aagctgtggg cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt 8220
tctcaatgct gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg 8280
cgcgacaagt tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg 8340
aacaaatcca gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac 8400
aaatacagca aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt 8460
ggcagatctc gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg 8520
cgcagatctg accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg 8580
gtggaataaa ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc 8640
tgtcaaacgg tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca 8700
aggcggcatg tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg 8760
aaaatcccct aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa 8820
acagggggac acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa 8880
ttctggcgaa tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc 8940
aattcagagc ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt 9000
tgacatggtg aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa 9060
cgatatccgc ctgatgcgtg aacgtgacgg acgtaaccac cgcga 9105
<210> 12
<211> 9107
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 12
catgtgtgtg ctgttccgct gggcatgcca ggacaacttc tggtccggta acgtgctgag 60
cccggccaaa ctccgcgata agtggaccca actcgaaatc aaccgtaaca agcaacaggc 120
aggcgtgaca gccagcaaac caaaactcga cctgacaaac acagactgga tttacggggt 180
ggatctatga aaaacatcgc cgcacagatg gttaactttg accgtgagca gatgcgtcgg 240
atcgccaaca acatgccgga acagtacgac gaaaagccgc aggtacagca ggtagcgcag 300
atcatcaacg gtgtgttcag ccagttactg gcaactttcc cggcgagcct ggctaaccgt 360
gaccagaacg aagtgaacga aatccgtcgc cagtgggttc tggcttttcg ggaaaacggg 420
atcaccacga tggaacaggt taacgcagga atgcgcgtag cccgtcggca gaatcgacca 480
tttctgccat cacccgggca gtttgttgca tggtgccggg aagaagcatc cgttaccgcc 540
ggactgccaa acgtcagcga gctggttgat atggtttacg agtattgccg gaagcgaggc 600
ctgtatccgg atgcggagtc ttatccgtgg aaatcaaacg cgcactactg gctggttacc 660
aacctgtatc agaacatgcg ggccaatgcg cttactgatg cggaattacg ccgtaaggcc 720
gcagatgagc ttgtccatat gactgcgaga attaaccgtg gtgaggcgat ccctgaacca 780
gtaaaacaac ttcctgtcat gggcggtaga cctctaaatc gtgcacaggc tctggcgaag 840
atcgcagaaa tcaaagctaa gttcggactg aaaggagcaa gtgtatgacg ggcaaagagg 900
caattattca ttacctgggg acgcataata gcttctgtgc gccggacgtt gccgcgctaa 960
caggcgcaac agtaaccagc ataaatcagg ccgcggctaa aatggcacgg gcaggtcttc 1020
tggttatcga aggtaaggtc tggcgaacgg tgtattaccg gtttgctacc agggaagaac 1080
gggaaggaaa gatgagcacg aacctggttt ttaaggagtg tcgccagagt gccgcgatga 1140
aacgggtatt ggcggtatat ggagttaaaa gatgaccatc tacattactg agctaataac 1200
aggcctgctg gtaatcgcag gcctttttat ttgggggaga gggaagtcat gaaaaaacta 1260
acctttgaaa ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc 1320
cttccagacc caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac 1380
caaaacagga agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt 1440
cgctggctgg atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat 1500
gttgttccta accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg 1560
cgtgtaggcg aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc 1620
gttaagtggt cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg 1680
gctgcatgat aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc 1740
taatggagca aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt 1800
gtgaacatcc aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc 1860
tcaccgtatt gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat 1920
gggaaccaaa ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa 1980
agaaatatgg cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc 2040
ccttcaccaa atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca 2100
tcagagctga tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac 2160
tgtcagactt tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc 2220
aaataccgga acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg 2280
gacttgcctg caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat 2340
cccatgtgcg tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt 2400
cgctggacgg tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca 2460
tggtacgagc taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag 2520
ggcagcttga tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga 2580
atgcaaagaa gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg 2640
gtgtgaaaga acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg 2700
agacagcgac gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa 2760
cgcaccagaa ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac 2820
acggctcacc tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg 2880
accaaaatcg aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg 2940
gtcagaagct gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga 3000
gcgatccgaa tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga 3060
tgtaaaaacg atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc 3120
tctccagagt gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg 3180
gaaaaagcag cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag 3240
attcgaaaac tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta 3300
aacgccttca tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg 3360
tctgctcagt gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt 3420
aatgaacgca atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc 3480
gttccgtatc gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa 3540
tcaaaccata accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac 3600
caacagaaac tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa 3660
aaaccattcc agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac 3720
tgaaatgtag tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg 3780
ccatcgtcaa cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac 3840
gaaaaaattg atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc 3900
tacacgaacc tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt 3960
atctcggtgg gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc 4020
acattcccct ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta 4080
tcagagcgtg gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc 4140
gattacgaca aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta 4200
atcatcgaac tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt 4260
gacgaatacg agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga 4320
atcagcaact cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt 4380
ggtcatacgc cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc 4440
gcagtgttct gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg 4500
aaagcgtagc taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca 4560
cggcttctga ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac 4620
aagccggatt cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac 4680
aaaaggctat caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg 4740
tggcaaagct tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt 4800
atgcggatta ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta 4860
caggccgtgc ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt 4920
gcggaagatg caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg 4980
tgacgatgct aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt 5040
atgacgctct ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg 5100
cggtcacacg ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga 5160
cttattgaat aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta 5220
gtgagatgaa aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat 5280
cgtctggaac tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt 5340
cgcaggtaat agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg 5400
taagagcatt gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc 5460
cgttgtgctg aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg 5520
tcatcgccgc ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat 5580
tcattagtaa tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag 5640
gaggtcgcgc taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg 5700
attactaaac acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa 5760
tagagcaaat ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg 5820
gccgccattc tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg 5880
taccttcgcg gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg 5940
tgcgccatta tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat 6000
ctcgcttata taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt 6060
atcaaacgct tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg 6120
taaggcgttc ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac 6180
cagaaatcat ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca 6240
ccctcgcaaa cttgtcacgc taaacccaaa actcaaatca acaggcgccg gacgctacca 6300
gcttctttcc cgttggtggg atgcctaccg caagcagctt ggcctgaaag acttctctcc 6360
gaaaagtcag gacgctgtgg cattgcagca gattaaggag cgtggcgctt tacctatgat 6420
tgatcgtggt gatatccgtc aggcaatcga ccgttgcagc aatatctggg cttcactgcc 6480
gggcgctggt tatggtcagt tcgagcataa ggctgacagc ctgattgcaa aattcaaaga 6540
agcgggcgga acggtcagag agattgatgt atgagcagag tcaccgcgat tatctccgct 6600
ctggttatct gcatcatcgt ctgcctgtca tgggctgtta atcattaccg tgataacgcc 6660
attacctaca aagcccagcg cgacaaaaat gccagagaac tgaagctggc gaacgcggca 6720
attactgaca tgcagatgcg tcagcgtgat gttgctgcgc tcgatgcaaa atacacgaag 6780
gagttagctg atgctaaagc tgaaaatgat gctctgcgtg atgatgttgc cgctggtcgt 6840
cgtcggttgc acatcaaagc agtctgtcag tcagtgcgtg aagccaccac cgcctccggc 6900
gtggataatg cagcctcccc ccgactggca gacaccgctg aacgggatta tttcaccctc 6960
agagagaggc tgatcactat gcaaaaacaa ctggaaggaa cccagaagta tattaatgag 7020
cagtgcagat agagttgccc atatcgatgg gcaactcatg caattattgt gagcaataca 7080
cacgcgcttc cagcggagta taaatgccta aagtaataaa accgagcaat ccatttacga 7140
atgtttgctg ggtttctgtt ttaacaacat tttctgcgcc gccacaaatt ttggctgcat 7200
cgacagtttt cttctgccca attccagaaa cgaagaaatg atgggtgatg gtttcctttg 7260
gtgctactgc tgccggtttg ttttgaacag taaacgtctg ttgagcacat cctgtaataa 7320
gcagggccag cgcagtagcg agtagcattt ttttcatggt gttattcccg atgctttttg 7380
aagttcgcag aatcgtatgt gtagaaaatt aaacaaaccc taaacaatga gttgaaattt 7440
catattgtta atatttatta atgtatgtca ggtgcgatga atcgtcattg tattcccgga 7500
ttaactatgt ccacagccct gacggggaac ttctctgcgg gagtgtccgg gaataattaa 7560
aacgatgcac acagggttta gcgcgtacac gtattgcatt atgccaacgc cccggtgctg 7620
acacggaaga aaccggacgt tatgatttag cgtggaaaga tttgtgtagt gttctgaatg 7680
ctctcagtaa atagtaatga attatcaaag gtatagtaat atcttttatg ttcatggata 7740
tttgtaaccc atcggaaaac tcctgcttta gcaagatttt ccctgtattg ctgaaatgtg 7800
atttctcttg atttcaacct atcataggac gtttctataa gatgcgtgtt tcttgagaat 7860
ttaacattta caaccttttt aagtcctttt attaacacgg tgttatcgtt ttctaacacg 7920
atgtgaatat tatctgtggc tagatagtaa atataatgtg agacgttgtg acgttttagt 7980
tcagaataaa acaattcaca gtctaaatct tttcgcactt gatcgaatat ttctttaaaa 8040
atggcaacct gagccattgg taaaaccttc catgtgatac gagggcgcgt agtttgcatt 8100
atcgttttta tcgtttcaat ctggtctgac ctccttgtgt tttgttgatg atttatgtca 8160
aatattagga atgttttcac ttaatagtat tggttgcgta acaaagtgcg gtcctgctgg 8220
cattctggag ggaaatacaa ccgacagatg tatgtaaggc caacgtgctc aaatcttcat 8280
acagaaagat ttgaagtaat attttaaccg ctagatgaag agcaagcgca tggagcgaca 8340
aaatgaataa agaacaatct gctgatgatc cctccgtgga tctgattcgt gtaaaaaata 8400
tgcttaatag caccatttct atgagttacc ctgatgttgt aattgcatgt atagaacata 8460
aggtgtctct ggaagcattc agagcaattg aggcagcgtt ggtgaagcac gataataata 8520
tgaaggatta ttccctggtg gttgactgat caccataact gctaatcatt caaactattt 8580
agtctgtgac agagccaaca cgcagtctgt cactgtcagg aaagtggtaa aactgcaact 8640
caattactgc aatgccctcg taattaagtg aatttacaat atcgtcctgt tcggagggaa 8700
gaacgcggga tgttcattct tcatcacttt taattgatgt atatgctctc ttttctgacg 8760
ttagtctccg acggcaggct tcaatgaccc aggctgagaa attcccggac cctttttgct 8820
caagagcgat gttaatttgt tcaatcattt ggttaggaaa gcggatgttg cgggttgttg 8880
ttctgcgggt tctgttcttc gttgacatga ggttgccccg tattcagtgt cgctgatttg 8940
tattgtctga agttgttttt acgttaagtt gatgcagatc aattaatacg atacctgcgt 9000
cataattgat tatttgacgt ggtttgatgg cctccacgca cgttgtgata tgtagatgat 9060
aatcattatc actttacggg tcctttccgg tgatccgaca ggttacg 9107
<210> 13
<211> 103
<212> RNA
<213> artificial sequence
<220>
<223> sgRNA
<400> 13
cgcagagucc ucaaaaaacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 14
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> protospacer
<400> 14
cgcagagtcc tcaaaaaacg 20
<210> 15
<211> 103
<212> RNA
<213> artificial sequence
<220>
<223> srRNA
<400> 15
agcaguucca gcacaaucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103
<210> 16
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> protospacer
<400> 16
agcagttcca gcacaatcga 20
<210> 17
<211> 522
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 17
caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 60
agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 120
catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 180
ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 240
ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 300
ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 360
ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 420
acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 480
cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aa 522
<210> 18
<211> 520
<212> DNA
<213> artificial sequence
<220>
<223> Lambda DNA
<400> 18
atcgatggtg ttaccaattc atggaaaagg tctgcgtcaa atccccagtc gtcatgcatt 60
gcctgctctg ccgcttcacg cagtgcctga gagttaattt cgctcacttc gaacctctct 120
gtttactgat aagttccaga tcctcctggc aacttgcaca agtccgacaa ccctgaacga 180
ccaggcgtct tcgttcatct atcggatcgc cacactcaca acaatgagtg gcagatatag 240
cctggtggtt caggcggcgc atttttattg ctgtgttgcg ctgtaattct tctatttctg 300
atgctgaatc aatgatgtct gccatctttc attaatccct gaactgttgg ttaatacgct 360
tgagggtgaa tgcgaataat aaaaaaggag cctgtagctc cctgatgatt ttgcttttca 420
tgttcatcgt tccttaaaga cgccgtttaa catgccgatt gccaggctta aatgagtcgg 480
tgtgaatccc atcagcgtta ccgtttcgcg gtgcttcttc 520
<210> 19
<211> 1082
<212> PRT
<213> Geobacillus thermodenitrificans T12
<400> 19
Met Lys Tyr Lys Ile Gly Leu Asp Ile Gly Ile Thr Ser Ile Gly Trp
1 5 10 15
Ala Val Ile Asn Leu Asp Ile Pro Arg Ile Glu Asp Leu Gly Val Arg
20 25 30
Ile Phe Asp Arg Ala Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu
35 40 45
Pro Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Leu Arg Arg Arg Lys
50 55 60
His Arg Leu Glu Arg Ile Arg Arg Leu Phe Val Arg Glu Gly Ile Leu
65 70 75 80
Thr Lys Glu Glu Leu Asn Lys Leu Phe Glu Lys Lys His Glu Ile Asp
85 90 95
Val Trp Gln Leu Arg Val Glu Ala Leu Asp Arg Lys Leu Asn Asn Asp
100 105 110
Glu Leu Ala Arg Ile Leu Leu His Leu Ala Lys Arg Arg Gly Phe Arg
115 120 125
Ser Asn Arg Lys Ser Glu Arg Thr Asn Lys Glu Asn Ser Thr Met Leu
130 135 140
Lys His Ile Glu Glu Asn Gln Ser Ile Leu Ser Ser Tyr Arg Thr Val
145 150 155 160
Ala Glu Met Val Val Lys Asp Pro Lys Phe Ser Leu His Lys Arg Asn
165 170 175
Lys Glu Asp Asn Tyr Thr Asn Thr Val Ala Arg Asp Asp Leu Glu Arg
180 185 190
Glu Ile Lys Leu Ile Phe Ala Lys Gln Arg Glu Tyr Gly Asn Ile Val
195 200 205
Cys Thr Glu Ala Phe Glu His Glu Tyr Ile Ser Ile Trp Ala Ser Gln
210 215 220
Arg Pro Phe Ala Ser Lys Asp Asp Ile Glu Lys Lys Val Gly Phe Cys
225 230 235 240
Thr Phe Glu Pro Lys Glu Lys Arg Ala Pro Lys Ala Thr Tyr Thr Phe
245 250 255
Gln Ser Phe Thr Val Trp Glu His Ile Asn Lys Leu Arg Leu Val Ser
260 265 270
Pro Gly Gly Ile Arg Ala Leu Thr Asp Asp Glu Arg Arg Leu Ile Tyr
275 280 285
Lys Gln Ala Phe His Lys Asn Lys Ile Thr Phe His Asp Val Arg Thr
290 295 300
Leu Leu Asn Leu Pro Asp Asp Thr Arg Phe Lys Gly Leu Leu Tyr Asp
305 310 315 320
Arg Asn Thr Thr Leu Lys Glu Asn Glu Lys Val Arg Phe Leu Glu Leu
325 330 335
Gly Ala Tyr His Lys Ile Arg Lys Ala Ile Asp Ser Val Tyr Gly Lys
340 345 350
Gly Ala Ala Lys Ser Phe Arg Pro Ile Asp Phe Asp Thr Phe Gly Tyr
355 360 365
Ala Leu Thr Met Phe Lys Asp Asp Thr Asp Ile Arg Ser Tyr Leu Arg
370 375 380
Asn Glu Tyr Glu Gln Asn Gly Lys Arg Met Glu Asn Leu Ala Asp Lys
385 390 395 400
Val Tyr Asp Glu Glu Leu Ile Glu Glu Leu Leu Asn Leu Ser Phe Ser
405 410 415
Lys Phe Gly His Leu Ser Leu Lys Ala Leu Arg Asn Ile Leu Pro Tyr
420 425 430
Met Glu Gln Gly Glu Val Tyr Ser Thr Ala Cys Glu Arg Ala Gly Tyr
435 440 445
Thr Phe Thr Gly Pro Lys Lys Lys Gln Lys Thr Val Leu Leu Pro Asn
450 455 460
Ile Pro Pro Ile Ala Asn Pro Val Val Met Arg Ala Leu Thr Gln Ala
465 470 475 480
Arg Lys Val Val Asn Ala Ile Ile Lys Lys Tyr Gly Ser Pro Val Ser
485 490 495
Ile His Ile Glu Leu Ala Arg Glu Leu Ser Gln Ser Phe Asp Glu Arg
500 505 510
Arg Lys Met Gln Lys Glu Gln Glu Gly Asn Arg Lys Lys Asn Glu Thr
515 520 525
Ala Ile Arg Gln Leu Val Glu Tyr Gly Leu Thr Leu Asn Pro Thr Gly
530 535 540
Leu Asp Ile Val Lys Phe Lys Leu Trp Ser Glu Gln Asn Gly Lys Cys
545 550 555 560
Ala Tyr Ser Leu Gln Pro Ile Glu Ile Glu Arg Leu Leu Glu Pro Gly
565 570 575
Tyr Thr Glu Val Asp His Val Ile Pro Tyr Ser Arg Ser Leu Asp Asp
580 585 590
Ser Tyr Thr Asn Lys Val Leu Val Leu Thr Lys Glu Asn Arg Glu Lys
595 600 605
Gly Asn Arg Thr Pro Ala Glu Tyr Leu Gly Leu Gly Ser Glu Arg Trp
610 615 620
Gln Gln Phe Glu Thr Phe Val Leu Thr Asn Lys Gln Phe Ser Lys Lys
625 630 635 640
Lys Arg Asp Arg Leu Leu Arg Leu His Tyr Asp Glu Asn Glu Glu Asn
645 650 655
Glu Phe Lys Asn Arg Asn Leu Asn Asp Thr Arg Tyr Ile Ser Arg Phe
660 665 670
Leu Ala Asn Phe Ile Arg Glu His Leu Lys Phe Ala Asp Ser Asp Asp
675 680 685
Lys Gln Lys Val Tyr Thr Val Asn Gly Arg Ile Thr Ala His Leu Arg
690 695 700
Ser Arg Trp Asn Phe Asn Lys Asn Arg Glu Glu Ser Asn Leu His His
705 710 715 720
Ala Val Asp Ala Ala Ile Val Ala Cys Thr Thr Pro Ser Asp Ile Ala
725 730 735
Arg Val Thr Ala Phe Tyr Gln Arg Arg Glu Gln Asn Lys Glu Leu Ser
740 745 750
Lys Lys Thr Asp Pro Gln Phe Pro Gln Pro Trp Pro His Phe Ala Asp
755 760 765
Glu Leu Gln Ala Arg Leu Ser Lys Asn Pro Lys Glu Ser Ile Lys Ala
770 775 780
Leu Asn Leu Gly Asn Tyr Asp Asn Glu Lys Leu Glu Ser Leu Gln Pro
785 790 795 800
Val Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala Ala His
805 810 815
Gln Glu Thr Leu Arg Arg Tyr Ile Gly Ile Asp Glu Arg Ser Gly Lys
820 825 830
Ile Gln Thr Val Val Lys Lys Lys Leu Ser Glu Ile Gln Leu Asp Lys
835 840 845
Thr Gly His Phe Pro Met Tyr Gly Lys Glu Ser Asp Pro Arg Thr Tyr
850 855 860
Glu Ala Ile Arg Gln Arg Leu Leu Glu His Asn Asn Asp Pro Lys Lys
865 870 875 880
Ala Phe Gln Glu Pro Leu Tyr Lys Pro Lys Lys Asn Gly Glu Leu Gly
885 890 895
Pro Ile Ile Arg Thr Ile Lys Ile Ile Asp Thr Thr Asn Gln Val Ile
900 905 910
Pro Leu Asn Asp Gly Lys Thr Val Ala Tyr Asn Ser Asn Ile Val Arg
915 920 925
Val Asp Val Phe Glu Lys Asp Gly Lys Tyr Tyr Cys Val Pro Ile Tyr
930 935 940
Thr Ile Asp Met Met Lys Gly Ile Leu Pro Asn Lys Ala Ile Glu Pro
945 950 955 960
Asn Lys Pro Tyr Ser Glu Trp Lys Glu Met Thr Glu Asp Tyr Thr Phe
965 970 975
Arg Phe Ser Leu Tyr Pro Asn Asp Leu Ile Arg Ile Glu Phe Pro Arg
980 985 990
Glu Lys Thr Ile Lys Thr Ala Val Gly Glu Glu Ile Lys Ile Lys Asp
995 1000 1005
Leu Phe Ala Tyr Tyr Gln Thr Ile Asp Ser Ser Asn Gly Gly Leu
1010 1015 1020
Ser Leu Val Ser His Asp Asn Asn Phe Ser Leu Arg Ser Ile Gly
1025 1030 1035
Ser Arg Thr Leu Lys Arg Phe Glu Lys Tyr Gln Val Asp Val Leu
1040 1045 1050
Gly Asn Ile Tyr Lys Val Arg Gly Glu Lys Arg Val Gly Val Ala
1055 1060 1065
Ser Ser Ser His Ser Lys Ala Gly Glu Thr Ile Arg Pro Leu
1070 1075 1080
<210> 20
<211> 1263
<212> PRT
<213> Eubacterium rectale
<400> 20
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys
100 105 110
Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val
1010 1015 1020
Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr
1025 1030 1035
Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe
1040 1045 1050
Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe
1055 1060 1065
Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr
1070 1075 1080
Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys
1085 1090 1095
Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg
1100 1105 1110
Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile
1115 1120 1125
Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp
1130 1135 1140
Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile
1145 1150 1155
Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg
1160 1165 1170
Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile
1175 1180 1185
Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys
1190 1195 1200
Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr
1205 1210 1215
Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu
1220 1225 1230
Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
<210> 21
<211> 1274
<212> PRT
<213> Artificial Sequence
<220>
<223> MAD7-NLS
<400> 21
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys
100 105 110
Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val
1010 1015 1020
Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr
1025 1030 1035
Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe
1040 1045 1050
Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe
1055 1060 1065
Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr
1070 1075 1080
Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys
1085 1090 1095
Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg
1100 1105 1110
Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile
1115 1120 1125
Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp
1130 1135 1140
Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile
1145 1150 1155
Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg
1160 1165 1170
Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile
1175 1180 1185
Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys
1190 1195 1200
Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr
1205 1210 1215
Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu
1220 1225 1230
Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1265 1270
- 通过核酸内切酶保护的靶向富集
- 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰