掌桥专利:专业的专利平台
掌桥专利
首页

通过核酸内切酶保护的靶向富集

文献发布时间:2023-06-19 11:55:48



技术领域

本发明属于遗传学研究领域,更具体地,属于靶向核酸分离领域,如用于遗传学研究中进一步分析或加工的文库制备。公开了用于降低核酸样品复杂度或富集核酸样品内靶核酸的新方法和组合物。

发明背景

遗传研究的重要组成是所定义的DNA基因座的序列分析。这可以是对已知变体基因分型,或鉴定序列变化或变体。这类分析通常需要以多重方式完成,如需要在大量样品中分析特定基因座组。用于此的理想试验在需要筛选的样品及基因座数目方面灵活,高精度且适合不同测序平台。尝试提供包括富集步骤的试验但理想的是没有扩增。例如,US2014/0134610描述了降低复杂性的方法,使用II型限制酶以片段化样品中的核酸,然后连接保护性接头且随后用核酸外切酶降解所有非捕获核酸。在WO2016/028887中,此方法如下改善:使用可编程的核酸内切酶,即CRISPR-核酸内切酶,片段化样品中的核酸。

CRISPR(成簇的规律间隔的短回文重复序列)是含多个较短直接重复序列的基因座且在40%经测序的细菌和90%经测序的古生菌内发现。CRISPR重复序列形成获得性细菌免疫系统,抵御遗传学病原体如噬菌体和质粒。当细菌受到病原体攻击时,一小段病原体基因组通过CRISPR相关蛋白(CAS)加工并纳入CRISPR重复序列之间的细菌基因组。CRISPR基因座接着转录并加工形成所谓的crRNA,其包含约30bp与病原体基因组相同的序列。这些RNA分子形成在后续感染之后识别病原体的基础并通过直接消化病原体基因组来导致病原体遗传因子沉默。CAS蛋白Cas9是来自酿脓链球菌(S.pyogenes)的II型CRISPR-CAS系统的主要成分,且在联合crRNA和称为反式激活crRNA(tracrRNA)的第二RNA时形成核酸内切酶,所述核酸内切酶靶向侵入的致病DNA,以通过在crRNA所定义基因组位置处引入DNA双链断裂(DSB)而降解。此II型CRISPR-Cas9系统证明在生物化学中是方便有效的工具,通过靶向引入双链缺口和随后激活内源修复机制,能够在真核基因组感兴趣位点引入修饰。Jinek等.(2012,Science 337:816-820)证明单链嵌合RNA(单引导RNA、sRNA、sgRNA)能够联合Cas9形成功能核酸内切酶,所述单链嵌合RNA通过组合crRNA和tracrRNA基本序列到单一RNA分子内生成。从不同细菌种群中鉴定了许多不同CRISPR-CAS系统(Zetsche等.2015Cell163,759-771;Kim等.2017,Nat.Commun.8,1-7;Ran等.2015.Nature 520,186-191)。

除了RNA指导用于引导核酸内切酶到核酸分子特定位置的CRISPR-CAS系统,本领域已知使用DNA或RNA指导的其他核酸内切酶(Doxzen等.2017,PLOS ONE 12(5):e0177097;Kaya等.2016,PNAS卷113第15号,4057-4062)。

本领域仍然很需要灵活且精确的方法用于降低核酸复杂性。本领域尤其需要就一个或多个靶核酸片段富集样品的通用方法,例如用于遗传学研究的后续分析或加工。

本发明如下详述,允许高度简化的文库制备方法用于下游加工和/或分析。

发明概述

第一方面,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二RNA或DNA指导的核酸内切酶复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,所述RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物。因此,本发明优选涉及从包含核酸分子的样品富集靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二gRNA-CAS复合物切割核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,步骤b)如下进行:将第一和第二gRNA-CAS复合物与核酸分子一起在约10-90℃,优选约37℃温育约1分钟-约18小时,优选约60分钟。

优选地,步骤c)如下进行:将经切割核酸分子与核酸外切酶在约10-90℃,优选约37℃温育约1分钟-约12小时,优选30分钟。

优选地,所述第一和第二gRNA-CAS复合物至少之一包含Cas9蛋白。

优选地,所述第一和第二gRNA-CAS复合物至少之一包含sgRNA。

优选地,所述第一和第二gRNA-CAS复合物至少之一包含作为不同分子的crRNA及tracrRNA。

优选地,所述第一和第二gRNA-CAS复合物至少之一能够诱导DSB。

优选地,所述第一和第二gRNA-CAS复合物都能够诱导DSB。

优选地,在所述步骤b)中,第一和第二gRNA-CAS复合物至少之一使核酸分子的一条链产生缺口,且其中核酸分子与至少第三gRNA-CAS复合物接触,所述第三gRNA-CAS复合物使互补链基本在所述第一或第二gRNA-CAS复合物所形成的缺口的位置的互补位置产生缺口。

第二方面,本发明涉及从包含核酸分子的样品中制备接头连接的靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;

b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;

d)任选地,从步骤c所得消化物纯化包含感兴趣的序列的靶核酸片段;和

e)使接头与靶核酸片段连接。

优选地,所述接头是序列接头。

第三方面,本发明涉及从包含核酸分子的样品测序靶核酸片段的方法,其中所述靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含所述感兴趣的序列;

b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含所述感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许所述核酸外切酶消化所述至少一个非靶核酸片段;

d)任选地,从步骤c所得的消化物纯化包含所述感兴趣的序列的靶核酸片段;

e)任选地,使接头与靶核酸片段连接;和

f)测序所述至少一个靶核酸片段。

优选地,本文所定义的方法对多个核酸样品平行进行。

优选地,所述核酸分子是基因组DNA。

优选地,所述核酸分子是可从植物、动物、人或微生物获得的核酸分子。

第四方面,本发明涉及从核酸分子富集靶核酸片段的的成套试剂盒(kit ofparts),所述试剂盒包含:

-至少本文所定义的第一和第二gRNA-CAS复合物以及

-核酸外切酶。

第五方面,本发明涉及本文所定义的第一和第二gRNA-CAS复合物或本文所定义的成套试剂盒用于从核酸分子富集至少一个靶核酸片段的用途。

定义

本说明书和权利要求通篇使用了涉及方法、组合物、应用和本发明其他方面的各种术语。除非另有说明,这样的术语以本发明所属领域的通常意义给出。其他特别定义的术语以与本文所提供定义一致的方式解释。尽管与本文所述类似或等同的任何方法和材料能用于实施本发明测试,但是优选的方法和材料如本文所述。

实施本发明所用常规技术的方法对技术人员是明显的。分子生物学、生物化学、计算化学、细胞培养、重组DNA、生物信息学、基因组学、测序和相关领域的常规技术实施为本领域技术人员熟知,且讨论于例如下列参考文献:Sambrook等.《分子克隆.实验室手册》(Molecular Cloning.A Laboratory Manual),第2版,冷泉港实验室出版社(Cold SpringHarbor Laboratory Press),纽约冷泉港,1989;Ausubel等.《精编分子生物学实验指南》(Current Protocols in Molecular Biology),约翰威利父子公司(John Wiley&Sons),纽约,1987和定期更新;和《酶学方法》系列(the series Methods in Enzymology),学术出版社(Academic Press),圣地亚哥。

除非上下文另有明确说明,“一(a、an)”和“所述”:这些单数形式术语包括复数指示物。因此,例如,提及“一个细胞”包括2个或更多细胞的组合等。

本文所用术语“约”用于描述并解释小变化。例如,该术语能指小于或等于±10%,如小于或等于±5%,小于或等于±4%,小于或等于±3%,小于或等于±2%,小于或等于±1%,小于或等于±0.5%,小于或等于±0.1%或者小于或等于±0.05%。另外,量、比例和其他数值有时在本文中以范围形式表示。应理解这种范围形式出于方便和简洁而使用,其应灵活理解包含明确指定为限值范围的数值,还包含该范围涵盖的所有单独数值或子区间,就如同各数值和子区间被明确指定。例如,约1-约200的范围内比例应理解为包含约1和约200的明确列举界限值,还包含单个比例如约2、约3和约4,以及子区间如约10-约50、约20-约100,等等。

本文所用术语“接头”是单链、双链、部分双链、Y型或发夹核酸分子,其能附着优选连接其他核酸末端,例如双链DNA分子的一条或两条链,且优选长度有限,如约10-约200、或约10-约100碱基、或约10-约80、或约10-约50、或约10-约30碱基对长度,并且优选是化学合成的。接头的双链结构可由彼此碱基配对的2个不同寡核苷酸分子形成,或由单一寡核苷酸链的发夹结构形成。显然,接头的可粘附末端能设计成与悬垂部分相容或任选地能与之连接,所述悬垂部分通过限制酶和/或可编程核酸酶切割来制备,可设计成与加入非模板延伸反应(如3’-A添加)后产生的悬垂部分相容,或可具有钝端。

“和/或”:术语“和/或”指其中所述的情况的一种或多种可能单独发生,或与所述的情况的至少一种,多至所述的情况的全部组合发生的情形。

用于核酸或核酸反应使用,“扩增”是指制备特定核酸如靶核酸或带标签核酸的拷贝的体外方法。多种扩增核酸方法为本领域已知,核酸反应包括聚合酶链式反应、连接酶链式反应、链置换扩增反应、滚环扩增反应、转录介导扩增法如NASBA(例如美国专利号5,409,818)、环介导扩增法(例如使用成环序列的“LAMP”扩增,例如美国专利号6,410,278所述)和等温扩增反应。扩增的核酸可以是DNA,包括以下、由其组成或从其衍生:DNA或RNA或DNA与RNA的混合物,包括经修饰的DNA和/或RNA。,无论起始核酸是DNA、RNA或两者,获自一个或多个核酸分子的扩增的产物(即“扩增产物”)可以是DNA或RNA,或DNA与RNA核苷或核苷酸的混合物,或其能包括经修饰的DNA或RNA核苷或核苷酸。

“拷贝”可以是但不限于某一序列,其与特定序列有全序列互补性或全序列相同性。或者,拷贝不必定与此特定序列具有完美序列互补性或相同性,例如允许一定程序的序列变化。例如,拷贝能包括核苷酸类似物如脱氧肌苷或脱氧尿苷,内部序列变化(如通过引物引入的序列变化,该引物所包含的序列与特定序列可杂交但不互补),和/或扩增期间发生的序列错误。

术语“互补性”在本文中定义为序列与完全互补链(如第二或反链)的序列相同性。例如,100%互补(或全互补)的序列在本文理解为与互补链有100%序列相同性,且例如80%互补的序列在本文理解为与(全)互补链有80%序列相同性。

“包含”:此术语解释为包容性和开放性的,且不是排除性的。特别地,该术语和其变型指包含特定特征、步骤或组分。这些术语不应解释为排除其他特征、步骤或组分的存在。

“构建体”或“核酸构建体”或“载体”:这指人造核酸分子,产生自重组DNA技术的使用且能用于向宿主细胞递送外源DNA,通常目的是在宿主细胞中表达构建体上包含的DNA区域。构建体的载体骨架可以是例如质粒,其中整合了(嵌合)基因,或如果适当转录调节序列(例如(诱导型)启动子)已存在,仅想要的核苷酸序列(如编码序列)整合在所述转录调节序列下游。载体可包含更多遗传因子以促进其在分子克隆中的应用,如选择性标记、多克隆位点等。

本文所用术语“双链”和“双链体”,描述碱基配对即杂交在一起的2条互补多核苷酸。互补核苷酸链在本领域也已知为反向互补。

本文所用术语“有效量”指足以引起想要的生物学效果的生物学活性剂的量。例如,在一些实施方案中,有效量核酸外切酶可指足以诱导未保护的核酸切割的核酸外切酶的量。本领域技术人员会理解,物质(agent)的有效量可根据多种因素变化,如所用的物质、使用所述物质的条件以及想要的生物学效果,例如待检测的核酸酶切割程度。

“示范性”:此术语指“用作示例、实例或说明”,且不应解释为排除本文公开的其他配置。

“表达”:这指其中可操作连接合适调控区尤其是启动子的DNA区域转录成RNA,其进而能翻译成蛋白或肽的过程。

“引导序列”在本文中应理解为指导RNA或DNA引导的核酸内切酶到RNA或DNA分子特定位点的序列。在gRNA-CAS复合物的背景下,“引导序列”进一步在本文理解为sgRNA或crRNA的部分,其是使gRNA-CAS复合物靶向双链DNA特定位点所需的。

gRNA-CAS复合物在本文中应理解为与引导RNA复合或杂交CAS蛋白,也称为CRISPR-核酸内切酶或CRISPR-核酸酶,其中引导RNA可以是crRNA和/或tracrRNA或sgRNA。

“相同性”和“相似性”能通过已知方法容易地计算。“序列相同性”和“序列相似性”能通过比对2个肽或2个核苷酸序列用总体或局部比对算法确定,取决于2个序列的长度。长度类似的序列优选用总体比对算法(如Needleman Wunsch)比对,该算法优选在完整长度上比对序列,而长度显著不同的序列优选用局部比对算法(如Smith Waterman)比对。当序列(优选通过例如程序GAP或BESTFIT用默认参数比对时)共有至少某一最小百分比的序列相同性(如下所定义)时,序列可随后称为“大体相同”或“基本相似”。GAP采用Needleman和Wunsch总体比对算法以在其完整长度(全长)上比对2个序列,使匹配数最大化且缺口数最小化。当2个序列具有相似长度时,总体比对适用于确定序列相同性。一般,采用GAP默认参数,空位产生罚分=50(核苷酸)/8(蛋白)且空位延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,所用默认打分矩阵是nwsgapdna,对于蛋白,默认打分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。序列比对和序列相同性百分比的分数可用计算机程序测定,如GCG Wisconsin包,10.3版,可获自Accelrys公司(Accelrys Inc.),9685Scranton路,圣地亚哥,CA 92121-3752USA,或使用开源软件如程序“needle”(采用总体NeedlemanWunsch算法)或“water”(采用局部Smith Waterman算法),EmbossWIN 2.10.0版,所用参数与上面GAP相同,或使用默认设置(都用于“needle”和“water”且都用于蛋白及DNA比对,默认空格罚分是10.0且默认空位延伸罚分0.5;默认打分矩阵是用于蛋白的Blosum62和用于DNA的DNAFull)。当序列在长度方面显著不同时,优选局部算法如用Smith Waterman算法的那些。

或者,相似性或相同性百分比可通过针对公开数据库搜索来确定,使用算法如FASTA,BLAST等。因此,本发明的核酸和蛋白序列能进一步用作“查询序列”以针对公开数据库执行搜索,例如鉴定其他家族成员或相关序列。这类搜索能用Altschul等.(1990)J.Mol.Biol.215:403—10的BLASTn和BLASTx程序(2.0版)实施。BLAST核苷酸搜索能用NBLAST程序,得分=100,字长=12执行,以获得本发明核酸分子的核苷酸序列同源物。BLAST蛋白搜索能用BLASTx程序,得分=50,字长=3执行,以获得本发明蛋白分子的氨基酸序列同源物。为获得空位比对用于比较目的,空位BLAST能如Altschul等,(1997)NucleicAcids Res.25(17):3389-3402所述使用。当使用BLAST和空位BLAST程序时,能采用各程序(如BLASTx和BLASTn)的默认参数。参见美国国家生物技术信息中心网页http://www.ncbi.nlm.nih.gov/。

术语“核苷酸”包括但不限于天然存在的核苷酸,包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别是G、C、A和T)。术语“核苷酸”还意在包括以下这些部分:其不仅包含已知嘌呤与嘧啶碱基,还含有经修饰的其他杂环碱基。这类修饰包括甲基化嘌呤或嘧啶,酰化嘌呤或嘧啶,烷基化核糖或其他杂环。另外,术语“核苷酸”包含以下这些部分:其包含半抗原或荧光标记且可能不仅包含常规核糖及脱氧核糖,还含有其他糖。修饰核苷或核苷酸还包括糖部分的修饰,例如其中一个或多个羟基用卤素原子或脂族基取代,或作为醚、胺功能化,等等。

术语“核酸”、“多核苷酸”和“核酸分子”在本文中可互换使用以描述任何长度的聚合物,如大于约2个碱基,大于约10个碱基,大于约100个碱基,大于约500个碱基,大于1000个碱基,多至约10,000或更多个由核苷酸如脱氧核苷酸或核糖核苷酸构成的碱基,且可酶促或合成产生(例如PNA,如美国专利号5,948,902和其中所引用参考文献所述)。所述核酸可与天然产生的核酸以序列特异性方式杂交,该方式与2个天然产生的核酸类似,如能参与Watson-Crick碱基配对相互作用。另外,核酸和多核苷酸可分离(且任选随后分段)自细胞、组织和/或体液。核酸可以是例如基因组DNA(gDNA)、线粒体、细胞游离DNA(cfDNA)、来自文库的DNA和/或来自文库的RNA。

本文所用术语“核酸样品”或“包含核酸的样品”指含核酸的任何样品,其中样品涉及材料或材料混合物,通常(尽管不必定)采用液体形式,包含一种或多种感兴趣的靶核苷酸序列。本发明方法中用作起始材料的核酸样品能来自任何来源,例如全基因组、染色体集合、单染色体、来自一个或多个染色体或转录的基因的一个或多个区域,且可直接纯化自生物来源或实验室来源如核酸库。核酸样品能获自同一个体,其可以是人或其他物种(如植物、细菌、真菌、藻类、古生菌等),或来自同一物种的不同个体,或不同物种的不同个体。例如,核酸样品可来自细胞、组织、活组织检查、体液、基因组DNA文库、cDNA文库和/或RNA文库。

术语“感兴趣的序列”、“感兴趣的靶核苷酸序列”和“靶序列”在本文中可互换使用,且包括但不限于优选存在于细胞内的任何基因序列,例如基因、部分基因或者基因内或邻近基因的非编码序列。感兴趣的靶序列可存在于染色体、附加体、细胞器基因组如线粒体或叶绿体基因组或能独立于遗传物质主体而存在的遗传物质,例如感染性病毒基因组、质粒、附加体,如转座子。感兴趣的序列可在基因的编码序列之内,转录的非编码序列之内,例如前导序列、尾随序列或内含子。所述感兴趣的核酸序列可存在于双链核酸或单链核酸。

感兴趣的序列可以是但不限于具有或疑似具有多态性如SNP的序列。

本文所用术语“寡核苷酸”指核苷酸的单链多聚体,长度优选约2-200个核苷酸,或多至500个核苷酸。寡核苷酸可合成或酶促制备,在一些实施方案中,长度为约10-50个核苷酸。寡核苷酸能包含核糖核苷酸单体(即可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸可以是约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150、150-200或约200-250个核苷酸长度。

“植物”:这包括植物细胞、植物原生质体、能从其再生植物的植物细胞组织培养物、植物愈伤组织、植物丛以及在植物或植物部分中完整的植物细胞,所述植物部分如胚、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、外壳、梗、根、根尖、花药、谷粒等。植物的非限制性示例包括作物和栽培植物如大麦、卷心菜、油菜(canola)、木薯、花椰菜、菊苣、棉花、黄瓜、茄子、葡萄、辣椒、莴苣、玉米、甜瓜、油菜(oilseed rape)、土豆、南瓜、稻、黑麦、高粱、倭瓜、甘蔗、甜菜、向日葵、甜辣椒、番茄、西瓜、小麦和意大利青瓜。

“前间隔序列”是识别或可与引导RNA内引导序列杂交的序列,更特定是crRNA或在sgRNA情况中,是引导RNA的crRNA部分,且位于靶序列中、处或附近。

“核酸内切酶”是在结合其靶或识别位点后,水解双链DNA中至少一条链或一条RNA分子链的酶,核酸内切酶在本文中应理解为位点特异性核酸内切酶且术语“核酸内切酶”和“核酸酶”在本文中可互换使用。限制性核酸内切酶在本文中应理解为同时水解双链体两条链的核酸内切酶,以在DNA中引入双重链缺口。“切口”核酸内切酶是仅水解双链体中一条链的核酸内切酶,以生成“有切口的”而不是经切割的DNA分子。

“核酸外切酶”在本文中定义为从多核苷酸末端(exo)切割一个或多个核苷酸的任何酶。

“降低复杂性”或“复杂性降低”在本文中应理解为复杂核酸样品减少,如衍生自基因组DNA的样品,衍生自液体活检的cfDNA,分离的RNA样品等。复杂性减少可导致复杂起始材料内所包含的一种或多种特定靶序列或靶核酸片段(本文也命名为靶片段)富集和/或产生样品子集,其中该子集包含复杂起始材料内所包含的一种或多种特定靶序列或片段或者由其组成,而非靶序列或片段的量相较于起始材料即在复杂性减少前非靶序列或片段的量,下降至少20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。降低复杂性一般在进一步分析或方法步骤前实施,如扩增、条形编码、测序、确定表观遗传变异等。复杂性减少优选是可重复的复杂性减少,意味着当同一样品用相同方法降低复杂性时,获得相同或至少相当的子集,这与随机复杂性减少相反。降低复杂性方法的示例包括例如

“序列”或“核苷酸序列”:这指核酸的或核酸内的核苷酸的顺序。换言之,核酸中的任何核苷酸顺序可称为序列或核酸序列。例如,靶序列是DNA双链体单链所包含的核苷酸的顺序。

本文所用术语“测序”指获得多核苷酸中至少10个连续核苷酸特性(如至少20、至少50、至少100或至少200或更多个连续核苷酸特性)的方法。术语“二代测序”指所谓的平行合成测序或连接平台测序,例如依诺米那(Illumina)、美国生命技术公司(LifeTechnologies)、PacBio和罗氏(Roche)等目前所用。二代测序方法还可包括纳米孔测序法,如牛津纳米孔技术公司(Oxford Nanopore Technologies)商品化的那些,或基于电子检测的方法如美国生命技术公司商品化的离子激流技术。

“靶核酸片段”或“靶片段”可以是小或较长延伸片段或选定部分的核酸,单或双链,包含感兴趣的序列或由其组成,其优选是进一步分析或作用的目标,例如但不限于复制、扩增、测序和/或其他核酸检测过程。复杂性减少前,靶核酸片段优选包含在较大核酸分子内,如待分析样品中存在的较大的核酸分子内部。

感兴趣的序列可以是样品核酸内的任何序列,如基因、基因复合物、基因座、假基因、调节区、高重复区、多态性区域或其部分。感兴趣的序列也可以是含遗传或表观遗传变异的区域,所述变异指示表型或疾病。在一些方面,选择一组靶核酸片段进行富集,所述片段包含一种或多种感兴趣的序列,或由其组成。任选地,该组由结构或功能相关靶核酸片段组成。一个或多个靶片段能包含天然或非天然、人工、或非经典核苷酸,包括但不限于DNA、RNA、BNA(桥连核酸)、LNA(锁核酸)、PNA(肽核酸)、吗啉代核酸、乙二醇核酸、苏糖核酸、表观遗传修饰的核苷酸如甲基化DNA以及模拟物和其组合。优选地,这些感兴趣的序列是双链DNA中单链DNA链的小或较长连续核苷酸延伸片段(即多核苷酸),其中所述双链DNA还包含与所述双链DNA互补链中靶序列互补的序列。由感兴趣的序列和其互补链组成的双链DNA在本文中也命名为靶核酸片段双链DNA。优选地,所述双链DNA是基因组DNA(gDNA)和/或细胞游离DNA(cfDNA)。

发明详述

发明人发现功能性gRNA-CAS复合物对经切割的片段具有意外的保护效果。事实上,看来切割后,经切割的片段受到保护抵御核酸外切酶切割。不想受理论约束,此保护归因于在核酸外切酶处理期间仍结合切割片段末端的复合物。因此,本发明方法意外显示例如本文所公开的靶富集的无扩增方法不需要连接保护性接头。

第一方面,提供从包含核酸分子的样品中富集至少一个靶核酸片段的方法。优选地,靶核酸片段包含感兴趣的序列。优选地,所述核酸片段包含在如下文详述的富集步骤前样品中存在的核酸分子内。因此优选地,所述靶核酸片段是样品中核酸分子的片段。

优选地,本发明涉及从包含核酸分子的样品富集靶核酸片段的方法,其中靶核酸片段包含感兴趣的序列,且其中所述方法包括以下步骤:

a)提供包含所述核酸分子的样品,其中所述核酸分子包含感兴趣的序列;

b)用至少第一和第二gRNA-CAS复合物切割所述核酸分子,从而产生包含感兴趣的序列的靶核酸片段和至少一个非靶核酸片段;

c)使步骤b)所得的经切割的核酸分子接触核酸外切酶并允许核酸外切酶消化所述至少一个非靶核酸片段;和

d)任选地,从步骤c)所得的消化物纯化包含感兴趣的序列的靶核酸片段。

优选地,步骤b)中的RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物、gRNA-argonaute复合物和gDNA-argonaute复合物至少之一。优选地,步骤b)中的RNA或DNA指导的核酸内切酶复合物是gRNA-CAS复合物。

优选地,步骤c)中,所述至少第一和第二gRNA-CAS复合物结合靶核酸片段。

优选地,步骤c)中,所述至少第一和第二gRNA-CAS复合物在步骤c)期间或至少部分步骤c)期间保持结合靶核酸片段。

优选地,步骤c)中,靶核酸片段不被核酸外切酶消化,即在步骤c)中,靶核酸片段受到保护抵御核酸外切酶消化。

优选地,步骤c)中,仅一个或多个非靶核酸片段被核酸外切酶消化。

在步骤b)中,用至少第一和第二gRNA-CAS复合物切割所述核酸分子。任选地,步骤b)能在使所述核酸分子接触第一和第二gRNA-CAS复合物的步骤以及允许所述复合物切割所述核酸分子的步骤中进一步说明。因此,在一个实施方案中,步骤b)能进一步如下说明:

b1)使所述核酸分子接触第一和第二gRNA-CAS复合物,其中所述第一复合物的gRNA引导所述第一复合物到感兴趣的序列上游的序列,且其中所述第二复合物的gRNA引导所述第二复合物到感兴趣的序列下游的序列;和

b2)允许所述第一和第二gRNA-CAS复合物切割核酸分子,其中至少一个经切割的核酸分子是靶核酸片段,且至少1个、优选2个经切割的核酸分子是非靶核酸片段。

发明人意外发现向步骤b的消化物加入核酸外切酶,而不采取更多措施以保护靶核酸片段,引起所述感兴趣片段富集。换言之,意外地,不需要通过例如连接惰性接头的进一步保护来保护靶核酸片段免于核酸外切酶降解。因此,本发明方法优选不包括以下进一步步骤:在核酸外切酶处理步骤前,保护靶核酸片段,或靶核酸片段末端。在一个优选实施方案中,本文所定义的方法在核酸外切酶处理前没有加入保护性接头。此背景下,保护性接头在本文中应理解为特别设计成针对核酸外切酶消化保护被接头捕获的靶核酸片段的接头。这种接头优选通过纳入化学部分或阻断基(如硫代磷酸)或缺乏末端核苷酸(发夹或茎环接头或可环化接头)针对核酸外切酶降解提供保护。

本发明的方法例如用于富集核酸样品,优选用于帮助下游加工或分析所述样品内的一个或多个靶核酸片段。富集引起本发明方法步骤a)中用作起始材料的核酸样品复杂性降低和/或本发明方法步骤a)中用作起始材料的核酸样品的一个或多个靶核酸片段子集产生。

因此,本发明第一方面还提供至少:

i)一种用于降低包含感兴趣的序列的核酸样品复杂性的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d);

ii)一种用于提供核酸样品子集的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d),其中所述子集包含一个或多个靶核酸片段;和

iii)一种用于分离或获得包含感兴趣的序列(来自包含所述感兴趣的序列的核酸分子)的片段即靶核酸片段的方法,包括如上所定义的步骤a)–c)和任选存在的步骤d)。

降低核酸样品复杂性在核酸测序应用方面有特别的效用,尤其是在其中靶核酸片段是复杂样品(例如但不限于基因组)内的次要种类的样品中。富集或复杂性降低可显著降低所产生的测序数据的成本,因为复杂样品的大部分在测序前去除,而靶核酸片段被选择性保留,因而更高百分比的序列读取产生自感兴趣的序列。

在优选实施方案中,通过本文方法生成的富集的靶核酸片段用于单分子、实时测序反应,如来自太平洋生物科学公司(Pacific Biosciences)、加利福尼亚州门洛帕克的

所述至少第一和第二gRNA-CAS复合物在本文中应理解为CRISPR相关(CAS)蛋白或CRISPR核酸酶,各自与引导RNA复合。CRISPR核酸酶包含核酸酶结构域和至少一个与引导RNA相互作用的结构域。当与引导RNA复合时,引导RNA将CRISPR核酸酶指引到特定核酸序列。引导RNA与CRISPR核酸酶以及特定靶核酸序列相互作用,从而一旦经引导序列指引到包含特定核酸序列的位点,CRISPR核酸酶能够在靶位点引入断裂。优选地,在核酸酶的1个或2个结构域都具有催化活性的情况中,CRISPR核酸酶分别能够在靶位点引入单或双链断裂。技术人员清楚了解如何设计引导RNA,采用的方式是当联合CRISPR核酸酶时,实现在核酸分子预定的位点处引入单或双链断裂。

基于核心元件含量和序列,CRISPR核酸酶一般可以分成6个主要类型(I-VI型),其进一步细分成亚型(Makarova等,2011,Nat Rev Microbiol 9:467-77和Wright等,2016,Cell 164(1-2):29-44)。一般而言,CRISPR-CAS系统复合物的2个关键元件是CRISPR核酸酶和crRNA。crRNA由短重复序列组成,所述序列散布有衍生自入侵DNA的间隔序列。CAS蛋白具有多种活性如核酸酶活性。因此,gRNA-CAS复合物提供靶向特定序列以及根据序列的某些酶活性的机制。

I型CRISPR-CAS系统通常包含有分开的解旋酶和DNase活性的Cas 3蛋白。例如,在1-E型系统中,crRNA纳入称为Cascade(用于抗病毒防御的CRISPR相关复合物)的多亚基效应复合物内(Brouns等,2008,Science 321:960-4),其特异性结合双螺旋DNA并通过Cas3蛋白激发降解(Sinkunas等,2011,EMSO J 30:1335-1342;Beloglazova等,2011,EMBO J 30:616-627)。

II型CRISPR-CAS系统包含特征性Cas9蛋白,这是一种单一蛋白(约160KDa),能够产生crRNA且特异性切割双螺旋DNA。Cas9蛋白通常包含2个核酸酶结构域,即氨基末端附近的RuvC样核酸酶结构域和蛋白中间附近的HNH(或McrA样)核酸酶结构域。Cas9蛋白的各核酸酶结构域专门用于切割双螺旋的一条链(Jinek等,2012,Science 337(6096):816-821)。Cas9蛋白是II型CRISPR/-CAS系统的CAS蛋白示例并形成核酸内切酶,当联合crRNA和称为反式激活crRNA(tracrRNA)的第二RNA时,其靶向入侵病原体DNA,通过在crRNA所定义的病原体基因组中的位置处引入DNA双链断裂(DSB)进行降解。Jinek等.(2012,Science 337:816-820)证明通过融合crRNA和tracrRNA必要部分而生成的单链嵌合引导RNA(本文的“sgRNA”)能够联合Cas9蛋白形成功能性核酸内切酶。

III型CRISPR-CAS系统包含聚合酶和RAMP组件。III型系统能进一步分成亚型III-A和III-B。III-A型CRISPR-CAS系统显示靶向质粒,III-A型系统的聚合酶样蛋白参与特异性切割DNA(Marraffini和Sontheimer,2008,Science 322:1843-1845)。III-B型CRISPR-CAS系统还显示靶向RNA(Hale等,2009,Cell 139:945-956)。

IV型CRISPR-CAS系统包含Csf1,一种未表征的蛋白质,被提议形成部分Cascade样复合物,不过这些系统通常作为分离cas基因发现,而没有相关CRISPR阵列。

最近描述了V型CRISPR-CAS系统,来自普氏菌(Prevotella)和弗朗西斯氏菌(Francisella)的成簇的规律间隔短回文重复序列1,或CRISPR/Cpf1。Cpf1基因与CRISPR基因座相关且编码使用crRNA来靶向DNA的核酸内切酶。Cpf1是比Cas9更小且更简单的核酸内切酶,其可克服CRISPR-Cas9系统的一些限制。Cpf1是单RNA指导的核酸内切酶,没有tracrRNA,且其使用富含T的前间隔序列毗邻基序。Cpf1经交错DNA双链断裂来切割DNA(Zetsche等(2015)Cell 163(3):759–771)。V型CRISPR-CAS系统优选包含Cpf1、C2c1和C2c3的至少一种。

VI型CRISPR-CAS系统可包含Cas13a蛋白,其包含RNaseA活性。在靶核酸片段是RNA的情况中,本发明方法的至少第一和第二gRNA-CAS复合物可包含Cas13a,例如但不限于来自韦德纤毛菌(Leptotreichia wadee,LwCas13a)或沙氏纤毛菌(Leptotrichia shahii,LshCas13a)的Cas13a,如描述于Gootenberg等,Science.2017年4月28日;356(6336):438-442。

本发明的方法的第一和第二gRNA-CAS复合物可包含上文所定义的任何CRISPR核酸酶。优选地,本发明的方法的第一和第二gRNA-CAS复合物至少之一包含II型CRISPR核酸酶如Cas9(例如SEQ ID NO:1的蛋白,其由SEQ ID NO:2编码,或SEQ ID NO:19的蛋白)或V型CRISPR核酸酶如Cpf1(例如SEQ ID NO:3的蛋白,其由SEQ ID NO:4编码)或Mad7(例如SEQID NO:20或21的蛋白)或其衍生蛋白,与所述蛋白在其全长上具有优选至少约70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性。

优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含II型CRISPR核酸酶,优选Cas9核酸酶。

技术人员了解如何制备CRISPR-CAS系统的不同组分,包括CRISPR核酸酶。在现有技术中,在其设计和应用方面有许多报道。参见例如Haeussler等(J Genet Genomics.(2016)43(5):239-50.doi:10.1016/j.jgg.2016.04.008.)关于设计引导RNA和其与CAS蛋白(初始获自酿脓链球菌(S.pyogenes))组合应用的近期的综述,或Lee等的综述(PlantBiotechnology Journal(2016)14(2)448–462)。

一般地,CRISPR核酸酶如Cas9包含2个催化活性核酸酶结构域。例如,Cas9蛋白能包含RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域一起合作,都切割单链以在DNA中产生双链断裂(Jinek等,Science,337:816-821)。失活CRISPR核酸酶包含修饰,从而没有核酸酶结构域显示切割活性。用于本发明方法的第一和第二gRNA-CAS复合物至少之一的CRISPR核酸酶可以是CRISPR核酸酶变体,其中一个核酸酶结构域突变,从而其不再具有功能(即缺少核酸酶活性),由此产生切口酶。一个示例是具有D10A或H840A突变的SpCas9变体。优选地,第一和第二gRNA-CAS复合物的核酸酶至少之一不是失活核酸酶。优选地,第一gRNA-CAS复合物的CRISPR核酸酶是切口酶或(内切)核酸酶。优选地,第二gRNA-CAS复合物的CRISPR核酸酶是切口酶或(内切)核酸酶。

本发明的方法的至少第一和第二gRNA-CAS复合物可包含完整Cas9蛋白或变体或由其组成,或可包含其片段。优选地,这类片段确实结合crRNA和tracrRNA或sgRNA,但可缺乏核酸酶活性所需的一个或多个残基。

优选地,第一和第二gRNA-CAS复合物至少之一包含Cas9蛋白。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含Cas9蛋白。Cas9蛋白可衍生自酿脓链球菌(Streptococcus pyogenes)(SpCas9;NCBI参考序列NC_017053.1;UniProtKB-Q99ZW2),嗜热脱氮芽孢杆菌(Geobacillus thermodenitrificans)(UniProtKB-A0A178TEJ9),溃疡性棒状杆菌(Corynebacterium ulcerous)(NCBI Refs:NC_015683.1,NC_017317.1);白喉棒状杆菌(Corynebacterium diphtheria)(NCBI Refs:NC_016782.1,NC_016786.1);螺原体(Spiroplasma syrphidicola)(NCBI Ref:NC_021284.1);中间普雷沃菌(Prevotellaintermedia)(NCBI Ref:NC_017861.1);台湾螺原体(Spiroplasma taiwanense)(NCBIRef:NC_021846.1);海豚链球菌(Streptococcus iniae)(NCBI Ref:NC_021314.1);罗的海贝尔氏菌(Belliella baltica)(NCBI Ref:NC_018010.1);扭曲冷弯曲菌(Psychroflexustorquisl)(NCBI Ref:NC_018721.1);嗜热链球菌(Streptococcus thermophilus)(NCBIRef:YP_820832.1);Listeria innocua(NCBI Ref:NP_472073.1);空肠弯曲菌(Campylobacter jejuni)(NCBI Ref:YP_002344900.1);或脑膜炎奈瑟氏菌(Neisseriameningitidis)(NCBI Ref:YP_002342100.1)。涵盖了来自这些的Cas9变体,具有与SpCas9同源的失活的HNH或RuvC结构域,如SpCas9_D10A或SpCas9_H840A,或者在SpCas9蛋白中对应D10或H840的位置处有等价取代的Cas9,产生切口酶。

根据一个优选实施方案,可编程核酸酶能衍生自Cpf1,如来自氨基酸球菌属(Acidaminococcus sp)的Cpf1;UniProtKB-U2UMQ6。该变体可以是有失活的RuvC或NUC结构域的Cpf1-切口酶,其中RuvC或NUC结构域不再具有核酸酶活性。技术人员清楚了解本领域可获得的技术,如定点诱变、PCR介导的突变和全基因合成,其允许失活核酸酶如失活RuvC或NUC结构域。带有失活的NUC结构域的Cpf1切口酶示例是Cpf1 R1226A(参见Gao等.CellResearch(2016)26:901–913,Yamano等.Cell(2016)165(4):949–962)。此变体中,NUC结构域内有精氨酸到丙氨酸(R1226A)转换,这使得NUC结构域失活。

所述至少第一和第二gRNA-CAS复合物还包含指导复合物到核酸样品中限定的位点的CRISPR核酸酶相关的引导RNA,也称为前间隔序列。引导RNA包含使gRNA-CAS复合物靶向前间隔序列的引导序列,所述前间隔序列优选在核酸分子中感兴趣的序列附近、在核酸分子中感兴趣的序列处或在核酸分子中感兴趣的序列内部,且可以是sgRNA或crRNA与tracrRNA的组合(如用于Cas9)或仅crRNA(如在Cpf1情况中)。任选地,在同一实验中可以使用多于一种类型的引导RNA,例如针对2种或更多不同的感兴趣的序列,或甚至针对相同感兴趣的序列。

本文中应理解在用至少第一和第二gRNA-CAS复合物切割前,感兴趣的序列存在于核酸样品。切割核酸样品可产生至少2个或更多核酸片段,其中至少一个核酸片段是靶核酸片段且至少一个核酸片段是非靶核酸片段。靶核酸片段包含感兴趣的序列或由其组成。因此,在切割核酸样品前,技术人员很清楚核酸样品涵盖靶核酸片段且在切割后靶核酸片段从核酸样品释放。发明人发现gRNA-CAS复合物切割的核酸片段受到保护免于消化,优选核酸外切酶消化。

本发明的方法需要第一gRNA-CAS复合物的gRNA指导所述第一复合物到核酸样品中的序列,从而第一gRNA-CAS复合物在感兴趣的序列上游切割核酸样品,且第二复合物的gRNA指导第二gRNA-CAS复合物到核酸样品中的序列,从而第二gRNA-CAS复合物在感兴趣的序列下游切割核酸样品。

优选地,gRNA-CAS复合物包含切割前间隔序列内核酸的CRISPR核酸酶。优选的CRISPR核酸酶是Cas9。

由第一gRNA-CAS复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。同样,由第二gRNA-CAS复合物结合的前间隔序列可以是靶核酸片段和/或非靶核酸片段中的序列。优选地,前间隔序列是与靶核酸片段和非靶核酸片段重叠的序列,即gRNA-CAS复合物的切割位点在前间隔序列内。

优选地,前间隔序列的位置取决于本发明方法所用的CRISPR核酸酶。作为非限制性示例,CRISPR核酸酶SpCAS9切割前间隔序列内的核酸。因此,当CAS9用于本发明方法时,优选前间隔序列部分位于靶核酸片段且部分位于非靶片段,即前间隔序列在靶核酸片段与非靶核酸片段之间重叠。由此,优选地,第一和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与选自下组的前间隔序列杂交:

A)靶核酸片段中包含的前间隔序列杂交;

B)非靶核酸片段中包含的前间隔序列杂交;和

C)在靶核酸片段与非靶核酸片段之间重叠的前间隔序列。

A)在一个实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与一段序列杂交,所述序列是靶核酸片段的序列或是其部分,或与相反链中的其互补序列杂交,例如在核酸片段是双链的情况中。换言之,在此实施方案中,所述由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列是靶核酸片段的序列或位于其中。优选地,由至少第一gRNA-CAS复合物靶向的前间隔序列是靶核酸片段序列的5’-末端或位置与其毗邻,或其互补序列,且优选由至少第二gRNA-CAS复合物靶向的前间隔序列是靶核酸片段序列的3’-末端或位置毗邻其,或其互补序列。毗邻可以是直接毗邻,或优选距离不大于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500或1000个连续核苷酸。核苷酸数目可以取决于本发明方法所用CRISPR核酸酶。

B)在一个实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的gRNA引导序列能够与一段序列杂交,所述序列会形成或形成部分非靶核酸片段,或与相反链中的其互补序列杂交,在核酸样品是双链核酸的情况中。换言之,在此实施方案中,所述由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列位置几乎毗邻或直接毗邻在切割后会形成靶核酸片段的序列。优选地,当片段存在于核酸样品或其互补序列时,由第一gRNA-CAS复合物靶向的前间隔序列几乎在靶核酸片段5’-末端侧翼,优选直接在5’-末端侧翼。优选地,当片段存在于核酸样品或其互补序列时,由第二gRNA-CAS复合物靶向的前间隔序列在靶核酸片段3’-末端侧翼,或直接在3’-末端侧翼。优选地,前间隔序列与核酸样品中靶核酸片段序列各5’末端或3’末端之间的距离不超过约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个连续核苷酸。核苷酸数目可能取决于本发明方法所用CRISPR核酸酶。

C)在一个优选实施方案中,所述第一gRNA-CAS复合物和第二gRNA-CAS复合物至少之一的引导序列能够与一段序列杂交,所述序列在非靶核酸片段和靶核酸片段之间重叠。优选地,所述至少第一或第二gRNA-CAS复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠。优选地,所述至少第一或第二gRNA-CAS复合物的引导序列能够与一段序列杂交,所述序列在非靶核酸片段5’末端和靶核酸片段3’末端之间重叠。换言之,在此实施方案中,优选的是,由至少所述第一或第二gRNA-CAS复合物靶向的前间隔序列在非靶核酸片段3’末端和靶核酸片段5’末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。

作为非限制性示例,SpCas9可在20nt前间隔序列内位置3与4之间切割。因此,在其3’-末端的靶核酸片段可包含前间隔序列的3nt且在其5’-末端的非靶核酸片段可包含前间隔序列的17nt。同样,如果前间隔序列在互补链上,在其3’-末端的靶核酸片段可包含前间隔序列的17nt且在其5’-末端的非靶核酸片段可包含前间隔序列的3nt。由此,在前间隔序列是20个连续核苷酸的示例中,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15,16、17、18或19个核苷酸可存在于非靶核酸片段3’-末端,并且分别地,前间隔序列的19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列5’-末端,这取决于本发明方法所用CRISPR核酸酶类型。

优选地,由至少第一或第二gRNA-CAS复合物靶向的前间隔序列在非靶核酸片段5’-末端与靶核酸片段3’-末端之间重叠(当所述片段存在于核酸样品时,即在核酸样品切割前)。作为前间隔序列是20个核苷酸的非限制性示例,前间隔序列的1、2、3、4、5、6、7、8、9、10、11、12,13,14、15,16、17、18或19个核苷酸可存在于非靶核酸片段5’-末端,前间隔序列的各19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸可存在于靶序列3-末端,这取决于本发明方法所用CRISPR核酸酶类型。

在一个优选实施方案中,所述第一和第二gRNA-CAS复合物至少之一结合靶核酸片段内的序列。优选地,所述第一和第二gRNA-CAS复合物都结合靶核酸片段内的序列。

或者或另外,所述第一和第二gRNA-CAS复合物至少之一结合非靶核酸片段内的序列。优选地,所述第一和第二gRNA-CAS复合物都结合非靶核酸片段内的序列。

或者或另外,所述第一和第二gRNA-CAS复合物至少之一结合在靶核酸片段与非靶核酸片段之间重叠的序列。优选地,所述第一和第二gRNA-CAS复合物都结合在靶核酸片段与非靶核酸片段之间重叠的序列。

在一个优选实施方案中,所述第一和第二gRNA-CAS复合物至少之一在切割后仍分别结合靶核酸片段的5’-末端或3’-末端。优选地,在切割后,至少一种gRNA-CAS复合物保持结合靶核酸片段的5’-末端且一种gRNA-CAS复合物保持结合靶核酸片段的3’-末端。不同的是,gRNA-CAS复合物优选在靶核酸片段两边的侧翼。

因为除了前间隔序列,gRNA-CAS复合物还需要前间隔序列邻近基序(PAM)序列用于识别,gRNA应设计成使得所靶向的前间隔序列毗邻这类PAM序列,这取决于所用的gRNA-CAS复合物。PAM序列对CRISPR/Cas核酸内切酶活性是必需的,相对较短,因而通常在一定长度的任意给定序列中多次存在。例如,酿脓链球菌Cas9蛋白的PAM基序是NGG,其确保就任何给定基因组序列而言,存在多种PAM基序且能设计许多不同引导RNA。另外,引导RNA还能设计成靶向同一双链序列的相反链。直接毗邻PAM的序列被纳入引导RNA。根据所用CRISPR-CAS复合物,其可能长度不同。例如,用于在Cas9 sgRNA中靶向序列的最优长度是20nt。根据所用CRISPR/Cas核酸内切酶,复合物随后在离PAM的不同距离处诱导2条DNA链的切口。例如,酿脓链球菌Cas9蛋白在PAM序列上游3bp处诱导2条DNA链的切口,以产生钝性DNA DSB。根据例如所用CRISPR-CAS复合物,用于切割核酸样品的PAM位点可存在于所产生核酸片段或所产生非靶核酸片段。

优选地,核酸样品中的感兴趣的序列侧翼是PAM序列或包含优选在感兴趣的序列末端附近的PAM序列,所述PAM序列已知用于和本文所定义复合物的CRISPR-系统核酸酶相互作用(例如参见Ran等2015,Nature 520:186-191)。另外或替代地,PAM序列优选在由第一和第二gRNA-CAS复合物至少之一靶向的前间隔序列侧翼。

例如,若所述CRISPR核酸酶是酿脓链球菌Cas9,PAM序列可具有序列5’-NGG-3’。例如,对于嗜热脱氮芽孢杆菌T12 Cas9(例如参见WO2016/198361),PAM序列可具有序列5’-NNNNCNNA-3’。用于Cas9核酸内切酶的更多已知PAM序列是:IIA型5'-NGGNNNN-3'(酿脓链球菌)、5'-NNGTNNN-3'(巴氏链球菌(Streptococcus pasteurianus))、5'-NNGGAAN-3'(嗜热链球菌(Streptococcus thermophilus))、5'-NNGGGNN-3'(金黄色葡萄球菌(Staphylococcus aureus))以及IIC型5'-NGGNNNN-3'(白喉棒状杆菌(Corynebacteriumdifteriae))、5'-NNGGGTN-3'(红嘴鸥弯曲杆菌(Campylobacter lari))、5'-NNNCATN-3'(细小棒菌(Parvobaculum lavamentivorans))和5'-NNNNGTA-3'(灰色奈瑟球菌(Neiseriacinerea))。本领域技术人员因而能够设计gRNA以使来自样品核酸的靶序列片段化。

适合作为crRNA和tracrRNA用作gRNA-CAS复合物中gRNA的分子为本领域熟知(参见例如WO2013142578和Jinek等,Science(2012)337,816-821)。

在一个实施方案中,所述crRNA至少之一包含能与感兴趣的序列,优选本文所定义感兴趣的序列,杂交或在其附近杂交的序列。因此优选地,所述crRNA至少之一包含与感兴趣的序列中序列完全互补的序列,即感兴趣的序列包含前间隔序列。

在一个实施方案中,所述至少一种crRNA包含能与感兴趣的序列,优选本文所定义感兴趣的序列,的互补序列杂交或在其附近杂交的序列。因此优选地,所述crRNA至少之一包含与感兴趣的序列或部分感兴趣的序列有完全序列相同性的核苷酸序列。

优选地,一种或多种crRNA还能够与tracrRNA复合。用于本发明方法的crRNA至少之一能包含未修饰或天然存在的核苷酸或者由其组成。或者或另外,至少一种crRNA能包含修饰或非天然存在的核苷酸或者由其组成,优选这类化学修饰的核苷酸用于保护crRNA免于降解。在一个实施方案中,所述用于本发明方法的至少2种或所有crRNA能包含修饰或非天然产生核苷酸或者由其组成。

在本发明的一个实施方案中,所述至少一种crRNA可以包含核糖核苷酸和非核糖核苷酸。所述至少一种crRNA能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。

所述至少一种crRNA可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(LNA)核苷酸、桥接核酸(BNA)、2’-O-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰的核苷酸可包含选自但不限于下组的修饰的碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。

所述至少一种crRNA可如下化学修饰:在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、2'-O-甲基3'thioPACE(膦酰乙酸酯)(MSP)或其组合。这种化学修饰crRNA能包含相较未修饰crRNA增加的稳定性和/或活性(Hendel等,2015,NatBiotechnol.33(9);985-989)。在某些实施方案中,所述至少一种crRNA在与前间隔序列杂交的区域中包含核糖核苷酸。在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能并入经工程化的crRNA结构,例如但不限于在与前间隔序列杂交的序列中,在与tracrRNA相互作用的序列中或这些序列之间。

或者或另外,化学修饰核苷酸能位于与前间隔序列杂交的序列5’和/或3’。化学修饰的序列能进一步位于与tracrRNA相互作用的序列的5’和/或3’。

在一个优选实施方案中,所述至少一种crRNA的长度可以是至少约15、20、25、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、65、70、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述至少一种crRNA的长度小于约75、50、45、40、35、30、25或约20个核苷酸。优选地,用于本发明方法的crRNA长度是约20-100、25-80、30-60或约35-50个核苷酸长度。

与前间隔序列杂交的crRNA序列部分设计成与前间隔序列有足够互补性,以与前间隔序列杂交并指导所复合的核酸酶的序列特异性结合。前间隔序列优选毗邻前间隔序列邻近基序(PAM)序列,该PAM序列可与本文所定义的RNA指导的CRISPR系统核酸内切酶复合物中CRISPR核酸酶相互作用。例如,在CRISPR核酸酶是酿脓链球菌Cas9的情况中,PAM序列优选是5’-NGG-3’,其中N可以是T、G、A或C中的任何一种。技术人员能够改造crRNA以靶向任何所需序列,优选通过改造序列成与任何所需前间隔序列至少部分互补,从而与其杂交。优选地,部分crRNA序列与其对应的前间隔序列之间的互补性用适当比对算法最优比对时,是至少约70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与前间隔序列互补的部分crRNA序列可以是至少约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸长度。在一些优选实施方案中,与DNA靶序列互补的序列小于约75、50、45、40、35、30、25、20个核苷酸长度。优选地,与DNA序列互补的序列长度是至少17个核苷酸。优选地,互补crRNA序列是约10-30个核苷酸长度,约17–25个核苷酸长度或约15-21个核苷酸长度。与前间隔序列互补的部分crRNA优选是15、16、17、18、19、20、21、22、23、24或25个核苷酸长度,优选20或21个核苷酸,优选20个核苷酸。

与tracrRNA相互作用的crRNA的部分设计成与tracrRNA有足够互补性,以与tracrRNA杂交并指导所复合的核酸酶到前间隔序列。优选地,此部分crRNA序列与其tracrRNA对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与tracrRNA相互作用的部分crRNA优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,与tracrRNA相互作用的部分crRNA小于约60、55、50、45、40、35、30或35个核苷酸长度。优选地,与tracrRNA相互作用的部分crRNA是约5–40、10-35、15-30、20-28个核苷酸长度。与tracrRNA相互作用的部分crRNA长度优选是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。

在一个实施方案中,本发明方法所用的至少第一和第二gRNA-Cas复合物分别包含第一和第二crRNA。然而,第一和第二gRNA-Cas复合物可包含相同的tracrRNA。

tracrRNA优选包含一个或多个结构基序,其能与本文所定义的复合物的CRISPR系统核酸酶相互作用。优选地,tracrRNA还能与本文所定义的crRNA相互作用。tracrRNA和crRNA可通过crRNA与tracrRNA之间碱基配对来杂交。tracrRNA优选能够与CRISPR系统核酸酶和crRNA形成复合物。crRNA能够复合tracrRNA并能与靶序列杂交,从而指导核酸酶到靶序列。

tracrRNA可包含一个或多个茎环结构,如1、2、3或更多个茎环结构。

tracrRNA能包含未修饰或天然存在的核苷酸,或由其组成。或者或另外,tracrRNA能包含修饰或非天然存在的核苷酸,或由其组成,优选这类化学修饰核苷酸用于保护tracrRNA免于降解。

在本发明的一个实施方案中,所述tracrRNA包含核糖核苷酸和非核糖核苷酸。tracrRNA能包含一个或多个核糖核苷酸以及一个或多个脱氧核糖核苷酸。

tracrRNA可包含一个或多个非天然存在的核苷酸或核苷酸类似物,如有硫代磷酸连接的核苷酸、在核糖环2'与4'碳之间包含亚甲桥的锁核酸(LNA)核苷酸、桥接核酸(BNA)、2’-O-甲基类似物、2'-脱氧类似物、2'-氟类似物或其组合。修饰核苷酸可包含选自但不限于下组的修饰碱基:2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷和7-甲基鸟苷。

tracrRNA可如下化学修饰:在一个或多个末端核苷酸处纳入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、2'-O-甲基3'thioPACE(膦酰乙酸酯)(MSP)或其组合。这种化学修饰tracrRNA能包含相较未修饰tracrRNA增加的稳定性和/或活性(Hendel等,2015,NatBiotechnol.33(9);985-989)。在某些实施方案中,所述tracrRNA在与crRNA相互作用的区域中包含核糖核苷酸。

在本发明的一个实施方案中,所述脱氧核糖核苷酸和/或核苷酸类似物能纳入改造的tracrRNA结构,例如但不限于在与crRNA相互作用的序列中,在与CRISPR系统核酸酶相互作用的序列中或这些序列之间。

或者或另外,化学修饰核苷酸能位于与crRNA相互作用的序列的5’和/或3’。化学修饰核苷酸能进一步位于与CRISPR系统核酸酶相互作用的序列的5’和/或3’。

在一个优选实施方案中,所述tracrRNA长度可以是约25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100、110、120、130、140、150或更多个核苷酸长度。在一些优选实施方案中,所述tracrRNA小于约200、180、160、140、120、100、95、90、85、80或75个核苷酸长度。tracrRNA长度优选是约30–120、40-100、50-90或约60-80个核苷酸长度。

与CRISPR系统核酸酶相互作用的tracrRNA序列部分设计成足以指导复合核酸酶到靶序列。与CRISPR系统核酸酶相互作用的tracrRNA序列的部分可以是约20、25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100或更多个核苷酸长度。在一些优选实施方案中,所述与CRISPR系统核酸酶相互作用的序列小于约120、100、80、72、70、60、55、50、45、40、30或20个核苷酸长度。优选地,与CRISPR系统核酸酶相互作用的tracrRNA序列部分是约20-90、30-85、35-80、40–75或50-72个核苷酸长度。优选地,与CRISPR系统核酸酶相互作用的tracrRNA部分是约40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76个核苷酸长度。

与crRNA相互作用的tracrRNA序列部分设计成与crRNA有足够互补性,以与crRNA杂交并指导所复合的核酸酶到靶序列。优选地,此部分tracrRNA序列与其crRNA对应部分之间的互补性用适当比对算法最优比对时,是至少约50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。与crRNA相互作用的tracrRNA的部分优选是至少约5、10、15、20、22、25、30、35、40、45或更多个核苷酸长度。在一些优选实施方案中,所述与crRNA相互作用的tracrRNA的部分小于约60、55、50、45、40、35、30或35个核苷酸长度。在一个优选实施方案中,所述与crRNA相互作用的tracrRNA部分是约5–40、10-35、15-30、20-28个核苷酸长度。优选地,与crRNA相互作用的部分长度是约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸。

优选地,crRNA和tracrRNA连接在一起形成sgRNA。crRNA和tracrRNA能连接,优选共价连接,使用本领域已知的任何常规方法。例如,crRNA和tracrRNA的常规连接描述于Jinek等.(同上)和WO13/176772,其通过引用纳入本文。crRNA和tracrRNA能共价连接,使用例如接头核苷酸或通过crRNA 3'末端与tracrRNA 5'末端直接共价连接。优选地,所述至少第一和第二gRNA-CAS复合物的gRNA设计成在核酸样品用至少第一和第二gRNA-CAS复合物温育后,来自核酸样品的核酸内所含靶核酸片段从所述核酸中切下。另外,优选第一gRNA设计成第一gRNA-CAS复合物在核酸样品切割后结合靶核酸片段。另外,优选第二gRNA设计成第二gRNA-CAS复合物在核酸样品切割后结合靶核酸片段。优选地,靶核酸片段存在于核酸样品时,侧翼是至少一个非靶核酸片段。优选地,靶核酸片段存在于核酸样品时,2边侧翼都是非靶核酸片段,即一个非靶核酸片段直接存在于靶核酸片段5’且一个非靶核酸片段直接存在于靶核酸片段3’。

优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含sgRNA用于使CRISPR核酸酶优选Cas9,靶向靶核酸片段中的序列。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一和第二gRNA-CAS复合物靶向靶核酸片段中的序列。本发明方法的第一和第二gRNA-CAS复合物至少之一优选包含sgRNA以用于使CRISPR核酸酶优选Cas9,靶向毗邻优选直接毗邻靶核酸片段的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA用于使各第一或第二gRNA-CAS复合物,靶向毗邻优选直接毗邻靶核酸片段的序列,其中靶核酸包含于核酸样品内。

优选地,本发明方法的第一和第二gRNA-CAS复合物至少之一包含sgRNA以用于使CRISPR核酸酶优选Cas9,靶向靶核酸片段与非靶核酸片段之间重叠的序列,此时该片段包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一或第二gRNA-CAS复合物,靶向靶核酸片段与非靶核酸片段之间重叠的序列,其中靶核酸包含于核酸样品内。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含sgRNA以用于使各第一或第二gRNA-CAS复合物,分别靶向靶核酸片段5’-末端与非靶核酸片段3’-末端之间重叠的序列以及靶核酸片段3’-末端与非靶核酸片段5’-末端之间重叠的序列,此时靶核酸包含于核酸样品内。

或者,本发明方法的第一和第二gRNA-CAS复合物至少之一包含二元引导RNA以使CRISPR核酸酶优选Cas9,靶向核酸样品中的序列,即靶核酸片段中存在的或非靶核酸片段中存在的前间隔序列。二元引导RNA(dgRNA)在本文中应理解为包含crRNA和tracrRNA作为单独但优选杂交的分子,或由其组成。任选地,本发明方法的第一和第二gRNA-CAS复合物都包含dgRNA用于使各第一或第二gRNA-CAS复合物靶向前间隔序列。

优选地,第一和第二gRNA-CAS复合物至少之一能够诱导双链断裂(DSB)。优选地,第一和第二gRNA-CAS复合物都能够诱导核酸样品中的双链断裂(DSB)。

或者,第一和第二gRNA-CAS复合物至少之一是切口酶,本文表示为第一或第二gRNA-CAS-切口酶复合物,其能够在双螺旋DNA的仅一条链上产生缺口。在本发明的这个实施方案中,步骤b)中,加入额外即第三gRNA-CAS复合物,其能够在双螺旋DNA的互补链上产生缺口,大致在第一或第二gRNA-CAS-切口酶复合物产生缺口的互补位置。大致在互补位置产生缺口优选引起核酸样品中的双链(即钝的或交错的)断裂。

作为非限制性示例,例如第三gRNA-CAS-切口酶的前间隔序列优选是互补链中的序列,该序列与第一gRNA-CAS-切口酶复合物靶向的前间隔序列互补,或在互补链上游或下游方向移动约1、2、3、4、5、6、7、8、9、10、15、20、25或30个核苷酸内的序列。例如,在第一gRNA-CAS复合物是gRNA-CAS-切口酶复合物的情况中,第三gRNA-CAS-切口酶复合物能在步骤b中加入,导致通过所述第一和第三gRNA-CAS-切口酶复合物在感兴趣的序列一侧诱导的双链断裂,其可以是钝端,此时实际相反位置被所述第一和第三复合物形成切口,或可以是交错的,此时被所述第一和第三复合物形成缺口的位置不完全是相反的。同样,除了所述第一和第三gRNA-CAS-切口酶复合物外,使用第二和更多如第四gRNA-CAS-切口酶复合物可产生本发明方法步骤b)所得靶核酸片段的2个钝或交错末端。在一些情况中,例如在后续定向接头连接的情况中,可能需要在本发明方法步骤b所生成靶核酸片段的1个或2个末端处产生交错末端。

本发明的方法的步骤b)可如下进行:将所述至少第一和第二gRNA-CAS复合物与核酸样品一起温育,所用条件和时间适合gRNA-CAS复合物诱导至少一个单链断裂,任选地双链断裂,例如但不限于本文所提供实施例中详述的条件。任选地,所述温育在约10-90℃,优选约37℃进行约1分钟-约18小时,优选约60分钟。

发明人发现由gRNA-CAS切割的靶核酸片段受到保护免于核酸外切酶处理。因此,从核酸切割靶核酸片段后,立即加入核酸外切酶以消化一种或多种非靶核酸。靶核酸片段受到保护免于降解,而未保护片段被降解,引起靶片段富集或复杂性减少。因而,本发明的方法采用去除不需要的(非靶)核酸样品部分的方法,而不是移出感兴趣部分,从而回避了复杂的亲和性选择方案。

核酸外切酶可以是核酸外切酶I、III、V、VII、VIII或相关酶,或其任何组合。核酸外切酶III识别切口并延伸切口到空位,直至形成一段ssDNA。核酸外切酶VII能降解此ssDNA。核酸外切酶I也降解ssDNA。ExoIII和ExoVII是核酸外切酶的优选组合,用于本发明方法步骤c)。

核酸外切酶V能够以3’到5’和5’到3’方向降解ssDNA及dsDNA。因此,在一个优选实施方案中,本发明方法步骤c)的核酸外切酶是能够以3’到5’和5’到3’方向降解ssDNA及dsDNA的核酸外切酶,优选核酸外切酶V。

关于降解非靶序列的更多信息提供于美国专利公开号2014/0134610,其通过引用全文纳入本文以用于所有目的。

另外,核酸内切酶即限制性酶可用于降解未保护片段,与本发明方法步骤c)的核酸外切酶消化一起、之前、之后或其任何组合。本文应理解用于本发明方法的限制性酶优选根据一个或多个感兴趣靶序列选择,所述序列用本发明方法富集,因为一种或多种限制性酶优选不应具有一个或多个感兴趣靶序列内存在的识别位点,但优选应具有剩余核酸样品即一个或多个非靶核酸片段中一个或多个位置处存在的识别位点。在本发明方法步骤c)的核酸外切酶处理之前或甚至步骤b)的切割反应之前,限制性酶消化的益处是这种消化产生片段,如果该片段不受gRNA-CAS复合物保护,则更易由步骤c)的核酸外切酶消化。

实施步骤c)和任选存在的核酸内切酶步骤,所用条件和时间足以使核酸外切酶(和任选存在的核酸内切酶)降解几乎所有未保护片段,例如但不限于本文所提供实施例详述的条件。优选地,以足以使核酸外切酶(和任选存在的核酸内切酶)降解所有未保护的片段的条件和时间实施步骤c)。步骤c)在约10-90℃,优选约37℃,优选进行约1分钟-约12小时,优选30分钟。

在步骤c)后,可以灭活核酸外切酶和任选存在的核酸内切酶,通过例如但不限于至少一种蛋白酶如蛋白酶K处理或者热灭活。这类技术是本领域标准且技术人员直接理解如何灭活核酸外切酶和任选存在的核酸内切酶。优选的灭活步骤是在约50-90℃,优选约75℃的温度加热样品,持续约1–120分钟,优选约10分钟。灭活步骤优选在本发明方法步骤c)与d)之间。

在本发明步骤c)后,富集了一个或多个靶核酸片段的样品可接受纯化步骤如基于AMPure珠的纯化工艺,以去除复合物、酶、游离核苷酸、可能的游离接头和可能的小、非靶核酸片段。靶核酸片段可在纯化后回收,并接受进一步加工和/或分析如单分子测序。

本发明方法还可包含尺寸选择步骤。任选地,尺寸选择步骤在本发明方法步骤b)之前、步骤b)与c)之间或步骤c)之后进行。

靶核酸片段长度可变,但优选至少200、500、1000、3000、5000、7000、10,000、15,000或20,000(多至至少100,000)个碱基长度。长度主要取决于预期用途,在一些最优实施方案中,基于待使用特定测序技术的平均读数长度。

本文中应理解有效量的组分用于本发明方法。例如,步骤b)中加入的至少第一和第二gRNA-CAS复合物以足以诱导样品内一个或多个核酸分子切割的量提供。另外,步骤c)所加入核酸外切酶施用的量足以降解样品或起始材料内至少约75%、80%、85%、90%、95%或100%的非靶核酸片段。

本发明方法可包含一个或多个纯化步骤,优选本文所定义步骤c)之后。任选存在的纯化步骤是蛋白酶K处理。或者或另外,所述纯化可包括下列步骤:

I.使步骤c)后所得的经消化的核酸样品暴露于一个或多个固体支持物,所述支持物特异且有效结合一个或多个靶核酸片段;和任选地,

II.洗涤所述一个或多个固体支持物,并从所述一个或多个固体支持物洗脱靶核酸片段。

所述一个或多个固体支持物可以是但不限于Ampure珠。由于纯化后获得至少一个分离靶核酸片段,本文所定义的方法也可视作从核酸样品分离一个或多个靶核酸片段的方法。

本发明的方法之后可以是测序一个或多个靶核酸片段的步骤。因此,本文所定义方法还可视作测序来自核酸样品的一个或多个靶核酸片段的方法。

任选地,本发明方法还包含扩增步骤。优选地,此扩增在核酸外切酶处理即本文所定义步骤c)后进行。扩增能通过PCR或本领域已知任何扩增方法完成。

本发明的方法也可包括连接一个或多个接头到靶核酸片段的步骤。优选地,这类接头连接在本文所定义步骤c)后进行。这些一个或多个接头可包含功能结构域,优选选自限制性位点结构域、捕获结构域、测序引物结合位点、扩增引物结合位点、检测结构域、条形码序列、转录启动子结构域和PAM序列或其任何组合。条形码可以是但不限于样品条形码或独特的分子标识符(UMI)。

在尤其优选的实施方案中,所述一个或多个接头是测序接头,例如包含的功能结构域允许罗氏454A和454B测序、ILLUMINA

根据接头设计,接头可以是单链、双链、部分双链、Y型、发夹或可环化接头。任选地,能使用一个或多个接头。任选地,能使用一组或多组的2个接头,其中一组的第一接头旨在靶核酸片段5’末端侧连接且组的第二接头旨在靶核酸片段3’末端侧连接。组内第一和第二接头优选各包含相容性引物结合序列,从而接头连接的片段易用相容性引物对扩增或测序。

在一个优选实施方案中,本发明方法没有扩增和/或克隆步骤。减少扩增步骤是有益的,因为表观遗传学信息(例如5-mC、6-mA等)会在扩增子中丧失。进一步扩增能在扩增子中引入变化(如通过扩增期间的错误),从而其核苷酸序列不反映初始样品。类似地,靶区域克隆到另一生物体内通常不维持初始样品核酸中存在的修饰,因此,在优选实施方案中,待富集用于进一步分析的靶序列通常不在本文方法中扩增和/或克隆。

茎环或发夹接头是单链的,但其末端互补,从而接头自身回折以产生双链部分和单链环。茎环接头能连接线性、双链核酸末端。例如,茎环接头连接双链靶核酸片段末端,从而没有末端核苷酸(例如任何空位被填充且连接,分别使用聚合酶和连接酶)时,所得分子缺乏末端核苷酸,而不是在各末端携带单链环。

靶核酸片段能连接可环化接头。此方面中,含靶序列的片段可如下环化:通过相容性结构在片段任一侧自身环化(其可由接头连接或经连接接头的限制性酶消化引起),或通过杂交与所需片段末端互补的选择探针。延伸和最终连接步骤形成了共价闭合的环状,任选地,双链多核苷酸。

本文中应理解核酸样品包含至少一个靶核酸片段。不同的是,核酸样品因而可包含1、2、3、4、5、6、7、8、9、10或更多个靶核酸片段,例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,其中优选样品内的各靶核酸片段具有不同序列。本发明方法可提供来自核酸样品的这些靶核酸片段同步富集。因此任选地,本发明方法步骤b)中,加入多组的至少第一和第二gRNA-CAS复合物以从核酸样品富集、分离或测序多个靶核酸片段。优选地,这些多组的第一和第二gRNA-CAS复合物可包含相同CRISPR核酸酶,但其gRNA不同。例如,对于各靶核酸片段,可使用2个不同gRNA分子,如一个gRNA纳入第一gRNA-CAS复合物,另一gRNA纳入第二gRNA-CAS复合物。对于例如至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多个靶核酸片段,优选至少约50、100、150、200、250、300、350、400、450、500、750、1000或更多组gRNA分子,优选至少约100、200、300、400、500、600、700、800、900、1000、1500、2000或更多个不同gRNA分子,可用于本发明方法。

任选地,本发明方法是多路的,即同时施用于多个核酸样品,例如用于至少约10、20、30、40、50、60、70、80、90、100、500、1000或更多个核酸样品。所述方法可就多个样品平行实施,其中“平行”在本文中应理解为几乎同时,但各样品在单独反应管或容器中处理。另外或替代地,本发明方法的一个或多个步骤可在合并样品上进行。为追溯富集、分离和/或测序片段到初始样品,片段可用标识符作标签,然后合并样品。这类标识符能是任何可检测实体,例如但不限于放射性或荧光标记,但优选是特定核苷酸序列或核苷酸序列组合,优选具有定义长度。另外或替代地,样品能用聪明的混同策略合并,例如但不限于2D和3D合并策略,从而合并后,各样品分别包含于至少2或3个池。特定靶片段能追溯到初始样品,使用含有特定富集、分离和/或测序靶片段的各池坐标。

本发明方法的核酸样品可来自任何来源,如人、动物、植物、微生物,且可以是任何种类,如细胞内源或外源,例如基因组DNA、染色体DNA、人工染色体、质粒DNA或游离型DNA、cDNA、RNA、线粒体、或人工文库如BAC或YAC等。DNA可以是核或细胞器DNA。DNA优选是染色体DNA,优选细胞内源。

另一方面,本发明提供用于上文所定义的方法的成套试剂盒。优选地,所述试剂盒包含至少以下之一:

-一个或多个小瓶,包含本文所定义的至少第一和第二gRNA-CAS复合物;

-一个或多个小瓶,包含至少第一和第二gRNA,用于复合CRISPR-CAS蛋白形成gRNA-CAS复合物,以及包含所述CRISPR-CAS蛋白的另一小瓶;

-另一小瓶,包含一种或多种核酸外切酶以降解非靶核酸;和

-任选存在的小瓶,包含一种或多种限制性酶以降解非靶核酸。

任选地,试剂盒还包含一个或多个本文所定义接头,有一个或多个上文所示小瓶或在单独小瓶中。试剂盒优选包含至少2、4、10、20、30或50个小瓶,含有本文所定义一种或多种gRNA。试剂盒内任何小瓶的体积优选不超过100mL、50mL、20mL、10mL、5mL、4mL、3mL、2mL或1mL。

试剂可以冻干形式存在,或溶于适当缓冲液。试剂盒还可包含完成本发明所需的任何其他组分,如缓冲液、吸量管、微量滴定板和书面说明。用于本发明的试剂盒的这类其他组分是技术人员已知的。

最后,提供本文所定义的至少第一和第二gRNA-CAS复合物或成套试剂盒用于从核酸样品富集至少一个靶核酸片段的用途。更具体地,提供所述至少第一和第二gRNA-CAS复合物用于保护靶核酸片段免于核酸外切酶降解的用途。

附图说明

图1:λDNA中的PciI限制性核酸内切酶识别位点和Cas9 sgRNA位置。指示片段尺寸以及用Cas9靶向的片段。

图2:经消化的DNA样品的电泳分析。A)PciI消化的λDNA,没有Cas9靶向和保护。B)PciI消化的λDNA,有Cas9靶向和保护。

图3:FEMTO脉冲(Advanced Analytical)分析经消化的甜瓜DNA,使用靶向423个基因组基因座的Cas9,每个基因座具有5.1-5.6kbp的尺寸,池为1406sgRNA。在靶基因座侧翼序列中设计sgRNA。实际靶向区域的总长是~5.5kbp。可见大小为~6.4kbp的清晰峰值。所量的(sized)长度的差异正常,这归因于量度(sizing)的不准确。左侧第一泳道是经消化的甜瓜DNA,第二泳道是标记。

图4:FEMTO脉冲(Advanced Analytical)分析选定尺寸的DNA。从图3所示样品可见,片段选择范围是2.5kbp–10kbp,使用Sage Science BluePippin。左侧第一泳道是经消化且选定尺寸的DNA,第二泳道是标记。

图5:甜瓜(Melon Vedrantais)基因组区域的IGV可视化,将在富集操作后获得的读取进行作图到所述区域。灰盒描述就2个靶基因座而言的相对读数覆盖范围(上部),下面显示作图的读数。靶向基因座指示为作图读数下的黑条。在这些黑条下方,用于这些基因座的所用sgRNA位置以黑线指示。显示的是,富集的读取在选定sgRNA位置开始且完全涵盖靶向基因座。

实施例

材料与方法

共3μgλDNA(SEQ ID NO:5、GenBank登录号J02459.1)(10μl 300ng/μl)用限制性核酸内切酶PciI(新英格兰生物实验室(New England Biolabs))消化,通过加入下列组分、2μl 10x NEB 3.1缓冲液(新英格兰生物实验室)、3μl PciI核酸内切酶(10U/μl)和5μl无核酸酶水进行。所得20μl反应混合物在37℃温育1小时,之后酶通过80℃温育20分钟灭活。λDNA中2个PciI识别位点的概览如图1所示。

PciI限制性酶切的λDNA中的2个特定位点用Cas9和2个为这些靶向位点设计的sgRNA来靶向。第一sgRNA(sgRNA 9)具有SEQ ID NO:13并靶向具有SEQ ID NO:14的前间隔序列。第二sgRNA(sgRNA13)具有SEQ ID NO:15并靶向具有SEQ ID NO:16的前间隔序列。反应条件是:20μl PciI限制性酶切的λDNA(见上)、1μl 10x NEB 3.1缓冲液、3μl 0.3μMsgRNA9、3μl 0.3μM sgRNA13、1.8μl Cas9蛋白(新英格兰生物实验室)和1.2μl无核酸酶水。30μl反应混合物在37℃温育1小时。

未保护片段通过用核酸外切酶V温育来去除。为此,向12.5μl Cas9反应物加入下列组分:1.75μl 10x NEB 3.1缓冲液、3.0μl 10mM ATP(新英格兰生物实验室)、1.0μl 10U/μl ExoV核酸外切酶(新英格兰生物实验室)和11.75μl无核酸酶水。所得30μl反应混合物在37℃温育30分钟。蛋白通过75℃温育10分钟灭活。

进行下列对照反应:

1.仅限制性酶切λDNA。为此,仅实施上述PciI限制性反应。

2.将PciI限制性酶切的λDNA与核酸外切酶V温育。为此,PciI限制性酶切λDNA后,加入下列组分:1.0μl 10x NEB 3.1缓冲液、3.0μl 10mM ATP、1.0μl 10U/μl ExoV核酸外切酶和5.0μl无核酸酶水。30.0μl反应混合物在37℃温育30分钟。核酸外切酶通过75℃温育10分钟灭活。

所有样品用Ampure XP溶液(贝克曼库尔特(Beckman Coultier),美国加利福尼亚布州布雷亚)纯化,珠与样品之比为0.8x。结合后,珠用70%乙醇洗2次,结合的DNA在10μl无核酸酶水洗脱。

洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。

结果

FEMTO脉冲分析结果如图2所示:简言之;

·用PciI限制性酶消化的λDNA显示以下长度的预期片段:~600bp(SEQ ID NO:6)–~9,000bp(SEQ ID NO:8)–~40,000bp(SEQ ID NO:7)

·用PciI限制性酶消化且后续用ExoV核酸外切酶温育的Lambda DNA没有显示剩余片段,表明缺乏核酸外切酶保护

·用PciI限制性酶消化并用带sgRNA9和13的Cas9靶向的λDNA显示以下长度的预期片段:~600bp(SEQ ID NO:6)–~9,000bp(2x)(SEQ ID NO:11和12)–~10,000bp(SEQ IDNO:10)–~20,000bp(SEQ ID NO:9)。SEQ ID NO:9的最后的(3’)~500bp如SEQ ID NO:17所示且SEQ ID NO:11的最初的(5’)~500bp如SEQ ID NO:18所示。SEQ ID NO:10在其5’末端包含SEQ ID NO:14的前间隔序列的部分且在其3’末端包含SEQ ID NO:16的前间隔序列的部分。

·用PciI限制性酶消化并用具有sgRNA9和13的Cas9靶向且后续用ExoV核酸外切酶温育的λDNA意外显示长度~10,000bp的片段(SEQ ID NO:10)。

结论

CRISPR系统核酸酶复合物能够保护DNA免于核酸外切酶降解。

材料、方法与结果

为研究对作物DNA的方法,sgRNA设计成靶向甜瓜(Melon Vedrantais)基因组DNA中的423个基因座,这些靶标各具有5.1-5.9kbp长度。对于各靶标,一对至少2个sgRNA设计成靶向各靶标侧翼500bp的上游和下游区域,其中各sgRNA包含20nt长的引导序列,其在基因组内独特。

总共48个反应,各包含9μl 115.6ng/μl(=~1μg)甜瓜DNA,总体积为25μl,由以下组成:2.5μl 10x NEB 3.1缓冲液(新英格兰生物实验室公司(New England BiolabsInc.))、0.18μl 16.58μM sgRNA混合物、0.15μl 20μM酿脓链球菌(S.pyrogenes)Cas9核酸酶(新英格兰生物实验室公司)和13.17μl无核酸酶水。

反应混合物(16μl)在室温预温育10分钟,然后加入甜瓜DNA(9μl)。25μl反应在37℃温育1小时。未保护片段通过用核酸外切酶V温育来移出。对此,平分25μl Cas9反应,向各12.5μl加入下列组分、2μl 10x NEB 3.1缓冲液、2.0μl 50mM ATP(新英格兰生物实验室公司)、2.5μl 10U/μl核酸外切酶V核酸外切酶(新英格兰生物实验室公司)和1μl无核酸酶水。所得20μl反应混合物在37℃温育60分钟。蛋白通过70℃温育30分钟灭活。

为水解肽键,向20μl反应混合物加入1μl 20mg/ml蛋白酶K(罗氏)并室温温育10分钟。

所有样品用Ampure PB珠溶液(太平洋生物科学公司)纯化,珠与样品之比为0.45x。合并所有96个反应的反应混合物。结合磁体后,珠用70%乙醇洗2次。珠干燥1分钟且结合的DNA在50μl无核酸酶水中洗脱。

洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。结果如图3所示。

使用BluePippin(Sage Science)对洗脱的DNA进行尺寸选定(2.5kbp–10kbp)。作为分离基质,采用BluePippin无染料0.75%琼脂胶盒。特定大小的产物用QIAquick PCR纯化试剂盒(凯杰(Qiagen))纯化。纯化的DNA在10μl无核酸酶水中洗脱。洗脱的DNA用FEMTO脉冲(Advanced Analytical)分析。结果如图4所示。

洗脱的DNA用于测序文库制备,用于牛津纳米孔(Oxford Nanopore)MinION系统测序。文库制备和测序根据厂商说明书实施。

所得的序列读取用厂商设置进行质量过滤,通过的读数针对甜瓜全基因组参考序列作图。为将读取作图,使用标准设置的minimap2.11-r797。从作图的读取,仅有单一作图位置的那些用于进一步分析。所得的作图的读取用IGV软件(博德研究所(BroadInstitute))呈现。图5提供此图用于基因组内分开约47kbp的2个靶。在可视化呈现中,还描绘所靶向的基因座和用于靶向基因座的sgRNA的位置。

结论

CRISPR系统核酸酶复合物能够保护DNA免于核酸外切酶降解,导致所靶向的感兴趣的区域的DNA富集。

序列表

<110> 主基因有限公司

<120> 通过核酸内切酶保护的靶向富集

<130> p6080445pct

<150> 18208936.7

<151> 2018-11-28

<160> 21

<170> PatentIn version 3.5

<210> 1

<211> 1368

<212> PRT

<213> artificial sequence

<220>

<223> Cas9

<400> 1

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 2

<211> 4104

<212> DNA

<213> artificial sequence

<220>

<223> sequence encoding Cas9

<400> 2

atggataaaa aatatagcat tggtctggat attggtacca atagcgttgg ttgggcagtt 60

attaccgatg aatataaagt tccgagcaaa aaatttaaag ttctgggtaa taccgatcgt 120

catagcatta aaaaaaatct gattggtgca ctgctgtttg atagcggtga aaccgcagaa 180

gcaacccgtc tgaaacgtac cgcacgtcgt cgttataccc gtcgtaaaaa tcgtatttgt 240

tatctgcagg aaatttttag caatgaaatg gcaaaagttg atgatagctt ttttcatcgt 300

ctggaagaaa gctttctggt tgaagaagat aaaaaacatg aacgtcatcc gatttttggt 360

aatattgttg atgaagttgc atatcatgaa aaatatccga ccatttatca tctgcgtaaa 420

aaactggttg atagcaccga taaagcagat ctgcgtctga tttatctggc actggcacat 480

atgattaaat ttcgtggtca ttttctgatt gaaggtgatc tgaatccgga taatagcgat 540

gttgataaac tgtttattca gctggttcag acctataatc agctgtttga agaaaatccg 600

attaatgcaa gcggtgttga tgcaaaagca attctgagcg cacgtctgag caaaagccgt 660

cgtctggaaa atctgattgc acagctgccg ggtgaaaaaa aaaatggtct gtttggtaat 720

ctgattgcac tgagcctggg tctgaccccg aattttaaaa gcaattttga tctggcagaa 780

gatgcaaaac tgcagctgag caaagatacc tatgatgatg atctggataa tctgctggca 840

cagattggtg atcagtatgc agatctgttt ctggcagcaa aaaatctgag cgatgcaatt 900

ctgctgagcg atattctgcg tgttaatacc gaaattacca aagcaccgct gagcgcaagc 960

atgattaaac gttatgatga acatcatcag gatctgaccc tgctgaaagc actggttcgt 1020

cagcagctgc cggaaaaata taaagaaatt ttttttgatc agagcaaaaa tggttatgca 1080

ggttatattg atggtggtgc aagccaggaa gaattttata aatttattaa accgattctg 1140

gaaaaaatgg atggtaccga agaactgctg gttaaactga atcgtgaaga tctgctgcgt 1200

aaacagcgta cctttgataa tggtagcatt ccgcatcaga ttcatctggg tgaactgcat 1260

gcaattctgc gtcgtcagga agatttttat ccgtttctga aagataatcg tgaaaaaatt 1320

gaaaaaattc tgacctttcg tattccgtat tatgttggtc cgctggcacg tggtaatagc 1380

cgttttgcat ggatgacccg taaaagcgaa gaaaccatta ccccgtggaa ttttgaagaa 1440

gttgttgata aaggtgcaag cgcacagagc tttattgaac gtatgaccaa ttttgataaa 1500

aatctgccga atgaaaaagt tctgccgaaa catagcctgc tgtatgaata ttttaccgtt 1560

tataatgaac tgaccaaagt taaatatgtt accgaaggta tgcgtaaacc ggcatttctg 1620

agcggtgaac agaaaaaagc aattgttgat ctgctgttta aaaccaatcg taaagttacc 1680

gttaaacagc tgaaagaaga ttattttaaa aaaattgaat gttttgatag cgttgaaatt 1740

agcggtgttg aagatcgttt taatgcaagc ctgggtacct atcatgatct gctgaaaatt 1800

attaaagata aagattttct ggataatgaa gaaaatgaag atattctgga agatattgtt 1860

ctgaccctga ccctgtttga agatcgtgaa atgattgaag aacgtctgaa aacctatgca 1920

catctgtttg atgataaagt tatgaaacag ctgaaacgtc gtcgttatac cggttggggt 1980

cgtctgagcc gtaaactgat taatggtatt cgtgataaac agagcggtaa aaccattctg 2040

gattttctga aaagcgatgg ttttgcaaat cgtaatttta tgcagctgat tcatgatgat 2100

agcctgacct ttaaagaaga tattcagaaa gcacaggtta gcggtcaggg tgatagcctg 2160

catgaacata ttgcaaatct ggcaggtagc ccggcaatta aaaaaggtat tctgcagacc 2220

gttaaagttg ttgatgaact ggttaaagtt atgggtcgtc ataaaccgga aaatattgtt 2280

attgaaatgg cacgtgaaaa tcagaccacc cagaaaggtc agaaaaatag ccgtgaacgt 2340

atgaaacgta ttgaagaagg tattaaagaa ctgggtagcc agattctgaa agaacatccg 2400

gttgaaaata cccagctgca gaatgaaaaa ctgtatctgt attatctgca gaatggtcgt 2460

gatatgtatg ttgatcagga actggatatt aatcgtctga gcgattatga tgttgatcat 2520

attgttccgc agagctttct gaaagatgat agcattgata ataaagttct gacccgtagc 2580

gataaaaatc gtggtaaaag cgataatgtt ccgagcgaag aagttgttaa aaaaatgaaa 2640

aattattggc gtcagctgct gaatgcaaaa ctgattaccc agcgtaaatt tgataatctg 2700

accaaagcag aacgtggtgg tctgagcgaa ctggataaag caggttttat taaacgtcag 2760

ctggttgaaa cccgtcagat taccaaacat gttgcacaga ttctggatag ccgtatgaat 2820

accaaatatg atgaaaatga taaactgatt cgtgaagtta aagttattac cctgaaaagc 2880

aaactggtta gcgattttcg taaagatttt cagttttata aagttcgtga aattaataat 2940

tatcatcatg cacatgatgc atatctgaat gcagttgttg gtaccgcact gattaaaaaa 3000

tatccgaaac tggaaagcga atttgtttat ggtgattata aagtttatga tgttcgtaaa 3060

atgattgcaa aaagcgaaca ggaaattggt aaagcaaccg caaaatattt tttttatagc 3120

aatattatga atttttttaa aaccgaaatt accctggcaa atggtgaaat tcgtaaacgt 3180

ccgctgattg aaaccaatgg tgaaaccggt gaaattgttt gggataaagg tcgtgatttt 3240

gcaaccgttc gtaaagttct gagcatgccg caggttaata ttgttaaaaa aaccgaagtt 3300

cagaccggtg gttttagcaa agaaagcatt ctgccgaaac gtaatagcga taaactgatt 3360

gcacgtaaaa aagattggga tccgaaaaaa tatggtggtt ttgatagccc gaccgttgca 3420

tatagcgttc tggttgttgc aaaagttgaa aaaggtaaaa gcaaaaaact gaaaagcgtt 3480

aaagaactgc tgggtattac cattatggaa cgtagcagct ttgaaaaaaa tccgattgat 3540

tttctggaag caaaaggtta taaagaagtt aaaaaagatc tgattattaa actgccgaaa 3600

tatagcctgt ttgaactgga aaatggtcgt aaacgtatgc tggcaagcgc aggtgaactg 3660

cagaaaggta atgaactggc actgccgagc aaatatgtta attttctgta tctggcaagc 3720

cattatgaaa aactgaaagg tagcccggaa gataatgaac agaaacagct gtttgttgaa 3780

cagcataaac attatctgga tgaaattatt gaacagatta gcgaatttag caaacgtgtt 3840

attctggcag atgcaaatct ggataaagtt ctgagcgcat ataataaaca tcgtgataaa 3900

ccgattcgtg aacaggcaga aaatattatt catctgttta ccctgaccaa tctgggtgca 3960

ccggcagcat ttaaatattt tgataccacc attgatcgta aacgttatac cagcaccaaa 4020

gaagttctgg atgcaaccct gattcatcag agcattaccg gtctgtatga aacccgtatt 4080

gatctgagcc agctgggtgg tgat 4104

<210> 3

<211> 1300

<212> PRT

<213> artificial sequence

<220>

<223> FnCpfI

<400> 3

Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys

20 25 30

Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys

35 40 45

Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu

50 55 60

Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser

65 70 75 80

Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys

85 90 95

Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr

100 105 110

Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile

115 120 125

Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln

130 135 140

Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr

145 150 155 160

Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr

165 170 175

Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser

180 185 190

Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu

195 200 205

Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys

210 215 220

Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu

225 230 235 240

Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg

245 250 255

Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr

260 265 270

Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys

275 280 285

Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile

290 295 300

Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys

305 310 315 320

Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser

325 330 335

Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met

340 345 350

Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys

355 360 365

Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln

370 375 380

Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr

385 390 395 400

Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala

405 410 415

Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn

420 425 430

Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala

435 440 445

Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn

450 455 460

Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala

465 470 475 480

Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys

485 490 495

Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys

500 505 510

Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp

515 520 525

Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His

530 535 540

Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His

545 550 555 560

Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val

565 570 575

Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser

580 585 590

Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly

595 600 605

Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys

610 615 620

Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile

625 630 635 640

Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys

645 650 655

Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val

660 665 670

Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile

675 680 685

Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln

690 695 700

Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe

705 710 715 720

Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp

725 730 735

Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu

740 745 750

Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn

755 760 765

Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr

770 775 780

Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg

785 790 795 800

Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn

805 810 815

Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr

820 825 830

Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala

835 840 845

Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu

850 855 860

Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe

865 870 875 880

His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe

885 890 895

Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His

900 905 910

Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu

915 920 925

Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile

930 935 940

Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile

945 950 955 960

Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn

965 970 975

Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile

980 985 990

Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu

995 1000 1005

Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val

1010 1015 1020

Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu

1025 1030 1035

Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg

1040 1045 1050

Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly

1055 1060 1065

Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser

1070 1075 1080

Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys

1085 1090 1095

Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp

1100 1105 1110

Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe

1115 1120 1125

Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr

1130 1135 1140

Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp

1145 1150 1155

Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu

1160 1165 1170

Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly

1175 1180 1185

Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe

1190 1195 1200

Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg

1205 1210 1215

Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val

1220 1225 1230

Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys

1235 1240 1245

Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly

1250 1255 1260

Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu

1265 1270 1275

Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu

1280 1285 1290

Phe Val Gln Asn Arg Asn Asn

1295 1300

<210> 4

<211> 3900

<212> DNA

<213> artificial sequence

<220>

<223> sequence encoding FnCpfI

<400> 4

atgagcattt atcaggaatt tgttaataaa tatagcctga gcaaaaccct gcgttttgaa 60

ctgattccgc agggtaaaac cctggaaaat attaaagcac gtggtctgat tctggatgat 120

gaaaaacgtg caaaagatta taaaaaagca aaacagatta ttgataaata tcatcagttt 180

tttattgaag aaattctgag cagcgtttgt attagcgaag atctgctgca gaattatagc 240

gatgtttatt ttaaactgaa aaaaagcgat gatgataatc tgcagaaaga ttttaaaagc 300

gcaaaagata ccattaaaaa acagattagc gaatatatta aagatagcga aaaatttaaa 360

aatctgttta atcagaatct gattgatgca aaaaaaggtc aggaaagcga tctgattctg 420

tggctgaaac agagcaaaga taatggtatt gaactgttta aagcaaatag cgatattacc 480

gatattgatg aagcactgga aattattaaa agctttaaag gttggaccac ctattttaaa 540

ggttttcatg aaaatcgtaa aaatgtttat agcagcaatg atattccgac cagcattatt 600

tatcgtattg ttgatgataa tctgccgaaa tttctggaaa ataaagcaaa atatgaaagc 660

ctgaaagata aagcaccgga agcaattaat tatgaacaga ttaaaaaaga tctggcagaa 720

gaactgacct ttgatattga ttataaaacc agcgaagtta atcagcgtgt ttttagcctg 780

gatgaagttt ttgaaattgc aaattttaat aattatctga atcagagcgg tattaccaaa 840

tttaatacca ttattggtgg taaatttgtt aatggtgaaa ataccaaacg taaaggtatt 900

aatgaatata ttaatctgta tagccagcag attaatgata aaaccctgaa aaaatataaa 960

atgagcgttc tgtttaaaca gattctgagc gataccgaaa gcaaaagctt tgttattgat 1020

aaactggaag atgatagcga tgttgttacc accatgcaga gcttttatga acagattgca 1080

gcatttaaaa ccgttgaaga aaaaagcatt aaagaaaccc tgagcctgct gtttgatgat 1140

ctgaaagcac agaaactgga tctgagcaaa atttatttta aaaatgataa aagcctgacc 1200

gatctgagcc agcaggtttt tgatgattat agcgttattg gtaccgcagt tctggaatat 1260

attacccagc agattgcacc gaaaaatctg gataatccga gcaaaaaaga acaggaactg 1320

attgcaaaaa aaaccgaaaa agcaaaatat ctgagcctgg aaaccattaa actggcactg 1380

gaagaattta ataaacatcg tgatattgat aaacagtgtc gttttgaaga aattctggca 1440

aattttgcag caattccgat gatttttgat gaaattgcac agaataaaga taatctggca 1500

cagattagca ttaaatatca gaatcagggt aaaaaagatc tgctgcaggc aagcgcagaa 1560

gatgatgtta aagcaattaa agatctgctg gatcagacca ataatctgct gcataaactg 1620

aaaatttttc atattagcca gagcgaagat aaagcaaata ttctggataa agatgaacat 1680

ttttatctgg tttttgaaga atgttatttt gaactggcaa atattgttcc gctgtataat 1740

aaaattcgta attatattac ccagaaaccg tatagcgatg aaaaatttaa actgaatttt 1800

gaaaatagca ccctggcaaa tggttgggat aaaaataaag aaccggataa taccgcaatt 1860

ctgtttatta aagatgataa atattatctg ggtgttatga ataaaaaaaa taataaaatt 1920

tttgatgata aagcaattaa agaaaataaa ggtgaaggtt ataaaaaaat tgtttataaa 1980

ctgctgccgg gtgcaaataa aatgctgccg aaagtttttt ttagcgcaaa aagcattaaa 2040

ttttataatc cgagcgaaga tattctgcgt attcgtaatc atagcaccca taccaaaaat 2100

ggtagcccgc agaaaggtta tgaaaaattt gaatttaata ttgaagattg tcgtaaattt 2160

attgattttt ataaacagag cattagcaaa catccggaat ggaaagattt tggttttcgt 2220

tttagcgata cccagcgtta taatagcatt gatgaatttt atcgtgaagt tgaaaatcag 2280

ggttataaac tgacctttga aaatattagc gaaagctata ttgatagcgt tgttaatcag 2340

ggtaaactgt atctgtttca gatttataat aaagatttta gcgcatatag caaaggtcgt 2400

ccgaatctgc ataccctgta ttggaaagca ctgtttgatg aacgtaatct gcaggatgtt 2460

gtttataaac tgaatggtga agcagaactg ttttatcgta aacagagcat tccgaaaaaa 2520

attacccatc cggcaaaaga agcaattgca aataaaaata aagataatcc gaaaaaagaa 2580

agcgtttttg aatatgatct gattaaagat aaacgtttta ccgaagataa attttttttt 2640

cattgtccga ttaccattaa ttttaaaagc agcggtgcaa ataaatttaa tgatgaaatt 2700

aatctgctgc tgaaagaaaa agcaaatgat gttcatattc tgagcattga tcgtggtgaa 2760

cgtcatctgg catattatac cctggttgat ggtaaaggta atattattaa acaggatacc 2820

tttaatatta ttggtaatga tcgtatgaaa accaattatc atgataaact ggcagcaatt 2880

gaaaaagatc gtgatagcgc acgtaaagat tggaaaaaaa ttaataatat taaagaaatg 2940

aaagaaggtt atctgagcca ggttgttcat gaaattgcaa aactggttat tgaatataat 3000

gcaattgttg tttttgaaga tctgaatttt ggttttaaac gtggtcgttt taaagttgaa 3060

aaacaggttt atcagaaact ggaaaaaatg ctgattgaaa aactgaatta tctggttttt 3120

aaagataatg aatttgataa aaccggtggt gttctgcgtg catatcagct gaccgcaccg 3180

tttgaaacct ttaaaaaaat gggtaaacag accggtatta tttattatgt tccggcaggt 3240

tttaccagca aaatttgtcc ggttaccggt tttgttaatc agctgtatcc gaaatatgaa 3300

agcgttagca aaagccagga attttttagc aaatttgata aaatttgtta taatctggat 3360

aaaggttatt ttgaatttag ctttgattat aaaaattttg gtgataaagc agcaaaaggt 3420

aaatggacca ttgcaagctt tggtagccgt ctgattaatt ttcgtaatag cgataaaaat 3480

cataattggg atacccgtga agtttatccg accaaagaac tggaaaaact gctgaaagat 3540

tatagcattg aatatggtca tggtgaatgt attaaagcag caatttgtgg tgaaagcgat 3600

aaaaaatttt ttgcaaaact gaccagcgtt ctgaatacca ttctgcagat gcgtaatagc 3660

aaaaccggta ccgaactgga ttatctgatt agcccggttg cagatgttaa tggtaatttt 3720

tttgatagcc gtcaggcacc gaaaaatatg ccgcaggatg cagatgcaaa tggtgcatat 3780

catattggtc tgaaaggtct gatgctgctg ggtcgtatta aaaataatca ggaaggtaaa 3840

aaactgaatc tggttattaa aaatgaagaa tattttgaat ttgttcagaa tcgtaataat 3900

<210> 5

<211> 48502

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 5

gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60

ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120

acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180

ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240

taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300

tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360

tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420

ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480

ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540

gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600

gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660

agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720

cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780

ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840

ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900

tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960

aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020

ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080

gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140

cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200

caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260

atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320

cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380

agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440

gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500

cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560

aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620

atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680

ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740

tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800

cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860

attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920

tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980

accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040

ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100

gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160

tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220

gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280

agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340

acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400

agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460

gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520

gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580

ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640

acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700

ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760

gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820

tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880

acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940

cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000

ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060

ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120

tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180

aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240

atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300

acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360

cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420

aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480

ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540

gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600

gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660

gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720

ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780

gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840

ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900

cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960

aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020

tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080

ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140

caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200

gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260

gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320

gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380

gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440

cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500

ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560

cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620

cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680

cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740

cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800

cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860

ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920

tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980

catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040

aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100

ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160

gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220

gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280

tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340

aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400

tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460

gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520

ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580

gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640

tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700

tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760

aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820

cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880

taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940

tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000

tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060

ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120

tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180

aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240

cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300

cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360

gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420

aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480

tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540

ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600

gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660

ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720

atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780

agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840

gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900

agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960

acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020

aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080

gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140

tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200

catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260

tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320

gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380

gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440

tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500

ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560

agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620

ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680

ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740

gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800

tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860

ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920

tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980

ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040

ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100

cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160

aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220

taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280

agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340

gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400

aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460

ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520

tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580

actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640

ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700

cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760

tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820

cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880

gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940

aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000

ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060

ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120

acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180

ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240

tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300

cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360

tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420

gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480

ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540

gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600

tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660

ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720

aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780

agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840

accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900

tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960

ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020

tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080

acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140

cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200

atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260

gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320

ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380

agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440

cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500

gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560

atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620

ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680

cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740

ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800

aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860

tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920

cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980

ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040

tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100

cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160

agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220

tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280

acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340

gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400

tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460

ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520

aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580

ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640

ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700

agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760

ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820

aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880

atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940

aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000

agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060

gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120

ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180

acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240

agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300

aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360

cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420

ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480

gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540

cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600

tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660

ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720

ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780

cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840

gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900

cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960

tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020

atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080

tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140

ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200

tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260

ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320

gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380

tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440

cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500

gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560

aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620

ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680

tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740

cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800

gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860

gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920

ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980

agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040

tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100

ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160

cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220

gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280

gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340

ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400

gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460

cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520

tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580

gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640

acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700

ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760

gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820

atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880

ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940

gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000

cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060

gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120

tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180

ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240

ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300

tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360

cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420

caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480

tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540

gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600

gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660

ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720

caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780

gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840

cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900

tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960

atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020

ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080

ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140

ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200

agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260

acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320

gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380

gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440

ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500

cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560

aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620

cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680

aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740

gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800

atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860

aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920

catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980

ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040

ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100

gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160

gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220

tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280

ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340

gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400

ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460

ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520

acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580

cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640

gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700

ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760

attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820

atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880

aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940

ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000

gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060

aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120

ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180

agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240

acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300

ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360

ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420

ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480

atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540

gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600

cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660

acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720

gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780

gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840

tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900

tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960

aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020

tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080

gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140

cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200

cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260

gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320

tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380

taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440

aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500

cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560

cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620

gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680

acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740

ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800

tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860

acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920

gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980

aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040

ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100

cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160

ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220

agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280

ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340

aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400

cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460

ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520

gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580

cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640

aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700

tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760

acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820

cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880

gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940

agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000

cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060

gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120

tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180

aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240

ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300

ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360

gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420

gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480

tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540

ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600

aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660

tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720

gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780

tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840

ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900

cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960

gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020

ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080

ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140

gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200

tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260

tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320

gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380

atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440

acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500

gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560

ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620

gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680

atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740

aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800

tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860

ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920

atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980

ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040

gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100

taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160

gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220

attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280

aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340

atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400

attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460

acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520

tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580

tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640

tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700

tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760

tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820

ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880

aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940

tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000

aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060

cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120

ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180

aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240

ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300

ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360

ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420

accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480

gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540

ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600

gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660

atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720

ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780

gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840

ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900

agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960

tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020

caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080

tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140

ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200

ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260

ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320

catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380

gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440

aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500

aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560

taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620

gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680

ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740

gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800

atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860

aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920

tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980

tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040

gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100

aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160

tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220

aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280

tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340

tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400

atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460

gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520

atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580

ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640

ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700

gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760

tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820

gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880

atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940

cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000

accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060

gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120

tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180

tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240

aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300

ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360

ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420

cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480

gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540

aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600

ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660

tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720

tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780

gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840

tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900

gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960

gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020

accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080

cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140

tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200

atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260

caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320

ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380

tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440

tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500

gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560

ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620

ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680

ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740

cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800

ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860

catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920

tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980

ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040

cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100

gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160

gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220

ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280

tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340

cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400

agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460

tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520

gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580

agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640

ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700

gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760

catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820

aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880

atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940

tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000

tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060

aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120

tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180

agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240

ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300

accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360

gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420

gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480

gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540

ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600

tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660

cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720

cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780

cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840

atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900

gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960

acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020

tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080

gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140

aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200

cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260

cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320

ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380

ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440

catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500

gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560

ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620

ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680

gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740

ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800

tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860

ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920

ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980

agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040

tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100

tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160

tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220

accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280

cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340

atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400

ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460

atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520

aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580

accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640

ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700

cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760

ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820

cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880

ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940

tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000

ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060

gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120

tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180

agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240

agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300

agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360

cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420

aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480

tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540

cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600

ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660

cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720

gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780

cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840

cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900

acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960

tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020

actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080

ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140

tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200

cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260

ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320

gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380

cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440

ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500

atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560

tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620

atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680

tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740

taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800

aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860

caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920

cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980

ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040

ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100

ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160

atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220

cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280

ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340

cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400

ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460

cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520

ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580

atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640

cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700

ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760

atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820

cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880

tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940

aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000

caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060

ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120

acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180

ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240

gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300

ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360

ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420

aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480

gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540

gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600

cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660

tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720

cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780

tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840

atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900

tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960

ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020

ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080

tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140

tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200

atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260

ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320

agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380

cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440

attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500

tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560

gcatcacctt tggtaaaggt tctaagctca ggtgagaaca tccctgcctg aacatgagaa 37620

aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680

tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740

gcaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800

cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860

ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920

ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980

gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040

atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100

aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160

tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220

aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280

atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340

tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400

gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460

cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520

gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580

tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640

gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700

aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760

gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820

accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880

ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940

tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000

tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060

aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120

acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180

tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240

ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300

aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360

ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420

tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480

acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540

ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600

agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660

acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720

tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780

gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840

caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900

ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960

ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020

cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080

atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140

cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200

gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260

gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320

taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380

tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440

aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500

ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560

taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620

tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680

atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740

tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800

taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860

agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920

gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980

tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040

tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100

ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160

taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220

tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280

cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340

aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400

cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460

tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520

aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580

cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640

catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700

attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760

aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820

ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880

cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940

ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000

ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060

ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120

taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180

tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240

ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300

aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360

tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420

ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480

ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540

cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600

gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660

gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720

gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780

accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840

gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900

gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960

ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020

atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080

agcatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140

aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200

tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260

gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320

atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380

gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440

gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500

ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560

aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620

aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680

ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740

tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800

tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860

tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920

aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980

tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040

ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100

atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160

ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220

gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280

aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340

ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400

ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460

caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520

ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580

tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640

ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700

cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760

aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820

aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880

ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940

cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000

cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060

gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120

tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180

aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240

aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300

gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tggttcattc 45360

gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420

tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480

ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540

tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600

gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660

ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720

taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780

cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840

atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900

cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960

gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020

tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080

aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140

gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200

atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260

gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320

tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380

aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440

gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500

gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560

aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620

agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680

aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740

catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800

aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860

tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920

ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980

tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040

tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100

caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160

ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220

aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280

cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340

agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400

aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460

ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520

ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580

agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640

agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700

aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760

tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820

ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880

aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940

ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000

tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060

aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120

acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180

gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240

catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300

catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360

aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420

gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480

tccggtgatc cgacaggtta cg 48502

<210> 6

<211> 628

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 6

gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60

ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120

acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180

ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240

taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300

tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360

tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420

ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480

ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540

gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600

gcggcgtttt ccggaactgg aaaaccga 628

<210> 7

<211> 38767

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 7

catgttgatt tcctgaaacg ggatatcatc aaagccatga acaaagcagc cgcgctggat 60

gaactgatac cggggttgct gagtgaatat atcgaacagt caggttaaca ggctgcggca 120

ttttgtccgc gccgggcttc gctcactgtt caggccggag ccacagaccg ccgttgaatg 180

ggcggatgct aattactatc tcccgaaaga atccgcatac caggaagggc gctgggaaac 240

actgcccttt cagcgggcca tcatgaatgc gatgggcagc gactacatcc gtgaggtgaa 300

tgtggtgaag tctgcccgtg tcggttattc caaaatgctg ctgggtgttt atgcctactt 360

tatagagcat aagcagcgca acacccttat ctggttgccg acggatggtg atgccgagaa 420

ctttatgaaa acccacgttg agccgactat tcgtgatatt ccgtcgctgc tggcgctggc 480

cccgtggtat ggcaaaaagc accgggataa cacgctcacc atgaagcgtt tcactaatgg 540

gcgtggcttc tggtgcctgg gcggtaaagc ggcaaaaaac taccgtgaaa agtcggtgga 600

tgtggcgggt tatgatgaac ttgctgcttt tgatgatgat attgaacagg aaggctctcc 660

gacgttcctg ggtgacaagc gtattgaagg ctcggtctgg ccaaagtcca tccgtggctc 720

cacgccaaaa gtgagaggca cctgtcagat tgagcgtgca gccagtgaat ccccgcattt 780

tatgcgtttt catgttgcct gcccgcattg cggggaggag cagtatctta aatttggcga 840

caaagagacg ccgtttggcc tcaaatggac gccggatgac ccctccagcg tgttttatct 900

ctgcgagcat aatgcctgcg tcatccgcca gcaggagctg gactttactg atgcccgtta 960

tatctgcgaa aagaccggga tctggacccg tgatggcatt ctctggtttt cgtcatccgg 1020

tgaagagatt gagccacctg acagtgtgac ctttcacatc tggacagcgt acagcccgtt 1080

caccacctgg gtgcagattg tcaaagactg gatgaaaacg aaaggggata cgggaaaacg 1140

taaaaccttc gtaaacacca cgctcggtga gacgtgggag gcgaaaattg gcgaacgtcc 1200

ggatgctgaa gtgatggcag agcggaaaga gcattattca gcgcccgttc ctgaccgtgt 1260

ggcttacctg accgccggta tcgactccca gctggaccgc tacgaaatgc gcgtatgggg 1320

atgggggccg ggtgaggaaa gctggctgat tgaccggcag attattatgg gccgccacga 1380

cgatgaacag acgctgctgc gtgtggatga ggccatcaat aaaacctata cccgccggaa 1440

tggtgcagaa atgtcgatat cccgtatctg ctgggatact ggcgggattg acccgaccat 1500

tgtgtatgaa cgctcgaaaa aacatgggct gttccgggtg atccccatta aaggggcatc 1560

cgtctacgga aagccggtgg ccagcatgcc acgtaagcga aacaaaaacg gggtttacct 1620

taccgaaatc ggtacggata ccgcgaaaga gcagatttat aaccgcttca cactgacgcc 1680

ggaaggggat gaaccgcttc ccggtgccgt tcacttcccg aataacccgg atatttttga 1740

tctgaccgaa gcgcagcagc tgactgctga agagcaggtc gaaaaatggg tggatggcag 1800

gaaaaaaata ctgtgggaca gcaaaaagcg acgcaatgag gcactcgact gcttcgttta 1860

tgcgctggcg gcgctgcgca tcagtatttc ccgctggcag ctggatctca gtgcgctgct 1920

ggcgagcctg caggaagagg atggtgcagc aaccaacaag aaaacactgg cagattacgc 1980

ccgtgcctta tccggagagg atgaatgacg cgacaggaag aacttgccgc tgcccgtgcg 2040

gcactgcatg acctgatgac aggtaaacgg gtggcaacag tacagaaaga cggacgaagg 2100

gtggagttta cggccacttc cgtgtctgac ctgaaaaaat atattgcaga gctggaagtg 2160

cagaccggca tgacacagcg acgcagggga cctgcaggat tttatgtatg aaaacgccca 2220

ccattcccac ccttctgggg ccggacggca tgacatcgct gcgcgaatat gccggttatc 2280

acggcggtgg cagcggattt ggagggcagt tgcggtcgtg gaacccaccg agtgaaagtg 2340

tggatgcagc cctgttgccc aactttaccc gtggcaatgc ccgcgcagac gatctggtac 2400

gcaataacgg ctatgccgcc aacgccatcc agctgcatca ggatcatatc gtcgggtctt 2460

ttttccggct cagtcatcgc ccaagctggc gctatctggg catcggggag gaagaagccc 2520

gtgccttttc ccgcgaggtt gaagcggcat ggaaagagtt tgccgaggat gactgctgct 2580

gcattgacgt tgagcgaaaa cgcacgttta ccatgatgat tcgggaaggt gtggccatgc 2640

acgcctttaa cggtgaactg ttcgttcagg ccacctggga taccagttcg tcgcggcttt 2700

tccggacaca gttccggatg gtcagcccga agcgcatcag caacccgaac aataccggcg 2760

acagccggaa ctgccgtgcc ggtgtgcaga ttaatgacag cggtgcggcg ctgggatatt 2820

acgtcagcga ggacgggtat cctggctgga tgccgcagaa atggacatgg ataccccgtg 2880

agttacccgg cgggcgcgcc tcgttcattc acgtttttga acccgtggag gacgggcaga 2940

ctcgcggtgc aaatgtgttt tacagcgtga tggagcagat gaagatgctc gacacgctgc 3000

agaacacgca gctgcagagc gccattgtga aggcgatgta tgccgccacc attgagagtg 3060

agctggatac gcagtcagcg atggatttta ttctgggcgc gaacagtcag gagcagcggg 3120

aaaggctgac cggctggatt ggtgaaattg ccgcgtatta cgccgcagcg ccggtccggc 3180

tgggaggcgc aaaagtaccg cacctgatgc cgggtgactc actgaacctg cagacggctc 3240

aggatacgga taacggctac tccgtgtttg agcagtcact gctgcggtat atcgctgccg 3300

ggctgggtgt ctcgtatgag cagctttccc ggaattacgc ccagatgagc tactccacgg 3360

cacgggccag tgcgaacgag tcgtgggcgt actttatggg gcggcgaaaa ttcgtcgcat 3420

cccgtcaggc gagccagatg tttctgtgct ggctggaaga ggccatcgtt cgccgcgtgg 3480

tgacgttacc ttcaaaagcg cgcttcagtt ttcaggaagc ccgcagtgcc tgggggaact 3540

gcgactggat aggctccggt cgtatggcca tcgatggtct gaaagaagtt caggaagcgg 3600

tgatgctgat agaagccgga ctgagtacct acgagaaaga gtgcgcaaaa cgcggtgacg 3660

actatcagga aatttttgcc cagcaggtcc gtgaaacgat ggagcgccgt gcagccggtc 3720

ttaaaccgcc cgcctgggcg gctgcagcat ttgaatccgg gctgcgacaa tcaacagagg 3780

aggagaagag tgacagcaga gctgcgtaat ctcccgcata ttgccagcat ggcctttaat 3840

gagccgctga tgcttgaacc cgcctatgcg cgggttttct tttgtgcgct tgcaggccag 3900

cttgggatca gcagcctgac ggatgcggtg tccggcgaca gcctgactgc ccaggaggca 3960

ctcgcgacgc tggcattatc cggtgatgat gacggaccac gacaggcccg cagttatcag 4020

gtcatgaacg gcatcgccgt gctgccggtg tccggcacgc tggtcagccg gacgcgggcg 4080

ctgcagccgt actcggggat gaccggttac aacggcatta tcgcccgtct gcaacaggct 4140

gccagcgatc cgatggtgga cggcattctg ctcgatatgg acacgcccgg cgggatggtg 4200

gcgggggcat ttgactgcgc tgacatcatc gcccgtgtgc gtgacataaa accggtatgg 4260

gcgcttgcca acgacatgaa ctgcagtgca ggtcagttgc ttgccagtgc cgcctcccgg 4320

cgtctggtca cgcagaccgc ccggacaggc tccatcggcg tcatgatggc tcacagtaat 4380

tacggtgctg cgctggagaa acagggtgtg gaaatcacgc tgatttacag cggcagccat 4440

aaggtggatg gcaaccccta cagccatctt ccggatgacg tccgggagac actgcagtcc 4500

cggatggacg caacccgcca gatgtttgcg cagaaggtgt cggcatatac cggcctgtcc 4560

gtgcaggttg tgctggatac cgaggctgca gtgtacagcg gtcaggaggc cattgatgcc 4620

ggactggctg atgaacttgt taacagcacc gatgcgatca ccgtcatgcg tgatgcactg 4680

gatgcacgta aatcccgtct ctcaggaggg cgaatgacca aagagactca atcaacaact 4740

gtttcagcca ctgcttcgca ggctgacgtt actgacgtgg tgccagcgac ggagggcgag 4800

aacgccagcg cggcgcagcc ggacgtgaac gcgcagatca ccgcagcggt tgcggcagaa 4860

aacagccgca ttatggggat cctcaactgt gaggaggctc acggacgcga agaacaggca 4920

cgcgtgctgg cagaaacccc cggtatgacc gtgaaaacgg cccgccgcat tctggccgca 4980

gcaccacaga gtgcacaggc gcgcagtgac actgcgctgg atcgtctgat gcagggggca 5040

ccggcaccgc tggctgcagg taacccggca tctgatgccg ttaacgattt gctgaacaca 5100

ccagtgtaag ggatgtttat gacgagcaaa gaaaccttta cccattacca gccgcagggc 5160

aacagtgacc cggctcatac cgcaaccgcg cccggcggat tgagtgcgaa agcgcctgca 5220

atgaccccgc tgatgctgga cacctccagc cgtaagctgg ttgcgtggga tggcaccacc 5280

gacggtgctg ccgttggcat tcttgcggtt gctgctgacc agaccagcac cacgctgacg 5340

ttctacaagt ccggcacgtt ccgttatgag gatgtgctct ggccggaggc tgccagcgac 5400

gagacgaaaa aacggaccgc gtttgccgga acggcaatca gcatcgttta actttaccct 5460

tcatcactaa aggccgcctg tgcggctttt tttacgggat ttttttatgt cgatgtacac 5520

aaccgcccaa ctgctggcgg caaatgagca gaaatttaag tttgatccgc tgtttctgcg 5580

tctctttttc cgtgagagct atcccttcac cacggagaaa gtctatctct cacaaattcc 5640

gggactggta aacatggcgc tgtacgtttc gccgattgtt tccggtgagg ttatccgttc 5700

ccgtggcggc tccacctctg aatttacgcc gggatatgtc aagccgaagc atgaagtgaa 5760

tccgcagatg accctgcgtc gcctgccgga tgaagatccg cagaatctgg cggacccggc 5820

ttaccgccgc cgtcgcatca tcatgcagaa catgcgtgac gaagagctgg ccattgctca 5880

ggtcgaagag atgcaggcag tttctgccgt gcttaagggc aaatacacca tgaccggtga 5940

agccttcgat ccggttgagg tggatatggg ccgcagtgag gagaataaca tcacgcagtc 6000

cggcggcacg gagtggagca agcgtgacaa gtccacgtat gacccgaccg acgatatcga 6060

agcctacgcg ctgaacgcca gcggtgtggt gaatatcatc gtgttcgatc cgaaaggctg 6120

ggcgctgttc cgttccttca aagccgtcaa ggagaagctg gatacccgtc gtggctctaa 6180

ttccgagctg gagacagcgg tgaaagacct gggcaaagcg gtgtcctata aggggatgta 6240

tggcgatgtg gccatcgtcg tgtattccgg acagtacgtg gaaaacggcg tcaaaaagaa 6300

cttcctgccg gacaacacga tggtgctggg gaacactcag gcacgcggtc tgcgcaccta 6360

tggctgcatt caggatgcgg acgcacagcg cgaaggcatt aacgcctctg cccgttaccc 6420

gaaaaactgg gtgaccaccg gcgatccggc gcgtgagttc accatgattc agtcagcacc 6480

gctgatgctg ctggctgacc ctgatgagtt cgtgtccgta caactggcgt aatcatggcc 6540

cttcggggcc attgtttctc tgtggaggag tccatgacga aagatgaact gattgcccgt 6600

ctccgctcgc tgggtgaaca actgaaccgt gatgtcagcc tgacggggac gaaagaagaa 6660

ctggcgctcc gtgtggcaga gctgaaagag gagcttgatg acacggatga aactgccggt 6720

caggacaccc ctctcagccg ggaaaatgtg ctgaccggac atgaaaatga ggtgggatca 6780

gcgcagccgg ataccgtgat tctggatacg tctgaactgg tcacggtcgt ggcactggtg 6840

aagctgcata ctgatgcact tcacgccacg cgggatgaac ctgtggcatt tgtgctgccg 6900

ggaacggcgt ttcgtgtctc tgccggtgtg gcagccgaaa tgacagagcg cggcctggcc 6960

agaatgcaat aacgggaggc gctgtggctg atttcgataa cctgttcgat gctgccattg 7020

cccgcgccga tgaaacgata cgcgggtaca tgggaacgtc agccaccatt acatccggtg 7080

agcagtcagg tgcggtgata cgtggtgttt ttgatgaccc tgaaaatatc agctatgccg 7140

gacagggcgt gcgcgttgaa ggctccagcc cgtccctgtt tgtccggact gatgaggtgc 7200

ggcagctgcg gcgtggagac acgctgacca tcggtgagga aaatttctgg gtagatcggg 7260

tttcgccgga tgatggcgga agttgtcatc tctggcttgg acggggcgta ccgcctgccg 7320

ttaaccgtcg ccgctgaaag ggggatgtat ggccataaaa ggtcttgagc aggccgttga 7380

aaacctcagc cgtatcagca aaacggcggt gcctggtgcc gccgcaatgg ccattaaccg 7440

cgttgcttca tccgcgatat cgcagtcggc gtcacaggtt gcccgtgaga caaaggtacg 7500

ccggaaactg gtaaaggaaa gggccaggct gaaaagggcc acggtcaaaa atccgcaggc 7560

cagaatcaaa gttaaccggg gggatttgcc cgtaatcaag ctgggtaatg cgcgggttgt 7620

cctttcgcgc cgcaggcgtc gtaaaaaggg gcagcgttca tccctgaaag gtggcggcag 7680

cgtgcttgtg gtgggtaacc gtcgtattcc cggcgcgttt attcagcaac tgaaaaatgg 7740

ccggtggcat gtcatgcagc gtgtggctgg gaaaaaccgt taccccattg atgtggtgaa 7800

aatcccgatg gcggtgccgc tgaccacggc gtttaaacaa aatattgagc ggatacggcg 7860

tgaacgtctt ccgaaagagc tgggctatgc gctgcagcat caactgagga tggtaataaa 7920

gcgatgaaac atactgaact ccgtgcagcc gtactggatg cactggagaa gcatgacacc 7980

ggggcgacgt tttttgatgg tcgccccgct gtttttgatg aggcggattt tccggcagtt 8040

gccgtttatc tcaccggcgc tgaatacacg ggcgaagagc tggacagcga tacctggcag 8100

gcggagctgc atatcgaagt tttcctgcct gctcaggtgc cggattcaga gctggatgcg 8160

tggatggagt cccggattta tccggtgatg agcgatatcc cggcactgtc agatttgatc 8220

accagtatgg tggccagcgg ctatgactac cggcgcgacg atgatgcggg cttgtggagt 8280

tcagccgatc tgacttatgt cattacctat gaaatgtgag gacgctatgc ctgtaccaaa 8340

tcctacaatg ccggtgaaag gtgccgggac caccctgtgg gtttataagg ggagcggtga 8400

cccttacgcg aatccgcttt cagacgttga ctggtcgcgt ctggcaaaag ttaaagacct 8460

gacgcccggc gaactgaccg ctgagtccta tgacgacagc tatctcgatg atgaagatgc 8520

agactggact gcgaccgggc aggggcagaa atctgccgga gataccagct tcacgctggc 8580

gtggatgccc ggagagcagg ggcagcaggc gctgctggcg tggtttaatg aaggcgatac 8640

ccgtgcctat aaaatccgct tcccgaacgg cacggtcgat gtgttccgtg gctgggtcag 8700

cagtatcggt aaggcggtga cggcgaagga agtgatcacc cgcacggtga aagtcaccaa 8760

tgtgggacgt ccgtcgatgg cagaagatcg cagcacggta acagcggcaa ccggcatgac 8820

cgtgacgcct gccagcacct cggtggtgaa agggcagagc accacgctga ccgtggcctt 8880

ccagccggag ggcgtaaccg acaagagctt tcgtgcggtg tctgcggata aaacaaaagc 8940

caccgtgtcg gtcagtggta tgaccatcac cgtgaacggc gttgctgcag gcaaggtcaa 9000

cattccggtt gtatccggta atggtgagtt tgctgcggtt gcagaaatta ccgtcaccgc 9060

cagttaatcc ggagagtcag cgatgttcct gaaaaccgaa tcatttgaac ataacggtgt 9120

gaccgtcacg ctttctgaac tgtcagccct gcagcgcatt gagcatctcg ccctgatgaa 9180

acggcaggca gaacaggcgg agtcagacag caaccggaag tttactgtgg aagacgccat 9240

cagaaccggc gcgtttctgg tggcgatgtc cctgtggcat aaccatccgc agaagacgca 9300

gatgccgtcc atgaatgaag ccgttaaaca gattgagcag gaagtgctta ccacctggcc 9360

cacggaggca atttctcatg ctgaaaacgt ggtgtaccgg ctgtctggta tgtatgagtt 9420

tgtggtgaat aatgcccctg aacagacaga ggacgccggg cccgcagagc ctgtttctgc 9480

gggaaagtgt tcgacggtga gctgagtttt gccctgaaac tggcgcgtga gatggggcga 9540

cccgactggc gtgccatgct tgccgggatg tcatccacgg agtatgccga ctggcaccgc 9600

ttttacagta cccattattt tcatgatgtt ctgctggata tgcacttttc cgggctgacg 9660

tacaccgtgc tcagcctgtt tttcagcgat ccggatatgc atccgctgga tttcagtctg 9720

ctgaaccggc gcgaggctga cgaagagcct gaagatgatg tgctgatgca gaaagcggca 9780

gggcttgccg gaggtgtccg ctttggcccg gacgggaatg aagttatccc cgcttccccg 9840

gatgtggcgg acatgacgga ggatgacgta atgctgatga cagtatcaga agggatcgca 9900

ggaggagtcc ggtatggctg aaccggtagg cgatctggtc gttgatttga gtctggatgc 9960

ggccagattt gacgagcaga tggccagagt caggcgtcat ttttctggta cggaaagtga 10020

tgcgaaaaaa acagcggcag tcgttgaaca gtcgctgagc cgacaggcgc tggctgcaca 10080

gaaagcgggg atttccgtcg ggcagtataa agccgccatg cgtatgctgc ctgcacagtt 10140

caccgacgtg gccacgcagc ttgcaggcgg gcaaagtccg tggctgatcc tgctgcaaca 10200

gggggggcag gtgaaggact ccttcggcgg gatgatcccc atgttcaggg ggcttgccgg 10260

tgcgatcacc ctgccgatgg tgggggccac ctcgctggcg gtggcgaccg gtgcgctggc 10320

gtatgcctgg tatcagggca actcaaccct gtccgatttc aacaaaacgc tggtcctttc 10380

cggcaatcag gcgggactga cggcagatcg tatgctggtc ctgtccagag ccgggcaggc 10440

ggcagggctg acgtttaacc agaccagcga gtcactcagc gcactggtta aggcgggggt 10500

aagcggtgag gctcagattg cgtccatcag ccagagtgtg gcgcgtttct cctctgcatc 10560

cggcgtggag gtggacaagg tcgctgaagc cttcgggaag ctgaccacag acccgacgtc 10620

ggggctgacg gcgatggctc gccagttcca taacgtgtcg gcggagcaga ttgcgtatgt 10680

tgctcagttg cagcgttccg gcgatgaagc cggggcattg caggcggcga acgaggccgc 10740

aacgaaaggg tttgatgacc agacccgccg cctgaaagag aacatgggca cgctggagac 10800

ctgggcagac aggactgcgc gggcattcaa atccatgtgg gatgcggtgc tggatattgg 10860

tcgtcctgat accgcgcagg agatgctgat taaggcagag gctgcgtata agaaagcaga 10920

cgacatctgg aatctgcgca aggatgatta ttttgttaac gatgaagcgc gggcgcgtta 10980

ctgggatgat cgtgaaaagg cccgtcttgc gcttgaagcc gcccgaaaga aggctgagca 11040

gcagactcaa caggacaaaa atgcgcagca gcagagcgat accgaagcgt cacggctgaa 11100

atataccgaa gaggcgcaga aggcttacga acggctgcag acgccgctgg agaaatatac 11160

cgcccgtcag gaagaactga acaaggcact gaaagacggg aaaatcctgc aggcggatta 11220

caacacgctg atggcggcgg cgaaaaagga ttatgaagcg acgctgaaaa agccgaaaca 11280

gtccagcgtg aaggtgtctg cgggcgatcg tcaggaagac agtgctcatg ctgccctgct 11340

gacgcttcag gcagaactcc ggacgctgga gaagcatgcc ggagcaaatg agaaaatcag 11400

ccagcagcgc cgggatttgt ggaaggcgga gagtcagttc gcggtactgg aggaggcggc 11460

gcaacgtcgc cagctgtctg cacaggagaa atccctgctg gcgcataaag atgagacgct 11520

ggagtacaaa cgccagctgg ctgcacttgg cgacaaggtt acgtatcagg agcgcctgaa 11580

cgcgctggcg cagcaggcgg ataaattcgc acagcagcaa cgggcaaaac gggccgccat 11640

tgatgcgaaa agccgggggc tgactgaccg gcaggcagaa cgggaagcca cggaacagcg 11700

cctgaaggaa cagtatggcg ataatccgct ggcgctgaat aacgtcatgt cagagcagaa 11760

aaagacctgg gcggctgaag accagcttcg cgggaactgg atggcaggcc tgaagtccgg 11820

ctggagtgag tgggaagaga gcgccacgga cagtatgtcg caggtaaaaa gtgcagccac 11880

gcagaccttt gatggtattg cacagaatat ggcggcgatg ctgaccggca gtgagcagaa 11940

ctggcgcagc ttcacccgtt ccgtgctgtc catgatgaca gaaattctgc ttaagcaggc 12000

aatggtgggg attgtcggga gtatcggcag cgccattggc ggggctgttg gtggcggcgc 12060

atccgcgtca ggcggtacag ccattcaggc cgctgcggcg aaattccatt ttgcaaccgg 12120

aggatttacg ggaaccggcg gcaaatatga gccagcgggg attgttcacc gtggtgagtt 12180

tgtcttcacg aaggaggcaa ccagccggat tggcgtgggg aatctttacc ggctgatgcg 12240

cggctatgcc accggcggtt atgtcggtac accgggcagc atggcagaca gccggtcgca 12300

ggcgtccggg acgtttgagc agaataacca tgtggtgatt aacaacgacg gcacgaacgg 12360

gcagataggt ccggctgctc tgaaggcggt gtatgacatg gcccgcaagg gtgcccgtga 12420

tgaaattcag acacagatgc gtgatggtgg cctgttctcc ggaggtggac gatgaagacc 12480

ttccgctgga aagtgaaacc cggtatggat gtggcttcgg tcccttctgt aagaaaggtg 12540

cgctttggtg atggctattc tcagcgagcg cctgccgggc tgaatgccaa cctgaaaacg 12600

tacagcgtga cgctttctgt cccccgtgag gaggccacgg tactggagtc gtttctggaa 12660

gagcacgggg gctggaaatc ctttctgtgg acgccgcctt atgagtggcg gcagataaag 12720

gtgacctgcg caaaatggtc gtcgcgggtc agtatgctgc gtgttgagtt cagcgcagag 12780

tttgaacagg tggtgaactg atgcaggata tccggcagga aacactgaat gaatgcaccc 12840

gtgcggagca gtcggccagc gtggtgctct gggaaatcga cctgacagag gtcggtggag 12900

aacgttattt tttctgtaat gagcagaacg aaaaaggtga gccggtcacc tggcaggggc 12960

gacagtatca gccgtatccc attcagggga gcggttttga actgaatggc aaaggcacca 13020

gtacgcgccc cacgctgacg gtttctaacc tgtacggtat ggtcaccggg atggcggaag 13080

atatgcagag tctggtcggc ggaacggtgg tccggcgtaa ggtttacgcc cgttttctgg 13140

atgcggtgaa cttcgtcaac ggaaacagtt acgccgatcc ggagcaggag gtgatcagcc 13200

gctggcgcat tgagcagtgc agcgaactga gcgcggtgag tgcctccttt gtactgtcca 13260

cgccgacgga aacggatggc gctgtttttc cgggacgtat catgctggcc aacacctgca 13320

cctggaccta tcgcggtgac gagtgcggtt atagcggtcc ggctgtcgcg gatgaatatg 13380

accagccaac gtccgatatc acgaaggata aatgcagcaa atgcctgagc ggttgtaagt 13440

tccgcaataa cgtcggcaac tttggcggct tcctttccat taacaaactt tcgcagtaaa 13500

tcccatgaca cagacagaat cagcgattct ggcgcacgcc cggcgatgtg cgccagcgga 13560

gtcgtgcggc ttcgtggtaa gcacgccgga gggggaaaga tatttcccct gcgtgaatat 13620

ctccggtgag ccggaggcta tttccgtatg tcgccggaag actggctgca ggcagaaatg 13680

cagggtgaga ttgtggcgct ggtccacagc caccccggtg gtctgccctg gctgagtgag 13740

gccgaccggc ggctgcaggt gcagagtgat ttgccgtggt ggctggtctg ccgggggacg 13800

attcataagt tccgctgtgt gccgcatctc accgggcggc gctttgagca cggtgtgacg 13860

gactgttaca cactgttccg ggatgcttat catctggcgg ggattgagat gccggacttt 13920

catcgtgagg atgactggtg gcgtaacggc cagaatctct atctggataa tctggaggcg 13980

acggggctgt atcaggtgcc gttgtcagcg gcacagccgg gcgatgtgct gctgtgctgt 14040

tttggttcat cagtgccgaa tcacgccgca atttactgcg gcgacggcga gctgctgcac 14100

catattcctg aacaactgag caaacgagag aggtacaccg acaaatggca gcgacgcaca 14160

cactccctct ggcgtcaccg ggcatggcgc gcatctgcct ttacggggat ttacaacgat 14220

ttggtcgccg catcgacctt cgtgtgaaaa cgggggctga agccatccgg gcactggcca 14280

cacagctccc ggcgtttcgt cagaaactga gcgacggctg gtatcaggta cggattgccg 14340

ggcgggacgt cagcacgtcc gggttaacgg cgcagttaca tgagactctg cctgatggcg 14400

ctgtaattca tattgttccc agagtcgccg gggccaagtc aggtggcgta ttccagattg 14460

tcctgggggc tgccgccatt gccggatcat tctttaccgc cggagccacc cttgcagcat 14520

ggggggcagc cattggggcc ggtggtatga ccggcatcct gttttctctc ggtgccagta 14580

tggtgctcgg tggtgtggcg cagatgctgg caccgaaagc cagaactccc cgtatacaga 14640

caacggataa cggtaagcag aacacctatt tctcctcact ggataacatg gttgcccagg 14700

gcaatgttct gcctgttctg tacggggaaa tgcgcgtggg gtcacgcgtg gtttctcagg 14760

agatcagcac ggcagacgaa ggggacggtg gtcaggttgt ggtgattggt cgctgatgca 14820

aaatgtttta tgtgaaaccg cctgcgggcg gttttgtcat ttatggagcg tgaggaatgg 14880

gtaaaggaag cagtaagggg cataccccgc gcgaagcgaa ggacaacctg aagtccacgc 14940

agttgctgag tgtgatcgat gccatcagcg aagggccgat tgaaggtccg gtggatggct 15000

taaaaagcgt gctgctgaac agtacgccgg tgctggacac tgaggggaat accaacatat 15060

ccggtgtcac ggtggtgttc cgggctggtg agcaggagca gactccgccg gagggatttg 15120

aatcctccgg ctccgagacg gtgctgggta cggaagtgaa atatgacacg ccgatcaccc 15180

gcaccattac gtctgcaaac atcgaccgtc tgcgctttac cttcggtgta caggcactgg 15240

tggaaaccac ctcaaagggt gacaggaatc cgtcggaagt ccgcctgctg gttcagatac 15300

aacgtaacgg tggctgggtg acggaaaaag acatcaccat taagggcaaa accacctcgc 15360

agtatctggc ctcggtggtg atgggtaacc tgccgccgcg cccgtttaat atccggatgc 15420

gcaggatgac gccggacagc accacagacc agctgcagaa caaaacgctc tggtcgtcat 15480

acactgaaat catcgatgtg aaacagtgct acccgaacac ggcactggtc ggcgtgcagg 15540

tggactcgga gcagttcggc agccagcagg tgagccgtaa ttatcatctg cgcgggcgta 15600

ttctgcaggt gccgtcgaac tataacccgc agacgcggca atacagcggt atctgggacg 15660

gaacgtttaa accggcatac agcaacaaca tggcctggtg tctgtgggat atgctgaccc 15720

atccgcgcta cggcatgggg aaacgtcttg gtgcggcgga tgtggataaa tgggcgctgt 15780

atgtcatcgg ccagtactgc gaccagtcag tgccggacgg ctttggcggc acggagccgc 15840

gcatcacctg taatgcgtac ctgaccacac agcgtaaggc gtgggatgtg ctcagcgatt 15900

tctgctcggc gatgcgctgt atgccggtat ggaacgggca gacgctgacg ttcgtgcagg 15960

accgaccgtc ggataagacg tggacctata accgcagtaa tgtggtgatg ccggatgatg 16020

gcgcgccgtt ccgctacagc ttcagcgccc tgaaggaccg ccataatgcc gttgaggtga 16080

actggattga cccgaacaac ggctgggaga cggcgacaga gcttgttgaa gatacgcagg 16140

ccattgcccg ttacggtcgt aatgttacga agatggatgc ctttggctgt accagccggg 16200

ggcaggcaca ccgcgccggg ctgtggctga ttaaaacaga actgctggaa acgcagaccg 16260

tggatttcag cgtcggcgca gaagggcttc gccatgtacc gggcgatgtt attgaaatct 16320

gcgatgatga ctatgccggt atcagcaccg gtggtcgtgt gctggcggtg aacagccaga 16380

cccggacgct gacgctcgac cgtgaaatca cgctgccatc ctccggtacc gcgctgataa 16440

gcctggttga cggaagtggc aatccggtca gcgtggaggt tcagtccgtc accgacggcg 16500

tgaaggtaaa agtgagccgt gttcctgacg gtgttgctga atacagcgta tgggagctga 16560

agctgccgac gctgcgccag cgactgttcc gctgcgtgag tatccgtgag aacgacgacg 16620

gcacgtatgc catcaccgcc gtgcagcatg tgccggaaaa agaggccatc gtggataacg 16680

gggcgcactt tgacggcgaa cagagtggca cggtgaatgg tgtcacgccg ccagcggtgc 16740

agcacctgac cgcagaagtc actgcagaca gcggggaata tcaggtgctg gcgcgatggg 16800

acacaccgaa ggtggtgaag ggcgtgagtt tcctgctccg tctgaccgta acagcggacg 16860

acggcagtga gcggctggtc agcacggccc ggacgacgga aaccacatac cgcttcacgc 16920

aactggcgct ggggaactac aggctgacag tccgggcggt aaatgcgtgg gggcagcagg 16980

gcgatccggc gtcggtatcg ttccggattg ccgcaccggc agcaccgtcg aggattgagc 17040

tgacgccggg ctattttcag ataaccgcca cgccgcatct tgccgtttat gacccgacgg 17100

tacagtttga gttctggttc tcggaaaagc agattgcgga tatcagacag gttgaaacca 17160

gcacgcgtta tcttggtacg gcgctgtact ggatagccgc cagtatcaat atcaaaccgg 17220

gccatgatta ttacttttat atccgcagtg tgaacaccgt tggcaaatcg gcattcgtgg 17280

aggccgtcgg tcgggcgagc gatgatgcgg aaggttacct ggattttttc aaaggcaaga 17340

taaccgaatc ccatctcggc aaggagctgc tggaaaaagt cgagctgacg gaggataacg 17400

ccagcagact ggaggagttt tcgaaagagt ggaaggatgc cagtgataag tggaatgcca 17460

tgtgggctgt caaaattgag cagaccaaag acggcaaaca ttatgtcgcg ggtattggcc 17520

tcagcatgga ggacacggag gaaggcaaac tgagccagtt tctggttgcc gccaatcgta 17580

tcgcatttat tgacccggca aacgggaatg aaacgccgat gtttgtggcg cagggcaacc 17640

agatattcat gaacgacgtg ttcctgaagc gcctgacggc ccccaccatt accagcggcg 17700

gcaatcctcc ggccttttcc ctgacaccgg acggaaagct gaccgctaaa aatgcggata 17760

tcagtggcag tgtgaatgcg aactccggga cgctcagtaa tgtgacgata gctgaaaact 17820

gtacgataaa cggtacgctg agggcggaaa aaatcgtcgg ggacattgta aaggcggcga 17880

gcgcggcttt tccgcgccag cgtgaaagca gtgtggactg gccgtcaggt acccgtactg 17940

tcaccgtgac cgatgaccat ccttttgatc gccagatagt ggtgcttccg ctgacgtttc 18000

gcggaagtaa gcgtactgtc agcggcagga caacgtattc gatgtgttat ctgaaagtac 18060

tgatgaacgg tgcggtgatt tatgatggcg cggcgaacga ggcggtacag gtgttctccc 18120

gtattgttga catgccagcg ggtcggggaa acgtgatcct gacgttcacg cttacgtcca 18180

cacggcattc ggcagatatt ccgccgtata cgtttgccag cgatgtgcag gttatggtga 18240

ttaagaaaca ggcgctgggc atcagcgtgg tctgagtgtg ttacagaggt tcgtccggga 18300

acgggcgttt tattataaaa cagtgagagg tgaacgatgc gtaatgtgtg tattgccgtt 18360

gctgtctttg ccgcacttgc ggtgacagtc actccggccc gtgcggaagg tggacatggt 18420

acgtttacgg tgggctattt tcaagtgaaa ccgggtacat tgccgtcgtt gtcgggcggg 18480

gataccggtg tgagtcatct gaaagggatt aacgtgaagt accgttatga gctgacggac 18540

agtgtggggg tgatggcttc cctggggttc gccgcgtcga aaaagagcag cacagtgatg 18600

accggggagg atacgtttca ctatgagagc ctgcgtggac gttatgtgag cgtgatggcc 18660

ggaccggttt tacaaatcag taagcaggtc agtgcgtacg ccatggccgg agtggctcac 18720

agtcggtggt ccggcagtac aatggattac cgtaagacgg aaatcactcc cgggtatatg 18780

aaagagacga ccactgccag ggacgaaagt gcaatgcggc atacctcagt ggcgtggagt 18840

gcaggtatac agattaatcc ggcagcgtcc gtcgttgttg atattgctta tgaaggctcc 18900

ggcagtggcg actggcgtac tgacggattc atcgttgggg tcggttataa attctgatta 18960

gccaggtaac acagtgttat gacagcccgc cggaaccggt gggctttttt gtggggtgaa 19020

tatggcagta aagatttcag gagtcctgaa agacggcaca ggaaaaccgg tacagaactg 19080

caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 19140

agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 19200

catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 19260

ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 19320

ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 19380

ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 19440

ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 19500

acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 19560

cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aaaaacgcgg cggccaccag 19620

tgccggtgcg gcgaaaacgt cagaaacgaa tgctgcagcg tcacaacaat cagccgccac 19680

gtctgcctcc accgcggcca cgaaagcgtc agaggccgcc acttcagcac gagatgcggt 19740

ggcctcaaaa gaggcagcaa aatcatcaga aacgaacgca tcatcaagtg ccggtcgtgc 19800

agcttcctcg gcaacggcgg cagaaaattc tgccagggcg gcaaaaacgt ccgagacgaa 19860

tgccaggtca tctgaaacag cagcggaacg gagcgcctct gccgcggcag acgcaaaaac 19920

agcggcggcg gggagtgcgt caacggcatc cacgaaggcg acagaggctg cgggaagtgc 19980

ggtatcagca tcgcagagca aaagtgcggc agaagcggcg gcaatacgtg caaaaaattc 20040

ggcaaaacgt gcagaagata tagcttcagc tgtcgcgctt gaggatgcgg acacaacgag 20100

aaaggggata gtgcagctca gcagtgcaac caacagcacg tctgaaacgc ttgctgcaac 20160

gccaaaggcg gttaaggtgg taatggatga aacgaacaga aaagcccact ggacagtccg 20220

gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 20280

gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 20340

ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 20400

atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 20460

ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 20520

gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 20580

taccttgggg ccggtgagaa ttcggccttt ccggcaggtg cgccgatccc gtggccatca 20640

gatatcgttc cgtctggcta cgtcctgatg caggggcagg cgtttgacaa atcagcctac 20700

ccaaaacttg ctgtcgcgta tccatcgggt gtgcttcctg atatgcgagg ctggacaatc 20760

aaggggaaac ccgccagcgg tcgtgctgta ttgtctcagg aacaggatgg aattaagtcg 20820

cacacccaca gtgccagtgc atccggtacg gatttgggga cgaaaaccac atcgtcgttt 20880

gattacggga cgaaaacaac aggcagtttc gattacggca ccaaatcgac gaataacacg 20940

ggggctcatg ctcacagtct gagcggttca acaggggccg cgggtgctca tgcccacaca 21000

agtggtttaa ggatgaacag ttctggctgg agtcagtatg gaacagcaac cattacagga 21060

agtttatcca cagttaaagg aaccagcaca cagggtattg cttatttatc gaaaacggac 21120

agtcagggca gccacagtca ctcattgtcc ggtacagccg tgagtgccgg tgcacatgcg 21180

catacagttg gtattggtgc gcaccagcat ccggttgtta tcggtgctca tgcccattct 21240

ttcagtattg gttcacacgg acacaccatc accgttaacg ctgcgggtaa cgcggaaaac 21300

accgtcaaaa acattgcatt taactatatt gtgaggcttg cataatggca ttcagaatga 21360

gtgaacaacc acggaccata aaaatttata atctgctggc cggaactaat gaatttattg 21420

gtgaaggtga cgcatatatt ccgcctcata ccggtctgcc tgcaaacagt accgatattg 21480

caccgccaga tattccggct ggctttgtgg ctgttttcaa cagtgatgag gcatcgtggc 21540

atctcgttga agaccatcgg ggtaaaaccg tctatgacgt ggcttccggc gacgcgttat 21600

ttatttctga actcggtccg ttaccggaaa attttacctg gttatcgccg ggaggggaat 21660

atcagaagtg gaacggcaca gcctgggtga aggatacgga agcagaaaaa ctgttccgga 21720

tccgggaggc ggaagaaaca aaaaaaagcc tgatgcaggt agccagtgag catattgcgc 21780

cgcttcagga tgctgcagat ctggaaattg caacgaagga agaaacctcg ttgctggaag 21840

cctggaagaa gtatcgggtg ttgctgaacc gtgttgatac atcaactgca cctgatattg 21900

agtggcctgc tgtccctgtt atggagtaat cgttttgtga tatgccgcag aaacgttgta 21960

tgaaataacg ttctgcggtt agttagtata ttgtaaagct gagtattggt ttatttggcg 22020

attattatct tcaggagaat aatggaagtt ctatgactca attgttcata gtgtttacat 22080

caccgccaat tgcttttaag actgaacgca tgaaatatgg tttttcgtca tgttttgagt 22140

ctgctgttga tatttctaaa gtcggttttt tttcttcgtt ttctctaact attttccatg 22200

aaatacattt ttgattatta tttgaatcaa ttccaattac ctgaagtctt tcatctataa 22260

ttggcattgt atgtattggt ttattggagt agatgcttgc ttttctgagc catagctctg 22320

atatccaaat gaagccatag gcatttgtta ttttggctct gtcagctgca taacgccaaa 22380

aaatatattt atctgcttga tcttcaaatg ttgtattgat taaatcaatt ggatggaatt 22440

gtttatcata aaaaattaat gtttgaatgt gataaccgtc ctttaaaaaa gtcgtttctg 22500

caagcttggc tgtatagtca actaactctt ctgtcgaagt gatattttta ggcttatcta 22560

ccagttttag acgctcttta atatcttcag gaattatttt attgtcatat tgtatcatgc 22620

taaatgacaa tttgcttatg gagtaatctt ttaattttaa ataagttatt ctcctggctt 22680

catcaaataa agagtcgaat gatgttggcg aaatcacatc gtcacccatt ggattgttta 22740

tttgtatgcc aagagagtta cagcagttat acattctgcc atagattata gctaaggcat 22800

gtaataattc gtaatctttt agcgtattag cgacccatcg tctttctgat ttaataatag 22860

atgattcagt taaatatgaa ggtaatttct tttgtgcaag tctgactaac ttttttatac 22920

caatgtttaa catactttca tttgtaataa actcaatgtc attttcttca atgtaagatg 22980

aaataagagt agcctttgcc tcgctataca tttctaaatc gccttgtttt tctatcgtat 23040

tgcgagaatt tttagcccaa gccattaatg gatcattttt ccatttttca ataacattat 23100

tgttatacca aatgtcatat cctataatct ggtttttgtt tttttgaata ataaatgtta 23160

ctgttcttgc ggtttggagg aattgattca aattcaagcg aaataattca gggtcaaaat 23220

atgtatcaat gcagcatttg agcaagtgcg ataaatcttt aagtcttctt tcccatggtt 23280

ttttagtcat aaaactctcc attttgatag gttgcatgct agatgctgat atattttaga 23340

ggtgataaaa ttaactgctt aactgtcaat gtaatacaag ttgtttgatc tttgcaatga 23400

ttcttatcag aaaccatata gtaaattagt tacacaggaa atttttaata ttattattat 23460

cattcattat gtattaaaat tagagttgtg gcttggctct gctaacacgt tgctcatagg 23520

agatatggta gagccgcaga cacgtcgtat gcaggaacgt gctgcggctg gctggtgaac 23580

ttccgatagt gcgggtgttg aatgatttcc agttgctacc gattttacat attttttgca 23640

tgagagaatt tgtaccacct cccaccgacc atctatgact gtacgccact gtccctagga 23700

ctgctatgtg ccggagcgga cattacaaac gtccttctcg gtgcatgcca ctgttgccaa 23760

tgacctgcct aggaattggt tagcaagtta ctaccggatt ttgtaaaaac agccctcctc 23820

atataaaaag tattcgttca cttccgataa gcgtcgtaat tttctatctt tcatcatatt 23880

ctagatccct ctgaaaaaat cttccgagtt tgctaggcac tgatacataa ctcttttcca 23940

ataattgggg aagtcattca aatctataat aggtttcaga tttgcttcaa taaattctga 24000

ctgtagctgc tgaaacgttg cggttgaact atatttcctt ataactttta cgaaagagtt 24060

tctttgagta atcacttcac tcaagtgctt ccctgcctcc aaacgatacc tgttagcaat 24120

atttaatagc ttgaaatgat gaagagctct gtgtttgtct tcctgcctcc agttcgccgg 24180

gcattcaaca taaaaactga tagcacccgg agttccggaa acgaaatttg catataccca 24240

ttgctcacga aaaaaaatgt ccttgtcgat atagggatga atcgcttggt gtacctcatc 24300

tactgcgaaa acttgacctt tctctcccat attgcagtcg cggcacgatg gaactaaatt 24360

aataggcatc accgaaaatt caggataatg tgcaatagga agaaaatgat ctatattttt 24420

tgtctgtcct atatcaccac aaaatggaca tttttcacct gatgaaacaa gcatgtcatc 24480

gtaatatgtt ctagcgggtt tgtttttatc tcggagatta ttttcataaa gcttttctaa 24540

tttaaccttt gtcaggttac caactactaa ggttgtaggc tcaagagggt gtgtcctgtc 24600

gtaggtaaat aactgacctg tcgagcttaa tattctatat tgttgttctt tctgcaaaaa 24660

agtggggaag tgagtaatga aattatttct aacatttatc tgcatcatac cttccgagca 24720

tttattaagc atttcgctat aagttctcgc tggaagaggt agttttttca ttgtacttta 24780

ccttcatctc tgttcattat catcgctttt aaaacggttc gaccttctaa tcctatctga 24840

ccattataat tttttagaat ggtttcataa gaaagctctg aatcaacgga ctgcgataat 24900

aagtggtggt atccagaatt tgtcacttca agtaaaaaca cctcacgagt taaaacacct 24960

aagttctcac cgaatgtctc aatatccgga cggataatat ttattgcttc tcttgaccgt 25020

aggactttcc acatgcagga ttttggaacc tcttgcagta ctactgggga atgagttgca 25080

attattgcta caccattgcg tgcatcgagt aagtcgctta atgttcgtaa aaaagcagag 25140

agcaaaggtg gatgcagatg aacctctggt tcatcgaata aaactaatga cttttcgcca 25200

acgacatcta ctaatcttgt gatagtaaat aaaacaattg catgtccaga gctcattcga 25260

agcagatatt tctggatatt gtcataaaac aatttagtga atttatcatc gtccacttga 25320

atctgtggtt cattacgtct taactcttca tatttagaaa tgaggctgat gagttccata 25380

tttgaaaagt tttcatcact acttagtttt ttgatagctt caagccagag ttgtcttttt 25440

ctatctactc tcatacaacc aataaatgct gaaatgaatt ctaagcggag atcgcctagt 25500

gattttaaac tattgctggc agcattcttg agtccaatat aaaagtattg tgtacctttt 25560

gctgggtcag gttgttcttt aggaggagta aaaggatcaa atgcactaaa cgaaactgaa 25620

acaagcgatc gaaaatatcc ctttgggatt cttgactcga taagtctatt attttcagag 25680

aaaaaatatt cattgttttc tgggttggtg attgcaccaa tcattccatt caaaattgtt 25740

gttttaccac acccattccg cccgataaaa gcatgaatgt tcgtgctggg catagaatta 25800

accgtcacct caaaaggtat agttaaatca ctgaatccgg gagcactttt tctattaaat 25860

gaaaagtgga aatctgacaa ttctggcaaa ccatttaaca cacgtgcgaa ctgtccatga 25920

atttctgaaa gagttacccc tctaagtaat gaggtgttaa ggacgctttc attttcaatg 25980

tcggctaatc gatttggcca tactactaaa tcctgaatag ctttaagaag gttatgttta 26040

aaaccatcgc ttaatttgct gagattaaca tagtagtcaa tgctttcacc taaggaaaaa 26100

aacatttcag ggagttgact gaatttttta tctattaatg aataagtgct tacttcttct 26160

ttttgaccta caaaaccaat tttaacattt ccgatatcgc atttttcacc atgctcatca 26220

aagacagtaa gataaaacat tgtaacaaag gaatagtcat tccaaccatc tgctcgtagg 26280

aatgccttat ttttttctac tgcaggaata tacccgcctc tttcaataac actaaactcc 26340

aacatatagt aacccttaat tttattaaaa taaccgcaat ttatttggcg gcaacacagg 26400

atctctcttt taagttactc tctattacat acgttttcca tctaaaaatt agtagtattg 26460

aacttaacgg ggcatcgtat tgtagttttc catatttagc tttctgcttc cttttggata 26520

acccactgtt attcatgttg catggtgcac tgtttatacc aacgatatag tctattaatg 26580

catatatagt atcgccgaac gattagctct tcaggcttct gaagaagcgt ttcaagtact 26640

aataagccga tagatagcca cggacttcgt agccattttt cataagtgtt aacttccgct 26700

cctcgctcat aacagacatt cactacagtt atggcggaaa ggtatgcatg ctgggtgtgg 26760

ggaagtcgtg aaagaaaaga agtcagctgc gtcgtttgac atcactgcta tcttcttact 26820

ggttatgcag gtcgtagtgg gtggcacaca aagctttgca ctggattgcg aggctttgtg 26880

cttctctgga gtgcgacagg tttgatgaca aaaaattagc gcaagaagac aaaaatcacc 26940

ttgcgctaat gctctgttac aggtcactaa taccatctaa gtagttgatt catagtgact 27000

gcatatgttg tgttttacag tattatgtag tctgtttttt atgcaaaatc taatttaata 27060

tattgatatt tatatcattt tacgtttctc gttcagcttt tttatactaa gttggcatta 27120

taaaaaagca ttgcttatca atttgttgca acgaacaggt cactatcagt caaaataaaa 27180

tcattatttg atttcaattt tgtcccactc cctgcctctg tcatcacgat actgtgatgc 27240

catggtgtcc gacttatgcc cgagaagatg ttgagcaaac ttatcgctta tctgcttctc 27300

atagagtctt gcagacaaac tgcgcaactc gtgaaaggta ggcggatccc cttcgaagga 27360

aagacctgat gcttttcgtg cgcgcataaa ataccttgat actgtgccgg atgaaagcgg 27420

ttcgcgacga gtagatgcaa ttatggtttc tccgccaaga atctctttgc atttatcaag 27480

tgtttccttc attgatattc cgagagcatc aatatgcaat gctgttggga tggcaatttt 27540

tacgcctgtt ttgctttgct cgacataaag atatccatct acgatatcag accacttcat 27600

ttcgcataaa tcaccaactc gttgcccggt aacaacagcc agttccattg caagtctgag 27660

ccaacatggt gatgattctg ctgcttgata aattttcagg tattcgtcag ccgtaagtct 27720

tgatctcctt acctctgatt ttgctgcgcg agtggcagcg acatggtttg ttgttatatg 27780

gccttcagct attgcctctc ggaatgcatc gctcagtgtt gatctgatta acttggctga 27840

cgccgccttg ccctcgtcta tgtatccatt gagcattgcc gcaatttctt ttgtggtgat 27900

gtcttcaagt ggagcatcag gcagacccct ccttattgct ttaattttgc tcatgtaatt 27960

tatgagtgtc ttctgcttga ttcctctgct ggccaggatt ttttcgtagc gatcaagcca 28020

tgaatgtaac gtaacggaat tatcactgtt gattctcgct gtcagaggct tgtgtttgtg 28080

tcctgaaaat aactcaatgt tggcctgtat agcttcagtg attgcgattc gcctgtctct 28140

gcctaatcca aactctttac ccgtccttgg gtccctgtag cagtaatatc cattgtttct 28200

tatataaagg ttagggggta aatcccggcg ctcatgactt cgccttcttc ccatttctga 28260

tcctcttcaa aaggccacct gttactggtc gatttaagtc aacctttacc gctgattcgt 28320

ggaacagata ctctcttcca tccttaaccg gaggtgggaa tatcctgcat tcccgaaccc 28380

atcgacgaac tgtttcaagg cttcttggac gtcgctggcg tgcgttccac tcctgaagtg 28440

tcaagtacat cgcaaagtct ccgcaattac acgcaagaaa aaaccgccat caggcggctt 28500

ggtgttcttt cagttcttca attcgaatat tggttacgtc tgcatgtgct atctgcgccc 28560

atatcatcca gtggtcgtag cagtcgttga tgttctccgc ttcgataact ctgttgaatg 28620

gctctccatt ccattctcct gtgactcgga agtgcattta tcatctccat aaaacaaaac 28680

ccgccgtagc gagttcagat aaaataaatc cccgcgagtg cgaggattgt tatgtaatat 28740

tgggtttaat catctatatg ttttgtacag agagggcaag tatcgtttcc accgtactcg 28800

tgataataat tttgcacggt atcagtcatt tctcgcacat tgcagaatgg ggatttgtct 28860

tcattagact tataaacctt catggaatat ttgtatgccg actctatatc tataccttca 28920

tctacataaa caccttcgtg atgtctgcat ggagacaaga caccggatct gcacaacatt 28980

gataacgccc aatctttttg ctcagactct aactcattga tactcattta taaactcctt 29040

gcaatgtatg tcgtttcagc taaacggtat cagcaatgtt tatgtaaaga aacagtaaga 29100

taatactcaa cccgatgttt gagtacggtc atcatctgac actacagact ctggcatcgc 29160

tgtgaagacg acgcgaaatt cagcattttc acaagcgtta tcttttacaa aaccgatctc 29220

actctccttt gatgcgaatg ccagcgtcag acatcatatg cagatactca cctgcatcct 29280

gaacccattg acctccaacc ccgtaatagc gatgcgtaat gatgtcgata gttactaacg 29340

ggtcttgttc gattaactgc cgcagaaact cttccaggtc accagtgcag tgcttgataa 29400

caggagtctt cccaggatgg cgaacaacaa gaaactggtt tccgtcttca cggacttcgt 29460

tgctttccag tttagcaata cgcttactcc catccgagat aacaccttcg taatactcac 29520

gctgctcgtt gagttttgat tttgctgttt caagctcaac acgcagtttc cctactgtta 29580

gcgcaatatc ctcgttctcc tggtcgcggc gtttgatgta ttgctggttt ctttcccgtt 29640

catccagcag ttccagcaca atcgatggtg ttaccaattc atggaaaagg tctgcgtcaa 29700

atccccagtc gtcatgcatt gcctgctctg ccgcttcacg cagtgcctga gagttaattt 29760

cgctcacttc gaacctctct gtttactgat aagttccaga tcctcctggc aacttgcaca 29820

agtccgacaa ccctgaacga ccaggcgtct tcgttcatct atcggatcgc cacactcaca 29880

acaatgagtg gcagatatag cctggtggtt caggcggcgc atttttattg ctgtgttgcg 29940

ctgtaattct tctatttctg atgctgaatc aatgatgtct gccatctttc attaatccct 30000

gaactgttgg ttaatacgct tgagggtgaa tgcgaataat aaaaaaggag cctgtagctc 30060

cctgatgatt ttgcttttca tgttcatcgt tccttaaaga cgccgtttaa catgccgatt 30120

gccaggctta aatgagtcgg tgtgaatccc atcagcgtta ccgtttcgcg gtgcttcttc 30180

agtacgctac ggcaaatgtc atcgacgttt ttatccggaa actgctgtct ggcttttttt 30240

gatttcagaa ttagcctgac gggcaatgct gcgaagggcg ttttcctgct gaggtgtcat 30300

tgaacaagtc ccatgtcggc aagcataagc acacagaata tgaagcccgc tgccagaaaa 30360

atgcattccg tggttgtcat acctggtttc tctcatctgc ttctgctttc gccaccatca 30420

tttccagctt ttgtgaaagg gatgcggcta acgtatgaaa ttcttcgtct gtttctactg 30480

gtattggcac aaacctgatt ccaatttgag caaggctatg tgccatctcg atactcgttc 30540

ttaactcaac agaagatgct ttgtgcatac agcccctcgt ttattattta tctcctcagc 30600

cagccgctgt gctttcagtg gatttcggat aacagaaagg ccgggaaata cccagcctcg 30660

ctttgtaacg gagtagacga aagtgattgc gcctacccgg atattatcgt gaggatgcgt 30720

catcgccatt gctccccaaa tacaaaacca atttcagcca gtgcctcgtc cattttttcg 30780

atgaactccg gcacgatctc gtcaaaactc gccatgtact tttcatcccg ctcaatcacg 30840

acataatgca ggccttcacg cttcatacgc gggtcatagt tggcaaagta ccaggcattt 30900

tttcgcgtca cccacatgct gtactgcacc tgggccatgt aagctgactt tatggcctcg 30960

aaaccaccga gccggaactt catgaaatcc cgggaggtaa acgggcattt cagttcaagg 31020

ccgttgccgt cactgcataa accatcggga gagcaggcgg tacgcatact ttcgtcgcga 31080

tagatgatcg gggattcagt aacattcacg ccggaagtga attcaaacag ggttctggcg 31140

tcgttctcgt actgttttcc ccaggccagt gctttagcgt taacttccgg agccacaccg 31200

gtgcaaacct cagcaagcag ggtgtggaag taggacattt tcatgtcagg ccacttcttt 31260

ccggagcggg gttttgctat cacgttgtga acttctgaag cggtgatgac gccgagccgt 31320

aatttgtgcc acgcatcatc cccctgttcg acagctctca catcgatccc ggtacgctgc 31380

aggataatgt ccggtgtcat gctgccacct tctgctctgc ggctttctgt ttcaggaatc 31440

caagagcttt tactgcttcg gcctgtgtca gttctgacga tgcacgaatg tcgcggcgaa 31500

atatctggga acagagcggc aataagtcgt catcccatgt tttatccagg gcgatcagca 31560

gagtgttaat ctcctgcatg gtttcatcgt taaccggagt gatgtcgcgt tccggctgac 31620

gttctgcagt gtatgcagta ttttcgacaa tgcgctcggc ttcatccttg tcatagatac 31680

cagcaaatcc gaaggccaga cgggcacact gaatcatggc tttatgacgt aacatccgtt 31740

tgggatgcga ctgccacggc cccgtgattt ctctgccttc gcgagttttg aatggttcgc 31800

ggcggcattc atccatccat tcggtaacgc agatcggatg attacggtcc ttgcggtaaa 31860

tccggcatgt acaggattca ttgtcctgct caaagtccat gccatcaaac tgctggtttt 31920

cattgatgat gcgggaccag ccatcaacgc ccaccaccgg aacgatgcca ttctgcttat 31980

caggaaaggc gtaaatttct ttcgtccacg gattaaggcc gtactggttg gcaacgatca 32040

gtaatgcgat gaactgcgca tcgctggcat cacctttaaa tgccgtctgg cgaagagtgg 32100

tgatcagttc ctgtgggtcg acagaatcca tgccgacacg ttcagccagc ttcccagcca 32160

gcgttgcgag tgcagtactc attcgtttta tacctctgaa tcaatatcaa cctggtggtg 32220

agcaatggtt tcaaccatgt accggatgtg ttctgccatg cgctcctgaa actcaacatc 32280

gtcatcaaac gcacgggtaa tggatttttt gctggccccg tggcgttgca aatgatcgat 32340

gcatagcgat tcaaacaggt gctggggcag gcctttttcc atgtcgtctg ccagttctgc 32400

ctctttctct tcacgggcga gctgctggta gtgacgcgcc cagctctgag cctcaagacg 32460

atcctgaatg taataagcgt tcatggctga actcctgaaa tagctgtgaa aatatcgccc 32520

gcgaaatgcc gggctgatta ggaaaacagg aaagggggtt agtgaatgct tttgcttgat 32580

ctcagtttca gtattaatat ccatttttta taagcgtcga cggcttcacg aaacatcttt 32640

tcatcgccaa taaaagtggc gatagtgaat ttagtctgga tagccataag tgtttgatcc 32700

attctttggg actcctggct gattaagtat gtcgataagg cgtttccatc cgtcacgtaa 32760

tttacgggtg attcgttcaa gtaaagattc ggaagggcag ccagcaacag gccaccctgc 32820

aatggcatat tgcatggtgt gctccttatt tatacataac gaaaaacgcc tcgagtgaag 32880

cgttattggt atgcggtaaa accgcactca ggcggccttg atagtcatat catctgaatc 32940

aaatattcct gatgtatcga tatcggtaat tcttattcct tcgctaccat ccattggagg 33000

ccatccttcc tgaccatttc catcattcca gtcgaactca cacacaacac catatgcatt 33060

taagtcgctt gaaattgcta taagcagagc atgttgcgcc agcatgatta atacagcatt 33120

taatacagag ccgtgtttat tgagtcggta ttcagagtct gaccagaaat tattaatctg 33180

gtgaagtttt tcctctgtca ttacgtcatg gtcgatttca atttctattg atgctttcca 33240

gtcgtaatca atgatgtatt ttttgatgtt tgacatctgt tcatatcctc acagataaaa 33300

aatcgccctc acactggagg gcaaagaaga tttccaataa tcagaacaag tcggctcctg 33360

tttagttacg agcgacattg ctccgtgtat tcactcgttg gaatgaatac acagtgcagt 33420

gtttattctg ttatttatgc caaaaataaa ggccactatc aggcagcttt gttgttctgt 33480

ttaccaagtt ctctggcaat cattgccgtc gttcgtattg cccatttatc gacatatttc 33540

ccatcttcca ttacaggaaa catttcttca ggcttaacca tgcattccga ttgcagcttg 33600

catccattgc atcgcttgaa ttgtccacac cattgatttt tatcaatagt cgtagtcata 33660

cggatagtcc tggtattgtt ccatcacatc ctgaggatgc tcttcgaact cttcaaattc 33720

ttcttccata tatcacctta aatagtggat tgcggtagta aagattgtgc ctgtctttta 33780

accacatcag gctcggtggt tctcgtgtac ccctacagcg agaaatcgga taaactatta 33840

caacccctac agtttgatga gtatagaaat ggatccactc gttattctcg gacgagtgtt 33900

cagtaatgaa cctctggaga gaaccatgta tatgatcgtt atctgggttg gacttctgct 33960

tttaagccca gataactggc ctgaatatgt taatgagaga atcggtattc ctcatgtgtg 34020

gcatgttttc gtctttgctc ttgcattttc gctagcaatt aatgtgcatc gattatcagc 34080

tattgccagc gccagatata agcgatttaa gctaagaaaa cgcattaaga tgcaaaacga 34140

taaagtgcga tcagtaattc aaaaccttac agaagagcaa tctatggttt tgtgcgcagc 34200

ccttaatgaa ggcaggaagt atgtggttac atcaaaacaa ttcccataca ttagtgagtt 34260

gattgagctt ggtgtgttga acaaaacttt ttcccgatgg aatggaaagc atatattatt 34320

ccctattgag gatatttact ggactgaatt agttgccagc tatgatccat ataatattga 34380

gataaagcca aggccaatat ctaagtaact agataagagg aatcgatttt cccttaattt 34440

tctggcgtcc actgcatgtt atgccgcgtt cgccaggctt gctgtaccat gtgcgctgat 34500

tcttgcgctc aatacgttgc aggttgcttt caatctgttt gtggtattca gccagcactg 34560

taaggtctat cggatttagt gcgctttcta ctcgtgattt cggtttgcga ttcagcgaga 34620

gaatagggcg gttaactggt tttgcgctta ccccaaccaa caggggattt gctgctttcc 34680

attgagcctg tttctctgcg cgacgttcgc ggcggcgtgt ttgtgcatcc atctggattc 34740

tcctgtcagt tagctttggt ggtgtgtggc agttgtagtc ctgaacgaaa accccccgcg 34800

attggcacat tggcagctaa tccggaatcg cacttacggc caatgcttcg tttcgtatca 34860

cacaccccaa agccttctgc tttgaatgct gcccttcttc agggcttaat ttttaagagc 34920

gtcaccttca tggtggtcag tgcgtcctgc tgatgtgctc agtatcaccg ccagtggtat 34980

ttatgtcaac accgccagag ataatttatc accgcagatg gttatctgta tgttttttat 35040

atgaatttat tttttgcagg ggggcattgt ttggtaggtg agagatctga attgctatgt 35100

ttagtgagtt gtatctattt atttttcaat aaatacaatt ggttatgtgt tttgggggcg 35160

atcgtgaggc aaagaaaacc cggcgctgag gccgggttat tcttgttctc tggtcaaatt 35220

atatagttgg aaaacaagga tgcatatatg aatgaacgat gcagaggcaa tgccgatggc 35280

gatagtgggt atcatgtagc cgcttatgct ggaaagaagc aataacccgc agaaaaacaa 35340

agctccaagc tcaacaaaac taagggcata gacaataact accgatgtca tatacccata 35400

ctctctaatc ttggccagtc ggcgcgttct gcttccgatt agaaacgtca aggcagcaat 35460

caggattgca atcatggttc ctgcatatga tgacaatgtc gccccaagac catctctatg 35520

agctgaaaaa gaaacaccag gaatgtagtg gcggaaaagg agatagcaaa tgcttacgat 35580

aacgtaagga attattacta tgtaaacacc aggcatgatt ctgttccgca taattactcc 35640

tgataattaa tccttaactt tgcccacctg ccttttaaaa cattccagta tatcactttt 35700

cattcttgcg tagcaatatg ccatctcttc agctatctca gcattggtga ccttgttcag 35760

aggcgctgag agatggcctt tttctgatag ataatgttct gttaaaatat ctccggcctc 35820

atcttttgcc cgcaggctaa tgtctgaaaa ttgaggtgac gggttaaaaa taatatcctt 35880

ggcaaccttt tttatatccc ttttaaattt tggcttaatg actatatcca atgagtcaaa 35940

aagctcccct tcaatatctg ttgcccctaa gacctttaat atatcgccaa atacaggtag 36000

cttggcttct accttcaccg ttgttcggcc gatgaaatgc atatgcataa catcgtcttt 36060

ggtggttccc ctcatcagtg gctctatctg aacgcgctct ccactgctta atgacattcc 36120

tttcccgatt aaaaaatctg tcagatcgga tgtggtcggc ccgaaaacag ttctggcaaa 36180

accaatggtg tcgccttcaa caaacaaaaa agatgggaat cccaatgatt cgtcatctgc 36240

gaggctgttc ttaatatctt caactgaagc tttagagcga tttatcttct gaaccagact 36300

cttgtcattt gttttggtaa agagaaaagt ttttccatcg attttatgaa tatacaaata 36360

attggagcca acctgcaggt gatgattatc agccagcaga gaattaagga aaacagacag 36420

gtttattgag cgcttatctt tccctttatt tttgctgcgg taagtcgcat aaaaaccatt 36480

cttcataatt caatccattt actatgttat gttctgaggg gagtgaaaat tcccctaatt 36540

cgatgaagat tcttgctcaa ttgttatcag ctatgcgccg accagaacac cttgccgatc 36600

agccaaacgt ctcttcaggc cactgactag cgataacttt ccccacaacg gaacaactct 36660

cattgcatgg gatcattggg tactgtgggt ttagtggttg taaaaacacc tgaccgctat 36720

ccctgatcag tttcttgaag gtaaactcat cacccccaag tctggctatg cagaaatcac 36780

ctggctcaac agcctgctca gggtcaacga gaattaacat tccgtcagga aagcttggct 36840

tggagcctgt tggtgcggtc atggaattac cttcaacctc aagccagaat gcagaatcac 36900

tggctttttt ggttgtgctt acccatctct ccgcatcacc tttggtaaag gttctaagct 36960

caggtgagaa catccctgcc tgaacatgag aaaaaacagg gtactcatac tcacttctaa 37020

gtgacggctg catactaacc gcttcataca tctcgtagat ttctctggcg attgaagggc 37080

taaattcttc aacgctaact ttgagaattt ttgcaagcaa tgcggcgtta taagcattta 37140

atgcattgat gccattaaat aaagcaccaa cgcctgactg ccccatcccc atcttgtctg 37200

cgacagattc ctgggataag ccaagttcat ttttcttttt ttcataaatt gctttaaggc 37260

gacgtgcgtc ctcaagctgc tcttgtgtta atggtttctt ttttgtgctc atacgttaaa 37320

tctatcaccg caagggataa atatctaaca ccgtgcgtgt tgactatttt acctctggcg 37380

gtgataatgg ttgcatgtac taaggaggtt gtatggaaca acgcataacc ctgaaagatt 37440

atgcaatgcg ctttgggcaa accaagacag ctaaagatct cggcgtatat caaagcgcga 37500

tcaacaaggc cattcatgca ggccgaaaga tttttttaac tataaacgct gatggaagcg 37560

tttatgcgga agaggtaaag cccttcccga gtaacaaaaa aacaacagca taaataaccc 37620

cgctcttaca cattccagcc ctgaaaaagg gcatcaaatt aaaccacacc tatggtgtat 37680

gcatttattt gcatacattc aatcaattgt tatctaagga aatacttaca tatggttcgt 37740

gcaaacaaac gcaacgaggc tctacgaatc gagagtgcgt tgcttaacaa aatcgcaatg 37800

cttggaactg agaagacagc ggaagctgtg ggcgttgata agtcgcagat cagcaggtgg 37860

aagagggact ggattccaaa gttctcaatg ctgcttgctg ttcttgaatg gggggtcgtt 37920

gacgacgaca tggctcgatt ggcgcgacaa gttgctgcga ttctcaccaa taaaaaacgc 37980

ccggcggcaa ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc 38040

tatcaacagg agtcattatg acaaatacag caaaaatact caacttcggc agaggtaact 38100

ttgccggaca ggagcgtaat gtggcagatc tcgatgatgg ttacgccaga ctatcaaata 38160

tgctgcttga ggcttattcg ggcgcagatc tgaccaagcg acagtttaaa gtgctgcttg 38220

ccattctgcg taaaacctat gggtggaata aaccaatgga cagaatcacc gattctcaac 38280

ttagcgagat tacaaagtta cctgtcaaac ggtgcaatga agccaagtta gaactcgtca 38340

gaatgaatat tatcaagcag caaggcggca tgtttggacc aaataaaaac atctcagaat 38400

ggtgcatccc tcaaaacgag ggaaaatccc ctaaaacgag ggataaaaca tccctcaaat 38460

tgggggattg ctatccctca aaacaggggg acacaaaaga cactattaca aaagaaaaaa 38520

gaaaagatta ttcgtcagag aattctggcg aatcctctga ccagccagaa aacgaccttt 38580

ctgtggtgaa accggatgct gcaattcaga gcggcagcaa gtgggggaca gcagaagacc 38640

tgaccgccgc agagtggatg tttgacatgg tgaagactat cgcaccatca gccagaaaac 38700

cgaattttgc tgggtgggct aacgatatcc gcctgatgcg tgaacgtgac ggacgtaacc 38760

accgcga 38767

<210> 8

<211> 9107

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 8

catgtgtgtg ctgttccgct gggcatgcca ggacaacttc tggtccggta acgtgctgag 60

cccggccaaa ctccgcgata agtggaccca actcgaaatc aaccgtaaca agcaacaggc 120

aggcgtgaca gccagcaaac caaaactcga cctgacaaac acagactgga tttacggggt 180

ggatctatga aaaacatcgc cgcacagatg gttaactttg accgtgagca gatgcgtcgg 240

atcgccaaca acatgccgga acagtacgac gaaaagccgc aggtacagca ggtagcgcag 300

atcatcaacg gtgtgttcag ccagttactg gcaactttcc cggcgagcct ggctaaccgt 360

gaccagaacg aagtgaacga aatccgtcgc cagtgggttc tggcttttcg ggaaaacggg 420

atcaccacga tggaacaggt taacgcagga atgcgcgtag cccgtcggca gaatcgacca 480

tttctgccat cacccgggca gtttgttgca tggtgccggg aagaagcatc cgttaccgcc 540

ggactgccaa acgtcagcga gctggttgat atggtttacg agtattgccg gaagcgaggc 600

ctgtatccgg atgcggagtc ttatccgtgg aaatcaaacg cgcactactg gctggttacc 660

aacctgtatc agaacatgcg ggccaatgcg cttactgatg cggaattacg ccgtaaggcc 720

gcagatgagc ttgtccatat gactgcgaga attaaccgtg gtgaggcgat ccctgaacca 780

gtaaaacaac ttcctgtcat gggcggtaga cctctaaatc gtgcacaggc tctggcgaag 840

atcgcagaaa tcaaagctaa gttcggactg aaaggagcaa gtgtatgacg ggcaaagagg 900

caattattca ttacctgggg acgcataata gcttctgtgc gccggacgtt gccgcgctaa 960

caggcgcaac agtaaccagc ataaatcagg ccgcggctaa aatggcacgg gcaggtcttc 1020

tggttatcga aggtaaggtc tggcgaacgg tgtattaccg gtttgctacc agggaagaac 1080

gggaaggaaa gatgagcacg aacctggttt ttaaggagtg tcgccagagt gccgcgatga 1140

aacgggtatt ggcggtatat ggagttaaaa gatgaccatc tacattactg agctaataac 1200

aggcctgctg gtaatcgcag gcctttttat ttgggggaga gggaagtcat gaaaaaacta 1260

acctttgaaa ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc 1320

cttccagacc caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac 1380

caaaacagga agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt 1440

cgctggctgg atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat 1500

gttgttccta accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg 1560

cgtgtaggcg aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc 1620

gttaagtggt cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg 1680

gctgcatgat aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc 1740

taatggagca aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt 1800

gtgaacatcc aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc 1860

tcaccgtatt gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat 1920

gggaaccaaa ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa 1980

agaaatatgg cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc 2040

ccttcaccaa atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca 2100

tcagagctga tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac 2160

tgtcagactt tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc 2220

aaataccgga acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg 2280

gacttgcctg caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat 2340

cccatgtgcg tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt 2400

cgctggacgg tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca 2460

tggtacgagc taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag 2520

ggcagcttga tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga 2580

atgcaaagaa gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg 2640

gtgtgaaaga acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg 2700

agacagcgac gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa 2760

cgcaccagaa ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac 2820

acggctcacc tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg 2880

accaaaatcg aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg 2940

gtcagaagct gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga 3000

gcgatccgaa tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga 3060

tgtaaaaacg atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc 3120

tctccagagt gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg 3180

gaaaaagcag cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag 3240

attcgaaaac tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta 3300

aacgccttca tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg 3360

tctgctcagt gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt 3420

aatgaacgca atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc 3480

gttccgtatc gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa 3540

tcaaaccata accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac 3600

caacagaaac tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa 3660

aaaccattcc agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac 3720

tgaaatgtag tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg 3780

ccatcgtcaa cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac 3840

gaaaaaattg atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc 3900

tacacgaacc tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt 3960

atctcggtgg gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc 4020

acattcccct ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta 4080

tcagagcgtg gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc 4140

gattacgaca aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta 4200

atcatcgaac tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt 4260

gacgaatacg agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga 4320

atcagcaact cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt 4380

ggtcatacgc cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc 4440

gcagtgttct gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg 4500

aaagcgtagc taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca 4560

cggcttctga ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac 4620

aagccggatt cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac 4680

aaaaggctat caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg 4740

tggcaaagct tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt 4800

atgcggatta ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta 4860

caggccgtgc ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt 4920

gcggaagatg caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg 4980

tgacgatgct aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt 5040

atgacgctct ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg 5100

cggtcacacg ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga 5160

cttattgaat aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta 5220

gtgagatgaa aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat 5280

cgtctggaac tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt 5340

cgcaggtaat agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg 5400

taagagcatt gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc 5460

cgttgtgctg aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg 5520

tcatcgccgc ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat 5580

tcattagtaa tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag 5640

gaggtcgcgc taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg 5700

attactaaac acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa 5760

tagagcaaat ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg 5820

gccgccattc tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg 5880

taccttcgcg gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg 5940

tgcgccatta tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat 6000

ctcgcttata taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt 6060

atcaaacgct tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg 6120

taaggcgttc ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac 6180

cagaaatcat ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca 6240

ccctcgcaaa cttgtcacgc taaacccaaa actcaaatca acaggcgccg gacgctacca 6300

gcttctttcc cgttggtggg atgcctaccg caagcagctt ggcctgaaag acttctctcc 6360

gaaaagtcag gacgctgtgg cattgcagca gattaaggag cgtggcgctt tacctatgat 6420

tgatcgtggt gatatccgtc aggcaatcga ccgttgcagc aatatctggg cttcactgcc 6480

gggcgctggt tatggtcagt tcgagcataa ggctgacagc ctgattgcaa aattcaaaga 6540

agcgggcgga acggtcagag agattgatgt atgagcagag tcaccgcgat tatctccgct 6600

ctggttatct gcatcatcgt ctgcctgtca tgggctgtta atcattaccg tgataacgcc 6660

attacctaca aagcccagcg cgacaaaaat gccagagaac tgaagctggc gaacgcggca 6720

attactgaca tgcagatgcg tcagcgtgat gttgctgcgc tcgatgcaaa atacacgaag 6780

gagttagctg atgctaaagc tgaaaatgat gctctgcgtg atgatgttgc cgctggtcgt 6840

cgtcggttgc acatcaaagc agtctgtcag tcagtgcgtg aagccaccac cgcctccggc 6900

gtggataatg cagcctcccc ccgactggca gacaccgctg aacgggatta tttcaccctc 6960

agagagaggc tgatcactat gcaaaaacaa ctggaaggaa cccagaagta tattaatgag 7020

cagtgcagat agagttgccc atatcgatgg gcaactcatg caattattgt gagcaataca 7080

cacgcgcttc cagcggagta taaatgccta aagtaataaa accgagcaat ccatttacga 7140

atgtttgctg ggtttctgtt ttaacaacat tttctgcgcc gccacaaatt ttggctgcat 7200

cgacagtttt cttctgccca attccagaaa cgaagaaatg atgggtgatg gtttcctttg 7260

gtgctactgc tgccggtttg ttttgaacag taaacgtctg ttgagcacat cctgtaataa 7320

gcagggccag cgcagtagcg agtagcattt ttttcatggt gttattcccg atgctttttg 7380

aagttcgcag aatcgtatgt gtagaaaatt aaacaaaccc taaacaatga gttgaaattt 7440

catattgtta atatttatta atgtatgtca ggtgcgatga atcgtcattg tattcccgga 7500

ttaactatgt ccacagccct gacggggaac ttctctgcgg gagtgtccgg gaataattaa 7560

aacgatgcac acagggttta gcgcgtacac gtattgcatt atgccaacgc cccggtgctg 7620

acacggaaga aaccggacgt tatgatttag cgtggaaaga tttgtgtagt gttctgaatg 7680

ctctcagtaa atagtaatga attatcaaag gtatagtaat atcttttatg ttcatggata 7740

tttgtaaccc atcggaaaac tcctgcttta gcaagatttt ccctgtattg ctgaaatgtg 7800

atttctcttg atttcaacct atcataggac gtttctataa gatgcgtgtt tcttgagaat 7860

ttaacattta caaccttttt aagtcctttt attaacacgg tgttatcgtt ttctaacacg 7920

atgtgaatat tatctgtggc tagatagtaa atataatgtg agacgttgtg acgttttagt 7980

tcagaataaa acaattcaca gtctaaatct tttcgcactt gatcgaatat ttctttaaaa 8040

atggcaacct gagccattgg taaaaccttc catgtgatac gagggcgcgt agtttgcatt 8100

atcgttttta tcgtttcaat ctggtctgac ctccttgtgt tttgttgatg atttatgtca 8160

aatattagga atgttttcac ttaatagtat tggttgcgta acaaagtgcg gtcctgctgg 8220

cattctggag ggaaatacaa ccgacagatg tatgtaaggc caacgtgctc aaatcttcat 8280

acagaaagat ttgaagtaat attttaaccg ctagatgaag agcaagcgca tggagcgaca 8340

aaatgaataa agaacaatct gctgatgatc cctccgtgga tctgattcgt gtaaaaaata 8400

tgcttaatag caccatttct atgagttacc ctgatgttgt aattgcatgt atagaacata 8460

aggtgtctct ggaagcattc agagcaattg aggcagcgtt ggtgaagcac gataataata 8520

tgaaggatta ttccctggtg gttgactgat caccataact gctaatcatt caaactattt 8580

agtctgtgac agagccaaca cgcagtctgt cactgtcagg aaagtggtaa aactgcaact 8640

caattactgc aatgccctcg taattaagtg aatttacaat atcgtcctgt tcggagggaa 8700

gaacgcggga tgttcattct tcatcacttt taattgatgt atatgctctc ttttctgacg 8760

ttagtctccg acggcaggct tcaatgaccc aggctgagaa attcccggac cctttttgct 8820

caagagcgat gttaatttgt tcaatcattt ggttaggaaa gcggatgttg cgggttgttg 8880

ttctgcgggt tctgttcttc gttgacatga ggttgccccg tattcagtgt cgctgatttg 8940

tattgtctga agttgttttt acgttaagtt gatgcagatc aattaatacg atacctgcgt 9000

cataattgat tatttgacgt ggtttgatgg cctccacgca cgttgtgata tgtagatgat 9060

aatcattatc actttacggg tcctttccgg tgatccgaca ggttacg 9107

<210> 9

<211> 19604

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 9

catgttgatt tcctgaaacg ggatatcatc aaagccatga acaaagcagc cgcgctggat 60

gaactgatac cggggttgct gagtgaatat atcgaacagt caggttaaca ggctgcggca 120

ttttgtccgc gccgggcttc gctcactgtt caggccggag ccacagaccg ccgttgaatg 180

ggcggatgct aattactatc tcccgaaaga atccgcatac caggaagggc gctgggaaac 240

actgcccttt cagcgggcca tcatgaatgc gatgggcagc gactacatcc gtgaggtgaa 300

tgtggtgaag tctgcccgtg tcggttattc caaaatgctg ctgggtgttt atgcctactt 360

tatagagcat aagcagcgca acacccttat ctggttgccg acggatggtg atgccgagaa 420

ctttatgaaa acccacgttg agccgactat tcgtgatatt ccgtcgctgc tggcgctggc 480

cccgtggtat ggcaaaaagc accgggataa cacgctcacc atgaagcgtt tcactaatgg 540

gcgtggcttc tggtgcctgg gcggtaaagc ggcaaaaaac taccgtgaaa agtcggtgga 600

tgtggcgggt tatgatgaac ttgctgcttt tgatgatgat attgaacagg aaggctctcc 660

gacgttcctg ggtgacaagc gtattgaagg ctcggtctgg ccaaagtcca tccgtggctc 720

cacgccaaaa gtgagaggca cctgtcagat tgagcgtgca gccagtgaat ccccgcattt 780

tatgcgtttt catgttgcct gcccgcattg cggggaggag cagtatctta aatttggcga 840

caaagagacg ccgtttggcc tcaaatggac gccggatgac ccctccagcg tgttttatct 900

ctgcgagcat aatgcctgcg tcatccgcca gcaggagctg gactttactg atgcccgtta 960

tatctgcgaa aagaccggga tctggacccg tgatggcatt ctctggtttt cgtcatccgg 1020

tgaagagatt gagccacctg acagtgtgac ctttcacatc tggacagcgt acagcccgtt 1080

caccacctgg gtgcagattg tcaaagactg gatgaaaacg aaaggggata cgggaaaacg 1140

taaaaccttc gtaaacacca cgctcggtga gacgtgggag gcgaaaattg gcgaacgtcc 1200

ggatgctgaa gtgatggcag agcggaaaga gcattattca gcgcccgttc ctgaccgtgt 1260

ggcttacctg accgccggta tcgactccca gctggaccgc tacgaaatgc gcgtatgggg 1320

atgggggccg ggtgaggaaa gctggctgat tgaccggcag attattatgg gccgccacga 1380

cgatgaacag acgctgctgc gtgtggatga ggccatcaat aaaacctata cccgccggaa 1440

tggtgcagaa atgtcgatat cccgtatctg ctgggatact ggcgggattg acccgaccat 1500

tgtgtatgaa cgctcgaaaa aacatgggct gttccgggtg atccccatta aaggggcatc 1560

cgtctacgga aagccggtgg ccagcatgcc acgtaagcga aacaaaaacg gggtttacct 1620

taccgaaatc ggtacggata ccgcgaaaga gcagatttat aaccgcttca cactgacgcc 1680

ggaaggggat gaaccgcttc ccggtgccgt tcacttcccg aataacccgg atatttttga 1740

tctgaccgaa gcgcagcagc tgactgctga agagcaggtc gaaaaatggg tggatggcag 1800

gaaaaaaata ctgtgggaca gcaaaaagcg acgcaatgag gcactcgact gcttcgttta 1860

tgcgctggcg gcgctgcgca tcagtatttc ccgctggcag ctggatctca gtgcgctgct 1920

ggcgagcctg caggaagagg atggtgcagc aaccaacaag aaaacactgg cagattacgc 1980

ccgtgcctta tccggagagg atgaatgacg cgacaggaag aacttgccgc tgcccgtgcg 2040

gcactgcatg acctgatgac aggtaaacgg gtggcaacag tacagaaaga cggacgaagg 2100

gtggagttta cggccacttc cgtgtctgac ctgaaaaaat atattgcaga gctggaagtg 2160

cagaccggca tgacacagcg acgcagggga cctgcaggat tttatgtatg aaaacgccca 2220

ccattcccac ccttctgggg ccggacggca tgacatcgct gcgcgaatat gccggttatc 2280

acggcggtgg cagcggattt ggagggcagt tgcggtcgtg gaacccaccg agtgaaagtg 2340

tggatgcagc cctgttgccc aactttaccc gtggcaatgc ccgcgcagac gatctggtac 2400

gcaataacgg ctatgccgcc aacgccatcc agctgcatca ggatcatatc gtcgggtctt 2460

ttttccggct cagtcatcgc ccaagctggc gctatctggg catcggggag gaagaagccc 2520

gtgccttttc ccgcgaggtt gaagcggcat ggaaagagtt tgccgaggat gactgctgct 2580

gcattgacgt tgagcgaaaa cgcacgttta ccatgatgat tcgggaaggt gtggccatgc 2640

acgcctttaa cggtgaactg ttcgttcagg ccacctggga taccagttcg tcgcggcttt 2700

tccggacaca gttccggatg gtcagcccga agcgcatcag caacccgaac aataccggcg 2760

acagccggaa ctgccgtgcc ggtgtgcaga ttaatgacag cggtgcggcg ctgggatatt 2820

acgtcagcga ggacgggtat cctggctgga tgccgcagaa atggacatgg ataccccgtg 2880

agttacccgg cgggcgcgcc tcgttcattc acgtttttga acccgtggag gacgggcaga 2940

ctcgcggtgc aaatgtgttt tacagcgtga tggagcagat gaagatgctc gacacgctgc 3000

agaacacgca gctgcagagc gccattgtga aggcgatgta tgccgccacc attgagagtg 3060

agctggatac gcagtcagcg atggatttta ttctgggcgc gaacagtcag gagcagcggg 3120

aaaggctgac cggctggatt ggtgaaattg ccgcgtatta cgccgcagcg ccggtccggc 3180

tgggaggcgc aaaagtaccg cacctgatgc cgggtgactc actgaacctg cagacggctc 3240

aggatacgga taacggctac tccgtgtttg agcagtcact gctgcggtat atcgctgccg 3300

ggctgggtgt ctcgtatgag cagctttccc ggaattacgc ccagatgagc tactccacgg 3360

cacgggccag tgcgaacgag tcgtgggcgt actttatggg gcggcgaaaa ttcgtcgcat 3420

cccgtcaggc gagccagatg tttctgtgct ggctggaaga ggccatcgtt cgccgcgtgg 3480

tgacgttacc ttcaaaagcg cgcttcagtt ttcaggaagc ccgcagtgcc tgggggaact 3540

gcgactggat aggctccggt cgtatggcca tcgatggtct gaaagaagtt caggaagcgg 3600

tgatgctgat agaagccgga ctgagtacct acgagaaaga gtgcgcaaaa cgcggtgacg 3660

actatcagga aatttttgcc cagcaggtcc gtgaaacgat ggagcgccgt gcagccggtc 3720

ttaaaccgcc cgcctgggcg gctgcagcat ttgaatccgg gctgcgacaa tcaacagagg 3780

aggagaagag tgacagcaga gctgcgtaat ctcccgcata ttgccagcat ggcctttaat 3840

gagccgctga tgcttgaacc cgcctatgcg cgggttttct tttgtgcgct tgcaggccag 3900

cttgggatca gcagcctgac ggatgcggtg tccggcgaca gcctgactgc ccaggaggca 3960

ctcgcgacgc tggcattatc cggtgatgat gacggaccac gacaggcccg cagttatcag 4020

gtcatgaacg gcatcgccgt gctgccggtg tccggcacgc tggtcagccg gacgcgggcg 4080

ctgcagccgt actcggggat gaccggttac aacggcatta tcgcccgtct gcaacaggct 4140

gccagcgatc cgatggtgga cggcattctg ctcgatatgg acacgcccgg cgggatggtg 4200

gcgggggcat ttgactgcgc tgacatcatc gcccgtgtgc gtgacataaa accggtatgg 4260

gcgcttgcca acgacatgaa ctgcagtgca ggtcagttgc ttgccagtgc cgcctcccgg 4320

cgtctggtca cgcagaccgc ccggacaggc tccatcggcg tcatgatggc tcacagtaat 4380

tacggtgctg cgctggagaa acagggtgtg gaaatcacgc tgatttacag cggcagccat 4440

aaggtggatg gcaaccccta cagccatctt ccggatgacg tccgggagac actgcagtcc 4500

cggatggacg caacccgcca gatgtttgcg cagaaggtgt cggcatatac cggcctgtcc 4560

gtgcaggttg tgctggatac cgaggctgca gtgtacagcg gtcaggaggc cattgatgcc 4620

ggactggctg atgaacttgt taacagcacc gatgcgatca ccgtcatgcg tgatgcactg 4680

gatgcacgta aatcccgtct ctcaggaggg cgaatgacca aagagactca atcaacaact 4740

gtttcagcca ctgcttcgca ggctgacgtt actgacgtgg tgccagcgac ggagggcgag 4800

aacgccagcg cggcgcagcc ggacgtgaac gcgcagatca ccgcagcggt tgcggcagaa 4860

aacagccgca ttatggggat cctcaactgt gaggaggctc acggacgcga agaacaggca 4920

cgcgtgctgg cagaaacccc cggtatgacc gtgaaaacgg cccgccgcat tctggccgca 4980

gcaccacaga gtgcacaggc gcgcagtgac actgcgctgg atcgtctgat gcagggggca 5040

ccggcaccgc tggctgcagg taacccggca tctgatgccg ttaacgattt gctgaacaca 5100

ccagtgtaag ggatgtttat gacgagcaaa gaaaccttta cccattacca gccgcagggc 5160

aacagtgacc cggctcatac cgcaaccgcg cccggcggat tgagtgcgaa agcgcctgca 5220

atgaccccgc tgatgctgga cacctccagc cgtaagctgg ttgcgtggga tggcaccacc 5280

gacggtgctg ccgttggcat tcttgcggtt gctgctgacc agaccagcac cacgctgacg 5340

ttctacaagt ccggcacgtt ccgttatgag gatgtgctct ggccggaggc tgccagcgac 5400

gagacgaaaa aacggaccgc gtttgccgga acggcaatca gcatcgttta actttaccct 5460

tcatcactaa aggccgcctg tgcggctttt tttacgggat ttttttatgt cgatgtacac 5520

aaccgcccaa ctgctggcgg caaatgagca gaaatttaag tttgatccgc tgtttctgcg 5580

tctctttttc cgtgagagct atcccttcac cacggagaaa gtctatctct cacaaattcc 5640

gggactggta aacatggcgc tgtacgtttc gccgattgtt tccggtgagg ttatccgttc 5700

ccgtggcggc tccacctctg aatttacgcc gggatatgtc aagccgaagc atgaagtgaa 5760

tccgcagatg accctgcgtc gcctgccgga tgaagatccg cagaatctgg cggacccggc 5820

ttaccgccgc cgtcgcatca tcatgcagaa catgcgtgac gaagagctgg ccattgctca 5880

ggtcgaagag atgcaggcag tttctgccgt gcttaagggc aaatacacca tgaccggtga 5940

agccttcgat ccggttgagg tggatatggg ccgcagtgag gagaataaca tcacgcagtc 6000

cggcggcacg gagtggagca agcgtgacaa gtccacgtat gacccgaccg acgatatcga 6060

agcctacgcg ctgaacgcca gcggtgtggt gaatatcatc gtgttcgatc cgaaaggctg 6120

ggcgctgttc cgttccttca aagccgtcaa ggagaagctg gatacccgtc gtggctctaa 6180

ttccgagctg gagacagcgg tgaaagacct gggcaaagcg gtgtcctata aggggatgta 6240

tggcgatgtg gccatcgtcg tgtattccgg acagtacgtg gaaaacggcg tcaaaaagaa 6300

cttcctgccg gacaacacga tggtgctggg gaacactcag gcacgcggtc tgcgcaccta 6360

tggctgcatt caggatgcgg acgcacagcg cgaaggcatt aacgcctctg cccgttaccc 6420

gaaaaactgg gtgaccaccg gcgatccggc gcgtgagttc accatgattc agtcagcacc 6480

gctgatgctg ctggctgacc ctgatgagtt cgtgtccgta caactggcgt aatcatggcc 6540

cttcggggcc attgtttctc tgtggaggag tccatgacga aagatgaact gattgcccgt 6600

ctccgctcgc tgggtgaaca actgaaccgt gatgtcagcc tgacggggac gaaagaagaa 6660

ctggcgctcc gtgtggcaga gctgaaagag gagcttgatg acacggatga aactgccggt 6720

caggacaccc ctctcagccg ggaaaatgtg ctgaccggac atgaaaatga ggtgggatca 6780

gcgcagccgg ataccgtgat tctggatacg tctgaactgg tcacggtcgt ggcactggtg 6840

aagctgcata ctgatgcact tcacgccacg cgggatgaac ctgtggcatt tgtgctgccg 6900

ggaacggcgt ttcgtgtctc tgccggtgtg gcagccgaaa tgacagagcg cggcctggcc 6960

agaatgcaat aacgggaggc gctgtggctg atttcgataa cctgttcgat gctgccattg 7020

cccgcgccga tgaaacgata cgcgggtaca tgggaacgtc agccaccatt acatccggtg 7080

agcagtcagg tgcggtgata cgtggtgttt ttgatgaccc tgaaaatatc agctatgccg 7140

gacagggcgt gcgcgttgaa ggctccagcc cgtccctgtt tgtccggact gatgaggtgc 7200

ggcagctgcg gcgtggagac acgctgacca tcggtgagga aaatttctgg gtagatcggg 7260

tttcgccgga tgatggcgga agttgtcatc tctggcttgg acggggcgta ccgcctgccg 7320

ttaaccgtcg ccgctgaaag ggggatgtat ggccataaaa ggtcttgagc aggccgttga 7380

aaacctcagc cgtatcagca aaacggcggt gcctggtgcc gccgcaatgg ccattaaccg 7440

cgttgcttca tccgcgatat cgcagtcggc gtcacaggtt gcccgtgaga caaaggtacg 7500

ccggaaactg gtaaaggaaa gggccaggct gaaaagggcc acggtcaaaa atccgcaggc 7560

cagaatcaaa gttaaccggg gggatttgcc cgtaatcaag ctgggtaatg cgcgggttgt 7620

cctttcgcgc cgcaggcgtc gtaaaaaggg gcagcgttca tccctgaaag gtggcggcag 7680

cgtgcttgtg gtgggtaacc gtcgtattcc cggcgcgttt attcagcaac tgaaaaatgg 7740

ccggtggcat gtcatgcagc gtgtggctgg gaaaaaccgt taccccattg atgtggtgaa 7800

aatcccgatg gcggtgccgc tgaccacggc gtttaaacaa aatattgagc ggatacggcg 7860

tgaacgtctt ccgaaagagc tgggctatgc gctgcagcat caactgagga tggtaataaa 7920

gcgatgaaac atactgaact ccgtgcagcc gtactggatg cactggagaa gcatgacacc 7980

ggggcgacgt tttttgatgg tcgccccgct gtttttgatg aggcggattt tccggcagtt 8040

gccgtttatc tcaccggcgc tgaatacacg ggcgaagagc tggacagcga tacctggcag 8100

gcggagctgc atatcgaagt tttcctgcct gctcaggtgc cggattcaga gctggatgcg 8160

tggatggagt cccggattta tccggtgatg agcgatatcc cggcactgtc agatttgatc 8220

accagtatgg tggccagcgg ctatgactac cggcgcgacg atgatgcggg cttgtggagt 8280

tcagccgatc tgacttatgt cattacctat gaaatgtgag gacgctatgc ctgtaccaaa 8340

tcctacaatg ccggtgaaag gtgccgggac caccctgtgg gtttataagg ggagcggtga 8400

cccttacgcg aatccgcttt cagacgttga ctggtcgcgt ctggcaaaag ttaaagacct 8460

gacgcccggc gaactgaccg ctgagtccta tgacgacagc tatctcgatg atgaagatgc 8520

agactggact gcgaccgggc aggggcagaa atctgccgga gataccagct tcacgctggc 8580

gtggatgccc ggagagcagg ggcagcaggc gctgctggcg tggtttaatg aaggcgatac 8640

ccgtgcctat aaaatccgct tcccgaacgg cacggtcgat gtgttccgtg gctgggtcag 8700

cagtatcggt aaggcggtga cggcgaagga agtgatcacc cgcacggtga aagtcaccaa 8760

tgtgggacgt ccgtcgatgg cagaagatcg cagcacggta acagcggcaa ccggcatgac 8820

cgtgacgcct gccagcacct cggtggtgaa agggcagagc accacgctga ccgtggcctt 8880

ccagccggag ggcgtaaccg acaagagctt tcgtgcggtg tctgcggata aaacaaaagc 8940

caccgtgtcg gtcagtggta tgaccatcac cgtgaacggc gttgctgcag gcaaggtcaa 9000

cattccggtt gtatccggta atggtgagtt tgctgcggtt gcagaaatta ccgtcaccgc 9060

cagttaatcc ggagagtcag cgatgttcct gaaaaccgaa tcatttgaac ataacggtgt 9120

gaccgtcacg ctttctgaac tgtcagccct gcagcgcatt gagcatctcg ccctgatgaa 9180

acggcaggca gaacaggcgg agtcagacag caaccggaag tttactgtgg aagacgccat 9240

cagaaccggc gcgtttctgg tggcgatgtc cctgtggcat aaccatccgc agaagacgca 9300

gatgccgtcc atgaatgaag ccgttaaaca gattgagcag gaagtgctta ccacctggcc 9360

cacggaggca atttctcatg ctgaaaacgt ggtgtaccgg ctgtctggta tgtatgagtt 9420

tgtggtgaat aatgcccctg aacagacaga ggacgccggg cccgcagagc ctgtttctgc 9480

gggaaagtgt tcgacggtga gctgagtttt gccctgaaac tggcgcgtga gatggggcga 9540

cccgactggc gtgccatgct tgccgggatg tcatccacgg agtatgccga ctggcaccgc 9600

ttttacagta cccattattt tcatgatgtt ctgctggata tgcacttttc cgggctgacg 9660

tacaccgtgc tcagcctgtt tttcagcgat ccggatatgc atccgctgga tttcagtctg 9720

ctgaaccggc gcgaggctga cgaagagcct gaagatgatg tgctgatgca gaaagcggca 9780

gggcttgccg gaggtgtccg ctttggcccg gacgggaatg aagttatccc cgcttccccg 9840

gatgtggcgg acatgacgga ggatgacgta atgctgatga cagtatcaga agggatcgca 9900

ggaggagtcc ggtatggctg aaccggtagg cgatctggtc gttgatttga gtctggatgc 9960

ggccagattt gacgagcaga tggccagagt caggcgtcat ttttctggta cggaaagtga 10020

tgcgaaaaaa acagcggcag tcgttgaaca gtcgctgagc cgacaggcgc tggctgcaca 10080

gaaagcgggg atttccgtcg ggcagtataa agccgccatg cgtatgctgc ctgcacagtt 10140

caccgacgtg gccacgcagc ttgcaggcgg gcaaagtccg tggctgatcc tgctgcaaca 10200

gggggggcag gtgaaggact ccttcggcgg gatgatcccc atgttcaggg ggcttgccgg 10260

tgcgatcacc ctgccgatgg tgggggccac ctcgctggcg gtggcgaccg gtgcgctggc 10320

gtatgcctgg tatcagggca actcaaccct gtccgatttc aacaaaacgc tggtcctttc 10380

cggcaatcag gcgggactga cggcagatcg tatgctggtc ctgtccagag ccgggcaggc 10440

ggcagggctg acgtttaacc agaccagcga gtcactcagc gcactggtta aggcgggggt 10500

aagcggtgag gctcagattg cgtccatcag ccagagtgtg gcgcgtttct cctctgcatc 10560

cggcgtggag gtggacaagg tcgctgaagc cttcgggaag ctgaccacag acccgacgtc 10620

ggggctgacg gcgatggctc gccagttcca taacgtgtcg gcggagcaga ttgcgtatgt 10680

tgctcagttg cagcgttccg gcgatgaagc cggggcattg caggcggcga acgaggccgc 10740

aacgaaaggg tttgatgacc agacccgccg cctgaaagag aacatgggca cgctggagac 10800

ctgggcagac aggactgcgc gggcattcaa atccatgtgg gatgcggtgc tggatattgg 10860

tcgtcctgat accgcgcagg agatgctgat taaggcagag gctgcgtata agaaagcaga 10920

cgacatctgg aatctgcgca aggatgatta ttttgttaac gatgaagcgc gggcgcgtta 10980

ctgggatgat cgtgaaaagg cccgtcttgc gcttgaagcc gcccgaaaga aggctgagca 11040

gcagactcaa caggacaaaa atgcgcagca gcagagcgat accgaagcgt cacggctgaa 11100

atataccgaa gaggcgcaga aggcttacga acggctgcag acgccgctgg agaaatatac 11160

cgcccgtcag gaagaactga acaaggcact gaaagacggg aaaatcctgc aggcggatta 11220

caacacgctg atggcggcgg cgaaaaagga ttatgaagcg acgctgaaaa agccgaaaca 11280

gtccagcgtg aaggtgtctg cgggcgatcg tcaggaagac agtgctcatg ctgccctgct 11340

gacgcttcag gcagaactcc ggacgctgga gaagcatgcc ggagcaaatg agaaaatcag 11400

ccagcagcgc cgggatttgt ggaaggcgga gagtcagttc gcggtactgg aggaggcggc 11460

gcaacgtcgc cagctgtctg cacaggagaa atccctgctg gcgcataaag atgagacgct 11520

ggagtacaaa cgccagctgg ctgcacttgg cgacaaggtt acgtatcagg agcgcctgaa 11580

cgcgctggcg cagcaggcgg ataaattcgc acagcagcaa cgggcaaaac gggccgccat 11640

tgatgcgaaa agccgggggc tgactgaccg gcaggcagaa cgggaagcca cggaacagcg 11700

cctgaaggaa cagtatggcg ataatccgct ggcgctgaat aacgtcatgt cagagcagaa 11760

aaagacctgg gcggctgaag accagcttcg cgggaactgg atggcaggcc tgaagtccgg 11820

ctggagtgag tgggaagaga gcgccacgga cagtatgtcg caggtaaaaa gtgcagccac 11880

gcagaccttt gatggtattg cacagaatat ggcggcgatg ctgaccggca gtgagcagaa 11940

ctggcgcagc ttcacccgtt ccgtgctgtc catgatgaca gaaattctgc ttaagcaggc 12000

aatggtgggg attgtcggga gtatcggcag cgccattggc ggggctgttg gtggcggcgc 12060

atccgcgtca ggcggtacag ccattcaggc cgctgcggcg aaattccatt ttgcaaccgg 12120

aggatttacg ggaaccggcg gcaaatatga gccagcgggg attgttcacc gtggtgagtt 12180

tgtcttcacg aaggaggcaa ccagccggat tggcgtgggg aatctttacc ggctgatgcg 12240

cggctatgcc accggcggtt atgtcggtac accgggcagc atggcagaca gccggtcgca 12300

ggcgtccggg acgtttgagc agaataacca tgtggtgatt aacaacgacg gcacgaacgg 12360

gcagataggt ccggctgctc tgaaggcggt gtatgacatg gcccgcaagg gtgcccgtga 12420

tgaaattcag acacagatgc gtgatggtgg cctgttctcc ggaggtggac gatgaagacc 12480

ttccgctgga aagtgaaacc cggtatggat gtggcttcgg tcccttctgt aagaaaggtg 12540

cgctttggtg atggctattc tcagcgagcg cctgccgggc tgaatgccaa cctgaaaacg 12600

tacagcgtga cgctttctgt cccccgtgag gaggccacgg tactggagtc gtttctggaa 12660

gagcacgggg gctggaaatc ctttctgtgg acgccgcctt atgagtggcg gcagataaag 12720

gtgacctgcg caaaatggtc gtcgcgggtc agtatgctgc gtgttgagtt cagcgcagag 12780

tttgaacagg tggtgaactg atgcaggata tccggcagga aacactgaat gaatgcaccc 12840

gtgcggagca gtcggccagc gtggtgctct gggaaatcga cctgacagag gtcggtggag 12900

aacgttattt tttctgtaat gagcagaacg aaaaaggtga gccggtcacc tggcaggggc 12960

gacagtatca gccgtatccc attcagggga gcggttttga actgaatggc aaaggcacca 13020

gtacgcgccc cacgctgacg gtttctaacc tgtacggtat ggtcaccggg atggcggaag 13080

atatgcagag tctggtcggc ggaacggtgg tccggcgtaa ggtttacgcc cgttttctgg 13140

atgcggtgaa cttcgtcaac ggaaacagtt acgccgatcc ggagcaggag gtgatcagcc 13200

gctggcgcat tgagcagtgc agcgaactga gcgcggtgag tgcctccttt gtactgtcca 13260

cgccgacgga aacggatggc gctgtttttc cgggacgtat catgctggcc aacacctgca 13320

cctggaccta tcgcggtgac gagtgcggtt atagcggtcc ggctgtcgcg gatgaatatg 13380

accagccaac gtccgatatc acgaaggata aatgcagcaa atgcctgagc ggttgtaagt 13440

tccgcaataa cgtcggcaac tttggcggct tcctttccat taacaaactt tcgcagtaaa 13500

tcccatgaca cagacagaat cagcgattct ggcgcacgcc cggcgatgtg cgccagcgga 13560

gtcgtgcggc ttcgtggtaa gcacgccgga gggggaaaga tatttcccct gcgtgaatat 13620

ctccggtgag ccggaggcta tttccgtatg tcgccggaag actggctgca ggcagaaatg 13680

cagggtgaga ttgtggcgct ggtccacagc caccccggtg gtctgccctg gctgagtgag 13740

gccgaccggc ggctgcaggt gcagagtgat ttgccgtggt ggctggtctg ccgggggacg 13800

attcataagt tccgctgtgt gccgcatctc accgggcggc gctttgagca cggtgtgacg 13860

gactgttaca cactgttccg ggatgcttat catctggcgg ggattgagat gccggacttt 13920

catcgtgagg atgactggtg gcgtaacggc cagaatctct atctggataa tctggaggcg 13980

acggggctgt atcaggtgcc gttgtcagcg gcacagccgg gcgatgtgct gctgtgctgt 14040

tttggttcat cagtgccgaa tcacgccgca atttactgcg gcgacggcga gctgctgcac 14100

catattcctg aacaactgag caaacgagag aggtacaccg acaaatggca gcgacgcaca 14160

cactccctct ggcgtcaccg ggcatggcgc gcatctgcct ttacggggat ttacaacgat 14220

ttggtcgccg catcgacctt cgtgtgaaaa cgggggctga agccatccgg gcactggcca 14280

cacagctccc ggcgtttcgt cagaaactga gcgacggctg gtatcaggta cggattgccg 14340

ggcgggacgt cagcacgtcc gggttaacgg cgcagttaca tgagactctg cctgatggcg 14400

ctgtaattca tattgttccc agagtcgccg gggccaagtc aggtggcgta ttccagattg 14460

tcctgggggc tgccgccatt gccggatcat tctttaccgc cggagccacc cttgcagcat 14520

ggggggcagc cattggggcc ggtggtatga ccggcatcct gttttctctc ggtgccagta 14580

tggtgctcgg tggtgtggcg cagatgctgg caccgaaagc cagaactccc cgtatacaga 14640

caacggataa cggtaagcag aacacctatt tctcctcact ggataacatg gttgcccagg 14700

gcaatgttct gcctgttctg tacggggaaa tgcgcgtggg gtcacgcgtg gtttctcagg 14760

agatcagcac ggcagacgaa ggggacggtg gtcaggttgt ggtgattggt cgctgatgca 14820

aaatgtttta tgtgaaaccg cctgcgggcg gttttgtcat ttatggagcg tgaggaatgg 14880

gtaaaggaag cagtaagggg cataccccgc gcgaagcgaa ggacaacctg aagtccacgc 14940

agttgctgag tgtgatcgat gccatcagcg aagggccgat tgaaggtccg gtggatggct 15000

taaaaagcgt gctgctgaac agtacgccgg tgctggacac tgaggggaat accaacatat 15060

ccggtgtcac ggtggtgttc cgggctggtg agcaggagca gactccgccg gagggatttg 15120

aatcctccgg ctccgagacg gtgctgggta cggaagtgaa atatgacacg ccgatcaccc 15180

gcaccattac gtctgcaaac atcgaccgtc tgcgctttac cttcggtgta caggcactgg 15240

tggaaaccac ctcaaagggt gacaggaatc cgtcggaagt ccgcctgctg gttcagatac 15300

aacgtaacgg tggctgggtg acggaaaaag acatcaccat taagggcaaa accacctcgc 15360

agtatctggc ctcggtggtg atgggtaacc tgccgccgcg cccgtttaat atccggatgc 15420

gcaggatgac gccggacagc accacagacc agctgcagaa caaaacgctc tggtcgtcat 15480

acactgaaat catcgatgtg aaacagtgct acccgaacac ggcactggtc ggcgtgcagg 15540

tggactcgga gcagttcggc agccagcagg tgagccgtaa ttatcatctg cgcgggcgta 15600

ttctgcaggt gccgtcgaac tataacccgc agacgcggca atacagcggt atctgggacg 15660

gaacgtttaa accggcatac agcaacaaca tggcctggtg tctgtgggat atgctgaccc 15720

atccgcgcta cggcatgggg aaacgtcttg gtgcggcgga tgtggataaa tgggcgctgt 15780

atgtcatcgg ccagtactgc gaccagtcag tgccggacgg ctttggcggc acggagccgc 15840

gcatcacctg taatgcgtac ctgaccacac agcgtaaggc gtgggatgtg ctcagcgatt 15900

tctgctcggc gatgcgctgt atgccggtat ggaacgggca gacgctgacg ttcgtgcagg 15960

accgaccgtc ggataagacg tggacctata accgcagtaa tgtggtgatg ccggatgatg 16020

gcgcgccgtt ccgctacagc ttcagcgccc tgaaggaccg ccataatgcc gttgaggtga 16080

actggattga cccgaacaac ggctgggaga cggcgacaga gcttgttgaa gatacgcagg 16140

ccattgcccg ttacggtcgt aatgttacga agatggatgc ctttggctgt accagccggg 16200

ggcaggcaca ccgcgccggg ctgtggctga ttaaaacaga actgctggaa acgcagaccg 16260

tggatttcag cgtcggcgca gaagggcttc gccatgtacc gggcgatgtt attgaaatct 16320

gcgatgatga ctatgccggt atcagcaccg gtggtcgtgt gctggcggtg aacagccaga 16380

cccggacgct gacgctcgac cgtgaaatca cgctgccatc ctccggtacc gcgctgataa 16440

gcctggttga cggaagtggc aatccggtca gcgtggaggt tcagtccgtc accgacggcg 16500

tgaaggtaaa agtgagccgt gttcctgacg gtgttgctga atacagcgta tgggagctga 16560

agctgccgac gctgcgccag cgactgttcc gctgcgtgag tatccgtgag aacgacgacg 16620

gcacgtatgc catcaccgcc gtgcagcatg tgccggaaaa agaggccatc gtggataacg 16680

gggcgcactt tgacggcgaa cagagtggca cggtgaatgg tgtcacgccg ccagcggtgc 16740

agcacctgac cgcagaagtc actgcagaca gcggggaata tcaggtgctg gcgcgatggg 16800

acacaccgaa ggtggtgaag ggcgtgagtt tcctgctccg tctgaccgta acagcggacg 16860

acggcagtga gcggctggtc agcacggccc ggacgacgga aaccacatac cgcttcacgc 16920

aactggcgct ggggaactac aggctgacag tccgggcggt aaatgcgtgg gggcagcagg 16980

gcgatccggc gtcggtatcg ttccggattg ccgcaccggc agcaccgtcg aggattgagc 17040

tgacgccggg ctattttcag ataaccgcca cgccgcatct tgccgtttat gacccgacgg 17100

tacagtttga gttctggttc tcggaaaagc agattgcgga tatcagacag gttgaaacca 17160

gcacgcgtta tcttggtacg gcgctgtact ggatagccgc cagtatcaat atcaaaccgg 17220

gccatgatta ttacttttat atccgcagtg tgaacaccgt tggcaaatcg gcattcgtgg 17280

aggccgtcgg tcgggcgagc gatgatgcgg aaggttacct ggattttttc aaaggcaaga 17340

taaccgaatc ccatctcggc aaggagctgc tggaaaaagt cgagctgacg gaggataacg 17400

ccagcagact ggaggagttt tcgaaagagt ggaaggatgc cagtgataag tggaatgcca 17460

tgtgggctgt caaaattgag cagaccaaag acggcaaaca ttatgtcgcg ggtattggcc 17520

tcagcatgga ggacacggag gaaggcaaac tgagccagtt tctggttgcc gccaatcgta 17580

tcgcatttat tgacccggca aacgggaatg aaacgccgat gtttgtggcg cagggcaacc 17640

agatattcat gaacgacgtg ttcctgaagc gcctgacggc ccccaccatt accagcggcg 17700

gcaatcctcc ggccttttcc ctgacaccgg acggaaagct gaccgctaaa aatgcggata 17760

tcagtggcag tgtgaatgcg aactccggga cgctcagtaa tgtgacgata gctgaaaact 17820

gtacgataaa cggtacgctg agggcggaaa aaatcgtcgg ggacattgta aaggcggcga 17880

gcgcggcttt tccgcgccag cgtgaaagca gtgtggactg gccgtcaggt acccgtactg 17940

tcaccgtgac cgatgaccat ccttttgatc gccagatagt ggtgcttccg ctgacgtttc 18000

gcggaagtaa gcgtactgtc agcggcagga caacgtattc gatgtgttat ctgaaagtac 18060

tgatgaacgg tgcggtgatt tatgatggcg cggcgaacga ggcggtacag gtgttctccc 18120

gtattgttga catgccagcg ggtcggggaa acgtgatcct gacgttcacg cttacgtcca 18180

cacggcattc ggcagatatt ccgccgtata cgtttgccag cgatgtgcag gttatggtga 18240

ttaagaaaca ggcgctgggc atcagcgtgg tctgagtgtg ttacagaggt tcgtccggga 18300

acgggcgttt tattataaaa cagtgagagg tgaacgatgc gtaatgtgtg tattgccgtt 18360

gctgtctttg ccgcacttgc ggtgacagtc actccggccc gtgcggaagg tggacatggt 18420

acgtttacgg tgggctattt tcaagtgaaa ccgggtacat tgccgtcgtt gtcgggcggg 18480

gataccggtg tgagtcatct gaaagggatt aacgtgaagt accgttatga gctgacggac 18540

agtgtggggg tgatggcttc cctggggttc gccgcgtcga aaaagagcag cacagtgatg 18600

accggggagg atacgtttca ctatgagagc ctgcgtggac gttatgtgag cgtgatggcc 18660

ggaccggttt tacaaatcag taagcaggtc agtgcgtacg ccatggccgg agtggctcac 18720

agtcggtggt ccggcagtac aatggattac cgtaagacgg aaatcactcc cgggtatatg 18780

aaagagacga ccactgccag ggacgaaagt gcaatgcggc atacctcagt ggcgtggagt 18840

gcaggtatac agattaatcc ggcagcgtcc gtcgttgttg atattgctta tgaaggctcc 18900

ggcagtggcg actggcgtac tgacggattc atcgttgggg tcggttataa attctgatta 18960

gccaggtaac acagtgttat gacagcccgc cggaaccggt gggctttttt gtggggtgaa 19020

tatggcagta aagatttcag gagtcctgaa agacggcaca ggaaaaccgg tacagaactg 19080

caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 19140

agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 19200

catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 19260

ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 19320

ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 19380

ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 19440

ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 19500

acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 19560

cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aaaa 19604

<210> 10

<211> 10058

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 10

acgcggcggc caccagtgcc ggtgcggcga aaacgtcaga aacgaatgct gcagcgtcac 60

aacaatcagc cgccacgtct gcctccaccg cggccacgaa agcgtcagag gccgccactt 120

cagcacgaga tgcggtggcc tcaaaagagg cagcaaaatc atcagaaacg aacgcatcat 180

caagtgccgg tcgtgcagct tcctcggcaa cggcggcaga aaattctgcc agggcggcaa 240

aaacgtccga gacgaatgcc aggtcatctg aaacagcagc ggaacggagc gcctctgccg 300

cggcagacgc aaaaacagcg gcggcgggga gtgcgtcaac ggcatccacg aaggcgacag 360

aggctgcggg aagtgcggta tcagcatcgc agagcaaaag tgcggcagaa gcggcggcaa 420

tacgtgcaaa aaattcggca aaacgtgcag aagatatagc ttcagctgtc gcgcttgagg 480

atgcggacac aacgagaaag gggatagtgc agctcagcag tgcaaccaac agcacgtctg 540

aaacgcttgc tgcaacgcca aaggcggtta aggtggtaat ggatgaaacg aacagaaaag 600

cccactggac agtccggcac tgaccggaac gccaacagca ccaaccgcgc tcaggggaac 660

aaacaatacc cagattgcga acaccgcttt tgtactggcc gcgattgcag atgttatcga 720

cgcgtcacct gacgcactga atacgctgaa tgaactggcc gcagcgctcg ggaatgatcc 780

agattttgct accaccatga ctaacgcgct tgcgggtaaa caaccgaaga atgcgacact 840

gacggcgctg gcagggcttt ccacggcgaa aaataaatta ccgtattttg cggaaaatga 900

tgccgccagc ctgactgaac tgactcaggt tggcagggat attctggcaa aaaattccgt 960

tgcagatgtt cttgaatacc ttggggccgg tgagaattcg gcctttccgg caggtgcgcc 1020

gatcccgtgg ccatcagata tcgttccgtc tggctacgtc ctgatgcagg ggcaggcgtt 1080

tgacaaatca gcctacccaa aacttgctgt cgcgtatcca tcgggtgtgc ttcctgatat 1140

gcgaggctgg acaatcaagg ggaaacccgc cagcggtcgt gctgtattgt ctcaggaaca 1200

ggatggaatt aagtcgcaca cccacagtgc cagtgcatcc ggtacggatt tggggacgaa 1260

aaccacatcg tcgtttgatt acgggacgaa aacaacaggc agtttcgatt acggcaccaa 1320

atcgacgaat aacacggggg ctcatgctca cagtctgagc ggttcaacag gggccgcggg 1380

tgctcatgcc cacacaagtg gtttaaggat gaacagttct ggctggagtc agtatggaac 1440

agcaaccatt acaggaagtt tatccacagt taaaggaacc agcacacagg gtattgctta 1500

tttatcgaaa acggacagtc agggcagcca cagtcactca ttgtccggta cagccgtgag 1560

tgccggtgca catgcgcata cagttggtat tggtgcgcac cagcatccgg ttgttatcgg 1620

tgctcatgcc cattctttca gtattggttc acacggacac accatcaccg ttaacgctgc 1680

gggtaacgcg gaaaacaccg tcaaaaacat tgcatttaac tatattgtga ggcttgcata 1740

atggcattca gaatgagtga acaaccacgg accataaaaa tttataatct gctggccgga 1800

actaatgaat ttattggtga aggtgacgca tatattccgc ctcataccgg tctgcctgca 1860

aacagtaccg atattgcacc gccagatatt ccggctggct ttgtggctgt tttcaacagt 1920

gatgaggcat cgtggcatct cgttgaagac catcggggta aaaccgtcta tgacgtggct 1980

tccggcgacg cgttatttat ttctgaactc ggtccgttac cggaaaattt tacctggtta 2040

tcgccgggag gggaatatca gaagtggaac ggcacagcct gggtgaagga tacggaagca 2100

gaaaaactgt tccggatccg ggaggcggaa gaaacaaaaa aaagcctgat gcaggtagcc 2160

agtgagcata ttgcgccgct tcaggatgct gcagatctgg aaattgcaac gaaggaagaa 2220

acctcgttgc tggaagcctg gaagaagtat cgggtgttgc tgaaccgtgt tgatacatca 2280

actgcacctg atattgagtg gcctgctgtc cctgttatgg agtaatcgtt ttgtgatatg 2340

ccgcagaaac gttgtatgaa ataacgttct gcggttagtt agtatattgt aaagctgagt 2400

attggtttat ttggcgatta ttatcttcag gagaataatg gaagttctat gactcaattg 2460

ttcatagtgt ttacatcacc gccaattgct tttaagactg aacgcatgaa atatggtttt 2520

tcgtcatgtt ttgagtctgc tgttgatatt tctaaagtcg gttttttttc ttcgttttct 2580

ctaactattt tccatgaaat acatttttga ttattatttg aatcaattcc aattacctga 2640

agtctttcat ctataattgg cattgtatgt attggtttat tggagtagat gcttgctttt 2700

ctgagccata gctctgatat ccaaatgaag ccataggcat ttgttatttt ggctctgtca 2760

gctgcataac gccaaaaaat atatttatct gcttgatctt caaatgttgt attgattaaa 2820

tcaattggat ggaattgttt atcataaaaa attaatgttt gaatgtgata accgtccttt 2880

aaaaaagtcg tttctgcaag cttggctgta tagtcaacta actcttctgt cgaagtgata 2940

tttttaggct tatctaccag ttttagacgc tctttaatat cttcaggaat tattttattg 3000

tcatattgta tcatgctaaa tgacaatttg cttatggagt aatcttttaa ttttaaataa 3060

gttattctcc tggcttcatc aaataaagag tcgaatgatg ttggcgaaat cacatcgtca 3120

cccattggat tgtttatttg tatgccaaga gagttacagc agttatacat tctgccatag 3180

attatagcta aggcatgtaa taattcgtaa tcttttagcg tattagcgac ccatcgtctt 3240

tctgatttaa taatagatga ttcagttaaa tatgaaggta atttcttttg tgcaagtctg 3300

actaactttt ttataccaat gtttaacata ctttcatttg taataaactc aatgtcattt 3360

tcttcaatgt aagatgaaat aagagtagcc tttgcctcgc tatacatttc taaatcgcct 3420

tgtttttcta tcgtattgcg agaattttta gcccaagcca ttaatggatc atttttccat 3480

ttttcaataa cattattgtt ataccaaatg tcatatccta taatctggtt tttgtttttt 3540

tgaataataa atgttactgt tcttgcggtt tggaggaatt gattcaaatt caagcgaaat 3600

aattcagggt caaaatatgt atcaatgcag catttgagca agtgcgataa atctttaagt 3660

cttctttccc atggtttttt agtcataaaa ctctccattt tgataggttg catgctagat 3720

gctgatatat tttagaggtg ataaaattaa ctgcttaact gtcaatgtaa tacaagttgt 3780

ttgatctttg caatgattct tatcagaaac catatagtaa attagttaca caggaaattt 3840

ttaatattat tattatcatt cattatgtat taaaattaga gttgtggctt ggctctgcta 3900

acacgttgct cataggagat atggtagagc cgcagacacg tcgtatgcag gaacgtgctg 3960

cggctggctg gtgaacttcc gatagtgcgg gtgttgaatg atttccagtt gctaccgatt 4020

ttacatattt tttgcatgag agaatttgta ccacctccca ccgaccatct atgactgtac 4080

gccactgtcc ctaggactgc tatgtgccgg agcggacatt acaaacgtcc ttctcggtgc 4140

atgccactgt tgccaatgac ctgcctagga attggttagc aagttactac cggattttgt 4200

aaaaacagcc ctcctcatat aaaaagtatt cgttcacttc cgataagcgt cgtaattttc 4260

tatctttcat catattctag atccctctga aaaaatcttc cgagtttgct aggcactgat 4320

acataactct tttccaataa ttggggaagt cattcaaatc tataataggt ttcagatttg 4380

cttcaataaa ttctgactgt agctgctgaa acgttgcggt tgaactatat ttccttataa 4440

cttttacgaa agagtttctt tgagtaatca cttcactcaa gtgcttccct gcctccaaac 4500

gatacctgtt agcaatattt aatagcttga aatgatgaag agctctgtgt ttgtcttcct 4560

gcctccagtt cgccgggcat tcaacataaa aactgatagc acccggagtt ccggaaacga 4620

aatttgcata tacccattgc tcacgaaaaa aaatgtcctt gtcgatatag ggatgaatcg 4680

cttggtgtac ctcatctact gcgaaaactt gacctttctc tcccatattg cagtcgcggc 4740

acgatggaac taaattaata ggcatcaccg aaaattcagg ataatgtgca ataggaagaa 4800

aatgatctat attttttgtc tgtcctatat caccacaaaa tggacatttt tcacctgatg 4860

aaacaagcat gtcatcgtaa tatgttctag cgggtttgtt tttatctcgg agattatttt 4920

cataaagctt ttctaattta acctttgtca ggttaccaac tactaaggtt gtaggctcaa 4980

gagggtgtgt cctgtcgtag gtaaataact gacctgtcga gcttaatatt ctatattgtt 5040

gttctttctg caaaaaagtg gggaagtgag taatgaaatt atttctaaca tttatctgca 5100

tcataccttc cgagcattta ttaagcattt cgctataagt tctcgctgga agaggtagtt 5160

ttttcattgt actttacctt catctctgtt cattatcatc gcttttaaaa cggttcgacc 5220

ttctaatcct atctgaccat tataattttt tagaatggtt tcataagaaa gctctgaatc 5280

aacggactgc gataataagt ggtggtatcc agaatttgtc acttcaagta aaaacacctc 5340

acgagttaaa acacctaagt tctcaccgaa tgtctcaata tccggacgga taatatttat 5400

tgcttctctt gaccgtagga ctttccacat gcaggatttt ggaacctctt gcagtactac 5460

tggggaatga gttgcaatta ttgctacacc attgcgtgca tcgagtaagt cgcttaatgt 5520

tcgtaaaaaa gcagagagca aaggtggatg cagatgaacc tctggttcat cgaataaaac 5580

taatgacttt tcgccaacga catctactaa tcttgtgata gtaaataaaa caattgcatg 5640

tccagagctc attcgaagca gatatttctg gatattgtca taaaacaatt tagtgaattt 5700

atcatcgtcc acttgaatct gtggttcatt acgtcttaac tcttcatatt tagaaatgag 5760

gctgatgagt tccatatttg aaaagttttc atcactactt agttttttga tagcttcaag 5820

ccagagttgt ctttttctat ctactctcat acaaccaata aatgctgaaa tgaattctaa 5880

gcggagatcg cctagtgatt ttaaactatt gctggcagca ttcttgagtc caatataaaa 5940

gtattgtgta ccttttgctg ggtcaggttg ttctttagga ggagtaaaag gatcaaatgc 6000

actaaacgaa actgaaacaa gcgatcgaaa atatcccttt gggattcttg actcgataag 6060

tctattattt tcagagaaaa aatattcatt gttttctggg ttggtgattg caccaatcat 6120

tccattcaaa attgttgttt taccacaccc attccgcccg ataaaagcat gaatgttcgt 6180

gctgggcata gaattaaccg tcacctcaaa aggtatagtt aaatcactga atccgggagc 6240

actttttcta ttaaatgaaa agtggaaatc tgacaattct ggcaaaccat ttaacacacg 6300

tgcgaactgt ccatgaattt ctgaaagagt tacccctcta agtaatgagg tgttaaggac 6360

gctttcattt tcaatgtcgg ctaatcgatt tggccatact actaaatcct gaatagcttt 6420

aagaaggtta tgtttaaaac catcgcttaa tttgctgaga ttaacatagt agtcaatgct 6480

ttcacctaag gaaaaaaaca tttcagggag ttgactgaat tttttatcta ttaatgaata 6540

agtgcttact tcttcttttt gacctacaaa accaatttta acatttccga tatcgcattt 6600

ttcaccatgc tcatcaaaga cagtaagata aaacattgta acaaaggaat agtcattcca 6660

accatctgct cgtaggaatg ccttattttt ttctactgca ggaatatacc cgcctctttc 6720

aataacacta aactccaaca tatagtaacc cttaatttta ttaaaataac cgcaatttat 6780

ttggcggcaa cacaggatct ctcttttaag ttactctcta ttacatacgt tttccatcta 6840

aaaattagta gtattgaact taacggggca tcgtattgta gttttccata tttagctttc 6900

tgcttccttt tggataaccc actgttattc atgttgcatg gtgcactgtt tataccaacg 6960

atatagtcta ttaatgcata tatagtatcg ccgaacgatt agctcttcag gcttctgaag 7020

aagcgtttca agtactaata agccgataga tagccacgga cttcgtagcc atttttcata 7080

agtgttaact tccgctcctc gctcataaca gacattcact acagttatgg cggaaaggta 7140

tgcatgctgg gtgtggggaa gtcgtgaaag aaaagaagtc agctgcgtcg tttgacatca 7200

ctgctatctt cttactggtt atgcaggtcg tagtgggtgg cacacaaagc tttgcactgg 7260

attgcgaggc tttgtgcttc tctggagtgc gacaggtttg atgacaaaaa attagcgcaa 7320

gaagacaaaa atcaccttgc gctaatgctc tgttacaggt cactaatacc atctaagtag 7380

ttgattcata gtgactgcat atgttgtgtt ttacagtatt atgtagtctg ttttttatgc 7440

aaaatctaat ttaatatatt gatatttata tcattttacg tttctcgttc agctttttta 7500

tactaagttg gcattataaa aaagcattgc ttatcaattt gttgcaacga acaggtcact 7560

atcagtcaaa ataaaatcat tatttgattt caattttgtc ccactccctg cctctgtcat 7620

cacgatactg tgatgccatg gtgtccgact tatgcccgag aagatgttga gcaaacttat 7680

cgcttatctg cttctcatag agtcttgcag acaaactgcg caactcgtga aaggtaggcg 7740

gatccccttc gaaggaaaga cctgatgctt ttcgtgcgcg cataaaatac cttgatactg 7800

tgccggatga aagcggttcg cgacgagtag atgcaattat ggtttctccg ccaagaatct 7860

ctttgcattt atcaagtgtt tccttcattg atattccgag agcatcaata tgcaatgctg 7920

ttgggatggc aatttttacg cctgttttgc tttgctcgac ataaagatat ccatctacga 7980

tatcagacca cttcatttcg cataaatcac caactcgttg cccggtaaca acagccagtt 8040

ccattgcaag tctgagccaa catggtgatg attctgctgc ttgataaatt ttcaggtatt 8100

cgtcagccgt aagtcttgat ctccttacct ctgattttgc tgcgcgagtg gcagcgacat 8160

ggtttgttgt tatatggcct tcagctattg cctctcggaa tgcatcgctc agtgttgatc 8220

tgattaactt ggctgacgcc gccttgccct cgtctatgta tccattgagc attgccgcaa 8280

tttcttttgt ggtgatgtct tcaagtggag catcaggcag acccctcctt attgctttaa 8340

ttttgctcat gtaatttatg agtgtcttct gcttgattcc tctgctggcc aggatttttt 8400

cgtagcgatc aagccatgaa tgtaacgtaa cggaattatc actgttgatt ctcgctgtca 8460

gaggcttgtg tttgtgtcct gaaaataact caatgttggc ctgtatagct tcagtgattg 8520

cgattcgcct gtctctgcct aatccaaact ctttacccgt ccttgggtcc ctgtagcagt 8580

aatatccatt gtttcttata taaaggttag ggggtaaatc ccggcgctca tgacttcgcc 8640

ttcttcccat ttctgatcct cttcaaaagg ccacctgtta ctggtcgatt taagtcaacc 8700

tttaccgctg attcgtggaa cagatactct cttccatcct taaccggagg tgggaatatc 8760

ctgcattccc gaacccatcg acgaactgtt tcaaggcttc ttggacgtcg ctggcgtgcg 8820

ttccactcct gaagtgtcaa gtacatcgca aagtctccgc aattacacgc aagaaaaaac 8880

cgccatcagg cggcttggtg ttctttcagt tcttcaattc gaatattggt tacgtctgca 8940

tgtgctatct gcgcccatat catccagtgg tcgtagcagt cgttgatgtt ctccgcttcg 9000

ataactctgt tgaatggctc tccattccat tctcctgtga ctcggaagtg catttatcat 9060

ctccataaaa caaaacccgc cgtagcgagt tcagataaaa taaatccccg cgagtgcgag 9120

gattgttatg taatattggg tttaatcatc tatatgtttt gtacagagag ggcaagtatc 9180

gtttccaccg tactcgtgat aataattttg cacggtatca gtcatttctc gcacattgca 9240

gaatggggat ttgtcttcat tagacttata aaccttcatg gaatatttgt atgccgactc 9300

tatatctata ccttcatcta cataaacacc ttcgtgatgt ctgcatggag acaagacacc 9360

ggatctgcac aacattgata acgcccaatc tttttgctca gactctaact cattgatact 9420

catttataaa ctccttgcaa tgtatgtcgt ttcagctaaa cggtatcagc aatgtttatg 9480

taaagaaaca gtaagataat actcaacccg atgtttgagt acggtcatca tctgacacta 9540

cagactctgg catcgctgtg aagacgacgc gaaattcagc attttcacaa gcgttatctt 9600

ttacaaaacc gatctcactc tcctttgatg cgaatgccag cgtcagacat catatgcaga 9660

tactcacctg catcctgaac ccattgacct ccaaccccgt aatagcgatg cgtaatgatg 9720

tcgatagtta ctaacgggtc ttgttcgatt aactgccgca gaaactcttc caggtcacca 9780

gtgcagtgct tgataacagg agtcttccca ggatggcgaa caacaagaaa ctggtttccg 9840

tcttcacgga cttcgttgct ttccagttta gcaatacgct tactcccatc cgagataaca 9900

ccttcgtaat actcacgctg ctcgttgagt tttgattttg ctgtttcaag ctcaacacgc 9960

agtttcccta ctgttagcgc aatatcctcg ttctcctggt cgcggcgttt gatgtattgc 10020

tggtttcttt cccgttcatc cagcagttcc agcacaat 10058

<210> 11

<211> 9105

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 11

cgatggtgtt accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc 60

ctgctctgcc gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt 120

ttactgataa gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc 180

aggcgtcttc gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc 240

tggtggttca ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat 300

gctgaatcaa tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg 360

agggtgaatg cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg 420

ttcatcgttc cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg 480

tgaatcccat cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat 540

cgacgttttt atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg 600

gcaatgctgc gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa 660

gcataagcac acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac 720

ctggtttctc tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga 780

tgcggctaac gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc 840

aatttgagca aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt 900

gtgcatacag cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga 960

tttcggataa cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa 1020

gtgattgcgc ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata 1080

caaaaccaat ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt 1140

caaaactcgc catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct 1200

tcatacgcgg gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt 1260

actgcacctg ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca 1320

tgaaatcccg ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac 1380

catcgggaga gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa 1440

cattcacgcc ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc 1500

aggccagtgc tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg 1560

tgtggaagta ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca 1620

cgttgtgaac ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc 1680

cctgttcgac agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc 1740

tgccaccttc tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc 1800

ctgtgtcagt tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa 1860

taagtcgtca tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt 1920

ttcatcgtta accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt 1980

ttcgacaatg cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg 2040

ggcacactga atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc 2100

cgtgatttct ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc 2160

ggtaacgcag atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt 2220

gtcctgctca aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc 2280

atcaacgccc accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt 2340

cgtccacgga ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc 2400

gctggcatca cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac 2460

agaatccatg ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat 2520

tcgttttata cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac 2580

cggatgtgtt ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg 2640

gattttttgc tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc 2700

tggggcaggc ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc 2760

tgctggtagt gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc 2820

atggctgaac tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg 2880

aaaacaggaa agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc 2940

attttttata agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga 3000

tagtgaattt agtctggata gccataagtg tttgatccat tctttgggac tcctggctga 3060

ttaagtatgt cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt 3120

aaagattcgg aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc 3180

tccttattta tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac 3240

cgcactcagg cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata 3300

tcggtaattc ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca 3360

tcattccagt cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata 3420

agcagagcat gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg 3480

agtcggtatt cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt 3540

acgtcatggt cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt 3600

ttgatgtttg acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc 3660

aaagaagatt tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct 3720

ccgtgtattc actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca 3780

aaaataaagg ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca 3840

ttgccgtcgt tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca 3900

tttcttcagg cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt 3960

gtccacacca ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc 4020

atcacatcct gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa 4080

tagtggattg cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc 4140

tcgtgtaccc ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt 4200

atagaaatgg atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga 4260

accatgtata tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct 4320

gaatatgtta atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt 4380

gcattttcgc tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag 4440

cgatttaagc taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa 4500

aaccttacag aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat 4560

gtggttacat caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac 4620

aaaacttttt cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg 4680

actgaattag ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct 4740

aagtaactag ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat 4800

gccgcgttcg ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag 4860

gttgctttca atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc 4920

gctttctact cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt 4980

tgcgcttacc ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg 5040

acgttcgcgg cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg 5100

tgtgtggcag ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc 5160

cggaatcgca cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt 5220

tgaatgctgc ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg 5280

cgtcctgctg atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat 5340

aatttatcac cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg 5400

ggcattgttt ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat 5460

ttttcaataa atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg 5520

gcgctgaggc cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg 5580

catatatgaa tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg 5640

cttatgctgg aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta 5700

agggcataga caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg 5760

cgcgttctgc ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct 5820

gcatatgatg acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga 5880

atgtagtggc ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg 5940

taaacaccag gcatgattct gttccgcata attactcctg ataattaatc cttaactttg 6000

cccacctgcc ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc 6060

atctcttcag ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt 6120

tctgatagat aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg 6180

tctgaaaatt gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt 6240

ttaaattttg gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt 6300

gcccctaaga cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt 6360

gttcggccga tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc 6420

tctatctgaa cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc 6480

agatcggatg tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca 6540

aacaaaaaag atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca 6600

actgaagctt tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag 6660

agaaaagttt ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga 6720

tgattatcag ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc 6780

cctttatttt tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac 6840

tatgttatgt tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt 6900

gttatcagct atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca 6960

ctgactagcg ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta 7020

ctgtgggttt agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt 7080

aaactcatca cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg 7140

gtcaacgaga attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat 7200

ggaattacct tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac 7260

ccatctctcc gcatcacctt tggtaaaggt tctaagctca ggtgagaaca tccctgcctg 7320

aacatgagaa aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc 7380

ttcatacatc tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt 7440

gagaattttt gcaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa 7500

agcaccaacg cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc 7560

aagttcattt ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc 7620

ttgtgttaat ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat 7680

atctaacacc gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta 7740

aggaggttgt atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac 7800

caagacagct aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg 7860

ccgaaagatt tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc 7920

cttcccgagt aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct 7980

gaaaaagggc atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa 8040

tcaattgtta tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc 8100

tacgaatcga gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg 8160

aagctgtggg cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt 8220

tctcaatgct gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg 8280

cgcgacaagt tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg 8340

aacaaatcca gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac 8400

aaatacagca aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt 8460

ggcagatctc gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg 8520

cgcagatctg accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg 8580

gtggaataaa ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc 8640

tgtcaaacgg tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca 8700

aggcggcatg tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg 8760

aaaatcccct aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa 8820

acagggggac acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa 8880

ttctggcgaa tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc 8940

aattcagagc ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt 9000

tgacatggtg aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa 9060

cgatatccgc ctgatgcgtg aacgtgacgg acgtaaccac cgcga 9105

<210> 12

<211> 9107

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 12

catgtgtgtg ctgttccgct gggcatgcca ggacaacttc tggtccggta acgtgctgag 60

cccggccaaa ctccgcgata agtggaccca actcgaaatc aaccgtaaca agcaacaggc 120

aggcgtgaca gccagcaaac caaaactcga cctgacaaac acagactgga tttacggggt 180

ggatctatga aaaacatcgc cgcacagatg gttaactttg accgtgagca gatgcgtcgg 240

atcgccaaca acatgccgga acagtacgac gaaaagccgc aggtacagca ggtagcgcag 300

atcatcaacg gtgtgttcag ccagttactg gcaactttcc cggcgagcct ggctaaccgt 360

gaccagaacg aagtgaacga aatccgtcgc cagtgggttc tggcttttcg ggaaaacggg 420

atcaccacga tggaacaggt taacgcagga atgcgcgtag cccgtcggca gaatcgacca 480

tttctgccat cacccgggca gtttgttgca tggtgccggg aagaagcatc cgttaccgcc 540

ggactgccaa acgtcagcga gctggttgat atggtttacg agtattgccg gaagcgaggc 600

ctgtatccgg atgcggagtc ttatccgtgg aaatcaaacg cgcactactg gctggttacc 660

aacctgtatc agaacatgcg ggccaatgcg cttactgatg cggaattacg ccgtaaggcc 720

gcagatgagc ttgtccatat gactgcgaga attaaccgtg gtgaggcgat ccctgaacca 780

gtaaaacaac ttcctgtcat gggcggtaga cctctaaatc gtgcacaggc tctggcgaag 840

atcgcagaaa tcaaagctaa gttcggactg aaaggagcaa gtgtatgacg ggcaaagagg 900

caattattca ttacctgggg acgcataata gcttctgtgc gccggacgtt gccgcgctaa 960

caggcgcaac agtaaccagc ataaatcagg ccgcggctaa aatggcacgg gcaggtcttc 1020

tggttatcga aggtaaggtc tggcgaacgg tgtattaccg gtttgctacc agggaagaac 1080

gggaaggaaa gatgagcacg aacctggttt ttaaggagtg tcgccagagt gccgcgatga 1140

aacgggtatt ggcggtatat ggagttaaaa gatgaccatc tacattactg agctaataac 1200

aggcctgctg gtaatcgcag gcctttttat ttgggggaga gggaagtcat gaaaaaacta 1260

acctttgaaa ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc 1320

cttccagacc caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac 1380

caaaacagga agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt 1440

cgctggctgg atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat 1500

gttgttccta accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg 1560

cgtgtaggcg aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc 1620

gttaagtggt cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg 1680

gctgcatgat aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc 1740

taatggagca aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt 1800

gtgaacatcc aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc 1860

tcaccgtatt gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat 1920

gggaaccaaa ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa 1980

agaaatatgg cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc 2040

ccttcaccaa atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca 2100

tcagagctga tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac 2160

tgtcagactt tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc 2220

aaataccgga acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg 2280

gacttgcctg caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat 2340

cccatgtgcg tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt 2400

cgctggacgg tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca 2460

tggtacgagc taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag 2520

ggcagcttga tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga 2580

atgcaaagaa gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg 2640

gtgtgaaaga acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg 2700

agacagcgac gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa 2760

cgcaccagaa ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac 2820

acggctcacc tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg 2880

accaaaatcg aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg 2940

gtcagaagct gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga 3000

gcgatccgaa tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga 3060

tgtaaaaacg atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc 3120

tctccagagt gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg 3180

gaaaaagcag cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag 3240

attcgaaaac tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta 3300

aacgccttca tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg 3360

tctgctcagt gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt 3420

aatgaacgca atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc 3480

gttccgtatc gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa 3540

tcaaaccata accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac 3600

caacagaaac tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa 3660

aaaccattcc agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac 3720

tgaaatgtag tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg 3780

ccatcgtcaa cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac 3840

gaaaaaattg atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc 3900

tacacgaacc tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt 3960

atctcggtgg gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc 4020

acattcccct ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta 4080

tcagagcgtg gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc 4140

gattacgaca aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta 4200

atcatcgaac tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt 4260

gacgaatacg agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga 4320

atcagcaact cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt 4380

ggtcatacgc cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc 4440

gcagtgttct gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg 4500

aaagcgtagc taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca 4560

cggcttctga ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac 4620

aagccggatt cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac 4680

aaaaggctat caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg 4740

tggcaaagct tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt 4800

atgcggatta ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta 4860

caggccgtgc ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt 4920

gcggaagatg caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg 4980

tgacgatgct aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt 5040

atgacgctct ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg 5100

cggtcacacg ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga 5160

cttattgaat aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta 5220

gtgagatgaa aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat 5280

cgtctggaac tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt 5340

cgcaggtaat agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg 5400

taagagcatt gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc 5460

cgttgtgctg aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg 5520

tcatcgccgc ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat 5580

tcattagtaa tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag 5640

gaggtcgcgc taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg 5700

attactaaac acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa 5760

tagagcaaat ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg 5820

gccgccattc tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg 5880

taccttcgcg gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg 5940

tgcgccatta tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat 6000

ctcgcttata taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt 6060

atcaaacgct tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg 6120

taaggcgttc ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac 6180

cagaaatcat ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca 6240

ccctcgcaaa cttgtcacgc taaacccaaa actcaaatca acaggcgccg gacgctacca 6300

gcttctttcc cgttggtggg atgcctaccg caagcagctt ggcctgaaag acttctctcc 6360

gaaaagtcag gacgctgtgg cattgcagca gattaaggag cgtggcgctt tacctatgat 6420

tgatcgtggt gatatccgtc aggcaatcga ccgttgcagc aatatctggg cttcactgcc 6480

gggcgctggt tatggtcagt tcgagcataa ggctgacagc ctgattgcaa aattcaaaga 6540

agcgggcgga acggtcagag agattgatgt atgagcagag tcaccgcgat tatctccgct 6600

ctggttatct gcatcatcgt ctgcctgtca tgggctgtta atcattaccg tgataacgcc 6660

attacctaca aagcccagcg cgacaaaaat gccagagaac tgaagctggc gaacgcggca 6720

attactgaca tgcagatgcg tcagcgtgat gttgctgcgc tcgatgcaaa atacacgaag 6780

gagttagctg atgctaaagc tgaaaatgat gctctgcgtg atgatgttgc cgctggtcgt 6840

cgtcggttgc acatcaaagc agtctgtcag tcagtgcgtg aagccaccac cgcctccggc 6900

gtggataatg cagcctcccc ccgactggca gacaccgctg aacgggatta tttcaccctc 6960

agagagaggc tgatcactat gcaaaaacaa ctggaaggaa cccagaagta tattaatgag 7020

cagtgcagat agagttgccc atatcgatgg gcaactcatg caattattgt gagcaataca 7080

cacgcgcttc cagcggagta taaatgccta aagtaataaa accgagcaat ccatttacga 7140

atgtttgctg ggtttctgtt ttaacaacat tttctgcgcc gccacaaatt ttggctgcat 7200

cgacagtttt cttctgccca attccagaaa cgaagaaatg atgggtgatg gtttcctttg 7260

gtgctactgc tgccggtttg ttttgaacag taaacgtctg ttgagcacat cctgtaataa 7320

gcagggccag cgcagtagcg agtagcattt ttttcatggt gttattcccg atgctttttg 7380

aagttcgcag aatcgtatgt gtagaaaatt aaacaaaccc taaacaatga gttgaaattt 7440

catattgtta atatttatta atgtatgtca ggtgcgatga atcgtcattg tattcccgga 7500

ttaactatgt ccacagccct gacggggaac ttctctgcgg gagtgtccgg gaataattaa 7560

aacgatgcac acagggttta gcgcgtacac gtattgcatt atgccaacgc cccggtgctg 7620

acacggaaga aaccggacgt tatgatttag cgtggaaaga tttgtgtagt gttctgaatg 7680

ctctcagtaa atagtaatga attatcaaag gtatagtaat atcttttatg ttcatggata 7740

tttgtaaccc atcggaaaac tcctgcttta gcaagatttt ccctgtattg ctgaaatgtg 7800

atttctcttg atttcaacct atcataggac gtttctataa gatgcgtgtt tcttgagaat 7860

ttaacattta caaccttttt aagtcctttt attaacacgg tgttatcgtt ttctaacacg 7920

atgtgaatat tatctgtggc tagatagtaa atataatgtg agacgttgtg acgttttagt 7980

tcagaataaa acaattcaca gtctaaatct tttcgcactt gatcgaatat ttctttaaaa 8040

atggcaacct gagccattgg taaaaccttc catgtgatac gagggcgcgt agtttgcatt 8100

atcgttttta tcgtttcaat ctggtctgac ctccttgtgt tttgttgatg atttatgtca 8160

aatattagga atgttttcac ttaatagtat tggttgcgta acaaagtgcg gtcctgctgg 8220

cattctggag ggaaatacaa ccgacagatg tatgtaaggc caacgtgctc aaatcttcat 8280

acagaaagat ttgaagtaat attttaaccg ctagatgaag agcaagcgca tggagcgaca 8340

aaatgaataa agaacaatct gctgatgatc cctccgtgga tctgattcgt gtaaaaaata 8400

tgcttaatag caccatttct atgagttacc ctgatgttgt aattgcatgt atagaacata 8460

aggtgtctct ggaagcattc agagcaattg aggcagcgtt ggtgaagcac gataataata 8520

tgaaggatta ttccctggtg gttgactgat caccataact gctaatcatt caaactattt 8580

agtctgtgac agagccaaca cgcagtctgt cactgtcagg aaagtggtaa aactgcaact 8640

caattactgc aatgccctcg taattaagtg aatttacaat atcgtcctgt tcggagggaa 8700

gaacgcggga tgttcattct tcatcacttt taattgatgt atatgctctc ttttctgacg 8760

ttagtctccg acggcaggct tcaatgaccc aggctgagaa attcccggac cctttttgct 8820

caagagcgat gttaatttgt tcaatcattt ggttaggaaa gcggatgttg cgggttgttg 8880

ttctgcgggt tctgttcttc gttgacatga ggttgccccg tattcagtgt cgctgatttg 8940

tattgtctga agttgttttt acgttaagtt gatgcagatc aattaatacg atacctgcgt 9000

cataattgat tatttgacgt ggtttgatgg cctccacgca cgttgtgata tgtagatgat 9060

aatcattatc actttacggg tcctttccgg tgatccgaca ggttacg 9107

<210> 13

<211> 103

<212> RNA

<213> artificial sequence

<220>

<223> sgRNA

<400> 13

cgcagagucc ucaaaaaacg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 14

<211> 20

<212> DNA

<213> artificial sequence

<220>

<223> protospacer

<400> 14

cgcagagtcc tcaaaaaacg 20

<210> 15

<211> 103

<212> RNA

<213> artificial sequence

<220>

<223> srRNA

<400> 15

agcaguucca gcacaaucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 103

<210> 16

<211> 20

<212> DNA

<213> artificial sequence

<220>

<223> protospacer

<400> 16

agcagttcca gcacaatcga 20

<210> 17

<211> 522

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 17

caccattcag ctgaaagcca gacgtaacag caccacggtg gtggtgaaca cggtgggctc 60

agagaatccg gatgaagccg ggcgttacag catggatgtg gagtacggtc agtacagtgt 120

catcctgcag gttgacggtt ttccaccatc gcacgccggg accatcaccg tgtatgaaga 180

ttcacaaccg gggacgctga atgattttct ctgtgccatg acggaggatg atgcccggcc 240

ggaggtgctg cgtcgtcttg aactgatggt ggaagaggtg gcgcgtaacg cgtccgtggt 300

ggcacagagt acggcagacg cgaagaaatc agccggcgat gccagtgcat cagctgctca 360

ggtcgcggcc cttgtgactg atgcaactga ctcagcacgc gccgccagca cgtccgccgg 420

acaggctgca tcgtcagctc aggaagcgtc ctccggcgca gaagcggcat cagcaaaggc 480

cactgaagcg gaaaaaagtg ccgcagccgc agagtcctca aa 522

<210> 18

<211> 520

<212> DNA

<213> artificial sequence

<220>

<223> Lambda DNA

<400> 18

atcgatggtg ttaccaattc atggaaaagg tctgcgtcaa atccccagtc gtcatgcatt 60

gcctgctctg ccgcttcacg cagtgcctga gagttaattt cgctcacttc gaacctctct 120

gtttactgat aagttccaga tcctcctggc aacttgcaca agtccgacaa ccctgaacga 180

ccaggcgtct tcgttcatct atcggatcgc cacactcaca acaatgagtg gcagatatag 240

cctggtggtt caggcggcgc atttttattg ctgtgttgcg ctgtaattct tctatttctg 300

atgctgaatc aatgatgtct gccatctttc attaatccct gaactgttgg ttaatacgct 360

tgagggtgaa tgcgaataat aaaaaaggag cctgtagctc cctgatgatt ttgcttttca 420

tgttcatcgt tccttaaaga cgccgtttaa catgccgatt gccaggctta aatgagtcgg 480

tgtgaatccc atcagcgtta ccgtttcgcg gtgcttcttc 520

<210> 19

<211> 1082

<212> PRT

<213> Geobacillus thermodenitrificans T12

<400> 19

Met Lys Tyr Lys Ile Gly Leu Asp Ile Gly Ile Thr Ser Ile Gly Trp

1 5 10 15

Ala Val Ile Asn Leu Asp Ile Pro Arg Ile Glu Asp Leu Gly Val Arg

20 25 30

Ile Phe Asp Arg Ala Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu

35 40 45

Pro Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Leu Arg Arg Arg Lys

50 55 60

His Arg Leu Glu Arg Ile Arg Arg Leu Phe Val Arg Glu Gly Ile Leu

65 70 75 80

Thr Lys Glu Glu Leu Asn Lys Leu Phe Glu Lys Lys His Glu Ile Asp

85 90 95

Val Trp Gln Leu Arg Val Glu Ala Leu Asp Arg Lys Leu Asn Asn Asp

100 105 110

Glu Leu Ala Arg Ile Leu Leu His Leu Ala Lys Arg Arg Gly Phe Arg

115 120 125

Ser Asn Arg Lys Ser Glu Arg Thr Asn Lys Glu Asn Ser Thr Met Leu

130 135 140

Lys His Ile Glu Glu Asn Gln Ser Ile Leu Ser Ser Tyr Arg Thr Val

145 150 155 160

Ala Glu Met Val Val Lys Asp Pro Lys Phe Ser Leu His Lys Arg Asn

165 170 175

Lys Glu Asp Asn Tyr Thr Asn Thr Val Ala Arg Asp Asp Leu Glu Arg

180 185 190

Glu Ile Lys Leu Ile Phe Ala Lys Gln Arg Glu Tyr Gly Asn Ile Val

195 200 205

Cys Thr Glu Ala Phe Glu His Glu Tyr Ile Ser Ile Trp Ala Ser Gln

210 215 220

Arg Pro Phe Ala Ser Lys Asp Asp Ile Glu Lys Lys Val Gly Phe Cys

225 230 235 240

Thr Phe Glu Pro Lys Glu Lys Arg Ala Pro Lys Ala Thr Tyr Thr Phe

245 250 255

Gln Ser Phe Thr Val Trp Glu His Ile Asn Lys Leu Arg Leu Val Ser

260 265 270

Pro Gly Gly Ile Arg Ala Leu Thr Asp Asp Glu Arg Arg Leu Ile Tyr

275 280 285

Lys Gln Ala Phe His Lys Asn Lys Ile Thr Phe His Asp Val Arg Thr

290 295 300

Leu Leu Asn Leu Pro Asp Asp Thr Arg Phe Lys Gly Leu Leu Tyr Asp

305 310 315 320

Arg Asn Thr Thr Leu Lys Glu Asn Glu Lys Val Arg Phe Leu Glu Leu

325 330 335

Gly Ala Tyr His Lys Ile Arg Lys Ala Ile Asp Ser Val Tyr Gly Lys

340 345 350

Gly Ala Ala Lys Ser Phe Arg Pro Ile Asp Phe Asp Thr Phe Gly Tyr

355 360 365

Ala Leu Thr Met Phe Lys Asp Asp Thr Asp Ile Arg Ser Tyr Leu Arg

370 375 380

Asn Glu Tyr Glu Gln Asn Gly Lys Arg Met Glu Asn Leu Ala Asp Lys

385 390 395 400

Val Tyr Asp Glu Glu Leu Ile Glu Glu Leu Leu Asn Leu Ser Phe Ser

405 410 415

Lys Phe Gly His Leu Ser Leu Lys Ala Leu Arg Asn Ile Leu Pro Tyr

420 425 430

Met Glu Gln Gly Glu Val Tyr Ser Thr Ala Cys Glu Arg Ala Gly Tyr

435 440 445

Thr Phe Thr Gly Pro Lys Lys Lys Gln Lys Thr Val Leu Leu Pro Asn

450 455 460

Ile Pro Pro Ile Ala Asn Pro Val Val Met Arg Ala Leu Thr Gln Ala

465 470 475 480

Arg Lys Val Val Asn Ala Ile Ile Lys Lys Tyr Gly Ser Pro Val Ser

485 490 495

Ile His Ile Glu Leu Ala Arg Glu Leu Ser Gln Ser Phe Asp Glu Arg

500 505 510

Arg Lys Met Gln Lys Glu Gln Glu Gly Asn Arg Lys Lys Asn Glu Thr

515 520 525

Ala Ile Arg Gln Leu Val Glu Tyr Gly Leu Thr Leu Asn Pro Thr Gly

530 535 540

Leu Asp Ile Val Lys Phe Lys Leu Trp Ser Glu Gln Asn Gly Lys Cys

545 550 555 560

Ala Tyr Ser Leu Gln Pro Ile Glu Ile Glu Arg Leu Leu Glu Pro Gly

565 570 575

Tyr Thr Glu Val Asp His Val Ile Pro Tyr Ser Arg Ser Leu Asp Asp

580 585 590

Ser Tyr Thr Asn Lys Val Leu Val Leu Thr Lys Glu Asn Arg Glu Lys

595 600 605

Gly Asn Arg Thr Pro Ala Glu Tyr Leu Gly Leu Gly Ser Glu Arg Trp

610 615 620

Gln Gln Phe Glu Thr Phe Val Leu Thr Asn Lys Gln Phe Ser Lys Lys

625 630 635 640

Lys Arg Asp Arg Leu Leu Arg Leu His Tyr Asp Glu Asn Glu Glu Asn

645 650 655

Glu Phe Lys Asn Arg Asn Leu Asn Asp Thr Arg Tyr Ile Ser Arg Phe

660 665 670

Leu Ala Asn Phe Ile Arg Glu His Leu Lys Phe Ala Asp Ser Asp Asp

675 680 685

Lys Gln Lys Val Tyr Thr Val Asn Gly Arg Ile Thr Ala His Leu Arg

690 695 700

Ser Arg Trp Asn Phe Asn Lys Asn Arg Glu Glu Ser Asn Leu His His

705 710 715 720

Ala Val Asp Ala Ala Ile Val Ala Cys Thr Thr Pro Ser Asp Ile Ala

725 730 735

Arg Val Thr Ala Phe Tyr Gln Arg Arg Glu Gln Asn Lys Glu Leu Ser

740 745 750

Lys Lys Thr Asp Pro Gln Phe Pro Gln Pro Trp Pro His Phe Ala Asp

755 760 765

Glu Leu Gln Ala Arg Leu Ser Lys Asn Pro Lys Glu Ser Ile Lys Ala

770 775 780

Leu Asn Leu Gly Asn Tyr Asp Asn Glu Lys Leu Glu Ser Leu Gln Pro

785 790 795 800

Val Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala Ala His

805 810 815

Gln Glu Thr Leu Arg Arg Tyr Ile Gly Ile Asp Glu Arg Ser Gly Lys

820 825 830

Ile Gln Thr Val Val Lys Lys Lys Leu Ser Glu Ile Gln Leu Asp Lys

835 840 845

Thr Gly His Phe Pro Met Tyr Gly Lys Glu Ser Asp Pro Arg Thr Tyr

850 855 860

Glu Ala Ile Arg Gln Arg Leu Leu Glu His Asn Asn Asp Pro Lys Lys

865 870 875 880

Ala Phe Gln Glu Pro Leu Tyr Lys Pro Lys Lys Asn Gly Glu Leu Gly

885 890 895

Pro Ile Ile Arg Thr Ile Lys Ile Ile Asp Thr Thr Asn Gln Val Ile

900 905 910

Pro Leu Asn Asp Gly Lys Thr Val Ala Tyr Asn Ser Asn Ile Val Arg

915 920 925

Val Asp Val Phe Glu Lys Asp Gly Lys Tyr Tyr Cys Val Pro Ile Tyr

930 935 940

Thr Ile Asp Met Met Lys Gly Ile Leu Pro Asn Lys Ala Ile Glu Pro

945 950 955 960

Asn Lys Pro Tyr Ser Glu Trp Lys Glu Met Thr Glu Asp Tyr Thr Phe

965 970 975

Arg Phe Ser Leu Tyr Pro Asn Asp Leu Ile Arg Ile Glu Phe Pro Arg

980 985 990

Glu Lys Thr Ile Lys Thr Ala Val Gly Glu Glu Ile Lys Ile Lys Asp

995 1000 1005

Leu Phe Ala Tyr Tyr Gln Thr Ile Asp Ser Ser Asn Gly Gly Leu

1010 1015 1020

Ser Leu Val Ser His Asp Asn Asn Phe Ser Leu Arg Ser Ile Gly

1025 1030 1035

Ser Arg Thr Leu Lys Arg Phe Glu Lys Tyr Gln Val Asp Val Leu

1040 1045 1050

Gly Asn Ile Tyr Lys Val Arg Gly Glu Lys Arg Val Gly Val Ala

1055 1060 1065

Ser Ser Ser His Ser Lys Ala Gly Glu Thr Ile Arg Pro Leu

1070 1075 1080

<210> 20

<211> 1263

<212> PRT

<213> Eubacterium rectale

<400> 20

Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser

1 5 10 15

Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln

20 25 30

Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly

35 40 45

Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly

50 55 60

Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser

65 70 75 80

Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp

85 90 95

Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys

100 105 110

Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile

115 120 125

Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala

130 135 140

Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe

145 150 155 160

Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser

165 170 175

Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn

180 185 190

Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys

195 200 205

Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp

210 215 220

Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr

225 230 235 240

Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys

245 250 255

Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu

260 265 270

Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys

275 280 285

Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu

290 295 300

Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys

305 310 315 320

His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr

325 330 335

Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser

340 345 350

Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile

355 360 365

His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys

370 375 380

Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile

385 390 395 400

Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys

405 410 415

Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu

420 425 430

Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu

435 440 445

Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala

450 455 460

Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp

465 470 475 480

Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro

485 490 495

Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro

500 505 510

Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala

515 520 525

Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu

530 535 540

Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys

545 550 555 560

Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp

565 570 575

Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile

580 585 590

Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro

595 600 605

Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser

610 615 620

Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe

625 630 635 640

Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp

645 650 655

Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu

660 665 670

Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys

675 680 685

Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile

690 695 700

Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His

705 710 715 720

Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile

725 730 735

Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser

740 745 750

Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg

755 760 765

Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val

770 775 780

Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe

785 790 795 800

Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys

805 810 815

Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr

820 825 830

Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn

835 840 845

Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr

850 855 860

Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu

865 870 875 880

Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val

885 890 895

Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys

900 905 910

Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys

915 920 925

Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val

930 935 940

Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala

945 950 955 960

Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu

965 970 975

Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn

980 985 990

Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu

995 1000 1005

Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val

1010 1015 1020

Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr

1025 1030 1035

Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe

1040 1045 1050

Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe

1055 1060 1065

Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr

1070 1075 1080

Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys

1085 1090 1095

Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg

1100 1105 1110

Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile

1115 1120 1125

Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp

1130 1135 1140

Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile

1145 1150 1155

Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg

1160 1165 1170

Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile

1175 1180 1185

Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys

1190 1195 1200

Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr

1205 1210 1215

Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu

1220 1225 1230

Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile

1235 1240 1245

Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu

1250 1255 1260

<210> 21

<211> 1274

<212> PRT

<213> Artificial Sequence

<220>

<223> MAD7-NLS

<400> 21

Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser

1 5 10 15

Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln

20 25 30

Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly

35 40 45

Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly

50 55 60

Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser

65 70 75 80

Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp

85 90 95

Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys

100 105 110

Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile

115 120 125

Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala

130 135 140

Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe

145 150 155 160

Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser

165 170 175

Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn

180 185 190

Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys

195 200 205

Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp

210 215 220

Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr

225 230 235 240

Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys

245 250 255

Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu

260 265 270

Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys

275 280 285

Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu

290 295 300

Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys

305 310 315 320

His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr

325 330 335

Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser

340 345 350

Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile

355 360 365

His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys

370 375 380

Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile

385 390 395 400

Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys

405 410 415

Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu

420 425 430

Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu

435 440 445

Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala

450 455 460

Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp

465 470 475 480

Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro

485 490 495

Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro

500 505 510

Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala

515 520 525

Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu

530 535 540

Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys

545 550 555 560

Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp

565 570 575

Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile

580 585 590

Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro

595 600 605

Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser

610 615 620

Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe

625 630 635 640

Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp

645 650 655

Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu

660 665 670

Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys

675 680 685

Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile

690 695 700

Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His

705 710 715 720

Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile

725 730 735

Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser

740 745 750

Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg

755 760 765

Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val

770 775 780

Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe

785 790 795 800

Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys

805 810 815

Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr

820 825 830

Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn

835 840 845

Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr

850 855 860

Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu

865 870 875 880

Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val

885 890 895

Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys

900 905 910

Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys

915 920 925

Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val

930 935 940

Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala

945 950 955 960

Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu

965 970 975

Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn

980 985 990

Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu

995 1000 1005

Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val

1010 1015 1020

Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr

1025 1030 1035

Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe

1040 1045 1050

Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe

1055 1060 1065

Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr

1070 1075 1080

Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys

1085 1090 1095

Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg

1100 1105 1110

Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile

1115 1120 1125

Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp

1130 1135 1140

Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile

1145 1150 1155

Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg

1160 1165 1170

Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile

1175 1180 1185

Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys

1190 1195 1200

Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr

1205 1210 1215

Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu

1220 1225 1230

Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile

1235 1240 1245

Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu

1250 1255 1260

Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val

1265 1270

相关技术
  • 通过核酸内切酶保护的靶向富集
  • 使用靶向核酸内切酶进行哺乳动物基因组的表观遗传修饰
技术分类

06120113108181