掌桥专利:专业的专利平台
掌桥专利
首页

使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌

文献发布时间:2023-06-19 11:55:48


使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌

发明领域

本发明涉及代谢工程细胞增加其与污染微生物竞争而无需抗生素的能力的方法。更特别地,本发明提供了工程蓝细菌以利用三聚氰胺作为氮源,亚磷酸盐作为磷源,任选地还利用NADP+而不是NAD+的方法,并且还提供了使用这种方法制造的基因工程细胞。

背景技术

作为推进碳中和经济的努力的一部分,蓝细菌正在越来越多地被用于代谢工程。它们是光合自养生物,能够以相当简单的要求生长——具有无机氮和磷源的最少培养基,使用光用于能源生成并且将CO

大型蓝细菌培养可以在半封闭系统诸如吊袋中,或者在开放系统,是跑道池或气提式贮水池中进行[Schoepp等人,Bioresour Technol.166:273-81 (2014)]。封闭系统具有更高可控性、培养物污染的机会更少以及通常更高的生长产率的优点。然而,与迄今为止发现的最经济可行的替代的具有气提式贮水池或跑道池的开放系统相比,封闭系统运行基本上更加昂贵 [Schoepp等人,Bioresour Technol.166:273-81(2014)]。另一方面,开放系统具有暴露于环境中的明显缺点,并且因此更易于受到污染。通过使用抗生素和抗生素抗性蓝细菌菌株通常将污染的威胁降至最低。运行具有携带抗生素抗性基因的蓝细菌菌株的大型开放系统,一旦培养物逃逸,会带来严重的生物危害,并且通过水平基因转移,可能有助于抗生素抗性向环境致病物种的传播。

最近,已经探索了使用生态上稀有或异生源的常量营养素来作为手段,以对转基因生物在不使用抗生素下生长来生成选择压力[Kanda等人,J Biotechnol.182:68-73(2014);Loera-Quezada等人,Plant Biotechnol J.14: 2066(2016);Pandeya等人,PlantMol Biol.95:567-577(2017);Polyviou等人,Environmental microbiology reports.7:824-30(2015);Shaw等人,Science. 353:583-6(2016)]以及允许转基因植物竞争过杂草,同时消耗显著更少的磷 [Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012)]。亚磷酸盐脱氢酶(PtxD)是一种将亚磷酸盐(一种生态学上罕见的磷形式)转化为磷酸盐的酶,已被引入多种生物中[Kanda等人,J Biotechnol.182:68-73(2014);Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012);Nahampun等人,Plant Cell Rep.35:1121-1132(2016);Pandeya等人,Plant Mol Biol.95:567-577(2017)]。还已经设计出利用异生的富氮化合物三聚氰胺的合成途径,并将其引入不同的生物中[Shaw等人,Science.353:583-6 (2016)]。在大肠杆菌(Escherichia coli)中引入完整的途径(由6种酶组成)允许携带菌株克服蓄意的污染[Shaw等人,Science.353:583-6(2016)]。

在许多情况下,借助于抗生素盒将这些途径或基因引入靶生物 [Loera-Quezada等人,Plant Biotechnol J.14:2066(2016);Motomura等人, ACS Synth Biol.10:1021(2018);Shaw等人,Science.353:583-6(2016)]。即使这证明了这些途径为携带它们的生物带来了优势,但一种或多种抗生素抗性盒的水平基因转移风险仍然存在。

鉴于上述缺陷,期望提供用于生产工程微生物的方法,该工程微生物可以更有效地与污染物竞争而没有将抗生素抗性基因转移至环境中的风险。

发明内容

本发明提供了工程蓝细菌菌株的方法,其能够在作为唯一N和Pi源的三聚氰胺和/或亚磷酸盐上生长,通过使用代谢选择来驱动它们的基因组整合而无需抗生素选择。通过实验室的演变,获得了七种不同的聚球藻PCC 7002突变菌株,其可以在作为唯一N源的三聚氰胺上生长。另外,使用ptxD 基因或其突变体和亚磷酸盐也被示为是此蓝细菌物种中有效的代谢选择标志物。用三聚氰胺和亚磷酸盐代谢途径转化的细胞能够分别使用作为N和 Pi源的三聚氰胺和亚磷酸盐生长,并且可以耐受并且轻易竞争过污染,即使在大量过量污染中。

三聚氰胺突变菌株均具有影响triA基因的突变,并且以Mel 1表示,具有Trp471stop突变;Mel4,具有Leu88Phe突变;Mel5,在核糖体结合位点(RBS)中具有AGGAGA至AGAAGA的突变;Mel6,具有Glu317Lys突变;Mel7,具有His254Tyr突变;Mel8,具有Ala355Val突变;以及Mel5evo,除了在RBS中具有与Mel5相同的AGGAGA至AGAAGA突变外,在triA 中具有Thr218Asn突变和Val278Met突变。

根据第一方面,本发明提供了一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、 trzE、DUR1,2、trzC、guaD和triA,其中;

i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),

其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。

根据另一方面,本发明提供了分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因,其中,所述ptxD 基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO: 91(NADP)所示的多核苷酸序列,

其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。

根据另一方面,本发明提供重组载体,所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD,其中

i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及254His和Val278Met的组合;

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),

其中,所述载体缺失抗生素抗性基因。

在一些实施方式中,重组载体进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。

根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:

a)根据本发明的任何方面,在无抗生素并且三聚氰胺为氮源的培养基中,培养多个基因工程蓝细菌细胞,所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺的蓝细菌细胞的生长,

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:

a)在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中,培养多个基因工程蓝细菌细胞,所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长;,

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

附图说明

图1示出了三聚氰胺选择工具的概述。(A)三聚氰胺利用途径反应。一 mol的三聚氰胺产生6mol的氨和3mol的二氧化碳。(B)三聚氰胺利用操纵子的示意图。所示引物用于证实该途径的全基因组整合。不同部分均不按比例(C)PCR反应的0.6%琼脂糖凝胶使用A中所示的引物进行。(参见表1 的序列)

图2示出了在包含三聚氰胺的培养基中利用三聚氰胺的菌株的生长。(A) 野生型(WT)Syn7002和利用三聚氰胺的菌株的生长曲线。(B)接种后48小时的培养物样品。对所有菌株计算了将OD

图3A-3B示出了如通过Illumina测序发现的在不同的利用三聚氰胺的菌株中,triA基因座的突变的示意图。Mel1在原始终止密码子之前具有4 个氨基酸的突变(图3A)。在不同的利用三聚氰胺的菌株中,triA基因座的多序列比对(图3B)。

图4示出了在指示的时间点在用过的培养基中三聚氰胺途径中间体 LC-MS/MS定量。(A)三聚氰胺;(B)三聚氰酸二酰胺;(C)三聚氰酸一酰胺; (D)氰尿酸。还包括接种在AD7-Mel培养基中的WT培养物的定量,作为对照。注意三聚氰胺(以mM)和其余中间体(以μM)的比例差异。由于比例,误差线可能不明显。

图5示出了在包含2mM或4mM三聚氰胺的AD7-Mel培养基中生长的Mel5菌株的生长曲线。

图6示出了利用亚磷酸盐的菌株在包含磷酸盐(Pho)和亚磷酸盐(Phi)的 AD7培养基中的生长。(A)WT Syn7002(左)和利用亚磷酸盐的菌株(右)在包含Pho或不同浓度Phi的AD7培养基中的生长曲线,如所示。(B)接种后 48小时的培养物样品的细节。可以在表2中找到将OD

图7示出了亚磷酸盐选择工具的概述。(A)顶部——pSJ135的细节,包括用于染色体整合PCR的引物。底部——构建体pSJ141的细节,其使用亚磷酸盐以驱动异源基因(YFP)的染色体整合。(B)PCR的0.8%琼脂糖凝胶,在WT和Mel5背景两者下均示出ptxD基因的基因组整合和YFP基因的 ptxD驱动整合。(C)用pSJ135和pSJ141转化的菌株相对于各自的背景菌株的YFP荧光。

图8A-8C示出了敲除Syn7002中推定的膦酸盐转运蛋白同源物 A0336(顶部)和G0143(底部)。(图8A)敲除构建体质粒pSJ156(顶部)和 pSJ157(底部)的示意图。各个元件未按比例。(图8B)用于A0935-ptxD推定的膦酸盐转运蛋白同源物敲除菌株的分离凝胶。(图8C)在AD7-Pho 1x(左) 或AD7-Phi 20x(右)中,A0935-ptxD亲本菌株和衍生的敲除菌株的稀释涂布。注意:ΔA–ΔA0336::SpR;ΔG–ΔG0143::GmR

图9示出利用三聚氰胺和亚磷酸盐的菌株的表征。(A)在常规AD7培养基或AD7-MelPhi 20x中的WT和Mel5-A0935ptxD(“MelPhi”)菌株的生长曲线。(B)接种后48小时的培养物样品的细节。对于在AD7-Mel Pho 1x 或AD7-Mel Phi 20x中的MelPhi菌株,计算了将OD

图10示出了WT、Mel5和Re-Mel5菌株在正常AD7-NO

图11示出了通过流式细胞术测量的以下生长曲线:在Syn7002 WT背景中表达YFP的菌株(“纯YFP”,在常规AD7中生长);MelPhi菌株(“纯 MelPhi”,缺失YFP,在AD7-Mel Phi20x中生长);或者在AD7-Mel Phi 20x 中,在YFP(在WT背景中)与MelPhi(缺失YFP)以10:1的细胞比率组合的两种菌株(“混合物YFP”和“混合物MelPhi”)的混合培养物。

图12示出了用于污染实验中细胞计数的门控策略。示出的数据是针对在T=100小时下,10:1混合培养实验之一。YFP和MelPhi纯培养物和混合培养物在点绘图上绘制的左门(顶部至底部);相同样品的中间直方图绘图;使用YFP与前向散射对相同样品进行的右点绘图,用于定量。SSC–侧向散射;FSC-前向散射

图13示出了Syn7002 WT和利用三聚氰胺和亚磷酸盐的菌株在具有硝酸盐(NO

图14示出了MelPhi菌株在AD7-Mel Phi 20x(2L的培养物总体积)中,在两个带挡板的1L锥形烧瓶中在11天的时间段内的生长曲线。

图15示出了MelPhi菌株(MelPhi WT)和MelPhi菌株的衍生物 (MelPhiAQ)的生长曲线,在其中,PtxD酶被突变为使用NADP+代替 NAD+(因为蓝细菌具有的NADP+比NAD+更多)。使用分批补料策略生长菌株,每天添加三聚氰胺(将600μL的20mM三聚氰胺储备液加入12mL 培养物中)以继续生长至更高密度。达到的最高密度为约70的OD

图16示出了在12mM三聚氰胺中Mel5菌株和进化的Mel5菌株(以“Mel5evo”表示)的生长曲线。Mel5菌株无法在12mM三聚氰胺中生长,但是Mel5evo菌株可以并且生长至约50的OD

为了方便起见,这里收集了说明书、实施例和所附权利要求书中应用的某些术语。

如本文所用,术语“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白质序列,或任何这些的片段,并且是指天然存在的或合成的分子。本文所述的“氨基酸序列”是指天然存在的蛋白质分子的氨基酸序列,“氨基酸序列”和类似术语并不意指将氨基酸序列限制为与所述蛋白质分子相关的完整的天然氨基酸序列。

如本文所用,术语“包括(comprising)”或“包括(including)”应解释为指定所指的所述特征、整数、步骤或组分的存在,但不排除一个或多个特征、整数、步骤或组分或其组的存在或增加。然而,在本公开的上下文中,术语“包括(comprising)”或“包括(including)”也包括“由……组成”。单词“包括(comprising)”,诸如“包括(comprise)”和“包括(comprises)”,以及“包括(including)”,诸如“包括(include)”和“包括(includes)”具有相应变化含义的变体。

如本文所用,将术语“基因突变”定义为其具有至少一个核苷酸序列从野生型序列经由以下变化的基因突变:可以增强基因活性或者可以导致编码蛋白质的氨基酸序列与野生型蛋白质相比相对更具活性的至少一个核苷酸的取代、缺失或添加。例如,可以突变至少一个天然或野生型三聚氰胺脱氨酶(triA)基因和/或其核糖体结合位点(RBS)AGGAGA以增加三聚氰胺代谢。

将术语“分离的”在本文定义为基本上从自然存在组分的生物体的细胞中的其他生物组分(即其他染色体和额外染色体DNA和RNA)和蛋白质分离、分开生产或纯化出的生物组分(诸如核酸、肽或蛋白质)。因此,已分离的核酸、肽和蛋白质包括通过标准纯化方法纯化的核酸和蛋白质。该术语还涵盖通过在宿主细胞中重组表达制备的核酸、肽和蛋白质,以及化学合成的核酸。

如本文所用,短语“核酸”或“核酸序列”是指寡核苷酸、核苷酸、多核苷酸或其任何片段,是指可以为单链或双链的并且可以表示正义链和反义链的基因组或合成来源DNA或RNA,是指肽核酸(PNA),或是指任何类似DNA或类似RNA的材料。

如本文所用,术语“可操作地连接”意指对其中应用术语的组分处于允许它们在适当条件下执行其固有功能的关系中。例如,将与蛋白质编码序列“可操作地连接”的控制序列连接到其上,使得在与控制序列的转录活性相容的条件下实现蛋白质编码序列的表达。借助于实例,当第一核酸序列与第二核酸序列处于功能关系时,第一核酸序列与第二核酸序列可操作地连接。例如,如果启动子影响编码序列的转录或表达,则启动子与编码序列可操作地连接。通常,可操作地连接的DNA序列是连续的,并且在需要结合两个蛋白质编码区的情况下,它们在同一阅读框中。

如本文所用,术语“突变体”意指以下的多核苷酸:可以编码保留活性的示例性催化酶的突变体,或可以具有突变,例如在其RBS中,其增强了催化酶生产。如本文所用,催化酶的“突变体”是指被一个或多个氨基酸改变的氨基酸序列。突变体可以具有“保守”变化,其中,取代的氨基酸具有相似的结构或化学特性(例如,用异亮氨酸替代亮氨酸)。更少见的是,突变体可以具有“非保守”变化(例如,用色氨酸替代甘氨酸)。类似的微小变化也可包括氨基酸缺失或插入,或两者。使用本领域众所周知的计算机程序,例如DNASTAR软件,可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不丧失催化活性的指导。在一些实施方式中,突变酶在氨基酸水平上为至少80%、85%、90%、95%、96%、97%、98%、99%或更高,优选至少90%同源或同一性,以示例性本文描述的氨基酸序列(例如,三聚氰胺脱氨酶)或其功能片段——例如,在约:50、55、60、65、70、75、 80、85、90、95或100%的长度上,优选成熟参考序列长度的至少90%,但仍保持催化活性。优选地,所述变体酶在氨基酸水平上具有至少90%的同一性并保持催化活性。示例性的三聚氰胺脱氨酶突变体在具有增加活性的His254Tyr取代的Mel7(SEQ ID NO:87)中表示为SEQ ID NO:64。254Tyr 可能被其他氨基酸替代(保守取代)并保留了活性。

载体可以以适于在宿主细胞中表达的一个或多个核酸的形式包括一个或多个催化酶核酸。优选地,重组表达载体包括与预表达的一个或多个核酸序列可操作地连接的一个或多个调控序列。术语“调控序列”包括启动子、增强子、核糖体结合位点和/或IRES元件和其他表达控制元件(例如,聚腺苷酸化信号)。调控序列包括指导核苷酸序列组成型表达的那些,诸如本文实例中公开的P

可以设计本发明的重组表达载体用于在原核或真核细胞中,更特别在原核细胞中,表达催化酶蛋白质。例如,本发明的多肽可以在细菌(例如,蓝细菌)或酵母细胞中表达。合适的宿主细胞在Goeddel,(1990)Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,Calif.中进一步讨论。

上文描述的方法利用酶催化反应的序列。尽管这些反应可以单独地,或者更特别地将它们中的两个或更多个组合进行,但是特别优选地将所有反应组合在级联反应序列中,该级联反应序列在一锅中提供来自初始原料的产物,从而消除了分离中间体的需要,并且潜在地提高了反应序列的总产率。

在本发明中,新型工程细菌不包含抗生素抗性基因,并且而是利用三聚氰胺和亚磷酸盐与污染物竞争。此外,本发明的工程细胞在triA基因中和/或在其RBS中包括突变,其改进了生物的生长,其中一些可以在12mM 的三聚氰胺中健壮生长。另外,亚磷酸盐代谢基因ptxD可以被突变以利用 NADP+代替NAD+。

具体实施方式

本说明书中提及的参考文献是为了方便起见以文献列表的形式列出的,并添加在实施例的末尾。这些参考文献的全部内容上下文通过援引并入本文,但其在说明书中的提及并不意味着它们构成一般通用常识的一部分。

根据第一方面,本发明提供了一种分离的基因工程蓝细菌,其中,所述蓝细菌已被至少一种多核苷酸分子转化,所述至少一种多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、 trzE、DUR1,2、trzC、guaD和triA,其中;

i)所述triA基因包括编码氨基酸取代的一个或多个突变,其中,所述氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),

其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。

在一些实施方式中,蓝细菌是聚球藻Syn7002。

在一些实施方式中,triA基因编码选自包括以下的组的氨基酸序列: SEQ ID NO:56(天然,Mel5)、SEQ ID NO:58(Mel1)、SEQ ID NO:60(Mel4)、 SEQ ID NO:62(Mel6)、SEQID NO:64(Mel7)、SEQ ID NO:66(Mel8)和SEQ ID NO:68(Mel5evo)。在一些实施方式中,triA基因多核苷酸序列具有与选自包括以下的组的triA基因的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性:SEQ ID NO:57、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ ID NO: 65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO:69(Mel5evo)和SEQ ID NO: 70(Mel5)。

应当理解,由于遗传密码中的冗余,核酸序列可以具有小于100%的同一性并且仍然编码相同的氨基酸序列。

在一些实施方式中,triA基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:57(天然)、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ IDNO:65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO: 69(Mel5evo)和SEQ ID NO:70(Mel5密码子opt)。

优选地,triA基因包括SEQ ID NO:69或SEQ ID NO:70中所示的多核苷酸序列。

在一些实施方式中,异源trzE基因包括与SEQ ID NO:71或72中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或 100%序列同一性的多核苷酸序列;trzC基因包括与SEQ ID NO:73或74中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列;DUR1,2基因包括与SEQ IDNO:75 或76中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列;atzD基因包括与SEQ ID NO:77或78中所示的多核苷酸序列至少80%、至少85%、至少90%、至少 95%序列同一性或100%序列同一性的多核苷酸序列;和/或guaD基因包括与SEQ ID NO:79、80或81(Arg352Ser)中所示的多核苷酸序列至少80%、至少85%、至少90%、至少95%序列同一性或100%序列同一性的多核苷酸序列。

在一些实施方式中,异源trzE基因包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列;trzC基因包括SEQ ID NO:73或74(密码子优化的)中所示的多核苷酸序列;DUR1,2基因包括SEQ ID NO:75或76(密码子优化的)中所示的多核苷酸序列;atzD基因包括SEQ ID NO:77或78(密码子优化的)中所示的多核苷酸序列;和/或guaD基因包括SEQID NO:79、 80(密码子优化的)或81(Arg352Ser)中所示的多核苷酸序列。

在一些实施方式中,atzD基因来自假单胞菌(Pseudomonas sp.)菌株 ADP、trzE基因来自红球菌(Rhodococcus sp.)Mel、DUR1,2基因来自酿酒酵母(S.cerevisiae)、trzC基因来自瓜类细菌性果斑病菌(A.citrulli)NRRL B-12227、guaD基因来自大肠杆菌K-12以及triA基因来自瓜类细菌性果斑病菌NRRL B-12227。

在一些实施方式中,所述三聚氰胺利用途径基因的每一个具有核糖体结合位点(RBS)。适合的RBS的实例具有多核苷酸序列AGGAGA。有利地,可以使用包括多核苷酸序列AGAAGA的突变体RBS。更特别地,该突变体RBS与triA基因连接。应当理解,IRES可能适合代替与atzD、trzE、 DUR1,2、trzC和guaD基因连接的一个或多个RBS。

在一些实施方式中,所述至少一个启动子是组成型启动子。应当理解,存在适合于驱动三聚氰胺途径基因表达的已知启动子,诸如P

在一些实施方式中,所述组成型启动子是P

在一些实施方式中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。

在一些实施方式中,基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83(Mel1菌株)、SEQ ID NO:84(Mel4菌株)、SEQ ID NO:85(Mel5 菌株)、SEQ ID NO:86(Mel6菌株)、SEQ ID NO:87(Mel7菌株)和SEQ ID NO: 88(Mel8菌株)。

在一些实施方式中,至少一个多核苷酸分子进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。结果示出,ptxD可以单独用于重组菌株的选择,无需抗生素选择。还可以将 ptxD基因与三聚氰胺途径基因(MelPhi菌株)组合使用,以更严格的选择方法来生产与缺失这些异源基因的污染细菌激烈竞争的菌株。而且,生成了允许工程菌株利用NADP+而不是NAD+的ptxD的突变体形式。

在一些实施方式中,ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO: 90(MelPhi)或SEQ ID NO:91(NADP)中所示的多核苷酸序列。

在一些实施方式中,与ptxD基因连接的启动子可以选自包括以下的组: P

在一些实施方式中,所述异源亚磷酸盐脱氢酶(ptxD)基因从单个启动子表达,作为基因操纵子的一部分,其中,所述操纵子多核苷酸序列在SEQ ID NO:93中示出。

在一些实施方式中,本发明的分离的基因工程蓝细菌进一步包括外源多核苷酸,该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。

根据另一方面,本发明提供了分离的基因工程蓝细菌,其中,该蓝细菌已被至少一个多核苷酸分子转化,至少一个多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因,其中,所述ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO:91(NADP) 中所示的多核苷酸序列,并且其中,所述基因工程蓝细菌不具有异源抗生素抗性基因。

优选地,ptxD基因包括SEQ ID NO:90或SEQ ID NO:91中所示的多核苷酸序列。

根据另一方面,本发明提供重组载体,所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD,其中

i)triA基因包括编码氨基酸取代的一个或多个突变,其中,该氨基酸取代位于选自包括以下的组的位置:Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合;

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS),

其中,所述载体缺失抗生素抗性基因。

在一些实施方式中,triA基因编码选自包括以下的组的氨基酸序列: SEQ ID NO:56(天然,Mel5)、SEQ ID NO:58(Mel1)、SEQ ID NO:60(Mel4)、 SEQ ID NO:62(Mel6)、SEQID NO:64(Mel7)、SEQ ID NO:66(Mel8)和SEQ ID NO:68(Mel5evo)。

在一些实施方式中,triA基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:57(天然)、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ IDNO:65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO: 69(Mel5evo)和SEQ ID NO:70(Mel5)。

在一些实施方式中,异源基因trzE包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列;trzC包括SEQ ID NO:73或74(密码子优化的) 中所示的多核苷酸序列;DUR1,2包括SEQ ID NO:75或76(密码子优化的) 中所示的多核苷酸序列;atzD包括SEQ IDNO:77或78(密码子优化的)中所示的多核苷酸序列;guaD包括SEQ ID NO:79、80(密码子优化的)或 81(Arg352Ser)中所示的多核苷酸序列。

在一些实施方式中,atzD基因来自假单胞菌菌株ADP、trzE基因来自红球菌Mel、DUR1,2基因来自酿酒酵母、trzC基因来自瓜类细菌性果斑病菌B-12227、guaD基因来自大肠杆菌以及triA基因来自瓜类细菌性果斑病菌B-12227。

在一些实施方式中,所述三聚氰胺利用途径基因的每一个具有核糖体结合位点(RBS)。适合的RBS的实例具有多核苷酸序列AGGAGA。有利地,可以使用包括多核苷酸序列AGAAGA的突变体RBS。更特别地,该突变体RBS与triA基因连接。应当理解,IRES可能适合代替与atzD、trzE、 DUR1,2、trzC和guaD基因连接的一个或多个RBS。

在一些实施方式中,所述至少一个启动子是组成型启动子。应当理解,存在适合于驱动三聚氰胺途径基因表达的已知启动子,诸如P

在一些实施方式中,所述组成型启动子是P

在一些实施方式中,所述异源三聚氰胺利用途径基因从单个启动子表达,作为基因操纵子的一部分。

在一些实施方式中,基因操纵子多核苷酸序列选自包括以下的组:SEQ ID NO:83(Mel1)、SEQ ID NO:84(Mel4)、SEQ ID NO:85(Mel5)、SEQ ID NO: 86(Mel6)、SEQ ID NO:87(Mel7)和SEQ ID NO:88(Mel8)。

在一些实施方式中,至少一个多核苷酸分子进一步包括多核苷酸,该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。

在一些实施方式中,ptxD基因包括选自包括以下的组的多核苷酸序列: SEQ IDNO:89(天然)、SEQ ID NO:90(MelPhi)和SEQ ID NO:91(NADP)。

在一些实施方式中,与ptxD基因连接的启动子选自包括以下的组:P

在一些实施方式中,重组载体进一步包括外源多核苷酸,该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。

根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:

a)根据本发明的任何方面,在无抗生素并且三聚氰胺为氮源的培养基中,培养多个基因工程蓝细菌细胞,该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺的细胞的生长;

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

根据另一方面,本发明提供在基因工程蓝细菌细胞中表达产物的方法,包括步骤:

a)根据本发明的任何方面,在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中,培养多个基因工程蓝细菌细胞,该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和 /或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸,其中,培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长,

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

在一些实施方式中,所述表达产物能够将底物转化为其他产物。所述产物可以是,例如是可以催化培养物中的底物转化为其他产物的酶。例如,所述表达的产物可以是酶,诸如金合欢烯合酶,其可以将CO

在一些实施方式中,培养基包括在以下浓度的三聚氰胺:至少1mM、至少2mM、至少4mM、至少6mM、至少8mM、至少10mM、至少12mM、至少14Mm或至少16mM。在一些实施方式中,培养基中三聚氰胺的浓度选自约2mM至约12mM范围内的浓度。

在一些实施方式中,该方法进一步包括分离在基因工程蓝细菌细胞中表达的所述产物。

现在已经大体上描述了本发明,通过参考以下借助于说明而提供以下实施例,将更容易理解本发明,并且不旨在限制本发明。

实施例

实施例1:方法

如Green and Sambrook and Russel,Molecular Cloning:A LaboratoryManual,Cold Springs Harbor Laboratory,New York(2012)中描述的,通常按照本领域已知且未具体描述的标准分子生物学技术。

聚球藻PCC 7002(来自美国宾夕法尼亚州立大学(Penn State University) 的Donald Bryant教授的一种馈赠)在使用D7微量营养元素[Arnon等人, Biochim BiophysActa.357:231-45(1974)],按指示补充有12mM硝酸钠(AD7-NO

对于生长实验,在50μmol光子m

使用超感受态大肠杆菌细胞(Stellar,TaKaRa)构建所有相关质粒,并且于37℃,在补充有50μg·mL

三聚氰胺生长菌株

除非另有说明,否则使用Q5 DNA聚合酶(New England Biolabs,NEB) 进行所有的PCR反应,以及PCR产物通常用DpnI消化过夜,并且在组装 DNA之前使用EZ-10旋转柱PCR产物纯化试剂盒(BioBasic)进行纯化。使用引物D08807和D08808(参见表1)从Syn7002基因组DNA(gDNA)中PCR 扩增了包括glpK中性基因组整合位点的DNA片段[Begemann等人,PLoSOne.8:e76594.10.1371/journal.pone.0076594(2013)],侧翼为500-bp的上游和下游区。

表1:使用的引物列表

按照制造商的说明,将纯化的PCR产物连接至pCR-Blunt II TOPO (Invitrogen)中,并转化为至化学感受态Stellar大肠杆菌细胞中,从而产生质粒pCRBlunt-glpK(通过使用通用M13引物的Sanger测序证实正确的组装)。使用引物D98496993和D77036,反向PCR扩增pCRBlunt-glpK主链,并且使用引物D98847023和D98847024(上半部分)以及D98847025和D98847026(下半部分),从合成构建体(GenScript,香港,Ltd.)中将三聚氰胺操纵子扩增为两等份。按照制造商的说明,使用NEBuilder HiFi DNA Assembly Master Mix(NEB)将两个片段组装至pCRBlunt-glpK。将1μL的组装混合物转化至Stellar大肠杆菌超感受态细胞中,得到质粒pSJ051。使用表1中所示的引物Mel_seq_1至Mel_seq_14、D99280067和D99280068,通过Sanger测序证实了三聚氰胺操纵子的正确组装。如先前所描述的 [Frigaard等人,Methods Mol Biol.274:325-40(2004)]通过双重同源重组转化 Syn7002 WT,具有修饰。简而言之,如上文描述,在0.5的OD

利用亚磷酸盐和利用三聚氰胺/亚磷酸盐组合的菌株

将在ORF A0935和A0936之间的中性基因组整合位点的上游500bp至下游500bp的区[Davies等人,Frontiers in bioengineering and biotechnology. 2:21.10.3389/fbioe.2014.00021(2014)]使用引物D100023580和D100023581 从Syn7002 gDNA进行PCR扩增。用XbaI(NEB)消化pUC19(Invitrogen),并使用EZ-10旋转柱DNA凝胶提取试剂盒(BioBasic)从琼脂糖凝胶带中纯化。根据制造商的说明,使用pEASY-Uni无缝克隆和组装试剂盒(TransGen Biotech Co.,Ltd,中国)将A0935-A0936位点组装至消化的pUC19主链中,并转化至Stellar大肠杆菌细胞中,从而获得质粒pSZT001。将引物对 A0935_UCO_F和A0936_UCO_R用于反向PCR扩增pSZT001主链,并且对D98496996和D100141467用于扩增施氏假单胞菌(Pseudomonas stutzeri)WM88亚磷酸盐脱氢酶(ptxD)基因[Loera-Quezada等人,Plant Biotechnol J.14:2066(2016)]的合成的、密码子优化型(SEQ ID NO:90)(由GenScript,香港,Ltd),由绿穗苋(Amaranthus hybridus)组成型psbA启动子 (SEQ ID NO:92)驱动[Elhai and Wolk,Gene.68:119-138(1988)]。如上文描述,使用pEASY-Uni试剂盒组装两个片段,得到质粒pSJ135。如上文描述,将2μg的该质粒用于转化Syn7002 WT以及Mel5菌株,不同的是,在转化之前将培养物离心并用缺少磷酸盐的AD7培养基(AD7-NO

为了进一步测试亚磷酸盐作为选择标志物的用途,在强组成型P

敲除推定的膦酸盐转运蛋白

通过使用 CyanoBase(http://genomedotmicrobedbdotjp/blast/blast_search/cyanobase/gene s)内的BlastP工具鉴定了推定的膦酸盐转运蛋白基因,将搜索限制在Syn7002上,并将来自原绿球藻(Prochlorococcus marinus sp.)MIT9301[Bisson等人,NatCommun.8:1746.10.1038/s41467-017-01226-8 (2017);Feingersch等人,ISME J.6:827-34(2012)]的PhnD的氨基酸序列作为搜索模板使用。在Syn7002:A0336(E值=1e

黄色荧光蛋白(YFP)荧光测量

对于以下测定全细胞YFP荧光:一式三份的培养物(每份15mL)在常规 AD7培养基中生长至OD

基因组测序

通过使用Quick-DNA真菌/细菌试剂盒(Zymo Research),从WT菌株以及不同的利用三聚氰胺的菌株两者中制备基因组DNA。文库制备是根据 Illumina的TruSeq纳米DNA样品制备方案进行的。按照制造商的建议,将样品在Covaris E220上剪切至~550bp,并用Illumina的TruSeq LT DNA条形码之一进行唯一标记,以使样品合并以用于测序。使用Promega的 QuantiFluor dsDNA测定法对完成的文库进行定量,并在Agilent Tapestation4200上确定平均文库大小。然后使用用于Illumina平台的Kapa文库定量试剂盒(KapaBiosystems),将文库浓度归一化至4nM,并且通过在QuantStudio-3实时PCR系统(AppliedBiosystems)上qPCR进行验证。然后将文库以等摩尔浓度合并,并在Illumina MiSeq平台上以300bp配对末端的阅读长度进行测序。使用Geneious 11.1.4软件(Biomatters Ltd.)组装并比较基因组。

核糖体结合位点(RBS)点突变测试

为了评估Mel5中RBS变化的影响,通过反向PCR[Liu and Naismith, BMCBiotechnol.8:91.10.1186/1472-6750-8-91(2008)],使用Q5 DNA聚合酶 (NEB),使用引物D101108989和D101108990,将原始的pSJ051质粒在triA 上游的RBS处突变(从AG

共培养竞争实验和流式细胞术

通过在AD7-NO

使用LC-MS/MS鉴定三聚氰胺途径中间体

生长48小时后收集Syn7002和利用三聚氰胺的菌株培养物,并离心(14000g,5min,室温)。将上清液通过0.2μm注射器过滤器(带有Supor膜的Acrodisc过滤器,PALL)过滤,并在-80℃冷冻直至进一步使用。在NTU Phenomics Centre使用先前描述的方法[Braekevelt等人,Food Addit Contam Part A Chem Anal Control Expo Risk Assess.28:698-704(2011)],,通过 LC-MS/MS对三聚氰胺、三聚氰酸二酰胺(ammeline)、三聚氰酸一酰胺(ammelide)和氰尿酸进行定量。

实施例2

三聚氰胺降解途径的引入要求进化适应性以有效利用

在此研究中利用的三聚氰胺降解途径是基于Shaw及其同事报道的最优途径(基因triA、guaD、trzC、atzD、trzE和DUR1,2,包括在guaD基因产物中描述的R352S突变)[Shaw等人,Science.353:583-6(2016)](图1)。在我们的情况下,我们使用了密码子优化的基因(triA,SEQ ID NO:70;guaD, SEQ ID NO:80;trzC,SEQ ID NO:74;atzD,SEQ ID NO:78;trzE SEQ ID NO:72;和DUR1,2,SEQ ID NO:76),合成的强蓝细菌启动子P

比较了不同的Mel菌株和WT Syn 7002在AD7-Mel培养基(包含2mM 三聚氰胺)或常规AD7培养基(包含硝酸盐)中的生长。如在图2A和B中看出,与亲本Syn7002 Wt菌株不同,不同的单独菌株能够在作为唯一的氮源的三聚氰胺上生长,尽管速率不同。特别是两个菌株,Mel5和Mel7,可以在AD7-Mel中的生长几乎与Syn7002 WT在AD7-NO

为了进一步了解这些不同表型背后的原因,我们对所有三聚氰胺生长菌株(Mel1、Mel4、Mel5、Mel6、Mel7和Mel8)的以及本实验中使用的Syn7002 WT(获得自美国宾夕法尼亚州立大学Donald Bryant教授的实验室)的基因组进行了测序。比较序列确定了三聚氰胺操纵子中的几个突变,它们全部位于triA(编码三聚氰胺脱氨酶)基因之前的RBS中或triA基因本身的内部(图 3A)。triA氨基酸序列中的突变位于以下的位置:Leu88Phe(Mel4)、His254Tyr (Mel7)、Glu317Lys(Mel6)、Ala355Val(Mel8)和Trp471stop(Mel1)。Mel5具有在RBS中的突变(从AGGAGA至AGAAGA)(图3B)。由于这是三聚氰胺降解途径的第一步,影响triA或其RBS的突变将调控通过该途径其余部分的代谢通量。

为了进一步阐明不同菌株中三聚氰胺途径代谢通量中发生的变化,使用LC-MS/MS定量从三聚氰胺到氰尿酸排入生长培养基的途径中间体(图 4)。在生长的最初24小时内,Mel5和Mel7两者中,三聚氰胺被非常快速地消耗,同时发现,在同一时间范围内,三聚氰酸二酰胺(三聚氰胺之后的第一个中间体)在Mel5和Mel7中的积累(Mel5为86.2±1.6μM以及Mel7 为57.2±1.5μM)比其余菌株中的(≤25μM)显著更多。仅以非常低的水平定量三聚氰酸一酰胺(第三中间体)(24小时后在Mel5生长培养基中检测到<4 μM),而氰尿酸在Mel5中以207.5±16.3μM的浓度以及在Mel 7中以134.5 ±8.8μM的浓度快速积累(图4A-D)。在最初的文章中也报道了氰尿酸大量排入培养基中,该文章涉及在添加的三聚氰胺为13%的初始(摩尔)量的水平下,将三聚氰胺降解途径引入至大肠杆菌中[Shaw等人,Science.353:583-6 (2016)],惊人地类似于24小时后在Mel5菌株中观察到的9.7%的值。存在于其余菌株中的突变很可能没有赋予与Mel5和Mel7发现那些突变一样的强大的优势,导致在正常光照条件下观察到的低细胞内氮水平和较慢的生长速率(图2)。应当注意的是,在弱光下生长的预培养物受到的影响要小得多,这可能是由于在这些条件下总体代谢速率下降(数据未示出)。

Mel5在2mM和4mM三聚氰胺中生长,并且比较了生长速率。图5 示出,约72小时后,4mM三聚氰胺可使Mel5维持比2mM三聚氰胺更高的OD。

最后,将RBS序列在原始pSJ051中的triA基因上游突变,以匹配在 Mel5中发现的突变。当直接涂布于AD7-Mel板上(以及通过涂布于AD7-Cya 板上)时,使用这种修饰的构建体获得菌落。将新获得的菌株(名为“Re-Mel5”) 的生长与Mel5进行了比较,并且当在以三聚氰胺作为唯一氮源中生长时,在48小时后,发现Re-Mel5达到了类似的OD

实施例3

可以将亚磷酸盐和PtxD用作聚球藻PCC7002中有效的选择系统

尽管亚磷酸盐(Phi)先前示出能够维持集胞藻(Synechocystis sp.)PCC 6803[Polyviou等人,Environmental microbiology reports.7:824-30(2015)]和聚球藻PCC7942[Motomura等人,ACS Synth Biol.10:1021(2018)]两者的修饰菌株的生长,在这两者的情况下,基因操作(包含ptxD以及特定的Phi转运蛋白的操纵子的整合)均由抗生素选择压力驱动。同时,两种菌株(野生型集胞藻PCC 6803或野生型聚球藻PCC 7942)似乎都无法在不包括特定转运蛋白下摄取Phi,因此使构建体过大而无法具有作为选择标志物的实际用途。由于文献中不存在关于Syn7002在作为唯一P源的Phi上生长的能力的数据,因此使用不同浓度的Phi测试了WT菌株的生长(图6A,左图片)。尽管在最初的24-36小时内有一些生长,但是在此时间段之后没有发生可观察到的生长,这可能是由于内部磷酸盐储备的全部消耗——蓝细菌将磷作为多磷酸盐颗粒存储在细胞质中,并且具有动态流通机制,允许它们在需要时采用这些储备[Gomez-Garcia等人,Journal of bacteriology.195,3309(2013)]。

在中性位点A0935中,并且没有其他可选择标志物,用包含施氏假单胞菌WM88亚磷酸盐脱氢酶基因(密码子优化的;SEQ ID NO:90)的构建体 (pSJ135)转化的Syn7002 WT(图7A,上)涂布于具有Phi(0.37mM,1x)作为唯一磷源的AD7板上。这种转化产生了数百个菌落,并且尽管转化体 (A0935-ptxD)具有淡微黄色,是磷酸盐缺乏细胞的特征,但这种浓度的Phi 足以诱导转化菌株的全染色体分离(图7B),因此验证了ptxD基因和亚磷酸盐作为Syn7002中有效的选择策略。

考虑到单独的ptxD基因足以使菌株A0935-ptxD在Phi上生长,其似乎与相关(淡水)菌株集胞藻PCC6803和聚球藻PCC7942不同,Syn7002能够通过迄今未定义的转运蛋白从生长培养基中输入Phi。

为了测试更高的浓度梯度是否足以增强向细胞内的转运并允许其在 Phi上更快地生长,在具有Phi浓度增加(0.37mM至7.4mM)的AD7中测试了A0935-ptxD的生长。如图6A(右侧)可以看出,测试的最高Phi浓度(Phi 20x, 7.4mM)使该菌株达到接近Pho生长细胞的生长速率。同时,克干细胞重量 (gDCW)与OD

表2:每种测试菌株的OD

备注:图是使用生物一式三份样品测定干重量的平均和标准偏差。

已知表达相同的ptxD基因的转基因拟南芥(Arabidopsis thaliana)植物 (使用草丁膦(phosphinothricin)选择)能够使用Phi作为唯一的磷源来生长[Lopez-Arredondoand Herrera-Estrella,Nat Biotechnol.30:889(2012)]。虽然尚不清楚由植物根部摄取Phi的具体转运蛋白,但似乎不需要额外的Phi 转运蛋白基因,Syn7002就是这种情况。然而,与拟南芥不同,Syn7002中 Phi的吸收效率要低得多。如先前的研究示出,几种海洋蓝细菌能够摄取并利用Phi作为磷源[Feingersch等人,ISME J.6:827-34(2012);Martinez等人, Environ Microbiol.14:1363(2012);Polyviou等人,Environmental microbiologyreports.7:824-30(2015)]我们在Syn7002基因组中搜索了推定的转运蛋白基因,诸如ptxB和phnD同源物[Bisson等人,Nat Commun.8: 1746.10.1038/s41467-017-01226-8(2017)]。虽然未找到ptxB同源物,但环状染色体(A0336)或pAQ7质粒(G0143)中存在两个推定的phnD基因A0336和 G0143(数据未示出)。我们假设这两个基因中的任何一个都可能涉及亚磷酸盐向细胞的输入,因为phnD同源物也示出与亚磷酸盐结合[Bisson等人,Nat Commun.8:1746.10.1038/s41467-017-01226-8(2017)]。然而,单独或组合敲除这些推定的膦酸盐转运蛋白并不能阻止ptxD亲本菌株在亚磷酸盐上生长 (图8A-8C)。

为了研究这种选择方法是否足以允许其他基因的共整合,设计了第二种构建体,其中将yfp基因整合至同一基因座的染色体中,使用ptxD作为选择标志物,并且Phi作为阳性选择。在图7B和7C中可以看出,使用该方法成功地共整合了yfp基因,并且可以在阳性转化体中测量YFP荧光。因此,该方法可用于选择在Syn7002中整合和表达异源基因。

实施例4

构建能够在三聚氰胺和亚磷酸盐两者上生长的菌株

上文的实施例证明了Syn7002中两种独立的无抗生素选择方法。通过双重选择产生的菌株可能对污染生物更为强健。因此,Mel5,最佳三聚氰胺生长菌株之一,是用pSJ135(单独的ptxD基因;SEQ ID NO:93)或 pSJ141(ptxD和yfp)转化,并在AD7-Mel 1xPhi板上选择阳性转化体。与 Syn7002 WT背景的情况一样,通过这种选择方法(图7B)可以轻松获得阳性转化体,并在完全分离的表达YFP的转化体中测量YFP荧光(图7C)。与在常规AD7中生长的MelPhi或Syn7002 WT亲本菌株相比,菌株 Mel5-A0935ptxD(“MelPhi”)能够在AD7-Mel Phi20x液体培养基中生长,尽管速率稍较慢(图9A)。如预测的,Syn7002 WT不能在AD7-Mel Phi20x 培养基中生长(图9A)。这示出了在同一基底中使用三聚氰胺和Phi两者进行双重选择是可能的。图13示出了Syn7002、Mel5、A0935ptxD和MelPhi 菌株在包括各种培养基的板上的生长。

实施例5

菌株Mel5-A0935ptxD能够抵抗蓄意的污染

本发明涉及适合于在开放系统中室外培养的蓝细菌菌株。在这些条件下,该菌株应能够竞争过其他菌株,以成为在潜在受污染系统中的优势种群。为了确定获得菌株的强健性,设计了实验,其中蓄意将用于 Mel5-A0935ptxD(在AD7-Mel Phi 20x中)的起始培养物大量过量污染,组成型表达YFP(来自P

实施例6

菌株Mel5-A0935ptxD的生长可扩展性

通过在生长室中于AD7-Mel Phi 20x培养基中的2x 1L带挡板的锥形烧瓶(2L的总体积)中生长11天,测试了Mel5-A0935ptxD在较大规模培养物中生长的能力。细菌在开始的24小时内生长非常快,并且逐渐减少到约 10的OD(图14)。生长速率减慢的解释是,稀释的培养物在开始的24小时内允许更多的光照,并且随着培养物变得更加浑浊而在该阶段之后变得基本上受光照限制,因此生长更慢。

实施例7

构建能够利用NADP+代替NAD+的MelPhi菌株

由于蓝细菌具有比NAD+更多的NADP+,生成了MelPhi菌株的新衍生物,其中PtxD酶(密码子优化的;SEQ ID NO:90)突变,使用NADP+ 代替NAD+,具有的突变基因的多核苷酸序列在SEQ ID NO:91中示出。使用引物RF_ptxD_F(SEQ ID NO:95)和RF_ptxD_R(SEQ ID NO:96),使用 pSJ135作为模板,Phusion聚合酶(NEB)和如van den Ent,等人,J BiochemBiophys Methods,67:67-74(2006)中描述的RF克隆方法,对ptxD基因的序列突变,得到质粒pSJ165。ptxD基因中的突变(Glu175Ala和Ala176Arg)模拟了Woodyer,R.等人,FEBS J.,272:3816-27(2005)中描述的那些突变,先前示出增加PtxD对NADP+的特异性。如上文描述,用pSJ165转化Mel5。将ptxD突变体菌株以MelPhiAQ表示,并且将其生长与使用分批补料策略的MelPhi进行比较,每天添加三聚氰胺以继续生长至更高的密度。图15 示出了两种菌株的生长相似,并且达到的最高密度为约70的OD

实施例8

可以在高浓度三聚氰胺中生长的Mel5菌株的进化

Mel5菌株在包括2mM三聚氰胺的培养基中进化,并且可以在4mM 三聚氰胺中生长(图5)。可以在更高浓度的三聚氰胺中生长的菌株可能甚至更抵抗污染,因此Mel5菌株在12mM的三聚氰胺上进一步进化。将Mel5 培养物涂布于包含12mM三聚氰胺代替常规2mM的AD7-Mel板上,并如上文描述进行培养。大约2周后,将出现的菌落在相同条件下,在具有12mM 三聚氰胺的AD7-Mel板中重新划线进一步的4次。在划线的最初12个菌落中,将3个看似更强健的生长菌株(在板上)培养在具有12mM三聚氰胺作为氮源的AD7液体培养基中。将最强健的菌株即由此生成的新进化的Mel5 菌株(“Mel5evo”)的生长与Mel5进行比较。如图16中示出,原始菌株不能在12mM三聚氰胺中生长,但进化后的菌株生长至相当高的OD

总结

本发明工程菌株的重要考虑是,在当前价格和本研究中使用的浓度下,三聚氰胺将是比硝酸盐更经济的氮源,使用三聚氰胺时成本降低24%(参见表3)。

表3:硝酸盐、三聚氰胺、磷酸盐和亚磷酸盐的成本估算

备注:基于来自Alibaba.com网站上的数据(2019年3月25日访问),数值为最低价格。

而且,由于三聚氰胺不用作农业肥料,将其用作氮源将消除农业中使用的富氮肥料的竞争。此外,随着三聚氰胺水平在生长24小时内降至使用 LC-MS/MS检测水平以下,最终培养物上清液中残留的三聚氰胺不会成为采用该技术的阻碍因素。

亚磷酸盐的额外选择使菌株具有“双刃剑”,尤其是在培养物的早期阶段,污染物种更难以克服,从而使携带这两种修饰的菌株成为优势种群,而无需灭菌或添加抗生素。此外,该策略消除了水平基因转移抗生素抗性盒的风险[Ventola,P T.40:277-83(2015a);Ventola,P T.40:344-52(2015b); von Wintersdorff等人,Frontiers inmicrobiology.7:10.3389/fmicb.2016.00173 (2016)]。

本文的结果表明,TriA突变调控通过三聚氰胺途径的通量,使得其更有效地被使用。Mel5evo菌株无需在线进料设备等(比分批培养更加昂贵)即可使分批培养达到高密度。MelPhiAQ菌株生长良好,并且可以提高需要更高NADPH浓度的生物分子的产量(因为使用突变的PtxD酶将亚磷酸盐转化为磷酸盐会将NADP+转化为NADPH,从而增加其内部浓度)。

本发明的菌株为高密度培养提供了两种不同的策略。第一种策略是使用Mel5和相关的工程蓝细菌菌株进行分批补料。第二种策略是使用 Mel5evo蓝细菌菌株以高浓度的三聚氰胺(最高至少12mM)进行分批培养。

总之,这项工作首次描述了能够在高达12mM的三聚氰胺作为唯一氮源上生长的海洋蓝细菌菌株,将亚磷酸盐选择作为可以利用NADP+代替NAD+的蓝细菌和亚磷酸盐代谢菌株中有效选择策略的用途。最后,我们开发了独特的菌株,其能够使用三聚氰胺和亚磷酸盐两者分别作为唯一的N 和P源。即使当污染大量过量存在时,该菌株也能够抵抗由其他蓝细菌的蓄意污染,并且对于“绿色”生物技术应用而言,该菌株应证明是有用的基底菌株。

文献

Angermayr,S.A.,Paszota,M.,Hellingwerf,K.J.,2012.Engineering acyanobacterial cell factory for production of lactic acid.Applied andenvironmental microbiology.78,7098-106.10.1128/AEM.01587-12.

Arnon,D.I.,McSwain,B.D.,Tsujimoto,H.Y.,Wada,K.,1974. Photochemicalactivity and components of membrane preparations from blue-greenalgae.I.Coexistence of two photosystems in relation to chlorophyll a andremoval of phycocyanin.Biochim Biophys Acta.357,231-45.

Begemann,M.B.,Zess,E.K.,Walters,E.M.,Schmitt,E.F.,Markley,A. L.,Pfleger,B.F.,2013.An organic acid based counter selection system forcyanobacteria.PLoS One.8,e76594.10.1371/journal.pone.0076594.

Bisson,C.,Adams,N.B.P.,Stevenson,B.,Brindley,A.A.,Polyviou,D., Bibby,T.S.,Baker,P.J.,Hunter,C.N.,Hitchcock,A.,2017.The molecular basis ofphosphite and hypophosphite recognition by ABC-transporters.Nat Commun.8,1746.10.1038/s41467-017-01226-8.

Braekevelt,E.,Lau,B.P.,Feng,S.,Menard,C.,Tittlemier,S.A.,2011.Determination of melamine,ammeline,ammelide and cyanuric acid in infantformula purchased in Canada by liquid chromatography-tandem massspectrometry.Food Addit Contam Part A Chem Anal Control Expo Risk Assess. 28,698-704.10.1080/19440049.2010.545442.

Choi,S.Y.,Wang,J.Y.,Kwak,H.S.,Lee,S.M.,Um,Y.,Kim,Y.,Sim,S. J.,Choi,J.I.,Woo,H.M.,2017.Improvement of squalene production from CO

Clark,R.L.,McGinley,L.L.,Purdy,H.M.,Korosh,T.C.,Reed,J.L., Root,T.W.,Pfleger,B.F.,2018.Light-optimized growth of cyanobacterial cultures:Growthphases and productivity of biomass and secreted molecules in light-limitedbatch growth.Metab Eng.47, 230-242.10.1016/j.ymben.2018.03.017.

Collier,J.L.,Grossman,A.R.,1992.Chlorosis induced by nutrientdeprivation in Synechococcus sp.strain PCC 7942:not all bleaching is thesame. Journal of bacteriology.174,4718-26.

Davies,F.K.,Work,V.H.,Beliaev,A.S.,Posewitz,M.C.,2014. Engineeringlimonene and bisabolene production in wild type and a glycogen-deficientmutant of Synechococcus sp.PCC 7002.Frontiers in bioengineering andbiotechnology.2,21.10.3389/fbioe.2014.00021.

Dexter,J.,Armshaw,P.,Sheahan,C.,Pembroke,J.T.,2015.The state ofautotrophic ethanol production in Cyanobacteria.J Appl Microbiol.119, 11-24.10.1111/jam.12821.

Elhai,J.,Wolk,C.P.,1988.A versatile class of positive-selectionvectors based on the nonviability of palindrome-containing plasmids thatallows cloning into long polylinkers.Gene.68,119-138.Doi 10.1016/0378-1119(88)90605-1.

Englund,E.,Pattanaik,B.,Ubhayasekera,S.J.,Stensjo,K.,Bergquist,J.,Lindberg,P.,2014.Production of squalene in Synechocystis sp.PCC 6803. PLoSOne.9,e90270.10.1371/journal.pone.0090270.

Fathima,A.M.,Chuang,D.,Lavina,W.A.,Liao,J.,Putri,S.P.,Fukusaki, E.,2018.Iterative cycle of widely targeted metabolic profiling for theimprovement of 1-butanol titer and productivity in Synechococcus elongatus.Biotechnol Biofuels.11,188.10.1186/s13068-018-1187-8.

Feingersch,R.,Philosof,A.,Mejuch,T.,Glaser,F.,Alalouf,O.,Shoham,Y.,Beja,O.,2012.Potential for phosphite and phosphonate utilization byProchlorococcus.ISME J.6,827-34.10.1038/ismej.2011.149.

Frigaard,N.U.,Sakuragi,Y.,Bryant,D.A.,2004.Gene inactivation in thecyanobacterium Synechococcus sp.PCC 7002 and the green sulfur bacteriumChlorobium tepidum using in vitro-made DNA constructs and naturaltransformation.Methods Mol Biol.274,325-40.10.1385/1-59259-799-8:325.

Gomez-Garcia,M.R.,Fazeli,F.,Grote,A.,Grossman,A.R.,Bhaya,D.,2013.Role of polyphosphate in thermophilic Synechococcus sp.from microbialmats.Journal of bacteriology.195,3309-19.10.1128/JB.00207-13.

Gordon,G.C.,Korosh,T.C.,Cameron,J.C.,Markley,A.L.,Begemann, M.B.,Pfleger,B.F.,2016.CRISPR interference as a titratable,trans-acting regulatorytool for metabolic engineering in the cyanobacterium Synechococcus sp.strainPCC 7002.Metab Eng.38,170-179.10.1016/j.ymben.2016.07.007.

Halfmann,C.,Gu,L.,Gibbons,W.,Zhou,R.,2014.Genetically engineeringcyanobacteria to convert CO

Hirota,R.,Abe,K.,Katsuura,Z.I.,Noguchi,R.,Moribe,S.,Motomura,K.,Ishida,T.,Alexandrov,M.,Funabashi,H.,Ikeda,T.,Kuroda,A.,2017.A novelbiocontainment strategy makes bacterial growth and survival dependent onphosphite.Sci Rep.7,44748.10.1038/srep44748.

Kanda,K.,Ishida,T.,Hirota,R.,Ono,S.,Motomura,K.,Ikeda,T., Kitamura,K.,Kuroda,A.,2014.Application of a phosphite dehydrogenase gene as a noveldominant selection marker for yeasts.J Biotechnol.182, 68-73.10.1016/j.jbiotec.2014.04.012.

Kato,A.,Takatani,N.,Ikeda,K.,Maeda,S.I.,Omata,T.,2017.Removal of theproduct from the culture medium strongly enhances free fatty acid productionby genetically engineered Synechococcus elongatus.Biotechnol Biofuels.10,141.10.1186/s13068-017-0831-z.

Liu,H.,Naismith,J.H.,2008.An efficient one-step site-directeddeletion, insertion,single and multiple-site plasmid mutagenesis protocol.BMCBiotechnol.8,91.10.1186/1472-6750-8-91.

Loera-Quezada,M.M.,Leyva-Gonzalez,M.A.,Velazquez-Juarez,G., Sanchez-Calderon,L.,Do Nascimento,M.,Lopez-Arredondo,D., Herrera-Estrella,L.,2016.Anovel genetic engineering platform for the effective management of biologicalcontaminants for the production of microalgae.Plant Biotechnol J.14,2066-76.10.1111/pbi.12564.

Lopez-Arredondo,D.L.,Herrera-Estrella,L.,2012.Engineering phosphorusmetabolism in plants to produce a dual fertilization and weed controlsystem.Nat Biotechnol.30,889-93.10.1038/nbt.2346.

Ludwig,M.,Bryant,D.A.,2011.Transcription profiling of the modelcyanobacterium Synechococcus sp.strain PCC 7002 by next-gen(SOLiD) sequencingof cDNA.Frontiers in microbiology.2,41.

Ludwig,M.,Bryant,D.A.,2012.Synechococcus sp.strain PCC 7002transcriptome:acclimation to temperature,salinity,oxidative stress,andmixotrophic growth conditions.Frontiers in microbiology.3,354.

Markley,A.L.,Begemann,M.B.,Clarke,R.E.,Gordon,G.C.,Pfleger,B. F.,2015.Synthetic biology toolbox for controlling gene expression in thecyanobacterium Synechococcus sp.strain PCC 7002.ACS Synth Biol.4, 595-603.10.1021/sb500260k.

Martinez,A.,Osburne,M.S.,Sharma,A.K.,DeLong,E.F.,Chisholm,S. W.,2012.Phosphite utilization by the marine picocyanobacterium ProchlorococcusMIT9301.Environ Microbiol.14, 1363-77.10.1111/j.1462-2920.2011.02612.x.

Motomura,K.,Sano,K.,Watanabe,S.,Kanbara,A.,Gamal Nasser,A.H., Ikeda,T.,Ishida,T.,Funabashi,H.,Kuroda,A.,Hirota,R.,2018.Synthetic phosphorusmetabolic pathway for biosafety and contamination management ofcyanobacterial cultivation.ACS Synth Biol.10.1021/acssynbio.8b00199.

Nahampun,H.N.,Lopez-Arredondo,D.,Xu,X.,Herrera-Estrella,L., Wang,K.,2016.Assessment of ptxD gene as an alternative selectable marker forAgrobacterium-mediated maize transformation.Plant Cell Rep.35, 1121-1132.10.1007/s00299-016-1942-x.

Pandeya,D.,Campbell,L.M.,Nunes,E.,Lopez-Arredondo,D.L.,Janga, M.R.,Herrera-Estrella,L.,Rathore,K.S.,2017.ptxD gene in combination with phosphiteserves as a highly effective selection system to generate transgenic cotton(Gossypium hirsutum L.).Plant Mol Biol.95, 567-577.10.1007/s11103-017-0670-0.

Perez,A.A.,Liu,Z.,Rodionov,D.A.,Li,Z.,Bryant,D.A.,2016.Complementation of cobalamin auxotrophy in Synechococcus sp.strain PCC 7002and validation of a putative cobalamin riboswitch in vivo.Journal ofbacteriology.10.1128/JB.00475-16.

Polyviou,D.,Hitchcock,A.,Baylay,A.J.,Moore,C.M.,Bibby,T.S.,2015.Phosphite utilization by the globally important marine diazotrophTrichodesmium.Environmental microbiology reports.7, 824-30.10.1111/1758-2229.12308.

Ruffing,A.M.,2014.Improved free fatty acid production incyanobacteria with Synechococcus sp.PCC 7002 as host.Frontiers inbioengineering and biotechnology.2,17.10.3389/fbioe.2014.00017.

Schoepp,N.G.,Stewart,R.L.,Sun,V.,Quigley,A.J.,Mendola,D., Mayfield,S.P.,Burkart,M.D.,2014.System and method for research-scale outdoorproduction of microalgae and cyanobacteria.Bioresour Technol.166, 273-81.10.1016/j.biortech.2014.05.046.

Shabestary,K.,Anfelt,J.,Ljungqvist,E.,Jahn,M.,Yao,L.,Hudson,E.P.,2018.Targeted repression of essential genes to arrest growth and increasecarbon partitioning and biofuel titers in cyanobacteria.ACS Synth Biol.7,1669-1675.10.1021/acssynbio.8b00056.

Shaw,A.J.,Lam,F.H.,Hamilton,M.,Consiglio,A.,MacEwen,K., Brevnova,E.E.,Greenhagen,E.,LaTouf,W.G.,South,C.R.,van Dijken,H., Stephanopoulos,G.,2016.Metabolic engineering of microbial competitive advantage for industrialfermentation processes.Science.353, 583-6.10.1126/science.aaf6159.

Stevens,S.E.,Patterson,C.O.,Myers,J.,1973.Production of hydrogenperoxide by blue-green algae-a survey.J Phycol.9,427-430

van den Ent,F.,and

Ventola,C.L.,2015a.The antibiotic resistance crisis:part 1:causes andthreats.P T.40,277-83.

Ventola,C.L.,2015b.The antibiotic resistance crisis:part 2:managementstrategies and new agents.P T.40,344-52.

von Wintersdorff,C.J.H.,Penders,J.,van Niekerk,J.M.,Mills,N.D.,Majumder,S.,van Alphen,L.B.,Savelkoul,P.H.M.,Wolffs,P.F.G.,2016.Dissemination of antimicrobial resistance in microbial ecosystems throughhorizontal gene transfer.Frontiers in microbiology. 7.10.3389/fmicb.2016.00173.

Wang,X.,Liu,W.,Xin,C.,Zheng,Y.,Cheng,Y.,Sun,S.,Li,R.,Zhu,X.G., Dai,S.Y.,Rentzepis,P.M.,Yuan,J.S.,2016.Enhanced limonene production incyanobacteria reveals photosynthesis limitations.Proceedings of the NationalAcademy of Sciences of the United States of America.113, 14225-14230.10.1073/pnas.1613340113.

Woodyer R.,Zhao H.,van der Donk WA.,2005.Mechanistic investigation ofa highly active phosphite dehydrogenase mutant and its application for NADPHregeneration.FEBS J.Aug;272(15):3816-27.

Xu,Y.,Alvey,R.M.,Byrne,P.O.,Graham,J.E.,Shen,G.,Bryant,D.A.,2011.Expression of genes in cyanobacteria:adaptation of endogenous plasmidsas platforms for high-level gene expression in Synechococcus sp.PCC 7002.Methods Mol Biol.684,273-93。

序列表

<110> 南洋理工大学(Nanyang Technological University)

<120> 使用无抗生素选择的遗传工程蓝细菌在未灭菌条件下生长

<130> PPI21171099SG

<150> 10201810863R

<151> 2018-12-04

<160> 96

<170> PatentIn version 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> D08807

<400> 1

gcactgtggc aaggaaatcg 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> D08808

<400> 2

tcgcctttat ggaggatggc 20

<210> 3

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> D98496993

<400> 3

taaaaaagac tttatgactg ctttactg 28

<210> 4

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D77036

<400> 4

ggctcaaaag acatcattta gg 22

<210> 5

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> D98847023

<400> 5

gaaggttttc tgttatctga aattcctccc taaatgatgt cttttgagcc aaaggtgctt 60

gtgtctcaac 70

<210> 6

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> D98847024

<400> 6

tcatggtgta tatctcctaa tcaatttaga gcatttcaaa gtaggc 46

<210> 7

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> D98847025

<400> 7

tcgggcctac tttgaaatgc tctaaattga ttaggagata tacaccatg 49

<210> 8

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> D98847026

<400> 8

gggaataatg ttggtcatgg agcagtaaag cagtcataaa gtctttttta tcgctcgtca 60

tttgctttc 69

<210> 9

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> D99280067

<400> 9

tgaagatcaa caccatctat gacttagcc 29

<210> 10

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> D99280068

<400> 10

taaccccatg caaacgccat c 21

<210> 11

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_1

<400> 11

tgccattggt atgagtgaac aagc 24

<210> 12

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_2

<400> 12

tctctccgat tgtaccggtg c 21

<210> 13

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_3

<400> 13

aatggatcaa atcttttatt tgtgaagaaa gtgg 34

<210> 14

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_4

<400> 14

atgatgtggc ccgctcc 17

<210> 15

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_5

<400> 15

tcgtggataa actctttgtg atgatgacc 29

<210> 16

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_6

<400> 16

catgcccaaa ttaccgaaac c 21

<210> 17

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_7

<400> 17

tgctctctga tagtgatatt aattccacc 29

<210> 18

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_8

<400> 18

gaaggtgaac ccattattga taaacc 26

<210> 19

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_9

<400> 19

tccatcaatt tcaaattctc aagtctcg 28

<210> 20

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_10

<400> 20

agcaatcccc tcaaaaaatt tagttcc 27

<210> 21

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_11

<400> 21

tcattggcaa aaaatttacc gattatgc 28

<210> 22

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_12

<400> 22

tgcccaatgt gaccgtgg 18

<210> 23

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_13

<400> 23

tcaaagaaga ataccccgat acctg 25

<210> 24

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_14

<400> 24

tcgatgaacg cctccaagtg g 21

<210> 25

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> D100023580

<400> 25

acccggggat cctctagagc cagatccttt tgcatc 36

<210> 26

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> D100023581

<400> 26

ctgcaggtcg actcttgaag ggagccagaa cataaaaag 39

<210> 27

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> A0935_UCO_F

<400> 27

tgacttggtt cacgtagaaa aaccagaagg gac 33

<210> 28

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> A0936_UCO_R

<400> 28

tgtccactcc ttaatcacta ttcaaaatat tatatttact cagtttttaa g 51

<210> 29

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> D98496996

<400> 29

attaaggagt ggacagccta c 21

<210> 30

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D100141467

<400> 30

acgtgaacca agtcagacaa tc 22

<210> 31

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> D100043610

<400> 31

tagatgatga tgtagaattg tctgctaatt ac 32

<210> 32

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> D100043611

<400> 32

taatgatttc agtacaaatt gctctgc 27

<210> 33

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D100263687

<400> 33

tttgattgtc tgacttggtt cacgtttgag gccgttgatc tagacaaaaa ac 52

<210> 34

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> D100263688

<400> 34

aggagattaa ttccatgggc catc 24

<210> 35

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> D100098818

<400> 35

agaaaaacca gaagggacg 19

<210> 36

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> D101108991

<400> 36

taaagtcaag tagaagatta attccatggg ccatcatcat catcatcatc atc 53

<210> 37

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> D101108992

<400> 37

ggaattaatc ttctacttga ctttatgagt tgggagctcc ttttgcaatc 50

<210> 38

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> D74727

<400> 38

ttcacagagg aaggggaaat tgtc 24

<210> 39

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D74729

<400> 39

tcatatccgg ggcatacatt cg 22

<210> 40

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> D101108989

<400> 40

ttaagctagt tagaagattc agaccatgca aaccctcagc attcaacatg 50

<210> 41

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> D101108990

<400> 41

ggtctgaatc ttctaactag cttaattccg ttcgtacacg aggcgac 47

<210> 42

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> D15106

<400> 42

gttgtaaaac gacggccagt gaattttaag cctggggtga gttgac 46

<210> 43

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> D15107

<400> 43

cgtttccagt tgtccactcc ttaattaatt tctcaaggga aagaaaaaga tttattcc 58

<210> 44

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15108

<400> 44

ttaaaaagca tgacttggtt cacgtacgaa ggttgttttt aaagctaaga ag 52

<210> 45

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15109

<400> 45

caggaaacag ctatgaccat gattatatga aaatgcttca caccatgatt cg 52

<210> 46

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15110

<400> 46

gttgtaaaac gacggccagt gaattacaat tgacacaaaa aagagagcaa ag 52

<210> 47

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> D15111

<400> 47

gctccggctt tgacttggtt cacgtgtgac cctcttgcag caacc 45

<210> 48

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> D15112

<400> 48

ttccacggtg tgtccactcc ttaatttgcc tgattatgct tccatcaaaa tttg 54

<210> 49

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> D15113

<400> 49

caggaaacag ctatgaccat gattatatcc gtcacggtgg ctc 43

<210> 50

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D39394

<400> 50

taggtagtat tggggcatca gg 22

<210> 51

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> D39395

<400> 51

taatctcgat gtgatgattg ctgaagg 27

<210> 52

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> D99047654

<400> 52

attaaggagt ggacacaccg tggaaacgga tgaag 35

<210> 53

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> D99047655

<400> 53

acgtgaacca agtcaaagcc ggagcgcttt tg 32

<210> 54

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> D98646038

<400> 54

attaaggagt ggacaactgg aaacggatga agg 33

<210> 55

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> D98646039

<400> 55

acgtgaacca agtcatgctt tttaagggaa ttgtgc 36

<210> 56

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> 原始TriA

<400> 56

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 57

<211> 1425

<212> DNA

<213> 人工序列

<220>

<223> 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227

<400> 57

atgcaaacgc tcagcatcca gcacggtacc ctcgtcacga tggatcagta ccgcagagtc 60

cttggggata gctgggttca cgtgcaggat ggacggatcg tcgcgctcgg agtgcacgcc 120

gagtcggtgc ctccgccagc ggatcgggtg atcgatgcac gcggcaaggt cgtgttaccc 180

ggtttcatca atgcccacac ccatgtgaac cagatcctcc tgcgcggagg gccctcgcac 240

gggcgtcaac tctatgactg gctgttcaac gttttgtatc cgggacaaaa ggcgatgaga 300

ccggaggacg tagcggtggc ggtgaggttg tattgtgcgg aagctgtgcg cagcgggatt 360

acgacgatca acgacaacgc cgattcggcc atctacccag gcaacatcga ggccgcgatg 420

gcggtctatg gtgaggtggg tgtgagggtc gtctacgccc gcatgttctt tgatcggatg 480

gacgggcgca ttcaagggta tgtggacgcc ttgaaggctc gctctcccca agtcgaactg 540

tgctcgatca tggaggaaac ggctgtggcc aaagatcgga tcacagccct gtcagatcag 600

tatcatggca cggcaggagg tcgtatatca gtttggcccg ctcctgccat taccccggcg 660

gtgacagttg aaggaatgcg atgggcacaa gccttcgccc gtgatcgggc ggtaatgtgg 720

acgcttcaca tggcggagag cgatcatgat gagcggcttc attggatgag tcccgccgag 780

tacatggagt gttacggact cttggatgag cgtctgcagg tcgcgcattg cgtgtacttt 840

gaccggaagg atgttcggct gctgcaccgc cacaatgtga aggtcgcgtc gcaggttgtg 900

agcaatgcct acctcggctc aggggtggcc cccgtgccag agatggtgga gcgcggcatg 960

gccgtgggca ttggaacaga tgacgggaat tgtaatgact ccgtaaacat gatcggagac 1020

atgaagttta tggcccatat tcaccgcgcg gtgcatcggg atgcggacgt gctgacccca 1080

gagaagattc ttgaaatggc gacgatcgat ggggcgcgtt cgttgggaat ggaccacgag 1140

attggttcca tcgaaaccgg caagcgcgcg gaccttatcc tgcttgacct gcgtcaccct 1200

cagacgactc ctcaccatca tttggcggcc acgatcgtgt ttcaggctta cggcaatgag 1260

gtggacactg tcctgattga cggaaacgtt gtgatggaga accgccgctt gagctttctt 1320

ccccctgaac gtgagttggc gttccttgag gaagcgcaga gccgcgccac agctattttg 1380

cagcgggcga acatggtggc taacccagct tggcgcagcc tctag 1425

<210> 58

<211> 470

<212> PRT

<213> 人工序列

<220>

<223> Mel1 TriA

<400> 58

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala

465 470

<210> 59

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel1基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<400> 59

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg acgcagcctc 1440

taa 1443

<210> 60

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel4 TriA.

<400> 60

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Phe Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 61

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel4基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 61

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggt tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440

taa 1443

<210> 62

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel6 TriA

<400> 62

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Lys Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 63

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel6基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 63

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtgaaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440

taa 1443

<210> 64

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel7 TriA

<400> 64

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu Tyr Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 65

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel7基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 65

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctctac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440

taa 1443

<210> 66

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel8 TriA

<400> 66

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Val Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 67

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel8基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 67

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gtcgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440

taa 1443

<210> 68

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel5Evo TriA

<400> 68

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Asn Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Met Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 69

<211> 1446

<212> DNA

<213> 人工序列

<220>

<223> Mel5Evo

<220>

<221> RBS

<222> (1)..(21)

<220>

<221> 基因

<222> (22)..(1446)

<223> triA基因序列

<400> 69

gctagttaga agattcagac catgcaaacc ctcagcattc aacatggcac cctcgtgacg 60

atggatcaat atcgccgggt gctcggcgat agctgggtgc atgtgcaaga tggccgcatt 120

gtggccctcg gtgtgcatgc cgaatctgtg cccccccccg ccgatcgtgt gattgatgcc 180

cgcggtaaag tggtgctccc cggttttatt aatgcccata cccacgtgaa tcaaattctc 240

ctccgtggtg gtccctctca cggtcgccaa ctctatgatt ggctctttaa tgtgctctac 300

cccggccaaa aagccatgcg ccccgaagat gtggccgtgg ccgtgcggct ctattgtgcc 360

gaagccgtgc gcagtggtat taccaccatt aatgataatg ccgattccgc catttacccc 420

ggcaatattg aagccgcgat ggccgtgtat ggcgaagtgg gtgtgcgggt ggtgtacgcc 480

cgcatgtttt tcgatcgcat ggatggccgg attcaaggtt atgtggatgc cctcaaagcc 540

cggagccccc aagtggaact ctgttctatt atggaagaaa ccgccgtggc caaagatcgg 600

attaccgccc tcagcgatca atatcacggc accgccggtg gccgcattag tgtgtggccc 660

gcccccgcca ttaaccccgc cgtgaccgtg gagggtatgc gttgggccca agcctttgcc 720

cgcgatcggg ccgtgatgtg gaccctccac atggccgaaa gcgatcatga tgaacggctc 780

cactggatgt ctcccgccga atatatggaa tgttacggcc tcctcgatga acgcctccaa 840

gtggcccact gtatgtattt tgatcgcaaa gatgtgcggc tcctccatcg ccacaatgtg 900

aaagtggcca gtcaagtggt gtccaatgcc tacctcggca gtggtgtggc ccccgtgccc 960

gaaatggtgg aacgtggcat ggccgtgggc attggcaccg atgatggtaa ttgtaatgat 1020

tccgtgaata tgattggcga tatgaaattt atggcccata ttcaccgggc cgtgcatcgc 1080

gatgccgatg tgctcacccc cgaaaaaatt ctcgaaatgg ccaccattga tggcgcccgc 1140

agtctcggta tggatcatga aattggctcc attgaaaccg gtaaacgggc cgatctcatt 1200

ctcctcgatc tccgccaccc ccaaaccacc ccccaccatc acctcgccgc caccattgtg 1260

tttcaagcct acggtaatga agtggatacc gtgctcattg atggcaatgt ggtgatggaa 1320

aatcgccggc tcagttttct cccccccgaa cgggaactcg cctttctcga agaagcccaa 1380

agtcgcgcca ccgccattct ccaacgcgcc aatatggtgg ccaatcccgc ctggcgcagc 1440

ctctaa 1446

<210> 70

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel5 triA包括RBS

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 70

agttagaaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg gcgcagcctc 1440

taa 1443

<210> 71

<211> 726

<212> DNA

<213> 人工序列

<220>

<223> trzE 红球菌(Rhodococcus sp.) Mel

<400> 71

atgatatact caacagtcaa cgctaatcct tacgcttggc cttacgatgg ttcaatagac 60

cctgctcaca ccgctttaat cttaatcgat tggcaaatag acttttgtgg tccaggtggt 120

tatgtcgatt ccatgggtta cgacttatcc ttgactagaa gtggtttaga acctacagca 180

agagtattgg ctgcagccag agatactggt atgacagtta tccatactag agaaggtcac 240

agaccagatt tggctgactt gccacctaat aagagatgga gatctgcatc agccggtgct 300

gaaatcggtt cagttggtcc atgtggtaga attttagtca gaggtgaacc tggttgggaa 360

atagtaccag aagttgcacc tagagaaggt gaaccaatta tagataaacc tggtaaaggt 420

gctttctacg caacagattt ggacttgttg ttgagaacaa gaggtatcac ccatttgatt 480

ttgaccggta taactacaga tgtttgcgtc cacaccacta tgagagaagc caacgataga 540

ggttacgaat gtttaatttt gtctgattgc accggtgcta ctgacagaaa gcatcacgaa 600

gctgcattat ctatggtcac catgcaaggt ggtgtattcg gtgcaactgc ccattcagat 660

gacttattgg ccgctttggg tacaaccgtt ccagcagccg ctggtcctag agctagaaca 720

gaataa 726

<210> 72

<211> 726

<212> DNA

<213> 人工序列

<220>

<223> trzE 红球菌(Rhodococcus sp.) Mel

<400> 72

atgatttata gtaccgtgaa tgccaatccc tatgcctggc cctacgatgg ctccattgat 60

cccgcccaca ccgccctcat cctcatcgat tggcaaatcg atttttgtgg tcccggcggt 120

tatgtggata gtatgggcta cgatctcagc ctcacccgct ctggcctcga acccaccgcc 180

cgcgtgctcg ccgccgcccg cgataccggc atgaccgtga ttcacacccg cgaaggtcat 240

cgtcccgatc tcgccgatct cccccccaat aaacgttggc ggagtgcctc cgccggcgcc 300

gaaattggca gtgtgggtcc ctgtggccgc attctcgtgc gtggtgaacc cggttgggaa 360

attgtgcccg aagtggcccc ccgcgaaggt gaacccatta ttgataaacc cggtaaaggt 420

gccttttatg ccaccgatct cgatctcctc ctccgcaccc gcggcattac ccacctcatt 480

ctcaccggca ttaccaccga tgtgtgtgtg cataccacca tgcgcgaagc caatgatcgg 540

ggctacgaat gtctcattct ctccgattgt accggtgcca ccgatcggaa acaccatgaa 600

gccgccctca gcatggtgac catgcaaggc ggtgtgtttg gtgccaccgc ccattctgat 660

gatctcctcg ccgccctcgg caccaccgtg cccgccgccg ccggcccccg tgcccgcacc 720

gaataa 726

<210> 73

<211> 1239

<212> DNA

<213> 人工序列

<220>

<223> trzC 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227

<400> 73

atgtcaatgg aaacccatag ttatgtagac gtcgcaattc gtaacgcgcg tcttgccgat 60

acggagggaa ttgtcgatat tcttattcac gatgggcgca ttgcgtccat cgtgaagtcg 120

acaaaaacaa aaggatcggt ggagatcgat gctcatgagg gtctggtcac ttccggcctg 180

gtagagcctc acatccatct cgataaggcc ctgacggcag atcgggttcc cgcaggaagc 240

attggcgacc ttcgaacgcg acgaggcctt gagatggcaa ttcgggccac ccgtgatatc 300

aagcgtacgt tcacggttga agatgttcga gaacgggcca tacgtgcggc cctgatggca 360

tcccgtgcgg gaaccaccgc attgcggaca cacgtcgatg tcgacccgat tgtcggcctc 420

gcaggtatcc gtggtgtcct tgaggcgcgt gaagtctgcg cgggattgat cgatatccag 480

atcgtcgcct tccctcagga gggactcttc tgctctgcgg gggccgtgga cctcatgcgg 540

gaggcgatca aactgggcgc ggatgccgtc ggcggcgcac ccgcgctgga tgatcgcccg 600

caggaccatg tccgagccgt ttttgacctt gctgctgagt tcggcctgcc cgtagacatg 660

cacgtcgatg agtccgaccg gcgggaagac tttacgcttc cctttgtgat tgaagctgcc 720

cgtgaacggc gtgtgcccaa tgtgaccgtc gcgcacatca gctcgctgtc cgtacagacg 780

gatgacgtag cacggtcgac cattgccgcc cttgcggacg ccgatgttaa tgtcgtggtt 840

aatccgatca ttgtcaaaat tacgcggctg agtgaattac tcgatgccgg agtctccgta 900

atgtttggct cggacaacct gcgggatccg ttctatccgc tcggagcggc gaatcccctt 960

ggatcagcca tttttgcctg tcaaattgcc gcgctgggaa caccgcaaga tctcagacgg 1020

gtattcgatg cggtcaccat caacgctgcc cgcatgctgg gattcccctc acttttaggc 1080

gtcgtggaag gggcagtcgc ggatctcgca gtattcccat cggcgacgcc cgaggaggtt 1140

gttctggatc aacagtctcc gctcttcgta ctcaagggcg gacgtgtcgt tgccatgcga 1200

ttggccgctg gatcaacgtc gttccgcgac tactcatga 1239

<210> 74

<211> 1239

<212> DNA

<213> 人工序列

<220>

<223> trzC 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227

<400> 74

atgagcatgg aaacccactc ctatgttgat gttgcgatcc gtaacgcccg tctcgccgat 60

accgaaggca ttgttgatat tctgattcat gatggtcgga ttgccagcat tgtgaaatcc 120

accaaaacca aaggttccgt ggaaattgat gcccatgaag gtctcgtgac cagtggcctc 180

gtggaacccc acattcatct cgataaagcc ctcaccgccg atcgcgtgcc cgccggtagt 240

attggcgatc tccggacccg ccggggtctc gaaatggcca ttcgcgccac ccgcgatatt 300

aaacgcacct ttaccgtgga agatgtgcgg gaacgcgcca ttcgggccgc cctcatggcc 360

agtcgcgccg gcaccaccgc cctccgcacc catgtggatg tggaccccat tgtgggtctc 420

gccggtattc ggggcgtgct cgaagcccgc gaagtgtgtg ccggtctcat tgatattcaa 480

attgtggcct ttccccaaga aggcctcttt tgtagtgccg gtgccgtgga tctcatgcgg 540

gaagccatta aactcggtgc cgatgccgtg ggcggtgccc ccgccctcga tgatcgcccc 600

caagatcatg tgcgcgccgt gtttgatctc gccgccgaat ttggtctccc cgtggatatg 660

cacgtggatg aaagtgatcg ccgggaagat tttaccctcc cctttgtgat tgaagccgcc 720

cgcgaacggc gcgtgcccaa tgtgaccgtg gcccacattt cctctctcag tgtgcaaacc 780

gatgatgtgg cccgctccac cattgccgcc ctcgccgatg ccgatgtgaa tgtggtggtg 840

aatcccatta ttgtgaaaat tacccgcctc tctgaactcc tcgatgccgg tgtgtctgtg 900

atgtttggct ccgataatct ccgcgatccc ttttatcccc tcggtgccgc caatcccctc 960

ggtagtgcca tttttgcctg tcaaattgcc gccctcggca ccccccaaga cctccgccgg 1020

gtgtttgatg ccgtgaccat taatgccgcc cgcatgctcg gttttcccag tctcctcggt 1080

gtggtggaag gtgccgtggc cgatctcgcc gtgtttccca gtgccacccc cgaagaagtg 1140

gtgctcgatc aacaaagtcc cctctttgtg ctcaaaggtg gtcgggtcgt tgcgatgcgg 1200

ttagcggcgg gtagcacctc ctttcgtgat tattcgtaa 1239

<210> 75

<211> 1866

<212> DNA

<213> 人工序列

<220>

<223> DUR 1,2 酿酒酵母(1,2 Saccharomyces cerevisiae),截短氨基酸1-622

<400> 75

atgacagtta gttccgatac aactgctgaa atatcgttag gttggtcaat ccaagactgg 60

attgatttcc acaagtcatc aagctcccag gcttcactaa ggcttcttga atcactacta 120

gactctcaaa atgttgcgcc agtcgataat gcgtggatat cgctaatttc aaaggaaaat 180

ttactgcacc aattccaaat tttaaagagc agagaaaata aagaaactct acctctctac 240

ggtgtcccta ttgctgttaa ggacaacatc gacgttagag gtctacccac caccgctgca 300

tgtccatcct ttgcatatga gccttccaaa gactctaaag tagtagaact actaagaaat 360

gcaggtgcga taatcgtggg taagacaaac ttggaccaat ttgccacagg attagtcggc 420

acacggtctc catatgggaa aacaccttgc gcttttagca aagagcatgt atctggtggt 480

tcctccgctg ggtcagcatc ggtggtcgcc agaggtatcg taccaattgc attgggtact 540

gatacagcag gttctggtag agtcccagcc gccttgaaca acctgattgg cctaaagcca 600

acaaagggcg tcttttcctg tcaaggtgta gttcccgctt gtaaatcttt agactgcgtc 660

tccatctttg cattaaacct aagtgatgct gaacgctgct tccgcatcat gtgccagcca 720

gatcctgata atgatgaata ttctagaccc tatgtttcca accctttgaa aaaattttca 780

agcaatgtaa cgattgctat tcctaaaaat atcccatggt atggtgaaac caagaatcct 840

gtactgtttt ccaatgctgt cgaaaatcta tcaagaacgg gcgctaacgt catagaaatt 900

gattttgagc ctcttttaga gttagctcgc tgtttatacg aaggtacttg ggtggccgag 960

cgttatcaag ctattcaatc gtttttggac agtaaaccac caaaggaatc tttggaccct 1020

actgttattt caattataga aggggccaag aaatacagtg cagtagactg cttcagtttt 1080

gaatacaaaa gacaaggcat cttgcaaaaa gtgagacgac ttctcgaatc agtcgatgta 1140

ttgtgtgtgc ccacatgtcc tttaaatcct actatgcaac aagttgcgga tgaaccagtc 1200

ctagtcaatt caagacaagg cacatggact aattttgtca acttggcaga tttggcagcc 1260

cttgctgttc ccgcagggtt ccgagacgat ggtttgccaa atggtattac tttaatcggt 1320

aaaaaattca cagattacgc actattagag ttggctaacc gctatttcca aaatatattc 1380

cccaacggtt ccagaacata cggtactttt acctcttctt cagtaaagcc agcaaacgat 1440

caattagtgg gaccagacta tgacccatct acgtccataa aattggctgt tgtcggtgca 1500

catcttaagg gtctgcctct acattggcaa ttggaaaagg tcaatgcaac atatttatgt 1560

acaacaaaaa catcaaaagc ttaccagctt tttgctttgc ccaaaaatgg accagtttta 1620

aaacctggtt tgagaagagt tcaagatagc aatggctctc aaatcgaatt agaagtgtac 1680

agtgttccaa aagaactgtt cggtgctttt atttccatgg ttcctgaacc attaggaata 1740

ggttcagtgg agttagaatc tggtgaatgg atcaaatcct ttatttgtga agaatctggt 1800

tacaaagcca aaggtacagt tgatatcaca aagtatggtg gatttagagc atattttgaa 1860

atgttg 1866

<210> 76

<211> 1869

<212> DNA

<213> 人工序列

<220>

<223> DUR 1,2 酿酒酵母(1,2 Saccharomyces cerevisiae),截短氨基酸1-622

<400> 76

atgaccgtga gttccgatac caccgccgaa atttctctcg gctggagtat ccaagattgg 60

atcgattttc acaaaagctc tagttcccaa gcctccctcc gcctcctcga atccctcctc 120

gatagccaaa atgtggcccc cgtggataat gcctggattt ccctcattag caaggaaaac 180

ctcctccatc aatttcaaat tctcaagtct cgcgaaaaca aggaaaccct ccccctctat 240

ggtgtgccca ttgccgtgaa agataatatt gatgtgcgtg gcctccccac caccgccgcc 300

tgtcccagtt ttgcctacga accctctaaa gatagtaaag tggtggaact cctccgcaat 360

gccggcgcca ttattgtggg taaaaccaat ctcgatcaat ttgccaccgg cctcgtgggc 420

acccgcagtc cctatggcaa aaccccctgt gccttttcca aagaacacgt gagcggcggt 480

agctctgccg gctccgccag cgtggtggcc cgcggtattg tgcccattgc cctcggcacc 540

gataccgccg gctctggtcg ggtgcccgcc gccctcaata atctcattgg cctcaaaccc 600

accaagggtg tgtttagttg tcaaggcgtg gtgcccgcct gtaaatctct cgattgtgtg 660

agtatttttg ccctcaatct cagcgatgcc gaacgctgtt ttcggattat gtgtcaaccc 720

gatcccgata atgatgaata ttcccgcccc tacgtgagca atcccctcaa aaaatttagt 780

tccaatgtga ccattgccat tcccaaaaat attccctggt atggtgaaac caaaaatccc 840

gtgctctttt ccaatgccgt ggaaaatctc agccggaccg gcgccaatgt gattgaaatt 900

gattttgaac ccctcctcga actcgcccgc tgtctctatg aaggcacctg ggtggccgaa 960

cgctatcaag ccattcaatc ttttctcgat agtaaacccc ccaaagaatc tctcgatccc 1020

accgtgatta gtatcatcga aggtgccaaa aaatactccg ccgtggattg ttttagcttt 1080

gaatacaaac gccaaggcat tctccaaaaa gtgcgccggc tcctcgaatc cgtggatgtg 1140

ctctgtgtgc ccacctgtcc cctcaatccc accatgcaac aagtggccga tgaacccgtg 1200

ctcgtgaata gccgccaagg cacctggacc aattttgtga atctcgccga tctcgccgcc 1260

ctcgccgtgc ccgccggttt tcgggatgat ggcctcccca atggtattac cctcattggc 1320

aaaaaattta ccgattatgc cctcctcgaa ctcgccaacc gctactttca aaacatcttt 1380

cccaacggct cccggaccta tggcaccttt accagctcta gtgtgaaacc cgccaatgat 1440

caactcgtgg gccccgatta cgatccctct accagtatta aactcgccgt ggtgggcgcc 1500

cacctcaaag gcctccccct ccattggcaa ctcgaaaaag tgaatgccac ctatctctgt 1560

accaccaaaa ccagcaaagc ctaccaactc tttgccctcc ccaaaaatgg tcccgtgctc 1620

aaacccggcc tccgtcgtgt gcaagattcc aatggtagcc aaattgaact cgaagtgtat 1680

tccgtgccca aagaactctt tggcgccttt attagcatgg tgcccgaacc cctcggcatt 1740

ggttctgtgg aactcgaaag tggcgaatgg atcaaatctt ttatttgtga agaaagtggc 1800

tacaaagcca aaggcaccgt ggatattacc aaatatggcg gttttcgggc ctactttgaa 1860

atgctctaa 1869

<210> 77

<211> 1092

<212> DNA

<213> 人工序列

<220>

<223> atzD 假单胞菌(Pseudomonas sp.) ADP

<400> 77

atgtatcaca tcgacgtttt ccgaatccct tgccacagcc ctggtgatac atcgggtctc 60

gaggatttga ttgaaacagg ccgcgttgcc cccgccgaca tcgtcgcggt aatgggcaag 120

accgagggca atggctgcgt caacgattac acgcgtgaat acgccaccgc catgcttgct 180

gcgtgccttg ggcgtcattt gcaactccca ccccatgagg tggaaaagcg ggtcgcgttt 240

gtgatgtcag gtgggacgga aggcgtgctg tccccccacc acacggtatt cgcaagacgt 300

ccggcaatcg acgcgcatcg tcccgctggc aaacgtctca cgcttggaat cgccttcacg 360

cgtgattttc tgccggagga aattggccgc cacgctcaga taacggagac agccggcgcc 420

gtcaaacgcg caatgcgaga tgccgggatc gcttcgattg acgatctgca ttttgtgcag 480

gtgaagtgtc cgctgctgac accagcaaag atcgcctcgg cgcgatcacg cggatgcgct 540

ccagtcacga cggatacgta tgaatcgatg ggctattcgc gcggcgcttc ggccctgggc 600

atcgctctcg ctacagaaga ggtgccctcc tcgatgctcg tagacgaatc agtgctgaat 660

gactggagtc tctcatcgtc actggcgtcg gcgtctgcag gcatcgaact ggagcacaac 720

gtggtgatcg ctattggcat gagcgagcag gccaccagtg aactggtcat tgcccacggc 780

gtgatgagcg acgcgatcga cgcggcctcg gtgcggcgaa cgattgaatc gctgggcata 840

cgtagcgatg acgagatgga tcgcatcgtc aacgtattcg ccaaagcgga ggcgagcccg 900

gacggggttg tacgaggtat gcggcacacg atgctaagtg actccgacat taattcgacc 960

cgccatgcgc gggcggtcac cggcgcggcc attgcctcgg tagttgggca tggcatggtg 1020

tatgtgtccg gtggcgccga gcatcaggga cctgccggcg gcggcccttt tgcagtcatt 1080

gcccgcgctt aa 1092

<210> 78

<211> 1092

<212> DNA

<213> 人工序列

<220>

<223> atzD 假单胞菌(Pseudomonas sp.) ADP

<400> 78

atgtatcaca ttgatgtgtt tcgcattccc tgtcatagcc ccggtgatac ctctggcctc 60

gaagatttga ttgaaaccgg tcgtgtggcc cccgccgata ttgtggccgt gatgggtaaa 120

accgagggta atggctgtgt gaatgattat acccgcgaat acgccaccgc catgctcgcc 180

gcctgtctcg gccgccacct ccaactcccc ccccatgaag tggaaaaacg ggtggccttt 240

gtgatgagtg gtggcaccga aggtgtgctc tccccccacc ataccgtgtt tgcccgtcgc 300

cccgccattg atgcccaccg tcccgccggt aaacgtctca ccctcggcat tgcctttacc 360

cgcgattttc tccccgaaga aattggtcgg catgcccaaa ttaccgaaac cgccggcgcc 420

gtgaaacgtg ccatgcgtga tgccggtatt gccagtattg atgatctcca ctttgtgcaa 480

gtgaaatgtc ccctcctcac ccccgccaaa attgcctccg cccgcagccg gggctgtgcc 540

cccgtgacca ccgataccta tgaatctatg ggttacagtc ggggcgcctc cgccctcggt 600

attgccctcg ccaccgaaga agtgcccagt tccatgctcg tggatgaaag tgtgctcaat 660

gattggtccc tcagctctag tctcgcctcc gccagcgccg gcattgaact cgaacacaat 720

gtggtgattg ccattggtat gagtgaacaa gccacctccg aactcgtgat tgcccacggc 780

gtgatgagcg atgccattga tgccgcctct gtgcgccgga ccattgaaag cctcggtatt 840

cgctctgatg atgaaatgga tcggattgtg aatgtgtttg ccaaagccga agccagtccc 900

gatggtgtgg tgcgtggtat gcgtcacacc atgctctctg atagtgatat taattccacc 960

cgtcatgccc gtgccgtgac cggtgccgcc attgccagcg tggtgggtca cggcatggtg 1020

tacgtgtctg gcggtgccga acatcaaggt cccgccggtg gtggtccctt tgccgtgatt 1080

gcccgtgcct aa 1092

<210> 79

<211> 1320

<212> DNA

<213> 人工序列

<220>

<223> guaD 大肠杆菌(Escherichia coli) K-12

<400> 79

atgatgtcag gagaacacac gttaaaagcg gtacgaggca gttttattga tgtcacccgt 60

acgatcgata acccggaaga gattgcctct gcgctgcggt ttattgagga tggtttatta 120

ctcattaaac agggaaaagt ggaatggttt ggcgaatggg aaaacggaaa gcatcaaatt 180

cctgacacca ttcgcgtgcg cgactatcgc ggcaaactga tagtaccggg ctttgtcgat 240

acacatatcc attatccgca aagtgaaatg gtgggggcct atggtgagca attgctggag 300

tggttgaata aacacacctt ccctactgaa cgtcgttatg aggatttaga gtacgcccgc 360

gaaatgtcgg cgttcttcat caagcagctt ttacgtaacg gaaccaccac ggcgctggtg 420

tttggcactg ttcatccgca atctgttgat gcgctgtttg aagccgccag tcatatcaat 480

atgcgtatga ttgccggtaa ggtgatgatg gaccgcaacg caccggatta tctgctcgac 540

actgccgaaa gcagctatca ccaaagcaaa gaactgatcg aacgctggca caaaaatggt 600

cgtctgctat atgcgattac gccacgcttc gccccgacct catctcctga acagatggcg 660

atggcgcaac gcctgaaaga agaatatccg gatacgtggg tacataccca tctctgtgaa 720

aacaaagatg aaattgcctg ggtgaaatcg ctttatcctg accatgatgg ttatctggat 780

gtttaccatc agtacggcct gaccggtaaa aactgtgtct ttgctcactg cgtccatctc 840

gaagaaaaag agtgggatcg tctcagcgaa accaaatcca gcattgcttt ctgtccgacc 900

tccaaccttt acctcggcag cggcttattc aacttgaaaa aagcatggca gaagaaagtt 960

aaagtgggca tgggaacgga tatcggtgcc ggaaccactt tcaacatgct gcaaacgctg 1020

aacgaagcct acaaagtatt gcaattacaa ggctatcgcc tctcggcata tgaagcgttt 1080

tacctggcca cgctcggcgg agcgaaatct ctgggccttg acgatttgat tggcaacttt 1140

ttacctggca aagaggctga tttcgtggtg atggaaccca ccgccactcc gctacagcag 1200

ctgcgctatg acaactctgt ttctttagtc gacaaattgt tcgtgatgat gacgttgggc 1260

gatgaccgtt cgatctaccg cacctacgtt gatggtcgtc tggtgtacga acgcaactaa 1320

<210> 80

<211> 1343

<212> DNA

<213> 人工序列

<220>

<223> guaD 大肠杆菌(Escherichia coli) K-12

<400> 80

atgatgagcg gcgaacacac cctcaaagcc gtgcgcggtt cttttattga tgtgacccgg 60

accattgata atcccgaaga aattgccagc gccctccgct ttattgaaga tggcctcctc 120

ctcattaaac agggtaaagt ggaatggttt ggcgaatggg aaaatggtaa acaccaaatt 180

cccgatacca ttcgcgtgcg ggattatcgg ggcaaactca ttgtgcccgg ttttgtggat 240

acccacattc attatcccca aagtgaaatg gtgggcgcct acggtgaaca actcctcgaa 300

tggctcaata aacatacctt tcccaccgaa cgccggtatg aagatttgga atacgcccgc 360

gaaatgtccg cctttttcat taaacaactc ctccggaatg gcaccaccac cgccctcgtg 420

tttggcaccg tgcatcccca aagtgtggat gccctctttg aagccgcctc ccatattaat 480

atgcgcatga ttgccggcaa agtgatgatg gatcggaatg cccccgatta tctcctcgat 540

accgccgaaa gttcctacca ccaatctaaa gaactcattg aacgctggca taaaaatggt 600

cggctcctct atgccattac cccccgtttt gcccccacca gctctcccga acaaatggcg 660

atggcccaac ggctcaaaga agaatacccc gatacctggg tgcataccca tctctgtgaa 720

aataaagatg aaattgcctg ggtgaaaagc ctctatcccg atcacgatgg ctacctcgat 780

gtgtatcatc aatacggcct caccggtaaa aattgtgtgt ttgcccactg tgtgcatctc 840

gaagaaaaag aatgggatcg cctctctgaa accaaaagtt ccattgcctt ttgtcccacc 900

agcaatctct atctcggctc tggcctcttt aatctcaaaa aagcctggca gaaaaaagtg 960

aaagtgggca tgggcaccga tattggcgcc ggcaccacct ttaatatgct ccaaaccctc 1020

aatgaagcct ataaagtgct ccaactccaa ggctacagcc tctctgccta tgaagccttt 1080

tacctcgcca ccctcggcgg tgccaaaagt ctcggcctcg atgatctcat tggcaatttt 1140

ctccccggta aagaagccga ttttgtggtg atggaaccca ccgccacccc cctccaacaa 1200

ctccgttatg ataatagtgt gtccctcgtg gagggtttgc atggtctgaa tctgataaac 1260

tctttgtgat gatgaccctc ggcgatgatc gctccattta tcggacctac gtggatggtc 1320

gcctcgtgta cgaacggaat taa 1343

<210> 81

<211> 1320

<212> DNA

<213> 人工序列

<220>

<223> guaD R352S 大肠杆菌(Escherichia coli) K-12

<400> 81

atgatgtcag gagaacacac gttaaaagcg gtacgaggca gttttattga tgtcacccgt 60

acgatcgata acccggaaga gattgcctct gcgctgcggt ttattgagga tggtttatta 120

ctcattaaac agggaaaagt ggaatggttt ggcgaatggg aaaacggaaa gcatcaaatt 180

cctgacacca ttcgcgtgcg cgactatcgc ggcaaactga tagtaccggg ctttgtcgat 240

acacatatcc attatccgca aagtgaaatg gtgggggcct atggtgagca attgctggag 300

tggttgaata aacacacctt ccctactgaa cgtcgttatg aggatttaga gtacgcccgc 360

gaaatgtcgg cgttcttcat caagcagctt ttacgtaacg gaaccaccac ggcgctggtg 420

tttggcactg ttcatccgca atctgttgat gcgctgtttg aagccgccag tcatatcaat 480

atgcgtatga ttgccggtaa ggtgatgatg gaccgcaacg caccggatta tctgctcgac 540

actgccgaaa gcagctatca ccaaagcaaa gaactgatcg aacgctggca caaaaatggt 600

cgtctgctat atgcgattac gccacgcttc gccccgacct catctcctga acagatggcg 660

atggcgcaac gcctgaaaga agaatatccg gatacgtggg tacataccca tctctgtgaa 720

aacaaagatg aaattgcctg ggtgaaatcg ctttatcctg accatgatgg ttatctggat 780

gtttaccatc agtacggcct gaccggtaaa aactgtgtct ttgctcactg cgtccatctc 840

gaagaaaaag agtgggatcg tctcagcgaa accaaatcca gcattgcttt ctgtccgacc 900

tccaaccttt acctcggcag cggcttattc aacttgaaaa aagcatggca gaagaaagtt 960

aaagtgggca tgggaacgga tatcggtgcc ggaaccactt tcaacatgct gcaaacgctg 1020

aacgaagcct acaaagtatt gcaattacaa ggctatagcc tctcggcata tgaagcgttt 1080

tacctggcca cgctcggcgg agcgaaatct ctgggccttg acgatttgat tggcaacttt 1140

ttacctggca aagaggctga tttcgtggtg atggaaccca ccgccactcc gctacagcag 1200

ctgcgctatg acaactctgt ttctttagtc gacaaattgt tcgtgatgat gacgttgggc 1260

gatgaccgtt cgatctaccg cacctacgtt gatggtcgtc tggtgtacga acgcaactaa 1320

<210> 82

<211> 89

<212> DNA

<213> 人工序列

<220>

<223> Pc223启动子

<400> 82

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaag 89

<210> 83

<211> 7983

<212> DNA

<213> 人工序列

<220>

<223> Mel1

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzd

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 83

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctgacgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaagc aaatgacgag 7980

cga 7983

<210> 84

<211> 7968

<212> DNA

<213> 人工序列

<220>

<223> Mel4

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzD

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 84

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggttcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968

<210> 85

<211> 7968

<212> DNA

<213> 人工序列

<220>

<223> Mel5

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzD

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 85

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta gaagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968

<210> 86

<211> 7968

<212> DNA

<213> 人工序列

<220>

<223> Mel6

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzD

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 86

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt gaaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968

<210> 87

<211> 7968

<212> DNA

<213> 人工序列

<220>

<223> Mel7

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzD

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 87

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tctactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgccga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968

<210> 88

<211> 7968

<212> DNA

<213> 人工序列

<220>

<223> Mel8

<220>

<221> 启动子

<222> (1)..(89)

<223> Pc223启动子

<220>

<221> 基因

<222> (104)..(1195)

<223> atzD

<220>

<221> 基因

<222> (1217)..(1942)

<223> trzE

<220>

<221> 基因

<222> (1963)..(3831)

<223> DUR1,2

<220>

<221> 基因

<222> (3853)..(5091)

<223> trzC

<220>

<221> 基因

<222> (5113)..(6432)

<223> guaD

<220>

<221> 基因

<222> (6454)..(7878)

<223> triA

<220>

<221> 终止子

<222> (7929)..(7957)

<223> RRNB终止子

<400> 88

ttaacaaaaa agcaggaata aaattaacat gatgtaacag acataagtcc catcaccgtt 60

gtataatgtt aactgtggga ttgcaaaaga ggagattaat tcaatgtatc acattgatgt 120

gtttcgcatt ccctgtcata gccccggtga tacctctggc ctcgaagatt tgattgaaac 180

cggtcgtgtg gcccccgccg atattgtggc cgtgatgggt aaaaccgagg gtaatggctg 240

tgtgaatgat tatacccgcg aatacgccac cgccatgctc gccgcctgtc tcggccgcca 300

cctccaactc cccccccatg aagtggaaaa acgggtggcc tttgtgatga gtggtggcac 360

cgaaggtgtg ctctcccccc accataccgt gtttgcccgt cgccccgcca ttgatgccca 420

ccgtcccgcc ggtaaacgtc tcaccctcgg cattgccttt acccgcgatt ttctccccga 480

agaaattggt cggcatgccc aaattaccga aaccgccggc gccgtgaaac gtgccatgcg 540

tgatgccggt attgccagta ttgatgatct ccactttgtg caagtgaaat gtcccctcct 600

cacccccgcc aaaattgcct ccgcccgcag ccggggctgt gcccccgtga ccaccgatac 660

ctatgaatct atgggttaca gtcggggcgc ctccgccctc ggtattgccc tcgccaccga 720

agaagtgccc agttccatgc tcgtggatga aagtgtgctc aatgattggt ccctcagctc 780

tagtctcgcc tccgccagcg ccggcattga actcgaacac aatgtggtga ttgccattgg 840

tatgagtgaa caagccacct ccgaactcgt gattgcccac ggcgtgatga gcgatgccat 900

tgatgccgcc tctgtgcgcc ggaccattga aagcctcggt attcgctctg atgatgaaat 960

ggatcggatt gtgaatgtgt ttgccaaagc cgaagccagt cccgatggtg tggtgcgtgg 1020

tatgcgtcac accatgctct ctgatagtga tattaattcc acccgtcatg cccgtgccgt 1080

gaccggtgcc gccattgcca gcgtggtggg tcacggcatg gtgtacgtgt ctggcggtgc 1140

cgaacatcaa ggtcccgccg gtggtggtcc ctttgccgtg attgcccgtg cctaagtcaa 1200

gtaggagatt aattccatga tttatagtac cgtgaatgcc aatccctatg cctggcccta 1260

cgatggctcc attgatcccg cccacaccgc cctcatcctc atcgattggc aaatcgattt 1320

ttgtggtccc ggcggttatg tggatagtat gggctacgat ctcagcctca cccgctctgg 1380

cctcgaaccc accgcccgcg tgctcgccgc cgcccgcgat accggcatga ccgtgattca 1440

cacccgcgaa ggtcatcgtc ccgatctcgc cgatctcccc cccaataaac gttggcggag 1500

tgcctccgcc ggcgccgaaa ttggcagtgt gggtccctgt ggccgcattc tcgtgcgtgg 1560

tgaacccggt tgggaaattg tgcccgaagt ggccccccgc gaaggtgaac ccattattga 1620

taaacccggt aaaggtgcct tttatgccac cgatctcgat ctcctcctcc gcacccgcgg 1680

cattacccac ctcattctca ccggcattac caccgatgtg tgtgtgcata ccaccatgcg 1740

cgaagccaat gatcggggct acgaatgtct cattctctcc gattgtaccg gtgccaccga 1800

tcggaaacac catgaagccg ccctcagcat ggtgaccatg caaggcggtg tgtttggtgc 1860

caccgcccat tctgatgatc tcctcgccgc cctcggcacc accgtgcccg ccgccgccgg 1920

cccccgtgcc cgcaccgaat aatctaatag gagacaaata ctatgaccgt gagttccgat 1980

accaccgccg aaatttctct cggctggagt atccaagatt ggatcgattt tcacaaaagc 2040

tctagttccc aagcctccct ccgcctcctc gaatccctcc tcgatagcca aaatgtggcc 2100

cccgtggata atgcctggat ttccctcatt agcaaggaaa acctcctcca tcaatttcaa 2160

attctcaagt ctcgcgaaaa caaggaaacc ctccccctct atggtgtgcc cattgccgtg 2220

aaagataata ttgatgtgcg tggcctcccc accaccgccg cctgtcccag ttttgcctac 2280

gaaccctcta aagatagtaa agtggtggaa ctcctccgca atgccggcgc cattattgtg 2340

ggtaaaacca atctcgatca atttgccacc ggcctcgtgg gcacccgcag tccctatggc 2400

aaaaccccct gtgccttttc caaagaacac gtgagcggcg gtagctctgc cggctccgcc 2460

agcgtggtgg cccgcggtat tgtgcccatt gccctcggca ccgataccgc cggctctggt 2520

cgggtgcccg ccgccctcaa taatctcatt ggcctcaaac ccaccaaggg tgtgtttagt 2580

tgtcaaggcg tggtgcccgc ctgtaaatct ctcgattgtg tgagtatttt tgccctcaat 2640

ctcagcgatg ccgaacgctg ttttcggatt atgtgtcaac ccgatcccga taatgatgaa 2700

tattcccgcc cctacgtgag caatcccctc aaaaaattta gttccaatgt gaccattgcc 2760

attcccaaaa atattccctg gtatggtgaa accaaaaatc ccgtgctctt ttccaatgcc 2820

gtggaaaatc tcagccggac cggcgccaat gtgattgaaa ttgattttga acccctcctc 2880

gaactcgccc gctgtctcta tgaaggcacc tgggtggccg aacgctatca agccattcaa 2940

tcttttctcg atagtaaacc ccccaaagaa tctctcgatc ccaccgtgat tagtatcatc 3000

gaaggtgcca aaaaatactc cgccgtggat tgttttagct ttgaatacaa acgccaaggc 3060

attctccaaa aagtgcgccg gctcctcgaa tccgtggatg tgctctgtgt gcccacctgt 3120

cccctcaatc ccaccatgca acaagtggcc gatgaacccg tgctcgtgaa tagccgccaa 3180

ggcacctgga ccaattttgt gaatctcgcc gatctcgccg ccctcgccgt gcccgccggt 3240

tttcgggatg atggcctccc caatggtatt accctcattg gcaaaaaatt taccgattat 3300

gccctcctcg aactcgccaa ccgctacttt caaaacatct ttcccaacgg ctcccggacc 3360

tatggcacct ttaccagctc tagtgtgaaa cccgccaatg atcaactcgt gggccccgat 3420

tacgatccct ctaccagtat taaactcgcc gtggtgggcg cccacctcaa aggcctcccc 3480

ctccattggc aactcgaaaa agtgaatgcc acctatctct gtaccaccaa aaccagcaaa 3540

gcctaccaac tctttgccct ccccaaaaat ggtcccgtgc tcaaacccgg cctccgtcgt 3600

gtgcaagatt ccaatggtag ccaaattgaa ctcgaagtgt attccgtgcc caaagaactc 3660

tttggcgcct ttattagcat ggtgcccgaa cccctcggca ttggttctgt ggaactcgaa 3720

agtggcgaat ggatcaaatc ttttatttgt gaagaaagtg gctacaaagc caaaggcacc 3780

gtggatatta ccaaatatgg cggttttcgg gcctactttg aaatgctcta aattgattag 3840

gagatataca ccatgagcat ggaaacccac tcctatgttg atgttgcgat ccgtaacgcc 3900

cgtctcgccg ataccgaagg cattgttgat attctgattc atgatggtcg gattgccagc 3960

attgtgaaat ccaccaaaac caaaggttcc gtggaaattg atgcccatga aggtctcgtg 4020

accagtggcc tcgtggaacc ccacattcat ctcgataaag ccctcaccgc cgatcgcgtg 4080

cccgccggta gtattggcga tctccggacc cgccggggtc tcgaaatggc cattcgcgcc 4140

acccgcgata ttaaacgcac ctttaccgtg gaagatgtgc gggaacgcgc cattcgggcc 4200

gccctcatgg ccagtcgcgc cggcaccacc gccctccgca cccatgtgga tgtggacccc 4260

attgtgggtc tcgccggtat tcggggcgtg ctcgaagccc gcgaagtgtg tgccggtctc 4320

attgatattc aaattgtggc ctttccccaa gaaggcctct tttgtagtgc cggtgccgtg 4380

gatctcatgc gggaagccat taaactcggt gccgatgccg tgggcggtgc ccccgccctc 4440

gatgatcgcc cccaagatca tgtgcgcgcc gtgtttgatc tcgccgccga atttggtctc 4500

cccgtggata tgcacgtgga tgaaagtgat cgccgggaag attttaccct cccctttgtg 4560

attgaagccg cccgcgaacg gcgcgtgccc aatgtgaccg tggcccacat ttcctctctc 4620

agtgtgcaaa ccgatgatgt ggcccgctcc accattgccg ccctcgccga tgccgatgtg 4680

aatgtggtgg tgaatcccat tattgtgaaa attacccgcc tctctgaact cctcgatgcc 4740

ggtgtgtctg tgatgtttgg ctccgataat ctccgcgatc ccttttatcc cctcggtgcc 4800

gccaatcccc tcggtagtgc catttttgcc tgtcaaattg ccgccctcgg caccccccaa 4860

gacctccgcc gggtgtttga tgccgtgacc attaatgccg cccgcatgct cggttttccc 4920

agtctcctcg gtgtggtgga aggtgccgtg gccgatctcg ccgtgtttcc cagtgccacc 4980

cccgaagaag tggtgctcga tcaacaaagt cccctctttg tgctcaaagg tggtcgggtc 5040

gttgcgatgc ggttagcggc gggtagcacc tcctttcgtg attattcgta atatacttag 5100

gagattcata cgatgatgag cggcgaacac accctcaaag ccgtgcgcgg ttcttttatt 5160

gatgtgaccc ggaccattga taatcccgaa gaaattgcca gcgccctccg ctttattgaa 5220

gatggcctcc tcctcattaa acagggtaaa gtggaatggt ttggcgaatg ggaaaatggt 5280

aaacaccaaa ttcccgatac cattcgcgtg cgggattatc ggggcaaact cattgtgccc 5340

ggttttgtgg atacccacat tcattatccc caaagtgaaa tggtgggcgc ctacggtgaa 5400

caactcctcg aatggctcaa taaacatacc tttcccaccg aacgccggta tgaagatttg 5460

gaatacgccc gcgaaatgtc cgcctttttc attaaacaac tcctccggaa tggcaccacc 5520

accgccctcg tgtttggcac cgtgcatccc caaagtgtgg atgccctctt tgaagccgcc 5580

tcccatatta atatgcgcat gattgccggc aaagtgatga tggatcggaa tgcccccgat 5640

tatctcctcg ataccgccga aagttcctac caccaatcta aagaactcat tgaacgctgg 5700

cataaaaatg gtcggctcct ctatgccatt accccccgtt ttgcccccac cagctctccc 5760

gaacaaatgg cgatggccca acggctcaaa gaagaatacc ccgatacctg ggtgcatacc 5820

catctctgtg aaaataaaga tgaaattgcc tgggtgaaaa gcctctatcc cgatcacgat 5880

ggctacctcg atgtgtatca tcaatacggc ctcaccggta aaaattgtgt gtttgcccac 5940

tgtgtgcatc tcgaagaaaa agaatgggat cgcctctctg aaaccaaaag ttccattgcc 6000

ttttgtccca ccagcaatct ctatctcggc tctggcctct ttaatctcaa aaaagcctgg 6060

cagaaaaaag tgaaagtggg catgggcacc gatattggcg ccggcaccac ctttaatatg 6120

ctccaaaccc tcaatgaagc ctataaagtg ctccaactcc aaggctacag cctctctgcc 6180

tatgaagcct tttacctcgc caccctcggc ggtgccaaaa gtctcggcct cgatgatctc 6240

attggcaatt ttctccccgg taaagaagcc gattttgtgg tgatggaacc caccgccacc 6300

cccctccaac aactccgtta tgataatagt gtgtccctcg tggataaact ctttgtgatg 6360

atgaccctcg gcgatgatcg ctccatttat cggacctacg tggatggtcg cctcgtgtac 6420

gaacggaatt aagctagtta ggagattcag accatgcaaa ccctcagcat tcaacatggc 6480

accctcgtga cgatggatca atatcgccgg gtgctcggcg atagctgggt gcatgtgcaa 6540

gatggccgca ttgtggccct cggtgtgcat gccgaatctg tgcccccccc cgccgatcgt 6600

gtgattgatg cccgcggtaa agtggtgctc cccggtttta ttaatgccca tacccacgtg 6660

aatcaaattc tcctccgtgg tggtccctct cacggtcgcc aactctatga ttggctcttt 6720

aatgtgctct accccggcca aaaagccatg cgccccgaag atgtggccgt ggccgtgcgg 6780

ctctattgtg ccgaagccgt gcgcagtggt attaccacca ttaatgataa tgccgattcc 6840

gccatttacc ccggcaatat tgaagccgcg atggccgtgt atggcgaagt gggtgtgcgg 6900

gtggtgtacg cccgcatgtt tttcgatcgc atggatggcc ggattcaagg ttatgtggat 6960

gccctcaaag cccggagccc ccaagtggaa ctctgttcta ttatggaaga aaccgccgtg 7020

gccaaagatc ggattaccgc cctcagcgat caatatcacg gcaccgccgg tggccgcatt 7080

agtgtgtggc ccgcccccgc cattaccccc gccgtgaccg tggagggtat gcgttgggcc 7140

caagcctttg cccgcgatcg ggccgtgatg tggaccctcc acatggccga aagcgatcat 7200

gatgaacggc tccactggat gtctcccgcc gaatatatgg aatgttacgg cctcctcgat 7260

gaacgcctcc aagtggccca ctgtgtgtat tttgatcgca aagatgtgcg gctcctccat 7320

cgccacaatg tgaaagtggc cagtcaagtg gtgtccaatg cctacctcgg cagtggtgtg 7380

gcccccgtgc ccgaaatggt ggaacgtggc atggccgtgg gcattggcac cgatgatggt 7440

aattgtaatg attccgtgaa tatgattggc gatatgaaat ttatggccca tattcaccgg 7500

gccgtgcatc gcgatgtcga tgtgctcacc cccgaaaaaa ttctcgaaat ggccaccatt 7560

gatggcgccc gcagtctcgg tatggatcat gaaattggct ccattgaaac cggtaaacgg 7620

gccgatctca ttctcctcga tctccgccac ccccaaacca ccccccacca tcacctcgcc 7680

gccaccattg tgtttcaagc ctacggtaat gaagtggata ccgtgctcat tgatggcaat 7740

gtggtgatgg aaaatcgccg gctcagtttt ctcccccccg aacgggaact cgcctttctc 7800

gaagaagccc aaagtcgcgc caccgccatt ctccaacgcg ccaatatggt ggccaatccc 7860

gcctggcgca gcctctaaaa gggtgggcgc gccgacccag ctttcttgta caaactcggc 7920

cctgcaggag aaggccatcc tgacggatgg cctttttgaa gcttgaaa 7968

<210> 89

<211> 1011

<212> DNA

<213> 人工序列

<220>

<223> ptxD原始序列

<400> 89

atgctgccga aactcgttat aactcaccga gtacacgatg agatcctgca actgctggcg 60

ccacattgcg agctgatgac caaccagacc gacagcacgc tgacgcgcga ggaaattctg 120

cgccgctgtc gcgatgctca ggcgatgatg gcgttcatgc ccgatcgggt cgatgcagac 180

tttcttcaag cctgccctga gctgcgtgta gtcggctgcg cgctcaaggg cttcgacaat 240

ttcgatgtgg acgcctgtac tgcccgcggg gtctggctga ccttcgtgcc tgatctgttg 300

acggtcccga ctgccgagct ggcgatcgga ctggcggtgg ggctggggcg gcatctgcgg 360

gcagcagatg cgttcgtccg ctctggcgag ttccagggct ggcaaccaca gttctacggc 420

acggggctgg ataacgctac ggtcggcatc cttggcatgg gcgccatcgg actggccatg 480

gctgatcgct tgcagggatg gggcgcgacc ctgcagtacc acgaggcgaa ggctctggat 540

acacaaaccg agcaacggct cggcctgcgc caggtggcgt gcagcgaact cttcgccagc 600

tcggacttca tcctgctggc gcttcccttg aatgccgata cccagcatct ggtcaacgcc 660

gagctgcttg ccctcgtacg gccgggcgct ctgcttgtaa acccctgtcg tggttcggta 720

gtggatgaag ccgccgtgct cgcggcgctt gagcgaggcc agctcggcgg gtatgcggcg 780

gatgtattcg aaatggaaga ctgggctcgc gcggaccggc cgcggctgat cgatcctgcg 840

ctgctcgcgc atccgaatac gctgttcact ccgcacatag ggtcggcagt gcgcgcggtg 900

cgcctggaga ttgaacgttg tgcagcgcag aacatcatcc aggtattggc aggtgcgcgc 960

ccaatcaacg ctgcgaaccg tctgcccaag gccgagcctg ccgcatgttg a 1011

<210> 90

<211> 1011

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的ptxD

<400> 90

atgctgccca aactggtcat cacccaccgc gtccatgatg aaattctgca gctgctggcc 60

ccgcactgtg agctgatgac caaccaaacc gatagcaccc tgacgcgcga agagatcctg 120

cgccgctgcc gcgatgctca ggccatgatg gcttttatgc ccgatcgcgt ggatgcggat 180

ttcctgcaag cttgtcccga actgcgcgtg gtgggttgtg ccctgaaggg ttttgataat 240

tttgatgtgg atgcctgcac ggcccgcggc gtgtggctga cctttgtccc cgatctgctg 300

accgtgccga ccgctgaact ggccattggc ctggcggtgg gtctgggtcg ccatctgcgc 360

gcggccgatg cgtttgtgcg cagcggcgag ttccagggtt ggcagcccca attctatggc 420

accggcctgg ataatgccac ggtgggcatc ctgggtatgg gtgctattgg cctggccatg 480

gctgatcgcc tgcagggttg gggcgccacc ctgcaatatc acgaagccaa agcgctggat 540

acgcaaacgg aacagcgcct gggtctgcgc caggtggctt gcagcgaact gtttgccagc 600

agcgatttca tcctgctggc cctgccgctg aacgcggata cccaacatct ggtcaatgct 660

gaactgctgg ctctggtgcg ccccggtgct ctgctggtca atccgtgtcg cggcagcgtg 720

gtggatgaag cggctgtgct ggccgctctg gagcgcggtc aactgggcgg ctacgccgcg 780

gatgtctttg aaatggagga ttgggctcgc gcggatcgcc cacgcctgat cgatcccgcc 840

ctgctggctc acccaaacac cctgttcacc ccgcatattg gcagcgccgt gcgcgcggtc 900

cgcctggaaa ttgagcgctg cgctgcccag aatatcattc aagtgctggc cggtgctcgc 960

cccattaacg ccgctaatcg cctgcccaag gccgaaccgg ccgcgtgcta g 1011

<210> 91

<211> 1011

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的ptxD NADP+

<400> 91

atgctgccca aactggtcat cacccaccgc gtccatgatg aaattctgca gctgctggcc 60

ccgcactgtg agctgatgac caaccaaacc gatagcaccc tgacgcgcga agagatcctg 120

cgccgctgcc gcgatgctca ggccatgatg gcttttatgc ccgatcgcgt ggatgcggat 180

ttcctgcaag cttgtcccga actgcgcgtg gtgggttgtg ccctgaaggg ttttgataat 240

tttgatgtgg atgcctgcac ggcccgcggc gtgtggctga cctttgtccc cgatctgctg 300

accgtgccga ccgctgaact ggccattggc ctggcggtgg gtctgggtcg ccatctgcgc 360

gcggccgatg cgtttgtgcg cagcggcgag ttccagggtt ggcagcccca attctatggc 420

accggcctgg ataatgccac ggtgggcatc ctgggtatgg gtgctattgg cctggccatg 480

gctgatcgcc tgcagggttg gggcgccacc ctgcaatatc acgctcgtaa agcgctggat 540

acgcaaacgg aacagcgcct gggtctgcgc caggtggctt gcagcgaact gtttgccagc 600

agcgatttca tcctgctggc cctgccgctg aacgcggata cccaacatct ggtcaatgct 660

gaactgctgg ctctggtgcg ccccggtgct ctgctggtca atccgtgtcg cggcagcgtg 720

gtggatgaag cggctgtgct ggccgctctg gagcgcggtc aactgggcgg ctacgccgcg 780

gatgtctttg aaatggagga ttgggctcgc gcggatcgcc cacgcctgat cgatcccgcc 840

ctgctggctc acccaaacac cctgttcacc ccgcatattg gcagcgccgt gcgcgcggtc 900

cgcctggaaa ttgagcgctg cgctgcccag aatatcattc aagtgctggc cggtgctcgc 960

cccattaacg ccgctaatcg cctgcccaag gccgaaccgg ccgcgtgcta g 1011

<210> 92

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> psbA启动子

<400> 92

gatctcaatg aatattggtt gacacgggcg tataagacat gttatactgt tgaataacaa 60

g 61

<210> 93

<211> 1236

<212> DNA

<213> 人工序列

<220>

<223> ptxD操纵子

<220>

<221> 启动子

<222> (1)..(61)

<223> psbA启动子

<220>

<221> 基因

<222> (84)..(1091)

<223> ptxD

<220>

<221> 终止子

<222> (1107)..(1194)

<400> 93

gatctcaatg aatattggtt gacacgggcg tataagacat gttatactgt tgaataacaa 60

gactagatag tggaggtact agaatgctgc ccaaactggt catcacccac cgcgtccatg 120

atgaaattct gcagctgctg gccccgcact gtgagctgat gaccaaccaa accgatagca 180

ccctgacgcg cgaagagatc ctgcgccgct gccgcgatgc tcaggccatg atggctttta 240

tgcccgatcg cgtggatgcg gatttcctgc aagcttgtcc cgaactgcgc gtggtgggtt 300

gtgccctgaa gggttttgat aattttgatg tggatgcctg cacggcccgc ggcgtgtggc 360

tgacctttgt ccccgatctg ctgaccgtgc cgaccgctga actggccatt ggcctggcgg 420

tgggtctggg tcgccatctg cgcgcggccg atgcgtttgt gcgcagcggc gagttccagg 480

gttggcagcc ccaattctat ggcaccggcc tggataatgc cacggtgggc atcctgggta 540

tgggtgctat tggcctggcc atggctgatc gcctgcaggg ttggggcgcc accctgcaat 600

atcacgaagc caaagcgctg gatacgcaaa cggaacagcg cctgggtctg cgccaggtgg 660

cttgcagcga actgtttgcc agcagcgatt tcatcctgct ggccctgccg ctgaacgcgg 720

atacccaaca tctggtcaat gctgaactgc tggctctggt gcgccccggt gctctgctgg 780

tcaatccgtg tcgcggcagc gtggtggatg aagcggctgt gctggccgct ctggagcgcg 840

gtcaactggg cggctacgcc gcggatgtct ttgaaatgga ggattgggct cgcgcggatc 900

gcccacgcct gatcgatccc gccctgctgg ctcacccaaa caccctgttc accccgcata 960

ttggcagcgc cgtgcgcgcg gtccgcctgg aaattgagcg ctgcgctgcc cagaatatca 1020

ttcaagtgct ggccggtgct cgccccatta acgccgctaa tcgcctgccc aaggccgaac 1080

cggccgcgtg ctagttaaac ctcagcggtt tagtgaccga ctaacacttt tctcataaaa 1140

tcccagggag gtttcggcct cccttttttt cacttgctaa gctctctttc gtttgattgt 1200

ctgacttggt tcacgtagaa aaaccagaag ggacgc 1236

<210> 94

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> pSJ051

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 94

agttaggaga ttcagaccat gcaaacgctc agcatccagc acggtaccct cgtcacgatg 60

gatcagtacc gcagagtcct tggggatagc tgggttcacg tgcaggatgg acggatcgtc 120

gcgctcggag tgcacgccga gtcggtgcct ccgccagcgg atcgggtgat cgatgcacgc 180

ggcaaggtcg tgttacccgg tttcatcaat gcccacaccc atgtgaacca gatcctcctg 240

cgcggagggc cctcgcacgg gcgtcaactc tatgactggc tgttcaacgt tttgtatccg 300

ggacaaaagg cgatgagacc ggaggacgta gcggtggcgg tgaggttgta ttgtgcggaa 360

gctgtgcgca gcgggattac gacgatcaac gacaacgccg attcggccat ctacccaggc 420

aacatcgagg ccgcgatggc ggtctatggt gaggtgggtg tgagggtcgt ctacgcccgc 480

atgttctttg atcggatgga cgggcgcatt caagggtatg tggacgcctt gaaggctcgc 540

tctccccaag tcgaactgtg ctcgatcatg gaggaaacgg ctgtggccaa agatcggatc 600

acagccctgt cagatcagta tcatggcacg gcaggaggtc gtatatcagt ttggcccgct 660

cctgccatta ccccggcggt gacagttgaa ggaatgcgat gggcacaagc cttcgcccgt 720

gatcgggcgg taatgtggac gcttcacatg gcggagagcg atcatgatga gcggcttcat 780

tggatgagtc ccgccgagta catggagtgt tacggactct tggatgagcg tctgcaggtc 840

gcgcattgcg tgtactttga ccggaaggat gttcggctgc tgcaccgcca caatgtgaag 900

gtcgcgtcgc aggttgtgag caatgcctac ctcggctcag gggtggcccc cgtgccagag 960

atggtggagc gcggcatggc cgtgggcatt ggaacagatg acgggaattg taatgactcc 1020

gtaaacatga tcggagacat gaagtttatg gcccatattc accgcgcggt gcatcgggat 1080

gcggacgtgc tgaccccaga gaagattctt gaaatggcga cgatcgatgg ggcgcgttcg 1140

ttgggaatgg accacgagat tggttccatc gaaaccggca agcgcgcgga ccttatcctg 1200

cttgacctgc gtcaccctca gacgactcct caccatcatt tggcggccac gatcgtgttt 1260

caggcttacg gcaatgaggt ggacactgtc ctgattgacg gaaacgttgt gatggagaac 1320

cgccgcttga gctttcttcc ccctgaacgt gagttggcgt tccttgagga agcgcagagc 1380

cgcgccacag ctattttgca gcgggcgaac atggtggcta acccagcttg gcgcagcctc 1440

tag 1443

<210> 95

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> RF_ptxD_F

<400> 95

ggcgccaccc tgcaatatca cgctcgtaaa gcgct 35

<210> 96

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RF_ptxD_R

<400> 96

ccgtttgcgt atccagcgct ttacgagcgt gata 34

相关技术
  • 使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌
  • 一种无质粒、无抗生素抗性筛选标记的基因工程菌的构建方法
技术分类

06120113108261