使用无抗生素选择在未灭菌条件下生长的基因工程蓝细菌

文献发布时间：2023-06-19 11:55:48

发明领域

本发明涉及代谢工程细胞增加其与污染微生物竞争而无需抗生素的能力的方法。更特别地，本发明提供了工程蓝细菌以利用三聚氰胺作为氮源，亚磷酸盐作为磷源，任选地还利用NADP+而不是NAD+的方法，并且还提供了使用这种方法制造的基因工程细胞。

背景技术

作为推进碳中和经济的努力的一部分，蓝细菌正在越来越多地被用于代谢工程。它们是光合自养生物，能够以相当简单的要求生长——具有无机氮和磷源的最少培养基，使用光用于能源生成并且将CO

大型蓝细菌培养可以在半封闭系统诸如吊袋中，或者在开放系统，是跑道池或气提式贮水池中进行[Schoepp等人,Bioresour Technol.166:273-81 (2014)]。封闭系统具有更高可控性、培养物污染的机会更少以及通常更高的生长产率的优点。然而，与迄今为止发现的最经济可行的替代的具有气提式贮水池或跑道池的开放系统相比，封闭系统运行基本上更加昂贵 [Schoepp等人,Bioresour Technol.166:273-81(2014)]。另一方面，开放系统具有暴露于环境中的明显缺点，并且因此更易于受到污染。通过使用抗生素和抗生素抗性蓝细菌菌株通常将污染的威胁降至最低。运行具有携带抗生素抗性基因的蓝细菌菌株的大型开放系统，一旦培养物逃逸，会带来严重的生物危害，并且通过水平基因转移，可能有助于抗生素抗性向环境致病物种的传播。

最近，已经探索了使用生态上稀有或异生源的常量营养素来作为手段，以对转基因生物在不使用抗生素下生长来生成选择压力[Kanda等人,J Biotechnol.182:68-73(2014)；Loera-Quezada等人,Plant Biotechnol J.14: 2066(2016)；Pandeya等人,PlantMol Biol.95:567-577(2017)；Polyviou等人,Environmental microbiology reports.7:824-30(2015)；Shaw等人,Science. 353:583-6(2016)]以及允许转基因植物竞争过杂草，同时消耗显著更少的磷 [Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012)]。亚磷酸盐脱氢酶(PtxD)是一种将亚磷酸盐(一种生态学上罕见的磷形式)转化为磷酸盐的酶，已被引入多种生物中[Kanda等人,J Biotechnol.182:68-73(2014)；Lopez-Arredondo and Herrera-Estrella,Nat Biotechnol.30:889(2012)；Nahampun等人,Plant Cell Rep.35:1121-1132(2016)；Pandeya等人,Plant Mol Biol.95:567-577(2017)]。还已经设计出利用异生的富氮化合物三聚氰胺的合成途径，并将其引入不同的生物中[Shaw等人,Science.353:583-6 (2016)]。在大肠杆菌(Escherichia coli)中引入完整的途径(由6种酶组成)允许携带菌株克服蓄意的污染[Shaw等人,Science.353:583-6(2016)]。

在许多情况下，借助于抗生素盒将这些途径或基因引入靶生物 [Loera-Quezada等人,Plant Biotechnol J.14:2066(2016)；Motomura等人, ACS Synth Biol.10:1021(2018)；Shaw等人,Science.353:583-6(2016)]。即使这证明了这些途径为携带它们的生物带来了优势，但一种或多种抗生素抗性盒的水平基因转移风险仍然存在。

鉴于上述缺陷，期望提供用于生产工程微生物的方法，该工程微生物可以更有效地与污染物竞争而没有将抗生素抗性基因转移至环境中的风险。

发明内容

本发明提供了工程蓝细菌菌株的方法，其能够在作为唯一N和Pi源的三聚氰胺和/或亚磷酸盐上生长，通过使用代谢选择来驱动它们的基因组整合而无需抗生素选择。通过实验室的演变，获得了七种不同的聚球藻PCC 7002突变菌株，其可以在作为唯一N源的三聚氰胺上生长。另外，使用ptxD 基因或其突变体和亚磷酸盐也被示为是此蓝细菌物种中有效的代谢选择标志物。用三聚氰胺和亚磷酸盐代谢途径转化的细胞能够分别使用作为N和 Pi源的三聚氰胺和亚磷酸盐生长，并且可以耐受并且轻易竞争过污染，即使在大量过量污染中。

三聚氰胺突变菌株均具有影响triA基因的突变，并且以Mel 1表示，具有Trp471stop突变；Mel4，具有Leu88Phe突变；Mel5，在核糖体结合位点(RBS)中具有AGGAGA至AGAAGA的突变；Mel6，具有Glu317Lys突变；Mel7，具有His254Tyr突变；Mel8，具有Ala355Val突变；以及Mel5evo，除了在RBS中具有与Mel5相同的AGGAGA至AGAAGA突变外，在triA 中具有Thr218Asn突变和Val278Met突变。

根据第一方面，本发明提供了一种分离的基因工程蓝细菌，其中，所述蓝细菌已被至少一种多核苷酸分子转化，所述至少一种多核苷酸分子包括与至少一个启动子可操作地连接的异源三聚氰胺利用途径基因atzD、 trzE、DUR1,2、trzC、guaD和triA，其中；

i)所述triA基因包括编码氨基酸取代的一个或多个突变，其中，所述氨基酸取代位于选自包括以下的组的位置：Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合；

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS)，

其中，所述基因工程蓝细菌不具有异源抗生素抗性基因。

根据另一方面，本发明提供了分离的基因工程蓝细菌，其中，所述蓝细菌已被至少一种多核苷酸分子转化，所述至少一种多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因，其中，所述ptxD 基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO: 91(NADP)所示的多核苷酸序列，

其中，所述基因工程蓝细菌不具有异源抗生素抗性基因。

根据另一方面，本发明提供重组载体，所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD，其中

i)所述triA基因包括编码氨基酸取代的一个或多个突变，其中，所述氨基酸取代位于选自包括以下的组的位置：Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及254His和Val278Met的组合；

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS)，

其中，所述载体缺失抗生素抗性基因。

在一些实施方式中，重组载体进一步包括多核苷酸，该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。

根据另一方面，本发明提供在基因工程蓝细菌细胞中表达产物的方法，包括步骤：

a)根据本发明的任何方面，在无抗生素并且三聚氰胺为氮源的培养基中，培养多个基因工程蓝细菌细胞，所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸，其中，培养有利于代谢三聚氰胺的蓝细菌细胞的生长，

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

根据另一方面，本发明提供在基因工程蓝细菌细胞中表达产物的方法，包括步骤：

a)在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中，培养多个基因工程蓝细菌细胞，所述基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸，其中，培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长；，

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

附图说明

图1示出了三聚氰胺选择工具的概述。(A)三聚氰胺利用途径反应。一 mol的三聚氰胺产生6mol的氨和3mol的二氧化碳。(B)三聚氰胺利用操纵子的示意图。所示引物用于证实该途径的全基因组整合。不同部分均不按比例(C)PCR反应的0.6％琼脂糖凝胶使用A中所示的引物进行。(参见表1 的序列)

图2示出了在包含三聚氰胺的培养基中利用三聚氰胺的菌株的生长。(A) 野生型(WT)Syn7002和利用三聚氰胺的菌株的生长曲线。(B)接种后48小时的培养物样品。对所有菌株计算了将OD

图3A-3B示出了如通过Illumina测序发现的在不同的利用三聚氰胺的菌株中，triA基因座的突变的示意图。Mel1在原始终止密码子之前具有4 个氨基酸的突变(图3A)。在不同的利用三聚氰胺的菌株中，triA基因座的多序列比对(图3B)。

图4示出了在指示的时间点在用过的培养基中三聚氰胺途径中间体 LC-MS/MS定量。(A)三聚氰胺；(B)三聚氰酸二酰胺；(C)三聚氰酸一酰胺； (D)氰尿酸。还包括接种在AD7-Mel培养基中的WT培养物的定量，作为对照。注意三聚氰胺(以mM)和其余中间体(以μM)的比例差异。由于比例，误差线可能不明显。

图5示出了在包含2mM或4mM三聚氰胺的AD7-Mel培养基中生长的Mel5菌株的生长曲线。

图6示出了利用亚磷酸盐的菌株在包含磷酸盐(Pho)和亚磷酸盐(Phi)的 AD7培养基中的生长。(A)WT Syn7002(左)和利用亚磷酸盐的菌株(右)在包含Pho或不同浓度Phi的AD7培养基中的生长曲线，如所示。(B)接种后 48小时的培养物样品的细节。可以在表2中找到将OD

图7示出了亚磷酸盐选择工具的概述。(A)顶部——pSJ135的细节，包括用于染色体整合PCR的引物。底部——构建体pSJ141的细节，其使用亚磷酸盐以驱动异源基因(YFP)的染色体整合。(B)PCR的0.8％琼脂糖凝胶，在WT和Mel5背景两者下均示出ptxD基因的基因组整合和YFP基因的 ptxD驱动整合。(C)用pSJ135和pSJ141转化的菌株相对于各自的背景菌株的YFP荧光。

图8A-8C示出了敲除Syn7002中推定的膦酸盐转运蛋白同源物 A0336(顶部)和G0143(底部)。(图8A)敲除构建体质粒pSJ156(顶部)和 pSJ157(底部)的示意图。各个元件未按比例。(图8B)用于A0935-ptxD推定的膦酸盐转运蛋白同源物敲除菌株的分离凝胶。(图8C)在AD7-Pho 1x(左) 或AD7-Phi 20x(右)中，A0935-ptxD亲本菌株和衍生的敲除菌株的稀释涂布。注意：ΔA–ΔA0336::SpR；ΔG–ΔG0143::GmR

图9示出利用三聚氰胺和亚磷酸盐的菌株的表征。(A)在常规AD7培养基或AD7-MelPhi 20x中的WT和Mel5-A0935ptxD(“MelPhi”)菌株的生长曲线。(B)接种后48小时的培养物样品的细节。对于在AD7-Mel Pho 1x 或AD7-Mel Phi 20x中的MelPhi菌株，计算了将OD

图10示出了WT、Mel5和Re-Mel5菌株在正常AD7-NO

图11示出了通过流式细胞术测量的以下生长曲线：在Syn7002 WT背景中表达YFP的菌株(“纯YFP”，在常规AD7中生长)；MelPhi菌株(“纯 MelPhi”，缺失YFP，在AD7-Mel Phi20x中生长)；或者在AD7-Mel Phi 20x 中，在YFP(在WT背景中)与MelPhi(缺失YFP)以10:1的细胞比率组合的两种菌株(“混合物YFP”和“混合物MelPhi”)的混合培养物。

图12示出了用于污染实验中细胞计数的门控策略。示出的数据是针对在T＝100小时下，10:1混合培养实验之一。YFP和MelPhi纯培养物和混合培养物在点绘图上绘制的左门(顶部至底部)；相同样品的中间直方图绘图；使用YFP与前向散射对相同样品进行的右点绘图，用于定量。SSC–侧向散射；FSC-前向散射

图13示出了Syn7002 WT和利用三聚氰胺和亚磷酸盐的菌株在具有硝酸盐(NO

图14示出了MelPhi菌株在AD7-Mel Phi 20x(2L的培养物总体积)中，在两个带挡板的1L锥形烧瓶中在11天的时间段内的生长曲线。

图15示出了MelPhi菌株(MelPhi WT)和MelPhi菌株的衍生物 (MelPhiAQ)的生长曲线，在其中，PtxD酶被突变为使用NADP+代替 NAD+(因为蓝细菌具有的NADP+比NAD+更多)。使用分批补料策略生长菌株，每天添加三聚氰胺(将600μL的20mM三聚氰胺储备液加入12mL 培养物中)以继续生长至更高密度。达到的最高密度为约70的OD

图16示出了在12mM三聚氰胺中Mel5菌株和进化的Mel5菌株(以“Mel5evo”表示)的生长曲线。Mel5菌株无法在12mM三聚氰胺中生长，但是Mel5evo菌株可以并且生长至约50的OD

为了方便起见，这里收集了说明书、实施例和所附权利要求书中应用的某些术语。

如本文所用，术语“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白质序列，或任何这些的片段，并且是指天然存在的或合成的分子。本文所述的“氨基酸序列”是指天然存在的蛋白质分子的氨基酸序列，“氨基酸序列”和类似术语并不意指将氨基酸序列限制为与所述蛋白质分子相关的完整的天然氨基酸序列。

如本文所用，术语“包括(comprising)”或“包括(including)”应解释为指定所指的所述特征、整数、步骤或组分的存在，但不排除一个或多个特征、整数、步骤或组分或其组的存在或增加。然而，在本公开的上下文中，术语“包括(comprising)”或“包括(including)”也包括“由……组成”。单词“包括(comprising)”，诸如“包括(comprise)”和“包括(comprises)”，以及“包括(including)”，诸如“包括(include)”和“包括(includes)”具有相应变化含义的变体。

如本文所用，将术语“基因突变”定义为其具有至少一个核苷酸序列从野生型序列经由以下变化的基因突变：可以增强基因活性或者可以导致编码蛋白质的氨基酸序列与野生型蛋白质相比相对更具活性的至少一个核苷酸的取代、缺失或添加。例如，可以突变至少一个天然或野生型三聚氰胺脱氨酶(triA)基因和/或其核糖体结合位点(RBS)AGGAGA以增加三聚氰胺代谢。

将术语“分离的”在本文定义为基本上从自然存在组分的生物体的细胞中的其他生物组分(即其他染色体和额外染色体DNA和RNA)和蛋白质分离、分开生产或纯化出的生物组分(诸如核酸、肽或蛋白质)。因此，已分离的核酸、肽和蛋白质包括通过标准纯化方法纯化的核酸和蛋白质。该术语还涵盖通过在宿主细胞中重组表达制备的核酸、肽和蛋白质，以及化学合成的核酸。

如本文所用，短语“核酸”或“核酸序列”是指寡核苷酸、核苷酸、多核苷酸或其任何片段，是指可以为单链或双链的并且可以表示正义链和反义链的基因组或合成来源DNA或RNA，是指肽核酸(PNA)，或是指任何类似DNA或类似RNA的材料。

如本文所用，术语“可操作地连接”意指对其中应用术语的组分处于允许它们在适当条件下执行其固有功能的关系中。例如，将与蛋白质编码序列“可操作地连接”的控制序列连接到其上，使得在与控制序列的转录活性相容的条件下实现蛋白质编码序列的表达。借助于实例，当第一核酸序列与第二核酸序列处于功能关系时，第一核酸序列与第二核酸序列可操作地连接。例如，如果启动子影响编码序列的转录或表达，则启动子与编码序列可操作地连接。通常，可操作地连接的DNA序列是连续的，并且在需要结合两个蛋白质编码区的情况下，它们在同一阅读框中。

如本文所用，术语“突变体”意指以下的多核苷酸：可以编码保留活性的示例性催化酶的突变体，或可以具有突变，例如在其RBS中，其增强了催化酶生产。如本文所用，催化酶的“突变体”是指被一个或多个氨基酸改变的氨基酸序列。突变体可以具有“保守”变化，其中，取代的氨基酸具有相似的结构或化学特性(例如，用异亮氨酸替代亮氨酸)。更少见的是，突变体可以具有“非保守”变化(例如，用色氨酸替代甘氨酸)。类似的微小变化也可包括氨基酸缺失或插入，或两者。使用本领域众所周知的计算机程序，例如DNASTAR软件，可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不丧失催化活性的指导。在一些实施方式中，突变酶在氨基酸水平上为至少80％、85％、90％、95％、96％、97％、98％、99％或更高，优选至少90％同源或同一性，以示例性本文描述的氨基酸序列(例如，三聚氰胺脱氨酶)或其功能片段——例如，在约：50、55、60、65、70、75、 80、85、90、95或100％的长度上，优选成熟参考序列长度的至少90％，但仍保持催化活性。优选地，所述变体酶在氨基酸水平上具有至少90％的同一性并保持催化活性。示例性的三聚氰胺脱氨酶突变体在具有增加活性的His254Tyr取代的Mel7(SEQ ID NO:87)中表示为SEQ ID NO：64。254Tyr 可能被其他氨基酸替代(保守取代)并保留了活性。

载体可以以适于在宿主细胞中表达的一个或多个核酸的形式包括一个或多个催化酶核酸。优选地，重组表达载体包括与预表达的一个或多个核酸序列可操作地连接的一个或多个调控序列。术语“调控序列”包括启动子、增强子、核糖体结合位点和/或IRES元件和其他表达控制元件(例如，聚腺苷酸化信号)。调控序列包括指导核苷酸序列组成型表达的那些，诸如本文实例中公开的P

可以设计本发明的重组表达载体用于在原核或真核细胞中，更特别在原核细胞中，表达催化酶蛋白质。例如，本发明的多肽可以在细菌(例如，蓝细菌)或酵母细胞中表达。合适的宿主细胞在Goeddel,(1990)Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,Calif.中进一步讨论。

上文描述的方法利用酶催化反应的序列。尽管这些反应可以单独地，或者更特别地将它们中的两个或更多个组合进行，但是特别优选地将所有反应组合在级联反应序列中，该级联反应序列在一锅中提供来自初始原料的产物，从而消除了分离中间体的需要，并且潜在地提高了反应序列的总产率。

在本发明中，新型工程细菌不包含抗生素抗性基因，并且而是利用三聚氰胺和亚磷酸盐与污染物竞争。此外，本发明的工程细胞在triA基因中和/或在其RBS中包括突变，其改进了生物的生长，其中一些可以在12mM 的三聚氰胺中健壮生长。另外，亚磷酸盐代谢基因ptxD可以被突变以利用 NADP+代替NAD+。

具体实施方式

本说明书中提及的参考文献是为了方便起见以文献列表的形式列出的，并添加在实施例的末尾。这些参考文献的全部内容上下文通过援引并入本文，但其在说明书中的提及并不意味着它们构成一般通用常识的一部分。

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS)，

其中，所述基因工程蓝细菌不具有异源抗生素抗性基因。

在一些实施方式中，蓝细菌是聚球藻Syn7002。

在一些实施方式中，triA基因编码选自包括以下的组的氨基酸序列： SEQ ID NO:56(天然，Mel5)、SEQ ID NO:58(Mel1)、SEQ ID NO:60(Mel4)、 SEQ ID NO:62(Mel6)、SEQID NO:64(Mel7)、SEQ ID NO:66(Mel8)和SEQ ID NO:68(Mel5evo)。在一些实施方式中，triA基因多核苷酸序列具有与选自包括以下的组的triA基因的多核苷酸序列至少80％、至少85％、至少90％、至少95％序列同一性或100％序列同一性：SEQ ID NO:57、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ ID NO: 65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO:69(Mel5evo)和SEQ ID NO: 70(Mel5)。

应当理解，由于遗传密码中的冗余，核酸序列可以具有小于100％的同一性并且仍然编码相同的氨基酸序列。

在一些实施方式中，triA基因包括选自包括以下的组的多核苷酸序列： SEQ IDNO:57(天然)、SEQ ID NO:59(Mel1)、SEQ ID NO:61(Mel4)、SEQ ID NO:63(Mel6)、SEQ IDNO:65(Mel7)、SEQ ID NO:67(Mel8)、SEQ ID NO: 69(Mel5evo)和SEQ ID NO:70(Mel5密码子opt)。

优选地，triA基因包括SEQ ID NO:69或SEQ ID NO:70中所示的多核苷酸序列。

在一些实施方式中，异源trzE基因包括与SEQ ID NO:71或72中所示的多核苷酸序列至少80％、至少85％、至少90％、至少95％序列同一性或 100％序列同一性的多核苷酸序列；trzC基因包括与SEQ ID NO:73或74中所示的多核苷酸序列至少80％、至少85％、至少90％、至少95％序列同一性或100％序列同一性的多核苷酸序列；DUR1,2基因包括与SEQ IDNO:75 或76中所示的多核苷酸序列至少80％、至少85％、至少90％、至少95％序列同一性或100％序列同一性的多核苷酸序列；atzD基因包括与SEQ ID NO:77或78中所示的多核苷酸序列至少80％、至少85％、至少90％、至少 95％序列同一性或100％序列同一性的多核苷酸序列；和/或guaD基因包括与SEQ ID NO:79、80或81(Arg352Ser)中所示的多核苷酸序列至少80％、至少85％、至少90％、至少95％序列同一性或100％序列同一性的多核苷酸序列。

在一些实施方式中，异源trzE基因包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列；trzC基因包括SEQ ID NO:73或74(密码子优化的)中所示的多核苷酸序列；DUR1,2基因包括SEQ ID NO:75或76(密码子优化的)中所示的多核苷酸序列；atzD基因包括SEQ ID NO:77或78(密码子优化的)中所示的多核苷酸序列；和/或guaD基因包括SEQID NO:79、 80(密码子优化的)或81(Arg352Ser)中所示的多核苷酸序列。

在一些实施方式中，atzD基因来自假单胞菌(Pseudomonas sp.)菌株 ADP、trzE基因来自红球菌(Rhodococcus sp.)Mel、DUR1,2基因来自酿酒酵母(S.cerevisiae)、trzC基因来自瓜类细菌性果斑病菌(A.citrulli)NRRL B-12227、guaD基因来自大肠杆菌K-12以及triA基因来自瓜类细菌性果斑病菌NRRL B-12227。

在一些实施方式中，所述三聚氰胺利用途径基因的每一个具有核糖体结合位点(RBS)。适合的RBS的实例具有多核苷酸序列AGGAGA。有利地，可以使用包括多核苷酸序列AGAAGA的突变体RBS。更特别地，该突变体RBS与triA基因连接。应当理解，IRES可能适合代替与atzD、trzE、 DUR1,2、trzC和guaD基因连接的一个或多个RBS。

在一些实施方式中，所述至少一个启动子是组成型启动子。应当理解，存在适合于驱动三聚氰胺途径基因表达的已知启动子，诸如P

在一些实施方式中，所述组成型启动子是P

在一些实施方式中，所述异源三聚氰胺利用途径基因从单个启动子表达，作为基因操纵子的一部分。

在一些实施方式中，基因操纵子多核苷酸序列选自包括以下的组：SEQ ID NO:83(Mel1菌株)、SEQ ID NO:84(Mel4菌株)、SEQ ID NO:85(Mel5 菌株)、SEQ ID NO:86(Mel6菌株)、SEQ ID NO:87(Mel7菌株)和SEQ ID NO: 88(Mel8菌株)。

在一些实施方式中，至少一个多核苷酸分子进一步包括多核苷酸，该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。结果示出，ptxD可以单独用于重组菌株的选择，无需抗生素选择。还可以将 ptxD基因与三聚氰胺途径基因(MelPhi菌株)组合使用，以更严格的选择方法来生产与缺失这些异源基因的污染细菌激烈竞争的菌株。而且，生成了允许工程菌株利用NADP+而不是NAD+的ptxD的突变体形式。

在一些实施方式中，ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO: 90(MelPhi)或SEQ ID NO:91(NADP)中所示的多核苷酸序列。

在一些实施方式中，与ptxD基因连接的启动子可以选自包括以下的组： P

在一些实施方式中，所述异源亚磷酸盐脱氢酶(ptxD)基因从单个启动子表达，作为基因操纵子的一部分，其中，所述操纵子多核苷酸序列在SEQ ID NO:93中示出。

在一些实施方式中，本发明的分离的基因工程蓝细菌进一步包括外源多核苷酸，该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。

根据另一方面，本发明提供了分离的基因工程蓝细菌，其中，该蓝细菌已被至少一个多核苷酸分子转化，至少一个多核苷酸分子包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因，其中，所述ptxD基因包括SEQ ID NO:89(天然)、SEQ ID NO:90(MelPhi)或SEQ ID NO:91(NADP) 中所示的多核苷酸序列，并且其中，所述基因工程蓝细菌不具有异源抗生素抗性基因。

优选地，ptxD基因包括SEQ ID NO:90或SEQ ID NO:91中所示的多核苷酸序列。

根据另一方面，本发明提供重组载体，所述重组载体包括与至少一个启动子可操作地连接的三聚氰胺途径基因triA、DUR1,2、atzD、trzC、trzE 和guaD，其中

i)triA基因包括编码氨基酸取代的一个或多个突变，其中，该氨基酸取代位于选自包括以下的组的位置：Leu88Phe、His254Tyr、Glu317Lys、 Ala355Val、Trp471Stop以及Thr218Asn和Val278Met的组合；

和/或

ii)所述triA基因具有包括AGGAGA至AGAAGA突变的核糖体结合位点(RBS)，

其中，所述载体缺失抗生素抗性基因。

在一些实施方式中，异源基因trzE包括SEQ ID NO:71或72(密码子优化的)中所示的多核苷酸序列；trzC包括SEQ ID NO:73或74(密码子优化的) 中所示的多核苷酸序列；DUR1,2包括SEQ ID NO:75或76(密码子优化的) 中所示的多核苷酸序列；atzD包括SEQ IDNO:77或78(密码子优化的)中所示的多核苷酸序列；guaD包括SEQ ID NO:79、80(密码子优化的)或 81(Arg352Ser)中所示的多核苷酸序列。

在一些实施方式中，atzD基因来自假单胞菌菌株ADP、trzE基因来自红球菌Mel、DUR1,2基因来自酿酒酵母、trzC基因来自瓜类细菌性果斑病菌B-12227、guaD基因来自大肠杆菌以及triA基因来自瓜类细菌性果斑病菌B-12227。

在一些实施方式中，所述至少一个启动子是组成型启动子。应当理解，存在适合于驱动三聚氰胺途径基因表达的已知启动子，诸如P

在一些实施方式中，所述组成型启动子是P

在一些实施方式中，所述异源三聚氰胺利用途径基因从单个启动子表达，作为基因操纵子的一部分。

在一些实施方式中，基因操纵子多核苷酸序列选自包括以下的组：SEQ ID NO:83(Mel1)、SEQ ID NO:84(Mel4)、SEQ ID NO:85(Mel5)、SEQ ID NO: 86(Mel6)、SEQ ID NO:87(Mel7)和SEQ ID NO:88(Mel8)。

在一些实施方式中，至少一个多核苷酸分子进一步包括多核苷酸，该多核苷酸包括与启动子可操作地连接的异源亚磷酸盐脱氢酶(ptxD)基因。

在一些实施方式中，ptxD基因包括选自包括以下的组的多核苷酸序列： SEQ IDNO:89(天然)、SEQ ID NO:90(MelPhi)和SEQ ID NO:91(NADP)。

在一些实施方式中，与ptxD基因连接的启动子选自包括以下的组：P

在一些实施方式中，重组载体进一步包括外源多核苷酸，该外源多核苷酸包括编码RNA和/或蛋白质产物的可表达多核苷酸。

根据另一方面，本发明提供在基因工程蓝细菌细胞中表达产物的方法，包括步骤：

a)根据本发明的任何方面，在无抗生素并且三聚氰胺为氮源的培养基中，培养多个基因工程蓝细菌细胞，该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和包括编码RNA和/或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸，其中，培养有利于代谢三聚氰胺的细胞的生长；

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

根据另一方面，本发明提供在基因工程蓝细菌细胞中表达产物的方法，包括步骤：

a)根据本发明的任何方面，在无抗生素、三聚氰胺为氮源并且亚磷酸盐为磷源的培养基中，培养多个基因工程蓝细菌细胞，该基因工程蓝细菌细胞包括异源三聚氰胺利用途径基因和亚磷酸盐代谢基因和包括编码RNA和 /或蛋白质产物的可表达多核苷酸的至少一种外源多核苷酸，其中，培养有利于代谢三聚氰胺和亚磷酸盐的蓝细菌细胞的生长，

b)在用于表达所述产物的条件下培养所述基因工程蓝细菌细胞。

在一些实施方式中，所述表达产物能够将底物转化为其他产物。所述产物可以是，例如是可以催化培养物中的底物转化为其他产物的酶。例如，所述表达的产物可以是酶，诸如金合欢烯合酶，其可以将CO

在一些实施方式中，培养基包括在以下浓度的三聚氰胺：至少1mM、至少2mM、至少4mM、至少6mM、至少8mM、至少10mM、至少12mM、至少14Mm或至少16mM。在一些实施方式中，培养基中三聚氰胺的浓度选自约2mM至约12mM范围内的浓度。

在一些实施方式中，该方法进一步包括分离在基因工程蓝细菌细胞中表达的所述产物。

现在已经大体上描述了本发明，通过参考以下借助于说明而提供以下实施例，将更容易理解本发明，并且不旨在限制本发明。

实施例

实施例1:方法

如Green and Sambrook and Russel,Molecular Cloning:A LaboratoryManual,Cold Springs Harbor Laboratory,New York(2012)中描述的，通常按照本领域已知且未具体描述的标准分子生物学技术。

聚球藻PCC 7002(来自美国宾夕法尼亚州立大学(Penn State University) 的Donald Bryant教授的一种馈赠)在使用D7微量营养元素[Arnon等人, Biochim BiophysActa.357:231-45(1974)]，按指示补充有12mM硝酸钠(AD7-NO

对于生长实验，在50μmol光子m

使用超感受态大肠杆菌细胞(Stellar,TaKaRa)构建所有相关质粒，并且于37℃，在补充有50μg·mL

三聚氰胺生长菌株

除非另有说明，否则使用Q5 DNA聚合酶(New England Biolabs,NEB) 进行所有的PCR反应，以及PCR产物通常用DpnI消化过夜，并且在组装 DNA之前使用EZ-10旋转柱PCR产物纯化试剂盒(BioBasic)进行纯化。使用引物D08807和D08808(参见表1)从Syn7002基因组DNA(gDNA)中PCR 扩增了包括glpK中性基因组整合位点的DNA片段[Begemann等人,PLoSOne.8:e76594.10.1371/journal.pone.0076594(2013)]，侧翼为500-bp的上游和下游区。

表1：使用的引物列表

按照制造商的说明，将纯化的PCR产物连接至pCR-Blunt II TOPO (Invitrogen)中，并转化为至化学感受态Stellar大肠杆菌细胞中，从而产生质粒pCRBlunt-glpK(通过使用通用M13引物的Sanger测序证实正确的组装)。使用引物D98496993和D77036，反向PCR扩增pCRBlunt-glpK主链，并且使用引物D98847023和D98847024(上半部分)以及D98847025和D98847026(下半部分)，从合成构建体(GenScript，香港,Ltd.)中将三聚氰胺操纵子扩增为两等份。按照制造商的说明，使用NEBuilder HiFi DNA Assembly Master Mix(NEB)将两个片段组装至pCRBlunt-glpK。将1μL的组装混合物转化至Stellar大肠杆菌超感受态细胞中，得到质粒pSJ051。使用表1中所示的引物Mel_seq_1至Mel_seq_14、D99280067和D99280068，通过Sanger测序证实了三聚氰胺操纵子的正确组装。如先前所描述的 [Frigaard等人,Methods Mol Biol.274:325-40(2004)]通过双重同源重组转化 Syn7002 WT，具有修饰。简而言之，如上文描述，在0.5的OD

利用亚磷酸盐和利用三聚氰胺/亚磷酸盐组合的菌株

将在ORF A0935和A0936之间的中性基因组整合位点的上游500bp至下游500bp的区[Davies等人,Frontiers in bioengineering and biotechnology. 2:21.10.3389/fbioe.2014.00021(2014)]使用引物D100023580和D100023581 从Syn7002 gDNA进行PCR扩增。用XbaI(NEB)消化pUC19(Invitrogen)，并使用EZ-10旋转柱DNA凝胶提取试剂盒(BioBasic)从琼脂糖凝胶带中纯化。根据制造商的说明，使用pEASY-Uni无缝克隆和组装试剂盒(TransGen Biotech Co.,Ltd，中国)将A0935-A0936位点组装至消化的pUC19主链中，并转化至Stellar大肠杆菌细胞中，从而获得质粒pSZT001。将引物对 A0935_UCO_F和A0936_UCO_R用于反向PCR扩增pSZT001主链，并且对D98496996和D100141467用于扩增施氏假单胞菌(Pseudomonas stutzeri)WM88亚磷酸盐脱氢酶(ptxD)基因[Loera-Quezada等人,Plant Biotechnol J.14:2066(2016)]的合成的、密码子优化型(SEQ ID NO:90)(由GenScript,香港,Ltd)，由绿穗苋(Amaranthus hybridus)组成型psbA启动子 (SEQ ID NO:92)驱动[Elhai and Wolk,Gene.68:119-138(1988)]。如上文描述，使用pEASY-Uni试剂盒组装两个片段，得到质粒pSJ135。如上文描述，将2μg的该质粒用于转化Syn7002 WT以及Mel5菌株，不同的是，在转化之前将培养物离心并用缺少磷酸盐的AD7培养基(AD7-NO

为了进一步测试亚磷酸盐作为选择标志物的用途，在强组成型P

敲除推定的膦酸盐转运蛋白

通过使用 CyanoBase(http://genomedotmicrobedbdotjp/blast/blast_search/cyanobase/gene s)内的BlastP工具鉴定了推定的膦酸盐转运蛋白基因，将搜索限制在Syn7002上，并将来自原绿球藻(Prochlorococcus marinus sp.)MIT9301[Bisson等人,NatCommun.8:1746.10.1038/s41467-017-01226-8 (2017)；Feingersch等人,ISME J.6:827-34(2012)]的PhnD的氨基酸序列作为搜索模板使用。在Syn7002:A0336(E值＝1e

黄色荧光蛋白(YFP)荧光测量

对于以下测定全细胞YFP荧光：一式三份的培养物(每份15mL)在常规 AD7培养基中生长至OD

基因组测序

通过使用Quick-DNA真菌/细菌试剂盒(Zymo Research)，从WT菌株以及不同的利用三聚氰胺的菌株两者中制备基因组DNA。文库制备是根据 Illumina的TruSeq纳米DNA样品制备方案进行的。按照制造商的建议，将样品在Covaris E220上剪切至～550bp，并用Illumina的TruSeq LT DNA条形码之一进行唯一标记，以使样品合并以用于测序。使用Promega的 QuantiFluor dsDNA测定法对完成的文库进行定量，并在Agilent Tapestation4200上确定平均文库大小。然后使用用于Illumina平台的Kapa文库定量试剂盒(KapaBiosystems)，将文库浓度归一化至4nM，并且通过在QuantStudio-3实时PCR系统(AppliedBiosystems)上qPCR进行验证。然后将文库以等摩尔浓度合并，并在Illumina MiSeq平台上以300bp配对末端的阅读长度进行测序。使用Geneious 11.1.4软件(Biomatters Ltd.)组装并比较基因组。

核糖体结合位点(RBS)点突变测试

为了评估Mel5中RBS变化的影响，通过反向PCR[Liu and Naismith, BMCBiotechnol.8:91.10.1186/1472-6750-8-91(2008)]，使用Q5 DNA聚合酶 (NEB)，使用引物D101108989和D101108990，将原始的pSJ051质粒在triA 上游的RBS处突变(从AG

共培养竞争实验和流式细胞术

通过在AD7-NO

使用LC-MS/MS鉴定三聚氰胺途径中间体

生长48小时后收集Syn7002和利用三聚氰胺的菌株培养物，并离心(14000g，5min，室温)。将上清液通过0.2μm注射器过滤器(带有Supor膜的Acrodisc过滤器，PALL)过滤，并在-80℃冷冻直至进一步使用。在NTU Phenomics Centre使用先前描述的方法[Braekevelt等人,Food Addit Contam Part A Chem Anal Control Expo Risk Assess.28:698-704(2011)]，，通过 LC-MS/MS对三聚氰胺、三聚氰酸二酰胺(ammeline)、三聚氰酸一酰胺(ammelide)和氰尿酸进行定量。

实施例2

三聚氰胺降解途径的引入要求进化适应性以有效利用

在此研究中利用的三聚氰胺降解途径是基于Shaw及其同事报道的最优途径(基因triA、guaD、trzC、atzD、trzE和DUR1,2，包括在guaD基因产物中描述的R352S突变)[Shaw等人,Science.353:583-6(2016)](图1)。在我们的情况下，我们使用了密码子优化的基因(triA，SEQ ID NO:70；guaD， SEQ ID NO:80；trzC，SEQ ID NO:74；atzD，SEQ ID NO:78；trzE SEQ ID NO:72；和DUR1,2,SEQ ID NO:76)，合成的强蓝细菌启动子P

比较了不同的Mel菌株和WT Syn 7002在AD7-Mel培养基(包含2mM 三聚氰胺)或常规AD7培养基(包含硝酸盐)中的生长。如在图2A和B中看出，与亲本Syn7002 Wt菌株不同，不同的单独菌株能够在作为唯一的氮源的三聚氰胺上生长，尽管速率不同。特别是两个菌株，Mel5和Mel7，可以在AD7-Mel中的生长几乎与Syn7002 WT在AD7-NO

为了进一步了解这些不同表型背后的原因，我们对所有三聚氰胺生长菌株(Mel1、Mel4、Mel5、Mel6、Mel7和Mel8)的以及本实验中使用的Syn7002 WT(获得自美国宾夕法尼亚州立大学Donald Bryant教授的实验室)的基因组进行了测序。比较序列确定了三聚氰胺操纵子中的几个突变，它们全部位于triA(编码三聚氰胺脱氨酶)基因之前的RBS中或triA基因本身的内部(图 3A)。triA氨基酸序列中的突变位于以下的位置：Leu88Phe(Mel4)、His254Tyr (Mel7)、Glu317Lys(Mel6)、Ala355Val(Mel8)和Trp471stop(Mel1)。Mel5具有在RBS中的突变(从AGGAGA至AGAAGA)(图3B)。由于这是三聚氰胺降解途径的第一步，影响triA或其RBS的突变将调控通过该途径其余部分的代谢通量。

为了进一步阐明不同菌株中三聚氰胺途径代谢通量中发生的变化，使用LC-MS/MS定量从三聚氰胺到氰尿酸排入生长培养基的途径中间体(图 4)。在生长的最初24小时内，Mel5和Mel7两者中，三聚氰胺被非常快速地消耗，同时发现，在同一时间范围内，三聚氰酸二酰胺(三聚氰胺之后的第一个中间体)在Mel5和Mel7中的积累(Mel5为86.2±1.6μM以及Mel7 为57.2±1.5μM)比其余菌株中的(≤25μM)显著更多。仅以非常低的水平定量三聚氰酸一酰胺(第三中间体)(24小时后在Mel5生长培养基中检测到<4 μM)，而氰尿酸在Mel5中以207.5±16.3μM的浓度以及在Mel 7中以134.5 ±8.8μM的浓度快速积累(图4A-D)。在最初的文章中也报道了氰尿酸大量排入培养基中，该文章涉及在添加的三聚氰胺为13％的初始(摩尔)量的水平下，将三聚氰胺降解途径引入至大肠杆菌中[Shaw等人,Science.353:583-6 (2016)]，惊人地类似于24小时后在Mel5菌株中观察到的9.7％的值。存在于其余菌株中的突变很可能没有赋予与Mel5和Mel7发现那些突变一样的强大的优势，导致在正常光照条件下观察到的低细胞内氮水平和较慢的生长速率(图2)。应当注意的是，在弱光下生长的预培养物受到的影响要小得多，这可能是由于在这些条件下总体代谢速率下降(数据未示出)。

Mel5在2mM和4mM三聚氰胺中生长，并且比较了生长速率。图5 示出，约72小时后，4mM三聚氰胺可使Mel5维持比2mM三聚氰胺更高的OD。

最后，将RBS序列在原始pSJ051中的triA基因上游突变，以匹配在 Mel5中发现的突变。当直接涂布于AD7-Mel板上(以及通过涂布于AD7-Cya 板上)时，使用这种修饰的构建体获得菌落。将新获得的菌株(名为“Re-Mel5”) 的生长与Mel5进行了比较，并且当在以三聚氰胺作为唯一氮源中生长时，在48小时后，发现Re-Mel5达到了类似的OD

实施例3

可以将亚磷酸盐和PtxD用作聚球藻PCC7002中有效的选择系统

尽管亚磷酸盐(Phi)先前示出能够维持集胞藻(Synechocystis sp.)PCC 6803[Polyviou等人,Environmental microbiology reports.7:824-30(2015)]和聚球藻PCC7942[Motomura等人,ACS Synth Biol.10:1021(2018)]两者的修饰菌株的生长，在这两者的情况下，基因操作(包含ptxD以及特定的Phi转运蛋白的操纵子的整合)均由抗生素选择压力驱动。同时，两种菌株(野生型集胞藻PCC 6803或野生型聚球藻PCC 7942)似乎都无法在不包括特定转运蛋白下摄取Phi，因此使构建体过大而无法具有作为选择标志物的实际用途。由于文献中不存在关于Syn7002在作为唯一P源的Phi上生长的能力的数据，因此使用不同浓度的Phi测试了WT菌株的生长(图6A，左图片)。尽管在最初的24-36小时内有一些生长，但是在此时间段之后没有发生可观察到的生长，这可能是由于内部磷酸盐储备的全部消耗——蓝细菌将磷作为多磷酸盐颗粒存储在细胞质中，并且具有动态流通机制，允许它们在需要时采用这些储备[Gomez-Garcia等人,Journal of bacteriology.195,3309(2013)]。

在中性位点A0935中，并且没有其他可选择标志物，用包含施氏假单胞菌WM88亚磷酸盐脱氢酶基因(密码子优化的；SEQ ID NO:90)的构建体 (pSJ135)转化的Syn7002 WT(图7A，上)涂布于具有Phi(0.37mM,1x)作为唯一磷源的AD7板上。这种转化产生了数百个菌落，并且尽管转化体 (A0935-ptxD)具有淡微黄色，是磷酸盐缺乏细胞的特征，但这种浓度的Phi 足以诱导转化菌株的全染色体分离(图7B)，因此验证了ptxD基因和亚磷酸盐作为Syn7002中有效的选择策略。

考虑到单独的ptxD基因足以使菌株A0935-ptxD在Phi上生长，其似乎与相关(淡水)菌株集胞藻PCC6803和聚球藻PCC7942不同，Syn7002能够通过迄今未定义的转运蛋白从生长培养基中输入Phi。

为了测试更高的浓度梯度是否足以增强向细胞内的转运并允许其在 Phi上更快地生长，在具有Phi浓度增加(0.37mM至7.4mM)的AD7中测试了A0935-ptxD的生长。如图6A(右侧)可以看出，测试的最高Phi浓度(Phi 20x, 7.4mM)使该菌株达到接近Pho生长细胞的生长速率。同时，克干细胞重量 (gDCW)与OD

表2：每种测试菌株的OD

备注：图是使用生物一式三份样品测定干重量的平均和标准偏差。

已知表达相同的ptxD基因的转基因拟南芥(Arabidopsis thaliana)植物 (使用草丁膦(phosphinothricin)选择)能够使用Phi作为唯一的磷源来生长[Lopez-Arredondoand Herrera-Estrella,Nat Biotechnol.30:889(2012)]。虽然尚不清楚由植物根部摄取Phi的具体转运蛋白，但似乎不需要额外的Phi 转运蛋白基因，Syn7002就是这种情况。然而，与拟南芥不同，Syn7002中 Phi的吸收效率要低得多。如先前的研究示出，几种海洋蓝细菌能够摄取并利用Phi作为磷源[Feingersch等人,ISME J.6:827-34(2012)；Martinez等人, Environ Microbiol.14:1363(2012)；Polyviou等人,Environmental microbiologyreports.7:824-30(2015)]我们在Syn7002基因组中搜索了推定的转运蛋白基因，诸如ptxB和phnD同源物[Bisson等人,Nat Commun.8: 1746.10.1038/s41467-017-01226-8(2017)]。虽然未找到ptxB同源物，但环状染色体(A0336)或pAQ7质粒(G0143)中存在两个推定的phnD基因A0336和 G0143(数据未示出)。我们假设这两个基因中的任何一个都可能涉及亚磷酸盐向细胞的输入，因为phnD同源物也示出与亚磷酸盐结合[Bisson等人,Nat Commun.8:1746.10.1038/s41467-017-01226-8(2017)]。然而，单独或组合敲除这些推定的膦酸盐转运蛋白并不能阻止ptxD亲本菌株在亚磷酸盐上生长 (图8A-8C)。

为了研究这种选择方法是否足以允许其他基因的共整合，设计了第二种构建体，其中将yfp基因整合至同一基因座的染色体中，使用ptxD作为选择标志物，并且Phi作为阳性选择。在图7B和7C中可以看出，使用该方法成功地共整合了yfp基因，并且可以在阳性转化体中测量YFP荧光。因此，该方法可用于选择在Syn7002中整合和表达异源基因。

实施例4

构建能够在三聚氰胺和亚磷酸盐两者上生长的菌株

上文的实施例证明了Syn7002中两种独立的无抗生素选择方法。通过双重选择产生的菌株可能对污染生物更为强健。因此，Mel5，最佳三聚氰胺生长菌株之一，是用pSJ135(单独的ptxD基因；SEQ ID NO:93)或 pSJ141(ptxD和yfp)转化，并在AD7-Mel 1xPhi板上选择阳性转化体。与 Syn7002 WT背景的情况一样，通过这种选择方法(图7B)可以轻松获得阳性转化体，并在完全分离的表达YFP的转化体中测量YFP荧光(图7C)。与在常规AD7中生长的MelPhi或Syn7002 WT亲本菌株相比，菌株 Mel5-A0935ptxD(“MelPhi”)能够在AD7-Mel Phi20x液体培养基中生长，尽管速率稍较慢(图9A)。如预测的，Syn7002 WT不能在AD7-Mel Phi20x 培养基中生长(图9A)。这示出了在同一基底中使用三聚氰胺和Phi两者进行双重选择是可能的。图13示出了Syn7002、Mel5、A0935ptxD和MelPhi 菌株在包括各种培养基的板上的生长。

实施例5

菌株Mel5-A0935ptxD能够抵抗蓄意的污染

本发明涉及适合于在开放系统中室外培养的蓝细菌菌株。在这些条件下，该菌株应能够竞争过其他菌株，以成为在潜在受污染系统中的优势种群。为了确定获得菌株的强健性，设计了实验，其中蓄意将用于 Mel5-A0935ptxD(在AD7-Mel Phi 20x中)的起始培养物大量过量污染，组成型表达YFP(来自P

实施例6

菌株Mel5-A0935ptxD的生长可扩展性

通过在生长室中于AD7-Mel Phi 20x培养基中的2x 1L带挡板的锥形烧瓶(2L的总体积)中生长11天，测试了Mel5-A0935ptxD在较大规模培养物中生长的能力。细菌在开始的24小时内生长非常快，并且逐渐减少到约 10的OD(图14)。生长速率减慢的解释是，稀释的培养物在开始的24小时内允许更多的光照，并且随着培养物变得更加浑浊而在该阶段之后变得基本上受光照限制，因此生长更慢。

实施例7

构建能够利用NADP+代替NAD+的MelPhi菌株

由于蓝细菌具有比NAD+更多的NADP+，生成了MelPhi菌株的新衍生物，其中PtxD酶(密码子优化的；SEQ ID NO:90)突变，使用NADP+ 代替NAD+，具有的突变基因的多核苷酸序列在SEQ ID NO:91中示出。使用引物RF_ptxD_F(SEQ ID NO:95)和RF_ptxD_R(SEQ ID NO:96)，使用 pSJ135作为模板，Phusion聚合酶(NEB)和如van den Ent,等人,J BiochemBiophys Methods,67:67-74(2006)中描述的RF克隆方法，对ptxD基因的序列突变，得到质粒pSJ165。ptxD基因中的突变(Glu175Ala和Ala176Arg)模拟了Woodyer,R.等人,FEBS J.,272:3816-27(2005)中描述的那些突变，先前示出增加PtxD对NADP+的特异性。如上文描述，用pSJ165转化Mel5。将ptxD突变体菌株以MelPhiAQ表示，并且将其生长与使用分批补料策略的MelPhi进行比较，每天添加三聚氰胺以继续生长至更高的密度。图15 示出了两种菌株的生长相似，并且达到的最高密度为约70的OD

实施例8

可以在高浓度三聚氰胺中生长的Mel5菌株的进化

Mel5菌株在包括2mM三聚氰胺的培养基中进化，并且可以在4mM 三聚氰胺中生长(图5)。可以在更高浓度的三聚氰胺中生长的菌株可能甚至更抵抗污染，因此Mel5菌株在12mM的三聚氰胺上进一步进化。将Mel5 培养物涂布于包含12mM三聚氰胺代替常规2mM的AD7-Mel板上，并如上文描述进行培养。大约2周后，将出现的菌落在相同条件下，在具有12mM 三聚氰胺的AD7-Mel板中重新划线进一步的4次。在划线的最初12个菌落中，将3个看似更强健的生长菌株(在板上)培养在具有12mM三聚氰胺作为氮源的AD7液体培养基中。将最强健的菌株即由此生成的新进化的Mel5 菌株(“Mel5evo”)的生长与Mel5进行比较。如图16中示出，原始菌株不能在12mM三聚氰胺中生长，但进化后的菌株生长至相当高的OD

总结

本发明工程菌株的重要考虑是，在当前价格和本研究中使用的浓度下，三聚氰胺将是比硝酸盐更经济的氮源，使用三聚氰胺时成本降低24％(参见表3)。

表3：硝酸盐、三聚氰胺、磷酸盐和亚磷酸盐的成本估算

备注：基于来自Alibaba.com网站上的数据(2019年3月25日访问)，数值为最低价格。

而且，由于三聚氰胺不用作农业肥料，将其用作氮源将消除农业中使用的富氮肥料的竞争。此外，随着三聚氰胺水平在生长24小时内降至使用 LC-MS/MS检测水平以下，最终培养物上清液中残留的三聚氰胺不会成为采用该技术的阻碍因素。

亚磷酸盐的额外选择使菌株具有“双刃剑”，尤其是在培养物的早期阶段，污染物种更难以克服，从而使携带这两种修饰的菌株成为优势种群，而无需灭菌或添加抗生素。此外，该策略消除了水平基因转移抗生素抗性盒的风险[Ventola,P T.40:277-83(2015a)；Ventola,P T.40:344-52(2015b)； von Wintersdorff等人,Frontiers inmicrobiology.7:10.3389/fmicb.2016.00173 (2016)]。

本文的结果表明，TriA突变调控通过三聚氰胺途径的通量，使得其更有效地被使用。Mel5evo菌株无需在线进料设备等(比分批培养更加昂贵)即可使分批培养达到高密度。MelPhiAQ菌株生长良好，并且可以提高需要更高NADPH浓度的生物分子的产量(因为使用突变的PtxD酶将亚磷酸盐转化为磷酸盐会将NADP+转化为NADPH，从而增加其内部浓度)。

本发明的菌株为高密度培养提供了两种不同的策略。第一种策略是使用Mel5和相关的工程蓝细菌菌株进行分批补料。第二种策略是使用 Mel5evo蓝细菌菌株以高浓度的三聚氰胺(最高至少12mM)进行分批培养。

总之，这项工作首次描述了能够在高达12mM的三聚氰胺作为唯一氮源上生长的海洋蓝细菌菌株，将亚磷酸盐选择作为可以利用NADP+代替NAD+的蓝细菌和亚磷酸盐代谢菌株中有效选择策略的用途。最后，我们开发了独特的菌株，其能够使用三聚氰胺和亚磷酸盐两者分别作为唯一的N 和P源。即使当污染大量过量存在时，该菌株也能够抵抗由其他蓝细菌的蓄意污染，并且对于“绿色”生物技术应用而言，该菌株应证明是有用的基底菌株。

文献

Angermayr,S.A.,Paszota,M.,Hellingwerf,K.J.,2012.Engineering acyanobacterial cell factory for production of lactic acid.Applied andenvironmental microbiology.78,7098-106.10.1128/AEM.01587-12.

Arnon,D.I.,McSwain,B.D.,Tsujimoto,H.Y.,Wada,K.,1974. Photochemicalactivity and components of membrane preparations from blue-greenalgae.I.Coexistence of two photosystems in relation to chlorophyll a andremoval of phycocyanin.Biochim Biophys Acta.357,231-45.

Begemann,M.B.,Zess,E.K.,Walters,E.M.,Schmitt,E.F.,Markley,A. L.,Pfleger,B.F.,2013.An organic acid based counter selection system forcyanobacteria.PLoS One.8,e76594.10.1371/journal.pone.0076594.

Bisson,C.,Adams,N.B.P.,Stevenson,B.,Brindley,A.A.,Polyviou,D., Bibby,T.S.,Baker,P.J.,Hunter,C.N.,Hitchcock,A.,2017.The molecular basis ofphosphite and hypophosphite recognition by ABC-transporters.Nat Commun.8,1746.10.1038/s41467-017-01226-8.

Braekevelt,E.,Lau,B.P.,Feng,S.,Menard,C.,Tittlemier,S.A.,2011.Determination of melamine,ammeline,ammelide and cyanuric acid in infantformula purchased in Canada by liquid chromatography-tandem massspectrometry.Food Addit Contam Part A Chem Anal Control Expo Risk Assess. 28,698-704.10.1080/19440049.2010.545442.

Choi,S.Y.,Wang,J.Y.,Kwak,H.S.,Lee,S.M.,Um,Y.,Kim,Y.,Sim,S. J.,Choi,J.I.,Woo,H.M.,2017.Improvement of squalene production from CO

Clark,R.L.,McGinley,L.L.,Purdy,H.M.,Korosh,T.C.,Reed,J.L., Root,T.W.,Pfleger,B.F.,2018.Light-optimized growth of cyanobacterial cultures:Growthphases and productivity of biomass and secreted molecules in light-limitedbatch growth.Metab Eng.47, 230-242.10.1016/j.ymben.2018.03.017.

Collier,J.L.,Grossman,A.R.,1992.Chlorosis induced by nutrientdeprivation in Synechococcus sp.strain PCC 7942:not all bleaching is thesame. Journal of bacteriology.174,4718-26.

Davies,F.K.,Work,V.H.,Beliaev,A.S.,Posewitz,M.C.,2014. Engineeringlimonene and bisabolene production in wild type and a glycogen-deficientmutant of Synechococcus sp.PCC 7002.Frontiers in bioengineering andbiotechnology.2,21.10.3389/fbioe.2014.00021.

Dexter,J.,Armshaw,P.,Sheahan,C.,Pembroke,J.T.,2015.The state ofautotrophic ethanol production in Cyanobacteria.J Appl Microbiol.119, 11-24.10.1111/jam.12821.

Elhai,J.,Wolk,C.P.,1988.A versatile class of positive-selectionvectors based on the nonviability of palindrome-containing plasmids thatallows cloning into long polylinkers.Gene.68,119-138.Doi 10.1016/0378-1119(88)90605-1.

Englund,E.,Pattanaik,B.,Ubhayasekera,S.J.,Stensjo,K.,Bergquist,J.,Lindberg,P.,2014.Production of squalene in Synechocystis sp.PCC 6803. PLoSOne.9,e90270.10.1371/journal.pone.0090270.

Fathima,A.M.,Chuang,D.,Lavina,W.A.,Liao,J.,Putri,S.P.,Fukusaki, E.,2018.Iterative cycle of widely targeted metabolic profiling for theimprovement of 1-butanol titer and productivity in Synechococcus elongatus.Biotechnol Biofuels.11,188.10.1186/s13068-018-1187-8.

Feingersch,R.,Philosof,A.,Mejuch,T.,Glaser,F.,Alalouf,O.,Shoham,Y.,Beja,O.,2012.Potential for phosphite and phosphonate utilization byProchlorococcus.ISME J.6,827-34.10.1038/ismej.2011.149.

Frigaard,N.U.,Sakuragi,Y.,Bryant,D.A.,2004.Gene inactivation in thecyanobacterium Synechococcus sp.PCC 7002 and the green sulfur bacteriumChlorobium tepidum using in vitro-made DNA constructs and naturaltransformation.Methods Mol Biol.274,325-40.10.1385/1-59259-799-8:325.

Gomez-Garcia,M.R.,Fazeli,F.,Grote,A.,Grossman,A.R.,Bhaya,D.,2013.Role of polyphosphate in thermophilic Synechococcus sp.from microbialmats.Journal of bacteriology.195,3309-19.10.1128/JB.00207-13.

Gordon,G.C.,Korosh,T.C.,Cameron,J.C.,Markley,A.L.,Begemann, M.B.,Pfleger,B.F.,2016.CRISPR interference as a titratable,trans-acting regulatorytool for metabolic engineering in the cyanobacterium Synechococcus sp.strainPCC 7002.Metab Eng.38,170-179.10.1016/j.ymben.2016.07.007.

Halfmann,C.,Gu,L.,Gibbons,W.,Zhou,R.,2014.Genetically engineeringcyanobacteria to convert CO

Hirota,R.,Abe,K.,Katsuura,Z.I.,Noguchi,R.,Moribe,S.,Motomura,K.,Ishida,T.,Alexandrov,M.,Funabashi,H.,Ikeda,T.,Kuroda,A.,2017.A novelbiocontainment strategy makes bacterial growth and survival dependent onphosphite.Sci Rep.7,44748.10.1038/srep44748.

Kanda,K.,Ishida,T.,Hirota,R.,Ono,S.,Motomura,K.,Ikeda,T., Kitamura,K.,Kuroda,A.,2014.Application of a phosphite dehydrogenase gene as a noveldominant selection marker for yeasts.J Biotechnol.182, 68-73.10.1016/j.jbiotec.2014.04.012.

Kato,A.,Takatani,N.,Ikeda,K.,Maeda,S.I.,Omata,T.,2017.Removal of theproduct from the culture medium strongly enhances free fatty acid productionby genetically engineered Synechococcus elongatus.Biotechnol Biofuels.10,141.10.1186/s13068-017-0831-z.

Liu,H.,Naismith,J.H.,2008.An efficient one-step site-directeddeletion, insertion,single and multiple-site plasmid mutagenesis protocol.BMCBiotechnol.8,91.10.1186/1472-6750-8-91.

Loera-Quezada,M.M.,Leyva-Gonzalez,M.A.,Velazquez-Juarez,G., Sanchez-Calderon,L.,Do Nascimento,M.,Lopez-Arredondo,D., Herrera-Estrella,L.,2016.Anovel genetic engineering platform for the effective management of biologicalcontaminants for the production of microalgae.Plant Biotechnol J.14,2066-76.10.1111/pbi.12564.

Lopez-Arredondo,D.L.,Herrera-Estrella,L.,2012.Engineering phosphorusmetabolism in plants to produce a dual fertilization and weed controlsystem.Nat Biotechnol.30,889-93.10.1038/nbt.2346.

Ludwig,M.,Bryant,D.A.,2011.Transcription profiling of the modelcyanobacterium Synechococcus sp.strain PCC 7002 by next-gen(SOLiD) sequencingof cDNA.Frontiers in microbiology.2,41.

Ludwig,M.,Bryant,D.A.,2012.Synechococcus sp.strain PCC 7002transcriptome:acclimation to temperature,salinity,oxidative stress,andmixotrophic growth conditions.Frontiers in microbiology.3,354.

Markley,A.L.,Begemann,M.B.,Clarke,R.E.,Gordon,G.C.,Pfleger,B. F.,2015.Synthetic biology toolbox for controlling gene expression in thecyanobacterium Synechococcus sp.strain PCC 7002.ACS Synth Biol.4, 595-603.10.1021/sb500260k.

Martinez,A.,Osburne,M.S.,Sharma,A.K.,DeLong,E.F.,Chisholm,S. W.,2012.Phosphite utilization by the marine picocyanobacterium ProchlorococcusMIT9301.Environ Microbiol.14, 1363-77.10.1111/j.1462-2920.2011.02612.x.

Motomura,K.,Sano,K.,Watanabe,S.,Kanbara,A.,Gamal Nasser,A.H., Ikeda,T.,Ishida,T.,Funabashi,H.,Kuroda,A.,Hirota,R.,2018.Synthetic phosphorusmetabolic pathway for biosafety and contamination management ofcyanobacterial cultivation.ACS Synth Biol.10.1021/acssynbio.8b00199.

Nahampun,H.N.,Lopez-Arredondo,D.,Xu,X.,Herrera-Estrella,L., Wang,K.,2016.Assessment of ptxD gene as an alternative selectable marker forAgrobacterium-mediated maize transformation.Plant Cell Rep.35, 1121-1132.10.1007/s00299-016-1942-x.

Pandeya,D.,Campbell,L.M.,Nunes,E.,Lopez-Arredondo,D.L.,Janga, M.R.,Herrera-Estrella,L.,Rathore,K.S.,2017.ptxD gene in combination with phosphiteserves as a highly effective selection system to generate transgenic cotton(Gossypium hirsutum L.).Plant Mol Biol.95, 567-577.10.1007/s11103-017-0670-0.

Perez,A.A.,Liu,Z.,Rodionov,D.A.,Li,Z.,Bryant,D.A.,2016.Complementation of cobalamin auxotrophy in Synechococcus sp.strain PCC 7002and validation of a putative cobalamin riboswitch in vivo.Journal ofbacteriology.10.1128/JB.00475-16.

Polyviou,D.,Hitchcock,A.,Baylay,A.J.,Moore,C.M.,Bibby,T.S.,2015.Phosphite utilization by the globally important marine diazotrophTrichodesmium.Environmental microbiology reports.7, 824-30.10.1111/1758-2229.12308.

Ruffing,A.M.,2014.Improved free fatty acid production incyanobacteria with Synechococcus sp.PCC 7002 as host.Frontiers inbioengineering and biotechnology.2,17.10.3389/fbioe.2014.00017.

Schoepp,N.G.,Stewart,R.L.,Sun,V.,Quigley,A.J.,Mendola,D., Mayfield,S.P.,Burkart,M.D.,2014.System and method for research-scale outdoorproduction of microalgae and cyanobacteria.Bioresour Technol.166, 273-81.10.1016/j.biortech.2014.05.046.

Shabestary,K.,Anfelt,J.,Ljungqvist,E.,Jahn,M.,Yao,L.,Hudson,E.P.,2018.Targeted repression of essential genes to arrest growth and increasecarbon partitioning and biofuel titers in cyanobacteria.ACS Synth Biol.7,1669-1675.10.1021/acssynbio.8b00056.

Shaw,A.J.,Lam,F.H.,Hamilton,M.,Consiglio,A.,MacEwen,K., Brevnova,E.E.,Greenhagen,E.,LaTouf,W.G.,South,C.R.,van Dijken,H., Stephanopoulos,G.,2016.Metabolic engineering of microbial competitive advantage for industrialfermentation processes.Science.353, 583-6.10.1126/science.aaf6159.

Stevens,S.E.,Patterson,C.O.,Myers,J.,1973.Production of hydrogenperoxide by blue-green algae-a survey.J Phycol.9,427-430

van den Ent,F.,and

Ventola,C.L.,2015a.The antibiotic resistance crisis:part 1:causes andthreats.P T.40,277-83.

Ventola,C.L.,2015b.The antibiotic resistance crisis:part 2:managementstrategies and new agents.P T.40,344-52.

von Wintersdorff,C.J.H.,Penders,J.,van Niekerk,J.M.,Mills,N.D.,Majumder,S.,van Alphen,L.B.,Savelkoul,P.H.M.,Wolffs,P.F.G.,2016.Dissemination of antimicrobial resistance in microbial ecosystems throughhorizontal gene transfer.Frontiers in microbiology. 7.10.3389/fmicb.2016.00173.

Wang,X.,Liu,W.,Xin,C.,Zheng,Y.,Cheng,Y.,Sun,S.,Li,R.,Zhu,X.G., Dai,S.Y.,Rentzepis,P.M.,Yuan,J.S.,2016.Enhanced limonene production incyanobacteria reveals photosynthesis limitations.Proceedings of the NationalAcademy of Sciences of the United States of America.113, 14225-14230.10.1073/pnas.1613340113.

Woodyer R.,Zhao H.,van der Donk WA.,2005.Mechanistic investigation ofa highly active phosphite dehydrogenase mutant and its application for NADPHregeneration.FEBS J.Aug；272(15):3816-27.

Xu,Y.,Alvey,R.M.,Byrne,P.O.,Graham,J.E.,Shen,G.,Bryant,D.A.,2011.Expression of genes in cyanobacteria:adaptation of endogenous plasmidsas platforms for high-level gene expression in Synechococcus sp.PCC 7002.Methods Mol Biol.684,273-93。

序列表

<110> 南洋理工大学(Nanyang Technological University)

<120> 使用无抗生素选择的遗传工程蓝细菌在未灭菌条件下生长

<130> PPI21171099SG

<150> 10201810863R

<151> 2018-12-04

<160> 96

<170> PatentIn version 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> D08807

<400> 1

gcactgtggc aaggaaatcg 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> D08808

<400> 2

tcgcctttat ggaggatggc 20

<210> 3

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> D98496993

<400> 3

taaaaaagac tttatgactg ctttactg 28

<210> 4

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D77036

<400> 4

ggctcaaaag acatcattta gg 22

<210> 5

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> D98847023

<400> 5

gaaggttttc tgttatctga aattcctccc taaatgatgt cttttgagcc aaaggtgctt 60

gtgtctcaac 70

<210> 6

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> D98847024

<400> 6

tcatggtgta tatctcctaa tcaatttaga gcatttcaaa gtaggc 46

<210> 7

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> D98847025

<400> 7

tcgggcctac tttgaaatgc tctaaattga ttaggagata tacaccatg 49

<210> 8

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> D98847026

<400> 8

gggaataatg ttggtcatgg agcagtaaag cagtcataaa gtctttttta tcgctcgtca 60

tttgctttc 69

<210> 9

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> D99280067

<400> 9

tgaagatcaa caccatctat gacttagcc 29

<210> 10

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> D99280068

<400> 10

taaccccatg caaacgccat c 21

<210> 11

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_1

<400> 11

tgccattggt atgagtgaac aagc 24

<210> 12

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_2

<400> 12

tctctccgat tgtaccggtg c 21

<210> 13

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_3

<400> 13

aatggatcaa atcttttatt tgtgaagaaa gtgg 34

<210> 14

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_4

<400> 14

atgatgtggc ccgctcc 17

<210> 15

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_5

<400> 15

tcgtggataa actctttgtg atgatgacc 29

<210> 16

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_6

<400> 16

catgcccaaa ttaccgaaac c 21

<210> 17

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_7

<400> 17

tgctctctga tagtgatatt aattccacc 29

<210> 18

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_8

<400> 18

gaaggtgaac ccattattga taaacc 26

<210> 19

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_9

<400> 19

tccatcaatt tcaaattctc aagtctcg 28

<210> 20

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_10

<400> 20

agcaatcccc tcaaaaaatt tagttcc 27

<210> 21

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_11

<400> 21

tcattggcaa aaaatttacc gattatgc 28

<210> 22

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_12

<400> 22

tgcccaatgt gaccgtgg 18

<210> 23

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_13

<400> 23

tcaaagaaga ataccccgat acctg 25

<210> 24

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Mel_seq_14

<400> 24

tcgatgaacg cctccaagtg g 21

<210> 25

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> D100023580

<400> 25

acccggggat cctctagagc cagatccttt tgcatc 36

<210> 26

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> D100023581

<400> 26

ctgcaggtcg actcttgaag ggagccagaa cataaaaag 39

<210> 27

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> A0935_UCO_F

<400> 27

tgacttggtt cacgtagaaa aaccagaagg gac 33

<210> 28

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> A0936_UCO_R

<400> 28

tgtccactcc ttaatcacta ttcaaaatat tatatttact cagtttttaa g 51

<210> 29

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> D98496996

<400> 29

attaaggagt ggacagccta c 21

<210> 30

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D100141467

<400> 30

acgtgaacca agtcagacaa tc 22

<210> 31

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> D100043610

<400> 31

tagatgatga tgtagaattg tctgctaatt ac 32

<210> 32

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> D100043611

<400> 32

taatgatttc agtacaaatt gctctgc 27

<210> 33

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D100263687

<400> 33

tttgattgtc tgacttggtt cacgtttgag gccgttgatc tagacaaaaa ac 52

<210> 34

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> D100263688

<400> 34

aggagattaa ttccatgggc catc 24

<210> 35

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> D100098818

<400> 35

agaaaaacca gaagggacg 19

<210> 36

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> D101108991

<400> 36

taaagtcaag tagaagatta attccatggg ccatcatcat catcatcatc atc 53

<210> 37

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> D101108992

<400> 37

ggaattaatc ttctacttga ctttatgagt tgggagctcc ttttgcaatc 50

<210> 38

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> D74727

<400> 38

ttcacagagg aaggggaaat tgtc 24

<210> 39

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D74729

<400> 39

tcatatccgg ggcatacatt cg 22

<210> 40

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> D101108989

<400> 40

ttaagctagt tagaagattc agaccatgca aaccctcagc attcaacatg 50

<210> 41

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> D101108990

<400> 41

ggtctgaatc ttctaactag cttaattccg ttcgtacacg aggcgac 47

<210> 42

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> D15106

<400> 42

gttgtaaaac gacggccagt gaattttaag cctggggtga gttgac 46

<210> 43

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> D15107

<400> 43

cgtttccagt tgtccactcc ttaattaatt tctcaaggga aagaaaaaga tttattcc 58

<210> 44

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15108

<400> 44

ttaaaaagca tgacttggtt cacgtacgaa ggttgttttt aaagctaaga ag 52

<210> 45

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15109

<400> 45

caggaaacag ctatgaccat gattatatga aaatgcttca caccatgatt cg 52

<210> 46

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> D15110

<400> 46

gttgtaaaac gacggccagt gaattacaat tgacacaaaa aagagagcaa ag 52

<210> 47

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> D15111

<400> 47

gctccggctt tgacttggtt cacgtgtgac cctcttgcag caacc 45

<210> 48

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> D15112

<400> 48

ttccacggtg tgtccactcc ttaatttgcc tgattatgct tccatcaaaa tttg 54

<210> 49

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> D15113

<400> 49

caggaaacag ctatgaccat gattatatcc gtcacggtgg ctc 43

<210> 50

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> D39394

<400> 50

taggtagtat tggggcatca gg 22

<210> 51

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> D39395

<400> 51

taatctcgat gtgatgattg ctgaagg 27

<210> 52

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> D99047654

<400> 52

attaaggagt ggacacaccg tggaaacgga tgaag 35

<210> 53

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> D99047655

<400> 53

acgtgaacca agtcaaagcc ggagcgcttt tg 32

<210> 54

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> D98646038

<400> 54

attaaggagt ggacaactgg aaacggatga agg 33

<210> 55

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> D98646039

<400> 55

acgtgaacca agtcatgctt tttaagggaa ttgtgc 36

<210> 56

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> 原始TriA

<400> 56

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 57

<211> 1425

<212> DNA

<213> 人工序列

<220>

<223> 瓜类细菌性果斑病菌(Acidovorax avenae subsp. citrulli) NRRL B-12227

<400> 57

atgcaaacgc tcagcatcca gcacggtacc ctcgtcacga tggatcagta ccgcagagtc 60

cttggggata gctgggttca cgtgcaggat ggacggatcg tcgcgctcgg agtgcacgcc 120

gagtcggtgc ctccgccagc ggatcgggtg atcgatgcac gcggcaaggt cgtgttaccc 180

ggtttcatca atgcccacac ccatgtgaac cagatcctcc tgcgcggagg gccctcgcac 240

gggcgtcaac tctatgactg gctgttcaac gttttgtatc cgggacaaaa ggcgatgaga 300

ccggaggacg tagcggtggc ggtgaggttg tattgtgcgg aagctgtgcg cagcgggatt 360

acgacgatca acgacaacgc cgattcggcc atctacccag gcaacatcga ggccgcgatg 420

gcggtctatg gtgaggtggg tgtgagggtc gtctacgccc gcatgttctt tgatcggatg 480

gacgggcgca ttcaagggta tgtggacgcc ttgaaggctc gctctcccca agtcgaactg 540

tgctcgatca tggaggaaac ggctgtggcc aaagatcgga tcacagccct gtcagatcag 600

tatcatggca cggcaggagg tcgtatatca gtttggcccg ctcctgccat taccccggcg 660

gtgacagttg aaggaatgcg atgggcacaa gccttcgccc gtgatcgggc ggtaatgtgg 720

acgcttcaca tggcggagag cgatcatgat gagcggcttc attggatgag tcccgccgag 780

tacatggagt gttacggact cttggatgag cgtctgcagg tcgcgcattg cgtgtacttt 840

gaccggaagg atgttcggct gctgcaccgc cacaatgtga aggtcgcgtc gcaggttgtg 900

agcaatgcct acctcggctc aggggtggcc cccgtgccag agatggtgga gcgcggcatg 960

gccgtgggca ttggaacaga tgacgggaat tgtaatgact ccgtaaacat gatcggagac 1020

atgaagttta tggcccatat tcaccgcgcg gtgcatcggg atgcggacgt gctgacccca 1080

gagaagattc ttgaaatggc gacgatcgat ggggcgcgtt cgttgggaat ggaccacgag 1140

attggttcca tcgaaaccgg caagcgcgcg gaccttatcc tgcttgacct gcgtcaccct 1200

cagacgactc ctcaccatca tttggcggcc acgatcgtgt ttcaggctta cggcaatgag 1260

gtggacactg tcctgattga cggaaacgtt gtgatggaga accgccgctt gagctttctt 1320

ccccctgaac gtgagttggc gttccttgag gaagcgcaga gccgcgccac agctattttg 1380

cagcgggcga acatggtggc taacccagct tggcgcagcc tctag 1425

<210> 58

<211> 470

<212> PRT

<213> 人工序列

<220>

<223> Mel1 TriA

<400> 58

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Leu Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala

465 470

<210> 59

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel1基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<400> 59

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggc tctttaatgt gctctacccc 300

ggccaaaaag ccatgcgccc cgaagatgtg gccgtggccg tgcggctcta ttgtgccgaa 360

gccgtgcgca gtggtattac caccattaat gataatgccg attccgccat ttaccccggc 420

aatattgaag ccgcgatggc cgtgtatggc gaagtgggtg tgcgggtggt gtacgcccgc 480

atgtttttcg atcgcatgga tggccggatt caaggttatg tggatgccct caaagcccgg 540

agcccccaag tggaactctg ttctattatg gaagaaaccg ccgtggccaa agatcggatt 600

accgccctca gcgatcaata tcacggcacc gccggtggcc gcattagtgt gtggcccgcc 660

cccgccatta cccccgccgt gaccgtggag ggtatgcgtt gggcccaagc ctttgcccgc 720

gatcgggccg tgatgtggac cctccacatg gccgaaagcg atcatgatga acggctccac 780

tggatgtctc ccgccgaata tatggaatgt tacggcctcc tcgatgaacg cctccaagtg 840

gcccactgtg tgtattttga tcgcaaagat gtgcggctcc tccatcgcca caatgtgaaa 900

gtggccagtc aagtggtgtc caatgcctac ctcggcagtg gtgtggcccc cgtgcccgaa 960

atggtggaac gtggcatggc cgtgggcatt ggcaccgatg atggtaattg taatgattcc 1020

gtgaatatga ttggcgatat gaaatttatg gcccatattc accgggccgt gcatcgcgat 1080

gccgatgtgc tcacccccga aaaaattctc gaaatggcca ccattgatgg cgcccgcagt 1140

ctcggtatgg atcatgaaat tggctccatt gaaaccggta aacgggccga tctcattctc 1200

ctcgatctcc gccaccccca aaccaccccc caccatcacc tcgccgccac cattgtgttt 1260

caagcctacg gtaatgaagt ggataccgtg ctcattgatg gcaatgtggt gatggaaaat 1320

cgccggctca gttttctccc ccccgaacgg gaactcgcct ttctcgaaga agcccaaagt 1380

cgcgccaccg ccattctcca acgcgccaat atggtggcca atcccgcctg acgcagcctc 1440

taa 1443

<210> 60

<211> 474

<212> PRT

<213> 人工序列

<220>

<223> Mel4 TriA.

<400> 60

Met Gln Thr Leu Ser Ile Gln His Gly Thr Leu Val Thr Met Asp Gln

1 5 10 15

Tyr Arg Arg Val Leu Gly Asp Ser Trp Val His Val Gln Asp Gly Arg

20 25 30

Ile Val Ala Leu Gly Val His Ala Glu Ser Val Pro Pro Pro Ala Asp

35 40 45

Arg Val Ile Asp Ala Arg Gly Lys Val Val Leu Pro Gly Phe Ile Asn

50 55 60

Ala His Thr His Val Asn Gln Ile Leu Leu Arg Gly Gly Pro Ser His

65 70 75 80

Gly Arg Gln Leu Tyr Asp Trp Phe Phe Asn Val Leu Tyr Pro Gly Gln

85 90 95

Lys Ala Met Arg Pro Glu Asp Val Ala Val Ala Val Arg Leu Tyr Cys

100 105 110

Ala Glu Ala Val Arg Ser Gly Ile Thr Thr Ile Asn Asp Asn Ala Asp

115 120 125

Ser Ala Ile Tyr Pro Gly Asn Ile Glu Ala Ala Met Ala Val Tyr Gly

130 135 140

Glu Val Gly Val Arg Val Val Tyr Ala Arg Met Phe Phe Asp Arg Met

145 150 155 160

Asp Gly Arg Ile Gln Gly Tyr Val Asp Ala Leu Lys Ala Arg Ser Pro

165 170 175

Gln Val Glu Leu Cys Ser Ile Met Glu Glu Thr Ala Val Ala Lys Asp

180 185 190

Arg Ile Thr Ala Leu Ser Asp Gln Tyr His Gly Thr Ala Gly Gly Arg

195 200 205

Ile Ser Val Trp Pro Ala Pro Ala Ile Thr Pro Ala Val Thr Val Glu

210 215 220

Gly Met Arg Trp Ala Gln Ala Phe Ala Arg Asp Arg Ala Val Met Trp

225 230 235 240

Thr Leu His Met Ala Glu Ser Asp His Asp Glu Arg Leu His Trp Met

245 250 255

Ser Pro Ala Glu Tyr Met Glu Cys Tyr Gly Leu Leu Asp Glu Arg Leu

260 265 270

Gln Val Ala His Cys Val Tyr Phe Asp Arg Lys Asp Val Arg Leu Leu

275 280 285

His Arg His Asn Val Lys Val Ala Ser Gln Val Val Ser Asn Ala Tyr

290 295 300

Leu Gly Ser Gly Val Ala Pro Val Pro Glu Met Val Glu Arg Gly Met

305 310 315 320

Ala Val Gly Ile Gly Thr Asp Asp Gly Asn Cys Asn Asp Ser Val Asn

325 330 335

Met Ile Gly Asp Met Lys Phe Met Ala His Ile His Arg Ala Val His

340 345 350

Arg Asp Ala Asp Val Leu Thr Pro Glu Lys Ile Leu Glu Met Ala Thr

355 360 365

Ile Asp Gly Ala Arg Ser Leu Gly Met Asp His Glu Ile Gly Ser Ile

370 375 380

Glu Thr Gly Lys Arg Ala Asp Leu Ile Leu Leu Asp Leu Arg His Pro

385 390 395 400

Gln Thr Thr Pro His His His Leu Ala Ala Thr Ile Val Phe Gln Ala

405 410 415

Tyr Gly Asn Glu Val Asp Thr Val Leu Ile Asp Gly Asn Val Val Met

420 425 430

Glu Asn Arg Arg Leu Ser Phe Leu Pro Pro Glu Arg Glu Leu Ala Phe

435 440 445

Leu Glu Glu Ala Gln Ser Arg Ala Thr Ala Ile Leu Gln Arg Ala Asn

450 455 460

Met Val Ala Asn Pro Ala Trp Arg Ser Leu

465 470

<210> 61

<211> 1443

<212> DNA

<213> 人工序列

<220>

<223> Mel4基因序列

<220>

<221> RBS

<222> (5)..(10)

<220>

<221> 基因

<222> (19)..(1443)

<223> triA基因序列

<400> 61

agttaggaga ttcagaccat gcaaaccctc agcattcaac atggcaccct cgtgacgatg 60

gatcaatatc gccgggtgct cggcgatagc tgggtgcatg tgcaagatgg ccgcattgtg 120

gccctcggtg tgcatgccga atctgtgccc ccccccgccg atcgtgtgat tgatgcccgc 180

ggtaaagtgg tgctccccgg ttttattaat gcccataccc acgtgaatca aattctcctc 240

cgtggtggtc cctctcacgg tcgccaactc tatgattggt tctttaatgt gctctacccc 300