掌桥专利:专业的专利平台
掌桥专利
首页

生产天冬氨酸和β-丙氨酸的重组宿主细胞和方法

文献发布时间:2023-06-19 11:35:49


生产天冬氨酸和β-丙氨酸的重组宿主细胞和方法

优先权要求

本申请要求于2018年6月25日提交的美国临时申请号62/689,265,其全部内容通过引用并入本文。

政府利益

本发明是由美国能源部资助在美国政府的支持下完成的,资助号为DE-EE0007565。美国政府拥有本发明的某些权利。

涉及序列表

本申请含有经EFS-web递交的序列表,出于所有目的,其全部内容通过引用并入本文。创建于2019年6月19日的ASCII拷贝的名称为Lygos_0016_01_WO_ST25.txt,大小为196KB。

发明背景

天冬氨酸是根据1973年的低效率酶促分批工艺生产的,该工艺使用固定化的富含天冬氨酸酶的大肠杆菌细胞提取物将氨和富马酸转化为天冬氨酸。从历史上讲,天冬氨酸曾用于生产人造食品甜味剂阿斯巴甜,天冬氨酸作为聚天冬氨酸在各种应用中具有巨大潜力,所述应用例如防风雨和防腐蚀涂料、家用和建筑分散剂、可生物降解的单层保水剂以及用于尿布或敷料的超吸收性凝胶。不幸的是,现有工艺无法产生高收益来支持新的市场增长。因此,需要新的低成本、节能、高产的制造方法。

类似地,β-丙氨酸是通过使天冬氨酸与固定的富含天冬氨酸β-脱羧酶的德阿昆哈假单胞菌(Pseudomonas dacunhae)细胞提取物反应而生产的。β-丙氨酸是一种非必需氨基酸,其在运动营养市场中用作增强性能的补充剂。

本公开内容提供了通过使用糖原料的微生物发酵来生产天冬氨酸和β-丙氨酸的重组宿主细胞和方法。根据本公开内容的各种实施方案的天冬氨酸和β-丙氨酸的生产利用了有效的总碳转化途径;在以葡萄糖为原料的情况下,每摩尔葡萄糖的化学计量理论收率为2摩尔天冬氨酸或2摩尔β-丙氨酸。在一些实施方案中,CO

发明概述

在第一方面,本发明提供了能够生产天冬氨酸的重组宿主细胞,其包含一种或多种编码天冬氨酸生物合成途径的异源核酸,其中天冬氨酸生物合成途径的酶包括草酰乙酸形成酶和天冬氨酸形成酶。本发明还提供了能够生产β-丙氨酸的重组宿主细胞,其包含一种或多种编码β-丙氨酸生物合成途径的异源核酸,其中β-丙氨酸生物合成途径的酶包括草酰乙酸形成酶、天冬氨酸形成酶和β-丙氨酸形成酶。在一些实施方案中,重组宿主细胞是细菌细胞。在一些实施方案中,细菌细胞是大肠杆菌、谷氨酸棒状杆菌(Corynebacteriumglutamicum)或Pantoea ananatis。

在一些实施方案中,草酰乙酸形成酶是丙酮酸羧化酶、磷酸烯醇丙酮酸羧化酶和磷酸烯醇丙酮酸羧化激酶。在一些实施方案中,重组宿主细胞包含编码草酰乙酸形成酶的异源核酸,其与SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:35具有至少40%的同源性。

在一些实施方案中,天冬氨酸形成酶是天冬氨酸脱氢酶或天冬氨酸转氨酶。在一些实施方案中,重组宿主细胞包含编码天冬氨酸形成酶的异源核酸,其与SEQ ID NO:9、SEQID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:33或SEQ ID NO:36具有至少40%的同源性。

在一些实施方案中,β-丙氨酸形成酶是天冬氨酸1-脱羧酶。在一些实施方案中,重组宿主细胞包含编码天冬氨酸1-脱羧酶的异源核酸,其与SEQ ID NO:29、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40具有至少40%的同源性。

在第二方面,本发明提供了还包含一种或多种基因的遗传破坏的重组宿主细胞,其中一种或多种基因编码乳酸脱氢酶、琥珀酸脱氢酶亚单位或其组合。在一些实施方案中,一种或多种基因与SEQ ID NO:1、SEQ ID NO:2、SEQ I DNO:10、SEQ ID NO:11或其任何组合具有至少40%的同源性。

在第三方面,本发明提供了培养重组宿主细胞足够长的时间段的方法,以生产天冬氨酸或β-丙氨酸。在一些实施方案中,该方法还包括厌氧发酵。在一些实施方案中,该方法以g-天冬氨酸或β-丙氨酸/g-葡萄糖的至少25%的产率生产天冬氨酸或β-丙氨酸。

在第四方面,本发明提供了从发酵液回收天冬氨酸或β-丙氨酸的方法。

在另一个方面,本文提供了分离天冬氨酸或其盐的方法,包括:

在发酵液中培养本文所利用的重组宿主细胞,以生产天冬氨酸或其盐;

将宿主细胞与发酵液分开(优选通过离心),以生产澄清的发酵液;

任选地,浓缩澄清的发酵液,以提供浓缩的发酵液;

任选地,将浓缩的发酵液与离子交换树脂或活性炭吸附剂接触;

酸化澄清的发酵液或浓缩的发酵液,以沉淀天冬氨酸或其盐;和

分离所沉淀的天冬氨酸或其盐。

在一个实施方案中,发酵液维持在约pH 6至约pH 8。在另一个实施方案中,酸化之后,通过除去挥发性液体浓缩澄清的发酵液。例如,可以蒸馏出诸如水的挥发物以提供浓缩的发酵液。在另一个实施方案中,在浓缩或酸化之前,通过超滤或纳滤过滤澄清的发酵液。在另一个实施方案中,使浓缩的发酵液与离子交换树脂或活性炭吸附剂接触。在另一个实施方案中,将澄清的发酵液用例如木炭的脱色剂处理。在另一个实施方案中,用无机酸或基于树脂的酸进行酸化。无机酸的非限制性实例包括硫酸、磺酸例如对甲苯磺酸、盐酸和其他氢卤酸、硝酸、高氯酸等。基于树脂的酸的非限制性实例包括聚苯乙烯磺酸等。在另一个实施方案中,通过过滤分离天冬氨酸。在另一个实施方案中,结晶后获得的上清液经历后续的一次或多次结晶以提供更多分离的天冬氨酸或其盐。在一些实施方案中,分离的天冬氨酸或其盐通过重结晶进一步纯化。上清液或滤液中的天冬氨酸或其盐可以通过离心、加热、冷却和过滤中的一种或多种来浓缩。在另一个实施方案中,发酵液包含至少约20g/l的天冬氨酸或其盐。在另一个实施方案中,所浓缩的酸化的发酵液包含至少约70g/l、至少约80g/l或至少约90g/l的天冬氨酸或其盐。在另一个实施方案中,存在于发酵液中的至多约80%或至多约90%或大于约90%的天冬氨酸或其盐被分离。在另一个实施方案中,分离的天冬氨酸或其盐纯度为约85%或约90%或更高。

在另一个实施方案中,细胞是细菌细胞。在另一个实施方案中,细胞是谷氨酸棒状杆菌。在另一个实施方案中,细胞还包含:一种或多种编码天冬氨酸(aspartate即asparticacid)形成酶的异源核酸,所述天冬氨酸形成酶选自天冬氨酸脱氢酶和天冬氨酸转氨酶;和一种或多种编码草酰乙酸形成酶的异源核酸,所述草酰乙酸形成酶选自丙酮酸羧化酶、磷酸烯醇丙酮酸羧化酶和磷酸烯醇丙酮酸羧化激酶。在另一个实施方案中,细胞能够在厌氧条件下生产天冬氨酸。在另一个实施方案中,细胞还包含一种或多种编码琥珀酸脱氢酶亚单位的基因的一个或多个破坏。在另一个实施方案中,细胞还包含一种或多种编码乳酸脱氢酶的基因的一个或多个破坏。

附图的简要说明

图1提供了本公开内容的天冬氨酸途径和β-丙氨酸途径的酶的示意图。

图2提供了根据本公开内容的天冬氨酸分离的非限制性和示例性实施方案的示意图。

详述

本公开内容提供了用于生物生产和纯化天冬氨酸的重组宿主细胞、材料、方法和实施方案。尽管本公开内容描述了特定于L-天冬氨酸的细节,但是本领域普通技术人员将认识到可以进行各种改变,并且可以在不背离本发明的情况下以等同物替代。本公开内容不限于特定的核酸、表达载体、酶、生物合成途径、宿主微生物、工艺或对映异构体,因为它们可以发生变化。本文所使用的术语仅出于描述特定实施方案的目的,并且不应解释为限制性的。由于天冬氨酸包含两种不同的对映异构体(D-天冬氨酸(与R-天冬氨酸同义)和L-天冬氨酸(与S-天冬氨酸同义)),因此所公开的与L-天冬氨酸相关的许多材料、方法和实施方案也涉及D-天冬氨酸。另外,根据本发明,可以做出许多修改以适应特定情况、材料、物质组成、工艺、工艺步骤或工艺流程。所有这些修改都在所附权利要求书的范围内。

第1节:定义

除非另有说明,否则本技术的实践将采用有机化学、药理学、免疫学、分子生物学、微生物学、细胞生物学和重组DNA的常规技术,它们在本领域技术范围内。参见例如Sambrook,Fritsch and Maniatis,Molecular Cloning:A Laboratory Manual,2

除非上下文另有明确说明,否则如本说明书和权利要求书中所用,单数形式“a”、“an”和“the”包括复数形式。

如本文所用,术语“包含”旨在表示化合物、组合物和工艺包括所列举的要素,但不排除其他要素。当用于定义化合物、组合物和工艺时,“基本上由……组成”应表示排除对该组合具有任何重要意义的其他元素。因此,基本上由本文所定义的元素组成的组合物将不会例如从分离和纯化方法中排除痕量污染物。“由……组成”是指排除其他成分中的微量元素。由这些及物术语中的每一个定义的实施方案在本技术的范围内。

所有指定数字表达,例如pH值、温度、时间、浓度和分子量,包括范围,都是近似值,其变化为(+)或(-)1%、5%或10%的增量,例如使用前缀“约”。应理解,尽管并非总是明确地指出,但是所有指定数字表达之前均带有术语“约”。还应理解,尽管并非总是明确指出,但是本文所述的试剂仅是示例性的,其等同物是本领域已知的。如本文所用,范围“约x至y”包括约x至约y。

“盐”衍生自本领域众所周知的各种有机和无机抗衡离子,并且仅作为示例,当所述化合物包含酸性官能团时,包括钠、钾、钙、镁、铵和四烷基铵;当分子包含碱性官能团时,包括有机或无机酸的盐,例如盐酸盐、氢溴酸盐、酒石酸盐、甲磺酸盐、乙酸盐、马来酸盐和草酸盐。盐包括与无机酸或有机酸形成的酸加成盐。适用于形成酸加成盐的无机酸包括但不限于氢卤酸(例如盐酸、氢溴酸、氢碘酸等)、硫酸、硝酸、磷酸等。

适用于形成酸加成盐的有机酸包括、仅作为示例且不限于乙酸、三氟乙酸、丙酸、己酸、环戊烷丙酸、乙醇酸、草酸、丙酮酸、乳酸、丙二酸、琥珀酸、苹果酸、马来酸、富马酸、酒石酸、柠檬酸、棕榈酸、苯甲酸、3-(4-羟基苯甲酰基)苯甲酸、肉桂酸、扁桃酸、烷基磺酸(例如甲磺酸、乙磺酸、1,2-乙烷-二磺酸、2-羟基乙磺酸等)、芳基磺酸(例如苯磺酸、4-氯苯磺酸、2-萘磺酸、4-甲苯磺酸、樟脑磺酸等)、谷氨酸、羟萘甲酸、水杨酸、硬脂酸、粘康酸等。

盐还包括当母体化合物中存在的酸性质子被金属离子(例如碱金属离子、碱土金属离子或铝离子)或铵离子(例如衍生自有机碱的铵离子,所述有机碱例如乙醇胺、二乙醇胺、三乙醇胺、吗啉、哌啶、二甲胺,二乙胺、三乙胺和氨)替代时形成的盐。

在本说明书和所附权利要求书中,将参考许多术语,这些术语应被定义为具有以下含义。

术语“登录号”和类似术语例如“蛋白质登录号”、“UniProt ID”、“基因ID”和“基因登录号”是指指定给特定蛋白质或基因的表达。这些标识符描述了可公开访问的数据库(例如美国国家生物技术信息中心(NCBI))中的基因或蛋白质序列。

如本文所用,术语“异源”是相对于细胞而言非天然的材料。例如,如果以下至少一项为真,则核酸相对于细胞是异源的,相对于该细胞而言,“异源核酸”也是如此:1)不是天然存在于该细胞中的核酸(也就是说,它是“外源”核酸);2)核酸天然存在于给定的宿主细胞中(即“内源于”),但是由该核酸的转录和翻译产生的核酸或RNA或蛋白质在宿主细胞中以非天然的(例如大于或小于天然存在的)数量产生或存在;3)核酸包含编码宿主细胞内源性蛋白质的核苷酸序列,但是其序列不同于编码相同蛋白(具有相同或基本相同的氨基酸序列)的内源性核苷酸序列,通常导致该蛋白质在细胞中大量产生,或在酶的情况下,产生具有改变的(例如,更高或更低或不同)活性的突变形式;和/或4)核酸包含两个或更多个核苷酸序列,它们在细胞中彼此之间没有相同的关系。作为另一个例子,如果蛋白质是通过RNA翻译产生的,或者相应的RNA是通过异源核酸的转录产生的,则该蛋白质相对于宿主细胞是异源的。此外,如果蛋白质是内源蛋白质的突变形式并且该突变是通过基因工程引入的,则该蛋白质相对于宿主细胞也是异源的。

术语“同源”以及其例如“同源性”的变化形式是指核酸或氨基酸序列的相似性,通常在基因的编码序列或蛋白质的氨基酸序列的情况下。可以使用已知氨基酸或编码序列(“参考序列”)进行有用蛋白质的同源性搜索,以鉴定同源编码序列或具有相似序列的蛋白质,从而可能执行与参考序列定义的蛋白质相同的有用功能。如本领域技术人员将理解的,例如但不限于通过BLAST(https://blast.ncbi.nlm.nih.gov)搜索来确定与参考蛋白质具有同源性的蛋白质。具有高百分比同源性的蛋白质极有可能发生与参考蛋白质相同的生化反应。在某些情况下,具有大于40%同源性的两种酶将执行相同的生化反应,且同源性越高(即40%、50%、60%、70%、80%、90%或高于95%的同源性),这两种蛋白质具有相同或相似功能的可能性就越大。与参考蛋白具有至少60%的同源性、在某些情况下至少40%的同源性的蛋白质被定义为基本上同源。根据本公开内容,可以在宿主细胞中使用与参考序列基本上同源的任何蛋白质。

一般而言,同源蛋白质具有实质上的序列同一性。一组同源蛋白质一般具有一个或多个在共有序列蛋白质类别的所有成员中保守的特定氨基酸。蛋白质相对于共有序列的序列同一性百分比是通过使蛋白质序列与共有序列比对确定的。本领域技术人员将认识到各种序列比对算法适用于将蛋白质与共有序列比对。参见例如Needleman,SB等人,“Ageneral method applicable to the search for similarities in the amino acidsequence of two proteins.”Journal of Molecular Biology 48(3):443-53(1970)。相对于共有序列比对蛋白质序列之后,蛋白质具有共有序列中相同位置所描述的氨基酸的位置百分比决定了序列同一性百分比。当在共有序列中存在简并氨基酸(即B、Z、X、J或“+”)时,简并氨基酸所描述的任何氨基酸都可存在于蛋白质的比对位置处,以使蛋白质在比对位置处与共有序列相同。如果无法区分两个紧密相关的氨基酸,则使用以下一个字母的符号——“B”表示天冬氨酸或天冬酰胺;“Z”是指谷氨酰胺或谷氨酸;“J”是指亮氨酸或异亮氨酸;“X”或“+”是指任何氨基酸。

共有序列中的破折号(-)表示在该指定位置不存在氨基酸。共有序列中的加号(+)表示在该指定位置可存在任何氨基酸。因此,本文中共有序列中的加号表示该氨基酸通常是不保守的;当与共有序列比对时,同源酶序列可以在指示“+”的位置具有任何氨基酸。

除了通过与给定共有序列的序列同一性百分比来鉴定有用的酶以外,还可以通过在查询蛋白序列中相对于共有序列存在高度保守的氨基酸残基来鉴定在本文提供的组合物和方法中有用的酶。对于本文提供的每个共有序列,描述了许多高度保守的氨基酸残基。可用于本文提供的组合物和方法中的酶包括那些在与共有序列中所示残基比对的位置上包含大量且有时是全部高度保守的氨基酸的酶。本领域技术人员将认识到,与同一性百分比一样,可以在将查询蛋白序列相对于给定的共有序列进行比对后,比较查询蛋白序列中与在共有序列中指定的每个高度保守氨基酸比对的氨基酸,从而确定查询蛋白序列中这些高度保守的氨基酸是否存在。

具有同样的特定功能的蛋白质并不总是由序列同一性百分比来定义或限制。在某些情况下,与参考蛋白质具有低序列同一性百分比的蛋白质能够执行与参考蛋白质相同的生化反应。这样的蛋白质可以具有使得能够共享特定功能的三维结构,但不一定具有序列相似性。这样的蛋白质具有的序列相似性可能不足以表明它们是通过共同祖先的进化而同源的,因此它们不会被BLAST搜索或其他基于序列的搜索所鉴定。因此,在本公开内容的一些实施方案中,同源蛋白质包括缺乏实质上的序列相似性但具有实质上的功能相似性和/或实质上的结构相似性的蛋白质。

如本文所用,当与在细胞中编码酶的核酸或酶本身结合使用时,术语“表达”是指在细胞中产生的可以是内源或外源(异源)酶的酶。在这些情况下,术语“过表达”是指在内源酶的情况下,与野生型相比,酶以更高的水平产生,即,酶水平增加。本领域技术人员理解,可以通过增加强度或改变用于驱动编码序列表达的启动子的类型,增加核糖体结合位点或Kozak序列的强度,增加mRNA转录物,改变密码子使用,增加酶的稳定性等来实现酶的过表达。

术语“表达载体”或“载体”是指可以例如通过转导、转化或感染被引入宿主细胞中的核酸和/或包含核酸的组合物,从而使细胞然后产生(即表达)的不是细胞而言天然的核酸和/或蛋白质或以相对于细胞而言非天然的方式产生,其包含在这样引入的核酸中或由其编码。因此,“表达载体”包含待由宿主细胞表达的核酸(通常是DNA)。任选地,表达载体可以包含在有助于实现核酸进入宿主细胞的材料中,例如与病毒、脂质体、蛋白质包衣等相关的材料。适用于本公开内容的各个方面和实施方案的表达载体包括那些可以将核酸序列与任何优选或所需的操作元件一起插入或已经插入其中的表达载体。因此,表达载体可以被转移到宿主细胞中并且通常在其中复制(尽管在一些实施方案中,也可以采用提供“瞬时”表达的不可复制载体)。在一些实施方案中,使用整合入染色体、线粒体或质体DNA中的表达载体。在其他实施方案中,使用了染色体外复制的表达载体。典型的表达载体包括质粒,并且表达载体通常包含载体中核酸转录所需的操作元件。这样的质粒以及其他表达载体在本文中进行了描述或为本领域普通技术人员所熟知。

本文使用术语“发酵(ferment、fermentative和fermentation)”来描述在产生有用化学物质的条件下培养微生物,所述条件包括但不限于发生有氧或无氧微生物生长的条件。

术语“重组宿主细胞”和“重组宿主微生物”在本文可互换使用,是指可以(或已经)通过表达载体的插入转化的活细胞。本文所述的宿主细胞或微生物可以是原核细胞(例如,真细菌界的微生物)或真核细胞。如本领域技术人员将理解的,原核细胞缺乏膜结合的核,而真核细胞具有膜结合的核。

术语“分离的”或“纯的”是指实质上例如大于50%或大于75%,或基本上例如大于90%、95%、98%或99%的不含通常会以其原始状态(例如,自然发现的状态或首次生产时存在的状态)伴随其的成分的材料。另外,对“纯的”材料的任何引用旨在指代分离的或纯的材料。

如本文所用,术语“核酸”及其变化形式应通用于聚脱氧核糖核苷酸(含2-脱氧-D-核糖)、聚核糖核苷酸(含D-核糖)、聚脱氧核糖核苷酸的片段和聚核糖核苷酸的片段。“核酸”还可以是指其为嘌呤或嘧啶碱基的N-糖苷的任何其他类型的多核苷酸,并且是指含有非核苷酸主链的其他聚合物,条件是该聚合物含有允许如DNA和RNA中发现的碱基配对和碱基堆积的构型的核碱基。如本文所用,核苷酸和多核苷酸的符号是IUPAC-IUB生化命名委员会(Biochem.9:4022,1970)推荐的那些。本文中还可以相对于其序列指“核酸”,核酸中不同核苷酸出现的顺序,因为核酸中核苷酸的序列通常定义其生物学活性,例如,如在编码区序列中,由启动子和编码区组成的基因中的核酸编码一个基因的产物,该产物可以是RNA,例如rRNA、tRNA或mRNA,也可以是蛋白质(其中一个基因编码蛋白质,mRNA和蛋白质都是该基因的“基因产物”)。

在本公开内容中,术语“遗传破坏”是指改变基因组、染色体或基于质粒的基因表达的几种方式。遗传破坏的非限制性实例包括CRISPR、RNAi、核酸缺失、核酸插入、核酸置换、核酸突变、敲除、提前终止密码子和转录启动子修饰。在本公开内容中,“遗传破坏”与“遗传修饰”、“遗传突变”和“遗传改变”可互换使用。遗传破坏导致基因表达改变和/或蛋白质活性改变。改变的基因表达包括降低、消除和增加的基因表达水平。在一些例子中,基因表达导致蛋白质表达,在这种情况下,术语“基因表达”与“蛋白质表达”同义。

如本文所用,术语“任选”或“任选地”表示随后描述的特征或结构可能存在或可能不存在,或者随后描述的事件或情况可能发生或可能不发生,并且该描述包括存在特定特征或结构的实例以及不存在该特征或结构的实例,或者事件或情况发生的实例以及事件或情况没有发生的实例。

如本文所用,“重组”是指通过人工干预改变遗传物质。通常,重组是指通过分子生物学(重组DNA技术)方法(包括克隆和重组),对细胞或病毒或表达载体中的DNA或RNA进行操作。重组还可以指通过随机或定向诱变对细胞或病毒中的DNA或RNA进行操作。通常可以参考其与天然存在的对应物(“野生型”)的不同之处描述“重组”细胞或核酸。另外,提及已被“工程改造”或“修饰”的细胞或核酸以及那些术语的变化形式旨在指重组细胞或核酸。

如本文所用,术语“转导”、“转化”、“转染”及其变化形式是指将一种或多种核酸引入细胞。出于实用目的,核酸必须在细胞中稳定维持或复制足够的时间,以使其能够为称为“已转导”、“已转化”或“已转化”的细胞表达其编码的功能或产物。如本领域技术人员将认识到的,核酸的稳定维持或复制可以如通过染色体整合发生的那样通过将核酸序列掺入细胞染色体DNA例如基因组中,或者如自由复制质粒发生的那样通过染色体外复制而发生。当病毒具有“感染性”时,它可以被稳定地维持或复制:当它转导宿主微生物时,可以复制并(且没有任何互补性病毒或载体的好处)将与原始的转导表达载体相同的后代表达载体例如病毒传播到其他微生物,其中后代表达载体具有相同的繁殖能力。

如本文所用,“天冬氨酸”旨在表示化学式为C

在pH值高于天冬氨酸的pKa的条件下(例如,使用碱(如氢氧化钠)时,pH约>3.9),天冬氨酸被去质子化为天冬氨酸阴离子C

此外,天冬氨酸阴离子能够与阳离子形成离子键以产生天冬氨酸盐。术语“天冬氨酸盐(aspartate)”旨在表示多种天冬氨酸盐形式,并且可与“天冬氨酸盐(aspartatesalt)”互换使用。天冬氨酸盐的非限制性实例包括天冬氨酸钠(CAS No.3792-50-5)和天冬氨酸铵(CAS No.130296-88-7)。

天冬氨酸盐可以各种水合状态结晶。例如,“天冬氨酸一水合物”旨在表示分子量为173.1g/mol的C

在pH值低于天冬氨酸的pKa的条件下(例如pH约<3.9),天冬氨酸阴离子被质子化形成天冬氨酸。在本文中,“天冬氨酸阴离子”也可以与“天冬氨酸”互换使用,并且本领域技术人员理解这些术语是同义词。

本公开的天冬氨酸和天冬氨酸盐是通过发酵微生物从生物学产生的有机组分合成的。例如,通过本公开内容的重组宿主细胞从糖的发酵中合成天冬氨酸、天冬氨酸盐或其前体。本领域技术人员理解,前缀“生物”或形容词“基于生物的”可用于区分这些生物产生的天冬氨酸和天冬氨酸盐与那些衍生自石油原料的天冬氨酸和天冬氨酸盐。如本文所用,“天冬氨酸”被定义为“基于生物的天冬氨酸”,而“天冬氨酸盐”被定义为“基于生物的天冬氨酸盐”。

如本文所用,“β-丙氨酸”旨在表示化学式为C

此外,β-丙氨酸阴离子能够与阳离子形成离子键以产生β-丙氨酸盐。术语“β-丙氨酸盐”旨在表示各种β-丙氨酸盐形式。

如本文所用,术语“基本上厌氧的”当用于提及培养或生长条件时旨在表示氧的量小于液体介质中溶解氧的饱和度的约10%。该术语还旨在包括保持有小于约1%氧气的气氛的液体或固体生长培养基的密封室。

术语“副产物(byproduct或by-product)”是指与靶分子的生物产生有关的不期望的化学物质。在本公开内容中,“副产物”旨在表示在天冬氨酸的生物合成期间可能积累的任何氨基酸、氨基酸前体、化学品、化学前体、有机酸、有机酸前体、生物燃料、生物燃料前体或小分子。在某些情况下,“副产物”的积累可能会降低发酵的靶产物(例如天冬氨酸)的产率、效价或生产率。

氧化还原辅助因子烟酰胺腺嘌呤二核苷酸NAD有两种形式——磷酸化和非磷酸化。术语NAD(P)既指磷酸化(NADP)形式,又指非磷酸化(NAD)形式,并且包括两种形式的氧化形式(NAD

在说明书和权利要求书中记载了温度、效价、产率、吸氧率(OUR)和pH的各种值。应当理解,这些值不是那么精确的。但是,除非另有说明,否则这些值可以近似为最右/最后/最低有效数字。例如,约30℃至约42℃的温度范围覆盖了25℃至44℃的范围。应当理解,当数值接近最右/最后/最低有效数字时,所述数值范围还可包括所述最小值和所述最大值。例如,约25℃至约50℃的温度范围覆盖了25℃至50℃的范围。

第2节:生产天冬氨酸和/或β-丙氨酸的重组宿主细胞

2.1宿主细胞

本公开内容提供了经工程改造以产生天冬氨酸和/或β-丙氨酸的重组宿主细胞,其中所述重组宿主细胞包含一种或多种编码一种或多种天冬氨酸途径酶的异源核酸。在某些实施方案中,重组宿主细胞还包含一种或多种异源核酸,其编码一种或多种提高天冬氨酸和/或β-丙氨酸的产率、效价和/或生产率的辅助基因产物(即,除天冬氨酸和/或β-丙氨酸途径酶以外的基因产物)。在特定的实施方案中,重组宿主细胞还包含内源核酸的破坏或缺失,其改善了天冬氨酸和/或β-丙氨酸的产率、效价和/或生产率。在一些实施方案中,重组宿主细胞能够在有氧条件下生产天冬氨酸和/或β-丙氨酸。在一些实施方案中,重组宿主细胞能够在基本上厌氧的条件下产生天冬氨酸和/或β-丙氨酸。与不包含所述异源核酸的亲代宿主细胞相比,重组宿主细胞以增加的效价、产率和生产率生产天冬氨酸和/或β-丙氨酸。

在一些实施方案中,重组宿主细胞还包含一种或多种异源核酸,其编码一种或多种提高天冬氨酸和/或β-丙氨酸产率、效价和/或生产率的辅助基因产物(即除产物途径酶之外的基因产物)。在特定的实施方案中,重组宿主细胞还包含内源核酸的破坏或缺失,其改善了天冬氨酸和/或β-丙氨酸的产率、效价和/或生产率。在一些实施方案中,重组宿主细胞能够在有氧条件下生产天冬氨酸和/或β-丙氨酸。在一些实施方案中,重组宿主细胞能够在基本上厌氧的条件下生产天冬氨酸和/或β-丙氨酸。

在本公开内容的方法的实践中可以使用任何合适的宿主细胞,并且可用于本文提供的组合物和方法中的示例性宿主细胞包括古细菌、原核或真核细胞。在本公开内容的一个实施方案中,重组宿主细胞是原核细胞。在本公开内容的一个实施方案中,重组宿主细胞是真核细胞。在本公开内容的一个实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。在本公开内容的另一个实施方案中,重组宿主细胞是大肠杆菌菌株。在本公开内容的又一个实施方案中,重组宿主细胞是P.ananatis菌株。本文描述了这些重组宿主细胞的构建方法和基因型。

在一些实施方案中,重组宿主细胞能够在基本上厌氧的条件下生长和/或生产天冬氨酸和/或β-丙氨酸,或者重组宿主细胞可以被工程改造为能够在基本上厌氧的条件下生长和/或生产天冬氨酸和/或β-丙氨酸。

2.1.1酵母细胞

在本公开内容的一个实施方案中,重组宿主细胞是酵母细胞。酵母细胞是用于构建重组代谢途径的优秀宿主细胞,所述重组代谢途径包括催化小分子产物产生的异源酶。已经建立了分子生物学技术和编码构建酵母表达载体所必需的遗传元件的核酸,所述遗传元件包括但不限于启动子、复制起点、抗生素抗性标志物、营养缺陷标志物、终止子等。第二,已充分建立通过同源重组将核酸整合/插入酵母染色体中的技术。酵母作为工业发酵宿主还具有许多优势。酵母细胞通常能够耐受高浓度的有机酸,并在低pH下保持细胞活力,并且能够在需氧和厌氧培养条件下生长,并且已经建立了发酵液和发酵方案。当宿主细胞被供给碳水化合物碳源时,该特征导致有效的产物生物合成。

在各种实施方案中,可用于本公开内容的方法的酵母包括以下属的酵母:Aciculoconidium、Ambrosiozyma、Arthroascus、Arxiozyma、Ashbya、Babjevia、Bensingtonia、Botryoascus、Botryozyma、Brettanomyces、Bullera、Bulleromyces、Candida、Citeromyces、Clavispora、Cryptococcus、Cystofilobasidium、Debaryomyces、Dekkara、Dipodascopsis、Dipodascus、Eeniella、Endomycopsella、Eremascus、Eremothecium、Erythrobasidium、Fellomyces、Filobasidium、Galactomyces、Geotrichum、Guilliermondella、Hanseniaspora、Hansenula、Hasegawaea、Holtermannia、Hormoascus、Hyphopichia、Issatchenkia、Kloeckera、Kloeckeraspora、Kluyveromyces、Kondoa、Kuraishia、Kurtzmanomyces、Leucosporidium、Lipomyces、Lodderomyces、Malassezia、Metschnikowia、Mrakia、Myxozyma、Nadsonia、Nakazawaea、Nematospora、Ogataea、Oosporidium、Pachysolen、Phachytichospora、Phaffia、Pichia、Rhodosporidium、Rhodotorula、Saccharomyces、Saccharomycodes、Saccharomycopsis、Saitoella、Sakaguchia、Saturnospora、Schizoblastosporion、Schizosaccharomyces、Schwanniomyces、Sporidiobolus、Sporobolomyces、Sporopachydermia、Stephanoascus、Sterigmatomyces、Sterigmatosporidium、Symbiotaphrina、Sympodiomyces、Sympodiomycopsis、Torulaspora、Trichosporiella、Trichosporon、Trigonopsis、Tsuchiyaea、Udeniomyces、Waltomyces、Wickerhamia、Wickerhamiella、Williopsis、Yamadazyma、Yarrowia、Zygoascus、Zygosaccharomyces、Zygowilliopsis和Zygozyma等。

在各种实施方案中,酵母细胞是选自包含以下非限制性组的种的酵母细胞:白色念珠菌(Candida albicans)、Candida ethanolica、Candida guilliermondii、Candidakrusei、Candida lipolytica、Candida methanosorbosa、Candida sonorensis、Candidatropicalis、Candida utilis、Cryptococcus curvatus、Hansenula polymorpha、Issatchenkia orientalis、Kluyveromyces lactis、Kluyveromyces marxianus、Kluyveromyces thermotolerans、Komagataella pastoris、Lipomyces starkeyi、Pichiaangusta、Pichia deserticola、Pichia galeiformis、Pichia kodamae、Pichiakudriavzevii(P.kudriavzevii)、Pichia membranaefaciens、Pichia methanolica、Pichia pastoris、Pichia salicaria、Pichia stipitis、Pichia thermotolerans、Pichiatrehalophila、Rhodosporidium toruloides、Rhodotorula glutinis、Rhodotorulagraminis、Saccharomyces bayanus、Saccharomyces boulardi、Saccharomycescerevisiae(S.cerevisiae)、Saccharomyces kluyveri、Schizosaccharomyces pombe和Yarrowia lipolytica。本领域技术人员将理解该表以最广泛的含义涵盖酵母。

2.1.2真核细胞

除了酵母细胞之外,其他真核细胞也适合用于根据本公开内容的方法,只要所工程改造的宿主细胞能够生长和/或形成产物。由本公开内容提供的真核宿主细胞的示例性实例包括但不限于属于以下属的细胞:Aspergillus、Crypthecodinium、Cunninghamella、Entomophthora、Mortierella、Mucor、Neurospora、Pythium、Schizochytrium、Thraustochytrium、Trichoderma和Xanthophyllomyces。真核菌株的实例包括但不限于:Aspergillus niger、Aspergillus oryzae、Crypthecodiniumcohnii、Cunninghamellajaponica、Entomophthora coronata、Mortierella alpina、Mucor circinelloides、Neurospora crassa、Pythium ultimum、Schizochytrium limacinum、Thraustochytriumaureum、Trichoderma reesei和Xanthophyllomyces dendrorhous。

2.1.3古细菌细胞

古细菌细胞也适合用于根据本公开内容的方法,并且在本公开内容的一个实施方案中,重组宿主细胞是古细菌细胞。由本公开内容提供的重组古细菌宿主细胞的示例性实例包括但不限于属于以下属的细胞:Aeropyrum、Archaeglobus、Halobacterium、Methanococcus、Methanobacterium、Pyrococcus、Sulfolobus和Thermoplasma。古细菌菌株的实例包括但不限于Archaeoglobus fulgidus、Halobacterium sp.、Methanococcusjannaschii、Methanobacterium thermoautotrophicum、Thermoplasma acidophilum、Thermoplasma volcanium、Pyrococcus horikoshii、Pyrococcus abyssi和Aeropyrumpernix。

2.1.4原核细胞

在本公开内容的一个实施方案中,重组宿主细胞是原核细胞。原核细胞是用于构建重组代谢途径的合适宿主细胞,所述重组代谢途径包括催化小分子产物产生的异源酶。重组原核宿主细胞的示例性实例包括但不限于属于以下属的细胞:Agrobacterium、Alicyclobacillus、Anabaena、Anacystis、Arthrobacter、Azobacter、Bacillus、Brevibacterium、Chromatium、Clostridium、Corynebacterium、Enterobacter、Erwinia、Escherichia、Lactobacillus、Lactococcus、Mesorhizobium、Methylobacterium、Microbacterium、Pantoea、Phormidium、Pseudomonas、Rhodobacter、Rhodopseudomonas、Rhodospirillum、Rhodococcus、Salmonella、Scenedesmun、Serratia、Shigella、Staphlococcus、Strepromyces、Synnecoccus、Vibrio和Zymomonas。原核菌株的实例包括但不限于Bacillus subtilis(B.subtilis)、Brevibacterium ammoniagenes、Bacillusamyloliquefacines、Brevibacterium ammoniagenes、Brevibacterium immariophilum、Clostridium acetobutylicum、Clostridium beigerinckii、谷氨酸棒状杆菌(C.glutamicum)、Enterobacter sakazakii、大肠杆菌(E.coli)、Lactobacillusacidophilus、Lactococcus lactis、Mesorhizobium loti、Pantoea ananatis(P.ananatis)、Pseudomonas aeruginosa、Pseudomonas mevalonii、Pseudomonas pudita、Rhodobacter capsulatus、Rhodobacter sphaeroides、Rhodospirillum rubrum、Salmonella enterica、Salmonella typhi、Salmonella typhimurium、Shigelladysenteriae、Shigella flexneri、Shigella sonnei和Staphylococcus aureus和Vibrionatriegens。

谷氨酸棒状杆菌、大肠杆菌、Vibrio natriegens和P.ananatis是用于根据本公开内容的方法的特别好的原核宿主细胞。谷氨酸棒状杆菌被很好地用于各种氨基酸的工业生产。通常被认为是严格的需氧菌,而谷氨酸棒状杆菌不能在基本上厌氧的条件下生长,它将分解糖并产生一系列发酵产物。在一些实施方案中,重组宿主细胞是谷氨酸棒状杆菌宿主细胞。大肠杆菌能够在基本上厌氧的条件下生长和/或形成产物(即天冬氨酸和/或β-丙氨酸),在小分子产物的工业发酵中得到了很好的利用,并且易于工程改造。与大多数野生型酵母菌株不同,野生型大肠杆菌能够分解代谢戊糖和己糖作为碳源。在本公开内容的一些实施方案中,重组宿主细胞是大肠杆菌宿主细胞。P.ananatis也能够在基本上厌氧的条件下生长;P.ananatis可以在低pH值的环境中生长,从而减少了在发酵过程中为了维持有机酸(例如天冬氨酸)生产而必须添加的碱的量。在一些实施方案中,重组宿主细胞是P.ananatis宿主细胞。Vibrio natriegens是生长最快的微生物之一,倍增时间不到10分钟,适合作为生产宿主。在一些实施方案中,重组宿主细胞是Vibrio natriegens宿主细胞。

2.2天冬氨酸途径和β-丙氨酸途径的酶

在本文某些实施方案中提供的重组宿主细胞具有至少一个从糖酵解中间体或糖酵解产物到天冬氨酸的活性天冬氨酸途径,和/或至少一个从天冬氨酸到β-丙氨酸的活性β-丙氨酸途径。如本文所用,具有活性天冬氨酸途径和/或β-丙氨酸途径的重组宿主细胞产生一种或多种催化天冬氨酸途径和/或β-丙氨酸途径中的每个代谢反应所必需的活性酶,因此能够在合适的条件下培养时,以可测量的产率、效价和/或生产率生产天冬氨酸和/或β-丙氨酸。具有天冬氨酸途径和/或β-丙氨酸途径的重组宿主细胞包含一种或多种编码天冬氨酸途径酶和/或β-丙氨酸途径酶的异源核酸,并且能够生产天冬氨酸和/或β-丙氨酸。

重组宿主细胞可以采用代谢反应的组合来生物合成产生本公开内容的化合物。重组宿主细胞产生的生物合成的化合物包括天冬氨酸盐、天冬氨酸、β-丙氨酸以及天冬氨酸途径和β-丙氨酸途径的中间体、产物和/或衍生物。生物合成的化合物可以在细胞内产生和/或分泌到发酵培养基中。

从糖酵解中间体或糖酵解产物产生天冬氨酸需要两个酶促步骤(图1)。第一步使用草酰乙酸形成酶将磷酸烯醇丙酮酸(一种糖酵解中间体)或丙酮酸(一种糖酵解产物)转化为草酰乙酸。第二步使用天冬氨酸形成酶将草酰乙酸转化为天冬氨酸。这两个步骤都发生在细胞质中。本文所述的天冬氨酸途径从一分子葡萄糖产生两分子天冬氨酸。

表1中列出了可在天冬氨酸途径中起作用的酶。在某些实施方案中,重组宿主细胞包含一种或多种编码1、2、3、4、5、6个或全部7个天冬氨酸途径酶或其任何组合的异源核酸,其中异源核酸以足以生产天冬氨酸的量表达。在各种实施方案中,重组宿主细胞可以包含单个异源核酸的多个拷贝和/或两种或更多种异源核酸的多个拷贝。包含多种异源核酸的重组宿主细胞可以包含任何数量的异源核酸。

需要额外的酶促步骤以将天冬氨酸转化为β-丙氨酸(表1)。该步骤使用天冬氨酸1-脱羧酶将天冬氨酸转化为β-丙氨酸和CO

在本公开内容的某些实施方案中,重组宿主细胞以在基本上厌氧的条件下足以产生天冬氨酸和/或β-丙氨酸的量表达一些或全部的天冬氨酸途径酶和/或一些或全部的β-丙氨酸途径酶。在基本上厌氧的条件下,重组宿主细胞中起氧化NAD(P)H作用的天然有氧代谢途径被下调。因此,NAD(P)H从特定的氧依赖性途径转移到异源天冬氨酸途径,以将NAD(P)H氧化为NAD(P)

本公开内容还提供了用于鉴定和/或构建适合于根据本公开内容的方法使用的天冬氨酸途径和/或β-丙氨酸途径的共有序列(上文定义的)。如下文所述,在各种实施方案中,这些共有序列包含被认为对于底物识别和反应催化是必需的(尽管本发明不受任何作用机理的限制)的活性位点氨基酸残基。因此,本文所提供的共有序列所涵盖的酶在催化由本文所例示的酶之一进行反应的能力方面具有相同或基本上相同或至少实质上相似的酶活性。例如,尽管本文描述的丙酮酸羧化酶与丙酮酸羧化酶共有序列的序列同一性不足,但仍可用于本公开内容的宿主细胞中。

下文实施例6中描述了包含本公开内容的天冬氨酸途径的重组宿主细胞的构建。下文实施例7中描述了这些重组宿主细胞用于天冬氨酸生产的厌氧发酵以及天冬氨酸效价和产率的分析。

2.2.1草酰乙酸形成酶

天冬氨酸途径的第一步包括将糖酵解中间体或产物转化为草酰乙酸。在本公开内容的各种实施方案中,重组宿主细胞包含一种或多种编码草酰乙酸形成酶的异源核酸,其中所述草酰乙酸形成酶是丙酮酸羧化酶(EC#6.4.1.1)、磷酸烯醇丙酮酸羧化酶(EC#4.1.1.31)、形成GTP的磷酸烯醇丙酮酸羧激酶(EC#4.1.1.32)和/或形成ATP的磷酸烯醇丙酮酸羧激酶(EC#4.1.1.49),其中所述重组宿主细胞能够生产天冬氨酸。在一些实施方案中,重组宿主细胞包含编码一种、两种、三种或全部四种上述草酰乙酸形成酶的一种或多种异源核酸(图1和表1)。在许多实施方案中,草酰乙酸形成酶衍生自原核生物来源。在其他实施方案中,草酰乙酸形成酶衍生自真核生物来源。

2.2.1.1丙酮酸羧化酶

本文所述的丙酮酸羧化酶(PYC)(EC#6.4.1.1)催化一分子丙酮酸、一分子碳酸氢根(HCO

在许多实施方案中,PYC衍生自细菌来源。在这些实施方案中的许多实施方案中,PYC衍生自属于选自包含以下组的属的宿主细胞:Corynebacterium、Geobacillus、Rhizobium、Pseudomonas、Mycobacterium、Staphylococcus、Arthrobacter、Sinorhizobium和Methanocaldococcus。细菌PYC的非限制性实例包括谷氨酸棒状杆菌UniProt ID:O54587、Geobacillus thermodenitrificans UniProt ID:A4ILW8、Geobacillusthermodenitrificans UniProt ID:Q05FZ3、Geobacillus stearothermophilus UniProtID:P94448、Geobacillus stearothermophilus UniProt ID:Q8L1N9、Rhizobium etliUniProt ID:Q2K340、Pseudomonas fluorescence UniProt ID:C3KEC5、Pseudomonasfluorescence UniProt ID:E2XMN3、Pseudomonas fluorescence UniProt ID:V7E6C6、Pseudomonas fluorescence UniProt ID:K0WNR6、Pseudomonas fluorescence UniProtID:L7HKS9、Pseudomonas fluorescence UniProt ID:J2Y9J8、Pseudomonas fluorescenceUniProt ID:U1TDW3、Pseudomonas fluorescence UniProt ID:I4K2J5、Pseudomonasfluorescence UniProt ID:G8QB75、Methanocaldococcus jannaschii UniProt ID:Q58626 and Q58628、Mycobacterium smegmatis UniProt ID:L8FHY2、Mycobacteriumsmegmatis UniProt ID:I7G857、Mycobacterium smegmatis UniProt ID:I7FNQ9、Mycobacterium smegmatis UniProt ID:A0R6R9、Mycobacterium smegmatis UniProt ID:L8FKA4、Mycobacterium smegmatis UniProt ID:L8FB92、Mycobacterium smegmatisUniProt ID:Q9F843、Mycobacterium smegmatis UniProt ID:A0QV14和Mycobacteriumsmegmatis UniProt ID:L8FBY1。

在许多实施方案中,PYC衍生自真核来源。在这些实施方案中的许多实施方案中,PYC衍生自属于选自包含以下组的属的宿主细胞:Aspergillus、Paecilomyces、Pichia、Saccharomyces、Phycomyces、Emiliania。真核PYC的非限制性实例包括Aspergillus nigerUniProt ID:Q9HES8、Aspergillus terreus UniProt ID:O93918、Aspergillus oryzaeUniProt ID:Q2UGL1、Paecilomyces variotii UniProt ID:V5FWI7、Pichia kudriavzeviiUniProt ID:A0A099P757、Pichia kudriavzevii UniProt ID:A0A1V2LT98、Pichiakudriavzevii UniProt ID:A0A1Z8JRB6、Saccharomyces cerevisiae UniProt ID:P11154、Saccharomyces cerevisiae UniProt ID:P32327、Phycomyces blakesleeanusUniProt ID:A0A167KQN5、Phycomyces blakesleeanus UniProt ID:A0A167L0T9、Emiliania huxleyi UniProt ID:B9X0T8。

在一些实施方案中,PYC是谷氨酸棒状杆菌PYC(简称为CgPYC;UniProt ID:O54587;SEQ ID NO:15)。

在许多实施方案中,重组宿主细胞包含一种或多种编码PYC的异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PYC活性,并且包含与SEQ ID NO:15具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

2.2.1.2磷酸烯醇丙酮酸羧化酶

本文所述的磷酸烯醇丙酮酸羧化酶(PPC)(EC#4.1.1.31)催化一分子磷酸烯醇丙酮酸和一分子HCO

在许多实施方案中,PPC衍生自原核来源。在这些实施方案中的许多实施方案中,PPC衍生自属于选自包含以下组的属的宿主细胞:Acetobacter、Bacillus、Bradyrhizoibum、Brevibacterium、Chlamydomonas、Clostridium、Escherichia、Mycobacterium、Hyphomicrobium、Methanothermobacter、Methanothermus、Photobacterium、Pseudomonas、Rhodospeudomonas、Roseobacter、Starkeya、Streptomyces、Thermosynechococcus、Thiobacillus、Halothiobacillus、Thermus和Corynebacterium。细菌PPC的非限制性实例包括Clostridium perfingens UniProt ID:Q8XLE8、大肠杆菌UniProt ID:P00864、Mycobacterium tuberculosis UniProt ID:P9WIH3、谷氨酸棒状杆菌UniProt ID:P12880和Thermosynechococcus vulcanus UniProtID:P0A3X6。

在许多实施方案中,PPC衍生自真核来源。在这些实施方案中的许多实施方案中,PPC衍生自属于选自包含以下组的属的宿主细胞:Alternanthera、Amaranthus、Ananas、Annona、Arabidopsis、Atriplex、Beta、Brachiaria、Brassica、Bryophyllum、Candida、Cicer、Citrus、Coccochloris、Coleataenia、Commelina、Crassula、Cucumis、Digitaria、Echinochloa、Embryophyta、Euglena、Flaveria、Gallus、Glycine、Hakea、Haloxylon、Helianthus、Hordeum、Hydrilla、Iris、Kalanchoe、Lilium、Lotus、Lupinus、Malus、Medicago、Megathyrus、Mesembryanthemum、Molinema、Monoraphidium、Musa、Nicotiana、Oryza、Panicum、Persea、Phaeodactylum、Pichia、Pinus、Pisum、Plasmodium、Portulaca、Ricinus、Saccharomyces、Solanum、Sorghum、Spinacia、Steinchisma、Starkeya、Umbilicus、Vicia、Xylosalsola和Zea。在一些实施方案中,PPC衍生自真菌来源。真核PPC的非限制性实例包括Alternanthera ficoidea UniProt ID:Q1XAT8、Arabidopsis thalianaUniProt ID:Q5GM68、Arabidopsis thaliana UniProt ID:Q84VW9、Arabidopsis thalianaUniProt ID:Q8GVE8、Arabidopsis thaliana UniProt ID:Q9MAH0、Gossypium hirsutumUniProt ID:O23946和Pinus halepensis UniProt ID:Q9M3Y3。

在一些实施方案中,PPC是大肠杆菌PPC(简称EcPPC;UniProt ID:P00864;SEQ IDNO:12)。在一些实施方案中,PPC是结核分枝杆菌PPC(简称MtPCKG;UniProt ID:P9WIH3;SEQID NO:13)。在一些实施方案中,PPC是谷氨酸棒状杆菌PPC(简称CgPPC;UniProt ID:P12880;SEQ ID NO:14)。

在许多实施方案中,重组宿主细胞包含编码PPC的一种或多种异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PPC活性,并且包含与SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

在一些实施方案中,重组宿主细胞包含编码PPC的一种或多种异源核酸,其中针对改变的酶特性(例如改变的底物亲和力、辅因子亲和力、改变的反应速率和/或改变的抑制剂亲和力)诱变PPC。在这些实施方案中,PPC变体是一个或多个蛋白质工程化循环的产物。在这些实施方案中,PPC变体包含一个或多个点突变。在这些实施方案中,适合根据本公开内容的方法使用的蛋白质具有PPC活性,并且包含与SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在这些实施方案的一些中,PPC变体具有降低的针对变构抑制剂的亲和力。PPC的变构抑制剂的非限制性实例包括天冬氨酸、乙酰辅酶A和苹果酸。例如,在EcPPC(SEQ ID NO:12)中,天冬氨酸的变构结合位点距离催化位点20埃,并且参与结合天冬氨酸的四个残基是Lys773、Arg832、Arg587和Asn881。在一些实施方案中,与SEQ ID NO:12具有至少40%的序列同一性的蛋白质在一个、一些或所有这些氨基酸上包含突变以减少天冬氨酸的结合。在其中重组宿主细胞包含编码这样的诱变的PPC的一种或多种异源核酸的实施方案中,重组宿主细胞以比缺乏所述诱变的PPC的重组宿主细胞更高的效价和/或产率产生天冬氨酸。

PPC共有序列#1(SEQ ID NO:35)提供了氨基酸序列,其中每个位置鉴定最有可能在PPC中的特定位置发现的氨基酸(如果鉴定了特定氨基酸)或氨基酸的子集(如果位置被鉴定为可变的)。共有序列#1(SEQ ID NO:35)中的许多氨基酸是高度保守的,并且适合根据本公开内容的方法使用的PPC在与共有序列#1(SEQ ID NO:35)中所示氨基酸的位置对齐的位置上将包含相当大数量的和有时所有这些高度保守的氨基酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PPC活性,并且包含与共有序列#1(SEQ ID NO:35)具有至少40%、至少50%、至少60%、至少65%或至少70%的序列同一性的氨基酸序列。例如,EcPPC序列(SEQ ID NO:12)与共有序列#1(SEQ ID NO:35)至少40%相同,因此被共有序列#1(SEQ ID NO:35)所涵盖。

在与SEQ ID NO:35同源的酶中,高度保守的氨基酸是M1、Y5、N11、S13、M14、L15、G16、L19、G20、T22、I23、A26、G28、E36、I38、R39、L41、S42、R46、G48、R53、L56、P70、V71、A72、R73、A74、F75、Q77、F78、L79、N80、L81、N83、A85、E86、Q87、Y88、I91、S92、L111、V125、E131、L132、V133、L134、T135、A136、H137、P138、T139、E140、R143、R144、K149、N154、C156、L157、L160、E169、L177、L180、A182、W185、H186、I190、R191、R194、P195、P197、E200、A201、K202、W203、G204、A206、E209、N210、S211、L212、W213、P217、L220、R221、L235、P241、W247、M248、G249、G250、D251、R252、D253、G254、N255、P256、V258、T259、T263、R271、W272、K273、A274、L277、L279、D281、L285、E288、L289、S290、G303、E309、P310、Y311、R312、K316、R319、L322、T325、L351、W352、P354、L355、C358、Y359、S361、L362、C365、G366、M367、I369、I370、A371、G373、L375、L376、D377、L379、R381、F385、G386、L389、D393、R395、Q396、E397、S398、T399、H401、E407、Y411、G415、D416、Y417、W420、E422、K425、F428、L429、E432、L433、S435、R437、P438、L439、P441、W444、P446、S447、E452、T456、C457、Y471、I473、S474、M475、A476、S480、D481、V482、L483、A484、V485、L487、L488、L489、E491、G493、V500、P502、L503、F504、E505、T506、L507、D509、L510、L520、W525、Y526、R527、I530、Q534、M535、V536、M537、I538、G539、Y540、S541、D542、S543、A544、K545、D546、A547、G548、M550、A552、W554、A555、Q556、Y557、A559、L563、L574、T575、L576、F577、H578、G579、R580、G581、G582、I584、G585、R586、G587、G588、A589、P590、A591、H592、A594、L595、L596、S597、Q598、P599、P600、S602、L603、K604、G606、L607、R608、V609、T610、E611、Q612、G613、E614、M615、I616、R617、F618、K619、G621、L622、P623、Y633、A636、L638、E639、A640、N641、L642、L643、P644、P645、P646、P648、K649、W652、M656、L659、S660、S663、C664、Y667、R668、R672、F677、V678、Y680、F681、R682、A684、T685、P686、E687、E689、L690、K692、L693、P694、L695、G696、S697、R698、P699、A700、K701、R702、P704、G706、G707、V708、E709、L711、R712、A713、I714、P715、W716、I717、F718、W720、Q722、N723、R724、L725、L727、P728、A729、W730、L731、G732、A733、G734、G744、M752、W756、P757、F758、F759、T761、R762、M765、L766、E767、M768、V769、K772、Y781、D782、L785、L790、W791、L793、G794、L797、R798、D804、I805、V808、L809、L817、M818、P822、W823、I828、L830、R831、N832、Y834、P837、L838、N839、L841、Q842、E844、L845、L846、R848、R850、E860、A862、L863、M864、I867、G869、A871、G873、M874、R875、N876、T877和G878。在各种实施方案中,与SEQ ID NO:35同源的PPC酶在与SEQ ID NO:35中鉴定的高度保守的氨基酸相对应的位置处包含至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或有时所有这些高度保守的氨基酸。在一些实施方案中,这些高度保守的氨基酸中的每一个发现于所提供(例如在SEQ ID NO:12中)的所需PPC中。

2.2.1.3磷酸烯醇丙酮酸羧激酶

本文所述的磷酸烯醇丙酮酸羧激酶催化一分子磷酸烯醇丙酮酸和一分子HCO

在许多实施方案中,PCK衍生自细菌来源。在许多这些实施方案中,PCK衍生自属于选自包含以下的组的属的宿主细胞:Actinobacillus、Escherichia、Anaerobiospirillum、Bacillus、Corynebacterium、Cupriavidus、Leishmania、Rhodopseudomonas、Ruminiclostridium、Ruminococcus、Salinivibrio、Selenomonas、Sinorhizobium、Staphylococcus、Mannheimia、Haemophilus和Thermus。细菌PCK的非限制性实例包括Actinobacillus ficoidea UniProt ID:Q6W6X5、Anaerobiospirillumsucciniciproducens UniProt ID:O09460、大肠杆菌UniProt ID:P22259、Anaerobiospirillum succiniciproducens UniProt ID:O09460、Actinobacillussuccinogenes UniProt ID:A6VKV4、谷氨酸棒状杆菌UniProt ID:Q9AEM1、Mannheimiasucciniciproducens UniProt ID:Q65Q60、Ruminococcus albus UniProt ID:B3Y6D3、Selenomonas ruminantium UniProt ID:O83023、Thermus thermophiles UniProt ID:Q5SLL5和Haemophilus influenzae UniProt ID:A5UDR5。

在许多实施方案中,PCK衍生自真核来源。在许多这些实施方案中,丙酮酸羧激酶衍生自属于选自包含以下的组的属的宿主细胞:Alternanthera、Ananas、Arabidopsis、Candida、Clusia、Cucumis、Digitaria、Embryophyta、Hordeum、Iris、Laminaria、Megathyrus、Mus、Nicotiana、Oryza、Pichia、Pisum、Plasmodium、Prunus、Saccharomyces、Skeletonema、Solanum、Solenostemon、Sorghum、Tillandsia、Trypanosoma、Udotea、Urochloa、Vitis、Pichia、Aspergillus、Zoysia和Zea。在一些实施方案中,PCK衍生自真菌来源。真核PCK的非限制性实例包括Arabidopsis thaliana UniProt ID:Q93VK0、Plasmodium falciparum UniProt ID:Q9U750、Saccharomyces cerevisiae UniProt ID:P10963、Pichia kudriavzevii UniProt ID:A0A099NX43和Zoysia japonica UniProt ID:Q5KQS7。

在一些实施方案中,PCK是Actinobacillus succinogenes PCK(简称AsPCKA;UniProt ID:A6VKV4;SEQ ID NO:16)。在一些实施方案中,PCK是谷氨酸棒状杆菌PCK(简称CgPCKG;UniProt ID:Q9AEM1;SEQ ID NO:17)。在一些实施方案中,PCK是大肠杆菌PCK(简称EcPCKA;UniProt ID:P22259;SEQ ID NO:18)。

在许多实施方案中,重组宿主细胞包含编码PCK的一种或多种异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有丙酮酸羧激酶活性,并且包含与SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

2.2.2天冬氨酸形成酶

天冬氨酸途径的第二步包括将草酰乙酸转化为天冬氨酸。在本公开内容的各种实施方案中,重组宿主细胞包含编码天冬氨酸形成酶的一种或多种异源核酸,其中所述天冬氨酸形成酶是天冬氨酸脱氢酶和/或天冬氨酸转氨酶,其中所述重组宿主细胞能够产生天冬氨酸。在一些实施方案中,重组宿主细胞包含编码上述草酰乙酸形成酶中的一种、两种、三种或全部四种的一种或多种异源核酸(图1和表1)。在许多实施方案中,天冬氨酸形成酶衍生自原核来源。在其他实施方案中,天冬氨酸形成酶衍生自真核来源。

2.2.2.1天冬氨酸脱氢酶

本文所述的天冬氨酸脱氢酶(AspDH)(EC#1.4.1.21)催化一分子草酰乙酸、一分子NAD(P)H、一分子NH

在大多数细胞类型中,NAD的库(由还原和氧化形式,即NADH和NAD

AspDH能够利用NADH或NADPH作为辅因子。通常,NADH是在重组宿主细胞的将葡萄糖转化为丙酮酸的糖酵解过程中产生的。在谷氨酸棒状杆菌、P.kudriavzevii、酿酒酵母、P.ananatis和大肠杆菌中,例如,糖酵解中的甘油醛3-磷酸脱氢酶(GAPDH)将NAD

本公开内容的AspDH包括:(1)利用NADH的AspDH;(2)利用NADPH的AspDH;和(3)可以不加选择地利用NADH和NADPH的AspDH。在一些实施方案中,重组宿主细胞包含利用NADH作为辅因子并能够产生天冬氨酸和/或β-丙氨酸的AspDH。在一些实施方案中,重组宿主细胞包含利用NADPH作为辅因子并能够产生天冬氨酸和/或β-丙氨酸的AspDH。在一些实施方案中,重组宿主细胞包含利用NADH和/或NADPH作为辅因子并能够产生天冬氨酸和/或β-丙氨酸的AspDH。在AspDH能够利用NADH和NADPH的实施方案中,重组宿主细胞可进一步包含转氢酶(EC#1.6.1.1、1.6.1.2或1.6.1.5)。

在许多实施方案中,AspDH衍生自原核来源。在许多这些实施方案中,AspDH衍生自属于选自包含以下的组的属的宿主细胞:Bradyrhizobium、Escherichia、Thermotoga、Klebsiella、Cupriavidus、Rhodopseudomonas、Pseudomonas、Variovorax、Delftia、Ralstonia、Burkholderia、Ochrobactrum、Acinetobacter、Dinoroseobacter、Ruegeria、Herbaspirillum和Comamonas。原核AspDH酶的非限制性实例包括Pseudomonas aeruginosaUniProt ID:Q9HYA4(简称PaAspDH)、Cupriavidus taiwanensis UniProt ID:B3R8S4(简称AspDH#2)、Polaromonas sp.UniProt ID:Q126FS(简称AspDH#4)、Klebsiella pneumoniaeUniProt ID:A6TDT8(简称AspDH#9)、Comamonas testosteroni UniProt ID:D0IX49(简称AspDH#12)、Delftia acidovarans UniProt ID:S2WWY2(简称AspDH#14)、Variovoraxsp.UniProt ID:A0A1C6Q9L7(简称AspDH#16)、Thermotoga maritima UniProt ID:Q9X1X6(简称TmAspDH)、Ralstonia solanacearum UniProt ID:Q8XRV9(简称AspDH#3)、Burkholderia thailandensis UniProt ID:Q2T559(简称AspDH#5)、Burkholderiapseudomallei UniProt ID:Q3JFK2(简称AspDH#6)、Ochrobactrum anthropic UniProtID:A6X792(简称AspDH#7)、Acinetobacter sp.UniProt ID:D6JRV1(简称AspDH#8)、Dinoroseobacter shibae UniProt ID:A8LLH8(简称AspDH#10)、Rugeria pomeroyiUniProt ID:Q5LPG8(简称AspDH#11)、Ralstonia eutropha UniProt ID:Q46VA0(简称AspDH#13)、Pseudomonase sp.ENNP23 UniProt ID:A0A1E4W5J7(简称AspDH#15)、Herbaspirillum frisingense UniProt ID:R0EI78(简称AspDH#17)、Burkholderiaceaebacterium 16UniProt ID:A0A0F0FQG4(简称AspDH#18)、Ralstonia sp.GA3-3 UniProtID:R7XIB1(简称AspDH#19)、Cupriavidus sp.SK-3UniProt ID:A0A069IKY7(简称AspDH#20)和Cupriavidus necator UniProt ID:Q46VA0(简称CnAspDH)。

在许多实施方案中,AspDH衍生自古细菌来源。在许多这些实施方案中,AspDH衍生自属于Archaeoglobus属的宿主细胞。古细菌AspDH的非限制性实例是A.fulgidus UniProtID:O28440。

在一些实施方案中,AspDH是Cupriavidus taiwanensis AspDH(简称AspDH#2;UniProt ID:B3R8S4;SEQ ID NO:19)。在一些实施方案中,AspDH是Polaromonas sp.AspDH(简称AspDH#4;UniProt ID:Q126FS;SEQ ID NO:20)。在一些实施方案中,AspDH是Klebsiella pneumoniae AspDH(简称AspDH#9;UniProt ID:A6TDT8;SEQ ID NO:21)。在一些实施方案中,AspDH是Comamonas testosteroni AspDH(简称AspDH#12;UniProt ID:D0IX49;SEQ ID NO:24)。在一些实施方案中,AspDH是Delftia acidovarans AspDH(简称AspDH#14;UniProt ID:S2WWY2;SEQ ID NO:22)。在一些实施方案中,AspDH是Variovoraxsp.AspDH(简称AspDH#16;UniProt ID:A0A1C6Q9L7;SEQ ID NO:23)。在一些实施方案中,AspDH是Pseudomonase aeruginosa AspDH(简称PaAspDH;UniProt ID:Q9HYA4;SEQ ID NO:34)。在一些实施方案中,AspDH是Ralstonia solanacearum UniProt ID:Q8XRV9(简称AspDH#3)。在一些实施方案中,AspDH是Burkholderia thailandensis UniProt ID:Q2T559(简称AspDH#5)。在一些实施方案中,AspDH是Burkholderia pseudomallei UniProt ID:Q3JFK2(简称AspDH#6)。在一些实施方案中,AspDH是Ochrobactrum anthropic UniProtID:A6X792(简称AspDH#7)。在一些实施方案中,AspDH是Acinetobacter sp.UniProt ID:D6JRV1(简称AspDH#8)。在一些实施方案中,AspDH是Dinoroseobacter shibae UniProtID:A8LLH8(简称AspDH#10)。在一些实施方案中,AspDH是Rugeria pomeroyi UniProt ID:Q5LPG8(简称AspDH#11)。在一些实施方案中,AspDH是Ralstonia eutropha UniProt ID:Q46VA0(简称AspDH#13)。在一些实施方案中,AspDH是Pseudomonase sp.ENNP23 UniProtID:A0A1E4W5J7(简称AspDH#15)。在一些实施方案中,AspDH是Herbaspirillumfrisingense UniProt ID:R0EI78(简称AspDH#17)。在一些实施方案中,AspDH是Burkholderiaceae bacterium 16UniProt ID:A0A0F0FQG4(简称AspDH#18)。在一些实施方案中,AspDH是Ralstonia sp.GA3-3 UniProt ID:R7XIB1(简称AspDH#19)。在一些实施方案中,AspDH是Cupriavidus sp.SK-3UniProt ID:A0A069IKY7(简称AspDH#20)。

在许多实施方案中,重组宿主细胞包含编码AspDH的一种或多种异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspDH活性并且包含与SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:34具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspDH活性,并且包含与AspDH#3、AspDH#5、AspDH#6、AspDH#7、AspDH#8、AspDH#10、AspDH#11、AspDH#13、AspDH#15、AspDH#17、AspDH#18、AspDH#19或AspDH#20具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

在一些实施方案中,重组宿主细胞包含编码AspDH的一种或多种异源核酸,其中针对改变的酶特性(例如改变的底物亲和力、辅因子亲和力、改变的反应速率和/或改变的抑制剂亲和力)诱变AspDH。在这些实施方案中,AspDH变体是一个或多个蛋白质工程化循环的产物。在这些实施方案中,AspDH变体包含一个或多个点突变。在这些实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspDH活性并且包含SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:34具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在这些实施方案中,适合于根据本发明的方法使用的蛋白质具有AspDH活性,并且包含与AspDH#3、AspDH#5、AspDH#6、AspDH#7、AspDH#8、AspDH#10、AspDH#11、AspDH#13、AspDH#15、AspDH#17、AspDH#18、AspDH#19或AspDH#20具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在这些实施方案的一些中,AspDH变体具有增加的针对NADH的亲和力。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

AspDH共有序列#2(SEQ ID NO:33)提供了氨基酸序列,其中每个位置鉴定最有可能在AspDH中的特定位置发现的氨基酸(如果鉴定了特定氨基酸)或氨基酸的子集(如果位置被鉴定为可变的)。共有序列#2(SEQ ID NO:33)中的许多氨基酸是高度保守的,并且适合根据本公开内容的方法使用的AspDH在与共有序列#2(SEQ ID NO:33)中所示氨基酸的位置对齐的位置上将包含相当大数量的和有时所有这些高度保守的氨基酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspDH活性,并且包含与共有序列#2(SEQID NO:33)具有至少40%、至少50%、至少60%、至少65%或至少70%的序列同一性的氨基酸序列。例如,PaAspDH序列(SEQ ID NO:34)与共有序列#2(SEQ ID NO:33)至少40%相同,因此被共有序列#2(SEQ ID NO:33)所涵盖。

在与SEQ ID NO:33同源的酶中,高度保守的氨基酸是G8、G10、A11、I12、G13、E69、A71、G72、H73、A75、H79、P82、L84、G87、S94、G96、A97、L98、A110、A111、G114、L120、G123、A124、I125、G126、D129、A130、A133、A134、G137、G138、L139、V142、Y144、G146、R147、K148、P149、W153、T156、P157、E159、D163、L164、I173、F174、G176、A178、A181、A182、P186、K187、N188、A189、N190、V191、A192、A193、T194、A198、G199、G201、L202、T205、V207、L209、A211、D212、P213、N218、H220、A224、G226、A227、F228、G229、L233、P239、L240、N243、P244、K245、T246、S247、A248、L249、T250、S253、R256、A257、N260和I267。在各个实施方案中,与SEQ IDNO:33同源的AspDH酶在与SEQ ID NO:33中鉴定的高度保守的氨基酸相对应的位置处包含至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或有时所有这些高度保守的氨基酸。在一些实施方案中,这些高度保守的氨基酸中的每一个发现于所提供(例如在SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:34中)的所需AspDH中。

SEQ ID NO:33中的氨基酸H220用作一般的酸/碱(尽管本发明不受任何作用机理的限制),并且对于酶活性是必需的;因此,在与SEQ ID NO:33同源的酶中发现了对应于共有序列SEQ ID NO:33中的H220的氨基酸。例如,在SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:23和SEQ ID NO:34中示出的AspDH中发现了对应于共有序列SEQ ID NO:33中的H220的氨基酸。

2.2.2.2天冬氨酸转氨酶

本文描述的天冬氨酸转氨酶(AspB)(EC#2.6.1.1)催化一分子草酰乙酸和一分子谷氨酸转化为一分子天冬氨酸和一分子2-酮戊二酸(与酮戊二酸同义)(图1和表1)。任何酶都适用于本发明,只要该酶能够催化所述AspB反应。

在许多实施方案中,AspB衍生自原核来源。在许多这些实施方案中,AspB衍生自属于选自包含以下的组的属的宿主细胞:Bacillus、Corynebacterium、Escherichia、Mycobacterium、Deinococcus、Giardia、Leishmania、Leptosphaeria、Sinorhizobium和Nostoc。原核AspB的非限制性实例包括谷氨酸棒状杆菌UniProt ID:Q8NTR2(简称CgAspB)、Corynebacterium diphtheriae UniProt ID:Q6NJY4(简称CdAspB)、Deinococcusgeothermalis UniProt ID:Q1IZU0(简称DgAspB)、Mycobacterium tuberculosis UniProtID:O69689(简称MtAspB)。

在许多实施方案中,AspB衍生自真核来源。在许多这些实施方案中,AspB衍生自属于选自包含以下的组的属的宿主细胞:Arabidopsis、Crassostrea、Sulfolobus、Trypanosoma和Xenopus。

在一些实施方案中,AspB是谷氨酸棒状杆菌AspB(简称CgAspB;UniProt ID:Q8NTR2;SEQ ID NO:25)。在一些实施方案中,AspB是C.diphtheriae AspB(简称CdAspB;UniProt IDQ6NJY4;SEQ ID NO:26)。在一些实施方案中,AspB是D.geothermalis AspB(简称DgAspB;UniProt ID:DIP0257;SEQ ID NO:27)。在一些实施方案中,AspB是M.tuberculosis AspB(简称MtAspB;UniProt ID:O69689;SEQ ID NO:28)。

在许多实施方案中,重组宿主细胞包含编码AspB的一种或多种异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspB活性,并且包含与SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27或SEQ ID NO:28具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

AspB共有序列#3(SEQ ID NO:36)提供了氨基酸序列,其中每个位置鉴定最有可能在衍生自棒状杆菌和相关原核生物的AspB中的特定位置发现的氨基酸(如果鉴定了特定氨基酸)或氨基酸的子集(如果位置被鉴定为可变的)。共有序列#3(SEQ ID NO:36)中的许多氨基酸是高度保守的,并且适合根据本公开内容的方法使用的AspB在与共有序列#3(SEQID NO:36)中所示氨基酸的位置对齐的位置上将包含相当大数量的和有时所有这些高度保守的氨基酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有AspB活性,并且包含与共有序列#3(SEQ ID NO:36)具有至少40%、至少50%、至少60%、至少65%或至少70%的序列同一性的氨基酸序列。例如,CgAspB序列(SEQ ID NO:25)与共有序列#3(SEQID NO:36)至少40%相同,因此被共有序列#3(SEQ ID NO:36)所涵盖。

在与SEQ ID NO:36同源的衍生自棒状杆菌和相关原核生物的酶中,高度保守的氨基酸是L25、L30、L32、L34、T35、R36、G37、K38、P39、E42、Q43、L44、D45、L50、L51、L53、P54、G64、D66、R68、N69、Y70、G71、G75、R80、A96、S101、L102、D107、G116、D119、S120、P123、W124、E127、K131、C134、P135、P137、G138、Y139、D140、R141、H142、I145、G150、E152、M153、P157、G162、P163、D164、L171、V172、P176、K179、G180、W182、V184、P185、N189、P190、T191、G192、M206、A209、A210、P211、D212、F213、R214、W217、D218、N219、A220、Y221、V223、L226、A243和G244。

在其中重组宿主细胞包含编码AspB的一种或多种异源核酸并且所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸的许多实施方案中,所述重组宿主细胞可以进一步包含编码谷氨酸脱氢酶(EC#1.4.1.2或1.4.1.3)的异源核酸。需要将AspB产生的酮戊二酸(伴随有天冬氨酸的产生)转换回谷氨酸以用于将来的天冬氨酸转氨酶反应。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有谷氨酸脱氢酶活性。谷氨酸脱氢酶的细节在下文的第2.5.1.1节中公开。

天冬氨酸1-脱羧酶

在本公开内容的β-丙氨酸途径中,β-丙氨酸是通过天冬氨酸的脱羧产生的。本文所述的天冬氨酸1-脱羧酶(PanD)(EC#4.1.1.11)催化一分子天冬氨酸转化为一分子β-丙氨酸和一分子CO

本文提供的能够催化所述PanD反应的蛋白质包括细菌和真核类型。细菌PanD是丙酮酰依赖性脱羧酶,其中通过特定丝氨酸残基(例如,SEQ ID NO:29和37中的S25)的自动催化重排产生共价结合的丙酮酰辅因子。相比之下,真核PanD不具有丙酮酰辅因子,而是具有吡哆醛5'-磷酸辅因子。在一些实施方案中,重组宿主细胞包含编码细菌PanD的异源核酸,并且能够产生β-丙氨酸。在其他实施方案中,重组宿主细胞包含编码真核PanD的异源核酸,并能够产生β-丙氨酸。

在许多实施方案中,PanD衍生自细菌来源。在许多这些实施方案中,PanD衍生自属于选自包含以下的组的属的宿主细胞:Corynebacterium、Escherichia、Helicobacter、Methanocaldococcus、Mycobacterium、Bacillus、Clostridium、Enterococcus、Lactobacillus、Cupriavidus、Arthrobacter、Pseudomonas、Staphlococcus、Streptomyces和Salmonella。细菌PanD的非限制性实例包括谷氨酸棒状杆菌UniProt ID:Q9X4N0(简称CgAPanD)、大肠杆菌UniProt ID:P0A790和Methanocaldococcus jannaschii UniProt ID:Q60358、Arthrobacter aurescens UniProt ID:A1RDH3、Bacillus cereus UniProt ID:A7GN78、Bacillus subtilis UniProt ID:P52999、Burkholderia xenovorans UniProtID:Q143J3、Clostridium acetobutylicum UniProt ID:P58285、Clostridiumbeijerinckii UniProt ID:A6LWN4、Corynebacterium efficiens UniProt ID:Q8FU86、Corynebacterium jeikeium UniProt ID:Q4JXL3、Cupriavidus necator UniProt ID:Q9ZHI5、Enterococcus faecalis UniProt ID:Q833S7、大肠杆菌UniProt ID:Q0TLK2、Helicobacter pylori UniProt ID:P56065、Lactobacillus plantarum UniProt ID:Q88Z02、Mycobacterium smegmatis UniProt ID:A0QNF3、Pseudomonas aeruginosaUniProt ID:Q9HV68、Pseudomonas fluorescens UniProt ID:Q848I5、Staphylococcusaureus UniProt ID:A6U4X7和Streptomyces coelicolor UniProt ID:P58286。

在许多实施方案中,PanD衍生自真核来源。在许多这些实施方案中,PanD衍生自属于选自包含以下的组的属的宿主细胞:Aedes、Drosophila和Tribolium。真核PanD的非限制性实例包括Triboliumcastaneum UniProt ID:A7U8C7、Tribolium castaneum UniProtID:A9YVA8、Aedes aegypti UniProt ID:Q171S0、Drosophila mojavensis UniProt ID:B4KIX9和Dendroctonus ponderosae UniProt ID:U4UTD4。

在一些实施方案中,PanD是谷氨酸棒状杆菌PanD(简称CgPanD;UniProt ID:Q9X4N0;SEQ ID NO:29)。在一些实施方案中,PanD是B.subtilis PanD(简称BsPanD;UniProt ID:P52999;SEQ ID NO:37)。

在一些实施方案中,PanD是T.castaneum PanD(简称TcPanD;UniProt ID:A9YVA8;SEQ ID NO:38)。

在许多实施方案中,重组宿主细胞包含编码PanD的一种或多种异源核酸,其中所述重组宿主细胞能够产生β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PanD活性,并且包含与SEQ ID NO:29、SEQ ID NO:37或SEQ ID NO:38具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

本文提供的细菌和真核PanD中的许多氨基酸是高度保守的,并且与本公开内容的细菌或真核PanD同源的蛋白质可包含对应于相当大数量的高度保守的氨基酸的氨基酸。如上文所述,如果在同源蛋白中发现参考序列中至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或多于95%的高度保守的氨基酸,则认为同源物包含对应于参考序列中的高度保守的氨基酸的相当大数量的氨基酸。

在一些实施方案中,PanD包含细菌PanD,例如CgPanD(SEQ ID NO:29)、BsPanD(SEQID NO:37)或其他细菌PanD。细菌PanD中高度保守的氨基酸是K9、H11、R12、A13、V15、T16、A18、L20、Y22、G24、S25、D29、E42、N51、G52、R54、T57、Y58、I60、G62、G65、G67、N72、G73、A74、A75、A76、G82、D83、V85、I86、Y90、E97、P103和N112。在一些实施方案中,与CgPanD(SEQ IDNO:29)同源的蛋白质包含对应于至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或多于95%的这些高度保守的氨基酸的氨基酸。在一些实施方案中,与BsPanD(SEQ ID NO:37)同源的蛋白质包含对应于至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或多于95%的这些高度保守的氨基酸的氨基酸。

在一些实施方案中,PanD包含真核PanD,例如TcPanD(SEQ ID NO:38)或其他真核PanD。真核PanD中高度保守的氨基酸是V88、P94、D102、L115、S126、V127、T129、H131、P132、F134、N136、Q137、L138、S140、D143、Y145、Q150、T153、D154、L156、N157、P158、S159、Y161、T162、E164、V165、P167、L171、M172、E173、E174、V176、L177、E179、M180、R181、I183、G185、G191、G193、F195、P197、G198、G199、S200、A202、N203、G204、Y205、I207、A210、R211、P216、K219、G222、L229、F232、T233、S234、E235、A237、H238、Y239、S240、K243、A245、F247、G249、G251、G264、P285、V288、T291、G293、T294、T295、V296、G298、A299、F300、D301、C310、K312、W316、H318、D320、A321、A322、W323、G324、G325、G326、A327、L328、S330、R334、L336、L337、G339、D344、S345、V346、T347、W348、N349、P350、H351、K352、L353、L354、A356、Q358、Q359、C360、S361、T362、L364、H367、L371、H375、A379、Y381、L382、F383、Q384、D386、K387、F388、Y389、D390、D394、G396、D397、H399、Q401、C402、G403、R404、A406、D407、V408、K410、F411、W412、M414、W415、A417、K418、G419、G422、H426、F431、R444、G446、P454、N458、F461、Y463、P465、R469、L481、A485、P486、K489、E490、M492、G496、M498、T501、Y502、Q503、N510、F511、F512、R513、V515、Q517、S519、L521、D525、M526、E532、E534、L536。在一些实施方案中,与TcPanD(SEQ ID NO:38)同源的蛋白质包含对应于这些高度保守的氨基酸中的至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少有90%、至少95%或95%以上的氨基酸。

本公开内容提供的PanD中的一些高度保守的氨基酸是严格保守的,并且与本公开内容的PanD同源的蛋白质可以包含一个或多个对应于这些严格保守的氨基酸的氨基酸。

细菌PanD中的严格保守的氨基酸,例如BsPanD(SEQ ID NO:37)和CgPanD(SEQ IDNO:29)是K9、G24、S25、R54和Y58。K9上的ε-胺基团被认为与天冬氨酸上的α-羧基形成离子对,R54被认为与天冬氨酸上的γ-羧基形成离子对,并且Y58被认为将质子提供给延伸的烯醇化反应中间体;因此,这三个氨基酸对于天冬氨酸结合和随后的脱羧作用很重要。另外,残基G24和S25之间的蛋白水解切割产生了对于脱羧酶活性也是必需的N-末端丙酮酰基部分。因此,在一些实施方案中,根据本公开内容适于使用的细菌酶将包含相当大量且有时是所有的对应于SEQ ID NO:37和/或29中的K9、G24、S25、R54和Y58的这些严格保守的氨基酸。

在真核PanD中(例如TcPanD(SEQ ID NO:38))中的严格保守的氨基酸是Q137、H238、K352和R513。Q137和R513与天冬氨酸上的γ-羧基形成盐桥,H238是具有吡哆醛5’-磷酸盐辅因子的吡啶环的碱基堆积残基,并且K352与吡哆醛5’-磷酸盐辅因子形成席夫碱键。因此,这四个氨基酸对于天冬氨酸或辅因子结合以及随后的天冬氨酸脱羧作用很重要,因此,在一些实施方案中,根据本公开内容适于使用的真核生物酶将包含相当大量且有时是所有的对应于SEQ ID NO:38中Q137、H238、K352和R513的这些严格保守的氨基酸。

PanD共有序列提供了氨基酸序列,其中每个位置标识最有可能在PanD的特定位置处存在的氨基酸(如果鉴定出特定氨基酸)或氨基酸子集(如果位置被鉴定为可变)。本公开内容提供了两个PanD共有序列——细菌PanD共有序列#4(SEQ ID NO:39)和真核PanD共有序列#5(SEQ ID NO:40)。

细菌PanD共有序列#4(SEQ ID NO:39)提供了这样的氨基酸序列,其中每个位置标识最有可能在细菌PanD的特定位置处存在的氨基酸(如果鉴定出特定氨基酸)或氨基酸子集(如果位置被鉴定为可变)。共有序列#4(SEQ ID NO:39)中的许多氨基酸是高度保守的,并且适合根据本公开内容的方法使用的细菌PanD将包含相当大量且有时是所有的与共有序列#4(SEQ ID NO:39)中所示氨基酸的位置对齐的位置处的这些高度保守的氨基酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PanD活性并且包含与共有序列#4(SEQ ID NO:39)具有至少40%、至少50%、至少60%、至少65%或至少70%的序列同一性的氨基酸序列。例如,BsPanD(SEQ ID NO:37)与共有序列#4(SEQ ID NO:39)具有至少40%的同一性,因此被共有序列#4(SEQ ID NO:39)所涵盖。

在与SEQ ID NO:39同源的细菌酶中,高度保守的氨基酸是K9、H11、R12、A13、V15、T16、A18、L20、Y22、G24、S25、D29、E42、N51、G52、R54、T57、Y58、I60、G62、G65、G67、N72、G73、A74、A75、A76、G82、D83、V85、I86、Y90、E97、P103和N112。在各种实施方案中,与SEQ ID NO:39同源的细菌酶在对应于SEQ ID NO:39中鉴定的高度保守的氨基酸的位置处包含至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或有时所有的这些高度保守的氨基酸。例如,所有的高度保守的氨基酸均可以在SEQ ID NO:29和37中找到。

在高度保守的氨基酸中,其中五个是严格保守的:K9、G24、S25、R54和Y58对于PanD活性很重要,并且存在于细菌PanD共有序列SEQ ID NO:39中。每种严格保守的氨基酸的功能,尽管本发明不受任何作用机理理论的限制,但每种严格保守的氨基酸的功能如下。K9上的ε-胺基与天冬氨酸上的α-羧基形成离子对,R54与天冬氨酸上的γ-羧基形成离子对,以及Y58将质子提供给延伸的烯醇化反应中间体。SEQ ID NO:39中另外的严格保守的残基是G24和S25,并且G24和S25之间的蛋白水解切割导致产生脱羧酶活性所需的N-末端丙酮酰基部分。与共有序列SEQ ID NO:39同源的细菌酶包含对应于共有序列SEQ ID NO:39中鉴定的所有五个严格保守氨基酸的氨基酸。在一些实施方案中,这些高度保守的氨基酸中的每一个都在所希望的PanD中存在,例如SEQ ID NO:29和SEQ ID NO:37中提供的PanD。

真核PanD共有序列#5(SEQ ID NO:40)提供了氨基酸序列,其中每个位置标识最有可能在真核PanD的特定位置处存在的氨基酸(如果鉴定出特定氨基酸)或氨基酸子集(如果位置被鉴定为可变)。共有序列#5(SEQ ID NO:40)中的许多氨基酸是高度保守的,并且适合根据本公开内容的方法使用的细菌PanD将包含相当大量且有时是所有的与共有序列#5(SEQ ID NO:40)中所示氨基酸的位置对齐的位置处的这些高度保守的氨基酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有PanD活性并且包含与共有序列#5(SEQ ID NO:40)具有至少40%、至少50%、至少60%、至少65%或至少70%的序列同一性的氨基酸序列。例如,TcPanD(SEQ ID NO:38)与共有序列#5(SEQ ID NO:40)具有至少40%的同一性,因此被共有序列#5(SEQ ID NO:40)所涵盖。

在与SEQ ID NO:40同源的真核生物酶中,高度保守的氨基酸是V130、P136、D144、L157、S168、V169、T171、H173、P174、F176、N178、Q179、L180、S182、D185、Y187、Q192、T195、D196、L198、N199、P200、S201、Y203、T204、E206、V207、P209、L213、M214、E215、E216、V218、L219、E221、M222、R223、I225、G227、G234、G236、F238、P240、G241、G242、S243、A245、N246、G247、Y248、I250、A253、R254、P259、K262、G265、L272、F275、T276、S277、E278、A280、H281、Y282、S283、K286、A288、F290、G292、G294、G307、P328、V331、T334、G336、T337、T338、V339、G341、A342、F343、D344、C353、K355、W359、H361、D363、A364、A365、W366、G367、G368、G369、A370、L371、S373、R377、L379、L380、G382、D387、S388、V389、T390、W391、N392、P393、H394、K395、L396、L397、A399、Q401、Q402、C403、S404、T405、L407、H410、L414、H418、A422、Y424、L425、F426、Q427、D429、K430、F431、Y432、D433、D437、G439、D440、H442、Q444、C445、G446、R447、A449、D450、V451、K453、F454、W455、M457、W458、A460、K461、G462、G465、H469、F474、R487、G489、P497、N501、F504、Y506、P508、R512、L525、A529、P530、K533、E534、M536、G540、M542、T545、Y546、Q547、N554、F555、F556、R557、V559、Q561、S563、L565、D569、M570、E576、E578和L580。在各种实施方案中,与SEQ ID NO:40同源的真核生物酶在对应于SEQ ID NO:40中鉴定的高度保守的氨基酸的位置处包含至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%或有时所有这些高度保守氨基酸。例如,例如,所有这些高度保守的氨基酸均可以在SEQ ID NO:38所示的TcPanD中找到。

在高度保守的氨基酸中,其中四个是严格保守的:Q179、H281、K395和R557对于PanD活性很重要,并且存在于真核PanD共有序列(SEQ ID NO:40)中。每种严格保守的氨基酸的功能,尽管本发明不受任何作用机理理论的限制,但每种严格保守的氨基酸的功能如下。Q179和R557与天冬氨酸上的γ-羧基形成盐桥,H281是具有吡哆醛5’-磷酸盐辅因子的吡啶环的碱基堆积残基,并且K395与吡哆醛5’-磷酸盐辅因子形成席夫碱键。因此,这四个氨基酸对于天冬氨酸或辅因子结合以及随后的天冬氨酸脱羧作用很重要。与共有序列SEQID NO:40同源的真核生物酶包含对应于共有序列SEQ ID NO:40中鉴定的所有四个严格保守氨基酸的氨基酸。在一些实施方案中,这些高度保守的氨基酸中的每一个都在所希望的PanD中存在,例如SEQ ID NO:38中提供的PanD。

2.4鉴定和/或改善天冬氨酸途径和/或β-丙氨酸途径中的酶的方法

已经开发了以下示例性方法用于基因的诱变和多样化,用于工程改造靶向酶的具体的性质或增强的性质。本领域技术人员将理解,所公开的方法可以根据所希望的靶酶性质而根据需要进行调整。在一些情况下,所公开的方法适用于工程改造酶,以获得天冬氨酸途径和/或β-丙氨酸途径的更高产率、效价和/或生产率。

本文描述的用于蛋白质诱变、鉴定、表达、纯化和表征的方法是本领域技术人员广泛实践的方法,本领域技术人员将理解,各种各样的商业解决方案可用于此类努力。本领域技术人员将理解,突变蛋白的鉴定包括活性筛选和表型选择。

2.4.1通过诱变产生蛋白质文库

被鉴定为良好诱变起点的酶进入蛋白质工程循环,其包括蛋白质诱变、蛋白质鉴定、蛋白质表达、蛋白质表征、重组宿主细胞表征及其任何组合。通常进行蛋白质工程的迭代轮回以产生具有与模板/原始蛋白质不同的性质的酶变体。通过蛋白质工程改善和/或改变的酶特性的实例包括例如底物结合(K

通常,随机和合理的诱变方法是产生突变蛋白的DNA文库的可接受方法。易错PCR是一种随机诱变方法,在蛋白质工程中广泛用于产生多样性,并且本领域技术人员将认识到,易错PCR不仅快速简便,而且也是一种从野生型DNA模板成功产生具有改变的活性的突变酶的方法。(Wilson,D.S.&Keefe,A.D.Random mutagenesis byPCR.Curr.Protoc.Mol.Biol.第8章,第8.3单元(2001.)。为了帮助增加鉴定具有所希望的改善活性的酶的几率,对少量活性位点突变进行合理诱变也是有用的。本领域的技术人员将理解,结构建模使人们能够鉴定被认为对底物识别重要的活性位点中的氨基酸。可以使用的其他诱变方法,包括DNA改组和组合诱变。在一些实施方案中,诱变步骤进行一次以上,导致工程的迭代轮回。

2.4.2酶表征

将由诱变产生的蛋白质变体整合到重组宿主细胞的基因组中,并分析所得菌株变体的天冬氨酸途径和/或β-丙氨酸途径活性。在一些实施方案中,进行蛋白质工程的迭代轮回以产生具有优化性质的酶变体,其中所述蛋白质工程的迭代轮回包括合理诱变和随机诱变。在这些实施方案中,鉴定了来自前几轮蛋白质工程的选择变体用于进一步的蛋白质工程。此类性质的非限制性实例包括针对特异性和/或转换率的改善的酶动力学,改善的途径通量,增加的代谢物产率,降低的抑制剂亲和力和降低的副产物产率。在一些实施方案中,分析培养基或发酵液中代谢物(例如天冬氨酸、β-丙氨酸)和/或副产物的存在,其中分析方法是HPLC(高效液相色谱)。

2.5辅助蛋白质

除了天冬氨酸和/或β-丙氨酸途径酶,辅助蛋白是在本公开内容的重组宿主细胞中过表达的其他蛋白质,如与对照或不过表达所述蛋白质的宿主细胞相比,辅助蛋白过表达导致天冬氨酸和/或β-丙氨酸增加。辅助蛋白在天冬氨酸和/或β-丙氨酸途径之外起作用,其中每种辅助蛋白均起到间接增强重组宿主细胞产生天冬氨酸和/或β-丙氨酸的能力的作用。辅助蛋白包括具有任何结构或功能的任何蛋白质(天冬氨酸途径酶和β-丙氨酸途径酶除外),当过表达时,其可以增加天冬氨酸和/或β-丙氨酸的产率、效价或生产率。蛋白质类别的非限制性实例包括转录因子、转运蛋白、支架蛋白、减少副产物积累的蛋白质以及再生或合成氧化还原辅因子的蛋白质。

本文在某些实施方案中提供了包含一种或多种编码一种或多种辅助蛋白的异源核酸的重组宿主细胞,与对照细胞或不包含所述一种或多种异源核酸的宿主细胞相比,其中所述重组宿主细胞能够产生更高的天冬氨酸和/或β-丙氨酸产率、效价或生产率。在一些实施方案中,宿主重组细胞天然产生天冬氨酸和/或β-丙氨酸,并且在这些情况下,天冬氨酸和/或β-丙氨酸的产率、效价和/或生产率增加。在其他实施方案中,重组宿主细胞包含一种或多种编码一种或多种天冬氨酸和/或β-丙氨酸途径酶的异源核酸。

在本公开内容的某些实施方案中,重组宿主细胞包含编码一种或多种天冬氨酸和/或β-丙氨酸途径酶的一种或多种异源核酸和编码一种或多种辅助蛋白的一种或多种异源核酸。在这些实施方案的某些实施方案中,可以改造重组宿主细胞以表达更多的这些辅助蛋白。在这些特定的实施方案中,辅助蛋白以更高的水平表达(即与不表达所述辅助蛋白的细胞相比以更高的量产生),并且可以可操作地连接至一个或多个外源启动子或其他调控元件。

在某些实施方案中,重组宿主细胞包含编码一种或多种天冬氨酸和/或β-丙氨酸途径酶和一种或多种辅助蛋白的内源核酸和异源核酸。在某些实施方案中,重组宿主细胞包含一种或多种编码一种或多种天冬氨酸和/或β-丙氨酸途径酶和/或一种或多种辅助蛋白的异源核酸,以及一种或多种编码一种或多种天冬氨酸和/或β-丙氨酸途径酶和/或一种或多种辅助蛋白的内源核酸。

在某些实施方案中,辅助蛋白的内源核酸被原位修饰(即,在宿主细胞基因组中的染色体上)以改变表达水平、活性或特异性。在一些实施方案中,将异源核酸插入辅助蛋白的内源核酸中。

2.5.1用于氧化还原辅因子再循环和生物发生的辅助蛋白

一种类型的辅助蛋白是再循环在天冬氨酸和/或β-丙氨酸途径活性期间产生的氧化还原辅因子的蛋白质。氧化还原平衡是生物体中持续代谢和细胞生长的基础。细胞内氧化还原电位由促进细胞内电子从一个分子转移到另一个分子的氧化还原辅因子决定。酵母中的氧化还原辅助因子包括烟酰胺腺嘌呤二核苷酸、NAD和NADP、黄素核苷酸、FAD和FMN以及铁硫簇(Fe-S簇)。

氧化还原约束在最终产物形成中起重要作用。必须提供额外的还原能力以产生还原度高于底物的还原度的化合物。相反,产生还原度低于底物的还原度的化合物将迫使合成具有较高还原度的副产物,以补偿由底物氧化产生的过量还原力。因此,必须保持氧化还原中性以确保较高的终产物产率。例如,天冬氨酸和/或β-丙氨酸途径与葡萄糖氧化还原平衡,并且在胞质溶胶中化学计量地转换成天冬氨酸和/或-丙氨酸的每摩尔葡萄糖都没有NAD(P)

NAD和NADP辅助因子参与电子转移,并贡献细胞中所有生化反应的约12%(Osterman A.,EcoSal Plus,2009)。NAD由天冬氨酸、磷酸二羟丙酮(DHAP;甘油)、磷酸核糖焦磷酸酯(PRPP)和ATP组装而成。NADP以相同的方式组装并进一步磷酸化。在一些实施方案中,重组宿主细胞包含编码一种或多种促进NAD和NADP辅因子组装的辅助蛋白的异源和/或内源核酸。在一些实施方案中,辅助蛋白包含适合根据本公开内容的方法使用的一种、多种或所有蛋白质,其具有NAD和/或NADP组装能力、NAD和/或NADP转移能力、NAD和/或NADP伴侣能力或其任何组合。

类似地,Fe-S簇促进需要电子转移的各种酶活性。由于铁和硫原子均具有高反应性和对细胞有毒性,因此Fe-S团簇组装需要在活细胞中精心协调的合成途径。三种已知途径是Isc(铁硫簇)系统、Suf(硫形成)系统和Nif(固氮)系统。这些系统中的每一个都具有独特的生理作用,但它们之间共享几个功能组件。首先,半胱氨酸脱硫酶从游离半胱氨酸中释放出硫原子。然后,支架蛋白接收释放的硫用于Fe-S簇组装。最后,将Fe-S簇转移至靶标载脂蛋白。在本公开内容的一些实施方案中,重组宿主细胞包含编码促进Fe-S簇组装的一种或多种辅助蛋白的异源和/或内源核酸。在一些实施方案中,辅助蛋白质包含Isc系统、Suf系统、Nif系统或其任何组合的一种、多种或所有蛋白质。在一些实施方案中,重组宿主细胞包含一种或多种编码一种或多种蛋白质的异源核酸,所述异种核酸适合根据本公开内容的方法使用,所述蛋白质具有半胱氨酸脱硫酶活性、Fe-S簇组装能力、Fe-S簇转移能力、铁伴侣能力或其任何组合。

2.5.1.1谷氨酸脱氢酶

在其中重组宿主细胞包含编码AspB以产生天冬氨酸和/或β-丙氨酸的异源核酸的实施方案中,重组宿主细胞可以进一步包含编码谷氨酸脱氢酶(GDH;EC#1.4.1.2或1.4.1.3)的异源核酸。AspB将一分子草酰乙酸和一分子谷氨酸转化为一分子天冬氨酸和一分子酮戊二酸(图1和表1)。在本公开内容的天冬氨酸和β-丙氨酸途径中,由AspB产生的酮戊二酸(第2.2.2.2节,图1和表1)需要转化回谷氨酸以用于将来的AspB反应,从而使天冬氨酸/β-丙氨酸途径不会被破坏。GDH可使这种酮戊二酸-谷氨酸再循环,同时将NAD(P)H氧化为NAD(P)+。

GDH有两种类型:NAD

如上文关于AspDH的第2.2.2.1节所公开的,NADH通常在重组宿主细胞将葡萄糖转化为丙酮酸的糖酵解过程中产生。例如,在谷氨酸棒状杆菌、P.kudriavzevii、酿酒酵母、P.ananatis和大肠杆菌中,糖酵解中的甘油醛3-磷酸脱氢酶(GAPDH)将NAD

在许多实施方案中,GDH衍生自原核生物来源。在这些实施方案中的许多实施方案中,GDH衍生自属于选自包含以下组的属的宿主细胞:芽孢杆菌属、梭状芽孢杆菌属、棒状杆菌属、埃希氏杆菌属、螺杆菌属、Methanocaldococcus、分支杆菌属、嗜胨菌属(Peptoniphilus)、火球菌属、红细菌属、沙门氏菌属、高温球菌属和栖热菌属。在一些实施方案中,GDH选自共生梭菌UniProt ID:U2D2C5(简称CsGDH;SEQ ID NO:52)、谷氨酸棒状杆菌UniProt ID:P31026(简称CgGDH;SEQ ID NO:53)和不解糖嗜胨菌(Peptoniphilusasaccharolyticus)UniProt ID:P28997(简称PaGDH;SEQ ID NO:54)。

在许多实施方案中,重组宿主细胞包含一种或多种编码GDH的异源核酸,其中所述重组宿主细胞能够产生天冬氨酸和/或β-丙氨酸。在各种实施方案中,适合根据本公开内容的方法使用的蛋白质具有GDH活性并且包含与SEQ ID NO:52、SEQ ID NO:53或SEQ ID NO:54具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

在一些实施方案中,重组宿主细胞包含一种或多种编码GDH的异源核酸,其中GDH被诱变为具有改变的酶特性,例如改变的底物亲和力、辅因子亲和力、改变的反应速率和/或改变的抑制剂亲和力。在这些实施方案中,GDH变体是一个或多个蛋白质工程循环的产物。在这些实施方案中,GDH变体包含一个或多个点突变。在这些实施方案中,适合根据本公开内容的方法使用的蛋白质具有GDH活性,并且包含与SEQ ID NO:52、SEQ ID NO:53或SEQID NO:54具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。在这些实施方案的一些中,GDH变体对NADH的亲和力增加。在许多实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

2.5.1.2利用NADP

在天冬氨酸脱氢酶(AspDH)催化的步骤中,本公开内容的天冬氨酸和β-丙氨酸途径中氧化辅因子(即NAD

在其中重组宿主细胞包含编码利用NADPH的AspDH的异源核酸的实施方案中,重组宿主细胞还包含编码利用NADP

在一些实施方案中,细菌利用NADP

在许多实施方案中,重组宿主细胞包含一种或多种编码利用NADP

在一些实施方案中,除了包含编码利用NADP

2.5.2天冬氨酸运输辅助蛋白

可用于增加天冬氨酸产率、效价和/或生产率的另一类辅助蛋白是能够转运天冬氨酸的氨基酸转运蛋白。在一些实施方案中,重组宿主细胞包含编码一种或多种氨基酸转运蛋白的一种或多种异源和/或内源核酸。在许多实施方案中,氨基酸转运蛋白衍生自原核生物来源。在许多实施方案中,氨基酸转运蛋白衍生自真核生物来源。在一些实施方案中,氨基酸转运蛋白选自酿酒酵母PDR12(简称ScPDR12;UniProt ID:Q02785;SEQ ID NO:30)、酿酒酵母WAR1(简称ScWAR1;UniProt ID:Q03631;SEQ ID NO:31)、粟酒裂殖酵母(Schizosaccharomyces pombe)MAE1(简称SpMAE1;UniProt ID;P50537;SEQ ID NO:32)、马克斯克鲁维酵母PDR12(简称KmPDR12;UniProt ID:W0T9C6;SEQ ID NO:7)、谷氨酸棒状杆菌GLUD(简称CgGLUD;UniProt ID:P48245;SEQ ID NO:41)、谷氨酸棒状杆菌GLUA(简称CgGLUA;UniProt ID:P48243;SEQ ID NO:42)和谷氨酸棒状杆菌GLUC(简称CgGLUC;UniProtID:P48244;SEQ ID NO:43)。

在一些实施方案中,重组宿主细胞包含编码具有天冬氨酸转运蛋白活性,即能够跨细胞膜转运天冬氨酸盐或天冬氨酸的一种或多种蛋白质的一种或多种异源核酸。在一些实施方案中,重组宿主细胞包含编码一种或多种蛋白质的一种或多种异源核酸,所述蛋白质包含与ScPDR12(SEQ ID NO:30)、ScWAR1(SEQ ID NO:31)、SpMAE1(SEQ ID NO:32)或KmPDR12(SEQ ID NO:7)、CgGLUD(SEQ ID NO:41)、CgGLUA(SEQ ID NO:42)或CgGLUC(SEQ IDNO:43)具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。

2.5.3碳固定辅助蛋白

在本公开内容的天冬氨酸和β-丙氨酸途径中,通过将每分子葡萄糖转化为天冬氨酸或β-丙氨酸来固定一分子CO

在一些实施方案中,碳酸酐酶选自智人(Homo sapiens)碳酸酐酶(简称HsCAH;UniProt ID:P00918;SEQ ID NO:44)、黄顶菊(Flaveria bidentis)碳酸酐酶(简称FbCAH;UniProt ID:P46510;SEQ ID NO:45)、酿酒酵母碳酸酐酶(简称ScCAH;UniProt ID:P53615;SEQ ID NO:46)、白色念珠菌(Candida albicans)碳酸酐酶(简称CaCAH;UniProt ID:Q5AJ71;SEQ ID NO:47)、牙龈卟啉单胞菌(Porphyromonas gingivalis)碳酸酐酶(简称PgCAH;UniProt ID:Q7MV79;SEQ ID NO:48)、结核分支杆菌(Mycobacteriumtuberculosis)碳酸酐酶(简称MtCAH;UniProt ID:P9WPJ9;SEQ ID NO:49)、大肠杆菌碳酸酐酶1(简称EcCAH1;UniProt ID:P0ABE9)和大肠杆菌碳酸酐酶2(简称EcCAH2;UniProt ID:P615517)。

在一些实施方案中,重组宿主细胞包含一种或多种异源核酸,其编码适合根据本公开内容的方法使用的具有碳酸酐酶活性的一种或多种蛋白质。在一些实施方案中,重组宿主细胞包含编码一种或多种蛋白质的一种或多种异源核酸,所述蛋白质包含与HsCAH(SEQ ID NO:44)、FbCAH(SEQ ID NO:45)、ScCAH(SEQ ID NO:46)、CaCAH(SEQ ID NO:47)、PgCAH(SEQ ID NO:48)、MtCAH(SEQ ID NO:49)、EcCAH1(SEQ ID NO:50)或EcCAH2(SEQ IDNO:51)具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的序列同一性的氨基酸序列。

2.6降低或消除副产物途径酶的表达

在本发明的另一方面,在本公开内容的重组宿主细胞中破坏编码副产物途径酶的核酸,以增加天冬氨酸和/或β-丙氨酸的产率、生产率和/或效价;和/或与对照细胞或表达天然/未被破坏水平的所述副产物途径酶的宿主细胞相比,降低副产物效价和/或产率。副产物途径酶包含具有任何结构或功能的任何天然蛋白质(天冬氨酸和/或β-丙氨酸途径酶除外),由于它们利用天冬氨酸和/或β-丙氨酸途径的中间体或产物,被破坏时可以增加天冬氨酸和/或β-丙氨酸产物的产率、效价和/或生产率。另外,副产物途径酶还包含任何具有任何结构或功能的天然蛋白质(天冬氨酸和/或β-丙氨酸途径酶除外),由于它们利用天冬氨酸和/或β-丙氨酸途径酶的中间体或产物,被破坏时可以降低不希望的副产物的产率、效价和/或生产率。

在天冬氨酸和/或β-丙氨酸生产过程中积累的副产物可导致:(1)较低的天冬氨酸和/或β-丙氨酸效价、生产率和/或产率;和/或(2)发酵液中副产物的积累,这增加了下游纯化过程的难度。在一些实施方案中,重组宿主细胞可包含遗传破坏,其包括降低副产物积累的改变、缺失、敲除、取代、启动子修饰、过早终止密码子或敲低。在一些实施方案中,与没有所述一种或多种遗传破坏的细胞相比,包含编码副产物途径酶的一种或多种基因的破坏的重组宿主细胞将具有改变的性能特征,例如降低或消除的副产物途径酶表达、降低或消除的副产物积累、经改善的天冬氨酸和/或β-丙氨酸活性,改变的天冬氨酸和/或β-丙氨酸途径的代谢物通量、更高的天冬氨酸和/或β-丙氨酸效价、生产率、产率和/或改变的细胞适应性。

减少副产物形成的一个重要因素是增加天冬氨酸和/或β-丙氨酸途径的活性,其导致产生的天冬氨酸和/或β-丙氨酸的量增加。在许多实施方案中,与不包含所述一种或多种遗传破坏的宿主细胞相比,包含编码副产物途径酶的一种或多种基因的一种或多种遗传破坏的本公开内容的重组宿主细胞产生增加的天冬氨酸和/或β-丙氨酸效价。在这些实施方案的一些中,发酵液中的天冬氨酸和/或β-丙氨酸效价增加了0.5g/l、1g/l、2.5g/l、5g/l、7.5g/l、10g/l或大于10g/l。

除了增加天冬氨酸和/或β-丙氨酸效价之外,减少副产物的形成还可以帮助增加天冬氨酸和/或β-丙氨酸的产率。由于产率与发酵液的体积无关,发酵液的体积在发酵过程中会发生变化,因此测量天冬氨酸和/或β-丙氨酸的产率通常是有利的。在许多实施方案中,与不包含所述遗传破坏的宿主细胞相比,包含编码副产物途径酶的一种或多种基因的一种或多种遗传破坏的本公开内容的重组宿主细胞产生增加的天冬氨酸和/或β-丙氨酸产率。在这些实施方案的一些中,天冬氨酸和/或β-丙氨酸的产率增加了0.5%、1%、2.5%、5%、7.5%、10%或大于10%(g-天冬氨酸/g-底物和/或β-丙氨酸/g-底物)。该产率计算中的底物是发酵底物,其通常是葡萄糖,但也可以是其他非葡萄糖底物(例如蔗糖、甘油或丙酮酸)。

增加天冬氨酸和/或β-丙氨酸对于降低生产成本很重要,但是破坏编码副产物途径酶的基因以减少副产物形成也是有用的。副产物通常是不需要的化学物质,会作为废物处理,并且其处理可能涉及复杂的处理步骤和密封要求。因此,减少副产物形成对于降低生产成本通常也很重要。在许多实施方案中,与不包含所述遗传破坏的宿主细胞相比,包含编码副产物途径酶的一种或多种基因的一种或多种遗传破坏的本公开内容的重组宿主细胞产生较低的副产物效价。在这些实施方案的一些中,,包含一种或多种副产物途径酶的遗传破坏的本公开内容的重组宿主细胞产生的副产物效价比不包含所述遗传破坏的宿主细胞低0.5g/l、1g/l、2.5g/l、5g/l、7.5g/l、10g/l或多于10g/l。

在许多实施方案中,与不包含所述一种或多种遗传破坏的宿主细胞相比,包含编码副产物途径酶的一种或多种基因的一种或多种遗传破坏的本公开内容的重组宿主细胞产生较低的副产物产率。在这些实施方案的一些中,包含编码副产物途径酶的一种或多种基因的遗传破坏的重组宿主细胞比不包含所述遗传破坏的宿主细胞产生的副产物产率低0.5%、1%、2.5%、5%、7.5%、10%或多于10%(g-副产物/g-底物)。与天冬氨酸和/或β-丙氨酸产率计算一样,副产物产率计算中使用的底物是提供给发酵的碳源;这通常是葡萄糖、蔗糖或甘油,但可以是任何碳底物。

由于消耗天冬氨酸和/或β-丙氨酸途径或下游途径底物、中间体或产物而产生的副产物的非限制性实例包括乳酸盐、L-丙氨酸、苹果酸盐和琥珀酸盐。在氧化还原失衡的情况下,还可能积累不希望的过量还原或氧化的辅因子;因此,在许多情况下,氧化还原辅助因子NADH、NAD

在表2中列出了利用天冬氨酸和/或β-丙氨酸途径底物或中间体的酶催化反应的非限制性列表。减少或消除编码表2中的酶的一种、一些或全部基因的表达可以增加天冬氨酸和/或β-丙氨酸的产生和/或减少副产物的产生。在许多情况下,表2中提供的酶催化反应的产物会在发酵液中积累;在这种情况下,这表明应减少或消除编码所列出的酶的天然基因的表达。例如,发酵液中乳酸的出现表明应减少或消除编码乳酸脱氢酶的天然基因的表达。在某些情况下,表2中列出的特定反应产物被自发地或通过其他酶的作用进一步转化为在发酵液中积累的副产物。在副产物积累是由于多种酶的活性而引起的情况下,可以删除或破坏编码一种或多种副产物途径酶的一种或多种基因,以减少副产物的形成。

2.6.1降低或消除乳酸脱氢酶的表达

降低或消除乳酸脱氢酶的表达以降低乳酸副产物的效价从而防止碳通量离开天冬氨酸/β-丙氨酸途径是有益的。

乳酸脱氢酶(EC#1.1.1.27)催化天冬氨酸/β-丙氨酸途径将中间体丙酮酸转化为乳酸,同时将NADH氧化为NAD

在一些实施方案中,重组宿主细胞包含编码天冬氨酸途径和/或β-丙氨酸途径的异源核酸,并且还包含减少或消除乳酸脱氢酶的表达的遗传破坏。在一些实施方案中,乳酸脱氢酶是谷氨酸棒状杆菌乳酸脱氢酶UniProt ID:Q9HYA4(简称CgLDHA;SEQ ID NO:1)。在一些实施方案中,重组宿主细胞包含与SEQ ID NO:1相比具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或95%以上同源性的同源乳酸脱氢酶基因的遗传破坏。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸和天然乳酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含10g/l或更低、优选1g/l或更低以及最优选为0.5g/l或更低的乳酸副产物效价。在某些实施方案中,乳酸副产物产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏乳酸脱氢酶同源物的遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和天然乳酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏乳酸脱氢酶同源物的遗传破坏的细胞相比,包含编码β-丙氨酸途径酶的异源核酸和天然乳酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

包含遗传破坏的乳酸脱氢酶的重组宿主细胞的构建在以下实施例1和3中描述。这些重组宿主细胞的乳酸、琥珀酸和天冬氨酸的效价在以下实施例5和8中描述。

2.6.2减少或消除琥珀酸脱氢酶的表达

减少或消除琥珀酸脱氢酶的表达以降低琥珀酸副产物的效价从而防止碳通量离开天冬氨酸/β-丙氨酸途径是有益的。

琥珀酸脱氢酶(EC#1.3.5.1)在三羧酸(简称TCA)循环(与柠檬酸循环同义)中起作用,在该循环中,它催化一分子延胡索酸和一分子醌醇可逆转化为一分子琥珀酸和一分子醌(表2)。当TCA循环处于活动状态时,草酰乙酸从天冬氨酸和β-丙氨酸途径(表1和图1)被引导充当TCA循环中间体,使细胞能够氧化乙酰辅酶A以产生ATP和NADH。在厌氧条件下,在天冬氨酸/β-丙氨酸产生阶段,TCA循环沿还原方向流动,导致琥珀酸的积累。编码琥珀酸脱氢酶的天然核酸的遗传破坏减少了琥珀酸副产物,使TCA循环失效,并且可用于确保草酰乙酸可用于天冬氨酸和β-丙氨酸途径,从而增加天冬氨酸/β-丙氨酸的产率、效价和/或生产率。在一些实施方案中,任何酶都是合适的,只要该酶能够催化所述琥珀酸脱氢酶反应。在一些实施方案中,任何酶都适合根据本发明使用,只要该酶在TCA循环中起作用。在一些实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。

在一些实施方案中,重组宿主细胞包含编码天冬氨酸途径和/或β-丙氨酸途径的异源核酸,并且还包含遗传破坏以减少或消除一个、多个或所有琥珀酸脱氢酶亚基的表达。在许多实施方案中,琥珀酸脱氢酶亚基选自谷氨酸棒状杆菌SDHA(SEQ ID NO:10),谷氨酸棒状杆菌SDHB(SEQ ID NO:11)和谷氨酸棒状杆菌SDHC(SEQ ID NO:2)。在一些实施方案中,重组宿主细胞包含与SEQ ID NO:10、SEQ ID NO:11或SEQ ID NO:2相比时具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或95%以上的同源性的琥珀酸脱氢酶亚基同源物的一种或多种遗传破坏。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸和一种或多种天然琥珀酸脱氢酶亚基同源物的遗传破坏的重组宿主细胞将进一步包含3g/l或更低、优选1g/l或更低以及最优选0.5g/l或更低的琥珀酸副产物效价。在某些实施方案中,琥珀酸副产物的产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏一种或多种天然琥珀酸脱氢酶亚基同源物的遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和一种或多种天然琥珀酸脱氢酶亚基同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏一种或多种天然琥珀酸脱氢酶亚基同源物的遗传破坏的细胞相比,编码β-丙氨酸途径酶的异源核酸和一种或多种天然琥珀酸脱氢酶亚基同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

在以下实施例2和3中描述了具有琥珀酸脱氢酶的遗传破坏的重组宿主细胞的构建。在以下实施例5和8中描述了这些重组宿主细胞的乳酸、琥珀酸和天冬氨酸的效价。

2.6.3减少或消除丙氨酸转氨酶的表达

丙氨酸转氨酶(EC#2.6.1.2)将天冬氨酸/β-丙氨酸途径中间体丙酮酸转化为L-丙氨酸,同时将L-谷氨酸转化为2-酮戊二酸(表2)。因此,内源性丙氨酸转氨酶的表达可以减少天冬氨酸和/或β-丙氨酸的厌氧产生。只要该酶能够催化所述丙氨酸转氨酶反应,任何酶都适用于本发明。编码丙氨酸转氨酶的天然核酸的遗传破坏可用于增加天冬氨酸和/或β-丙氨酸的效价、产率和/或生产率。在一些实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株。在一些实施方案中,重组宿主细胞包含编码天冬氨酸途径和/或β-丙氨酸途径的异源核酸,并且还包含减少或消除丙氨酸转氨酶或丙氨酸转氨酶同源物的表达的遗传破坏。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然丙氨酸转氨酶同源物的遗传破坏的重组宿主细胞将进一步包含10g/l或更低、优选5g/l或更低以及最优选2.5g/l或更低的L-丙氨酸副产物效价(即,发酵结束时副产物(g)/发酵液体积(升))。在某些实施方案中,L-丙氨酸副产物的产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏丙氨酸转氨酶同源物的遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和天然丙氨酸转氨酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏丙氨酸转氨酶同源物的遗传破坏的细胞相比,编码β-丙氨酸途径酶的异源核酸和天然丙氨酸转氨酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

2.6.4减少或消除苹果酸脱氢酶的表达

苹果酸脱氢酶(EC#1.1.1.37)催化天冬氨酸/β-丙氨酸途径中间体草酰乙酸还原为苹果酸,同时使NADH氧化为NAD

在一些实施方案中,苹果酸脱氢酶是谷氨酸棒状杆菌苹果酸脱氢酶UniProt ID:Q8NN33(SEQ ID NO:8)。在一些实施方案中,重组宿主细胞包含与SEQ ID NO:34相比时具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或95%以上同源性的同源苹果酸脱氢酶基因的遗传破坏。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然苹果酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含10g/l或更低、优选5g/l或更低以及最优选2.5g/l或更低的苹果酸副产物效价(即,发酵结束时副产物(g)/发酵液体积(升))。在某些实施方案中,苹果酸副产物的产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏苹果酸脱氢酶同源物的遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和天然苹果酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏苹果酸脱氢酶同源物的遗传破坏的细胞相比,编码β-丙氨酸途径酶的异源核酸和天然苹果酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

2.6.5减少或消除丙氨酸脱氢酶的表达

丙氨酸脱氢酶(EC#1.4.1.1)催化一分子丙酮酸(糖酵解产物以及天冬氨酸和本公开内容的β-丙氨酸途径的底物)、一分子NH

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然丙氨酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含10g/l或更低、优选5g/l或更低以及最优选2.5g/l或更低的L-丙氨酸副产物效价(即,发酵结束时副产物(g)/发酵液体积(升))。在某些实施方案中,L-丙氨酸副产物的产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏丙氨酸脱氢酶同源物的遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和天然丙氨酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏丙氨酸脱氢酶同源物的遗传破坏的细胞相比,编码β-丙氨酸途径酶的异源核酸和天然丙氨酸脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

2.6.6减少或消除一种以上副产物途径酶的表达以产生协同作用

在本公开内容的一些实施方案中,重组宿主细胞包含减少或消除的一种以上的副产物途径酶的表达。在这些实施方案中,与仅包含减少或消除的一种副产物途径酶的表达的重组宿主细胞相比,重组宿主细胞还包含更高的天冬氨酸或β-丙氨酸效价、产率和/或生产率。在这些实施方案中的一些中,重组宿主细胞在表2中列出的编码酶的一些或全部基因中包含遗传破坏。在一些实施方案中,重组宿主细胞包含减少或消除的副产物积累,其中所述副产物通过一种、一些或全部的表2中列出的酶的活性形成。在一些实施方案中,重组宿主细胞包含减少或消除的一种以上利用丙酮酸的酶的表达。在一些实施方案中,重组宿主细胞包含减少或消除的一种以上利用天冬氨酸盐、天冬氨酸和/或β-丙氨酸的酶的表达。在一些实施方案中,重组宿主细胞不能代谢天冬氨酸盐、天冬氨酸和/或β-丙氨酸。在一些实施方案中,重组宿主细胞包含遗传修饰,其降低了宿主细胞代谢天冬氨酸盐或天冬氨酸的能力,除了通过β-丙氨酸途径。在一些实施方案中,重组宿主细胞包含遗传修饰,其降低了宿主细胞代谢丙酮酸的能力,除了通过天冬氨酸和/或β-丙氨酸途径。在一个特定的实施方案中,重组宿主细胞包含降低或消除的乳酸脱氢酶同源物和一种或多种琥珀酸脱氢酶亚基同源物的表达。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸的重组宿主细胞将进一步包含0.5g/l至10g/l或更高的乳酸副产物效价(即,发酵结束时副产物(g)/发酵体积(升))以及3g/l或更高的琥珀酸副产物效价。在这些实施方案中,减少或消除乳酸脱氢酶和琥珀酸脱氢酶的表达以降低乳酸和琥珀酸副产物的效价从而防止碳通量离开天冬氨酸/-β丙氨酸途径是有益的。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及乳酸脱氢酶和琥珀酸脱氢酶的遗传破坏的重组宿主细胞将进一步包含0.5g/l或更低的乳酸副产物效价以及0.5g/l或更低的琥珀酸副产物效价。

在一些实施方案中,与仅在天然乳酸脱氢酶同源物或一种或多种琥珀酸脱氢酶亚基同源物中具有遗传破坏的重组宿主细胞相比,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然乳酸脱氢酶同源物和一种或多种琥珀酸脱氢酶亚基同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与仅在天然乳酸脱氢酶同源物或一种或多种琥珀酸脱氢酶亚基同源物中具有遗传破坏的重组宿主细胞相比,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然乳酸脱氢酶同源物和一种或多种琥珀酸脱氢酶亚基同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

在以下实施例3中描述了具有乳酸脱氢酶和琥珀酸脱氢酶两者的遗传破坏的重组宿主细胞的构建。在以下实施例4和8中描述了这些重组宿主细胞的乳酸、琥珀酸和天冬氨酸的效价。

2.6.7减少或消除乙酸激酶和磷酸乙酰转移酶的表达

在一些实施方案中,减少或消除乙酸激酶和磷酸乙酰基转移酶的表达以降低乙酸副产物的效价从而防止碳通量离开天冬氨酸途径和/或β-丙氨酸途径而产生乙酸是有益的。

乙酸激酶(简称AckA;EC#2.7.2.1)催化乙酸和ATP转化为乙酰磷酸和ADP。只要该酶能够催化所述AckA反应,任何酶都适用于本发明。编码AckA的天然核酸的遗传破坏可用于增加天冬氨酸和/或β-丙氨酸的效价、产率和/或生产率。在一些实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株,其中谷氨酸棒状杆菌AckA是UniProt ID:P77845。

磷酸乙酰转移酶(简称Pta;EC#2.3.1.8)催化乙酰辅酶A和磷酸盐转化为乙酰磷酸和辅酶A。只要该酶能够催化所述Pta反应,任何酶都适用于本发明。编码Pta的天然核酸的遗传破坏可用于增加天冬氨酸和/或β-丙氨酸的效价、产率和/或生产率。在一些实施方案中,重组宿主细胞是谷氨酸棒状杆菌菌株,其中谷氨酸棒状杆菌Pta是UniProt ID:P77844。

在一些实施方案中,重组宿主细胞包含编码天冬氨酸途径和/或β-丙氨酸途径的异源核酸,并且还包含遗传破坏以减少或消除AckA和/或Pta的表达。在一些实施方案中,AckA是谷氨酸棒状杆菌AckA UniProt ID:P77845。在一些实施方案中,重组宿主细胞包含与UniProt ID:P77845相比时具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或95%以上同源性的同源ACKA基因的遗传破坏。在一些实施方案中,Pta是谷氨酸棒状杆菌Pta UniProt ID:P77844。在一些实施方案中,重组宿主细胞包含与UniProt ID:P77844相比时具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或95%以上同源性的同源PTA基因的遗传破坏。

在一些实施方案中,包含编码天冬氨酸和/或β-丙氨酸途径酶的异源核酸以及天然AckA和/或Pta同源物的遗传破坏的重组宿主细胞将进一步包含10g/l或更低、优选1g/l或更低以及最优选0.5g/l或更低的乙酸副产物效价。在某些实施方案中,乙酸副产物的产率(即,发酵结束时副产物(g)与底物(g)的百分比)为10%或更低、5%或更低、2.5%或更低并且优选为1%或更低。

在一些实施方案中,与缺乏所述遗传破坏的细胞相比,包含编码天冬氨酸途径酶的异源核酸和天然AckA同源物和/或Pta脱氢酶同源物的遗传破坏的重组宿主细胞将进一步包含更高的天冬氨酸产率、效价和/或生产率。在一些实施方案中,与缺乏所述遗传破坏的细胞相比,包含编码β-丙氨酸途径酶的异源核酸和天然AckA同源物和/或天然Pta同源物的遗传破坏的重组宿主细胞将进一步包含更高的β-丙氨酸产率、效价和/或生产率。

重组宿主细胞的构建在以下实施例1、3和6中描述,所述重组宿主细胞包含遗传破坏的乳酸脱氢酶、琥珀酸脱氢酶、AckA和/或Pta。这些重组宿主细胞的乳酸、琥珀酸和天冬氨酸的效价在以下实施例5和8中描述。

2.7基因工程

天冬氨酸和/或β-丙氨酸途径酶的表达是通过用编码天冬氨酸和/或β-丙氨酸途径酶的外源核酸转化宿主细胞产生本公开内容的重组宿主细胞来实现的。辅助蛋白的表达也是如此。可以使用任何方法将外源核酸引入宿主细胞以产生本公开内容的重组宿主细胞。许多这样的方法是本领域技术人员已知的。一些实例包括电穿孔,化学转化和结合。一些例子包括电穿孔、化学转化和接合。外源核酸进入宿主细胞后,核酸可以通过同源重组整合到细胞基因组中。

本公开内容的重组宿主细胞可包含一种或多种外源核酸分子/元件,以及如本文所述的特定外源核酸分子/元件的单拷贝或多拷贝。这些分子/元件包括转录启动子、转录终止子、蛋白质编码区、开放阅读框、调节位点、用于同源重组的侧翼序列和基因间序列。

外源核酸可以通过重组宿主细胞以各种方式维持。在一些实施方案中,外源核酸被整合到宿主细胞基因组中。在其他实施方案中,外源核酸维持游离状态,其可以稳定或短暂地传播至子细胞。外源核酸可包含可选择标志物以确保增殖。在一些实施方案中,外源核酸带有可选择标志物维持在重组宿主细胞中。在一些实施方案中,去除可选择标志物并使外源核酸维持在重组宿主细胞株中而无需选择。在一些实施方案中,可选择标志物的去除对于发酵产物的下游加工和纯化是有利的。

在一些实施方案中,内源核酸(即宿主细胞的基因组或染色体元件)被遗传破坏以改变、突变、修饰、调节、破坏、增强、去除或灭活基因产物。在一些实施方案中,遗传破坏改变宿主细胞天然蛋白质的表达或活性。在一些实施方案中,遗传破坏避免了不需要的副产物形成或副产物积累。根据同源重组原理,通过本领域众所周知的方法发生遗传破坏。破坏的内源核酸可包含开放阅读框以及不翻译成蛋白质的遗传物质。在一些实施方案中,一种或多种标志物基因通过同源重组取代缺失的基因。在这些实施方案的一些中,随后使用本领域技术人员已知的技术从染色体上去除一个或多个标志物基因。

第3节用重组宿主细胞产生天冬氨酸和/或β-丙氨酸的方法

本文提供了用于从本公开内容的重组宿主细胞产生天冬氨酸和/或β-丙氨酸的方法。在某些实施方案中,所述方法包括以下步骤:(1)在产生天冬氨酸和/或β-丙氨酸的条件下,在包含至少一种碳源和一种氮源的发酵液中培养如本公开内容提供的重组宿主细胞;以及(2)从发酵液中回收天冬氨酸和/或β-丙氨酸。

如上文第2.5.3节所述,将一分子葡萄糖转化为天冬氨酸或β-丙氨酸来固定一分子CO

3.1由重组宿主细胞发酵生产天冬氨酸和/或β-丙氨酸

可以培养本公开内容的任何重组宿主细胞以产生和/或分泌天冬氨酸和/或β-丙氨酸。

用于微生物的维持和生长的材料和方法以及发酵条件是本领域普通技术人员众所周知的。应理解,取决于宿主细胞、发酵和工艺流程的具体要求,必须考虑适当的培养基、pH、温度、冷冻原种的复苏,种子培养物和种子菌株的生长,以及有氧、微需氧或无氧条件的要求。

本文提供的生产天冬氨酸和/或β-丙氨酸的方法可以在合适的生物反应器如发酵容器中的合适的发酵液中进行,所述发酵容器包括但不限于培养板、培养瓶或发酵罐。此外,该方法可以在本领域已知的任何规模的发酵中进行,以支持工业规模的小分子的微生物生产。可以使用任何合适的发酵罐,包括搅拌罐发酵罐、气升式发酵罐、鼓泡发酵罐、固定床生物反应器或其任意组合。

在本公开内容的一些实施方案中,发酵液是其中能够产生根据本公开内容的天冬氨酸和/或β-丙氨酸的重组宿主细胞并能够维持(即,保持生长,活力和/或分解代谢葡萄糖或其他碳源)的任何发酵液。在一些实施方案中,发酵液是包含可同化的碳、氮和磷酸盐源的水性培养基。这样的培养基也可以包括适当的盐、矿物质、金属和其他营养物。在一些实施方案中,将碳源和每种必需细胞营养物增加地或连续地提供给发酵液,并且每种必需细胞营养物基本上维持在生长细胞有效同化所需的最低水平。示例性的细胞生长程序包括分批发酵,采用分批分离的补料分批发酵,采用连续分离的补料分批发酵,和采用连续分离的连续发酵。这些程序是本领域普通技术人员众所周知的。

在本公开内容的一些实施方案中,处理和培养重组宿主细胞以产生天冬氨酸和/或β-丙氨酸可以分为多个阶段,例如生长阶段,生产阶段和/或回收阶段。以下段落提供了可能与这些不同阶段有关的功能或目的的示例。本领域技术人员将认识到,这些特征或目的可以基于所使用的重组宿主细胞,所需的天冬氨酸和/或β-丙氨酸的产量、效价和/或生产率,或其他因素而变化。虽然在一些实施方案中组成型表达天冬氨酸和/或β-丙氨酸途径酶、辅助蛋白和/或内源性宿主细胞蛋白可能是有益的,但在其他实施方案中,选择性表达或阻抑前述蛋白质的任何或全部可能是优选的。

在生长阶段,可以培养重组宿主细胞通过利用提供的碳源专注于生长细胞生物质。在许多实施方案中,生长阶段在有氧条件下进行。在一些实施方案中,天冬氨酸和/或β-丙氨酸途径酶和/或辅助蛋白的表达被抑制或未被诱导。在一些实施方案中,没有制备可观量的天冬氨酸和/或β-丙氨酸。在一些实施方案中,可以选择性地表达有助于细胞生长和/或细胞过程的蛋白质。

然而,在生产阶段,可以培养重组宿主细胞以停止生产细胞生物质,并通过利用提供的碳源专注于天冬氨酸和/或β-丙氨酸的生物合成。在许多实施方案中,生产阶段在基本上厌氧、微厌氧或氧受限的条件下进行,其中重组宿主细胞停止生长并通过本公开内容的天冬氨酸或β-丙氨酸途径引导资源作为消耗葡萄糖和循环NAD(P)H的手段。在一些实施方案中,天冬氨酸和/或β-丙氨酸途径酶和/或辅助蛋白可以在生产过程中选择性表达,以产生较高的产物效价、产量和生产率。生产阶段与发酵、发酵运行或发酵阶段同义。

在一些实施方案中,生长阶段和生产阶段同时发生。在其他实施方案中,生长阶段和生产阶段是分开的。虽然在一些实施方案中,仅在生产阶段中制造产物,但是在其他实施方案中,一些产物在开始生产阶段之前的生长阶段中制造。

回收阶段标志着生产阶段的结束,在此阶段,将细胞生物质从发酵液中分离出来,并从发酵液中纯化出天冬氨酸和/或β-丙氨酸。本领域技术人员将认识到,在一些发酵过程例如填充-抽提和连续发酵中,可能存在多个回收阶段,其中从发酵系统中移出含有生物质和天冬氨酸和/或β-丙氨酸的发酵液。发酵液的抽提物可以独立处理,也可以合起来存储、汇集和处理。在其他发酵过程例如分批和补料分批发酵中,可以只有一个回收阶段。

发酵程序对于商业性天冬氨酸和/或β-丙氨酸的生物合成生产特别有用。本领域普通技术人员应理解,可以扩大发酵程序规模以生产天冬氨酸和/或β-丙氨酸,并且示例性的发酵程序包括,例如,补料分批发酵和分批产物分离;补料分批发酵和连续产物分离;分批发酵和分批产物分离;以及连续发酵和连续产物分离。

3.1.1碳源

提供给发酵的碳源可以是可被重组宿主细胞发酵的任何碳源。合适的碳源包括但不限于单糖、二糖、多糖、甘油、乙酸盐、乙醇、甲醇、甲烷或其一种或多种组合。适合根据本公开内容的方法使用的示例性单糖包括但不限于右旋糖(葡萄糖)、果糖、半乳糖、木糖、阿拉伯糖及其任意组合。适用于本公开内容的方法的示例性二糖包括但不限于蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖及其任何组合。适用于本公开内容的方法的示例性多糖包括但不限于淀粉、糖原、纤维素及其组合。在一些实施方案中,碳源是右旋糖。在其他实施方案中,碳源是蔗糖。在一些实施方案中,可以将一些或所有上述碳源的混合物用于发酵。

3.1.2pH

发酵的pH值可以通过影响发酵中的CO

3.1.3温度

通常,发酵液的温度可以是适合重组宿主细胞生长和/或天冬氨酸和/或β-丙氨酸生产的任何温度。优选地,在天冬氨酸和/或β-丙氨酸生产期间,将发酵液保持在约20℃至约45℃的温度范围内,更优选在约30℃至约42℃的温度范围内。

在重组宿主细胞能够耐受更高温度而没有生长缺陷的实施方案中,更高的温度增加了天冬氨酸和/或β-丙氨酸途径的酶动力学,从而提高了天冬氨酸的生产率。在谷氨酸棒状杆菌为重组宿主细胞的实施方案中,ATCC推荐的生长温度为30℃至33℃。如果谷氨酸棒状杆菌能够忍受更高的温度而没有生长缺陷,例如约37℃的温度,则将发酵温度保持在37℃。

在一些实施方案中,生长温度与生产温度不同。在一些实施方案中,生长温度低于生产温度。在一些实施方案中,生长温度为30℃至33℃,而生产温度为37℃。在这些实施方案中,葡萄糖消耗率提高了5-20%,而天冬氨酸生产率提高了10-30%。

3.1.4氧/通风

本公开提供了实现高天冬氨酸和/或β-丙氨酸产量、效价和/或生产率的方法,其中重组宿主细胞在生长阶段期间处于有氧条件下,而在生产阶段期间处于厌氧或微需氧条件下。氧化的辅因子NAD(P)

在生产阶段,选择通风和搅拌条件以产生导致天冬氨酸的产生的氧转移速率(OTR;溶解氧在发酵培养基中的溶解速率)。在多个实施方案中,选择发酵条件以使不转移氧气(即,OTR为0mmol/l/hr)。在一些实施方案中,选择发酵条件以产生小于1mmol/l/hr的OTR。在一些实施方案中,选择发酵条件以产生小于5mmol/l/hr的OTR。在一些实施方案中,选择发酵条件以产生小于10mmol/l/hr的OTR。如本文所用,OTR是指发酵期间消耗氧气的量体积速率。入口和出口的氧浓度可以通过废气分析测量,例如通过质谱仪来测量。本领域普通技术人员可以使用Bioreaction Engineering Principles第3版,2011年,SpringScience+Business Media,第449页中所述的Direct Method来计算OTR。

在一些实施方案中,重组宿主细胞在BD Biosciences GasPak

3.1.5二氧化碳补充

在本公开内容的天冬氨酸和β-丙氨酸途径中,一分子CO

在一些实施方案中,CO

在一些实施方案中,重组宿主细胞在BD Biosciences GasPak

3.1.6产率和效价

期望从提供的碳源(一种或多种)有高产率的天冬氨酸和/或β-丙氨酸以降低生产成本。如本文所用,产率被计算为由本公开内容的重组宿主细胞分解代谢并用于产生天冬氨酸和/或β-丙氨酸的碳源质量的百分比。在某些情况下,提供给发酵的碳源中只有一小部分被细胞分解代谢,而剩余的发现在发酵液中未被消耗或被发酵中的污染微生物所消耗。因此,重要的是要确保发酵既基本上不含污染微生物,又要在发酵完成时测量未消耗的碳源的浓度。例如,如果将100克葡萄糖加入发酵中,并且在发酵结束时产生25克天冬氨酸,而剩下10克葡萄糖,则天冬氨酸的产率为27.7%(即25克天冬氨酸来自90克葡萄糖)。在本文提供的方法的某些实施方案中,碳源上的天冬氨酸和/或β-丙氨酸的最终产率为至少10%、至少20%、至少30%、至少35%、至少40%、至少50%、至少60%、至少70%、至少80%或大于80%。在某些实施方案中,本文提供的重组宿主细胞能够产生按碳源重量计至少70%、至少75%或大于80%的天冬氨酸和/或β-丙氨酸。

除产率外,发酵中产生的天冬氨酸和/或β-丙氨酸的效价(或浓度)是生产的另一个重要量度。假设所有其他量度均相等,则较高的效价优选于较低的效价。一般而言,效价以每升发酵液中产物(例如天冬氨酸和/或β-丙氨酸)的克数(g/l)提供。在一些实施方案中,在发酵过程中的某个时点(优选在发酵结束时),天冬氨酸和/或β-丙氨酸效价为至少1g/l、至少5g/l、至少10g/l、至少15g/l、至少20g/l、至少25g/l、至少30g/l、至少40g/l、至少50g/l、至少60g/l、至少70g/l、至少80g/l、至少90g/l、至少100g/l、至少125g/l、至少150g/l或大于150g/l。在一些实施方案中,发酵结束时的天冬氨酸和/或β-丙氨酸效价大于100g/l。在一些实施方案中,发酵结束时的天冬氨酸和/或β-丙氨酸效价大于125g/l。在一些实施方案中,发酵结束时的天冬氨酸和/或β-丙氨酸效价大于150g/l。

此外,生产率或产物(即天冬氨酸和/或β-丙氨酸)形成的速率对于降低生产成本是重要的,并且假设所有其他量度均相等,则较高的生产率优选于较低的生产率。一般而言,生产率以每小时每升发酵液产生的克产品数(即,g/l/hr)提供。在一些实施方案中,在发酵期间的一定时间段内,天冬氨酸和/或β-丙氨酸生产率为至少0.1g/l/hr、至少0.25g/l/hr、至少0.5g/l/hr、至少0.75g/l/hr、至少1.0g/l/hr、至少1.25g/l/hr、至少1.25g/l/hr、至少1.5g/l/hr、至少2.0g/l/hr、至少3.0g/l/hr、至少4.0g/l/hr、至少5.0g/l/hr、至少6.0g/l/hr或大于6.0g/l/hr。在一些实施方案中,天冬氨酸和/或β-丙氨酸生产率为至少3g/l/hr。在一些实施方案中,天冬氨酸和/或β-丙氨酸生产率为至少4g/l/hr。在一些实施方案中,天冬氨酸和/或β-丙氨酸生产率为至少5g/l/hr。

本领域普通技术人员理解,HPLC是测定天冬氨酸和/或β-丙氨酸和/或产物的量,产生的任何副产物(例如有机酸和醇)的量,产生的任何途径代谢物或中间产物的量,以及发酵液中剩余的未消耗葡萄糖量的合适方法。可以在发酵过程中以及发酵结束时的任何时间分离出发酵液的等分试样进行分析。简而言之,首先通过液相色谱(LC)分离发酵液中的分子;然后,使用适当的检测方法(例如UV-VIS、折射率和/或光电二极管阵列检测器)选择特定的液体级分进行分析。在本公开内容的一些实施方案中,有机酸盐(例如天冬氨酸和/或β-丙氨酸)是存在于发酵液中的发酵产物。本领域技术人员理解,盐在HPLC分析之前或期间被酸化以产生天冬氨酸和/或β-丙氨酸。因此,通过调整两种化合物之间的分子量差异,可以将通过HPLC分析计算出的酸浓度用于计算发酵液中的盐效价。

气相色谱-质谱法(GC-MS)也是测定目标产物和副产物量的合适方法,特别是如果它们是挥发性的。发酵过程中和发酵后的任何时间都可以分离出发酵样品,并且可以提取顶空中的挥发性化合物进行分析。发酵培养基中的非挥发性化合物(例如有机酸)也可以在用于GC-MS检测的衍生化(即化学改变)后通过GC-MS分析。还可以通过充分提高发酵培养基的温度,从发酵培养基中提取非挥发性化合物,从而使非挥发性化合物转变为气相以用于GC-MS检测。本领域技术人员理解,分子在通过柱进行分离然后到达检测器时由惰性气体携载。

第4节天冬氨酸、天冬氨酸盐和β-丙氨酸的纯化

本公开描述了用于纯化和分析由本公开内容的重组细胞合成的发酵产物的方法,其中所述发酵产物包含天冬氨酸、天冬氨酸盐和/或β-丙氨酸。该方法包括将可溶性发酵产物从发酵液、细胞、细胞碎片和可溶性杂质分开,以及分离可溶性发酵产物。在一些实例中,所述方法还可包括将发酵产物从可溶性形式转化为不溶性结晶形式,以及分离结晶发酵产物。

在发酵结束时,发酵液包含可溶和/或不可溶形式的发酵产物,以及生物质和可溶性杂质,包括盐、蛋白质、未转化的糖和包括色体(color bodies)在内的其他杂质。生物质和可溶性杂质可通过一系列纯化步骤去除。在本公开内容的某些实施方案中,纯化步骤可包括离心、微滤、超滤、纳滤、渗滤、离子交换、结晶及其任何组合。在这些实施方案的一些中,将离子交换树脂和纳滤膜作为精制步骤以去除痕量的可溶性杂质、未转化的糖和色体。

4.1去除细胞和细胞碎片

在一些实施方案中,纯化发酵产物(即,天冬氨酸、天冬氨酸盐和/或β-丙氨酸)的过程包括将包含发酵产物的液体部分与包含细胞和细胞碎片的固体部分分离的步骤。对于这种分离,可以处理任何量的发酵液,包括全部发酵液。本领域技术人员将认识到,所处理的发酵液的量可以取决于所使用的发酵过程的类型,例如分批或连续发酵工艺。在多个实施方案中,细胞和细胞碎片的去除可以例如通过使用特定g-力和停留时间的离心和/或使用适合于从含有细胞和细胞碎片的固体部分有效分离含发酵产物的液体部分的分子量截留的过滤来完成。在一些实施方案中,在本文提供的方法中的一个或超过一个步骤中至少一次重复去除细胞和细胞碎片。

在一些实施方案中,离心用于提供包含发酵产物的液体级分,其基本不含细胞。可用于从发酵液中去除细胞和固体的许多类型的离心机是本领域技术人员已知的,包括盘叠式离心机和沉降式离心机。离心机非常适合分离粒度为0.5μm至500μm且密度大于液相密度(约1.0g/ml)的固体。作为发酵产物产生微生物的非限制性实例,酵母细胞通常具有4-6μm的粒度和约1.1g/ml的密度;因此,离心特别适合从发酵液中去除酵母细胞。

在一些实施方案中,使用盘叠式(disk-stack)离心机来提供包含发酵产物的液体部分,其基本不含细胞。盘叠式离心机通常在连续过程中将固体在操作过程中间歇性地从液体中分离出来。盘叠式离心机非常适合分离柔软的、非研磨性固体,包括细胞。在一些实施方案中,使用沉降式离心机提供包含发酵产物的基本不含细胞的液体级分。基本不含细胞的离心机通常可以处理更大量的固体,并且当细胞质量和其他固体超过约3%w/w时,通常比盘叠式离心机更优选用于处理发酵液。

结合上述离心过程或单独地可以使用其他方法。例如,微滤也是从发酵液中去除细胞的有效手段。微滤包括通过孔径为约0.5μm至约5μm的膜过滤发酵液。在一些实施方案中,微滤用于提供包含发酵产物的液体级分,其基本上不含细胞。

在一些实施方案中,将通过离心和/或微滤除去的细胞再循环回到发酵中。本领域技术人员将认识到,将细胞再循环回到发酵中可以提高发酵产物的产率,因为必须使用更少的碳源(例如葡萄糖)来产生新的细胞。另外,将细胞再循环回到发酵中还可以提高发酵产物的生产率,因为可以提高发酵罐中产生天冬氨酸和/或β-丙氨酸的细胞的浓度。

离心和微滤虽然适合去除细胞,但通常不能有效去除发酵液中的细胞碎片、蛋白质、DNA和其他较小分子量的化合物。超滤是类似于微滤的过程,但是膜的孔径范围为约0.005μm至0.1μm。该孔径等同于约1,000道尔顿至约200,000道尔顿的分子量截留值(被膜保留约90%的大分子的大小)。超滤渗透物将包含低分子量化合物,包括发酵产物和各种其他可溶性盐,而超滤渗余物将包含大多数残留的细胞碎片,DNA和蛋白质。在一些实施方案中,将超滤用于提供基本上不含细胞碎片和蛋白质的包含天冬氨酸和/或β-丙氨酸的液体级分。

4.2含发酵产物的澄清发酵液的纳滤和离子交换精制

在一些实施方案中,使用纳滤分离出存在于含有发酵产物(即天冬氨酸、天冬氨酸盐和/或β-丙氨酸)的澄清发酵液中的某些污染性盐、糖、成色体和其他有机化合物。在纳滤中,将澄清的发酵液(即从上述离心、微滤和/或超滤步骤的组合产生的发酵液)通过孔径范围为0.0005μm至0.005μm(等同于约100道尔顿至2,000道尔顿的分子量截留)的膜过滤。纳滤可用于去除二价和多价离子、麦芽糖和其他二糖(例如蔗糖)、多糖和分子量比发酵产物(例如天冬氨酸、天冬氨酸盐和/或β-丙氨酸)大得多的其他复杂分子。纳滤材料的非限制性实例包括陶瓷膜、金属膜、聚合物膜、活性炭和复合膜。

在一些实施方案中,将离子交换用于除去存在于含有发酵产物的澄清发酵液中的特定污染性盐。离子交换元件可以采取树脂珠和膜的形式。通常,树脂以多孔珠的形式铸型。树脂可以是具有带电位点形式的活性基团的交联聚合物。在这些位点,具有相反电荷的离子被吸引,但可以根据其相对浓度和对位点的亲和力而被其他离子替代。离子交换剂可以是阳离子或阴离子性的。决定给定离子交换树脂效率的因素包括对给定离子的偏好度以及可用的活性位点数量。

本领域普通技术人员应理解,可以组合和修改纳滤和离子交换步骤的组合以产生发酵产物的纯化液。

4.3发酵产物的纯化液的酸化

在一些实施方案中,所述方法包括酸化发酵产物的纯化液以将发酵盐产物转化为天冬氨酸。可用于该酸化步骤的酸的非限制性实例包括硫酸、盐酸、磷酸和硝酸。在一些实施方案中,使用浓酸来限制所产生的天冬氨酸的稀释。

在一些实施方案中,发酵盐产物是天冬氨酸盐。在一些实施方案中,天冬氨酸盐是天冬氨酸钠。在一些实施方案中,天冬氨酸盐是天冬氨酸铵。在一些实施方案中,将诸如硫酸的酸添加至澄清的发酵液中以将天冬氨酸盐转化为硫酸盐和天冬氨酸。在一些实施方案中,硫酸盐是硫酸钠。在一些实施方案中,硫酸盐是硫酸铵。

4.4发酵产物的结晶

在一些实施方案中,所述方法包括结晶步骤以从如上所述的发酵产物的纯化液中纯化出天冬氨酸和/或β-丙氨酸。结晶步骤除去水和水溶性杂质。在本公开内容的一些实施方案中,期望以不溶的结晶形式回收大部分的天冬氨酸和/或β-丙氨酸,而在母液中残留少量的天冬氨酸和/或β-丙氨酸。

在一些实施方案中,发酵产物的纯化溶液包含天冬氨酸盐和天冬氨酸。在一些实施方案中,天冬氨酸盐是天冬氨酸钠。在一些实施方案中,天冬氨酸盐是天冬氨酸铵。因为天冬氨酸盐比天冬氨酸具有实质性更高的溶解度,所以可以通过结晶从溶液中纯化天冬氨酸。例如,在室温,天冬氨酸钠在水中的溶解度大于100g/l,而天冬氨酸铵在约600g/l在水中可溶,而天门冬氨酸在约4.5g/l在水中可溶。在一些实施方案中,天冬氨酸无需额外的浓缩和/或冷却步骤即结晶。在一些实施方案中,在结晶之前有一个或多个浓缩步骤。通过一个或多个步骤浓缩水性发酵液中的发酵产物,其中一个或多个步骤包括离心、加热、冷却、过滤、蒸馏、蒸发或其任何组合。

在一些实施方案中,发酵产物的纯化溶液包含硫酸盐和天冬氨酸。在一些实施方案中,硫酸盐是硫酸钠。在一些实施方案中,硫酸盐是硫酸铵。因为硫酸盐具有比天冬氨酸实质性更高的溶解度,所以可以通过结晶从溶液中纯化天冬氨酸。例如,在室温,硫酸钠在20g/l在水中可溶,硫酸铵在约76g/l在水中可溶,而天冬氨酸在约4.5g/l在水中可溶。在一些实施方案中,天冬氨酸无需额外的浓缩和/或冷却步骤即结晶。

在本公开内容的一些实施方案中,改变母液的温度以促进发酵产物结晶。在一些实施方案中,将母液冷却至低于20℃的温度以降低发酵产物的溶解度。在一些这些实施方案中,将母液加热以蒸发过量的水。

在这些实施方案的一些中,优选蒸发结晶,因为其提供高产率的发酵产物并防止形成稳定凝胶,如果温度降低至浓缩的发酵产物溶液的胶凝点之下,则可能发生凝胶形成。在这些实施方案的一些中,通过组合各种加热和冷却步骤来实现发酵产物结晶。在这些实施方案的一些中,通过蒸发结晶实现过饱和,其中溶质更浓缩在大批溶剂中,这通常在给定的温度和压力条件下是可能的;母液中发酵产物过饱和的增加导致发酵产物结晶。结晶器的非限制性实例包括强制循环结晶器、湍流/气流管和折流板结晶器、诱导循环结晶器和Oslo型结晶器。

在本公开内容的一些实施方案中,如对于本领域技术人员显然的,以各种方式将前述的加热步骤,冷却步骤和pH的变化组合以使发酵产物结晶,并根据需要进行修改。

发酵产物晶体可通过对于本领域技术人员来说明显的任何技术从母液中分离。在本公开内容的一些实施方案中,基于大小、重量、密度或其组合分离发酵产物晶体。基于大小的发酵产物晶体分离可以例如通过使用具有特定粒度截留值的过滤器通过过滤来实现。基于重量或密度的发酵产物晶体分离可以例如通过重力沉降或离心来实现,其中使用例如沉降器(settler)、沉降式离心机、盘叠式离心机、篮式离心机或水力旋流器进行,其中合适的g力和沉降或离心时间可以使用本领域已知的方法确定。在一些实施方案中,通过为1的g力沉降30分钟至2小时而从母液中分离出发酵产物晶体。在其他实施方案中,通过以275×-g至1,000×-g的g力离心20至60秒来从发酵液分离出天冬氨酸、天冬氨酸盐和/或β-丙氨酸晶体。

从母液中分离出来后,发酵产物晶体是湿的,晶体被残留母液包被。因此,用水洗涤发酵产物晶体以除去可能在母液中的这些痕量杂质是有用的。当洗涤发酵产物晶体时,重要的是使分离出的晶体在洗涤水中的溶解最小;因此,通常使用冷洗(约4℃)水。另外,重要的是使用于使晶体溶解最小的洗涤水的量最少。在许多实施方案中,将少于10%w/w的洗涤水用于洗涤发酵产物晶体。

在一些实施方案中,该方法进一步包括从发酵产物晶体中除去杂质的步骤。杂质可能会与发酵产物晶体反应并降低最终产量,或导致纯度变低的发酵产物晶体,从而限制了工业实用性。杂质的非限制性实例包括乙酸、琥珀酸、苹果酸、乙醇、甘油、柠檬酸和丙酸。在一些实施方案中,通过将分离的发酵产物晶体溶解在水溶液中并使发酵产物重结晶来实现去除这类杂质。使发酵产物晶体溶解和重结晶的非限制性实例可包括将发酵产物溶解于水中并蒸发所得水溶液(如上所述),最后通过过滤和/或离心将发酵产物晶体重新分离。只要所得到的发酵产物具有适合于随后酯化的质量,就可以不使用发酵产物重结晶或者一个或多于一个循环的发酵产物重结晶。在一些实施方案中,不进行发酵产物重结晶。在其他实施方案中,进行一次发酵产物重结晶。在另外的实施方案中,进行多于一次的发酵产物重结晶。

在本公开内容的一些实施方案中,使用对本领域技术人员来说显然的筛选和干燥方法的组合来使发酵产物晶体脱水。在这些实施方案的一些中,晶体脱水步骤包括离心、带式干燥、过滤、施加真空或其组合。在这些实施方案的一些中,在低于大气压的20mm Hg下施加真空。用于晶体脱水的合适的设备可以包括水平真空带式过滤器(HVBF)或旋转鼓式真空过滤器(RDVF)。基于大小的发酵产物晶体分离可以例如通过过滤来实现,例如使用压滤机,烛台过滤器或其他具有适当分子量截留值的工业上使用的过滤系统进行过滤。基于重量或密度的发酵产物晶体分离可以例如通过重力沉降或离心来实现,例如使用沉降器、沉降氏离心机、盘叠式离心机、篮式离心机或水力旋流器,其中合适的g力和沉降或离心时间可以使用本领域已知的方法确定。

在本公开内容的一些实施方案中,在除去细胞、细胞碎片、污染性盐和各种可溶性杂质之前,使发酵产物在发酵液中结晶。在这些实施方案的许多实施方案中,通过沉淀、离心、超滤、纳滤、离子交换或它们的任何组合,将发酵产物晶体与发酵液、细胞、细胞碎片、污染性盐和各种可溶性杂质分离。

在一些实施方案中,进一步处理从结晶剩下的母液或在结晶后获得的上清液,以便可以分离母液中剩余的小部分天冬氨酸或其盐。母液通过一个或多个步骤浓缩,其中一个或多个步骤包括离心、加热、冷却、过滤、蒸馏、蒸发或其任何组合。加热和冷却步骤可包括加热到80℃和缓慢冷却到20℃。通过添加酸使回收的小部分天冬氨酸结晶,并且将所得晶体通过在室温或在烘箱中在升高的温度下蒸发而干燥。可以使用的酸的非限制性实例是无机酸,例如硫酸、盐酸、氢卤酸、硝酸和高氯酸,以及基于树脂的酸,例如聚苯乙烯磺酸。如上所述,天冬氨酸晶体通过一个或多个过滤步骤分离。

第5节实施例

脑心灌注(BHI)培养基。BHI培养基包括牛心(从250g输注)5g/l、小牛脑(从200g输注)12.5g/l、磷酸氢二钠2.5g/l、D(+)-葡萄糖2g/l、蛋白胨10g/lL和氯化钠5g/l。

含卡那霉素的脑心灌注培养基(BHI+Kan)。BHI+Kan包含BHI培养基和25μg/ml卡那霉素。

含卡那霉素的脑心灌注培养基(BHI+Kan+Spec)。BHI+Kan+Spec包含BHI培养基、25μg/ml卡那霉素和50μg/ml壮观霉素。

具有MOPS和葡萄糖的脑心灌注培养基(BHI+MOPS+葡萄糖)。BHI+MOPS+葡萄糖包括BHI培养基和50mM MOPS,其中pH值用KOH调节至pH 7.5,以及2%葡萄糖。

微量元素,1000倍储液。该微量元素溶液包括FeSO

CGXII培养基。CGXII包含MOPS(用KOH调节至pH 7.5)0.2M,尿素0.16M,KH

含卡那霉素的CGXII培养基(CGXII+Kan)。CGXII+Kan包含CGXII和25μg/ml卡那霉素。

实施例1:构建消除乳酸脱氢酶表达的重组谷氨酸棒状杆菌菌株LCG4004

实施例1描述了乳酸脱氢酶(LDHA)阴性谷氨酸棒状杆菌LCG4004的构建,其中通过LdhA基因的遗传破坏消除了谷氨酸棒状杆菌中LDHA(简称CgLDHA;SEQ ID NO:1)的表达。消除CgLDHA表达的LCG4004细胞无法将丙酮酸转化为乳酸,因此不会耗尽可能用于天冬氨酸/β-丙氨酸途径的丙酮酸的细胞库。LCG4004的培养和分析在以下实施例4和5中描述。

本文所述的所有重组菌株的谷氨酸棒状杆菌亲本菌株均命名为LCG4002。使用由Okibe等人在Journal of Microbiological Methods 85(2011)155-163中描述的温度敏感型sacB(ts-sacB)无标志物缺失方法在LCG4002中对CgLDHA进行了基因破坏。简而言之,构建质粒pLCSac-LDH^,其包含侧接上游转录启动子和下游转录终止子的ts-sacB基因。pLCSac-LDH^进一步包含谷氨酸棒状杆菌LdhA的独特的上游(SEQ ID NO:3)和下游(SEQ IDNO:4)同源区域,用于在谷氨酸棒状杆菌LdhA基因座处的同源重组。pLCSac-LDH^也包含卡那霉素抗性基因。用pLCSac-LDH^转化谷氨酸棒状杆菌是根据Okibe等人公开的两步法进行的,该过程包括两个温度选择步骤。在37℃在含卡那霉素的丰富培养基中进行的首次温度选择产生了单交叉重组体,即整合了ts-sacB并同时缺失LdhA中靶区域的重组体。在33℃在含蔗糖的最小培养基上进行的第二次温度选择产生了双交叉重组体,即随后除掉包括ts-sacB基因在内的所有pLCSac-LDH^组分的重组体。因此,选择转化体用于LdhA的无标志物和无痕遗传破坏,产生谷氨酸棒状杆菌重组菌株LCG4004。正确的转化体在BHI+Kan上繁殖。

实施例2:构建消除琥珀酸脱氢酶表达的重组谷氨酸棒状杆菌菌株LCG4021

实施例2描述了琥珀酸脱氢酶(SDHCAB)阴性的谷氨酸棒状杆菌LCG4021的构建,其中在谷氨酸棒状杆菌中SDHCAB(简称CgSDHC,UniProt ID:A0A1Q3DMH0,SEQ ID NO:2,简称CgSDHA,UniProt ID:A0A072Z4F3,SEQ ID NO:10;简称CgSDHB,UniProt ID:A0A1Q3DME3,SEQ ID NO:11)的表达通过琥珀酸脱氢酶基因C,A和B的遗传破坏而消除。具有消除的CgSDHCAB表达的LCG4012细胞无法积累大量琥珀酸副产物,因此不会使碳通量从天冬氨酸/β-丙氨酸途径转移到TCA循环。LCG4021的培养和分析在以下实施例4和5中描述。

使用上文实施例1中描述的并且由Okibe等人在Journal of MicrobiologicalMethods 85(2011)155-163中详细公开的ts-sacB无标志物缺失方法对CgSDHCAB进行了基因破坏。简而言之,构建质粒pLCSac-SDH^,其包含侧接上游转录启动子和下游转录终止子的ts-sacB基因。pLCSac-SDH^还包含谷氨酸棒状杆菌SdhCAB的独特的上游(SEQ ID NO:5)和下游(SEQ ID NO:6)同源区域,用于在谷氨酸棒状杆菌SdhCAB基因座处的同源重组。pLCSac-SDH^进一步包含卡那霉素抗性基因。谷氨酸棒状杆菌重组菌株LCG4001用pLCSac-SDH^的转化是根据Okibe等人公开的两步法进行的,该过程包括两个温度选择步骤。在37℃在含卡那霉素的丰富培养基中进行的首次温度选择产生了单交叉重组体,即整合了ts-sacB基因并同时缺失SdhCAB基因座中靶区域的重组体。在33℃在含蔗糖的最小培养基上进行的第二次温度选择产生了双交叉重组体,即随后除掉包括ts-sacB基因在内的所有pLCSac-SDH^组分的重组体。因此,选择转化体用于SdhCAB的无标志物和无痕遗传破坏,产生谷氨酸棒状杆菌重组菌株LCG4021。正确的转化体在BHI+Kan上繁殖。

实施例3:构建消除乳酸脱氢酶和琥珀酸脱氢酶表达的重组谷氨酸棒状杆菌菌株LCG4020

实施例3描述了乳酸脱氢酶(LDHA)阴性和琥珀酸脱氢酶(SDHCAB)阴性的谷氨酸棒状杆菌LCG4020的构建,其中通过LdhA基因的遗传破坏消除了谷氨酸棒状杆菌中LDHA(简称CgLDHA;SEQ ID NO:1)的表达,且谷氨酸棒状杆菌中SDHCAB(简称CgSDHC,UniProt ID:A0A1Q3DMH0,SEQ ID NO:2,简称CgSDHA,UniProt ID:A0A072Z4F3,SEQ ID NO:10;简称CgSDHB,UniProt ID:A0A1Q3DME3,SEQ ID NO:11)的表达通过琥珀酸脱氢酶基因C,A和B的遗传破坏而消除。LCG4020细胞无法积累大量的乳酸和琥珀酸副产物,因此不会使碳通量从天冬氨酸/β-丙氨酸生产中转移。LCG4020的培养和分析在以下实施例4和5中描述。

使用上文实施例1中所述的ts-sacB无标志物缺失方法对CgLDHA进行了遗传破坏。使用实施例2中上述的ts-sacB无标志物缺失方法对CgSDHCAB进行了遗传破坏。选择转化体用于LdhA和SdhCAB的无标志物和无痕遗传破坏,产生谷氨酸棒状杆菌重组菌株LCG4020。正确的转化体在BHI+Kan上繁殖。

在该实施例中描述的菌株LCG4020是用于谷氨酸棒状杆菌菌株LCG4054、LCG4025、LCG4058、LCG4244和LCG4062的背景菌株,两者均包含本公开内容的天冬氨酸途径。菌株LCG4054、LCG4025、LCG4058、LCG4244和LCG4062的构建在以下实施例6中描述。

实施例4:在厌氧条件下培养谷氨酸棒状杆菌重组菌株LCG4004、LCG4021和LCG4020以及亲本菌株LCG4002

实施例4描述了来自实施例1、2和3的LCG4004(LDHA阴性),4021(SDHCAB阴性)和4020(LDHA阴性和SDHCAB阴性)以及亲本菌株LCG4002的培养,用于乳酸、琥珀酸和天冬氨酸的厌氧产生。这些菌株缺乏编码本公开内容的天冬氨酸途径的异源核酸。每种菌株首先在250mL带挡板的Erylenmyer培养瓶中从单个菌落生长,该培养瓶中装有50mL BHI+MOPS+葡萄糖,补充有50mM MOPS(pH 7.5)、2%葡萄糖和25μg/ml卡那霉素,在30℃生长24小时。细胞生长超过24小时直到OD

实施例5:谷氨酸棒状杆菌重组菌株LCG4004、LCG4021和LCG4020以及亲本菌株LCG4002的发酵液的HPLC分析以分析乳酸、琥珀酸和天冬氨酸的存在

实施例5描述了重组谷氨酸棒状杆菌菌株LCG4004(LDHA阴性),LCG4021(SDHCAB阴性)和LCG4020(LDHA阴性和SDHCAB阴性)(在实施例1、2和3中构建,并在实施例4的厌氧发酵条件下培养)和亲本菌株LCG4002(也按实施例4所述培养)的HPLC分析,针对乳酸、琥珀酸和天冬氨酸的生产。所有菌株均不包含本公开内容的任一天冬氨酸途径。

为了进行HPLC分析,按照Agilent推荐,用邻苯二甲醛(OPA)处理来自实施例4的每个保存的发酵液样品进行衍生化,以与自动化的柱前衍生化方案一起使用,该方案与使用Agilent Zorbax Eclipse-AAA柱(4.6mm×75mm,3.5微米)的HPLC分析集成在一起。进行15分钟的UV 338nm测量。

为了通过HPLC检测糖和有机酸,通常在收获后48小时内,通过HPLC直接分析过滤的样品。冻融和通过HPLC分析冷冻样品,其使用串联安装的Bio-Rad Aminex 87H柱(300×7.8mm)和Bio-Rad发酵监测柱(#1250115;150×7.8mm),使用水的等度洗脱速率为0.7ml/min和5mM硫酸。进行20分钟的折射率和UV 210nm测量。

LCG4002(亲本谷氨酸棒状杆菌菌株)产生0.01g/l–0.04g/l天冬氨酸,表明本公开内容的谷氨酸棒状杆菌菌株中天冬氨酸产量的基础水平。这表明所有缺少本公开内容的天冬氨酸途径的谷氨酸棒状杆菌菌株都不能产生大量的天冬氨酸。之后显示编码天冬氨酸途径的异源核酸的掺入能够增加天冬氨酸的产生(实施例6)。LCG4002还产生8g/l-20g/l的乳酸盐和3g/l-10g/l的琥珀酸盐,表明碳通量转向了副产物乳酸盐和琥珀酸盐的形成。

LCG4004(LDHA阴性谷氨酸棒状杆菌)仅产生0.4g/l-3g/l的乳酸盐和1g/l-5g/l的琥珀酸盐。该结果证明消除的CgLDHA表达显著降低了乳酸盐副产物的形成。LCG4004没有产生可检测量的天冬氨酸。

LCG4021(SDHCAB阴性谷氨酸棒状杆菌)产生5g/l-12g/l的乳酸盐和0.1g/l-4g/l的琥珀酸盐。该结果表明,消除的CgSDHCAB表达显著降低了琥珀酸盐副产物形成的形成。LCG4021产生0.01g/l–0.1g/l天冬氨酸,收率为0.5%(g-天冬氨酸/g-葡萄糖)。这表明来自琥珀酸盐副产物形成途径的碳通量可以被转移以增加基础水平的天冬氨酸产生。

而LCG4020(LDHA阴性和SDHCAB阴性谷氨酸棒状杆菌)产生0.1g/l–0.5g/l乳酸盐和0.1g/l–0.5g/l琥珀酸盐。该结果证明消除了CgLDHA和CgSDHCAB的表达减少了乳酸盐和琥珀酸盐副产物的形成。LCG4020还产生了0.1g/l–0.3g/l的天冬氨酸,收率为7%(g-天冬氨酸/g-葡萄糖)。这表明有可以将碳通量从乳酸盐和琥珀酸盐副产物形成转向增加的基础水平的天冬氨酸产生。

实施例6:构建重组谷氨酸棒状杆菌菌株LCG4054、LCG4025、LCG4058、LCG4244和LCG4062,其各自包含本公开内容的天冬氨酸途径

实施例6描述了重组谷氨酸棒状杆菌菌株LCG4054、LCG4025、LCG4058、LCG4244和LCG4062的构建,其中每种菌株包含编码天冬氨酸途径的酶的异源核酸,所述天冬氨酸途径的酶能够实施磷酸烯醇丙酮酸羧激酶和天冬氨酸转氨酶或天冬氨酸脱氢酶的活性(表1和图1)。

LCG4054包含谷氨酸棒状杆菌磷酸烯醇丙酮酸羧激酶PckA UniProt ID:Q6F5A5(简称CgPCKA,SEQ ID NO:17)和贪噬菌属(Variovorax)的种HW608天冬氨酸脱氢酶UniProtID:A0A1C6Q9L7(简称AspDH#16,SEQ ID NO:23)。从谷氨酸棒状杆菌基因组DNA扩增编码CgPCKA的异源核酸。编码AspDH#16的异源核酸针对谷氨酸棒状杆菌进行了密码子优化,并由Twist Bioscience合成和提供。

在构建LCG4054菌株之前,将CgPCKA和AspDH#16串联克隆到质粒pLCG1013中,其根据Li和Elledge在Methods Mol Biol(2012)51-9中详细介绍的SLIC方法,这是本领域普通技术人员通常实践的方法。质粒pLCG1013还包含上游EF-Tu转录启动子或上游Tac启动子,下游转录终止子和卡那霉素抗性基因。实施例3中的LCG4020菌株(其包含LDHA阴性和SDHCAB阴性表型)为LCG4054的背景菌株。用质粒pLCG1013转化LCG4020。单步骤进行转化。转化体在BHI+Kan上繁殖。

LCG4025包含CgPCKA和谷氨酸棒状杆菌天冬氨酸转氨酶UniProt ID:Q8NTR2(简称CgASPB;SEQ ID NO:25)。从谷氨酸棒状杆菌基因组DNA扩增编码CgPCKA的异源核酸。编码CgASPB的异源核酸针对谷氨酸棒状杆菌进行了密码子优化,并由Twist Bioscience合成并提供。

在构建LCG4025菌株之前,根据SLIC方法将CgPCKA和CgASPB串联克隆到质粒pLCD1002中。质粒pLCD1002还包含上游EF-Tu转录启动子或上游Tac启动子,下游转录终止子和卡那霉素抗性基因。实施例3中的LCG4020菌株(其包含LDHA阴性和SDHCAB阴性表型)是LCG4025的背景菌株。用质粒pLCG1002转化LCG4020。单步骤进行转化。转化体在BHI+Kan上繁殖。

LCG4058包含EcPCKA UniProt ID:P22259和CgAspB UniProt ID:Q8NTR2。从大肠杆菌基因组DNA中扩增出编码EcPCKA的异源核酸。从谷氨酸棒状杆菌基因组DNA中扩增出编码CgAspB的异源核酸。

在构建LCG4058菌株之前,根据SLIC方法将EcPCKA和CgAspB串联克隆到质粒pCOMPASS-0031中。质粒pCOMPASS-0031还包含上游转录启动子,下游转录终止子和卡那霉素抗性基因。实施例3中的LCG4020菌株(其包含LDHA阴性和SDHCAB阴性表型)是LCG4058的背景菌株。用质粒pCOMPASS-0031转化LCG4020。单步骤进行转化。转化体在BHI+Kan上繁殖。

LCG4244包含CgPCKA UniProt ID:Q6F5A5和AspDH#16UniProt ID:A0A1C6Q9L7。从大肠杆菌基因组DNA中扩增出编码EcPCKA的异源核酸。从谷氨酸棒状杆菌基因组DNA中扩增出编码CgAspB的异源核酸。

在构建LCG4244菌株之前,根据SLIC方法将CgPCKA和AspDH#16串联克隆到质粒pCOMPASS-0131-2中。LCG4244还包括丙酮丁醇梭菌(Clostridium acetobutylium)的利用NADP

在用pCOMPASS-0131-2转化以创建LCG4244之前,按照实施例3所述构建LCG4020(LDHA阴性和SDHCAB阴性谷氨酸棒状杆菌)。使用LCG4020作为背景菌株,随后使用Cho等人在Metabolic Engineering 42(2017)157-67和Wang等人在Microbial Cell Factories(2018)17:63中描述的CRISPR方法构建LCG4248(LDHA阴性,SDHCAB阴性,ACKA阴性和PTA阴性的谷氨酸棒状杆菌)。简而言之,构建了两种质粒:(1)构建pLC-Target以包含Cas9-核糖核蛋白复合物的gRNA,壮观霉素可选择标志物,AckA-Pta上游和下游的500-750bp同源臂;和(2)构建pLC1-Cas9-pTRC-RecE588T,使其包含Cas9-核糖核蛋白复合物,RecE588截短的外切核酸酶RecT,驱动RecE588T复合物的pTrc诱导型启动子和卡那霉素可选择标志物。两种质粒上的所有基因都针对谷氨酸棒状杆菌进行了密码子优化。谷氨酸棒状杆菌通过电穿孔转化,首先用pLC1-Cas9-pTrc-RecE588T质粒,然后用pLC-Target质粒。通过在BHI+Kan+Spec培养基上繁殖,选择了具有所需AckA-Pta遗传破坏的正确的谷氨酸棒状杆菌转化体。然后将转化体的pLC1-Cas9-pTRC-RecE588T质粒固化,该质粒是温度敏感的质粒,使本领域技术人员可以终止迭代敲除过程并获得不含质粒的菌株(Cho等人,MetabolicEngineering 42(2017)157-67)。因此,转化体在37℃生长,使其对卡那霉素敏感,并命名为LCG4248。然后用pCOMPASS-0131-2转化LCG4248,并在BHI-Kan上繁殖以选择命名为LCG4244的转化体。该实施例描述了本公开内容的LCG4248的重组细胞的构建,其编码本公开内容的天冬氨酸生物合成途径的酶。

LCG4062包含CgPCKA UniProt ID:Q6F5A5和贪铜菌钩虫(Cupriavidus necator)天冬氨酸脱氢酶UniProt ID:Q46VA0(简称AspDH#13,SEQ ID NO:9)。从谷氨酸棒状杆菌基因组DNA扩增编码CgPCKA的异源核酸。编码AspDH#13的异源核酸针对谷氨酸棒状杆菌进行了密码子优化,并由Twist Bioscience合成和提供。

在构建LCG4062菌株之前,根据SLIC方法将CgPCKA和AspDH#13串联克隆到质粒pCOMPASS-0034中。质粒pCOMPASS-0034还包含上游转录启动子,下游转录终止子和卡那霉素抗性基因。实施例3中的LCG4020菌株(包括LDHA阴性和SDHCAB阴性表型)是LCG4062的背景菌株。用质粒pCOMPASS-0034转化LCG4020。单步骤进行转化。转化体在BHI+Kan上繁殖。

该实施例描述了本公开内容的LCG4054、LCG4025、LCG4058、LCG4244和LCG4062的重组细胞构建,其编码本公开内容的天冬氨酸生物合成途径的酶。

实施例7:用于生产天冬氨酸的重组谷氨酸棒状杆菌菌株LCG4054、LCG4025和LCG4062的培养和HPLC分析

如上文实施例4和5中所述,培养重组谷氨酸棒状杆菌LCG4054、LCG4025和LCG4062并通过HPLC进行分析,以厌氧产生天冬氨酸。LCG4054、LCG4025和LCG4062各自产生5-13g/l的天冬氨酸,产率为25-80%(g-天冬氨酸/g-葡萄糖)。该实施例证实,根据本公开,在重组谷氨酸棒状杆菌中表达编码天冬氨酸途径的异源核酸相对于亲本、对照菌株产生了提高量的天冬氨酸。谷氨酸棒状杆菌背景菌株LCG4020(在实施例4和5中描述)缺乏所述异源天冬氨酸途径,但其他在遗传上是相同的;LCG4020仅产生0.1g/l–0.3g/l的天冬氨酸,产率为7%(g-天冬氨酸/g-葡萄糖)。

实施例8:重组谷氨酸棒状杆菌菌株LCG4054、LCG4025和LCG4062的培养和针对副产物乳酸盐和琥珀酸盐的HPLC分析

如上文实施例4和5中所述,培养重组谷氨酸棒状杆菌菌株LCG4054、LCG4025和LCG4062并通过HPLC分析副产物乳酸盐和琥珀酸盐。

LCG4054产生小于0.5g/l的乳酸盐和小于0.5g/l的琥珀酸盐。LCG4025产生少于0.5g/l的乳酸盐和少于0.5g/l的琥珀酸盐。LCG4062产生少于1g/l的乳酸盐和少于1.5g/l的琥珀酸盐。

该实施例与实施例4、5和7一起证明,在包含LDHA阴性表型和SDHCAB阴性表型的天冬氨酸重组细胞中产生了最小量的乳酸盐和琥珀酸盐。

实施例9:从2升发酵液中分离天冬氨酸

实施例9a

实施例9a描述了从发酵液中分离天冬氨酸。LCG4058是该实施例中使用的菌株。LCG4058包含LDHA阴性和SDHCAB阴性表型,并按照实施例3中所述工程化进行了相应的遗传修饰。LCG4058还包含天冬氨酸途径,即CgAspB(UniProt ID:Q8NTR2)和EcPckA(UniProtID:P22259),并且如实施例6所述工程化进行了相应的遗传修饰。

LCG4058在补充有25μg/ml卡那霉素的4升BHI+MOPS+葡萄糖培养基中生长。使细胞在5升生物反应器中于30℃生长约45小时,至细胞密度约为4g-DCW/l。通过以4,000x-g离心10分钟使细胞沉淀,并以约7g-DCW/l重悬于CGXII培养基中,总计2升。将重悬的细胞置于密封的发酵瓶中以提供厌氧环境,并将培养物在30℃温育并充分摇动以防止细胞沉降。在发酵过程中将NaHCO

通过以4,000×g离心10分钟从发酵液中除去细胞,并浓缩发酵液以产生约350ml的澄清的发酵液,其天冬氨酸效价为92g/l(即699mM)。经计算,澄清的发酵液中的天冬氨酸总量为32.6g。

通过蒸发浓缩澄清的发酵液以增加天冬氨酸浓度。然后通过添加硫酸至pH 2.5至pH 3将天冬氨酸的浓缩溶液酸化,这导致天冬氨酸的结晶。通过用8μm滤纸过滤分离天冬氨酸晶体,并将湿的天冬氨酸晶体在约40℃至约50℃的烘箱中干燥过夜。实施例10a描述了对从实施例9a获得的分离的天冬氨酸的表征。

实施例9b

实施例9b描述了从发酵液中分离天冬氨酸。LCG4244是该实施例中使用的菌株。LCG4244包含LDHA阴性,SDHCAB阴性,ACKA阴性和PTA阴性表型,并按照实施例3和6所述工程化进行了相应的遗传修饰。LCG4244还包含天冬氨酸途径,即CgPCKA UniProt ID:Q6F5A5和AspDH#16UniProt ID:A0A1C6Q9L7,并按照实施例6中所述工程化进行了相应的遗传修饰。

LCG4244在补充了25μg/ml卡那霉素的6升BHI+MOPS+葡萄糖培养基中生长。将细胞在4份1.5升培养物中(总共6升)在30℃生长约24-28小时,至细胞密度OD

通过以4,000×-g离心10分钟并通过用0.2-μm过滤器进行微滤,从发酵液中除去细胞,以产生约400ml的澄清的发酵液,其天冬氨酸效价为54.3g/l(即398mM)。计算出澄清的发酵液中的天冬氨酸总量为21.7g。用活性炭过滤400ml澄清的发酵液以除去有色杂质,并蒸发以提高天冬氨酸的浓度。然后通过添加盐酸使pH 2.5至pH 3来酸化浓缩的天冬氨酸溶液或浓缩的澄清发酵液,这导致天冬氨酸沉淀。将沉淀的天冬氨酸在90℃重新溶解,然后将天冬氨酸溶液缓慢冷却至5℃进行结晶。将来自该结晶步骤的母液进行另一轮结晶,其包括浓缩、加热和缓慢冷却的步骤,以增加回收的总天冬氨酸晶体的量。通过用8μm滤纸过滤分离来自两轮结晶的天冬氨酸晶体,并将湿的天冬氨酸晶体在约40℃至约50℃的烘箱中干燥过夜。实施例10b描述了对从实施例9b获得的分离的天冬氨酸的表征。

实施例10a:对分离的天冬氨酸的表征

使用OPA衍生化方法准备来自实施例9a的天冬氨酸以用于HPLC分析。测定该天冬氨酸溶液的纯度为93.3%。回收了30.74g+/-2.975g天冬氨酸,这相当于从发酵液的回收收率为94.24+/-11.79%。

实施例10b:对分离的天冬氨酸的表征

使用TMS衍生化方法准备如本文所提供产生的天冬氨酸以用于GC-FID分析。测定天冬氨酸溶液的纯度为99.7%(峰面积%)。回收了约17.2g的天冬氨酸,这相当于从发酵液的回收收率为约79%。

实施例11:构建重组谷氨酸棒状杆菌菌株LCG4133、LCG4166、LCG4136和LCG4137,其各自包含天冬氨酸途径和编码本公开内容的利用NADP

实施例11描述了重组谷氨酸棒状杆菌菌株LCG4133、LCG4166、LCG4136和LCG4137的构建,其中每种菌株包含编码天冬氨酸途径的酶的异源核酸,所述天冬氨酸途径的酶能够实施磷酸烯醇丙酮酸羧激酶和天冬氨酸脱氢酶的活性(表1和图1)。这4种菌株进一步包含编码利用NADP

LCG4133包含谷氨酸棒状杆菌磷酸烯醇丙酮酸羧激酶PckA UniProt ID:Q6F5A5(简称CgPCKA,SEQ ID NO:17),贪噬菌属的种HW608天冬氨酸脱氢酶UniProt ID:A0A1C6Q9L7(简称AspDH#16)和丙酮丁醇梭菌的利用NADP

LCG4166包含谷氨酸棒状杆菌磷酸烯醇丙酮酸羧激酶PckA UniProt ID:Q6F5A5(简称CgPCKA,SEQ ID NO:17),贪噬菌属的种HW608天冬氨酸脱氢酶UniProt ID:A0A1C6Q9L7(简称AspDH#16)和海沼甲烷球菌(Methanococcus maripaludis)利用NADP

LCG4136包含谷氨酸棒状杆菌磷酸烯醇丙酮酸羧激酶PckA UniProt ID:Q6F5A5(简称CgPCKA,SEQ ID NO:17),贪噬菌属的种HW608天冬氨酸脱氢酶UniProt ID:A0A1C6Q9L7(简称AspDH#16)和谷氨酸棒状杆菌的利用NAD

LCG4137包含谷氨酸棒状杆菌磷酸烯醇丙酮酸羧激酶PckA UniProt ID:Q6F5A5(简称CgPCKA,SEQ ID NO:17),贪噬菌属的种HW608天冬氨酸脱氢酶UniProt ID:A0A1C6Q9L7(简称AspDH#16)和谷氨酸棒状杆菌的利用NAD

LCG4133、LCG4166、LCG4136和LCG4137的培养和分析在以下实施例12中描述。

实施例12:用于生产天冬氨酸的重组谷氨酸棒状杆菌菌株LCG4133、LCG4166、LCG4136和LCG4137的培养和HPLC分析

如上文实施例4和5中所述,培养重组谷氨酸棒状杆菌LCG4133、LCG4166、LCG4136和LCG4137并通过HPLC进行分析以用于天冬氨酸的厌氧产生。发酵24小时和72小时的天冬氨酸效价如下:(1)LCG4133(利用NADP

在本申请中引用了各种出版物。这些出版物的全部公开内容通过引用整体并入本申请中,以便更全面地描述本发明所属的技术领域的状态。

应当注意,存在实现本文公开的实施方案的替代方式。因此,所述实施方案应被认为是说明性的而非限制性的;在不脱离本发明的精神的情况下,可以进行各种修改。此外,权利要求书不限于本文给出的细节,而是被赋予其全部范围及其等同物。

序列表

<110> 利戈斯股份有限公司

<120> 生产天冬氨酸和β-丙氨酸的重组宿主细胞和方法

<130> LYGOS-0016-01-WO

<150> 62/689,265

<151> 2018-06-25

<160> 54

<170> PatentIn version 3.5

<210> 1

<211> 314

<212> PRT

<213> 谷氨酸棒状杆菌(Corynebacterium glutamicum)

<400> 1

Met Lys Glu Thr Val Gly Asn Lys Ile Val Leu Ile Gly Ala Gly Asp

1 5 10 15

Val Gly Val Ala Tyr Ala Tyr Ala Leu Ile Asn Gln Gly Met Ala Asp

20 25 30

His Leu Ala Ile Ile Asp Ile Asp Glu Lys Lys Leu Glu Gly Asn Val

35 40 45

Met Asp Leu Asn His Gly Val Val Trp Ala Asp Ser Arg Thr Arg Val

50 55 60

Thr Lys Gly Thr Tyr Ala Asp Cys Glu Asp Ala Ala Met Val Val Ile

65 70 75 80

Cys Ala Gly Ala Ala Gln Lys Pro Gly Glu Thr Arg Leu Gln Leu Val

85 90 95

Asp Lys Asn Val Lys Ile Met Lys Ser Ile Val Gly Asp Val Met Asp

100 105 110

Ser Gly Phe Asp Gly Ile Phe Leu Val Ala Ser Asn Pro Val Asp Ile

115 120 125

Leu Thr Tyr Ala Val Trp Lys Phe Ser Gly Leu Glu Trp Asn Arg Val

130 135 140

Ile Gly Ser Gly Thr Val Leu Asp Ser Ala Arg Phe Arg Tyr Met Leu

145 150 155 160

Gly Glu Leu Tyr Glu Val Ala Pro Ser Ser Val His Ala Tyr Ile Ile

165 170 175

Gly Glu His Gly Asp Thr Glu Leu Pro Val Leu Ser Ser Ala Thr Ile

180 185 190

Ala Gly Val Ser Leu Ser Arg Met Leu Asp Lys Asp Pro Glu Leu Glu

195 200 205

Gly Arg Leu Glu Lys Ile Phe Glu Asp Thr Arg Asp Ala Ala Tyr His

210 215 220

Ile Ile Asp Ala Lys Gly Ser Thr Ser Tyr Gly Ile Gly Met Gly Leu

225 230 235 240

Ala Arg Ile Thr Arg Ala Ile Leu Gln Asn Gln Asp Val Ala Val Pro

245 250 255

Val Ser Ala Leu Leu His Gly Glu Tyr Gly Glu Glu Asp Ile Tyr Ile

260 265 270

Gly Thr Pro Ala Val Val Asn Arg Arg Gly Ile Arg Arg Val Val Glu

275 280 285

Leu Glu Ile Thr Asp His Glu Met Glu Arg Phe Lys His Ser Ala Asn

290 295 300

Thr Leu Arg Glu Ile Gln Lys Gln Phe Phe

305 310

<210> 2

<211> 257

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 2

Met Thr Val Arg Asn Pro Asp Arg Glu Ala Ile Arg His Gly Lys Ile

1 5 10 15

Thr Thr Glu Ala Leu Arg Glu Arg Pro Ala Tyr Pro Thr Trp Ala Met

20 25 30

Lys Leu Thr Met Ala Ile Thr Gly Leu Met Phe Gly Gly Phe Val Leu

35 40 45

Val His Met Ile Gly Asn Leu Lys Ile Phe Met Pro Asp Tyr Ala Ala

50 55 60

Asp Ser Ala His Pro Gly Glu Ala Gln Val Asp Val Tyr Gly Glu Phe

65 70 75 80

Leu Arg Glu Ile Gly Ser Pro Ile Leu Pro His Gly Ser Val Leu Trp

85 90 95

Ile Leu Arg Ile Ile Leu Leu Val Ala Leu Val Leu His Ile Tyr Cys

100 105 110

Ala Phe Ala Leu Thr Gly Arg Ser His Gln Ser Arg Gly Lys Phe Arg

115 120 125

Arg Thr Asn Leu Val Gly Gly Phe Asn Ser Phe Ala Thr Arg Ser Met

130 135 140

Leu Val Thr Gly Ile Val Leu Leu Ala Phe Ile Ile Phe His Ile Leu

145 150 155 160

Asp Leu Thr Met Gly Val Ala Pro Ala Ala Pro Thr Ser Phe Glu His

165 170 175

Gly Glu Val Tyr Ala Asn Met Val Ala Ser Phe Ser Arg Trp Pro Val

180 185 190

Ala Ile Trp Tyr Ile Ile Ala Asn Leu Val Leu Phe Val His Leu Ser

195 200 205

His Gly Ile Trp Leu Ala Val Ser Asp Leu Gly Ile Thr Gly Arg Arg

210 215 220

Trp Arg Ala Ile Leu Leu Ala Val Ala Tyr Ile Val Pro Ala Leu Val

225 230 235 240

Leu Ile Gly Asn Ile Thr Ile Pro Phe Ala Ile Ala Val Gly Trp Ile

245 250 255

Ala

<210> 3

<211> 750

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 3

agccgtaacc caccacggtt tcggcaacaa tgacggcgag agagcccacc acattgcgat 60

ttccgctccg ataaagccag cgcccatatt tgcagggagg attcgcctgc ggtttggcga 120

cattcggatc cccggaacta gctctgcaat gacctgcgcg ccgagggagg cgaggtgggt 180

ggcaggtttt agtgcgggtt taagcgttgc caggcgagtg gtgagcagag acgctagtct 240

ggggagcgaa accatattga gtcatcttgg cagagcatgc acaattctgc agggcatagg 300

ttggttttgc tcgatttaca atgtgatttt ttcaacaaaa ataacacttg gtctgaccac 360

attttcggac ataatcgggc ataattaaag gtgtaacaaa ggaatccggg cacaagctct 420

tgctgatttt ctgagctgct ttgtgggttg tccggttagg gaaatcagga agtgggatcg 480

aaaatgaaag aaaccgtcgg taacaagatt gtcctcattg gcgcaggaga tgttggagtt 540

gcatacgcat acgcactgat caaccagggc atggcagatc accttgcgat catcgacatc 600

gatgaaaaga aactcgaagg caacgtcatg gacttaaacc atggtgttgt gtgggccgat 660

tcccgcaccc gcgtcaccaa gggcacctac gctgactgcg aagacgcagc catggttgtc 720

atttgtgccg gcgcagccca aaagccaggc 750

<210> 4

<211> 750

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 4

atcacattat cgacgccaag ggctccactt cctacggcat cggcatgggt cttgctcgca 60

tcacccgcgc aatcctgcag aaccaagacg ttgcagtccc agtctctgca ctgctccacg 120

gtgaatacgg tgaggaagac atctacatcg gcaccccagc tgtggtgaac cgccgaggca 180

tccgccgcgt tgtcgaacta gaaatcaccg accacgagat ggaacgcttc aagcattccg 240

caaataccct gcgcgaaatt cagaagcagt tcttctaaat ctttggcgcc tagttggcga 300

cgcaagtgtt tcattggaac acttgcgctg ccaacttttt ggtttacggg cacaatgaaa 360

ctgttggatg gaatttagag tgtttgtagc ttaaggagct caaatgaatg agtttgacca 420

ggacattctc caggagatca agactgaact cgacgagtta attctagaac ttgatgaggt 480

gacacaaact cacagcgagg ccatcgggca ggtctcccca acccattacg ttggtgcccg 540

caacctcatg cattacgcgc atcttcgcac caaagacctc cgtggcctgc agcaacgcct 600

ctcctctgtg ggagctaccc gcttgactac caccgaacca gcagtgcagg cccgcctcaa 660

ggccgcccgc aatgttatcg gagctttcgc aggtgaaggc ccactttatc caccctcaga 720

tgtcgtcgat gccttcgaag atgccgatga 750

<210> 5

<211> 885

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 5

gtgagcgggc gtacgtcgtg ctcaatctga tttacataac ttgcagataa gccaagggtt 60

gctgctaagg atgcctggct caggtctctt tcgcggcgca gttggcgcag cctggacccc 120

acatatgtct ttcccatggc gcaactatag cgtgatcacc atcaccttaa ccactcttgg 180

cactgaggtg ttgcaaactt gttgattttc gcttttcgac gcagcccgcc gccaccaggt 240

gcccggcgtg gtcgggccac atccgccccg ggaacttttt aggcacctac ggtgcaactg 300

ttgggataat tgtgtcacct gcgcaaagtt gctccctgga tcggaaggtt gggctgtcta 360

aactttttgg ttgataccaa acggggttag aaactgttcg gatcggtatc ctgtgaggaa 420

gctcaccttg gttttagaat gttgaaaagg cctcacgttt ccgcaggtag agcacactca 480

attaaatgag cgtcaaacga caataaagta aggctatcct aataagtggg gttttatgtc 540

tctaaacagc cagttggggg tcatggggga gcgccccgtg actggttaat gccccgatct 600

gggacgtaca gtaacaacga cactggaggt gccatgactg ttagaaatcc cgaccgtgag 660

gcaatccgtc acggaaaaat tacgacggag gcgctgcgtg agcgtcccgc atacccgacc 720

tgggcaatga agctgaccat ggccatcact ggcctaatgt ttggtggctt cgttcttgtt 780

cacatgatcg gaaacctgaa aatcttcatg ccggactacg cagccgattc tgcgcatccg 840

ggtgaagcac aagtagatgt ctacggcgag ttcctgcgtg agatc 885

<210> 6

<211> 885

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 6

cacgtaagat ggttgatgaa atggaaacca acttcggaca ctgctccctc tacggcgagt 60

gcgcagatgt ctgccccgca ggcatcccac tgaccgctgt ggcagctgtc accaaggaac 120

gtgcgcgtgc agctttccga ggcaaagacg actagtcttt aatccaagta agtaccggtt 180

cagacagtta aaccagaaag acgagtgaac accatgtcct ccgcgaaaaa gaaacccgca 240

ccggagcgta tgcactacat caagggctat gtacctgtgg cgtatagctc tccacactca 300

tccctcgagc gcagcgcaac ctggttgggc atgggattcc tcctcactgc tctggcaggc 360

gttggcgcag tcctcttcgc agtcggcgca aacagcgttg gccagcagca ggaacactgg 420

gtcctctaca gcatcatcgg tgttgtattc gccgttgtct gcacagtttt gggcaccgtc 480

ctgatcatca agggccgagc accttacaac cgttacgtca aggaaaccgg ccgtacgcag 540

tagtttctgt atgcaggttc tttgactagc acctccaaca acaccctttc ttccatttat 600

gtgggggaga gggtgttgtt ttgtttttgc ttggagttcc ctggagcctt catcgacagc 660

ccccaagccc tcgaaaacgc cgaaagcaac ccactgtgga gccaactccc cgcagtcaaa 720

aacggtcaac tctgtaccac ggaaaacctc accccatgga tcctcaccgg accagcagca 780

gctgagattg tgacctctga cctcgaggca tgtttcgctg cttaggagac atggaagatt 840

ggtggaaatt gggtcgtgca gaaggatgct tggagatata ggata 885

<210> 7

<211> 1517

<212> PRT

<213> 马克斯克鲁维酵母(Kluyveromyces marxianus)

<400> 7

Met Ser Asn Ser Ser Ser Ser Glu Gly Lys Thr Asn Glu Asp Gly Arg

1 5 10 15

Asn Ser Val His Ser Ser Asp Ser Phe Ala Gln Ser Val Ala Ser Phe

20 25 30

His Leu Asp Asp Asn Glu Ser Gln Asn Val Thr Ala Gln Leu Ser Gln

35 40 45

Gln Ile Thr Asn Val Leu Ser Asn Ser Asn Gly Ala Glu Arg Ile Glu

50 55 60

Ser Leu Ala Arg Val Ile Ser Thr Lys Thr Lys Lys Gln Met Glu Ser

65 70 75 80

Phe Glu Val Asn Gln Leu Asp Phe Asp Leu Lys Ala Leu Leu Asn Tyr

85 90 95

Leu Arg Ser Ser Gln Leu Glu Gln Gly Ile Glu Pro Gly Asp Ser Gly

100 105 110

Ile Ala Phe His Asp Leu Thr Ala Val Gly Ile Asp Ala Ser Ala Ala

115 120 125

Phe Gly Pro Ser Val Glu Glu Met Val Arg Ser Trp Ile His Phe Pro

130 135 140

Val Arg Leu Trp Lys Lys Ile Cys Arg Gln Lys Ser Glu Thr Pro Leu

145 150 155 160

Arg Asn Ile Ile Gln His Cys Thr Gly Val Val Glu Ser Gly Glu Met

165 170 175

Leu Phe Val Val Gly Arg Pro Gly Ala Gly Cys Ser Thr Leu Leu Lys

180 185 190

Cys Leu Ser Gly Glu Thr Gly Glu Leu Val Glu Val Thr Gly Asp Ile

195 200 205

Ser Tyr Asp Gly Leu Ser Gln Glu Glu Met Met Gln Lys Phe Lys Gly

210 215 220

Tyr Val Ile Tyr Cys Pro Glu Leu Asp Phe His Phe Pro Lys Ile Thr

225 230 235 240

Val Lys Glu Thr Ile Asp Phe Ala Leu Lys Cys Lys Thr Pro Arg Ser

245 250 255

Arg Ile Asp His Leu Thr Arg Ala Gln Tyr Val Asp Asn Met Arg Asp

260 265 270

Leu Trp Cys Thr Val Phe Gly Leu Thr His Thr Tyr Ala Thr Asn Val

275 280 285

Gly Asn Asp Val Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val

290 295 300

Ser Leu Val Glu Ala Leu Ala Met Asn Ala Ser Ile Tyr Ser Trp Asp

305 310 315 320

Asn Ala Thr Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Phe Ala Gln

325 330 335

Ala Ile Arg Thr Ala Thr Asn Met Met Asn Asn Ser Ala Ile Val Ala

340 345 350

Ile Tyr Gln Ala Gly Glu Asn Ile Tyr Gln Leu Phe Asp Lys Thr Thr

355 360 365

Val Leu Tyr Asn Gly Lys Gln Val Tyr Phe Gly Pro Ala Asp Glu Ala

370 375 380

Val Gly Tyr Phe Glu Arg Met Gly Tyr Ile Lys Pro Asn Arg Met Thr

385 390 395 400

Ser Ala Glu Phe Leu Thr Ser Ala Thr Val Asp Phe Glu Asn Arg Thr

405 410 415

Leu Glu Val Arg Glu Gly Tyr Glu Glu Lys Ile Pro Lys Ser Ser Thr

420 425 430

Glu Met Glu Ala Tyr Trp His Asn Ser Pro Glu Tyr Ala Lys Ala Thr

435 440 445

Glu Leu Phe Asn Glu Tyr Cys Gln Ser His Pro Glu Glu Glu Thr Arg

450 455 460

Gln Arg Leu Glu Thr Ala Lys Lys Gln Arg Leu Gln Lys Gly Gln Arg

465 470 475 480

Glu Lys Ser Gln Phe Val Val Thr Phe Trp Ala Gln Val Trp Tyr Cys

485 490 495

Met Ile Arg Gly Phe Gln Arg Val Lys Gly Asp Ser Thr Tyr Thr Lys

500 505 510

Val Tyr Leu Ser Ser Phe Leu Thr Lys Gly Leu Ile Val Gly Ser Met

515 520 525

Phe His Lys Ile Asp Pro Lys Ser Gln Ser Thr Thr Glu Gly Ala Tyr

530 535 540

Ser Arg Gly Gly Leu Leu Phe Tyr Val Leu Leu Phe Ala Ala Leu Thr

545 550 555 560

Ser Leu Ala Glu Ile Ser Asn Ser Phe Gln Asn Arg Ala Ile Ile Val

565 570 575

Lys Gln Lys Thr Tyr Ser Met Tyr His Thr Ser Ala Glu Ser Leu Gln

580 585 590

Glu Ile Phe Thr Glu Ile Pro Thr Lys Phe Val Ala Ile Leu Thr Leu

595 600 605

Ser Leu Val Ser Tyr Trp Ile Pro Val Leu Lys Tyr Asp Ala Gly Ser

610 615 620

Phe Phe Gln Tyr Leu Leu Tyr Leu Phe Thr Thr Gln Gln Cys Thr Ser

625 630 635 640

Phe Ile Phe Lys Leu Val Ala Thr Leu Thr Lys Asp Gly Gly Thr Ala

645 650 655

His Ala Ile Gly Gly Leu Trp Val Leu Met Leu Thr Val Tyr Ala Gly

660 665 670

Phe Val Leu Pro Ile Gly Asn Met His His Trp Ile Arg Trp Phe His

675 680 685

Tyr Leu Asn Pro Leu Thr Tyr Ala Tyr Glu Ser Leu Met Ser Thr Glu

690 695 700

Phe His Gly Arg Lys Met Leu Cys Ser Arg Leu Leu Pro Ser Gly Pro

705 710 715 720

Gly Tyr Glu Asn Val Ser Ile Ala His Lys Ile Cys Asp Ala Ala Gly

725 730 735

Ala Val Ala Gly Gln Leu Tyr Val Ser Gly Asp Ala Tyr Val Leu Lys

740 745 750

Lys Tyr His Phe Arg Tyr Lys His Ala Trp Arg Asp Trp Gly Ile Asn

755 760 765

Ile Val Trp Thr Phe Gly Tyr Ile Val Met Asn Val Val Met Ser Glu

770 775 780

Tyr Leu Lys Pro Leu Glu Gly Gly Gly Asp Leu Leu Leu Tyr Lys Arg

785 790 795 800

Gly His Met Pro Glu Leu Gly Ser Glu Ser Val Asp Ser Lys Val Ala

805 810 815

Ser Arg Glu Glu Met Met Glu Ser Leu Asn Gly Pro Gly Val Asp Leu

820 825 830

Glu Lys Val Ile Ala Ser Lys Asp Val Phe Thr Trp Asn His Leu Asn

835 840 845

Tyr Thr Ile Pro Tyr Asp Gly Ala Thr Arg Gln Leu Leu Ser Asp Val

850 855 860

Phe Gly Tyr Val Lys Pro Gly Lys Met Thr Ala Leu Met Gly Glu Ser

865 870 875 880

Gly Ala Gly Lys Thr Thr Leu Leu Asn Val Leu Ala Gln Arg Ile Asn

885 890 895

Val Gly Val Ile Thr Gly Asp Met Leu Val Asn Ala Lys Pro Leu Pro

900 905 910

Pro Ser Phe Asn Arg Ser Cys Gly Tyr Val Ala Gln Ala Asp Asn His

915 920 925

Met Gly Glu Leu Ser Val Arg Glu Ser Leu Arg Phe Ala Ala Glu Leu

930 935 940

Arg Gln Pro Lys Ser Val Pro Leu Gln Glu Lys Tyr Asp Tyr Val Glu

945 950 955 960

Lys Ile Ile Ser Leu Leu Gly Met Glu Lys Tyr Ala Glu Ala Ile Ile

965 970 975

Gly Lys Thr Gly Arg Gly Leu Asn Val Glu Gln Arg Lys Lys Leu Ser

980 985 990

Ile Gly Val Glu Leu Val Ala Lys Pro Ser Leu Leu Leu Phe Leu Asp

995 1000 1005

Glu Pro Thr Ser Gly Leu Asp Ser Gln Ser Ala Trp Ser Ile Val

1010 1015 1020

Gln Phe Met Arg Ala Leu Ala Asp Ser Gly Gln Ser Ile Leu Cys

1025 1030 1035

Thr Ile His Gln Pro Ser Ala Thr Leu Phe Glu Gln Phe Asp Arg

1040 1045 1050

Leu Leu Leu Leu Lys Lys Gly Gly Lys Met Val Tyr Phe Gly Asp

1055 1060 1065

Ile Gly Glu Asn Ser Ser Thr Leu Leu Asn Tyr Phe Glu Arg Gln

1070 1075 1080

Ser Gly Val Lys Cys Gly Lys Ser Glu Asn Pro Ala Glu Tyr Met

1085 1090 1095

Leu Asn Cys Ile Gly Ala Gly Ala Thr Ala Ser Ala Asp Ala Asp

1100 1105 1110

Trp His Asp Leu Trp Leu Gln Ser Pro Glu Cys Ala Ala Ala Arg

1115 1120 1125

Glu Glu Val Glu Glu Leu His Arg Thr Leu Ala Ser Arg Pro Val

1130 1135 1140

Thr Asp Asp Lys Glu Leu Ala Gly Arg Tyr Ala Ala Ser Tyr Leu

1145 1150 1155

Thr Gln Met Lys Cys Val Phe Arg Arg Thr Asn Ile Gln Phe Trp

1160 1165 1170

Arg Ser Pro Val Tyr Ile Arg Ala Lys Phe Leu Glu Cys Val Leu

1175 1180 1185

Cys Ala Leu Phe Val Gly Leu Ser Tyr Val Gly Val Asp His Ser

1190 1195 1200

Ile Ala Gly Ala Ser Gln Ser Phe Ser Ser Ile Phe Met Met Leu

1205 1210 1215

Leu Ile Ala Leu Ala Met Val Asn Gln Leu His Val Phe Ala Leu

1220 1225 1230

Asp Ser Arg Glu Leu Tyr Glu Val Arg Glu Ala Ala Ser Asn Thr

1235 1240 1245

Phe His Trp Ser Val Leu Leu Leu Asn His Thr Phe Val Glu Ile

1250 1255 1260

Ile Trp Ser Thr Leu Cys Glu Phe Ile Cys Trp Ile Cys Tyr Tyr

1265 1270 1275

Trp Pro Ala Gln Tyr Ser Gly Arg Ala Ser His Ala Gly Tyr Phe

1280 1285 1290

Phe Leu Ile Tyr Val Ile Met Phe Pro Ala Tyr Phe Val Ser Tyr

1295 1300 1305

Gly Cys Trp Val Phe Tyr Met Ser Pro Asp Val Pro Ser Ala Ser

1310 1315 1320

Met Ile Asn Ser Asn Leu Phe Ala Gly Met Leu Leu Phe Cys Gly

1325 1330 1335

Ile Leu Gln Pro Lys Asp Lys Met Pro Gly Phe Trp Lys Arg Phe

1340 1345 1350

Met Tyr Asn Val Ser Pro Phe Thr Tyr Val Val Gln Ser Leu Val

1355 1360 1365

Thr Pro Leu Val Gln Gly Lys Lys Val Arg Cys Thr Lys Asn Glu

1370 1375 1380

Phe Ala Val Val Asn Pro Pro Glu Gly Gln Thr Cys Ser Gln Tyr

1385 1390 1395

Phe Ala Arg Phe Ile Lys Asp Asn Thr Gly Tyr Leu Lys Asn Pro

1400 1405 1410

Asn Asp Thr Glu Ser Cys His Tyr Cys Pro Tyr Ser Tyr Gln Gln

1415 1420 1425

Glu Val Val Glu Gln Tyr Asn Val Arg Trp Val Tyr Arg Trp Arg

1430 1435 1440

Asn Phe Gly Phe Leu Trp Ala Tyr Ile Gly Phe Asn Phe Phe Ala

1445 1450 1455

Met Leu Ala Cys Tyr Trp Val Leu Arg Val Lys Asn Tyr Ser Ile

1460 1465 1470

Thr Ser Ile Phe Gly Val Phe Lys Ile Gly Asn Trp Lys Lys Ala

1475 1480 1485

Ile His His Asp Ser Arg His Glu Lys Asp His Thr Ile Phe Gln

1490 1495 1500

Glu Lys Pro Gly Asp Ala Ala Asn Val Gln Lys Thr Lys Ala

1505 1510 1515

<210> 8

<211> 328

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 8

Met Asn Ser Pro Gln Asn Val Ser Thr Lys Lys Val Thr Val Thr Gly

1 5 10 15

Ala Ala Gly Gln Ile Ser Tyr Ser Leu Leu Trp Arg Ile Ala Asn Gly

20 25 30

Glu Val Phe Gly Thr Asp Thr Pro Val Glu Leu Lys Leu Leu Glu Ile

35 40 45

Pro Gln Ala Leu Gly Gly Ala Glu Gly Val Ala Met Glu Leu Leu Asp

50 55 60

Ser Ala Phe Pro Leu Leu Arg Asn Ile Thr Ile Thr Ala Asp Ala Asn

65 70 75 80

Glu Ala Phe Asp Gly Ala Asn Ala Ala Phe Leu Val Gly Ala Lys Pro

85 90 95

Arg Gly Lys Gly Glu Glu Arg Ala Asp Leu Leu Ala Asn Asn Gly Lys

100 105 110

Ile Phe Gly Pro Gln Gly Lys Ala Ile Asn Asp Asn Ala Ala Asp Asp

115 120 125

Ile Arg Val Leu Val Val Gly Asn Pro Ala Asn Thr Asn Ala Leu Ile

130 135 140

Ala Ser Ala Ala Ala Pro Asp Val Pro Ala Ser Arg Phe Asn Ala Met

145 150 155 160

Met Arg Leu Asp His Asn Arg Ala Ile Ser Gln Leu Ala Thr Lys Leu

165 170 175

Gly Arg Gly Ser Ala Glu Phe Asn Asn Ile Val Val Trp Gly Asn His

180 185 190

Ser Ala Thr Gln Phe Pro Asp Ile Thr Tyr Ala Thr Val Gly Gly Glu

195 200 205

Lys Val Thr Asp Leu Val Asp His Asp Trp Tyr Val Glu Glu Phe Ile

210 215 220

Pro Arg Val Ala Asn Arg Gly Ala Glu Ile Ile Glu Val Arg Gly Lys

225 230 235 240

Ser Ser Ala Ala Ser Ala Ala Ser Ser Ala Ile Asp His Met Arg Asp

245 250 255

Trp Val Gln Gly Thr Glu Ala Trp Ser Ser Ala Ala Ile Pro Ser Thr

260 265 270

Gly Ala Tyr Gly Ile Pro Glu Gly Ile Phe Val Gly Leu Pro Thr Val

275 280 285

Ser Arg Asn Gly Glu Trp Glu Ile Val Glu Gly Leu Glu Ile Ser Asp

290 295 300

Phe Gln Arg Ala Arg Ile Asp Ala Asn Ala Gln Glu Leu Gln Ala Glu

305 310 315 320

Arg Glu Ala Val Arg Asp Leu Leu

325

<210> 9

<211> 268

<212> PRT

<213> Cupriavidus necator

<400> 9

Met Ser Met Leu His Val Ser Met Val Gly Cys Gly Ala Ile Gly Arg

1 5 10 15

Gly Val Leu Glu Leu Leu Lys Ala Asp Pro Asp Val Ala Phe Asp Val

20 25 30

Val Ile Val Pro Glu Gly Gln Met Asp Glu Ala Arg Ser Ala Leu Ser

35 40 45

Ala Leu Ala Pro Asn Val Arg Val Ala Thr Gly Leu Asp Gly Gln Arg

50 55 60

Pro Asp Leu Leu Val Glu Cys Ala Gly His Gln Ala Leu Glu Glu His

65 70 75 80

Ile Val Pro Ala Leu Glu Arg Gly Ile Pro Cys Met Val Val Ser Val

85 90 95

Gly Ala Leu Ser Glu Pro Gly Leu Val Glu Arg Leu Glu Ala Ala Ala

100 105 110

Arg Arg Gly Asn Thr Gln Val Gln Leu Leu Ser Gly Ala Ile Gly Ala

115 120 125

Ile Asp Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Asp Glu Val Ile

130 135 140

Tyr Thr Gly Arg Lys Pro Ala Arg Ala Trp Thr Gly Thr Pro Ala Ala

145 150 155 160

Glu Leu Phe Asp Leu Glu Ala Leu Thr Glu Pro Thr Val Ile Phe Glu

165 170 175

Gly Thr Ala Arg Asp Ala Ala Arg Leu Tyr Pro Lys Asn Ala Asn Val

180 185 190

Ala Ala Thr Val Ser Leu Ala Gly Leu Gly Leu Asp Arg Thr Ser Val

195 200 205

Arg Leu Leu Ala Asp Pro Asn Ala Val Glu Asn Val His His Ile Glu

210 215 220

Ala Arg Gly Ala Phe Gly Gly Phe Glu Leu Thr Met Arg Gly Lys Pro

225 230 235 240

Leu Ala Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Phe Ser Val Val

245 250 255

Arg Ala Leu Gly Asn Arg Ala His Ala Val Ser Ile

260 265

<210> 10

<211> 673

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 10

Met Ser Thr His Ser Glu Thr Thr Arg Pro Glu Phe Ile His Pro Val

1 5 10 15

Ser Val Leu Pro Glu Val Ser Ala Gly Thr Val Leu Asp Ala Ala Glu

20 25 30

Pro Ala Gly Val Pro Thr Lys Asp Met Trp Glu Tyr Gln Lys Asp His

35 40 45

Met Asn Leu Val Ser Pro Leu Asn Arg Arg Lys Phe Arg Val Leu Val

50 55 60

Val Gly Thr Gly Leu Ser Gly Gly Ala Ala Ala Ala Ala Leu Gly Glu

65 70 75 80

Leu Gly Tyr Asp Val Lys Ala Phe Thr Tyr His Asp Ala Pro Arg Arg

85 90 95

Ala His Ser Ile Ala Ala Gln Gly Gly Val Asn Ser Ala Arg Gly Lys

100 105 110

Lys Val Asp Asn Asp Gly Ala Tyr Arg His Val Lys Asp Thr Val Lys

115 120 125

Gly Gly Asp Tyr Arg Gly Arg Glu Ser Asp Cys Trp Arg Leu Ala Val

130 135 140

Glu Ser Val Arg Val Ile Asp His Met Asn Ala Ile Gly Ala Pro Phe

145 150 155 160

Ala Arg Glu Tyr Gly Gly Ala Leu Ala Thr Arg Ser Phe Gly Gly Val

165 170 175

Gln Val Ser Arg Thr Tyr Tyr Thr Arg Gly Gln Thr Gly Gln Gln Leu

180 185 190

Gln Leu Ser Thr Ala Ser Ala Leu Gln Arg Gln Ile His Leu Gly Ser

195 200 205

Val Glu Ile Phe Thr His Asn Glu Met Val Asp Val Ile Val Thr Glu

210 215 220

Arg Asn Gly Glu Lys Arg Cys Glu Gly Leu Ile Met Arg Asn Leu Ile

225 230 235 240

Thr Gly Glu Leu Thr Ala His Thr Gly His Ala Val Ile Leu Ala Thr

245 250 255

Gly Gly Tyr Gly Asn Val Tyr His Met Ser Thr Leu Ala Lys Asn Ser

260 265 270

Asn Ala Ser Ala Ile Met Arg Ala Tyr Glu Ala Gly Ala Tyr Phe Ala

275 280 285

Ser Pro Ser Phe Ile Gln Phe His Pro Thr Gly Leu Pro Val Asn Ser

290 295 300

Thr Trp Gln Ser Lys Thr Ile Leu Met Ser Glu Ser Leu Arg Asn Asp

305 310 315 320

Gly Arg Ile Trp Ser Pro Lys Glu Pro Asn Asp Asn Arg Asp Pro Asn

325 330 335

Thr Ile Pro Glu Asp Glu Arg Asp Tyr Phe Leu Glu Arg Arg Tyr Pro

340 345 350

Ala Phe Gly Asn Leu Val Pro Arg Asp Val Ala Ser Arg Ala Ile Ser

355 360 365

Gln Gln Ile Asn Ala Gly Leu Gly Val Gly Pro Leu Asn Asn Ala Ala

370 375 380

Tyr Leu Asp Phe Arg Asp Ala Thr Glu Arg Leu Gly Gln Asp Thr Ile

385 390 395 400

Arg Glu Arg Tyr Ser Asn Leu Phe Thr Met Tyr Glu Glu Ala Ile Gly

405 410 415

Glu Asp Pro Tyr Ser Ser Pro Met Arg Ile Ala Pro Thr Cys His Phe

420 425 430

Thr Met Gly Gly Leu Trp Thr Asp Phe Asn Glu Met Thr Ser Leu Pro

435 440 445

Gly Leu Phe Cys Ala Gly Glu Ala Ser Trp Thr Tyr His Gly Ala Asn

450 455 460

Arg Leu Gly Ala Asn Ser Leu Leu Ser Ala Ser Val Asp Gly Trp Phe

465 470 475 480

Thr Leu Pro Phe Thr Ile Pro Asn Tyr Leu Gly Pro Leu Leu Gly Ser

485 490 495

Glu Arg Leu Ser Glu Asp Ala Pro Glu Ala Gln Ala Ala Ile Ala Arg

500 505 510

Ala Gln Ala Arg Ile Asp Arg Leu Met Gly Asn Arg Pro Glu Trp Val

515 520 525

Gly Asp Asn Val His Gly Pro Glu Tyr Tyr His Arg Gln Leu Gly Asp

530 535 540

Ile Leu Tyr Phe Ser Cys Gly Val Ser Arg Asn Val Glu Asp Leu Gln

545 550 555 560

Asp Gly Ile Asn Lys Ile Arg Ala Leu Arg Asp Asp Phe Trp Lys Asn

565 570 575

Met Arg Ile Thr Gly Ser Thr Asp Glu Met Asn Gln Val Leu Glu Tyr

580 585 590

Ala Ala Arg Val Ala Asp Tyr Ile Asp Leu Gly Glu Leu Met Cys Val

595 600 605

Asp Ala Leu Asp Arg Asp Glu Ser Cys Gly Ala His Phe Arg Asp Asp

610 615 620

His Leu Ser Glu Asp Gly Glu Ala Glu Arg Asp Asp Glu Asn Trp Cys

625 630 635 640

Phe Val Ser Ala Trp Glu Pro Gly Glu Asn Gly Thr Phe Val Arg His

645 650 655

Ala Glu Pro Leu Phe Phe Glu Ser Val Pro Leu Gln Thr Arg Asn Tyr

660 665 670

Lys

<210> 11

<211> 673

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 11

Met Ser Thr His Ser Glu Thr Thr Arg Pro Glu Phe Ile His Pro Val

1 5 10 15

Ser Val Leu Pro Glu Val Ser Ala Gly Thr Val Leu Asp Ala Ala Glu

20 25 30

Pro Ala Gly Val Pro Thr Lys Asp Met Trp Glu Tyr Gln Lys Asp His

35 40 45

Met Asn Leu Val Ser Pro Leu Asn Arg Arg Lys Phe Arg Val Leu Val

50 55 60

Val Gly Thr Gly Leu Ser Gly Gly Ala Ala Ala Ala Ala Leu Gly Glu

65 70 75 80

Leu Gly Tyr Asp Val Lys Ala Phe Thr Tyr His Asp Ala Pro Arg Arg

85 90 95

Ala His Ser Ile Ala Ala Gln Gly Gly Val Asn Ser Ala Arg Gly Lys

100 105 110

Lys Val Asp Asn Asp Gly Ala Tyr Arg His Val Lys Asp Thr Val Lys

115 120 125

Gly Gly Asp Tyr Arg Gly Arg Glu Ser Asp Cys Trp Arg Leu Ala Val

130 135 140

Glu Ser Val Arg Val Ile Asp His Met Asn Ala Ile Gly Ala Pro Phe

145 150 155 160

Ala Arg Glu Tyr Gly Gly Ala Leu Ala Thr Arg Ser Phe Gly Gly Val

165 170 175

Gln Val Ser Arg Thr Tyr Tyr Thr Arg Gly Gln Thr Gly Gln Gln Leu

180 185 190

Gln Leu Ser Thr Ala Ser Ala Leu Gln Arg Gln Ile His Leu Gly Ser

195 200 205

Val Glu Ile Phe Thr His Asn Glu Met Val Asp Val Ile Val Thr Glu

210 215 220

Arg Asn Gly Glu Lys Arg Cys Glu Gly Leu Ile Met Arg Asn Leu Ile

225 230 235 240

Thr Gly Glu Leu Thr Ala His Thr Gly His Ala Val Ile Leu Ala Thr

245 250 255

Gly Gly Tyr Gly Asn Val Tyr His Met Ser Thr Leu Ala Lys Asn Ser

260 265 270

Asn Ala Ser Ala Ile Met Arg Ala Tyr Glu Ala Gly Ala Tyr Phe Ala

275 280 285

Ser Pro Ser Phe Ile Gln Phe His Pro Thr Gly Leu Pro Val Asn Ser

290 295 300

Thr Trp Gln Ser Lys Thr Ile Leu Met Ser Glu Ser Leu Arg Asn Asp

305 310 315 320

Gly Arg Ile Trp Ser Pro Lys Glu Pro Asn Asp Asn Arg Asp Pro Asn

325 330 335

Thr Ile Pro Glu Asp Glu Arg Asp Tyr Phe Leu Glu Arg Arg Tyr Pro

340 345 350

Ala Phe Gly Asn Leu Val Pro Arg Asp Val Ala Ser Arg Ala Ile Ser

355 360 365

Gln Gln Ile Asn Ala Gly Leu Gly Val Gly Pro Leu Asn Asn Ala Ala

370 375 380

Tyr Leu Asp Phe Arg Asp Ala Thr Glu Arg Leu Gly Gln Asp Thr Ile

385 390 395 400

Arg Glu Arg Tyr Ser Asn Leu Phe Thr Met Tyr Glu Glu Ala Ile Gly

405 410 415

Glu Asp Pro Tyr Ser Ser Pro Met Arg Ile Ala Pro Thr Cys His Phe

420 425 430

Thr Met Gly Gly Leu Trp Thr Asp Phe Asn Glu Met Thr Ser Leu Pro

435 440 445

Gly Leu Phe Cys Ala Gly Glu Ala Ser Trp Thr Tyr His Gly Ala Asn

450 455 460

Arg Leu Gly Ala Asn Ser Leu Leu Ser Ala Ser Val Asp Gly Trp Phe

465 470 475 480

Thr Leu Pro Phe Thr Ile Pro Asn Tyr Leu Gly Pro Leu Leu Gly Ser

485 490 495

Glu Arg Leu Ser Glu Asp Ala Pro Glu Ala Gln Ala Ala Ile Ala Arg

500 505 510

Ala Gln Ala Arg Ile Asp Arg Leu Met Gly Asn Arg Pro Glu Trp Val

515 520 525

Gly Asp Asn Val His Gly Pro Glu Tyr Tyr His Arg Gln Leu Gly Asp

530 535 540

Ile Leu Tyr Phe Ser Cys Gly Val Ser Arg Asn Val Glu Asp Leu Gln

545 550 555 560

Asp Gly Ile Asn Lys Ile Arg Ala Leu Arg Asp Asp Phe Trp Lys Asn

565 570 575

Met Arg Ile Thr Gly Ser Thr Asp Glu Met Asn Gln Val Leu Glu Tyr

580 585 590

Ala Ala Arg Val Ala Asp Tyr Ile Asp Leu Gly Glu Leu Met Cys Val

595 600 605

Asp Ala Leu Asp Arg Asp Glu Ser Cys Gly Ala His Phe Arg Asp Asp

610 615 620

His Leu Ser Glu Asp Gly Glu Ala Glu Arg Asp Asp Glu Asn Trp Cys

625 630 635 640

Phe Val Ser Ala Trp Glu Pro Gly Glu Asn Gly Thr Phe Val Arg His

645 650 655

Ala Glu Pro Leu Phe Phe Glu Ser Val Pro Leu Gln Thr Arg Asn Tyr

660 665 670

Lys

<210> 12

<211> 883

<212> PRT

<213> 大肠杆菌

<400> 12

Met Asn Glu Gln Tyr Ser Ala Leu Arg Ser Asn Val Ser Met Leu Gly

1 5 10 15

Lys Val Leu Gly Glu Thr Ile Lys Asp Ala Leu Gly Glu His Ile Leu

20 25 30

Glu Arg Val Glu Thr Ile Arg Lys Leu Ser Lys Ser Ser Arg Ala Gly

35 40 45

Asn Asp Ala Asn Arg Gln Glu Leu Leu Thr Thr Leu Gln Asn Leu Ser

50 55 60

Asn Asp Glu Leu Leu Pro Val Ala Arg Ala Phe Ser Gln Phe Leu Asn

65 70 75 80

Leu Ala Asn Thr Ala Glu Gln Tyr His Ser Ile Ser Pro Lys Gly Glu

85 90 95

Ala Ala Ser Asn Pro Glu Val Ile Ala Arg Thr Leu Arg Lys Leu Lys

100 105 110

Asn Gln Pro Glu Leu Ser Glu Asp Thr Ile Lys Lys Ala Val Glu Ser

115 120 125

Leu Ser Leu Glu Leu Val Leu Thr Ala His Pro Thr Glu Ile Thr Arg

130 135 140

Arg Thr Leu Ile His Lys Met Val Glu Val Asn Ala Cys Leu Lys Gln

145 150 155 160

Leu Asp Asn Lys Asp Ile Ala Asp Tyr Glu His Asn Gln Leu Met Arg

165 170 175

Arg Leu Arg Gln Leu Ile Ala Gln Ser Trp His Thr Asp Glu Ile Arg

180 185 190

Lys Leu Arg Pro Ser Pro Val Asp Glu Ala Lys Trp Gly Phe Ala Val

195 200 205

Val Glu Asn Ser Leu Trp Gln Gly Val Pro Asn Tyr Leu Arg Glu Leu

210 215 220

Asn Glu Gln Leu Glu Glu Asn Leu Gly Tyr Lys Leu Pro Val Glu Phe

225 230 235 240

Val Pro Val Arg Phe Thr Ser Trp Met Gly Gly Asp Arg Asp Gly Asn

245 250 255

Pro Asn Val Thr Ala Asp Ile Thr Arg His Val Leu Leu Leu Ser Arg

260 265 270

Trp Lys Ala Thr Asp Leu Phe Leu Lys Asp Ile Gln Val Leu Val Ser

275 280 285

Glu Leu Ser Met Val Glu Ala Thr Pro Glu Leu Leu Ala Leu Val Gly

290 295 300

Glu Glu Gly Ala Ala Glu Pro Tyr Arg Tyr Leu Met Lys Asn Leu Arg

305 310 315 320

Ser Arg Leu Met Ala Thr Gln Ala Trp Leu Glu Ala Arg Leu Lys Gly

325 330 335

Glu Glu Leu Pro Lys Pro Glu Gly Leu Leu Thr Gln Asn Glu Glu Leu

340 345 350

Trp Glu Pro Leu Tyr Ala Cys Tyr Gln Ser Leu Gln Ala Cys Gly Met

355 360 365

Gly Ile Ile Ala Asn Gly Asp Leu Leu Asp Thr Leu Arg Arg Val Lys

370 375 380

Cys Phe Gly Val Pro Leu Val Arg Ile Asp Ile Arg Gln Glu Ser Thr

385 390 395 400

Arg His Thr Glu Ala Leu Gly Glu Leu Thr Arg Tyr Leu Gly Ile Gly

405 410 415

Asp Tyr Glu Ser Trp Ser Glu Ala Asp Lys Gln Ala Phe Leu Ile Arg

420 425 430

Glu Leu Asn Ser Lys Arg Pro Leu Leu Pro Arg Asn Trp Gln Pro Ser

435 440 445

Ala Glu Thr Arg Glu Val Leu Asp Thr Cys Gln Val Ile Ala Glu Ala

450 455 460

Pro Gln Gly Ser Ile Ala Ala Tyr Val Ile Ser Met Ala Lys Thr Pro

465 470 475 480

Ser Asp Val Leu Ala Val His Leu Leu Leu Lys Glu Ala Gly Ile Gly

485 490 495

Phe Ala Met Pro Val Ala Pro Leu Phe Glu Thr Leu Asp Asp Leu Asn

500 505 510

Asn Ala Asn Asp Val Met Thr Gln Leu Leu Asn Ile Asp Trp Tyr Arg

515 520 525

Gly Leu Ile Gln Gly Lys Gln Met Val Met Ile Gly Tyr Ser Asp Ser

530 535 540

Ala Lys Asp Ala Gly Val Met Ala Ala Ser Trp Ala Gln Tyr Gln Ala

545 550 555 560

Gln Asp Ala Leu Ile Lys Thr Cys Glu Lys Ala Gly Ile Glu Leu Thr

565 570 575

Leu Phe His Gly Arg Gly Gly Ser Ile Gly Arg Gly Gly Ala Pro Ala

580 585 590

His Ala Ala Leu Leu Ser Gln Pro Pro Gly Ser Leu Lys Gly Gly Leu

595 600 605

Arg Val Thr Glu Gln Gly Glu Met Ile Arg Phe Lys Tyr Gly Leu Pro

610 615 620

Glu Ile Thr Val Ser Ser Leu Ser Leu Tyr Thr Gly Ala Ile Leu Glu

625 630 635 640

Ala Asn Leu Leu Pro Pro Pro Glu Pro Lys Glu Ser Trp Arg Arg Ile

645 650 655

Met Asp Glu Leu Ser Val Ile Ser Cys Asp Val Tyr Arg Gly Tyr Val

660 665 670

Arg Glu Asn Lys Asp Phe Val Pro Tyr Phe Arg Ser Ala Thr Pro Glu

675 680 685

Gln Glu Leu Gly Lys Leu Pro Leu Gly Ser Arg Pro Ala Lys Arg Arg

690 695 700

Pro Thr Gly Gly Val Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala

705 710 715 720

Trp Thr Gln Asn Arg Leu Met Leu Pro Ala Trp Leu Gly Ala Gly Thr

725 730 735

Ala Leu Gln Lys Val Val Glu Asp Gly Lys Gln Ser Glu Leu Glu Ala

740 745 750

Met Cys Arg Asp Trp Pro Phe Phe Ser Thr Arg Leu Gly Met Leu Glu

755 760 765

Met Val Phe Ala Lys Ala Asp Leu Trp Leu Ala Glu Tyr Tyr Asp Gln

770 775 780

Arg Leu Val Asp Lys Ala Leu Trp Pro Leu Gly Lys Glu Leu Arg Asn

785 790 795 800

Leu Gln Glu Glu Asp Ile Lys Val Val Leu Ala Ile Ala Asn Asp Ser

805 810 815

His Leu Met Ala Asp Leu Pro Trp Ile Ala Glu Ser Ile Gln Leu Arg

820 825 830

Asn Ile Tyr Thr Asp Pro Leu Asn Val Leu Gln Ala Glu Leu Leu His

835 840 845

Arg Ser Arg Gln Ala Glu Lys Glu Gly Gln Glu Pro Asp Pro Arg Val

850 855 860

Glu Gln Ala Leu Met Val Thr Ile Ala Gly Ile Ala Ala Gly Met Arg

865 870 875 880

Asn Thr Gly

<210> 13

<211> 606

<212> PRT

<213> 结核分枝杆菌(Mycobacterium tuberculosis)

<400> 13

Met Thr Ser Ala Thr Ile Pro Gly Leu Asp Thr Ala Pro Thr Asn His

1 5 10 15

Gln Gly Leu Leu Ser Trp Val Glu Glu Val Ala Glu Leu Thr Gln Pro

20 25 30

Asp Arg Val Val Phe Thr Asp Gly Ser Glu Glu Glu Phe Gln Arg Leu

35 40 45

Cys Asp Gln Leu Val Glu Ala Gly Thr Phe Ile Arg Leu Asn Pro Glu

50 55 60

Lys His Lys Asn Ser Tyr Leu Ala Leu Ser Asp Pro Ser Asp Val Ala

65 70 75 80

Arg Val Glu Ser Arg Thr Tyr Ile Cys Ser Ala Lys Glu Ile Asp Ala

85 90 95

Gly Pro Thr Asn Asn Trp Met Asp Pro Gly Glu Met Arg Ser Ile Met

100 105 110

Lys Asp Leu Tyr Arg Gly Cys Met Arg Gly Arg Thr Met Tyr Val Val

115 120 125

Pro Phe Cys Met Gly Pro Leu Gly Ala Glu Asp Pro Lys Leu Gly Val

130 135 140

Glu Ile Thr Asp Ser Glu Tyr Val Val Val Ser Met Arg Thr Met Thr

145 150 155 160

Arg Met Gly Lys Ala Ala Leu Glu Lys Met Gly Asp Asp Gly Phe Phe

165 170 175

Val Lys Ala Leu His Ser Val Gly Ala Pro Leu Glu Pro Gly Gln Lys

180 185 190

Asp Val Ala Trp Pro Cys Ser Glu Thr Lys Tyr Ile Thr His Phe Pro

195 200 205

Glu Thr Arg Glu Ile Trp Ser Tyr Gly Ser Gly Tyr Gly Gly Asn Ala

210 215 220

Leu Leu Gly Lys Lys Cys Tyr Ser Leu Arg Ile Ala Ser Ala Met Ala

225 230 235 240

His Asp Glu Gly Trp Leu Ala Glu His Met Leu Ile Leu Lys Leu Ile

245 250 255

Ser Pro Glu Asn Lys Ala Tyr Tyr Phe Ala Ala Ala Phe Pro Ser Ala

260 265 270

Cys Gly Lys Thr Asn Leu Ala Met Leu Gln Pro Thr Ile Pro Gly Trp

275 280 285

Arg Ala Glu Thr Leu Gly Asp Asp Ile Ala Trp Met Arg Phe Gly Lys

290 295 300

Asp Gly Arg Leu Tyr Ala Val Asn Pro Glu Phe Gly Phe Phe Gly Val

305 310 315 320

Ala Pro Gly Thr Asn Trp Lys Ser Asn Pro Asn Ala Met Arg Thr Ile

325 330 335

Ala Ala Gly Asn Thr Val Phe Thr Asn Val Ala Leu Thr Asp Asp Gly

340 345 350

Asp Val Trp Trp Glu Gly Leu Glu Gly Asp Pro Gln His Leu Ile Asp

355 360 365

Trp Lys Gly Asn Asp Trp Tyr Phe Arg Glu Thr Glu Thr Asn Ala Ala

370 375 380

His Pro Asn Ser Arg Tyr Cys Thr Pro Met Ser Gln Cys Pro Ile Leu

385 390 395 400

Ala Pro Glu Trp Asp Asp Pro Gln Gly Val Pro Ile Ser Gly Ile Leu

405 410 415

Phe Gly Gly Arg Arg Lys Thr Thr Val Pro Leu Val Thr Glu Ala Arg

420 425 430

Asp Trp Gln His Gly Val Phe Ile Gly Ala Thr Leu Gly Ser Glu Gln

435 440 445

Thr Ala Ala Ala Glu Gly Lys Val Gly Asn Val Arg Arg Asp Pro Met

450 455 460

Ala Met Leu Pro Phe Leu Gly Tyr Asn Val Gly Asp Tyr Phe Gln His

465 470 475 480

Trp Ile Asn Leu Gly Lys His Ala Asp Glu Ser Lys Leu Pro Lys Val

485 490 495

Phe Phe Val Asn Trp Phe Arg Arg Gly Asp Asp Gly Arg Phe Leu Trp

500 505 510

Pro Gly Phe Gly Glu Asn Ser Arg Val Leu Lys Trp Ile Val Asp Arg

515 520 525

Ile Glu His Lys Ala Gly Gly Ala Thr Thr Pro Ile Gly Thr Val Pro

530 535 540

Ala Val Glu Asp Leu Asp Leu Asp Gly Leu Asp Val Asp Ala Ala Asp

545 550 555 560

Val Ala Ala Ala Leu Ala Val Asp Ala Asp Glu Trp Arg Gln Glu Leu

565 570 575

Pro Leu Ile Glu Glu Trp Leu Gln Phe Val Gly Glu Lys Leu Pro Thr

580 585 590

Gly Val Lys Asp Glu Phe Asp Ala Leu Lys Glu Arg Leu Gly

595 600 605

<210> 14

<211> 919

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 14

Met Thr Asp Phe Leu Arg Asp Asp Ile Arg Phe Leu Gly Gln Ile Leu

1 5 10 15

Gly Glu Val Ile Ala Glu Gln Glu Gly Gln Glu Val Tyr Glu Leu Val

20 25 30

Glu Gln Ala Arg Leu Thr Ser Phe Asp Ile Ala Lys Gly Asn Ala Glu

35 40 45

Met Asp Ser Leu Val Gln Val Phe Asp Gly Ile Thr Pro Ala Lys Ala

50 55 60

Thr Pro Ile Ala Arg Ala Phe Ser His Phe Ala Leu Leu Ala Asn Leu

65 70 75 80

Ala Glu Asp Leu Tyr Asp Glu Glu Leu Arg Glu Gln Ala Leu Asp Ala

85 90 95

Gly Asp Thr Pro Pro Asp Ser Thr Leu Asp Ala Thr Trp Leu Lys Leu

100 105 110

Asn Glu Gly Asn Val Gly Ala Glu Ala Val Ala Asp Val Leu Arg Asn

115 120 125

Ala Glu Val Ala Pro Val Leu Thr Ala His Pro Thr Glu Thr Arg Arg

130 135 140

Arg Thr Val Phe Asp Ala Gln Lys Trp Ile Thr Thr His Met Arg Glu

145 150 155 160

Arg His Ala Leu Gln Ser Ala Glu Pro Thr Ala Arg Thr Gln Ser Lys

165 170 175

Leu Asp Glu Ile Glu Lys Asn Ile Arg Arg Arg Ile Thr Ile Leu Trp

180 185 190

Gln Thr Ala Leu Ile Arg Val Ala Arg Pro Arg Ile Glu Asp Glu Ile

195 200 205

Glu Val Gly Leu Arg Tyr Tyr Lys Leu Ser Leu Leu Glu Glu Ile Pro

210 215 220

Arg Ile Asn Arg Asp Val Ala Val Glu Leu Arg Glu Arg Phe Gly Glu

225 230 235 240

Gly Val Pro Leu Lys Pro Val Val Lys Pro Gly Ser Trp Ile Gly Gly

245 250 255

Asp His Asp Gly Asn Pro Tyr Val Thr Ala Glu Thr Val Glu Tyr Ser

260 265 270

Thr His Arg Ala Ala Glu Thr Val Leu Lys Tyr Tyr Ala Arg Gln Leu

275 280 285

His Ser Leu Glu His Glu Leu Ser Leu Ser Asp Arg Met Asn Lys Val

290 295 300

Thr Pro Gln Leu Leu Ala Leu Ala Asp Ala Gly His Asn Asp Val Pro

305 310 315 320

Ser Arg Val Asp Glu Pro Tyr Arg Arg Ala Val His Gly Val Arg Gly

325 330 335

Arg Ile Leu Ala Thr Thr Ala Glu Leu Ile Gly Glu Asp Ala Val Glu

340 345 350

Gly Val Trp Phe Lys Val Phe Thr Pro Tyr Ala Ser Pro Glu Glu Phe

355 360 365

Leu Asn Asp Ala Leu Thr Ile Asp His Ser Leu Arg Glu Ser Lys Asp

370 375 380

Val Leu Ile Ala Asp Asp Arg Leu Ser Val Leu Ile Ser Ala Ile Glu

385 390 395 400

Ser Phe Gly Phe Asn Leu Tyr Ala Leu Asp Leu Arg Gln Asn Ser Glu

405 410 415

Ser Tyr Glu Asp Val Leu Thr Glu Leu Phe Glu Arg Ala Gln Val Thr

420 425 430

Ala Asn Tyr Arg Glu Leu Ser Glu Ala Glu Lys Leu Glu Val Leu Leu

435 440 445

Lys Glu Leu Arg Ser Pro Arg Pro Leu Ile Pro His Gly Ser Asp Glu

450 455 460

Tyr Ser Glu Val Thr Asp Arg Glu Leu Gly Ile Phe Arg Thr Ala Ser

465 470 475 480

Glu Ala Val Lys Lys Phe Gly Pro Arg Met Val Pro His Cys Ile Ile

485 490 495

Ser Met Ala Ser Ser Val Thr Asp Val Leu Glu Pro Met Val Leu Leu

500 505 510

Lys Glu Phe Gly Leu Ile Ala Ala Asn Gly Asp Asn Pro Arg Gly Thr

515 520 525

Val Asp Val Ile Pro Leu Phe Glu Thr Ile Glu Asp Leu Gln Ala Gly

530 535 540

Ala Gly Ile Leu Asp Glu Leu Trp Lys Ile Asp Leu Tyr Arg Asn Tyr

545 550 555 560

Leu Leu Gln Arg Asp Asn Val Gln Glu Val Met Leu Gly Tyr Ser Asp

565 570 575

Ser Asn Lys Asp Gly Gly Tyr Phe Ser Ala Asn Trp Ala Leu Tyr Asp

580 585 590

Ala Glu Leu Gln Leu Val Glu Leu Cys Arg Ser Ala Gly Val Lys Leu

595 600 605

Arg Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro

610 615 620

Ser Tyr Asp Ala Ile Leu Ala Gln Pro Arg Gly Ala Val Gln Gly Ser

625 630 635 640

Val Arg Ile Thr Glu Gln Gly Glu Ile Ile Ser Ala Lys Tyr Gly Asn

645 650 655

Pro Glu Thr Ala Arg Arg Asn Leu Glu Ala Leu Val Ser Ala Thr Leu

660 665 670

Glu Ala Ser Leu Leu Asp Val Ser Glu Leu Thr Asp His Gln Arg Ala

675 680 685

Tyr Asp Ile Met Ser Glu Ile Ser Glu Leu Ser Leu Lys Lys Tyr Ala

690 695 700

Ser Leu Val His Glu Asp Gln Gly Phe Ile Asp Tyr Phe Thr Gln Ser

705 710 715 720

Thr Pro Leu Gln Glu Ile Gly Ser Leu Asn Ile Gly Ser Arg Pro Ser

725 730 735

Ser Arg Lys Gln Thr Ser Ser Val Glu Asp Leu Arg Ala Ile Pro Trp

740 745 750

Val Leu Ser Trp Ser Gln Ser Arg Val Met Leu Pro Gly Trp Phe Gly

755 760 765

Val Gly Thr Ala Leu Glu Gln Trp Ile Gly Glu Gly Glu Gln Ala Thr

770 775 780

Gln Arg Ile Ala Glu Leu Gln Thr Leu Asn Glu Ser Trp Pro Phe Phe

785 790 795 800

Thr Ser Val Leu Asp Asn Met Ala Gln Val Met Ser Lys Ala Glu Leu

805 810 815

Arg Leu Ala Lys Leu Tyr Ala Asp Leu Ile Pro Asp Thr Glu Val Ala

820 825 830

Glu Arg Val Tyr Ser Val Ile Arg Glu Glu Tyr Phe Leu Thr Lys Lys

835 840 845

Met Phe Cys Val Ile Thr Gly Ser Asp Asp Leu Leu Asp Asp Asn Pro

850 855 860

Leu Leu Ala Arg Ser Val Gln Arg Arg Tyr Pro Tyr Leu Leu Pro Leu

865 870 875 880

Asn Val Ile Gln Val Glu Met Met Arg Arg Tyr Arg Lys Gly Asp Gln

885 890 895

Ser Glu Gln Val Ser Arg Asn Ile Gln Leu Thr Met Asn Gly Leu Ser

900 905 910

Thr Ala Leu Arg Asn Ser Gly

915

<210> 15

<211> 1140

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 15

Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala Phe Lys Lys Ile Leu

1 5 10 15

Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala Phe Arg Ala Ala Leu

20 25 30

Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro Arg Glu Asp Arg Gly

35 40 45

Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val Arg Ile Gly Thr Glu

50 55 60

Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp Glu Ile Ile Gly Ala

65 70 75 80

Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro Gly Tyr Gly Phe Leu

85 90 95

Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala Glu Asn Gly Ile Thr

100 105 110

Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu Thr Gly Asp Lys Ser

115 120 125

Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu Pro Val Leu Ala Glu

130 135 140

Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val Lys Ser Ala Glu Gly

145 150 155 160

Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala Gly Gly Gly Gly Arg

165 170 175

Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu Arg Lys Leu Ala Thr

180 185 190

Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly Asp Gly Ala Val Tyr

195 200 205

Val Glu Arg Ala Val Ile Asn Pro Gln His Ile Glu Val Gln Ile Leu

210 215 220

Gly Asp His Thr Gly Glu Val Val His Leu Tyr Glu Arg Asp Cys Ser

225 230 235 240

Leu Gln Arg Arg His Gln Lys Val Val Glu Ile Ala Pro Ala Gln His

245 250 255

Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala Asp Ala Val Lys Phe

260 265 270

Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr Val Glu Phe Leu Val

275 280 285

Asp Glu Lys Gly Asn His Val Phe Ile Glu Met Asn Pro Arg Ile Gln

290 295 300

Val Glu His Thr Val Thr Glu Glu Val Thr Glu Val Asp Leu Val Lys

305 310 315 320

Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu Lys Glu Leu Gly Leu

325 330 335

Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala Leu Gln Cys Arg Ile

340 345 350

Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro Asp Thr Gly Thr Ile

355 360 365

Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val Arg Leu Asp Gly Ala

370 375 380

Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe Asp Ser Met Leu Val

385 390 395 400

Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr Ala Val Ala Arg Ala

405 410 415

Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly Val Ala Thr Asn Ile

420 425 430

Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp Phe Thr Ser Lys Arg

435 440 445

Ile Ala Thr Gly Phe Ile Ala Asp His Pro His Leu Leu Gln Ala Pro

450 455 460

Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp Tyr Leu Ala Asp Val

465 470 475 480

Thr Val Asn Lys Pro His Gly Val Arg Pro Lys Asp Val Ala Ala Pro

485 490 495

Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro Leu Pro Arg Gly Ser

500 505 510

Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala Phe Ala Arg Asp Leu

515 520 525

Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr Thr Phe Arg Asp Ala

530 535 540

His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser Phe Ala Leu Lys Pro

545 550 555 560

Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu Leu Leu Ser Val Glu

565 570 575

Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met Arg Phe Leu Phe Glu

580 585 590

Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu Ala Met Pro Asn Val

595 600 605

Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr Val Gly Tyr Thr Pro

610 615 620

Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys Glu Ala Ala Ser Ser

625 630 635 640

Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu Asn Asp Val Ser Gln

645 650 655

Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr Asn Thr Ala Val Ala

660 665 670

Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser Asp Pro Asn Glu Lys

675 680 685

Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala Glu Glu Ile Val Lys

690 695 700

Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met Ala Gly Leu Leu Arg

705 710 715 720

Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu Arg Arg Glu Phe Asp

725 730 735

Leu Pro Val His Val His Thr His Asp Thr Ala Gly Gly Gln Leu Ala

740 745 750

Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp Ala Val Asp Gly Ala

755 760 765

Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro Ser Leu Ser Ala Ile

770 775 780

Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr Gly Leu Ser Leu Glu

785 790 795 800

Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala Val Arg Gly Leu Tyr

805 810 815

Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr Gly Arg Val Tyr Arg

820 825 830

His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu Arg Ala Gln Ala Thr

835 840 845

Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile Glu Asp Asn Tyr Ala

850 855 860

Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys Val Thr Pro Ser Ser

865 870 875 880

Lys Val Val Gly Asp Leu Ala Leu His Leu Val Gly Ala Gly Val Asp

885 890 895

Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr Asp Ile Pro Asp Ser

900 905 910

Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn Pro Pro Gly Gly Trp

915 920 925

Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly Arg Ser Glu Gly Lys

930 935 940

Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln Ala His Leu Asp Ala

945 950 955 960

Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn Arg Leu Leu Phe Pro

965 970 975

Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg Arg Phe Gly Asn Thr

980 985 990

Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly Leu Val Glu Gly Arg

995 1000 1005

Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr Pro Leu Leu Val

1010 1015 1020

Arg Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly Met Arg Asn

1025 1030 1035

Val Val Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg Val Arg

1040 1045 1050

Asp Arg Ser Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala Asp

1055 1060 1065

Ser Ser Asn Lys Gly His Val Ala Ala Pro Phe Ala Gly Val Val

1070 1075 1080

Thr Val Thr Val Ala Glu Gly Asp Glu Val Lys Ala Gly Asp Ala

1085 1090 1095

Val Ala Ile Ile Glu Ala Met Lys Met Glu Ala Thr Ile Thr Ala

1100 1105 1110

Ser Val Asp Gly Lys Ile Asp Arg Val Val Val Pro Ala Ala Thr

1115 1120 1125

Lys Val Glu Gly Gly Asp Leu Ile Val Val Val Ser

1130 1135 1140

<210> 16

<211> 538

<212> PRT

<213> 产琥珀酸放线杆菌(Actinobacillus succinogenes)

<400> 16

Met Thr Asp Leu Asn Lys Leu Val Lys Glu Leu Asn Asp Leu Gly Leu

1 5 10 15

Thr Asp Val Lys Glu Ile Val Tyr Asn Pro Ser Tyr Glu Gln Leu Phe

20 25 30

Glu Glu Glu Thr Lys Pro Gly Leu Glu Gly Phe Asp Lys Gly Thr Leu

35 40 45

Thr Thr Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly Arg

50 55 60

Ser Pro Lys Asp Lys Tyr Ile Val Cys Asp Glu Thr Thr Lys Asp Thr

65 70 75 80

Val Trp Trp Asn Ser Glu Ala Ala Lys Asn Asp Asn Lys Pro Met Thr

85 90 95

Gln Glu Thr Trp Lys Ser Leu Arg Glu Leu Val Ala Lys Gln Leu Ser

100 105 110

Gly Lys Arg Leu Phe Val Val Glu Gly Tyr Cys Gly Ala Ser Glu Lys

115 120 125

His Arg Ile Gly Val Arg Met Val Thr Glu Val Ala Trp Gln Ala His

130 135 140

Phe Val Lys Asn Met Phe Ile Arg Pro Thr Asp Glu Glu Leu Lys Asn

145 150 155 160

Phe Lys Ala Asp Phe Thr Val Leu Asn Gly Ala Lys Cys Thr Asn Pro

165 170 175

Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn

180 185 190

Ile Thr Glu Gly Ile Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu

195 200 205

Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Lys

210 215 220

Gly Val Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp

225 230 235 240

Val Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser

245 250 255

Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp

260 265 270

Glu Ser Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile

275 280 285

Asn Leu Ser Gln Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Arg Arg

290 295 300

Asp Ala Leu Leu Glu Asn Val Val Val Arg Ala Asp Gly Ser Val Asp

305 310 315 320

Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile

325 330 335

Tyr His Ile Asp Asn Ile Val Arg Pro Val Ser Lys Ala Gly His Ala

340 345 350

Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu Pro Pro

355 360 365

Val Ser Lys Leu Thr Pro Glu Gln Thr Glu Tyr Tyr Phe Leu Ser Gly

370 375 380

Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Val Thr Glu Pro Thr

385 390 395 400

Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro

405 410 415

Ile Gln Tyr Ala Asp Val Leu Val Glu Arg Met Lys Ala Ser Gly Ala

420 425 430

Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile

435 440 445

Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser

450 455 460

Ile Glu Lys Ala Glu Met Gly Glu Leu Pro Ile Phe Asn Leu Ala Ile

465 470 475 480

Pro Lys Ala Leu Pro Gly Val Asp Pro Ala Ile Leu Asp Pro Arg Asp

485 490 495

Thr Tyr Ala Asp Lys Ala Gln Trp Gln Val Lys Ala Glu Asp Leu Ala

500 505 510

Asn Arg Phe Val Lys Asn Phe Val Lys Tyr Thr Ala Asn Pro Glu Ala

515 520 525

Ala Lys Leu Val Gly Ala Gly Pro Lys Ala

530 535

<210> 17

<211> 610

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 17

Met Thr Thr Ala Ala Ile Arg Gly Leu Gln Gly Glu Ala Pro Thr Lys

1 5 10 15

Asn Lys Glu Leu Leu Asn Trp Ile Ala Asp Ala Val Glu Leu Phe Gln

20 25 30

Pro Glu Ala Val Val Phe Val Asp Gly Ser Gln Ala Glu Trp Asp Arg

35 40 45

Met Ala Glu Asp Leu Val Glu Ala Gly Thr Leu Ile Lys Leu Asn Glu

50 55 60

Glu Lys Arg Pro Asn Ser Tyr Leu Ala Arg Ser Asn Pro Ser Asp Val

65 70 75 80

Ala Arg Val Glu Ser Arg Thr Phe Ile Cys Ser Glu Lys Glu Glu Asp

85 90 95

Ala Gly Pro Thr Asn Asn Trp Ala Pro Pro Gln Ala Met Lys Asp Glu

100 105 110

Met Ser Lys His Tyr Ala Gly Ser Met Lys Gly Arg Thr Met Tyr Val

115 120 125

Val Pro Phe Cys Met Gly Pro Ile Ser Asp Pro Asp Pro Lys Leu Gly

130 135 140

Val Gln Leu Thr Asp Ser Glu Tyr Val Val Met Ser Met Arg Ile Met

145 150 155 160

Thr Arg Met Gly Ile Glu Ala Leu Asp Lys Ile Gly Ala Asn Gly Ser

165 170 175

Phe Val Arg Cys Leu His Ser Val Gly Ala Pro Leu Glu Pro Gly Gln

180 185 190

Glu Asp Val Ala Trp Pro Cys Asn Asp Thr Lys Tyr Ile Thr Gln Phe

195 200 205

Pro Glu Thr Lys Glu Ile Trp Ser Tyr Gly Ser Gly Tyr Gly Gly Asn

210 215 220

Ala Ile Leu Ala Lys Lys Cys Tyr Ala Leu Arg Ile Ala Ser Val Met

225 230 235 240

Ala Arg Glu Glu Gly Trp Met Ala Glu His Met Leu Ile Leu Lys Leu

245 250 255

Ile Asn Pro Glu Gly Lys Ala Tyr His Ile Ala Ala Ala Phe Pro Ser

260 265 270

Ala Cys Gly Lys Thr Asn Leu Ala Met Ile Thr Pro Thr Ile Pro Gly

275 280 285

Trp Thr Ala Gln Val Val Gly Asp Asp Ile Ala Trp Leu Lys Leu Arg

290 295 300

Glu Asp Gly Leu Tyr Ala Val Asn Pro Glu Asn Gly Phe Phe Gly Val

305 310 315 320

Ala Pro Gly Thr Asn Tyr Ala Ser Asn Pro Ile Ala Met Lys Thr Met

325 330 335

Glu Pro Gly Asn Thr Leu Phe Thr Asn Val Ala Leu Thr Asp Asp Gly

340 345 350

Asp Ile Trp Trp Glu Gly Met Asp Gly Asp Ala Pro Ala His Leu Ile

355 360 365

Asp Trp Met Gly Asn Asp Trp Thr Pro Glu Ser Asp Glu Asn Ala Ala

370 375 380

His Pro Asn Ser Arg Tyr Cys Val Ala Ile Asp Gln Ser Pro Ala Ala

385 390 395 400

Ala Pro Glu Phe Asn Asp Trp Glu Gly Val Lys Ile Asp Ala Ile Leu

405 410 415

Phe Gly Gly Arg Arg Ala Asp Thr Val Pro Leu Val Thr Gln Thr Tyr

420 425 430

Asp Trp Glu His Gly Thr Met Val Gly Ala Leu Leu Ala Ser Gly Gln

435 440 445

Thr Ala Ala Ser Ala Glu Ala Lys Val Gly Thr Leu Arg His Asp Pro

450 455 460

Met Ala Met Leu Pro Phe Ile Gly Tyr Asn Ala Gly Glu Tyr Leu Gln

465 470 475 480

Asn Trp Ile Asp Met Gly Asn Lys Gly Gly Asp Lys Met Pro Ser Ile

485 490 495

Phe Leu Val Asn Trp Phe Arg Arg Gly Glu Asp Gly Arg Phe Leu Trp

500 505 510

Pro Gly Phe Gly Asp Asn Ser Arg Val Leu Lys Trp Val Ile Asp Arg

515 520 525

Ile Glu Gly His Val Gly Ala Asp Glu Thr Val Val Gly His Thr Ala

530 535 540

Lys Ala Glu Asp Leu Asp Leu Asp Gly Leu Asp Thr Pro Ile Glu Asp

545 550 555 560

Val Lys Glu Ala Leu Thr Ala Pro Ala Glu Gln Trp Ala Asn Asp Val

565 570 575

Glu Asp Asn Ala Glu Tyr Leu Thr Phe Leu Gly Pro Arg Val Pro Ala

580 585 590

Glu Val His Ser Gln Phe Asp Ala Leu Lys Ala Arg Ile Ser Ala Ala

595 600 605

His Ala

610

<210> 18

<211> 540

<212> PRT

<213> 大肠杆菌

<400> 18

Met Arg Val Asn Asn Gly Leu Thr Pro Gln Glu Leu Glu Ala Tyr Gly

1 5 10 15

Ile Ser Asp Val His Asp Ile Val Tyr Asn Pro Ser Tyr Asp Leu Leu

20 25 30

Tyr Gln Glu Glu Leu Asp Pro Ser Leu Thr Gly Tyr Glu Arg Gly Val

35 40 45

Leu Thr Asn Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly

50 55 60

Arg Ser Pro Lys Asp Lys Tyr Ile Val Arg Asp Asp Thr Thr Arg Asp

65 70 75 80

Thr Phe Trp Trp Ala Asp Lys Gly Lys Gly Lys Asn Asp Asn Lys Pro

85 90 95

Leu Ser Pro Glu Thr Trp Gln His Leu Lys Gly Leu Val Thr Arg Gln

100 105 110

Leu Ser Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn

115 120 125

Pro Asp Thr Arg Leu Ser Val Arg Phe Ile Thr Glu Val Ala Trp Gln

130 135 140

Ala His Phe Val Lys Asn Met Phe Ile Arg Pro Ser Asp Glu Glu Leu

145 150 155 160

Ala Gly Phe Lys Pro Asp Phe Ile Val Met Asn Gly Ala Lys Cys Thr

165 170 175

Asn Pro Gln Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala

180 185 190

Phe Asn Leu Thr Glu Arg Met Gln Leu Ile Gly Gly Thr Trp Tyr Gly

195 200 205

Gly Glu Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Leu Leu Pro

210 215 220

Leu Lys Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Glu Lys

225 230 235 240

Gly Asp Val Ala Val Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr

245 250 255

Leu Ser Thr Asp Pro Lys Arg Arg Leu Ile Gly Asp Asp Glu His Gly

260 265 270

Trp Asp Asp Asp Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys

275 280 285

Thr Ile Lys Leu Ser Lys Glu Ala Glu Pro Glu Ile Tyr Asn Ala Ile

290 295 300

Arg Arg Asp Ala Leu Leu Glu Asn Val Thr Val Arg Glu Asp Gly Thr

305 310 315 320

Ile Asp Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr

325 330 335

Pro Ile Tyr His Ile Asp Asn Ile Val Lys Pro Val Ser Lys Ala Gly

340 345 350

His Ala Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu

355 360 365

Pro Pro Val Ser Arg Leu Thr Ala Asp Gln Thr Gln Tyr His Phe Leu

370 375 380

Ser Gly Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu

385 390 395 400

Pro Thr Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu

405 410 415

His Pro Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Ala Ala

420 425 430

Gly Ala Gln Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys

435 440 445

Arg Ile Ser Ile Lys Asp Thr Arg Ala Ile Ile Asp Ala Ile Leu Asn

450 455 460

Gly Ser Leu Asp Asn Ala Glu Thr Phe Thr Leu Pro Met Phe Asn Leu

465 470 475 480

Ala Ile Pro Thr Glu Leu Pro Gly Val Asp Thr Lys Ile Leu Asp Pro

485 490 495

Arg Asn Thr Tyr Ala Ser Pro Glu Gln Trp Gln Glu Lys Ala Glu Thr

500 505 510

Leu Ala Lys Leu Phe Ile Asp Asn Phe Asp Lys Tyr Thr Asp Thr Pro

515 520 525

Ala Gly Ala Ala Leu Val Ala Ala Gly Pro Lys Leu

530 535 540

<210> 19

<211> 266

<212> PRT

<213> Cupriavidus taiwanensis

<400> 19

Met Leu His Val Ser Met Val Gly Cys Gly Ala Ile Gly Arg Gly Val

1 5 10 15

Leu Glu Leu Leu Lys Ser Asp Pro Asp Val Val Phe Asp Val Val Ile

20 25 30

Val Pro Glu His Thr Met Asp Glu Ala Arg Gly Ala Val Ser Ala Leu

35 40 45

Ala Pro Arg Ala Arg Val Ala Thr His Leu Asp Asp Gln Arg Pro Asp

50 55 60

Leu Leu Val Glu Cys Ala Gly His His Ala Leu Glu Glu His Ile Val

65 70 75 80

Pro Ala Leu Glu Arg Gly Ile Pro Cys Met Val Val Ser Val Gly Ala

85 90 95

Leu Ser Glu Pro Gly Met Ala Glu Arg Leu Glu Ala Ala Ala Arg Arg

100 105 110

Gly Gly Thr Gln Val Gln Leu Leu Ser Gly Ala Ile Gly Ala Ile Asp

115 120 125

Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Asp Glu Val Ile Tyr Thr

130 135 140

Gly Arg Lys Pro Ala Arg Ala Trp Thr Gly Thr Pro Ala Glu Gln Leu

145 150 155 160

Phe Asp Leu Glu Ala Leu Thr Glu Ala Thr Val Ile Phe Glu Gly Thr

165 170 175

Ala Arg Asp Ala Ala Arg Leu Tyr Pro Lys Asn Ala Asn Val Ala Ala

180 185 190

Thr Val Ser Leu Ala Gly Leu Gly Leu Asp Arg Thr Ala Val Lys Leu

195 200 205

Leu Ala Asp Pro His Ala Val Glu Asn Val His His Val Glu Ala Arg

210 215 220

Gly Ala Phe Gly Gly Phe Glu Leu Thr Met Arg Gly Lys Pro Leu Ala

225 230 235 240

Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Phe Ser Val Val Arg Ala

245 250 255

Leu Gly Asn Arg Ala His Ala Val Ser Ile

260 265

<210> 20

<211> 267

<212> PRT

<213> Polaromonas sp.

<400> 20

Met Leu Lys Ile Ala Met Ile Gly Cys Gly Ala Ile Gly Ala Ser Val

1 5 10 15

Leu Glu Leu Leu His Gly Asp Ser Asp Val Val Val Asp Arg Val Ile

20 25 30

Thr Val Pro Glu Ala Arg Asp Arg Thr Glu Ile Ala Val Ala Arg Trp

35 40 45

Ala Pro Arg Ala Arg Val Leu Glu Val Leu Ala Ala Asp Asp Ala Pro

50 55 60

Asp Leu Val Val Glu Cys Ala Gly His Gly Ala Ile Ala Ala His Val

65 70 75 80

Val Pro Ala Leu Glu Arg Gly Ile Pro Cys Val Val Thr Ser Val Gly

85 90 95

Ala Leu Ser Ala Pro Gly Met Ala Gln Leu Leu Glu Gln Ala Ala Arg

100 105 110

Arg Gly Lys Thr Gln Val Gln Leu Leu Ser Gly Ala Ile Gly Gly Ile

115 120 125

Asp Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Asp Ser Val Val Tyr

130 135 140

Thr Gly Arg Lys Pro Pro Met Ala Trp Lys Gly Thr Pro Ala Glu Ala

145 150 155 160

Val Cys Asp Leu Asp Ser Leu Thr Val Ala His Cys Ile Phe Asp Gly

165 170 175

Ser Ala Glu Gln Ala Ala Gln Leu Tyr Pro Lys Asn Ala Asn Val Ala

180 185 190

Ala Thr Leu Ser Leu Ala Gly Leu Gly Leu Lys Arg Thr Gln Val Gln

195 200 205

Leu Phe Ala Asp Pro Gly Val Ser Glu Asn Val His His Val Ala Ala

210 215 220

His Gly Ala Phe Gly Ser Phe Glu Leu Thr Met Arg Gly Arg Pro Leu

225 230 235 240

Ala Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg

245 250 255

Ala Leu Leu Asn Arg Gly Arg Ala Leu Val Ile

260 265

<210> 21

<211> 255

<212> PRT

<213> 肺炎克雷伯菌(Klebsiella pneumoniae)

<400> 21

Met Met Lys Lys Val Met Leu Ile Gly Tyr Gly Ala Met Ala Gln Ala

1 5 10 15

Val Ile Glu Arg Leu Pro Pro Gln Val Arg Val Glu Trp Ile Val Ala

20 25 30

Arg Glu Ser His His Ala Ala Ile Cys Leu Gln Phe Gly Gln Ala Val

35 40 45

Thr Pro Leu Thr Asp Pro Leu Gln Cys Gly Gly Thr Pro Asp Leu Val

50 55 60

Leu Glu Cys Ala Ser Gln Gln Ala Val Ala Gln Tyr Gly Glu Ala Val

65 70 75 80

Leu Ala Arg Gly Trp His Leu Ala Val Ile Ser Thr Gly Ala Leu Ala

85 90 95

Asp Ser Glu Leu Glu Gln Arg Leu Arg Gln Ala Gly Gly Lys Leu Thr

100 105 110

Leu Leu Ala Gly Ala Val Ala Gly Ile Asp Gly Leu Ala Ala Ala Lys

115 120 125

Glu Gly Gly Leu Glu Arg Val Thr Tyr Gln Ser Arg Lys Ser Pro Ala

130 135 140

Ser Trp Arg Gly Ser Tyr Ala Glu Gln Leu Ile Asp Leu Ser Ala Val

145 150 155 160

Asn Glu Ala Gln Ile Phe Phe Glu Gly Ser Ala Arg Glu Ala Ala Arg

165 170 175

Leu Phe Pro Ala Asn Ala Asn Val Ala Ala Thr Ile Ala Leu Gly Gly

180 185 190

Ile Gly Leu Asp Ala Thr Arg Val Gln Leu Met Val Asp Pro Ala Thr

195 200 205

Gln Arg Asn Thr His Thr Leu His Ala Glu Gly Leu Phe Gly Glu Phe

210 215 220

His Leu Glu Leu Ser Gly Leu Pro Leu Ala Ser Asn Pro Lys Thr Ser

225 230 235 240

Thr Leu Ala Ala Leu Ser Ala Val Arg Ala Cys Arg Glu Leu Ala

245 250 255

<210> 22

<211> 265

<212> PRT

<213> Delftia acidovarans

<400> 22

Met Asn Ile Ala Val Ile Gly Cys Gly Ala Ile Gly Ala Ser Val Leu

1 5 10 15

Glu Leu Leu Lys Gly His Ala Ala Val Gln Val Gly Trp Val Leu Val

20 25 30

Pro Glu Val Thr Asp Ala Val Arg Ala Thr Leu Ala Leu His Ala Pro

35 40 45

Lys Ala Arg Ala Val Pro Ala Leu Ala Ala Glu Asp Arg Pro Asp Leu

50 55 60

Ile Val Glu Cys Ala Gly His Ala Ala Ile Glu Glu His Val Leu Pro

65 70 75 80

Ala Leu Arg Arg Gly Ile Pro Ala Val Val Ala Ser Ile Gly Ala Leu

85 90 95

Ser Ala Pro Gly Met Ala Glu Ala Val Gln Ala Ala Ala Glu Ala Gly

100 105 110

Gly Thr Gln Val Gln Leu Leu Ser Gly Ala Ile Gly Gly Val Asp Ala

115 120 125

Leu Ala Ala Ala Arg Ile Gly Gly Leu Asp Glu Val Val Tyr Thr Gly

130 135 140

Arg Lys Pro Pro Met Ala Trp Thr Gly Thr Pro Ala Glu Gln Arg Cys

145 150 155 160

Asp Leu Ala Ser Leu Lys Glu Ala Phe Cys Ile Phe Glu Gly Ser Ala

165 170 175

Arg Glu Ala Ala Gln Leu Tyr Pro Lys Asn Ala Asn Val Ala Ala Thr

180 185 190

Leu Ser Leu Ala Gly Met Gly Leu Asp Arg Thr Thr Val Arg Leu Tyr

195 200 205

Ala Asp Pro Gly Val Asp Glu Asn Val His His Val Ala Ala Arg Gly

210 215 220

Ala Phe Gly Ser Met Glu Leu Thr Met Arg Gly Lys Pro Leu Ala Ala

225 230 235 240

Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg Ala Val

245 250 255

Leu Asn Gln Ala Thr Ala Ile Ala Ile

260 265

<210> 23

<211> 267

<212> PRT

<213> Variovorax sp.

<400> 23

Met Thr Val Arg Ile Ala Leu Ile Gly Cys Gly Ala Ile Gly Thr Ala

1 5 10 15

Ala Leu Glu Leu Leu Arg Glu Asp Ala Gly Leu Ser Val Ala Ala Ile

20 25 30

Val Val Pro Ala Glu Ala Phe Ala Ala Thr Lys Asp Val Ala Ala Arg

35 40 45

Leu Ala Pro Gly Ala Gln Val Val Ser Ala Val Pro Ala Asp Gly Ile

50 55 60

Asp Leu Val Val Glu Ala Ala Gly His Ala Ala Ile Glu Ala His Val

65 70 75 80

Leu Pro Ala Leu Gln Arg Gly Thr Pro Cys Val Val Ala Ser Val Gly

85 90 95

Ala Leu Ser Ala Gln Gly Phe Ala Glu Lys Leu Glu Ala Ala Ala Val

100 105 110

Ala Gly Lys Thr Gln Val Gln Leu Ile Ala Gly Ala Ile Gly Ala Ile

115 120 125

Asp Ala Leu Ala Ala Ala Arg Ile Gly Gly Leu Asp Ser Val Arg Tyr

130 135 140

Thr Gly Arg Lys Pro Pro His Ala Trp Lys Gly Thr Pro Ala Glu Gln

145 150 155 160

Gly Arg Asp Leu Gly Ala Leu Thr Gly Ala Thr Val Ile Phe Glu Gly

165 170 175

Ser Ala Arg Glu Ala Ala Thr Leu Tyr Pro Lys Asn Ala Asn Val Ala

180 185 190

Ala Thr Val Ser Leu Ala Gly Leu Gly Leu Asp Arg Thr Ser Val Arg

195 200 205

Leu Ile Ala Asp Pro Thr Val Ala Glu Asn Val His Thr Val Glu Ala

210 215 220

Glu Gly Ala Phe Gly Asn Phe Glu Leu Thr Met Arg Asn Lys Pro Leu

225 230 235 240

Ala Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Ala Val Arg

245 250 255

Ala Leu Arg Asn Arg Val Ala Pro Leu Thr Ile

260 265

<210> 24

<211> 266

<212> PRT

<213> Comamonas testosteroni

<400> 24

Met Lys Asn Ile Ala Leu Ile Gly Cys Gly Ala Ile Gly Ser Ser Val

1 5 10 15

Leu Glu Leu Leu Ser Gly Asp Thr Gln Leu Gln Val Gly Trp Val Leu

20 25 30

Val Pro Glu Ile Thr Pro Ala Val Arg Glu Thr Ala Ala Arg Leu Ala

35 40 45

Pro Gln Ala Gln Leu Leu Gln Ala Leu Pro Gly Asp Ala Val Pro Asp

50 55 60

Leu Leu Val Glu Cys Ala Gly His Ala Ala Ile Glu Glu His Val Leu

65 70 75 80

Pro Ala Leu Ala Arg Gly Ile Pro Ala Val Ile Ala Ser Ile Gly Ala

85 90 95

Leu Ser Ala Pro Gly Met Ala Glu Arg Val Gln Ala Ala Ala Glu Thr

100 105 110

Gly Lys Thr Gln Ala Gln Leu Leu Ser Gly Ala Ile Gly Gly Ile Asp

115 120 125

Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Glu Thr Val Leu Tyr Thr

130 135 140

Gly Arg Lys Pro Pro Lys Ala Trp Ser Gly Thr Pro Ala Glu Gln Val

145 150 155 160

Cys Asp Leu Asp Gly Leu Thr Glu Ala Phe Cys Ile Phe Glu Gly Ser

165 170 175

Ala Arg Glu Ala Ala Gln Leu Tyr Pro Lys Asn Ala Asn Val Ala Ala

180 185 190

Thr Leu Ser Leu Ala Gly Leu Gly Leu Asp Lys Thr Met Val Arg Leu

195 200 205

Phe Ala Asp Pro Gly Val Gln Glu Asn Val His Gln Val Glu Ala Arg

210 215 220

Gly Ala Phe Gly Ala Met Glu Leu Thr Met Arg Gly Lys Pro Leu Ala

225 230 235 240

Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg Ala

245 250 255

Val Leu Asn Asn Val Ala Pro Leu Ala Ile

260 265

<210> 25

<211> 266

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 25

Met Lys Asn Ile Ala Leu Ile Gly Cys Gly Ala Ile Gly Ser Ser Val

1 5 10 15

Leu Glu Leu Leu Ser Gly Asp Thr Gln Leu Gln Val Gly Trp Val Leu

20 25 30

Val Pro Glu Ile Thr Pro Ala Val Arg Glu Thr Ala Ala Arg Leu Ala

35 40 45

Pro Gln Ala Gln Leu Leu Gln Ala Leu Pro Gly Asp Ala Val Pro Asp

50 55 60

Leu Leu Val Glu Cys Ala Gly His Ala Ala Ile Glu Glu His Val Leu

65 70 75 80

Pro Ala Leu Ala Arg Gly Ile Pro Ala Val Ile Ala Ser Ile Gly Ala

85 90 95

Leu Ser Ala Pro Gly Met Ala Glu Arg Val Gln Ala Ala Ala Glu Thr

100 105 110

Gly Lys Thr Gln Ala Gln Leu Leu Ser Gly Ala Ile Gly Gly Ile Asp

115 120 125

Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Glu Thr Val Leu Tyr Thr

130 135 140

Gly Arg Lys Pro Pro Lys Ala Trp Ser Gly Thr Pro Ala Glu Gln Val

145 150 155 160

Cys Asp Leu Asp Gly Leu Thr Glu Ala Phe Cys Ile Phe Glu Gly Ser

165 170 175

Ala Arg Glu Ala Ala Gln Leu Tyr Pro Lys Asn Ala Asn Val Ala Ala

180 185 190

Thr Leu Ser Leu Ala Gly Leu Gly Leu Asp Lys Thr Met Val Arg Leu

195 200 205

Phe Ala Asp Pro Gly Val Gln Glu Asn Val His Gln Val Glu Ala Arg

210 215 220

Gly Ala Phe Gly Ala Met Glu Leu Thr Met Arg Gly Lys Pro Leu Ala

225 230 235 240

Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg Ala

245 250 255

Val Leu Asn Asn Val Ala Pro Leu Ala Ile

260 265

<210> 26

<211> 419

<212> PRT

<213> 白喉棒状杆菌(Corynebacterium diphtheriae)

<400> 26

Met Ser Leu Lys Asp Tyr Asp Ala Ala Arg Leu Ala Gln Val Arg Glu

1 5 10 15

Glu Val Thr Ala Lys Tyr Ala Glu Leu Lys Ala Lys Asn Leu Ser Leu

20 25 30

Asp Leu Thr Arg Gly Lys Pro Ser Ala Glu Gln Leu Asp Leu Ser Asn

35 40 45

Asp Leu Leu Ser Leu Pro Gly Gly Asp Phe Arg Thr Lys Asp Gly Val

50 55 60

Asp Cys Arg Asn Tyr Gly Gly Leu Leu Gly Ile Ala Asp Ile Arg Glu

65 70 75 80

Leu Trp Ala Glu Ala Leu Gly Leu Pro Ala Asp Leu Val Val Ala Gln

85 90 95

Asp Gly Ser Ser Leu Asn Ile Met Phe Asp Leu Ile Ser Trp Ser Tyr

100 105 110

Thr Trp Gly Asn Asn Asp Ser Ser Arg Pro Trp Ser Ala Glu Glu Lys

115 120 125

Val Lys Trp Leu Cys Pro Val Pro Gly Tyr Asp Arg His Phe Thr Ile

130 135 140

Thr Glu His Phe Gly Phe Glu Met Ile Asn Val Pro Met Thr Asp Glu

145 150 155 160

Gly Pro Asp Met Gly Val Val Arg Glu Leu Val Lys Asp Pro Gln Val

165 170 175

Lys Gly Met Trp Thr Val Pro Val Phe Gly Asn Pro Thr Gly Val Thr

180 185 190

Phe Ser Glu Gln Thr Cys Arg Glu Leu Ala Glu Met Ser Thr Ala Ala

195 200 205

Pro Asp Phe Arg Ile Val Trp Asp Asn Ala Tyr Ala Leu His Thr Leu

210 215 220

Ser Asp Glu Phe Pro Ile Val His Asn Val Ile Glu Phe Ala Gln Ala

225 230 235 240

Ala Gly Asn Pro Asn Arg Phe Trp Phe Met Ser Ser Thr Ser Lys Ile

245 250 255

Thr His Ala Gly Ser Gly Val Ser Phe Phe Ala Ser Ser Lys Glu Asn

260 265 270

Ile Glu Trp Tyr Ala Ser His Ala Asn Val Arg Gly Ile Gly Pro Asn

275 280 285

Lys Leu Asn Gln Leu Ala His Ala Gln Phe Phe Gly Asp Val Ala Gly

290 295 300

Leu Lys Ala His Met Leu Lys His Ala Ala Ser Leu Ala Pro Lys Phe

305 310 315 320

Glu Arg Val Leu Glu Ile Leu Asp Ser Arg Leu Ser Glu Tyr Gly Val

325 330 335

Ala Lys Trp Thr Ser Pro Thr Gly Gly Tyr Phe Ile Ser Val Asp Val

340 345 350

Val Pro Gly Thr Ala Ser Arg Val Val Glu Leu Ala Lys Glu Ala Gly

355 360 365

Ile Ala Leu Thr Gly Ala Gly Ser Ser Phe Pro Leu His Asn Asp Pro

370 375 380

Asn Asn Glu Asn Ile Arg Leu Ala Pro Ser Leu Pro Pro Val Ala Glu

385 390 395 400

Leu Glu Val Ala Met Asp Gly Phe Ala Thr Cys Val Leu Met Ala Ala

405 410 415

Leu Glu Val

<210> 27

<211> 422

<212> PRT

<213> Deinococcus geothermalis

<400> 27

Met Thr Lys Glu Ala Ser Arg Pro Ala Leu Asp Leu Ala Arg Gln Ala

1 5 10 15

Tyr Glu Ala Phe Lys Ala Arg Gly Leu Asn Leu Asn Met Gln Arg Gly

20 25 30

Gln Pro Ala Asp Ala Asp Phe Asp Leu Ser Asn Gly Leu Leu Thr Val

35 40 45

Leu Gly Ala Glu Asp Val Arg Met Asp Gly Leu Asp Leu Arg Asn Tyr

50 55 60

Pro Gly Gly Val Ala Gly Leu Pro Ser Ala Arg Ala Leu Phe Ala Gly

65 70 75 80

Tyr Leu Asp Val Lys Ala Glu Asn Val Leu Val Trp Asn Asn Ser Ser

85 90 95

Leu Glu Leu Gln Gly Leu Val Leu Thr Phe Ala Leu Leu His Gly Val

100 105 110

Arg Gly Ser Thr Gly Pro Trp Leu Ser Gln Thr Pro Lys Met Ile Val

115 120 125

Thr Val Pro Gly Tyr Asp Arg His Phe Leu Leu Leu Gln Thr Leu Gly

130 135 140

Phe Glu Leu Leu Thr Val Asp Met Gln Ser Asp Gly Pro Asp Val Asp

145 150 155 160

Ala Val Glu Arg Leu Ala Gly Thr Asp Pro Ser Val Lys Gly Ile Leu

165 170 175

Phe Val Pro Thr Tyr Ser Asn Pro Gly Gly Glu Thr Ile Ser Leu Glu

180 185 190

Lys Ala Arg Arg Leu Ala Gly Leu Gln Ala Ala Ala Pro Asp Phe Thr

195 200 205

Ile Phe Ala Asp Asp Ala Tyr Arg Val His His Leu Val Glu Glu Asp

210 215 220

Arg Ala Glu Pro Val Asn Phe Val Val Leu Ala Arg Asp Ala Gly Tyr

225 230 235 240

Pro Asp Arg Ala Phe Val Phe Ala Ser Thr Ser Lys Ile Thr Phe Ala

245 250 255

Gly Ala Gly Leu Gly Phe Val Ala Ser Ser Glu Asp Asn Ile Arg Trp

260 265 270

Leu Ser Lys Tyr Leu Gly Ala Gln Ser Ile Gly Pro Asn Lys Val Glu

275 280 285

Gln Ala Arg His Val Lys Phe Leu Thr Glu Tyr Pro Gly Gly Leu Glu

290 295 300

Gly Leu Met Arg Asp His Ala Ala Ile Ile Ala Pro Lys Phe Arg Ala

305 310 315 320

Val Asp Glu Val Leu Arg Ala Glu Leu Gly Glu Gly Gly Glu Tyr Ala

325 330 335

Thr Trp Thr Leu Pro Lys Gly Gly Tyr Phe Ile Ser Leu Asp Thr Ala

340 345 350

Glu Pro Val Ala Asp Arg Val Val Lys Leu Ala Glu Ala Ala Gly Val

355 360 365

Ser Leu Thr Pro Ala Gly Ala Thr Tyr Pro Ala Gly Gln Asp Pro His

370 375 380

Asn Arg Asn Leu Arg Leu Ala Pro Thr Arg Pro Pro Val Glu Glu Val

385 390 395 400

Arg Thr Ala Met Gln Val Val Ala Ala Cys Ile Arg Leu Ala Thr Glu

405 410 415

Glu Tyr Arg Ala Gly His

420

<210> 28

<211> 435

<212> PRT

<213> 结核分枝杆菌(Mycobacterium tuberculosis)

<400> 28

Met Ser Phe Asp Ser Leu Ser Pro Gln Glu Leu Ala Ala Leu His Ala

1 5 10 15

Arg His Gln Gln Asp Tyr Ala Ala Leu Gln Gly Met Lys Leu Ala Leu

20 25 30

Asp Leu Thr Arg Gly Lys Pro Ser Ala Glu Gln Leu Asp Leu Ser Asn

35 40 45

Gln Leu Leu Ser Leu Pro Gly Asp Asp Tyr Arg Asp Pro Glu Gly Thr

50 55 60

Asp Thr Arg Asn Tyr Gly Gly Gln His Gly Leu Pro Gly Leu Arg Ala

65 70 75 80

Ile Phe Ala Glu Leu Leu Gly Ile Ala Val Pro Asn Leu Ile Ala Gly

85 90 95

Asn Asn Ser Ser Leu Glu Leu Met His Asp Ile Val Ala Phe Ser Met

100 105 110

Leu Tyr Gly Gly Val Asp Ser Pro Arg Pro Trp Ile Gln Glu Gln Asp

115 120 125

Gly Ile Lys Phe Leu Cys Pro Val Pro Gly Tyr Asp Arg His Phe Ala

130 135 140

Ile Thr Glu Thr Met Gly Ile Glu Met Ile Pro Ile Pro Met Leu Gln

145 150 155 160

Asp Gly Pro Asp Val Asp Leu Ile Glu Glu Leu Val Ala Val Asp Pro

165 170 175

Ala Ile Lys Gly Met Trp Thr Val Pro Val Phe Gly Asn Pro Ser Gly

180 185 190

Val Thr Tyr Ser Trp Glu Thr Val Arg Arg Leu Val Gln Met Arg Thr

195 200 205

Ala Ala Pro Asp Phe Arg Leu Phe Trp Asp Asn Ala Tyr Ala Val His

210 215 220

Thr Leu Thr Leu Asp Phe Pro Arg Gln Val Asp Val Leu Gly Leu Ala

225 230 235 240

Ala Lys Ala Gly Asn Pro Asn Arg Pro Tyr Val Phe Ala Ser Thr Ser

245 250 255

Lys Ile Thr Phe Ala Gly Gly Gly Val Ser Phe Phe Gly Gly Ser Leu

260 265 270

Gly Asn Ile Ala Trp Tyr Leu Gln Tyr Ala Gly Lys Lys Ser Ile Gly

275 280 285

Pro Asp Lys Val Asn Gln Leu Arg His Leu Arg Phe Phe Gly Asp Ala

290 295 300

Asp Gly Val Arg Leu His Met Leu Arg His Gln Gln Ile Leu Ala Pro

305 310 315 320

Lys Phe Ala Leu Val Ala Glu Val Leu Asp Gln Arg Leu Ser Glu Ser

325 330 335

Lys Ile Ala Ser Trp Thr Glu Pro Lys Gly Gly Tyr Phe Ile Ser Leu

340 345 350

Asp Val Leu Pro Gly Thr Ala Arg Arg Thr Val Ala Leu Ala Lys Asp

355 360 365

Val Gly Ile Ala Val Thr Glu Ala Gly Ala Ser Phe Pro Tyr Arg Lys

370 375 380

Asp Pro Asp Asp Lys Asn Ile Arg Ile Ala Pro Ser Phe Pro Ser Val

385 390 395 400

Pro Asp Leu Arg Asn Ala Val Asp Gly Leu Ala Thr Cys Ala Leu Leu

405 410 415

Ala Ala Thr Glu Thr Leu Leu Asn Gln Gly Leu Ala Ser Ser Ala Pro

420 425 430

Asn Val Arg

435

<210> 29

<211> 136

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 29

Met Leu Arg Thr Ile Leu Gly Ser Lys Ile His Arg Ala Thr Val Thr

1 5 10 15

Gln Ala Asp Leu Asp Tyr Val Gly Ser Val Thr Ile Asp Ala Asp Leu

20 25 30

Val His Ala Ala Gly Leu Ile Glu Gly Glu Lys Val Ala Ile Val Asp

35 40 45

Ile Thr Asn Gly Ala Arg Leu Glu Thr Tyr Val Ile Val Gly Asp Ala

50 55 60

Gly Thr Gly Asn Ile Cys Ile Asn Gly Ala Ala Ala His Leu Ile Asn

65 70 75 80

Pro Gly Asp Leu Val Ile Ile Met Ser Tyr Leu Gln Ala Thr Asp Ala

85 90 95

Glu Ala Lys Ala Tyr Glu Pro Lys Ile Val His Val Asp Ala Asp Asn

100 105 110

Arg Ile Val Ala Leu Gly Asn Asp Leu Ala Glu Ala Leu Pro Gly Ser

115 120 125

Gly Leu Leu Thr Ser Arg Ser Ile

130 135

<210> 30

<211> 1511

<212> PRT

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 30

Met Ser Ser Thr Asp Glu His Ile Glu Lys Asp Ile Ser Ser Arg Ser

1 5 10 15

Asn His Asp Asp Asp Tyr Ala Asn Ser Val Gln Ser Tyr Ala Ala Ser

20 25 30

Glu Gly Gln Val Asp Asn Glu Asp Leu Ala Ala Thr Ser Gln Leu Ser

35 40 45

Arg His Leu Ser Asn Ile Leu Ser Asn Glu Glu Gly Ile Glu Arg Leu

50 55 60

Glu Ser Met Ala Arg Val Ile Ser His Lys Thr Lys Lys Glu Met Asp

65 70 75 80

Ser Phe Glu Ile Asn Asp Leu Asp Phe Asp Leu Arg Ser Leu Leu His

85 90 95

Tyr Leu Arg Ser Arg Gln Leu Glu Gln Gly Ile Glu Pro Gly Asp Ser

100 105 110

Gly Ile Ala Phe Lys Asn Leu Thr Ala Val Gly Val Asp Ala Ser Ala

115 120 125

Ala Tyr Gly Pro Ser Val Glu Glu Met Phe Arg Asn Ile Ala Ser Ile

130 135 140

Pro Ala His Leu Ile Ser Lys Phe Thr Lys Lys Ser Asp Val Pro Leu

145 150 155 160

Arg Asn Ile Ile Gln Asn Cys Thr Gly Val Val Glu Ser Gly Glu Met

165 170 175

Leu Phe Val Val Gly Arg Pro Gly Ala Gly Cys Ser Thr Phe Leu Lys

180 185 190

Cys Leu Ser Gly Glu Thr Ser Glu Leu Val Asp Val Gln Gly Glu Phe

195 200 205

Ser Tyr Asp Gly Leu Asp Gln Ser Glu Met Met Ser Lys Tyr Lys Gly

210 215 220

Tyr Val Ile Tyr Cys Pro Glu Leu Asp Phe His Phe Pro Lys Ile Thr

225 230 235 240

Val Lys Glu Thr Ile Asp Phe Ala Leu Lys Cys Lys Thr Pro Arg Val

245 250 255

Arg Ile Asp Lys Met Thr Arg Lys Gln Tyr Val Asp Asn Ile Arg Asp

260 265 270

Met Trp Cys Thr Val Phe Gly Leu Arg His Thr Tyr Ala Thr Lys Val

275 280 285

Gly Asn Asp Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val

290 295 300

Ser Leu Val Glu Ala Gln Ala Met Asn Ala Ser Ile Tyr Ser Trp Asp

305 310 315 320

Asn Ala Thr Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Phe Ala Gln

325 330 335

Ala Ile Arg Thr Ala Thr Asn Met Val Asn Asn Ser Ala Ile Val Ala

340 345 350

Ile Tyr Gln Ala Gly Glu Asn Ile Tyr Glu Leu Phe Asp Lys Thr Thr

355 360 365

Val Leu Tyr Asn Gly Arg Gln Ile Tyr Phe Gly Pro Ala Asp Lys Ala

370 375 380

Val Gly Tyr Phe Gln Arg Met Gly Trp Val Lys Pro Asn Arg Met Thr

385 390 395 400

Ser Ala Glu Phe Leu Thr Ser Val Thr Val Asp Phe Glu Asn Arg Thr

405 410 415

Leu Asp Ile Lys Pro Gly Tyr Glu Asp Lys Val Pro Lys Ser Ser Ser

420 425 430

Glu Phe Glu Glu Tyr Trp Leu Asn Ser Glu Asp Tyr Gln Glu Leu Leu

435 440 445

Arg Thr Tyr Asp Asp Tyr Gln Ser Arg His Pro Val Asn Glu Thr Arg

450 455 460

Asp Arg Leu Asp Val Ala Lys Lys Gln Arg Leu Gln Gln Gly Gln Arg

465 470 475 480

Glu Asn Ser Gln Tyr Val Val Asn Tyr Trp Thr Gln Val Tyr Tyr Cys

485 490 495

Met Ile Arg Gly Phe Gln Arg Val Lys Gly Asp Ser Thr Tyr Thr Lys

500 505 510

Val Tyr Leu Ser Ser Phe Leu Ile Lys Ala Leu Ile Ile Gly Ser Met

515 520 525

Phe His Lys Ile Asp Asp Lys Ser Gln Ser Thr Thr Ala Gly Ala Tyr

530 535 540

Ser Arg Gly Gly Met Leu Phe Tyr Val Leu Leu Phe Ala Ser Val Thr

545 550 555 560

Ser Leu Ala Glu Ile Gly Asn Ser Phe Ser Ser Arg Pro Val Ile Val

565 570 575

Lys His Lys Ser Tyr Ser Met Tyr His Leu Ser Ala Glu Ser Leu Gln

580 585 590

Glu Ile Ile Thr Glu Phe Pro Thr Lys Phe Val Ala Ile Val Ile Leu

595 600 605

Cys Leu Ile Thr Tyr Trp Ile Pro Phe Met Lys Tyr Glu Ala Gly Ala

610 615 620

Phe Phe Gln Tyr Ile Leu Tyr Leu Leu Thr Val Gln Gln Cys Thr Ser

625 630 635 640

Phe Ile Phe Lys Phe Val Ala Thr Met Ser Lys Ser Gly Val Asp Ala

645 650 655

His Ala Val Gly Gly Leu Trp Val Leu Met Leu Cys Val Tyr Ala Gly

660 665 670

Phe Val Leu Pro Ile Gly Glu Met His His Trp Ile Arg Trp Leu His

675 680 685

Phe Ile Asn Pro Leu Thr Tyr Ala Phe Glu Ser Leu Val Ser Thr Glu

690 695 700

Phe His His Arg Glu Met Leu Cys Ser Ala Leu Val Pro Ser Gly Pro

705 710 715 720

Gly Tyr Glu Gly Ile Ser Ile Ala Asn Gln Val Cys Asp Ala Ala Gly

725 730 735

Ala Val Lys Gly Asn Leu Tyr Val Ser Gly Asp Ser Tyr Ile Leu His

740 745 750

Gln Tyr His Phe Ala Tyr Lys His Ala Trp Arg Asn Trp Gly Val Asn

755 760 765

Ile Val Trp Thr Phe Gly Tyr Ile Val Phe Asn Val Ile Leu Ser Glu

770 775 780

Tyr Leu Lys Pro Val Glu Gly Gly Gly Asp Leu Leu Leu Tyr Lys Arg

785 790 795 800

Gly His Met Pro Glu Leu Gly Thr Glu Asn Ala Asp Ala Arg Thr Ala

805 810 815

Ser Arg Glu Glu Met Met Glu Ala Leu Asn Gly Pro Asn Val Asp Leu

820 825 830

Glu Lys Val Ile Ala Glu Lys Asp Val Phe Thr Trp Asn His Leu Asp

835 840 845

Tyr Thr Ile Pro Tyr Asp Gly Ala Thr Arg Lys Leu Leu Ser Asp Val

850 855 860

Phe Gly Tyr Val Lys Pro Gly Lys Met Thr Ala Leu Met Gly Glu Ser

865 870 875 880

Gly Ala Gly Lys Thr Thr Leu Leu Asn Val Leu Ala Gln Arg Ile Asn

885 890 895

Met Gly Val Ile Thr Gly Asp Met Leu Val Asn Ala Lys Pro Leu Pro

900 905 910

Ala Ser Phe Asn Arg Ser Cys Gly Tyr Val Ala Gln Ala Asp Asn His

915 920 925

Met Ala Glu Leu Ser Val Arg Glu Ser Leu Arg Phe Ala Ala Glu Leu

930 935 940

Arg Gln Gln Ser Ser Val Pro Leu Glu Glu Lys Tyr Glu Tyr Val Glu

945 950 955 960

Lys Ile Ile Thr Leu Leu Gly Met Gln Asn Tyr Ala Glu Ala Leu Val

965 970 975

Gly Lys Thr Gly Arg Gly Leu Asn Val Glu Gln Arg Lys Lys Leu Ser

980 985 990

Ile Gly Val Glu Leu Val Ala Lys Pro Ser Leu Leu Leu Phe Leu Asp

995 1000 1005

Glu Pro Thr Ser Gly Leu Asp Ser Gln Ser Ala Trp Ser Ile Val

1010 1015 1020

Gln Phe Met Arg Ala Leu Ala Asp Ser Gly Gln Ser Ile Leu Cys

1025 1030 1035

Thr Ile His Gln Pro Ser Ala Thr Leu Phe Glu Gln Phe Asp Arg

1040 1045 1050

Leu Leu Leu Leu Lys Lys Gly Gly Lys Met Val Tyr Phe Gly Asp

1055 1060 1065

Ile Gly Pro Asn Ser Glu Thr Leu Leu Lys Tyr Phe Glu Arg Gln

1070 1075 1080

Ser Gly Met Lys Cys Gly Val Ser Glu Asn Pro Ala Glu Tyr Ile

1085 1090 1095

Leu Asn Cys Ile Gly Ala Gly Ala Thr Ala Ser Val Asn Ser Asp

1100 1105 1110

Trp His Asp Leu Trp Leu Ala Ser Pro Glu Cys Ala Ala Ala Arg

1115 1120 1125

Ala Glu Val Glu Glu Leu His Arg Thr Leu Pro Gly Arg Ala Val

1130 1135 1140

Asn Asp Asp Pro Glu Leu Ala Thr Arg Phe Ala Ala Ser Tyr Met

1145 1150 1155

Thr Gln Ile Lys Cys Val Leu Arg Arg Thr Ala Leu Gln Phe Trp

1160 1165 1170

Arg Ser Pro Val Tyr Ile Arg Ala Lys Phe Phe Glu Cys Val Ala

1175 1180 1185

Cys Ala Leu Phe Val Gly Leu Ser Tyr Val Gly Val Asn His Ser

1190 1195 1200

Val Gly Gly Ala Ile Glu Ala Phe Ser Ser Ile Phe Met Leu Leu

1205 1210 1215

Leu Ile Ala Leu Ala Met Ile Asn Gln Leu His Val Phe Ala Tyr

1220 1225 1230

Asp Ser Arg Glu Leu Tyr Glu Val Arg Glu Ala Ala Ser Asn Thr

1235 1240 1245

Phe His Trp Ser Val Leu Leu Leu Cys His Ala Ala Val Glu Asn

1250 1255 1260

Phe Trp Ser Thr Leu Cys Gln Phe Met Cys Phe Ile Cys Tyr Tyr

1265 1270 1275

Trp Pro Ala Gln Phe Ser Gly Arg Ala Ser His Ala Gly Phe Phe

1280 1285 1290

Phe Phe Phe Tyr Val Leu Ile Phe Pro Leu Tyr Phe Val Thr Tyr

1295 1300 1305

Gly Leu Trp Ile Leu Tyr Met Ser Pro Asp Val Pro Ser Ala Ser

1310 1315 1320

Met Ile Asn Ser Asn Leu Phe Ala Ala Met Leu Leu Phe Cys Gly

1325 1330 1335

Ile Leu Gln Pro Arg Glu Lys Met Pro Ala Phe Trp Arg Arg Leu

1340 1345 1350

Met Tyr Asn Val Ser Pro Phe Thr Tyr Val Val Gln Ala Leu Val

1355 1360 1365

Thr Pro Leu Val His Asn Lys Lys Val Val Cys Asn Pro His Glu

1370 1375 1380

Tyr Asn Ile Met Asp Pro Pro Ser Gly Lys Thr Cys Gly Glu Phe

1385 1390 1395

Leu Ser Thr Tyr Met Asp Asn Asn Thr Gly Tyr Leu Val Asn Pro

1400 1405 1410

Thr Ala Thr Glu Asn Cys Gln Tyr Cys Pro Tyr Thr Val Gln Asp

1415 1420 1425

Gln Val Val Ala Lys Tyr Asn Val Lys Trp Asp His Arg Trp Arg

1430 1435 1440

Asn Phe Gly Phe Met Trp Ala Tyr Ile Cys Phe Asn Ile Ala Ala

1445 1450 1455

Met Leu Ile Cys Tyr Tyr Val Val Arg Val Lys Val Trp Ser Leu

1460 1465 1470

Lys Ser Val Leu Asn Phe Lys Lys Trp Phe Asn Gly Pro Arg Lys

1475 1480 1485

Glu Arg His Glu Lys Asp Thr Asn Ile Phe Gln Thr Val Pro Gly

1490 1495 1500

Asp Glu Asn Lys Ile Thr Lys Lys

1505 1510

<210> 31

<211> 944

<212> PRT

<213> 酿酒酵母

<400> 31

Met Asp Thr Gln Ile Ala Ile Thr Gly Val Ala Val Gly Lys Glu Ile

1 5 10 15

Asn Asn Asp Asn Ser Lys Thr Asp Gln Lys Val Ser Leu Pro Lys Ala

20 25 30

Asp Val Pro Cys Ile Asp Lys Ala Thr Gln Thr Ile Ile Glu Gly Cys

35 40 45

Ser Lys Asp Asp Pro Arg Leu Ser Tyr Pro Thr Lys Leu Glu Thr Thr

50 55 60

Glu Lys Gly Lys Thr Lys Arg Asn Ser Phe Ala Cys Val Cys Cys His

65 70 75 80

Ser Leu Lys Gln Lys Cys Glu Pro Ser Asp Val Asn Asp Ile Tyr Arg

85 90 95

Lys Pro Cys Arg Arg Cys Leu Lys His Lys Lys Leu Cys Lys Phe Asp

100 105 110

Leu Ser Lys Arg Thr Arg Lys Arg Lys Pro Arg Ser Arg Ser Pro Thr

115 120 125

Pro Phe Glu Ser Pro Met Val Asn Val Ser Thr Lys Ser Lys Gly Pro

130 135 140

Thr Asp Ser Glu Glu Ser Ser Leu Lys Asp Gly Thr Ser Tyr Leu Ala

145 150 155 160

Ser Phe Pro Ser Asp Pro Asn Ala Lys Gln Phe Pro Asn Ser Arg Thr

165 170 175

Val Leu Pro Gly Leu Gln Gln Ser Leu Ser Asp Leu Trp Ser Thr Leu

180 185 190

Ser Gln Pro Pro Ser Tyr Gly Ala Arg Glu Ala Glu Thr Thr Ser Thr

195 200 205

Gly Glu Ile Thr Thr Asn Asn His Thr Lys Ser Asn Gly Ser Val Pro

210 215 220

Thr Asn Pro Ala Val Leu Ala Ser Asn Asp Glu His Thr Asn Ile Ser

225 230 235 240

Asp Ala Pro Val Ile Tyr Ser Thr Tyr Asn Ser Pro Val Pro Ile Ser

245 250 255

Ser Ala Pro Thr Ser Ile Asn Ser Glu Ala Leu Phe Lys His Arg Pro

260 265 270

Lys Ile Val Gly Asp Glu Glu Thr Gln Asn Val Lys Val Lys Arg Gln

275 280 285

Lys Lys Ser Tyr Ser Arg His Met Thr Arg Ser Phe Arg Lys Gln Leu

290 295 300

Gln Ser Leu Ile Ile Ser Gln Lys Gly Lys Ile Arg Asp Ile Ser Met

305 310 315 320

Lys Leu Asp Thr Trp Ser Lys Gln Trp Asn Asp Leu Val Glu Lys Ser

325 330 335

Met Phe Leu Pro Thr Ile Ala Asp Pro Val Ser Val Gly Ile Ile Ser

340 345 350

His Glu Glu Ala Thr Leu Arg Leu His Leu Tyr Lys Thr Glu Ile Ser

355 360 365

Tyr Leu Ser Lys Leu Pro Phe Ile Lys Val Glu Glu Asn Val Ser Val

370 375 380

Asp Glu Leu Arg Lys Lys Lys Pro Ile Leu Phe Ser Val Ile Met Ser

385 390 395 400

Cys Val Ser Ile Val Leu Thr Pro Lys Gln Thr Thr Arg Gly Thr Ile

405 410 415

Met Lys Leu Asp Ser Phe Val Leu Asn Leu Ile Thr Asn Gln Ile Phe

420 425 430

Lys Ala Asn Asn Lys Ser Ile Glu Ile Ile Glu Ser Leu Ser Thr Leu

435 440 445

Cys Leu Trp Tyr Asn Phe Phe Glu Trp Ser Ser Lys Thr Arg Tyr His

450 455 460

Ile Phe Asn Tyr Ile Cys Cys Cys Leu Thr Arg Asp Leu Gly Pro Thr

465 470 475 480

Tyr Val Asn Arg Ser Phe Gly Met Phe Ser Asp Glu Asp Pro Lys Arg

485 490 495

Phe Lys Ser Pro Leu Glu Leu Tyr Ser Asn Gly Ala Ser Leu Thr Leu

500 505 510

Leu Val Tyr Ile Ser Ala Leu Asn Ile Ser Ile Phe Leu Arg Gln Ser

515 520 525

Ile Gln Ala Arg Trp Ser His Val Thr Glu Lys Ala Cys Glu Asp Leu

530 535 540

Val Lys Glu Thr Lys Lys Ser Arg His Tyr Asp Asn Asp Lys Leu Leu

545 550 555 560

Leu Asp Ser Ala Asp Asp Pro Ile Leu Val Gln Phe Ala Lys Met Asn

565 570 575

His Val Leu Glu Asn Ile His Thr His Leu His Glu Arg Asp Leu Asn

580 585 590

Asp Asp Glu Phe Asp Asp Pro Ile Phe Thr Lys Lys Tyr Leu Asn Lys

595 600 605

Leu Met Glu Lys Tyr His Lys Gln Leu Gln Glu Ile Phe Thr Lys Leu

610 615 620

Asp Arg Asn Arg Pro Arg Val Ile Ala Phe Tyr Tyr Ser Val Glu Ala

625 630 635 640

Tyr Leu Tyr Gln Tyr Lys Leu Ala Val Phe Ile Gly Glu Met Ser His

645 650 655

Thr Ile Asn Glu Lys Val Glu Leu Pro Arg Glu Ile Met Asp Asp Phe

660 665 670

Val Lys Cys Tyr His Cys Cys Lys Ser Ala Leu Glu Glu Phe Ser Lys

675 680 685

Leu Glu Pro Ile Leu Ile Thr Ser Leu Pro Leu Phe His Thr Ser Arg

690 695 700

Ile Ile Tyr Thr Val Gly Met Leu Leu Leu Lys Leu Arg Tyr Ser Val

705 710 715 720

Val Ala Ile Pro Ser Phe His Asp Leu Met Pro Leu Thr Asp Asp Ala

725 730 735

Ile Ala Leu Val Ile Gly Val Asn Asn Leu Leu Glu Lys Thr Ser Glu

740 745 750

Leu Tyr Pro Phe Asn Asn Ser Leu Tyr Lys Phe Arg Tyr Val Ile Ala

755 760 765

Leu Phe Cys Gln Thr Tyr Ala Asn Lys Val Ile Asp Val Ala Asp Arg

770 775 780

Tyr Asn Ala Glu Arg Glu Lys Leu Lys Glu Lys Gln Val Ile Asp Glu

785 790 795 800

Val Ser Asn Gly His Asp Gly Thr Lys Pro Ile Asn Ala Tyr Val Thr

805 810 815

Glu Ser Gln Lys Met Pro Thr Glu Glu Asp Pro Ile Ile Asp Asn Asn

820 825 830

Thr Asn Gln Asn Ile Thr Ala Val Pro Asp Glu Met Leu Pro Val Tyr

835 840 845

Ser Arg Val Arg Asp Asp Thr Ala Ala Met Asn Leu Asn Ile Asn Ser

850 855 860

Thr Ser Tyr Met Asn Glu Ser Pro His Glu His Arg Glu Ser Met Thr

865 870 875 880

Gly Thr Thr Leu Leu Pro Pro Pro Phe Ile Ser Asn Asp Val Thr Asn

885 890 895

Ser Ala Asp Ser Thr Asn Ile Lys Pro Ser Pro Ser Ser Ser Val Asp

900 905 910

Asn Leu Asn Asp Tyr Leu Thr Asp Ile Asn Ser Leu Ala Trp Gly Val

915 920 925

Asn Ser Leu Asn Asp Glu Phe Trp Thr Asp Leu Phe Met Asn Asp Ile

930 935 940

<210> 32

<211> 438

<212> PRT

<213> 粟酒裂殖酵母(Schizosaccharomyces pombe)

<400> 32

Met Gly Glu Leu Lys Glu Ile Leu Lys Gln Arg Tyr His Glu Leu Leu

1 5 10 15

Asp Trp Asn Val Lys Ala Pro His Val Pro Leu Ser Gln Arg Leu Lys

20 25 30

His Phe Thr Trp Ser Trp Phe Ala Cys Thr Met Ala Thr Gly Gly Val

35 40 45

Gly Leu Ile Ile Gly Ser Phe Pro Phe Arg Phe Tyr Gly Leu Asn Thr

50 55 60

Ile Gly Lys Ile Val Tyr Ile Leu Gln Ile Phe Leu Phe Ser Leu Phe

65 70 75 80

Gly Ser Cys Met Leu Phe Arg Phe Ile Lys Tyr Pro Ser Thr Ile Lys

85 90 95

Asp Ser Trp Asn His His Leu Glu Lys Leu Phe Ile Ala Thr Cys Leu

100 105 110

Leu Ser Ile Ser Thr Phe Ile Asp Met Leu Ala Ile Tyr Ala Tyr Pro

115 120 125

Asp Thr Gly Glu Trp Met Val Trp Val Ile Arg Ile Leu Tyr Tyr Ile

130 135 140

Tyr Val Ala Val Ser Phe Ile Tyr Cys Val Met Ala Phe Phe Thr Ile

145 150 155 160

Phe Asn Asn His Val Tyr Thr Ile Glu Thr Ala Ser Pro Ala Trp Ile

165 170 175

Leu Pro Ile Phe Pro Pro Met Ile Cys Gly Val Ile Ala Gly Ala Val

180 185 190

Asn Ser Thr Gln Pro Ala His Gln Leu Lys Asn Met Val Ile Phe Gly

195 200 205

Ile Leu Phe Gln Gly Leu Gly Phe Trp Val Tyr Leu Leu Leu Phe Ala

210 215 220

Val Asn Val Leu Arg Phe Phe Thr Val Gly Leu Ala Lys Pro Gln Asp

225 230 235 240

Arg Pro Gly Met Phe Met Phe Val Gly Pro Pro Ala Phe Ser Gly Leu

245 250 255

Ala Leu Ile Asn Ile Ala Arg Gly Ala Met Gly Ser Arg Pro Tyr Ile

260 265 270

Phe Val Gly Ala Asn Ser Ser Glu Tyr Leu Gly Phe Val Ser Thr Phe

275 280 285

Met Ala Ile Phe Ile Trp Gly Leu Ala Ala Trp Cys Tyr Cys Leu Ala

290 295 300

Met Val Ser Phe Leu Ala Gly Phe Phe Thr Arg Ala Pro Leu Lys Phe

305 310 315 320

Ala Cys Gly Trp Phe Ala Phe Ile Phe Pro Asn Val Gly Phe Val Asn

325 330 335

Cys Thr Ile Glu Ile Gly Lys Met Ile Asp Ser Lys Ala Phe Gln Met

340 345 350

Phe Gly His Ile Ile Gly Val Ile Leu Cys Ile Gln Trp Ile Leu Leu

355 360 365

Met Tyr Leu Met Val Arg Ala Phe Leu Val Asn Asp Leu Cys Tyr Pro

370 375 380

Gly Lys Asp Glu Asp Ala His Pro Pro Pro Lys Pro Asn Thr Gly Val

385 390 395 400

Leu Asn Pro Thr Phe Pro Pro Glu Lys Ala Pro Ala Ser Leu Glu Lys

405 410 415

Val Asp Thr His Val Thr Ser Thr Gly Gly Glu Ser Asp Pro Pro Ser

420 425 430

Ser Glu His Glu Ser Val

435

<210> 33

<211> 267

<212> PRT

<213> 人工序列

<220>

<223> 合成序列

<400> 33

Met Leu His Ile Ala Met Ile Gly Cys Gly Ala Ile Gly Ala Gly Val

1 5 10 15

Leu Glu Leu Leu Lys Ser Asp Pro Asp Leu Arg Val Asp Ala Val Ile

20 25 30

Val Pro Glu Glu Ser Met Asp Ala Val Arg Glu Ala Val Ala Ala Leu

35 40 45

Ala Pro Val Ala Arg Val Leu Thr Ala Leu Pro Ala Asp Ala Arg Pro

50 55 60

Asp Leu Leu Val Glu Cys Ala Gly His Arg Ala Ile Glu Glu His Val

65 70 75 80

Val Pro Ala Leu Glu Arg Gly Ile Pro Cys Ala Val Ala Ser Val Gly

85 90 95

Ala Leu Ser Glu Pro Gly Leu Ala Glu Arg Leu Glu Ala Ala Ala Arg

100 105 110

Arg Gly Gly Thr Gln Val Gln Leu Leu Ser Gly Ala Ile Gly Ala Ile

115 120 125

Asp Ala Leu Ala Ala Ala Arg Val Gly Gly Leu Asp Ser Val Val Tyr

130 135 140

Thr Gly Arg Lys Pro Pro Leu Ala Trp Lys Gly Thr Pro Ala Glu Gln

145 150 155 160

Val Cys Asp Leu Asp Ala Leu Thr Glu Ala Thr Val Ile Phe Glu Gly

165 170 175

Ser Ala Arg Glu Ala Ala Arg Leu Tyr Pro Lys Asn Ala Asn Val Ala

180 185 190

Ala Thr Leu Ser Leu Ala Gly Leu Gly Leu Asp Arg Thr Gln Val Arg

195 200 205

Leu Ile Ala Asp Pro Ala Val Thr Glu Asn Val His His Val Glu Ala

210 215 220

Arg Gly Ala Phe Gly Gly Phe Glu Leu Thr Met Arg Gly Lys Pro Leu

225 230 235 240

Ala Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg

245 250 255

Ala Leu Gly Asn Arg Ala His Ala Leu Ser Ile

260 265

<210> 34

<211> 267

<212> PRT

<213> 铜绿假单胞菌(Pseudomonas aeruginosa)

<400> 34

Met Leu Asn Ile Val Met Ile Gly Cys Gly Ala Ile Gly Ala Gly Val

1 5 10 15

Leu Glu Leu Leu Glu Asn Asp Pro Gln Leu Arg Val Asp Ala Val Ile

20 25 30

Val Pro Arg Asp Ser Glu Thr Gln Val Arg His Arg Leu Ala Ser Leu

35 40 45

Arg Arg Pro Pro Arg Val Leu Ser Ala Leu Pro Ala Gly Glu Arg Pro

50 55 60

Asp Leu Leu Val Glu Cys Ala Gly His Arg Ala Ile Glu Gln His Val

65 70 75 80

Leu Pro Ala Leu Ala Gln Gly Ile Pro Cys Leu Val Val Ser Val Gly

85 90 95

Ala Leu Ser Glu Pro Gly Leu Val Glu Arg Leu Glu Ala Ala Ala Gln

100 105 110

Ala Gly Gly Ser Arg Ile Glu Leu Leu Pro Gly Ala Ile Gly Ala Ile

115 120 125

Asp Ala Leu Ser Ala Ala Arg Val Gly Gly Leu Glu Ser Val Arg Tyr

130 135 140

Thr Gly Arg Lys Pro Ala Ser Ala Trp Leu Gly Thr Pro Gly Glu Thr

145 150 155 160

Val Cys Asp Leu Gln Arg Leu Glu Lys Ala Arg Val Ile Phe Asp Gly

165 170 175

Ser Ala Arg Glu Ala Ala Arg Leu Tyr Pro Lys Asn Ala Asn Val Ala

180 185 190

Ala Thr Leu Ser Leu Ala Gly Leu Gly Leu Asp Arg Thr Gln Val Arg

195 200 205

Leu Ile Ala Asp Pro Glu Ser Cys Glu Asn Val His Gln Val Glu Ala

210 215 220

Ser Gly Ala Phe Gly Gly Phe Glu Leu Thr Leu Arg Gly Lys Pro Leu

225 230 235 240

Ala Ala Asn Pro Lys Thr Ser Ala Leu Thr Val Tyr Ser Val Val Arg

245 250 255

Ala Leu Gly Asn His Ala His Ala Ile Ser Ile

260 265

<210> 35

<211> 885

<212> PRT

<213> 人工序列

<220>

<223> 合成序列

<400> 35

Met Asn Glu Gln Tyr Ser Ala Leu Arg Ser Asn Val Ser Met Leu Gly

1 5 10 15

Lys Leu Leu Gly Asp Thr Ile Lys Asp Ala Leu Gly Glu Asp Ile Leu

20 25 30

Asp Arg Val Glu Thr Ile Arg Lys Leu Ser Lys Ser Ser Arg Ala Gly

35 40 45

Asn Glu Ala Asn Arg Gln Glu Leu Leu Thr Thr Leu Gln Asn Leu Ser

50 55 60

Asn Asp Glu Leu Leu Pro Val Ala Arg Ala Phe Ser Gln Phe Leu Asn

65 70 75 80

Leu Thr Asn Thr Ala Glu Gln Tyr His Ser Ile Ser Pro His Gly Glu

85 90 95

Ala His Ala Ser Asn Pro Glu Ala Ile Ala Arg Leu Phe Arg Lys Leu

100 105 110

Lys Asp Gln Pro Asn Leu Ser Glu Ala Asp Ile Lys Lys Ala Val Glu

115 120 125

Ser Leu Ser Ile Glu Leu Val Leu Thr Ala His Pro Thr Glu Ile Thr

130 135 140

Arg Arg Thr Leu Ile His Lys Leu Val Glu Val Asn Thr Cys Leu Ser

145 150 155 160

Gln Leu Asp His Asp Asp Leu Ala Asp Tyr Glu Arg Asn Gln Ile Met

165 170 175

Arg Arg Leu Arg Gln Leu Ile Ala Gln Ser Trp His Thr Asp Glu Ile

180 185 190

Arg Lys Gln Arg Pro Thr Pro Val Asp Glu Ala Lys Trp Gly Phe Ala

195 200 205

Val Val Glu Asn Ser Leu Trp Glu Gly Val Pro Ala Phe Leu Arg Glu

210 215 220

Phe Asn Glu Gln Leu Glu Glu Ser Leu Gly Tyr Lys Leu Pro Val Glu

225 230 235 240

Ala Val Pro Val Arg Phe Thr Ser Trp Met Gly Gly Asp Arg Asp Gly

245 250 255

Asn Pro Asn Val Thr Ala Glu Ile Thr Arg His Val Leu Leu Leu Ser

260 265 270

Arg Trp Lys Ala Ala Asp Leu Phe Leu Lys Asp Ile Gln Val Leu Val

275 280 285

Ser Glu Leu Ser Met Val Glu Cys Thr Pro Glu Leu Arg Ala Leu Ala

290 295 300

Gly Glu Glu Gly Ala Leu Glu Pro Tyr Arg Glu Leu Leu Lys Asn Leu

305 310 315 320

Arg Thr Gln Leu Met Ala Thr Leu Ala Tyr Leu Glu Ala Arg Leu Lys

325 330 335

Gly Glu Arg Leu Arg Pro Lys Pro Ala Gly Leu Leu Thr Gln Asn Glu

340 345 350

Gln Leu Trp Glu Pro Leu Tyr Ala Cys Tyr Gln Ser Leu Gln Ala Cys

355 360 365

Gly Met Gly Ile Ile Ala Asn Gly Gln Leu Leu Asp Thr Leu Arg Arg

370 375 380

Val Lys Cys Phe Gly Val Pro Leu Val Arg Ile Asp Ile Arg Gln Glu

385 390 395 400

Ser Thr Arg His Thr Glu Ala Leu Ala Glu Leu Thr Arg Tyr Leu Gly

405 410 415

Leu Gly Asp Tyr Glu Ser Trp Ser Glu Ala Asp Lys Gln Ala Phe Leu

420 425 430

Ile Arg Glu Leu Asn Ser Lys Arg Pro Leu Leu Pro Arg Asn Trp Glu

435 440 445

Pro Ser Ala Glu Thr Gln Glu Val Leu Asp Thr Cys Lys Val Ile Ala

450 455 460

Glu Ala Pro Lys Gly Ser Ile Ala Ala Tyr Val Ile Ser Met Ala Lys

465 470 475 480

Thr Pro Ser Asp Val Leu Ala Val His Leu Leu Leu Lys Glu Ala Gly

485 490 495

Cys Pro Phe Ala Leu Pro Val Ala Pro Leu Phe Glu Thr Leu Asp Asp

500 505 510

Leu Asn Asn Ala Glu Asp Val Met Thr Gln Leu Leu Asn Ile Asp Trp

515 520 525

Tyr Arg Gly Phe Ile Gln Gly Lys Gln Met Val Met Ile Gly Tyr Ser

530 535 540

Asp Ser Ala Lys Asp Ala Gly Val Met Ala Ala Ser Trp Ala Gln Tyr

545 550 555 560

Arg Ala Gln Asp Ala Leu Ile Lys Thr Cys Glu Lys Ala Gly Ile Glu

565 570 575

Leu Thr Leu Phe His Gly Arg Gly Gly Ser Ile Gly Arg Gly Gly Ala

580 585 590

Pro Ala His Ala Ala Leu Leu Ser Gln Pro Pro Gly Ser Leu Lys Gly

595 600 605

Gly Leu Arg Val Thr Glu Gln Gly Glu Met Ile Arg Phe Lys Leu Gly

610 615 620

Leu Pro Glu Val Thr Val Ser Ser Leu Ser Leu Tyr Ala Ser Ala Ile

625 630 635 640

Leu Glu Ala Asn Leu Leu Pro Pro Pro Glu Pro Lys Asp Glu Trp Arg

645 650 655

Asp Ile Met Asp Glu Leu Ser Asp Ile Ser Cys Asp Leu Tyr Arg Gly

660 665 670

Tyr Val Arg Glu Asn Lys Asp Phe Val Pro Tyr Phe Arg Ala Ala Thr

675 680 685

Pro Glu Gln Glu Leu Gly Lys Leu Pro Leu Gly Ser Arg Pro Ala Lys

690 695 700

Arg Arg Pro Thr Gly Gly Val Glu Ser Leu Arg Ala Ile Pro Trp Ile

705 710 715 720

Phe Ala Trp Thr Gln Asn Arg Leu Met Leu Pro Ala Trp Leu Gly Ala

725 730 735

Gly Ala Ala Leu Gln Lys Val Ile Glu Asp Gly Lys Gln Asp Glu Leu

740 745 750

Glu Ala Met Cys Arg Asp Trp Pro Phe Phe Ser Thr Arg Ile Gly Met

755 760 765

Leu Glu Met Val Phe Ala Lys Ala Asp Leu Trp Leu Ala Glu Tyr Tyr

770 775 780

Asp Gln Arg Leu Val Asp Lys Ala Leu Trp Pro Leu Gly Glu Glu Leu

785 790 795 800

Arg Asp Gln Leu Glu Glu Asp Ile Lys Val Val Leu Ala Ile Ala Asn

805 810 815

Asp Ser His Leu Met Ala Asp Leu Pro Trp Ile Ala Glu Ser Ile Ala

820 825 830

Leu Arg Asn Val Tyr Thr Asp Pro Leu Asn Val Leu Gln Ala Glu Leu

835 840 845

Leu His Arg Ser Arg Gln Gln Glu Glu Glu Gly Lys Glu Pro Asp Pro

850 855 860

Arg Val Glu Gln Ala Leu Met Val Thr Ile Ala Gly Ile Ala Ala Gly

865 870 875 880

Met Arg Asn Thr Gly

885

<210> 36

<211> 245

<212> PRT

<213> 人工序列

<220>

<223> 合成序列

<400> 36

Met Ser Leu Gln Asp Phe Asp Ala Asp Glu Leu Ala Ala Phe His Glu

1 5 10 15

Asp Ile Lys Ala Ala Tyr Glu Glu Leu Lys Ala Lys Asn Leu Lys Leu

20 25 30

Asp Leu Thr Arg Gly Lys Pro Ser Ser Glu Gln Leu Asp Phe Ser Asn

35 40 45

Glu Leu Leu Ala Leu Pro Gly Glu Asp Asp Tyr Arg Asp Ala Asp Gly

50 55 60

Thr Asp Thr Arg Asn Tyr Gly Gly Leu Thr Gly Ile Pro Glu Ile Arg

65 70 75 80

Ala Ile Trp Ala Glu Leu Leu Gly Ile Pro Val Glu Asn Val Leu Ala

85 90 95

Gly Asp Ala Ser Ser Leu Asn Ile Met Phe Asp Leu Ile Ser Trp Ser

100 105 110

Tyr Leu Phe Gly Asn Asn Asp Ser Pro Arg Pro Trp Ser Gln Glu Glu

115 120 125

Val Val Lys Trp Leu Cys Pro Val Pro Gly Tyr Asp Arg His Phe Ala

130 135 140

Ile Thr Glu Ser Phe Gly Ile Glu Met Ile Pro Val Pro Leu Arg Glu

145 150 155 160

Asp Gly Pro Asp Met Asp Ala Val Glu Glu Leu Val Ala Lys Asp Pro

165 170 175

Gln Ile Lys Gly Met Trp Thr Val Pro Val Phe Ser Asn Pro Thr Gly

180 185 190

Ala Thr Tyr Ser Glu Glu Val Ala Arg Arg Leu Ala Glu Met Glu Thr

195 200 205

Ala Ala Pro Asp Phe Arg Ile Val Trp Asp Asn Ala Tyr Ala Val His

210 215 220

Thr Leu Thr Asp Glu Phe Pro Glu Val Ile Asp Ile Leu Gly Leu Ala

225 230 235 240

Glu Ala Ala Gly Asn

245

<210> 37

<211> 127

<212> PRT

<213> 枯草杆菌(Bacillus subtilis)

<400> 37

Met Tyr Arg Thr Met Met Ser Gly Lys Leu His Arg Ala Thr Val Thr

1 5 10 15

Glu Ala Asn Leu Asn Tyr Val Gly Ser Ile Thr Ile Asp Glu Asp Leu

20 25 30

Ile Asp Ala Val Gly Met Leu Pro Asn Glu Lys Val Gln Ile Val Asn

35 40 45

Asn Asn Asn Gly Ala Arg Leu Glu Thr Tyr Ile Ile Pro Gly Lys Arg

50 55 60

Gly Ser Gly Val Ile Cys Leu Asn Gly Ala Ala Ala Arg Leu Val Gln

65 70 75 80

Glu Gly Asp Lys Val Ile Ile Ile Ser Tyr Lys Met Met Ser Asp Gln

85 90 95

Glu Ala Ala Ser His Glu Pro Lys Val Ala Val Leu Asn Asp Gln Asn

100 105 110

Lys Ile Glu Gln Met Leu Gly Asn Glu Pro Ala Arg Thr Ile Leu

115 120 125

<210> 38

<211> 540

<212> PRT

<213> Tribolium castaneum

<400> 38

Met Pro Ala Thr Gly Glu Asp Gln Asp Leu Val Gln Asp Leu Ile Glu

1 5 10 15

Glu Pro Ala Thr Phe Ser Asp Ala Val Leu Ser Ser Asp Glu Glu Leu

20 25 30

Phe His Gln Lys Cys Pro Lys Pro Ala Pro Ile Tyr Ser Pro Ile Ser

35 40 45

Lys Pro Val Ser Phe Glu Ser Leu Pro Asn Arg Arg Leu His Glu Glu

50 55 60

Phe Leu Arg Ser Ser Val Asp Val Leu Leu Gln Glu Ala Val Phe Glu

65 70 75 80

Gly Thr Asn Arg Lys Asn Arg Val Leu Gln Trp Arg Glu Pro Glu Glu

85 90 95

Leu Arg Arg Leu Met Asp Phe Gly Val Arg Gly Ala Pro Ser Thr His

100 105 110

Glu Glu Leu Leu Glu Val Leu Lys Lys Val Val Thr Tyr Ser Val Lys

115 120 125

Thr Gly His Pro Tyr Phe Val Asn Gln Leu Phe Ser Ala Val Asp Pro

130 135 140

Tyr Gly Leu Val Ala Gln Trp Ala Thr Asp Ala Leu Asn Pro Ser Val

145 150 155 160

Tyr Thr Tyr Glu Val Ser Pro Val Phe Val Leu Met Glu Glu Val Val

165 170 175

Leu Arg Glu Met Arg Ala Ile Val Gly Phe Glu Gly Gly Lys Gly Asp

180 185 190

Gly Ile Phe Cys Pro Gly Gly Ser Ile Ala Asn Gly Tyr Ala Ile Ser

195 200 205

Cys Ala Arg Tyr Arg Phe Met Pro Asp Ile Lys Lys Lys Gly Leu His

210 215 220

Ser Leu Pro Arg Leu Val Leu Phe Thr Ser Glu Asp Ala His Tyr Ser

225 230 235 240

Ile Lys Lys Leu Ala Ser Phe Glu Gly Ile Gly Thr Asp Asn Val Tyr

245 250 255

Leu Ile Arg Thr Asp Ala Arg Gly Arg Met Asp Val Ser His Leu Val

260 265 270

Glu Glu Ile Glu Arg Ser Leu Arg Glu Gly Ala Ala Pro Phe Met Val

275 280 285

Ser Ala Thr Ala Gly Thr Thr Val Ile Gly Ala Phe Asp Pro Ile Glu

290 295 300

Lys Ile Ala Asp Val Cys Gln Lys Tyr Lys Leu Trp Leu His Val Asp

305 310 315 320

Ala Ala Trp Gly Gly Gly Ala Leu Val Ser Ala Lys His Arg His Leu

325 330 335

Leu Lys Gly Ile Glu Arg Ala Asp Ser Val Thr Trp Asn Pro His Lys

340 345 350

Leu Leu Thr Ala Pro Gln Gln Cys Ser Thr Leu Leu Leu Arg His Glu

355 360 365

Gly Val Leu Ala Glu Ala His Ser Thr Asn Ala Ala Tyr Leu Phe Gln

370 375 380

Lys Asp Lys Phe Tyr Asp Thr Lys Tyr Asp Thr Gly Asp Lys His Ile

385 390 395 400

Gln Cys Gly Arg Arg Ala Asp Val Leu Lys Phe Trp Phe Met Trp Lys

405 410 415

Ala Lys Gly Thr Ser Gly Leu Glu Lys His Val Asp Lys Val Phe Glu

420 425 430

Asn Ala Arg Phe Phe Thr Asp Cys Ile Lys Asn Arg Glu Gly Phe Glu

435 440 445

Met Val Ile Ala Glu Pro Glu Tyr Thr Asn Ile Cys Phe Trp Tyr Val

450 455 460

Pro Lys Ser Leu Arg Gly Arg Lys Asp Glu Ala Asp Tyr Lys Asp Lys

465 470 475 480

Leu His Lys Val Ala Pro Arg Ile Lys Glu Arg Met Met Lys Glu Gly

485 490 495

Ser Met Met Val Thr Tyr Gln Ala Gln Lys Gly His Pro Asn Phe Phe

500 505 510

Arg Ile Val Phe Gln Asn Ser Gly Leu Asp Lys Ala Asp Met Val His

515 520 525

Phe Val Glu Glu Ile Glu Arg Leu Gly Ser Asp Leu

530 535 540

<210> 39

<211> 128

<212> PRT

<213> 人工序列

<220>

<223> 合成序列

<400> 39

Met Leu Arg Thr Met Leu Lys Ser Lys Ile His Arg Ala Thr Val Thr

1 5 10 15

Gln Ala Asp Leu His Tyr Val Gly Ser Val Thr Ile Asp Ala Asp Leu

20 25 30

Leu Asp Ala Ala Asp Ile Leu Glu Gly Glu Lys Val Ala Ile Val Asp

35 40 45

Ile Thr Asn Gly Ala Arg Leu Glu Thr Tyr Val Ile Ala Gly Glu Arg

50 55 60

Gly Ser Gly Val Ile Gly Ile Asn Gly Ala Ala Ala His Leu Val His

65 70 75 80

Pro Gly Asp Leu Val Ile Ile Ile Ala Tyr Ala Gln Met Ser Asp Ala

85 90 95

Glu Ala Arg Ala Tyr Glu Pro Arg Val Val Phe Val Asp Ala Asp Asn

100 105 110

Arg Ile Val Glu Leu Gly Asn Asp Pro Ala Glu Ala Leu Pro Gly Gly

115 120 125

<210> 40

<211> 585

<212> PRT

<213> 人工序列

<220>

<223> 合成序列

<400> 40

Met Pro Ala Asn Gly Asn Phe Pro Val Ala Leu Glu Val Ile Ser Ile

1 5 10 15

Phe Lys Pro Tyr Asn Ser Ala Val Glu Asp Leu Ala Ser Met Ala Lys

20 25 30

Thr Asp Thr Ser Ala Ser Ser Ser Gly Ser Asp Ser Ala Gly Ser Ser

35 40 45

Glu Asp Glu Asp Val Gln Leu Phe Ala Ser Lys Gly Asn Leu Leu Asn

50 55 60

Ser Lys Leu Leu Lys Lys Ser Asn Asn Asn Asn Lys Asn Asn Asn Ile

65 70 75 80

Asn Glu Asn Asn Asn Lys Asn Ala Ala Ala Gly Leu Lys Arg Phe Ala

85 90 95

Ser Leu Pro Asn Arg Ala Glu His Glu Glu Phe Leu Arg Asp Cys Val

100 105 110

Asp Glu Ile Leu Lys Leu Ala Val Phe Glu Gly Thr Asn Arg Ser Ser

115 120 125

Lys Val Val Glu Trp His Asp Pro Glu Glu Leu Lys Lys Leu Phe Asp

130 135 140

Phe Glu Leu Arg Ala Glu Pro Asp Ser His Glu Lys Leu Leu Glu Leu

145 150 155 160

Leu Arg Ala Thr Ile Arg Tyr Ser Val Lys Thr Gly His Pro Tyr Phe

165 170 175

Val Asn Gln Leu Phe Ser Ser Val Asp Pro Tyr Gly Leu Val Gly Gln

180 185 190

Trp Leu Thr Asp Ala Leu Asn Pro Ser Val Tyr Thr Tyr Glu Val Ala

195 200 205

Pro Val Phe Thr Leu Met Glu Glu Val Val Leu Arg Glu Met Arg Arg

210 215 220

Ile Val Gly Phe Pro Asn Asp Gly Glu Gly Asp Gly Ile Phe Cys Pro

225 230 235 240

Gly Gly Ser Ile Ala Asn Gly Tyr Ala Ile Ser Cys Ala Arg Tyr Lys

245 250 255

Tyr Ala Pro Glu Val Lys Lys Lys Gly Leu His Ser Leu Pro Arg Leu

260 265 270

Val Ile Phe Thr Ser Glu Asp Ala His Tyr Ser Val Lys Lys Leu Ala

275 280 285

Ser Phe Met Gly Ile Gly Ser Asp Asn Val Tyr Lys Ile Ala Thr Asp

290 295 300

Glu Val Gly Lys Met Arg Val Ser Asp Leu Glu Gln Glu Ile Leu Arg

305 310 315 320

Ala Leu Asp Glu Gly Ala Gln Pro Phe Met Val Ser Ala Thr Ala Gly

325 330 335

Thr Thr Val Ile Gly Ala Phe Asp Pro Leu Glu Gly Ile Ala Asp Leu

340 345 350

Cys Lys Lys Tyr Asn Leu Trp Met His Val Asp Ala Ala Trp Gly Gly

355 360 365

Gly Ala Leu Met Ser Lys Lys Tyr Arg His Leu Leu Lys Gly Ile Glu

370 375 380

Arg Ala Asp Ser Val Thr Trp Asn Pro His Lys Leu Leu Ala Ala Pro

385 390 395 400

Gln Gln Cys Ser Thr Phe Leu Thr Arg His Glu Gly Ile Leu Ser Glu

405 410 415

Cys His Ser Thr Asn Ala Thr Tyr Leu Phe Gln Lys Asp Lys Phe Tyr

420 425 430

Asp Thr Ser Tyr Asp Thr Gly Asp Lys His Ile Gln Cys Gly Arg Arg

435 440 445

Ala Asp Val Leu Lys Phe Trp Phe Met Trp Lys Ala Lys Gly Thr Ser

450 455 460

Gly Phe Glu Ala His Val Asp Lys Val Phe Glu Asn Ala Glu Tyr Phe

465 470 475 480

Thr Asp Ser Ile Lys Ala Arg Pro Gly Phe Glu Leu Val Ile Glu Glu

485 490 495

Pro Glu Cys Thr Asn Ile Cys Phe Trp Tyr Val Pro Pro Ser Leu Arg

500 505 510

Gly Met Glu Arg Asp Asn Ala Glu Phe Tyr Glu Lys Leu His Lys Val

515 520 525

Ala Pro Lys Ile Lys Glu Arg Met Ile Lys Glu Gly Ser Met Met Ile

530 535 540

Thr Tyr Gln Pro Leu Arg Asp Leu Pro Asn Phe Phe Arg Leu Val Leu

545 550 555 560

Gln Asn Ser Gly Leu Asp Lys Ser Asp Met Leu Tyr Phe Ile Asn Glu

565 570 575

Ile Glu Arg Leu Gly Ser Asp Leu Val

580 585

<210> 41

<211> 273

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 41

Met Leu Ser Gly Asn Gly Gln Leu Asp Ala Asn Lys Trp Thr Pro Phe

1 5 10 15

Ile Asn Ser Gln Thr Trp Thr Thr Tyr Ile Leu Pro Gly Leu Trp Gly

20 25 30

Thr Leu Lys Ser Ala Val Phe Ser Val Ile Leu Ala Leu Val Met Gly

35 40 45

Thr Ala Leu Gly Leu Gly Arg Ile Ser Glu Ile Arg Ile Leu Arg Trp

50 55 60

Phe Cys Ala Val Ile Ile Glu Thr Phe Arg Ala Ile Pro Val Leu Ile

65 70 75 80

Leu Met Ile Phe Ala Tyr Gln Met Phe Ala Gln Tyr Asn Ile Val Pro

85 90 95

Ser Ser Gln Leu Ala Phe Ala Ala Val Val Phe Gly Leu Thr Met Tyr

100 105 110

Asn Gly Ser Val Ile Ala Glu Ile Leu Arg Ser Gly Ile Ala Ser Leu

115 120 125

Pro Lys Gly Gln Lys Glu Ala Ala Ile Ala Leu Gly Met Ser Ser Arg

130 135 140

Gln Thr Thr Trp Ser Ile Leu Leu Pro Gln Ala Val Ala Ala Met Leu

145 150 155 160

Pro Ala Leu Ile Ser Gln Met Val Ile Ala Leu Lys Asp Ser Ala Leu

165 170 175

Gly Tyr Gln Ile Gly Tyr Ile Glu Val Val Arg Ser Gly Ile Gln Ser

180 185 190

Ala Ser Val Asn Arg Asn Tyr Leu Ala Ala Leu Phe Val Val Ala Leu

195 200 205

Ile Met Ile Val Leu Asn Phe Ser Leu Thr Ala Leu Ala Ser Arg Ile

210 215 220

Glu Arg Gln Leu Arg Ala Gly Arg Ala Arg Lys Asn Ile Val Ala Lys

225 230 235 240

Val Pro Glu Gln Pro Asp Gln Gly Leu Glu Thr Lys Asp Asn Val Asn

245 250 255

Val Asp Trp Gln Asp Pro Asp Tyr Lys Asp Leu Lys Thr Pro Gly Val

260 265 270

Gln

<210> 42

<211> 242

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 42

Met Ile Lys Met Thr Gly Val Gln Lys Tyr Phe Gly Asp Phe His Ala

1 5 10 15

Leu Thr Asp Ile Asp Leu Glu Ile Pro Arg Gly Gln Val Val Val Val

20 25 30

Leu Gly Pro Ser Gly Ser Gly Lys Ser Thr Leu Cys Arg Thr Ile Asn

35 40 45

Arg Leu Glu Thr Ile Glu Glu Gly Thr Ile Glu Ile Asp Gly Lys Val

50 55 60

Leu Pro Glu Glu Gly Lys Gly Leu Ala Asn Leu Arg Ala Asp Val Gly

65 70 75 80

Met Val Phe Gln Ser Phe Asn Leu Phe Pro His Leu Thr Ile Lys Asp

85 90 95

Asn Val Thr Leu Ala Pro Ile Lys Val Arg Lys Met Lys Lys Ser Glu

100 105 110

Ala Glu Lys Leu Ala Met Ser Leu Leu Glu Arg Val Gly Ile Ala Asn

115 120 125

Gln Ala Asp Lys Tyr Pro Ala Gln Leu Ser Gly Gly Gln Gln Gln Arg

130 135 140

Val Ala Ile Ala Arg Ala Leu Ala Met Asn Pro Lys Ile Met Leu Phe

145 150 155 160

Asp Glu Pro Thr Ser Ala Leu Asp Pro Glu Met Val Asn Glu Val Leu

165 170 175

Asp Val Met Ala Ser Leu Ala Lys Glu Gly Met Thr Met Val Cys Val

180 185 190

Thr His Glu Met Gly Phe Ala Arg Lys Ala Ala Asp Arg Val Leu Phe

195 200 205

Met Ala Asp Gly Leu Ile Val Glu Asp Thr Glu Pro Asp Ser Phe Phe

210 215 220

Thr Asn Pro Lys Ser Asp Arg Ala Lys Asp Phe Leu Gly Lys Ile Leu

225 230 235 240

Ala His

<210> 43

<211> 228

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 43

Met Ser Thr Leu Trp Ala Asp Leu Gly Pro Ser Leu Leu Pro Ala Phe

1 5 10 15

Trp Val Thr Ile Lys Leu Thr Ile Tyr Ser Ala Ile Gly Ala Met Ile

20 25 30

Phe Gly Thr Ile Leu Thr Thr Met Arg Val Ser Pro Val Lys Ile Leu

35 40 45

Arg Thr Leu Ser Thr Ala Tyr Ile Asn Thr Val Arg Asn Thr Pro Leu

50 55 60

Thr Leu Val Val Leu Phe Cys Ser Phe Gly Leu Tyr Gln Asn Leu Gly

65 70 75 80

Leu Thr Leu Ala Gly Arg Glu Ser Ser Thr Phe Leu Val Asp Asn Asn

85 90 95

Phe Arg Leu Ala Val Leu Gly Phe Ile Leu Tyr Thr Ser Thr Phe Val

100 105 110

Ala Glu Ser Leu Arg Ser Gly Ile Asn Thr Val His Phe Gly Gln Ala

115 120 125

Glu Ala Ala Arg Ser Leu Gly Leu Gly Phe Gly Ala Thr Phe Arg Ser

130 135 140

Ile Ile Phe Pro Gln Ala Val Arg Ala Ala Ile Val Pro Leu Gly Asn

145 150 155 160

Thr Leu Ile Ala Leu Thr Lys Asn Thr Thr Ile Ala Ser Val Ile Gly

165 170 175

Val Gly Glu Ala Ser Leu Leu Met Lys Ala Thr Ile Glu Asn His Ala

180 185 190

Asn Met Leu Phe Val Val Phe Ala Ile Phe Ala Val Gly Phe Met Ile

195 200 205

Leu Thr Leu Pro Met Gly Leu Gly Leu Gly Lys Leu Ser Glu Arg Leu

210 215 220

Ala Val Lys Lys

225

<210> 44

<211> 260

<212> PRT

<213> 智人(Homo sapiens)

<400> 44

Met Ser His His Trp Gly Tyr Gly Lys His Asn Gly Pro Glu His Trp

1 5 10 15

His Lys Asp Phe Pro Ile Ala Lys Gly Glu Arg Gln Ser Pro Val Asp

20 25 30

Ile Asp Thr His Thr Ala Lys Tyr Asp Pro Ser Leu Lys Pro Leu Ser

35 40 45

Val Ser Tyr Asp Gln Ala Thr Ser Leu Arg Ile Leu Asn Asn Gly His

50 55 60

Ala Phe Asn Val Glu Phe Asp Asp Ser Gln Asp Lys Ala Val Leu Lys

65 70 75 80

Gly Gly Pro Leu Asp Gly Thr Tyr Arg Leu Ile Gln Phe His Phe His

85 90 95

Trp Gly Ser Leu Asp Gly Gln Gly Ser Glu His Thr Val Asp Lys Lys

100 105 110

Lys Tyr Ala Ala Glu Leu His Leu Val His Trp Asn Thr Lys Tyr Gly

115 120 125

Asp Phe Gly Lys Ala Val Gln Gln Pro Asp Gly Leu Ala Val Leu Gly

130 135 140

Ile Phe Leu Lys Val Gly Ser Ala Lys Pro Gly Leu Gln Lys Val Val

145 150 155 160

Asp Val Leu Asp Ser Ile Lys Thr Lys Gly Lys Ser Ala Asp Phe Thr

165 170 175

Asn Phe Asp Pro Arg Gly Leu Leu Pro Glu Ser Leu Asp Tyr Trp Thr

180 185 190

Tyr Pro Gly Ser Leu Thr Thr Pro Pro Leu Leu Glu Cys Val Thr Trp

195 200 205

Ile Val Leu Lys Glu Pro Ile Ser Val Ser Ser Glu Gln Val Leu Lys

210 215 220

Phe Arg Lys Leu Asn Phe Asn Gly Glu Gly Glu Pro Glu Glu Leu Met

225 230 235 240

Val Asp Asn Trp Arg Pro Ala Gln Pro Leu Lys Asn Arg Gln Ile Lys

245 250 255

Ala Ser Phe Lys

260

<210> 45

<211> 330

<212> PRT

<213> 黄顶菊(Flaveria bidentis)

<400> 45

Met Ser Ala Ala Ser Ala Phe Ala Met Asn Ala Pro Ser Phe Val Asn

1 5 10 15

Ala Ser Ser Leu Lys Lys Ala Ser Thr Ser Ala Arg Ser Gly Val Leu

20 25 30

Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ser Ala

35 40 45

Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala

50 55 60

Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu

65 70 75 80

Glu Ala Ile Asp Ala Leu Lys Lys Thr Leu Ile Glu Lys Gly Glu Leu

85 90 95

Glu Pro Val Ala Ala Thr Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala

100 105 110

Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser

115 120 125

Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu

130 135 140

Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala

145 150 155 160

Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro

165 170 175

Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe

180 185 190

Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val

195 200 205

Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys

210 215 220

Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser

225 230 235 240

Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser

245 250 255

Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val

260 265 270

Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr

275 280 285

Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Lys Thr Leu Ala Leu Lys

290 295 300

Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu

305 310 315 320

Asp Phe Gly Leu Ser Ser Pro Thr Ser Val

325 330

<210> 46

<211> 221

<212> PRT

<213> 酿酒酵母

<400> 46

Met Ser Ala Thr Glu Ser Ser Ser Ile Phe Thr Leu Ser His Asn Ser

1 5 10 15

Asn Leu Gln Asp Ile Leu Ala Ala Asn Ala Lys Trp Ala Ser Gln Met

20 25 30

Asn Asn Ile Gln Pro Thr Leu Phe Pro Asp His Asn Ala Lys Gly Gln

35 40 45

Ser Pro His Thr Leu Phe Ile Gly Cys Ser Asp Ser Arg Tyr Asn Glu

50 55 60

Asn Cys Leu Gly Val Leu Pro Gly Glu Val Phe Thr Trp Lys Asn Val

65 70 75 80

Ala Asn Ile Cys His Ser Glu Asp Leu Thr Leu Lys Ala Thr Leu Glu

85 90 95

Phe Ala Ile Ile Cys Leu Lys Val Asn Lys Val Ile Ile Cys Gly His

100 105 110

Thr Asp Cys Gly Gly Ile Lys Thr Cys Leu Thr Asn Gln Arg Glu Ala

115 120 125

Leu Pro Lys Val Asn Cys Ser His Leu Tyr Lys Tyr Leu Asp Asp Ile

130 135 140

Asp Thr Met Tyr His Glu Glu Ser Gln Asn Leu Ile His Leu Lys Thr

145 150 155 160

Gln Arg Glu Lys Ser His Tyr Leu Ser His Cys Asn Val Lys Arg Gln

165 170 175

Phe Asn Arg Ile Ile Glu Asn Pro Thr Val Gln Thr Ala Val Gln Asn

180 185 190

Gly Glu Leu Gln Val Tyr Gly Leu Leu Tyr Asn Val Glu Asp Gly Leu

195 200 205

Leu Gln Thr Val Ser Thr Tyr Thr Lys Val Thr Pro Lys

210 215 220

<210> 47

<211> 281

<212> PRT

<213> 白念珠菌(Candida albicans)

<400> 47

Met Gly Arg Glu Asn Ile Leu Lys Tyr Gln Leu Glu His Asp His Glu

1 5 10 15

Ser Asp Leu Val Thr Glu Lys Asp Gln Ser Leu Leu Leu Asp Asn Asn

20 25 30

Asn Asn Leu Asn Gly Met Asn Asn Thr Ile Lys Thr His Pro Val Arg

35 40 45

Val Ser Ser Gly Asn His Asn Asn Phe Pro Phe Thr Leu Ser Ser Glu

50 55 60

Ser Thr Leu Gln Asp Phe Leu Asn Asn Asn Lys Phe Phe Val Asp Ser

65 70 75 80

Ile Lys His Asn His Gly Asn Gln Ile Phe Asp Leu Asn Gly Gln Gly

85 90 95

Gln Ser Pro His Thr Leu Trp Ile Gly Cys Ser Asp Ser Arg Ala Gly

100 105 110

Asp Gln Cys Leu Ala Thr Leu Pro Gly Glu Ile Phe Val His Arg Asn

115 120 125

Ile Ala Asn Ile Val Asn Ala Asn Asp Ile Ser Ser Gln Gly Val Ile

130 135 140

Gln Phe Ala Ile Asp Val Leu Lys Val Lys Lys Ile Ile Val Cys Gly

145 150 155 160

His Thr Asp Cys Gly Gly Ile Trp Ala Ser Leu Ser Lys Lys Lys Ile

165 170 175

Gly Gly Val Leu Asp Leu Trp Leu Asn Pro Val Arg His Ile Arg Ala

180 185 190

Ala Asn Leu Lys Leu Leu Glu Glu Tyr Asn Gln Asp Pro Lys Leu Lys

195 200 205

Ala Lys Lys Leu Ala Glu Leu Asn Val Ile Ser Ser Val Thr Ala Leu

210 215 220

Lys Arg His Pro Ser Ala Ser Val Ala Leu Lys Lys Asn Glu Ile Glu

225 230 235 240

Val Trp Gly Met Leu Tyr Asp Val Ala Thr Gly Tyr Leu Ser Gln Val

245 250 255

Glu Ile Pro Gln Asp Glu Phe Glu Asp Leu Phe His Val His Asp Glu

260 265 270

His Asp Glu Glu Glu Tyr Asn Pro His

275 280

<210> 48

<211> 192

<212> PRT

<213> 牙龈卟啉单胞菌(Porphyromonas gingivalis)

<400> 48

Met Ala Gln Arg Glu Asn Ser Asp Tyr Leu Thr Thr Lys Met Ala Leu

1 5 10 15

Ile Gln Ser Val Arg Gly Phe Thr Pro Ile Ile Gly Glu Asp Thr Phe

20 25 30

Leu Ala Glu Asn Ala Thr Ile Val Gly Asp Val Val Met Gly Lys Gly

35 40 45

Cys Ser Val Trp Phe Asn Ala Val Leu Arg Gly Asp Val Asn Ser Ile

50 55 60

Arg Ile Gly Asp Asn Val Asn Ile Gln Asp Gly Ser Ile Leu His Thr

65 70 75 80

Leu Tyr Gln Lys Ser Thr Ile Glu Ile Gly Asp Asn Val Ser Val Gly

85 90 95

His Asn Val Val Ile His Gly Ala Lys Ile Cys Asp Tyr Ala Leu Ile

100 105 110

Gly Met Gly Ala Val Val Leu Asp His Val Val Val Gly Glu Gly Ala

115 120 125

Ile Val Ala Ala Gly Ser Val Val Leu Thr Gly Thr Gln Ile Glu Pro

130 135 140

Asn Ser Ile Tyr Ala Gly Ala Pro Ala Arg Phe Ile Lys Lys Val Asp

145 150 155 160

Pro Glu Gln Ser Arg Glu Met Asn Phe Arg Ile Ala His Asn Tyr Arg

165 170 175

Met Tyr Ala Ser Trp Phe Lys Asp Glu Ser Ser Glu Ile Asp Asn Pro

180 185 190

<210> 49

<211> 207

<212> PRT

<213> 结核分枝杆菌

<400> 49

Met Pro Asn Thr Asn Pro Val Ala Ala Trp Lys Ala Leu Lys Glu Gly

1 5 10 15

Asn Glu Arg Phe Val Ala Gly Arg Pro Gln His Pro Ser Gln Ser Val

20 25 30

Asp His Arg Ala Gly Leu Ala Ala Gly Gln Lys Pro Thr Ala Val Ile

35 40 45

Phe Gly Cys Ala Asp Ser Arg Val Ala Ala Glu Ile Ile Phe Asp Gln

50 55 60

Gly Leu Gly Asp Met Phe Val Val Arg Thr Ala Gly His Val Ile Asp

65 70 75 80

Ser Ala Val Leu Gly Ser Ile Glu Tyr Ala Val Thr Val Leu Asn Val

85 90 95

Pro Leu Ile Val Val Leu Gly His Asp Ser Cys Gly Ala Val Asn Ala

100 105 110

Ala Leu Ala Ala Ile Asn Asp Gly Thr Leu Pro Gly Gly Tyr Val Arg

115 120 125

Asp Val Val Glu Arg Val Ala Pro Ser Val Leu Leu Gly Arg Arg Asp

130 135 140

Gly Leu Ser Arg Val Asp Glu Phe Glu Gln Arg His Val His Glu Thr

145 150 155 160

Val Ala Ile Leu Met Ala Arg Ser Ser Ala Ile Ser Glu Arg Ile Ala

165 170 175

Gly Gly Ser Leu Ala Ile Val Gly Val Thr Tyr Gln Leu Asp Asp Gly

180 185 190

Arg Ala Val Leu Arg Asp His Ile Gly Asn Ile Gly Glu Glu Val

195 200 205

<210> 50

<211> 219

<212> PRT

<213> 大肠杆菌

<400> 50

Met Lys Glu Ile Ile Asp Gly Phe Leu Lys Phe Gln Arg Glu Ala Phe

1 5 10 15

Pro Lys Arg Glu Ala Leu Phe Lys Gln Leu Ala Thr Gln Gln Ser Pro

20 25 30

Arg Thr Leu Phe Ile Ser Cys Ser Asp Ser Arg Leu Val Pro Glu Leu

35 40 45

Val Thr Gln Arg Glu Pro Gly Asp Leu Phe Val Ile Arg Asn Ala Gly

50 55 60

Asn Ile Val Pro Ser Tyr Gly Pro Glu Pro Gly Gly Val Ser Ala Ser

65 70 75 80

Val Glu Tyr Ala Val Ala Ala Leu Arg Val Ser Asp Ile Val Ile Cys

85 90 95

Gly His Ser Asn Cys Gly Ala Met Thr Ala Ile Ala Ser Cys Gln Cys

100 105 110

Met Asp His Met Pro Ala Val Ser His Trp Leu Arg Tyr Ala Asp Ser

115 120 125

Ala Arg Val Val Asn Glu Ala Arg Pro His Ser Asp Leu Pro Ser Lys

130 135 140

Ala Ala Ala Met Val Arg Glu Asn Val Ile Ala Gln Leu Ala Asn Leu

145 150 155 160

Gln Thr His Pro Ser Val Arg Leu Ala Leu Glu Glu Gly Arg Ile Ala

165 170 175

Leu His Gly Trp Val Tyr Asp Ile Glu Ser Gly Ser Ile Ala Ala Phe

180 185 190

Asp Gly Ala Thr Arg Gln Phe Val Pro Leu Ala Ala Asn Pro Arg Val

195 200 205

Cys Ala Ile Pro Leu Arg Gln Pro Thr Ala Ala

210 215

<210> 51

<211> 220

<212> PRT

<213> 大肠杆菌

<400> 51

Met Lys Asp Ile Asp Thr Leu Ile Ser Asn Asn Ala Leu Trp Ser Lys

1 5 10 15

Met Leu Val Glu Glu Asp Pro Gly Phe Phe Glu Lys Leu Ala Gln Ala

20 25 30

Gln Lys Pro Arg Phe Leu Trp Ile Gly Cys Ser Asp Ser Arg Val Pro

35 40 45

Ala Glu Arg Leu Thr Gly Leu Glu Pro Gly Glu Leu Phe Val His Arg

50 55 60

Asn Val Ala Asn Leu Val Ile His Thr Asp Leu Asn Cys Leu Ser Val

65 70 75 80

Val Gln Tyr Ala Val Asp Val Leu Glu Val Glu His Ile Ile Ile Cys

85 90 95

Gly His Tyr Gly Cys Gly Gly Val Gln Ala Ala Val Glu Asn Pro Glu

100 105 110

Leu Gly Leu Ile Asn Asn Trp Leu Leu His Ile Arg Asp Ile Trp Phe

115 120 125

Lys His Ser Ser Leu Leu Gly Glu Met Pro Gln Glu Arg Arg Leu Asp

130 135 140

Thr Leu Cys Glu Leu Asn Val Met Glu Gln Val Tyr Asn Leu Gly His

145 150 155 160

Ser Thr Ile Met Gln Ser Ala Trp Lys Arg Gly Gln Lys Val Thr Ile

165 170 175

His Gly Trp Ala Tyr Gly Ile His Asp Gly Leu Leu Arg Asp Leu Asp

180 185 190

Val Thr Ala Thr Asn Arg Glu Thr Leu Glu Gln Arg Tyr Arg His Gly

195 200 205

Ile Ser Asn Leu Lys Leu Lys His Ala Asn His Lys

210 215 220

<210> 52

<211> 450

<212> PRT

<213> 共生梭菌(Clostridium symbiosum)

<400> 52

Met Ser Lys Tyr Val Asp Arg Val Ile Ala Glu Val Glu Lys Lys Tyr

1 5 10 15

Ala Asp Glu Pro Glu Phe Val Gln Thr Val Glu Glu Val Leu Ser Ser

20 25 30

Leu Gly Pro Val Val Asp Ala His Pro Glu Tyr Glu Glu Val Ala Leu

35 40 45

Leu Glu Arg Met Val Ile Pro Glu Arg Val Ile Glu Phe Arg Val Pro

50 55 60

Trp Glu Asp Asp Asn Gly Lys Val His Val Asn Thr Gly Tyr Arg Val

65 70 75 80

Gln Phe Asn Gly Ala Ile Gly Pro Tyr Lys Gly Gly Leu Arg Phe Ala

85 90 95

Pro Ser Val Asn Leu Ser Ile Met Lys Phe Leu Gly Phe Glu Gln Ala

100 105 110

Phe Lys Asp Ser Leu Thr Thr Leu Pro Met Gly Gly Ala Lys Gly Gly

115 120 125

Ser Asp Phe Asp Pro Asn Gly Lys Ser Asp Arg Glu Val Met Arg Phe

130 135 140

Cys Gln Ala Phe Met Thr Glu Leu Tyr Arg His Ile Gly Pro Asp Ile

145 150 155 160

Asp Val Pro Ala Gly Asp Leu Gly Val Gly Ala Arg Glu Ile Gly Tyr

165 170 175

Met Tyr Gly Gln Tyr Arg Lys Ile Val Gly Gly Phe Tyr Asn Gly Val

180 185 190

Leu Thr Gly Lys Ala Arg Ser Phe Gly Gly Ser Leu Val Arg Pro Glu

195 200 205

Ala Thr Gly Tyr Gly Ser Val Tyr Tyr Val Glu Ala Val Met Lys His

210 215 220

Glu Asn Asp Thr Leu Val Gly Lys Thr Val Ala Leu Ala Gly Phe Gly

225 230 235 240

Asn Val Ala Trp Gly Ala Ala Lys Lys Leu Ala Glu Leu Gly Ala Lys

245 250 255

Ala Val Thr Leu Ser Gly Pro Asp Gly Tyr Ile Tyr Asp Pro Glu Gly

260 265 270

Ile Thr Thr Glu Glu Lys Ile Asn Tyr Met Leu Glu Met Arg Ala Ser

275 280 285

Gly Arg Asn Lys Val Gln Asp Tyr Ala Asp Lys Phe Gly Val Gln Phe

290 295 300

Phe Pro Gly Glu Lys Pro Trp Gly Gln Lys Val Asp Ile Ile Met Pro

305 310 315 320

Cys Ala Thr Gln Asn Asp Val Asp Leu Glu Gln Ala Lys Lys Ile Val

325 330 335

Ala Asn Asn Ile Lys Tyr Tyr Ile Glu Val Ala Asn Met Pro Thr Thr

340 345 350

Asn Glu Ala Leu Arg Phe Leu Met Gln Gln Pro Asn Met Val Val Ala

355 360 365

Pro Ser Lys Ala Val Asn Ala Gly Gly Val Leu Val Ser Gly Phe Glu

370 375 380

Met Ser Gln Asn Ser Glu Arg Leu Ser Trp Thr Ala Glu Glu Val Asp

385 390 395 400

Ser Lys Leu His Gln Val Met Thr Asp Ile His Asp Gly Ser Ala Ala

405 410 415

Ala Ala Glu Arg Tyr Gly Leu Gly Tyr Asn Leu Val Ala Gly Ala Asn

420 425 430

Ile Val Gly Phe Gln Lys Ile Ala Asp Ala Met Met Ala Gln Gly Ile

435 440 445

Ala Trp

450

<210> 53

<211> 447

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 53

Met Thr Val Asp Glu Gln Val Ser Asn Tyr Tyr Asp Met Leu Leu Lys

1 5 10 15

Arg Asn Ala Gly Glu Pro Glu Phe His Gln Ala Val Ala Glu Val Leu

20 25 30

Glu Ser Leu Lys Ile Val Leu Glu Lys Asp Pro His Tyr Ala Asp Tyr

35 40 45

Gly Leu Ile Gln Arg Leu Cys Glu Pro Glu Arg Gln Leu Ile Phe Arg

50 55 60

Val Pro Trp Val Asp Asp Gln Gly Gln Val His Val Asn Arg Gly Phe

65 70 75 80

Arg Val Gln Phe Asn Ser Ala Leu Gly Pro Tyr Lys Gly Gly Leu Arg

85 90 95

Phe His Pro Ser Val Asn Leu Gly Ile Val Lys Phe Leu Gly Phe Glu

100 105 110

Gln Ile Phe Lys Asn Ser Leu Thr Gly Leu Pro Ile Gly Gly Gly Lys

115 120 125

Gly Gly Ser Asp Phe Asp Pro Lys Gly Lys Ser Asp Leu Glu Ile Met

130 135 140

Arg Phe Cys Gln Ser Phe Met Thr Glu Leu His Arg His Ile Gly Glu

145 150 155 160

Tyr Arg Asp Val Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Ile

165 170 175

Gly Tyr Leu Phe Gly His Tyr Arg Arg Met Ala Asn Gln His Glu Ser

180 185 190

Gly Val Leu Thr Gly Lys Gly Leu Thr Trp Gly Gly Ser Leu Val Arg

195 200 205

Thr Glu Ala Thr Gly Tyr Gly Cys Val Tyr Phe Val Ser Glu Met Ile

210 215 220

Lys Ala Lys Gly Glu Ser Ile Ser Gly Gln Lys Ile Ile Val Ser Gly

225 230 235 240

Ser Gly Asn Val Ala Thr Tyr Ala Ile Glu Lys Ala Gln Glu Leu Gly

245 250 255

Ala Thr Val Ile Gly Phe Ser Asp Ser Ser Gly Trp Val His Thr Pro

260 265 270

Asn Gly Val Asp Val Ala Lys Leu Arg Glu Ile Lys Glu Val Arg Arg

275 280 285

Ala Arg Val Ser Val Tyr Ala Asp Glu Val Glu Gly Ala Thr Tyr His

290 295 300

Thr Asp Gly Ser Ile Trp Asp Leu Lys Cys Asp Ile Ala Leu Pro Cys

305 310 315 320

Ala Thr Gln Asn Glu Leu Asn Gly Glu Asn Ala Lys Thr Leu Ala Asp

325 330 335

Asn Gly Cys Arg Phe Val Ala Glu Gly Ala Asn Met Pro Ser Thr Pro

340 345 350

Glu Ala Val Glu Val Phe Arg Glu Arg Asp Ile Arg Phe Gly Pro Gly

355 360 365

Lys Ala Ala Asn Ala Gly Gly Val Ala Thr Ser Ala Leu Glu Met Gln

370 375 380

Gln Asn Ala Ser Arg Asp Ser Trp Ser Phe Glu Tyr Thr Asp Glu Arg

385 390 395 400

Leu Gln Val Ile Met Lys Asn Ile Phe Lys Thr Cys Ala Glu Thr Ala

405 410 415

Ala Glu Tyr Gly His Glu Asn Asp Tyr Val Val Gly Ala Asn Ile Ala

420 425 430

Gly Phe Lys Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Ile

435 440 445

<210> 54

<211> 421

<212> PRT

<213> 不解糖嗜胨菌(Peptoniphilus asaccharolyticus)

<400> 54

Met Thr Asp Thr Leu Asn Pro Leu Val Ala Ala Gln Glu Lys Val Arg

1 5 10 15

Ile Ala Cys Glu Lys Leu Gly Cys Asp Pro Ala Val Tyr Glu Leu Leu

20 25 30

Lys Glu Pro Gln Arg Val Ile Glu Ile Ser Ile Pro Val Lys Met Asp

35 40 45

Asp Gly Thr Val Lys Val Phe Lys Gly Trp Arg Ser Ala His Ser Ser

50 55 60

Ala Val Gly Pro Ser Lys Gly Gly Val Arg Phe His Pro Asn Val Asn

65 70 75 80

Met Asp Glu Val Lys Ala Leu Ser Leu Trp Met Thr Phe Lys Gly Gly

85 90 95

Ala Leu Gly Leu Pro Tyr Gly Gly Gly Lys Gly Gly Ile Cys Val Asp

100 105 110

Pro Ala Glu Leu Ser Glu Arg Glu Leu Glu Gln Leu Ser Arg Gly Trp

115 120 125

Val Arg Gly Leu Tyr Lys Tyr Leu Gly Asp Arg Ile Asp Ile Pro Ala

130 135 140

Pro Asp Val Asn Thr Asn Gly Gln Ile Met Ser Trp Phe Val Asp Glu

145 150 155 160

Tyr Val Lys Leu Asn Gly Glu Arg Met Asp Ile Gly Thr Phe Thr Gly

165 170 175

Lys Pro Val Ala Phe Gly Gly Ser Glu Gly Arg Asn Glu Ala Thr Gly

180 185 190

Phe Gly Val Ala Val Val Val Arg Glu Ser Ala Lys Arg Phe Gly Ile

195 200 205

Lys Met Glu Asp Ala Lys Ile Ala Val Gln Gly Phe Gly Asn Val Gly

210 215 220

Thr Phe Thr Val Lys Asn Ile Glu Arg Gln Gly Gly Lys Val Cys Ala

225 230 235 240

Ile Ala Glu Trp Asp Arg Asn Glu Gly Asn Tyr Ala Leu Tyr Asn Glu

245 250 255

Asn Gly Ile Asp Phe Lys Glu Leu Leu Ala Tyr Lys Glu Ala Asn Lys

260 265 270

Thr Leu Ile Gly Phe Pro Gly Ala Glu Arg Ile Thr Asp Glu Glu Phe

275 280 285

Trp Thr Lys Glu Tyr Asp Ile Ile Val Pro Ala Ala Leu Glu Asn Val

290 295 300

Ile Thr Gly Glu Arg Ala Lys Thr Ile Asn Ala Lys Leu Val Cys Glu

305 310 315 320

Ala Ala Asn Gly Pro Thr Thr Pro Glu Gly Asp Lys Val Leu Thr Glu

325 330 335

Arg Gly Ile Asn Leu Thr Pro Asp Ile Leu Thr Asn Ser Gly Gly Val

340 345 350

Leu Val Ser Tyr Tyr Glu Trp Val Gln Asn Gln Tyr Gly Tyr Tyr Trp

355 360 365

Thr Glu Ala Glu Val Glu Glu Lys Gln Glu Ala Asp Met Met Lys Ala

370 375 380

Ile Lys Gly Val Phe Ala Val Ala Asp Glu Tyr Asn Val Thr Leu Arg

385 390 395 400

Glu Ala Val Tyr Met Tyr Ala Ile Lys Ser Ile Asp Val Ala Met Lys

405 410 415

Leu Arg Gly Trp Tyr

420

相关技术
  • 生产天冬氨酸和β-丙氨酸的重组宿主细胞和方法
  • 生产L-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法
技术分类

06120112979448