掌桥专利:专业的专利平台
掌桥专利
首页

嗜氢菌属细菌转化体

文献发布时间:2023-06-19 09:41:38



技术领域

本发明涉及具有异丁醇、乙醇或丙氨酸生成能力的嗜氢菌(Hydrogenophilus)属细菌转化体,以及利用所述转化体制造异丁醇、乙醇或丙氨酸的方法。

背景技术

2015年通过的《巴黎协定》规定,应迅速减少全球温室气体排放量。根据巴黎协定,日本制定了到2030年将温室气体例如二氧化碳和甲烷的排放量与2013年相比减少26%的目标。

全世界的化学品制造大部分依赖石油原料,并存在温室气体排放量增加的问题。因此,在化学品制造中需要摆脱对石油的依赖,并且各国都在积极进行从生物质制造绿色化学品的生物炼制的研究和开发。但是,将生物质转化为用作微生物发酵原料的糖类需要复杂的过程,存在成本高的问题。

作为摆脱石油依赖的研究的一部分,气体例如二氧化碳、甲烷和一氧化碳作为可持续性程度较高的碳源引起了关注,而使用利用这些气体的微生物制造有价值的化学品和生物燃料的技术正在成为关心的课题。特别是,高度设想了已知对变暖的贡献很大的二氧化碳的固定和有效利用。

乙醇、正丁醇和异丁醇已常规用作生物燃料,并需要所述化合物的有效制造方法。具有4个碳原子的丁醇的一些优点是:燃料效率比具有2个碳原子的乙醇更高;与汽油(4至10个碳原子)或柴油发动机容易混合,使得能够原样使用现有的发动机和给油设备;以及由于丁醇对空气中的水分仅有少量吸收,因此不易腐蚀设备。特别是,现有针对异丁醇作为drop-in型生物喷气燃料的原料的ASTM认证标准。作为减少航空领域的二氧化碳排放的努力,已经进行了异丁醇实际应用的技术开发。

酵母和一些细菌生成少量的异丁醇。异丁醇是从必需氨基酸缬氨酸生物合成途径中的代谢中间体2-酮异戊酸生成的。从活体内的重要代谢产物丙酮酸通过5个步骤生成异丁醇。即,通过乙酰羟酸合酶的催化作用由丙酮酸生成乙酰乳酸,然后通过乙酰羟酸异构还原酶的催化作用由乙酰乳酸生成2,3-二羟基异戊酸,然后通过二羟酸脱水酶的催化作用由2,3-二羟基异戊酸生成2-酮异戊酸,然后通过2-酮酸脱羧酶(以下可称为“KDC”)(EC4.1.1.1)的催化作用由2-酮异戊酸生成异丁醛,最后,通过醇脱氢酶(以下可称为“ADH”)(EC 1.1.1.1)的催化作用由异丁醛生成异丁醇。

作为利用重组微生物制造异丁醇的技术,专利文献1公开了利用谷氨酸棒状杆菌(Corynebacterium glutamicum)转化体制造异丁醇的方法。该转化体具有分别催化构成从丙酮酸到异丁醇的代谢途径的5个步骤的上述5种酶的外源基因。乳酸乳球菌(Lactococcuslactis)kivD基因或表皮葡萄球菌(Staphylococcus epidermidis)ipd基因用作2-酮酸脱羧酶基因,酿酒酵母(Saccharomyces cerevisiae)adh2基因、恶臭假单胞菌(Pseudomonasputida)adh基因或大肠杆菌(Escherichia coli)adhP基因用作醇脱氢酶基因。

另外,使用仅导入2-酮酸脱羧酶基因和醇脱氢酶基因的转化体来生成异丁醇的各种方法是已知的。

非专利文献1教导了通过将乳酸乳球菌kivD基因和酿酒酵母adh2基因导入大肠杆菌中获得的转化体的用途。

非专利文献2教导了通过将乳酸乳球菌kivD基因和乳酸乳球菌adhA基因导入大肠杆菌中获得的转化体的用途。

非专利文献3教导了通过将乳酸乳球菌kivD基因和酿酒酵母adh2基因导入枯草芽孢杆菌(Bacillus subtilis)中获得的转化体的用途。

非专利文献4教导了通过将乳酸乳球菌kivD基因和富养劳氏菌(Ralstoniaeutropha)adh基因导入奥奈达希瓦氏菌(Shewanella oneidensis)中获得的转化体的用途。

非专利文献5教导了通过将乳酸乳球菌kivD基因和大肠杆菌yqhD基因导入蓝细菌细长聚球藻(Synechococcus elongatus)中获得的转化体的用途。

非专利文献6教导了通过将乳酸乳球菌kivD基因和富养劳氏菌adh基因的过表达质粒导入富养劳氏菌中获得的转化体的用途。

非专利文献7教导了通过将乳酸乳球菌kivD基因和热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)adhA基因的过表达质粒导入热葡糖苷酶地芽孢杆菌中获得的转化体的用途。

除使用乳酸乳球菌kivD基因的方法外,将枯草芽孢杆菌alsS基因、热葡糖苷酶地芽孢杆菌Geoth_3495基因、嗜热脱氮地芽孢杆菌(Geobacillus thermodenitrificans)Gtng_0348基因、肺炎克雷伯氏菌(Klebsiella pneumoniae)ipdC基因或表皮葡萄球菌(Staphylococcus epidermidis)ipdC基因用作2-酮酸脱羧酶基因的方法也是已知的。然而,与后5个基因相比,乳酸乳球菌kivD基因在宿主内通常产生更高的酶活性,因此,常规上主要使用乳酸乳球菌kivD基因。

几乎所有上述方法都是利用糖作为碳源生成异丁醇的方法,而不是利用二氧化碳作为碳源生成异丁醇的方法。

非专利文献5的方法使用蓝细菌作为宿主,蓝细菌是一种光合细菌。该方法利用碳酸氢钠作为碳源制造异丁醇。蓝细菌具有比植物更高的二氧化碳固定能力。但是,由于蓝细菌的二氧化碳固定能力不足,利用蓝细菌作为宿主的方法尚未作为制造异丁醇的工业方法投入实际应用。

常规上,许多用于燃料、化工原料、饮料等的乙醇是通过利用微生物来发酵源自于各种生物质资源的淀粉或糖类而制造的。

作为利用重组微生物生产乙醇的方法,使用通过导入催化使丙酮酸脱羧生成乙醛的反应的丙酮酸脱羧酶(以下可称为“PDC”)(EC4.1.1.1)基因、和/或导入催化从乙醛到乙醇的反应的醇脱氢酶(以下称为“ADH”)(EC 1.1.1.1)基因而获得的转化体的方法,是已知的。

许多常规方法使用通过导入产生PDC的基因和产生ADH的基因而获得的转化体,这两种基因均源自于运动发酵单胞菌(Zymomonas mobilis)。例如,专利文献2教导了通过将源自于运动发酵单胞菌的pdc基因和adhB基因导入肠细菌例如大肠杆菌中获得的转化体有效生成乙醇。

作为利用其他细菌的PDC和ADH基因的方法,非专利文献8公开了使用通过将胃八叠球菌(Sarcina ventriculi)pdc基因和短乳杆菌(Lactobacillus brevis)adh基因导入大肠杆菌中获得的转化体来制造乙醇的方法。

另外,非专利文献9公开了使用通过将胃八叠球菌pdc基因和嗜热脂肪地芽孢杆菌(Geobacillus stearotherophilophilus)adh基因导入巨大芽孢杆菌(Bacillusmegaterium)中获得的转化体来制造乙醇的方法。

除上述丙酮酸脱羧酶基因外,还已知可利用氧化葡糖杆菌(Gluconobacteroxydans)、重氮营养葡糖醋杆菌(Gluconoacetobacter diazotrophicus)、巴氏醋杆菌(Acetobacter pasteurianus)、丙酮丁醇梭菌(Clostridium acetobutylicum)和棕榈发酵细菌(Zymobacter palmae)的丙酮酸脱羧酶基因。此外,除上述醇脱氢酶基因外,还已知利用了多种微生物物种的醇脱氢酶基因。

然而,那些文献中记载的方法是利用糖作为碳源生成乙醇的方法,而不是利用二氧化碳作为碳源生成乙醇的方法。

作为利用二氧化碳作为碳源生成乙醇的方法,使用光合细菌蓝细菌作为宿主的方法是已知的。例如,非专利文献10公开了使用通过将源自于运动发酵单胞菌的pdc和adhB基因导入聚球藻(Synechococcus)属细菌中获得的转化体来制造乙醇的方法。

另外,非专利文献11公开了使用通过将运动发酵单胞菌pdc基因和集胞藻(Synechocystis)属细菌的NADPH依赖性ADH基因(slr1192)导入聚球藻属细菌中获得的转化体来制造乙醇的方法。

如上面提到的,蓝细菌的二氧化碳固定能力不足以用于工业利用,因此,尚没有使用蓝细菌作为宿主的方法作为乙醇工业制造方法投入实际应用。

此外,作为使用重组微生物制造乙醇的方法,使用通过导入催化从乙酰辅酶A经乙醛生成乙醇的反应的醛-醇脱氢酶基因而获得的转化体的方法也是已知的。

从乙酰辅酶A经乙醛生成乙醇的反应对于在厌氧条件下生产乙醇很重要,因此,当使用在厌氧条件下生长的微生物作为宿主生产醇时,通常使用醛-醇脱氢酶基因。

例如,非专利文献12教导了使用通过将一种醛-醇脱氢酶基因——adehE基因导入在厌氧条件下生长的激烈火球菌(Pyrococcus furiosus)中获得的转化体来制造乙醇的方法。

另外,非专利文献13教导了使用通过将adhE基因导入在厌氧条件下生长的Caldicellulosiruptor bescii中获得的转化体来制造乙醇的方法。

然而,在那些文献中记载的这些方法是利用糖作为碳源生成乙醇的方法,而不是利用二氧化碳作为碳源生成乙醇的方法。

丙氨酸是一种作为医药、食品或化学工业原料的重要的氨基酸,并且对丙氨酸的需求在不断增加。丙氨酸脱氢酶(EC 1.4.1.1)已用于制造丙氨酸。该酶催化由丙酮酸、氨和NADH生成丙氨酸的反应。

作为利用微生物制造丙氨酸的技术,非专利文献14教导了使用通过将嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(现在称为嗜热脂肪地芽孢杆菌)的丙氨酸脱氢酶基因导入大肠杆菌中获得的转化体来生成丙氨酸的方法。

专利文献3教导了使用通过将节杆菌(Arthrobacter)属细菌的丙氨酸脱氢酶基因导入埃希氏菌(Escherichia)属、棒状杆菌(Corynebacterium)属或短杆菌(Brevibacterium)属的细菌中获得的转化体生成丙氨酸的方法。

非专利文献15教导了使用通过将球形芽孢杆菌(Bacillus sphaericus)(现在称为球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus))的丙氨酸脱氢酶基因导入大肠杆菌中获得的转化体来生成丙氨酸的方法。

非专利文献16教导了使用通过将球形芽孢杆菌(现在称为球形赖氨酸芽孢杆菌)的丙氨酸脱氢酶基因导入运动发酵单胞菌中获得的转化体来生成丙氨酸的方法。

非专利文献17教导了使用通过将球形芽孢杆菌(现在称为球形赖氨酸芽孢杆菌)的丙氨酸脱氢酶基因导入乳酸乳球菌中获得的转化体来生成丙氨酸的方法。

非专利文献18教导了使用通过将球形芽孢杆菌(现在称为球形赖氨酸芽孢杆菌)的丙氨酸脱氢酶基因导入谷氨酸棒状杆菌中获得的转化体来生成丙氨酸的方法。

然而,所有上述方法都是利用糖作为碳源生成丙氨酸的方法,而不是利用二氧化碳作为碳源生成丙氨酸的方法。

现有技术文献

专利文献

[专利文献1]WO/2010/113832

[专利文献2]WO/2001/96573

[专利文献3]JP1994(Heisei 6)-277082A

非专利文献

[非专利文献1]合成支链高级醇作为生物燃料的非发酵途径(Non-fermentativepathways for synthesis of branched-chain higher alcohols as biofuels).AtsumiS,Hanai T,Liao JC.Nature(2008)451:86-89

[非专利文献2]通过比较三种醛还原酶/醇脱氢酶基因在大肠杆菌中使异丁醇生物合成途径工程化(Engineering the isobutanol biosynthetic pathway inEscherichia coli by comparison of three aldehyde reductase/alcoholdehydrogenase genes).Atsumi S,Wu TY,Eckl EM,Hawkins SD,Buelter T,LiaoJC.Appl.Microbiol.Biotechnol.(2010)85:651-657

[非专利文献3]通过异源Ehrlich途径构建和生物合成的2-酮异戊酸前体途径过表达来工程化枯草芽孢杆菌用于异丁醇生成(Engineering Bacillus subtilis forisobutanol production by heterologous Ehrlich pathway construction and thebiosynthetic 2-ketoisovalerate precursor pathway overexpression).Li S,Wen J,Jia X.Appl.Microbiol.Biotechnol.(2011)91:577-589

[非专利文献4]从工程化的奥奈达希瓦氏菌MR-1生成异丁醇(Isobutanolproduction from an engineered Shewanella oneidensis MR-1).Jeon JM,Park H,SeoHM,Kim JH,Bhatia SK,Sathiyanarayanan G,Song HS,Park SH,Choi KY,Sang BI,YangYH.Bioprocess Biosyst.Eng.(2015)38:2147-2154

[非专利文献5]二氧化碳直接光合再循环成为异丁醛(Direct photosyntheticrecycling of carbon dioxide to isobutyraldehyde).Atsumi S,Higashide W,LiaoJC.Nat.Biotechnol.(2009)27:1177-1180

[非专利文献6]在工程化的富养劳氏菌中生成支链醇的研究(Studies on theproduction of branched-chain alcohols in engineered Ralstonia eutropha).Lu J,Brigham CJ,Gai CS,Sinskey AJ.Appl.Microbiol.Biotechnol.(2012)96:283-297

[非专利文献7]在升高的温度下在嗜热的热葡糖苷酶地芽孢杆菌中的异丁醇生成(Isobutanol production at elevated temperatures in thermophilic Geobacillusthermoglucosidasius).Lin PP,Rabe KS,Takasumi JL,Kadisch M,Arnold FH,LiaoJC.Metab.Eng.(2014)24:1-8

[非专利文献8]丙酮酸脱羧酶和醇脱氢酶基因在短乳杆菌中的共表达(Coexpression of pyruvate decarboxylase and alcohol dehydrogenase genes inLactobacillus brevis).Liu S,Dien BS,Nichols NN,Bischoff KM,Hughes SR,CottaMA.FEMS Microbiol.Lett.(2007)274:291-297

[非专利文献9]革兰氏阳性菌中乙醇生成操纵子的构建和表达(Constructionand expression of an ethanol production operon in Gram-positive bacteria).Talarico LA,Gil MA,Yomano LP,Ingram LO,Maupin-Furlow JA.Microbiology(2005)151:4023-4031

[非专利文献10]通过蓝细菌中的基因工程合成乙醇(Ethanol synthesis bygenetic engineering in cyanobacteria).Deng MD,ColemanJR.Appl.Environ.Microbiol.(1999)65:523-528

[非专利文献11]用于表征和了解蓝细菌细胞工厂中乙醇合成途径的组合策略(Combinatory strategy for characterizing and understanding the ethanolsynthesis pathway in cyanobacteria cell factories).Luan G,Qi Y,Wang M,Li Z,Duan Y,Tan X,Lu X,Biotechnol.Biofuels(2015)8:184

[非专利文献12]通过超嗜热古菌激烈火球菌表达细菌双功能醇脱氢酶生成乙醇(Ethanol production by the hyperthermophilic archaeon Pyrococcus furiosus byexpression of bacterial bifunctional alcohol dehydrogenases).Keller MW,Lipscomb GL,Nguyen DM,Crowley AT,Schut GJ,Scott I,Kelly RM,AdamsMWW.Microb.Biotechnol.(2017)10:1535-1545

[非专利文献13]由工程化的Caldicellulosiruptor bescii在75℃下通过联合生物加工生成纤维素乙醇(Cellulosic ethanol production via consolidatedbioprocessing at 75℃ by engineered Caldicellulosiruptor bescii).Chung D,ChaM,Snyder EN,Elkins JG,Guss AM,Westpheling J.Biotechnol.Biofuels(2015)8:163

[非专利文献14]在表达丙氨酸脱氢酶的大肠杆菌的H+-ATP酶和乳酸脱氢酶缺陷型突变体中的丙氨酸生成(Alanine production in an H+-ATPase-and lactatedehydrogenase-defective mutant of Escherichia coli expressing alaninedehydrogenase).Wada M,Narita K,Yokota A.Appl.Microbiol.Biotechnol.(2007)76:819-825

[非专利文献15]表达球形芽孢杆菌alaD基因的大肠杆菌aceF ldhA突变体有氧生成丙氨酸(Aerobic production of alanine by Escherichia coli aceF ldhA mutantsexpressing the Bacillus sphaericus alaD gene).Lee M,Smith GM,Eiteman MA,Altman E.Appl.Microbiol.Biotechnol.(2004)65:56-60

[非专利文献16]运动发酵单胞菌中L-丙氨酸脱氢酶基因的表达和L-丙氨酸的分泌(Expression of an L-alanine dehydrogenase gene in Zymomonas mobilis andexcretion of L-alanine).Uhlenbusch I,Sahm H,SprengerGA.Appl.Environ.Microbiol.(1991)57:1360-1366

[非专利文献17]通过代谢工程将乳酸乳球菌从高乳酸发酵转化为高丙氨酸发酵(Conversion of Lactococcus lactis from homolactic to homoalanine fermentationthrough metabolic engineering).Hols P,Kleerebezem M,Schanck AN,Ferain T,Hugenholtz J,Delcour J,de Vos WM.Nat.Biotechnol.(1999)17:588-592

[非专利文献18]谷氨酸棒状杆菌的糖代谢工程化以在缺氧条件下生成氨基酸L-丙氨酸(Engineering of sugar metabolism of Corynebacterium glutamicum forproduction of amino acid L-alanineunder oxygen deprivation).Jojima T,Fujii M,Mori E,Inui M,Yukawa H.Appl.Microbiol.Biotechnol.(2010)87:159-165

发明内容

发明要解决的问题

本发明的第一个目的是提供能够利用二氧化碳作为唯一碳源来有效制造异丁醇的嗜氢菌属细菌转化体、使用该转化体有效制造异丁醇的方法、以及能够使嗜氢菌属细菌高效制造异丁醇的基因。

本发明的第二个目的是提供能够利用二氧化碳作为唯一碳源来有效制造乙醇的嗜氢菌属细菌转化体、以及使用该转化体有效制造乙醇的方法。

本发明的第三个目的是提供能够利用二氧化碳作为唯一碳源来有效制造丙氨酸的嗜氢菌属细菌转化体、使用该转化体有效制造丙氨酸的方法、以及能够使嗜氢菌属细菌高效制造丙氨酸的基因。

解决问题的手段

为了实现上述目的,本发明的发明人进行了深入研究,并且得出了以下发现。

嗜氢菌属细菌是利用氢能从二氧化碳生成有机物质进行生长的氢氧化细菌。氢氧化细菌的生长速度通常极为缓慢,然而,嗜氢菌属细菌的生长速度快,并且它们的二氧化碳固定能力明显高于植物和光合细菌。嗜氢菌属细菌原本不生成异丁醇或乙醇,因此,需要导入催化这些化合物生成反应的酶的基因,从而为该细菌提供生成这些化合物的能力。此外,嗜氢菌属细菌生成丙氨酸,然而,为了使它们具有工业规模的丙氨酸生成能力,需要导入催化丙氨酸生成反应的酶的基因。

然而,当使用在嗜氢菌属细菌内起作用的载体将具有天然碱基序列的异源基因导入该细菌中时,往往不产生或不能充分产生功能蛋白质。

(i)嗜氢菌属细菌原本不生成异丁醇,并且没有2-酮酸脱羧酶基因。即使在将乳酸乳球菌kivD基因、枯草芽孢杆菌alsS基因、热葡糖苷酶地芽孢杆菌Geoth_3495基因、嗜热脱氮地芽孢杆菌Gtng_0348基因或肺炎克雷伯氏菌ipdC基因作为2-酮酸脱羧酶导入到嗜氢菌属细菌中时,它们在嗜氢菌属细菌内不起作用。特别地,乳酸乳球菌kivD基因在各种宿主内起作用并带来高活性,因此经常被用于异丁醇生成方法中,然而,它在嗜氢菌属细菌内不起作用。因此,当使用在细菌内起作用的载体将异源基因导入嗜氢菌属细菌中时,往往不产生或不能充分产生功能蛋白质。

关于这一点,本发明的发明人已积累了关于源自于多种微生物的基因在嗜氢菌属的细菌中是否表达的数据。通过进一步推进这种信息积累并将其系统化,对乳酸乳球菌kivD基因的密码子使用进行了优化,使其与嗜氢菌属细菌的密码子使用频率相符。结果,本发明的发明人通过将由SEQ ID NO:1的碱基序列组成的密码子优化的kivD基因导入嗜氢菌属细菌中,成功地产生了高活性的2-酮酸脱羧酶。

(ii)嗜氢菌属细菌原本不生成异丁醇,并且没有醇脱氢酶基因。

然而,当将异种微生物的醇脱氢酶基因导入到嗜氢菌属细菌中时,该基因在嗜氢菌属细菌中起作用并产生高活性的醇脱氢酶。特别地,当将肺炎克雷伯氏菌adhP基因、热小链地芽孢杆菌(Geobacillus thermocatenulatus)adhP基因、或热葡糖苷酶地芽孢杆菌adhA或adhP基因导入嗜氢菌属细菌中时,产生活性特别高的醇脱氢酶。

(iii)通过将上面(i)中所述的密码子优化的2-酮酸脱羧酶基因、和醇脱氢酶基因导入嗜氢菌属细菌中获得的转化体,利用二氧化碳作为唯一碳源有效地生成异丁醇。

(i)嗜氢菌属细菌原本不生成乙醇,并且没有丙酮酸脱羧酶基因。即使当将运动发酵单胞菌、棕榈发酵细菌或巴氏醋杆菌(Acetobacter pasteurianus)的据报道会生成乙醇的pdc基因作为丙酮酸脱羧酶基因导入嗜氢菌属细菌中时,该基因在嗜氢菌属细菌中也不起作用。

另一方面,氧化葡糖杆菌pdc基因在嗜氢菌属细菌内起作用,并产生高活性的丙酮酸脱羧酶。

(ii)嗜氢菌属细菌原本不生成乙醇,并且没有醇脱氢酶基因。

然而,当将异种微生物的醇脱氢酶基因导入嗜氢菌属细菌中时,该基因在嗜氢菌属细菌内起作用,并产生高活性的醇脱氢酶。特别地,当将肺炎克雷伯氏菌adhP基因、热小链地芽孢杆菌adhP基因、或热葡糖苷酶地芽孢杆菌adhA或adhP基因导入嗜氢菌属细菌中时,产生活性特别高的醇脱氢酶。

(iii)通过将氧化葡糖杆菌pdc基因和醇脱氢酶基因导入嗜氢菌属细菌中获得的转化体,利用二氧化碳作为唯一碳源有效地生成乙醇。

(i)嗜氢菌属细菌原本不生成乙醇,并且没有醛-醇脱氢酶基因。

然而,通过将异种微生物的醛-醇脱氢酶基因引入嗜氢菌属细菌中,该基因在嗜氢菌属细菌内起作用,并产生高活性的醛-醇脱氢酶。特别地,当将大肠杆菌或热纤梭菌(Clostridium thermocellum)的adhE基因导入嗜氢菌属细菌中时,产生活性特别高的醛-醇脱氢酶。结果,所得的转化体有效地生成乙醇。

(ii)醛-醇脱氢酶活性在需氧条件下受到抑制。然而,大肠杆菌的醛-醇脱氢酶的568位Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的突变型醛-醇脱氢酶,和热纤梭菌的醛-醇脱氢酶的575位Asp被Asn取代的突变型醛-醇脱氢酶,在需氧条件下表现出活性。分别导入了编码上述突变型醛-醇脱氢酶的各突变型adhE基因adhE(E568K、E568A、E568L、E568N、E568G、E568S、E568R和E568H)和adhE(D575N)的嗜氢菌属细菌,在需氧条件下产生高活性的醛-醇脱氢酶。

嗜氢菌属细菌不能在厌氧条件下生长,因此需要在需氧条件下利用嗜氢菌属细菌生产物质。在这方面,通过导入这些突变型adhE基因获得的嗜氢菌属细菌转化体可以利用二氧化碳作为唯一碳源,在需氧条件下更加有效地生成乙醇。

(i)嗜氢菌属的细菌生成生存必要量的丙氨酸,然而,它们不能生成可工业利用的丙氨酸量。当将异种微生物的丙氨酸脱氢酶基因导入嗜氢菌属细菌中时,该基因在嗜氢菌属细菌内起作用,并产生高活性的丙氨酸脱氢酶,因此,所得的转化体利用二氧化碳作为唯一的碳源有效地生成丙氨酸。特别地,当将嗜热脂肪地芽孢杆菌的alaD1或alaD2基因、或嗜热栖热菌(Thermus thermophilus)的alaD1或alaD2基因导入嗜氢菌属细菌中时,产生活性特别高的丙氨酸脱氢酶。

(ii)在丙氨酸脱氢酶的N末端添加麦芽糖结合蛋白的N末端部分的氨基酸序列所得的修饰的丙氨酸脱氢酶的编码基因,与编码没有添加该氨基酸序列的丙氨酸脱氢酶的基因相比,在嗜氢菌属细菌中产生更高的酶活性表达。结果,已导入该修饰的丙氨酸脱氢酶基因的嗜氢菌属细菌转化体,利用二氧化碳作为唯一的碳源,更加有效地生成丙氨酸。

本发明基于以上发现完成,并提供了如下所述的转化体和化学品制造方法。

项1.下述(a1)、(a2)或(a3)的DNA:

(a1)由SEQ ID NO:1的碱基序列组成的DNA;

(a2)由与SEQ ID NO:1具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有2-酮酸脱羧酶活性的多肽;

(a3)在严格条件下与由SEQ ID NO:1的互补碱基序列组成的DNA杂交并且编码具有2-酮酸脱羧酶活性的多肽的DNA。

项2.一种转化体,其通过将(a)根据项1所述的DNA和(b)醇脱氢酶基因导入嗜氢菌属细菌中获得。

项3.根据项2所述的转化体,其中所述醇脱氢酶基因(b)是下述(b1)、(b2)、(b3)、(b4)、(b5)或(b6)的DNA:

(b1)由SEQ ID NO:2、3、4或5的碱基序列组成的DNA;

(b2)由与SEQ ID NO:2、3、4或5具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有醇脱氢酶活性的多肽;

(b3)在严格条件下与由SEQ ID NO:2、3、4或5的互补碱基序列组成的DNA杂交并且编码具有醇脱氢酶活性的多肽的DNA;

(b4)由SEQ ID NO:6、7、8或9的氨基酸序列组成的多肽的编码DNA;

(b5)由与SEQ ID NO:6、7、8或9具有90%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性;

(b6)由在SEQ ID NO:6、7、8或9的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性。

项4.根据项2或3所述的转化体,其中所述嗜氢菌属细菌是Hydrogenophilusthermoluteolus。

项5.一种制造异丁醇的方法,所述方法包括在使用二氧化碳作为基本上唯一碳源的同时,培养根据项2至4中任一项所述的转化体的步骤。

项6.一种转化体,其通过将(c)下述(c1)、(c2)、(c3)、(c4)、(c5)或(c6)的丙酮酸脱羧酶基因和(b)醇脱氢酶基因导入嗜氢菌属细菌中获得:

(c1)由SEQ ID NO:10的碱基序列组成的DNA;

(c2)由与SEQ ID NO:10具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有丙酮酸脱羧酶活性的多肽;

(c3)在严格条件下与由SEQ ID NO:10的互补碱基序列组成的DNA杂交并且编码具有丙酮酸脱羧酶活性的多肽的DNA;

(c4)由SEQ ID NO:11的氨基酸序列组成的多肽的编码DNA;

(c5)由与SEQ ID NO:11具有90%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙酮酸脱羧酶活性;

(c6)由在SEQ ID NO:11的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙酮酸脱羧酶活性。

项7.根据项6所述的转化体,其中所述醇脱氢酶基因(b)是下述(b1)、(b2)、(b3)、(b4)、(b5)或(b6)的DNA:

(b1)由SEQ ID NO:2、3、4或5的碱基序列组成的DNA;

(b2)由与SEQ ID NO:2、3、4或5具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有醇脱氢酶活性的多肽;

(b3)在严格条件下与由SEQ ID NO:2、3、4或5的互补碱基序列组成的DNA杂交并且编码具有醇脱氢酶活性的多肽的DNA;

(b4)由SEQ ID NO:6、7、8或9的氨基酸序列组成的多肽的编码DNA;

(b5)由与SEQ ID NO:6、7、8或9具有90%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性;

(b6)由在SEQ ID NO:6、7、8或9的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性。

项8.根据项6或7所述的转化体,其中所述嗜氢菌属细菌是Hydrogenophilusthermoluteolus。

项9.一种制造乙醇的方法,所述方法包括在使用二氧化碳作为基本上唯一碳源的同时,培养根据项6至8中任一项所述的转化体的步骤。

项10.一种转化体,其通过将(d)醛-醇脱氢酶基因导入嗜氢菌属细菌中获得。

项11.根据项10所述的转化体,其中所述醛-醇脱氢酶基因(d)是下述(d1)、(d2)、(d3)、(d4)、(d5)、(d6)、(d7)、(d8)或(d9)的DNA:

(d1)由SEQ ID NO:12或13的碱基序列组成的DNA;

(d2)由与SEQ ID NO:12或13具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有醛-醇脱氢酶活性的多肽;

(d3)在严格条件下与由SEQ ID NO:12或13的互补碱基序列组成的DNA杂交并且编码具有醛-醇脱氢酶活性的多肽的DNA;

(d4)由SEQ ID NO:14或15的氨基酸序列组成的多肽的编码DNA;

(d5)由与SEQ ID NO:14或15具有90%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性;

(d6)由在SEQ ID NO:14或15的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性;

(d7)由SEQ ID NO:16、17、18、19、20、21、22、23或24的氨基酸序列组成的多肽的编码DNA;

(d8)由与SEQ ID NO:16、17、18、19、20、21、22或23具有90%以上同一性的氨基酸序列组成的多肽的编码DNA(条件是所述多肽中氨基酸编号568的氨基酸是Lys、Ala、Leu、Asn、Gly、Ser、Arg或His),所述多肽具有醛-醇脱氢酶活性,或者由与SEQ ID NO:24具有90%以上同一性的氨基酸序列组成的多肽的编码DNA(条件是所述多肽中氨基酸编号575的氨基酸是Asn),所述多肽具有醛-醇脱氢酶活性;

(d9)由在SEQ ID NO:16、17、18、19、20、21、22或23的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA(条件是氨基酸编号568的氨基酸是Lys、Ala、Leu、Asn、Gly、Ser、Arg或His),所述多肽具有醛-醇脱氢酶活性,或者由在SEQ ID NO:24的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA(条件是氨基酸编号575的氨基酸是Asn),所述多肽具有醛-醇脱氢酶活性。

项12.根据项11所述的转化体,其中所述(d7)的DNA是由SEQ ID NO:25、26、27或28的碱基序列组成的DNA。

项13.根据项10至12中任一项所述的转化体,其中所述嗜氢菌属细菌是Hydrogenophilus thermoluteolus。

项14.一种制造乙醇的方法,所述方法包括在使用二氧化碳作为基本上唯一碳源的同时,培养根据项10至13中任一项所述的转化体的步骤。

项15.一种醛-醇脱氢酶,其由下述(d7’)、(d8’)或(d9’)的多肽组成(条件是多肽(d8’)和(d9’)的N末端起575位氨基酸是Asn):

(d7’)由SEQ ID NO:24的氨基酸序列组成的多肽;

(d8’)由与SEQ ID NO:24具有90%以上同一性的氨基酸序列组成的多肽,所述多肽具有醛-醇脱氢酶活性;

(d9’)由在SEQ ID NO:24的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽,所述多肽具有醛-醇脱氢酶活性。

项16.一种醛-醇脱氢酶基因,其由下述(d10’)、(d11’)或(d12’)的DNA组成(条件是从(d11’)和(d12’)的DNA的5'末端起1723位到1725位的3个核苷酸是AAC或AAT):

(d10’)由SEQ ID NO:27或28的碱基序列组成的DNA;

(d11’)由与SEQ ID NO:27或28具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有醛-醇脱氢酶活性的多肽;

(d12’)在严格条件下与由SEQ ID NO:27或28的互补碱基序列组成的DNA杂交的DNA,所述DNA编码具有醛-醇脱氢酶活性的多肽。

项17.一种转化体,其通过将(e)丙氨酸脱氢酶基因导入嗜氢菌属细菌中获得。

项18.根据项17所述的转化体,其中所述丙氨酸脱氢酶基因(e)是下述(e1)、(e2)、(e3)、(e4)、(e5)、(e6)、(e7)、(e8)、(e9)、(e10)、(e11)或(e12)的DNA:

(e1)由SEQ ID NO:29、30、31或32的碱基序列组成的DNA;

(e2)由与SEQ ID NO:29、30、31或32具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有丙氨酸脱氢酶活性的多肽;

(e3)在严格条件下与由SEQ ID NO:29、30、31或32的互补碱基序列组成的DNA杂交并且编码具有丙氨酸脱氢酶活性的多肽的DNA;

(e4)由SEQ ID NO:33、34、35或36的氨基酸序列组成的多肽的编码DNA;

(e5)由与SEQ ID NO:33、34、35或36具有90%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性;

(e6)由在SEQ ID NO:33、34、35或36的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性;

(e7)由在SEQ ID NO:33、34、35或36的氨基酸序列的N末端添加SEQ ID NO:37的氨基酸序列所得的氨基酸序列组成的多肽的编码DNA;

(e8)由在与SEQ ID NO:33、34、35或36具有90%以上同一性的氨基酸序列的N末端添加SEQ ID NO:37的氨基酸序列所得的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性;

(e9)由在SEQ ID NO:33、34、35或36的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列的N末端添加SEQ ID NO:37的氨基酸序列所得的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性;

(e10)由在SEQ ID NO:29、30、31或32的碱基序列的5’末端添加SEQ ID NO:38的碱基序列所得的碱基序列组成的DNA;

(e11)由在与SEQ ID NO:29、30、31或32具有90%以上同一性的碱基序列的5’末端添加SEQ ID NO:38的碱基序列所得的碱基序列组成的DNA,所述DNA编码具有丙氨酸脱氢酶活性的多肽;

(e12)在严格条件下与由SEQ ID NO:29、30、31或32的互补碱基序列组成的DNA杂交的DNA的碱基序列在5’末端添加SEQ ID NO:38的碱基序列所得的碱基序列所组成的DNA,其编码具有丙氨酸脱氢酶活性的多肽。

项19.根据项17或18所述的转化体,其中所述嗜氢菌属细菌是Hydrogenophilusthermoluteolus。

项20.一种制造丙氨酸的方法,所述方法包括在使用二氧化碳作为基本上唯一碳源的同时,培养根据项17至19中任一项所述的转化体的步骤。

项21.一种修饰的丙氨酸脱氢酶,其中在丙氨酸脱氢酶的N末端添加由SEQ ID NO:37的氨基酸序列组成的多肽。

项22.根据项21所述的修饰的丙氨酸脱氢酶,其由SEQ ID NO:39的氨基酸序列组成。

项23.一种修饰的丙氨酸脱氢酶基因,其中在丙氨酸脱氢酶基因的5’末端添加由SEQ ID NO:38的碱基序列组成的多核苷酸。

项24.根据项23所述的修饰的丙氨酸脱氢酶基因,其由SEQ ID NO:40的碱基序列组成。

发明的有利效果

抑制二氧化碳增加的对策包括减少二氧化碳排放和固定所排放的二氧化碳。为了减少二氧化碳排放,利用太阳能、风能、地热能等代替化石能。然而,利用这种能量实际上尚不能充分抑制二氧化碳增加。因此,需要推进所排放的二氧化碳的固定或再循环。

二氧化碳可以被物理或化学固定,然而,如果利用活生物固定二氧化碳,则可以生产可用作食物、饲料、燃料等的有机物质。亦即,二氧化碳本身作为资源可以直接转化为有价值的化学品。因此,可以同时解决由于二氧化碳增加导致的全球变暖以及难以确保食物、饲料和燃料这两个问题。

氢氧化细菌是可以利用氢和氧的反应产生的化学能并利用二氧化碳作为唯一的碳源进行生长的细菌。由于氢氧化细菌可以利用氧气、氢气和二氧化碳的混合气体为原料制造化学品,因此它们可以有效地进行二氧化碳的有机化并在简单培养基中培养。氢氧化细菌的生长通常较慢,然而,嗜氢菌属的氢氧化细菌的生长速度明显加快。“Journal ofMitsubishi Research Institute No.34 1999”如下评估嗜氢菌属细菌:“它们的增殖能力没有高得可以与植物的二氧化碳固定能力相提并论,这确实表明了微生物的二氧化碳固定能力高”。

当使用在嗜氢菌属细菌内起作用的载体将具有天然碱基序列的异源基因导入嗜氢菌属细菌中时,往往不产生功能蛋白质。根据本发明,通过将特定基因导入到嗜氢菌属细菌中,所述基因在嗜氢菌属细菌内起作用,并且可以生成异丁醇、乙醇或丙氨酸。

如上所述,嗜氢菌属细菌在具有二氧化碳固定能力的生物体当中具有特别优异的二氧化碳固定能力,因此,通过使用本发明的转化体,可以固定二氧化碳,并且可以按工业水平制造异丁醇、乙醇或丙氨酸。

具体实施方式

下面详细描述本发明:

本发明的密码子优化的2-酮酸脱羧酶基因是通过对乳酸乳球菌的2-酮酸脱羧酶的密码子优化而获得的,并且在碱基序列上不同于乳酸乳球菌的2-酮酸脱羧酶基因(kivD)。该基因是由SEQ ID NO:1的碱基序列组成的DNA。该密码子优化的2-酮酸脱羧酶基因在嗜氢菌属细菌内起作用,并且可以引起2-酮酸脱羧酶活性表达。

基于该密码子优化的2-酮酸脱羧酶基因产生的2-酮酸脱羧酶的氨基酸序列与乳酸乳球菌的2-酮酸脱羧酶的氨基酸序列(SEQ ID NO:41)相同。

由与SEQ ID NO:1具有90%以上、优选95%以上、更优选98%以上、更加优选99%以上同一性的碱基序列组成的DNA(所述DNA编码具有2-酮酸脱羧酶活性的多肽)也可用于在嗜氢菌属细菌内引起2-酮酸脱羧酶活性表达。

在本发明中,使用GENETYX ver.17(GENETYX Corporation制造)计算碱基序列的同一性。

也可以使用在严格条件下与由SEQ ID NO:1的互补碱基序列组成的DNA杂交的DNA,所述DNA编码具有2-酮酸脱羧酶活性的多肽。

在本发明中,“严格条件”是指在盐浓度为6×SSC的杂交溶液中在50至60℃的温度下进行16小时杂交、然后在盐浓度为0.1×SSC的溶液中进行洗涤的条件。

希望所述密码子优化的2-酮酸脱羧酶基因(SEQ ID NO:1)的上述同源物的碱基序列与SEQ ID NO:1的差异是在所述编码的2-酮酸脱羧酶的氨基酸序列与乳酸乳球菌的2-酮酸脱羧酶的氨基酸序列(SEQ ID NO:41)相同的程度上。

本发明还包括包含上述密码子优化的2-酮酸脱羧酶基因或其同源物的载体(特别是在嗜氢菌属细菌内起作用的载体)。

通过将醇脱氢酶基因与上述经密码子优化的2-酮酸脱羧酶基因或其同源物一起导入嗜氢菌属细菌中,所述嗜氢菌属细菌变得生成异丁醇。

因此,本发明包括一种转化体,所述转化体通过将下列各项导入嗜氢菌属宿主细菌中而获得:(a)(a1)由SEQ ID NO:1的碱基序列组成的DNA,(a2)由与SEQ ID NO:1具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有2-酮酸脱羧酶活性的多肽,或(a3)在严格条件下与由SEQ ID NO:1的互补碱基序列组成的DNA杂交并且编码具有2-酮酸脱羧酶活性的多肽的DNA,和(b)醇脱氢酶基因的DNA。换句话说,该转化体具有上述(a)和(b)的外源性DNA。

醇脱氢酶基因的实例包括:(b1)肺炎克雷伯氏菌的醇脱氢酶基因(adhP)、热小链地芽孢杆菌的醇脱氢酶基因(adhP)、热葡糖苷酶地芽孢杆菌的醇脱氢酶基因(adhP)、和热葡糖苷酶地芽孢杆菌的醇脱氢酶基因(adhA),由于它们具有良好的异丁醇生成效率,因此是优选的。这些基因的碱基序列分别是SEQ ID NO:2、3、4和5。

(b2)由与SEQ ID NO:2、3、4或5具有90%以上、优选95%以上、更优选98%以上、更加优选99%以上同一性的碱基序列组成的DNA,所述DNA编码具有醇脱氢酶活性的多肽,和(b3)在严格条件下与由SEQ ID NO:2、3、4或5的互补碱基序列组成的DNA杂交并且编码具有醇脱氢酶活性的多肽的DNA,也是优选的。

另外,醇脱氢酶基因的实例包括(b4)由SEQ ID NO:6、7、8或9的氨基酸序列组成的多肽的编码DNA,或(b5)由与SEQ ID NO:6、7、8或9具有90%以上、优选95%以上、更优选98%以上、更加优选99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性,这些也是优选的。

SEQ ID NO:6、7、8和9分别是肺炎克雷伯氏菌、热小链地芽孢杆菌和热葡糖苷酶地芽孢杆菌的醇脱氢酶ADHP的氨基酸序列以及热葡糖苷酶地芽孢杆菌的醇脱氢酶ADHA的氨基酸序列。

在本发明中,使用GENETYX ver.17(GENETYX Corporation制造)计算氨基酸序列的同一性。

(b6)由在SEQ ID NO:6、7、8或9的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性,也是优选的。

在本发明中,多个的实例包括1至5个,特别是1至3个,特别是1至2个,特别是1个。

在本发明中,当具有某种活性的多肽的氨基酸残基被取代时,所述氨基酸残基可以被另一个化学上相似的氨基酸残基取代,以进行取代从而使所述多肽在被取代后具有所述某种活性(特别是使所述多肽维持与所述某种活性相同水平的活性)。例如,疏水性氨基酸残基可以被另一个疏水性氨基酸残基取代,或者带电荷的氨基酸残基可以被另一个具有相同电荷的带电荷氨基酸残基取代。可以被如此取代的化学上相似的氨基酸是本领域技术人员公知的。具有非极性(疏水性)侧链的氨基酸的实例包括甘氨酸、丙氨酸、缬氨酸、异亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸、甲硫氨酸等,并且这些氨基酸可以互相取代。具有极性侧链的中性氨基酸的实例包括丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺、半胱氨酸等,并且这些氨基酸可以互相取代。具有正电荷的(碱性)氨基酸的实例包括精氨酸、组氨酸、赖氨酸等,并且这些氨基酸可以互相取代。另外,具有负电荷的(酸性)氨基酸的实例包括天冬氨酸、谷氨酸等,并且这些氨基酸可以互相取代。

在本发明中,当具有某种活性的多肽的编码DNA的核苷酸被取代时,如果所述核苷酸被取代成使得所编码的多肽的氨基酸序列不变,则所述多肽在取代后有具有所述某种活性的倾向(特别是维持与所述某种活性相同水平的活性)。另外,如果核苷酸被取代成使得相应的氨基酸残基被另一个化学上相似的氨基酸残基取代,则所述多肽在取代后有具有所述某种活性的倾向(特别是维持与所述某种活性相同水平的活性)。

在本发明中,为了确认多肽具有2-酮酸脱羧酶活性,在醇脱氢酶和NADH的共存下使被测多肽与2-酮异戊酸反应,并检测340nm处的吸光度降低。2-酮酸脱羧酶从2-酮异戊酸生成异丁醛,而共存的醇脱氢酶则从异丁醛生成异丁醇。当从异丁醛生成异丁醇时,醇脱氢酶消耗NADH,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有2-酮酸脱羧酶活性。

在本发明中,为了确认多肽具有将异丁醛用作底物的醇脱氢酶活性,在NADH的共存下使被测多肽与异丁醛反应,并检测340nm处的吸光度降低。醇脱氢酶从异丁醛生成异丁醇,这伴随着NADH向NAD的转化,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有将异丁醛用作底物的醇脱氢酶活性。

本发明包括通过将下述各项导入嗜氢菌属宿主细菌中而获得的转化体:(c)(c1)由SEQ ID NO:10的碱基序列组成的DNA,(c2)由与SEQ ID NO:10具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成的DNA,所述DNA编码具有丙酮酸脱羧酶活性的多肽,或(c3)在严格条件下与由SEQ ID NO:10的互补碱基序列组成的DNA杂交并且编码具有丙酮酸脱羧酶活性的多肽的DNA,以及(b)醇脱氢酶基因的DNA。换句话说,该转化体具有(c)和(b)的外源性DNA。由于具有(c)和(b)的DNA,该转化体可以生成乙醇。

SEQ ID NO:10是氧化葡糖杆菌的丙酮酸脱羧酶基因(pdc基因)的碱基序列。

也可以使用的丙酮酸脱羧酶基因的实例包括(c4)由SEQ ID NO:11的氨基酸序列组成的多肽的编码DNA,(c5)由与SEQ ID NO:11具有90%以上、优选95%以上、更优选98%以上、更加优选99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙酮酸脱羧酶活性,或(c6)由在SEQ ID NO:11的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙酮酸脱羧酶活性。

SEQ ID NO:11是氧化葡糖杆菌的丙酮酸脱羧酶的氨基酸序列。

(b)醇脱氢酶基因的实例包括:(b1)肺炎克雷伯氏菌的醇脱氢酶基因(adhP)、热小链地芽孢杆菌的醇脱氢酶基因(adhP)、热葡糖苷酶地芽孢杆菌的醇脱氢酶基因(adhP)、和热葡糖苷酶地芽孢杆菌的醇脱氢酶基因(adhA),由于它们具有良好的乙醇生成效率,因此是优选的。这些基因的碱基序列分别是SEQ ID NO:2、3、4和5。

也可以优选使用(b2)由与SEQ ID NO:2、3、4或5具有95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成的DNA,所述DNA编码具有醇脱氢酶活性的多肽。也可以优选使用(b3)在严格条件下与由SEQ ID NO:2、3、4或5的互补碱基序列组成的DNA杂交并且编码具有醇脱氢酶活性的多肽的DNA。

(b4)由SEQ ID NO:6、7、8或9的氨基酸序列组成的多肽的编码DNA,也可以优选用作醇脱氢酶基因。此外,也可以优选使用(b5)由与SEQ ID NO:6、7、8或9具有90%以上、优选95%以上、更优选98%以上、更加优选99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性,和(b6)由在SEQ ID NO:6、7、8或9的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醇脱氢酶活性。

SEQ ID NO:6、7、8和9分别是肺炎克雷伯氏菌、热小链地芽孢杆菌和热葡糖苷酶地芽孢杆菌的醇脱氢酶ADHP的氨基酸序列以及热葡糖苷酶地芽孢杆菌的醇脱氢酶ADHA的氨基酸序列。

在本发明中,为了确认多肽具有丙酮酸脱羧酶活性,使被测多肽与丙酮酸在醇脱氢酶和NADH的共存下反应,并检测340nm处的吸光度降低。丙酮酸脱羧酶从丙酮酸生成乙醛,醇脱氢酶从乙醛生成乙醇。当从乙醛生成乙醇时,醇脱氢酶消耗NADH,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有丙酮酸脱羧酶活性。

在本发明中,为了确认多肽具有将乙醛用作底物的醇脱氢酶活性,使被测多肽与乙醛在NADH的共存下反应,并检测340nm处的吸光度降低。醇脱氢酶从乙醛生成乙醇,这伴随着NADH向NAD的转化,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有将乙醛用作底物的醇脱氢酶活性。

本发明包括通过将(d)醛-醇脱氢酶基因的DNA导入嗜氢菌属的宿主细菌中而获得的转化体。换句话说,该转化体具有(d)醛-醇脱氢酶基因的外源性DNA。由于具有(d)的DNA,该转化体可以生成乙醇。

醛-醇脱氢酶基因的实例包括(d1)大肠杆菌的醛-醇脱氢酶基因(adhE)和热纤梭菌的醛-醇脱氢酶基因(adhE),由于它们具有良好的乙醇生成效率,因此是优选的。大肠杆菌adhE的碱基序列是SEQ ID NO:12,而热纤梭菌adhE的碱基序列是SEQ ID NO:13。

也可以优选使用(d2)由与由SEQ ID NO:12或13组成的碱基序列组成的DNA具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成并且编码具有醛-醇脱氢酶活性的多肽的DNA,和(d3)在严格条件下与由SEQ ID NO:12或13的互补碱基序列组成的DNA杂交并且编码具有醛-醇脱氢酶活性的多肽的DNA。

也可以优选使用(d4)由SEQ ID NO:14或15的氨基酸序列组成的多肽的编码DNA。此外,也可以优选使用(d5)由与SEQ ID NO:14或15具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性,和(d6)由在SEQ ID NO:14或15的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性。

SEQ ID NO:14是大肠杆菌的醛-醇脱氢酶(ADHE)的氨基酸序列,SEQ ID NO:15是热纤梭菌的醛-醇脱氢酶(ADHE)的氨基酸序列。

醛-醇脱氢酶活性在需氧条件下受到抑制,因此,在本发明中,尝试了在嗜氢菌属细菌内使用在需氧条件下表达高活性的醛-醇脱氢酶。

结果发现,其中大肠杆菌的醛-醇脱氢酶的氨基酸序列SEQ ID NO:14的氨基酸编号568处的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的突变型ADHE可以在嗜氢菌属细菌内在需氧条件下表达高活性。其中氨基酸编号568处的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的突变型ADHE的氨基酸序列,分别在SEQ ID NO:16、17、18、19、20、21、22和23中显示。

尤其优选由SEQ ID NO:14的氨基酸编号568的Glu被Lys取代所得的SEQ ID NO:16的氨基酸序列组成的突变型ADHE(E568K)。

因此,在本发明中,可以优选使用(d7)由其中SEQ ID NO:14的氨基酸编号568的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的氨基酸序列组成的多肽的编码DNA。

也可以优选使用(d8)由与SEQ ID NO:14的氨基酸编号568的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的氨基酸序列(SEQ ID NO:16、17、18、19、20、21、22或23)具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性,和(d9)由在SEQ ID NO:14的氨基酸编号568的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代的氨基酸序列(SEQ ID NO:16、17、18、19、20、21、22或23)中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性。

然而要注意,在(d8)和(d9)的多肽中,氨基酸编号568的氨基酸分别为Lys、Ala、Leu、Asn、Gly、Ser、Arg或His,或按上述顺序。

所表达的醛-醇脱氢酶的568位氨基酸变成Lys的突变型adhE的碱基序列,是大肠杆菌adhE的碱基序列SEQ ID NO:12的1702-1704碱基位置处的GAG被AAG或AAA取代的碱基序列(SEQ ID NO:25或26)。

所表达的醛-醇脱氢酶的568位氨基酸变成Ala的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被GCT、GCC、GCA或GCG取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成Leu的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被TTA、TTG、CTT、CTC、CTA或CTG取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成Asn的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被AAT或AAC取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成Gly的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被GGT、GGC、GGA或GGG取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成Ser的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被TCT、TCC、TCA、TCG、AGT或AGC取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成Arg的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的GAG被CGT、CGC、CGA、AGA或AGG取代的碱基序列。

所表达的醛-醇脱氢酶的568位氨基酸变成His的adhE的碱基序列,是SEQ ID NO:12的1702至1704碱基位置处的CAT或CAC取代的碱基序列。

特别地,根据嗜氢菌属细菌的良好的乙醇产生效率,优选SEQ ID NO:25或26,并更优选SEQ ID NO:25。

另外,也可以优选使用由与上述编码突变型ADHE的突变型adhE的碱基序列具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成的DNA,在所述突变型ADHE中大肠杆菌的醛-醇脱氢酶(ADHE)SEQ ID NO:14的氨基酸编号568的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代,所述DNA编码具有醛-醇脱氢酶活性的多肽(大肠杆菌的突变型adhE的同源物);以及在严格条件下与由上述编码突变型ADHE的突变型adhE的碱基序列的互补碱基序列组成的DNA杂交并且编码具有醛-醇脱氢酶活性的多肽的DNA(大肠杆菌的突变型adhE的同源物),在所述突变型ADHE中大肠杆菌的醛-醇脱氢酶(ADHE)SEQ ID NO:14的氨基酸编号568的Glu被Lys、Ala、Leu、Asn、Gly、Ser、Arg或His取代。

然而要注意,在大肠杆菌突变型adhE的上述同源物中,与大肠杆菌突变型ADHE的568号氨基酸相对应的3个核苷酸的碱基序列与对应于大肠杆菌突变型ADHE的氨基酸编号568的Lys、Ala、Leu、Asn、Gly、Ser、Arg或His的3个核苷酸中的任何一个相同。

亦即,编码其中568号氨基酸是Lys的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是AAG或AAA。

编码其中568号氨基酸是Ala的大肠杆菌突变型ADHE的DNA的所述同源物的碱基编号1702至1704的核苷酸是GCT、GCC、GCA或GCG。

编码其中568号氨基酸是Leu的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是TTA、TTG、CTT、CTC、CTA或CTG。

编码其中568号氨基酸是Asn的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是AAT或AAC。

编码其中568号氨基酸是Gly的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是GGT、GGC、GGA或GGG。

编码其中568号氨基酸是Ser的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是TCT、TCC、TCA、TCG、AGT或AGC。

编码其中568号氨基酸是Arg的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是GCT、CGC、CGA、AGA或AGG。

编码其中568号氨基酸是His的大肠杆菌突变型ADHE的DNA的上述同源物的碱基编号1702至1704的核苷酸是CAT或CAC。

发现由SEQ ID NO:15中氨基酸编号575的Asp被Asn取代的氨基酸序列SEQ ID NO:24组成的突变型ADHE在嗜氢菌属细菌中在需氧条件下表达高活性,SEQ ID NO:15是热纤梭菌的醛-醇脱氢酶(ADHE)的氨基酸序列。

因此,在本发明中,(d7)编码由SEQ ID NO:15中氨基酸编号575的Asp被Asn取代的氨基酸序列(SEQ ID NO:24)组成的多肽的DNA(adhE(D575N)),可以被优选导入嗜氢菌属细菌中。

也可以优选使用(d8)由与SEQ ID NO:15中氨基酸编号575的Asp被Asn取代的氨基酸序列(SEQ ID NO:24)具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性(热纤梭菌突变型ADHE的同源物),和(d9)由在SEQ ID NO:15中氨基酸编号575的Asp被Asn取代的氨基酸序列(SEQ ID NO:24)中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有醛-醇脱氢酶活性(热纤梭菌突变型ADHE的同源物)。

然而要注意,在(d8)和(d9)的热纤梭菌突变型ADHE同源物中,氨基酸编号575的氨基酸是Asn。

通过将产生上述氨基酸取代的突变型热纤梭菌adhE基因导入嗜氢菌属细菌中,获得的转化体变得能够在需氧条件下高表达醛-醇脱氢酶活性。

所表达的醛-醇脱氢酶的575位氨基酸是Asn的突变型adhE的碱基序列,是其中热纤梭菌adhE基因的碱基序列SEQ ID NO:13的碱基编号1723至1725的GAC被AAC或AAT取代的碱基序列(SEQ ID NO:27或28)。特别地,优选由SEQ ID NO:27的碱基序列组成的DNA。

也可以优选使用由与由SEQ ID NO:27或28的碱基序列组成的DNA具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成并且编码具有醛-醇脱氢酶活性的多肽的DNA(热纤梭菌的突变型adhE的同源物),以及在严格条件下与由SEQ ID NO:27或28的互补碱基序列组成的DNA杂交并且编码具有醛-醇脱氢酶活性的多肽的DNA(热纤梭菌的突变型adhE的同源物)。

然而要注意,在由SEQ ID NO:27或28的碱基序列组成的热纤梭菌突变型adhE同源物中,碱基编号1723至1725的核苷酸是AAC或AAT。

在本发明中,提供了由下列所组成的醛-醇脱氢酶:(d7’)由SEQ ID NO:24的氨基酸序列组成的多肽,(d8’)由与SEQ ID NO:24具有90%以上同一性的氨基酸序列组成的多肽,所述多肽具有醛-醇脱氢酶活性,或(d9’)由在SEQ ID NO:24的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽,所述多肽具有醛-醇脱氢酶活性。然而要注意,从(d8’)和(d9’)多肽的N末端起575位的氨基酸分别是Asn。

该多肽可以在嗜氢菌属细菌内表达,并优选用于乙醇生成,或用于通过酶反应生成乙醇。

本发明还提供了由下列所组成的醛-醇脱氢酶:(d10’)由SEQ ID NO:27或28的碱基序列组成的DNA,(d11’)由与SEQ ID NO:27或28具有90%以上同一性的碱基序列组成的DNA,所述DNA编码具有醛-醇脱氢酶活性的多肽,或(d12’)在严格条件下与由SEQ ID NO:27或28的互补碱基序列组成的DNA杂交并且编码具有醛-醇脱氢酶活性的多肽的DNA。然而要注意,从(d11’)或(d12’)的DNA的5’末端起1723至1725位的3个核苷酸是AAC或AAT。

本发明包括包含该醛-醇脱氢酶基因的载体(特别是在嗜氢菌属细菌内起作用的载体)。

该醛-醇脱氢酶基因和包含所述基因的载体可以优选用于在嗜氢菌属细菌中生成乙醇。

醛-醇脱氢酶是一种双功能酶,它既具有催化从乙酰辅酶A生成乙醛的反应的醛脱氢酶活性,又具有催化从乙醛生成乙醇的反应的醇脱氢酶活性。

在本发明中,当被测多肽显示出既有将乙酰辅酶A用作底物的醛脱氢酶活性又有将乙醛用作底物的醇脱氢酶活性时,确定具有醛-醇脱氢酶活性。

在本发明中,为了确认多肽具有将乙酰辅酶A用作底物的醛脱氢酶活性,使被测多肽与乙酰辅酶A在NADH的共存下反应,并检测340nm处的吸光度降低。醛脱氢酶从乙酰辅酶A生成乙醛,这伴随着NADH向NAD的转化,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有将乙酰辅酶A用作底物的醛脱氢酶活性。

为了确认多肽具有将乙醛用作底物的醇脱氢酶活性,使被测多肽与乙醛在NADH的共存下反应,并检测340nm处的吸光度降低。醇脱氢酶从乙醛生成乙醇,这伴随着NADH向NAD的转化,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有将乙醛用作底物的醇脱氢酶活性。

本发明包括通过将(e)丙氨酸脱氢酶基因导入嗜氢菌属宿主细菌中而获得的转化体。换句话说,该转化体具有外源性丙氨酸脱氢酶基因。嗜氢菌属细菌生成生存必要量的丙氨酸,然而,该量不足以供工业利用。由于拥有外源性丙氨酸脱氢酶基因,本发明的转化体的丙氨酸生成量改善。

丙氨酸脱氢酶基因的实例包括:(e1)嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶基因(alaD1)、嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶基因(alaD2)、嗜热栖热菌的丙氨酸脱氢酶基因(alaD1)和嗜热栖热菌的丙氨酸脱氢酶基因(alaD2),它们由于具有良好的丙氨酸生成效率,所以是优选的。

嗜热脂肪地芽孢杆菌的alaD1的碱基序列是SEQ ID NO:29,嗜热脂肪地芽孢杆菌的alaD2的碱基序列是SEQ ID NO:30。嗜热栖热菌alaD1的碱基序列是SEQ ID NO:31,嗜热栖热菌alaD2的碱基序列是SEQ ID NO:32。

特别地,嗜热脂肪地芽孢杆菌的alaD2(SEQ ID NO:30)在嗜氢菌属细菌内引起特别高的丙氨酸脱氢酶活性,因此是优选的。

在本发明中,也可以优选使用(e2)由与SEQ ID NO:29、30、31或32具有95%以上、特别是98%以上、特别是99%以上同一性的碱基序列组成的DNA,所述DNA编码具有丙氨酸脱氢酶活性的多肽。另外,也可以优选使用(e3)在严格条件下与由SEQ ID NO:29、30、31或32的互补碱基序列组成的DNA杂交并且编码具有丙氨酸脱氢酶活性的多肽的DNA。

在本发明中,根据良好的丙氨酸生成效率,可以优选使用(e4)由SEQ ID NO:33、34、35或36的氨基酸序列组成的多肽的编码DNA。此外,也可以优选使用(e5)由与SEQ IDNO:33、34、35或36具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性,和(e6)由在SEQID NO:33、34、35或36的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性。

SEQ ID NO:33是嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD1的氨基酸序列,并且SEQ ID NO:34是嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD2的氨基酸序列。SEQ ID NO:35是嗜热栖热菌的丙氨酸脱氢酶ALAD1的氨基酸序列,并且SEQ ID NO:36是嗜热栖热菌的丙氨酸脱氢酶ALAD2的氨基酸序列。

特别是,优选嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD2。

在本发明中,发现在丙氨酸脱氢酶的N末端添加麦芽糖结合蛋白的N末端部分(SEQID NO:37)所得的修饰的丙氨酸脱氢酶,在嗜氢菌属细菌中表达更高的活性。因此,本发明提供了转化体,所述转化体通过将在丙氨酸脱氢酶的N末端添加麦芽糖结合蛋白的N末端部分(SEQ ID NO:37)所得的修饰的丙氨酸脱氢酶的编码DNA(修饰的丙氨酸脱氢酶基因)导入嗜氢菌属细菌中而获得。亦即,本发明提供了转化体,所述转化体通过将在丙氨酸脱氢酶基因的5’末端添加编码麦芽糖结合蛋白的N末端部分的DNA(SEQ ID NO:38)所得的修饰的丙氨酸脱氢酶基因导入嗜氢菌属细菌中而获得。

在这种情况下,进行所述添加使得麦芽糖结合蛋白的N末端部分的C末端与丙氨酸脱氢酶的N末端连接。此外,进行所述添加使得编码麦芽糖结合蛋白的N末端部分的DNA的3’末端与丙氨酸脱氢酶基因的5’末端连接。

特别是,优选将麦芽糖结合蛋白的N末端部分(SEQ ID NO:37)添加到嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD1或ALAD2或嗜热栖热菌的丙氨酸脱氢酶ALAD1或ALAD2的N末端上的多肽,更优选将麦芽糖结合蛋白的N末端部分(SEQ ID NO:37)添加到嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD2(SEQ ID NO:34)的N末端上的多肽。

详细地说,(e7)在SEQ ID NO:33、34、35或36的氨基酸序列的N末端添加麦芽糖结合蛋白的N末端部分的氨基酸序列(SEQ ID NO:37)所得的修饰氨基酸序列的编码DNA,可以优选用于嗜氢菌属细菌的转化。在嗜热脂肪地芽孢杆菌的丙氨酸脱氢酶ALAD2(SEQ ID NO:34)的N末端添加麦芽糖结合蛋白的N末端部分(SEQ ID NO:37)所得的修饰的丙氨酸脱氢酶的氨基酸序列是SEQ ID NO:39。

此外,也可以使用(e8)由在与SEQ ID NO:33、34、35或36具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的氨基酸序列的N末端添加麦芽糖结合蛋白的N末端部分的氨基酸序列(SEQ ID NO:37)所得的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性,和(e9)由在SEQ ID NO:33、34、35或36的氨基酸序列中具有一个或多个氨基酸的缺失、取代或添加的氨基酸序列的N末端添加麦芽糖结合蛋白的N末端部分的氨基酸序列(SEQ ID NO:37)所得的氨基酸序列组成的多肽的编码DNA,所述多肽具有丙氨酸脱氢酶活性。

同样可以使用(e10)由在SEQ ID NO:29、30、31或32的碱基序列的5’末端添加编码麦芽糖结合蛋白的N末端部分的碱基序列(SEQ ID NO:38)所得的碱基序列组成的DNA。特别地,优选由在嗜热脂肪地芽孢杆菌alaD2的碱基序列SEQ ID NO:30的碱基序列5’末端添加麦芽糖结合蛋白的N末端部分的碱基序列(SEQ ID NO:38)所得的碱基序列组成的DNA(SEQID NO:40)。

此外,同样可以使用(e11)由在与SEQ ID NO:29、30、31或32具有90%以上、特别是95%以上、特别是98%以上、特别是99%以上同一性的碱基序列的5’末端添加编码麦芽糖结合蛋白的N末端部分的碱基序列(SEQ ID NO:38)所得的碱基序列组成的DNA,所述DNA编码具有丙氨酸脱氢酶活性的多肽,和(e12)由在严格条件下与由SEQ ID NO:29、30、31或32的互补碱基序列组成的DNA杂交的DNA碱基序列的5’末端添加编码麦芽糖结合蛋白的N末端部分的碱基序列(SEQ ID NO:38)所得的碱基序列组成并且编码具有丙氨酸脱氢酶活性的多肽的DNA。

本发明包括在丙氨酸脱氢酶基因的5’末端添加编码麦芽糖结合蛋白的N末端部分(SEQ ID NO:37)的多核苷酸(SEQ ID NO:38)所得的修饰的丙氨酸脱氢酶基因。所述修饰的丙氨酸脱氢酶基因和优选的修饰的丙氨酸脱氢酶基因的具体实例如对于用于转化嗜氢菌属细菌的修饰的丙氨酸脱氢酶基因所描述的。本发明还包括包含该修饰的丙氨酸脱氢酶基因的载体(特别是在嗜氢菌属细菌内起作用的载体)。

该修饰的丙氨酸脱氢酶基因和包含所述基因的载体可以优选用于在嗜氢菌属细菌内生成丙氨酸。

本发明包括在丙氨酸脱氢酶基因的N末端添加麦芽糖结合蛋白的N末端部分(SEQID NO:37)所得的修饰的丙氨酸脱氢酶。所述修饰的丙氨酸脱氢酶和优选的修饰的丙氨酸脱氢酶的具体实例如对于由用于转化嗜氢菌属细菌的修饰的丙氨酸脱氢酶基因所编码的修饰的丙氨酸脱氢酶所描述的。

该修饰的丙氨酸脱氢酶可优选用于在嗜氢菌属细菌内生成丙氨酸,或可用于通过酶反应生成丙氨酸。

在本发明中,为了确认多肽具有丙氨酸脱氢酶活性,使被测多肽在NADH的共存下与丙酮酸和氯化铵反应,并检测340nm处的吸光度降低。丙氨酸脱氢酶从丙酮酸和氨生成丙氨酸,这伴随着NADH向NAD的转化,因此利用340nm处的吸光度降低为指标,检测NADH量的减少。具体地,实施在“实施例”项目中记载的方法。如果被测多肽即使轻度降低340nm处的吸光度,则所述多肽就被确定为具有丙氨酸脱氢酶活性。

在本发明中,编码具有某种活性的多肽的某种DNA的“同源物”是指具有与所述某种DNA相似的碱基序列(特别是由与所述某种DNA的碱基序列具有90%以上同一性的碱基序列组成)并且编码具有所述某种活性的多肽的DNA,或者是指在严格条件下与由所述某种DNA的碱基序列的互补碱基序列组成的DNA杂交并且编码具有所述某种活性的多肽的DNA。

在本发明中,具有某种活性的某种多肽的“同源物”是指具有与所述某种多肽相似的氨基酸序列(特别是由与所述某种多肽的氨基酸序列具有90%上同一性的氨基酸序列组成)并具有所述某种活性的多肽,以及由在所述某种多肽的氨基酸序列中缺失、取代或添加一个或多个氨基酸所得的氨基酸序列组成并具有所述某种活性的多肽。

接下来,解释通过将上述用于生成异丁醇的基因、上述用于生成乙醇的基因或上述用于生成丙氨酸的基因导入嗜氢菌属细菌中来获得转化体的方法。

嗜氢菌(Hydrogenophilus)属细菌的实例包括Hydrogenophilusthermoluteolus、Hydrogenophilus halorhabdus、Hydrogenophilus denitrificans、Hydrogenophilus hirschii、Hydrogenophilus islandicus、和嗜氢菌属细菌的菌株Mar3(嗜氢菌种Mar3)。特别是,优选Hydrogenophilus thermoluteolus,因为在固定二氧化碳的微生物当中,它不仅具有最高水平的生长速度,而且具有最高水平的二氧化碳固定能力。

嗜氢菌属细菌可以容易地从地球上的任何地方分离。优选的Hydrogenophilusthermoluteolus菌株包括TH-1菌株(NBRC 14978)。Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978)在固定二氧化碳的微生物当中表现出最高的生长速度(Agriculturaland Biological Chemistry,41,685-690(1977))。Hydrogenophilus thermoluteolus菌株NBRC14978根据《布达佩斯条约》(Budapest Treaty)进行国际保藏,并供公众使用。

用于将上述DNA导入宿主的质粒载体应含有控制在嗜氢菌属细菌内自主复制功能的DNA,实例包括广宿主载体pRK415(GenBank:EF437940.1)、pBHR1(GenBank:Y14439.1)、pMMB67EH(ATCC 37622)、pCAR1(NCBI参考序列:NC_004444.1)、pC194(NCBI参考序列:NC_002013.1)、pK18mobsacB(GenBank:FJ437239.1)、pUB110(NCBI参考序列:NC_001384.1)等。

优选的启动子的实例包括tac启动子、lac启动子、trc启动子、或各个来自OxfordGenetics Ltd.的启动子OXB1和OXB11至OXB20。优选的终止子的实例包括大肠杆菌rRNA操纵子的rrnB T1T2终止子、噬菌体λt0转录终止子等。

可以通过公知的方法例如氯化钙法、磷酸钙法、DEAE-葡聚糖转染法、电脉冲法进行转化。

嗜氢菌属细菌在自养条件下生长。但是,由于它们也可以在异养条件下生长,因此用于培养嗜氢菌属细菌的宿主或转化体的培养基可以是无机培养基或有机培养基。可以使用包含糖、有机酸、氨基酸等的有机培养基。培养基的pH可调节至约6.2至8。

在任何情况下,都可以在供给含有氢气、氧气和二氧化碳的混合气体、并优选由氢气、氧气和二氧化碳组成的混合气体的同时进行培养。当使用有机培养基时,可以使用含有氢气、氧气和二氧化碳的混合气体,例如空气,进行通气。在不供给二氧化碳气体时,可以使用含有碳酸盐作为碳源的培养基。混合气体可以封入密闭的培养容器内或连续供给到密闭的培养容器中,并且可以通过振荡培养溶解到培养基中。或者,培养容器可以是密闭型或开放型的,并且混合气体可以通过鼓泡溶解在培养基中。

供给的气体内氢气、氧气和二氧化碳的体积比(氢气:氧气:二氧化碳)优选为1.75至7.5:1:0.25至3,更优选5至7.5:1:1至2,更加优选6.25至7.5:1:1.5。嗜氢菌属细菌是嗜热细菌,因此培养温度优选为35至55℃,更优选37至52℃,更加优选50至52℃。

当使用上述嗜氢菌属细菌的转化体制造异丁醇、乙醇或丙氨酸时,可以在供给含有氢气、氧气和二氧化碳的混合气体的同时,使用无机或有机培养基培养所述转化体。

供给的气体优选是由氢气、氧气和二氧化碳组成的混合气体。但是,在可以有效生成异丁醇、乙醇或丙氨酸的程度上,可以将不同种类的气体混合在内。

嗜氢菌属细菌可以使用氢气作为能源并使用二氧化碳作为唯一的碳源进行生长,因此,通过基本上只使用二氧化碳(特别是通过只使用二氧化碳)作为碳源来制造上述化合物,可以特别有效地固定二氧化碳。因此,使用不含有机物、碳酸盐等碳源的无机培养基,即基本上只使用二氧化碳(特别是只使用二氧化碳)作为碳源进行培养,是优选的。“基本上只使用二氧化碳作为碳源”包括其中混有不可避免的量的其他碳源的情况。此外,也可以使用含有糖、有机酸和氨基酸等有机物质以及碳酸盐的培养基而不供给二氧化碳。

培养基的pH优选为6.2至8,更优选6.4至7.4,更加优选6.6至7。当PH在该范围内时,细菌生长良好,混合气体良好地溶解在培养基中,并且可以有效制造目的化合物。

当采用分批培养时,可以在密闭的培养容器中封入混合气体,并可以进行静置培养或振荡培养。当采用连续培养时,可以将混合气体连续供给到密闭的培养容器中并可以进行振荡培养,或者可以使用密闭的培养容器在将混合气体鼓泡导入培养基的同时培养转化体。优选振荡培养,因为可以实现混合气体更好地溶解到培养基中。

供给气体内氢气、氧气和二氧化碳的体积比(氢气:氧气:二氧化碳)优选为1.75至7.5:1:0.25至3,更优选5至7.5:1:1至2,更加优选6.25至7.5:1:1.5。当体积比在该范围内时,细菌生长良好,并可以有效地制造目的化合物。

混合气体或原料气体的供给速度可以是每1L培养基10.5至60L/小时,特别是10.5至40L/小时,特别是10.5至21L/小时。当供给速度在该范围内时,转化体生长良好,可以有效制造目的化合物,并且可以减少混合气体的浪费量。

培养温度优选为35至55℃,更优选37至52℃,更加优选50至52℃。当温度在该范围内时,转化体生长良好,并可以有效制造目的化合物。

通过以上述方式培养,在反应液中生成目的化合物异丁醇、乙醇或丙氨酸。回收反应液将能够回收目的化合物,然而,可以进一步通过公知的方法从反应液中分离目的化合物。关于乙醇和异丁醇的这类公知方法包括分馏、提取和通过超声雾化分离,而关于丙氨酸的方法包括各种色谱法和结晶。

实施例

下面描述通常用于导入赋予异丁醇生成能力的基因、赋予乙醇生成能力的基因和赋予丙氨酸生成能力的基因的质粒载体的构建方法。

首先,将广宿主载体pRK415(GenBank:EF437940.1)(Gene,70,191-197(1998))用作模板并进行PCR。为了扩增除四环素基因区域以外的质粒区域的DNA片段,合成并使用下述引物对。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KODFX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增pRK415质粒序列的引物

(a-1)5’-CGT

(b-1)5’-TGA

向引物(a-1)和(b-1)添加了SfiI限制性酶切位点。

将含有新霉素/卡那霉素抗性基因(以下,所述基因可被称为“nptII”)的质粒pK18mobsacB(GenBank:FJ437239.1)(Gene,145,69-73(1994))用作模板,根据常规方法进行PCR。在PCR中,合成并使用下述引物对以扩增含有nptII基因序列的DNA片段。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增nptII基因序列的引物

(a-2)5’-ctg

(b-2)5’-tccGGCCAATGAGGCCtcagaagaactcgtcaaga-3’(SEQ ID NO:45)

向引物(a-2)和(b-2)添加了SfiI限制性酶切位点。

对上述各PCR产生的反应液使用1%琼脂糖凝胶进行电泳,结果,当pRK415质粒用作模板时,检测到约8.7-kb的DNA片段,当nptII基因用作模板时,检测到约1.1-kb的DNA片段。

将如此制备的DNA片段各自用限制酶SfiI切割,并与T4 DNA连接酶(Takara BioInc.制造)反应以获得连接液。将所得的连接液用于通过氯化钙法(Journal of MolecularBiology,53,159-162(1970))转化大肠杆菌JM109,并将转化体涂布到含卡那霉素的LB琼脂培养基上。将培养基上的活菌株通过常规方法在液体培养基中培养,并从所得的培养液中提取质粒DNA。用限制酶SfiI切割该质粒DNA,并确认插入的片段。结果,除了源自于pRK415质粒的约2.0-kb、3.0-kb和3.7-kb的DNA片段外,还观察到约1.1-kb的nptII基因序列的DNA片段。

该构建的质粒命名为pCYK01。

合成下述引物对并用于PCR以制备具有λt0终止子序列的DNA。使用LifeTechnologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。由于使用每个引物作为另一个的模板进行延伸,因此不包含模板DNA。

用于制备λt0终止子序列的引物

(a-3)

5’-GC

(b-3)

5’-caccgtgcagtcgatgGATctggattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatccagatggag-3’(SEQ ID NO:47)

引物(a-3)和(b-3)的3’末端的碱基序列是彼此互补的。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到对应于λt0终止子序列的约0.13-kb的DNA片段。

使用含有tac启动子的质粒pMAL-c5X(New England Biolabs Inc.制造)作为模板进行PCR。在PCR中,合成并使用下述引物对以扩增tac启动子序列。根据常规方法,使用LifeTechnologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增tac启动子序列的引物

(a-4)

5’-TTATTGGTGAGAATCCAGATCCATCGACTGCACGGTGCACCAATGCTTCT-3’(SEQ ID NO:48)

(b-4)

5’-gc

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到对应于tac启动子序列的约0.3-kb的DNA片段。

从琼脂糖凝胶上切下上述(2-1)和(2-2)中制备的DNA片段,并通过冷冻和熔化该凝胶从该凝胶中回收DNA。将所回收的对应于λt0终止子序列和tac启动子序列的DNA片段混合并用作模板,并进行重叠延伸PCR(overlap extension PCR)。在重叠延伸PCR中,使用上述引物(a-3)和(b-4)的组合以制备在λt0终止子的下游连接tac启动子的DNA。用于扩增模板DNA片段的引物(b-3)和a-4)的5’末端的碱基序列彼此互补。分别向引物(a-3)和(b-4)添加了PshBI和HindIII限制性酶切位点。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到约0.4-kb的DNA片段,其对应于tac启动子连接在λt0终止子下游的DNA。

通过限制酶PshBI和HindIII切割出PCR扩增的其中tac启动子连接到λt0终止子下游的约0.4-kb DNA片段、以及克隆载体pCYK01的上述约9.8-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

将所得的连接液用于通过氯化钙法转化大肠杆菌JM109,并将转化体涂布到含卡那霉素的LB琼脂培养基上。将培养基上的活菌株通过常规方法在液体培养基中培养,并从所得的培养液中提取质粒DNA。用限制酶PshBI和HindIII切割该质粒DNA,并确认插入的片段。结果,除了质粒pCYK01的约9.6kb的DNA片段外,还观察到其中tac启动子连接在λt0终止子下游的约0.4kb的DNA片段。

使用含有rrnB终止子序列的质粒pMAL-c5X(New England Biolabs Inc.制造)作为模板进行PCR。在PCR中,合成并使用下述引物对以扩增rrnB终止子序列。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增rrnB终止子序列的引物

(a-5)5’-ctc

(b-5)5’-CG

分别向引物(a-5)和(b-5)添加了EcoRI和MunI限制性酶切位点。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到对应于rrnB终止子序列的约0.6-kb的DNA片段。

通过限制酶EcoRI和MunI切割出通过上述PCR扩增的含有rrnB终止子序列的约0.6-kb DNA片段,并使用限制酶EcoRI切割在上述(2-3)中构建的质粒的约10.0-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

将所得的连接液用于通过氯化钙法转化大肠杆菌JM109,并将所得的转化体涂布到含卡那霉素的LB琼脂培养基上。将培养基上的活菌株通过常规方法在液体培养基中培养,并从所得的培养液中提取质粒DNA。用限制酶EcoRI和MunI切割该质粒,并确认插入的片段。结果,除了上述(2-3)的质粒的约10.0-kb的DNA片段外,还观察到对应于rrnB终止子序列的约0.6-kb的DNA片段。

所构建的用于基因表达的克隆载体被命名为pCYK21。

根据Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978)的密码子使用频率来优化编码乳酸乳球菌2-酮酸脱羧酶的kivD基因的密码子使用,并由GenScript JapanInc.合成优化的碱基序列的DNA片段(SEQ ID NO:1)。

各自通过使用限制酶NdeI和HindIII切割出所合成的密码子优化基因的约1.7-kbDNA片段,以及上述来自克隆载体pCYK21的约10.6-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

将所得的连接液用于通过用电脉冲法(电穿孔法)转化Hydrogenophilusthermoluteolus菌株TH-1(NBRC 14978),并将转化体涂布到含50μg/ml卡那霉素的A固体培养基[(NH

使用铂环将A固体培养基上的活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基[(NH

含有密码子优化的乳酸乳球菌kivD基因的质粒被命名为pC-opt-kivD。具有pC-opt-kivD的Hydrogenophilus thermoluteolus重组菌株被命名为菌株KDC01。

根据常规方法从乳酸乳球菌NBRC 100933、枯草芽孢杆菌NBRC 13719、热葡糖苷酶地芽孢杆菌NBRC 107763、嗜热脱氮地芽孢杆菌ATCC 29492和肺炎克雷伯氏菌NBRC 14940提取基因组DNA。

使用上述5种基因组DNA,通过PCR法分别扩增含有乳酸乳球菌的2-酮酸脱羧酶kivD基因的DNA片段;含有枯草芽孢杆菌的乙酰乳酸合酶alsS基因的DNA片段,该乙酰乳酸合酶具有2-酮酸脱羧酶活性;含有热葡糖苷酶地芽孢杆菌的乙酰乳酸合酶Geoth_3495基因的DNA片段,该乙酰乳酸合酶具有2-酮酸脱羧酶活性;含有嗜热脱氮地芽孢杆菌的乙酰乳酸合酶Gtng_0348基因的DNA片段,该乙酰乳酸合酶具有2-酮酸脱羧酶活性;以及含有肺炎克雷伯氏菌的吲哚丙酮酸脱羧酶ipdC基因的DNA片段,该吲哚丙酮酸脱羧酶具有2-酮酸脱羧酶活性。

以下引物用于PCR。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增乳酸乳球菌kivD基因的引物

(a-6)5’-GCA

(b-6)5’-GCA

向引物(a-6)添加了NdeI限制性酶切位点,向引物(b-6)添加了BamHI限制性酶切位点。

用于扩增枯草芽孢杆菌alsS基因的引物

(a-7)5’-GCA

(b-7)5’-GCA

向引物(a-7)添加了NdeI限制性酶切位点,向引物(b-7)添加了BamHI限制性酶切位点。

用于扩增热葡糖苷酶地芽孢杆菌Geoth_3495基因的引物

(a-8)5’-CGAGTC

(b-8)5’-GCA

向引物(a-8)添加了NdeI限制性酶切位点,向引物(b-8)添加了BamHI限制性酶切位点。

用于扩增嗜热脱氮地芽孢杆菌Gtng_0348基因的引物

(a-9)5’-CGAGTC

(b-9)5’-GCA

向引物(a-9)添加了NdeI限制性酶切位点,向引物(b-9)添加了BamHI限制性酶切位点。

用于扩增肺炎克雷伯氏菌ipdC基因的引物

(a-10)5’-CGAGTC

(b-10)5’-CGC

向引物(a-10)添加了NdeI限制性酶切位点,向引物(b-10)添加了BamHI限制性酶切位点。

对生成的反应液使用1%琼脂糖凝胶进行电泳,检测到关于乳酸乳球菌kivD基因、枯草芽孢杆菌alsS基因、热葡糖苷酶地芽孢杆菌Geoth_3495基因、嗜热脱氮地芽孢杆菌Gtng_0348基因和肺炎克雷伯氏菌ipdC基因各自的约1.7-kb DNA片段。

使用限制酶NdeI和HindIII切割通过上述PCR扩增的约1.7kb的DNA片段,所述DNA片段各自含有乳酸乳球菌kivD基因、枯草芽孢杆菌alsS基因、热葡糖苷酶地芽孢杆菌Geoth_3495基因、嗜热脱氮地芽孢杆菌Gtng_0348基因或肺炎克雷伯氏菌ipdC基因。上述的克隆载体pCYK21的约10.6-kb DNA片段也使用限制酶NdeI和HindIII切割。使用T4 DNA连接酶(Takara Bio Inc.制造)将5个所切割的1.7-kb DNA片段中的每一个和所述10.6-kb DNA片段彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978),并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

含有乳酸乳球菌kivD基因的质粒被命名为pC-Lla-kivD,含有枯草芽孢杆菌alsS基因的质粒被命名为pC-Bsu-alsS,含有热葡糖苷酶地芽孢杆菌Geoth_3495的质粒被命名为pC-Gtg-3495,含有嗜热脱氮地芽孢杆菌Gtng_0348基因的质粒被命名为pC-Gtd-0348,含有肺炎克雷伯氏菌ipdC基因的质粒被命名为pC-Kpn-ipdC。

根据常规方法从肺炎克雷伯氏菌NBRC 14940、热小链地芽孢杆菌NBRC 15316和热葡糖苷酶地芽孢杆菌NBRC 107763中提取基因组DNA。

将上述3个基因组DNA各自用作模板,通过PCR方法分别扩增含有肺炎克雷伯氏菌的醇脱氢酶基因adhP的DNA片段、含有热小链地芽孢杆菌的醇脱氢酶基因ahdP的DNA片段、含有热葡糖苷酶地芽孢杆菌的醇脱氢酶基因ahdP的DNA片段、以及含有热葡糖苷酶地芽孢杆菌的醇脱氢酶基因adhA的DNA片段。以下引物用于PCR。根据常规方法,使用LifeTechnologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增肺炎克雷伯氏菌adhP基因的引物

(a-11)5’-CGAGTC

(b-11)5’-CGC

向引物(a-11)添加了NdeI限制性酶切位点,向引物(b-11)添加了EcoRI限制性酶切位点。

用于扩增热小链地芽孢杆菌adhP基因的引物

(a-12)5’-CGAGTC

(b-12)5’-GCA

向引物(a-12)添加了NdeI限制性酶切位点,向引物(b-12)添加了BamHI限制性酶切位点。

用于扩增热葡糖苷酶地芽孢杆菌adhP基因的引物

(a-13)5’-CGAGTC

(b-13)5’-CGC

向引物(a-13)添加了NdeI限制性酶切位点,向引物(b-13)添加了EcoRI限制性酶切位点。

用于扩增热葡糖苷酶地芽孢杆菌adhA基因的引物

(a-14)5’-CGAGTC

(b-14)5’-GCA

向引物(a-14)添加了NdeI限制性酶切位点,向引物(b-14)添加了BamHI限制性酶切位点。

对生成的反应液使用1%琼脂糖凝胶进行电泳,检测到关于肺炎克雷伯氏菌adhP基因、热小链地芽孢杆菌adhP基因、热葡糖苷酶地芽孢杆菌adhP基因和热葡糖苷酶地芽孢杆菌adhP基因各自的约1.0-kb DNA片段。

使用限制酶NdeI和BamHI切割通过上述PCR扩增的各自含有热小链地芽孢杆菌adhP基因和热葡糖苷酶地芽孢杆菌adhA基因的约1.0-kb DNA片段。上述的克隆载体pCYK21的约10.6-kb DNA片段也使用限制性酶NdeI和BamHI切割。使用T4 DNA连接酶(Takara BioInc.制造)将各个所切割的1.0-kb DNA片段和所述10.6-kb DNA片段彼此连接。

使用限制酶NdeI和EcoRI切割通过PCR扩增的各自含有肺炎克雷伯氏菌adhP基因和热葡糖苷酶地芽孢杆菌adhP基因的约1.0-kb DNA片段。上述的克隆载体pCYK21的约10.6-kb DNA片段也使用限制酶NdeI和EcoRI切割。使用T4 DNA连接酶(Takara Bio Inc.制造)将各个所切割的1.0-kb DNA片段和所述10.6-kb DNA片段彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978),并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

含有肺炎克雷伯氏菌adhP基因的质粒被命名为pC-Kpn-adhP,含有热小链地芽孢杆菌adhP基因的质粒被命名为pC-Gtc-adhP,含有热葡糖苷酶地芽孢杆菌adhP基因的质粒被命名为pC-Gtg-adhP,以及含有热葡糖苷酶地芽孢杆菌adhA基因的质粒被命名为pC-Gtg-adhA。

表1显示了Hydrogenophilus thermoluteolus重组菌株所具有的质粒。

[表1]

使用铂环将如上所述获得的各个导入了2-酮酸脱羧酶基因的菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

如此培养和增殖的细菌细胞通过离心(4℃,15,000rpm,1分钟)进行回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量2-酮酸脱羧酶活性。将粗酶液、50mM Tris-HCl(pH 6.8)、2.5mM MgSO

结果,在导入了乳酸乳球菌的密码子优化kivD的菌株KDC01中检测到0.65U/mg的目的2-酮酸脱羧酶活性。

另一方面,在导入了乳酸乳球菌的天然型kivD的菌株KDC02、导入了枯草芽孢杆菌alsS的菌株KDC03、导入了热葡糖苷酶地芽孢杆菌Geoth_3495的菌株KDC04、导入了嗜热脱氮地芽孢杆菌Gtng_0348的菌株KDC05和导入了肺炎克雷伯氏菌ipdC的菌株KDC06中,未观察到2-酮酸脱羧酶活性。

对导入了空载体(pCYK21)的Hydrogenophilus thermoluteolus菌株TH-1进行相同的实验,结果没有观察到2-酮酸脱羧酶活性。

使用铂环将如上所述获得的各个导入了醇脱氢酶基因的Hydrogenophilusthermoluteolus菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

如此培养和增殖的细菌细胞通过离心(4℃,15,000rpm,1分钟)进行回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量醇脱氢酶活性。将粗酶液、50mM Tris-HCl(pH8.0)、0.2mM NADH和100mM异丁醛混合,在50℃反应,并追踪源自NADH的340nm处吸光度下降,并分析反应初速度。由反应初速度和蛋白质浓度计算比活度。将每分钟产生1μmol异丁醇的酶量定义为1U(单位)。

结果,如表2所示,在导入了肺炎克雷伯氏菌adhP基因、热小链地芽孢杆菌adhP基因、热葡糖苷酶地芽孢杆菌adhP基因或热葡糖苷酶地芽孢杆菌adhA基因中任一种的所有转化体中都观察到活性。另一方面,对导入了空载体(pCYK21)的Hydrogenophilusthermoluteolus菌株TH-1进行相同的实验,结果没有观察到醇脱氢酶活性。

[表2]

使用异丁醛作为底物的醇脱氢酶在Hydrogenophilus thermoluteolus的adhP或adhA转基因菌株中的活性

根据常规方法,使用PCR,其中使用Life Technologies Inc.制造的“DNA热循环仪”并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,扩增含有编码肺炎克雷伯氏菌醇脱氢酶的adhP基因的DNA片段。将质粒pC-Kpn-adhP用作模板DNA,并使用以下引物对。

用于扩增肺炎克雷伯氏菌adhP基因的引物

(a-15)5’-CGC

(b-15)5’-CGC

向引物(a-15)和(b-15)添加了KpnI限制性酶切位点。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到肺炎克雷伯氏菌adhP基因的约1.0-kb的DNA片段。

各自用限制酶KpnI切割出如上所述获得的含有编码肺炎克雷伯氏菌醇脱氢酶的adhP基因的DNA片段,和上述的含有密码子优化的乳酸乳球菌kivD基因的质粒pC-opt-kivD的约12.3-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978),并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

在密码子优化的乳酸乳球菌kivD基因下游含有肺炎克雷伯氏菌adhP基因的质粒被命名为pC-opt-kivD&Kpn-adhP。

另外,该Hydrogenophilus thermoluteolus菌株被命名为菌株IBU-1。

将在上述(3-5)项目中获得的导入了异丁醇生成基因的Hydrogenophilusthermoluteolus菌株(IBU-1)用铂环接种到含有50μg/ml卡那霉素的A液体培养基中,并在温育期间供给H

温育后,通过离心(4℃,15,000rpm,1分钟)获得培养上清液,并对培养上清液中的异丁醇进行定量。结果,在培养上清液中确认生成了4mM的异丁醇。

按照常规方法,分别从氧化葡糖杆菌NBRC 3292、运动发酵单胞菌NBRC 13756、棕榈发酵细菌NBRC 102412和巴氏醋杆菌NBRC105184中提取基因组DNA。

使用上述4种基因组DNA中的每一种为模板,分别通过PCR法扩增了含有氧化葡糖杆菌、运动发酵单胞菌、棕榈发酵细菌和巴氏醋杆菌的丙酮酸脱羧酶pdc基因的DNA片段。以下引物用于PCR。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增氧化葡糖杆菌pdc基因的引物

(a-16)5’-GCA

(b-16)5’-GCA

向引物(a-16)添加了NdeI限制性酶切位点,向引物(b-16)添加了BamHI限制性酶切位点。

用于扩增运动发酵单胞菌pdc基因的引物

(a-17)5’-CGAGTC

(b-17)

5’-CGCGTCGACTTAGCTACGCAGATCGATAACCATAC-3’(SEQ ID NO:75)

向引物(a-17)添加了NdeI限制性酶切位点,向引物(b-17)添加了SalI限制性酶切位点。

用于扩增棕榈发酵细菌pdc基因的引物

(a-18)5’-GCA

(b-18)5’-GCA

向引物(a-18)添加了NdeI限制性酶切位点,向引物(b-18)添加了SalI限制性酶切位点。

用于扩增巴氏醋杆菌pdc基因的引物

(a-19)5’-GCA

(b-19)5’-GCA

向引物(a-19)添加了NdeI限制性酶切位点,向引物(b-19)添加了SalI限制性酶切位点。

对生成的反应液使用1%琼脂糖凝胶进行电泳,并检测到氧化葡糖杆菌、运动发酵单胞菌、棕榈发酵细菌和巴氏醋杆菌的pdc基因各自的约1.7-kb DNA片段。

各自使用限制酶NdeI和BamHI切割出通过上述PCR扩增的氧化葡糖杆菌源性pdc基因的约1.7-kb DNA片段,以及上述的克隆载体pCYK21的约10.6-kb的DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

各自使用限制酶NdeI和SalI切割出通过上述PCR扩增的各自含有运动发酵单胞菌、棕榈发酵细菌和巴氏醋杆菌pdc基因的约1.7kb DNA片段。上述的克隆载体pCYK21的约10.6-kb DNA片段也使用限制酶NdeI和SalI切割。使用T4 DNA连接酶(Takara Bio Inc.制造)将各个所切割的1.7-kb DNA片段和所述10.6-kb DNA片段彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus菌株TH-1(NBRC 14978),并将转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

用限制酶NdeI和BamHI切割含有氧化葡糖杆菌源性pdc基因的质粒,并确认插入的片段。结果,除了质粒pCYK21的约10.6-kb DNA片段外,还观察到氧化葡糖杆菌源性pdc基因的长度约1.7-kb的插入片段。

用限制酶NdeI和SalI切割各自含有运动发酵单胞菌、棕榈发酵细菌和巴氏醋杆菌pdc基因的质粒,并确认插入的片段。结果,除了质粒pCYK21的约10.6-kb DNA片段外,还观察到运动发酵单胞菌、棕榈发酵细菌和巴氏醋杆菌pdc基因各自的长度约1.7-kb的插入片段。

含有氧化葡糖杆菌源性pdc基因的质粒被命名为pC-Gox-pdc,含有运动发酵单胞菌pdc基因的质粒被命名为pC-Zmo-pdc,含有棕榈发酵细菌pdc基因的质粒被命名为pC-Zpa-pdc,以及含有巴氏醋杆菌pdc基因的质粒被命名为pC-Apa-pdc。

详细内容如“(3)具有异丁醇生成能力的转化体”的(3-3)项目中所述。

根据常规方法从大肠杆菌K12 MG1655提取基因组DNA。另外,热纤梭菌ATCC 27405的基因组DNA是从国立技术与评估研究院(NBRC)获得的。

这些基因组DNA各自用作模板,并通过PCR法扩增含有醛-醇脱氢酶基因adhE的DNA片段。以下引物用于PCR。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增大肠杆菌adhE基因的引物

(a-20)5’-GCA

(b-20)5’-GCA

向引物(a-20)添加了NdeI限制性酶切位点,向引物(b-20)添加了BamHI限制性酶切位点。

用于扩增热纤梭菌adhE基因的引物

(a-21)5’-GCA

(b-21)5’-GCA

向引物(a-21)添加了NdeI限制性酶切位点,向引物(b-21)添加了PstI限制性酶切位点。

对2μl所生成的反应液使用1%琼脂糖凝胶进行电泳,检测到源自于大肠杆菌的adhE基因和源自于热纤梭菌的adhE基因各自约2.7-kb的DNA片段。

各自使用限制酶NdeI和BamHI切割出通过上述PCR扩增的大肠杆菌源性adhE基因的约2.7-kb DNA片段,以及上述的克隆载体pCYK21的约10.6-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

各自使用限制酶NdeI和PstI切割出通过上述PCR扩增的热纤梭菌源性adhE基因的约2.7-kb DNA片段,以及上述的克隆载体pCYK21的约10.6-kb DNA片段。所切割的DNA片段用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus TH-1(NBRC 14978),并将转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

含有大肠杆菌源性adhE基因的质粒被命名为pC-Eco-adhE,含有热纤梭菌源性adhE基因的质粒被命名为pC-Cth-adhE。

表3中显示了导入各转化体中的质粒。

[表3]

各Hydrogenophilus thermoluteolus重组菌株所具有的质粒

使用铂环将导入了丙酮酸脱羧酶基因(pdc基因)的菌株PDC01、PDC02、PDC03和PDC04接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

培养增殖的细菌细胞通过离心(4℃,15,000rpm,1分钟)回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量丙酮酸脱羧酶活性。将粗酶液、250mM磷酸钠(pH 6.2)、1mM MgCl

结果,在导入了氧化葡糖杆菌pdc基因的菌株PDC01中检测到3.0U/mg的目的丙酮酸脱羧酶活性。

另一方面,在导入了运动发酵单胞菌pdc基因的菌株PDC02、导入了棕榈发酵细菌pdc基因的菌株PDC03和导入了巴氏醋杆菌pdc基因的菌株PDC04中均未检测到丙酮酸脱羧酶活性。

另外,对Hyalophilus thermoluteolus野生菌株(仅具有空载体(pCYK21)的TH-1菌株)进行了相同的实验,结果未观察到丙酮酸脱羧酶活性。

使用铂环将导入了醇脱氢酶基因的各Hydrogenophilus thermoluteolus菌株ADH01、ADH02、ADH03和ADH04接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

培养增殖的细菌细胞各自通过离心(4℃,15,000rpm,1分钟)回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量使用乙醛作为底物的醇脱氢酶活性。将粗酶液、50mMTris-HCl(pH 8.0)、0.2mM NADH和90mM乙醛混合,在50℃反应,并追踪源自NADH的340nm处吸光度下降,并分析反应初速度。由反应初速度和蛋白质浓度计算比活度。将每分钟产生1μmol乙醇的酶量定义为1U(单位)。

结果,如表4所示,在菌株ADH01至ADH04中检测到目的醇脱氢酶活性。肺炎克雷伯氏菌源性adhP基因和热葡糖苷酶地芽孢杆菌源性adhP基因显示出特别高的活性。对热小链地芽孢杆菌源性adhP基因和热葡糖苷酶地芽孢杆菌源性adhA基因也检测出醇脱氢酶活性。对导入了空载体(pCYK21)的Hydrogenophilus thermoluteolus菌株TH-1进行了相同的实验,结果没有观察到醇脱氢酶活性。

表4显示了在已导入adhP基因或adhA基因的Hydrogenophilus thermoluteolus菌株中,使用乙醛作为底物的醇脱氢酶活性值。

[表4]

AdhE编码的醛-醇脱氢酶的活性在需氧条件下受到抑制。使用上述质粒pC-Eco-adhE,通过反向PCR制备大肠杆菌源性adhE的突变体(adhE(E568K)),在所述突变体中568位的谷氨酸(E568)被赖氨酸(K)取代,使得即使在需氧条件下也显示出高醛-醇脱氢酶活性。如此通过定点诱变获得的质粒被命名为pC-Eco-E568K。

对于热纤梭菌源性adhE,使用上述质粒pC-Cth-adhE通过反向PCR制备热纤梭菌源性adhE的突变体(adhE(D575N)),在所述突变体中575位的天冬氨酸(D575)被天冬酰胺(N)取代。如此通过定点诱变获得的质粒被命名为pC-Cth-D575N。

根据常规方法,用下述引物以及pC-Eco-adhE和pC-Cth-adhE作为相应的模板,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行反向PCR。

用于导入大肠杆菌adhE基因的E568K突变的引物

(a-22)

5’-GAAGCTGGCGCTGCGCTTTATGGATATCCGTAAAC-3’(SEQ ID NO:84)

(b-22)

5’-TCGAAGTGAGTTTCCGGATGTTCGTACATAACCCA-3’(SEQ ID NO:85)

用于导入热纤梭菌adhE基因的D575N突变的引物

(a-23)

5’-ATGGCAATGAGATTTATGGATATAAGAAAGAGAGT-3’(SEQ ID NO:86)

(b-23)

5’-GTTCATAAAGTCAACTTCCGGATGTTCATACATCA-3’(SEQ ID NO:87)

对生成的反应液使用1%琼脂糖凝胶进行电泳,并对各大肠杆菌源性adhE的E568K突变体和热纤梭菌源性adhE的D575N突变体检测到约13-kb的DNA片段。

各扩增的DNA片段用T4多核苷酸激酶(Takara Bio Inc.制造)磷酸化,然后用T4DNA连接酶(Takara Bio Inc.制造)连接(通过自连接)。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus NBRC14978,并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

表5显示了导入突变adhE基因的Hydrogenophilus thermoluteolus重组菌株所具有的质粒。

[表5]

将(4-3)项目中制成的导入了醛-醇脱氢酶基因的Hydrogenophilusthermoluteolus转基因菌株(ADH05,ADH06)、以及(4-5)项目中制成的导入了突变型醛-醇脱氢酶基因的Hydrogenophilus thermoluteolus转基因菌株(ADH07,ADH08)用铂环接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

培养增殖的细菌细胞通过离心(4℃,15,000rpm,1分钟)回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量使用乙醛作为底物的醇脱氢酶活性。将粗酶液、50mMTris-HCl(pH 8.0)、0.2mM NADH和90mM乙醛混合,在50℃反应,并追踪源自NADH的340nm处吸光度下降,并分析反应初速度。由反应初速度和蛋白质浓度计算比活度。将每分钟产生1μmol乙醇的酶量定义为1U(单位)。

如上所述,adhE基因编码的醛-醇脱氢酶是一种双功能酶,它兼具催化乙酰辅酶A转化为乙醛的反应的醛脱氢酶活性和催化乙醛转化为乙醇的反应的醇脱氢酶活性。在此,将使用乙醛作为底物生成乙醇的反应用作指标,评价adhE基因的表达。然而,上述各菌株还具有催化乙酰辅酶A转化为乙醛的反应的醛脱氢酶活性。

结果,与导入了野生型基因的菌株ADH05和ADH06相比,导入了突变基因的菌株ADH07和ADH08的活性分别提高了1.5倍和3.4倍,如表6所示。

[表6]

按照常规方法,使用PCR扩增含有编码肺炎克雷伯氏菌醇脱氢酶的adhP基因的DNA片段,其中使用Life Technologies Inc.制造的“DNA热循环仪”并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂。将质粒pC-Kpn-adhP用作模板DNA,并使用以下引物对。

用于扩增热葡糖苷酶地芽孢杆菌adhP基因的引物

(a-24)5’-CGC

(b-24)5’-CGC

向引物(a-24)和(b-24)添加了KpnI限制性酶切位点。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到对应于热葡糖苷酶地芽孢杆菌源性adhP基因的约1.0-kb的DNA片段。

各自通过限制酶KpnI切割出通过上述PCR扩增的肺炎克雷伯氏菌adhP基因的约1.0-kb DNA片段、以及含有氧化葡糖杆菌pdc基因的质粒pC-Gox-pdc的约12.3-kb DNA片段。所切割的DNA片段用T4DNA连接酶(Takara Bio Inc.制造)彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus NBRC14978,并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的活菌株接种到装有5ml含有50μg/ml卡那霉素的A液体培养基的试管中。将H

在氧化葡糖杆菌pdc基因下游含有热葡糖苷酶地芽孢杆菌adhP基因的质粒被命名为pC-Gox-pdc&Kpn-adhP。

具有该质粒的菌株被命名为Hydrogenophilus thermoluteolus菌株ETH-1。

将在上述(4-7)项目中获得的导入了乙醇生成基因的Hydrogenophilusthermoluteolus菌株(ETH-1菌株)用铂环接种到含有50μg/ml卡那霉素的A液体培养基中,并在伴随温育供给H

温育后,通过离心(4℃,15,000rpm,1分钟)获得培养上清液,并且作为定量其中的乙醇的结果,在培养上清液中确认生成了10mM的乙醇。

根据常规方法从嗜热脂肪地芽孢杆菌ATCC 12980中提取基因组DNA。另外,嗜热栖热菌菌株HB8(ATCC 27634)的基因组DNA购自Takara BioInc.。

使用嗜热脂肪地芽孢杆菌ATCC 12980的基因组DNA和嗜热栖热菌菌株HB8(ATCC27634)的基因组DNA中的每一种作为模板,并使用以下引物对,通过PCR扩增含有丙氨酸脱氢酶基因的DNA片段。根据常规方法,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。

用于扩增嗜热脂肪地芽孢杆菌alaD1基因的引物

(a-25)5’-TCCGGCGGG

(b-25)5’-AA

向引物(a-25)添加了NdeI限制性酶切位点,向引物(b-25)添加了EcoRI限制性酶切位点。

用于扩增嗜热脂肪地芽孢杆菌alaD2基因的引物

(a-26)5’-TCCGGCGGG

(b-26)5’-AA

向引物(a-26)添加了NdeI限制性酶切位点,向引物(b-26)添加了EcoRI限制性酶切位点。

用于扩增嗜热栖热菌alaD1基因的引物

(a-27)5’-CCGGCGGG

(b-27)5’-AA

向引物(a-27)添加了NdeI限制性酶切位点,向引物(b-27)添加了EcoRI限制性酶切位点。

用于扩增嗜热栖热菌alaD2基因的引物

(a-28)5’-CGGCGGG

(b-28)5’-AA

向引物(a-28)添加了NdeI限制性酶切位点,向引物(b-28)添加了EcoRI限制性酶切位点。

对生成的反应液使用1%琼脂糖凝胶进行电泳,在嗜热脂肪地芽孢杆菌alaD1基因的情况下检测到约1.6-kb的DNA片段,在嗜热地热芽孢杆菌alaD2基因、嗜热栖热菌alaD1基因和嗜热栖热菌alaD2基因各自的情况下检测到约1.1-kb的DNA片段。

各自通过限制性酶NdeI和EcoRI切割出通过上述PCR扩增的嗜热脂肪地芽孢杆菌alaD1基因的约1.6-kb DNA片段、嗜热脂肪地芽孢杆菌alaD2基因的约1.1-kb DNA片段、嗜热栖热菌alaD1基因的约1.1-kb DNA片段和嗜热栖热菌alaD2基因的约1.1-kb DNA片段。上述克隆载体pCYK21的约10.6-kb DNA片段也通过限制酶NdeI和EcoRI切割。各个所切割的1.6-kb或1.1-kb DNA片段和所述10.6-kb DNA片段使用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus NBRC14978,并将所得的转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

含有嗜热脂肪地芽孢杆菌alaD1基因的质粒被命名为pC-Gst-alaD1,含有嗜热脂肪地芽孢杆菌alaD2基因的质粒被命名为pC-Gst-alaD2,含有嗜热栖热菌alaD1基因的质粒被命名为pC-Tth-alaD1,而含有嗜热栖热菌alaD2基因的质粒被命名为pC-Tth-alaD2。表7显示了Hydrogenophilus thermoluteolus的这些重组菌株所具有的质粒。

[表7]

将导入了丙氨酸脱氢酶基因的Hydrogenophilus thermoluteolus菌株——ALA01、ALA02、ALA03和ALA04菌株,各自使用铂环接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

培养增殖的细菌细胞各自通过离心(4℃,15,000rpm,1分钟)回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量丙氨酸脱氢酶活性。将粗酶液、100mM Tris-HCl(pH8.5)、100mM NH

表8显示了由导入alaD基因的Hydrophoophilus thermoluteolus菌株产生的丙氨酸脱氢酶活性值。

[表8]

如表8所示,在菌株ALA01、ALA02、ALA03和ALA04中检测到目的丙氨酸脱氢酶活性。嗜热脂肪地芽孢杆菌源性alaD2基因表现出特别高的活性。另一方面,对导入了空载体(pCYK21)的Hydrogenophilus thermoluteolus菌株TH-1进行相同的实验,结果没有观察到丙氨酸脱氢酶活性。

合成以下各对寡核苷酸,以制备编码待添加的多肽的DNA片段。每对寡核苷酸的序列彼此互补。

序列MKIEEGKLVIH(SEQ ID NO:37)的多肽(麦芽糖结合蛋白N末端的序列)

(a-29)5’-TATGAAAATCGAAGAAGGTAAACTGGTAATCCA-3’(SEQ ID NO:98)

(b-29)5’-TATGGATTACCAGTTTACCTTCTTCGATTTTCA-3’(SEQ ID NO:99)

序列MSKIKH(SEQ ID NO:100)的多肽[Journal of Bioscience andBioengineering,123,540-546(2017)]

(a-30)5’-TATGAGCAAGATCAAACA-3’(SEQ ID NO:101)

(b-30)5’-TATGTTTGATCTTGCTCA-3’(SEQ ID NO:102)

序列MDFPVAEDRRH(SEQ ID NO:103)的多肽(谷胱甘肽S-转移酶N末端的序列)

(a-31)5’-TATGTCGCCGATCCTCGGCTACTGGAAAATCCA-3’(SEQ ID NO:104)

(b-31)5’-TATGGATTTTCCAGTAGCCGAGGATCGGCGACA-3’(SEQ ID NO:105)

序列MTENAEKFLWH(SEQ ID NO:106)的多肽(β-葡糖苷酶N末端的序列)

(a-32)5’-TATGACCGAGAACGCCGAAAAATTCCTTTGGCA-3’(SEQ ID NO:107)

(b-32)5’-TATGCCAAAGGAATTTTTCGGCGTTCTCGGTCA-3’(SEQ ID NO:108)

将寡核苷酸(a-29)和(b-29)、(a-30)和(b-30)、(a-31)和(b-31)、(a-32)和(b-32)各自等摩尔(mol)量混合,并将混合的溶液从98℃逐渐冷却至20℃。由于寡核苷酸的退火,制备了编码多肽序列的双链DNA片段。这些DNA片段的两端等同于限制性酶NdeI切割产生的粘性末端。

另外,为了制备由序列MGKDHLIHNVHKEEHAHAHNKH(SEQ ID NO:109)(HAT序列)的编码碱基序列组成的DNA片段,使用下述引物对,使用Life Technologies Inc.制造的“DNA热循环仪”,并使用KOD FX Neo(东洋纺株式会社制造)作为反应试剂,进行PCR。由于使用每个引物作为另一个的模板进行延伸,因此不包含模板DNA。

用于制备HAT序列的引物

(a-33)

5’-CGCATATGGGCAAGGATCATCTCATCCACAATGTCCACAAAGAGG-3’(SEQ ID NO:110)

(b-33)

5’-CGCATATGCTTGTTGTGGGCATGAGCGTGCTCCTCTTTGTGGACA-3’(SEQ ID NO:111)

引物(a-33)和(b-33)的3'末端的碱基序列彼此互补。向引物(a-33)和引物(b-33)添加了NdeI限制性酶切位点。

对所生成的反应液使用1%琼脂糖凝胶进行电泳,结果,检测到对应于HAT序列的约0.1-kb的DNA片段。扩增的HAT序列的约0.1-kb DNA片段通过限制酶NdeI切割。

含有嗜热脂肪地芽孢杆菌alaD2基因的质粒pC-Gst-alaD2通过限制酶NdeI切割。将该质粒和在两个末端由于限制酶NdeI的切割而具有突出端的上述各DNA片段(在“待添加多肽的编码DNA片段的制备”项目中制备的5种双链DNA片段)混合,并用T4 DNA连接酶(Takara Bio Inc.制造)彼此连接。

所得的连接液用于通过电脉冲法转化Hydrogenophilus thermoluteolus NBRC14978,并将转化体涂布到含50μg/ml卡那霉素的A固体培养基上,并在封入H

使用铂环将A固体培养基上的各活菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

用于添加麦芽糖结合蛋白的N末端序列以产生融合肽的质粒被命名为pMBP-Gst-alaD2,用于添加序列MSKIKH以产生融合肽的质粒被命名为pSKIK-Gst-alaD2,用于添加谷胱甘肽S-转移酶的N末端序列以产生融合肽的质粒被命名为pGST-Gst-alaD2,用于添加β-葡糖苷酶的N末端序列以产生融合肽的质粒被命名为pGlu-Gst-alaD2,以及用于添加HAT标签序列以产生融合肽的质粒被命名为pHAT-Gst-alaD2。

表9显示了所述重组菌株所具有的质粒。

[表9]

使用铂环将在项目(5-4)中制成的导入了多肽融合丙氨酸脱氢酶基因的Hydrogenophilus thermoluteolus转基因菌株接种到装有5ml含50μg/ml卡那霉素的A液体培养基的试管中。将H

培养增殖的细菌细胞各自通过离心(4℃,15,000rpm,1分钟)回收。通过超声处理破碎细菌细胞,然后离心(4℃,15,000rpm,5分钟)以获得细胞破碎上清液。将所述细胞破碎上清液用作粗酶液,通过以下方法测量丙氨酸脱氢酶活性。将粗酶液、100mM Tris-HCl(pH8.5)、100mM NH

表10显示了由Hydrophoophilus thermoluteolus的alaD转基因菌株产生的丙氨酸脱氢酶活性。

[表10]

如表10所示,与导入了嗜热脂肪地芽孢杆菌alaD2基因的菌株(ALA02菌株)相比,只有ALA05菌株显示出更高的丙氨酸脱氢酶活性。

将导入了丙氨酸脱氢酶基因的Hydrogenophilus thermoluteolus转基因菌株ALA05用铂环接种到含有50μg/ml卡那霉素的A液体培养基中,并在温育期间供给H

温育后,通过离心(4℃,15,000rpm,1分钟)获得培养上清液,并且作为定量其中的丙氨酸的结果,在培养上清液中确认生成了5mM的丙氨酸。

下表11中所示的各菌株都保藏在国立技术与评估研究院的NITE专利微生物保藏中心(日本千叶县木更津市,2-5-8Kazusakamatari(邮政编号292-0818))。表11列出了保藏日期和保藏号。因此,这些菌株可供公众使用。

[表11]

此外,本说明书中描述的全部菌株(包括ATCC菌株和NBRC菌株)都根据《布达佩斯条约》进行国际保藏,或者由提供该菌株的组织没有任何条款或条件地保有,或已在市场出售,因此,所述菌株均可供公众使用。

工业实用性

本发明的转化体利用二氧化碳作为唯一的碳源,有效生成异丁醇、乙醇或丙氨酸,因此,由于二氧化碳增加导致的全球变暖以及难以确保食物、饲料和燃料这两个问题,均可得以解决。

序列表

<110> 株式会社CO2资源化研究所(Utilization of Carbon Dioxide InstituteCo.,Ltd. )

<120> 嗜氢菌属细菌转化体

<130> FPR0007WO

<150> JP 2018-86100

<151> 2018-04-27

<160> 111

<170> PatentIn version 3.5

<210> 1

<211> 1647

<212> DNA

<213> 人工序列

<220>

<223> 编码乳酸乳球菌(Lactococcus lactis)的2-酮酸脱羧酶的DNA

<400> 1

atgtataccg tcggcgacta cctgctggat cgcctgcacg agctgggcat cgaggagatc 60

ttcggcgtcc cgggcgatta caatctgcag ttcctggatc agatcatctc gcgcaaggac 120

atgaaatggg tgggcaatgc gaacgaactg aacgcctcgt acatggcgga tggctacgcg 180

cggaccaaga aggccgccgc cttcctgacc accttcggcg tcggcgaact gtcggcggtc 240

aatggcctgg cgggctccta cgcggaaaat ctgcccgtcg tcgagatcgt gggctccccg 300

acgtcgaagg tgcagaacga aggcaagttc gtgcaccaca cgctggccga cggcgacttc 360

aagcacttca tgaaaatgca tgagcccgtc accgccgcgc ggacgctgct gacggccgag 420

aacgccacgg tggaaatcga ccgggtcctg tcggcgctgc tgaaagagcg caagccggtc 480

tatatcaatc tgccggtgga cgtggccgcc gcgaaagcgg aaaagccctc cctgccgctg 540

aaaaaggaga attcgacctc gaatacgagc gaccaggaga tcctgaacaa gatccaggaa 600

agcctgaaaa acgcgaagaa gccgatcgtc atcaccggcc acgaaatcat ctcgttcggc 660

ctggagaaga ccgtctcgca gttcatctcc aagaccaagc tgccgatcac gacgctgaac 720

ttcggcaagt cgtccgtcga cgaagccctg cccagcttcc tgggcatcta caacggcaaa 780

ctgtccgagc ccaacctgaa agagttcgtc gagtcggcgg atttcatcct gatgctgggc 840

gtcaagctga ccgatagctc gaccggcgcg ttcacccatc acctgaacga gaacaagatg 900

atctcgctga atatcgacga aggcaaaatc ttcaacgagt cgatccagaa cttcgatttc 960

gaaagcctga tctcctcgct gctggacctg agcgagatcg aatacaaggg caagtatatc 1020

gacaaaaagc aagaagactt cgtcccgagc aacgccctgc tgagccagga ccggctgtgg 1080

caggccgtcg aaaacctgac ccagtcgaat gaaaccatcg tcgcggagca gggcacctcg 1140

ttcttcggcg ccagctcgat cttcctgaag ccgaagtccc acttcatcgg ccagccgctg 1200

tggggctcca tcggctatac cttcccggcg gccctgggca gccagatcgc cgacaaggaa 1260

agccgccatc tgctgttcat cggcgacggc tcgctgcagc tgacggtgca ggaactgggc 1320

ctggccatcc gcgagaagat caaccccatc tgcttcatca tcaataacga cggctacacc 1380

gtggagcggg aaatccacgg ccccaaccag agctacaacg acatcccgat gtggaattac 1440

tcgaaactgc ccgagtcgtt cggcgcgacc gaggaacggg tggtgtccaa gatcgtccgc 1500

accgagaatg agttcgtcag cgtgatgaag gaagcccagg cggacccgaa ccgcatgtat 1560

tggatcgaac tgatcctggc gaaggaagac gcccccaagg tcctgaagaa gatgggcaag 1620

ctgttcgcgg agcagaacaa gagctaa 1647

<210> 2

<211> 1011

<212> DNA

<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)

<400> 2

atgaaggcag ctgttgttac ccacgaccat caggttaacg tcacggaaaa aacgctgcgc 60

ccgctggaat acggcgaagc gctgttgaaa atggaatgct gcggcgtgtg tcatactgac 120

ctgcacgtga aaaacggcga ttttggcgat aaaaccggcg tcattctcgg ccatgaaggg 180

atcggggtgg tacaaaaagt cggcccgggc gtcacctccc tgaagccggg cgaccgcgcc 240

agcgtggcgt ggttcttcga aggctgcggc cactgcgatt actgtaacag cggcaacgag 300

acgctctgcc gctcggtgaa aaacgccggc tataccgtcg atggcggcat ggcggaagag 360

tgcatcgtca ccgccaacta cgcggtaaaa gttccggacg gcctcgactc cgccgccgcc 420

agcagcatca cctgcgcggg cgtcaccacc tacaaagcgg tcaaggtctc ccacatcaaa 480

ccgggccagt ggatcgccat ctacggcctc ggcgggttgg gtaacctcgc gctgcagtat 540

gcgaagaatg tctttaacgc caaagtgatc gctatcgacg tcaacgacgg acagctggag 600

ctggcggcct cgatgggcgc cgacctgacc atcaactccc gcaatgaaga tgcggcgaaa 660

gtgattcagg aaaaaaccgg cggcgcccac gctgcggtag taaccgcggt ggccaaagcg 720

gcctttaact cggcggtgga tgccgttcgc gccggtggcc gcgtggtcgc ggtgggcctg 780

ccgccggagg cgatgagcct cgatattccg cgtctggtgc tggacggcat cgaggtggtc 840

ggttcgctgg tcggcacccg tcaggatctg gtggaagcct tccagtttgc cgccgaaggc 900

aaagtagtgc cgaaagtcac cctgcgtccg ctggaagata tcaacgctat cttcaaagag 960

atggagcaag gtcagatccg cggccgtatg gttatcgatc tgcgtagcta a 1011

<210> 3

<211> 1011

<212> DNA

<213> 热小链地芽孢杆菌(Geobacillus thermocatenulatus)

<400> 3

atgaaagccg ccgttgttca caaattcaaa caaaaacttc aaattgaaga agtggagaaa 60

ccaaaactag ggtatggcga agtgcttgtg aaaattgaag cttgtggcgt ctgccatacc 120

gatttgcatg cggcccatgg agattggcca gtaaaaccga aacttccgct tattcctggt 180

catgaaggag taggaatcgt tgttgaggtc ggcgagggag tgaaatcaat caaaattggc 240

gatcgtgttg gcattccatg gttatactcg gcatgcggtg aatgtgaata ttgtttaagc 300

ggtcaagaaa cactttgtcc acatcaatta aatggtggat actctgtcga tggcagttat 360

gcagaatatt gcaaagcccc ggccgattat gtcgcacgaa ttcctaaaaa tctcgatcct 420

gtacaagttg ctcctattct ttgtgctgga gtcacaacgt ataaagcatt aaaagtttca 480

aatgccaagc ctggtgaatg ggtcgctatt tatggaatcg ggggattggg ccatattgct 540

cttcaatatg ccaaagcaat gggattaaat gtcgttgctg ttgatatcag tgatgaaaag 600

gcagagcttg cagcaaagtt aggagctgat attacaatca atggcctgcg tgaagacccc 660

gtagcaacaa ttcgtgaaaa agtaggcgga gtgcatgcag ctattagcgt tgctgtaacg 720

aaaaaagctt tcgaacaagc ctatcaatcc gttcgacgcg gtggttgcct tgtcatcgtt 780

ggactgcctc acgatgaact accgatccct atttttgaca ctgtattaaa tggcgttaca 840

ataaaaggtt cgatcgtcgg tacacgaaaa gatatgcaag aagctttaga tttcgccgca 900

cgcggaaaag ttcgccccat tgtggaagcg gtaccattag aaaaaattaa cgaagtattt 960

gaacggatgg aaaaaggcca aatcaatggc cgcattgttt taacaatgta a 1011

<210> 4

<211> 1023

<212> DNA

<213> 热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)

<400> 4

atgaaagcgg cagttgtcaa cgattttaaa caaaaattag aaattaaaga ggtggaaaaa 60

ccaaagctaa actacggaga agtgcttgtc aaaattgagg cttgcggcgt ttgccacacc 120

gatttgcatg cggcgcacgg agactggcca gtcaagccaa aactgccttt gattcccgga 180

cacgaagggg taggcattgt cgtcgaggtg gcagaagggg taaaatcggt taaagtcggc 240

gaccgtgtcg gcattccatg gctatactcc gcttgcggag aatgtgaata ttgcctaagc 300

gggcaagaaa cgctctgtcc gcatcaatta aacggtggat attccgccga tggaggatat 360

gcggaatact gcaaagcgcc tgccaattat gttgcaaaaa ttccggaaca cttggatccg 420

gtggaagtcg cgccaattct ctgcgcgggt gtaacgacat ataaagcgct aaaggtatct 480

aacgccaaac cgggagaatg ggtagccatc tacggaatcg gagggttagg gcatatcgcc 540

cttcaatacg cgaaagcaat gggattaaac gtcgtcgcgg tcgatattag cgacgaaaag 600

atagatctcg ccaaacagtt aggcgctgat attgccatca acggacgaaa agaggatcca 660

gtggaagcca ttcatcaaaa cgttggcgga gtacatgccg ccattagcgt tgccgtaacg 720

aaaaaagcgt tcgaacaagc ctatcaatcc gtaagacgcg gcggatgcct tgttgttgtc 780

ggactgccta atgaagactt gccgattcct attttcaata cggtattaaa cggaatcacg 840

gtgaaaggat cgatcgtcgg cacgagaaaa gatatgcaag aagcgttgga cttcgccgcg 900

aaaggaaaag tgcgcccgat cgtcgaaacc gctccattgg aaaaaatcaa tgaagtattt 960

gagagaatgg aaaaaggaaa aattaacggc cgagtcgttt taaccattgg tgtcaaccgc 1020

taa 1023

<210> 5

<211> 1041

<212> DNA

<213> 热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)

<400> 5

atgaaagcac ttacatacct agggccagga aaaaaagaat taatggaaaa accaaagcca 60

aaaattgaaa aggaaaccga tgcaatcgtc aaaataataa aaacaacgat ttgtggaacg 120

gatttgcaca ttctttcagg agatgttcct actgttgaag aagggcggat tttaggacac 180

gaaggcgtcg gaattattga agaagttggt tcggccgtaa agaattttaa aaaaggcgac 240

agagtgttga tttcttgcat tacctcttgt ggaaaatgcg aaaattgcaa gaaagggtta 300

tacgcccatt gcgaagatgg cggctggatc ttgggccact taattgatgg aactcaagca 360

gaatatgtaa gaattccgca cgcagacaac agcctttatc ctattccgga aggcgtggat 420

gaagagactc ttgtcatgct tagtgacatt cttccaacag gatttgaaat cggcgtgttg 480

aacggcaaag ttcagcctgg acaaaccgtc gccattatcg gagctggtcc cgtaggtatg 540

gcagcgctat taacagccca attttattca ccagcagaga tcattatggt tgatttagac 600

gataaccgtt tagaagttgc gaaaaaattt ggcgcgaccc aagtggtgaa tagcgctgat 660

ggcaaggcag tggaaaaaat tatggaatta accggcggga aaggtgtaga cgtcgcgatg 720

gaagccgtcg gaattccggc aacatttgat atttgtcaag aaattgtcaa accaggtggc 780

tatatcgcca atatcggtgt tcatggaaaa agcgtggaat ttcacattga aaaattatgg 840

atacgcaaca ttacgttgac aaccggtctt gtcaacacga cttctacgcc gatgttatta 900

aaaacggtgc agtcgaaaaa attgaagccg gaacaattaa ttacccatcg tttcgccttt 960

tcagacatta tgaaagcgta tgaagtattt ggaaatgcag caaaagaaaa agcgttaaaa 1020

gtcattattt ccaacagtta a 1041

<210> 6

<211> 336

<212> PRT

<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)

<400> 6

Met Lys Ala Ala Val Val Thr His Asp His Gln Val Asn Val Thr Glu

1 5 10 15

Lys Thr Leu Arg Pro Leu Glu Tyr Gly Glu Ala Leu Leu Lys Met Glu

20 25 30

Cys Cys Gly Val Cys His Thr Asp Leu His Val Lys Asn Gly Asp Phe

35 40 45

Gly Asp Lys Thr Gly Val Ile Leu Gly His Glu Gly Ile Gly Val Val

50 55 60

Gln Lys Val Gly Pro Gly Val Thr Ser Leu Lys Pro Gly Asp Arg Ala

65 70 75 80

Ser Val Ala Trp Phe Phe Glu Gly Cys Gly His Cys Asp Tyr Cys Asn

85 90 95

Ser Gly Asn Glu Thr Leu Cys Arg Ser Val Lys Asn Ala Gly Tyr Thr

100 105 110

Val Asp Gly Gly Met Ala Glu Glu Cys Ile Val Thr Ala Asn Tyr Ala

115 120 125

Val Lys Val Pro Asp Gly Leu Asp Ser Ala Ala Ala Ser Ser Ile Thr

130 135 140

Cys Ala Gly Val Thr Thr Tyr Lys Ala Val Lys Val Ser His Ile Lys

145 150 155 160

Pro Gly Gln Trp Ile Ala Ile Tyr Gly Leu Gly Gly Leu Gly Asn Leu

165 170 175

Ala Leu Gln Tyr Ala Lys Asn Val Phe Asn Ala Lys Val Ile Ala Ile

180 185 190

Asp Val Asn Asp Gly Gln Leu Glu Leu Ala Ala Ser Met Gly Ala Asp

195 200 205

Leu Thr Ile Asn Ser Arg Asn Glu Asp Ala Ala Lys Val Ile Gln Glu

210 215 220

Lys Thr Gly Gly Ala His Ala Ala Val Val Thr Ala Val Ala Lys Ala

225 230 235 240

Ala Phe Asn Ser Ala Val Asp Ala Val Arg Ala Gly Gly Arg Val Val

245 250 255

Ala Val Gly Leu Pro Pro Glu Ala Met Ser Leu Asp Ile Pro Arg Leu

260 265 270

Val Leu Asp Gly Ile Glu Val Val Gly Ser Leu Val Gly Thr Arg Gln

275 280 285

Asp Leu Val Glu Ala Phe Gln Phe Ala Ala Glu Gly Lys Val Val Pro

290 295 300

Lys Val Thr Leu Arg Pro Leu Glu Asp Ile Asn Ala Ile Phe Lys Glu

305 310 315 320

Met Glu Gln Gly Gln Ile Arg Gly Arg Met Val Ile Asp Leu Arg Ser

325 330 335

<210> 7

<211> 336

<212> PRT

<213> 热小链地芽孢杆菌(Geobacillus thermocatenulatus)

<400> 7

Met Lys Ala Ala Val Val His Lys Phe Lys Gln Lys Leu Gln Ile Glu

1 5 10 15

Glu Val Glu Lys Pro Lys Leu Gly Tyr Gly Glu Val Leu Val Lys Ile

20 25 30

Glu Ala Cys Gly Val Cys His Thr Asp Leu His Ala Ala His Gly Asp

35 40 45

Trp Pro Val Lys Pro Lys Leu Pro Leu Ile Pro Gly His Glu Gly Val

50 55 60

Gly Ile Val Val Glu Val Gly Glu Gly Val Lys Ser Ile Lys Ile Gly

65 70 75 80

Asp Arg Val Gly Ile Pro Trp Leu Tyr Ser Ala Cys Gly Glu Cys Glu

85 90 95

Tyr Cys Leu Ser Gly Gln Glu Thr Leu Cys Pro His Gln Leu Asn Gly

100 105 110

Gly Tyr Ser Val Asp Gly Ser Tyr Ala Glu Tyr Cys Lys Ala Pro Ala

115 120 125

Asp Tyr Val Ala Arg Ile Pro Lys Asn Leu Asp Pro Val Gln Val Ala

130 135 140

Pro Ile Leu Cys Ala Gly Val Thr Thr Tyr Lys Ala Leu Lys Val Ser

145 150 155 160

Asn Ala Lys Pro Gly Glu Trp Val Ala Ile Tyr Gly Ile Gly Gly Leu

165 170 175

Gly His Ile Ala Leu Gln Tyr Ala Lys Ala Met Gly Leu Asn Val Val

180 185 190

Ala Val Asp Ile Ser Asp Glu Lys Ala Glu Leu Ala Ala Lys Leu Gly

195 200 205

Ala Asp Ile Thr Ile Asn Gly Leu Arg Glu Asp Pro Val Ala Thr Ile

210 215 220

Arg Glu Lys Val Gly Gly Val His Ala Ala Ile Ser Val Ala Val Thr

225 230 235 240

Lys Lys Ala Phe Glu Gln Ala Tyr Gln Ser Val Arg Arg Gly Gly Cys

245 250 255

Leu Val Ile Val Gly Leu Pro His Asp Glu Leu Pro Ile Pro Ile Phe

260 265 270

Asp Thr Val Leu Asn Gly Val Thr Ile Lys Gly Ser Ile Val Gly Thr

275 280 285

Arg Lys Asp Met Gln Glu Ala Leu Asp Phe Ala Ala Arg Gly Lys Val

290 295 300

Arg Pro Ile Val Glu Ala Val Pro Leu Glu Lys Ile Asn Glu Val Phe

305 310 315 320

Glu Arg Met Glu Lys Gly Gln Ile Asn Gly Arg Ile Val Leu Thr Met

325 330 335

<210> 8

<211> 340

<212> PRT

<213> 热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)

<400> 8

Met Lys Ala Ala Val Val Asn Asp Phe Lys Gln Lys Leu Glu Ile Lys

1 5 10 15

Glu Val Glu Lys Pro Lys Leu Asn Tyr Gly Glu Val Leu Val Lys Ile

20 25 30

Glu Ala Cys Gly Val Cys His Thr Asp Leu His Ala Ala His Gly Asp

35 40 45

Trp Pro Val Lys Pro Lys Leu Pro Leu Ile Pro Gly His Glu Gly Val

50 55 60

Gly Ile Val Val Glu Val Ala Glu Gly Val Lys Ser Val Lys Val Gly

65 70 75 80

Asp Arg Val Gly Ile Pro Trp Leu Tyr Ser Ala Cys Gly Glu Cys Glu

85 90 95

Tyr Cys Leu Ser Gly Gln Glu Thr Leu Cys Pro His Gln Leu Asn Gly

100 105 110

Gly Tyr Ser Ala Asp Gly Gly Tyr Ala Glu Tyr Cys Lys Ala Pro Ala

115 120 125

Asn Tyr Val Ala Lys Ile Pro Glu His Leu Asp Pro Val Glu Val Ala

130 135 140

Pro Ile Leu Cys Ala Gly Val Thr Thr Tyr Lys Ala Leu Lys Val Ser

145 150 155 160

Asn Ala Lys Pro Gly Glu Trp Val Ala Ile Tyr Gly Ile Gly Gly Leu

165 170 175

Gly His Ile Ala Leu Gln Tyr Ala Lys Ala Met Gly Leu Asn Val Val

180 185 190

Ala Val Asp Ile Ser Asp Glu Lys Ile Asp Leu Ala Lys Gln Leu Gly

195 200 205

Ala Asp Ile Ala Ile Asn Gly Arg Lys Glu Asp Pro Val Glu Ala Ile

210 215 220

His Gln Asn Val Gly Gly Val His Ala Ala Ile Ser Val Ala Val Thr

225 230 235 240

Lys Lys Ala Phe Glu Gln Ala Tyr Gln Ser Val Arg Arg Gly Gly Cys

245 250 255

Leu Val Val Val Gly Leu Pro Asn Glu Asp Leu Pro Ile Pro Ile Phe

260 265 270

Asn Thr Val Leu Asn Gly Ile Thr Val Lys Gly Ser Ile Val Gly Thr

275 280 285

Arg Lys Asp Met Gln Glu Ala Leu Asp Phe Ala Ala Lys Gly Lys Val

290 295 300

Arg Pro Ile Val Glu Thr Ala Pro Leu Glu Lys Ile Asn Glu Val Phe

305 310 315 320

Glu Arg Met Glu Lys Gly Lys Ile Asn Gly Arg Val Val Leu Thr Ile

325 330 335

Gly Val Asn Arg

340

<210> 9

<211> 346

<212> PRT

<213> 热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)

<400> 9

Met Lys Ala Leu Thr Tyr Leu Gly Pro Gly Lys Lys Glu Leu Met Glu

1 5 10 15

Lys Pro Lys Pro Lys Ile Glu Lys Glu Thr Asp Ala Ile Val Lys Ile

20 25 30

Ile Lys Thr Thr Ile Cys Gly Thr Asp Leu His Ile Leu Ser Gly Asp

35 40 45

Val Pro Thr Val Glu Glu Gly Arg Ile Leu Gly His Glu Gly Val Gly

50 55 60

Ile Ile Glu Glu Val Gly Ser Ala Val Lys Asn Phe Lys Lys Gly Asp

65 70 75 80

Arg Val Leu Ile Ser Cys Ile Thr Ser Cys Gly Lys Cys Glu Asn Cys

85 90 95

Lys Lys Gly Leu Tyr Ala His Cys Glu Asp Gly Gly Trp Ile Leu Gly

100 105 110

His Leu Ile Asp Gly Thr Gln Ala Glu Tyr Val Arg Ile Pro His Ala

115 120 125

Asp Asn Ser Leu Tyr Pro Ile Pro Glu Gly Val Asp Glu Glu Thr Leu

130 135 140

Val Met Leu Ser Asp Ile Leu Pro Thr Gly Phe Glu Ile Gly Val Leu

145 150 155 160

Asn Gly Lys Val Gln Pro Gly Gln Thr Val Ala Ile Ile Gly Ala Gly

165 170 175

Pro Val Gly Met Ala Ala Leu Leu Thr Ala Gln Phe Tyr Ser Pro Ala

180 185 190

Glu Ile Ile Met Val Asp Leu Asp Asp Asn Arg Leu Glu Val Ala Lys

195 200 205

Lys Phe Gly Ala Thr Gln Val Val Asn Ser Ala Asp Gly Lys Ala Val

210 215 220

Glu Lys Ile Met Glu Leu Thr Gly Gly Lys Gly Val Asp Val Ala Met

225 230 235 240

Glu Ala Val Gly Ile Pro Ala Thr Phe Asp Ile Cys Gln Glu Ile Val

245 250 255

Lys Pro Gly Gly Tyr Ile Ala Asn Ile Gly Val His Gly Lys Ser Val

260 265 270

Glu Phe His Ile Glu Lys Leu Trp Ile Arg Asn Ile Thr Leu Thr Thr

275 280 285

Gly Leu Val Asn Thr Thr Ser Thr Pro Met Leu Leu Lys Thr Val Gln

290 295 300

Ser Lys Lys Leu Lys Pro Glu Gln Leu Ile Thr His Arg Phe Ala Phe

305 310 315 320

Ser Asp Ile Met Lys Ala Tyr Glu Val Phe Gly Asn Ala Ala Lys Glu

325 330 335

Lys Ala Leu Lys Val Ile Ile Ser Asn Ser

340 345

<210> 10

<211> 1692

<212> DNA

<213> 氧化葡糖杆菌(Gluconobacter oxydans)

<400> 10

atgacttata ctgtcggaca ttatcttgcc gaacgactga cacagatcgg cctgaagcat 60

catttcgccg ttgccggcga ctacaacctc gttctgctcg accagctgat cgaacagggc 120

ggcacgaagc agatctatga ctgcaacgag ctgaactgca gcttcgccgc cgaaggttat 180

gcccgcgcca acggtgcagc cgctgccgtc atcaccttca gcgtcggcgc catctccgcc 240

atgaacggcc tcggcggcgc ctatgccgag aacctgccga tcctcgtgat ttcgggcgct 300

ccgaactcca acgatcacgg ttcgggccac gtcctgcacc acacgatcgg cacgacggac 360

tacagctacc agatggaaat ggcgaagcac gttacctgtg ccgccgaaag catcacctct 420

gctgaaaccg ccccggccaa gatcgaccac gtcatccgca cgatgctgcg tgagaagaag 480

ccggcctatc tcgaaatcgc ctgcaacatc tcggccgcac cctgcgtccg tccgggcccg 540

gtctcgtccc tgcacgccca tccgcgtccg gacgaagcca gcctgaaggc cgctctggac 600

gagagcctga gcttcctcaa caaggccaac aaggtcgcca tcctggtcgg caccaagctg 660

cgcgcagccg aagccctcaa ggaaacggtc gaactggctg acaagctcgg ttgccccgtt 720

acggtcatgg ccgctgcaaa gagctacttc cccgagacgc accccggctt ccgtggcgtg 780

tactggggcg acgtcagcag cccgggcgcc caggaaatca tcgaaggcgc cgatgccgtc 840

atctgcctgg caccagtctg gaatgactac tcctcgggcg gctggaagag cgttgtccgt 900

ggcgaaaagg tcctcgaggt cgatcccaac cgcgtcaccg tcaacggcaa gaccttcgaa 960

ggcttccgcc tgaaggaatt cgtcaaggcc ctgaccgaga aggctccgaa gaagtccgca 1020

gccctgaccg gcgaatacaa gcccgtcatg ctgcctaagg ccgacccgtc caagccgctg 1080

tccaacgacg aaatgacccg ccagatcaac gaactggtcg acggcaacac cacgctcttc 1140

gccgagaccg gcgactcatg gttcaacgcc gtgcgtatgc accttcccga aggtgcgaag 1200

gtcgagacgg aaatgcagtg gggtcacatc ggctggtccg ttccgtccat gttcggcaac 1260

gccaccgctt cgccggagcg caagcacgtc ctgatggtcg gtgacggttc cttccagctg 1320

acggcgcagg aagtggccca gatggtccgc tacgaactgc cggtcatcat cttcctggtg 1380

aacaaccacg gctacgtcat cgaaatcgcc atccatgacg gcccgtacaa ctacatccag 1440

aactgggact acgcagctct gatgcagtgc ttcaaccagg gcgtcccggg cgaggaaagc 1500

ggcaagtacg gtctcggcct gcatgccacg accggtgcag aactggccga agccatcgcc 1560

aaggccaaga agaacacccg cggcccgacg ctcatcgagt gcaagcttga tcgtacggac 1620

tgcaccaaga ccctcgtgga gtggggcaag gctgttgccg ccgcaaactc ccgcaagccc 1680

cagagcgtct aa 1692

<210> 11

<211> 563

<212> PRT

<213> 氧化葡糖杆菌(Gluconobacter oxydans)

<400> 11

Met Thr Tyr Thr Val Gly His Tyr Leu Ala Glu Arg Leu Thr Gln Ile

1 5 10 15

Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu

20 25 30

Leu Asp Gln Leu Ile Glu Gln Gly Gly Thr Lys Gln Ile Tyr Asp Cys

35 40 45

Asn Glu Leu Asn Cys Ser Phe Ala Ala Glu Gly Tyr Ala Arg Ala Asn

50 55 60

Gly Ala Ala Ala Ala Val Ile Thr Phe Ser Val Gly Ala Ile Ser Ala

65 70 75 80

Met Asn Gly Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Ile Leu Val

85 90 95

Ile Ser Gly Ala Pro Asn Ser Asn Asp His Gly Ser Gly His Val Leu

100 105 110

His His Thr Ile Gly Thr Thr Asp Tyr Ser Tyr Gln Met Glu Met Ala

115 120 125

Lys His Val Thr Cys Ala Ala Glu Ser Ile Thr Ser Ala Glu Thr Ala

130 135 140

Pro Ala Lys Ile Asp His Val Ile Arg Thr Met Leu Arg Glu Lys Lys

145 150 155 160

Pro Ala Tyr Leu Glu Ile Ala Cys Asn Ile Ser Ala Ala Pro Cys Val

165 170 175

Arg Pro Gly Pro Val Ser Ser Leu His Ala His Pro Arg Pro Asp Glu

180 185 190

Ala Ser Leu Lys Ala Ala Leu Asp Glu Ser Leu Ser Phe Leu Asn Lys

195 200 205

Ala Asn Lys Val Ala Ile Leu Val Gly Thr Lys Leu Arg Ala Ala Glu

210 215 220

Ala Leu Lys Glu Thr Val Glu Leu Ala Asp Lys Leu Gly Cys Pro Val

225 230 235 240

Thr Val Met Ala Ala Ala Lys Ser Tyr Phe Pro Glu Thr His Pro Gly

245 250 255

Phe Arg Gly Val Tyr Trp Gly Asp Val Ser Ser Pro Gly Ala Gln Glu

260 265 270

Ile Ile Glu Gly Ala Asp Ala Val Ile Cys Leu Ala Pro Val Trp Asn

275 280 285

Asp Tyr Ser Ser Gly Gly Trp Lys Ser Val Val Arg Gly Glu Lys Val

290 295 300

Leu Glu Val Asp Pro Asn Arg Val Thr Val Asn Gly Lys Thr Phe Glu

305 310 315 320

Gly Phe Arg Leu Lys Glu Phe Val Lys Ala Leu Thr Glu Lys Ala Pro

325 330 335

Lys Lys Ser Ala Ala Leu Thr Gly Glu Tyr Lys Pro Val Met Leu Pro

340 345 350

Lys Ala Asp Pro Ser Lys Pro Leu Ser Asn Asp Glu Met Thr Arg Gln

355 360 365

Ile Asn Glu Leu Val Asp Gly Asn Thr Thr Leu Phe Ala Glu Thr Gly

370 375 380

Asp Ser Trp Phe Asn Ala Val Arg Met His Leu Pro Glu Gly Ala Lys

385 390 395 400

Val Glu Thr Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser

405 410 415

Met Phe Gly Asn Ala Thr Ala Ser Pro Glu Arg Lys His Val Leu Met

420 425 430

Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met

435 440 445

Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Val Asn Asn His Gly

450 455 460

Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Gln

465 470 475 480

Asn Trp Asp Tyr Ala Ala Leu Met Gln Cys Phe Asn Gln Gly Val Pro

485 490 495

Gly Glu Glu Ser Gly Lys Tyr Gly Leu Gly Leu His Ala Thr Thr Gly

500 505 510

Ala Glu Leu Ala Glu Ala Ile Ala Lys Ala Lys Lys Asn Thr Arg Gly

515 520 525

Pro Thr Leu Ile Glu Cys Lys Leu Asp Arg Thr Asp Cys Thr Lys Thr

530 535 540

Leu Val Glu Trp Gly Lys Ala Val Ala Ala Ala Asn Ser Arg Lys Pro

545 550 555 560

Gln Ser Val

<210> 12

<211> 2676

<212> DNA

<213> 大肠杆菌(Escherichia coli)

<400> 12

atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag 60

cgtgaatatg ccagtttcac tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg 120

gctgctgcag atgctcgaat cccactcgcg aaaatggccg ttgccgaatc cggcatgggt 180

atcgtcgaag ataaagtgat caaaaaccac tttgcttctg aatatatcta caacgcctat 240

aaagatgaaa aaacctgtgg tgttctgtct gaagacgaca cttttggtac catcactatc 300

gctgaaccaa tcggtattat ttgcggtatc gttccgacca ctaacccgac ttcaactgct 360

atcttcaaat cgctgatcag tctgaagacc cgtaacgcca ttatcttctc cccgcacccg 420

cgtgcaaaag atgccaccaa caaagcggct gatatcgttc tgcaggctgc tatcgctgcc 480

ggtgctccga aagatctgat cggctggatc gatcaacctt ctgttgaact gtctaacgca 540

ctgatgcacc acccagacat caacctgatc ctcgcgactg gtggtccggg catggttaaa 600

gccgcataca gctccggtaa accagctatc ggtgtaggcg cgggcaacac tccagttgtt 660

atcgatgaaa ctgctgatat caaacgtgca gttgcatctg tactgatgtc caaaaccttc 720

gacaacggcg taatctgtgc ttctgaacag tctgttgttg ttgttgactc tgtttatgac 780

gctgtacgtg aacgttttgc aacccacggc ggctatctgt tgcagggtaa agagctgaaa 840

gctgttcagg atgttatcct gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca 900

gcctataaaa ttgctgaact ggcaggcttc tctgtaccag aaaacaccaa gattctgatc 960

ggtgaagtga ccgttgttga tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact 1020

ctggcaatgt accgcgctaa agatttcgaa gacgcggtag aaaaagcaga gaaactggtt 1080

gctatgggcg gtatcggtca tacctcttgc ctgtacactg accaggataa ccaaccggct 1140

cgcgtttctt acttcggtca gaaaatgaaa acggcgcgta tcctgattaa caccccagcg 1200

tctcagggtg gtatcggtga cctgtataac ttcaaactcg caccttccct gactctgggt 1260

tgtggttctt ggggtggtaa ctccatctct gaaaacgttg gtccgaaaca cctgatcaac 1320

aagaaaaccg ttgctaagcg agctgaaaac atgttgtggc acaaacttcc gaaatctatc 1380

tacttccgcc gtggctccct gccaatcgcg ctggatgaag tgattactga tggccacaaa 1440

cgtgcgctca tcgtgactga ccgcttcctg ttcaacaatg gttatgctga tcagatcact 1500

tccgtactga aagcagcagg cgttgaaact gaagtcttct tcgaagtaga agcggacccg 1560

accctgagca tcgttcgtaa aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt 1620

atcgcgctgg gtggtggttc cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa 1680

catccggaaa ctcacttcga agagctggcg ctgcgcttta tggatatccg taaacgtatc 1740

tacaagttcc cgaaaatggg cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt 1800

acaggttctg aagtcactcc gtttgcggtt gtaactgacg acgctactgg tcagaaatat 1860

ccgctggcag actatgcgct gactccggat atggcgattg tcgacgccaa cctggttatg 1920

gacatgccga agtccctgtg tgctttcggt ggtctggacg cagtaactca cgccatggaa 1980

gcttatgttt ctgtactggc atctgagttc tctgatggtc aggctctgca ggcactgaaa 2040

ctgctgaaag aatatctgcc agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt 2100

gaacgtgttc acagtgcagc gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt 2160

gtatgtcact caatggcgca caaactgggt tcccagttcc atattccgca cggtctggca 2220

aacgccctgc tgatttgtaa cgttattcgc tacaatgcga acgacaaccc gaccaagcag 2280

actgcattca gccagtatga ccgtccgcag gctcgccgtc gttatgctga aattgccgac 2340

cacttgggtc tgagcgcacc gggcgaccgt actgctgcta agatcgagaa actgctggca 2400

tggctggaaa cgctgaaagc tgaactgggt attccgaaat ctatccgtga agctggcgtt 2460

caggaagcag acttcctggc gaacgtggat aaactgtctg aagatgcatt cgatgaccag 2520

tgcaccggcg ctaacccgcg ttacccgctg atctccgagc tgaaacagat tctgctggat 2580

acctactacg gtcgtgatta tgtagaaggt gaaactgcag cgaagaaaga agctgctccg 2640

gctaaagctg agaaaaaagc gaaaaaatcc gcttaa 2676

<210> 13

<211> 2622

<212> DNA

<213> 热纤梭菌(Clostridium thermocellum)

<400> 13

atgacgaaaa tagcgaataa atacgaagtt attgataatg ttgaaaagct tgaaaaggct 60

ttgaaacgtt taagagaagc tcaaagtgtt tatgcaacct atacacagga gcaggttgac 120

aaaattttct ttgaggcggc aatggcggcc aataaaatga gaattcctct tgccaaaatg 180

gctgtggagg aaacaggcat gggagtggtt gaagacaagg ttatcaaaaa ccactatgct 240

tctgagtata tctataatgc gtacaaaaac actaaaacct gcggtgttat tgaagaggac 300

cctgctttcg gtattaaaaa aatagcagag cctttggggg ttattgcggc ggttatacct 360

actacgaatc cgacatcgac agcaatcttt aagactctta ttgcattaaa gacgagaaat 420

gcaattatta taagcccaca ccccagggca aaaaactcaa cgatagaagc ggcgaaaatt 480

gttttggagg cggccgttaa agccggtgct ccggaaggca tcattggctg gattgatgtg 540

ccgagccttg aacttaccaa cctggtaatg agagaagcag atgtgattct cgcaacaggc 600

ggtcccggac tggttaaagc agcttactct tcgggcaaac cggctattgg tgtcggagcg 660

ggcaatactc ctgcaattat tgatgattcg gccgacattg tcttggcagt gaactcaata 720

atacattcaa aaactttcga caacggtatg atttgtgctt cagagcaatc ggtcattgtt 780

ctggacgggg tatataaaga ggtaaaaaaa gaatttgaaa aaagaggatg ctatttctta 840

aatgaagatg aaactgaaaa ggtaagaaaa acaattataa taaacggtgc gttaaatgcc 900

aagatagtag gtcagaaagc tcacacaatt gcaaaccttg caggttttga ggtacccgag 960

actacaaaaa ttctgatagg cgaagttacc agcgtggata tttccgaaga atttgcccac 1020

gaaaagttgt gcccggtact ggcaatgtac agggcaaagg attttgacga tgcccttgat 1080

aaagcagaaa ggttggtagc tgacggtgga tttggccata cttcgtcact ttatatagat 1140

acggtaacac agaaagagaa acttcagaaa ttctctgaaa ggatgaaaac ctgccgtata 1200

ttggttaata cgccgtcatc ccagggaggt atcggtgacc tttacaactt caagcttgct 1260

ccgtctctca ccctcggctg cggttcctgg ggaggaaatt cagtttccga caatgtggga 1320

gtcaagcatt tgttaaacat taaaacagtt gccgagagga gagagaacat gctctggttc 1380

agaacacctg aaaagattta tataaaaaga ggttgtctgc ctgttgcatt ggatgagctt 1440

aaaaatgtaa tgggtaaaaa gaaagcattt attgtaacgg ataacttcct gtacaataac 1500

ggctacacca agccgattac ggataagctg gatgaaatgg gaattgtgca caagaccttc 1560

tttgatgtgt ctccagaccc atcccttgca tctgccaaag ccggtgcggc agaaatgctg 1620

gctttccagc ctgacaccat aattgcggtc ggcggcggat ctgccatgga cgcggccaaa 1680

atcatgtggg tgatgtatga acatccggaa gttgacttta tggacatggc aatgagattt 1740

atggatataa gaaagagagt ttacaccttc ccgaagatgg gacagaaggc atactttatc 1800

gcaattccga cttccgcggg tacaggttca gaagtgacac cttttgcggt tattactgat 1860

gaaaaaacag gaattaaata ccctctggcc gactatgaat tgttgccgga catggctatt 1920

gtagatgccg atatgatgat gaatgctcca aagggactta ccgcagcttc cggtatagac 1980

gcattgaccc acgctctgga agcctatgtt tcaatgcttg cgaccgacta tacggatagc 2040

cttgcccttc gtgcaataaa gatgatattt gaatatctcc cgagagccta tgaaaacggt 2100

gcaagtgacc cggttgcaag agagaaaatg gccaatgccg caacaatagc cggaatggct 2160

tttgccaatg cctttttggg tgtatgccat tcaatggcgc acaaactggg tgctttttat 2220

cacctgcccc acggtgttgc caatgcactt atgataaacg aagtaatcag attcaactca 2280

tccgaggctc cgaccaagat gggtactttc ccgcagtatg accatccgcg cacgctggaa 2340

aggtatgcag aaattgccga ttatatcgga cttaagggca agaataacga agaaaaagtt 2400

gaaaacttga ttaaagctat tgatgagctt aaagaaaagg tgggcatcag gaagaccatc 2460

aaagattatg acatagatga aaaggaattt ttggacagac tggacgaaat ggtggaacag 2520

gcttttgacg accagtgcac aggtacaaat ccaagatacc cgcttatgaa tgaaatcagg 2580

caaatgtatc tgaacgctta ttacggaggt gcgaagaaat aa 2622

<210> 14

<211> 891

<212> PRT

<213> 大肠杆菌(Escherichia coli)

<400> 14

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 15

<211> 873

<212> PRT

<213> 热纤梭菌(Clostridium thermocellum)

<400> 15

Met Thr Lys Ile Ala Asn Lys Tyr Glu Val Ile Asp Asn Val Glu Lys

1 5 10 15

Leu Glu Lys Ala Leu Lys Arg Leu Arg Glu Ala Gln Ser Val Tyr Ala

20 25 30

Thr Tyr Thr Gln Glu Gln Val Asp Lys Ile Phe Phe Glu Ala Ala Met

35 40 45

Ala Ala Asn Lys Met Arg Ile Pro Leu Ala Lys Met Ala Val Glu Glu

50 55 60

Thr Gly Met Gly Val Val Glu Asp Lys Val Ile Lys Asn His Tyr Ala

65 70 75 80

Ser Glu Tyr Ile Tyr Asn Ala Tyr Lys Asn Thr Lys Thr Cys Gly Val

85 90 95

Ile Glu Glu Asp Pro Ala Phe Gly Ile Lys Lys Ile Ala Glu Pro Leu

100 105 110

Gly Val Ile Ala Ala Val Ile Pro Thr Thr Asn Pro Thr Ser Thr Ala

115 120 125

Ile Phe Lys Thr Leu Ile Ala Leu Lys Thr Arg Asn Ala Ile Ile Ile

130 135 140

Ser Pro His Pro Arg Ala Lys Asn Ser Thr Ile Glu Ala Ala Lys Ile

145 150 155 160

Val Leu Glu Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly

165 170 175

Trp Ile Asp Val Pro Ser Leu Glu Leu Thr Asn Leu Val Met Arg Glu

180 185 190

Ala Asp Val Ile Leu Ala Thr Gly Gly Pro Gly Leu Val Lys Ala Ala

195 200 205

Tyr Ser Ser Gly Lys Pro Ala Ile Gly Val Gly Ala Gly Asn Thr Pro

210 215 220

Ala Ile Ile Asp Asp Ser Ala Asp Ile Val Leu Ala Val Asn Ser Ile

225 230 235 240

Ile His Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln

245 250 255

Ser Val Ile Val Leu Asp Gly Val Tyr Lys Glu Val Lys Lys Glu Phe

260 265 270

Glu Lys Arg Gly Cys Tyr Phe Leu Asn Glu Asp Glu Thr Glu Lys Val

275 280 285

Arg Lys Thr Ile Ile Ile Asn Gly Ala Leu Asn Ala Lys Ile Val Gly

290 295 300

Gln Lys Ala His Thr Ile Ala Asn Leu Ala Gly Phe Glu Val Pro Glu

305 310 315 320

Thr Thr Lys Ile Leu Ile Gly Glu Val Thr Ser Val Asp Ile Ser Glu

325 330 335

Glu Phe Ala His Glu Lys Leu Cys Pro Val Leu Ala Met Tyr Arg Ala

340 345 350

Lys Asp Phe Asp Asp Ala Leu Asp Lys Ala Glu Arg Leu Val Ala Asp

355 360 365

Gly Gly Phe Gly His Thr Ser Ser Leu Tyr Ile Asp Thr Val Thr Gln

370 375 380

Lys Glu Lys Leu Gln Lys Phe Ser Glu Arg Met Lys Thr Cys Arg Ile

385 390 395 400

Leu Val Asn Thr Pro Ser Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn

405 410 415

Phe Lys Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly

420 425 430

Asn Ser Val Ser Asp Asn Val Gly Val Lys His Leu Leu Asn Ile Lys

435 440 445

Thr Val Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Thr Pro Glu

450 455 460

Lys Ile Tyr Ile Lys Arg Gly Cys Leu Pro Val Ala Leu Asp Glu Leu

465 470 475 480

Lys Asn Val Met Gly Lys Lys Lys Ala Phe Ile Val Thr Asp Asn Phe

485 490 495

Leu Tyr Asn Asn Gly Tyr Thr Lys Pro Ile Thr Asp Lys Leu Asp Glu

500 505 510

Met Gly Ile Val His Lys Thr Phe Phe Asp Val Ser Pro Asp Pro Ser

515 520 525

Leu Ala Ser Ala Lys Ala Gly Ala Ala Glu Met Leu Ala Phe Gln Pro

530 535 540

Asp Thr Ile Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys

545 550 555 560

Ile Met Trp Val Met Tyr Glu His Pro Glu Val Asp Phe Met Asp Met

565 570 575

Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Thr Phe Pro Lys

580 585 590

Met Gly Gln Lys Ala Tyr Phe Ile Ala Ile Pro Thr Ser Ala Gly Thr

595 600 605

Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Glu Lys Thr Gly

610 615 620

Ile Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Leu Pro Asp Met Ala Ile

625 630 635 640

Val Asp Ala Asp Met Met Met Asn Ala Pro Lys Gly Leu Thr Ala Ala

645 650 655

Ser Gly Ile Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Met

660 665 670

Leu Ala Thr Asp Tyr Thr Asp Ser Leu Ala Leu Arg Ala Ile Lys Met

675 680 685

Ile Phe Glu Tyr Leu Pro Arg Ala Tyr Glu Asn Gly Ala Ser Asp Pro

690 695 700

Val Ala Arg Glu Lys Met Ala Asn Ala Ala Thr Ile Ala Gly Met Ala

705 710 715 720

Phe Ala Asn Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu

725 730 735

Gly Ala Phe Tyr His Leu Pro His Gly Val Ala Asn Ala Leu Met Ile

740 745 750

Asn Glu Val Ile Arg Phe Asn Ser Ser Glu Ala Pro Thr Lys Met Gly

755 760 765

Thr Phe Pro Gln Tyr Asp His Pro Arg Thr Leu Glu Arg Tyr Ala Glu

770 775 780

Ile Ala Asp Tyr Ile Gly Leu Lys Gly Lys Asn Asn Glu Glu Lys Val

785 790 795 800

Glu Asn Leu Ile Lys Ala Ile Asp Glu Leu Lys Glu Lys Val Gly Ile

805 810 815

Arg Lys Thr Ile Lys Asp Tyr Asp Ile Asp Glu Lys Glu Phe Leu Asp

820 825 830

Arg Leu Asp Glu Met Val Glu Gln Ala Phe Asp Asp Gln Cys Thr Gly

835 840 845

Thr Asn Pro Arg Tyr Pro Leu Met Asn Glu Ile Arg Gln Met Tyr Leu

850 855 860

Asn Ala Tyr Tyr Gly Gly Ala Lys Lys

865 870

<210> 16

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 16

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Lys Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 17

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 17

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Ala Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 18

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 18

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Leu Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 19

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 19

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Asn Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 20

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 20

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Gly Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 21

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 21

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Ser Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 22

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 22

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu Arg Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 23

<211> 891

<212> PRT

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶的突变体

<400> 23

Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val

1 5 10 15

Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro

35 40 45

Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr

65 70 75 80

Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly

85 90 95

Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu

115 120 125

Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp

130 135 140

Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala

145 150 155 160

Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu

165 170 175

Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala

180 185 190

Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro

195 200 205

Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr

210 215 220

Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe

225 230 235 240

Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp

245 250 255

Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr

260 265 270

Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys

275 280 285

Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile

290 295 300

Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile

305 310 315 320

Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys

325 330 335

Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala

340 345 350

Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr

355 360 365

Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr

370 375 380

Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala

385 390 395 400

Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser

405 410 415

Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn

420 425 430

Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala

435 440 445

Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg

450 455 460

Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys

465 470 475 480

Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala

485 490 495

Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val

500 505 510

Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly

515 520 525

Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly

530 535 540

Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu

545 550 555 560

His Pro Glu Thr His Phe Glu His Leu Ala Leu Arg Phe Met Asp Ile

565 570 575

Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met

580 585 590

Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe

595 600 605

Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp

610 615 620

Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met

625 630 635 640

Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr

645 650 655

His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp

660 665 670

Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala

675 680 685

Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His

690 695 700

Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly

705 710 715 720

Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro

725 730 735

His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn

740 745 750

Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg

755 760 765

Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu

770 775 780

Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala

785 790 795 800

Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg

805 810 815

Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu

820 825 830

Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr

835 840 845

Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly

850 855 860

Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro

865 870 875 880

Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala

885 890

<210> 24

<211> 873

<212> PRT

<213> 人工序列

<220>

<223> 热纤梭菌(Clostridium thermocellum)醛-醇脱氢酶的突变体

<400> 24

Met Thr Lys Ile Ala Asn Lys Tyr Glu Val Ile Asp Asn Val Glu Lys

1 5 10 15

Leu Glu Lys Ala Leu Lys Arg Leu Arg Glu Ala Gln Ser Val Tyr Ala

20 25 30

Thr Tyr Thr Gln Glu Gln Val Asp Lys Ile Phe Phe Glu Ala Ala Met

35 40 45

Ala Ala Asn Lys Met Arg Ile Pro Leu Ala Lys Met Ala Val Glu Glu

50 55 60

Thr Gly Met Gly Val Val Glu Asp Lys Val Ile Lys Asn His Tyr Ala

65 70 75 80

Ser Glu Tyr Ile Tyr Asn Ala Tyr Lys Asn Thr Lys Thr Cys Gly Val

85 90 95

Ile Glu Glu Asp Pro Ala Phe Gly Ile Lys Lys Ile Ala Glu Pro Leu

100 105 110

Gly Val Ile Ala Ala Val Ile Pro Thr Thr Asn Pro Thr Ser Thr Ala

115 120 125

Ile Phe Lys Thr Leu Ile Ala Leu Lys Thr Arg Asn Ala Ile Ile Ile

130 135 140

Ser Pro His Pro Arg Ala Lys Asn Ser Thr Ile Glu Ala Ala Lys Ile

145 150 155 160

Val Leu Glu Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly

165 170 175

Trp Ile Asp Val Pro Ser Leu Glu Leu Thr Asn Leu Val Met Arg Glu

180 185 190

Ala Asp Val Ile Leu Ala Thr Gly Gly Pro Gly Leu Val Lys Ala Ala

195 200 205

Tyr Ser Ser Gly Lys Pro Ala Ile Gly Val Gly Ala Gly Asn Thr Pro

210 215 220

Ala Ile Ile Asp Asp Ser Ala Asp Ile Val Leu Ala Val Asn Ser Ile

225 230 235 240

Ile His Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln

245 250 255

Ser Val Ile Val Leu Asp Gly Val Tyr Lys Glu Val Lys Lys Glu Phe

260 265 270

Glu Lys Arg Gly Cys Tyr Phe Leu Asn Glu Asp Glu Thr Glu Lys Val

275 280 285

Arg Lys Thr Ile Ile Ile Asn Gly Ala Leu Asn Ala Lys Ile Val Gly

290 295 300

Gln Lys Ala His Thr Ile Ala Asn Leu Ala Gly Phe Glu Val Pro Glu

305 310 315 320

Thr Thr Lys Ile Leu Ile Gly Glu Val Thr Ser Val Asp Ile Ser Glu

325 330 335

Glu Phe Ala His Glu Lys Leu Cys Pro Val Leu Ala Met Tyr Arg Ala

340 345 350

Lys Asp Phe Asp Asp Ala Leu Asp Lys Ala Glu Arg Leu Val Ala Asp

355 360 365

Gly Gly Phe Gly His Thr Ser Ser Leu Tyr Ile Asp Thr Val Thr Gln

370 375 380

Lys Glu Lys Leu Gln Lys Phe Ser Glu Arg Met Lys Thr Cys Arg Ile

385 390 395 400

Leu Val Asn Thr Pro Ser Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn

405 410 415

Phe Lys Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly

420 425 430

Asn Ser Val Ser Asp Asn Val Gly Val Lys His Leu Leu Asn Ile Lys

435 440 445

Thr Val Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Thr Pro Glu

450 455 460

Lys Ile Tyr Ile Lys Arg Gly Cys Leu Pro Val Ala Leu Asp Glu Leu

465 470 475 480

Lys Asn Val Met Gly Lys Lys Lys Ala Phe Ile Val Thr Asp Asn Phe

485 490 495

Leu Tyr Asn Asn Gly Tyr Thr Lys Pro Ile Thr Asp Lys Leu Asp Glu

500 505 510

Met Gly Ile Val His Lys Thr Phe Phe Asp Val Ser Pro Asp Pro Ser

515 520 525

Leu Ala Ser Ala Lys Ala Gly Ala Ala Glu Met Leu Ala Phe Gln Pro

530 535 540

Asp Thr Ile Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys

545 550 555 560

Ile Met Trp Val Met Tyr Glu His Pro Glu Val Asp Phe Met Asn Met

565 570 575

Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Thr Phe Pro Lys

580 585 590

Met Gly Gln Lys Ala Tyr Phe Ile Ala Ile Pro Thr Ser Ala Gly Thr

595 600 605

Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Glu Lys Thr Gly

610 615 620

Ile Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Leu Pro Asp Met Ala Ile

625 630 635 640

Val Asp Ala Asp Met Met Met Asn Ala Pro Lys Gly Leu Thr Ala Ala

645 650 655

Ser Gly Ile Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Met

660 665 670

Leu Ala Thr Asp Tyr Thr Asp Ser Leu Ala Leu Arg Ala Ile Lys Met

675 680 685

Ile Phe Glu Tyr Leu Pro Arg Ala Tyr Glu Asn Gly Ala Ser Asp Pro

690 695 700

Val Ala Arg Glu Lys Met Ala Asn Ala Ala Thr Ile Ala Gly Met Ala

705 710 715 720

Phe Ala Asn Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu

725 730 735

Gly Ala Phe Tyr His Leu Pro His Gly Val Ala Asn Ala Leu Met Ile

740 745 750

Asn Glu Val Ile Arg Phe Asn Ser Ser Glu Ala Pro Thr Lys Met Gly

755 760 765

Thr Phe Pro Gln Tyr Asp His Pro Arg Thr Leu Glu Arg Tyr Ala Glu

770 775 780

Ile Ala Asp Tyr Ile Gly Leu Lys Gly Lys Asn Asn Glu Glu Lys Val

785 790 795 800

Glu Asn Leu Ile Lys Ala Ile Asp Glu Leu Lys Glu Lys Val Gly Ile

805 810 815

Arg Lys Thr Ile Lys Asp Tyr Asp Ile Asp Glu Lys Glu Phe Leu Asp

820 825 830

Arg Leu Asp Glu Met Val Glu Gln Ala Phe Asp Asp Gln Cys Thr Gly

835 840 845

Thr Asn Pro Arg Tyr Pro Leu Met Asn Glu Ile Arg Gln Met Tyr Leu

850 855 860

Asn Ala Tyr Tyr Gly Gly Ala Lys Lys

865 870

<210> 25

<211> 2676

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶基因的突变体

<400> 25

atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag 60

cgtgaatatg ccagtttcac tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg 120

gctgctgcag atgctcgaat cccactcgcg aaaatggccg ttgccgaatc cggcatgggt 180

atcgtcgaag ataaagtgat caaaaaccac tttgcttctg aatatatcta caacgcctat 240

aaagatgaaa aaacctgtgg tgttctgtct gaagacgaca cttttggtac catcactatc 300

gctgaaccaa tcggtattat ttgcggtatc gttccgacca ctaacccgac ttcaactgct 360

atcttcaaat cgctgatcag tctgaagacc cgtaacgcca ttatcttctc cccgcacccg 420

cgtgcaaaag atgccaccaa caaagcggct gatatcgttc tgcaggctgc tatcgctgcc 480

ggtgctccga aagatctgat cggctggatc gatcaacctt ctgttgaact gtctaacgca 540

ctgatgcacc acccagacat caacctgatc ctcgcgactg gtggtccggg catggttaaa 600

gccgcataca gctccggtaa accagctatc ggtgtaggcg cgggcaacac tccagttgtt 660

atcgatgaaa ctgctgatat caaacgtgca gttgcatctg tactgatgtc caaaaccttc 720

gacaacggcg taatctgtgc ttctgaacag tctgttgttg ttgttgactc tgtttatgac 780

gctgtacgtg aacgttttgc aacccacggc ggctatctgt tgcagggtaa agagctgaaa 840

gctgttcagg atgttatcct gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca 900

gcctataaaa ttgctgaact ggcaggcttc tctgtaccag aaaacaccaa gattctgatc 960

ggtgaagtga ccgttgttga tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact 1020

ctggcaatgt accgcgctaa agatttcgaa gacgcggtag aaaaagcaga gaaactggtt 1080

gctatgggcg gtatcggtca tacctcttgc ctgtacactg accaggataa ccaaccggct 1140

cgcgtttctt acttcggtca gaaaatgaaa acggcgcgta tcctgattaa caccccagcg 1200

tctcagggtg gtatcggtga cctgtataac ttcaaactcg caccttccct gactctgggt 1260

tgtggttctt ggggtggtaa ctccatctct gaaaacgttg gtccgaaaca cctgatcaac 1320

aagaaaaccg ttgctaagcg agctgaaaac atgttgtggc acaaacttcc gaaatctatc 1380

tacttccgcc gtggctccct gccaatcgcg ctggatgaag tgattactga tggccacaaa 1440

cgtgcgctca tcgtgactga ccgcttcctg ttcaacaatg gttatgctga tcagatcact 1500

tccgtactga aagcagcagg cgttgaaact gaagtcttct tcgaagtaga agcggacccg 1560

accctgagca tcgttcgtaa aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt 1620

atcgcgctgg gtggtggttc cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa 1680

catccggaaa ctcacttcga aaagctggcg ctgcgcttta tggatatccg taaacgtatc 1740

tacaagttcc cgaaaatggg cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt 1800

acaggttctg aagtcactcc gtttgcggtt gtaactgacg acgctactgg tcagaaatat 1860

ccgctggcag actatgcgct gactccggat atggcgattg tcgacgccaa cctggttatg 1920

gacatgccga agtccctgtg tgctttcggt ggtctggacg cagtaactca cgccatggaa 1980

gcttatgttt ctgtactggc atctgagttc tctgatggtc aggctctgca ggcactgaaa 2040

ctgctgaaag aatatctgcc agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt 2100

gaacgtgttc acagtgcagc gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt 2160

gtatgtcact caatggcgca caaactgggt tcccagttcc atattccgca cggtctggca 2220

aacgccctgc tgatttgtaa cgttattcgc tacaatgcga acgacaaccc gaccaagcag 2280

actgcattca gccagtatga ccgtccgcag gctcgccgtc gttatgctga aattgccgac 2340

cacttgggtc tgagcgcacc gggcgaccgt actgctgcta agatcgagaa actgctggca 2400

tggctggaaa cgctgaaagc tgaactgggt attccgaaat ctatccgtga agctggcgtt 2460

caggaagcag acttcctggc gaacgtggat aaactgtctg aagatgcatt cgatgaccag 2520

tgcaccggcg ctaacccgcg ttacccgctg atctccgagc tgaaacagat tctgctggat 2580

acctactacg gtcgtgatta tgtagaaggt gaaactgcag cgaagaaaga agctgctccg 2640

gctaaagctg agaaaaaagc gaaaaaatcc gcttaa 2676

<210> 26

<211> 2676

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌(Escherichia coli)醛-醇脱氢酶基因的突变体

<400> 26

atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag 60

cgtgaatatg ccagtttcac tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg 120

gctgctgcag atgctcgaat cccactcgcg aaaatggccg ttgccgaatc cggcatgggt 180

atcgtcgaag ataaagtgat caaaaaccac tttgcttctg aatatatcta caacgcctat 240

aaagatgaaa aaacctgtgg tgttctgtct gaagacgaca cttttggtac catcactatc 300

gctgaaccaa tcggtattat ttgcggtatc gttccgacca ctaacccgac ttcaactgct 360

atcttcaaat cgctgatcag tctgaagacc cgtaacgcca ttatcttctc cccgcacccg 420

cgtgcaaaag atgccaccaa caaagcggct gatatcgttc tgcaggctgc tatcgctgcc 480

ggtgctccga aagatctgat cggctggatc gatcaacctt ctgttgaact gtctaacgca 540

ctgatgcacc acccagacat caacctgatc ctcgcgactg gtggtccggg catggttaaa 600

gccgcataca gctccggtaa accagctatc ggtgtaggcg cgggcaacac tccagttgtt 660

atcgatgaaa ctgctgatat caaacgtgca gttgcatctg tactgatgtc caaaaccttc 720

gacaacggcg taatctgtgc ttctgaacag tctgttgttg ttgttgactc tgtttatgac 780

gctgtacgtg aacgttttgc aacccacggc ggctatctgt tgcagggtaa agagctgaaa 840

gctgttcagg atgttatcct gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca 900

gcctataaaa ttgctgaact ggcaggcttc tctgtaccag aaaacaccaa gattctgatc 960

ggtgaagtga ccgttgttga tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact 1020

ctggcaatgt accgcgctaa agatttcgaa gacgcggtag aaaaagcaga gaaactggtt 1080

gctatgggcg gtatcggtca tacctcttgc ctgtacactg accaggataa ccaaccggct 1140

cgcgtttctt acttcggtca gaaaatgaaa acggcgcgta tcctgattaa caccccagcg 1200

tctcagggtg gtatcggtga cctgtataac ttcaaactcg caccttccct gactctgggt 1260

tgtggttctt ggggtggtaa ctccatctct gaaaacgttg gtccgaaaca cctgatcaac 1320

aagaaaaccg ttgctaagcg agctgaaaac atgttgtggc acaaacttcc gaaatctatc 1380

tacttccgcc gtggctccct gccaatcgcg ctggatgaag tgattactga tggccacaaa 1440

cgtgcgctca tcgtgactga ccgcttcctg ttcaacaatg gttatgctga tcagatcact 1500

tccgtactga aagcagcagg cgttgaaact gaagtcttct tcgaagtaga agcggacccg 1560

accctgagca tcgttcgtaa aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt 1620

atcgcgctgg gtggtggttc cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa 1680

catccggaaa ctcacttcga aaaactggcg ctgcgcttta tggatatccg taaacgtatc 1740

tacaagttcc cgaaaatggg cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt 1800

acaggttctg aagtcactcc gtttgcggtt gtaactgacg acgctactgg tcagaaatat 1860

ccgctggcag actatgcgct gactccggat atggcgattg tcgacgccaa cctggttatg 1920

gacatgccga agtccctgtg tgctttcggt ggtctggacg cagtaactca cgccatggaa 1980

gcttatgttt ctgtactggc atctgagttc tctgatggtc aggctctgca ggcactgaaa 2040

ctgctgaaag aatatctgcc agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt 2100

gaacgtgttc acagtgcagc gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt 2160

gtatgtcact caatggcgca caaactgggt tcccagttcc atattccgca cggtctggca 2220

aacgccctgc tgatttgtaa cgttattcgc tacaatgcga acgacaaccc gaccaagcag 2280

actgcattca gccagtatga ccgtccgcag gctcgccgtc gttatgctga aattgccgac 2340

cacttgggtc tgagcgcacc gggcgaccgt actgctgcta agatcgagaa actgctggca 2400

tggctggaaa cgctgaaagc tgaactgggt attccgaaat ctatccgtga agctggcgtt 2460

caggaagcag acttcctggc gaacgtggat aaactgtctg aagatgcatt cgatgaccag 2520

tgcaccggcg ctaacccgcg ttacccgctg atctccgagc tgaaacagat tctgctggat 2580

acctactacg gtcgtgatta tgtagaaggt gaaactgcag cgaagaaaga agctgctccg 2640

gctaaagctg agaaaaaagc gaaaaaatcc gcttaa 2676

<210> 27

<211> 2622

<212> DNA

<213> 人工序列

<220>

<223> 热纤梭菌(Clostridium thermocellum)醛-醇脱氢酶基因的突变体

<400> 27

atgacgaaaa tagcgaataa atacgaagtt attgataatg ttgaaaagct tgaaaaggct 60

ttgaaacgtt taagagaagc tcaaagtgtt tatgcaacct atacacagga gcaggttgac 120

aaaattttct ttgaggcggc aatggcggcc aataaaatga gaattcctct tgccaaaatg 180

gctgtggagg aaacaggcat gggagtggtt gaagacaagg ttatcaaaaa ccactatgct 240

tctgagtata tctataatgc gtacaaaaac actaaaacct gcggtgttat tgaagaggac 300

cctgctttcg gtattaaaaa aatagcagag cctttggggg ttattgcggc ggttatacct 360

actacgaatc cgacatcgac agcaatcttt aagactctta ttgcattaaa gacgagaaat 420

gcaattatta taagcccaca ccccagggca aaaaactcaa cgatagaagc ggcgaaaatt 480

gttttggagg cggccgttaa agccggtgct ccggaaggca tcattggctg gattgatgtg 540

ccgagccttg aacttaccaa cctggtaatg agagaagcag atgtgattct cgcaacaggc 600

ggtcccggac tggttaaagc agcttactct tcgggcaaac cggctattgg tgtcggagcg 660

ggcaatactc ctgcaattat tgatgattcg gccgacattg tcttggcagt gaactcaata 720

atacattcaa aaactttcga caacggtatg atttgtgctt cagagcaatc ggtcattgtt 780

ctggacgggg tatataaaga ggtaaaaaaa gaatttgaaa aaagaggatg ctatttctta 840

aatgaagatg aaactgaaaa ggtaagaaaa acaattataa taaacggtgc gttaaatgcc 900

aagatagtag gtcagaaagc tcacacaatt gcaaaccttg caggttttga ggtacccgag 960

actacaaaaa ttctgatagg cgaagttacc agcgtggata tttccgaaga atttgcccac 1020

gaaaagttgt gcccggtact ggcaatgtac agggcaaagg attttgacga tgcccttgat 1080

aaagcagaaa ggttggtagc tgacggtgga tttggccata cttcgtcact ttatatagat 1140

acggtaacac agaaagagaa acttcagaaa ttctctgaaa ggatgaaaac ctgccgtata 1200

ttggttaata cgccgtcatc ccagggaggt atcggtgacc tttacaactt caagcttgct 1260

ccgtctctca ccctcggctg cggttcctgg ggaggaaatt cagtttccga caatgtggga 1320

gtcaagcatt tgttaaacat taaaacagtt gccgagagga gagagaacat gctctggttc 1380

agaacacctg aaaagattta tataaaaaga ggttgtctgc ctgttgcatt ggatgagctt 1440

aaaaatgtaa tgggtaaaaa gaaagcattt attgtaacgg ataacttcct gtacaataac 1500

ggctacacca agccgattac ggataagctg gatgaaatgg gaattgtgca caagaccttc 1560

tttgatgtgt ctccagaccc atcccttgca tctgccaaag ccggtgcggc agaaatgctg 1620

gctttccagc ctgacaccat aattgcggtc ggcggcggat ctgccatgga cgcggccaaa 1680

atcatgtggg tgatgtatga acatccggaa gttgacttta tgaacatggc aatgagattt 1740

atggatataa gaaagagagt ttacaccttc ccgaagatgg gacagaaggc atactttatc 1800

gcaattccga cttccgcggg tacaggttca gaagtgacac cttttgcggt tattactgat 1860

gaaaaaacag gaattaaata ccctctggcc gactatgaat tgttgccgga catggctatt 1920

gtagatgccg atatgatgat gaatgctcca aagggactta ccgcagcttc cggtatagac 1980

gcattgaccc acgctctgga agcctatgtt tcaatgcttg cgaccgacta tacggatagc 2040

cttgcccttc gtgcaataaa gatgatattt gaatatctcc cgagagccta tgaaaacggt 2100

gcaagtgacc cggttgcaag agagaaaatg gccaatgccg caacaatagc cggaatggct 2160

tttgccaatg cctttttggg tgtatgccat tcaatggcgc acaaactggg tgctttttat 2220

cacctgcccc acggtgttgc caatgcactt atgataaacg aagtaatcag attcaactca 2280

tccgaggctc cgaccaagat gggtactttc ccgcagtatg accatccgcg cacgctggaa 2340

aggtatgcag aaattgccga ttatatcgga cttaagggca agaataacga agaaaaagtt 2400

gaaaacttga ttaaagctat tgatgagctt aaagaaaagg tgggcatcag gaagaccatc 2460

aaagattatg acatagatga aaaggaattt ttggacagac tggacgaaat ggtggaacag 2520

gcttttgacg accagtgcac aggtacaaat ccaagatacc cgcttatgaa tgaaatcagg 2580

caaatgtatc tgaacgctta ttacggaggt gcgaagaaat aa 2622

<210> 28

<211> 2622

<212> DNA

<213> 人工序列

<220>

<223> 热纤梭菌(Clostridium thermocellum)醛-醇脱氢酶基因的突变体

<400> 28

atgacgaaaa tagcgaataa atacgaagtt attgataatg ttgaaaagct tgaaaaggct 60

ttgaaacgtt taagagaagc tcaaagtgtt tatgcaacct atacacagga gcaggttgac 120

aaaattttct ttgaggcggc aatggcggcc aataaaatga gaattcctct tgccaaaatg 180

gctgtggagg aaacaggcat gggagtggtt gaagacaagg ttatcaaaaa ccactatgct 240

tctgagtata tctataatgc gtacaaaaac actaaaacct gcggtgttat tgaagaggac 300

cctgctttcg gtattaaaaa aatagcagag cctttggggg ttattgcggc ggttatacct 360

actacgaatc cgacatcgac agcaatcttt aagactctta ttgcattaaa gacgagaaat 420

gcaattatta taagcccaca ccccagggca aaaaactcaa cgatagaagc ggcgaaaatt 480

gttttggagg cggccgttaa agccggtgct ccggaaggca tcattggctg gattgatgtg 540

ccgagccttg aacttaccaa cctggtaatg agagaagcag atgtgattct cgcaacaggc 600

ggtcccggac tggttaaagc agcttactct tcgggcaaac cggctattgg tgtcggagcg 660

ggcaatactc ctgcaattat tgatgattcg gccgacattg tcttggcagt gaactcaata 720

atacattcaa aaactttcga caacggtatg atttgtgctt cagagcaatc ggtcattgtt 780

ctggacgggg tatataaaga ggtaaaaaaa gaatttgaaa aaagaggatg ctatttctta 840

aatgaagatg aaactgaaaa ggtaagaaaa acaattataa taaacggtgc gttaaatgcc 900

aagatagtag gtcagaaagc tcacacaatt gcaaaccttg caggttttga ggtacccgag 960

actacaaaaa ttctgatagg cgaagttacc agcgtggata tttccgaaga atttgcccac 1020

gaaaagttgt gcccggtact ggcaatgtac agggcaaagg attttgacga tgcccttgat 1080

aaagcagaaa ggttggtagc tgacggtgga tttggccata cttcgtcact ttatatagat 1140

acggtaacac agaaagagaa acttcagaaa ttctctgaaa ggatgaaaac ctgccgtata 1200

ttggttaata cgccgtcatc ccagggaggt atcggtgacc tttacaactt caagcttgct 1260

ccgtctctca ccctcggctg cggttcctgg ggaggaaatt cagtttccga caatgtggga 1320

gtcaagcatt tgttaaacat taaaacagtt gccgagagga gagagaacat gctctggttc 1380

agaacacctg aaaagattta tataaaaaga ggttgtctgc ctgttgcatt ggatgagctt 1440

aaaaatgtaa tgggtaaaaa gaaagcattt attgtaacgg ataacttcct gtacaataac 1500

ggctacacca agccgattac ggataagctg gatgaaatgg gaattgtgca caagaccttc 1560

tttgatgtgt ctccagaccc atcccttgca tctgccaaag ccggtgcggc agaaatgctg 1620

gctttccagc ctgacaccat aattgcggtc ggcggcggat ctgccatgga cgcggccaaa 1680

atcatgtggg tgatgtatga acatccggaa gttgacttta tgaatatggc aatgagattt 1740

atggatataa gaaagagagt ttacaccttc ccgaagatgg gacagaaggc atactttatc 1800

gcaattccga cttccgcggg tacaggttca gaagtgacac cttttgcggt tattactgat 1860

gaaaaaacag gaattaaata ccctctggcc gactatgaat tgttgccgga catggctatt 1920

gtagatgccg atatgatgat gaatgctcca aagggactta ccgcagcttc cggtatagac 1980

gcattgaccc acgctctgga agcctatgtt tcaatgcttg cgaccgacta tacggatagc 2040

cttgcccttc gtgcaataaa gatgatattt gaatatctcc cgagagccta tgaaaacggt 2100

gcaagtgacc cggttgcaag agagaaaatg gccaatgccg caacaatagc cggaatggct 2160

tttgccaatg cctttttggg tgtatgccat tcaatggcgc acaaactggg tgctttttat 2220

cacctgcccc acggtgttgc caatgcactt atgataaacg aagtaatcag attcaactca 2280

tccgaggctc cgaccaagat gggtactttc ccgcagtatg accatccgcg cacgctggaa 2340

aggtatgcag aaattgccga ttatatcgga cttaagggca agaataacga agaaaaagtt 2400

gaaaacttga ttaaagctat tgatgagctt aaagaaaagg tgggcatcag gaagaccatc 2460

aaagattatg acatagatga aaaggaattt ttggacagac tggacgaaat ggtggaacag 2520

gcttttgacg accagtgcac aggtacaaat ccaagatacc cgcttatgaa tgaaatcagg 2580

caaatgtatc tgaacgctta ttacggaggt gcgaagaaat aa 2622

<210> 29

<211> 1119

<212> DNA

<213> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)

<400> 29

atgaagatcg gcattccaaa agaaatcaaa aacaatgaaa accgcgtcgc catcactccg 60

gcaggcgtga tgacgctcgt caaagcgggg catgacgtgt atgtggagac ggaagccggc 120

gctgggtcgg ggttttctga cgctgaatat gaaaaagccg gggcagtgat cgtgacgaaa 180

gcggaagatg cctgggcggc ggagatggtg ttgaaagtga aagaaccgct gcctgaggag 240

ttccgctatt ttcgccccgg attgattttg tttacgtatt tgcatttagc cgcggccgaa 300

gcgctcacga aagcgctcgt cgagcaaaaa gtggtcggca tcgcttacga gacggtgcag 360

cttgcgaacg gctcgctgcc gctgttgacg ccgatgagtg aagtcgccgg ccgcatgtcg 420

gtgcaagtcg gcgcccagtt tctcgagaag ccgcacggcg ggaaaggcat tttgcttggc 480

ggcgtgcccg gggtgcggcg cggcaaagtg acgatcatcg gcggcggcac agcggggacg 540

aacgcgggga aaatcgcggt cggcctcggg gcggacgtga cgattttgga cattaacgcc 600

gagcggctgc gcgagctcga tgatttgttc ggcgaccaag tgacgacgtt gatgtccaac 660

tcgtatcata tcgccgaatg cgtgcgggaa tcggatttgg tcgtcggcgc cgtcttgatc 720

ccgggggcga aagcgccaaa gcttgtgacg gaagagatgg tgcgctcgat gatgccaggc 780

tcggtgttgg tcgacgtcgc cattgaccaa ggcggcattt tcgaaacgac cgaccgcgtc 840

acgacgcacg acgatccgac atacgtcaag cacggcgtcg ttcattacgc cgtcgcgaac 900

atgccgggcg ctgtgccgcg cacgtcgaca ttcgcgctta cgaacgtcac gatcccatac 960

gccttgcaaa tcgccaacaa aggctaccgc gccgcgtgct tggataaccc ggcgctgtta 1020

aaagggatca acacgctcga cgggcacatc gtgtacgaag cggtcgcggc ggcgcacaac 1080

atgccgtata cggatgctca ttcgttgctg cagggatga 1119

<210> 30

<211> 1134

<212> DNA

<213> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)

<400> 30

atgattattg gagtgccaaa ggaaatcaaa aataacgaaa accgtgtcgc cattacgccg 60

gctggcgttt tgtcattcgt tcaggctgga catacggttc tgattgagaa agaggcaggg 120

gttggaagcg gtttcagcga cagcgattac gcccgtgccg gagcacaaat catcgagcgg 180

gcggaagatg tttgggcgca agccgatatg gtgatgaaag tgaaagagcc gctgccaagc 240

gaatacggct atttccgccc aggtctcatt ttgttcacct atttgcattt ggccgccgac 300

ccggagttga cacgcgcctt aaaagaaagc ggcgtcatcg ccattgccta tgagacggtg 360

caagtcggcc gcacactgcc gctgttgaca ccaatgagcg aagtcgccgg acggatggcc 420

gcgcaaattg gagcgcaatt tttagaaaaa ccgtacggcg gcaaaggcat cttgcttggc 480

ggcgtcccag gcgttgcccg cggcaaagtg acgatcatcg gcggcggagt cgtcggcacg 540

aacgcagcga aagtcgcggt cggcctcggg gcagatgtca cgattatcga cttgaacgcg 600

gatcgcctgc gcgagcttga cgacattttc ggcaaccaaa ttacgacgct catgtccaac 660

ccaatgaaca tcgccgaagc ggttgctgag gccgaccttg tcatcggcgc cgtcctcatc 720

ccgggagcgc gggcgccgaa gctcgtcacc gaggacatgg tgaaagcgat gaaaccgggt 780

tcggtcatcg tcgatgtcgc catcgaccaa gggggcatcg tcgagacgag cgaccacgtc 840

acgacacatg acgacccgac gtacgtcaaa cacggcgtcg tccattatgc ggtcgccaac 900

atgcctggcg ccgtcccgcg cacctcaacg atcgccttga cgaacgtcac catgccatac 960

gccttgcaaa tcgccaacaa aggcgtcatc caagccatta cagacaaccc ggcgcttgag 1020

cttggcgtca acgtcgccaa cggtgaaatc acgtacgaag cggtcgcccg cgacctcggt 1080

taccgctacg tcccggcccg cgaagcgctc gggaaaacgt tggccgccaa ctaa 1134

<210> 31

<211> 1110

<212> DNA

<213> 嗜热栖热菌(Thermus thermophilus)

<400> 31

atggtgatcg gcgtgccgaa ggagatcaag accttggaga accgggtggc cctcacgccc 60

ggcggggtgg agagcctggt caggcgcggc cacaccgtgc tggtggagcg gggggccggg 120

gagggctcgg ggctttccga cgcggagtac gcccgggccg gggccgagct cgtgggccgg 180

gaggaggcct ggggtgcgga gatggtggtg aaggtgaagg agcccctacc cgaggagtac 240

ggcttcctgc gggagggcct catcctcttc acctaccttc acctggccgc ggaccgcggc 300

ctcaccgagg ccatgctccg tagcggggtc acgggcatcg cctacgagac cgtccagctt 360

cccgacggca ccctccccct cctcgtcccc atgagcgagg tggcggggcg gatggccccc 420

caggtggggg cccagttcct ggagaagccc aaggggggcc ggggggtcct cctcgggggg 480

gtgccggggg tggccccggc cagcgtggtg atcctcgggg gcgggaccgt gggcaccaac 540

gcggccaaga tcgccctggg gatgggggcc caggtgacca tcctggacgt gaaccacaag 600

cgcctccagt atctggacga cgtcttcggc gggcgggtga tcaccctcac cgccaccgag 660

gccaacatca aaaagagcgt ccagcacgcg gacctcctca tcggggccgt cctcgtcccc 720

ggggccaagg cccccaagct cgtcacccgg gacatgctct ctctgatgaa ggagggagcg 780

gtgatcgtgg acgtggccgt ggaccagggg gggtgcgtgg agaccatccg gcccaccacc 840

cacgccgagc ccacctacgt ggtggacggg gtggtccact acggggtggc caacatgccc 900

ggggcggtgc ccaggaccag caccttcgcc ctcaccaacc agaccctgcc ctacgtgttg 960

aagctcgcgg agaaggggct ggacgccctt ctggaggacg cggcccttct caaggggctc 1020

aacacccaca aaggccgcct cacccacccc ggggtggccg aggccttcgg cctgccctac 1080

acgcctcccg aggaggcctt gagggggtga 1110

<210> 32

<211> 1038

<212> DNA

<213> 嗜热栖热菌(Thermus thermophilus)

<400> 32

atggagttcg gcgtgcccag agaacggtcg ggcggggaga tcccggaaag gcgggtgccc 60

ctcacgcccc agggggtgcg ggagctcgtc gcctcggggc accgggtcta cgtggagcgg 120

ggcgcggggg aaggggcggg ctttcccgac gaggcctacg aggaagcggg ggccaggctc 180

gtgggccggg aggaggcctt cggccgcccc caggtggtgc tcaaggtggc ccgccccacc 240

ctcgaggagg tggggctcat gcgcaaaaac gccgttctca tggccttcct ccacctggcg 300

gtggcggaaa gccccctcgt ggaggccatg gcccaaaagg gcctcaccgc catcggctac 360

gagctggtgg gcgaggaggg ccgccgcccc gtcctgaagg ccatgagcga gatcgccggg 420

cgcatggccc cccagctcgc cgggcggctc ctcgaggccc cccagggccc gggcatcctc 480

ctctccggcc tggtgggcat ccccccggcg gacgtggtcg tcctgggggc gggggtcctg 540

ggccgggcgg cggcgcgggc ctttctgggc gcgggggcct cggtccacct cctggaccgg 600

gcccttcccc cgctggagga ggccgcccgg gaggccccgg gggccatcac cgccctcgtc 660

acccaggacc gcctggagcg gtacgtggcc ttcgccgacg tcctggtggg ggcggtggcc 720

gtccctgggg agcgcacccc ccttctcctc acccgcggcc tcctcgcccg catgcgcccc 780

ggaagcgtcc tcctggactt ctccatagac caggggggcg tctcggaaac cagccgccct 840

ggggtctacc aggagatggg cgtcacccac ttctgcctcc ccaacgtccc cgccctcgtc 900

ccccgcaccg caagccacgc cctcaccctc accctcctcc cctacctgct ccggatccag 960

gaagaccccc tggcccttcc cgggctccgc cagggggcct acctcctctt cggcgagaaa 1020

ggaggccacc tagaatga 1038

<210> 33

<211> 372

<212> PRT

<213> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)

<400> 33

Met Lys Ile Gly Ile Pro Lys Glu Ile Lys Asn Asn Glu Asn Arg Val

1 5 10 15

Ala Ile Thr Pro Ala Gly Val Met Thr Leu Val Lys Ala Gly His Asp

20 25 30

Val Tyr Val Glu Thr Glu Ala Gly Ala Gly Ser Gly Phe Ser Asp Ala

35 40 45

Glu Tyr Glu Lys Ala Gly Ala Val Ile Val Thr Lys Ala Glu Asp Ala

50 55 60

Trp Ala Ala Glu Met Val Leu Lys Val Lys Glu Pro Leu Pro Glu Glu

65 70 75 80

Phe Arg Tyr Phe Arg Pro Gly Leu Ile Leu Phe Thr Tyr Leu His Leu

85 90 95

Ala Ala Ala Glu Ala Leu Thr Lys Ala Leu Val Glu Gln Lys Val Val

100 105 110

Gly Ile Ala Tyr Glu Thr Val Gln Leu Ala Asn Gly Ser Leu Pro Leu

115 120 125

Leu Thr Pro Met Ser Glu Val Ala Gly Arg Met Ser Val Gln Val Gly

130 135 140

Ala Gln Phe Leu Glu Lys Pro His Gly Gly Lys Gly Ile Leu Leu Gly

145 150 155 160

Gly Val Pro Gly Val Arg Arg Gly Lys Val Thr Ile Ile Gly Gly Gly

165 170 175

Thr Ala Gly Thr Asn Ala Gly Lys Ile Ala Val Gly Leu Gly Ala Asp

180 185 190

Val Thr Ile Leu Asp Ile Asn Ala Glu Arg Leu Arg Glu Leu Asp Asp

195 200 205

Leu Phe Gly Asp Gln Val Thr Thr Leu Met Ser Asn Ser Tyr His Ile

210 215 220

Ala Glu Cys Val Arg Glu Ser Asp Leu Val Val Gly Ala Val Leu Ile

225 230 235 240

Pro Gly Ala Lys Ala Pro Lys Leu Val Thr Glu Glu Met Val Arg Ser

245 250 255

Met Met Pro Gly Ser Val Leu Val Asp Val Ala Ile Asp Gln Gly Gly

260 265 270

Ile Phe Glu Thr Thr Asp Arg Val Thr Thr His Asp Asp Pro Thr Tyr

275 280 285

Val Lys His Gly Val Val His Tyr Ala Val Ala Asn Met Pro Gly Ala

290 295 300

Val Pro Arg Thr Ser Thr Phe Ala Leu Thr Asn Val Thr Ile Pro Tyr

305 310 315 320

Ala Leu Gln Ile Ala Asn Lys Gly Tyr Arg Ala Ala Cys Leu Asp Asn

325 330 335

Pro Ala Leu Leu Lys Gly Ile Asn Thr Leu Asp Gly His Ile Val Tyr

340 345 350

Glu Ala Val Ala Ala Ala His Asn Met Pro Tyr Thr Asp Ala His Ser

355 360 365

Leu Leu Gln Gly

370

<210> 34

<211> 377

<212> PRT

<213> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)

<400> 34

Met Ile Ile Gly Val Pro Lys Glu Ile Lys Asn Asn Glu Asn Arg Val

1 5 10 15

Ala Ile Thr Pro Ala Gly Val Leu Ser Phe Val Gln Ala Gly His Thr

20 25 30

Val Leu Ile Glu Lys Glu Ala Gly Val Gly Ser Gly Phe Ser Asp Ser

35 40 45

Asp Tyr Ala Arg Ala Gly Ala Gln Ile Ile Glu Arg Ala Glu Asp Val

50 55 60

Trp Ala Gln Ala Asp Met Val Met Lys Val Lys Glu Pro Leu Pro Ser

65 70 75 80

Glu Tyr Gly Tyr Phe Arg Pro Gly Leu Ile Leu Phe Thr Tyr Leu His

85 90 95

Leu Ala Ala Asp Pro Glu Leu Thr Arg Ala Leu Lys Glu Ser Gly Val

100 105 110

Ile Ala Ile Ala Tyr Glu Thr Val Gln Val Gly Arg Thr Leu Pro Leu

115 120 125

Leu Thr Pro Met Ser Glu Val Ala Gly Arg Met Ala Ala Gln Ile Gly

130 135 140

Ala Gln Phe Leu Glu Lys Pro Tyr Gly Gly Lys Gly Ile Leu Leu Gly

145 150 155 160

Gly Val Pro Gly Val Ala Arg Gly Lys Val Thr Ile Ile Gly Gly Gly

165 170 175

Val Val Gly Thr Asn Ala Ala Lys Val Ala Val Gly Leu Gly Ala Asp

180 185 190

Val Thr Ile Ile Asp Leu Asn Ala Asp Arg Leu Arg Glu Leu Asp Asp

195 200 205

Ile Phe Gly Asn Gln Ile Thr Thr Leu Met Ser Asn Pro Met Asn Ile

210 215 220

Ala Glu Ala Val Ala Glu Ala Asp Leu Val Ile Gly Ala Val Leu Ile

225 230 235 240

Pro Gly Ala Arg Ala Pro Lys Leu Val Thr Glu Asp Met Val Lys Ala

245 250 255

Met Lys Pro Gly Ser Val Ile Val Asp Val Ala Ile Asp Gln Gly Gly

260 265 270

Ile Val Glu Thr Ser Asp His Val Thr Thr His Asp Asp Pro Thr Tyr

275 280 285

Val Lys His Gly Val Val His Tyr Ala Val Ala Asn Met Pro Gly Ala

290 295 300

Val Pro Arg Thr Ser Thr Ile Ala Leu Thr Asn Val Thr Met Pro Tyr

305 310 315 320

Ala Leu Gln Ile Ala Asn Lys Gly Val Ile Gln Ala Ile Thr Asp Asn

325 330 335

Pro Ala Leu Glu Leu Gly Val Asn Val Ala Asn Gly Glu Ile Thr Tyr

340 345 350

Glu Ala Val Ala Arg Asp Leu Gly Tyr Arg Tyr Val Pro Ala Arg Glu

355 360 365

Ala Leu Gly Lys Thr Leu Ala Ala Asn

370 375

<210> 35

<211> 369

<212> PRT

<213> 嗜热栖热菌(Thermus thermophilus)

<400> 35

Met Val Ile Gly Val Pro Lys Glu Ile Lys Thr Leu Glu Asn Arg Val

1 5 10 15

Ala Leu Thr Pro Gly Gly Val Glu Ser Leu Val Arg Arg Gly His Thr

20 25 30

Val Leu Val Glu Arg Gly Ala Gly Glu Gly Ser Gly Leu Ser Asp Ala

35 40 45

Glu Tyr Ala Arg Ala Gly Ala Glu Leu Val Gly Arg Glu Glu Ala Trp

50 55 60

Gly Ala Glu Met Val Val Lys Val Lys Glu Pro Leu Pro Glu Glu Tyr

65 70 75 80

Gly Phe Leu Arg Glu Gly Leu Ile Leu Phe Thr Tyr Leu His Leu Ala

85 90 95

Ala Asp Arg Gly Leu Thr Glu Ala Met Leu Arg Ser Gly Val Thr Gly

100 105 110

Ile Ala Tyr Glu Thr Val Gln Leu Pro Asp Gly Thr Leu Pro Leu Leu

115 120 125

Val Pro Met Ser Glu Val Ala Gly Arg Met Ala Pro Gln Val Gly Ala

130 135 140

Gln Phe Leu Glu Lys Pro Lys Gly Gly Arg Gly Val Leu Leu Gly Gly

145 150 155 160

Val Pro Gly Val Ala Pro Ala Ser Val Val Ile Leu Gly Gly Gly Thr

165 170 175

Val Gly Thr Asn Ala Ala Lys Ile Ala Leu Gly Met Gly Ala Gln Val

180 185 190

Thr Ile Leu Asp Val Asn His Lys Arg Leu Gln Tyr Leu Asp Asp Val

195 200 205

Phe Gly Gly Arg Val Ile Thr Leu Thr Ala Thr Glu Ala Asn Ile Lys

210 215 220

Lys Ser Val Gln His Ala Asp Leu Leu Ile Gly Ala Val Leu Val Pro

225 230 235 240

Gly Ala Lys Ala Pro Lys Leu Val Thr Arg Asp Met Leu Ser Leu Met

245 250 255

Lys Glu Gly Ala Val Ile Val Asp Val Ala Val Asp Gln Gly Gly Cys

260 265 270

Val Glu Thr Ile Arg Pro Thr Thr His Ala Glu Pro Thr Tyr Val Val

275 280 285

Asp Gly Val Val His Tyr Gly Val Ala Asn Met Pro Gly Ala Val Pro

290 295 300

Arg Thr Ser Thr Phe Ala Leu Thr Asn Gln Thr Leu Pro Tyr Val Leu

305 310 315 320

Lys Leu Ala Glu Lys Gly Leu Asp Ala Leu Leu Glu Asp Ala Ala Leu

325 330 335

Leu Lys Gly Leu Asn Thr His Lys Gly Arg Leu Thr His Pro Gly Val

340 345 350

Ala Glu Ala Phe Gly Leu Pro Tyr Thr Pro Pro Glu Glu Ala Leu Arg

355 360 365

Gly

<210> 36

<211> 345

<212> PRT

<213> 嗜热栖热菌(Thermus thermophilus)

<400> 36

Met Glu Phe Gly Val Pro Arg Glu Arg Ser Gly Gly Glu Ile Pro Glu

1 5 10 15

Arg Arg Val Pro Leu Thr Pro Gln Gly Val Arg Glu Leu Val Ala Ser

20 25 30

Gly His Arg Val Tyr Val Glu Arg Gly Ala Gly Glu Gly Ala Gly Phe

35 40 45

Pro Asp Glu Ala Tyr Glu Glu Ala Gly Ala Arg Leu Val Gly Arg Glu

50 55 60

Glu Ala Phe Gly Arg Pro Gln Val Val Leu Lys Val Ala Arg Pro Thr

65 70 75 80

Leu Glu Glu Val Gly Leu Met Arg Lys Asn Ala Val Leu Met Ala Phe

85 90 95

Leu His Leu Ala Val Ala Glu Ser Pro Leu Val Glu Ala Met Ala Gln

100 105 110

Lys Gly Leu Thr Ala Ile Gly Tyr Glu Leu Val Gly Glu Glu Gly Arg

115 120 125

Arg Pro Val Leu Lys Ala Met Ser Glu Ile Ala Gly Arg Met Ala Pro

130 135 140

Gln Leu Ala Gly Arg Leu Leu Glu Ala Pro Gln Gly Pro Gly Ile Leu

145 150 155 160

Leu Ser Gly Leu Val Gly Ile Pro Pro Ala Asp Val Val Val Leu Gly

165 170 175

Ala Gly Val Leu Gly Arg Ala Ala Ala Arg Ala Phe Leu Gly Ala Gly

180 185 190

Ala Ser Val His Leu Leu Asp Arg Ala Leu Pro Pro Leu Glu Glu Ala

195 200 205

Ala Arg Glu Ala Pro Gly Ala Ile Thr Ala Leu Val Thr Gln Asp Arg

210 215 220

Leu Glu Arg Tyr Val Ala Phe Ala Asp Val Leu Val Gly Ala Val Ala

225 230 235 240

Val Pro Gly Glu Arg Thr Pro Leu Leu Leu Thr Arg Gly Leu Leu Ala

245 250 255

Arg Met Arg Pro Gly Ser Val Leu Leu Asp Phe Ser Ile Asp Gln Gly

260 265 270

Gly Val Ser Glu Thr Ser Arg Pro Gly Val Tyr Gln Glu Met Gly Val

275 280 285

Thr His Phe Cys Leu Pro Asn Val Pro Ala Leu Val Pro Arg Thr Ala

290 295 300

Ser His Ala Leu Thr Leu Thr Leu Leu Pro Tyr Leu Leu Arg Ile Gln

305 310 315 320

Glu Asp Pro Leu Ala Leu Pro Gly Leu Arg Gln Gly Ala Tyr Leu Leu

325 330 335

Phe Gly Glu Lys Gly Gly His Leu Glu

340 345

<210> 37

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 麦芽糖结合蛋白的N末端

<400> 37

Met Lys Ile Glu Glu Gly Lys Leu Val Ile His

1 5 10

<210> 38

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 编码麦芽糖结合蛋白的N末端的DNA

<400> 38

atgaaaatcg aagaaggtaa actggtaatc cat 33

<210> 39

<211> 388

<212> PRT

<213> 人工序列

<220>

<223> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)的修饰的丙氨酸脱氢酶

<400> 39

Met Lys Ile Glu Glu Gly Lys Leu Val Ile His Met Ile Ile Gly Val

1 5 10 15

Pro Lys Glu Ile Lys Asn Asn Glu Asn Arg Val Ala Ile Thr Pro Ala

20 25 30

Gly Val Leu Ser Phe Val Gln Ala Gly His Thr Val Leu Ile Glu Lys

35 40 45

Glu Ala Gly Val Gly Ser Gly Phe Ser Asp Ser Asp Tyr Ala Arg Ala

50 55 60

Gly Ala Gln Ile Ile Glu Arg Ala Glu Asp Val Trp Ala Gln Ala Asp

65 70 75 80

Met Val Met Lys Val Lys Glu Pro Leu Pro Ser Glu Tyr Gly Tyr Phe

85 90 95

Arg Pro Gly Leu Ile Leu Phe Thr Tyr Leu His Leu Ala Ala Asp Pro

100 105 110

Glu Leu Thr Arg Ala Leu Lys Glu Ser Gly Val Ile Ala Ile Ala Tyr

115 120 125

Glu Thr Val Gln Val Gly Arg Thr Leu Pro Leu Leu Thr Pro Met Ser

130 135 140

Glu Val Ala Gly Arg Met Ala Ala Gln Ile Gly Ala Gln Phe Leu Glu

145 150 155 160

Lys Pro Tyr Gly Gly Lys Gly Ile Leu Leu Gly Gly Val Pro Gly Val

165 170 175

Ala Arg Gly Lys Val Thr Ile Ile Gly Gly Gly Val Val Gly Thr Asn

180 185 190

Ala Ala Lys Val Ala Val Gly Leu Gly Ala Asp Val Thr Ile Ile Asp

195 200 205

Leu Asn Ala Asp Arg Leu Arg Glu Leu Asp Asp Ile Phe Gly Asn Gln

210 215 220

Ile Thr Thr Leu Met Ser Asn Pro Met Asn Ile Ala Glu Ala Val Ala

225 230 235 240

Glu Ala Asp Leu Val Ile Gly Ala Val Leu Ile Pro Gly Ala Arg Ala

245 250 255

Pro Lys Leu Val Thr Glu Asp Met Val Lys Ala Met Lys Pro Gly Ser

260 265 270

Val Ile Val Asp Val Ala Ile Asp Gln Gly Gly Ile Val Glu Thr Ser

275 280 285

Asp His Val Thr Thr His Asp Asp Pro Thr Tyr Val Lys His Gly Val

290 295 300

Val His Tyr Ala Val Ala Asn Met Pro Gly Ala Val Pro Arg Thr Ser

305 310 315 320

Thr Ile Ala Leu Thr Asn Val Thr Met Pro Tyr Ala Leu Gln Ile Ala

325 330 335

Asn Lys Gly Val Ile Gln Ala Ile Thr Asp Asn Pro Ala Leu Glu Leu

340 345 350

Gly Val Asn Val Ala Asn Gly Glu Ile Thr Tyr Glu Ala Val Ala Arg

355 360 365

Asp Leu Gly Tyr Arg Tyr Val Pro Ala Arg Glu Ala Leu Gly Lys Thr

370 375 380

Leu Ala Ala Asn

385

<210> 40

<211> 1167

<212> DNA

<213> 人工序列

<220>

<223> 嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)的修饰的丙氨酸脱氢酶基因的编码DNA

<400> 40

atgaaaatcg aagaaggtaa actggtaatc catatgatta ttggagtgcc aaaggaaatc 60

aaaaataacg aaaaccgtgt cgccattacg ccggctggcg ttttgtcatt cgttcaggct 120

ggacatacgg ttctgattga gaaagaggca ggggttggaa gcggtttcag cgacagcgat 180

tacgcccgtg ccggagcaca aatcatcgag cgggcggaag atgtttgggc gcaagccgat 240

atggtgatga aagtgaaaga gccgctgcca agcgaatacg gctatttccg cccaggtctc 300

attttgttca cctatttgca tttggccgcc gacccggagt tgacacgcgc cttaaaagaa 360

agcggcgtca tcgccattgc ctatgagacg gtgcaagtcg gccgcacact gccgctgttg 420

acaccaatga gcgaagtcgc cggacggatg gccgcgcaaa ttggagcgca atttttagaa 480

aaaccgtacg gcggcaaagg catcttgctt ggcggcgtcc caggcgttgc ccgcggcaaa 540

gtgacgatca tcggcggcgg agtcgtcggc acgaacgcag cgaaagtcgc ggtcggcctc 600

ggggcagatg tcacgattat cgacttgaac gcggatcgcc tgcgcgagct tgacgacatt 660

ttcggcaacc aaattacgac gctcatgtcc aacccaatga acatcgccga agcggttgct 720

gaggccgacc ttgtcatcgg cgccgtcctc atcccgggag cgcgggcgcc gaagctcgtc 780

accgaggaca tggtgaaagc gatgaaaccg ggttcggtca tcgtcgatgt cgccatcgac 840

caagggggca tcgtcgagac gagcgaccac gtcacgacac atgacgaccc gacgtacgtc 900

aaacacggcg tcgtccatta tgcggtcgcc aacatgcctg gcgccgtccc gcgcacctca 960

acgatcgcct tgacgaacgt caccatgcca tacgccttgc aaatcgccaa caaaggcgtc 1020

atccaagcca ttacagacaa cccggcgctt gagcttggcg tcaacgtcgc caacggtgaa 1080

atcacgtacg aagcggtcgc ccgcgacctc ggttaccgct acgtcccggc ccgcgaagcg 1140

ctcgggaaaa cgttggccgc caactaa 1167

<210> 41

<211> 548

<212> PRT

<213> 乳酸乳球菌(Lactococcus lactis)

<400> 41

Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly

1 5 10 15

Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu

20 25 30

Asp Gln Ile Ile Ser Arg Lys Asp Met Lys Trp Val Gly Asn Ala Asn

35 40 45

Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys

50 55 60

Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Val

65 70 75 80

Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile

85 90 95

Val Gly Ser Pro Thr Ser Lys Val Gln Asn Glu Gly Lys Phe Val His

100 105 110

His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu

115 120 125

Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Val

130 135 140

Glu Ile Asp Arg Val Leu Ser Ala Leu Leu Lys Glu Arg Lys Pro Val

145 150 155 160

Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro

165 170 175

Ser Leu Pro Leu Lys Lys Glu Asn Ser Thr Ser Asn Thr Ser Asp Gln

180 185 190

Glu Ile Leu Asn Lys Ile Gln Glu Ser Leu Lys Asn Ala Lys Lys Pro

195 200 205

Ile Val Ile Thr Gly His Glu Ile Ile Ser Phe Gly Leu Glu Lys Thr

210 215 220

Val Ser Gln Phe Ile Ser Lys Thr Lys Leu Pro Ile Thr Thr Leu Asn

225 230 235 240

Phe Gly Lys Ser Ser Val Asp Glu Ala Leu Pro Ser Phe Leu Gly Ile

245 250 255

Tyr Asn Gly Lys Leu Ser Glu Pro Asn Leu Lys Glu Phe Val Glu Ser

260 265 270

Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr

275 280 285

Gly Ala Phe Thr His His Leu Asn Glu Asn Lys Met Ile Ser Leu Asn

290 295 300

Ile Asp Glu Gly Lys Ile Phe Asn Glu Ser Ile Gln Asn Phe Asp Phe

305 310 315 320

Glu Ser Leu Ile Ser Ser Leu Leu Asp Leu Ser Glu Ile Glu Tyr Lys

325 330 335

Gly Lys Tyr Ile Asp Lys Lys Gln Glu Asp Phe Val Pro Ser Asn Ala

340 345 350

Leu Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Asn Leu Thr Gln

355 360 365

Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala

370 375 380

Ser Ser Ile Phe Leu Lys Pro Lys Ser His Phe Ile Gly Gln Pro Leu

385 390 395 400

Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile

405 410 415

Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu

420 425 430

Gln Leu Thr Val Gln Glu Leu Gly Leu Ala Ile Arg Glu Lys Ile Asn

435 440 445

Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu

450 455 460

Ile His Gly Pro Asn Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr

465 470 475 480

Ser Lys Leu Pro Glu Ser Phe Gly Ala Thr Glu Glu Arg Val Val Ser

485 490 495

Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala

500 505 510

Gln Ala Asp Pro Asn Arg Met Tyr Trp Ile Glu Leu Ile Leu Ala Lys

515 520 525

Glu Asp Ala Pro Lys Val Leu Lys Lys Met Gly Lys Leu Phe Ala Glu

530 535 540

Gln Asn Lys Ser

545

<210> 42

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 42

cgtggccaac taggcccagc cagatactcc cgatc 35

<210> 43

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 43

tgaggcctca ttggccggag cgcaacccac tcact 35

<210> 44

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 44

ctgggcctag ttggccacgt agaaagccag tccgc 35

<210> 45

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 45

tccggccaat gaggcctcag aagaactcgt caaga 35

<210> 46

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 46

gcattaatcc ttggactcct gttgatagat ccagtaatga cctcagaact ccatctggat 60

ttgttcagaa cgctcggttg ccg 83

<210> 47

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 47

caccgtgcag tcgatggatc tggattctca ccaataaaaa acgcccggcg gcaaccgagc 60

gttctgaaca aatccagatg gag 83

<210> 48

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 48

ttattggtga gaatccagat ccatcgactg cacggtgcac caatgcttct 50

<210> 49

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 49

gcaagcttgg agtgatcatc gtatgcatat gcgtttctcc tccagatccc tgtttcctgt 60

gtgaaattgt 70

<210> 50

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 50

ctcgaattca ctggccgtcg ttttacaacg tcgtg 35

<210> 51

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 51

cgcaattgag tttgtagaaa cgcaaaaagg ccatc 35

<210> 52

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 52

gcacatatgt atacagtagg agattaccta ttaga 35

<210> 53

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 53

gcaggatcct tatgatttat tttgttcagc aaata 35

<210> 54

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 54

gcacatatga caaaagcaac aaaagaacaa aaatc 35

<210> 55

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 55

gcaggatcct agagagcttt cgttttcatg agttc 35

<210> 56

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 56

cgagtccata tgaaacagac tatccgcaat atcag 35

<210> 57

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 57

gcaggatcct taccgagaat tcgagcgctt tcgca 35

<210> 58

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 58

cgagtccata tgaaaaagcg ggtgatgcgt ggcct 35

<210> 59

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 59

gcaggatcct catctgtctg acagtctcat cgtca 35

<210> 60

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 60

cgagtccata tgcaaccgac ctacactatt gggga 35

<210> 61

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 61

cgcggatcct taaacgcggc tgtttcgctc ctcaa 35

<210> 62

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 62

cgagtccata tgaaggcagc tgttgttacc cacga 35

<210> 63

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 63

cgcgaattct tagctacgca gatcgataac catac 35

<210> 64

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 64

cgagtccata tgaaagccgc cgttgttcac aaatt 35

<210> 65

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 65

gcaggatcct tacattgtta aaacaatgcg gccat 35

<210> 66

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 66

cgagtccata tgaaagcggc agttgtcaac gattt 35

<210> 67

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 67

cgcgaattct taacggttga caccgatggt taaaa 35

<210> 68

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 68

cgagtccata tgaaagcact tacataccta gggcc 35

<210> 69

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 69

gcaggatcct taactgttgg aaataatgac tttta 35

<210> 70

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 70

cgcggtaccg gatctggagg agaaacgcat atgaa 35

<210> 71

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 71

cgcggtacct taacggttga caccgatggt taaaa 35

<210> 72

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 72

gcacatatga cttatactgt cggacattat cttgc 35

<210> 73

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 73

gcaggatcct tagacgctct ggggcttgcg ggagt 35

<210> 74

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 74

cgagtccata tgaaggcagc tgttgttacc cacga 35

<210> 75

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 75

cgcgtcgact tagctacgca gatcgataac catac 35

<210> 76

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 76

gcacatatgt ataccgttgg tatgtacttg gcaga 35

<210> 77

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 77

gcagtcgact tacgcttgtg gtttgcgaga gttgg 35

<210> 78

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 78

gcacatatga catatacagt cggcatgtat cttgc 35

<210> 79

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 79

gcagtcgact caggatacct gcggttttct ggaat 35

<210> 80

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 80

gcacatatgg ctgttactaa tgtcgctgaa cttaa 35

<210> 81

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 81

gcaggatcct taagcggatt ttttcgcttt tttct 35

<210> 82

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 82

gcacatatga cgaaaatagc gaataaatac gaagt 35

<210> 83

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 83

gcactgcagt tatttcttcg cacctccgta ataag 35

<210> 84

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 84

gaagctggcg ctgcgcttta tggatatccg taaac 35

<210> 85

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 85

tcgaagtgag tttccggatg ttcgtacata accca 35

<210> 86

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 86

atggcaatga gatttatgga tataagaaag agagt 35

<210> 87

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 87

gttcataaag tcaacttccg gatgttcata catca 35

<210> 88

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 88

cgcggtaccg gatctggagg agaaacgcat atgaa 35

<210> 89

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 89

cgcggtacct taacggttga caccgatggt taaaa 35

<210> 90

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 90

tccggcgggc atatgaagat cggcattcca aaaga 35

<210> 91

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 91

aagaattcca gcggctcata tacgataccg ttcgg 35

<210> 92

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 92

tccggcgggc atatgattat tggagtgcca aagga 35

<210> 93

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 93

aagaattctt agttggcagc caacgttttc ccgag 35

<210> 94

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 94

ccggcgggca tatggtgatc ggcgtgccga aggag 35

<210> 95

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 95

aagaattctc accccctcaa ggcctcctcg ggagg 35

<210> 96

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 96

cggcgggcat atggagttcg gcgtgcccag agaac 35

<210> 97

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 97

aagaattctc attctaggtg gcctcctttc tcgcc 35

<210> 98

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 98

tatgaaaatc gaagaaggta aactggtaat cca 33

<210> 99

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 99

tatggattac cagtttacct tcttcgattt tca 33

<210> 100

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> Journal of Bioscience and Bioengineering, 123, 540-546 (2017)所写的多肽

<400> 100

Met Ser Lys Ile Lys His

1 5

<210> 101

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 101

tatgagcaag atcaaaca 18

<210> 102

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 102

tatgtttgat cttgctca 18

<210> 103

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 谷胱甘肽S-转移酶N末端部分

<400> 103

Met Asp Phe Pro Val Ala Glu Asp Arg Arg His

1 5 10

<210> 104

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 104

tatgtcgccg atcctcggct actggaaaat cca 33

<210> 105

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 105

tatggatttt ccagtagccg aggatcggcg aca 33

<210> 106

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> β-葡糖苷酶的N末端部分

<400> 106

Met Thr Glu Asn Ala Glu Lys Phe Leu Trp His

1 5 10

<210> 107

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 107

tatgaccgag aacgccgaaa aattcctttg gca 33

<210> 108

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 108

tatgccaaag gaatttttcg gcgttctcgg tca 33

<210> 109

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> HAT序列

<400> 109

Met Gly Lys Asp His Leu Ile His Asn Val His Lys Glu Glu His Ala

1 5 10 15

His Ala His Asn Lys His

20

<210> 110

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 110

cgcatatggg caaggatcat ctcatccaca atgtccacaa agagg 45

<210> 111

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> PCR引物

<400> 111

cgcatatgct tgttgtgggc atgagcgtgc tcctctttgt ggaca 45

相关技术
  • 产乳酸的嗜氢菌属细菌转化体
  • 具有增强的产缬氨酸能力的嗜氢菌属细菌基因重组体
技术分类

06120112263969