掌桥专利:专业的专利平台
掌桥专利
首页

具有改善的戊糖转化的细胞

文献发布时间:2023-06-19 09:29:07



本申请是申请号为201380053639.X的名称为具有改善的戊糖转化的细胞的中国专利申请的分案申请,原申请是申请日为2013年10月15日的国际申请PCT/EP2013/071462的中国国家阶段申请。

技术领域

本发明涉及具有改善的戊糖转化的细胞。更特别地,本发明涉及具有改善的木糖和/或L-阿拉伯糖的转化的细胞。所述细胞用于生产发酵产物,例如用于从源自木质纤维素材料的糖来生产乙醇。

背景技术

近几十年中对传统化石燃料(基于石油的燃料)的大规模消耗产生了高水平的污染。这与对化石燃料的世界储量并非无限的认识以及日益增长的环境意识一起,刺激了研究诸如乙醇的替选燃料的可行性的新举措,乙醇是以每升记比无铅汽油释放更少CO

虽然可通过发酵得自多种不同来源的己糖来产生源自生物质的乙醇,但是诸如蔗糖和玉米淀粉的通常用于商业规模生产燃料醇的底物是昂贵的。因此,燃料乙醇生产的增加将需要使用较低成本的原料。

目前,只有源自植物生物质的木质纤维素原料能够以替代现在用于乙醇生产的作物的足够的量获得。在大多数木质纤维素材料中,继葡萄糖之后的第二常用的糖是木糖。而且,L-阿拉伯糖是源自一些木质纤维素材料的糖。因此,对于经济上可行的燃料生产方法而言,必须发酵己糖和戊糖二者以形成乙醇。酿酒酵母(Saccharomyces cerevisiae)这种酵母是稳固的并且被良好地适于乙醇生产,但是其无法使用木糖作为碳源来生产乙醇。因此,需要拥有这些性质的生物体以使得从木质纤维素原料生产乙醇在商业上可行。将来自厌氧真菌单鞭毛菌Sp.E2(Piromyces Sp.E2)的木糖异构酶引入酿酒酵母,并且观察到高水平的酶活性使该菌株能够厌氧生长并用木糖生产乙醇(WO03/062340和WO06/009434)。这样的酵母菌菌株首次提供了与商业规模的乙醇生产相适应的木糖消耗和乙醇形成比速率。

但是,仍然期望改善戊糖转化以及缩短发酵时间。

发明内容

本发明的一个目的是提供具有改善的戊糖转化的细胞。本发明的另一个目的是提供具有改善的木糖和/或L-阿拉伯糖转化的重组菌株。另一个目的是提供在存在葡萄糖的情况下具有改善的木糖和/或L-阿拉伯糖转化的菌株。另一个目的是减少发酵包含戊糖和己糖的糖混合物的发酵时间。

通过本发明达到了这些目的中的一个或多个。根据本发明,提供了细胞,其组成型表达具有SEQ ID NO:20的氨基酸序列或由SEQ ID NO:27的核苷酸序列编码的氨基酸序列的异源或同源多肽,或者具有与SEQ ID NO:20有至少45%序列同一性的氨基酸序列的其变体。

根据实施例的细胞具有改善的戊糖转化,并且导致减少发酵包含戊糖和己糖的糖混合物的发酵时间。在一个实施方案中,所述多肽具有乙二醛酶活性。

本发明还提供了:

-用于生产发酵产物的方法,所述方法包括用本发明的细胞发酵含有木糖源和或L-阿拉伯糖源的介质,以使所述细胞将木糖和/或L-阿拉伯糖发酵成发酵产物;

-本发明的细胞用于生产发酵产物的方法中的用途。

附图说明

图1:具有PGK1启动子和PGI1终止子的GLO1表达盒的图。

图2:质粒pRN228的图谱(参见实施例);

图3:质粒pRN935的图谱(参见实施例);

图4:质粒pRN685的图谱(参见实施例);

图5:质粒pRN1048的图谱(参见实施例);

图6:质粒pRN1129的图谱(参见实施例);

图7:酵母穿梭载体pRN599的图谱(参见实例);

图8:质粒pRN1049的图谱;

图9:基因表达数据。菌株RN1001Epl和RN1001Gpl的归一化的表达倍数;

图10:菌株RN1001Gpl(上)和RN1001Epl(下)的生长的CO

图11:示出糖消耗的菌株RN1001Epl和RN1001Gpl的生长曲线。

图12:质粒pRN324的图谱;

图13:质粒pRN1142的图谱;

图14:示出酿酒酵母基因组中的整合位点的图谱:整合位点1(Chr XV,坐标458319bp至459320bp)。两条垂直虚线之间的区域指示具体图谱;

图15:示出PCR片段(His或His-Glo)整合至酿酒酵母基因组中的机制的图示;

图16:基因表达数据。菌株RN1041(上)和RN1216(下)的归一化的GLO1表达倍数;

图17:菌株RN1041H、RN1041HG-1和RN1041HG-2的生长的CO

图18:菌株RN1041H(上)、RN1041HG-1(中)和RN1041HG-2(下)的糖消耗曲线;

图19:菌株RN1216H、RN1216HG-1和RN1216HG-2的生长的CO

图20:示出糖消耗的菌株RN1216H(上)、RN1216HG-1(中)和RN1216HG-2(下)的糖消耗曲线。

图21:质粒pDB1175的图谱(参见实施例);

图22:质粒pDB1176的图谱(参见实施例);

图23:质粒pDB1177的图谱(参见实施例);

图24:质粒pDB1178的图谱(参见实施例);

图25:质粒pRN1179的图谱(参见实施例);

图26:示出PCR片段整合至酿酒酵母基因组中的机制的图示;

图27:菌株RN1216 ScG_H、RN1216 CglaG_H、RN1216 ZrouG_H、RN1216 KIG_H、RN1216 CmagG_H和RN1216H的生长的CO

图28:菌株RN1216 ScG_H的糖消耗曲线

图29:菌株RN1216 CglaG_H的糖消耗曲线

图30:菌株RN1216 ZrouG_H的糖消耗曲线

图31:菌株RN1216 KIG_H的糖消耗曲线

图32:菌株RN1216 CmagG_H的糖消耗曲线

图33:菌株RN1216 H的糖消耗曲线

SEQ ID NO 1:正向引物PGK1启动子;

SEQ ID NO 2:反向引物PGI1终止子

SEQ ID NO 3:正向引物ACT1基因;

SEQ ID NO 4:反向引物ACT1基因;

SEQ ID NO 5:正向引物GLO1基因,Q-PCR;

SEQ ID NO 6:反向引物GLO1基因,Q-PCR;

SEQ ID NO 7:正向引物ALG9基因,Q-PCR;

SEQ ID NO 8:反向引物ALG9基因,Q-PCR;

SEQ ID NO 9:正向引物UBC6基因,Q-PCR;

SEQ ID NO 10:反向引物UBC6基因,Q-PCR;

SEQ ID NO 11:正向引物HIS3盒,5'侧翼INT1;

SEQ ID NO 12:反向引物GLO1盒,3'侧翼INT1;

SEQ ID NO 13:反向引物HIS3盒,3'侧翼INT1;

SEQ ID NO 14:正向引物5’侧翼INT1;

SEQ ID NO 15:反向引物5’侧翼INT1;

SEQ ID NO 16:正向引物3'侧翼INT1;

SEQ ID NO 17:反向引物3'侧翼INT1;

SEQ ID NO 18:整合位点INT1的核苷酸序列5’侧翼;

SEQ ID NO 19:整合位点INT1的核苷酸序列3'侧翼;

SEQ ID NO 20:来自酿酒酵母的GLO1的蛋白序列;

SEQ ID NO 21:来自光滑假丝酵母(Candida glabrata)的GLO1的蛋白序列;

SEQ ID NO 22:来自鲁氏接合酵母(Zygosaccharomyces rouxii)的GLO1的蛋白序列;

SEQ ID NO 23:来自乳酸克鲁维酵母(Kluyveromyces lactis)的GLO1的蛋白序列;

SEQ ID NO 24:来自木兰假丝酵母(Candida magnolia)的GLO1的蛋白序列;

SEQ ID NO 25:GLO1 ORF的正向引物;

SEQ ID NO 26:GLO1 ORF的反向引物;

SEQ ID NO 27:来自酿酒酵母的GLO1的核苷酸序列;

SEQ ID NO 28:同源GLO1表达盒(包含启动子和终止子)的正向引物;

SEQ ID NO 29:同源GLO1表达盒(包含启动子和终止子)的反向引物;

SEQ ID NO 30:HIS3盒的正向引物,由20个核苷酸以及5'端的与同源GLO1表达盒3'端的50核苷酸相同的50个核苷酸的尾组成;

SEQ ID NO 31:HIS3盒的反向引物,由21个核苷酸以及5'端的与3'500bp INT1侧翼5'端的50核苷酸相同的50个核苷酸的尾组成;

SEQ ID NO 32:5'500bp INT1侧翼序列的反向引物,由23个核苷酸以及5'端的与同源GLO1表达盒5'端的50核苷酸相同的50个核苷酸的尾组成;

SEQ ID NO 33:3'500bp INT1侧翼的正向引物,由24个核苷酸以及5'端的与HIS3表达盒3'端的50核苷酸相同的50个核苷酸的尾组成;

SEQ ID NO 34:来自酿酒酵母的GLO1的密码子对优化的核苷酸序列;

SEQ ID NO 35:来自光滑假丝酵母的GLO1的密码子对优化的核苷酸序列;

SEQ ID NO 36:来自木兰假丝酵母的GLO1的密码子对优化的核苷酸序列;

SEQ ID NO 37:来自乳酸克鲁维酵母的GLO1的密码子对优化的核苷酸序列;

SEQ ID NO 38:来自鲁氏接合酵母的GLO1的密码子对优化的核苷酸序列。

具体实施方式

在整个说明书以及所附权利要求中,词语“包含”和“包括”及其变化形式应当理解为包括性的。即,这些词语旨在传达在上下文允许的情况下可能包含没有具体列举的其他要素或整体。

根据本发明,所述细胞可包含乙二醛酶活性,优选乙二醛酶I活性。乙二醛酶1(GLO1)是编码参与甲基乙二醛分解代谢(2)的乙二醛酶I(EC4.4.1.5)的基因。甲基乙二醛是作为糖酵解副产物形成的有毒化合物。

乙二醛酶的替代名称为例如乳酰谷胱甘肽裂合酶、醛酮变位酶、酮-醛变位酶、甲基乙二醛酶、S-D-乳酰谷胱甘肽甲基乙二醛裂合酶。

甲基乙二醛分解代谢的一种方法包括乙二醛酶系统,其中用谷胱甘肽经Glo1p缩合甲基乙二醛,以产生S-D-乳酰谷胱甘肽。然后用乙二醛酶II(Glo2p和Glo4p)将该谷胱甘肽硫羟酸酯水解成乳酸和谷胱甘肽。用甲基乙二醛诱导GLO1表达,特别地,以高摩尔渗透压浓度(osmolarity)的甘油(Hog1p)-丝裂原活化蛋白(MAP)激酶依赖的方式(1)由渗透应力诱导GLO1表达。

GLO1的缺失导致对甲基乙二醛的超敏反应。在酿酒酵母中,乙二醛酶I(Glo1p)是天然的,并且存在为单体。该系统示出了处理内源毒素的酶的许多典型特征。首先,与参与异生物质代谢的许多酶的惊人底物范围不同,其示出窄的底物特异性。其次,需要细胞内的硫醇作为其酶促机制的部分,并且再次,该系统的作用是将反应性代谢物回收至可用于细胞代谢的形式。

在一个实施方案中,本发明涉及表达乙二醛酶的细胞,其中所述乙二醛酶的氨基酸序列与SEQ ID NO:20中所示氨基酸序列有至少45%的同一性,并且其中将核苷酸序列以同源或异源的形式组成型地整合至细胞中。

氨基酸/多核苷酸序列

通过引用具有SEQ ID NO:20的氨基酸序列或与其有至少45%序列同一性的序列的蛋白质来定义本发明的细胞。在一个实施方案中,所述蛋白质与SEQ ID NO:20的氨基酸序列的序列同一性为至少约50%、至少55%、至少约60%、至少约65%、至少约70%、至少约80%、至少约90%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。

在一个实施方案中,所述细胞包含和/或表达具有与SEQ ID NO:20中的位置H25、E89、H269和E318和/或H185、E242、H117和E163相对应的氨基酸H、E、H和E的多肽。在一个实施方案中,所述细胞包含和/或表达具有与SEQ ID NO:20中的片段E242-L243-X-H245-N246相对应的片段(E,s,d)-L-X-(H,Y)-(N,s)的多肽。在一个实施方案中,所述细胞包含和/或表达具有与SEQ ID NO:20中的片段G266-Y267-G268-H269相对应的片段G-(F,Y)-G-H的多肽。在一个实施方案中,所述细胞包含和/或表达具有与SEQ ID NO:20中的片段G301-X(6)-F308-X(2)-D311-X(3)-Y315相对应的片段G-X(6)-(F,i)-X(2,3)-D-X(3)-Y的多肽。

在上文中,用单字母代码来指代氨基酸。X为任何氨基酸;(X,Y)为氨基酸X或Y;X(y)为y数目的氨基酸X,并且X(y,z)为y或z数目的氨基酸X。小写字母代码指代较少出现的氨基酸。

在一个实施方案中,所述细胞包含和/或表达具有乙二醛酶活性的多肽。

根据本发明的细胞可包含编码乙二醛酶的核苷酸序列,其具有SEQ ID NO:27的核苷酸序列,或与SEQ ID NO:27中所示核酸序列有以下序列同一性的序列:至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%,优选至少约80%、至少约85%、至少约90%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%,或者至少75%、至少80%、至少85%、至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%。

因此,本发明提供了具有包含编码乙二醛酶多肽的基因的多核苷酸序列及其编码序列的细胞。

可分离或合成本发明的多核苷酸。本文中乙二醛酶多肽和乙二醛酶多核苷酸可分别为合成的多肽、多核苷酸。可对合成的多核苷酸在密码子使用上进行优化,优选根据WO2006/077258和/或PCT/EP2007/055943中描述的方法,通过引用将其并入本文。PCT/EP2007/055943涉及密码子对的优化。

该术语是指多核苷酸分子,其为单链或双链的核糖核酸(RNA)分子或脱氧核糖核酸(DNA)分子。多核苷酸可以以分离的形式存在,或者包含于重组核酸分子或载体中,或包含于宿主细胞中。

本文使用词语“多肽”来表示包含多于七个氨基酸残基的链。本文中所有寡肽和多肽式或序列都是以从左至右从氨基末端至羧基末端的方向书写的。本文所用的氨基酸的单字母代码是本领域公知的。

“分离的”多肽或蛋白质是指从其天然环境中移除的多肽或蛋白质。例如,宿主细胞中表达的重组生产的多肽和蛋白质为本发明的目的被视分离的,已经通过诸如Smith和Johnson,Gene 67:31-40(1988)中公开的单步骤纯化法的任何合适技术基本纯化了的天然多肽或重组多肽也是如此。

可使用标准分子生物学技术以及本文提供的序列信息来分离或合成本发明的多核苷酸,例如编码乙二醛酶多肽的多核苷酸。

可使用cDNA、mRNA或者作为另一个选择的基因组DNA作为模板以及合适的寡核苷酸引物根据标准PCR扩增技术来扩增本发明的编码乙二醛酶多肽的多核苷酸。可将这样扩增的核酸克隆至合适的载体中,并通过DNA序列分析来进行表征。

酶动力学

酶是蛋白质催化剂,像所有催化剂一样,其加速化学反应速率而不在该过程中耗尽。

它们通过瞬时结合底物并通过这样做来降低将底物转化成产物所需的活化能来实现其作用。

酶发挥作用时的速率受到一些因素的影响,例如,底物分子浓度(以[S]指代,以摩尔浓度的单位表示)、温度、抑制剂(结合至与底物相同位点的竞争性抑制剂,或者结合至酶上的另一个位点从而降低其催化能的非竞争性抑制剂)的存在、pH等。

酶动力学研究和描述酶发挥作用时的速率。存在许多测量方法。在反应开始后的一段短时间内,酶以近似线性的初始速率将底物转化成产物。随着反应继续进行并且底物被消耗,当底物仍然以饱和水平存在时,速率持续减慢。为了测量初始(以及最大)速率,通常在反应仅向总完成进行了几百分比时进行酶测定。初始速率时间的长度取决于测定条件等。

酶动力学的研究之所以重要是因为两个基本原因。首先,其有助于解释酶如何发挥作用,其次,其有助于预测酶在活生物体中的行为。动力学常数Km和Vmax对试图理解酶如何一起发挥作用以控制代谢至关重要。

通过实验将米氏常数Km定义为酶反应速率是Vmax的一半时的浓度。Vmax是酶催化反应时的最大速度:当[S]更高时,酶被底物饱和,并且速率达到酶的最大速率Vmax。

Km是酶与其底物之间的亲和力或结合强度的(大致)反量度。Km值(以mM表示)越低,亲和力越高,因此,需要越低的底物浓度来达到指定速率。

宿主细胞

宿主细胞可为适于生产有用产物的任何宿主细胞。宿主细胞可为任何合适的细胞,例如,诸如细菌的原核细胞,或者真核细胞。通常来说,细胞将为真核细胞,例如酵母或丝状真菌。宿主细胞能够将诸如L-阿拉伯糖或木糖的一种或多种戊糖转化成发酵产物。

宿主细胞可为细菌。在一个实施方案中,对细菌进行遗传改造用于戊糖转化。在一个实施方案中,所述细菌不是大肠杆菌(Escherichia coli,E-coli)。适于本发明应用的宿主细菌的一个例子是遗传改造的运动发酵单胞菌(Zymomonas mobilis)。在例如Yanna等,

本发明的宿主可为(经遗传改造的)酵母。在下文中详细描述了遗传改造。本文中,酵母定义为真核微生物,并且包括主要以单细胞形式生长的真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,Introductory Mycology,John Wiley&Sons,Inc.,NewYork)。

酵母可通过单细胞菌体的出芽来生长,或可通过生物体的分裂来生长。作为经转化的宿主细胞的优选酵母可属于酵母属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)或亚罗酵母属(Yarrowia)。优选地,所述酵母是能够厌氧发酵的酵母,更优选是能够厌氧醇发酵的酵母。

在一个实施方案中,所述宿主细胞是酵母。

优选地,所述宿主是工业宿主,更优选工业酵母。可按下文定义工业宿主和工业酵母细胞。工业方法中的酵母细胞生活环境与实验室中的酵母细胞生活环境显著不同。工业酵母细胞必须能够在该过程期间可能变化的多种环境条件下表现良好。这样的变化包括营养源、pH、乙醇浓度、温度、氧浓度等的变化,这些变化一起潜在影响酿酒酵母的细胞生长和乙醇生产。在不利的工业条件下,环境耐受菌株应当能够进行稳健生长和生产。工业酵母菌株一般对在使用其的应用中可发生的这些环境条件变化更加稳健,所述应用为例如焙烤工业、酿造工业、造酒工业以及乙醇工业。工业酵母(酿酒酵母)的例子有Ethanol

在一个实施方案中,所述宿主是耐受抑制剂的。可通过筛选在包含抑制剂的材料上生长的菌株来选择耐受抑制剂的宿主细胞,如在Kadar等,Appl.Biochem.Biotechnol.(2007),第136-140卷,847-858中所述,其中选择了一个耐受抑制剂的酿酒酵母株ATCC26602。

转化

可在合适的宿主中表达根据本发明的多核苷酸。因此,可使用标准转化技术。

本发明还涉及包含前述多核苷酸的核酸构建体,例如载体。

因此本发明的另一个方面属于载体,包括包含本发明的编码乙二醛酶多肽蛋白或其功能等同物的多核苷酸的克隆载体和表达载体,以及例如在发生本发明的乙二醛酶表达的条件下使这样的载体生长、转化或转染于合适的宿主细胞中的方法。本文所用术语“载体”是指能够转运与其连接的其他核酸的核酸分子。

可将本发明的多核苷酸并入至重组的可复制载体中,例如,并入至克隆载体或表达载体中。所述载体可用于在相容宿主细胞中复制所述核酸。因此,在另一个实施方案中,本发明提供了通过将本发明的多核苷酸引入可复制载体,将所述载体引入相容宿主细胞中并使宿主细胞在使得载体复制的条件下生长从而制备本发明的多核苷酸的方法。可从所述宿主细胞中回收所述载体。下面描述了合适的宿主细胞。

本领域技术人员应领会,表达载体的设计可取决于以下因素:待转化的宿主细胞的选择、期望的蛋白质表达水平等。可将本发明的载体,例如表达载体,引入宿主细胞中从而生产由本文描述的核酸编码的蛋白质或肽。本发明的载体,例如重组表达载体,可设计成在原核细胞或真核细胞中表达乙二醛酶多肽蛋白。

例如,可在细菌细胞如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、丝状真菌、酵母细胞或哺乳动物细胞中表达乙二醛酶多肽。合适的宿主细胞在Goeddel,GeneExpression Technology:Methods in Enzymology 185,Academic出版社,San Diego,CA(1990)中有进一步的描述。下文中描述了合适宿主的代表性例子。

用于上述宿主细胞的合适培养基和条件是本领域已知的。

对于大多数丝状真菌和酵母而言,优选将载体或表达构建体整合至宿主细胞的基因组中以得到稳定的转化子。然而,对于某些酵母而言,可使用合适的附加体型载体,为了稳定和高水平的表达而将表达构建体并入其中,其例子包括分别源自酵母属和克鲁维酵母属的2μ质粒和pKD1质粒的载体,或包含AMA序列的载体(例如来自曲霉(Aspergillus)的AMA1)。在将表达构建体整合至宿主细胞基因组中的情况下,所述构建体整合于基因组中的随机位点,或者通过使用同源重组整合在于预定的靶位点,其中靶位点优选包含高表达的基因。

因此,可用于本发明的表达载体包括染色体型载体、附加体型载体和病毒衍生载体,例如,源自细菌质粒、噬菌体、酵母附加体、酵母染色体元件、诸如杆状病毒、乳多空病毒、牛痘病毒、腺病毒、禽痘病毒、伪狂犬病毒和逆转录病毒等病毒的载体,以及源自其组合的载体,例如源自质粒和噬菌体遗传元件的载体,如黏粒和噬菌粒。

载体还可包含位于产生RNA的多核苷酸侧翼的序列,其包含与真核基因组序列或病毒基因组序列同源的序列。这使得能够将本发明的多核苷酸引入宿主细胞基因组中。

整合性克隆载体可整合至其所整合进的宿主细胞的一个或多个染色体中的随机位点或预定的靶位点。

载体系统可为单一载体,例如单一质粒,或者可为两个或更多个载体,例如两个或更多个质粒,这些质粒一起包含将引入宿主细胞基因组中的总DNA。

所述载体可包含朝向反义方向的本发明的多核苷酸,以提供反义RNA的产生。

可通过常规的转化技术或转染技术将载体DNA引入原核细胞或真核细胞中。本文所用术语“转化”和“转染”旨在指用于将外源核酸(例如DNA)引入宿主细胞的各种本领域公知技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、转导、感染、脂质体转染、阳离子脂质介导的转染或电穿孔。适于转化或转染宿主细胞的方法可在Sambrook等(Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory出版社,Cold Spring Harbor,NY,1989)、Davis等,BasicMethods in Molecular Biology(1986)以及另一些实验室手册中找到。

组成型表达根据本发明的多核苷酸。在本文中,通常相对于宿主细胞的术语“组成型”意为该多核苷酸不是(或者不只是)像其天然存在于宿主中那样存在。从这个意义上讲,其还可解释为通过人为干预将该多核苷酸引入细胞中。组成型表达的基因的特征是,该基因连续转录,与诸如碳源的生长条件或细胞的生长时期无关。所述多核苷酸可与宿主细胞的基因组异源。通常相对于宿主细胞的术语“异源”意为该多核苷酸不天然地存在于宿主细胞的基因组中,或者该细胞不天然产生该多肽。

所述多核苷酸可与宿主细胞的基因组同源。通常相对于宿主细胞的术语“同源”意为该多核苷酸天然地存在于宿主细胞的基因组中,或者该细胞天然产生该多肽。

在另一个实施方案中,本发明提供了细胞,例如,包含本发明所涵盖的核酸的经转化的宿主细胞或重组宿主细胞。“经转化的细胞”或“重组细胞”是通过重组DNA技术向其中(或向其祖先细胞中)引入了根据本发明的核酸的细胞。包括原核细胞和真核细胞二者,例如细菌、真菌、酵母等,尤其优选的是包括例如酵母属在内的酵母细胞,例如酿酒酵母。

可选择以特异、期望的方式调节插入序列的表达或者修饰和加工基因产物的宿主细胞。对蛋白质产物的这样的修饰(例如糖基化)和加工(例如切割)可有助于优化该蛋白质的功能。

多种宿主细胞具有用于对蛋白质和基因产物进行翻译后加工和修饰的特征的并且特异的机制。可选择分子生物学和/或微生物学领域的技术人员熟悉的合适细胞系或宿主系统来确保对所表达的异源蛋白进行期望并且正确的修饰和加工。为此,可使用拥有对原初转录物进行正确加工、对基因产物进行糖基化和磷酸化的细胞机制的真核宿主细胞。这样的宿主细胞是本领域公知的。

如期望,可使用上述细胞来制备根据本发明的多肽。这样的方法通常包括在使编码所述多肽的编码序列得以表达(通过载体)的条件下培养宿主细胞(例如,上述用表达载体转化或转染的宿主细胞),以及任选回收所表达的多肽。可将本发明的多核苷酸并入至重组的可复制载体中,例如,并入至表达载体中。所述载体可用于在相容宿主细胞中复制所述核酸。因此,在另一个实施方案中,本发明提供了通过将本发明的多核苷酸引入可复制载体,将所述载体引入相容宿主细胞中并使宿主细胞在复制载体的条件下生长从而制备本发明的多核苷酸的方法。可从所述宿主细胞中回收所述载体。

可将所述载体转化或转染进上述合适的宿主细胞中,以使本发明的多肽得以表达。该方法可包括在使编码所述多肽的编码序列得以通过载体表达的条件下培养上述用表达载体转化的宿主细胞。

本文中使用了标准的分离、杂交、转化和克隆技术(例如,如在Sambrook,J.,Fritsh,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual.第二版,ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory出版社,Cold SpringHarbor,NY,1989中所述)。

同源性与同一性

当表现出某水平的相似性时,则称多个氨基酸序列或核苷酸序列是同源的。两个同源的序列指示了共同的进化起源。由分别为高或低的“百分比同一性”或“百分比相似度”来指示两个同源序列关系近还是关系较远。虽然尚有争议,但是“百分比同一性”或“百分比相似度”、“同源性水平”或“百分比同源性”经常可互换使用。

可使用数学算法来完成序列比较以及两个序列之间的百分比同一性的确定。本领域技术人员应认识到以下事实,可使用几个不同的计算机程序来比对两个序列,以及确定两个序列之间的同源性(D.Sankoff和J.B.Kruskal,(编),Time warps,string edits andmacromolecules:the theory and practice of sequence comparison中的Kruskal,J.B.(1983)An overview of sequence comparison,第1-44页,Addison Wesley)。可使用用于比对两个序列的Needleman和Wunsch算法来确定两个氨基酸序列之间的百分比同一性。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。该算法比对氨基酸序列以及核苷酸序列。已经在计算机程序NEEDLE中实施了Needleman-Wunsch算法。对于本发明的目的而言,使用来自EMBOSS包的NEEDLE程序(2.8.0或更高版本,EMBOSS:The EuropeanMolecular Biology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,

全局同源性定义

同源性或同一性是两个全序列之间的针对包括任何间隔和延伸在内的总对齐区域的一致匹配百分比。按照以下计算两个经比对序列之间的同源性或同一性:比对中在两个序列中都示出相同氨基酸的对应位置数除以包括间隔的比对总长度。本文定义的同一性可从NEEDLE得到,并且在该程序输出中标记为“IDENTITY”。

最长同一性定义

按照以下计算两个经比对序列之间的同源性或同一性:比对中在两个序列中都示出相同氨基酸的对应位置数除以减去比对中的总间隔数后的比对总长度。本文定义的同一性可从NEEDLE通过使用NOBRIEF选项得到,并且在该程序输出中标记为“longest-IDENTITY”。

表1中给出了根据本发明在细胞中有活性的GLO1氨基酸与本文上面定义的SEQ IDNO:20的同一性的概览。

表1:根据本发明有活性的GLO1氨基酸(参见实施例)以及与酿酒酵母GLO1(SEQ IDNO:20)的同一性的概览。

因此,在一个实施方案中,GLO1核苷酸或氨基酸来源于选自以下的微生物:酿酒酵母、光滑假丝酵母、乳酸克鲁维酵母、鲁氏接合酵母和木兰假丝酵母。

在一个实施方案中,GLO1核苷酸或氨基酸来源于选自以下的微生物:酿酒酵母、光滑假丝酵母、乳酸克鲁维酵母和木兰假丝酵母。

在一个实施方案中,GLO核苷酸是经密码子对优化的核苷酸序列,其中该序列是SED ID NO:34、SED ID NO:35、SED ID NO:36、SED ID NO:37、SED ID NO:38。

在一个实施方案中,GLO核苷酸是经密码子对优化的核苷酸序列,其中该序列是SED ID NO:34、SED ID NO:35、SED ID NO:36或SED ID NO:37。

可交叉组合本文描述的本发明的各种实施方案。本发明涉及如权利要求1所述的细胞。这样的细胞在本文中还称为经转化的宿主细胞。现在描述其实施方案。

所述细胞能够使用L-阿拉伯糖和木糖。在一个实施方案中,所述细胞能够将L-阿拉伯糖转化成L-核酮糖和/或5-磷酸木酮糖,和/或转化成所期望的发酵产物,例如本文中提及的发酵产物中的一种。

可通过引入来自合适的源的araA(L-阿拉伯糖异构酶)基因、araB(L-核酮糖激酶)基因和araD(L-核酮糖-5-P4-差向异构酶)基因来修饰宿主细胞从而产生能够从L-阿拉伯糖产生的乙醇的生物体,例如酿酒酵母菌株。可将这样的基因引入宿主细胞,以使其能够使用阿拉伯糖。WO2003/095627中给出并描述了这样的方法。可使用来自植物乳杆菌(Lactobacillus plantarum)的araA基因、araB基因和araD基因,并且WO2008/041840中描述了这些基因。可使用来自枯草芽孢杆菌(Bacillus subtilis)的araA基因以及来自大肠杆菌的araB基因和araD基因,并且EP1499708公开了这些基因。在另一个实施方案中,如WO2009011591中所公开的,araA基因、araB基因和araD基因可源自棍状杆菌属(Clavibacter)、节杆菌属(Arthrobacter)和/或革兰菌属(Gramella)中的至少一种,特别是密执安棍状杆菌(Clavibacter michiganensis)、金黄节杆菌(Arthrobacteraurescens)和/或凡赛堤革兰菌(Gramella forsetii)中的一种。

在一个实施方案中,所述经转化的宿主细胞还可包含一个或多个拷贝木糖异构酶基因,和/或一个或多个拷贝木糖还原酶和/或木糖醇脱氢酶。

可由本领域技术人员通过任何已知的方法来确定拷贝数。在一个实施方案中,所述经转化的宿主细胞能够发酵葡萄糖、阿拉伯糖、木糖和半乳糖。

在一个实施方案中,所述细胞能够将90%或更高的可用的葡萄糖、木糖阿拉伯糖、半乳糖和甘露糖转化成发酵产物。在一个实施方案中,细胞能够将91%或更高、92%或更高、94%或更高、95%或更高、96%或更高、97%或更高、98%或更高或者100%的所有可用的葡萄糖、木糖阿拉伯糖、半乳糖和甘露糖转化成发酵产物。

在本发明的一个实施方案中,所述经转化的宿主细胞能够发酵一种或多种额外的糖,优选C5糖和/或C6糖,例如甘露糖。在本发明的一个实施方案中,经转化的宿主细胞包含xylA-基因、XYL1基因和XYL2基因和/或XKS1基因中的一个或多个,以使所述经转化的宿主细胞能够发酵木糖;缺失醛糖还原酶(GRE3)基因;过表达PPP-基因TAL1、TKL1、RPE1和RKI1以使得能够升高细胞中通过戊糖磷酸途径的通量。

在一个实施方案中,所述经转化的宿主细胞是工业细胞,更优选是工业酵母(如本文在上文的宿主段落中所定义的)。

在一个实施方案中,所述经转化的宿主细胞是耐受抑制剂的。抑制剂耐受是对抑制性化合物的抵抗力。木质纤维素中抑制性化合物的存在和水平可随原料、预处理方法、水解方法的变化而有大变化。抑制剂种类的例子有羧酸、呋喃和/或酚类化合物。羧酸的例子有乳酸、乙酸或甲酸。呋喃的例子有糠醛和羟基-甲基糠醛。酚类化合物的例子有香草醛、丁香酸、阿魏酸和香豆酸。对于羧酸而言抑制剂的一般量为:每升数克直至每升20克或更高,这根据原料、预处理和水解条件而不同。对于呋喃而言:每升数百毫克直至每升数克,这根据原料、预处理和水解条件而不同。

对于酚类而言:每升数十毫克直至每升1克,这根据原料、预处理和水解条件而不同。

根据本发明的经转化的宿主细胞可为耐受抑制剂的,即,它们可承受在通常的预处理和水解条件下所具有的一般水平的常用抑制剂,以使所述经转化的宿主细胞可广泛应用,即,其具有针对不同原料、不同预处理方法和不同水解条件的高适用性。

在一个实施方案中,基于耐受抑制剂的宿主细胞来构建所述工业经转化的宿主细胞,其中如下文描述来进行所述构建。可通过筛选在包含抑制剂的材料上生长的菌株来选择耐受抑制剂的宿主细胞,如在Kadar等,Appl.Biochem.Biotechnol.(2007),第136-140卷,847-858中所述,其中选择了一个耐受抑制剂的酿酒酵母株ATCC 26602。

在一个实施方案中,所述经转化的宿主细胞是不含标记的。本文所用术语“标记”是指编码使得能够对包含所述标记的宿主细胞进行选择或筛选的特征或表型的基因。不含标记是指经转化的宿主细胞中基本没有标记。当在经转化的宿主细胞的构建中使用了抗生素标记并且随后去除该标记时,不含标记是特别有利的。可使用诸如分子内重组的任何合适的现有技术来去除标记。实施例中示例了去除标记的合适方法。

经转化的宿主细胞可具有将植物生物质、纤维素、半纤维素、果胶、淀粉、淀粉衍生物转化成例如可发酵糖的能力。因此,经转化的宿主细胞可表达一种或多种酶,例如,纤维素酶(纤维素内切酶或纤维素外切酶)、将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所必需的半纤维素酶(木聚糖内切酶或外切酶,或者阿拉伯糖内切酶或外切酶)、能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶,或者将淀粉转化成葡萄糖单体的淀粉酶。

所述经转化的宿主细胞还可包含将糖转化成期望发酵产物所需的那些酶活性,所述期望发酵产物为例如乙醇、丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、柠檬酸、富马酸、苹果酸、衣康酸、氨基酸、1,3-丙烷-二醇、乙烯、甘油、β-内酰胺抗生素或者头孢菌素。

在一个实施方案中,所述经转化的宿主细胞是能够天然进行醇发酵,优选进行厌氧醇发酵的细胞。经转化的宿主细胞优选具有对乙醇的高耐受、对低pH的高耐受(即,能够在低于约5、约4、约3或约2.5的pH下生长),以及对有机物的高耐受和/或对升高的温度的高耐受。

经转化宿主细胞的任何以上性质或活性可天然地存在于该细胞中,或者可通过遗传修饰来引入或改造。

根据一个实施方案,可通过将以下的一个或多个引入宿主细胞来将基因引入细胞:

a)处于一个或多个强组成型启动子控制下的基因araA、araB和araD;

b)任选处于一个或多个强组成型启动子控制下的PPP-基因TAL1、TKL1、RPE1和RKI1。

c)缺失醛糖还原酶基因;

d)处于一个或多个强组成型启动子控制下的xylA基因和XKS1基因;

e)处于强组成型启动子控制下的xylA基因,其能够在多个位点整合至基因组中;

以及适应性进化以产生所述经转化宿主细胞。可使用重组表达技术来构建上述细胞。

所述经转化的宿主细胞是重组细胞。也就是说,经转化的宿主细胞包含没有天然存在于所述细胞中的核苷酸序列,或者用所述核苷酸序列对其进行了转化或遗传修饰。

用于细胞中酶的重组表达以及对经转化宿主细胞进行其他遗传修饰的技术是本领域技术人员公知的。通常来说,这样的技术涉及用包含相关序列的核酸构建体来转化细胞。例如,从标准手册中知晓这样的方法,例如Sambrook和Russel(2001)"MolecularCloning:A Laboratory Manual(第3版),Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory出版社,或者F.Ausubel等编,"Current protocols in molecularbiology",Green Publishing and Wiley Interscience,New York(1987)。从例如EP-A-0635 574、WO 98/46772、WO 99/60102、WO 00/37671、WO90/14423、EP-A-0481008、EP-A-0635574和US 6,265,186知晓用于转化和遗传修饰宿主细胞的方法。

通常来说,核酸构建体可为质粒,例如低拷贝质粒或高拷贝质粒。根据本发明的细胞可例如通过多拷贝的核苷酸构建体或通过使用具有多拷贝酶序列的构建体来包含单一拷贝或多拷贝的编码酶的核苷酸序列。

可以以附加体的形式来维持所述核酸构建体,因此,所述构建体包含用于自主复制的序列,例如常染色体复制序列。合适的附加体型核酸构建体可例如基于酵母2μ或者pKD1质粒(Gleer等,1991,Biotechnology 9:968-975),或AMA质粒(Fierro等,1995,CurrGenet.29:482-489)。作为另一个选择,可将每个核酸构建体以一个或多个拷贝整合至细胞的基因组中。可通过非同源重组来随机进行向细胞基因组中的整合,但是优选地,可通过如本领域公知的同源重组将核酸构建体整合至细胞的基因组中(参见例如,WO90/14423、EP-A-0481008、EP-A-0635和US 6,265,186)。

在酵母中,大多数附加体或2μ质粒是相对不稳定的,每次传代后在约10

术语“有效连接(operably linked)”是指这样的并置,其中所描述的组件处于使它们能够以它们的预期方式发挥功能的关系中。例如,使启动子或增强子有效连接至编码序列,其中所述启动子或增强子影响该编码序列的转录。

本文所用术语“启动子”是指这样的核酸片段,其功能为控制一个或多个基因的转录、相对于基因转录起始位点的转录方向位于上游,并且通过DNA依赖的RNA聚合酶的结合位点、转录起始位点以及本领域技术人员已知的任何其他DNA序列的存在来在结构上限定。“组成型”启动子是在大多数环境和发育条件下有活性的启动子。“可诱导”启动子是在环境或发育调控下有活性的启动子。

可用于实现编码根据本发明的酶的核苷酸序列的表达的启动子可以对编码待表达的酶的核苷酸序列而言不是天然的,即,与跟其有效连接的核苷酸序列(编码序列)异源的启动子。但是,启动子可与宿主细胞同源,即,是内源的。

启动子是广泛可得的,并且是本领域技术人员已知的。这样的启动子的合适例子包括例如,来自糖解基因的启动子,例如来自酵母或丝状真菌的磷酸果糖激酶(PFK)启动子、磷酸丙糖异构酶(TPI)启动子、甘油醛-3-磷酸脱氢酶(GPD、TDH3或者GAPDH)启动子、丙酮酸激酶(PYK)启动子、磷酸甘油酸激酶(PGK)启动子;关于来自酵母的这样的启动子的细节可在(WO 93/03159)中找到。另一些可用的启动子为编码核糖体蛋白质的基因启动子、乳糖酶基因启动子(LAC4)、醇脱氢酶启动子(ADH1、ADH4等),以及烯醇酶启动子(ENO)。对本领域技术人员而言,其他启动子(无论是组成型还是可诱导型)以及增强子或上游活化序列都将是已知的。如期望,可改造用于本发明宿主细胞的启动子,以影响它们的控制特征。在该上下文中,合适的启动子包括本领域技术人员公知的组成型和可诱导型的天然启动子二者以及经改造启动子。真核宿主细胞中的合适启动子可为GAL7、GAL10或GAL1,CYC1、HIS3、ADH1、PGL、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO1、TPI1和AOX1。其他合适的启动子包括PDC1、GPD1、PGK1、TEF1和TDH3。

在经转化的宿主细胞中,优选使编码酶的核苷酸序列的3'端有效连接至转录终止子序列。优选地,所述终止子序列在所选宿主细胞如所选酵母物种中是可操作的。在任何情况下,终止子的选择都不是至关重要的;其可例如来自任何酵母基因,但是如果其来自非酵母真核的基因,则终止子有时可起作用。通常来说,编码酶的核苷酸序列包含终止子。优选地,使这样的终止子与防止经转化宿主细胞中的无义介导的mRNA衰变的突变相组合(参见例如Shirley等,2002,Genetics 161:1465-1482)。

所述转录终止序列还优选包含多腺苷酸化信号。

任选地,适用于本发明的核酸构建体中可存在可选择标记。本文所用术语“标记”是指编码使得能够对包含所述标记的宿主细胞进行选择或筛选的特征或表型的基因。标记基因可为可使用合适抗生素来从未经转化的细胞中选择经转化的细胞的抗生素抗性基因。合适的抗生素抗性标记的例子包括例如二氢叶酸还原酶、潮霉素-B-磷酸转移酶、3'-O-磷酸转移酶II(卡那霉素抗性、新霉素抗性和G418抗性)。对于多倍体宿主细胞的转化而言,抗生素抗性标记可为最方便的。还可使用非抗生素抗性标记,例如营养缺陷标记(URA3、TRP1、LEU2)或粟酒酵母(S.pombe)TPI基因(由Russell P R,1985,Gene 40:125-130描述)。在一个优选实施方案中,用核酸构建体转化的宿主细胞不含标记基因。EP-A-0635 574中公开了用于构建重组的不含标记基因的微生物宿主细胞的方法,并且所述方法基于使用双向标记,例如构巢曲霉(A.nidulans)amdS(乙酰胺酶)基因或酵母URA3基因和LYS2基因。作为另一个选择,可将诸如绿色荧光蛋白、lacL、萤光素酶、氯霉素乙酰转移酶、β-葡糖醛酸酶的可筛选标记并入本发明的核酸构建体中,以使得能够筛选经转化的细胞。

适用于本发明的核酸构建体中可存在的任选的另一些元件包括但不限于:一个或多个前导序列、增强子、整合因子和/或报告基因,内含子序列、着丝粒、端粒和/或基质附着(MAR)序列。本发明的核酸构建还可包含用于自主复制的序列,例如ARS序列。

因此可用已知的重组技术进行所述重组方法。本领域技术人员已知用于在经转化的宿主细胞中表达和过表达酶的多种方法。特别地,可通过提高宿主细胞中编码酶的基因的拷贝数来过表达酶,例如,通过将额外的基因拷贝整合至宿主细胞的基因组中,通过表达来自附加体型多拷贝表达载体的基因,或者通过引入包含多个基因拷贝的附加体型表达载体。

作为另一个选择,可通过使用对编码待过表达的酶的序列非天然的启动子,即,与跟其有效连接的编码序列异源的启动子,来实现在本发明的宿主细胞中过表达酶。虽然所述启动子优选与跟其有效连接的编码性序列异源,但是,还优选的是,启动子与宿主细胞同源,即,是宿主细胞内源的。优选地,异源启动子能够比编码性序列的天然启动子产生更高稳定状态水平的包含编码性序列的转录物(或者能够在每单位时间内产生更多转录物分子,即,mRNA分子)。该上下文中的合适启动子包括组成型和可诱导的天然启动子二者,以及经改造的启动子。

在一个实施方案中,经转化的宿主细胞是不含标记的,这意味着,基因组中或染色体外都不存在营养缺陷标记或显性标记,特别是抗生素抗性标记。

用于过表达上述酶的编码序列可优选与宿主细胞同源。但是,可使用与宿主异源的编码序列。

当涉及在经遗传修饰的细胞中生产酶时,酶的过表达意为,与相同条件下的未经修饰的宿主细胞相比,以更高水平的比酶活来产生该酶。通常来说,这意味着,与相同条件下的未经修饰的宿主细胞相比,产生了更大量的或处于更高稳定状态水平下的酶促活性蛋白质(或在多亚基酶的情况下,产生多种蛋白质)。类似地,这通常意味着,与相同条件下的未经修饰的宿主细胞相比,产生了更大量的或处于更高稳定状态水平下的编码酶促活性蛋白质的mRNA。优选地,在宿主中,与除了引起过表达的遗传修饰之外遗传上相同的菌株相比,以至少约1.1、约1.2、约1.5、约2、约5、约10或约20的系数来过表达待过表达的酶。应理解,这些过表达水平可适用于稳定状态水平的酶活性、稳定状态水平的酶蛋白,以及稳定状态水平的编码酶的转录物。

优选地,将乙二醛酶表达于细胞溶胶(cytosol)中。

适应是种群变得更适于(适应)其一个或多个生境的进化过程。该过程的发生跨越几个至许多世代,并且是一种基本的生物学现象。

术语适应还可指对生物体的生存尤其重要的特征。这样的适应通过自然选择,通过更成功繁殖的更适应形式在可变种群中产生。

环境条件的变化改变了自然选择的结果,影响改进生物体在新条件下的适合度的后续适应的选择性益处。在极端的环境变化的情况下,有益适应的出现和固定可为存活所必不可少的。大量不同的因素可驱动适应性进化,例如营养可得性、温度、氧可得性等等。

适应度(adaptedness)(生物体能够在指定的生境中生存和繁殖的程度)和适合度之间存在明确的关系。适合度是对自然选择速率的评估和预测因子。通过施加自然选择,如果可遗传的,则替选表型的相对频率会随着时间而变化。

当自然选择作用于群体的遗传变异性上时,遗传变化是潜在机制。通过这种方式,种群在遗传上来适应其环境。遗传性变化可导致可见的结构,或可以以适于经改变的生境的方式来调节生物体的生理学活性。

生境可频繁地发生变化。因此,随之而来的是适应过程从未最终进行完全。有时,环境可逐渐地发生变化,并且物种变得越来越适应其环境。另一方面,环境中的变化可发生相对快,则物种变得越来越不良好地适应。适应是遗传过程,从某种程度上来说,其无时无刻不在发生,即便当种群没有改变生境或环境时亦如此。

经转化的宿主细胞可在它们的制备过程中经受适应性进化。可通过选择自发的或经诱导的(例如,通过辐射或化学物质)突变体使经转化的宿主细胞适应糖利用,以依靠期望的糖生长,优选将所述糖作为唯一碳源,并且更优选在厌氧条件下进行。可通过以下的技术来进行突变体的选择,包括如Kuyper等描述的(2004,FEMS Yeast Res.4:655-664)连续转移培养物,或者通过在恒化培养的选择压力下培养。例如,在一种优选的宿主细胞中,至少一种上述遗传修饰(包括通过突变体选择获得的修饰)赋予宿主细胞在木糖作为碳源、优选地作为唯一碳源时、并且优选地在厌氧条件下生长的能力。当XI用作基因来转化木糖时,优选地,细胞基本上不生产木糖醇,例如生产的木糖醇低于检出界限,或者例如以摩尔为基础少于消耗的碳的约5%、约2%、约1%、约0.5%或约0.3%。

适应性进化还描述于例如Wisselink H.W.等,Applied and EnvironmentalMicrobiology,2007年8月,4881–4891页中。

在适应性进化的一种实施方式中,使用由不同培养基(葡萄糖、木糖和阿拉伯糖;木糖和阿拉伯糖)中重复的连续生长循环与重复的分批培养所构成的方案。见Wisselink等(2009)Applied and Environmental Microbiology,Feb.2009,907–914页。

遗传改造(即用重组DNA转化酵母细胞)在1978年首次可行[Beggs,1978;Hinnen等,1978]。从那时起,建立了酵母中的重组DNA技术。可以获得多种不同的载体构建体。通常,这些被称作穿梭载体的质粒载体含有由复制起点和选择性标记物(通常是β-内酰胺酶基因,ampR)构成的、源自E.coli载体的遗传材料,这使得它们在被转化进酵母细胞中之前能够在E.coli中繁殖。另外,穿梭载体含有用于在酵母中选择的选择性标记物。标记物可以是下述基因,所述基因编码用于合成具体氨基酸或核苷酸的酶,使得带有相应基因组缺失(或突变)的细胞针对营养缺陷或自养而被回补(complemented)。或者,这些载体含有异源显性抗性标记物,它们对重组的酵母细胞(即吸收了DNA并且表达标记物基因的细胞)赋予针对某些抗生素如g418(遗传霉素)、潮霉素B或腐草霉素的抗性。另外,这些载体可含有(组合的)限制性位点序列(多克隆位点或MCS),这些序列会允许将外源DNA克隆进这些位点内,尽管同时存在替代性的方法。

传统上,可以通过额外的遗传元件的不存在或存在区别四种类型的穿梭载体:

·整合性质粒(YIp),当宿主基因组中标记物或另一基因的基因座通过限制性消化被打开并使用经线性化的DNA转化酵母细胞时,所述整合性质粒通过同源重组被整合进宿主基因组中标记物或另一基因的基因座处。

·附加体型质粒(Yep),其带有在酵母细胞中自主复制所需的2μ质粒DNA序列部分。多拷贝的被转化的质粒在酵母细胞中繁殖,并作为附加体保持。

·自主复制质粒(YRp),其带有允许被转化的质粒被繁殖数百倍的酵母复制起点(ARS,自主复制序列)。

·CEN质粒(YCp),其除了ARS序列外还带有中心粒序列(源自核染色体之一),所述中心粒序列通常保证稳定的有丝分裂分离,并且通常将自我复制的质粒的拷贝数减少至仅有一个。

这些质粒通过转化被引入酵母细胞中。酵母细胞的转化可以通过若干不同的技术实现,例如用醋酸锂(Ito等,1983)和电穿孔方法使细胞通透化。

在重组微生物的商业应用中,质粒不稳定性是最重要的问题。不稳定性是经转化的细胞由于质粒的改变或丢失而失去它们被改造的特性的趋势。这一问题由Zhang等(Plasmid stability in recombinant Saccharomyces cerevisiae.BiotechnologyAdvances,Vol.14,No.4,401-435页,1996)详细讨论。用整合型质粒转化的菌株是极度稳定的,即使在缺失选择性压力时也是如此(Sherman,F.http://dbb.urmc.rochester.edu/labs/sherman_f/yeast/9.html及其中的参考文献)。

异源DNA通常以染色体外质粒(Yep、YCp和YRp)的形式被引入生物中。不幸的是,已经发现用细菌和酵母新的特征可能不被保持,特别是不持续应用选择压力时。这归因于重组细胞长时间生长时杂种质粒的分离不稳定性(segregational instability)。这导致种群异质性和克隆变异性,并最终得到下述细胞种群,其中大部分细胞丢失了通过转化被引入的特性。如果使用具有营养缺陷型标记物的载体,则在丰富培养基中的培养通常导致载体的迅速丢失,因为载体仅在最小培养基中被保持。或者,显性抗生素抗性标记物的使用通常不与生产方法相容。从注册的观点来看(痕量抗生素存在于终产物中的可能性)或处于经济原因(以工业规模使用抗生素的成本),抗生素的使用可能不是期望的。

载体的丢失在大规模生产的情况下导致多种问题。对酵母而言,存在用于引入DNA的替代性方法,例如使用整合性质粒(YIp)。DNA通过重组被整合进宿主基因组中,导致高稳定性。(Caunt,P.Stability of recombinant质粒s in yeast.Journal of Biotechnology9(1988)173–192)。我们发现,使用宿主转座子的整合方法是一种好的选择。在一个实施方案中,可将基因整合至经转化的宿主细胞基因组中。以本领域已知的任何方法来进行多拷贝的初始引入(即,在适应性进化前),从而导致基因的引入。在一个实施方案中,可通过使用其部分与宿主细胞的重复序列(转座子)同源的载体来实现。当宿主细胞是酵母细胞时,合适的重复序列是Ty元件的长末端重复(LTR),称为δ序列。Ty元件分为两个十分相似的亚家族,称为Ty1和Ty2。这些元件为约6千碱基(kb)长,并且被长末端重复(LTR)结合,约335碱基对的序列(Boeke JD等,The Saccharomyces cerevisiae Genome Contains Functionaland Nonfunctional Copies of Transposon Ty1.Molecular and Cellular Biology,1988年4月,第1432-1442页,第8卷,第4期)。在经完全测序的酿酒酵母菌株S288c中,最丰富的转座子是Ty1(31拷贝)和Ty2(13拷贝)(Gabriel A,Dapprich J,Kunkel M,Gresham D,Pratt SC等,(2006)Global mapping of transposon location.PLoS Genet 2(12):e212.doi:10.1371/journal.pgen.0020212)。这些转座子由两个重叠的开放阅读框(ORF)组成,每个编码若干个蛋白质。编码区侧翼是上述几乎相同的LTR。酿酒酵母的另一些丰度更低并且更不同的Ty元件包括Ty3、Ty4和Ty5。对于每个全长Ty元件的家族,存在分散遍及基因组中的多出一个量级的单LTR元件。这些被认为是通过全长元件的LTR–LTR重组并且环出内部蛋白编码区而产生。

已经利用Ty反转录转座子的反转录转座机制来将多拷贝整合至遍及基因组中(Boeke等,1988;Jacobs等,1988)。Ty元件的长末端重复(LTR)被称为δ序列,其还是用于经同源重组整合的良好标靶,因为它们以约150至200个拷贝存在于Ty相关的位点处或单位点处(Boeke,1989;Kingsman和Kingsman,1988)。(Parekh R.N.(1996).An IntegratingVector for Tunable,High Copy,Stable Integration into the Dispersed Ty DELTASites of Saccharomyces cerevisiae.Biotechnol.Prog.1996,12,16-21)。经适应性进化,拷贝数可发生变化。

经转化的宿主细胞能够使用阿拉伯糖。因此,经转化的宿主细胞能够将L-阿拉伯糖转化成L-核酮糖和/或5-磷酸木酮糖,和/或转化成期望的发酵产物,例如本文中提及的发酵产物中的一种。

可通过引入来自合适的源的araA(L-阿拉伯糖异构酶)基因、araB(L-核酮糖激酶)基因和araD(L-核酮糖-5-P4-差向异构酶)基因来修饰细胞从而产生能够从L-阿拉伯糖产生的乙醇的生物体,例如酿酒酵母菌株。可将这样的基因引入经转化的宿主细胞,以使其能够使用阿拉伯糖。WO2003/095627中给出并描述了这样的方法。可使用来自植物乳杆菌的araA基因、araB基因和araD基因,并且WO2008/041840中描述了这些。可使用来自枯草芽孢杆菌的araA基因以及来自大肠杆菌的araB基因和araD基因,并且EP1499708公开了这些。在另一个实施方案中,如WO 2009011591中所公开的,araA基因、araB基因和araD基因可源自棍状杆菌属、节杆菌属和/或革兰菌属中的至少一种,特别是密执安棍状杆菌、金黄节杆菌和/或凡赛堤革兰菌中的一种。

经转化宿主细胞可包含一种或多种提高戊糖磷酸通路(PPP)通量的遗传修饰。具体地,遗传修饰可导致通过戊糖磷酸通路的非氧化性部分的通量提高。引起戊糖磷酸通路非氧化性部分通量提高的遗传修饰在本文中被理解为表示下述修饰,与除了引起通量提高的遗传修饰之外遗传上相同的菌株中的通量相比,所述修饰将所述通量提高至约1.1、约1.2、约1.5、约2、约5、约10或约20的倍数。戊糖磷酸通路非氧化部分的通量可以如下测量:在木糖作为唯一碳源时培养经修饰的宿主,测定木糖消耗的比速率,并在产生任何木糖醇时从木糖消耗的比速率中减去木糖醇生产的比速率。然而,戊糖磷酸通路非氧化部分的通量与木糖作为唯一碳源时的生长速率成比例,优选地与木糖作为唯一碳源时的厌氧生长速率成比例。木糖作为唯一碳源时的生长速率(μ

Q

或者

1/y

因此,如果μ是恒定的,戊糖磷酸通路非氧化部分通量的提高可演绎自这些条件下最大生产速率的提高,除非转运(摄取受到限制)。

可以通过多种方式在宿主细胞中引入提高戊糖磷酸通路通量的一种或多种遗传修饰。这些方式包括例如,实现木酮糖激酶和/或非还原性部分戊糖磷酸通路的一种或多种酶更高的稳态活性水平,和/或非特异性醛糖还原酶活性的降低的稳态水平。稳态活性水平的这些改变可以通过(自发或化学或辐射诱导的)突变体的选择和/或编码酶的基因或调节这些基因的因子的重组DNA技术(例如过表达或失活)来实现。

在一种优选的宿主细胞中,遗传修饰包括(非氧化部分)戊糖磷酸通路的至少一种酶的过表达。优选地,所述酶选自由编码核酮糖-5-磷酸异构酶、核酮糖-5-磷酸差向异构酶、转酮酶和转醛酶的酶构成的组。可以过表达(非氧化性部分)戊糖磷酸通路的酶的多种组合。例如可以被过表达的酶可以至少是酶5-磷酸核酮糖异构酶和5-磷酸核酮糖差向异构酶;或至少是酶5-磷酸核酮糖异构酶和转酮酶;或至少是酶5-磷酸核酮糖异构酶和转醛酶;或至少是酶5-磷酸核酮糖差向异构酶和转酮酶;或至少是酶核酮糖-5-磷酸差向异构酶和转醛酶;或至少是酶转酮酶和转醛酶;或至少是酶5-磷酸核酮糖差向异构酶、转酮酶和转醛酶;或至少是酶5-磷酸核酮糖异构酶、转酮酶和转醛酶;或至少是酶5-磷酸核酮糖异构酶、5-磷酸核酮糖差向异构酶和转醛酶;或至少是酶5-磷酸核酮糖异构酶、5-磷酸核酮糖差向异构酶和转酮酶。在本发明的一种实施方式中,酶5-磷酸核酮糖异构酶、5-磷酸核酮糖差向异构酶、转酮酶和转醛酶的每一种都在宿主细胞中被过表达。更优选的是下述宿主细胞,其中遗传修饰至少包含酶转酮酶和转醛酶二者的过表达,因为这样的宿主细胞已经能够在木糖上厌氧生长。实际上,在一些条件下,仅过表达转酮酶和转醛酶的木糖转化宿主细胞在木糖上已经具有与下述宿主细胞相同的厌氧生长速率,所述宿主细胞过表达所有四种酶,即5-磷酸核酮糖异构酶、5-磷酸核酮糖差向异构酶、转酮酶和转醛酶。另外,过表达酶5-磷酸核酮糖异构酶和核酮糖-5-磷酸差向异构酶二者的宿主细胞是超过下述宿主细胞而被优选的,所述宿主细胞仅过表达异构酶或仅过表达差向异构酶,因为这些酶中仅一种的过表达可产生代谢失衡。

酶“核酮糖-5-磷酸差向异构酶”(EC 5.1.3.1)在本文中被定义为催化D-木酮糖5-磷酸差向异构化为D-核酮糖5-磷酸并且反之亦然的酶。所述酶也已知为磷酸核酮糖(phosphoribulose)异构酶;赤藓糖-4-磷酸异构酶;磷酸酮戊糖3-差向异构酶;木酮糖磷酸3-差向异构酶;磷酸酮戊糖向异构酶;核酮糖5-磷酸3-差向异构酶;D-核酮糖磷酸-3-差向异构酶;D-核酮糖5-磷酸差向异构酶;D-核酮糖-5-P 3-差向异构酶;D-木酮糖-5-磷酸3-差向异构酶;戊糖-5-磷酸3-差向异构酶;或D-核酮糖-5-磷酸3-差向异构酶。核酮糖5-磷酸差向异构酶还可通过其氨基酸序列定义。类似地,核酮糖5-磷酸差向异构酶可以通过编码酶的核苷酸序列或者通过与编码核酮糖5-磷酸差向异构酶的参照核苷酸序列杂交的核苷酸序列来定义。编码核酮糖5-磷酸差向异构酶的核苷酸序列在本文中称作RPE1。

酶“核酮糖5-磷酸异构酶”(EC 5.3.1.6)在本文中被定义为催化D-核糖5-磷酸直接异构化为D-核酮糖5-磷酸并且反之亦然的酶。所述酶也已知为磷酸戊糖异构酶;磷酸核糖异构酶;核糖磷酸异构酶;5-磷酸核糖异构酶;D-核糖5-磷酸异构酶;D-核糖-5-磷酸酮醇-异构酶;或D-核糖-5-磷酸醛糖-酮糖-异构酶。核酮糖5-磷酸异构酶还可通过其氨基酸序列定义。类似地,核酮糖5-磷酸异构酶可以通过编码所述酶的核苷酸序列以及与编码核酮糖5-磷酸异构酶的参照核苷酸序列杂交的核苷酸序列来定义。编码核酮糖5-磷酸异构酶的核苷酸序列在本文中称作RKI1。

酶“转酮酶”(EC 2.2.1.1)在本文中被定义为催化下述反应的酶:D-核糖5-磷酸+D-木酮糖5-磷酸<->景天庚酮糖7-磷酸+D-甘油醛3-磷酸且反之亦然。所述酶也已知为羟乙醛转移酶或景天庚酮糖-7-磷酸:D-甘油醛-3-磷酸羟乙醛转移酶。转酮酶还可通过其氨基酸定义。类似地,转酮酶可以通过编码酶的核苷酸序列以及与编码转酮酶的参照核苷酸序列杂交的核苷酸序列来定义。编码转酮酶的核苷酸序列在本文中称作TKL1。

酶“转醛酶”(EC 2.2.1.2)在本文中被定义为催化下述反应的酶:景天庚酮糖7-磷酸+D-甘油醛3-磷酸<->D-赤藓糖4-磷酸+D-岩藻糖6-磷酸且反之亦然。所述酶还已知为二羟基丙酮转移酶;二羟基丙酮合酶;甲醛转酮酶;或景天庚酮糖-7-磷酸:D-甘油醛-3-磷酸甘油酮转移酶。转醛酶还可通过其氨基酸序列定义。类似地,转醛酶可以通过编码酶的核苷酸序列以及与编码转醛酶的参照核苷酸序列杂交的核苷酸序列来定义。编码转醛酶的核苷酸序列在本文中称作TAL1。

根据本发明,将一个或多个拷贝的一种或多种木糖异构酶基因和/或一种或多种木糖还原酶和木糖醇脱氢酶引入宿主细胞的基因组中。这些遗传元件的存在赋予细胞通过异构化或还原来转化木糖的能力。

在一个实施方案中,将一个或多个拷贝的一种或多种木糖异构酶基因引入宿主细胞的基因组中。

在本文中,“木糖异构酶”(EC 5.3.1.5)定义为催化D-木糖直接异构化成D-木酮糖和/或其逆反应的酶。该酶还称为D-木糖酮异构酶。在本文中,木糖异构酶还可能够催化D-葡萄糖和D-果糖之间的转化(因此可称为葡萄糖异构酶)。在本文中,木糖异构酶可需要诸如镁、锰或钴的二价阳离子作为辅因子。

因此,这样的经转化宿主细胞能够将木糖异构化木酮糖。通过用包含编码所定义的木糖异构酶的核苷酸序列的核酸构建体转化宿主细胞来赋予宿主细胞将木糖异构化成木酮糖的能力。经转化的宿主细胞通过直接将木糖异构化成木酮糖来将木糖异构化成木酮糖。

木糖异构酶基因可具有多种起源,例如,WO2006/009434中公开的单鞭毛菌(Piromyces)属。其他合适的起源有拟杆菌(Bacteroides),特别是如PCT/EP2009/52623中描述的单形拟杆菌(Bacteroides uniformis)。在另一个实施方案中,将一个或多个拷贝的一种或多种木糖还原酶基因和木糖醇脱氢酶基因引入宿主细胞的基因组。在该实施方案中,以分别由木糖还原酶和木糖醇脱氢酶经木糖醇中间体催化木糖向木酮糖的两步骤转化来进行木糖的转化。在其一个实施方案中,如在WO 2004085627中公开的,可过表达木糖还原酶(XR)、木糖醇脱氢酶(XDH)和木酮糖激酶(XK),并且任选上调编码产生NADPH的酶的一种或多种基因,以及上调编码消耗NADH的酶的一种或多种基因。

经转化的宿主细胞可包含提高木酮糖激酶比活性的一种或多种遗传修饰。优选地,一种或多种遗传修饰导致木酮糖激酶的过表达,例如通过过表达编码木酮糖激酶的核苷酸序列。编码木酮糖激酶的基因可为宿主细胞的内源的,或者可为宿主细胞异源的木酮糖激酶。用于在宿主细胞中过表达木酮糖激酶的核苷酸序列是编码具有木酮糖激酶活性的多肽的核苷酸序列。

在本文中,“木酮糖激酶”(EC 2.7.1.17)定义为催化以下反应的酶:ATP+D-木酮糖=ADP+D-木酮糖5-磷酸。该酶还称为具有磷酸化木酮糖激酶、D-木酮糖激酶或ATP:D-木酮糖5-磷酸转移酶。可根据其氨基酸序列来进一步定义用于本发明的木酮糖激酶。同样地,可根据编码该酶的核苷酸序列以及通过与编码木酮糖激酶的参考核苷酸序列杂交的核苷酸序列来定义木酮糖激酶。

在经转化的宿主细胞中,可使升高木酮糖激酶比活性的一种或多种遗传修饰与上文描述的提高戊糖磷酸途径通量的任何修饰相组合。但是,这并非必需的。

在本发明的宿主细胞中,与除了引起过表达的一个或多个遗传修饰之外的遗传上相同的菌株相比,以至少约1.1、约1.2、约1.5、约2、约5、约10或约20的系数来过表达待过表达的木酮糖激酶。应理解,这些过表达水平可适用于酶活性的稳定状态水平、酶蛋白的稳定状态水平,以及编码酶的转录物的稳定状态水平。

在该实施方案中,使用XI作为转化木糖的基因,降低醛糖还原酶活性可为有利的。因此,经转化的宿主细胞可包含降低宿主细胞中醛糖还原酶活性的一种或多种遗传修饰。优选地,通过降低编码非特异性醛糖还原酶的基因的表达或使其失活的一种或多种遗传修饰来降低宿主细胞中的非特异性醛糖还原酶活性。优选地,在一个GRE3醛糖还原酶缺失(本文称为GRE3缺失)的实施方案中,一个或多个遗传修饰降低或失活宿主细胞中编码醛糖还原酶的基因的每个内源拷贝的表达。经转化的宿主细胞可通过二倍体、多倍体或非整倍体而包含多拷贝的编码非特异性醛糖还原酶的基因,和/或所述宿主细胞可包含具有醛糖还原酶活性的氨基酸序列不同并且各由不同基因编码的几种不同(异)酶。在这样的情况下还优选地的是,降低或失活编码非特异性醛糖还原酶的各基因的表达。优选地,通过缺失基因的至少部分或通过破坏基因,来使该基因失活,其中,在该上下文中,术语基因还包括编码序列的上游或下游的任何非编码序列,(部分)缺失或失活导致宿主细胞中非特异性醛糖还原酶活性的表达降低。

编码要在宿主细胞中降低其活性的醛糖还原酶的核苷酸序列是编码具有醛糖还原酶活性的多肽的核苷酸序列。

因此,仅包含下述一种或多种遗传修饰的宿主细胞明确地包括在本发明中,所述修饰降低宿主细胞中的非特异性醛糖还原酶活性。

酶“醛糖还原酶”(EC 1.1.1.21)在本文中被定义为能够将木糖或木酮糖还原为木糖醇的任何酶。在本发明的语境中,醛糖还原酶可以是对本发明宿主细胞而言天然(内源)的并且能够将木糖或木酮糖还原为木糖醇的任何非特异性醛糖还原酶。非特异性醛糖还原酶催化反应:

所述酶具有广泛特异性并且也已知为醛糖还原酶;多元醇脱氢酶(NADP

这类非特异性醛糖还原酶的一个具体的例子是对酿酒酵母内源并且由GRE3基因编码的醛糖还原酶(Traff等,2001,Appl.Environ.Microbiol.67:5668-74)。因此,本发明的醛糖还原酶还可通过其氨基酸序列定义。类似地,醛糖还原酶可以通过编码酶的核苷酸序列以及与编码醛糖还原酶的参照核苷酸序列杂交的核苷酸序列来定义。

多年以来,已经有建议引入多种生物体用于从作物糖生产生物乙醇。然而,实际上,所有主要的生物乙醇生产过程都继续使用酵母属的酵母作物乙醇生产者。这是由于酵母属物种用于工业方法中的许多有吸引力的特征导致的,即,对高酸、乙醇和渗透压的耐受、厌氧生长的能力,当然还有其高醇发酵能力。作为宿主细胞的优选酵母物种包括酿酒酵母、博伊丁酵母(S.bulderi)、S.barnetti、少孢酵母(S.exiguus)、葡萄汁酵母(S.uvarum)、糖化酵母(S.diastaticus)、乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)或脆弱克鲁维酵母(K.fragilis)

经转化的宿主细胞可为适于生产乙醇的细胞。但是,经转化的宿主细胞可适于生产除乙醇以外的发酵产物。

这样的非乙醇发酵产物原则上包括可通过诸如酵母或丝状真菌的真核微生物生产的任何粗制(bulk)或精细化学物质。

可用于生产非乙醇发酵产物的经转化的宿主细胞是包含遗传修饰从而导致醇脱氢酶活性降低的宿主细胞。

在一个实施方案中,经转化的宿主细胞可用于将来源于木质纤维素的糖转化成乙醇的方法中。

木质纤维素可被视为潜在的可再生原料,其一般包括多糖纤维素(葡聚糖)和半纤维素(木聚糖、异木聚糖和木葡聚糖)。此外,一些半纤维素可例如在木衍生的原料中作为葡甘露聚糖存在。这些多糖向可溶糖的酶促水解在不同的酶一起作用下发生,所述可溶糖包括单体或多聚体二者,例如葡萄糖、纤维二糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、半乳糖醛酸、葡萄糖醛酸,以及另一些己糖和戊糖。

此外,果胶和诸如阿拉伯聚糖的其他果胶质可构成来自非木质植物组织的通常细胞壁的干质量的相当比例(干质量的约四分之一至一半可以是果胶)。

在酶处理前,可预处理该木质纤维素材料。所述预处理可包括将木质纤维素材料暴露于酸、碱、溶剂、热、过氧化物、臭氧、机械切碎、研磨、铣磨或快速减压,或其中任何两种或更多种的组合。经常将该化学预处理与热预处理组合,例如,在150℃至220℃之间保持1分钟至30分钟。

通常对经预处理的材料进行酶促水解,以释放可根据本发明发酵的糖。可用诸如与纤维素酶接触的常规方法来进行该酶促水解,所述纤维素酶为例如,一种或多种纤维素二糖水解酶、一种或多种内切葡聚糖酶、一种或多种β-葡萄糖苷酶和任选地另一些酶。可在环境温度或更高的温度下以释放充分量的一种或多种糖的反应时间来进行用纤维素酶的该转化。该酶促水解的结果是包含C5/C6糖的水解产物,本文中将其成为糖组合物。

根据本发明的糖组合物包括葡萄糖、阿拉伯糖和木糖。满足这些标准的任何糖组合物都可用于本发明。糖组合物中的任选糖是半乳糖和甘露糖。在一个优选实施方案中,糖组合物是一种或多种木质纤维素材料的水解物。在本文中,木质纤维素包括半纤维素和生物质的半纤维素部分。木质纤维素还包括生物质的木质纤维素级分。合适的木质纤维素材料可在以下清单中找到:果园填充物(orchard priming)、丛林、铣磨废物、都市木质废物、城市废物、伐木废物、森林疏伐物、短轮伐期木质作物、工业废物、小麦秸秆、燕麦秸秆、水稻秸秆、大麦秸秆、黑麦秸秆、亚麻秸秆、大豆壳、稻壳、水稻秸秆、玉米麸质饲料、燕麦壳、甘蔗、玉米叶、玉米杆、玉米芯、玉米苞皮、柳枝稷、芒草、甜高粱、芥菜茎、大豆茎、草原草、磨擦禾、狐尾草;甜菜浆、柑橘水果浆、种子壳、纤维素质动物粪料、剪草屑、棉花、海藻、树木、软木、硬木、杨树、松树、灌木、草、小麦、小麦秸秆、甘蔗渣、玉米、玉米壳、玉米芯、玉米粒、来自谷粒的纤维、来自谷物湿磨或干磨的产物和副产物、城市固体废物、废纸、庭院废物、草本材料、农业残余物、林业残余物、城市固体废物、废纸、浆、纸磨残余物、树枝、灌木丛、藤条、玉米、玉米壳、能源作物、森林、水果、花、谷物、草、草本作物、叶、树皮、针叶、原木、根、树苗、灌丛、柳枝稷、树、植物、果皮、藤、甜菜浆、麦麸、燕麦壳、硬或软木、产生自农业过程的有机废料、林业木废料或其中任意两种或更多种的组合。

表2中给出了源自木质纤维素的一些合适的糖组合物以及它们的水解产物的糖构成的概览。所列的木质纤维素包括:玉米棒、玉米纤维、稻壳、瓜皮、甜菜浆、小麦秸秆、甘蔗渣、木、草和橄榄压榨物。

表2:来自木质纤维素材料的糖组合物的概览。Gal=半乳糖、Xyl=木糖、Ara=阿拉伯糖、Man=甘露糖、Glu=葡萄糖、Rham=鼠李糖。给出了半乳糖百分比(%Gal)

从表2中明显的是,在这些木质纤维素中,高量的糖以葡萄糖、木糖、阿拉伯糖和半乳糖的形式存在。因此,将葡萄糖、木糖、阿拉伯糖和半乳糖转化成发酵产物有着巨大的经济重要性。此外,甘露糖通常以比前述糖更低的量存在于一些木质纤维素材料中。因此,有利的是,经转化的宿主细胞还转化甘露糖。

发酵方法可为好氧发酵方法或厌氧发酵方法。在本文中,厌氧发酵方法定义为这样的发酵方法,其在没有氧的情况下或在基本没有消耗氧(优选消耗低于约5mmol/L/小时、约2.5mmol/L/小时或约1mmol/L/小时,更优选消耗0mmol/L/小时(即,未检出氧消耗))的情况下进行,并且其中有机分子充当电子供体和电子受体二者。在没有氧的情况下,糖酵解中产生的NADH和生物质形成不能受到氧化磷酸化的氧化。为了解决该问题,许多微生物使用丙酮酸或其一种衍生物作为电子和氢受体,从而再生NAD

因此,在一种优选的厌氧发酵中,将戊糖转化成发酵产物,例如乙醇、丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙烷-二醇、乙烯、甘油、β-内酰胺抗生素和头孢菌素。

优选在对细胞最优的温度下进行发酵方法。因此,对于大多数酵母或真菌宿主细胞而言,在低于约42℃,优选低于38℃的温度下进行发酵方法。对于酵母宿主细胞或丝状真菌宿主细胞而言,优选在低于约35℃、约33℃、约30℃或28℃的温度下,以及在高于约20℃、约22℃或约25℃的温度下进行发酵方法。

在该方法中基于木糖和/或葡萄糖的乙醇产率优选为至少约50%、约60%、约70%、约80%、约90%、约95%或约98%。本文中,乙醇产率被定义为理论最大产率的百分比。

本发明还涉及生产发酵产物的方法。

根据本发明的发酵方法可在好氧条件和厌氧条件下进行。在一个实施方案中,在微好氧或限氧条件下进行该方法。

在本文中,厌氧发酵方法定义为这样的发酵方法,其在没有氧的情况下或在基本没有消耗氧的情况下(优选消耗低于约5mmol/L/小时、约2.5mmol/L/小时或约1mmol/L/小时)进行,并且其中有机分子充当电子供体和电子受体二者。

在一种优选方法中,所述细胞发酵木糖和葡萄糖二者,优选同时地发酵,在此情况下优选使用对葡萄糖抑制不敏感的细胞。除了作为碳源的木糖(和葡萄糖)源之外,发酵介质还将包含细胞生长需要的合适成分。用于诸如酵母的微生物生长的发酵介质的成分是本领域公知的。

可以以分批式、分批补料式或连续式来进行发酵方法。还可使用分别水解和发酵(separate hydrolysis and fermentation,SHF)法或同时糖化和发酵(SSF)法。这些发酵方法模式的组合还可能用于最优化产率。下文中将更详细地描述这些方法。

对于同时糖化和发酵(Simultaneous Saccharification and Fermentation,SSF)模式而言,用于液化/水解步骤或预糖化步骤的反应时间依赖于实现期望产率(即,纤维素至葡萄糖的转化产率)的时间。这样的产率优选尽可能高,优选60%或更高、65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、96%或更高、97%或更高、98%或更高、99%或更高,甚至99.5%或更高或者99.9%或更高。

根据本发明,实现了SHF模式中非常高的糖浓度和SSF模式中非常高的产物浓度(例如乙醇)。在SHF操作中,葡萄糖浓度是25g/L或更高、30g/L或更高、35g/L或更高、40g/L或更高、45g/L或更高、50g/L或更高、55g/L或更高、60g/L或更高、65g/L或更高、70g/L或更高、75g/L或更高、80g/L或更高、85g/L或更高、90g/L或更高、95g/L或更高、100g/L或更高、110g/L或更高、120g/L或更高,或者可例如为25g/L至250g/L、30gl/L至200g/L、40g/L至200g/L、50g/L至200g/L、60g/L至200g/L、70g/L至200g/L、80g/L至200g/L、90g/L、80g/L至200g/L。

在SSF操作中,产物浓度(g/L)依赖于所产生葡萄糖的量,但这是不可见的,因为SSF中糖被转化成产物,并且产物浓度可通过乘以理论最大产率(每克葡萄糖的gr产物中最大Yps)与潜在葡萄糖浓度相关。

发酵产物的理论最大产率(每克葡萄糖的gr产物的最大Yps)可来源于生物化学参考书。对于乙醇而言,在酵母中,1摩尔葡萄糖(180gr)根据正常的糖酵解发酵途径产生2摩尔乙醇(=2×46=92gr乙醇)。因此,基于葡萄糖的理论最大乙醇产率为92/180=0.51gr乙醇/gr葡萄糖。

对于丁醇(MW 74gr/摩尔)或异丁醇而言,理论最大产率为1摩尔丁醇每摩尔葡萄糖。因此,对于(异-)丁醇而言,最大Yps=74/180=0.41gr(异-)丁醇/gr葡萄糖。

对于乳酸而言,同型乳酸发酵的发酵产率为2摩尔乳酸(MW=90gr/摩尔)每摩尔葡萄糖。根据该化学计量,最大Yps=1gr乳酸/gr葡萄糖。

对于其他发酵产物而言,可进行类似的计算。

在SSF操作中,产物浓度为25g*Yps g/L/L或更高、30*Yps g/L或更高、35g*Yps/L或更高、40*Yps g/L或更高、45*Yps g/L或更高、50*Yps g/L或更高、55*Yps g/L或更高、60*Yps g/L或更高、65*Yps g/L或更高、70*Yps g/L或更高、75*Yps g/L或更高、80*Yps g/L或更高、85*Yps g/L或更高、90*Yps g/L或更高、95*Yps g/L或更高、100*Yps g/L或更高、110*Yps g/L或更高、120g/L*Yps或更高,或者可例如为25*Yps g/L至250*Yps g/L、30*Ypsgl/L至L-200*Yps g/L、40*Yps g/L至200*Yps g/L、50*Yps g/L至200*Yps g/L、60*Yps g/L至200*Yps g/L、70*Yps g/L至200*Yps g/L、80*Yps g/L至200*Yps g/L、90*Yps g/L、80*Yps g/L至200*Yps g/L。

因此,本发明提供了用于制备发酵产物的方法,所述方法包括:

a.使用本文所述的方法降解木质纤维素;以及

b.发酵所得的材料,

从而制备发酵产物。

本发明的发酵产物可为任何有用的产物。在一个实施方案中,其为选自以下的产物:乙醇、正丁醇、异丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、富马酸、苹果酸、衣康酸、马来酸、柠檬酸、己二酸、氨基酸,例如,赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸、1,3-丙烷二醇、乙烯、甘油、β-内酰胺抗生素和头孢菌素、维生素、药物、动物饲料补充剂、专用化学物质、化学原料、塑料、溶剂、燃料包括生物燃料和生物气或有机聚合物,以及工业酶,例如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂合酶、氧化还原酶、转移酶或木聚糖酶。例如,可根据现有技术的细胞制备方法和发酵方法由根据本发明的细胞生产发酵产物,但是其实例不应解读为限制性的。可由WO2008121701或WO2008086124中描述的细胞生产正丁醇;由US2011053231或US2010137551中描述的细胞生产乳酸;由WO2010010291中描述的细胞生产3-羟基-丙酸;由WO2009153047中描述的细胞生产丙烯酸。

使用现有技术回收发酵产物。不同的回收方法适用于不同发酵产物。从水性混合物回收乙醇的现有方法通常使用分级技术和吸附技术。例如,可使用蒸馏塔(beer still)来处理包含乙醇于水性混合物中的发酵产物,以产生经富集的包含乙醇的混合物,然后对其进行分级(例如,分馏(fractional distillation)或其他类似技术)。然后,可使包含最高浓度乙醇的级分通过吸附器,以从乙醇去除大多数(如果不是所有)残余的水。

以下实施例示例性阐释了本发明:

除非另有指明,否则所用方法是标准生物化学技术。合适的一般方法参考书的例子包括Sambrook等,Molecular Cloning,a Laboratory Manual(1989),以及Ausubel等,Current Protocols in Molecular Biology(1995),John Wiley&Sons,Inc。

实验中使用的培养基为如在实施例中指出的添加了糖的YEP-培养基(10g/l酵母提取物,20g/l蛋白胨)或固体YNB-培养基(6.7g/l酵母氮碱,15g/l琼脂)。对于固体YEP培养基而言,在灭菌之前将15g/l琼脂添加至液体培养基中。

在AFM实验中,使用矿物质培养基。Verduyn等(Yeast(1992),第8卷,501-517)已经描述了矿物质培养基的成分,并且如实施例中所示,添加有2.325g/l尿素和糖。

根据Schiestl和Gietz(Current Genetics(1989),第16卷,339-346)描述的方法来进行酵母转化。

根据

醇发酵监视(Alcohol Fermentation Monitor,AFM;Halotec,Veenendaal,theNetherlands)是稳健并且用户友好的实验室并联生物反应器(parallel bioreactor),其使得能够准确比较六个同时的厌氧发酵的碳转化速率和产率。

AFM实验的起始培养物包含50mg酵母(干重)。为了确定此,对RN1001菌株的生物质相比于OD700制作校准曲线。在实验中使用该校准曲线来确定50mg酵母(干重)所需的细胞培养物的体积。

在开始AFM实验之前,如实施例中所示,使预培养物生长。对于各菌株,测量OD

使用Nucleospin RNA II试剂盒(Machery-Nagel,GmbH&Co.KG,Düren,德国),使用稍经改善的制造商的规程来分离RNA。在开始规程前,用0.2mg溶细胞酶/ml、1M山梨醇和0.1M EDTA缓冲剂于30℃处理新鲜生长的酵母细胞30分钟。在该步骤后,进行除了第6步和第7步(二氧化硅膜脱盐和DNA酶处理)之外的制造商规程。为了去除基因组DNA,在从柱子上洗脱RNA后进行DNA酶处理。为此,使10μl RNA溶液与7μl不含DNA酶和RNA酶的水、2μl 10×缓冲剂以及1μl DNA酶(Fermentas,68789 St.Leon-Rot/德国)混合。于37℃下孵育该混合物30分钟。添加1μl 25mM EDTA(Fermentas,68789 St.Leon-Rot/德国),并于65℃孵育10分钟以使该酶失活。

使用RevertAid

对于Q-PCR实验,使用DyNAmo Colorflash SYBR Green qPCR试剂盒(Finnzymes,01620Vantaa,芬兰)。DNA混合物由1μl cDNA、39μl H

表3:Q-PCR程序

用于实验的菌株为RN1001、RN1041和RN1216。WO 2012067510中已经描述了RN1041。该菌株具有以下基因型:

MAT a、ura3-52、leu2-112、his3::loxP、gre3::loxP、loxP-pTPI1::TAL1、loxP-pTPI1::RKI1、loxP-pTPI1-TKL1、loxP-pTPI1-RPE1、delta::pADH1-XKS1-tCYC1-LEU2、delta::URA3-pTPI1-xylA-tCYC1。

MAT a=接合型a

ura3-52、leu2-112、HIS3::loxP分别在URA3基因、LEU2基因和HIS3基因中的突变。ura3-52突变由xylA过表达构建体上的URA3基因回补;leu2-112突变由XKS1过表达构建体上的LEU2基因回补。HIS3-基因的缺失导致组氨酸营养缺陷型。为此,RN1041需要培养基中的组氨酸来生长。

gre3::loxP是缺失编码醛糖还原酶的GRE3基因。在去除标记后,loxP位点留在基因组中。

在本文描述的实验中,loxP-pTPI1表示通过TPI1基因启动子替代天然启动子的非氧化性戊糖磷酸途径基因的过表达。在去除标记后,强组成型TPI1启动子上游的loxP位点仍然保持在基因组中(Kuyper等,FEMS Yeast Research 5(2005)925–934)。

delta::是指在重组后,构建体通过Ty1反转录转座子的长末端重复进行染色体整合。

菌株RN1001是菌株RN1041的亲本菌株,即,HIS3-基因缺失之前。

菌株RN1216具有与菌株RN1041相同的基因型。

使用引物SEQ ID NO 25和SEQ ID NO 26从CEN.PK113-7D得到GLO1 ORF。然后,使用Zero

基于2μ质粒来进行GLO1的过表达。因此,构建具有GLO1表达盒的2μ质粒。图1中示出了具有PGK1启动子和PGI1终止子的GLO1表达盒的构建。图2、3和4中分别给出了包含存在于质粒pRN228、pRN935和pRN685中的这三种元件的质粒的物理图谱。然后,使用引物SEQ IDNO 1(pPGK1-5'-F;图1)和SEQ ID NO 2(tPGI1-3'-R;图1)PCR扩增构建的GLO1表达盒。通过使用GeneJET

质粒pRN228包含以下相关元件:PGK1启动子,侧翼为限制位点SpeI和PstI,以及卡那霉素抗性标记。

质粒pRN935包含以下相关元件:GLO1 ORF,侧翼为限制位点PstI和SalI,以及卡那霉素抗性标记。

质粒pRN685包含以下相关元件:PGI1终止子,侧翼为限制位点XhoI和HindIII,以及卡那霉素抗性标记。

质粒pRN599包含以下相关元件:2μ来源的复制子,其后为kanMX标记(由棉阿舒囊霉(Ashbya gossypii)TEF1启动子、KanMX抗性基因、和阿舒囊霉TEF1终止子组成)和氨苄青霉素抗性标记。

引物SEQ ID NO 1是PGK1启动子的正向引物。

引物SEQ ID NO 2是PGI1终止子的反向引物。

引物SEQ ID NO 25是用于扩增GLO1基因的正向引物。

引物SEQ ID NO 26是用于扩增GLO1基因的反向引物。

使用构建的GLO1过表达质粒pRN1049来转化酵母菌株RN1001。还通过用空质粒pRN599转化酵母菌株RN1001得到对照菌株。在包含2%葡萄糖和200μg/ml G418的YEP平板上选择正确的转化子。包含pRN1049的RN1001菌株称为RN1001Gpl。包含空质粒pRN599的RN1001对照菌株称为RN1001Epl。

通过Q-PCR来确定RN1001Gpl中GLO1表达的水平。使用对照菌株RN1001Epl作为参照。对于该实验,使两个菌株都在包含2%葡萄糖和200μg/ml G418的YEP培养基中生长过夜。然后,从培养物分离RNA,并使用引物SEQ ID NO 3和SEQ ID NO 4通过PCR检测基因组DNA污染。未发现污染。然后,使用RevertAid试剂盒(Fermentas,68789 St.Leon-Rot/德国)基于RNA来进行cDNA合成。随后,用引物SEQ ID NO5和SEQ ID NO 6来进行Q-PCR实验。使用以下两个持家基因作为参照:ALG9,使用引物SEQ ID NO 7和SEQ ID NO 8,以及UBC6,使用引物SEQ ID NO 9和SEQ ID NO 10。基于具有最好重复CT值(best duplo CT-values)的持家基因(在该情况下是ALG9)来归一化GLO1表达数据。RN1001Gpl菌株示出比RN1001Epl更高的GLO1表达(图9)。如图9所示,菌株RN1001Gpl中归一化的GLO1-基因表达水平是RN1001Epl相比的约5倍,而在这两个菌株中UBC6-基因的归一化表达相同。

引物SEQ ID NO 3与ACT1基因的序列一致。

引物SEQ ID NO 4与ACT1基因的序列一致。

引物SEQ ID NO 5与GLO1基因的序列一致。

引物SEQ ID NO 6与GLO1基因的序列一致。

引物SEQ ID NO 7与ALG9基因的序列一致。

引物SEQ ID NO 8与ALG9基因的序列一致。

引物SEQ ID NO 9与UBC6基因的序列一致。

引物SEQ ID NO 10与UBC6基因的序列一致。

在通过Q-PCR(实施例2)验证RN1001Gpl中的GLO1表达比对照菌株RN1001Epl更高后,开始AFM实验以通过测量实验期间CO

通过将一些细胞材料从琼脂板接种至100ml包含2%葡萄糖和200μg/ml G418的YEP中,制成两个菌株的预培养物。第二天,用来自所述预培养物的细胞材料接种400ml包含2%葡萄糖和2%木糖的矿物质培养基。在AFM实验中,未向矿物质培养基中添加G418。

CO

表4:HPLC数据RN1001Gpl

表5:HPLC数据RN1001Epl

因为AFM实验中未添加G418,所以确定了多少细胞中仍然包含它们的质粒。因此,在最终AFM实验结束时,将相同量的细胞培养物涂布于YEPD琼脂板和包含G418的YEPD琼脂板上。在没有G418的琼脂板上得到了四倍的克隆。这些结果示出,约25%的细胞仍然包含它们的质粒,指示在RN1001Gpl和RN1001Epl二者中都存在质粒丢失。因此,构建了新的转化子,其包含稳定整合于基因组中的额外的组成型表达的GLO1基因拷贝。

为了克服AFM实验期间的质粒丢失问题,将GLO1表达盒与用于选择正确转化子的HIS3一起整合至酵母菌株的基因组中。为此,构建了包含GLO1表达盒和HIS3表达盒的质粒。使用限制酶PvuII以及SphI或ApaLI从质粒中提取GLO1表达盒(存在于pRN1129中)和HIS3表达盒(存在于pRN324中)(图6和12)。然后,使两个片段在PvuII位点上连接至一起。使用引物SEQ ID NO 11和SEQ ID NO 12通过PCR扩增所得的片段,使用Zero

然后,使用引物SEQ ID NO 11和SEQ ID NO 12,以及pRN1142作为模板,PCR扩增GLO1和HIS3片段。为了得到对照菌株,用引物SEQ ID NO 11和SEQ ID NO 13,以及pRN324作为模板,PCR扩增HIS3表达盒。对于至基因组的整合,需要得到整合位点1(INT1)的两个500bp侧翼,图14中给出了整合位点的图谱(得自http://www.yeastgenome.org/)。PCR扩增了用于整合至INT1的5'的500bp侧翼和3'的500bp侧翼,针对5'侧翼使用引物SEQ ID NO 14和SEQ ID NO 15,针对3'侧翼使用引物SEQ ID NO 16和SEQ ID NO 17。使用来自RN1001的基因组DNA作为模板。使用GeneJET

质粒pRN324包含以下相关元件:HIS3表达盒,侧翼为限制位点ApaLI和PvuII,以及氨苄青霉素抗性标记。

质粒pRN1129包含以下相关元件:GLO1表达盒(由PGK1启动子、GLO1 ORF和PGI1终止子组成),侧翼为限制位点PvuII和SphI,以及卡那霉素抗性标记。

引物SEQ ID NO 11是HIS3盒的正向引物,由25个核苷酸以及5'端的与5'500bpINT1侧翼3'端的50核苷酸相同的50个核苷酸的尾组成;

引物SEQ ID NO 12是GLO1盒的反向引物,由25个核苷酸以及5'端的与3'500bpINT1侧翼5'端的50核苷酸相同的50个核苷酸的尾组成;

引物SEQ ID NO 13是HIS3盒的反向引物,由25个核苷酸以及5'端的与3'500bpINT1侧翼序列5'端的50核苷酸相同的50个核苷酸的尾组成;

引物SEQ ID NO 14是5'500bp INT1侧翼的正向引物。

引物SEQ ID NO 15是5'500bp INT1侧翼的反向引物。

引物SEQ ID NO 16是3'500bp INT1侧翼的正向引物。

引物SEQ ID NO 17是3'500bp INT1侧翼的反向引物。

图15中也示出了上述所有引物序列。

图15中示意地示出了将PCR片段整合至基因组中的机制。使用所得的PCR片段(实施例4)来转化菌株RN1041和RN1216,这二者都包含针对组氨酸的营养缺陷。在包含2%葡萄糖的YNB平板上选择正确的转化子。使用引物SEQ ID NO 14和SEQ ID NO 17,以菌落PCR来核实转化子,用于将表达盒整合至基因组中。将包含HIS3表达盒和GLO1表达盒的RN1041菌株命名为RN1041HG,并且将包含HIS3表达盒的RN1041对照菌株命名为RN1041H。将包含HIS3表达盒和GLO1表达盒的RN1216菌株命名为RN1216HG,并且将包含HIS3表达盒的RN1216对照菌株命名为RN1216H。

从两个对照菌株RN1041H和RN1216H各选择一个菌落用于Q-PCR。由RN1041HG和RN1216HG各选择两个单独的菌落用于Q-PCR(克隆1和克隆2)。

在Q-PCR实验中核实转化子中GLO1-基因的表达。对于该Q-PCR实验,使所有选择的菌株都在包含2%葡萄糖的YEP培养基中生长过夜。然后,从培养物分离RNA,并使用引物SEQID NO 3和SEQ ID NO 4通过PCR检测基因组DNA污染。未发现污染。然后,使用RevertAid试剂盒(Fermentas,68789 St.Leon-Rot/德国)基于RNA来进行cDNA合成。随后,用引物SEQ IDNO 5和SEQ ID NO 6来进行Q-PCR实验。使用以下两个持家基因作为参照:ALG9,使用引物SEQ ID NO 7和SEQ ID NO 8,以及UBC6,使用引物SEQ ID NO 9和SEQ ID NO 10。基于具有最好重复CT值的持家基因(在该情况下是UBC6)来归一化GLO1表达数据。包含HIS3和GLO1的所有4个菌株都示出了比对照菌株更高的归一化GLO1表达(图16),在RN1041背景中与ALG9相比为约4倍至5倍高,并且在RN1216背景中为约2倍至3倍高。

在通过Q-PCR(实施例5)验证包含HIS3和GLO1的所有四个菌株中的GLO1表达比其对照菌株更高后,开始AFM实验以通过测量实验期间CO

通过将一些细胞材料从平板接种至包含2%葡萄糖的100ml YEP中,制成所有3个RN1041衍生菌株(RN1041H、RN1041HG-1和RN1041HG-2)的预培养物。第二天,用来自所述预培养物的细胞材料接种400ml包含2%葡萄糖和2%木糖的矿物质培养基。

RN1041衍生菌株的CO

表6:HPLC数据RN1041H

表7:HPLC数据RN1041HG-1

表8:HPLC数据RN1041HG-2

这些结果清楚示出,GLO1-基因的过表达导致更快更高效的生物质糖发酵,从而导致发酵时间缩短。这意味着,更高效地将糖转化为乙醇。

用RN1216衍生菌株开始新的AFM实验。通过将一些细胞材料从琼脂板接种至包含2%葡萄糖的100ml YEP中,制成所有3个菌株(RN1216H、RN1216HG-1和RN1216HG-2)的预培养物。第二天,用来自所述预培养物的细胞材料接种400ml包含5%葡萄糖和5%木糖的矿物质培养基。

RN1216的CO

表9:HPLC数据RN1216H

表10:HPLC数据RN1216HG-1

表11:HPLC数据RN1216HG-2

这些结果再次证实了上述结果:GLO1-基因的过表达导致更快更高效的生物质糖(在该情况下为木糖和葡萄糖)发酵,从而导致总发酵时间缩短并且前述糖转化成乙醇更高效。

以前面的实施例中所描述的相同的方式表达来自除酿酒酵母之外的其他生物体的GLO1同源物。为此,基于蛋白质序列合成基因序列,列出为SED ID NO:20至SEQ ID NO:24。通过WO/2008/000632中描述的方法来生成开放阅读框的序列。蛋白质序列源自酿酒酵母、光滑假丝酵母、鲁氏接合酵母、乳酸克鲁维酵母和木兰假丝酵母。作为参照,使用来自酿酒酵母的野生型GLO1基因(参见前面的实施例)。

如前面的实施例所述,用如此获得的构建体来转化菌株RN1216。

当在AFM实验(也参见实施例10)测试时,所有转化子都示出增强的糖消耗速率,二者都基于实验期间的二氧化碳曲线以及实际糖浓度。

在一个实施方案中,一些有活性的GLO1版本中存在的以下特征,尤其是在增强混合糖底物共发酵方面的特征如下:

表12:GLO1特征模式

在表12中,X表示氨基酸(即,任何氨基酸)。

如果括号之间提及两个氨基酸残基,则任一个都适用(例如(F,Y))。

小写字母表示较少见的变体,例如(F,i)是指在大多数情况下观察到氨基酸F,但是在较少情况下观察到氨基酸I(异亮氨酸)。

将GLO1同源物与用于选择正确转化子的HIS3一起整合至酵母菌株RN1216的基因组中。为此,构建了质粒,其中每一个都包含具有PGK1启动子和PGI1终止子的不同GLO1同源物。根据PCT/EP2013/056623中描述的方法构建质粒。这些质粒称为pDB1175(图21)、pDB1176(图22)、pDB1177(图23)、pDB1178(图24)以及pDB1179(图25)。

然后,使用引物SEQ ID NO 28和SEQ ID NO 29,并以pDB1175、pDB1176、pDB1177、pDB1178和pDB1179为模板PCR扩增不同的GLO1表达盒。使用SEQ ID NO 30和SEQ ID NO 31,并以pRN324(图12)为模板PCR扩增HIS3表达盒。对于整合至基因组中,需要得到整合位点1(INT1)的两个500bp侧翼(实施例4中有描述)。对于整合至INT1,PCR扩增了5'的500bp侧翼和3'的500bp侧翼,针对5'侧翼使用引物SEQ ID NO 14和SEQ ID NO 32,针对3'侧翼使用引物SEQ ID NO 33和SEQ ID NO 17。使用来自RN1001的基因组DNA作为模板。使用GeneJET

质粒pDB1175包含以下相关元件:Sc_GLO1表达盒(由PGK1启动子、密码子对优化的来自酿酒酵母的GLO1 ORF和PGI1终止子组成),以及卡那霉素抗性标记。

质粒pDB1176包含以下相关元件:Cgla_GLO1表达盒(由PGK1启动子、密码子对优化的来自光滑假丝酵母的GLO1 ORF和PGI1终止子组成),以及卡那霉素抗性标记。

质粒pDB1177包含以下相关元件:Zrou_GLO1表达盒(由PGK1启动子、密码子对优化的来自鲁氏接合酵母的GLO1 ORF和PGI1终止子组成),以及卡那霉素抗性标记。

质粒pDB1178包含以下相关元件:Kl_GLO1表达盒(由PGK1启动子、密码子对优化的来自乳酸克鲁维酵母的GLO1 ORF和PGI1终止子组成),以及卡那霉素抗性标记。

质粒pDB1179包含以下相关元件:Cmag_GLO1表达盒(由PGK1启动子、密码子对优化的来自木兰假丝酵母的GLO1 ORF和PGI1终止子组成),以及卡那霉素抗性标记。

质粒pRN324:实施例4中有描述

引物SEQ ID NO 28是同源GLO1表达盒(包含启动子和终止子)的正向引物。引物SEQ ID NO 29是同源GLO1表达盒(包含启动子和终止子)的反向引物。引物SEQ ID NO 30是HIS3盒的正向引物,由20个核苷酸以及5'端的与同源GLO1表达盒3'端的50核苷酸相同的50个核苷酸的尾组成。引物SEQ ID NO 31是HIS3盒的反向引物,由21个核苷酸以及5'端的与3'500bp INT1侧翼5'端的50核苷酸相同的50个核苷酸的尾组成。引物SEQ ID NO 32是5'500bp INT1侧翼序列的反向引物,由23个核苷酸以及5'端的与同源GLO1表达盒5'端的50核苷酸相同的50个核苷酸的尾组成。引物SEQ ID NO 33是3'500bp INT1侧翼的正向引物,由24个核苷酸以及5'端的与HIS3表达盒3'端的50核苷酸相同的50个核苷酸的尾组成。

图26中也示出了上述所有引物序列。

图26中示意地示出了将PCR片段整合至基因组中的机制。使用所得的PCR片段(实施例8)来转化包含针对组氨酸的营养缺陷的菌株RN1216。在包含2%葡萄糖的YNB平板上选择正确的转化子。使用引物SEQ ID NO 14和SEQ ID NO 17,以菌落PCR来核实转化子,用于将表达盒整合至基因组中。正确的菌株命名如下:RN1216 ScG_H、RN1216CglaG_H、RN1216ZrouG_H、RN1216 KlG_H和RN1216 CmagG_H。

菌株RN1216 ScG_H包含Sc_GLO1表达盒和HIS3表达盒。

菌株RN1216 CglaG_H包含Cgla_GLO1表达盒和HIS3表达盒。

菌株RN1216 ZrouG_H包含Zrou_GLO1表达盒和HIS3表达盒。

菌株RN1216 KlG_H包含Kl_GLO1表达盒和HIS3表达盒。

菌株RN1216 CmagG_H包含Cmag_GLO1表达盒和HIS3表达盒。

开始AFM实验以通过测量实验期间CO

通过将一些细胞材料从平板接种至包含2%葡萄糖的100ml YEP中,制成所有6个菌株的预培养物。第二天,用来自所述预培养物的细胞材料接种400ml包含5%葡萄糖和5%木糖的矿物质培养基。

RN1216衍生菌株的CO

这些结果示出,来源于酿酒酵母、光滑假丝酵母、乳酸克鲁维酵母或木兰假丝酵母菌株的GLO1-基因的过表达导致更快更高效的生物质糖(在该情况下为木糖和葡萄糖)发酵,从而导致总发酵时间缩短并且前述糖转化成乙醇更高效。来源于鲁氏接合酵母菌株的GLO1-基因的过表达是例外,其示出了比该实验中测试的其他菌株更快的葡萄糖消耗,但是该菌株的总体性能不佳。

序列表

<110> 帝斯曼知识产权资产管理有限公司

<120> 具有改善的戊糖转化的细胞

<130> 29095-WO-PCT

<160> 38

<170> BiSSAP 1.2

<210> 1

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..32

<223> /生物体="人工序列"

/注释="正向引物PGK1启动子"

/分子类型="未指定DNA"

<400> 1

actagtctcg agctcttcaa ctcaagacgc ac 32

<210> 2

<211> 36

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..36

<223> /生物体="人工序列"

/注释="反向引物PGI1终止子"

/分子类型="未指定DNA"

<400> 2

ttaagcttcg tacgttttaa acagttgatg agaacc 36

<210> 3

<211> 26

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..26

<223> /生物体="人工序列"

/注释="正向引物ACT1基因"

/分子类型="未指定DNA"

<400> 3

ccattttgag aatcgatttg gccggt 26

<210> 4

<211> 28

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..28

<223> /生物体="人工序列"

/注释="反向引物ACT1基因"

/分子类型="未指定DNA"

<400> 4

ggtgatttcc ttttgcattc tttcggca 28

<210> 5

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..24

<223> /生物体="人工序列"

/注释="正向引物GLO1基因, Q-PCR"

/分子类型="未指定DNA"

<400> 5

ggagagcctg atgtttttag cgca 24

<210> 6

<211> 23

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..23

<223> /生物体="人工序列"

/注释="反向引物GLO1基因, Q-PCR"

/分子类型="未指定DNA"

<400> 6

tcaatccagt atccatcagg gcc 23

<210> 7

<211> 29

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..29

<223> /生物体="人工序列"

/注释="正向引物ALG9基因, Q-PCR"

/分子类型="未指定DNA"

<400> 7

cacggatagt ggctttggtg aacaattac 29

<210> 8

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..32

<223> /生物体="人工序列"

/注释="反向引物ALG9基因, Q-PCR"

/分子类型="未指定DNA"

<400> 8

tatgattatc tggcagcagg aaagaacttg gg 32

<210> 9

<211> 29

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..29

<223> /生物体="人工序列"

/注释="正向引物UBC6基因, Q-PCR"

/分子类型="未指定DNA"

<400> 9

gatacttgga atcctggctg gtctgtctc 29

<210> 10

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..32

<223> /生物体="人工序列"

/注释="反向引物UBC6基因, Q-PCR"

/分子类型="未指定DNA"

<400> 10

aaagggtctt ctgtttcatc acctgtattt gc 32

<210> 11

<211> 75

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..75

<223> /生物体="人工序列"

/注释="正向引物HIS3盒, 5'侧翼INT1"

/分子类型="未指定DNA"

<400> 11

cagttttaaa aagtcagaga atgtagagaa gtatggatct ttgaaaccct ttggtgagcg 60

ctaggagtca ctgcc 75

<210> 12

<211> 75

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..75

<223> /生物体="人工序列"

/注释="反向引物GLO1盒, 3'侧翼INT1"

/分子类型="未指定DNA"

<400> 12

atcttacata gtgtcgggaa caggtcattc taaaaaaagt aaaataaaat acgttttaaa 60

cagttgatga gaacc 75

<210> 13

<211> 75

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..75

<223> /生物体="人工序列"

/注释="反向引物HIS3盒, 3'侧翼INT1"

/分子类型="未指定DNA"

<400> 13

cataatatgt taaaagctag atcttacata gtgtcgggaa caggtcattc ttcacaccgc 60

atatgatccg tcgag 75

<210> 14

<211> 19

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..19

<223> /生物体="人工序列"

/注释="正向引物5'侧翼INT1"

/分子类型="未指定DNA"

<400> 14

cggcattatt gtgtatggc 19

<210> 15

<211> 23

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..23

<223> /生物体="人工序列"

/注释="反向引物5'侧翼INT1"

/分子类型="未指定DNA"

<400> 15

agggtttcaa agatccatac ttc 23

<210> 16

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..24

<223> /生物体="人工序列"

/注释="正向引物3'侧翼INT1"

/分子类型="未指定DNA"

<400> 16

gaatgacctg ttcccgacac tatg 24

<210> 17

<211> 24

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..24

<223> /生物体="人工序列"

/注释="反向引物3'侧翼INT1"

/分子类型="未指定DNA"

<400> 17

cacaagctta ttcttccaaa aatc 24

<210> 18

<211> 500

<212> DNA

<213> Saccharomyces cerevisiae

<220>

<221> 来源

<222> 1..500

<223> /生物体="Saccharomyces cerevisiae"

/分子类型="未指定DNA"

<400> 18

cggcattatt gtgtatggct caataatttt ataaaaaaag gaactattgg ttcttagtat 60

tttcttgcta gaagacatat tcttaccaat cctttcataa gctaattatg ccatccatat 120

agcaagagaa tccggtgggg gcgccatgcc tatccggcgg caacattatt actctggtat 180

acgggcgtaa ctccataata tgccaccact tacctttaac atgttcatgg taggtacccc 240

acccagccat aaggaaattt tcaaaggcgt tggatcaaaa aataggcctt tatttcatcg 300

cgtgattgag gagcataaca tgtttagtga aggtttcttt tggaaaactt cagtcgctca 360

ttattagaac cagggaggtc caggctttgc tggtgggaga gaaagcttat gaagctgggg 420

ttgcagattt gtcgattggt cgccagtaca cagttttaaa aagtcagaga atgtagagaa 480

gtatggatct ttgaaaccct 500

<210> 19

<211> 478

<212> DNA

<213> Saccharomyces cerevisiae

<220>

<221> 来源

<222> 1..478

<223> /生物体="Saccharomyces cerevisiae"

/分子类型="未指定DNA"

<400> 19

gaatgacctg ttcccgacac tatgtaagat ctagctttta acatattatg gaaacctgaa 60

atgtaaaatc tgaatttttg tatatgtgtt tatatttggg tagttctttt gaggaaagca 120

tgcatagact tgctgtacga actttatgtg acttgtagtg acgctgtttc atgagacttt 180

agccctttga acatattatc atatctcagc ttgaaatact atagatttac ttttgcagcc 240

atttcttggt gctccaaggt tgtgcgtatc tattacttaa tttctgtcct tgccaagttt 300

tgcagcaggg cggtcacaag actcctctgc cgtcattcct tagtccttcg ggaacacact 360

tatttatgta tttgtattct acaattctac ggtgcacaag ggttgggcac tgttgagctc 420

agcacgcaac tattgctggc atgaagataa gattgatttt tggaagaata agcttgtg 478

<210> 20

<211> 326

<212> PRT

<213> Saccharomyces cerevisiae

<400> 20

Met Ser Thr Asp Ser Thr Arg Tyr Pro Ile Gln Ile Glu Lys Ala Ser

1 5 10 15

Asn Asp Pro Thr Leu Leu Leu Asn His Thr Cys Leu Arg Val Lys Asp

20 25 30

Pro Ala Arg Thr Val Lys Phe Tyr Thr Glu His Phe Gly Met Lys Leu

35 40 45

Leu Ser Arg Lys Asp Phe Glu Glu Ala Lys Phe Ser Leu Tyr Phe Leu

50 55 60

Ser Phe Pro Lys Asp Asp Ile Pro Lys Asn Lys Asn Gly Glu Pro Asp

65 70 75 80

Val Phe Ser Ala His Gly Val Leu Glu Leu Thr His Asn Trp Gly Thr

85 90 95

Glu Lys Asn Pro Asp Tyr Lys Ile Asn Asn Gly Asn Glu Glu Pro His

100 105 110

Arg Gly Phe Gly His Ile Cys Phe Ser Val Ser Asp Ile Asn Lys Thr

115 120 125

Cys Glu Glu Leu Glu Ser Gln Gly Val Lys Phe Lys Lys Arg Leu Ser

130 135 140

Glu Gly Arg Gln Lys Asp Ile Ala Phe Ala Leu Gly Pro Asp Gly Tyr

145 150 155 160

Trp Ile Glu Leu Ile Thr Tyr Ser Arg Glu Gly Gln Glu Tyr Pro Lys

165 170 175

Gly Ser Val Gly Asn Lys Phe Asn His Thr Met Ile Arg Ile Lys Asn

180 185 190

Pro Thr Arg Ser Leu Glu Phe Tyr Gln Asn Val Leu Gly Met Lys Leu

195 200 205

Leu Arg Thr Ser Glu His Glu Ser Ala Lys Phe Thr Leu Tyr Phe Leu

210 215 220

Gly Tyr Gly Val Pro Lys Thr Asp Ser Val Phe Ser Cys Glu Ser Val

225 230 235 240

Leu Glu Leu Thr His Asn Trp Gly Thr Glu Asn Asp Pro Asn Phe His

245 250 255

Tyr His Asn Gly Asn Ser Glu Pro Gln Gly Tyr Gly His Ile Cys Ile

260 265 270

Ser Cys Asp Asp Ala Gly Ala Leu Cys Lys Glu Ile Glu Val Lys Tyr

275 280 285

Gly Asp Lys Ile Gln Trp Ser Pro Lys Phe Asn Gln Gly Arg Met Lys

290 295 300

Asn Ile Ala Phe Leu Lys Asp Pro Asp Gly Tyr Ser Ile Glu Val Val

305 310 315 320

Pro His Gly Leu Ile Ala

325

<210> 21

<211> 319

<212> PRT

<213> Candida glabrata

<400> 21

Met Ser Tyr Pro His Lys Ile Ala Ala Ala His Asp Asp Pro Thr Leu

1 5 10 15

Met Phe Asn His Thr Cys Leu Arg Ile Lys Asp Pro Ala Lys Ser Ile

20 25 30

Pro Phe Tyr Gln Lys His Phe Gly Met Glu Leu Leu Asn Lys Leu Asp

35 40 45

Phe Pro Glu Met Lys Phe Ser Leu Phe Phe Leu Ser Phe Pro Lys Asp

50 55 60

Asn Val Ala Lys Asn Ser Glu Gly Lys Asn Asp Val Phe Ser Thr Ser

65 70 75 80

Gly Ile Leu Glu Leu Thr His Asn Trp Gly Ser Glu Asn Asp Ala Asp

85 90 95

Phe Lys Ile Cys Asn Gly Asn Glu Glu Pro His Arg Gly Phe Gly His

100 105 110

Ile Cys Phe Ser Tyr Ala Asp Ile Asn Ala Ala Cys Ser Lys Leu Glu

115 120 125

Ala Glu Gly Val Ser Phe Lys Lys Arg Leu Thr Asp Gly Arg Met Lys

130 135 140

Asp Ile Ala Phe Ala Leu Asp Pro Asp Gly Tyr Trp Ile Glu Leu Ile

145 150 155 160

Arg Tyr Asp Arg Glu Asn Ser Pro Lys Lys Asp Val Gly Ser Arg Phe

165 170 175

Asn His Thr Met Val Arg Val Lys Asp Pro Lys Ala Ser Leu Glu Phe

180 185 190

Tyr Gln Asn Val Leu Gly Met Lys Leu Leu Arg Thr Ser Glu His Glu

195 200 205

Ala Ala Lys Phe Thr Leu Tyr Phe Leu Gly Tyr Lys Val Ser Ser Glu

210 215 220

Asp Asn Glu Phe Ser His Glu Gly Val Leu Glu Leu Thr His Asn Trp

225 230 235 240

Gly Thr Glu Asn Glu Ala Asp Phe Lys Tyr His Asn Gly Asn Asp Lys

245 250 255

Pro Gln Gly Tyr Gly His Ile Cys Val Ser Cys Lys Asp Pro Ala Lys

260 265 270

Leu Cys Asn Glu Ile Glu Gln Thr Tyr Gly Asp Lys Ile Gln Trp Ala

275 280 285

Pro Lys Phe Asn Gln Gly Lys Leu Lys Asn Ile Ala Phe Leu Lys Asp

290 295 300

Pro Asp Gly Tyr Ser Ile Glu Val Val Pro His Gly Leu Ile Val

305 310 315

<210> 22

<211> 347

<212> PRT

<213> Zygosaccharomyces rouxii

<400> 22

Met Phe Ser Arg Val Phe Ser Arg Leu Gly Leu Ile Lys Gln His Ile

1 5 10 15

Arg Thr Met Ser Thr Lys Thr Ser Glu Ala Gln Tyr Tyr Thr Lys Lys

20 25 30

Ile Ala Ser Ala Val Gly Asp Pro Ser Leu Arg Phe Asn His Thr Cys

35 40 45

Leu Arg Ile Lys Asp Pro Ser Ala Ser Val Glu Phe Tyr Lys Lys His

50 55 60

Phe Asn Met Thr Leu Leu Ser Lys Lys Asp Phe Pro Asp Met Lys Phe

65 70 75 80

Ser Leu Tyr Phe Leu Val Met Thr Lys Glu Asn Leu Pro Lys Asn Glu

85 90 95

Lys Gly Glu Asn Leu Val Phe Ala Asn Arg Gly Ile Leu Glu Leu Thr

100 105 110

His Asn Trp Gly Thr Glu Ala Asp Pro Glu Tyr Lys Val Asn Asn Gly

115 120 125

Asn Val Glu Pro His Arg Gly Phe Gly His Ile Cys Phe Ser Val Ala

130 135 140

Asn Val Glu Ser Thr Cys Gln Arg Leu Glu Ser Glu Gly Val Lys Phe

145 150 155 160

Gln Lys Arg Leu Val Asp Gly Arg Gln Lys Asn Ile Ala Phe Ala Leu

165 170 175

Asp Pro Asp Gly Tyr Trp Ile Glu Leu Ile Gln Tyr Ile Asn Glu Ser

180 185 190

Gly Glu Gly Pro Lys Thr Asp Leu Gly Asn Arg Phe Asn His Thr Met

195 200 205

Val Arg Val Lys Asp Pro Val Lys Ser Leu Glu Phe Tyr Gln Asn Val

210 215 220

Leu Gly Met Thr Leu His Arg Val Ser Glu His Ala Asn Ala Lys Phe

225 230 235 240

Thr Leu Tyr Phe Leu Gly Tyr Asp Ile Pro Gln Gly Asp Ser Thr Gly

245 250 255

Ser Ala Glu Thr Leu Leu Glu Leu Thr His Asn Trp Gly Thr Glu Asn

260 265 270

Asp Pro Asp Phe His Tyr His Asn Gly Asn Ala Gln Pro Gln Gly Tyr

275 280 285

Gly His Ile Cys Ile Thr Cys Lys Asp Pro Gly Ala Leu Cys Glu Glu

290 295 300

Ile Glu Lys Lys Tyr Asn Glu Gln Val Val Trp Ser Pro Lys Trp Asn

305 310 315 320

His Gly Lys Met Lys Asn Leu Ala Phe Ile Lys Asp Pro Asp Gly Tyr

325 330 335

Ser Ile Glu Ile Val Pro Ala Glu Leu Val Leu

340 345

<210> 23

<211> 338

<212> PRT

<213> Kluyveromyces lactis

<400> 23

Met Phe Lys Glu Arg Leu Leu Asn Ile Leu Lys His Ile Arg Pro Met

1 5 10 15

Ser Thr Glu Thr Thr Ala Lys Tyr Tyr Pro Lys Ile Val Glu Ser Ala

20 25 30

Gln Ala Asp Gln Ser Leu Lys Leu Asn His Thr Cys Phe Arg Val Lys

35 40 45

Asp Pro Lys Val Thr Val Ala Phe Tyr Gln Glu Gln Phe Gly Met Lys

50 55 60

Leu Leu Asp His Lys Lys Phe Pro Asp Met Lys Phe Asp Leu Tyr Phe

65 70 75 80

Leu Ser Phe Pro Asn Lys Gln Phe Ser Asn Asn Ser Gln Gly Ala Ile

85 90 95

Asp Val Phe Arg Glu Asn Gly Ile Leu Glu Leu Thr His Asn Tyr Gly

100 105 110

Thr Glu Ser Asp Pro Ala Tyr Lys Val Asn Asn Gly Asn Glu Glu Pro

115 120 125

His Arg Gly Phe Gly His Ile Cys Phe Ser Val Ser Asn Leu Glu Ala

130 135 140

Glu Cys Glu Arg Leu Glu Ser Asn Gly Val Lys Phe Lys Lys Arg Leu

145 150 155 160

Thr Asp Gly Ser Gln Arg Asn Ile Ala Phe Ala Leu Asp Pro Asn Gly

165 170 175

Tyr Trp Ile Glu Leu Ile Gln Asn Asn Glu Ser Gly Glu Gly Asn Asn

180 185 190

Tyr Lys Phe Asn His Thr Met Val Arg Val Lys Asp Pro Ile Lys Ser

195 200 205

Leu Glu Phe Tyr Gln Asn Val Leu Gly Met Lys Ile Leu Asp Val Ser

210 215 220

Asp His Ser Asn Ala Lys Phe Thr Leu Tyr Phe Leu Gly Tyr Glu Asn

225 230 235 240

Asp Gln Lys Gly Ile Ala Arg Gly Ser Arg Glu Ser Ile Leu Glu Leu

245 250 255

Thr His Asn Trp Gly Thr Glu Asn Asp Pro Asp Phe Ala Tyr His Thr

260 265 270

Gly Asn Thr Glu Pro Gln Gly Tyr Gly His Ile Cys Ile Ser Asn Lys

275 280 285

Asp Pro Ala Thr Leu Cys Ala Glu Ile Glu Lys Leu Tyr Pro Asp Ile

290 295 300

Gln Trp Ser Pro Lys Phe Asn Gln Gly Lys Met Lys Asn Leu Ala Phe

305 310 315 320

Ile Lys Asp Pro Asp Gly Tyr Ser Ile Glu Val Val Pro Tyr Gly Leu

325 330 335

Gly Val

<210> 24

<211> 315

<212> PRT

<213> Candida magnoliae

<400> 24

Met Leu Gly Lys Val Ala Gln Lys Phe Leu Asn His Thr Cys Ile Arg

1 5 10 15

Ile Ala Asp Pro Ala Arg Ser Leu Ala Phe Tyr Glu Lys Asn Phe Gly

20 25 30

Met Lys Leu Val Thr Gln Leu Asp Val Lys Glu Val Gly Phe Thr Leu

35 40 45

Tyr Tyr Leu Gly Phe Thr Gly Pro Lys Ser Leu Tyr Lys Asp Thr Pro

50 55 60

Trp Tyr Lys Arg Gly Gly Leu Leu Glu Leu Thr His Asn His Gly Ala

65 70 75 80

Thr Pro Glu Asn Phe Glu Ala Asn Asn Gly Asn Lys Glu Pro His Arg

85 90 95

Gly Phe Gly His Ile Cys Phe Ser Val Ser Asp Leu Glu Lys Thr Cys

100 105 110

Glu Lys Leu Glu Gly Asn Gly Val Gly Phe Gln Lys Arg Leu Thr Asp

115 120 125

Gly Arg Gln Lys Asn Ile Ala Phe Ala Leu Asp Pro Asp Gly Tyr Trp

130 135 140

Ile Glu Leu Ile Arg Asn Gly Asn Glu Gly Ala Glu Ser Pro Glu Thr

145 150 155 160

Cys Thr Thr Arg Phe Asn His Ser Met Ile Arg Val Lys Asp Lys Asp

165 170 175

Ala Ala Leu Asp Phe Tyr Thr Asn Lys Leu Gly Met Thr Leu Val Asp

180 185 190

Thr Ser Asp Phe Pro Glu Ala Lys Phe Thr Leu Phe Phe Leu Ser Phe

195 200 205

Asp Pro Thr Ser Val Lys Glu Arg Ser Arg Gly Gly Thr Glu Gly Leu

210 215 220

Ile Glu Leu Thr Tyr Asn Tyr Gly Ser Glu Gln Asp Val Asn Leu His

225 230 235 240

Tyr His Asn Gly Asn Thr Asp Pro Gln Gly Phe Gly His Phe Gly Val

245 250 255

Thr Val Pro Asp Ala Lys Ala Phe Leu Ser Glu Leu Glu Ser Lys Gly

260 265 270

Val Arg Val Thr Lys Gln Leu Thr Glu Gly Lys Met Lys Phe Met Gly

275 280 285

Phe Val Ser Asp Pro Asp Gly Tyr Leu Ile Glu Val Leu Pro Gln Arg

290 295 300

Asp Phe Pro Lys Asp Leu Phe Ser Pro Ser Leu

305 310 315

<210> 25

<211> 32

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..32

<223> /生物体="人工序列"

/注释="GLO1 ORF的正向引物"

/分子类型="未指定DNA"

<400> 25

agctgcagaa aatgtccact gatagtacac gc 32

<210> 26

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..35

<223> /生物体="人工序列"

/注释="GLO1 ORF的反向引物"

/分子类型="未指定DNA"

<400> 26

aagtcgactt aggcaatcaa accatgagga acgac 35

<210> 27

<211> 981

<212> DNA

<213> Saccharomyces cerevisiae

<220>

<221> 来源

<222> 1..981

<223> /生物体="Saccharomyces cerevisiae"

/分子类型="未指定DNA"

<400> 27

atgtccactg atagtacacg ctatccaatt cagattgaga aagcctcgaa tgatccaacc 60

cttctgctta atcacacatg tttaagagtc aaggatccag caaggaccgt taagttctac 120

accgaacact tcggtatgaa gctattaagc agaaaggatt ttgaagaagc aaaatttagc 180

ttgtactttt taagctttcc aaaagacgac atacccaaaa ataagaatgg agagcctgat 240

gtttttagcg cacacggtgt cttagaacta actcacaatt ggggtactga aaaaaaccca 300

gactacaaga tcaacaacgg gaatgaggaa cctcatcgtg gatttgggca catctgtttt 360

tctgtatccg atatcaataa aacctgcgaa gagctagaat ctcagggtgt caaattcaag 420

aagagactct ctgaaggaag acagaaggac attgcgtttg ctttaggccc tgatggatac 480

tggattgagt tgatcacata ttctagagag ggtcaggaat acccaaaggg ctcagtaggt 540

aacaagttca atcataccat gattcgtatt aaaaacccaa cccggtcttt agaattctac 600

cagaatgtgt tgggcatgaa attattaaga actagtgagc acgaaagtgc aaaatttacg 660

ttatactttc ttggttatgg cgttccaaag accgacagcg ttttttcatg tgaaagtgtg 720

ttggagttaa ctcataattg gggaactgag aatgatccaa acttccacta tcataacggt 780

aactcagagc cccagggtta tggtcacatc tgcataagtt gtgatgacgc tggcgccctt 840

tgtaaagaaa ttgaagtgaa atacggcgat aagatccaat ggtctcctaa atttaaccaa 900

ggcagaatga agaatattgc ctttttgaag gatcctgatg gttattccat tgaagtcgtt 960

cctcatggtt tgattgccta a 981

<210> 28

<211> 22

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..22

<223> /生物体="人工序列"

/注释="正向引物同源GLO1表达盒"

/分子类型="未指定DNA"

<400> 28

aagcgacttc caatcgcttt gc 22

<210> 29

<211> 21

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..21

<223> /生物体="人工序列"

/注释="反向引物同源GLO1表达盒"

/分子类型="未指定DNA"

<400> 29

aaagcaaagg aaggagagaa c 21

<210> 30

<211> 70

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..70

<223> /生物体="人工序列"

/注释="正向引物HIS3盒, 同源GLO1表达

盒s"

/分子类型="未指定DNA"

<400> 30

ttgcccatcg aacgtacaag tactcctctg ttctctcctt cctttgcttt taactatgcg 60

gcatcagagc 70

<210> 31

<211> 71

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..71

<223> /生物体="人工序列"

/注释="反向引物HIS3盒, 3â侧翼INT1"

/分子类型="未指定DNA"

<400> 31

acttagtatg gtctgttgga aaggattgtg gcttcgcata caggctttct tcctgatgcg 60

gtattttctc c 71

<210> 32

<211> 73

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..73

<223> /生物体="人工序列"

/注释="反向引物INT1 5â侧翼, 同源GLO1表达

盒s"

/分子类型="未指定DNA"

<400> 32

aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt agggtttcaa 60

agatccatac ttc 73

<210> 33

<211> 74

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..74

<223> /生物体="人工序列"

/注释="正向引物INT1 3â侧翼, HIS3盒"

/分子类型="未指定DNA"

<400> 33

agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt gaatgacctg 60

ttcccgacac tatg 74

<210> 34

<211> 981

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..981

<223> /生物体="人工序列"

/注释="GLO1 S. cerevisiae密码子对优化序列"

/分子类型="未指定DNA"

<400> 34

atgtccactg actctaccag atacccaatt caaattgaaa aggcctccaa cgacccaact 60

ctattattga accacacctg tttgagagtc aaggacccag ctagaactgt caaattctac 120

actgaacact tcggtatgaa attgttgtcc agaaaggact ttgaagaagc taagttctct 180

ttgtacttct tgtctttccc aaaggatgac attccaaaga acaagaacgg tgaaccagat 240

gttttctctg ctcacggtgt cttggaatta acccacaact ggggcactga aaagaaccca 300

gactacaaga tcaacaacgg taacgaagaa cctcaccgtg gtttcggtca tatctgtttc 360

tctgtttctg acatcaacaa gacctgtgaa gaattggaat ctcaaggtgt caagttcaag 420

aagagattat ctgaaggtcg tcaaaaggat atcgcctttg ctttgggtcc agatggttac 480

tggattgaat tgatcaccta ctccagagaa ggtcaagaat acccaaaggg ttccgttggt 540

aacaaattca accacaccat gatcagaatc aagaacccaa ccagatcttt ggaattctac 600

caaaacgttt tgggtatgaa gttgttgaga acttctgaac acgaatctgc caagttcact 660

ttatacttct tgggttacgg tgttccaaag accgattctg tcttttcctg tgaatccgtt 720

ttggaattga cccataactg gggtactgaa aatgacccaa acttccacta ccacaatggt 780

aactctgaac ctcaaggtta cggtcacatc tgtatctctt gtgatgatgc tggtgctttg 840

tgtaaggaaa ttgaagtcaa atacggtgac aagattcaat ggtccccaaa gttcaaccaa 900

ggtagaatga agaacattgc tttcttgaaa gacccagacg gttactccat cgaagttgtt 960

ccacacggtt tgatcgctta a 981

<210> 35

<211> 960

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..960

<223> /生物体="人工序列"

/注释="GLO1 C. glabrata密码子对优化序列"

/分子类型="未指定DNA"

<400> 35

atgtcttacc cacacaagat tgctgctgcc cacgatgacc caactttgat gttcaaccac 60

acctgtttga gaatcaagga cccagctaag tccattccat tttaccaaaa gcatttcggt 120

atggaattgt tgaacaaatt ggacttccca gaaatgaaat tctccttgtt tttcttatct 180

ttcccaaagg acaacgttgc caagaactct gaaggtaaga acgatgtctt ctccacttct 240

ggtatcttgg aattgaccca caactggggt tctgaaaacg atgctgattt caagatctgt 300

aacggtaacg aagaaccaca ccgtggtttc ggtcacatct gtttctctta cgctgatatc 360

aacgctgctt gttccaaatt ggaagctgaa ggtgtttctt tcaagaagag attgaccgat 420

ggtagaatga aggatatcgc ctttgctttg gacccagacg gttactggat cgaattaatc 480

agatacgaca gagaaaactc tccaaagaag gacgtcggtt ccagattcaa ccataccatg 540

gtcagagtta aggacccaaa ggcttctttg gaattctacc aaaacgttct aggtatgaaa 600

ttgttgagaa cctctgaaca cgaagctgcc aagttcactt tgtacttctt aggttacaag 660

gtttcctctg aagacaacga attctctcac gaaggtgtct tagaattgac tcataactgg 720

ggtactgaaa atgaagctga cttcaaatac cacaacggta atgacaagcc acaaggttac 780

ggtcacattt gtgtctcctg taaggatcca gccaagttgt gtaacgaaat tgaacaaacc 840

tacggtgaca agatccaatg ggctccaaag ttcaaccaag gtaaattgaa gaacattgct 900

ttcttgaagg accctgatgg ttactccatc gaagttgttc cacacggttt gattgtataa 960

<210> 36

<211> 948

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..948

<223> /生物体="人工序列"

/注释="GLO1 C. magnoliae密码子对优化序列"

/分子类型="未指定DNA"

<400> 36

atgttgggta aggttgctca aaagttcttg aaccacacct gtatcagaat tgctgaccca 60

gctcgttctt tggctttcta cgaaaagaac tttggtatga aattggttac tcaattggat 120

gtcaaggaag tcggtttcac tttgtactac ttgggtttca ccggtccaaa gtctttatac 180

aaggacactc catggtacaa gagaggtggt ctattggaat tgactcacaa ccatggtgcc 240

actccagaaa actttgaagc taacaatggt aacaaggaac cacacagagg ttttggtcac 300

atctgtttct ccgtttctga tttggaaaag acctgtgaaa aattggaagg taacggtgtc 360

ggtttccaaa agagattgac cgatggtaga caaaagaaca ttgcctttgc tttggaccca 420

gacggttact ggattgaatt gatcagaaac ggtaacgaag gtgctgaatc tccagaaacc 480

tgtaccacca gattcaacca ctccatgatc agagttaagg acaaggacgc tgctttggat 540

ttctacacca acaaattggg tatgactttg gttgacacct ctgacttccc agaagccaag 600

ttcactttat tcttcttgtc tttcgaccca acttccgtca aggaaagatc cagaggtggt 660

actgaaggtt taatcgaatt gacctacaac tacggttctg aacaagatgt caacttgcac 720

taccacaacg gtaacactga cccacaaggt ttcggtcact tcggtgtcac cgttccagat 780

gctaaggctt tcttgtccga attggaatcc aagggtgtcc gtgtcaccaa gcaattgact 840

gaaggtaaga tgaaattcat gggtttcgtt tctgacccag atggttactt gattgaagtt 900

ttgcctcaaa gagatttccc aaaggactta ttctctccat cgctctaa 948

<210> 37

<211> 1017

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..1017

<223> /生物体="人工序列"

/注释="GLO1 K. lactis密码子对优化序列"

/分子类型="未指定DNA"

<400> 37

atgttcaagg aaagattatt gaacatcttg aagcacatca gaccaatgtc tactgaaacc 60

accgccaagt actacccaaa gattgtcgaa tctgctcaag ctgaccaatc tttgaaatta 120

aaccatacct gtttcagagt caaggatcca aaggttaccg ttgctttcta ccaagaacaa 180

tttggtatga aattgttgga ccacaagaag ttcccagaca tgaagttcga cttgtacttc 240

ttgtctttcc caaacaagca attctccaac aactctcaag gtgccattga tgttttcaga 300

gaaaacggta tcttggaatt gacccacaac tacggtactg aatctgaccc agcttacaag 360

gtcaacaacg gtaacgaaga accacaccgt ggtttcggtc acatctgttt ctccgtttcc 420

aacttggaag ctgaatgtga aagattggaa tccaacggtg tcaagttcaa gaagagattg 480

accgatggtt ctcaaagaaa cattgctttc gctttggacc caaacggtta ctggattgaa 540

ttgatccaaa acaacgaatc tggtgaaggt aacaactaca aattcaacca caccatggtt 600

cgtgttaagg acccaatcaa atctttggaa ttctaccaaa acgtcttggg tatgaagatc 660

ttggatgtct ctgaccattc caatgctaag ttcactttat acttcttggg ttacgaaaat 720

gaccaaaagg gtattgccag aggttccaga gaatccatct tagaattgac tcacaactgg 780

ggtactgaaa acgacccaga ttttgcttac cacaccggta acactgaacc tcaaggttac 840

ggtcacattt gtatctctaa caaagaccca gctactctat gtgctgaaat tgaaaagttg 900

tacccagata tccaatggtc cccaaagttc aaccaaggta agatgaagaa cttggccttt 960

atcaaggacc cagatggtta ctctattgaa gttgttccat acggtttagg ggtgtaa 1017

<210> 38

<211> 1044

<212> DNA

<213> 人工序列

<220>

<221> 来源

<222> 1..1044

<223> /生物体="人工序列"

/注释="GLO1 Z. rouxii密码子对优化序列"

/分子类型="未指定DNA"

<400> 38

atgttctccc gtgttttctc cagattaggt ttgatcaagc aacacatcag aaccatgtcc 60

accaagactt ctgaagccca atactacacc aagaagattg cttctgctgt cggtgaccca 120

tctttgcgtt tcaaccacac ctgtttgaga atcaaggacc catctgcttc cgtcgaattc 180

tacaagaagc acttcaacat gactttgttg tccaagaagg acttcccaga catgaaattc 240

tctctatact ttttggttat gaccaaggaa aacttgccaa agaacgaaaa gggtgaaaac 300

ttggtttttg ctaacagagg tatcttggaa ttaacccaca actggggcac tgaagctgac 360

ccagaataca aggtcaacaa tggtaacgtt gaacctcaca gaggtttcgg tcacatttgt 420

ttctctgttg ctaacgtcga atccacttgt caaagattgg aatctgaagg tgttaagttc 480

caaaagagat tagtcgatgg tagacaaaag aacattgcct ttgctttgga cccagatggt 540

tactggatcg aattgattca atacatcaac gaatctggtg aaggtccaaa gaccgatttg 600

ggtaacagat tcaaccatac catggttaga gtcaaggatc cagttaagtc tttggaattc 660

taccaaaatg tcttaggtat gactttgcac agagtttctg aacacgctaa cgccaaattc 720

actttgtact tcttgggtta cgatatccca caaggtgact ctactggttc tgctgaaact 780

ttgttggaat tgacccataa ctggggtact gaaaacgacc cagatttcca ctaccacaac 840

ggtaacgccc aaccacaagg ttacggtcac atctgtatca cctgtaagga cccaggtgct 900

ttgtgtgaag aaattgaaaa gaaatacaac gaacaagttg tctggtcccc aaaatggaac 960

cacggtaaga tgaagaactt ggctttcatc aaagatccag acggttactc cattgaaatt 1020

gttccagctg aattggtctt ataa 1044

相关技术
  • 具有改善的戊糖转化的细胞
  • 具有改善的戊糖转化的细胞
技术分类

06120112180143