掌桥专利:专业的专利平台
掌桥专利
首页

重组酵母细胞

文献发布时间:2023-06-19 11:39:06



本申请要求于2018年11月19日提交的美国申请第62/769,169号的优先权权益,所述美国申请的内容通过引用整体并入本文。

本申请包含根据“按照专利合作条约(PCT)在国际专利申请中呈现核苷酸和氨基酸序列表的标准(Standard for the Presentation of Nucleotide and Amino AcidSequence Listings in International Patent Applications Under the PatentCooperation Treaty(PCT))”ST.25以ASC II文本(.txt)文件呈计算机可读形式(CRF)的核苷酸和氨基酸序列表。序列表在以下鉴别出,并且以全文引用的方式并且出于所有目的并入本申请的本说明书中。

技术领域

本发明涉及用于高产率蛋白质表达的重组酵母细胞。本发明进一步涉及关于所述重组酵母细胞的细胞培养、关于培养所述重组酵母细胞的蛋白质制备方法以及所述重组酵母细胞的用途。

背景技术

法夫驹形氏酵母(Komagataella phaffii)(以前被称为巴斯德毕赤酵母(Pichiapastoris))是一种易于操作和培养的单细胞微生物。法夫驹形氏酵母是一种真核生物,其能够进行由高级真核细胞进行的许多翻译后修饰,如蛋白水解加工、折叠、二硫键形成和糖基化。因此,相比于无法像真核细胞那样进行翻译后修饰的细菌系统,优选法夫驹形氏酵母系统作为表达宿主细胞。进一步地,在细菌系统中,如果蛋白质在无活性的包涵体中产生,则蛋白质可能会丢失。已经证明,与许多细菌系统相比,法夫驹形氏酵母系统可提供更高的蛋白质表达水平。因此,可以将需要翻译后修饰的外来蛋白质产生为法夫驹形氏酵母中的生物活性分子,并且法夫驹形氏酵母已被用于产生多种重组蛋白。

现有技术中公开的表达菌株包含CBS7435(Küberl等人(2011)《生物技术杂志(JBiotechnol)》154:312-320;)、GS115(DeSchutter等人(2009)《自然生物技术(NatBiotechnol)》27:561-566)和DSMZ 70382(Mattanovich等人(2009)《微生物细胞工厂(Microb Cell Factories)》8:29)。

尽管如此,仍需要优化的重组酵母细胞以允许高产率的蛋白质表达和有效的蛋白质回收。

发明内容

本发明人已经开发了一种重组酵母细胞,由于启动子和前导肽的特定组合,所述重组酵母细胞能够实现高产率的蛋白质表达。

具体地说,本发明涉及一种包括至少第一表达盒的重组酵母细胞,所述第一表达盒包括

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的核酸序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

所述重组酵母细胞可以进一步包括第二表达盒,所述第二表达盒包括

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的核酸序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码所述重组蛋白的核酸序列。

所述重组酵母细胞可能缺乏至少一个标志物基因,并且可以包括编码所述标志物的重组核酸序列。

在一个实施例中,所述标志物基因是营养缺陷型标志物基因,其可以选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。

在一个实施例中,所述标志物基因是抗生素抗性标志物基因,其可以选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。

所述重组酵母细胞可能缺乏第一标志物基因和第二标志物基因,并且可以包括编码所述第一标志物的重组核酸序列和编码所述第二标志物的重组核酸序列。

在一个实施例中,所述第一表达盒和任选的所述第二表达盒被稳定整合到所述酵母细胞的基因组中。

所述第一标志物基因和所述第二标志物基因可以独立的选自营养缺陷型标志物基因,所述营养缺陷型标志物基因可以独立地选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。

所述第一标志物基因和所述第二标志物基因可以独立的选自抗生素抗性标志物基因,所述抗生素抗性标志物基因可以独立地选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。

第一营养缺陷型标志物基因可以是his4,而第二营养缺陷型标志物基因可以是ura3。

在一个实施例中,ura3的缺乏是由于部分或全部ura3基因的缺失。

在一个实施例中,编码所述第一营养缺陷型标志物的核酸序列选自由以下组成的组:

(a)根据SEQ ID No:25所述的核酸序列;

(b)与根据SEQ ID No:25所述的核酸序列具有至少65%同一性的核酸序列;

(c)编码根据SEQ ID No:27所述的多肽的核酸序列;以及

(d)编码与根据SEQ ID No:27所述的多肽具有至少80%同一性的多肽的核酸序列;和/或

其中编码所述第二营养缺陷型标志物的核酸序列选自由以下组成的组:

(a)根据SEQ ID No:26所述的核酸序列;

(b)与根据SEQ ID No:26所述的核酸序列具有至少65%同一性的序列;

(c)编码根据SEQ ID No:28所述的多肽的核酸序列;以及

(d)编码与根据SEQ ID No:28所述的多肽具有至少80%同一性的多肽的核酸序列。

所述重组蛋白可以是酶、肽、抗体或其抗原结合片段、蛋白质抗生素、融合蛋白、疫苗或疫苗样蛋白质或颗粒、生长因子、激素或细胞因子,并且所述酶可以是脂肪酶、蛋白酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、木聚糖酶、甘露聚糖酶、葡聚糖酶、纤维素酶或植酸酶。

在一个实施例中,所述脂肪酶选自:

(a)具有根据SEQ ID No:23所述的氨基酸序列的脂肪酶;

(b)具有与根据SEQ ID No:23所述的氨基酸序列具有至少80%序列同一性的氨基酸序列的脂肪酶;

(c)在对应于SEQ ID NO:23的位置23、33、82、83、84、85、160、199、254、255、256、258、263、264、265、268、308或311的位置上具有一个或多个氨基酸取代的脂肪酶;

(d)由根据SEQ ID No:24所述的核酸序列编码的脂肪酶;以及

(e)由编码与根据SEQ ID No:23所述的多肽序列具有至少80%序列同一性的脂肪酶的任何核酸序列编码的脂肪酶。

所述酵母细胞可以来自甲基营养型酵母物种,或者可以是法夫驹形氏酵母细胞。

本发明进一步涉及一种包括本文所述的重组酵母细胞的培养物。

本发明进一步涉及一种用于产生重组蛋白的方法,所述方法包括以下步骤:

(a)在合适的培养基中培养如本文所述的重组酵母细胞;以及

(b)获得所述重组蛋白。

本发明进一步涉及如本文所述的重组酵母细胞用于产生重组蛋白的用途。

附图说明

图1)具有法夫驹形氏酵母表达盒的表达载体,所述表达盒包括启动子、信号肽、所关注的基因(GOI)和终止子。

图2)在发酵条件下,在用不同法夫驹形氏酵母表达盒(1-4)转化的菌株中表达了各种脂肪酶。菌株1和菌株2在甲醇诱导条件下生长,而菌株3和菌株4在无甲醇条件下生长。示出了来自最终发酵液的上清液中的蛋白质染色凝胶。

在菌株1中,表1所示的脂肪酶LIP062在根据SEQ ID No:8所述的启动子的控制下表达,并与根据SEQ ID No:14所述的信号序列融合。

在菌株2中,表1所示的脂肪酶LIP167在根据SEQ ID No:8所述的启动子的控制下表达,并与根据SEQ ID No:15所述的信号序列融合。

在菌株3中,表1所示的脂肪酶LIP134在根据SEQ ID No:1所述的启动子的控制下表达,并与根据SEQ ID No:10所述的信号序列融合。

在菌株4中,表1所示的脂肪酶LIP173在根据SEQ ID No:1所述的启动子的控制下表达,并与根据SEQ ID No:10所述的信号序列融合。

具体实施方式

尽管将针对特定实施例描述本发明,但是该描述不应被理解为限制性的。

在详细描述本发明的示例性实施例之前,给出对于理解本发明而言重要的定义。除非另有说明或从定义的性质显而易见,否则这些定义适用于本文所述的所有方法和用途。

如在本说明书和所附权利要求书中所使用的,单数形式的“一个/种(a/an)”也包含各自的复数,除非上下文另外明确指出。在本发明的上下文中,术语“约(about)”和“大约(approximately)”表示本领域技术人员将理解以仍然确保所讨论特征的技术效果的精度范围。该术语通常表示与所指示的数值的偏差为±20%,优选地为±15%,更优选地为±10%,并且甚至更优选地为±5%。

应当理解,术语“包括”不是限制性的。出于本发明的目的,术语“由...组成”被认为是术语“包括”的优选实施例。如果在下文中组被定义为包括至少一定数量的实施例,则这意味着还涵盖优选地仅由这些实施例组成的组。

此外,说明书和权利要求书中的术语“第一”、“第二”、“第三”或“(a)”“(b)”“(c)”“(d)”等用于区分相似要素,而不一定用于描述顺序或时间次序。应该理解的是,如此使用的术语在适当情况下是可互换的,并且本文描述的本发明的实施例能够以不同于本文描述或说明的其它顺序操作。在术语“第一”、“第二”、“第三”或“(a)”“(b)”“(c)”“(d)”、“i”、“ii”等涉及方法或用途或测定的步骤的情况下,步骤之间不存在时间或时间间隔的连贯性,即,这些步骤可以同时执行,或者在这些步骤之间可能存在几秒钟、几分钟、几小时、几天、几周、几个月甚至几年的时间间隔,除非在上文或下文中提出的申请中另有说明。

应当理解,本发明不限于本文描述的特定方法、方案、试剂等,因为这些可以变化。还应理解,本文所使用的术语仅出于描述特定实施例的目的,并不旨在限制本发明的范围,本发明的范围仅由所附权利要求书限制。除非另外定义,否则本文所使用的所有技术术语和科学术语具有与本领域普通技术人员通常所理解的含义相同的含义。

术语“酵母细胞”具有其典型含义。合适的酵母细胞可以选自由以下组成的属组:毕赤酵母属(Pichia)、假丝酵母属(Candida)、球拟酵母属(Torulopsis)、阿克氏酵母属(Arxula)、汉逊酵母属(Hansenula)、汉逊酵母属(Ogatea)、耶氏酵母属(Yarrowia)、克鲁维酵母属(Kluyveromyces)、酿酒酵母属(Saccharomyces)和驹形氏酵母属(Komagataella)。优选地,酵母细胞来自驹形氏酵母属。

在一个实施例中,酵母细胞是甲基营养型酵母细胞。如本文所使用的,术语“甲基营养型酵母”包含但不限于例如可以使用还原的一碳化合物(如甲醇或甲烷)以及不具有碳键的多碳化合物(如二甲基醚和二甲胺)的酵母物种。例如,这些物种可以使用甲醇作为细胞生长的唯一碳源和能量源。不受限制地,甲基营养型酵母物种可以包含例如甲烷八叠球菌属(Methanoscacina)、荚膜甲基球菌(Methylococcus capsulatus)、多形汉逊酵母(Hansenula polymorpha)、博伊丁假丝酵母(Candida boidinii)、巴斯德驹形氏酵母(Komagataella pastoris)和法夫驹形氏酵母(Komagataella phaffii)。优选地,宿主细胞是法夫驹形氏酵母细胞。

如本文所使用的,术语“重组酵母细胞”是指酵母细胞含有至少一种核酸序列,其不天然存在于细胞中或天然存在于酵母细胞中,但与在酵母细胞中未天然连接的序列相连,如与编码蛋白质的核酸序列未天然连接的启动子。在本发明的上下文中,重组酵母细胞与天然存在的酵母细胞的不同之处在于,其含有至少一个在天然存在的细胞中不存在的表达盒。

已经用至少第一表达盒转化了本发明的重组酵母细胞,即通过转化过程将第一表达盒引入了酵母细胞。重组宿主细胞中至少第一表达盒的存在可以通过用如PCR或Southern Blot等方法检测启动子的核酸序列的存在来检测。另外或可替代地,可以通过用如蛋白质印迹或免疫荧光等方法检测前导肽或重组蛋白的表达来检测重组宿主细胞中至少第一第二表达盒的存在。

在一个实施例中,用至少第一表达盒转化的酵母细胞缺乏至少一种营养缺陷型标志物。在这种情况下,第一表达盒可以包括编码所述营养缺陷型标志物的核酸序列。可以使用所述营养缺陷型标志物选择重组酵母细胞。

用于转化酵母细胞(具体地说,法夫驹形氏酵母细胞)的合适方法是技术人员已知的,并描述于以下文献中:例如,《毕赤酵母方案(Pichia Protocols)》,第2版,2007,编者:James M.Cregg,ISBN:978-1-58829-429-6。

表达盒通常存在于表达载体中,除表达盒外,所述表达载体还包括使其能够在细菌细胞中进行繁殖和选择的另外的元件,如在细菌细胞中起作用的复制起点和在细菌中起作用的抗生素抗性基因,从而选择转化的细菌。在转化之前,可以用合适的限制酶切割表达载体,以释放表达盒,从而将其转化到酵母细胞中。

在一个实施例中,用第一表达盒和第二表达盒转化重组酵母细胞。第一表达盒和第二表达盒可以分别转化到酵母细胞中。例如,可以将第一表达盒转化到酵母细胞中,并且可以使用第一营养缺陷型标志物来选择转化的细胞,然后将第二表达盒转化到已经用第一表达盒转化的酵母细胞中,并使用第二营养缺陷型标志物选择转化的细胞。

在一个实施例中,在一个转化反应中,将第一表达盒和第二表达盒一起转化到酵母细胞中。在这种情况下,可以同时使用第一营养缺陷型标志物和第二营养缺陷型标志物来选择转化的细胞。

本发明的重组酵母细胞可能缺乏至少第一营养缺陷型标志物基因和任选的第二营养缺陷型标志物基因。缺乏营养缺陷型标志物基因的酵母细胞在编码某种代谢途径所需的酶/因子的基因中具有突变。因此,缺乏某些营养缺陷型标志物基因的酵母细胞不能合成特定的生化产物,因此需要将生化产物补充到生长培养基中。当用包括编码所述营养缺陷型标志物的核酸序列的表达盒转化缺乏一个或多个营养缺陷型标志物基因的酵母细胞时,恢复了在未添加生化产物的培养基中生长的能力。因此,这种营养缺陷型标志物可以用于选择用期望产物转化的酵母细胞。

用于酵母细胞的营养缺陷型标志物基因包含但不限于ura3、his4、ade2、arg4、ade1、ura5、aox1、met2、lys2、pro3和tyr1。

缺乏两个营养缺陷型标志物基因的酵母细胞可以用两个表达盒转化,每个表达盒均包括一个营养缺陷型标志物基因。可以通过筛选在未添加相应生化产品的培养基中生长的细胞来选择转化的细胞。因此,可以选择用两个表达盒转化的酵母细胞。

在一个实施例中,第一营养缺陷型标志物基因是his4。His4缺陷型细胞需要在其生长培养基中存在组氨酸才能生长。因此,用编码His4的核酸序列转化的细胞能够在没有组氨酸的培养基上生长。His4缺陷型法夫驹形氏酵母菌株GS115可从Life Technologies

在一个实施例中,第二营养缺陷型标志物基因是ura3。ura3缺陷型细胞JC254描述于以下文献中:Cregg等人(1998)《分子生物学方法(Methods Mol.Biol.)》103:17-26。ura3缺陷型细胞需要在其生长培养基中存在尿嘧啶或尿苷才能生长。因此,用编码Ura3的核酸序列转化的细胞能够在没有尿嘧啶或尿苷的培养基上生长。ura3缺陷型细胞JC254描述于以下文献中:Cregg等人(1998)《分子生物学方法》103:17-26。

在本发明的上下文中,ura3缺陷型菌株可以是具有部分或全部ura3基因缺失的菌株。

在一个实施例中,重组酵母菌株是缺乏ura3的GS115菌株。优选地,重组酵母菌株是具有部分ura3基因缺失的GS115菌株。

术语“核酸”、“核酸序列”或“核酸分子”具有其通常的含义,并且可以包含但不限于例如多核苷酸(如脱氧核糖核酸(DNA)或核糖核酸(RNA))、寡核苷酸、通过聚合酶链反应(PCR)生成的片段以及通过连接、切割、核酸内切酶作用和核酸外切酶作用中的任何一种生成的片段。糖修饰包含例如用卤素、烷基、胺和叠氮基代替一个或多个羟基,或者糖可以被官能化为醚或酯。此外,整个糖部分可以被空间上和电子上相似的结构代替,如氮杂糖和碳环糖类似物。碱基部分的修饰的实例包含烷基化的嘌呤和嘧啶、酰化的嘌呤或嘧啶或其它众所周知的杂环取代基。核酸单体可以通过磷酸二酯键或此类连接的类似物连接。磷酸二酯键的类似物包含硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、硫代苯胺磷酸酯、苯胺磷酸酯、氨基磷酸酯等。核酸可以是单链或双链的。

术语“分离的核酸分子”是指已经与其天然缔合的环境(如基因组)分离的核酸分子。

本发明中使用的核酸序列进一步涵盖密码子优化的序列。通过系统地改变重组DNA中的密码子来优化核酸,以使其在不同于分离核酸的细胞的宿主细胞中表达,使得密码子与用于表达的生物体中的密码子使用模式相匹配,从而增强被表达的蛋白质的产率。然而,密码子优化的序列编码具有与天然蛋白相同的氨基酸序列的蛋白。

如本文所使用的,术语“编码(coding for)或(encoding)”具有其通常的含义,并且可以包含但不限于例如多核苷酸(如基因、cDNA或mRNA)中的核苷酸特定序列的性质,以用作合成其它大分子(如确定的氨基酸序列)的模板。因此,如果对应于基因的mRNA的转录和翻译在细胞或其它生物系统中产生蛋白质,则该基因编码该蛋白质。

如本文所使用的,术语“前导肽”是指指导蛋白质分泌的肽。从细胞分泌的蛋白质的前导肽位于蛋白质的N端,一旦新生蛋白质链跨过粗糙的内质网开始输出,该前导肽就会从成熟的蛋白质上被切割下来。前导肽使被表达的蛋白质能够运输到质膜或穿过质膜,从而易于分离和纯化被表达的蛋白质。通常,在蛋白质被转运到质膜上或穿过质膜后,前导肽通过专门的细胞肽酶从蛋白质上被切割下来。

在一个实施例中,前导肽包括SEQ ID No:9到15中任一个所示的氨基酸序列。在一个实施例中,前导肽是根据SEQ ID No:9到15中任一个所述的前导肽的功能变体。如果变体前导肽与蛋白质的融合导致重组宿主细胞将所述蛋白质分泌到上清液中(与未修饰的前导肽与所述蛋白质的融合基本上相同),则前导肽的功能变体与未修饰的序列具有基本上相同的前导活性。基本上相同的分泌是指表达前导肽的功能变体的宿主细胞的上清液中蛋白质的量是表达未修饰的前导肽的宿主细胞的上清液中蛋白质的量的至少50%或60%,优选地,至少70%或75%,更优选地,至少80%或85%,并且最优选地,至少90%、92%、95%或98%。在一个实施例中,前导肽包括SEQ ID No:9所示的氨基酸序列。

本发明中使用的前导肽可以由根据SEQ ID No:16到22中任一个所述的核酸序列编码,或由与根据SEQ ID NO:16到22中任一个所述的核酸序列具有至少80%同一性且编码根据SEQ ID NO:9到15中任一个所述的前导肽的功能变体的核酸序列编码。

“序列同一性”、“%序列同一性”、“%同一性”、“%一致性”或“序列比对”是指第一氨基酸序列与第二氨基酸序列的比较或第一核酸序列与第二核酸序列的比较,并基于该比较计算为百分比。这一计算结果可以描述为“一致百分比”或“ID百分比”。

通常,序列比对可用于通过两种不同方法之一来计算序列同一性。在第一种方法中,在最终序列同一性计算中,将单个位置的不匹配项和单个位置的空位均计为不一致位置。在第二种方法中,在最终序列同一性计算中,将单个位置的不匹配项计为不一致位置;然而,在最终序列同一性计算中,单个位置的空位不计为(忽略)不一致位置。换句话说,在第二种方法中,在最终序列同一性计算中忽略空位。这两种方法之间的差异(即,将空位计为不一致位置而不是忽略空位)可能会导致两个序列之间的序列同一性值发生变化。

序列同一性由程序确定,所述程序产生比对,并且在最终序列同一性计算中将单个位置的不匹配项和单个位置的空位均计为不一致位置,从而计算同一性。例如程序Needle(EMBOS),所述程序已实现Needleman和Wunsch的算法(Needleman和Wunsch,1970,《分子生物学杂志(J.Mol.Biol.)》48:443-453),并且所述程序如下根据默认设置计算序列同一性:首先在第一个序列和第二个序列之间产生比对,然后计算比对长度上相同位置的数目,然后将相同残基的数目除以比对长度,然后将该数目乘以100来生成序列同一性百分比[序列同一性百分比=(相同残基数/比对长度)x 100)]。

可以根据成对的比对计算出序列同一性,所述成对的比对显示全长上的两个序列,因此显示出其全长上的第一序列和第二序列(“全局序列同一性”)。举例来说,程序Needle(EMBOSS)产生这样的比对;序列同一性百分比=(相同残基数/比对长度)x 100)]。

可以根据仅显示第一序列或第二序列的局部区域的成对的比对计算序列同一性(“局部同一性”)。举例来说,程序Blast(NCBI)产生这样的比对;序列同一性百分比=(相同残基数/比对长度)x 100)]。

优选地通过使用Needleman和Wunsch的算法(《分子生物学杂志》(1979)48,第443-453页)产生序列比对。优选地,将程序“NEEDLE”(欧洲分子生物学开放软件套件(EMBOSS))与程序的默认参数一起使用(空位开放=10.0,空位延伸=0.5,对于蛋白质,矩阵=EBLOSUM62,而对于核苷酸,矩阵=EDNAFULL)。然后,可以根据比对计算出序列同一性,所述比对显示全长上的两个序列,因此显示出其全长上的第一序列和第二序列(“全局序列同一性”)。举例来说:序列同一性百分比=(相同残基数/比对长度)x 100)]。

如本文所使用的,“变体核酸序列”是指与各个亲本序列的核酸序列具有至少n%同一性的核酸序列,其中“n”是介于80和100之间的整数。变体核酸序列包含与亲本核酸序列的全长序列相比具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。变体核酸序列编码具有与亲本核酸序列编码的蛋白质基本上相同的活性的蛋白质。

如本文所使用的,“变体氨基酸序列”是指与各个亲本序列的氨基酸序列具有至少n%同一性的氨基酸序列,其中“n”是介于80和100之间的整数。变体氨基酸序列包含与亲本氨基酸序列的全长序列相比具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。具有变体氨基酸序列的蛋白质具有与亲本氨基酸序列基本上相同的活性。

术语“表达盒”是指含有蛋白质的编码序列和控制序列(如例如可操作连接的启动子)的核酸分子,使得用这些序列转化或转染的宿主细胞能够产生被编码的蛋白质。表达盒可以进一步包括编码标志物(如营养缺陷型标志物)的核酸序列。表达盒可以是载体的一部分或可以整合到宿主细胞染色体中。

表达盒可以进一步含有与编码蛋白质的核酸序列可操作地连接的合适的终止子序列。合适的终止子序列包含但不限于AOX1(醇氧化酶)终止子、CYC1(细胞色素c)终止子和TEF(翻译延伸因子)终止子。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9所述的氨基酸序列或与根据SEQ ID No:9所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:11所述的氨基酸序列或与根据SEQ ID No:11所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:12所述的氨基酸序列或与根据SEQ ID No:12所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:13所述的氨基酸序列或与根据SEQ ID No:13所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:5所述的核酸序列或与根据SEQ IDNo:5中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:7所述的核酸序列或与根据SEQ IDNo:7中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码重组蛋白的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85T和D265S和T268G。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和D265T。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和D265A。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I254L和D265T。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。

在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:

(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至

(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及

(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。

在一个实施例中,重组酵母细胞包括第一表达盒和第二表达盒。在一个实施例中,第一表达盒和第二表达盒编码相同的重组蛋白,即,由第一表达盒编码的重组蛋白与由第二表达盒编码的重组蛋白相同。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第一营养缺陷型标志物的核酸序列。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码HIS4的核酸序列。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列。

在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列。

在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列。

在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第二营养缺陷型标志物的核酸序列。

在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码URA3的核酸序列。

在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。

在一个实施例中,第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。

在一个实施例中,第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第一营养缺陷型标志物的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第二营养缺陷型标志物的核酸序列。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码HIS4的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码URA3的核酸序列。

在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。

在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列,并且第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。

在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列,并且第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。

在本发明的酵母细胞中表达的重组蛋白可以是任何蛋白质,如任何真核、原核和合成蛋白质。该蛋白质可以与宿主细胞同源,即其可以由宿主细胞天然表达,或者可以与宿主细胞异源,即其可以不由宿主细胞天然表达。该蛋白质可以包含但不限于酶、肽、抗体及其抗原结合片段和重组蛋白。市场上已存在的通过在法夫驹形氏酵母中异源表达而获得的蛋白质包含植酸酶、胰蛋白酶、硝酸还原酶、磷脂酶C、胶原蛋白、蛋白酶K、艾卡拉肽(ecallantide)、奥克纤溶酶(ocriplasmin)、人胰岛素、菌丝霉素肽衍生物NZ2114、弹性蛋白酶抑制剂、重组细胞因子和生长因子、人胱抑素C、HB-EGF、干扰素-α2b、人血清白蛋白和人血管抑素。

在一个实施例中,重组蛋白是酶。该酶可以选自由以下组成的组:脂肪酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、葡聚糖酶、纤维素酶、甘露聚糖酶和植酸酶。

在一个实施例中,由第一表达盒和第二表达盒编码的重组蛋白是脂肪酶。脂肪酶可以具有与SEQ ID No:23的氨基酸序列具有至少80%序列同一性的氨基酸序列。在一个实施例中,脂肪酶具有根据SEQ ID No:23所述的氨基酸序列。脂肪酶由与SEQ ID No:24的核酸序列具有至少80%序列同一性的核酸序列编码。在一个实施例中,脂肪酶由根据SEQ IDNo:24所述的核酸序列编码。具有与SEQ ID No:23的氨基酸序列具有至少80%同一性的氨基酸序列或由与SEQ ID No:24的核酸序列具有至少80%同一性的核酸序列编码的蛋白质具有脂肪酶活性。术语“脂肪酶活性”是指蛋白质可以切割脂质中的酯键。通过将蛋白质与合适的脂肪酶底物(如PNP-辛酸酯、1-油精、半乳糖脂、磷脂酰胆碱和三酰基甘油)一起孵育并确定相对于对照脂肪酶的脂肪酶活性,可以确定蛋白质的脂肪酶活性。

在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括一个或多个氨基酸插入、缺失或取代。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,氨基酸插入、缺失或取代位于选自氨基酸残基23、33、82、83、84、85、160、199、254、255、256、258、263、264、265、268、308和311的氨基酸残基处。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,氨基酸取代选自由以下组成的组:Y23A、K33N、S82T、S83D、S83H、S83I、S83N、S83R、S83T、S83Y、S84S、S84N、I85A、I85C、I85F、I85H、I85L、I85M、I85P、I85S、I85T、I85V、I85Y、K160N、P199I、P199V、I254A、I254C、I254E、I254F、I254G、I254L、I254M、I254N、I254R、I254S、I2454V、I254W、I254Y、I255A、I255L、A256D、L258A、L258D;L258E、L258G、L258H、L258N、L258Q、L258R、L258S、L258T、L258V、D263G、D263K、D263P、D263R、D263S;T264A、T264D、T264G、T264I、T264L、T264N、T264S、D265A、D265G、D265K、D265L、D265N、D265S、D265T、T268A、T268G、T268K、T268L、T268N、T268S、D308A和Y311E。在一个实施例中,与SEQID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和T268G。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:I255A和D265S。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I254L和D265T。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和D265T。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和D265A。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:I255A。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85T和D265S和T268G。

下表1中示出了与根据SEQ ID No:23所述的序列相比具有一个或多个氨基酸取代或插入的另外的合适的脂肪酶,其中LIP062是指根据SEQ ID No:23所述的脂肪酶。

表:1

表:1

表:1

表:1

表:1

表:1

表:1

表:1

如本文所使用的,术语“启动子”是指指导结构基因转录的核苷酸序列。在一些实施例中,启动子位于基因的5'非编码区中,最接近结构基因的转录起始位点。在启动转录中起作用的启动子内的序列元件也可以通过共有核苷酸序列来表征。这些启动子元件包含RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSE;McGehee等人,《分子内分泌学(Mol.Endocrinol.)》7:551(1993))、环状AMP反应元件(CRE)、血清反应元件(SRE;Treisman,《癌症生物学研讨会(Seminars in Cancer Biol.)》1:47(1990))、糖皮质激素应答元件(GRE)和其它转录因子的结合位点,如CRE/ATF(O'Reilly等人,《生物化学杂志(J.Biol.Chem.)》267:19938(1992))、AP2(Ye等人,《生物化学杂志》269:25728(1994))、SP1、cAMP反应元件结合蛋白(CREB;Loeken,《基因表达(Gene Expr.)》3:253(1993))和八聚体因子(一般参见,编者:Watson等人,《基因的分子生物学(Molecular Biology of theGene)》,第4版(本杰明/卡明斯出版公司(The Benjamin/Cummings Publishing Company,Inc.)1987;)以及Lemaigre和Rousseau,《生物化学杂志(Biochem.J.)》303:1(1994))。

在本发明的上下文中,在第一表达盒和任选的第二表达盒中用于表达重组蛋白的启动子序列包括选自由以下组成的组的核酸序列:SEQ ID No:1-8(pSD001(SEQ ID No:1)、pSD002(SEQ ID No:2)、pSD003(SEQ ID No:3)、pSD004(SEQ ID No:4)、pSD005(SEQ ID No:5)、pSD007(SEQ ID No:6)、pSD008(SEQ ID No:7)和AOX(SEQ ID No:8)。

在一个实施例中,启动子包括与SEQ ID No:1-7中任一个或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。在一些实施例中,序列同一性在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上。在一些实施例中,SEQ ID No:1-7中任一个的片段在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上,并在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。

在一个实施例中,启动子包括根据SEQ ID No:1-7中任一个所述的核酸序列的功能片段。功能片段包括根据SEQ ID No:1-7中任一个所述的序列中的任何序列的至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个或1150个连续核苷酸。术语“功能”旨在表示该启动子可用于独立于甲醇来驱动蛋白质表达,其中该启动子在无甲醇的培养基中驱动蛋白质表达。

在一些实施方案中,启动子是可用于独立于甲醇来驱动蛋白质表达的启动子,其中该启动子驱动无甲醇的培养基中的蛋白质表达。这意味着该启动子在不存在甲醇的情况下是有活性的。表述“在不存在甲醇的情况下是有活性的启动子”在本文中可以与“启动子独立于甲醇来驱动蛋白质表达”和“在不存在甲醇的情况下允许蛋白质表达增加的启动子”互换使用。

在一个实施例中,启动子序列包括根据SEQ ID No:1所述的核酸序列。在一个实施例中,启动子包括与SEQ ID No:1或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并且所述启动子在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。

在一个实施例中,启动子包括与SEQ ID No:8或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并在存在甲醇的情况下驱动酵母细胞中的蛋白质表达。在一些实施例中,序列同一性在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上。在一些实施例中,SEQ ID No:8的片段在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上,并在存在甲醇的情况下驱动酵母细胞中的蛋白质表达。

启动子可以可操作地连接至编码前导肽的核酸分子和编码重组蛋白的核酸分子,使得启动子能够影响前导肽和重组蛋白的表达。

在一个实施例中,彼此可操作地连接的核酸序列被立即连接,即在启动子与编码蛋白质和前导肽的核酸序列之间没有另外的元件或核酸序列。

在一个实施例中,第一表达盒包括编码第一营养缺陷标志物HIS4(组蛋白醇脱氢酶)的核酸序列。在一个实施例中,编码HIS4的核酸序列来自酿酒酵母。在一个实施例中,编码HIS4的核酸序列是根据SEQ ID No:25所述的核酸序列或其功能变体,所述功能变体与根据SEQ ID No:25所述的核酸序列具有至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一个实施例中,核酸序列编码与根据SEQ ID No:27所述的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的多肽。根据SEQ ID No:25所述的核酸序列的功能变体编码具有组蛋白醇脱氢酶活性的蛋白质。因此,功能变体能够补充酵母细胞的his4缺陷表型,并允许酵母细胞在不包括组氨酸的培养基上生长。

在一个实施例中,第二表达盒包括编码第二营养缺陷标志物URA3(乳清酸核苷5'磷酸脱羧酶)的核酸序列。在一个实施例中,编码URA3的核酸序列来自酿酒酵母。在一个实施例中,编码URA3的核酸序列是根据SEQ ID No:26所述的核酸序列或其功能变体,所述功能变体与根据SEQ ID No:26所述的核酸序列具有至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一个实施例中,核酸序列编码与根据SEQ ID No:28所述的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的多肽。根据SEQ ID No:26所述的核酸序列的功能变体编码具有乳清酸核苷5'磷酸脱羧酶活性的蛋白质。因此,功能变体能够补充酵母细胞的ura3缺陷表型,并允许酵母细胞在不包括尿嘧啶或尿苷的培养基上生长。

第一表达盒和任选的第二表达盒被稳定地整合到酵母细胞(优选地,法夫驹形氏酵母细胞)的基因组中。这意味着第一表达盒和任选的第二表达盒与酵母细胞的基因组一起复制,并且在细胞分裂过程中不会丢失。

术语“载体”是指在合适的宿主生物体中克隆的重组核苷酸序列(即重组基因)的转录及其mRNA翻译所需的DNA序列。表达载体包括表达盒,并且通常另外地包括宿主细胞或基因组整合位点中自主复制的起点、一个或多个可选择标志物(例如氨基酸合成基因或赋予对抗生素(如博莱霉素、卡那霉素、G418或潮霉素)的抗性的基因)、多个限制酶切割位点、合适的启动子序列和转录终止子,这些组分可操作地连接在一起。

如本文所使用的,术语“载体”包含自主复制性核苷酸序列以及基因组整合性核苷酸序列。载体包含但不限于质粒、小环、酵母整合质粒、附加型质粒、着丝粒质粒、人工染色体和病毒基因组。可用的商业载体是本领域技术人员已知的。商业载体可从例如欧洲分子生物学实验室和Atum获得。

在优选的实施例中,表达载体是适合以每细胞单拷贝或多拷贝整合到宿主细胞基因组中的质粒。编码启动子、重组蛋白和营养缺陷型标志物的核酸序列也可以以每个细胞单拷贝或多拷贝提供在自主复制质粒上。优选的质粒是真核表达载体,优选地,酵母表达载体。表达载体可以是能够在宿主生物体的基因组中复制或整合到宿主生物体的基因组中的任何载体。优选地,载体在酵母细胞(如法夫驹形氏酵母细胞)中有功能。

载体可以通过本领域已知的任何方法产生。例如,连接编码蛋白质的核酸序列并将连接的序列插入合适的载体中的程序是已知的并描述于以下文献中:例如Green和Sambrook(2012)《分子克隆(Molecular Cloning)》,第4版,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press)。

在一个实施例中,提供了一种在本发明的重组酵母细胞中产生重组蛋白的方法。根据所述方法,在获得蛋白质之前,在合适的条件下培养酵母细胞。合适的条件是允许蛋白质表达和分泌的那些条件,并且是本领域技术人员众所周知的。所述条件包含以分批模式、分批进料模式和连续模式进行培养。

可以以工业规模培养宿主细胞,所述工业规模可以采用至少10升(优选地,至少50升,最优选地,至少100升)的培养基体积。

可以在生长条件下培养宿主细胞以获得至少1g/L细胞干重(更优选地,至少10g/L细胞干重,优选地,至少20g/L细胞干重)的细胞密度。

用于细胞培养的营养发酵液可以包括至少一种碳源。在一些实施例中,至少一种碳源选自由以下组成的组:右旋糖、麦芽糖、葡萄糖、糊精、甘油、山梨糖醇、甘露糖醇、乳酸、乙酸盐、木糖或其它部分水解的淀粉及其任何混合物。在一些实施例中,至少一种碳源的浓度为0.0g/l、0.5g/L、1g/L、2g/L、4g/L、6g/L、8g/L、10g/L、11g/L、12g/L、13g/L、14g/L、15g/L、16g/L、18g/L、20g/L、22g/L、24g/L、26g/L、28g/L、30g/L、35g/L、40g/L、45g/L、50g/L、55g/L或60g/L(由上述任何两个值定义的范围内的任何浓度)。在一些实施例中,所述方法进一步包括通过脉冲或连续进料添加至少一种碳源。

宿主细胞产生的蛋白质可以通过任何已知的用于分离和纯化蛋白质的工艺获得。这些工艺包含但不限于盐析和溶剂沉淀、超滤、凝胶电泳、离子交换色谱、亲和色谱、反相高效液相色谱、疏水相互作用色谱、混合模式色谱、羟基磷灰石色谱和等电聚焦。

重组酵母细胞上清液中重组蛋白的效价为0.2到15.5g/l或0.5到15.5g/l或1.0到15.5g/l或1.5到15.5g/l或2.0到15.5g/l或2.5到15.5g/l或3.0到15.5g/l或3.5到15.5g/l或4.0到15.5g/l或4.5到15.5g/l或5.0到15.5g/l或5.3到15.5g/l。重组酵母细胞上清液中重组蛋白的效价为0.8g/l到15.5g/l或0.8g/l到15.0g/l或0.8g/l到14.5g/l或0.8g/l到14.0g/l或0.8g/l到13.5g/l或0.8g/l到13.0g/l或0.8g/l到12.5g/l或0.8g/l到12.0g/l或0.8g/l到11.5g/l或0.8g/l到11.0g/l或0.8g/l到10.5g/l或0.8g/l到10.0g/l或0.8g/l到9.5g/l或0.8g/l到9.0g/l或0.8g/l到8.5g/l或0.8g/l到8.0g/l或0.8g/l到7.5g/l或0.8g/l到7.0g/l或0.8g/l到6.5g/l或0.8g/l到6.0g/l。重组酵母细胞上清液中重组蛋白的效价为3.8到5.4g/l或0.9到8.8g/l或1.7到2.5g/l或1.1到11.8g/l或2.8到9.0g/l或3.5到13.7g/l或1.8到2.7g/l或5.3到5.7g/l或3.2到6.1g/l或0.2到3.5g/l或4.4到15.5g/l或0.9到12.8g/l或0.8到5.2g/l或0.6到11.1g/l或1.6到2.5g/l或0.8到1.9g/l或3.1到6.9g/l或2.9到4.9g/l。

在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:

(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及

(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。

在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:

(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组脂肪酶的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及

(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组脂肪酶的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。

在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:

(a)第一表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及

(b)第二表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。

在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:

(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及

(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与启动子可操作地连接的编码重组蛋白的核酸序列,所述核酸序列与根据SEQ ID No:1-8中任一个所述的序列具有至少80%的同一性,和编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与启动子可操作地连接的编码所述重组蛋白的核酸序列,所述核酸序列与根据SEQ ID No:1-8中任一个所述的序列具有至少80%的同一性,和编码URA3的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码脂肪酶的核酸序列和编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码脂肪酶的核酸序列和编码URA3的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。

在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:

(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和根据SEQ IDNo:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列;以及

(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和根据SEQ IDNo:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。

提供以下实例用于说明性目的。因此,应当理解,这些实例不应解释为限制性的。技术人员将显然能够设想对本文提出的原理的进一步修改。

实例

1)毕赤酵母表达载体的构建和筛选方法

将基因部分克隆到pPICz或pAO815表达载体(Invitrogen)中。通过限制性消化使表达载体线性化,并使用凝胶电泳和纯化分离载体主链。通过使用GeneArt Seamless克隆和装配试剂盒(Invitrogen)进行无缝连接或通过使用T4连接酶(ThermoFischer)进行限制性连接将新的DNA部分(如启动子、编码信号肽的核酸序列、重组蛋白或选择标志物)克隆到载体主链中。

将克隆的构建体转化到大肠杆菌克隆宿主中,如One Shot TOP10(Invitrogen)或XL1-blue(Agilent),进行序列验证,然后纯化质粒。通过限制性消化使纯化的表达载体质粒线性化,并通过电穿孔将其转化为法夫驹形氏酵母。通过博莱霉素选择或通过在最小培养基上进行选择,筛选转化体以进行转化。在发酵罐中生长之前,首先在微量滴定板上筛选单个菌落的表达。

2)发酵条件

将表达载体转化到巴斯德毕赤酵母(法夫驹形氏酵母)中,并将所得菌株如下所述生长。

对于脉冲进料葡萄糖的发酵条件,将初始批次的法夫驹形氏酵母细胞用分批培养物接种,pH大于pH 4.0,并且温度在20-35℃之间。每天两次对发酵进行采样,持续140小时,第一次采样是在接种后的24小时。初始批次补充有15g/L的葡萄糖(玉米糖浆)。在初始葡萄糖受DO控制而耗尽后,给予细胞1g/L的葡萄糖脉冲。

对于葡萄糖受限的发酵条件,将初始批次的法夫驹形氏酵母细胞用分批培养物接种,pH大于pH 4.0,并且温度在20-35℃之间。每天两次对发酵进行采样,持续140小时,第一次采样是在接种后的24小时。初始批次补充有15g/L的葡萄糖(玉米糖浆)。初始葡萄糖耗尽后,给予细胞1G/L的葡萄糖脉冲,直至OD600超过200,然后连续补充葡萄糖。

根据本领域已知的方法,用甲醇处理用携带有AOX启动子的表达载体转化的巴斯德毕赤酵母培养物,以诱导基因表达。

3)蛋白质定量

通过将全发酵液与作为底物的对辛酸酯一起在50mM HEPES pH 7.5中于26℃下孵育10分钟,通过脂肪酶活性来测量全发酵液中的脂肪酶蛋白滴度。将全发酵液特异性脂肪酶活性与已经通过氨基酸分析(AAA)定量的脂肪酶金标准进行比较。另外,对蛋白质样品进行SDS PAGE分析。

表2示出了用不同酵母菌株获得的全发酵液滴度:

序列表

<110> 巴斯夫股份公司(BASF SE)

<120> 重组酵母细胞

<130> 180262US01

<160> 26

<170> PatentIn 3.5版

<210> 1

<211> 1501

<212> DNA

<213> 人工

<220>

<223> 启动子pSD001

<400> 1

tccagtgtag cactaaaatc taatatcttc ggctttatac ttttttgttc atccgaaagc 60

ttacgaacaa ttctttctcc tgttttattg tggatataga caatttcgtc agtttcttgg 120

agagaagagt tatttccggt tttggctggc cctataaacg ggttcttgga tttggatcta 180

gtaataaaaa tgtcactgtc attctcggag ctgaactttg tgttgtacga agatgggttg 240

ttccactgtt ttgccagctc ttcattgatg attttcttag tgggtgttct tggaggttca 300

cgttgcctat aatcttgacg ttcttcttca tcactatcga tgccatcaaa attaagcgtc 360

cttattgcag gcttttgtga tttcaactgc aatccttcta tctcttcatc agagctttcg 420

aactgaatac tatcactcaa aactggcgac attgcacatt tccgcaaacc atttcgggaa 480

tctatgctag ctcttctaga cgataaagaa cgaccggaac caatacgggg ttgtgcaggt 540

gggaataaat atgttggttt ggattcttga cgtgaagaag gtattctagt cgatgaagtg 600

gttgataagg atatggcgtc actgagttgt tttcttttcc tatgttgcgg tgttgggtca 660

ggagttaatt gattcacctc cataactctg gaatttcttg aatgtggggt tttcagatgg 720

gcatctttct tgacggggtt gtgagtaacg gaggaacctg gtgtcttggg tgtgaacggt 780

gtttgagcct gtacgcggtt acttctgggc ggagtactcg gagtcatgag agccattgat 840

tagaaggtga atgagggagt caccactcta agcaaacaaa atgaggtcga agcaaaaaat 900

aaagtaaagt agcacttctg gcaggttaga tcaaagagtg acgggagatt tgaagatggc 960

tggtttttcc ttagtcttgg aagaggtttg tgtgggtatc agcgaatatt ccccgattag 1020

gcaaattagt tgcattgaaa ttaacacgac atggtgattt gtggtaacaa atatctattg 1080

gtggttggtg tgtgggtgta atagtggtcg tgtcatgatg atggtgttca ggtgttgtca 1140

tagatcggtc ttcagtaaga gaaggaagct tggtgacgat cacagctatg atgtaataga 1200

aattgctaag caattgtgag gtgtgatgta ttttgcagag caattgtgcg gtacaacggg 1260

gtgttattgt cttcacaagg catttattgc gaatttcgta gttgaaagaa tattttagca 1320

cagggtgctt gacccctatt gttgctcgct aaaccatgat tgctaaatga tgacatagca 1380

atcactttac taagattgct ataaggacac ctttcttagt ataaatggac actcttttcc 1440

cctgctaaac ttcttttatt tttcacactt aaacagttac aaaacacaaa cacaactaga 1500

a 1501

<210> 2

<211> 1501

<212> DNA

<213> 人工

<220>

<223> 启动子pSD002

<400> 2

gtgctaaaat ctgaggttta caagctgtga tgttccccta agatctcaca atcgaacaat 60

cgcgaagcca atgcaagttg tttaagggga aacgactcac tattcctgaa attagtattc 120

aaaacttggt ccggaagaac aatgaggcgg ccgttaaaat actcacgtaa acggtgtcta 180

caagcgcatt aaaatccgtt tgaattcaag caaaagccac cagaggctta tgcttggtta 240

tacccagcat tgacctttgg tatgagcatc tgaaaaacaa ccaggtgttg caaagttaaa 300

catccttctt tgttcatata gaacccacta ttcatggtac tccccaatcg aatttcacat 360

tctggttttg aaattacaca ccacgttagc ttataagatt tcatataact tattgatata 420

cggtttccat tgttcgaata gttgaggttg tatgtaattc gattgaaggg gccatttttg 480

tttcctactt ttcctgggag cttatccgat gcgcttcaaa gctggaattg taaatataga 540

gaaaaagaag gatgttgttt tattcttgaa agagtataat tttacttcta gcaactctcc 600

cacttcgctt gacttcattt atttcttggg cacataggcg tagtaatcta gaccaacaga 660

taatttgccg gaatgatata gcgattggaa aatgaactga aattttttgc tgtctttcaa 720

tttgacgggc agttcatcag tgaccgacca tataaatacg ttgagaatgt tattcttcct 780

cgtagttgaa gtggcttcat aatttcagaa ctcaatagat aaactaggat gttttaaagc 840

aattaatgct cacaagtaag gagcgactct cttgcttttc gaatactaaa agtatcgtcc 900

caacccagaa aaaaagacct cttaactgca aaataaactc tatatatttc ttctaaaaca 960

gtttcaggtt ggatagtatc gcattctcat cacttctaac tagtaggcca tgagatatat 1020

taacgtttac ttgagttcta agttctccga attagatgca cagcacaaac aagattaggt 1080

ttcacttggt acaaaatacg aacagagttt aaggtcgtaa tttcatttcg ttattgatcc 1140

ccacaatcta ttcttatcac agtcatcaga tagtcgcgaa aaagcatgca gaaaaggggg 1200

tcgtccctat ctaagttgta gcattacaac aaatatgact acactcagtg tcgcaatcgg 1260

tatagccaac gctgcaaaat ggattctact gagaatggta tgatgatccc aggatcaatt 1320

tcccaaaaat taaaaaaagt aaaataaaaa gcatcagata ttagggaggt ggtaagattg 1380

ctctgcaagc gatcacgaga ttttaggttt tcctttatgt actatataaa gcgcagattg 1440

gatgccgctt ttccctcctg ggctatgata atatagcgaa cgaaatacac gccaaaataa 1500

a 1501

<210> 3

<211> 1500

<212> DNA

<213> 人工

<220>

<223> 启动子pSD003

<400> 3

tcacattcat agcatctctc gcctgcaata gcttccacga taggaatatc tgtgaaagtg 60

aacatgctat ttcgatgata taagacttta agatctggca tgtttgtgtt ggaggttacc 120

ctggggtcaa taaccctaat tatctccttc actaaaaatg atgaagattc ttcggattcg 180

tttttgaaca gagttaatgc catttcttcg tcaatagaaa aatcaatatc tggtatctca 240

tcttttacat attgaggatt tagttttctt ccctttggat agtacattat gatcaatgta 300

ttcctgtctt tattgataaa gtattggcat tctgcttctt gtacaccttt gaattgtttg 360

tctggaagtg actgacattt ttccacattg ctaacggttt ggcacgaatt acatctaaat 420

aaaatgtctt ctccggattc gtgtattaag tgatactcca atgataaatc cccacctatc 480

gaaccagaat cggcattggc cacagtcaca ggtaacttta ggtcttgaaa aatccttcta 540

taggcttcat tgacattgtc ataagactta agaccatctt ctttggtcaa gtcaaaagaa 600

taggcatctt tcatgagaaa ctctcgtcct ctcaacaaac ctcccctagg tctcaactca 660

tctctatatt tgcgggaaat ttggtacacg agaaggggta aatctttata tgacgaacat 720

aagtcaccaa ctaagtttgt gatttcctct tcacaagttg gcactaaaca gtagtctcta 780

tccttggagt ctttgaactt gaacaattca ttgttgtccc atctcttagt tctctcccat 840

aaatgcttgg aagacaggct acttaattcc atttccagcc caccagcctg atccattctt 900

ttcctaatta cattttgaag ctttttatag gtacggagtc ctaatggaag ccagtgaact 960

attcctgctg caggctggta aataaacctt gattgaagga gcatatcatg agtagtaagg 1020

tcctttacag aaaatagttt acttccttga agagaagtag aataaaacct catgttgggt 1080

ctccatgaaa ggttcaaagg cattgatcct ttaggtactt caggatgttt aagtcatcaa 1140

actgtccatc aaaggtagta tagtatttac catctagata gtgatgtatg ggtgtaacac 1200

aacatttaaa tgttgtaaat taacattagg actgagtccg gagatgctat tgtcacctaa 1260

atctattaga aagcacttca gttatatcat cgatagaggt ttgaagataa acctattgtt 1320

gataaataac cccattaccc gtttacgtag caaggttcaa aaatttgctt agatcggagc 1380

taaaaattcg actgacttct ttcgaaaatg tggattatgc aagcaacgtt gctatcggaa 1440

tagtatataa ggtcgatctg ccccattaca aattgtaaag caacaaacat cctacgcaaa 1500

<210> 4

<211> 1500

<212> DNA

<213> 人工

<220>

<223> pSD004

<400> 4

tcagtttcac ggttatgtga gctgtctccg cgtgaggcag taacctctgt gtcatggata 60

caggctggta cacatttggc agtaggaaca caatctggtt tagttgaaat atgggacgcc 120

acgacgtcca aatgtacaag atcaatgact gggcattcgg cccgaacctc agcgctgagt 180

tggaaccgtc atgttttgag ttctggttca agagatcgca gtatcttaca tcgggatgta 240

cgtgcagcag ctcactatac aagtcgcatt gttgaacacc gccaagaggt ttgtggctta 300

cgttggaacg tggatgaaaa caagctggcc agtggttcca atgataaccg tatgatggta 360

tgggatgcac tgcgtgtaga acagcccctt atgaaagttg aagagcatac tgcggctgtt 420

aaggcgttgg catggtcacc tcatcaacgt ggaatactgg cttcgggtgg aggtactgct 480

gacagacgta tcaaggtgtg gaatacttta acaggatcca agctgcacga tgttgatact 540

ggatctcaag tttgtaatct cttgtggtct cgcaattcta atgaattggt aagtactcat 600

ggatattctc gaaaccaagt cgttatttgg aaatatccgc aaatgaagca actagcatct 660

ttgactggtc atacttatcg agtcctttac ctttccatgt cacctgatgg aactacagtc 720

gtaacggggg ctggagacga aactttaaga ttttggaact gtttcgagaa gtcacgacaa 780

agcggaggag gatcaatatt actagacgct tttagtcagc ttcgttaaat taccaccaaa 840

tttggtgcaa aagggcccat atggtgctac aaccaaagga actttctaat tttgataatg 900

atgtcatttc tctcatcggg atgaaaatag aagtcgaaag gatttttgtc actatttcaa 960

gccccacctg cagctggcag catttctatt gtttatgcat tgtcatttat gggaaaacta 1020

agaaagttcc tctccacccg gactccactg gtaaatatgc gatatcggaa tcatgaccaa 1080

cccatatttt gatcctaatc atttcggttc tagtctccga tcggactccg taaaactgcg 1140

gagtgaactc caacggagaa tactgcagcc aatctcatat ttcatttgtt atttgtccct 1200

caactgtctc gataaggtca tctgtgtttg actagatgtt cgtcattggc atgtcaaaca 1260

aggctagacc ttacaatcat ctcttacgaa tgtaagtgaa tgtaactata ttttccttgc 1320

tactttaacg aggttaacca acccccgcac atccccacac caccgctctt gataagcatc 1380

tccgaaaatg catgacgcga caacttcaag catgttgtat ttactgagtt ttcagcctca 1440

ctatcgatac ctctataaat agaggcactt tcgtctcttc tccctcccca caagaaacca 1500

<210> 5

<211> 1500

<212> DNA

<213> 人工

<220>

<223> 启动子pSD005

<400> 5

agaagtactg ttatgaatcg atcgacgtga catgttgttg atggttctga cttcttgatg 60

tccgcgtttt ctgtctctca atagtggtgt tcgggggaag tatggttcta atacttaaca 120

ggtaagatgg ttgcaatgag cacctggtaa agcaacttga atttcctgcc ctgtctccgt 180

taagttatat tcgactcaag gtccttgctt cctgtctgtt ctgtaaaact tccctttggt 240

gtcttctata tcaactttaa aaacaaggta gtgtgtcgag cgatagtact gtgtcttttt 300

ccctatgaaa aaaatcgcac catccaagac ttctcacctt caacagcttc aacatcatgt 360

tcggtccttt tagagctacg ctggtcgatc taggaggtct gctatggaaa cgtccttgga 420

gaatgtccaa accacagaaa tatagactcc gcaaaagaat gcaacttgta gactccaata 480

tcgacattat ttaccaggga ctgactgagg agggtctgtc ttgcaaagtg atagataact 540

tgaaacaaaa cttcccaaag gagcatgaag tgctccccaa aaacaagtat accgtgttta 600

acaagacagc caaaaactat agaaagggtg ttcatttggt tccaaaatgg accaagaagt 660

ctttgagaga gaaccccgag ttcttctaat tgcacatttc ttcctgttca tagattatcc 720

cacacatagt tgctcacaaa aaaatcacta taattttcct ccaccggcag tatatcacta 780

acacctttat ctttattgta gattataatc tgatctttat ccttagatgt atctatcatc 840

aaccccatgc tcttgaaaag cttgagtctt aacactgtcg aatcgtagtt ttcttgtaga 900

tcattcgata tcactgcttt ttcttgctct tctaattcgt tgagattctg ggtcaaacta 960

gagattgaat tctgaaggtg attcatgttc atctccagat ctgttattga ttttgctaat 1020

ttaaattttt cgtgttcaag ctcttcgata ctctttaggg tctgttgacg gtcttctgtt 1080

tccaataatt gcttgttgaa ctctttaagt tcgtctctct gtttactgat acgtgacaac 1140

aaatctagct ggtgatcgag tttaagtttc cgtttggagc tcaacagaga aagattttca 1200

ttaatttggt tgatagtttg cacgtccggt tcgatctgaa aattctctat agtcgacctg 1260

attaaggaca cagtctcttg aagatcggac attggattta tggagaaggg agatcaaagc 1320

ggaaccagtt gcactgttta cctttccagt cgagatactt atcccacagg gccctcactt 1380

tccaggcaga agtcacctag gaggcgcatc cctccgtttg cttccctcgc gacaaactcc 1440

cctgtaaaag aaaacttcac tgaatcgtac acctaatcat acgacactaa cacagatata 1500

<210> 6

<211> 1500

<212> DNA

<213> 人工

<220>

<223> 启动子pSD007

<400> 6

gtcctttcca aatttttggt tgaaggcatc gcttaaatta tgagcaggat cggtggaaat 60

aagcaggtat ttcttgttag gattgtgaag ggcaagctgg atagatatag aagaagatgt 120

cgtggtttta ccgacacccc ccttacctcc aacaaagatc cacttcagcg attcgtggtt 180

cacaattgat cgcaaacttg gctctgcctc aatatccatg gttgatgtct agttgagtgg 240

cgtttgtggt ctcttgatga gttcaaggcg aaagaatatg ataggaaagc atggtttgaa 300

cttttcgcga aagaaggaat actgttccgc gagaaactcc ccggtgccag aaccttccat 360

tgaggttaat cggtgggagg tgttcgaatg acaatgtcag acaaggcgaa cacgtcttgt 420

gacaccagct ggactaagaa gattcggtat gcaccgaaga agaaggccgt gtctcaattg 480

gcaactttgc aacaaactac ggaggaaaag tctcacaagc ttttaaccaa gttgaatcac 540

gacgacaacg ataaagaaat cctcaaccat ctaacacatg aagtacaaag tagaaatgtg 600

atcttattgg acaaactaga ggagctcaac aaggaactgg gctggattaa agaccgaaaa 660

tgaggaacca tgagcactgg gcgtttccag aaaaactgca accaacgatg ggaaaatgat 720

accacactac tatggtcacc ccacattgtg aaatttcaaa ccaaaaaaga tcaaccccat 780

aattccccag agggttttcc caacaatttt ccaacggact tgataatgag tcagatcatt 840

tgagcatatt catcttaccc cttattccgt gacaatttac ctattccatt caaagcatac 900

ggtatcccgt gaccttctca tggagatcat tctccaccga tacagcatat acacagatat 960

acccaactaa tatcaattgg accttgatat ggtcgacctt gatggtcccg tccaacctta 1020

aaacttagtt taatgctata ctttcgcctt gaaccaaatc tgtctccccc tcaatcatct 1080

ctatgcaaga aggtcaacac tgattacgtg agcaacagcc agcaatcgtt cgagtccccg 1140

ccaaaaaagg cggagttact gctccttgtg accacacccc ctgagaccac gtccctaaac 1200

gatccttgtc ggttccttcg tccaattggc aattgccacg catacgtgaa tcgttattgt 1260

ttcgcctacc ttgcgtcatt cgttccagaa tgttcgacat actcctctag aacataccgt 1320

cacaccacca tcttaagtta tcttcacgtg accatgacgt acattgtagt tgactacccc 1380

attctcatca ttccgatgcg gccaaaaatc tctatataaa gaccgtatcc cctaatattc 1440

tcttcttgtt aagacattaa cttagttaat tcaccaatta ctcacttata aacaaacaaa 1500

<210> 7

<211> 1500

<212> DNA

<213> 人工

<220>

<223> 启动子pSD008

<400> 7

gtttctcttg gggagatact tttttcgcgt gctcctccgt gcggaacttc cttctgagct 60

tctacctctc agattagtct aatcgcatca ggaataagac tgagaatgct tttaaggaga 120

ggcttgagat tggctaattg cgttccgaag tactctttca aaaggagtta tacccctctc 180

aactacgatt ctctaaagaa ttatcgtagg catgctcagg cgcctcaacc ccatcagttt 240

gacgccacta gatgggacca acaaccagtt actaatgagc aaggagtaat actcccatcc 300

gactcaattg caaacattct gagacaacca actctggtca tagaacggca aatggaaatg 360

atgaatatat ttttaggatt tgagcaggcg aaccgatatg ttatcatgga tcctacagga 420

agtattttgg gttacatgct agaaagggat ctgggcatca ccaaagctat attgagacag 480

atctaccgtt tgcatcgacc ttttacagtg gatgtaatgg atactgcagg aaatgtatta 540

atgacaatca agaggccgtt tagtttcatc aattcgcaca tcaaagctat attaccccct 600

ttcaggaaca gcgacccaga cgaacatgta attggagaat ccgttcaaag ctggcatcct 660

tggagacgaa gatacaatct atttacagca caaattggcg aaaaggacac tgtctacgat 720

cagttcgggt acattgacgc accgtttctt tcctttgagt ttcctgtact ttcagaatct 780

aggcaaacgc taggtgctgt ctctagaaac ttcgtgggct ttgcaagaga gcttttcaca 840

gatacaggag tttacatcat ccgtatgggg cctgaatctt ttgtagggct agaagggaac 900

tacgggaaca atgtggccca acatgccctt acgctggacc aaagggctgt attattagcc 960

aatgccgttt caattgactt tgattacttt tctaggcact cgtcacacag tggtggcttc 1020

attgggtttg aggaatagac agggtctcgt caactcagct cctgccacca aaccaatcat 1080

tgatcaacga gcacactttt gtccacgtga gatcgctttc gcttgcagaa agagcaatgc 1140

atgaaaacgg caaacgcaaa acgagcaaaa aaacgagtaa ataactacaa tttcaccacc 1200

aacagggtca aagagctttt gagacactat aaaaggggcc ctttcccccc aggttccttg 1260

aaatcctcat tcaattatgt tttttactca taatttgact caattggcat cttcttcttt 1320

gttcatatac agtaattgat atgacgctta gtcattatta gtgttctcga ctagcagtgg 1380

cgaaaaaagg gggagttatt ttctagaacc gaccgcaaac tataaaagaa agctgcccct 1440

catatacctt tcgaattctt tattttctgt gtttcttccc tatttaacat ctacacaaaa 1500

<210> 8

<211> 940

<212> DNA

<213> 法夫驹形氏酵母(Komagataella phaffii)

<400> 8

agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60

gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120

tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180

agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240

acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300

tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360

agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420

gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480

ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540

cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600

ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660

ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720

gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780

atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840

actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900

caacttgaga agatcaaaaa acaactaatt attcgaaacg 940

<210> 9

<211> 32

<212> PRT

<213> 人工

<220>

<223> 前导肽

<220>

<221> misc_feature

<222> (13)..(13)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (31)..(31)

<223> Xaa可以是任何天然存在的氨基酸

<400> 9

Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Xaa Ala Ala Ser

1 5 10 15

Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Arg Xaa Arg

20 25 30

<210> 10

<211> 31

<212> PRT

<213> 腐皮镰刀菌(Fusarium solani)

<400> 10

Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Thr Ala Ala Ser

1 5 10 15

Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Lys Arg

20 25 30

<210> 11

<211> 31

<212> PRT

<213> 腐皮镰刀菌(Fusarium solani)

<400> 11

Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Ala Ala Ala Ser

1 5 10 15

Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Thr Arg

20 25 30

<210> 12

<211> 31

<212> PRT

<213> 人工

<220>

<223> 前导肽的变体

<400> 12

Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Ala Ala Ala Ser

1 5 10 15

Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Lys Arg

20 25 30

<210> 13

<211> 31

<212> PRT

<213> 人工

<220>

<223> 前导肽的变体

<400> 13

Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Thr Ala Ala Ser

1 5 10 15

Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Thr Arg

20 25 30

<210> 14

<211> 87

<212> PRT

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 14

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Glu Ala

85

<210> 15

<211> 61

<212> PRT

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 15

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Leu Glu Gly

20 25 30

Asp Phe Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys

35 40 45

Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala

50 55 60

<210> 16

<211> 93

<212> DNA

<213> 人工

<220>

<223> 编码前导肽的变体的核酸序列

<220>

<221> misc_feature

<222> (37)..(39)

<223> n为a、c、g或t

<220>

<221> misc_feature

<222> (88)..(90)

<223> n为a、c、g或t

<400> 16

atgaggctgc ttccactgtt gtccgtcgtt acattgnnng ccgcttcccc aatcgcctct 60

gtccaggaat acaccgacgc tttggaannn aga 93

<210> 17

<211> 93

<212> DNA

<213> 腐皮镰刀菌(Fusarium solani)

<400> 17

atgaggctgc ttccactgtt gtccgtcgtt acattgactg ccgcttcccc aatcgcctct 60

gtccaggaat acaccgacgc tttggaaaaa aga 93

<210> 18

<211> 93

<212> DNA

<213> 腐皮镰刀菌(Fusarium solani)

<400> 18

atgaggctgc ttccactgtt gtccgtcgtt acattggctg ccgcttcccc aatcgcctct 60

gtccaggaat acaccgacgc tttggaaaca aga 93

<210> 19

<211> 93

<212> DNA

<213> 人工

<220>

<223> 编码前导肽变体的核酸

<400> 19

atgaggctgc ttccactgtt gtccgtcgtt acattggctg ccgcttcccc aatcgcctct 60

gtccaggaat acaccgacgc tttggaaaaa aga 93

<210> 20

<211> 93

<212> DNA

<213> 人工

<220>

<223> 编码前导肽变体的核酸

<400> 20

atgaggctgc ttccactgtt gtccgtcgtt acattgactg ccgcttcccc aatcgcctct 60

gtccaggaat acaccgacgc tttggaaaca aga 93

<210> 21

<211> 261

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 21

atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60

ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120

tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180

aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240

tctctcgaga aaagagaggc t 261

<210> 22

<211> 171

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 22

atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60

ccagtcaaca ctacaacaga agatgaatta gaaggggatt tcgatgttgc tgttttgcca 120

ttttccgcca gcattgctgc taaagaagaa ggggtatctc tcgagaaaag a 171

<210> 23

<211> 317

<212> PRT

<213> 腐皮镰刀菌(Fusarium solani)

<400> 23

Ala Ile Thr Ala Ser Gln Leu Asp Tyr Glu Asn Phe Lys Phe Tyr Ile

1 5 10 15

Gln His Gly Ala Ala Ala Tyr Cys Asn Ser Glu Thr Ala Ser Gly Gln

20 25 30

Lys Ile Thr Cys Ser Asp Asn Gly Cys Lys Gly Val Glu Ala Asn Asn

35 40 45

Ala Ile Ile Val Ala Ser Phe Val Gly Lys Gly Thr Gly Ile Gly Gly

50 55 60

Tyr Val Ser Thr Asp Asn Val Arg Lys Glu Ile Val Leu Ser Ile Arg

65 70 75 80

Gly Ser Ser Asn Ile Arg Asn Trp Leu Thr Asn Val Asp Phe Gly Gln

85 90 95

Ser Ser Cys Ser Tyr Val Arg Asp Cys Gly Val His Thr Gly Phe Arg

100 105 110

Asn Ala Trp Asp Glu Ile Ala Gln Arg Ala Arg Asp Ala Val Ala Lys

115 120 125

Ala Arg Thr Met Asn Pro Ser Tyr Lys Val Ile Ala Thr Gly His Ser

130 135 140

Leu Gly Gly Ala Val Ala Thr Leu Gly Ala Ala Asp Leu Arg Ser Lys

145 150 155 160

Gly Thr Ala Val Asp Ile Phe Thr Phe Gly Ala Pro Arg Val Gly Asn

165 170 175

Ala Glu Leu Ser Ala Phe Ile Thr Ala Gln Ala Gly Gly Glu Phe Arg

180 185 190

Val Thr His Gly Arg Asp Pro Val Pro Arg Leu Pro Pro Ile Val Phe

195 200 205

Gly Tyr Arg His Thr Ser Pro Glu Tyr Trp Leu Ala Gly Gly Ala Ser

210 215 220

Thr Lys Thr Asp Tyr Thr Val Asn Asp Ile Lys Val Cys Glu Gly Ala

225 230 235 240

Ala Asn Leu Ala Cys Asn Gly Gly Thr Leu Gly Leu Asp Ile Ile Ala

245 250 255

His Leu Arg Tyr Phe Gln Asp Thr Asp Ala Cys Thr Ala Gly Gly Ile

260 265 270

Ser Trp Lys Arg Gly Asp Lys Ala Lys Arg Asp Glu Ile Pro Lys Arg

275 280 285

Gln Glu Gly Met Thr Asp Glu Glu Leu Glu Gln Lys Leu Asn Asp Tyr

290 295 300

Val Ala Met Asp Lys Glu Tyr Val Glu Ser Asn Lys Met

305 310 315

<210> 24

<211> 954

<212> DNA

<213> 腐皮镰刀菌(Fusarium solani)

<400> 24

gccattactg cttctcaatt ggactacgaa aacttcaagt tttacatcca gcacggtgcc 60

gctgcttact gtaactccga aactgcctct ggtcaaaaga tcacttgttc cgacaacggt 120

tgcaaaggtg tcgaagctaa caacgctatt attgtcgcct ctttcgttgg aaaaggtact 180

ggtattggtg gttacgtttc tactgataac gttagaaagg agatcgtttt gtctattaga 240

ggttcttcca acattcgtaa ctggttgact aacgtcgact tcggacaatc ctcttgttct 300

tacgttagag attgtggagt tcacactggt ttcagaaatg cttgggacga gattgcccaa 360

agagctagag acgctgtcgc taaagctaga actatgaacc catcttacaa ggttatcgct 420

actggtcact ctttgggtgg tgctgttgcc actttgggtg ctgctgattt gagatccaag 480

ggtactgccg tcgatatctt tacttttggt gccccaagag ttggtaacgc tgagttgtcc 540

gctttcatca ctgctcaggc tggtggtgag ttcagagtta ctcacggacg tgatccagtt 600

ccacgtttgc cacctatcgt cttcggttac agacacacct ctccagagta ctggttggct 660

ggtggtgctt ccaccaagac tgattatact gttaacgata tcaaggtttg tgaaggtgcc 720

gctaacttgg cctgtaatgg tggtactttg ggattggata tcattgctca tttgagatac 780

ttccaagaca ctgacgcctg tactgctggt ggtatctcct ggaagagagg tgacaaagct 840

aagagagatg agattccaaa aagacaagaa ggaatgactg atgaggagtt ggaacaaaaa 900

ctgaacgact atgtcgccat ggataaggag tacgttgagt ccaacaagat gtaa 954

<210> 25

<211> 2400

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 25

atggttttgc cgattctacc gttaattgat gatctggcct catggaatag taagaaggaa 60

tacgtttcac ttgttggtca ggtacttttg gatggctcga gcctgagtaa tgaagagatt 120

ctccagttct ccaaagagga agaagttcca ttggtggctt tgtccttgcc aagtggtaaa 180

ttcagcgatg atgaaatcat tgccttcttg aacaacggag tttcttctct gttcattgct 240

agccaagatg ctaaaacagc cgaacacttg gttgaacaat tgaatgtacc aaaggagcgt 300

gttgttgtgg aagagaacgg tgttttctcc aatcaattca tggtaaaaca aaaattctcg 360

caagataaaa ttgtgtccat aaagaaatta agcaaggata tgttgaccaa agaagtgctt 420

ggtgaagtac gtacagaccg tcctgacggt ttatatacca ccctagttgt cgaccaatat 480

gagcgttgtc tagggttggt gtattcttcg aagaaatcta tagcaaaggc catcgatttg 540

ggtcgtggcg tttattattc tcgttctagg aatgaaatct ggatcaaggg tgaaacttct 600

ggcaatggcc aaaagctttt acaaatctct actgactgtg attcggatgc cttaaagttt 660

atcgttgaac aagaaaacgt tggattttgc cacttggaga ccatgtcttg ctttggtgag 720

ttcaagcatg gtttggtggg gctagaatct ttactaaaac aaaggctaca ggacgctcca 780

gaggaatctt atactagaag actattcaac gactctgcat tgttagatgc caagatcaag 840

gaagaagctg aagaactgac tgaggcaaag ggtaagaagg agctttcttg ggaggctgcc 900

gatttgttct actttgcact ggccaaatta gtggccaacg atgtttcatt gaaggacgtc 960

gagaataatc tgaatatgaa gcatctgaag gttacaagac ggaaaggtga tgctaagcca 1020

aagtttgttg gacaaccaaa ggctgaagaa gaaaaactga ccggtccaat tcacttggac 1080

gtggtgaagg cttccgacaa agttggtgtg cagaaggctt tgagcagacc aatccaaaag 1140

acttctgaaa ttatgcattt agtcaatccg atcatcgaaa atgttagaga caaaggtaac 1200

tctgcccttt tggagtacac agaaaagttt gatggtgtaa aattatccaa tcctgttctt 1260

aatgctccat tcccagaaga atactttgaa ggtttaaccg aggaaatgaa ggaagctttg 1320

gacctttcaa ttgaaaacgt ccgcaaattc catgctgctc aattgccaac agagactctt 1380

gaagttgaaa cccaacctgg tgtcttgtgt tccagattcc ctcgtcctat tgaaaaagtt 1440

ggtttgtata tccctggtgg cactgccatt ttaccaagta ctgcattaat gcttggtgtt 1500

ccagcacaag ttgcccaatg taaggagatt gtgtttgcat ctccaccaag aaaatctgat 1560

ggtaaagttt cacccgaagt tgtttatgtc gcagaaaaag ttggcgcttc caagattgtt 1620

ctagctggtg gtgcccaagc cgttgctgct atggcttacg ggacagaaac tattcctaaa 1680

gtggataaaa tcttgggtcc aggtaatcaa tttgtgactg ccgccaaaat gtatgttcaa 1740

aatgacactc aagctctatg ttccattgat atgccagctg gcccaagtga agttttggtt 1800

attgccgatg aagatgccga tgtggatttt gttgcaagtg atttgctatc gcaagctgaa 1860

cacggtattg actcccaagt tatccttgtt ggtgttaact tgagcgaaaa gaaaattcaa 1920

gagattcaag atgctgtcca caatcaagct ttacaactgc cacgtgtgga tattgttcgt 1980

aaatgtattg ctcacagtac gatcgttctt tgtgacggtt acgaagaagc ccttgaaatg 2040

tccaaccaat atgcaccaga acatttgatt ctacaaatcg ccaatgctaa cgattatgtt 2100

aaattggttg acaatgcagg gtccgtattt gtgggtgctt acactccaga atcgtgcggt 2160

gactattcaa gtggtactaa ccatacatta ccaacctatg gttacgctag gcagtacagt 2220

ggtgccaaca ctgcaacctt ccaaaagttt atcactgccc aaaacattac ccctgaaggt 2280

ttagaaaaca tcggtagagc tgttatgtgc gttgccaaga aggagggtct agacggtcac 2340

agaaacgctg tgaaaatcag aatgagtaag cttgggttga tcccaaagga tttccagtag 2400

<210> 26

<211> 804

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 26

atgtcgaaag ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag 60

ctatttaata tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc 120

accaaggaat tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca 180

catgtggata tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta 240

tccgccaagt acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca 300

gtcaaattgc agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat 360

gcacacggtg tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta 420

acaaaggaac ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct 480

actggagaat atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc 540

ggctttattg ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg 600

acacccggtg tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg 660

gatgatgtgg tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag 720

ggaagggatg ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg 780

agaagatgcg gccagcaaaa ctaa 804

相关技术
  • 基于表达HBsAg的热失活全重组汉逊酵母细胞的乙肝治疗疫苗
  • 表达手足口病疫苗抗原的重组汉逊酵母细胞破碎缓冲液及其制备方法与应用
技术分类

06120113002902