用于甜茶素生产的宿主细胞及方法
文献发布时间:2023-06-19 19:30:30
技术领域
本发明涉及合成生物学及医药技术领域。具体地,本发明涉及用于甜茶素生产的宿主细胞及方法。
背景技术
甜茶,又名甜叶悬钩子,为蔷薇科悬钩子属植物,生长于我国广西省西南山区,是广西特有的无毒,高糖,低热量的天然植物。由于其叶味道甘甜,口感独特,且具有一定保健作用,广西民间以甜茶的叶片作为茶叶饮用。根据广西中药药物标准记载,甜茶具有清热降火,润肺生津,止咳祛痰的功效,含甜茶素、黄酮、茶多酚、蛋白质、氨基酸、维生素及铁、锌、钙等矿物质,其主要成分是二萜糖苷化合物甜茶素。
二萜类化合物是一类重要的植物来源次生代谢产物,具有广泛的生理和药用活性。尽管二萜类化合物具有广泛的分布,但其糖基化修饰却相对罕见,自然界仅有极少数植物,如甜叶菊、甜茶与明日叶等能生产糖基化的二萜类化合物。这些二萜糖苷在食品工业、药物开发中具有巨大的开发和应用前景。甜茶素是一种稀有的糖基化贝壳杉烯型四环二萜类分子,由一分子甜菊醇和两分子葡萄糖分别在甜菊醇的C13位和C19位取代结合而成的四环二萜苷。其甜度约为蔗糖的300倍而热量仅仅为蔗糖的1/10,是一种理想的天然甜味剂,可作为糖精和蔗糖的替代品,用于食品、医药等行业。由于甜茶素热值低,不会增加胆固醇,不致龋齿,心血管、肥胖、糖尿病等患者均可饮用。甜茶素已广泛用于糕点、饮料、罐头、医药、烟草、牙膏、啤酒、酱制品等方面。甜茶素有降血压、降血糖、促进新陈代谢、治疗胃酸过多等作用。新近的报道表明,甜茶素是首个发现的可同时抑制人果糖转运蛋白GLUT5和葡萄糖转运蛋白GLUT1的小分子化合物,具有独特的药理活性。
与大多数天然产物一样,甜茶素现阶主要依靠从植物中进行提取的方式获得,尚无相关的化学合成方法报道。植物生长缓慢、植物资源的不可再生性是天然植物提取的瓶颈问题,此外,在植物提取过程中也需要消耗大量的有机溶剂,存在后续分离工艺繁琐、设备工业化造价高等问题。现阶段随着合成生物学的发展,利用微生物作为底盘细胞,通过外源基因的导入以及微生物反应器发酵手段定向合成目标产物为越来越普遍的一种技术。微生物具有遗传操作简便、生长迅速等优势。相对于传统的植物提取手段,微生物发酵具有速度快、受天气气候影响较小等优势,并且一些中间产物更易获得;部分化合物通过微生物合成的产量远高于植物提取,已经成为天然产物获得的一种重要手段。
迄今为止的研究中,尚无关于在酿酒酵母中高效合成甜茶素的报道,因此本领域亟待进行有效的探索,以期找到此类化合物的高效合成途径。
发明内容
本发明的目的在于提供一种催化转化甜菊醇生成甜茶素的宿主细胞和方法。
具体而言,本发明第一方面提供一种基因工程改造的宿主细胞,所述宿主细胞:
表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶;和/或
含有:(a)将甜菊醇C13位羟基糖基化的糖基转移酶的编码序列,(b)将甜菊醇C4位羧基糖基化的糖基转移酶的编码序列,和(c)至少一种蔗糖合成酶的编码序列;和/或
含有表达载体,所述表达载体用于表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶。
在一个或多个实施方案中,所述将甜菊醇C4位羧基糖基化的糖基转移酶选自:(i)糖基转移酶AkUGT75L21,(ii)糖基转移酶SrUGT74G1,和(iii)其氨基酸序列与糖基转移酶AkUGT75L21或SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶;优选地,所述与糖基转移酶SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶包括在选自糖基转移酶SrUGT74G1的第83、84、87、88、190和192位中的一个或多个位置上,优选在第84和/或87位上发生取代突变的糖基转移酶SrUGT74G1突变体;优选地,所述取代突变为将野生型的氨基酸取代为甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个,优选突变为丙氨酸。
在一个或多个实施方案中,所述将甜菊醇C13位羟基糖基化的糖基转移酶选自:(i)糖基转移酶RsUGT85A57,(ii)糖基转移酶SrUGT85C2,和(iii)其氨基酸序列与糖基转移酶RsUGT85A57或SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述至少一种蔗糖合成酶选自:(1)蔗糖合成酶AtSUS3,(2)蔗糖合成酶SoSUS2,和(3)其氨基酸序列与蔗糖合成酶AtSUS3或SoSUS2具有至少85%序列同一性、同时保留所述AtSUS3或SoSUS2的蔗糖合成酶功能的蔗糖合成酶。
在一个或多个实施方案中,所述宿主细胞至少表达将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶、将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶、以及所述至少一种蔗糖合成酶,任选还表达将甜菊醇催化生成甜菊单糖苷的糖基转移酶和/或将甜菊单糖苷催化生成甜茶素的糖基转移酶。
在一个或多个实施方案中,所述宿主细胞至少含有将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶的编码序列或其表达载体、将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶的编码序列或其表达载体、以及所述至少一种蔗糖合成酶的编码序列或其表达载体,任选地还含有将甜菊醇催化生成甜菊单糖苷的糖基转移酶的编码序列或其表达载体和/或将甜菊单糖苷催化生成甜茶素的糖基转移酶的编码序列或其表达载体。
在一个或多个实施方案中,所述将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶以及将甜菊单糖苷催化生成甜茶素的糖基转移酶选自:(i)糖基转移酶AkUGT75L21,(ii)糖基转移酶SrUGT74G1,和(iii)其氨基酸序列与糖基转移酶AkUGT75L21或SrUGT74G1具有至少85%序列同一性、同时具有将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的生物学功能的糖基转移酶;优选地,所述与糖基转移酶SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶包括在选自糖基转移酶SrUGT74G1的第83、84、87、88、190和192位中的一个或多个位置上,优选在第84和/或87位上发生取代突变的糖基转移酶SrUGT74G1突变体;优选地,所述取代突变为将野生型的氨基酸取代为甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个,优选突变为丙氨酸。
在一个或多个实施方案中,所述将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶选自:(i)糖基转移酶RsUGT85A57,(ii)糖基转移酶SrUGT85C2,和(iii)其氨基酸序列与糖基转移酶RsUGT85A57或SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述将甜菊醇催化生成甜菊单糖苷的糖基转移酶选自:(i)糖基转移酶SrUGT85C2,和(ii)其氨基酸序列与糖基转移酶SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇催化生成甜菊单糖苷的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述至少一种蔗糖合成酶选自:(1)蔗糖合成酶AtSUS3,(2)蔗糖合成酶SoSUS2,和(3)其氨基酸序列与蔗糖合成酶AtSUS3或SoSUS2具有至少85%序列同一性、同时保留所述AtSUS3或SoSUS2的蔗糖合成酶功能的蔗糖合成酶。
在一个或多个实施方案中,所述宿主细胞:
(1)表达糖基转移酶AkUGT75L21、糖基转移酶RsUGT85A57,以及蔗糖合成酶AtSUS3或SoSUS2;和/或含有糖基转移酶AkUGT75L21的编码序列或表达载体、糖基转移酶RsUGT85A57的编码序列或表达载体,以及蔗糖合成酶AtSUS3或SoSUS2的编码序列或表达载体;
(2)表达糖基转移酶AkUGT75L21、糖基转移酶RsUGT85A57、糖基转移酶SrUGT85C2,以及蔗糖合成酶AtSUS3或SoSUS2;和/或含有糖基转移酶AkUGT75L21的编码序列或表达载体、糖基转移酶RsUGT85A57的编码序列或表达载体、糖基转移酶SrUGT85C2的编码序列或表达载体,以及蔗糖合成酶AtSUS3或SoSUS2的编码序列或表达载体;或
(3)表达糖基转移酶AkUGT75L21、糖基转移酶RsUGT85A57、糖基转移酶SrUGT85C2、糖基转移酶SrUGT74G1或其突变体,以及蔗糖合成酶AtSUS3或SoSUS2;和/或含有糖基转移酶AkUGT75L21的编码序列或表达载体、糖基转移酶RsUGT85A57的编码序列或表达载体、糖基转移酶SrUGT85C2的编码序列或表达载体、糖基转移酶SrUGT74G1或其突变体的编码序列或表达载体,以及蔗糖合成酶AtSUS3或SoSUS2的编码序列或表达载体;
优选地,所述与糖基转移酶SrUGT74G1的突变体包括在选自糖基转移酶SrUGT74G1的第83、84、87、88、190和192位中的一个或多个位置上,优选在第84和/或87位上发生取代突变的糖基转移酶SrUGT74G1突变体;优选地,所述取代突变为将野生型的氨基酸取代为甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个,优选突变为丙氨酸。
在一个或多个实施方案中,所述宿主细胞选自大肠杆菌和酵母;优选地,所述酵母为酿酒酵母。
本发明第二方面提供一种甜茶素生产方法,所述方法包括在适合所述的宿主细胞合成甜茶素的条件下培养本文任一实施方案所述的宿主细胞,以及分离得到甜茶素的步骤。
在一个或多个实施方案中,所述培养包括催化细胞生产甜茶素的细胞催化反应,其中,在甜菊醇、蔗糖和金属离子的存在下进行催化反应,其中催化反应体系的pH为7.2~8.2,催化反应在25~35℃的条件下进行。
在一个或多个实施方案中,所述金属离子不包括Mn离子和Mg离子;优选地,所述金属离子为Co
在一个或多个实施方案中,催化反应体系中还含有表面活性剂,优选CTAB;优选地,表面活性剂的浓度为5~15g/L。
在一个或多个实施方案中,催化反应体系中甜菊醇的浓度为1~2g/L。
在一个或多个实施方案中,催化反应体系中蔗糖的浓度可为10~40g/100mL。
在一个或多个实施方案中,所述催化反应体系中未添加外源UDPG。
本发明第三方面提供糖基转移酶SrUGT74G1的突变体,所述突变体与SEQ ID NO:8相比,在其第83、84、87、88、190和192位中的一个或多个位置上、优选在第84和/或87位上发生取代突变。
在一个或多个实施方案中,所述取代突变为所述位置上的野生型氨基酸残基被选自甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个取代,优选突变为丙氨酸。
在一个或多个实施方案中,所述突变体为单突变体,与SEQ ID NO:8相比,在其第83、84、87、88、190或192位发生E83A、S84A、E87A、T88A、P190A或S192A突变;或所述突变体为双突变体,与SEQ ID NO:8相比,发生了S84A和E87A取代突变。
本发明第四方面提供一种用于构建用来生产甜茶素的宿主细胞的试剂盒,所述试剂盒含有表达载体,所述表达载体用于表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶。优选地,所述糖基转移酶和蔗糖合成酶如本文任一实施方案所述。
本发明的其他方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1:甜菊醇糖基化转化途径示意图。
图2:酵母全细胞催化合成甜茶素所使用的载体p85、pS3示意图。
图3:酵母全细胞催化合成甜茶素所使用的载体p5025、pS2、p8574示意图。
图4:sRub1转化甜菊醇合成甜茶素及其中间体。(A)40%蔗糖浓度下sRub1反应混合物的HPLC分析,(B)不同蔗糖浓度下sRub1的产物积累情况。
图5:甜菊醇的两种糖基化转化途径示意图。
图6:不同工程菌株转化甜菊醇合成甜茶素及其中间体的比较示意图。
图7:引入SrUGT74G1强化中间体的糖基化。(A)引入SrUGT74G1的甜菊醇糖基化双途径,(B)不同蔗糖浓度下sRub6的产物积累情况。
图8:酿酒酵母全细胞催化最适反应条件的优化结果。(A)反应温度,(B)反应pH,(C)反应时间,(D)金属离子。
图9:SrUGT74G1的(A)多序列对比及(B)同源建模。
图10:SrUGT74G1突变体的活性检测。(A)含有不同的SrUGT74G1突变体的酵母菌株sRub7~sRub13的产物积累情况,(B)sRub13反应产物的HPLC分析。
具体实施方式
本发明致力于酿酒酵母底盘中全细胞催化转化甜菊醇生成甜茶素的工艺研究。通过将甜茶素的糖基化合成途径中关键糖基转移酶编码基因导入酿酒酵母中,使这些基因在酿酒酵母中过量表达,同时在酿酒酵母中表达蔗糖合成酶;通过利用蔗糖合成酶与糖基转移酶偶联,实现在微生物底盘中尿苷二磷酸葡萄糖(UDPG)的原位再生;进一步地,通过构建重组工程菌,建立全细胞催化工艺,在不添加外源UDPG的条件下实现甜茶素的高效生物催化转化。
术语
如本文所用,所述的“基因表达盒”是指包含有表达目的多肽(本发明中为酶)所需的所有必要元件的基因表达系统,通常其包括以下元件:启动子、编码多肽的基因序列,终止子;此外还可选择性包括信号肽编码序列等;这些元件是操作性相连的。
如本文所用,所述的“可操作地连接(相连)”或“操作性连接(相连)”是指两个或多个核酸区域或核酸序列的功能性的空间排列。例如:启动子区被置于相对于目的基因核酸序列的特定位置,使得核酸序列的转录受到该启动子区域的引导,从而,启动子区域被“可操作地连接”到该核酸序列上。
如本文所用,所述的“表达构建物”是指重组DNA分子,它包含预期的核酸编码序列,其可以包含一个或多个基因表达盒。所述的“构建物”通常被包含在表达载体中。
如本文所用,所述的“异源”是指来自不同来源的两条或多条核酸或蛋白质序列之间的关系,获知来自不同来源的蛋白(核酸)与宿主细胞之间的关系。例如,如果核算与宿主细胞的组合通常不是天然存在的,则核酸对于该宿主细胞来说是异源的。特定序列对于其所插入的细胞或生物体来说是“异源的”。
宿主细胞
本发明提供用于生产甜茶素的宿主细胞。本发明的宿主细胞经基因工程改造而外源转入了糖基转移酶和蔗糖合成酶,能在不添加外源UDPG的条件下实现甜茶素的高效生物催化转化。
具体而言,本发明提供一种基因工程改造的宿主细胞,该宿主细胞:
表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶;和/或
含有:(a)将甜菊醇C13位羟基糖基化的糖基转移酶的编码序列,(b)将甜菊醇C4位羧基糖基化的糖基转移酶的编码序列,和(c)至少一种蔗糖合成酶的编码序列;和/或
含有表达载体,所述表达载体用于表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶。
优选地,所述将甜菊醇C13位羟基糖基化的糖基转移酶选自:(i)糖基转移酶AkUGT75L21,(ii)糖基转移酶SrUGT74G1,和(iii)其氨基酸序列与糖基转移酶AkUGT75L21或SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶。优选地,所述糖基转移酶AkUGT75L21的氨基酸序列如SEQ ID NO:2所示;所述糖基转移酶SrUGT74G1的氨基酸序列如SEQ ID NO:8所示。在一个或多个实施方案中,所述氨基酸序列与所述糖基转移酶AkUGT75L21具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶来自明日叶(Angelica keiskei)。在一个或多个实施方案中,所述氨基酸序列与所述糖基转移酶SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶来自甜叶菊(Stevia rebaudiana)。
本文中,所述与糖基转移酶SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶包括在选自糖基转移酶SrUGT74G1的第83、84、87、88、190和192位中的一个或多个位置上发生取代突变的糖基转移酶SrUGT74G1突变体;优选地,所述与糖基转移酶SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶包括在选自糖基转移酶SrUGT74G1的第84和87位中的任意一个或全部位置上发生取代突变的糖基转移酶SrUGT74G1突变体。优选地,所述取代突变为将野生型的氨基酸取代为甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个,优选突变为丙氨酸。在一些实施方案中,SrUGT74G1的所述突变体为单突变体,在所述第83、84、87、88、190或192位发生E83A、S84A、E87A、T88A、P190A或S192A突变。在一些实施方案中,SrUGT74G1的所述突变体为双突变体,在选自第83、84、87、88、190和192位中的任意两个位置上发生取代突变;优选地,任意两个位置上的氨基酸残基被突变为丙氨酸;更优选地,所述双突变体为在第84和87位上发生取代突变的突变体,更优选为发生了S84A和E87A取代突变的双突变体。
优选地,所述将甜菊醇C4位羧基糖基化的糖基转移酶选自:(i)糖基转移酶RsUGT85A57,(ii)糖基转移酶SrUGT85C2,和(iii)其氨基酸序列与糖基转移酶RsUGT85A57或SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶。优选地,所述糖基转移酶RsUGT85A57的氨基酸序列如SEQID NO:4所示;所述糖基转移酶SrUGT85C2的氨基酸序列如SEQ ID NO:6所示。在一个或多个实施方案中,所述氨基酸序列与所述糖基转移酶RsUGT85A57具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶来自悬钩子变种(Rubus chingii var.suavissimus)。在一个或多个实施方案中,所述氨基酸序列与所述糖基转移酶SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶来自甜叶菊(Stevia rebaudiana)。
优选地,所述至少一种蔗糖合成酶选自:(1)蔗糖合成酶AtSUS3,(2)蔗糖合成酶SoSUS2,和(3)其氨基酸序列与蔗糖合成酶AtSUS3或SoSUS2具有至少85%序列同一性、同时保留所述AtSUS3或SoSUS2的蔗糖合成酶功能的蔗糖合成酶。优选地,所述蔗糖合成酶SoSUS2的氨基酸序列如SEQ ID NO:10所示;所述蔗糖合成酶AtSUS3的氨基酸序列如SEQ IDNO:12所示。在一个或多个实施方案中,所述氨基酸序列与所述蔗糖合成酶AtSUS3具有至少85%序列同一性、同时保留所述AtSUS3的蔗糖合成酶功能的蔗糖合成酶来自拟南芥(Arabidopsis thaliana)。在一个或多个实施方案中,所述氨基酸序列与所述蔗糖合成酶SoSUS2具有至少85%序列同一性、同时保留所述SoSUS2的蔗糖合成酶功能的蔗糖合成酶来自甘蔗(Saccharum hybrid cultivar F36-819)。
本文中,所述糖基转移酶AkUGT75L21指来源于明日叶(Angelica keiskei)的糖基转移酶,优选GenBank登录号为MG592710.1的糖基转移酶(编码序列如SEQ ID NO:1所示,氨基酸序列如SEQ ID NO:2所示)。所述糖基转移酶RsUGT85A57指来源于悬钩子变种(Rubuschingii var.suavissimus)的糖基转移酶,优选GenBank登录号为MG592709.1的糖基转移酶(编码序列如SEQ ID NO:3所示,氨基酸序列如SEQ ID NO:4所示)。所述糖基转移酶SrUGT85C2指来源于甜叶菊(Stevia rebaudiana)的糖基转移酶,优选其氨基酸序列如Genbank登陆号AAR06916.1所示(氨基酸序列如SEQ ID NO:6所示)。在一些优选的实施方案中,本发明使用经大肠杆菌密码子优化的非野生型SrUGT85C2糖基转移酶(编码序列如SEQID NO:5所示,氨基酸序列如SEQ ID NO:6所示)。所述糖基转移酶SrUGT74G1指来源于甜叶菊(Stevia rebaudiana)的糖基转移酶,优选其氨基酸序列如Genbank登陆号AAR06920.1所示(氨基酸序列如SEQ ID NO:8所示)。在一些优选的实施方案中,本发明使用经大肠杆菌密码子优化的非野生型SrUGT74G1糖基转移酶(编码序列如SEQ ID NO:7所示,氨基酸序列如SEQ ID NO:8所示)。所述蔗糖合成酶SoSUS2指来源于甘蔗(Saccharum hybrid cultivarF36-819)的蔗糖合成酶,优选GenBank登录号为AF263384的蔗糖合成酶(编码序列如SEQ IDNO:9所示,氨基酸序列如SEQ ID NO:10所示)。所述蔗糖合成酶AtSUS3指来源于拟南芥(Arabidopsis thaliana)的蔗糖合成酶,优选GenBank登录号为NM_116461的蔗糖合成酶(编码序列如SEQ ID NO:11所示,氨基酸序列如SEQ ID NO:12所示)。
本文也包括所述酶的生物活性片段及所述酶或其生物活性片段的变体。酶的生物活性片段的含义是指作为一种多肽,其仍然能保持全长的酶或蛋白的全部或部分功能。通常情况下,所述的生物活性片段至少保持50%的全长酶或蛋白的活性。在更优选的条件下,所述活性片段能够保持全长酶或蛋白的55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%、或100%的活性。
本文中,所述酶或其生物活性片段的突变体指经过一个或多个氨基酸残基的取代、缺失或添加而形成的氨基酸序列。适当替换氨基酸是本领域公知的技术,所述技术可以很容易地被实施,并且确保不改变所得分子的生物活性。这些技术使本领域人员认识到,一般来说,在一种多肽的非必要区域改变单个氨基酸基本上不会改变生物活性(见Watson等Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub.Co.P224)。在特别优选的实施方案中,本发明包括其氨基酸序列与所述酶具有至少85%、至少90%、至少95%、至少97%、至少98%、至少99%序列同一性,同时保留了所述酶的生物学活性的蛋白或酶。优选地,所述变体来自相同的来源(如相同的植物),如糖基转移酶RsUGT85A57来源于悬钩子变种,因此其变体优选也来自悬钩子变种。示例性的SrUGT74G1的突变体如前文所述。
本发明也可采用经修饰或改良的酶或蛋白,比如,可采用为了促进其半衰期、有效性、代谢和/或蛋白的效力而加以修饰或改良的酶或蛋白。所述经过修饰或改良的酶或蛋白可以是一种共轭物,或其可包含被取代的或人工的氨基酸。所述经过修饰或改良的酶或蛋白可以是与天然存在的酶或蛋白具有较小的共同点,但也能发挥与野生型相同或基本相同的功能,且不会带来其它不良影响。也就是说,任何不影响酶或蛋白的生物活性的变化形式都可应用于本发明中。
本发明中,“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞包括大肠杆菌、枯草杆菌等;常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。作为本发明的优选方式,所述的细胞选自(但不限于):大肠杆菌、酵母细胞。更优选地,所述的酵母细胞是酿酒酵母。较佳地,所述大肠杆菌选自DH10;较佳地,所述的酿酒酵母选自WAT11。
在一个或多个实施方案中,所述宿主细胞:
表达:(1)下述四个糖基转移酶中的至少三个:将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶,将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶,将甜菊醇催化生成甜菊单糖苷的糖基转移酶,以及将甜菊单糖苷催化生成甜茶素的糖基转移酶;和(2)至少一种蔗糖合成酶;和/或
含有:(a)下述四个糖基转移酶中的至少两个、优选至少三个的编码序列或其表达载体:将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶,将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶,将甜菊醇催化生成甜菊单糖苷的糖基转移酶,以及将甜菊单糖苷催化生成甜茶素的糖基转移酶;和(2)至少一种蔗糖合成酶的编码序列或其表达载体。
在一个或多个实施方案中,所述将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶选自:(i)糖基转移酶AkUGT75L21,(ii)糖基转移酶SrUGT74G1,和(iii)其氨基酸序列与糖基转移酶AkUGT75L21或SrUGT74G1具有至少85%序列同一性、同时具有将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶选自:(i)糖基转移酶RsUGT85A57,(ii)糖基转移酶SrUGT85C2,和(iii)其氨基酸序列与糖基转移酶RsUGT85A57或SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述将甜菊醇催化生成甜菊单糖苷的糖基转移酶选自:(i)糖基转移酶SrUGT85C2,和(ii)其氨基酸序列与糖基转移酶SrUGT85C2具有至少85%序列同一性、同时具有将甜菊醇催化生成甜菊单糖苷的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述将甜菊单糖苷催化生成甜茶素的糖基转移酶选自:(i)糖基转移酶AkUGT75L21,(ii)糖基转移酶SrUGT74G1,和(iii)其氨基酸序列与糖基转移酶AkUGT75L21或SrUGT74G1具有至少85%序列同一性、同时具有将甜菊单糖苷催化生成甜茶素的生物学功能的糖基转移酶。
在一个或多个实施方案中,所述宿主细胞至少表达所述将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶和所述将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶。优选地,所述至少两种糖基转移酶至少包括糖基转移酶AkUGT75L21和糖基转移酶RsUGT85A57。
在一个或多个实施方案中,所述宿主至少表达将甜菊醇催化生成甜菊醇19-O-β-D-葡萄糖苷的糖基转移酶,将甜菊醇19-O-β-D-葡萄糖苷催化生成甜茶素的糖基转移酶和将甜菊醇催化生成甜菊单糖苷的糖基转移酶。优选地,所述至少两种糖基转移酶至少包括糖基转移酶AkUGT75L21、糖基转移酶RsUGT85A57和糖基转移酶SrUGT85C2。
在一个或多个实施方案中,所述宿主表达所述所有四种糖基转移酶。优选地,所述至少两种糖基转移酶包括糖基转移酶AkUGT75L21、糖基转移酶RsUGT85A57、糖基转移酶SrUGT85C2和糖基转移酶SrUGT74G1或其突变体。
在一个或多个实施方案中,所述宿主细胞选自大肠杆菌和酵母。优选地,所述酵母为酿酒酵母。
在一个或多个实施方案中,所述宿主细胞为酿酒酵母,其表达:(1)糖基转移酶AkUGT75L21,糖基转移酶RsUGT85A57,以及蔗糖合成酶AtSUS3或SoSUS2;或(2)糖基转移酶AkUGT75L21,糖基转移酶RsUGT85A57,糖基转移酶SrUGT85C2,以及蔗糖合成酶AtSUS3或SoSUS2;或(3)糖基转移酶AkUGT75L21,糖基转移酶RsUGT85A57,糖基转移酶SrUGT85C2,糖基转移酶SrUGT74G1或其突变体,以及蔗糖合成酶AtSUS3或SoSUS2。
试剂盒
本发明在另一个方面提供试剂盒。该试剂盒含有表达载体,所述表达载体用于表达:(1)将甜菊醇C13位羟基糖基化的糖基转移酶,(2)将甜菊醇C4位羧基糖基化的糖基转移酶,和(3)至少一种蔗糖合成酶。优选地,所述糖基转移酶和蔗糖合成酶如前述任一实施方案所述。
试剂盒中还可含有将所述表达载体转入宿主细胞中所需的试剂。
本发明中,表达载体可以是能够方便地经受重组DNA方法并且可导致感兴趣的核苷酸序列表达的任何载体(如质粒或病毒)。载体的选择一般取决于载体与其中被导入该载体的宿主细胞的相容性。该载体可以是线性或闭合的环形质粒。
载体可以是自主复制的载体,即作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体或人工染色体。载体可包含用于保证自我复制的任何方式。优选的是,本发明的载体被导入宿主细胞后,能整合到基因组中。更优选的是,本发明的载体被导入宿主细胞后,能通过与基因组发生同源重组,从而整合到基因组中。
表达载体通常含有编码本文所述酶或其生物活性片段或其变体的核酸分子,以及与所述核酸分子的序列操作性相连的表达调控序列,以便于蛋白的表达。所述的表达调控序列的设计是本领域公知的。表达调控序列中,根据不同的需要,可以应用诱导型或组成型的启动子,诱导型的启动子可实现更可控的蛋白表达以及化合物生产,有利于工业化应用。
表达载体的建立目前已经是本领域技术人员熟悉的技术。因此,在得知了所需选择的酶或蛋白之后,本领域技术人员易于进行表达构建物的建立。编码酶或蛋白的基因序列可以被插入到不同的表达构建物(如表达载体)中,也可以被插入到同一表达构建物中,只要在转入到细胞后酶或蛋白能够被有效地表达即可。
在优选的实施方案中,本发明使用选自pESC-HIS、pESC-URA和pESC-LEU的载体做为骨架构建本发明的重组表达载体。
催化转化甜菊醇生成甜茶素的方法
本发明在另一个方面公开了一种利用酿酒酵母底盘全细胞催化转化甜菊醇生成甜茶素的方法。通过将甜茶素的糖基化合成途径中糖基转移酶编码基因与拟南芥来源或甘蔗来源的蔗糖合酶偶联,实现在微生物底盘中尿苷二磷酸葡萄糖(UDPG)的原位再生;进一步地,通过构建重组工程菌,建立全细胞催化工艺,在不添加外源UDPG的条件下实现甜茶素的高效生物催化转化。
本发明的甜菊醇糖基化转化途径参见图7。以甜菊醇为前体,经AkUGT75L21糖基转移酶和SrUGT74G1糖基转移酶作用获得甜茶素合成的通用前体甜菊醇19-O-β-D-葡萄糖苷,最终经SrUGT85C2糖基转移酶和RsUGT85A57糖基转移酶作用,形成甜茶素。或者经第二种甜菊醇糖基化转化途径,以甜菊醇为前体,经SrUGT85C2糖基转移酶作用获得甜茶素合成的通用前体甜菊单糖苷,最终经AkUGT75L21糖基转移酶和SrUGT74G1糖基转移酶或其突变体作用,形成甜茶素。
在一些实施方案中,本发明提供一种甜茶素生产方法,所述方法包括在适合所述的宿主细胞合成甜茶素的条件下培养本文任一实施方案所述的宿主细胞,以及分离得到甜茶素的步骤。优选地,所述培养包括催化细胞生产甜茶素的细胞催化反应,其中,在甜菊醇、蔗糖和金属离子的存在下进行催化反应,其中催化反应体系的pH为7.2~8.2,催化反应在25~35℃的条件下进行。优选地,所述金属离子不包括Mn离子和Mg离子;优选地,所述金属离子为Co
优选地,催化反应体系中还含有表面活性剂,优选CTAB;优选地,表面活性剂的浓度为5~15g/L;催化反应体系中甜菊醇的浓度为1~2g/L;催化反应体系中蔗糖的浓度可为10~40g/100mL。优选地,所述催化反应体系中未添加外源UDPG。
糖基转移酶SrUGT74G1的突变体
在本发明的一个实施方案中,本发明也提供SrUGT74G1糖基转移酶的突变体。具体而言,所述突变体与糖基转移酶SrUGT74G1的野生型序列(GenBank登录号为AAR06920)相比,在其第83、84、87、88、190和192位中的一个或多个位置上发生取代突变。优选地,与野生型序列相比,所述突变体在第84和87位中的任意一个或全部位置上发生取代突变。
优选地,所述取代突变为所述位置上的野生型氨基酸残基被选自甘氨酸、丙氨酸、亮氨酸、异亮氨酸和缬氨酸中的一个或多个取代,优选突变为丙氨酸。
优选地,SrUGT74G1的所述突变体为单突变体,与野生型SrUGT74G1相比,在所述第83、84、87、88、190或192位发生E83A、S84A、E87A、T88A、P190A或S192A突变。
优选地,SrUGT74G1的所述突变体为双突变体,与野生型SrUGT74G1相比,在选自第83、84、87、88、190和192位中的任意两个位置上发生取代突变;优选地,任意两个位置上的氨基酸残基被突变为丙氨酸;更优选地,所述双突变体为在第84和87位上发生取代突变的突变体,更优选为发生了S84A和E87A取代突变的双突变体。
本发明还包括所述糖基转移酶SrUGT74G1的突变体在制备甜茶素中的应用,包括在构建用于转化宿主细胞如大肠杆菌或酵母以生产甜茶素的表达载体中的应用,以及在制备能生产甜茶素的宿主细胞如大肠杆菌或酵母中的应用。
本发明的有益效果
利用本发明的方法的关键最终产物甜茶素的比例提升至74.9%,产量达到1.92g/L(3.00mM)。该方法可替代植物提取法获得具有巨大市场价值的甜茶素,具有广阔的应用前景和发展潜力。
本发明的方法克服了传统从植物中提取时的繁琐、受环境影响大、破坏自然资源等缺点,具有成本低、占地面积少、产品质量可控等优点。
应理解,在本发明范围中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著的《分子克隆实验指南》(第3版,科学出版社,2002)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
材料和方法
甘蔗培养于中国科学院分子植物科学卓越创新中心人工气候室,采用20℃恒温培养。
寡核苷酸引物购自生工生物工程(上海)股份有限公司。密码子优化合成序列由通用生物系统(安徽)有限公司合成。
AxyPrep总RNA小量制备试剂盒,多聚酶链式反应(PCR)胶回收试剂盒,质粒抽提试剂盒均为美国Axygen产品;PrimeScript RT reagent Kit with gDNA Eraser(PerfectReal Time)聚合酶试剂盒,聚合酶链式反应高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品。无缝克隆使用
大肠杆菌DH10B菌株、酿酒酵母WAT11菌株和pESC-HIS、pESC-URA、pESC-LEU载体用于基因克隆及蛋白表达。
标准品化合物甜菊醇(steviol)和甜菊单糖苷(steviolmonoside)购自上海源叶生物科技有限公司;甜茶素(rubusoside)购自南京广润生物制品有限公司;甜菊糖19-O-β-D-葡萄糖酯(S19G)为实验室制备,通过NMR和MS分析确认结构。其他试剂为国产分析纯或色谱纯试剂,购自国药集团化学试剂有限公司。
PCR使用Arktik Thermal Cycler(Thermo Fisher Scientific)。高效液相色谱使用Dionex UltiMate 3000液相色谱系统(Thermo Fisher Scientific)。高分辨质谱由Thermo Fisher Scientific静电场轨道阱组合质谱Q Exactive测得。
实施例1、酿酒酵母全细胞催化转化生产甜茶素
本实施例中,甜茶素苷元甜菊醇(steviol)的糖基化途径如图1。甜菊醇(steviol)经糖基转移酶AkUGT75L21催化生成甜菊醇19-O-β-D-葡萄糖苷(steviol 19-O-β-D-glucoside),其再经RsUGT85A57催化生成甜茶素。
1、甜茶素糖基化转化质粒p5025的构建
以RsUGT85A57(GenBank登录号:MG592709.1)的克隆载体为模板,UGT25-F-BamHI/UGT25-R-SalI(表1)为引物对扩增RsUGT85A57片段,将该片段通过无缝克隆法插入pESC-LEU载体多克隆位点1的SalI和BamHI之间。以AkUGT75L21(GenBank登录号:MG592710.1)的克隆载体为模板,使用引物对UGT50-F-SpeI/UGT50-R-NotI(表1)扩增AkUGT75L21片段后插入pESC-LEU载体多克隆位点2的SpeI和NotI位点之间,构成质粒p5025(图3)。将质粒转化大肠杆菌DH10B,涂布含氨苄青霉素(100μg/mL)的LB固体培养基平板,37℃过夜培养后挑取转化子测序验证。
表1、构建甜茶素糖基化转化质粒p5025所用引物
2、构建甜茶素生产菌株及酵母全细胞催化体系建立
将测序验证的质粒p5025转化到酿酒酵母WAT11的感受态细胞中以获得工程菌株,命名为sRub1。
使用氨基酸缺陷型SD-LEU培养基(添加2%的葡萄糖)在30℃培养过夜。挑取单个sRub1克隆到5mL SD-LEU培养基,30℃,200rpm,培养24小时至OD
结果如图4所示,在体系中添加蔗糖浓度=40g/100mL时(图4,A),转化体系中含有0.11mM甜茶素(终产物),0.22mM甜菊醇19-O-β-D-葡萄糖苷(中间体)和3.67mM甜菊醇(残留底物)。甜茶素产量约为68mg/L,转化率为2.66%。蔗糖浓度为0%的情况下未检测到糖基化产物,随蔗糖浓度升高,检测到反应液中含甜茶素、甜菊醇19-O-β-D-葡萄糖苷和大量未转化的甜菊醇(图4,B)。该结果表明,在不添加外源性尿苷二磷酸葡萄糖(UDPG)的情况下,酵母自身具有一定的糖基化催化能力,然而未能实现底物的充分糖基化,提示后续需要进一步通过提高UDPG的供给、改进糖基转移酶等手段提高糖基化效率。
实施例2、利用蔗糖合成酶偶联糖基转移酶在酵母全细胞催化体系中生产甜茶素
本实施例的糖基化途径在实施例1的基础上进一步引入糖基转移酶SrUGT85C2,SrUGT85C2能够糖基化中间体甜菊醇19-O-β-D-葡萄糖苷,减少该中间体的积累(图5)。同时,SrUGT85C2能够糖基化苷元甜菊醇,产生中间体甜菊单糖苷(steviolmonoside),该中间体经由AkUGT75L21的催化能够转化生成甜茶素,由此形成双途径的糖基化系统(图5)。在本实施例中同时考虑引入不同来源的蔗糖合酶,以便能够实现UDPG的循环再生,提高UDPG的内源供给。
1、糖基化转化质粒p85的构建
以SrUGT85C2(编码蛋白GenBank登录号:AAR06916,核酸序列经由密码子优化)的克隆载体为模板,85C2-F-BamHI/85C2-R-SalI(表2)为引物对扩增SrUGT85C2片段,将该片段通过无缝克隆法插入pESC-URA载体多克隆位点1的SalI和BamHI之间,构成质粒p85(图2)。将质粒转化大肠杆菌DH10B,涂布含氨苄青霉素(100μg/mL)的LB固体培养基平板,37℃过夜培养后挑取转化子测序验证。
表2、构建糖基化转化质粒p85、蔗糖合酶表达载体pS2、pS3所用引物
2、蔗糖合酶表达载体pS2、pS3的构建
以AtSUS3(GenBank登录号:NM_116461)的克隆载体为模板,使用引物对SUS3-F-BamHI/SUS3-R-SalI(表2)扩增AtSUS3片段。将该片段通过无缝克隆法插入pESC-HIS载体多克隆位点1的SalI和BamHI之间,获得质粒获得pS3(图2)。以甘蔗cDNA为模板,SUS1-F-BamHI/SUS1-R-SalI(表2)为引物对扩增SoSUS2片段。克隆得到的SoSUS2片段与公开报道的栽培甘蔗(Saccharum spp.hybrids)来源的sucrose synthase-1(GenBank登录号:AF263384)的核酸和蛋白序列相似度为99.63%。将该片段通过无缝克隆法插入pESC-HIS载体多克隆位点1的SalI和BamHI之间,获得质粒获得pS2(图3)。将质粒转化大肠杆菌DH10B,涂布含氨苄青霉素(100μg/mL)的LB固体培养基平板,37℃过夜培养后挑取转化子测序验证。
3、全细胞催化菌株的优化
将质粒p5025和pS3共同转化到酿酒酵母WAT11的感受态细胞中,获得工程菌株sRub2。将质粒p5025和pS2共同转化到酿酒酵母WAT11的感受态细胞中,获得工程菌株sRub3。将质粒p5025、p85和pS3共同转化到酿酒酵母WAT11的感受态细胞中,获得工程菌株sRub4。将质粒p5025、p85和pS2共同转化到酿酒酵母WAT11的感受态细胞中,获得工程菌株sRub5。
使用合适的氨基酸缺陷型SD培养基(添加2%的葡萄糖)(sRub2使用SD-LEU-HIS,sRub3使用SD-LEU-HIS,sRub4使用SD-LEU-HIS-URA,sRub5使用SD-LEU-HIS-URA)在30℃培养过夜。挑取单个克隆到5mL氨基酸缺陷型SD培养基,30℃,200rpm,培养24小时至OD
结果如图6所示,与对照菌株sRub1相比,引入拟南芥来源的蔗糖合酶AtSUS3的sRub2糖基化效率大幅提高,反应体系中甜茶素占26.6%,中间体甜菊醇19-O-β-D-葡萄糖苷占25.0%,未反应的底物甜菊醇占48.4%,甜茶素产量为683mg/L(1.06mM)。引入甘蔗来源的蔗糖合酶SoSUS2的sRub3糖基化效率同样大幅提高,反应体系中甜茶素占41.8%,中间体甜菊醇19-O-β-D-葡萄糖苷占23.1%,未反应的底物甜菊醇占35.1%,甜茶素产量为1.07g/L(1.67mM)。这一结果表明甘蔗来源的SoSUS2对于UDPG的循环再生能力优于拟南芥来源的AtSUS3。
由于sRub2和sRub3的产物中有较多甜菊醇19-O-β-D-葡萄糖苷的积累,因此我们进一步引入SrUGT85C2以转化这一中间体。如图6所示,在工程菌sRub4和sRub5中,甜菊醇19-O-β-D-葡萄糖苷的比例显著缩小或至消失,同时底物甜菊醇的残留亦显著减少,主要因为SrUGT85C2将甜菊醇转化为甜菊单糖苷(图5)。菌株sRub4的甜茶素产量为1.04g/L(1.62mM),菌株sRub5的甜茶素产量为1.34g/L(2.09mM)。菌株sRub5的转化产物中含52.4%的甜茶素,1.2%的中间体甜菊醇19-O-β-D-葡萄糖苷、35.7%的中间体甜菊单糖苷,未反应的底物甜菊醇占10.7%。
实施例3、四元糖基转移酶偶联蔗糖合成酶催化生产甜茶素及全细胞催化体系条件优化
由于在实施例2中,菌株sRub4和sRub5仍有部分中间体甜菊单糖苷和苷元甜菊醇未能转化,因此考虑继续引入甜叶菊来源的SrUGT74G1来转化残留底物。本实施例中的双途径的糖基化系统如图7。SrUGT74G1分别催化苷元甜菊醇和中间体甜菊单糖苷的19-O-糖基化。
1、糖基化转化质粒p8574的构建
以SrUGT74G1(编码蛋白GenBank登录号:AAR06920,核酸序列经由密码子优化)的克隆载体为模板,使用引物对74G1-F-SpeI/74G1-R-NotI(表3)扩增后插入上述构建载体p85的多克隆位点2的SpeI和NotI位点之间,构成质粒p8574(图3)。将质粒转化大肠杆菌DH10B,涂布含氨苄青霉素(100μg/mL)的LB固体培养基平板,37℃过夜培养后挑取转化子测序验证。
表3、构建糖基化转化质粒p8574所用引物
3、全细胞催化菌株的建立及反应条件优化
将质粒p5025、p8574和pS2共同转化到酿酒酵母WAT11的感受态细胞中,获得工程菌株sRub6。
使用合适的氨基酸缺陷型SD-LEU-HIS-URA培养基(添加2%的葡萄糖)在30℃培养过夜。挑取单个克隆到5mL氨基酸缺陷型SD培养基,30℃,200rpm,培养24小时至OD
分析结果如图7(B)所示,在添加蔗糖40%的情况下,sRub6的反应混合物中终产物甜茶素的比例提升至61.0%,产量达到1.57g/L(2.44mM),底物甜菊醇的积累降至7.2%。随蔗糖浓度的升高,糖基化产物的比例逐渐增加。在不添加蔗糖的情况下,反应混合物中含有14.1%甜茶素、45.4%甜菊单糖苷、5.7%甜菊醇19-O-β-D-葡萄糖苷和34.8%未反应的底物甜菊醇。
进一步以工程菌株sRub6为基础,通过单因素实验考察了可能影响糖基化催化活性的多方面因素,其中包括(1)反应温度,(2)反应pH,(3)反应时间,(4)金属离子(图8)。我们发现反应体系的最适的反应温度为30℃,最佳pH为7.4(与初始对照pH 7.6无显著差异)。延长反应时间虽然能够一定程度增加甜茶素的产量,但是在单位时间内的产量并不具优势,因此合适的反应时间应选择在12~24小时内。在金属阳离子中,Mn
实施例4、SrUGT74G1突变体四元糖基转移酶偶联蔗糖合成酶催化生产甜茶素
由于在实施例3中,菌株sRub6仍有部分中间体甜菊单糖苷和苷元甜菊醇未能转化,因此考虑继续针对SrUGT74G1进行突变来转化残留底物。通过多序列比对,将SrUGT74G1的序列与其他来源的UGT74家族糖基转移酶(包括来自罗汉果的SgUGT74AC1、来自拟南芥的AtUGT74F2和来自水稻的Os79)进行序列比对(图9,A)。我们使用SgUGT74AC1(PDB ID:6L8Z)作为模板,基于同源建模构建了SrUGT74G1的结构模型。根据模型,我们认为α3和α7螺旋上的六个相邻的残基(Glu83、Ser84、Glu87、Thr88、Pro190和Ser192),其突变可能会影响关键残基Y85/L86和W191的朝向,从而影响SrUGT74G1的催化活性和底物特异性(图9,B)。我们对上述6个残基进行了丙氨酸扫描,并对于其中活性有所改善的Ser84和Glu87进行了双突变。
1、糖基化转化质粒p8574-突变体的构建
以SrUGT74G1(编码蛋白GenBank登录号:AAR06920,核酸序列经由密码子优化)的克隆载体为模板,使用表4中的引物扩增后插入上述构建载体p85的多克隆位点2的SpeI和NotI位点之间,构成质粒p8574-mutant(74G1
表4、构建糖基化转化质粒p8574-mutant所用引物
3、全细胞催化菌株的建立
将质粒p5025、pS2和p8574-mutant(74G1
使用合适的氨基酸缺陷型SD-LEU-HIS-URA培养基(添加2%的葡萄糖)在30℃培养过夜。挑取单个克隆到5mL氨基酸缺陷型SD培养基,30℃,200rpm,培养24小时至OD
分析结果如图10所示,在添加蔗糖40%的情况下,sRub13的反应混合物中终产物甜茶素的比例提升至74.9%,产量达到1.92±0.17g/L(3.00mM),甜菊单糖苷降至23.3%,无甜菊醇19-O-β-D-葡萄糖苷积累,底物甜菊醇的积累降至1.8%。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院分子植物科学卓越创新中心
<120> 用于甜茶素生产的宿主细胞及方法
<130> 215418
<160> 38
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1434
<212> DNA
<213> 明日叶(Angelica keiskei)
<400> 1
atggcaaacc aacgtcacat cctcctcata acattcccgg cacaaggcca cataaatccc 60
agcctccaat tttccaagaa acttacaagg atgggggttg aagttacatt tgcaaccagt 120
ttgtcagccc acagccgcat ggccaacact ctagcagcta caaaaggcct taatatcgct 180
cccttctccg atggctatga tgatggcttc aagcttactg atgatgctaa gcatttcatg 240
tcctccatac gtaaccacgg atccgagagt gtcaaacaaa tattacgttc tagtgctgag 300
caaggccgcc ctgttagttg tgttgtgtac acacttcttc tcccatgggt ggcagaggtg 360
gcccgtgaat ttcacgtgcc gtctgccctc ctttggattc aacctgcttc tgttttggat 420
atttactact actatttcaa tgggtatggt gaggccatga acgattgttt agatgacccc 480
tcttggtcaa tacaattacc tggtttgcca ctcctccatg cacgtgacct tccttcgttt 540
atacttccta catgccacga aatgtacagt tttgctctcc catcattcaa agagcagctc 600
gatgcactga atgcggatga aaggcctatg gtgcttgtaa attcttttga tgcactggaa 660
tcggaggctc tcaaagcaat caaaaagctc gagttgattg caatcggtcc ggtccttcca 720
tcagctttct tggatggcaa ggatccttcg gacacttcag ttggaggtga cctattccaa 780
aaatcaagaa actacagaga ttggttggat gccaagcctc ccaaatccgt gatttatata 840
tcattcggaa gtatattaac attgtcaaag cctcagatga acgagattgg aaaaggcttg 900
ctaaaaagtg gaatgccatt tttgtgggtg ataaggaaaa aagaaggcga atcaagcggg 960
caacaagtag aggaagagga attaagtggc agggaggaat tggaaaaaca aggaatgata 1020
gtgccatggt gtagtcaact agaagtactg tcacaccctg cactaggatg tttcgtgacg 1080
cattgcggtt ggaattcgac attggagagt ttggtttcga gggttccggt ggtggcattt 1140
ccgcattgga cggatcagac gacaaatgcg aagttgatag aagatgtgtg gaagacggga 1200
gtgagagtga gagtaaatgg taatgaagga atggttgatg gtgatgaagt tgataggtgc 1260
atagaaatgg tgatgggaaa tgaagaattg agaagcaatg caaagaaatg gggtgatttg 1320
gctagggaag caataagtga aggtggatct tcggataaga atctaaaggc ttttgtggaa 1380
catgttgatc accaagtcac acccacggga tgtctcgaga gcagtggcgc ttaa 1434
<210> 2
<211> 477
<212> PRT
<213> 明日叶(Angelica keiskei)
<400> 2
Met Ala Asn Gln Arg His Ile Leu Leu Ile Thr Phe Pro Ala Gln Gly
1 5 1015
His Ile Asn Pro Ser Leu Gln Phe Ser Lys Lys Leu Thr Arg Met Gly
202530
Val Glu Val Thr Phe Ala Thr Ser Leu Ser Ala His Ser Arg Met Ala
354045
Asn Thr Leu Ala Ala Thr Lys Gly Leu Asn Ile Ala Pro Phe Ser Asp
505560
Gly Tyr Asp Asp Gly Phe Lys Leu Thr Asp Asp Ala Lys His Phe Met
65707580
Ser Ser Ile Arg Asn His Gly Ser Glu Ser Val Lys Gln Ile Leu Arg
859095
Ser Ser Ala Glu Gln Gly Arg Pro Val Ser Cys Val Val Tyr Thr Leu
100 105 110
Leu Leu Pro Trp Val Ala Glu Val Ala Arg Glu Phe His Val Pro Ser
115 120 125
Ala Leu Leu Trp Ile Gln Pro Ala Ser Val Leu Asp Ile Tyr Tyr Tyr
130 135 140
Tyr Phe Asn Gly Tyr Gly Glu Ala Met Asn Asp Cys Leu Asp Asp Pro
145 150 155 160
Ser Trp Ser Ile Gln Leu Pro Gly Leu Pro Leu Leu His Ala Arg Asp
165 170 175
Leu Pro Ser Phe Ile Leu Pro Thr Cys His Glu Met Tyr Ser Phe Ala
180 185 190
Leu Pro Ser Phe Lys Glu Gln Leu Asp Ala Leu Asn Ala Asp Glu Arg
195 200 205
Pro Met Val Leu Val Asn Ser Phe Asp Ala Leu Glu Ser Glu Ala Leu
210 215 220
Lys Ala Ile Lys Lys Leu Glu Leu Ile Ala Ile Gly Pro Val Leu Pro
225 230 235 240
Ser Ala Phe Leu Asp Gly Lys Asp Pro Ser Asp Thr Ser Val Gly Gly
245 250 255
Asp Leu Phe Gln Lys Ser Arg Asn Tyr Arg Asp Trp Leu Asp Ala Lys
260 265 270
Pro Pro Lys Ser Val Ile Tyr Ile Ser Phe Gly Ser Ile Leu Thr Leu
275 280 285
Ser Lys Pro Gln Met Asn Glu Ile Gly Lys Gly Leu Leu Lys Ser Gly
290 295 300
Met Pro Phe Leu Trp Val Ile Arg Lys Lys Glu Gly Glu Ser Ser Gly
305 310 315 320
Gln Gln Val Glu Glu Glu Glu Leu Ser Gly Arg Glu Glu Leu Glu Lys
325 330 335
Gln Gly Met Ile Val Pro Trp Cys Ser Gln Leu Glu Val Leu Ser His
340 345 350
Pro Ala Leu Gly Cys Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu
355 360 365
Glu Ser Leu Val Ser Arg Val Pro Val Val Ala Phe Pro His Trp Thr
370 375 380
Asp Gln Thr Thr Asn Ala Lys Leu Ile Glu Asp Val Trp Lys Thr Gly
385 390 395 400
Val Arg Val Arg Val Asn Gly Asn Glu Gly Met Val Asp Gly Asp Glu
405 410 415
Val Asp Arg Cys Ile Glu Met Val Met Gly Asn Glu Glu Leu Arg Ser
420 425 430
Asn Ala Lys Lys Trp Gly Asp Leu Ala Arg Glu Ala Ile Ser Glu Gly
435 440 445
Gly Ser Ser Asp Lys Asn Leu Lys Ala Phe Val Glu His Val Asp His
450 455 460
Gln Val Thr Pro Thr Gly Cys Leu Glu Ser Ser Gly Ala
465 470 475
<210> 3
<211> 1446
<212> DNA
<213> 悬钩子变种(Rubus chingii var. suavissimus)
<400> 3
atggcttctg gttataatca taagcctcat gctgtttgta ttccagctcc tgctcaaagc 60
cacattaagg ctatgcttaa attagccaaa atcctccatc acagaggctt tcacattacc 120
tttgtcaaca cagaattcaa ccacaaacga tttcttgagt caagaggtcc taactccctc 180
gatggcttac ctgattttca ctttgaagcc atccctgatg gatttccaga atcaggtgaa 240
gatccaacgc aagatatcac tgtgcttatt gaatccgtca gaatccatct tttggctcca 300
tttcgggacc tcctgataaa actcaacagt actagttctc cagtgacttg cattttttca 360
gatggtttca tgtccgcttt taccaccaga gctgccgagg aacttggaat tcctattgca 420
ttgatctaca ctatttctgc ttgcagcttc atgggattaa ggaaattccg cactttgctt 480
gagaaaggac ttgcaccact caaagatgag agctgtatga caaatgggtt tctggacaaa 540
gttatagaat ggattccgag aaagaaagat atccgattat gggatctacc aagcttttgc 600
cgaactacaa atcctgatga catcatgttc cactacacca tggaagctgc tgaagaagca 660
aataaagctt cagccgttgt tcttctcaca tatgatgctt tggaaaaaga tgttttggaa 720
gttctctcct catctatttc tccaccagtt tatactattg gtcctctcca attgcttcta 780
gatcaaatag cagaagaccc tttgaagcct atgggataca gtctttggaa ggaggaaaca 840
gactgtctcc aatggctaca gtctaaggca ccaaactcaa ttgtttatgt caattttggc 900
agcatcgcgg ttttgacacc tgaacagctg gttgagtttg gttggggact ggctaatacc 960
aagcttccct tcttctgggt cattaggcct gatttggttg ttggaaattc ggcgattttg 1020
ccaccggagt tcgaaactga aaccaaagac agaggtctaa tagccagttg gtgcccccaa 1080
gaacaagtcc taaaccatcc atcagttgga ggatttctca cacacagtgg ttggaattca 1140
atcattgaga gtgtaacagc tggagtgccg atgctgtgtt ggccattctt tgcagaccag 1200
caaacaaaca gttactacac ttgcaatgaa tggggtattg gcatggagat caatagtaac 1260
gtaaagagag acaatgtgga gaagcttgta agggagttaa tggacggaga gaagggtaag 1320
aagatgaaaa acaaggtctt ggagtggaag agacttgctg aagaagccac agctccacat 1380
ggttcttcat caacaaactt ggacaattta gtgaatcaag tcctattaag gaagcgcacg 1440
tactag 1446
<210> 4
<211> 481
<212> PRT
<213> 悬钩子变种(Rubus chingii var. suavissimus)
<400> 4
Met Ala Ser Gly Tyr Asn His Lys Pro His Ala Val Cys Ile Pro Ala
1 5 1015
Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Lys Ile Leu
202530
His His Arg Gly Phe His Ile Thr Phe Val Asn Thr Glu Phe Asn His
354045
Lys Arg Phe Leu Glu Ser Arg Gly Pro Asn Ser Leu Asp Gly Leu Pro
505560
Asp Phe His Phe Glu Ala Ile Pro Asp Gly Phe Pro Glu Ser Gly Glu
65707580
Asp Pro Thr Gln Asp Ile Thr Val Leu Ile Glu Ser Val Arg Ile His
859095
Leu Leu Ala Pro Phe Arg Asp Leu Leu Ile Lys Leu Asn Ser Thr Ser
100 105 110
Ser Pro Val Thr Cys Ile Phe Ser Asp Gly Phe Met Ser Ala Phe Thr
115 120 125
Thr Arg Ala Ala Glu Glu Leu Gly Ile Pro Ile Ala Leu Ile Tyr Thr
130 135 140
Ile Ser Ala Cys Ser Phe Met Gly Leu Arg Lys Phe Arg Thr Leu Leu
145 150 155 160
Glu Lys Gly Leu Ala Pro Leu Lys Asp Glu Ser Cys Met Thr Asn Gly
165 170 175
Phe Leu Asp Lys Val Ile Glu Trp Ile Pro Arg Lys Lys Asp Ile Arg
180 185 190
Leu Trp Asp Leu Pro Ser Phe Cys Arg Thr Thr Asn Pro Asp Asp Ile
195 200 205
Met Phe His Tyr Thr Met Glu Ala Ala Glu Glu Ala Asn Lys Ala Ser
210 215 220
Ala Val Val Leu Leu Thr Tyr Asp Ala Leu Glu Lys Asp Val Leu Glu
225 230 235 240
Val Leu Ser Ser Ser Ile Ser Pro Pro Val Tyr Thr Ile Gly Pro Leu
245 250 255
Gln Leu Leu Leu Asp Gln Ile Ala Glu Asp Pro Leu Lys Pro Met Gly
260 265 270
Tyr Ser Leu Trp Lys Glu Glu Thr Asp Cys Leu Gln Trp Leu Gln Ser
275 280 285
Lys Ala Pro Asn Ser Ile Val Tyr Val Asn Phe Gly Ser Ile Ala Val
290 295 300
Leu Thr Pro Glu Gln Leu Val Glu Phe Gly Trp Gly Leu Ala Asn Thr
305 310 315 320
Lys Leu Pro Phe Phe Trp Val Ile Arg Pro Asp Leu Val Val Gly Asn
325 330 335
Ser Ala Ile Leu Pro Pro Glu Phe Glu Thr Glu Thr Lys Asp Arg Gly
340 345 350
Leu Ile Ala Ser Trp Cys Pro Gln Glu Gln Val Leu Asn His Pro Ser
355 360 365
Val Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Ile Ile Glu Ser
370 375 380
Val Thr Ala Gly Val Pro Met Leu Cys Trp Pro Phe Phe Ala Asp Gln
385 390 395 400
Gln Thr Asn Ser Tyr Tyr Thr Cys Asn Glu Trp Gly Ile Gly Met Glu
405 410 415
Ile Asn Ser Asn Val Lys Arg Asp Asn Val Glu Lys Leu Val Arg Glu
420 425 430
Leu Met Asp Gly Glu Lys Gly Lys Lys Met Lys Asn Lys Val Leu Glu
435 440 445
Trp Lys Arg Leu Ala Glu Glu Ala Thr Ala Pro His Gly Ser Ser Ser
450 455 460
Thr Asn Leu Asp Asn Leu Val Asn Gln Val Leu Leu Arg Lys Arg Thr
465 470 475 480
Tyr
<210> 5
<211> 1446
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggacgcga tggcgaccac cgaaaaaaaa ccgcacgtta tcttcatccc gttcccggcg 60
cagtctcaca tcaaagcgat gctgaaactg gcgcagctgc tgcaccacaa aggtctgcag 120
atcaccttcg ttaacaccga cttcatccac aaccagttcc tggaatcttc tggtccgcac 180
tgcctggacg gtgcgccggg tttccgtttc gaaaccatcc cggacggtgt ttctcactct 240
ccggaagcgt ctatcccgat ccgtgaatct ctgctgcgtt ctatcgaaac caacttcctg 300
gaccgtttca tcgacctggt taccaaactg ccggacccgc cgacctgcat catctctgac 360
ggtttcctgt ctgttttcac catcgacgcg gcgaaaaaac tgggtatccc ggttatgatg 420
tactggaccc tggcggcgtg cggtttcatg ggtttctacc acatccactc tctgatcgaa 480
aaaggtttcg cgccgctgaa agacgcgtct tacctgacca acggttacct ggacaccgtt 540
atcgactggg ttccgggtat ggaaggtatc cgtctgaaag acttcccgct ggactggtct 600
accgacctga acgacaaagt tctgatgttc accaccgaag cgccgcagcg ttctcacaaa 660
gtttctcacc acatcttcca caccttcgac gaactggaac cgtctatcat caaaaccctg 720
tctctgcgtt acaaccacat ctacaccatc ggtccgctgc agctgctgct ggaccagatc 780
ccggaagaaa aaaaacagac cggtatcacc tctctgcacg gttactctct ggttaaagaa 840
gaaccggaat gcttccagtg gctgcagtct aaagaaccga actctgttgt ttacgttaac 900
ttcggttcta ccaccgttat gtctctggaa gacatgaccg aattcggttg gggtctggcg 960
aactctaacc actacttcct gtggatcatc cgttctaacc tggttatcgg tgaaaacgcg 1020
gttctgccgc cggaactgga agaacacatc aaaaaacgtg gtttcatcgc gtcttggtgc 1080
tctcaggaaa aagttctgaa acacccgtct gttggtggtt tcctgaccca ctgcggttgg 1140
ggttctacca tcgaatctct gtctgcgggt gttccgatga tctgctggcc gtactcttgg 1200
gaccagctga ccaactgccg ttacatctgc aaagaatggg aagttggtct ggaaatgggt 1260
accaaagtta aacgtgacga agttaaacgt ctggttcagg aactgatggg tgaaggtggt 1320
cacaaaatgc gtaacaaagc gaaagactgg aaagaaaaag cgcgtatcgc gatcgcgccg 1380
aacggttctt cttctctgaa catcgacaaa atggttaaag aaatcaccgt tctggcgcgt 1440
aactaa 1446
<210> 6
<211> 481
<212> PRT
<213> 甜叶菊(Stevia rebaudiana)
<400> 6
Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile
1 5 1015
Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln
202530
Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe
354045
Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly
505560
Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser
65707580
Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu
859095
Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp
100 105 110
Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile
115 120 125
Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu
130 135 140
Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu
145 150 155 160
Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr
165 170 175
Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu
180 185 190
Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu
195 200 205
Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His
210 215 220
Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu
225 230 235 240
Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu
245 250 255
Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu
260 265 270
His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu
275 280 285
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr
290 295 300
Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala
305 310 315 320
Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile
325 330 335
Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys
340 345 350
Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His
355 360 365
Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile
370 375 380
Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp
385 390 395 400
Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly
405 410 415
Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val
420 425 430
Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys
435 440 445
Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser
450 455 460
Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg
465 470 475 480
Asn
<210> 7
<211> 1383
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cgctttgatc agttcagaaa cgaattcaac gatgtcgttg tcagaagaac caccttcgtg 60
aaccgcaact ttcgccaggt ctttccattt aaccgcgttt ttacggatga taacaccacg 120
ttcttcttcc atgatcattt tgatgcaaga cgccaggtta ccacgacgaa cgataccgtt 180
ttcgtccgct ttaacacgaa caccaacacc caggatttcg tccagcagtt tcgcgttggt 240
ggtctggtca gagaactgcg gcatcgcaac aaccggaaca cccagagaga tcgcttccag 300
ggtagagttg aaaccgcagt gggtaacgaa gcaaccaaca gattcgtgcg ccagaacgtc 360
cagctgtttg caccacgcaa cgatcagacc tttaccggtt ttgataactt cagacaggtt 420
ttccggcagt ttaccttctt ctttgtgttt gataacccac aggaagttaa cgtcagagtc 480
gatcagcgca cgggtgattt cttcaacctg ttccggaccg tgtttaacca gagaaccgaa 540
cgcaacgtaa acaacagatt ctttcggttt gtcgtccagc cagttcatgc attcgtggtg 600
gttcgctttg tacaggttga aaccgttgtc tttgtcgtcg tccagacgtt tgtccaggta 660
catagacggc agggtcggac cgataacttt caggttccag attttacggg tccattcgat 720
aacttcttct tccagtttgt agaaagagtt ggtgaaaacc caacgcgcct ggtcgatgtt 780
cgcgaactga ccgaacagca tctgagacca cggagactgg atctgttcgt ggttctgcag 840
gatcagcggg gtttcccaac gctgcagaac cgggaaaccc ggaacagaaa cggtttcacc 900
cagcggcaga gagatcagac ctttgtgaac gtggtagtac agagagttaa caacgcacgc 960
ctgggtgaag aaagaaccac cgtcgatacc gaattcgatc gcaacgtcca gaacccattc 1020
ggtcatagag tcgtagatga tcgcgtcgat ggtggtacct tcagactgca gttttttgat 1080
caggtccgcc agagatttag aaccaacctg tttgaaggtt tccaggtaag attcacccgc 1140
agacatgaaa ccaccttcgt cgcaaccgtc agagatcgcc tggatttcga tagaggtggt 1200
ggtggtgtta gagtggttca gggtagagtt cagggtgtgg atggtggtaa ccagggtggt 1260
tttaacacct ttagagatca gacgtttacc gaactggatg aacgggttga tgtgaccctg 1320
cagcgggaac gggatcagca gaacgtgcgg agattttttg attttctgct gttccgccat 1380
taa 1383
<210> 8
<211> 460
<212> PRT
<213> 甜叶菊(Stevia rebaudiana)
<400> 8
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 1015
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
202530
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
354045
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
505560
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65707580
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
859095
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 9
<211> 2409
<212> DNA
<213> 甘蔗(Saccharum hybrid cultivar F36-819)
<400> 9
atggctgcca agttgactcg cctccacagt cttcgcgaac gccttggtgc caccttctcc 60
tctcatccca atgagctgat tgcactcttc tccaggtatg ttaaccaggg caagggaatg 120
cttcagcgcc atcaactgct tgctgagttt gatgccctgt ttgatagtga caaggagaag 180
tatgcgccct tcgaagactt tcttcgtgct gctcaggaag caattgtgct ccctccctgg 240
gtagcacttg ctatcaggcc aaggcctggt gtctgggatt acattcgagt gaatgtaagc 300
gagttggctg tggaggagct gagtgtttct gagtacttgg cattcaagga acagctggtg 360
gatggaaatt ccaacagcaa ctttgttctt gagcttgatt ttgagccctt caatgcctca 420
ttccctcgtc cttccatgtc aaagtccatt ggaaatggag tgcaattcct taaccgacac 480
ctgtcttcca agttgttcca ggacaaggag agcctgtacc cattgctgaa tttcctcaaa 540
gcccataact acaagggcac gacgatgatg ttgaatgaca gaattcagag cctccgtggg 600
ctccagtcat cccttagaaa ggcagaagag tatctactga gtgtccctca agacactccc 660
tactcagagt tcaaccatag gttccaagag cttggcttgg agaagggttg gggtgacact 720
gcaaagcgcg tacttgatac actccacttg cttcttgacc ttcttgaggc ccctgatcct 780
gccaacttgg agaagttcct tggaactata ccaatgatgt tcaatgttgt tatcctgtct 840
cctcatggct actttgccca atccaatgtg cttggatacc ctgacactgg tggtcaggtt 900
gtgtacattt tggatcaagt ccgtgctttg gagaatgaga tgcttcttag gattaagcag 960
caaggccttg acatcacccc gaagatcctc attgttacca ggctgttgcc tgatgctgtt 1020
gggactacgt gcggtcagcg tctggagaag gtcattggaa ccgagcacac agacattatt 1080
cgtattccat tcagaaatga gaatggtatt ctccgcaagt ggatctctcg ttttgatgtc 1140
tggccatacc tggagacata cactgaggat gttgccagtg aaataatgtt agaaatgcag 1200
gccaagcctg accttatcgt tggcaactac agtgatggca atctagtcgc cactctgctc 1260
gcgcacaagt tgggagttac tcagtgtacc attgcccacg ccttggagaa aaccaaatat 1320
cccaactcag acatatactt ggacaaattt gacagccaat accacttctc atgccagttc 1380
acagctgacc ttattgccat gaatcacact gatttcatca tcaccagtac attccaagaa 1440
atcgcgggaa gcaaggacac tgtggggcag tatgagtccc acattgcgtt cactcttcct 1500
ggactttacc gtgttgtcca tggcattgat gtttttgatc ccaaattcaa cattgtctct 1560
cctggagcag acatgagtgt ttactaccca tacactgaaa ctgacaagag actcactgcc 1620
ttccatcctg aaattgagga gctcatctac agtgatgttg agaacgatga gcacaagttt 1680
gtgttgaagg acaagaacaa gccgatcatc ttctcaatgg ctcgtcttga ccgtgtgaag 1740
aacatgacag gcttggttga gatgtatggt aagaatgcac gcctgaggga attggcaaac 1800
cttgtgattg ttgctggtga ccatggcaag gaatcgaagg acagggagga gcaggcagag 1860
ttcaagaaga tgtacagtct cattgatgag tacaacttga agggccatat ccggtggatc 1920
tcagctcaga tgaaccgtgt ccgcaacgct gagttgtacc gctacatttg tgacacgaag 1980
ggagcatttg tgcagcctgc attctatgaa gcattcggcc tgactgtcat tgagtccatg 2040
acgtgcggtt tgccaacaat tgcaacctgc catggtggcc ctgctgaaat aattgtggac 2100
ggggtgtctg gtttgcacat tgatccttac cacagtgaca aggctgcaga tattttggtc 2160
aacttctttg agaagtgcaa ggcagaccca agctactggg acaagatctc acagggtgga 2220
ctgcagagaa tttatgagaa gtacacctgg aagctctact ccgagaggct gatgaccctg 2280
actggtgtat acggattctg gaagtatgtg agcaatctgg agaggcgtga gactcgccgc 2340
taccttgaga tgttctatgc tctgaaatac cgtagcctgg caagtgcggt tccattgtcc 2400
ttcgattag 2409
<210> 10
<211> 802
<212> PRT
<213> 甘蔗(Saccharum hybrid cultivar F36-819)
<400> 10
Met Ala Ala Lys Leu Thr Arg Leu His Ser Leu Arg Glu Arg Leu Gly
1 5 1015
Ala Thr Phe Ser Ser His Pro Asn Glu Leu Ile Ala Leu Phe Ser Arg
202530
Tyr Val Asn Gln Gly Lys Gly Met Leu Gln Arg His Gln Leu Leu Ala
354045
Glu Phe Asp Ala Leu Phe Asp Ser Asp Lys Glu Lys Tyr Ala Pro Phe
505560
Glu Asp Phe Leu Arg Ala Ala Gln Glu Ala Ile Val Leu Pro Pro Trp
65707580
Val Ala Leu Ala Ile Arg Pro Arg Pro Gly Val Trp Asp Tyr Ile Arg
859095
Val Asn Val Ser Glu Leu Ala Val Glu Glu Leu Ser Val Ser Glu Tyr
100 105 110
Leu Ala Phe Lys Glu Gln Leu Val Asp Gly Asn Ser Asn Ser Asn Phe
115 120 125
Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ser Phe Pro Arg Pro
130 135 140
Ser Met Ser Lys Ser Ile Gly Asn Gly Val Gln Phe Leu Asn Arg His
145 150 155 160
Leu Ser Ser Lys Leu Phe Gln Asp Lys Glu Ser Leu Tyr Pro Leu Leu
165 170 175
Asn Phe Leu Lys Ala His Asn Tyr Lys Gly Thr Thr Met Met Leu Asn
180 185 190
Asp Arg Ile Gln Ser Leu Arg Gly Leu Gln Ser Ser Leu Arg Lys Ala
195 200 205
Glu Glu Tyr Leu Leu Ser Val Pro Gln Asp Thr Pro Tyr Ser Glu Phe
210 215 220
Asn His Arg Phe Gln Glu Leu Gly Leu Glu Lys Gly Trp Gly Asp Thr
225 230 235 240
Ala Lys Arg Val Leu Asp Thr Leu His Leu Leu Leu Asp Leu Leu Glu
245 250 255
Ala Pro Asp Pro Ala Asn Leu Glu Lys Phe Leu Gly Thr Ile Pro Met
260 265 270
Met Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ala Gln Ser
275 280 285
Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu
290 295 300
Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu Leu Arg Ile Lys Gln
305 310 315 320
Gln Gly Leu Asp Ile Thr Pro Lys Ile Leu Ile Val Thr Arg Leu Leu
325 330 335
Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu Lys Val Ile
340 345 350
Gly Thr Glu His Thr Asp Ile Ile Arg Ile Pro Phe Arg Asn Glu Asn
355 360 365
Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp Val Trp Pro Tyr Leu
370 375 380
Glu Thr Tyr Thr Glu Asp Val Ala Ser Glu Ile Met Leu Glu Met Gln
385 390 395 400
Ala Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly Asn Leu Val
405 410 415
Ala Thr Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Thr Ile Ala
420 425 430
His Ala Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Ile Tyr Leu Asp
435 440 445
Lys Phe Asp Ser Gln Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu
450 455 460
Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu
465 470 475 480
Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser His Ile Ala
485 490 495
Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Val Phe
500 505 510
Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Val Tyr
515 520 525
Tyr Pro Tyr Thr Glu Thr Asp Lys Arg Leu Thr Ala Phe His Pro Glu
530 535 540
Ile Glu Glu Leu Ile Tyr Ser Asp Val Glu Asn Asp Glu His Lys Phe
545 550 555 560
Val Leu Lys Asp Lys Asn Lys Pro Ile Ile Phe Ser Met Ala Arg Leu
565 570 575
Asp Arg Val Lys Asn Met Thr Gly Leu Val Glu Met Tyr Gly Lys Asn
580 585 590
Ala Arg Leu Arg Glu Leu Ala Asn Leu Val Ile Val Ala Gly Asp His
595 600 605
Gly Lys Glu Ser Lys Asp Arg Glu Glu Gln Ala Glu Phe Lys Lys Met
610 615 620
Tyr Ser Leu Ile Asp Glu Tyr Asn Leu Lys Gly His Ile Arg Trp Ile
625 630 635 640
Ser Ala Gln Met Asn Arg Val Arg Asn Ala Glu Leu Tyr Arg Tyr Ile
645 650 655
Cys Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe
660 665 670
Gly Leu Thr Val Ile Glu Ser Met Thr Cys Gly Leu Pro Thr Ile Ala
675 680 685
Thr Cys His Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser Gly
690 695 700
Leu His Ile Asp Pro Tyr His Ser Asp Lys Ala Ala Asp Ile Leu Val
705 710 715 720
Asn Phe Phe Glu Lys Cys Lys Ala Asp Pro Ser Tyr Trp Asp Lys Ile
725 730 735
Ser Gln Gly Gly Leu Gln Arg Ile Tyr Glu Lys Tyr Thr Trp Lys Leu
740 745 750
Tyr Ser Glu Arg Leu Met Thr Leu Thr Gly Val Tyr Gly Phe Trp Lys
755 760 765
Tyr Val Ser Asn Leu Glu Arg Arg Glu Thr Arg Arg Tyr Leu Glu Met
770 775 780
Phe Tyr Ala Leu Lys Tyr Arg Ser Leu Ala Ser Ala Val Pro Leu Ser
785 790 795 800
Phe Asp
<210> 11
<211> 2430
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 11
atggcaaacc ctaagctcac tagggttcta agcacaaggg atcgcgtgca agacacgctt 60
tccgctcacc gcaacgaact cgttgctctt ctctccaggt atgtggatca ggggaaaggg 120
attcttcaac cacataactt aattgacgaa ctcgaatctg ttatcggaga cgatgaaaca 180
aagaagagtc tctctgatgg tccttttgga gagatcctta aatcagcaat ggaagctata 240
gttgtaccac cttttgttgc gttagccgtt agaccaagac ctggtgtttg ggaatatgtt 300
cgtgttaatg tcttcgagct aagtgttgaa caattaacag tctctgagta tcttcgtttc 360
aaagaagaac tcgttgatgg acctaatagt gacccttttt gtcttgagct tgatttcgag 420
ccctttaacg caaacgtgcc acgtccttct cgttcgtctt cgattggtaa tggagttcag 480
tttctgaatc gtcacttgtc ttctgttatg ttccgtaaca aagattgctt ggagcctctg 540
cttgatttcc ttagagttca taagtacaaa ggtcatccgt tgatgttgaa tgatcggatt 600
caaagcatat ctaggcttca aatccagctt agtaaagcag aagatcatat ctctaagctt 660
tcacaagaaa ctccgttctc ggaattcgaa tacgcgttgc aaggaatggg ttttgagaaa 720
ggatggggag ataccgcagg gagagttctt gaaatgatgc atcttctctc tgatattctt 780
caagctcctg atccttcgtc cttggagaag tttcttggga tggtaccaat ggttttcaac 840
gttgtgatct tatctccaca tggatatttc gggcaagcca atgttttagg cttacctgac 900
actggtggac aagttgtcta tattcttgac caagtccgtg cccttgagac tgaaatgctg 960
ttgagaataa agagacaggg gttggatata tcacctagta ttcttattgt aactaggttg 1020
ataccggatg ctaaaggaac tacgtgtaac cagcggttag agagagtcag cggaacagag 1080
catactcata ttctccgggt tccttttagg tctgagaaag gaatcctccg taagtggatt 1140
tcaagattcg acgtatggcc ttatctagag aactatgctc aggatgcagc aagcgagatt 1200
gtcggtgaat tgcaaggcgt accggacttt atcatcggta actatagtga cggaaacctt 1260
gttgcatcgt taatggcaca tagaatgggt gttacacaat gtactattgc acatgctttg 1320
gagaaaacca agtatccaga ttcagacatt tactggaaag acttcgacaa caagtatcat 1380
ttctcttgtc aattcacagc tgatcttatc gcaatgaaca acgcagattt catcatcaca 1440
agcacttacc aagaaatcgc aggaacgaag aacaccgtcg gtcaatatga aagccacggg 1500
gcttttacgc tcccgggact atatagagta gtacacggca tcgatgtgtt tgatccgaag 1560
ttcaacatag tctcgcccgg tgcagacatg accatatatt tcccgtattc cgaagaaact 1620
aggagactta cagctttaca tggttcaata gaggaaatgc tctatagccc tgaccagact 1680
gatgagcatg tcggtacact gagtgatcga tcaaagccaa tactcttctc tatggcgagg 1740
ctcgacaaag tgaagaacat ctccggttta gttgagatgt atagtaagaa cacaaagttg 1800
agggagctgg ttaatctggt tgtaatagct ggtaacattg atgtgaacaa gtccaaagat 1860
agagaagaaa tcgtagagat tgagaaaatg cataacctta tgaagaatta caagcttgat 1920
ggacagtttc gttggataac tgctcagact aaccgagctc gaaatggtga gctttaccgc 1980
tacatcgcgg atacaagagg tgcttttgct cagcctgcgt tctacgaggc ttttggactt 2040
acggtagtgg aagcgatgac ttgcgggctc ccgacttttg ccacttgtca cggtggtcca 2100
gcagagatca tcgagcacgg gctctcgggt ttccacatcg atccatacca tcctgagcaa 2160
gcgggtaaca taatggctga tttctttgaa cgttgtaagg aagatccaaa ccattggaag 2220
aaagtatcag acgctggtct ccaaaggata tacgaaaggt acacatggaa gatatactcg 2280
gagagattga tgacactagc tggtgtgtat ggtttctgga aatacgtatc gaaattggag 2340
cgtcgtgaga ctcggcgata tcttgaaatg ttctacattc tcaaattccg cgacttggtg 2400
aaaactgttc cttcaaccgc cgatgactga 2430
<210> 12
<211> 809
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 12
Met Ala Asn Pro Lys Leu Thr Arg Val Leu Ser Thr Arg Asp Arg Val
1 5 1015
Gln Asp Thr Leu Ser Ala His Arg Asn Glu Leu Val Ala Leu Leu Ser
202530
Arg Tyr Val Asp Gln Gly Lys Gly Ile Leu Gln Pro His Asn Leu Ile
354045
Asp Glu Leu Glu Ser Val Ile Gly Asp Asp Glu Thr Lys Lys Ser Leu
505560
Ser Asp Gly Pro Phe Gly Glu Ile Leu Lys Ser Ala Met Glu Ala Ile
65707580
Val Val Pro Pro Phe Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val
859095
Trp Glu Tyr Val Arg Val Asn Val Phe Glu Leu Ser Val Glu Gln Leu
100 105 110
Thr Val Ser Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Pro
115 120 125
Asn Ser Asp Pro Phe Cys Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140
Asn Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ser Val Met Phe Arg Asn Lys Asp Cys
165 170 175
Leu Glu Pro Leu Leu Asp Phe Leu Arg Val His Lys Tyr Lys Gly His
180 185 190
Pro Leu Met Leu Asn Asp Arg Ile Gln Ser Ile Ser Arg Leu Gln Ile
195 200 205
Gln Leu Ser Lys Ala Glu Asp His Ile Ser Lys Leu Ser Gln Glu Thr
210 215 220
Pro Phe Ser Glu Phe Glu Tyr Ala Leu Gln Gly Met Gly Phe Glu Lys
225 230 235 240
Gly Trp Gly Asp Thr Ala Gly Arg Val Leu Glu Met Met His Leu Leu
245 250 255
Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Ser Leu Glu Lys Phe Leu
260 265 270
Gly Met Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285
Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Thr Glu Met Leu
305 310 315 320
Leu Arg Ile Lys Arg Gln Gly Leu Asp Ile Ser Pro Ser Ile Leu Ile
325 330 335
Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Thr Cys Asn Gln Arg
340 345 350
Leu Glu Arg Val Ser Gly Thr Glu His Thr His Ile Leu Arg Val Pro
355 360 365
Phe Arg Ser Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp
370 375 380
Val Trp Pro Tyr Leu Glu Asn Tyr Ala Gln Asp Ala Ala Ser Glu Ile
385 390 395 400
Val Gly Glu Leu Gln Gly Val Pro Asp Phe Ile Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Met Ala His Arg Met Gly Val Thr
420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Ile Tyr Trp Lys Asp Phe Asp Asn Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Leu Ile Ala Met Asn Asn Ala Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr
485 490 495
Glu Ser His Gly Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Thr Ile Tyr Phe Pro Tyr Ser Glu Glu Thr Arg Arg Leu Thr
530 535 540
Ala Leu His Gly Ser Ile Glu Glu Met Leu Tyr Ser Pro Asp Gln Thr
545 550 555 560
Asp Glu His Val Gly Thr Leu Ser Asp Arg Ser Lys Pro Ile Leu Phe
565 570 575
Ser Met Ala Arg Leu Asp Lys Val Lys Asn Ile Ser Gly Leu Val Glu
580 585 590
Met Tyr Ser Lys Asn Thr Lys Leu Arg Glu Leu Val Asn Leu Val Val
595 600 605
Ile Ala Gly Asn Ile Asp Val Asn Lys Ser Lys Asp Arg Glu Glu Ile
610 615 620
Val Glu Ile Glu Lys Met His Asn Leu Met Lys Asn Tyr Lys Leu Asp
625 630 635 640
Gly Gln Phe Arg Trp Ile Thr Ala Gln Thr Asn Arg Ala Arg Asn Gly
645 650 655
Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Ala Gln Pro
660 665 670
Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys
675 680 685
Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Ala Glu Ile Ile
690 695 700
Glu His Gly Leu Ser Gly Phe His Ile Asp Pro Tyr His Pro Glu Gln
705 710 715 720
Ala Gly Asn Ile Met Ala Asp Phe Phe Glu Arg Cys Lys Glu Asp Pro
725 730 735
Asn His Trp Lys Lys Val Ser Asp Ala Gly Leu Gln Arg Ile Tyr Glu
740 745 750
Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly
755 760 765
Val Tyr Gly Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr
770 775 780
Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Asp Leu Val
785 790 795 800
Lys Thr Val Pro Ser Thr Ala Asp Asp
805
<210> 13
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gtaatccatc gatactagta gcgccactgc tctcgagac 39
<210> 14
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cctcactaaa gggcggccgc atggcaaacc aacgtcaca 39
<210> 15
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ggagaaaaaa ccccggatcc atggcttctg gttataatc 39
<210> 16
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
caacttctgt tccatgtcga cgtacgtgcg cttccttaa 39
<210> 17
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gagaaaaaac cccggatcca tggacgcgat ggcgaccac 39
<210> 19
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
caacttctgt tccatgtcga cgttacgcgc cagaacggtg 40
<210> 19
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ccctcactaa agggcggccg catggcaaac cctaagctc 39
<210> 20
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gtaatccatc gatactagtg tcatcggcgg ttgaaggaac 40
<210> 21
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtaatccatc gatactagta tcgaaggaca atggaaccg 39
<210> 22
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ctcactaaag ggcggccgca tggctgccaa gttgactcg 39
<210> 23
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cttgtaatcc atcgatacta gtcgctttga tcagttcaga aac 43
<210> 24
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
cctcactaaa gggcggccgc atggcggaac agcagaaaat c 41
<210> 25
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gtctgcgggt gcatcttacc tggaaacctt caaacaggtt ggttc 45
<210> 26
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gtttccaggt aagatgcacc cgcagacatg aaaccacctt cgtcg 45
<210> 27
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gtctgcgggt gaagcttacc tggaaacctt caaacaggtt ggttc 45
<210> 28
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gtttccaggt aagcttcacc cgcagacatg aaaccacctt cgtcg 45
<210> 29
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gtctgcgggt gaatcttacc tggcaacctt caaacaggtt ggttc 45
<210> 30
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gtttgaaggt tgccaggtaa gattcacccg cagacatgaa accaccttcg tcg 53
<210> 31
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gaatcttacc tggaagcatt caaacaggtt ggttctaaat ctctggcgga cctgat 56
<210> 32
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gtttgaatgc ttccaggtaa gattcacccg cagacatgaa accaccttcg tcgcaa 56
<210> 33
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ctgcagaacc acgaacagat ccagtctgcg tggtctcaga tgctgttcgg tcagtt 56
<210> 34
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gcatctgaga ccacgcagac tggatctgtt cgtggttctg caggatcagc ggggtt 56
<210> 35
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gaacagatcc agtctccgtg ggcgcagatg ctgttcggtc agttcgcgaa catcga 56
<210> 36
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ctgcgcccac ggagactgga tctgttcgtg gttctgcagg atcagcgggg tttccc 56
<210> 37
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gtctgcgggt gaagcgtacc tggcaacctt caaacaggtt ggttctaaat ctctg 55
<210> 38
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ggttgccagg tacgcttcac ccgcagacat gaaaccacct tcgtcgcaac cgtc 54