掌桥专利:专业的专利平台
掌桥专利
首页

来自块菌的甜蛋白

文献发布时间:2023-06-19 18:35:48


来自块菌的甜蛋白

相关申请的交叉引用

本专利申请要求于2020年6月25日提交的美国临时专利申请号63/044,245的优先权,该申请通过援引并入。

以电子方式提交的材料的通过援引并入

通过援引以其全部内容并入本文的是与本文同时提交的计算机可读核苷酸/氨基酸序列表,其标识如下:一个命名为“338820_640_30A_WO_ST25.TXT”的86,678字节ASCII(文本)文件,创建于2021年6月25日。

背景技术

营养甜味剂的过量摄入长期以来与饮食相关健康问题诸如肥胖、心脏病、代谢紊乱和牙齿问题有关。因此,消费者越来越多地寻找减少他们饮食中营养甜味剂的量的方法。制造商通过寻求开发能够更好地模仿营养甜味剂的期望味道和功能特性的营养甜味剂的替代品来满足这一需求。

期望优选来源于天然来源的零卡路里或低卡路里甜味剂以限制高糖消耗的负面影响(例如,糖尿病和肥胖等)。众所周知的零卡路里或低卡路里甜味剂包括阿斯巴甜、乙酰磺胺酸钾、罗汉果(monk)果实提取物、纽甜(neotame)、糖精、甜菊和三氯蔗糖。然而,这些甜味剂具有味道缺陷诸如苦味。

块菌是一些子囊菌真菌(包括属于盘菌纲(Pezizomycetes)盘菌目(Pezizales)的属)的地下子实体。块菌是外生菌根真菌,并且因此通常发现与树根密切相关。

迄今为止已知有七种甜味修饰蛋白,即巴西甜蛋白(brazzein)、奇异果甜蛋白、应乐果甜蛋白、仙茅甜蛋白、马槟榔甜蛋白、神秘果素(miraculin)和培它丁(pentadin)。对于这些蛋白中的任何一种,尚未确定蛋白表面上负责生物活性的关键残基。应乐果甜蛋白被发现在摩尔基础上是蔗糖100,000倍甜,随后是巴西甜蛋白和奇异果甜蛋白,其在克基础上分别是蔗糖的500倍和3000倍甜。所有这些蛋白都是从热带雨林中生长的植物中分离出来的。虽然它们中的大多数没有序列同源性或结构相似性,但奇异果甜蛋白在蛋白序列水平上与其他植物中发现的某些非甜蛋白具有广泛的相似性。真菌中没有已知的甜味修饰蛋白。

本领域仍然需要从天然来源生产具有改善味道的新的低卡路里或零卡路里甜味剂。本领域仍然需要从甜味组合物的潜在来源,特别是从子囊菌真菌物种中经济地生产这样的甜味组合物。

发明内容

本发明涉及新鉴定的真菌来源甜蛋白,以及编码所述蛋白的基因和cDNA,在本文中也称为MYD/Myd。更具体地,本发明涉及新鉴定的甜味蛋白、编码所述蛋白的基因和cDNA,以及使用此蛋白、基因和cDNA调节食物味道的方法。本发明尤其提供了本文鉴定为MYD1的编码新型甜蛋白的DNA序列和相应的多肽Myd1(也称为mycodulcein)。Myd1是第一种从真菌中鉴定出的甜味蛋白。Myd1降低食物和饮品的酸味、苦味或涩味,另外Myd1具有增强食物和饮品味道的活性,即味道修饰活性。

本发明提供了编码具有甜味调节活性的多肽的多核苷酸(例如,分离的多核苷酸),其中,所述多核苷酸序列编码选自由以下组成的组的多肽:(a)选自由以下组成的组的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQIDNO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74和SEQ ID NO:75;(b)与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽:SEQ ID NO:3、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ IDNO:16和SEQ ID NO:17;以及(c)通过不多于24个氨基酸的缺失、插入、置换或添加而从选自由以下组成的组的多肽序列修饰的多肽序列:SEQ IDNO:3、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16和SEQ ID NO:17。

在一个方面,具有甜味调节活性的多肽的多肽序列为SEQ ID NO:3中所示的多肽序列,或与SEQ ID NO:3具有至少80%序列同一性的多肽序列。在另一方面,编码具有甜味调节活性的多肽的多肽不是SEQ ID NO:3的多肽。

在另一方面,多肽序列包括SEQ ID NO:3的氨基酸残基1-11、17-32、39、40、45-67、73-100和110-121。

本发明还提供了多核苷酸(例如,分离的多核苷酸),其选自由以下组成的组:(a)包括SEQ ID NO:2中所示的核酸序列具有至少一个置换修饰的多核苷酸;(b)包括与SEQ IDNO:2中所示的核酸序列具有至少90%序列同一性的核酸序列的多核苷酸,其中,所述多核苷酸不是SEQ ID NO:2的多核苷酸,以及(c)包括(i)SEQ ID NO:2中所示的核酸序列和(ii)编码组氨酸标签的核苷酸序列的多核苷酸,其中,所述多核苷酸编码具有甜味调节活性的多肽。

在一个方面,具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75。尤其,具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ IDNO:68。

在特定的方面,多肽包括以下的核酸序列:SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:29、SEQ ID NO:37、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65或SEQ ID NO:67。

编码具有甜味调节活性的多肽的多核苷酸任选地与异源调控元件可操作地连接。另外地或替代地,多核苷酸序列还编码蛋白标签或标记。蛋白标签任选地是亲和标签。蛋白任选地是组氨酸标签。

在一个方面,多核苷酸包括SEQ ID NO:20,其对应于大肠杆菌(E.coli)中带His标签的mycodulcein的编码序列(其中,残基364-381对应于任选的His标签序列)。SEQ ID NO:20针对在大肠杆菌中的表达进行了密码子优化。在另一方面,多核苷酸包括SEQ ID NO:22,其对应于酿酒酵母(S.cerevisiae)中带His标签的mycodulcein的编码序列(其中,残基364-381对应于任选的His标签序列)。SEQ ID NO:22针对在酿酒酵母中的表达进行了密码子优化。SEQ ID NO:21的相应多肽对应于带His标签的mycodulcein蛋白(其中残基122-127对应于任选的His标签序列),该多肽序列对于在大肠杆菌和酿酒酵母中的表达是相同的。

提供了包括多核苷酸的表达盒和包括多核苷酸的载体,以及用载体转化的宿主细胞。还提供了产生具有甜味调节活性的蛋白的方法,所述方法包括在导致产生具有甜味调节活性的蛋白的条件下在培养基中培养宿主细胞。

本发明包括多肽(例如,分离的多肽),该多肽包括与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16和SEQ ID NO:17;其中,所述多肽任选地包含相对于选自由以下组成的组的多肽序列的至少一个置换或修饰:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,所述多肽任选地还包括蛋白标签,特别是组氨酸标签,并且其中,所述多肽具有甜味调节活性。

在一个方面,多肽包括SEQ ID NO:3或与SEQ ID NO:3具有至少80%序列同一性的多肽序列。在另一方面,多肽不是SEQ ID NO:3的多肽。

在又另一方面,多肽包括SEQ ID NO:3的氨基酸残基1-11、17-32、39、40、45-67、73-100和110-121。

在一个方面,多肽(例如,分离的多肽)包括选自由SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74和SEQ ID NO:75组成的组的多肽序列,其中,所述多肽任选地不是SEQ ID NO:3。尤其,多肽包括以下的氨基酸序列:SEQ ID NO:24、SEQ ID NO:26、SEQID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66或SEQ ID NO:68。

本发明提供了组合物,该组合物包括以下的组合:(a)用于经口施用的产品,其中,所述产品不是地菇状马蒂菌(Mattirolomyces terfezioides)块菌,以及(b)包括所述多肽的甜味组合物,其中,所述组合与所述用于经口施用的产品相比具有增强的甜味。在一个方面,所述多肽包括与选自由以下组成的组的多肽具有至少80%序列同一性的氨基酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17。在另一方面,所述多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17;其中,所述多肽任选地包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQ IDNO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,所述多肽任选地不是SEQ ID NO:3的多肽,其中,所述多肽任选地还包括组氨酸标签,其中,所述多肽具有甜味调节活性。例如,甜味组合物中的多肽包括SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75的氨基酸序列,并且任选地不由SEQ ID NO:3组成。尤其,多肽包括以下的氨基酸序列:SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ IDNO:68。

在一个方面,本发明提供了包括多肽的甜味组合物,所述多肽包括与选自由以下组成的组的多肽具有至少80%序列同一性的氨基酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,所述多肽任选地是除SEQID NO:3的氨基酸序列的多肽以外的多肽。

本发明提供了用于调节用于经口施用的产品的味道的方法,包括将所述用于经口施用的产品与有效量的包括多肽的甜味组合物组合,其中,所述用于经口施用的产品不是地菇状马蒂菌块菌,并且其中,与所述用于经口施用的产品相比,所述组合具有增强的甜味。在一个方面,所述多肽包括与选自由以下组成的组的多肽具有至少80%序列同一性的氨基酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17。在另一方面,所述多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16和SEQID NO:17;其中,所述多肽任选地包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,所述多肽任选地不是SEQ ID NO:3的多肽,其中,所述多肽任选地还包括组氨酸标签,其中,所述多肽具有甜味调节活性。例如,甜味组合物中的多肽包括SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75的氨基酸序列,并且任选地不由SEQ IDNO:3组成。尤其,多肽包括以下的氨基酸序列:SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66或SEQ ID NO:68。

用于经口施用的产品可以是食物、饮料、膳食补充剂组合物或药物组合物。食品的实例包括但不限于烘焙食品;烘焙物;甜烘焙产品,用于制备甜烘焙产品的预制甜烘焙混合物;馅饼填充料和其他甜填充料、明胶和布丁;冷冻甜点;酸乳;小吃;面包产品;用于制备面包产品的预制面包混合物;酱、糖浆和调味品;甜酱;糖果点心产品;和甜早餐谷物。饮料产品的实例包括但不限于碳酸饮料;非碳酸饮料;和浓缩饮料。

本发明还提供了纯化具有甜味调节活性的多肽的方法,包括(a)获得包括所述多肽的组合物,以及(b)经由疏水作用色谱法(HIC)随后通过尺寸排阻色谱法(SEC)来纯化所述组合物。在一个方面,所述多肽包括与选自由以下组成的组的多肽具有至少80%序列同一性的氨基酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16和SEQ ID NO:17。在另一方面,所述多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16和SEQ ID NO:17;其中,所述多肽任选地包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQID NO:17,其中,所述多肽任选地不是SEQ ID NO:3的多肽,其中,所述多肽任选地还包括组氨酸标签,其中,所述多肽具有甜味调节活性。例如,所述多肽包括SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75的氨基酸序列,并且任选地不由SEQID NO:3组成。尤其,多肽包括以下的氨基酸序列:SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66或SEQ ID NO:68。

本发明的其他方面和实施方式在回顾本文的附图、详细描述和非限制性实例时将是显而易见的。

附图说明

图1示出了使用PHYRE2.0蛋白折叠预测工具基于序列数据预测的Myd1的三维结构。

图2示出了从部分纯化的地菇状马蒂菌产孢组织的级分获得的蛋白的考马斯染色SDS-PAGE凝胶。

图3示出了在大肠杆菌中表达的SEQ ID NO:21的纯化步骤的考马斯染色的SDS-PAGE凝胶。泳道1:分子量标准;泳道3,粗裂解物;泳道4,来自HisPur

图4示出了mycodulcein、阿斯巴甜、奇异果甜蛋白、甜叶菊苷A对于甜味的浓度响应函数。数据以200m M蔗糖相关的(“甜”)目标上发生响应的比例(p)绘图。对于mycodulcein、阿斯巴甜、奇异果甜蛋白、甜叶菊苷A的曲线中的每个数据点计算为32次重复的平均值,并且对于蔗糖曲线,计算为16次重复的平均值;误差棒为SEM。水和蔗糖对照的点类似地分别计算为128次和64次重复的平均值。通过非线性回归拟合曲线。

图5A示出了mycodulcein预测的三级结构与奇异果甜蛋白(PDB:1RQW)、应乐果甜蛋白(PDB:2O9U)、巴西甜蛋白(PDB:1BRZ)和鸡卵白溶菌酶(PDB:1LSN)的已知晶体结构(蛋白数据库)的比较,示出mycodulcein具有类似于其他已知甜蛋白的预测三级结构,所有均包含反平行的β折叠与平行于β折叠的α螺旋。

图5B示出叠加在推定的二级结构基序上的SEQ ID NO:3预测二级结构的表示以及每个基序内的点突变位置。

图6示出了通过ELISA测量的等于相同蛋白浓度的带his标签的突变体mycodulcein彼此以及与带his标签的非突变体mycodulcein在甜度强度、甜度感知起效时间和甜度感知持续时间比较的结果。

图7A示出了来自Capto MMC的洗脱级分的考马斯染色的SDS-PAGE分析。M:蛋白标志物;泳道1:洗脱级分,在阳离子交换后示出低纯度。箭头指示mycodulcein条带。

图7B示出了在SDS-PAGE上分析的从HiScreen Capto Butyl柱梯度洗脱期间收集的两个洗脱级分的考马斯染色的SDS-PAGE分析。泳道1示出不含mycodulcein的洗脱级分1,以及泳道2示出洗脱的mycodulcein。洗脱级分的纯度通过GelAnalyzer确定为~86%。箭头指示mycodulcein条带。

图7B示出了在HiPrep 26/60Sephacryl S-200上色谱分析后从HIC柱洗脱的蛋白的考马斯染色的SDS-PAGE分析。泳道1示出纯化的带his标签的mycodulcein,以及泳道2示出纯化的天然mycodulcein。洗脱级分的纯度通过GelAnalyzer确定为~98%。箭头指示mycodulcein条带。

具体实施方式

因此,本发明提供了编码能够调节甜味的蛋白的分离的核酸分子,以及它们编码的多肽。如本文所述,本发明的多肽单独地或与食物、饮料、膳食补充剂或药物组合地介导甜味感知。本发明还提供了能够修饰甜味的分离的多肽,以及其连同食物、饮料、膳食补充剂或药物组合物的组合物,所得组合具有甜味。本发明还提供了通过使用本发明的分离的多核苷酸和多肽来修饰食物、饮料、膳食补充剂或药物组合物的甜味的方法。

在本发明的一个方面,提供了新鉴定的真菌甜蛋白,在本文中称为Myd1。术语“Myd多肽”在本文中用于识别根据本发明的任何多肽,其例如与SEQ ID NO:3具有至少80%的序列同一性并且还具有甜味修饰活性。Myd多肽还包括具有甜味修饰活性的肽SEQ ID NO:8至SEQ ID NO:17。对地菇状马蒂菌产孢组织的甜味部分纯化提取物进行从头氨基酸测序以鉴定20聚体N末端序列(SEQ ID NO:4)。在使用RNAseq读段从头组装地菇状马蒂菌产孢组织的整个转录物组后,鉴定了Myd1编码序列(推定源自MYD1基因)。使用20聚体N末端序列筛选地菇状马蒂菌整个转录物组鉴定了一种转录物,该转录物预计编码在N末端具有100%同一性的蛋白。鉴定的转录物预计编码121个氨基酸的蛋白。该方法鉴定了SEQ ID NO:1。在转录物中鉴定起始和终止密码子以鉴定推定的编码序列SEQ ID NO:2。SEQ IDNO:3是推定的蛋白,一种121个氨基酸的蛋白。预测的蛋白SEQ ID NO:3与GENBANK中的其他蛋白序列之间的同一性为31%或更低。已针对在大肠杆菌和酿酒酵母(Saccharomyces cerevisiae)中表达进行密码子优化的天然mycodulcein的编码序列分别对应于SEQ ID NO:20和SEQ ID NO:22的核酸序列(其编码具有任选的6残基组氨酸标签的SEQ ID NO:3的氨基酸序列,即,SEQ IDNO:21的氨基酸序列)。

在一个方面,与通过提取从地菇状马蒂菌产孢组织分离的天然存在的Myd多肽相比,本文的“Myd多肽”具有至少10%或更高(例如,15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高)的甜味修饰活性。在另一些方面,与通过提取从地菇状马蒂菌产孢组织分离的天然存在的Myd多肽相比,本文的“Myd多肽”具有至少50%或更高的甜味修饰活性。在一个方面,与通过提取从地菇状马蒂菌产孢组织分离的天然存在的Myd多肽相比,本文的“Myd多肽”具有至少80%或更高的甜味修饰活性。甜味修饰活性可以通过本领域已知的任何比较方法测量,并且尤其是通过本文实例中描述的任何方法,并且更特别地采用使用如本文描述的感官小组(sensory panel)的方法。

虽然不希望受任何特定理论的束缚,但据信Myd1参与甜味激活,例如,是味觉1受体成员2(T1R2)和/或味觉1受体成员3(T1R3)的激动剂。然而,Myd1可能会激动其他味觉受体,诸如苦味、鲜味、酸味和咸味。分离或纯化的Myd多肽随后可用于食物和药物行业以定制味道,例如,调节食物或药物的甜味。

在第一方面,本发明包括编码具有甜味调节活性的多肽的多核苷酸(例如,分离的多核苷酸),其中,多肽序列包括选自由以下组成的组的多肽,基本上由选自由以下组成的组的多肽组成,或由选自由以下组成的组的多肽组成:,(a)SEQ ID NO:3、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQIDNO:15、SEQ ID NO:16或SEQ ID NO:17中所示的氨基酸序列;(b)与SEQ ID NO:3、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:17中所示的氨基酸序列具有至少80%(例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性的氨基酸序列;以及(c)通过不多于24个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24及其任何范围个)氨基酸的缺失、插入、置换或添加而从SEQ ID NO:3、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:17中所示的氨基酸序列修饰的氨基酸序列。在一些实施方式中,具有甜味调节活性的多肽的氨基酸序列是SEQ ID NO:3中所示的氨基酸序列,与SEQ ID NO:3具有至少80%序列同一性的氨基酸序列,或通过不多于24个氨基酸的缺失、插入、置换或添加而从氨基酸序列SEQ ID NO:3中修饰的氨基酸。

在具体方面,本发明提供了编码具有甜味调节活性的多肽的多核苷酸(例如,分离的多核苷酸),其中,多核苷酸序列编码选自由以下组成的组的多肽:(a)选自由以下组成的组的多肽序列:SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17;(b)与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ IDNO:17;以及(c)通过不多于24个氨基酸的缺失、插入、置换或添加而从选自由以下组成的组的多肽序列修饰的多肽序列:SEQ ID NO:3、SEQIDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,编码具有甜味调节活性的多肽的分离的多肽不是SEQ ID NO:3的多肽。

在另一方面,本发明包括多核苷酸(例如,分离的多核苷酸),其中,所述多核苷酸选自由以下组成的组:(a)包括SEQ ID NO:2中所示的核酸序列的多核苷酸,其任选地包含至少一个(例如,2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72个以及任何这些值的范围个)修饰(例如缺失、插入、置换或添加);以及(b)包括与SEQ IDNO:2中所示的核酸序列具有至少80%(例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性的核酸序列的多核苷酸,任选地其中,多核苷酸不是SEQ ID NO:2的多核苷酸。在实施方式中,多核苷酸编码具有甜味调节活性的多肽。在实施方式中,具有甜味调节活性的多肽的氨基酸序列为SEQ ID NO:3中所示的氨基酸序列。

在一个方面,本发明提供了多核苷酸(例如,分离的多核苷酸),其中,多核苷酸序列包括选自由以下组成的组的的多核苷酸,基本上由选自由以下组成的组的的多核苷酸组成,或由选自由以下组成的组的的多核苷酸组成:(a)包括SEQ ID NO:2中所示的核酸序列的多核苷酸,其具有至少一个(例如,2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72个以及任何这些值的范围个)置换修饰;(b)包括与SEQ ID NO:2中所示的核酸序列具有至少90%(至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性的核酸序列的多核苷酸,其中,多核苷酸任选地不是SEQ IDNO:2的多核苷酸,以及(c)包括(i)SEQ ID NO:2中所示的核酸序列和(ii)编码组氨酸标签的核苷酸序列的多核苷酸,其中,多核苷酸编码具有甜味调节活性的多肽。

编码本发明Myd的多核苷酸可以是单链或双链DNA、RNA或人工核酸的形式,或可以是cDNA或化学合成的DNA,其不包括任何内含子。

术语“核酸”或“核酸序列”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸寡核苷酸。该术语涵括包含天然核苷酸的已知类似物的核酸,即寡核苷酸。该术语还涵括具有合成骨架的核酸样结构(参见例如,Oligonucleotides and Analogues,a PracticalApproach,ed.F.Eckstein,Oxford Univ.Press(1991);Antisense Strategies,Annals ofthe N.Y.Academy of Sciences,Vol.600,Eds.Baserga et al.(NYAS 1992);MilliganJ.Med.Chem.36:1923-1937(1993);Antisense Research and Applications(1993,CRCPress);WO 97/03211;WO 96/39154;Mata,Toxicol.Appl.Pharmacol.144:189-197(1997);Strauss-Soukup,Biochemistry 36:8692-8698(1997);Samstag,Antisense Nucleic AcidDrug Dev,6:153-156(1996))。

除非另有说明,否则特定的核酸序列还隐含地涵括其保守修饰的变体(例如,简并密码子置换)和互补序列,以及明确指出的序列。具体地,简并密码子置换可以通过生成例如其中一个或多个选定密码子的第三个位置被混合碱基和/或脱氧肌苷残基置换的序列来实现(Batzer et al.,Nucleic Acid Res.,19:5081(1991);Ohtsuka et al.,J.Biol.Chem.,260:2605-2608(1985);Rossolini et al.,Mol.Cell.Probes,8:91-98(1994))。术语核酸可与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换使用。

本发明还提供了包括编码Myd多肽的多核苷酸的表达盒和用载体转化的宿主细胞。

在另一方面,本发明提供了多肽(例如,分离的多肽),该多肽包括以下,基本上由以下组成,或由以下组成:与选自由SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16和SEQ ID NO:17组成的组的多肽序列具有至少80%(例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性的多肽序列,其中,多肽任选地包含至少一个(例如,2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72个以及任何这些值的范围个)修饰(例如缺失、插入、置换或添加),其中,多肽任选地还包括组氨酸标签,并且其中,多肽具有甜味调节活性。术语“基本上由……组成”允许包括对产品的功能或活性不是必需的并且不会实质性影响功能或活性的组分,诸如抗结块剂、填料、稳定剂(例如,热稳定剂)和填充剂(例如,麦芽糖葡萄糖(maltodextrose)、阿拉伯树胶等)。

多肽包括SEQ ID NO:3或与SEQ ID NO:3具有至少80%序列同一性。多肽包括SEQID NO:8或与SEQ ID NO:8具有至少80%序列同一性。多肽包括SEQ ID NO:9或与SEQ IDNO:9具有至少80%序列同一性。多肽包括SEQ ID NO:10或与SEQ ID NO:10具有至少80%序列同一性。多肽包括SEQ ID NO:11或与SEQ ID NO:11具有至少80%序列同一性。多肽包括SEQ ID NO:12或与SEQ ID NO:12具有至少80%序列同一性。多肽包括SEQ ID NO:13或与SEQ ID NO:13具有至少80%序列同一性。多肽包括SEQ ID NO:14或与SEQ ID NO:14具有至少80%序列同一性。多肽包括SEQ ID NO:15或与SEQ ID NO:15具有至少80%序列同一性。多肽包括SEQ ID NO:16或与SEQ ID NO:16具有至少80%序列同一性。多肽包括SEQ ID NO:17或与SEQ ID NO:17具有至少80%序列同一性。

在一种实施方式中,多肽序列选自由以下组成的组:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17。在一种实施方式中,多肽不是SEQ ID NO:3的多肽。

在一个方面,多肽包括SEQ ID NO:3的氨基酸残基1-11、17-32、39、40、45-67、73-100和110-121。在一个方面,多肽包括SEQ ID NO:3的氨基酸残基1-11、17-32、39、40、45-67、73-100和110-121,但多肽不是具有SEQ ID NO:3的氨基酸序列的多肽。

在另一方面,多肽包括SEQ ID NO:3的氨基酸残基1-121,其中,在多肽序列的氨基酸残基12-16、33-38、41-44、68-72或101-109中,存在至少1个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24个或其值的任何范围个)与SEQ ID NO:3相比在所列残基中的氨基酸置换、添加、插入或缺失。在另一方面,由多核苷酸编码的具有甜味调节活性的多肽的多肽序列为包括SEQ ID NO:3的氨基酸残基1-121的多肽,其中,在多肽序列的氨基酸残基12-16、33-38、41-44、68-72或101-109中,存在至少1个与SEQ IDNO:3相比在所列残基中的氨基酸置换、添加、插入或缺失,并且其中,多肽与SEQ ID NO:3具有至少80%的序列同一性。

在另一方面,本发明包括具有甜味调节活性的重组多肽,该重组多肽包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:17具有至少80%(例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性的氨基酸序列,该氨基酸序列与异源信号肽或转运肽融合。术语“基本上由……组成”允许包括对产品的功能或活性不是必需的并且不会实质性影响功能或活性的组分,诸如抗结块剂、填料、稳定剂(例如,热稳定剂)和填充剂(例如,麦芽糖葡萄糖(maltodextrose)、阿拉伯树胶等)。

在另一方面,本发明包括具有甜味调节活性的多肽,该多肽包括以下、基本上由以下组成或由以下组成:与SEQ ID NO:3(或SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17)具有至少80%(例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)序列同一性并且包含相对于SEQ ID NO:3(或SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17)的至少一个置换修饰的氨基酸。在一些方面,与SEQ ID NO:3的相应氨基酸相比,本发明的多肽在以下位置处包括1至24个氨基酸置换:位置2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120或121处。术语“基本上由……组成”允许包括对产品的功能或活性不是必需的并且不会实质性影响功能或活性的组分,诸如抗结块剂、填料、稳定剂(例如,热稳定剂)和填充剂(例如,麦芽糖葡萄糖、阿拉伯树胶等)。

在特定方面,由多核苷酸编码的具有甜味调节活性的多肽的多肽序列包括SEQ IDNO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75的氨基酸序列。

SEQ ID NO:71(共有序列1)对应于SEQ ID NO:3,只是位置3、11-16、26、33、34、36-38、41-43、51、57、66、68-72、85、86、89、97、101-110、117和120是任何氨基酸。本发明提供了包括SEQ ID NO:71的氨基酸序列的多肽。

SEQ ID NO:72(共有序列2)对应于SEQ ID NO:3,只是位置3、11-16、26、33、37、38、41、43、51、57、66、68-70、72、85、86、89、97、101-103、105-110、117和120是任何氨基酸(即,维持了SEQ ID NO:3的位置34、36、42、71和104处的脯氨酸)本发明提供了包括SEQ ID NO:72的氨基酸序列的多肽。

SEQ ID NO:73(共有序列3)和SEQ ID NO:74(共有序列4)对应于SEQ ID NO:3,只是位置3、11-16、26、33、37、38、41、43、51、57、66、68-70、72、85、86、89、97、101-103、105-110、117和120可以包括本文所述的保守修饰。本发明提供了包括SEQ ID NO:73的氨基酸序列的多肽。本发明提供了包括SEQ ID NO:74的氨基酸序列的多肽。

SEQ ID NO:75(共有序列5)对应于SEQ ID NO:3,只是位置3、11、26、51、57、66、69、85、86、89、97、103、106、110、117和120可以包括本文所述的保守修饰。本发明提供了包括SEQ ID NO:75的氨基酸序列的多肽。

在特定的方面,具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:3,其在SEQID NO:3的残基3、11、26、51、57、66、69、85、86、89、97、103、106、110、117和120处具有一个或多个修饰(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15和16个)。本文给出了相对于SEQID NO:3(对于多肽)的示例性修饰(参见实施例8;表3)。例如,具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ ID NO:68,或者与SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ ID NO:68具有至少80%(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的氨基酸序列。

具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:24(D3E)或与SEQ ID NO:24具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:26(K11R)或与SEQ ID NO:26具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:30(K26R)或与SEQ ID NO:30具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:38(K51R)或与SEQ ID NO:38具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:42(R57K)或与SEQ ID NO:42具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:44(R66K)或与SEQID NO:44具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:46(D69E)或与SEQ ID NO:46具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:50(D85E)或与SEQ ID NO:50具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:52(E86D)或与SEQ ID NO:52具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:54(E89D)或与SEQ ID NO:54具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:58(D97E)或与SEQ ID NO:58具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ IDNO:60(K103R)或与SEQ ID NO:60具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:62(R106K)或与SEQ ID NO:62具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:64(R110K)或与SEQ ID NO:64具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:66(E117D)或与SEQ IDNO:66具有至少80%序列同一性。具有甜味调节活性的多肽的多肽序列包括SEQ ID NO:68(K120R)或与SEQ ID NO:68具有至少80%序列同一性。

在另一方面,编码具有甜味调节活性的多肽的多核苷酸包括SEQ ID NO:23、SEQID NO:25、SEQ ID NO:29、SEQ ID NO:37、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQID NO:63、SEQ ID NO:65或SEQ ID NO:67,或者与SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:29、SEQ ID NO:37、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65或SEQ ID NO:67具有至少80%(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的核酸序列。

多核苷酸包括SEQ ID NO:23(对应于D3E)或与SEQ ID NO:23具有至少80%序列同一性。多核苷酸包括SEQ ID NO:25(对应于K11R)或与SEQ ID NO:25具有至少80%序列同一性。多核苷酸包括SEQ ID NO:29(对应于K26R)或与SEQ ID NO:29具有至少80%序列同一性。多核苷酸包括SEQ ID NO:37(对应于K51R)或与SEQ ID NO:37具有至少80%序列同一性。多核苷酸包括SEQ ID NO:41(对应于R57K)或与SEQ ID NO:41具有至少80%序列同一性。多核苷酸包括SEQ ID NO:43(对应于R66K)或与SEQ ID NO:43具有至少80%序列同一性。多核苷酸包括SEQ ID NO:45(对应于D69E)或与SEQ ID NO:45具有至少80%序列同一性。多核苷酸包括SEQ ID NO:49(D85E)或与SEQ ID NO:49具有至少80%序列同一性。多核苷酸包括SEQ ID NO:51(对应于E86D)或与SEQ ID NO:51具有至少80%序列同一性。多核苷酸包括SEQ ID NO:53(对应于E89D)或与SEQ ID NO:53具有至少80%序列同一性。多核苷酸包括SEQ ID NO:57(对应于D97E)或与SEQ ID NO:57具有至少80%序列同一性。多核苷酸包括SEQ ID NO:59(对应于K103R)或与SEQ ID NO:59具有至少80%序列同一性。多核苷酸包括SEQ ID NO:61(对应于R106K)或与SEQ ID NO:61具有至少80%序列同一性。多核苷酸包括SEQ ID NO:63(R110K)或与SEQ ID NO:63具有至少80%序列同一性。多核苷酸包括SEQID NO:65(E117D)或与SEQ ID NO:65具有至少80%序列同一性。多核苷酸包括SEQ ID NO:67(K120R)或与SEQ ID NO:67具有至少80%序列同一性。

在一个方面,多核苷酸包括SEQ ID NO:20,其对应于大肠杆菌中带His标签的mycodulcein的编码序列(其中残基364-381对应于任选的His标签序列)。SEQ ID NO:20针对在大肠杆菌中的表达进行了密码子优化。在另一方面,多核苷酸包括SEQ ID NO:22,其对应于酿酒酵母中带His标签的mycodulcein的编码序列(其中,残基364-381对应于任选的His标签序列)。SEQ ID NO:22针对在酿酒酵母中的表达进行了密码子优化。SEQ ID NO:21的相应多肽对应于带His标签的mycodulcein蛋白(其中,残基122-127对应于任选的His标签序列),该多肽序列对于在大肠杆菌和酿酒酵母中的表达是相同的。因此,本发明还提供了包括SEQ ID NO:21的氨基酸序列的多肽。

本发明还提供了多肽,该多肽包括SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:40、SEQ ID NO:48或SEQ IDNO:56的氨基酸序列,或者与SEQ IDNO:28、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:40、SEQ ID NO:48或SEQID NO:56具有至少80%(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的氨基酸序列。

多肽包括SEQ ID NO:28(R20K)或与SEQ ID NO:28具有至少80%序列同一性。多肽包括SEQ ID NO:32(E35D)或与SEQ ID NO:32具有至少80%序列同一性。多肽包括SEQ IDNO:34(K44R)或与SEQ ID NO:34具有至少80%序列同一性。多肽包括SEQ ID NO:36(D46E)或与SEQ ID NO:36具有至少80%序列同一性。多肽包括SEQ ID NO:40(D52E)或与SEQ IDNO:40具有至少80%序列同一性。多肽包括SEQ ID NO:48(R75K)或与SEQ ID NO:48具有至少80%序列同一性。多肽包括SEQ ID NO:56(D94E)或与SEQ ID NO:56具有至少80%序列同一性。

在另一方面,多核苷酸包括SEQ ID NO:27、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:39、SEQ ID NO:47或SEQ ID NO:55,或者与SEQ ID NO:27、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:39、SEQ ID NO:47或SEQ ID NO:55具有至少80%(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的核酸序列。

多核苷酸包括SEQ ID NO:27(对应于R20K)或与SEQ ID NO:27具有至少80%序列同一性。多核苷酸包括SEQ ID NO:31(对应于E35D)或与SEQ ID NO:31具有至少80%序列同一性。多核苷酸包括SEQ ID NO:33(对应于K44R)或与SEQ ID NO:33具有至少80%序列同一性。多核苷酸包括SEQ IDNO:35(对应于D46E)或与SEQ ID NO:35具有至少80%序列同一性。多核苷酸包括SEQ ID NO:39(对应于D52E)或与SEQ ID NO:39具有至少80%序列同一性。多核苷酸包括SEQ ID NO:47(对应于R75K)或与SEQ ID NO:47具有至少80%序列同一性。多核苷酸包括SEQ ID NO:55(对应于D94E)或与SEQ ID NO:55具有至少80%序列同一性。

术语“多肽”、“肽”和“蛋白”在本文中可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是相应天然存在氨基酸的人工化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

多核苷酸或多肽可以是天然存在的或非天然存在的(例如,合成的、重组的、修饰的和/或变体产物)。在一个方面,天然存在或非天然存在的产物是分离的或纯化的。

在一个方面,术语“分离的”涵括已经从生物环境(例如,细胞、组织、培养基、体液等)中移除或以其他方式纯度增加到任何程度(例如,从合成介质中分离出来)的产物。因此,分离的产物可以是合成的或天然产生的。

如本文所用,当涉及核酸或多肽时,术语“分离的”是指与天然存在不同的纯化或浓缩状态。大于天然存在的纯化或浓度的任何程度,包括(1)从其他天然存在的相关结构或化合物中纯化,或(2)与通常在体内不相关的结构或化合物相关,都在如本文所用的“分离的”的含义。根据本领域技术人员已知的多种方法和处理,本文所述的核酸或多肽可以是分离的或以其他方式与它们在自然界中通常不相关的结构或化合物相关。在一种实施方式中,本文所述的多肽包含按重量计至多5%(例如,至多4%、至多3%、至多2%至多1%)的其他真菌蛋白。

如本文所用,“重组”是指在体外合成或以其他方式操作的多核苷酸(例如,“重组多核苷酸”),是指使用重组多核苷酸在细胞或其他生物系统中产生基因产物的方法,或是指由重组多核苷酸编码的多肽(“重组蛋白”)“重组方式”还涵括将来自不同来源的具有不同编码区或结构域或启动子序列的核酸连接到表达盒或载体中,以表达例如包括本发明的易位结构域和使用本发明的引物扩增的核酸序列的融合蛋白的诱导型或组成型表达。

“修饰的”或“变体”产物是指从原始(例如,天然存在的)结构改变的产物(例如,多核苷酸或多肽)。如本文所述,变体涵括分别具有核酸或氨基酸序列的一个或多个变化的多核苷酸或多肽。变化包括对核酸或氨基酸序列的修饰,包括添加、缺失、插入和置换。相对于原始结构,修饰或变体产物还可以涵括二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,诸如与标记组分的缀合。

如本文所用,术语“扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法来生成或检测重组或天然表达的核酸,如下文详细描述的。例如,本发明提供了用于在体内或体外扩增(例如,通过聚合酶链反应、PCR)本发明(例如,本发明的味觉刺激结合序列)的天然表达(例如,基因组或mRNA)或重组(例如,cDNA)核酸的方法和试剂。

术语“文库”意指为不同核酸或多肽分子的混合物的制备物,诸如通过使用简并引物对扩增核酸来生成的重组生成的Myd相关多核苷酸的文库,或引入了扩增的配体结合结构域的分离的载体集合,或细胞各自用编码MYD的至少一个载体随机转染的细胞混合物。

如本文所用,“核酸探针或寡核苷酸”被定义为通过一种或多种类型的化学键合,通常通过互补碱基配对,通常通过氢键形成,能够与互补序列的靶核酸结合的核酸。如本文所用,探针可以包括天然的(即,A、G、C或T)或修饰的碱基(7-脱氮鸟苷、肌苷等)。另外,探针中的碱基可以通过磷酸二酯键以外的键连接,只要它不干扰杂交即可。因此,例如,探针可以是肽核酸,其中组成碱基通过肽键而不是磷酸二酯键连接。本领域技术人员将理解,取决于杂交条件的严格性,探针可以结合与探针序列缺乏完全互补性的靶序列。探针任选地用同位素、发色团、发光团(lumiphore)、色原直接标记,或间接标记诸如用生物素间接标记,链霉亲和素复合物随后可与该生物素结合。通过测定探针的存在或不存在,可以检测选择序列或子序列的存在或不存在。

术语“异源”当用于指核酸的部分时表示核酸包括在自然界中彼此不存在相同关系的两个或更多个子序列。例如,核酸通常是重组产生的,具有来自不相关基因的两个或更多个序列,这些序列被排列以产生新的功能性核酸,例如来自一个来源的启动子和来自另一个来源的编码区。类似地,异源蛋白表示该蛋白包括在自然界中彼此不存在相同关系的两个或更多个子序列(例如,融合蛋白)。

“启动子”定义为指导核酸转录的一系列核酸序列。如本文所用,启动子包括转录起始位点附近的必需核酸序列,诸如,在聚合酶II型启动子的情况下,TATA元件。启动子还任选地包括远侧端增强子或阻遏物元件,它们可以位于距转录起始位点多达几千个碱基对处。“组成型”启动子是在大多数环境和发育条件下有活性的启动子。“诱导型”启动子是在环境或发育调控下具有活性的启动子。术语“可操作地连接”是指核酸表达控制序列(诸如启动子或转录因子结合位点阵列)与第二核酸序列之间的功能性连接,其中,表达控制序列指导对应于第二序列的核酸的转录。

术语“MYD家族”可以是指多态性变体,包括编码多肽的天然等位基因、突变体、等位基因和种间同源物,所述多肽:(1)与SEQ ID NO:3在约25个氨基酸、任选50-100个氨基酸的窗口上具有至少约35%至50%的氨基酸序列同一性,任选地约60%、75%、80%、85%、90%、95%、96%、97%、98%或99%的氨基酸序列同一性。

术语“表达载体”或“表达盒”是指任何重组表达系统,目的是在任何细胞(包括原核、酵母、真菌、植物、昆虫或哺乳动物细胞)中在体外或体内组成型或诱导型地表达本发明的核酸序列。该术语包括线性或环状表达系统。该术语包括保持游离基因或整合到宿主细胞基因组中的表达系统。表达系统可以具有自我复制的能力,或不具有该能力,即仅驱动细胞中的瞬时表达。该术语包括仅包含转录重组核酸所需的最少元件的重组表达“盒”。

“宿主细胞”意指包含表达载体并支持表达载体的复制或表达的细胞。宿主细胞可以是原核细胞诸如大肠杆菌,或真核细胞如酵母、昆虫、两栖动物或哺乳动物细胞,诸如CHO、HeLa、HEK-293等,例如培养的细胞、外植体和体内细胞。

在一种实施方式中,宿主细胞选自由以下组成的组:大肠杆菌(Escherichiacoli)、产酸克雷伯氏菌(Klebsiella oxytoca)、产琥珀酸厌氧螺菌(Anaerobiospirillumsucciniciproducens)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、产琥珀酸曼氏杆菌(Mannheimia succiniciproducens)、菜豆根瘤菌(Rhizobium etli)、枯草芽孢杆菌(Bacillus subtilis)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、氧化葡萄糖酸杆菌(Gluconobacter oxydans)、运动发酵单胞菌(Zymomonas mobilis)、乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、天蓝色链霉菌(Streptomyces coelicolor)、丙酮丁醇梭菌(Clostridium acetobutylicum)、荧光假单胞菌(Pseudomonas fluorescens)、恶臭假单胞菌(Pseudomonas putida)、酿酒酵母(Saccharomyces cerevisiae)、栗酒裂殖酵母(Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、土曲霉(Aspergillus terreus)、黑曲霉(Aspergillus niger)、毕赤酵母(Pichia pastoris)、少根根霉(Rhizopus arrhizus)、米根霉(Rhizopus oryzae)、解脂耶氏酵母(Yarrowialipolytica)、白念珠菌(Candida albicans)、东方伊萨酵母(Issatchenkia orientalis)、树干发酵酵母(Scheffersomyces stipitis)、解脂耶氏酵母、汉逊酵母(Ogataeapolymorpha)、红发夫酵母(Phaffia rhodozyma)、产朊假丝酵母(Candida utilis)、Arxulaadeninivorans、汉逊德巴利酵母(Debaryomyces hansenii)、多形德巴利酵母(Debaryomyces polymorphus)和许旺酵母(Schwanniomyces occidentalis)。

在另一方面,宿主细胞选自由以下组成的组:革兰氏阳性无孢子形成细菌、革兰氏阳性孢子形成细菌、革兰氏阴性细菌、酵母和原生生物/藻类。

革兰氏阳性无孢子形成细菌的非限制性实例包括青春双歧杆菌(Bifidobacterium adolescentis)、动物双歧杆菌(Bifidobacterium animalis)、两歧双歧杆菌(Bifidobacterium bifidum)、短双歧杆菌(Bifidobacterium breve)、长双歧杆菌(Bifidobacterium longum)、广布肉毒杆菌(Carnobacterium divergens)、产氨棒杆菌(Corynebacterium ammoniagenes)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、嗜酸乳杆菌(Lactobacillus acidophilus)、解淀粉乳杆菌(Lactobacillus amylolyticus)、食淀粉乳杆菌(Lactobacillus amylovorus)、动物乳杆菌(Lactobacillus animalis)、消化乳杆菌(Lactobacillus alimentarius)、鸟乳杆菌(Lactobacillus aviaries)、短乳杆菌(Lactobacillus brevis)、布氏乳杆菌(Lactobacillus buchneri)、干酪乳杆菌(Lactobacillus casei)、纤维二糖乳杆菌(Lactobacillus cellobiosus)、丘状乳杆菌(Lactobacillus collinoides)、棒状乳杆菌(Lactobacillus coryniformis)、卷曲乳杆菌(Lactobacillus crispatus)、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌(Lactobacillus delbrueckii)、糊精乳杆菌(Lactobacillus dextrinicus)、食二酸乳杆菌(Lactobacillus diolivorans)、香肠乳杆菌(Lactobacillus farciminis)、发酵乳杆菌(Lactobacillus fermentum)、母鸡乳杆菌(Lactobacillus gallinarum)、加氏乳杆菌(Lactobacillus gasseri)、瑞士乳杆菌(Lactobacillus helveticus)、希氏乳杆菌(Lactobacillus hilgardii)、约氏乳杆菌(Lactobacillus johnsonii)、开菲尔基质乳杆菌(Lactobacillus kefiranofaciens)、开菲尔乳杆菌(Lactobacillus kefiri)、粘膜乳杆菌(Lactobacillus mucosae)、面包乳杆菌(Lactobacillus panis)、副干酪乳杆菌(Lactobacillus paracasei)、类谷糠乳杆菌(Lactobacillus parafarraginis)、类植物乳杆菌(Lactobacillus paraplantarum)、戊糖乳杆菌(Lactobacillus pentosus)、植物乳杆菌、桥乳杆菌(Lactobacillus pontis)、罗伊氏乳杆菌(Lactobacillus reuteri)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、沙克乳酸杆菌(Lactobacillus sakei)、唾液乳杆菌(Lactobacillus salivarius)、旧金山乳杆菌(Lactobacillus sanfranciscensis)、乳酸乳球菌(Lactococcus lactis)、柠檬明串珠菌(Leuconostoc citreum)、乳明串珠菌(Leuconostoc lactis)、肠膜明串珠菌(Leuconostoc mesenteroides)、假肠膜明串珠菌肠(Leuconostoc pseudomesenteroides)、蛾微杆菌(Microbacterium imperial)、酒类酒球菌(Oenococcus oeni)、巴斯德杆菌(Pasteuria nishizawae)、乳酸片球菌(Pediococcusacidilactic)、小片球菌(Pediococcus parvulus)、戊糖片球菌(Pediococcuspentosaceus)、产丙酸丙酸杆菌(Propionibacterium acidipropioni)、费氏丙酸杆菌(Propionibacterium freudenreichii)和嗜热链球菌(Streptococcus thermophiles)。

革兰氏阳性孢子形成细菌的非限制性实例包括解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、萎缩芽孢杆菌(Bacillus atrophaeus)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、弯曲芽孢杆菌(Bacillus flexus)、梭形芽孢杆菌(Bacillus fusiformis)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、摩加夫芽孢杆菌(Bacillus mojavensis)、短小芽孢杆菌(Bacilluspumilus)、史氏芽孢杆菌(Bacillus smithii)、枯草芽孢杆菌(Bacillus subtilis)、死谷芽孢杆菌(Bacillus vallismortis)、贝莱斯芽胞杆菌(Bacillus velezensis)、嗜热脂肪土芽胞杆菌(Geobacillus stearothermophilus)、依利诺斯类芽孢杆菌(Paenibacillusillinoisensis)和热葡糖苷酶地芽胞杆菌(Parageobacillus thermoglucosidasius)。革兰氏阴性细菌的非限制性实例包括钩虫贪铜菌11599(Cupriavidus necator)、氧化葡萄糖杆菌(Gluconobacter oxydans)、Komagataeibacter sucrofermentans和野油菜黄单胞菌野(Xanthomonas campestris)。

酵母的非限制性实例包括柱状假丝酵母(Candida cylindracea)、汉逊德巴利酵母(Debaryomyces hansenii)、葡萄汁有孢汉逊酵母(Hanseniaspora uvarum)、乳酸克鲁维酵母、马克斯克鲁维酵母、巴斯德驹形氏酵母(Komagataella pastoris)、法夫驹形氏酵母(Komagataella phaffi)、无性型产朊假丝酵母(Lindnera jadinii)、Ogataea angusta、贝酵母(Saccharomyces bayanus)、酿酒酵母、巴斯德酵母(Saccharomyces pastorianus)、粟酒裂殖酵母、异常威克汉姆酵母(Wickerhamomyces anomalus)、红发夫酵母(Xanthophyllomyces dendrorhous)、解脂耶氏酵母和鲁氏接合酵母(Zygosaccharomycesrouxii)。

原生生物/藻类的非限制性实例包括裂殖壶奥兰氏菌(Aurantiochytriumlimacinum)、细小裸藻(Euglena gracilis)和朱氏四爿藻(Tetraselmis chuii)。

本文描述的Myd蛋白还包括具有与示例性序列基本对应的结构和活性的“类似物”或“保守变体”和“模拟物”(“肽模拟物”)。因此,术语“保守变体”或“类似物”或“模拟物”是指具有修饰的氨基酸序列的多肽,使得一种或多种变化基本上不改变如本文定义的多肽(保守变体)的结构和/或活性。这些包括氨基酸序列的保守修饰变异,即那些对蛋白活性不重要的残基的氨基酸置换、添加或缺失,或利用相似特性(例如,酸性、碱性、带正电荷的或带负电荷的、极性或非极性等)的残基的氨基酸置换,这样即使是重要氨基酸的置换也不会显著改变结构和/或活性。

更具体地,“保守修饰的变体”适用于氨基酸和核酸序列两者。对于特定的核酸序列,保守修饰的变体是指那些编码相同或基本相同的氨基酸序列的核酸,或者在核酸不编码氨基酸序列的情况下是指基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白。

例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在丙氨酸由密码子指定的每个位置,密码子可以改变为所描述的任何相应密码子而不改变编码的多肽。

这样的核酸变异是“沉默变异”,其是一种保守修饰的变异。本文编码多肽的每个核酸序列也描述了核酸的每个可能的沉默变异。技术人员将认识到核酸中的每个密码子(除了AUG,其通常是甲硫氨酸的唯一密码子,和TGG,其通常是色氨酸的唯一密码子)可以被修饰以产生功能相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在每个描述的序列中。

提供功能相似氨基酸的保守置换表是本领域众所周知的。例如,选择保守置换的一个示例性指南包括(原始残基后跟示例性置换):ala/gly或ser;arg/lys;asn/gln或his;asp/glu;cys/ser;gln/asn;gly/asp;gly/ala或pro;his/asn或gln;ile/leu或val;leu/ile或val;lys/arg或gln或glu;met/leu或tyr或ile;phe/met或leu或tyr;ser/thr;thr/ser;trp/tyr;tyr/trp或phe;val/ile或leu。替代的示例性指南使用以下六组,每组包含彼此保守置换的氨基酸:1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(I);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);和6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);(另参见,例如,Creighton,Proteins,W.H.Freeman and Company(1984);Schultz and Schimer,Principles ofProtein Structure,Springer-Vrlag(1979))。另一个替代的示例性指南使用以下六组,其中脯氨酸是独特的:1)Gly(G)、Ala(A)、Val(V)、Leu(L)、Ile(I);2)Ser(S)、Cys(C)、Thr(T)、Met(M);3)Pro(P);4)Phe(F)、Tyr(Y)、Try(W);5)His(H)、Lys(K)、Arg(R);以及6)Asp(D)、Glu(E)、Gln(N)。本领域的技术人员将理解,上述置换不是唯一可能的保守置换。例如,出于某些目的,人们可以将所有带电荷的氨基酸视为彼此的保守置换,无论它们是正的还是负的。另外,改变、添加或缺失编码序列中单个氨基酸或一小百分比的氨基酸的个别置换、缺失或添加也可被认为是“保守修饰的变异”。本领域技术人员熟悉在表达目的蛋白的给定宿主中的密码子选择。

术语“模拟物”和“肽模拟物”是指具有与本发明的多肽(例如易位结构域、配体结合结构域或嵌合受体)基本相同的结构和/或功能特征的合成化合物。模拟物可以完全由合成的非天然氨基酸类似物组成,或者可以是部分天然肽氨基酸和部分非天然氨基酸类似物的嵌合分子。模拟物也可以掺入任意量的天然氨基酸保守置换,只要此类置换也不会显著改变模拟物的结构和/或活性即可。

对于作为保守变体的本发明的多肽,常规实验将确定模拟物是否在本发明的范围内,即其结构和/或功能是否未发生实质性改变。多肽模拟组合物可以包含非天然结构组分的任意组合,其通常来自三个结构组:a)除天然酰胺键(“肽键”)连接之外的残基连接基团;b)代替天然存在的氨基酸残基的非天然残基;c)诱导二级结构拟态的残基,即诱导或稳定二级结构,例如β转角、γ转角、β折叠、α螺旋构象等。当多肽的所有或一些残基通过天然肽键以外的化学方式连接时,多肽可以表征为模拟物。单个肽模拟物残基可以通过肽键、其他化学键或偶联方式连接,诸如例如戊二醛、N-羟基琥珀酰亚胺酯、双官能马来酰亚胺、N,N'-二环己基碳二亚胺(DCC)或N,N'-二异丙基碳二亚胺(DIC)。可以替代传统酰胺键(“肽键”)连接的连接基团包括,例如,酮亚甲基(ketomethylene)(例如--C(O)--CH

使用包括PHYRE Protein Homology/analogY Recognition Engine V 2.0和蛋白二级结构预测服务器JPred在内的工具进行蛋白折叠分析。这些工具揭示了SEQ ID NO:3预测了β折叠主导的球状蛋白,它具有大量的β-折叠部分和一些短的α-螺旋部分。具体而言,Jpred工具预测了SEQ ID NO:3的约残基5-11、16-19、28-29、39-40、61-67、71-77和98-101的推定β折叠;以及约残基20-25、45-55、111-119的α-螺旋;PHYRE工具预测了SEQ IDNO:3的约残基5至12、17-32、38-40、45-57、62-66、73-81、98-104和112-116的β折叠以及约残基84至89和116-118的α-螺旋。参见图1。

Myd1蛋白结构的保守修饰变体的实例可以使用同源建模算法SWISS-MODEL、PHYRE2.0和Jpred鉴定基于序列的共有序列环区域来推导,如本领域中已知的,参见例如S.&Frydman,J.Interplay between Chaperones and Protein Disorder Promotes theEvolution of Protein Networks.PLoS Computational Biology 10,e1003674(2014)。

与Myd1具有推定的相似结构和功能的替代蛋白序列在本文中作为SEQ ID NO:8至SEQ ID NO:17提供。为了推导SEQ ID NO:8至SEQ IDNO:17,选择共有环区域作为突变位点,因为大多数插入和缺失通常出现在二级结构元件之间的区域,在这些区域可以更容易地容纳它们,而不会在蛋白的整体折叠中产生重大扭曲。该蛋白的核心具有更高程度的序列保守性,如在4JOX中发现的。

在共有环区域内的29个可能的氨基酸位置中,有12个氨基酸使用保守替换进行了置换。如果选择用于突变,野生型氨基酸在保守氨基酸残基中具有相同的概率。(Gly可以被Ala、Cys、Asp、Glu、Arg以相等地20%概率替换)。

MYD/Myd核苷酸和氨基酸序列的特定区域可用于鉴定多态性变体、种间同源物和Myd家族成员的等位基因。这种鉴定可以在体外进行,例如,在严格杂交条件下或PCR(例如,使用编码本文鉴定的Myd序列的引物),或通过使用计算机系统中的序列信息与其他核苷酸序列进行比较。单个物种种群中MYD基因的不同等位基因也将有助于确定等位基因序列的差异是否与种群成员之间的味觉差异相关。经典的PCR型扩增和克隆技术可用于分离直系同源物,例如,其中简并引物足以检测跨物种的相关基因。

例如,使用本文公开的序列设计的引物可用于从不同的真菌基因组中扩增和克隆MYD相关基因。相比之下,单个物种内与MYD相关的基因最好使用序列模式识别软件来识别以查找相关序列。通常,可以通过比较约25个氨基酸或更多,例如50-100个氨基酸的氨基酸序列来鉴定MYD家族成员的多态性变体和等位基因。大约至少35至50%和任选地60%、70%、75%、80%、85%、90%、95-99%或以上的氨基酸同一性通通常表明蛋白是MYD家族成员的多态性变体、种间同源物或等位基因。可以使用下文讨论的任何序列比较算法来进行序列比较。特异性结合Myd多肽或其保守区域的抗体也可用于鉴定等位基因、种间同源物和多态性变体。

MYD家族成员的核苷酸和氨基酸序列信息也可用于在计算机系统中构建甜味调节多肽的模型以及它们如何与甜味受体及其计算机系统模型相互作用。甜味受体由味觉1受体成员2(T1R2)和味觉1受体成员3(T1R3)的异二聚体组成。这些模型随后可用于识别可以增加甜味受体的激活的Myd的变体和突变,并识别Myd的更高活性版本。

各种保守突变和置换被设想在本发明的范围内。例如,使用重组基因技术的已知方案包括PCR、基因克隆、cDNA的定点诱变、宿主细胞的转染和体外转录来进行氨基酸置换将在本领域技术水平内。然后可以筛选变体的味觉受体激动剂功能活性。

在一种实施方式中,可以构建包括编码Myd融合蛋白的核酸的杂合蛋白编码序列。这些核酸序列可以与以下项可操作地连接:转录或翻译控制元件,例如转录和翻译起始序列、启动子和增强子、转录和翻译终止子、多腺苷酸化序列和用于将DNA转录成RNA的其他序列。融合蛋白可以包括C末端或N末端易位序列。此外,融合蛋白可以包括额外的元件,例如,用于蛋白检测、纯化或其他应用。检测和纯化促进结构域包括,例如,金属螯合肽,诸如聚组氨酸束、组氨酸-色氨酸模块,或允许在固定化金属上进行纯化的其他结构域;麦芽糖结合蛋白;允许在固定化免疫球蛋白上纯化的蛋白A结构域;或在FLAGS延伸/亲和纯化系统(Immunex Corp,Seattle Wash.)中使用的结构域。

在一种实施方式中,融合蛋白包括肽或蛋白标签(例如,用于蛋白纯化或检测)。肽/蛋白标签是本领域已知的,诸如在Johnson,“Protein/Peptide Tags,”DOI//dx.doi.org/10.13070/mm.en.2.116中描述的那些,包括但不限于绿色荧光蛋白(GFP)、FLAG、Myc表位、聚组氨酸、谷胱甘肽-S-转移酶(GST)、HA、V5、ABDz1-标签、腺苷酸激酶(AK-标签)、BC2-标签、钙调蛋白结合肽、CusF、Fc、Fh8、卤素标签、肝素结合肽(HB-标签)、酮类固醇异构酶(KSI)、麦芽糖结合蛋白(MBP)、硫氧还蛋白、PA(NZ-1)、Poly-Arg、Poly-Lys、S-标签、SBP/链霉亲和素结合肽、SNAP、Strep-II(Twin-Strep)和SUMO/SUMO2。

亲和标签是一种附加到蛋白上的蛋白标签,因此它们可以使用亲和技术从它们的原始生物来源中纯化出来。亲和标签在本领域中是已知的,诸如在Kimple et al.CurrProtoc Protein Sci.;73:Unit–9.9.doi:10.1002/0471140864.ps0909s73中描述的那些。这些包括聚组氨酸、GST、MBP、钙调蛋白结合肽、内含肽-甲壳质结合结构域、基于链霉亲和素/生物素的标签和His-Patch ThioFusion(硫氧还蛋白)。亲和标签包括小的(例如,20个或更少的氨基酸残基)或大的亲和标签。小亲和标签的实例包括His、FLAG、Strep II和S肽,以及大亲和标签的实例包括MBP、GST、纤维素结合结构域、钙调蛋白结合肽和His-patch硫氧还蛋白。

亲和标签包括表位标签和报道基因标签。报道基因标签作为蛋白表达和蛋白-蛋白相互作用的报道基因。报道基因标签包括但不限于酶,诸如β-半乳糖苷酶(β-gal)、碱性磷酸酶(AP)、氯霉素乙酰基转移酶(CAT)和辣根过氧化物酶(HRP)。

表位标签包括FLAG、血凝素(HA)、c-myc、T7和Glu-Glu,用于在体外和细胞培养中检测融合蛋白。它们短而线性的识别基序很少影响目的蛋白的特性,并且通常非常特异于其各自的第一抗体。如果使用抗myc抗体,则可以通过使用酶联第二抗体检测缀合的抗myc第一抗体来提高特异性,而不是单独使用HRP-或AP-抗myc缀合物。

标签可以位于靶蛋白的任一端。一些表位标签,诸如FLAG,通常串联使用以增加其所期望的特征,或与其他标签结合使用,诸如在His-Myc和His-V5的构建体中。

串联亲和纯化(TAP)是基于将两个亲和标签融合到目的蛋白的双亲和纯化方法,其允许纯化带标签的蛋白以及分离与目的蛋白相互作用的蛋白复合物。TAP的使用涵括在本发明内。

在一种实施方式中,融合蛋白包扩组氨酸标签,该标签包括2-10个(例如,2、3、4、5、6、7、8、9或10个)组氨酸残基。例如,组氨酸标签可以包括6个组氨酸残基。

新翻译多肽在易位结构域(用于有效质膜表达)和其余部分之间包括可切割的接头序列,诸如因子Xa(参见,例如,Ottavi,Biochimie 80:289-293(1998))、枯草菌素蛋白酶识别基序(参见,例如,Polyak,Protein Eng.10:615-619(1997));肠激酶(Invitrogen,圣地亚哥,Calif.)等可用于促进纯化。例如,一种构建体可以包括编码核酸序列的多肽,该核酸序列与六个组氨酸残基连接,随后是硫氧还蛋白、肠激酶切割位点(参见例如,Williams,Biochemistry 34:1787-1797(1995))和C-末端易位结构域。组氨酸残基有助于检测和纯化,而肠激酶切割位点提供了从融合蛋白的其余部分纯化一种或多种期望蛋白的方法。与编码融合蛋白的载体和融合蛋白的应用有关的技术在科学和专利文献中有很好的描述,参见,例如Kroll,DNA Cell.Biol.12:441-53(1993)。

融合蛋白可以包含一个或多个接头(例如,柔性接头、刚性接头和体内可切割接头)。除了将功能结构域连接在一起(如在柔性和刚性接头中)或在体内释放游离功能结构域(如体内可切割接头)的基本作用外,接头还为融合蛋白的生产提供许多其他优势,诸如改善生物学活性,增加表达产量,以及实现期望的药代动力学特征。接头在本领域中是已知的(参见,例如,Chen et al.,Adv Drug Deliv Rev.65(10):1357–1369(2013))。

当连接的结构域需要一定程度的移动或相互作用时,使用柔性接头。它们通常由小的非极性(例如Gly)或极性(例如Ser或Thr)氨基酸组成。这些氨基酸的小尺寸提供了柔性,并允许连接功能结构域的移动性。Ser或Thr的掺入可以通过与水分子形成氢键来维持水性溶液中接头的稳定性,并且从而降低接头与蛋白部分之间的不利相互作用。

最常用的柔性接头具有主要由Gly和Ser残基延伸组成的序列(“GS”接头)。最广泛使用的柔性接头的实例具有序列(Gly-Gly-Gly-Gly-Ser)

刚性接头在结构域之间保持固定距离并维持它们的独立功能。刚性接头的实例包括具有(EAAAK)

本发明的多肽还可以包含信号肽(即,信号序列、靶向信号、定位信号、定位序列、转运肽、前导序列或前导肽),其是存在于大多数新合成的旨在进入分泌途径的蛋白的N末端或偶尔的C末端的短肽。这些蛋白包括驻留在某些细胞器(内质网、高尔基体或核内体)内、从细胞分泌或插入大多数细胞膜的那些。示例性信号肽是本领域已知的并且本领域普通技术人员将认识到如何选择特定信号肽用于本发明。

如本文所用,关于氨基酸序列或核苷酸序列的“至少80%同一性”是指80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多同一性。

如本文所用,“通过一个或多个氨基酸的缺失、插入、置换或添加修饰的氨基酸序列”的实例包括通过1个或多个至30个或更少个、优选20个或更少个、更优选10个或更少个、和进一步优选5个或更少个氨基酸(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或其任何范围个)的缺失、插入、置换或添加修饰的氨基酸序列。如本文所用,“通过一个或多个核苷酸的缺失、插入、置换或添加修饰的核苷酸序列”的实例包括通过1个或多个至90个或更少个、优选60个或更少个、更优选30个或更少个、进一步优选15个或更少个、和进一步更优选10个或更少个核苷酸(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90个或其任何范围个)的缺失、插入、置换或添加修饰的核苷酸序列。

例如,在序列比较中,通常将一个序列作为参考序列,将测试序列与其进行比较。当使用序列比较算法时,将测试和参考序列输入计算机,指定子序列坐标(如果需要的话),并且指定序列算法程序参数。可以使用默认程序参数,如下文针对BLASTN和BLASTP程序所述,或者可以指定替代参数。然后,序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性百分比。

如本文所用,“比较窗口”包括指选自由20个至600个、通常约50个至约200个、更通常约100个至约150个组成的组的多个连续位置中的任何一个的区段,其中可以将序列与相同数量的连续位置的参考序列在两个序列最佳比对后进行比较。用于比较的序列比对方法是本领域众所周知的。可以进行用于比较的序列的最佳比对,例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,通过Needleman&Wunsch,JMol.Biol.48:443(1970)的同源性比对算法,通过Pearson&Lipman,Proc.Natl.Acad Sci.USA 85:2444(1988)的相似性搜索方法,通过这些算法的计算机化实施(GAP、BESTFIT、FASTA和TFASTA,于Wisconsin遗传学软件包中,Genetics Computer Group,575Science Dr.,Madison,Wis.),或通过手动比对和目视检查(参见,例如,Current Protocols in MolecularBiology(Ausubel et al.,eds.1995supplement))。

适用于确定百分比序列同一性和序列相似性的算法的优选实例是BLAST和BLAST2.0算法,它们分别描述于Altschul at al.,Nuc.Acids Res.25:3389-3402(1977)和Altschul et al.,J Mol.Biol.215:403-410(1990)中。用于执行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information.)公开获得。该算法涉及首先通过识别查询序列中长度为W的短词来识别高分序列对(HSP),当与数据库序列中相同长度的词对比时,这些短词匹配或满足某个正值阈值得分T。T被称为邻域词得分阈值(Altschul et al.,Altschul et al.,Nuc.Acids Res.25:3389-3402(1977)andAltschul et al.,J Mol.Biol.215:403-410(1990))。这些初始的邻域词命中充当用于启动搜索以查找包含它们的更长HSP的种子。词命中沿着每个序列在两个方向上延伸,直到可以增加累积比对得分。对于核苷酸序列,使用参数M(一对匹配残基的奖励得分;始终>0)和N(不匹配残基的罚分得分;始终<0)计算累积得分。对于氨基酸序列,使用评分矩阵计算累积得分。在以下情况下,词在每个方向上的延伸命中将停止:累积比对得分从其最大实现值下降数量X;由于一个或多个负得分残基比对的累积,累积得分变为零或以下;或到达任一序列的端部。BLAST算法参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用默认字长(W)11、期望值(E)10、M=5、N=-4和两条链的比较。对于氨基酸序列,BLASTP程序使用默认字长3、期望值(E)10,并且BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad Sci.USA 89:10915(1989))比对(B)50,期望值(E)10,M=5,N=-4,以及两条链的比较。

有用算法的另一实例是PILEUP。PILEUP使用渐进的成对比对从一组相关序列创建多序列比对,以示出关系和序列同一性百分比。它还绘制了所谓的“树”或“树状图”,示出用于创建比对的聚类关系(参见例如图2)。PILEUP使用Feng&Doolittle,J Mol.Evol.35:351-360(1987)的渐进比对方法的简化。使用的方法类似于Higgins&Sharp,CABIOS 5:151-153(1989)描述的方法。该程序可以比对最多达300个序列,每个序列的最大长度为5,000个核苷酸或氨基酸。多重比对程序从两个最相似序列的成对比对开始,产生两个比对序列的簇。然后将该簇与下一个最相关的序列或比对序列簇进行比对。两个序列簇通过两个单独序列的成对比对的简单扩展来比对。最终比对是通过一系列渐进的成对比对来实现的。该程序通过为序列比较区域指定特定序列及其氨基酸或核苷酸坐标并通过指定程序参数来运行。使用PILEUP,将参考序列与其他测试序列进行比较,以使用以下参数确定序列同一性百分比关系:默认间隙权重(3.00)、默认间隙长度权重(0.10)和加权末端间隙。PILEUP可以从GCG序列分析软件包中获得,例如7.0版(Devereaux et al.,Nuc.Acids Res.12:387-395(1984),由基因编码的是通过相应开放阅读框的概念翻译得出的。

编码本发明的多肽的多核苷酸可以基于Myd的氨基酸序列化学合成或通过基因工程合成。例如,可以基于本发明的多肽或其前蛋白的氨基酸序列化学合成多核苷酸。核酸的合同合成服务(例如由Medical&Biological Laboratories Co.,Ltd.、Genscript等提供)可以用于多核苷酸的化学合成。此外,合成的多核苷酸可以通过PCR和克隆等方式进行扩增。

本发明的多肽可以例如通过表达编码本发明的Myd多肽的基因来产生。优选地,本发明的Myd多肽可以从其中引入了编码本发明的Myd多肽的多核苷酸的转化体产生。例如,在将编码本发明的Myd多肽的多核苷酸或包括它的载体引入宿主以获得获得转化体并且将转化体培养在合适的培养基中之后,从引入到转化体的编码本发明的Myd多肽的多核苷酸产生本发明的Myd多肽。可以通过从培养物中分离或纯化产生的Myd多肽来获得本发明的蛋白。

因此,本发明另外提供了编码本发明Myd多肽的多核苷酸和包括它的载体。本发明另外提供了制造转化体的方法,包括将编码本发明Myd多肽的多核苷酸或包括它的载体引入宿主。本发明另外提供了包括编码本发明Myd多肽的多核苷酸的转化体或从细胞外引入的包括多核苷酸的载体。本发明另外提供了制造本发明的Myd多肽的方法,包括培养转化体。

本发明还包括与异源调控元件可操作地连接的本发明的多核苷酸。本发明可以包括含有本发明的多核苷酸的表达盒或载体,以及用本发明的载体转化的宿主细胞。

替代地,通过根据利用已知诱变方法(诸如紫外线辐照和定点诱变)的程序将突变引入合成的多核苷酸,可以产生编码本发明的Myd多肽的多核苷酸。例如,编码本发明多肽的多核苷酸可以通过以下项获得:用已知方法在SEQ ID NO:1或SEQ ID NO:2的多核苷酸中引入突变,表达获得的多核苷酸,研究表达的蛋白的甜味修饰活性,选择编码具有所期望甜味修饰活性的蛋白的多核苷酸。

多核苷酸的定点诱变可以用任何方法,诸如例如反向PCR和退火(Muramatsu etal.edit.,"Revised 4th edition New genetic engineering handbook",YODOSHA,p.82-88)进行。可以根据需要使用用于定点诱变的各种各样的商购试剂盒,诸如来自Stratagene的QuickChange II定点诱变试剂盒和QuickChange Multi定点诱变试剂盒。

包括编码本发明多肽的多核苷酸的载体类型的实例包括但不限于通常用于基因克隆的载体,例如质粒、黏粒、噬菌体、病毒、YAC和BAC。载体的实例包括质粒(例如,DNA质粒),酵母(例如,酵母属(Saccharomyces))和病毒载体诸如痘病毒、逆转录病毒、腺病毒、腺相关病毒、疱疹病毒、脊髓灰质炎病毒、甲病毒、杆状病毒、辛德比斯病毒、植物病毒(例如甲型线形病毒科(Alphaflexiviridae)或马铃薯Y病毒科(Potyviridae))和昆虫病毒(例如杆状病毒科(Baculoviridae))。

在这些中,优选质粒载体,并且例如可以使用用于蛋白表达的商购质粒载体,例如pUC19、pUC118、pUC119、pBR322等(所有的这些均来自TAKARA BIO INC.)。

载体可以包括含有DNA的复制起始区域或复制起点的DNA区域。替代地,调控序列诸如用于启动基因转录的启动子区域、终止子区域或用于将表达的蛋白分泌到细胞外的分泌信号区域可以与载体中编码本发明蛋白的多核苷酸(即本发明的MYD基因)的上游可操作地连接。如本文所用,基因和调控序列被“可操作地连接”是指其中基因和调控区域被定位使得基因可以在调控区域的调控下表达的条件。

启动子区域、终止子和分泌信号区域等调控序列的类型没有具体限制,并且通常使用的启动子和分泌信号序列可以视情况选择使用,这取决于引入序列的宿主。例如,可掺入本发明载体的调控序列的优选实例包括源自里氏木霉(Trichoderma reesei)的cbh1启动子序列(Curr,Genet,1995,28(1):71-79)。

替代地,用于选择载体适合引入的宿主的标志物基因(例如,对药剂诸如氨苄青霉素(ampicillin)、新霉素(neomycin)、卡那霉素(kanamycin)和氯霉素(chloramphenicol)的抗性基因)可以另外掺入本发明的载体中。替代地,当使用营养缺陷型菌株作为宿主时,可以将编码所需营养物的合酶的基因作为标志物基因掺入载体中。替代地,当使用生长需要特定代谢的选择性培养基时,可以将代谢的相关基因作为标志物基因掺入载体中。这样的代谢相关基因的实例包括用于使用乙酰胺作为氮源的乙酰胺酶基因。

编码本发明的Myd多肽的多核苷酸与调控序列和标志物基因之间的连接可以通过本领域已知的方法,诸如SOE(重叠延伸拼接法)-PCR(Gene,1989,77:61-68)进行。用于将连接的片段引入载体的程序是本领域已知的。

引入载体的转化体的宿主的实例包括微生物诸如细菌和丝状真菌。细菌的实例包括大肠杆菌和属于葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、李斯特菌属(Listeria)和芽孢杆菌属(Bacillus)的细菌,其中优选大肠杆菌和芽孢杆菌属细菌(例如,枯草芽孢杆菌或其突变体)。枯草芽孢杆菌突变体的实例可以包括J.Biosci.Bioeng.,2007,104(2):135-143中描述的蛋白酶9双缺陷菌株KA8AX,以及Biotechnol.Lett.,2011,33(9):1847-1852中描述的蛋白酶8双缺陷菌株DBPA菌株,其改善了蛋白折叠效率。丝状真菌的实例包括木霉属(Trichoderma)、曲霉属(Aspergillus)和根霉属(Rhizopus)。此外,例如,毕赤酵母、酿酒酵母、多形汉逊酵母、解脂耶氏酵母、粟酒裂殖酵母、乳酸克鲁维酵母是合适的表达宿主。在又另一方面,本发明包括以下宿主细胞,该宿主细胞包括与在细胞中表达相容的控制元件可操作地连接的本文所述的表达盒的一个或多个。细胞可以是例如哺乳动物细胞(例如BHK、VERO、HT1080、293、RD、COS-7或CHO细胞)、昆虫细胞(例如Trichoplusiani(Tn5)或Sf9)、细菌细胞、植物细胞或酵母细胞。

来自编码Myd的表达盒的重组表达的多肽通常从裂解的细胞或培养基中分离。可以通过本领域已知的方法进行纯化,包括盐分级、离子交换色谱法、凝胶过滤、尺寸排阻色谱法、尺寸分级和亲和色谱法。可以使用基于例如Gag抗原生成的抗体来采用免疫亲和色谱法。

本发明提供了纯化具有甜味调节活性的多肽的方法,包括(a)获得包括该多肽的组合物,以及(b)经由疏水作用色谱法(HIC)随后通过尺寸排阻色谱法(SEC)来纯化该组合物。在一个方面,多肽包括与选自由以下组成的组的多肽具有至少80%序列同一性的氨基酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQIDNO:17。在另一方面,多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17;(a)其中,多肽包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQIDNO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,多肽不是SEQID NO:3的多肽,或(b)其中,多肽另外包括组氨酸标签,其中,多肽具有甜味调节活性。

本领域技术人员熟悉疏水作用色谱法(HIC)和尺寸排阻色谱法(SEC)的纯化技术,包括选择合适的柱、缓冲液和洗脱溶液。示例性的HIC和SEC纯化技术在本文的实施例11中有所描述。在示例性的方面,多肽在通过HIC和SEC纯化后的纯度为至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%,或其值的任何范围。

本发明还考虑了包括如本文所述的本发明的异源多核苷酸和/或异源多肽的转基因植物。由于异源核酸序列的表达,该植物具有改变的表型。改变的表型可以包括任何植物部分(包括果实)的甜度增加的表型。转基因植物可包含如本文定义的表达盒作为植物的一部分,该表达盒已通过用本发明的载体转化植物而引入。这样的表达盒包括用于在植物中表达异源编码序列的调控序列,包括植物可表达的启动子和终止子。转基因植物可以是可以表达本文所述的异源核酸序列的任何类型的植物。术语“植物”包括整株植物、植物器官(例如叶、茎、根等)、种子和植物细胞及其后代。可用于本发明方法的植物种类通常与适合转化技术的高等植物种类一样广泛,包括单子叶的(单子叶植物(monocots))植物和双子叶的植物(双子叶的植物(dicots))。其包括各种倍性水平的植物,包括多倍体、二倍体和单倍体。例如,转基因植物可以是苹果或草莓。

用于转化多种植物物种的技术在本领域中是众所周知的并且在技术和科学文献中有所描述。参见例如,Weising et al.(1988)Ann.Rev.Genet.,22:421-477and Joung etal.(2015)“Plant Transformation Methods and Applications,”in CurrentTechnology in Plant Molecular Breeding,(Koh et al.,eds)Springer DordrechtHeidelberg New York London,Chapter 9,pages297-344。本领域已知的用于转化植物细胞(包括植物原生质体或植物组织)的任何方法都可以用于植物转化。用于植物转化的特定方法尤其包括bolistic方法(基因枪)、电穿孔、微注射、原生质体融合和农杆菌属(Agrobacterium)介导的转化。农杆菌属介导的转化可以例如使用在大肠杆菌和根癌农杆菌(Agrobacterium tumefaciens)或其他农杆菌属(Agrobacterium)菌株中复制的双元载体。多种这样的双元载体在本领域中是已知的并且可以用于将异源多核苷酸引入植物细胞和植物组织中。包括用于在植物细胞和植物组织中表达异源编码序列的调控序列(包括植物可表达的启动子序列和其他植物调控序列)的植物表达载体是本领域已知的并且可以用于转化植物以表达本文所述的多肽。

多种植物可表达的启动子是本领域已知的并且可用于包含编码具有甜味调节活性的蛋白的多核苷酸的本文的异源构建体、载体和转化的植物材料。植物可表达的启动子可以来源于天然植物来源、植物病毒来源以及具有植物可表达的启动子的细菌,诸如农杆菌属菌株。植物可表达的启动子尤其包括花椰菜花叶病毒启动子(CaMV 35S)、章鱼碱和胭脂碱合酶启动子(例如nos启动子)、植物泛素启动子(Ubi)、水稻肌动蛋白启动子(Act-1)和玉米醇脱氢酶(Adh-1)。植物可表达的启动子包括组成型启动子、诱导型启动子、组织特异性启动子、发育阶段特异性启动子,并且每种类型的启动子的实例是本领域已知的。组织特异性启动子尤其包括在植物根、植物叶、果实、花、花粉或参与活性光合作用的细胞中直接表达的启动子(例如,磷酸烯醇丙酮酸启动子(PEP))。发育阶段特异性启动子包括那些在果实成熟、开花或结籽期间指导表达的启动子。合成植物启动子也是本领域已知的,并且可用于异源构建体、载体和转化的植物材料(参见,例如,Ali S.&Kim W-C(2019)Frontiers inPlant Science,10,article 1433)。

用于从转化的原生质体、植物细胞、愈伤组织或其他植物组织再生植物的技术在本领域是众所周知的,并且可以用于从这种转化的植物材料再生整个植物和植物部分。再生方法包括器官发生和胚胎发生。参见:Handbook of plant cell culture.Volume 1:Techniques for propagation and breeding(1983)Edited by D.A.Evans et al.,Macmillan(New York);R.H.Smith,Plant Tissue Culture:Techniques andExperiments,3

本领域常用的方法诸如原生质体方法和电穿孔可以用作将载体引入宿主的方法。可以通过使用指标诸如标志物基因的表达和/或营养缺陷型选择适当引入了载体的菌株来获得目标转化体。

替代地,可以将其中编码本发明的Myd多肽的多核苷酸、调控序列和标志物基因被连接的片段直接引入宿主的基因组中。例如,通过构建在连接片段两端添加有与宿主基因组互补的序列的DNA片段,将片段引入宿主,并且通过SOE-PCR诱导宿主基因组与DNA片段之间的同源重组,可以将编码本发明的Myd多肽的多核苷酸引入宿主的基因组中。

在合适的培养基中培养由此获得的其中引入了编码本发明的Myd多肽的多核苷酸或包括它的载体的转化体,导致载体上的MYD cDNA的表达,并且然后产生本发明的Myd多肽。用于培养这样的转化体的培养基可以由本领域技术人员适当地根据这种转化体的微生物类型来选择。

替代地,本发明的Myd多肽可以使用无细胞翻译系统从编码本发明的Myd多肽或其转录产物的多核苷酸表达。“无细胞翻译系统”是指通过将蛋白翻译所需试剂诸如氨基酸添加到以机械方式破坏宿主细胞得到的悬浮液中来构建的体外转录翻译系统或体外翻译系统。

在培养物或无细胞翻译系统中产生的本发明的Myd多肽可以通过使用用于纯化蛋白的一般方法来分离或纯化的,例如单独或适当组合的离心、硫酸铵沉淀、凝胶色谱法、离子交换色谱法、亲和色谱法等。此处,当编码本发明的Myd多肽的基因和分泌信号序列在转化体内的载体上可操作连接时,由于Myd多肽被分泌到细胞外部,产生的Myd多肽可以更容易地从培养物中收集。从培养物中收集的Myd多肽可以用已知的方法进一步纯化。

本发明还包括用于产生具有甜味调节活性的蛋白的方法,该方法包括在导致产生类似于已知的甜味调味剂或化合物的具有甜味调节活性的蛋白的条件下在培养基中培养本发明的宿主细胞。

如本文所用,“甜味调味剂”、“甜味化合物”或“甜味受体激活化合物”是指在受试者中引起可检测的甜味的组合物,例如蔗糖、果糖、葡萄糖和其他已知的天然基于糖的甜味剂,或如本文另外讨论的已知人工甜味剂诸如糖精、环己氨磺酸盐、阿斯巴甜等,或在体外激活T1R2/T1R3受体的物质。受试者可以是人或动物。

甜味调味剂或甜味组合物可以以有效量使用,其指当存在于用于经口施用的产品中时足以在受试者中诱导甜味的本发明的甜味组合物的量。

在实施方式中,速溶甜蛋白能够具有甜味调节活性。本发明的Myd多肽可以对味觉受体诸如甜味受体具有例如功能、物理和化学作用。“甜味调节活性”可以指使用体外和体内味觉转导测定法鉴定的本发明多肽的抑制、激活(例如激动剂或拮抗剂)特性。具有抑制活性的蛋白可以结合、部分或完全阻断刺激,减少、阻止、延迟激活,失活、脱敏或下调味觉转导,例如拮抗剂。激活多肽可以结合、刺激、增加、打开、激活、促进、增强激活、敏化或上调味觉转导,例如激动剂。活化多肽是优选的。

甜味调节还指当作为组合施用时增强用于经口施用的特定产品的味道,例如甜味。

甜味调节活性可以通过本领域已知的方法,例如体外方法,或通过动物或人感官测试进行体内方法来检测。虽然不希望受任何特定理论的束缚,但Myd参与甜味激活,例如,是味觉1受体成员2(T1R2)和/或味觉1受体成员3(T1R3)的激动剂。然而,Myd会刺激其他味觉受体,诸如苦味、鲜味、酸味和咸味。这样的功能效应可以通过本领域技术人员已知的任何方式测量,例如,经由光谱特征(例如,荧光、吸光度、折射率)、流体动力学(例如,形状)、色谱法的变化来测量与味觉受体T1R的结合,或溶解度特性、膜片钳、电压敏感染料、全细胞电流、放射性同位素流出、诱导标志物、T1R基因的转录激活;配体结合测定;电压、膜电位和电导变化;离子通量测定;细胞内第二信使诸如cAMP、cGMP和肌醇三磷酸(IP3)的变化;细胞内钙水平的变化;神经递质释放等。

感官测试(人或动物)也可用于确定Myd候选多肽是否具有甜味调节活性。感官评价是一门科学学科,其分析和测量人对食物和饮品组成的反应,例如外观、触感、气味、质地、温度和味道。使用人作为仪器的测量有时是必要的。确定甜味的合适方法的选择可以由本领域技术人员确定,并且包括例如辨别测试或差异测试,其被设计用于测量两种产品可感知不同的可能性。计算评价者的反应的正确性,并进行统计分析以查看是否有比仅因偶然性而预期的更正确的结果。

感官评价是一门科学学科,其分析和测量人对食物和饮品组成的反应,例如外观、触感、气味、质地、温度和味道。使用人作为仪器的测量有时是必要的。食品行业首先需要开发这种测量工具,因为风味和质地的感官特征是无法通过仪器容易测量的明显属性。确定本发明中公开的蛋白的感官品质(例如甜度)的合适方法的选择可以由本领域技术人员确定,并且包括例如辨别测试或差异测试,其被设计用于测量两种产品可感知不同的可能性。对于甜度感知,例如,例如5%蔗糖、6%蔗糖、7%蔗糖、8%蔗糖、9%蔗糖、10%蔗糖中的一种或多种的样品和测试样品可以由经培训的小组成员按照甜味强度从低甜到高甜的顺序排列。在本发明中,应当理解本领域的技术人员可以通过多种方式测量感官差异。

糖度测量(或白糖度标度)是食品和饮料行业中众所周知的应用,用于确定水中的纯蔗糖含量:1度糖度(°Bx)=1g蔗糖/100g溶液,并且以质量百分比表示溶液的强度。8°Bx相当于大约8%的糖溶液。如实例中所述,经培训的感官科学家以0.03mg/ml品尝对应于SEQID NO:21的纯化多肽(0.2mL等分试样),并且发现其具有的甜度相当于8°Bx(大约8%糖溶液)(参见实施例4、5、9和10)。

在一些实施方式中,本发明的Myd多肽包括至少与糖一样甜(以w/w为基础)(例如,1X),或者替代地,是糖2X、5X、10X、50X、100X、200X、400X、600X、800X、1000X、1500X、2000X、3000X、5000X、10,000X、20,000X甜或更甜的多肽,如通过上述任何方法或本领域已知的方法测量的。在其他实施方式中,Myd多肽的甜度为糖的至少1%(至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%,至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%)。

食品、饮料、补充剂、医药产品

在一种实施方式中,本发明包括组合物,该组合物包括以下项、基本上由以下组成或由以下项组成用于经口施用的产品和甜味组合物的组合,该甜味组合物包含括如本文所述的根据本发明的分离的Myd多肽。在一个方面中,与缺乏Myd多肽的用于经口施用产品(对照)相比,该组合具有增强的甜味。在一种实施方式中,用于经口施用的产品不是地菇状马蒂菌块菌。术语“基本上由……组成”允许包括对产品的功能或活性不是必需的并且不会实质性影响功能或活性的组分,诸如抗结块剂、填料、稳定剂(例如,热稳定剂)和填充剂(例如,麦芽糖葡萄糖、阿拉伯树胶等)。

在一种实施方式中,包括本发明的分离的Myd蛋白的组合物可以包括为分离的Myd蛋白提供增强的功能的制剂。例如,组合物可以包括稳定Myd蛋白以抵抗热、渗透、pH或其他类型的降解的制剂。在一种实施方式中,该制剂使Myd蛋白稳定以抵抗热降解。用于稳定Myd蛋白的示例性化合物包括,例如,L-精氨酸甘氨酸、L-脯氨酸、L-组氨酸、β-丙氨酸、L-丝氨酸、L-精氨酸乙酯二盐酸盐、L-精氨酰胺二盐酸盐、6-氨基己酸、gly-gly、gly-gly-gly、胰胨、甜菜碱一水合物、D-(+)-海藻糖二水合物、木糖醇、D-山梨糖醇、蔗糖、羟基四氢嘧啶(hydroxyectoine)、三甲胺n-氧化物二水合物、甲基-α-d-吡喃葡萄糖苷、三乙二醇、精胺四盐酸盐、亚精胺、5-氨基戊酸、戊二酸、己二酸、二盐酸乙二胺、盐酸胍、脲、N-甲基脲、N-乙基脲、N-甲基甲酰胺、亚牛磺酸、TCEP盐酸盐、GSH(还原型l-谷胱甘肽)、苯甲脒盐酸盐、乙二胺四乙酸二钠盐二水合物、氯化镁六水合物、氯化镉水合物、非洗涤剂硫代甜菜碱195(ndsb-195)、非洗涤剂硫代甜菜碱201(NDSB-201)、非洗涤剂硫代甜菜碱211(NDSB-211)、非洗涤剂硫代甜菜碱221(NDSB-221)、非洗涤剂硫代甜菜碱256(NDSB-256)、牛磺酸、乙酰胺、草酸二水合物、丙二酸钠pH 7.0、琥珀酸pH 7.0、tacsimate pH 7.0、四乙基溴化铵、醋酸胆碱、1-乙基-3-甲基咪唑醋酸盐、1-丁基-3-甲基咪唑氯化物、乙基硝酸铵、硫酸铵、氯化铵、水合硫酸镁、硫氰酸钾、氯化钆(III)六水合物、氯化铯、4-氨基丁酸(GABA)、硝酸锂、DL-苹果酸pH7.0、柠檬酸锂四水合物、醋酸铵、苯磺酸钠、对甲苯磺酸钠、氯化钠、氯化钾、一水磷酸二氢钠、十水硫酸钠、氯化锂、溴化钠、甘油、乙二醇、聚乙二醇200、聚乙二醇单甲醚550、聚乙二醇单甲醚750、甲酰胺、聚乙二醇400、季戊四醇乙氧基化物(15/4EO/OH)、1,2-丙二醇、聚乙二醇单甲醚1,900、聚乙二醇3,350、聚乙二醇8,000、聚乙烯吡咯烷酮k15、聚乙二醇20,000、(2-羟丙基)-β-环糊精、α-环糊精、β-环糊精、甲基-β-环糊精。

在一个方面,甜味组合物的Myd多肽可以包括与SEQ ID NO:3(或SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17)具有至少80%序列同一性的氨基酸序列。在另一方面,Myd多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17;(a)其中,多肽包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,多肽不是SEQID NO:3的多肽,或(b)其中,多肽另外包括组氨酸标签,其中,多肽具有甜味调节活性。例如,多肽包括SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74或SEQ ID NO:75的氨基酸序列,并且不由SEQ ID NO:3组成。在特定的方面,多肽包括以下的氨基酸序列:SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:38、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ ID NO:68。

本发明还包括用于调节用于经口施用产品的味道的方法,包括将用于经口施用产品与有效量的分离的Myd多肽组合,如本文所述。在一个方面中,与缺乏Myd多肽的用于经口施用产品(对照)相比,该组合具有增强的甜味。在一种实施方式中,用于经口施用的产品不是地菇状马蒂菌块菌。

在一个方面,甜味组合物的Myd多肽可以包括与SEQ ID NO:3(或SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17)具有至少80%序列同一性的氨基酸序列。在另一方面,Myd多肽具有与选自由以下组成的组的多肽序列具有至少80%序列同一性的多肽序列:SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17;(a)其中,多肽包含相对于选自由以下组成的组的多肽序列的至少一个置换修饰:SEQID NO:3、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17,其中,多肽不是SEQID NO:3的多肽,或(b)其中,多肽另外包括组氨酸标签,其中,多肽具有甜味调节活性。

用于经口施用的产品可以是食物、饮料、膳食补充剂组合物或药物组合物。

术语“用于经口施用的产品”可以指可食用产品,诸如食品、饮料产品;医药(药物)产品,或膳食补充剂产品诸如草药补充剂。如本文所用,术语“医药产品”包括固体和液体组合物两者,其为具有药用价值的可摄取无毒材料或包括药用活性剂诸如止咳糖浆、止咳滴剂、阿司匹林和可咀嚼药用片剂。口腔卫生产品也是用于经口施用的产品,并且包括固体和液体诸如牙膏或漱口水。

一般来说,本发明考虑食品或饮料产品可以包括有效量的本发明的分离的甜蛋白,例如,相对于食品或饮料产品的总重量,至多按重量计约99%的量,例如按重量计约0.01%至约99%的量。考虑了所有中间重量,相对于食品或饮料产品的总重量,按重量计(即0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、……90%、95%、99%),以及基于这些量的所有中间范围。

本发明的组合物可以包括“可食用、生物学上或医学上可接受的载体或赋形剂”,其可以包括用于制备所期望剂型的Myd多肽的固体或液体介质和/或组合物,以便以分散/稀释的形式施用Myd多肽,从而使Myd多肽的生物学效力最大化。可食用、生物学上或医学上可接受的载体包括许多常见的食物成分,诸如中性、酸性或碱性pH的水,果汁或蔬菜汁,醋、腌泡汁、啤酒、葡萄酒、天然水/脂肪乳剂诸如乳或炼乳,食用油和起酥油,脂肪酸,丙二醇的低分子量低聚物,脂肪酸的甘油酯,以及此类疏水物质在水性介质中的分散体或乳液,盐诸如氯化钠,小麦粉,溶剂诸如乙醇,固体可食用稀释剂诸如蔬菜粉末或粉状物质,或其他液体负载体、分散或悬浮助剂、表面活性剂、等渗剂;增稠剂或乳化剂、防腐剂、固体粘结剂、润滑剂等。

在本发明的上下文中可以考虑的食品或饮料产品包括烘焙物;甜烘焙产品(包括但不限于面包卷、蛋糕、馅饼、糕点和饼干);用于制备甜烘焙产品的预制甜烘焙混合物;馅饼填充料和其他甜填充料(包括但不限于水果馅饼填充料和坚果馅饼填充料,诸如山核桃馅饼填充料,以及用于饼干、蛋糕、糕点、糖果点心产品等的填充料,诸如脂肪基奶油填充料);甜点、明胶和布丁;冷冻甜点(包括但不限于冷冻乳制甜点,诸如冰淇淋——包括普通冰淇淋、软冰淇淋和所有其他类型的冰淇淋——以及冷冻非乳制甜点,诸如非乳制冰淇淋、果汁冰糕等);碳酸饮料(包括但不限于软碳酸饮料);非碳酸饮料(包括但不限于软非碳酸饮料,诸如调味水和基于甜茶或咖啡饮料);饮料浓缩物(包括但不限于液体浓缩物和糖浆以及非液体浓缩物,诸如冻干和/或粉末制剂);酸乳(包括但不限于全脂、低脂和脱脂酸乳,以及非乳制品和无乳糖酸乳以及所有这些酸乳的冷冻等同物);小吃(包括但不限于谷物、坚果、种子和/或水果棒);面包产品(包括但不限于发酵和未发酵面包、酵母和无酵母面包,诸如苏打面包、包括任何类型小麦粉的面包、包括任何类型非小麦粉(诸如马铃薯、水稻和黑麦粉)的面包、无麸质面包);用于制备面包产品的预制面包混合物;酱、糖浆和调味品;甜酱(包括但不限于果冻、果酱、黄油、坚果酱和其他可涂抹的饯、蜜饯等);糖果点心产品(包括但不限于果冻糖、软糖、硬糖、巧克力和口香糖);甜早餐谷物(包括但不限于挤压(kix型)早餐谷物、片状早餐谷物和膨化早餐谷物);用于制备甜早餐谷物的谷物涂层组合物。在本发明的上下文中也可以考虑这里未提及但通常包括一种或多种营养甜味剂的其他类型的食品和饮料产品。

由于本发明的食品或饮料产品中营养甜味剂的完全或部分替代,本发明的食品或饮料产品可用作低卡路里或减肥产品、医疗食物/产品(包括丸剂和片剂)和运动营养产品,并且可以特别适用于在给定可溶性固形物水平下需要较低甜度的食品或饮料产品。

在一些实施方式中,本发明的甜味组合物可以补充有其他营养或非营养甜味剂以形成甜味剂系统。甜味剂系统可以包括本发明的甜味组合物、填充剂诸如麦芽糖葡萄糖、阿拉伯树胶等,以及至少一种高强度甜味剂。该组合物可以作为液体组合物或干共混物提供。

在实施方式中,本发明包括用于增强用于经口施用的产品甜味的方法,包括添加本发明的Myd多肽。

在另一实施方式中,本发明的方法包括用于改善用于经口施用的产品的甜味的方法,该方法包括向用于经口施用的产品中添加通过本发明的方法制备的甜味组合物。添加的量可以通过本领域已知的方法来确定,例如,使用感官测试作为指导。

以下实施例另外说明本发明,但当然不应解释为以任何方式限制其范围。

实施例

实施例1

在其自然范围内使用适当的程序和许可原位获得新鲜的地菇状马蒂菌块菌。将新鲜样品(总共29个)运送到MycoTechnology,Inc.设施并在RO水中轻轻洗涤,然后在液氮中冷冻并储存在-80℃下。块菌的平均含水率为83.6%加或减4.6%。

如下进行块菌的水性提取。将八个不同的块菌样品放入液氮中研磨成粉末,然后加入5:1v/w块菌的4℃水,并在4℃下温育30分钟。然后对提取的材料进行低速短暂离心,并且滤液尝起来“纯净”。甜度强度在0(无甜味)和10(极甜)之间进行评分。对样品的甜度进行如下规定:

表1.各个块菌样品的甜度。

将水性提取物在4℃下在pH 7和pH 2下储存在磷酸钠缓冲液中,并且在8天的时间内观察到甜度几乎没有变化。

实施例2

从地菇状马蒂菌中纯化甜蛋白Myd。在其自然范围内使用适当的程序和许可原位获得新鲜的地菇状马蒂菌块菌,并储存在-80℃下。从冰箱中取出16.3g样品,并在液氮中用研钵和研杵(白色陶瓷)研磨。研磨进行15分钟以充分粉碎组织并获得精细的冷冻粉末。将粉末添加到50mL Falcon管中,并添加20mL RO-H

实施例3(RNA的鉴定)

样品采集

在其自然范围内使用适当的程序和许可原位获得新鲜的地菇状马蒂菌块菌。地菇状马蒂菌块菌(产孢组织)的野生分离株(BDP2_18)来自自然环境。BDP2_18是被找寻中的最大的野生块菌,并且该块菌具有“甜味前端、更多真菌和泥土味、低甜味持续”的甜度特征。

样品鉴定

将产孢组织的野生分离株冷冻运送到GeneWiz进行内部转录间隔区(ITS)测序。测序的基因组基因座是ITS 1和2区域。然后将生成的sanger测序读段比对并去除低质量碱基。然后对每个序列进行单独的基本局部比对搜索工具(BLAST)(Altschul,Gish,Miller,Myers,&Lipman,1990)搜索以验证身份。使用核苷酸集合(nr/nt)进行BLASTn搜索,排除未发表的样品序列。与野生分离株具有最高同一性百分比的条目是地菇状马蒂菌菌株rib02。

样品制备

将野生分离株BPD2_18用无菌水进行表面洗涤并切成重~100mg的立方体,并在液N

RNA测序

以下样品通过GeneWiz提交用于通过Illumina HiSeq,2x150 bp,单指标,每条泳道具有每条泳道~350M原始配对末端读段进行标准RNASeq。这项RNASeq研究涉及用于转录物组分析的polyA+选择。

GeneWiz按照制造商的说明使用Qiagen RNeasy Plus Universal小型试剂盒提取RNA。RNA文库制备是使用用于Illumina的NEBNext Ultra RNA文库制备试剂盒完成的。Illumina衔接子序列概述如下。

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’(SEQID NO:18)

5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC[i7barcode]ATCTCGTATGCCGTCTTCTGCTTG-3’(SEQ ID NO:19)

来自地菇状马蒂菌的两种菌株(每种三个重复)的RNA-seq研究的Fastq序列文件用HTStream修整并清洁以去除以下污染物:PhiX(来自测序的常见污染物)、rRNA读段、测序衔接子、低质量和“N”碱基、poly-a迹线、引物和读段<50bp。rnaSPAdes(Bushmanova E,Antipov D,Lapidus A,Prjibelski AD.rnaSPAdes:a de novo transcriptome assemblerand its application to RNA-Seq data.Gigascience.2019;8(9):giz100.doi:10.1093/gigascience/giz100)然后用于从清洁文件中对每个地菇状马蒂菌菌株进行转录物组的从头组装。将Bandage(a Bioinformatics Application for Navigating De novo AssemblyGraphs Easily)(Ryan R.Wick,Mark B.Schultz,Justin Zobel,Kathryn E.Holt,Bandage:interactive visualization of de novo genome assemblies,Bioinformatics,Volume 31,Issue 20,15October 2015,Pages 3350–3352)用于使用tBLASTn搜索(Gertz EM,Yu YK,Agarwala R,

鉴定出RNA转录物,其DNA拷贝具有如SEQ ID NO:1所示的序列,其中SEQ ID NO:2是基于起始密码子和终止密码子预测的编码序列。还提供了预测的蛋白SEQ ID NO:3,其具有121个氨基酸,估计大小为13.3kD。长度:122aa,分子量:13.381kDa,预测等电点:8.64,以及pH 7下预测电荷:1.01。

Blast分析。预测的蛋白SEQ ID NO:3与GENBANK中的其他蛋白序列之间的同一性为31%或更低。发现来自彩色豆马勃(Pisolithus tincturius)的假设蛋白(GenBank:KIN98154.1;SEQ ID NO:7)与SEQ ID NO:3具有大约31%的同源性;称为假设蛋白M404DRAFT_1005519[彩色豆马勃Marx 270]。推测SEQ ID NO:7也可能具有甜味调节活性。RNA转录物的完整cDNA拷贝是SEQ ID No:5,具有的编码序列如SEQ ID NO:6所示。

实施例4(大肠杆菌中mycodulcein的克隆和异源表达;甜味的确认。)

基于鉴定为SEQ ID NO:3的核苷酸序列,合成了表达包含组氨酸标签的SEQ IDNO:20的三种表达载体,并由Atum,Inc.(Newark,CA)克隆到三种不同的Atum载体骨架中:pD454-SR(质粒pMy_3000)、pD454-MR(质粒pMy_3001)和pD454-WR(质粒pMy_3002),所有这些都是大肠杆菌IPTG诱导型T7启动子表达载体,在质粒上具有氨苄青霉素-r、lacl、Lac01、Ori_pUC以及中(M)、强(S)和弱(W)核糖体结合位点。将大肠杆菌BL21 DE3(Studier et al.(1986)J.Mol.Biol.189:113-130)(New England Biolabs)使用制造商方案用pMy_3000、pMy_3001、pMy_3002转化。简而言之,将先前冷冻的感受态细胞解冻并与1pg-100ng质粒DNA混合,并在冰上放置30分钟。对该混合物施加42℃的热激45秒。然后立即将混合物置于冰浴中持续10分钟。添加950μL预热的LB培养基,并且然后在37℃下以225rpm振荡1小时。对每个转化反应进行1:10和1:100的细胞稀释,并在抗生素板上铺板100μL。在37℃下过夜生长使菌落完全恢复并变得可见。为确认成功转化,进行csPCR(菌落筛选PCR)以询问质粒的cDNA区域,并通过裂解物SDS-PAGE确认表达。摇瓶规模的诱导表达用于确认大肠杆菌宿主中的异源表达。该过程产生了分别包含质粒pMy_3000、pMy_3001和pMy_3002的菌株Z14CE、Z15CE、Z16CE。三种菌株(Z14CE、Z15CE、Z16CE)保持在LB+氨苄青霉素100μg/mL琼脂板上,而阴性对照(Eco_0001)保持在LB琼脂板上。在无挡板的250mL培养摇瓶中,在37℃下与适当的抗生素以150rpm振荡过夜,使每种菌株的过夜培养物在50mL LB液体培养基中生长。随后将每个过夜培养物接种到200mL的TB液体培养基中,并于次日接种到带挡板的1000mL培养摇瓶中,在37℃下以200rpm振荡,并用适当的抗生素调节至0.1OD600。一旦OD600达到0.8,就将IPTG补充剂添加到培养基中至最终浓度为0.66mM。在37℃下继续振荡额外的5小时。表达后,将细胞以4000g离心20min。弃去上清液,将沉淀物悬浮在~20mL的洗涤缓冲液(10mM磷酸钠缓冲液pH 7.0)中。在以最高2,000巴运行的高压匀浆器(C3 Emulsiflex,Avestin,Inc.,Ottawa,ON,加拿大)中破碎悬浮细胞。将破碎的细胞以13,000g离心(30min),收集上清液,并且弃去沉淀物。包含溶解蛋白的上清液通过0.22μm PES膜单元(Millipore,Burlington,MA,USA)过滤。运行SDS PAGE并观察到13.1kD条带(考马斯染色)以确认表达。

将Thermo Scientific

经培训的感官科学家以0.03mg/ml(0.2mL等分试样)品尝纯化级分(图3的泳道8中示出,包含高度纯化的SEQ ID NO:21),并且发现其具有的甜度相当于8°糖度(大约8%的糖溶液),证实从地菇状马蒂菌中分离出的mycodulcein是实施例1和2中观察到的甜味活性的原因。甜味是非常明显甜,具有“干净”的甜度(糖样味道),没有其他味道,起效稍延迟并且具有甜的余味。

实施例5(MYCODULCEIN(HIS-标签)的中试生产)

在实验室规模的生物反应器中测试实施例4中制备的包含编码序列SEQ ID NO:20的大肠杆菌菌株Z14CE在发酵期间的性能。生物反应器培养物在10.0L Bioflo 320圆底搅拌发酵罐(BioFlo/CelliGen 310,New Brunswick Scientific,Edison,NJ,USA)中进行。发酵罐装有pH和溶解氧传感器(Mettler Toledo,OH,USA)。经由填充水的不锈钢底座控制温度。搅拌由两个安装的六叶片Rushton涡轮提供,涡轮间隔47mm,最低叶轮定位在轴底部的正上方。曝气通过穿孔管分布器环发生。通过使用500至800rpm这件搅拌的连续级联和5至8L/min之间的曝气,并在高细胞密度下喷射空气,将溶解氧(DO)控制在空气饱和度的20%。使用5.0M氢氧化铵将pH控制在7.0。自动添加消泡剂204(Sigma,St Louis,MO,USA)以控制起泡。后者是使用安装在培养水平上方10cm处的电导率探头检测的。主要发酵培养基包含(每升)24g酵母膏、12g胰胨、5.42mL甘油、100mL磷酸盐缓冲储备液(0.17M KH

由经培训的感官科学家以0.03mg/ml品尝本实施例中制备的纯化上清液(0.2mL等分试样),并发现其甜度相当于8°糖度(大约8%糖溶液)。甜味是非常明显甜,具有“干净”的甜度(糖样味道),没有其他味道,起效稍延迟并且具有甜的余味。

上清液在-20℃下以等分试样储存并用于进一步的实验。

实施例6(来自大肠杆菌的Mycodulcein的ELISA定量)

开发了直接ELISA以使用SEQ ID NO:21的羧基末端上的6XHis-标签序列的辣根过氧化物酶(HRP)缀合抗体来定量带组氨酸标签的mycodulcein(SEQ ID NO:21)。ELISA能够测量复杂裂解物和纯化蛋白中的mycodulcein浓度。重组的带6XHis标签的大肠杆菌mycodulcein具有14.2kDa的分子量和27,960M

ELISA程序:将蛋白在50mM碳酸盐缓冲液pH 9.4包被缓冲液中在室温下结合到高蛋白结合96孔板的壁上30分钟。将板用具有0.02%吐温-20的磷酸盐缓冲盐水(PBS)pH 7.4洗涤3次。微孔板上的非特异性结合位点在室温下用在PBS pH 7.4中的5% BSA封闭15分钟,并用PBS 0.02%吐温-20洗涤3次。第一抗体在封闭缓冲液中稀释(1:1000),并将微孔板温育1小时,并在PBS 0.02%吐温-20中洗涤3次。比色底物3,3',5,5'-四甲基联苯胺(TMB)用于使HRP反应显色8分钟,并用2N硫酸终止。

实施例7(mycodulcein的浓度依赖性的定量表征)

Opertech Bio(Philadelphia,PA)对如实施例5中所述从大肠杆菌获得并如实施例4所述纯化的纯化的带his标签的mycodulcein(SEQ ID NO:21)的味道特性的浓度依赖性进行了定量表征。将mycodulcein的甜味效力和相对功效与蔗糖以及其他甜味剂奇异果甜蛋白、甜叶菊苷A和阿斯巴甜进行了比较。对照标准是以下项的溶液:200mM蔗糖、100mMNaCl、0.5mM奎宁和10mM柠檬酸。图4示出了mycodulcein、阿斯巴甜、奇异果甜蛋白、甜叶菊苷A对于甜味的浓度响应函数。数据以200m M蔗糖相关的(“甜”)目标上发生响应的比例(p)绘图。对于mycodulcein、阿斯巴甜、奇异果甜蛋白、甜叶菊苷A的曲线中的每个数据点计算为32次重复的平均值,并且对于蔗糖曲线,计算为16次重复的平均值;误差棒为SEM。水和蔗糖对照的点类似地分别计算为128次和64次重复的平均值。通过非线性回归拟合曲线。

由非线性回归推导引起半数最大甜味响应的浓度(EC50或效力)。mycodulcein(MYC)、蔗糖(SUC)、阿斯巴甜(ASP)、甜叶菊苷A(REB)和奇异果甜蛋白(THN)的EC50(和95%置信区间)见表2。还提供了基于摩尔和重量的与蔗糖的等效性。

表2.

奇异果甜蛋白、蔗糖和SEQ ID NO:21的评价是在使用指定分析物在水中的甜味感的CATA(单击所有适用项)时间强度在0.045mg/ml的蛋白和10%蔗糖下进行的。方法:时间强度技术;数据采集软件:EyeQuestion,每2.57秒记录一次响应;标度方法:15分甜标度,例如,得分5=5%蔗糖,得分10=10%蔗糖;评价方案:小体积啜饮、倾斜和吐出测试。有3-6名小组成员和2个重复。所有样品都采用盲法并随机提供3位代码。

培训策略:在15分甜度标度上进行为期6周的关于甜度标度的强化培训,以自信地分配甜度值。由于独特的甜度行为模式,有必要进行为期3周的培训时间强度原则。品尝样品,用秒表记录时间并帮助达成共识。#小组成员数目:3-6,#重复次数:2。所有样品都采用盲法并随机提供3位代码。统计分析:由于#小组成员数目少,无法进行统计分析。

在测试的量下,mycodulcein和奇异果甜蛋白的最大强度(Imax)在15分标量中示出比蔗糖高大约1分。奇异果甜蛋白和mycodulcein具有更平坦的斜率,表明更长的峰值时间和更渐进/更长的下降。蔗糖在162秒时接近阈值甜度(强度<1),比奇异果甜蛋白和mycodulcein更快。当蔗糖达到阈值水平时,奇异果甜蛋白和mycodulcein可在低-中强度下识别。Mycodulcein和奇异果甜蛋白在该实验中似乎具有相似的效力,其在重量基础上是蔗糖的3000x甜,或在摩尔基础上是蔗糖的约120,000x甜。从这两个实验中,mycodulcein被证明是一种高强度甜蛋白,其效力在重量基础上是蔗糖的400x甜至是蔗糖的3000x甜之间。

实施例8(mycodulcein变体的产生以及对于甜度和热稳定性的测试)

鉴定mycodulcein中的潜在关键残基的方法。尽管甜蛋白没有一级序列同一性,但总体三级结构具有甜指(finger)基序(Tancredi,T.,Pastore,A.,Salvadori,S.,Esposito,V.&Temussi,P.A.Interaction of sweet proteins with their receptor:Aconformational study of peptides corresponding to loops of brazzein,monellinand thaumatin.European Journal of Biochemistry 271,(2004):2231–2240.)。甜蛋白具有反平行的β折叠,以及垂直于β折叠的α螺旋。使用PyMOL 2.0(The PyMOL MolecularGraphics System,Version 2.0

具体而言,生成了以下单突变体,并且它们的预测位置在表3中。还参见图5B,其示出叠加在推定的二级结构基序上的SEQ ID NO:3预测二级结构的表示和每个基序内的表3点突变的位置。

克隆:使用制造商方案用23个质粒(pMy_3018至pMy_3040)对Eco_0001aka大肠杆菌BL21 DE3(E.coli str.B F

将板在37℃温育16小时。使用菌落筛选引物进行菌落筛选PCR以确认基因型,该引物设计用于询问侧翼区域连同质粒的cDNA区域。成功的转化会产生一定大小的DNA片段,而阴性对照和无模板对照则不会产生PCR条带。观察到所有突变体的成功转化。

摇瓶规模的诱导表达用于确认大肠杆菌宿主中的异源表达。

23种菌株(Z38CE至Z60CE)保持在LB+氨苄青霉素100μg/mL琼脂板上,而阴性对照(Eco_0001)保持在LB琼脂板上。在无挡板的250mL培养摇瓶中,在37℃下与适当的抗生素以150rpm振荡过夜,使每种菌株的过夜培养物在50mL LB液体培养基中生长。随后将每个过夜培养物接种到200mL的TB液体培养基中,并于次日接种到带挡板的1000mL培养摇瓶中,在37℃下以200rpm摇动,并用适当的抗生素调节至0.1OD

表3.mycodulcein的单点突变的甜度测试结果

使用200mL培养基额外重新表达16种变体(Z38CE、Z39CE、Z41CE、Z45CE、Z47CE、Z48CE、Z49CE、Z51CE、Z52CE、Z53CE、Z55CE、Z56CE、Z57CE、Z58CE、Z59CE、Z60CE),其全部具有甜味。表达后,细胞在24小时诱导时期后以4000g离心20min。弃去上清液,将沉淀物悬浮在~20mL洗涤缓冲液(10mM磷酸钠缓冲液pH 7.0)中。在以最高2,000巴运行的高压匀浆器(C3Emulsiflex,Avestin,Inc.,Ottawa,ON,加拿大)中破碎悬浮细胞。将破碎的细胞以13,000g离心(30min),收集上清液,并且弃去沉淀物。包含溶解蛋白的上清液通过0.22μm PES膜单元(Millipore,Burlington,MA,USA)过滤。随后如实施例4中所述通过IMAC纯化来分离材料。

由经培训的感官科学家品尝纯化的样品。将Mycodulcein储备液稀释至相等的蛋白浓度,如通过ELISA测量的。受试者遵循机构审查委员会批准的啜饮和吐出方案。将0.2ml的每种纯化突变体置于舌头上,并记录甜味感知强度、甜味感知起效时间和甜味感知持续时间。结果示出在图6中并在下文中讨论。

保守点突变对Mycodulcein甜度的影响

为了关联保守单点突变对甜度的影响,将公布的奇异果甜蛋白、巴西甜蛋白、应乐果甜蛋白和溶菌酶的突变与mycodulcein进行了比较。由于目标是将mycodulcein的时间和强度曲线与蔗糖相匹配,我们通过感官分析测量了蔗糖等效、起效和总持续时间。蔗糖具有快速起效、高强度和快持续时间。因此,降低起效和持续时间的突变与匹配或改善蔗糖等效性的突变一样是期望的。增加起效和总持续时间的突变与降低蔗糖等效性的突变一样是不期望的。参见图5B和6。

N-末端-外部-D3E

在外部N-末端处D3E的单突变的保守变化导致蔗糖等效和持续时间的损失;然而,起效仅略有降低。这些结果表明,甜蛋白N末端的电荷、大小和极性对于甜味和蛋白稳定性很重要。

β折叠1-外部-K11R

K11R处单突变的保守变化导致蔗糖等效性的小幅增加和起效的适度降低;然而,甜度的持续时间显著增加。这些结果表明,K11是与甜味受体T1R2/T1R3结合的重要残基,并且可能会影响mycodulcein从受体上的解离率。

β折叠2和3之间的区域-外部-K26R–接头区域

K26处的保守突变导致蔗糖等效略微减少,示出该保守突变对蛋白功能没有显著作用。

环2区域-外部-K51R

分子模型示出所有推定的环区域突变都是溶剂暴露的。除了起效的适度下降外,在感官研究中仅观察到蔗糖等效和总持续时间的小幅下降,示出这种保守突变对蛋白功能没有显著作用。

环2区域-外部-R57K

突变R57K对起效、蔗糖等效和总持续时间具有显著的抑制作用。

β折叠4-外部-R66K

突变体R66K具有显著降低的蔗糖等效和总持续时间,同时略微增加的起效。R66K突变可能是对于甜味受体的亲和力和解离率的关键残基。

环3区域-外部-D69E

D69E处的突变具有蔗糖等效性、持续时间的小幅减少和持续时间的小幅增加。预测在该区域中的该区对保守突变相对不敏感。

α-螺旋区域-外部-D85E和D86E

D85E和D86E二者对mycodulcein感官特性具有相似的作用。D85E和D86E的蔗糖等效性和持续时间降低。起效与对照相似。

C-末端-外部-D97E、K103R、R106K和E117D与对照相比具有最小的作用,表明这些区域对保守突变相对不敏感。然而,R110K和K120R示出甜度和持续时间减少,但起效相似。

如表3中示出,R20K、E35D、K44R、D46E、D52E、R75K和D94E处的保守单点突变导致蛋白表达的丧失。这些数据表明这些残基可能参与大肠杆菌宿主内的蛋白折叠或表达。本实施例上文讨论的预测三级结构模型支持由这些变化引起的蛋白错折叠,因为所有这些残基都包含在预测的β折叠中。

参考文献:

Korz,D.J.,Rinas,U.,Hellmuth,K.,Sanders,E.A.&Deckwer,W.-D.Simple fed-batch technique for high cell density cultivation of Escherichia coli.Journalof Biotechnology 39,59–65(1995).

Norsyahida,A.,Rahmah,N.&Ahmad,R.M.Y.Effects of feeding and inductionstrategy on the production of BmR1 antigen in recombinant E.coli.Letters inApplied Microbiology 49,544–550(2009)。

实施例9.

使用GloMelt

表4.突变体的热稳定性测试结果

实施例10(酿酒酵母中mycodulcein的克隆和异源表达;甜味的确认)

基于鉴定为SEQ ID NO:3的核苷酸序列,合成表达EQ ID NO:21(pMy_4003)(带his标签)和SEQ ID NO:3(pMy_4002)(天然)mycodulcein的两种表达载体,并且由Atum,Inc.(Newark,CA)克隆到包含URA3标志物和强组成型启动子GPD的Atum载体非分泌骨架pD1234中。转化程序涉及制备电转感受态细胞,并且然后通过电穿孔引入表达载体。简而言之,通过首先使细胞生长到对数早期和中期之间并多次洗涤以去除生长培养基中的盐来产生电转感受态细胞。混合1-5μg表达载体后,样品在Gene Pulser II电穿孔仪上进行以下设置(充电电压:1.5kV,电容:25μF,电阻:200Ω),立即添加1mL预热的30℃ YPD,并且将悬浮液在30℃下以200-250rpm振荡温育1-2h。将转化后突变体铺板并维持在SC-ura琼脂板上。该过程产生了分别包含质粒pMy_4002和pMy_4003的菌株Z19ES、Z20ES。进行csPCR(菌落筛选PCR)以查询质粒的cDNA区域。因此,成功的转化将产生303bp的DNA片段,而阴性对照和无模板对照将导致没有PCR条带,并确认表达。

将两种菌株(Z19ES、Z20ES)保持在SC-ura琼脂板上,而阴性对照保持在SC琼脂板上。在无挡板的250mL培养摇瓶中在37℃下以150rpm振荡过夜,使每种菌株的过夜培养物在50mL SC-ura/SC液体培养基中生长。将每个过夜培养物接种到在30℃下以200rpm振荡的带挡板的1000mL培养摇瓶中的200mL SC-ura/SC(O-RDL-R10_TB培养基)液体培养基中,并调整至0.02OD600。在30℃下继续振荡额外的48小时。然后,通过在4℃下以5000g离心5min来收集细胞。然后,用冷dH2O洗涤酿酒酵母细胞,并在4℃下以5000g再次离心5分钟。为了确认成功表达,使用液氮和研钵和研杵裂解细胞。将细胞沉淀物重悬于10mL冷dH

将Thermo Scientific

实施例11(从菌株Z19ES(酿酒酵母)中纯化天然mycodulcein)

评估了三种色谱技术用于纯化在酿酒酵母中表达的天然mycodulcein(SEQ IDNO:3)的有效性:阳离子交换(CIEX)、疏水相互作用(HIC)和尺寸排阻色谱法(SEC)。

阳离子交换评估。

通过等电聚焦确定天然mycodulcein的等电点为~9.5,表明阳离子交换柱可能成功纯化mycodulcein。将如实施例10中所述制备的澄清的细胞裂解物与2x起始缓冲液混合以获得在pH 7.0的50mM磷酸钠、1M硫酸铵中的细胞裂解物,并将其储存在4℃以备将来使用。纯化程序在

HIC评估。

细胞裂解物也使用HiScreen CaptoButyl柱(Cytiva,瑞典)进行疏水作用色谱法(HIC);使用5个柱体积的pH 7.0的50mM磷酸钠、1M硫酸铵进行平衡。然后将细胞裂解物以3mL/min的流速加载到柱中。使用pH 7.0的50mM磷酸钠,通过从1至0M的递减硫酸铵梯度进行结合蛋白的洗脱。通过SDS-PAGE分析所有获得的级分。

图7B示出了在SDS-PAGE上分析的从HiScreen Capto Butyl柱梯度洗脱期间收集的两个洗脱级分。泳道1示出不含mycodulcein的洗脱级分1,以及泳道2示出洗脱的mycodulcein。洗脱级分的纯度通过GelAnalyzer确定为~86%。

SEC评估。

然后使用尺寸排阻色谱法(SEC)HiPrep 26/60Sephacryl S-200HR柱(Cytiva,瑞典)进一步纯化包含天然mycodulcein的洗脱级分,并用pH 7.0的包含50mM磷酸钠和150mMNaCl的缓冲液洗脱。收集级分,并且然后使用3kDa截留分子量(MWCO)离心过滤器(Millipore-Sigma,德国)来浓缩并脱盐,并且然后通过SDS-PAGE进行分析。

总结:虽然天然mycodulcein成功地结合弱阳离子交换剂Capto MMC,但洗脱级分的相对低纯度使得CIEX成为不太有利的捕获/中间纯化步骤。另一方面,从HIC,CaptoButyl柱中获得了更高纯度的级分。根据SDS-PAGE分析,杂质似乎具有相对较高的分子量,这使得SEC成为获得高纯度天然mycodulcein的理想选择。

通过SDS-PAGE的GelAnalyzer,HIC/SEC后的纯度为大约98%。图7C示出了在HiPrep 26/60Sephacryl S-200上进行色谱后从HIC柱中洗脱的蛋白。泳道1示出纯化的带his标签的mycodulcein,以及泳道2示出纯化的天然mycodulcein。

由经培训的感官科学家以0.03mg/ml品尝从酿酒酵母纯化的纯化天然蛋白(0.2mL等分试样),并发现其具有的甜度相当于8°糖度(大约8%的糖溶液)。甜味是非常明显甜,具有“干净”的甜度(糖样味道),没有其他味道,起效稍延迟并且具有甜的余味。

实施例12(应用数据)

在酸乳基质中测试如实施例5中制备并如实施例5中所述纯化的带His标签的mycodulcein。酸乳基质具有以下配方(表5)

表5.

将蔗糖添加作为酸乳培养物的碳源并且至少部分地被培养物消耗。添加Mycodulcein至大约的甜度为8°至10°糖度的糖,在酸乳基质中的最终浓度为0.05mg/ml。由经培训的感官科学家进行味觉测试,并且发现酸乳具有的的甜度相当于8°糖度(大约8%的糖溶液)。甜味是非常明显甜,具有“干净”的甜度(糖样味道),没有其他味道,起效稍延迟并且具有甜的余味。

在全脂乳、基于非乳制豌豆的乳(水,93.75%,豌豆蛋白,4.2%,油菜籽油,1.7%,TIC Gum Blend Pro 181AG(阿拉伯胶+结冷胶)0.3%,向日葵卵磷脂0.05%)、冷咖啡和水(对照)中以最终浓度为0.04mg/m测试如实施例5中制备并如实施例5中所述纯化的带His标签的mycodulcein,预计提供8°至10°糖度的糖的甜度水平。通过味道测试证实,在所有样品中甜蛋白提供8°至10°糖度的甜味水平,并且所有样品具有的的甜度强度、起效和持续时间都与水对照相似。

本文引用的所有参考文献(包括出版物、专利申请和专利)通过援引并入本文,其程度就如每篇参考文献均单独且具体地指明通过援引并入并在本文中以其全文列出一样。

除非本文另有说明或与上下文明显矛盾,否则在描述本发明的上下文中(特别是在所附权利要求的上下文中)使用术语“一个/一种(a/an)”和“所述/该(the)”和“至少一个”以及类似的指示物应被解释为包括单数和复数。除非本文另有说明或与上下文明显矛盾,否则结合一个或多个项目的列表使用术语“至少一个”(例如,“A和B中的至少一个”)应被解释为意指从列出的项目中选择的一个项目(A或B)或所列项目中的两个或更多个的任意组合(A和B)。除非另有说明,否则术语“包括(comprising)”、“具有”、“包括(including)”和“包含(containing)”应解释为开放式术语(即,意思是“包括但不限于”)。术语“由……组成”被解释为封闭式术语(即,排除未列出的组分或步骤)。术语“基本上由……组成”允许包括对产品或方法的功能或活性不重要且不会对功能或活性产生实质性影响的组分或步骤。

除非本文另有说明,否则本文对值的范围的引用仅旨在用作单独指代落入该范围内的每个单独值的简略表达方式的方法,并且每个单独的值被并入说明书中,就如其是在本文中单独引用一样。除非本文另有说明或与上下文明显矛盾,否则本文描述的所有方法可以以任何合适的顺序进行。除非另有声明,否则本文提供的任何和所有实例或示例性语言(例如,“诸如”)的使用仅旨在更好地阐明本发明并且不对本发明的范围构成限制。说明书中的任何语言都不应被解释为指示任何未要求保护的元素对于本发明的实践是必不可少的。

本文描述了本发明的优选实施方式,包括发明人已知的用于实施本发明的最佳模式。在阅读前述描述后,那些优选实施方式的变化对于本领域的普通技术人员而言将变得显而易见。发明人期望熟练的技术人员适当地采用此类变化,并且发明人打算以不同于本文具体描述的方式实施本发明。因此,本发明包括适用法律允许的所附权利要求中所列主题的所有修改和等同物。此外,除非本文另有说明或与上下文明显矛盾,否则本发明包括上述要素的所有可能变体的任何组合。

序列表

<110> 麦可科技有限公司(MYCOTECHNOLOGY, INC.)

<120> 来自块菌的甜蛋白

<130> PPI22172415US

<150> US 63/044245

<151> 2020-06-25

<160> 75

<170> PatentIn version 3.5

<210> 1

<211> 1072

<212> DNA

<213> 地菇状马蒂菌(Mattirolomyces terfezioides)

<400> 1

caagtcttta agtgttgatc gagcagtaga aatattaatc gcccaattaa ttgctcttac 60

tctaggaaat gtagtactca agttggccct ctaagtccct gattcagtgt cactttttct 120

cctttgacag taggctagat tctagctctt gtgtccgttt cttaaaatcc tgatatggca 180

ccttagcgtc agagcagaat acctgttctc atacaccttg gctatgatcc gatatttaaa 240

tagagcaatc acccttctgg atatcttccc catagctccc attgacctca aacattttct 300

aatcccctat accagccata ttacttgtct aagcacttca cattcttcct cacaatacga 360

aacctcctaa aatgcctgat ctctcctcct tcattacgat taagaacaac tctaaccacg 420

tcttcactcg gacggcaatt tattctaagt atgccgctgt gcagtggagt cccgagccgc 480

aactctcaat ctctcccggc aaatgggatt tgtttatttt aaaggacatc ttgtctatcc 540

gtgggacttc gggatatgta caatatcggg ttggggatgg tcctggatgg gttagggtca 600

ccttttcttc tctagtcggg gccgatgaag tggcagagtg gagctcaggt gacctacctg 660

atggctttgt tctccaaaaa ccagttcgca ctgggtccag gcctttgcag gcaacgttcg 720

aggctacaaa acagtaaaga tcgatgatgc ctaatatgcc tccataacac tgacccgcgt 780

gcacatggcc gcatgaatga taagggggat atcgatgatg atgggattag ttattggaat 840

tttcacaatg gacgtcggct tggatttaca ataatcgttt catttgtatt caaatattcc 900

tatttccttg ggtttttgta tttatctcct tcatcacgcc ttctgaggcc gtgggaagat 960

gaatatgtaa tcaaaagaag ttaggatatg catcatgtac agaaagtgga ccgcaacccc 1020

ttcagcgaaa tgttataaag atgatatcta agacgccaaa gcacattctc ag 1072

<210> 2

<211> 366

<212> DNA

<213> 地菇状马蒂菌(Mattirolomyces terfezioides)

<400> 2

atgcctgatc tctcctcctt cattacgatt aagaacaact ctaaccacgt cttcactcgg 60

acggcaattt attctaagta tgccgctgtg cagtggagtc ccgagccgca actctcaatc 120

tctcccggca aatgggattt gtttatttta aaggacatct tgtctatccg tgggacttcg 180

ggatatgtac aatatcgggt tggggatggt cctggatggg ttagggtcac cttttcttct 240

ctagtcgggg ccgatgaagt ggcagagtgg agctcaggtg acctacctga tggctttgtt 300

ctccaaaaac cagttcgcac tgggtccagg cctttgcagg caacgttcga ggctacaaaa 360

cagtaa 366

<210> 3

<211> 121

<212> PRT

<213> 地菇状马蒂菌(Mattirolomyces terfezioides)

<400> 3

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 4

<211> 20

<212> PRT

<213> 地菇状马蒂菌(Mattirolomyces terfezioides)

<400> 4

Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His Val

1 5 10 15

Phe Thr Arg Thr

20

<210> 5

<211> 873

<212> DNA

<213> 彩色豆马勃(Pisolithus tincturius)

<400> 5

tcgtccgagc agataaacat cgacgggcag gatgtcattt ctactgaatg tctggaacgc 60

tgtccaggcc cgaggtacaa tcttcctatc aacgacgcag acgaggtaca atactgctgt 120

caatgctaca aaatcatgcc gggtcctgtg catggccgtc tgaggaggtt cttctggtag 180

aagtttaaaa ggtctctggg cgacgggtgt aacttgccaa tttcccctac atccgaacat 240

ggcagatgaa cagaaggaac tcgcaaccaa cgtagccgac catggtctta ctggccaact 300

tccctcatca aacgaaacca cggagggact cggagtcacg caagactgct cttgctacat 360

cacgctccac aatgggaccg accatgagct tgtgctcgtc tacgctcaag agaaacacgg 420

tgaatggaag acccgccctg cggaaaccgt gagccagaag agcaatatca agttttggct 480

caaagactta ttccttggtc ctggagcaga gggtatggtg aagtatcgaa tcggaagtac 540

cgagcacaag gtgcagatga acttcagctg tcctatgtct tctcccaact cggcgtcctg 600

gagtcaaggt gaacatgaga ttccaggcat ctggttgccc tgtccggaat acaataaatc 660

tgatgcgttg catgccgtgt ttgaagtaca acctgggaat taaggcgtcg gggcggggag 720

acgtactata ccccattgtc gatagcctct ggaagtgtca tcataatgac tgtttgtttt 780

gtcattgacc ggcgacttgt cattttgagt tcgtttccct tggcctgagg cgcacttacc 840

gggcatcgtc atagagctac tgcttaccac aaa 873

<210> 6

<211> 464

<212> DNA

<213> 彩色豆马勃(Pisolithus tincturius)

<400> 6

atggcagatg aacagaagga actcgcaacc aacgtagccg accatggtct tactggccaa 60

cttccctcat caaacgaaac cacggaggga ctcggagtca cgcaagactg ctcttgctac 120

atcacgctcc acaatgggac cgaccatgag cttgtgctcg tctacgctca agagaaacac 180

ggtgaatgga agacccgccc tgcggaaacc gtgagccaga agagcaatat caagttttgg 240

ctcaaagact tattccttgg tcctggagca gagggtatgg tgaagtatcg aatcggaagt 300

accgagcaca aggtgcagat gaacttcagc tgtcctatgt cttctcccaa ctcggcgtcc 360

tggagtcaag gtgaacatga gattccaggc atctggttgc cctgtccgga atacaataaa 420

tctgatgcgt tgcatgccgt gtttgaagta caacctggga atta 464

<210> 7

<211> 154

<212> PRT

<213> 彩色豆马勃(Pisolithus tincturius)

<400> 7

Met Ala Asp Glu Gln Lys Glu Leu Ala Thr Asn Val Ala Asp His Gly

1 5 10 15

Leu Thr Gly Gln Leu Pro Ser Ser Asn Glu Thr Thr Glu Gly Leu Gly

20 25 30

Val Thr Gln Asp Cys Ser Cys Tyr Ile Thr Leu His Asn Gly Thr Asp

35 40 45

His Glu Leu Val Leu Val Tyr Ala Gln Glu Lys His Gly Glu Trp Lys

50 55 60

Thr Arg Pro Ala Glu Thr Val Ser Gln Lys Ser Asn Ile Lys Phe Trp

65 70 75 80

Leu Lys Asp Leu Phe Leu Gly Pro Gly Ala Glu Gly Met Val Lys Tyr

85 90 95

Arg Ile Gly Ser Thr Glu His Lys Val Gln Met Asn Phe Ser Cys Pro

100 105 110

Met Ser Ser Pro Asn Ser Ala Ser Trp Ser Gln Gly Glu His Glu Ile

115 120 125

Pro Gly Ile Trp Leu Pro Cys Pro Glu Tyr Asn Lys Ser Asp Ala Leu

130 135 140

His Ala Val Phe Glu Val Gln Pro Gly Asn

145 150

<210> 8

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 8

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys His Asn Ser His His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Gln Glu Pro His Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Ala Ala Gln Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Trp His Gln Gln Val Thr Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 9

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 9

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Thr Asp His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Gln Pro Gln Leu Ser Ile Ser His Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly His Gly Pro Asp Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Trp His Glu His Val Pro Met Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 10

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 10

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Lys Pro Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Ser Glu Ser Gln Leu Ser Ile Pro Ser Gly Glu Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Val Gly Ser Cys Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Ser Val Gln Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 11

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 11

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn His Thr Asn Arg

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Thr Pro Glu Ser Leu Met Ser Ile Ser Pro Gly Thr Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Cys Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Gln Met Gly Thr Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 12

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 12

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asp Asn Ser Asn Gln

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Cys Pro Glu Leu Pro Arg Ser Ile Ser Leu Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Ala Leu Ala Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Leu Val Arg Asn Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 13

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 13

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys His Asn Ala His His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Gln Glu Gln Gln Leu Ser Ile Ala Pro Gly Thr Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Arg Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Gln Val Arg Lys Arg Ala Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 14

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 14

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn His Ser Asn Asn

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Pro Arg Gly Pro Leu Leu Ser Ile Ser Pro Arg Gln Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Arg Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Arg Val Gly Asn Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 15

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 15

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser His Gln Pro Arg Pro Ser Ile Trp Pro Asp Met Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Asp Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Arg Met Pro Asp Pro Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 16

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 16

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asp Asp Pro Asn Gln

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu His Gln Phe Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Cys Asp Cys Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Phe Gln Thr Pro Val Thr Thr Gly Pro Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 17

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的突变蛋白

<400> 17

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Lys Thr Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Thr Gln Gln Pro Gln Ile Ser Ile Thr Gln Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Asp Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Arg Lys Pro Leu Arg Met Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln

115 120

<210> 18

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成衔接子序列

<400> 18

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 19

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成衔接子序列

<220>

<221> misc_feature

<222> (34)..(34)

<223> i7 条形码的插入

<400> 19

gatcggaaga gcacacgtct gaactccagt cacnatctcg tatgccgtct tctgcttg 58

<210> 20

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 用于来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的蛋白的大肠杆菌(E. coli)表达的经修饰编码序列

<220>

<221> CDS

<222> (1)..(384)

<400> 20

atg ccg gat ttg agc tcg ttc att act att aag aat aac tct aac cat 48

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

gtt ttt acg cgt acc gca atc tat tcc aaa tat gcc gca gtc cag tgg 96

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

agc ccg gaa ccg cag ctg agc att agc cca ggt aaa tgg gac ctg ttc 144

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

atc ctg aaa gac atc ctg agc atc cgc ggt acg tcc ggc tac gtg cag 192

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

tac cgt gtc ggc gac ggt ccg ggc tgg gtg cgt gtt acc ttt agc agc 240

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

ctg gtg ggt gcg gac gaa gtt gct gag tgg agc agc ggt gat ctg ccg 288

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

gat ggc ttt gtt ctg caa aag cct gtc cgc acc ggt agc cgt ccg ctg 336

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

caa gcg acg ttc gag gcg acc aag caa cat cac cat cac cac cac taa 384

Gln Ala Thr Phe Glu Ala Thr Lys Gln His His His His His His

115 120 125

<210> 21

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 21

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln His His His His His His

115 120 125

<210> 22

<211> 366

<212> DNA

<213> 人工序列

<220>

<223> 用于来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的蛋白的酿酒酵母(Saccharomyces cerevisiae)表达的经修饰编码序列

<400> 22

atgcctgatt tatcaagttt tatcaccatt aaaaataact ctaaccatgt ttttactaga 60

acagccatct actcaaagta cgcagccgtc caatggtccc cagaacctca gttgtctata 120

tctccaggta aatgggatct tttcatctta aaagatattc taagtattag aggcacttct 180

ggttacgtac agtatcgtgt tggtgatgga cctggttggg ttagagtaac attcagctca 240

ttggttgggg ctgacgaagt ggctgagtgg tcctcaggtg acctcccaga tggcttcgtg 300

ctgcaaaagc cagtcagaac tggatctaga ccattgcaag cgacattcga agcaacaaag 360

caatga 366

<210> 23

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的包括His标签的经修饰蛋白的编码序列

<400> 23

atgccggaat tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 24

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 24

Met Pro Glu Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 25

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 25

atgccggatt tgagctcgtt cattactatt agaaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 26

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 26

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Arg Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 27

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 27

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgaaa 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 28

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 28

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Lys Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 29

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 29

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attcccgcta tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 30

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 30

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Arg Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 31

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 31

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggatccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 32

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 32

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Asp Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 33

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 33

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggtc gctgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 34

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 34

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Arg Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 35

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 35

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggaact gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 36

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 36

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Glu Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 37

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 37

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg cgcgacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 38

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 38

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Arg Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 39

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 39

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagaaatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 40

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 40

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Glu Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 41

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 41

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatcaa aggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 42

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 42

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Lys Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 43

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 43

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtacaaagt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 44

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 44

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Lys Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 45

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 45

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgagggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 46

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 46

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Glu Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 47

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 47

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgaaagttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 48

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 48

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Lys Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 49

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 49

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggaagaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 50

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 50

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Glu Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 51

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 51

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgatgt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 52

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 52

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Asp Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 53

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 53

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgattgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 54

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 54

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Asp Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 55

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 55

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg agctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 56

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 56

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Glu Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 57

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 57

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga aggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 58

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 58

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Glu Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 59

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 59

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaacgcc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 60

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 60

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Arg Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 61

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 61

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtcaaaac cggtagccgt ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 62

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 62

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Lys Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 63

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 63

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagcaaa ccgctgcaag cgacgttcga ggcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 64

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 64

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Lys Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 65

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 65

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga tgcgaccaag 360

caacatcacc accaccacca ctaa 384

<210> 66

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 66

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Asp Ala Thr Lys Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 67

<211> 384

<212> DNA

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)的具有His标签的经修饰蛋白的编码序列

<400> 67

atgccggatt tgagctcgtt cattactatt aagaataact ctaaccatgt ttttacgcgt 60

accgcaatct attccaaata tgccgcagtc cagtggagcc cggaaccgca gctgagcatt 120

agcccaggta aatgggacct gttcatcctg aaagacatcc tgagcatccg cggtacgtcc 180

ggctacgtgc agtaccgtgt cggcgacggt ccgggctggg tgcgtgttac ctttagcagc 240

ctggtgggtg cggacgaagt tgctgagtgg agcagcggtg atctgccgga tggctttgtt 300

ctgcaaaagc ctgtccgcac cggtagccgt ccgctgcaag cgacgttcga ggcgacccgc 360

caacatcacc accaccacca ctaa 384

<210> 68

<211> 127

<212> PRT

<213> 人工序列

<220>

<223> 来自地菇状马蒂菌(Mattirolomyces terfezioides)具有任选的His标签的经修饰蛋白

<220>

<221> misc_feature

<222> (122)..(127)

<223> 不存在或组氨酸

<400> 68

Met Pro Asp Leu Ser Ser Phe Ile Thr Ile Lys Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Lys Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Lys Asp Ile Leu Ser Ile Arg Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Arg Val Gly Asp Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Asp Glu Val Ala Glu Trp Ser Ser Gly Asp Leu Pro

85 90 95

Asp Gly Phe Val Leu Gln Lys Pro Val Arg Thr Gly Ser Arg Pro Leu

100 105 110

Gln Ala Thr Phe Glu Ala Thr Arg Gln Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

<210> 69

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 氨基酸接头

<220>

<221> REPEAT

<222> (1)..(5)

<223> 可以重复n次,其中n是任何整数

<400> 69

Gly Gly Gly Gly Ser

1 5

<210> 70

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 氨基酸接头

<220>

<221> REPEAT

<222> (1)..(5)

<223> 可以重复n次,其中n是任何整数

<400> 70

Glu Ala Ala Ala Lys

1 5

<210> 71

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 共有序列1

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (11)..(16)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (26)..(26)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (33)..(34)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (36)..(38)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (41)..(43)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (51)..(51)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (57)..(57)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (66)..(66)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (68)..(72)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (85)..(86)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (89)..(89)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (97)..(97)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (101)..(110)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa为任何氨基酸

<400> 71

Met Pro Xaa Leu Ser Ser Phe Ile Thr Ile Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Xaa Tyr Ala Ala Val Gln Trp

20 25 30

Xaa Xaa Glu Xaa Xaa Xaa Ser Ile Xaa Xaa Xaa Lys Trp Asp Leu Phe

35 40 45

Ile Leu Xaa Asp Ile Leu Ser Ile Xaa Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Xaa Val Xaa Xaa Xaa Xaa Xaa Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Xaa Xaa Val Ala Xaa Trp Ser Ser Gly Asp Leu Pro

85 90 95

Xaa Gly Phe Val Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Leu

100 105 110

Gln Ala Thr Phe Xaa Ala Thr Xaa Gln

115 120

<210> 72

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 共有序列2

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (11)..(16)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (26)..(26)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (33)..(33)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (37)..(38)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (41)..(41)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (43)..(43)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (51)..(51)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (57)..(57)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (66)..(66)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (68)..(70)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (72)..(72)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (85)..(86)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (89)..(89)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (97)..(97)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (101)..(103)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (105)..(110)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa为任何氨基酸

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa为任何氨基酸

<400> 72

Met Pro Xaa Leu Ser Ser Phe Ile Thr Ile Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Xaa Tyr Ala Ala Val Gln Trp

20 25 30

Xaa Pro Glu Pro Xaa Xaa Ser Ile Xaa Pro Xaa Lys Trp Asp Leu Phe

35 40 45

Ile Leu Xaa Asp Ile Leu Ser Ile Xaa Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Xaa Val Xaa Xaa Xaa Pro Xaa Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Xaa Xaa Val Ala Xaa Trp Ser Ser Gly Asp Leu Pro

85 90 95

Xaa Gly Phe Val Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Pro Leu

100 105 110

Gln Ala Thr Phe Xaa Ala Thr Xaa Gln

115 120

<210> 73

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 共有序列3

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (11)..(11)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (12)..(13)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (14)..(14)

<223> Xaa为Ser、Cys、Thr或Met

<220>

<221> misc_feature

<222> (15)..(15)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (16)..(16)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (26)..(26)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (33)..(33)

<223> Xaa为Ser、Cys、Thr或Met

<220>

<221> misc_feature

<222> (37)..(37)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (38)..(38)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (41)..(41)

<223> Xaa为Ser、Cys、Thr或Met

<220>

<221> misc_feature

<222> (43)..(43)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (51)..(51)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (57)..(57)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (66)..(66)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (68)..(68)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (69)..(69)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (70)..(70)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (72)..(72)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (85)..(86)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (89)..(89)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (97)..(97)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (101)..(101)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (102)..(102)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (103)..(103)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (105)..(105)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (106)..(106)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (107)..(107)

<223> Xaa为Ser、Cys、Thr或Met

<220>

<221> misc_feature

<222> (108)..(108)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (108)..(108)

<223> Xaa为Val、Gly、Ala、Leu或Ile

<220>

<221> misc_feature

<222> (109)..(109)

<223> Xaa为Ser、Cys、Thr或Met

<220>

<221> misc_feature

<222> (110)..(110)

<223> Xaa为Lys、Arg或His

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa为Asp、Glu、Asn或Gln

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa为Lys、Arg或His

<400> 73

Met Pro Xaa Leu Ser Ser Phe Ile Thr Ile Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Xaa Tyr Ala Ala Val Gln Trp

20 25 30

Xaa Pro Glu Pro Xaa Xaa Ser Ile Xaa Pro Xaa Lys Trp Asp Leu Phe

35 40 45

Ile Leu Xaa Asp Ile Leu Ser Ile Xaa Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Xaa Val Xaa Xaa Xaa Pro Xaa Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Xaa Xaa Val Ala Xaa Trp Ser Ser Gly Asp Leu Pro

85 90 95

Xaa Gly Phe Val Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Pro Leu

100 105 110

Gln Ala Thr Phe Xaa Ala Thr Xaa Gln

115 120

<210> 74

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 共有序列4

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (11)..(11)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (12)..(13)

<223> Xaa为Asn或Gln

<220>

<221> misc_feature

<222> (14)..(14)

<223> Xaa为Ser或Thr

<220>

<221> misc_feature

<222> (15)..(15)

<223> Xaa为Asn或Gln

<220>

<221> misc_feature

<222> (16)..(16)

<223> Xaa为Leu、Val或Ile

<220>

<221> misc_feature

<222> (26)..(26)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (33)..(33)

<223> Xaa为Ser或Thr

<220>

<221> misc_feature

<222> (37)..(37)

<223> Xaa为Asn或Gln

<220>

<221> misc_feature

<222> (38)..(38)

<223> Xaa为Leu、Val或Ile

<220>

<221> misc_feature

<222> (41)..(41)

<223> Xaa为Ser或Thr

<220>

<221> misc_feature

<222> (43)..(43)

<223> Xaa为Gly或Ala

<220>

<221> misc_feature

<222> (51)..(51)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (57)..(57)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (66)..(66)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (68)..(68)

<223> Xaa为Gly或Ala

<220>

<221> misc_feature

<222> (69)..(69)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (70)..(70)

<223> Xaa为Gly或Ala

<220>

<221> misc_feature

<222> (72)..(72)

<223> Xaa为Gly或Ala

<220>

<221> misc_feature

<222> (85)..(86)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (89)..(89)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (97)..(97)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (101)..(101)

<223> Xaa为Leu、Val或Ile

<220>

<221> misc_feature

<222> (102)..(102)

<223> Xaa为Asn或Gln

<220>

<221> misc_feature

<222> (103)..(103)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (105)..(105)

<223> Xaa为Leu、Val或Ile

<220>

<221> misc_feature

<222> (106)..(106)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (107)..(107)

<223> Xaa为Ser或Thr

<220>

<221> misc_feature

<222> (108)..(108)

<223> Xaa为Gly或Ala

<220>

<221> misc_feature

<222> (109)..(109)

<223> Xaa为Ser或Thr

<220>

<221> misc_feature

<222> (110)..(110)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa为Lys或Arg

<400> 74

Met Pro Xaa Leu Ser Ser Phe Ile Thr Ile Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Xaa Tyr Ala Ala Val Gln Trp

20 25 30

Xaa Pro Glu Pro Xaa Xaa Ser Ile Xaa Pro Xaa Lys Trp Asp Leu Phe

35 40 45

Ile Leu Xaa Asp Ile Leu Ser Ile Xaa Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Xaa Val Xaa Xaa Xaa Pro Xaa Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Xaa Xaa Val Ala Xaa Trp Ser Ser Gly Asp Leu Pro

85 90 95

Xaa Gly Phe Val Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Pro Leu

100 105 110

Gln Ala Thr Phe Xaa Ala Thr Xaa Gln

115 120

<210> 75

<211> 121

<212> PRT

<213> 人工序列

<220>

<223> 共有序列5

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (11)..(11)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (26)..(26)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (51)..(51)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (57)..(57)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (66)..(66)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (69)..(69)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (85)..(85)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (86)..(86)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (89)..(89)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (97)..(97)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (103)..(103)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (106)..(106)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (110)..(110)

<223> Xaa为Lys或Arg

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa为Asp或Glu

<220>

<221> misc_feature

<222> (120)..(120)

<223> Xaa为Lys或Arg

<400> 75

Met Pro Xaa Leu Ser Ser Phe Ile Thr Ile Xaa Asn Asn Ser Asn His

1 5 10 15

Val Phe Thr Arg Thr Ala Ile Tyr Ser Xaa Tyr Ala Ala Val Gln Trp

20 25 30

Ser Pro Glu Pro Gln Leu Ser Ile Ser Pro Gly Lys Trp Asp Leu Phe

35 40 45

Ile Leu Xaa Asp Ile Leu Ser Ile Xaa Gly Thr Ser Gly Tyr Val Gln

50 55 60

Tyr Xaa Val Gly Xaa Gly Pro Gly Trp Val Arg Val Thr Phe Ser Ser

65 70 75 80

Leu Val Gly Ala Xaa Xaa Val Ala Xaa Trp Ser Ser Gly Asp Leu Pro

85 90 95

Xaa Gly Phe Val Leu Gln Xaa Pro Val Xaa Thr Gly Ser Xaa Pro Leu

100 105 110

Gln Ala Thr Phe Xaa Ala Thr Xaa Gln

115 120

技术分类

06120115628467