掌桥专利:专业的专利平台
掌桥专利
首页

内质网靶向信号

文献发布时间:2023-06-19 09:41:38


内质网靶向信号

相关申请

本申请要求2018年1月31日提交的以色列专利申请第257269号的优先权的权益,其内容通过参考以其全部结合至本文中。

发明领域和背景

在其一些实施方案中,本发明涉及增强重组蛋白,并且更具体地讲(但非排他地)分泌型重组蛋白的表达的方法。

mRNA靶向和定位翻译为提供蛋白合成的时空控制的重要机制。将mRNA递送至特定的亚细胞区室在各种生物体和细胞类型的极性建立中起主要作用,并且已证明对于细胞的适当功能至关重要。有趣的是,mRNA的定位通常受嵌入在mRNA序列内的顺式作用元件(zipcode)的控制(Martin和Ephrussi, 2009; Buxbaum等人, 2014)。RNA结合蛋白(RBP)识别这种序列,并与“分子马达”共同起作用,以将mRNA引导至其目的地。

内质网(ER)为分泌型和膜蛋白(SMP;分泌蛋白质组)的合成位点。根据教条,编码SMP的mRNA (mSMP)通过经信号识别颗粒(SRP)途径进行的不同翻译依赖性机制递送至ER。根据该模型,蛋白翻译在细胞质中开始,并且当SMP转录物进行翻译时,存在于其多肽氨基末端的信号肽会从翻译核糖体的出口通道中出现,并被SRP识别。然后将SRP募集到ER膜上的其受体,并发生核糖体-mRNA-新生蛋白链复合体从细胞质到ER的易位。在那里,翻译核糖体与易位子相互作用以使得共翻译蛋白易位和mRNA锚定。因此,SRP模型将mSMP描述为在ER易位过程中没有积极作用的组件。

然而,多种证据表明,还有另外的途径可将mRNA递送至ER。首先,SRP途径的丧失不会导致酵母和哺乳动物细胞的致命性,也不会对膜蛋白合成以及细胞质和ER之间的整体mRNA分布具有显著影响。其次,对胞质溶胶多核糖体和ER结合的多核糖体之间编码可溶性和膜蛋白的mRNA分布的全基因组分析表明,两个部分中mRNA的组成存在显著重叠,并且表明在ER上广泛展现胞质溶胶蛋白编码mRNA。这意味着缺少编码信号序列的mRNA可定位于ER。与这些发现一致,信号序列的去除和翻译的抑制不破坏mSMP定位于ER (Pyhtila等人,2008; Chen等人, 2011; Kraut-Cohen等人, 2013)。第三,已知分泌蛋白质组蛋白的子集以SRP非依赖性途径定位于ER。这些蛋白被认为在胞质溶胶中翻译之后易位到ER中。在一项利用特异性摧毁ER结合的核糖体的技术的研究中(Jan等人, 2014),发现ER膜上编码SRP依赖性蛋白的mRNA的富集与编码SRP非依赖性蛋白的mRNA相比较没有显著差异。另外,在信号序列出现之前,核糖体的子集设法到达ER。对于这些观察结果的可能解释可能是,mRNA以SRP非依赖性机制在核糖体之前到达ER。如果直到信号肽出现才开始mRNA靶向ER,则膜结合的核糖体不应翻译信号肽上游的转录物部分。然而,情况并非如此,因为发现翻译膜结合的核糖体在整个转录物中均匀分布(Chartron等人, 2016)。这表明mRNA在翻译起始之前定位于ER。

尽管难以鉴定出在mRNA内将其引导至ER的清晰的顺式元件,但已经鉴定出mSMP的特定序列特征。例如,对编码信号序列的区域进行序列分析揭示,腺嘌呤的低使用而无法在该序列内产生A延伸(Palazzo等人, 2007)。另外,与编码胞质溶胶蛋白的mRNA相比较,编码膜蛋白的mRNA具有高度的尿嘧啶富集以及嘧啶使用(Wolfenden等人, 1979; Prilusky和Bibi, 2009; Kraut-Cohen和Gerst, 2010; Polyansky等人, 2013)。这些发现增加ER定位基序以更弥散的普遍的方式存在于mRNA分子的序列组成中的可能性。

发明概述

本发明的一个方面提供一种包含转录单位的分离的多核苷酸,其中所述转录单位包括:

(i) 编码目标分泌蛋白的核酸序列;

(ii) 如SEQ ID NO: 2所示的内质网(ER)靶向序列,所述ER靶向序列与所述目标分泌蛋白异源;

(iii) 启动子;和

(iv) 转录终止位点,其中编码目标蛋白的核酸序列和ER靶向序列位于启动子和转录终止位点之间;

其中当ER靶向序列包含在编码目标蛋白的核酸序列中时,该核酸序列已被密码子优化以包含ER靶向序列。

本发明的一个方面提供一种产生蛋白的方法,其包括根据本文所述的方法表达蛋白并分离蛋白,从而产生该蛋白。

本发明的一个方面提供从本文所述的多核苷酸转录的RNA。

本发明的一个方面提供包含本文所述的分离的多核苷酸的细胞。

本发明的一个方面提供一种表达构建体,其包含本文所述的多核苷酸。

本发明的一个方面提供一种表达构建体,其包含如SEQ ID NO: 2中所示的核酸序列和克隆位点,其中选择克隆位点的位置,使得在将编码目标蛋白的序列插入到克隆位点中后,在细胞中表达后,转录编码目标蛋白并进一步包含所述核酸序列的转录产物的mRNA,其中SEQ ID NO: 2不包含在编码蛋白的序列中。

本发明的一个方面提供一种在细胞中表达蛋白的方法,方法包括将本文所述的分离的多核苷酸引入到细胞中,从而表达蛋白。

根据一个实施方案,ER靶向序列不包含编码目标分泌蛋白的核苷酸。

根据本发明的实施方案,ER靶向序列不包含编码如SEQ ID NO: 5中所示的序列的核苷酸。

根据本发明的实施方案,ER靶向序列不包含如SEQ ID NO: 6中所示的序列。

根据本发明的实施方案,ER靶向序列不包含序列TG的超过5个连续重复。

根据本发明的实施方案,ER靶向序列包含序列NNY的至少15个连续重复,其中N为任何碱基和Y为嘧啶。

根据本发明的实施方案,ER靶向序列不包含超过10个连续的胸腺嘧啶。

根据本发明的实施方案,ER靶向序列位于编码目标蛋白的核酸序列的3’。

根据本发明的实施方案,ER靶向序列核酸序列位于编码目标蛋白的核酸序列的5’。

根据本发明的实施方案,转录单位进一步编码信号肽序列。

根据本发明的实施方案,信号肽序列与目标蛋白异源。

根据本发明的实施方案,目标蛋白为人类蛋白。

根据本发明的实施方案,目标蛋白选自抗体、胰岛素、干扰素、生长激素、促红细胞生成素、生长激素、促卵泡激素、因子VIII、低密度脂蛋白受体(LDLR)α半乳糖苷酶A和葡糖脑苷脂酶。

根据本发明的实施方案,细胞属于选自细菌物种、真菌物种、植物物种、昆虫物种和哺乳动物物种的物种。

根据本发明的实施方案,细菌物种的细胞包括大肠杆菌(

根据本发明的实施方案,哺乳动物物种的细胞包括中国仓鼠卵巢(CHO)细胞。

根据本发明的实施方案,真菌物种的细胞包括酿酒酵母(

根据本发明的实施方案,表达构建体进一步包含适合于在细胞中表达目标蛋白的启动子。

根据本发明的实施方案,细胞属于选自细菌物种、真菌物种、植物物种、昆虫物种和哺乳动物物种的物种。

根据本发明的实施方案,细菌物种的细胞包括大肠杆菌细胞。

根据本发明的实施方案,哺乳动物物种的细胞包括中国仓鼠卵巢(CHO)细胞。

根据本发明的实施方案,真菌物种的细胞包括酿酒酵母细胞。

除非另外定义,否则本文使用的所有技术和/或科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些类似或等同的方法和材料可用于本发明实施方案的实践或测试中,但是以下描述示例性的方法和/或材料。在有冲突的情况下,以专利说明书(包括定义)为准。另外,材料、方法和实施例仅为说明性的,并且不旨在一定是限制性的。

附图的几个视图的简述

本文仅通过实例并参考附图描述本发明的一些实施方案。现具体地详细参考附图,要强调的是,所示的细节是作为实例并且出于对本发明实施方案的说明性讨论的目的。在这方面,结合附图进行的描述使得本领域技术人员显而易见的是可如何实践本发明的实施方案。

在附图中:

图1A-C. 确定NNY重复数以用作SECReTE的阈值。(A) SECReTE数与转录物长度之间的相关性。通过根据所示阈值并在所有三个框中对转录物序列中存在的连续NNY重复数进行计数,计算每个酵母基因的总SECReTE得分(得分为5904)。散点图表示SECReTE得分和基因长度之间的相关性。SECReTE得分与超过10个NNY重复的阈值(SECReTE10)的基因长度无关。R得分代表皮尔逊相关系数。(B) SECReTE基序在编码分泌蛋白质组蛋白的mRNA比编码非分泌蛋白质组蛋白的mRNA中更丰富。根据所示阈值,对编码分泌蛋白质组(蓝色)和非分泌蛋白质组(灰色)蛋白的mRNA中的SECReTE的存在进行评分。条形表示所示阈值下SECReTE阳性转录物的分数。分泌蛋白质组mRNA中的SECReTE丰度明显更高。*

图2A-C. mSMP中的SECReTE丰度为跨膜结构域(TMD)非依赖性的。(A) SECReTE在密码子的第二位置丰富。分别计算每个密码子位置的SECReTE丰度。在第二密码子位置中,mSMP中的SECReTE丰度最显著,但在第三位置中也检测到显著差异,*

图3A-D. 细胞壁蛋白高度富含SECReTE。(A) 对含有SECReTE10的基因进行的GO注释分析。编码细胞壁蛋白以及膜蛋白的基因显示最高和最显著的富集得分。(B) 对含有SECReTE15的基因进行的GO注释分析。编码细胞壁蛋白的基因最富含SECReTE。(C) 基因的不同组中的SECReTE10丰度。超过90%编码注释为定位于细胞壁的蛋白的mRNA含有SECReTE。除尾锚定性(TA)蛋白之外,其他分泌蛋白质组中也注意到了高SECReTE丰度。线粒体mRNA(Mito)具有低SECReTE丰度。条形上方的数字代表每组中的基因数。(D) 细胞壁转录物的MEME分析。使用MEME揭示了在细胞壁转录物中类似于SECReTE的基序。x轴上的数字表示碱基数。

图4A-E. 在人类基因组中发现SECReTE。(A) SECReTE10最大化对人类分泌蛋白质组基因进行分类的能力。针对每个所示阈值绘制ROC曲线。分泌蛋白质组基因用作真阳性集和非分泌蛋白质组基因用作真阴性集。SECReTE10的AUC (曲线下面积)最高。B. SECReTE在人类分泌蛋白质组蛋白的mRNA中高度丰富。分别计算每个密码子位置的SECReTE10丰度。人类mSMP中的SECReTE丰度在密码子的第二位置最显著,但在第三位置也检测到高度显著的差异。*

图5A-F. 内源性和外源性蛋白的分泌水平受SECReTE强度的影响。(A) SECReTE增强在蔗糖上生长的能力。通过跌落测试(drop-test)检查WT、suc2△、SUC2(+)SECReTE和SUC2(-)SECReTE酵母在蔗糖上生长的能力。将细胞在含有葡萄糖的YPD培养基上生长至对数中期,之后连续稀释并铺板到含有蔗糖的合成培养基或YPD上。使细胞在照相记录之前生长2天。SUC2(-)SECReTE突变体与WT细胞相比表现出生长减少,而SUC2(+)SECReTE细胞表现出生长更好。suc2Δ细胞无法在含有蔗糖的培养基上生长。(B) SECReTE增强转化酶的分泌。将来自A的所示菌株进行转化酶分泌测定。内部和分泌型转化酶活性两者均以葡萄糖去抑制之后的单位进行测量。两者活性在SUC2(-)SECReTE细胞中均降低,而在SUC2(+)SECReTE细胞中升高。误差棒代表来自3次实验重复的标准偏差。*

图6A-B. SECReTE增强SUC2 mRNA定位至ER。(A) 使用smFISH可视化内源性表达的SUC2(+)SECReTE和SUC2(-)SECReTE mRNA。从质粒内源性表达WT SUC2、SUC2(+)SECReTE或SUC2(-)SECReTE和Sec63-GFP的酵母在含有2%葡萄糖的SC培养基上生长至对数中期,之后将细胞转移至含有低葡萄糖的培养基(0.05%葡萄糖)以诱导SUC2表达。使用与SUC2互补的非重叠、TAMRA标记的FISH探针对细胞进行smFISH标记处理。B. SUC2(+)SECReTE和SUC2(-)SECReTE mRNA定位于ER的量化。对每个细胞中共定位于、未共定位于或相邻于Sec63-GFP标记的ER的颗粒的百分比进行评分。直方图显示每个菌株至少~60个细胞和~250个SUC2颗粒的平均得分,*

图7A-B. 潜在SECReTE结合蛋白的鉴定。(A) 在RNA结合蛋白摧毁研究中含有SECReTE10的转录物的鉴定。显示来自结合至所示RBP的总mRNA中含有SECReTE10的mRNA的数目和分数。用于生成直方图的微阵列分析数据发表于(Colomina等人, 2008; Hasegawa等人, 2008; Hogan等人, 2008)中。(B) 潜在SECReTE结合配偶体的鉴定。将WT细胞和缺失编码所示RBP (例如Whi3和Khd1)的基因的WT或HSP150(+)SECReTE细胞在30℃下于YPD上生长至对数中期,之后连续稀释并铺板到固体YPD培养基或含有CFW的YPD上。使酵母在照相记录之前生长2天。

图8. SECReTE在蛋白分泌中起积极作用。含有SECReTE的转录物(1)结合SBP (2)和诱导mRNA靶向ER (3)和/或赋予mRNA稳定作用(4)。靶向ER可提供空间调控和mRNA稳定作用(5),从而导致蛋白产生(6)和分泌(7)的随后增加。

图9A-D. SECReTE的丰度不依赖于密码子组成。进行排列分析以评估SECReTE对密码子使用的依赖性。为此,保持密码子组成并将序列随机改组1000次。计算每个基因的Z得分,以评价SECReTE10随机出现的可能性(对于Z得分的计算,请参见材料和方法)。Z得分越高,SECReTE随机出现的可能性越小。(A) 分泌蛋白质组编码mRNA中的SECReTE富集与密码子组成无关。Z得分的分布图显示,编码分泌蛋白质组蛋白的mRNA的值高于非分泌蛋白质组蛋白。(B) 在编码可溶性和膜型分泌蛋白质组转录物两者的mRNA中的SECReTE富集与密码子组成无关。Z得分的分布图显示,编码分泌蛋白质组蛋白的mRNA (mSMP;有或没有TMD)的值高于非分泌蛋白质组蛋白(即有或没有TMD)。(C) 密码子第二和第三位置的SECReTE富集与密码子使用无关。编码分泌蛋白质组蛋白的mRNA的显著Z得分(即≥1.96)的分数大于非分泌蛋白质组蛋白。(D) 密码子的第二和第三位置的SECReTE富集与密码子使用和TMD存在两者无关。在有或没有TMD的情况下,编码分泌蛋白质组蛋白的mRNA的显著Z得分(即≥1.96)的分数大于非分泌蛋白质组蛋白。

图10A-C. SUC2、HSP150和CCW12中SECReTE和SECReTE突变的图解说明。图表比较在天然和突变SECReTE基因中使用(下部示意图)或未使用(上部示意图) 10个连续NNY重复的阈值的情况下沿着基因长度发现的NNY重复数。(A)

图11A-C. SECReTE中的突变不一定会影响mRNA水平。通过qRT-PCR量化所示菌株中天然或突变SUC2、CCW12和HSP150的mRNA水平。计算相对于WT水平的倍数变化。(A) SUC2mRNA水平由于SECReTE突变而改变。使细胞在30℃下于含有2%葡萄糖的SC培养基上生长至对数中期,之后将细胞转移至低葡萄糖培养基保持1.5小时。收获并提取RNA之后,引物用于扩增编码分泌蛋白的SUC2的长转录物。肌动蛋白的引物用于标准化。SUC2(-)SECReTE细胞显示出比WT低的SUC2 mRNA水平,而SUC2(+)SECReTE细胞产生的水平更高。误差棒代表3次生物学重复的标准偏差。(B) CCW12 mRNA的水平不会由于SECReTE突变而改变。使细胞在30℃下于YPD培养基上生长至对数中期,之后收获并提取RNA。用于扩增UBC6的引物用于标准化。CCW12 mRNA水平并没有由于SECReTE改变而明显变化。(C) HSP150 mRNA水平不会由于SECReTE突变而改变。使酵母菌株在26℃或37℃下于YPD培养基上生长至对数中期,之后收获并提取RNA。UBC6用于标准化。HSP150 mRNA水平并没有由于SECReTE改变而明显变化。

图12A-B. 潜在SECReTE结合蛋白的鉴定。将WT细胞和缺失编码所示RBP [例如Puf2、She2 (A)和Puf1(B)]的基因的WT或HSP150(+)SECReTE细胞在30℃下于YPD上生长至对数中期,之后连续稀释并铺板到固体YPD培养基或含有CFW的YPD上。使酵母在照相记录之前生长2天。

图13为可用于表达GFP的示例性序列 - (SEQ ID NO: 4)。

本发明具体实施方案的描述

在其一些实施方案中,本发明涉及增强重组蛋白,并且更具体地讲(但非排他地)分泌型重组蛋白的表达的方法。

在详细解释本发明的至少一个实施方案之前,应当理解,本发明并不一定将其应用限于以下描述中阐述的或由实施例举例说明的细节。本发明能够具有其他实施方案,或者能够以各种方式实践或实施。

将蛋白分选到其正确目的地对于细胞组织和正常功能至关重要。尽管蛋白定位的信息可存在于蛋白序列(例如蛋白靶向序列)内,但mRNA的空间定位对于正确的蛋白细胞内靶向也可为重要的。

本发明人现已鉴定出表征所有分泌型和膜蛋白(SMP)的特征,并且发现由>10个连续NNY重复组成的重复基序。该基序本文称为“SECReTE”,不限于编码含有跨膜结构域(TMD)的蛋白的转录物,而是可在从原核生物(例如枯草芽孢杆菌)到酵母(酿酒酵母和粟酒裂殖酵母(

通过改变SECReTE在编码SMP的以下3种mRNA中的富集来探索其生理相关性:SUC2、HSP150和CCW12 (图5)。尽管氨基酸序列不会由于突变而改变,但这些基因的功能却会改变。与WT细胞相比较,SUC2 SECReTE突变体在含有蔗糖的培养基上呈现出改变的生长速率,即当基序强度降低时生长减少,而当基序强度升高时则生长更好(图5A)。该结果分别对应于转化酶合成和分泌两者的减少或增加(图5A、B)。HSP150 SECReTE突变体的行为表现也不同,即与WT细胞相比较,HSP150(-)SECReTE细胞对CFW呈现出更高的敏感性,而HSP150(+)SECReTE细胞具有更高的抗性(图5C)。类似地,CCW12(-)SECReTE细胞对HB呈现出超敏性(图5E)。

这些发现加强SECReTE在调控从细胞分泌的蛋白量中起重要生物学作用的观点。使用外源性底物SS(GAS1)-GFP对此进行验证,添加含有SECReTE基序的Gas1 3’UTR后,其分泌显著增强(图5F)。此外,加强SECReTE不仅增加蛋白的产生和分泌,其还增强SUC2转录物定位于ER (图6)。

因此,本教导提示该基序可用于改善重组蛋白的产生。

因此,本发明的第一方面提供一种包含转录单位的分离的多核苷酸,其中转录单位包含:

(i) 编码目标分泌蛋白的核酸序列;

(ii) 如SEQ ID NO: 2中所示的内质网(ER)靶向序列,所述ER靶向序列与所述目标分泌蛋白异源;

(iii) 启动子;和

(iv) 转录终止位点,其中编码目标蛋白的所述核酸序列和所述ER靶向序列位于所述启动子和所述转录终止位点之间;

其中当所述ER靶向序列包含在编码所述目标蛋白的所述核酸序列中时,所述核酸序列已被密码子优化以包含所述ER靶向序列。

短语“分离的多核苷酸”是指以分离的DNA分子(即包含脱氧核糖核苷酸)的形式提供的单链或双链核酸序列。

术语“转录单位”是指编码单个RNA分子的DNA序列及其转录必需的序列。一般地,转录单位含有启动子、编码目标蛋白的序列和终止子。

这些元件中的每一个将在下文单独描述。

编码目标蛋白的核酸序列:

目标蛋白一般地为分泌蛋白。在一个实施方案中,蛋白为人类蛋白,尽管本发明也考虑来自其他物种的蛋白。

可通过采用主题组合物和方法产生的目标示例性蛋白包括(但不限于)某些天然和重组人类激素(例如胰岛素、生长激素、胰岛素样生长因子1、促卵泡激素和绒毛膜促性腺激素)、造血蛋白(例如促红细胞生成素、C-CSF、GM-CSF和IL-11)、血栓形成和止血蛋白(例如组织纤溶酶原激活剂和活化蛋白C)、免疫蛋白(例如白细胞介素)、抗体和其他酶(例如脱氧核糖核酸酶I)。可通过主题组合物和方法产生的示例性疫苗包括(但不限于)针对各种流感病毒(例如甲、乙和丙型以及每种类型的各种血清型,比如甲型流感病毒的H5N2、H1N1、H3N2)、HIV、肝炎病毒(例如甲、乙、丙或丁型肝炎)、莱姆病和人类乳头瘤病毒(HPV)的疫苗。异源产生的蛋白诊断剂的实例包括(但不限于)促胰液素、甲状腺刺激激素(TSH)、HIV抗原和丙型肝炎抗原。

其他示例性的目标蛋白可包括(但不限于)细胞因子、趋化因子、淋巴因子、配体、受体、激素、酶、抗体和抗体片段以及生长因子。受体的非限制性实例包括I型TNF受体、II型IL-1受体、IL-1受体拮抗剂、IL-4受体以及任何化学或遗传修饰的可溶性受体。酶的实例包括乙酰胆碱酯酶、乳糖酶、活化蛋白C、因子VII、胶原酶(例如由Advance BiofacturesCorporation以名称Santyl销售);β-半乳糖苷酶(例如由Genzyme以名称Fabrazyme销售);阿法链道酶(例如由Genentech以名称Pulmozyme销售);阿替普酶(alteplase) (例如由Genentech以名称Activase销售);聚乙二醇化天冬酰胺酶(例如由Enzon以名称Oncaspar销售);天冬酰胺酶(例如由默克公司以名称Elspar销售);和伊米苷酶(imiglucerase) (例如由Genzyme以名称Ceredase销售)。特定多肽或蛋白的实例包括(但不限于)胶原蛋白、粒细胞巨噬细胞集落刺激因子(GM-CSF)、粒细胞集落刺激因子(G-CSF)、巨噬细胞集落刺激因子(M-CSF)、集落刺激因子(CSF)、干扰素β(IFN-β)、干扰素γ(IFNγ)、干扰素γ诱导因子I(IGIF)、转化生长因子β (IGF-β)、RANTES (激活时调节、正常T细胞表达和假定分泌(regulated upon activation, normal T-cell expressed and presumablysecreted))、巨噬细胞炎性蛋白(例如MIP-1α和MIP-1β)、利什曼原虫延伸起始因子(Leishmnania elongation initiating factor) (LEIF)、血小板衍生生长因子(PDGF)、肿瘤坏死因子(TNF)、生长因子(例如表皮生长因子(EGF)、血管内皮生长因子(VEGF)、成纤维细胞生长因子(FGF)、神经生长因子(NGF))、脑源性神经营养因子(BDNF)、神经营养因子-2(NT-2)、神经营养因子-3 (NT-3)、神经营养因子-4 (NT-4)、神经营养因子-5 (NT-5)、胶质细胞系源性神经营养因子(GDNF)、睫状神经营养因子(ciliary neurotrophic factor)(CNTF)、II型TNFα受体、促红细胞生成素(EPO)、胰岛素和可溶性糖蛋白,例如gp120和gp160糖蛋白。gp120糖蛋白为人类免疫缺陷病毒(WIV)包膜蛋白,而gp160糖蛋白为gp120糖蛋白的已知前体。 其他实例包括促胰液素、奈西立肽(人类B型利钠肽(B-type natriureticpeptide) (hBNP))和GYP-1。

其他示例性的目标蛋白可包括GPCR,包括(但不限于)A类视紫红质样受体(ClassA Rhodopsin like receptors),比如毒蕈碱型(Muse.)乙酰胆碱脊椎动物1型(Muscatinic(Muse.) acetylcholine Vertebrate type 1)、毒蕈碱型乙酰胆碱脊椎动物2型、毒蕈碱型乙酰胆碱脊椎动物3型、毒蕈碱型乙酰胆碱脊椎动物4型;肾上腺素受体(α肾上腺素受体1型、α肾上腺素受体2型、β肾上腺素受体1型、β肾上腺素受体2型、β肾上腺素受体3型)、多巴胺脊椎动物1型、多巴胺脊椎动物2型、多巴胺脊椎动物3型、多巴胺脊椎动物4型、组胺1型、组胺2型、组胺3型、组胺4型、5-羟色胺1型、5-羟色胺2型、5-羟色胺3型、5-羟色胺4型、5-羟色胺5型、5-羟色胺6型、5-羟色胺7型、5-羟色胺8型、其他5-羟色胺类型、痕量胺(Traceamine)、血管紧张素1型、血管紧张素2型、蛙皮素、缓激肽(Bradykffin)、C5a过敏毒素(C5aanaphylatoxin)、Finet-leu-phe、APJ样物质、白细胞介素-8A型、白细胞介素-8B型、白细胞介素-8其他型、C-C趋化因子1型至11型和其他类型、C--X--C趋化因子(2至6型和其他类型)、C-X3-C趋化因子、胆囊收缩素CCK、A型CCK、B型CCK、其他CCK、内皮素、黑皮质素(黑素细胞刺激素、促肾上腺皮质激素、黑皮质素激素)、达菲抗原(Duffy antigen)、催乳素释放肽(Prolactin-releasing peptide) (GPR10)、神经肽Y (1至7型)、神经肽Y、其他神经肽Y、神经降压素(Neurotensin)、阿片类物质(D、K、M、X型)、生长抑素(Somatostatin) (1至5型)、速激肽(Tachykinin) (物质P (NK1)、物质K (NK2)、神经介素K (Neuromedin K) (NK3)、速激肽样 1 (Tachykinin like 1)、速激肽样2 (Tachykinin like 2)、血管加压素(Vasopressin)/加压催产素(vasotocin) (1至2型)、加压催产素(Vasotocin)、催产素(Oxytocin)/中催产素(mesotocin)、芋螺升压素(Conopressin)、甘丙肽样(Galaninlike)、蛋白酶激活样、食欲素(Orexin)和神经肽FF (neuropeptides FF)、QRFP、趋化因子受体样(Chemokine receptor-like)、神经介素U样(Neuromedin U like) (神经介素U(Neuromedin U),PRXamide)、激素蛋白(促卵泡激素、绒毛膜促性腺激素(Lutropin-choriogonadotropic hormone)、促甲状腺激素、I型促性腺激素(Gonadotropin type I)、II型促性腺激素(Gonadotropin type II))、(Rhod)视蛋白、视紫红质脊椎动物(1-5型)、视紫红质脊椎动物5型、视紫红质节肢动物、视紫红质节肢动物1型、视紫红质节肢动物2型、视紫红质节肢动物3型、视紫红质软体动物、视紫红质、嗅觉(嗅觉11家族1至13)、前列腺素(前列腺素E2亚型EP 1、前列腺素E2/D2亚型EP2、前列腺素E2亚型EP3、前列腺素E2亚型EP4、前列腺素F2α、前列环素、血栓烷素)、腺苷1至3型、嘌呤受体、嘌呤受体P2RY1-4,6,11 GPR91、嘌呤受体P2RY5,8,9,10 GPR35,92,174、嘌呤受体P2RY12-14 GPR87 (JDP-葡萄糖)、大麻素、血小板活化因子、促性腺激素释放激素、I型促性腺激素释放激素、II型促性腺激素释放激素、脂动激素样(Adipokinetic hormone like)、黑化诱导神经肽(Corazonin)、促甲状腺激素释放激素和促分泌素(Thyrotropin-releasing hormone &Secretagogue)、促甲状腺激素释放激素(Thyrotropin-releasing hormone)、生长激素促分泌素(Growth hormonesecretagogue)、生长激素促分泌素样(Growth hormone secretagogue like)、蜕皮触发激素(Ecdysis-triggering hormone) (ETHR)、褪黑激素、溶血鞘脂(Lysosphingolipid)和LPA (EDG)、鞘氨醇1-磷酸Edg-1 (Sphingosine 1-phosphate Edg-1)、溶血磷脂酸Edg-2(Lysophosphatidic acid Edg-2)、鞘氨醇1-磷酸Edg-3 (Sphingosine 1-phosphate Edg-3)、溶血磷脂酸Edg4(Lysophosphatidic acid Edg4)、鞘氨醇1-磷酸Edg-5 (Sphingosine1-phosphate Edg-5)、鞘氨醇1-磷酸Edg-6 (Sphingosine 1-phosphate Edg-6)、溶血磷脂酸Edg-7(Lysophosphatidic acid Edg-7)、鞘氨醇1-磷酸Edg-8 (Sphingosine 1-phosphate Edg-8)、其他Edg白三烯B4受体(Edg Other Leukotriene B4 receptor)、白三烯B4受体BLT1、白三烯B4受体BLT2、A类孤儿(Class A Orphan)/其他、推定的神经递质(Putative neurotransmitters)、SREB、Mas原癌基因和Mas相关(Mas proto-oncogene &Mas-related) (MRG)、GPR45样、半胱氨酰白三烯(Cysteinyl leukotriene)、G蛋白偶联胆汁酸受体(G-protein coupled bile acid receptor)、游离脂肪酸受体(GP40、GP41、GP43)、B类促胰液素样(Class B Secretin like)、降钙素、促肾上腺皮质激素释放因子(Corticotropin releasing factor)、抑胃肽(Gastric inhibitory peptide)、胰高血糖素、生长激素释放激素、甲状旁腺激素(Parathyroid hormone)、PACAP、促胰液素、血管活性肠多肽(Vasoactive intestinal polypeptide)、蛛毒素受体(Latrophilin)、蛛毒素受体1型(Latrophilin type 1)、蛛毒素受体2型(Latrophilin type 2)、蛛毒素受体3型(Latrophilin type 3)、ETL受体、脑特异性血管生成抑制因子(BAI)、Methuselah样蛋白(MTH)、钙黏着蛋白(Cadherin)EGF LAG (CELSR)、非常大的G蛋白偶联受体、C类代谢型谷氨酸(Class C Metabotropic glutamate)/信息素(pheromone)、代谢型谷氨酸I至III组(Metabotropic glutamate group I through III)、钙感知样(Calcium-sensing like)、细胞外钙感知(Extracellular calcium-sensing)、信息素(Pheromone)、其他钙感知样(calcium-sensing like other)、推定的信息素受体(Putative pheromone receptor)、GABA-B、GABA-B亚型1、GABA-B亚型2、GABA-B样(GABA-B like)、孤儿GPRC5 (OrphanGPRC5)、孤儿GPCR6 (Orphan GPCR6)、无七的新娘蛋白(Bride of sevenless proteins)(BOSS)、味觉受体(TiR)、D类真菌信息素(Class D Fungal pheromone)、真菌信息素A因子样(Fungal pheromone A-Factor like) (STE2、STE3)、真菌信息素B样(Fungal pheromoneB like) (BAR、BBR、RCB、PRA)、E类cAMP受体(Class E cAMP receptor)、眼白化病蛋白(Ocular albinism protein)、卷曲/平滑家族((Frizzled/Smoothened family)、卷曲A组(frizzled Group A) (Fz 1&2&4&5&7-9)、卷曲B组(frizzled Group B) (Fz 3&6)、卷曲C组(fizzled Group C) (其他)、犁鼻受体(Vomeronasal receptor)、线虫化学感受器(Nematode chemoreceptor)、昆虫气味受体(Insect odorant receptor)和Z类古细菌/细菌/真菌视蛋白。

目标多肽也可为生物活性肽。实例包括:BOTOX、Myobloc、肉毒毒素制剂(Neurobloc)、丽舒妥(Dysport) (或其他血清型肉毒杆菌神经毒素)、阿糖苷酶α(alglucosidase alfa)、达托霉素(daptomycin)、YH-16、绒毛膜促性腺激素α、非格司亭(filgrastim)、西曲瑞克(cetrorelix)、白细胞介素-2、阿地白介素(aldesleukin)、替西白介素(teceleulin)、地尼白介素-毒素连接物(denileukin diftitox)、干扰素α-n3 (注射剂)、干扰素α-n1、DL-8234、干扰素、Suntory (γ-1a)、干扰素γ、胸腺素α1 (thymosinalpha 1)、他索纳明(tasonermin)、DigiFab、ViperaTAb、EchiTAb、CroFab、奈西立肽(nesiritide)、阿巴西普(abatacept)、阿来法塞(alefacept)、利比(Rebif)、依托特明α(eptoterminalfa)、特立帕肽(teriparatide) (骨质疏松症)、可注射降钙素(骨病)、降钙素(鼻,骨质疏松症)、依那西普(etanercept)、谷他血红蛋白250 (hemoglobin glutamer250) (牛)、屈曲可金α (drotrecogin alfa)、胶原酶、卡培立肽(carperitide)、重组人表皮生长因子(局部用凝胶剂,伤口愈合)、DWP401、达贝泊汀α (darbepoetin alfa)、依泊汀ω(epoetin omega)、依泊汀β (epoetin beta)、依泊汀α (epoetin alfa)、地西卢定(desirudin)、来匹卢定(lepirudin)、比伐卢定(bivalirudin)、诺那凝血素α (nonacogalpha)、凝血因子Ⅸ粉针剂(Mononine)、依他凝血素α (eptacog alfa) (活化的)、重组因子VIII + VWF、浓缩的重组抗血友病因子(Recombinate)、重组因子VIII、因子VIII (重组)、Alphnmate、辛凝血素α (octocogalfa)、因子VIII、帕利夫明(palifermin)、印地激酶(indikinase)、替奈普酶(tenecteplase)、阿替普酶(alteplase)、帕米普酶(pamiteplase)、瑞替普酶(reteplase)、那替普酶(nateplase)、孟替普酶(monteplase)、促滤泡素α (follitropin alfa)、rFSH、hpFSH、米卡芬净(micafungin)、培非格司亭(pegfilgrastim)、来格司亭(lenograstim)、那托司亭(nartograstim)、舍莫瑞林(sermorelin)、胰高血糖素、艾塞那肽(exenatide)、普兰林肽(pramlintide)、伊米苷酶(imiglucerase)、加硫酶(galsulfase)、留可曲平(Leucotropin)、莫拉司亭(molgramostirn)、醋酸曲普瑞林(triptorelin acetate)、组氨瑞林(histrelin) (皮下植入物,Hydron)、地洛瑞林(deslorelin)、组氨瑞林(histrelin)、那法瑞林(nafarelin)、亮丙瑞林缓释贮库(leuprolide sustained release depot) (ATRIGEL)、亮丙瑞林植入物(leuprolide implant) (DUROS)、戈舍瑞林(goserelin)、促生长激素(somatropin)、尤得盼(Eutropin)、KP-102程序(KP-102 program)、促生长激素(somatropin)、促生长激素(somatropin)、美卡舍明(mecasermin) (生长不足)、恩夫韦替(enlfavirtide)、Org-33408、甘精胰岛素(insulin glargine)、赖谷胰岛素(insulin glulisine)、胰岛素(吸入)、赖脯胰岛素(insulin lispro)、地特胰岛素(insulin deternir)、胰岛素(颊,RapidMist)、美卡舍明-林菲培(mecasermin rinfabate)、阿那白滞素(anakinra)、西莫白介素(celmoleukin)、99mTc-阿西肽注射液(99 mTc-apcitide injection)、麦罗匹德(myelopid)、倍泰龙(Betaseron)、醋酸格拉替雷(glatiramer acetate)、Gepon、沙格司亭(sargramostim)、奥普瑞白介素(oprelvekin)、人类白细胞衍生的α干扰素、倍尔来福(Bilive)、胰岛素(重组)、重组人类胰岛素、门冬胰岛素(insulin aspart)、美卡舍明(mecasenin)、罗扰素(Roferon)-A、干扰素-α2、阿尔法弗隆(Alfaferone)、复合α干扰素(interferon alfacon-1)、干扰素α、阿温耐克斯重组人类黄体化激素(Avonex’recombinant human luteinizing hormone)、阿法链道酶(dornase alfa)、曲弗明(trafermin)、齐考诺肽(ziconotide)、他替瑞林(taltirelin)、地博特明α(diboterminalfa)、阿托西班(atosiban)、贝卡普勒明(becaplermin)、依替巴肽(eptifibatide)、Zemaira、CTC-111、Shanvac-B、HPV疫苗(四价)、奥曲肽(octreotide)、兰瑞肽(lanreotide)、安瑟斯替(ancestirn)、β-半乳糖苷酶(agalsidase beta)、α-半乳糖苷酶(agalsidase alfa)、拉罗尼酶(laronidase)、蓝铜胜肽(prezatide copper acetate)(局部凝胶剂)、拉布立酶(rasburicase)、兰尼单抗(ranibizumab)、Actimmune、PEG-Intron、曲可明(Tricomin)、重组屋尘螨过敏脱敏注射剂、重组人类甲状旁腺激素(PTH)1-84 (sc,骨质疏松症)、依泊汀δ (epoetin delta)、转基因抗凝血酶III (transgenicantithrombin III)、格兰蒂曲平(Granditropin)、Vitrase、重组胰岛素、干扰素-α(口服锭剂)、GEM-21S、伐普肽(vapreotide)、艾度硫酸酯酶(idursulfase)、奥马曲拉(omnapatrilat)、重组血清白蛋白、赛妥珠单抗(certolizumab pegol)、谷卡匹酶(glucarpidase)、人类重组C1酯酶抑制剂(血管性水肿)、拉诺替普酶(lanoteplase)、重组人类生长激素、恩夫韦肽(enfuvirtide) (无针注射剂,生物喷射器2000 (Biojector2000))、VGV-1、干扰素(α)、芦西纳坦(lucinactant)、阿肽地尔(aviptadil) (吸入,肺部疾病)、艾替班特(icatibant)、艾卡拉肽(ecallantide)、奥米加南(omiganan)、奥罗格雷(Aurograb)、醋酸培西加南(pexigananacetate)、ADI-PEG-20、LDI-200、地加瑞克(degarelix)、贝辛白介素(cintredelinbesudotox)、Favld、MDX-1379、ISAtx-247、利拉鲁肽(liraglutide)、特立帕肽(teriparatide) (骨质疏松症)、替法可近(tifacogin)、AA4500、T4N5脂质体洗剂、卡妥索单抗(catumaxomab)、DWP413、ART-123、克里萨林(Chrysalin)、去氨普酶(desmoteplase)、安地普酶(amediplase)、绒促卵泡素α(corifollitropinalpha)、TH-9507、替度鲁肽(teduglutide)、Diamyd、DWP-412、生长激素(缓释注射剂)、重组G-CSF、胰岛素(吸入,AIR)、胰岛素(吸入,Technosphere)、胰岛素(吸入,AERx)、RGN-303、DiaPep277、干扰素β(丙型肝炎病毒感染) (HCV))、扰素α-n3(口服)、贝拉西普(belatacept)、透皮胰岛素贴剂、AMG-531、MBP-8298、西雷西普(Xerecept)、奥培巴坎(opebacan)、AIDSVAX、GV-1001、LymphoScan、豹蛙酶(ranpirnase)、利普散(Lipoxysan)、卢舒普肽(lusupultide)、MP52 (β-磷酸三钙载体,骨再生)、黑色素瘤疫苗、sipuleucel-T、CTP-37、印瑟吉(Insegia)、维特斯朋(vitespen)、人类凝血酶(冷冻,手术出血)、凝血酶、TransMID、蛇毒纤溶酶(alfimeprase)、普瑞凯希(Puricase)、特利加压素(terlipressin)(静脉注射,肝肾综合征)、EUR-1008M、重组FGF-I (可注射,血管疾病)、BDM-E、罗替加肽(rotigaptide)、ETC-216、P-113、MBI-594AN、耐久霉素(duramycin) (吸入,囊性纤维化)、SCV-07、OPI-45、内皮抑素(Endostatin)、血管抑制素(Angiostatin)、ABT-510、鲍曼-比尔克抑制剂浓缩物(Bowman Birk Inhibitor Concentrate)、XMP-629、99mTc-Hynic-膜联蛋白V (99 mTc-Hynic-Annexin V)、卡哈拉德F (kahalalide F)、CTCE-9908、替维瑞克(teverelix) (延长释放)、奥扎里克(ozarelix)、罗米德普(rornidepsin)、BAY-504798、白细胞介素4、PRX-321、佩斯坎(Pepscan)、埃布他德金(iboctadekin)、rh乳铁蛋白(rhlactoferrin)、TRU-015、IL-21、ATN-161、西仑吉肽(cilengitide)、白蛋白干扰素(Albuferon)、Biphasix、IRX-2、ω干扰素、PCK-3145、CAP-232、帕西瑞肽(pasireotide)、huN901-DMI、卵巢癌免疫治疗疫苗、SB-249553、Oncovax-CL、OncoVax-P、BLP-25、CerVax-16、多表位肽黑色素瘤疫苗(MART-1,gp100,酪氨酸酶)、奈米非肽(nemifitide)、rAAT (吸入)、rAAT (皮肤病)、CGRP (吸入,哮喘)、培那西普(pegsunercept)、胸腺素β4(thymosinbeta4)、普利德普(plitidepsin)、GTP-200、雷莫拉宁(ramoplanin)、GRASPA、OBI-1、AC-100、鲑鱼降钙素(salmon calcitonin) (口服,艾力更(eligen))、降钙素(口服,骨质疏松症)、艾沙瑞林(examorelin)、卡普瑞林(capromorelin)、卡德法(Cardeva)、维拉弗明(velafermin)、131I-TM-601、KK-220、T-10、乌拉立肽(ularitide)、地来司他(depelestat)、赫马肽(hematide)、克里萨林(Chrysalin) (局部)、rNAPc2、重组因子V111(聚乙二醇化脂质体)、bFGF、聚乙二醇化重组葡萄球菌激酶变体(PEGylated recombinantstaphylokinase variant)、V-10153、SonoLysis Prolyse、NeuroVax、CZEN-002、胰岛细胞新生疗法(islet cell neogenesis therapy)、rGLP-1、BIM-51077、LY-548806、艾塞那肽(exenatide) (控制释放,Medisorb)、AVE-0010、GA-GCB、阿伏瑞林(avorelin)、ACM-9604、醋酸利那洛肽(linaclotid eacetate)、CETi-1、赫莫斯盘(Hemospan)、VAL (可注射)、速效胰岛素(可注射,Viadel)、鼻内胰岛素、胰岛素(吸入)、胰岛素(口服、艾力更(eligen))、重组甲硫氨酰人瘦素(recombinant methionyl human leptin)、皮崔金拉(pitrakinra) (皮下注射,湿疹)、皮崔金拉(吸入干粉,哮喘)、白细胞介素注射剂(Multikine)、RG-1068、MM-093、NBI-6024、AT-001、PI-0824、Org-39141、Cpn10 (自身免疫性疾病/炎症)、talactoferrin (局部)、rEV-131 (眼科)、rEV-131(呼吸系统疾病)、口服重组人类胰岛素(糖尿病)、RPI-78M、奥普瑞白介素(oprelvekin) (口服)、CYT-99007 CTLA4-Ig、DTY-001、伐拉司特(valategrast)、干扰素α-n3 (局部)、IRX-3、RDP-58、涛弗隆(Tauferon)、胆汁盐刺激的脂肪酶、梅里斯普酶(Merispase)、碱性磷酸酶、EP-2104R、美拉诺坦-II(Melanotan-II)、布雷默浪丹(bremelanotide)、ATL-104、重组人类微纤溶酶(recombinanthuman microplasmin)、AX-200、SEMAX、ACV-1、Xen-2174、CJC-1008、强啡肽A (dynorphinA)、SI-6603、LAB GHRH、AER-002、BGC-728、疟疾疫苗(病毒体(virosomes),PeviPRO)、ALTU-135、细小病毒B19疫苗、流感疫苗(重组神经氨酸酶)、疟疾/HBV疫苗、炭疽疫苗、Vacc-5q、Vacc-4x、HIV疫苗(口服)、HPV疫苗、达特类毒素(Tat Toxoid)、YSPSL、CHS-13340、PTH (1-34)脂质体乳膏(Novasome)、奥斯布尔(Ostabolin-C)、PTH类似物(局部,牛皮癣)、MBRI-93.02、MTB72F疫苗(结核病)、MVA-Ag85A疫苗(结核病)、FARA04、BA-210、重组鼠疫FIV疫苗、AG-702、OxSODrol、rBetV1、Der-p1/Der-p2/Der-p7过敏原靶向疫苗(尘螨过敏)、PR1肽抗原(白血病)、突变体ras疫苗、HPV-16E7脂肽疫苗、labyrinthin疫苗(腺癌)、CML疫苗、WT1-肽疫苗(癌症)、IDD-5、CDX-110、明曲斯(Pentrys)、诺雷林(Norelin)、CytoFab、P-9808、VT-111、艾罗卡肽(icrocaptide)、替柏明(telbermin) (皮肤病、糖尿病足溃疡)、芦平曲韦(rupintrivir)、雷替库罗(reticulose)、rGRF、P1A、α-半乳糖苷酶A (alpha-galactosidase A)、ACE-011、ALTU-140、CGX-1160、血管紧张素治疗性疫苗、D-4F、ETC-642、APP-018、rhMBL、SCV-07 (口服,结核病)、DRF-7295、ABT-828、ErbB2特异性免疫毒素(抗癌)、DT3SSIL-3、TST-10088、PRO-1762、库姆波托(Combotox)、胆囊收缩素-B(cholecystokinin-B)/胃泌素受体结合肽、111In-hEGF、AE-37、曲妥珠单抗(trasnizumab)-DM1、拮抗剂G、IL-12 (重组)、PM-02734、IMP-321、rhIGF-BP3、BLX-883、CUV-1647 (局部)、基于L-19的放射性免疫治疗剂(癌症)、Re-188-P-2045、AMG-386、DC/1540/KLH疫苗(癌症)、VX-001、AVE-9633、AC-9301、NY-ESO-1疫苗(肽)、NA17.A2肽、黑色素瘤疫苗(脉冲抗原治疗剂)、前列腺癌疫苗、CBP-501、重组人类乳铁蛋白(干眼症)、FX-06、AP-214、WAP-8294A (可注射)、ACP-HIP、SUN-11031、肽YY [3-36] (肥胖症,鼻内)、FGLL、阿塞西普(atacicept)、BR3-Fc、BN-003、BA-058、人类甲状旁腺激素1-34 (鼻,骨质疏松症)、F-18-CCR1、AT-1100 (乳糜泻/糖尿病)、JPD-003、PTH (7-34)脂质体乳膏(Novasome)、耐久霉素(眼科,干眼症)、CAB-2、CTCE-0214、糖基化聚乙二醇化促红细胞生成素、EPO-Fc、CNTO-528、AMG-114、JR-013、因子XIII、氨基康定(aminocandin)、PN-951、716155、SUN-E7001、TH-0318、BAY-73-7977、替维瑞克(teverelix) (立即释放)、EP-51216、hGH (控制释放,Biosphere)、OGP-I、西夫韦肽(sifuvirtide)、TV4710、ALG-889、Org-41259、rhCC10、F-991、胸腺五肽(thymopentin) (肺部疾病)、r(m)CRP、肝脏选择性胰岛素、速碧林(subalin)、L19-IL-2融合蛋白、弹力素(elafin)、NMK-150、ALTU-139、EN-122004、rhTPO、促血小板生成素受体激动剂(血小板减少障碍)、AL-108、AL-208、神经生长因子拮抗剂(疼痛)、SLV-317、CGX-1007、INNO-105、口服特立帕肽(teriparatide) (艾力更(eligen))、GEM-OS1、AC-162352、PRX-302、LFn-p24融合疫苗(Therapore)、EP-1043、肺炎链球菌儿科疫苗、疟疾疫苗、脑膜炎奈瑟菌B组疫苗、新生儿B组链球菌疫苗、炭疽疫苗、HCV疫苗(gpE1+gpE2+MF-59)、中耳炎治疗、HCV疫苗(核心抗原+ISCOMATRIX)、hPTH (1-34) (透皮,ViaDerm)、768974、SYN-101、PGN-0052、阿维库明(aviscumnine)、BIM-23190、结核病疫苗、多表位酪氨酸酶肽、癌症疫苗、恩卡斯替母(enkastim)、APC-8024、GI-5005、ACC-001、TTS-CD3、血管靶向的TNF(实体肿瘤)、去氨加压素(desmopressin) (颊控制释放)、奥那西普(onercept)和TP-9201。

在某些实施方案中,目标蛋白为酶或其生物活性片段。合适的酶包括(但不限于):氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。在某些实施方案中,异源产生的蛋白为酶学委员会(Enzyme Commission) (EC) 1类的酶,例如来自EC 1.1至1.21或1.97中任何一种的酶。酶也可为来自EC 2、3、4、5或6类的酶。例如,酶可选自EC 2.1至2.9、EC 3.1至3.13、EC 4.1至4.6、EC 4.99、EC 5.1至5.11、EC 5.99或EC 6.1-6.6中的任何一种。

在另一个实施方案中,目标蛋白为抗体。

本文使用的术语“抗体”是指基本上完整的抗体分子。

本文使用的短语“抗体片段”是指能够结合于抗原的表位的抗体的功能片段(比如Fab、F(ab')2、Fv或单结构域分子,比如VH和VL)。

启动子

本文使用的术语“启动子”是指在转录起始期间被DNA依赖性RNA聚合酶识别并结合(直接或间接),导致与转录的DNA互补的RNA分子的产生的任何核酸序列,比如DNA序列。启动子通常位于要转录的蛋白编码序列之前的5'非翻译区(UTR)的上游,并具有充当RNA聚合酶II和其他蛋白(比如转录因子)结合位点的区域,以启动可操作地连接的序列的转录。启动子本身可含有子元件(即启动子基序),比如调控可操作地连接的基因的转录的顺式元件或增强子结构域。启动子和连接的5' UTR也称为“启动子区域”。

本发明该方面的启动子可为组成型或诱导型的。

适用于本发明该实施方案的组成型启动子包括在大多数环境条件和大多数细胞类型下具有功能(即能够指导转录)的序列(比如巨细胞病毒(CMV)、SV-40早期启动子、SV-40晚期启动子、金属硫蛋白启动子、鼠乳腺肿瘤病毒启动子、劳斯肉瘤病毒启动子和多角体蛋白启动子)。

适用于本发明该实施方案的诱导型启动子包括例如四环素诱导型启动子(Srour,M.A.,等人, 2003. Thromb. Haemost. 90: 398-405)或IPTG。

在酵母中,可使用多种组成型或诱导型启动子,如美国专利申请号5932447中所公开的。或者,可使用促进外源DNA序列整合到酵母染色体中的载体。

在其中需要在植物中表达的情况下,编码序列的表达可由多种启动子驱动。例如,可使用病毒启动子,比如CaMV的35S RNA和19S RNA启动子[Brisson等人 (1984) Nature310:511-514]或TMV的外壳蛋白启动子[Takamatsu等人 (1987) EMBO J. 6:307-311]。或者,可使用植物启动子比如RUBISCO的小亚基[Coruzzi等人 (1984) EMBO J. 3:1671-1680和Brogli等人, (1984) Science 224:838-843]或热激启动子,例如大豆hsp17.5-E或hsp17.3-B [Gurley等人 (1986) Mol. Cell. Biol. 6:559-565]。

转录终止位点:

本文使用的术语“转录终止位点”是指通过RNA聚合酶指导转录终止的DNA序列。所述序列还可指导经转录的RNA的转录后切割和多聚腺苷酸化。在一个特定的实施方案中,转录终止序列包含多聚腺苷酸化信号,称为多聚腺苷酸化/终止序列。在一个优选的实施方案中,终止序列源自SV40病毒。

如SEQ ID NO: 2中所示的内质网(ER)靶向序列:

本发明该方面的ER靶向序列助于使附接的序列定位于ER。在一个实施方案中,ER靶向序列促进附接的序列摄入到ER中。

该序列的NNY重复重复至少7次(如在SEQ ID NO: 1中)、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次、20次或更多次。

根据一个特定的实施方案,NNY重复重复至少10次(如在SEQ ID NO: 2中)。

在一个特定的实施方案中,NNY重复的N为嘧啶。在另一个实施方案中,NNY重复的N为嘌呤。在所有实施方案中,NNY重复的Y为嘧啶。

根据一个特定的实施方案,ER靶向序列不包含编码目标蛋白的核苷酸。

根据仍然另一个实施方案,ER靶向序列不包含编码如SEQ ID NO: 5 (KDEL)中所示的序列的核苷酸。

优选地,ER靶向序列不包含如SEQ ID NO: 6 (agc tacacccacc acctcatctacctctac)中所示的序列。

此外,在一个实施方案中,ER靶向序列不包含序列TG的超过5个连续的重复。

优选地,ER靶向序列不包含超过10、15、20、25、30或更多个连续的胸腺嘧啶。

优选地,ER靶向序列不包含超过10、15、20、25、30或更多个连续的胞嘧啶。

ER靶向序列与目标分泌蛋白异源(即不是内源性的)-即其不是编码目标蛋白(或调控其表达)的天然序列的一部分。

这些元件中每一个的定位使得编码目标蛋白的核酸序列和ER靶向序列位于启动子和转录终止位点之间。这样,产生mRNA转录物,其编码目标蛋白并进一步包含ER靶向序列。

在一个实施方案中,本发明该方面的ER靶向序列位于编码目标蛋白的序列的3’。在另一个实施方案中,本发明该方面的ER靶向序列位于编码目标蛋白的序列的5’。在仍然进一步的实施方案中,ER靶向序列被编码在编码目标蛋白的序列中。

优选地,当ER靶向序列包含在编码目标蛋白的核酸序列中时,将蛋白的核酸序列进行密码子优化以包含ER靶向序列。因此,目标蛋白的氨基酸序列与天然氨基酸序列相同。

短语“密码子优化”是指选择在结构基因或其片段内使用的合适的DNA核苷酸,使得ER靶向序列在DNA序列内编码而不影响蛋白的氨基酸序列。因此,优化的基因或核酸序列是指其中天然或天然存在的基因的核苷酸序列已被修饰以便利用包含ER靶向序列的密码子的基因。

本发明该方面的转录单位可进一步包含编码信号肽序列的序列。

本文使用的短语“信号肽”是指与多肽的氨基末端在框内连接的肽并指导编码的多肽进入细胞的分泌途径。

信号序列一般地位于蛋白序列的N-末端。通常不存在来自成熟蛋白的信号序列。蛋白运输之后,一般地会通过信号肽酶从蛋白上切割信号序列。

根据一个实施方案,该多肽编码具有如SEQ ID NO: 3 (ATGTTGTTTAAATCCCTTTCAAAGTTAGCAACCGCTGCTGCTTTTTTTGCTGGCGTCGCAACTGCGGAC)中所示的序列的信号肽。

在一个实施方案中,信号肽序列对目标蛋白为内源性的。在另一个实施方案中,信号肽序列对于目标蛋白为异源的(即不是天然的,或者为外源性的、非内源性的)。

多种原核或真核细胞可用作宿主表达系统以表达本发明的多肽。这些包括(但不限于)细菌细胞(例如大肠杆菌)、真菌细胞(例如酿酒酵母细胞)、植物细胞(例如烟草)、昆虫细胞(鳞翅目细胞)和其他哺乳动物细胞(中国仓鼠卵巢细胞)。

细胞可为细胞培养物的一部分、整个生物体或生物体的一部分。

如本文使用的术语“植物”涵盖整个植物、植物的祖先和后代以及植物部分,包括种子、芽、茎、根(包括块茎)以及植物细胞、组织和器官。植物可以任何形式存在,包括悬浮培养物、胚、分生组织区域、愈伤组织、叶片、配子体、孢子体、花粉和小孢子。在本发明的方法中特别有用的植物包括属于绿色植物(Viridiplantae)总科的所有植物,特别是单子叶和双子叶植物,包括饲料或草料豆科植物、观赏植物、粮食作物、树木或灌木。藻类和其他非绿色植物也可用于本发明的方法。

考虑用于表达人类干扰素β1a的细胞包括例如中国仓鼠卵巢(CHO)细胞。

考虑用于表达人类干扰素β1b的细胞包括例如大肠杆菌细胞。

考虑用于表达人类干扰素γ的细胞包括例如大肠杆菌细胞。

考虑用于表达人类生长激素的细胞包括例如大肠杆菌细胞。

考虑用于表达人类胰岛素的细胞包括例如大肠杆菌细胞。

考虑用于表达白细胞介素II的细胞包括例如大肠杆菌细胞。

考虑用于表达促卵泡激素的细胞包括例如CHO细胞。

为了在细胞系统中从本发明的多核苷酸表达多肽,将多核苷酸连接到核酸表达载体中。

本发明该实施方案的表达载体可包括使该载体适合于在原核生物、真核生物或优选地两者(例如穿梭载体)中复制和整合的另外序列。典型的克隆载体含有转录和翻译起始序列(例如启动子、增强子)以及转录和翻译终止子(例如多聚腺苷酸化信号)。

真核启动子一般地含有两种类型的识别序列,TATA框和上游启动子元件。TATA框位于转录起始位点的上游25-30个碱基对,被认为参与指导RNA聚合酶开始RNA合成。其他上游启动子元件决定转录起始的速率。

增强子元件可从连接的同源或异源启动子刺激转录高达1000倍。当置于转录起始位点的下游或上游时,增强子具有活性。许多源自病毒的增强子元件具有广泛的宿主范围,并在多种组织中具有活性。例如,SV40早期基因增强子适合于许多细胞类型。适合于本发明的其他增强子/启动子组合包括源自多瘤病毒、人或鼠巨细胞病毒(CMV)、来自各种逆转录病毒比如鼠白血病病毒、鼠或劳斯肉瘤病毒和HIV的长末端重复(term repeat)的那些。参见Enhancers and Eukaryotic Expression, Cold Spring Harbor Press, Cold SpringHarbor, N.Y. 1983,其通过参考结合至本文中。

也可将多聚腺苷酸化序列添加到表达载体中,以增加从本发明的表达载体表达的多肽的翻译效率。准确有效的多聚腺苷酸化需要两种不同的序列元件:位于多聚腺苷酸化位点下游的富含GU或U的序列以及位于上游11-30个核苷酸的6个核苷酸的高度保守序列AAUAAA。适合于本发明的终止和多聚腺苷酸化信号包括源自SV40的那些。

除了已经描述的元件之外,本发明的表达载体一般地可含有其他专门元件,旨在增加克隆的核酸的表达水平或促进携带重组DNA的细胞的鉴定。例如,许多动物病毒含有在允许的细胞类型中促进病毒基因组的额外染色体复制的DNA序列。只要在质粒上携带或与宿主细胞的基因组一起的基因提供适当的因子,就可附加型地复制携带有这些病毒复制子的质粒。

载体可能包含或可能不包含真核复制子。如果存在真核复制子,则可使用适当的选择标记在真核细胞中扩增载体。如果载体不包含真核复制子,则不能进行附加型扩增。相反,将重组DNA整合到工程化细胞的基因组中,其中启动子指导期望的核酸的表达。

本发明也可使用含有来自真核病毒比如逆转录病毒的调控元件的表达载体。SV40载体包括pSVT7和pMT2。源自牛乳头瘤病毒的载体包括pBV-1MTHA,和源自爱泼斯坦巴尔病毒(Epstein Bar virus)的载体包括pHEBO和p2O5。其他示例性的载体包括pMSG、pAV009/A

在酵母中,可使用多种含有组成型或诱导型启动子的载体,如美国专利申请号5932447中所公开的。或者,可使用促进外源DNA序列整合到酵母染色体中的载体。

在其中使用植物表达载体的情况下,编码序列的表达可由多种启动子驱动。例如,可使用病毒启动子,比如CaMV的35S RNA和19S RNA启动子[Brisson等人 (1984) Nature310:511-514]或TMV的外壳蛋白启动子[Takamatsu等人 (1987) EMBO J. 6:307-311]。或者,可使用植物启动子比如RUBISCO的小亚基[Coruzzi等人 (1984) EMBO J. 3:1671-1680和Brogli等人, (1984) Science 224:838-843]或热激启动子,例如大豆hsp17.5-E或hsp17.3-B [Gurley等人 (1986) Mol. Cell. Biol. 6:559-565]。这些构建体可使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电穿孔和技术人员众所周知的其他技术引入到植物细胞中。参见例如Weissbach & Weissbach, 1988, Methods for PlantMolecular Biology, Academic Press, NY, Section VIII, pp 421-463。

哺乳动物表达载体的实例包括(但不限于) pcDNA3、pcDNA3.1(+/-)、pGL3、pZeoSV2(+/-)、pSecTag2、pDisplay、pEF/myc/cyto、pCMV/myc/cyto、pCR3.1、pSinRep5、DH26S、DHBB、pNMT1、pNMT41、pNMT81 (可从Invitrogen获得)、pCI (可从Promega获得)、pMbac、pPbac、pBK-RSV和pBK-CMV (可从Strategene获得)、pTRES (可从Clontech获得)及其衍生物。

在一个实施方案中,表达载体包含核酸序列,后者包含本发明的ER靶向序列(例如如SEQ ID NO: 1或SEQ ID NO: 2中所示)和克隆位点,其中选择克隆位点的位置,使得在将编码目标蛋白的序列插入到克隆位点中后,在细胞中表达后,转录编码目标蛋白的mRNA,其中ER靶向序列不是编码已知目标蛋白的序列的一部分-例如不编码MRL1-3,如Kraut Cohenet al Mol. Biol. Cell

术语“克隆位点”是指载体上可插入DNA的位置。术语“多克隆位点”或“mcs”是指含有任何一个或多个不同的限制性内切酶位点以允许在载体上限定的基因座(限制性位点)处插入的合成DNA序列。术语“独特克隆位点”是指对给定的DNA序列出现一次的克隆位点。

可使用各种方法将本发明的表达载体引入到细胞中。这种方法在Sambrook等人,Molecular Cloning: A Laboratory Manual, Cold Springs Harbor Laboratory, NewYork (1989, 1992)中,在Ausubel等人, Current Protocols in Molecular Biology,John Wiley and Sons, Baltimore, Md. (1989), Chang等人, Somatic Gene Therapy,CRC Press, Ann Arbor, Mich. (1995), Vega等人, Gene Targeting, CRC Press, AnnArbor Mich. (1995), Vectors: A Survey of Molecular Cloning Vectors and TheirUses, Butterworths, Boston Mass. (1988)和Gilboa et at. [Biotechniques 4 (6):504-512, 1986]中进行了一般性描述,并且包括例如稳定或瞬时转染、脂质转染、电穿孔和使用重组病毒载体的感染。另外,对于正负选择方法(positive-negative selectionmethod)请参见美国专利第5464764和5487992号。

在允许表达大量重组多肽的有效条件下培养转化的细胞。有效的培养条件包括(但不限于)允许蛋白产生的有效培养基、生物反应器、温度、pH和氧气条件。有效培养基是指其中培养细胞以产生本发明的重组多肽的任何培养基。这种培养基一般地包括具有可同化的碳、氮和磷酸盐源以及适当的盐、矿物质、金属和其他营养物(比如维生素)的水溶液。可在常规发酵生物反应器、摇瓶、试管、微量滴定盘和培养皿中培养本发明的细胞。培养可在适合于重组细胞的温度、pH和氧气含量下进行。这种培养条件在本领域普通技术人员的专业知识范围内。

培养预定时间后,进行重组多肽的回收。

本文使用的短语“回收重组多肽”是指收集含有多肽的整个发酵培养基,并且不需要意指分离或纯化的另外步骤。

因此,本发明的多肽可使用多种标准蛋白纯化技术来纯化,比如(但不限于)亲和色谱、离子交换色谱、过滤、电泳、疏水相互作用色谱、凝胶过滤色谱、反相色谱、伴刀豆球蛋白A色谱、色谱聚焦和差异增溶。

本文使用的术语“约”是指±10%。

术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(having)”及其词形变化意指“包括(但不限于)”。

术语“由……组成”意指“包括并限于”。

术语“基本上由...组成”意指组合物、方法或结构可包括另外的成分、步骤和/或部分,但前提是另外的成分、步骤和/或部分不会实质性地改变要求保护的组合物、方法或结构的基本和新颖特征。

本文使用的单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数指涉,除非上下文另外明确规定。例如,术语“化合物”或“至少一种化合物”可包括多种化合物,包括其混合物。

在整个本申请中,本发明的各种实施方案可以范围格式呈现。应当理解,以范围格式的描述仅是为了方便和简洁起见,而不应解释为对本发明范围不灵活的限制。因此,范围的描述应被认为具有具体公开的所有可能的子范围以及该范围内的单个数值。例如,对范围比如1-6的描述应被认为具有具体公开的子范围(比如1-3、1-4、1-5、2-4、2-6、3 -6等)以及该范围内的单个数字(例如1、2、3、4、5和6)。无论范围的广度如何,这都适用。

每当本文指示数值范围时,其意在包括所示范围内的任何引用数值(分数或整数)。短语“在”第一指示数字和第二指示数字“之间的范围内/的范围”和从第一指示数字“到”第二指示数字的“范围内/的范围”本文可互换使用,并且意指包括第一和第二指示数字以及其间的所有分数和整数数字。

本文使用的术语“方法”是指用于完成给定任务的方式、手段、技术和程序,包括(但不限于)化学、药理学、生物学、生物化学和医学领域的从业人员已知或者从已知的方式、手段、技术和程序易于开发的那些方式、手段、技术和程序。

当提及特定的序列表时,应当理解这种指涉还包括基本上对应于其互补序列的序列,如包括由例如测序错误、克隆错误或导致碱基取代、碱基缺失或碱基添加的其他改变引起的微小序列变化,条件是这种变化的频率小于1/50个核苷酸,或者小于1/100个核苷酸,或者小于1/200个核苷酸,或者小于1/500个核苷酸,或者小于1/1000个核苷酸,或者小于1/5000个核苷酸,或者小于1/10000个核苷酸。

应当理解,本申请中公开的任何序列识别号(SEQ ID NO)均可指DNA序列或RNA序列,这取决于其中提及该SEQ ID NO的上下文,即使该SEQ ID NO仅以DNA序列格式或RNA序列格式表达也是如此。

应当意识到,为了清楚起见在单独的实施方案的上下文中描述的本发明的某些特征也可在单个实施方案中组合提供。相反,为了简洁起见在单个实施方案的上下文中描述的本发明的各种特征,也可单独地或以任何合适的子组合或适当地在本发明的任何其他所述实施方案中提供。在各种实施方案的上下文中描述的某些特征不应认为是那些实施方案的必要特征,除非实施方案在没有那些要素的情况下不可操作。

如上文描述的以及如以下部分权利要求所要求保护的本发明的各种实施方案和方面在以下实施例中得到实验支持。

实施例

现参考以下实施例,其与以上描述一起以非限制性方式说明本发明的一些实施方案。

通常,本文所用的命名法和本发明中所用的实验室程序包括分子、生物化学、微生物学和重组DNA技术。这种技术在文献中有详尽的解释。参见例如"Molecular Cloning: Alaboratory Manual" Sambrook等人, (1989); "Current Protocols in MolecularBiology" 第I-III卷 Ausubel, R. M.,编辑 (1994); Ausubel等人, "CurrentProtocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland(1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons,New York (1988); Watson等人, "Recombinant DNA", Scientific American Books,New York; Birren等人 (编辑) "Genome Analysis: A Laboratory Manual Series", 第1-4卷, Cold Spring Harbor Laboratory Press, New York (1998); 如美国专利第4666828、4683202、4801531、5192659和5272057号中所示的方法学; "Cell Biology: ALaboratory Handbook", 第I-III卷 Cellis, J. E.,编辑 (1994); "Culture of AnimalCells - A Manual of Basic Technique",Freshney, Wiley-Liss, N. Y. (1994), 第三版; "Current Protocols in Immunology" 第I-III卷 Coligan J. E.,编辑 (1994);Stites等人 (编辑), "Basic and Clinical Immunology" (第8版), Appleton & Lange,Norwalk, CT (1994); Mishell和Shiigi (编辑), "Selected Methods in CellularImmunology", W. H. Freeman and Co., New York (1980); 可利用的免疫测定在专利和科学文献中有广泛的描述,参见例如美国专利第3791932、3839153、3850752、3850578、3853987、3867517、3879262、3901654、3935074、3984533、3996345、4034074、4098876、4879219、5011771和5281521号; "Oligonucleotide Synthesis" Gait, M. J.,编辑(1984); “Nucleic Acid Hybridization" Hames, B. D., 和Higgins S. J., 编辑.(1985); "Transcription and Translation" Hames, B. D., 和Higgins S. J., 编辑.(1984); "Animal Cell Culture" Freshney, R. I.,编辑 (1986); "Immobilized Cellsand Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning"Perbal, B., (1984)和"Methods in Enzymology" Vol. 1-317, Academic Press; "PCRProtocols: A Guide To Methods And Applications", Academic Press, San Diego,CA (1990); Marshak等人, "Strategies for Protein Purification andCharacterization - A Laboratory Course Manual" CSHL Press (1996);其全部通过参考结合,如同本文全面阐述一样。整个本文件中提供其他一般参考。据信其中的程序为本领域中众所周知的,并且为读者方便而提供。其中含有的所有信息均通过参考结合至本文中。

材料和方法

酵母菌株、基因组操作和生长条件

使酵母在所示温度下,于标准生长培养基(1%酵母提取物、2%蛋白胨、2%右旋糖)或含有2%葡萄糖的合成培养基[例如合成完全(SC)和缺少氨基酸或核苷酸碱基的选择性SC遗失培养基] (Haim和Gerst, 2009)中生长。使用标准LiOAc转化程序和用诺尔斯菌素(100 μg/ml)创建在WT (BY4741)细胞中使用NAT抗生素抗性基因的缺失菌株,以在合成固体培养基上进行选择。为了创建SECReTE突变株,设计具有适当的修饰(从第一个到最后一个突变碱基)的SECReTE基因片段,并合成为gBlock

定量RT-PCR (qRT-PCR)

使用MasterPure酵母RNA纯化试剂盒(Epicentre Biotechnologies)从过夜培养物中提取并纯化RNA。对于每个样品,将2 μg纯化的RNA在37℃下用DNA酶(Promega, Madison,WI, USA)处理2小时,并在推荐的制造商条件下使用莫洛尼鼠白血病病毒(Moloney murineleukemia virus) RT RNase H(-) (Promega)进行逆转录(RT)。使用NCBI Primer-Blast(Ye等人, 2012)设计引物对,以仅产生一个扩增子(60-70 bp)。为每对引物生成标准曲线,并测量引物效率。所有反应组均一式三份进行,并且每组均包括阴性对照(H

跌落测试生长测定

通过使酵母菌株在YPD培养基中生长至对数中期,并然后在新鲜培养基中进行5次连续稀释(每次10倍)来进行跌落测试测定。将细胞点样到具有不同条件的板上并温育48小时,之后进行照相记录。按照上述方案,通过将细胞点样到含有25 μg/ml HB或50 μg/ml CFW(溶解于DMSO中,如在Ram和Klis (2006)中那样制备)的YPD板上,测试Calcofluor White(CFW)或潮霉素B(HB)敏感性。

Hsp150和GFP分泌测定

为了诱导Hsp150分泌,使菌株在YPD中于26℃下生长过夜,在YPD培养基中稀释至0.2O.D.

转化酶测定

如前所述(Goldstein和Lampen, 1975)测量转化酶的分泌。如(Novick和Schekman,1979)中所述进行用于转化酶测定的细胞制备。方案基于(Troy AA, 2014)进行优化。内部和外部活性以基于540 nm处的吸收为单位表示(1 U = 1 μmol释放的葡萄糖/分钟/OD单位)。

单分子FISF

使表达Sec63-GFP的酵母细胞生长至对数中期,并转移至含有低葡萄糖的培养基[0.1%葡萄糖]上保持1.5 h以诱导SUC2表达。加入甲醛(最终浓度为3.7%)45分钟后,将细胞固定在相同培养基中。细胞用0.1 M磷酸钾缓冲液(pH 7.4,含有1.2 M山梨醇)轻轻洗涤两次,之后将细胞在1 ml新鲜制备的原生质球缓冲液[0.1 M磷酸钾缓冲液, pH 7.4, 1.2 M山梨醇,20 mM氧钒核糖核苷复合物(ribonucleoside vanadyl complex) (Sigma-Aldrich,St. Louis, MO), 1×完全蛋白酶抑制剂混合物(Complete Protease InhibitorCocktail),28 mM β-巯基乙醇, 120 U/ml RNasin核糖核酸酶抑制剂和消解酶(10 kU/ml)]中,于30℃下原生质球化30分钟。将原生质球在4℃下以1300 ×

计算分析:

SECReTE得分计算

使用Perl编程语言进行SECReTE得分的计算。为了计算基序数,对3个不同位置(即YNN、NYN、NNY,其中N为任何核苷酸和Y为嘧啶)计数高于某个阈值的NNY重复数。

基因本体论

根据(Ast等人, 2013)定义分泌蛋白质组,该组包括所有含有TMD和/或信号序列且不是线粒体的基因。使用TMHMM工具定义含有TMD的蛋白。根据UniProt定义细胞壁和尾锚定性基因。来自(Jan等人, 2014)的数据用于定义其他组基因以及定义人类GO术语。使用GOSlim Mapper工具(SGD) (worldwidewebdotyeastgenomedotorg/cgi-bin/GO/goSlimMapperdotpl)对ERTM10-和ERTM15-阳性基因进行分类。

排列测试分析

为了进行排列分析,将每个基因序列随机改组1000次,并对每个改组序列的SECReTE进行评分。为了评估SECReTE随机出现的可能性,根据下式计算每个基因的Z得分:Z = (观测值-平均值)/STD。观测值为从基因序列测量的值(例如基因的SECReTE得分)。平均值为基因的所有改组序列的平均SECReTE得分。STD为来自基因的所有改组序列的SECReTE得分的标准偏差。

细胞壁基序的鉴定

基序搜索通过MEME套件(Bailey等人, 2009)在meme-suitedotorg/tools/meme中进行。

结果

编码酵母分泌蛋白质组蛋白的mRNA中的嘧啶重复基序的鉴定

因为编码疏水性残基的密码子在其第二位富含嘧啶(Prilusky和Bibi, 2009),所以本发明人检查了酵母中编码分泌蛋白质组蛋白的mRNA在编码和UTR区中是否存在连续的每3个核苷酸的嘧啶重复(即YNN、NYN或NNY)。首先,我们确定了多少嘧啶重复可以最好地区分分泌蛋白质组蛋白编码mRNA与非分泌蛋白质组蛋白编码mRNA。为此,根据定义的阈值(例如5、7、10、12和15个重复)对沿着mRNA转录物的重复数进行评分。为了确定基因长度与重复的存在之间是否存在相关性,本发明人比较了这两个参数(图1A)。基于使用定义的阈值进行的序列分析,他们暂时将这些重复定义为 “分泌增强型顺式调控靶向元件(

如果10以上的SECReTE重复(例如SECReTE10)在蛋白分泌中起作用,则可预计它们在编码分泌蛋白质组蛋白的mRNA中更加丰富,如根据Astet等人(Ast等人, 2013)定义的。为了测试这种可能性,本发明人将全部酵母基因组分为两组:分泌蛋白质组和非分泌蛋白质组,并计算每组中含有SECReTE的转录物的分数。他们发现,编码分泌蛋白质组蛋白的转录物富含SECReTE基序> 7 (图1B),与编码非分泌蛋白质组蛋白的转录物相对。为了测试在分泌蛋白质组与非分泌蛋白质组转录物之间提供最显著分离的重复数,本发明人使用接收者操作特征(receiver operator characteristics) (ROC)分析评估了不同阈值对mSMP进行分类的能力(Hanley和McNeil, 1982)。真实的编码分泌蛋白质组蛋白的转录物用作真阳性集和编码非分泌蛋白质组蛋白的转录物定义为真阴性。如所示(图1C),SECReTE10阈值最大程度地区分了分泌蛋白质组转录物与非分泌蛋白质组转录物。由于SECReTE10不显示对基因长度的依赖性,并且在分泌蛋白质组与非分泌蛋白质组转录物之间提供最显著的分离,因此本发明人将其用作在随后的分析中借以定义基序存在的阈值。

mSMP中的SECReTE丰度不依赖于TMD的存在

编码TMD的mRNA序列富含尿嘧啶(U),主要位于密码子(NYN)的第二位(Wolfenden等人,1979; Prilusky和Bibi, 2009)。由于大多数分泌蛋白质组蛋白均含有TMD,因此仅其存在就可能是分泌蛋白质组转录物中基序富集的原因。为了确定mSMP中的SECReTE富集是否不仅是由于编码的TMD的存在,本发明人确定了在SECReTE10元件中嘧啶(Y)位于三联体的哪个位置:第一(YNN);第二(NYN);或第三(NNY)。他们仅使用编码序列(即从起始密码子到终止密码子)而没有使用UTR分别计算每个位置的SECReTE10丰度。尽管不出所料,信号存在于第二位(图2A;NYN),但在密码子的第三位其也很丰富(图2A;NNY)。后一个发现意味着,TMD可能不是影响mSMP中SECReTE富集的唯一因素。相比之下,SECReTE10元件在第一位的表现不佳(图2A;YNN)。

接下来,他们分别检查了编码含有TMD的蛋白和可溶性分泌蛋白的mRNA中SECReTE10的存在。不出所料,比起编码可溶性分泌蛋白的转录物,更多的编码含有TMD的分泌蛋白质组蛋白的转录物在第二位(NYN)含有SECReTE10 (图2B)。然而,编码可溶性分泌蛋白的含有SECReTE10的转录物在第三位(NNY)的分数甚至更高。这为与编码的TMD区域无关的转录物中的SECReTE10富集提供令人信服的证据。相应地,当从编码膜蛋白的mRNA序列中人工去除TMD时,分泌蛋白质组基因不再富含第二位的SECReTE10 (图2C;NYN),尽管第三位的SECReTE10富集仍然高度丰富(图2C;NNY)。

SECReTE丰度不依赖于密码子组成

SECReTE富集可能是由转录物的密码子组成引起。为了检查这种可能性,本发明人进行了排列测试分析。在这种情况下,将每个基因序列随机改组x 1000,而密码子组成保持不变。然后,他们为每个基因计算SECReTE10的Z得分(即与平均值的标准偏差数),以评估信号随机出现的可能性。通过查看分泌蛋白质组和非分泌蛋白质组基因的Z得分分布,可以得出结论,mSMP中的SECReTE富集不是随机现象,也不依赖于密码子组成(图9A)。该结论对于编码膜蛋白和可溶性蛋白两者的mSMP均为有效的(图9B)。本发明人还分别对每个密码子位置进行了分析。为此,他们分别计算了每个位置具有显著Z得分(≥1.96)的基因分数。在密码子的第二和第三位两者处,分泌蛋白质组基因中具有显著Z得分的基因分数要大于非分泌蛋白质组基因中的(图9C),从而加强这样一种观点,即SECReTE在这些位置中明显更加富集。这一发现不依赖于TMD的存在,因为具有显著Z得分的基因分数对于可溶性和含有TMD的分泌蛋白质组转录物两者均较大,而对于可溶性和含有TMD的非分泌蛋白质组转录物则不是(图9D)。

基因本体论(GO)分析

为了确定在含有SECReTE的基因群体中过度表现的那些基因类别,进行了基因本体论(GO)富集分析。当针对GO富集搜索SECReTE10阳性基因时(使用所有酵母基因作为背景),毫不奇怪的是,发现膜蛋白具有高富集得分(富集倍数= 1.67) (图3A)。SECReTE最富集的基因类别为包含细胞壁蛋白的基因(富集倍数= 1.8) (图3A)。当15个NNY重复用作阈值时,细胞壁蛋白类别的富集倍数变化增加到4.8倍(图3B)。为了进一步表征富含SECReTE的mRNA,本发明人将分泌蛋白质组和非分泌蛋白质组分为亚组,并计算每个类别中含有SECReTE10的转录物的分数。与GO分析一致,编码细胞壁蛋白的mRNA中多于90%具有SECReTE10元件,并且细胞壁蛋白是SECReTE最丰富的(图3C)。他们发现,编码TMD和信号序列(SS)区域两者的蛋白的mRNA中86%以及编码TMD的分泌蛋白质组mRNA中84%均含有SECReTE10 (图3C)。其中,编码尾锚定性(TA)蛋白的mRNA在分泌蛋白质组中含有最少数量的具有SECReTE10的转录物(图3C)。已知TA蛋白在胞质溶胶中翻译之后会通过备选途径(GET)易位至ER (Sharp和Li,1987; Stefanovic和Hegde, 2007; Denic, 2012),并且它们的转录物不会在ER膜上富集(Jan等人, 2014; Chartron等人, 2016)。这可能意味着在ER上进行翻译的mRNA中SECReTE更为丰富。相比之下,非分泌蛋白质组蛋白的转录物(即线粒体和细胞核)具有最低的SECReTE元件丰度(图3C)。

由于SECReTE在编码细胞壁蛋白的mRNA中高度富集,因此本发明人希望知道是否可使用无偏倚基序搜索工具(unbiased motif search tool)来发现它。为此,他们使用MEME分析了细胞壁蛋白的mRNA序列以鉴定mRNA基序。获得的最显著的结果与具有U或C的SECReTE10重复高度相似(图3D)。重要的是,他们没有检测到该mRNA基序内的蛋白基序,从而消除了SECReTE元件依赖于蛋白序列的可能性。

在原核生物和高等真核生物两者中均发现mSMP中的SECReTE富集

进化中的保守性或趋同性均为具有意义的强指征。为了检查在高等和低等生物体(例如人类和枯草芽孢杆菌)中是否发现在mSMP中的SECReTE富集,本发明人分析了这些基因组。在人类中,如在酿酒酵母中一样,基于ROC分析,SECReTE10在编码分泌蛋白质组和非分泌蛋白质组蛋白的RNA之间提供最显著的分离(图4A)。在确认SECReTE10与基因长度不相关之后,将10个NNY重复用作阈值来定义SECReTE基序的存在。如在酵母中一样,与非分泌蛋白质组转录物相比较,SECReTE在分泌蛋白质组转录物的第二和第三密码子位置富集(图4B)。同样,与带有或缺少TMD的非分泌蛋白质组转录物相比较,缺少TMD的分泌蛋白质组转录物中有较大分数含有SECReTE (图4C)。有趣的是,发现编码GPI锚定蛋白(等同于细胞壁蛋白)的转录物高度富含SECReTE。相比之下,如酵母中所见示,尾锚定性基因以及线粒体和细胞核基因具有低的SECReTE丰度(图4D)。与编码非分泌蛋白质组蛋白的那些基因相比较,在编码枯草芽孢杆菌的分泌蛋白质组蛋白的基因中检测到高丰度的SECReTE10 (图4E)。

SECReTE中的突变影响内源性分泌蛋白质组蛋白的分泌

为了进一步理解SECReTE的意义并确证其对酵母细胞生理学的重要性,本发明人通过升高或降低所选基因中的信号来检查其相关性。基于其相对短的基因长度、其缺失后的可检测表型以及其在不同生理途径中的功能,选择了3个代表性基因。这些基因包括:SUC2,其编码可溶性分泌型周质酶;HSP150,其编码可溶性培养基蛋白;和CCW12,其编码GPI锚定的细胞壁蛋白。通过分别用T或C取代存在于第三密码子位置上的任何A或G,从而沿着整个基因富含SECReTE的存在,来增加基因的整体SECReTE信号[(+)SECReTE]。将T转换为A或将C转换为G的反向取代降低了整体SECReTE信号[(-)SECReTE]。至关重要的是,将这些修饰设计成确保仅改变mRNA序列的SECReTE属性,而不对编码的氨基酸序列进行任何改变。此外,mRNA二级结构的稳定性变化保持在可接受的范围内,并且密码子适应指数(CodonAdaptation Index) (CAI)保持在0.8-1.0的最佳范围内(Sharp和Li, 1987)。使用1个NNY重复或10个NNY重复的最小阈值,沿着基因长度显示SUC2、HSP150和CCW12中的SECReTE突变,如图10所示(A-C;分别为上部和下部)。

SUC2中的SECReTE突变改变转化酶的分泌

SUC2编码从两种不同的mRNA (短和长,其仅在它们的5’末端不同)翻译而成的不同形式的转化酶。尽管较长的mRNA编码含有信号序列的分泌蛋白,但从短同工型则省略了信号序列,其编码细胞质蛋白。分泌的Suc2表达受到葡萄糖抑制;然而,在诱导条件(即葡萄糖耗竭)下,Suc2通过分泌途径运输到细胞的周质空间。在那里,其催化蔗糖水解为葡萄糖和果糖,这种酶促活性负责酵母利用蔗糖作为碳源的能力,并可通过生化测定(即转化酶活性)在细胞的内部和外部进行测量。通过经跌落测试检查突变体在含有蔗糖的培养基上生长的能力来测试SECReTE突变对Suc2功能的影响。有趣的是,即使在YPD板上未检测到生长变化,但与WT细胞相比较,蔗糖板上SUC2(-)SECReTE的生长速率也降低,而SUC2(+)SECReTE突变体却呈现出更好的生长(图5A)。这些发现表明SECReTE强度影响Suc2的分泌。Suc2分泌的这些变化可能是由于SUC2转录、Suc2产生的变化和/或分泌速率的改变引起的。为了区分这些可能性,对WT细胞、suc2Δ和SUC2 SECReTE突变体进行转化酶测定。转化酶测定通过计算由蔗糖产生的葡萄糖的量,使得能够定量分泌的Suc2以及内部Suc2。不出所料,在葡萄糖抑制条件(例如2%葡萄糖)下,分泌的和内部Suc2两者的水平均非常低。当细胞在含有低葡萄糖(例如0.05%葡萄糖)的培养基上生长以促进所分泌的酶的表达时,分泌的Suc2水平由于SECReTE的变化而发生改变。与跌落测试结果相对应,与WT细胞相比较,对SUC2(-)SECReTE细胞检测到分泌的转化酶显著减少,而对Suc2(+)SECReTE细胞检测到显著增加。从suc2Δ细胞中未检测到Suc2分泌(图5B,分泌的)。如果SECReTE突变影响Suc2分泌的效率但不影响其合成,那么预计会在SUC2(-)SECReTE细胞中发生Suc2积累。同样地,预计会在SUC2(+)SECReTE细胞中发生内部转化酶的减少。然而,情况并非如此,因为SUC2(-)SECReTE细胞中Suc2的内部量减少,而SUC2(+)SECReTE细胞中Suc2的内部量略微增加(图5B,内部)。这些发现表明,SUC2中的SECReTE改变可能影响蛋白的产生。

SECReTE突变改变Hsp150分泌和细胞壁稳定性

接下来,本发明人希望研究SECReTE在HSP150中的重要性。Hsp150为外细胞壁的组成部分,并且尽管尚不清楚Hsp150的确切功能,但其对于细胞壁稳定性和对细胞壁扰动剂(cellwall-perturbing agent) (比如Calcofluor White (CFW)和刚果红(CR))的抗性而言是需要的。尽管hsp150∆细胞对细胞壁应激更为敏感,但Hsp150的过量产生会提高细胞壁完整性(Hsu等人, 2015)。Hsp150被有效地分泌到生长培养基中,并且在热激时其表达增加(Russo等人, 1992, 1993)。通过测试HSP150(-)SECReTE和HSP150(+)SECReTE细胞与WT和hsp150∆细胞相比较对添加的CFW的敏感性,经跌落测试来检查修饰HSP150中的SECReTE的效果。从图5C可以看出,尽管与WT细胞相比较,HSP150(-)SECReTE菌株对CFW更为敏感,但是HSP150(+)SECReTE菌株对CFW更具有抗性。不出所料,hsp150∆细胞最易受到CFW的影响(图5C)。还对HSP150菌株进行了Western印迹分析以测量突变蛋白的水平。由于热激后HSP150的分泌升高(Russo等人, 1992, 1993),因此在蛋白提取之前使细胞在37℃下生长。分别从生长培养基和细胞两者中提取蛋白以检测外部和内部蛋白水平两者。与WT细胞相比较,分泌到培养基中的Hsp150的量在HSP150(-)SECReTE细胞中减少,而在HSP150(+)SECReTE细胞中升高(图5D)。与Suc2相似,与WT细胞相比较,HSP150(-)SECReTE细胞中Hsp150的内部量也减少(图5D)。这可能意味着分泌本身并未由于SECReTE强度的降低而显著减弱。由于HSP150(+)SECReTE细胞中Hsp150的内部量与WT细胞相似,因此可以得出结论,HSP150中SECReTE的改变也可能影响蛋白的产生。

CCW12中的SECReTE突变改变细胞壁稳定性

CCW12编码糖磷脂酰肌醇(GPI)锚定的细胞壁蛋白,该蛋白定位于新合成的细胞壁区域,并在出芽和shmoo形成期间保持壁的稳定性。已表明缺失CCW12会引起对细胞壁去稳定剂(如潮霉素B (HB))的超敏性(Ragni等人, 2007, 2011)。由于CCW12中的SECReTE得分非常高,因此无法进一步增加信号。因此,本发明人仅产生CCW12(-)SECReTE细胞,并测试其在含有HB的板上生长的能力。如用HSP150(-)SECReTE所见(图5C),发现与WT细胞相比较,CCW12(-)SECReTE突变使细胞对细胞壁扰动敏感(图5E)。

SECReTE的添加影响外源性天然蛋白的分泌

SECReTE添加改善外源性蛋白分泌的能力不仅是其重要性的实质证据,而且还可为一种有用的低成本的工业工具,以在不改变蛋白序列的情况下改善重组蛋白的分泌。为了测试这一点,本发明人采用在5’末端带有Gas1的编码的SS (SSGas1)的GFP转录物构建体。SSGasI使得能够将GFP蛋白分泌到培养基中,尽管与其他SS融合的GFP蛋白(比如SSKar2)相比较其分泌不那没有有效(图5F)。为了潜在地改善SSGas1的分泌,本发明人添加含有SECReTE的Gas1的改变的3’UTR序列[即其中所有的A和G分别被T和C置换;SSGasI-3’UTRGASI(+)SECReTE]。然后他们测试了添加SECReTE对GFP分泌到培养基中的影响。他们发现,与SSGasI-GFP相比较,将SECReTE添加到GasI-GFP的3’UTR提高了GFP分泌至培养基中的分泌,并且与SSKar2-GFP相似(图5F)。

SECReTE突变对mRNA水平的影响

由于蛋白水平可能会因(-)SECReTE和(+)SECReTE突变而改变(图5B、D和F),因此,本发明人检查是否涉及基因转录或mRNA稳定性的变化。定量实时(qRT) PCR用于检查SUC2、HSP150和CCW12的mRNA水平是否受SECReTE强度影响。发现SUC2(-)SECReTE mRNA水平比在SUC2 WT细胞中的几乎低30%,而SUC2(+)ERTM水平比WT高~50% (图S3A)。mRNA水平的这种变化可能是SUC2(+)SECReTE突变体增加蛋白产生并因此在含有蔗糖的培养基上生长得更好的能力的原因(图5A,B)。

还研究了SECReTE突变对HSP150 mRNA水平的影响。有趣的是,发现HSP150(-)SECReTE的mRNA水平与WT相似,而HSP150(+)SECReTE的mRNA水平则略微降低(图11B)。因此,由于SECReTE改变而导致的Hsp150蛋白水平的变化和对CFW的敏感性(图5C和D)无法通过mRNA水平的变化来解释。同样地,CCW12(-)SECReTE中的SECReTE突变也不会引起其mRNA水平的显著变化(图11C)。因此,CCW12(-)SECReTE对HB的敏感性增加(图5E)不是由于CCW12mRNA的减少导致的。

SECReTE突变对SUC2 mRNA定位的影响

为了测试SECReTE是否具有决定mRNA定位的作用,本发明人使用特异性荧光探针通过单分子FISH (smFISH)使SUC2 mRNA可视化,并测试了SECReTE改变对SUC2 mRNA与ER共定位的水平的影响。他们使用Sec63-GFP作为ER标志物,并计算与或不与ER共定位或者与ER相邻的每细胞的颗粒百分比。发现与WT SUC2 mRNA颗粒相比较,SUC2(-)SECReTE mRNA颗粒和Sec63-GFP之间的共定位水平略微降低(图6A和B)。相比之下,观察到与WT SUC2 mRNA相比较,SUC2(+)SECReTE mRNA颗粒与ER的共定位水平显著增加~50% (图6A和B)。这些发现表明,SECReTE在使SUC2 mRNA靶向ER方面具有作用。

潜在的SECReTE结合蛋白的鉴定

为了进一步阐明SECReTE的作用,必须鉴定其结合配偶体(假定是RBP)。先前曾使用大规模方法来鉴定结合酵母中>40种已知RBP的mRNA (Colomina等人, 2008; Hasegawa等人,2008; Hogan等人, 2008)。为了获得潜在的SECReTE结合蛋白(SBP)的列表,本发明人在数据集中搜索结合高度富含SECReTE的mRNA的RBP。对于每个RBP,他们计算了含有SECReTE10的其结合转录物的分数是多少。被发现与大部分的含有SECReTE10的mRNA结合的RBP包括Bfr1、Whi3、Puf1、Puf2、Scp160和Khd1 (图7A),并且先前均显示出它们与mSMP结合。为了测试哪个候选物结合SECReTE,在WT或HSP150(+)SECReTE细胞中缺失这些RBP的每个基因。他们假设缺失真正的SBP可能会赋予对CFW的超敏性并消除在含有CFW的板上观察到的WT和HSP150(+)SECReTE细胞之间的生长速率差异(图5C)。当缺失PUF1、PUF2或SHE2时,发现HSP150(+)SECReTE菌株仍然比WT细胞对CFW具有更高的抗性(图12)。对于这种缺少影响的一种可能解释是,这些RBP不结合HSP150或者对其他SBP冗余。然而,发现WHI3或KHD1的缺失消除含有CFW的板上WT和HSP150(+)SECReTE菌株之间的差异(图7B)。这表明Whi3和Khd1结合HSP150 mRNA和可能的其他分泌蛋白质组mRNA,并且甚至在其不存在的情况下也使得单独的WT细胞对CFW更加敏感(图7B)。

参考文献

Aronov, S., Gelin-Licht, R., Zipor, G., Haim, L., Safran, E.,和Gerst,J.E. (2007). mRNAs Encoding Polarity and Exocytosis Factors Are Cotransportedwith the Cortical Endoplasmic Reticulum to the Incipient Bud in Saccharomycescerevisiae. Mol. Cell. Biol. 27, 3441-3455.

Ast, T., Cohen, G.,和Schuldiner, M. (2013). A network of cytosolicfactors targets SRP-independent proteins to the endoplasmic reticulum. Cell152, 1134-1145.

Bailey, T.L., Boden, M., Buske, F.A., Frith, M., Grant, C.E., Clementi,L., Ren, J., Li, W.W.,和Noble, W.S. (2009). MEME SUITE: tools for motifdiscovery and searching. Nucleic Acids Res. 37, W202-W208.

Blobel, G.,和Dofferstein, B. (1975). Transfer of proteins acrossmembranes. I. Presence of proteolytically processed and unprocessed nascentimmunoglobulin light chains on membrane bound ribosomes of murine myeloma. J.Cell Biol. 67, 835-851.

Buxbaum, A.R., Haimovich, G.,和Singer, R.H. (2015). In the right place atthe right time: visualizing and understanding mRNA localization. Nat. Rev.Mol. Cell Biol. 16, 95-109.

Cai, Y., Futcher, B., Waern, K., Shou, C.,和Raha, D. (2013). Effects ofthe Yeast RNA-Binding Protein Whi3 on the Half-Life and Abundance of CLN3mRNA and Other Targets. PLoS One 8, e84630.

Chartron, J.W., Hunt, K.C.L.,和Frydman, J. (2016). Cotranslationalsignal-independent SRP preloading during membrane targeting. Nature 536, 224-228.

Chen, Q., Jagannathan, S., Reid, D.W., Zheng, T.,和Nicchitta, C. V(2011). Hierarchical regulation of mRNA partitioning between the cytoplasmand the endoplasmic reticulum of mammalian cells. Mol. Biol. Cell 22, 2646-2658.

Chin, A.,和Lécuyer, E. (2017). RNA localization: Making its way to thecenter stage. Biochim. Biophys. Acta1861, 2956-2970.

Christiansen, T., Foy, B.D., Wall, L.,和Orwant, J. (2012) ProgrammingPerl: Unmatched power for text processing and scripting. O’Reilly Media Inc.ISBN:0596004923 9780596004927

Colomina, N., Ferrezuelo, F., Wang, H., Aldea, M.,和Garí, E. (2008).Whi3, a developmental regulator of budding yeast, binds a large set of mRNAsfunctionally related to the endoplasmic reticulum. J. Biol. Chem. 283, 28670-28679.

Cui, X. a.,和Palazzo, A.F. (2014). Localization of mRNAs to theendoplasmic reticulum. Wiley Interdiscip. Rev. RNA 5, 481-492.

Cui, X.A., Zhang, H., Palazzo, A.F., Fugate, R.D.,和Reichlin, M. (2012).p180 Promotes the Ribosome-Independent Localization of a Subset of mRNA tothe Endoplasmic Reticulum. PLoS Biol. 10, e1001336.

Denic, V. (2012). A portrait of the GET pathway as a surprisinglycomplicated young man. Trends Biochem. Sci. 37, 411-417.

Diehn, M., Eisen, M.B., Botstein, D.,和Brown, P.O. (2000). Large-scaleidentification of secreted and membrane-associated gene products using DNAmicroarrays. Nat. Genet. 25, 58-62.

Gerst, J.E. (2008). Message on the web: mRNA and ER co-trafficking.Trends Cell Biol. 18, 68-76.

Gilmore, R., Walter, P.,和Blobel, G. (1982). Protein translocation acrossthe endoplasmic reticulum. II. Isolation and characterization of the signalrecognition particle receptor. J. Cell Biol. 95, 470-477.

Goldstein, A.,和Lampen, J.O. (1975). Beta-D-fructofuranosidefructohydrolase from yeast. Methods Enzymol. 42, 504-511.

Haim, L.和Gerst, J.E. (2009) m-TAG: A PCR-based genomic integrationmethod to visualize the localization of specific endogenous mRNAs in vivo inyeast. Nat. Protocols 4,1274-1284.

Hamilton, R.S.,和Davis, I. (2011). Identifying and searching forconserved RNA localisation signals. Methods Mol. Biol. 714, 447-466.

Hanley, J.A.和McNeil, B.J. (1982) The meaning and use of the area under areceiver operating characteristic. Radiology 143, 29-36.

Hasegawa, Y., Irie, K.,和Gerber, A.P. (2008). Distinct roles for Khd1p inthe localization and expression of bud-localized mRNAs in yeast. RNA 14,2333-2347.

Hogan, D.J., Riordan, D.P., Gerber, A.P., Herschlag, D.,和Brown, P.O.(2008). Diverse RNA-binding proteins interact with functionally related setsof RNAs, suggesting an extensive regulatory system. PLoS Biol. 6, 2297-2313.

Houshmandi, S.S.,和Olivas, W.M. (2005). Yeast Puf3 mutants reveal thecomplexity of Puf-RNA binding and identify a loop required for regulation ofmRNA decay. RNA 11, 1655-1666.

Hsu, P.-H., Chiang, P.-C., Liu, C.-H.,和Chang, Y.-W. (2015).Characterization of Cell Wall Proteins in Saccharomyces cerevisiae ClinicalIsolates Elucidates Hsp150p in Virulence. PLoS One 10, e0135174.

Irie, K., Tadauchi, T., Takizawa, P.A., Vale, R.D., Matsumoto, K.,和Herskowitz, I. (2002). The Khd1 protein, which has three KH RNA-bindingmotifs, is required for proper localization of ASH1 mRNA in yeast. EMBO J.21, 1158-1167.

Ito, W., Li, X., Irie, K., Mizuno, T.,和Irie, K. (2011). RNA-BindingProtein Khd1 and Ccr4 Deadenylase Play Overlapping Roles in the Cell WallIntegrity Pathway in Saccharomyces cerevisiaeEukaryot. Cell 10, 1340-1347.

Jagannathan, S., Reid, D.W., Cox, A.H., Jagannathan, S., Reid, D.W., Cox,A.H.,和Nicchitta, C. V (2014). De novo translation initiation on membrane-bound ribosomes as a mechanism for localization of cytosolic protein mRNAs tothe endoplasmic reticulum. RNA 20, 1489-1498.

Jan, C.H., Williams, C.C.,和Weissman, J.S. (2014). Principles of ERcotranslational translocation revealed by proximity-specific ribosomeprofiling. Science 346, 1257521.

Jan, C.H., Williams, C.C.,和Weissman, J.S. (2015). Response to Comment on“Principles of ER cotranslational translocation revealed by proximity-specific ribosome profiling.” Science (80-. ). 348.

Johnson, N., Powis, K.,和High, S. (2013). Post-translationaltranslocation into the endoplasmic reticulum. Biochim. Biophys. Acta - Mol.Cell Res. 1833, 2403-2409.

Kejiou, N.S.,和Palazzo, A.F. (2017). mRNA localization as a rheostat toregulate subcellular gene expression. Wiley Interdiscip. Rev. RNA 8, e1416.

Kraut-Cohen, J.,和Gerst, J.E. (2010). Addressing mRNAs to the ER: cissequences act up! Trends Biochem. Sci. 35, 459-469.

Kraut-Cohen, J., Afanasieva, E., Haim-Vilmovsky, L., Slobodin, B., Yosef,I., Bibi, E.,和Gerst, J.E. (2013). Translation- and SRP-independent mRNAtargeting to the endoplasmic reticulum in the yeast Saccharomyces cerevisiae.Mol. Biol. Cell 24, 3069-3084.

Lerner, R.S., Seiser, R.M., Zheng, T., Lager, P.J., Reedy, M.C., Keene,J.D.,和Nicchitta, C. V (2003). Partitioning and translation of mRNAs encodingsoluble proteins on membrane-bound ribosomes. Rna 9, 1123-1137.

Martin, K.C.,和Ephrussi, A. (2009). mRNA localization: gene expression inthe spatial dimension. Cell 136, 719-730.

Mutka, S.C.,和Walter, P. (2001). Multifaceted Physiological ResponseAllows Yeast to Adapt to the Loss of the Signal Recognition Particle-dependent Protein-targeting Pathway. Mol. Biol. Cell 12, 577-588.

Novick, P.,和Schekman, R. (1979). Secretion and cell-surface growth areblocked in a temperature-sensitive mutant of Saccharomyces cerevisiae. Proc.Natl. Acad. Sci. U. S. A. 76, 1858-1862.

Olivas, W.,和Parker, R. (2000). The Puf3 protein is a transcript-specificregulator of Gen. Genet. 239, 273-280.

Saint-Georges, Y., Garcia, M., Delaveau, T., Jourdren, L., Le Crom, S.,Lemoine, S., Tanty, V., Devaux, F.,和Jacq, C. (2008). Yeast MitochondrialBiogenesis: A Role for the PUF RNA-Binding Protein Puf3p in mRNALocalization. PLoS One 3, e2293.

Saraogi, I., Shan, S.,和Ishu Saraogi, S. (2011). Molecular mechanism ofco-translational protein targeting by the signal recognition particle.Traffic 12, 535-542.

Schmid, M., Jaedicke, A., Du, T.-G.,和Jansen, R.-P. (2006). Coordinationof Endoplasmic Reticulum and mRNA Localization to the Yeast Bud. Curr. Biol.16, 1538-1543.

Schwartz, T.U. (2007). Origins and evolution of cotranslational transportto the ER. Adv. Exp. Med. Biol. 607, 52-60.

Shahbabian, K.,和Chartrand, P. (2012). Control of cytoplasmic mRNAlocalization. Cell. Mol. Life Sci. 69, 535-552.

Sharp, P.M.,和Li, W.H. (1987). The codon Adaptation Index--a measure ofdirectional synonymous codon usage bias, and its potential applications.Nucleic Acids Res. 15, 1281-1295.

Stefanovic, S.,和Hegde, R.S. (2007). Identification of a Targeting Factorfor Posttranslational Membrane Protein Insertion into the ER. Cell 128, 1147-1159.

Tang, H., Song, M., He, Y., Wang, J., Wang, S., Shen, Y., Hou, J.,和Bao,X. (2017). Engineering vesicle trafficking improves the extracellularactivity and surface display efficiency of cellulases in Saccharomycescerevisiae. Biotechnol. Biofuels 10, 53.

Troy AA, H. (2014). A Simplified Method for Measuring Secreted InvertaseActivity in Saccharomyces cerevisiae. Biochem. Pharmacol. Open Access 3.

Vergés, E., Colomina, N., Garí, E., Gallego, C.,和Aldea, M. (2007).Cyclin Cln3 Is Retained at the ER and Released by the J Chaperone Ydj1 inLate G1 to Trigger Cell Cycle Entry. Mol. Cell 26, 649-662.

Walter, P.,和Blobel, G. (1981). Translocation of proteins acrossmembranes III. Signal recognition protein (SRP) causes signal sequence-dependent and site specific arrest of chain elongation that is released bymicrosomal membranes. J. Cell Biol. 91, 557-561.

Weis, B.L., Schleiff, E.,和Zerges, W. (2013). Protein targeting tosubcellular organelles via mRNA localization. Biochim. Biophys. Acta - Mol.Cell Res. 1833, 260-273.

Wolfenden, R. V, Cullis, P.M.,和Southgate, C.C. (1979). Water, proteinfolding, and the genetic code. Science 206, 575-577.

Ye, J., Coulouris, G., Zaretskaya, I., Cutcutache, I., Rozen, S.,和Madden, T.L. (2012). Primer-BLAST: A tool to design target-specific primersfor polymerase chain reaction. BMC Bioinformatics 13, 134.

Zhang, T., Lei, J., Yang, H., Xu, K., Wang, R.,和Zhang, Z. (2011). Animproved method for whole protein extraction from yeast Saccharomycescerevisiae. Yeast 28, 795-798。

尽管本发明已经结合其特定实施方案进行了描述,但是显然许多备选、修改和变化对于本领域技术人员将是显而易见的。因此,旨在包括落入所附权利要求的精神和广泛范围内的所有这种备选、修改和变化。

本说明书中提及的所有出版物、专利和专利申请本文均通过参考以其全部结合至说明书中至好像每个单独的出版物、专利或专利申请被具体地和单独地表明通过参考结合至本文中的相同程度。另外,在本申请中对任何参考文献的引用或标识均不应解释为承认这种参考文献可用作本发明的现有技术。就使用小节标题而言,其不应解释为必然的限制。

另外,本申请的任何优先权文件特此通过参考以其全部结合至本文中。

相关技术
  • 内质网靶向信号
  • 在酵母表达系统中利用人内质网分子伴侣蛋白天然信号序列产生天然重组的分泌的人内质网分子伴侣蛋白
技术分类

06120112264080