掌桥专利:专业的专利平台
掌桥专利
首页

通过融合WHEP结构域来提高靶蛋白的水溶性的方法

文献发布时间:2023-06-19 16:08:01



技术领域

本发明涉及用于提高靶蛋白的表达效率的融合蛋白。更详细地,涉及人源谷氨酰-脯氨酰-tRNA合成酶(Glutamyl-prolyl-tRNA syntheta se from human,hEPRS)的WHEP结构域(包括位于谷氨酰-脯氨酰-tRNA合成酶(EPRS)蛋白的中间位点的WHEP结构域TRS-1、TRS-2、TRS-3以及用于连接三个结构域的连接基团)。当为了在靶蛋白的大肠杆菌中表达而将本发明的hEPRS的WHEP结构域用作融合蛋白时,靶蛋白的水溶性得以提高。

背景技术

在通过生命工程技术生产的蛋白质中,通常可分为如免疫调节、酶抑制剂及作为激素的用于医药及研究的蛋白质及用于诊断的蛋白质,或者如反应添加酶的工业用蛋白质,以这两种蛋白质为中心,促进生产工序技术研发及产业化。尤其,利用重组微生物技术生产有用的重组蛋白时,大肠杆菌因其遗传基因众所周知且已构建各种载体系统,具有可在较便宜的培养基中以高浓度快速培养的优点,从而以各种研究或商业目的使用。

当在大肠杆菌中生产重组蛋白时,已开发具有强诱导(inducible)型启动子的各种表达载体而用于生产外源蛋白。但是,在将大肠杆菌用作宿主细胞的情况下,所要制备的蛋白质被大肠杆菌内的蛋白质分解酶分解而使收率降低的情况多,尤其,已知在分子量为10kDa以下的小尺寸的多肽的表达中,这种倾向更严重。而且,通常,在大肠杆菌中,蛋白质的转录(transcription)和翻译(translation)几乎同时发生,因此,当过表达重组蛋白时,形成不溶性凝聚体(inclusion body)的情况多,在由凝聚体表达的多肽的情况下,折叠(folding)中间体通过分子间二硫键(intermolecular disulfide bond)或疏水性相互作用(hydrophobic interaction)与宿主细胞的其他蛋白质杂质(伴侣(chaper on)、核糖体(ribosome)、起始因子等)非选择性地结合,并具有靶多肽的凝聚体内的纯度降低的缺点。并且,为了将以这种方式表达的蛋白质制备为活性形式,需要进行通过使用如盐酸胍(Guanidine hychloride)或尿素(urea)的变性剂溶解后稀释的重折叠(refolding)过程,此时,具有蛋白质并不折叠为活性形式等生产收率降低的问题(Marst on FA et al.,Biochem J 240(1):1-12,1986)。

本发明人进行了确认WHEP结构域作为融合蛋白的水溶性提高能力的研究。首先,制备了仅具有一个WHEP结构域的TRS-1、TRS-2以及包括3个WHEP结构域(TRS-1、TRS-2、TRS-3)及连接基团的多WHEP结构域(multiple WHEP domain;称为EPRS)。并且,确认三种融合蛋白的靶蛋白水溶性提高能力。确认三个融合蛋白中的多WHEP结构域的水溶性提高能力最显著,从而完成了本发明。

为了在已知的大肠杆菌中表达难以表达水溶性的蛋白质,使用TR S-1、TRS-2、EPRS作为融合蛋白,使用绿色荧光蛋白(Green Fluore scent Protein,GFP)作为靶蛋白,并比较水溶性。确认结果,在包括hEPRS的WHEP结构域的融合蛋白中,确认EPRS对于水溶性提高的贡献最高。通过使用作为其他靶蛋白的干扰素β(Interferon beta,IFN-b)、烟草蚀纹病毒蛋白酶(Tev protease)、不耐热肠毒素B亚单位(Heat-labile enterotoxinsubunit B,LTB)来追加确认通过EPRS的水溶性提高效果。

发明内容

技术问题

本发明的目的在于,提供可将WHEP结构域用作融合配偶体来提高靶蛋白的水溶性及折叠的肽、用于生产重组蛋白的表达载体或基因构建体(gene construct)。

本发明的再一目的在于,提供可显著增加靶蛋白的水溶性的WHEP结构域的结构。

本发明的另一目的在于,提供利用上述表达载体转化或者插入有基因构建体的重组微生物及利用其的重组蛋白的制备方法。

技术方案

根据本发明,提供一种用于提高靶蛋白的表达效率的肽,其特征在于,包括从人源谷氨酰-脯氨酰-tRNA合成酶(hEPRS,human Glutamyl-prolyltRNA synthetase)分离的结构域的序列。

根据本发明的优选一实施例,上述结构域包括TRS-1(SEQ ID NO:1)及TRS-2(SEQID NO:2),最优选地,上述结构域可包括TRS-1(SEQ ID NO:1)及TRS-2(SEQ ID NO:2)。

本发明的上述肽还可包括用于连接各个上述结构域的序列的连接基团(Linker)序列,上述连接基团序列可由SEQ ID NO:3表示。

并且,上述肽还可包括用于提高靶蛋白的表达效率的标签(tag)序列。

在本发明中,上述靶蛋白可从由抗原、抗体、细胞受体、酶、结构蛋白、血清及细胞蛋白组成的组中选择一种以上,上述抗原可从由新型冠状病毒(SARS-CoV-2)、流感病毒的血凝素蛋白(HA)、呼吸道合胞病毒(Respiratory Syncytial Virus,RSV)及尼帕病毒(Nipha virus)组成的组中选择一种以上。根据本发明的最优选的实施例,上述抗原为呼吸道合胞病毒。

本发明还提供编码上述肽的多聚核苷酸。

根据本发明的一实施例,提供一种表达载体,其包括:编码靶蛋白的多聚核苷酸;以及结合在编码上述靶蛋白的多聚核苷酸的5'-末端的编码权利要求1至8中任一项所述的肽的多聚核苷酸。

根据本发明的再一实施例,提供利用上述表达载体转化的宿主细胞,上述宿主细胞可以为大肠杆菌(E.coli)。

本发明提供一种水溶性靶蛋白的生产方法,相应方法可包括:步骤(A),制备表达载体,上述表达载体包括编码靶蛋白的多聚核苷酸及结合在上述多聚核苷酸的5'-末端的编码权利要求1至5中任一项所述的肽的核苷酸;步骤(B),将上述表达载体引入至宿主细胞来制备转化子;以及步骤(C),通过培养上述转化子来诱导重组靶蛋白的表达,并获得其。

发明的效果

将本发明的WHEP结构域用作融合配偶体的重组蛋白的制备方法提高靶蛋白的水溶性及表达率,可以为了各种靶蛋白的医疗用途及产业用途而研发及生产。

附图说明

图1为以将TRS-1、TRS-2、EPRS用作融合蛋白的方式设计的用于表达的质粒。利用多克隆位点(Multiple cloning site,MCS)插入靶蛋白,包括用于纯化的组氨酸标(histidine tag,6X His)、用于切割融合蛋白和靶蛋白的Tev蛋白酶识别位点(Tevprotease recognition site,TEV site)。

图2为测量通过EPRS的GFP的水溶性表达提高及活性的图像。

图3为测量通过EPRS的干扰素β的水溶性表达提高及活性的图像。

图4为测量通过EPRS的Tev蛋白酶的水溶性表达提高及活性的图像。

图5为确认通过EPRS的多聚体蛋白(multimeric protein)的水溶性表达提高的图像。除此之外,在大肠杆菌内表达多聚体蛋白,并追加确认通过EPRS的蛋白质的水溶性表达率增加效果。不耐热肠毒素(Heat-labile enterotoxin)为形成五聚体(pentamer)的蛋白质,同样地,在大肠杆菌中难以表达水溶性而周知。该蛋白质与EPRS融合来确认表达的结果,确认与直接形式(direct form)相比,融合有EPRS的形式(form)进一步增加水溶性表达率。

图6为示出WHEP结构域与EPRS的融合形式的示意图。

图7为根据本发明的一实施例确认与COVID-19的受体结合区(RBD)和S1的EPRS融合表达的图像。

图8为根据本发明的一实施例确认与RSV F-细菌铁蛋白(RSV F-bacterioferritin)的EPRS融合表达的图像。

图9为根据本发明的一实施例确认与LTB-JEVED3的EPRS融合表达的图像。

图10示出处理TEV蛋白酶的EPRS-LTB的尺寸排除色谱法。

图11示出EPRS-LTB-JEVED3的尺寸排除色谱法。

图12示出处理TEV蛋白酶的EPRS-LTB-JEVED3的尺寸排除色谱法。

具体实施方式

本发明人确认在包括hEPRS的WHEP结构域的融合蛋白中,EPRS对于水溶性提高的贡献最大,从而完成了本发明。

根据本发明,提供可将WHEP结构域用作融合配偶体来提高靶蛋白的水溶性及折叠的肽、用于生产重组蛋白的表达载体或基因构建体。

在本发明中,“载体(vector)”指在DNA重组实验中,通过将所需的DNA片段引入至宿主细菌等并可增殖的DNA,还称为克隆载体(cloning vehicle),载体DNA利用限制酶等切割来开环,并向其插入所需的DNA片段并连接来引入至宿主细菌。连接所需的DNA片段的载体DNA随着宿主细菌的增殖而复制,在使细菌分裂的同时分配至各囊细胞来代代保持所需的DNA片段,例如,可使用质粒(plasmid)、噬菌体染色体。

只要是本申请所属技术领域的普通技术人员可容易实施上述的载体的选择、制备、转化及重组蛋白的表达等的方法,常规方法中的一部分变形也包括在本发明中。

在本发明中,“转化(transformation)”是指通过作为从外部提供的遗传物质的DNA在遗传上改变个体或细胞的性状。

上述载体的向宿主细胞内的转运(引入)可使用本领域周知的转运方法。上述转运方法可使用如显微注射法、磷酸钙沉淀法、电穿孔法、脂质体介导的转染法、基因轰击等,但并不限定于此。可利用PEG等的化学处理法、基因枪(gene gun)等。

当培养上述转化子时的培养条件可适当选择根据宿主细胞惯用的来利用。为了适合培养时的细胞的培育和蛋白质的大量生产,可适当调节温度、培养基的pH值及培养时间等的条件。

在本发明中,宿主细胞可利用本领域通常利用的宿主细胞,优选地,可利用大肠杆菌。

本发明的实施方式

以下,参照本发明的附图详细说明实施例。参照后述的实施例,就能明确本发明的优点、特征及实现这些优点及特征的方法。但是,本发明并不限定于以下所公开的实施例,能够以互不相同的实施方式实现,本实施例仅使本发明的公开更加完整,为了向本发明所属技术领域的普通技术人员完整地告知发明的范畴而提供,本发明仅由发明要求保护范围定义。在说明书全文中,相同的附图标记指相同的组件。

除非另行定义,否则在本说明书中使用的所有术语(包括技术术语及科学术语)能够以本发明所属技术领域的普通技术人员共同理解的含义使用。并且,除非明确地特别定义,否则被通常使用的词典定义的术语不应异常或过度地解释。在本说明书中使用的术语用于说明实施例,并不限制本发明。在本说明书中,除非特别提及,否则单数型包括复数型。

实施例1

使用pGE-LysRS表达载体作为蛋白质表达载体(Choi SI et al.,Proteinsolubility and folding enhancement by interaction with RNA,PLoS ONE(2008),3:e2677)。pGE-LysRS通过T7启动子(promote r)调节表达,使用位于Nde1和MCS(Kpn1-BamH1-EcoRV-Sal1-Hind3)的切割位置中的一个来切除LysRS,并向其位置插入TRS-1、TRS-2或EPRS来制备了pGE-TRS-1、pGE-TRS-2、pGE-EPRS表达载体。并且,向各表达载体的C-末端位置插入靶蛋白来制备了融合TRS-1、TRS-2、EPRS的靶蛋白表达载体(图1)。使用GFP、IFN-b、Tev蛋白酶、LTB作为靶蛋白。以这种方式制备的表达载体为pGE-GFP、pGE-TRS-1-GFP、pGE-TRS-2-GFP、pGE-EPRS-GFP、pGE-IFN-b、pGE-EPRS-IFN-b、pGE-Tev、pGE-EPRS-Tev、pGE-LTB及pGE-EPRS-LTB。

将制备的蛋白质表达载体转化至BL21(DE3)-pLysS或

将制备的pGE-GFP、pGE-TRS-1-GFP、pGE-TRS-2-GFP、pGE-EPRS-GFP、pGE-IFN-b、pGE-EPRS-IFN-b、pGE-Tev、pGE-EPRS-Tev表达载体转化至BL21(DE3)-pLysS水溶性细胞来培养。在包含50ug/ml的氨苄青霉素和34ug/ml的氯霉素的LB培养基中培养所有转化的大肠杆菌。若大肠杆菌的OD600值成为0.5以上,则为了激活T7启动子,以1mM的水平添加IPTG,并为了充分生产蛋白质,从添加IPTG之后开始,在30℃的温度下培养6小时。对充分培养的大肠杆菌进行离心分离来去除上清液后保存。

向收获的大肠杆菌的收获物添加PBS并进行超声波粉碎来制备裂解物。并且,对裂解物进行离心分离来仅获取水溶性部分后,利用Ni

进行了用于测量单位细胞所制备的GFP蛋白质活性的实验。在蛋白质表达结束后,向进行离心分离来去除上清液的大肠杆菌培养体添加PBS,并进行超声波粉碎来制备裂解物。之后,对裂解物进行离心分离来仅获得水溶性部分后,利用分光光度计测量荧光来测量GFP的实际活性(图2)。

绿色荧光蛋白(Green fluorescent protein,GFP)以作为在大肠杆菌内单独表达时以不溶性制备的蛋白质而周知。在大肠杆菌表达在没有融合蛋白的情况下单独表达的直接GFP和融合TRS-1、TRS-2、EPRS的融合蛋白后,确认表达特性的结果,在所有融合蛋白中示出水溶性表达率与直接GFP相比增加的特性,尤其,确认融合EPRS的GFP的水溶性表达率增加的非常高的结果。

测量每个培养容量表达的GFP的活性的结果,融合TRS-2的GFP示出与直接GFP相似水平的荧光活性,融合TRS-1、EPRS的GFP示出更高水平的荧光活性。

由此,确认通过TRS-1、TRS-2、EPRS增加作为靶蛋白的GFP的水溶性表达量,并确认制备的蛋白质具有活性。

利用HEK-Blue

干扰素β也为在大肠杆菌中以不溶性表达的蛋白质,没有融合蛋白的直接IFN-b示出在大肠杆菌中的水溶性表达率非常低的特征。当使用EPRS作为融合蛋白时,融合蛋白示出高水溶性表达率。

当利用HEK-BlueTM IFN-α/βCells(InvivoGen)测量纯化的IFN-b的活性时,在CHO细胞中表达及纯化的商业化(commercial)IFN-b示出最高的活性,融合EPRS的IFN-b融合蛋白示出下一个最高的活性。在直接IFN-b的情况下,示出最低的活性。

由此,确认通过EPRS促进IFN-b的水溶性及活性表达。

为了测量在大肠杆菌中表达的Tev蛋白酶的活性,使用SensoLyt

烟草蚀纹病毒(Tobacco Etch Virus,TEV)的蛋白酶为商业需求高的蛋白质,是一种在大肠杆菌中难以作为重组蛋白获得的蛋白质。当没有融合蛋白时,直接Tev蛋白酶在大肠杆菌中示出低的水溶性表达率,当融合EPRS时,示出水溶性表达率的上升效果。若在培养大肠杆菌时降低表达温度(20℃),则直接Tev蛋白酶和EPRS-Tev蛋白酶的水溶性表达率均增加,尤其,在EPRS-Tev蛋白酶的情况下,示出90%以上的水溶性表达率。

利用Tev蛋白酶活性分析试剂盒(

由此,确认通过EPRS的Tev蛋白酶的水溶性及活性表达。

实施例2

将作为靶蛋白的SARS-CoV-2(COVID-19)的受体结合区(receptor-bindingdomain,RBD)和大小相对大的高峰亚基1(spike subunit1,S1)来制备的载体为pGE-EPRS-RBD、pGE-EPRS-S1。

将制备的蛋白质表达载体分别转化至BL21或HMS174感应细胞来培养。在包含50ug/ml的氨苄青霉素的LB培养基中培养所有转化的大肠杆菌。若大肠杆菌的OD600值成为0.5以上,则为了激活T7启动子,添加0.5mM的IPTG后,在16℃的温度下培养16小时。对培养的大肠杆菌进行离心分离来去除上清液后,在-80℃的温度中保存。之后,向对应于5ml的LB培养基的大肠杆菌收获物添加0.3ml的裂解缓冲液(lysis buffer)(50mM的Tris-Cl(pH7.5)、300mM的NaCl、10%的甘油(glycerol)、2mM的β-巯基乙醇(beta-mercaptoethanol)、0.1%的吐温20(tween-20))并进行超声波粉碎,从而制备裂解物。并且,对裂解物进行离心分离来分为水溶性部分和不溶性部分,区分总裂解物、水溶性部分、不溶性部分并利用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳分析。RBD和S1的大小分别为27kDa和73kDa,融合EPRS的大小分别为49kDa和95kDa(参照图7)。

通过使用作为靶蛋白的呼吸道合胞病毒(Respiratory syncytial virus,RSV)融合(Fusion,F)和作为用于纳米颗粒(nanoparticle)的支架(scaffold)蛋白的细菌铁蛋白(bacterioferritin)制备的载体为pGE-EPRS-RSV F-细菌铁蛋白。

将制备的蛋白质表达载体转化至Shuffle T7感应细胞来培养。在包含50ug/ml的氨苄青霉素的LB培养基中培养所有转化的大肠杆菌。若大肠杆菌的OD600值成为0.5以上,则为了激活T7启动子,添加0.5mM的IPTG后,在20℃的温度下培养6小时。对培养的大肠杆菌进行离心分离来去除上清液后,在-80℃的温度下保存。之后,向对应于5ml的LB培养基的大肠杆菌收获物添加0.3ml的裂解缓冲液(50mM的Tris-Cl(pH 7.5)、200mM的NaCl、10%的甘油、0.1%的吐温20)并进行超声波粉碎,从而制备裂解物。并且,对裂解物进行离心分离来分为水溶性部分和不溶性部分,区分总裂解物、水溶性部分、不溶性部分并利用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳分析。RSV F-细菌铁蛋白的大小为70kDa,融合EPRS的大小为92kDa(参照图8)。

使用作为靶蛋白的在日本脑炎病毒结构内5倍轴以五聚体存在且在免疫诱导中起到重要作用而周知的包膜蛋白(envelope protein)的结构域III(ED3)和作为五聚体支架(pentameric scaffold)的不耐热肠毒素B亚单位(heat-labile toxin B subunit,LTB)制备的载体为pGE-EPRS-LTB-JEVED3。

将制备的蛋白质表达载体转化在Shuffle T7感应细胞来培养。在包含50ug/ml的氨苄青霉素的LB培养基中培养所有转化的大肠杆菌。若大肠杆菌的OD600值成为0.5以上,则为了激活T7启动子,添加1mM的IPTG后,在20℃的温度下培养6小时。对培养的大肠杆菌进行离心分离来去除上清液后,在-80℃的温度下保存。之后,向对应于5ml的LB培养基的大肠杆菌收获物添加0.3ml的裂解缓冲液(50mM的Tris-Cl(pH 7.5)、300mM的NaCl、10%的甘油)并进行超声波粉碎,从而制备裂解物。并且,对裂解物进行离心分离来分为水溶性部分和不溶性部分,区分总裂解物、水溶性部分、不溶性部分并利用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳进行分析。LTB-JEVED3的大小为24kDa,融合EPRS的大小为46kDa(参照图9)。

在包含50ug/ml的氨苄青霉素的LB培养基中培养在Shuffle T7感应细胞中转化的pGE-EPRS-LTB、pGE-EPRS-LTB-JEVED3表达载体。若大肠杆菌的OD600值成为0.5以上,则以1mM水平添加IPTG后,在20℃的温度下培养6小时。对充分培养的大肠杆菌进行离心分离来去除上清液后,在-80℃的温度下保存。

向收获的大肠杆菌添加A缓冲液(50mM的Tris-Cl(pH 7.5),300mM的NaCl、10%的甘油、5mM的咪唑(imidazole))后进行超声波粉碎,从而制备裂解物。并且,对裂解物进行离心分离来仅获得水溶性部分后,利用镍色谱法纯化,在储存缓冲液(storage buffer)(50mM的Tris-Cl(pH 7.5)、300mM的NaCl、0.1mM的EDTA)中透析纯化的蛋白质,并利用amicon浓缩。

为了验证纯化的EPRS-LTB和EPRS-LTB-JEVED3蛋白质是否形成五聚体结构,利用Superdex200 increase 10/300column(GE health care)进行尺寸排除色谱法(size-exclusion chromatography;SEC),利用已知大小的标志物蛋白进行校准(calibration)来测量蛋白质的尺寸。此时使用的组成为[50mM的Tris-Cl(pH 7.5)、300mM的NaCl]。针对蛋白质,对融合EPRS的和通过处理TEV蛋白酶而位于EPRS与靶蛋白之间的tev切割位点被切割而去除EPRS的蛋白质均验证。利用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳再次验证在五聚体大小中有峰值(peak)的部分。

结果,各个蛋白质在五聚体预测尺寸中示出峰值(参照图10至图12,左图部分),当以在十二烷基硫酸钠-聚丙烯酰胺凝胶电泳中具有DTT的还原(reduced)状态和没有DTT的非还原(non-reduced)状态观察其峰值部分时,确认在相似的尺寸中示出带(参照图10至图12,右图部分)。当形成五聚体时,针对各个尺寸,LTB约为60kDa,EPRS-LTB-JEVED3约为230kDa,LTB-JEVED3约为125kDa。因此,由于EPRS的融合,不仅可提高大肠杆菌中的靶蛋白的水溶性,还可诱导蛋白质的适当折叠,从而确认可折叠为多聚体。

序列表目录

SEQ ID NO:1

TRS1

LYNRVAVQGDVVRELKAKKAPKEDVDAAVKQLLSLKAEYKEKTGQEYKPGNPP

SEQ ID NO:2

TRS1

LYDEVAAQGEVVRKLKAEKSPKAKINEAVECLLSLKAQYKEKTGKEYIPGQPP

SEQ ID NO:3

TRS3

LFDKVASQGEVVRKLKTEKAPKDQVDIAVQELLQLKAQYKSLIGVEYKP

SEQ ID NO:4

AEIGQNISSNSSASILESKS

SEQ ID NO:5

LSQSSDSSPTRNSEPAGLETPEAKV

SEQ ID NO:6

EPRS序列

LYNRVAVQGDVVRELKAKKAPKEDVDAAVKQLLSLKAEYKEKTGQEYKPGNPPAEIGQNISSNSSASILESKSLYDEVAAQGEVVRKLKAEKSPKAKINEAVECLLSLKAQYKEKTGKEYIPGQPPLSQSSDSSPTRNSEPAGLETPEAKVLFDKVASQGEVVRKLKTEKAPKDQVDIAVQELLQLKAQYKSLIGVEYKP

SEQ ID NO:7

COVID-19RBD

FTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNF

SEQ ID NO:8

COVID-19S1

QCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIG

SEQ ID NO:9

不耐热肠毒素B亚单位

APQTITELCSEYRNTQIYTINDKILSYTESMAGKREMVIITFKSGETFQVEVPGSQHIDSQKKAIERMKDTLRITYLTETKIDKLCVWNNKTPNSIAAISMKN

SEQ ID NO:10

细菌铁蛋白

MKGDTKVINYLNKLLGNELVAINQYFLHARMFKNWGLKRLNDVEYHESIDEMKHADRYIERILFLEGLPNLQDLGKLNIGEDVEEMLRSDLALELDGAKNLREAIGYADSVHDYVSRDMMIEILRDEEGHIDWLETELDLIQKMGLQNYLQAQIREEG

SEQ ID NO:11

RSV F

QNITEEFYQSTCSAVSKGYLSALRTGWYTSVITIELSNIKENKCNGTDAKVKLIKQELDKYKNAVTELQLLMQSTPPTNNRARRGGSGGSGGSGFLGFLLGVGSAIASGVAVCKVLHLEGEVNKIKSALLSTNKAVVSLSNGVSVLTFKVLDLKNYIDKQLLPILNKQSCSISNIETVIEFQQKNNRLLEITREFSVNAGVTTPVSTYMLTNSELLSLINDMPITNDQKKLMSNNVQIVRQQSYSIMCIIKEEVLAYVVQLPLYGVIDTPCWKLHTSPLCTTNTKEGSNICLTRTDRGWYCDNAGSVSFFPQAETCKVQSNRVFCDTMNSLTLPSEINLCNVDIFNPKYDCKIMTSKTDVSSSVITSLGAIVSCYGKTKCTASNKNRGIIKTFSNGCDYVSNKGMDTVSVGNTLYYVNKQEGKSLYVKGEPIINFYDPLVFPSDEFDASISQVNEKINQSLAFIRKSDELL

SEQ ID NO:12

JEV包膜结构域III(ED3)

KGTTYGMCTEKFSFAKNPADTGHGTVVIELSYSGSDGPCKIPIVSVASLNDMTPVGRLVTVNPFVATSSANSKVLVEMEPPFGDSYIVVGRGDKQINHHWHKAG

<110> 延世大学校产学协力团

<120> 通过融合WHEP结构域来提高靶蛋白的水溶性的方法

<130> 1068672

<150> KR 10-2019-0171057

<151> 2019-12-19

<160> 12

<170> KoPatentIn 3.0

<210> 1

<211> 53

<212> PRT

<213> 人工序列

<220>

<223> TRS1

<400> 1

Leu Tyr Asn Arg Val Ala Val Gln Gly Asp Val Val Arg Glu Leu Lys

1 5 10 15

Ala Lys Lys Ala Pro Lys Glu Asp Val Asp Ala Ala Val Lys Gln Leu

20 25 30

Leu Ser Leu Lys Ala Glu Tyr Lys Glu Lys Thr Gly Gln Glu Tyr Lys

35 40 45

Pro Gly Asn Pro Pro

50

<210> 2

<211> 53

<212> PRT

<213> 人工序列

<220>

<223> TRS2

<400> 2

Leu Tyr Asp Glu Val Ala Ala Gln Gly Glu Val Val Arg Lys Leu Lys

1 5 10 15

Ala Glu Lys Ser Pro Lys Ala Lys Ile Asn Glu Ala Val Glu Cys Leu

20 25 30

Leu Ser Leu Lys Ala Gln Tyr Lys Glu Lys Thr Gly Lys Glu Tyr Ile

35 40 45

Pro Gly Gln Pro Pro

50

<210> 3

<211> 49

<212> PRT

<213> 人工序列

<220>

<223> TRS3

<400> 3

Leu Phe Asp Lys Val Ala Ser Gln Gly Glu Val Val Arg Lys Leu Lys

1 5 10 15

Thr Glu Lys Ala Pro Lys Asp Gln Val Asp Ile Ala Val Gln Glu Leu

20 25 30

Leu Gln Leu Lys Ala Gln Tyr Lys Ser Leu Ile Gly Val Glu Tyr Lys

35 40 45

Pro

<210> 4

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 连接基团 1

<400> 4

Ala Glu Ile Gly Gln Asn Ile Ser Ser Asn Ser Ser Ala Ser Ile Leu

1 5 10 15

Glu Ser Lys Ser

20

<210> 5

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> 连接基团 2

<400> 5

Leu Ser Gln Ser Ser Asp Ser Ser Pro Thr Arg Asn Ser Glu Pro Ala

1 5 10 15

Gly Leu Glu Thr Pro Glu Ala Lys Val

20 25

<210> 6

<211> 200

<212> PRT

<213> 人工序列

<220>

<223> EPRS

<400> 6

Leu Tyr Asn Arg Val Ala Val Gln Gly Asp Val Val Arg Glu Leu Lys

1 5 10 15

Ala Lys Lys Ala Pro Lys Glu Asp Val Asp Ala Ala Val Lys Gln Leu

20 25 30

Leu Ser Leu Lys Ala Glu Tyr Lys Glu Lys Thr Gly Gln Glu Tyr Lys

35 40 45

Pro Gly Asn Pro Pro Ala Glu Ile Gly Gln Asn Ile Ser Ser Asn Ser

50 55 60

Ser Ala Ser Ile Leu Glu Ser Lys Ser Leu Tyr Asp Glu Val Ala Ala

65 70 75 80

Gln Gly Glu Val Val Arg Lys Leu Lys Ala Glu Lys Ser Pro Lys Ala

85 90 95

Lys Ile Asn Glu Ala Val Glu Cys Leu Leu Ser Leu Lys Ala Gln Tyr

100 105 110

Lys Glu Lys Thr Gly Lys Glu Tyr Ile Pro Gly Gln Pro Pro Leu Ser

115 120 125

Gln Ser Ser Asp Ser Ser Pro Thr Arg Asn Ser Glu Pro Ala Gly Leu

130 135 140

Glu Thr Pro Glu Ala Lys Val Leu Phe Asp Lys Val Ala Ser Gln Gly

145 150 155 160

Glu Val Val Arg Lys Leu Lys Thr Glu Lys Ala Pro Lys Asp Gln Val

165 170 175

Asp Ile Ala Val Gln Glu Leu Leu Gln Leu Lys Ala Gln Tyr Lys Ser

180 185 190

Leu Ile Gly Val Glu Tyr Lys Pro

195 200

<210> 7

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> COVID-19 RBD

<400> 7

Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln

1 5 10 15

Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro

20 25 30

Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp

35 40 45

Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr

50 55 60

Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr

65 70 75 80

Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val

85 90 95

Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys

100 105 110

Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val

115 120 125

Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr

130 135 140

Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu

145 150 155 160

Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn

165 170 175

Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe

180 185 190

Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu

195 200 205

Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys

210 215 220

Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe

225 230 235

<210> 8

<211> 654

<212> PRT

<213> 人工序列

<220>

<223> COVID-19 S1

<400> 8

Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr

1 5 10 15

Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser

20 25 30

Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn

35 40 45

Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys

50 55 60

Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala

65 70 75 80

Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr

85 90 95

Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn

100 105 110

Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu

115 120 125

Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe

130 135 140

Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln

145 150 155 160

Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu

165 170 175

Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser

180 185 190

Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser

195 200 205

Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg

210 215 220

Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp

225 230 235 240

Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr

245 250 255

Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile

260 265 270

Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys

275 280 285

Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn

290 295 300

Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr

305 310 315 320

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser

325 330 335

Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr

340 345 350

Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly

355 360 365

Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala

370 375 380

Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly

385 390 395 400

Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

405 410 415

Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val

420 425 430

Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu

435 440 445

Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser

450 455 460

Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln

465 470 475 480

Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg

485 490 495

Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys

500 505 510

Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe

515 520 525

Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys

530 535 540

Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr

545 550 555 560

Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro

565 570 575

Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser

580 585 590

Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro

595 600 605

Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser

610 615 620

Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala

625 630 635 640

Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly

645 650

<210> 9

<211> 103

<212> PRT

<213> 人工序列

<220>

<223> 不耐热肠毒素B亚单位(LTB)

<400> 9

Ala Pro Gln Thr Ile Thr Glu Leu Cys Ser Glu Tyr Arg Asn Thr Gln

1 5 10 15

Ile Tyr Thr Ile Asn Asp Lys Ile Leu Ser Tyr Thr Glu Ser Met Ala

20 25 30

Gly Lys Arg Glu Met Val Ile Ile Thr Phe Lys Ser Gly Glu Thr Phe

35 40 45

Gln Val Glu Val Pro Gly Ser Gln His Ile Asp Ser Gln Lys Lys Ala

50 55 60

Ile Glu Arg Met Lys Asp Thr Leu Arg Ile Thr Tyr Leu Thr Glu Thr

65 70 75 80

Lys Ile Asp Lys Leu Cys Val Trp Asn Asn Lys Thr Pro Asn Ser Ile

85 90 95

Ala Ala Ile Ser Met Lys Asn

100

<210> 10

<211> 158

<212> PRT

<213> 人工序列

<220>

<223> 细菌铁蛋白

<400> 10

Met Lys Gly Asp Thr Lys Val Ile Asn Tyr Leu Asn Lys Leu Leu Gly

1 5 10 15

Asn Glu Leu Val Ala Ile Asn Gln Tyr Phe Leu His Ala Arg Met Phe

20 25 30

Lys Asn Trp Gly Leu Lys Arg Leu Asn Asp Val Glu Tyr His Glu Ser

35 40 45

Ile Asp Glu Met Lys His Ala Asp Arg Tyr Ile Glu Arg Ile Leu Phe

50 55 60

Leu Glu Gly Leu Pro Asn Leu Gln Asp Leu Gly Lys Leu Asn Ile Gly

65 70 75 80

Glu Asp Val Glu Glu Met Leu Arg Ser Asp Leu Ala Leu Glu Leu Asp

85 90 95

Gly Ala Lys Asn Leu Arg Glu Ala Ile Gly Tyr Ala Asp Ser Val His

100 105 110

Asp Tyr Val Ser Arg Asp Met Met Ile Glu Ile Leu Arg Asp Glu Glu

115 120 125

Gly His Ile Asp Trp Leu Glu Thr Glu Leu Asp Leu Ile Gln Lys Met

130 135 140

Gly Leu Gln Asn Tyr Leu Gln Ala Gln Ile Arg Glu Glu Gly

145 150 155

<210> 11

<211> 471

<212> PRT

<213> 人工序列

<220>

<223> RSV F

<400> 11

Gln Asn Ile Thr Glu Glu Phe Tyr Gln Ser Thr Cys Ser Ala Val Ser

1 5 10 15

Lys Gly Tyr Leu Ser Ala Leu Arg Thr Gly Trp Tyr Thr Ser Val Ile

20 25 30

Thr Ile Glu Leu Ser Asn Ile Lys Glu Asn Lys Cys Asn Gly Thr Asp

35 40 45

Ala Lys Val Lys Leu Ile Lys Gln Glu Leu Asp Lys Tyr Lys Asn Ala

50 55 60

Val Thr Glu Leu Gln Leu Leu Met Gln Ser Thr Pro Pro Thr Asn Asn

65 70 75 80

Arg Ala Arg Arg Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Phe Leu

85 90 95

Gly Phe Leu Leu Gly Val Gly Ser Ala Ile Ala Ser Gly Val Ala Val

100 105 110

Cys Lys Val Leu His Leu Glu Gly Glu Val Asn Lys Ile Lys Ser Ala

115 120 125

Leu Leu Ser Thr Asn Lys Ala Val Val Ser Leu Ser Asn Gly Val Ser

130 135 140

Val Leu Thr Phe Lys Val Leu Asp Leu Lys Asn Tyr Ile Asp Lys Gln

145 150 155 160

Leu Leu Pro Ile Leu Asn Lys Gln Ser Cys Ser Ile Ser Asn Ile Glu

165 170 175

Thr Val Ile Glu Phe Gln Gln Lys Asn Asn Arg Leu Leu Glu Ile Thr

180 185 190

Arg Glu Phe Ser Val Asn Ala Gly Val Thr Thr Pro Val Ser Thr Tyr

195 200 205

Met Leu Thr Asn Ser Glu Leu Leu Ser Leu Ile Asn Asp Met Pro Ile

210 215 220

Thr Asn Asp Gln Lys Lys Leu Met Ser Asn Asn Val Gln Ile Val Arg

225 230 235 240

Gln Gln Ser Tyr Ser Ile Met Cys Ile Ile Lys Glu Glu Val Leu Ala

245 250 255

Tyr Val Val Gln Leu Pro Leu Tyr Gly Val Ile Asp Thr Pro Cys Trp

260 265 270

Lys Leu His Thr Ser Pro Leu Cys Thr Thr Asn Thr Lys Glu Gly Ser

275 280 285

Asn Ile Cys Leu Thr Arg Thr Asp Arg Gly Trp Tyr Cys Asp Asn Ala

290 295 300

Gly Ser Val Ser Phe Phe Pro Gln Ala Glu Thr Cys Lys Val Gln Ser

305 310 315 320

Asn Arg Val Phe Cys Asp Thr Met Asn Ser Leu Thr Leu Pro Ser Glu

325 330 335

Ile Asn Leu Cys Asn Val Asp Ile Phe Asn Pro Lys Tyr Asp Cys Lys

340 345 350

Ile Met Thr Ser Lys Thr Asp Val Ser Ser Ser Val Ile Thr Ser Leu

355 360 365

Gly Ala Ile Val Ser Cys Tyr Gly Lys Thr Lys Cys Thr Ala Ser Asn

370 375 380

Lys Asn Arg Gly Ile Ile Lys Thr Phe Ser Asn Gly Cys Asp Tyr Val

385 390 395 400

Ser Asn Lys Gly Met Asp Thr Val Ser Val Gly Asn Thr Leu Tyr Tyr

405 410 415

Val Asn Lys Gln Glu Gly Lys Ser Leu Tyr Val Lys Gly Glu Pro Ile

420 425 430

Ile Asn Phe Tyr Asp Pro Leu Val Phe Pro Ser Asp Glu Phe Asp Ala

435 440 445

Ser Ile Ser Gln Val Asn Glu Lys Ile Asn Gln Ser Leu Ala Phe Ile

450 455 460

Arg Lys Ser Asp Glu Leu Leu

465 470

<210> 12

<211> 104

<212> PRT

<213> 人工序列

<220>

<223> JEV包膜结构域III(ED3)

<400> 12

Lys Gly Thr Thr Tyr Gly Met Cys Thr Glu Lys Phe Ser Phe Ala Lys

1 5 10 15

Asn Pro Ala Asp Thr Gly His Gly Thr Val Val Ile Glu Leu Ser Tyr

20 25 30

Ser Gly Ser Asp Gly Pro Cys Lys Ile Pro Ile Val Ser Val Ala Ser

35 40 45

Leu Asn Asp Met Thr Pro Val Gly Arg Leu Val Thr Val Asn Pro Phe

50 55 60

Val Ala Thr Ser Ser Ala Asn Ser Lys Val Leu Val Glu Met Glu Pro

65 70 75 80

Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg Gly Asp Lys Gln Ile

85 90 95

Asn His His Trp His Lys Ala Gly

100

技术分类

06120114713065