掌桥专利:专业的专利平台
掌桥专利
首页

一种截短的发热伴血小板减少综合征病毒Gn蛋白及其应用

文献发布时间:2023-06-19 11:42:32



技术领域

本申请涉及基因工程和分子生物学领域,具体涉及截短的发热伴血小板减少综合征病毒Gn蛋白,包含所述截短的Gn蛋白的融合蛋白,包含编码所述截短的Gn蛋白或融合蛋白的核苷酸序列的核酸分子,以及包含所述核酸分子的载体和宿主细胞。此外,本申请还涉及包含所述截短的Gn蛋白、融合蛋白、核酸分子或载体的药物组合物。

背景技术

发热伴血小板减少综合征(severe fever with thrombocytopenia syndrome,SFTS)是一种急性传染性疾病,由发热伴血小板减少综合征布尼亚病毒(severe feverwith thrombocytopenia syndrome bunyavirus,SFTSV)感染所致。SFTSV隶属于布尼亚病毒科白蛉病毒属,主要通过蜱虫传播,可人传人,2009年在中国首次被发现,近年来已在大半个中国地区流行传播,致数千人患病甚至死亡。

WHO将SFTS列为2017年优先关注的传染性疾病。目前针对该病没有特效药物,也没有有效的疫苗可供预防,对患者主要采取对症支持治疗和使用利巴韦林(病毒唑)等进行广谱抗病毒治疗,并且,有研究表明单纯用该药对重症病例(死亡病例)并无多大效果,其血小板计数和病毒载量治疗前后几乎无变化。

目前针对该疾病没有获批的治疗药品或者疫苗,也没有进入临床试验的品种。针对该种病毒疾病,疫苗是比较有前景的预防方式,其中,前期研究试验报道的代表性的主要有DNA疫苗(Development of a SFTSV DNA vaccine that confers complete protectionagainst lethal infection in ferrets.Nature Communications,2019),虽然取得了不错的效果,但其使用多种质粒混合使用,并且用量较大。比如采用了5种质粒免疫小鼠,每种质粒采用40ug的剂量,合计200ug,如推算到人的剂量共约40mg。剂量过大,一方面导致生产成本高,病人用药费用高,负担重;另一方面高剂量用药导致引入的杂质更多,可能会导致毒副作用的增大,从而增加了临床风险,成药性非常难以实现。

因此,为了提高临床治疗效果,减少用量,需要开发可进一步提高抗原表达量、大幅度降低临床使用剂量的SFTSV DNA疫苗。

发明内容

在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。

如本文中所使用的,术语“SFTSV”为“发热伴血小板减少综合征布尼亚病毒(severe fever with thrombocytopenia syndrome bunyavirus)”的简称,其属于布尼亚病毒科白蛉病毒属,为负链 RNA病毒。SFTSV的基因组序列是本领域技术人员已知的,可参见例如GenBank:HM745931.1。SFTSV含有2种包膜糖蛋白,分别为Gn和Gc蛋白,在病毒感染细胞过程中Gn蛋白起着更为重要的作用。目前,SFTSV在世界范围内已经鉴定出8个基因型,分别为 C1、C2、C3、C4、C5、J1、J2、J3(Phylogenetic and Geographic Relationships ofSevere Fever With Thrombocytopenia Syndrome Virus in China,South Korea,andJapan.J Infect Dis,2015,212:889-98)。

如本文中所使用的,术语“Gn包膜糖蛋白”和“Gn蛋白”是指SFTSV的一种包膜糖蛋白,它们具有相同的含义,可互换使用。在SFTS的相关研究及疫苗治疗中,Gn蛋白可作为抗原,在本文中也简称为“Gn抗原”。

如本文中所使用的,术语“截短的Gn蛋白”是指,在野生型 Gn蛋白的N端和/或C端去掉一个或者多个氨基酸后产生的蛋白质,其中,野生型Gn蛋白的具体氨基酸序列可从公共数据库(例如GenBank数据库)获得,例如,如GenBank登录号HM745931.1 (HB29株)、BAN58192.1(SPL035A株)、BAN58191.1 (SPL032A株)或BAN58187.1(SPL004A株)所示的氨基酸序列。

在本发明中,SFTSV Gn蛋白的示例性氨基酸序列如SEQ ID NO:1所示。因此,在本发明中,当涉及Gn蛋白的序列时,其使用 SEQ ID NO:1所示的序列来进行描述。例如,表述“Gn蛋白的C 末端24个氨基酸”是指,SEQ ID NO:1中最靠近C末端的24个氨基酸。然而,本领域技术人员理解,可在SEQ ID NO:1中天然产生或人工引入突变或变异(包括但不限于,置换,缺失和/或添加),而不影响Gn蛋白的生物学特性。例如,SFTSV的不同病毒株的Gn 蛋白可在氨基酸序列上天然存在差异,但具有实质上相同的生物学特性。因此,在本发明中,术语“Gn蛋白”意欲包括所有此类多肽和变体,包括SEQ ID NO:1所示的多肽以及其天然或人工的变体,所述变体保留了Gn蛋白的生物学特性。并且,当描述Gn蛋白的序列片段和氨基酸位置时,其不仅包括SEQ ID NO:1所示的多肽的序列片段和氨基酸位置,还包括该多肽的天然或人工变体中的相应序列片段和氨基酸位置。例如,表述“Gn蛋白的C末端24个氨基酸”意欲包括,SEQ ID NO:1的C末端24个氨基酸,以及SEQ ID NO:1 所示的多肽的变体(天然或人工)中与SEQ ID NO:1的C末端24 个氨基酸处于相应氨基酸位置的氨基酸残基。

如本文所使用的,表述“相应序列片段”或“相应片段”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中位于等同位置的片段。根据本发明,表述“相应氨基酸位置”是指,当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性时,进行比较的序列中位于等同位置的氨基酸位点/残基。

如本文所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT 共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAstar,Inc.)方便地进行的 Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.Appl Biosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residuetable)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入 GCG软件包(可在www.gcg.com上获得)的GAP程序中的 Needleman和Wunsch(J MoI Biol.48:444-453(1970))算法,使用 Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。

如本文所使用的,术语“SFTS”为“发热伴血小板减少综合征”的简称,其指,因SFTSV感染而导致的系列征候或症状,临床表现以发热伴血小板减少为主要特征。

如本文中所使用的,术语“载体”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。

如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如酵母细胞或曲霉菌等的真菌细胞,如S2果蝇细胞或Sf9等的昆虫细胞,或者如纤维原细胞,CHO细胞,COS细胞,NSO细胞,HeLa细胞,BHK细胞,HEK 293细胞或人细胞等的动物细胞。

本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、分离的核酸分子等。

根据本发明,术语“药学可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington'sPharmaceutical Sciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company, 1995),并且包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂包括但不限于磷酸盐缓冲液;表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween- 80;佐剂包括但不限于铝佐剂(例如氢氧化铝),弗氏佐剂(例如完全弗氏佐剂);离子强度增强剂包括但不限于氯化钠。

根据本发明,术语“佐剂”是指非特异性免疫增强剂,当其与抗原一起或预先递送入机体时,其可增强机体对抗原的免疫应答或改变免疫应答类型。佐剂有很多种,包括但不限于铝佐剂(例如氢氧化铝)、弗氏佐剂(例如完全弗氏佐剂和不完全弗氏佐剂)、短小棒状杆菌、脂多糖、细胞因子等。弗氏佐剂是目前动物试验中最常用的佐剂。氢氧化铝佐剂则在临床实验中使用较多。在本发明中,特别优选地,佐剂为铝佐剂。

根据本发明,术语“有效量”是指能够有效实现预期目的的量。例如,预防或治疗疾病(例如SFTSV感染)有效量是指,能够有效预防、阻止或延迟疾病(例如SFTSV感染)的发生、或缓解、减轻或治疗已有的疾病(例如由SFTSV感染所导致的疾病)的严重程度的量。测定这样的有效量在本领域技术人员的能力范围之内。例如,对于治疗用途有效的量将取决于待治疗的疾病的严重度、患者自己的免疫系统的总体状态、患者的一般情况例如年龄,体重和性别,药物的施用方式,以及同时施用的其他治疗等等。

在本发明中,术语“多肽”和“蛋白质”具有相同的含义,可互换使用。并且在本发明中,氨基酸通常用本领域公知的单字母和三字母缩写来表示。例如,丙氨酸可用A或Ala表示。

如本文中使用的,“受试者”是指动物,例如脊椎动物。优选地,受试者为哺乳动物,例如人,牛科动物,马科动物,猫科动物,犬科动物,啮齿类动物或灵长类动物。特别优选地,受试者为人。在本文中,该术语可以与“患者”互换使用。

在第一方面,本申请提供了一种截短的发热伴血小板减少综合征布尼亚病毒(SFTSV)的Gn蛋白,其与天然的Gn蛋白相比,C末端截短了24个氨基酸。

在某些实施方案中,所述SFTSV是C1、C2、C3、C4、C5、J1、J2、J3基因型。在某些实施方案中,所述SFTSV是SFTSV的临床分离株,例如选自下列的分离株:SFTSV HB29/China/2010,SFTSV CB1/South Korea/2014,SFTSV KAJNH2/South Korea/2013,SFTSV ZJZHSH-FDE/China/2012,SFTSV KADGH/South Korea/2013, SFTSV SPL035A/Japan,SFTSVSPL032A/Japan,SFTSV SPL004A/ Japan等。

在某些实施方案中,所述天然的Gn蛋白的氨基酸序列如SEQ ID NO:1所示。

在某些实施方案中,所述截短的Gn蛋白的氨基酸序列如SEQ ID NO:3所示。

在第二方面,本申请提供了一种融合蛋白,其包含如上所述的截短的Gn蛋白以及另外的多肽。在本申请的某些实施方案中,所述融合蛋白不是天然存在的蛋白或其片段。在某些实施方案中,所述另外的多肽相对于所述截短的Gn蛋白是异源的。

在某些实施方案中,所述另外的多肽任选地通过接头(例如肽接头)连接至所述截短的Gn蛋白的N端或C端。这类接头(例如肽接头)是本领域熟知的,其实例包括但不限于,包含一个或多个(例如, 1个,2个,3个,4个或5个)氨基酸(如,Gly或Ser)的肽接头。在某些实施方案中,所述肽接头是柔性的。在某些实施方案中,柔性的肽接头可能是有利的,其能够连接两种蛋白/多肽成分,并且保持其各自的活性和功能。此类肽接头包括但不限于,(GGGGS)

在某些实施方案中,所述另外的多肽选自标签、信号肽或导肽、可检测的标记(例如,荧光素酶(fluc)、绿色荧光蛋白(GFP)),或其任何组合。在某些实施方案中,可以将本申请的截短的Gn蛋白与标签序列连接,以便于本申请的截短的Gn蛋白的表达、检测和/或纯化。在某些实施方案中,可以将本申请的截短的Gn蛋白与信号肽或导肽序列连接,以引导本申请的截短的Gn蛋白的分泌。在某些实施方案中,可以将本申请的截短的Gn蛋白与可检测的标记序列连接,以便于对本申请的截短的Gn蛋白进行检测或示踪。

在某些实施方案中,所述信号肽选自Gn蛋白的天然信号肽、HGF (肝细胞生长因子)的天然信号肽和IgE(免疫球蛋白E)的天然信号肽。在某些实施方案中,所述信号肽具有选自下列的氨基酸序列:SEQ ID NO:10,SEQ ID NO:13,和SEQ ID NO:14。

本领域技术人员可以理解,本文意在涵盖的信号肽包括但不限于上述列举的信号肽,本领域技术人员已知如何根据期望目的(例如,蛋白的分泌或引导)选择合适的信号肽。

在某些实施方案中,所述融合蛋白具有选自下列的氨基酸序列: SEQ ID NO:15和SEQ ID NO:16。

在第三方面,本申请提供了一种核酸分子,其包含编码如前所述的截短的Gn蛋白或者如前所述的融合蛋白的核苷酸序列。

在某些实施方案中,所述编码截短的Gn蛋白或融合蛋白的核苷酸序列是根据宿主细胞(例如,人细胞)的密码子偏好性进行了密码子优化的或是未进行优化的。

在某些实施方案中,所述核酸分子具有选自下列的核苷酸序列: SEQ ID NO:5,SEQ ID NO:7,和SEQ ID NO:9。

在某些实施方案中,所述核酸分子为DNA。

在第四方面,本申请提供了一种载体,其包含如前所述的核酸分子。

在某些实施方案中,所述载体选自质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体;以及,病毒载体,例如逆转录酶病毒载体(例如慢病毒载体)、腺病毒载体、腺相关病毒载体、疱疹病毒载体(如单纯疱疹病毒载体)、痘病毒载体、杆状病毒载体、乳头瘤病毒载体、乳头多瘤空泡病毒载体。

在某些实施方案中,所述载体用于表达(例如在受试者(例如哺乳动物,例如人)体内表达)所述截短的Gn蛋白或者所述融合蛋白。

在某些实施方案中,所述载体是用于基因治疗的载体,例如质粒,腺病毒载体,腺相关病毒载体,和慢病毒载体。

在第五方面,本申请提供了一种宿主细胞,其包含根据如前所述的核酸分子或根据如前所述的载体。

在某些实施方案中,所述宿主细胞选自原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞。

在某些实施方案中,所述动物细胞为哺乳动物的细胞,例如小鼠细胞、人细胞等。

在某些实施方案中,所述哺乳动物的细胞为人的细胞,例如,造血细胞,上皮细胞,肝细胞,肿瘤细胞,神经细胞。

在某些实施方案中,所述宿主细胞是大肠杆菌细胞,例如大肠杆菌 DH5α细胞;或者所述宿主细胞是人细胞(例如,293T细胞)。

在第六方面,本申请提供了一种表达或产生如前所述的截短的Gn 蛋白或者如前所述的融合蛋白的方法,所述方法包括,使用根据如前所述的核酸分子或根据如前所述的载体或根据如前所述的宿主细胞。

在某些实施方案中,所述方法包括,在允许蛋白表达的条件下,在宿主细胞中表达根据如前所述的核酸分子或根据如前所述的载体;以及任选地,回收宿主细胞中表达的截短的Gn蛋白或者所述融合蛋白。

在第七方面,本申请提供了根据如前所述的核酸分子或根据如前所述的载体或根据如前所述的宿主细胞用于表达或产生所述截短的Gn蛋白或者所述融合蛋白的用途。在某些优选的实施方案中,所述的核酸分子或载体用于在体外表达或产生所述截短的Gn蛋白或者所述融合蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在细胞内表达或产生所述截短的Gn蛋白或者所述融合蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在体外、在细胞内表达或产生所述截短的Gn蛋白或者所述融合蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在体内表达或产生所述截短的Gn蛋白或者所述融合蛋白。在某些优选的实施方案中,所述的核酸分子或载体用于在受试者 (例如哺乳动物,例如人)体内表达或产生所述截短的Gn蛋白或者所述融合蛋白。

在第八方面,本申请提供了一种药物组合物,其含有根据如前所述的截短的Gn蛋白或者根据如前所述的融合蛋白或根据如前所述的核酸分子或根据如前所述的载体,以及任选地,药学上可接受的载体和/或赋形剂。

在某些实施方案中,所述药物组合物通过注射进行施用。

在某些实施方案中,所述药物组合物为注射液或冻干粉剂。

在某些实施方案中,所述截短的Gn蛋白或者所述融合蛋白或核酸分子或载体以有效量(例如预防或治疗有效量)存在。

在某些实施方案中,所述的药物组合物以单位剂量形式存在。

在某些实施方案中,所述药物组合物为疫苗。

在某些实施方案中,所述药物组合物还包含佐剂。

在某些实施方案中,所述药物组合物为蛋白疫苗,其含有如前所述的截短的Gn蛋白或者如前所述的融合蛋白。

在某些实施方案中,所述药物组合物为核酸疫苗,其含有如前所述的核酸分子或如前所述的载体。

在某些实施方案中,所述核酸疫苗为DNA疫苗。

在第九方面,本申请提供了一种制备如前所述的药物组合物的方法,所述方法包括将如前所述的截短的Gn蛋白或者如前所述的融合蛋白或如前所述的核酸分子或如前所述的载体与药学可接受的载体和/或赋形剂(例如,佐剂)混合。

在第十方面,本申请提供了根据如前所述的截短的Gn蛋白或者根据如前所述的融合蛋白或根据如前所述的核酸分子或根据如前所述的载体在制备药物组合物中的用途,所述药物组合物用于在受试者中预防或治疗SFTSV感染或由SFTSV感染所导致的疾病(例如SFTS)。

在某些实施方案中,所述受试者为哺乳动物,例如人。

在某些实施方案中,所述药物组合物通过注射来进行施用。

在某些实施方案中,所述药物组合物为注射液或冻干粉剂。

在某些实施方案中,所述药物组合物包含有效量(例如预防或治疗 SFTSV感染或由SFTSV感染所导致的疾病的有效量)的所述截短的Gn蛋白或者所述融合蛋白或核酸分子或载体。

在某些实施方案中,所述的药物组合物以单位剂量形式存在。

在某些实施方案中,所述药物组合物为疫苗。

在某些实施方案中,所述药物组合物还包含佐剂。

在某些实施方案中,所述药物组合物为蛋白疫苗,其含有如前所述的截短的Gn蛋白或者如前所述的融合蛋白。

在某些实施方案中,所述药物组合物为核酸疫苗,其含有如前所述的核酸分子或如前所述的载体。

在某些实施方案中,所述核酸疫苗为DNA疫苗。

在第十一方面,本申请提供了一种类病毒颗粒,所述类病毒颗粒含有如前所述的截短的Gn蛋白或含有如前所述的融合蛋白;或者,所述类病毒颗粒由如前所述的Gn蛋白或如前所述的融合蛋白组成。

在第十二方面,本申请提供了一种在受试者中预防或治疗SFTSV 感染或由SFTSV感染所导致的疾病(例如SFTS)的方法,其包括,给有此需要的受试者施用有效量的根据如前所述的截短的Gn蛋白或者根据如前所述的融合蛋白或根据如前所述的核酸分子或根据如前所述的载体或根据如前所述的药物组合物。

在某些实施方案中,所述受试者为哺乳动物,例如人。

在某些实施方案中,通过注射来给受试者施用所述截短的Gn蛋白或所述融合蛋白或核酸分子或载体或药物组合物。

本申请的截短的Gn蛋白与天然Gn蛋白相比,其在细胞内的表达水平有了显著提升(提升了5倍以上)。进一步,将含有编码截短的 Gn蛋白的核苷酸序列的载体施用于受试者后,可在体内诱导显著提高的针对Gn蛋白的总抗体和中和抗体的滴度(提升了约5倍)。因此,本申请的截短的Gn蛋白以及编码其的核酸分子是特别有利的,可用作高效的抗病毒疫苗。

下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列实施例仅用于说明本发明,而不是对本发明的范围的限定。根据优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。

序列信息

本发明涉及的部分序列的信息提供于下面的表1中。

表1:序列信息

具体实施方式

现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。

除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。例如,本发明中所使用的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA等常规技术,可参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989);《当代分子生物学实验手册》 (CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR 2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、 B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995)),以及《动物细胞培养》(ANIMAL CELLCULTURE)(R.I.弗雷谢尼 (R.I.Freshney)编辑(1987))。

另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。

本实施例所应用的Gn蛋白的序列参见GenBank登录号 HM745931.1,其中,第1-19位氨基酸为天然Gn蛋白的信号肽的序列 (SEQ ID NO:10),其余氨基酸序列为天然Gn蛋白的氨基酸序列 (如SEQ ID NO:1所示,其编码核苷酸序列如SEQ ID NO:2所示)。去除天然Gn蛋白C末端24个氨基酸,获得截短的Gn蛋白 (其氨基酸序列如SEQ ID NO:3所示)。

根据人细胞的密码子偏好性,对编码天然Gn蛋白和截短的Gn蛋白的核苷酸序列进行优化,获得了如SEQ ID NO:4和5所示的核苷酸序列。

接着,在SEQ ID NO:4和5所示的核苷酸序列的5’端分别连接编码HGF信号肽或IgE信号肽的核苷酸序列(所连接的信号肽编码序列分别如SEQ ID NO:11和12),获得了如SEQID NO:6-9所示的核苷酸序列。

将如上所述的序列SEQ ID NO:6-9分别构建至pSN载体(具体信息及序列参见专利CN108611367B)中,获得重组质粒pSN-FXG-H-0、 pSN-FXG-H-1、pSN-FXG-I-0、pSN-FXG-I-1,具体序列信息如表2所示。

表2.重组质粒的序列信息

本实施例进行的是常规的工程菌的构建筛选、发酵以及质粒纯化。简言之,将含有序列SEQ ID NO:6-9的重组质粒分别转化到宿主菌 DH5α中,获得稳定的质粒产量高的菌株,作为工程菌进行保存。将工程菌进行发酵,得到的菌液离心后收取菌泥,并按照常规质粒纯化方法进行纯化。经电泳检测,得到的4种质粒的纯度均大于95%,超螺旋的含量大于90%,OD260与OD280的比值大于1.8,说明质粒的质量达到了要求。具体检测结果如下表所示。

表3.质粒的检测结果

1.重组质粒转染HEK293T细胞

(1)细胞准备:取待转染的HEK293T细胞,接种于24孔细胞培养板中,500μl/孔,放入37℃、5%CO

(2)质粒转染:对于每孔细胞,使用50μL DMEM无血清培养基稀释2μLLipofectamine 2000;对于每孔细胞,使用50μl DMEM无血清培养基稀释质粒,分别加入上述4种重组质粒各0.8μg;室温孵育 5min后,将稀释后的DNA和稀释后的Lipofectamine2000轻轻混匀。并在室温保温20min。实验组为:培养基+质粒+转染试剂;阴性对照组为:培养基+转染试剂;以上实验组和对照组分别按照100μL/孔加入准备转染的细胞中。放入37℃、5%的CO

2.表达量测定

采用Gn蛋白检测试剂盒(购自上海将来实业股份有限公司,货号:JL48815-48T)进行定量检测,按照试剂盒说明书操作,最后在酶标仪450nm处测吸光值,计算Gn蛋白的含量并进行分析。测定结果见表5。

表4. 4种质粒Gn蛋白表达量测定结果

从表中可以看出,不同信号肽对于蛋白表达量的影响差异较小,进一步的,当信号肽相同时,截短的Gn蛋白表达量为天然Gn蛋白的5 倍以上。

3.体内针对Gn蛋白的总抗体和中和抗体含量的测定

6周龄的Balb/c小鼠50只,20-25g,分为5组,第1组为阴性对照组,即pSN空质粒给药组,第2、3、4、5组分别对应重组质粒(pSN-FXG-H-0、pSN-FXG-H-1、pSN-FXG-I-0和pSN-FXG-I-1)给药组。小鼠于第0天肌肉注射质粒剂量为10ug/0.1mL,总共注射1次,2 周后采血,进行系列稀释,采用Gn蛋白的抗体检测试剂盒(购自上海将来实业股份有限公司,货号:JL51160-48T),按照试剂盒说明书操作,测定Gn蛋白的总抗体。中和抗体平均滴度采用系列稀释的抗体血清,与SFTSV CB1/2014株混合室温孵育1小时,然后与Vero E6细胞在96孔板中孵育,37℃,1hr,然后更换为含有1%胎牛血清的DEME 培养基继续培养7天,用细胞数量计算可减少50%细胞生长抑制的中和抗体滴度,结果见表6。

表5.抗体的滴度

从表中可以看出,不同信号肽对于抗体滴度的影响差异较小,但进一步的,当信号肽相同时,含有编码截短的Gn蛋白核苷酸序列的质粒诱导的针对Gn抗原的总抗体和中和抗体的滴度显著高于含有编码天然的Gn蛋白核苷酸序列的质粒。

综合上述试验结果,截短的Gn蛋白与天然Gn蛋白相比,体外抗原表达及诱导体内总抗体和中和抗体表达均获得了出人意料地提高,预期可大大降低用药剂量,提高DNA疫苗的成药性。

尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。

SEQUENCE LISTING

<110> 北京诺思兰德生物技术股份有限公司

<120> 一种截短的发热伴血小板减少综合征病毒Gn蛋白及其应用

<130> IDC210041

<160> 16

<170> PatentIn version 3.5

<210> 1

<211> 516

<212> PRT

<213> Artificial Sequence

<220>

<223> 天然Gn蛋白(不含信号肽)氨基酸序列

<400> 1

Asp Ser Gly Pro Ile Ile Cys Ala Gly Pro Ile His Ser Asn Lys Ser

1 5 10 15

Ala Gly Ile Pro His Leu Leu Gly Tyr Ser Glu Lys Ile Cys Gln Ile

20 25 30

Asp Arg Leu Ile His Val Ser Ser Trp Leu Arg Asn His Ser Gln Phe

35 40 45

Gln Gly Tyr Val Gly Gln Arg Gly Gly Arg Ser Gln Val Ser Tyr Tyr

50 55 60

Pro Ala Glu Asn Ser Tyr Ser Arg Trp Ser Gly Leu Leu Ser Pro Cys

65 70 75 80

Asp Ala Asp Trp Leu Gly Met Leu Val Val Lys Lys Ala Lys Glu Ser

85 90 95

Asp Met Ile Val Pro Gly Pro Ser Tyr Lys Gly Lys Val Phe Phe Glu

100 105 110

Arg Pro Thr Phe Asp Gly Tyr Val Gly Trp Gly Cys Gly Ser Gly Lys

115 120 125

Ser Arg Thr Glu Ser Gly Glu Leu Cys Ser Ser Asp Ser Gly Thr Ser

130 135 140

Ser Gly Leu Leu Pro Ser Asp Arg Val Leu Trp Ile Gly Asp Val Ala

145 150 155 160

Cys Gln Pro Met Thr Pro Ile Pro Glu Glu Thr Phe Leu Glu Leu Lys

165 170 175

Ser Phe Ser Gln Ser Glu Phe Pro Asp Ile Cys Lys Ile Asp Gly Ile

180 185 190

Val Phe Asn Gln Cys Glu Gly Glu Ser Leu Pro Gln Pro Phe Asp Val

195 200 205

Ala Trp Met Asp Val Gly His Ser His Lys Ile Ile Met Arg Glu His

210 215 220

Lys Thr Lys Trp Val Gln Glu Ser Ser Ser Lys Asp Phe Val Cys Tyr

225 230 235 240

Lys Glu Gly Thr Gly Pro Cys Ser Glu Ser Glu Glu Lys Ala Cys Lys

245 250 255

Thr Ser Gly Ser Cys Arg Gly Asp Met Gln Phe Cys Lys Val Ala Gly

260 265 270

Cys Glu His Gly Glu Glu Ala Ser Glu Ala Lys Cys Arg Cys Ser Leu

275 280 285

Val His Lys Pro Gly Glu Val Val Val Ser Tyr Gly Gly Thr Arg Val

290 295 300

Arg Pro Lys Cys Tyr Gly Phe Ser Arg Met Met Ala Thr Leu Glu Val

305 310 315 320

Asn Pro Pro Glu Gln Arg Ile Gly Gln Cys Thr Gly Cys His Leu Glu

325 330 335

Cys Ile Asn Gly Gly Val Arg Leu Ile Thr Leu Thr Ser Glu Leu Arg

340 345 350

Ser Ala Thr Val Cys Ala Ser His Phe Cys Ser Ser Ala Ser Ser Gly

355 360 365

Lys Lys Ser Thr Glu Ile His Phe His Ser Gly Ser Leu Val Gly Lys

370 375 380

Thr Ala Ile His Val Lys Gly Ala Leu Val Asp Gly Thr Glu Phe Thr

385 390 395 400

Phe Glu Gly Ser Cys Met Phe Pro Asp Gly Cys Asp Ala Val Asp Cys

405 410 415

Thr Phe Cys Arg Glu Phe Leu Lys Asn Pro Gln Cys Tyr Pro Ala Lys

420 425 430

Lys Trp Leu Phe Ile Ile Ile Val Ile Leu Leu Gly Tyr Ala Gly Leu

435 440 445

Met Leu Leu Thr Asn Val Leu Lys Ala Ile Gly Val Trp Gly Ser Trp

450 455 460

Val Ile Ala Pro Val Lys Leu Met Phe Ala Ile Ile Lys Lys Leu Met

465 470 475 480

Arg Thr Val Ser Cys Leu Val Gly Lys Leu Met Asp Arg Gly Arg Gln

485 490 495

Val Ile His Glu Glu Ile Gly Glu Asn Gly Glu Gly Asn Gln Asp Asp

500 505 510

Val Arg Ile Glu

515

<210> 2

<211> 1548

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码天然Gn蛋白(不含信号肽)的核苷酸序列

<400> 2

gattcgggcc caatcatctg cgcaggaccc atccactcaa acaagagtgc tggcataccc 60

cacctgcttg gttactctga gaagatttgt cagatagatc ggctgataca tgtttcgtca 120

tggctcagga accactcgca atttcaaggc tacgttgggc agcgaggtgg acgctctcag 180

gttagctact acccagctga gaattcttac tcgaggtgga gtggacttct aagcccctgt 240

gatgctgatt ggcttgggat gcttgtcgtg aagaaggcta aggagtctga tatgatagtt 300

cctgggcctt catacaaggg gaaagtcttt tttgaacggc caacttttga tggatacgta 360

ggctggggct gtggcagtgg gaagtctagg actgagtcag gagagctctg cagttcagac 420

tcagggacaa gttctggtct tctgccctcg gatagggttc tctggatagg tgatgttgct 480

tgtcagccta tgacacccat ccctgaggag acatttctgg agctgaagag ttttagccaa 540

agtgaattcc cagacatatg taaaattgat ggcattgtgt tcaaccagtg tgagggtgag 600

agtctacccc agccctttga tgttgcatgg atggatgttg gccactctca taagatcatc 660

atgagggagc acaagaccaa atgggtacaa gagagctcat ccaaggattt tgtgtgctac 720

aaggaaggga ctggaccttg ttctgaatca gaagaaaagg cttgtaagac cagtggatca 780

tgcagagggg acatgcagtt ttgcaaggtg gcaggttgcg aacatggaga ggaggcatct 840

gaggccaagt gtagatgctc acttgtgcac aagcctgggg aagtcgttgt gtcatatgga 900

gggacgcgtg tcagaccaaa gtgctacggt ttctccagaa tgatggcaac actggaggtg 960

aacccaccag agcaaaggat tggtcaatgc actggctgcc atctagaatg cataaatggg 1020

ggtgtgaggc taatcactct aaccagtgag ctcaggtcag ctactgtctg tgcttcccac 1080

ttttgcagtt ctgcctcaag tggtaagaaa agcacggaga ttcatttcca ctcaggatca 1140

ttggttggga aaacagctat ccatgtcaaa ggggcattgg tagatggaac tgaattcaca 1200

tttgagggta gttgcatgtt cccagatgga tgtgatgcag tggactgcac attctgtcgt 1260

gagtttctaa aaaatcctca gtgctaccct gcaaagaagt ggctgttcat cattattgtc 1320

atcctccttg gatatgcagg cctcatgtta ctcaccaatg tccttaaggc aattggggtc 1380

tggggatcat gggtaatagc tccagtgaag ctaatgtttg ccatcataaa gaaactaatg 1440

agaactgtga gctgcttggt ggggaaattg atggataggg gaaggcaagt gatccatgag 1500

gaaatagggg agaatgggga gggcaaccaa gatgatgtta ggattgag 1548

<210> 3

<211> 492

<212> PRT

<213> Artificial Sequence

<220>

<223> 截短的Gn蛋白氨基酸序列

<400> 3

Asp Ser Gly Pro Ile Ile Cys Ala Gly Pro Ile His Ser Asn Lys Ser

1 5 10 15

Ala Gly Ile Pro His Leu Leu Gly Tyr Ser Glu Lys Ile Cys Gln Ile

20 25 30

Asp Arg Leu Ile His Val Ser Ser Trp Leu Arg Asn His Ser Gln Phe

35 40 45

Gln Gly Tyr Val Gly Gln Arg Gly Gly Arg Ser Gln Val Ser Tyr Tyr

50 55 60

Pro Ala Glu Asn Ser Tyr Ser Arg Trp Ser Gly Leu Leu Ser Pro Cys

65 70 75 80

Asp Ala Asp Trp Leu Gly Met Leu Val Val Lys Lys Ala Lys Glu Ser

85 90 95

Asp Met Ile Val Pro Gly Pro Ser Tyr Lys Gly Lys Val Phe Phe Glu

100 105 110

Arg Pro Thr Phe Asp Gly Tyr Val Gly Trp Gly Cys Gly Ser Gly Lys

115 120 125

Ser Arg Thr Glu Ser Gly Glu Leu Cys Ser Ser Asp Ser Gly Thr Ser

130 135 140

Ser Gly Leu Leu Pro Ser Asp Arg Val Leu Trp Ile Gly Asp Val Ala

145 150 155 160

Cys Gln Pro Met Thr Pro Ile Pro Glu Glu Thr Phe Leu Glu Leu Lys

165 170 175

Ser Phe Ser Gln Ser Glu Phe Pro Asp Ile Cys Lys Ile Asp Gly Ile

180 185 190

Val Phe Asn Gln Cys Glu Gly Glu Ser Leu Pro Gln Pro Phe Asp Val

195 200 205

Ala Trp Met Asp Val Gly His Ser His Lys Ile Ile Met Arg Glu His

210 215 220

Lys Thr Lys Trp Val Gln Glu Ser Ser Ser Lys Asp Phe Val Cys Tyr

225 230 235 240

Lys Glu Gly Thr Gly Pro Cys Ser Glu Ser Glu Glu Lys Ala Cys Lys

245 250 255

Thr Ser Gly Ser Cys Arg Gly Asp Met Gln Phe Cys Lys Val Ala Gly

260 265 270

Cys Glu His Gly Glu Glu Ala Ser Glu Ala Lys Cys Arg Cys Ser Leu

275 280 285

Val His Lys Pro Gly Glu Val Val Val Ser Tyr Gly Gly Thr Arg Val

290 295 300

Arg Pro Lys Cys Tyr Gly Phe Ser Arg Met Met Ala Thr Leu Glu Val

305 310 315 320

Asn Pro Pro Glu Gln Arg Ile Gly Gln Cys Thr Gly Cys His Leu Glu

325 330 335

Cys Ile Asn Gly Gly Val Arg Leu Ile Thr Leu Thr Ser Glu Leu Arg

340 345 350

Ser Ala Thr Val Cys Ala Ser His Phe Cys Ser Ser Ala Ser Ser Gly

355 360 365

Lys Lys Ser Thr Glu Ile His Phe His Ser Gly Ser Leu Val Gly Lys

370 375 380

Thr Ala Ile His Val Lys Gly Ala Leu Val Asp Gly Thr Glu Phe Thr

385 390 395 400

Phe Glu Gly Ser Cys Met Phe Pro Asp Gly Cys Asp Ala Val Asp Cys

405 410 415

Thr Phe Cys Arg Glu Phe Leu Lys Asn Pro Gln Cys Tyr Pro Ala Lys

420 425 430

Lys Trp Leu Phe Ile Ile Ile Val Ile Leu Leu Gly Tyr Ala Gly Leu

435 440 445

Met Leu Leu Thr Asn Val Leu Lys Ala Ile Gly Val Trp Gly Ser Trp

450 455 460

Val Ile Ala Pro Val Lys Leu Met Phe Ala Ile Ile Lys Lys Leu Met

465 470 475 480

Arg Thr Val Ser Cys Leu Val Gly Lys Leu Met Asp

485 490

<210> 4

<211> 1548

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码天然Gn蛋白(不含信号肽)的核苷酸序列

<400> 4

gactctggcc ccatcatctg tgctggcccc atccacagca acaagtctgc tggcatcccc 60

cacctgctgg gttattctga gaagatctgt cagattgaca gactgatcca tgtgagcagc 120

tggctgagaa accactctca gttccaaggc tatgtgggtc aaagaggggg cagaagccaa 180

gtgagctact accctgctga gaacagctac agcagatggt ctggccttct gagcccatgt 240

gatgctgact ggctgggcat gctggtggtg aagaaggcca aggagtctga catgattgtg 300

cctggcccta gctacaaggg caaggtgttc tttgagagac ccacctttga tggctatgtg 360

gggtggggat gtggctctgg caaaagcaga acagagtctg gggagctgtg cagctctgac 420

tctggcacaa gctctggcct gctgccctct gacagagtgc tgtggattgg ggatgttgcc 480

tgtcagccca tgacccccat ccctgaggag accttcctgg agctgaagag cttctctcag 540

tctgagttcc ctgacatctg caagattgat ggcattgtgt tcaatcagtg tgagggggag 600

agcctgcctc agccctttga tgtggcctgg atggatgtgg gccacagcca caagatcatc 660

atgagagagc acaagaccaa gtgggtgcaa gagagcagca gcaaggactt tgtgtgctac 720

aaggagggca ctggcccctg ctctgagtct gaggagaagg cctgcaagac ctctggcagc 780

tgcagagggg acatgcagtt ctgcaaggtg gctggctgtg agcatgggga ggaggcctct 840

gaggccaagt gcagatgcag cctggtgcac aagcctgggg aggtggtggt gagctatggg 900

ggcacaagag tgagacccaa gtgctatggc ttcagcagaa tgatggccac cctggaggtg 960

aacccccctg agcagagaat tgggcagtgc actggctgcc acctggagtg catcaatggg 1020

ggggtgagac tgatcaccct gacctctgag ctgagatctg ccacagtgtg tgcaagccac 1080

ttctgcagct ctgcaagctc tggcaaaaaa agcacagaga tccacttcca ctctggctcc 1140

ctggtgggca agactgctat ccatgtgaag ggggccctgg tggatggcac agagttcacc 1200

tttgagggca gctgcatgtt ccctgatggc tgtgatgctg tggactgcac cttctgcaga 1260

gagttcctga agaaccctca gtgctaccct gccaagaagt ggctgttcat catcattgtg 1320

atcctgcttg gttatgctgg actgatgctg ctgaccaatg tgctgaaggc cattggggtg 1380

tggggcagct gggtgattgc ccctgtgaag ctgatgtttg ccatcatcaa gaagctgatg 1440

agaacagtga gctgcctggt gggaaagctg atggacagag gcagacaagt gatccatgag 1500

gagattgggg agaatgggga gggcaaccaa gatgatgtga gaattgag 1548

<210> 5

<211> 1476

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码截短的Gn蛋白的核苷酸序列

<400> 5

gactctggcc ccatcatctg tgctggcccc atccacagca acaagtctgc tggcatcccc 60

cacctgctgg gttattctga gaagatctgt cagattgaca gactgatcca tgtgagcagc 120

tggctgagaa accactctca gttccaaggc tatgtgggtc aaagaggggg cagaagccaa 180

gtgagctact accctgctga gaacagctac agcagatggt ctggccttct gagcccatgt 240

gatgctgact ggctgggcat gctggtggtg aagaaggcca aggagtctga catgattgtg 300

cctggcccta gctacaaggg caaggtgttc tttgagagac ccacctttga tggctatgtg 360

gggtggggat gtggctctgg caaaagcaga acagagtctg gggagctgtg cagctctgac 420

tctggcacaa gctctggcct gctgccctct gacagagtgc tgtggattgg ggatgttgcc 480

tgtcagccca tgacccccat ccctgaggag accttcctgg agctgaagag cttctctcag 540

tctgagttcc ctgacatctg caagattgat ggcattgtgt tcaatcagtg tgagggggag 600

agcctgcctc agccctttga tgtggcctgg atggatgtgg gccacagcca caagatcatc 660

atgagagagc acaagaccaa gtgggtgcaa gagagcagca gcaaggactt tgtgtgctac 720

aaggagggca ctggcccctg ctctgagtct gaggagaagg cctgcaagac ctctggcagc 780

tgcagagggg acatgcagtt ctgcaaggtg gctggctgtg agcatgggga ggaggcctct 840

gaggccaagt gcagatgcag cctggtgcac aagcctgggg aggtggtggt gagctatggg 900

ggcacaagag tgagacccaa gtgctatggc ttcagcagaa tgatggccac cctggaggtg 960

aacccccctg agcagagaat tgggcagtgc actggctgcc acctggagtg catcaatggg 1020

ggggtgagac tgatcaccct gacctctgag ctgagatctg ccacagtgtg tgcaagccac 1080

ttctgcagct ctgcaagctc tggcaaaaaa agcacagaga tccacttcca ctctggctcc 1140

ctggtgggca agactgctat ccatgtgaag ggggccctgg tggatggcac agagttcacc 1200

tttgagggca gctgcatgtt ccctgatggc tgtgatgctg tggactgcac cttctgcaga 1260

gagttcctga agaaccctca gtgctaccct gccaagaagt ggctgttcat catcattgtg 1320

atcctgcttg gttatgctgg actgatgctg ctgaccaatg tgctgaaggc cattggggtg 1380

tggggcagct gggtgattgc ccctgtgaag ctgatgtttg ccatcatcaa gaagctgatg 1440

agaacagtga gctgcctggt gggaaagctg atggac 1476

<210> 6

<211> 1641

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码含HGF信号肽的天然Gn蛋白的核苷酸序列

<400> 6

atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60

ctgctcccca tcgccatccc ctatgcagag ggagactctg gccccatcat ctgtgctggc 120

cccatccaca gcaacaagtc tgctggcatc ccccacctgc tgggttattc tgagaagatc 180

tgtcagattg acagactgat ccatgtgagc agctggctga gaaaccactc tcagttccaa 240

ggctatgtgg gtcaaagagg gggcagaagc caagtgagct actaccctgc tgagaacagc 300

tacagcagat ggtctggcct tctgagccca tgtgatgctg actggctggg catgctggtg 360

gtgaagaagg ccaaggagtc tgacatgatt gtgcctggcc ctagctacaa gggcaaggtg 420

ttctttgaga gacccacctt tgatggctat gtggggtggg gatgtggctc tggcaaaagc 480

agaacagagt ctggggagct gtgcagctct gactctggca caagctctgg cctgctgccc 540

tctgacagag tgctgtggat tggggatgtt gcctgtcagc ccatgacccc catccctgag 600

gagaccttcc tggagctgaa gagcttctct cagtctgagt tccctgacat ctgcaagatt 660

gatggcattg tgttcaatca gtgtgagggg gagagcctgc ctcagccctt tgatgtggcc 720

tggatggatg tgggccacag ccacaagatc atcatgagag agcacaagac caagtgggtg 780

caagagagca gcagcaagga ctttgtgtgc tacaaggagg gcactggccc ctgctctgag 840

tctgaggaga aggcctgcaa gacctctggc agctgcagag gggacatgca gttctgcaag 900

gtggctggct gtgagcatgg ggaggaggcc tctgaggcca agtgcagatg cagcctggtg 960

cacaagcctg gggaggtggt ggtgagctat gggggcacaa gagtgagacc caagtgctat 1020

ggcttcagca gaatgatggc caccctggag gtgaaccccc ctgagcagag aattgggcag 1080

tgcactggct gccacctgga gtgcatcaat gggggggtga gactgatcac cctgacctct 1140

gagctgagat ctgccacagt gtgtgcaagc cacttctgca gctctgcaag ctctggcaaa 1200

aaaagcacag agatccactt ccactctggc tccctggtgg gcaagactgc tatccatgtg 1260

aagggggccc tggtggatgg cacagagttc acctttgagg gcagctgcat gttccctgat 1320

ggctgtgatg ctgtggactg caccttctgc agagagttcc tgaagaaccc tcagtgctac 1380

cctgccaaga agtggctgtt catcatcatt gtgatcctgc ttggttatgc tggactgatg 1440

ctgctgacca atgtgctgaa ggccattggg gtgtggggca gctgggtgat tgcccctgtg 1500

aagctgatgt ttgccatcat caagaagctg atgagaacag tgagctgcct ggtgggaaag 1560

ctgatggaca gaggcagaca agtgatccat gaggagattg gggagaatgg ggagggcaac 1620

caagatgatg tgagaattga g 1641

<210> 7

<211> 1569

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码含HGF信号肽的截短的Gn蛋白的核苷酸序列

<400> 7

atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60

ctgctcccca tcgccatccc ctatgcagag ggagactctg gccccatcat ctgtgctggc 120

cccatccaca gcaacaagtc tgctggcatc ccccacctgc tgggttattc tgagaagatc 180

tgtcagattg acagactgat ccatgtgagc agctggctga gaaaccactc tcagttccaa 240

ggctatgtgg gtcaaagagg gggcagaagc caagtgagct actaccctgc tgagaacagc 300

tacagcagat ggtctggcct tctgagccca tgtgatgctg actggctggg catgctggtg 360

gtgaagaagg ccaaggagtc tgacatgatt gtgcctggcc ctagctacaa gggcaaggtg 420

ttctttgaga gacccacctt tgatggctat gtggggtggg gatgtggctc tggcaaaagc 480

agaacagagt ctggggagct gtgcagctct gactctggca caagctctgg cctgctgccc 540

tctgacagag tgctgtggat tggggatgtt gcctgtcagc ccatgacccc catccctgag 600

gagaccttcc tggagctgaa gagcttctct cagtctgagt tccctgacat ctgcaagatt 660

gatggcattg tgttcaatca gtgtgagggg gagagcctgc ctcagccctt tgatgtggcc 720

tggatggatg tgggccacag ccacaagatc atcatgagag agcacaagac caagtgggtg 780

caagagagca gcagcaagga ctttgtgtgc tacaaggagg gcactggccc ctgctctgag 840

tctgaggaga aggcctgcaa gacctctggc agctgcagag gggacatgca gttctgcaag 900

gtggctggct gtgagcatgg ggaggaggcc tctgaggcca agtgcagatg cagcctggtg 960

cacaagcctg gggaggtggt ggtgagctat gggggcacaa gagtgagacc caagtgctat 1020

ggcttcagca gaatgatggc caccctggag gtgaaccccc ctgagcagag aattgggcag 1080

tgcactggct gccacctgga gtgcatcaat gggggggtga gactgatcac cctgacctct 1140

gagctgagat ctgccacagt gtgtgcaagc cacttctgca gctctgcaag ctctggcaaa 1200

aaaagcacag agatccactt ccactctggc tccctggtgg gcaagactgc tatccatgtg 1260

aagggggccc tggtggatgg cacagagttc acctttgagg gcagctgcat gttccctgat 1320

ggctgtgatg ctgtggactg caccttctgc agagagttcc tgaagaaccc tcagtgctac 1380

cctgccaaga agtggctgtt catcatcatt gtgatcctgc ttggttatgc tggactgatg 1440

ctgctgacca atgtgctgaa ggccattggg gtgtggggca gctgggtgat tgcccctgtg 1500

aagctgatgt ttgccatcat caagaagctg atgagaacag tgagctgcct ggtgggaaag 1560

ctgatggac 1569

<210> 8

<211> 1602

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码含IgE信号肽的天然Gn蛋白的核苷酸序列

<400> 8

atggattgga catggatctt attcttagta gcagcagcaa caagagtgca ctcagactct 60

ggccccatca tctgtgctgg ccccatccac agcaacaagt ctgctggcat cccccacctg 120

ctgggttatt ctgagaagat ctgtcagatt gacagactga tccatgtgag cagctggctg 180

agaaaccact ctcagttcca aggctatgtg ggtcaaagag ggggcagaag ccaagtgagc 240

tactaccctg ctgagaacag ctacagcaga tggtctggcc ttctgagccc atgtgatgct 300

gactggctgg gcatgctggt ggtgaagaag gccaaggagt ctgacatgat tgtgcctggc 360

cctagctaca agggcaaggt gttctttgag agacccacct ttgatggcta tgtggggtgg 420

ggatgtggct ctggcaaaag cagaacagag tctggggagc tgtgcagctc tgactctggc 480

acaagctctg gcctgctgcc ctctgacaga gtgctgtgga ttggggatgt tgcctgtcag 540

cccatgaccc ccatccctga ggagaccttc ctggagctga agagcttctc tcagtctgag 600

ttccctgaca tctgcaagat tgatggcatt gtgttcaatc agtgtgaggg ggagagcctg 660

cctcagccct ttgatgtggc ctggatggat gtgggccaca gccacaagat catcatgaga 720

gagcacaaga ccaagtgggt gcaagagagc agcagcaagg actttgtgtg ctacaaggag 780

ggcactggcc cctgctctga gtctgaggag aaggcctgca agacctctgg cagctgcaga 840

ggggacatgc agttctgcaa ggtggctggc tgtgagcatg gggaggaggc ctctgaggcc 900

aagtgcagat gcagcctggt gcacaagcct ggggaggtgg tggtgagcta tgggggcaca 960

agagtgagac ccaagtgcta tggcttcagc agaatgatgg ccaccctgga ggtgaacccc 1020

cctgagcaga gaattgggca gtgcactggc tgccacctgg agtgcatcaa tgggggggtg 1080

agactgatca ccctgacctc tgagctgaga tctgccacag tgtgtgcaag ccacttctgc 1140

agctctgcaa gctctggcaa aaaaagcaca gagatccact tccactctgg ctccctggtg 1200

ggcaagactg ctatccatgt gaagggggcc ctggtggatg gcacagagtt cacctttgag 1260

ggcagctgca tgttccctga tggctgtgat gctgtggact gcaccttctg cagagagttc 1320

ctgaagaacc ctcagtgcta ccctgccaag aagtggctgt tcatcatcat tgtgatcctg 1380

cttggttatg ctggactgat gctgctgacc aatgtgctga aggccattgg ggtgtggggc 1440

agctgggtga ttgcccctgt gaagctgatg tttgccatca tcaagaagct gatgagaaca 1500

gtgagctgcc tggtgggaaa gctgatggac agaggcagac aagtgatcca tgaggagatt 1560

ggggagaatg gggagggcaa ccaagatgat gtgagaattg ag 1602

<210> 9

<211> 1530

<212> DNA

<213> Artificial Sequence

<220>

<223> 优化后的编码含IgE信号肽的截短的Gn蛋白的核苷酸序列

<400> 9

atggattgga catggatctt attcttagta gcagcagcaa caagagtgca ctcagactct 60

ggccccatca tctgtgctgg ccccatccac agcaacaagt ctgctggcat cccccacctg 120

ctgggttatt ctgagaagat ctgtcagatt gacagactga tccatgtgag cagctggctg 180

agaaaccact ctcagttcca aggctatgtg ggtcaaagag ggggcagaag ccaagtgagc 240

tactaccctg ctgagaacag ctacagcaga tggtctggcc ttctgagccc atgtgatgct 300

gactggctgg gcatgctggt ggtgaagaag gccaaggagt ctgacatgat tgtgcctggc 360

cctagctaca agggcaaggt gttctttgag agacccacct ttgatggcta tgtggggtgg 420

ggatgtggct ctggcaaaag cagaacagag tctggggagc tgtgcagctc tgactctggc 480

acaagctctg gcctgctgcc ctctgacaga gtgctgtgga ttggggatgt tgcctgtcag 540

cccatgaccc ccatccctga ggagaccttc ctggagctga agagcttctc tcagtctgag 600

ttccctgaca tctgcaagat tgatggcatt gtgttcaatc agtgtgaggg ggagagcctg 660

cctcagccct ttgatgtggc ctggatggat gtgggccaca gccacaagat catcatgaga 720

gagcacaaga ccaagtgggt gcaagagagc agcagcaagg actttgtgtg ctacaaggag 780

ggcactggcc cctgctctga gtctgaggag aaggcctgca agacctctgg cagctgcaga 840

ggggacatgc agttctgcaa ggtggctggc tgtgagcatg gggaggaggc ctctgaggcc 900

aagtgcagat gcagcctggt gcacaagcct ggggaggtgg tggtgagcta tgggggcaca 960

agagtgagac ccaagtgcta tggcttcagc agaatgatgg ccaccctgga ggtgaacccc 1020

cctgagcaga gaattgggca gtgcactggc tgccacctgg agtgcatcaa tgggggggtg 1080

agactgatca ccctgacctc tgagctgaga tctgccacag tgtgtgcaag ccacttctgc 1140

agctctgcaa gctctggcaa aaaaagcaca gagatccact tccactctgg ctccctggtg 1200

ggcaagactg ctatccatgt gaagggggcc ctggtggatg gcacagagtt cacctttgag 1260

ggcagctgca tgttccctga tggctgtgat gctgtggact gcaccttctg cagagagttc 1320

ctgaagaacc ctcagtgcta ccctgccaag aagtggctgt tcatcatcat tgtgatcctg 1380

cttggttatg ctggactgat gctgctgacc aatgtgctga aggccattgg ggtgtggggc 1440

agctgggtga ttgcccctgt gaagctgatg tttgccatca tcaagaagct gatgagaaca 1500

gtgagctgcc tggtgggaaa gctgatggac 1530

<210> 10

<211> 19

<212> PRT

<213> Artificial Sequence

<220>

<223> 天然Gn蛋白信号肽氨基酸序列

<400> 10

Met Met Lys Val Ile Trp Phe Ser Ser Leu Ile Cys Leu Val Ile Gln

1 5 10 15

Cys Ser Gly

<210> 11

<211> 93

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码HGF信号肽的核苷酸序列

<400> 11

atgtgggtga ccaaactcct gccagccctg ctgctgcagc atgtcctcct gcatctcctc 60

ctgctcccca tcgccatccc ctatgcagag gga 93

<210> 12

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<223> 编码IgE信号肽的核苷酸序列

<400> 12

atggattgga catggatctt attcttagta gcagcagcaa caagagtgca ctca 54

<210> 13

<211> 31

<212> PRT

<213> Artificial Sequence

<220>

<223> HGF信号肽的氨基酸序列

<400> 13

Met Trp Val Thr Lys Leu Leu Pro Ala Leu Leu Leu Gln His Val Leu

1 5 10 15

Leu His Leu Leu Leu Leu Pro Ile Ala Ile Pro Tyr Ala Glu Gly

20 25 30

<210> 14

<211> 18

<212> PRT

<213> Artificial Sequence

<220>

<223> IgE信号肽的氨基酸序列

<400> 14

Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val

1 5 10 15

His Ser

<210> 15

<211> 523

<212> PRT

<213> Artificial Sequence

<220>

<223> 含HGF信号肽的截短的Gn蛋白的氨基酸序列

<400> 15

Met Trp Val Thr Lys Leu Leu Pro Ala Leu Leu Leu Gln His Val Leu

1 5 10 15

Leu His Leu Leu Leu Leu Pro Ile Ala Ile Pro Tyr Ala Glu Gly Asp

20 25 30

Ser Gly Pro Ile Ile Cys Ala Gly Pro Ile His Ser Asn Lys Ser Ala

35 40 45

Gly Ile Pro His Leu Leu Gly Tyr Ser Glu Lys Ile Cys Gln Ile Asp

50 55 60

Arg Leu Ile His Val Ser Ser Trp Leu Arg Asn His Ser Gln Phe Gln

65 70 75 80

Gly Tyr Val Gly Gln Arg Gly Gly Arg Ser Gln Val Ser Tyr Tyr Pro

85 90 95

Ala Glu Asn Ser Tyr Ser Arg Trp Ser Gly Leu Leu Ser Pro Cys Asp

100 105 110

Ala Asp Trp Leu Gly Met Leu Val Val Lys Lys Ala Lys Glu Ser Asp

115 120 125

Met Ile Val Pro Gly Pro Ser Tyr Lys Gly Lys Val Phe Phe Glu Arg

130 135 140

Pro Thr Phe Asp Gly Tyr Val Gly Trp Gly Cys Gly Ser Gly Lys Ser

145 150 155 160

Arg Thr Glu Ser Gly Glu Leu Cys Ser Ser Asp Ser Gly Thr Ser Ser

165 170 175

Gly Leu Leu Pro Ser Asp Arg Val Leu Trp Ile Gly Asp Val Ala Cys

180 185 190

Gln Pro Met Thr Pro Ile Pro Glu Glu Thr Phe Leu Glu Leu Lys Ser

195 200 205

Phe Ser Gln Ser Glu Phe Pro Asp Ile Cys Lys Ile Asp Gly Ile Val

210 215 220

Phe Asn Gln Cys Glu Gly Glu Ser Leu Pro Gln Pro Phe Asp Val Ala

225 230 235 240

Trp Met Asp Val Gly His Ser His Lys Ile Ile Met Arg Glu His Lys

245 250 255

Thr Lys Trp Val Gln Glu Ser Ser Ser Lys Asp Phe Val Cys Tyr Lys

260 265 270

Glu Gly Thr Gly Pro Cys Ser Glu Ser Glu Glu Lys Ala Cys Lys Thr

275 280 285

Ser Gly Ser Cys Arg Gly Asp Met Gln Phe Cys Lys Val Ala Gly Cys

290 295 300

Glu His Gly Glu Glu Ala Ser Glu Ala Lys Cys Arg Cys Ser Leu Val

305 310 315 320

His Lys Pro Gly Glu Val Val Val Ser Tyr Gly Gly Thr Arg Val Arg

325 330 335

Pro Lys Cys Tyr Gly Phe Ser Arg Met Met Ala Thr Leu Glu Val Asn

340 345 350

Pro Pro Glu Gln Arg Ile Gly Gln Cys Thr Gly Cys His Leu Glu Cys

355 360 365

Ile Asn Gly Gly Val Arg Leu Ile Thr Leu Thr Ser Glu Leu Arg Ser

370 375 380

Ala Thr Val Cys Ala Ser His Phe Cys Ser Ser Ala Ser Ser Gly Lys

385 390 395 400

Lys Ser Thr Glu Ile His Phe His Ser Gly Ser Leu Val Gly Lys Thr

405 410 415

Ala Ile His Val Lys Gly Ala Leu Val Asp Gly Thr Glu Phe Thr Phe

420 425 430

Glu Gly Ser Cys Met Phe Pro Asp Gly Cys Asp Ala Val Asp Cys Thr

435 440 445

Phe Cys Arg Glu Phe Leu Lys Asn Pro Gln Cys Tyr Pro Ala Lys Lys

450 455 460

Trp Leu Phe Ile Ile Ile Val Ile Leu Leu Gly Tyr Ala Gly Leu Met

465 470 475 480

Leu Leu Thr Asn Val Leu Lys Ala Ile Gly Val Trp Gly Ser Trp Val

485 490 495

Ile Ala Pro Val Lys Leu Met Phe Ala Ile Ile Lys Lys Leu Met Arg

500 505 510

Thr Val Ser Cys Leu Val Gly Lys Leu Met Asp

515 520

<210> 16

<211> 510

<212> PRT

<213> Artificial Sequence

<220>

<223> 含IgE信号肽的截短的Gn蛋白的氨基酸序列

<400> 16

Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val

1 5 10 15

His Ser Asp Ser Gly Pro Ile Ile Cys Ala Gly Pro Ile His Ser Asn

20 25 30

Lys Ser Ala Gly Ile Pro His Leu Leu Gly Tyr Ser Glu Lys Ile Cys

35 40 45

Gln Ile Asp Arg Leu Ile His Val Ser Ser Trp Leu Arg Asn His Ser

50 55 60

Gln Phe Gln Gly Tyr Val Gly Gln Arg Gly Gly Arg Ser Gln Val Ser

65 70 75 80

Tyr Tyr Pro Ala Glu Asn Ser Tyr Ser Arg Trp Ser Gly Leu Leu Ser

85 90 95

Pro Cys Asp Ala Asp Trp Leu Gly Met Leu Val Val Lys Lys Ala Lys

100 105 110

Glu Ser Asp Met Ile Val Pro Gly Pro Ser Tyr Lys Gly Lys Val Phe

115 120 125

Phe Glu Arg Pro Thr Phe Asp Gly Tyr Val Gly Trp Gly Cys Gly Ser

130 135 140

Gly Lys Ser Arg Thr Glu Ser Gly Glu Leu Cys Ser Ser Asp Ser Gly

145 150 155 160

Thr Ser Ser Gly Leu Leu Pro Ser Asp Arg Val Leu Trp Ile Gly Asp

165 170 175

Val Ala Cys Gln Pro Met Thr Pro Ile Pro Glu Glu Thr Phe Leu Glu

180 185 190

Leu Lys Ser Phe Ser Gln Ser Glu Phe Pro Asp Ile Cys Lys Ile Asp

195 200 205

Gly Ile Val Phe Asn Gln Cys Glu Gly Glu Ser Leu Pro Gln Pro Phe

210 215 220

Asp Val Ala Trp Met Asp Val Gly His Ser His Lys Ile Ile Met Arg

225 230 235 240

Glu His Lys Thr Lys Trp Val Gln Glu Ser Ser Ser Lys Asp Phe Val

245 250 255

Cys Tyr Lys Glu Gly Thr Gly Pro Cys Ser Glu Ser Glu Glu Lys Ala

260 265 270

Cys Lys Thr Ser Gly Ser Cys Arg Gly Asp Met Gln Phe Cys Lys Val

275 280 285

Ala Gly Cys Glu His Gly Glu Glu Ala Ser Glu Ala Lys Cys Arg Cys

290 295 300

Ser Leu Val His Lys Pro Gly Glu Val Val Val Ser Tyr Gly Gly Thr

305 310 315 320

Arg Val Arg Pro Lys Cys Tyr Gly Phe Ser Arg Met Met Ala Thr Leu

325 330 335

Glu Val Asn Pro Pro Glu Gln Arg Ile Gly Gln Cys Thr Gly Cys His

340 345 350

Leu Glu Cys Ile Asn Gly Gly Val Arg Leu Ile Thr Leu Thr Ser Glu

355 360 365

Leu Arg Ser Ala Thr Val Cys Ala Ser His Phe Cys Ser Ser Ala Ser

370 375 380

Ser Gly Lys Lys Ser Thr Glu Ile His Phe His Ser Gly Ser Leu Val

385 390 395 400

Gly Lys Thr Ala Ile His Val Lys Gly Ala Leu Val Asp Gly Thr Glu

405 410 415

Phe Thr Phe Glu Gly Ser Cys Met Phe Pro Asp Gly Cys Asp Ala Val

420 425 430

Asp Cys Thr Phe Cys Arg Glu Phe Leu Lys Asn Pro Gln Cys Tyr Pro

435 440 445

Ala Lys Lys Trp Leu Phe Ile Ile Ile Val Ile Leu Leu Gly Tyr Ala

450 455 460

Gly Leu Met Leu Leu Thr Asn Val Leu Lys Ala Ile Gly Val Trp Gly

465 470 475 480

Ser Trp Val Ile Ala Pro Val Lys Leu Met Phe Ala Ile Ile Lys Lys

485 490 495

Leu Met Arg Thr Val Ser Cys Leu Val Gly Lys Leu Met Asp

500 505 510

相关技术
  • 一种截短的发热伴血小板减少综合征病毒Gn蛋白及其应用
  • 一种截短的发热伴血小板减少综合征病毒Gn蛋白及其应用
技术分类

06120113026830