掌桥专利:专业的专利平台
掌桥专利
首页

一种mRNA、药物组合物及其应用

文献发布时间:2023-06-19 15:47:50



技术领域

本发明涉及生物医药技术领域,尤其是涉及一种mRNA、药物组合物及其应用。

背景技术

法布雷病(Fabry)的发病与X染色体上q22的α-半乳糖苷酶A(α-GalA,一种溶酶体酶)基因突变有关,这个基因突变导致该酶的活性部分或全部丧失,造成其代谢底物三己糖酰基鞘脂醇(globotriaosylceramide,Gb3)和相关的鞘糖脂在人体各个器官或组织如心脏、肾脏、胰腺、皮肤、神经、肺等大量贮积,最终引起一系列脏器病变。蓄积的Gb3通过释放促炎细胞因子、促生长因子和诱导氧化应激,导致心肌细胞外基质重构、左心室肥厚(leftventricular hypertrophy,LVH)、血管功能障碍和间质纤维化(Xuling Zhu等,2019年)。男性新生儿发病率为1/110000~1/40000。男女均受累,多在儿童至青少年时期发病,女性症状通常较男性轻。

根据临床表现,可以将Fabry病分为经典型和迟发型。经典型:α-Gal A 活性显著下降甚至完全缺失,常有多系统累积,较年轻时发病,见于大部分男性和极少数女性患者。迟发型:α-Gal A活性部分下降,受累仅局限于心脏(心脏型)或肾脏(肾脏型),发病年龄相对较晚,见于大部分女性患者。Fabry病患者常见的心血管受累表现包括心室肥厚、严重的传导障碍、微循环心绞痛、心律失常、心力衰竭以及心源性猝死(sudden cardiac death,SCD),Gb3介导的浸润和微血管损伤导致心脏局限性和向心性肥大,是Fabry心肌病的主要临床表现,也是导致Fabry患者死亡的主要原因。

酶替代疗法(ERT)和伴侣疗法是法布雷病的一线治疗方法,ERT通过注入基因工程酶来替代缺失或有缺陷的α-半乳糖苷酶A,减少溶酶体在细胞中蓄积;伴侣疗法则通过提高α-半乳糖苷酶A的内源性酶活性,从而减少三己糖酰基鞘脂醇在细胞中积累。现有的ERT药物受到生物分布不均匀的限制,大部分在肝脏中被吸收,只有少量被足细胞和心肌细胞吸收,导致对肾脏疗效显著,但心脏和神经系统的效果并不十分理想;而伴侣疗法的应用还仅限于某些特异性突变的患者。因此需要改进的治疗剂和疗法来治疗法布雷病。

鉴于此,特提出本发明。

发明内容

本发明的目的在于提供一种mRNA、药物组合物及其应用。本发明对编码α-半乳糖苷酶A的mRNA序列进行了优化,以解决现有技术中酶替代疗法药物分布不均匀,尤其是心肌细胞吸收量少、药效不佳的问题。本发明提高心脏中α-半乳糖苷酶蛋白的表达量,并且同时保持在肾脏、肝脏等器官的α-半乳糖苷酶蛋白的表达量,提高了对法布雷病疾病治疗的效果。

本发明提供的技术方案如下:

在一个方面,本发明提供了一种mRNA,所述mRNA包含编码如序列SEQ ID No. 8所示氨基酸序列的α-半乳糖苷酶A的mRNA序列,所述mRNA序列包括如SEQ ID No. 1所示的ORF序列。

在一个实施方案中,所述mRNA包含编码α-半乳糖苷酶A的ORF序列;其中,所述ORF序列如SEQ ID No. 1所示;或者与SEQ ID No. 1具有95%以上同源性且功能相同的序列。

本发明提供的mRNA分子是一种经优化改进的mRNA,其编码半乳糖苷酶A(GLA)多肽的开放阅读框(Open Reading Frame,ORF)。

编码半乳糖苷酶A(GLA)多肽的开放阅读框(ORF)序列为SEQ ID No. 1。该序列的长度为1284 bp(除去起始密码子AUG和终止密码子UGA);A 碱基数目:270,占21.03%;G碱基数目:388,占30.22%;C碱基数目:370,占28.82%;U碱基数目:256,占19.94%;A+U占40.97%;G+C占59.03%。

在一个实施方案中,本发明涵盖与SEQ ID No. 1具有95%以上同源性且功能相同的序列,例如包括但不限于与SEQ ID No. 1具有96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%同一性的mRNA。

在一个实施方案中,所述mRNA还包括5’-帽子结构、5’-UTR、3’-聚腺苷酸尾和3’-UTR;

优选地,所述5’-UTR的长度为10~150个核苷酸,优选为15~80个核苷酸;更优选地,所述5’-UTR的序列如SEQ ID No. 2~SEQ ID No. 4中任一条所示;最优选地,所述5’-UTR的序列如SEQ ID No. 2所示。

SEQ ID No. 3在下文中,也称为序列A。

在一个实施方案中,所述3’-UTR的序列如SEQ ID No. 5或SEQ ID No. 6所示;优选地,所述3’-UTR的序列如SEQ ID No.5所示。

SEQ ID No. 6在下文中,也称为序列B。

在本发明中,进行了SEQ ID No. 1所示ORF序列与不同的5’-UTR和/或3’-UTR的序列的组合方案,其中优选SEQ ID No. 1所示ORF序列、SEQ ID No. 2所示的5’-UTR序列和SEQ ID No. 5所示的3’-UTR序列的组合方案。

在一个实施方案中,所述5’-帽子结构包括7-甲基-鸟苷-5’-三磷酸-5’-腺苷、鸟苷-5’-三磷酸-5’-腺苷、7-甲基-鸟苷-5’-三磷酸-5’-鸟苷、鸟苷-5’-三磷酸-5’-鸟苷和7-甲基-鸟苷-5’-三磷酸-5’-2-甲氧基腺嘌呤-鸟苷中的一种或几种;优选为7-甲基-鸟苷-5’-三磷酸-5’-2-甲氧基腺嘌呤-鸟苷(m7G(5’)ppp(5’)(2’-OMeA)pG);

进一步地,所述3’-聚腺苷酸尾包括60~120个A,优选包括80~100个A,更优选为100个A。

在另一个方面,本发明提供了所述的mRNA对应的核酸分子(编码所述的mRNA的DNA序列),所述核酸分子的核苷酸序列如SEQ ID No. 7所示。在一个实施方案中,本发明涵盖包括所述核酸分子的生物材料,例如但不限于,含有所述核酸分子的表达盒、重组载体、重组质粒、转基因细胞系等。

本发明半乳糖苷酶A(GLA)多肽的氨基酸序列为SEQ ID No. 8所示。

在一个优选的方案中,本发明所述mRNA按照5’至3’方向依次包括如下元件:5’帽结构(m7G(5’)ppp(5’)(2’-OMeA)pG),5’-UTR序列(SEQ ID No. 2),半乳糖苷酶A(GLA)多肽的ORF(SEQ ID No.1),3’-UTR序列(SEQ ID No. 5)和多聚腺苷酸序列(100个A的聚腺苷酸尾)。

在一个方面,本发明还提供了一种脂质纳米颗粒,所述脂质纳米颗粒包含前述的mRNA。所述脂质纳米颗粒可包含可质子化阳离子脂质、阴离子脂质、结构脂质和表面活性剂。可质子化阳离子脂质包括Dlin-MC3-DMA、Dlin-KC2-DMA、DODMA、c12-200和DlinDMA中的至少一种;阴离子脂质包括DOPG和/或DOPS;结构脂质包括胆固醇/酯;所述表面活性剂包括PEG-DMG、PEG-DSPE等。本发明中mRNA包封在所述脂质纳米颗粒中或与所述脂质纳米颗粒相关联,例如所述mRNA与一种或多种脂质复合,从而形成脂质体、脂质纳米颗粒和/或脂质复合物。

在一个方面,本发明还提供了一种药物组合物,所述药物组合物包含前述的mRNA或前述的脂质纳米颗粒。

在一个方面,本发明还提供了所述mRNA或所述脂质纳米颗粒在制备药物中的应用;

优选地,所述药物包括核酸药物。

在一个实施方案中,所述药物组合物还包含任选地药用载体,包括稀释剂、崩解剂和润滑剂等。

在一个实施方案中,所述mRNA、所述脂质纳米颗粒或所述药物组合物可通过静脉内、皮内、皮下、鞘内等方式施用于个体。

在一个实施方案中,所述药物用于预防或治疗提高心脏中α-半乳糖苷酶蛋白的表达量;优选地,所述药物为用于治疗α-半乳糖苷酶A活性部分或完全丧失或三己糖酰基鞘脂醇贮积引起的疾病。本发明涉及所述的mRNA或含有其的脂质纳米颗粒或药物组合物在制备用于在受试者中表达α-半乳糖苷酶A的药物中的用途。

在一个实施方案中,所述药物为用于治疗法布雷病的药物。

除非上下文指出或另有要求,否则词语“包括”、“包含”和“含有”以及类似的表述以开放性和包含性的含义解释为“包括但不限于”在本发明中,开放阅读框(ORF)从起始密码子开始,是DNA序列中具有编码蛋白质潜能的序列,结束于终止密码子连续的碱基序列。术语“个体”或“受试者”是指人类或任何非人动物(例如小鼠、大鼠、兔、犬、猫、牛、猪、绵羊、马或灵长类动物)。

本发明对mRNA序列进行了优化和修饰,本发明mRNA药物给药后,血浆中α-半乳糖苷酶蛋白活性表达时长延长,各组织中α-半乳糖苷酶蛋白活性显著升高。特别是可提高心脏中α-半乳糖苷酶蛋白的表达量,并且同时保持在肾脏、肝脏等器官的α-半乳糖苷酶蛋白的表达量。

本发明提供的mRNA能降低肾脏、心脏和血浆中Gb3水平,解决了现有技术中mRNA治疗的方案,心脏中的Gb3降低较少,对于法布雷病患者中心脏改善治疗的效果较差的问题。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的Western Blot技术检测在HEK293细胞内α-半乳糖苷酶蛋白表达的结果图(其中,Control为空脂质组;DNA质粒为环状质粒;mRNA-007为裸mRNA);

图2为本发明提供的在HEK293细胞内α-半乳糖苷酶蛋白表达水平的结果图(其中,Control为空脂质组;质粒为环状质粒;mRNA-007为mRNA);

图3为本发明提供的Gla-KO小鼠肾脏和脾脏中的α-半乳糖苷酶活性与野生型小鼠相比的结果;

图4为本发明提供的单剂量给药后小鼠血浆6-24 h内α-半乳糖苷酶的活性;

图5为本发明提供的单剂量给药后小鼠血浆24-144 h内α-半乳糖苷酶的活性;

图6为本发明提供的单剂量给药小鼠各个组织中24 h时α-半乳糖苷酶的蛋白活性;

图7为本发明提供的单剂量给药小鼠后其肝脏组织中α-半乳糖苷酶蛋白活性表达时长;

图8为本发明提供的单剂量给药小鼠后其肾脏组织中α-半乳糖苷酶蛋白活性表达时长;

图9为本发明提供的单剂量给药小鼠后其血浆中底物Gb3的水平变化;

图10为本发明提供的高效液相串联质谱的方法检测单剂量给药小鼠后各组织中底物Gb3的水平变化的结果;

图11为本发明提供的不同类别mRNA在小鼠肾脏、心脏和血浆中α-半乳糖苷酶蛋水平(给药后72小时取样);

图12为本发明提供的不同类别mRNA对小鼠肾脏、心脏和血浆中底物Gb3的降低效果(给药后72小时取样)。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1. RNA制备LNP的工艺

一种包含编码半乳糖苷酶A(GLA)多肽的RNA的脂质纳米颗粒,其中脂质纳米颗粒按照摩尔百分比计包括Dlin-MC3-DMA 50%、DOPG 10%、胆固醇38.5%和PEG-DMG 1.5%。

制备方法如下:

(a) 将本发明编码半乳糖苷酶A(GLA)多肽的RNA溶解于pH4的柠檬酸盐缓冲液,将浓度调整为0.1 mg/ml,得到水相;

(b) 按照配方量将Dlin-MC3-DMA、DOPG、胆固醇和PEG-DMG按照配方量溶解于无水乙醇,将有机相中的脂质成分的浓度调整至6 mg/mL,得到有机相;

(c) 将步骤(a)的水相和步骤(b)的有机相按照1:3的体积比,使用微流控设备,按照12 mL/min的流速混合,混合液立刻用pH 7.4的PBS溶液稀释100倍,并使用切向流过滤(TFF)除去溶液中乙醇成分,然后浓缩至体系中的mRNA的浓度为0.59 mg/ml,得到包含编码半乳糖苷酶A(GLA)多肽的RNA的脂质纳米颗粒,包封率为98%。

实施例2. 制备含编码半乳糖苷酶A(GLA)多肽的DNA质粒的工艺

将含有质粒的大肠杆菌转化到平板上,培养24小时后直接挑单克隆接摇瓶,继续培养14小时后抽提(碱裂解法),进行质粒点胶验证,再进行去内毒素操作后再进行线性化操作,之后重新醇沉即可。

编码半乳糖苷酶A(GLA)多肽的DNA序列为SEQ ID No. 7。

实施例3. GLA在体外细胞水平的表达

(1)转染:将Lip2000试剂10 μL与40 μL opti-MEM混合均匀静置,向其中再加入46μL opti-MEM,然后分别加入4 μL DNA质粒和4 μL mRNA(μg/μL),静置,细胞培养箱中孵育。

(2)使用Western Blot技术检测细胞内α-半乳糖苷酶(α-galactosidase)蛋白的表达。

加入250 μL细胞裂解液裂(含PMSF)于细胞培养板中,冰上裂解2分钟,进行匀浆离心,取上清分装于1.5 mL离心管中。使用BCA试剂盒对样品的蛋白浓度进行测定。接着使用预制胶进行电泳,加入重组Anti-Galactosidase alpha抗体和Goat Anti-Rabbit IgG H&L(HRP),对PVDF膜进行化学发光,显色。

结果表明(图1-图2),DNA质粒和mRNA组的α-半乳糖苷酶蛋白表达量显著高于对照组,α-半乳糖苷酶蛋白的DNA和mRNA能够在HEK293细胞中稳定表达。

实施例4. Gla-KO小鼠模型的建立与验证

委托上海南方模式生物科技股份有限公司通过CRISPR-Cas9系统构建

ELISA试剂盒检测α-半乳糖苷酶活性,分别取约10 mg肾脏和脾脏,加入α-galAssay Buffer于冰上裂解混匀,使用离心机离心。取上清,稀释10倍于96孔板中。制备标准曲线后,将底物进行水解,将20 μL水解底物加入96孔板中孵育,最后使用200 μL终止液来终止反应,放入多功能酶标仪中进行检测。

结果表明(图3),Gla-KO小鼠肾脏和脾脏中的α-半乳糖苷酶活性与野生型小鼠相比有较大幅度的降低,Gla-KO小鼠模型已建立成功。

实施例5. 探究mRNA药物单剂量注射小鼠体内在各个器官及血中的表达时长

给药方式:尾静脉注射。

实验分组:Gla-KO小鼠(雄性)数量:18只,分为两组,分别为GLA组(3 mg/kg)和空LNP组。

实验方案:小鼠血浆采样时间点:给药前1 h、给药后6、12、24、48、72、144 h,每个时间点采血浆50 μL。小鼠的心脏、肝脏、脾脏、肺脏、肾脏采样时间点:给药后12、24、48、72、144 h。

实验结果:

1、α-半乳糖苷酶(α-galactosidase)蛋白活性情况

(1)单剂量给药小鼠后其血浆中α-半乳糖苷酶蛋白活性情况

使用ELISA试剂盒检测小鼠血浆中的α-半乳糖苷酶活性。结果如图4所示,与对照组相比,给药组在6 h内α-半乳糖苷酶活性显著升高,并在6-24 h内持续保持高水平活性。

(2)单剂量给药小鼠后其血浆中α-半乳糖苷酶蛋白活性表达时长

使用ELISA试剂盒检测小鼠血浆中的α-半乳糖苷酶活性。结果如图5所示,与对照组相比,给药组在24 h后α-半乳糖苷酶蛋白活性开始下降,但在24-144 h中α-半乳糖苷酶活性持续保持高水平活性,与对照组仍有显著性差异。

(3)单剂量给药小鼠各个组织中α-半乳糖苷酶蛋白活性情况

使用ELISA试剂盒检测小鼠肝脏和肾脏组织中的α-半乳糖苷酶活性。结果如图6所示,与对照组相比,给药组在24 h时其肝脏和肾脏组织的α-半乳糖苷酶蛋白活性显著升高。

(4)单剂量给药小鼠后其肝脏组织中α-半乳糖苷酶蛋白活性表达时长

使用ELISA试剂盒检测小鼠肝脏中的α-半乳糖苷酶活性。结果表明(图7),与对照组相比,给药组在144 h时α-半乳糖苷酶蛋白活性仍然保持较高水平。

(5)单剂量给药小鼠后其肾脏组织中α-半乳糖苷酶蛋白活性表达时长

使用ELISA试剂盒检测小鼠肾脏中的α-半乳糖苷酶活性。结果表明(图8),与对照组相比,给药组在144 h时α-半乳糖苷酶蛋白活性仍然保持较高水平。

注:1. 以上实验的检测时长只到了144h,后面没有再继续检测,但并意味着144h后实验体丧失表达α-半乳糖苷酶蛋白活性。 2. 图4-图5中纵坐标为GLA水平为相对值,以对照组的GLA水平为1,纵坐标上给药组GLA水平=给药组GLA活性/对照组GLA活性。

2、底物Gb3的水平变化

(1)单剂量给药小鼠后其血浆中底物Gb3的水平变化

使用高效液相串联质谱的方法检测小鼠血浆中底物Gb3的水平。

取50 μL血浆样品,加入100 μL冰乙醇,混合均匀,使用离心机离心。取上清,使用0.22 μm滤膜过滤上清,取10 μL上清进样检测。

结果表明(图9),对照组Gb3的水平随着时间有上升的趋势,给药组在144 h内Gb3的水平显著下降。

为了进一步探究单剂量给药小鼠后各组织中底物Gb3的水平变化,使用高效液相串联质谱的方法检测小鼠各组织中底物Gb3的水平。取约20 mg组织样品,加入100 μL冰乙醇,混合均匀,使用离心机离心。取上清,使用0.22 μm滤膜过滤上清,取10 μL上清进样检测。

结果表明(图10),与对照组相比,在24 h后给药组各组织中Gb3的水平显著下降。

实施例6. 方案筛选

针对现有药物组织分布中,心脏分布较少的问题,我们对于mRNA的序列进行了优化,以提高心脏中α-半乳糖苷酶蛋白的表达量,并且同时保持在肾脏、肝脏等器官的α-半乳糖苷酶蛋白的表达量,用以提高对法布雷病疾病治疗的效果。

mRNA的序列优化的策略包括:

(1)针对ORF区:

I、根据特定器官和/或宿主生物体中的密码子频率进行密码子优化以确保恰当折叠和适当表达;

II、调节G/C含量以增加mRNA稳定性或减少二级结构;

III、使可能损害基因构建或表达的串联重复密码子或碱基串(base runs)最小化;

IV、定制转录和翻译控制区;

V、减少或消除多核苷酸内的问题二级结构。

(2)针对UTR区:从各UTR序列中筛选出符合筛选目的的序列。

经过对ORF区和各UTR序列排列组合的筛选,筛选出合适的全序列。

通过对比不同组序列的区别,说明实验效果。

1)给药方式:尾静脉注射。

2)实验分组:

Fabry小鼠(雄性)数量:9只,分为三组,每组3只,分别为GLA-1组(0.5 mg/kg)、GLA-2组(0.5 mg/kg)和空LNP组。

3)给药方案

GLA-1组和GLA-2组实验方案:尾静脉注射0.5 mg/kg mRNA药物,在72h时间点处死3只小鼠,分别取血浆200 μL、心脏、肝脏、脾脏和肾脏。

空LNP组(对照组)实验方案:尾静脉注射0.5 mg/kg空LNP,在72h时间点取200 μL血浆和100 mg组织。

GLA-1组的mRNA的ORF序列如SEQ ID No.1所示;5’UTR序列如SEQ ID No.2所示;3’UTR序列如SEQ ID No.5所示;5’端帽子为7-甲基-鸟苷-5’-三磷酸-5’-2-甲氧基腺嘌呤-鸟苷(m7G(5’)ppp(5’)(2’-OMeA)pG);3’-聚腺苷酸尾包括100个A。

GLA-2组mRNA的ORF区序列如SEQ ID No.9所示;5’UTR区序列为A序列,如SEQ IDNo.3所示;3’UTR区序列为B序列,如SEQ ID No.6所示;5’端帽子为7-甲基-鸟苷-5’-三磷酸-5’-2-甲氧基腺嘌呤-鸟苷(m7G(5’)ppp(5’)(2’-OMeA)pG);3’’-聚腺苷酸尾包括100个A。

SEQ ID No.9序列长度:1281;A碱基数目:242,占18.85%;G碱基数目:339,占26.40%;C碱基数目:498,占38.79%;U碱基数目,205,占15.97%;A+U占34.82%;G+C占65.19%。

进一步评估不同类别mRNA在小鼠肾脏、心脏和血浆中α-半乳糖苷酶水平。在给药后72小时取样。

结果表明(图11):GLA-1和GLA-2的序列小鼠体内皆正常表达,并且GLA-1组小鼠肾脏、心脏和血浆中的α-半乳糖苷酶水平均高于GLA-2组。

进一步评估不同类别mRNA对小鼠肾脏、心脏和血浆中底物Gb3的降低效果。在给药后72小时取样,结果表明(图12),在降低肾脏、心脏和血浆中Gb3水平上,GLA-1组效果高于GLA-2组的效果。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

SEQUENCE LISTING

<110> 珠海丽凡达生物技术有限公司

<120> 一种mRNA、药物组合物及其应用

<130> PA22010478

<160> 9

<170> PatentIn version 3.3

<210> 1

<211> 1290

<212> RNA

<213> 编码半乳糖苷酶A(GLA)多肽的ORF序列

<400> 1

augcagcuga gaaacccuga gcugcaccug ggcugugccc uggcccugag auuccuggcc 60

cuggugucuu gggacauccc uggcgcccgc gcccuggaua auggccuggc caggacccca 120

acaaugggcu ggcugcacug ggagcgguuc augugcaacc uggacuguca ggaggagcca 180

gauagcugca ucuccgagaa gcuguuuaug gagauggccg agcugauggu gucugagggc 240

uggaaggacg ccggcuacga guaucugugc aucgaugacu guuggauggc cccccagaga 300

gacucugagg gcagacugca ggccgaucca cagagauuuc cucacggcau caggcagcug 360

gccaacuacg ugcacuccaa gggccugaag cugggcaucu acgccgaugu gggcaacaag 420

acaugugccg gcuuucccgg cucuuuuggc uacuacgaua ucgaugccca gaccuucgcc 480

gauuggggcg uggaucugcu gaaguucgau ggcugcuauu gugauagccu ggagaaucug 540

gccgauggcu auaagcacau gucccuggcc cugaacagaa ccggcagguc caucguguac 600

ucuugugagu ggccacugua cauguggccu uuccagaagc cuaacuauac cgagaucagg 660

caguacugca accacuggcg gaauuucgcc gacaucgaug acagcuggaa guccaucaag 720

uccauccugg auuggaccuc cuucaaccag gagagaaucg uggauguggc cggcccuggc 780

ggcuggaacg acccugauau gcugguaauc ggcaacuuug gccugucuug gaaccagcag 840

gugacccaga uggcccugug ggccaucaug gccgccccac uguucauguc caacgaucug 900

aggcacaucu cuccacaggc caaggcccug cugcaggaca aggaugugau cgccaucaau 960

caggacccac ugggcaagca gggcuaccag cugagacagg gcgacaacuu cgaggugugg 1020

gagagaccuc ugucuggccu ggccugggcc guggccauga ucaaucgcca ggagaucggc 1080

ggcccaaggu cuuacaccau cgccguggcc agccugggca agggcguggc cugcaauccc 1140

gccuguuuua ucacccagcu gcugccugug aagaggaagc ugggcuucua cgaguggacc 1200

agcagacuga gaagccacau caacccuacc ggcacagugc ugcugcagcu ggagaacacc 1260

augcagauga gccugaagga ccugcuguga 1290

<210> 2

<211> 15

<212> RNA

<213> 5’-UTR

<400> 2

gggagaaagc uuacc 15

<210> 3

<211> 47

<212> RNA

<213> 5’-UTR

<400> 3

gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccacc 47

<210> 4

<211> 43

<212> RNA

<213> 5’-UTR

<400> 4

gggaaauaag agagaaaaga agaguaagaa auaaagagcc acc 43

<210> 5

<211> 74

<212> RNA

<213> 3’-UTR

<400> 5

ggacuaguua uaagacugac uagcccgaug ggccucccaa cgggcccucc uccccuccuu 60

gcaccgagau uaau 74

<210> 6

<211> 164

<212> RNA

<213> 3’-UTR

<400> 6

ugauaauagu ccauaaagua ggaaacacua cagcuggagc cucgguggcc augcuucuug 60

ccccuugggc cuccccccag ccccuccucc ccuuccugca cccguacccc ccgcauuauu 120

acucacggua cgaguggucu uugaauaaag ucugaguggg cggc 164

<210> 7

<211> 1290

<212> DNA

<213> mRNA对应的核苷酸序列

<400> 7

atgcagctga gaaaccctga gctgcacctg ggctgtgccc tggccctgag attcctggcc 60

ctggtgtctt gggacatccc tggcgcccgc gccctggata atggcctggc caggacccca 120

acaatgggct ggctgcactg ggagcggttc atgtgcaacc tggactgtca ggaggagcca 180

gatagctgca tctccgagaa gctgtttatg gagatggccg agctgatggt gtctgagggc 240

tggaaggacg ccggctacga gtatctgtgc atcgatgact gttggatggc cccccagaga 300

gactctgagg gcagactgca ggccgatcca cagagatttc ctcacggcat caggcagctg 360

gccaactacg tgcactccaa gggcctgaag ctgggcatct acgccgatgt gggcaacaag 420

acatgtgccg gctttcccgg ctcttttggc tactacgata tcgatgccca gaccttcgcc 480

gattggggcg tggatctgct gaagttcgat ggctgctatt gtgatagcct ggagaatctg 540

gccgatggct ataagcacat gtccctggcc ctgaacagaa ccggcaggtc catcgtgtac 600

tcttgtgagt ggccactgta catgtggcct ttccagaagc ctaactatac cgagatcagg 660

cagtactgca accactggcg gaatttcgcc gacatcgatg acagctggaa gtccatcaag 720

tccatcctgg attggacctc cttcaaccag gagagaatcg tggatgtggc cggccctggc 780

ggctggaacg accctgatat gctggtaatc ggcaactttg gcctgtcttg gaaccagcag 840

gtgacccaga tggccctgtg ggccatcatg gccgccccac tgttcatgtc caacgatctg 900

aggcacatct ctccacaggc caaggccctg ctgcaggaca aggatgtgat cgccatcaat 960

caggacccac tgggcaagca gggctaccag ctgagacagg gcgacaactt cgaggtgtgg 1020

gagagacctc tgtctggcct ggcctgggcc gtggccatga tcaatcgcca ggagatcggc 1080

ggcccaaggt cttacaccat cgccgtggcc agcctgggca agggcgtggc ctgcaatccc 1140

gcctgtttta tcacccagct gctgcctgtg aagaggaagc tgggcttcta cgagtggacc 1200

agcagactga gaagccacat caaccctacc ggcacagtgc tgctgcagct ggagaacacc 1260

atgcagatga gcctgaagga cctgctgtga 1290

<210> 8

<211> 429

<212> PRT

<213> 半乳糖苷酶A(GLA)多肽的氨基酸序列

<400> 8

Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu

1 5 10 15

Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu

20 25 30

Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu

35 40 45

Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile

50 55 60

Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly

65 70 75 80

Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met

85 90 95

Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg

100 105 110

Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly

115 120 125

Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly

130 135 140

Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala

145 150 155 160

Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser

165 170 175

Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn

180 185 190

Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met

195 200 205

Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn

210 215 220

His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys

225 230 235 240

Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val

245 250 255

Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn

260 265 270

Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala

275 280 285

Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser

290 295 300

Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn

305 310 315 320

Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn

325 330 335

Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala

340 345 350

Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala

355 360 365

Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile

370 375 380

Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr

385 390 395 400

Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln

405 410 415

Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu

420 425

<210> 9

<211> 1281

<212> RNA

<213> GLA-2组mRNA的ORF区

<400> 9

cagcuccgga accccgagcu ccaccuuggc ugcgcccucg ccuugcgguu ccucgcacuu 60

gugagcuggg acauaccagg cgcccgggcc cucgacaacg gccucgcccg caccccaacc 120

augggcuggc uccacuggga gcgcuucaug ugcaaccucg acugccagga ggagcccgac 180

uccugcaucu ccgagaagcu uuucauggag auggccgagc ucaugguguc cgagggcugg 240

aaggacgccg gcuacgagua ccucugcauc gacgacugcu ggauggcccc gcagcgcgac 300

agcgaggguc gccuccaggc cgacccgcag cgguucccuc acggcauccg ccagcucgcc 360

aacuacgucc acuccaaggg ccucaagcuc ggcaucuacg ccgacgucgg caacaagacc 420

ugcgccggcu uccccggcuc cuucggcuac uacgacaucg acgcccagac cuucgccgac 480

uggggcgucg accuccucaa guucgacggc ugcuacugcg acucccucga gaaccucgcc 540

gacggcuaca agcacauguc ccucgcccuc aaccgcaccg gccgcuccau cgucuacucc 600

ugcgaguggc cccucuacau guggcccuuc cagaagccca acuacaccga gauaaggcag 660

uacugcaacc acuggcgcaa uuucgccgau aucgaugacu ccuggaaguc caucaagagc 720

auccuggacu ggaccuccuu caaccaggag cgcaucgucg acgucgccgg ccccggcggc 780

uggaacgacc ccgacaugcu cgucaucgga aacuucggcc uguccuggaa ccagcagguc 840

acccagaugg cccucugggc caucauggcc gccccacugu ucauguccaa cgaccuccgc 900

cacaucagcc cgcaggccaa ggcccuccuc caggacaagg acgucaucgc caucaaccaa 960

gacccgcucg gcaagcaggg cuaccagcuc cgccagggcg acaacuucga ggugugggaa 1020

cguccccuca gcggccuggc gugggccguc gccaugauca accgccagga gaucggcggc 1080

ccgcgcuccu acaccaucgc cguggccagc cugggcaagg gcgucgccug caaccccgcc 1140

ugcuucauca cccagcuccu ccccgucaag agaaagcugg gcuucuacga guggaccagc 1200

cgccuccgcu cccacaucaa ccccaccggc accguccugc uccagcugga gaacaccaug 1260

cagaugagcc ucaaggaccu g 1281

技术分类

06120114587344