掌桥专利:专业的专利平台
掌桥专利
首页

用于治疗丙酸血症的基因疗法

文献发布时间:2023-06-19 11:21:00


用于治疗丙酸血症的基因疗法

与相关申请的交叉引用

本申请要求2018年10月1日提交的美国临时专利申请号62/739,471的利益和优先权,所述临时申请的全部公开内容为所有目的整体通过参考并入本文。

序列表

本申请含有以ASCII格式电子提交并整体通过参考并入本文的序列表。所述2019年9月22日生成的ASCII副本名为ULP-001WO_SL_ST25.txt,大小为98,889字节。

技术领域

本公开总的来说涉及腺相关病毒载体、腺相关病毒以及它们在用于治疗丙酸血症的基因疗法中的使用方法。

背景技术

丙酸血症(PA),又称丙酸尿,是由有活性的丙酰辅酶A羧化酶(PCC)的缺乏引起的一种有机酸代谢的先天性错误,所述酶为丙酰辅酶A转化为(D)-甲基丙二酰辅酶A所需,这是奇数链脂肪酸和产丙酸氨基酸、特别是异亮氨酸、苏氨酸、甲硫氨酸和缬氨酸分解代谢途径中的关键步骤。PCC酶由两个不同的亚基α和β组成,它们分别由PCCA和PCCB基因编码。丙酰辅酶A羧化酶缺陷可以由PCCA或PCCB任一者中的突变引起。在一项研究中,对30位PA患者进行了突变分析,发现15位患者具有α-亚基缺乏,并且15位患者具有β-亚基缺乏。参见Yang等,2004,Mol Genet and Metab.81:335-342。

在美国,PA的估计发病率是1:105,000至1:130,000。这种罕见的常染色体隐性代谢障碍在新生儿早期表现为进食不良、呕吐、嗜睡、癫痫发作和缺乏肌肉张力。如果不治疗,由于继发性高氨血症、感染、心肌病或基底节性中风,死亡可能迅速发生。PA在新生儿中可以几乎立即被诊断出来,并且在美国所述疾病被包括在新生儿筛查疾病组中。

目前,PA通过氨基酸前体的饮食限制、补充L-肉碱以解决肉碱水平降低问题以及施用抗生素以降低肠道细菌的丙酸产量进行管控。在患者无法通过标准治疗来管控的情况下,肝移植在PA的管控中发挥作用。然而,尽管通过营养、辅因子和抗生素疗法的复杂组合进行了应对所述疾病的积极尝试,但PA患者的长期预后仍然不良。参见van der Meer等,1996,Eur.J.Pediatr.155:205-210。因此,需要解决所述疾病的根本原因即PCC的缺乏的改进的治疗方法。

本发明通过产生介导功能性PCCA或PCCB基因向PA患者的转移的腺相关病毒载体来应对这种需求。本发明还描述了将功能性PCCA或PCCB基因递送到PA患者的重组腺相关病毒(rAAV)的产生。

发明内容

本发明提供了组合物和它们在基因疗法中的使用方法。更具体来说,本文中提供了可用于治疗PA的包含腺相关病毒(AAV)衣壳和包装在其中的载体基因组的重组腺相关病毒(rAAV)。

一方面,本公开提供了一种重组腺相关病毒(rAAV),其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:(a)5’-反向末端重复序列(5’-ITR)序列;(b)启动子序列;(c)PCCA的部分或完整编码序列;和(d)3’-反向末端重复序列(3’-ITR)序列。

另一方面,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)PCCA的部分或完整编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-ITR序列。

在某些实施方式中,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含AAV 5’-ITR序列、启动子序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列和AAV 3’-ITR序列。

在某些实施方式中,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含AAV 5’-ITR、启动子序列、人类PCCA 5’-非翻译区(5’-UTR)的截短或完整的核苷酸序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCA 3’-非翻译区(3’-UTR)核苷酸序列和AAV 3’-ITR。

在某些实施方式中,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含由SEQ ID NO:30表示的完整的人类PCCA 5’-UTR。在某些实施方式中,所述包装的基因组包含截短的人类PCCA 5’-UTR核苷酸序列。在某些实施方式中,所述人类PCCA 5’-UTR的截短的核苷酸序列包含SEQ ID NO:30的一部分。在某些实施方式中,所述人类PCCA 5’-UTR的截短的核苷酸序列包含与SEQ ID NO:30的等长度区域至少95%同一性的至少100个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对PCCA时,所述截短或完整的人类PCCA 5’-UTR位于所述内含子序列与PCCA的部分或完整编码序列之间。

在某些实施方式中,所述包装的载体基因组包含由SEQ ID NO:31表示的完整的人类PCCA 3’-UTR。在某些实施方式中,所述包装的基因组包含截短的人类PCCA 3’-UTR核苷酸序列。在某些实施方式中,所述人类PCCA 3’-UTR的截短的核苷酸序列包含SEQ ID NO:31的一部分。在某些实施方式中,所述人类PCCA 3’-UTR的截短的核苷酸序列包含与SEQ IDNO:31的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对PCCA时,所述截短或完整的人类PCCA 3’-UTR位于所述多聚腺苷酸化信号序列与3’-ITR序列之间。

在一个实施方式中,所述PCCA的部分或完整编码序列是野生型编码序列。在可选实施方式中,所述PCCA的部分或完整编码序列是密码子优化的编码序列。在一个示例性实施方式中,所述PCCA的部分或完整编码序列为了在人类中表达而被密码子优化。

在某些实施方式中,PCCA由SEQ ID NO:1中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达PCCA的天然同型或变体的编码序列,例如在UniProtKB/Swiss-Prot登记号P05165-1(SEQ ID NO:25)、P05165-2(SEQ ID NO:26)和P05165-3(SEQ ID NO:27)中示出的。在某些实施方式中,PCCA由密码子优化的编码序列编码。

在某些实施方式中,PCCA由与SEQ ID NO:1中示出的野生型编码序列具有少于80%同一性的密码子优化的编码序列编码。在某些示例性实施方式中,PCCA由选自SEQ IDNOs:2-6的密码子优化的编码序列编码。在某些实施方式中,PCCA由与选自SEQ ID NOs:2-6的序列至少80%同一性的密码子优化的编码序列编码。在某些实施方式中,PCCA由与选自SEQ ID NOs:2-6的序列至少90%同一性的密码子优化的编码序列编码。在某些实施方式中,PCCA由与选自SEQ ID NOs:2-6的序列至少95%同一性的密码子优化的编码序列编码。在某些实施方式中,所述PCCA的编码序列可以在3’末端处进一步包含终止密码子(TGA、TAA或TAG)。在某些实施方式中,所述表达的PCCA包含SEQ ID NO:16的氨基酸序列或由其构成。

另一方面,本公开提供了一种重组腺相关病毒(rAAV),其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)启动子序列;(c)PCCB的部分或完整编码序列;和(d)3’-ITR序列。

另一方面,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)PCCB的部分或完整编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-ITR序列。

在某些实施方式中,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含AAV 5’-ITR序列、启动子序列、PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列和AAV 3’-ITR序列。

在某些实施方式中,本公开提供了一种rAAV,其包含AAV衣壳和包装在其中的载体基因组,所述载体基因组包含AAV 5’-ITR、启动子序列、人类PCCB 5’-非翻译区(5’-UTR)的截短或完整的核苷酸序列、PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCB 3’-非翻译区(3’-UTR)核苷酸序列和AAV 3’-ITR。

在某些实施方式中,所述包装的载体基因组包含由SEQ ID NO:32表示的完整的人类PCCB 5’-UTR。在某些实施方式中,所述包装的载体基因组包含截短的人类PCCB 5’-UTR核苷酸序列。在某些实施方式中,所述人类PCCB 5’-UTR的截短的核苷酸序列包含SEQ IDNO:32的一部分。在某些实施方式中,所述人类PCCB 5’-UTR的截短的核苷酸序列包含与SEQID NO:32的等长度区域至少95%同一性的至少100个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对PCCB时,所述截短或完整的人类PCCB 5’-UTR位于所述内含子序列与PCCB的部分或完整编码序列之间。

在某些实施方式中,所述包装的载体基因组包含由SEQ ID NO:33表示的完整的人类PCCB 3’-UTR。在某些实施方式中,所述包装的载体基因组包含截短的人类PCCB 3’-UTR核苷酸序列。在某些实施方式中,所述人类PCCB 3’-UTR的截短的核苷酸序列包含SEQ IDNO:33的一部分。在某些实施方式中,所述人类PCCB 3’-UTR的截短的核苷酸序列包含与SEQID NO:33的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,当所述包装的载体基因组中的部分或完整编码序列是针对PCCB时,所述截短或完整的人类PCCB 3’-UTR位于所述多聚腺苷酸化信号序列与3’-ITR序列之间。

在一个实施方式中,所述PCCB的部分或完整编码序列是野生型编码序列。在可选实施方式中,所述PCCB的部分或完整编码序列是密码子优化的编码序列。在一个示例性实施方式中,所述PCCB的部分或完整编码序列为了在人类中表达而被密码子优化。

在某些实施方式中,PCCB由SEQ ID NO:7中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达PCCB的天然同型或变体的编码序列,例如在UniProtKB/Swiss-Prot登记号P05166-1(SEQ ID NO:28)和P05166-2(SEQ ID NO:29)中示出的。在可选实施方式中,PCCB由密码子优化的编码序列编码。在某些实施方式中,PCCB由与SEQ ID NO:7中示出的野生型编码序列具有少于80%同一性的密码子优化的编码序列编码。在某些示例性实施方式中,PCCB由选自SEQ ID NOs:8-12的密码子优化的编码序列编码。在某些实施方式中,PCCB由与选自SEQ ID NOs:8-12的序列至少80%同一性的密码子优化的编码序列编码。在某些实施方式中,PCCB由与选自SEQ ID NOs:8-12的序列至少90%同一性的密码子优化的编码序列编码。在某些实施方式中,PCCB由与选自SEQ ID NOs:8-12的序列至少95%同一性的密码子优化的编码序列编码。在某些实施方式中,所述PCCB的编码序列还可以在3’末端处包含终止密码子(TGA、TAA或TAG)。在某些实施方式中,所述表达的PCCB包含SEQ IDNO:17的氨基酸序列或由其构成。

在某些实施方式中,所述5’-ITR序列来自于AAV2。在某些实施方式中,所述3’-ITR序列来自于AAV2。在某些实施方式中,所述5’-ITR序列和3’-ITR序列来自于AAV2。在某些实施方式中,所述5’-ITR序列和/或3’-ITR序列包含SEQ ID NO:15或由其构成。在其他实施方式中,所述5’-ITR序列和/或3’-ITR序列来自于非AAV2来源。

在一个实施方式中,所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)立即早期基因启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子、CAG启动子(使用CMV早期增强子元件、CBA基因的启动子、第一外显子和第一内含子以及兔β-珠蛋白基因的剪接受体构建)、PCCA基因特异性内源启动子和PCCB基因特异性内源启动子。在示例性实施方式中,所述启动子是CBA启动子。在一个实施方式中,所述CBA启动子包含SEQ ID NO:18或由其构成。在某些实施方式中,所述启动子是基因特异性内源启动子。在一个实施方式中,所述启动子包含本源基因启动子元件。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCA时,所述启动子是PCCA基因特异性内源启动子,其包含与SEQ ID NO:34的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCB时,所述启动子是PCCB基因特异性内源启动子,其包含与SEQ ID NO:36的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。

在某些实施方式中,所述包装的载体基因组还包含一个或多个增强子序列。在一个实施方式中,所述增强子选自巨细胞病毒(CMV)立即早期基因增强子、甲状腺素运载蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子和载脂蛋白E(ApoE)增强子。在示例性实施方式中,所述增强子是CMV增强子。在一个实施方式中,所述CMV增强子包含SEQ IDNO:19或由其构成。在某些实施方式中,所述增强子位于所述启动子序列上游。

在某些实施方式中,包装的载体基因组还包含一个或多个内含子序列。在一个实施方式中,所述内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人类β珠蛋白IVS2内含子、β-珠蛋白/IgG嵌合内含子(Promega嵌合内含子)或hFIX内含子。在一个示例性实施方式中,所述内含子是SV40小T内含子。在一个实施方式中,所述SV40小T内含子序列包含SEQ ID NO:20或由其构成。在另一个示例性实施方式中,所述内含子是rHBB内含子。在一个实施方式中,所述rHBB内含子序列包含SEQ ID NO:21或由其构成。

在某些实施方式中,包装的载体基因组还包含共有Kozak序列。在某些实施方式中,所述共有Kozak序列位于内含子序列下游。在一个实施方式中,所述共有Kozak序列是GCCGCC(SEQ ID NO:24)。在某些实施方式中,所述共有Kozak序列位于PCCA的编码序列上游。在某些实施方式中,所述共有Kozak序列位于PCCB的编码序列上游。

在某些实施方式中,包装的载体基因组还包含多聚腺苷酸化信号序列。在某些实施方式中,所述多聚腺苷酸化信号序列选自牛生长激素(BGH)多聚腺苷酸化信号序列、SV40多聚腺苷酸化信号序列、兔β珠蛋白多聚腺苷酸化信号序列、PCCA基因特异性内源多聚腺苷酸化信号序列、PCCB基因特异性内源多聚腺苷酸化信号序列。在示例性实施方式中,所述多聚腺苷酸化信号序列是牛生长激素(BGH)多聚腺苷酸化信号序列。在一个实施方式中,所述BGH多聚腺苷酸化信号序列包含SEQ ID NO:22或由其构成。在另一个示例性实施方式中,所述多聚腺苷酸化信号序列是SV40多聚腺苷酸化信号序列。在一个实施方式中,所述SV40多聚腺苷酸化信号序列包含SEQ ID NO:23或由其构成。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCA时,所述多聚腺苷酸化信号序列包含PCCA基因特异性内源多聚腺苷酸化信号序列。在一个实施方式中,所述PCCA基因特异性内源多聚腺苷酸化信号序列包含与SEQ ID NO:35的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCB时,所述多聚腺苷酸化信号序列包含PCCB基因特异性内源多聚腺苷酸化信号序列。在一个实施方式中,所述PCCB基因特异性内源多聚腺苷酸化信号序列包含与SEQID NO:37的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。

在某些实施方式中,所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。在一个示例性实施方式中,所述AAV衣壳来自于AAV9。在另一个示例性实施方式中,所述AAV衣壳来自于AAV8。在另一个示例性实施方式中,所述AAV衣壳是AAV9变体衣壳。

在某些实施方式中,本公开提供了一种rAAV,其中所述编码序列是针对PCCA而不是针对PCCB,所述启动子是PCCA基因特异性内源启动子而不是PCCB基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列而不是PCCB基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,本公开提供了一种rAAV,其中所述编码序列是针对PCCB而不是针对PCCA,所述启动子是PCCB基因特异性内源启动子而不是PCCA基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列而不是PCCA基因特异性内源多聚腺苷酸化信号序列。

在某些情况下,本公开提供了编码PCCA的新的密码子优化的核酸序列。在一个实施方式中,所述编码PCCA的密码子优化的核酸序列与SEQ ID NO:1中示出的野生型编码序列具有少于80%同一性。在某些实施方式中,所述编码PCCA的密码子优化的核酸序列与SEQID NOs:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。在某些实施方式中,本公开提供了与SEQ ID NO:1中示出的野生型编码序列具有少于80%同一性并且与SEQ ID NOs:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自SEQ ID NOs:2-6的编码PCCA的核酸序列。还提供了SEQ ID NOs:2-6中示出的核酸序列的编码具有功能性PCCA活性的多肽的片段。在某些实施方式中,所述编码PCCA的核酸序列还可以在3’末端处包含终止密码子(TGA、TAA或TAG)。

在某些情况下,本公开提供了编码PCCB的新的密码子优化的核酸序列。在一个实施方式中,所述编码PCCB的密码子优化的核酸序列与SEQ ID NO:7中示出的野生型编码序列具有少于80%同一性。在某些实施方式中,所述编码PCCB的密码子优化的核酸序列与SEQID NOs:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。本公开提供了与SEQ ID NO:7中示出的野生型编码序列具有少于80%同一性并且与SEQ ID NOs:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自SEQ ID NOs:8-12的编码PCCB的核酸序列。还提供了SEQ ID NOs:8-12中示出的核酸序列的编码具有功能性PCCB活性的多肽的片段。在某些实施方式中,所述编码PCCB的核酸序列还可以在3’末端处包含终止密码子(TGA、TAA或TAG)。

在某些实施方式中,本公开提供了可作为基因疗法药剂用于治疗PA的重组腺相关病毒(rAAV),其中所述rAAV包含AAV衣壳和包装在其中的本文中所描述的载体基因组。在某些实施方式中,所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV(即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV9、AAV10、AAV11、AAV12、AAVrh10或AAVhu37)。在示例性实施方式中,所述AAV载体是AAV血清型9(AAV9)载体、AAV9变体载体、AAV血清型8(AAV8)载体或AAV血清型2(AAV2)载体。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自SEQ ID NOs:1-6的PCCA的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’ITR序列。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自SEQ ID NOs:7-12的PCCB的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’ITR序列。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自SEQ ID NOs:1-6的PCCA的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-ITR序列。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)5’-ITR序列;(b)增强子序列;(c)启动子序列;(d)内含子序列;(e)选自SEQ ID NOs:7-12的PCCB的编码序列;(f)多聚腺苷酸化信号序列;和(g)3’-ITR序列。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)AAV2 5’-ITR序列;(b)CMV增强子序列;(c)CBA启动子序列;(d)rHBB或SV40小T内含子序列;(e)选自SEQ ID NOs:1-6的PCCA的编码序列;(f)BGH或SV40多聚腺苷酸化信号序列;和(g)AAV2 3’-ITR序列。

在某些实施方式中,本公开提供了一种可用于治疗丙酸血症(PA)的rAAV,所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:(a)AAV2 5’-ITR序列;(b)CMV增强子序列;(c)CBA启动子序列;(d)rHBB或SV40小T内含子序列;(e)选自SEQ ID NOs:7-12的PCCB的编码序列;(f)BGH或SV40多聚腺苷酸化信号序列;和(g)AAV2 3’-ITR序列。

在某些实施方式中,本公开提供了一种重组核酸构建物,其包含(a)5’-ITR序列;(b)启动子序列;(c)PCCA的部分或完整编码序列;和(d)3’-ITR序列。在某些实施方式中,本公开提供了一种重组核酸构建物,其包含(a)5’-ITR序列;(b)启动子序列;(c)PCCB的部分或完整编码序列;和(d)3’-ITR序列。

在某些情况下,本公开提供了本文公开的rAAV用于治疗PA的用途,其中所述rAAV包括AAV衣壳和包装在其中的载体基因组。在某些实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列,以及3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子上游的增强子序列、在所述启动子下游的内含子和在所述3’-ITR上游的多聚腺苷酸化序列。在一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,CBA启动子,SV40小T内含子,PCCA的编码序列,BGH多聚腺苷酸化信号序列和AAV2 3’-ITR。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有Kozak序列。在某些实施方式中,所述PCCA的编码序列选自SEQ ID NOs:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些情况下,本公开提供了本文中公开的rAAV用于治疗PA的用途,其中所述rAAV包括AAV衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列(例如PCCA基因特异性内源启动子序列),人类PCCA 5’-UTR的截短或完整的核苷酸序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类PCCA 3’-UTR的截短或完整的核苷酸序列,以及3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所启动子述下游的内含子和在所述3’-ITR上游的PCCA基因特异性多聚腺苷酸化序列。在某些实施方式中,所述包装的基因组还包含位于所述人类PCCA 5’-UTR的截短或完整的核苷酸序列下游并在PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列上游的共有Kozak序列。在某些实施方式中,所述PCCA的编码序列选自SEQ ID NOs:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些情况下,本公开提供了本文中公开的rAAV用于治疗PA的用途,其中所述rAAV包括AAV衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列,以及3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-ITR上游的多聚腺苷酸化序列。在一个示例性实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,CBA启动子,SV40小T内含子,PCCB的编码序列,BGH多聚腺苷酸化信号序列和AAV2 3’-ITR。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有Kozak序列。在某些实施方式中,所述PCCB的编码序列选自SEQ ID NOs:7-12。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些情况下,本公开提供了本文中公开的rAAV用于治疗PA的用途,其中所述rAAV包括AAV衣壳和包装在其中的载体基因组。在某些实施方式中,所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列(例如PCCB基因特异性内源启动子序列),人类PCCB 5’-UTR的截短或完整的核苷酸序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类PCCB 3’-UTR的截短或完整的核苷酸序列,以及3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-ITR上游的PCCB基因特异性多聚腺苷酸化序列。在某些实施方式中,所述包装的基因组还包含位于所述人类PCCB 5’-UTR的截短或完整的核苷酸序列下游并在PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列上游的共有Kozak序列。在某些实施方式中,所述PCCB的编码序列选自SEQ ID NO:7-12。在某些实施方式中,所述衣壳是AAV9衣壳。

本公开还涉及包含本文中公开的rAAV的药物组合物。在某些实施方式中,所述药物组合物包含可药用载体或赋形剂。在某些实施方式中,所述药物组合物被配制成用于皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述药物组合物被配制成用于静脉内施用。

另一方面,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列。在另一个实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。

在某些实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用:(1)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列;和(2)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述(1)和(2)的rAAV可以同时施用。在某些实施方式中,所述(1)和(2)的rAAV可以顺序施用。在某些实施方式中,所述(1)和(2)的rAAV可以分开施用。

在某些实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用:(1)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCA而不是针对PCCB,所述启动子是PCCA基因特异性内源启动子而不是PCCB基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列而不是PCCB基因特异性内源多聚腺苷酸化信号序列;和(2)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCB而不是针对PCCA,所述启动子是PCCB基因特异性内源启动子而不是PCCA基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列而不是PCCA基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述(1)和(2)的rAAV可以同时施用。在某些实施方式中,所述(1)和(2)的rAAV可以顺序施用。在某些实施方式中,所述(1)和(2)的rAAV可以分开施用。

在某些实施方式中,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向被诊断为在PCCA中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCA中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在PCCA中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCA而不是针对PCCB,所述启动子是PCCA基因特异性内源启动子而不是PCCB基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列而不是PCCB基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCA中的突变选自表1。在某些实施方式中,所述PCCA的编码序列选自SEQ ID NOs:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些情况下,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向被诊断为在PCCB中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCB中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在PCCB中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCB而不是针对PCCA,所述启动子是PCCB基因特异性内源启动子而不是PCCA基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列而不是PCCA基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCB中的突变选自表2。在某些实施方式中,所述PCCB的编码序列选自SEQ ID NOs:7-12。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些实施方式中,所述rAAV被皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述rAAV被静脉内施用。在某些实施方式中,所述rAAV以约1x10

在某些情况下,本文中提供了包含本文中公开的重组核酸分子、AAV载体或rAAV的宿主细胞。在特定实施方式中,所述宿主细胞可能适合于AAV的繁殖。在某些实施方式中,所述宿主细胞选自HeLa、Cos-7、HEK293、A549、BHK、Vero、RD、HT-1080、ARPE-19或MRC-5细胞。

本发明的这些和其他方面和特点在本公开的下述章节中描述。

附图说明

参考下述附图,可以更完全地理解本发明。

图1是原理图,示出了根据一个实施方式的包含PCCA的示例性包装的载体基因组构建物。在所述图中,5’-ITR、CMV增强子、鸡β-肌动蛋白启动子、SV40小T内含子、共有Kozak序列、PCCA编码序列、SV40多聚腺苷酸化信号和3’-ITR分别由1、2、3、4、5、6、7和8表示。

图2是原理图,示出了根据一个实施方式的包含PCCB的示例性包装的载体基因组构建物。在所述图中,5’-ITR、CMV增强子、鸡β-肌动蛋白启动子、SV40小T内含子、共有Kozak序列、PCCB编码序列、SV40多聚腺苷酸化信号和3’-ITR分别由1、2、3、4、5、6、7和8表示。

图3是条形图,示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)转染连续肝细胞系(HepG2)后,通过RT-qPCR所确定的PCCA RNA表达的变化倍数。

图4A是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)、带有编码人类PCCA的完整本源序列的核苷酸序列和编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC365)或带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)转染的连续肝细胞系(HepG2)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图4B是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)或带有编码人类PCCA的完整本源序列的核苷酸序列和编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC365)转染的连续肝细胞系(Huh7)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图5是照片,示出了在从用或未用带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)转染的连续肝细胞系(HepG2)分离的全细胞裂解液(WCL)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过Western印迹所检测的PCCA蛋白表达水平。1X和2X表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图6是条形图,从左至右示出了在连续肾细胞系(HEK293)的三重转染后通过qPCR所确定的PCCA AAV9滴度(以基因组拷贝(GC)/mL为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)转染,每种质粒在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无TX”。

图7是从左至右分别为亲和纯化的含有表达PCCA和PCCB的重组AAV(rAAV)载体盒(DTC365)、表达PCCA的重组AAV(rAAV)载体盒(DTC349、DTC348、DTC347或DTC346)或表达eGFP的重组AAV(rAAV)载体盒(DTC343)的AAV9粒子的DNA碱性琼脂糖凝胶的照片。

图8是条形图,示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC370、DTC368、DTC369或DTC371)转染连续肝细胞系(HepG2)后,通过RT-qPCR所确定的PCCB RNA表达的变化倍数。

图9A是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)转染的连续肝细胞系(HepG2)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图9B是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC369、DTC368、DTC370或DTC371)转染的连续肝细胞系(Huh7)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图10是照片,示出了在从用或未用带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)转染的连续肝细胞系(HepG2)分离的全细胞裂解液(WCL)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过Western印迹所检测的PCCB蛋白表达水平。1X和2X表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

图11是条形图,从左至右示出了在连续肾细胞系(HEK293)的三重转染后通过qPCR所确定的PCCB AAV9滴度(以基因组拷贝(GC)/mL为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)转染,每种质粒在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无TX”。

图12是从左至右分别为亲和纯化的含有对照质粒(带有空载体、没有TX的质粒)、表达eGFP的重组AAV(rAAV)载体盒(DTC343)或表达PCCB的重组AAV(rAAV)载体盒(DTC366、DTC367、DTC368、DTC369、DTC370或DTC371)的AAV9粒子的DNA碱性琼脂糖凝胶的照片。

图13是条形图,示出了在野生型FVB小鼠中,在用编码人类PCCA的完整本源序列(DTC346)或人类PCCA的密码子优化的序列(DTC347、DTC348或DTC349)的rAAV治疗后,人类PCCA蛋白表达相对于小鼠内源PCCA表达的百分率。误差条表示标准偏差。

图14是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)或人类PCCA的密码子优化的序列(DTC347、DTC348或DTC349)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中表达的人类野生型PCCA蛋白的浓度(以nmol/g蛋白为单位)。所列出的百分数表示被计算为相对于野生型FVB小鼠的内源PCCA蛋白水平的百分率的人类野生型PCCA表达。误差条表示标准偏差。

图15是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中通过每分钟的平均计数(CPM)数据所度量的人类PCCA活性。误差条表示标准偏差。所列出的百分数描述了相对于在野生型FVB小鼠中观察到的数据的CPM数据。**表示使用Dunnett多重比较检验与PBS治疗组相比p<0.01。

图16A-C是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中的已知丙酸血症生物标志物的浓度。图16A是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中C3(丙酰肉碱)的血浆浓度。图16B是在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中血浆C3/C2浓度比(丙酰肉碱/乙酰肉碱)的条形图。图16C是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中2-甲基柠檬酸(2MC)的血浆浓度。Pre表示在rAAV注射前0至14天,2W表示在rAAV注射后2周,3W表示在rAAV注射后3周,4W表示在rAAV注射后4周,6W表示在rAAV注射后6周。误差条表示标准偏差。**表示与PBS治疗组相比p<0.01,***表示与PBS治疗组相比p<0.001,使用Dunnett多重比较检验。

发明详述

本发明提供了大量用于治疗性应用的新的药剂和组合物。正如本文中所描述的,本发明的核酸序列、载体、重组病毒和相关组合物可用于改善、预防或治疗PA。

除非另有指明,否则技术术语按照常规用法使用。分子生物学常用术语的定义可以在下述文献中找到:Benjamin Lewin,《基因V》(Genes V),Oxford University Press出版,1994(ISBN 0-19-854287-9);Kendrew等主编,《分子生物学百科全书》(TheEncyclopedia of Molecular Biology),Blackwell Science Ltd.出版,1994(ISBN 0-632-02182-9);Robert A.Meyers主编,《分子生物学和生物技术详尽桌面参考》(MolecularBiology and Biotechnology:a Comprehensive Desk Reference),VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8)。

为了促进对本公开的各种不同实施方式的回顾,提供了下述对特定术语的解释:

腺相关病毒(AAV):一种小型的复制缺陷型无包膜病毒,可感染人类和一些其他灵长类物种。尚不知道AAV会引起疾病,并且它引发非常轻微的免疫应答。利用AAV的基因疗法载体可以感染分裂和静止期细胞两者,并且可以以染色体外状态持续存在而不会整合到宿主细胞的基因组中。这些特性使AAV成为有吸引力的用于基因疗法的病毒载体。目前存在12种公认的AAV血清型(AAV1–12)。

施用:将药剂例如治疗剂(例如重组AAV)通过任何有效的途径提供或给予到受试者。示例性的施用途径包括但不限于注射(例如皮下、肌肉内、真皮内、腹膜内和静脉内)、口服、管内、舌下、直肠、透皮、鼻内、阴道和吸入途径。

密码子优化的:“密码子优化的”核酸是指已被改变以使密码子最适合于在特定系统(例如特定物种或物种组)中表达的核酸序列。例如,可以将核酸序列优化以在哺乳动物细胞或特定哺乳动物物种(例如人类细胞)中表达。密码子优化不改变所编码的蛋白质的氨基酸序列。

增强子:一种通过提高启动子活性来提高转录速率的核酸序列。

内含子:基因内不含蛋白质编码信息的一段DNA。内含子在信使RNA翻译之前被去除。

反向末端重复序列(ITR):腺相关病毒的基因组中为高效复制所需的对称核酸序列。ITR序列位于AAV DNA基因组的每个末端处。ITR充当病毒DNA合成的复制原点,并且是用于产生AAV整合载体的必需顺式组分。

分离的:“分离的”生物组分(例如核酸分子、蛋白质、病毒或细胞)已与所述组分天然存在于其中的生物体的细胞或组织中的其他生物组分或所述生物体本身,例如其他染色体和染色体外DNA和RNA、蛋白质和细胞基本上分离开或从其中纯化出来。已被“分离的”核酸分子和蛋白质包括通过标准纯化方法纯化的那些核酸分子和蛋白质。所述术语还包括在宿主细胞中通过重组表达制备的核酸分子和蛋白质以及化学合成的核酸分子和蛋白质。

可操作连接:当第一核酸序列被放置成与第二核酸序列功能上相关时,所述第一核酸序列与所述第二核酸序列可操作连接。例如,如果启动子影响编码序列的转录或表达,则所述启动子可操作连接到所述编码序列。通常,可操作连接的DNA序列是毗邻的,并且在必需联结两个蛋白质编码区的情况下处于同一阅读框中。

可药用载体:在本公开中有用的可药用载体(介质)是常规的。《Remington制药学》(Remington's Pharmaceutical Sciences),E.W.Martin,Mack Publishing Co.,Easton,Pa.,第15版(1975)描述了适合于一种或多种治疗性化合物、分子或药剂的药物递送的组合物和制剂。

通常,载体的性质取决于所采用的特定施用方式。例如,肠胃外制剂通常包含可注射流体作为介质,其包括制药学和生理学上可接受的流体例如水、生理盐水、平衡盐溶液、右旋糖水溶液、甘油等。对于固体组合物例如粉剂、丸剂、片剂或胶囊形式来说,常规的无毒固体载体可以包括例如制药级甘露糖醇、乳糖、淀粉或硬脂酸镁。除了生物学中性的载体之外,待施用的药物组合物还可以含有少量无毒辅助性物质,例如润湿剂或乳化剂、防腐剂和pH缓冲剂等,例如乙酸钠或失水山梨糖醇单月桂酸酯。

预防、治疗或改善疾病:“预防”疾病(例如PA)是指抑制疾病的全面发展。“治疗”是指在疾病或病理状况(例如PA)已开始发展后改善其体征或症状的治疗性干预。“改善”是指降低疾病(例如PA)的体征或症状的数目或严重性。

启动子:指导/启动核酸(例如基因)的转录的DNA区域。启动子包括靠近转录起始位点的必需核酸序列。对于本领域技术人员来说许多启动子序列是已知的,甚至在人工核酸分子中不同启动子序列的组合也是可能的。当在本文中使用时,基因特异性内源启动子是指调控感兴趣的内源基因的表达的本源启动子元件。在示例性实施方式中,PCCA基因特异性内源启动子调控PCCA基因的表达。在另一个示例性实施方式中,PCCB基因特异性内源启动子调控PCCB基因的表达。

纯化的:术语“纯化的”不要求绝对纯度;相反,它打算作为相对术语。因此,例如,纯化的肽、蛋白质、病毒或其他活性化合物是与天然相伴的蛋白质和其他污染物完全或部分分离开的肽、蛋白质、病毒或其他活性化合物。在某些实施方式中,术语“基本上纯化的”是指已从细胞、细胞培养基或其他粗制备物中分离出来并经过分级分离以除去初始制备物中的各种不同组分例如蛋白质、细胞碎片和其他组分的肽、蛋白质、病毒或其他活性化合物。

重组的:重组核酸分子是具有非天然存在的序列或具有通过两个原本分开的序列区段的人工合并而制造的序列的核酸分子。这种人工组合可以通过化学合成或通过分离的核酸分子区段的人工操作,例如通过遗传工程技术来实现。

同样地,重组病毒是包含非天然存在的或通过至少两个不同起源的序列的人工合并而制造的序列(例如基因组序列)的病毒。术语“重组的”还包括仅仅通过天然核酸分子、蛋白质或病毒的一部分的添加、替换或缺失而改变的核酸、蛋白质和病毒。当在本文中使用时,“重组AAV”是指重组核酸分子例如编码PCCA的重组核酸分子和/或编码PCCB的重组核酸分子已被包装在其中的AAV粒子。

序列同一性:两个或更多个核酸序列或两个或更多个氨基酸序列之间的同一性或相似性根据所述序列之间的同一性或相似性来表示。序列同一性可以根据同一性百分数来度量;所述百分数越高,所述序列越同一性。序列相似性可以根据相似性百分数(其将保守氨基酸替换考虑在内)来度量;所述百分数越高,所述序列越相似。核酸或氨基酸序列的同源物或直向同源物在使用标准方法比对时具有相对高的序列同一性/相似性程度。与亲缘关系更远的物种(例如人类和秀丽隐杆线虫序列)相比,当所述直向同源蛋白或cDNA源自于亲缘关系更近的物种(例如人类和小鼠序列)时,这种同源性更加显著。

用于比较目的的序列比对方法在本领域中是公知的。各种不同的程序和比对算法描述在下述文献中:Smith&Waterman,Adv.Appl.Math.2:482,1981;Needleman&Wunsch,J.Mol.Biol.48:443,1970;Pearson&Lipman,Proc.Natl.Acad.Sci.USA 85:2444,1988;Higgins&Sharp,Gene,73:237-44,1988;Higgins&Sharp,CABIOS5:151-3,1989;Corpet等,Nuc.Acids Res.16:10881-90,1988;Huang等,Computer Appls.in the Biosciences 8,155-65,1992;和Pearson等,Meth.Mol.Rio.24:307-31,1994。Altschul等,J.Mol.Biol.215:403-10,1990提出了序列比对方法和同源性计算的详细考量。

NCBI基本局部比对搜索工具(Basic Local Alignment Search Tool)(BLAST)(Altschul等,J.Mol.Biol.215:403-10,1990)可以从几个来源获得,包括美国国家生物信息中心(National Center for Biological Information)(NCBI)和因特网上,以与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。其他信息可以在NCBI网站上找到。

血清型:通过一组特征性抗原区分的一组密切相关的微生物(例如病毒)。

填充片段序列:是指包含在较大核酸分子(例如载体)内的,通常用于在两个核酸零件之间(例如启动子与编码序列之间)产生所需间隔或延伸核酸分子以使它具有所需长度的核苷酸序列。填充片段序列不含蛋白质编码信息,并且可以具有未知/合成起源和/或与较大核酸分子内的其他核酸序列无关。

受试者:活的多细胞脊椎动物生物体,包括人类和非人类哺乳动物的一个类别。

合成的:在实验室中通过人工手段生产的,例如合成的核酸可以在实验室中化学合成。

非翻译区(UTR):典型的mRNA在编码区的上游和下游分别含有5′非翻译区(“5′UTR”)和3′非翻译区(3′UTR)(参见Mignone F.等,(2002)Genome Biol 3:REVIEWS0004)。

治疗有效量:指定药物或治疗剂(例如重组AAV)的足以在正用所述药剂治疗的受试者或细胞中实现所需效果的量。药剂的有效量取决于几种因素,包括但不限于正治疗的受试者或细胞和所述治疗性组合物的施用方式。

载体:载体是一种核酸分子,其允许外来核酸的插入而不破坏所述载体在宿主细胞中复制和/或整合的能力。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制原点。载体还可以包括一个或多个可选择标记基因和其他遗传元件。表达载体是含有允许插入的一个或多个基因的转录和翻译的必需调控序列的载体。在本文的某些实施方式中,所述载体是AAV载体。

除非另有解释,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。没有具体数目的指称包括复数指称物,除非上下文清楚地指明不是如此。“包含A或B”意味着包括A或B或A和B。还应该理解,为核酸或多肽提供的所有碱基尺寸或氨基酸尺寸以及所有分子重量或分子质量值均为近似值,并且出于描述的目的而提供。尽管与本文中描述的相似或等同的方法和材料可用于本公开的实践或试验,但在下文中描述了适合的方法和材料。本文中提到的所有出版物、专利申请、专利和其他参考文献整体通过参考并入本文。在有冲突的情况下,以本说明书包括术语的解释为准。此外,材料、方法和实例仅仅是说明性的而不打算是限制性的。

在某些情况下,本公开提供了腺相关病毒(AAV)载体,其含有包装的基因组,所述包装的基因组包含AAV 5’-ITR、启动子序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列以及AAV 3’-ITR。

在某些实施方式中,本公开提供了一种AAV载体,其含有包装的基因组,所述包装的基因组包含AAV 5’-ITR、启动子序列、人类PCCA5’-UTR的截短或完整的核苷酸序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCA3’-UTR核苷酸序列以及AAV 3’-ITR。

在某些情况下,本公开提供了AAV载体,其含有包装的基因组,所述包装的基因组包含AAV 5’-ITR、启动子序列、PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列以及AAV 3’-ITR。

在某些实施方式中,本公开提供了一种AAV载体,其含有包装的基因组,所述包装的基因组包含AAV 5’-ITR、启动子序列、人类PCCB5’-UTR的截短或完整的核苷酸序列、PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCB3’-UTR核苷酸序列以及AAV 3’-ITR。

在某些实施方式中,所述包装的基因组还可以包含本文中所描述的增强子、内含子、共有Kozak序列和/或多聚腺苷酸化信号。在某些实施方式中,所述重组载体还可以包含一个或多个填充片段核酸序列。在一个实施方式中,填充片段核酸序列位于所述内含子与PCCA或PCCB的部分或完整编码序列之间。

在本文中描述的各种不同实施方式中,所述重组病毒载体是AAV载体。所述AAV载体可以是血清型1、2、3、4、5、6、7、8、9、10、11或12的AAV载体(即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12)以及从人类和非人类灵长动物组织分离的超过100种变体中的任一者。参见例如Choi等,2005,Curr Gene Ther.5:299-310,2005和Gao等,2005,Curr Gene Ther.5:285-297。在本发明中可以使用任何血清型的AAV载体,并且AAV血清型的选择部分取决于基因疗法所靶向的细胞类型。对于PA的治疗来说,肝脏是相关的靶器官之一。在某些实施方式中,所述AAV载体选自血清型9(AAV9)、血清型8(AAV8)或其变体。在示例性实施方式中,所述AAV载体是血清型9(AAV9)或其变体。

在某些实施方式中,所述重组AAV载体包括AAV ITR序列,其在AAV和腺病毒辅助功能以反式提供时发挥载体DNA复制原点和载体基因组的包装信号两种作用。另外,所述ITR充当大Rep蛋白的单链核酸内切切口的靶,从复制中间体中拆分出单个基因组。

在某些实施方式中,所述5’-ITR序列来自于AAV2。在某些实施方式中,所述3’-ITR序列来自于AAV2。在某些实施方式中,所述5’-ITR序列和3’-ITR序列来自于AAV2。在某些实施方式中,所述5’-ITR序列和/或3’-ITR序列来自于AAV2,并且包含SEQ ID NO:15或由其构成。在其他实施方式中,所述5’-ITR序列和/或3’-ITR序列来自于非AAV2来源。

在某些示例性实施方式中,所述AAV载体是AAV血清型9(AAV9)载体,并且所述载体包含本文中描述的增强子、启动子、内含子、PCCA或PCCB的编码序列和多聚腺苷酸化信号。在某些实施方式中,所述AAV9载体还包含两个AAV2、AAV8或AAV9反向末端重复序列(ITR)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。在示例性实施方式中,所述AAV9载体包含两个AAV2反向末端重复序列(ITR)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。在某些实施方式中,所述AAV2 ITR序列包含SEQ ID NO:15或由其构成。在另一个示例性实施方式中,所述AAV9载体包含两个AAV9反向末端重复序列(ITR)序列:一个在所述增强子的5’,一个在所述多聚腺苷酸化信号的3’。

在本文中描述的各种不同情况下,提供了含有包装的基因组的病毒载体,所述包装的基因组包含帮助驱动和调控转入基因表达例如PCCA或PCCB的表达的启动子序列。在某些实施方式中,所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)立即早期基因启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子、CAG启动子、PCCA基因特异性内源启动子和PCCB基因特异性内源启动子。在示例性实施方式中,所述启动子序列位于所选的5’-ITR序列与PCCA或PCCB的部分或完整编码序列之间。在某些实施方式中,所述启动子序列位于增强子序列下游。在某些实施方式中,所述启动子序列位于内含子序列上游。在某些实施方式中,所述启动子序列位于所选的5’-ITR序列与人类PCCA或人类PCCB 5’-非翻译区(UTR)的截短或完整的核苷酸序列之间。

在某些说明性实施方式中,使用遍在的鸡β-肌动蛋白启动子(CBA),其可以任选地位于CMV立即早期增强子(CMV IE)下游。在某些实施方式中,本文描述的包装的基因组包含本源PCCA或PCCB启动子元件。在某些说明性实施方式中,当所述包装的基因组中的部分或完整编码序列是针对PCCA时,本文描述的包装的基因组包含PCCA基因特异性内源启动子,其包含与SEQ ID NO:34的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,本文描述的包装的基因组包含PCCA基因特异性内源启动子,其包含与SEQ ID NO:34的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725或约750)的核苷酸序列。在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCA时,本文描述的包装的基因组包含PCCA基因特异性内源启动子,其包含与SEQ ID NO:34的等长度区域100%同一性的至少15个连续核苷酸的核苷酸序列。

在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCB时,本文描述的包装的基因组包含PCCB基因特异性内源启动子,其包含与SEQ ID NO:36的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,本文描述的包装的基因组包含PCCB基因特异性内源启动子,其包含与SEQ ID NO:36的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425或约450)的核苷酸序列。在某些说明性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCB时,本文描述的包装的基因组包含PCCB基因特异性内源启动子,其包含与SEQ ID NO:36的等长度区域100%同一性的至少15个连续核苷酸的核苷酸序列。

在某些实施方式中,所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)立即早期基因启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子和CAG启动子。在示例性实施方式中,所述启动子是CBA启动子。在一个实施方式中,所述CBA启动子包含SEQ ID NO:18或由其构成。

除了启动子之外,包装的基因组还可以含有其他适合的转录起始、终止、增强子序列和高效RNA加工信号。正如在下文中进一步详细描述的,此类序列包括剪接和多聚腺苷酸化(poly A)信号、增强表达的调控元件(即WPRE)、使细胞质mRNA稳定的序列、增强翻译效率的序列(即Kozak共有序列)和增强蛋白质稳定性的序列。

在某些实施方式中,所述包装的基因组还包含共有Kozak序列。在某些实施方式中,所述共有Kozak序列位于内含子序列下游。在一个实施方式中,所述共有Kozak序列是GCCGCC(SEQ ID NO:24)。正如本领域技术人员将会理解的,所述共有Kozak序列通常紧靠编码序列的上游;在这种情况下,紧靠PCCA或PCCB的部分或完整编码序列的上游。正如专业技术人员将会认识到的,所述共有Kozak序列可以被认为共享对应于治疗性多肽例如PCCA或PCCB的起始密码子的ATG残基。为了公开的简化,本文中描述的共有Kozak序列包含对应于不与所述治疗性多肽例如PCCA或PCCB共享的区域的6个核苷酸的序列。

已知来自于内源基因特异性mRNA的5’-非翻译区(UTR)在通过与细胞内转录本竞争翻译起始因子和核糖体来优化转入基因生产,通过最小化mRNA衰减或转录后基因沉默来提高mRNA半衰期,以及避免与调控性蛋白或抑制性RNA二级结构的有害相互作用中发挥重要作用(参见Chiba,Y.和Green,P.(2009)J.Plant Biol.52,114–124;Moore,M.J.和Proudfoot,N.J.(2009)Cell 136,688–700;Jackson,R.J.等,(2010)Nat.Rev.Mol.CellBiol.11,113–127)。已发现所述位于蛋白质编码序列下游的3’-非翻译区(3’-UTR)参与大量调控过程,包括转录本切割、稳定性和多聚腺苷酸化、翻译和mRNA定位。因此它们在决定mRNA的命运中是至关重要的(参见Barrett,L.W.等,(2012)Cell Mol Life Sci.Nov;69(21):3613–3634)。在某些实施方式中,本公开提供了一种含有包装的基因组的rAAV,所述包装的基因组包含人类PCCA或PCCB 5’-UTR的截短或完整的核苷酸序列。在某些实施方式中,本公开提供了一种含有包装的基因组的rAAV,所述包装的基因组包含人类PCCA或PCCB3’-UTR的截短或完整的核苷酸序列。

在某些实施方式中,本公开提供了一种含有包装的基因组的rAAV,所述包装的基因组包含AAV 5’-ITR、启动子序列、人类PCCA 5’-UTR的截短或完整的核苷酸序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCA 3’-UTR核苷酸序列和AAV 3’-反向末端重复序列(ITR)。

在某些实施方式中,本公开提供了一种含有包装的基因组的rAAV,所述包装的基因组包含AAV 5’-ITR、启动子序列、人类PCCB 5’-UTR的截短或完整的核苷酸序列、PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列、截短或完整的人类PCCB 3’-UTR核苷酸序列和AAV 3’-ITR。

在某些实施方式中,所述包装的基因组包含由SEQ ID NO:30表示的完整的人类PCCA 5’-UTR。在某些实施方式中,所述包装的基因组包含由SEQ ID NO:32表示的完整的人类PCCB 5’-UTR。

在某些实施方式中,所述包装的基因组包含截短的本源人类PCCA 5’-UTR。在某些实施方式中,所述截短的人类PCCA 5’-UTR包含与SEQ ID NO:30的等长度区域至少95%同一性的约50个连续核苷酸至约1400个连续核苷酸(例如约75、约100、约125、约150、约175、约200、约250、约275、约300、约325、约350、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约900、约925、约950、约975、约1000、约1025、约1050、约1075、约1100、约1125、约1150、约1175、约1200、约1225、约1250、约1275、约1300、约1325或约1350)的核苷酸序列。

在某些实施方式中,所述包装的基因组包含截短的本源人类PCCB 5’-UTR。在某些实施方式中,所述截短的人类PCCB 5’-UTR包含与SEQ ID NO:32的等长度区域至少95%同一性的约50个连续核苷酸至约1400个连续核苷酸(例如约75、约100、约125、约150、约175、约200、约250、约275、约300、约325、约350、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约900、约925、约950、约975、约1000、约1025、约1050、约1075、约1100、约1125、约1150、约1175、约1200、约1225、约1250、约1275、约1300、约1325或约1350)的核苷酸序列。

在某些实施方式中,所述包装的基因组包含由SEQ ID NO:31表示的完整的人类PCCA 3’-UTR。在某些实施方式中,所述包装的基因组包含由SEQ ID NO:33表示的完整的人类PCCB 3’-UTR。

在某些实施方式中,所述包装的基因组包含截短的本源人类PCCA 3’-UTR。在某些实施方式中,所述截短的人类PCCA 3’-UTR包含与SEQ ID NO:31的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270)的核苷酸序列。

在某些实施方式中,所述包装的基因组包含截短的本源人类PCCB 3’-UTR。在某些实施方式中,所述截短的人类PCCB 3’-UTR包含与SEQ ID NO:33的等长度区域至少95%同一性的约15个连续核苷酸(例如约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140或约150)的核苷酸序列。

真如本文中所描述的,本发明的各个方面提供了含有包装的基因组的重组载体,所述包装的基因组包含AAV 5’-ITR、启动子序列、PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列和AAV 3’-ITR。本文中还描述了含有包装的基因组的重组载体,所述包装的基因组包含AAV 5’-ITR、启动子序列、部分或完整编码序列for PCCB或其同型或其功能性片段或功能性变体和AAV 3’-ITR。

在一个实施方式中,所述PCCA或PCCB的部分或完整编码序列是野生型编码序列。当在本文中使用时,术语“野生型”是指与自然界中存在的生物聚合物(例如多肽序列或多核苷酸序列)相同的生物聚合物(例如多肽序列或多核苷酸序列)。

在可选实施方式中,所述PCCA或PCCB的部分或完整编码序列是密码子优化的编码序列。在一个实施方式中,所述PCCA或PCCB的部分或完整编码序列为了在人类中表达而被密码子优化。

在本文中描述的各种不同实施方式中,提供了含有包装的基因组的载体,所述包装的基因组包含PCCA或PCCB的编码序列。使用本文中描述的载体递送的多肽涵盖可能在哺乳动物包括人类的治疗中有用的PCCA和PCCB多肽。

在某些实施方式中,所述用本文描述的载体表达的多肽是PCCA(SEQ ID NO:16;GenBank登记号NP_000273.2;728个氨基酸)或其功能性片段、功能性变体或功能性同型。在某些实施方式中,所述用本文中描述的载体表达的多肽是PCCA,并且包含SEQ ID NO:16或由其构成。

在一个实施方式中,所述PCCA多肽由SEQ ID NO:1中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达PCCA的天然同型或变体的编码序列,例如在UniProtKB/Swiss-Prot登记号P05165-1(SEQ ID NO:25)、P05165-2(SEQ ID NO:26)和P05165-3(SEQ ID NO:27)中示出的。在可选实施方式中,所述PCCA多肽由密码子优化的编码序列编码。在某些实施方式中,所述PCCA多肽由与SEQ ID NO:1中示出的野生型编码序列的同一性少于80%的密码子优化的编码序列编码。在某些示例性实施方式中,所述PCCA多肽由选自SEQ ID NOs:2-6的密码子优化的编码序列编码。在某些实施方式中,所述PCCA的编码序列还可能在3’末端处包含终止密码子(TGA、TAA或TAG)。

在某些实施方式中,所述用本文中描述的载体表达的多肽是PCCB(SEQ ID NO:17;GenBank登记号NP_000523.2;539个氨基酸)或其功能性片段、功能性变体或功能性同型。在某些实施方式中,所述用本文中描述的载体表达的多肽是PCCB,并且包含SEQ ID NO:17或由其构成。

在一个实施方式中,所述PCCB多肽由SEQ ID NO:7中示出的野生型编码序列编码。在另一个实施方式中,可以使用表达PCCB的天然同型或变体的编码序列,例如在UniProtKB/Swiss-Prot登记号P05166-1(SEQ ID NO:28)和P05166-2(SEQ ID NO:29)中示出的。在可选实施方式中,所述PCCB多肽由密码子优化的编码序列编码。在某些实施方式中,所述PCCB多肽由与SEQ ID NO:7中示出的野生型编码序列的同一性少于80%的密码子优化的编码序列编码。在某些示例性实施方式中,所述PCCB多肽由选自SEQ ID NOs:8-12的密码子优化的编码序列编码。在某些实施方式中,所述PCCB的编码序列还可能在3’末端处包含终止密码子(TGA、TAA或TAG)。

在各种不同情况下,本发明可用于递送本文中描述的PCCA或PCCB多肽的片段、变体、同型或融合体。

在某些实施方式中,本发明可用于递送PCCA或PCCB多肽的片段,其包含至少50、100、150、200、250、300、350、400、450、500、550或600个氨基酸残基,并保留与所述全长多肽相关的一种或多种活性(例如在酶的情况下催化活性)。此类片段可以通过本领域中常规且公知的重组技术来获得。此外,可以通过专业技术人员已知的常规体外测定法来测试此类片段。例如,丙酰辅酶A羧化酶(PCC)活性可以通过下述步骤测定:(1)将所述多肽在含有1mM2-巯基乙醇和0.1mg/ml牛血清白蛋白的10mM磷酸盐缓冲液(pH 7.0)中稀释,(2)取出含有50mM Tris-HCl pH 8.0、5mM谷胱甘肽、2mM ATP、100mM KCl、10mM MgCl

在某些实施方式中,本发明可用于递送所述PCCA或PCCB多肽的变体。在某些实施方式中,所述变体多肽可以与野生型治疗性多肽例如SEQ ID NO:16的野生型PCCA多肽或SEQ ID NO:17的野生型PCCB多肽至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述变体治疗性多肽与相应的野生型多肽相比可能具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个不同残基。此类变体可以通过本领域中常规且公知的重组技术来获得。此外,可以通过专业技术人员已知的常规体外测定法来测试此类变体的催化活性。对于丙酰辅酶A羧化酶活性测定法的描述,参见例如Kalousek等,1980,J Biol Chem255(1):60-65和Hsia等,1973J.Pediatr.83:625-628。本发明还包括编码上述治疗性多肽变体的核酸分子。

在某些情况下,本公开提供了编码PCCA的新的密码子优化的核酸序列。在一个实施方式中,所述编码PCCA的密码子优化的核酸序列与SEQ ID NO:1中示出的野生型编码序列的同一性少于80%。在某些实施方式中,所述编码PCCA的密码子优化的核酸序列与SEQID NOs:2-6至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述编码PCCA的密码子优化的核酸序列与选自SEQ ID NOs:2-6的序列100%同一性。在某些实施方式中,本公开提供了与SEQ IDNO:1中示出的野生型编码序列的同一性少于80%,并且与SEQ ID NOs:2-6的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自SEQ ID NOs:2-6的编码PCCA的核酸序列。还提供了SEQ ID NOs:2-6中示出的核酸序列的片段,其编码具有功能性PCCA活性的多肽。在某些实施方式中,所述编码PCCA的核酸序列还可以在3’末端处包含终止密码子(TGA、TAA或TAG)。

在某些情况下,本公开提供了编码PCCB的新的密码子优化的核酸序列。在一个实施方式中,所述编码PCCB的密码子优化的核酸序列与SEQ ID NO:7中示出的野生型编码序列的同一性少于80%。在某些实施方式中,所述编码PCCB的密码子优化的核酸序列与SEQID NOs:8-12至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)同一性。在某些实施方式中,所述编码PCCB的密码子优化的核酸序列与选自SEQ ID NOs:8-12的序列100%同一性。在某些实施方式中,本公开提供了与SEQID NO:7中示出的野生型编码序列的同一性少于80%,并且与SEQ ID NOs:8-12的同一性为至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核酸序列。在示例性实施方式中,本公开提供了选自SEQ ID NOs:8-12的编码PCCB的核酸序列。还提供了在SEQ ID NOs:8-12中示出的核酸序列的片段,其编码具有功能性PCCB活性的多肽。在某些实施方式中,所述编码PCCB的核酸序列还可以在3’末端处包含终止密码子(TGA、TAA或TAG)。

在某些实施方式中,所述rAAV含有包装的载体基因组,其还包含一个或多个增强子序列。在一个实施方式中,所述增强子选自巨细胞病毒立即早期基因(CMV)增强子、甲状腺素运载蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子和ApoE增强子。在示例性实施方式中,所述增强子是CMV增强子。在一个实施方式中,所述CMV增强子包含SEQ IDNO:19或由其构成。

在某些实施方式中,所述rAAV含有包装的载体基因组,其还包含一个或多个内含子序列。在一个实施方式中,所述内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人类β珠蛋白IVS2内含子、Promega嵌合内含子或hFIX内含子。在一个示例性实施方式中,所述内含子是SV40小T内含子。在一个实施方式中,所述SV40小T内含子序列包含SEQ IDNO:20或由其构成。在另一个示例性实施方式中,所述内含子是rHBB内含子。在一个实施方式中,所述rHBB内含子序列包含SEQ ID NO:21或由其构成。

在某些实施方式中,所述rAAV含有包装的载体基因组,其还包含多聚腺苷酸化信号序列。在一个实施方式中,所述多聚腺苷酸化信号序列选自牛生长激素(BGH)多聚腺苷酸化信号序列、SV40多聚腺苷酸化信号序列、兔β珠蛋白多聚腺苷酸化信号序列、PCCA基因特异性内源多聚腺苷酸化信号序列、PCCB基因特异性内源多聚腺苷酸化信号序列。在示例性实施方式中,所述多聚腺苷酸化信号序列是牛生长激素(BGH)多聚腺苷酸化信号序列。在一个实施方式中,所述BGH多聚腺苷酸化信号序列包含SEQ ID NO:22或由其构成。在另一个示例性实施方式中,所述多聚腺苷酸化信号序列是SV40多聚腺苷酸化信号序列。在一个实施方式中,所述SV40多聚腺苷酸化信号序列包含SEQ ID NO:23或由其构成。在一个实施方式中,所述多聚腺苷酸化信号序列是基因特异性内源多聚腺苷酸化序列。在示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCA时,所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCA基因特异性内源多聚腺苷酸化信号序列包含与SEQ ID NO:35的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,所述PCCA基因特异性内源多聚腺苷酸化信号序列包含与SEQ ID NO:35的等长度区域至少95%同一性的约15个连续核苷酸(例如约20、约30、约40、约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150或约160)的核苷酸序列。在另一个示例性实施方式中,当所述载体基因组中的部分或完整编码序列是针对PCCB时,所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCB基因特异性内源多聚腺苷酸化信号序列包含与SEQID NO:37的等长度区域至少95%同一性的至少15个连续核苷酸的核苷酸序列。在某些实施方式中,所述PCCA基因特异性内源多聚腺苷酸化信号序列包含与SEQ ID NO:37的等长度区域至少95%同一性的约15个连续核苷酸(例如约20、约30、约40、约50、约60、约70、约80、约90或约100)的核苷酸序列。

另一方面,本公开提供了在PA的治疗中可用作基因疗法药剂的rAAV,其中所述rAAV包含AAV衣壳和包装在其中的本文中所描述的载体基因组。在某些实施方式中,所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV(即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV9、AAV10、AAV11、AAV12、AAVrh10或AAVhu37)。在示例性实施方式中,所述AAV载体是AAV血清型9(AAV9)载体、AAV9变体载体、AAV血清型8(AAV8)载体或AAV血清型2(AAV2)载体。

所述AAV9衣壳是一种由多个AAV9 vp蛋白组成的自组装的AAV衣壳。所述AAV9 vp蛋白通常被表达为由SEQ ID NO:13的核酸序列或与其至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%同一性的序列编码的可选剪接变体,所述核酸序列编码SEQ ID NO:14的vp1氨基酸序列(GenBank登记号AAS99264)。这些剪接变体产生SEQ ID NO:14的不同长度的蛋白质。在某些实施方式中,AAV9衣壳包括具有与AAS9926499%同一性或与SEQ ID NO:14 99%同一性的氨基酸序列的AAV。也参见美国专利号7,906,111和WO/2005/033321。当在本文中使用时,AAV9变体包括在例如WO/2016/049230、美国专利号8,927,514、美国专利公布号2015/0344911和美国专利号8,734,809中所描述的。

正如本文中指示的,所述AAV9序列和蛋白可用于生产rAAV。然而,在其他实施方式中,选择另一种AAV衣壳。组织特异性由衣壳类型决定。可以选择转导适合的靶(例如肝脏、肌肉、肺或CNS)的AAV血清型作为AAV病毒载体的衣壳的来源,包括例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAV8、AAV9、AAVrh10、AAVrh64Rl、AAVrh64R2、AAVrh8。参见例如美国专利公布号2007/0036760、美国专利公布号2009/0197338和EP1310571。也参见WO2003/042397(AAV7和其他猿猴AAV)、美国专利号7282199和7790449(AAV8)。此外,可以使用尚未发现的AAV或基于它们的重组AAV作为AAV衣壳的来源。这些文献还描述了可以被选择用于产生AAV的其他AAV,并且通过参考并入本文。在某些实施方式中,在病毒载体中使用的AAV衣壳可以通过上述AAV衣壳之一或其编码核酸的突变(即通过插入、缺失或替换)来产生。在某些实施方式中,所述AAV衣壳是嵌合的,包含来自于上述AAV衣壳蛋白中的两者或三者或四者或更多者的结构域。在某些实施方式中,所述AAV衣壳是来自于两种或三种不同AAV或重组AAV的Vpl、Vp2和Vp3单体的嵌合体。在某些实施方式中,rAAV组合物包含超过一种上述衣壳。

在某些情况下,本文提供了包含本文中公开的重组核酸分子、病毒载体例如AAV载体或rAAV的宿主细胞。在特定实施方式中,所述宿主细胞可能适合于AAV的繁殖。

可以使用广范围的宿主细胞,例如细菌、酵母、昆虫、哺乳动物细胞等。在某些实施方式中,所述宿主细胞可以是适合于生产重组AAV(rAAV)的细胞(或细胞系),例如HeLa、Cos-7、HEK293、A549、BHK、Vero、RD、HT-1080、ARPE-19或MRC-5细胞。

所述重组核酸分子或载体可以使用本领域中已知的任何适合的方法递送到所述宿主细胞培养物。在某些实施方式中,产生在其基因组中插入有所述重组核酸分子或载体的稳定的宿主细胞系。在某些实施方式中,产生含有本文中描述的rAAV载体的稳定宿主细胞系。在将所述rAAV载体转染到宿主培养物后,所述rAAV在宿主基因组中的整合可以通过各种不同方法来测定,例如抗生素选择、荧光激活细胞分拣、southern印迹、基于PCR的检测、荧光原位杂交,正如在下述文献中所描述的:Nakai等,Nature Genetics(2003)34,297-302;Philpott等,Journal of Virology(2002)76(11):5411-5421;和Howden等,J GeneMed 2008;10:42-50。此外,可以按照本领域中公知的流程来建立稳定的细胞系,例如在Clark,Kidney International Vol 61(2002):S9-S15和Yuan等,Human Gene Therapy2011May;22(5):613-24中所描述的流程。

AAV属于细小病毒科和依赖病毒属。AAV是一种小型无包膜病毒,其包装线性单链DNA基因组。AAV DNA的正义链和反义链两者以相同频率包装到AAV衣壳中。

AAV基因组的特征在于位于两个开放阅读框(ORB)侧翼的两个反向末端重复序列(ITR)。例如,在AAV2基因组中,ITR的前125个核苷酸是回文,其自身折叠以使碱基配对最大化,并形成T形发夹结构。被称为D序列的ITR的其他20个碱基保持未配对。ITR是对AAV DNA复制来说重要的顺式作用序列;ITR是复制原点,并充当DNA聚合酶合成第二链的引物。在该合成过程中形成的被称为复制型单体的双链DNA被用于第二轮自引发复制,并形成复制型二聚体。这些双链中间体通过链置换机制进行加工,产生用于包装的单链DNA和用于转录的双链DNA。位于所述ITR内的是Rep结合元件和末端解离位点(TRS)。这些零件在AAV复制期间被病毒调控蛋白Rep用于加工所述双链中间体。除了它们在AAV复制中的作用之外,ITR对于AAV基因组包装、转录、非容许条件下的负调控以及位点特异性整合来说也是必不可少的(Days和Berns,Clin Microbiol Rev 21(4):583-593,2008)。

AAV的左侧ORF含有Rep基因,其编码四种蛋白质——Rep78、Rep68、Rep52和Rep40。右侧ORF含有Cap基因,其产生三种病毒衣壳蛋白(VP1、VP2和VP3)。所述AAV衣壳含有以二十面体对称排布的60个病毒衣壳蛋白。VP1、VP2和VP3以1:1:10的摩尔比存在(Daya和Berns,Clin Microbiol Rev 21(4):583-593,2008)。

AAV目前是基因疗法最常用的病毒之一。尽管AAV感染人类和某些其他灵长类物种,但尚不知道会引起疾病,并且它引发非常轻微的免疫应答。利用AAV的基因疗法载体可以感染分裂和静止期细胞两者,并以染色体外状态持续存在而不整合到宿主细胞的基因组中。由于AAV的有利特点,因此本公开设想了将AAV用于本文公开的重组核酸分子和方法。

AAV具有基因疗法载体所需的几种特点,包括结合和进入靶细胞、进入细胞核的能力,在细胞核中长期表达的能力和低毒性。然而,AAV基因组的小尺寸限制了可以并入的异源DNA的尺寸。为了使这个问题最小化,已构建了不编码Rep和整合效率元件(IEE)的AAV载体。ITR得以保留,因为它们是包装所需的顺式信号(Daya和Berns,Clin Microbiol Rev,21(4):583-593,2008)。

用于生产适合于基因疗法的rAAV的方法在本领域中是公知的(参见例如美国专利申请号2012/0100606、2012/0135515、2011/0229971和2013/0072548;以及Ghosh等,GeneTher 13(4):321-329,2006),并且可用于本文中公开的重组核酸分子和方法。

在某些情况下,本公开提供了本文中公开的rAAV用于治疗丙酸血症(PA)的用途,其中所述rAAV包含AAV衣壳和包装在其中的载体基因组。在某些实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列和3’-ITR。在某些实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,人类PCCA5’-UTR的截短或完整的核苷酸序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类PCCA 3’-UTR的截短或完整的核苷酸序列和3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-ITR上游的多聚腺苷酸化序列。因此,在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,增强子序列,启动子序列,内含子序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列和3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,增强子序列,启动子序列,内含子序列,人类PCCA 5’-UTR的截短或完整的核苷酸序列,PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列,人类PCCA 3’-UTR的截短或完整的核苷酸序列和3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,CBA启动子,SV40小T内含子,PCCA的编码序列,BGH多聚腺苷酸化信号序列进而AAV2 3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,本源PCCA启动子,SV40小T内含子,PCCA 5’-UTR的核苷酸序列,PCCA的编码序列,本源PCCA多聚腺苷酸化信号序列,PCCA 3’-UTR的核苷酸序列和AAV2 3’-ITR。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有Kozak序列。在某些实施方式中,所述包装的基因组还包含位于所述本源PCCA 5’-UTR序列下游的共有Kozak序列。在某些实施方式中,所述PCCA的编码序列选自SEQ ID NO:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

图1中提供的原理图示出了用于表达PCCA的示例性包装的载体基因组构建物,其以5’至3’的顺序示出了:5’-ITR,CMV增强子,CBA启动子,SV40小T内含子,共有Kozak序列,PCCA编码序列,SV40多聚腺苷酸化信号序列和3’-ITR。

在某些情况下,本公开提供了本文中公开的rAAV用于治疗丙酸血症(PA)的用途,其中所述rAAV包含AAV衣壳和包装在其中的载体基因组,其中所述包装的基因组作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列和3’-ITR。在某些实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,启动子序列,人类PCCB 5’-UTR的截短或完整的核苷酸序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列,人类PCCB 3’-UTR的截短或完整的核苷酸序列和3’-ITR。在示例性实施方式中,所述包装的基因组还包含在所述启动子序列上游的增强子序列、在所述启动子下游的内含子和在所述3’-ITR上游的多聚腺苷酸化序列。因此,在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,增强子序列,启动子序列,内含子序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列和3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:5’-ITR,增强子序列,启动子序列,内含子序列,人类PCCB 5’-UTR的截短或完整的核苷酸序列,PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列,多聚腺苷酸化信号序列,人类PCCB 3’-UTR的截短或完整的核苷酸序列和3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,CBA启动子,SV40小T内含子,PCCB的编码序列,BGH多聚腺苷酸化信号序列和AAV2 3’-ITR。在另一个示例性实施方式中,所述rAAV含有包装的基因组,其作为可操作连接的组件以5’至3’的顺序包含:AAV2 5’-ITR序列,CMV增强子,本源PCCB启动子,SV40小T内含子,PCCB 5’-UTR的核苷酸序列,PCCB的编码序列,本源PCCB多聚腺苷酸化信号序列,PCCB 3’-UTR的核苷酸序列和AAV2 3’-ITR。在某些实施方式中,所述包装的基因组还包含位于所述内含子序列下游的共有Kozak序列。在某些实施方式中,所述包装的基因组还包含位于所述本源PCCB 5’-UTR序列下游的共有Kozak序列。在某些实施方式中,所述PCCB的编码序列选自SEQ ID NOs:7-12。在某些实施方式中,所述衣壳是AAV9衣壳。

图2中提供的原理图示出了用于表达PCCB的示例性包装的载体基因组构建物,其以5’至3’的顺序示出了:5’-ITR,CMV增强子,CBA启动子,SV40小T内含子,共有Kozak序列,PCCA编码序列,SV40多聚腺苷酸化信号序列和3’-ITR。

丙酰辅酶A羧化酶是一种定位到线粒体基质的多聚体蛋白(参见Browner等,(1989)Journal of Biological Chemistry.264:12680-5)。因此,递送PCCA和/或PCCB基因的基因疗法载体必须能够编码在线粒体中有功能并且定位于线粒体中的蛋白质。一方面,本文中公开的一种或多种病毒载体驱动并调控编码位于线粒体中的PCCA和/或PCCB蛋白的基因的表达(例如PCCA或PCCB的表达)。

本公开提供了包含本文中公开的rAAV和可药用载体的组合物。适合用于rAAV的施用的药物剂型可以在例如美国专利申请公布号2012/0219528中找到。在本公开中有用的可药用载体(介质)是常规的。《Remington制药学》(Remington's PharmaceuticalSciences),E.W.Martin,Mack Publishing Co.,Easton,Pa.,第15版(1975)描述了适用于一种或多种治疗性化合物、分子或药剂的药物递送的组合物和剂型。

正如在前述段落中强调的,本公开在某些方面涉及包含本发明的rAAV的药物组合物。在某些实施方式中,所述药物组合物包含可药用载体或赋形剂。在某些实施方式中,所述药物组合物被配制成用于皮下、肌肉内、真皮内、腹膜内或静脉内施用。在示例性实施方式中,所述药物组合物被配制成用于静脉内施用。

在某些实施方式中,所述rAAV被配制在适合于在人类受试者中输注的缓冲剂/载体中。所述缓冲剂/载体应该包含防止所述rAAV粘附到输液管,但是不干扰所述rAAV的体内结合活性的组分。各种适合的溶液可以包含下述一者或多者:缓冲盐水,表面活性剂,以及离子强度被调整到等同于约100mM氯化钠(NaCl)至约250mM氯化钠的生理相容的盐或盐的混合物或被调整到等同离子浓度的生理相容的盐。pH可以在6.5至8.5或7至8.5或7.5至8的范围内。适合的表面活性剂或表面活性剂的组合可以选自泊洛沙姆(即由中央的聚氧丙烯10(聚(氧化丙烯))疏水链和两侧的两个聚氧乙烯(聚(氧化乙烯))的亲水链组成的三嵌段共聚物)、SOLUTOL HS 15(聚乙二醇-15羟基硬脂酸酯)、LABRASOL(聚氧乙烯辛酸甘油酯)、聚氧乙烯10油基醚、TWEEN(聚氧乙烯失水山梨糖醇脂肪酸酯)、乙醇和聚乙二醇。

另一方面,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的rAAV。

在一个实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列。

在另一个实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。

在又一个实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用:(1)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列;和(2)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述(1)和(2)的rAAV可以同时施用。在某些实施方式中,所述(1)和(2)的rAAV可以顺序施用。在某些实施方式中,所述(1)和(2)的rAAV可以分开施用。

在某些实施方式中,本公开提供了一种治疗PA的方法,所述方法包括施用:(1)包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCA而不是针对PCCB,所述启动子是PCCA基因特异性内源启动子而不是PCCB基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列而不是PCCB基因特异性内源多聚腺苷酸化信号序列;和/或(2)包含AAV衣壳和载体基因组的rAAV,其中所述编码序列是针对PCCB而不是针对PCCA,所述启动子是PCCB基因特异性内源启动子而不是PCCA基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列而不是PCCA基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述(1)和(2)的rAAV可以同时施用。在某些实施方式中,所述(1)和(2)的rAAV可以顺序施用。在某些实施方式中,所述(1)和(2)的rAAV可以分开施用。

在某些实施方式中,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向被诊断为在PCCA中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCA中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在PCCA中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCA而不是针对PCCB,所述启动子是PCCA基因特异性内源启动子而不是PCCB基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCA基因特异性内源多聚腺苷酸化信号序列而不是PCCB基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCA中的突变选自表1。在某些实施方式中,所述PCCA的编码序列选自SEQ ID NOs:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些情况下,本公开提供了在人类受试者中治疗PA的方法,所述方法包括向被诊断为在PCCB中具有至少一个突变的人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCB中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,本公开提供了一种在被诊断为在PCCB中具有至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述编码序列是针对PCCB而不是针对PCCA,所述启动子是PCCB基因特异性内源启动子而不是PCCA基因特异性内源启动子,并且所述多聚腺苷酸化信号序列是PCCB基因特异性内源多聚腺苷酸化信号序列而不是PCCA基因特异性内源多聚腺苷酸化信号序列。在某些实施方式中,所述PCCB中的突变选自表2。在某些实施方式中,所述PCCB的编码序列选自SEQ ID NOs:7-12。

在某些实施方式中,所述衣壳是AAV9衣壳。

描述引起PA的PCCA和PCCB中的突变的综述文章提供在Ugarte等,1999,Hum.Mutat.14(4):275-282中。

在由突变的PCCA基因引起的PA中,已鉴定到PCCA基因中的下述突变和多态性:

在由突变的PCCB基因引起的PA中,已鉴定到PCCB基因中的下述突变和多态性:

在某些实施方式中,本公开提供了在被诊断为在PCCA中具有选自表1的至少一个突变的人类受试者中治疗PA的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCA中具有选自表1的至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCA或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述PCCA的编码序列选自SEQID NOs:1-6。在某些实施方式中,所述衣壳是AAV9衣壳。

在某些实施方式中,本公开提供了在被诊断为在PCCB中具有选自表2的至少一个突变的人类受试者中治疗PA的方法,所述方法包括向所述人类受试者施用治疗有效量的至少一种本文中公开的rAAV。在一个实施方式中,本公开提供了一种在被诊断为在PCCB中具有选自表2的至少一个突变的人类受试者中治疗PA的方法,所述方法包括施用包含AAV衣壳和包装在其中的载体基因组的rAAV,其中所述载体基因组包含PCCB或其同型或其功能性片段或功能性变体的部分或完整编码序列。在某些实施方式中,所述PCCB的编码序列选自SEQID NOs:7-12。在某些实施方式中,所述衣壳是AAV9衣壳。

任何适合的方法或途径可用于施用本文中描述的rAAV或含有rAAV的组合物。施用途径包括例如系统性、口服、吸入、鼻内、气管内、动脉内、眼内、静脉内、肌肉内、皮下、真皮内和其他肠胃外施用途径。在某些实施方式中,所述rAAV、包含rAAV的组合物或包含多种rAAV(例如一种rAAV表达PCCA并且第二种rAAV表达PCCB)的组合物被静脉内施用。

对于每位患者来说,施用的具体剂量可以是均一的剂量,例如每位患者1.0x10

在某些实施方式中,所述rAAV以例如约1.0x10

药剂可以每周、每月或每年施用一次或多次,或甚至每2至20年施用一次。例如,每剂药剂可以最少隔1周、隔2周、隔3周、隔1个月、隔3个月、隔6个月或隔1年施用。本领域普通技术人员可以根据所述可靶向构建物或复合物在体液或组织中的实测停留时间和浓度,容易地估算出施用的重复率。

在整个本说明书中,在组合物被描述成具有、包括或包含特定组分的情况下或过程和方法被描述成具有、包括或包含特定步骤的情况下,设想了另外存在基本上由所叙述的组分构成或由其构成的本发明的组合物,并且另外存在基本上由所叙述的过程步骤构成或由其构成的本发明的过程和方法。

在本公开中,在要素或组分被描述为包括在所叙述的要素或组分名单中和/或选自所述名单的情况下,应该理解所述要素或组分可以是所叙述的要素或组分中的任一者,或者所述要素或组分可以选自所叙述的要素或组分中的两者或更多者。

此外,应该理解,本文中描述的组合物或方法的要素和/或特点可以以不背离本公开的精神和范围的各种不同方式组合,不论在本文中明示还是暗示。例如,在指称特定化合物的情况下,该化合物可用于本发明的组合物的各种不同实施方式中和/或本发明的方法中,除非从上下文另有理解。换句话说,在本公开中,实施方式以能够书写并描绘清楚简明的申请的方式描述和描绘,但是应当理解并且可以理解,在不脱离本文的教导和发明的情况下可以对实施方式进行各种不同的组合或分离。例如,应该认识到,本文中描述和描绘的所有特点可以适用于本文中描述和描绘的发明的所有方面。

应当理解,表述“……中的至少一者”分别包括在所述表述之后的每个所叙述的受试者以及所叙述的受试者中的两者或更多者的各种不同组合,除非从上下文和用法中另有理解。与三个或更多个所叙述的受试者相关联的表述“和/或”应该被理解为具有相同的含义,除非从上下文另有理解。

术语“包括”、“具有”、“含有”、包括其语法等同形式的使用,通常应该被理解为开放性且非限制性的,例如不排除另外的未叙述的要素或步骤,除非另有具体陈述或从上下文另有理解。

在定量值之前使用术语“约”的情况下,除非另有具体陈述,否则本发明还包括所述具体定量值本身。当在本文中使用时,除非另有指明或推断,否则术语“约”是指与所述标称值相差±10%。

应该理解,步骤顺序或用于执行某些行动的顺序是不重要的,只要本发明仍然可操作即可。此外,两个或更多个步骤或行动可以同时进行。

本文中的任何和所有的实例或示例性语言例如“例如”或“包括”的使用仅打算更好地说明本发明,并且除非宣称,否则不对本发明的范围构成限制。本说明书中的任何语言均不应被解释为表明任何未要求保护的要素对于本发明的实践来说是必不可少的。

实施例

通过参考下面的实施例,现在正一般性描述的本公开将更容易理解,包含所述实施例仅仅是出于说明本公开的某些方面和实施方式的目的,并不打算以任何方式限制本公开的范围。

实施例1:PCCA的RNA和蛋白质表达

RNA表达

本实施例涉及在转染连续肝细胞系(HepG2)后通过RT-qPCR所确定的PCCA的RNA表达。简单来说,使用Lipofectamine 2000(Invitrogen),按照制造商的说明书将HepG2细胞用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)转染。在转染后72小时收获HepG2细胞并裂解。使用TRIzol试剂(Invitrogen),按照制造商的说明书从裂解的HepG2细胞提取RNA。使用NanoDrop ND-1000(Thermo Scientific),通过OD260/280和OD260/230比率来测量RNA的质量和数量。使用高能力cDNA反转录试剂盒(ThermoFisher Scientific),按照制造商的说明书将总RNA反转录成。使用Applied Biosystems 7500实时PCR系统,使用Power SYBR Green PCR主混合物(Applied Biosystems),按照制造商的说明书进行实时RT-qPCR。通过delta-delta Ct(2

所述作图的数据显示,用DTC346转染后完全本源的人类PCCA的RNA表达,与用DTC347和DTC348转染后两种密码子优化的人类PCCA版本的表达相当。用DTC349转染的细胞表现出更高的RNA表达。

蛋白质表达

本实施例还涉及连续肝细胞系HepG2和Huh7的转染后PCCA的蛋白质表达。简单来说,使用Lipofectamine 2000(Invitrogen),按照制造商的说明书将HepG2和Huh7细胞系用对照质粒(带有空载体、没有TX的质粒)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)、带有编码人类PCCA的完整本源序列的核苷酸序列和编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC365)或带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)转染。在转染后72小时收获细胞,并用增补有蛋白酶抑制剂混合物(Sigma)和磷酸酶抑制剂混合物2+3(Sigma P5726和P0044)的NP-40裂解缓冲液(50mM Tris·HCl pH 8.0,150mM NaCl,1.0%NP-40)裂解。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(SDS-PAGE)凝胶上分离,并转移到

图4A是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)、带有编码人类PCCA的完整本源序列的核苷酸序列和编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC365)或带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)转染的连续肝细胞系(HepG2)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

如图4A中所示,在“无TX”对照(第1道)中存在预期的基础水平的PCCA蛋白表达,并且当与“无TX”对照(第1道)相比时,在用DTC346(第2道)转染的细胞和用DTC347(第3道)或DTC348(第4道)转染的细胞中存在PCCA蛋白的过表达。用DTC349(第5道)转染的细胞未表现出PCCA蛋白的过表达,尽管观察到这个版本表达大量RNA。正如预期,用DTC343(第7道)转染的细胞表现出eGFP表达。

图4B是照片,从第1道至第7道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)或带有编码人类PCCA的完整本源序列的核苷酸序列和编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC365)转染的连续肝细胞系(Huh7)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

如图4B中所示,在“无TX”对照(第1道)中存在预期的基础水平的PCCA蛋白表达,并且当与“无TX”对照(第1道)相比时,在用DTC346(第3道)转染的细胞和用DTC347(第4道)或DTC348(第5道)转染的细胞中存在PCCA蛋白的过表达。用DTC349(第6道)转染的细胞未表现出PCCA蛋白的过表达,尽管观察到这个版本表达大量RNA。正如预期,用DTC343(第2道)转染的细胞表现出eGFP表达。

实施例2:过表达的人类PCCA蛋白定位到线粒体

这个实施例显示出在连续肝细胞系(HepG2)中过表达的人类PCCA定位到线粒体。简单来说,将连续肝细胞系(HepG2)用带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)转染。在转染后,对细胞进行亚细胞分级,其中将胞质和线粒体级分分离。也对全细胞裂解液进行处理。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(SDS-PAGE)凝胶上分离,并转移到

如图5中所示并且与图4A-B中示出的结果相一致,当与未转染的对照细胞相比时,用带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)转染的细胞在全细胞裂解液中表现出PCCA过表达(图5中的第7道相比于第8道)。调查了一种已知定位到线粒体的蛋白质mitofilin的水平,以确定分离的细胞级分的相对纯度。如图5中所示,未转染的和DTC346转染的细胞的胞质级分未表现出可检测水平的mitofilin(图5中的第1道相比于第2道),而正如预期的,mitofilin在线粒体级分和全细胞裂解液中被容易地检测到(图5中的第3-8道)。过表达的PCCA主要定位到线粒体(图5中的第2道相比于第4和6道)。

实施例3:PCCA AAV9滴度产量的比较

本实施例涉及从带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)获得的PCCA AAV9滴度产量的比较。将连续肾细胞系(HEK293)用带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)、带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)或带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)三重转染;每个所述载体质粒被表达在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中。未转染的细胞被用作对照并在图6中被表示为“无TX”。收获细胞上清液并用DNase I或等同物处理,以消除未被衣壳包裹的DNA,并便于利用对包含在这些构建物的设计中的多聚腺苷酸化信号特异的引物/探针组对DNase抗性粒子(DRP)滴度进行定量。图6是条形图,从左至右示出了在连续肾细胞系(HEK293)的三重转染后通过qPCR所确定的PCCA AAV9滴度(以基因组拷贝(GC)/mL为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCA的完整本源序列的核苷酸序列的rAAV载体质粒(DTC346)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC347、DTC348或DTC349)转染,每种质粒在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无TX”。图6示出了通过qPCR确定的PCCA AAV9滴度(以基因组拷贝(GC)/ml为单位)相对于未转染的细胞的变化倍数。图6中示出的数据证实了表达本源的完整人类PCCA的构建物(DTC346)与所有密码子优化的版本(DTC347、DTC348和DTC349)之间可比的rAAV滴度。

实施例4:测试PCCA DNA完整性

在通过三重转染在HEK293细胞中产生AAV9 rAAV病毒粒子后,收获细胞上清液并与AAVX树脂(Thermo Fisher)或等同物温育。将AAV9 rAAV病毒粒子纯化,然后用Amicon离心管式滤器(Millipore Sigma)浓缩。将纯化的病毒在碱性裂解缓冲液中温育,载样到DNA琼脂糖凝胶中,并在存在碱性运行缓冲液的情况下运行过夜。图7是从左至右分别为亲和纯化的含有表达PCCA和PCCB的重组AAV(rAAV)载体盒(DTC365)、表达PCCA的重组AAV(rAAV)载体盒(DTC349、DTC348、DTC347或DTC346)或表达eGFP的重组AAV(rAAV)载体盒(DTC343)的AAV9粒子的DNA碱性琼脂糖凝胶的照片。

如图7中所示,凝胶照片在本源和密码子优化的PCCA载体盒的预期大小处显示出清楚的单一条带,表明载体基因组(DTC346、DTC347、DTC348和DTC349)的适合的包装。eGFP对照(DTC343)表明两个条带的包装,与包装小载体基因组的已知限制相符。

实施例5:PCCB的RNA和蛋白质表达

RNA表达

本实施例涉及在转染连续肝细胞系(HepG2)后通过RT-qPCR所确定的PCCB的RNA表达。简单来说,使用Lipofectamine 2000(Invitrogen),按照制造商的说明书将HepG2细胞用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC370、DTC368、DTC369或DTC371)转染。在转染后72小时收获HepG2细胞并裂解。使用TRIzol试剂(Invitrogen),按照制造商的说明书从裂解的HepG2细胞提取RNA。使用NanoDrop ND-1000(Thermo Scientific),通过OD260/280和OD260/230比率来测量RNA的质量和数量。使用高能力cDNA反转录试剂盒(ThermoFisher Scientific),按照制造商的说明书将总RNA反转录成。使用Applied Biosystems 7500实时PCR系统,使用Power SYBR GreenPCR主混合物(Applied Biosystems),按照制造商的说明书进行实时RT-qPCR。通过delta-delta Ct(2

所述作图的数据显示,用DTC366转染后人类PCCB的完全本源列的RNA表达,与用DTC367、DTC368、DTC370或DTC371转染后的四种密码子优化的人类PCCB版本的表达相当。用DTC369转染的细胞表现出更低的RNA表达。

蛋白质表达

本实施例还涉及连续肝细胞系HepG2和Huh7的转染后PCCB的蛋白质表达。简单来说,使用Lipofectamine 2000(Invitrogen),按照制造商的说明书将HepG2和Huh7细胞系用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)转染。在转染后72小时收获细胞,并用增补有蛋白酶抑制剂混合物(Sigma)和磷酸酶抑制剂混合物2+3(Sigma P5726和P0044)的NP-40裂解缓冲液(50mM Tris·HCl pH8.0,150mM NaCl,1.0%NP-40)裂解。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(SDS-PAGE)凝胶上分离,并转移到IMMUN-

图9A是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)转染的连续肝细胞系(HepG2)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

如图9A中所示,在“无TX”对照(第1道)中存在预期的基础水平的PCCB蛋白表达,并且当与“无TX”对照(第1道)相比时,在用DTC366(第3道)转染的细胞和用DTC367(第4道)或DTC370(第7道)转染的细胞中存在PCCB蛋白的过表达。用DTC368(第5道)、DTC369(第6道)或DTC371(第8道)转染的细胞未表现出PCCB蛋白的过表达。正如预期,用DTC343(第2道)转染的细胞表现出eGFP表达。

图9B是照片,从第1道至第8道分别示出了在用对照质粒(带有空载体、没有TX的质粒)、带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC369、DTC368、DTC370或DTC371)转染的连续肝细胞系(Huh7)中,通过Western印迹所检测的蛋白质表达水平。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

如图9B中所示,在“无TX”对照(第1道)中存在预期的基础水平的PCCB蛋白表达,并且当与“无TX”对照(第1道)相比时,在用DTC366(第3道)转染的细胞和用DTC367(第4道)或DTC370(第7道)转染的细胞中存在PCCB蛋白的过表达。用DTC368(第6道)、DTC369(第5道)或DTC371(第8道)转染的细胞未表现出PCCB蛋白的过表达。正如预期,用DTC343(第2道)转染的细胞表现出eGFP表达。

实施例6:过表达的人类PCCB蛋白定位到线粒体

这个实施例显示出在连续肝细胞系(HepG2)中过表达的人类PCCB定位到线粒体。简单来说,将连续肝细胞系(HepG2)用带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)转染。在转染后,对细胞进行亚细胞分级,其中将胞质和线粒体级分分离。也对全细胞裂解液进行处理。将蛋白质在10%十二烷基硫酸钠聚丙烯酰胺电泳(SDS-PAGE)凝胶上分离,并转移到

图10是照片,示出了在从用或未用带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)转染的连续肝细胞系(HepG2)分离的全细胞裂解液(WCL)、亚细胞级分(胞质级分(cyto)和线粒体级分(线粒体))中,通过Western印迹所检测的PCCB蛋白表达水平。1X和2X表示所载样的线粒体级分的相对体积。β-肌动蛋白(“肌动蛋白”)被用作载样对照。

如图10中所示并且与前述结果相一致,当与未转染的对照细胞相比时,用带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)转染的细胞在全细胞裂解液中表现出PCCB蛋白过表达(图10中的第7道相比于第8道)。调查了一种已知定位到线粒体的蛋白质mitofilin的水平,以确定分离的细胞级分的相对纯度。如图10中所示,未转染的和DTC366转染的细胞的胞质级分未表现出可检测水平的mitofilin(第1道相比于第2道),而正如预期的,mitofilin在线粒体级分和全细胞裂解液中被容易地检测到(第3-8道)。过表达的PCCB主要定位到线粒体(第2道相比于第4和6道)。

实施例7:PCCB AAV9滴度产量的比较

本实施例涉及从带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCB的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)获得的PCCB AAV9滴度产量的比较。将连续肾细胞系(HEK293)用带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)三重转染;每个所述载体质粒被表达在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中。未转染的细胞被用作对照并在图11中被表示为“无TX”。收获细胞上清液并用DNase I或等同物处理,以消除未被衣壳包裹的DNA,并便于利用对包含在这些构建物的设计中的多聚腺苷酸化信号特异的引物/探针组对DNase抗性粒子(DRP)滴度进行定量。图11是条形图,从左至右示出了在连续肾细胞系(HEK293)的三重转染后通过qPCR所确定的PCCB AAV9滴度(以基因组拷贝(GC)/mL为单位)的变化倍数,所述细胞用带有编码增强绿色荧光蛋白eGFP的核苷酸序列的rAAV载体质粒(DTC343)、带有编码人类PCCB的完整本源序列的核苷酸序列的rAAV载体质粒(DTC366)或带有编码人类PCCA的密码子优化的序列的核苷酸序列的rAAV载体质粒(DTC367、DTC368、DTC369、DTC370或DTC371)转染,每种质粒在用表达AAV9衣壳的质粒(pAAV2/9)和提供腺病毒辅助功能的质粒(pAdHelper)共转染的细胞中表达。未转染的细胞被用作对照并被表示为“无TX”。图11示出了通过qPCR确定的PCCB AAV9滴度(以基因组拷贝(GC)/ml为单位)相对于未转染的细胞的变化倍数。图11中示出的数据证实了表达本源的完整人类PCCB的构建物(DTC366)与所有密码子优化的版本(DTC367、DTC368、DTC369、DTC370和DTC371)之间可比的rAAV滴度。

实施例8:测试PCCB DNA完整性

在通过三重转染在HEK293细胞中产生AAV9 rAAV病毒粒子后,收获细胞上清液并与AAVX树脂(Thermo Fisher)或等同物温育。将AAV9 rAAV病毒粒子纯化,然后用Amicon离心管式滤器(Millipore Sigma)浓缩。将纯化的病毒在碱性裂解缓冲液中温育,载样到DNA琼脂糖凝胶中,并在存在碱性运行缓冲液的情况下运行过夜。图12是从左至右分别为亲和纯化的含有对照质粒(带有空载体、没有TX的质粒)、表达eGFP的重组AAV(rAAV)载体盒(DTC343)或表达PCCB的重组AAV(rAAV)载体盒(DTC366、DTC367、DTC368、DTC369、DTC370或DTC371)的AAV9粒子的DNA碱性琼脂糖凝胶的照片。

如图12中所示,凝胶照片在本源和密码子优化的PCCB载体盒的预期大小处显示出清楚的单一条带,表明载体基因组(DTC366、DTC367、DTC368、DTC369、DTC370和DTC371)的适合的包装。eGFP对照(DTC343)表明两个条带的包装,与包装小载体基因组的已知限制相符。

实施例9:PCCA病毒载体向野生型小鼠的施用

本实施例涉及在用表达完整本源人类PCCA(DTC346)或密码子优化的(DTC347、DTC348和DTC349)人类PCCA的rAAV治疗后,野生型FVB小鼠中人类PCCA蛋白的表达。简单来说,将小鼠(n=2或3)用1.66x10

实施例10:亚效等位基因PCCA小鼠模型中的人类PCCA活性

本实施例涉及在亚效等位基因PCCA小鼠模型中测试人类PCCA活性。在小鼠中PCCA基因的缺失模拟了所述人类疾病的最严重的形式。PCCA基因缺失的小鼠在出生后36小时内死亡,使得难以在它们中试验静脉内系统性疗法(参见Guenzel等,Mol Ther.2013Jul;21(7):1316–1323)。由于在小鼠PCCA敲除的背景上引入了编码具有致病性A138T突变的人类PCCA的转入基因,亚效等位基因PCCA小鼠具有降低的PCCA活性。这种突变的PCCA基因导致丙酰肉碱、甲基柠檬酸、甘氨酸、丙氨酸、赖氨酸、氨和与心肌病相关的标志物的水平升高,与丙酸血症(PA)患者中这些化合物的水平相近。简单来说,将小鼠(n=5)用1.66x10

PCCA表达水平和酶活性测定法

在注射后6周,将小鼠肝脏匀浆,并通过LC-MS测量人类野生型PCCA蛋白。图14是条形图,示出了在用编码人类PCCA的完整本源序列(DTC346)或人类PCCA的密码子优化的序列(DTC347、DTC348或DTC349)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中表达的人类野生型PCCA蛋白的浓度(以nmol/g蛋白为单位)。所列出的百分数表示被计算为相对于野生型FVB小鼠的内源PCCA蛋白水平的百分率的人类野生型PCCA表达。误差条表示标准偏差。所列出的百分数表示被计算为相对于野生型FVB小鼠的内源PCCA蛋白水平的百分率的人类野生型PCCA表达。与前述结果相一致,当与从编码完整本源人类PCCA的rAAV表达的本源人类PCCA蛋白相比时,从编码密码子优化的人类PCCA的rAAV表达的人类PCCA蛋白表现出更低的表达水平。使用闪烁计数器将肝匀浆液的PCCA酶活性测量为碳酸氢钠[C14]的掺入。图15是在用编码人类PCCA的完整本源序列(DTC346)的rAAV治疗后,亚效等位基因PCCA小鼠模型(A138T突变体)中通过每分钟的平均计数(CPM)数据所度量的人类PCCA活性的条形图。误差条表示标准偏差。所列出的百分数描述了相对于在野生型FVB小鼠中观察到的数据的CPM数据。**表示使用Dunnett多重比较检验与PBS治疗组相比p<0.01。

如图15中所示,用较高剂量(5x10

向亚效等位基因PCCA小鼠施用本源PCCA病毒载体对丙酸血症(PA)的已知生物标志物的浓度的影响

本实施例还涉及测试向亚效等位基因PCCA小鼠施用编码人类PCCA的完整本源序列的rAAV(DTC346)对PA的已知生物标志物的血浆浓度的影响。简单来说,将小鼠(n=5)用1.66x10

用任一剂量(1.66x10

编号实施方式

本文公开的实施方式包括在本公开的编号实施方式中所提供的实施方式P1至P136。

实施方式P1:一种重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)启动子序列;

(c)PCCA的部分或完整编码序列;和

(d)3’ITR序列。

实施方式P2:根据实施方式P1所述的rAAV,其中所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。

实施方式P3:根据实施方式P2所述的rAAV,其中所述AAV衣壳来自于AAV9。

实施方式P4:根据实施方式P2所述的rAAV,其中所述AAV衣壳来自于AAV8。

实施方式P5:根据实施方式P1所述的rAAV,其中所述AAV衣壳是AAV9变体衣壳。

实施方式P6:根据实施方式P1-P5中的任一项所述的rAAV,其中所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)立即早期基因启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子和CAG启动子。

实施方式P7:根据实施方式P6所述的rAAV,其中所述启动子是CBA启动子。

实施方式P8:根据实施方式P1至P7中的任一项所述的rAAV,其中所述PCCA的部分或完整编码序列是野生型编码序列。

实施方式P9:根据实施方式P8所述的rAAV,其中所述PCCA的编码序列包含SEQ IDNO:1。

实施方式P10:根据实施方式P1至P7中的任一项所述的rAAV,其中所述PCCA的部分或完整编码序列是密码子优化的编码序列。

实施方式P11:根据实施方式P10所述的rAAV,其中所述PCCA的编码序列包含选自SEQ ID NOs:2-6的编码序列。

实施方式P12:根据实施方式P1至P11中的任一项所述的rAAV,其中所述5’ITR序列来自于AAV2。

实施方式P13:根据实施方式P1至P11中的任一项所述的rAAV,其中所述3’ITR序列来自于AAV2。

实施方式P14:根据实施方式P1至P11中的任一项所述的rAAV,其中所述5’ITR序列和3’ITR序列来自于AAV2。

实施方式P15:根据实施方式P12至P14中的任一项所述的rAAV,其中所述5’ITR序列和3’ITR序列包含SEQ ID NO:15或由其构成。

实施方式P16:根据实施方式P1至P11中的任一项所述的rAAV,其中所述5’ITR序列和/或3’ITR序列来自于非AAV2来源。

实施方式P17:根据实施方式P1至P16中的任一项所述的rAAV,其中所述包装的基因组还包含一个或多个增强子序列。

实施方式P18:根据实施方式P17所述的rAAV,其中所述增强子选自巨细胞病毒立即早期基因(CMV)增强子、甲状腺素运载蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子和ApoE增强子。

实施方式P19:根据实施方式P18所述的rAAV,其中所述增强子是CMV增强子。

实施方式P20:根据实施方式P19所述的rAAV,其中所述增强子包含SEQ ID NO:19或由其构成。

实施方式P21:根据实施方式P18至P20中的任一项所述的rAAV,其中所述增强子位于所述启动子序列上游。

实施方式P22:根据实施方式P1至P21中的任一项所述的rAAV,其中所述包装的基因组还包含一个或多个内含子序列。

实施方式P23:根据实施方式P22所述的rAAV,其中所述内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人类β珠蛋白IVS2内含子、Promega嵌合内含子或hFIX内含子。

实施方式P24:根据实施方式P23所述的rAAV,其中所述内含子是SV40小T内含子。

实施方式P25:根据实施方式P24所述的rAAV,其中所述内含子包含SEQ ID NO:20或由其构成。

实施方式P26:根据实施方式P23所述的rAAV,其中所述内含子是rHBB内含子。

实施方式P27:根据实施方式P26所述的rAAV,其中所述内含子包含SEQ ID NO:21或由其构成。

实施方式P28:根据实施方式P1至P27中的任一项所述的rAAV,其中所述包装的基因组还包含多聚腺苷酸化信号序列。

实施方式P29:根据实施方式P28所述的rAAV,其中所述多聚腺苷酸化信号序列选自牛生长激素(BGH)多聚腺苷酸化信号序列、SV40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。

实施方式P30:根据实施方式P29所述的rAAV,其中所述多聚腺苷酸化信号序列是牛生长激素(BGH)多聚腺苷酸化信号序列。

实施方式P31:根据实施方式P30所述的rAAV,其中所述多聚腺苷酸化信号序列包含SEQ ID NO:22或由其构成。

实施方式P32:根据实施方式P29所述的rAAV,其中所述多聚腺苷酸化信号序列是SV40多聚腺苷酸化信号序列。

实施方式P33:根据实施方式P32所述的rAAV,其中所述多聚腺苷酸化信号序列包含SEQ ID NO:23或由其构成。

实施方式P34:一种重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)启动子序列;

(c)PCCB的部分或完整编码序列;和

(d)3’ITR序列。

实施方式P35:根据实施方式P34所述的rAAV,其中所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。

实施方式P36:根据实施方式P35所述的rAAV,其中所述AAV衣壳来自于AAV9。

实施方式P37:根据实施方式P35所述的rAAV,其中所述AAV衣壳来自于AAV8。

实施方式P38:根据实施方式P34所述的rAAV,其中所述AAV衣壳是AAV9变体衣壳。

实施方式P39:根据实施方式P34至P38中的任一项所述的rAAV,其中所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒立即早期基因(CMV)启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子和CAG启动子。

实施方式P40:根据实施方式P39所述的rAAV,其中所述启动子是CBA启动子。

实施方式P41:根据实施方式P34至P40中的任一项所述的rAAV,其中所述PCCB的部分或完整编码序列是野生型编码序列。

实施方式P42:根据实施方式P41所述的rAAV,其中所述PCCB的编码序列包含SEQID NO:7。

实施方式P43:根据实施方式P34至P40中的任一项所述的rAAV,其中所述PCCB的部分或完整编码序列是密码子优化的编码序列。

实施方式P44:根据实施方式P43所述的rAAV,其中所述PCCB的编码序列包含选自SEQ ID NOs:8-12的编码序列。

实施方式P45:根据实施方式P34至P44中的任一项所述的rAAV,其中所述5’ITR序列来自于AAV2。

实施方式P46:根据实施方式P34至P44中的任一项所述的rAAV,其中所述3’ITR序列来自于AAV2。

实施方式P47:根据实施方式P34至P44中的任一项所述的rAAV,其中所述5’ITR序列和3’ITR序列来自于AAV2。

实施方式P48:根据实施方式P45至P47中的任一项所述的rAAV,其中所述5’ITR序列和3’ITR序列包含SEQ ID NO:15或由其构成。

实施方式P49:根据实施方式P34至P44中的任一项所述的rAAV,其中所述5’ITR序列和/或3’ITR序列来自于非AAV2来源。

实施方式P50:根据实施方式P34至P49中的任一项所述的rAAV,其中所述包装的基因组还包含一个或多个增强子序列。

实施方式P51:根据实施方式P50所述的rAAV,其中所述增强子选自巨细胞病毒立即早期基因(CMV)增强子、甲状腺素运载蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子和ApoE增强子。

实施方式P52:根据实施方式P51所述的rAAV,其中所述增强子是CMV增强子。

实施方式P53:根据实施方式P52所述的rAAV,其中所述增强子包含SEQ ID NO:19或由其构成。

实施方式P54:根据实施方式P51至P53中的任一项所述的rAAV,其中所述增强子位于所述启动子序列上游。

实施方式P55:根据实施方式P34至P54中的任一项所述的rAAV,其中所述包装的基因组还包含一个或多个内含子序列。

实施方式P56:根据实施方式P55所述的rAAV,其中所述内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人类β珠蛋白IVS2内含子、Promega嵌合内含子或hFIX内含子。

实施方式P57:根据实施方式P56所述的rAAV,其中所述内含子是SV40小T内含子。

实施方式P58:根据实施方式P57所述的rAAV,其中所述内含子包含SEQ ID NO:20或由其构成。

实施方式P59:根据实施方式P56所述的rAAV,其中所述内含子是rHBB内含子。

实施方式P60:根据实施方式P59所述的rAAV,其中所述内含子包含SEQ ID NO:21或由其构成。

实施方式P61:根据实施方式P34至P60中的任一项所述的rAAV,其中所述包装的基因组还包含多聚腺苷酸化信号序列。

实施方式P62:根据实施方式P61所述的rAAV,其中所述多聚腺苷酸化信号序列选自牛生长激素(BGH)多聚腺苷酸化信号序列、SV40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。

实施方式P63:根据实施方式P62所述的rAAV,其中所述多聚腺苷酸化信号序列是牛生长激素(BGH)多聚腺苷酸化信号序列。

实施方式P64:根据实施方式P63所述的rAAV,其中所述多聚腺苷酸化信号序列包含SEQ ID NO:22或由其构成。

实施方式P65:根据实施方式P62所述的rAAV,其中所述多聚腺苷酸化信号序列是SV40多聚腺苷酸化信号序列。

实施方式P66:根据实施方式P65所述的rAAV,其中所述多聚腺苷酸化信号序列包含SEQ ID NO:23或由其构成。

实施方式P67:一种重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)PCCA的部分或完整编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P68:一种重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)PCCB的部分或完整编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P69:根据实施方式P67或实施方式P68所述的rAAV,其中所述AAV衣壳来自于血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。

实施方式P70:根据实施方式P69所述的rAAV,其中所述AAV衣壳来自于AAV9。

实施方式P71:根据实施方式P69所述的rAAV,其中所述AAV衣壳来自于AAV8。

实施方式P72:根据实施方式P67或实施方式P68所述的rAAV,其中所述AAV衣壳是AAV9变体衣壳。

实施方式P73:根据实施方式P67至P72中的任一项所述的rAAV,其中所述启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒立即早期基因(CMV)启动子、甲状腺素运载蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、α-1抗胰蛋白酶因子(A1AT)启动子和CAG启动子。

实施方式P74:根据实施方式P73所述的rAAV,其中所述启动子是CBA启动子。

实施方式P75:根据实施方式P67所述的rAAV,其中所述PCCA的部分或完整编码序列是野生型编码序列。

实施方式P76:根据实施方式P75所述的rAAV,其中所述PCCA的编码序列包含SEQID NO:1。

实施方式P77:根据实施方式P67所述的rAAV,其中所述PCCA的部分或完整编码序列是密码子优化的编码序列。

实施方式P78:根据实施方式P77所述的rAAV,其中所述PCCA的编码序列包含选自SEQ ID NOs:2-6的编码序列。

实施方式P79:根据实施方式P68所述的rAAV,其中所述PCCB的部分或完整编码序列是野生型编码序列。

实施方式P80:根据实施方式P79所述的rAAV,其中所述PCCB的编码序列包含SEQID NO:7。

实施方式P81:根据实施方式P68所述的rAAV,其中所述PCCB的部分或完整编码序列是密码子优化的编码序列。

实施方式P82:根据实施方式P81所述的rAAV,其中所述PCCB的编码序列包含选自SEQ ID NOs:8-12的编码序列。

实施方式P83:根据实施方式P67至P82中的任一项所述的rAAV,其中所述增强子选自巨细胞病毒立即早期基因(CMV)增强子、甲状腺素运载蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子和ApoE增强子。

实施方式P84:根据所述实施方式P83的rAAV,其中所述增强子是CMV增强子。

实施方式P85:根据实施方式P67至P84中的任一项所述的rAAV,其中所述内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人类β珠蛋白IVS2内含子、Promega嵌合内含子或hFIX内含子。

实施方式P86:根据实施方式P85所述的rAAV,其中所述内含子是SV40小T内含子。

实施方式P87:根据实施方式P85所述的rAAV,其中所述内含子是rHBB内含子。

实施方式P88:根据实施方式P67至P87中的任一项所述的rAAV,其中所述多聚腺苷酸化信号序列选自牛生长激素(BGH)多聚腺苷酸化信号序列、SV40多聚腺苷酸化信号序列和兔β珠蛋白多聚腺苷酸化信号序列。

实施方式P89:根据实施方式P88所述的rAAV,其中所述多聚腺苷酸化信号序列是牛生长激素(BGH)多聚腺苷酸化信号序列。

实施方式P90:根据实施方式P88所述的rAAV,其中所述多聚腺苷酸化信号序列是SV40多聚腺苷酸化信号序列。

实施方式P91:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)选自SEQ ID NOs:1-6的PCCA的编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P92:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)选自SEQ ID NOs:7-12的PCCB的编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P93:根据实施方式P91或P92所述的rAAV,其中所述AAV衣壳来自于AAV9。

实施方式P94:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)选自SEQ ID NOs:1-6的PCCA的编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P95:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)5’ITR序列;

(b)增强子序列;

(c)启动子序列;

(d)内含子序列;

(e)选自SEQ ID NOs:7-12的PCCB的编码序列;

(f)多聚腺苷酸化信号序列;和

(g)3’ITR序列。

实施方式P96:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)AAV2 5’ITR序列;

(b)CMV增强子序列;

(c)CBA启动子序列;

(d)rHBB或SV40小T内含子序列;

(e)选自SEQ ID NOs:1-6的PCCA的编码序列;

(f)BGH或SV40多聚腺苷酸化信号序列;和

(g)AAV2 3’ITR序列。

实施方式P97:一种可用于治疗丙酸血症(PA)的重组腺相关病毒(rAAV),所述rAAV包含AAV9衣壳和包装在其中的载体基因组,作为可操作连接的组件所述载体基因组以5’至3’的顺序包含:

(a)AAV2 5’ITR序列;

(b)CMV增强子序列;

(c)CBA启动子序列;

(d)rHBB或SV40小T内含子序列;

(e)选自SEQ ID NOs:7-12的PCCB的编码序列;

(f)BGH或SV40多聚腺苷酸化信号序列;和

(g)AAV2 3’ITR序列。

实施方式P98:根据实施方式P67至P97中的任一项所述的rAAV,其中所述载体基因组包含位于载体基因组元件(d)与(e)之间的共有Kozak序列。

实施方式P99:根据实施方式P98所述的rAAV,其中所述共有Kozak序列包含SEQ IDNO:24。

实施方式P100:一种组合物,其包含前述实施方式中的任一项所述的rAAV和可药用载体。

实施方式P101:一种在人类受试者中治疗丙酸血症(PA)的方法,所述方法包括向所述人类受试者施用治疗有效量的实施方式P1至P99中的任一项所述的rAAV或实施方式P100所述的组合物。

实施方式P102:一种在人类受试者中治疗丙酸血症(PA)的方法,所述方法包括向所述人类受试者施用

(1)治疗有效量的包含实施方式P1至P33中的任一项所述的rAAV的组合物;和

(2)治疗有效量的包含实施方式P34至P66中的任一项所述的rAAV的组合物。

实施方式P103:实施方式P102所述的方法,其中所述(1)和(2)的组合物被同时施用。

实施方式P104:实施方式P102所述的方法,其中所述(1)和(2)的组合物被顺序施用。

实施方式P105:实施方式P102所述的方法,其中所述(1)和(2)的组合物被分开施用。

实施方式P106:一种在被诊断为在PCCA中具有至少一个突变的人类受试者中治疗丙酸血症(PA)的方法,所述方法包括向所述人类受试者施用治疗有效量的包含实施方式P1至P33中的任一项所述的rAAV的组合物。

实施方式P107:实施方式P106所述的方法,其中所述PCCA中的突变选自表1。

实施方式P108:一种在被诊断为在PCCB中具有至少一个突变的人类受试者中治疗丙酸血症(PA)的方法,所述方法包括向所述人类受试者施用治疗有效量的包含实施方式P34至P66中的任一项所述的rAAV的组合物。

实施方式P109:实施方式P108所述的方法,其中所述PCCB中的突变选自表2。

实施方式P110:实施方式P101至P109中的任一项所述的方法,其中所述重组病毒、rAAV或组合物被皮下、肌肉内、真皮内、腹膜内或静脉内施用。

实施方式P111:实施方式P110所述的方法,其中所述rAAV或组合物被静脉内施用。

实施方式P112:实施方式P101至P111中的任一项所述的方法,其中所述rAAV以约1x10

实施方式P113:实施方式P112所述的方法,其中所述rAAV以约1x10

实施方式P114:根据实施方式P110至P113中的任一项所述的方法,其中施用所述rAAV包括单剂rAAV的施用。

实施方式P115:根据实施方式P110至P113中的任一项所述的方法,其中施用所述rAAV包括多剂rAAV的施用。

实施方式P116:一种重组核酸,其编码SEQ ID NO:16的PCCA多肽,其中所述核酸序列与SEQ ID NO:1的野生型编码序列的同一性少于80%。

实施方式P117:实施方式P116所述的重组核酸,其中所述核酸序列包含与选自SEQID NOs:2-6的序列具有至少80%同一性的序列。

实施方式P118:实施方式P117所述的重组核酸,其中所述核酸序列包含选自SEQID NOs:2-6的序列。

实施方式P119:实施方式P116至P118中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自TGA、TAA和TAG的一个或多个终止密码子。

实施方式P120:一种重组核酸,其编码SEQ ID NO:17的PCCB多肽,其中所述核酸序列与SEQ ID NO:7的野生型编码序列的同一性少于80%。

实施方式P121:实施方式P120所述的重组核酸,其中所述核酸序列包含与选自SEQID NOs:8-12的序列具有至少80%同一性的序列。

实施方式P122:实施方式P121所述的重组核酸,其中所述核酸序列包含选自SEQID NOs:8-12的序列。

实施方式P123:实施方式P120至P122中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自TGA、TAA和TAG的一个或多个终止密码子。

实施方式P124:一种重组核酸,其包含与选自SEQ ID NOs:2-6的序列至少80%同一性的序列。

实施方式P125:所实施方式P124述的重组核酸,其中所述重组核酸包含与选自SEQID NOs:2-6的序列至少90%同一性的序列。

实施方式P126:实施方式P125所述的重组核酸,其中所述重组核酸包含与选自SEQID NOs:2-6的序列至少95%同一性的序列。

实施方式P127:一种重组核酸,其包含选自SEQ ID NOs:2-6的序列。

实施方式P128:实施方式P124至P127中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自TGA、TAA和TAG的一个或多个终止密码子。

实施方式P129:一种重组核酸,其包含与选自SEQ ID NOs:7-12的序列至少80%同一性的序列。

实施方式P130:实施方式P129所述的重组核酸,其中所述重组核酸包含与选自SEQID NOs:7-12的序列至少90%同一性的序列。

实施方式P131:实施方式P130所述的重组核酸,其中所述重组核酸包含与选自SEQID NOs:7-12的序列至少95%同一性的序列。

实施方式P132:一种重组核酸,其包含选自SEQ ID NOs:7-12的序列。

实施方式P133:实施方式P129至P132中的任一项所述的重组核酸,其中所述核酸序列还在3’末端处包含选自TGA、TAA和TAG的一个或多个终止密码子。

实施方式P134:一种rAAV,其包含根据实施方式P116至P133中的任一项所述的重组核酸。

实施方式P135:一种宿主细胞,其包含根据实施方式P116至P133中的任一项所述的重组核酸或实施方式P134的rAAV。

实施方式P136:所实施方式P135述的宿主细胞,其中所述宿主细胞选自HeLa、Cos-7、HEK293、A549、BHK、Vero、RD、HT-1080、ARPE-19或MRC-5细胞。

通过参考并入

本文中提到的每个专利文献和科学论文的整个公开内容为所有目的通过参考并入本文。

等同性

在不背离本发明的精神或本质特征的情况下,本发明可以以其他特定形式来体现。因此,前述实施方式应该在所有情况下被认为是说明性的,而不是限制本文描述的发明。不同实施方式的各种不同结构要素和公开的各种不同方法步骤可以以各种不同的组合和排列使用,并且所有这样的变化形式应该被认为是本公开的形式。因此,本根据的范围由随附的权利要求书而不是上面的描述指明,并且打算将进入权利要求书的意义和等同性范围之内的所有变化涵盖在其中。

序列表

<110> 奥特吉尼克斯制药公司

<120> 用于治疗丙酸血症的基因疗法

<130> AJ4309PT2103

<150> 62/739,471

<151> 2018-10-01

<160> 39

<170> PatentIn version 3.5

<210> 1

<211> 2184

<212> DNA

<213> 智人(Homo sapiens)

<400> 1

atggcggggt tctgggtcgg gacagcaccg ctggtcgctg ccggacggcg tgggcggtgg 60

ccgccgcagc agctgatgct gagcgcggcg ctgcggaccc tgaagcatgt tctgtactat 120

tcaagacagt gcttaatggt gtcccgtaat cttggttcag tgggatatga tcctaatgaa 180

aaaacttttg ataaaattct tgttgctaat agaggagaaa ttgcatgtcg ggttattaga 240

acttgcaaga agatgggcat taagacagtt gccatccaca gtgatgttga tgctagttct 300

gttcatgtga aaatggcgga tgaggctgtc tgtgttggcc cagctcccac cagtaaaagc 360

tacctcaaca tggatgccat catggaagcc attaagaaaa ccagggccca agctgtacat 420

ccaggttatg gattcctttc agaaaacaaa gaatttgcca gatgtttggc agcagaagat 480

gtcgttttca ttggacctga cacacatgct attcaagcca tgggcgacaa gattgaaagc 540

aaattattag ctaagaaagc agaggttaat acaatccctg gctttgatgg agtagtcaag 600

gatgcagaag aagctgtcag aattgcaagg gaaattggct accctgtcat gatcaaggcc 660

tcagcaggtg gtggtgggaa aggcatgcgc attgcttggg atgatgaaga gaccagggat 720

ggttttagat tgtcatctca agaagctgct tctagttttg gcgatgatag actactaata 780

gaaaaattta ttgataatcc tcgtcatata gaaatccagg ttctaggtga taaacatggg 840

aatgctttat ggcttaatga aagagagtgc tcaattcaga gaagaaatca gaaggtggtg 900

gaggaagcac caagcatttt tttggatgcg gagactcgaa gagcgatggg agaacaagct 960

gtagctcttg ccagagcagt aaaatattcc tctgctggga ccgtggagtt ccttgtggac 1020

tctaagaaga atttttattt cttggaaatg aatacaagac tccaggttga gcatcctgtc 1080

acagaatgca ttactggcct ggacctagtc caggaaatga tccgtgttgc taagggctac 1140

cctctcaggc acaaacaagc tgatattcgc atcaacggct gggcagttga atgtcgggtt 1200

tatgctgagg acccctacaa gtcttttggt ttaccatcta ttgggagatt gtctcagtac 1260

caagaaccgt tacatctacc tggtgtccga gtggacagtg gcatccaacc aggaagtgat 1320

attagcattt attatgatcc tatgatttca aaactaatca catatggctc tgatagaact 1380

gaggcactga agagaatggc agatgcactg gataactatg ttattcgagg tgttacacat 1440

aatattgcat tacttcgaga ggtgataatc aactcacgct ttgtaaaagg agacatcagc 1500

actaaatttc tctccgatgt gtatcctgat ggcttcaaag gacacatgct aaccaagagt 1560

gagaagaacc agttattggc aatagcatca tcattgtttg tggcattcca gttaagagca 1620

caacattttc aagaaaattc aagaatgcct gttattaaac cagacatagc caactgggag 1680

ctctcagtaa aattgcatga taaagttcat accgtagtag catcaaacaa tgggtcagtg 1740

ttctcggtgg aagttgatgg gtcgaaacta aatgtgacca gcacgtggaa cctggcttcg 1800

cccttattgt ctgtcagcgt tgatggcact cagaggactg tccagtgtct ttctcgagaa 1860

gcaggtggaa acatgagcat tcagtttctt ggtacagtgt acaaggtgaa tatcttaacc 1920

agacttgccg cagaattgaa caaatttatg ctggaaaaag tgactgagga cacaagcagt 1980

gttctgcgtt ccccgatgcc cggagtggtg gtggccgtct ctgtcaagcc tggagacgcg 2040

gtagcagaag gtcaagaaat ttgtgtgatt gaagccatga aaatgcagaa tagtatgaca 2100

gctgggaaaa ctggcacggt gaaatctgtg cactgtcaag ctggagacac agttggagaa 2160

ggggatctgc tcgtggagct ggaa 2184

<210> 2

<211> 2184

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCA编码序列 -

密码子优化的

<400> 2

atggctggat tttgggtcgg aacggcccct ctcgtggccg ccggccgccg gggtcggtgg 60

ccgccgcaac agctgatgtt gtcggccgcg ctgcgcaccc ttaagcatgt gctgtactac 120

tcccggcaat gccttatggt gtccagaaac ctgggtagcg tgggctatga cccgaacgag 180

aaaaccttcg acaagattct ggtggccaac cggggggaaa ttgcctgccg ggtcatcagg 240

acttgcaaga agatgggcat caagaccgtc gccattcact ccgacgtgga cgcctcctcc 300

gtgcacgtga agatggcaga tgaagccgtc tgcgtgggcc ccgccccgac ctccaagtcc 360

taccttaaca tggacgcgat catggaagcc atcaaaaaga ccagagccca ggcagtgcac 420

ccgggatacg gctttctctc cgaaaacaag gagttcgcgc ggtgcctggc cgctgaagat 480

gtcgtgttca tcggccctga tacccacgcg atccaggcta tgggagacaa gatcgaatcc 540

aagctgctcg ccaagaaagc cgaagtcaac accatacctg ggtttgacgg cgtggtcaag 600

gacgcagaag aagccgtcag gattgcccgc gagatcggat accccgtgat gatcaaggca 660

tccgccgggg ggggaggaaa gggaatgcgc atcgcctggg atgacgaaga aacccgggac 720

ggcttcagac tctcgtcaca agaggccgcg tcctcattcg gggatgaccg gctcctgatt 780

gagaagttca ttgacaatcc tcggcacatc gagattcagg tcctgggcga taagcatgga 840

aacgccctgt ggctgaacga acgcgaatgc agcatccaga ggcggaacca gaaagtggtg 900

gaagaggccc catccatctt tctcgacgcc gagactcgga gagcgatggg tgaacaggcc 960

gtggccctgg cccgagccgt gaagtactcc agcgcgggga ctgtcgagtt cctggtggac 1020

agcaagaaga atttctactt cctggagatg aatactcggc tccaagtgga acaccccgtg 1080

accgaatgca ttaccggtct ggacctcgtc caagaaatga tccgcgtcgc caagggctac 1140

ccattgagac acaaacaggc cgacattcgg atcaacggat gggccgtcga gtgtcgcgtg 1200

tacgcggaag atccgtataa gtcgttcgga ctgccgtcca ttggtagact ctcgcagtac 1260

caagagccac tgcacctccc cggagtgcgc gtggactcag gcatccagcc cggaagcgac 1320

atctctatct actacgaccc catgatttcc aagttgatca cctacgggtc cgataggacc 1380

gaggcactga agcgcatggc tgacgcactt gacaactacg tgatccgcgg ggtcactcac 1440

aacattgccc tgctccgcga agtgatcatc aactcgcgct tcgtgaaggg cgacatctcc 1500

actaagttcc tgtccgacgt gtaccctgac ggtttcaagg gccatatgct gaccaagtcc 1560

gagaagaacc agctcctggc tatcgcctcc tccctgtttg tggcgttcca gctgagggcg 1620

cagcacttcc aggagaacag ccggatgccc gtgatcaagc ctgacatcgc caattgggag 1680

ctgtccgtga agctgcacga taaggtccat accgtggtgg catccaacaa cggatcggtg 1740

ttcagcgtgg aagtggacgg gtccaagctg aacgtgacca gcacatggaa cctggcgtcc 1800

cccctgttgt ctgtgtcggt cgatggcacg cagcgcactg tgcagtgcct ctcccgggaa 1860

gctggcggaa acatgagcat ccagttcctg ggtactgtgt acaaggtcaa cattctgact 1920

cggctggccg ccgagctgaa caagttcatg ttggaaaaag tcaccgaaga tacatcgtca 1980

gtcctgcgga gcccaatgcc tggagtcgtg gtggcggtgt cagtgaagcc cggcgatgct 2040

gtggccgaag gccaagagat ctgcgtgatc gaggccatga agatgcagaa ctcgatgacc 2100

gccggaaaga ccggtaccgt gaagtccgtg cattgtcaag cgggcgacac tgtgggagag 2160

ggagatctgc tcgtggagct ggag 2184

<210> 3

<211> 2184

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCA编码序列 -

密码子优化的

<400> 3

atggccggct tctgggtcgg caccgcccct ctggtcgcgg ccggacgacg cggacgctgg 60

ccaccccagc aactgatgct gagcgcggcc ttgaggactc tgaagcacgt gctctactac 120

tcgcggcagt gcctgatggt gtcccggaat ctggggtccg tgggatacga ccctaacgaa 180

aagaccttcg ataagatcct cgtggcaaat cggggagaga tcgcgtgtcg cgtgatccgc 240

acgtgcaaga agatggggat caagactgtg gcaatccata gcgatgtgga tgcatcctcg 300

gtccacgtga agatggccga cgaagctgtg tgcgtgggac cggcgccgac ttcgaaatcg 360

tacctgaaca tggacgctat tatggaggcg atcaagaaaa cgcgcgccca agcggtccat 420

cccggttacg gattcctgag cgagaacaag gaatttgcac ggtgcctcgc tgccgaggac 480

gtggtgttta tcggtcccga cacccacgcc atccaagcta tgggggacaa gattgagtcc 540

aagctcctgg cgaaaaaggc agaggtcaac acaattcctg gtttcgacgg cgtcgtgaag 600

gacgccgaag aagccgtgcg catcgcgagg gaaatcggtt accctgtgat gattaaggcc 660

tccgccggcg gcggtggaaa gggaatgaga attgcctggg acgatgaaga aacccgcgac 720

ggattccgcc tgtcgagcca ggaagccgcc tcttccttcg gcgatgacag actgctgatc 780

gaaaagttca tcgataaccc cagacacatt gagatccaag tgctcgggga taagcacggc 840

aacgcccttt ggctgaacga gagagagtgc tccattcaac gccgcaatca gaaggtcgtg 900

gaggaagccc cgtcgatatt cctggatgcc gaaacccggc gggccatggg agagcaggct 960

gtcgcgttgg cgcgggccgt caagtacagc tcggccggga ccgtggaatt tctggtcgat 1020

tccaagaaga acttctattt cctggagatg aacaccagac tccaggtcga gcacccggtc 1080

actgagtgta tcaccgggct cgatctggtg caagagatga ttcgggtggc gaagggatat 1140

ccccttcggc ataaacaagc cgacatcagg atcaacggtt gggccgtgga atgcagggtc 1200

tacgccgagg acccctacaa gagcttcggc ctgcccagca tcggccgcct gtcacagtat 1260

caggaaccgc tgcatcttcc gggcgtgcgg gtcgacagcg gaattcagcc tggctcagat 1320

atctccatct actacgatcc aatgatctca aagctgatta cttatggatc cgaccggacc 1380

gaagccctta agcgaatggc cgacgccctg gacaactacg tgatccgggg agtgacccac 1440

aacatcgcct tgctgcggga agtgatcatt aacagcagat tcgtgaaggg agacatcagc 1500

accaagttcc tgtcggatgt ctacccggac gggttcaaag ggcacatgct tactaagtcc 1560

gagaagaatc agctgctcgc cattgcgtca agcttgttcg tggcctttca actccgggcc 1620

cagcacttcc aggaaaactc ccgcatgcca gtcattaagc cggacatcgc caactgggaa 1680

ctcagcgtga agctccatga caaagtgcat accgtggtgg ccagcaacaa cggtagcgtg 1740

ttctcagtcg aggtcgatgg ctcgaagctc aacgtcactt ccacttggaa cttggccagc 1800

ccgctgctgt ccgtgtccgt ggacggaacc cagaggaccg tgcagtgtct gtcgagagaa 1860

gccggcggca acatgtcaat ccagttcctg ggaaccgtgt acaaggtcaa catcctgacc 1920

agactggccg ccgaactgaa caagtttatg ctcgagaaag tgaccgagga cactagctcc 1980

gtgctgcgct cccctatgcc cggagtggtc gtggcagtgt ccgtgaagcc gggcgacgcc 2040

gtggccgagg gacaggaaat ctgtgtgatc gaagcgatga agatgcagaa ttcaatgacc 2100

gcgggaaaga ctgggaccgt gaagtctgtg cactgccagg ctggcgatac cgtgggggag 2160

ggcgaccttc tggtggaact cgag 2184

<210> 4

<211> 2184

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCA编码序列 -

密码子优化的

<400> 4

atggctgggt tttgggtggg gacagctcct ctggtggctg ctgggaggag ggggaggtgg 60

cctcctcagc agctgatgct gtctgctgct ctgaggacac tgaagcatgt gctgtattat 120

tctaggcagt gtctgatggt gtctaggaat ctggggtctg tggggtatga tcctaatgag 180

aagacatttg ataagattct ggtggctaat aggggggaga ttgcttgtag ggtgattagg 240

acatgtaaga agatggggat taagacagtg gctattcatt ctgatgtgga tgcttcttct 300

gtgcatgtga agatggctga tgaggctgtg tgtgtggggc ctgctcctac atctaagtct 360

tatctgaata tggatgctat tatggaggct attaagaaga caagggctca ggctgtgcat 420

cctgggtatg ggtttctgtc tgagaataag gagtttgcta ggtgtctggc tgctgaggat 480

gtggtgttta ttgggcctga tacacatgct attcaggcta tgggggataa gattgagtct 540

aagctgctgg ctaagaaggc tgaggtgaat acaattcctg ggtttgatgg ggtggtgaag 600

gatgctgagg aggctgtgag gattgctagg gagattgggt atcctgtgat gattaaggct 660

tctgctgggg ggggggggaa ggggatgagg attgcttggg atgatgagga gacaagggat 720

gggtttaggc tgtcttctca ggaggctgct tcttcttttg gggatgatag gctgctgatt 780

gagaagttta ttgataatcc taggcatatt gagattcagg tgctggggga taagcatggg 840

aatgctctgt ggctgaatga gagggagtgt tctattcaga ggaggaatca gaaggtggtg 900

gaggaggctc cttctatttt tctggatgct gagacaagga gggctatggg ggagcaggct 960

gtggctctgg ctagggctgt gaagtattct tctgctggga cagtggagtt tctggtggat 1020

tctaagaaga atttttattt tctggagatg aatacaaggc tgcaggtgga gcatcctgtg 1080

acagagtgta ttacagggct ggatctggtg caggagatga ttagggtggc taaggggtat 1140

cctctgaggc ataagcaggc tgatattagg attaatgggt gggctgtgga gtgtagggtg 1200

tatgctgagg atccttataa gtcttttggg ctgccttcta ttgggaggct gtctcagtat 1260

caggagcctc tgcatctgcc tggggtgagg gtggattctg ggattcagcc tgggtctgat 1320

atttctattt attatgatcc tatgatttct aagctgatta catatgggtc tgataggaca 1380

gaggctctga agaggatggc tgatgctctg gataattatg tgattagggg ggtgacacat 1440

aatattgctc tgctgaggga ggtgattatt aattctaggt ttgtgaaggg ggatatttct 1500

acaaagtttc tgtctgatgt gtatcctgat gggtttaagg ggcatatgct gacaaagtct 1560

gagaagaatc agctgctggc tattgcttct tctctgtttg tggcttttca gctgagggct 1620

cagcattttc aggagaattc taggatgcct gtgattaagc ctgatattgc taattgggag 1680

ctgtctgtga agctgcatga taaggtgcat acagtggtgg cttctaataa tgggtctgtg 1740

ttttctgtgg aggtggatgg gtctaagctg aatgtgacat ctacatggaa tctggcttct 1800

cctctgctgt ctgtgtctgt ggatgggaca cagaggacag tgcagtgtct gtctagggag 1860

gctgggggga atatgtctat tcagtttctg gggacagtgt ataaggtgaa tattctgaca 1920

aggctggctg ctgagctgaa taagtttatg ctggagaagg tgacagagga tacatcttct 1980

gtgctgaggt ctcctatgcc tggggtggtg gtggctgtgt ctgtgaagcc tggggatgct 2040

gtggctgagg ggcaggagat ttgtgtgatt gaggctatga agatgcagaa ttctatgaca 2100

gctgggaaga cagggacagt gaagtctgtg cattgtcagg ctggggatac agtgggggag 2160

ggggatctgc tggtggagct ggag 2184

<210> 5

<211> 2184

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCA编码序列 -

密码子优化的

<400> 5

atggcagggt tttgggtggg gacagcacca ctggtggcag cagggaggag ggggaggtgg 60

ccaccacagc agctgatgct gtcagcagca ctgaggacac tgaagcatgt gctgtattat 120

tcaaggcagt gtctgatggt gtcaaggaat ctggggtcag tggggtatga tccaaatgag 180

aagacatttg ataagattct ggtggcaaat aggggggaga ttgcatgtag ggtgattagg 240

acatgtaaga agatggggat taagacagtg gcaattcatt cagatgtgga tgcatcatca 300

gtgcatgtga agatggcaga tgaggcagtg tgtgtggggc cagcaccaac atcaaagtca 360

tatctgaata tggatgcaat tatggaggca attaagaaga caagggcaca ggcagtgcat 420

ccagggtatg ggtttctgtc agagaataag gagtttgcaa ggtgtctggc agcagaggat 480

gtggtgttta ttgggccaga tacacatgca attcaggcaa tgggggataa gattgagtca 540

aagctgctgg caaagaaggc agaggtgaat acaattccag ggtttgatgg ggtggtgaag 600

gatgcagagg aggcagtgag gattgcaagg gagattgggt atccagtgat gattaaggca 660

tcagcagggg ggggggggaa ggggatgagg attgcatggg atgatgagga gacaagggat 720

gggtttaggc tgtcatcaca ggaggcagca tcatcatttg gggatgatag gctgctgatt 780

gagaagttta ttgataatcc aaggcatatt gagattcagg tgctggggga taagcatggg 840

aatgcactgt ggctgaatga gagggagtgt tcaattcaga ggaggaatca gaaggtggtg 900

gaggaggcac catcaatttt tctggatgca gagacaagga gggcaatggg ggagcaggca 960

gtggcactgg caagggcagt gaagtattca tcagcaggga cagtggagtt tctggtggat 1020

tcaaagaaga atttttattt tctggagatg aatacaaggc tgcaggtgga gcatccagtg 1080

acagagtgta ttacagggct ggatctggtg caggagatga ttagggtggc aaaggggtat 1140

ccactgaggc ataagcaggc agatattagg attaatgggt gggcagtgga gtgtagggtg 1200

tatgcagagg atccatataa gtcatttggg ctgccatcaa ttgggaggct gtcacagtat 1260

caggagccac tgcatctgcc aggggtgagg gtggattcag ggattcagcc agggtcagat 1320

atttcaattt attatgatcc aatgatttca aagctgatta catatgggtc agataggaca 1380

gaggcactga agaggatggc agatgcactg gataattatg tgattagggg ggtgacacat 1440

aatattgcac tgctgaggga ggtgattatt aattcaaggt ttgtgaaggg ggatatttca 1500

acaaagtttc tgtcagatgt gtatccagat gggtttaagg ggcatatgct gacaaagtca 1560

gagaagaatc agctgctggc aattgcatca tcactgtttg tggcatttca gctgagggca 1620

cagcattttc aggagaattc aaggatgcca gtgattaagc cagatattgc aaattgggag 1680

ctgtcagtga agctgcatga taaggtgcat acagtggtgg catcaaataa tgggtcagtg 1740

ttttcagtgg aggtggatgg gtcaaagctg aatgtgacat caacatggaa tctggcatca 1800

ccactgctgt cagtgtcagt ggatgggaca cagaggacag tgcagtgtct gtcaagggag 1860

gcagggggga atatgtcaat tcagtttctg gggacagtgt ataaggtgaa tattctgaca 1920

aggctggcag cagagctgaa taagtttatg ctggagaagg tgacagagga tacatcatca 1980

gtgctgaggt caccaatgcc aggggtggtg gtggcagtgt cagtgaagcc aggggatgca 2040

gtggcagagg ggcaggagat ttgtgtgatt gaggcaatga agatgcagaa ttcaatgaca 2100

gcagggaaga cagggacagt gaagtcagtg cattgtcagg caggggatac agtgggggag 2160

ggggatctgc tggtggagct ggag 2184

<210> 6

<211> 2184

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCA编码序列 -

密码子优化的

<400> 6

atggctggtt tttgggtagg tacagcacca ctagtagcag caggtaggag gggtaggtgg 60

ccaccacaac aactaatgct atcagcagca ctaaggacac taaagcatgt actatattat 120

tcaaggcaat gtctaatggt atcaaggaat ctggggtctg tggggtatga tcctaatgag 180

aagacatttg ataagattct ggtggctaat aggggggaga ttgcttgtag ggtgattagg 240

acatgtaaga agatggggat taagacagtg gctattcatt ctgatgtgga tgcttcttct 300

gtgcatgtga agatggctga tgaggctgtg tgtgtggggc ctgctcctac atctaagtct 360

tatctgaata tggatgctat tatggaggct attaagaaga caagggctca ggctgtgcat 420

cctgggtatg ggtttctgtc tgagaataag gagtttgcta ggtgtctggc tgctgaggat 480

gtggtgttta ttgggcctga tacacatgct attcaggcta tgggggataa gattgagtct 540

aagctgctgg ctaagaaggc tgaggtgaat acaattcctg ggtttgatgg ggtggtgaag 600

gatgctgagg aggctgtgag gattgctagg gagattgggt atcctgtgat gattaaggct 660

tctgctgggg ggggggggaa ggggatgagg attgcttggg atgatgagga gacaagggat 720

gggtttaggc tgtcttctca ggaggctgct tcttcttttg gggatgatag gctgctgatt 780

gagaagttta ttgataatcc taggcatatt gagattcagg tgctggggga taagcatggg 840

aatgctctgt ggctgaatga gagggagtgt tctattcaga ggaggaatca gaaggtggtg 900

gaggaggctc cttctatttt tctggatgct gagacaagga gggctatggg ggagcaggct 960

gtggctctgg ctagggctgt gaagtattct tctgctggga cagtggagtt tctggtggat 1020

tctaagaaga atttttattt tctggagatg aatacaaggc tgcaggtgga gcatcctgtg 1080

acagagtgta ttacagggct ggatctggtg caggagatga ttagggtggc taaggggtat 1140

cctctgaggc ataagcaggc tgatattagg attaatgggt gggctgtgga gtgtagggtg 1200

tatgctgagg atccttataa gtcttttggg ctgccttcta ttgggaggct gtctcagtat 1260

caggagcctc tgcatctgcc tggggtgagg gtggattctg ggattcagcc tgggtctgat 1320

atttctattt attatgatcc tatgatttct aagctgatta catatgggtc tgataggaca 1380

gaggctctga agaggatggc tgatgctctg gataattatg tgattagggg ggtgacacat 1440

aatattgctc tgctgaggga ggtgattatt aattctaggt ttgtgaaggg ggatatttct 1500

acaaagtttc tgtctgatgt gtatcctgat gggtttaagg ggcatatgct gacaaagtct 1560

gagaagaatc agctgctggc tattgcttct tctctgtttg tggcttttca gctgagggct 1620

cagcattttc aggagaattc taggatgcct gtgattaagc ctgatattgc taattgggag 1680

ctgtctgtga agctgcatga taaggtgcat acagtggtgg cttctaataa tgggtctgtg 1740

ttttctgtgg aggtggatgg gtctaagctg aatgtgacat ctacatggaa tctggcttct 1800

cctctgctgt ctgtgtctgt ggatgggaca cagaggacag tgcagtgtct gtctagggag 1860

gctgggggga atatgtctat tcagtttctg gggacagtgt ataaggtgaa tattctgaca 1920

aggctggctg ctgagctgaa taagtttatg ctggagaagg tgacagagga tacatcttct 1980

gtgctgaggt ctcctatgcc tggggtggtg gtggctgtgt ctgtgaagcc tggggatgct 2040

gtggctgagg ggcaggagat ttgtgtgatt gaggctatga agatgcagaa ttctatgaca 2100

gctgggaaga cagggacagt gaagtctgtg cattgtcagg ctggggatac agtgggggag 2160

ggggatctgc tggtggagct ggag 2184

<210> 7

<211> 1617

<212> DNA

<213> 智人(Homo sapiens)

<400> 7

atggcggcgg cattacgggt ggcggcggtc ggggcaaggc tcagcgttct ggcgagcggt 60

ctccgcgccg cggtccgcag cctttgcagc caggccacct ctgttaacga acgcatcgaa 120

aacaagcgcc ggaccgcgct gctgggaggg ggccaacgcc gtattgacgc gcagcacaag 180

cgaggaaagc taacagccag ggagaggatc agtctcttgc tggaccctgg cagctttgtt 240

gagagcgaca tgtttgtgga acacagatgt gcagattttg gaatggctgc tgataagaat 300

aagtttcctg gagacagcgt ggtcactgga cgaggccgaa tcaatggaag attggtttat 360

gtcttcagtc aggattttac agtttttgga ggcagtctgt caggagcaca tgcccaaaag 420

atctgcaaaa tcatggacca ggccataacg gtgggggctc cagtgattgg gctgaatgac 480

tctgggggag cacggatcca agaaggagtg gagtctttgg ctggctatgc agacatcttt 540

ctgaggaatg ttacggcatc cggagtcatc cctcagattt ctctgatcat gggcccatgt 600

gctggtgggg ccgtctactc cccagcccta acagacttca cgttcatggt aaaggacacc 660

tcctacctgt tcatcactgg ccctgatgtt gtgaagtctg tcaccaatga ggatgttacc 720

caggaggagc tcggtggtgc caagacccac accaccatgt caggtgtggc ccacagagct 780

tttgaaaatg atgttgatgc cttgtgtaat ctccgggatt tcttcaacta cctgcccctg 840

agcagtcagg acccggctcc cgtccgtgag tgccacgatc ccagtgaccg tctggttcct 900

gagcttgaca caattgtccc tttggaatca accaaagcct acaacatggt ggacatcata 960

cactctgttg ttgatgagcg tgaatttttt gagatcatgc ccaattatgc caagaacatc 1020

attgttggtt ttgcaagaat gaatgggagg actgttggaa ttgttggcaa ccaacctaag 1080

gtggcctcag gatgcttgga tattaattca tctgtgaaag gggctcgttt tgtcagattc 1140

tgtgatgcat tcaatattcc actcatcact tttgttgatg tccctggctt tctacctggc 1200

acagcacagg aatacggggg catcatccgg catggtgcca agcttctcta cgcatttgct 1260

gaggcaactg tacccaaagt cacagtcatc accaggaagg cctatggagg tgcctatgat 1320

gtcatgagct ctaagcacct ttgtggtgat accaactatg cctggcccac cgcagagatt 1380

gcagtcatgg gagcaaaggg cgctgtggag atcatcttca aagggcatga gaatgtggaa 1440

gctgctcagg cagagtacat cgagaagttt gccaaccctt tccctgcagc agtgcgaggg 1500

tttgtggatg acatcatcca accttcttcc acacgtgccc gaatctgctg tgacctggat 1560

gtcttggcca gcaagaaggt acaacgtcct tggagaaaac atgcaaatat tccattg 1617

<210> 8

<211> 1617

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCB编码序列 -

密码子优化的

<400> 8

atggctgccg ccctgcgcgt ggcggccgtg ggagcaagac tgtccgtgct ggcgtcgggc 60

ttgagagcgg ccgtgcggag cctgtgctca caagcaacct cggtgaacga acgcatcgag 120

aacaagcgca ggactgcgct gctgggcggg ggccagcgca ggatcgacgc acagcataag 180

cgcggaaagc tgaccgcccg cgagcggatt tccctgctcc tggatcctgg aagcttcgtg 240

gagtccgaca tgttcgtgga gcaccgctgc gccgacttcg ggatggctgc cgacaagaac 300

aagttccccg gggactcagt ggtcactggt cgcggaagaa tcaatggccg gctcgtctac 360

gtgttctcac aagactttac tgtgttcggc ggctccctgt cgggagccca cgcgcaaaag 420

atctgcaaga ttatggatca ggccatcact gtgggagcgc ctgtgattgg actcaacgac 480

tccgggggag caagaatcca ggaaggagtg gaaagccttg ccggctacgc tgacatcttc 540

ctccggaacg tgaccgcctc tggagtgatt ccgcaaatct ccctgatcat gggaccatgt 600

gccgggggcg ccgtgtactc cccggcgctg actgacttca ctttcatggt caaggacaca 660

tcctacctgt tcatcaccgg tcccgacgtc gtgaagtccg tgaccaacga ggatgtgacc 720

caggaagaac tggggggggc caagacgcat accaccatgt cgggagtggc ccaccgggcc 780

ttcgagaacg atgtggacgc cttgtgcaac cttcgggact tcttcaatta tctcccgctg 840

agcagccagg atccggcccc agtgcgggaa tgccacgacc cttcggatcg gttggtgcct 900

gagctggata ccatcgtgcc cctcgaatcc accaaggctt acaacatggt cgacatcatt 960

cactccgtgg tggacgagag ggaattcttc gagattatgc cgaactacgc caagaacatc 1020

attgtcggat tcgcccgcat gaacggtcga actgtgggca ttgtcggaaa ccagcctaaa 1080

gtggcctccg gttgcctgga catcaactca agcgtgaagg gtgccagatt tgtgcggttt 1140

tgtgacgcgt tcaatattcc gctgatcacc ttcgtcgacg tcccgggctt cctgcctggg 1200

accgcccagg aatacggcgg catcatcaga cacggcgcga agctcctcta cgcgttcgcg 1260

gaagccaccg tgcccaaggt caccgtgatc actcgcaagg catacggcgg cgcatacgat 1320

gtgatgtcct ccaagcacct gtgtggcgac accaactacg cctggcccac cgccgagatc 1380

gccgtgatgg gtgccaaggg tgctgtcgag atcatcttca agggacatga aaacgtggaa 1440

gctgcccagg ccgagtacat tgaaaagttc gctaacccct tccctgccgc cgtgcgggga 1500

tttgtggatg acattatcca gccgagctcg accagggcca gaatctgctg cgatcttgat 1560

gtgttggcca gcaaaaaggt ccagcggccc tggcggaaac acgccaacat tccactg 1617

<210> 9

<211> 1617

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCB编码序列 -

密码子优化的

<400> 9

atggccgcgg cgcttagagt ggccgctgtg ggagccaggc tgagcgtgct ggccagcggt 60

ctgcgcgccg cagtgcgctc gctgtgtagc caggctacct ccgtgaatga gcggatcgaa 120

aacaagcggc gcaccgccct gttgggcggc ggacagcggc gaattgacgc ccaacacaag 180

cggggaaagc tcactgcgag ggaaagaatc tcactgctgc tcgaccccgg gtcgttcgtg 240

gaatcggata tgtttgtcga acatagatgc gcagatttcg gaatggccgc tgacaagaac 300

aagttcccgg gagattccgt cgtgaccgga agggggcgca ttaacgggag acttgtgtac 360

gtgttcagcc aggatttcac ggtgttcggc ggatcactga gcggtgcaca tgcacagaag 420

atctgcaaga tcatggacca ggccattacc gtcggggcac ctgtgatcgg cctgaatgat 480

tcgggcggag cccggattca agagggcgtg gagtcactcg cgggttacgc cgacattttc 540

ctgcggaacg tcaccgcctc cggcgtgatc cctcaaatca gcctcattat gggcccctgc 600

gcgggcggtg ccgtctactc acccgctctg accgatttta ccttcatggt caaggacacc 660

tcctatctgt ttatcactgg accagatgtg gtcaagtccg tgaccaacga ggacgtcact 720

caggaagaac tcggtggagc aaagacccac actactatgt ccggggtcgc gcatagagct 780

ttcgaaaacg acgtcgatgc tctctgtaac ctgagggatt tcttcaacta ccttccactg 840

tcgtcgcaag acccagcccc cgtgcgcgag tgccacgatc cctccgaccg cctggtgccg 900

gaactcgaca ctattgtccc tctggagtca accaaggcct acaacatggt ggacatcatc 960

catagcgtcg tggatgaacg ggagttcttc gaaatcatgc ccaactatgc gaaaaatatc 1020

atcgtgggct ttgcgcggat gaacggccgc accgtgggca tagtgggcaa ccagccgaag 1080

gtcgcgtcgg gatgcctcga tatcaacagc tctgtgaagg gagcgcggtt cgtgcgcttc 1140

tgcgacgcct tcaacatccc cttgatcacc ttcgtggatg tgcctgggtt cttgcctgga 1200

accgcccagg aatacggggg gatcattcgg cacggagcaa aactgctgta cgccttcgcc 1260

gaggccactg tgccgaaagt gacagtgatt acccggaagg cctacggggg tgcctacgac 1320

gtgatgagct ccaagcacct gtgcggagac accaattacg cgtggcctac tgctgaaatt 1380

gctgtcatgg gagccaaggg cgccgtggaa atcattttca agggccacga aaacgtcgag 1440

gccgcccaag ctgagtacat cgagaagttt gccaacccgt ttcctgcggc tgtgcgcggc 1500

ttcgtcgacg atatcattca gccctcgtcc actcgcgccc gcatttgttg tgacctcgac 1560

gtgctggcgt ccaagaaagt gcaaagaccg tggagaaagc atgcaaacat cccgctc 1617

<210> 10

<211> 1617

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCB编码序列 -

密码子优化的

<400> 10

atggctgctg ctctgagggt ggctgctgtg ggggctaggc tgtctgtgct ggcttctggg 60

ctgagggctg ctgtgaggtc tctgtgttct caggctacat ctgtgaatga gaggattgag 120

aataagagga ggacagctct gctggggggg gggcagagga ggattgatgc tcagcataag 180

agggggaagc tgacagctag ggagaggatt tctctgctgc tggatcctgg gtcttttgtg 240

gagtctgata tgtttgtgga gcataggtgt gctgattttg ggatggctgc tgataagaat 300

aagtttcctg gggattctgt ggtgacaggg agggggagga ttaatgggag gctggtgtat 360

gtgttttctc aggattttac agtgtttggg gggtctctgt ctggggctca tgctcagaag 420

atttgtaaga ttatggatca ggctattaca gtgggggctc ctgtgattgg gctgaatgat 480

tctggggggg ctaggattca ggagggggtg gagtctctgg ctgggtatgc tgatattttt 540

ctgaggaatg tgacagcttc tggggtgatt cctcagattt ctctgattat ggggccttgt 600

gctggggggg ctgtgtattc tcctgctctg acagatttta catttatggt gaaggataca 660

tcttatctgt ttattacagg gcctgatgtg gtgaagtctg tgacaaatga ggatgtgaca 720

caggaggagc tggggggggc taagacacat acaacaatgt ctggggtggc tcatagggct 780

tttgagaatg atgtggatgc tctgtgtaat ctgagggatt tttttaatta tctgcctctg 840

tcttctcagg atcctgctcc tgtgagggag tgtcatgatc cttctgatag gctggtgcct 900

gagctggata caattgtgcc tctggagtct acaaaggctt ataatatggt ggatattatt 960

cattctgtgg tggatgagag ggagtttttt gagattatgc ctaattatgc taagaatatt 1020

attgtggggt ttgctaggat gaatgggagg acagtgggga ttgtggggaa tcagcctaag 1080

gtggcttctg ggtgtctgga tattaattct tctgtgaagg gggctaggtt tgtgaggttt 1140

tgtgatgctt ttaatattcc tctgattaca tttgtggatg tgcctgggtt tctgcctggg 1200

acagctcagg agtatggggg gattattagg catggggcta agctgctgta tgcttttgct 1260

gaggctacag tgcctaaggt gacagtgatt acaaggaagg cttatggggg ggcttatgat 1320

gtgatgtctt ctaagcatct gtgtggggat acaaattatg cttggcctac agctgagatt 1380

gctgtgatgg gggctaaggg ggctgtggag attattttta aggggcatga gaatgtggag 1440

gctgctcagg ctgagtatat tgagaagttt gctaatcctt ttcctgctgc tgtgaggggg 1500

tttgtggatg atattattca gccttcttct acaagggcta ggatttgttg tgatctggat 1560

gtgctggctt ctaagaaggt gcagaggcct tggaggaagc atgctaatat tcctctg 1617

<210> 11

<211> 1617

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCB编码序列 -

密码子优化的

<400> 11

atggcagcag cactgagggt ggcagcagtg ggggcaaggc tgtcagtgct ggcatcaggg 60

ctgagggcag cagtgaggtc actgtgttca caggcaacat cagtgaatga gaggattgag 120

aataagagga ggacagcact gctggggggg gggcagagga ggattgatgc acagcataag 180

agggggaagc tgacagcaag ggagaggatt tcactgctgc tggatccagg gtcatttgtg 240

gagtcagata tgtttgtgga gcataggtgt gcagattttg ggatggcagc agataagaat 300

aagtttccag gggattcagt ggtgacaggg agggggagga ttaatgggag gctggtgtat 360

gtgttttcac aggattttac agtgtttggg gggtcactgt caggggcaca tgcacagaag 420

atttgtaaga ttatggatca ggcaattaca gtgggggcac cagtgattgg gctgaatgat 480

tcaggggggg caaggattca ggagggggtg gagtcactgg cagggtatgc agatattttt 540

ctgaggaatg tgacagcatc aggggtgatt ccacagattt cactgattat ggggccatgt 600

gcaggggggg cagtgtattc accagcactg acagatttta catttatggt gaaggataca 660

tcatatctgt ttattacagg gccagatgtg gtgaagtcag tgacaaatga ggatgtgaca 720

caggaggagc tggggggggc aaagacacat acaacaatgt caggggtggc acatagggca 780

tttgagaatg atgtggatgc actgtgtaat ctgagggatt tttttaatta tctgccactg 840

tcatcacagg atccagcacc agtgagggag tgtcatgatc catcagatag gctggtgcca 900

gagctggata caattgtgcc actggagtca acaaaggcat ataatatggt ggatattatt 960

cattcagtgg tggatgagag ggagtttttt gagattatgc caaattatgc aaagaatatt 1020

attgtggggt ttgcaaggat gaatgggagg acagtgggga ttgtggggaa tcagccaaag 1080

gtggcatcag ggtgtctgga tattaattca tcagtgaagg gggcaaggtt tgtgaggttt 1140

tgtgatgcat ttaatattcc actgattaca tttgtggatg tgccagggtt tctgccaggg 1200

acagcacagg agtatggggg gattattagg catggggcaa agctgctgta tgcatttgca 1260

gaggcaacag tgccaaaggt gacagtgatt acaaggaagg catatggggg ggcatatgat 1320

gtgatgtcat caaagcatct gtgtggggat acaaattatg catggccaac agcagagatt 1380

gcagtgatgg gggcaaaggg ggcagtggag attattttta aggggcatga gaatgtggag 1440

gcagcacagg cagagtatat tgagaagttt gcaaatccat ttccagcagc agtgaggggg 1500

tttgtggatg atattattca gccatcatca acaagggcaa ggatttgttg tgatctggat 1560

gtgctggcat caaagaaggt gcagaggcca tggaggaagc atgcaaatat tccactg 1617

<210> 12

<211> 1617

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:PCCB编码序列 -

密码子优化的

<400> 12

atggctgcag cactaagggt agcagcagta ggtgcaaggc tatcagtact agcatcaggt 60

ctaagggcag cagtaaggtc actatgttca caagcaacat cagtaaatga aaggatagaa 120

aataagagga ggacagcact actaggtggt gggcagagga ggattgatgc tcagcataag 180

agggggaagc tgacagctag ggagaggatt tctctgctgc tggatcctgg gtcttttgtg 240

gagtctgata tgtttgtgga gcataggtgt gctgattttg ggatggctgc tgataagaat 300

aagtttcctg gggattctgt ggtgacaggg agggggagga ttaatgggag gctggtgtat 360

gtgttttctc aggattttac agtgtttggg gggtctctgt ctggggctca tgctcagaag 420

atttgtaaga ttatggatca ggctattaca gtgggggctc ctgtgattgg gctgaatgat 480

tctggggggg ctaggattca ggagggggtg gagtctctgg ctgggtatgc tgatattttt 540

ctgaggaatg tgacagcttc tggggtgatt cctcagattt ctctgattat ggggccttgt 600

gctggggggg ctgtgtattc tcctgctctg acagatttta catttatggt gaaggataca 660

tcttatctgt ttattacagg gcctgatgtg gtgaagtctg tgacaaatga ggatgtgaca 720

caggaggagc tggggggggc taagacacat acaacaatgt ctggggtggc tcatagggct 780

tttgagaatg atgtggatgc tctgtgtaat ctgagggatt tttttaatta tctgcctctg 840

tcttctcagg atcctgctcc tgtgagggag tgtcatgatc cttctgatag gctggtgcct 900

gagctggata caattgtgcc tctggagtct acaaaggctt ataatatggt ggatattatt 960

cattctgtgg tggatgagag ggagtttttt gagattatgc ctaattatgc taagaatatt 1020

attgtggggt ttgctaggat gaatgggagg acagtgggga ttgtggggaa tcagcctaag 1080

gtggcttctg ggtgtctgga tattaattct tctgtgaagg gggctaggtt tgtgaggttt 1140

tgtgatgctt ttaatattcc tctgattaca tttgtggatg tgcctgggtt tctgcctggg 1200

acagctcagg agtatggggg gattattagg catggggcta agctgctgta tgcttttgct 1260

gaggctacag tgcctaaggt gacagtgatt acaaggaagg cttatggggg ggcttatgat 1320

gtgatgtctt ctaagcatct gtgtggggat acaaattatg cttggcctac agctgagatt 1380

gctgtgatgg gggctaaggg ggctgtggag attattttta aggggcatga gaatgtggag 1440

gctgctcagg ctgagtatat tgagaagttt gctaatcctt ttcctgctgc tgtgaggggg 1500

tttgtggatg atattattca gccttcttct acaagggcta ggatttgttg tgatctggat 1560

gtgctggctt ctaagaaggt gcagaggcct tggaggaagc atgctaatat tcctctg 1617

<210> 13

<211> 2211

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:AAV9核酸序列

<400> 13

atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180

aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020

acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140

acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260

cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500

tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680

accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980

gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040

gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160

tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210> 14

<211> 736

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述:AAV9氨基酸序列

<400> 14

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 15

<211> 145

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:AAV2 ITR

<400> 15

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 16

<211> 728

<212> PRT

<213> 智人(Homo sapiens)

<400> 16

Met Ala Gly Phe Trp Val Gly Thr Ala Pro Leu Val Ala Ala Gly Arg

1 5 10 15

Arg Gly Arg Trp Pro Pro Gln Gln Leu Met Leu Ser Ala Ala Leu Arg

20 25 30

Thr Leu Lys His Val Leu Tyr Tyr Ser Arg Gln Cys Leu Met Val Ser

35 40 45

Arg Asn Leu Gly Ser Val Gly Tyr Asp Pro Asn Glu Lys Thr Phe Asp

50 55 60

Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Ala Cys Arg Val Ile Arg

65 70 75 80

Thr Cys Lys Lys Met Gly Ile Lys Thr Val Ala Ile His Ser Asp Val

85 90 95

Asp Ala Ser Ser Val His Val Lys Met Ala Asp Glu Ala Val Cys Val

100 105 110

Gly Pro Ala Pro Thr Ser Lys Ser Tyr Leu Asn Met Asp Ala Ile Met

115 120 125

Glu Ala Ile Lys Lys Thr Arg Ala Gln Ala Val His Pro Gly Tyr Gly

130 135 140

Phe Leu Ser Glu Asn Lys Glu Phe Ala Arg Cys Leu Ala Ala Glu Asp

145 150 155 160

Val Val Phe Ile Gly Pro Asp Thr His Ala Ile Gln Ala Met Gly Asp

165 170 175

Lys Ile Glu Ser Lys Leu Leu Ala Lys Lys Ala Glu Val Asn Thr Ile

180 185 190

Pro Gly Phe Asp Gly Val Val Lys Asp Ala Glu Glu Ala Val Arg Ile

195 200 205

Ala Arg Glu Ile Gly Tyr Pro Val Met Ile Lys Ala Ser Ala Gly Gly

210 215 220

Gly Gly Lys Gly Met Arg Ile Ala Trp Asp Asp Glu Glu Thr Arg Asp

225 230 235 240

Gly Phe Arg Leu Ser Ser Gln Glu Ala Ala Ser Ser Phe Gly Asp Asp

245 250 255

Arg Leu Leu Ile Glu Lys Phe Ile Asp Asn Pro Arg His Ile Glu Ile

260 265 270

Gln Val Leu Gly Asp Lys His Gly Asn Ala Leu Trp Leu Asn Glu Arg

275 280 285

Glu Cys Ser Ile Gln Arg Arg Asn Gln Lys Val Val Glu Glu Ala Pro

290 295 300

Ser Ile Phe Leu Asp Ala Glu Thr Arg Arg Ala Met Gly Glu Gln Ala

305 310 315 320

Val Ala Leu Ala Arg Ala Val Lys Tyr Ser Ser Ala Gly Thr Val Glu

325 330 335

Phe Leu Val Asp Ser Lys Lys Asn Phe Tyr Phe Leu Glu Met Asn Thr

340 345 350

Arg Leu Gln Val Glu His Pro Val Thr Glu Cys Ile Thr Gly Leu Asp

355 360 365

Leu Val Gln Glu Met Ile Arg Val Ala Lys Gly Tyr Pro Leu Arg His

370 375 380

Lys Gln Ala Asp Ile Arg Ile Asn Gly Trp Ala Val Glu Cys Arg Val

385 390 395 400

Tyr Ala Glu Asp Pro Tyr Lys Ser Phe Gly Leu Pro Ser Ile Gly Arg

405 410 415

Leu Ser Gln Tyr Gln Glu Pro Leu His Leu Pro Gly Val Arg Val Asp

420 425 430

Ser Gly Ile Gln Pro Gly Ser Asp Ile Ser Ile Tyr Tyr Asp Pro Met

435 440 445

Ile Ser Lys Leu Ile Thr Tyr Gly Ser Asp Arg Thr Glu Ala Leu Lys

450 455 460

Arg Met Ala Asp Ala Leu Asp Asn Tyr Val Ile Arg Gly Val Thr His

465 470 475 480

Asn Ile Ala Leu Leu Arg Glu Val Ile Ile Asn Ser Arg Phe Val Lys

485 490 495

Gly Asp Ile Ser Thr Lys Phe Leu Ser Asp Val Tyr Pro Asp Gly Phe

500 505 510

Lys Gly His Met Leu Thr Lys Ser Glu Lys Asn Gln Leu Leu Ala Ile

515 520 525

Ala Ser Ser Leu Phe Val Ala Phe Gln Leu Arg Ala Gln His Phe Gln

530 535 540

Glu Asn Ser Arg Met Pro Val Ile Lys Pro Asp Ile Ala Asn Trp Glu

545 550 555 560

Leu Ser Val Lys Leu His Asp Lys Val His Thr Val Val Ala Ser Asn

565 570 575

Asn Gly Ser Val Phe Ser Val Glu Val Asp Gly Ser Lys Leu Asn Val

580 585 590

Thr Ser Thr Trp Asn Leu Ala Ser Pro Leu Leu Ser Val Ser Val Asp

595 600 605

Gly Thr Gln Arg Thr Val Gln Cys Leu Ser Arg Glu Ala Gly Gly Asn

610 615 620

Met Ser Ile Gln Phe Leu Gly Thr Val Tyr Lys Val Asn Ile Leu Thr

625 630 635 640

Arg Leu Ala Ala Glu Leu Asn Lys Phe Met Leu Glu Lys Val Thr Glu

645 650 655

Asp Thr Ser Ser Val Leu Arg Ser Pro Met Pro Gly Val Val Val Ala

660 665 670

Val Ser Val Lys Pro Gly Asp Ala Val Ala Glu Gly Gln Glu Ile Cys

675 680 685

Val Ile Glu Ala Met Lys Met Gln Asn Ser Met Thr Ala Gly Lys Thr

690 695 700

Gly Thr Val Lys Ser Val His Cys Gln Ala Gly Asp Thr Val Gly Glu

705 710 715 720

Gly Asp Leu Leu Val Glu Leu Glu

725

<210> 17

<211> 539

<212> PRT

<213> 智人(Homo sapiens)

<400> 17

Met Ala Ala Ala Leu Arg Val Ala Ala Val Gly Ala Arg Leu Ser Val

1 5 10 15

Leu Ala Ser Gly Leu Arg Ala Ala Val Arg Ser Leu Cys Ser Gln Ala

20 25 30

Thr Ser Val Asn Glu Arg Ile Glu Asn Lys Arg Arg Thr Ala Leu Leu

35 40 45

Gly Gly Gly Gln Arg Arg Ile Asp Ala Gln His Lys Arg Gly Lys Leu

50 55 60

Thr Ala Arg Glu Arg Ile Ser Leu Leu Leu Asp Pro Gly Ser Phe Val

65 70 75 80

Glu Ser Asp Met Phe Val Glu His Arg Cys Ala Asp Phe Gly Met Ala

85 90 95

Ala Asp Lys Asn Lys Phe Pro Gly Asp Ser Val Val Thr Gly Arg Gly

100 105 110

Arg Ile Asn Gly Arg Leu Val Tyr Val Phe Ser Gln Asp Phe Thr Val

115 120 125

Phe Gly Gly Ser Leu Ser Gly Ala His Ala Gln Lys Ile Cys Lys Ile

130 135 140

Met Asp Gln Ala Ile Thr Val Gly Ala Pro Val Ile Gly Leu Asn Asp

145 150 155 160

Ser Gly Gly Ala Arg Ile Gln Glu Gly Val Glu Ser Leu Ala Gly Tyr

165 170 175

Ala Asp Ile Phe Leu Arg Asn Val Thr Ala Ser Gly Val Ile Pro Gln

180 185 190

Ile Ser Leu Ile Met Gly Pro Cys Ala Gly Gly Ala Val Tyr Ser Pro

195 200 205

Ala Leu Thr Asp Phe Thr Phe Met Val Lys Asp Thr Ser Tyr Leu Phe

210 215 220

Ile Thr Gly Pro Asp Val Val Lys Ser Val Thr Asn Glu Asp Val Thr

225 230 235 240

Gln Glu Glu Leu Gly Gly Ala Lys Thr His Thr Thr Met Ser Gly Val

245 250 255

Ala His Arg Ala Phe Glu Asn Asp Val Asp Ala Leu Cys Asn Leu Arg

260 265 270

Asp Phe Phe Asn Tyr Leu Pro Leu Ser Ser Gln Asp Pro Ala Pro Val

275 280 285

Arg Glu Cys His Asp Pro Ser Asp Arg Leu Val Pro Glu Leu Asp Thr

290 295 300

Ile Val Pro Leu Glu Ser Thr Lys Ala Tyr Asn Met Val Asp Ile Ile

305 310 315 320

His Ser Val Val Asp Glu Arg Glu Phe Phe Glu Ile Met Pro Asn Tyr

325 330 335

Ala Lys Asn Ile Ile Val Gly Phe Ala Arg Met Asn Gly Arg Thr Val

340 345 350

Gly Ile Val Gly Asn Gln Pro Lys Val Ala Ser Gly Cys Leu Asp Ile

355 360 365

Asn Ser Ser Val Lys Gly Ala Arg Phe Val Arg Phe Cys Asp Ala Phe

370 375 380

Asn Ile Pro Leu Ile Thr Phe Val Asp Val Pro Gly Phe Leu Pro Gly

385 390 395 400

Thr Ala Gln Glu Tyr Gly Gly Ile Ile Arg His Gly Ala Lys Leu Leu

405 410 415

Tyr Ala Phe Ala Glu Ala Thr Val Pro Lys Val Thr Val Ile Thr Arg

420 425 430

Lys Ala Tyr Gly Gly Ala Tyr Asp Val Met Ser Ser Lys His Leu Cys

435 440 445

Gly Asp Thr Asn Tyr Ala Trp Pro Thr Ala Glu Ile Ala Val Met Gly

450 455 460

Ala Lys Gly Ala Val Glu Ile Ile Phe Lys Gly His Glu Asn Val Glu

465 470 475 480

Ala Ala Gln Ala Glu Tyr Ile Glu Lys Phe Ala Asn Pro Phe Pro Ala

485 490 495

Ala Val Arg Gly Phe Val Asp Asp Ile Ile Gln Pro Ser Ser Thr Arg

500 505 510

Ala Arg Ile Cys Cys Asp Leu Asp Val Leu Ala Ser Lys Lys Val Gln

515 520 525

Arg Pro Trp Arg Lys His Ala Asn Ile Pro Leu

530 535

<210> 18

<211> 278

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:CBA启动子

<400> 18

tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60

ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120

ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180

cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240

ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278

<210> 19

<211> 304

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:CMV增强子

<400> 19

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catg 304

<210> 20

<211> 95

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:SV40小T内含子

<400> 20

gctctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg 60

tttctctctt ttagattcca acctttggaa ctgat 95

<210> 21

<211> 315

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:rHBB内含子

<400> 21

gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 60

cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120

ggggggagcg gctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 180

ggcggggttc ggcttctggc gtgtgaccgg cggctcaaga gcctctgcta accatgttca 240

tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca 300

ttttggcaaa gaatt 315

<210> 22

<211> 215

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:BGH多聚腺苷酸化信号序列

<400> 22

gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 60

ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 120

cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 180

gaggattggg aagacaatag caggcatgct gggga 215

<210> 23

<211> 198

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:SV40晚期多聚腺苷酸化信号序列

<400> 23

gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60

aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120

tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180

gtgtgggagg ttttttag 198

<210> 24

<400> 24

000

<210> 25

<211> 728

<212> PRT

<213> 智人(Homo sapiens)

<400> 25

Met Ala Gly Phe Trp Val Gly Thr Ala Pro Leu Val Ala Ala Gly Arg

1 5 10 15

Arg Gly Arg Trp Pro Pro Gln Gln Leu Met Leu Ser Ala Ala Leu Arg

20 25 30

Thr Leu Lys His Val Leu Tyr Tyr Ser Arg Gln Cys Leu Met Val Ser

35 40 45

Arg Asn Leu Gly Ser Val Gly Tyr Asp Pro Asn Glu Lys Thr Phe Asp

50 55 60

Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Ala Cys Arg Val Ile Arg

65 70 75 80

Thr Cys Lys Lys Met Gly Ile Lys Thr Val Ala Ile His Ser Asp Val

85 90 95

Asp Ala Ser Ser Val His Val Lys Met Ala Asp Glu Ala Val Cys Val

100 105 110

Gly Pro Ala Pro Thr Ser Lys Ser Tyr Leu Asn Met Asp Ala Ile Met

115 120 125

Glu Ala Ile Lys Lys Thr Arg Ala Gln Ala Val His Pro Gly Tyr Gly

130 135 140

Phe Leu Ser Glu Asn Lys Glu Phe Ala Arg Cys Leu Ala Ala Glu Asp

145 150 155 160

Val Val Phe Ile Gly Pro Asp Thr His Ala Ile Gln Ala Met Gly Asp

165 170 175

Lys Ile Glu Ser Lys Leu Leu Ala Lys Lys Ala Glu Val Asn Thr Ile

180 185 190

Pro Gly Phe Asp Gly Val Val Lys Asp Ala Glu Glu Ala Val Arg Ile

195 200 205

Ala Arg Glu Ile Gly Tyr Pro Val Met Ile Lys Ala Ser Ala Gly Gly

210 215 220

Gly Gly Lys Gly Met Arg Ile Ala Trp Asp Asp Glu Glu Thr Arg Asp

225 230 235 240

Gly Phe Arg Leu Ser Ser Gln Glu Ala Ala Ser Ser Phe Gly Asp Asp

245 250 255

Arg Leu Leu Ile Glu Lys Phe Ile Asp Asn Pro Arg His Ile Glu Ile

260 265 270

Gln Val Leu Gly Asp Lys His Gly Asn Ala Leu Trp Leu Asn Glu Arg

275 280 285

Glu Cys Ser Ile Gln Arg Arg Asn Gln Lys Val Val Glu Glu Ala Pro

290 295 300

Ser Ile Phe Leu Asp Ala Glu Thr Arg Arg Ala Met Gly Glu Gln Ala

305 310 315 320

Val Ala Leu Ala Arg Ala Val Lys Tyr Ser Ser Ala Gly Thr Val Glu

325 330 335

Phe Leu Val Asp Ser Lys Lys Asn Phe Tyr Phe Leu Glu Met Asn Thr

340 345 350

Arg Leu Gln Val Glu His Pro Val Thr Glu Cys Ile Thr Gly Leu Asp

355 360 365

Leu Val Gln Glu Met Ile Arg Val Ala Lys Gly Tyr Pro Leu Arg His

370 375 380

Lys Gln Ala Asp Ile Arg Ile Asn Gly Trp Ala Val Glu Cys Arg Val

385 390 395 400

Tyr Ala Glu Asp Pro Tyr Lys Ser Phe Gly Leu Pro Ser Ile Gly Arg

405 410 415

Leu Ser Gln Tyr Gln Glu Pro Leu His Leu Pro Gly Val Arg Val Asp

420 425 430

Ser Gly Ile Gln Pro Gly Ser Asp Ile Ser Ile Tyr Tyr Asp Pro Met

435 440 445

Ile Ser Lys Leu Ile Thr Tyr Gly Ser Asp Arg Thr Glu Ala Leu Lys

450 455 460

Arg Met Ala Asp Ala Leu Asp Asn Tyr Val Ile Arg Gly Val Thr His

465 470 475 480

Asn Ile Ala Leu Leu Arg Glu Val Ile Ile Asn Ser Arg Phe Val Lys

485 490 495

Gly Asp Ile Ser Thr Lys Phe Leu Ser Asp Val Tyr Pro Asp Gly Phe

500 505 510

Lys Gly His Met Leu Thr Lys Ser Glu Lys Asn Gln Leu Leu Ala Ile

515 520 525

Ala Ser Ser Leu Phe Val Ala Phe Gln Leu Arg Ala Gln His Phe Gln

530 535 540

Glu Asn Ser Arg Met Pro Val Ile Lys Pro Asp Ile Ala Asn Trp Glu

545 550 555 560

Leu Ser Val Lys Leu His Asp Lys Val His Thr Val Val Ala Ser Asn

565 570 575

Asn Gly Ser Val Phe Ser Val Glu Val Asp Gly Ser Lys Leu Asn Val

580 585 590

Thr Ser Thr Trp Asn Leu Ala Ser Pro Leu Leu Ser Val Ser Val Asp

595 600 605

Gly Thr Gln Arg Thr Val Gln Cys Leu Ser Arg Glu Ala Gly Gly Asn

610 615 620

Met Ser Ile Gln Phe Leu Gly Thr Val Tyr Lys Val Asn Ile Leu Thr

625 630 635 640

Arg Leu Ala Ala Glu Leu Asn Lys Phe Met Leu Glu Lys Val Thr Glu

645 650 655

Asp Thr Ser Ser Val Leu Arg Ser Pro Met Pro Gly Val Val Val Ala

660 665 670

Val Ser Val Lys Pro Gly Asp Ala Val Ala Glu Gly Gln Glu Ile Cys

675 680 685

Val Ile Glu Ala Met Lys Met Gln Asn Ser Met Thr Ala Gly Lys Thr

690 695 700

Gly Thr Val Lys Ser Val His Cys Gln Ala Gly Asp Thr Val Gly Glu

705 710 715 720

Gly Asp Leu Leu Val Glu Leu Glu

725

<210> 26

<211> 702

<212> PRT

<213> 智人(Homo sapiens)

<400> 26

Met Ala Gly Phe Trp Val Gly Thr Ala Pro Leu Val Ala Ala Gly Arg

1 5 10 15

Arg Gly Arg Trp Pro Pro Gln Gln Leu Met Leu Ser Ala Ala Leu Arg

20 25 30

Thr Leu Lys Thr Phe Asp Lys Ile Leu Val Ala Asn Arg Gly Glu Ile

35 40 45

Ala Cys Arg Val Ile Arg Thr Cys Lys Lys Met Gly Ile Lys Thr Val

50 55 60

Ala Ile His Ser Asp Val Asp Ala Ser Ser Val His Val Lys Met Ala

65 70 75 80

Asp Glu Ala Val Cys Val Gly Pro Ala Pro Thr Ser Lys Ser Tyr Leu

85 90 95

Asn Met Asp Ala Ile Met Glu Ala Ile Lys Lys Thr Arg Ala Gln Ala

100 105 110

Val His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Lys Glu Phe Ala Arg

115 120 125

Cys Leu Ala Ala Glu Asp Val Val Phe Ile Gly Pro Asp Thr His Ala

130 135 140

Ile Gln Ala Met Gly Asp Lys Ile Glu Ser Lys Leu Leu Ala Lys Lys

145 150 155 160

Ala Glu Val Asn Thr Ile Pro Gly Phe Asp Gly Val Val Lys Asp Ala

165 170 175

Glu Glu Ala Val Arg Ile Ala Arg Glu Ile Gly Tyr Pro Val Met Ile

180 185 190

Lys Ala Ser Ala Gly Gly Gly Gly Lys Gly Met Arg Ile Ala Trp Asp

195 200 205

Asp Glu Glu Thr Arg Asp Gly Phe Arg Leu Ser Ser Gln Glu Ala Ala

210 215 220

Ser Ser Phe Gly Asp Asp Arg Leu Leu Ile Glu Lys Phe Ile Asp Asn

225 230 235 240

Pro Arg His Ile Glu Ile Gln Val Leu Gly Asp Lys His Gly Asn Ala

245 250 255

Leu Trp Leu Asn Glu Arg Glu Cys Ser Ile Gln Arg Arg Asn Gln Lys

260 265 270

Val Val Glu Glu Ala Pro Ser Ile Phe Leu Asp Ala Glu Thr Arg Arg

275 280 285

Ala Met Gly Glu Gln Ala Val Ala Leu Ala Arg Ala Val Lys Tyr Ser

290 295 300

Ser Ala Gly Thr Val Glu Phe Leu Val Asp Ser Lys Lys Asn Phe Tyr

305 310 315 320

Phe Leu Glu Met Asn Thr Arg Leu Gln Val Glu His Pro Val Thr Glu

325 330 335

Cys Ile Thr Gly Leu Asp Leu Val Gln Glu Met Ile Arg Val Ala Lys

340 345 350

Gly Tyr Pro Leu Arg His Lys Gln Ala Asp Ile Arg Ile Asn Gly Trp

355 360 365

Ala Val Glu Cys Arg Val Tyr Ala Glu Asp Pro Tyr Lys Ser Phe Gly

370 375 380

Leu Pro Ser Ile Gly Arg Leu Ser Gln Tyr Gln Glu Pro Leu His Leu

385 390 395 400

Pro Gly Val Arg Val Asp Ser Gly Ile Gln Pro Gly Ser Asp Ile Ser

405 410 415

Ile Tyr Tyr Asp Pro Met Ile Ser Lys Leu Ile Thr Tyr Gly Ser Asp

420 425 430

Arg Thr Glu Ala Leu Lys Arg Met Ala Asp Ala Leu Asp Asn Tyr Val

435 440 445

Ile Arg Gly Val Thr His Asn Ile Ala Leu Leu Arg Glu Val Ile Ile

450 455 460

Asn Ser Arg Phe Val Lys Gly Asp Ile Ser Thr Lys Phe Leu Ser Asp

465 470 475 480

Val Tyr Pro Asp Gly Phe Lys Gly His Met Leu Thr Lys Ser Glu Lys

485 490 495

Asn Gln Leu Leu Ala Ile Ala Ser Ser Leu Phe Val Ala Phe Gln Leu

500 505 510

Arg Ala Gln His Phe Gln Glu Asn Ser Arg Met Pro Val Ile Lys Pro

515 520 525

Asp Ile Ala Asn Trp Glu Leu Ser Val Lys Leu His Asp Lys Val His

530 535 540

Thr Val Val Ala Ser Asn Asn Gly Ser Val Phe Ser Val Glu Val Asp

545 550 555 560

Gly Ser Lys Leu Asn Val Thr Ser Thr Trp Asn Leu Ala Ser Pro Leu

565 570 575

Leu Ser Val Ser Val Asp Gly Thr Gln Arg Thr Val Gln Cys Leu Ser

580 585 590

Arg Glu Ala Gly Gly Asn Met Ser Ile Gln Phe Leu Gly Thr Val Tyr

595 600 605

Lys Val Asn Ile Leu Thr Arg Leu Ala Ala Glu Leu Asn Lys Phe Met

610 615 620

Leu Glu Lys Val Thr Glu Asp Thr Ser Ser Val Leu Arg Ser Pro Met

625 630 635 640

Pro Gly Val Val Val Ala Val Ser Val Lys Pro Gly Asp Ala Val Ala

645 650 655

Glu Gly Gln Glu Ile Cys Val Ile Glu Ala Met Lys Met Gln Asn Ser

660 665 670

Met Thr Ala Gly Lys Thr Gly Thr Val Lys Ser Val His Cys Gln Ala

675 680 685

Gly Asp Thr Val Gly Glu Gly Asp Leu Leu Val Glu Leu Glu

690 695 700

<210> 27

<211> 681

<212> PRT

<213> 智人(Homo sapiens)

<400> 27

Met Ala Gly Phe Trp Val Gly Thr Ala Pro Leu Val Ala Ala Gly Arg

1 5 10 15

Arg Gly Arg Trp Pro Pro Gln Gln Leu Met Leu Ser Ala Ala Leu Arg

20 25 30

Thr Leu Lys His Val Leu Tyr Tyr Ser Arg Gln Cys Leu Met Val Ser

35 40 45

Arg Asn Leu Gly Ser Val Gly Tyr Asp Pro Asn Glu Lys Thr Phe Asp

50 55 60

Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Ala Cys Arg Val Ile Arg

65 70 75 80

Thr Cys Lys Lys Met Gly Ile Lys Thr Val Ala Ile His Ser Asp Val

85 90 95

Asp Ala Ser Ser Val His Val Lys Met Ala Asp Glu Ala Val Cys Val

100 105 110

Gly Pro Ala Pro Thr Ser Lys Ser Tyr Leu Asn Met Asp Ala Ile Met

115 120 125

Glu Ala Ile Lys Lys Thr Arg Ala Gln Ala Val His Pro Gly Tyr Gly

130 135 140

Phe Leu Ser Glu Asn Lys Glu Phe Ala Arg Cys Leu Ala Ala Glu Asp

145 150 155 160

Val Val Phe Ile Gly Pro Asp Thr His Ala Ile Gln Ala Met Gly Asp

165 170 175

Lys Ile Glu Ser Lys Leu Leu Ala Lys Lys Ala Glu Val Asn Thr Ile

180 185 190

Pro Gly Phe Asp Gly Val Val Lys Asp Ala Glu Glu Ala Val Arg Ile

195 200 205

Ala Arg Glu Ile Gly Tyr Pro Val Met Ile Lys Ala Ser Ala Gly Gly

210 215 220

Gly Gly Lys Gly Met Arg Ile Ala Trp Asp Asp Glu Glu Thr Arg Asp

225 230 235 240

Gly Phe Arg Leu Ser Ser Gln Glu Ala Ala Ser Ser Phe Gly Asp Asp

245 250 255

Arg Leu Leu Ile Glu Lys Phe Ile Asp Asn Pro Arg His Ile Glu Ile

260 265 270

Gln Val Leu Gly Asp Lys His Gly Asn Ala Leu Trp Leu Asn Glu Arg

275 280 285

Glu Cys Ser Ile Gln Arg Arg Asn Gln Lys Val Val Glu Glu Ala Pro

290 295 300

Ser Ile Phe Leu Asp Ala Glu Thr Arg Arg Ala Met Gly Glu Gln Ala

305 310 315 320

Val Ala Leu Ala Arg Ala Val Lys Tyr Ser Ser Ala Gly Thr Val Glu

325 330 335

Phe Leu Val Asp Ser Lys Lys Asn Phe Tyr Phe Leu Glu Met Asn Thr

340 345 350

Arg Leu Gln Val Glu His Pro Val Thr Glu Cys Ile Thr Gly Leu Asp

355 360 365

Leu Val Gln Glu Met Ile Arg Val Ala Lys Gly Tyr Pro Leu Arg His

370 375 380

Lys Gln Ala Asp Ile Arg Ile Asn Gly Trp Ala Val Glu Cys Arg Val

385 390 395 400

Tyr Ala Glu Asp Pro Tyr Lys Ser Phe Gly Leu Pro Ser Ile Gly Arg

405 410 415

Leu Ser Gln Tyr Gln Glu Pro Leu His Leu Pro Gly Val Arg Val Asp

420 425 430

Ser Gly Ile Gln Pro Gly Ser Asp Ile Ser Ile Tyr Tyr Asp Pro Met

435 440 445

Ile Ser Lys Leu Ile Thr Tyr Gly Ser Asp Arg Thr Glu Ala Leu Lys

450 455 460

Arg Met Ala Asp Ala Leu Asp Asn Tyr Val Ile Arg Gly Val Thr His

465 470 475 480

Asn Ile Ala Leu Leu Arg Glu Val Ile Ile Asn Ser Arg Phe Val Lys

485 490 495

Gly Asp Ile Ser Thr Lys Phe Leu Ser Asp Val Tyr Pro Asp Gly Phe

500 505 510

Lys Gly His Met Leu Thr Lys Ser Glu Lys Asn Gln Leu Leu Ala Ile

515 520 525

Ala Ser Ser Leu Phe Val Ala Phe Gln Leu Arg Ala Gln His Phe Gln

530 535 540

Glu Asn Ser Arg Met Pro Val Ile Lys Pro Asp Ile Ala Asn Trp Glu

545 550 555 560

Leu Ser Val Lys Leu His Asp Lys Val His Thr Val Val Ala Ser Asn

565 570 575

Asn Gly Ser Val Phe Ser Val Glu Val Asp Gly Ser Lys Leu Asn Val

580 585 590

Thr Ser Thr Trp Asn Leu Ala Ser Pro Leu Leu Ser Val Ser Val Asp

595 600 605

Gly Thr Gln Arg Thr Val Gln Cys Leu Ser Arg Glu Ala Gly Gly Asn

610 615 620

Met Ser Ile Gln Phe Leu Gly Thr Val Val Ala Glu Gly Gln Glu Ile

625 630 635 640

Cys Val Ile Glu Ala Met Lys Met Gln Asn Ser Met Thr Ala Gly Lys

645 650 655

Thr Gly Thr Val Lys Ser Val His Cys Gln Ala Gly Asp Thr Val Gly

660 665 670

Glu Gly Asp Leu Leu Val Glu Leu Glu

675 680

<210> 28

<211> 539

<212> PRT

<213> 智人(Homo sapiens)

<400> 28

Met Ala Ala Ala Leu Arg Val Ala Ala Val Gly Ala Arg Leu Ser Val

1 5 10 15

Leu Ala Ser Gly Leu Arg Ala Ala Val Arg Ser Leu Cys Ser Gln Ala

20 25 30

Thr Ser Val Asn Glu Arg Ile Glu Asn Lys Arg Arg Thr Ala Leu Leu

35 40 45

Gly Gly Gly Gln Arg Arg Ile Asp Ala Gln His Lys Arg Gly Lys Leu

50 55 60

Thr Ala Arg Glu Arg Ile Ser Leu Leu Leu Asp Pro Gly Ser Phe Val

65 70 75 80

Glu Ser Asp Met Phe Val Glu His Arg Cys Ala Asp Phe Gly Met Ala

85 90 95

Ala Asp Lys Asn Lys Phe Pro Gly Asp Ser Val Val Thr Gly Arg Gly

100 105 110

Arg Ile Asn Gly Arg Leu Val Tyr Val Phe Ser Gln Asp Phe Thr Val

115 120 125

Phe Gly Gly Ser Leu Ser Gly Ala His Ala Gln Lys Ile Cys Lys Ile

130 135 140

Met Asp Gln Ala Ile Thr Val Gly Ala Pro Val Ile Gly Leu Asn Asp

145 150 155 160

Ser Gly Gly Ala Arg Ile Gln Glu Gly Val Glu Ser Leu Ala Gly Tyr

165 170 175

Ala Asp Ile Phe Leu Arg Asn Val Thr Ala Ser Gly Val Ile Pro Gln

180 185 190

Ile Ser Leu Ile Met Gly Pro Cys Ala Gly Gly Ala Val Tyr Ser Pro

195 200 205

Ala Leu Thr Asp Phe Thr Phe Met Val Lys Asp Thr Ser Tyr Leu Phe

210 215 220

Ile Thr Gly Pro Asp Val Val Lys Ser Val Thr Asn Glu Asp Val Thr

225 230 235 240

Gln Glu Glu Leu Gly Gly Ala Lys Thr His Thr Thr Met Ser Gly Val

245 250 255

Ala His Arg Ala Phe Glu Asn Asp Val Asp Ala Leu Cys Asn Leu Arg

260 265 270

Asp Phe Phe Asn Tyr Leu Pro Leu Ser Ser Gln Asp Pro Ala Pro Val

275 280 285

Arg Glu Cys His Asp Pro Ser Asp Arg Leu Val Pro Glu Leu Asp Thr

290 295 300

Ile Val Pro Leu Glu Ser Thr Lys Ala Tyr Asn Met Val Asp Ile Ile

305 310 315 320

His Ser Val Val Asp Glu Arg Glu Phe Phe Glu Ile Met Pro Asn Tyr

325 330 335

Ala Lys Asn Ile Ile Val Gly Phe Ala Arg Met Asn Gly Arg Thr Val

340 345 350

Gly Ile Val Gly Asn Gln Pro Lys Val Ala Ser Gly Cys Leu Asp Ile

355 360 365

Asn Ser Ser Val Lys Gly Ala Arg Phe Val Arg Phe Cys Asp Ala Phe

370 375 380

Asn Ile Pro Leu Ile Thr Phe Val Asp Val Pro Gly Phe Leu Pro Gly

385 390 395 400

Thr Ala Gln Glu Tyr Gly Gly Ile Ile Arg His Gly Ala Lys Leu Leu

405 410 415

Tyr Ala Phe Ala Glu Ala Thr Val Pro Lys Val Thr Val Ile Thr Arg

420 425 430

Lys Ala Tyr Gly Gly Ala Tyr Asp Val Met Ser Ser Lys His Leu Cys

435 440 445

Gly Asp Thr Asn Tyr Ala Trp Pro Thr Ala Glu Ile Ala Val Met Gly

450 455 460

Ala Lys Gly Ala Val Glu Ile Ile Phe Lys Gly His Glu Asn Val Glu

465 470 475 480

Ala Ala Gln Ala Glu Tyr Ile Glu Lys Phe Ala Asn Pro Phe Pro Ala

485 490 495

Ala Val Arg Gly Phe Val Asp Asp Ile Ile Gln Pro Ser Ser Thr Arg

500 505 510

Ala Arg Ile Cys Cys Asp Leu Asp Val Leu Ala Ser Lys Lys Val Gln

515 520 525

Arg Pro Trp Arg Lys His Ala Asn Ile Pro Leu

530 535

<210> 29

<211> 559

<212> PRT

<213> 智人(Homo sapiens)

<400> 29

Met Ala Ala Ala Leu Arg Val Ala Ala Val Gly Ala Arg Leu Ser Val

1 5 10 15

Leu Ala Ser Gly Leu Arg Ala Ala Val Arg Ser Leu Cys Ser Gln Ala

20 25 30

Thr Ser Val Asn Glu Arg Ile Glu Asn Lys Arg Arg Thr Ala Leu Leu

35 40 45

Gly Gly Gly Gln Arg Arg Ile Asp Ala Gln His Lys Arg Gly Lys Leu

50 55 60

Thr Ala Arg Glu Arg Ile Ser Leu Leu Leu Asp Pro Gly Ser Phe Val

65 70 75 80

Glu Ser Asp Met Phe Val Glu His Arg Cys Ala Asp Phe Gly Met Ala

85 90 95

Ala Asp Lys Asn Lys Phe Pro Gly Asp Ser Val Val Thr Gly Arg Gly

100 105 110

Arg Ile Asn Gly Arg Leu Val Tyr Val Phe Ser Gln Gln Ile Ile Gly

115 120 125

Trp Ala Gln Trp Leu Pro Leu Val Ile Ser Ala Leu Trp Glu Ala Glu

130 135 140

Asp Phe Thr Val Phe Gly Gly Ser Leu Ser Gly Ala His Ala Gln Lys

145 150 155 160

Ile Cys Lys Ile Met Asp Gln Ala Ile Thr Val Gly Ala Pro Val Ile

165 170 175

Gly Leu Asn Asp Ser Gly Gly Ala Arg Ile Gln Glu Gly Val Glu Ser

180 185 190

Leu Ala Gly Tyr Ala Asp Ile Phe Leu Arg Asn Val Thr Ala Ser Gly

195 200 205

Val Ile Pro Gln Ile Ser Leu Ile Met Gly Pro Cys Ala Gly Gly Ala

210 215 220

Val Tyr Ser Pro Ala Leu Thr Asp Phe Thr Phe Met Val Lys Asp Thr

225 230 235 240

Ser Tyr Leu Phe Ile Thr Gly Pro Asp Val Val Lys Ser Val Thr Asn

245 250 255

Glu Asp Val Thr Gln Glu Glu Leu Gly Gly Ala Lys Thr His Thr Thr

260 265 270

Met Ser Gly Val Ala His Arg Ala Phe Glu Asn Asp Val Asp Ala Leu

275 280 285

Cys Asn Leu Arg Asp Phe Phe Asn Tyr Leu Pro Leu Ser Ser Gln Asp

290 295 300

Pro Ala Pro Val Arg Glu Cys His Asp Pro Ser Asp Arg Leu Val Pro

305 310 315 320

Glu Leu Asp Thr Ile Val Pro Leu Glu Ser Thr Lys Ala Tyr Asn Met

325 330 335

Val Asp Ile Ile His Ser Val Val Asp Glu Arg Glu Phe Phe Glu Ile

340 345 350

Met Pro Asn Tyr Ala Lys Asn Ile Ile Val Gly Phe Ala Arg Met Asn

355 360 365

Gly Arg Thr Val Gly Ile Val Gly Asn Gln Pro Lys Val Ala Ser Gly

370 375 380

Cys Leu Asp Ile Asn Ser Ser Val Lys Gly Ala Arg Phe Val Arg Phe

385 390 395 400

Cys Asp Ala Phe Asn Ile Pro Leu Ile Thr Phe Val Asp Val Pro Gly

405 410 415

Phe Leu Pro Gly Thr Ala Gln Glu Tyr Gly Gly Ile Ile Arg His Gly

420 425 430

Ala Lys Leu Leu Tyr Ala Phe Ala Glu Ala Thr Val Pro Lys Val Thr

435 440 445

Val Ile Thr Arg Lys Ala Tyr Gly Gly Ala Tyr Asp Val Met Ser Ser

450 455 460

Lys His Leu Cys Gly Asp Thr Asn Tyr Ala Trp Pro Thr Ala Glu Ile

465 470 475 480

Ala Val Met Gly Ala Lys Gly Ala Val Glu Ile Ile Phe Lys Gly His

485 490 495

Glu Asn Val Glu Ala Ala Gln Ala Glu Tyr Ile Glu Lys Phe Ala Asn

500 505 510

Pro Phe Pro Ala Ala Val Arg Gly Phe Val Asp Asp Ile Ile Gln Pro

515 520 525

Ser Ser Thr Arg Ala Arg Ile Cys Cys Asp Leu Asp Val Leu Ala Ser

530 535 540

Lys Lys Val Gln Arg Pro Trp Arg Lys His Ala Asn Ile Pro Leu

545 550 555

<210> 30

<211> 1412

<212> DNA

<213> 智人(Homo sapiens)

<400> 30

tctcaaggtg actctgcagg agatgcaaag tagttaagag gagaaccccc aatactgatg 60

tgtttatagg tgaggtggtc tgatgtctta gatttgcttt aaaatattcc tgcacaaaat 120

aaaaagggga atagatgaaa caagattgac aaaatgttga ttcattgacg cggtgtaatg 180

ggtatctggg tgatcatagt acaattttat ctcttttgta tatattttaa aatttccata 240

atatagcaaa acatgagccc agtccctcaa ggcagccaga tttgggttca aaccctagtt 300

tgacctttta ctcgctgagt gactttaccc tgctacagct tcagtttctc caaatggaaa 360

taatatatac tccattaagg ttcttgtaaa ctctcaagta agagggaatc tgaggctcta 420

gcacacggcc cggcccttaa tagttgtact aatttttatt ttatttttcg aaacggagtt 480

tgctctgtca cccaggctgg agtgtagtgg catgatccgg ctcactgcaa cctccacctc 540

cagggttcaa gcaattctcc tgcctcagcc tcctcccgag taactgggat tacaggagtg 600

cgccaccacg cccagctaat ttttgtattt tttagtagag acggggtttc ggcatgttgt 660

ccaggctggt ctccaactcc tgacctcagg ttatcctccc gcctcggcct cccagagtgc 720

tgggattaca ggcgtgagcc actgcgcctg gccagtagtt gtactaacaa gggtttctgc 780

ttgcgagcaa caaagactga ctctagttgt ggctaatttc tttcacacac acatattaag 840

tgccagaggt aggacttgag ctcggatctc tgatttccag acctagaact ttttatgtgt 900

tattacagtc gttaaaaacc ttacctggat ttgtgctttg caatttacgc tttcgaacat 960

gcaggaatgt agtttgggca tttgtctgga acttcggatt ctcgggactc cagggtggcc 1020

aaggcgcgga ggtgactcaa tgacattgac cggcctggat gcacgtgggt tgctgagccg 1080

atgctgggaa ggtacggggt ttgcccggtg caggccgccg gaactcacgc acgcccctgt 1140

ctctctcact cctggggtcg gctctggccg gtggcctcca gctcagctag cggccggacg 1200

cgcagcccgc cgactagccc tccaggtcct agcgcgactc ccggatcccg gatccggcgg 1260

atctggccga ccactcaccc tcccctttcc gcaagttagg gggcggggca tcgggtttct 1320

ggctcgtgat ttgccggagc tcctgcgctc cccttctcca ccccctccgg ctgtgtgaga 1380

ggtcagcaga ggggcggtct gcggggacaa ca 1412

<210> 31

<211> 275

<212> DNA

<213> 智人(Homo sapiens)

<400> 31

aggatttata acctttcagt catcacccaa tttaattagc catttgcatg atgctttcac 60

acacaattga ttcaagcatt atacaggaac acccctgtgc agctacgttt acgtcgtcat 120

ttattccaca gagtcaagac caatattctg ccaaaaaatc accaatggaa attttcattg 180

atataaatac ttgtacatat gatttgtact tctgctgtga gattccctag tgtcaaaatt 240

aaatcaataa aactgagcat ttgtctaaat attag 275

<210> 32

<211> 1378

<212> DNA

<213> 智人(Homo sapiens)

<400> 32

gctggcccca gccccagagt ttctgattta aaggtctgga gtaagttctg agaattcgag 60

cttgcatttc caactcactc ccaggtgata ctgaagttgc tggattgaca agattccctc 120

cttgatcaaa cattggtcag gctcttctga gctctctctt tgactaggcc tgagtgtggg 180

ctcccatgtc attccttgtg gaattccatt ttagcaagaa acttgccaag tcagtttagc 240

cagaatcctc cattcttgat atctgattac tctccatatc tggttttgac ccataccgcc 300

accatccccc aggtgatgtt cagttaccct gacctgcctt gggcaggaat cctgttaggt 360

caatttagcc agattccccg ccaatgtttc ctcttagtaa ttttccatcc actgacttcc 420

acacactgcc ccttagctat aaattaccac tttgctatat tcagcccaat cgctctgact 480

tatggcaaaa ctctatccct acctctgtca gattgggcct gaataaagtt tgccttacca 540

ttcttaaaca tgaataatta agtgtcatga atagtttttt ctttaatggg atccatactt 600

tgagaactac tgattagagg ttaagggtcc tgtgctcatt atctggcaca tattaatgat 660

aggtctctga gtttgaatcc tggccaacca cattgtcagt cttggctttt tttttttttt 720

ttttttgaga cagggttttg cccaggctgg agtgcagtga tgcaatcacg gctcactgca 780

gcctcgactt cctgggccaa gccatcctgc cgccttagcc tcccgagtag ctggggtcac 840

aggtgcaagc cgccatgccc agctaatttt taattttttt gtagaggtgg ggtcttacta 900

tattgctcag gctggtcttg ggctcctggg ctcacctacc tcggcctcag tcttgcctct 960

tgatcaaatc actcatctct ctgtgcttga tttacctcat ctgtgaaatc cagatagtaa 1020

gctagtgcat ggtaagtgca aaaagcaaca cctggcacaa tgcttaataa atgttggtta 1080

aatcttataa tcattttctg taggaagtgg gacgacaaag ttaagggtct aggtggtcag 1140

agaagagcaa ggactatgtc ccttttttgt gcagccaggc aggccctgta ctttttctct 1200

gcgcgaccct cctcgggcag caccgggtct cgaactctca cgccttactc ccaagcaggt 1260

tctgtagtcc agcccccgcg gctccctaca gccagccgat gctgcgcaag cgccgtaccc 1320

acgctttagc acatgcgtac tcaggtgcgc cggtagggga cgcgccggca cagcaaaa 1378

<210> 33

<211> 159

<212> DNA

<213> 智人(Homo sapiens)

<400> 33

acaaatcaaa ggaaaagaaa ccaagaactg aattactgtc tgcccattca catcccattc 60

ctgccttttg caatcatgaa acctgggaat ccaaatagtt ggataactta gaataactaa 120

gtttattaaa ttctagaaag atctcttttg tgccttact 159

<210> 34

<211> 793

<212> DNA

<213> 智人(Homo sapiens)

<400> 34

tttttgtatt ttttagtaga gacggggttt cggcatgttg tccaggctgg tctccaactc 60

ctgacctcag gttatcctcc cgcctcggcc tcccagagtg ctgggattac aggcgtgagc 120

cactgcgcct ggccagtagt tgtactaaca agggtttctg cttgcgagca acaaagactg 180

actctagttg tggctaattt ctttcacaca cacatattaa gtgccagagg taggacttga 240

gctcggatct ctgatttcca gacctagaac tttttatgtg ttattacagt cgttaaaaac 300

cttacctgga tttgtgcttt gcaatttacg ctttcgaaca tgcaggaatg tagtttgggc 360

atttgtctgg aacttcggat tctcgggact ccagggtggc caaggcgcgg aggtgactca 420

atgacattga ccggcctgga tgcacgtggg ttgctgagcc gatgctggga aggtacgggg 480

tttgcccggt gcaggccgcc ggaactcacg cacgcccctg tctctctcac tcctggggtc 540

ggctctggcc ggtggcctcc agctcagcta gcggccggac gcgcagcccg ccgactagcc 600

ctccaggtcc tagcgcgact cccggatccc ggatccggcg gatctggccg accactcacc 660

ctcccctttc cgcaagttag ggggcggggc atcgggtttc tggctcgtga tttgccggag 720

ctcctgcgct ccccttctcc accccctccg gctgtgtgag aggtcagcag aggggcggtc 780

tgcggggaca aca 793

<210> 35

<211> 168

<212> DNA

<213> 智人(Homo sapiens)

<400> 35

aggatttata acctttcagt catcacccaa tttaattagc catttgcatg atgctttcac 60

acacaattga ttcaagcatt atacaggaac acccctgtgc agctacgttt acgtcgtcat 120

ttattccaca gagtcaagac caatattctg ccaaaaaatc accaatgg 168

<210> 36

<211> 468

<212> DNA

<213> 智人(Homo sapiens)

<400> 36

gctggtcttg ggctcctggg ctcacctacc tcggcctcag tcttgcctct tgatcaaatc 60

actcatctct ctgtgcttga tttacctcat ctgtgaaatc cagatagtaa gctagtgcat 120

ggtaagtgca aaaagcaaca cctggcacaa tgcttaataa atgttggtta aatcttataa 180

tcattttctg taggaagtgg gacgacaaag ttaagggtct aggtggtcag agaagagcaa 240

ggactatgtc ccttttttgt gcagccaggc aggccctgta ctttttctct gcgcgaccct 300

cctcgggcag caccgggtct cgaactctca cgccttactc ccaagcaggt tctgtagtcc 360

agcccccgcg gctccctaca gccagccgat gctgcgcaag cgccgtaccc acgctttagc 420

acatgcgtac tcaggtgcgc cggtagggga cgcgccggca cagcaaaa 468

<210> 37

<211> 102

<212> DNA

<213> 智人(Homo sapiens)

<400> 37

acaaatcaaa ggaaaagaaa ccaagaactg aattactgtc tgcccattca catcccattc 60

ctgccttttg caatcatgaa acctgggaat ccaaatagtt gg 102

<210> 38

<211> 3360

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:带有本源PCCA cDNA序列的rAAV(DTC346)

<400> 38

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctcgtta cataacttac ggtaaatggc ccgcctggct 180

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 240

caatagggac tttccattga cgtcaatggg tggactattt acggtaaact gcccacttgg 300

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 360

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 420

tctacgtatt agtcatcgct attaccatgc gtcgaggtga gccccacgtt ctgcttcact 480

ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 540

tatgcagcga tgggggcggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 600

ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 660

aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 720

gcgggcggct ctaaggtaaa tataaaattt ttaagtgtat aatgtgttaa actactgatt 780

ctaattgttt ctctctttta gattccaacc tttggaactg atgccgccac catggcgggg 840

ttctgggtcg ggacagcacc gctggtcgct gccggacggc gtgggcggtg gccgccgcag 900

cagctgatgc tgagcgcggc gctgcggacc ctgaagcatg ttctgtacta ttcaagacag 960

tgcttaatgg tgtcccgtaa tcttggttca gtgggatatg atcctaatga aaaaactttt 1020

gataaaattc ttgttgctaa tagaggagaa attgcatgtc gggttattag aacttgcaag 1080

aagatgggca ttaagacagt tgccatccac agtgatgttg atgctagttc tgttcatgtg 1140

aaaatggcgg atgaggctgt ctgtgttggc ccagctccca ccagtaaaag ctacctcaac 1200

atggatgcca tcatggaagc cattaagaaa accagggccc aagctgtaca tccaggttat 1260

ggattccttt cagaaaacaa agaatttgcc agatgtttgg cagcagaaga tgtcgttttc 1320

attggacctg acacacatgc tattcaagcc atgggcgaca agattgaaag caaattatta 1380

gctaagaaag cagaggttaa tacaatccct ggctttgatg gagtagtcaa ggatgcagaa 1440

gaagctgtca gaattgcaag ggaaattggc taccctgtca tgatcaaggc ctcagcaggt 1500

ggtggtggga aaggcatgcg cattgcttgg gatgatgaag agaccaggga tggttttaga 1560

ttgtcatctc aagaagctgc ttctagtttt ggcgatgata gactactaat agaaaaattt 1620

attgataatc ctcgtcatat agaaatccag gttctaggtg ataaacatgg gaatgcttta 1680

tggcttaatg aaagagagtg ctcaattcag agaagaaatc agaaggtggt ggaggaagca 1740

ccaagcattt ttttggatgc ggagactcga agagcgatgg gagaacaagc tgtagctctt 1800

gccagagcag taaaatattc ctctgctggg accgtggagt tccttgtgga ctctaagaag 1860

aatttttatt tcttggaaat gaatacaaga ctccaggttg agcatcctgt cacagaatgc 1920

attactggcc tggacctagt ccaggaaatg atccgtgttg ctaagggcta ccctctcagg 1980

cacaaacaag ctgatattcg catcaacggc tgggcagttg aatgtcgggt ttatgctgag 2040

gacccctaca agtcttttgg tttaccatct attgggagat tgtctcagta ccaagaaccg 2100

ttacatctac ctggtgtccg agtggacagt ggcatccaac caggaagtga tattagcatt 2160

tattatgatc ctatgatttc aaaactaatc acatatggct ctgatagaac tgaggcactg 2220

aagagaatgg cagatgcact ggataactat gttattcgag gtgttacaca taatattgca 2280

ttacttcgag aggtgataat caactcacgc tttgtaaaag gagacatcag cactaaattt 2340

ctctccgatg tgtatcctga tggcttcaaa ggacacatgc taaccaagag tgagaagaac 2400

cagttattgg caatagcatc atcattgttt gtggcattcc agttaagagc acaacatttt 2460

caagaaaatt caagaatgcc tgttattaaa ccagacatag ccaactggga gctctcagta 2520

aaattgcatg ataaagttca taccgtagta gcatcaaaca atgggtcagt gttctcggtg 2580

gaagttgatg ggtcgaaact aaatgtgacc agcacgtgga acctggcttc gcccttattg 2640

tctgtcagcg ttgatggcac tcagaggact gtccagtgtc tttctcgaga agcaggtgga 2700

aacatgagca ttcagtttct tggtacagtg tacaaggtga atatcttaac cagacttgcc 2760

gcagaattga acaaatttat gctggaaaaa gtgactgagg acacaagcag tgttctgcgt 2820

tccccgatgc ccggagtggt ggtggccgtc tctgtcaagc ctggagacgc ggtagcagaa 2880

ggtcaagaaa tttgtgtgat tgaagccatg aaaatgcaga atagtatgac agctgggaaa 2940

actggcacgg tgaaatctgt gcactgtcaa gctggagaca cagttggaga aggggatctg 3000

ctcgtggagc tggaatgaat ccagacatga taagatacat tgatgagttt ggacaaacca 3060

caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat 3120

ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt 3180

ttcaggttca gggggaggtg tgggaggttt tttagaggaa cccctagtga tggagttggc 3240

cactccctct ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 3300

ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 3360

<210> 39

<211> 2806

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:带有本源PCCB cDNA序列的rAAV

<400> 39

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctcgtta cataacttac ggtaaatggc ccgcctggct 180

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 240

caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 300

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 360

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 420

tctacgtatt agtcatcgct attaccatgt cgaggtgagc cccacgttct gcttcactct 480

ccccatctcc cccccctccc cacccccaat tttgtattta tttatttttt aattattttg 540

tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 600

ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 660

aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 720

gcgggcggct ctaaggtaaa tataaaattt ttaagtgtat aatgtgttaa actactgatt 780

ctaattgttt ctctctttta gattccaacc tttggaactg atctcgaggc cgccaccatg 840

gcggcggcat tacgggtggc ggcggtcggg gcaaggctca gcgttctggc gagcggtctc 900

cgcgccgcgg tccgcagcct ttgcagccag gccacctctg ttaacgaacg catcgaaaac 960

aagcgccgga ccgcgctgct gggagggggc caacgccgta ttgacgcgca gcacaagcga 1020

ggaaagctaa cagccaggga gaggatcagt ctcttgctgg accctggcag ctttgttgag 1080

agcgacatgt ttgtggaaca cagatgtgca gattttggaa tggctgctga taagaataag 1140

tttcctggag acagcgtggt cactggacga ggccgaatca atggaagatt ggtttatgtc 1200

ttcagtcagg attttacagt ttttggaggc agtctgtcag gagcacatgc ccaaaagatc 1260

tgcaaaatca tggaccaggc cataacggtg ggggctccag tgattgggct gaatgactct 1320

gggggagcac ggatccaaga aggagtggag tctttggctg gctatgcaga catctttctg 1380

aggaatgtta cggcatccgg agtcatccct cagatttctc tgatcatggg cccatgtgct 1440

ggtggggccg tctactcccc agccctaaca gacttcacgt tcatggtaaa ggacacctcc 1500

tacctgttca tcactggccc tgatgttgtg aagtctgtca ccaatgagga tgttacccag 1560

gaggagctcg gtggtgccaa gacccacacc accatgtcag gtgtggccca cagagctttt 1620

gaaaatgatg ttgatgcctt gtgtaatctc cgggatttct tcaactacct gcccctgagc 1680

agtcaggacc cggctcccgt ccgtgagtgc cacgatccca gtgaccgtct ggttcctgag 1740

cttgacacaa ttgtcccttt ggaatcaacc aaagcctaca acatggtgga catcatacac 1800

tctgttgttg atgagcgtga attttttgag atcatgccca attatgccaa gaacatcatt 1860

gttggttttg caagaatgaa tgggaggact gttggaattg ttggcaacca acctaaggtg 1920

gcctcaggat gcttggatat taattcatct gtgaaagggg ctcgttttgt cagattctgt 1980

gatgcattca atattccact catcactttt gttgatgtcc ctggctttct acctggcaca 2040

gcacaggaat acgggggcat catccggcat ggtgccaagc ttctctacgc atttgctgag 2100

gcaactgtac ccaaagtcac agtcatcacc aggaaggcct atggaggtgc ctatgatgtc 2160

atgagctcta agcacctttg tggtgatacc aactatgcct ggcccaccgc agagattgca 2220

gtcatgggag caaagggcgc tgtggagatc atcttcaaag ggcatgagaa tgtggaagct 2280

gctcaggcag agtacatcga gaagtttgcc aaccctttcc ctgcagcagt gcgagggttt 2340

gtggatgaca tcatccaacc ttcttccaca cgtgcccgaa tctgctgtga cctggatgtc 2400

ttggccagca agaaggtaca acgtccttgg agaaaacatg caaatattcc attgtaatct 2460

agagatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 2520

tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 2580

agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 2640

gaggtgtggg aggtttttta gaggaacccc tagtgatgga gttggccact ccctctctgc 2700

gcgctcgctc gctcactgag gccgcccggg caaagcccgg gcgtcgggcg acctttggtc 2760

gcccggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 2806

相关技术
  • 用于治疗丙酸血症的基因疗法
  • 用于治疗MMA的非破坏性基因疗法
技术分类

06120112894057