AAV衣壳和含有AAV衣壳的组合物

文献发布时间：2024-04-18 19:58:30

背景技术

腺相关病毒(AAV)载体在人基因疗法中具有广阔的前景，并且由于其提供长期基因表达的能力和缺乏致病性，已在各种研究中广泛用于靶向肝脏、肌肉、心脏、脑、眼睛、肾脏和其它组织。AAV属于细小病毒家族，并且含有侧接有两个反向末端重复序列的单链DNA基因组。已经报告了数十种天然存在的AAV衣壳；所述天然存在的AAV衣壳的独特的衣壳结构使其能够识别和转导不同的细胞类型和器官。

自1981年开始的第一次试验以来，在基于AAV载体的基因疗法的临床试验中没有任何载体相关毒性的报告。与已证明的功效组合的AAV载体在临床试验中不断积累的安全记录表明AAV是有吸引力的平台。特别是，AAV容易被操纵，因为所述病毒具有单链DNA病毒，其具有相对较小的基因组(约4.7kb)和简单的遗传组分——反向末端重复序列(ITR)、Rep和Cap基因。AAV载体仅需要ITR和AAV衣壳蛋白，其中ITR作为用于载体产生的复制和包装信号，并且衣壳蛋白通过形成衣壳以容纳载体基因组DNA和决定组织嗜性发挥核心作用。

由于AAV的低免疫原性和非致病性，AAV是基因疗法最有效的候选载体之一。然而，尽管允许有效的基因转移，但目前在临床中使用的AAV载体可能会受到对病毒的预先存在的免疫力和限制的组织嗜性的阻碍。因此，需要另外的AAV载体。

发明内容

一方面，本文提供了一种重组腺相关病毒(rAAV)，其包括衣壳和载体基因组，所述载体基因组包括AAV 5'反向末端重复序列(ITR)、包括可操作地连接到表达控制序列的编码基因产物的核酸序列的表达盒和AAV 3'ITR，其中所述衣壳是：(a)AAVrh75衣壳，所述AAVrh75衣壳由以下组成：(i)由编码SEQ ID NO:40的核酸序列或与其至少99％相同的基于SEQ ID NO:40的编号在位置24处具有Asn(N)氨基酸残基的序列产生的衣壳；(ii)由编码SEQ ID NO:40的序列或与其至少95％相同的序列的SEQ ID NO:39的核酸序列产生的衣壳；或(iii)作为AAVrh75 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白至少在SEQ IDNO:40的N57、N262、N384和/或N512位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(b)AAVhu71/74衣壳，所述AAVhu71/74衣壳由以下组成：(i)由编码SEQ ID NO:4的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:4的序列或与其至少95％相同的序列的SEQID NO:3的核酸序列产生的衣壳；或(iii)作为AAVrh71/74vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:4的至少4个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(c)AAVhu79衣壳，所述AAVhu79衣壳由以下组成：(i)由编码SEQ ID NO:6的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:6的序列或与其至少95％相同的序列的SEQ ID NO:5的核酸序列产生的衣壳；或(iii)作为AAVhu79 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:6的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(d)AAVhu80衣壳，所述AAVhu80衣壳由以下组成：(i)由编码SEQ IDNO:8的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:8的序列或与其至少95％相同的序列的SEQ ID NO:7的核酸序列产生的衣壳；或(iii)作为AAVhu80 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:8的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(e)AAVhu83衣壳，所述AAVhu83衣壳由以下组成：(i)由编码SEQID NO:10的核酸序列产生的衣壳；(i)由编码SEQ ID NO:10的序列或与其至少95％相同的序列的SEQ ID NO:9的核酸序列产生的衣壳；或(iii)作为AAVhu83 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:10的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(f)AAVhu74/71衣壳，所述AAVhu74/71衣壳由以下组成：(i)由编码SEQ ID NO:12的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:12的序列或与其至少95％相同的序列的SEQ ID NO:11的核酸序列产生的衣壳；或(iii)作为AAVhu74/71vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:12的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(g)AAVhu77衣壳，所述AAVhu77衣壳由以下组成：(i)由编码SEQ ID NO:14的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:14的序列或与其至少95％相同的序列的SEQ ID NO:13的核酸序列产生的衣壳；或(iii)作为AAVhu77vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:14的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(h)AAVhu78/88衣壳，所述AAVhu78/88衣壳由以下组成：(i)由编码SEQ ID NO:16的核酸序列产生的衣壳；(ii)由编码SEQ IDNO:16的序列或与其至少95％相同的序列的SEQ ID NO:15的核酸序列产生的衣壳；或(iii)作为AAVhu78/88vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:16的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(i)AAVhu70衣壳，所述AAVhu70衣壳由以下组成：(i)由编码SEQ ID NO:18的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:18的序列或与其至少95％相同的序列的SEQ ID NO:17的核酸序列产生的衣壳；或(iii)作为AAVhu70 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:18的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(j)AAVhu72衣壳，所述AAVhu72衣壳由以下组成：(i)由编码SEQ ID NO:20的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:20的序列或与其至少95％相同的序列的SEQ ID NO:19的核酸序列产生的衣壳；或(iii)作为AAVhu72 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:20的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(k)AAVhu75衣壳，所述AAVhu75衣壳由以下组成：(i)由编码SEQ ID NO:22的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:22的序列或与其至少95％相同的序列的SEQ ID NO:21的核酸序列产生的衣壳；或(iii)作为AAVhu75 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:22的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(l)AAVhu76衣壳，所述AAVhu76衣壳由以下组成：(i)由编码SEQ ID NO:24的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:24的序列或与其至少95％相同的序列的SEQ IDNO:23的核酸序列产生的衣壳；或(iii)作为AAVhu76 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:24的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(m)AAVhu81衣壳，所述AAVhu81衣壳由以下组成：(i)由编码SEQ ID NO:26的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:26的序列或与其至少95％相同的序列的SEQ ID NO:25的核酸序列产生的衣壳；或(iii)作为AAVhu81vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:26的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(n)AAVhu82衣壳，所述AAVhu82衣壳由以下组成：(i)由编码SEQ IDNO:28的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:28的序列或与其至少95％相同的序列的SEQ ID NO:27的核酸序列产生的衣壳；或(iii)作为AAVhu82 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:28的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(o)AAVhu84衣壳，所述AAVhu84衣壳由以下组成：(i)由编码SEQ ID NO:30的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:30的序列或与其至少95％相同的序列的SEQ ID NO:29的核酸序列产生的衣壳；或(iii)作为AAVhu84 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:30的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(p)AAVhu86衣壳，所述AAVhu86衣壳由以下组成：(i)由编码SEQ ID NO:32的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:32的序列或与其至少95％相同的序列的SEQ ID NO:31的核酸序列产生的衣壳；或(iii)作为AAVhu86 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:32的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(q)AAVhu87衣壳，所述AAVhu87衣壳由以下组成：(i)由编码SEQ ID NO:34的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:34的序列或与其至少95％相同的序列的SEQ ID NO:33的核酸序列产生的衣壳；或(iii)作为AAVhu87 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:34的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(r)AAVhu88/78衣壳，所述AAVhu88/78衣壳由以下组成：(i)由编码SEQ ID NO:36的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:36的序列或与其至少95％相同的序列的SEQ ID NO:35的核酸序列产生的衣壳；或(iii)作为AAVhu88/78vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:36的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(s)AAVhu69衣壳，所述AAVhu69衣壳由以下组成：(i)由编码SEQ ID NO:38的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:38的序列或与其至少95％相同的序列的SEQ ID NO:37的核酸序列产生的衣壳；或(iii)作为AAVhu69 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:38的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(t)AAVrh76衣壳，所述AAVrh76衣壳由以下组成：(i)由编码SEQ ID NO:42的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:42的序列或与其至少95％相同的序列的SEQ ID NO:41的核酸序列产生的衣壳；或(iii)作为AAVhu69 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:42的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(u)AAVrh77衣壳，所述AAVrh77衣壳由以下组成：(i)由编码SEQ ID NO:44的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:44的序列或与其至少95％相同的序列的SEQ IDNO:43的核酸序列产生的衣壳；或(iii)作为AAVrh71 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:44的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(v)AAVrh78衣壳，所述AAVrh78衣壳由以下组成：(i)由编码SEQ ID NO:46的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:46的序列或与其至少95％相同的序列的SEQ ID NO:45的核酸序列产生的衣壳；或(iii)作为AAVrh78 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:46的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(w)AAVrh81衣壳，所述AAVrh81衣壳由以下组成：(i)由编码SEQID NO:50的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:50的序列或与其至少95％相同的序列的SEQ ID NO:49的核酸序列产生的衣壳；或(iii)作为AAVrh81 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:50的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(x)AAVrh89衣壳，所述AAVrh89衣壳由以下组成：(i)由编码SEQ ID NO:52的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:52的序列或与其至少95％相同的序列的SEQ ID NO:51的核酸序列产生的衣壳；或(iii)作为AAVrh89 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:52的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(y)AAVrh82衣壳，所述AAVrh82衣壳由以下组成：(i)由编码SEQ ID NO:54的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:54的序列或与其至少95％相同的序列的SEQ ID NO:53的核酸序列产生的衣壳；或(iii)作为AAVrh82 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:54的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(z)AAVrh83衣壳，所述AAVrh83衣壳由以下组成：(i)由编码SEQ ID NO:56的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:56的序列或与其至少95％相同的序列的SEQ ID NO:55的核酸序列产生的衣壳；或(iii)作为AAVrh83 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:56的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(aa)AAVrh84衣壳，所述AAVrh84衣壳由以下组成：(i)由编码SEQ ID NO:58的核酸序列产生的衣壳；(ii)由编码SEQID NO:58的序列或与其至少95％相同的序列的SEQ ID NO:57的核酸序列产生的衣壳；或(iii)作为AAVrh84vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:58的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(bb)AAVrh85衣壳，所述AAVrh85衣壳由以下组成：(i)由编码SEQ ID NO:60的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:60的序列或与其至少95％相同的序列的SEQ ID NO:59的核酸序列产生的衣壳；或(iii)作为AAVrh85 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ IDNO:60的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(cc)AAVrh87衣壳，所述AAVrh87衣壳由以下组成：(i)由编码SEQ ID NO:62的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:62的序列或与其至少95％相同的序列的SEQ ID NO:61的核酸序列产生的衣壳；或(iii)作为AAVrh87 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:62的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；(dd)AAVhu73衣壳，所述AAVhu73衣壳由以下组成：(i)由编码SEQ ID NO:74的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:74的序列或与其至少95％相同的序列的SEQ ID NO:73的核酸序列产生的衣壳；或(iii)作为AAVrh73 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:74的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化。

一方面，本文提供了一种药物组合物，其包括rAAV和生理上相容的载体、缓冲液、佐剂和/或稀释剂。

一方面，本文提供了一种将转基因递送到细胞的方法，所述方法包括使所述细胞与根据权利要求1至5中任一项所述的rAAV接触的步骤，其中所述rAAV包括所述转基因。

一方面，本文提供了一种产生包括AAV衣壳的重组腺相关病毒(rAAV)的方法，所述方法包括培养含有以下的宿主细胞：(a)分子，所述分子编码AAVrh75(SEQ ID NO:40)、AAVhu71/74(SEQ ID NO:4)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu83(SEQID NO:10)、AAVhu74/71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78/88(SEQ IDNO:16)、AAVhu70(SEQ ID NO:18)、AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu76(SEQ ID NO:24)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu84(SEQID NO:30)、AAVhu86(SEQ ID NO:32)、AAVhu87(SEQ ID NO:34)、AAVhu88/78(SEQ ID NO:36)、AAVhu69(SEQ ID NO:38)、AAVrh76(SEQ ID NO:42)、AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)、AAVrh81(SEQ ID NO:50)、AAVrh89(SEQ ID NO:52)、AAVrh82(SEQ ID NO:54)、AAVrh83(SEQ ID NO:56)、AAVrh84(SEQ ID NO:58)、AAVrh85(SEQ ID NO:60)、AAVrh87(SEQ ID NO:62)或AAVhu73(SEQ ID NO:74)的AAV vp1、vp2和/或vp3衣壳蛋白、或与SEQ IDNO:40、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、42、44、46、50、52、54、56、58、60、62或74中的任何一个共用至少99％同一性的AAV vp1、vp2和/或vp3衣壳蛋白；(b)功能性rep基因；(c)包括AAV反向末端重复序列(ITR)和转基因的载体基因组；以及(d)足以允许将所述载体基因组包装到AAV衣壳蛋白中的辅助功能。

一方面，本文提供了一种质粒，其包括AAVrh75(SEQ ID NO:39)、AAVhu71/74(SEQID NO:3)、AAVhu79(SEQ ID NO:5)、AAVhu80(SEQ ID NO:7)、AAVhu83(SEQ ID NO:9)、AAVhu74/71(SEQ ID NO:11)、AAVhu77(SEQ ID NO:13)、AAVhu78/88(SEQ ID NO:15)、AAVhu70(SEQ ID NO:17)、AAVhu72(SEQ ID NO:19)、AAVhu75(SEQ ID NO:21)、AAVhu76(SEQID NO:23)、AAVhu81(SEQ ID NO:25)、AAVhu82(SEQ ID NO:27)、AAVhu84(SEQ ID NO:29)、AAVhu86(SEQ ID NO:31)、AAVhu87(SEQ ID NO:33)、AAVhu88/78(SEQ ID NO:35)、AAVhu69(SEQ ID NO:37)、AAVrh76(SEQ ID NO:41)、AAVrh77(SEQ ID NO:43)、AAVrh78(SEQ ID NO:45)、AAVrh81(SEQ ID NO:49)、AAVrh89(SEQ ID NO:51)、AAVrh82(SEQ ID NO:53)、AAVrh83(SEQ ID NO:55)、AAVrh84(SEQ ID NO:57)、AAVrh85(SEQ ID NO:59)、AAVrh87(SEQ ID NO:61)或AAVhu73(SEQ ID NO:73)的vp1、vp2和/或vp3序列、或与SEQ ID NO:39、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、41、43、45、49、51、53、55、57、59、61或73中的任何一个共用至少95％同一性的vp1、vp2和/或vp3序列。在另外的实施例中，提供了一种含有此类质粒的培养的宿主细胞。

这些组合物和方法的其它方面和优点在以下具体实施方式中进一步描述。

附图说明

图1示出了AAV-单一基因组扩增(AAV-SGA)的图表。使用扩增AAV基因组的3.1kb区域的AAV特异性引物通过PCR筛选大量哺乳动物基因组DNA样品，所述AAV基因组涵盖末端三分之一的Rep基因和完整的Cap基因序列。针对AAV检测PCR产生阳性结果的样品在96孔板格式中进行端点稀释，并且用作3.1kb扩增子AAV特异性PCR的模板。导致低于30％阳性PCR率的gDNA稀释在每个反应中含有一个可扩增的AAV基因组。使用Illumina MiSeq平台对每个阳性扩增子进行大小选择和测序。来自单一基因组的读段被重新组装以恢复含有VP1衣壳基因的全长AAV重叠群。

图2A-图2D示出了对DNA聚合酶的可变保真和PCR突变体的生物活性的分析。(图2A)HiFi和Q5 DNA聚合酶在环状和线性化质粒模板上诱导的PCR错误的比较。对PCR产物进行克隆和测序。每个点表示单独的质粒克隆。HiFi环状，n＝19；HiFi线性，n＝20；Q5环状，n＝24；Q5线性，n＝20个质粒克隆。(图2B)由HiFi PCR产生的AAV9-突变体PCR分离株的载体产生滴度。突变体衣壳与CB7.ffluciferase.rBG转基因一起包装。通过qPCR测量了总HEK293三重转染细胞裂解物的基因组拷贝滴度。(图2C)通过荧光素酶发光测量的PCR突变体的Huh7感染滴度。“n/a”：“不可用”，因为发光值低于检测极限。对于B和C，AAV9对照设置为100％；值示出为平均值和标准偏差(SD)。使用威尔科克森秩和测试(Wilcoxon rank sumtest)(图2A)和斯图登氏t测试(Student'st-test)(图2B和图2C)评估统计显著性；不显著(NS)：p>＝0.05，*p<0.05，**p<0.01并且***p<0.001。(图2D)对齐的PCR突变体AAV Cap DNA序列的示意图。与AAV9的每个核苷酸错配示出为黑线。这些实验中错配的序列信息详见表1。

图3A-图3C示出了来自人分离株(图3A)、恒河猴分离株(图3B)和先前报告的人AAVHSC(图3C)的AAV VP1 DNA序列的AAV VP1基因邻接系统发育的阳性选择的系统发育分析。BUSTED检测到阳性选择的证据的分支以红色着色。带圆圈的分支节点表示自举支持值>70。

图4示出了HiFi PCR突变体AAV VP1基因的系统发育分析。HiFi PCR突变体的AAVVP1 DNA序列的邻接系统发育。

图5A-图5C示出了AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:81)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu83(SEQ ID NO:10)和AAVhu86(SEQ ID NO:32)的氨基酸序列的比对。

图6A-图6G示出了AAVhu72(SEQ ID NO:19)、AAVhu75(SEQ ID NO:21)、AAVhu79(SEQ ID NO:5)、AAVhu80(SEQ ID NO:7)、AAVhu81(SEQ ID NO:25)、AAVhu82(SEQ ID NO:27)、AAVhu83(SEQ ID NO:9)和AAVhu86(SEQ ID NO:31)的核苷酸序列的比对。

图7A-图7D示出了AAVhu69(SEQ ID NO:38)、AAVhu70(SEQ ID NO:18)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ ID NO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu76(SEQ IDNO:24)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu84(SEQ ID NO:30)、AAVhu87(SEQ ID NO:34)、AAVhu88.78(SEQ ID NO:36)和AAVrh81(SEQ ID NO:50)的氨基酸序列的比对。

图8A-图8J示出了AAVhu69(SEQ ID NO:37)、AAVhu70(SEQ ID NO:17)、AAVhu71.74(SEQ ID NO:3)、AAVhu73(SEQ ID NO:73)、AAVhu74.71(SEQ ID NO:11)、AAVhu76(SEQ IDNO:23)、AAVhu77(SEQ ID NO:13)、AAVhu78.88(SEQ ID NO:15)、AAVhu84(SEQ ID NO:29)、AAVhu87(SEQ ID NO:33)、AAVhu88.78(SEQ ID NO:25)和AAVrh81(SEQ ID NO:49)的核苷酸序列的比对。

图9A-图9B示出了AAVrh76(SEQ ID NO:42)、AAVrh85(SEQ ID NO:60)、AAVrh87(SEQ ID NO:62)、AAVrh89(SEQ ID NO:52)和AAV7(SEQ ID NO:85)的氨基酸序列的比对。

图10A-图10E示出了AAVrh75(SEQ ID NO:39)、AAVrh76(SEQ ID NO:41)、AAVrh85(SEQ ID NO:59)、AAVrh87(SEQ ID NO:61)、AAVrh89(SEQ ID NO:51)和AAV7(SEQ ID NO:84)的核苷酸序列的比对。

图11A-图11B示出了AAVrh75(SEQ ID NO:40)、AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ ID NO:56)、AAVrh84(SEQ ID NO:58)和AAV8(SEQ ID NO:83)的氨基酸序列的比对。

图12A-图12E示出了AAVrh79(SEQ ID NO:47)、AAVrh83(SEQ ID NO:55)、AAVrh84(SEQ ID NO:57)和AAV8(SED ID NO:82)的核苷酸序列的比对。

图13示出了AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)和AAVrh82(SEQ IDNO:54)的氨基酸序列的比对。

图14A-图14C示出了AAVrh77(SEQ ID NO:43)、AAVrh78(SEQ ID NO:45)和AAVrh82(SEQ ID NO:53)的核苷酸序列的比对。

图15示出了AAV载体产量。含有指定分离株衣壳基因的顺式质粒用于包装含有TBG启动子和eGFP转基因的载体基因组。所述载体是用三重转染(各自一个CellStack)制造的，用碘克沙醇梯度纯化，并且使用qPCR进行滴定。“E+#”是指数值中E+后面的指数，例如E+13是指“x 10

图16示出了AAVrh75和AAVrh81载体制剂的感染滴度。以板规模制备具有AAVrh75和AAVrh81衣壳的载体(携带报告转基因盒)，其中以AAV8作为对照。然后使用粗裂解物转导人和小鼠细胞系。AAVrh75和AAVrh81的感染滴度表示为相对于AAV8对照的转导。

图17示出了AAVrh81载体的肝脏转导。C57BL/6J小鼠以1×10

图18示出了AAVrh83和AAVrh84载体的肝脏转导。C57BL/6J小鼠以1×10

图19示出了新型AAV分离株的肝脏转导。C57BL/6J小鼠以1×10

具体实施方式

通过使用AAV单一基因组扩增来探索AAV在其天然哺乳动物宿主中的遗传变异，所述技术用于从病毒群体内准确分离单个AAV基因组(图1)。本文描述从恒河猴组织和人组织中分离新的AAV序列，所述序列可以归类为各种进化枝。从恒河猴组织中分离的12种新型AAV可以分为进化枝D、E和含有AAVrh32.33的灵长类进化枝外群。另外，从人组织中分离的20种新型AAV可以分为进化枝B和C，或分别类似于AAV2和AAV2-AAV3杂合体。

除非另外定义，否则本文所使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解和参照公开的文本相同的含义，这些术语为本领域的技术人员提供了本申请中使用的许多术语的通用指南。以下定义仅出于清楚起见而提供且并不打算限制所要求的发明。

当提及核酸或其片段时，术语“基本同源性”或“基本类似性”表示当与另一个核酸(或其互补链)的适当核苷酸插入或缺失进行最佳比对时，至少约95至99％的比对序列具有核苷酸序列同一性。优选地，同源性在全长序列、或其开放阅读框或长度为至少15个核苷酸的另一个合适的片段上。本文描述了合适片段的实例。

在核酸序列的上下文中，术语“序列同一性”、“序列同一性百分比”或“相同百分比”是指两个序列中的残基在比对以获得最大对应性时是相同的。期望序列同一性比较的长度可以超过基因组的全长、基因编码序列的全长或至少约500至5000个核苷酸的片段。然而，也可能期望较小片段之间的同一性，例如至少约九个核苷酸，通常至少约20至24个核苷酸、至少约28至32个核苷酸、至少约36个或更多个核苷酸。类似地，对于氨基酸序列，在蛋白质的全长或其片段上，可以容易地确定“序列同一性百分比”。合适地，片段长度为至少约8个氨基酸，并且可以至多约700个氨基酸。本文描述了合适片段的实例。

当提及氨基酸或其片段时，术语“基本同源性”或“基本类似性”表示当与另一个氨基酸(或其互补链)的适当氨基酸插入或缺失进行最佳比对时，至少约95到99％的比对序列具有氨基酸序列同一性。优选地，同源性在全长序列、或其蛋白质(例如，cap蛋白、rep蛋白、或其长度为至少8个氨基酸、或更期望地至少15个氨基酸的片段)上。本文描述了合适片段的实例。

术语“高度保守的”意指至少80％同一性、优选地至少90％同一性，并且更优选地超过97％同一性。通过使用本领域技术人员已知的算法和计算机程序，本领域技术人员可以容易地确定同一性。

通常，当提及两种不同的腺相关病毒之间的“同一性”、“同源性”或“类似性”时，参考“比对”序列来确定“同一性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比，通常含有对丢失的或另外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。在实例中，使用公开的AAV9序列作为参考点执行AAV比对。使用多种公开或可商购获得的多序列比对程序中的任一种进行比对。此类程序的实例包含“ClustalΩ”、“ClustalW”、“CAP序列组装”、“MAP”和“MEME”，这些程序可通过因特网上的Web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。可替代地，也使用了载体NTI实用程序。本领域已知的许多算法可以用于测量核苷酸序列同一性，包含上述程序中所含有的算法。作为另一个实例，可以使用GCG 6.1版本的程序Fasta

术语“AAV中间体”或“AAV载体中间体”是指缺少包装在其中的所期望的基因组序列的组装的rAAV衣壳。这些也可以被称为“空”衣壳。此类衣壳可以不含有表达盒的可检测基因组序列，或者含有不足以实现基因产物的表达的仅部分包装的基因组序列。

“遗传元件”包含任何核酸分子例如，裸DNA、质粒、噬菌体、转座子、粘粒、附加体、病毒等，其转移其上携带的序列。任选地，此类遗传元件可以利用基于脂质的载体。除非另有说明，否则基因元件可以通过任何合适的方法递送，包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合。

用于rAAV产生的“稳定宿主细胞”是已被工程化成含有所需的rAAV产生元件(例如，迷你基因、rep序列、如本文所定义的AAVhu68工程化cap序列和/或辅助功能)中的一种或多种和其后代的宿主细胞。稳定宿主细胞可以含有在诱导型启动子的控制下所需组分。可替代地，所需组分可以在组成型启动子的控制下。合适的诱导型和组成型启动子的实例提供于本文适用于转基因的调控元件的论述中。在仍另一个替代方案中，所选的稳定宿主细胞可以含有在组成型启动子控制下的所选组分以及在一个或多个诱导型启动子控制下的其它所选组分。例如，可以产生稳定宿主细胞，所述稳定宿主细胞源自HEK293细胞(其含有在组成型启动子控制下的E1辅助功能)、Huh7细胞、Vero细胞，被工程化以含有在合适启动子控制下的辅助功能，其任选地进一步含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可以产生其它仍稳定的宿主细胞。

如本文所使用的，“表达盒”是指包括生物学上有用的核酸序列(例如，编码蛋白质、酶或其它有用的基因产物的基因cDNA、mRNA等)和与其可操作地连接的调控序列的核酸分子，所述调控序列指导或调节核酸序列和其基因产物的转录、翻译和/或表达。

缩写“sc”是指自身互补。“自身互补AAV”是指其中由重组AAV核酸序列所携带的编码区已经被设计成形成分子内双链DNA模板的构建体。感染后，未等待细胞介导的第二条链合成，而是两条互补的半scAAV将缔合以形成易于立即复制和转录的一条双链DNA(dsDNA)。参见例如，D M McCarty等人,“自身互补的重组腺相关病毒(scAAV)载体独立于DNA合成而促进高效转导(Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently of DNA synthesis)”,《基因疗法(Gene Therapy)》,(2001年8月),第8卷,第16期,第1248-1254页。自互补AAV在例如美国专利第6,596,535号；第7,125,717号；和第7,456,683号中描述，这些美国专利中的每个美国专利通过引用以其整体并入本文。

如本文所使用的，术语“可操作地连接”是指与所关注的基因邻接的表达控制序列以及以反式或在远处起作用以控制所关注的基因的表达控制序列两者。

术语“异源性”当结合蛋白质或核酸使用时指示蛋白质或核酸包括在自然界中未发现彼此间的相同关系的两个或更多个序列或子序列。例如，核酸通常是重组地产生的，具有来自不相关基因的布置成产生新的功能性核酸的两个或更多个序列。例如，在一个实施例中，核酸具有来自一种基因的布置成引导编码序列从不同基因表达的启动子。因此，关于编码序列，启动子是异源性的。

“复制缺陷型病毒”或“病毒载体”是指其中含有所关注基因的表达盒包装在病毒衣壳或包膜中的合成或人工病毒颗粒，其中也包装在病毒衣壳或包膜内的任何病毒基因组序列均是复制缺陷型的；即，所述合成或人工病毒颗粒不能产生子代病毒粒子但保留了感染靶细胞的能力。在一个实施例中，病毒载体的基因组不包含编码复制所需的酶的基因(基因组可以被工程化成“无肠的(gutless)”-仅含有所关注的基因，其侧接有扩增和包装人工基因组所需的信号)，但是这些基因可以在产生期间供应。因此，这被认为可以安全地用于基因疗法，因为除非存在复制所需的病毒酶，否则不会发生通过子代病毒粒子进行的复制和感染。

在许多情况下，rAAV颗粒被称为DNA酶抗性的。然而，除此核酸内切酶(DNA酶)之外，其它核酸内切酶和核酸外切酶也可以用于本文所描述的纯化步骤中，以去除污染性核酸。可以选择此类核酸酶以降解单链DNA和/或双链DNA以及RNA。此类步骤可以含有单个核酸酶或针对不同靶标的核酸酶的混合物，并且可以是核酸内切酶或核酸外切酶。

术语“抗核酸酶”表示AAV衣壳已经在表达盒周围完全组装，所述表达盒被设计成将基因递送到宿主细胞并保护这些包装的基因组序列在被设计成去除产生过程中可能存在的污染性核酸的核酸酶温育步骤期间免于降解(消化)。

如本文所使用的，“有效量”是指在靶细胞中递送和表达一定量的来自载体基因组的基因产物的rAAV组合物的量。可以基于动物模型而不是人类患者来确定有效量。本文描述了合适的鼠类模型的实例。

在本发明的上下文中，术语“翻译”涉及核糖体的过程，其中mRNA链控制氨基酸序列的组装以产生蛋白质或肽。

如本文所使用的，术语“一个/一种(a/an)”是指一个或多个/一种或多种，例如，“一个表达盒”应理解为表示一个或多个表达盒。如此，术语“一个/一种(a或an)”、“一个或多个/一种或多种”和“至少一个/至少一种”在本文可互换地使用。

如本文所使用的，除非另有说明，否则术语“约”意指相对于给定参考的10％的变化性。

虽然说明书中的各个实施例是使用“包括”语言来呈现的，但是在其它情况下，也意图使用“由…组成”或“基本上由…组成”的语言来解释和描述相关的实施例。

关于以下描述，希望在另一个实施例中，本文描述的每种组合物适用于本发明的方法。另外，还预期在另一个实施例中，所描述的用于所述方法中的组合物中的每种组合物本身也是本发明的实施例。

A.AAV衣壳

编码AAV衣壳的核酸包含三个重叠的编码序列，由于使用替代起始密码子，所述编码序列的长度不同。经翻译的蛋白被称为VP1、VP2和VP3，其中VP1是最长的且VP3是最短的。AAV颗粒由比率为约1:1:10(VP1:VP2:VP3)的所有三种衣壳蛋白组成。VP3包括在N端的VP1和VP2中，是构建颗粒的主要结构成分。可使用若干不同编号系统来指代衣壳蛋白。为方便起见，如本文所用，使用VP1编号来指代AAV序列，所述编号从VP1的第一个残基的aa 1开始。但是，本文所描述的衣壳蛋白包含VP1、VP2和VP3(在本文中可与vp1、vp2和vp3互换使用)。

进化枝B

本文提供了新型AAV衣壳蛋白，其具有序列表中所示的vp1序列：AAVhu72(SEQ IDNO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu83(SEQ ID NO:10)或AAVhu86(SEQ ID NO:32)。对应于vp1、vp2、vp3的核苷酸和氨基酸的编号如下：

核苷酸(nt)

AAVhu72：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:19的nt 607至2205；

AAVhu75：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:21的nt 607至2205；

AAVhu79：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:5的nt 607至2205；

AAVhu80：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:7的nt 607至2205；

AAVhu81：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:25的nt 607至2205；

AAVhu82：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:27的nt 607至2205；

AAVhu83：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:9的nt 607至2205；

AAVhu86：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:31的nt 607至2205。

氨基酸(aa)

AAVhu72：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:20的aa 203至735；

AAVhu75：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:22的aa 203至735；

AAVhu79：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:6的aa 203至735；

AAVhu80：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:8的aa 203至735；

AAVhu81：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:26的aa 203至735；

AAVhu82：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:28的aa 203至735；

AAVhu83：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:10的aa 203至735；

AAVhu86：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:32的aa 203至735。

在某些实施例中，本文提供了rAAV，所述rAAV包括以下中的任何一个的vp1、vp2和vp3中的至少一个：AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ IDNO:6)、AAVhu80(SEQ ID NO:8)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu83(SEQ ID NO:10)或AAVhu86(SEQ ID NO:32)。在某些实施例中，提供了具有衣壳蛋白的rAAV，所述衣壳蛋白包括与AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQID NO:28)、AAVhu83(SEQ ID NO:10)或AAVhu86(SEQ ID NO:32)至少95％、至少96％、至少97％、至少98％或至少99％相同的vp1、vp2和/或vp3序列。在某些实施例中，vp1、vp2和/或vp3相对于AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu83(SEQID NO:10)或AAVhu86(SEQ ID NO:32)的vp1、vp2和/或vp3具有至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9或至多10个氨基酸差异。本文还提供了包括AAV衣壳的rAAV，所述AAV衣壳由以下编码：AAVhu72(SEQ ID NO:19)、AAVhu75(SEQ ID NO:21)、AAVhu79(SEQ ID NO:5)、AAVhu80(SEQ ID NO:7)、AAVhu81(SEQ ID NO:25)、AAVhu82(SEQID NO:27)、AAVhu83(SEQ ID NO:9)或AAVhu86(SEQ ID NO:31)的vp1、vp2、vp3序列中的至少一个、或与SEQ ID NO:19、21、5、7、25、27、9或31至少95％、至少96％、至少97％、至少98％或至少99％相同的序列。在某些实施例中，所述序列编码AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu83(SEQ ID NO:10)或AAVhu86(SEQ ID NO:32)的全长vp1、vp2和/或vp3。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

进化枝C

本文提供了新型AAV衣壳蛋白，其具有序列表中所示的vp1序列：AAVrh81(SEQ IDNO:50)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ ID NO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu76(SEQ ID NO:24)、AAVhu84(SEQ ID NO:30)、hu87(SEQ ID NO:34)、AAVhu88.78(SEQID NO:36)或AAVhu69(SEQ ID NO:38)。对应于vp1、vp2、vp3的核苷酸和氨基酸的编号如下：

核苷酸(nt)

AAVrh81：vp1-nt 1至2217；vp2-nt 412至2217；vp3-SEQ ID NO:49的nt 619至2217；

AAVhu71.74：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:3的nt 607至2205；

AAVhu73：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:73的nt 607至2205；

AAVhu74.71：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:11的nt 607至2205；

AAVhu77：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:13的nt 607至2205；

AAVhu78.88：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:15的nt 607至2205；

AAVhu70：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:17的nt 607至2205；

AAVhu76：vp1-nt 1至2202；vp2-nt 412至2202；vp3-SEQ ID NO:23的nt 607至2202；

AAVhu84：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:29的nt 607至2205；

AAVhu87：vp1-nt 1至2202；vp2-nt 412至2202；vp3-SEQ ID NO:33的nt 607至2202；

AAVhu88.78：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:35的nt 607至2205；

AAVhu69：vp1-nt 1至2205；vp2-nt 412至2205；vp3-SEQ ID NO:37的nt 607至2205。

氨基酸(aa)

AAVrh81：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:50的aa 207至739；

AAVhu71.74：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:4的aa 203至735；

AAVhu73：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:74的aa 203至735；

AAVhu74.71：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:12的aa 203至735；

AAVhu77：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:14的aa 203至735；

AAVhu78.88：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:16的aa 203至735；

AAVhu70：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:18的aa 203至735；

AAVhu76：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:24的aa 203至734；

AAVhu84：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:30的aa 203至735；

AAVhu87：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:34的aa 203至734；

AAVhu88.78：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:36的aa 203至735；

AAVhu69：aa vp1–1至735；vp2–aa 138至735；vp3–SEQ ID NO:38的aa 203至735。

在某些实施例中，本文提供了rAAV，所述rAAV包括以下中的任何一个的vp1、vp2和vp3中的至少一个：AAVrh81(SEQ ID NO:50)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ IDNO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu76(SEQ ID NO:24)、AAVhu84(SEQ ID NO:30)、hu87(SEQ ID NO:34)、AAVhu88.78(SEQ ID NO:36)或AAVhu69(SEQ ID NO:38)。在某些实施例中，提供了具有衣壳蛋白的rAAV，所述衣壳蛋白包括与AAVrh81(SEQ ID NO:50)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ ID NO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu76(SEQ ID NO:24)、AAVhu84(SEQ ID NO:30)、hu87(SEQ ID NO:34)、AAVhu88.78(SEQ ID NO:36)或AAVhu69(SEQ ID NO:38)至少95％、至少96％、至少97％、至少98％或至少99％相同的vp1、vp2和/或vp3序列。在某些实施例中，vp1、vp2和/或vp3相对于AAVrh81(SEQ ID NO:50)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ ID NO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu76(SEQ ID NO:24)、AAVhu84(SEQ ID NO:30)、hu87(SEQ ID NO:34)、AAVhu88.78(SEQ ID NO:36)或AAVhu69(SEQ ID NO:38)的vp1、vp2和/或vp3具有至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9或至多10个氨基酸差异。本文还提供了包括AAV衣壳的rAAV，所述AAV衣壳由以下编码：AAVrh81(SEQ ID NO:49)、AAVhu71.74(SEQ ID NO:3)、AAVhu73(SEQID NO:73)、AAVhu74.71(SEQ ID NO:11)、AAVhu77(SEQ ID NO:13)、AAVhu78.88(SEQ IDNO:15)、AAVhu70(SEQ ID NO:17)、AAVhu76(SEQ ID NO:23)、AAVhu84(SEQ ID NO:29)、hu87(SEQ ID NO:33)、AAVhu88.78(SEQ ID NO:35)或AAVhu69(SEQ ID NO:37)的vp1、vp2和vp3序列中的至少一个、或与SEQ ID NO:49、3、73、11、13、15、17、23、29、33、35或37至少95％、至少96％、至少97％、至少98％或至少99％相同的序列。在某些实施例中，所述序列编码AAVrh81(SEQ ID NO:50)、AAVhu71.74(SEQ ID NO:4)、AAVhu73(SEQ ID NO:74)、AAVhu74.71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78.88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu76(SEQ ID NO:24)、AAVhu84(SEQ ID NO:30)、hu87(SEQ IDNO:34)、AAVhu88.78(SEQ ID NO:36)或AAVhu69(SEQ ID NO:38)的全长vp1、vp2和/或vp3。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

进化枝D

本文提供了新型AAV衣壳蛋白，其具有序列表中所示的vp1序列：AAVrh76(SEQ IDNO:42)、AAVrh89(SEQ ID NO:52)、AAVrh85(SEQ ID NO:60)或AAVrh87(SEQ ID NO:62)。对应于vp1、vp2、vp3的核苷酸和氨基酸的编号如下：

核苷酸(nt)

AAVrh76：vp1-nt 1至2211；vp2-nt 412至2211；vp3-SEQ ID NO:41的nt 610至2211；

AAVrh89：vp1-nt 1至2184；vp2-nt 412至2184；vp3-SEQ ID NO:51的nt 595至2184；

AAVrh85：vp1-nt 1至2211；vp2-nt 412至2211；vp3-SEQ ID NO:59的nt 610至2211；

AAVrh87：vp1-nt 1至2211；vp2-nt 412至2211；vp3-SEQ ID NO:61的nt 610至2211。

氨基酸(aa)

AAVrh76：aa vp1–1至737；vp2–aa 138至737；vp3–SEQ ID NO:42的aa 204至737；

AAVrh89：aa vp1–1至728；vp2–aa 138至728；vp3–SEQ ID NO:52的aa 199至728；

AAVrh85：aa vp1–1至737；vp2–aa 138至737；vp3–SEQ ID NO:60的aa 204至737；

AAVrh87：aa vp1–1至737；vp2–aa 138至737；vp3–SEQ ID NO:62的aa 204至737。

在某些实施例中，本文提供了rAAV，所述rAAV包括以下中的任何一个的vp1、vp2和vp3中的至少一个：AAVrh76(SEQ ID NO:42)、AAVrh89(SEQ ID NO:52)、AAVrh85(SEQ IDNO:60)或AAVrh87(SEQ ID NO:62)。在某些实施例中，提供了具有衣壳蛋白的rAAV，所述衣壳蛋白包括与AAVrh75(SEQ ID NO:40)、AAVrh76(SEQ ID NO:42)、AAVrh89(SEQ ID NO:52)、AAVrh85(SEQ ID NO:60)或AAVrh87(SEQ ID NO:62)至少95％、至少96％、至少97％、至少98％或至少99％相同的vp1、vp2和/或vp3序列。在某些实施例中，vp1、vp2和/或相对于AAVrh76(SEQ ID NO:42)、AAVrh89(SEQ ID NO:52)、AAVrh85(SEQ ID NO:60)或AAVrh87(SEQ ID NO:62)的vp1、vp2和/或vp3具有至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9或至多10个氨基酸差异。本文还提供了包括AAV衣壳的rAAV，所述AAV衣壳由以下编码：AAVrh75(SEQ ID NO:39)、AAVrh76(SEQ ID NO:41)、AAVrh89(SEQ ID NO:51)、AAVrh85(SEQ ID NO:59)或AAVrh87(SEQ ID NO:61)中的任何一个的vp1、vp2和vp3序列中的至少一个、或与SEQ ID NO:39、41、51、59或61至少95％、至少96％、至少97％、至少98％或至少99％相同的序列。在某些实施例中，所述序列编码AAVrh75(SEQ ID NO:40)、AAVrh76(SEQ ID NO:42)、AAVrh89(SEQ ID NO:52)、AAVrh85(SEQ ID NO:60)或AAVrh87(SEQ IDNO:62)的全长vp1、vp2和/或vp3。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

进化枝E

本文提供了新型AAV衣壳蛋白，其具有序列表中所示的vp1序列：AAVrh75(SEQ IDNO:40)、AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ ID NO:56)或AAVrh84(SEQ ID NO:58)。对应于vp1、vp2、vp3的核苷酸和氨基酸的编号如下：

核苷酸(nt)

AAVrh75：vp1-nt 1至2208；vp2-nt 412至2208；vp3-SEQ ID NO:39的nt 607至2208；

AAVrh79：vp1-nt 1至2214；vp2-nt 412至2214；vp3-SEQ ID NO:47的nt 610至2214；

AAVrh83：vp1-nt 1至2211；vp2-nt 412至2211；vp3-SEQ ID NO:55的nt 610至2211；

AAVrh84：vp1-nt 1至2211；vp2-nt 412至2211；vp3-SEQ ID NO:57的nt 610至2211。

氨基酸(aa)

AAVrh75：aa vp1–1至736；vp2–aa 138至736；vp3–SEQ ID NO:40的aa 203至736；

AAVrh79：aa vp1–1至738；vp2–aa 138至738；vp3–SEQ ID NO:48的aa 204至738；

AAVrh83：aa vp1–1至737；vp2–aa 138至737；vp3–SEQ ID NO:56的aa 204至737；

AAVrh84：aa vp1–1至737；vp2–aa 138至737；vp3–SEQ ID NO:58的aa 204至737。

在某些实施例中，本文提供了rAAV，所述rAAV包括以下中的任何一个的vp1、vp2和vp3中的至少一个：AAVrh75(SEQ ID NO:40)、AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ IDNO:56)或AAVrh84(SEQ ID NO:58)。在某些实施例中，提供了具有衣壳蛋白的rAAV，所述衣壳蛋白包括与AAVrh75(SEQ ID NO:40)、AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ ID NO:56)或AAVrh84(SEQ ID NO:58)至少95％、至少96％、至少97％、至少98％或至少99％相同的vp1、vp2和/或vp3序列。在某些实施例中，vp1、vp2和/或vp3相对于AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ ID NO:56)或AAVrh84(SEQ ID NO:58)的vp1、vp2和/或vp3具有至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9或至多10个氨基酸差异。本文还提供了包括AAV衣壳的rAAV，所述AAV衣壳由以下编码：AAVrh75(SEQ ID NO:40)、AAVrh79(SEQID NO:47)、AAVrh83(SEQ ID NO:55)或AAVrh84(SEQ ID NO:57)的vp1、vp2和vp3中的至少一个、或与SEQ ID NO:47、55或57至少95％、至少96％、至少97％、至少98％或至少99％相同的序列。在某些实施例中，所述序列编码AAVrh79(SEQ ID NO:48)、AAVrh83(SEQ ID NO:56)或AAVrh84(SEQ ID NO:58)的全长vp1、vp2和/或vp3。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

“边缘进化枝”外群

本文提供了新型AAV衣壳蛋白，其具有序列表中所示的vp1序列：AAVrh77(SEQ IDNO:44)、AAVrh78(SEQ ID NO:46)或AAVrh82(SEQ ID NO:54)。对应于vp1、vp2、vp3的核苷酸和氨基酸的编号如下：

核苷酸(nt)

AAVrh77：vp1-nt 1至2199；vp2-nt 412至2199；vp3-SEQ ID NO:43的nt 589至2199；

AAVrh78：vp1-nt 1至2199；vp2-nt 412至2199；vp3-SEQ ID NO:45的nt 589至2199；

AAVrh82：vp1-nt 1至2199；vp2-nt 412至2199；vp3-SEQ ID NO:53的nt 589至2199。

氨基酸(aa)

AAVrh77：aa vp1–1至733；vp2–aa 138至733；vp3–SEQ ID NO:44的aa 197至733；

AAVrh78：aa vp1–1至733；vp2–aa 138至733；vp3–SEQ ID NO:46的aa 197至733；

AAVrh82：aa vp1–1至733；vp2–aa 138至733；vp3–SEQ ID NO:82的aa 197至733。

在某些实施例中，本文提供了rAAV，所述rAAV包括以下中的任何一个的vp1、vp2和vp3中的至少一个：AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)或AAVrh82(SEQ IDNO:54)。在某些实施例中，提供了具有衣壳蛋白的rAAV，所述衣壳蛋白包括与AAVrh77(SEQID NO:44)、AAVrh78(SEQ ID NO:46)或AAVrh82(SEQ ID NO:54)至少95％、至少96％、至少97％、至少98％或至少99％相同的vp1、vp2和/或vp3序列。在某些实施例中，vp1、vp2和/或vp3相对于AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)或AAVrh82(SEQ ID NO:54)的vp1、vp2和/或vp3具有至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9或至多10个氨基酸差异。本文还提供了包括AAV衣壳的rAAV，所述AAV衣壳由以下编码：AAVrh77(SEQ ID NO:43)、AAVrh78(SEQ ID NO:45)或AAVrh82(SEQ ID NO:53)的vp1、vp2和vp3中的至少一个、或与SEQ ID NO:43、45、53至少95％、至少96％、至少97％、至少98％或至少99％相同的序列。在某些实施例中，vp1、vp2和/或vp3是AAVrh77(SEQ ID NO:44)、AAVrh78(SEQID NO:46)或AAVrh82(SEQ ID NO:54)的全长衣壳蛋白。在其它实施例中，vp1、vp2和/或vp3具有N末端和/或C末端截短(例如，约1至约10个氨基酸的截短)。

“重组AAV”或“rAAV”是含有两个元件的DNA酶抗性病毒颗粒，所述两个元件即AAV衣壳和至少含有包装在AAV衣壳内的非AAV编码序列的载体基因组。除非另有说明，否则此术语可以与短语“rAAV载体”互换地使用。rAAV是“复制缺陷型病毒”或“病毒载体”，因为其缺少任何功能性AAV rep基因或功能性AAV cap基因并且不能产生子代。在某些实施例中，仅AAV序列是AAV反向末端重复序列(ITR)，通常定位在载体基因组的5'和3'最端处，以允许定位在ITR之间的基因和调控序列包装在AAV衣壳内。

如本文所使用的，“载体基因组”是指包装在形成病毒颗粒的rAAV衣壳内部的核酸序列。此类核酸序列含有AAV反向末端重复序列(ITR)。在本文的实例中，载体基因组至少含有从5'至3'的AAV 5'ITR、编码序列和AAV 3'ITR。可以选择来自AAV2的ITR、不同于衣壳来源或除全长ITR之外的AAV。在某些实施例中，ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。进一步地，可以使用其它ITR。进一步地，载体基因组含有引导基因产物表达的调控序列。在本文中更详细地讨论载体基因组的合适组分。载体基因组在本文中有时被称作“迷你基因”。

rAAV由AAV衣壳和载体基因组构成。AAV衣壳是vp1的异质群体、vp2的异质群体和vp3蛋白的异质群体的组装。如本文所使用的，当用于指vp衣壳蛋白时，术语“异质”或其任何语法变型是指由不相同的元件组成的群体，例如具有带有不同的经修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白质)。

如本文所使用的，与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质群体”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群体。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如，某些亚群体包括天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺的天冬酰胺(N)位置，并且任选地进一步包括其它脱酰胺的氨基酸，其中脱酰胺引起氨基酸变化和其它任选的修饰。

如本文所使用的，除非另有说明，否则vp蛋白的“亚群体”是指一组vp蛋白，所述一组vp蛋白具有至少一个限定的共同特性，并且由至少一个组成员到少于参考组的所有成员组成。例如，除非另有说明，否则vp1蛋白的“亚群体”可以是至少一种(1)vp1蛋白，并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明，否则vp3蛋白的“亚群体”可以是少于组装的AAV衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如，vp1蛋白可以是vp蛋白的亚群体；vp2蛋白可以是vp蛋白的单独亚群体，并且vp3是组装的AAV衣壳中的vp蛋白的仍另外的亚群体。在另一个实例中，vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体，例如，至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺，例如在天冬酰胺-甘氨酸对处。

除非另有说明，否则高度脱酰胺化是指与在参考氨基酸位置处的预测的氨基酸序列相比，在参考的氨基酸位置处被至少45％脱酰胺化、至少50％脱酰胺化、至少60％脱酰胺化、至少65％脱酰胺化、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％或至多约100％脱酰胺化。此类百分比可以使用2D凝胶、质谱技术或其它合适的技术来确定。

在不希望受理论束缚的情况下，AAV衣壳中的vp蛋白中的至少高度脱酰胺化的残基的脱酰胺化被认为本质上主要是非酶促的，这是由衣壳蛋白内的功能基团引起的，所述功能基团使所选天冬酰胺脱酰胺化，并在较小程度上使谷氨酰胺残基脱酰胺化。大多数脱酰胺化vp1蛋白的有效衣壳组装表明这些事件在衣壳组装之后发生，或者单独单体(vp1、vp2或vp3)中的脱酰胺化在结构上具有良好的耐受性，并且在很大程度上不会影响组装动力学。VP1-独特(VP1-u)区(约aa 1-137)中的广泛的脱酰胺化通常被认为在细胞进入之前定位在内部，这表明VP脱酰胺化可以在衣壳组装之前发生。

在不希望受理论束缚的情况下，N的脱酰胺化可以通过其C端残基的骨架氮原子对Asn侧链酰胺基碳原子进行亲核攻击而发生。据信形成了中间闭环的琥珀酰亚胺残基。然后，琥珀酰亚胺残基进行快速水解以产生最终产物天冬氨酸(Asp)或异天冬氨酸(IsoAsp)。因此，在某些实施例中，天冬酰胺(N或Asn)的脱酰胺化产生Asp或IsoAsp，其可以通过琥珀酰亚胺中间体相互转化，例如如下文所展示的。

如本文所提供的，VP1、VP2或VP3中的每个脱酰胺化的N可以独立地是天冬氨酸(Asp)、异天冬氨酸(isoAsp)、天冬氨酸和/或Asp和isoAsp的互相转化的共混物或其组合。可以存在任何合适比率的α-和异天冬氨酸。例如，在某些实施例中，比率可以为10:1至1:10天冬氨酸:异天冬氨酸、约50:50天冬氨酸:异天冬氨酸、或约1:3天冬氨酸:异天冬氨酸或另一所选比率。

在某些实施例中，一种或多种谷氨酰胺(Q)可以脱酰胺化为谷氨酸(Glu)，即α-谷氨酸、γ-谷氨酸(Glu)或α-和γ-谷氨酸的共混物，其可以通过常见的戊二酰亚胺(glutarinimide)中间体相互转化。可以存在任何合适比率的α-和γ-谷氨酸。例如，在某些实施例中，比率可以为10:1至1:10α:γ、约50:50α:γ、或约1:3α:γ或另一所选比率。

因此，rAAV包含vp1、vp2和/或vp3蛋白的rAAV衣壳内具有脱酰胺化的氨基酸的亚群体，至少包含至少一个包括至少一种高度脱酰胺化的天冬酰胺的亚群体。另外，其它修饰可以包含异构化，特别是在所选天冬氨酸(D或Asp)残基位置处。在仍其它实施例中，修饰可以包含在Asp位置处的酰胺化。

在某些实施例中，AAV衣壳含有具有至少1个、至少2个、至少3个、至少4个、至少5个至至少约25个脱酰胺化的氨基酸残基位置的vp1、vp2和vp3的亚群体，与vp蛋白的经编码的氨基酸序列相比，所述vp1、vp2和vp3的至少1％至10％、至少10％至25％、至少25％至50％、至少50％至70％、至少70％至100％、至少75％至100％、至少80％-100％或至少90-100％被脱酰胺化。这些中的大多数可以是N残基。然而，Q残基也可以被脱酰胺化。

如本文所使用的，“经编码的氨基酸序列”是指基于被转译成氨基酸的参考的核酸序列的已知DNA密码子的转译而预测的氨基酸。下表展示了DNA密码子和二十种常见氨基酸，分别示出了单字母代码(SLC)和三个字母代码(3LC)。

在某些实施例中，rAAV具有含有vp1、vp2和vp3蛋白的AAV衣壳，所述蛋白具有包括在本文中提供的表中列出的位置处的两个、三个、四个、五个或更多个脱酰胺化的残基的组合的亚群体，并通过引用并入本文中。

rAAV中的脱酰胺化可以使用2D凝胶电泳和/或质谱和/或蛋白质建模技术来确定。在线色谱可以使用Acclaim PepMap柱和与Q Exactive HF和NanoFlex源(赛默飞世尔科技公司(Thermo Fisher Scientific))耦合的Thermo UltiMate 3000RSLC系统(赛默飞世尔科技公司)执行。MS数据是使用用于Q Exactive HF的数据依赖性前20种方法获取的，所述方法从调查扫描(200-2000m/z)中动态选择最丰富的尚未测序的前体离子。测序通过高能碰撞解离片段进行，其中通过预测性自动增益控制确定的靶值为1e5离子，并且以4m/z的窗口进行前体分离。在m/z 200下以120,000的分辨率获取调查扫描。HCD光谱的分辨率可以在m/z 200下设置为30,000，其中最大离子注入时间为50毫秒，并且归一化碰撞能量为30。S-透镜RF水平可以设置为50，以使消化肽所占据的m/z区达到最佳传输。可以从片段选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。BioPharma Finder 1.0软件(赛默飞世尔科技公司)可以用于分析所获取的数据。对于肽作图，使用单进入蛋白FASTA数据库进行搜索，其中脲基甲基化设置为固定的修饰；并将氧化、脱酰胺化和磷酸化设置为可变修饰、10-ppm质量准确度、高蛋白酶特异性和置信度水平为0.8的MS/MS光谱。合适的蛋白酶的实例可以包含例如胰蛋白酶或胰凝乳蛋白酶。脱酰胺化的肽的质谱鉴定相对简单，因为脱酰胺化向完整分子的质量添加了+0.984Da(-OH基团与-NH

除脱酰胺化之外，可能发生不会导致一个氨基酸转化为不同的氨基酸残基的其它修饰。这种修饰可以包含乙酰化残基、异构化、磷酸化或氧化。

脱酰胺化的调节：在某些实施例中，AAV被修饰成改变天冬酰胺-甘氨酸对中的甘氨酸，以降低脱酰胺化。在其它实施例中，将天冬酰胺改变为不同的氨基酸，例如以较慢速率进行脱酰胺化的谷氨酰胺；或改变为缺乏酰胺基的氨基酸(例如，含有酰胺基的谷氨酰胺和天冬酰胺)；和/或改变为缺乏胺基的氨基酸(例如，含有胺基的赖氨酸、精氨酸和组氨酸)。如本文所使用的，缺乏酰胺或胺侧基的氨基酸是指例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、胱氨酸、苯丙氨酸、酪氨酸或色氨酸和/或脯氨酸。如所描述的修饰可以在经编码的AAV氨基酸序列中存在的天冬酰胺-甘氨酸对中的一个、两个或三个天冬酰胺-甘氨酸对中。在某些实施例中，在所有四个天冬酰胺-甘氨酸对中没有进行此类修饰。因此，一种用于降低具有较低脱酰胺化速率的AAV和/或经工程化的AAV变体的脱酰胺化的方法。另外地或可替代地，可以将一种或多种其它酰胺氨基酸改变为非酰胺氨基酸以降低AAV的脱酰胺化。在某些实施例中，本文所描述的突变AAV衣壳含有天冬酰胺-甘氨酸对中的突变，使得甘氨酸变为丙氨酸或丝氨酸。突变AAV衣壳可以含有一个、两个或三个突变体，其中参考AAV天然地含有四个NG对。在某些实施例中，AAV衣壳可以含有一个、两个、三个或四个此类突变体，其中参考AAV天然地含有五个NG对。在某些实施例中，突变AAV衣壳含有NG对中的仅单个突变。在某些实施例中，突变AAV衣壳含有两个不同的NG对中的突变。在某些实施例中，突变AAV衣壳含有定位在AAV衣壳中的结构上分开的位置中的两个不同的NG对中的突变。在某些实施例中，突变不在VP1-独特区中。在某些实施例中，突变之一不在VP1-独特区中。任选地，突变AAV衣壳不含有NG对中的修饰，但是含有突变以最小化或消除定位在NG对的外部的一个或多个天冬酰胺或谷氨酰胺中的脱酰胺化。

在某些实施例中，提供了一种增加rAAV载体的效力的方法，所述方法包括使AAV衣壳工程化，这消除了野生型AAV衣壳中的NG中的一个或多个NG。在某些实施例中，“NG”的“G”的编码序列被工程化为编码另一种氨基酸。在下文的某些实例中，“S”或“A”被取代。然而，可以选择其它合适的氨基酸编码序列。

氨基酸修饰可以通过常规的基因工程技术进行。例如，可以产生含有经过修饰的AAV vp密码子的核酸序列，其中修饰天冬酰胺-甘氨酸中编码甘氨酸的密码子中的一到三个密码子以编码除甘氨酸之外的氨基酸。在某些实施例中，含有经过修饰的天冬酰胺密码子的核酸序列可以在天冬酰胺-甘氨酸对中的一到三个天冬酰胺-甘氨酸对处被工程化，使得经过修饰的密码子编码除天冬酰胺之外的氨基酸。每个经过修饰的密码子可以编码不同的氨基酸。可替代地，改变的密码子中的一个或多个密码子可以编码相同的氨基酸。在某些实施例中，这些经过修饰的核酸序列可以用于产生具有比天然AAV3B变体衣壳脱酰胺化程度更低的衣壳的突变rAAV。此类突变rAAV可以具有降低的免疫原性和/或增加储存时的稳定性，特别是以悬浮液形式储存时的稳定性。

本文还提供了编码具有降低的脱酰胺化的AAV衣壳的核酸序列。设计编码此AAV衣壳的核酸序列在本领域的技术范围内，包含DNA(基因组或cDNA)或RNA(例如，mRNA)。此类核酸序列可以被密码子优化以在所选系统(即，细胞类型)中进行表达并且可以通过各种方法设计。可以使用在线可用的方法(例如，GeneArt)、公开的方法或提供密码子优化服务的公司(例如，DNA2.0)(加利福尼亚州门洛帕克市(Menlo Park,CA))来执行此优化。例如，在国际专利公开第WO 2015/012924号中描述了一种密码子优化方法，其通过引用整体并入本文中。还参见例如美国专利公开第2014/0032186号和美国专利公开第2006/0136184号。适合的是，修饰产物的开放阅读框(ORF)的全长。然而，在一些实施例中，仅ORF的片段可以被改变。通过使用这些方法中的一种方法，可以将频率应用于任何给定的多肽序列，并产生对多肽进行编码的经密码子优化的编码区的核酸片段。许多选项可用于对密码子进行实际改变或者可用于合成如本文所描述地设计的密码子优化的编码区。此类改变或合成可以使用本领域普通技术人员已熟知的标准和常规分子生物学操作来进行。在一种方法中，通过标准方法合成各自长度为80-90个核苷酸且跨越希望的序列的长度的一系列互补寡核苷酸对。这些寡核苷酸对被合成为使得在退火时它们形成80-90个碱基对的双链片段，这些双链片段含有黏性末端，例如在该对中的各寡核苷酸被合成来延伸超过与该对中另一寡核苷酸互补的区域3个、4个、5个、6个、7个、8个、9个、10个或更多个碱基。每对寡核苷酸的单链末端被设计为用另一对寡核苷酸的单链末端退火。允许这些寡核苷酸对退火，并且然后允许约五至六个这些双链片段经由粘性单链末端一起退火，并且随后它们连接在一起并克隆到标准细菌克隆载体中，例如可获自加利福尼亚州卡尔斯巴德英杰公司(InvitrogenCorporation,Carlsbad,Calif)的

在某些实施例中，提供了AAV衣壳，所述AAV衣壳具有含有多个高度脱酰胺化的“NG”位置的AAV衣壳同种型(即，VP1、VP2、VP3)的异质群体。在某些实施例中，高度脱酰胺化的位置在下文参考预测的全长VP1氨基酸序列鉴定的位置中。在其它实施例中，衣壳基因被修饰成使得参考的“NG”被消融，并且突变体“NG”被工程化到另一个位置中。

B.rAAV载体和组合物

一方面，本文提供了利用本文所描述的AAV衣壳序列(包含其片段)的分子，用于产生可用于将异源基因或其它核酸序列递送到靶细胞的病毒载体。在某些实施例中，所提供的rAAV具有如本文所描述的衣壳，并且在衣壳中包装了包括非AAV核酸序列的载体基因组。在某些实施例中，可用于本文所描述的组合物和方法的载体至少含有编码本文所描述的选定AAV衣壳的序列例如，AAVhu71/74(SEQ ID NO:4)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQID NO:8)、AAVhu83(SEQ ID NO:10)、AAVhu74/71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78/88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu76(SEQ ID NO:24)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQID NO:28)、AAVhu84(SEQ ID NO:30)、AAVhu86(SEQ ID NO:32)、AAVhu87(SEQ ID NO:34)、AAVhu88/78(SEQ ID NO:36)、AAVhu69(SEQ ID NO:38)、AAVrh75(SEQ ID NO:40)、AAVrh76(SEQ ID NO:42)、AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)、AAVrh79(SEQ ID NO:48)、AAVrh81(SEQ ID NO:50)、AAVrh89(SEQ ID NO:52)、AAVrh82(SEQ ID NO:54)、AAVrh83(SEQ ID NO:56)、AAVrh84(SEQ ID NO:58)、AAVrh85(SEQ ID NO:60)、AAVrh87(SEQ ID NO:62)或AAVhu73(SEQ ID NO:74)衣壳、或其片段，包含vp1、vp2或vp3衣壳蛋白。在某些实施例中，有用的载体至少含有编码所选AAV血清型rep蛋白或其片段的序列。任选地，此类载体可以含有AAV cap和rep蛋白。在提供AAV rep和cap两者的载体中，AAV rep和AAV cap序列可以均属于一种血清型来源例如，都是AAVhu71/74、AAVhu79、AAVhu80、AAVhu83、AAVhu74/71、AAVhu77、AAVhu78/88、AAVhu70、AAVhu72、AAVhu75、AAVhu76、AAVhu81、AAVhu82、AAVhu84、AAVhu86、AAVhu87、AAVhu88/78、AAVhu69、AAVrh75、AAVrh76、AAVrh77、AAVrh78、AAVrh79、AAVrh81、AAVrh89、AAVrh82、AAVrh83、AAVrh84、AAVrh85、AAVrh87或AAVhu73来源。可替代地，可以使用其中rep序列来自不同于提供cap序列的野生型AAV的AAV的载体例如，提供ITR和rep的同一AAV。

在一个实施例中，rep和cap序列由单独来源(例如，单独的载体或宿主细胞和载体)表达。在另一个实施例中，这些rep序列使用相同读框融合到不同AAV血清型的cap序列以形成嵌合AAV载体，如美国专利第7,282,199号中描述的AAV2/8，所述美国专利通过引用并入本文。任选地，载体进一步含有迷你基因，所述迷你基因包括侧接有AAV 5'ITR和AAV3'ITR的所选转基因。在另一个实施例中，AAV是自互补AAV(sc-AAV)(参见以引用的方式并入本文中的US 2012/0141422)。自互补载体包装一个反向重复基因组，它可以折叠成dsDNA，而无需DNA合成或多个载体基因组之间的碱基配对。由于scAAV不需要在表达之前将单股DNA(ssDNA)基因组转化为双股DNA(dsDNA)，因此其为更有效的载体。然而，这种效率的代价是载体编码能力的一半损失，ScAAV可用于小蛋白编码基因(至多约55kd)和任何目前可用的基于RNA的疗法。

假型载体可用于本文，其中一种AAV的衣壳被异源衣壳蛋白替代。例如，利用如本文所描述的AAVhu71/74、AAVhu79、AAVhu80、AAVhu83、AAVhu74/71、AAVhu77、AAVhu78/88、AAVhu70、AAVhu72、AAVhu75、AAVhu76、AAVhu81、AAVhu82、AAVhu84、AAVhu86、AAVhu87、AAVhu88/78、AAVhu69、AAVrh75、AAVrh76、AAVrh77、AAVrh78、AAVrh79、AAVrh81、AAVrh89、AAVrh82、AAVrh83、AAVrh84、AAVrh85、AAVrh87或AAVhu73衣壳的AAV载体具有AAV2 ITR。参见，Mussolini等人。除非另外规定，否则本文所述的AAV ITR和其它所选AAV成分可个别地选自任何AAV血清型，包含但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或其它已知和未知的AAV血清型。在一个理想的实施例中，使用AAV血清型2的ITR。然而，可选择来自其它合适血清型的ITR。这些ITR或其它AAV成分可以使用本领域技术人员可用的技术从AAV血清型中容易地分离。此类AAV可以从学术、商业或公共来源分离或获得(例如，维吉尼亚州马纳萨斯的美国典型培养物保藏中心(the American Type CultureCollection,Manassas,VA))。可替代地，AAV序列可以通过合成或其它适合的方式通过参考公开的序列(如在文献中或在如例如GenBank、PubMed等数据库中可获得的公开的序列)而获得。

本文所提供的rAAV包括载体基因组。载体基因组至少由如下所述的非AAV或异源核酸序列(例如，转基因)、调控序列以及5'和3'AAV反向末端重复序列(ITR)组成。这种迷你基因被包装到衣壳蛋白中并且递送到所选靶细胞或靶组织。

转基因是与转基因侧翼的载体序列异源的核酸序列，其编码所关注的多肽、蛋白质或其它产物。核酸编码序列以允许转基因在靶细胞中转录、翻译和/或表达的方式与调控组分可操作地连接。异源核酸序列(转基因)可以源自任何生物体。AAV可以包括一种或多种转基因。

如本文所用，术语“靶细胞”和“靶组织”可以指打算被受试者AAV载体转导的任何细胞或组织。所述术语可以指肌肉、肝脏、肺、气道上皮、中枢神经系统、神经元、眼睛(眼细胞)或心脏中的任何一种或多种。在一个实施例中，靶组织为肝脏。在另一个实施例中，靶组织为心脏。在另一个实施例中，靶组织为脑。在另一个实施例中，靶组织为肌肉。

如本文所用，术语“哺乳动物受试者”或“受试者”包含需要本文所述的治疗或预防方法的任何哺乳动物，尤其包含人类。需要此类治疗或预防的其它哺乳动物包含狗、猫或其它驯养动物、马、家畜、实验动物，包含非人类灵长类动物等。受试者可以是男性或女性。

如本文所使用的，术语“宿主细胞”可以指rAAV由质粒产生的包装细胞系。在替代方案中，术语“宿主细胞”可以指需要转基因表达的靶细胞。

治疗性转基因

由转基因编码的有用产物包含各种基因产物，所述基因产物替代缺陷型或有缺陷的基因，使失活或“敲除”、或“敲低”或减少以不期望的高水平表达或递送具有所期望的治疗效果的基因产物的基因的表达。在大多数实施例中，疗法将是“体细胞基因疗法”，即，将基因转移到不产生精子或卵子的人体细胞。在某些实施例中，转基因表达蛋白具有天然人序列的序列。然而，在其它实施例中，表达合成蛋白。此类蛋白质可以用于治疗人，或者在其它实施例中，被设计成用于治疗动物，包含如犬科或猫科群体等伴侣动物，或用于治疗与人群体接触的牲畜或其它动物。

合适的基因产物的实例可以包含与家族性高胆固醇血症、肌营养不良、囊性纤维化以及罕见疾或孤儿病相关的基因产物。此类罕见病的实例可以包含脊髓性肌萎缩症(SMA)、亨廷顿氏病(Huntingdon's Disease)、雷特综合征(Rett Syndrome)(例如，甲基CpG结合蛋白2(MeCP2)；UniProtKB-P51608)、肌萎缩侧索硬化症(ALS)、杜氏肌营养不良(Duchenne Type Muscular dystrophy)、弗里德里希共济失调(Friedrichs Ataxia)(例如，共济蛋白)、与2型脊髓小脑性共济失调(SCA2)/ALS相关的ATXN2；与ALS相关的TDP-43、颗粒蛋白前体(PRGN)(与非阿尔茨海默氏病的大脑变性相关，包含额颞叶痴呆(FTD)、进行性非流利性失语症(PNFA)和语义性痴呆)等等。参见例如orpha.net/consor/cgi-bin/Disease_Search_List.php；rarediseases.info.nih.gov/diseases。在一个实施例中，转基因不是人低密度脂蛋白受体(hLDLR)。在另一个实施例中，转基因不是工程化的人低密度脂蛋白受体(hLDLR)变体，如WO 2015/164778中描述的那些变体。

合适的基因的实例可以包含例如激素以及生长和分化因子，包含但不限于胰岛素、胰高血糖素、胰高血糖素样肽-1(GLP1)、生长激素(GH)、甲状旁腺激素(PTH)、生长激素释放因子(GRF)、促卵泡激素(FSH)、促黄体激素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长因子(VEGF)、血管生成素、血管抑素、粒细胞集落刺激因子(GCSF)、促红细胞产生素(EPO)(包含例如人、犬或猫epo)、结缔组织生长因子(CTGF)、神经营养因子包含例如碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、转化生长因子α超家族(包含TGFα、激活素、抑制素)中的任一种、或骨形态发生蛋白(BMP)BMP 1-15中的任一种、生长因子的调蛋白/神经调节蛋白/ARIA/neu分化因子(NDF)家族、神经生长因子(NGF)、脑源性神经营养因子(BDNF)、神经营养因子NT-3和NT-4/5、睫状神经营养因子(CNTF)、神经胶质细胞系源性神经营养因子(GDNF)、神经秩蛋白、集聚蛋白中的任一种、信号素/脑衰蛋白、纺锤蛋白-1和纺锤蛋白-2、肝细胞生长因子(HGF)、肝配蛋白、头蛋白、音猬因子和酪氨酸羟化酶的家族中的任一种。

其它有用的转基因产物包含调节免疫系统的蛋白质，包含但不限于细胞因子和淋巴因子，如血小板生成素(TPO)、白细胞介素(IL)IL-1到IL-36(包含例如人白细胞介素IL-1、IL-1α、IL-1β、IL-2、IL-3、IL-4、IL-6、IL-8、IL-12、IL-11、IL-12、IL-13、IL-18、IL-31、IL-35)、单核细胞趋化蛋白、白血病抑制因子、粒细胞-巨噬细胞集落刺激因子、Fas配体、肿瘤坏死因子α和β、干扰素α、β和γ、干细胞因子、flk-2/flt3配体。由免疫系统产生的基因产物也可用于本发明。这些包含但不限于免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合T细胞受体、单链T细胞受体、MHC I类和II类分子以及工程化免疫球蛋白和MHC分子。例如，在某些实施例中，可以将rAAV抗体设计成递送犬或猫抗体，例如抗IgE、抗IL31、抗IL33、抗CD20、抗NGF、抗GnRH。有用的基因产物还包含补体调控蛋白，如补体调控蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2、CD59和C1酯酶抑制剂(C1-INH)。

仍其它有用的基因产物包含用于激素、生长因子、细胞因子、淋巴因子、调控蛋白和免疫系统蛋白的受体中的任一种。本发明涵盖用于胆固醇调控和/或脂质调节的受体，包含低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体和清除剂受体。本发明还涵盖基因产物，如类固醇激素受体超家族的成员，包含糖皮质激素受体和雌激素受体、维生素D受体和其它核受体。另外，有用的基因产物包含转录因子，如jun、fos、max、mad、血清响应因子(SRF)、AP-1、AP2、myb、MyoD和肌生成素、含ETS盒的蛋白质、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT盒结合蛋白、干扰素调节因子(IRF-1)、威尔姆斯肿瘤蛋白(Wilms tumor protein)、ETS结合蛋白、STAT、GATA盒结合蛋白(例如，GATA-3)和带翼螺旋蛋白的叉头家族。

其它有用的基因产物包含羟甲基胆素合成酶(HMBS)、氨基甲酰合成酶I、鸟氨酸转氨甲酰酶(OTC)、精氨酸琥珀酸合成酶、用于治疗精氨琥珀酸裂解酶缺乏症的精氨琥珀酸裂解酶(ASL)、精氨酸酶、延胡索酰乙酰乙酸水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、恒河猴甲胎蛋白(AFP)、绒毛膜促性腺激素(CG)、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β合酶、支链酮酸脱羧酶、白蛋白、异戊酰辅酶A脱氢酶、丙酰辅酶A羧化酶、甲基丙二酰辅酶A变位酶、戊二酰辅酶A脱氢酶、胰岛素、β-葡糖苷酶、丙酮酸羧酸盐、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H蛋白、T蛋白、囊性纤维化跨膜调节子(CFTR)序列和肌营养不良蛋白基因产物[例如，迷你或微小肌营养不良蛋白]。仍其它有用的基因产物包含如可以用于酶替代疗法的酶，所述酶替代疗法可用于由于酶活性不足而导致的多种病状。例如，可以将含有甘露糖-6-磷酸的酶用于溶酶体贮积病的疗法中(例如，合适的基因包含编码β-葡糖醛酸酶(GUSB)的基因)。在另一实例中，基因产物为泛素蛋白质连接酶E3A(UBE3A)。仍适用的基因产物包含UDP葡萄糖醛酸基转移酶家族1成员A1(UGT1A1)。

在某些实施例中，可以在基因编辑系统中使用rAAV，所述系统可以涉及一种rAAV或多种rAAV原液的共同施用。例如，rAAV可以被工程化以递送SpCas9、SaCas9、ARCUS、Cpf1(也称为Cas12a)、CjCas9和其它合适的基因编辑构建体。

仍其它有用的基因产物包含用于治疗血友病的基因产物，所述血友病包含血友病B(包含因子IX)和血友病A(包含因子VIII及其变体，如异二聚体和B缺失结构域的轻链和重链；美国专利第6,200,560号和美国专利第6,221,349号)。在一些实施例中，迷你基因包括因子VIII重链的前57个碱基对，所述重链编码10个氨基酸信号序列以及人生长激素(hGH)聚腺苷酸化序列。在替代性实施例中，迷你基因进一步包括A1和A2结构域以及来自B结构域的N端的5个氨基酸和/或B结构域的C端的85个氨基酸以及A3、C1和C2结构域。在又其它实施例中，在单个迷你基因中提供了对因子VIII重链和轻链进行编码的核酸，所述单个迷你基因由对B结构域的14个氨基酸进行编码的42个核酸分开[美国专利第6,200,560号]。

其它有用的基因产物包含非天然存在的多肽，如具有含有插入、缺失或氨基酸取代的非天然存在的氨基酸序列的嵌合或杂合多肽。例如，单链工程化的免疫球蛋白可能在某些免疫受损的患者中有用。其它类型的非天然存在的基因序列包含反义分子和催化核酸，如核酶，其可以用于减少靶标的过度表达。

减少和/或调节基因表达对于治疗以细胞过度增殖为特征的过度增殖性病状(如癌症和牛皮癣)是特别期望的。靶多肽包含与正常细胞相比在过度增殖性细胞中专门产生或以更高水平产生的那些多肽。靶抗原包含由癌基因如myb、myc、fyn和易位基因bcr/abl、ras、src、P53、neu、trk和EGRF编码的多肽。除作为靶抗原的癌基因产物之外，用于抗癌治疗和保护方案的靶多肽包含由B细胞淋巴瘤产生的抗体的可变区和T细胞淋巴瘤的T细胞受体的可变区，在一些实施例中，所述可变区还被用作自身免疫疾病的靶抗原。其它肿瘤相关多肽也可以用作靶多肽，如在肿瘤细胞中以较高水平存在的多肽，包含由单克隆抗体17-1A识别的多肽和叶酸结合多肽。

其它合适的治疗性多肽和蛋白质包含可以用于通过为针对与自身免疫相关的靶标赋予广泛基础的保护性免疫应答而治疗患有自身免疫性疾病和病症的个体的多肽和蛋白质，所述靶标包含细胞受体和产生“自身”定向抗体的细胞。T细胞介导的自身免疫性疾病包含类风湿关节炎(RA)、多发性硬化症(MS)、干燥综合征(

可以通过本文所提供的用于治疗例如肝脏适应症的rAAV递送的另外的说明性基因包含但不限于：与糖原贮积病或1A型缺乏症(GSD1)相关的葡萄糖-6-磷酸酶；与PEPCK缺乏症相关的磷酸烯醇丙酮酸羧激酶(PEPCK)；细胞周期蛋白依赖性激酶样5(CDKL5)，其也被称为与癫痫发作和严重的神经发育障碍相关的丝氨酸/苏氨酸激酶9(STK9)；与半乳糖血症相关的半乳糖-1磷酸尿嘧啶转移酶；与苯丙酮尿症(PKU)相关的苯丙氨酸羟化酶(PAH)；与原发性高草酸尿症1型相关的基因产物，包含羟基酸氧化酶1(GO/HAO1)和AGXT，与枫糖尿病相关的支链α-酮酸脱氢酶；包含BCKDH、BCKDH-E2、BAKDH-E1a和BAKDH-E1b；与1型酪氨酸血症相关的延胡索酰乙酰乙酸水解酶；与甲基丙二酸血症相关的甲基丙二酰辅酶A变位酶；与中链乙酰辅酶A缺乏症相关的中链酰基辅酶A脱氢酶；与鸟氨酸转氨甲酰酶缺乏症相关的鸟氨酸转氨甲酰酶(OTC)；与瓜氨酸血症相关的精氨酸琥珀酸合成酶(ASS1)；卵磷脂胆固醇酰基转移酶(LCAT)缺乏症；甲基丙二酸血症(MMA)；与尼曼-皮克病(Niemann-Pick disease)(C1型)相关的NPC1；丙酸血症(PA)；与转甲状腺素蛋白(TTR)相关的遗传性淀粉样变性相关的TTR；与家族性高胆固醇血症(FH)相关的低密度脂蛋白受体(LDLR)蛋白，LDLR变体，如WO2015/164778中描述的那些变体；PCSK9；与痴呆相关的ApoE和ApoC蛋白；与克里格勒-纳贾尔病(Crigler-Najjar disease)相关的UDP-葡萄糖醛糖基转移酶；与严重联合免疫缺陷病相关的腺苷脱氨酶；与痛风和莱施-奈恩综合征(Lesch-Nyan syndrome)相关的次黄嘌呤鸟嘌呤磷酸核糖基转移酶；与生物素酶缺乏症相关的生物素酶；与法布里病(Fabry disease)相关的α-半乳糖苷酶A(α-Gal A)；与GM1神经节苷脂病相关的β-半乳糖苷酶(GLB1)；与威尔逊氏病(Wilson's Disease)相关的ATP7B；与戈谢病(Gaucher disease)2和3型相关的β-葡糖脑苷脂酶；与泽尔韦格氏综合征(Zellweger syndrome)相关的过氧化物酶体膜蛋白70kDa；与变质性脑白质营养不良相关的芳基硫酸酯酶A(ARSA)；与克拉伯病(Krabbedisease)相关的半乳糖脑苷脂酶(GALC)；与庞贝病(Pompe disease)相关的α-葡糖苷酶(GAA)；与尼曼-皮克病A型相关的鞘磷脂酶(SMPD1)基因；与成人II型瓜氨酸血症(CTLN2)相关的精氨琥珀酸合酶；与脲循环病症相关的氨基甲酰磷酸合酶1(CPS1)；与脊髓性肌萎缩症相关的存活运动神经元(SMN)蛋白；与法伯脂肪肉芽肿病(Farber lipogranulomatosis)相关的神经酰胺酶；与GM2神经节苷脂病和泰伊-萨克斯二氏病(Tay-Sachs)和山霍夫氏病(Sandhoff disease)相关的b-己糖胺酶；与天冬氨酰葡糖尿症相关的天冬氨酰葡糖胺酶；与岩藻糖苷贮积症相关的a岩藻糖苷酶；与α甘露糖苷贮积症相关的α-甘露糖苷酶；与急性间歇性卟啉症(AIP)相关的胆色素原脱氨酶；用于治疗α-1抗胰蛋白酶缺乏症(肺气肿)的α-1抗胰蛋白酶；用于治疗因地中海贫血或肾衰竭引起的贫血的促红细胞生成素；用于治疗缺血性疾病的血管内皮生长因子、血管生成素-1和成纤维细胞生长因子；用于治疗如例如在动脉粥样硬化、血栓形成或栓塞中所看见的阻塞的血管的血栓调节蛋白和组织因子途径抑制剂；用于治疗帕金森氏病(Parkinson's disease)的芳香族氨基酸脱羧酶(AADC)和酪氨酸羟化酶(TH)；与受磷蛋白、肌浆(内质)网腺苷三磷酸酶-2(SERCA2)呈反义或为其突变体形式的β肾上腺素能受体；用于治疗充血性心力衰竭的心脏腺苷酸环化酶；用于治疗各种癌症的肿瘤抑制基因，如p53；用于治疗炎症和免疫病症以及癌症的细胞因子，如各种白细胞介素之一；用于治疗肌营养不良的肌营养不良蛋白或迷你肌营养不良蛋白以及肌萎缩相关蛋白或迷你肌萎缩相关蛋白；以及用于治疗糖尿病的胰岛素或GLP-1。

另外的所关注的基因和疾病包含例如肌张力异常蛋白基因相关的疾病，如遗传性感觉和自主神经病VI型(DST基因编码肌张力异常蛋白)；由于蛋白质的大小(约7570aa)可能需要双重AAV载体；SCN9A相关疾病，其中功能突变体的丧失导致无法感觉疼痛，并且功能突变体的获得引起疼痛病状，如红斑性肢痛症。由于NEFL基因(神经丝轻链)发生突变，另一种病状是腓骨肌萎缩症(CMT)1F和2E型，其以具有可变临床和电生理表达的进行性周围运动和感觉神经病为特征。与CMT相关的其它基因产物包含线粒体融合蛋白2(MFN2)。

在某些实施例中，本文所描述的rAAV可以用于治疗黏多糖贮积症(MPS)病症。这种rAAV可以含有携带对用于治疗MPS I(贺勒、贺勒-施艾氏和施艾氏综合征(Hurler,Hurler-Scheie and Scheie syndromes))的α-L-艾杜糖苷酸酶(IDUA)进行编码的核酸序列；对用于治疗MPS II(亨特氏综合征(Hunter syndrome))的艾杜糖醛酸-2-硫酸酯酶(IDS)进行编码的核酸序列；对用于治疗MPSIII A、B、C和D(沙费利波综合征(Sanfilippo syndrome))的磺酰胺酶(SGSH)进行编码的核酸序列；对用于治疗MPS IV A和B(莫基奥综合征(Morquiosyndrome))的N-乙酰半乳糖胺-6-硫酸硫酸酯酶(GALNS)进行编码的核酸序列；对用于治疗MPS VI(马罗托-拉米氏综合征(Maroteaux-Lamy syndrome))的芳基硫酸酯酶B(ARSB)进行编码的核酸序列；对用于治疗MPSI IX(透明质酸酶缺乏症)的透明质酸酶进行编码的核酸序列；以及对用于治疗MPS VII(斯赖综合征(Sly syndrome))的β-葡糖醛酸苷酶进行编码的核酸序列。

在一些实施例中，通过向患有癌症的受试者施用含有rAAV载体的rAAV，包括对与癌症相关的基因产物(例如，肿瘤抑制因子)进行编码的核酸的rAAV载体可以用于治疗癌症。在一些实施例中，通过向患有癌症的受试者施用含有rAAV载体的rAAV，包括对抑制与癌症相关的基因产物(例如，致癌基因)的表达的小干扰核酸(例如，shRNA、miRNA)进行编码的核酸的rAAV载体可以用于治疗癌症。在一些实施例中，包括对与癌症相关的基因产物(或抑制与癌症相关的基因表达的功能性RNA)进行编码的核酸的rAAV载体可以用于研究目的，例如研究癌症或鉴定治疗癌症的治疗剂。以下是已知与癌症的发展相关的示例性基因(例如，癌基因和肿瘤抑制因子)的非限制性列表：AARS、ABCB1、ABCC4、ABI2、ABL1、ABL2、ACK1、ACP2、ACY1、ADSL、AK1、AKR1C2、AKT1、ALB、ANPEP、ANXA5、ANXA7、AP2M1、APC、ARHGAP5、ARHGEF5、ARID4A、ASNS、ATF4、ATM、ATP5B、ATP5O、AXL、BARD1、BAX、BCL2、BHLHB2、BLMH、BRAF、BRCA1、BRCA2、BTK、CANX、CAP1、CAPN1、CAPNS1、CAV1、CBFB、CBLB、CCL2、CCND1、CCND2、CCND3、CCNE1、CCT5、CCYR61、CD24、CD44、CD59、CDC20、CDC25、CDC25A、CDC25B、CDC2L5、CDK10、CDK4、CDK5、CDK9、CDKL1、CDKN1A、CDKN1B、CDKN1C、CDKN2A、CDKN2B、CDKN2D、CEBPG、CENPC1、CGRRF1、CHAF1A、CIB1、CKMT1、CLK1、CLK2、CLK3、CLNS1A、CLTC、COL1A1、COL6A3、COX6C、COX7A2、CRAT、CRHR1、CSF1R、CSK、CSNK1G2、CTNNA1、CTNNB1、CTPS、CTSC、CTSD、CUL1、CYR61、DCC、DCN、DDX10、DEK、DHCR7、DHRS2、DHX8、DLG3、DVL1、DVL3、E2F1、E2F3、E2F5、EGFR、EGR1、EIF5、EPHA2、ERBB2、ERBB3、ERBB4、ERCC3、ETV1、ETV3、ETV6、F2R、FASTK、FBN1、FBN2、FES、FGFR1、FGR、FKBP8、FN1、FOS、FOSL1、FOSL2、FOXG1A、FOXO1A、FRAP1、FRZB、FTL、FZD2、FZD5、FZD9、G22P1、GAS6、GCN5L2、GDF15、GNA13、GNAS、GNB2、GNB2L1、GPR39、GRB2、GSK3A、GSPT1、GTF2I、HDAC1、HDGF、HMMR、HPRT1、HRB、HSPA4、HSPA5、HSPA8、HSPB1、HSPH1、HYAL1、HYOU1、ICAM1、ID1、ID2、IDUA、IER3、IFITM1、IGF1R、IGF2R、IGFBP3、IGFBP4、IGFBP5、IL1B、ILK、ING1、IRF3、ITGA3、ITGA6、ITGB4、JAK1、JARID1A、JUN、JUNB、JUND、K-ALPHA-1、KIT、KITLG、KLK10、KPNA2、KRAS2、KRT18、KRT2A、KRT9、LAMB1、LAMP2、LCK、LCN2、LEP、LITAF、LRPAP1、LTF、LYN、LZTR1、MADH1、MAP2K2、MAP3K8、MAPK12、MAPK13、MAPKAPK3、MAPRE1、MARS、MAS1、MCC、MCM2、MCM4、MDM2、MDM4、MET、MGST1、MICB、MLLT3、MME、MMP1、MMP14、MMP17、MMP2、MNDA、MSH2、MSH6、MT3、MYB、MYBL1、MYBL2、MYC、MYCL1、MYCN、MYD88、MYL9、MYLK、NEO1、NF1、NF2、NFKB1、NFKB2、NFSF7、NID、NINE、NMBR、NME1、NME2、NME3、NOTCH1、NOTCH2、NOTCH4、NPM1、NQO1、NR1D1、NR2F1、NR2F6、NRAS、NRG1、NSEP1、OSM、PA2G4、PABPC1、PCNA、PCTK1、PCTK2、PCTK3、PDGFA、PDGFB、PDGFRA、PDPK1、PEA15、PFDN4、PFDN5、PGAM1、PHB、PIK3CA、PIK3CB、PIK3CG、PIM1、PKM2、PKMYT1、PLK2、PPARD、PPARG、PPIH、PPP1CA、PPP2R5A、PRDX2、PRDX4、PRKAR1A、PRKCBP1、PRNP、PRSS15、PSMA1、PTCH、PTEN、PTGS1、PTMA、PTN、PTPRN、RAB5A、RAC1、RAD50、RAF1、RALBP1、RAP1A、RARA、RARB、RASGRF1、RB1、RBBP4、RBL2、REA、REL、RELA、RELB、RET、RFC2、RGS19、RHOA、RHOB、RHOC、RHOD、RIPK1、RPN2、RPS6 KB1、RRM1、SARS、SELENBP1、SEMA3C、SEMA4D、SEPP1、SERPINH1、SFN、SFPQ、SFRS7、SHB、SHH、SIAH2、SIVA、SIVA TP53、SKI、SKIL、SLC16A1、SLC1A4、SLC20A1、SMO、鞘磷脂磷酸二酯酶1(SMPD1)、SNAI2、SND1、SNRPB2、SOCS1、SOCS3、SOD1、SORT1、SPINT2、SPRY2、SRC、SRPX、STAT1、STAT2、STAT3、STAT5B、STC1、TAF1、TBL3、TBRG4、TCF1、TCF7L2、TFAP2C、TFDP1、TFDP2、TGFA、TGFB1、TGFBI、TGFBR2、TGFBR3、THBS1、TIE、TIMP1、TIMP3、TJP1、TK1、TLE1、TNF、TNFRSF10A、TNFRSF10B、TNFRSF1A、TNFRSF1B、TNFRSF6、TNFSF7、TNK1、TOB1、TP53、TP53BP2、TP5313、TP73、TPBG、TPT1、TRADD、TRAM1、TRRAP、TSG101、TUFM、TXNRD1、TYRO3、UBC、UBE2L6、UCHL1、USP7、VDAC1、VEGF、VHL、VIL2、WEE1、WNT1、WNT2、WNT2B、WNT3、WNT5A、WT1、XRCC1、YES1、YWHAB、YWHAZ、ZAP70和ZNF9。

rAAV载体可以包括对调节细胞凋亡的蛋白质或功能性RNA进行编码的作为转基因的核酸。以下是与细胞凋亡相关的基因的非限制性列表，并且对这些基因的产物及其同源物进行编码的以及对抑制这些基因及其同源物的表达的小干扰核酸(例如，shRNA、miRNA)进行编码的核酸在本发明的某些实施例中用作转基因：RPS27A、ABL1、AKT1、APAF1、BAD、BAG1、BAG3、BAG4、BAK1、BAX、BCL10、BCL2、BCL2A1、BCL2L1、BCL2L10、BCL2L11、BCL2L12、BCL2L13、BCL2L2、BCLAF1、BFAR、BID、BIK、NAIP、BIRC2、BIRC3、XIAP、BIRC5、BIRC6、BIRC7、BIRC8、BNIP1、BNIP2、BNIP3、BNIP3L、BOK、BRAF、CARD10、CARD11、NLRC4、CARD14、NOD2、NOD1、CARD6、CARDS、CARDS、CASP1、CASP10、CASP14、CASP2、CASP3、CASP4、CASP5、CASP6、CASP7、CASP8、CASP9、CFLAR、CIDEA、CIDEB、CRADD、DAPK1、DAPK2、DFFA、DFFB、FADD、GADD45A、GDNF、HRK、IGF1R、LTA、LTBR、MCL1、NOL3、PYCARD、RIPK1、RIPK2、TNF、TNFRSF10A、TNFRSF10B、TNFRSF10C、TNFRSF10D、TNFRSF11B、TNFRSF12A、TNFRSF14、TNFRSF19、TNFRSF1A、TNFRSF1B、TNFRSF21、TNFRSF25、CD40、FAS、TNFRSF6B、CD27、TNFRSF9、TNFSF10、TNFSF14、TNFSF18、CD40LG、FASLG、CD70、TNFSF8、TNFSF9、TP53、TP53BP2、TP73、TP63、TRADD、TRAF1、TRAF2、TRAF3、TRAF4和TRAF5。

有用的转基因产物还包含miRNA。miRNA和其它小干扰核酸通过靶信使RNA(mRNA)的靶RNA转录物裂解/降解或转译抑制来调节基因表达。miRNA是天然表达的，通常作为最终的19-25种非转译的RNA产物。miRNA通过与靶mRNA的3'非转译区(UTR)的序列特异性相互作用展现出其活性。这些内源表达的miRNA形成发夹前体，所述发夹前体随后被加工成miRNA双链体，并且被进一步加工成“成熟的”单链miRNA分子。这种成熟的miRNA引导多蛋白复合物miRISC，所述多蛋白复合物基于与成熟的miRNA的互补性来鉴定靶mRNA的靶位点，例如在3'UTR区中。

在方法的某些实施例中，以下miRNA基因和其同源物的非限制性列表可用作转基因或由转基因编码的小干扰核酸(例如，miRNA海绵体、反义寡核苷酸、TuD RNA)的靶标：hsa-let-7a、hsa-let-7a*、hsa-let-7b、hsa-let-7b*、hsa-let-7c、hsa-let-7c*、hsa-let-7d、hsa-let-7d*、hsa-let-7e、hsa-let-7e*、hsa-let-7f、hsa-let-7f-1*、hsa-let-7f-2*、hsa-let-7g、hsa-let-7g*、hsa-let-71、hsa-let-71*、hsa-miR-1、hsa-miR-100、hsa-miR-100*、hsa-miR-101、hsa-miR-101*、hsa-miR-103、hsa-miR-105、hsa-miR-105*、hsa-miR-106a、hsa-miR-106a*、hsa-miR-106b、hsa-miR-106b*、hsa-miR-107、hsa-miR-10a、hsa-miR-10a*、hsa-miR-10b、hsa-miR-10b*、hsa-miR-1178、hsa-miR-1179、hsa-miR-1180、hsa-miR-1181、hsa-miR-1182、hsa-miR-1183、hsa-miR-1184、hsa-miR-1185、hsa-miR-1197、hsa-miR-1200、hsa-miR-1201、hsa-miR-1202、hsa-miR-1203、hsa-miR-1204、hsa-miR-1205、hsa-miR-1206、hsa-miR-1207-3p、hsa-miR-1207-5p、hsa-miR-1208、hsa-miR-122、hsa-miR-122*、hsa-miR-1224-3p、hsa-miR-1224-5p、hsa-miR-1225-3p、hsa-miR-1225-5p、hsa-miR-1226、hsa-miR-1226*、hsa-miR-1227、hsa-miR-1228、hsa-miR-1228*、hsa-miR-1229、hsa-miR-1231、hsa-miR-1233、hsa-miR-1234、hsa-miR-1236、hsa-miR-1237、hsa-miR-1238、hsa-miR-124、hsa-miR-124*、hsa-miR-1243、hsa-miR-1244、hsa-miR-1245、hsa-miR-1246、hsa-miR-1247、hsa-miR-1248、hsa-miR-1249、hsa-miR-1250、hsa-miR-1251、hsa-miR-1252、hsa-miR-1253、hsa-miR-1254、hsa-miR-1255a、hsa-miR-1255b、hsa-miR-1256、hsa-miR-1257、hsa-miR-1258、hsa-miR-1259、hsa-miR-125a-3p、hsa-miR-125a-5p、hsa-miR-125b、hsa-miR-125b-1*、hsa-miR-125b-2*、hsa-miR-126、hsa-miR-126*、hsa-miR-1260、hsa-miR-1261、hsa-miR-1262、hsa-miR-1263、hsa-miR-1264、hsa-miR-1265、hsa-miR-1266、hsa-miR-1267、hsa-miR-1268、hsa-miR-1269、hsa-miR-1270、hsa-miR-1271、hsa-miR-1272、hsa-miR-1273、hsa-miR-127-3p、hsa-miR-1274a、hsa-miR-1274b、hsa-miR-1275、hsa-miR-127-5p、hsa-miR-1276、hsa-miR-1277、hsa-miR-1278、hsa-miR-1279、hsa-miR-128、hsa-miR-1280、hsa-miR-1281、hsa-miR-1282、hsa-miR-1283、hsa-miR-1284、hsa-miR-1285、hsa-miR-1286、hsa-miR-1287、hsa-miR-1288、hsa-miR-1289、hsa-miR-129*、hsa-miR-1290、hsa-miR-1291、hsa-miR-1292、hsa-miR-1293、hsa-miR-129-3p、hsa-miR-1294、hsa-miR-1295、hsa-miR-129-5p、hsa-miR-1296、hsa-miR-1297、hsa-miR-1298、hsa-miR-1299、hsa-miR-1300、hsa-miR-1301、hsa-miR-1302、hsa-miR-1303、hsa-miR-1304、hsa-miR-1305、hsa-miR-1306、hsa-miR-1307、hsa-miR-1308、hsa-miR-130a、hsa-miR-130a*、hsa-miR-130b、hsa-miR-130b*、hsa-miR-132、hsa-miR-132*、hsa-miR-1321、hsa-miR-1322、hsa-miR-1323、hsa-miR-1324、hsa-miR-133a、hsa-miR-133b、hsa-miR-134、hsa-miR-135a、hsa-miR-135a*、hsa-miR-135b、hsa-miR-135b*、hsa-miR-136、hsa-miR-136*、hsa-miR-137、hsa-miR-138、hsa-miR-138-1*、hsa-miR-138-2*、hsa-miR-139-3p、hsa-miR-139-5p、hsa-miR-140-3p、hsa-miR-140-5p、hsa-miR-141、hsa-miR-141*、hsa-miR-142-3p、hsa-miR-142-5p、hsa-miR-143、hsa-miR-143*、hsa-miR-144、hsa-miR-144*、hsa-miR-145、hsa-miR-145*、hsa-miR-146a、hsa-miR-146a*、hsa-miR-146b-3p、hsa-miR-146b-5p、hsa-miR-147、hsa-miR-147b、hsa-miR-148a、hsa-miR-148a*、hsa-miR-148b、hsa-miR-148b*、hsa-miR-149、hsa-miR-149*、hsa-miR-150、hsa-miR-150*、hsa-miR-151-3p、hsa-miR-151-5p、hsa-miR-152、hsa-miR-153、hsa-miR-154、hsa-miR-154*、hsa-miR-155、hsa-miR-155*、hsa-miR-15a、hsa-miR-15a*、hsa-miR-15b、hsa-miR-15b*、hsa-miR-16、hsa-miR-16-1*、hsa-miR-16-2*、hsa-miR-17、hsa-miR-17*、hsa-miR-181a、hsa-miR-181a*、hsa-miR-181a-2*、hsa-miR-181b、hsa-miR-181c、hsa-miR-181c*、hsa-miR-181d、hsa-miR-182、hsa-miR-182*、hsa-miR-1825、hsa-miR-1826、hsa-miR-1827、hsa-miR-183、hsa-miR-183*、hsa-miR-184、hsa-miR-185、hsa-miR-185*、hsa-miR-186、hsa-miR-186*、hsa-miR-187、hsa-miR-187*、hsa-miR-188-3p、hsa-miR-188-5p、hsa-miR-18a、hsa-miR-18a*、hsa-miR-18b、hsa-miR-18b*、hsa-miR-190、hsa-miR-190b、hsa-miR-191、hsa-miR-191*、hsa-miR-192、hsa-miR-192*、hsa-miR-193a-3p、hsa-miR-193a-5p、hsa-miR-193b、hsa-miR-193b*、hsa-miR-194、hsa-miR-194*、hsa-miR-195、hsa-miR-195*、hsa-miR-196a、hsa-miR-196a*、hsa-miR-196b、hsa-miR-197、hsa-miR-198、hsa-miR-199a-3p、hsa-miR-199a-5p、hsa-miR-199b-5p、hsa-miR-19a、hsa-miR-19a*、hsa-miR-19b、hsa-miR-19b-1*、hsa-miR-19b-2*、hsa-miR-200a、hsa-miR-200a*、hsa-miR-200b、hsa-miR-200b*、hsa-miR-200c、hsa-miR-200c*、hsa-miR-202、hsa-miR-202*、hsa-miR-203、hsa-miR-204、hsa-miR-205、hsa-miR-206、hsa-miR-208a、hsa-miR-208b、hsa-miR-20a、hsa-miR-20a*、hsa-miR-20b、hsa-miR-20b*、hsa-miR-21、hsa-miR-21*、hsa-miR-210、hsa-miR-211、hsa-miR-212、hsa-miR-214、hsa-miR-214*、hsa-miR-215、hsa-miR-216a、hsa-miR-216b、hsa-miR-217、hsa-miR-218、hsa-miR-218-1*、hsa-miR-218-2*、hsa-miR-219-1-3p、hsa-miR-219-2-3p、hsa-miR-219-5p、hsa-miR-22、hsa-miR-22*、hsa-miR-220a、hsa-miR-220b、hsa-miR-220c、hsa-miR-221、hsa-miR-221*、hsa-miR-222、hsa-miR-222*、hsa-miR-223、hsa-miR-223*、hsa-miR-224、hsa-miR-23a、hsa-miR-23a*、hsa-miR-23b、hsa-miR-23b*、hsa-miR-24、hsa-miR-24-1*、hsa-miR-24-2*、hsa-miR-25、hsa-miR-25*、hsa-miR-26a、hsa-miR-26a-1*、hsa-miR-26a-2*、hsa-miR-26b、hsa-miR-26b*、hsa-miR-27a、hsa-miR-27a*、hsa-miR-27b、hsa-miR-27b*、hsa-miR-28-3p、hsa-miR-28-5p、hsa-miR-296-3p、hsa-miR-296-5p、hsa-miR-297、hsa-miR-298、hsa-miR-299-3p、hsa-miR-299-5p、hsa-miR-29a、hsa-miR-29a*、hsa-miR-29b、hsa-miR-296-1*、hsa-miR-296-2*、hsa-miR-29c、hsa-miR-29c*、hsa-miR-300、hsa-miR-301a、hsa-miR-301b、hsa-miR-302a、hsa-miR-302a*、hsa-miR-302b、hsa-miR-302b*、hsa-miR-302c、hsa-miR-302c*、hsa-miR-302d、hsa-miR-302d*、hsa-miR-302e、hsa-miR-302f、hsa-miR-30a、hsa-miR-30a*、hsa-miR-30b、hsa-miR-30b*、hsa-miR-30c、hsa-miR-30c-1*、hsa-miR-30c-2*、hsa-miR-30d、hsa-miR-30d*、hsa-miR-30e、hsa-miR-30e*、hsa-miR-31、hsa-miR-31*、hsa-miR-32、hsa-miR-32*、hsa-miR-320a、hsa-miR-320b、hsa-miR-320c、hsa-miR-320d、hsa-miR-323-3p、hsa-miR-323-5p、hsa-miR-324-3p、hsa-miR-324-5p、hsa-miR-325、hsa-miR-326、hsa-miR-328、hsa-miR-329、hsa-miR-330-3p、hsa-miR-330-5p、hsa-miR-331-3p、hsa-miR-331-5p、hsa-miR-335、hsa-miR-335*、hsa-miR-337-3p、hsa-miR-337-5p、hsa-miR-338-3p、hsa-miR-338-5p、hsa-miR-339-3p、hsa-miR-339-5p、hsa-miR-33a、hsa-miR-33a*、hsa-miR-33b、hsa-miR-33b*、hsa-miR-340、hsa-miR-340*、hsa-miR-342-3p、hsa-miR-342-5p、hsa-miR-345、hsa-miR-346、hsa-miR-34a、hsa-miR-34a*、hsa-miR-34b、hsa-miR-34b*、hsa-miR-34c-3p、hsa-miR-34c-5p、hsa-miR-361-3p、hsa-miR-361-5p、hsa-miR-362-3p、hsa-miR-362-5p、hsa-miR-363、hsa-miR-363*、hsa-miR-365、hsa-miR-367、hsa-miR-367*、hsa-miR-369-3p、hsa-miR-369-5p、hsa-miR-370、hsa-miR-371-3p、hsa-miR-371-5p、hsa-miR-372、hsa-miR-373、hsa-miR-373*、hsa-miR-374a、hsa-miR-374a*、hsa-miR-374b、hsa-miR-374b*、hsa-miR-375、hsa-miR-376a、hsa-miR-376a*、hsa-miR-376b、hsa-miR-376c、hsa-miR-377、hsa-miR-377*、hsa-miR-378、hsa-miR-378*、hsa-miR-379、hsa-miR-379*、hsa-miR-380、hsa-miR-380*、hsa-miR-381、hsa-miR-382、hsa-miR-383、hsa-miR-384、hsa-miR-409-3p、hsa-miR-409-5p、hsa-miR-410、hsa-miR-411、hsa-miR-411*、hsa-miR-412、hsa-miR-421、hsa-miR-422a、hsa-miR-423-3p、hsa-miR-423-5p、hsa-miR-424、hsa-miR-424*、hsa-miR-425、hsa-miR-425*、hsa-miR-429、hsa-miR-431、hsa-miR-431*、hsa-miR-432、hsa-miR-432*、hsa-miR-433、hsa-miR-448、hsa-miR-449a、hsa-miR-449b、hsa-miR-450a、hsa-miR-450b-3p、hsa-miR-450b-5p、hsa-miR-451、hsa-miR-452、hsa-miR-452*、hsa-miR-453、hsa-miR-454、hsa-miR-454*、hsa-miR-455-3p、hsa-miR-455-5p、hsa-miR-483-3p、hsa-miR-483-5p、hsa-miR-484、hsa-miR-485-3p、hsa-miR-485-5p、hsa-miR-486-3p、hsa-miR-486-5p、hsa-miR-487a、hsa-miR-487b、hsa-miR-488、hsa-miR-488*、hsa-miR-489、hsa-miR-490-3p、hsa-miR-490-5p、hsa-miR-491-3p、hsa-miR-491-5p、hsa-miR-492、hsa-miR-493、hsa-miR-493*、hsa-miR-494、hsa-miR-495、hsa-miR-496、hsa-miR-497、hsa-miR-497*、hsa-miR-498、hsa-miR-499-3p、hsa-miR-499-5p、hsa-miR-500、hsa-miR-500*、hsa-miR-501-3p、hsa-miR-501-5p、hsa-miR-502-3p、hsa-miR-502-5p、hsa-miR-503、hsa-miR-504、hsa-miR-505、hsa-miR-505*、hsa-miR-506、hsa-miR-507、hsa-miR-508-3p、hsa-miR-508-5p、hsa-miR-509-3-5p、hsa-miR-509-3p、hsa-miR-509-5p、hsa-miR-510、hsa-miR-511、hsa-miR-512-3p、hsa-miR-512-5p、hsa-miR-513a-3p、hsa-miR-513a-5p、hsa-miR-513b、hsa-miR-513c、hsa-miR-514、hsa-miR-515-3p、hsa-miR-515-5p、hsa-miR-516a-3p、hsa-miR-516a-5p、hsa-miR-516b、hsa-miR-517*、hsa-miR-517a、hsa-miR-517b、hsa-miR-517c、hsa-miR-518a-3p、hsa-miR-518a-5p、hsa-miR-518b、hsa-miR-518c、hsa-miR-518c*、hsa-miR-518d-3p、hsa-miR-518d-5p、hsa-miR-518e、hsa-miR-518e*、hsa-miR-518f、hsa-miR-518f*、hsa-miR-519a、hsa-miR-519b-3p、hsa-miR-519c-3p、hsa-miR-519d、hsa-miR-519e、hsa-miR-519e*、hsa-miR-520a-3p、hsa-miR-520a-5p、hsa-miR-520b、hsa-miR-520c-3p、hsa-miR-520d-3p、hsa-miR-520d-5p、hsa-miR-520e、hsa-miR-520f、hsa-miR-520g、hsa-miR-520h、hsa-miR-521、hsa-miR-522、hsa-miR-523、hsa-miR-524-3p、hsa-miR-524-5p、hsa-miR-525-3p、hsa-miR-525-5p、hsa-miR-526b、hsa-miR-526b*、hsa-miR-532-3p、hsa-miR-532-5p、hsa-miR-539、hsa-miR-541、hsa-miR-541*、hsa-miR-542-3p、hsa-miR-542-5p、hsa-miR-543、hsa-miR-544、hsa-miR-545、hsa-miR-545*、hsa-miR-548a-3p、hsa-miR-548a-5p、hsa-miR-548b-3p、hsa-miR-5486-5p、hsa-miR-548c-3p、hsa-miR-548c-5p、hsa-miR-548d-3p、hsa-miR-548d-5p、hsa-miR-548e、hsa-miR-548f、hsa-miR-548g、hsa-miR-548h、hsa-miR-548i、hsa-miR-548j、hsa-miR-548k、hsa-miR-5481、hsa-miR-548m、hsa-miR-548n、hsa-miR-548o、hsa-miR-548p、hsa-miR-549、hsa-miR-550、hsa-miR-550*、hsa-miR-551a、hsa-miR-551b、hsa-miR-551b*、hsa-miR-552、hsa-miR-553、hsa-miR-554、hsa-miR-555、hsa-miR-556-3p、hsa-miR-556-5p、hsa-miR-557、hsa-miR-558、hsa-miR-559、hsa-miR-561、hsa-miR-562、hsa-miR-563、hsa-miR-564、hsa-miR-566、hsa-miR-567、hsa-miR-568、hsa-miR-569、hsa-miR-570、hsa-miR-571、hsa-miR-572、hsa-miR-573、hsa-miR-574-3p、hsa-miR-574-5p、hsa-miR-575、hsa-miR-576-3p、hsa-miR-576-5p、hsa-miR-577、hsa-miR-578、hsa-miR-579、hsa-miR-580、hsa-miR-581、hsa-miR-582-3p、hsa-miR-582-5p、hsa-miR-583、hsa-miR-584、hsa-miR-585、hsa-miR-586、hsa-miR-587、hsa-miR-588、hsa-miR-589、hsa-miR-589*、hsa-miR-590-3p、hsa-miR-590-5p、hsa-miR-591、hsa-miR-592、hsa-miR-593、hsa-miR-593*、hsa-miR-595、hsa-miR-596、hsa-miR-597、hsa-miR-598、hsa-miR-599、hsa-miR-600、hsa-miR-601、hsa-miR-602、hsa-miR-603、hsa-miR-604、hsa-miR-605、hsa-miR-606、hsa-miR-607、hsa-miR-608、hsa-miR-609、hsa-miR-610、hsa-miR-611、hsa-miR-612、hsa-miR-613、hsa-miR-614、hsa-miR-615-3p、hsa-miR-615-5p、hsa-miR-616、hsa-miR-616*、hsa-miR-617、hsa-miR-618、hsa-miR-619、hsa-miR-620、hsa-miR-621、hsa-miR-622、hsa-miR-623、hsa-miR-624、hsa-miR-624*、hsa-miR-625、hsa-miR-625*、hsa-miR-626、hsa-miR-627、hsa-miR-628-3p、hsa-miR-628-5p、hsa-miR-629、hsa-miR-629*、hsa-miR-630、hsa-miR-631、hsa-miR-632、hsa-miR-633、hsa-miR-634、hsa-miR-635、hsa-miR-636、hsa-miR-637、hsa-miR-638、hsa-miR-639、hsa-miR-640、hsa-miR-641、hsa-miR-642、hsa-miR-643、hsa-miR-644、hsa-miR-645、hsa-miR-646、hsa-miR-647、hsa-miR-648、hsa-miR-649、hsa-miR-650、hsa-miR-651、hsa-miR-652、hsa-miR-653、hsa-miR-654-3p、hsa-miR-654-5p、hsa-miR-655、hsa-miR-656、hsa-miR-657、hsa-miR-658、hsa-miR-659、hsa-miR-660、hsa-miR-661、hsa-miR-662、hsa-miR-663、hsa-miR-663b、hsa-miR-664、hsa-miR-664*、hsa-miR-665、hsa-miR-668、hsa-miR-671-3p、hsa-miR-671-5p、hsa-miR-675、hsa-miR-7、hsa-miR-708、hsa-miR-708*、hsa-miR-7-1*、hsa-miR-7-2*、hsa-miR-720、hsa-miR-744、hsa-miR-744*、hsa-miR-758、hsa-miR-760、hsa-miR-765、hsa-miR-766、hsa-miR-767-3p、hsa-miR-767-5p、hsa-miR-768-3p、hsa-miR-768-5p、hsa-miR-769-3p、hsa-miR-769-5p、hsa-miR-770-5p、hsa-miR-802、hsa-miR-873、hsa-miR-874、hsa-miR-875-3p、hsa-miR-875-5p、hsa-miR-876-3p、hsa-miR-876-5p、hsa-miR-877、hsa-miR-877*、hsa-miR-885-3p、hsa-miR-885-5p、hsa-miR-886-3p、hsa-miR-886-5p、hsa-miR-887、hsa-miR-888、hsa-miR-888*、hsa-miR-889、hsa-miR-890、hsa-miR-891a、hsa-miR-891b、hsa-miR-892a、hsa-miR-892b、hsa-miR-9、hsa-miR-9*、hsa-miR-920、hsa-miR-921、hsa-miR-922、hsa-miR-923、hsa-miR-924、hsa-miR-92a、hsa-miR-92a-1*、hsa-miR-92a-2*、hsa-miR-92b、hsa-miR-92b*、hsa-miR-93、hsa-miR-93*、hsa-miR-933、hsa-miR-934、hsa-miR-935、hsa-miR-936、hsa-miR-937、hsa-miR-938、hsa-miR-939、hsa-miR-940、hsa-miR-941、hsa-miR-942、hsa-miR-943、hsa-miR-944、hsa-miR-95、hsa-miR-96、hsa-miR-96*、hsa-miR-98、hsa-miR-99a、hsa-miR-99a*、hsa-miR-99b和hsa-miR-99b*。例如，可能所关注的是靶向染色体8开放阅读框72(C9orf72)的miRNA，所述开放阅读框表达与肌萎缩侧索硬化症(ALS)相关的超氧化物歧化酶(SOD1)。

miRNA抑制其靶向的mRNA的功能，并且因此抑制由mRNA编码的多肽的表达。因此，(部分地或全部地)阻断miRNA的活性(例如，沉默miRNA)可以有效地诱导或恢复表达被抑制的多肽的表达(使多肽去抑制)。在一个实施例中，通过多种方法中的任一种抑制细胞中的miRNA活性来实现对由miRNA的mRNA靶标编码的多肽的去抑制。例如，可以通过与和miRNA互补或基本上互补的小干扰核酸(例如，反义寡核苷酸、miRNA海绵体、TuD RNA)杂交来实现阻断miRNA的活性，由此阻断miRNA与其靶mRNA的相互作用。如本文所使用的，与miRNA基本上互补的小干扰核酸是能够与miRNA杂交并阻断miRNA活性的小干扰核酸。在一些实施例中，与miRNA基本上互补的小干扰核酸是除1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个或18个碱基之外完全与miRNA互补的小干扰核酸。“miRNA抑制剂”是阻断miRNA功能、表达和/或加工的药剂。例如，这些分子包含但不限于抑制miRNA与Drosha复合物相互作用的微小RNA特异性反义分子、微小RNA海绵体、强诱饵RNA(TuD RNA)和微小RNA寡核苷酸(双链、发夹、短寡核苷酸)。

仍其它有用的转基因可以包含对赋予病原体被动免疫的免疫球蛋白进行编码的转基因。“免疫球蛋白分子”是含有共价偶联在一起并且能够与抗原特异性组合的免疫球蛋白重链和免疫球蛋白轻链的免疫活性部分的蛋白质。免疫球蛋白分子可以是任何类型(例如，IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如，IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)或子类。术语“抗体”和“免疫球蛋白”在本文中可以互换使用。

“免疫球蛋白重链”是含有免疫球蛋白的抗原结合结构域的至少一部分和免疫球蛋白重链的可变区的至少一部分或免疫球蛋白重链的恒定区的至少一部分的多肽。因此，免疫球蛋白源性重链与免疫球蛋白基因超家族的成员具有显著的氨基酸序列同源性区。例如，Fab片段中的重链是免疫球蛋白源性重链。

“免疫球蛋白轻链”是含有免疫球蛋白的抗原结合结构域的至少一部分和免疫球蛋白轻链的可变区的至少一部分或恒定区的至少一部分的多肽。因此，免疫球蛋白源性轻链与免疫球蛋白基因超家族的成员具有显著的氨基酸同源性区。

“免疫粘附素”是嵌合的抗体样分子，所述分子将结合蛋白(通常是受体、配体或细胞粘附分子)的功能结构域与免疫球蛋白恒定结构域组合，所述免疫球蛋白恒定结构域通常包含铰链和Fc区。

“片段抗原结合(Fab)片段”是与抗原结合的抗体上的区。其由重链和轻链中的每一个的一个恒定结构域和一个可变结构域构成。

基于寻求针对其进行保护的疾病的病原体(causative agent/pathogen)选择抗病原体构建体。这些病原体可以是病毒、细菌或真菌来源的，并且可以用于预防人感染人类疾病，或用于非人类哺乳动物或其它动物以预防兽医疾病。

rAAV可以包含对抗体以及具体地针对病毒病原体的中和抗体进行编码的基因。这种抗病毒抗体可以包含针对甲型流感、乙型流感和丙型流感中的一种或多种的抗流感抗体。A型病毒是最具毒性的人类病原体。与流行病相关的甲型流感的血清型包含：H1N1，其引起1918年的西班牙流感和2009年的猪流感；H2N2，其引起1957年的亚洲流感；H3N2，其引起1968年的香港流感；H5N1，其引起2004年的禽流感；H7N7；H1N2；H9N2；H7N2；H7N3；和H10N7。其它靶病原性病毒包含：沙粒病毒(包含funin、马丘波病毒(machupo)和拉沙热病毒(Lassa))、丝状病毒(包含马尔堡病毒(Marburg)和埃博拉病毒(Ebola))、汉坦病毒、小核糖核酸病毒(picornoviridae)(包含鼻病毒、艾柯病毒)、冠状病毒、副粘病毒、麻疹病毒、呼吸道合胞病毒、囊膜病毒、柯萨奇病毒、JC病毒、细小病毒B19、副流感病毒、腺病毒、呼吸道肠道病毒、来自痘病毒家族的天花病毒(variola)(大天花(天花(Smallpox))和牛痘(Vaccinia/Cowpox)以及水痘-带状疱疹病毒(伪狂犬病)。病毒性出血热是由沙粒病毒家族(拉沙热)(此家族也与淋巴细胞性脉络丛脑膜炎病毒(LCM)相关)、丝状病毒(埃博拉病毒)和汉坦病毒(普马拉病毒(puremala))的成员引起的。小核糖核酸病毒(鼻病毒的亚家族)的成员与人普通感冒相关。冠状病毒家族包含多种非人类病毒，如传染性支气管炎病毒(家禽)、猪传染性胃肠炎病毒(猪)、猪血凝素脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠道冠状病毒(猫)、犬冠状病毒(狗)。已经推定人呼吸道冠状病毒与普通感冒、非甲型、乙型或丙型肝炎以及突发性急性呼吸综合症(SARS)相关。副粘病毒家族包含副流感病毒1型、副流感病毒3型、牛副流感病毒3型、腮腺炎病毒属(腮腺炎病毒)、副流感病毒2型、副流感病毒4型、新城疫病毒(鸡)、牛瘟、麻疹病毒(包含麻疹和犬瘟热)和肺炎病毒(包含呼吸道合胞病毒(RSV)。细小病毒家族包含猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。腺病毒家族包含引起呼吸道疾病的病毒(EX、AD7、ARD、O.B.)。因此，在某些实施例中，本文所描述的rAAV载体可以被工程化以表达抗埃博拉抗体(例如，2G4、4G7、13C6)、抗流感抗体(例如，FI6、CR8033)和抗RSV抗体(例如，帕利珠单抗(palivizumab)、莫维珠单抗(motavizumab))。也可以选择针对细菌病原体的中和抗体构建体用于本发明中。在一个实施例中，中和抗体构建体针对细菌本身。在另一个实施例中，中和抗体构建体针对由细菌产生的毒素。空气传播的细菌病原体的实例包含例如脑膜炎奈瑟氏球菌(Neisseriameningitidis)(脑膜炎)、肺炎克雷伯菌(Klebsiella pneumonia)(肺炎)、铜绿假单胞菌(Pseudomonas aeruginosa)(肺炎)、伪鼻疽假单胞菌(Pseudomonas pseudomallei)(肺炎)、鼻疽假单胞菌(Pseudomonas mallei)(肺炎)、不动杆菌(肺炎)、卡他莫拉菌(Moraxella catarrhalis)、腔隙莫拉菌(Moraxella lacunata)、产碱杆菌属(Alkaligenes)、心杆菌属(Cardiobacterium)、流感嗜血杆菌(Haemophilus influenzae)(流感)、副流感嗜血杆菌(Haemophilus parainfluenzae)、百日咳博代氏杆菌(Bordetellapertussis)(百日咳)、土拉弗朗西斯菌(Francisella tularensis)(肺炎/发烧)、肺炎军团菌(Legionella pneumonia)(军团病)、鹦鹉热衣原体(Chlamydia psittaci)(肺炎)、肺炎衣原体(Chlamydia pneumoniae)(肺炎)、结核分枝杆菌(Mycobacterium tuberculosis)(肺结核(TB))、堪萨斯分枝杆菌(Mycobacterium kansasii)(TB)、鸟分枝杆菌(Mycobacterium avium)(肺炎)、星状诺卡氏菌(Nocardia asteroides)(肺炎)、炭疽杆菌(Bacillus anthracis)(炭疽)、金黄色葡萄球菌(Staphylococcus aureus)(肺炎)、酿脓链球菌(Streptococcus pyogenes)(猩红热)、肺炎链球菌(Streptococcus pneumoniae)(肺炎)、白喉棒状杆菌(Corynebacteria diphtheria)(白喉)、肺炎支原体(Mycoplasmapneumoniae)(肺炎)。

rAAV可以包含对抗体以及具体地针对细菌病原体(如炭疽的病原体，即由炭疽杆菌产生的毒素)的中和抗体进行编码的基因。已经描述了针对形成类毒素的三种肽之一的保护剂(PA)的中和抗体。其它两种多肽由致死因子(LF)和水肿因子(EF)组成。抗PA中和抗体已经被描述为有效针对炭疽进行被动地免疫。参见例如，美国专利第7,442,373号；R.Sawada-Hirai等人,《基于免疫的疫苗疗法杂志(J Immune Based Ther Vaccines)》.2004；2:5.(2004年5月12日在线)。已经描述和/或可以产生仍其它抗炭疽毒素中和抗体。类似地，针对其它细菌和/或细菌毒素的中和抗体可以用于产生如本文所描述的AAV递送性抗病原体构建体。

针对传染病的抗体可以由寄生虫或真菌引起，所述真菌包含例如曲霉菌(Aspergillus species)、伞枝犁头霉(Absidia corymbifera)、匍枝根霉(Rhixpusstolonifer)、密丛毛霉(Mucor plumbeaus)、新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasmcapsulatum)、皮炎芽生菌(Blastomyces dermatitidis)、粗球孢子菌(Coccidioides immitis)、青霉菌(Penicillium species)、干草小多孢菌(Micropolyspora faeni)、普通高温放线菌(Thermoactinomyces vulgaris)、互隔交链孢霉(Alternaria alternate)、枝孢菌(Cladosporium species)、长蠕孢属(Helminthosporium)和葡萄穗霉(Stachybotrys species)。

rAAV可以包含对抗体以及具体地针对以下疾病的致病因子的中和抗体进行编码的基因：如阿尔茨海默氏病(AD)、帕金森氏病(PD)、GBA相关的帕金森氏病(GBA-PD)、类风湿关节炎(RA)、肠易激综合症(IBS)、慢性阻塞性肺病(COPD)、癌症、肿瘤、全身性硬化症、哮喘和其它疾病。此类抗体可以是但不限于例如α-突触核蛋白、抗血管内皮生长因子(VEGF)(抗VEGF)、抗VEGFA、抗PD-1、抗PDL1、抗CTLA-4、抗TNF-α、抗IL-17、抗IL-23、抗IL-21、抗IL-6、抗IL-6受体、抗IL-5、抗IL-7、抗XII因子、抗IL-2、抗HIV、抗IgE、抗肿瘤坏死因子受体1(TNFR1)、抗notch 2/3、抗notch1、抗OX40、抗erb-b2受体酪氨酸激酶3(ErbB3)、抗ErbB2、抗β细胞成熟抗原、抗B淋巴细胞刺激剂、抗CD20、抗HER2、抗粒细胞巨噬细胞集落刺激因子、抗制瘤素M(OSM)、抗淋巴细胞活化基因3(LAG3)蛋白、抗CCL20、抗血清淀粉样蛋白P组分(SAP)、抗脯氨酰羟化酶抑制剂、抗CD38、抗糖蛋白IIb/IIIa、抗CD52、抗CD30、抗IL-1β、抗表皮生长因子受体、抗CD25、抗RANK配体、抗补体系统蛋白C5、抗CD11a、抗CD3受体、抗α-4(α4)整联蛋白、抗RSV F蛋白和抗整联蛋白α

其它合适的治疗性多肽和蛋白质包含可以用于通过为针对与自身免疫相关的靶标赋予广泛基础的保护性免疫应答而治疗患有自身免疫性疾病和病症的个体的多肽和蛋白质，所述靶标包含细胞受体和产生自身定向抗体的细胞。T细胞介导的自身免疫性疾病包含类风湿关节炎(RA)、多发性硬化症(MS)、干燥综合征、结节病、胰岛素依赖型糖尿病(IDDM)、自身免疫性甲状腺炎、反应性关节炎、强直性脊柱炎、硬皮病、多发性肌炎、皮肌炎、牛皮癣、韦格纳氏肉芽肿病、克罗恩氏病和溃疡性结肠炎。这些疾病中的每种疾病以与内源性抗原结合并引发与自身免疫性疾病相关的炎性级联的T细胞受体(TCR)为特征。

可替代地或另外，载体可以含有本发明的AAV序列和编码肽、多肽或蛋白质的转基因，所述肽、多肽或蛋白质诱导针对选定免疫原的免疫应答。例如，免疫原可以选自多种病毒科。需要针对其产生免疫反应的理想病毒科的实例包含小核糖核酸病毒科，其包含鼻病毒属，其造成约50％的普通感冒病例；肠道病毒属，其包含脊髓灰质炎病毒、柯萨奇病毒、埃可病毒和人类肠道病毒，如甲型肝炎病毒；和主要在非人类动物中引起口蹄疫的口蹄疫病毒属。在病毒的小核糖核酸病毒家族内，靶抗原包含VP1、VP2、VP3、VP4和VPG。另一病毒家族包含杯状病毒家族，所述家族涵盖诺瓦克(Norwalk)病毒群，其为流行性胃肠炎的重要病原体。另一个期望用于靶向抗原以在人类和非人类动物中诱导免疫反应的病毒家族是披膜病毒科，其包含甲病毒属，其包含辛德毕斯病毒(Sindbis viruses)、罗斯河病毒(RossRivervirus)和委内瑞拉、东方和西方马脑炎(Venezuelan,Eastern&Western Equineencephalitis)，以及风疹病毒属，包含风疹病毒。黄病毒科包含登革热、黄热病、日本脑炎、圣路易斯脑炎和蜱传脑炎病毒。其它靶抗原可以来自丙型肝炎或冠状病毒家族，其包含许多非人类病毒，如传染性支气管炎病毒(家禽)、猪传染性胃肠炎病毒(猪)、猪血凝性脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠道冠状病毒(猫)、犬冠状病毒(狗)和人类呼吸道冠状病毒，它们可能导致普通感冒和/或非-甲、乙或丙型肝炎。在冠状病毒科中，靶抗原包含E1(也称为M或基质蛋白)、E2(也称为S或纤突蛋白)、E3(也称为HE或血凝素-依尔替糖(elterose))糖蛋白(并非在所有冠状病毒中都存在)或N(核衣壳)。其它抗原可以靶向弹状病毒科，其包含水疱病毒属(例如水泡性口炎病毒)和一般狂犬病毒属(例如狂犬病)。在弹状病毒科中，合适的抗原可以来源于G蛋白或N蛋白。包含马堡病毒和埃博拉病毒等出血热病毒的丝状病毒科可能是合适的抗原来源。副粘病毒科包含副流感病毒1型、副流感病毒3型、牛副流感病毒3型、腮腺炎病毒属(腮腺炎病毒)、副流感病毒2型、副流感病毒4型、新城疫病毒(鸡)、牛瘟、麻疹病毒(其包含麻疹和犬瘟热)和肺病毒属，其包含呼吸道合胞病毒。流感病毒分类在正粘病毒科内，并且是合适的抗原来源(例如HA蛋白、N1蛋白)。布尼亚病毒科包含布尼亚病毒属(加利福尼亚脑炎、拉克罗斯(La Crosse))、白蛉病毒属(裂谷热)、汉坦病毒(普马拉病毒(puremala)是一种出血热病毒)、内罗病毒(内罗毕绵羊病)和各种未指定的布尼亚病毒。沙粒病毒科提供了抗LCM和拉沙热病毒的抗原来源。呼肠孤病毒家族包含呼肠孤病毒属、轮状病毒(其可引起儿童急性肠胃炎)、轮状病毒和科罗拉多蜱传热病毒属(cultivirus)(科罗拉多蜱传热、莱邦博病(Lebombo)(人类)、马脑病、蓝舌病)。

逆转录病毒家族包含致癌病毒亚-科，其涵盖人类和兽医疾病，如猫白血病病毒、HTLVI和HTLVII、慢病毒(其包含人类免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、马传染性贫血病毒和泡沫病毒)。在HIV与SIV之间，已描述许多合适的抗原并且可以容易地选择。合适的HIV和SIV抗原的实例包含但不限于gag、pol、Vif、Vpx、VPR、Env、Tat和Rev蛋白以及其各种片段。另外，已描述对这些抗原的多种修饰。出于此目的的合适抗原是本领域的技术人员已知的。例如，可选择编码gag、pol、Vif和Vpr、Env、Tat和Rev的序列，以及其它蛋白质。参见例如美国专利5,972,596中所描述的经修饰的gag蛋白。还参见以下描述的HIV和SIV蛋白：D.H.Barouch等人,《病毒学杂志(J.Virol.)》,75(5):2462-2467(2001年3月)以及R.R.Amara等人,《科学(Science)》,292:69-74(2001年4月6日)。这些蛋白质或其亚单位可单独递送，或经由单独载体或从单一载体组合递送。

乳多泡病毒科包含亚科多瘤病毒(BKU和JCU病毒)和乳头瘤病毒亚-科(与癌症或乳头状瘤的恶性进展相关)。腺病毒科包含引起呼吸道疾病和/或肠炎的病毒(EX、AD7、ARD、O.B.)。细小病毒家科猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。疱疹病毒科包含α疱疹病毒亚-科，其涵盖单纯疱疹病毒属(HSVI、HSVII)、水痘病毒属(假性狂犬病、水痘带状疱疹)；和亚科β疱疹病毒，其包含巨细胞病毒属(HCMV、鼠巨细胞病毒属)；和γ疱疹病毒亚-科，其包含淋巴隐病毒属、EBV(伯基特氏淋巴瘤(Burkittslymphoma))、传染性鼻气管炎、马立克氏病(Marek's disease)病毒和猴病毒属。痘病毒科包含脊痘病毒亚-科，其涵盖正痘病毒属(天花(Variola/Smallpox)和牛痘(Vaccinia/Cowpox))、副痘病毒属、禽痘病毒属、山羊痘病毒属、兔痘病毒属、猪痘病毒属和昆虫痘病毒亚-科。肝炎病毒科包含乙型肝炎病毒。一种可能是合适的抗原来源的未分类病毒是丁型肝炎病毒。其它病毒来源可包含禽传染性法氏囊病病毒和猪呼吸和生殖综合征病毒。甲病毒科包含马动脉炎病毒和各种脑炎病毒。

rAAV还可以递送编码免疫原的序列，所述免疫原可用于使人类或非人类动物免疫以抵抗其它病原体，所述病原体包含感染人类和非人类脊椎动物的细菌、真菌、寄生微生物或多细胞寄生虫，或来自癌细胞或肿瘤细胞。细菌病原体的实例包含致病性革兰氏-阳性球菌，包含肺炎双球菌；葡萄球菌；和链球菌。病原性革兰氏-阴性球菌包含脑膜炎球菌；淋球菌。致病性肠道革兰氏-阴性杆菌包含肠杆菌科(enterobacteriaceae)；假单胞菌属(pseudomonas)、不动杆菌属(acinetobacteria)和艾肯氏菌属(eikenella)；类鼻疽属(melioidosis)；沙门氏菌属(salmonella)；志贺氏菌属(shigella)；嗜血杆菌属(haemophilus)；莫拉氏菌属(moraxella)；杜克雷嗜血杆菌属(H.Ducreyi)(导致软下疳)；布鲁氏菌属(brucella)；土拉弗朗西斯菌(Franisella tularensis)(导致土拉菌病)；耶尔森氏菌属(yersinia)(巴氏杆菌属(pasteurella))；念珠状链杆菌(streptobacillusmoniliformis)和螺旋菌属(spirillum)；革兰氏阳性杆菌包含单核细胞增生李斯特菌(listeria monocytogenes)；猪红斑丹毒丝菌(erysipelothrix rhusiopathiae)；白喉棒状杆菌(Corynebacterium diphtheria)(白喉(diphtheria))；霍乱；炭疽杆菌(B.anthracis)(炭疽(anthrax))；杜诺凡病(donovanosis)(腹股沟肉芽肿)；和巴尔通体病(bartonellosis)。由致病性厌氧菌引起的疾病包含破伤风；肉毒杆菌；其它梭菌；结核；麻风；和其它分枝杆菌。致病性螺旋体病包含梅毒；密螺旋体病：雅司病(yaws)、斑点病和地方性梅毒；以及钩端螺旋体病。其它由高等致病性细菌和致病性真菌引起的感染包含放线菌病；诺卡氏菌病；隐球菌病、芽生菌病、组织胞浆菌病和球孢子菌病；念珠菌病、曲霉病和毛霉菌病；孢子丝菌病；副球孢子菌病、球孢菌病、圆环孢菌病、足菌肿和染色体病；和皮肤癣菌病。立克次体感染包含斑疹伤寒、落基山斑疹热、Q热和立克次体痘。支原体和衣原体感染的实例包含：肺炎支原体；性病淋巴肉芽肿；鹦鹉热；和围产期衣原体感染。致病性真核生物涵盖致病性原生动物和蠕虫，并且由此产生的感染包含：阿米巴病(amebiasis)；疟疾；利什曼病(leishmaniasis)；锥虫病；弓形体病；卡氏肺孢子虫(Pneumocystis carinii)；特里坎斯(Trichans)；刚地弓形虫(Toxoplasma gondii)；巴贝斯虫病(babesiosis)；贾第鞭毛虫病(giardiasis)；旋毛虫病；丝虫病；血吸虫病；线虫病；吸虫(trematodes)或吸虫(flukes)；和绦虫(cestode/tapeworm)感染。

许多这些生物体和/或由此产生的毒素已被疾病控制中心[(CDC)，美国卫生和公众服务部]鉴定为有可能用于生物攻击的药剂。例如，这些生物药剂中的一些包含炭疽芽孢杆菌(Bacillus anthracis)(炭疽)、肉毒杆菌(Clostridium botulinum)和其毒素(肉毒中毒)、鼠疫耶尔森菌(Yersinia pestis)(鼠疫)、大天花(天花)、土拉弗朗西斯菌(土拉菌病)和病毒性出血热，所有这些目前都归类为A类药剂；立克次体(Coxiella burnetti)(Q热)；布鲁氏菌种(Brucella species)(布鲁氏菌病(brucellosis))、鼻疽伯克霍尔德氏菌(Burkholderia mallei)(鼻疽病)、蓖麻(Ricinus communis)和其毒素(蓖麻毒素)、产气荚膜芽胞梭菌(Clostridium perfringens)和其毒素(ε毒素)、葡萄球菌种和其毒素(肠毒素B)，所有这些目前都归类为B类药剂；以及尼潘病毒(Nipan virus)和汉坦病毒(hantavirus)，目前被归类为C类药剂。此外，被如此分类或不同分类的其它生物体可以在未来被识别和/或用于这样的目的。将容易理解的是，本文所描述的病毒载体和其它构建体可用于从这些生物体、病毒、其毒素或其它副产物递送抗原，这将预防和/或治疗感染或与这些生物药剂有关的其它不良反应。

施用本发明的载体以递送针对T细胞可变区的免疫原引发包含CTL的免疫应答以消除那些T细胞。在类风湿性关节炎(RA)中，已经表征了与所述疾病相关的T细胞受体(TCR)的若干特定可变区。这些TCR包含V-3、V-14、V-17和Vα-17。因此，编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应，所述免疫反应将靶向涉及RA的T细胞。在多发性硬化症(MS)中，已表征涉及所述疾病的TCR的若干特定可变区。这些TCR包含V-7和Vα-10。因此，编码这些多肽中的至少一种的核酸序列的递送将引发免疫反应，所述免疫反应将靶向涉及MS的T细胞。在硬皮病中，已表征涉及所述疾病的TCR的若干特定可变区。这些TCR包含V-6、V-8、V-14和Vα-16、Vα-3C、Vα-7、Vα-14、Vα-15、Vα-16、Vα-28和Vα-12。因此，编码这些多肽中的至少一种的核酸分子的递送将引发免疫反应，所述免疫反应将靶向涉及硬皮病的T细胞。

在一个实施例中，选择转基因以提供光遗传疗法。在光遗传疗法中，人工光感受器是通过将光激活通道或泵基因递送到剩余视网膜回路中的存活细胞类型来构建的。这特别适用于已经失去大量光感受器功能，但其双极细胞回路至神经节细胞和视神经保持完整的患者。在一个实施例中，异源核酸序列(转基因)为视蛋白。视蛋白序列可以来源于任何合适的单细胞或多细胞生物，包含人类、藻类和细菌。在一个实施例中，视蛋白为视紫红质、光视蛋白、L/M波长(红色/绿色)-视蛋白或短波长(S)视蛋白(蓝色)。在另一个实施例中，视蛋白为通道视紫红质或盐细菌视紫红质。

在另一个实施例中，选择转基因用于基因增强疗法，即提供缺失或缺陷基因的替代拷贝。在此实施例中，本领域技术人员可以容易地选择转基因以提供必要的替代基因。在一个实施例中，缺失/缺陷的基因与眼部病症有关。在另一个实施例中，转基因为NYX、GRM6、TRPM1L或GPR179，并且眼部病症为先天性静止性夜盲症。参见如Zeitz等人,《美国人类遗传学杂志(Am J Hum Genet.)》2013年1月10日；92(1):67-75.电子版2012年12月13日，所述文献通过引用并入本文。在另一个实施例中，转基因为RPGR。在另一个实施例中，所述基因是由CHM编码的Rab护送蛋白1(REP-1)，与无脉络膜血症相关。

在另一个实施例中，选择转基因用于基因抑制疗法，即，一种或多种天然基因的表达在转录或翻译水平下被中断或抑制。这可以使用短发夹RNA(shRNA)或所属领域中众所周知的其它技术实现。参见例如Sun等人,《国际癌症杂志(Int J Cancer.)》2010年2月1日；126(3):764-74以及O'Reilly M等人《美国人类遗传学杂志》2007年7月；81(1):127-35，所述文献通过引入并入本文。在此实施例中，本领域的技术人员可以基于需要沉默的基因容易地选择转基因。

在另一个实施例中，转基因包括多于一个转基因。这可以使用携带两个或更多个异源序列的单一载体，或使用各自携带一个或多个异源序列的两个或更多个rAAV来实现。在一个实施例中，rAAV用于基因抑制(或敲低)和基因增强协同疗法。在敲低/增强协同疗法中，所关注的基因的缺陷拷贝被沉默并提供非突变拷贝。在一个实施例中，这使用两个或更多个共同施用的载体实现。参见Millington-Ward等人,《分子疗法(Molecular Therapy)》,2011年4月,19(4):642-649，其以引用的方式并入本文中。转基因可由本领域的技术人员基于所需结果容易地选择。

在另一个实施例中，选择转基因用于基因校正疗法。这可以使用例如锌指核酸酶(ZFN)诱导的DNA双股断裂结合外源DNA供体底物来实现。参见例如Ellis等人,《基因疗法》(电子版2012年1月)20:35-42，其以引用的方式并入本文中。在一个实施例中，转基因编码选自以下的核酸酶：大范围核酸酶、锌指核酸酶、转录激活因子样(TAL)效应子核酸酶(TALEN)和簇状、规则间隔的短回文重复序列(CRISPR)/核酸内切酶(Cas9、Cpf1等)。合适的大范围核酸酶的实例在例如美国专利8,445,251；US 9,340,777；US 9,434,931；US 9,683,257和WO 2018/195449进行了描述。其它合适的酶包含能以核酸编程方式结合RNA的核酸酶非活性酿脓链球菌(S.pyogenes)CRISPR/Cas9(Nelles等人,用CRISPR/Cas9在活细胞中进行可编程RNA跟踪(Programmable RNA Tracking in Live Cells with CRISPR/Cas9)《细胞(Cell)》,165(2):第488-96页(2016年4月))和碱基编辑器(例如，Levy等人,通过腺相关病毒编辑小鼠的脑、肝脏、视网膜、心脏和骨骼肌的胞嘧啶和腺嘌呤碱基(Cytosine andadenine base editing of the brain,liver,retina,heart and skeletal muscle ofmice via adeno-associated viruses),《自然生物医学工程(Nature BiomedicalEngineering)》,4,97–110(2020年1月))。在某些实施例中，核酸酶不是锌指核酸酶。在某些实施例中，核酸酶不是CRISPR相关核酸酶。在某些实施例中，核酸酶不是TALEN。在一个实施例中，核酸酶不是大范围核酸酶。在某些实施例中，核酸酶是归巢核酸内切酶LAGLIDADG(SEQ ID NO:45)家族的成员。在某些实施例中，核酸酶是归巢核酸内切酶I-CreI家族的成员，所述归巢核酸内切酶识别并切割22碱基对识别序列SEQ ID NO:46-CAAAACGTCGTGAGACAGTTTG。参见例如WO 2009/059195。描述了合理设计单LAGLIDADG归巢核酸内切酶的方法，所述方法能够全面重新设计ICreI和其它归巢核酸内切酶，以靶向广泛不同的DNA位点，包含哺乳动物、酵母、植物、细菌和病毒基因组中的位点(WO 2007/047859)。

在某些实施例中，本文提供了基于rAAV的基因编辑核酸酶系统。基因编辑核酸酶靶向疾病相关基因中的位点，即所关注的基因。

在某些实施例中，基于AAV的基因编辑核酸酶系统包括rAAV，所述rAAV包括AAV衣壳和包封在其中的载体基因组，其中包括AAV 5'反向末端重复序列(ITR)的载体基因组，包括编码基因编辑核酸酶的核酸序列的表达盒，所述基因编辑核酸酶识别并切割所关注的基因中的识别位点，其中所述基因编辑核酸酶编码序列可操作地连接到表达控制序列，所述表达控制序列引导其在包括所关注的基因和AAV 3'ITR的细胞中的表达。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu71/74的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu79的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu80的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu83的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu74/71的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu77的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu78/88的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu70的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu72的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu75的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu76的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu81的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu82的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu84的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu86的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu87的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu88/78的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu69的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh75的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh76的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh77的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh78的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh79的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh81的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh89的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh82的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh83的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh84的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh85的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVrh87的基因编辑核酸酶系统。在某些实施例中，基于rAAV的基因编辑核酸酶系统是基于rAAVhu73的基因编辑核酸酶系统。

本文还提供了使用基于rAAV的基因编辑核酸酶系统的治疗方法。

在一些实施例中，基于rAAV的基因编辑大范围核酸酶系统用于治疗疾病、病症、综合征和/或病状。在一些实施例中，基因编辑核酸酶靶向所关注的基因，其中所关注的基因具有一个或多个基因突变、缺失、插入和/或与疾病、病症、综合征和/或病状相关和/或涉及其的缺陷。在一些实施例中，病症选自但不限于心血管病症、肝病症、内分泌病症或代谢病症、肌肉骨骼病症、神经病症和/或肾病症。

在某些实施例中，指定的心血管疾病、病症、综合症和/或病状包含但不限于心血管疾病(相关溶血磷脂酸、脂蛋白(a)或血管生成素样3(ANGPTL3)或载脂蛋白C-III(APOC3)编码基因)、阻断凝固、血栓形成、终末期肾病、凝血障碍(与因子XI(F11)编码基因相关)、高血压(血管紧张素原(AGT)编码基因)和心力衰竭(血管紧张素原(AGT)编码基因)。

在某些实施例中，指示的肝病、病症、综合征和/或病状包含但不限于特发性肺纤维化(与SERPINH1/Hsp47基因相关)、肝病(与羟基类固醇17-β脱氢酶13(HSD17B13)编码基因相关)、非酒精性脂肪性肝炎(NASH)(与二酰基甘油O-酰基转移酶-2(DGAT2)相关)、羟基类固醇17-β脱氢酶13(HSD17B13)、或含马铃薯糖蛋白样磷脂酶结构域3(PNPLA3)编码基因)以及酒精使用障碍(与醛脱氢酶2(ALDH2)编码基因相关)。

在某些实施例中，指定的肌肉骨骼疾病、病症、综合征和/或病状包含但不限于肌营养不良症(与肌营养不良蛋白或整合素α(4)(VLA-4)(CD49D)编码基因相关)、杜氏肌营养不良(DMD)(与肌营养不良蛋白(DMD)基因相关)、中央核肌病(与发动蛋白2(DNM2)编码基因相关)以及强直性肌营养不良(DM1)(与强直性肌营养不良蛋白激酶(DMPK)编码基因相关)。

在某些实施例中，指示的内分泌或代谢疾病、病症、综合征和/或病状包含但不限于高甘油三酯血症(与载脂蛋白C-III(APOC3)或血管生成素样3(ANGPTL3)编码基因相关)、脂肪代谢障碍、高脂血症(与载脂蛋白C-III(APOC3编码基因相关)、高胆固醇血症(与载脂蛋白B-100(APOB-100)、前蛋白转化酶枯草杆菌蛋白酶可欣9型(PCSK9)相关)、或淀粉样变性(与转甲状腺素蛋白(TTR)编码基因相关)、卟啉症(与氨基乙酰丙酸合酶-1(ALAS-1)编码基因相关)、神经病(与转甲状腺素蛋白(TTR)编码基因相关)、原发性高草酸尿症1型(与乙醇酸氧化酶编码基因相关)、糖尿病(与胰高血糖素受体(GCGR)编码基因相关)、肢端肥大症(生长激素受体(GHR)编码基因相关)、α-1抗胰蛋白酶缺乏(AATD)(与α-1抗胰蛋白酶(AAT)编码基因相关)、丙酸血症(丙酰基-辅酶A羧化酶(PCCA/PCCB)编码基因相关)、糖原贮积病III型(GDSIII)(与糖原脱支酶(GSDIII)编码基因相关)、心脏代谢疾病(与脱唾液酸糖蛋白(ASGPR)、羟基酸氧化酶1(HAO1)、或α-1-抗胰蛋白酶(SERPINA1)编码基因相关)、甲基丙二酸血症(MMA)(与甲基丙二酰辅酶A变位酶(MMUT)、钴胺素(I)腺苷转移酶(MMAA或MMAB)、甲基丙二酰辅酶A差向异构酶(MCEE)、含LMBR1结构域1(LMBRD1)或ATP结合盒式亚家族D成员4(ABCD4)编码基因相关)、糖原贮积病1a型(与葡萄糖-6-磷酸酶催化亚基相关蛋白(G6PC)编码基因相关)以及苯丙酮尿症(PKU)(与苯丙氨酸羟化酶(PAH)编码基因相关)。

在某些实施例中，指定的神经系统疾病、病症、综合征和/或病状包含但不限于脊髓性肌萎缩(SMA)(与运动神经元生存蛋白(SMN2)基因相关)、肌萎缩性脊髓侧索硬化症(ALS)(超氧化物歧化酶1型(SOD1)、FUS RNA结合蛋白(FUS)、微小RNA-155、9号染色体开放阅读框72(C9orf72)或ataxin-2(ATXN2)基因)、亨廷顿氏病(与亨廷顿蛋白(HTT)基因相关)、hATTR多神经病(与转甲状腺素蛋白(TTR)基因相关)、阿尔茨海默氏病(与MAP-tau(MAPT)基因相关)、多系统萎缩症(与α-突触核蛋白(SNCA)相关)、帕金森氏病(与α-突触核蛋白(SNCA)、富亮氨酸重复激酶2(LRRK2)基因相关)、中央核肌病(与发动蛋白2(DNM2)基因相关)、快乐木偶综合征(Angelman syndrome)(与泛素蛋白连接酶E3A(UBE3A)基因相关)、癫痫(与糖原合成酶1(GYS1)基因相关)、德拉韦综合征(Dravet Syndrome)(与钠电压门控通道α亚基1(SNC1A)基因相关)、脑白质营养不良(与胶质原纤维酸性蛋白(GFAP)基因相关)、朊病毒病(与朊病毒蛋白(PRNP)基因相关)以及遗传性脑出血伴淀粉样变性-荷兰型(HCHWA-D)(与淀粉样蛋白β前体蛋白(APP)基因相关)。

在某些实施例中，指示的肾脏疾病、病症、综合征和/或病状包含但不限于肾小球肾炎(IgA肾病)(与补体因子B编码基因相关)、奥尔波特综合征(Alport syndrome)(与PPARα信号通路中的蛋白质相关)以及神经病(与载脂蛋白L1(APOL1)编码基因相关)或APOL1相关的慢性肾病。

在某些实施例中，基因编辑核酸酶靶向所关注的基因，其中所关注的基因包含但不限于溶血磷脂酸编码基因、脂蛋白(a)编码基因、ANGPTL3、APOC3、F11、AGT、SERPINH1/Hsp47、HSD17B13、DGAT2、PNPLA3、ALDH2、DMD、VLA-4、DNM2DM1、DMPK、APOC3、ANGPTL3、APOB-100、PCSK9、TTR、ALAS-1、乙醇酸氧化酶编码基因、GCGR、GHR、AATD、AAT、PCCA、PCCB、GDSIII、ASGPR、HAO1、SERPINA1、MMA、MMUT、MMAA、MMAB、MCEE、LMBRD1、ABCD4、G6PC、PAH、SMN2、SOD1、FUS、C9orf72、ATXN2、HTT、MAPT、SNCA、LRRK2、UBE3A、GYS1、SNC1A、GFAP、PRNP、APP、补体因子B编码基因、APOL1、AAS1、SLC25A13基因。

合适的基因编辑靶标包含例如肝表达的基因，如但不限于前蛋白转化酶枯草蛋白酶/可欣9型(PCSK9)(胆固醇相关病症)、转甲状激素(TTR)(转甲状腺素蛋白淀粉样变性)、HAO、载脂蛋白C-III(APOC3)、因子VIII、因子IX、低密度脂蛋白受体(LDLr)、脂蛋白脂肪酶(LPL)(脂蛋白脂肪酶缺乏症)、卵磷脂胆固醇酰基转移酶(LCAT)、鸟氨酸转氨甲酰酶(OTC)、肌肽酶(CN1)、鞘磷脂磷酸二酯酶(SMPD1)(尼曼-皮克病)、次黄嘌呤鸟嘌呤磷酸核糖转移酶(HGPRT)、支链α-酮酸脱氢酶复合物(BCKDC)(枫糖尿病)、促红细胞生成素(EPO)、氨基甲酰磷酸合成酶(CPS1)、N-乙酰谷氨酸合成酶(NAGS)、精氨酸琥珀酸合成酶(瓜氨酸血症)、精氨琥珀酸裂解酶(ASL)(精氨基琥珀酸尿症)和精氨酸酶(AG)。

其它基因编辑靶标可以包含例如羟甲基胆素合成酶(HMBS)、氨基甲酰合成酶I、鸟氨酸转氨甲酰酶(OTC)、精氨酸琥珀酸合成酶、α1抗胰蛋白酶(A1AT)、用于治疗精氨琥珀酸裂解酶缺乏症的精氨琥珀酸裂解酶(ASL)、精氨酸酶、延胡索酰乙酰乙酸水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、恒河猴甲胎蛋白(AFP)、恒河猴绒毛膜促性腺激素(CG)、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β合酶、支链酮酸脱羧酶、白蛋白、异戊酰辅酶A脱氢酶、丙酰辅酶A羧化酶、甲基丙二酰辅酶A变位酶(MUT)、戊二酰辅酶A脱氢酶、胰岛素、β-葡糖苷酶、丙酮酸羧酸盐、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H蛋白、T蛋白、囊性纤维化跨膜调节子(CFTR)序列和肌营养不良蛋白基因产物[例如，迷你或微小肌营养不良蛋白]。仍其它有用的基因产物包含如可以用于酶替代疗法的酶，所述酶替代疗法可用于由于酶活性不足而导致的多种病状。例如，可以将含有甘露糖-6-磷酸的酶用于溶酶体贮积病的疗法中(例如，合适的基因包含编码β-葡糖醛酸酶(GUSB)的基因)。在另一个实例中，基因产物是泛素蛋白连接酶。与糖原贮积病或1A型缺乏症(GSD1)相关的葡萄糖-6-磷酸酶；与PEPCK缺乏症相关的磷酸烯醇丙酮酸羧激酶(PEPCK)；细胞周期蛋白依赖性激酶样5(CDKL5)，其也被称为与癫痫发作和严重的神经发育障碍相关的丝氨酸/苏氨酸激酶9(STK9)；与半乳糖血症相关的半乳糖-1磷酸尿嘧啶转移酶；与苯丙酮尿症(PKU)相关的苯丙氨酸羟化酶(PAH)；与原发性高草酸尿症1型相关的基因产物，包含羟基酸氧化酶1(GO/HAO1)和AGXT，与枫糖尿病相关的支链α-酮酸脱氢酶；包含BCKDH、BCKDH-E2、BAKDH-E1a和BAKDH-E1b；与1型酪氨酸血症相关的延胡索酰乙酰乙酸水解酶；与甲基丙二酸血症相关的甲基丙二酰辅酶A变位酶；与中链乙酰辅酶A缺乏症相关的中链酰基辅酶A脱氢酶；与鸟氨酸转氨甲酰酶缺乏症相关的鸟氨酸转氨甲酰酶(OTC)；与瓜氨酸血症相关的精氨酸琥珀酸合成酶(ASS1)；卵磷脂胆固醇酰基转移酶(LCAT)缺乏症；甲基丙二酸血症(MMA)；与尼曼-皮克病(C1型)相关的NPC1；丙酸血症(PA)；与转甲状腺素蛋白(TTR)相关的遗传性淀粉样变性相关的TTR；与家族性高胆固醇血症(FH)相关的低密度脂蛋白受体(LDLR)蛋白，LDLR变体，如WO 2015/164778中描述的那些变体；PCSK9；与痴呆相关的ApoE和ApoC蛋白；与克里格勒-纳贾尔病相关的UDP-葡萄糖醛糖基转移酶；与严重联合免疫缺陷病相关的腺苷脱氨酶；与痛风和莱施-奈恩综合征相关的次黄嘌呤鸟嘌呤磷酸核糖基转移酶；与生物素酶缺乏症相关的生物素酶；与法布里病相关的α-半乳糖苷酶A(α-Gal A)；与GM1神经节苷脂病相关的β-半乳糖苷酶(GLB1)；与威尔逊氏病相关的ATP7B；与戈谢病2和3型相关的β-葡糖脑苷脂酶；与泽尔韦格氏综合征相关的过氧化物酶体膜蛋白70kDa；与变质性脑白质营养不良相关的芳基硫酸酯酶A(ARSA)；与克拉伯病相关的半乳糖脑苷脂酶(GALC)；与庞贝病相关的α-葡糖苷酶(GAA)；与尼曼-皮克病A型相关的鞘磷脂酶(SMPD1)基因；与成人II型瓜氨酸血症(CTLN2)相关的精氨琥珀酸合酶；与脲循环病症相关的氨基甲酰磷酸合酶1(CPS1)；与脊髓性肌萎缩症相关的存活运动神经元(SMN)蛋白；与法伯脂肪肉芽肿病相关的神经酰胺酶；与GM2神经节苷脂病和泰伊-萨克斯二氏病和山霍夫氏病相关的b-己糖胺酶；与天冬氨酰葡糖尿症相关的天冬氨酰葡糖胺酶；与岩藻糖苷贮积症相关的a岩藻糖苷酶；与α甘露糖苷贮积症相关的α-甘露糖苷酶；与急性间歇性卟啉症(AIP)相关的胆色素原脱氨酶；用于治疗α-1抗胰蛋白酶缺乏症(肺气肿)的α-1抗胰蛋白酶；用于治疗因地中海贫血或肾衰竭引起的贫血的促红细胞生成素；用于治疗缺血性疾病的血管内皮生长因子、血管生成素-1和成纤维细胞生长因子；用于治疗如例如在动脉粥样硬化、血栓形成或栓塞中所看见的阻塞的血管的血栓调节蛋白和组织因子途径抑制剂；用于治疗帕金森氏病的芳香族氨基酸脱羧酶(AADC)和酪氨酸羟化酶(TH)；与受磷蛋白、肌浆(内质)网腺苷三磷酸酶-2(SERCA2)呈反义或为其突变体形式的β肾上腺素能受体；用于治疗充血性心力衰竭的心脏腺苷酸环化酶；用于治疗各种癌症的肿瘤抑制基因，如p53；用于治疗炎症和免疫病症以及癌症的细胞因子，如各种白细胞介素之一；用于治疗肌营养不良的肌营养不良蛋白或迷你肌营养不良蛋白以及肌萎缩相关蛋白或迷你肌萎缩相关蛋白；以及用于治疗糖尿病的胰岛素或GLP-1。

在一个实施例中，本文所描述的衣壳可用于于2018年4月26日提交的美国公开的专利申请2018/0110877中描述的CRISPR-Cas双载体系统，所述申请中的每个通过引用并入本文中。衣壳还可用于递送归巢核酸内切酶或其它大范围核酸酶。

在另一个实施例中，本文有用的转基因包含报告序列，其在表达时产生可检测信号。此类报告序列包含但不限于编码以下者的DNA序列：β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、膜结合蛋白(包含例如CD2、CD4、CD8)、流感血凝素蛋白和本领域熟知的其它蛋白，针对其存在或可通过常规方法产生高亲和力抗体，以及融合蛋白，包括适当地与尤其来自血凝素或Myc的抗原标签域融合的膜结合蛋白。

在某些实施例中，除转基因编码序列之外，另一种非AAV编码序列可以包含在内，例如，肽、多肽、蛋白质、功能性RNA分子(例如，miRNA、miRNA抑制剂)或所关注的其它基因产物。有用的基因产物可以包含miRNA。miRNA和其它小干扰核酸通过靶信使RNA(mRNA)的靶RNA转录物裂解/降解或转译抑制来调节基因表达。miRNA是天然表达的，通常作为最终的19-25种非转译的RNA产物。miRNA通过与靶mRNA的3'非转译区(UTR)的序列特异性相互作用展现出其活性。这些内源表达的miRNA形成发夹前体，所述发夹前体随后被加工成miRNA双链体，并且被进一步加工成“成熟的”单链miRNA分子。这种成熟的miRNA引导多蛋白复合物miRISC，所述多蛋白复合物基于与成熟的miRNA的互补性来鉴定靶mRNA的靶位点，例如在3'UTR区中。

当与驱动其表达的调节元件相关时，这些上述编码序列提供可通过常规手段检测的信号，包含酶、射线照相、比色、荧光或其它光谱测定、荧光激活细胞分选测定和免疫测定，所述免疫测定包含酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组化。例如，在标志物序列是LacZ基因的情况下，通过测定β-半乳糖苷酶活性来检测携带信号的载体的存在。在转基因是绿色荧光蛋白或荧光素酶的情况下，携带信号的载体可以通过在发光计中的颜色或光产生来目测测量。

期望地，转基因编码可用于生物学和医学的产物，如蛋白质、肽、RNA、酶或催化性RNA。理想的RNA分子包含shRNA、tRNA、dsRNA、核糖体RNA、催化RNA和反义RNA。适用的RNA序列的一个实例是消除靶细胞中的靶向核酸序列表达的序列。

调控序列包含常规控制元件，其以允许其在用载体转染或感染如本文所描述产生的病毒的细胞中转录、翻译和/或表达的方式可操作地连接到转基因。如本文所使用的，“可操作地连接的”序列包含与所关注的基因邻接的表达控制序列和以反式或在远处起作用以控制所关注的基因的表达控制序列。

表达控制序列包含适当的转录起始、终止、启动子和增强子序列；有效的RNA加工信号，如剪接和聚腺苷酸化(polyA)信号；稳定细胞质mRNA的序列；增强翻译效率的序列(即，Kozak共有序列)；增强蛋白质稳定性的序列；以及当需要时，增强经编码的产物的分泌的序列。大量表达控制序列(包含启动子)在本领域中已知并且可以被利用。

可用于本文提供的构建体中的调控序列还可含有内含子，理想地位于启动子/增强子序列与基因之间。一个期望的内含子序列源自SV-40，并且是被称为SD-SA的100bp的小内含子剪接供体/剪接受体。另一合适的序列包含土拔鼠肝炎病毒转录后元件。(参见例如L.Wang和I.Verma,1999《美国国家科学院院刊(Proc.Natl.Acad.Sci.,USA)》,96:3906-3910)。PolyA信号可以源自许多适合的物种，包含但不限于人和牛SV-40。

适用于本文所述的方法的rAAV的另一调控组分为内部核糖体进入位点(IRES)。IRES序列或其它适合的系统可以用于由单个基因转录物产生多于一种多肽。IRES(或其它适合的序列)用于产生含有多于一条多肽链的蛋白质，或用于表达来自同一细胞或在同一细胞内的两种不同的蛋白质。示例性IRES是脊髓灰质炎病毒内部核糖体进入序列，其支持光感受器、RPE和神经节细胞中的转基因表达。优选地，IRES位于rAAV载体的转基因的3'。

在某些实施例中，载体基因组包括启动子(或启动子的功能片段)。用于rAAV中的启动子可选自多种可在所需靶细胞中表达所选转基因的组成性或诱导性启动子。在一个实施例中，靶细胞是眼细胞。启动子可以来源于任何物种，包含人类。理想地，在一个实施例中，启动子具有“细胞特异性”。术语“细胞特异性”意指为重组载体选择的特定启动子可以引导所选转基因在特定细胞组织中的表达。在一个实施例中，启动子对转基因在肌肉细胞中的表达具有特异性。在另一个实施例中，启动子对肺中的表达具有特异性。在另一个实施例中，启动子对转基因在肝细胞中的表达具有特异性。在另一个实施例中，启动子对转基因在气道上皮中的表达具有特异性。在另一个实施例中，启动子对转基因在神经元中的表达具有特异性。在另一个实施例中，启动子对转基因在心脏中的表达具有特异性。

载体基因组通常含有启动子序列作为表达控制序列的一部分例如，位于选定5'ITR序列与免疫球蛋白构建体编码序列之间。在一个实施例中，肝脏中的表达是合乎需要的。因此，在一个实施例中，使用肝特异性启动子。肝脏特异性启动子的实例可以包含例如，甲状腺激素结合球蛋白(TBG)，白蛋白，Miyatake等人,(1997)《病毒学杂志》,71:512432；乙型肝炎病毒核心启动子，Sandig等人,(1996)《基因疗法》,3:1002 9；或人α1-抗胰蛋白酶、磷酸烯醇丙酮酸羧激酶(PECK)或甲胎蛋白(AFP),Arbuthnot等人,(1996)《人类基因疗法(Hum.Gene Ther.)》,7:1503 14)。可以在本文所描述的载体中使用组织特异性启动子、组成型启动子、可调控启动子[参见例如WO 2011/126808和WO 2013/04943]或对生理学线索有应答的启动子。在另一个实施例中，肌肉中的表达是合乎需要的。因此，在一个实施例中，使用肌肉特异性启动子。在一个实施例中，启动子是基于MCK的启动子，如dMCK(509-bp)或tMCK(720-bp)启动子(参见例如Wang等人,《基因疗法》2008年11月；15(22):1489-99.doi:10.1038/gt.2008.104.电子版2008年6月19日，所述文献通过引用并入本文)。另一适用的启动子是SPc5-12启动子(参见Rasowo等人,《欧洲科学杂志(European ScientificJournal)》2014年6月版第10卷，第18期，其以引用的方式并入本文中)。在某些实施例中，可以选择对眼睛或其子部分(例如，视网膜)具有特异性的启动子。

在一个实施例中，启动子是CMV启动子。在另一个实施例中，启动子为TBG启动子。在另一个实施例中，使用CB7启动子。CB7是具有巨细胞病毒增强子元件的鸡β-肌动蛋白启动子。可替代地，可以使用其它肝脏特异性启动子[参见例如，肝脏特异性基因启动子数据库(The Liver Specific Gene Promoter Database),冷泉港实验室(Cold SpringHarbor),rulai.schl.edu/LSPD,α1抗胰蛋白酶(A1AT)；人白蛋白，Miyatake等人,《病毒学杂志》,71:5124 32(1997),humAlb；以及乙型肝炎病毒核心启动子，Sandig等人,《基因疗法》,3:1002 9(1996)]。TTR最小增强子/启动子、α-抗胰蛋白酶启动子、LSP(845nt)25(需要无内含子scAAV)。

一种或多种启动子可以选自不同的来源，例如人巨细胞病毒(CMV)立即早期增强子/启动子、SV40早期增强子/启动子、JC多瘤病毒启动子、髓鞘碱性蛋白(MBP)或神经胶质原纤维酸性蛋白(GFAP)启动子、单纯疱疹病毒(HSV-1)潜伏期相关启动子(LAP)、劳氏肉瘤病毒(RSV)长末端重复(LTR)启动子、神经元特异性启动子(NSE)、血小板源性生长因子(PDGF)启动子、hSYN、黑色素浓缩激素(MCH)启动子、CBA、基质金属蛋白启动子(MPP)和鸡β-肌动蛋白启动子。

载体基因组可以含有至少一种增强子，即CMV增强子。仍其它增强子元件可以包含例如载脂蛋白增强子、斑马鱼增强子、GFAP增强子元件和脑特异性增强子(如在WO 2013/1555222中描述的)、土拨鼠肝炎后转录后调控元件。另外或可替代地，可以选择其它例如杂合人巨细胞病毒(HCMV)-立即早期(IE)-PDGR启动子或其它启动子-增强子元件。本文适用的其它增强子序列包含IRBP增强子(Nicoud 2007,《基因医学杂志(J Gene Med.)》2007年12月；9(12):1015-23)、立即早期巨细胞病毒增强子、源自免疫球蛋白基因或SV40增强子的一种、小鼠近端启动子中鉴别的顺式作用元件等。

除启动子之外，载体基因组可以含有其它合适的转录起始、终止、增强子序列、如剪接和聚腺苷酸化(polyA)信号等有效RNA加工信号；稳定胞质mRNA的序列；增强翻译效率的序列(即，Kozak共有序列)；增强蛋白稳定性的序列；以及当需要时，增强经编码的产物的分泌的序列。多种合适的polyA是已知的。在一个实例中，polyA是兔β珠蛋白，如127bp兔β珠蛋白聚腺苷酸化信号(GenBank编号V00882.1)。在其它实施例中，选择SV40 polyA信号。可选择其它合适的polyA序列。在某些实施例中，包含内含子。一个合适的内含子是鸡β-肌动蛋白内含子。在一个实施例中，内含子为875bp(GenBank编号X00182.1)在另一个实施例中，使用可购自普洛麦格公司(Promega)的嵌合内含子。然而，可选择其它合适的内含子。在一个实施例中，包含间隔子以使得载体基因组与天然AAV载体基因组的大小大致相同(例如，在4.1与5.2kb之间)。在一个实施例中，包含间隔子以使得载体基因组为约4.7kb。参见Wu等人,基因组大小对AAV载体包装的影响(Effect of Genome Size on AAV VectorPackaging),《分子疗法》2010年1月；18(1):80-86，所述参考文献通过引用并入本文。

在某些实施例中，载体基因组进一步包括可操作地连接到转基因编码序列的背根神经节(drg)特异性miRNA去靶向序列。在某些实施例中，所述串联miRNA靶序列是连续的或由1到10个核酸的间隔子隔开，其中所述间隔子不是miRNA靶序列。在某些实施例中，至少两个drg特异性miRNA序列定位在功能转基因编码序列的3'处。在某些实施例中，所述至少两个drg特异性miRNA串联重复序列中的第一个的起点在距转基因编码序列的3'端20个核苷酸内。在某些实施例中，所述至少两个drg特异性miRNA串联重复序列中的第一个的起点距功能转基因编码序列的3'端至少100个核苷酸。在某些实施例中，所述miRNA串联重复序列的长度包括200个至1200个核苷酸。在某些实施例中，至少两个drg特异性miRNA靶序列定位在功能转基因编码序列的5'处。在某些实施例中，至少两个drg特异性miRNA靶序列定位在功能转基因编码序列的5'和3'两者中。在某些实施例中，表达盒mRNA或DNA正链的至少第一和/或至少第二miRNA靶序列的miRNA靶序列选自：(i)AGTGAATTCTACCAGTGCCATA(SEQ IDNO:78)；(ii)AGCAAAAATGTGCTAGTGCCAAA(SEQ ID NO:79)；(iii)AGTGTGAGTTCTACCATTGCCAAA(SEQ ID NO:80)；或(iv)AGGGATTCCTGGGAAAACTGGAC(SEQ IDNO:81)。在某些实施例中，表达盒mRNA或DNA正链的至少第一和/或至少第二miRNA靶序列的miRNA靶序列是AGTGAATTCTACCAGTGCCATA(SEQ ID NO:78)。在某些实施例中，表达盒mRNA或DNA正链的至少第一和/或至少第二miRNA靶序列的miRNA靶序列是AGTGAATTCTACCAGTGCCATA(SEQ ID NO:78)。在某些实施例中，两个或更多个连续的miRNA靶序列是连续的并且不由间隔子隔开。在某些实施例中，两个或更多个miRNA靶序列由间隔子隔开，并且每个间隔子独立地选自以下中的一个或多个：(A)GGAT；(B)CACGTG；或(C)GCATGC。在某些实施例中，定位在所述miRNA靶序列之间的间隔子可以定位在第一个miRNA靶序列的3'和/或最后一个miRNA靶序列的5'。在某些实施例中，所述miRNA靶序列之间的所述间隔子是相同的。参见于2019年12月20日提交的国际专利申请第PCT/US19/67872号、于2020年5月12日提交的美国临时专利申请第63/023,594号、于2020年6月12日提交的美国临时专利申请第63/038,488号、于2020年6月24日提交的美国临时专利申请第63/043,562号和于2020年9月16日提交的美国临时专利申请第63/079,299号，所述申请全都通过引用整体并入。

这些和其它常见载体和调控元件的选择是常规的并且许多此类序列是可用的。参见例如Sambrook等人和其中所引用的参考文献，例如第3.18-3.26和16.17-16.27页，以及Ausubel等人,当前分子生物学实验指南(Current Protocols in Molecular Biology)》,纽约约翰威立父子出版公司(John Wiley&Sons,New York),1989。当然，并非所有载体和表达控制序列都将同样好地起作用以表达如本文所述的所有转基因。然而，本领域的技术人员可以在不脱离本发明的范围的情况下在这些和其它表达控制序列中进行选择。

在另一个实施例中，提供一种产生重组腺相关病毒的方法。合适的重组腺相关病毒(AAV)通过培养宿主细胞产生，所述宿主细胞含有编码如本文所述的AAV衣壳蛋白或其片段的核酸序列；功能性rep基因；至少由AAV反向末端重复序列(ITR)和编码所需转基因的异源核酸序列构成的迷你基因；和允许将迷你基因包装至AAV衣壳蛋白中的足够辅助功能。在宿主细胞中培养以将AAV迷你基因包装在AAV衣壳中所需的组分可以反式形式提供到宿主细胞。可替代地，所需组分(例如，迷你基因、rep序列、cap序列和/或辅助功能)中的任何一种或多种组分可以由稳定的宿主细胞提供，所述宿主细胞已经使用本领域技术人员已知的方法被工程化为含有所需组分中的一种或多种。

本文还提供了用本文所描述的AAV转染的宿主细胞。最适合的是，此类稳定宿主细胞将含有在诱导型启动子的控制下所需组分。然而，所需组分可以在组成型启动子的控制下。合适的诱导型和组成型启动子的实例提供于下文适用于转基因的调控元件的论述中。在仍另一个替代方案中，所选的稳定宿主细胞可以含有在组成型启动子控制下的所选组分以及在一个或多个诱导型启动子控制下的其它所选组分。例如，可以产生源自293个细胞的稳定宿主细胞，(所述宿主细胞含有在组成型启动子控制下的E1辅助功能)，但是所述宿主细胞含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可以产生其它仍稳定的宿主细胞。在另一个实施例中，宿主细胞包括如本文所描述的核酸分子(例如，质粒)。

用于产生本文所描述的rAAV所需的迷你基因、rep序列、cap序列和辅助功能可以以转移其上携带的序列的任何遗传元件的形式递送到包装宿主细胞。可以通过任何适合的方法(包含本文所描述的方法)递送所选基因元件。用于构建本发明的任何实施例的方法对核酸操作技术人员是已知的并且包含基因工程、重组工程以及合成技术。参见例如Sambrook等人,《分子克隆：实验室手册(Molecular Cloning:A Laboratory Manual)》,纽约冷泉港的冷泉港出版社(Cold Spring Harbor Press,Cold Spring Harbor,NY)。类似地，产生rAAV病毒粒子的方法是众所周知的并且对合适的方法的选择不是对本发明的限制。参见例如K.Fisher等人,1993《病毒学杂志》,70:520-532以及美国专利5,478,745等。这些出版物通过引用并入本文中。

本文还提供了用于产生本文所描述的载体的质粒。此类质粒包含核酸序列，所述核酸序列编码AAVhu71/74(SEQ ID NO:4)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu83(SEQ ID NO:10)、AAVhu74/71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78/88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu76(SEQ ID NO:24)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu84(SEQ ID NO:30)、AAVhu86(SEQ ID NO:32)、AAVhu87(SEQ ID NO:34)、AAVhu88/78(SEQ ID NO:36)、AAVhu69(SEQ ID NO:38)、AAVrh75(SEQ ID NO:40)、AAVrh76(SEQ ID NO:42)、AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)、AAVrh79(SEQ ID NO:48)、AAVrh81(SEQ ID NO:50)、AAVrh89(SEQ ID NO:52)、AAVrh82(SEQ ID NO:54)、AAVrh83(SEQ ID NO:56)、AAVrh84(SEQ ID NO:58)、AAVrh85(SEQ ID NO:60)、AAVrh87(SEQ ID NO:62)或AAVhu73(SEQ ID NO:74)的vp1、vp2和vp3中的至少一个。在某些实施例中，提供了质粒，所述质粒具有AAVhu71/74(SEQ ID NO:3)、AAVhu79(SEQ ID NO:5)、AAVhu80(SEQ IDNO:7)、AAVhu83(SEQ ID NO:9)、AAVhu74/71(SEQ ID NO:11)、AAVhu77(SEQ ID NO:13)、AAVhu78/88(SEQ ID NO:15)、AAVhu70(SEQ ID NO:17)、AAVhu72(SEQ ID NO:19)、AAVhu75(SEQ ID NO:21)、AAVhu76(SEQ ID NO:23)、AAVhu81(SEQ ID NO:25)、AAVhu82(SEQ ID NO:27)、AAVhu84(SEQ ID NO:29)、AAVhu86(SEQ ID NO:31)、AAVhu87(SEQ ID NO:33)、AAVhu88/78(SEQ ID NO:35)、AAVhu69(SEQ ID NO:37)、AAVrh75(SEQ ID NO:39)、AAVrh76(SEQ ID NO:41)、AAVrh77(SEQ ID NO:43)、AAVrh78(SEQ ID NO:45)、AAVrh79(SEQ ID NO:47)、AAVrh81(SEQ ID NO:49)、AAVrh89(SEQ ID NO:51)、AAVrh82(SEQ ID NO:53)、AAVrh83(SEQ ID NO:55)、AAVrh84(SEQ ID NO:57)、AAVrh85(SEQ ID NO:59)、AAVrh87(SEQ ID NO:61)或AAVhu73(SEQ ID NO:73)的vp1、vp2和/或vp3序列、或与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59或61中的任何一个共用至少95％、至少96％、至少97％、至少98％或至少99％同一性的序列。在另外的实施例中，质粒包含非AAV序列。还提供了含有本文所描述的质粒的培养宿主细胞。

在某些实施例中，质粒是编码AAV基因组和所关注的基因的AAV顺式质粒、含有AAVrep和新型hu68 cap基因的AAV反式质粒以及辅助质粒。基于遗传元件的总重量，这些质粒可以以任何合适的比例使用例如，约1:约1:约1。在其它实施例中，pRepCap与AAV顺式质粒的比率按每个编码序列的重量计为约1:1，并且pHelper为所述重量的约2倍。在其它实施例中，按重量计，所述比率可以是约3:1辅助:10:1pRepCap:1:0.10rAAV质粒。可以选择其它合适的比率。在某些实施例中，宿主细胞可以用这些元件中的一种或多种元件稳定转化。例如，宿主细胞可以含有稳定的核酸分子，所述核酸分子包括可操作地连接到调控序列的AAVhu68M191 vp1编码序列、编码rep编码序列的核酸分子和/或编码辅助功能的一个或多个核酸分子(例如，腺病毒E1a等)。在此类实施例中，基于遗传元件的总重量，各种遗传元件可以以任何合适的比例使用例如，约1:约1:约1。在某些实施例中，按重量计，pRep DNA与Cap DNA与AAV分子(例如，携带待包装的载体基因组的质粒)的比率为约1比约1比约1(1:1:1)。在某些实施例中，某些宿主细胞含有一些以反式提供的辅助元件(例如Ad E2a和/或AdE2b)和以顺式提供的其它辅助元件(例如Ad E1a和/或E1b)。辅助序列可以以其它遗传元件的量的约2倍存在。可以确定仍其它比率。

载体产生过程可以包含方法步骤，如开始细胞培养、进行细胞传代、接种细胞、用质粒DNA转染细胞、将转染后介质交换为无血清介质以及采集含载体的细胞和介质。所采集的含载体的细胞和介质在本文中被称为粗细胞采集物。在又另一个系统中，通过用基于杆状病毒的载体进行感染来将基因疗法载体引入到昆虫细胞中。对于这些产生系统的综述，通常参见例如，Clement和Grieger,《分子疗法-方法和临床发展(Mol Ther Methods ClinDev)》,2016:3:16002,在线公开于2016年3月16日。在以下美国专利中也描述了制备和使用这些及其它AAV产生系统的方法，所述美国专利中的每个美国专利的内容通过引用整体并入本文：5,139,941；5,741,683；6,057,152；6,204,059；6,268,213；6,491,907；6,660,514；6,951,753；7,094,604；7,172,893；7,201,898；7,229,823和7,439,065。

此后，粗细胞采集物可以是本主题的方法步骤，如浓缩载体采集物、渗滤载体采集物、微流化载体采集物、核酸酶消化载体采集物、过滤经微流化的中间体、通过色谱粗纯化、通过超速离心法粗纯化、通过切向流过滤进行缓冲液交换和/或调配和过滤以制备大量载体。

各种AAV纯化方法在本领域中是众所周知的。参见例如题为“AAV9的可分级纯化方法(Scalable Purification Method for AAV9)”的WO 2017/160360，所述文献通过引用并入本文，并且描述了通常对进化枝F衣壳有用的方法。进行两步亲和色谱法纯化，然后通过使用阴离子交换树脂色谱法来纯化载体药物产物并去除空衣壳。粗细胞收获物可以是主题步骤，如浓缩载体收获物、渗滤载体收获物、微流化载体收获物、核酸酶消化载体收获物、过滤经微流化的中间体、通过色谱粗纯化、通过超速离心法粗纯化、通过切向流过滤进行缓冲液交换和/或调配和过滤以制备大量载体。进行亲和色谱法纯化，随后使用阴离子交换树脂色谱法来纯化载体药物产物并去除空衣壳。在一个实例中，对于亲和色谱法步骤，可以将经过渗滤的产物应用于有效捕获AAV2/9血清型的Capture Select

用于表征或定量rAAV的方法对于本领域技术人员是可用的。例如，为了计算空颗粒和完整颗粒的含量，将所选样品(例如，在本文的实例中经过碘克沙醇(iodixanol)梯度纯化的制剂，其中GC#＝颗粒#)的VP3带体积相对于加载的GC颗粒进行作图。所得线性等式(y＝mx+c)用于计算测试制品峰的带状体积中的颗粒的数量。然后将加载的每20μL颗粒数量(pt)乘以50，以得到颗粒(pt)/mL。将pt/mL除以GC/mL得到颗粒与基因组拷贝的比率(pt/GC)。pt/mL-GC/mL得到空pt/mL。空pt/mL除以pt/mL并且×100得到空颗粒的百分比。

在某些实施例中，包装的AAV载体基因组拷贝(VG或GC)的产量可以通过对经编码的转基因使用生物活性测定来评估。例如，产生后，可以收集培养物上清液并且使其向下旋转以去除细胞碎片。可以使用与对照(参考标准)相比等体积的来自测试样品的上清液来转导选定的靶细胞并评估经编码的蛋白质的生物活性通过生物活性测定来测量产量。可以选择用于评估产量的其它合适的方法，包含例如纳米粒子追踪[Povlich,S.F.等人(2016)使用纳米颗粒跟踪分析的rAAV分子的颗粒滴度测定和表征(Particle Titer Determinationand Characterization of rAAV Molecules Using Nanoparticle Tracking Analysis).《分子疗法：AAV载体II(Molecular Therapy:AAV Vectors II)》,24(S1),S122]、酶联免疫吸附测定(ELISA)[Grimm,D.等人(1999).通过新型衣壳ELISA进行AAV-2颗粒滴定：基因组的包装可以限制重组AAV-2的产生(Titration of AAV-2particles via anovel capsidELISA:packaging of genomes can limit production of recombinant AAV-2).《基因疗法》,6(7),1322–1330.doi.org/10.1038/sj.gt.3300946]；已经描述了通过数字液滴(dd)聚合酶链反应(PCR)进行的用于确定单链和自身互补的AAV载体基因组滴度的数字液滴(dd)聚合酶链反应(PCR)方法。参见例如，M.Lock等人,《人类基因疗法方法》.2014年4月；25(2):115-25.doi:10.1089/hgtb.2013.131.电子版2014年2月14日]。另一种合适的方法是qPCR。可以使用经优化的-PCR方法，所述方法利用了广谱丝氨酸蛋白酶，例如蛋白酶K(如可从凯杰公司(Qiagen)商购获得)。更具体地，经优化的qPCR基因组效价测定与标准测定类似，不同之处在于在DNA酶I消化之后，将样品用蛋白酶K缓冲液稀释并用蛋白酶K处理，然后进行热失活。合适地，以等于样品大小的量用蛋白酶K缓冲液稀释样品。蛋白酶K缓冲液可以浓缩2倍或更多倍。通常，蛋白酶K处理为约0.2mg/mL，但是可以在0.1g/mL到约1mg/mL之间变化。处理步骤通常在约55℃下进行持续约15分钟，但是可以在较低温度(例如，约37℃至约50℃)下进行持续较长的时间段(例如，约20分钟至约30分钟)，或者在较高的温度(例如，至多约60℃)下进行持续较短的时间段(例如，约5至10分钟)。类似地，热失活通常在约95℃下持续约15分钟，但是温度可以降低(例如，约70℃到约90℃)并且时间延长(例如，约20分钟到约30分钟)。然后将样品稀释(例如，1000倍)，并如标准测定中所描述的进行TaqMan分析。另一种方法是定量DNA斑点印迹[Wu,Z.等人,(2008).用于肝脏定向表达的自身互补的AAV载体的优化引起低载体剂量下B型血友病的持续校正(Optimization of self-complementary AAV vectors for liver-directed expression results in sustainedcorrection of hemophilia B at low vector dose).《分子疗法：美国基因疗法学会杂志(Molecular therapy:the journal of the American Society of Gene Therapy)》,16(2),280–289.doi.org/10.1038/sj.mt.6300355]。可以选择仍其它方法。

用于测定具有包装的基因组的空衣壳和AAV载体颗粒的方法是本领域已知的。参见例如，Grimm等人,《基因疗法》(1999)6:1322-1330；Sommer等人,《分子疗法》(2003)7:122-128。为了测试变性的衣壳，所述方法包含使经过处理的AAV原液经受SDS-聚丙烯酰胺凝胶电泳(由能够分离三种衣壳蛋白的任何凝胶组成，例如在缓冲液中含有3-8％三乙酸盐的梯度凝胶)，然后运行凝胶直到分离出样品材料，并且将凝胶印迹到尼龙或硝酸纤维素膜(优选地是尼龙)上。然后，将抗AAV衣壳抗体用作与变性的衣壳蛋白结合的初级抗体，优选地抗AAV衣壳单克隆抗体，最优选地B1抗AAV-2单克隆抗体(Wobus等人,《病毒学杂志》(2000)74:9281-9293)。然后使用次级抗体，所述次级抗体与初级抗体结合并且含有一种用于检测与初级抗体的结合的装置，更优选地是含有与其共价结合的检测分子的抗IgG抗体，最优选地是与辣根过氧化物酶共价连接的绵羊抗小鼠IgG抗体。一种用于检测结合的方法用于半定量地确定初级抗体与次级抗体之间的结合，优选地是能够检测放射性同位素发射、电磁辐射或比色变化的检测方法，最优选地是化学发光检测试剂盒。例如，对于SDS-PAGE，可以从柱级分中提取样品并在含有还原剂(例如，DTT)的SDS-PAGE上样缓冲液中加热，并且在预制的梯度聚丙烯酰胺凝胶(例如，Novex)上解析衣壳蛋白。可以根据制造商的说明使用SilverXpress(加利福尼亚州英杰公司(Invitrogen,CA))或其它合适的染色方法(即，SYPRO红宝石色或考马斯染色)进行银染色。在一个实施例中，可以通过定量实时PCR(Q-PCR)测量柱级分中的AAV载体基因组(vg)的浓度。将样品稀释并用DNA酶I(或另一种合适的核酸酶)消化以去除外源性DNA。在核酸酶失活后，使用引物和对引物之间的DNA序列具有特异性的TaqMan

用于确定衣壳蛋白的vp1、vp2与vp3之间的比率的方法也是可用的。参见例如，Vamseedhar Rayaprolu等人,腺相关病毒衣壳稳定性和动力学的比较分析(ComparativeAnalysis of Adeno-Associated Virus Capsid Stability and Dynamics),《病毒学杂志》2013年12月；87(24):13150-13160；Buller RM、Rose JA.1978。KB细胞中腺病毒相关病毒诱导多肽的表征(Characterization of adenovirus-associated virus-inducedpolypeptides in KB cells).《病毒学杂志》25:331-338；以及Rose JA、Maizel JV、InmanJK、Shatkin AJ.1971。腺病毒相关病毒的结构蛋白(Structural proteins ofadenovirus-associated viruses).《病毒学杂志》8:766–770。

如本文所使用的，rAAV的“原液”是指rAAV的群体。尽管由于脱酰胺作用，其衣壳蛋白具有异质性，但是原液中的rAAV被期望共用相同的载体基因组。原液可以包含具有衣壳的rAAV，所述衣壳具有例如所选AAV衣壳蛋白和所选产生系统的特有的异质脱酰胺模式。原液可以从单个产生系统中产生或者从产生系统的多次运行中汇集(例如，使用用于产生的相同遗传元件的产生系统的不同运行)。可以选择各种产生系统，包含但不限于本文所描述的产生系统。

C.药物组合物和施用

在一个实施例中，任选地通过常规方法评估如上所详述用于靶细胞的含有所需转基因和启动子的重组AAV的污染，且接着调配成意图向有需要的受试者施用的药物组合物。此类调配物涉及使用药学上和/或生理学上可接受的媒剂或载体，如缓冲生理盐水或其它缓冲液，例如HEPES，以将pH维持在适当生理水平，和任选地其它药剂、医药剂、稳定剂、缓冲液、载体、佐剂、稀释剂等。对于注射，载体将通常是液体。示例性生理上可接受的载体包含无菌、无热原水和无菌、无热原磷酸盐缓冲盐水。美国专利公开第7,629,322号中提供了各种此类已知载体，所述美国专利公开通过引用并入本文。在一个实施例中，载体是等渗氯化钠溶液。在另一个实施例中，载体是平衡盐溶液。在一个实施例中，载体包含吐温。如果病毒要长期存储，则其可以在甘油或吐温20的存在下冷冻。在另一个实施例中，药学上可接受的载体包括表面活性剂，例如全氟辛烷(Perfluoron液体)。在适合人类受试者输注的缓冲液/载体中调配载体。缓冲液/载体应包含防止rAAV粘附到输液管道上但不干扰rAAV体内结合活性的组分。

在本文所描述的方法的某些实施例中，向受试者肌肉内(IM)施用上文所描述的药物组合物。在其它实施例中，药物组合物是通过静脉内(IV)施用的。在其它实施例中，药物组合物是通过脑室内(ICV)注射施用的。在其它实施例中，药物组合物是通过小脑延髓池内(ICM)注射施用的。可以用于本文所描述的方法的其它施用形式包含但不限于直接递送到期望器官(例如眼睛)，包含视网膜下或玻璃体内递送、口服、吸入、鼻内、气管内、静脉内、肌肉内、皮下、皮内和其它亲本施用途径。如果期望，可以组合施用途径。

如本文所使用的，术语“鞘内递送”或“鞘内施用”是指通过注射到椎管中，更具体地注射到蛛网膜下腔中使得其到达脑脊液(CSF)的施用途径。鞘内递送可以包含腰椎穿刺、心室内(包含脑室内(ICV))、枕骨下/脑池内和/或C1-2穿刺。例如，可以通过腰椎穿刺引入材料以在整个蛛网膜下腔扩散。在另一个实例中，可以向小脑延髓池中注射。

如本文所使用的，术语“脑池内递送”或“脑池内施用”是指直接进入到小脑延髓池(cisterna magna cerebellomedularis)的脑脊液中，更具体地是通过枕骨下穿刺或通过直接注射到小脑延髓池(cisterna magna)中或通过永久定位的管的施用途径。

组合物可以以约0.1μL到约10mL的体积递送，包含所述范围内的所有数字，这取决于待治疗区域的大小、所使用的病毒滴度、施用途径以及所述方法的期望效果。在一个实施例中，体积为约50μL。在另一个实施例中，体积为约70μL。在另一个实施例中，体积为约100μL。在另一个实施例中，体积为约125μL。在另一个实施例中，体积为约150μL。在另一个实施例中，体积为约175μL。在又另一个实施例中，体积为约200μL。在另一个实施例中，体积为约250μL。在另一个实施例中，体积为约300μL。在另一个实施例中，体积为约450μL。在另一个实施例中，体积为约500μL。在另一个实施例中，体积为约600μL。在另一个实施例中，体积为约750μL。在另一个实施例中，体积为约850μL。在另一个实施例中，体积为约1000μL。在另一个实施例中，体积为约1.5mL。在另一个实施例中，体积为约2mL。在另一个实施例中，体积为约2.5mL。在另一个实施例中，体积为约3mL。在另一个实施例中，体积为约3.5mL。在另一个实施例中，体积为约4mL。在另一个实施例中，体积为约5mL。在另一个实施例中，体积为约5.5mL。在另一个实施例中，体积为约6mL。在另一个实施例中，体积为约6.5mL。在另一个实施例中，体积为约7mL。在另一个实施例中，体积为约8mL。在另一个实施例中，体积为约8.5mL。在另一个实施例中，体积为约9mL。在另一个实施例中，体积为约9.5mL。在另一个实施例中，体积为约10mL。

携带在调控序列控制下编码期望的转基因的核酸序列的重组腺相关病毒的有效浓度期望地在约10

优选地，浓度为约1.5×10

在一个实施例中，剂量为约1.5×10

在一个实施例中，有效剂量(递送的总基因组拷贝数)为约10

令人期望的是利用最低有效浓度的病毒以降低如毒性等不期望效果的风险。在这些范围内的仍其它剂量和施用体积可以由主治医师考虑所治疗的受试者(优选地人)的身体状态、受试者的年龄、特定病症和病症(如果进行性的话)已经发展的程度来选择。例如，静脉内递送可能需要大约1.5×10

D.方法

另一方面，提供了一种转导靶细胞或组织的方法。在一个实施例中，所述方法包含施用如本文所描述的rAAV。

在一个实施例中，rAAV的剂量为每剂约1×10

在一个实施例中，所述方法进一步包括向所述受试者施用免疫抑制共疗法。例如，如果检测到针对AAV衣壳的不期望的高中和抗体水平，此类免疫抑制共疗法可以在递送rAAV或所公开的组合物之前开始。在某些实施例中，作为预防措施，共疗法也可以在递送rAAV之前开始。例如，如果在治疗后观察到不期望的免疫应答，在某些实施例中，免疫抑制共疗法在rAAV递送后开始。

用于此类共疗法的免疫抑制剂包含但不限于糖皮质激素、类固醇、抗代谢药、T细胞抑制剂、大环内酯类(例如，雷帕霉素或雷帕霉素类似物)以及细胞生长抑制剂，包含烷化剂、抗代谢药、细胞毒性抗生素、抗体或对免疫亲和素具有活性的药剂。免疫抑制剂可以包含强的松(prednisone)、氮芥(nitrogen mustard)、亚硝基脲(nitrosourea)、铂化合物、甲氨蝶呤(methotrexate)、硫唑嘌呤(azathioprine)、巯嘌呤(mercaptopurine)、氟尿嘧啶(fluorouracil)、更生霉素(dactinomycin)、蒽环霉素(anthracycline)、丝裂霉素C(mitomycin C)、博来霉素(bleomycin)、光神霉素(mithramycin)、IL-2受体(CD25)或CD3定向抗体、抗IL-2抗体、环孢素(ciclosporin)、他克莫司(tacrolimus)、西罗莫司(sirolimus)、IFN-β、IFN-γ、阿片类或TNF-α(肿瘤坏死因子-α)结合剂。在某些实施例中，在rAAV施用之前，可以从第0天、第1天、第2天、第7天或第更多天开始免疫抑制疗法，或者在rAAV施用之后，可以从第0天、第1天、第2天、第3天、第7天或第更多天开始免疫抑制疗法。此类疗法可以涉及单一药物(例如，强的松)或在同一天内共施用两种或更多种药物(例如，强的松、霉酚酸酯(MMF)和/或西罗莫司(即，雷帕霉素))。可以在基因疗法施用之后以相同的剂量或经过调整的剂量继续使用这些药物中的一种或多种药物。根据需要，此类疗法可以持续约1周(7天)、两周、三周、约60天或更长时间。在某些实施例中，选择无他克莫司的方案。

下文将另外的实施例列为1至12。

1.一种重组腺相关病毒(rAAV)，其包括衣壳和载体基因组，所述载体基因组包括AAV 5'反向末端重复序列(ITR)、包括可操作地连接到表达控制序列的编码基因产物的核酸序列的表达盒和AAV 3'ITR，其中所述衣壳是：

(a)AAVrh75衣壳，所述AAVrh75衣壳由以下组成：(i)由编码SEQ ID NO:40的核酸序列或与其至少99％相同的基于SEQ ID NO:40的编号在位置24处具有Asn(N)氨基酸残基的序列产生的衣壳；(ii)由编码SEQ ID NO:40的序列或与其至少95％相同的序列的SEQ IDNO:39的核酸序列产生的衣壳；或(iii)作为AAVrh75 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白至少在SEQ ID NO:40的N57、N262、N384和/或N512位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(b)AAVhu71/74衣壳，所述AAVhu71/74衣壳由以下组成：(i)由编码SEQ ID NO:3的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:4的序列或与其至少95％相同的序列的SEQID NO:3的核酸序列产生的衣壳；或(iii)作为AAVrh71/74vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:4的至少4个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(c)AAVhu79衣壳，所述AAVhu79衣壳由以下组成：(i)由编码SEQ ID NO:6的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:6的序列或与其至少95％相同的序列的SEQ ID NO:5的核酸序列产生的衣壳；或(iii)作为AAVhu79 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:6的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(d)AAVhu80衣壳，所述AAVhu80衣壳由以下组成：(i)由编码SEQ ID NO:8的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:8的序列或与其至少95％相同的序列的SEQ ID NO:7的核酸序列产生的衣壳；或(iii)作为AAVhu80 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:8的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(e)AAVhu83衣壳，所述AAVhu83衣壳由以下组成：(i)由编码SEQ ID NO:10的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:10的序列或与其至少95％相同的序列的SEQ IDNO:9的核酸序列产生的衣壳；或(iii)作为AAVhu83 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:10的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(f)AAVhu74/71衣壳，所述AAVhu74/71衣壳由以下组成：(i)由编码SEQ ID NO:12的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:12的序列或与其至少95％相同的序列的SEQ ID NO:11的核酸序列产生的衣壳；或(iii)作为AAVhu74/71vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:12的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(g)AAVhu77衣壳，所述AAVhu77衣壳由以下组成：(i)由编码SEQ ID NO:14的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:14的序列或与其至少95％相同的序列的SEQ IDNO:13的核酸序列产生的衣壳；或(iii)作为AAVhu77 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:14的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(h)AAVhu78/88衣壳，所述AAVhu78/88衣壳由以下组成：(i)由编码SEQ ID NO:16的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:16的序列或与其至少95％相同的序列的SEQ ID NO:15的核酸序列产生的衣壳；或(iii)作为AAVhu78/88vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:16的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(i)AAVhu70衣壳，所述AAVhu70衣壳由以下组成：(i)由编码SEQ ID NO:18的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:18的序列或与其至少95％相同的序列的SEQ IDNO:17的核酸序列产生的衣壳；或(iii)作为AAVhu70 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:18的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(j)AAVhu72衣壳，所述AAVhu72衣壳由以下组成：(i)由编码SEQ ID NO:20的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:20的序列或与其至少95％相同的序列的SEQ IDNO:19的核酸序列产生的衣壳；或(iii)作为AAVhu72 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:20的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(k)AAVhu75衣壳，所述AAVhu75衣壳由以下组成：(i)由编码SEQ ID NO:22的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:22的序列或与其至少95％相同的序列的SEQ IDNO:21的核酸序列产生的衣壳；或(iii)作为AAVhu75 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:22的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(l)AAVhu76衣壳，所述AAVhu76衣壳由以下组成：(i)由编码SEQ ID NO:24的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:24的序列或与其至少95％相同的序列的SEQ IDNO:23的核酸序列产生的衣壳；或(iii)作为AAVhu76 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:24的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(m)AAVhu81衣壳，所述AAVhu81衣壳由以下组成：(i)由编码SEQ ID NO:26的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:26的序列或与其至少95％相同的序列的SEQ IDNO:25的核酸序列产生的衣壳；或(iii)作为AAVhu81 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:26的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(n)AAVhu82衣壳，所述AAVhu82衣壳由以下组成：(i)由编码SEQ ID NO:28的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:28的序列或与其至少95％相同的序列的SEQ IDNO:27的核酸序列产生的衣壳；或(iii)作为AAVhu82 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:28的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(o)AAVhu84衣壳，所述AAVhu84衣壳由以下组成：(i)由编码SEQ ID NO:30的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:30的序列或与其至少95％相同的序列的SEQ IDNO:29的核酸序列产生的衣壳；或(iii)作为AAVhu84 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:30的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(p)AAVhu86衣壳，所述AAVhu86衣壳由以下组成：(i)由编码SEQ ID NO:32的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:32的序列或与其至少95％相同的序列的SEQ IDNO:31的核酸序列产生的衣壳；或(iii)作为AAVhu86 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:32的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(q)AAVhu87衣壳，所述AAVhu87衣壳由以下组成：(i)由编码SEQ ID NO:34的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:34的序列或与其至少95％相同的序列的SEQ IDNO:33的核酸序列产生的衣壳；或(iii)作为AAVhu87 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:34的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(r)AAVhu88/78衣壳，所述AAVhu88/78衣壳由以下组成：(i)由编码SEQ ID NO:36的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:36的序列或与其至少95％相同的序列的SEQ ID NO:35的核酸序列产生的衣壳；或(iii)作为AAVhu88/78vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:36的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(s)AAVhu69衣壳，所述AAVhu69衣壳由以下组成：(i)由编码SEQ ID NO:38的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:38的序列或与其至少95％相同的序列的SEQ IDNO:37的核酸序列产生的衣壳；或(iii)作为AAVhu69 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:38的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(t)AAVrh76衣壳，所述AAVrh76衣壳由以下组成：(i)由编码SEQ ID NO:42的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:42的序列或与其至少95％相同的序列的SEQ IDNO:41的核酸序列产生的衣壳；或(iii)作为AAVhu69 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:42的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(u)AAVrh77衣壳，所述AAVrh77衣壳由以下组成：(i)由编码SEQ ID NO:44的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:44的序列或与其至少95％相同的序列的SEQ IDNO:43的核酸序列产生的衣壳；或(iii)作为AAVrh71 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:44的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(v)AAVrh78衣壳，所述AAVrh78衣壳由以下组成：(i)由编码SEQ ID NO:46的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:46的序列或与其至少95％相同的序列的SEQ IDNO:45的核酸序列产生的衣壳；或(iii)作为AAVrh78 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:46的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(w)AAVrh81衣壳，所述AAVrh81衣壳由以下组成：(i)由编码SEQ ID NO:50的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:50的序列或与其至少95％相同的序列的SEQ IDNO:49的核酸序列产生的衣壳；或(iii)作为AAVrh81 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:50的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(x)AAVrh89衣壳，所述AAVrh89衣壳由以下组成：(i)由编码SEQ ID NO:52的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:52的序列或与其至少95％相同的序列的SEQ IDNO:51的核酸序列产生的衣壳；或(iii)作为AAVrh89 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:52的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(y)AAVrh82衣壳，所述AAVrh82衣壳由以下组成：(i)由编码SEQ ID NO:54的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:54的序列或与其至少95％相同的序列的SEQ IDNO:53的核酸序列产生的衣壳；或(iii)作为AAVrh82 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:54的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(z)AAVrh83衣壳，所述AAVrh83衣壳由以下组成：(i)由编码SEQ ID NO:56的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:56的序列或与其至少95％相同的序列的SEQ IDNO:55的核酸序列产生的衣壳；或(iii)作为AAVrh83 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:56的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(aa)AAVrh84衣壳，所述AAVrh84衣壳由以下组成：(i)由编码SEQ ID NO:58的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:58的序列或与其至少95％相同的序列的SEQ IDNO:57的核酸序列产生的衣壳；或(iii)作为AAVrh84 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:58的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(bb)AAVrh85衣壳，所述AAVrh85衣壳由以下组成：(i)由编码SEQ ID NO:60的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:60的序列或与其至少95％相同的序列的SEQ IDNO:59的核酸序列产生的衣壳；或(iii)作为AAVrh85 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:60的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；

(cc)AAVrh87衣壳，所述AAVrh87衣壳由以下组成：(i)由编码SEQ ID NO:62的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:62的序列或与其至少95％相同的序列的SEQ IDNO:61的核酸序列产生的衣壳；或(iii)作为AAVrh87 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:62的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化；或

(dd)AAVhu73衣壳，所述AAVhu73衣壳由以下组成：(i)由编码SEQ ID NO:74的核酸序列产生的衣壳；(ii)由编码SEQ ID NO:74的序列或与其至少95％相同的序列的SEQ IDNO:73的核酸序列产生的衣壳；或(iii)作为AAVrh73 vp1、vp2和vp3蛋白的异质混合物的衣壳，所述蛋白在SEQ ID NO:74的至少四个位置中95％至100％脱酰胺化，并且任选地在其它位置中脱酰胺化。

2.根据实施例1所述的rAAV，其中所述基因产物可用于治疗肝脏病症或疾病，并且其中所述衣壳是AAVrh75、AAVrh79、AAVrh83或AAVrh84衣壳。

3.根据实施例1所述的rAAV，其中所述基因产物是基因编辑核酸酶。

4.根据权利要求1所述的rAAV，其中基因编码基因编辑核酸酶。

5.根据实施例1至4中任一项所述的rAAV，其中所述表达盒包括组织特异性启动子。

6.一种宿主细胞，其含有根据实施例1至5中任一项所述的rAAV。

7.一种药物组合物，其包括根据实施例1至5中任一项所述的rAAV以及生理上相容的载体、缓冲液、佐剂和/或稀释剂。

8.一种将转基因递送到细胞的方法，所述方法包括使所述细胞与根据实施例1至5中任一项所述的rAAV接触的步骤，其中所述rAAV包括所述转基因。

9.一种产生包括AAV衣壳的重组腺相关病毒(rAAV)的方法，所述方法包括培养含有以下的宿主细胞：(a)分子，所述分子编码AAVrh75(SEQ ID NO:40)、AAVhu71/74(SEQ IDNO:4)、AAVhu79(SEQ ID NO:6)、AAVhu80(SEQ ID NO:8)、AAVhu83(SEQ ID NO:10)、AAVhu74/71(SEQ ID NO:12)、AAVhu77(SEQ ID NO:14)、AAVhu78/88(SEQ ID NO:16)、AAVhu70(SEQ ID NO:18)、AAVhu72(SEQ ID NO:20)、AAVhu75(SEQ ID NO:22)、AAVhu76(SEQID NO:24)、AAVhu81(SEQ ID NO:26)、AAVhu82(SEQ ID NO:28)、AAVhu84(SEQ ID NO:30)、AAVhu86(SEQ ID NO:32)、AAVhu87(SEQ ID NO:34)、AAVhu88/78(SEQ ID NO:36)、AAVhu69(SEQ ID NO:38)、AAVrh76(SEQ ID NO:42)、AAVrh77(SEQ ID NO:44)、AAVrh78(SEQ ID NO:46)、AAVrh81(SEQ ID NO:50)、AAVrh89(SEQ ID NO:52)、AAVrh82(SEQ ID NO:54)、AAVrh83(SEQ ID NO:56)、AAVrh84(SEQ ID NO:58)、AAVrh85(SEQ ID NO:60)、AAVrh87(SEQ ID NO:62)或AAVhu73(SEQ ID NO:74)的AAV vp1、vp2和/或vp3衣壳蛋白、或与SEQ ID NO:40、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、42、44、46、50、52、54、56、58、60、62或74中的任何一个共用至少99％同一性的AAV vp1、vp2和/或vp3衣壳蛋白；(b)功能性rep基因；(c)包括AAV反向末端重复序列(ITR)和转基因的载体基因组；以及(d)足以允许将所述载体基因组包装到AAV衣壳蛋白中的辅助功能。

10.一种质粒，其包括AAVrh75(SEQ ID NO:39)、AAVhu71/74(SEQ ID NO:3)、AAVhu79(SEQ ID NO:5)、AAVhu80(SEQ ID NO:7)、AAVhu83(SEQ ID NO:9)、AAVhu74/71(SEQID NO:11)、AAVhu77(SEQ ID NO:13)、AAVhu78/88(SEQ ID NO:15)、AAVhu70(SEQ ID NO:17)、AAVhu72(SEQ ID NO:19)、AAVhu75(SEQ ID NO:21)、AAVhu76(SEQ ID NO:23)、AAVhu81(SEQ ID NO:25)、AAVhu82(SEQ ID NO:27)、AAVhu84(SEQ ID NO:29)、AAVhu86(SEQ ID NO:31)、AAVhu87(SEQ ID NO:33)、AAVhu88/78(SEQ ID NO:35)、AAVhu69(SEQ ID NO:37)、AAVrh76(SEQ ID NO:41)、AAVrh77(SEQ ID NO:43)、AAVrh78(SEQ ID NO:45)、AAVrh81(SEQID NO:49)、AAVrh89(SEQ ID NO:51)、AAVrh82(SEQ ID NO:53)、AAVrh83(SEQ ID NO:55)、AAVrh84(SEQ ID NO:57)、AAVrh85(SEQ ID NO:59)、AAVrh87(SEQ ID NO:61)或AAVhu73(SEQ ID NO:73)的vp1、vp2和/或vp3序列、或与SEQ ID NO:39、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、41、43、45、49、51、53、55、57、59、61或73中的任何一个共用至少95％同一性的vp1、vp2和/或vp3序列。

11.一种培养的宿主细胞，其含有根据实施例10所述的质粒。

以下实例是对本发明某些实施例的说明，而不是对其的限制。

实例

腺相关病毒(AAV)由于其良好的生物学和安全特性作为基因转移载体具有优势，发现新型AAV变体是改进此治疗平台的关键。迄今为止，研究人员已使用基于聚合酶链反应(PCR)的方法从天然来源中分离200多种AAV。比较了两种现代DNA聚合酶和其在分离和扩增AAV基因组方面的效用。与热启动聚合酶(HotStar polymerase)相比，较高保真的Q5热启动高保真DNA聚合酶对输入的AAV序列提供了更精确和准确的扩增。较低保真的热启动DNA聚合酶在分离和扩增过程期间引入了突变，从而产生了与输入的AAV基因相比具有可变生物活性的多个突变衣壳。Q5聚合酶能够成功发现来自人类和非人类灵长类动物组织来源的新型AAV衣壳序列。来自这些来源的新型AAV序列示出了阳性选择的证据。此研究强调了使用可用的最高保真的DNA聚合酶准确分离和表征天然来源的AAV基因组以最终开发更有效的基因疗法载体的重要性。

腺相关病毒(AAV)是用于若干种临床适应症的基因转移的安全且有效媒剂。AAV介导的基因疗法药物已被FDA批准用于治疗脊髓性肌萎缩症和莱伯氏先天性黑蒙(LeberCongenital Amaurosis)。这些批准的基因疗法产品以及目前正在开发的许多其它产品都使用从天然来源分离的AAV衣壳作为递送媒剂

已经使用随时间推移出现和演化的各种技术从自然来源中分离AAV Cap序列，但最常见的方法涉及PCR扩增。第一，可以对提取的病毒DNA直接进行测序；此方法用于鉴定AAV2，发现所述AAV2在细胞培养中与辅助腺病毒一起繁殖。其次，可以提取已提取的病毒DNA，将其克隆到质粒骨架中并且进行测序(AAV1、AAV3、AAV3B、AAV6和AAV5)。第三，可以通过PCR提取病毒基因组并且将扩增子克隆到质粒中，然后再进行桑格测序(Sangersequencing)。许多来自灵长类动物、牛、猪、啮齿动物和其它的AAV已经使用这种方法分离。哺乳动物基因组DNA的下一代测序(NGS)分析已检测到内源性AAV基因组元件的片段。最近，使用鸟枪NGS对复杂样品中的数千个DNA分子同时进行测序的宏基因组病毒组测序研究已经鉴定了许多新型AAV序列。

使用PCR进行AAV扩增提供了用于发现新型AAV衣壳序列的直接且有效的方法。然而，重要的是利用具有高保真复制能力的PCR酶尽可能准确地扩增病毒序列。具有高错掺率和模板转换率的酶可以显著混淆测序数据并干扰新型AAV衣壳发现。事实上，由于使样品中的‘真实’遗传变异偏移的扩增错误，低保真聚合酶在扩增衣壳序列时引入的人工变异性可能损害AAV生物学和多样性的研究。

目的是比较多种AAV PCR方法来筛选AAV天然分离株基因组的组织样品，以扩大可用于表征为潜在基因递送载体的衣壳序列的广度。发现更多的衣壳增加了成功鉴定可以将治疗性转基因高效转移到一系列组织，在高剂量下降低了免疫原性并且在人群体中具有比现有AAV衣壳更少的普遍中和抗体谱的那些衣壳的机会。鉴于DNA聚合酶技术自近20年前最后一波AAV发现以来经历了重大发展，比较了两种现代DNA聚合酶和分离AAV序列的扩增方法。发现与较低保真的热启动DNA聚合酶相比，Q5热启动高保真DNA聚合酶以更高的准确度从输入模板生成PCR产物。使用Q5 DNA聚合酶，还通过进行系统发育分析研究了新分离的AAV衣壳序列的遗传多样性。此外，发现新型AAV自然分离株通过阳性选择示出进化的证据。

实例1：材料和方法

从非人灵长类动物和人组织中提取DNA

非人灵长类动物(猕猴)组织样品是从宾夕法尼亚大学佩雷尔曼医学院(University of Pennsylvania's Perelman School of Medicine)的基因疗法项目的尸检中收集的。获得人组织样品(包含主动脉瓣、骨髓、脑、乳腺、宫颈、结肠、心脏、肠、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、心包、骨骼肌和脾脏)。使用QIAamp DNA迷你试剂盒(马里兰州日耳曼敦的凯杰公司(QIAGEN Inc.,Germantown,MD))提取基因组DNA。

常规AAV分离

为了从宿主基因组DNA中扩增3.1kb AAV基因组序列，使用制造商确定的工作条件(马萨诸塞州伊普斯维奇的新英格兰生物实验室(New England Biolabs,Ipswich,MA))，利用Q5热启动高保真DNA聚合酶。使用先前所描述的AV1NS正向引物和AV2CAS反向引物来分离AAV基因组；用T(AV1NS 5'-GCTGCGTCAACTGGACCAATGAGAAC-3'；SEQ ID NO:63)和AV2CAS(5'-CGCAGAGACCAAAGTTCAACTGAAACGA-3'；SEQ ID NO:64)替代了AV1NS中的简并碱基Y(GaoGP等人《美国国家科学院院刊》2002；99:11854-59)，因为T是AAV序列系统发育中表示的主要核苷酸，跨越许多AAV进化枝。如Q5方案中所描述的，每种引物以0.5μM的最终浓度使用(马萨诸塞州伊普斯维奇的新英格兰生物实验室)。应用以下热循环条件：98℃下持续30秒；98℃下持续10秒、59℃下持续10秒、72℃下持续93秒、50个循环；以及72℃下延伸持续120秒。对PCR产物进行TOPO克隆(马塞诸塞州沃尔瑟姆的赛默飞世尔科技公司)和桑格测序(新泽西州南普莱恩菲尔德的金唯智公司(GENEWIZ,South Plainfield,NJ))。对于大多数PCR产物，至少对三个克隆进行了测序。

通过单一基因组扩增进行AAV分离

先前通过常规AAV分离PCR发现呈AAV阳性的人心脏组织样品的基因组DNA经受AAV-SGA。含有AAV的基因组DNA通过连续稀释在20ng/μL剪切鲑鱼精子DNA(德克萨斯州奥斯汀的艾莫宾公司(Ambion,Inc,Austin,TX))中进行终点稀释。使用AV1NS和AV2CAS引物，将来自每个连续稀释的材料用作96次PCR反应的模板(Mueller C等人《微生物学的当前方案(Curr Protoc Microbiol)》2012；第14章:单元14D11)。使用以下循环条件利用Q5热启动高保真DNA聚合酶(马萨诸塞州伊普斯维奇的新英格兰生物实验室)扩增AAV DNA：98℃下持续30秒；98℃下持续10秒、59℃下持续10秒、72℃下持续93秒、50个循环；以及72℃下延伸持续120秒。对于泊松分布(Poisson distribution)，在不超过30％的孔中产生PCR产物的DNA稀释液在超过80％的情况下每个阳性PCR包含一个可扩增的AAV DNA模板(Salazar-GonzalezJF等人《病毒学杂志》2008；82:3952-70)。使用Agencourt Ampure XP珠粒(加利福尼亚州布雷亚的贝克曼库尔特公司(Beckman Coulter,Brea,CA))纯化来自阳性PCR反应的AAV DNA扩增子，使用

序列分析

使用载体NTI

聚合酶保真比较

pAAV2/9反式质粒用作模板。为了确保模板是纯的，首先将质粒重新转化为稳定的感受态大肠杆菌(E.coli)细胞(马塞诸塞州沃尔瑟姆的赛默飞世尔科技公司)，并且通过NGS(加利福尼亚州圣地亚哥的依诺米那公司)对两个单菌落克隆进行测序，如先前所描述的(Saveliev A等人《人类基因疗法方法》2018；29:201-11)。为确保输入pAAV2/9反式质粒的完整序列同一性，使用两个测序质粒之一作为后续实验的模板。在这项比较研究中，热启动高保真聚合酶(Hot Star HiFidelity polymerase，“HiFi”)(马里兰州日耳曼敦的凯杰公司)是较低保真的聚合酶，而Q5热启动高保真DNA聚合酶(Q5)(马萨诸塞州伊普斯维奇的新英格兰生物实验室)是较高保真的聚合酶。对于“HiFi环状”，pAAV2/9反式质粒被稀释并用作PCR模板。对于“HiFi线性”和“Q5线性”，pAAV2/9反式质粒用限制酶PvuII(马萨诸塞州伊普斯维奇的新英格兰生物实验室)线性化，然后稀释用作模板。对于所有第一轮PCR，在25-μL反应中利用了模板的五个拷贝。在第二轮中，使用1μL第一轮PCR产物作为50-μL反应的模板。PCR条件基于制造商的指南。

对于所有“HiFi”实验，采用了热启动高保真聚合酶(马里兰州日耳曼敦的凯杰公司)。AV1NS'和AV2CAS引物是根据制造商的方案使用的。对第一轮PCR应用了以下热循环条件：95℃下持续300秒；94℃下持续15秒、63℃下持续60秒、68℃下持续371秒、40个循环；以及72℃延伸下持续600秒。对于第二轮PCR，使用引物McapF3SpeI(5'-ATCGATACTAGTCCATCGACGTCAGACGCGGAAG-3'；SEQ ID NO:65)和McapR1NotI(5'-ATCGATGCGGCCGCAGTTCAACTGAAACGAATTAAACGGT-3'；SEQ ID NO:66)来进行巢式反应。McapF3SpeI和McapR1NotI'在先前关于AAV PCR技术的出版物中描述(Smith LJ等人《分子疗法》2014；22:1625-1634)。McapR1NotI'是上述出版物中引物McapR1NotI的修改版本；修改了McapR1NotI以纠正其3'端附近的两个碱基对，所述碱基对不与包含先前出版物中报告的分离株的任何报告的AAV序列对准。1μL第一轮PCR产物用作第二轮巢式PCR的模板。以下热循环条件用于第二轮PCR：95℃下持续300秒；94℃下持续15秒、63℃下持续60秒、68℃下持续315秒、40个循环；以及72℃延伸下持续600秒。

对于第一轮“Q5”反应，使用了Q5热启动高保真DNA聚合酶主混合物(马萨诸塞州伊普斯维奇的新英格兰生物实验室)。根据制造商的方案使用每个反应中的AV1NS'和AV2CAS引物。热循环条件如下：98℃下持续30秒；98℃下持续10秒、59℃下持续30秒、72℃下持续186秒、40个循环；以及72℃延伸下持续120秒。对于第二轮“Q5”反应，利用引物McapF3SpeI和McapR1NotI'。1μL第一轮“Q5”PCR产物用作每个50-μL反应中的第二轮巢式PCR的模板。热循环条件如下：98℃下持续30秒；98℃下持续10秒、66℃下持续30秒、72℃下持续164秒、40个循环；以及72℃延伸下持续120秒。然后对PCR产物进行TOPO克隆和测序。

载体产生、定量PCR(qPCR)滴定和Huh7转导测定

对于六孔板中的AAV载体产生，基于减少的培养面积改编了先前描述的1-cell-stack规模HEK293三重转染方案，其中进行了一些修改：1)使用的质粒比率为2:1:0.1(含有所需腺病毒辅助基因的辅助质粒:含有AAV2 Rep和AAV衣壳基因的反式质粒:含有CB7启动子、萤火虫荧光素酶基因和兔β珠蛋白聚腺苷酸化序列转基因的顺式质粒(即，CB7.ffluciferase.rBG)，按重量计)，并且2)在采集时，除了冷冻/解冻外未进行其它处理(Lock M等人《人类基因疗法》2010；21:1259-1271)。使用引物和针对载体poly A序列的探针通过qPCR测量了载体产生滴度。

AAV VP1序列进化分析

应用Geneious版本2019.2(geneious.com)构建DNA序列比对，并且使用Geneious比对算法。使用针对情景多样化的分支位点无限制统计测试(BUSTED)和混合效应进化模型(MEME)程序对AAV VP1 DNA序列进行阳性选择假设测试统计分析。固定效应似然(FEL)测试用于进行阴性选择假设测试。这些程序在datamonkey.org处的HyPhy服务器上运行。对于人和恒河猴AAV自然分离株，使用BUSTED和FEL将每个新分离株的系统发育分支与以其最接近的BLASTn命中结束的分支进行比较。对于AAVHSC和AAV HiFi PCR突变体变体，将系统发育的所有分支作为整体进行测试以确定由于这些群体的固有序列相似性，阳性选择是否发生在整个树的任何可能位点处(Smith LJ等人《分子疗法》2014；22:1625-34)。BUSTED和FEL利用似然比测试来确定显著性，即，是否存在跨基因的阳性或阴性选择的证据。对于MEME分析，评估了每个系统发育(人、恒河猴、HSC和HiFi)的阳性情景或普遍选择的存在。MEME使用似然比测试来确定显著性。产生p<0.05的结果被认为是显著的。由于AAVrh81与所述组的其余部分的显著序列差异，因此从恒河猴系统发育中去除AAVrh81以进行分析。

使用MAFFT版本7服务器(mafft.cbrc.jp/alignment/server/)使用邻接法构建了所有系统发育树。树被自举100次并且使用FigTree(tree.bio.ed.ac.uk/software/figtree/)格式化。

统计学

对于图2A，使用威尔科克森秩和测试，使用R程序(版本3.5.0；cran.r-project.org)内的“wilcox.test”函数，对每组进行成对比较。对于图2B和图2C，斯图登氏t测试用于使用R程序(版本4.0.0；cran.r-project.org)内的“t.test”函数将每个突变体与AAV9进行比较。统计显著性在0.05水平下评估。

实例2：较低保真的DNA聚合酶产生更多的随机错配错误

首先评估了聚合酶保真对AAV分离的影响，以对较低保真的DNA聚合酶会产生具有较高PCR错误频率的扩增子的断言进行测试。在含有具有不同复制保真水平的DNA聚合酶的反应中使用含有AAV2 Rep基因和AAV9 Cap基因的纯的、经NGS验证的AAV9反式质粒(即，pAAV2/9)作为PCR模板。应用高保真聚合酶，即，Q5热启动高保真DNA聚合酶(Q5)和相对较低保真的聚合酶，即，热启动高保真(HiFi)聚合酶，因为它们的已知聚合酶保真水平不同。采用与HiFi聚合酶相同的用于分离AAV自然分离株AAVHSC1-17的方案(Smith LJ等人《分子疗法》2014；22:16-1634)，发现与使用高保真Q5 DNA聚合酶产生的那些质粒相比，从HiFi聚合酶PCR产物克隆和测序的质粒跨VP1区域含有多30％–60％的随机错误发生率：分别来自HiFi环状和线性组的十九个总测序PCR产物克隆中的十一个和二十个总测序PCR产物克隆中的六个含有至少一个错配。相比之下，20和24个测序的PCR产物克隆中只有一个分别在Q5线性和环状组中具有错配(图2A、图2D和表1)。

接下来的目的是确定从HiFi聚合酶实验中产生的AAV9 PCR分离衣壳序列是否是功能性的。将分离株克隆到含有AAV2 Rep基因的pAAV2/9反式质粒中，使得每个质粒都含有突变体AAV9 VP1 Cap基因，然后使用这些突变体反式质粒产生含有萤火虫荧光素酶转基因(即，CB7.ffluciferase.rBG)的AAV载体。突变体衣壳中的两个突变体衣壳以与野生型AAV9(D87G和G174D)的水平类似的水平产生载体滴度。与AAV9相比，其余突变体示出载体产生能力降低(图2B)。P32S具有比AAV9低17％的滴度，而G177S、Q299H和Q678R示出产生滴度降低80％-90％。与AAV9相比，S632F、K33T L648I和S348P M436T示出降低60％-65％。突变体的Huh7感染滴度(图2C)示出与其载体产生滴度类似的模式，其中具有一些例外——例如，突变体P32S的产生滴度为AAV9的约83％，但其Huh7感染滴度仅为AAV9的约6％，暗示突变P32S可能会损害衣壳的Huh7转导，这值得进一步研究。总之，这些结果表明低保真的HiFi DNA聚合酶以可能会损害新型分离株的发现和表征的不可预测的方式产生具有可变功能特性的突变体。

表1.具有PCR聚合酶介导的DNA突变和其相关氨基酸变化的列出的克隆。基于AAV9VP1序列的突变DNA和蛋白质编号。AAV9 VP核酸序列(SEQ ID NO:67)。AAV9VP1氨基酸序列(SEQ ID NO:68)。

实例3：使用高保真PCR聚合酶从非人灵长类动物和人组织中分离来自多个进化枝的新型AAV序列

基因疗法的进步需要鉴定新型AAV衣壳。目前使用的大多数AAV天然变体源自灵长类动物组织。使用经过验证的基于高保真Q5 PCR的技术，研究了是否可以从一组灵长类动物组织样品中分离新的衣壳序列。使用与衣壳序列保守区域结合的引物来扩增3.1-kb AAV扩增子，以便检测和扩增50个非人灵长类动物肠道组织样品中存在的AAV基因组。以这种方式，发现了12个AAV天然分离株序列。大多数这些分离株属于进化枝D或E或含有AAVrh32.33的灵长类外群进化枝(表2)。

表2.从非人灵长类动物肠道组织样品中回收的新型AAV天然分离株以及与最接近的已知AAV的序列相似性。

还使用Q5聚合酶从271个人组织样品中筛选了基因组DNA，并且获得了22个新的AAV天然分离株衣壳序列，包含进化枝F成员AAVhu68(SEQ ID NO:1)。那些新的AAV序列是从心脏、肠道、肾脏、肝脏、肺和脾脏中分离的。总体而言，8％的人样品对AAV呈阳性。大多数新型人分离株可以归类为进化枝B和C病毒，或者类似于AAV2和AAV2-AAV3杂合体(表3)。尽管具有与先前报告的GenBank条目(即，AAVhu32、AAV9和CHC367_AAV)相同的蛋白质序列，但三种人源性天然分离株仍显示出新型DNA序列。

表3.从人组织样品中回收的新型AAV天然分离株以及与最接近的已知AAV的序列相似性。

实例4：AAV单一基因组扩增(AAV-SGA)以高精度和准确度鉴定天然分离株AAVhu68衣壳序列

单一基因组扩增(SGA)可以准确地从混合样品中扩增单个病毒序列。基于Salazar等人和其它先前对感染患者的HIV基因组动态的扩增和研究的报告(Salazar-Gonzalez JF等人《病毒学杂志》2008；82:3952-70；Simmonds P等人《病毒学杂志》1990；64:5840-50)，采用SGA(图1)以使用上述高保真Q5聚合酶(数据未示出)从哺乳动物组织样品中准确分离AAV序列。在此技术中，经终点稀释的基因组DNA充当PCR模板，并且在每个扩增子阳性PCR中仅含有一个可扩增的AAV基因组。由于此方法的复制性质，所述方法防止由DNA聚合酶诱导的突变引起的序列歧义。此技术还减轻了DNA混合物中可能发生的DNA聚合酶模板转换问题(从而引起人工重组扩增子的恢复)，因为每个反应中只扩增了一个AAV基因组。

试图通过在其起源的同一组织样品上进行AAV-SGA来验证先前分离的AAVhu68的序列，如表2中所描述的。此技术与高保真Q5聚合酶的使用组合，使得能够以高精度和准确度确认此序列的同一性。结果表明，从此样品中回收的所有单AAV基因组与先前的常规Q5PCR分离的AAVhu68序列具有99.94％–100％的衣壳序列同一性。在从此样品中回收的61个源自单AAV基因组的扩增子中，只有七个扩增子与原始序列有1至2个核苷酸错配。绝大多数(54/61)扩增子与先前分离的AAVhu68衣壳序列具有100％的DNA序列同一性，表明使用Q5聚合酶生成的序列数据可以以高置信度解释。

实例5：AAV天然分离株衣壳蛋白序列示出阳性选择的证据

使用Q5聚合酶AAV分离策略，能够研究AAV基因组的进化特性，其中PCR介导的错误影响最小。观察到根据GenBank序列数据库，若干个回收的AAV天然分离株衣壳序列与其最接近的、先前报告的AAV序列相比时具有比对应蛋白质序列变化更多数量的DNA差异。

如果病毒经历有利于特定基因突变的选择压力，则预计所述区域的非同义突变率(dN)将高于同义突变率(dS)。序列内的有害突变是相反的。为了评估从灵长类动物组织中分离的AAV序列的进化稳定性，进行了统计分析以确定跨新型AAV的整个VP1基因与其最接近的天然分离株序列相比时是否存在阳性、多样化选择的证据。使用针对情景多样化的分支位点无限制统计测试(BUSTED)，因为它易于用于对小组类似序列进行进化分析(MurrellB等人《分子生物学与进化(Molecular Biology and Evolution)》2015；32:1365-71)。BUSTED确定整个所关注的基因的dN/dS比率——跨越系统发育树内不同分支组——是否暗示阳性选择。在若干个分支点处检测到统计显著性(p<0.05)，表明VP1基因中至少一个位点在系统发育的测试分支之间经历了多样化选择(图3A-图3C、图4和表4)。

表4.新型AAV VP1基因与最接近的天然分离株序列的BUSTED分析。p值

在3/20的案例中，人源性AAV天然分离株对于从其最接近的天然分离株进化枝成员中进行多样化选择呈阳性(图3A，表4)。在3/9的恒河猴分离株实例中，在跨衣壳序列的至少一个区域中，多样化选择是明显的(图3B，表4)。相比之下，当比较来自一组先前公开的源自人类造血干细胞(HSC)的AAV天然分离株的整个序列系统发育的测试分支时，BUSTED分析没有示出阳性、多样化选择的证据(图3C，表4)。同样，HiFi PCR突变体AAV VP1基因也没有示出阳性选择的证据(表1、表4和图4)。

除了针对阳性选择进行全基因测试外，还评估了每个系统发育的VP1基因内的单个位点是否示出阳性选择或阴性选择的证据。为了分析每组AAV序列的阳性选择的进化热点的存在，使用了混合效应进化模型(MEME)程序，因为所述程序能够检测情景和普遍选择。

MEME检测到十三个位点，所述位点显示了从人样品中分离的AAV的VP1基因中阳性多样化选择的证据(表5)。这些位点中的四个位点位于衣壳基因的高变区域(HVR)(即，显示显著序列多样性的表面暴露衣壳区域)。六个位点位于内部VP1独特区域(VP1u)。另外，在来自恒河猴的样品的衣壳序列数据集中发现了19个显著性位点(表5)。在这19个位点中，10个位于HVR区域，而一个位于VP1u。两组序列还示出了在HVR之间的区域中阳性选择的证据，所述区域包括衣壳结构的非表面暴露区域(表5)。MEME无法检测到任何在AAVHSC序列或HiFiPCR突变体-衣壳序列中经受阳性选择的位点。

还使用了固定效应似然(FEL)程序(Kosakovsky Pond SL等人《分子生物进化(Molecular Biological Evolution)》2005；22:1208-22)在进行阴性选择的新型人和非人灵长类动物AAV系统发育中检测跨分支对的位点(表6)。在29个新型AAV天然分离株序列中的15个内的位点与其最接近的已知AAV亲缘相比示出阴性纯化选择的证据。相比之下，AAVHSC变体和HiFi PCR突变体都不含有跨整个系统发育的任何位点，所述位点示出了通过阴性选择进行进化的证据。

表5.新型AAV VP1系统发育的MEME分析。示出p<0.05的所有位点。

表6.新型AAV VP1基因与最接近的天然分离株序列的固定效应似然分析。

*似然比测试

自1965年发现AAV以来，AAV序列分离技术有了很大的发展。在这项研究中，比较了两种DNA聚合酶在AAV分离方面的DNA复制保真：热启动高保真聚合酶和Q5热启动高保真聚合酶。发现与利用Q5聚合酶的方法相比，使用HiFi聚合酶和具有大量PCR循环的方案——一种先前用于发现新型AAV的方法——引起从模板DNA生成的扩增子的随机突变率显著更高。突变体-PCR在体外以可变水平分离产生的载体和转导的Huh7细胞。这些实验突出了低DNA聚合酶保真可以在衣壳基因组分离期间对AAV功能施加的可变和不可预测的影响。

Tindall等人是最早证明DNA聚合酶可以在扩增的DNA中产生突变的人之一(Tindall KR等人《生物化学(Biochemistry)》1988；27:6008-6013)。从那时起，研究人员分离并工程化了多种新的聚合酶来解决这个问题，包含Q5——最准确的聚合酶之一——碱基取代率为5.3×10

还使用Q5聚合酶进行AAV-SGA，以验证本著作中分离的人源性AAV之一AAVhu68的序列同一性。此技术的复制性质加上Q5聚合酶的高保真使得能够精确且准确地鉴定这种分离株的衣壳序列。此外，使用基于Q5聚合酶的技术获得的所得扩增子的测序数据与通过NGS方法获得的扩增子一致，从而验证了此AAV天然分离株衣壳基因的同一性。AAV-SGA确实恢复了一小部分扩增子序列，其中1-2个核苷酸与AAVhu68基因组错配，这可能归因于NGS错误、Q5的低错误率或热循环引起的DNA损伤，如通过Potapov等人表征的(《公共科学图书馆期刊》2017；12:e0169774)。这些数据表明AAV-SGA是一种用于以非常高的精度和准确度分析病毒群体的强大工具。

通过利用基于高保真Q5的AAV分离方法，发现天然AAV变体衣壳蛋白序列保持相对稳定，而其DNA序列与其在GenBank中的最接近的亲缘相比可以表现出相当大的变化。此发现与HiFi PCR突变体序列和从人HSC(AAVHSC)鉴定的AAV序列子集形成鲜明对比，其中更多的氨基酸变化与DNA序列改变相关。在任何病毒群体中，期望来自免疫系统的宿主介导的进化压力或介导组织嗜性的因素会促进与涉及如细胞粘附、进入和病毒运输等宿主-衣壳相互作用的过程相关的阳性、多样化选择。然而，这些选择压力在体外复制环境中是不存在的，如在产生PCR突变体时使用的环境。

使用BUSTED程序来确定整个AAV衣壳序列是否在其最近的进化谱系中经受阳性选择。结果示出了多样化选择的证据，即使对于两个分离株之间表现出高DNA序列变异但氨基酸序列同源性高的案例也是如此。相反，对于多个AAV之间的DNA序列变异导致氨基酸变化(即，AAVHSC和AAV HiFi PCR突变体)的少数情况，BUSTED分析没有提供多样化选择的证据。出乎意料的发现是，尽管具有高的非同义突变率，从如人HSC等自然来源中回收的AAV群体未示出进化压力介导的变化的证据。

使用MEME来阐明新型AAV自然变体中位点特异性进化的模式(Murrell B等人《公共科学图书馆遗传学(PLoS Genetics)》2012；8:e1002764)。大多数显示进化证据的位点映射到AAV HVR；表面暴露的HVR介导与如抗体和细胞-表面受体等宿主因子的相互作用。另外，少数位点位于VP1u区域中VP3开始之前，所述VP1u区域与宿主-细胞细胞内运输机制相互作用。在这些位点处显示的进化压力可以很好地表明哪些衣壳区域可易于从载体工程化角度进行修改。相比之下，AAVHSC分离株和HiFi PCR突变体都不含有任何显示显著选择压力的位点，进一步证实聚合酶引入的错误可以显著影响AAV序列分析、发现和功能。虽然高保真DNA聚合酶对于从自然来源中进行基于PCR的AAV最佳分离和表征是必需的，但易错聚合酶可以通过将随机突变引入给定AAV衣壳骨架来扩展候选AAV文库并使其多样化。

这些结果突出了需要准确的AAV分离方法来得出关于AAV进化、遗传学和基因组变异引起的生物学功能的有效结论。发现表明并非所有“高保真”DNA聚合酶都是一样产生的，并且在分析用低保真聚合酶产生的AAV序列时务必谨慎。利用如SGA等方法与高保真聚合酶相结合能够准确分离可能含有下一个候选基因疗法载体的天然AAV群体。

从人组织样品非人类灵长类动物组织样品中回收的新型AAV天然分离株和其序列汇总于下表7和表8中。

表7.从人组织样品中回收的新型AAV天然分离株和其序列。

表8.从非人灵长类动物肠道组织样品中回收的新型AAV天然分离株和其序列。

实例6：具有新型衣壳的重组AAV载体的产量和转导水平评估

对于

对于12孔板规模产生，所述方案改编自上述

另外，对转基因的递送进行了体内评估。给小鼠静脉内注射具有AAV8或AAVrh81衣壳的rAAV和含有肝脏特异性启动子(LSP)启动子和人因子IX转基因的载体基因组。在第28天，收集血浆以测量因子IX水平。AAVrh81载体递送后人因子IX的表达远低于AAV8(图17)。在进一步的研究中，将具有AAVrh78、AAVrh83、AAVrh84、AAVrh85、AAVrh87、AAVrh89或AAV8衣壳的rAAV载体和具有TBG启动子和eGFP转基因的载体基因组以1×10

(序列表自由文本)

对于在数字标识符<223>下含有自由文本的序列，提供了以下信息。

本说明书中列出的所有专利、专利出版物和其它出版物均通过引用并入本文。于2020年10月29日提交的美国临时专利申请第63/107,030号和于2021年6月24日提交的美国临时专利申请第63/214,530号通过引用并入本文。标记为“21-9492.PCT_ST25”的所附序列表通过引用并入本文。虽然已经参考特别优选的实施例描述了本发明，但是应当理解，可以在不脱离本发明的精神的情况下进行修改。此类修改旨在落入所附权利要求的范围内。

序列表

<110>宾夕法尼亚大学董事会（The Trustees of the University ofPennsylvania）

<120>AAV衣壳和含有AAV衣壳的组合物

<130>UPN-21-9492.PCT

<150>US 63/107,030

<151>2020-10-29

<150>US 63/214,530

<151>2021-06-24

<160>85

<170>PatentIn 3.5版

<210>1

<211>2211

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu68

<220>

<221>misc_feature

<222>(1)..(2208)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2208)

<223>vp2

<220>

<221>misc_feature

<222>(604)..(2208)

<223>vp3

<400>1

atggctgccg atggttatct tccagattgg ctcgaggaca acctcagtga aggcattcgc60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcggg gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180

aagggggagc cggtcaacga agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgt gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtccccg accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcaaaga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgctaataa ccttaccagc1020

acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatcta1140

acgcttaatg atggaagcca agccgtgggt cgttcgtcct tttactgcct ggaatatttc1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta1260

cctttccata gcagctatgc tcacagccaa agcctggacc gactcatgaa tccactcatc1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa1500

tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata1680

accaacgaag aagaaattaa aactaccaac ccagtagcaa cggagtccta tggacaagtg1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg1980

gctttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc2040

gtggagattg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgtt2160

tattctgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210>2

<211>736

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu68

<220>

<221>MISC_FEATURE

<222>(1)..(736)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(736)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(202)..(736)

<223>vp3

<400>2

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 1015

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

202530

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Val Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>3

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu71/74

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>3

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240

cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300

caagagcgtc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360

gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420

ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480

aaagcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540

tccgtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tttgggatct 600

actacaatgg ctacaggcag tggcgcacca gtggcagaca ataacgaggg tgccgatgga 660

gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caagcaaatc 780

tccagccaat caggagcctc aaacgacaac cactactttg gctacagcac cccttggggg 840

tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900

aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960

aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt1020

caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcgggtcggc gcatcaagga1080

tgcctcccgc cgtttccagc ggacgtcttc atggtcccac agtatggata cctcaccctg1140

aacaacggga gtcaagcggt aggacgctct tcattttact gcctggagta ctttccttct1200

cagatgcttc gtaccggaaa caactttcag ttcagctaca cctttgaaga cgtgcctttc1260

cacagcagct acgctcacag ccagagtctg gatcggctga tgaatcctct gatagaccag1320

tacctgtatt atctgaacaa gacacaatca aatagtggaa ctcttcagca gtctcggcta1380

ctgtttagcc aagctggacc caccaacatg tctcttcaag ctaaaaactg gctgcctgga1440

ccttgctaca gacagcagcg tttgtcaaag caggcaaacg acaacaacaa cagcaacttt1500

ccctggactg cagctacaaa gtatcatcta aatggccggg actcgttggt taatccagga1560

ccagcaatgg ccagccacaa agacgatgaa gaaaagtttt tccccatgca tggaaccctg1620

atatttggta aacaaggaac aaatgctaac gacgcggatt tggacaatgt catgattaca1680

gatgaagaag aaatccgcac caccaatcca gtggctactg agcagtacgg atatgtgtca1740

aataatttgc aaaactcaaa tactggtcca actactggaa ctgtcaatca ccaaggagcg1800

ttacctggta tggtgtggca ggatcgagat gtgtacctgc agggacccat ttgggccaag1860

attcctcaca ccgatggaca ctttcatcct tctccactga tgggaggttt tggactcaaa1920

cacccgcctc ctcagatcat gatcaaaaac actcccgttc cagccaatcc ccccacaaac1980

ttcagttctg ccaagtttgc ttccttcatc acacagtatt ccacggggca ggtcagcgtg2040

gagatcgagt gggagctgca gaaggagaac agtaaacgct ggaatcccga aattcagtac2100

acttccaact acaacaaatc tgttaatgtg gactttactg tggacactaa tggtgtgtat2160

tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208

<210>4

<211>735

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu71/74

<220>

<221>MISC_FEATURE

<222>(1)..(735)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(735)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(203)..(735)

<223>vp3

<400>4

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 1015

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

202530

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Ser Thr Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Lys Thr

435 440 445

Gln Ser Asn Ser Gly Thr Leu Gln Gln Ser Arg Leu Leu Phe Ser Gln

450 455 460

Ala Gly Pro Thr Asn Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn

485 490 495

Asn Ser Asn Phe Pro Trp Thr Ala Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys

530 535 540

Gln Gly Thr Asn Ala Asn Asp Ala Asp Leu Asp Asn Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Tyr Val Ser Asn Asn Leu Gln Asn Ser Asn Thr Gly Pro Thr Thr

580 585 590

Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Pro Thr Asn Phe Ser Ser Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>5

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu79

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>5

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcacaaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240

cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300

caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360

gcaaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420

ggaaaaaaga ggccggtaga gcactctcct gcggagccag attcctcctc cggaactgga 480

aagtcgggca accagcctgc aagaaagaga ttgaatttcg gtcagactgg agacgcagac 540

tccgtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600

aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660

gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720

accaccagca cccgcacctg ggctctgccc acctacaaca accatctgta caagcagatt 780

tccagccaat caggagccag caacgacaac cactactttg gctacagcac cccctggggg 840

tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900

aacaacaatt ggggattccg gcccaaaaga ctcaacttca agctctttaa cattcaagtc 960

aaggaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt1020

caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga1080

tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg1140

aacaacggga gtcaggcggt aggacgctct tccttttact gcctggagta ctttccttct1200

cagatgcttc gtaccggaaa caactttacc ttcagctaca cctttgagga cgttcctttc1260

cacagcagct acgctcacag ccagagtttg gaccgtctca tgaatcctct catcgaccag1320

tacctgtatt acttgagcaa aacaaacacg ccgagcggaa ccaccacgca gtccaggctt1380

cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga1440

ccctgttacc gccagcagcg agtatcaaag acagctgcgg acaacaacaa tagtgattac1500

tcgtggactg gagctaccaa gtaccacctc aatggaagag actctttggt gaatccggga1560

ccggccatgg ccagccacaa ggacgatgaa gaaaagtatt ttcctcagag cggggttctc1620

atctttggaa aacaagactc gggaaaaact aatgtggaca ttgaaaaggt catgattaca1680

gacgaagagg aaatcaggac caccaatccc gtggctacgg agcagtatgg tgctgtatct1740

accaacctcc agagcggcca cacacaagca gctaccgcag atgtcaacac acaaggcgtt1800

cttccaggca tggtctggca ggacagagac gtgtacctgc aggggcccat ctgggcaaag1860

attccacaca cggacggaca ttttcacccc tctcccctca tgggcggatt cggacttaaa1920

cacccgcctc ctcagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc1980

ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacagggca ggtcagtgtg2040

gagatcgagt gggagctgca gaaggagaac agcaaacgct ggaatcccga gatccagtac2100

acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat2160

tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208

<210>6

<211>735

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu79

<220>

<221>MISC_FEATURE

<222>(1)..(735)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(735)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(203)..(735)

<223>vp3

<400>6

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 1015

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

202530

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ser Gly Asn Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Lys Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ala Ala Asp Asn Asn

485 490 495

Asn Ser Asp Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Tyr Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Asp Ser Gly Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ala Val Ser Thr Asn Leu Gln Ser Gly His Thr Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>7

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu80

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>7

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240

cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300

caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360

gccaaaaaga ggattcttga acctctgggc ctggttgagg aacctgttaa aacggctccg 420

ggaaaaaaga ggccggtaga gcactctcct gcggagccag actcctcctc gggaaccgga 480

aaagcgggcc agcagcctgc aagaaaaaga ttgaatttcg gtcagactgg agacgcagac 540

tccgtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600

aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660

gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720

accaccagca cccgaacctg ggctctgccc acctacaaca accatctgta caagcagatt 780

tccagccagt ctggagccag caacgacaac cactactttg gctacagcac cccttggggg 840

tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900

aataacaact ggggattccg gcccaagaga ctcaacttca agctctttaa cattcaagtc 960

aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt1020

caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga1080

tgcctcccgc cgtttccagc ggacgtcttc atggtcccac agtatggata cctcaccctg1140

aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct1200

cagatgctgc gtaccggaaa caactttacc ttcagctaca cctttgagga cgttcctttc1260

cacagcagct acgctcacag ccagagtttg gaccgtctca tgaatcctct catcgaccag1320

tacctgtatt acttgagcag aacaaacact ccaagcggaa ccaccacgca gtccaggctt1380

cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga1440

ccctgttatc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac1500

tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc1560

ccggccatgg ccagtcacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc1620

atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca1680

gacgaagagg aaatcaggac caccaatccc gtggctacgg agcagtatgg ttctgtatct1740

accaacctcc agagcggcaa cacacaagca gctaccgcag atgtcaacac acaaggcgtt1800

cttccaggca tggtctggca ggacagagac gtgtacctgc aggggcccat ctgggcaaag1860

attccacaca cggacggaca ttttcacccc tctcccctca tgggcggatt tggactgaaa1920

caccctcctc cacagattct cattaagaat accccggtac ctgcgaatcc ttctaccact1980

ttcagcgcgg caaagtttgc ttccttcatc acacagtatt ccacggggca ggtcagcgtg2040

gagatcgagt gggagctgca gaaagagaac agcaaacgct ggaatcccga gattcagtac2100

acttccaact acaacaaatc tgttaatgtg gactttactg tggacactaa tggtgtgtat2160

tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208

<210>8

<211>735

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu80

<220>

<221>MISC_FEATURE

<222>(1)..(735)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(735)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(203)..(735)

<223>vp3

<400>8

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 1015

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

202530

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn

485 490 495

Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Ser Gly Asn Thr Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>9

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu83

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>9

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240

cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300

caggagcgtc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360

gcaaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420

ggaaaaaaga ggccggtaga gcactctcct gcggagccag attcctcctc cggaactgga 480

aagtcgggca accagcctgc aagaaagaga ttgaatttcg gtcagactgg agactcagac 540

tccgtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600

aatacgatgg cttcaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660

gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca accatctgta caagcaaata 780

tccagccagt ctggagccag caacgacaat cactactttg gctacagcac cccctggggg 840

tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900

aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960

aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt1020

caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga1080

tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg1140

aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct1200

cagatgctgc gtaccggaaa caactttacc ttcagctaca cctttgagga cgtgcctttc1260

cacagcagct acgctcacag ccagagtttg gaccgtctca tgaatcctct catcgaccag1320

tacctgtatt acttgagcag aacaaacact ccaagcggaa ccaccacgca gtccaggctt1380

cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga1440

ccctgttatc gccagcagcg agtatcaaag acatctgcgg acaacaacaa cagtgaatac1500

tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc1560

ccggccatgg ccagtcacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc1620

atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca1680

gacgaagagg aaatcagaac caccaatccc gtggccacgg agcagtatgg ttctgtatct1740

accaacctcc agagcggcaa cacacaagca gctactgcag atgtcaacac acaaggcgtt1800

cttccaggca tggtctggca ggacagagac gtgtacctgc aggggcctat ctgggcaaaa1860

attccacaca cggacggaca ttttcacccc tctcccctca tgggcggatt cggacttaaa1920

caccctcccc cgcagattct catcaagaac acccctgtac ctgcgaatcc ttcgaccacc1980

ttcagtgcgg caaagtttgc ttccttcatt acacagtatt ccacgggaca ggtcagcgtg2040

gagatcgagt gggagctgca gaaggaaaac agcaaacgtt ggaatcccga gattcagtac2100

acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggtgtgtat2160

tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208

<210>10

<211>735

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu83

<220>

<221>MISC_FEATURE

<222>(1)..(735)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(735)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(203)..(735)

<223>vp3

<400>10

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 1015

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

202530

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ser Gly Asn Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Ser Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn

485 490 495

Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Ser Gly Asn Thr Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>11

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu74/71

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>11

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240

cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300

caggagcgtc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360

gccaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420

ggaaaaaaga ggccagtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480

aaagcgggcc agcagcctgc aagaaagaga ttgaattttg gtcagactgg agacgcagac 540

tccgtacctg acccccagcc tctcggacaa ccaccagcag ccccctctgg tctgggatct 600

actacaatgg ctacaggcag tggcgcacca gtggcagaca ataacgaggg tgccgatgga 660

gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caagcaaatc 780

tccagccaat caggagccag caacgacaac cactactttg gctacagcac cccctggggg 840

tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900

aacaacaact ggggattccg gcccaagaga ctcaacttca agctctttaa cattcaagtc 960

aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt1020

caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga1080

tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg1140

aacaacggga gtcaggcggt aggacgctct tccttttact gcctggagta ctttccttct1200

cagatgctgc gtaccggaaa caactttcag ttcagctaca cctttgaaga cgttcctttc1260

catagcagct acgctcacag ccagagtctg gatcggctga tgaatcctct gatcgaccag1320

tacctgtatt atctgaacaa gacacaatca aatagtggaa ctcttcagca gtctcggcta1380

ctgtttagcc aagctggacc taccaacatg tctcttcaag ctaaaaactg gctgcctgga1440

ccttgctaca gacagcagcg tctgtcaaag caggcaaacg acaacaacaa cagcaacttt1500

ccctggactg cggctacaaa gtatcatcta aatggccggg actcgttggt taatccagga1560

ccagctatgg ccagccacaa agacgatgaa gaaaagtttt tccccatgca tggaaccctg1620

atatttggta aacaaggaac aaatgctaac gacgcggatt tggacaatgt catgattaca1680

gatgaagaag aaatccgcac caccaatccc gtggctacgg agcagtacgg atatgtgtca1740

aataatttgc aaaactcaaa tactggtcca actactggaa ctgtcaatca ccaaggagcg1800

ttacctggta tggtgtggca ggatcgagac gtgtacctgc agggacccat ttgggccaag1860

attcctcaca ccgatggaca ctttcaccct tctccactga tgggaggttt tggactcaaa1920

cacccgcctc ctcaaatcat gatcaaaaac actcccgttc cagccaatcc tcccacaaac1980

ttcagttctg ccaagtttgc ttctttcatc acacagtatt ccacggggca ggtcagcgtg2040

gagattgagt gggagctgca gaaggagaac agcaagcgct ggaaccccga gattcagtac2100

acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggtgtgtat2160

tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208

<210>12

<211>735

<212>PRT

<213>人工序列

<220>

<223>腺相关病毒hu74/71

<220>

<221>MISC_FEATURE

<222>(1)..(735)

<223>vp1

<220>

<221>MISC_FEATURE

<222>(138)..(735)

<223>vp2

<220>

<221>MISC_FEATURE

<222>(203)..(735)

<223>vp3

<400>12

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 1015

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

202530

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

354045

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

505560

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65707580

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

859095

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Ser Thr Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Lys Thr

435 440 445

Gln Ser Asn Ser Gly Thr Leu Gln Gln Ser Arg Leu Leu Phe Ser Gln

450 455 460

Ala Gly Pro Thr Asn Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn

485 490 495

Asn Ser Asn Phe Pro Trp Thr Ala Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys

530 535 540

Gln Gly Thr Asn Ala Asn Asp Ala Asp Leu Asp Asn Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Tyr Val Ser Asn Asn Leu Gln Asn Ser Asn Thr Gly Pro Thr Thr

580 585 590

Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Pro Thr Asn Phe Ser Ser Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210>13

<211>2208

<212>DNA

<213>人工序列

<220>

<223>腺相关病毒hu77

<220>

<221>misc_feature

<222>(1)..(2205)

<223>vp1

<220>

<221>misc_feature

<222>(412)..(2205)

<223>vp2

<220>

<221>misc_feature

<222>(607)..(2205)

<223>vp3

<400>13

atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga60

cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120

gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa ggcctacgac 240