掌桥专利:专业的专利平台
掌桥专利
首页

用肝特异性基因疗法载体治疗遗传性血管性水肿

文献发布时间:2023-06-19 16:08:01



技术领域

本文提供了重组腺伴随病毒(rAAV)载体和病毒颗粒,其用于通过实现C1酯酶抑制剂(C1EI或C1-INH)在受试者肝脏中的长期表达来治疗遗传性血管性水肿。

背景技术

遗传性血管性水肿(HAE)由被称作SERPING1的C1EI基因中的突变引起。大多数患者(85%)具有低水平的C1EI(被称作I型HAE),而少数(15%)具有正常或升高水平的突变C1EI,其为功能失调的(被称作II型HAE)。存在第三种类型的HAE(III型HAE),其中患者具有正常的C1EI蛋白,但具有在其它基因(诸如因子XII基因)中的突变,其导致HAE。I型和II型HAE(其特征在于功能性血浆C1酯酶抑制剂的缺乏)可以由于补体途径和/或接触活化途径的失调活化而导致炎症危象。危象表现为荨麻疹和/或血管性水肿的症状,诸如皮肤和/或粘膜的肿胀(皮下水肿或粘膜下水肿),包括呼吸道和胃肠道。喉部肿胀可以造成致死性窒息。严重肿胀的反复发作可以影响臂、腿、面部、肠道和气道,它们是疼痛的、毁容的,并且如果它们阻碍呼吸,有时会危及生命。如果不治疗,该病症具有25%的死亡率。据估计,HAE影响全球50,000-100,000人中的1人。

HAE危象可以由轻微的外科手术或牙科手术或创伤、感染、应激和药物(尤其是血管紧张素转换酶(ACE)抑制剂和雌激素)的使用引发。急性危象通常用C1EI蛋白、新鲜冷冻血浆、血浆衍生的C1EI蛋白、艾卡拉肽(一种激肽释放酶抑制剂)和/或艾替班特(一种缓激肽B2受体拮抗剂)治疗。常规预防性疗法包括血浆衍生的C1EI蛋白、减弱的雄激素诸如达那唑、抗纤维蛋白溶解剂和孕酮,尽管这些中的每一种都具有不良作用。孕妇的治疗代表一个问题,因为雄激素和抗纤维蛋白溶解剂在妊娠期间是禁忌的。

C1EI是一种丝氨酸蛋白酶抑制剂,其直接或间接抑制与HAE发作相关的几种蛋白酶。它是几种补体蛋白酶(诸如C1r和C1s)和接触蛋白酶(包括因子XIIa和激肽释放酶)的主要抑制剂,以及纤维蛋白溶解性蛋白酶(诸如纤溶酶和因子XIa)的次要抑制剂。在HAE患者中,由于功能性C1-INH的水平不足引起的接触途径的不受抑制的活化,导致激肽释放酶对高分子量激肽原的失调裂解,从而导致过多游离缓激肽的产生,所述缓激肽是一种增加毛细血管渗透性和水肿的有效血管活性肽。参见,例如,Riedl M.“Recombinant human C1esterase inhibitor in the management of hereditary angioedema.”Clin DrugInvestig.2015;35(7):407-417。

发明内容

本文描述的实施方案涉及载体构建体、重组复制缺陷型AAV颗粒、细胞和药物组合物,其用于向有此需要的受试者、特别是具有遗传性血管性水肿或功能性C1EI缺乏的受试者递送功能性人C1酯酶抑制剂(C1EI)。本文描述的实施方案还涉及这样的AAV颗粒或这样的载体构建体向诊断出遗传性血管性水肿或功能性C1EI缺乏的患者(人受试者)的肝细胞递送编码人C1EI的基因的用途。

在一个方面,本文描述的实施方案提供了载体构建体,其包含编码功能性C1酯酶抑制剂(C1EI)的核酸序列。在一个或多个实施方案中,所述功能性C1EI包含与SEQ ID NO:2(人C1EI或“hC1EI”)的氨基酸23-500具有至少90%、95%或98%同一性的氨基酸序列。在实施例实施方案中,编码功能性C1EI的核酸序列是野生型序列,SEQ ID NO:1为其一个例子,或经过密码子优化,或是变体。替代性的密码子优化的人C1EI编码序列如在SEQ ID NO:10-13、59或60中所示。在实施例实施方案中,编码功能性C1EI的核酸序列包含与SEQ ID NO:1或10-13或59-60的至少100、200、300、400或500个连续碱基具有至少90%同源性的核苷酸序列,且其编码与SEQ ID NO:2的氨基酸23-500具有至少95%同一性的功能性人C1酯酶抑制剂(hC1EI)。在某些实施方案中,hC1EI的编码序列为在人类中的表达经过密码子优化。在一个实施方案中,密码子优化的hC1EI核酸包含降低的CpG二核苷酸含量。在一个具体实施方案中,所述CpG二核苷酸含量小于25。

在一个或多个实施方案中,编码C1EI的核酸序列可操作地连接至一个或多个异源表达控制元件。优选地,编码hC1EI的转基因的表达由肝特异性表达控制元件控制。因而,在这样的实施方案中,在本文描述的载体构建体中,编码C1EI的核酸序列可操作地连接至异源肝特异性转录调节区。在某些实施方案中,在本文描述的载体构建体中,所述表达控制元件包括以下一种或多种:启动子和/或增强子;任选的内含子;和多腺苷酸化(多腺苷酸)信号。本文进一步描述了这样的元件。

所述肝特异性转录调节区可以包含一个或多个肝特异性表达控制元件。在一个或多个实施方案中,所述肝特异性转录调节区是包含人α-1-抗胰蛋白酶(hAAT)启动子、肝控制区(HCR)增强子和/或载脂蛋白E(ApoE)增强子的部分的合成启动子序列。在某些实施方案中,所述肝特异性转录调节区包含(a)与SEQ ID NO:16具有至少90%同一性的缩短的ApoE增强子序列;(b)与SEQ ID NO:3具有至少90%同一性的α抗胰蛋白酶(hAAT)近侧启动子序列,(c)一个或多个增强子,其选自(i)与SEQ ID NO:4具有至少90%同一性的ApoE/HCR增强子,(ii)AAT启动子远侧X区域,和(iii)AAT启动子远侧区域。在一个实施例实施方案中,肝特异性转录调节区的序列包含与SEQ ID NO:5具有至少80%、85%、90%或95%同一性的核苷酸序列。在某些实施方案中,所述肝特异性转录调节区包含(a)与SEQ ID NO:17具有至少90%同一性的α-微球蛋白增强子序列,和/或(b)与SEQ ID NO:3具有至少90%同一性的α抗胰蛋白酶(AAT)近侧启动子。

在某些实施方案中,所述载体构建体包含一个或多个内含子。在某些实施方案中,所述内含子也增强编码C1EI的核酸的表达,并任选地增强在肝脏中的表达。在一个或多个实施方案中,所述内含子是复杂的hAAT/血红蛋白内含子序列。在一个实施例实施方案中,所述内含子包含与SEQ ID NO:6具有至少80%、85%、90%或95%同一性的核苷酸序列,或与SEQ ID NO:61具有至少80%、85%、90%或95%同一性的核苷酸序列。在某些实施方案中,编码C1EI的核酸序列包含内含子。

在某些实施方案中,所述载体构建体包含多腺苷酸化信号,任选牛生长激素(bGH)多腺苷酸信号(例如,SEQ ID NO:19)或优选人生长激素(hGH)多腺苷酸信号(例如,SEQ IDNO:7)。

所述载体构建体优选地是重组AAV载体构建体。在某些实施方案中,所述载体构建体包含(a)(i)AAV 5'反向末端重复(ITR)和(ii)AAV3’ITR中的一个或两个;(b)启动子和/或增强子,例如肝特异性转录调节区;和(c)编码在功能上有活性的人C1酯酶抑制剂蛋白或其片段的核酸序列。在某些实施方案中,所述载体构建体包含(a)AAV 5'反向末端重复(ITR)序列(例如,SEQ ID NO:54);(b)启动子和/或增强子,例如肝特异性转录调节区;(c)编码在功能上有活性的人C1酯酶抑制剂蛋白的核酸序列;和(d)AAV 3'ITR(例如,SEQ IDNO:55)。AAV 5'ITR和/或AAV 3'ITR可以来自异源AAV假型(其可以如本领域已知的经过修饰或未经过修饰)。在某些实施方案中,5'ITR和3’ITR序列衍生自AAV2。在一个或多个实施方案中,所述载体构建体是约3kb至约5kb大小、或约2.7kb至约4kb大小的AAV载体基因组。在一个或多个实施方案中,所述载体构建体是约2.7kb至约3.3kb大小、或约3.7kb至约4.1kb大小的AAV载体基因组,例如,SEQ ID NO 57和58。

在实施例实施方案中,所述载体构建体包含与SEQ ID NO:9、20-36或57-58中的任一个具有至少80%、85%、90%或95%同一性的核苷酸序列。

在另一个方面,本文提供了重组腺伴随病毒(rAAV)颗粒,其包含AAV衣壳和在一个或多个本文实施方案中描述的载体构建体。在某些实施方案中,用于递送C1EI编码基因(“rAAV.SERPIN G1”或“AAV-SERPIN G1”)的重组AAV(rAAV)颗粒对肝脏具有嗜性。在这样的实施方案中,所述rAAV包含具有肝嗜性的AAV衣壳,例如,与SEQ ID NO:46具有至少90%同一性的AAV5衣壳,或表现出肝嗜性的猿猴AAV衣壳,任选狒狒衍生的AAV衣壳或其变体。在一个或多个实施方案中,所述AAV衣壳是对它预先存在的体液免疫类似于AAV5或与AAV5相比减少的衣壳,例如,当通过体外IVIG中和评价时。

在另一个方面,本文提供了可用作基因递送载体的AAV颗粒的生产方法,所述方法包括以下步骤:(1)提供包含一种或多种核酸构建体的昆虫细胞,所述核酸构建体包含(a)如本文中所述的载体构建体,其包含侧接两个AAV ITR核苷酸序列的如本文中所述的核酸;(b)编码一种或多种AAV Rep蛋白的核苷酸序列,其可操作地连接至能够驱动Rep蛋白在昆虫细胞中的表达的启动子,(c)编码一种或多种AAV衣壳蛋白的核苷酸序列,其可操作地连接至能够驱动衣壳蛋白在昆虫细胞中的表达的启动子;其中(b)和(c)是在相同表达盒中或在两个不同的表达盒中;和(d)任选的编码在VP2/3中所含的AAP和MAAP的基因;(2)在有助于Rep和衣壳蛋白表达的条件下培养在(1)中定义的昆虫细胞;和,任选地(3)回收AAV颗粒。

在又一个方面,本文提供了药物组合物,其包含本文描述的载体构建体或本文描述的rAAV颗粒和无菌的药学上可接受的稀释剂、赋形剂或载体。

在另一个方面,本文提供了向哺乳动物受试者递送C1EI基因的方法。这样的方法包括在哺乳动物受试者中表达C1EI的方法,所述方法包括给所述受试者施用组合物,其包含本文描述的载体构建体、本文描述的rAAV颗粒、或本文描述的药物组合物,由此在所述受试者中表达编码的C1EI蛋白。优选地,在这样的方法中,所述哺乳动物是人且所述C1EI是如本文中所述的功能性人C1EI。这样的方法包括通过施用一定量的载体构建体、rAAV颗粒或药物组合物在哺乳动物的肝脏中表达C1EI的方法,所述量有效地增加哺乳动物的肝脏中的C1EI表达水平。这样的方法还包括通过施用一定量的载体构建体、rAAV颗粒或药物组合物来增加哺乳动物血液中的功能性C1EI水平的方法,所述量有效地增加哺乳动物血液中的功能性C1EI水平。这样的方法还包括通过施用一定量的载体构建体、rAAV颗粒或药物组合物来治疗哺乳动物中的功能性C1EI缺乏的方法,所述量有效地增加哺乳动物血液中的功能性C1EI水平。在某些实施方案中,所述载体构建体、rAAV颗粒或药物组合物的量有效地将血液中的功能性C1EI水平增加至约0.4IU/ml或1IU/ml或更高,或增加至约16mg/dL或更高的C1EI水平。

这样的方法还包括治疗哺乳动物中的遗传性血管性水肿或治疗或预防其任何症状的方法,所述方法包括施用治疗有效量的载体构建体、rAAV颗粒或药物组合物。在一个或多个实施方案中,这样的方法降低哺乳动物中粘膜下或皮下水肿、急性HAE发作的频率或严重程度,或为治疗急性HAE发作而施用的按需疗法的量。

在本文所述的任何方法中,在水性悬浮液中以约1x10

在本文所述的任何方法中,载体构建体、rAAV颗粒或药物组合物的施用可以进一步包含预防性或治疗性皮质类固醇治疗的施用,和/或可以进一步包括用于治疗HAE的第二种疗法的施用。在本文的任何方法中,在如上所述向患者施用AAV颗粒之前,可以评估预期患者是否存在抗-AAV衣壳抗体或抗-AAV中和抗体,其能够阻断细胞转导或以其它方式降低治疗的整体效率。

在阅读本说明书后,其它实施方案对于本领域技术人员将是显而易见的。

附图说明

图1A-1C描绘了多种载体构建体的组构的示意图。

图2描绘了来自HepG2细胞的瞬时转染的Serpin G1 ELISA结果。

图3A和B描绘了施用AAV颗粒的小鼠的血液中的人C1EI水平,所述AAV颗粒包含在实施例2中的载体构建体ApoE/HCR-hAAT.hhI.SERPIN G1.hGH(HAE15)(图3A)。举例说明了两种不同的AAV衣壳:AAV5型衣壳(与SEQ ID NO:46具有大于90%同一性)和狒狒衍生的AAV衣壳AAVBba49(与SEQ ID NO:56具有大于90%同一性)。图3B解释了各个动物/组的SerpinG1 ELISA结果。将小鼠用2x10

图4A和B描绘了相同小鼠中的功能性人C1EI水平。

图5描绘了相同小鼠的体重。

图6描绘了用AAV5-HAE15或Bba49-HAE15处理的小鼠的血浆中的丙氨酸氨基转移酶(ALT)活性。

图7A和B描绘了用AAV5-HAE15或Bba49-HAE15处理的小鼠的肝脏中的人C1抑制剂的肝表达(图7A)和%C1抑制剂(+)肝细胞的测量(图7B)。

图8A和B分别描绘了通过qPCR测量的肝脏中的HAE15 DNA和RNA水平。

图9A和B描绘了施用各种剂量的AAV5型颗粒的小鼠的血液中的人C1EI蛋白(图9A)和功能性人C1EI(图9B)水平,所述颗粒包含在实施例3中的载体构建体ApoE/HCR-hAAT.hhI.SERPIN G1.hGH(HAE15)。将小鼠用四种不同剂量的AAV5-HAE15处理:6x10

图10A-10B分别描绘了用五种不同剂量的实施例3中的AAV5-HAE15处理的小鼠的血浆中的总人C1EI蛋白浓度(mg/mL)和血浆中的功能性人C1EI蛋白浓度(国际单位,IU/mL):2x10

图11描绘了第二组群的ALT水平(IU/L),直到第52周。

图12描绘了第一组群在第12周或第二组群在第52周,肝脏(DNA拷贝/μg DNA)中的载体诱导的人SERPING1 DNA的量。

图13描绘了第一组群(在12周)和第二组群(在52周)通过免疫组织化学确定的C1EI表达阳性的肝细胞的百分比。图13也包括用于对比目的(最左侧)的在实施例2中的AAV5-HAE15施用的数据。

图14描绘了用6x10

图15A、15B和15C分别描绘了如通过OD600(光密度/组织重量)所评估的用6x10

具体实施方式

本文提供了编码在功能上有活性的治疗性C1EI蛋白的核酸或载体构建体,包含这样的载体构建体的AAV载体基因组和复制缺陷型rAAV颗粒,以及包含这样的载体构建体、载体基因组和AAV颗粒的药物组合物。本发明的组合物和方法可以提供改进的AAV病毒生产产率和/或简化的纯化和/或增强的表达,特别是增强的肝特异性表达。本文还提供了制备所述载体构建体、包含这样的载体构建体的AAV载体基因组和复制缺陷型rAAV颗粒的方法。本文进一步提供了治疗功能性C1EI缺乏或遗传性血管性水肿的方法。

除非另外定义,否则本文使用的技术和科学术语具有与本公开内容所属领域的普通技术人员通常理解的相同的含义。参见,例如Singleton等人,Dictionary ofMicrobiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994);Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Springs Harbor Press(Cold Springs Harbor,N.Y.1989)。为了本公开内容的目的,在下面定义了以下术语。

如本文中使用的,在基因递送的上下文中,术语“载体”或“基因递送载体”可以表示作为基因递送媒介物起作用的颗粒,并且其包含被包装在例如包膜或衣壳内的核酸(即,包含本文描述的任何载体构建体的载体基因组)。基因递送载体可以是病毒基因递送载体或非病毒基因递送载体。可替换地,在一些上下文中,术语“载体”可以用于仅指载体基因组或载体构建体。适用于本文用途的病毒载体可以是细小病毒、腺病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺病毒相关病毒(AAV)。

本文中使用的术语“AAV”是腺伴随病毒的标准缩写。腺伴随病毒是一种单链DNA细小病毒,其仅在由共同感染的辅助病毒提供某些功能的细胞中生长。众多AAV血清型已被表征。AAV的一般信息和综述可以参见例如Carter,1989,Handbook of Parvoviruses,第1卷,第169-228页;和Berns,1990,Virology,第1743-1764页,Raven Press,(New York);Gao等人,2011,Methods Mol.Biol.807:93-118;Ojala等人,2018,Mol.Ther.26(1):304-19。但是,完全预见到,这些相同的原则将可适用于其它AAV血清型,因为众所周知,各种血清型在结构上和在功能上都是非常密切相关的,即使在遗传水平上也是如此。(参见,例如,Blacklowe,1988,Parvoviruses and Human Disease的第165-174页,J.R.Pattison,编;和Rose,Comprehensive Virology3:1-61(1974))。例如,所有AAV血清型明显表现出由同源rep基因介导的非常相似的复制特性;并且都带有三种相关的衣壳蛋白。通过异源双链体分析进一步表明了相关程度,该分析揭示了沿基因组长度的血清型之间的广泛交叉杂交;和类似的自退火区段在对应于“反向末端重复序列”(ITR)的末端的存在。

本文中使用的“AAV载体构建体”表示具有以下至少一种的单链或双链核酸:(i)AAV 5'反向末端重复(ITR)序列和(ii)侧接蛋白编码序列(在一个实施方案中,功能性治疗蛋白编码序列,例如C1EI)的AAV 3'ITR,所述蛋白编码序列可操作地连接至对于蛋白编码序列而言异源的和/或对于AAV病毒基因组而言异源的转录调节元件(也称为“表达控制元件”),即,一个或多个启动子和/或增强子,和任选的多腺苷酸化序列和/或插入在蛋白编码序列的外显子之间的一个或多个内含子。单链AAV载体表示存在于AAV病毒颗粒的基因组中的核酸,并且可以是本文公开的核酸序列的有义链或反义链。以碱基提供这样的单链核酸的大小。双链AAV载体表示存在于质粒(例如,pUC19)的DNA中的核酸,或用于表达或转移AAV载体核酸的双链病毒(例如,杆状病毒)的基因组。以碱基对(bp)提供这样的双链核酸的大小。

呈单链形式的本文提供的AAV载体构建体小于约7.0kb长度,或小于6.5kb长度,或小于6.4kb长度,或小于6.3kb长度,或小于6.2kb长度,或小于6.0kb长度,或小于5.8kb长度,或小于5.6kb长度,或小于5.5kb长度,或小于5.4kb长度,或小于5.3kb长度,或小于5.2kb长度,或小于5.0kb长度,或小于4.8kb长度,或小于4.6kb长度,或小于4.5kb长度,或小于4.4kb长度,或小于4.3kb长度,或小于4.2kb长度,或小于4.1kb长度,或小于4.0kb长度,或小于3.9kb长度,或小于3.8kb长度,或小于3.7kb长度,或小于3.6kb长度,或小于3.5kb长度,或小于3.4kb长度,或小于3.3kb长度,或小于3.2kb长度,或小于3.1kb长度,或小于3.0kb长度。呈单链形式的本文提供的AAV载体构建体范围为从约5.0kb至约6.5kb长度,或范围为从约4.8kb至约5.2kb长度,或4.8kb至5.3kb长度,或范围为从约4.9kb至约5.5kb长度,或约4.8kb至约6.0kb长度,或约5.0kb至6.2kb长度或约5.1kb至约6.3kb长度,或约5.2kb至约6.4kb长度,或约5.5kb至约6.5kb长度,或范围为从约4.0kb至约5.0kb长度,或范围为从约3.8kb至约4.8kb长度,或3.6kb至4.6kb长度,或范围为从约3.4kb至约4.4kb长度,或范围为从约3.2kb至约4.2kb长度,或范围为从约3.0kb至4.0kb长度,或范围为从约3.5kb至约4.0kb长度,或范围为从约3.0kb至约3.5kb长度。

虽然在文献中已经报道了具有>5.0kb的AAV基因组的AAV颗粒,但在许多这样的情况下,编码的基因的5'或3'末端似乎被截短(参见Hirsch等人,Molec.Ther.18:6-8,2010,和Ghosh等人,Biotech.Genet.Engin.Rev.24:165-178,2007)。但是,已经证实,在AAV感染的细胞中在具有5'末端截短和3'末端截短的核酸之间发生了重叠同源重组,从而产生了编码大蛋白的“完整”核酸,由此重建功能性的全长基因。

过大的AAV载体在5'末端被随机截短,并且缺少5'AAV ITR。因为AAV是一种单链DNA病毒,并且包装有义链或反义链,因此过大的AAV载体中的有义链缺乏5'AAV ITR且可能缺乏靶蛋白编码基因的5'末端的部分,并且过大的AAV载体中的反义链缺乏3'ITR且可能缺乏靶蛋白编码基因的3'末端的部分。通过靶细胞内的有义和反义截短基因组的退火,在过大的AAV载体感染的细胞中产生功能性转基因。因而,在某些实施方案中,所述AAV C1EI载体和/或病毒颗粒包含至少一个ITR。

本文中使用的术语“反向末端重复(ITR)”表示在AAV基因组的5'和3'末端处发现的本领域公知的区域,其以顺式方式作为DNA复制起点和作为病毒基因组的包装信号发挥作用。AAV ITR与AAV rep编码区一起提供有效的切除和挽救,以及将插入在两个侧接ITR之间的核苷酸序列整合到宿主细胞基因组中。某些AAV相关的ITR的序列公开在Yan等人,J.Virol.(2005)第79卷,第364-379页,其通过引用整体并入本文。可以用于本文的ITR序列可以是全长野生型AAV ITR或其保留功能能力的片段,或者可以是能够以顺式方式作为复制起点起作用的全长野生型AAV ITR的序列变体。在本文提供的实施方案的重组AAV C1EI载体中有用的AAV ITR可以来源于任何已知的AAV血清型,并且在某些实施方案中,来源于AAV2或AAV5血清型。

术语“控制序列”表示在特定宿主生物中表达可操作地连接的编码序列所必需的DNA序列。适合用于原核生物的控制序列例如包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多腺苷酸化信号和增强子。

“转录调节元件”表示参与遗传转录调节的基因的核苷酸序列,包括启动子、加上应答元件、用于结合转录因子以辅助RNA聚合酶结合和促进表达的活化子和增强子序列,以及阻遏蛋白与其结合以阻断RNA聚合酶附着并阻止表达的操纵子或沉默子序列。术语“肝特异性转录调节元件”或“肝特异性转录调节区”表示在肝组织中特异性地产生优选基因表达的调节元件或区域。肝特异性调节元件的例子包括、但不限于小鼠thyretin启动子(mTTR)、内源性人因子VIII启动子(F8)、人载脂蛋白E肝控制区及其活性片段、人α-1-抗胰蛋白酶启动子(hAAT)及其活性片段、人α-1-微球蛋白启动子及其片段、人凝血酶原启动子及其活性片段、人白蛋白最小启动子和小鼠白蛋白启动子。也涵盖从肝特异性转录因子结合位点衍生出的增强子,诸如EBP、DBP、HNF1、HNF3、HNF4、HNF6和Enh1。

本文中使用的术语“可操作地连接”用于描述调节元件与基因或它的编码区之间的连接。通常,基因表达被置于一种或多种调节元件的控制之下,例如、但不限于组成型或诱导型启动子、组织特异性调节元件和增强子。基因或编码区被称为“可操作地连接至”或“可操作地连接到”调节元件或与其“可操作地关联”,这意味着,基因或编码区受调节元件控制或影响。例如,如果启动子影响编码序列的转录或表达,则启动子可操作地连接至编码序列。

在一个实施方案中,所述载体构建体包含编码在功能上有活性的C1EI蛋白的核酸。C1EI编码序列可以是野生型、密码子优化的或变体。

本文中使用的野生型SERPIN G1(编码C1EI的基因)具有以下核酸序列:ATGGCCTCCAGGCTGACCCTGCTGACCCTCCTGCTGCTGCTGCTGGCTGGGGATAGAGCCTCCTCAAATCCAAATGCTACCAGCTCCAGCTCCCAGGATCCAGAGAGTTTGCAAGACAGAGGCGAAGGGAAGGTCGCAACAACAGTTATCTCCAAGATGCTATTCGTTGAACCCATCCTGGAGGTTTCCAGCTTGCCGACAACCAACTCAACAACCAATTCAGCCACCAAAATAACAGCTAATACCACTGATGAACCCACCACACAACCCACCACAGAGCCCACCACCCAACCCACCATCCAACCCACCCAACCAACTACCCAGCTCCCAACAGATTCTCCTACCCAGCCCACTACTGGGTCCTTCTGCCCAGGACCTGTTACTCTCTGCTCTGACTTGGAGAGTCATTCAACAGAGGCCGTGTTGGGGGATGCTTTGGTAGATTTCTCCCTGAAGCTCTACCACGCCTTCTCAGCAATGAAGAAGGTGGAGACCAACATGGCCTTTTCCCCATTCAGCATCGCCAGCCTCCTTACCCAGGTCCTGCTCGGGGCTGGGGAGAACACCAAAACAAACCTGGAGAGCATCCTCTCTTACCCCAAGGACTTCACCTGTGTCCACCAGGCCCTGAAGGGCTTCACGACCAAAGGTGTCACCTCAGTCTCTCAGATCTTCCACAGCCCAGACCTGGCCATAAGGGACACCTTTGTGAATGCCTCTCGGACCCTGTACAGCAGCAGCCCCAGAGTCCTAAGCAACAACAGTGACGCCAACTTGGAGCTCATCAACACCTGGGTGGCCAAGAACACCAACAACAAGATCAGCCGGCTGCTAGACAGTCTGCCCTCCGATACCCGCCTTGTCCTCCTCAATGCTATCTACCTGAGTGCCAAGTGGAAGACAACATTTGATCCCAAGAAAACCAGAATGGAACCCTTTCACTTCAAAAACTCAGTTATAAAAGTGCCCATGATGAATAGCAAGAAGTACCCTGTGGCCCATTTCATTGACCAAACTTTGAAAGCCAAGGTGGGGCAGCTGCAGCTCTCCCACAATCTGAGTTTGGTGATCCTGGTACCCCAGAACCTGAAACATCGTCTTGAAGACATGGAACAGGCTCTCAGCCCTTCTGTTTTCAAGGCCATCATGGAGAAACTGGAGATGTCCAAGTTCCAGCCCACTCTCCTAACACTACCCCGCATCAAAGTGACGACCAGCCAGGATATGCTCTCAATCATGGAGAAATTGGAATTCTTCGATTTTTCTTATGACCTTAACCTGTGTGGGCTGACAGAGGACCCAGATCTTCAGGTTTCTGCGATGCAGCACCAGACAGTGCTGGAACTGACAGAGACTGGGGTGGAGGCGGCTGCAGCCTCCGCCATCTCTGTGGCCCGCACCCTGCTGGTCTTTGAAGTGCAGCAGCCCTTCCTCTTCGTGCTCTGGGACCAGCAGCACAAGTTCCCTGTCTTCATGGGGCGAGTATATGACCCCAGGGCCTGA(SEQ ID NO:1)。

本文中使用的野生型C1-INH(C1EI蛋白)具有以下氨基酸序列:MASRLTLLTLLLLLLAGDRASSNPNATSSSSQDPESLQDRGEGKVATTVISKMLFVEPILEVSSLPTTNSTTNSATKITANTTDEPTTQPTTEPTTQPTIQPTQPTTQLPTDSPTQPTTGSFCPGPVTLCSDLESHSTEAVLGDALVDFSLKLYHAFSAMKKVETNMAFSPFSIASLLTQVLLGAGENTKTNLESILSYPKDFTCVHQALKGFTTKGVTSVSQIFHSPDLAIRDTFVNASRTLYSSSPRVLSNNSDANLELINTWVAKNTNNKISRLLDSLPSDTRLVLLNAIYLSAKWKTTFDPKKTRMEPFHFKNSVIKVPMMNSKKYPVAHFIDQTLKAKVGQLQLSHNLSLVILVPQNLKHRLEDMEQALSPSVFKAIMEKLEMSKFQPTLLTLPRIKVTTSQDMLSIMEKLEFFDFSYDLNLCGLTEDPDLQVSAMQHQTVLELTETGVEAAAASAISVARTLLVFEVQQPFLFVLWDQQHKFPVFMGRVYDPRA(SEQ ID NO:2)。

本文描述的载体构建体可以包含这样的核苷酸序列:其与野生型核苷酸序列不同,但仍然编码与SEQ ID NO:2的氨基酸23-500具有至少90%、95%或98%同一性的功能性C1酯酶抑制剂氨基酸序列。根据该方面,所述核苷酸序列可以包含与SEQ ID NO:1或10-12的至少100个连续碱基具有至少80%、85%或90%同源性的部分,只要所述核苷酸序列编码与SEQ ID NO:2的氨基酸23-500具有至少90%、95%或98%同一性的功能性人C1酯酶抑制剂。在实施例实施方案中,所述核苷酸序列可以包含与SEQ ID NO:1或10-12的至少100、200、300、400或500个连续碱基具有至少90%同源性的部分,只要所述核苷酸序列编码与SEQ ID NO:2的氨基酸23-500具有至少90%同一性的功能性人C1酯酶抑制剂。在实施例实施方案中,所述核苷酸序列与SEQ ID NO:1或10-12的核苷酸序列具有实质同源性并编码功能性C1EI。术语实质同源性可以参考同源性百分比(%)进一步定义,例如至少80%、85%、90%或95%同源。这将在本文别处更详细地讨论。

当与本公开内容的核酸分子关联使用时,术语“分离的”通常表示从在其天然来源中通常与之相关的至少一种污染核酸中鉴定和分离的核酸序列。分离的核酸可以以不同于其在自然界中发现的形式或场合存在。因此,分离的核酸分子不同于存在于天然细胞中的核酸分子。

本文中使用的术语“变体”表示具有与参考多核苷酸(或多肽)基本相似的序列的多核苷酸(或多肽)。用于在多核苷酸、蛋白或多肽中引入核苷酸和氨基酸变化的程序是熟练的技术人员已知的(参见,例如,Sambrook等人(1989))。在多核苷酸的情况下,与参考多核苷酸相比,变体可以在5'末端、3'末端和/或一个或多个内部位点具有一个或多个核苷酸的缺失、置换、添加。使用本领域已知的常规技术,例如聚合酶链式反应(PCR)和杂交技术,可以检测变体与参考多核苷酸之间序列的相似性和/或差异。变体多核苷酸还包括合成地衍生出的多核苷酸,诸如例如使用定位诱变产生的那些。通常,多核苷酸(包括、但不限于DNA)的变体可以与参考多核苷酸具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性,如通过熟练的技术人员已知的序列比对程序所确定的。在多肽的情况下,与参考多肽相比,变体可以具有一个或多个氨基酸的缺失、置换、添加。使用本领域已知的常规技术,例如蛋白质印迹,可以检测变体与参考多肽之间序列的相似性和/或差异。通常,多肽的变体可以与参考多肽具有至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性,如通过熟练的技术人员已知的序列比对程序所确定的。

术语“同一性”、“同源性”及其语法变体是指,当它们是“比对的”序列时,两个或多个参考实体是相同的。因此,举例来说,当两个多肽序列相同时,它们具有相同的氨基酸序列,至少在参考区域或部分内。当两个多核苷酸序列相同时,它们具有相同的多核苷酸序列,至少在参考区域或部分内。同一性可以是在序列的定义区域(区域或结构域)上。具有同一性的“区域”或“区”表示两个或多个参考实体的相同的部分。因此,在两个蛋白或核酸序列在一个或多个序列区域或区上相同的情况下,它们在该区域内具有同一性。“比对的”序列表示多个多核苷酸或蛋白(氨基酸)序列,与参考序列相比,其经常含有对缺失或额外碱基或氨基酸(缺口)的校正。“实质同源性”是指,分子在结构上或在功能上是保守的,使得它具有或预期具有参考分子的结构或功能(例如,生物学功能或活性)中的一种或多种的至少部分结构或功能,或与其共享同源性的参考分子的相关/对应区域或部分。

“核酸序列同一性或同源性百分比(%)”定义为,在比对各个序列之后,如果必要的话引入缺口以实现最大序列同一性百分比,在候选序列中与参考序列相同的核苷酸的百分比。用于确定核酸序列同一性百分比目的的比对可以以本领域技术范围内的各种方式实现,例如,使用公众可得到的计算机软件诸如ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以确定用于测量比对的合适参数,包括在所对比的序列的全长上实现最大比对所需的任何算法。

关于本文鉴定的C1EI氨基酸序列,“氨基酸序列同一性或同源性百分比(%)”定义为,在比对所述序列之后,如果必要的话引入缺口以实现最大序列同一性百分比,且不考虑任何保守置换作为序列同一性的一部分,在候选序列中与C1EI多肽序列中的氨基酸残基相同的氨基酸残基的百分比。用于确定氨基酸序列同一性百分比的目的的比对可以以本领域技术中的多种方式实现,例如,使用公众可得到的计算机软件诸如ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以确定用于测量比对的合适参数,包括在所对比的序列的全长上实现最大比对所需的任何算法。

“密码子优化”或“密码子优化的”表示在核苷酸序列中做出的改变,使得与非密码子优化的序列相比,它更可能以相对高的水平表达。它不会改变每个密码子编码的氨基酸。

本文中使用的“内含子”广泛定义为可通过RNA剪接除去的核苷酸序列。“RNA剪接”是指将内含子从前mRNA切除以形成成熟的mRNA。内含子可以位于基因编码区的上游、下游或内部。通过本领域已知的任何方法,可以完成内含子向核苷酸序列中的插入。插入内含子的地方的唯一限制是考虑AAV病毒颗粒的包装限制(约5kbp)。

在某些实施方案中,所述重组AAV载体构建体包含核酸,所述核酸包含(a)AAV2 5'反向末端重复(ITR)(其可以如本领域已知的经过修饰或未经过修饰),(b)肝特异性转录调节区,(c)功能性C1EI蛋白编码区,(d)任选的一个或多个内含子,(e)多腺苷酸化序列,和(f)AAV2 3'ITR(其可以如本领域已知的经过修饰或未经过修饰)。

本文提供的其它实施方案涉及编码功能性C1EI多肽的载体构建体,其中所述构建体包含上述构建体的各个元件中的一个或多个和它们的组合,它们处于一种或多种不同取向。本文提供的另一个实施方案涉及相反取向的上述构建体。在另一个实施方案中,提供了包含本文描述的AAV载体构建体的重组AAV病毒颗粒及其用于治疗受试者的HAE或功能性C1EI缺乏的用途。在一个实施方案中,所述受试者是青少年受试者。

“AAV病毒粒子”或“AAV病毒颗粒”或“AAV载体颗粒”或“AAV病毒”表示由至少一种AAV衣壳蛋白和如本文中所述的衣壳化的AAV载体构建体组成的病毒颗粒。如果颗粒包含异源多核苷酸(即,除野生型AAV基因组之外的多核苷酸,诸如要递送给哺乳动物细胞的转基因),它通常被称作“重组AAV载体颗粒”或简称为“AAV载体”。AAV载体颗粒的产生必然包括AAV载体基因组的产生,因为这样的载体基因组被包含在AAV载体颗粒内。应当理解,对被封装在载体颗粒内的多核苷酸AAV载体构建体及其复制的提及表示AAV载体基因组。

本文中使用的“治疗性AAV病毒”表示包含异源多核苷酸的AAV病毒粒子、AAV病毒颗粒、AAV载体颗粒或AAV病毒,所述异源多核苷酸编码治疗性蛋白诸如本文描述的C1EI。本文中使用的“AAV载体构建体”或“AAV载体基因组”表示这样的载体构建体:其包含一种或多种编码目标蛋白的多核苷酸(也称为转基因),所述多核苷酸侧接至少一个AAV末端重复序列(ITR)并可操作地连接至一个或多个表达控制元件。当存在于已经用编码和表达rep和cap基因产物的载体转染的宿主细胞中时,这样的AAV载体构建体可以被复制并包装在传染性病毒颗粒中。

本文中使用的“治疗性蛋白”表示具有替代或补偿内源性蛋白的活性丧失或降低的生物活性的多肽。例如,功能性C1酯酶抑制剂(C1EI)是遗传性血管性水肿(HAE)的治疗性蛋白。

本文中使用的“遗传性血管性水肿(HAE)”表示一种遗传性代谢疾病,其特征在于皮下和/或粘膜下水肿(肿胀)的反复发作或症状,特别是在皮肤、胃肠道和呼吸道中,这是由于补体途径和/或接触活化途径的活化。严重肿胀的反复发作可以影响臂、腿、面部、肠道和气道,它们是疼痛的、毁容的,并且如果它们阻碍呼吸,有时会危及生命。如果不治疗,该病症具有25%的死亡率。

I型HAE和II型HAE是由功能性C1酯酶抑制剂(C1EI)蛋白的缺乏引起。I型HAE的特征在于C1EI的低表达水平。II型HAE的特征在于非功能性C1EI的正常的或升高的表达水平。III型HAE的特征在于功能性C1EI的正常水平,但在其它基因(诸如因子XII)中发生突变。

本文中使用的“C1酯酶抑制剂(C1EI)缺乏”或“功能性C1EI缺乏”表示由功能性C1酯酶抑制剂(C1EI)蛋白的缺乏引起的遗传病症。这包括I型和II型HAE。由功能性C1EI水平不足引起的补体和/或接触活化途径的不受抑制的活化导致激肽释放酶对高分子量激肽原的失调切割,从而导致过多的游离缓激肽的产生,缓激肽是增加毛细血管渗透性和水肿的有效血管活性肽。

本文中使用的“对HAE治疗上有效的”或“HAE疗法”表示对具有HAE的受试者的任何治疗干预,其改善HAE症状,或降低急性HAE发作的频率、持续时间或严重程度,或降低治疗急性HAE发作所需的按需疗法(例如人C1EI蛋白、激肽释放酶抑制剂、缓激肽拮抗剂等)的量,或降低为了治疗急性HAE发作而施用按需疗法的频率。本文中使用的“HAE基因疗法”表示对具有HAE的受试者的任何治疗干预,其涉及通过将一种或多种核酸分子递送至表达功能性C1EI蛋白的受试者的细胞来替代或恢复或增加C1EI活性。在某些实施方案中,HAE基因疗法表示涉及腺伴随病毒(AAV)颗粒的基因疗法,所述腺伴随病毒(AAV)颗粒包含表达人C1EI的载体构建体。

本文中使用的“治疗”或“处理”表示治疗性治疗,其表示对表现出病理学(即HAE)的征象或症状的受试者施用的治疗,其目的是减少或消除那些征象或症状。征象或症状可以是生化的、细胞的、组织学的、功能性的、主观的或客观的。“治疗”或“处理”或“治疗上有效的”表示与C1EI缺乏或HAE相关的疾病(或与其相关的症状)的进展、严重程度和/或持续时间的减少或改善,例如皮下水肿和/或粘膜下水肿的频率或严重程度,或异常升高的缓激肽水平。治疗可以发生在水肿之前或之后。恢复血液中功能性C1EI的正常水平例如约16mg/dL(约1IU/ml)至约32mg/dL的治疗可以减轻症状,或恢复正常C1EI水平的约40%或更多,这可以预期会改善HAE症状。参见,例如,Zuraw等人,Allergy 2015;70:1319-1328,表明以C1EI的正常水平的约40%观察到临床上有意义的效果。治疗优选是在临床上显著的时间长度内将功能性C1EI恢复到治疗有效水平的稳定治疗。

本文中使用的“改善”表示减轻疾病的症状的严重程度、进展或持续时间的动作。

本文中使用的“稳定地治疗”或“稳定治疗”表示使用施用给受试者的治疗性载体构建体、AAV颗粒或细胞,其中所述受试者稳定地表达由载体构建体、AAV颗粒或细胞表达的治疗性蛋白。稳定地表达的治疗性蛋白是指,所述蛋白在临床上显著的时间长度内表达。本文中使用的“临床上显著的时间长度”是指,在治疗有效水平上表达对受试者的生活质量具有有意义影响的时间长度。在某些实施方案中,对生活质量的有意义影响通过不需要静脉内地或皮下地施用替代疗法来证实。在某些实施方案中,临床上显著的时间长度是表达至少六个月,至少八个月,至少一年,至少两年,至少三年,至少四年,至少五年,至少六年,至少七年,至少八年,至少九年,至少十年,或受试者的一生。优选地,治疗上有效的表达持续至少一年。

本文中使用的术语“有效量”表示足以实现有益的或合乎需要的生物学和/或临床结果的量。

本文中使用的“受试者”表示作为治疗、观察或实验的对象的动物。“动物”包括冷血和温血脊椎动物和无脊椎动物,诸如鱼、贝类、爬行动物,和特别是哺乳动物。本文中使用的术语“禽类”包括、但不限于鸡、鸭、鹅、鹌鹑、火鸡和雉鸡。本文中使用的“哺乳动物”表示属于哺乳动物纲的个体,且包括、但不限于人类、家养动物和耕作动物、动物园动物、运动动物和宠物动物。哺乳动物的非限制性例子包括小鼠;大鼠;兔;豚鼠;狗;猫;绵羊;山羊;奶牛;马;灵长类动物,诸如猴、黑猩猩和猿类,和尤其是人类。在某些实施方案中,所述哺乳动物是人。但是,在某些实施方案中,所述哺乳动物不是人。

一般而言,“药学上可接受的载体”是对细胞没有毒性或过度有害的载体。示例性的药学上可接受的载体包括无菌的、无热原的水,和无菌的、无热原的磷酸盐缓冲盐水。药学上可接受的载体包括生理上可接受的载体。术语“药学上可接受的载体”包括生理学上相容的任意的和所有的溶剂、分散介质、包衣剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。

在另一个实施方案中,提供了产生包含本文提供的任何AAV载体构建体的重组腺伴随病毒(AAV)颗粒的方法。所述方法包括以下步骤:培养已经用本文提供的任何AAV载体构建体(与各种AAV cap和rep基因结合)转染的细胞,和从转染的细胞的上清液回收重组治疗性AAV颗粒。

本文提供的可用于重组AAV生产的细胞是对杆状病毒感染敏感的任何细胞类型,包括昆虫细胞诸如High Five、Sf9、Se301、SeIZD2109、SeUCR1、Sf9、Sf900+、Sf21、BTI-TN-5B1-4、MG-1、Tn368、HzAm1、BM-N、Ha2302、Hz2E5和Ao38。在另一个实施方案中,可以使用哺乳动物细胞诸如HEK293、HeLa、CHO、NSO、SP2/0、PER.C6、Vero、RD、BHK、HT 1080、A549、Cos-7、ARPE-19和MRC-5。

在另一个实施方案中,本文提供了有效量的载体核酸、载体构建体或AAV颗粒用于制备药物的用途,所述药物用于治疗遭受HAE或C1EI缺乏的受试者。在一个实施方案中,遭受HAE的受试者是人。在一个实施方案中,通过静脉内(IV)施用来施用药物。在另一个实施方案中,所述药物的施用导致受试者血流中C1EI蛋白的表达,其足以增加受试者血液中功能性C1EI蛋白的水平,改善HAE症状。在某些实施方案中,所述药物还用于与预防性和/或治疗性皮质类固醇共同施用以预防和/或治疗与AAV-C1EI病毒的施用相关的任何肝毒性。预防性或治疗性皮质类固醇治疗可以包含至少5、10、15、20、25、30、35、40、45、50、55、60或更多mg/天的皮质类固醇。在某些实施方案中,可以在至少约3、4、5、6、7、8、9、10周或更长的连续时间段内施用预防性或治疗性皮质类固醇。

在另一个实施方案中,本文提供的HAE疗法任选地进一步包括用于治疗HAE的其它疗法(例如减弱的雄激素诸如达那唑、司坦唑醇、氧雄龙、甲睾酮、替勃龙、羟甲烯龙)的施用,例如同时施用。在某些实施方案中,对于急性HAE发作,本文提供的HAE疗法包含以下一种或多种的附加施用:C1EI蛋白(任选地重组的或血浆衍生的)、激肽释放酶抑制剂、缓激肽拮抗剂和/或减弱的雄激素。

本公开内容的重组载体构建体本身可以用作基因疗法,或可以用于通过本文描述的方法产生rAAV颗粒,所述方法包括向合适的宿主细胞提供重组载体构建体以及Rep和Cap基因。本文描述的载体构建体包含编码功能性C1酯酶抑制剂(C1EI)的核酸序列。所述重组载体构建体可以包含:编码功能性人C1EI的核酸,其可操作地连接至异源表达控制元件,例如启动子和/或增强子;任选的内含子;和任选的多腺苷酸化(多腺苷酸)信号。所述异源表达控制元件可以是异源肝特异性转录调节区,例如,如本文中所述的。

当用于生产rAAV颗粒时,所述重组载体构建体可以包含(a)(i)AAV 5'反向末端重复(ITR)序列和(ii)AAV 3’ITR中的一个或两个,(b)异源肝特异性转录调节区,和(c)编码功能性人C1EI的核酸,任选地其中所述AAV ITR是AAV2 ITR。优选地,编码功能性C1EI的核酸可操作地连接至肝特异性表达控制元件。所述载体构建体可以包括额外的表达控制元件,例如:启动子和/或增强子;内含子;任选的来自与内含子相同基因的外显子;和多腺苷酸化(多腺苷酸)信号。本文进一步描述了这样的元件。优选地,所述rAAV颗粒也包含具有肝嗜性的AAV衣壳,任选AAV5型衣壳。

在一个或多个实施方案中,所述功能性C1EI包含与SEQ ID NO:2(人C1EI或“hC1EI”)的氨基酸23-500具有至少90%、95%或98%同一性的氨基酸序列。在实施例实施方案中,编码功能性C1EI的核酸序列是野生型SERPIN G1序列,SEQ ID NO:1为其一个例子,或经过密码子优化,或是变体。

在一个或多个实施方案中,编码C1EI的核酸序列可操作地连接至一个或多个异源表达控制元件。优选地,所述表达控制元件是肝特异性表达控制元件。肝特异性控制元件的例子包括、但不限于小鼠thyretin启动子(mTTR)、内源性人因子VIII启动子(F8)、人载脂蛋白E肝控制区及其活性片段、人α-1-抗胰蛋白酶启动子(hAAT)及其活性片段、人α-1-微球蛋白启动子及其片段、人凝血酶原启动子及其活性片段、人白蛋白最小启动子和小鼠白蛋白启动子。也涵盖从肝特异性转录因子结合位点衍生出的增强子,诸如EBP、DBP、HNF1、HNF3、HNF4、HNF6和Enh1。

在某些实施方案中,所述载体构建体包含编码功能性C1EI的核酸序列,其可操作地连接至异源肝特异性转录调节区。所述载体构建体可以包含其它调节元件。在某些实施方案中,在本文描述的载体构建体中,所述表达控制元件包括以下一种或多种:启动子和/或增强子;任选的内含子;和多腺苷酸化(多腺苷酸)信号。

所述肝特异性转录调节区可以包含一个或多个肝特异性表达控制元件。在一个或多个实施方案中,所述肝特异性转录调节区是包含人α-1-抗胰蛋白酶(hAAT)启动子、肝控制区(HCR)增强子和/或载脂蛋白E(ApoE)增强子的部分的合成启动子序列。

在某些实施方案中,所述载体构建体至少包含以下中的一个或两个:AAV的5′反向末端重复(ITR)和3′AAV ITR、启动子、编码功能性C1EI的核酸和任选的转录后调节元件,其中启动子、编码C1EI的核酸和转录后调节元件位于5′AAV ITR的下游和3′AAV ITR的上游。所述载体构建体可以例如用于为了治疗目的在受试者中产生高水平的C1EI。

在某些实施方案中,所述重组AAV载体构建体包含核酸,所述核酸包含(a)AAV2 5'反向末端重复(ITR)(其可以如本领域已知的经过修饰或未经过修饰)、(b)肝特异性转录调节区,(c)功能性C1EI蛋白编码区,(d)任选的一个或多个内含子,(e)多腺苷酸化序列,和(f)AAV2 3'ITR(其可以如本领域已知的经过修饰或未经过修饰)。

在某些实施方案中,所述肝特异性转录调节区包含缩短的ApoE增强子序列(SEQID NO:16)或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列;186碱基人α抗胰蛋白酶(hAAT)近侧启动子,包括42碱基的5'非翻译区(UTR)(SEQ ID NO:15)或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列;一个或多个增强子,其选自(i)34碱基人ApoE/HCR增强子(SEQ ID NO:4)或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列,(ii)32碱基人AAT启动子远侧X区域或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列,和(iii)人AAT近侧启动子的远侧元件的80个额外碱基或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列;和编码人C1EI的核酸。在另一个实施方案中,所述肝特异性转录调节区包含α-微球蛋白增强子序列(SEQ ID NO:17)或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列以及186碱基人α抗胰蛋白酶(AAT)近侧启动子(SEQ ID NO:15)或与其具有至少80%、85%、90%、95%或98%同一性的核苷酸序列。

本文提供的其它实施方案涉及编码功能性C1EI多肽的载体构建体,其中所述构建体包含上述构建体的各个元件中的一个或多个和它们的组合,它们处于一种或多种不同取向。本文提供的另一个实施方案涉及相反取向的上述构建体。在另一个实施方案中,提供了包含本文描述的载体构建体的重组AAV颗粒及其用于治疗受试者的HAE或C1EI缺乏的用途。在一个实施方案中,所述受试者是青少年受试者。

呈单链形式的本文提供的AAV载体构建体小于约7.0kb长度,或小于6.5kb长度,或小于6.4kb长度,或小于6.3kb长度,或小于6.2kb长度,或小于6.0kb长度,或小于5.8kb长度,或小于5.6kb长度,或小于5.5kb长度,或小于5.4kb长度,或小于5.3kb长度,或小于5.2kb长度,或小于5.0kb长度,或小于4.8kb长度,或小于4.6kb长度,或小于4.5kb长度,或小于4.4kb长度,或小于4.3kb长度,或小于4.2kb长度,或小于4.1kb长度,或小于4.0kb长度,或小于3.9kb长度,或小于3.8kb长度,或小于3.7kb长度,或小于3.6kb长度,或小于3.5kb长度,或小于3.4kb长度,或小于3.3kb长度,或小于3.2kb长度,或小于3.1kb长度,或小于3.0kb长度。呈单链形式的本文提供的AAV载体构建体范围为从约5.0kb至约6.5kb长度,或范围为从约4.8kb至约5.2kb长度,或4.8kb至5.3kb长度,或范围为从约4.9kb至约5.5kb长度,或约4.8kb至约6.0kb长度,或约5.0kb至6.2kb长度或约5.1kb至约6.3kb长度,或约5.2kb至约6.4kb长度,或约5.5kb至约6.5kb长度,或范围为从约4.0kb至约5.0kb长度,或范围为从约3.8kb至约4.8kb长度,或3.6kb至4.6kb长度,或范围为从约3.4kb至约4.4kb长度,或范围为从约3.2kb至约4.2kb长度,或范围为从约3.0kb至4.0kb长度,或范围为从约3.5kb至约4.0kb长度,或范围为从约3.0kb至约3.5kb长度。本文提供的AAV载体构建体也可以范围为从约2.7kb至约3.3kb长度,或约3.7kb至约4.1kb长度,或约2.7kb至约4kb长度,或约2.7kb至约4.1kb长度,例如,SEQ ID NO 57(HAE23)和58(HAE24)。在本公开内容的载体构建体中,较小尺寸范围的载体构建体提供较高的表达水平。

当从过大的重组载体构建体产生AAV载体时,它们可能缺少重组载体构建体的5'或3'末端的一部分。因为AAV是一种单链DNA病毒,并且包装有义链或反义链,因此过大的AAV载体中的有义链缺乏5'AAV ITR且可能缺乏靶蛋白编码基因的5'末端的部分,并且过大的AAV载体中的反义链缺乏3'ITR且可能缺乏靶蛋白编码基因的3'末端的部分。通过靶细胞内的有义和反义截短基因组的退火,在过大的AAV载体感染的细胞中产生功能性转基因。因而,在某些实施方案中,本发明的rAAV颗粒可以包含重组载体构建体,其包含至少一个ITR和编码功能性C1EI的核苷酸序列的主要部分,诸如SEQ ID NO:10-13、59或60中的任一个的片段,其为核苷酸序列的长度的大于50%、60%、70%、80%或90%。例如,所述重组载体构建体可以包含至少一个ITR、肝特异性转录调节区、和编码功能性C1EI的核苷酸序列的主要部分。本发明的rAAV颗粒还可以包含SEQ NO:8、9、20-36、57和58中任何一个的主要部分,例如为在SEQ ID NO:8、9、20-36、57和58中的任一个中所示的核苷酸序列的长度的大于50%、60%、70%、80%或90%的片段,包括肝特异性转录调节区。

载体构建体的产生可以使用本领域众所周知的任何合适的基因工程技术来完成,包括、但不限于限制性内切核酸酶消化、连接、转化、质粒纯化和DNA测序的标准技术,例如描述在Sambrook等人(Molecular Cloning:A Laboratory Manual.Cold Spring HarborLaboratory Press,N.Y.(1989))。

载体构建体可以掺入来自任何已知生物的基因组的序列。所述序列可以以其天然形式掺入,或可以以任何方式修饰以得到期望的活性。例如,所述序列可以包含插入、缺失或置换。

当AAV载体构建体存在于已经用编码和表达rep和cap基因产物的多核苷酸转染的宿主细胞中时,AAV载体构建体可以被复制并包装成感染性AAV颗粒,优选复制缺陷型AAV颗粒。

本文所述的载体构建体或AAV颗粒还可以在C1EI-缺陷型小鼠模型中产生有益效果,所述模型具有与人类中的HAE相关的特征,包括降低的血浆C1EI水平。在表型上,这些小鼠具有增加的皮肤和内脏器官的血管渗透性。

在本文公开的载体构建体中,各种启动子可以与包含目标蛋白(人C1EI)的编码区的核酸可操作地连接。在某些实施方案中,所述启动子可以驱动目标蛋白在被源自病毒载体的病毒感染的细胞(诸如靶细胞)中的表达。所述启动子可以是天然存在的或非天然存在的。在某些实施方案中,所述启动子是合成启动子。在一个实施方案中,所述合成启动子包含在自然界中不存在的序列,并且其被设计用于调节可操作地连接的基因的活性。在另一个实施方案中,所述合成启动子包含天然启动子的片段以形成在自然界中不存在的新的DNA序列片段。合成启动子通常包含调节元件、启动子、增强子、内含子、剪接供体和受体,它们被设计成产生增强的组织特异性表达。启动子的例子包括、但不限于病毒启动子、植物启动子和哺乳动物启动子。在另一个实施方案中,所述启动子是肝特异性启动子。肝特异性启动子的具体例子包括LP1、HLP、HCR-hAAT、ApoE-hAAT、LSP、TBG和TTR。这些启动子更详细地描述于以下参考文献中:LP1(具有人AAT启动子(255bp)的人ApoE HCR核心序列(192bp)):Nathwani A.等人.Blood.2006年4月1日;107(7):2653-2661;杂合的肝特异性启动子(HLP)(具有经修饰的人α-1-抗胰蛋白酶(αAT)启动子(217bp)的人载脂蛋白E(ApoE)肝控制区(HCR)片段(34bp)):McIntosh J.等人.Blood.2013年4月25日;121(17):3335-3344;HCR-hAAT(ApoE-HCR(319bp),具有ApoE增强子(1-4x154bp),具有人AAT启动子(408bp),且包括内含子A(1.4kbp)和3’UTR(1.7kbp)):Miao CH等人.Mol Ther.2000;1:522-532;ApoE-hAAT:Okuyama T等人.Human Gene Therapy,7,637-645(1996);LSP:Wang L等人.ProcNatl Acad Sci U S A.1999年3月30日;96(7):3906-3910,甲状腺素结合球蛋白(TBG)启动子:Yan等人,Gene 506:289-294(2012),和转甲状腺素蛋白(TTR)启动子:Costa等人,Mol.Cell.Biol.8:81-90(1988)。

例如,De Simone等人(EMBO Journal第6卷第9期第2759-2766页,1987)描述了许多源自人α-1-抗胰蛋白酶启动子的启动子。例如,它表征了在从-1200至+44的人AAT启动子内的肝特异性活性所需的顺式和反式作用元件。在HLP中的人AAT启动子由远侧X元件(32bp)以及近侧A和B元件(185bp)组成。Frain等人(MOL CELL BIO,1990年3月,第10卷,第3期,第991-999页)描述了许多源自人白蛋白启动子的启动子。例如,它表征了在从-1022至-1的人白蛋白基因内的启动子和增强子元件。

Dang等人(J BIOL CHEM,第270卷,第38期,9月22日发行,第22577-22585页,1995)描述了人载脂蛋白E基因(774bp)的肝控制区(HCR)。Shachter等人(J.Lipid Res.1993.第34卷:第1699-1707页)表征了ApoE HCR(154bp)中的肝特异性增强子。这些HCR片段可以与其它转录调节元件诸如人AAT启动子或其片段组合。Chow等人(J Biol Chem.1991年10月5日;266(28):18927-33)表征了从-940至-860(80bp)的人凝血酶原增强子。Rouet等人(第267卷,第29期,10月15日发行,第20765-20773页,1992;Nucleic Acids Res.1995年2月11日;23(3):395-404;和Biochemical Journal,1998年9月15日,334(3)577-584)表征了肝特异性人α-1-微球蛋白/bikunin增强子的序列。美国专利号7,323,324也描述了人AAT启动子、人α-微球蛋白/bikunen增强子、人白蛋白启动子和人凝血酶原增强子。

在某些实施方案中,所述启动子包含人α1抗胰蛋白酶(hAAT)启动子复合物。在某些实施方案中,所述启动子包含hAAT启动子的至少一部分。hAAT启动子的部分可以包含与SEQ ID NO:3具有至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核酸序列。

在某些实施方案中,所述启动子包含肝特异性增强子。在某些实施方案中,所述启动子包含载脂蛋白E(ApoE)/肝控制区(HCR)增强子。在某些实施方案中,所述启动子包含ApoE/HCR增强子的至少一部分。例如,ApoE/HCR增强子可以包含与SEQ ID NO:4具有至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核酸序列。

在某些实施方案中,所述启动子是包含hAAT启动子的至少一部分、ApoE/HCR增强子的至少一部分的合成启动子。在某些实施方案中,所述启动子可以包括与SEQ ID NO:5具有至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核酸序列。

在某些实施方案中,所述启动子包含一种或多种上面指出的增强子的多个拷贝。在某些实施方案中,所述启动子构建体包含上述各个增强子元件中的一个或多个和它们的组合,它们处于一种或多种不同取向。

在某些实施方案中,所述启动子与编码一种或多种目标蛋白的多核苷酸可操作地连接。在某些实施方案中,所述启动子与编码C1EI蛋白的多核苷酸可操作地连接。

启动子的大小可以变化。由于AAV的包装能力有限,优选使用小尺寸的启动子,但同时允许在宿主细胞中高水平生产目标蛋白。例如,在某些实施方案中,所述启动子是至多约1.5kb、至多约1.4kb、至多约1.35kb、至多约1.3kb、至多约1.25kb、至多约1.2kb、至多约1.15kb、至多约1.1kb、至多约1.05kb、至多约1kb、至多约800碱基对、至多约600碱基对、至多约400碱基对、至多约200碱基对或至多约100碱基对。

在载体构建体中可以使用各种额外的调节元件,例如增强子以进一步增加宿主细胞中目标蛋白的表达水平,多腺苷酸化信号、核糖体结合序列和/或共有剪接受体或剪接供体位点。在某些实施方案中,所述调节元件可以促进重组DNA分子在宿主细胞中在染色体外的维持和/或提高载体效能(例如支架/基质附着区域(S/MAR))。这样的调节元件是本领域众所周知的。

本文中公开的载体构建体可以包括调节元件诸如转录起始区域和/或转录终止区域。转录终止区域的例子包括、但不限于多腺苷酸化信号序列。多腺苷酸化信号序列的例子包括、但不限于人生长激素(hGH)多腺苷酸、牛生长激素(bGH)多腺苷酸、SV40晚期多腺苷酸、兔β-珠蛋白(rBG)多腺苷酸、胸苷激酶(TK)多腺苷酸序列,及其任何变体。在某些实施方案中,所述转录终止区域位于转录后调节元件的下游。在某些实施方案中,所述转录终止区域是多腺苷酸化信号序列。在某些实施方案中,所述转录终止区域是hGH多腺苷酸序列(SEQID NO:7)。

在某些实施方案中,所述载体构建体可以包括额外的转录和翻译起始序列,和/或额外的转录和翻译终止子,它们是本领域已知的。

本文中使用的“目标蛋白”是任何功能性C1EI蛋白,包括其天然存在的和非天然存在的变体。在某些实施方案中,可以将编码一种或多种C1EI目标蛋白的多核苷酸插入本文公开的病毒载体中,其中所述多核苷酸与启动子可操作地连接。在某些情况下,所述启动子可以驱动目标蛋白在宿主细胞(例如,人肝细胞)中的表达。

在第一方面,本公开内容提供了一种分离的核酸分子,其包含编码功能性野生型C1EI蛋白(例如,SEQ ID NO:2)的核苷酸序列。所述核苷酸序列可以与SEQ ID NO:1的野生型核苷酸序列同源。

如本文所述,可以修饰编码C1EI蛋白的核苷酸序列以提高蛋白的表达效率。可以用于改善本文基因的转录和/或翻译的方法没有特别限制。例如,可以修饰核苷酸序列以更好地反映宿主密码子选择从而增加在宿主(例如,哺乳动物)中的基因表达(例如,蛋白生产)。作为修饰的另一个非限制性例子,目标蛋白的核苷酸序列中的一个或多个剪接供体和/或剪接受体被修饰以减少外来剪接的潜力。作为修饰的另一个非限制性例子,可以将一个或多个内含子插入目标蛋白的核苷酸序列内或附近以优化AAV载体包装和增强表达。

编码功能性C1EI蛋白的核酸分子与SEQ ID NO:2的氨基酸23-500具有至少90%同一性,且优选地与野生型氨基酸序列具有至少95%或98%同一性。如果核酸所编码的蛋白包含具有对任何野生型氨基酸的变化的序列,该蛋白仍应是功能性蛋白。技术人员将理解,可以对蛋白的一些氨基酸做出微小改变,而不对蛋白的功能产生不利影响。

在某些实施方案中,所述核酸分子与SEQ ID NO:1或10-12的核苷酸序列、或SEQID NO:1或10-12的至少100、200、300、400或500个连续核苷酸具有至少75%、至少80%、至少85%、至少90%、至少95%同源性或至少98%同源性。在一个实施方案中,所述核酸分子编码功能性C1EI蛋白,就是说它编码C1EI,其当被表达时具有野生型C1EI的功能性。在某些实施方案中,当在合适的系统(例如宿主细胞)中表达时,所述核酸分子产生功能性C1EI蛋白并且处于相对高的水平。由于产生的C1EI是功能性的,因此它将具有与野生型C1EI的至少一部分相同的构象。在某些实施方案中,如本文中所述产生的功能性C1EI蛋白有效地治疗遭受C1EI缺乏和/或HAE的受试者。

在另一个实施方案中,与编码相应的非密码子优化序列的天然存在的核苷酸序列相比,编码功能性C1EI的核苷酸序列对人细胞具有改进的密码子选择偏倚。编码功能性C1EI的核苷酸序列对人细胞密码子选择的适应性可以表示为密码子适应指数(CAI)。密码子适应指数在本文中定义为基因的密码子选择对高度表达的人基因的密码子选择的相对适应性的量度。每个密码子的相对适应性(w)是每个密码子的选择与相同氨基酸的最丰富密码子的选择之比。CAI被定义为这些相对适应性值的几何平均值。不包括非同义密码子和终止密码子(取决于遗传密码)。CAI值范围从0到1,值越高表明最丰富的密码子的比例越高(参见Sharp和Li,1987,Nucleic Acids Research 15:1281-1295;也参见:Kim等人,Gene.1997,199:293-301;zur Megede等人,Journal of Virology,2000,74:2628-2635)。在某些实施方案中,编码C1EI的核酸分子具有至少0.75、0.80、0.85、0.90、0.95或0.99的CAI。

SEQ ID NO:10-12的核苷酸序列是密码子优化的人C1EI核酸序列,其基于野生型人C1EI核苷酸序列(SEQ ID NO:1)的序列。

例如,使用DNA2.0密码子优化算法,可以进行密码子优化,参见Villalobos等人,“Gene Designer:a synthetic biology tool for constructing artificial DNAsegments,”BMC Bioinformatics,第7卷,文章编号:285(2006)或Operon/EurofinsGenomics密码子优化软件。

例如,可以修饰核苷酸序列以更好地反映宿主密码子选择从而增加在宿主(例如,哺乳动物)中的基因表达(例如,蛋白生产)。作为修饰的另一个非限制性例子,目标蛋白的核苷酸序列中的一个或多个剪接供体和/或剪接受体被修饰以减少外来剪接的潜力。作为修饰的另一个非限制性例子,可以将一个或多个内含子插入目标蛋白的核苷酸序列内或附近以优化AAV载体包装和增强表达。

在另一个实施方案中,与编码相应的非密码子优化序列的天然存在的核苷酸序列相比,编码目标蛋白的核苷酸序列对人细胞具有改进的密码子选择偏倚。编码目标蛋白的核苷酸序列对人细胞密码子选择的适应性可以表示为密码子适应指数(CAI)。密码子适应指数在本文中定义为基因的密码子选择对高度表达的人基因的密码子选择的相对适应性的量度。每个密码子的相对适应性(w)是每个密码子的选择与相同氨基酸的最丰富密码子的选择之比。CAI被定义为这些相对适应性值的几何平均值。不包括非同义密码子和终止密码子(取决于遗传密码)。CAI值范围从0到1,值越高表明最丰富的密码子的比例越高(参见Sharp和Li,1987,Nucleic Acids Research15:1281-1295;也参见:Kim等人,Gene.1997,199:293-301;zur Megede等人,Journal of Virology,2000,74:2628-2635)。在某些实施方案中,编码目标蛋白的核酸分子具有至少0.75、0.80、0.85、0.90、0.95或0.99的CAI。

这可以与手动降低CpG二核苷酸含量并在有义和反义方向上除去任何额外的ORF结合完成。已经证实CpG二核苷酸含量会活化树突细胞中的TLR9,从而导致潜在的免疫活化和CTL应答。我们在递送的AAV载体基因组中的产品是ssDNA,从而降低了CpG含量,这可能减轻肝炎和ALT。

通常,密码子优化不会改变每个密码子编码的氨基酸。它只是改变核苷酸序列,使得与非密码子优化序列相比更可能以相对高的水平表达。这意味着,本文提供的核酸的核苷酸序列和例如SEQ ID NO:1或10-12可能是不同的,但是当它们被翻译时,所产生的蛋白的氨基酸序列是相同的。

在某些实施方案中,密码子优化的hC1EI核酸分子具有小于25、小于20、小于15或小于10的CpG二核苷酸含量。在另一个实施方案中,密码子优化的hC1EI核酸分子具有小于65%、小于60%或小于58%的GC含量。

生产本文提供的核酸分子完全是在技术人员的能力范围内。例如,这可以使用给定序列的化学合成来完成。此外,用于确定本文所述的核酸是否表达功能性蛋白的合适方法对于本领域技术人员将是显而易见的。例如,一种合适的体外方法包括将核酸插入载体诸如AAV载体,用该载体转导宿主细胞,诸如293T或HeLa细胞,并测定C1EI活性。可替换地,合适的体内方法包括将含有核酸的载体转导进HAE小鼠中,并测定小鼠血浆中的功能性C1EI。下文更详细地描述了合适的方法。

在某些实施方案中,所述载体包含一个或多个内含子。所述内含子可以促进哺乳动物宿主细胞中RNA转录物的加工,增加目标蛋白的表达和/或优化载体向AAV颗粒中的包装。这样的内含子的非限制性例子是血红蛋白(β-珠蛋白)内含子、hAAT内含子和/或A1AT内含子。在某些实施方案中,所述内含子是合成的内含子。例如,所述合成的内含子可以包括与SEQ ID NO:6具有至少约80%、85%、90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核苷酸序列。在载体中的内含子的位置和大小可以变化。在某些实施方案中,所述内含子位于启动子和编码目标蛋白的序列之间。在某些实施方案中,所述内含子位于编码目标蛋白的序列的下游。在某些实施方案中,所述内含子位于启动子内。在某些实施方案中,所述内含子包括增强子元件。在某些实施方案中,所述内含子位于编码目标蛋白的序列内,优选位于编码目标蛋白的序列的外显子之间。在某些实施方案中,所述内含子可以包含编码目标蛋白的序列内的全部或部分天然存在的内含子。在某些实施方案中,所述内含子是C1EI内含子,例如,第二C1EI内含子。在其它实施方案中,所述内含子序列是复杂的hAAT/血红蛋白内含子。在某些实施方案中,所述内含子也增强编码C1EI的核酸的表达。

在某些实施方案中,所述载体构建体可以进一步包含外显子序列或其片段,优选地邻近内含子序列,例如邻近hAAT外显子(SEQ ID NO:72)或其片段的hAAT内含子,和/或邻近血红蛋白外显子(SEQ ID NO:71)或其片段的血红蛋白内含子(SEQ ID NO:70)。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:61具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约100至约300个核苷酸长度,或约150至约250个核苷酸长度。在实施例实施方案中,所述内含子包含与SEQ ID NO:61具有至少80%或85%或90%或95%同一性的核苷酸序列,并且是约50-300个核苷酸、约100-250个核苷酸、约100-225个核苷酸、约100-200个核苷酸、约150-225个核苷酸、约150-200个核苷酸、约175-300个核苷酸、约175-250个核苷酸或约150-250个核苷酸长度。

在某些实施方案中,所述内含子包含SEQ ID NO:67或其片段。在一个或多个实施方案中,所述内含子包含与SEQ ID NO:64具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约300至约600个核苷酸长度,或约400至约500个核苷酸长度。在实施例实施方案中,所述内含子包含SEQ ID NO:64或其片段,并且是约100-900个核苷酸、约200-800个核苷酸、约200-700个核苷酸、约200-600个核苷酸、约200-500个核苷酸、约300-700个核苷酸、约300-600个核苷酸、约300-500个核苷酸、约400-700个核苷酸、约400-600个核苷酸或约400-500个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:62具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约200至约500个核苷酸长度,或约300至约400个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:63具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约200至约500个核苷酸长度,或约300至约400个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:65具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约600至约1000个核苷酸长度,或约800至约900个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:66具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约1000至约2000个核苷酸长度,或约1300至约1500个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:67具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约1500至约2000个核苷酸长度,或约1800至约1900个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:68具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约50至约150个核苷酸长度。

在一个或多个实施方案中,所述内含子包含与SEQ ID NO:69具有至少80%或85%或90%或95%同一性的核苷酸序列,且所述内含子可以是约50至约125个核苷酸长度。

在某些实施方案中,所述载体构建体可以进一步包含外显子序列或其片段;优选地邻近内含子序列。在一个实施例实施方案中,所述载体构建体包含邻近外显子的hAAT内含子,所述外显子包含与SEQ ID NO:72具有至少80%或85%或90%或95%同一性的核苷酸序列。在另一个实施例实施方案中,所述载体构建体包含邻近外显子序列的血红蛋白内含子,所述外显子序列包含与SEQ ID NO:70具有至少80%或85%或90%或95%同一性的核苷酸序列。在一个实施例实施方案中,所述载体包含(a)邻近外显子的hAAT内含子,所述外显子包含与SEQ ID NO:72具有至少80%或85%或90%或95%同一性的核苷酸序列,和(b)邻近外显子序列的血红蛋白内含子,所述外显子序列包含与SEQ ID NO:70具有至少80%或85%或90%同一性的核苷酸序列。在一个实施例实施方案中,所述载体构建体包含hAAT内含子和血红蛋白内含子,其邻近包含与SEQ ID NO:71具有至少80%或85%或90%同一性的核苷酸序列的血红蛋白外显子序列。

与在没有内含子元件存在下的表达相比,内含子元件的包含可以增强表达(参见例如Kurachi等人,1995,J Biol Chem.1995年3月10日;270(10):5276-81)。AAV载体通常接受具有确定大小范围的DNA插入片段,该范围通常为约4kb至约5.2kb,或稍大一些。但是,包装没有最小尺寸,且小载体基因组非常有效地包装。内含子和内含子片段满足了该要求,同时也增强了表达。因此,本公开内容不限于在AAV载体中包含C1EI内含子序列,并且包括其它内含子或其它DNA序列来代替C1EI内含子的部分。此外,可以使用核酸的其它5'和3'非翻译区来代替针对人C1EI列举的那些。

使用各种标准克隆、重组DNA技术、通过细胞表达或本领域技术人员已知的体外翻译和化学合成技术,可以制备包括修饰形式的多核苷酸和多肽(Sambrook等人,MolecularCloning:A Laboratory Manual,第2版)。

还提供了使用如本文中所述的载体构建体或AAV颗粒来递送编码目标蛋白的基因的方法。在一个实施方案中,基因递送载体可以是病毒基因递送载体,诸如病毒颗粒,或非病毒基因递送载体,诸如编码目标蛋白的载体构建体或核酸。病毒载体包括慢病毒、腺病毒、疱疹病毒载体。它优选地是重组腺相关病毒(rAAV)载体。可替换地,可以使用非病毒系统,包括使用通过各种转染方法(诸如脂质或电穿孔)引入细胞中的裸DNA(具有或不具有染色质附着区)或缀合DNA。

如本文中所述的病毒载体构建体的一个非限制性例子提供在SEQ ID NO:9中,并包括ApoE/HCR-hAAT启动子、hAAT/血红蛋白内含子(hhI)、人C1EI的野生型编码序列和人生长激素(hGH)多腺苷酸序列(“HAE15”或“ApoE/HCR-hAAT.hhI.SERPIN G1.hGH”)。如本文中所述的病毒载体构建体的其它非限制性例子提供在SEQ ID NO:20-36、57和58中的任一个中。另一种载体构建体如在SEQ ID NO:8(“CBA-HAE”或“CBA.SERPIN G1.bGH”)中所示,其包含从鸡β-肌动蛋白(CBA)启动子序列衍生出的启动子、人C1EI的野生型编码序列和牛生长因子(bGH)多腺苷酸序列。

在某些实施方案中,所述载体构建体或AAV载体基因组包含与SEQ ID NO:9具有至少约80%、85%、90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核苷酸序列。在某些实施方案中,所述载体构建体或AAV载体基因组包含与SEQ ID NO:20-36中的任一个具有至少约80%、85%、90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核苷酸序列。在某些实施方案中,所述载体构建体或AAV载体基因组包含与SEQ ID NO:57具有至少约80%、85%、90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核苷酸序列。在某些实施方案中,所述载体构建体或AAV载体基因组包含与SEQ ID NO:58具有至少约80%、85%、90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性的核苷酸序列。

本公开内容可以用于兽医和医学应用。本文所述的基因递送方法的合适受试者包括禽类和哺乳动物,其中哺乳动物是优选的,且人类是最优选的。人受试者包括新生儿、婴儿、青少年和成人。

使用裸DNA可以进行非病毒基因递送,这是最简单的非病毒转染方法。例如,可能使用裸质粒DNA施用本文提供的载体构建体。可替换地,可以使用方法诸如电穿孔、声致穿孔或使用“基因枪”,其使用例如高压气体或倒置0.22口径枪将DNA包被的金颗粒射入细胞中(

为了改善载体构建体向细胞中的递送,可能必须保护其免受损伤并且可以促进其进入细胞。为此目的,可以使用脂复合物和多聚物,其具有在转染过程中保护核酸免于不希望的降解的能力。

可以用有组织结构(诸如胶束或脂质体)中的脂质包被载体构建体。当有组织结构与DNA形成复合物时,它被称为脂复合物。阴离子和中性脂质可以用于构建合成载体的脂复合物。在一个实施方案中,由于它们的正电荷,阳离子脂质可以用于凝聚带负电荷的DNA分子,从而促进DNA封装到脂质体中。可能需要将辅助脂质(通常是电中性脂质,例如DOPE)添加到阳离子脂质中以形成脂复合物(Dabkowska等人,J R Soc Interface.2012年3月7日;9(68):548-561)。

在某些实施方案中,聚合物与DNA的复合物(称为多聚物)可以用于递送载体构建体。大多数多聚物由阳离子聚合物组成,并且它们的生产受离子相互作用调节。多聚物通常不可将其DNA负载释放到细胞质中。因此,可能需要用核内体裂解剂(诸如灭活的腺病毒)共转染(以裂解在胞吞过程中产生的核内体,所述胞吞即多聚物进入细胞的过程)(Akinc等人,The Journal of Gene Medicine.7(5):657-63)。

在某些实施方案中,可以使用杂合方法来递送组合两种或多种技术的载体构建体。病毒粒子是一个例子;他们将脂质体与灭活的HIV或流感病毒组合。在另一个实施方案中,其它方法包括将其它病毒载体与阳离子脂质或杂交病毒混合,并且可以用于递送核酸(Khan,Firdos Alam,Biotechnology Fundamentals,CRC Press,2015年11月18日,第395页)。

在某些实施方案中,树枝状聚合物可以用于递送载体构建体,特别是阳离子树枝状聚合物,即具有正表面电荷的树枝状聚合物。当存在DNA或RNA等遗传物质时,电荷互补性导致核酸与阳离子树枝状聚合物暂时结合。到达其目的地后,树枝状聚合物-核酸复合物然后通过胞吞作用输入细胞中(Amiji,Mansoor M.编,Polymeric Gene Delivery:Principles and Applications,CRC Press,2004年9月29日,第142页)。

在一个实施方案中,可以使用合适的病毒基因递送载体诸如病毒颗粒来递送核酸。在某些实施方案中,适用于本文用途的病毒基因递送载体可以是细小病毒、腺病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺病毒相关病毒(AAV)。

因此,本公开内容提供了用作基因递送载体(包含本文提供的载体构建体)的病毒颗粒,其基于动物细小病毒,特别是依赖病毒诸如传染性人或猿猴AAV、及其组分(例如,动物细小病毒基因组),其用于在哺乳动物细胞中引入和/或表达C1EI。本文中使用的术语“细小病毒”因此包括依赖病毒诸如任何类型的AAV。

细小病毒科的病毒是小型DNA动物病毒。细小病毒科可以分为两个亚科:感染脊椎动物的细小病毒亚科,和感染昆虫的浓核病毒亚科。细小病毒亚科的成员在本文中被称为细小病毒,并且包括依赖病毒属。从它们的属名可以推断,依赖病毒属的成员是独特的,因为它们通常需要与辅助病毒(诸如腺病毒或疱疹病毒)共同感染才能在细胞培养物中进行生产性感染。依赖病毒属包括通常感染人类(例如,血清型1、2、3A、3B、4、5和6)、灵长类动物(例如,血清型1和4)的AAV、以及感染其它温血动物(例如,牛、犬、马、小鼠、大鼠和羊腺伴随病毒)以及禽类和爬行动物的相关病毒。关于细小病毒和细小病毒科的其它成员的其它信息描述于Kenneth I.Berns,“Parvoviridae:The Viruses and Their Replication,”Fields Virology(1996年第3版)中的第69章。为方便起见,本文通过参考AAV进一步举例说明和描述了本公开内容。但是,应当理解,本公开内容不限于AAV,而是同样可以应用于其它细小病毒。

AAV颗粒的生产需要AAV“rep”和“cap”基因,它们分别是编码复制和衣壳化蛋白的基因。AAV rep和cap基因已在迄今为止检查的所有AAV血清型中发现,并在本文和引用的参考文献中进行了描述。在野生型AAV中,通常发现rep和cap基因在病毒基因组中彼此相邻(即,它们作为相邻或重叠的转录单元“陪伴”在一起),并且它们在AAV血清型中通常是保守的。AAV rep和cap基因也单独和统称为“AAV包装基因”。本文使用的AAV cap基因编码Cap蛋白,该蛋白能够在有rep和腺(adeno)辅助功能存在下包装AAV载体,并能够结合靶细胞受体。在某些实施方案中,AAV cap基因编码具有源自特定AAV血清型的氨基酸序列的衣壳蛋白。

用于生产AAV的AAV序列可以来自任何AAV血清型的基因组。通常,AAV血清型在氨基酸和核酸水平上具有显著同源性的基因组序列,提供一组相似的遗传功能,产生在物理上和在功能上基本相同的病毒粒子,并通过实质上相同的机制进行复制和组装。关于AAV血清型的基因组序列和基因组相似性的讨论(参见,例如,GenBank登录号U89790;GenBank登录号J01901;GenBank登录号AF043303;GenBank登录号AF085716;Chiorini等人,J.Vir.(1997)第71卷,第6823-6833页;Srivastava等人,J.Vir.(1983)第45卷,第555-564页;Chiorini等人,J.Vir.(1999)第73卷,第1309-1319页;Rutledge等人,J.Vir.(1998)第72卷,第309-319页;和Wu等人,J.Vir.(2000)第74卷,第8635-8647页)。

所有已知AAV血清型的基因组组构是非常类似的。AAV的基因组是小于约5,000个核苷酸(nt)长度的线性单链DNA分子。反向末端重复(ITR)侧接非结构复制(Rep)蛋白和结构(VP)蛋白的独特编码核苷酸序列。VP蛋白形成衣壳。组装活化蛋白(AAP)快速地陪伴衣壳组装并防止游离衣壳蛋白的降解(Grosse等人,J.Virol.91(20):e01198-17,2017)。末端145nt是自互补的并且被组织成使得可以形成能量上稳定的分子内双链体,其形成T形发夹。这些发夹结构作为病毒DNA复制的起点起作用,从而充当细胞DNA聚合酶复合物的引物。Rep基因编码Rep蛋白Rep78、Rep68、Rep52和Rep40。Rep78和Rep68从p5启动子转录,而Rep52和Rep40从p19启动子转录。cap基因编码VP蛋白VP1、VP2和VP3。cap基因从p40启动子转录。在本实施方案的载体中采用的ITR可以与相关的cap基因对应于相同的血清型,或者可以不同。在一个实施方案中,本文采用的ITR对应于AAV2血清型,并且cap基因对应于AAV5血清型。

已知AAV VP蛋白决定AAV病毒粒子的细胞嗜性。在不同的AAV血清型中,VP蛋白编码序列的保守性明显低于Rep蛋白和基因。Rep和ITR序列交叉补充其它血清型的相应序列的能力允许产生假型AAV颗粒,其包含血清型(例如,AAV1、5或8)的衣壳蛋白以及另一种AAV血清型(例如,AAV2)的Rep和/或ITR序列。这样的假型rAAV颗粒是本公开内容的一部分。

本文所述的AAV颗粒(和编码AAV载体基因组)可以包含在WO2018/022608或PCT/US19/32097中描述的任何衣壳蛋白,其公开的人和猿猴AAV衣壳及其性能诸如转导效率、组织嗜性、聚糖结合和对IVIG中和的抗性,包括、但不限于序列表中的任何衣壳及其变体,例如具有嵌合交换的可变区和/或聚糖结合序列和/或GH环,通过引用整体并入本文。

在一个实施方案中,在本公开内容的上下文中使用的AAV ITR序列衍生自AAV1、AAV2、AAV4和/或AAV6。同样地,Rep(例如,Rep78和Rep52)编码序列在一个实施方案中衍生自AAV1、AAV2、AAV4和/或AAV6。但是,在本公开内容的上下文中使用的编码VP1、VP2和VP3衣壳蛋白的序列可以取自任何血清型,诸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12,或取自猿猴AAV,包括在WO 2018/022608或PCT/US19/32097中描述的任何衣壳蛋白,或通过例如衣壳改组技术和AAV衣壳文库获得的新开发的AAV-样颗粒,或与SEQ ID NO:37-53或56中的任一个具有至少90%同一性的任何衣壳。

例如,公开了各种衣壳的氨基酸序列。参见,例如,

AAVRh.1/hu.14/AAV9 AAS99264.1(SEQ ID NO:37)

AAVRh.8美国专利公开2013/0045186的SEQ97(SEQ ID NO:38)

AAVRh.10美国专利公开2013/0045186的SEQ81(SEQ ID NO:39)

AAVRh.74国际专利公开WO 2013/123503的SEQ 1(SEQ ID NO:40)

AAV1 AAB_95452.1(SEQ ID NO:41)

AAV2 YP_680426.1(SEQ ID NO:42)

AAV3 NP_043941.1(SEQ ID NO:43)

AAV3B AAB95452.1(SEQ ID NO:44)

AAV4 NP_044927.1(SEQ ID NO:45)

AAV5 YP_068409.1(SEQ ID NO:46)

AAV6 AAB95450.1(SEQ ID NO:47)

AAV7 YP_077178.1(SEQ ID NO:48)

AAV8 YP_077180.1(SEQ ID NO:49)

AAV10 AAT46337.1(SEQ ID NO:50)

AAV11 AAT46339.1(SEQ ID NO:51)

AAV12 ABI16639.1(SEQ ID NO:52)

AAV13 ABZ10812.1(SEQ ID NO:53)

修饰的“AAV”序列也可以用在本公开内容的上下文中,例如用于生产AAV基因疗法载体。这样的修饰的序列,例如与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9ITR、Rep或VP具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或更多核苷酸和/或氨基酸序列同一性的序列(例如,具有约75-99%核苷酸序列同一性的序列),可以用于代替野生型AAV ITR、Rep或VP序列。

在某些实施方案中,编码AAV衣壳蛋白的核酸序列可操作地连接至表达控制序列,用于在特定细胞类型诸如Sf9或HEK细胞中表达。本领域技术人员已知的用于在昆虫宿主细胞或哺乳动物宿主细胞中表达外源基因的技术可以用于实践该实施方案。在昆虫细胞中对多肽进行分子工程和表达的方法描述于,例如,Summers和Smith(1986)A Manual ofMethods for Baculovirus Vectors and Insect Culture Procedures,TexasAgricultural Experimental Station Bull.No.7555,College Station,Tex.;Luckow(1991),Prokop等人,Cloning and Expression of Heterologous Genes in InsectCells with Baculovirus Vectors'Recombinant DNA Technology and Applications,97-152;King,L.A.和R.D.Possee(1992)The baculovirus expression system,Chapman和Hall,United Kingdom;O'Reilly,D.R.,L.K.Miller,V.A.Luckow(1992)BaculovirusExpression Vectors:A Laboratory Manual,New York;W.H.Freeman和Richardson,C.D.(1995)Baculovirus Expression Protocols,Methods in Molecular Biology,第39卷;美国专利号4,745,051;US2003148506;和WO 03/074714,它们都通过引用整体并入。用于转录编码AAV衣壳蛋白的核苷酸序列的特别合适的启动子是例如多角体启动子。但是,在昆虫细胞中具有活性的其它启动子是本领域已知的,例如p10、p35或IE-1启动子,还涵盖在上述参考文献中描述的其它启动子。

昆虫细胞用于表达异源蛋白的用途已得到充分证明,将核酸(诸如载体,例如,昆虫细胞相容的载体)引入这样的细胞中的方法以及将这样的细胞维持在培养物中的方法也已得到充分证明。(参见,例如,METHODS IN MOLECULAR BIOLOGY,Richard编,HumanaPress,N J(1995);O'Reilly等人,BACULOVIRUS EXPRESSION VECTORS,A LABORATORYMANUAL,Oxford Univ.Press(1994);Samulski等人,J.Vir.(1989)第63卷,第3822-3828页;Kajigaya等人,Proc.Nat'l.Acad.Sci.USA(1991)第88卷,第4646-4650页;Ruffing等人,J.Vir.(1992)第66卷,第6922-6930页;Kirnbauer等人,Vir.(1996)第219卷,第37-44页;Zhao等人,Vir.(2000)第272卷,第382-393页;和美国专利号6,204,059)。在某些实施方案中,在昆虫细胞中编码AAV的核酸构建体是昆虫细胞相容的载体。本文中使用的“昆虫细胞相容的载体”或“载体”表示能够进行昆虫或昆虫细胞的生产性转化或转染的核酸分子。示例性的生物载体包括质粒、线性核酸分子和重组病毒。可以采用任何载体,只要它是昆虫细胞相容的。载体可以整合到昆虫细胞基因组中,但载体在昆虫细胞中的存在不必是永久性的,也包括瞬时附加型载体。可以通过任何已知方式引入载体,例如通过细胞的化学处理、电穿孔或感染。在某些实施方案中,所述载体是杆状病毒、病毒载体或质粒。在一个实施方案中,所述载体是杆状病毒,即所述构建体是杆状病毒载体。杆状病毒载体及其使用方法描述于以上引用的关于昆虫细胞的分子工程的参考文献中。

本公开内容提供了用于在昆虫或哺乳动物细胞中生产重组AAV颗粒的材料和方法,其包含本文描述的任何载体构建体。在某些实施方案中,所述载体构建体进一步包含启动子和在启动子下游的限制位点以允许编码一种或多种目标蛋白的多核苷酸的插入,其中所述启动子和所述限制位点位于5'AAV ITR的下游和3'AAV ITR的上游。在某些实施方案中,所述载体构建体进一步包含在限制位点的下游且在3'AAV ITR的上游的转录后调节元件。在某些实施方案中,所述载体构建体进一步包含插入在限制位点处且与启动子可操作地连接的多核苷酸,其中所述多核苷酸包含目标蛋白的编码区。熟练的技术人员将理解,在本申请中公开的任何一种AAV载体构建体都可以用于生产重组AAV颗粒的方法中。

在某些实施方案中,由包含腺病毒或杆状病毒辅助基因的一种或多种辅助质粒或辅助病毒提供辅助功能。腺病毒或杆状病毒辅助基因的非限制性例子包括、但不限于E1A、E1B、E2A、E4和VA,它们可以为AAV包装提供辅助功能。

AAV的辅助病毒是本领域已知的,并且包括例如来自腺病毒科和疱疹病毒科的病毒。AAV的辅助病毒的例子包括、但不限于在美国公开号20110201088(其公开内容通过引用并入本文)中描述的SAdV-13辅助病毒和SAdV-13-样辅助病毒,以及辅助载体pHELP(Applied Viromics)。熟练的技术人员将理解,在本文中可以使用可为AAV提供适当辅助功能的AAV的任何辅助病毒或辅助质粒。

在某些实施方案中,所述AAV cap基因存在于质粒中。所述质粒可以进一步包含AAV rep基因,其可以对应于或不对应于与cap基因相同的血清型。来自本文所述的任何AAV血清型(包括、但不限于AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13及其任何变体)的cap基因和/或rep基因可以用于生产重组AAV。在某些实施方案中,所述AAV cap基因编码来自血清型1、血清型2、血清型4、血清型5、血清型6、血清型7、血清型8、血清型9、血清型10、血清型11、血清型12、血清型13或其变体的衣壳。

在某些实施方案中,可以用辅助质粒或辅助病毒、载体构建体和编码AAV cap基因的质粒转染昆虫或哺乳动物细胞;并且可以在共转染以后的不同时间点收集重组AAV病毒。例如,可以在共转染以后约12小时、约24小时、约36小时、约48小时、约72小时、约96小时、约120小时或这些时间点中的任何两个之间的时间收集重组AAV病毒。

使用本领域已知的适用于生产感染性重组AAV的任何常规方法,也可以生产重组AAV颗粒。在某些情况下,使用稳定地表达AAV颗粒生产的一些必要组分的昆虫或哺乳动物细胞,可以生产重组AAV。例如,包含AAV rep和cap基因的质粒(或多个质粒)以及选择标记诸如新霉素抗性基因可以整合到细胞的基因组中。然后可以用辅助病毒(例如,提供辅助功能的腺病毒或杆状病毒)和包含5'和3'AAV ITR(和编码异源蛋白的核苷酸序列,如果需要的话)的病毒载体构建体共感染昆虫或哺乳动物细胞。该方法的优点是,细胞具有选择性并适合大规模生产重组AAV颗粒。作为另一个非限制性例子,腺病毒或杆状病毒而不是质粒可以用于将rep和cap基因引入包装细胞中。作为又一个非限制性例子,含有5'和3'AAV ITR以及rep-cap基因的病毒载体构建体可以稳定整合到生产细胞的DNA中,并且辅助功能可以由野生型腺病毒提供以产生重组AAV。

在一个方面,本文提供了用于生产可用作基因递送载体的AAV颗粒的方法,所述方法包括以下步骤:

(a)给允许AAV复制的细胞(例如昆虫细胞或哺乳动物细胞)提供一种或多种核酸构建体,其包含:

(i)本文提供的核酸分子(例如重组载体构建体),其侧接至少一个AAV反向末端重复核苷酸序列;

(ii)编码一种或多种AAV Rep蛋白的核苷酸序列,其可操作地连接至能够驱动Rep蛋白在所述细胞中的表达的启动子;

(iii)编码一种或多种AAV衣壳蛋白的核苷酸序列,其可操作地连接至能够驱动衣壳蛋白在所述细胞中的表达的启动子;

(iv)和任选的在VP2/3mRNA中所含的AAP和MAAP

(b)在有助于Rep和衣壳蛋白表达的条件下培养在(a)中定义的细胞;和,

任选地,(c)回收AAV基因递送载体,和

任选地(d)纯化所述AAV颗粒。例如,(i)的重组载体构建体包含(1)至少一个AAVITR,(2)如本文中所述的异源肝特异性转录调节区,和(3)编码功能性C1EI的核酸。优选地,(i)的重组载体构建体包含5'和3’AAV ITR。

然后,通常,本文提供的用于生产AAV基因递送载体的方法包括:给允许AAV复制的细胞提供(a)编码用于生产载体基因组的模板的核苷酸序列,例如本公开内容的载体构建体(如本文详细描述的);(b)足以复制所述模板以产生载体基因组的核苷酸序列(上面定义的第一个表达盒);(c)在足以复制所述载体基因组并包装进AAV衣壳的条件下,足以将所述载体基因组包装进AAV衣壳的核苷酸序列(上面定义的第二个表达盒),由此在所述细胞中生产AAV颗粒,其包含被衣壳化在AAV衣壳内的载体基因组。

贴壁HEK293细胞的瞬时转染(Chahal等人,J.Virol.Meth.196:163-73(2014))和使用杆状病毒表达载体系统(BEVS)的Sf9细胞的转染(Mietzsch等人,Hum.Gene Ther.25:212-22(2014))是生产AAV载体的两种最常用的方法。

本文提供的方法可以包含,使用抗-AAV抗体,在一个实施方案中,使用固定化的抗体,亲和纯化重组细小病毒(rAAV)载体(或包含所述载体的病毒粒子)的步骤。在另一个实施方案中,所述抗-AAV抗体是单克隆抗体。用于本文用途的一种抗体是单链骆驼科抗体或其片段,例如可从骆驼或美洲驼羊获得(参见例如Muyldermans,2001,Biotechnol.74:277-302)。用于rAAV的亲和纯化的抗体是特异性地结合AAV衣壳蛋白上的表位的抗体,其中在一个实施方案中,所述表位是存在于超过一种AAV血清型的衣壳蛋白上的表位。例如,可以基于与AAV5衣壳的特异性结合而产生或选择抗体,但同时它也可能特异性地结合AAV1、AAV2、AAV3、AAV6、AAV8或AAV9衣壳。

本文提供的用于生产rAAV颗粒的方法产生了rAAV颗粒群体。在某些实施方案中,通过减少空衣壳数目的步骤,使群体富集包含全长或几乎全长载体基因组的颗粒。

通过本文提供的方法产生的rAAV颗粒群体例如用于在本文所述的任何治疗方法中施用。

使用允许生产AAV或生物产品并且可以维持在培养物中的任何无脊椎动物细胞类型,可以生产包含本文描述的载体构建体的病毒颗粒。例如,所使用的昆虫细胞系可以来自草地贪夜蛾(Spodoptera frugiperda),诸如SF9、SF21、SF900+,果蝇(drosophila)细胞系,蚊子细胞系,例如,白纹伊蚊(Aedes albopictus)衍生出的细胞系,家养蚕细胞系,例如家蚕(Bombyx mori)细胞系,粉纹夜蛾(Trichoplusia ni)细胞系诸如High Five细胞或鳞翅目(Lepidoptera)细胞系诸如Ascalapha odorata细胞系。在一个实施方案中,昆虫细胞是来自对杆状病毒感染敏感的昆虫物种的细胞,包括High Five、Sf9、Se301、SeIZD2109、SeUCR1、Sf9、Sf900+、Sf21、BTI-TN-5B1-4、MG-1、Tn368、HzAm1、BM-N、Ha2302、Hz2E5和Ao38。

杆状病毒是节肢动物的包膜DNA病毒,其中两个成员是众所周知的用于在细胞培养物中生产重组蛋白的表达载体。杆状病毒具有环状双链基因组(80-200kbp),可以对其进行工程改造以允许将大基因组内容物递送至特定细胞。用作载体的病毒通常是苜蓿银纹夜蛾(Autographa californica)多衣壳核多角体病毒属(AcMNPV)或家蚕核多角体病毒属(BmNPV)(Kato等人,(2010),Applied Microbiology and Biotechnology,第85卷,第3期,第459-470页)。

杆状病毒通常用于感染昆虫细胞以表达重组蛋白。具体地,异源基因在昆虫中的表达可以如例如以下文献中所述完成:美国专利号4,745,051;EP 127,839;EP 155,476;Vlak等人,(1988),Journal of General Virology,第68卷,第765-776页;Miller等人,(1988),Annual Review of Microbiology,第42卷,第177-179页;Carbonell等人,(1998),Gene,第73卷,第2期,第409-418页;Maeda等人,(1985),Nature,第315卷,第592-594页;Lebacq-Veheyden等人,(1988),Molecular and Cellular Biology,第8卷,第8期,第3129-3135页;Smith等人,(1985),PNAS,第82卷,第8404-8408页;和Miyajima等人,(1987),Gene,第58卷,第273-281页。可以用于蛋白生产的众多杆状病毒株和变体以及相应的允许昆虫宿主细胞描述于Luckow等人,(1988),Nature Biotechnology,第6卷,第47-55页;Maeda等人,(1985),Nature,第315卷,第592-594页;和McKenna等人,(1998),Journal ofInvertebrate Pathology,第71卷,第1期,第82-90页。

在另一个实施方案中,用允许AAV复制或生物产物产生并且可以维持在培养物中的任何哺乳动物细胞类型实现本文提供的方法。在一个实施方案中,使用的哺乳动物细胞可以是HEK293、HeLa、CHO、NSO、SP2/0、PER.C6、Vero、RD、BHK、HT 1080、A549、Cos-7、ARPE-19和MRC-5细胞。

在另一个实施方案中,提供了包含上述载体的宿主细胞。在一个实施方案中,所述载体构建体能够在宿主细胞中表达本文提供的核酸分子。在某些实施方案中,本文提供了用于HAE细胞疗法的HAE治疗剂,其是包含载体构建体的宿主细胞,所述载体构建体包含编码hC1EI的核酸。

本文中使用的术语“宿主”表示携带本公开内容的核酸分子或载体构建体的生物体和/或细胞,以及适用于表达重组基因或蛋白的生物体和/或细胞。本公开内容不旨在限于任何特定类型的细胞或生物体。实际上,考虑任何合适的生物体和/或细胞将在本文中用作宿主。宿主细胞可以是单细胞、相似或不同细胞群体的形式,例如培养物(诸如液体培养物或在固体基质上的培养物)、生物体或其部分的形式。在一个实施方案中,宿主细胞可以允许本文提供的核酸分子的表达。因此,宿主细胞可以是例如细菌、酵母、昆虫或哺乳动物细胞或人细胞。

在另一个实施方案中,提供了一种将本文提供的核酸递送到宽范围细胞中的方法,所述细胞包括分裂细胞和非分裂细胞。本公开内容可以用于将本文提供的核酸递送至体外细胞,例如,在体外产生由这样的核酸分子编码的多肽,或用于离体基因疗法。

本公开内容的核酸分子、载体构建体、细胞和方法/用途另外可用于将本文提供的核酸递送进宿主、通常遭受HAE的宿主的方法中。

在一个实施方案中,提供了一种药物组合物,其包含本文提供的核酸或载体以及药学上可接受的稀释剂、赋形剂、载体和/或其它药物成分、药学试剂或佐剂等。

“药学上可接受的”是指在生物学上或在其它方面不是不合需要的材料,即该材料可以施用给受试者而不引起任何不希望的生物学效应。因此,这样的药物组合物可以用于例如离体细胞的转染,或将病毒颗粒或细胞直接施用给受试者。

载体可以适用于胃肠外施用,其包括静脉内、腹膜内或肌肉内施用。可替换地,所述载体可以适用于舌下或口服施用。药学上可接受的载体包括无菌水溶液或分散体和用于即时制备无菌可注射溶液或分散体的无菌粉剂。这样的介质和试剂用于药学活性物质的用途是本领域众所周知的。除非任何常规介质或试剂与活性化合物不相容,否则考虑其在本文提供的药物组合物中的应用。

在其它实施方案中,本文提供了AAV颗粒的药物组合物(即制剂),其可用于施用给遭受遗传性障碍的受试者以递送编码目标蛋白的基因。在某些实施方案中,本文提供的药物制剂是包含重组AAV颗粒的液体制剂,所述重组AAV颗粒包含本文公开的任何载体构建体。制剂中重组AAV病毒粒子的浓度可以变化。在某些实施方案中,制剂中重组AAV颗粒的浓度可以是在1x10

在其它实施方案中,本文提供的AAV颗粒药物制剂包含一种或多种无菌的药学上可接受的赋形剂以给制剂提供对于储存和/或施用给受试者以治疗遗传性障碍而言有利的性能。在某些实施方案中,本文提供的药物制剂能够在-65℃储存至少2周的时间,在一个实施方案中至少4周,在另一个实施方案中至少6周和在又一个实施方案中至少约8周,稳定性没有可检测到的变化。在这点上,术语“稳定的”是指,存在于制剂中的重组AAV颗粒在储存期间基本保持其物理稳定性、化学稳定性和/或生物活性。在某些实施方案中,在药物制剂中存在的重组AAV颗粒在-65℃储存确定的时间段期间在人患者中保留其生物活性的至少约80%,在其它实施方案中保留其在人受试者中的生物活性的至少约85%、90%、95%、98%或99%。在一个实施方案中,所述受试者是青少年人受试者。

在某些方面,包含重组AAV颗粒的制剂进一步包含一种或多种缓冲剂。例如,在各种实施方案中,本文提供的制剂包含浓度为约0.1mg/ml至约3mg/ml、约0.5mg/ml至约2.5mg/ml、约1mg/ml至约2mg/ml、或约1.4mg/ml至约1.6mg/ml的磷酸氢二钠。在一个实施方案中,本文提供的AAV颗粒制剂包含约1.42mg/ml的磷酸氢二钠(干燥的)。可以用于本文提供的重组AAV颗粒制剂中的另一种缓冲剂是磷酸二氢钠一水合物,在某些实施方案中,其以从约0.1mg/ml至约3mg/ml、约0.5mg/ml至约2.5mg/ml、约1mg/ml至约2mg/ml、或约1.3mg/ml至约1.5mg/ml的浓度使用。在一个实施方案中,本实施方案的AAV颗粒制剂包含约1.38mg/ml的磷酸二氢钠一水合物。在另一个实施方案中,本文提供的重组AAV颗粒制剂包含约1.42mg/ml的磷酸氢二钠和约1.38mg/ml的磷酸二氢钠一水合物。

在另一个实施方案中,本文提供的重组AAV颗粒制剂可以包含一种或多种等渗剂,诸如氯化钠,在一个实施方案中,以约1mg/ml至约20mg/ml的浓度,例如,约1mg/ml至约10mg/ml,约5mg/ml至约15mg/ml,或约8mg/ml至约20mg/ml。在另一个实施方案中,本文提供的重组AAV颗粒制剂包含约8.18mg/ml的氯化钠。本领域已知的其它缓冲剂和等渗剂是合适的,并且可以常规用于本文提供的制剂中。

在另一个实施方案中,本文提供的重组AAV颗粒制剂可以包含一种或多种填充剂。示例性的填充剂包括、但不限于甘露醇、蔗糖、葡聚糖、乳糖、海藻糖和聚维酮(PVP K24)。在某些实施方案中,本文提供的制剂包含甘露醇,其可以以从约5mg/ml至约40mg/ml、或从约10mg/ml至约30mg/ml、或从约15mg/ml至约25mg/ml的量存在。在另一个实施方案中,甘露醇以约20mg/ml的浓度存在。

在又一个实施方案中,本文提供的重组AAV颗粒制剂可以包含一种或多种表面活性剂,其可以是非离子型表面活性剂。示例性的表面活性剂包括离子型表面活性剂、非离子型表面活性剂和它们的组合。例如,所述表面活性剂可以是、但不限于TWEEN 80(也被称作聚山梨酯80,或它的化学名称聚氧乙烯脱水山梨糖醇单油酸酯)、十二烷基硫酸钠、硬脂酸钠、月桂醇硫酸酯铵、TRITON AG 98(Rhone-Poulenc)、泊洛沙姆407、泊洛沙姆188等和它们的组合。在一个实施方案中,本实施方案的制剂包含泊洛沙姆188,其可以以从约0.1mg/ml至约4mg/ml、或从约0.5mg/ml至约3mg/ml、从约1mg/ml至约3mg/ml、约1.5mg/ml至约2.5mg/ml、或从约1.8mg/ml至约2.2mg/ml的浓度存在。在另一个实施方案中,泊洛沙姆188以约2.0mg/ml的浓度存在。

本文提供的重组AAV颗粒制剂是稳定的,并且可以长时间储存而不会在质量、效能或纯度方面发生不可接受的变化。在一个方面,所述制剂在约5℃(例如,2℃至8℃)的温度稳定至少1个月,例如,至少1个月、至少3个月、至少6个月、至少12个月、至少18个月、至少24个月或更久。在另一个实施方案中,所述制剂在小于或等于约-20℃的温度稳定至少6个月,例如,至少6个月、至少12个月、至少18个月、至少24个月、至少36个月或更久。在另一个实施方案中,所述制剂在小于或等于约-40℃的温度稳定至少6个月,例如,至少6个月、至少12个月、至少18个月、至少24个月、至少36个月或更久。在另一个实施方案中,所述制剂在小于或等于约-60℃的温度稳定至少6个月,例如,至少6个月、至少12个月、至少18个月、至少24个月、至少36个月或更久。

药物组合物在制造和储存条件下通常是无菌的且稳定的。药物组合物可以配制成溶液、微乳剂、脂质体或其它适合适应高药物浓度的有序结构。所述载体可以是溶剂或分散介质,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)以及它们的合适混合物。可以维持适当的流动性,例如,通过使用包衣诸如卵磷脂,通过维持所需的粒度(在分散体的情况下)和通过使用表面活性剂。在某些实施方案中,在组合物中包括等渗剂,例如,糖、多元醇诸如甘露醇、山梨醇或氯化钠。通过在组合物中包含延迟吸收的试剂,例如单硬脂酸盐和明胶,可以实现可注射组合物的延长吸收。在某些实施方案中,本文提供的核酸或载体构建体可以在时间或控释制剂中施用,例如在包含缓释聚合物或将保护化合物免于快速释放的其它载体的组合物中,包括植入物和微囊化的递送系统。例如可以使用可生物降解的、生物相容的聚合物,诸如乙烯醋酸乙烯酯、聚酸酐、聚乙醇酸、胶原、聚原酸酯、聚乳酸和聚乳酸、聚乙醇酸共聚物(PLG)。

在某些实施方案中,包含本文提供的载体构建体或AAV颗粒的药物组合物可以用于将遗传物质转移至细胞。这样的转移可以在体外、离体或在体内发生。因此,一个实施方案提供了一种用于将核苷酸序列递送至细胞的方法,该方法包括在使得本文提供的核酸或载体进入细胞中的条件下接触本文所述的核酸、载体构建体或药物组合物。所述细胞可以是体外、离体或体内细胞。

在某些实施方案中,本文提供了治疗遭受遗传性障碍的受试者的方法,其包括给所述受试者施用治疗有效量的编码C1EI的核酸、载体构建体、AAV颗粒或表达C1EI的宿主细胞、或包含它们的药物组合物。在该情况下,“治疗有效量”是在施用后导致治疗性蛋白的表达的量,其表达水平足以至少部分地且优选地完全改善遗传性障碍的症状。

在一个实施方案中,本文提供了治疗C1EI缺乏的方法,其包括给遭受C1EI缺乏(例如HAE)的患者施用治疗有效量的本文提供的核酸、载体构建体、AAV颗粒、宿主细胞或药物组合物。在一个实施方案中,所述患者是人。在一个实施方案中,所述受试者患者群体是具有中度至重度C1EI缺乏的患者,包括具有HAE或HAE的变体形式的那些。在一个实施方案中,治疗的目标是将重度HAE患者转变为中度或轻度HAE,从而减轻与复发性急性HAE发作相关的负担。在一个实施方案中,所述治疗将血液中的功能性C1EI水平增加到正常范围或约16mg/dL(或1IU/ml)至约32mg/dL的正常范围的至少40%。在有关的实施方案中,所述治疗改善HAE症状或降低急性HAE发作的频率、持续时间或严重程度。在某些实施方案中,所述治疗减少治疗急性HAE发作所需的按需疗法(例如人C1EI蛋白、激肽释放酶抑制剂、缓激肽拮抗剂等)的量,或降低为了治疗急性HAE发作而施用按需疗法的频率。在某些实施方案中,与未接受治疗的受试者相比,接受治疗的受试者经历发作频率的至少50%、60%、70%、80%或90%降低。

在一个实施方案中,本文提供了用于增加有此需要的受试者的血液中的循环C1EI蛋白水平的方法,其包括给所述受试者施用本文提供的任何核酸、载体构建体、AAV颗粒、宿主细胞或药物组合物,其表达C1EI蛋白。

在另一个实施方案中,本文提供了有效量的本文所述的重组AAV颗粒用于制备药物的用途,所述药物用于治疗遭受功能性C1EI缺乏或HAE的受试者。在一个实施方案中,遭受HAE的受试者是人。在一个实施方案中,通过静脉内(IV)施用来施用药物。在另一个实施方案中,药物的施用导致受试者血流中C1EI蛋白的表达,其足以将受试者血液中的功能性C1EI水平增加到至少正常范围或约16mg/dL(或1IU/ml)至约32mg/dL的正常范围的至少40%。

在一个或多个实施方案中,本文提供的治疗方法还包括施用预防性和/或治疗性皮质类固醇以预防和/或治疗与AAV C1EI病毒的施用相关的任何肝毒性。预防性或治疗性皮质类固醇治疗可以包含至少5、10、15、20、25、30、35、40、45、50、55、60或更多mg/天的皮质类固醇。在某些实施方案中,可以在至少约3、4、5、6、7、8、9、10周或更长的连续时间段内施用预防性或治疗性皮质类固醇。

在一个或多个实施方案中,本文提供的治疗方法任选地包括用于治疗HAE的其它疗法(例如减弱的雄激素诸如达那唑、司坦唑醇、氧雄龙、甲睾酮、替勃龙、羟甲烯龙)的施用,例如同时施用。在某些实施方案中,对于急性HAE发作,本文提供的治疗方法包含以下一种或多种的附加施用:C1EI蛋白(任选地重组的或血浆衍生的)、激肽释放酶抑制剂、缓激肽拮抗剂和/或减弱的雄激素。

用于本文所述的治疗目的的核酸、载体构建体、AAV颗粒、宿主细胞或包含它们的药物组合物的“治疗有效量”可以凭经验和以常规方式确定。但是,在某些实施方案中,重组AAV颗粒的“治疗有效量”范围为从约1x10

在一个实施方案中,通过多种已知的施用技术,可以将本文提供的重组载体构建体或AAV颗粒施用给受试者,在一个实施方案中,哺乳动物受试者或人受试者。在某些实施方案中,通过静脉内注射作为单次推注或在延长的时间段内施用载体构建体或重组AAV颗粒,所述延长的时间段可以是至少约1、5、10、15、30、45、60、75、90、120、150、180、210或240分钟或更久。

在本文所述的任何治疗方法中,通过测量治疗的受试者的血液中表达的功能性C1EI水平,可以监测治疗的有效性。用于量化C1EI的循环水平的精确定量测定是本领域众所周知的,并且包括ELISA、蛋白质印迹法测定、荧光测量测定(参见,McCaman,M.W.和Robins,E.,(1962)J.Lab.Clin.Med.,第59卷,第885-890页);基于质谱法、薄层色谱法的测定(参见,Tsukerman,G.L.(1985)Laboratornoe delo,第6卷,第326-327页);酶测定(参见,La Du,B.N.,等人(1963)Pediatrics,第31卷,第39-46页;和Peterson,K.,等人(1988)Biochem.Med.Metab.Biol.,第39卷,第98-104页);采用高压液相色谱法(HPLC)的方法(参见,Rudy,J.L.,等人(1987)Clin.Chem.,第33卷,第1152-1154页);和高通量自动化(参见,Hill,J.B.,等人(1985)Clin.Chem.,第5卷,第541-546页)。用于确认C1EI活性的功能测定是商购可得的,例如

在某些情况下,本公开内容的AAV颗粒的施用导致可观察程度的肝毒性。通过多种众所周知的和常规使用的技术,可以测量肝毒性,例如,在AAV施用前(即,基线)和AAV施用后,测量在受试者血流中的某些肝相关酶(例如,丙氨酸转氨酶,ALT)的浓度。在AAV施用后ALT浓度的可观察到的增加(与施用前相比)指示药物诱发的肝毒性。在某些实施方案中,除了施用治疗有效量的AAV病毒外,可以用皮质类固醇预防性地、治疗性地或二者兼有地治疗受试者,以预防和/或治疗与AAV病毒施用相关的任何肝毒性。

“预防性的”皮质类固醇治疗表示施用皮质类固醇以预防肝毒性和/或预防受试者中测量的ALT水平的升高。“治疗性的”皮质类固醇治疗表示施用皮质类固醇以降低由AAV病毒施用引起的肝毒性和/或降低由AAV病毒施用引起的受试者血流中升高的ALT浓度。在某些实施方案中,预防性或治疗性皮质类固醇治疗可以包含向受试者施用至少5、10、15、20、25、30、35、40、45、50、55、60或更多mg/天的皮质类固醇。在某些实施方案中,受试者的预防性或治疗性皮质类固醇治疗可以发生在至少约3、4、5、6、7、8、9、10周或更长的连续阶段内。可以用于本文所述方法的皮质类固醇包括任何已知的或常规使用的皮质类固醇,包括例如地塞米松、泼尼松、氟氢可的松、氢化可的松等。

为了将用全身性AAV介导的治疗性基因转移实现成功肝转导的可能性最大化,在将治疗方案中的AAV颗粒施用给如上所述的人患者之前,可以关于能够阻断细胞转导或以其它方式降低治疗方案的整体效率的抗-AAV衣壳抗体或抗-AAV中和抗体的存在评估预期患者。这样的抗体可以存在于预期患者的血清中,并且可以针对任何血清型的AAV衣壳。在一个实施方案中,预先存在的抗体所针对的血清型是AAV5。

检测预先存在的AAV免疫的方法是本领域众所周知的并常规使用,并且包括基于细胞的体外转导抑制(TI)测定、体内(例如,在小鼠中)TI测定和基于ELISA的总抗衣壳抗体(TAb)的检测(参见,例如,Masat等人,Discov.Med.,第15卷,第379-389页和Boutin等人,(2010)Hum.Gene Ther.,第21卷,第704-712页)。TI测定可以采用先前已在其中引入AAV诱导型报道载体的宿主细胞。报道载体可以包含诱导型报道基因诸如GFP等,其表达在AAV病毒转导宿主细胞后被诱导。存在于人血清中的能够阻止/减少宿主细胞转导的抗-AAV衣壳抗体将因此降低报道基因在系统中的总体表达。因此,这样的测定可以用于检测能够阻止/减少治疗性AAV-C1EI病毒的细胞转导的抗-AAV衣壳抗体在人血清中的存在。

检测抗-AAV衣壳抗体的测定可以采用固相结合的AAV衣壳作为“捕获试剂”,使人血清在其上面流过,从而允许在血清中存在的抗衣壳抗体结合固相结合的衣壳“捕获试剂”。一旦洗涤以除去非特异性结合,就可以使用“检测剂”来检测与捕获试剂结合的抗衣壳抗体的存在。检测剂可以是抗体、AAV衣壳等,并且可以被可检测地标记以帮助检测和定量所结合的抗衣壳抗体。在一个实施方案中,将检测剂用钌或钌复合物标记,它们可以使用电化学发光技术和设备检测到。

可以采用相同的上述方法来评估和检测先前用感兴趣的治疗性AAV病毒治疗的患者中抗-AAV衣壳免疫应答的产生。因此,这些技术不仅可以用于在用治疗性AAV病毒治疗之前评估抗-AAV衣壳抗体的存在,它们还可以用于评估和测量在施用后针对施用的治疗性AAV病毒的免疫应答的诱导。因此,本文涵盖了组合用于检测人血清中的抗-AAV衣壳抗体的技术和施用治疗性AAV病毒以治疗HAE的方法,其中可以在施用治疗性AAV病毒之前或之后执行用于检测人血清中的抗-AAV衣壳抗体的技术。

在考虑以下示例性实施例后将理解本公开内容的其它方面和优点。

设计了多种重组AAV基因疗法载体,其包含可操作地连接至杂合人载脂蛋白E(ApoE)/HCR增强子/人α抗胰蛋白酶(AAT)启动子的野生型或密码子优化的SERPING1 cDNA(表1)。图1进一步提供了载体构型的代表性描绘。载体基因组构型任选地包括hAAT/血红蛋白内含子序列(hhI)、以及牛或人生长激素多腺苷酸化信号(分别为bGHpA或hGHpA)。载体基因组侧接AAV血清型2(AAV2)衍生出的反向末端重复(ITR),并且长度范围为3087bp至4779bp。使用如例如以下文献所述的常规克隆技术制备载体:Gibson等人(2009).“Enzymatic assembly of DNA molecules up to several hundred kilobases”.NatureMethods.6(5):343-345,和Gibson DG.(2011).“Enzymatic assembly of overlappingDNA fragments”.Methods in Enzymology.498:349-361,它们通过引用并入本文。

表1-AAV-C1EI载体构建体

试验本文提供的重组AAV-C1EI载体的测定包括,例如,(1)在HepG2细胞(一种来源于人肝的细胞系)中瞬时转染包含AAV载体核酸的双链DNA质粒,以检查体外肝特异性C1EI蛋白生产和分泌;(2)在293细胞和杆状病毒感染的昆虫细胞中产生包含AAV-C1EI载体的AAV病毒粒子,随后确认在293细胞和杆状病毒感染的昆虫细胞中的AAV-C1EI载体,随后确认AAV载体核酸和衣壳蛋白完整性;(3)Rag2-/

进行初步体外测定以对比来自上述重组AAV基因疗法载体的C1EI表达和活性(也参见图1)。

在一个实施方案中,将载体构建体的质粒瞬时转染到人肝细胞系HepG2中。转染后,例如24或48或72小时后,测量C1EI表达。使用该测定,证明重组AAV基因疗法载体能够在瞬时转染的HepG2细胞中以约20220至721ng/mL的水平表达C1EI蛋白,如图2所示。

为了证明本实施方案的重组载体确实包装编码C1EI的核酸,将如上所述产生的AAV-C1EI载体的双链形式引入能够产生AAV病毒粒子的细胞中。产生表达AAV-C1EI载体核酸和AAV Cap和Rep蛋白的杆状病毒构建体,并然后共感染昆虫细胞,优选无弹状病毒,衍生自Sf9细胞。通过本领域已知的标准方法,纯化和分析所得的AAV病毒粒子。在一个替代性的AAV病毒生产系统中,将包含双链形式的AAV-C1EI载体核酸的质粒与表达AAV Cap和Rep蛋白的质粒以及表达AAV病毒粒子产生所需的腺病毒辅助功能的质粒一起共转染到293细胞中。

进行碱性凝胶电泳测定以确定包装的核酸的大小。结果表明,核酸具有预期的长度。替代测定包括复制中心测定以确定哪些AAV-C1EI载体以完整形式包装。使用引物延伸测定来量化具有完整末端的AAV-C1EI载体核酸的量,即终止于AAV2 5′ITR(有义链)或3′ITR(反义链)中的发夹环的5′末端处。可替换地,使用PCR测定来确定AAV-C1EI载体核酸是否具有完整末端,即终止于AAV2 5′ITR(有义链)或3′ITR(反义链)中的发夹环的5′末端处。

瞬时转染测定表明,该载体能够在肝细胞中表达高水平的外源C1EI。通常使用两种不同类型的衣壳AAV5-型衣壳和狒狒AAV衍生的衣壳如本文中所述生产AAV病毒粒子。对如此生产的核酸的评价表明,它们具有预期的长度。

通过HepG2细胞的体外转导,进一步评价使用两种不同类型的衣壳AAV5型和狒狒AAV衍生的(Bba49)衣壳如上所述生产的AAV病毒粒子。用具有AAV5型或AAVBba49衣壳的AAV颗粒的几种制品,以3种不同的MOI转导HepG2细胞:20,000、100,000和500,000。在转导后96小时收集培养基并通过质谱法测量bCG蛋白,显示所有制品的良好转导能力和相似的转导结果。

使用杆状病毒表达载体(BEV)系统生产AAV5 HAE15(或AAV5-ApoE/HCR-hAAT.hhI.SERPIN G1.hGH),并使用293细胞的三重转染生产另一种肝嗜性的狒狒衍生的AAV衣壳AAVBba49 HAE15(或AAVBba-ApoE/HCR-hAAT.hhI.SERPIN G1.hGH)。将纯化的载体通过qPCR进行量化,并以2x10

在施用两种不同rAAV颗粒的两组中,人C1EI表达的超生理水平(图3A和B)以及血清中的功能性蛋白浓度(图4A和B)远高于媒介物背景。施用AAVBba49-HAE15的组具有最高的蛋白表达,大于分泌的功能性人C1EI蛋白的正常水平的50倍。在AAV5和AAVBba49治疗组中,在12周研究中观察到持续表达。与AAV5 HAE15治疗组(25-48IU/mL)相比,在AAVBba49HAE15组中人C1EI水平的表达从2周下降到6周,并在人C1EI蛋白表达的较高水平(40-70IU/mL)稳定6周。在组B血浆中检测到C1EI蛋白的表达:2x10

还在用作为对照的媒介物处理的Rag2-/-小鼠中测量了生长速率,并基于在血浆样品回收前的体重测量值与AAV-C1EI处理的小鼠进行对比(图5)。所有组到10周的体重图表显示体重增加率没有显著变化。

血浆中的丙氨酸氨基转移酶(ALT)活性可以用作肝细胞健康的指标,并且较高水平的ALT指示肝细胞毒性。在施用AAV5或AAVBba49治疗之前和施用后每2周,从这些小鼠采集血浆样品(图6)。使用商业试剂盒(Sigma)测量血浆ALT。图指示,AAV5或AAVBba49与HAE15C1EI载体基因组一起的施用不会导致ALT水平的可察觉变化。虚线代表C57-BL6WT小鼠的历史正常范围(7-23IU/L)。

在施用后12周评价这些治疗的小鼠的肝脏的组织学和C1EI表达。如图7A所示,用2x10

AAV5 HAE15或Bba49 HAE15的施用不会影响肝脏组织结构,这基于对诸如以下因素的定性评估:肝核增大;肝窦塌陷;和肝脏病变的存在。呈现结构病理学的H&E组织用于对比分析。

IBA1是驻留和浸润巨噬细胞的标志物,并包括基础和活化状态。用2x10

在治疗后12周,通过qPCR测量,进一步评价了施用2x10

在两个组群中使用AAV5-HAE15进行了剂量响应研究—对第一组群评价12周,并对第二组群评价12个月。

在第一组群中,用媒介物或6x10

在第二组群中,用媒介物或2x10

总人C1EI蛋白和功能性C1EI蛋白的表达是剂量依赖性的,并在4至12周之间达到峰值。2x10

这些数据表明,AAV5-HAE15载体诱导了治疗水平的功能性C1EI表达,在一年评价期内具有良好的持久性,预计一年后会表达足够的水平。

AAV5-HAE15的施用提供了在52周时在肝脏中检测到的HAE15 DNA量的剂量依赖性增加(图12)。在施用后52周通过IHC对C1EI(+)肝细胞的评价显示了预期的剂量依赖性信号,其水平与第一组群的12周研究相当(图13)。在52周时,对于2x10

该数据表明,肝细胞转导在52周的研究期间具有良好的、一致的持久性,预计表达的持久性持续超过一年。

在52周的研究期间,所有剂量的ALT水平保持在正常范围内,表明正常的肝功能。治疗的小鼠没有表现出体重增加率的显著变化,也没有明显的肝脏组织学发现。该数据表明,AAV载体施用是安全的且可耐受的。

对16只食蟹猴(成束猴(Macaca fascicularis))进行了一项非人灵长类动物研究。给猴子施用媒介物或(a)低剂量的编码食蟹猴C1EI(cC1EI)或人C1EI(hC1EI)的AAV5-SERPING1载体,各自以大约2x10

高剂量和低剂量的AAV5-HAE15都产生了有效水平的人蛋白,尽管水平低于在小鼠中观察到的水平。存在剂量依赖性应答的趋势,同时在C1EI水平的正常范围内波动。载体DNA拷贝对应于蛋白表达水平,且载体RNA拷贝趋向于对应于蛋白表达水平。例如,用3倍以上的AAV颗粒进行的治疗在肝脏中产生了3倍以上的DNA拷贝。

安全终点包括每周身体和体重测量,以及监测抗-AAV5抗体和抗-C1EI抗体应答。监测灵长类动物的肿胀,且如果看到,则进行额外的分析。血栓终点包括APTT、PT、可溶性纤维蛋白、D-二聚体、凝血酶-抗-凝血酶复合物、纤维蛋白原。在研究终止时进行大体尸检并评估肝脏的C1EI,同时评估所有主要器官(包括生殖腺)的H&E和纤维蛋白染色。

表2-生物标志物的血液收集(基线、每周、研究终止)

·天冬氨酸氨基转移酶(AST)

·丙氨酸氨基转移酶(ALT)

·APTT(内在途径的凝血性能)

·PT(外在途径的凝血性能)

·D-二聚体(纤维蛋白凝块的存在的标志物)

·可溶性的纤维蛋白单体(弥散性血管内凝血的标志物)

·凝血酶-抗凝血酶复合物(高凝状态的标志物)

·纤维蛋白原(炎症和扰动的标志物可以指示纤维蛋白凝块形成)

没有观察到肝酶、凝血参数或炎症标志物的异常结果,表明非人灵长类动物耐受高剂量的AAV5载体,没有不良作用。

在HAE的小鼠模型中评估了hC1EI蛋白的AAV-SERPING1定向表达。与模拟HAE症状的野生型小鼠相比,SERPING1

在6至8周龄的纯合SERPING1

在施用AAV5-HAE15后2周、4周或6周,还评价了小鼠组的血管渗透性。给小鼠注射在磷酸盐缓冲盐水(PBS)中的30mg/kg伊文思蓝染料,然后在15分钟内将刺激物(5%芥子油)两次应用到右耳表面。在注射染料后30分钟,对小鼠实施安乐死。从右耳、小肠和肾脏中提取染料,并在600nm处通过分光光度计法测量。

与野生型小鼠相比,用媒介物处理的对照SERPING1敲除小鼠具有显著增加的血管渗透性。正如预期的那样,用人血浆衍生的C1EI蛋白对小鼠的治疗使功能性C1EI的血浆水平正常化(大约1IU/mL),并显著降低了耳朵、小肠和肾脏的血管渗透性。在耳廓中,小鼠对AAV5-HAE15的施用表现出剂量依赖性应答。施用2x10

用食蟹猴对HAE15、HAE23或HAE24进行了一项非人灵长类动物研究。在整个研究过程中跟踪急性和慢性毒性、药效动力学和免疫原性终点。在注射后8周和12周,评估持久性和慢性影响。计算生物分布,评估组织病理学,并通过原位杂交评价生殖腺中的DNA和RNA。AAV载体被确定为安全的和可耐受的。

本文描述的实施方案意图仅仅是示例性的,且本领域技术人员会认识到或至多使用例行实验能够确定特定化合物、材料和程序的众多等同物。所有这样的等同方案都被认为是在本公开内容的范围内。

本文提及的所有专利、专利申请和出版物都通过引用整体并入本文。在本申请中对任何参考文献的引用或标识并非承认这样的参考文献可作为本申请的现有技术得到。参考所附权利要求会更好地理解本公开内容的全部范围。

序列表

<110> BIOMARIN PHARMACEUTICAL INC.

<120> 用肝特异性基因疗法载体治疗遗传性血管性水肿

<130> 40007/20020

<150> US-62/935,359

<151> 2019-11-14

<150> US-63/016,365

<151> 2020-04-28

<160> 72

<170> PatentIn 3.5版

<210> 1

<211> 1503

<212> DNA

<213> 智人

<400> 1

atggcctcca ggctgaccct gctgaccctc ctgctgctgc tgctggctgg ggatagagcc 60

tcctcaaatc caaatgctac cagctccagc tcccaggatc cagagagttt gcaagacaga 120

ggcgaaggga aggtcgcaac aacagttatc tccaagatgc tattcgttga acccatcctg 180

gaggtttcca gcttgccgac aaccaactca acaaccaatt cagccaccaa aataacagct 240

aataccactg atgaacccac cacacaaccc accacagagc ccaccaccca acccaccatc 300

caacccaccc aaccaactac ccagctccca acagattctc ctacccagcc cactactggg 360

tccttctgcc caggacctgt tactctctgc tctgacttgg agagtcattc aacagaggcc 420

gtgttggggg atgctttggt agatttctcc ctgaagctct accacgcctt ctcagcaatg 480

aagaaggtgg agaccaacat ggccttttcc ccattcagca tcgccagcct ccttacccag 540

gtcctgctcg gggctgggga gaacaccaaa acaaacctgg agagcatcct ctcttacccc 600

aaggacttca cctgtgtcca ccaggccctg aagggcttca cgaccaaagg tgtcacctca 660

gtctctcaga tcttccacag cccagacctg gccataaggg acacctttgt gaatgcctct 720

cggaccctgt acagcagcag ccccagagtc ctaagcaaca acagtgacgc caacttggag 780

ctcatcaaca cctgggtggc caagaacacc aacaacaaga tcagccggct gctagacagt 840

ctgccctccg atacccgcct tgtcctcctc aatgctatct acctgagtgc caagtggaag 900

acaacatttg atcccaagaa aaccagaatg gaaccctttc acttcaaaaa ctcagttata 960

aaagtgccca tgatgaatag caagaagtac cctgtggccc atttcattga ccaaactttg 1020

aaagccaagg tggggcagct gcagctctcc cacaatctga gtttggtgat cctggtaccc 1080

cagaacctga aacatcgtct tgaagacatg gaacaggctc tcagcccttc tgttttcaag 1140

gccatcatgg agaaactgga gatgtccaag ttccagccca ctctcctaac actaccccgc 1200

atcaaagtga cgaccagcca ggatatgctc tcaatcatgg agaaattgga attcttcgat 1260

ttttcttatg accttaacct gtgtgggctg acagaggacc cagatcttca ggtttctgcg 1320

atgcagcacc agacagtgct ggaactgaca gagactgggg tggaggcggc tgcagcctcc 1380

gccatctctg tggcccgcac cctgctggtc tttgaagtgc agcagccctt cctcttcgtg 1440

ctctgggacc agcagcacaa gttccctgtc ttcatggggc gagtatatga ccccagggcc 1500

tga 1503

<210> 2

<211> 500

<212> PRT

<213> 智人

<400> 2

Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala

1 5 10 15

Gly Asp Arg Ala Ser Ser Asn Pro Asn Ala Thr Ser Ser Ser Ser Gln

20 25 30

Asp Pro Glu Ser Leu Gln Asp Arg Gly Glu Gly Lys Val Ala Thr Thr

35 40 45

Val Ile Ser Lys Met Leu Phe Val Glu Pro Ile Leu Glu Val Ser Ser

50 55 60

Leu Pro Thr Thr Asn Ser Thr Thr Asn Ser Ala Thr Lys Ile Thr Ala

65 70 75 80

Asn Thr Thr Asp Glu Pro Thr Thr Gln Pro Thr Thr Glu Pro Thr Thr

85 90 95

Gln Pro Thr Ile Gln Pro Thr Gln Pro Thr Thr Gln Leu Pro Thr Asp

100 105 110

Ser Pro Thr Gln Pro Thr Thr Gly Ser Phe Cys Pro Gly Pro Val Thr

115 120 125

Leu Cys Ser Asp Leu Glu Ser His Ser Thr Glu Ala Val Leu Gly Asp

130 135 140

Ala Leu Val Asp Phe Ser Leu Lys Leu Tyr His Ala Phe Ser Ala Met

145 150 155 160

Lys Lys Val Glu Thr Asn Met Ala Phe Ser Pro Phe Ser Ile Ala Ser

165 170 175

Leu Leu Thr Gln Val Leu Leu Gly Ala Gly Glu Asn Thr Lys Thr Asn

180 185 190

Leu Glu Ser Ile Leu Ser Tyr Pro Lys Asp Phe Thr Cys Val His Gln

195 200 205

Ala Leu Lys Gly Phe Thr Thr Lys Gly Val Thr Ser Val Ser Gln Ile

210 215 220

Phe His Ser Pro Asp Leu Ala Ile Arg Asp Thr Phe Val Asn Ala Ser

225 230 235 240

Arg Thr Leu Tyr Ser Ser Ser Pro Arg Val Leu Ser Asn Asn Ser Asp

245 250 255

Ala Asn Leu Glu Leu Ile Asn Thr Trp Val Ala Lys Asn Thr Asn Asn

260 265 270

Lys Ile Ser Arg Leu Leu Asp Ser Leu Pro Ser Asp Thr Arg Leu Val

275 280 285

Leu Leu Asn Ala Ile Tyr Leu Ser Ala Lys Trp Lys Thr Thr Phe Asp

290 295 300

Pro Lys Lys Thr Arg Met Glu Pro Phe His Phe Lys Asn Ser Val Ile

305 310 315 320

Lys Val Pro Met Met Asn Ser Lys Lys Tyr Pro Val Ala His Phe Ile

325 330 335

Asp Gln Thr Leu Lys Ala Lys Val Gly Gln Leu Gln Leu Ser His Asn

340 345 350

Leu Ser Leu Val Ile Leu Val Pro Gln Asn Leu Lys His Arg Leu Glu

355 360 365

Asp Met Glu Gln Ala Leu Ser Pro Ser Val Phe Lys Ala Ile Met Glu

370 375 380

Lys Leu Glu Met Ser Lys Phe Gln Pro Thr Leu Leu Thr Leu Pro Arg

385 390 395 400

Ile Lys Val Thr Thr Ser Gln Asp Met Leu Ser Ile Met Glu Lys Leu

405 410 415

Glu Phe Phe Asp Phe Ser Tyr Asp Leu Asn Leu Cys Gly Leu Thr Glu

420 425 430

Asp Pro Asp Leu Gln Val Ser Ala Met Gln His Gln Thr Val Leu Glu

435 440 445

Leu Thr Glu Thr Gly Val Glu Ala Ala Ala Ala Ser Ala Ile Ser Val

450 455 460

Ala Arg Thr Leu Leu Val Phe Glu Val Gln Gln Pro Phe Leu Phe Val

465 470 475 480

Leu Trp Asp Gln Gln His Lys Phe Pro Val Phe Met Gly Arg Val Tyr

485 490 495

Asp Pro Arg Ala

500

<210> 3

<211> 405

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 3

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300

cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360

cagcttcagg caccaccact gacctgggac agtgaatcgt aagta 405

<210> 4

<211> 321

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 4

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300

ggtttaggta gtgtgagagg g 321

<210> 5

<211> 725

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 5

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300

ggtttaggta gtgtgagagg ggtcgacgat cttgctacca gtggaacagc cactaaggat 360

tctgcagtga gagcagaggg ccagctaagt ggtactctcc cagagactgt ctgactcacg 420

ccaccccctc caccttggac acaggacgct gtggtttctg agccaggtac aatgactcct 480

ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg 540

ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg 600

accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat 660

acggacgagg acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt 720

gaatc 725

<210> 6

<211> 611

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 6

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat ggagaggctg cagctgagct cctattttca taataacagc agccatgagg 180

gttgtgtcct gtttcccagt cctgcccggt cccccctcgg tacctcctgg tggatacact 240

ggttcctgta agcagaagtg gatgagggtg tctaggtctg cagtcctggc accccaggat 300

gggggacacc agccaagata cagcaacagc aacaaagcgc agccatttct ttctgtttgc 360

acagctcctc tgtctgtcgg gggctcctgt ctgttgtctc ctataagcct caccacctct 420

cctactgctt gggcatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 480

ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 540

cttatcttcc tcccacagct cctgggcaac gtgctggtct gtgtgctggc ccatcacttt 600

ggcaaagaat t 611

<210> 7

<211> 1129

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 7

ctgcccgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct ggaagttgcc 60

actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag 120

gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcaagttggg 180

aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc agtggcacaa 240

tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc tcagcctccc 300

gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt tttttggtag 360

agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca ggtgatctac 420

ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc cttccctgtc 480

cttctgattt taaaataact ataccagcag gaggacgtcc agacacagca taggctacct 540

ggccatgccc aaccggtggg acatttgagt tgcttgcttg gcactgtcct ctcatgcgtt 600

gggtccactc agtagatgcc tgttgaattc ctgggcctag ggctgtgcca gctgcctcgt 660

cccgtcacct tctggcttct tctctccctc catatcttag ctgttttcct catgagaatg 720

ttccaaattc gaaatttcta tttaaccatt atatatttac ttgtttgcta ttatctctgc 780

ccccagtaga ttgttagctc cagaagagaa aggatcatgt cttttgctta tctagatatg 840

cccatctgcc tggtacaatc tctggcacat gttacaggca acaactactt gtggaattgg 900

tgaatgcatg aatagaagaa tgagtgaatg aatgaataga caaaaggcag aaatccagcc 960

tcaaagagct tacagtctgg taagaggaat aaaatgtctg caaatagcca caggacaggt 1020

caaaggaagg aggggctatt tccagctgag ggcaccccat caggaaagca ccccagactt 1080

cctacaacta ctagacacat ctcgatgctt ttcacttctc tatcaatgg 1129

<210> 8

<211> 3765

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 8

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ttgattattg actagttatt aatagtaatc 180

aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 240

aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 300

tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg actatttacg 360

gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 420

cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 480

tcctacttgg cagtacatct acgtattagt catcgctatt aacatggtcg aggtgagccc 540

cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 600

tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggggggc gcgcgccagg 660

cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa 720

tcagagcggc gcgctccgaa agtttccttt tatggcgagg cggcggcggc ggcggcccta 780

taaaaagcga agcgcgcggc gggcggggag tcgctgcgac gctgccttcg ccccgtgccc 840

cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag 900

gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 960

cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 1020

ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 1080

tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 1140

agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg ggctgcgagg 1200

ggaacaaagg ctgcgtgcgg ggtgtgtgcg tgggggggtg agcagggggt gtgggcgcgg 1260

cggtcgggct gtaacccccc cctgcacccc cctccccgag ttgctgagca cggcccggct 1320

tcgggtgcgg ggctccgtgc ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg 1380

cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag 1440

gggcgcggcg gccccggagc gccggcggct gtcgaggcgc ggcgagccgc agccattgcc 1500

ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc tggcggagcc 1560

gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc gggcgaagcg gtgcggcgcc 1620

ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc 1680

catctccagc ctcggggctg ccgcaggggg acggctgcct tcggggggga cggggcaggg 1740

cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800

ccttcttctt tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt 1860

ttggcaaacc tgcaggccac catggcctcc aggctgaccc tgctgaccct cctgctgctg 1920

ctgctggctg gggatagagc ctcctcaaat ccaaatgcta ccagctccag ctcccaggat 1980

ccagagagtt tgcaagacag aggcgaaggg aaggtcgcaa caacagttat ctccaagatg 2040

ctattcgttg aacccatcct ggaggtttcc agcttgccga caaccaactc aacaaccaat 2100

tcagccacca aaataacagc taataccact gatgaaccca ccacacaacc caccacagag 2160

cccaccaccc aacccaccat ccaacccacc caaccaacta cccagctccc aacagattct 2220

cctacccagc ccactactgg gtccttctgc ccaggacctg ttactctctg ctctgacttg 2280

gagagtcatt caacagaggc cgtgttgggg gatgctttgg tagatttctc cctgaagctc 2340

taccacgcct tctcagcaat gaagaaggtg gagaccaaca tggccttttc cccattcagc 2400

atcgccagcc tccttaccca ggtcctgctc ggggctgggg agaacaccaa aacaaacctg 2460

gagagcatcc tctcttaccc caaggacttc acctgtgtcc accaggccct gaagggcttc 2520

acgaccaaag gtgtcacctc agtctctcag atcttccaca gcccagacct ggccataagg 2580

gacacctttg tgaatgcctc tcggaccctg tacagcagca gccccagagt cctaagcaac 2640

aacagtgacg ccaacttgga gctcatcaac acctgggtgg ccaagaacac caacaacaag 2700

atcagccggc tgctagacag tctgccctcc gatacccgcc ttgtcctcct caatgctatc 2760

tacctgagtg ccaagtggaa gacaacattt gatcccaaga aaaccagaat ggaacccttt 2820

cacttcaaaa actcagttat aaaagtgccc atgatgaata gcaagaagta ccctgtggcc 2880

catttcattg accaaacttt gaaagccaag gtggggcagc tgcagctctc ccacaatctg 2940

agtttggtga tcctggtacc ccagaacctg aaacatcgtc ttgaagacat ggaacaggct 3000

ctcagccctt ctgttttcaa ggccatcatg gagaaactgg agatgtccaa gttccagccc 3060

actctcctaa cactaccccg catcaaagtg acgaccagcc aggatatgct ctcaatcatg 3120

gagaaattgg aattcttcga tttttcttat gaccttaacc tgtgtgggct gacagaggac 3180

ccagatcttc aggtttctgc gatgcagcac cagacagtgc tggaactgac agagactggg 3240

gtggaggcgg ctgcagcctc cgccatctct gtggcccgca ccctgctggt ctttgaagtg 3300

cagcagccct tcctcttcgt gctctgggac cagcagcaca agttccctgt cttcatgggg 3360

cgagtatatg accccagggc ctgagctcga gctgtgcctt ctagttgcca gccatctgtt 3420

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3480

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3540

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3600

gcggtgggct ctatggaccg gtgcggccgc aggaacccct agtgatggag ttggccactc 3660

cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3720

gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcc 3765

<210> 9

<211> 4280

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 9

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat agcagctaca 1320

atccagctac cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc 1380

aagctaggcc cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg 1440

caacgtgctg gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg 1500

gcctccaggc tgaccctgct gaccctcctg ctgctgctgc tggctgggga tagagcctcc 1560

tcaaatccaa atgctaccag ctccagctcc caggatccag agagtttgca agacagaggc 1620

gaagggaagg tcgcaacaac agttatctcc aagatgctat tcgttgaacc catcctggag 1680

gtttccagct tgccgacaac caactcaaca accaattcag ccaccaaaat aacagctaat 1740

accactgatg aacccaccac acaacccacc acagagccca ccacccaacc caccatccaa 1800

cccacccaac caactaccca gctcccaaca gattctccta cccagcccac tactgggtcc 1860

ttctgcccag gacctgttac tctctgctct gacttggaga gtcattcaac agaggccgtg 1920

ttgggggatg ctttggtaga tttctccctg aagctctacc acgccttctc agcaatgaag 1980

aaggtggaga ccaacatggc cttttcccca ttcagcatcg ccagcctcct tacccaggtc 2040

ctgctcgggg ctggggagaa caccaaaaca aacctggaga gcatcctctc ttaccccaag 2100

gacttcacct gtgtccacca ggccctgaag ggcttcacga ccaaaggtgt cacctcagtc 2160

tctcagatct tccacagccc agacctggcc ataagggaca cctttgtgaa tgcctctcgg 2220

accctgtaca gcagcagccc cagagtccta agcaacaaca gtgacgccaa cttggagctc 2280

atcaacacct gggtggccaa gaacaccaac aacaagatca gccggctgct agacagtctg 2340

ccctccgata cccgccttgt cctcctcaat gctatctacc tgagtgccaa gtggaagaca 2400

acatttgatc ccaagaaaac cagaatggaa ccctttcact tcaaaaactc agttataaaa 2460

gtgcccatga tgaatagcaa gaagtaccct gtggcccatt tcattgacca aactttgaaa 2520

gccaaggtgg ggcagctgca gctctcccac aatctgagtt tggtgatcct ggtaccccag 2580

aacctgaaac atcgtcttga agacatggaa caggctctca gcccttctgt tttcaaggcc 2640

atcatggaga aactggagat gtccaagttc cagcccactc tcctaacact accccgcatc 2700

aaagtgacga ccagccagga tatgctctca atcatggaga aattggaatt cttcgatttt 2760

tcttatgacc ttaacctgtg tgggctgaca gaggacccag atcttcaggt ttctgcgatg 2820

cagcaccaga cagtgctgga actgacagag actggggtgg aggcggctgc agcctccgcc 2880

atctctgtgg cccgcaccct gctggtcttt gaagtgcagc agcccttcct cttcgtgctc 2940

tgggaccagc agcacaagtt ccctgtcttc atggggcgag tatatgaccc cagggcctga 3000

cctcgagcct gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 3060

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 3120

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 3180

aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3240

tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3300

agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3360

tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3420

tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3480

tccctgtcct tctgatttta aaataactat accagcagga ggacgtccag acacagcata 3540

ggctacctgg ccatgcccaa ccggtgggac atttgagttg cttgcttggc actgtcctct 3600

catgcgttgg gtccactcag tagatgcctg ttgaattcct gggcctaggg ctgtgccagc 3660

tgcctcgtcc cgtcaccttc tggcttcttc tctccctcca tatcttagct gttttcctca 3720

tgagaatgtt ccaaattcga aatttctatt taaccattat atatttactt gtttgctatt 3780

atctctgccc ccagtagatt gttagctcca gaagagaaag gatcatgtct tttgcttatc 3840

tagatatgcc catctgcctg gtacaatctc tggcacatgt tacaggcaac aactacttgt 3900

ggaattggtg aatgcatgaa tagaagaatg agtgaatgaa tgaatagaca aaaggcagaa 3960

atccagcctc aaagagctta cagtctggta agaggaataa aatgtctgca aatagccaca 4020

ggacaggtca aaggaaggag gggctatttc cagctgaggg caccccatca ggaaagcacc 4080

ccagacttcc tacaactact agacacatct cgatgctttt cacttctcta tcaatgggcg 4140

gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4200

tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4260

cgagcgagcg cgcagctgcc 4280

<210> 10

<211> 1503

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 10

atggcctcca gactgaccct cctcacactg ctcctgctgc tccttgctgg agatagagcc 60

agctccaacc ccaatgccac aagcagcagc agccaggacc ctgagagcct gcaggacaga 120

ggagagggca aggtggccac aacagtgatc tctaaaatgc tcttcgttga acccatcctg 180

gaagtgtcct ctctgcctac cacaaacagc accacaaatt cagccaccaa gatcacagcc 240

aataccacag atgagcccac aacccaacct accacagaac caacaactca gcctacaatc 300

cagcctactc agccaaccac ccagctgcct acagacagcc ccacacagcc tacaacaggc 360

agcttctgcc ctggacctgt gaccctgtgc agtgatctgg aatctcactc tacagaggct 420

gtgctgggag atgccctggt ggacttcagc ctgaaactgt atcacgcctt ctctgccatg 480

aaaaaggtgg agacaaatat ggcttttagc cctttttcta ttgccagcct gctgacccaa 540

gtgctgctgg gagctggaga gaacacaaag accaacttgg aaagcatcct gagctaccct 600

aaggacttca cctgtgtgca ccaggccctg aagggcttca caaccaaggg agtgacaagt 660

gtttcccaaa tcttccacag ccctgatctg gccatcagag acacctttgt gaatgcctcc 720

agaaccctgt acagcagctc tcctagagtg ctgagcaaca actctgatgc caacctggaa 780

ctgatcaaca cctgggtggc caaaaacaca aacaacaaga tcagcagact gcttgatagc 840

ctcccttctg atactagact ggtcctgctg aatgctatct acctgtctgc taagtggaag 900

accacttttg accccaagaa aaccagaatg gaacctttcc actttaagaa cagtgtgatc 960

aaggtgccta tgatgaactc caagaaatac cctgtggccc acttcattga ccagaccctg 1020

aaggccaagg tgggccagct gcaactgagc cacaacctga gcctggtgat tctggttcct 1080

cagaacctga agcacagact ggaagatatg gagcaggccc tgtctccatc tgtgttcaag 1140

gccatcatgg agaagctgga aatgagcaag ttccagccca ccctgctgac actccccaga 1200

atcaaggtga ccaccagcca ggatatgctg tctatcatgg aaaagcttga gttctttgac 1260

ttctcctatg acctgaacct ctgtggcctg acagaagatc cagacctcca ggtgtctgcc 1320

atgcagcacc agacagtgtt ggagctgaca gaaacaggag tggaagctgc agctgcctct 1380

gccatctctg tggccagaac actgctggtg tttgaggtgc agcagccttt cctgtttgtg 1440

ctgtgggacc aacagcacaa gttccctgtg tttatgggca gagtgtatga ccctagagcc 1500

tga 1503

<210> 11

<211> 1503

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 11

atggccagca gacttaccct gcttaccctg ctcttgcttc tgttggctgg agacagagcc 60

agctccaatc ctaatgctac ctccagctcc agtcaagatc cagagagcct gcaggataga 120

ggagagggca aggtggccac cacagtcata agtaaaatgc tctttgtgga acccatcctg 180

gaggtgagtt ctcttcctac cactaactct accacaaact ctgcaaccaa gatcacagcc 240

aatactacag atgagcctac aactcaacca actacagaac ccacaactca acctacaatc 300

cagcctactc aacccactac acaactgccc actgactcac ctacccagcc taccacaggg 360

tcattttgtc cagggccagt taccctgtgt agtgaccttg agagccatag tacagaggct 420

gttctggggg atgctcttgt agattttagc cttaaactgt accatgcttt cagtgctatg 480

aaaaaagttg aaacaaacat ggctttttcc ccttttagta ttgcttctct ccttactcag 540

gttcttctgg gagctgggga gaacacaaaa actaatcttg aatctatcct cagctatcct 600

aaagacttta cttgtgtgca ccaagctctt aaaggattta caactaaggg agttactagt 660

gtgagtcaga tttttcacag tccagacctt gctatcagag atacatttgt taatgcttca 720

agaactctgt atagtagcag tcccagggtc ttgtcaaata acagtgatgc caatcttgag 780

ctcataaata cctgggtggc taagaataca aacaataaaa tatcaaggct tctggactct 840

ctcccaagtg ataccagact tgttctcctg aatgcaatat acctcagtgc taaatggaaa 900

actacatttg atcccaaaaa aactagaatg gagccatttc actttaaaaa tagtgtaatc 960

aaggtaccta tgatgaacag caaaaaatat cctgtagctc actttattga ccaaactctc 1020

aaagccaaag tggggcaact ccagctgagt cacaacctga gtttggtaat tctggtacca 1080

caaaatctga agcacagact tgaagatatg gaacaagctc tctctcccag tgtttttaaa 1140

gccataatgg aaaagcttga aatgagtaaa tttcaaccca cactcctcac cctccctagg 1200

atcaaagtta ccacatccca ggacatgctc agtataatgg agaaacttga gttctttgat 1260

tttagctatg atctgaatct ttgtggcctg acagaggatc cagatctcca ggtatctgcc 1320

atgcagcacc agactgtgct ggagctgaca gaaacaggtg tagaagctgc agcagcctca 1380

gctataagtg tggctagaac attgcttgtc tttgaggtcc aacagccttt tttgtttgtt 1440

ctttgggacc aacagcataa atttcctgtc tttatgggaa gagtttatga cccaagagct 1500

taa 1503

<210> 12

<211> 1503

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 12

atggccagca gacttaccct gcttaccctg ctcttgcttc tgttggctgg agacagagcc 60

agctccaatc ctaatgctac ctccagctcc agtcaagatc ccgagagcct gcaggataga 120

ggagagggca aggtggccac cacagtgatc agcaagatgc tgtttgtgga gcctatcctg 180

gaggtgagct ctctgcctac cacaaatagc accacaaatt ctgccaccaa gatcacagcc 240

aataccactg atgaacccac tacccagccc acaactgagc ctacaaccca acctactatc 300

caacctaccc agcctaccac tcaactgccc actgacagcc ctacccaacc tacaactggc 360

tccttctgcc ctggccctgt gaccctgtgc agtgatctgg agagccactc tactgaggct 420

gtgctgggag atgctctggt ggacttcagc ctgaagctgt accacgcctt ctctgctatg 480

aagaaggtgg agaccaatat ggctttcagc cccttctcta ttgccagcct gctgacccaa 540

gtgctcctgg gagctggaga gaataccaag accaatctgg agtctatcct gagctacccc 600

aaggatttca cctgtgtgca ccaagccctg aagggcttca ccacaaaggg agtgacctct 660

gtgagccaga tcttccacag cccagatctg gctatcagag atacctttgt gaatgccagc 720

agaaccctgt acagctcttc ccctagagtg ctgagcaaca attctgatgc taatctggag 780

ctgatcaata cctgggtggc caagaatacc aacaataaga tcagcagact cctggactcc 840

ctgccctctg ataccagact ggtgctcctg aatgctatct acctgtctgc caagtggaag 900

accacttttg accccaagaa gaccagaatg gagcccttcc acttcaagaa ttctgtgatc 960

aaggtgccca tgatgaatag caagaagtac cctgtggccc acttcattga tcagaccctg 1020

aaggctaagg tgggccaact ccagctgagc cacaatctca gcctggtgat cctggtgccc 1080

cagaatctga agcacagact ggaggatatg gagcaagccc tgagcccctc tgtgttcaag 1140

gctattatgg aaaagcttga aatgagcaag ttccagccca cactcctgac cctgcccaga 1200

atcaaggtga ccactagcca agatatgctg tctattatgg aaaaactgga attctttgac 1260

ttcagctatg acctgaatct gtgtggcctg actgaagatc ccgacctgca agtgtctgcc 1320

atgcagcacc aaactgtgct ggagctcact gagacaggag tggaggctgc agctgcttct 1380

gccatctctg tggccagaac cctcctggtg tttgaggtgc aacagccttt cctgtttgtg 1440

ctgtgggatc agcaacacaa gttccctgtg ttcatgggca gagtgtatga tcccagagcc 1500

taa 1503

<210> 13

<211> 1503

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 13

atggcttcta ggctgaccct gctgactctg ctgctgctgc tgctggccgg cgacagggct 60

tcttctaatc ccaacgccac ctctagcagc agccaggatc ccgagagcct gcaggacagg 120

ggggagggga aggtggccac caccgtgatc agcaagatgc tgttcgtgga gcctatcctg 180

gaggtgtcta gcctgcccac caccaactct accaccaaca gcgccaccaa gattactgct 240

aacaccaccg acgagcccac cacccagccc actaccgagc ctaccactca gcccaccatt 300

cagcccaccc agcctactac tcagctgccc actgacagcc ccacccagcc taccaccggc 360

agcttttgcc ccggccccgt gaccctgtgc agcgacctgg agagccattc taccgaggcc 420

gtgctgggcg acgccctggt ggacttcagc ctgaagctgt atcatgcctt tagcgctatg 480

aagaaggtgg agactaacat ggccttcagc cccttctcta tcgcctctct gctgacccag 540

gtgctgctgg gcgccgggga gaacaccaag accaatctgg agagcatcct gagctacccc 600

aaggatttca cttgcgtgca ccaggctctg aagggcttca ccaccaaggg cgtgactagc 660

gtgtctcaga tcttccactc tcccgacctg gccattaggg acactttcgt gaacgccagc 720

aggactctgt acagcagcag ccccagggtg ctgagcaaca atagcgacgc taacctggag 780

ctgatcaaca cctgggtggc caagaacacc aacaacaaga tcagcaggct gctggacagc 840

ctgcccagcg ataccaggct ggtgctgctg aacgctatct acctgtctgc taagtggaaa 900

actaccttcg atcctaagaa aaccaggatg gagcccttcc atttcaagaa tagcgtgatc 960

aaggtgccca tgatgaacag caagaagtac cccgtggccc acttcatcga ccagaccctg 1020

aaggccaagg tgggccagct gcagctgagc cacaacctga gcctggtgat cctggtgccc 1080

cagaatctga agcacaggct ggaggacatg gagcaggccc tgagccccag cgtgttcaag 1140

gccatcatgg agaagctgga gatgtctaag ttccagccca ccctgctgac cctgcccagg 1200

atcaaggtga ccactagcca ggacatgctg agcattatgg agaagctgga gttcttcgac 1260

ttctcttacg acctgaacct gtgcggcctg actgaggatc ccgatctgca ggtgtctgct 1320

atgcagcacc agaccgtgct ggagctgacc gagactggcg tggaggccgc cgccgccagc 1380

gccatcagcg tggccaggac cctgctggtg ttcgaggtgc agcagccctt tctgtttgtg 1440

ctgtgggatc agcagcacaa gttccctgtg ttcatgggga gagtgtacga ccctagggcc 1500

tga 1503

<210> 14

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 14

tggacacagg acgctgtggt ttctgagcca gg 32

<210> 15

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 15

gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60

gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120

tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180

tgaatc 186

<210> 16

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 16

tgtttgctgc ttgcaatgtt tgcccatttt aggg 34

<210> 17

<211> 351

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 17

gtcgacaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg cagcatttac 60

tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga ggcaggagaa 120

gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggag aggctcaggt 180

taatttttaa aaagcagtca aaagtccaag tggcccttgg cagcatttac tctctctgtt 240

tgctctggtt aataatctca ggagcacaaa cattcctgga ggcaggagaa gaaatcaaca 300

tcctggactt atcctctggg cctctcccca cccccaggag aggctgtcga c 351

<210> 18

<211> 252

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 18

tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60

gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120

tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180

cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240

ggacagtgaa tc 252

<210> 19

<211> 227

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 19

agctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 60

cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 120

tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 180

ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatgg 227

<210> 20

<211> 3075

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 20

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttagcagc tacaatccag ctaccattct gcttttattt tatggttggg 960

ataaggctgg attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct 1020

tatcttcctc ccacagctcc tgggcaacgt gctggtctgt gtgctggccc atcactttgg 1080

caaagaattg cgatcgccac catgttcatg ccttcttctt tttcctacag ctcctgggca 1140

acgtgctggt tgttgtgctg tctcatcatt ttggcaaacc tgcaggccac catggcctcc 1200

aggctgaccc tgctgaccct cctgctgctg ctgctggctg gggatagagc ctcctcaaat 1260

ccaaatgcta ccagctccag ctcccaggat ccagagagtt tgcaagacag aggcgaaggg 1320

aaggtcgcaa caacagttat ctccaagatg ctattcgttg aacccatcct ggaggtttcc 1380

agcttgccga caaccaactc aacaaccaat tcagccacca aaataacagc taataccact 1440

gatgaaccca ccacacaacc caccacagag cccaccaccc aacccaccat ccaacccacc 1500

caaccaacta cccagctccc aacagattct cctacccagc ccactactgg gtccttctgc 1560

ccaggacctg ttactctctg ctctgacttg gagagtcatt caacagaggc cgtgttgggg 1620

gatgctttgg tagatttctc cctgaagctc taccacgcct tctcagcaat gaagaaggtg 1680

gagaccaaca tggccttttc cccattcagc atcgccagcc tccttaccca ggtcctgctc 1740

ggggctgggg agaacaccaa aacaaacctg gagagcatcc tctcttaccc caaggacttc 1800

acctgtgtcc accaggccct gaagggcttc acgaccaaag gtgtcacctc agtctctcag 1860

atcttccaca gcccagacct ggccataagg gacacctttg tgaatgcctc tcggaccctg 1920

tacagcagca gccccagagt cctaagcaac aacagtgacg ccaacttgga gctcatcaac 1980

acctgggtgg ccaagaacac caacaacaag atcagccggc tgctagacag tctgccctcc 2040

gatacccgcc ttgtcctcct caatgctatc tacctgagtg ccaagtggaa gacaacattt 2100

gatcccaaga aaaccagaat ggaacccttt cacttcaaaa actcagttat aaaagtgccc 2160

atgatgaata gcaagaagta ccctgtggcc catttcattg accaaacttt gaaagccaag 2220

gtggggcagc tgcagctctc ccacaatctg agtttggtga tcctggtacc ccagaacctg 2280

aaacatcgtc ttgaagacat ggaacaggct ctcagccctt ctgttttcaa ggccatcatg 2340

gagaaactgg agatgtccaa gttccagccc actctcctaa cactaccccg catcaaagtg 2400

acgaccagcc aggatatgct ctcaatcatg gagaaattgg aattcttcga tttttcttat 2460

gaccttaacc tgtgtgggct gacagaggac ccagatcttc aggtttctgc gatgcagcac 2520

cagacagtgc tggaactgac agagactggg gtggaggcgg ctgcagcctc cgccatctct 2580

gtggcccgca ccctgctggt ctttgaagtg cagcagccct tcctcttcgt gctctgggac 2640

cagcagcaca agttccctgt cttcatgggg cgagtatatg accccagggc ctgagctcga 2700

gctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2760

ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2820

ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2880

tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggaccg gtgcggccgc 2940

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 3000

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 3060

gagcgcgcag ctgcc 3075

<210> 21

<211> 3134

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 21

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtagcagct acaatccagc taccattctg cttttatttt atggttggga 1020

taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt 1080

atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 1140

aaagaattgc gatcgccacc atgttcatgc cttcttcttt ttcctacagc tcctgggcaa 1200

cgtgctggtt gttgtgctgt ctcatcattt tggcaaacct gcaggccacc atggcctcca 1260

ggctgaccct gctgaccctc ctgctgctgc tgctggctgg ggatagagcc tcctcaaatc 1320

caaatgctac cagctccagc tcccaggatc cagagagttt gcaagacaga ggcgaaggga 1380

aggtcgcaac aacagttatc tccaagatgc tattcgttga acccatcctg gaggtttcca 1440

gcttgccgac aaccaactca acaaccaatt cagccaccaa aataacagct aataccactg 1500

atgaacccac cacacaaccc accacagagc ccaccaccca acccaccatc caacccaccc 1560

aaccaactac ccagctccca acagattctc ctacccagcc cactactggg tccttctgcc 1620

caggacctgt tactctctgc tctgacttgg agagtcattc aacagaggcc gtgttggggg 1680

atgctttggt agatttctcc ctgaagctct accacgcctt ctcagcaatg aagaaggtgg 1740

agaccaacat ggccttttcc ccattcagca tcgccagcct ccttacccag gtcctgctcg 1800

gggctgggga gaacaccaaa acaaacctgg agagcatcct ctcttacccc aaggacttca 1860

cctgtgtcca ccaggccctg aagggcttca cgaccaaagg tgtcacctca gtctctcaga 1920

tcttccacag cccagacctg gccataaggg acacctttgt gaatgcctct cggaccctgt 1980

acagcagcag ccccagagtc ctaagcaaca acagtgacgc caacttggag ctcatcaaca 2040

cctgggtggc caagaacacc aacaacaaga tcagccggct gctagacagt ctgccctccg 2100

atacccgcct tgtcctcctc aatgctatct acctgagtgc caagtggaag acaacatttg 2160

atcccaagaa aaccagaatg gaaccctttc acttcaaaaa ctcagttata aaagtgccca 2220

tgatgaatag caagaagtac cctgtggccc atttcattga ccaaactttg aaagccaagg 2280

tggggcagct gcagctctcc cacaatctga gtttggtgat cctggtaccc cagaacctga 2340

aacatcgtct tgaagacatg gaacaggctc tcagcccttc tgttttcaag gccatcatgg 2400

agaaactgga gatgtccaag ttccagccca ctctcctaac actaccccgc atcaaagtga 2460

cgaccagcca ggatatgctc tcaatcatgg agaaattgga attcttcgat ttttcttatg 2520

accttaacct gtgtgggctg acagaggacc cagatcttca ggtttctgcg atgcagcacc 2580

agacagtgct ggaactgaca gagactgggg tggaggcggc tgcagcctcc gccatctctg 2640

tggcccgcac cctgctggtc tttgaagtgc agcagccctt cctcttcgtg ctctgggacc 2700

agcagcacaa gttccctgtc ttcatggggc gagtatatga ccccagggcc tgagctcgag 2760

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2820

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2880

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2940

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggaccgg tgcggccgca 3000

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 3060

cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 3120

agcgcgcagc tgcc 3134

<210> 22

<211> 3471

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 22

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat agcagctaca 1320

atccagctac cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc 1380

aagctaggcc cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg 1440

caacgtgctg gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg 1500

ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttgtt gtgctgtctc 1560

atcattttgg caaacctgca ggccaccatg gcctccaggc tgaccctgct gaccctcctg 1620

ctgctgctgc tggctgggga tagagcctcc tcaaatccaa atgctaccag ctccagctcc 1680

caggatccag agagtttgca agacagaggc gaagggaagg tcgcaacaac agttatctcc 1740

aagatgctat tcgttgaacc catcctggag gtttccagct tgccgacaac caactcaaca 1800

accaattcag ccaccaaaat aacagctaat accactgatg aacccaccac acaacccacc 1860

acagagccca ccacccaacc caccatccaa cccacccaac caactaccca gctcccaaca 1920

gattctccta cccagcccac tactgggtcc ttctgcccag gacctgttac tctctgctct 1980

gacttggaga gtcattcaac agaggccgtg ttgggggatg ctttggtaga tttctccctg 2040

aagctctacc acgccttctc agcaatgaag aaggtggaga ccaacatggc cttttcccca 2100

ttcagcatcg ccagcctcct tacccaggtc ctgctcgggg ctggggagaa caccaaaaca 2160

aacctggaga gcatcctctc ttaccccaag gacttcacct gtgtccacca ggccctgaag 2220

ggcttcacga ccaaaggtgt cacctcagtc tctcagatct tccacagccc agacctggcc 2280

ataagggaca cctttgtgaa tgcctctcgg accctgtaca gcagcagccc cagagtccta 2340

agcaacaaca gtgacgccaa cttggagctc atcaacacct gggtggccaa gaacaccaac 2400

aacaagatca gccggctgct agacagtctg ccctccgata cccgccttgt cctcctcaat 2460

gctatctacc tgagtgccaa gtggaagaca acatttgatc ccaagaaaac cagaatggaa 2520

ccctttcact tcaaaaactc agttataaaa gtgcccatga tgaatagcaa gaagtaccct 2580

gtggcccatt tcattgacca aactttgaaa gccaaggtgg ggcagctgca gctctcccac 2640

aatctgagtt tggtgatcct ggtaccccag aacctgaaac atcgtcttga agacatggaa 2700

caggctctca gcccttctgt tttcaaggcc atcatggaga aactggagat gtccaagttc 2760

cagcccactc tcctaacact accccgcatc aaagtgacga ccagccagga tatgctctca 2820

atcatggaga aattggaatt cttcgatttt tcttatgacc ttaacctgtg tgggctgaca 2880

gaggacccag atcttcaggt ttctgcgatg cagcaccaga cagtgctgga actgacagag 2940

actggggtgg aggcggctgc agcctccgcc atctctgtgg cccgcaccct gctggtcttt 3000

gaagtgcagc agcccttcct cttcgtgctc tgggaccagc agcacaagtt ccctgtcttc 3060

atggggcgag tatatgaccc cagggcctga gctcgagctg tgccttctag ttgccagcca 3120

tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3180

ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3240

gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 3300

ggggatgcgg tgggctctat ggaccggtgc ggccgcagga acccctagtg atggagttgg 3360

ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 3420

gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc c 3471

<210> 23

<211> 3900

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 23

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactctta 1740

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1800

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1860

gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag aattgcgatc 1920

gccaccatgt tcatgccttc ttctttttcc tacagctcct gggcaacgtg ctggttgttg 1980

tgctgtctca tcattttggc aaacctgcag gccaccatgg cctccaggct gaccctgctg 2040

accctcctgc tgctgctgct ggctggggat agagcctcct caaatccaaa tgctaccagc 2100

tccagctccc aggatccaga gagtttgcaa gacagaggcg aagggaaggt cgcaacaaca 2160

gttatctcca agatgctatt cgttgaaccc atcctggagg tttccagctt gccgacaacc 2220

aactcaacaa ccaattcagc caccaaaata acagctaata ccactgatga acccaccaca 2280

caacccacca cagagcccac cacccaaccc accatccaac ccacccaacc aactacccag 2340

ctcccaacag attctcctac ccagcccact actgggtcct tctgcccagg acctgttact 2400

ctctgctctg acttggagag tcattcaaca gaggccgtgt tgggggatgc tttggtagat 2460

ttctccctga agctctacca cgccttctca gcaatgaaga aggtggagac caacatggcc 2520

ttttccccat tcagcatcgc cagcctcctt acccaggtcc tgctcggggc tggggagaac 2580

accaaaacaa acctggagag catcctctct taccccaagg acttcacctg tgtccaccag 2640

gccctgaagg gcttcacgac caaaggtgtc acctcagtct ctcagatctt ccacagccca 2700

gacctggcca taagggacac ctttgtgaat gcctctcgga ccctgtacag cagcagcccc 2760

agagtcctaa gcaacaacag tgacgccaac ttggagctca tcaacacctg ggtggccaag 2820

aacaccaaca acaagatcag ccggctgcta gacagtctgc cctccgatac ccgccttgtc 2880

ctcctcaatg ctatctacct gagtgccaag tggaagacaa catttgatcc caagaaaacc 2940

agaatggaac cctttcactt caaaaactca gttataaaag tgcccatgat gaatagcaag 3000

aagtaccctg tggcccattt cattgaccaa actttgaaag ccaaggtggg gcagctgcag 3060

ctctcccaca atctgagttt ggtgatcctg gtaccccaga acctgaaaca tcgtcttgaa 3120

gacatggaac aggctctcag cccttctgtt ttcaaggcca tcatggagaa actggagatg 3180

tccaagttcc agcccactct cctaacacta ccccgcatca aagtgacgac cagccaggat 3240

atgctctcaa tcatggagaa attggaattc ttcgattttt cttatgacct taacctgtgt 3300

gggctgacag aggacccaga tcttcaggtt tctgcgatgc agcaccagac agtgctggaa 3360

ctgacagaga ctggggtgga ggcggctgca gcctccgcca tctctgtggc ccgcaccctg 3420

ctggtctttg aagtgcagca gcccttcctc ttcgtgctct gggaccagca gcacaagttc 3480

cctgtcttca tggggcgagt atatgacccc agggcctgag ctcgagctgt gccttctagt 3540

tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3600

cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3660

tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3720

aggcatgctg gggatgcggt gggctctatg gaccggtgcg gccgcaggaa cccctagtga 3780

tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 3840

tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc 3900

<210> 24

<211> 3810

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 24

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactctta 1740

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1800

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1860

gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag aattgcgatc 1920

gccaccatgg ccagcaggct cactctgctg actctgctgc tgctgctgct ggctggggac 1980

agggccagca gcaaccccaa tgccaccagc agcagcagcc aggaccctga gagcctccag 2040

gacagggggg agggcaaggt ggccaccact gtgatcagca agatgctgtt tgtggagccc 2100

atcctggagg tcagcagcct gcccaccacc aacagcacca ccaactctgc caccaagatc 2160

actgccaaca ctactgatga acccactacc caacccacca ctgagcccac cactcagccc 2220

actatccagc ccacccagcc caccacccag ctgcccactg acagccccac ccagcccacc 2280

actggcagct tctgccctgg ccctgtgact ctgtgcagtg atctggagag ccacagcact 2340

gaggctgtgc tgggggatgc cctggtggac ttcagcctga agctgtacca cgccttcagt 2400

gctatgaaga aggtggagac caatatggcc ttcagcccct tcagtattgc cagcctgctg 2460

actcaggtgc tgctgggggc tggggagaac actaagacca acctggagag tatcctgagc 2520

taccccaagg acttcacttg tgtgcaccag gccctgaagg gcttcactac caagggggtc 2580

actagtgtga gccagatctt ccacagccct gatctggcca tcagggacac ttttgtgaat 2640

gccagcagga ccctgtacag cagcagcccc agggtgctga gcaacaacag tgatgccaac 2700

ctggagctga tcaatacctg ggtggccaag aataccaaca acaagatcag caggctgctg 2760

gacagcctgc ccagtgatac caggctggtg ctgctgaatg ctatctacct gagtgccaag 2820

tggaagacca cctttgatcc caagaagacc aggatggagc ccttccactt caagaacagt 2880

gtgatcaagg tgcccatgat gaacagcaag aagtaccctg tggcccactt cattgatcag 2940

accctgaagg ccaaggtggg ccagctgcag ctgagccaca acctgagcct ggtcatcctg 3000

gtgccccaga acctgaagca caggctggag gatatggagc aggccctgag ccccagtgtg 3060

ttcaaggcta ttatggagaa gctcgaaatg agcaagttcc agcccaccct gctgactctg 3120

cccaggatca aggtcactac cagccaggat atgctgtcta ttatggagaa actggagttc 3180

tttgacttca gctatgatct gaacctgtgt gggctgactg aggaccctga tctgcaagtg 3240

agtgccatgc agcaccagac tgtgctggag ctgactgaga ctggggtgga ggctgctgct 3300

gctagtgcca tcagtgtggc caggaccctg ctggtctttg aggtgcagca gcccttcctg 3360

tttgtgctgt gggaccagca gcacaagttc cctgtgttca tgggcagggt ctatgatccc 3420

agggcctaac ctcgagctgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3480

gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3540

attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3600

agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3660

gaccggtgcg gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 3720

gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 3780

cctcagtgag cgagcgagcg cgcagctgcc 3810

<210> 25

<211> 3810

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 25

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactctta 1740

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1800

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1860

gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag aattgcgatc 1920

gccaccatgg ccagccgcct gaccctgctg accctgctgc tgctgctgct ggccggcgac 1980

cgcgccagca gcaaccccaa cgccaccagc agcagcagcc aggaccccga gagcctgcag 2040

gaccgcggcg agggcaaggt ggccaccacc gtgatcagca agatgctgtt cgtggagccc 2100

atcctggagg tgagcagcct gcccaccacc aacagcacca ccaacagcgc caccaagatc 2160

accgccaaca ccaccgacga gcccaccacc cagcccacca ccgagcccac cacccagccc 2220

accatccagc ccacccagcc caccacccag ctgcccaccg acagccccac ccagcccacc 2280

accggcagct tctgccccgg ccccgtgacc ctgtgcagcg acctggagag ccacagcacc 2340

gaggccgtgc tgggcgacgc cctggtggac ttcagcctga agctgtacca cgccttcagc 2400

gccatgaaga aggtggagac caacatggcc ttcagcccct tcagcatcgc cagcctgctg 2460

acccaggtgc tgctgggcgc cggcgagaac accaagacca acctggagag catcctgagc 2520

taccccaagg acttcacctg cgtgcaccag gccctgaagg gcttcaccac caagggcgtg 2580

accagcgtga gccagatctt ccacagcccc gacctggcca tccgcgacac cttcgtgaac 2640

gccagccgca ccctgtacag cagcagcccc cgcgtgctga gcaacaacag cgacgccaac 2700

ctggagctga tcaacacctg ggtggccaag aacaccaaca acaagatcag ccgcctgctg 2760

gacagcctgc ccagcgacac ccgcctggtg ctgctgaacg ccatctacct gagcgccaag 2820

tggaagacca ccttcgaccc caagaagacc cgcatggagc ccttccactt caagaacagc 2880

gtgatcaagg tgcccatgat gaacagcaag aagtaccccg tggcccactt catcgaccag 2940

accctgaagg ccaaggtggg ccagctgcag ctgagccaca acctgagcct ggtgatcctg 3000

gtgccccaga acctgaagca ccgcctggag gacatggagc aggccctgag ccccagcgtg 3060

ttcaaggcca tcatggagaa gctggagatg agcaagttcc agcccaccct gctgaccctg 3120

ccccgcatca aggtgaccac cagccaggac atgctgagca tcatggagaa gctggagttc 3180

ttcgacttca gctacgacct gaacctgtgc gggctgaccg aggaccccga cctgcaggtg 3240

agcgccatgc agcaccagac cgtgctggag ctgaccgaga ccggcgtgga ggccgccgcc 3300

gccagcgcca tcagcgtggc ccgcaccctg ctggtgttcg aggtgcagca gcccttcctg 3360

ttcgtgctgt gggaccagca gcacaagttc cccgtgttca tgggccgcgt gtacgacccc 3420

cgcgcctaac ctcgagctgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3480

gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3540

attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3600

agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3660

gaccggtgcg gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 3720

gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 3780

cctcagtgag cgagcgagcg cgcagctgcc 3810

<210> 26

<211> 3810

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 26

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactctta 1740

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1800

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1860

gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag aattgcgatc 1920

gccaccatgg cttctaggct gaccctgctg actctgctgc tgctgctgct ggccggcgac 1980

agggcttctt ctaatcccaa cgccacctct agcagcagcc aggatcccga gagcctgcag 2040

gacagggggg aggggaaggt ggccaccacc gtgatcagca agatgctgtt cgtggagcct 2100

atcctggagg tgtctagcct gcccaccacc aactctacca ccaacagcgc caccaagatt 2160

actgctaaca ccaccgacga gcccaccacc cagcccacta ccgagcctac cactcagccc 2220

accattcagc ccacccagcc tactactcag ctgcccactg acagccccac ccagcctacc 2280

accggcagct tttgccccgg ccccgtgacc ctgtgcagcg acctggagag ccattctacc 2340

gaggccgtgc tgggcgacgc cctggtggac ttcagcctga agctgtatca tgcctttagc 2400

gctatgaaga aggtggagac taacatggcc ttcagcccct tctctatcgc ctctctgctg 2460

acccaggtgc tgctgggcgc cggggagaac accaagacca atctggagag catcctgagc 2520

taccccaagg atttcacttg cgtgcaccag gctctgaagg gcttcaccac caagggcgtg 2580

actagcgtgt ctcagatctt ccactctccc gacctggcca ttagggacac tttcgtgaac 2640

gccagcagga ctctgtacag cagcagcccc agggtgctga gcaacaatag cgacgctaac 2700

ctggagctga tcaacacctg ggtggccaag aacaccaaca acaagatcag caggctgctg 2760

gacagcctgc ccagcgatac caggctggtg ctgctgaacg ctatctacct gtctgctaag 2820

tggaaaacta ccttcgatcc taagaaaacc aggatggagc ccttccattt caagaatagc 2880

gtgatcaagg tgcccatgat gaacagcaag aagtaccccg tggcccactt catcgaccag 2940

accctgaagg ccaaggtggg ccagctgcag ctgagccaca acctgagcct ggtgatcctg 3000

gtgccccaga atctgaagca caggctggag gacatggagc aggccctgag ccccagcgtg 3060

ttcaaggcca tcatggagaa gctggagatg tctaagttcc agcccaccct gctgaccctg 3120

cccaggatca aggtgaccac tagccaggac atgctgagca ttatggagaa gctggagttc 3180

ttcgacttct cttacgacct gaacctgtgc ggcctgactg aggatcccga tctgcaggtg 3240

tctgctatgc agcaccagac cgtgctggag ctgaccgaga ctggcgtgga ggccgccgcc 3300

gccagcgcca tcagcgtggc caggaccctg ctggtgttcg aggtgcagca gccctttctg 3360

tttgtgctgt gggatcagca gcacaagttc cctgtgttca tggggagagt gtacgaccct 3420

agggcctgag ctcgagctgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3480

gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3540

attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3600

agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3660

gaccggtgcg gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 3720

gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 3780

cctcagtgag cgagcgagcg cgcagctgcc 3810

<210> 27

<211> 4767

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 27

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt tttctgattc aagacttctg gcttcagctt 2340

tgtacacaga gatgattcaa tgtcaggttt tggagtgaaa tctgtttaat cccagacaaa 2400

acatttagga ttacatctca gttttgtaag caagtagctc tgtgattttt agtgagttat 2460

ttaatgctct ttggggctca atttttctat ctataaaata gggctaataa tttgcacctt 2520

atagggtaag ctttgaggac agattagatg atacggtgcc tgtaaaacac caggtgttag 2580

taagtgtggc aatgatggtg acgctgaggc tgatgtttgc ttagcatagg gttaggcagc 2640

tggcaggcag taaacagttg gataatttaa tggaaaattt gccaaactca gatgctagca 2700

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 2760

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagct 2820

cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat tgcgatcgcc 2880

accatggcca gccgcctgac cctgctgacc ctgctgctgc tgctgctggc cggcgaccgc 2940

gccagcagca accccaacgc caccagcagc agcagccagg accccgagag cctgcaggac 3000

cgcggcgagg gcaaggtggc caccaccgtg atcagcaaga tgctgttcgt ggagcccatc 3060

ctggaggtga gcagcctgcc caccaccaac agcaccacca acagcgccac caagatcacc 3120

gccaacacca ccgacgagcc caccacccag cccaccaccg agcccaccac ccagcccacc 3180

atccagccca cccagcccac cacccagctg cccaccgaca gccccaccca gcccaccacc 3240

ggcagcttct gccccggccc cgtgaccctg tgcagcgacc tggagagcca cagcaccgag 3300

gccgtgctgg gcgacgccct ggtggacttc agcctgaagc tgtaccacgc cttcagcgcc 3360

atgaagaagg tggagaccaa catggccttc agccccttca gcatcgccag cctgctgacc 3420

caggtgctgc tgggcgccgg cgagaacacc aagaccaacc tggagagcat cctgagctac 3480

cccaaggact tcacctgcgt gcaccaggcc ctgaagggct tcaccaccaa gggcgtgacc 3540

agcgtgagcc agatcttcca cagccccgac ctggccatcc gcgacacctt cgtgaacgcc 3600

agccgcaccc tgtacagcag cagcccccgc gtgctgagca acaacagcga cgccaacctg 3660

gagctgatca acacctgggt ggccaagaac accaacaaca agatcagccg cctgctggac 3720

agcctgccca gcgacacccg cctggtgctg ctgaacgcca tctacctgag cgccaagtgg 3780

aagaccacct tcgaccccaa gaagacccgc atggagccct tccacttcaa gaacagcgtg 3840

atcaaggtgc ccatgatgaa cagcaagaag taccccgtgg cccacttcat cgaccagacc 3900

ctgaaggcca aggtgggcca gctgcagctg agccacaacc tgagcctggt gatcctggtg 3960

ccccagaacc tgaagcaccg cctggaggac atggagcagg ccctgagccc cagcgtgttc 4020

aaggccatca tggagaagct ggagatgagc aagttccagc ccaccctgct gaccctgccc 4080

cgcatcaagg tgaccaccag ccaggacatg ctgagcatca tggagaagct ggagttcttc 4140

gacttcagct acgacctgaa cctgtgcggg ctgaccgagg accccgacct gcaggtgagc 4200

gccatgcagc accagaccgt gctggagctg accgagaccg gcgtggaggc cgccgccgcc 4260

agcgccatca gcgtggcccg caccctgctg gtgttcgagg tgcagcagcc cttcctgttc 4320

gtgctgtggg accagcagca caagttcccc gtgttcatgg gccgcgtgta cgacccccgc 4380

gcctaacctc gagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 4440

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 4500

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 4560

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 4620

cggtgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4680

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4740

cagtgagcga gcgagcgcgc agctgcc 4767

<210> 28

<211> 4767

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 28

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt tttctgattc aagacttctg gcttcagctt 2340

tgtacacaga gatgattcaa tgtcaggttt tggagtgaaa tctgtttaat cccagacaaa 2400

acatttagga ttacatctca gttttgtaag caagtagctc tgtgattttt agtgagttat 2460

ttaatgctct ttggggctca atttttctat ctataaaata gggctaataa tttgcacctt 2520

atagggtaag ctttgaggac agattagatg atacggtgcc tgtaaaacac caggtgttag 2580

taagtgtggc aatgatggtg acgctgaggc tgatgtttgc ttagcatagg gttaggcagc 2640

tggcaggcag taaacagttg gataatttaa tggaaaattt gccaaactca gatgctagca 2700

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 2760

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagct 2820

cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat tgcgatcgcc 2880

accatggcct ccagactgac cctcctcaca ctgctcctgc tgctccttgc tggagataga 2940

gccagctcca accccaatgc cacaagcagc agcagccagg accctgagag cctgcaggac 3000

agaggagagg gcaaggtggc cacaacagtg atctctaaaa tgctcttcgt tgaacccatc 3060

ctggaagtgt cctctctgcc taccacaaac agcaccacaa attcagccac caagatcaca 3120

gccaatacca cagatgagcc cacaacccaa cctaccacag aaccaacaac tcagcctaca 3180

atccagccta ctcagccaac cacccagctg cctacagaca gccccacaca gcctacaaca 3240

ggcagcttct gccctggacc tgtgaccctg tgcagtgatc tggaatctca ctctacagag 3300

gctgtgctgg gagatgccct ggtggacttc agcctgaaac tgtatcacgc cttctctgcc 3360

atgaaaaagg tggagacaaa tatggctttt agcccttttt ctattgccag cctgctgacc 3420

caagtgctgc tgggagctgg agagaacaca aagaccaact tggaaagcat cctgagctac 3480

cctaaggact tcacctgtgt gcaccaggcc ctgaagggct tcacaaccaa gggagtgaca 3540

agtgtttccc aaatcttcca cagccctgat ctggccatca gagacacctt tgtgaatgcc 3600

tccagaaccc tgtacagcag ctctcctaga gtgctgagca acaactctga tgccaacctg 3660

gaactgatca acacctgggt ggccaaaaac acaaacaaca agatcagcag actgcttgat 3720

agcctccctt ctgatactag actggtcctg ctgaatgcta tctacctgtc tgctaagtgg 3780

aagaccactt ttgaccccaa gaaaaccaga atggaacctt tccactttaa gaacagtgtg 3840

atcaaggtgc ctatgatgaa ctccaagaaa taccctgtgg cccacttcat tgaccagacc 3900

ctgaaggcca aggtgggcca gctgcaactg agccacaacc tgagcctggt gattctggtt 3960

cctcagaacc tgaagcacag actggaagat atggagcagg ccctgtctcc atctgtgttc 4020

aaggccatca tggagaagct ggaaatgagc aagttccagc ccaccctgct gacactcccc 4080

agaatcaagg tgaccaccag ccaggatatg ctgtctatca tggaaaagct tgagttcttt 4140

gacttctcct atgacctgaa cctctgtggc ctgacagaag atccagacct ccaggtgtct 4200

gccatgcagc accagacagt gttggagctg acagaaacag gagtggaagc tgcagctgcc 4260

tctgccatct ctgtggccag aacactgctg gtgtttgagg tgcagcagcc tttcctgttt 4320

gtgctgtggg accaacagca caagttccct gtgtttatgg gcagagtgta tgaccctaga 4380

gcctgacctc gagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 4440

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 4500

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 4560

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 4620

cggtgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4680

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4740

cagtgagcga gcgagcgcgc agctgcc 4767

<210> 29

<211> 4767

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 29

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt tttctgattc aagacttctg gcttcagctt 2340

tgtacacaga gatgattcaa tgtcaggttt tggagtgaaa tctgtttaat cccagacaaa 2400

acatttagga ttacatctca gttttgtaag caagtagctc tgtgattttt agtgagttat 2460

ttaatgctct ttggggctca atttttctat ctataaaata gggctaataa tttgcacctt 2520

atagggtaag ctttgaggac agattagatg atacggtgcc tgtaaaacac caggtgttag 2580

taagtgtggc aatgatggtg acgctgaggc tgatgtttgc ttagcatagg gttaggcagc 2640

tggcaggcag taaacagttg gataatttaa tggaaaattt gccaaactca gatgctagca 2700

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 2760

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagct 2820

cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat tgcgatcgcc 2880

accatggcca gcagacttac cctgcttacc ctgctcttgc ttctgttggc tggagacaga 2940

gccagctcca atcctaatgc tacctccagc tccagtcaag atccagagag cctgcaggat 3000

agaggagagg gcaaggtggc caccacagtc ataagtaaaa tgctctttgt ggaacccatc 3060

ctggaggtga gttctcttcc taccactaac tctaccacaa actctgcaac caagatcaca 3120

gccaatacta cagatgagcc tacaactcaa ccaactacag aacccacaac tcaacctaca 3180

atccagccta ctcaacccac tacacaactg cccactgact cacctaccca gcctaccaca 3240

gggtcatttt gtccagggcc agttaccctg tgtagtgacc ttgagagcca tagtacagag 3300

gctgttctgg gggatgctct tgtagatttt agccttaaac tgtaccatgc tttcagtgct 3360

atgaaaaaag ttgaaacaaa catggctttt tcccctttta gtattgcttc tctccttact 3420

caggttcttc tgggagctgg ggagaacaca aaaactaatc ttgaatctat cctcagctat 3480

cctaaagact ttacttgtgt gcaccaagct cttaaaggat ttacaactaa gggagttact 3540

agtgtgagtc agatttttca cagtccagac cttgctatca gagatacatt tgttaatgct 3600

tcaagaactc tgtatagtag cagtcccagg gtcttgtcaa ataacagtga tgccaatctt 3660

gagctcataa atacctgggt ggctaagaat acaaacaata aaatatcaag gcttctggac 3720

tctctcccaa gtgataccag acttgttctc ctgaatgcaa tatacctcag tgctaaatgg 3780

aaaactacat ttgatcccaa aaaaactaga atggagccat ttcactttaa aaatagtgta 3840

atcaaggtac ctatgatgaa cagcaaaaaa tatcctgtag ctcactttat tgaccaaact 3900

ctcaaagcca aagtggggca actccagctg agtcacaacc tgagtttggt aattctggta 3960

ccacaaaatc tgaagcacag acttgaagat atggaacaag ctctctctcc cagtgttttt 4020

aaagccataa tggaaaagct tgaaatgagt aaatttcaac ccacactcct caccctccct 4080

aggatcaaag ttaccacatc ccaggacatg ctcagtataa tggagaaact tgagttcttt 4140

gattttagct atgatctgaa tctttgtggc ctgacagagg atccagatct ccaggtatct 4200

gccatgcagc accagactgt gctggagctg acagaaacag gtgtagaagc tgcagcagcc 4260

tcagctataa gtgtggctag aacattgctt gtctttgagg tccaacagcc ttttttgttt 4320

gttctttggg accaacagca taaatttcct gtctttatgg gaagagttta tgacccaaga 4380

gcttaacctc gagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 4440

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 4500

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 4560

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 4620

cggtgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4680

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4740

cagtgagcga gcgagcgcgc agctgcc 4767

<210> 30

<211> 4767

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 30

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt tttctgattc aagacttctg gcttcagctt 2340

tgtacacaga gatgattcaa tgtcaggttt tggagtgaaa tctgtttaat cccagacaaa 2400

acatttagga ttacatctca gttttgtaag caagtagctc tgtgattttt agtgagttat 2460

ttaatgctct ttggggctca atttttctat ctataaaata gggctaataa tttgcacctt 2520

atagggtaag ctttgaggac agattagatg atacggtgcc tgtaaaacac caggtgttag 2580

taagtgtggc aatgatggtg acgctgaggc tgatgtttgc ttagcatagg gttaggcagc 2640

tggcaggcag taaacagttg gataatttaa tggaaaattt gccaaactca gatgctagca 2700

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 2760

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagct 2820

cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat tgcgatcgcc 2880

accatggcca gcagacttac cctgcttacc ctgctcttgc ttctgttggc tggagacaga 2940

gccagctcca atcctaatgc tacctccagc tccagtcaag atcccgagag cctgcaggat 3000

agaggagagg gcaaggtggc caccacagtg atcagcaaga tgctgtttgt ggagcctatc 3060

ctggaggtga gctctctgcc taccacaaat agcaccacaa attctgccac caagatcaca 3120

gccaatacca ctgatgaacc cactacccag cccacaactg agcctacaac ccaacctact 3180

atccaaccta cccagcctac cactcaactg cccactgaca gccctaccca acctacaact 3240

ggctccttct gccctggccc tgtgaccctg tgcagtgatc tggagagcca ctctactgag 3300

gctgtgctgg gagatgctct ggtggacttc agcctgaagc tgtaccacgc cttctctgct 3360

atgaagaagg tggagaccaa tatggctttc agccccttct ctattgccag cctgctgacc 3420

caagtgctcc tgggagctgg agagaatacc aagaccaatc tggagtctat cctgagctac 3480

cccaaggatt tcacctgtgt gcaccaagcc ctgaagggct tcaccacaaa gggagtgacc 3540

tctgtgagcc agatcttcca cagcccagat ctggctatca gagatacctt tgtgaatgcc 3600

agcagaaccc tgtacagctc ttcccctaga gtgctgagca acaattctga tgctaatctg 3660

gagctgatca atacctgggt ggccaagaat accaacaata agatcagcag actcctggac 3720

tccctgccct ctgataccag actggtgctc ctgaatgcta tctacctgtc tgccaagtgg 3780

aagaccactt ttgaccccaa gaagaccaga atggagccct tccacttcaa gaattctgtg 3840

atcaaggtgc ccatgatgaa tagcaagaag taccctgtgg cccacttcat tgatcagacc 3900

ctgaaggcta aggtgggcca actccagctg agccacaatc tcagcctggt gatcctggtg 3960

ccccagaatc tgaagcacag actggaggat atggagcaag ccctgagccc ctctgtgttc 4020

aaggctatta tggaaaagct tgaaatgagc aagttccagc ccacactcct gaccctgccc 4080

agaatcaagg tgaccactag ccaagatatg ctgtctatta tggaaaaact ggaattcttt 4140

gacttcagct atgacctgaa tctgtgtggc ctgactgaag atcccgacct gcaagtgtct 4200

gccatgcagc accaaactgt gctggagctc actgagacag gagtggaggc tgcagctgct 4260

tctgccatct ctgtggccag aaccctcctg gtgtttgagg tgcaacagcc tttcctgttt 4320

gtgctgtggg atcagcaaca caagttccct gtgttcatgg gcagagtgta tgatcccaga 4380

gcctaacctc gagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 4440

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 4500

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 4560

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 4620

cggtgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4680

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4740

cagtgagcga gcgagcgcgc agctgcc 4767

<210> 31

<211> 4280

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 31

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat agcagctaca 1320

atccagctac cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc 1380

aagctaggcc cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg 1440

caacgtgctg gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg 1500

gcctccagac tgaccctcct cacactgctc ctgctgctcc ttgctggaga tagagccagc 1560

tccaacccca atgccacaag cagcagcagc caggaccctg agagcctgca ggacagagga 1620

gagggcaagg tggccacaac agtgatctct aaaatgctct tcgttgaacc catcctggaa 1680

gtgtcctctc tgcctaccac aaacagcacc acaaattcag ccaccaagat cacagccaat 1740

accacagatg agcccacaac ccaacctacc acagaaccaa caactcagcc tacaatccag 1800

cctactcagc caaccaccca gctgcctaca gacagcccca cacagcctac aacaggcagc 1860

ttctgccctg gacctgtgac cctgtgcagt gatctggaat ctcactctac agaggctgtg 1920

ctgggagatg ccctggtgga cttcagcctg aaactgtatc acgccttctc tgccatgaaa 1980

aaggtggaga caaatatggc ttttagccct ttttctattg ccagcctgct gacccaagtg 2040

ctgctgggag ctggagagaa cacaaagacc aacttggaaa gcatcctgag ctaccctaag 2100

gacttcacct gtgtgcacca ggccctgaag ggcttcacaa ccaagggagt gacaagtgtt 2160

tcccaaatct tccacagccc tgatctggcc atcagagaca cctttgtgaa tgcctccaga 2220

accctgtaca gcagctctcc tagagtgctg agcaacaact ctgatgccaa cctggaactg 2280

atcaacacct gggtggccaa aaacacaaac aacaagatca gcagactgct tgatagcctc 2340

ccttctgata ctagactggt cctgctgaat gctatctacc tgtctgctaa gtggaagacc 2400

acttttgacc ccaagaaaac cagaatggaa cctttccact ttaagaacag tgtgatcaag 2460

gtgcctatga tgaactccaa gaaataccct gtggcccact tcattgacca gaccctgaag 2520

gccaaggtgg gccagctgca actgagccac aacctgagcc tggtgattct ggttcctcag 2580

aacctgaagc acagactgga agatatggag caggccctgt ctccatctgt gttcaaggcc 2640

atcatggaga agctggaaat gagcaagttc cagcccaccc tgctgacact ccccagaatc 2700

aaggtgacca ccagccagga tatgctgtct atcatggaaa agcttgagtt ctttgacttc 2760

tcctatgacc tgaacctctg tggcctgaca gaagatccag acctccaggt gtctgccatg 2820

cagcaccaga cagtgttgga gctgacagaa acaggagtgg aagctgcagc tgcctctgcc 2880

atctctgtgg ccagaacact gctggtgttt gaggtgcagc agcctttcct gtttgtgctg 2940

tgggaccaac agcacaagtt ccctgtgttt atgggcagag tgtatgaccc tagagcctga 3000

cctcgagcct gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 3060

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 3120

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 3180

aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3240

tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3300

agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3360

tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3420

tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3480

tccctgtcct tctgatttta aaataactat accagcagga ggacgtccag acacagcata 3540

ggctacctgg ccatgcccaa ccggtgggac atttgagttg cttgcttggc actgtcctct 3600

catgcgttgg gtccactcag tagatgcctg ttgaattcct gggcctaggg ctgtgccagc 3660

tgcctcgtcc cgtcaccttc tggcttcttc tctccctcca tatcttagct gttttcctca 3720

tgagaatgtt ccaaattcga aatttctatt taaccattat atatttactt gtttgctatt 3780

atctctgccc ccagtagatt gttagctcca gaagagaaag gatcatgtct tttgcttatc 3840

tagatatgcc catctgcctg gtacaatctc tggcacatgt tacaggcaac aactacttgt 3900

ggaattggtg aatgcatgaa tagaagaatg agtgaatgaa tgaatagaca aaaggcagaa 3960

atccagcctc aaagagctta cagtctggta agaggaataa aatgtctgca aatagccaca 4020

ggacaggtca aaggaaggag gggctatttc cagctgaggg caccccatca ggaaagcacc 4080

ccagacttcc tacaactact agacacatct cgatgctttt cacttctcta tcaatgggcg 4140

gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4200

tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4260

cgagcgagcg cgcagctgcc 4280

<210> 32

<211> 4280

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 32

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat agcagctaca 1320

atccagctac cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc 1380

aagctaggcc cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg 1440

caacgtgctg gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg 1500

gccagcagac ttaccctgct taccctgctc ttgcttctgt tggctggaga cagagccagc 1560

tccaatccta atgctacctc cagctccagt caagatccag agagcctgca ggatagagga 1620

gagggcaagg tggccaccac agtcataagt aaaatgctct ttgtggaacc catcctggag 1680

gtgagttctc ttcctaccac taactctacc acaaactctg caaccaagat cacagccaat 1740

actacagatg agcctacaac tcaaccaact acagaaccca caactcaacc tacaatccag 1800

cctactcaac ccactacaca actgcccact gactcaccta cccagcctac cacagggtca 1860

ttttgtccag ggccagttac cctgtgtagt gaccttgaga gccatagtac agaggctgtt 1920

ctgggggatg ctcttgtaga ttttagcctt aaactgtacc atgctttcag tgctatgaaa 1980

aaagttgaaa caaacatggc tttttcccct tttagtattg cttctctcct tactcaggtt 2040

cttctgggag ctggggagaa cacaaaaact aatcttgaat ctatcctcag ctatcctaaa 2100

gactttactt gtgtgcacca agctcttaaa ggatttacaa ctaagggagt tactagtgtg 2160

agtcagattt ttcacagtcc agaccttgct atcagagata catttgttaa tgcttcaaga 2220

actctgtata gtagcagtcc cagggtcttg tcaaataaca gtgatgccaa tcttgagctc 2280

ataaatacct gggtggctaa gaatacaaac aataaaatat caaggcttct ggactctctc 2340

ccaagtgata ccagacttgt tctcctgaat gcaatatacc tcagtgctaa atggaaaact 2400

acatttgatc ccaaaaaaac tagaatggag ccatttcact ttaaaaatag tgtaatcaag 2460

gtacctatga tgaacagcaa aaaatatcct gtagctcact ttattgacca aactctcaaa 2520

gccaaagtgg ggcaactcca gctgagtcac aacctgagtt tggtaattct ggtaccacaa 2580

aatctgaagc acagacttga agatatggaa caagctctct ctcccagtgt ttttaaagcc 2640

ataatggaaa agcttgaaat gagtaaattt caacccacac tcctcaccct ccctaggatc 2700

aaagttacca catcccagga catgctcagt ataatggaga aacttgagtt ctttgatttt 2760

agctatgatc tgaatctttg tggcctgaca gaggatccag atctccaggt atctgccatg 2820

cagcaccaga ctgtgctgga gctgacagaa acaggtgtag aagctgcagc agcctcagct 2880

ataagtgtgg ctagaacatt gcttgtcttt gaggtccaac agcctttttt gtttgttctt 2940

tgggaccaac agcataaatt tcctgtcttt atgggaagag tttatgaccc aagagcttaa 3000

cctcgagcct gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 3060

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 3120

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 3180

aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3240

tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3300

agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3360

tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3420

tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3480

tccctgtcct tctgatttta aaataactat accagcagga ggacgtccag acacagcata 3540

ggctacctgg ccatgcccaa ccggtgggac atttgagttg cttgcttggc actgtcctct 3600

catgcgttgg gtccactcag tagatgcctg ttgaattcct gggcctaggg ctgtgccagc 3660

tgcctcgtcc cgtcaccttc tggcttcttc tctccctcca tatcttagct gttttcctca 3720

tgagaatgtt ccaaattcga aatttctatt taaccattat atatttactt gtttgctatt 3780

atctctgccc ccagtagatt gttagctcca gaagagaaag gatcatgtct tttgcttatc 3840

tagatatgcc catctgcctg gtacaatctc tggcacatgt tacaggcaac aactacttgt 3900

ggaattggtg aatgcatgaa tagaagaatg agtgaatgaa tgaatagaca aaaggcagaa 3960

atccagcctc aaagagctta cagtctggta agaggaataa aatgtctgca aatagccaca 4020

ggacaggtca aaggaaggag gggctatttc cagctgaggg caccccatca ggaaagcacc 4080

ccagacttcc tacaactact agacacatct cgatgctttt cacttctcta tcaatgggcg 4140

gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4200

tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4260

cgagcgagcg cgcagctgcc 4280

<210> 33

<211> 4280

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 33

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat agcagctaca 1320

atccagctac cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc 1380

aagctaggcc cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg 1440

caacgtgctg gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg 1500

gccagcagac ttaccctgct taccctgctc ttgcttctgt tggctggaga cagagccagc 1560

tccaatccta atgctacctc cagctccagt caagatcccg agagcctgca ggatagagga 1620

gagggcaagg tggccaccac agtgatcagc aagatgctgt ttgtggagcc tatcctggag 1680

gtgagctctc tgcctaccac aaatagcacc acaaattctg ccaccaagat cacagccaat 1740

accactgatg aacccactac ccagcccaca actgagccta caacccaacc tactatccaa 1800

cctacccagc ctaccactca actgcccact gacagcccta cccaacctac aactggctcc 1860

ttctgccctg gccctgtgac cctgtgcagt gatctggaga gccactctac tgaggctgtg 1920

ctgggagatg ctctggtgga cttcagcctg aagctgtacc acgccttctc tgctatgaag 1980

aaggtggaga ccaatatggc tttcagcccc ttctctattg ccagcctgct gacccaagtg 2040

ctcctgggag ctggagagaa taccaagacc aatctggagt ctatcctgag ctaccccaag 2100

gatttcacct gtgtgcacca agccctgaag ggcttcacca caaagggagt gacctctgtg 2160

agccagatct tccacagccc agatctggct atcagagata cctttgtgaa tgccagcaga 2220

accctgtaca gctcttcccc tagagtgctg agcaacaatt ctgatgctaa tctggagctg 2280

atcaatacct gggtggccaa gaataccaac aataagatca gcagactcct ggactccctg 2340

ccctctgata ccagactggt gctcctgaat gctatctacc tgtctgccaa gtggaagacc 2400

acttttgacc ccaagaagac cagaatggag cccttccact tcaagaattc tgtgatcaag 2460

gtgcccatga tgaatagcaa gaagtaccct gtggcccact tcattgatca gaccctgaag 2520

gctaaggtgg gccaactcca gctgagccac aatctcagcc tggtgatcct ggtgccccag 2580

aatctgaagc acagactgga ggatatggag caagccctga gcccctctgt gttcaaggct 2640

attatggaaa agcttgaaat gagcaagttc cagcccacac tcctgaccct gcccagaatc 2700

aaggtgacca ctagccaaga tatgctgtct attatggaaa aactggaatt ctttgacttc 2760

agctatgacc tgaatctgtg tggcctgact gaagatcccg acctgcaagt gtctgccatg 2820

cagcaccaaa ctgtgctgga gctcactgag acaggagtgg aggctgcagc tgcttctgcc 2880

atctctgtgg ccagaaccct cctggtgttt gaggtgcaac agcctttcct gtttgtgctg 2940

tgggatcagc aacacaagtt ccctgtgttc atgggcagag tgtatgatcc cagagcctaa 3000

cctcgagcct gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 3060

aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 3120

ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 3180

aagttgggaa gacaacctgt agggcctgcg gggtctattg ggaaccaagc tggagtgcag 3240

tggcacaatc ttggctcact gcaatctccg cctcctgggt tcaagcgatt ctcctgcctc 3300

agcctcccga gttgttggga ttccaggcat gcatgaccag gctcagctaa tttttgtttt 3360

tttggtagag acggggtttc accatattgg ccaggctggt ctccaactcc taatctcagg 3420

tgatctaccc accttggcct cccaaattgc tgggattaca ggcgtgaacc actgctccct 3480

tccctgtcct tctgatttta aaataactat accagcagga ggacgtccag acacagcata 3540

ggctacctgg ccatgcccaa ccggtgggac atttgagttg cttgcttggc actgtcctct 3600

catgcgttgg gtccactcag tagatgcctg ttgaattcct gggcctaggg ctgtgccagc 3660

tgcctcgtcc cgtcaccttc tggcttcttc tctccctcca tatcttagct gttttcctca 3720

tgagaatgtt ccaaattcga aatttctatt taaccattat atatttactt gtttgctatt 3780

atctctgccc ccagtagatt gttagctcca gaagagaaag gatcatgtct tttgcttatc 3840

tagatatgcc catctgcctg gtacaatctc tggcacatgt tacaggcaac aactacttgt 3900

ggaattggtg aatgcatgaa tagaagaatg agtgaatgaa tgaatagaca aaaggcagaa 3960

atccagcctc aaagagctta cagtctggta agaggaataa aatgtctgca aatagccaca 4020

ggacaggtca aaggaaggag gggctatttc cagctgaggg caccccatca ggaaagcacc 4080

ccagacttcc tacaactact agacacatct cgatgctttt cacttctcta tcaatgggcg 4140

gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4200

tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4260

cgagcgagcg cgcagctgcc 4280

<210> 34

<211> 4767

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 34

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt tttctgattc aagacttctg gcttcagctt 2340

tgtacacaga gatgattcaa tgtcaggttt tggagtgaaa tctgtttaat cccagacaaa 2400

acatttagga ttacatctca gttttgtaag caagtagctc tgtgattttt agtgagttat 2460

ttaatgctct ttggggctca atttttctat ctataaaata gggctaataa tttgcacctt 2520

atagggtaag ctttgaggac agattagatg atacggtgcc tgtaaaacac caggtgttag 2580

taagtgtggc aatgatggtg acgctgaggc tgatgtttgc ttagcatagg gttaggcagc 2640

tggcaggcag taaacagttg gataatttaa tggaaaattt gccaaactca gatgctagca 2700

gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 2760

gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagct 2820

cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat tgcgatcgcc 2880

accatggcct ccaggctgac cctgctgacc ctcctgctgc tgctgctggc tggggataga 2940

gcctcctcaa atccaaatgc taccagctcc agctcccagg atccagagag tttgcaagac 3000

agaggcgaag ggaaggtcgc aacaacagtt atctccaaga tgctattcgt tgaacccatc 3060

ctggaggttt ccagcttgcc gacaaccaac tcaacaacca attcagccac caaaataaca 3120

gctaatacca ctgatgaacc caccacacaa cccaccacag agcccaccac ccaacccacc 3180

atccaaccca cccaaccaac tacccagctc ccaacagatt ctcctaccca gcccactact 3240

gggtccttct gcccaggacc tgttactctc tgctctgact tggagagtca ttcaacagag 3300

gccgtgttgg gggatgcttt ggtagatttc tccctgaagc tctaccacgc cttctcagca 3360

atgaagaagg tggagaccaa catggccttt tccccattca gcatcgccag cctccttacc 3420

caggtcctgc tcggggctgg ggagaacacc aaaacaaacc tggagagcat cctctcttac 3480

cccaaggact tcacctgtgt ccaccaggcc ctgaagggct tcacgaccaa aggtgtcacc 3540

tcagtctctc agatcttcca cagcccagac ctggccataa gggacacctt tgtgaatgcc 3600

tctcggaccc tgtacagcag cagccccaga gtcctaagca acaacagtga cgccaacttg 3660

gagctcatca acacctgggt ggccaagaac accaacaaca agatcagccg gctgctagac 3720

agtctgccct ccgatacccg ccttgtcctc ctcaatgcta tctacctgag tgccaagtgg 3780

aagacaacat ttgatcccaa gaaaaccaga atggaaccct ttcacttcaa aaactcagtt 3840

ataaaagtgc ccatgatgaa tagcaagaag taccctgtgg cccatttcat tgaccaaact 3900

ttgaaagcca aggtggggca gctgcagctc tcccacaatc tgagtttggt gatcctggta 3960

ccccagaacc tgaaacatcg tcttgaagac atggaacagg ctctcagccc ttctgttttc 4020

aaggccatca tggagaaact ggagatgtcc aagttccagc ccactctcct aacactaccc 4080

cgcatcaaag tgacgaccag ccaggatatg ctctcaatca tggagaaatt ggaattcttc 4140

gatttttctt atgaccttaa cctgtgtggg ctgacagagg acccagatct tcaggtttct 4200

gcgatgcagc accagacagt gctggaactg acagagactg gggtggaggc ggctgcagcc 4260

tccgccatct ctgtggcccg caccctgctg gtctttgaag tgcagcagcc cttcctcttc 4320

gtgctctggg accagcagca caagttccct gtcttcatgg ggcgagtata tgaccccagg 4380

gcctgagctc gagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 4440

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 4500

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 4560

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggac 4620

cggtgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4680

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4740

cagtgagcga gcgagcgcgc agctgcc 4767

<210> 35

<211> 4385

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 35

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt atgcctttca ctgcgagggg 900

ttctggagag gcttctgagc tccccatggc ccaggcaggc agcaggtctg gggcaggagg 960

ggggttgtgg agtgggtatc cgcctgctga ggtgcagggc agatggagag gctgcagctg 1020

agctcctatt ttcataataa cagcagccat gagggttgtg tcctgtttcc cagtcctgcc 1080

cggtcccccc tcggtacctc ctggtggata cactggttcc tgtaagcaga agtggatgag 1140

ggtgtctagg tctgcagtcc tggcacccca ggatggggga caccagccaa gatacagcaa 1200

cagcaacaaa gcgcagccat ttctttctgt ttgcacagct cctctgtctg tcgggggctc 1260

ctgtctgttg tctcctataa gcctcaccac ctctcctact gcttgggcat gcatctttct 1320

ccccttctat agatgaggag gttaaggtcc agagaggggt ggggaggaac gccggctcac 1380

attctccatc ccctccagat atgaccagga acagacctgt gccaggcctc agccttacat 1440

caaaatgggc ctccccatgc accgtggacc tctgggccct cctgtcccag tggaggacag 1500

gaagctatga ggggcactgt cacccagggc tcaagctggc attcctgaat aatcgctctg 1560

caccaggcca cggctaagct cagtgcgtga ttaagcctca taaccctcca aggcagttac 1620

tagtgtgatt cccattttac agatgaggaa gatggggaca gagaggtgaa taactggccc 1680

caaatcacac accatccata attcgggctc aggcacctgg ctccagtccc caaactcttg 1740

aacctggccc tagtgtcact gtttctcttg ggtctcaggc gctggatggg gaacaggaaa 1800

cctgggctgg acttgaggcc tctctgatgc tcggtgactt cagacagttg ctcaacctct 1860

ctgttctctt gggcaaaaca tgataacctt tgacttctgt cccctcccct caccccaccc 1920

gaccttgatc tctgaagtgt tggaaggatt taatttttcc tgcactgagt tttggagaca 1980

ggtcaaaaag atgaccaagg ccaaggtggc cagtttccta tagaacgcct ctaaaagacc 2040

tgcagcaata gcagcaagaa ctggtattct cgagaacttg ctgcgcagca ggcacttctt 2100

ggcattttat gtgtatttaa tttcacaata gctctatgac aaagtccacc tttctcatct 2160

ccaggaaact gaggttcaga gaggttaagt aacttgtcca aggtcacaca gctaatagca 2220

agttgacgtg gagcaatctg gcctcagagc ctttaatttt agccacagac tgatgctccc 2280

ctcttcattt agccaggctg cctctgaagt ttttagcagc tacaatccag ctaccattct 2340

gcttttattt tatggttggg ataaggctgg attattctga gtccaagcta ggcccttttg 2400

ctaatcatgt tcatacctct tatcttcctc ccacagctcc tgggcaacgt gctggtctgt 2460

gtgctggccc atcactttgg caaagaattg cgatcgccac catggcctcc aggctgaccc 2520

tgctgaccct cctgctgctg ctgctggctg gggatagagc ctcctcaaat ccaaatgcta 2580

ccagctccag ctcccaggat ccagagagtt tgcaagacag aggcgaaggg aaggtcgcaa 2640

caacagttat ctccaagatg ctattcgttg aacccatcct ggaggtttcc agcttgccga 2700

caaccaactc aacaaccaat tcagccacca aaataacagc taataccact gatgaaccca 2760

ccacacaacc caccacagag cccaccaccc aacccaccat ccaacccacc caaccaacta 2820

cccagctccc aacagattct cctacccagc ccactactgg gtccttctgc ccaggacctg 2880

ttactctctg ctctgacttg gagagtcatt caacagaggc cgtgttgggg gatgctttgg 2940

tagatttctc cctgaagctc taccacgcct tctcagcaat gaagaaggtg gagaccaaca 3000

tggccttttc cccattcagc atcgccagcc tccttaccca ggtcctgctc ggggctgggg 3060

agaacaccaa aacaaacctg gagagcatcc tctcttaccc caaggacttc acctgtgtcc 3120

accaggccct gaagggcttc acgaccaaag gtgtcacctc agtctctcag atcttccaca 3180

gcccagacct ggccataagg gacacctttg tgaatgcctc tcggaccctg tacagcagca 3240

gccccagagt cctaagcaac aacagtgacg ccaacttgga gctcatcaac acctgggtgg 3300

ccaagaacac caacaacaag atcagccggc tgctagacag tctgccctcc gatacccgcc 3360

ttgtcctcct caatgctatc tacctgagtg ccaagtggaa gacaacattt gatcccaaga 3420

aaaccagaat ggaacccttt cacttcaaaa actcagttat aaaagtgccc atgatgaata 3480

gcaagaagta ccctgtggcc catttcattg accaaacttt gaaagccaag gtggggcagc 3540

tgcagctctc ccacaatctg agtttggtga tcctggtacc ccagaacctg aaacatcgtc 3600

ttgaagacat ggaacaggct ctcagccctt ctgttttcaa ggccatcatg gagaaactgg 3660

agatgtccaa gttccagccc actctcctaa cactaccccg catcaaagtg acgaccagcc 3720

aggatatgct ctcaatcatg gagaaattgg aattcttcga tttttcttat gaccttaacc 3780

tgtgtgggct gacagaggac ccagatcttc aggtttctgc gatgcagcac cagacagtgc 3840

tggaactgac agagactggg gtggaggcgg ctgcagcctc cgccatctct gtggcccgca 3900

ccctgctggt ctttgaagtg cagcagccct tcctcttcgt gctctgggac cagcagcaca 3960

agttccctgt cttcatgggg cgagtatatg accccagggc ctgagctcga gctgtgcctt 4020

ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 4080

ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 4140

gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 4200

atagcaggca tgctggggat gcggtgggct ctatggaccg gtgcggccgc aggaacccct 4260

agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 4320

aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4380

ctgcc 4385

<210> 36

<211> 3765

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 36

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ttgattattg actagttatt aatagtaatc 180

aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 240

aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 300

tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg actatttacg 360

gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 420

cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 480

tcctacttgg cagtacatct acgtattagt catcgctatt aacatggtcg aggtgagccc 540

cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 600

tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggggggc gcgcgccagg 660

cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa 720

tcagagcggc gcgctccgaa agtttccttt tatggcgagg cggcggcggc ggcggcccta 780

taaaaagcga agcgcgcggc gggcggggag tcgctgcgac gctgccttcg ccccgtgccc 840

cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag 900

gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 960

cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 1020

ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 1080

tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 1140

agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg ggctgcgagg 1200

ggaacaaagg ctgcgtgcgg ggtgtgtgcg tgggggggtg agcagggggt gtgggcgcgg 1260

cggtcgggct gtaacccccc cctgcacccc cctccccgag ttgctgagca cggcccggct 1320

tcgggtgcgg ggctccgtgc ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg 1380

cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag 1440

gggcgcggcg gccccggagc gccggcggct gtcgaggcgc ggcgagccgc agccattgcc 1500

ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc tggcggagcc 1560

gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc gggcgaagcg gtgcggcgcc 1620

ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc 1680

catctccagc ctcggggctg ccgcaggggg acggctgcct tcggggggga cggggcaggg 1740

cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800

ccttcttctt tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt 1860

ttggcaaacc tgcaggccac catggcctcc aggctgaccc tgctgaccct cctgctgctg 1920

ctgctggctg gggatagagc ctcctcaaat ccaaatgcta ccagctccag ctcccaggat 1980

ccagagagtt tgcaagacag aggcgaaggg aaggtcgcaa caacagttat ctccaagatg 2040

ctattcgttg aacccatcct ggaggtttcc agcttgccga caaccaactc aacaaccaat 2100

tcagccacca aaataacagc taataccact gatgaaccca ccacacaacc caccacagag 2160

cccaccaccc aacccaccat ccaacccacc caaccaacta cccagctccc aacagattct 2220

cctacccagc ccactactgg gtccttctgc ccaggacctg ttactctctg ctctgacttg 2280

gagagtcatt caacagaggc cgtgttgggg gatgctttgg tagatttctc cctgaagctc 2340

taccacgcct tctcagcaat gaagaaggtg gagaccaaca tggccttttc cccattcagc 2400

atcgccagcc tccttaccca ggtcctgctc ggggctgggg agaacaccaa aacaaacctg 2460

gagagcatcc tctcttaccc caaggacttc acctgtgtcc accaggccct gaagggcttc 2520

acgaccaaag gtgtcacctc agtctctcag atcttccaca gcccagacct ggccataagg 2580

gacacctttg tgaatgcctc tcggaccctg tacagcagca gccccagagt cctaagcaac 2640

aacagtgacg ccaacttgga gctcatcaac acctgggtgg ccaagaacac caacaacaag 2700

atcagccggc tgctagacag tctgccctcc gatacccgcc ttgtcctcct caatgctatc 2760

tacctgagtg ccaagtggaa gacaacattt gatcccaaga aaaccagaat ggaacccttt 2820

cacttcaaaa actcagttat aaaagtgccc atgatgaata gcaagaagta ccctgtggcc 2880

catttcattg accaaacttt gaaagccaag gtggggcagc tgcagctctc ccacaatctg 2940

agtttggtga tcctggtacc ccagaacctg aaacatcgtc ttgaagacat ggaacaggct 3000

ctcagccctt ctgttttcaa ggccatcatg gagaaactgg agatgtccaa gttccagccc 3060

actctcctaa cactaccccg catcaaagtg acgaccagcc aggatatgct ctcaatcatg 3120

gagaaattgg aattcttcga tttttcttat gaccttaacc tgtgtgggct gacagaggac 3180

ccagatcttc aggtttctgc gatgcagcac cagacagtgc tggaactgac agagactggg 3240

gtggaggcgg ctgcagcctc cgccatctct gtggcccgca ccctgctggt ctttgaagtg 3300

cagcagccct tcctcttcgt gctctgggac cagcagcaca agttccctgt cttcatgggg 3360

cgagtatatg accccagggc ctgagctcga gctgtgcctt ctagttgcca gccatctgtt 3420

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3480

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3540

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3600

gcggtgggct ctatggaccg gtgcggccgc aggaacccct agtgatggag ttggccactc 3660

cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3720

gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcc 3765

<210> 37

<211> 736

<212> PRT

<213> 腺相关病毒9

<400> 37

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 38

<211> 736

<212> PRT

<213> 腺相关病毒Rh.8

<400> 38

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly

145 150 155 160

Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Pro Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp Asn

260 265 270

Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Thr Asn Glu Gly Thr Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn

370 375 380

Gly Ser Gln Ala Leu Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr

405 410 415

Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Val

435 440 445

Arg Thr Gln Thr Thr Gly Thr Gly Gly Thr Gln Thr Leu Ala Phe Ser

450 455 460

Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Arg Asn Trp Val Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Asn Gln Asn

485 490 495

Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Ala Lys Phe Lys Leu Asn

500 505 510

Gly Arg Asp Ser Leu Met Asn Pro Gly Val Ala Met Ala Ser His Lys

515 520 525

Asp Asp Asp Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile Phe Gly

530 535 540

Lys Gln Gly Ala Gly Asn Asp Gly Val Asp Tyr Ser Gln Val Leu Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Glu

565 570 575

Tyr Gly Ala Val Ala Ile Asn Asn Gln Ala Ala Asn Thr Gln Ala Gln

580 585 590

Thr Gly Leu Val His Asn Gln Gly Val Ile Pro Gly Met Val Trp Gln

595 600 605

Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Leu Thr Phe Asn Gln Ala Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 39

<211> 738

<212> PRT

<213> 腺相关病毒Rh.10

<400> 39

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro

180 185 190

Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser

210 215 220

Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp

260 265 270

Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn

275 280 285

Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn

290 295 300

Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn

305 310 315 320

Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala

325 330 335

Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln

340 345 350

Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe

355 360 365

Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn

370 375 380

Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr

385 390 395 400

Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr

405 410 415

Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser

420 425 430

Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu

435 440 445

Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu

450 455 460

Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met

530 535 540

Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val

545 550 555 560

Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr

565 570 575

Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala

580 585 590

Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val

595 600 605

Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile

610 615 620

Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe

625 630 635 640

Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val

645 650 655

Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe

660 665 670

Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu

675 680 685

Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr

690 695 700

Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp

705 710 715 720

Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg

725 730 735

Asn Leu

<210> 40

<211> 738

<212> PRT

<213> 腺相关病毒Rh.74

<400> 40

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro

180 185 190

Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser

210 215 220

Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp

260 265 270

Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn

275 280 285

Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn

290 295 300

Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn

305 310 315 320

Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala

325 330 335

Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln

340 345 350

Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe

355 360 365

Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn

370 375 380

Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr

385 390 395 400

Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr

405 410 415

Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser

420 425 430

Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu

435 440 445

Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu

450 455 460

Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met

530 535 540

Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val

545 550 555 560

Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr

565 570 575

Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala

580 585 590

Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val

595 600 605

Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile

610 615 620

Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe

625 630 635 640

Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val

645 650 655

Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe

660 665 670

Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu

675 680 685

Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr

690 695 700

Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu

705 710 715 720

Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg

725 730 735

Asn Leu

<210> 41

<211> 736

<212> PRT

<213> 腺相关病毒1

<400> 41

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 42

<211> 735

<212> PRT

<213> 腺相关病毒2

<400> 42

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn

485 490 495

Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr

580 585 590

Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 43

<211> 736

<212> PRT

<213> 腺相关病毒3

<400> 43

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly

130 135 140

Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 44

<211> 736

<212> PRT

<213> 腺相关病毒3B

<400> 44

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 45

<211> 734

<212> PRT

<213> 腺相关病毒4

<400> 45

Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu

1 5 10 15

Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys

20 25 30

Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val

50 55 60

Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln

65 70 75 80

Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu

115 120 125

Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro

130 135 140

Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys

145 150 155 160

Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr

165 170 175

Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser

180 185 190

Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly

195 200 205

Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys

210 215 220

Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr

225 230 235 240

Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu

245 250 255

Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu

305 310 315 320

Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp

325 330 335

Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser

340 345 350

Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr

355 360 365

Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn

370 375 380

Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser

405 410 415

Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile

420 425 430

Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu

435 440 445

Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn

450 455 460

Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln

465 470 475 480

Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr

485 490 495

Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly

500 505 510

Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro

515 520 525

Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys

530 535 540

Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser

545 550 555 560

Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly

565 570 575

Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp

580 585 590

Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg

595 600 605

Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp

610 615 620

Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His

625 630 635 640

Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro

645 650 655

Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr

660 665 670

Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu

675 680 685

Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly

690 695 700

Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr

705 710 715 720

Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu

725 730

<210> 46

<211> 724

<212> PRT

<213> 腺相关病毒5

<400> 46

Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 47

<211> 736

<212> PRT

<213> 腺相关病毒6

<400> 47

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly

145 150 155 160

Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His

260 265 270

Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe

275 280 285

His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn

290 295 300

Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln

305 310 315 320

Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn

325 330 335

Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro

340 345 350

Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala

355 360 365

Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly

370 375 380

Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro

385 390 395 400

Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe

405 410 415

Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp

420 425 430

Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg

435 440 445

Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser

450 455 460

Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn

485 490 495

Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn

500 505 510

Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys

515 520 525

Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly

530 535 540

Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg

565 570 575

Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala

580 585 590

Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn

690 695 700

Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu

705 710 715 720

Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

725 730 735

<210> 48

<211> 737

<212> PRT

<213> 腺相关病毒7

<400> 48

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro

180 185 190

Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn

210 215 220

Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn

260 265 270

Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn

370 375 380

Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser

405 410 415

Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala

435 440 445

Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln

450 455 460

Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile

530 535 540

Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu

545 550 555 560

Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu

565 570 575

Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala

580 585 590

Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp

595 600 605

Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro

610 615 620

His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly

625 630 635 640

Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro

645 650 655

Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile

660 665 670

Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu

675 680 685

Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser

690 695 700

Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly

705 710 715 720

Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn

725 730 735

Leu

<210> 49

<211> 738

<212> PRT

<213> 腺相关病毒8

<400> 49

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro

180 185 190

Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser

210 215 220

Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp

260 265 270

Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn

275 280 285

Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn

290 295 300

Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn

305 310 315 320

Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala

325 330 335

Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln

340 345 350

Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe

355 360 365

Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn

370 375 380

Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr

385 390 395 400

Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr

405 410 415

Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser

420 425 430

Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu

435 440 445

Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly

450 455 460

Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile

530 535 540

Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val

545 550 555 560

Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr

565 570 575

Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala

580 585 590

Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val

595 600 605

Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile

610 615 620

Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe

625 630 635 640

Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val

645 650 655

Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe

660 665 670

Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu

675 680 685

Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr

690 695 700

Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu

705 710 715 720

Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg

725 730 735

Asn Leu

<210> 50

<211> 738

<212> PRT

<213> 腺相关病毒10

<400> 50

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile

145 150 155 160

Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln

165 170 175

Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro

180 185 190

Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly

195 200 205

Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser

210 215 220

Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val

225 230 235 240

Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His

245 250 255

Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp

260 265 270

Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn

275 280 285

Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn

290 295 300

Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn

305 310 315 320

Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala

325 330 335

Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln

340 345 350

Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe

355 360 365

Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn

370 375 380

Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr

385 390 395 400

Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr

405 410 415

Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser

420 425 430

Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu

435 440 445

Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu

450 455 460

Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp

465 470 475 480

Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser

485 490 495

Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His

500 505 510

Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr

515 520 525

His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met

530 535 540

Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val

545 550 555 560

Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr

565 570 575

Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly

580 585 590

Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val

595 600 605

Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile

610 615 620

Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe

625 630 635 640

Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val

645 650 655

Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe

660 665 670

Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu

675 680 685

Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr

690 695 700

Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu

705 710 715 720

Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg

725 730 735

Asn Leu

<210> 51

<211> 733

<212> PRT

<213> 腺相关病毒11

<400> 51

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Leu Glu Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys

145 150 155 160

Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Glu Glu Asp Thr

165 170 175

Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Asp Thr Ser Ala Met Ser

180 185 190

Ser Asp Ile Glu Met Arg Ala Ala Pro Gly Gly Asn Ala Val Asp Ala

195 200 205

Gly Gln Gly Ser Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys

210 215 220

Asp Ser Thr Trp Ser Glu Gly Lys Val Thr Thr Thr Ser Thr Arg Thr

225 230 235 240

Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Leu Arg Leu Gly Thr

245 250 255

Thr Ser Ser Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Asn Trp Gly Leu Arg Pro Lys Ala Met Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu

305 310 315 320

Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp

325 330 335

Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser

340 345 350

Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr

355 360 365

Cys Gly Ile Val Thr Gly Glu Asn Gln Asn Gln Thr Asp Arg Asn Ala

370 375 380

Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Met Ala Tyr Asn Phe Glu Lys Val Pro Phe His Ser Met

405 410 415

Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Leu Asp

420 425 430

Gln Tyr Leu Trp His Leu Gln Ser Thr Thr Ser Gly Glu Thr Leu Asn

435 440 445

Gln Gly Asn Ala Ala Thr Thr Phe Gly Lys Ile Arg Ser Gly Asp Phe

450 455 460

Ala Phe Tyr Arg Lys Asn Trp Leu Pro Gly Pro Cys Val Lys Gln Gln

465 470 475 480

Arg Phe Ser Lys Thr Ala Ser Gln Asn Tyr Lys Ile Pro Ala Ser Gly

485 490 495

Gly Asn Ala Leu Leu Lys Tyr Asp Thr His Tyr Thr Leu Asn Asn Arg

500 505 510

Trp Ser Asn Ile Ala Pro Gly Pro Pro Met Ala Thr Ala Gly Pro Ser

515 520 525

Asp Gly Asp Phe Ser Asn Ala Gln Leu Ile Phe Pro Gly Pro Ser Val

530 535 540

Thr Gly Asn Thr Thr Thr Ser Ala Asn Asn Leu Leu Phe Thr Ser Glu

545 550 555 560

Glu Glu Ile Ala Ala Thr Asn Pro Arg Asp Thr Asp Met Phe Gly Gln

565 570 575

Ile Ala Asp Asn Asn Gln Asn Ala Thr Thr Ala Pro Ile Thr Gly Asn

580 585 590

Val Thr Ala Met Gly Val Leu Pro Gly Met Val Trp Gln Asn Arg Asp

595 600 605

Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Ala Asp Gly

610 615 620

His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His Pro

625 630 635 640

Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ala

645 650 655

Thr Thr Phe Thr Ala Ala Arg Val Asp Ser Phe Ile Thr Gln Tyr Ser

660 665 670

Thr Gly Gln Val Ala Val Gln Ile Glu Trp Glu Ile Glu Lys Glu Arg

675 680 685

Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly Asn

690 695 700

Gln Ser Ser Met Leu Trp Ala Pro Asp Thr Thr Gly Lys Tyr Thr Glu

705 710 715 720

Pro Arg Val Ile Gly Ser Arg Tyr Leu Thr Asn His Leu

725 730

<210> 52

<211> 742

<212> PRT

<213> 腺相关病毒12

<400> 52

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Lys Gln Leu Glu Gln Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Gln Arg Leu Ala Thr Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Leu Glu Lys Thr Pro Asn Arg Pro Thr Asn Pro Asp Ser Gly Lys

145 150 155 160

Ala Pro Ala Lys Lys Lys Gln Lys Asp Gly Glu Pro Ala Asp Ser Ala

165 170 175

Arg Arg Thr Leu Asp Phe Glu Asp Ser Gly Ala Gly Asp Gly Pro Pro

180 185 190

Glu Gly Ser Ser Ser Gly Glu Met Ser His Asp Ala Glu Met Arg Ala

195 200 205

Ala Pro Gly Gly Asn Ala Val Glu Ala Gly Gln Gly Ala Asp Gly Val

210 215 220

Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp Ser Glu Gly

225 230 235 240

Arg Val Thr Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Thr Tyr Asn

245 250 255

Asn His Leu Tyr Leu Arg Ile Gly Thr Thr Ala Asn Ser Asn Thr Tyr

260 265 270

Asn Gly Phe Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Leu Arg Pro Lys Ser Met Arg Val Lys Ile Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Thr Ser Asn Gly Glu Thr Thr Val Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Ile Phe Ala Asp Ser Thr Tyr Glu Leu Pro Tyr

340 345 350

Val Met Asp Ala Gly Gln Glu Gly Ser Phe Pro Pro Phe Pro Asn Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Cys Gly Val Val Thr Gly Lys

370 375 380

Asn Gln Asn Gln Thr Asp Arg Asn Ala Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Val Ser Tyr Gln

405 410 415

Phe Glu Lys Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Met Met Asn Pro Leu Leu Asp Gln Tyr Leu Trp His Leu Gln

435 440 445

Ser Thr Thr Thr Gly Asn Ser Leu Asn Gln Gly Thr Ala Thr Thr Thr

450 455 460

Tyr Gly Lys Ile Thr Thr Gly Asp Phe Ala Tyr Tyr Arg Lys Asn Trp

465 470 475 480

Leu Pro Gly Ala Cys Ile Lys Gln Gln Lys Phe Ser Lys Asn Ala Asn

485 490 495

Gln Asn Tyr Lys Ile Pro Ala Ser Gly Gly Asp Ala Leu Leu Lys Tyr

500 505 510

Asp Thr His Thr Thr Leu Asn Gly Arg Trp Ser Asn Met Ala Pro Gly

515 520 525

Pro Pro Met Ala Thr Ala Gly Ala Gly Asp Ser Asp Phe Ser Asn Ser

530 535 540

Gln Leu Ile Phe Ala Gly Pro Asn Pro Ser Gly Asn Thr Thr Thr Ser

545 550 555 560

Ser Asn Asn Leu Leu Phe Thr Ser Glu Glu Glu Ile Ala Thr Thr Asn

565 570 575

Pro Arg Asp Thr Asp Met Phe Gly Gln Ile Ala Asp Asn Asn Gln Asn

580 585 590

Ala Thr Thr Ala Pro His Ile Ala Asn Leu Asp Ala Met Gly Ile Val

595 600 605

Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Tyr Gln Gly Pro Ile

610 615 620

Trp Ala Lys Val Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu

625 630 635 640

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Phe Ile Lys

645 650 655

Asn Thr Pro Val Pro Ala Asn Pro Asn Thr Thr Phe Ser Ala Ala Arg

660 665 670

Ile Asn Ser Phe Leu Thr Gln Tyr Ser Thr Gly Gln Val Ala Val Gln

675 680 685

Ile Asp Trp Glu Ile Gln Lys Glu His Ser Lys Arg Trp Asn Pro Glu

690 695 700

Val Gln Phe Thr Ser Asn Tyr Gly Thr Gln Asn Ser Met Leu Trp Ala

705 710 715 720

Pro Asp Asn Ala Gly Asn Tyr His Glu Leu Arg Ala Ile Gly Ser Arg

725 730 735

Phe Leu Thr His His Leu

740

<210> 53

<211> 733

<212> PRT

<213> 腺相关病毒13

<400> 53

Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu

1 5 10 15

Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys

20 25 30

Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val

50 55 60

Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln

65 70 75 80

Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro Leu

115 120 125

Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro

130 135 140

Val Glu Gln Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys

145 150 155 160

Ser Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr Gly

165 170 175

Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro Ala

180 185 190

Ala Pro Ser Gly Val Gly Ser Thr Thr Met Ala Ser Gly Gly Gly Ala

195 200 205

Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser Ser

210 215 220

Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr

225 230 235 240

Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr

245 250 255

Lys Gln Ile Ser Ser Gln Ser Gly Ala Thr Asn Asp Asn His Tyr Phe

260 265 270

Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys

275 280 285

His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly

290 295 300

Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys

305 310 315 320

Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr

325 330 335

Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val

340 345 350

Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val

355 360 365

Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln

370 375 380

Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln

385 390 395 400

Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu Asp

405 410 415

Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu

420 425 430

Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln

435 440 445

Thr Ala Ser Gly Thr Gln Gln Ser Arg Leu Leu Phe Ser Gln Ala Gly

450 455 460

Pro Thr Ser Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys

465 470 475 480

Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn Asn Ser

485 490 495

Asn Phe Pro Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp

500 505 510

Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Lys

515 520 525

Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys Glu Gly

530 535 540

Thr Asn Ala Asn Asn Ala Asp Leu Glu Asn Val Met Ile Thr Asp Glu

545 550 555 560

Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Thr

565 570 575

Val Ser Asn Asn Leu Gln Asn Ser Asn Ala Gly Pro Thr Thr Gly Thr

580 585 590

Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp Arg Asp

595 600 605

Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly

610 615 620

His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro

625 630 635 640

Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro

645 650 655

Thr Asn Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser

660 665 670

Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn

675 680 685

Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys

690 695 700

Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu

705 710 715 720

Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730

<210> 54

<211> 130

<212> DNA

<213> Adeno-Associated Virus

<400> 54

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 55

<211> 130

<212> DNA

<213> Adeno-Associated Virus

<400> 55

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag 130

<210> 56

<211> 742

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 56

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Leu Glu Lys Thr Pro Asn Arg Pro Thr Asn Pro Asp Ser Gly Lys

145 150 155 160

Ala Pro Ala Lys Lys Lys Gln Lys Asp Gly Glu Thr Ala Asp Ser Ala

165 170 175

Arg Arg Thr Leu Asp Phe Glu Asp Ser Gly Ala Gly Asp Gly Pro Pro

180 185 190

Glu Gly Ser Ser Ser Gly Glu Met Ser His Asp Ala Glu Met Arg Ala

195 200 205

Ala Pro Gly Gly Asn Ala Val Glu Ala Gly Gln Gly Ala Asp Gly Val

210 215 220

Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp Ser Glu Gly

225 230 235 240

Arg Val Thr Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Thr Tyr Asn

245 250 255

Asn His Leu Tyr Leu Arg Ile Gly Thr Thr Ala Asn Ser Asn Thr Tyr

260 265 270

Asn Gly Phe Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Leu Arg Pro Lys Ser Met Arg Val Lys Ile Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Thr Ser Asn Gly Glu Thr Thr Val Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Ile Phe Ala Asp Ser Thr Tyr Glu Leu Pro Tyr

340 345 350

Val Met Asp Ala Gly Gln Glu Gly Ser Leu Pro Pro Phe Pro Asn Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Cys Gly Val Val Thr Gly Glu

370 375 380

Asn Gln Asn Gln Thr Asp Arg Asn Ala Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Ile Ser Tyr Gln

405 410 415

Phe Glu Lys Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Met Met Asn Pro Leu Leu Asp Gln Tyr Leu Trp His Leu Gln

435 440 445

Ser Thr Thr Thr Gly Asn Ser Leu Asn Gln Gly Thr Ala Ile Thr Thr

450 455 460

Tyr Gly Lys Ile Thr Thr Gly Asp Phe Ala Tyr Tyr Arg Lys Asn Trp

465 470 475 480

Leu Pro Gly Ala Gly Ile Lys Gln Gln Lys Phe Ser Lys Asn Ala Ser

485 490 495

Gln Asn Tyr Lys Ile Pro Ala Ser Gly Gly Asp Ala Leu Leu Lys Tyr

500 505 510

Asp Thr His Thr Thr Leu Asn Gly Arg Trp Ser Asn Met Ala Pro Gly

515 520 525

Pro Pro Met Ala Thr Ala Gly Ala Gly Asp Ser Asp Phe Ser Asn Ser

530 535 540

Gln Leu Ile Phe Ala Gly Pro Asn Gln Ser Gly Asn Thr Thr Thr Ser

545 550 555 560

Ser Asn Asn Leu Leu Phe Thr Ser Glu Glu Glu Ile Ala Thr Thr Asn

565 570 575

Pro Arg Asp Thr Asp Met Phe Gly Gln Ile Ala Asp Asn Asn Gln Asn

580 585 590

Ala Thr Thr Ala Pro His Ile Ala Asn Leu Asp Ala Met Gly Ile Val

595 600 605

Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Tyr Gln Gly Pro Ile

610 615 620

Trp Ala Lys Val Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu

625 630 635 640

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Phe Ile Lys

645 650 655

Asn Thr Pro Val Pro Ala Asn Pro Asn Thr Thr Phe Ser Ala Ala Arg

660 665 670

Ile Asn Ser Phe Leu Thr Gln Tyr Ser Thr Gly Gln Val Ala Val Gln

675 680 685

Ile Asp Trp Glu Ile Gln Lys Glu His Ser Lys Arg Trp Asn Pro Glu

690 695 700

Val Gln Phe Thr Ser Asn Tyr Gly Thr Gln Asn Ser Met Leu Trp Ala

705 710 715 720

Pro Asp Asn Ala Gly Asn Tyr His Glu Pro Arg Ala Ile Gly Ser Arg

725 730 735

Phe Leu Thr His His Leu

740

<210> 57

<211> 2954

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 57

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt actagcagct acaatccagc 900

taccattctg cttttatttt atggttggga taaggctgga ttattctgag tccaagctag 960

gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctcct gggcaacgtg 1020

ctggtctgtg tgctggccca tcactttggc aaagaattgc gatcgccacc atggcctcca 1080

ggctgaccct gctgaccctc ctgctgctgc tgctggctgg ggatagagcc tcctcaaatc 1140

caaatgctac cagctccagc tcccaggatc cagagagttt gcaagacaga ggcgaaggga 1200

aggtcgcaac aacagttatc tccaagatgc tattcgttga acccatcctg gaggtttcca 1260

gcttgccgac aaccaactca acaaccaatt cagccaccaa aataacagct aataccactg 1320

atgaacccac cacacaaccc accacagagc ccaccaccca acccaccatc caacccaccc 1380

aaccaactac ccagctccca acagattctc ctacccagcc cactactggg tccttctgcc 1440

caggacctgt tactctctgc tctgacttgg agagtcattc aacagaggcc gtgttggggg 1500

atgctttggt agatttctcc ctgaagctct accacgcctt ctcagcaatg aagaaggtgg 1560

agaccaacat ggccttttcc ccattcagca tcgccagcct ccttacccag gtcctgctcg 1620

gggctgggga gaacaccaaa acaaacctgg agagcatcct ctcttacccc aaggacttca 1680

cctgtgtcca ccaggccctg aagggcttca cgaccaaagg tgtcacctca gtctctcaga 1740

tcttccacag cccagacctg gccataaggg acacctttgt gaatgcctct cggaccctgt 1800

acagcagcag ccccagagtc ctaagcaaca acagtgacgc caacttggag ctcatcaaca 1860

cctgggtggc caagaacacc aacaacaaga tcagccggct gctagacagt ctgccctccg 1920

atacccgcct tgtcctcctc aatgctatct acctgagtgc caagtggaag acaacatttg 1980

atcccaagaa aaccagaatg gaaccctttc acttcaaaaa ctcagttata aaagtgccca 2040

tgatgaatag caagaagtac cctgtggccc atttcattga ccaaactttg aaagccaagg 2100

tggggcagct gcagctctcc cacaatctga gtttggtgat cctggtaccc cagaacctga 2160

aacatcgtct tgaagacatg gaacaggctc tcagcccttc tgttttcaag gccatcatgg 2220

agaaactgga gatgtccaag ttccagccca ctctcctaac actaccccgc atcaaagtga 2280

cgaccagcca ggatatgctc tcaatcatgg agaaattgga attcttcgat ttttcttatg 2340

accttaacct gtgtgggctg acagaggacc cagatcttca ggtttctgcg atgcagcacc 2400

agacagtgct ggaactgaca gagactgggg tggaggcggc tgcagcctcc gccatctctg 2460

tggcccgcac cctgctggtc tttgaagtgc agcagccctt cctcttcgtg ctctgggacc 2520

agcagcacaa gttccctgtc ttcatggggc gagtatatga ccccagggcc tgagctcgag 2580

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2640

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2700

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2760

gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggaccgg tgcggccgca 2820

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 2880

cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 2940

agcgcgcagc tgcc 2954

<210> 58

<211> 3853

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 58

ggcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg cgtcgggcga 60

cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120

tcactagggg ttcctgcggc cgcacgcgta ggctcagagg cacacaggag tttctgggct 180

caccctgccc ccttccaacc cctcagttcc catcctccag cagctgtttg tgtgctgcct 240

ctgaagtcca cactgaacaa acttcagcct actcatgtcc ctaaaatggg caaacattgc 300

aagcagcaaa cagcaaacac acagccctcc ctgcctgctg accttggagc tggggcagag 360

gtcagagacc tctctgggcc catgccacct ccaacatcca ctcgacccct tggaatttcg 420

gtggagagga gcagaggttg tcctggcgtg gtttaggtag tgtgagaggg gtcgacgatc 480

ttgctaccag tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg 540

gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg 600

tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc 660

ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc 720

ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 780

cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 840

ttcaggcacc accactgacc tgggacagtg aatcgtaagt actagcagct acaatccagc 900

taccattctg cttttatttt atggttggga taaggctgga ttattctgag tccaagctag 960

gcccttttgc taatcatgtt catacctctt atcttcctcc cacagctcct gggcaacgtg 1020

ctggtctgtg tgctggccca tcactttggc aaagaattgc gatcgccacc atggcctcca 1080

ggctgaccct gctgaccctc ctgctgctgc tgctggctgg ggatagagcc tcctcaaatc 1140

caaatgctac cagctccagc tcccaggatc cagagagttt gcaagacaga ggcgaaggga 1200

aggtcgcaac aacagttatc tccaagatgc tattcgttga acccatcctg gaggtttcca 1260

gcttgccgac aaccaactca acaaccaatt cagccaccaa aataacagct aataccactg 1320

atgaacccac cacacaaccc accacagagc ccaccaccca acccaccatc caacccaccc 1380

aaccaactac ccagctccca acagattctc ctacccagcc cactactggg tccttctgcc 1440

caggacctgt tactctctgc tctgacttgg agagtcattc aacagaggcc gtgttggggg 1500

atgctttggt agatttctcc ctgaagctct accacgcctt ctcagcaatg aagaaggtgg 1560

agaccaacat ggccttttcc ccattcagca tcgccagcct ccttacccag gtcctgctcg 1620

gggctgggga gaacaccaaa acaaacctgg agagcatcct ctcttacccc aaggacttca 1680

cctgtgtcca ccaggccctg aagggcttca cgaccaaagg tgtcacctca gtctctcaga 1740

tcttccacag cccagacctg gccataaggg acacctttgt gaatgcctct cggaccctgt 1800

acagcagcag ccccagagtc ctaagcaaca acagtgacgc caacttggag ctcatcaaca 1860

cctgggtggc caagaacacc aacaacaaga tcagccggct gctagacagt ctgccctccg 1920

atacccgcct tgtcctcctc aatgctatct acctgagtgc caagtggaag acaacatttg 1980

atcccaagaa aaccagaatg gaaccctttc acttcaaaaa ctcagttata aaagtgccca 2040

tgatgaatag caagaagtac cctgtggccc atttcattga ccaaactttg aaagccaagg 2100

tggggcagct gcagctctcc cacaatctga gtttggtgat cctggtaccc cagaacctga 2160

aacatcgtct tgaagacatg gaacaggctc tcagcccttc tgttttcaag gccatcatgg 2220

agaaactgga gatgtccaag ttccagccca ctctcctaac actaccccgc atcaaagtga 2280

cgaccagcca ggatatgctc tcaatcatgg agaaattgga attcttcgat ttttcttatg 2340

accttaacct gtgtgggctg acagaggacc cagatcttca ggtttctgcg atgcagcacc 2400

agacagtgct ggaactgaca gagactgggg tggaggcggc tgcagcctcc gccatctctg 2460

tggcccgcac cctgctggtc tttgaagtgc agcagccctt cctcttcgtg ctctgggacc 2520

agcagcacaa gttccctgtc ttcatggggc gagtatatga ccccagggcc tgacctcgag 2580

cctgcccggg tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc 2640

cactccagtg cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta 2700

ggtgtccttc tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg 2760

gaagacaacc tgtagggcct gcggggtcta ttgggaacca agctggagtg cagtggcaca 2820

atcttggctc actgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagcctcc 2880

cgagttgttg ggattccagg catgcatgac caggctcagc taatttttgt ttttttggta 2940

gagacggggt ttcaccatat tggccaggct ggtctccaac tcctaatctc aggtgatcta 3000

cccaccttgg cctcccaaat tgctgggatt acaggcgtga accactgctc ccttccctgt 3060

ccttctgatt ttaaaataac tataccagca ggaggacgtc cagacacagc ataggctacc 3120

tggccatgcc caaccggtgg gacatttgag ttgcttgctt ggcactgtcc tctcatgcgt 3180

tgggtccact cagtagatgc ctgttgaatt cctgggccta gggctgtgcc agctgcctcg 3240

tcccgtcacc ttctggcttc ttctctccct ccatatctta gctgttttcc tcatgagaat 3300

gttccaaatt cgaaatttct atttaaccat tatatattta cttgtttgct attatctctg 3360

cccccagtag attgttagct ccagaagaga aaggatcatg tcttttgctt atctagatat 3420

gcccatctgc ctggtacaat ctctggcaca tgttacaggc aacaactact tgtggaattg 3480

gtgaatgcat gaatagaaga atgagtgaat gaatgaatag acaaaaggca gaaatccagc 3540

ctcaaagagc ttacagtctg gtaagaggaa taaaatgtct gcaaatagcc acaggacagg 3600

tcaaaggaag gaggggctat ttccagctga gggcacccca tcaggaaagc accccagact 3660

tcctacaact actagacaca tctcgatgct tttcacttct ctatcaatgg gcggccgcag 3720

gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 3780

gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 3840

gcgcgcagct gcc 3853

<210> 59

<211> 1508

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 59

atggccagca ggctcactct gctgactctg ctgctgctgc tgctggctgg ggacagggcc 60

agcagcaacc ccaatgccac cagcagcagc agccaggacc ctgagagcct ccaggacagg 120

ggggagggca aggtggccac cactgtgatc agcaagatgc tgtttgtgga gcccatcctg 180

gaggtcagca gcctgcccac caccaacagc accaccaact ctgccaccaa gatcactgcc 240

aacactactg atgaacccac tacccaaccc accactgagc ccaccactca gcccactatc 300

cagcccaccc agcccaccac ccagctgccc actgacagcc ccacccagcc caccactggc 360

agcttctgcc ctggccctgt gactctgtgc agtgatctgg agagccacag cactgaggct 420

gtgctggggg atgccctggt ggacttcagc ctgaagctgt accacgcctt cagtgctatg 480

aagaaggtgg agaccaatat ggccttcagc cccttcagta ttgccagcct gctgactcag 540

gtgctgctgg gggctgggga gaacactaag accaacctgg agagtatcct gagctacccc 600

aaggacttca cttgtgtgca ccaggccctg aagggcttca ctaccaaggg ggtcactagt 660

gtgagccaga tcttccacag ccctgatctg gccatcaggg acacttttgt gaatgccagc 720

aggaccctgt acagcagcag ccccagggtg ctgagcaaca acagtgatgc caacctggag 780

ctgatcaata cctgggtggc caagaatacc aacaacaaga tcagcaggct gctggacagc 840

ctgcccagtg ataccaggct ggtgctgctg aatgctatct acctgagtgc caagtggaag 900

accacctttg atcccaagaa gaccaggatg gagcccttcc acttcaagaa cagtgtgatc 960

aaggtgccca tgatgaacag caagaagtac cctgtggccc acttcattga tcagaccctg 1020

aaggccaagg tgggccagct gcagctgagc cacaacctga gcctggtcat cctggtgccc 1080

cagaacctga agcacaggct ggaggatatg gagcaggccc tgagccccag tgtgttcaag 1140

gctattatgg agaagctcga aatgagcaag ttccagccca ccctgctgac tctgcccagg 1200

atcaaggtca ctaccagcca ggatatgctg tctattatgg agaaactgga gttctttgac 1260

ttcagctatg atctgaacct gtgtgggctg actgaggacc ctgatctgca agtgagtgcc 1320

atgcagcacc agactgtgct ggagctgact gagactgggg tggaggctgc tgctgctagt 1380

gccatcagtg tggccaggac cctgctggtc tttgaggtgc agcagccctt cctgtttgtg 1440

ctgtgggacc agcagcacaa gttccctgtg ttcatgggca gggtctatga tcccagggcc 1500

taacctcg 1508

<210> 60

<211> 1508

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 60

atggccagcc gcctgaccct gctgaccctg ctgctgctgc tgctggccgg cgaccgcgcc 60

agcagcaacc ccaacgccac cagcagcagc agccaggacc ccgagagcct gcaggaccgc 120

ggcgagggca aggtggccac caccgtgatc agcaagatgc tgttcgtgga gcccatcctg 180

gaggtgagca gcctgcccac caccaacagc accaccaaca gcgccaccaa gatcaccgcc 240

aacaccaccg acgagcccac cacccagccc accaccgagc ccaccaccca gcccaccatc 300

cagcccaccc agcccaccac ccagctgccc accgacagcc ccacccagcc caccaccggc 360

agcttctgcc ccggccccgt gaccctgtgc agcgacctgg agagccacag caccgaggcc 420

gtgctgggcg acgccctggt ggacttcagc ctgaagctgt accacgcctt cagcgccatg 480

aagaaggtgg agaccaacat ggccttcagc cccttcagca tcgccagcct gctgacccag 540

gtgctgctgg gcgccggcga gaacaccaag accaacctgg agagcatcct gagctacccc 600

aaggacttca cctgcgtgca ccaggccctg aagggcttca ccaccaaggg cgtgaccagc 660

gtgagccaga tcttccacag ccccgacctg gccatccgcg acaccttcgt gaacgccagc 720

cgcaccctgt acagcagcag cccccgcgtg ctgagcaaca acagcgacgc caacctggag 780

ctgatcaaca cctgggtggc caagaacacc aacaacaaga tcagccgcct gctggacagc 840

ctgcccagcg acacccgcct ggtgctgctg aacgccatct acctgagcgc caagtggaag 900

accaccttcg accccaagaa gacccgcatg gagcccttcc acttcaagaa cagcgtgatc 960

aaggtgccca tgatgaacag caagaagtac cccgtggccc acttcatcga ccagaccctg 1020

aaggccaagg tgggccagct gcagctgagc cacaacctga gcctggtgat cctggtgccc 1080

cagaacctga agcaccgcct ggaggacatg gagcaggccc tgagccccag cgtgttcaag 1140

gccatcatgg agaagctgga gatgagcaag ttccagccca ccctgctgac cctgccccgc 1200

atcaaggtga ccaccagcca ggacatgctg agcatcatgg agaagctgga gttcttcgac 1260

ttcagctacg acctgaacct gtgcgggctg accgaggacc ccgacctgca ggtgagcgcc 1320

atgcagcacc agaccgtgct ggagctgacc gagaccggcg tggaggccgc cgccgccagc 1380

gccatcagcg tggcccgcac cctgctggtg ttcgaggtgc agcagccctt cctgttcgtg 1440

ctgtgggacc agcagcacaa gttccccgtg ttcatgggcc gcgtgtacga cccccgcgcc 1500

taacctcg 1508

<210> 61

<211> 196

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 61

gtaagtacta gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag 60

gctggattat tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct 120

tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag 180

aattgcgatc gccacc 196

<210> 62

<211> 317

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 62

gtaagtatgc ctttcactgc gaggggttct ggagaggctt agcagctaca atccagctac 60

cattctgctt ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc 120

cttttgctaa tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg 180

gtctgtgtgc tggcccatca ctttggcaaa gaattgcgat cgccaccatg ttcatgcctt 240

cttctttttc ctacagctcc tgggcaacgt gctggttgtt gtgctgtctc atcattttgg 300

caaacctgca ggccacc 317

<210> 63

<211> 376

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 63

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagta gcagctacaa tccagctacc 120

attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 180

ttttgctaat catgttcata cctcttatct tcctcccaca gctcctgggc aacgtgctgg 240

tctgtgtgct ggcccatcac tttggcaaag aattgcgatc gccaccatgt tcatgccttc 300

ttctttttcc tacagctcct gggcaacgtg ctggttgttg tgctgtctca tcattttggc 360

aaacctgcag gccacc 376

<210> 64

<211> 435

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 64

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat ggagaggctg cagctgagct cctattttca taataacagc agccatgagg 180

gttgtgtcct gtttcccagt cctgcccggt cccccctcgg tacctcctgg tggatacact 240

ggttcctgta agcagaagtg gatgagggtg tctaggtctg cagtcctggc accccaggat 300

gggggacacc agccaagata cagcaacagc aacaaagcgc agccatttct ttctgtttgc 360

acagctcctc tgtctgtcgg gggctcctgt ctgttgtctc ctataagcct caccacctct 420

cctactgctt gggca 435

<210> 65

<211> 864

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 65

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat ggagaggctg cagctgagct cctattttca taataacagc agccatgagg 180

gttgtgtcct gtttcccagt cctgcccggt cccccctcgg tacctcctgg tggatacact 240

ggttcctgta agcagaagtg gatgagggtg tctaggtctg cagtcctggc accccaggat 300

gggggacacc agccaagata cagcaacagc aacaaagcgc agccatttct ttctgtttgc 360

acagctcctc tgtctgtcgg gggctcctgt ctgttgtctc ctataagcct caccacctct 420

cctactgctt gggcatgcat ctttctcccc ttctatagat gaggaggtta aggtccagag 480

aggggtgggg aggaacgccg gctcacattc tccatcccct ccagatatga ccaggaacag 540

acctgtgcca ggcctcagcc ttacatcaaa atgggcctcc ccatgcaccg tggacctctg 600

ggccctcctg tcccagtgga ggacaggaag ctatgagggg cactgtcacc cagggctcaa 660

gctggcattc ctgaataatc gctctgcacc aggccacggc taagctcagt gcgtgattaa 720

gcctcataac cctccaaggc agttactagt gtgattccca ttttacagat gaggaagatg 780

gggacagaga ggtgaataac tggccccaaa tcacacacca tccataattc gggctcaggc 840

acctggctcc agtccccaaa ctct 864

<210> 66

<211> 1439

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 66

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat ggagaggctg cagctgagct cctattttca taataacagc agccatgagg 180

gttgtgtcct gtttcccagt cctgcccggt cccccctcgg tacctcctgg tggatacact 240

ggttcctgta agcagaagtg gatgagggtg tctaggtctg cagtcctggc accccaggat 300

gggggacacc agccaagata cagcaacagc aacaaagcgc agccatttct ttctgtttgc 360

acagctcctc tgtctgtcgg gggctcctgt ctgttgtctc ctataagcct caccacctct 420

cctactgctt gggcatgcat ctttctcccc ttctatagat gaggaggtta aggtccagag 480

aggggtgggg aggaacgccg gctcacattc tccatcccct ccagatatga ccaggaacag 540

acctgtgcca ggcctcagcc ttacatcaaa atgggcctcc ccatgcaccg tggacctctg 600

ggccctcctg tcccagtgga ggacaggaag ctatgagggg cactgtcacc cagggctcaa 660

gctggcattc ctgaataatc gctctgcacc aggccacggc taagctcagt gcgtgattaa 720

gcctcataac cctccaaggc agttactagt gtgattccca ttttacagat gaggaagatg 780

gggacagaga ggtgaataac tggccccaaa tcacacacca tccataattc gggctcaggc 840

acctggctcc agtccccaaa ctcttgaacc tggccctagt gtcactgttt ctcttgggtc 900

tcaggcgctg gatggggaac aggaaacctg ggctggactt gaggcctctc tgatgctcgg 960

tgacttcaga cagttgctca acctctctgt tctcttgggc aaaacatgat aacctttgac 1020

ttctgtcccc tcccctcacc ccacccgacc ttgatctctg aagtgttgga aggatttaat 1080

ttttcctgca ctgagttttg gagacaggtc aaaaagatga ccaaggccaa ggtggccagt 1140

ttcctataga acgcctctaa aagacctgca gcaatagcag caagaactgg tattctcgag 1200

aacttgctgc gcagcaggca cttcttggca ttttatgtgt atttaatttc acaatagctc 1260

tatgacaaag tccacctttc tcatctccag gaaactgagg ttcagagagg ttaagtaact 1320

tgtccaaggt cacacagcta atagcaagtt gacgtggagc aatctggcct cagagccttt 1380

aattttagcc acagactgat gctcccctct tcatttagcc aggctgcctc tgaagtttt 1439

<210> 67

<211> 1821

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 67

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat ggagaggctg cagctgagct cctattttca taataacagc agccatgagg 180

gttgtgtcct gtttcccagt cctgcccggt cccccctcgg tacctcctgg tggatacact 240

ggttcctgta agcagaagtg gatgagggtg tctaggtctg cagtcctggc accccaggat 300

gggggacacc agccaagata cagcaacagc aacaaagcgc agccatttct ttctgtttgc 360

acagctcctc tgtctgtcgg gggctcctgt ctgttgtctc ctataagcct caccacctct 420

cctactgctt gggcatgcat ctttctcccc ttctatagat gaggaggtta aggtccagag 480

aggggtgggg aggaacgccg gctcacattc tccatcccct ccagatatga ccaggaacag 540

acctgtgcca ggcctcagcc ttacatcaaa atgggcctcc ccatgcaccg tggacctctg 600

ggccctcctg tcccagtgga ggacaggaag ctatgagggg cactgtcacc cagggctcaa 660

gctggcattc ctgaataatc gctctgcacc aggccacggc taagctcagt gcgtgattaa 720

gcctcataac cctccaaggc agttactagt gtgattccca ttttacagat gaggaagatg 780

gggacagaga ggtgaataac tggccccaaa tcacacacca tccataattc gggctcaggc 840

acctggctcc agtccccaaa ctcttgaacc tggccctagt gtcactgttt ctcttgggtc 900

tcaggcgctg gatggggaac aggaaacctg ggctggactt gaggcctctc tgatgctcgg 960

tgacttcaga cagttgctca acctctctgt tctcttgggc aaaacatgat aacctttgac 1020

ttctgtcccc tcccctcacc ccacccgacc ttgatctctg aagtgttgga aggatttaat 1080

ttttcctgca ctgagttttg gagacaggtc aaaaagatga ccaaggccaa ggtggccagt 1140

ttcctataga acgcctctaa aagacctgca gcaatagcag caagaactgg tattctcgag 1200

aacttgctgc gcagcaggca cttcttggca ttttatgtgt atttaatttc acaatagctc 1260

tatgacaaag tccacctttc tcatctccag gaaactgagg ttcagagagg ttaagtaact 1320

tgtccaaggt cacacagcta atagcaagtt gacgtggagc aatctggcct cagagccttt 1380

aattttagcc acagactgat gctcccctct tcatttagcc aggctgcctc tgaagttttc 1440

tgattcaaga cttctggctt cagctttgta cacagagatg attcaatgtc aggttttgga 1500

gtgaaatctg tttaatccca gacaaaacat ttaggattac atctcagttt tgtaagcaag 1560

tagctctgtg atttttagtg agttatttaa tgctctttgg ggctcaattt ttctatctat 1620

aaaatagggc taataatttg caccttatag ggtaagcttt gaggacagat tagatgatac 1680

ggtgcctgta aaacaccagg tgttagtaag tgtggcaatg atggtgacgc tgaggctgat 1740

gtttgcttag catagggtta ggcagctggc aggcagtaaa cagttggata atttaatgga 1800

aaatttgcca aactcagatg c 1821

<210> 68

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 68

gtaagtatgc ctttcactgc gagaggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggagtg ggtatccgcc tgctgaggtg 120

cagggcagat 130

<210> 69

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 69

gtaagtatgc ctttcactgc gaggggttct ggagaggctt ctgagctccc catggcccag 60

gcaggcagca ggtctggggc aggagggggg ttgtggag 98

<210> 70

<211> 123

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 70

tagcagctac aatccagcta ccattctgct tttattttat ggttgggata aggctggatt 60

attctgagtc caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca 120

cag 123

<210> 71

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 71

ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga att 53

<210> 72

<211> 131

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 72

catcatgtgc cttgactcgg ggcctggccc ccccatctct gtcttgcagg acaattgccg 60

tcttctgtct cgtggggcat cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc 120

ctggctgagg a 131

技术分类

06120114713218