掌桥专利:专业的专利平台
掌桥专利
首页

肝特异性的病毒启动子及使用其的方法

文献发布时间:2023-06-19 12:24:27



技术领域

本文描述了在肝中特异或优先发挥作用的启动子。本文还公开了包括肝特异性的启动子的腺相关病毒(AAV)基因治疗载体、包括肝特异性的启动子的治疗剂、及其使用方法。

背景技术

提供以下讨论以帮助读者理解本公开,并且不承认描述或构成其现有技术。

对肝摄取用于基因治疗的DNA分子和载体(如病毒载体)的研究表明,肝具有很高的从循环中摄取这些的能力。事实上,熟知的是,用于基因治疗的许多病毒载体,包括腺相关病毒(AAV)载体,可以有效地在肝中被摄取,因此与其他器官相比,该器官相对容易被靶向。

此外,因为肝在血清蛋白的代谢和产生中发挥着核心作用,其一直是基因治疗的靶器官。目前对肝导向的AAV基因治疗产品开发的热情很大程度上源于血友病B领域的临床前的成功和临床成功。对血友病A和B经典小鼠和狗模型的大量研究已经证明了载体,包括AAV载体(其编码相关凝血因子,用运输到肝的载体进行基因表达)施用的令人信服的结果。最近在人体临床试验中也显示了成功。

然而,靶向肝仍然不是绝对精确的,脱靶递送和表达可能导致疗效降低或并发症。因此,本领域需要开发强力的肝特异性的启动子,其将在肝中充分且特异性地或优先地表达感兴趣的编码基因。本公开满足了这种需要。

发明内容

本文描述了肝特异性启动子、包含启动子的腺相关病毒(AAV)基因治疗载体和治疗剂,及使用它们的方法和药盒。

因此,根据一些实施方案,提供了至少包含三个选自以下的启动子衍生的核酸的合成多核苷酸或其变体:(a)HNF1/HNF3(SEQ ID NO:1);(b)HNF3/HNF3(SEQ ID NO:2);(c)c/EBP/HNF4(SEQ ID NO:3);(d)HS_CRM2/HNF3(SEQ ID NO:4);和(e)HS_CRM8(SEQ ID NO:6)。在一些实施方案中,合成多核苷酸至少包含SEQ ID NO:3和SEQ ID NO:6或其变体或衍生物。

在一些实施方案中,HS_CRM8序列的变体可以选自SEQ ID NO:5、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ IDNO:99、和SEQ ID NO:100。

在一些实施方案中,合成多核苷酸可能至少包含四个启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含五个启动子衍生的核酸(a)-(e)。在一些实施方案中,合成多核苷酸与包含五个启动子衍生的核酸(a)-(e)的合成多核苷酸具有至少90%的相同性。

根据一些实施方案,提供了与至少包含三个选自以下的启动子衍生的核酸的合成多核苷酸具有至少90%的相同性的合成多核苷酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQ ID NO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);及HS_CRM8(SEQ ID NO:6)。

在一些实施方案中,合成多核苷酸从5’到3’连续包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:6。

在一些实施方案中,合成多核苷酸还至少包含一个最小启动子核酸。在一些实施方案中,最小启动子核酸的序列衍生自SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ ID NO:10)或者与SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)或G6PC(SEQ ID NO:10)具有至少90%的序列相同性的最小启动子核酸。在一些实施方案中,最小启动子核酸包含选自以下的序列:SEQ ID NO:7、8、9和10。

在一些实施方案中,至少一个启动子衍生的核酸的方向是倒位(inverted)的。

在一些实施方案中,合成多核苷酸是上述合成多核苷酸中任何一个的反向互补。

在一些实施方案中,合成多核苷酸还至少包含一个位于两个启动子衍生的核酸之间的间隔区(spacer)核酸。在一些实施方案中,间隔区可以是1-50bp或1-200bp,例如5-150bp、10-100bp、15-75bp或20-50bp,或介于两者之间的任意数量的碱基对。在一些实施方案中,合成多核苷酸不含间隔区。

在一些实施方案中,合成多核苷酸还包含编码内含子的可操作地连接的核酸序列。在一些实施方案中,内含子衍生自SV40。在一些实施方案中内含子衍生自小鼠细小病毒(MVM)。在一些实施方案中,内含子是合成的最小内含子。在一些实施方案中,内含子序列的长度小于100个核苷酸。在一些实施方案中,内含子序列可能包含一个或多个启动子衍生的核酸。

在一些实施方案中,合成多核苷酸的长度小于250个碱基对。在一些实施方案中,合成多核苷酸的长度小于300个碱基对。

在一些实施方案中,多核苷酸具有选自SEQ ID NO:21、22、23、24、25、26、27、28、29、30、31的序列。在一些实施方案中,多核苷酸具有选自SEQ ID NO:41-45;53-58;67-69;73-86的序列。

在一些实施方案中,合成多核苷酸促进在肝中的转基因表达,优选肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少1.5倍的水平促进肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少2倍的水平促进肝特异性的转基因表达。在一些实施方案中,在非肝衍生的细胞中,合成多核苷酸具有比CMV启动子低至少4倍的水平的降低的转基因表达。在一些实施方案中,非肝衍生的细胞是A549细胞。在一些实施方案中,在肝衍生细胞中,合成多核苷酸适于以比CMV启动子高至少1.5倍的水平促进肝特异性的转基因表达。在一些实施方案中,在肝衍生细胞中,合成多核苷酸适于以比CMV启动子高至少2倍的水平促进肝特异性的转基因表达。在一些实施方案中,在非肝衍生的细胞中,合成多核苷酸具有比LP1启动子低至少1.5倍的水平的降低的转基因表达。在一些实施方案中,在非肝衍生的细胞中,合成多核苷酸具有比LP1启动子低至少2倍的水平的降低的转基因表达。

在一些实施方案中,合成多核苷酸还包含编码转录后调节元件的可操作地连接的核酸序列。

在一些实施方案中,合成多核苷酸还包含编码polyA元件的可操作地连接的核酸序列。

在一些实施方案中,合成多核苷酸还包含可操作地连接的转基因。

在一些实施方案中,合成多核苷酸还包含可操作地连接的转基因,其中该转基因编码AAT、AGXT、ARG、ASL、ASS、ATP7B、BCKDHA、BCKDHB、CFH、CFTF、CPS、DBT、FAH、FIX、FVIII、HAMP、HFE、JH、MUT、NAGS、OTC、PCCA、PCCB、PI、SLC40A1、TFR2、TTR、UGT1A1、尿激酶、PXBP或其变体、衍生物或等价物。

根据一些实施方案,提供了至少包含三个选自以下的启动子衍生的核酸的合成多核苷酸:(a)Motif_44(SEQ ID NO:12);(b)NRF2F1(SEQ ID NO:14);(c)HNF1A(SEQ ID NO:15);(d)IA2(SEQ ID NO:16);和(e)其各自生物等价物。

在一些实施方案中,合成多核苷酸包含前述实施方案的四个启动子衍生的核酸(a)–(d)。在一些实施方案中,合成多核苷酸与包含四个启动子衍生的核酸(a)–(d)的合成多核苷酸具有至少90%的相同性。

根据一些实施方案,提供了与至少包含三个选自以下的启动子衍生的核酸的合成多核苷酸具有至少90%相同性的合成多核苷酸:Motif_44(SEQ ID NO:12);NRF2F1(SEQ IDNO:14);HNF1A(SEQ ID NO:15);及IA2(SEQ ID NO:16)。

在一些实施方案中,合成多核苷酸从5’到3’连续包含SEQ ID NO:12、SEQ ID NO:15、和SEQ ID NO:16。在一些实施方案中,SEQ ID NO:14在SEQ ID NO:15的3’。在一些实施方案中,SEQ ID NO:14在SEQ ID NO:15的5’。

在一些实施方案中,合成多核苷酸还包含一个或多个选自以下的序列:(e)HNF1B(SEQ ID NO:11);(f)JUN/FOS(SEQ ID NO:17);(g)HNF4A(SEQ ID NO:18);(h)SPI1(SEQ IDNO:19)。

在一些实施方案中,合成多核苷酸从5’到3’连续包含:SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:14、SEQ ID NO:12、和SEQ ID NO:16。在一些实施方案中,合成多核苷酸与从5’到3’连续包含:SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:14、SEQ ID NO:12、和SEQ ID NO:16的合成多核苷酸具有至少90%相同性。

在一些实施方案中,合成多核苷酸从5’到3’连续包含:SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:14、SEQ ID NO:12、SEQ ID NO:15、和SEQ IDNO:16。在一些实施方案中,合成多核苷酸与从5’到3’连续包含:SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:14、SEQ ID NO:12、SEQ ID NO:15、和SEQ IDNO:16的合成多核苷酸具有至少90%相同性。

在一些实施方案中,合成多核苷酸包含SEQ ID NO:15和/或SEQ ID NO:16;及SEQID NO:17、SEQ ID NO:18、和SEQ ID NO:19。在一些实施方案中,合成多核苷酸包含SEQ IDNO:15和/或SEQ ID NO:16;及SEQ ID NO:14和SEQ ID NO:12。

在一些实施方案中,合成多核苷酸还至少包含最小启动子核酸。在一些实施方案中,最小启动子核酸的序列衍生自SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ ID NO:10)或最小启动子核酸与SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ ID NO:10)具有至少90%的序列相同性。在一些实施方案中,最小启动子核酸包含选自以下的序列:SEQ ID NO:7、8、9和10。

在一些实施方案中,至少一个启动子衍生的核酸的方向是倒位的。

在一些实施方案中,合成多核苷酸还至少包含一个位于两个启动子衍生的核酸之间的间隔区核酸。

在一些实施方案中,合成多核苷酸还包含编码内含子的可操作地连接的核酸序列。在一些实施方案中,内含子核酸包含衍生自SV40的序列。在一些实施方案中,内含子衍生自小鼠细小病毒(MVM)。在一些实施方案中,内含子是合成的最小内含子。在一些实施方案中,内含子序列的长度小于100个核苷酸。在一些实施方案中,内含子序列可包含一个或多个启动子衍生的核酸。

在一些实施方案中,合成多核苷酸的长度小于250个碱基对。在一些实施方案中,合成多核苷酸的长度小于300个碱基对。

在特定实施方案中,多核苷酸具有选自以下的序列:SEQ ID NO:32、33、34和35或与其具有至少90%的相同性的合成多核苷酸。在一些实施方案中,多核苷酸具有选自以下的序列:SEQ ID NO:32-25、SEQ ID NO:46-52、SEQ ID NO:59-66和SEQ ID NO:70-72。

在一些实施方案中,合成多核苷酸促进肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少1.5倍的水平促进肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少2倍的水平促进肝特异性的转基因表达。

在一些实施方案中,合成多核苷酸还包含编码翻译后调节元件的可操作地连接的核酸序列。

在一些实施方案中,合成多核苷酸还包含编码polyA元件的可操作地连接的核酸序列。

在一些实施方案中,合成多核苷酸还包含可操作地连接的转基因。在一些实施方案中,转基因编码AAT、AGXT、ARG、ASL、ASS、ATP7B、BCKDHA、BCKDHB、CFH、CFTF、CPS、DBT、FAH、FIX、FVIII、HAMP、HFE、JH、MUT、NAGS、OTC、PCCA、PCCB、PI、SLC40A1、TFR2、TTR、UGT1A1、尿激酶、PXBP或其变体、衍生物或等价物。在一些实施方案中,转基因为自杀基因。

在一些实施方案中,多核苷酸具有选自SEQ ID NO:36、37、38、39、40的序列。

根据一些实施方案,提供了表达盒,其包含根据本文描述的任一实施方案的合成多核苷酸和编码转基因的可操作地连接的多核苷酸序列,其中转基因编码适于治疗与肝有关的疾病或病症的治疗性多肽。

在一些实施方案中,表达盒还包含编码转录后调节元件的核酸。

在一些实施方案中,表达盒还包含编码polyA元件的核酸。

根据一些实施方案,提供了基因治疗载体,其包含本文所述的任一合成多核苷酸和/或根据本文所述的任一实施方案的表达盒。

在一些实施方案中,载体是逆转录病毒载体、慢病毒载体、腺病毒载体或腺相关病毒载体(AAV)。在一些实施方案中,载体是AAV载体。在一些实施方案中,AAV具有适于肝转导的血清型。在一些实施方案中,AAV选自:AAV2、AAV5、AAV6、AAV7、AAV8、AAV9、AAV6.2、AAVrh.64R1、AAVhu.37、AAVrh.8、AAVrh.32.33、AAV3B、和LK03。

根据一些实施方案,提供了重组病毒颗粒,其包含本文所述的合成多核苷酸、本文所述的表达盒或本文所述的载体中的任一种。

根据一些实施方案,提供了在有需要的对象中治疗遗传疾病或状况的方法,所述方法包含施用包含本文所述的任一合成多核苷酸的表达盒或包含表达盒的载体,从而在对象的肝中表达治疗性肽。

在一些实施方案中,与肝相关的遗传疾病或状况选自以下(包含但不限于):遗传性胆汁淤积、威尔森氏病、遗传性血色病、1型酪氨酸血症、α-1抗胰蛋白酶缺乏、精氨基琥珀酸尿、肝癌、糖原贮积病、尿素循环病症、克里格勒-纳贾尔综合征、家族性淀粉样多神经病、非典型溶血性尿毒症综合征-1、原发性尿草酸盐过多1型、枫糖尿病、急性间歇性卟啉病、凝血不良、GSD 1A型、纯合性家族性高胆固醇血症、有机酸尿症、囊性纤维化、红细胞生成性原卟啉病、戈谢病、血友病A、血友病B、家族性高胆固醇血症、鸟氨酸氨甲酰基转移酶缺乏症和苯丙酮尿症。

在一些实施方案中,对象是哺乳动物。在一些实施方案中,哺乳动物是人类。

根据一些实施方案,提供了在肝中表达转基因的方法,该方法包含使肝细胞与包含本文所述的任一合成多核苷酸的表达盒或包含表达盒的载体接触。

根据一些实施方案,提供了根据本文所述的任一实施方案的合成核酸序列、包含根据本文所述的任一实施方案的合成核酸序列的表达盒、或包含表达盒的载体,其用于遗传疾病或状况的医学治疗。在一些实施方案中,与肝相关的遗传疾病或状况选自以下(包含但不限于):遗传性胆汁淤积、威尔森氏病、遗传性血色病、1型酪氨酸血症、α-1抗胰蛋白酶缺乏、精氨基琥珀酸尿、肝癌、糖原贮积病、尿素循环病症、克里格勒-纳贾尔综合征、家族性淀粉样多神经病、非典型溶血性尿毒症综合征-1、原发性尿草酸盐过多1型、枫糖尿病、急性间歇性卟啉病、凝血不良、GSD 1A型、纯合性家族性高胆固醇血症、有机酸尿症、囊性纤维化、红细胞生成性原卟啉病、戈谢病、血友病A、血友病B、家族性高胆固醇血症、鸟氨酸氨甲酰基转移酶缺乏症和苯丙酮尿症。前面的一般描述和下面的详细描述是示例性和解释性的,旨在提供对本发明的进一步解释。

附图简述

图1显示了通过荧光激活细胞分选(FACS)对Huh7和HepG2细胞中GFP表达的评估。

图2显示了推定的最小启动子候选者的选择。显示了推定的TATA框(以粗体显示)、起始因子序列(下划线)和TSS(以双下划线的粗体显示)元件。SERPINA1最小启动子序列没有保守的TATA-box且源于CAGE-seq实验的转录起始位点用星号标出。

图3显示了Huh7细胞中最小启动子的活性评估。

图4显示了HepG2细胞中最小启动子活性的评估。

图5显示了Huh7和HepG2细胞中启动子文库的FACS筛选。

图6A-C显示了单个启动子候选者的PCR拯救(PCR rescue)。A.显示来自HepG2和Huh7细胞的数据。B.显示来自A1-A7的数据。C.显示来自A8-A11的数据。

图7显示了对HepG2和Huh7细胞的文库筛选中识别出的11个启动子的活性验证。左栏Huh7细胞;右栏HepG2细胞。

图8A-B显示了人原代肝细胞中的启动子活性。A.显示相对光单位(RLU)。B.显示相对LP1的倍数变化。

图9显示了HepG2细胞中次级FACS筛选的实例。

图10A-B显示了对从次级文库筛选的识别出的5个启动子的活性的验证。A.显示RLU。B.显示相对LP1的倍数变化。左栏HepG2细胞;右栏Huh7细胞。

图11A-B显示了人原代肝细胞中所选候选者的启动子活性。A.显示RLU。B.显示相对LP1的倍数变化。

图12显示了在原代肝细胞中从文库筛选中识别出的10个启动子的活性验证。

图13A-B显示了原代肝细胞中启动子活性的确认。A.显示RLU。B.显示相对LP1的倍数变化。

图14显示了在不同细胞系的原代肝细胞中分离的启动子的活性。A.显示RLU。B.显示相对LP1的倍数变化。左栏HepG2细胞,右栏Huh7细胞。

图15A-C显示了在不同细胞类型中与LP-1相比复合合成启动子的倍数活性。A.显示RLU。B.显示相对LP1的倍数变化。A.复合合成启动子示意图。左栏Huh7细胞;右栏HepG2细胞。

图16显示了SERPINE1对复合增强子活性的影响。左栏HepG2细胞;右栏Huh7细胞。

图17显示了不同最小启动子对复合增强子活性的影响。左栏Huh7细胞,中栏HepG2细胞,右栏HepaRG。

图18显示了启动子尺寸的减少和对表达强度的影响。左栏Huh7细胞,中栏HepG2细胞,右栏HepaRG。

图19显示了合理设计的启动子在原代肝细胞中的表达强度。

图20显示了合理设计的启动子在非肝细胞中的活性。

图21显示了在非肝细胞中细胞系文库筛选的启动子的活性。左栏HeLa细胞,中栏293细胞,右栏A549细胞。

图22显示了在非肝细胞中原代肝细胞文库筛选的启动子的活性。左栏293细胞,中栏HeLa细胞,右栏A549细胞。

图23A-E显示了报告子基因的体外与体内表达的比较。这些图表明,启动子在体外和体内实验中都驱动了报告子基因的表达。所有构建体都在质粒(转染;图B)以及AAV封装形式(转导;图C和D)中进行测试。在所有测定之间存在明显的强响应。包括两个对照:LP1启动子作为参考肝启动子以及缓冲剂(运载体)对照作为阴性。在E图中,很明显,递送到小鼠肝的DNA的DNA拷贝对于所有构建体都是可比的,因此启动子的性能是有效的并得到证实。

图24A-D显示了AAV质粒转染到细胞系和hpHepatocytes中。A.显示48小时HepG2细胞中的RLU。B.显示48小时Huh7细胞中的RLU。C.显示48小时HepaRG细胞中的RLU。D.显示48小时hpHepatocytes细胞中的RLU。

图25显示了平均3次生物学重复的SEQ ID NO:26衍生物的活性。使用标准萤光素酶测定法在Huh7细胞中筛选衍生物和对照序列,并将启动子活性归一化为SEQ ID NO:26启动子,以查看对原始启动子所做的改变是否对启动子活性有正面或负面影响。转染一式三份进行,萤光素酶测定一式两份进行,每个图显示来自3个生物学重复的结果。

图26显示了使用标准萤光素酶测定法在Huh7细胞中筛选出SEQ ID NO:33衍生物和对照序列,并将启动子活性归一化为SEQ ID NO:33,以查看对原始启动子活性所做的改变是否对启动子活性有正面或负面影响。转染一式三份进行,萤光素酶测定一式两份进行,每个图显示来自3个生物学重复的结果。

图27显示了平均3次生物学重复的SEQ ID NO:35衍生物的活性。使用标准萤光素酶测定法在Huh7细胞中筛选衍生物和对照序列,并将启动子活性归一化为SEQ ID NO:35启动子,以查看对原始启动子所做的改变是否对启动子活性有正面或负面影响。转染一式三份进行,萤光素酶测定一式两份进行,每个图显示来自3个生物学重复的结果。

图28显示#A2(SEQ ID NO:36)的示意图。

图29显示#A4(SEQ ID NO:37)的示意图。

图30显示#A11(SEQ ID NO:38)的图。

图31显示#C13(SEQ ID NO:39)的图。

图32显示#C81(SEQ ID NO:40)的图。

图33显示了HCR-hAAT启动子及其缩短版本的并排比较。LP1和HLP启动子。编码密码子优化的FVIII的三个构建体(命名为GD6、GD4和COSX),将由所示的启动子变体驱动的每一个转染到Huh-7细胞中。通过在转染后2天收集上清液并通过ELISA(AffinityBiologicals)测量抗原水平来检测培养基中FVIII的产生,并根据共转染的海肾萤光素酶(renilla luciferase)质粒校正转染效率。

具体实施方式

本文描述的是肝特异性启动子以及AAV基因治疗载体、治疗剂和包含其的方法。

本文公开的肝特异性启动子是通过以下两种方式之一获得的:(1)通过合理设计启动子,或(2)通过筛选衍生自已知肝相关的启动子元件的随机组合的候选启动子文库。结果是,本发明人能够开发出新的启动子,它们不仅比天然存在的启动子序列小,而且在肝中表达更活跃和更特异。

公开的组合物和方法可能不限于治疗肝或肝疾病。相反,公开的组合物和方法可以在治疗多种类型的疾病中提供益处,在该疾病中全身性蛋白(存在于血液中的蛋白质)发生突变或异常表达。通过使患者接受本发明的方法,可以改善肝表达的治疗分子的可用性,从而允许更有效的转导和/或所施用的AAV更低的量。

如下文更详细讨论的,与公开的启动子组合使用的AAV基因治疗载体的类型没有特别限制,并且可以包括来自各种血清型的AAV,以及重组或嵌合AAV。

如下文更详细讨论的,公开的方法和启动子的应用具有深远的意义,且可有助于改善众多基因治疗应用的安全性和有效性。

在本申请全文和内部通过引用参考技术和专利文献。对于这些参考文献中的某些,在紧接在权利要求之前的本申请的最后可找到明确引用。所有出版物均通过引用并入本公开,以更全面地描述本公开所属的技术状态。

定义

如在本发明的说明书、条款和所附权利要求的条款中使用的,单数形式“a”、“an”和“the”可互换使用并且也旨在包括复数形式并且落入每个含义内,除非上下文另有明确指示。此外,如本文所用,“和/或”是指并涵盖一个或多个所列项目的任何和所有可能的组合,以及当以选择(“或”)解释时的不组合。

如本文所用,术语“约”将被本领域普通技术人员理解并且将根据其使用的上下文在一定程度上变化。如果在给定的领域术语使用的上下文中本领域普通技术人员对于术语的使用不清楚,“约”将表示特定术语的多达正或负10%。

如本文所用,向对象“施用”物质(agent)(例如合成多核苷酸、表达盒、病毒颗粒、载体、多核苷酸、细胞、细胞群、组合物或药物组合物)包括向对象引入或递送物质以执行其预期功能的任何途径。施用可以通过任何合适的途径进行,所述途径包括口服、鼻内、眼内、眼部(ophthalmically)、胃肠外(静脉内、肌内、腹膜内或皮下)或表面(topically)。施用包括自我施用和他人施用。

如本文所用,术语“细胞”是指原核或真核细胞。在一些实施方案中,细胞为真核细胞,任选地得自对象或市售可得来源。在一些实施方案中,细胞是分离的细胞。

如本文所用,短语“治疗有效量”是指在对象中提供特定药理学作用的剂量或血浆浓度,为了所述特定药理学作用施用所公开的AAV基因治疗载体以例如在靶细胞/器官中表达治疗性基因或感兴趣的基因。需要强调的是,治疗有效量或治疗水平的AAV载体在治疗本文所述的状况时并不总是有效,即使这种剂量被本领域技术人员视为治疗有效量。仅为了方便起见,下面提供了示例性剂量、药物递送量和治疗有效量。本领域技术人员可以根据治疗特定对象和/或状况所需的标准实践来调整这些量。治疗有效量可根据施用途径和剂型、对象的年龄和体重、和/或被治疗的疾病或状况而变化。

如本文所用,术语“治疗(treatment)”或“治疗(treating)”是指减少、改善或消除疾病或状况的一种或多种体征、症状或作用(例如,增加具有血友病的对象中凝血因子的表达,或降低与疾病相关的基因的表达,例如通过诱导RNA干扰等)。

术语“个体”、“对象”和“患者”在本文中可互换使用,并且指需要治疗的具有疾病或状况的任何个体对象。出于本公开的目的,对象可以是灵长类动物,例如人灵长类动物,或另一种哺乳动物,例如狗、猫、马、猪、山羊或牛等。

术语“多核苷酸”和“寡核苷酸”可互换使用,指任何长度的聚合形式的核苷酸,或是脱氧核糖核苷酸,或是核糖核苷酸,或其类似物。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段(例如探针、引物、EST或SAGE标签)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任意序列的分离的DNA、任意序列的分离的RNA、核酸探针和引物。多核苷酸可以包含修饰的核苷酸,如甲基化核苷酸和核苷酸类似物。如果存在,可以在组装多核苷酸之前或之后对核苷酸结构给予修饰。核苷酸序列可以被非核苷酸组分打断。多核苷酸可在聚合后进一步修饰,如通过与标记组分缀合。术语也指双链和单链分子。除非另有说明或要求,本发明的任何多核苷酸的实施方案包括双链形式和已知或预测构成双链形式的两条互补单链形式中的每一条。

“同源性”或“相同性”或“相似性”是指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比较每个序列中的位置来确定,这些序列可以为了比较的目的而比对。当比较的序列中的位置被相同的碱基或氨基酸占据时,则分子在该位置是同源的。序列之间的同源性程度是序列共有的匹配或同源位置的数量的函数。“无关”或“非同源”序列与本发明的序列之一具有小于40%的相同性,或者小于25%的相同性。

多核苷酸或多核苷酸区域(或多肽或多肽区域)与另一序列具有一定百分比(例如70%、75%、80%、85%、90%、95%、98%或99%)的“序列相同性”意味着,当比对时,碱基(或氨基酸)的百分比在比较两个序列时是相同的。这种比对和同源性百分比或序列相同性可以使用本领域已知的软件程序来确定,例如在Ausubel等人所编辑的(2007)CurrentProtocols in Molecular Biology中描述的那些。优选地,使用默认参数用于比对。一种比对程序是BLAST,使用默认参数。特别是程序是BLASTN和BLASTP,使用以下默认参数:Genetic code=standard;filter=none;strand=both;cutoff=60;expect=10;Matrix=BLOSUM62;Descriptions=50sequences;sort by=HIGH SCORE;Databases=non-redundant,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein+SPupdate+PIR.。这些程序的详细信息可以在以下Internet地址找到:ncbi.nlm.nih.gov/cgi-bin/BLAST。

“等价的”或“生物学等价的”核酸、多核苷酸或寡核苷酸或肽是与参考核酸、多核苷酸、寡核苷酸、启动子衍生的核酸或肽具有至少55%序列相同性、或可选地至少60%序列相同性、或可选地至少65%序列相同性、或可选地至少70%序列相同性、或可选地至少75%序列相同性、或可选地至少80%序列相同性、或可选地至少85%序列相同性、或可选地至少90%序列相同性、或可选地至少92%序列相同性、或可选地至少95%序列相同性、或可选地至少97%序列相同性、或可选地98%序列相同性的核酸、多核苷酸或寡核苷酸或肽。在一些实施方案中,等价物包括参考核酸、多核苷酸、寡核苷酸或启动子衍生的核酸的反向互补。在一些实施方案中,参考元件的生物等价物是包含与参考元件基本相同功能的功能等价物。例如,作为特定效应子分子的识别或结合位点的特定启动子衍生的核酸的生物等价物可包含序列变异,但保留被相同效应子分子识别或结合的能力。等价功能可以通过本领域已知的任何相关方法来确定,包括但不限于电迁移率变化测定(EMSA)、结合测定、染色质免疫沉淀(ChIP)、ChIP测序(ChIP-seq)、免疫沉淀和报告子基因表达系统。具体的实例是,NRF2F1的生物等价物是能够被NRF2F1蛋白质结合的元件,这可以通过EMSA来确定。

如本文所用,术语“载体”是指包含完整复制子的非染色体核酸,使得载体在置于细胞内时(例如通过转化过程)可被复制。载体可以是病毒的或非病毒的。病毒载体包括逆转录病毒、腺病毒、疱疹病毒、杆状病毒、修饰的杆状病毒、细小病毒或其他修饰的天然存在的病毒。用于递送核酸的示例性非病毒载体包括裸DNA;与阳离子脂质复合的DNA,其单独或与阳离子聚合物组合;阴离子和阳离子脂质体;DNA-蛋白质复合体和包含与阳离子聚合物(例如异质聚赖氨酸、限定长度的寡肽和聚乙烯亚胺)缩合的DNA的颗粒(其在某些情况下包含在脂质体中);以及使用包含病毒和多聚赖氨酸-DNA的三元复合体。

“病毒载体”被定义为重组产生的病毒或病毒颗粒,其包含可在体内、离体或体外递送到宿主细胞中的多核苷酸。病毒载体的实例包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体(AAV)、α病毒载体等。适于治疗用途的病毒载体优选不表达任何病毒载体蛋白,即载体基因组包含在病毒衣壳/包膜中有效复制和包装载体基因组所需的所有遗传元件,但优选不含衍生自野生型病毒的产生病毒蛋白质的遗传元件,因为病毒蛋白质可能与致病性有关和/或可诱导不希望的免疫应答。α病毒载体,诸如基于Semliki Forest病毒的载体和基于Sindbis病毒的载体,也已被开发用于基因治疗和免疫治疗。参见Schlesinger和Dubensky(1999)Curr.Opin.Biotechnol.5:434-439;Ying等.(1999)Nat.Med.5(7):823-82。

术语“启动子”是指启动转录的核酸的调节区。在一些实施方案中,启动子可以是组成型或诱导型。组成型启动子是指始终具有活性和/或不断指导基因高于基础转录水平转录的启动子。诱导型启动子是能够被加入到细胞中或在细胞中表达的分子或因子诱导的启动子。诱导型启动子在没有诱导的情况下可能仍会产生基础水平的转录,但诱导通常导致显著更多的蛋白质产生。在一些实施方案中,启动子是组织特异的。组织特异性启动子允许在特定的细胞群中转录。

合成多核苷酸

本公开的合成多核苷酸包含一个或多个启动子衍生的核酸。“启动子衍生的核酸”是(i)包含已知启动子的全部或部分序列;或(ii)已证明或已知具有至少一些启动子功能的核酸序列。

在一些实施方案中,合成多核苷酸包含3个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含4个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含5个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含6个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含7个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含8个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含9个或更多启动子衍生的核酸。在一些实施方案中,合成多核苷酸包含10个或更多启动子衍生的核酸。非限制性的、示例性的启动子元件以SEQ ID NO:1-19提供并在表1中描述。

在一些实施方案中,一个或多个启动子衍生的核酸与最小启动子元件(如“TATAbox”)组合。启动子元件不一定需要转录起始点,因为最小启动子序列提供转录起始。示例性最小启动子元件可以选自APOC2(SEQ ID NO:9)、SERPINA1_mp(SEQ ID NO:8)、SERPINE1_mp(SEQ ID NO:7)、G6PC(SEQ ID NO:10),以及其各自生物等价物。

根据一些实施方案,提供了合成多核苷酸,其包含选自以下的至少三个启动子衍生的核酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQ ID NO:2);c/EBP/HNF4(SEQID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。

根据一些实施方案,提供了合成多核苷酸,其包含选自以下的至少四个启动子衍生的核酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQ ID NO:2);c/EBP/HNF4(SEQID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。

根据一些实施方案,提供了合成多核苷酸,其包含HNF1/HNF3(SEQ ID NO:1)和选自以下的至少三个启动子衍生的核酸或其变体:HNF3/HNF3(SEQ ID NO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。

根据一些实施方案,提供了合成多核苷酸,其包含c/EBP/HNF4(SEQ ID NO:3)和选自以下的至少三个启动子衍生的核酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQID NO:2);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。

根据一些实施方案,提供了合成多核苷酸,其包含HNF1/HNF3(SEQ ID NO:1)和c/EBP/HNF4(SEQ ID NO:3)或其变体;及选自以下的至少二个启动子衍生的核酸:HNF3/HNF3(SEQ ID NO:2);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。

在一些实施方案中,合成多核苷酸包含所有五个启动子衍生的核酸。在一些实施方案中,完整示例性启动子序列可包含SEQ ID NO:21-31的一个或多个。

在一些实施方案中,HS_CRM8序列的变体选自SEQ ID NO:5、SEQ ID NO:87、SEQ IDNO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ IDNO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99、SEQ IDNO:100及其每个等价物。

在一些实施方案中,肝特异性启动子提供了包含选自以下的HS_CRM8序列的变体:SEQ ID NO:5、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93、SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96、SEQ ID NO:97、SEQ ID NO:98、SEQ ID NO:99及其每个等价物。

HS_CRM8序列代表复合元件,如实施例所示,并制备如上所列的变体,其在包含在肝特异性启动子中时显示具有基本相同的活性。此外,缺失这个元件会大大降低肝基因的表达。因此,根据本发明的肝特异性启动子,代替或除了包含HS_CRM8序列的变体,还可以定义为包含SEQ ID NO:101(ACTTAGCCCCTGTTTGCTCCTCCG))和/或SEQ ID NO:102(TGACCTTGGTTAATATTCACCAGC),优选SEQ ID NO:101和SEQ ID NO:102。可以理解,根据本发明的这种肝特异性启动子还可以包含SEQ ID NO:101和/或SEQ ID NO:102的变体,或者其中之一或两者的反向互补。因此,在本文的描述中,无论SEQ ID NO:5包括在肝特定的启动子中的任何地方,作为SEQ ID NO:5的替代,所述启动子可以被定义为包括SEQ ID NO:101和/或SEQ ID NO:102,或功能等价于SEQ ID NO:101和/或SEQ ID NO:102,或其中之一或两者的反向补充。如实施例所示,从启动子活性的角度来看,可以制备许多功能等价物,即与其具有非常相似的活性。例如,SEQ ID NO:101可将SEQ ID NO:105对应的序列替换为SEQID NO:107。此外,SEQ ID NO:1可将序列TCCG替换为序列TTAG。还可以理解的是,同样地,功能等价物也可将与SEQ ID NO:105对应的序列作为反向互补序列,同样地,适用于TCCG。

此外,如实例中所示,由SEQ ID NO:5制备的许多变体导致启动子与SEQ ID NO:5相比具有非常相似的活性,尽管略有降低,但与LP1相比仍保留了显著的活性改善。因此,HS_CRM8的变体也可以定义为包含SEQ ID NO:101和选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:103(CCCTGTTTGCTCCTCCG)和选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:105(CCCTGTTTGCTCC)和序列TCCG,和选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:105和序列TTAG,和选自以下序列的复合元件:SEQ ID NO:102、SEQ IDNO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ IDNO:107(CCCTATTTACTCC)和序列TCCG,和选自以下序列的复合元件:SEQ ID NO:102、SEQ IDNO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ IDNO:107和序列TTAG,和选自以下序列的复合元件:自SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA)。应当理解,HS_CRM8的所述变体优选地具有小于60个核苷酸的序列长度。可以理解的是,本文定义的复合元件中包含的组分也可以用SEQ ID NO:101、102、103、104、105、106、107、TTAG和TCCG的反向互补序列代替。

根据一些实施方案,提供了合成多核苷酸,其至少包含与HS_CRM8或野生型CRM8具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的相同性的序列的一部分。

如本文所公开的HS_CRM8变体的用途不限于例如在实施例部分中描述的合成多核苷酸,而是还可用于新型肝特异性启动子和/或如现有技术中描述的包含CRM8序列的肝特异性启动子。在后一种情况下,本文所述的HS_CRM8变体序列(例如SEQ ID NO:5和87-99,或包含SEQ ID NO:101至107的各种组合的所述变体)适当地用于替代现有技术启动子中存在的一些或全部CRM8序列。通过这种方式,与野生型CRM8序列(SEQ ID NO:6或SEQ ID NO:100)相比,可以实现减小尺寸和/或增加肝特异性的基因表达和/或肝选择性。

因此,根据本发明的一些实施方案提供了合成的肝特异性启动子,其包含如上文所示的HS_CRM8变体(例如SEQ ID NO:5和87-99,或包含SEQ ID NO:101至107的各种组合的所述变体)或与任何所述的HS_CRM8变体具有至少75%、至少80%、至少85、至少90%、至少95%、至少97%、至少98%或至少99%的相同性的序列。

进一步提供了表达盒、载体(例如基因治疗载体,例如AAV载体)、重组病毒颗粒或药物组合物,其包含含此类HS_CRM8变体的合成肝特异性启动子。

还提供了在有需要的对象中治疗遗传疾病或状况的方法,包括施用包含含此类HS_CRM8变体的合成肝特异性启动子的表达盒,或包含此类表达盒的载体,从而在对象的肝中表达治疗性肽的方法。这种方法的进一步可选的或优选的细节在本公开的别处阐述。

还提供了在肝细胞中表达转基因的方法,该方法包括使肝细胞与包含含此类HS_CRM8变体的合成肝特异性启动子的表达盒接触,或与包含此类表达盒的载体接触。这种方法的进一步可选的或优选的细节在本公开的别处阐述。

还提供了包含含此类CRM8变体的合成肝特异性启动子的HS_CRM8变体、表达盒、载体(例如基因治疗载体,例如AAV载体)、重组病毒颗粒、药物组合物,其用于遗传疾病和状况的医学治疗用途。各种特定疾病以及此类用途的任选和优选细节在申请中的别处讨论。

根据一些实施方案,提供了与包含选自以下至少三个启动子衍生的核酸的合成多核苷酸具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%相同性的合成多核苷酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQ IDNO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6)。在一些实施方案中,提供了合成多核苷酸,其是包含选自以下至少三个启动子衍生的核酸的合成多核苷酸的生物学等价物或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQID NO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ IDNO:6)。

在一些实施方案中,合成多核苷酸从5'端到3'端连续包含SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:6,或其每一个的等价物。

在一些实施方案中,启动子衍生的核酸是可操作地连接的。

在一些实施方案中,合成多核苷酸还至少包含一个最小启动子核酸。合适的最小启动子核酸的非限制性实例包括SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)或G6PC(SEQ ID NO:10),或其每一个的等价物。在一些实施方案中,等价最小启动子核酸是与SERPINE1(SEQ ID NO:7),SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)或G6PC(SEQ ID NO:10)具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、或至少99%序列相同性的最小启动子核酸。在一些实施方案中,等价最小启动子核酸是SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)或G6PC(SEQ ID NO:10)的生物学等价物。在一些实施方案中,最小启动子核酸包含选自以下的序列:SEQ ID NO:7、8、9和10。

根据一些实施方案,提供与含有选自以下四个或五个不同启动子衍生的核酸的合成多核苷酸具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%相同性的合成多核苷酸或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQID NO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ IDNO:6),以及适合的最小启动子核酸包括SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ ID NO:10)。在一些实施方案中,提供了合成多核苷酸,其是含有选自以下四个或五个不同启动子衍生的核酸的合成多核苷酸的生物等价物或其变体:HNF1/HNF3(SEQ ID NO:1);HNF3/HNF3(SEQ ID NO:2);c/EBP/HNF4(SEQ ID NO:3);HS_CRM2/HNF3(SEQ ID NO:4);和HS_CRM8(SEQ ID NO:6),以及适合的最小启动子核酸包括SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ IDNO:10)。

在一些实施方案中,至少一个启动子衍生的核酸(不包括最小启动子元件,因为该元件与转录起始有关)的方向是倒位的。在一些实施方案中,合成多核苷酸包含本文所述启动子衍生的核酸中至少一个的反向互补(不包括最小启动子元件,因为该元件与转录起始有关)。

在一些实施方案中,合成多核苷酸还包含位于两个启动子衍生的核酸之间的或启动子衍生的核酸和ITR之间的至少一个间隔区核酸。这种间隔区核酸可不编码转录因子结合序列,且可仅仅是随机序列和/或不影响DNA结构但允许两个启动子衍生的核酸发挥其功能(即两者结合各自的转录因子)的序列。这样的间隔区核酸可以是一个、两个、三个、四个或更多个核苷酸或碱基对。在一些实施方案中,间隔区核酸长度为1-20、1-10、1-5、1-4、1-3或1-2个核苷酸或碱基对。在一些实施方案中,间隔区长度可以是1-200、1-150、1-100、1-50、5-150、10-100、15-75或20-50个核苷酸或碱基对或之间任何数量的核苷酸或碱基对。例如,间隔区可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50个或更多核苷酸或碱基对。这样的间隔区序列被排除在序列相同性计算之外,即当本发明的合成多核苷酸包含本文定义的启动子元件和最小子启动子序列时,优选地仅针对定义的启动子元件和最小启动子序列计算序列相同性,不包括间隔区元件。

在SEQ ID NO:26中发现了包含间隔区的合成多核苷酸的非限制性实例。间隔区核苷酸在SEQ ID NO:26中加下划线。在一些实施方案中,SEQ ID NO:26的生物学等价物是包含去除了一个或多个间隔区核苷酸的SEQ ID NO:26的合成多核苷酸。

在一些实施方案中,合成多核苷酸还包含编码内含子的可操作地连接的核酸序列。在一些实施方案中,内含子衍生自SV40。在一些实施方案中内含子衍生自MVM。在一些实施方案中内含子是合成内含子序列。在一些实施方案中,内含子的序列长度小于1000、小于900个核苷酸、小于800个核苷酸、小于700个核苷酸、小于600个核苷酸、小于500个核苷酸、小于400个核苷酸、小于300个核苷酸、小于200个核苷酸、小于100个核苷酸、小于90个核苷酸、小于80个核苷酸、小于70个核苷酸、小于60个核苷酸、小于50个核苷酸、小于40个核苷酸、小于30个核苷酸、小于20个核苷酸、小于10个核苷酸、或小于5核苷酸。在一些实施方案中,内含子序列在5个核苷酸和200个核苷酸之间,在5个核苷酸和150个核苷酸之间,在10个核苷酸和125个核苷酸之间,在10个核苷酸和100个核苷酸之间。在一些实施方案中,内含子序列可包含一个或多个启动子衍生的核酸

在一些实施方案中,多核苷酸具有选自SEQ ID NO:21、22、23、24、25、26、27、28、29、30、31、42及其等价物的序列。在一些实施方案中,多核苷酸具有选自SEQ ID NO:42-46;54-59;68-70;74-86,以及其每个等价物的序列。

在一些实施方案中,合成多核苷酸在肝中促进转基因表达,优选肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少1.5倍的水平促进肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少2倍的水平促进肝特异性的转基因表达。在一些实施方案中,合成多核苷酸适于以比LP1启动子高至少3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍或50倍的水平促进肝特异性的转基因表达,如实施例部分所示的Huh7转染和/或Huh7细胞的AAV转导,或如当比较LP1与本发明的合成多核苷酸时通过动物中的转基因表达所确定的。在一些实施方案中,在非肝衍生的细胞中,合成多核苷酸具有比LP1启动子低至少1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍、50倍的水平的降低的转基因表达。非肝衍生的细胞的非限制性实例是A549细胞。

在一些实施方案中,合成多核苷酸适于以比CMV启动子高至少4倍的水平促进肝特异性的转基因表达。在一些实施方案中,在肝衍生的细胞中,合成多核苷酸适于以比CMV启动子高至少2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍或50倍的水平促进肝特异性的转基因表达。在一些实施方案中,在非肝衍生的细胞中,合成多核苷酸具有比CMV启动子低至少1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、40倍或50倍的水平的降低的转基因表达。非肝衍生的细胞的非限制性实例是A549细胞。

在一些实施方案中,合成多核苷酸还包含可操作地连接的转基因。在一些实施方案中,转基因编码AAT、AGXT、ARG、ASL、ASS、ATP7B、BCKDHA、BCKDHB、CFH、CFTF、CPS、DBT、FAH、FIX、FVIII、HAMP、HFE、JH、MUT、NAGS、OTC、PCCA、PCCB、PI、SLC40A1、TFR2、TTR、UGT1A1、尿激酶、PXBP或其变体、衍生物或等价物。

根据一些实施方案,提供了包含选自以下至少三个启动子衍生的核酸的合成多核苷酸:Motif_44(SEQ ID NO:12);NRF2F1(SEQ ID NO:14);HNF1A(SEQ ID NO:15);IA2(SEQID NO:16);及其各自的生物等价物。

根据一些实施方案,提供了包含选自以下至少三个启动子衍生的核酸的合成多核苷酸:Motif_44(SEQ ID NO:12);NRF2F1(SEQ ID NO:14);HNF1A(SEQ ID NO:15);和IA2(SEQ ID NO:16);SEQ ID NO:33;SEQ ID NO:35;以及其各自生物等价物。根据一些实施方案,提供了与包含选自以下至少三个启动子衍生的核酸的合成多核苷酸具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%相同性的合成多核苷酸:Motif_44(SEQ ID NO:12);NRF2F1(SEQ ID NO:14);HNF1A(SEQ ID NO:15);和IA2(SEQ ID NO:16);SEQ ID NO:33;和SEQ ID NO:35。

在一些实施方案中,合成多核苷酸从5'到3'连续包含SEQ ID NO:12、SEQ ID NO:15和SEQ ID NO:16。在一些实施方案中,SEQ ID NO:14在SEQ ID NO:15的3'。在一些实施方案中,SEQ ID NO:14在SEQ ID NO:15的5’。

在一些实施方案中,合成多核苷酸还包含选自以下的一个或多个序列:(e)HNF1B(SEQ ID NO:11);(f)JUN/FOS(SEQ ID NO:17);(g)HNF4A(SEQ ID NO:18);(h)SPI1(SEQ IDNO:19),或者其各自生物等价物。

在一些实施方案中,合成多核苷酸从5'到3'连续包含:SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:14、SEQ ID NO:12和SEQ ID NO:16。在一些实施方案中,合成多核苷酸从5'到3'连续包含:SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:14、SEQ ID NO:12、SEQ ID NO:15和SEQ ID NO:16。

在一些实施方案中,合成多核苷酸还至少包含一个最小启动子核酸。在一些实施方案中,最小启动子核酸序列衍生自SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、G6PC(SEQ ID NO:10)、或其各自生物等价物,或与SERPINE1(SEQ IDNO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、或G6PC(SEQ ID NO:10)具有至少75%,至少80%,至少85%,至少90%、至少95%、至少97%、至少98%或至少99%序列相同性的最小启动子核酸。在一些实施方案中,最小启动子核酸包含选自以下的序列:SEQ IDNO:7、8、9和10。

在一些实施方案中,合成多核苷酸从5'到3'连续包含:SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:14、SEQ ID NO:12、和SEQ ID NO:16,或合成多核苷酸从5'到3'连续包含:SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:14、SEQ ID NO:12、SEQ ID NO:15、和SEQ ID NO:16;接着是衍生自SERPINE1(SEQ ID NO:7)、SERPINA1(SEQ ID NO:8)、APOC2(SEQ ID NO:9)、G6PC(SEQ ID NO:10)或其各自生物等价物的最小启动子核酸,或与其具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%序列相同性的合成多核苷酸。

在一些实施方案中,合成多核苷酸还包含编码内含子的可操作地连接的核酸序列。内含子的非限制性实例包括hCMV内含子A、腺病毒三联前导序列内含子、SV40内含子、MVM内含子、中国仓鼠EF-1α基因内含子1和间插(intervening)序列内含子。在一些实施方案中,内含子包含衍生自SV40的序列。参见,例如Xu等,J Cell Mol Med.2018Apr;22(4):2231-2239,关于合适的内含子序列的其他方法和描述。

在一些实施方案中,合成多核苷酸的长度为约20至约800bp、约40至约100bp、约50至约150bp、约60至约200bp、约80至约250bp、约90至约275bp、约100至约300bp、约50至约300bp、约100至约400bp、约100至约500bp、约100至约600bp、约100至约700bp、约200至约800bp或约50至约1000bp。在一些实施方案中,合成多核苷酸的长度小于约1000、小于约900、小于约800、小于约700、小于约600、小于约500、小于约400、小于约300、小于约250、小于约200个碱基对、或小于约150个碱基对。在特定实施方案中,合成多核苷酸的长度小于250个碱基对或小于300个碱基对。

在特定实施方案中,多核苷酸具有选自以下的序列:SEQ ID NO:21-31、41-45、53-58、67-69和73-86,或其各自的生物等物,或与其具有至少75%,至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%序列相同性的合成多核苷酸。

在特定实施方案中,多核苷酸具有选自以下的序列:SEQ ID NO:32-35、46-52、59-66、70-72、或其各自生物等价物、或与其具有至少75%,至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%序列相同性的合成多核苷酸。

在一些实施方案中,合成多核苷酸还包含编码翻译后调节元件的可操作地连接的核酸序列。翻译后调节元件的非限制性实例包括5'UTR、3'UTR和polyA元件。在一些实施方案中,合成多核苷酸还包含编码polyA元件的可操作地连接的核酸序列。

在一些实施方案中,合成多核苷酸还包含可操作地连接的转基因。在一些实施方案中,转基因编码AAT、AGXT、ARG、ASL、ASS、ATP7B、BCKDHA、BCKDHB、CFH、CFTF、CPS、DBT、FAH、FIX、FVIII、HAMP、HFE、JH、MUT、NAGS、OTC、PCCA、PCCB、PI、SLC40A1、TFR2、TTR、UGT1A1、尿激酶、PXBP或其变体、衍生物或等价物。

在一些实施方案中,转基因为自杀基因。在一些实施方案中,转基因是可诱导的。在一些实施方案中,自杀基因是单纯疱疹病毒胸苷激酶(“HSV-tk”)(GenBank登录号:AB45318.1(核苷酸3331-4458))。自杀基因的其他非限制性实例包括密码子优化的TK或tk30、tk75和sr39tk,如Pantuck等,(2004)Human Gene Therapy,Vol.13(7):777-789;Black等,(2001)Cancer Res.61:3022-3026;和Ardiani等,(2010)Cancer Gene Therapy17:86-96中所述。

在一些实施方案中,合成多核苷酸由DNA编码。在一些实施方案中,合成多核苷酸由RNA编码,可选地由病毒RNA编码。合成多核苷酸可以是单链的或双链的。在一些实施方案中,合成多核苷酸的结构形式(即DNA或RNA,单链的或双链的)由所使用的可适用的基因治疗运载体确定。例如,慢病毒载体包含单链RNA基因组。AAV载体包含单链DNA载体基因组或双链DNA载体基因组,这取决于载体基因组的尺寸和/或载体基因组的设计。当慢病毒载体基因组在转导过程中被逆转录时,RNA序列被转化为相应的DNA序列。

在一些实施方案中,合成多核苷酸具有选自以下的序列:SEQ ID NO:36、37、38、39、40、及其各自生物等价物,或合成多核苷酸与其具有至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%序列相同性的合成多核苷酸。

在一些实施方案中,与已知的非特异性启动子(例如,野生型CRM8)相比,包含公开的肝特异性启动子可以将肝中治疗性基因或感兴趣的基因的表达增加至少10%、至少20%、至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%或更多。在一些实施方案中,与已知的启动子相比,合成多核苷酸将表达增加至少1.2倍-1.8倍、1.5倍-2.5倍、2倍-5倍、4倍-10倍、5倍-20倍或10倍-100倍。

在一些实施方案中,与已知的肝特异性启动子(例如,LP-1启动子)相比,包含公开的肝特异性启动子可以将肝中治疗性基因或感兴趣基因的表达增加至少10%、至少20%、至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%或更多。在一些实施方案中,与已知肝特异性启动子相比,合成多核苷酸将表达增加至少1.2倍-1.8倍、1.5倍-2.5倍、2倍-5倍、4倍-10倍、5倍-20倍或10倍-100倍。

以下表1、2和3提供适用于合成多核苷酸的核酸序列和本公开的合成多核苷酸的非限制性实例。

表1:SEQ ID NO:1-40

表2:SEQ ID NO:41-90

表3:SEQ ID NO:87-100

表达盒

根据一些实施方案,提供了表达盒,其包含根据本文描述的任一实施方案的合成多核苷酸和编码转基因的可操作地连接的多核苷酸序列,其中转基因编码适于用于治疗与肝相关的疾病或状况的治疗性多肽。

在一些实施方案中,表达盒还包含编码转录后调节元件的核酸。在一些实施方案中,表达盒还包含编码polyA元件的核酸。

基因治疗载体

根据一些实施方案,提供了载体,其包含本文所述的合成多核苷酸或本文所述的表达盒中的任一种。

在一些实施方案中,载体是裸DNA、逆转录病毒载体、慢病毒载体、腺病毒载体、或腺相关病毒载体(AAV)。在一些实施方案中,载体是AAV载体。在一些实施方案中,AAV具有适合肝转导的血清型。在一些实施方案中,AAV选自:AAV2、AAV5、AAV6、AAV7、AAV8、AAV9、AAV6.2、AAVrh.64R1、AAVhu.37、AAVrh.8、AAVrh.32.33、AAV3B、和LK03。

在一些实施方案中,公开的肝特异性启动子掺入AAV基因治疗载体。AAV基因治疗载体可以编码多种组分(例如衣壳蛋白、ITR等),其可以是相同或不同的血清型,且载体可以编码一种或多种治疗性基因或感兴趣的基因。

AAV基因治疗载体可包含AAV衣壳和多核苷酸。多核苷酸可编码治疗性蛋白质;然而,并非所有多核苷酸都编码治疗性蛋白质。在一些实施方案中,AAV基因治疗载体内的多核苷酸可编码感兴趣的基因(例如,在对象中发生突变的基因)、感兴趣的蛋白质(例如,在对象中表达不足或突变的蛋白质)、或治疗性RNA(例如,靶向突变或过表达的基因的siRNA、miRNA或shRNA))。因此,转基因或治疗性基因可包含编码治疗性蛋白质或治疗性RNA或其片段的多核苷酸序列。

AAV基因治疗载体的血清型没有特别限制,可以包括但不限于AAV血清型1(AAV1)、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11。在一些实施方案中,AAV是嵌合的,意味着它包含来自至少两种AAV血清型的组分,例如AAV2的ITR和AAV5的衣壳蛋白。在一些实施方案中,基因治疗可包含施用多种AAV基因治疗载体,及载体可以是相同或不同的血清型。

在一些实施方案中,AAV是在人类细胞或非人类灵长类动物细胞中发现的,例如恒河猴细胞或食蟹猴细胞。

在一些实施方案中,AAV衣壳不是野生型衣壳而是重组AAV(rAAV),例如rAAV2/5,其包含AAV2和AAV5的至少一部分。例如,VP1衣壳蛋白可以由AAV2和AAV5之间的杂交氨基酸序列组成,而VP2和VP3衣壳可以衍生自AAV5血清型(例如,Urabe等人,Scalablegeneration of high-titer recombinant adeno-associated virus type 5 in insectcells.J Virol.2006Feb;80(4):1874-85)。在一些实施方案中,AAV是嵌合AAV(AAV

当向对象施用多个AAV基因治疗载体时,多个AAV基因治疗载体中的至少两个可以是相同类型的AAV,而在一些实施方案中,多个AAV基因治疗载体中的至少两个可以是不同类型的AAV。

治疗性基因

在一些实施方案中,AAV基因治疗载体包含转基因或治疗性基因。转基因或治疗性基因包含编码治疗性蛋白、治疗性RNA或其片段的多核苷酸序列。

治疗性蛋白可以是灵长类蛋白质、非灵长类蛋白质或人蛋白质。在一些实施方案中,治疗性蛋白质可包括但不限于因子IX(FIX)、因子VIII(FVIII)及其修饰形式,包括变体、衍生物或等价物。在一些实施方案中,治疗性基因可包括但不限于α-1抗胰蛋白酶(AAT)、芳香族氨基酸脱羧酶(AADC)、ATP酶肌浆/内质网Ca2+转运2(ATP2A2)、囊性纤维化跨膜传导调节因子(CTFR)、谷氨酸脱羧酶65kDa蛋白(GAD65)、谷氨酸脱羧酶67kDa蛋白(GAD67)、脂蛋白脂肪酶(LPL)、神经生长因子(NGF)、神经营养因子(NTN)、胆色素原脱氨酶(PBGD)、肌聚糖α(SGCA)、可溶性fms样酪氨酸激酶-1(sFLT-1)、S100钙结合蛋白A1(S100A1)、运动神经元生存1(SMN1)、三肽基肽酶1(TPP1)、肿瘤坏死因子受体(TNFR)-免疫球蛋白(IgG1)Fc融合体(TNFR:Fc)、干扰素β(IFN-β)、神经肽Y受体Y2、α葡萄糖苷酶、C9orf72、超氧化物歧化酶(SOD)、CFTR、α-半乳糖苷酶、α-N-乙酰半乳糖胺酶、尿酸酶、软骨素酶、HexA、HexB及其修饰形式。

转基因和/或治疗性基因也可以与基因编辑有关。基因编辑是基因工程的一种类型,其中使用工程核酸酶或“分子剪刀”在活生物体的基因组中插入、缺失或替换DNA。目前可以使用四类基因编辑,其包括大范围核酸酶、锌指核酸酶(ZFN)、基于转录激活因子的效应子核酸酶(TALEN)和成簇的规则间隔短回文重复CRISPR-Cas系统。所利用的AAV载体可以被工程化使得基因编辑能力是瞬时的,以允许内源基因被编辑。核酸酶在基因组中的期望位置产生位点特异性双链断裂(DSB)。随后通过非同源末端连接(NHEJ)或同源重组(HR)修复诱导的双链断裂,从而产生靶向的突变。例如,一个或多个AAV基因治疗载体可以编码靶向特定基因序列的基因。靶向基因可以是患病基因,其治疗目的是破坏患病基因的表达。另一种方法可以旨在修复患病基因,例如与X连锁相关疾病或显性疾病相关基因。通过例如同源重组,一个或多个AAV基因治疗载体可以编码用于插入/替换和/或用于修复与疾病相关的基因的基因编辑序列和DNA序列。

在上述方面的一些实施方案中,AAV基因治疗载体可含有编码干扰RNA(siRNA);微RNA(miRNA);或短发夹RNA(shRNA)的多核苷酸。在一些实施方案中,siRNA、miRNA或shRNA靶向并沉默或下调与疾病相关的基因。例如,沉默的靶基因可以包括Htt基因、C9orf72基因等,即与重复序列病症(例如三核苷酸(即聚谷氨酰胺或非聚谷氨酰胺疾病)或六核苷酸重复序列病症)相关的基因。在一些实施方案中,治疗性RNA干扰编码涉及疾病的蛋白质的基因表达。

治疗剂

在一些实施方案中,公开的方法可包含一种或多种治疗剂,这些治疗剂可以在施用AAV基因治疗载体之前、同时或之后施用。

本领域技术人员将理解,适于公开的方法和药盒的其他治疗剂可包括针对本文公开的疾病和状况的常规疗法。

施用方法

根据一些实施方案,提供了治疗有需要的对象中的遗传疾病或状况的方法,所示方法包含施用本文所述的任一种合成多核苷酸中的表达盒、包含表达盒的载体、和/或重组病毒颗粒,从而在对象的肝中表达治疗性肽。

在一些实施方案中,对象是哺乳动物。在一些实施方案中,哺乳动物是人类。

根据一些实施方案,提供了在肝细胞中表达转基因的方法,该方法包含使肝细胞与包含本文所述的任一种合成多核苷酸的表达盒或包含该表达盒的载体接触。

根据一些实施方案,提供了根据本文所述的任一实施方案的合成核酸序列、包含根据本文所述的任一实施方案的合成核酸序列的表达盒、或包含表达盒的载体,其用于医学治疗遗传疾病或状况。

公开的方法包含施用至少包含一个公开的肝特异性启动子的AAV基因治疗载体。在一些实施方案中,AAV基因治疗载体可以与一种或多种另外的治疗剂或与一种或多种被设计为防止载体被网状内皮系统清除的饱和剂同时或依次施用。

例如,饱和剂可以在AAV基因治疗载体之前施用。在一些实施方案中,在施用AAV基因治疗载体之前的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、或150或更多分钟或1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多小时施用该饱和剂。

类似地,在一些实施方案中,在施用一种或多种治疗剂之前的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、或150或更多分钟、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多小时施用AAV基因治疗载体。或者,在一些实施方案中,在施用一种或多种治疗剂之后的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、或150或更多分钟、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24或更多小时施用AAV基因治疗载体。

施用所公开方法的组分的持续时间也可以变化。例如,至少包含一种公开的肝特异性启动子的AAV基因治疗载体可以通过连续输注施用。因此,在一些实施方案中,AAV基因治疗载体的施用可以延长至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、或150或更长分钟。类似地,当公开的方法进一步包括施用另外的饱和剂或一种或多种治疗剂时,这些组分的施用可以延长至少1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、或150或更长分钟。

在一些实施方案中,本文公开的包含施用AAV基因治疗载体的方法为全身施用。全身施用可以是肠内或胃肠外。合适的肠内施用途径可包括但不限于口服、舌下和直肠施用。合适的肠内施用途径可包括但不限于吸入、注射和透皮施用。出于本公开的目的,优选的注射途径包括静脉内、肌内、皮下、动脉内、关节内、鞘内和皮内注射。

在一些实施方案中,本文所述方法的实施导致与已知的非特异性启动子相比,肝中治疗性基因或感兴趣基因的表达增加至少10%、至少20%、至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%或更多。在一些实施方案中,与已知的启动子相比,合成多核苷酸使表达增加至少1.2倍–1.8倍、1.5倍-2.5倍、2倍-5倍、4倍-10倍、5倍–20倍、或10倍–100倍。

在一些实施方案中,本文所述方法的实施导致与已知的肝特异性启动子(例如LP-1启动子)相比,肝中治疗性基因或感兴趣基因增加至少10%、至少20%、至少30%、至少40%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%或更多。在一些实施方案中,与已知肝特异性启动子,例如LP-1启动子相比,合成多核苷酸使表达增加至少1.2倍–1.8倍、1.5倍-2.5倍、2倍-5倍、4倍-10倍、5倍–20倍、或10倍–100倍。

剂量和剂型

在一些实施方案中,公开的方法包含特定剂量的包含至少一个公开的肝特异性启动子的AAV基因治疗载体。AAV基因治疗载体的剂量可以是例如1x10

在一些实施方案中,与不与饱和剂施用时的相同AAV基因治疗载体的剂量相比,与饱和剂共同施用时AAV基因治疗载体的剂量更少。在一些实施方案中,与不与饱和剂共同施用的AAV基因治疗载体的剂量相比,与饱和剂共同施用导致AAV基因治疗载体的剂量减少至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、或75%。

适应征

公开的治疗方法可用于治疗各种遗传病症和疾病。可以用所公开的方法治疗的遗传疾病和病症包括但不限于遗传性胆汁淤积、威尔森氏病、遗传性血色病、1型酪氨酸血症、α-1抗胰蛋白酶缺乏、精氨基琥珀酸尿、肝癌、糖原贮积病、尿素循环病症、克里格勒-纳贾尔综合征、家族性淀粉样多神经病、非典型溶血性尿毒症综合征-1、原发性尿草酸盐过多1型、枫糖尿病、急性间歇性卟啉病、凝血不良、GSD 1A型、纯合性家族性高胆固醇血症、有机酸尿症、囊性纤维化、红细胞生成性原卟啉病、戈谢病、血友病A、血友病B、家族性高胆固醇血症、鸟氨酸氨甲酰基转移酶缺乏症(OTC)、苯丙酮尿症(PKU)、急性间歇性卟啉病(AIP)、年龄相关性黄斑变性、肌萎缩侧索硬化(ALS)、囊性纤维化、瘫痪、阿尔茨海默病、帕金森病、亨廷顿病(HD)、关节炎、巴顿病、卡纳万病、瓜氨酸血症1型、类风湿性关节炎、癫痫、充血性心力衰竭、囊性纤维化、Duchene肌营养不良症、血脂异常、糖原贮积病I型(GSD-I)、遗传性肺气肿、纯合性家族性高血糖(HoFH)、Leber先天性黑矇、甲基丙二酸血症、脊髓性肌萎缩症、瘫痪、癫痫、庞皮病、泰萨克斯病、高草酸尿症(PH-1)、脊髓小脑共济失调1型(SCA-1)、SCA-3、u-肌营养不良蛋白、高雪氏病II型或III型、致心律失常性右心室心肌病(ARVC)、法布里病、家族性地中海热(FMF)、丙酸血症、脆性X综合征、Rett综合征、尼-皮氏病(Niemann-Pick)和克拉伯病。

在一些实施方案中,AAV基因治疗载体可用于治疗溶酶体贮积病症(lysosomalstorage disorders)、代谢病症和凝血病症。

溶酶体贮积病症可能是由于缺乏分解身体细胞中某些脂质(脂肪)或碳水化合物(糖)的特定酶。由于身体无法分解酶靶向的脂肪或碳水化合物进行再循环,这些可能会在细胞溶酶体中积聚,破坏正常功能,导致溶酶体贮积病症。溶酶体病症可包括法布里病、克拉伯病(小儿或晚期发作)、半乳糖唾液酸苷贮积症、法布里病(α-半乳糖苷酶A)、辛德勒病(α-半乳糖苷酶B)、β-半乳糖苷酶/GM1神经节苷脂、GM2神经节苷脂、戈谢病I型、II型和III型、鞘磷脂酶、溶酶体酸性脂肪酶缺乏症、尼-皮氏病A和B型、硫脂累积病、皂素B缺乏症(Saposin B deficiency)、多发性硫酸酯酶缺乏症、粘多糖积累病I型(Hurler/Scheie),II(Hunter),III(Sanfilippo),IV(Morquio),VI(Maroteaux)、VII(Sly)和IX(透明质酸酶缺乏症),粘脂质累积I型、II型、III型和IV型,尼-皮氏病,神经元蜡样质脂褐质沉积病1型、2型、3型、4型、5型、6型、7型、8型、9型、10型、酸性脂酶缺乏症(Wolman disease)、α-甘露糖苷病、β-甘露糖苷病、天冬氨酸糖胺尿症、岩藻糖苷病、溶酶体转运病、胱氨酸病、致密成骨不全症、唾液酸贮积病(Salla disease)、婴儿游离唾液酸贮积病、糖原贮积病如庞皮病和Danon病、胆固醇酯贮积病。

代谢病症可包括鸟氨酸氨甲酰基转移酶缺乏症、苯丙酮尿症、丙酸血症、甲基丙二酸血症、原发性高草酸尿症等。

凝血病症可包括凝血因子VII、VIII、IX和X、XI、V、XII、II、Willebrand因子缺乏症、FV/FVIII联合缺乏症、地中海贫血。

例如,在一些实施方案中,血友病A或B可以使用公开的方法通过向对象施用编码FIX或其变体的AAV基因治疗载体来治疗。在一些实施方案中,AAV基因治疗载体可以是AAV5血清型,且治疗性基因(即编码FIX的基因)可以受公开的肝特异性启动子之一的控制。此外,在一些实施方案中,治疗性FIX蛋白可包含一个或多个插入、缺失或替换。

实施例

给出以下实施例以说明本公开。然而,应当理解,本发明不限于实施例中描述的特定条件或细节。

实施例1——确定组成型启动子元件

进行了肝细胞数据集的荟萃分析,以确定用于顺式元件选择的候选基因。对微阵列和NGS数据集和科学文献进行了查阅,以确定在靶细胞类型中表达水平非常高的基因。

实施例2——选择包含在肝细胞合成启动子文库的顺式调节元件

确定了合适的肝相关的基因集后,接下来对所选基因的启动子区域进行分析,以确定所选启动子中负责转录调节的顺式调节元件(CRE)和其他特征。使用三种方法确定将被掺入合成启动子文库构建的顺式元件,导致选择至少SEQ ID NO:1-19。

确定的顺式元件分别用于创建不同的文库。通过肝特异性基因启动子数据库(LSGPD)和文献检索,确定了调节肝特异性基因的相关复合元件。这些复合元件随后被用于设计新的合成启动子。

实施例3——创建肝特异性的合成启动子文库筛选载体

筛选载体基于pUC19骨架(合成启动子文库+核心启动子元件+GFP)。在最小启动子序列上游克隆合成启动子文库。该序列包含招募RNA聚合酶II复合体所必需的元件,并包含转录起始位点。最小启动子序列显示基础转录活性和文库序列克隆上游设计为增强其活性和特异性。

实施例4——测定目标细胞类型的转染效率

在检查不同筛选载体的活性之前,建立了两个选定的肝细胞系(HepG2和Huh7)最佳转染所需的条件。在HepG2和Huh7细胞中测量了来自CMV立即早期(CMVIE)启动子(SEQ IDNO:108)的萤火虫萤光素酶基因表达效率。根据细胞文库的建议生长和维持所有细胞系。

用pCMVIE_Luc转染细胞使用不同的转染物质进行,包括FugeneHD转染物质(Promega#E2311)(以DNA:FuGeneHD比率1:1.1)。转染后24小时测量萤光素酶活性。用磷酸盐缓冲盐水(PBS)洗涤细胞,在100μl被动裂解缓冲剂(Promega#E194A)中裂解,并在-80℃储存过夜。使用萤光素酶报告子1000测定系统(Promega#E4550)按照制造商的说明在10μl裂解物中使用96孔平底白色固体微孔板FluoroNunc平板(ThermoFisher#236105)从在FLUOstar Omega读板器(BMG Labtech)的机器中定量的发光值来对萤光素酶活性进行定量。已证明FugeneHD在选定的肝细胞系中介导了最佳转染效率,因此被选为所有未来实验的转染物质。

接下来,在不同肝细胞类型中筛选所有启动子文库,以确定在体外所有细胞类型中具有最大活性的肝特异性启动子。通过荧光激活细胞分选(FACS)来进行选择肝细胞类型的筛选。启动子与绿色荧光蛋白(GFP)可操作地连接,并使用FACS分析评估Huh7和HepG2细胞中GFP的表达。图1是在CMV启动子(图1)下与表达GFP的构建体相关的实例。该数据显示Huh7和HepG2细胞均被表达GFP的构建体有效转染,并使用FACS评估活性。转染24小时后测量表达效率,且发现超过15%的细胞表达GFP。

实施例5——最小启动子活性的测试和用于文库筛选的筛选载体的选择

在对已知的肝特异性的基因的多种天然启动子驱动表达进行详细分析的基础上,选取最小启动子序列插入合成的启动子筛选载体中(图2)。示出了推定的TATA-box(以粗体显示)、起始子序列(下划线)和TSS(以粗体带双下划线显示)元件。设计筛选载体,使得顺式调节元件的组合可以被克隆在选定的最小启动子序列上游随机组合中。

接下来,评估每个单个最小启动子序列的转录活性,以选择用于文库筛选的最佳最小启动子(图3)。每个最小启动子在Huh7细胞中显示出基础水平的转录活性,因此是包含在合成启动子文库筛选载体中的合适候选者。

在HepG2细胞中监测转录活性(图4)。与Huh7细胞相比,HepG2细胞的转录活性有些高。G6PC和SERPINE1被确定为具有最低的基础活性,并因此是筛选载体中包含的最小启动子的最佳候选者。

实施例6——构建筛选文库和筛选转染入肝细胞的载体

三组不同的肝特异性的转录因子结合位点(或顺式元件)被用来创建三个不同的合成文库。

然后将三个合成启动子文库中的每一个克隆到紧邻G6PC最小启动子上游的筛选载体中。在最小启动子的下游,存在GFP筛选载体。每个所获的合成的启动子文库的复杂度(complexity)如表4所示。

表4

为了创建尺寸小于250bp的启动子,从每个荟萃分析中制作衍生文库,并对每个文库进行尺寸分级(fractionated),使每个潜在的启动子候选者的尺寸小于300bp。这些尺寸分级的文库的复杂度如表5所示。

表5

基于荟萃分析选择示例性文库SYN_L1_UNQ用于在不同肝细胞中进行额外筛选。

实施例7——使用FACS分析评估来自肝细胞文库中的启动子候选者活性

然后用FugeneHD物质将肝特异性的合成的启动子文库转染到Huh7和HepG2细胞中。24小时后,通过FACS评估GFP表达,并且如果细胞显示出大于104个单位的荧光强度,则对细胞进行分选(图5)。然后裂解分选的细胞,并通过PCR拯救启动子候选者。图6说明了从HepG2细胞拯救的启动子(A1到A7,框图B)和从Huh7细胞拯救的启动子(A8到A11;框图C)。启动子尺寸范围为从200bp到700bp。

将从转染的HepG2和Huh7细胞的FACS筛选中拯救的11启动子候选者(A1-A11)亚克隆到萤火虫萤光素酶基因上游的pGL4.10中,并且然后通过萤光素酶测定验证它们的活性(图7)。在这个实例中,无论哪种细胞类型启动子被筛选(即衍生自HepG2还是衍生自Huh7),最佳分离的启动子候选者在Huh7细胞中始终更活跃。

评估了原代人类肝细胞中启动子候选者的活性。在确定这些细胞的最佳转染条件后,我们用启动子候选者#A2、#A4和#A11转染原代肝细胞,并使用萤光素酶报告子系统监测表达(图8)。LP-1启动子在原代肝细胞中具有有限的活性,而合成启动子#A2和#A4在这种细胞类型中的具有高达五倍的活性。#A2、#A5和#A11的示意图如图28-30所示。

PCR拯救的结果(图6A)说明发明人能够从初步筛选中拯救大范围的启动子。与其尝试从该范围的启动子中分离单个克隆,不如进行次级筛选,由此将来自PCR拯救的所有片段重新克隆到筛选载体中,并在Huh7和HepG2细胞中重新筛选(图9)。

然后将从次级筛选中被拯救的单个启动子候选者插入pGL4.10中萤火虫萤光素酶基因的上游,并通过萤光素酶测定确定每个单个启动子介导的表达水平(图10)。启动子B1从HepG2细胞的初级和次级筛选中分离,启动子B2、B3和B4从Huh7细胞的初级筛选和HepG2细胞的次级筛选中分离,而启动子B5从Huh7细胞的初级和次级筛选中分离。基于该次级筛选,只有启动子B4比LP-1启动子具有更高的活性,并在HepG2细胞中具有高出3倍的活性,在Huh7细胞中具有高出7倍的活性。

在人原代肝细胞中将启动子B4的活性与LP-1启动子进行比较(图11)。确定启动子候选者B4具有高出2.5倍的活性。当将B4与其他启动子候选者进行比较时,B4具有与A5相同的活性,但在人原代肝细胞中显示出A2的一半的活性。

使用上述基于FACS筛选和PCR-拯救方法在人原代肝细胞中筛选了原始肝特异性的合成启动子文库。使用FugeneHD用文库转染肝细胞,根据与肝细胞系中使用的相同的门控策略进行门控,并如前所述裂解分选的细胞并拯救启动子。然后将单个启动子克隆到pGL4.10中并监测萤光素酶的表达(图12)。原代肝细胞筛选的结果显示,启动子#C13、#C14和#C81比LP-1启动子更有活性(图12)。重复该转染以证实这一观察结果,并发现启动子#C14始终比LP-1更有活性,具有高出12倍的活性(图13)。

在肝细胞系HepG2和Huh7中检测了启动子#C13、#C14和#C81的活性,以监测启动子活性如何随细胞类型而变化(图14)。在该实例中,与Huh7相比,从原代肝细胞中分离出的所有启动子在HepG2细胞中的活性更高(C81在HepG2细胞中的活性比LP-1高近50倍)。在原代肝细胞、HepG2细胞和Huh7细胞中,启动子#C14始终比LP-1启动子具有更高的活性。表6总结了从不同肝细胞类型的不同文库筛选中分离出的选定启动子候选者的表达活性。

表6

在这个实例中,启动子#B4和#C14在所有细胞类型和不同实验中始终具有更高的活性。启动子#C13和#C81在不同实验中的肝细胞中的活性显示出显著差异性,而且在不同细胞类型中还显示出高水平的表达。在图31和32中提供了#C13和#C81的示意图。

实施例8——启动子候选者的合理设计

除了实施例1-7中描述的随机混编方法来制备启动子候选者之外,发明人还使用了合理设计方法来制备另外新的启动子候选者。已知若干种包含转录因子结合位点基序的进化保守簇的顺式作用调节元件(CRE),并且CRM8已被鉴定为在肝中特别有效地表达。因此,衍生自SERPINA1的-137/-37片段被用作合理设计HS_CRM8变体的起点(De Simone等,“Cis-and trans-acting elemenst responsible for cell-specific expression ofhumanα1-antitrypsin gene”,EMBO Journal,vol.6,no.9,pp.2759-2766,1987)。基于生物信息学预测,选择具有推定TSS活性的较短序列并将其放在合成顺式调节模块(CRM)的3'端。CRE的方向和位置是基于生物信息学预测和从广泛的文献综述中推断出的肝特异性转录因子之间正负相互作用的层次结构来确定的。这种合理设计的CRM(也称为复合增强子元件)的活性在各种不同的肝细胞类型中进行了测试。

在不同肝细胞类型中检测了合理设计的CRM的活性。肝特异性CRM的第一次迭代显示出显著的转录活性(图15)。

数据显示,CRM本身(即没有可操作地连接的最小启动子)在HepG2细胞中与LP-1启动子具有相同的活性,在Huh7细胞中具有高出5倍的活性。

接下来,在SERPINE1最小启动子上游克隆CRM,以确定CRM是否会作为转录增强子。检查表达强度(图16)。

在CRM下游添加最小启动子增强了表达强度,使其在Huh7细胞中比LP-1具有高出9倍的活性,且在HepG2细胞中比LP-1具有高出2倍的活性。

接下来,在三个不同的肝细胞系(HepG2、Huh7和HepaRG)中检测了每个最小启动子对CRM活性的影响(图17)。所有最小启动子介导了类似的表达强度的增加,但SERPINA1介导了CRM表达强度增加最高。

鉴于启动子尺寸对选择合适的启动子进行进一步体内分析的重要性,进一步修饰了衍生自G6PC最小启动子的启动子,以通过去除间隔区来减小整体尺寸并监测尺寸减小对启动子活性的影响。通过去除间隔区元件将尺寸从307bp减小到241bp,发明人能够略微增加启动子的活性。将其尺寸进一步减小到226bp对Huh7和HepG2细胞的表达强度有负面影响,但对HepaRG细胞的表达强度有正面影响。图18显示了所有合理设计的启动子在不同细胞类型中和每个启动子尺寸的活性。

在人原代肝细胞中检查了合理设计的启动子的活性。使用FugeneHD,使用本文所述的条件,用表达萤火虫萤光素酶的合成启动子构建体转染在2%FBS中生长的原代细胞。转染结果示于图19。合理设计的启动子介导的肝细胞表达水平远高于LP-1启动子介导的表达水平。表达谱与肝细胞系中所见的表达谱相似,因为与其他最小启动子构建体相比,SERPINA1介导了最高水平的蛋白质表达。

如在不同细胞类型中所评估的,每个合理设计的启动子相对于LP-1启动子的表达的增加倍数的总结如表7所示。

表7

在该实施例中,发现LP-1启动子在HepG2和HepRG细胞中活性最高,而在Huh7和原代人肝细胞中活性最低。这意味着,当比较LP-1与不同合成启动子候选者的活性时,可以看到Huh7和原代人肝细胞的更高的增加倍数。令人惊讶的是,LP-1在原代细胞中具有非常有限的活性,表明这可以是启动子如何设计和选择的结果。

实施例9——在一系列的细胞系中测试肝细胞启动子序列以证明与LP1启动子的谱相比的特异性和活性

评估了衍生自其他组织的细胞系中不同启动子候选者的活性。用所有已确定的合成启动子候选者转染Hela(卵巢癌)、293(人胚胎肾)和A549(肺腺癌)细胞,以确定每个启动子对肝细胞的特异性水平。

然后将启动子的活性与该细胞类型中由CMVIE启动子介导的表达活性进行比较。图20显示LP-1启动子在A549细胞中有5%的CMVIE活性,但在其他两种细胞类型中没有活性。合成启动子中,在A549中,G6PC_COMP_V1、G6PC_COMP_V3和APOC2_COMP均介导了相似水平的表达。而SERPINA1_COMP、SERPINE1_COMP和G6PC_COMP在这些细胞中介导更高水平的表达。在该实例中,没有启动子构建体在293和Hela细胞中显示出任何可测量的活性。

接下来,在不同的非肝细胞系中评估了文库筛选的启动子的活性。从在肝细胞系Huh7和HepG2中筛选的启动子中,A2、A5和B4显示出类似LP-1启动子显示的特异性水平,即它们未在293和Hela细胞中介导表达,而在A549细胞中介导了低于5%的CMV表达(图21)。与其他启动子候选者相比,启动子A11在A549细胞中显示出显著更高水平的表达(>15%的CMVIE表达)。

在三个选定的非肝细胞系中测试了衍生自肝细胞筛选文库的启动子的特异性(图22)。在该实验中,在A549细胞中,相比于LP-1启动子以前的表达量(18%的CMVIE),LP-1启动子介导了几乎4倍的表达量。一般来说,A549细胞中的活性比以前观察到的要更高。特别是,在A549中,启动子#C14(60%的CMVIE)和#C81(90%的CMVIE)介导了高水平表达,而#C13(22%的CMVIE)介导了与LP-1启动子看到的相似的表达水平。正如所有其他启动子所观察到的那样,衍生自原代肝细胞中筛选的启动子候选者在293和Hela细胞中没有显示出可测量的活性。

如图7-14和21-22中所使用的选定的启动子序列的序列对应于SEQ ID NO:36(#A2)、SEQ ID NO:37(#A4)、SEQ ID NO:38(#A11)、SEQ ID NO:39(#C13)、SEQ ID NO:40(#C81)、SEQ ID NO:32(#B4)、SEQ ID NO:34(#C14)。如图15-20中所使用的选定的启动子序列的序列对应于SEQ ID NO:23(COMP)、SEQ ID NO:30(SERPINE1_COMP)、SEQ ID NO:29(SERPINA1_COMP)、SEQ ID NO:21(APOC2_COMP)、SEQ ID NO:25(G6PC_COMP)、SEQ ID NO:26(G6PC_COMP_v1)、SEQ ID NO:28(G6PC_COMP_v3)。

下表列出了每个启动子的示例性特征。

表8

实施例10——肝特定启动子序列的缩短和修饰

G6PC_COMP_v1、#B4和#C14

为了减少目前生成的启动子序列的尺寸,从原来的启动子设计中缺失了克隆接头(adaptor)和附带(accessory)序列。在设计过程结束时,在AAV质粒骨架中的报告子构建体(reporter constructs)中进一步研究了16个启动子序列的组合,包括原始版本和尺寸缩小版本。这些16个候选者列于表1中,分别为SEQ ID NO:21-35,包括原始构建体和尺寸缩小的合成多核苷酸(均来自复合启动子序列和#B4(SEQ ID NO:32)和#C14(SEQ ID NO:34)序列)。图23显示了用这些构建体获得的示例性结果。简而言之,图23A显示了用编码启动子加报告子的质粒DNA进行体外转染的数据。图23B显示了现在通过AAV感染引入细胞的相同启动子+报告子的活性。图23C和23D显示了注射AAV载体的小鼠在2周和6周后所获得的出血情况。图23E显示了在对小鼠施用AAV-prom-报告子后6周肝中每μg DNA的AAV基因组数量。

出于体内实验的目的,小鼠被注射了公开的合成启动子构建体,该构建体位于包含由合成启动子之一驱动的表达盒(SEAP)的重组AAV2衣壳中。小鼠(C57BL/6J)被尾静脉注射5x10

包含的其他变体是启动子序列,其具有反向的、混编的或缺失的启动子元件。SEQID NO:6元件是复合元件,其中包含的元件被进一步修饰以确定在启动子G6PC_COMP_v1的背景中可能进一步尺寸的减小和/或可能改进基因表达。其他变体列于表1和2中,对应于SEQ ID NO:26(G6PC_COMP_v1)的衍生物(即SEQ ID NO:41-45、53-58、67-69、73-85)和SEQID NO:33和35的衍生物(即SEQ ID NO:46-52、59-66和70-72)。SEQ ID NO:41-85如图25-27所示进行筛选,其显示了这些构建体的示例性结果。图25中被测试的构建体以SEQ ID NO:26标准化,SEQ ID NO:30用作阳性对照。图26中被测试的构建体以SEQ ID NO:33标准化,图27中被测试的构建体以SEQ ID NO:35标准化。

如所述,SEQ ID NO:5元件是复合元件,其中包含的元件被进一步修饰以确定可能进一步尺寸的减小和/或可能改进基因表达。此外,SEQ ID NO.5的缺失显著降低了基因表达(见图29、01),表明该复合元件对于表达很重要。使用G6PC_COMP_v1启动子作为起始点,通过引入突变、引入缺失、反向元件来对SEQ ID NO:5序列进行修饰,并与包含SEQ ID NO:5的较大元件(SEQ ID NO:100)进行比较。发现SEQ ID NO:100的较大序列与SEQ ID NO:5相比具有相同的活性(数据未显示)。所有测试的修饰证实SEQ ID NO:5允许广泛变异,允许间隔区元件的缺失以更进一步减小尺寸,并且还允许包含在SEQ ID NO:5中的元件的突变以及反向包含在其中的元件。因此,似乎允许对SEQ ID NO:5进行广泛的修饰,从而证实该序列代表复合元件,及不需要维持其全长序列,且它也可以划分为其他元件,同时仍然有助于肝特异性基因表达。从体外实验来判断,SEQ ID NO:5的前2个核苷酸似乎并不重要,后3个核苷酸也似乎并不重要,且这些可以从SEQ ID NO:5中进一步缺失,同时保留与包含SEQ IDNO:5的启动子基本相同的活性。SEQ ID NO:5中包含的10个核苷酸的间隔区序列也导致启动子具有基本相同的活性。缺失这些序列的组合会进一步减小尺寸,同时保持活性(即最终为51个核苷酸序列)。并且,SEQ ID NO:5的肝特异性启动子中包含的功能元件也可以被反向以及被修饰,这说明这些元件不需要以相同的方式定向,且也不需要彼此靠近。因此,根据结果,优选G6PC_COMP_v1启动子,或者其任何变体,可以定义为包括SEQ ID NO:101(ACTTAGCCCCTGTTTGCTCCTCCG),和SEQ ID NO:102(TGACCTTGGTTAATATTCACCAGC)中的一个或多个,优选SEQ ID NO:101和SEQ ID NO:102。应理解,此类肝特定的启动子还可包含SEQID NO:101和/或SEQ ID NO:102的变体,或其中之一或两者的反向互补。因此,在本文的描述中,无论SEQ ID NO:5包括在肝特定的启动子中的任何地方,作为SEQ ID NO:5的替代,所述启动子可以定义为包括SEQ ID NO:101和/或SEQ ID NO:102,或SEQ ID NO:101和/或SEQID NO:10的2功能等价物。

此外,如图26所示,由SEQ ID NO:5制备的许多变体导致启动子与SEQ ID NO:5相比具有非常相似的活性,尽管略有降低,但与LP1相比仍保留了活性的实质性改进。因此,SEQ ID NO:5的复合元件的变体可以定义为包含SEQ ID NO:101和选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:103(CCCTGTTTGCTCCTCCG和选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:105(CCCTGTTTGCTCC)和序列TCCG及选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:105和序列TTAG及选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:107(CCCTATTTACTCC)和序列TCCG及选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA);或包含SEQ ID NO:107和序列TTAG及选自以下序列的复合元件:SEQ ID NO:102、SEQ ID NO:104(TGGTTAATATTCACCAGC)、SEQ ID NO:106(TGACCTTGGTTAATATTCACCA)。应理解,所述复合元件优选地具有小于60个核苷酸的序列长度。应理解,复合元件的组分也可以是与其相反的互补序列,如实施例所示。

经修饰的启动子的活性仍然比LP1的活性高,与原始构建体相比,一些修饰降低了活性,而一些修饰更进一步改善了较高的活性。元件的缺失对活性的影响更为显著,这支持了元件的组合效应而不是单个元件的强度。

实施例13——在原代人肝细胞中测试AAV构建体

不仅通过人原代肝细胞中的感染筛选报告子构建体,而且还通过Huh-7、HepG2和HepaRG中的感染筛选报告子构建体。通过转染评估报告子构建体,以检查质粒骨架与AAV基因组背景下启动子活性的相关性。SEAP用作报告子。

在转染实验中,在转染后48小时测定SEAP。在某些细胞系中感染24、48和/或72小时后测定SEAP活性以优化测定时间;结果显示出完全与进行测定时的时间无关的相关性。

转染报告子构建体:启动子候选者在GeneArt合成并克隆到pVDX载体中(UNQ)。通过在Huh7、HepG2和HepaRG细胞中转染来测试报告子构建体。SEQ ID NO:23和24在所有测试的细胞系中显示出比LP1更低的活性(图24)。这在意料之中,因为这些启动子是从原始的COMP片段衍生出来的,由显示为肝特异性的调节元件组成,但在其3'端缺少经典的最小启动子序列。其余报告子构建体在所有测试的细胞系中显示出与LP1相当或更高的活性。SEQID NO:27和28在所有测试的细胞系中表现最好。在人原代肝细胞中,通过转染测试的所有报告子构建体显示出比LP1更高的活性(图24)。

通过AAV的转导:UNQ产生了用于小鼠研究的病毒制剂(AAV2血清型),其也在Huh7、HepaRG和人原代肝细胞中进行了测试(MOI 10

当在AAV基因组的背景下进行测试时,观察到一些启动子候选者的表现有所提高。与使用标准萤光素酶报告质粒(来自Promega的pGL4.10和SYNP报告载体)的转染实验结果相比,在启动子G6PC_COMP_v1(SEQ ID NO:26)情况中这种效果相当显著。在之前Huh7中使用萤光素酶作为转录报告子和缺乏SV40内含子的LP1作为参考的转染实验中,G6PC_COMP_v1显示出比LP1高约10倍的活性。在AAV骨架背景下在Huh7中测试转染时,G6PC_COMP_v1显示的活性是完整版LP1启动子(包括SV40内含子)的50倍以上。参见图25(其中SEQ ID NO:20=LP1和SEQ ID NO:26=G6PC_COMP_v1)。Huh7中通过AAV报告子质粒转染和AAV颗粒转导所测试的启动子活性具有很好的相关性。

参考实施例14——HCR-hAAT、LP1和HLP启动子性能比较

熟知的HCR-hAAT启动子(Nathwani等,Blood 2006;107(7):2653-2661)及其缩短版本包括LP1(Nathwani等,2006supra)和HLP(McIntosh等,Blood.2013;121(17):3335-44)在体外测试了它们通过转染Huh-7细胞驱动FVIII蛋白质表达的能力。

转染分析和细胞

使用lipofectamine3000物质将编码不同密码子优化的FVIII编码序列的三个构建体(分别命名为GD6、GD4和COSX)转染到Huh-7细胞中。共转染海肾萤光素酶质粒以校正转染效率。通过在转染后2天收集上清液并通过ELISA(Affinity Biologicals)测量抗原水平来检测培养基中FVIII的产生。

通过在Huh-7细胞中转染由不同启动子变体驱动的不同浓度的编码FVIII的质粒,将HCR-hAAT启动子与其缩短版本LP1和HLP1启动子进行了效力(potency)的比较。使用ELISA测定上清液中的FVIII蛋白质表达。测试了命名为GD6、GD4和COSX的不同密码子优化的FVIII构建体。图33中的结果表明,原始尺寸的HCR-hAAT启动子在驱动所有构建体的FVIII基因表达方面最有效,其次是LP1启动子。至少在最高浓度使用时,与HLP启动子相比,LP1启动子在体外驱动FVIII表达方面始终更有效(GD4 vs GD6)。

等价物

应当理解,虽然已经结合上述实施方案描述了本发明,但前述描述和实施例旨在说明而不是限制本发明的范围。本发明范围内的其他方面、益处和修饰对于本发明所属领域的技术人员来说将是明显的。

此外,在根据马文库什组描述发明的特征或方面的情况下,本领域技术人员将认识到,发明因此也根据马文库什组的任何单个成员或成员亚组来描述。

在此提及的所有出版物、专利申请、专利和其他参考文献均通过引用明确地整体并入,其程度与每个单独通过引用并入一样。在发生冲突的情况下,以当前说明书(包括定义)为准。在本说明书中,技术文献以作者引文引用,其完整的书目细节在下面提供。

序列表

<110> 优尼科IP有限公司

<120> 肝特异性的病毒启动子及使用其的方法

<130> P6064531PCT

<150> EP18207027.6

<151> 2018-11-19

<160> 108

<170> PatentIn version 3.5

<210> 1

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 1

aagcaaatat ttgtggttat ggattaactc gaa 33

<210> 2

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 2

ctgtttgccc actctatttg ccc 23

<210> 3

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 3

ggcgcccttt ggaccttttg caatcctgg 29

<210> 4

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 4

agcaaacagc aaacac 16

<210> 5

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 5

ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc 60

agcctc 66

<210> 6

<211> 51

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 6

gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc a 51

<210> 7

<211> 65

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 7

tcatctattt cctgcccaca tctggtataa aaggaggcag tggcccacag aggagcacag 60

ctgtg 65

<210> 8

<211> 186

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 8

gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60

gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120

tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180

tgaatc 186

<210> 9

<211> 63

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 9

gagcggaagt gggtctcaac cactataaat cctctctgtg cccgtccgga gctggtgagg 60

aca 63

<210> 10

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 10

gggcatataa aacaggggca aggcacagac tcatagcaga gcaatcacca ccaagcctgg 60

aataactgca gccacc 76

<210> 11

<211> 12

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 11

ttaatattta ac 12

<210> 12

<211> 7

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 12

agcttca 7

<210> 13

<211> 7

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 13

cctttga 7

<210> 14

<211> 14

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 14

tgacctttga acct 14

<210> 15

<211> 14

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 15

ggtaattatt aacc 14

<210> 16

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 16

ctagtagcaa ggctgactac acgagcacat atca 34

<210> 17

<211> 7

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 17

tgagtca 7

<210> 18

<211> 15

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 18

ctggactttg gactc 15

<210> 19

<211> 15

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 19

tcacttcctc ttttt 15

<210> 20

<211> 558

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 20

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360

ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420

caccaccact gacctgggac agtgaatccg gactctaagg taaatataaa atttttaagt 480

gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc aacctttgga 540

actgaattct agaccacc 558

<210> 21

<211> 304

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 21

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca tgctagcctc gaggatatca gatctgagcg 240

gaagtgggtc tcaaccacta taaatcctct ctgtgcccgt ccggagctgg tgaggacagc 300

cacc 304

<210> 22

<211> 238

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 22

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcatg agcggaagtg 180

ggtctcaacc actataaatc ctctctgtgc ccgtccggag ctggtgagga cagccacc 238

<210> 23

<211> 211

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 23

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca t 211

<210> 24

<211> 177

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 24

taaagcaaat atttgtggtt atggattaac tcgaactgtt tgcccactct atttgcccgg 60

cgccctttgg accttttgca atcctggagc aaacagcaaa cacggactta gcccctgttt 120

gctcctccga taactggggt gaccttggtt aatattcacc agcagcctca tgccacc 177

<210> 25

<211> 311

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 25

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca tgctagcctc gaggatatca gatctgggca 240

tataaaacag gggcaaggca cagactcata gcagagcaat caccaccaag cctggaataa 300

ctgcagccac c 311

<210> 26

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 26

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 27

<211> 214

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 27

aagcaaatat ttgtggttat ggattaactc gaaggcgccc tttggacctt ttgcaatcct 60

ggagcaaaca gcaaacacgg cccctgtttg ctcctccgat aactggggtg accttggtta 120

atattcacca gcagcctcgg gcatataaaa caggggcaag gcacagactc atagcagagc 180

aatcaccacc aagcctggaa taactgcagc cacc 214

<210> 28

<211> 228

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 28

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgcccctgtt tgctcctccg 120

ataactgggg tgaccttggt taatattcac cagggcatat aaaacagggg caaggcacag 180

actcatagca gagcaatcac caccaagcct ggaataactg cagccacc 228

<210> 29

<211> 427

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 29

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca tgctagcctc gaggatatca gatctgggcg 240

actcagatcc cagccagtgg acttagcccc tgtttgctcc tccgataact ggggtgacct 300

tggttaatat tcaccagcag cctcccccgt tgcccctctg gatccactgc ttaaatacgg 360

acgaggacag ggccctgtct cctcagcttc aggcaccacc actgacctgg gacagtgaat 420

cgccacc 427

<210> 30

<211> 305

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 30

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca tgctagcctc gaggatatca gatcttcatc 240

tatttcctgc ccacatctgg tataaaagga ggcagtggcc cacagaggag cacagctgtg 300

ccacc 305

<210> 31

<211> 239

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 31

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcatt catctatttc 180

ctgcccacat ctggtataaa aggaggcagt ggcccacaga ggagcacagc tgtgccacc 239

<210> 32

<211> 255

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 32

aagttaatat ttaacatcct agcacagctt cacttccagg tatgaccttt gaacctcttc 60

tagaagggta attattaacc tagctaggta tgaccttcga acctcttcta gaagtgaagc 120

tatgctagta gcaaggctga ctacacgagc acatatcaac gcgtcgacga tatcagatct 180

gggcatataa acaggggcaa ggcacagact catagcagag caattaccac caagcctgga 240

atagctgcag ccacc 255

<210> 33

<211> 193

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 33

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa cctcttctag 60

aagggtaatt attaacctag ctaggtatga ccttcgaacc tcttctagaa gtgaagctgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acc 193

<210> 34

<211> 283

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 34

taggttaata attacccttc taggattgag tcacttctag aagctggact ttggactcat 60

cctagaagtc acttcctctt ttttacctag aagaggttca aaggtcatac ctagcatagc 120

ttcacttcta gaagggtaat tattaaccta gctagtagca aggctgacta cacgagcaca 180

tatcaacgcg tcgacgatat cagatctggg catataaaac aggggcaagg cacagactca 240

tagcagagca atcaccacca ggcctggaat aactgcagcc acc 283

<210> 35

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 35

ggttaataat tacccttcta ggattgagtc acttctagaa gctggacttt ggactcatcc 60

tagaagtcac ttcctctttt ttacctagaa gaggttcaaa ggtcatacct agcatagctt 120

cacttctaga agggtaatta ttaaccgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cc 222

<210> 36

<211> 432

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<220>

<221> misc_feature

<222> (261)..(261)

<223> n is a, c, g, or t

<400> 36

catagcttca cttctagaag aggtcagggt gacctgggcc tacctagcta ggttaataat 60

tacccttcta gaagtgactc aatcctagaa gccggaagtg gcatcctaga agaggttcaa 120

aggtcatacc taggtaaaaa agaggaagtg acttctagga taaggaagta cttctagaag 180

tacttcctta tcctagcata gcttcacttc tagaagaggt tcaaaggtca tacctaggta 240

tgacctttga acctcttcta naagttaata tttaacatcc tagaagggta attattaacc 300

tagcaaggct gactacacga gcacatatca gcgcgtcgac gatatcagac ctgggcatat 360

aaaacagggg caaggcacag actcatagca gagcaatcac caccaagcct ggaataactg 420

cagccaccat gg 432

<210> 37

<211> 224

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 37

gtaaaaaaga ggaagtgact tctagaagag gttcaaaggt catacctagc taggttaata 60

attacccttc tagaagtact tccttatcct agtagcaagg ctgactacac gagcacatat 120

caacgcgtcg acgatatcag atctgggcat ataaaacagg ggcaaggcac agacccatag 180

cagagcaatc accaccaagc ctggaataac tgcagccacc atgg 224

<210> 38

<211> 410

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 38

aagaggtcag ggtgacctgg gcctacctag gataaggaag tacttctaga agtgactcaa 60

tcctagaagg gtaattatta acctagctag gatgagtcca aagtccagct tctaggtagt 120

agggcaaagg tcacttctag gattgagtca cttctaggat gagtccaaag tccagcttct 180

agaagaggtt caaaggtcat acctaggtaa aaaagaggaa gtgacttcta gaagttaata 240

tttaacatcc taggagtcac ttcctctttt ttacctagta gcaaggctga ctacacgagc 300

acatatcaac gcgtcaacga tatcagatct gggcatataa aacaggggca aggcacagac 360

tcatagcaga gcaatcacca ccaagcctgg aataactgca gccaccatgg 410

<210> 39

<211> 297

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<220>

<221> misc_feature

<222> (291)..(291)

<223> n is a, c, g, or t

<400> 39

tttctctggc ctaactggcc ggtaccgtcg actgtgctcg gacctgtaga tgctagtcta 60

gaagaggttc aaaggtcata cctaggataa ggaagtactt ctaggtaggc ccaggtcacc 120

ctgacctctt ctaggataag gaagtacttc tagaagaggt cagggtgacc tgggcctacc 180

tagaagtact tccttatcct aggtatgacc tttgaacctc ttctagacta gcatctacag 240

gtccgagcac agtcgacggt accggccagt taggccagag aaatgttctg ncacctg 297

<210> 40

<211> 263

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 40

tagtagggca aaggtcactt ctagaagccg gaagtggcat cctagaagtg actcaatcct 60

agaagaggtc agggtgacct gggcctacct agaagtgact caatcctagg atgttaaata 120

ttaacttcta gtagcaaggc tgactacacg agcacatatc aacgcgtcga cgatatcaga 180

tctgggcata taaaacaggg gcaaggcaca gactcatagc agagcaatca ccaccaagcc 240

tggaataact gcagccacca tgg 263

<210> 41

<211> 177

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 41

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgggcatata aaacaggggc 120

aaggcacaga ctcatagcag agcaatcacc accaagcctg gaataactgc agccacc 177

<210> 42

<211> 227

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 42

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggggact tagcccctgt ttgctcctcc gataactggg 120

gtgaccttgg ttaatattca ccagcagcct cgggcatata aaacaggggc aaggcacaga 180

ctcatagcag agcaatcacc accaagcctg gaataactgc agccacc 227

<210> 43

<211> 214

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 43

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccagca 60

aacagcaaac acggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 120

atattcacca gcagcctcgg gcatataaaa caggggcaag gcacagactc atagcagagc 180

aatcaccacc aagcctggaa taactgcagc cacc 214

<210> 44

<211> 210

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 44

ctgtttgccc actctatttg cccggcgccc tttggacctt ttgcaatcct ggagcaaaca 60

gcaaacacgg acttagcccc tgtttgctcc tccgataact ggggtgacct tggttaatat 120

tcaccagcag cctcgggcat ataaaacagg ggcaaggcac agactcatag cagagcaatc 180

accaccaagc ctggaataac tgcagccacc 210

<210> 45

<211> 220

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 45

aagcaaatat ttgtggttat ggattaactc gaaggcgccc tttggacctt ttgcaatcct 60

ggagcaaaca gcaaacacgg acttagcccc tgtttgctcc tccgataact ggggtgacct 120

tggttaatat tcaccagcag cctcgggcat ataaaacagg ggcaaggcac agactcatag 180

cagagcaatc accaccaagc ctggaataac tgcagccacc 220

<210> 46

<211> 171

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 46

agcttcactt ccaggtatga cctttgaacc tcttctagaa gggtaattat taacctagct 60

aggtatgacc ttcgaacctc ttctagaagt gaagctgggc atataaacag gggcaaggca 120

cagactcata gcagagcaat taccaccaag cctggaatag ctgcagccac c 171

<210> 47

<211> 155

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 47

ggttaataat tacccttcta ggataggttc aaaggtcata cctagcatag cttcacttct 60

agaagggtaa ttattaaccg ggcatataaa acaggggcaa ggcacagact catagcagag 120

caatcaccac caggcctgga ataactgcag ccacc 155

<210> 48

<211> 198

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 48

tgagtcactt ctagaagctg gactttggac tcatcctaga agtcacttcc tcttttttac 60

ctagaagagg ttcaaaggtc atacctagca tagcttcact tctagaaggg taattattaa 120

ccgggcatat aaaacagggg caaggcacag actcatagca gagcaatcac caccaggcct 180

ggaataactg cagccacc 198

<210> 49

<211> 169

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 49

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa cctcttctag 60

aagtgacctt cgaacctctt ctagaagtga agctgggcat ataaacaggg gcaaggcaca 120

gactcatagc agagcaatta ccaccaagcc tggaatagct gcagccacc 169

<210> 50

<211> 181

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 50

ggttaataat tacccttcta ggattgagtc acttctagaa gctggacttt ggactcatcc 60

tagaagtcac ttcctctttt ttacctagaa gggtaattat taaccgggca tataaaacag 120

gggcaaggca cagactcata gcagagcaat caccaccagg cctggaataa ctgcagccac 180

c 181

<210> 51

<211> 162

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 51

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa cctcttctag 60

aagggtaatt attaacctag ctaggtaggg catataaaca ggggcaaggc acagactcat 120

agcagagcaa ttaccaccaa gcctggaata gctgcagcca cc 162

<210> 52

<211> 121

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 52

ttaatattta acatcctagc acggtaatta ttaacctagc taggtagggc atataaacag 60

gggcaaggca cagactcata gcagagcaat taccaccaag cctggaatag ctgcagccac 120

c 121

<210> 53

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 53

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgaggctgct ggtgaatatt 120

aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 54

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 54

ctgtttgccc actctatttg cccaagcaaa tatttgtggt tatggattaa ctcgaaggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 55

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 55

agcaaacagc aaacacggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg 60

gttaatattc accagcagcc tcaagcaaat atttgtggtt atggattaac tcgaactgtt 120

tgcccactct atttgcccgg cgccctttgg accttttgca atcctggggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 56

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 56

ttcgagttaa tccataacca caaatatttg cttctgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 57

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 57

ctgtttgccc actctatttg cccagcaaac agcaaacaca agcaaatatt tgtggttatg 60

gattaactcg aaggcgccct ttggaccttt tgcaatcctg gggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 58

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 58

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctgggtgtt tgctgtttgc tggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 59

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 59

ggttaataat tacctaccta gaagaggttc aaaggtcata cctagcatag cttcacttct 60

agaagggtaa ttattaaccc ttctaggatt gagtcacttc tagaagctgg actttggact 120

catcctagaa gtcacttcct ctttttgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cc 222

<210> 60

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 60

ggttaataat tacccttcta ggataaaaag aggaagtgac ttctaggatg agtccaaagt 60

ccagcttcta gaagtgactc atacctagaa gaggttcaaa ggtcatacct agcatagctt 120

cacttctaga agggtaatta ttaaccgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cc 222

<210> 61

<211> 193

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 61

ggttaataat tacccttcta gaagaggttc aaaggtcata cctggaagtg aagctgtgct 60

aggatgttaa atattaatag ctaggtatga ccttcgaacc tcttctagaa gtgaagctgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acc 193

<210> 62

<211> 193

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 62

gggcatataa acaggggcaa ggcacagact catagcagag caattaccac caagcctgga 60

atagctgcat taatatttaa catcctagca cagcttcact tccaggtatg acctttgaac 120

ctcttctaga agggtaatta ttaacctagc taggtatgac cttcgaacct cttctagaag 180

tgaagctgcc acc 193

<210> 63

<211> 193

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 63

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa ccttagctag 60

gtatgacctt cgaacctctt ctagaagtga agctcttcta gaagggtaat tattaaccgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acc 193

<210> 64

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 64

ggttaataat tacccttcta ggattgagtc acttctagaa ggagtccaaa gtccagatcc 60

tagaagtcac ttcctctttt ttacctagaa gaggttcaaa ggtcacttct agaagtgaag 120

ctatgctagg taggtaatta ttaaccgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cc 222

<210> 65

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 65

ggttaataat tacccttcta ggattgagtc acttctagaa ggagtccaaa gtccagatcc 60

tagaagtcac ttcctctttt ttacctagaa gaggttcaaa ggtcatacct agcattgaag 120

ctcttctaga agggtaatta ttaaccgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cc 222

<210> 66

<211> 193

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 66

ggtaattatt aacctagcta ggtatgacct tcgaacctct tctagaagtt aatatttaac 60

atcctagcac agcttcactt ccaggtatga cctttgaacc tcttctagaa gtgaagctgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acc 193

<210> 67

<211> 360

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 67

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acagtgaatc cggactctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 300

ctgattctaa ttgtttctct cttttagatt ccaacctttg gaactgaatt ctagaccacc 360

<210> 68

<211> 419

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 68

taaagcaaat atttgtggtt atggattaac tcgaacttct agaagctgtt tgcccactct 60

atttgcccat cctaggtagg cgccctttgg accttttgca atcctggctt ctagaagagc 120

aaacagcaaa cacatcctag gtaggactta gcccctgttt gctcctccga taactggggt 180

gaccttggtt aatattcacc agcagcctca tgctagcctc gaggatatca gatcttcatc 240

tatttcctgc ccacatctgg tataaaagga ggcagtggcc cacagaggag cacagctgtg 300

cagtgaatcc ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac 360

tgattctaat tgtttctctc ttttagattc caacctttgg aactgaattc tagaccacc 419

<210> 69

<211> 360

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 69

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgggcatata aaacaggggc 120

aaggcacaga ctcatagcag agcaatcacc accaagcctg gaataactgc agccacagtg 180

aatccggact ctaaggtaaa tataaaattt ttaaggaggc tgctggtgaa tattaaccaa 240

ggtcacccca gttatcggag gagcaaacag gggctaagtc ctgtataatg tgttaaacta 300

ctgattctaa ttgtttctct cttttagatt ccaacctttg gaactgaatt ctagaccacc 360

<210> 70

<211> 339

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 70

ggttaataat tacccttcta ggattgagtc acttctagaa gctggacttt ggactcatcc 60

tagaagtcac ttcctctttt ttacctagaa gaggttcaaa ggtcatacct agcatagctt 120

cacttctaga agggtaatta ttaaccgggc atataaaaca ggggcaaggc acagactcat 180

agcagagcaa tcaccaccag gcctggaata actgcagcca cagtgaatcc ggactctaag 240

gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat tgtttctctc 300

ttttagattc caacctttgg aactgaattc tagaccacc 339

<210> 71

<211> 310

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 71

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa cctcttctag 60

aagggtaatt attaacctag ctaggtatga ccttcgaacc tcttctagaa gtgaagctgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acagtgaatc cggactctaa ggtaaatata aaatttttaa gtgtataatg 240

tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg gaactgaatt 300

ctagaccacc 310

<210> 72

<211> 341

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 72

ttaatattta acatcctagc acagcttcac ttccaggtat gacctttgaa cctcttctag 60

aagggtaatt attaacctag ctaggtatga ccttcgaacc tcttctagaa gtgaagctgg 120

gcatataaac aggggcaagg cacagactca tagcagagca attaccacca agcctggaat 180

agctgcagcc acagtgaatc cggactctaa ggtaaatata aaatttttaa gtgaccttcg 240

aacctcttct agaagtgaag cttgtataat gtgttaaact actgattcta attgtttctc 300

tcttttagat tccaaccttt ggaactgaat tctagaccac c 341

<210> 73

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 73

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca ctaacttagc ccctgtttgc 120

tcctccgatc cccatggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 74

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 74

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cagacttagc ccctgtttgc 120

tcctccgatg gctaaggtga ccttggttaa tattcaccag cagctagggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 75

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 75

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca ctaacttagc ccctgtttgc 120

tccttagatc cccatggtga ccttggttaa tattcaccag caatctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 76

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 76

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctatttac 120

tcctccgatg actcaggtga ctttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 77

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 77

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata gacggtgtga ccttggttaa tattcaccat agagctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 78

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 78

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca ctaacttagc ccctatttac 120

tccttagatc cccatggtga ctttggttaa tattcaccag caatctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 79

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 79

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca ctcactttgc ccctatttac 120

tcctccgatg actcaggtga ctttggttaa tattcaccag cagctagggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 80

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 80

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgcggaggag caaacagggg 120

ctaagtcata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 81

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 81

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actgggggct gctggtgaat attaaccaag gtcactcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 82

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 82

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ggagcaaaca 120

gggtccgata actggggtga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 83

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 83

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgata actggggtga cctgctggtg aatattaacc aagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 84

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 84

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgccc cagttattga ccttggttaa tattcaccag cagcctcggg catataaaac 180

aggggcaagg cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc 240

acc 243

<210> 85

<211> 233

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 85

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cggacttagc ccctgtttgc 120

tcctccgtga ccttggttaa tattcaccag cagcctcggg catataaaac aggggcaagg 180

cacagactca tagcagagca atcaccacca agcctggaat aactgcagcc acc 233

<210> 86

<211> 278

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 86

aagcaaatat ttgtggttat ggattaactc gaactgtttg cccactctat ttgcccggcg 60

ccctttggac cttttgcaat cctggagcaa acagcaaaca cgactcagat cccagccagt 120

ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc 180

agcctccccc gttgcccctc tggggcatat aaaacagggg caaggcacag actcatagca 240

gagcaatcac caccaagcct ggaataactg cagccacc 278

<210> 87

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> 15-17-18-19-14-12-15-10-SD/SA_SV40

<400> 87

taacttagcc cctgtttgct cctccgatcc ccatggtgac cttggttaat attcaccagc 60

agcctc 66

<210> 88

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> 11 mutations in spacer seqs and binding sites (NO HNF site

mutations)

<400> 88

agacttagcc cctgtttgct cctccgatgg ctaaggtgac cttggttaat attcaccagc 60

agctag 66

<210> 89

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 89

taacttagcc cctgtttgct ccttagatcc ccatggtgac cttggttaat attcaccagc 60

aatctc 66

<210> 90

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 90

ggacttagcc cctatttact cctccgatga ctcaggtgac tttggttaat attcaccagc 60

agcctc 66

<210> 91

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 91

ggacttagcc cctgtttgct cctccgatag acggtgtgac cttggttaat attcaccata 60

gagctc 66

<210> 92

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 92

taacttagcc cctatttact ccttagatcc ccatggtgac tttggttaat attcaccagc 60

aatctc 66

<210> 93

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 93

tcactttgcc cctatttact cctccgatga ctcaggtgac tttggttaat attcaccagc 60

agctag 66

<210> 94

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 94

gcggaggagc aaacaggggc taagtcataa ctggggtgac cttggttaat attcaccagc 60

agcctc 66

<210> 95

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 95

ggacttagcc cctgtttgct cctccgataa ctgggggctg ctggtgaata ttaaccaagg 60

tcactc 66

<210> 96

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 96

ggacttagcg gagcaaacag ggtccgataa ctggggtgac cttggttaat attcaccagc 60

agcctc 66

<210> 97

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 97

ggacttagcc cctgtttgct cctccgataa ctggggtgac ctgctggtga atattaacca 60

agcctc 66

<210> 98

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 98

ggacttagcc cctgtttgct cctccgcccc agttattgac cttggttaat attcaccagc 60

agcctc 66

<210> 99

<211> 56

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 99

ggacttagcc cctgtttgct cctccgtgac cttggttaat attcaccagc agcctc 56

<210> 100

<211> 101

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 100

gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac tggggtgacc 60

ttggttaata ttcaccagca gcctcccccg ttgcccctct g 101

<210> 101

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 101

acttagcccc tgtttgctcc tccg 24

<210> 102

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 102

tgaccttggt taatattcac cagc 24

<210> 103

<211> 17

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 103

ccctgtttgc tcctccg 17

<210> 104

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 104

tggttaatat tcaccagc 18

<210> 105

<211> 13

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 105

ccctgtttgc tcc 13

<210> 106

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 106

tgaccttggt taatattcac ca 22

<210> 107

<211> 13

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 107

ccctatttac tcc 13

<210> 108

<211> 580

<212> DNA

<213> Artificial Sequence

<220>

<223> replaceme

<400> 108

atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 60

acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 120

aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 180

gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 240

ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 300

atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 360

gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 420

tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 480

aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 540

ggtctatata agcagagctg gtttagtgaa ccgtcagatc 580

相关技术
  • 肝特异性的病毒启动子及使用其的方法
  • 含泡沫逆转录病毒包膜蛋白的感染性嗜肝DNA病毒颗粒的制备及其使用方法
技术分类

06120113280275