掌桥专利:专业的专利平台
掌桥专利
首页

具有转座活性的多肽

文献发布时间:2024-04-29 00:47:01


具有转座活性的多肽

本发明涉及具有转座子活性的多肽(特别是具有转座性活性的工程多肽)、编码这种多肽的核酸、包含所述核酸的载体、包含所述核酸的细胞、使用所述多肽将外源核酸整合到基因组中的方法,所述多肽用于医学和/或一些基因疗法;以及包含所述多肽、核酸、载体或细胞的药物组合物。特别地,本发明涉及所述多肽,其被工程化以具有整合到基因组中的特异性增益。

背景技术

具有转座酶活性的多肽是治疗性基因组工程的常用工具。转座子或转座元件包括具有上游和下游末端重复序列的(短)核酸序列。活性转座子编码促进核酸切除和插入靶DNA序列的酶。

睡美人(Sleeping Beauty,SB,一种Tc1/mariner超家族转座子)转座子是用于治疗性基因组工程的已知工具之一。这个示例性工具过去已经被研究过,特别是开发了一种表现出过度活性的变体,使不同大小的转座子被增强地有效插入细胞的核酸中或使DNA插入细胞的基因组中,从而允许比已知转座子更有效的转录/翻译。

SB是一种合成转座子,它是基于从鱼类基因组中分离的转座子非活性元件序列重建的。SB是迄今为止研究最彻底的脊椎动物转座子,它支持全方位的基因工程应用,包括转基因细胞系的产生、诱导多能干细胞(iPSC)重编程、癌症生物学领域表型驱动的插入突变筛选、实验动物的种系基因转移以及离体和体内的体细胞基因治疗。在基因组范围内,SB转座子表现出接近随机整合的特征,在培养的哺乳动物细胞系中,对整合到基因及其上游调控序列中略有偏好。在局部范围内,SB优先插入TA二核苷酸(如Mos1),并显示出基于DNA物理性质的额外靶位点偏好,包括可弯曲性、亲A性和tDNA主槽中氢键位点的对称模式。然而,在人类应用中,随机整合到基因组中会带来一定的基因毒性风险。因此,需要一种转座子系统,其中整合是安全的,并且插入基因组不会对致癌转化造成风险,或者至少其中风险降低。

本发明人出乎意料地发现了特异性转座酶变体,其特别表现出:整合到基因组中,特别是整合到回文AT重复靶序列中的特异性增加。本发明人证明了所发现的变体增强了富含非核小体DNA的靶位点的DNA可弯曲性。进一步发现这些变体可以靶向人类基因组中基因的外显子和转录调控区,从而增强变体在基因治疗应用中的安全性和实用性。

发明内容

在第一方面(方面1a)中,本发明提供了一种具有转座酶活性的多肽,其包含天然存在的转座酶的变体,所述变体包含以下二级结构元件:

α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋,

其中

(i)连接β3折叠和β4折叠的环中天然存在的H被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W、K、E或Y取代,优选被V、P或T取代,或

连接β3折叠和β4折叠的环中天然存在的F被N、C、Q、G、I、L、M、P、R、S、T、W、K、H、E或Y取代,优选地被V、P或T取代;或

连接β3折叠和β4折叠的环中天然存在的Y被V、a、N、C、Q、G、I、L、M、F、P、R、S、T、W、H、E或K取代,优选被V、P或T取代,或

连接β3折叠和β4折叠的环中天然存在的L被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W、H、E或K取代,优选被V、P或T取代,或

连接β3折叠和β4折叠的环中天然存在的S被V、A、N、C、Q、G、I、M、F、P、R、S、T、W、H、Y、E或K取代,优选地被V、P或T取代;

和/或

(ii)连接β6折叠与α4螺旋的η1中至少一个天然存在的Q、P、S或T被R、S、C或A取代,优选被R或S取代;

和/或

(iii)连接β6折叠与α4螺旋的η1中至少一种天然存在的K、I、S、T、V、P或C被R、I、C或V取代,优选被R取代;

其中所述天然存在的转座酶的变体包括所述取代(i)、(ii)或(iii)中的至少一个。

或者,在方面1b中,本发明提供具有转座活性的多肽,其包含Tc1/mariner超家族的转座酶或由其组成,其中对应于SEQ ID NO:1的睡美人(SB)转座酶的氨基酸位置248、247和/或187的氨基酸位置被不同的氨基酸取代,其中所述转座酶具有整合到所述基因组中的特异性增益。

特异性增益意味着与使用根据SEQ ID NO:1的SB时观察到的整合到外显子中的事件的数量相比,在用多肽转座时整合到外显子中的整合事件的数量减少了至少25%。

任选地,所述转座酶是与SEQ ID NO:1具有至少70%序列同一性的睡美人转座酶或其变体。

在一个实施方案中,本文公开的多肽可以包括在对应于SB转座酶的氨基酸位置248的氨基酸位置的取代,其中,优选地,所述取代选自K248R、K248S、K248V、K248I和K248C。

在一个实施方案中,所述多肽任选地在对应于SB转座酶的氨基酸位置247的氨基酸位置包含取代,其中,优选地,所述取代选自P247R、P247C、P247A和P247S。

在一个实施方案中,所述多肽可包含对应于SB转座酶的氨基酸位置187的氨基酸位置的取代,其中,优选地,所述取代选自H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187S、H187V、H187W、H187K、H187R、H187E、H187P和H187T。

在一个实施方案中,多肽可以包括一个或多个以下取代:

(i)H187V、H187P、H187R、H187E、H187T、H187S、H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187W、H187K,优选H187P,H187V或H187T,更优选H187V;和/或

(ii)P247R、P247S、P247C或P247A;优选P247R或P247S;和/或

(iii)K248R、K248S、K248V、K248I或K248C;优选K248R;

或在其变体的相应位置的取代。

或者,在方面1c中,本发明提供了包含SEQ ID NO:1或其变体的多肽,所述多肽具有转座活性并且与SEQ ID NO:1具有至少70%的序列同一性,并且其中SEQ ID NO:1或其变体包含一个或多个以下取代:

(i)H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、

H187F、H187S、H187V、H187W、H187K、H187Y、H187R、H187E、

H187P或H187T,优选H187P、H187V或H187T、更优选H187V;和/或

(ii)P247R、P247C、P247A或P247S,优选P247R或P247S和/或

(iii)K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

或在其变体的相应位置的取代。

所述多肽可以具有上述二级结构元件。它可以是方面1a的多肽。优选地,与SB100X相比,其表现出整合到基因组中的特异性增益。

在第二方面,本发明涉及核酸,所述核酸包含编码第一方面多肽的核酸序列。

在第三方面,本发明涉及包含第二方面的核酸分子的载体。

在第四方面,本发明涉及包含第二方面的核酸或第三方面的载体的细胞。

在第五方面,本发明涉及将外源核酸整合到细胞基因组中的体外方法,所述方法包括以下步骤:

a)提供分离的细胞;

b)在细胞中提供第一方面的多肽;和

c)在所述细胞中提供包含所述外源核酸的核酸或包含所述核酸的载体。

在第六方面,本发明涉及将外源核酸整合到受试者的细胞基因组中的体内方法,所述方法包括施用本发明任何前述方面所述的多肽、核酸、或载体,以及包含外源核酸的核酸或包含所述核酸的载体。

在另一个方面,本发明涉及上述多肽、核酸、载体或细胞,其用于医疗,特别是基因治疗。

在另一方面,本发明涉及药物组合物,所述药物组合物包含所述多肽、核酸、载体或细胞以及药学上可接受的载体、佐剂或辅料。

附图说明

在下文中,将描述本说明书中包含的附图的内容。在本文中,还请参考上文和/或下文对本发明的详细描述。

图1:Tc1/mariner超家族转座酶的示例性转座酶氨基酸序列的比对。对应于SB的氨基酸位置187、247和248的所有氨基酸用方框突出显示。因此,图1允许本领域技术人员确定所有其他排列的转座酶中的氨基酸位置,这些转座酶分别对应于氨基酸位置187、247和248,并且可以以与SB示例性概述的相同方式用不同的氨基酸取代。图1仅描述了Tc1/mariner超家族转座酶的转座酶选择的比对。可以将该超家族的其他转座酶添加到比对中,从而能够鉴定这些转座酶中对应于SB的氨基酸位置187、247和248的氨基酸。所示的转座酶属于具有已知转座酶活性的转座酶组。SB的氨基酸序列(SEQ ID NO:1)用作该比对中的参考氨基酸序列。

图2:与睡美人转座酶关系密切的转座酶氨基酸序列比对。对应于SB的氨基酸位置187、247和248的所有氨基酸用方框突出显示。因此,图1允许本领域技术人员确定所有其他排列的转座酶中的氨基酸位置,这些转座酶分别对应于氨基酸位置187、247和248,并且可以以与SB示例性概述的相同方式用不同的氨基酸取代。图2仅描述了Tc1/mariner转座酶超家族的一些转座活性成员的选择的比对。可以将进一步的转座酶添加到比对中,从而能够鉴定这些转座酶中对应于SB的氨基酸位置187、247和248的氨基酸。在序列比对的顶部,显示了属于相应氨基酸段(stretch)的二级结构α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋。这进一步允许本领域技术人员确定与连接β6折叠与α4螺旋或连接β3折叠与β4折叠的η1中的特定氨基酸相对应的所有其他排列的转座酶中的氨基酸位置。以同样的方式,可以将该超家族的其他转座酶添加到比对中,从而鉴定与连接β6折叠和α4螺旋的η1中的所述位置相对应的氨基酸,或连接β3折叠和β4折叠的氨基酸。SB的氨基酸序列(SEQ ID NO:1)用作该比对中的参考氨基酸序列。

图3:睡美人转座酶突变体的转座活性。H187(A)、P247(B)和K248(C)的相对转座活性。将表达转座酶突变体的质粒与转座子质粒(pT2B/puro)瞬时共转染到HeLa细胞中。对细胞进行嘌呤霉素抗性筛选,并用亚甲基蓝染色以鉴定有活力的细胞菌落。将菌落数归一化为SB100X阳性对照,其转座效率设定为100%。无活性的SB转座酶(D3)作为阴性对照。数据表示为平均值±标准差,n=3个生物重复。转座活性的差异是显著的,通过Student’s t检验来确定所指示的突变体。

图4:转座酶突变体的整合位点。序列标志显示了以靶TA二核苷酸为中心的60bp窗口中基因组插入位点的多数规则(majority-rule)一致序列。y轴上的值2(log24)表示最大可能频率。饼图描绘了在SB特异性ATATATAT共有基序处发生的插入的百分比。N值表示唯一可映射的SB转座子插入的数量。

图5:基因组特征和染色质定义的功能片段中插入位点的图像。(A)在人类基因组的基因相关片段中对MLV、HIV、SB100X及其突变衍生物的整合位点进行。这些数字表示与理论随机对照(设置为1)相比插入频率的倍数变化增加(红色)或减少(蓝色)。左边的树状图是基于行的平均频率值。K248R、P247R和H187V突变体相对于SB100X的值测量的统计学显著性(Fisher精确检验)用星号表示;*p<0.05,**p<0.001,ns:不显著。(B)表观遗传信号模式定义的功能基因组片段中插入位点的表达。颜色代码、树状图和统计显著性如图(A)所示。H187V和K248R催化的简单重复序列整合的富集如图(C)所示,整合到ATATATAT,H187V变体的偏好如图(D)所示。插入这些基因组区域的总百分比如(E)所示。

图6:基因组安全港中的插入频率。(A)这些数字表示下表所列安全港子类别中插入的百分比。在给定的安全港类别中,颜色越深,插入的频率越低,而理想情况下为100%。**p<0.001,Fischer检验,与SB100X相比。(B)基因组安全港中插入的总体表现。

图7:转座子插入位点的核小体占位。SB100X和K248R、P247R和H187V突变体插入与核小体相关的位点的相对频率,通过人HepG2细胞上的MNase-Seq数据确定。在转座子整合位点上游延伸500bp和下游延伸500bp的窗口中描述了频率。

图8:H187、P247和K248转座酶突变体优选靶向富含TA的基因组区域。图(A)显示H187V和K248R插入通常在组蛋白修饰中缺失。外显子,特别是编码外显子在TA二核苷酸中相对较差(图8B)。然而,外显子是SB转座的优选靶位点。

图9:基因组特征中额外SB100x突变体插入位点的图像。在人类基因组的基因相关片段中对MLV、HIV、SB100X及其突变衍生物H187P、H187R、H187E、H187S、H187T、P247S、P247A、P247C、P247S、K248C、K248I和K248V的整合位点进行计数。这些数字表示与理论随机对照(设置为1)相比插入频率的倍数变化增加(红色)或减少(蓝色)。左边的树状图是基于行的平均频率值。

具体实施方式

在下文详细描述本发明之前,应当理解,本发明不限于本文所述的特定方法、方案和试剂,因为这些方法、方案或试剂可以变化。还应当理解,这里使用的术语仅用于描述特定实施方案的目的,而不旨在限制将仅由所附权利要求限制的本发明的范围。除非另有定义,否则本文中使用的所有技术和科学术语的含义与本领域普通技术人员通常理解的含义相同。

优选地,本文使用的术语定义如Leuenberger,H.G.W,Nagel,B.和Klbl,H.eds.(1995)(Helvetica Chimica Acta,CH-4010巴塞尔,瑞士)所述的“A multilingualglossary of biotechnological terms:(IUPAC Recommendations)”,以及Axel Kleemann和Jurgen Engel的“Pharmaceutical Substances:Syntheses,Patents,Applications”,Thieme Medical Publishing,1999;Susan Budavari等人编辑的“Merck Index:AnEncyclopedia of Chemicals,Drugs,and Biologicals”,CRC出版社,1996,以及美国药典-25/国家药典-20,由Pharmcopeial Convention股份有限公司出版,马里兰州洛克维尔,2001。

除非另有说明,否则本发明的实施将采用化学、生物化学、细胞生物学、免疫学的常规方法。以及在本领域的文献中解释的重组DNA技术。

在本说明书和随后的权利要求中,除非上下文另有要求,否则“包含(comprise)”一词以及诸如“包含(comprises)”和“包含(comprising)”的变体将被理解为包括所述整数或步骤或整数组或步骤组,但不排除任何其他整数或整数或步骤或整数组或步骤组。在以下段落中,更详细地定义了本发明的不同方面。如此定义的每个方面可以与任何其他方面或多个方面相结合,除非明确指示相反。特别地,被指示为任选,优选或有利的任何特征可以与被指示为任选,优选或有利的任何其他一个或多个特征相结合。

在下文中,将描述本发明的元件。这些元件与具体实施方案一起列出;然而,应当理解,它们可以以任何方式和任何数量组合以创建附加实施方案。不同描述的实例和优选实施方案不应被解释为将本发明仅限于明确描述的实施方案。本说明书应理解为支持并涵盖将明确描述的实施方案与任何数量的公开和/或优选元件相结合的实施方案。此外,除非上下文另有指示,否则本申请中所有描述的元素的任何排列和组合都应被认为是由本申请的描述所公开的。

定义

在下文中,提供了本说明书中经常使用的术语的一些定义。这些术语在其使用的每种情况下,在说明书的其余部分中分别具有其定义的含义和优选的含义。

如本说明书和所附权利要求中所使用的,单数形式“一个(a)”、“一个(an)”和“所述(the)”包括复数指代物,除非内容另有明确规定。

本文中使用的术语“转座酶”是指作为能够转座的功能性核酸-蛋白质复合物的组分并且介导转座的酶。术语“转座酶”也指来自逆转录病毒转座子或逆转录病毒来源的整合酶。本文所用的“转座反应”是指转座子插入靶核酸的反应。转座反应中的主要组分是转座子和转座酶或整合酶。

术语“天然存在的转座酶”或“野生型转座酶“在本发明的上下文中可互换使用,作为从天然存在的物种中分离的转座酶类的那些未修饰的氨基酸序列。这类氨基酸序列在EBI或NCBI中很容易获得。睡美人被包括在术语“天然存在的转座酶”中。

本文使用的术语“转座活性”是指可以在转座反应中评估的给定转座酶的活性。合适的实验装置在本文的实验部分中描述,或者可以使用Ivics,1997Cell 91:51-510中描述的经典二元转座测定法。

术语“转座酶”是指具有全长天然存在的转座酶的转座活性的氨基酸的连续段,所述活性例如,至少1%的活性、至少10%的活性、至少20%的活性、至少50%的活性或最优100%的活性或更高。转座酶可能缺乏全长天然存在的转座酶的1至10个N端和/或C端氨基酸序列。优选地,如果转座酶包含在融合蛋白中,其可以在M1位置缺乏甲硫氨酸,该融合蛋白在转座酶的N末端包含另一种蛋白质。

在本发明上下文中使用的术语“取代”是指一个核苷酸或氨基酸分别与核酸序列中的一个核苷酸和氨基酸序列中的一个氨基酸交换。

在本发明的上下文中使用的术语“共有序列”是指在两个或多个序列之间的序列比对中的每个位置发现的核苷酸或氨基酸的最常见残基的计算序列。它表示多序列比对的结果,其中相关序列相互比较,并计算相似的序列基序。保守序列基序被描述为共有序列(其指示相同的氨基酸,即在比较的序列中相同的氨基酸)、保守氨基酸(即在比较的氨基酸序列中变化的氨基酸,但其中所有氨基酸都属于诸如极性或中性氨基酸的氨基酸的特定功能或结构组)、以及可变氨基酸(即在比较序列中没有表现出明显相关性的氨基酸)。图1描述了转座酶序列的比对,包括Tc1/mariner转座酶超家族的一些转座活性成员,在比对下方是衍生的共有序列。用于生成上述比对的比对算法是CLUSTALOmega,使用以下设置:取消比对输入序列:否,类似mbed的聚类导向树:是,类似mbed的聚类迭代:是,组合迭代次数:默认,最大导向树迭代:默认,最大hmm迭代:默认。在MView中突出显示了氨基酸保守。图2描述了与图1中相同的比对,但具有用ESPcript3.0突出显示的SB转座酶催化结构域(PDB条目代码:5CR4)的二级结构信息。

在本发明上下文中使用的短语“在相应位置”是指在氨基酸序列的比对中与天然存在的全长参考转座酶的氨基酸序列,优选与根据SEQ ID NO:1的SB的全长氨基酸序列比对的氨基酸。参考转座酶的位置由第一个N-末端氨基酸确定。因此,根据SEQ ID NO:1的全长氨基酸序列中SB的187位是“H”。因此,在另一转座酶中对应于SB的187位的氨基酸位置是在SEQ ID NO:1的187位与SB的“H”以如图1和图2所示的比对方式比对的氨基酸。类似地,对应于SB的247位的氨基酸位置是在SEQ ID NO:1的247位与SB的“P”比对的位置,对应于SB248位的位置是在SEQ ID NO:1的248位与SB的“K”比对的位置。

在本发明的上下文中,蛋白质或多肽的“一级结构”是多肽链中的氨基酸序列。蛋白质的“二级结构”是蛋白质局部片段的一般三维形式。然而,它并没有描述三维空间中的特定原子位置,这些位置被认为是三级结构。在蛋白质中,二级结构是由主链酰胺和羧基之间的氢键模式定义的。蛋白质的“三级结构”是由原子坐标决定的蛋白质的三维结构。“四元结构”是多亚基复合物中多个折叠或卷曲的蛋白质或多肽分子的排列。

本文所用的术语“折叠(folding)”或“蛋白质折叠”是指蛋白质呈现其三维形状或构象的过程,即通过非共价和/或共价相互作用,例如但不限于氢键、金属配位、疏水力、范德华力、π-π相互作用、静电效应和/或分子内Cys键,引导蛋白质形成特定的三维形状。因此,术语“折叠蛋白”是指部分或全部蛋白质的三维形状,如其二级、三级或四级结构。

在本发明上下文中使用的术语“β链”是指多肽链内的5至10个氨基酸的长片段,其中主链中N-Cα-C-N的扭转角为约120度。给定蛋白质序列中的β链可以在(多)序列比对(例如使用Clustalω)后通过从pdb文件中检索注释来预测。β链的预测可以使用JPred等常用软件工具进行。七条β链的起始和终止位置可以通过使用pyMol对PDB文件进行额外的结构比对来确认。

在本发明的上下文中可互换使用的术语“β折叠(sheet)”或“贝塔折叠”是指形成β折叠的两个β链。β折叠是蛋白质中一种常见的规则二级结构基序。因为肽链的N末端和C末端具有定向性,所以β链也可以说是定向的。它们通常在蛋白质拓扑图中用指向C末端的箭头表示。相邻的β-链可以形成反平行、平行或混合排列的氢键。在反向平行排列中,连续的β-链交替方向,使得一条链的N末端与下一条的C末端相邻。这是产生最强链间稳定性的排列,因为它允许羰基和胺之间的链间氢键是平面的,这是它们的优选取向。β结构的特征是长延伸的多肽链。β链的氨基酸组成倾向于有利于疏水(怕水)氨基酸残基。这些残基的侧链往往比更亲水(喜水)的残基的那些侧链更不易溶于水。β结构往往存在于蛋白质的核心结构中,其中链之间的氢键受到保护,不与水分子竞争。

在本发明的上下文中可互换使用的术语“α螺旋”或“阿尔法螺旋”是指蛋白质二级结构中的常见基序,并且是右手螺旋构象,其中每个主链N-H基团氢键连接到位于蛋白质序列四个残基之前的氨基酸的主链C=O基团。在蛋白质的局部结构类型中,α-螺旋是最极端、最可预测的序列,也是最普遍的。

在本发明的上下文中可互换使用的术语“过渡区(intervening region)”或“环(loop)”是指两个β折叠或一个β折叠和α螺旋之间的氨基酸残基。通常,“过渡区”或“环”的结构较少或根本没有结构,这为它们提供了灵活性。

对于给定氨基酸序列中的取代,使用以下名称。“XNo.Z”是指特定位置“No.”处的原始氨基酸序列的氨基酸“X”被氨基酸“Z”取代,而“XNo.Z/X'No.'Z'/X”No.”Z””旨在指位置“No.”上原始的X、X'、X”可以被分别表示为Z、Z'和Z”的几种不同氨基酸可选地取代。氨基酸位置是相对于特定转座酶的特定长度氨基酸序列,优选野生型全长序列来指示的。

术语“载体(vector)”或“表达载体”可互换使用,并且指能够被引入或能够将本发明的核酸集合或作为本发明核酸集合的一部分的一种核酸引入细胞(优选哺乳动物细胞)的多核苷酸或多核苷酸与蛋白质的混合物。载体的实例包括但不限于质粒、粘粒、噬菌体、病毒或人工染色体。特别地,载体用于将启动子和核酸的集合或作为本发明核酸集合一部分的一种核酸运输到合适的宿主细胞中。表达载体可以包含促进表达载体在宿主细胞中自主复制的“复制子”多核苷酸序列。一旦进入宿主细胞,表达载体可以独立于宿主染色体DNA或与宿主染色体DNA重合地复制,并且可以产生载体及其插入的DNA的几个拷贝。在使用不能复制的表达载体的情况下——出于安全原因,通常是这样——载体可能不会复制,而只是直接表达核酸。根据表达载体的类型,表达载体可能从细胞中丢失,即仅瞬时表达由核酸编码的新抗原,或者可能在细胞中稳定。表达载体通常包含表达盒,即允许核酸转录到mRNA分子中的必要元件。

术语“病毒载体”在本发明的上下文中用于指能够组装成感染性病毒颗粒的单链或双链核酸序列。所述核酸序列可以是完整的或部分的病毒基因组。在后一种情况下,病毒基因组优选包括一个或多个异源基因。对于一些病毒颗粒,只需要非常短的病毒基因组序列就可以组装感染性病毒颗粒。例如,对于感染性腺相关病毒颗粒的组装,仅在给定长度(通常在4.5至5.3kB间)的异源核酸的5’和3’处放置短(约200bp长)重复序列将允许感染性腺相关病毒颗粒的组装。用于组装给定病毒的最小核酸序列是众所周知的。病毒基因组越大,用于组装感染性病毒颗粒的最小病毒序列越小,可以插入病毒载体的异源基因就越大。

“序列相似性”表示相同或代表保守氨基酸取代的氨基酸的百分比。两个氨基酸序列之间的术语“序列同一性”表示两个给定序列之间相同的氨基酸的百分比。用于确定序列相似性,优选序列同一性的比对可以用现有技术已知的工具进行,优选使用最佳序列比对,例如,使用CLC主工作台(CLC bio)或Align,使用标准设置,优选EMBOSS::针,矩阵:Blosum62,空位开放10.0,空位延伸0.5。同一性百分比是参考用于比较的全长序列而不仅仅是具有最高相似性的序列或序列段来确定的。因此,与用于比较的100个氨基酸长序列中的50个连续氨基酸共享100%序列同一性的氨基酸仅具有50%序列同一性(假设在50个连续的氨基酸之外没有其他氨基酸共享任何同一性)。

如本文所用,术语“药学上可接受的”是指材料的无毒性,其优选不与药物组合物的活性剂的作用相互作用。特别是,“药学上可接受”是指经联邦或州政府监管机构批准,或列入美国药典、欧洲药典或其他公认药典,用于动物,尤其是人类。

术语“载体(carrier)”是指天然或合成性质的有机或无机成分,其中活性成分被结合以促进、增强或使应用成为可能。根据本发明,术语“载体”还包括一种或多种相容的固体或液体填料、稀释剂、赋形剂或包封物质,其适合给药于受试者。可能的载体物质(例如稀释剂)是例如无菌水、林格溶液、乳酸林格溶液、生理盐水、抑菌盐水(例如含0.9%苯甲醇的盐水)、磷酸盐缓冲盐水(PBS)、Hank’s溶液、固定油、聚亚烷基二醇、氢化萘和生物相容性丙交酯聚合物,丙交酯/乙交酯共聚物或聚氧乙烯/聚氧丙烯共聚物。在一个实施方案中,载体是PBS。所得溶液或悬浮液优选与受体的血液等渗。合适的载体及其制剂在Remington’sPharmaceutical Sciences,第17版,1985,Mack Publishing Co.有所描述。

术语“细胞”在本发明的上下文中用于指真核细胞或原核细胞,例如细菌细胞、酵母细胞或哺乳动物的细胞,优选人、小鼠、大鼠、兔、狗、猴子或猫的细胞。

本发明的各方面和优选实施方案

在下文中,更详细地定义了本发明的不同方面。如此定义的每个方面可以与任何其他方面或多个方面相结合,除非有明确的相反指示。特别地,被指示为优选或有利的任何特征可以与被指示为优选或有利的任意其它一个或多个特征相结合。

在得到本发明的工作中,令人惊讶地显示,具有转座酶活性的多肽的变体显著地增益整合到基因组中的特异性。

本发明提供了一种具有转座活性的多肽,其包含或由Tc1/mariner超家族的转座酶组成,其中对应于SEQ ID NO:1的睡美人(SB)转座酶的氨基酸位置248、247和/或187的氨基酸位置被不同的氨基酸取代,其中所述转座酶具有整合到所述基因组中的特异性增益。所述多肽可以是与SEQ ID NO:1具有至少70%序列同一性的睡美人转座酶或其变体。

“特异性增益”优选地是指与使用根据SEQ ID NO:1的SB时观察到的整合到外显子中的事件的数量相比,在用多肽转座时整合到外泌子中的整合事件的数量减少至少10%,优选至少25%。

在一个实施方案中,所述多肽可包含在对应于SB转座酶的氨基酸位置248的氨基酸位置的取代,其中,优选地,所述取代选自K248R、K248S、K248V、K248I和K248C。

在一个实施方案中,所述多肽可包含对应于SB转座酶的氨基酸位置247的氨基酸位置的取代,其中,优选地,所述取代选自P247R、P247C、P247A和P247S。

在一个实施方案中,所述多肽可包含对应于SB转座酶的氨基酸位置187的氨基酸位置的取代,其中,优选地,所述取代选自H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187S、H187V、H187W、H187K、H187R、H187E、H187P和H187T。

多肽还可以包括在这些位置上的取代的组合,优选地,所述取代的组合。也可以包括其他突变,例如增加转座活性的突变(例如,如下所述)。

本发明的多肽可以包括一个或多个以下取代:

(i)H187V、H187P、H187R、H187E、H187T或H187S、H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187S、H187W、H187K,优选H187P,H187V或H187T,更优选H187V;和/或

(ii)P247R、P247S、P247C或P247A,优选P247R或P247S和/或

(iii)K248R、K248S、K248V、K248I或K248C;优选K248R;

或在其变体的相应位置的取代。

在一个方面,本发明还提供了一种具有转座活性的多肽,其包含、基本上由或由具有以下二级结构元件的天然存在的转座酶的变体组成:

α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋,其中

(i)连接β3折叠和β4折叠的环中天然存在的H被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W、K、Y或E取代,优选被V、P或T取代,或

连接β3折叠和β4折叠环中天然存在的F被V、A、N、C、Q、G、I、L、M、P、R、S、T、W、K、H、E或Y取代,优选地被V、P或T取代;或

连接β3折叠和β4折叠的环中天然存在的Y被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W、H、E或K取代,优选被V、P或T取代,或

连接β3折叠和β4折叠的环中天然存在的L被V、A、N、C、Q、G、I、M、F、P、R、S、T、W、H、Y、E或K取代,优选被V、P或T取代,或

连接β3折叠和β4折叠环中天然存在的S被V、A、N、C、Q、G、I、L、M、F、P、R、T、W、H、Y、E或K取代,优选地被V、P或T取代;

和/或

(ii)连接β6折叠与α4螺旋的η1中至少一个天然存在的Q、P、S或T被R、S、C或A取代,优选被R或S取代;

和/或

(iii)连接β6折叠与α4螺旋的η1中至少一种天然存在的K、I、S、T、V、P或C优选被R、I、V或C取代;

其中所述天然存在的转座酶的变体包括取代(i)、(ii)或(iii)中的至少一个。

本发明基于以下惊人发现:在转座酶中取代某些氨基酸获得增强人类基因组中富含非核小体DNA和去靶外显子以及基因的转录调控区的靶位点的DNA可弯曲性的转座酶,所述转座酶增益整合到基因组中、特别是整合到回文AT重复靶序列中的特异性。所有这些特性都有助于增强本发明多肽在基因治疗应用中的安全性和实用性。这些特性对转座酶非常有利,因为它不太可能使表达的基因失活或突变。改进的整合模式可以通过本申请的实施例3和7中描述的实验进行评估,并分别如图5和图9所示。因此,优选的是,与使用根据SEQID NO:1的SB时观察到的整合到外显子中的事件的数量相比,在本发明的多肽中整合到外显子中的次数减少至少10%,更好的是至少25%,更优选至少40%或更优选至少50%,如果所述多肽包含根据SEQ ID NO:1的SB的变体或由其组成。

优选地,本发明的变体保留全长野生型转座酶的转座子活性,即具有变体所基于的全长野生型转座酶的转座活性的至少1%、至少10%、至少20%、至少30%、至少50%、至少75%、任选100%或更高,优选75%,任选100%的根据SEQ ID NO:1的SB的转座活性。

图1和图2描述了与SB具有不同相关度的转座酶的氨基酸序列的比对。虽然氨基酸序列差异很大,至少在图1和SB的比对中包括的一些转座酶之间是如此,但所有转座酶共享相似的二级结构。它们由二级结构的元件组成,如按一定顺序和一定长度的α螺旋和β折叠。图1和图2显示了这些氨基酸序列中α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋的位置。关于SB,元件α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋涵盖SEQ ID NO:1的以下氨基酸:

α1螺旋:SEQ ID NO:1的AA 128至138;

α2螺旋:SEQ ID NO:1的AA 143至147;

β1折叠:SEQ ID NO:1的AA 149至158;

β2折叠:SEQ ID NO:1的AA 169至171;

β3折叠:SEQ ID NO:1的AA 173至176;

β4折叠:SEQ ID NO:1的AA 191至199;

β5折叠:SEQ ID NO:1的AA 202至208;

α3螺旋:SEQ ID NO:1的AA 215至233;

β6折叠:SEQ ID NO:1的AA 240至241;

η1:SEQ ID NO:1的AA 247至250;

α4螺旋:SEQ ID NO:1的AA 252至260;

η2:SEQ ID NO:1的AA 273至275;

α5螺旋:SEQ ID NO:1的AA 278至291;

α6螺旋:SEQ ID NO:1的AA 297至309;

α7螺旋:SEQ ID NO:1的AA 313至321;

α8螺旋:SEQ ID NO:1的AA 323至332;

因此,其他转座酶的α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋将在SB内与上述氨基酸位置对应的氨基酸位置开始和结束。这使得本领域技术人员能够确定任何给定转座酶内的二级结构元件:α1螺旋-α2螺旋-β1折叠-β2折叠-β3折叠-β4折叠-β5折叠-α3螺旋-β6折叠-η1-α4螺旋-η2-α5螺旋-α6螺旋-α7螺旋-α8螺旋,并相应地确定在任何给定的转座酶内连接β3折叠和β4折叠的环以及连接β6折叠与α4螺旋的η1中的氨基酸。

此外,本领域技术人员可以分析三维结构和与其他转座酶中的该结构相关的氨基酸序列,并基于三维结构预测氨基酸的排列。此外,计算机程序可以帮助预测目标蛋白质或多肽的二级结构,即例如任何其他目标转座酶的二级构造。一种方法是基于同源性建模。通常,具有大于30%的序列同一性或大于40%的相似性的两种多肽或蛋白质通常具有相似的结构拓扑。蛋白质结构数据库(PDB)的增长增强了二级结构的可预测性,包括多肽或蛋白质结构内的潜在折叠数。预测蛋白质和多肽的二级结构的其他方法是本领域已知的,并且包括例如串线、图谱分析和进化连锁。因此,本领域技术人员可以容易地将该超家族的另外的转座酶添加到比对中,从而允许识别与这些转座酶中SB的氨基酸位置187、247和248相对应的氨基酸,和/或与连接任何给定转座酶的β3折叠和β4折叠的环中的氨基酸相对应,或连接任何给定转座酶的β6折叠与α4螺旋的η1中的氨基酸。

连接给定转座酶的β3折叠和β4折叠的环可以在天然存在的序列中包含H、F、L、S或Y。在这种情况下,优选用可能改变转座酶蛋白质-DNA相互作用的另一种氨基酸取代这些氨基酸。

如果连接β3折叠和β4折叠的环中天然存在的氨基酸是H,则优选该氨基酸被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W、K、Y或E取代,优选被V、I、L、M、P、S或T取代,更优选地被V、I、L、T或P取代,最优选地被V、P或T取代。

如果连接β3折叠和β4折叠的环中的天然存在的氨基酸是F,则优选该氨基酸被V、A、N、C、Q、G、I、L、M、P、R、S、T、W、K或Y取代,优选被V、I、L、M、P、S或T取代,更优选被V、I、L、T或P取代,最优选被V、P或T取代。

如果连接β3折叠和β4折叠的环中天然存在的氨基酸是Y,则优选该氨基酸被V、A、N、C、Q、G、I、L、M、F、P、R、S、T、W或K取代,优选被V、I、L、M、P、S或T取代,更优选被V、I、L、T或P取代,最优选被V、P或T取代。

如果连接β3折叠和β4折叠的环中天然存在的氨基酸是L,则优选该氨基酸被V、A、N、C、Q、G、I、M、F、P、R、S、T、W、H、Y或K取代,优选被V、P或T取代。

如果连接β3折叠和β4折叠的环中天然存在的氨基酸是S,则优选该氨基酸被V、A、N、C、Q、G、I、L、M、F、P、R、T、W、H、Y或K取代,优选被V、P或T取代。

连接给定转座酶的β6折叠与α4螺旋的η1可以包含在天然存在的序列K、I、S、T、V、P或C(SB中的248位)或Q、P、S或T(SB中247位)中。在这种情况下,优选用可能改变转座酶的蛋白质-DNA相互作用的另一种氨基酸取代这些氨基酸。

如果连接β6折叠与α4螺旋的η1中天然存在的氨基酸是至少一个天然存在的Q、P、S或T,则优选该氨基酸被R、C、S或A取代,优选被R或S取代。

如果连接β6折叠与α4螺旋的η1中天然存在的氨基酸是至少一种天然存在的K、I、S、T、V、P或C,则优选该氨基酸被R、V、I、C、A、P或Q取代,优选被I、C或R取代,最优选被R取代。

在另一个优选实施方案中,连接β6折叠与α4螺旋的η1中天然存在的Q、P、S或T以及K、I、S、T、V、P或C均如上所述被取代,优选两者均被R取代。

在本发明的另一个实施方案或另一个方面中,取代也可以发生在天然存在的转座酶的变体中。术语“天然存在的转座酶的变体”是指与天然存在的转座酶的转座蛋白酶的氨基酸序列,优选与根据SEQ ID NO:1至17的转座酶之一具有至少70%氨基酸序列同一性的氨基酸序列。更优选通过如上所述的一个或多个取代进一步修饰的转座酶的变体与天然存在的转座蛋白酶的转座酶的氨基酸序列,优选与根据SEQ ID NO:1至17的转座酶之一,最优选根据SEQ ID NO:1的SB转座酶具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。如果本发明的取代是在变体或天然存在的转座酶的背景下进行的,则在没有本发明取代的情况下确定同一性程度。因此,天然存在的转座酶的变体可以与SEQID NO:1具有70%的氨基酸序列同一性,并且另外具有如上所述的(i)、(ii)和/或(iii)的取代。

进一步优选的是,如果本发明的多肽包含根据SEQ ID NO:1至17的转座酶的变体或由其组成,则与使用根据SEQ ID NO:1至17的转座酶时观察到的整合到外显子中的事件的数量相比,基于SEQ ID NO:1至17的氨基酸序列,在本发明的多肽中整合到外泌子中的整合事件的数量减少,例如至少25%,更优选至少40%或更优选至少50%。

在优选实施方案中,本发明的多肽包含全长天然存在的转座酶、由其组成或基本上由其组成,所述全长天然存在的转座酶优选包含根据SEQ ID NO:1至17的全长天然存在转座酶或其变体、由其组成或基本上由其组成。在该优选实施方案中,用于测定变体的参考氨基酸序列是全长序列。因此,在本发明的多肽的该优选实施方案中,变体包含氨基酸序列、由其组成或基本上由其组成,该氨基酸序列与天然存在的转座酶的氨基酸序列,优选与SEQ ID NO:1至17的转座酶,最优选根据SEQ ID NO:1的转座酶SB具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。再次,在不存在根据(i)、(ii)和/或(iii)的本发明的取代的情况下,测定天然存在的转座酶的变体的氨基酸序列同一性。

在上述每种情况下,本发明的变体都保留了天然存在的或野生型转座酶的转座活性。氨基酸变化可能对所得转座酶的可生产性和/或稳定性产生影响,或者可能影响另一种活性,例如转座酶活性。增加转座酶,特别是SB的转座活性的取代在下文中进一步描述,并且先前已在WO 2009/003671中描述。除了上述(i)、(ii)和/或(iii)的取代之外,这种取代的存在是特别优选的。

在本发明的第一方面的一个实施方案中,天然存在的转座酶选自睡美人(SB)(SEQID NO:1)、Tdr1(SEQ ID NO:2)、ZB(SEQ ID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ IDNO:5)、TCB2(SEQ ID NO:6)、S(SEQ ID NO:7)、Quetzal(SEQ ID NO:8)、Paris(SEQ ID NO:9)、Tc1(SEQ ID NO:10)、Minos(SEQ ID NO:11)、Uhu(SEQ ID NO:12)、Bari(SEQ ID NO:13)、Tc3(SEQ ID NO:14)、Impala(SEQ ID NO:15)、Himar(SEQ ID NO:16)或Mos1(SEQ IDNO:17),优选所述转座酶是SB(SEQ ID NO:1)、ZB(SEQ ID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ ID NO:5)或Minos(SEQ ID NO:11)。在最优选的实施方案中,转座酶是SB(SEQ ID NO:1)。

在本发明的一个特别优选的实施方案或另一个方面中,本发明的多肽包含SEQ IDNO:1至17的转座酶或其变体、由其组成或基本上由其组成,所述变体包含至少一个根据上述(i)、(ii)或(iii)的取代。

与SB密切相关的转座酶不仅共享按上述顺序排列的二级结构元件,而且在涉及DNA-蛋白质相互作用的某些关键区域中共享显著的氨基酸相似性甚至同一性。因此,本发明在与SB密切相关的转座酶亚组中的取代可以通过围绕SB 187位氨基酸的共有氨基酸序列来表征。该共有序列是X

(i)第一氨基酸段:

X

X

X

X

X

X

X

X

其中当X

其中当X

其中当X

其中当X

其中当X

和/或

(ii)第二个氨基酸段:

X

X

X

X

X

X

X

和/或

X

其中X

在一个优选实施方案中,

X

X

X

X

X

X

X

其中当X

其中当X

其中当X

其中当X

其中当X

和/或

X

X

X

X

X

X

X

其中X

如果在本发明的多肽中只有一个取代,则优选不是H187F、H187Y或K248A。

如果这些取代中的任何一个存在于转座酶的变体中,则在引入根据(i)、(ii)和/或(iii)的取代之前,再次确定变体与相应野生型转座酶序列的序列同一性。

在一个实施方案中,根据本发明的多肽包含SEQ ID NO:1或其变体,其具有转座子活性并且与SEQ ID NO:1具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中SEQ ID NO:1或其变体包含一个或多个以下取代:

(i)H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187F、H187S、H187V、H187W、H187K、H187Y、H187R、H187E、H187P或H187T,优选H187P、H187V或H187T,更优选H187V;

和/或

(ii)P247R、P247C、P247A或P247S;优选P247R或P247S和/或

(iii)K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

或在其变体的相应位置的取代。

在优选实施方案中,根据本发明的多肽包含SEQ ID NO:1或其变体,所述多肽具有转座活性并且与SEQ ID NO:1具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性,其中SEQ ID NO:1或其变体包含增加其转座活性的取代,其中所述取代优选为一个或多个上述取代。转座活性的增加可以是与wtSB或SEQ ID NO:1的SB的活性相比的增加。如上所述,已经描述了天然存在的转座酶的各种变体。例如,WO 2009/003671描述了转座酶的变体,特别是SB的变体,其具有过度活性,即与野生型转座酶,尤其是SB相比具有增加的转座酶活性。优选将本发明的取代引入转座酶的变体中,所述变体包括增强一种或多种性质,特别是转座酶转座活性的取代或取代组。因此,在一个实施方案中,根据本发明的多肽还包括以下取代或取代组中的至少一个:

(1)K14R、K13D、K13A、K30R、K33A、T83A、I100L、R115H、R143L、

R147E、A205K/H207V/K208R/D210E、H207V/K208R/D210E、R214D/K215A/E216V/N217Q;M243Q、E267D、T314N,和/或G317E;

(2)K14R//R214D/K215A/E216V/N217Q;

(3)K33A/R115H/R214D/K215A/E216V/N217Q/M243H;

(4)K14R/K30R/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H;

(5)K13D/K33A/T83N/H207V/K208R/D210E/M243Q;

(6)K13A/K33A/R214D/K215A/E216V/N217Q;

(7)K33A/T83N/R214D/K215NE216V/N217Q//G317E;

(8)K14R/T83A/M243Q;

(9)K14R/T83A/I100L/M243Q;

(10)K14R/T83A/R143L/M243Q;

(11)K14R/T83A/R147E/M243Q;

(12)K14R/T83A/M243Q/E267D;

(13)K14R/T83A/M243Q/T314N;

(14)K14R/K30R/I110L/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H;

(15)K14R/K30R/R143L/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H;

(16)K14R/K30R/R147E/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H;

(17)K14R/K30R/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/E267D;

(18)K14R/K30R/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H/T314N;

(19)K14R/K30R/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/G317E;

(20)K14R/K33A/R115H/R214D/K215A/E216V/N217Q/M243H;

(21)K14R/K30R/R147E/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/T314N;

(22)K14R/K30R/R143U/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/E267D;

(23)K14R/K30R/R143L/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/T314N;

(24)K14R/K30R/R143L/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q//M243H/G317E;

(25)K14R/K33A/R115H/R143L/R214D/K215A/E216V/N217Q/M243H;

(26)K14R/K33A/R115H/R147E//R214D/K215A/E216V/N217Q/M243H;

(27)K14R/K33A/R115H/R214D/K215A/E216V/N217Q//M243H/E267D;

(28)K14R/K33A/R115H/R214D/K215A/E216V/N217Q//M243H/T314N;

(29)K14R/K33A/R115H/R214D/K215A/E216V/N217Q//M243H/G317E;

(30)K14R/T83A/M243Q/G317E;或

(31)K13A/K33A/T83N/R214D/K215A/E216V/N217Q;

或在其变体的相应位置上的至少一个以下取代或取代组。优选地,将上述取代或取代组在相应位置引入天然存在的转座酶中,所述转座酶选自Tdr1(SEQ ID NO:2)、ZB(SEQID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ ID NO:5)、TCB2(SEQ ID NO:6)、S(SEQ ID NO:7)、Quetzal(SEQ ID NO:8)、Paris(SEQ ID NO:9)、Tc1(SEQ ID NO:10)、Minos(SEQ ID NO:11)、Uhu(SEQ ID NO:12)、Bari(SEQ ID NO:13)、Tc3(SEQ ID NO:14)、Impala(SEQ ID NO:15)、Himar(SEQ ID NO:16)、或Mos1(SEQ ID NO:17),除了本发明的取代优选所述转座酶是ZB(SEQ ID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ ID NO:5)或Minos(SEQ ID NO:11),优选(i)K248R、H187A、H187N、H187C、H187Q、H187G、H187I、H187L、H187M、H187F、H187S、H187V、H187W、或H187Y,优选H187I、H187V或H187L,更优选H187V;和/或(ii)P247R;和/或(iii)K248A或K248S;优选K248R;或在Tdr1(SEQ ID NO:2)、ZB(SEQ ID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ ID NO:5)、TCB2(SEQ ID NO:6)、S(SEQ ID NO:7)、Quetzal(SEQ ID NO:8)、Paris(SEQ ID NO:9)、Tc1(SEQ ID NO:10)、Minos(SEQ ID NO:11)、Uhu(SEQ ID NO:12)、Bari(SEQ ID NO:13)、Tc3(SEQ ID NO:14)、Impala(SEQ ID NO:15)、Himar(SEQ ID NO:16)、或Mos1(SEQ ID NO:17)的对应位置上的取代,优选转座酶是SB(SEQ ID NO:1)、ZB(SEQID NO:3)、FP(SEQ ID NO:4)、Passport(SEQ ID NO:5)、或Minos(SEQ ID NO:11)。

本发明第一方面的多肽最优选包含基于SEQ ID NO:1的氨基酸序列或由其组成,其中以下氨基酸在SEQ ID NO:1的氨基酸序列内被取代:

(1)增加转座活性的K14R以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(2)增加转座活性的K13D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(3)增加转座活性的K13A以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(4)增加转座活性的K30R以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(5)增加转座活性的K33A以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(6)增加转座活性的T83A以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(7)增加转座活性的I100L以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(8)增加转座活性的R115H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(9)增加转座活性的R143L以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(10)增加转座活性的R147E以及H187I、H187V、H187E、H187T、H187P或H187L、更优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(11)增加转座活性的A205K/H207V/K208R/D210E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(12)增加转座活性的H207V/K208R/D210E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(13)增加转座活性的R214D/K215A/E216V/N217Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R或P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(14)增加转座活性的M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(15)增加转座活性的E267D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(16)增加转座活性的T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(17)增加转座活性的G317E以及H187I、H187V、H187E、H187T、H187P或H187L、更优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(18)增加(1)至(18)中指示的转座活性的两个或多个单取代或取代组的组合与以下取代组合:H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

增加(1)至(18)中指示的转座活性的取代与本发明的取代的优选组合如下:

(19)增加转座活性的K14R//R214D/K215A/E216V/N217Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(20)增加转座活性的K33A/R115H/R214D/K215A/E216V/N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(21)增加转座活性的K14R/K30R/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S;优选K248R;

(22)增加转座活性的K13D/K33A/T83N/H207V/K208R/D210E/M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(23)增加转座活性的K13A/K33A/R214D/K215A/E216V/N217Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S;优选K248R;

(24)增加转座活性的K33A/T83N/R214D/K215NE216V/N217Q//G317E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(25)增加转座活性的K14R/T83A/M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(26)增加转座活性的K14R/T83A/I100L/M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(27)增加转座活性的K14R/T83A/R143L/M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(28)增加转座活性的K14R/T83A/R147E/M243Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R或P247S、P247,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(29)增加转座活性的K14R/T83A/M243Q/E267D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(30)增加转座活性的K14R/T83A/M243Q/T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(31)增加转座活性的K14R/K30R/I110L/A205K/H207V/K208R/D210E/R214D/K215A/E216V/N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C

或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(32)增加转座活性的K14R/K30R/R143L/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q//M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C

或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(33)增加转座活性的K14R/K30R/R147E/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C

或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(34)增加转座活性的K14R/K30R/A205K/H207V/K208R/D210E/R214D/

K215A/E216V/N217Q//M243H/E267D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C

或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(35)增加转座活性的K14R/K30R/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q/M243H/T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(36)增加转座活性的K14R/K30R/A205K/H207V/K208R/D210E/R214D/

K215A/E216V/N217Q//M243H/G317E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C

或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(37)增加转座活性的K14R/K33A/R115H/R214D/K215A/E216V/N217Q/

M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;

和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;(38)增加转座活性的K14R/K30R/R147E/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q//M243H/T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(39)增加转座活性的K14R/K30R/R143U/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q//M243H/E267D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(40)增加转座活性的K14R/K30R/R143L/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q//M243H/T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(41)增加转座活性的K14R/K30R/R143L/A205K/H207V/K208R/D210E/

R214D/K215A/E216V/N217Q//M243H/G317E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(42)增加转座活性的K14R/K33A/R115H/R143L/R214D/K215A/E216V/

N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;

和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;(43)增加转座活性的K14R/K33A/R115H/R147E//R214D/K215A/E216V/

N217Q/M243H以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C、或P247A,优选P247R;

和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;(44)增加转座活性的K14R/K33A/R115H/R214D/K215A/E216V/N217Q//

M243H/E267D以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;

和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;(45)增加转座活性的K14R/K33A/R115H/R214D/K215A/E216V/N217Q//M243H/T314N以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(46)增加转座活性的K14R/K33A/R115H/R214D/K215A/E216V/N217Q//M243H/G317E以及H187I、H187V、H187E、H187T、H187P或H187L、更优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;

(47)增加转座活性的K14R/T83A/M243Q/G317E以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R;或

(48)增加转座活性的K13A/K33A/T83N/R214D/K215A/E216V/N217Q以及H187I、H187V、H187E、H187T、H187P或H187L,优选H187V,和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R。

在优选实施方案中,第一方面的多肽包含SEQ ID NO:1的氨基酸或由其组成,其中下列氨基酸已被取代,其增加转座活性:K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N,并且还包含本发明的下列取代H187I、H187V、H187E、H187T、H187P或H187L,优选H187V和/或P247R、P247S、P247C或P247A,优选P247R;和/或K248R、K248A、K248S、K248V、K248I或K248C;优选K248R。特别地,本发明第一方面的多肽的优选实施方案具有包含SEQ ID NO:1或由其组成的氨基酸序列,其中下列氨基酸已被取代:取代:

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座子活性和H187V;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和P247R;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和K248R;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和P247R和K248R;优选

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N,以增加转座活性和H187V;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座子活性和H187P;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和H187T;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和H187S;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和H187E;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和P247R;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座活性和P247S;或

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H,和T314N以增加转座活性和K248R;

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N增加转座子活性和K248C;

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N增加转座子活性和K248I;

K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N以增加转座子活性和K248V。

当然,也可以包括另外的取代基,但优选地,与SEQ ID NO:1的序列同一性为至少70%、至少80%、至少90%或至少95%。

将增加的转座活性与本发明的取代特性相结合的本发明的特别优选的转座酶如下(增加转座活性的氨基酸取代用粗体+下划线突出显示,并且本发明的氨基酸取代由粗体、下划线和斜体突出显示):

H187V和K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H和T314N(SEQ IDNO:20):

P247R和K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H,和T314N(SEQ IDNO:21):

K248R和K14R、K33A、R115H、R214D/K215A/E216V/N217Q、M243H,和T314N(SEQ IDNO:22):

与现有技术中的方法相比,本发明的多肽(转座酶变体)具有几个优点,其中最突出的表现为整合到基因组中的特异性增益显著。

在第二方面,本发明涉及核酸,其包含编码第一方面的多肽的核酸序列。

在本发明第二方面的一个实施方案中,(编码)核酸序列可操作地连接到至少一个转录控制单元。

在根据本发明的核酸的一个实施方案中,所述核酸另外包括至少一个开放阅读框架。在另一个实施方案中,所述核酸另外包含基因的至少一个调控区。优选地,所述调控区是转录调控区,更具体地说,所述调控区选自启动子、增强子、沉默子、基因座控制区和边界元件。根据本发明的核酸通常包括核糖核酸,包括mRNA、DNA、cDNA、染色体DNA、染色体外DNA、质粒DNA、病毒DNA或RNA,还包括重组病毒载体。在本发明核酸的一个实施方案中,所述核酸是DNA或RNA,在另一个优选实施方案中所述核酸是质粒或重组病毒载体的一部分。本发明的核酸优选选自编码本发明多肽的氨基酸序列的任何核酸序列。因此,编码上述本发明突变多肽变体的所有核酸变体,包括由于遗传密码的退化而具有不同核苷酸序列的核酸变体。特别是核酸变体的核苷酸序列,其使得编码的融合蛋白在所选宿主生物体中改进表达,是优选的。用于将核酸序列适当地调节到宿主细胞的特异性转录/翻译机制的表是本领域技术人员已知的。通常,优选使核苷酸序列的G/C含量适应特定的宿主细胞条件。为了在人细胞中表达,优选G/C含量增加最大G/C含量(编码相应的本发明肽变体)的至少10%,更优选至少20%,30%,50%,70%,甚至更优选90%。这种核酸和/或衍生物的制备和纯化通常通过标准程序进行。

这些序列变体优选导致本发明的多肽或选自具有本发明转座活性的多肽的变体的蛋白质,与具有转座活性的相应多肽的天然核酸序列相比,其具有至少一个被取代的氨基酸。因此,本发明的核酸序列编码所述多肽的修饰(非天然)变体。此外,启动子或其他表达控制区可以与编码本发明多肽的核酸可操作地连接,以定量或以组织特异性方式调节多肽/蛋白质的表达。

在第三方面,本发明涉及包含如上所述的第二方面的核酸分子的载体。如上所述,编码本发明多肽的核酸可以是RNA或DNA。类似地,编码本发明多肽的本发明核酸或转座子可以是线性片段或环状分离片段,或插入载体中,优选作为质粒或作为重组病毒DNA。

在第四方面,本发明涉及包含第二方面的核酸或第三方面的载体的细胞。

在一个实施方案中,细胞来自动物,优选脊椎动物,其优选选自鱼类、鸟类或哺乳动物,优选哺乳动物,例如人。该细胞可以是免疫细胞,例如T细胞,例如原代T细胞。它也可以是肿瘤细胞。

在第五方面,本发明涉及将外源核酸整合到细胞基因组中的体外方法,所述方法包括以下步骤:

a)提供分离的细胞;

b)在细胞中提供本发明的多肽;和

c)在所述细胞中提供包含所述外源核酸的核酸或包含所述核酸的载体。

在体外方法的一个实施方案中,通过将核酸或本发明的载体引入细胞来将多肽提供给细胞。在这种情况下,任选地,外源核酸可以包含在核酸或包含外源核酸的核酸内。包含外源核酸的载体也可以单独提供给细胞。

多肽也可以以多肽的形式提供给细胞,例如通过将所述多肽添加到细胞培养基中。

在一个实施方案中,本发明的核酸、本发明的载体和/或外源核酸使用选自电穿孔、显微注射、脂质转染的方法在细胞中提供。电穿孔已被证明是特别有利的,例如,用于转导原代细胞。

所述细胞来自动物,优选脊椎动物,其优选选自鱼类、鸟类或哺乳动物,优选哺乳动物,例如人。

在第六方面,本发明涉及将外源核酸整合到受试者的细胞基因组中的体内方法,该方法包括施用本发明任何前述方面的多肽、核酸、或载体和包含外源核酸的核酸或包含所述核酸的载体的步骤。

在一个实施方案中,外源核酸包含在本发明的核酸或载体中。它也可以单独施用。

在一个实施方案中,使用选自电穿孔、显微注射、脂蛋白颗粒、病毒样颗粒的方法在细胞中提供核酸、或本发明的载体或外源核酸。

所述外源核酸可以是DNA或RNA。

在另一个方面,本发明涉及上述多肽、核酸、载体或细胞,用于医疗,特别是基因治疗。

在一个实施方案中,基因疗法包括但不限于自体或异源T细胞疗法、靶向血液中任何细胞类型的基因疗法、造血干细胞疗法、肝脏基因疗法、中枢神经系统基因疗法、眼睛基因疗法、肌肉基因疗法、皮肤基因疗法和/或用于治疗癌症的基因疗法。

通常,本发明的治疗应用可以是多方面的,因此所述多肽、核酸、载体、细胞,特别是根据本发明将外源核酸整合到细胞基因组中的方法,也可以在治疗应用中找到用途,其中上述方法用于将治疗性核酸(“治疗性目的核酸”),例如基因(治疗性目的核酸)稳定整合到靶细胞基因组中,即基因治疗应用。这也可能是将抗原整合到抗原呈递细胞中的疫苗接种疗法的目标,所述抗原例如特异性肿瘤抗原,例如MAGE-1,用于肿瘤疫苗接种或病理抗原,用于治疗源自病原体的感染性疾病,例如麻风病、破伤风、百日咳、伤寒、副伤寒、霍乱、鼠疫、结核病、脑膜炎、细菌性肺炎、炭疽、肉毒杆菌病、细菌性呼吸困难、腹泻、食物中毒、梅毒、胃肠炎、沟槽热、流感、猩红热、白喉、淋病、中毒性休克综合征、莱姆病、斑疹伤寒(Typhus)、李斯特菌病、消化性溃疡和军团病;用于治疗导致例如获得性免疫缺陷综合征、腺病毒科感染、阿尔法病毒感染、虫媒病毒感染、病媒传播疾病(Borne disease)、布尼亚病毒科感染、嵌杯病毒科病毒感染、水痘、尖锐湿疣、冠状病毒科病毒感染、柯萨奇病毒感染、巨细胞病毒感染、登革热、DNA病毒感染、臁疮、传染性脑炎、虫媒病毒、爱泼斯坦-巴尔二氏病毒感染、传染性红斑、汉坦病毒感染、出血热、病毒性肝炎、病毒性人单纯疱疹、带状疱疹、耳部带状疱疹、疱疹病毒科感染、传染性单核细胞增多症、禽流感、流感、人拉沙热、麻疹、传染性软疣、腮腺炎、副粘病毒科感染、白蛉热、多瘤病毒感染、狂犬病、呼吸道合胞病毒感染、裂谷热、RNA病毒感染、风疹、慢病毒疾病、天花、亚急性硬化性全脑炎、肿瘤病毒感染、疣、西尼罗河热、病毒性疾病、黄热病;用于治疗导致例如疟疾的原动物学感染。所述方法可用于递送多种治疗性核酸。目标治疗性核酸包括取代靶宿主细胞中的缺陷基因的基因,例如负责基于遗传缺陷的疾病状况的基因;在治疗癌症中具有治疗效用的基因;等等。

在另一方面,本发明涉及药物组合物,其包含所述多肽、核酸、载体或细胞以及药学上可接受的载体、佐剂或辅料。

药物组合物可以进一步包含一种或多种载体和/或赋形剂,所有这些载体和赋形剂优选是药学上可接受的。根据本发明,药物组合物含有有效量的活性剂,例如本文所述的多肽、核酸、载体或细胞,以产生所需反应或所需效果。根据本发明的药物组合物优选是无菌的。药物组合物可以以均匀的剂量形式提供,并且可以以本身已知的方式制备。根据本发明的药物组合物可以是例如溶液或悬浮液的形式。

可用于本发明组合物的药学上可接受的载体、佐剂或辅料包括但不限于离子交换剂、氧化铝、硬脂酸铝、卵磷脂、血清蛋白(如人血清白蛋白)、缓冲物质(如磷酸盐、甘氨酸、山梨酸、山梨酸钾)、饱和植物脂肪酸的偏甘油酯混合物、水、盐或电解质,如鱼精蛋白硫酸盐、磷酸氢二钠、磷酸氢钾、氯化钠、锌盐、胶体二氧化硅、三硅酸镁、聚乙烯吡咯烷酮、纤维素类物质、聚乙二醇、羧甲基纤维素钠、聚丙烯酸酯、蜡、聚乙氧基丙烯嵌段聚合物、聚乙二醇和羊毛脂。本发明的药物组合物可以通过口服、肠道外、吸入喷雾、局部、直肠、鼻腔、口腔、阴道或通过植入的储存器施用。本文使用的术语胃肠外包括皮下、静脉内、肌肉内、关节内、滑膜内、胸骨内、鞘内、肝内、病灶内和颅内注射或输注技术。优选地,药物组合物通过口服、腹膜内或静脉内施用。本发明药物组合物的无菌可注射形式可以是含水或含油悬浮液。这些悬浮液可以根据本领域已知的技术使用合适的分散剂或润湿剂和悬浮剂配制。无菌注射制剂也可以是在无毒的肠道外可接受的稀释剂或溶剂中的无菌注射溶液或悬浮液,例如在1,3-丁二醇中的溶液。可使用的可接受的辅料和溶剂包括水、林格溶液和等渗氯化钠溶液。此外,通常使用无菌的固定油作为溶剂或悬浮介质。

本发明的药物组合物优选适用于治疗疾病,特别是由基因缺陷引起的疾病,例如囊性纤维化、高胆固醇血症、例如A、B、C或XIII型血友病、包括HIV的免疫缺陷、亨廷顿病、α-抗胰蛋白酶缺陷,以及选自结肠癌、黑色素瘤、肾癌、淋巴瘤、急性髓细胞性白血病(AML)、急性淋巴细胞性白血病(ALL)、慢性髓细胞性白血病(CML)、慢性淋巴细胞性白血病(CLL)、胃肠道肿瘤、肺癌、神经胶质瘤、甲状腺癌、乳腺癌、前列腺肿瘤、肝细胞瘤、各种病毒诱导的肿瘤,如乳头瘤病毒诱导的癌症(如宫颈癌)、腺癌、疱疹病毒诱导的肿瘤(如伯基特淋巴瘤、EBV诱导的B细胞淋巴瘤)、乙型肝炎诱导的肿瘤(肝细胞癌)、HTLV-1和HTLV-2诱导的淋巴瘤、听神经瘤、肺癌、咽癌、肛门癌、胶质母细胞瘤、淋巴瘤、直肠癌、星形细胞瘤、脑肿瘤、胃癌、视网膜母细胞瘤、基底细胞瘤、脑转移、髓母细胞瘤、阴道癌、胰腺癌、睾丸癌、黑色素瘤、膀胱癌、霍奇金综合征、脑膜瘤、施耐德伯格病、支气管癌、垂体癌、蕈样肉芽肿、食道癌、乳腺癌、神经瘤、脊髓瘤、伯基特淋巴瘤、喉癌、胸腺瘤、体部癌、骨癌、非霍奇金淋巴瘤、尿道癌、CUP综合征、少突神经胶质瘤、外阴癌、肠癌、食管癌、小肠肿瘤、颅咽管瘤、卵巢癌、卵巢癌、肝癌、白血病、皮肤癌或眼癌;等。

本领域技术人员有多种可供选择的技术和方法,这些技术和方法类似地允许人们成功地实践预期的发明。

实施例

实施例1:睡美人转座酶中H187、P247和K248的饱和诱变鉴定出表现出转座效率改变的突变体

为了评估187、247和248位的单个氨基酸置换对转座的相对影响,通过定点PCR诱变掺入所有可能的氨基酸,对SB100X转座酶进行饱和诱变。通过蛋白质印迹分析,编码突变体SB100X转座酶的所有构建体显示出与SB100X相当的蛋白质表达水平。

接下来,我们通过在人类细胞中应用基于细胞的转座分析来评估突变体相对于SB100X的转座活性,该分析经过微调以获得每个细胞的单个转座子整合。简言之,携带嘌呤霉素(puro)抗性基因标记的转座子的供体质粒与编码SB100X、无活性的E279D转座酶(D3)或SB100X转座酶的突变变体的辅助质粒一起共转染。

与H187突变相反,绝大多数P247突变要么完全失活,要么整体转位(图3B)和切除(数据未显示)活性严重降低。P247A是最具活性的突变体,相对于SB100X具有109%的转座活性。值得注意的是,P247A的相对转位活性超过了计算的相对切除活性。切除能力和整合能力之间的这种差异可能是由于这两个值都是由两个独立的测定确定的。第二个活性最高的突变体是P247S,相对于SB100X,它保留了73%的转座子整合活性,其次是P247R(27%,p=0.017)、P247C(7%,p=0.002)和P247K(3%,p=0.003)(图3B)。

与P247类似,在几乎所有的19个突变体中,248位的氨基酸交换强烈减少了转坐(图3C)。到目前为止,K248R是最具活性的突变体,相对于SB100X具有77%的整合活性。另外三个K248突变体,包括K248C(4%,p=0.003)、K248I(4%,p=0.003)和K248V(9%,p=0.003),相对于SBX100在较低水平表现出转座活性。如最近所述,一些K248突变体显示出转座子切除和整合活性的分离(数据未显示)。

实施例2:H187、P247和K248转座酶突变体的靶位点偏好改变

为了研究突变是否对靶位点选择有影响,我们使用上述一些SB突变体在人HepG2细胞中产生转座子插入位点文库,并将这些插入位点的局部属性和全基因组分布与SB100X产生的位点进行比较。对于位置187,我们选择了6个对转座效率有显著影响的突变体(H187R、H187E、H187S、H187T、H187V、H187P)(图3A),而对于位置247和248,我们选择所有显示可测量转座活性的突变体(分别为P247A、P247R、P247C、P247S、P247K和K248C、K248I、K248V、K248R)(图3B和C)。通过SeqLogo分析对转座子整合位点进行可视化,该分析不仅报告共有序列,还提供关于整体序列保守性(以位(bit)为单位测量)和每个位置核苷酸的相对频率(以符号的高度为单位测量,符号的高度按其在标志内的相对频率排序)的信息。分析显示,对于所有突变体,高度优选的TA靶位点二核苷酸都嵌入富含A/T的DNA中,如先前对SB所述(图4)。SB100X转座酶优选以实际TA靶二核苷酸为中心的8-bp回文AT重复序列ATA

尽管SB100X和P247S和P247R突变体仅2-3%的时间靶向该特定序列,但一些其他突变体显示出显著更高的整合到该基序中的频率(H187P为18%,H187V为21%,K248R为39%,图4)。总之,SB转座酶187、247和248位的一些氨基酸取代导致高度优先整合到AT重复序列中的表型。

实施例3:H187、P247和K248转座酶突变体催化的插入物全基因组分布的改变

相对于计算机生成的随机数据集,我们确定了整合到基因组特征中的相对频率,所述基因组特征包括基因和非基因区域、癌症基因、外显子、内含子、5’-UTR和3’-UTR以及10-kb窗口内上游和下游基因侧翼的序列。我们不仅比较了SB100X及其突变体产生的这些基因组特征中的插入,还在分析中涉及MLVγ-逆转录病毒和HIV慢病毒整合位点。这两种病毒系统都是基因治疗中常用的载体。如前所述,SB转座子插入仅显示出对基因及其侧翼区域的轻微偏好,而MLV和HIV插入分别富集在转录起始位点(TSS)侧翼和活跃转录基因内的基因座中(图5)。在这三个基因载体系统中,SB的总插入频率最接近预期的随机分布(图5)。

接下来,我们选择了一小部分突变体:即P247R、H187V和K248R突变体,并确定了这些突变体是否产生与SB100X明显不同的全基因组分布谱。图5A中的数据很有启发性。特别是H187V和K248R突变体在插入基因方面表现出显著的下降。最显著的差异在5'-和3'-UTR以及外显子(包括编码外显子)内。重要的是,与SB100X相比,H187V和K248R在这些基因组区域内的转座子整合不仅被减少,而且与随机数据集相比也被减少。插入这些基因组区域的总百分比如图5E所示。在编码外显子中,与SB100X相比,K248R的整合频率变化最显著,下降了4倍(p<0.001)(图5A)。除了驱动外显子的整合之外,我们的突变体更倾向于整合到AT重复序列中,这也意味着这些插入可能在重复DNA中富集。事实上,对于H187V和K248R催化的整合,检测到简单重复序列的显著富集;该基因组区室中的富集度是随机数据集的约12倍(p<0.001),H187V是SB100X的约4倍(p>0.001),K248R是随机数据集中的约21倍(p=0.001),SB100X(p<001)的约7倍(图5C)。与整合到ATATATAT中的偏好一致,H187V变体在富含TA的简单重复序列中分别比随机和SB100X富集24倍和约5倍(p<0.001),而K248R介导的插入在富含TA的简单重复中分别比随机和SB100X富集约43倍和约8倍(p>0.001)(图5D)。

接下来,我们分析了SB100X和P247R、H187V和K248R突变体在功能基因组片段中产生的插入。这些片段是由共现的表观遗传信号模式定义的,这些信号模式通过计算聚集在一起,构成人类基因组的各种功能分区。我们使用了人HepG2细胞的25态染色质模型。如上所述,我们将MLV和HIV插入物纳入分析。首先,与先前的观察结果一致,SB转座子插入仅显示出对具有开放染色质结构的启动子、TSS、增强子和转录调控区的轻微偏好,而MLV和HIV插入分别显示出对启动子区(包括TSS和转录区)的最高富集(图5B)。其次,对于H187V和K248R催化的整合,增强子、启动子(包括TSS)和开放调控区显著减少;最显著的变化是,在包括TSS的启动子中,H187V分别比MLV、SB100X(p<0.001)和随机数据集减少约50倍、约3倍和约5倍,在增强子中,K248R分别比MLV、SB100X(p<001)和随机数据集减少约14倍、4倍和约3倍(图5B)。总的来说,数据显示P247R、H187V和K248R突变体使很大一部分转座子的整合偏离(de-target)了外显子以及转录调控区(包括启动子和增强子)。

实施例4:H187V、P247R和K248R转座酶突变体将插入物富集到基因组安全港中

将治疗性基因构建体整合到人类基因组的安全位点将防止基因治疗中的插入突变和相关的致癌风险。基因组“安全港”(GSH)是人类基因组中能够适应新整合DNA的可预测表达而不会对宿主细胞或生物体产生不利影响的区域。如果GSH满足以下标准,则可以将其生物信息学地分配到染色体位点或区域:(i)与转录单元不重叠,(ii)与任何基因的5′-末端的距离至少50kb,iii)与癌症相关基因的距离至少300kb,和(iv)微小RNA基因,以及(v)超富集元件(UCE)58,68之外的区域。我们之前已经确定,就插入GSH的频率而言,SB转座子系统比基于MLV和HIV的病毒整合系统具有明显更有利的插入特性。

上述数据证实,我们的一些SB转座酶突变体显著地使插入物偏离基因的外显子和转录调控区,从而固有地意味着由这些酶催化的插入物的较大部分落在GSH中。我们分析了插入位点数据集中P247R、H187V和K248R转座酶变体整合到GSH中的相对频率,如上所述,我们在分析中包括了MLV和HIV插入(图6)。图6A在树状图中显示了三个聚类:第一个聚类由MLV和HIV表示,第二个聚类由SB100X、P247R和H187V表示,第三个聚类由K248R和随机表示。SB100X转座酶及其突变体的插入逐渐向随机分布转变。例如,只有17%的HIV插入位于基因之外,而SB100X的这一值为41%,P247R为42%,H187V为44%,K248R为46%,随机数据集为49%(图6A)。根据这些观察结果,我们的分析显示,通过同时应用所有五种GSH标准,插入GSH的频率增加。在测试的突变体中,K248R转座酶变体最接近随机:总体而言,29%的K248R插入和34%的随机插入落在GSH中(图6B)。总的来说,我们的分析预测1)SB系统比基于MLV和HIV的载体更安全、更有利的转基因插入谱,以及2)P247R、H187V和K248R转座酶变体在人类细胞中的治疗性基因转移中的安全性增强。

实施例5:H187V和K248R转座酶变体避开核小体DNA进行整合

酵母中Hermes转座子的高密度整合图谱显示整合位点与无核小体染色质有很强的相关性。此外,最近的证据表明,Tc1/mariner转座子优先整合在核小体之间的连接区。我们根据MNase Seq数据确定的核小体占位绘制了插入数据集。如前所述,SB100X介导的转座子插入在核小体DNA中的代表性不足(图7)。值得注意的是,在测试的三个转座酶突变体中,H187V和K248R变体不仅与随机对照相比,而且与SB100X数据集相比,转座子整合位点和核小体占位的关联都大幅下降(图7)。因此,H187V和K248R突变显著增强了SB转座酶的表型;即避免核小体DNA进行转座子整合。

实施例6:与H187、P247和K248转座酶突变体的优先基因组靶位点相关的分子特征

上述数据证实H187V和K248R转座酶突变体偏离基因的外显子和转录调控区,并避开核小体DNA进行整合。然而,这些数据并不一定能揭示这些独立观察之间的因果关系。例如,外显子往往与核小体相关;因此,H187V和K248R在外显子序列中整合的缺失可能只是这些转座酶变体避开核小体DNA的反映。然而,包括增强子和TSS在内的转录调控区在核小体中明显缺失;尽管如此,我们发现H187V和K248R偏离这些基因组区域,这表明核小体本身的占据不能充分解释为什么H187V和K248R整合在外显子和调控区域中都被减少。由于基因组片段是由染色质标记定义的,因此产生了一个问题,即是局部染色质结构还是潜在的初级DNA序列调节了这些片段中的整合频率。与先前的研究结果27一致,SB100X转座酶在人类细胞中催化几乎随机的插入谱,对常染色质标记(包括H3K4me1、H3K27ac、H3K36me3和H3K29me2)有轻微的偏好(图8A)。与SB100X插入相比,我们检测到H187V和K248R变体在染色质标记中的显著缺失(p<0.001)(图8C);然而,减少并不局限于常染色质标记。相反,H187V和K248R插入通常在组蛋白修饰中缺失,无论它们是标记转录活性染色质还是抑制染色质(图8A);因此,我们认为H187V和K248R转座酶变体与染色质的差异相互作用与SB100X相比是不可能的。上述发现使我们假设H187、P247和K248转座酶突变体的优选基因组靶标的主要决定簇是DNA序列组成。外显子,特别是编码外显子在TA二核苷酸中相对较差(图8B),这是SB转座的优选靶位点。已经看到我们的一些突变体,特别是H187V和K248R对ATATATAT序列基序的明显偏好,这意味着该突变体对外显子序列的偏离是由该序列基序在外显子序列中罕见出现所驱动的。事实上,ATATATAT在外显子中的代表性严重不足,尤其是在编码外显子时(图8B),从而表明初级DNA序列组成是驱动H187V和K248R插入远离外显子序列的主要决定因素。类似地,与人类基因组的平均碱基组成相比,开放调控区、TSS和增强子的TA相对较差(图8C)。如编码外显子所示,H187V和K248R突变体优先整合的ATATATAT序列基序在这三个基因组片段中严重不足(图8C)。数据表明,H187V和K248R突变体偏离外显子和转录调控区的主要决定因素是这些基因组区域中高度优选的ATATATAT序列的可用性降低。

实施例7:H187P、H187R、H187E、H187S、H187T、P247S、P247A、P247C、P247S、K248C、K248I和K248V转座酶突变体催化的插入物全基因组分布的改变

与实施例3中一样,相对于计算机生成的随机数据集,确定了整合到基因组特征中的相对频率,包括基因和非基因区域、癌症基因、外显子、内含子、5’-和3’-UTR以及10-kb窗口内基因上游和下游侧翼的序列。再次,我们将MLVγ-逆转录病毒和HIV慢病毒整合位点纳入分析。

这一次,我们分析了额外突变体的子集;即H187P、H187R、H187E、H187S、H187T、P247S、P247A、P247C、P247S、K248C、K248I和K248V,再次确定了这些突变体是否产生与SB100X有明显不同的全基因组分布谱(图9)。除了P247A和P247C,所有测试的突变体都显示出或多或少明显的插入基因的缺失。同样,在5'-和3'-UTR以及包括编码外显子在内的外显子中发现了最大的差异。在编码外显子中,与SB100X相比,K248I和K248C的整合频率变化最显著,下降了4倍(图9)。总之,这两个突变体发挥了与实施例3中测试的K248R突变体相似的效果(图5A)。有趣的是,P247A突变体似乎是其他变体的一个显著例外,因为它实际上增加了整合到外显子和转录调控区的频率(图9)。因此,它也使得插入特异性的增益,但与其他突变体相比方向相反。

相关技术
  • 包含具有半乳聚糖酶活性的多肽和具有β-半乳糖苷酶活性的多肽的组合物
  • 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
  • 一个具有自主转座活性的逆转录转座子Ra-RARE-1及其应用
技术分类

06120116592122