掌桥专利:专业的专利平台
掌桥专利
首页

用工程化细菌泛素连接酶模拟物进行的广谱蛋白质组编辑

文献发布时间:2023-06-19 09:24:30



本申请要求2018年3月16日提交的美国临时专利申请序列第62/644,055号的优先权权益,其全部内容特此通过引用并入本文。

技术领域

本申请总体上涉及用工程化细菌泛素连接酶模拟物进行的广谱蛋白质组编辑。

背景技术

传统上已经通过破坏编码蛋白质的靶基因的表达并分析产生的表型结果来研究蛋白质功能。现在通常使用基因沉默和基因组编辑技术如反义寡核苷酸(“ASO”)、RNA干扰(“RNAi”)、锌指核酸酶(“ZFN”)、转录激活因子样效应物核酸酶(“TALEN”)和成簇的规律间隔的短回文重复序列(“CRISPR”)-Cas系统进行此类功能丧失实验。McManus等人,“GeneSilencing in Mammals by Small Interfering RNAs,”Nat.Rev.Genet.3(10):737-47(2002);Deleavey等人,“Designing Chemically Modified Oligonucleotides forTargeted Gene Silencing,”Chemistry&Biology 19(8):937-54(2012);Boettcher等人,“Choosing the Right Tool for the Job:RNAi,TALEN,or CRISPR,”Mol.Cell 58(4):575-85(2015);和Gaj等人,“TALEN,and CRISPR/Cas-Based Methods for GenomeEngineering,”Trends Biotechnol.31(7):397-405(2013)。这些方法被广泛用于基础研究,并有望用于治疗遗传性障碍。Gaj等人,“TALEN,and CRISPR/Cas-Based Methods forGenome Engineering,”Trends Biotechnol.31(7):397-405(2013);Cox等人,“Therapeutic Genome Editing:Prospects and Challenges,”Nat.Med.21(2):121-31(2015);Soutschek等人,“Therapeutic Silencing of an Endogenous Gene by SystemicAdministration of Modified siRNAs,”Nature 432(7014)173-78(2004);Bumcrot等人,“RNAi Therapeutics:A Potential New Class of Pharmaceutical Drugs,”Nat.Chem.Biol.2(12):711-19(2006);和Wang等人,“Non-Viral Delivery of Genome-Editing Nucleases for Gene Therapy,”Gene Ther.24(3):144-50(2017)。但是,仍然存在许多挑战,包括:缺乏时间控制,不可预测的脱靶效应;在基因组编辑的情况下,无法去除必需基因以及此类敲除的不可逆性质,和在基因沉默的情况下,无法降低细胞内已经存在的蛋白质水平,因此不会影响稳定的、长寿的蛋白质。

蛋白质组编辑技术代表了用于研究蛋白质功能的正交方法,其在翻译后水平上操作,并且具有以比靶向DNA或RNA的方法更高的分辨率以及以翻译后精度剖析复杂蛋白质功能的潜力。最著名的方法之一涉及“降解抑制”,由此强行控制细胞泛素-蛋白酶体途径(“UPP”)的机制以特异性降解目标蛋白质。规范泛素化级联需要三种酶-泛素激活酶(E1)、泛素结合酶(E2)和泛素连接酶(E3)-的活性,所述酶通过以能量依赖性方式将聚泛素链共价连接至赖氨酸残基而依次作用于用于降解的标签蛋白。

E3是UPP中最异质的酶种类(在人类中存在大于600的E3),并且可以根据特征结构域的存在和泛素转移至底物蛋白的机制分类为HECT(与E6AP C-末端同源)、RING(真正有趣的新基因(really interesting new gene))和RBR(RING-between-RING)。Buetow等人,“Structural Insights into the Catalysis and Regulation of E3 UbiquitinLigases,”Nat.Rev.Mol.Cell Biol.17(10):626-42(2016)。因为它们介导底物特异性并且通常表现出显著的可塑性,E3泛素连接酶是迄今描述的蛋白质组编辑策略中最常利用的组分。例如,化学敲低已经使用称为蛋白水解靶向嵌合体的小分子或PROTAC实现(Neklesa等人,“Targeted Protein Degradation by PROTACs,”Pharmacol.Ther.17:4138-144(2017)和Deshaies,R.T,“Protein Degradation:Prime Time for PROTACs,”Nat.Chem.Biol.11(9):634 35(2015)),PROTAC是含有一个E3泛素连接酶的配体、另一个待降解蛋白质的配体和连接两者的接头的异双功能分子。这些分子结合E3和靶标,促进三元复合物的形成,所述三元复合物引发靶标聚泛素化,随后其蛋白酶体降解。已经报道了越来越多的基于肽和小分子的PROTAC,其能够在细胞和小鼠中实现化学敲除。Schneekloth等人,“ChemicalGenetic Control of Protein Levels:Selective In Vivo Targeted Degradation,”J.Am.Chem.Soc.126(12):3748-54(2004);Hines等人,“Posttranslational ProteinKnockdown Coupled to Receptor Tyrosine Kinase Activation withPhosphoPROTACs,”Proc.Natl.Acad.Sci.USA 110(22):8942-47(2013);Schneekloth等人,“Targeted Intracellular Protein Degradation Induced by a Small Molecule:EnRoute to Chemical Proteomics,”Bioorganic Med.Chem.Lett.18(22):5904-08(2008);Bondeson等人,“Catalytic In Vivo Protein Knockdown by Small-Molecule PROTACs,”Nat.Chem.Biol.11(8):611—17(2015);和Sakamoto等人,“Protacs:Chimeric Moleculesthat Target Proteins to the Skp1-Cullin-F Box Complex for Ubiquitination andDegradation,”Proc.Natl.Acad.Sci.USA 98(15):8554-59(2001)。这些化合物的有吸引力的特征是它们的药物样性质,包括细胞渗透性;然而,许多基于肽和小分子的PROTAC的效力低—常常需要高达25μM的浓度以诱导充分的降解(Buckley等人,“Small-MoleculeControl of Intracellular Protein Levels Through Modulation of the UbiquitinProteasome System,”Angew Chem.Int.Ed.Engl.53(9):2312-30(2014))—并且定制PROTAC的产生受到相对缺乏E3泛素连接酶和期望的蛋白质靶的可用配体以及与从头产生此类配体相关的技术挑战的限制(Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014))。

为了克服这些问题,已经开发了基于蛋白质的嵌合体,其中E3泛素连接酶被遗传融合到结合目标靶的蛋白质。在细胞中异位表达后,工程化的蛋白质嵌合体将E3募集至靶蛋白质,导致其聚泛素化并随后被蛋白酶体降解。在最早的实例中,通过产生F-box嵌合体实现蛋白质敲除,其中β-TrCP与来源于由人乳头瘤病毒16型编码的E7蛋白的肽融合,其已知与成视网膜细胞瘤蛋白pRB相互作用(Zhou等人,“Harnessing the UbiquitinationMachinery to Target the Degradation of Specific Cellular Proteins,”Mol.Cell 6(3):751-56(2000)和Zhang等人,“Exploring the Functional Complexity of CellularProteins by Protein Knockout,”Proc.Natl.Acad.Sci.USA 100(24):14127-32(2003))。异位表达后,工程化的F-box将pRB募集到Skp1-Cul1-F-box(“SCF”)机构,一种用于泛素化和破坏的来自Cullin-RING连接酶(“CRL”)超家族的多蛋白E3复合物。少数其他研究类似地利用天然蛋白质-蛋白质相互作用,由此一种相互作用蛋白质与E3的融合产生嵌合体,该嵌合体在细胞和小鼠中表达后使相应的结合伴侣沉默。Hatakeyama等人,“TargetedDestruction of C-Myc by an Engineered Ubiquitin Ligase Suppresses CellTransformation and Tumor Formation,”Cancer Res.65(17):7874-79(2005);Ma等人,“Targeted Degradation of KRAS by an Engineered Ubiquitin Ligase SuppressesPancreatic Cancer Cell Growth In Vitro and In Vivo,”Mol.Cancer Ther.12(3):286-94(2013);和Kong等人,“Engineering a Single Ubiquitin Ligase for theSelective Degradation of all Activated ErbB Receptor Tyrosine Kinases,”Oncogene 33(8):986-95(2014)。

最近,显示通用蛋白质组编辑技术可以扩展到天然存在的结合对之外。该方法包括将E3融合到合成的结合蛋白,例如单链抗体片段(“scFv”)、设计锚蛋白重复蛋白(“DARPin”)或III型纤连蛋白(“FN3”)抗体类似物(monobody)。Portnoff等人,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With Unnatural SubstrateSpecificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014)。这些双功能嵌合体,称为“ubiquibody”(“uAb”),结合了人RING/U-box型E3 CHIP(Hsc70-相互作用蛋白的羧基末端)的灵活的泛素标记能力与合成的结合蛋白的可工程化的亲和力和特异性。结果是一种可定制的技术,用于有效地将另外稳定的蛋白导向UPP,以便独立于它们的生物功能或相互作用而进行降解。事实上,uAb的最大优点之一是它们的高度模块化结构-简单地交换合成的结合蛋白可以产生特异性靶向不同底物蛋白的新uAb(Caussinus等人,“Fluorescent Fusion Protein Knockout Mediated by Anti-GFPNanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher等人,“TargetingEndogenous Proteins For Degradation Through the Affinity-Directed ProteinMissile System,”Open Biol.7(5):170066(2017);Fulcher等人,“An Affinity-DirectedProtein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin等人,“Nanobody-Targeted E3-Ubiquitin Ligase Complex DegradesNuclear Proteins,”Sci.Rep.5:14269(2015);和Kanner等人,“Sculpting Ion ChannelFunctional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017)),同时交换E3结构域可改变泛素转移的动力学或机制。此外,通过掺入识别特定蛋白状态(例如活性相对于无活性构象、突变体相对于野生型、翻译后修饰)的合成结合蛋白,可以排除某些蛋白亚群而不损害其他亚群。Zhang等人,“Exploring the FunctionalComplexity of Cellular Proteins by Protein Knockout,”Proc.Natl.Acad.Sci.USA100(24):14127-32(2003)和Baltz等人,“Design and Functional Characterization ofSynthetic E3 Ubiquitin Ligases for Targeted Protein Depletion,”Curr.Prot.Chem.Biol.10(1):72-90(2018)。然而,目前uAb的发展集中在相对窄的一组哺乳动物E3,最值得注意的是“独立的”E3 CHIP或多蛋白E3连接酶复合物的CRL超家族的成员。

本申请结合基于蛋白质的嵌合体的专门知识,由此新的E3泛素连接酶基序遗传融合到结合目标靶的蛋白质,从而解决上述挑战并克服本领域中的这些和其他缺陷。

发明内容

本申请的第一方面涉及一种分离的嵌合分子。分离的嵌合分子包含降解结构域,该降解结构域包含E3泛素连接酶(E3)基序;能够特异性地将降解结构域引导至底物的靶向结构域,其中所述靶向结构域与所述降解结构域异源;以及将降解结构域与靶向结构域偶联的接头。

本申请的第二方面涉及一种形成核糖核蛋白的方法。该方法包括提供编码本文所述的分离的嵌合分子的mRNA;提供一个或多个聚腺苷酸结合蛋白(“PABP”);和由mRNA和一个或多个PABP组装核糖核蛋白复合物。

本申请的第三方面涉及一种包含本文所述的嵌合分子和药学上可接受的载体的组合物。

本申请的第四方面涉及一种治疗疾病的方法。该方法包括选择患有疾病的受试者,并且向所述受试者施用本文所述的组合物,以使所述受试者具有与未患有所述疾病的受试者相比增加的底物表达水平。

本申请的第五方面涉及一种用于底物沉默的方法。该方法包括选择待沉默的底物;提供本文所述的嵌合分子;和使所述底物与嵌合分子在有效允许形成底物-分子复合物的条件下接触,其中所述复合物介导待沉默的底物的降解。

本申请的第六方面涉及一种筛选对疾病具有治疗功效的试剂的方法。该方法包括提供生物分子,其存在介导疾病状态;提供测试试剂,其包含(i)包含E3泛素连接酶(E3)基序的降解结构域,(ii)能够特异性地将所述降解结构域导向所述生物分子的靶向结构域,其中所述靶向结构域与所述降解结构域异源,和(iii)将所述降解结构域偶联至所述靶向结构域的接头;使所述生物分子在有效使所述测试试剂促进所述生物分子降解的条件下与所述测试试剂接触;确定作为接触的结果的生物分子的水平;以及基于所述确定,将降低所述生物分子水平的所述测试试剂鉴定为对所述疾病具有治疗功效的候选物。

本申请的第七方面涉及一种筛选疾病生物标志物的方法。该方法包括提供表达一种或多种配体的患病细胞的样品;提供多个嵌合分子,其包含(i)包含E3泛素连接酶(E3)基序的降解结构域,(ii)能够特异性地将所述降解结构域引导至所述一种或多种配体的靶向结构域,其中所述靶向结构域与所述降解结构域异源,和(iii)将所述降解结构域与所述靶向结构域偶联的接头;使样品在有效使患病细胞在不存在嵌合分子的情况下不能增殖的条件下与多个嵌合分子接触;确定哪些嵌合分子允许患病细胞增殖;和基于所述确定将与嵌合分子结合并允许患病细胞增殖的配体鉴定为疾病的生物标志物。

操纵泛素-蛋白酶体途径以实现细胞蛋白质的靶向沉默已成为重塑哺乳动物蛋白质组的可靠且可定制的策略。一种此类方法涉及工程化称为ubiquibody的双功能蛋白,ubiquibody由与E3泛素连接酶融合的合成结合蛋白构成,因此能够进行翻译后泛素化和靶蛋白降解,而与其功能无关。在这里,基于来自细菌病原体的E3泛素连接酶模拟物设计了一组新的ubiquibody,该模拟物能够有效地与哺乳动物蛋白酶体降解机制相互作用,以选择性去除目标蛋白质。其中之一是融合至特异性识别绿色荧光蛋白(GFP)的III型纤连蛋白(FN3)抗体类似物的弗氏志贺氏菌(Shigella flexneri)效应蛋白IpaH9.8,观察到其有效地消除GFP及其光谱衍生物以及15种不同的带有FP标签的大小(27-179kDa)和亚细胞定位(细胞质、细胞核、膜相关和跨膜)变化的哺乳动物蛋白。为了证明ubiquibody的治疗相关递送,利用了生物仿生分子组装方法,由此将编码GFP特异性ubiquibody的合成mRNA与聚A结合蛋白共组装,并使用带有阳离子胺侧基的生物相容性、结构明确的多肽包装成纳米尺寸的复合物。所得纳米复合物以导致在稳定表达GFP的培养的哺乳动物细胞以及普遍表达GFP的转基因小鼠中有效靶标耗竭的方式递送ubiquibody mRNA。总体而言,此处给出的结果表明,基于IpaH9.8的ubiquibody是一种具有药理学调节致病蛋白潜力的高度模块化的蛋白质组编辑技术。

因此,本申请涉及基于一类新型嵌合分子的嵌合分子、组合物、治疗、药物组合物、蛋白质沉默技术、治疗剂的阐明和靶标筛选技术。此类嵌合体在本文中称为“ubiquibody”,其导入E3泛素酶的连接酶功能以产生具有靶标特异性的分子。此类工程化的嵌合体有助于特定底物靶标的重定向和蛋白水解降解,所述底物靶标可能不会以其他方式与蛋白酶体结合。

在这方面,靶向清除此类特定底物(例如细胞内蛋白质)可将广泛的科学和临床适应症归因于本文提供的嵌合分子、组合物、治疗、药物组合物、蛋白质沉默技术、治疗剂的阐明和筛选技术。因此,本申请基于通过泛素化对异常表达的基因进行蛋白水解降解而提供了多种有价值的用于采用和开发特定的预后和治疗应用的工具。

在此,寻求扩大可以在功能上重新编程为双功能uAb嵌合体的E3的范围。但是,与以前涉及哺乳动物E3的努力明显不同的是,重点反而是来自微生物病原体的一组效应蛋白,其模拟宿主E3泛素连接酶并强行控制UPP机制以减弱感染过程中的先天免疫应答。Maculins等人,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons ofInvasion.Cell Res.26(4):499-5l0(2016)和Lin等人,“Exploitation of the Host CellUbiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017),其全部内容特此通过引用并入本文。这些酶的固有可塑性使我们假设可以操纵细菌E3进行靶向蛋白水解,就像其哺乳动物对应物一样。实际上,用由弗氏志贺氏菌E3连接酶IpaH9.8构成的uAb实现了强大的靶标沉默,uAb表现出与真核HECT型E3的相似性,但由于缺少与任何真核E3的序列和结构同源性而被归类为新型E3连接酶(“NEL”)。Maculins等人,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.CellRes.26(4):499-5l0(2016);Lin等人,“Exploitation of the Host Cell UbiquitinMachinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017);Zhu等人,“Structure of a Shigella Effector Reveals a New Class of UbiquitinLigases,”Nat.Struct.Mol.Biol.15(12):1302-08(2008);Singer等人,“A Pathogen TypeIII Effector With a Novel E3 Ubiquitin Ligase Architecture,”PLoS Pathogens 9(1):e1003 121(2013);和Rohde等人,“Type III Secretion Effectors of the IpaHFamily are E3 Ubiquitin Ligases,”Cell Host Microbe 1(1):77-83(2007),其全部内容特此通过引用并入本文。当IpaH9.8的C末端催化NEL结构域与特异性识别绿色荧光蛋白(“GFP”)的GFP特异性FN3抗体类似物GS2融合时,观察到在培养的哺乳动物细胞中瞬时和稳定表达后,EGFP有效降解。此外,GS2-IpaH9.8嵌合体还能够加速EGFP的光谱衍生物的降解,包括Emerald、Venus和Cerulean以及15种不同的带有FP标签的大小范围从27至179kDa并且定位于不同亚细胞区室(包括细胞质、细胞核和细胞膜)的哺乳动物蛋白。对于SHP2和Ras这两个靶标,当将IpaH9.8与SHP2或Ras特异性FN3结构域融合时,也实现了有效的沉默,突出了可以重新配置基于IpaH的uAb的便利性。

如前所述,uAb治疗发展的主要障碍是细胞内递送。Osherovich,L.,“DegradationFrom Within,”Science-Business Exchange 7:10-11(2014),其全部内容特此通过引用并入本文。与较小的可以设计用于细胞渗透性的PROTAC不同(Buckley等人,“Small-MoleculeControl of Intracellular Protein Levels Through Modulation of the UbiquitinProteasome System,”Angew Chem.Int.Ed.Engl.53(9):2312-30(2014),其全部内容特此通过引用并入本文),uAb是较大的蛋白质,不能有效地穿透细胞膜。为了解决该问题,实施了生物仿生性mRNA递送策略,由此将以另外的3'-末端聚腺苷(“聚A”)尾编码GS2-IpaH的mRNA与聚A结合蛋白(“PABP”)化学计量络合,从而用于改善mRNA稳定性并且还刺激真核细胞中的mRNA翻译(Li等人,“Polyamine-Mediated Stoichiometric Assembly ofRibonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017),其全部内容特此通过引用并入本文)。所得的核糖核蛋白(“RNP”)用阳离子多肽稳定化,以保护mRNA免于降解,使其能够被细胞摄取,并促进其内体逃逸。重要地是,这些共组装的纳米复合物以下述方式递送GS2-IpaH9.8 mRNA:导致在导入稳定表达GFP的培养的哺乳动物细胞后和向普遍表达GFP的转基因小鼠施用后引起有效的GFP沉默。总体而言,本文描述的结果表明,uAb介导的蛋白质组编辑是用于靶向降解细胞和小鼠中的蛋白质的有效策略,从而为将uAb作为药物发现工具和作为有可能在药理学上命中所谓的“无成药性”靶标的治疗候选物做好准备。

附图说明

图1A-1C描绘了将细菌E3连接酶IpaH9.8工程化为GFP特异性ubiquibody。图1A显示了IpaH9.8、IpaH9.8ΔLRR和GS2-IpaH9.8的线性表示。数字是指从N末端(“N”)至C末端(“C”)的氨基酸位置。蛋白质与IpaH9.8的LRR和NEL结构域垂直对齐。IpaH9.8ΔLRR是缺少LRR结构域的IpaH9.8的截短版本。图1B显示了所示的用质粒pcDNA3-EGFP单独转染或用pcDNA3-EGFP和编码一种基于细菌E3的uAb的质粒共转染的HEK293T细胞中EGFP荧光活性的流式细胞术分析,图1C与图1B相同,但在图1C中示出了基于哺乳动物E3的uAb。数据是针对单独表达EGFP的HEK283T细胞测得的MFI标准化的几何平均荧光强度(“MFI”)的一式三份生物学重复。误差棒代表平均值的标准偏差(“SD”)。

图2A-2D说明了IpaH9.8的催化结构域对于ubiquibody功能是必不可少的。图2A显示了通过在用pcDNA3-EGFP单独转染或用pcDNA3-EGFP和编码以下之一:GS2-IpaH9.8

图3A-3B显示GS2-IpaH9.8降解结构多样的荧光蛋白融合体。图3A描绘了用编码所示FP融合体的质粒(深灰色)单独转染或用FP融合质粒和pcDNA3-GS2-IpaH9.8

图4A-4C描绘了针对疾病相关靶标的IpaH9.8 ubiquibody。图4A说明了用pcDNA3-SHP2-EGFP单独转染或用pcDNA3-SHP2-EGFP和编码以下之一:GS2-IpaH9.8、GS2-IpaH9.8

图5A-5D描绘了通过ubiquibody mRNA的纳米复合物递送在小鼠中进行的蛋白质组编辑。图5A是多胺(TEP(N4))-介导的用于增强mRNA递送的mRNA/PABP核糖核蛋白的化学计量组装的示意图。在细胞内化后(灰色圆圈),纳米复合物解体导致释放mRNA/PABP,其被降解或翻译以产生uAb蛋白。图5B描绘了在用编码GS2-IpaH9.8、GS2-IpaH9.8

图6A-6B描绘了带有细菌和哺乳动物E3泛素连接酶结构域的uAb导致的GFP沉默。通过在所示的用pcDNA3-EGFP单独转染或用pcDNA3-EGFP和编码由与(如图6A所示)细菌或(如图6B所示)哺乳动物E3泛素连接酶之一融合的GS2构成的uAb的质粒共转染的HEK293T细胞中EGFP荧光活性的流式细胞术分析获得的代表性荧光直方图。显示了几何平均荧光强度(“MFI”)的值。

图7A-7B显示了GS2-IpaH9.8结合活性和表达的表征。在图7A中,显示了与所示的单独的GS2、缺少LRR结构域的IpaH9.8(“IpaH9.8 LRR”)或催化惰性的GS2-IpaH9.8

图8A-8B描绘了uAb介导的FP变体和另外的FP融合蛋白靶标的沉默。图8A显示了所示的用编码FP变体和pcDNA3-GS2-IpaH9.8C337A(白色)或pcDNA3-GS2-IpaH9.8(灰色)的质粒共转染的HEK293T细胞中荧光活性的流式细胞术定量。mCherry用作阴性对照。数据是针对单独表达相应FP的HEK283T细胞测得的MFI标准化的几何MFI的一式三份生物学重复。误差棒代表平均值的标准偏差(SD)。图8B显示了用编码所示FP融合体(深灰色)的质粒单独转染或用FP融合质粒和pcDNA3-GS2-IpaH9.8C337A(白色)或pcDNA3-GS2-IpaH9.8(浅灰色)共转染的HEK293T细胞中荧光活性的流式细胞术定量。数据是针对单独表达相应FP的HEK283T细胞测得的MFI标准化的几何MFI的一式三份生物学重复。误差棒代表平均值的标准偏差(SD)。

图9A-9C示出了uAb平台的模块化。图9A显示了用编码EGFP的质粒DNA转染或用编码由与不同的所示GFP导向结合蛋白融合的IpaH9.8构成的uAb嵌合体的质粒共转染的HEK293T细胞中EGFP荧光活性的流式细胞术定量。图9B显示了HEK293T细胞中EGFP荧光活性的流式细胞术定量,所述HEK293T细胞瞬时或稳定表达所示EGFP、ERK2-EGFP、H2B-EGFP或EGFPHRasG12V。在所有情况下,均用编码pcDNA3-GS2-IpaH9.8C337A(白色)或pcDNA3-GS2-IpaH9.8(灰色)的质粒DNA瞬时转染细胞。图9C显示了稳定地整合有仅编码EGFP-HRasG12V、EGFP-HRasG12V和GS2-IpaH9.8、EGFPHRasG12V和GS2-IpaH9.8C337A或单独的GS2-IpaH9.8的DNA的MCF10a细胞中EGFP荧光活性的流式细胞术定量。所有数据是针对单独表达EGFP的HEK283T细胞测得的MFI标准化的几何MFI的一式三份生物学重复。误差棒代表平均值的标准偏差(SD)。

具体实施方式

应当理解,以下以各种详细程度描述本申请的某些方面、模式、实施例、变化和特征,以便提供对本技术的实质理解。下面提供了本说明书中使用的某些术语的定义。除非另有定义,否则本文中使用的所有技术和科学术语通常具有与本申请所属领域的普通技术人员通常所理解的相同的含义。

在实践本申请的主题时,使用了分子生物学、蛋白质生物化学、细胞生物学、免疫学、微生物学和重组DNA中的多种常规技术。这些技术是众所周知的并且例如分别解释于Current Protocols in Molecular Biology,Vols.I—III,Ausubel编辑(1997);Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版(冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),冷泉港,纽约(1989));DNA Cloning:A PracticalApproach,Vols.I and II,Glover编辑(1985);Oligonucleotide Synthesis,Gait编辑(1984);Nucleic Acid Hybridization,Hames&Higgins编辑(1985);Transcription andTranslation,Hames&Higgins编辑(1984);Animal Cell Culture,Freshney编辑(1986);Immobilized Cells and Enzymes(IRL Press,1986);Perbal,A Practical Guide toMolecular Cloning,the series,Meth.Enzymol.,(学术出版社有限公司(AcademicPress,Inc.),1984);Gene Transfer Vectors for Mammalian Cells,Miller&Calos编辑(冷泉港实验室,纽约(1987));和Meth.Enzymol,Vols.154and 155,Wu&Grossman,和Wu编辑中,其所有的全部内容均通过引用并入本文。检测和测量多肽基因表达产物水平,即基因翻译水平的方法是本领域众所周知的,并且包括使用多肽检测方法,例如抗体检测和定量技术。还参见Strachan&Read,Human Molecular Genetics,第2版(约翰威利父子公司(JohnWiley and Sons,Inc.),纽约(1999)),其全部内容特此通过引用并入本文。

本申请的第一方面涉及一种分离的嵌合分子。分离的嵌合分子包含降解结构域,该降解结构域包含E3泛素连接酶(E3)基序;能够特异性地将降解结构域引导至底物的靶向结构域,其中靶向结构域与降解结构域异源;以及将降解结构域与靶向结构域偶联的接头。

如本文所用,术语“嵌合分子”、“嵌合多肽”和“嵌合蛋白”涵盖具有如下序列的分子,该序列包括第一蛋白或多肽序列的全长序列的至少一部分和第二蛋白或多肽序列的全长序列的至少一部分,其中第一和第二蛋白或多肽是不同的蛋白或多肽。嵌合分子还涵盖蛋白质或多肽,该蛋白质或多肽包括两个或更多个衍生自相同蛋白或多肽的不连续部分。嵌合分子还涵盖具有至少一个取代的蛋白质或多肽,其中所述嵌合分子包括第一蛋白或多肽序列,其中第一蛋白或多肽序列的一部分已被第二蛋白或多肽序列的一部分替代。如本文所用,术语“嵌合分子”进一步指具有降解结构域和靶向区域的分子,如本文所例示的。降解结构域和靶向区域可以以本领域已知的方式连接。例如,它们可以经由本文所例示的接头分子连接、融合、共价连接、非共价连接等。此外,降解结构域和靶向区域可以不直接连接和/或连接可以是瞬时的,例如如果使用接头,则该接头可以是可裂解的或不可裂解的。

如本文所用,术语“泛素化”是指蛋白质泛素与其他分子的赖氨酸残基的连接。分子如肽或蛋白质的泛素化可以充当其快速细胞降解以及靶向蛋白酶体复合物的信号。

如本文所用,术语“ubiquibody”和“嵌合分子”可互换使用,并且是指至少具有通过接头区域连接的降解结构域和靶区域的分子,如本文所例示的。

如本文所用,术语“靶结构域”或“靶向结构域”或“靶向部分”是指与嵌合分子内的第二区域共价或非共价结合的多肽区域,与周围位置、细胞和/或组织相比,其增强了嵌合分子或组合物在靶亚细胞位置、细胞或相关组织中的浓度。

一致地,本申请的嵌合分子具有新的E3连接酶基序(在本文中称为例如“E3连接酶(EL)”)泛素区域,该泛素区域连接至可用于底物结合的靶向结构域。在一些实施例中,底物是细胞内底物。然而,为了促进多功能性,靶向结构域衍生自抗体类似物(例如,III型纤连蛋白结构域(“FN3”))、抗体、多克隆抗体、单克隆抗体、重组抗体、抗体片段、Fab'、F(ab')2、Fv、scFv、tascFvs、bis-scFvs、sdAb、V

技术人员将容易地理解,在一些实施例中,此类靶向结构域具有与本文所述的新型E3连接酶基序区一致的细胞/组织特异性。在一个实施例中,靶向结构域结合至非天然底物。

如本文所用,术语抗体类似物可包括非免疫球蛋白分子的任何结合部分,包括例如FN3和DARPins,或含有结合位点的多肽,其特异性结合底物或与底物反应等。根据本申请的抗体类似物包括使用III型纤连蛋白结构域(“FN3”)作为分子支架构建的合成结合蛋白。抗体类似物是抗体的简单和强大的替代物,用于创建靶结合蛋白。抗体类似物属于一类分子,统称为抗体模拟物(或抗体类似物)和替代支架,旨在克服天然抗体分子的缺点。抗体类似物相对于常规抗体的主要优点是抗体类似物可以容易地用作遗传编码的细胞内抑制剂,即抗体类似物可以通过用抗体类似物表达载体转染细胞来在所选细胞中表达。这归因于FN3支架的基本特征:小(约90个残基)、稳定、易于生产并且其缺乏二硫键,这使得不管细胞环境的氧化还原电位(包括细胞质和细胞核的还原环境)如何,都能够生产功能性抗体类似物。在一个实施例中,靶向结构域是抗体类似物。所述抗体类似物可以是选自由GS2、Nsa5和RasInII组成的群组的III型纤连蛋白结构域(FN3)抗体类似物。GS2抗体类似物可以例如识别绿色荧光蛋白(“GFP”)。NSa5抗体类似物可能例如对SHP2的Src同源序列2(SH2)结构域具有特异性(Sha等人,“Dissection of the BCR-ABL Signaling Network Using HighlySpecific Monobody Inhibitors to the SHP2 SH2 Domains,”Proc.Natl.Acad.Sci.USA110(37):14924-29(2013),其全部内容特此通过引用并入本文)和对HRas、KRas和G12V突变体中的每一个具有特异性的RasInII(Cetin等人,“Raslns:Genetically EncodedIntrabodies of Activated Ras Proteins,”J.Mol.Biol.429(4):562-573(2017),其全部内容特此通过引用并入本文)。

作为抗体类似物的靶向结构域可以是例如III型纤连蛋白结构域(FN3)抗体类似物。FN3抗体类似物的实例包括但不限于(括号中为靶抗原):GS2(GFP)、Nsa5(SHP2)、RasInI(HRas/KRas)和RasInII(HRas/KRas)、1D10(CDC34)、1D7(COPS5)、1C4(MAP2K5)、2C12(MAP2K5)、1E2(SF3A1)、1C2(USP11)、1A9(USP11)、Ubi4(泛素)、EI1.4.1(EGFR)、EI2.4.6(EGFR)、EI3.4.3(EGFR)、EI4.2.1(EGFR)、EI4.4.2(EGFR)、EI6.2.6(EGFR)、EI6.2.10(EGFR)、E246(EGFR)、C743(CEA)、IIIa8.2.6(FcγIIa)、IIIa6.2.6(FcγIIIa)、hA2.2.1(hA33)、hA2.2.2(hA33)、hA3.2.1(hA33)、hA3.2.3(hA33)、mA3.2.1(mA33)、mA3.2.2(mA33)、mA3.2.3(mA33)、mA3.2.4(mA33)、mA3.2.5(mA33)、Alb3.2.1(hAlb)、mI2.2.1(mIgG)、HA4(AblSH2)、HA10(AblSH2)、HA16(AblSH2)、HA18(AblSH2)、159(vEGFR)、MUC16(MSLN)、E2#3(ERα/EF)、E2#4(ERα/EF)、E2#5(ERα/EF)、E2#6(ERα/EF)、E2#7(ERα/EF)、E2#8(ERα/EF)、E2#9(ERα/EF)、E2#10(ERα/EF)、E2#11(ERα/EF)、E2#23(ERα/EF)、E3#2(ERα/EF)、E3#6(ERα/EF)、OHT#31(ERα/EF)、OHT#32(ERα/EF)、OHT#33(ERα/EF)、AB7-A1(ERα/EF)、AB7-B1(ERα/EF)、MBP-74(MBP)、MBP-76(MBP)、MBP-79(MBP)、hSUM04-33(hSUM04)、hSUMO-39(hSUM04)、ySUMO-53(ySUMO)、ySUMO-56(ySUMO)、ySUMO-57(ySUMO)、T14.25(TNFα)、T14.20(TNFα)、FNfn10-3JCL14(avβ3整联蛋白)、1C9(Src SH3)、1F11(Src SH3)、1F10(Src SH3)、2G10(SrcSH3)、2B2(Src SH3)、1E3(Src SH3)、E18(VEGFR2)、E19(VEGFR2)、E26(VEGFR2)、E29(VEGFR2)、FG4.2(溶菌酶)、FG4.1(溶菌酶)、2L4.1(溶菌酶)、BF4.1(溶菌酶)、BF4.9(溶菌酶)、BF4.4(溶菌酶)、BFs1c4.01(溶菌酶)、BFs1c4.07(溶菌酶)、BFs3_4.02(溶菌酶)、BFs3_4.06(溶菌酶)、BFs3_8.01(溶菌酶)、10C17C25(含磷IκBα)、Fn-N22(SARS N)、Fn-N17(SARSN)、FN-N10(SARS N)、gI2.5.3T88I(山羊IgG)、gI2.5.2(山羊IgG)、gI2.5.4(山羊IgG)、rI4.5.4(兔IgG)、rI4.3.1(兔IgG)、rI3.6.6(兔IgG)、rI4.3.4(兔IgG)、rI3.6.4(兔IgG)和rI4.3.3(兔IgG)。

如本文所用,术语抗体可包括免疫球蛋白和免疫球蛋白的任何抗原结合部分,例如IgG、IgD、IgA、IgM和IgE,或含有抗原结合位点的多肽,其与免疫原、抗原、底物等特异性或“免疫特异性结合”或“免疫相互作用”。抗体可包含通过至少一个二硫键相互连接的至少一条重(H)链和至少一条轻(L)链。术语“V

可用作本申请的靶向结构域的抗体相关分子、结构域、片段、部分等包括例如但不限于Fab、Fab'和F(ab')

如本文所用,术语“单克隆抗体”可以包括从基本上均质的抗体群体中获得的抗体,即,除了可能以少量存在的可能天然存在的突变以外,包含该群体的各个抗体是相同的。然而,根据本申请使用的单克隆抗体可以通过杂交瘤方法制备,该杂交瘤方法首先由Kohler等人,“Continuous Cultures of Fused Cells Secreting Antibody ofPredefined Specificity,”Nature 256:495(1975)(其全部内容特此通过引用并入本文)描述,或可以通过重组DNA方法制备。参见,例如,美国专利第4,816,567号,其全部内容特此通过引用并入本文。也可以使用Clackson等人,“Making Antibody Fragments UsingPhage Display Libraries,”Nature 352:624-28(1991)和Marks等人,“By-PassingImmunization.Human Antibodies From V-Gene Libraries Displayed on Phage,”J.Mol.Biol.222:581-97(1991)(例如,其全部内容特此通过引用并入本文)描述的技术从噬菌体抗体文库中分离“单克隆抗体”。

如本文所用,术语“多克隆抗体”包括例如衍生自至少两(2)种不同的产生抗体的细胞系的抗体制剂。该术语的使用包括至少两(2)种抗体的制剂,其含有与抗原的不同表位或区域特异性结合的抗体。

如本文所用,术语“单链抗体”或“单链Fv(scFv)”可以指Fv片段的两个结构域V

如本文所用,术语“可变的”可以例如是指在抗体之间可变结构域的某些区段的序列差异大的事实。V结构域介导抗原结合并定义特定抗体对其特定抗原的特异性。但是,变异性并非在可变结构域的氨基酸范围内均匀分布。相反,V区由相对不变的15-30个氨基酸的称为构架区(FR)的延伸组成,构架区被称为“高变区”的极端可变性的较短区域分开,高变区各自为9-12个氨基酸长。天然重链和轻链的可变结构域各自包含四个FR,其主要采取β-折叠构型,通过三个高变区连接,所述高变区形成环连接,并且在一些情况下形成β-折叠结构的一部分。每条链中的高变区通过FR紧密靠近地保持在一起,并且与来自另一条链的高变区一起促成抗体的抗原结合位点的形成。参见Kabat等人,Sequences of Proteins ofImmunological Interest,第5版,公共卫生署(Public Health Service),国立卫生研究院(National Institutes of Health),贝塞斯达,马里兰州(1991),其全部内容特此通过引用并入本文。恒定区不直接参与抗体与抗原的结合,但显示各种效应子功能,例如抗体参与抗体依赖性细胞毒效应(“ADCC”)。

本申请的靶向结构域可以是例如单特异性、双特异性、三特异性或具有更大的多特异性。多特异性靶向结构域可以对底物的不同表位具有特异性,或者可以对本申请的底物多肽以及异源组合物如异源多肽或固体支持物质具有特异性。参见例如WO 93/17715;WO92/08802;WO 91/00360;WO 92/05793;Tutt等人,“Trispecific F(ab')3DerivativesThat Use Cooperative Signaling Via the TCR/CD3 Complex and CD2 to Activateand Redirect Resting Cytotoxic T Cells,”J Immunol.147:60-69(1991);美国专利第5,573,920、4,474,893、5,601,819、4,714,681、4,925,648和6,106,835号;Kostelny等人,“Formation of a Bispecific Antibody by the Use of Leucine Zippers,”J.Immunol.148:1547-53(1992),其全部内容特此通过引用并入本文。本申请的靶向结构域可以来自任何动物来源,包括鸟类和哺乳动物。例如,靶向结构域可以来自人、海洋、兔、山羊、豚鼠、骆驼、马或鸡。

产生针对靶底物的靶向结构域的技术是本领域技术人员众所周知的。此类技术的实例包括但不限于,例如涉及展示文库、xeno或humab小鼠、杂交瘤等的那些。在本申请范围内的靶多肽(从其衍生靶向结构域)包括能够显示抗原性的任何多肽或多肽衍生物。实例包括但不限于底物及其片段。在一些实施例中,靶向结构域是单链抗体。

单链抗体(“scFv”)是基因工程抗体,其由通过柔性区域在氨基末端与轻链的可变结构域连接的重链的可变结构域组成。在一些实施例中,scFv通过PCR从表达具有已知靶特异性的单克隆抗体(mAb)的杂交瘤细胞系产生,或者它们通过噬菌体展示从分离自脾细胞或淋巴细胞的文库中选择,并保持亲本抗体的亲和力。采用鉴定细胞内底物的方案,酵母双杂交技术用于鉴定候选scFv-蛋白质相互作用。此类系统可用于预测scFv是否能够在体内识别其靶底物。参见

通常,可以针对适当的抗原选择克隆到展示载体中的scFv、杂合抗体或杂合抗体片段,以鉴定保持良好结合活性的变体,因为抗体或抗体片段将存在于噬菌体或噬菌粒颗粒的表面上。参见例如Barbas III等人,Phage Display,A Laboratory Manual(冷泉港实验室出版社,冷泉港,纽约2001),其全部内容特此通过引用并入本文。然而,其他载体形式也可用于该方法,例如将抗体片段文库克隆到裂解噬菌体载体(修饰的T7或λZAP系统)中用于选择和/或筛选。

通常,可用于重组DNA技术的表达载体常常是质粒的形式。然而,本申请旨在包括在技术上不是质粒的表达载体的此类其他形式,例如病毒载体,如复制缺陷型逆转录病毒、腺病毒和腺相关病毒,其提供等同的功能。此类病毒载体允许感染受试者并在该受试者中表达化合物。表达控制序列通常是能够转化或转染真核宿主细胞的载体中的真核启动子系统。一旦载体被整合到合适的宿主中,宿主就被维持在适于高水平表达编码靶结构域的核苷酸序列以及收集和纯化底物结合剂例如交叉反应性抗底物抗体的条件下。通常参见美国专利公开第2002/0199213号,其全部内容特此通过引用并入本文。载体也可编码信号肽,例如果胶酸裂解酶,可用于指导细胞外抗体片段的分泌。参见美国专利第5,576,195号,其全部内容特此通过引用并入本文。

如本文所用,术语“降解结构域”或“降解区”包括能够促进底物泛素化的嵌合分子的一部分。降解结构域可以具有用于与天然结合蛋白相互作用的第二“结合”区。结合区可以被修饰以具有一个或多个突变、取代、缺失,或者可以被完全缺失。

降解结构域可含有具有类似于真核生物E3的折叠的E3模拟物,例如HECT型、RING或U-box(RING/U-box)型和F-box结构域,以及具有不同于任何其他真核生物E3的折叠的非常规E3,例如NEL、含XL-box和SidC。降解结构域涉及能够通过将一个或多个泛素分子和/或泛素样分子连接至底物而修饰底物的多肽或多肽区。在这方面,此类区域与众所周知的泛素化级联(涉及El、E2和E3酶的协调作用)一致,其作用是激活泛素并伴随地将泛素缀合到底物上。在一些实施例中,基序是由新E3连接酶构成的泛素区或其片段,其以底物特异性方式催化泛素的转移。参见Qian等人.,“Engineering a Ubiquitin Ligase RevealsConformational Flexibility Required for Ubiquitin Transfer,”J.Biol.Chem.284(39):26797-802(2009),其全部内容特此通过引用并入本文。

如本文所用,术语多肽、蛋白质、区域、结构域等的“修饰”或“氨基酸修饰”是指天然序列的改变,例如所需残基的缺失、添加或取代。通过将适当的核苷酸改变引入抗体核酸或通过肽合成来制备此类修饰的多肽。只要获得的抗体具有所需的特性,就可以进行缺失、插入和取代的任何组合以获得目标抗体。修饰还包括蛋白质糖基化模式的改变。识别诱变优选位置的可用方法称为“丙氨酸扫描诱变”,如Cunningham和Wells,“High-ResolutionEpitope Mapping of hGH-Receptor Interactions by Alanine-ScanningMutagenesis,”Science 244:1081-85(1989)所述,其全部内容特此通过引用并入本文。然后针对所需的活性筛选突变的抗体。

术语“多肽”、“蛋白质”和“肽”在本文中可互换使用,是指其中氨基酸残基通过肽键或修饰的肽键连接的氨基酸链。氨基酸链可以具有大于两个氨基酸的任何长度。除非另有说明,否则术语“多肽”、“蛋白质”和“肽”也涵盖其各种修饰形式。此类修饰形式可以是天然存在的修饰形式或化学修饰形式。修饰形式的实例包括但不限于糖基化形式、磷酸化形式、肉豆蔻酰化形式、棕榈酰化形式、核糖基化形式、乙酰化形式、泛素化形式等。修饰还包括分子内交联和共价连接至各种部分,例如脂质、黄素、生物素、聚乙二醇或其衍生物等。此外,修饰还可以包括环化、支化和交联。进一步地,多肽还可以包括除基因编码的常规二十个氨基酸以外的氨基酸。在一个实施例中,E3泛素连接酶基序(E3),在本文中也称为EL或NEL,包含修饰的结合区,与没有修饰的结合区的所述E3基序相比,该结合区抑制或降低与所述底物的结合。在另一个实施例中,修饰是结合区中的突变或缺失。

如本文所用,术语“变体”或“突变体”用于指通过对天然存在的蛋白质或肽进行修饰但保留天然存在形式的基本蛋白质和侧链结构而与天然存在的蛋白质或肽(即“原型”或“野生型”蛋白质)不同的蛋白质或肽。此类变化包括但不限于:一个、几个或甚至若干个氨基酸侧链的变化;一个、几个或若干个氨基酸的变化,包括缺失,例如蛋白质或肽的截短形式、插入和/或取代;一个或几个原子的立体化学变化;和/或次要衍生化,包括但不限于:甲基化、糖基化、磷酸化、乙酰化、肉豆蔻酰化、异戊烯化、棕榈酰化、酰胺化和/或添加糖基磷脂酰肌醇。与天然存在的蛋白质或肽相比,“变体”或“突变体”可以具有增强、降低、改变或基本相似的特性。

在一些实施例中,嵌合分子的降解结构域缺乏内源底物识别区,即与自然或天然结合伴侣相互作用的多肽的部分。与没有修饰结合区的E3基序相比,降解结构域的E3基序可以具有修饰的结合结构域,其抑制或减少与底物的结合。然而,在一些实施例中,E3基序允许底物的蛋白水解。在一些实施例中,修饰是结合区的突变、取代或缺失。该取代可以是氨基酸取代,例如保守或非保守氨基酸取代。

E3基序的非保守氨基酸取代是如下取代,其中烷基氨基酸被序列中的烷基氨基酸以外的氨基酸取代,芳族氨基酸被E3基序中的芳族氨基以外的氨基酸取代,含硫氨基酸被E3基序中的含硫氨基酸以外的氨基酸取代,含羟基氨基酸被E3基序中的含羟基氨基酸以外的氨基酸取代,酸性氨基酸被E3基序中的酸性氨基酸以外的氨基酸取代,碱性氨基酸被E3基序中的碱性氨基酸以外的氨基酸取代,或者二元一元羧氨基酸被E3基序中的二元一元羧氨基酸以外的氨基酸取代。

在常见氨基酸中,例如,“非保守氨基酸取代”由将以下组之一的氨基酸替换为来自不同组的氨基酸说明,如下所示:(1)甘氨酸、丙氨酸、(2)缬氨酸、亮氨酸和异亮氨酸、(3)苯丙氨酸、酪氨酸和色氨酸、(4)半胱氨酸和蛋氨酸、(5)丝氨酸和苏氨酸、(6)天冬氨酸和谷氨酸、(7)谷氨酰胺和天冬酰胺以及(8)赖氨酸、精氨酸和组氨酸。

可以通过用适当的核苷酸代替编码此类区域的核苷酸来引入例如E3基序中的保守或非保守氨基酸变化。这些修饰可通过例如寡核苷酸定向诱变、接头扫描诱变、使用聚合酶链反应的诱变等来获得。Ausubel等人(编辑),Short Protocols in MolecularBiology,第5版,约翰威利父子公司(2002);通常参见,McPherson(编辑),DirectedMutagenesis:A Practical Approach,IRL Press(1991),其全部内容特此通过引用并入本文。鉴定序列变异位置的可用方法称为“丙氨酸扫描诱变”,由Cunningham和Wells“ProteinEngineering of Antibody Binding Sites:Recovery of Specific Activity in anAnti-Digoxin Single-Chain Fv Analogue Produced in Escherichia coli,”Science244:1081-85(1989)(其全部内容特此通过引用并入本文)描述。

泛素连接酶家族包括但不限于与以下的同源物:E6相关蛋白C末端(“HECT”)结构域连接酶,其涉及泛素从E2结合酶转移到底物,真正有趣的新基因(“RING”)结构域连接酶,其结合E2,可介导E2-E3复合物的酶促活性,以及U-box泛素连接酶家族(“UUL”),其构成了修饰的RING基序连接酶家族,而没有完整的Zn

U-box泛素连接酶(“ULL”)的特征在于具有蛋白质结构域U-box,其与RING指在结构上相关,这是许多其他泛素连接酶的典型特征。在人类中,编码UUL的基因包括但不限于UBE4A和UBE4B基因(也分别称为UFD2b和UFD2a)、CHIP(也称为STUB1)、UIP5(也称为UBOX5)、PRP19(也称为PRPF19或SNEV)、CYC4(也称为PPIL2或Cyp-60)、WDSUB1和ACT1(也称为TRAF3IP2)。参见Marin,I,“Ancient Origin of Animal U-box Ubiquitin Ligases.”BMCEvolutionary Biology 10:331,pp.1-15(2010),其全部内容特此通过引用并入本文。

尽管HECT E3连接酶在泛素化过程中具有直接的催化作用,但RING和U-box E3蛋白通过充当募集E2和底物分子以促进底物泛素化的接合体分子来促进蛋白质泛素化。尽管多种RING型E3连接酶如MDM2(鼠类双微体克隆2癌基因)和c-Cbl可能单独发挥作用,但发现其他一些则是更大的多蛋白复合物如后期促进复合物(“APC”)的组分。综上所述,这些多方面的特性和相互作用使E3酶能够为真核生物的所有细胞内的蛋白质清除提供强大和特定的机制。Ardley等人,“E3 Ubiquitin Ligases.”Essays Biochem.41:15-30(2005),其全部内容特此通过引用并入本文。

尽管如此,有关E3基因产物的功能信息是可变的。U-box蛋白CHIP既充当辅助伴侣蛋白以及伴侣蛋白,例如Hsc70、Hsp70和Hsp90,也充当泛素连接酶,单独或作为可能包括其他E3蛋白的复合物的部分。参见上文。然而,泛素蛋白酶体系统对特定底物的选择性取决于泛素缀合酶如E2和泛素蛋白连接酶之间的相互作用。在泛素化之前,常常需要对蛋白质底物进行翻译后修饰,如例如磷酸化或羟基化。这样,可以实现特定底物的精确时空靶向和降解。

本文公开的降解结构域的E3基序具有功能性E3连接酶,其能够泛素化底物而不产生来自天然结合伴侣的空间破坏。在一些实施例中,除E3基序外,降解结构域还具有连接酶,该连接酶是具有类似于真核生物E3的折叠的E3模拟物,例如HECT型、RING或U-box(RING/U-box)型和F-box结构域,和具有不同于任何其他真核生物E3的折叠的非常规E3,例如NEL、含XL-box和SidC。此类结构域可以具有细胞或组织特异性。

在一个实施例中,嵌合分子的E3基序可以具有细胞类型特异性或组织特异性连接酶功能,包括但不限于皮肤细胞、肌肉细胞、上皮细胞、内皮细胞、干细胞、脐带血管细胞、角膜细胞、心肌细胞、主动脉细胞、角膜上皮细胞、体细胞、成纤维细胞、角质形成细胞、黑素细胞、脂肪细胞、骨细胞、成骨细胞、气道细胞、微血管细胞、乳腺细胞、血管细胞、软骨细胞、胎盘细胞、肝细胞、神经胶质细胞、表皮细胞、角膜缘干细胞、牙周干细胞、骨髓基质细胞、杂交瘤细胞、肾细胞、胰岛、关节软骨细胞、成神经细胞、淋巴细胞和红细胞和/或其任何组合。

在一个实施例中,降解结构域来自细菌病原体,该病原体任选地选自志贺氏菌属(Shigella)、沙门氏菌属(Salmonella)、芽孢杆菌属(Bacillus)、巴尔通氏体属(Bartonella)、博代氏杆菌属(Bordetella)、疏螺旋体属(Borrelia)、布鲁氏菌属(Brucella)、弯曲杆菌属(Campylobacter)、衣原体属(Chlamydia)和嗜衣体属(Chlamydophila)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、肠球菌属(Enterococcus)、埃希氏菌属(Escherichia)、弗朗西斯氏菌属(Francisella)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、军团菌属(Legionella)、钩端螺旋体属(Leptospira)、李斯特菌属(Listeria)、分枝杆菌属(Mycobacterium)、支原体(Mycoplasma)、奈瑟菌属(Neisseria)、假单胞菌属(Pseudomonas)、立克次体(Rickettsia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、脲原体属(Ureaplasma)、弧菌属(Vibrio)和耶尔森菌属(Yersinia)。更特别地,在另一个实施例中,细菌病原体是弗氏志贺氏菌。可以源自任何细菌的降解结构域可以来自例如弗氏志贺氏菌E3连接酶、SspH1、SspH2、SlrP、AvrPtoB、LubX、NleG5-1、NleG2-3、LegU1、LegAU13、NIeL、SopA、SidC、XopL、GobX、VirF、GALA、AnkB和/或SidE。

在一个实施例中,降解结构域是志贺氏菌属IpaH蛋白家族的成员,并且可以是IpaH9.8、IpaH1.4、IpaH2.5、IpaH4.5、IpaH7.8、IpaH0887、IpaH1389、IpaH2022、IpaH2202、IpaH2610和/或IpaH0722。志贺氏菌物种是高度适应的人类病原体,其引起细菌性痢疾(志贺氏菌病)。志贺氏菌通过III型分泌系统(T3SS)递送负责发病机理的致毒蛋白(效应子)子集,其功能包括细胞焦亡、上皮细胞入侵、细胞内存活以及逃避宿主免疫应答。

志贺氏菌拥有12个ipaH基因,它们位于大质粒和染色体上。参见例如,Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model for StudyingPathogenic Bacteria,”Front.Cell.Infect.Microbiol.5:100(2016),其全部内容特此通过引用并入本文。IpaH家族蛋白含有N末端富亮氨酸重复序列(LRR),并且在其保守的C末端区域具有E3泛素连接酶活性(Rohde等人,“Type III Secretion Effectors of the IpaHFamily are E3 Ubiquitin Ligase,”Cell Host Microbe.1:77-83(2007)和Ashida等人,“Exploitation of the Host Ubiquitin System by Human Bacterial Pathogens,”Nat.Rev.Microbiol.12:399 413(2014),其两者的全部内容特此通过引用并入本文)。泛素化通过多酶级联催化的一系列反应完成:E1(泛素激活酶)、E2(泛素结合酶)和E3(泛素连接酶)。Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model forStudying Pathogenic Bacteria,”Front.Cell.Infect.Microbiol.5:100(2016),其全部内容特此通过引用并入本文。泛素化级联通过在泛素的羧基末端Gly和E1的Cys之间形成硫酯键而从ATP依赖性泛素活化开始。同上。活化的泛素被转移到E2的活性位点Cys,并且最后E3连接酶介导泛素从E2到特定底物蛋白的转移(主要通过底物Lys残基进行)。同上。E3连接酶可根据其结构和功能分为两组:HECT(与E6-AP羧基末端同源)型和RING(真正有趣的新基因)/U-box型。同上。HECT型E3连接酶通过与其催化半胱氨酸残基形成硫酯键接受来自E2的泛素来催化泛素转移,然后将泛素转移至其靶底物。同上。另一方面,RING/U-box型E3连接酶通过充当支架分子来结合和募集E2-泛素复合物,然后直接将泛素从E2转移到E3结合的底物上,来催化直接的泛素转移。同上。

在动物和植物病原体中广泛保有IpaH家族蛋白,包括志贺氏菌(IpaH)、沙门氏菌(SspH1、SspH2和SlrP)、爱德华氏菌属(Edwardsiella)、慢生根瘤菌属(Bradyrhizobium)、根瘤菌属(Rhizobium)和某些假单胞菌属物种,这说明了这些效应子在细菌感染中的重要性。同上。尽管IpaH家族蛋白具有E3泛素连接酶活性,并且其C末端结构域含有单一保守Cys,其形成类似于HECT型连接酶的Cys-泛素中间体,但IpaH家族成员的催化结构域在序列和结构水平上与真核生物E3泛素连接酶有所不同。同上。因此,现在认为IpaH家族蛋白构成了一类新的E3泛素连接酶NEL(新型E3连接酶),其不同于典型的RING和HECT类型的E3泛素连接酶(Singer等人,“Structure of the Shigella T3SS effector IpaH Defines a NewClass of E3 Ubiquitin Ligases,”Nat.Struct.Mol.Biol.15:1293-1301(2008);Zhu等人,“Structure of a Shigella Effector Reveals a New Class of UbiquitinLigases,”Nat.Struct.Mol.Biol.15:1302-08(2008);Quezada等人,“A Family ofSalmonella Virulence Factors Functions as a Distinct Class of AutoregulatedE3 Ubiquitin Ligases,”Proc.Natl.Acad.Sci.USA 106:4864-69(2009),其所有的全部内容均特此通过引用并入本文)。尽管IpaH家族蛋白彼此高度相似,但是其LRR区的序列(被视为底物识别位点)和亚细胞定位(例如,核、细胞质或质膜)是不同的。Ashida&Sasakawa,“Shigella IpaH Family Effectors as a Versatile Model for Studying PathogenicBacteria,”Front.Cell.Infect.Microbiol.5:100(2016),其全部内容特此通过引用并入本文。

泛素连接酶家族也包括如Skp1-Cullin1-F-box(“SCF”)蛋白复合物中的“F-box”连接酶,其与泛素化的底物如例如Cdc 4结合,随后与靶蛋白如例如Sic1或Grr1相互作用,然后结合Cln。参见Bai等人,“SKP1 Connects Cell Cycle Regulators to the UbiquitinProteolysis Machinery through a Novel Motif,the F-Box,”Cell 86(2):263-74(1997),其全部内容特此通过引用并入本文。

F-box是约50个氨基酸的蛋白质基序,其充当蛋白质-蛋白质相互作用的位点。参见例如Kipreos等人,“The F-box Protein family.”Genome Biol.1(5)(2000),其全部内容特此通过引用并入本文。F-box蛋白首先被表征为SCF泛素-连接酶复合物的组分,其中它们结合底物以进行泛素介导的蛋白水解。F-box基序通过结合核心SCF组分Skp I将F-box蛋白与SCF复合物的其他组分连接。最近发现F-box蛋白通过非SCF蛋白复合物在多种细胞功能中发挥作用。参见上文。F-box蛋白常常包括能够进行蛋白质-蛋白质相互作用的其他羧基末端基序;酵母和人F-box蛋白中最常见的次级基序是WD重复序列和富亮氨酸重复序列,发现这两者都将磷酸化的底物与SCF复合物结合。参见上文。大多数F-box蛋白具有其他相关的基序,并且大多数这些蛋白的功能尚未被定义。参见上文。

F-box基序内最少的变异位置包括位置8(用于共识的234个F-box蛋白中的92%具有亮氨酸或蛋氨酸)、9(92%脯氨酸)、16(86%异亮氨酸或缬氨酸)、20(81%亮氨酸或蛋氨酸)和32(92%丝氨酸或半胱氨酸)。同上。缺乏严格的共识,使得技术人员采用多种搜索算法来检测F-box序列。例如,可以在Prosite和Pfam数据库中找到两种算法。有时候,一个数据库将对给定蛋白质中的F-box给出有效得分,而另一个数据库却没有检测到它,因此应搜索两个数据库。同上。

本申请的嵌合分子在原核生物中的表达最通常在具有含有指导融合或非融合多肽表达的组成型或诱导型启动子的载体的大肠杆菌中进行。融合载体将多个氨基酸添加至其中编码的多肽,通常添加至重组多肽的氨基末端。此类融合载体通常服务于三个目的:(i)增加表达;(ii)增加溶解度;和(iii)通过在亲和纯化中充当配体来帮助纯化。通常,在融合表达载体中,在融合部分和重组多肽的连接处引入蛋白水解裂解位点,以使得在纯化融合多肽之后能够从融合部分分离重组多肽。此类酶及其内源识别序列包括因子Xa、凝血酶和肠激酶。典型的融合表达载体包括pGEX(Smith和Johnson,“Single-StepPurification of Polypeptides Expressed in Escherichia coli as Fusions WithGlutathione S-Transferase,”Gene 67:31-40(1988),其全部内容特此通过引用并入本文)、pMAL(New England Biolabs,Beverly,Mass.)和pRIT5(Pharmacia,皮斯卡塔韦,新泽西州),其将谷胱甘肽S-转移酶(“GST”)、麦芽糖E结合多肽或多肽A分别与靶重组多肽融合。

合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人,“TightlyRegulated tac Promoter Vectors Useful for the Expression of Unfused and FusedProteins in Escherichia coli,”Gene 69:301-15(1988))和pET 1Id(Studier等人,GeneExpression Technology:Methods In Enzymology 185,学术出版社(Academic Press),圣地亚哥,加利福尼亚州60-89(1990)),其全部内容特此通过引用并入本文。Pack等人,美国专利第6,294,353号;第6,692,935号(其全部内容特此通过引用并入本文)描述了通过多肽融合靶向组装不同的活性肽或蛋白质结构域以产生多功能多肽的方法。使重组多肽表达例如大肠杆菌中的本申请的嵌合分子最大化的一个策略是在宿主细菌中表达该多肽,其蛋白水解裂解重组嵌合体的能力受损。参见例如Gottesman,Gene Expression Technology:Methods In Enzymology 185,学术出版社,圣地亚哥,加利福尼亚州119-128(1990),其全部内容特此通过引用并入本文。

在一些实施例中,使用哺乳动物表达载体在哺乳动物细胞中表达编码本申请的嵌合分子的核酸,包括降解结构域和靶向区。哺乳动物表达载体的实例包括,例如但不限于,pcDNA3、pCDM8(参见“An LFA-3cDNA Encodes a Phospholipid-Linked Membrane ProteinHomologous to its Receptor CD2,”Nature 329:840(1987),其全部内容特此通过引用并入本文)和pMT2PC。当用于哺乳动物细胞时,表达载体的控制功能通常由病毒调节元件提供。例如,常用的启动子衍生自多瘤、腺病毒2、巨细胞病毒和猿猴病毒40。对于用于原核和真核细胞两者的其他合适的表达系统,其可用于嵌合分子的靶向结构域、降解结构域的表达。参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual的第16和17章,第2版,冷泉港实验室,冷泉港实验室出版社,冷泉港,纽约,(1989),其全部内容特此通过引用并入本文。

尽管嵌合分子E3降解结构域和靶向结构域表达,但此类结构域/区域的功能赋予了本申请的特异性。已知或未知的底物与靶向结构域结合,以通过降解结构域进行后续泛素化。在一些实施例中,底物包括但不限于细胞内底物、细胞外底物、修饰的底物、糖基化的底物、法尼基化的底物、翻译后修饰的底物、磷酸化的底物和本领域已知的其他修饰。

在一些实施例中,底物包括但不限于荧光蛋白、组蛋白、核定位信号(NLS)、H-Ras蛋白、含Src同源2结构域磷酸酶2(SHP2)、β-半乳糖苷酶、gpD、Hsp70、MBP、CDC34、COPS5、MAP2K5、SF3A1、USP11、泛素、EGFR、CEA、FcγIIa、FcγIIIa、hA33、mA33、hAlb、mIgG、AblSH2、vEGFR、MSLN、ERα/EF、hSUMO4、ySUMO、TNFα、avβ3整联蛋白、Src SH3、溶菌酶、含磷IκBα、SARSN、山羊IgG、兔IgG、翻译后修饰的蛋白、原纤蛋白、亨廷顿蛋白、致瘤蛋白、p53、Rb、粘附蛋白、受体、细胞周期蛋白、检查点蛋白、HFE、ATP7B、朊病毒蛋白、病毒蛋白、细菌蛋白、寄生蛋白、真菌蛋白、DNA结合蛋白、代谢蛋白、调节蛋白、结构蛋白、酶、免疫原性蛋白、自身免疫原性蛋白、免疫原、抗原、病原性蛋白等。在一个实施例中,底物是荧光蛋白,例如绿色荧光蛋白、翠绿荧光蛋白、金星荧光蛋白、天蓝色荧光蛋白和增强的蓝绿色荧光蛋白。

如本文所用,术语“氨基酸”包括天然存在的氨基酸、L-氨基酸、D-氨基酸和合成氨基酸,以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸,以及后来被修饰的那些氨基酸,例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构的化合物,例如与氢、羧基、氨基和R基团结合的α-碳,例如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。此类类似物具有修饰的R基团,例如正亮氨酸或修饰的肽主链,但是保留了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构但以与天然存在的氨基酸相似的方式起作用的化合物。氨基酸在本文中可以用它们众所周知的三个字母符号或IUPAC-IUB生物化学命名委员会推荐的一个字母符号来指代。

可用作根据本申请的降解结构域的示例性E3连接酶包括来自丁香假单胞菌(Pseudomonas syringae)的E3泛素连接酶AvrPtoB,其是U-box基序,具有SEQ ID NO:1的氨基酸序列:

MAGINRAGPSGAYFVGHTDPEPVSGQAHGSGSGASSSNSPQVQPRPSNTPPSNAPAPPPTGRERLSRSTALSRQTREWLEQGMPTAEDASVRRRPQVTADAATPRAEARRTPEATADASAPRRGAVAHANSIVQQLVSEGADISHTRNMLRNAMNGDAVAFSRVEQNIFRQHFPNMPMHGISRDSELAIELRGALRRAVHQQAASAPVRSPTPTPASPAASSSGSSQRSLFGRFARLMAPNQGRSSNTAASQTPVDRSPPRVNQRPIRVDRAAMRNRGNDEADAALRGLVQQGVNLEHLRTALERHVMQRLPIPLDIGSALQNVGINPSIDLGESLVQHPLLNLNVALNRMLGLRPSAERAPRPAVPVAPATASRRPDGTRATRLRVMPEREDYENNVAYGVRLLNLNPGVGVRQAVAAFVTDRAERPAVVANIRAALDPIASQFSQLRTISKADAESEELGFKDAADHHTDDVTHCLFGGELSLSNPDQQVIGLAGNPTDTSQPYSQEGNKDLAFMDMKKLAQFLAGKPEHPMTRETLNAENIAKYAFRIVP

来自丁香假单胞菌的E3泛素连接酶AvrPtoB具有如下所示的SEQ ID NO:2的核苷酸序列:

ATGGCGGGTATCAATAGAGCGGGACCATCGGGCGCTTATTTTGTTGGCCACACAGACCCCGAGCCAGTATCGGGGCAAGCACACGGATCCGGCAGCGGCGCCAGCTCCTCGAACAGTCCGCAGGTTCAGCCGCGACCCTCGAATACTCCCCCGTCGAACGCGCCCGCACCGCCGCCAACCGGACGTGAGAGGCTTTCACGATCCACGGCGCTGTCGCGCCAAACCAGGGAGTGGCTGGAGCAGGGTATGCCTACAGCGGAGGATGCCAGCGTGCGTCGTAGGCCACAGGTGACTGCCGATGCCGCAACGCCGCGTGCAGAGGCAAGACGCACGCCGGAGGCAACTGCCGATGCCAGCGCACCGCGTAGAGGGGCGGTTGCACACGCCAACAGTATCGTTCAGCAATTGGTCAGTGAGGGCGCTGATATTTCGCATACTCGTAACATGCTCCGCAATGCAATGAATGGCGACGCAGTCGCTTTTTCTCGAGTAGAACAGAACATATTTCGCCAGCATTTCCCGAACATGCCCATGCATGGAATCAGCCGAGATTCGGAACTCGCTATCGAGCTCCGTGGGGCGCTTCGTCGAGCGGTTCACCAACAGGCGGCGTCAGCGCCAGTGAGGTCGCCCACGCCAACACCGGCCAGCCCTGCGGCATCATCATCGGGCAGCAGTCAGCGTTCTTTATTTGGACGGTTTGCCCGTTTGATGGCGCCAAACCAGGGACGGTCGTCGAACACTGCCGCCTCTCAGACGCCGGTCGACAGGAGCCCGCCACGCGTCAACCAAAGACCCATACGCGTCGACAGGGCTGCGATGCGTAATCGTGGCAATGACGAGGCGGACGCCGCGCTGCGGGGGTTAGTACAACAGGGGGTCAATTTAGAGCACCTGCGCACGGCCCTTGAAAGACATGTAATGCAGCGCCTCCCTATCCCCCTCGATATAGGCAGCGCGTTGCAGAATGTGGGAATTAACCCAAGTATCGACTTGGGGGAAAGCCTTGTGCAACATCCCCTGCTGAATTTGAATGTAGCGTTGAATCGCATGCTGGGGCTGCGTCCCAGCGCTGAAAGAGCGCCTCGTCCAGCCGTCCCCGTGGCTCCCGCGACCGCCTCCAGGCGACCGGATGGTACGCGTGCAACACGATTGCGGGTGATGCCGGAGCGGGAGGATTACGAAAATAATGTGGCTTATGGAGTGCGCTTGCTTAACCTGAACCCGGGGGTGGGGGTAAGGCAGGCTGTTGCGGCCTTTGTAACCGACCGGGCTGAGCGGCCAGCAGTGGTGGCTAATATCCGGGCAGCCCTGGACCCTATCGCGTCACAATTCAGTCAGCTGCGCACAATTTCGAAGGCCGATGCTGAATCTGAAGAGCTGGGTTTTAAGGATGCGGCAGATCATCACACGGATGACGTGACGCACTGTCTTTTTGGCGGAGAATTGTCGCTGAGTAATCCGGATCAGCAGGTGATCGGTTTGGCGGGTAATCCGACGGACACGTCGCAGCCTTACAGCCAAGAGGGAAATAAGGACCTGGCGTTCATGGATATGAAAAAACTTGCCCAATTCCTCGCAGGCAAGCCTGAGCATCCGATGACCAGAGAAACGCTTAACGCCGAAAATATCGCCAAGTATGCTTTTAGAATAGTCCCC

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH0722,其是新型E3连接酶(本文也称为NEL或EL),具有SEQ ID NO:3的氨基酸序列:

MKPAHNPSFFRSFCGLGCISRLSVEEQNITDYHRIWDNWAKEGAATEDRTQAVRLLKICLAFQEPALNLSLLRLRSLPYLPPHIQELNISSNELRSLPELPPSLTVLKASDNRLSRLPALPPHLVALDVSLNRVLTCLPSLPSSLQSLSALLNSLETLPDLPPALQKLSVGNNQLTALPELPCELQELSAFDNRLQELPPLPQNLRLLNVGENQLHRLPELPQRLQSLYIPNNQLNTLPDSIMNLHIYADVNIYNNPLSTRTLQALQRLTSSPDYHGPRIYFSMSDGQQNTLHRPLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFTDWFSLWGPWHAVLKRTEADRWALAEEQKYEMLENEYPQRVADRLKASGLSGDADAEREAGAQVMRETEQQIYRQLTDEVLALRLPENGSQLHHS

来自弗氏志贺氏菌的E3泛素连接酶IpaH0722,其是新型E3连接酶,具有如下所示的SEQ ID NO:4的核苷酸序列:

ATGAAACCTGCCCACAATCCTTCTTTTTTCCGCTCCTTTTGTGGTTTAGGATGTATATCCCGTTTATCCGTAGAAGAGCAAAATATCACGGATTATCACCGCATCTGGGATAACTGGGCCAAGGAAGGTGCTGCAACAGAAGACCGAACACAGGCAGTTCGATTACTGAAAATATGTCTGGCTTTTCAAGAGCCAGCCCTCAATTTAAGTTTACTCAGATTACGCTCTCTCCCATACCTGCCCCCGCACATACAAGAACTTAACATCTCTAGCAATGAGCTACGCTCTCTGCCAGAACTCCCTCCGTCCTTAACTGTACTTAAAGCCAGCGATAACAGACTGAGCAGGCTCCCGGCTCTTCCGCCTCACCTGGTCGCTCTTGATGTTTCACTTAACAGAGTTTTAACATGTTTGCCTTCTCTTCCATCTTCCTTGCAGTCACTCTCAGCCCTTCTCAATAGCCTGGAGACGCTACCTGATCTTCCCCCGGCTCTACAAAAACTTTCTGTTGGCAACAACCAGCTTACTGCCTTACCAGAATTACCATGTGAACTACAGGAACTAAGTGCTTTTGATAACAGATTACAAGAGCTACCGCCCCTTCCTCAAAATCTGAGGCTTTTAAACGTTGGGGAAAACCAACTACACAGACTGCCCGAACTTCCACAACGTCTGCAATCACTATATATCCCTAACAATCAGCTGAACACATTGCCAGACAGTATCATGAATCTGCACATTTATGCAGATGTTAATATTTATAACAATCCATTGTCGACTCGCACTCTGCAAGCCCTGCAAAGATTAACCTCTTCGCCGGACTACCACGGCCCACGGATTTACTTCTCCATGAGTGACGGACAACAGAATACACTCCATCGCCCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCATGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGACATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCTACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCCATGGTCAGAAGCCGTGAAGAGAATGAATTTACGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCTGGCAGAAGAGCAGAAATATGAGATGCTGGAGAATGAGTACCCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATGCGGATGCGGAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGCTGACTGACGAGGTACTGGCCCTGCGATTGCCTGAAAACGGCTCACAACTGCACCATTCATAA

可用作根据本申请的降解结构域的另一示例性E3连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH1.4,其是新型E3连接酶,具有如下所示的SEQ ID NO:5的氨基酸序列:

MIKSTNIQAIGSGIMHQINNIYSLTPFPLPMELTPSCNEFYLKAWSEWEKNGTPGEQRNIAFNRLKICLQNQEAELNLSELDLKTLPDLPPQITTLEIRKNLLTHLPDLPPMLKVIHAQFNQLESLPALPETLEELNAGDNKIKELPFLPENLTHLRVHNNRLHILPLLPPELKLLVVSGNRLDSIPPFPDKLEGLAMANNFIEQLPELPFSMNRAVLMNNNLTTLPESVLRLAQNAFVNVAGNPLSGHTMRTLQQITTGPDYSGPRIFFSMGNSATISAPEHSLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFKDWFSLWGPWHAVLKRTEADRWAQAEEQKYEMLENEYSQRVADRLKASGLSGDTDAEREAGAQVMRETEQQIYRQLTDEVLALRLSENGSNHIA

来自弗氏志贺氏菌的E3泛素连接酶IpaH1.4,其是新型E3连接酶,具有如下所示的SEQ ID NO:6的核苷酸序列:

ATGATTAAATCAACCAATATACAGGCAATCGGTTCTGGTATTATGCATCAAATAAACAATATATACTCGTTAACTCCATTTCCTTTACCTATGGAACTGACTCCATCTTGTAATGAATTTTATTTAAAAGCCTGGAGTGAATGGGAAAAGAACGGTACCCCAGGCGAGCAACGCAATATCGCCTTCAATAGGCTGAAAATATGTTTACAAAATCAAGAGGCAGAATTAAATTTATCTGAGTTAGATTTAAAAACATTACCAGATTTACCGCCTCAGATAACAACACTGGAAATAAGAAAAAACCTATTAACACATCTCCCTGATTTACCACCAATGCTTAAGGTAATACATGCTCAATTTAATCAACTGGAAAGCTTACCTGCCTTACCCGAGACGTTAGAAGAGCTTAATGCGGGTGATAACAAGATAAAAGAATTACCATTTCTTCCTGAAAATCTAACTCATTTACGGGTTCATAATAACCGATTGCATATTCTGCCACTATTGCCACCGGAACTAAAATTACTGGTAGTTTCTGGAAACAGATTAGACAGCATTCCCCCCTTTCCAGATAAGCTTGAAGGGCTGGCTATGGCTAATAATTTTATAGAACAACTACCGGAATTACCTTTTAGTATGAACAGGGCTGTGCTAATGAATAATAATCTGACAACACTTCCGGAAAGTGTCCTGAGATTAGCTCAGAATGCCTTCGTAAATGTTGCAGGTAATCCACTGTCTGGCCATACCATGCGTACACTACAACAAATAACCACCGGACCAGATTATTCTGGTCCTCGAATATTTTTCTCTATGGGAAATTCTGCCACAATTTCCGCTCCAGAACACTCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCACGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGACATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCCACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCCATGGTCAGAAGCCGTGAAGAGAATGAATTTAAGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCAGGCAGAAGAGCAGAAGTATGAGATGCTGGAGAATGAGTACTCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATACGGATGCGGAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGTTGACTGACGAGGTACTGGCCCTGCGATTGTCTGAAAACGGCTCAAATCATATCGCATAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH2.5,其是新型E3连接酶,具有SEQ ID NO:7的氨基酸序列:

MLIRILVIMIKSTNIQAIGSGIMHQINNVYSLTPLSLPMELTPSCNEFYLKTWSEWEKNGTPGEQRNIAFNRLKICLQNQEAELNLSELDLKTLPDLPPQITTLEIRKNLLTHLPDLPPMLKVIHAQFNQLESLPALPETLEELNAGDNKIKELPFLPENLTHLRVHNNRLHILPLLPPELKLLVVSGNRLDSIPPFPDKLEGLALANNFIEQLPELPFSMNRAVLMNNNLTTLPESVLRLAQNAFVNVAGNPLSGHTMRTLQQITTGPDYSGPRIFFSMGNSATISAPEHSLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFTDWFSLWGPWHAVLKRTEADRWAQAEEQKYEMLENEYSQRVADRLKASGLSGDADAEREAGAQVMRETEQQIYRQLTDEVLA

来自弗氏志贺氏菌的E3泛素连接酶IpaH2.5,其是新型E3连接酶,具有如下所示的SEQ ID NO:8的核苷酸序列:

ATGTTGATAAGAATTCTAGTTATAATGATTAAATCAACCAATATACAGGCAATCGGTTCTGGCATTATGCATCAAATAAACAATGTATACTCGTTAACTCCATTATCTTTACCTATGGAACTGACTCCATCTTGTAATGAATTTTATTTAAAAACCTGGAGCGAATGGGAAAAGAACGGTACCCCAGGCGAGCAACGCAATATCGCCTTCAATAGGCTGAAAATATGTTTACAAAATCAAGAGGCAGAATTAAATTTATCTGAGTTAGATTTAAAAACATTACCAGATTTACCGCCTCAGATAACAACACTGGAAATAAGAAAAAACCTATTAACACATCTCCCTGATTTACCACCAATGCTTAAGGTAATACATGCTCAATTTAATCAACTGGAAAGCTTACCTGCCTTACCCGAGACGTTAGAAGAGCTTAATGCGGGTGATAACAAGATAAAAGAATTACCATTTCTTCCTGAAAATCTAACTCATTTACGGGTTCATAATAACCGATTGCATATTCTGCCACTATTGCCACCGGAACTAAAATTACTGGTAGTTTCTGGAAACAGATTAGACAGCATTCCCCCCTTTCCAGATAAGCTTGAAGGGCTGGCTCTGGCTAATAATTTTATAGAACAACTACCGGAATTACCTTTTAGTATGAACAGGGCTGTGCTAATGAATAATAATCTGACAACACTTCCGGAAAGTGTCCTGAGATTAGCTCAGAATGCCTTCGTAAATGTTGCAGGTAATCCATTGTCTGGCCATACCATGCGTACACTACAACAAATAACCACCGGACCAGATTATTCTGGTCCTCGAATATTTTTCTCTATGGGAAATTCTGCCACAATTTCCGCTCCAGAACACTCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCATGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGATATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCTACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCCATGGTCAGAAGCCGTGAAGAGAATGAATTTACGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCAGGCAGAAGAGCAGAAGTATGAGATGCTGGAGAATGAGTACTCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATGCGGATGCGGAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGTTGACTGACGAGGTACTGGCCTGA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH4.5,其是新型E3连接酶,并且具有SEQ ID NO:9的氨基酸序列:

MKPINNHSFFRSLCGLSCISRLSVEEQCTRDYHRIWDDWAREGTTTENRIQAVRLLKICLDTREPVLNLSLLKLRSLPPLPLHIRELNISNNELISLPENSPLLTELHVNGNNLNILPTLPSQLIKLNISFNRNLSCLPSLPPYLQSLSARFNSLETLPELPSTLTILRIEGNRLTVLPELPHRLQELFVSGNRLQELPEFPQSLKYLKVGENQLRRLSRLPQELLALDVSNNLLTSLPENIITLPICTNVNISGNPLSTRVLQSLQRLTSSPDYHGPQIYFSMSDGQQNTLHRPLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFTDWFSLWGPWHAVLKRTEADRWAQAEEQKYEMLENEYSQRVADRLKASGLSGDADAQREAGAQVMRETEQQIYRQLTDEVLA

来自弗氏志贺氏菌的E3泛素连接酶IpaH4.5,其是新型E3连接酶,具有如下所示的SEQ ID NO:10的核苷酸序列:

ATGAAACCGATCAACAATCATTCTTTTTTTCGTTCCCTTTGTGGCTTATCATGTATATCTCGTTTATCGGTAGAAGAACAGTGTACCAGAGATTACCACCGCATCTGGGATGACTGGGCTAGGGAAGGAACAACAACAGAAAATCGCATCCAGGCGGTTCGATTATTGAAAATATGTCTGGATACCCGGGAGCCTGTTCTCAATTTAAGCTTACTGAAACTACGTTCTTTACCACCACTCCCTTTGCATATACGTGAACTTAATATTTCCAACAATGAGTTAATCTCCCTACCTGAAAATTCTCCGCTTTTGACAGAACTTCATGTAAATGGTAACAACTTGAATATACTCCCGACACTTCCATCTCAACTGATTAAGCTTAATATTTCATTCAATCGAAATTTGTCATGTCTGCCATCATTACCACCATATTTACAATCACTCTCGGCACGTTTTAATAGTCTGGAGACGTTACCAGAGCTTCCATCAACGCTAACAATATTACGTATTGAAGGTAATCGCCTTACTGTCTTGCCTGAATTGCCTCATAGACTACAAGAACTCTTTGTTTCCGGCAACAGACTACAGGAACTACCAGAATTTCCTCAGAGCTTAAAATATTTGAAGGTAGGTGAAAATCAACTACGCAGATTATCCAGATTACCGCAAGAACTATTGGCTCTGGATGTTTCCAATAACCTACTAACTTCATTACCCGAAAATATAATCACATTGCCCATTTGTACGAATGTTAACATTTCAGGGAATCCATTGTCGACTCGCGTTCTGCAATCCCTGCAAAGATTAACCTCTTCGCCGGACTACCACGGCCCGCAGATTTACTTCTCCATGAGTGACGGACAACAGAATACACTCCATCGCCCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCATGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGACATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCCACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCTATGGTCAGAAGCCGTGAAGAGAATGAATTTACGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCAGGCAGAAGAGCAGAAGTATGAGATGCTGGAGAATGAGTACTCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATGCGGATGCGCAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGCTGACTGACGAGGTACTGGCCTGA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH7.8,其是新型E3连接酶,并且具有SEQ ID NO:11的氨基酸序列:

MFSVNNTHSSVSCSPSINSNSTSNEHYLRILTEWEKNSSPGEERGIAFNRLSQCFQNQEAVLNLSDLNLTSLPELPKHISALIVENNKLTSLPKLPAFLKELNADNNRLSVIPELPESLTTLSVRSNQLENLPVLPNHLTSLFVENNRLYNLPALPEKLKFLHVYYNRLTTLPDLPDKLEILCAQRNNLVTFPQFSDRNNIRQKEYYFHFNQITTLPESFSQLDSSYRINISGNPLSTRVLQSLQRLTSSPDYHGPQIYFSMSDGQQNTLHRPLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFTDWFSLWGPWHAVLKRTEADRWAQAEEQKYEMLENEYSQRVADRLKASGLSGDADAEREAGAQVMRETEQQIYRQLTDEVLALRLSENGSRLHHS

来自弗氏志贺氏菌的E3泛素连接酶IpaH7.8,其是新型E3连接酶,具有如下所示的SEQ ID NO:12的核苷酸序列:

ATGTTCTCTGTAAATAATACACACTCATCAGTTTCTTGCTCCCCCTCTATTAACTCAAACTCAACCAGTAATGAACATTATCTGAGAATCCTGACTGAATGGGAAAAGAACTCTTCTCCCGGGGAAGAGCGAGGCATTGCTTTTAACAGACTCTCCCAGTGCTTTCAGAATCAAGAAGCAGTATTAAATTTATCAGACCTAAATTTGACGTCTCTTCCCGAATTACCAAAGCATATTTCTGCTTTGATTGTAGAAAATAATAAATTAACATCATTGCCAAAGCTGCCTGCATTTCTTAAAGAACTTAATGCTGATAATAACAGGCTTTCTGTGATACCAGAACTTCCTGAGTCATTAACAACTTTAAGTGTTCGTTCTAATCAACTGGAAAACCTTCCTGTTTTGCCAAACCATTTAACATCATTATTTGTTGAAAATAACAGGCTATATAACTTACCGGCTCTTCCCGAAAAATTGAAATTTTTACATGTTTATTATAACAGGCTGACAACATTACCCGACTTACCGGATAAACTGGAAATTCTCTGTGCTCAGCGCAATAATCTGGTTACTTTTCCTCAATTTTCTGATAGAAACAATATCAGACAAAAGGAATATTATTTTCATTTTAATCAGATAACCACTCTTCCGGAGAGTTTTTCACAATTAGATTCAAGTTACAGGATTAATATTTCAGGGAATCCATTGTCGACTCGCGTTCTGCAATCCCTGCAAAGATTAACCTCTTCGCCGGACTACCACGGCCCACAGATTTACTTCTCCATGAGTGACGGACAACAGAATACACTCCATCGCCCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCATGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGACATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCTACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCCATGGTCAGAAGCCGTGAAGAGAATGAATTTACGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCAGGCAGAAGAGCAGAAGTATGAGATGCTGGAGAATGAGTACTCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATGCGGATGCGGAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGTTGACTGACGAGGTACTGGCCCTGCGATTGTCTGAAAACGGCTCACGACTGCACCATTCATAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自弗氏志贺氏菌的E3泛素连接酶IpaH9.8,其是新型E3连接酶,并且具有SEQ ID NO:13的氨基酸序列:

MLPINNNFSLPQNSFYNTISGTYADYFSAWDKWEKQALPGEERDEAVSRLKECLINNSDELRLDRLNLSSLPDNLPAQITLLNVSYNQLTNLPELPVTLKKLYSASNKLSELPVLPPALESLQVQHNELENLPALPDSLLTMNISYNEIVSLPSLPQALKNLRATRNFLTELPAFSEGNNPVVREYFFDRNQISHIPESILNLRNECSIHISDNPLSSHALQALQRLTSSPDYHGPRIYFSMSDGQQNTLHRPLADAVTAWFPENKQSDVSQIWHAFEHEEHANTFSAFLDRLSDTVSARNTSGFREQVAAWLEKLSASAELRQQSFAVAADATESCEDRVALTWNNLRKTLLVHQASEGLFDNDTGALLSLGREMFRLEILEDIARDKVRTLHFVDEIEVYLAFQTMLAEKLQLSTAVKEMRFYGVSGVTANDLRTAEAMVRSREENEFTDWFSLWGPWHAVLKRTEADRWAQAEEQKYEMLENEYPQRVADRLKASGLSGDADAEREAGAQVMRETEQQIYRQLTDEVLALRLSENGSQLHHS

来自弗氏志贺氏菌的E3泛素连接酶IpaH9.8,其是新型E3连接酶,具有如下所示的SEQ ID NO:14的核苷酸序列:

ATGTTACCGATAAATAATAACTTTTCATTGCCCCAAAATTCTTTTTATAACACTATTTCCGGTACATATGCTGATTACTTTTCAGCATGGGATAAATGGGAAAAACAAGCGCTCCCCGGTGAAGAGCGTGATGAGGCTGTCTCCCGACTTAAAGAATGTCTTATCAATAATTCCGATGAACTTCGACTGGACCGTTTAAATCTGTCCTCGCTACCTGACAACTTACCAGCTCAGATAACGCTGCTCAATGTATCATATAATCAATTAACTAACCTACCTGAACTGCCTGTTACGCTAAAAAAATTATATTCCGCCAGCAATAAATTATCAGAATTGCCCGTGCTACCTCCTGCGCTGGAGTCACTTCAGGTACAACACAATGAGCTGGAAAACCTGCCAGCTTTACCCGATTCGTTATTGACTATGAATATCAGCTATAACGAAATAGTCTCCTTACCATCGCTCCCACAGGCTCTTAAAAATCTCAGAGCGACCCGTAATTTCCTCACTGAGCTACCAGCATTTTCTGAGGGAAATAATCCCGTTGTCAGAGAGTATTTTTTTGATAGAAATCAGATAAGTCATATCCCGGAAAGCATTCTTAATCTGAGGAATGAATGTTCAATACATATTAGTGATAACCCATTATCATCCCATGCTCTGCAAGCCCTGCAAAGATTAACCTCTTCGCCGGACTACCACGGCCCACGGATTTACTTCTCCATGAGTGACGGACAACAGAATACACTCCATCGCCCCCTGGCTGATGCCGTGACAGCATGGTTCCCGGAAAACAAACAATCTGATGTATCACAGATATGGCATGCTTTTGAACATGAAGAGCATGCCAACACCTTTTCCGCGTTCCTTGACCGCCTTTCCGATACCGTCTCTGCACGCAATACCTCCGGATTCCGTGAACAGGTCGCTGCATGGCTGGAAAAACTCAGTGCCTCTGCGGAGCTTCGACAGCAGTCTTTCGCTGTTGCTGCTGATGCCACTGAGAGCTGTGAGGACCGTGTCGCGCTCACATGGAACAATCTCCGGAAAACCCTCCTGGTCCATCAGGCATCAGAAGGCCTTTTCGATAATGATACCGGCGCTCTGCTCTCCCTGGGCAGGGAAATGTTCCGCCTCGAAATTCTGGAGGATATTGCCCGGGATAAAGTCAGAACTCTCCATTTTGTGGATGAGATAGAAGTCTACCTGGCCTTCCAGACCATGCTCGCAGAGAAACTTCAGCTCTCCACTGCCGTGAAGGAAATGCGTTTCTATGGCGTGTCGGGAGTGACAGCAAATGACCTCCGCACTGCCGAAGCCATGGTCAGAAGCCGTGAAGAGAATGAATTTACGGACTGGTTCTCCCTCTGGGGACCATGGCATGCTGTACTGAAGCGTACGGAAGCTGACCGCTGGGCGCAGGCAGAAGAGCAGAAATATGAGATGCTGGAGAATGAGTACCCTCAGAGGGTGGCTGACCGGCTGAAAGCATCAGGTCTGAGCGGTGATGCGGATGCGGAGAGGGAAGCCGGTGCACAGGTGATGCGTGAGACTGAACAGCAGATTTACCGTCAGCTGACTGACGAGGTACTGGCCCTGCGATTGTCTGAAAACGGCTCACAACTGCACCATTCATAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自嗜肺军团菌(Legionella pneumophila)的E3泛素连接酶LegAU13,其是F-box基序,并且具有SEQ IDNO:15的氨基酸序列:

MKKNFFSDLPEETIVNTLSFLKANTLARIAQTCQFFNRLANDKHLELHQLRQQHIKRELWGNLMVAARSNNLEEVKKILKKGIDPTQTNSYHLNRTPLLAAIEGKAYQTANYLWRKYTFDPNFKDNYGDSPISLLKKQLANPAFKDKEKKQIRALIRGMQEEKIAQSKCLVC

来自嗜肺军团菌的E3泛素连接酶LegAU13,其是F-box基序,具有如下所示的SEQID NO:16的核苷酸序列:

ATGAAAAAGAATTTTTTTTCTGATCTTCCTGAGGAAACAATTGTCAATACATTGAGTTTCTTAAAAGCAAACACACTAGCTCGTATAGCTCAGACATGTCAATTTTTTAATCGCTTGGCTAATGATAAACATCTGGAGCTGCATCAACTAAGACAACAGCATATAAAGCGAGAGCTATGGGGAAATCTTATGGTGGCGGCAAGAAGCAATAACCTGGAAGAGGTCAAAAAGATTCTAAAAAAAGGAATCGATCCAACCCAGACCAATAGCTACCACTTAAATAGAACGCCTTTACTTGCAGCTATCGAAGGAAAAGCATATCAAACTGCAAATTACCTCTGGAGAAAATACACTTTCGATCCCAATTTTAAAGATAACTATGGTGATTCACCTATCTCTCTTCTTAAAAAGCAACTGGCAAATCCAGCCTTCAAGGATAAGGAAAAAAAACAAATACGCGCCTTAATTAGGGGAATGCAAGAAGAAAAAATAGCACAGAGCAAGTGCCTTGTTTGTTAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自嗜肺军团菌的E3泛素连接酶LegU1,其是F-box基序,并且具有SEQ ID NO:17的氨基酸序列:

MKAKYDPTKPGLQKLPPEIKVMILEFLDAKSKLALSQTNYGWRDLILDRPEYTKEITNTLFRLDKKRHRQAIAQMMSGRVTASSMAKLFEELLCFSIPSSYVFLIFFASQKSVALIEVLTVILVFAAITSLAHDLVDYFIESDTKAEKQHAHRRAFQFFAQPSQSAAQQNLEEENLSADPKACQCEPL

来自嗜肺军团菌的E3泛素连接酶LegU1,其是F-box基序,具有如下所示的SEQ IDNO:18的核苷酸序列:

ATGAAAGCAAAATACGACCCCACAAAGCCTGGACTCCAAAAGTTACCTCCTGAAATCAAGGTAATGATTCTTGAGTTTCTTGATGCCAAATCAAAACTAGCTCTTTCACAGACAAATTATGGTTGGCGTGATTTAATTCTAGACCGGCCAGAATATACCAAAGAAATAACGAATACATTATTTCGTCTTGATAAAAAACGCCATCGTCAAGCAATAGCACAAATGATGTCAGGAAGAGTTACAGCAAGTTCTATGGCTAAGCTATTTGAAGAATTACTATGTTTTAGCATACCTTCGTCCTATGTGTTTTTAATCTTTTTCGCATCGCAAAAATCTGTGGCGCTTATAGAAGTCTTAACCGTAATCCTTGTGTTTGCTGCAATAACCTCTCTCGCCCATGATCTGGTGGATTATTTTATTGAAAGTGATACAAAAGCTGAGAAACAGCATGCACATCGCCGTGCTTTTCAATTCTTTGCCCAACCCAGTCAAAGCGCTGCACAACAAAACTTGGAGGAAGAGAATTTAAGTGCTGATCCCAAGGCCTGCCAATGTGAGCCATTGTAG

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自嗜肺军团菌的E3泛素连接酶LubX,其是U-box基序,并且具有SEQ ID NO:19的氨基酸序列:

MATRNPFDIDHKSKYLREAALEANLSHPETTPTMLTCPIDSGFLKDPVITPEGFVYNKSSILKWLETKKEDPQSRKPLTAKDLQPFPELLIIVNRFVETQTNYEKLKNRLVQNARVAARQKEYTEIPDIFLCPISKTLIKTPVITAQGKVYDQEALSNFLIATGNKDETGKKLSIDDVVVFDELYQQIKVYNFYRKREVQKNQIQPSVSNGFGFFSLNFLTSWLWGTEEKKEKTSSDMTY

来自嗜肺军团菌的E3泛素连接酶LubX,其是U-box基序,具有如下所示的SEQ IDNO:20的核苷酸序列:

ATGGCGACGCGAAATCCTTTTGATATTGATCATAAAAGTAAATACTTAAGAGAAGCAGCATTAGAAGCCAATTTATCTCATCCAGAAACAACACCAACAATGCTGACTTGCCCTATTGACAGCGGATTTCTAAAAGATCCCGTGATCACACCTGAAGGTTTTGTTTATAATAAATCCTCTATTTTAAAATGGTTAGAAACGAAAAAAGAAGACCCACAAAGCCGTAAACCCTTAACGGCTAAAGATTTGCAACCATTCCCCGAGTTATTGATTATAGTCAATAGATTTGTTGAGACACAAACGAACTATGAAAAATTAAAAAACAGATTAGTGCAAAATGCTCGGGTTGCTGCACGCCAAAAAGAATACACTGAAATTCCGGATATATTTCTTTGCCCAATAAGTAAAACGCTTATCAAAACACCTGTCATTACTGCCCAAGGGAAAGTATATGATCAAGAAGCATTAAGTAACTTTCTTATCGCAACGGGTAATAAAGATGAAACAGGCAAAAAATTATCCATTGATGATGTAGTGGTGTTTGATGAACTCTATCAACAGATAAAAGTTTATAATTTTTACCGCAAACGCGAAGTGCAAAAAAATCAAATTCAACCTTCAGTAAGTAATGGTTTTGGCTTTTTTAGCTTGAATTTTCTCACCTCATGGTTATGGGGAACTGAGGAGAAAAAAGAAAAGACATCATCTGATATGACGTACTAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自肠出血性大肠杆菌(EHEC)O157:H7的E3泛素连接酶NleG2-3,其是U-box基序,并且具有SEQ ID NO:21的氨基酸序列:

MPLTSDIRSHSFNLGVEVVRARIVANGRGDITVGGETVSIVYDSTNGRFSSSGGNGGLLSELLLLGFNSGPRALGERMLSMLSDSGEAQSQESIQNKISQCKFSVCPERLQCPLEAIQCPITLEQPEKGIFVKNSDGSDVCTLFDAAAFSRLVGEGLPHPLTREPITASIIVKHEECIYDDTRGNFIIKGN

来自肠出血性大肠杆菌(“EHEC”)O157:H7的E3泛素连接酶NleG2-3,其是U-box基序,具有如下所示的SEQ ID NO:22的核苷酸序列:

ATGCCATTAACCTCAGATATTAGATCACATTCATTTAATCTTGGGGTGGAGGTTGTTCGTGCCCGAATTGTAGCCAATGGGCGCGGAGATATTACAGTCGGTGGTGAAACTGTCAGTATTGTGTATGATTCTACTAATGGGCGCTTTTCATCCAGTGGCGGTAATGGCGGATTGCTTTCTGAGTTATTGCTTTTGGGATTTAATAGTGGTCCTCGAGCCCTTGGTGAGAGAATGCTAAGTATGCTTTCGGACTCAGGTGAAGCACAATCGCAAGAGAGTATTCAGAACAAAATATCTCAATGTAAGTTTTCTGTTTGTCCAGAGAGACTTCAGTGCCCGCTTGAGGCTATTCAGTGTCCAATTACACTGGAGCAGCCTGAAAAAGGTATTTTTGTGAAGAATTCAGATGGTTCAGATGTATGTACTTTATTTGATGCCGCTGCATTTTCTCGTTTGGTTGGTGAAGGCTTACCCCACCCACTGACCCGGGAACCAATAACGGCATCAATAATTGTAAAACATGAAGAATGCATTTATGACGATACCAGAGGAAACTTCATTATAAAGGGTAATTGA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自肠出血性大肠杆菌(“EHEC”)O157:H7的E3泛素连接酶NleG5-1,其是U-box基序,并且具有SEQ ID NO:23的氨基酸序列:

MPVDLTPYILPGVSFLSDIPQETLSEIRNQTIRGEAQIRLGELMVSIRPMQVNGYFMGSLNQDGLSNDNIQIGLQYIEHIERTLNHGSLTSREVTVLREIEMLENMDLLSNYQLEELLDKIEVCAFNVEHAQLQVPESLRTCPVTLCEPEDGVFMRNSMNSNVCMLYDKMALIHLVKTRAAHPLSRESIAVSMIVGRDNCAFDPDRGNFVLKN

来自肠出血性大肠杆菌(“EHEC”)O157:H7的E3泛素连接酶NleG5-1,其是U-box基序,具有如下所示的SEQ ID NO:24的核苷酸序列:

ATGCCTGTAGATTTAACGCCTTATATTTTACCTGGGGTTAGTTTTTTGTCTGACATTCCTCAAGAAACCTTGTCTGAGATACGTAATCAGACTATTCGTGGAGAAGCTCAAATAAGACTGGGTGAGTTGATGGTGTCAATACGACCTATGCAGGTAAATGGATATTTTATGGGAAGTCTTAACCAGGATGGTTTATCGAATGATAATATCCAGATTGGCCTTCAATATATAGAACATATTGAACGTACACTTAATCATGGTAGTTTGACAAGCCGTGAAGTTACAGTACTGCGTGAAATTGAGATGCTCGAAAATATGGATTTGCTTTCTAACTACCAGTTAGAGGAGTTGTTAGATAAAATTGAAGTATGTGCATTTAATGTGGAGCATGCACAATTGCAAGTGCCAGAGAGCTTACGAACATGCCCTGTTACATTATGTGAACCAGAAGATGGGGTATTTATGAGGAATTCAATGAATTCAAATGTTTGTATGTTGTATGATAAAATGGCATTAATACATCTTGTTAAAACAAGGGCGGCTCATCCTTTGAGCAGGGAATCAATCGCAGTTTCAATGATTGTAGGAAGAGATAATTGTGCTTTTGACCCTGACAGAGGTAACTTCGTTTTAAAAAATTAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自肠出血性大肠杆菌(“EHEC”)O157:H7的E3泛素连接酶NleL,其是HECT基序,并且具有SEQ ID NO:25的氨基酸序列:

MLPTTNISVNSGVISFESPVDSPSNEDVEVALEKWCAEGEFSENRHEVASKILDVISTNGETLSISEPITTLPDLLPGSLKELVLNGCTELKSINCLPPNLSSLSMVGCSSLEVINCSIPENVINLSLCHCSSLKHIEGSFPEALRNSVYLNGCNSLNESQCQFLAYDVSQGRACLSKAELTADLIWLSANRTGEESAEELNYSGCDLSGLSLVGLNLSSVNFSGAVLDDTDLRMSDLSQAVLENCSFKNSILNECNFCYANLSNCIIRALFENSNFSNSNLKNASFKGSSYIQYPPILNEADLTGAIIIPGMVLSGAILGDVKELFSEKSNTINLGGCYIDLSDIQENILSVLDNYTKSNKSILLTMNTSDDKYNHDKVRAAEELIKKISLDELAAFRPYVKMSLADSFSIHPYLNNANIQQWLEPICDDFFDTIMSWFNNSIMMYMENGSLLQAGMYFERHPGAMVSYNSSFIQIVMNGSRRDGMQERFRELYEVYLKNEKVYPVTQQSDFGLCDGSGKPDWDDDSDLAYNWVLLSSQDDGMAMMCSLSHMVDMLSPNTSTNWMSFFLYKDGEVQNTFGYSLSNLFSESFPIFSIPYHKAFSQNFVSGILDILISDNELKERFIEALNSNKSDYKMIADDQQRKLACVWNPFLDGWELNAQHVDMIMGSHVLKDMPLRKQAEILFCLGGVFCKYSSSDMFGTEYDSPEILRRYANGLIEQAYKTDPQVFGSVYYYNDILDRLQGRNNVFTCTAVLTDMLTEHAKESFPEIFSLYYPVAWR

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自肠出血性大肠杆菌(“EHEC”)O157:H7的E3泛素连接酶NleL,其是HECT基序,并且具有SEQ ID NO:26的核苷酸序列:

ATGCTGCCCACTACAAATATCTCTGTAAATTCTGGAGTAATATCTTTTGAAAGTCCTGTAGATTCACCATCTAACGAGGATGTTGAAGTTGCCCTCGAAAAGTGGTGTGCTGAGGGAGAATTTAGCGAAAATCGTCATGAGGTTGCATCAAAAATACTTGATGTTATAAGTACTAATGGAGAGACTTTATCAATCAGTGAGCCAATAACAACATTACCAGACTTGCTTCCAGGTTCTCTGAAAGAACTGGTTTTGAATGGATGTACAGAGCTTAAATCAATAAACTGCTTACCCCCCAACTTATCTTCATTAAGTATGGTTGGATGCTCATCATTAGAGGTTATAAATTGCAGCATACCTGAAAATGTCATTAATTTATCTTTATGCCATTGTAGTTCTTTGAAACATATAGAAGGTTCCTTTCCTGAGGCACTCAGAAATTCCGTATATTTAAATGGCTGTAATTCATTAAATGAATCGCAATGTCAATTCCTTGCATATGATGTCAGTCAAGGCCGTGCCTGCCTGAGCAAAGCTGAGCTTACTGCTGACTTAATTTGGTTGTCAGCTAACCGAACGGGTGAAGAGTCTGCTGAAGAATTGAATTACTCTGGATGTGACTTGTCAGGTCTAAGTCTTGTAGGGCTGAATTTATCATCAGTAAATTTTTCTGGAGCAGTGCTTGATGATACAGATCTCAGGATGAGTGATTTGTCTCAGGCTGTATTGGAAAACTGTTCTTTTAAAAACTCGATTTTGAATGAATGTAATTTTTGTTATGCTAATTTATCTAATTGTATTATTAGGGCTTTGTTTGAAAACTCTAATTTCAGCAATTCCAATCTTAAAAATGCATCATTTAAAGGATCTTCATATATACAATATCCTCCAATTTTGAACGAGGCTGATTTAACAGGAGCTATTATAATTCCTGGAATGGTTTTAAGTGGTGCTATCTTAGGTGATGTAAAGGAGCTCTTTAGTGAAAAAAGTAATACCATTAATCTAGGAGGGTGTTACATAGATCTATCTGACATACAGGAAAATATATTATCTGTGTTGGATAACTATACAAAATCAAATAAATCAATTTTATTGACTATGAATACATCTGATGATAAGTATAACCATGATAAAGTAAGGGCCGCTGAAGAACTTATCAAAAAAATATCTCTTGACGAATTAGCGGCGTTCCGGCCCTATGTTAAGATGTCTTTGGCTGATTCATTTAGTATTCATCCTTATTTGAACAACGCAAATATACAGCAATGGCTCGAGCCTATATGTGATGACTTTTTTGATACTATAATGTCTTGGTTTAATAATTCAATAATGATGTATATGGAGAATGGTAGTTTATTGCAGGCAGGGATGTATTTTGAGCGACATCCAGGTGCGATGGTATCTTATAATAGTTCCTTTATACAAATTGTAATGAATGGTTCACGGCGTGATGGAATGCAGGAACGATTTAGGGAACTCTATGAAGTATATTTAAAAAATGAAAAAGTTTATCCTGTCACACAGCAGAGTGATTTTGGATTGTGCGATGGCTCTGGGAAGCCTGACTGGGATGATGATTCCGATTTGGCTTATAACTGGGTTTTGTTATCATCACAGGATGATGGTATGGCAATGATGTGTTCTTTGAGTCATATGGTTGATATGTTATCTCCTAATACATCAACTAATTGGATGTCCTTTTTTTTATATAAGGATGGAGAAGTTCAAAATACATTTGGGTATTCATTGAGCAATCTTTTTTCTGAATCATTTCCAATTTTCAGTATTCCTTATCATAAAGCTTTTTCCCAGAATTTCGTTTCTGGTATTCTGGATATACTCATTTCTGATAATGAACTCAAAGAGAGATTTATTGAGGCACTTAATTCCAATAAATCAGATTATAAAATGATTGCTGATGATCAGCAAAGGAAACTTGCCTGTGTCTGGAATCCCTTTCTTGATGGTTGGGAACTGAACGCTCAGCATGTAGATATGATTATGGGGAGCCATGTATTGAAAGATATGCCACTAAGAAAACAGGCTGAAATATTATTTTGTTTAGGGGGGGTTTTCTGTAAATACTCATCGAGTGATATGTTTGGTACAGAGTATGATTCTCCTGAGATTCTACGGAGATATGCAAATGGATTGATTGAACAAGCTTATAAAACAGATCCTCAGGTATTTGGCTCAGTTTATTATTACAATGATATTTTAGACAGGCTACAAGGAAGAAATAATGTTTTTACTTGTACCGCTGTGCTGACTGATATGCTAACGGAGCATGCAAAAGAATCTTTTCCTGAAATATTTTCATTGTATTATCCTGTTGCGTGGCGTTGA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自嗜肺军团菌的E3泛素连接酶SidC,其是非常规基序,并且具有SEQ ID NO:27的氨基酸序列:

MVINMVDVIKFKEPERCDYLYVDENNKVHILLPIVGGDEIGLDNTCQTAVELITFFYGSAHSGVTKYSAEHQLSEYKRQLEEDIKAINSQKKISPHAYDDLLKEKIERLQQIEKYIELIQVLKKQYDEQNDIRQLRTGGIPQLPSGVKEIIKSSENAFAVRLSPYDNDKFTRFDDPLFNVKRNISKYDTPSRQAPIPIYEGLGYRLRSTLFPEDKTPTPINKKSLRDKVKSTVLSHYKDEDRIDGEKKDEKLNELITNLQNELVKELVKSDPQYSKLSLSKDPRGKEINYDYLVNSLMLVDNDSEIGDWIDTILDATVDSTVWVAQASSPFYDGAKEISSDRDADKISIRVQYLLAEANIYCKTNKLSDANFGEFFDKEPHATEIAKRVKEGFTQGADIEPIIYDYINSNHAELGLKSPLTGKQQQEITDKFTKHYNTIKESPHFDEFFVADPDKKGNIFSHQGRISCHFLDFFTRQTKGKHPLGDLASHQEALQEGTSNRLHHKNEVVAQGYEKLDQFKKEVVKLLAENKPKELLDYLVATSPTGVPNYSMLSKETQNYIAYNRNWPAIQKELEKATSIPESQKQDLSRLLSRDNLQHDNLSAITWSKYSSKPLLDVELNKIAEGLELTAKIYNEKRGREWWFKGSRNEARKTQCEELQRVSKEINTLLQSESLTKSQVLEKVLNSIETLDKIDRDISAESNWFQSTLQKEVRLFRDQLKDICQLDKYAFKSTKLDEIISLEMEEQFQKIQDPAVQQIVRDLPSHCHNDEAIEFFKTLNPEEAAKVASYLSLEYREINKSTDKKTLLEQDIPRLFKEVNTQLLSKLKEEKAIDEQVHEKLSQLADKIAPEHFTRNNIIKWSTNPEKLEESNLNEPIKSVQSPTTKQTSKQFREAMGEITGRNEPPTDTLYTGIIKK

来自嗜肺军团菌的E3泛素连接酶SidC,其是非常规基序,具有如下所示的SEQ IDNO:28的核苷酸序列:

ATGGTGATAAACATGGTTGACGTAATCAAATTCAAAGAGCCGGAACGTTGTGATTATCTATATGTTGATGAAAACAACAAAGTTCATATCCTTTTACCGATTGTAGGAGGAGATGAAATAGGCCTGGATAATACCTGTCAAACAGCAGTTGAGTTGATCACATTTTTCTATGGTAGTGCGCACAGTGGTGTGACTAAATATTCTGCTGAACACCAACTCAGTGAATACAAAAGGCAATTGGAAGAAGACATCAAAGCCATCAATAGTCAAAAGAAAATTTCACCTCATGCTTATGACGATTTATTAAAAGAGAAAATAGAACGCTTACAGCAAATTGAAAAATACATTGAATTAATTCAAGTACTAAAAAAACAATATGATGAACAAAATGATATCAGGCAACTTCGTACTGGAGGGATTCCGCAATTACCCTCTGGGGTAAAGGAAATCATTAAATCCTCTGAAAATGCTTTCGCTGTGAGACTTTCTCCATATGACAACGATAAATTCACTCGCTTTGATGACCCTTTATTCAATGTCAAAAGAAACATCTCAAAATATGACACGCCCTCAAGACAAGCTCCTATTCCAATATACGAGGGATTAGGTTATCGCCTGCGTTCAACACTGTTCCCGGAAGATAAAACACCAACTCCAATTAATAAAAAATCACTTAGGGATAAAGTTAAAAGCACTGTTCTTAGTCATTATAAAGATGAAGATAGAATTGATGGAGAAAAAAAAGATGAAAAATTAAACGAACTAATTACTAATCTTCAAAACGAACTTGTAAAAGAGTTAGTAAAAAGTGATCCTCAATATTCGAAACTATCTTTATCTAAAGATCCAAGAGGAAAAGAAATAAATTACGATTATTTAGTAAATAGTTTGATGCTTGTAGATAACGACTCTGAAATTGGTGATTGGATTGATACTATTCTCGACGCTACAGTAGATTCCACTGTCTGGGTAGCTCAGGCATCCAGCCCTTTCTATGATGGTGCTAAAGAAATATCATCAGACCGCGATGCGGACAAGATATCCATCAGAGTTCAGTACCTGTTGGCCGAAGCCAATATTTACTGTAAAACAAACAAATTATCGGATGCTAACTTTGGAGAATTTTTCGACAAAGAGCCTCATGCTACTGAAATTGCGAAAAGAGTAAAGGAAGGATTTACGCAAGGTGCAGATATAGAACCAATTATATACGACTATATTAACAGCAACCATGCCGAGCTGGGATTAAAATCTCCGTTAACCGGCAAACAACAACAAGAAATCACTGATAAATTTACAAAACATTATAATACGATTAAAGAATCTCCACATTTTGATGAGTTTTTTGTCGCTGATCCGGATAAAAAAGGCAATATCTTTTCTCATCAAGGCAGAATCAGTTGTCATTTTCTGGATTTCTTTACTCGACAAACCAAAGGCAAACATCCTCTTGGTGATCTTGCAAGTCATCAGGAAGCTCTCCAGGAAGGAACCTCCAATCGCTTACATCACAAGAATGAGGTAGTAGCCCAGGGGTACGAAAAACTGGATCAATTCAAGAAAGAGGTTGTCAAACTGCTGGCTGAGAATAAACCAAAAGAATTATTGGATTATTTGGTTGCTACCTCACCTACAGGTGTTCCAAATTACTCCATGCTTTCGAAGGAAACTCAAAATTACATTGCTTATAATCGTAACTGGCCAGCCATTCAAAAAGAGCTGGAAAAGGCTACCAGCATCCCGGAGAGTCAAAAACAAGATCTTTCAAGATTGCTTTCTCGTGATAATTTACAACACGATAATCTAAGCGCAATTACCTGGTCAAAATATTCCTCCAAGCCATTATTGGATGTGGAATTAAATAAAATCGCTGAAGGATTAGAACTCACTGCAAAAATTTACAATGAAAAGAGAGGACGCGAATGGTGGTTTAAAGGTTCAAGAAATGAAGCTCGTAAGACCCAATGTGAAGAATTGCAAAGAGTATCCAAAGAAATCAATACTCTTCTGCAAAGTGAATCTTTAACGAAAAGCCAGGTACTTGAAAAGGTTTTAAATTCTATAGAAACATTAGATAAAATTGACAGAGACATTTCTGCCGAATCCAATTGGTTTCAAAGTACTCTGCAAAAGGAAGTCAGGTTATTTCGAGATCAATTGAAAGATATTTGCCAATTGGACAAGTATGCCTTTAAATCAACAAAACTTGATGAAATCATCTCTCTGGAAATGGAAGAACAATTTCAAAAGATACAAGATCCTGCTGTTCAACAAATTGTCAGGGACTTGCCTTCTCATTGCCACAATGATGAAGCAATTGAATTCTTTAAGACATTGAACCCTGAAGAGGCAGCAAAAGTAGCTAGCTATTTAAGCCTGGAATACAGGGAAATTAATAAATCAACCGATAAGAAAACTCTCCTAGAACAAGATATTCCCAGACTGTTTAAAGAAGTCAATACGCAGTTACTCTCCAAACTCAAAGAAGAAAAAGCTATTGATGAGCAAGTTCATGAAAAACTCAGTCAACTGGCTGACAAAATTGCCCCTGAGCATTTTACAAGAAATAACATTATAAAATGGTCTACCAACCCTGAAAAGCTTGAGGAATCAAATCTTAATGAGCCAATCAAATCAGTCCAAAGCCCTACTACTAAACAAACATCAAAACAATTCAGGGAAGCGATGGGTGAAATCACTGGAAGAAATGAGCCTCCTACAGACACTTTGTACACGGGAATTATAAAGAAATAG

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自EHECO157:H7的E3泛素连接酶SlrP,其是NEL基序,并且具有SEQ ID NO:29的氨基酸序列:

MFNITNIQSTARHQSISNEASTEVPLKEEIWNKISAFFSSEHQVEAQNCIAYLCHPPETASPEEIKSKFECLRMLAFPAYADNIQYSRGGADQYCILSENSQEILSIVFNTEGYTVEGGGKSVTYTRVTESEQASSASGSKDAVNYELIWSEWVKEAPAKEAANREEPVQRMRDCLKNNKTELRLKILGLTTIPAYIPEQITTLILDNNELKSLPENLQGNIKTLYANSNQLTSIPATLPDTIQEMELSINRITELPERLPSALQSLDLFHNKISCLPENLPEELRYLSVYDNSIRTLPAHLPSEITHLNVQSNSLTALPETLPPGLKTLEAGENALTSLPASLPPELQVLDVSKNQITVLPETLPPTITTLDVSRNALTNLPENLPAALQIMQASRNNLVRLPESLPHFRGEGPQPTRIIVEYNPFSERTIQNMQRLMSSVDYQGPRVLVAMGDFSIVRVTRPLHQAVQGWLTSLEEEDVNQWRAFEAEANAAAFSGFLDYLGDTQNTRHPDFKEQVSAWLMRLAEDSALRETVFIIAMNATISCEDRVTLAYHQMQEATLVHDAERGAFDSHLAELIMAGREIFRLEQIESLAREKVKRLFFIDEVEVFLGFQNQLRESLSLTTMTRDMRFYNVSGITESDLDEAEIRIKMAENRDFHKWFALWGPWHKVLERIAPEEWREMMAKRDECIETDEYQSRVNAELEDLRIADDSDAERTTEVQMDAERAIGIKIMEEINQTLFTEIMENILLKKEVSSLMSAYWR

来自EHEC O157:H7的E3泛素连接酶SlrP,其是NEL基序,具有如下所示的SEQ IDNO:30的核苷酸序列:

ATGTTTAATATTACTAATATACAATCTACGGCAAGGCATCAAAGTATTAGCAATGAGGCCTCAACAGAGGTGCCTTTAAAAGAAGAGATATGGAATAAAATAAGTGCCTTTTTCTCTTCAGAACATCAGGTTGAAGCACAAAACTGCATCGCTTATCTTTGTCATCCACCTGAAACCGCCTCGCCAGAAGAGATCAAAAGCAAGTTTGAATGTTTAAGGATGTTAGCTTTCCCGGCGTATGCGGATAATATTCAGTATAGTAGAGGAGGGGCAGACCAATACTGTATTTTGAGTGAAAATAGTCAGGAAATTCTGTCTATAGTTTTTAATACAGAGGGCTATACCGTTGAGGGAGGGGGAAAGTCAGTCACCTATACCCGTGTGACAGAAAGCGAGCAGGCGAGTAGCGCTTCCGGCTCCAAAGATGCTGTGAATTATGAGTTAATCTGGTCTGAGTGGGTAAAAGAGGCGCCAGCGAAAGAGGCAGCAAATCGTGAAGAACCCGTACAACGGATGCGTGACTGCCTGAAAAATAATAAGACGGAACTTCGTCTGAAAATATTAGGACTTACCACTATACCTGCCTATATTCCTGAGCAGATAACTACTCTGATACTCGATAACAATGAACTGAAAAGTTTGCCGGAAAATTTACAGGGAAATATAAAGACCCTGTATGCCAACAGTAATCAGCTAACCAGTATCCCTGCCACGTTACCGGATACCATACAGGAAATGGAGCTGAGCATTAACCGTATTACTGAATTGCCGGAACGTTTGCCTTCAGCGCTTCAATCGCTGGATCTTTTCCATAATAAAATTAGTTGCTTACCTGAAAATCTACCTGAGGAACTTCGGTACCTGAGCGTTTATGATAACAGCATAAGGACACTGCCAGCACATCTTCCGTCAGAGATTACCCATTTGAATGTGCAGAGTAATTCGTTAACCGCTTTGCCTGAAACATTGCCGCCGGGCCTGAAGACTCTGGAGGCCGGCGAAAATGCCTTAACCAGTCTGCCCGCATCGTTACCACCAGAATTACAGGTCCTGGATGTAAGTAAAAATCAGATTACGGTTCTGCCTGAAACACTTCCTCCCACGATAACAACGCTGGATGTTTCCCGTAACGCATTGACTAATCTACCGGAAAACCTCCCGGCGGCATTACAAATAATGCAGGCCTCTCGCAATAACCTGGTCCGTCTCCCGGAGTCGTTACCCCATTTTCGTGGTGAAGGACCTCAACCTACAAGAATAATCGTAGAATATAATCCTTTTTCAGAACGAACAATACAGAATATGCAGCGGCTAATGTCCTCTGTAGATTATCAGGGACCCCGGGTATTGGTTGCCATGGGCGACTTTTCAATTGTTCGGGTAACTCGACCACTGCATCAAGCTGTCCAGGGGTGGCTAACCAGTCTCGAGGAGGAAGACGTCAACCAATGGCGGGCGTTTGAGGCAGAGGCAAACGCGGCGGCTTTCAGCGGATTCCTGGACTATCTTGGTGATACGCAGAATACCCGACACCCGGATTTTAAGGAACAAGTCTCCGCCTGGCTAATGCGCCTGGCTGAAGATAGCGCACTAAGAGAAACCGTATTTATTATAGCGATGAATGCAACGATAAGCTGTGAAGATCGGGTCACACTGGCATACCACCAAATGCAGGAAGCGACGTTGGTTCATGATGCTGAAAGAGGCGCCTTTGATAGCCACTTAGCGGAACTGATTATGGCGGGGCGTGAAATCTTTCGGCTGGAGCAAATAGAATCGCTCGCCAGAGAAAAGGTAAAACGGCTGTTTTTTATTGACGAAGTCGAAGTATTTCTGGGGTTTCAGAATCAGTTACGAGAGTCGCTGTCGCTGACAACAATGACCCGGGATATGCGATTTTATAACGTTTCGGGTATCACTGAGTCTGACCTGGACGAGGCGGAAATAAGGATAAAAATGGCTGAAAATAGGGATTTTCACAAATGGTTTGCGCTGTGGGGGCCGTGGCATAAAGTGCTGGAGCGCATAGCGCCAGAAGAGTGGCGTGAAATGATGGCTAAAAGGGATGAGTGTATTGAAACGGATGAGTATCAGAGCCGGGTCAATGCTGAACTGGAAGATTTAAGAATAGCAGACGACTCTGACGCAGAGCGTACTACTGAGGTACAGATGGATGCAGAGCGTGCTATTGGGATAAAAATAATGGAAGAGATCAATCAGACCCTCTTTACTGAGATCATGGAGAATATATTGCTGAAAAAAGAGGTGAGCTCGCTCATGAGCGCCTACTGGCGATAG

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自鼠伤寒沙门氏菌(Salmonella typhimurium)的E3泛素连接酶SopA,其是HECT基序,并且具有SEQ IDNO:31的氨基酸序列:

MKISSGAINFSTIPNQVKKLITSIREHTKNGLTSKITSVKNTHTSLNEKFKTGKDSPIEFALPQKIKDFFQPKDKNTLNKTLITVKNIKDTNNAGKKNISAEDVSKMNAAFMRKHIANQTCDYNYRMTGAAPLPGGVSVSANNRPTVSEGRTPPVSPSLSLQATSSPSSPADWAKKLTDAVLRQKAGETLTAADRDFSNADFRNITFSKILPPSFMERDGDIIKGFNFSNSKFTYSDISHLHFDECRFTYSTLSDVVCSNTKFSNSDMNEVFLQYSITTQQQPSFIDTTLKNTLIRHKANLSGVILNEPDNSSPPSVSGGGNFIRLGDIWLQMPLLWTENAVDGFLNHEHNNGKSILMTIDSLPDKYSQEKVQAMEDLVKSLRGGRLTEACIRPVESSLVSVLAHPPYTQSALISEWLGPVQERFFAHQCQTYNDVPLPAPDTYYQQRILPVLLDSFDRNSAAMTTHSGLFNQVILHCMTGVDCTDGTRQKAAALYEQYLAHPAVSPHIHNGLFGNYDGSPDWTTRAADNFLLLSSQDSDTAMMLSTDTLLTMLNPTPDTAWDNFYLLRAGENVSTAQISPVELFRHDFPVFLAAFNQQATQRRFGELIDIILSTEEHGELNQQFLAATNQKHSTVKLIDDASVSRLATIFDPLLPEGKLSPAHYQHILSAYHLTDATPQKQAETLFCLSTAFARYSSSAIFGTEHDSPPALRGYAEALMQKAWELSPAIFPSSEQFTEWSDRFHGLHGAFTCTSVVADSMQRHARKYFPSVLSSILPLAWA

来自鼠伤寒沙门氏菌的E3泛素连接酶SopA,其是HECT基序,具有如下所示的SEQID NO:32的核苷酸序列:

ATGAAGATATCATCAGGCGCAATTAATTTTTCTACTATTCCTAACCAGGTTAAAAAATTAATTACCTCTATTCGTGAACATACGAAAAACGGGCTCACCTCAAAAATAACCAGTGTTAAAAACACGCATACATCTTTAAATGAAAAATTTAAAACAGGAAAGGACTCACCGATTGAGTTCGCGTTACCACAAAAAATAAAAGACTTCTTTCAGCCGAAAGATAAAAACACCTTAAACAAAACATTGATTACTGTTAAAAATATTAAAGATACAAATAATGCAGGCAAGAAAAATATTTCAGCAGAAGATGTCTCAAAAATGAATGCAGCATTCATGCGTAAGCATATTGCAAATCAAACATGTGATTATAATTACAGAATGACAGGTGCGGCCCCGCTCCCCGGTGGAGTCTCTGTATCAGCCAATAACAGGCCCACGGTTTCTGAAGGTAGAACACCACCAGTATCCCCCTCCCTCTCACTTCAGGCTACCTCTTCCCCGTCATCACCTGCCGACTGGGCTAAGAAACTCACGGATGCAGTTTTACGACAGAAAGCCGGAGAAACCCTTACGGCCGCAGATCGCGATTTTTCAAACGCAGATTTCCGTAATATTACATTCAGCAAAATATTGCCCCCCAGCTTCATGGAGCGAGACGGCGATATTATTAAGGGGTTCAACTTTTCAAATTCAAAATTTACTTATTCTGATATATCTCATTTACATTTTGACGAATGCCGATTCACTTATTCGACACTGAGTGATGTAGTCTGCAGTAATACGAAATTTAGTAATTCAGACATGAATGAAGTGTTTTTACAGTATTCAATTACTACACAACAACAGCCCTCGTTTATTGATACAACATTAAAAAATACGCTTATACGTCACAAAGCCAACCTCTCTGGCGTTATTTTAAATGAACCGGATAATTCATCACCTCCGTCAGTGTCAGGGGGCGGAAATTTTATTCGTCTAGGTGATATCTGGCTGCAAATGCCACTCCTTTGGACTGAGAACGCTGTGGATGGATTTTTAAATCATGAGCACAATAATGGTAAAAGTATTCTGATGACCATTGACAGCCTGCCCGATAAATACAGTCAGGAAAAAGTCCAGGCAATGGAAGACCTGGTTAAGTCATTGCGGGGTGGCCGCTTAACAGAGGCATGTATCCGGCCAGTTGAAAGTTCGCTGGTAAGCGTACTGGCCCACCCCCCCTATACGCAAAGTGCGCTTATCAGCGAGTGGCTCGGGCCTGTTCAGGAACGTTTTTTTGCCCACCAGTGCCAGACCTATAATGACGTTCCCCTGCCGGCTCCTGACACATATTATCAGCAGCGCATACTGCCTGTGTTGCTGGATTCGTTTGACAGGAACAGCGCCGCCATGACCACTCACAGCGGACTCTTTAATCAGGTGATTTTACACTGTATGACAGGCGTGGACTGCACTGATGGCACCCGCCAGAAAGCTGCAGCGCTTTATGAACAGTATCTTGCTCACCCGGCGGTGTCTCCCCACATCCATAATGGGCTCTTCGGCAATTATGATGGCAGCCCGGACTGGACAACCCGCGCTGCAGATAATTTCCTGCTGCTTTCCTCCCAAGATTCAGACACGGCGATGATGCTCTCCACTGACACGCTGTTAACAATGCTAAACCCTACTCCTGACACTGCATGGGACAACTTTTACCTGCTGCGAGCCGGAGAGAACGTTTCCACCGCGCAAATCTCTCCGGTAGAGTTATTCCGTCATGACTTTCCGGTGTTTCTCGCCGCATTTAATCAGCAGGCCACGCAGCGACGCTTTGGGGAGCTGATTGATATCATCCTCAGCACTGAAGAGCACGGGGAGCTGAACCAGCAGTTTCTTGCCGCCACGAACCAGAAACATTCCACCGTGAAGTTGATTGATGATGCCTCAGTGTCGCGTCTGGCCACCATTTTTGACCCCTTGCTTCCTGAAGGCAAACTCAGCCCGGCACACTACCAGCACATCCTCAGTGCTTATCACCTGACGGACGCCACCCCACAGAAGCAGGCGGAAACCCTGTTCTGTCTCAGTACCGCATTCGCACGCTATTCCTCCAGCGCCATTTTCGGCACTGAGCATGACTCTCCGCCGGCCCTGAGAGGCTATGCGGAGGCGCTGATGCAGAAAGCCTGGGAGCTGTCTCCGGCGATATTCCCATCCAGCGAACAGTTTACCGAGTGGTCCGACCGTTTTCACGGCCTCCATGGCGCCTTTACCTGTACCAGCGTTGTGGCGGATAGTATGCAACGTCATGCCAGAAAATATTTCCCGAGTGTTCTGTCATCCATCCTGCCACTGGCCTGGGCGTAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自鼠伤寒沙门氏菌的E3泛素连接酶SspH1,其是新型E3连接酶基序,并且具有SEQ ID NO:33的氨基酸序列:

MFNIRNTQPSVSMQAIAGAAAPEASPEEIVWEKIQVFFPQENYEEAQQCLAELCHPARGMLPDHISSQFARLKALTFPAWEENIQCNRDGINQFCILDAGSKEILSITLDDAGNYTVNCQGYSEAHDFIMDTEPGEECTEFAEGASGTSLRPATTVSQKAAEYDAVWSKWERDAPAGESPGRAAVVQEMRDCLNNGNPVLNVGASGLTTLPDRLPPHITTLVIPDNNLTSLPELPEGLRELEVSGNLQLTSLPSLPQGLQKLWAYNNWLASLPTLPPGLGDLAVSNNQLTSLPEMPPALRELRVSGNNLTSLPALPSGLQKLWAYNNRLTSLPEMSPGLQELDVSHNQLTRLPQSLTGLSSAARVYLDGNPLSVRTLQALRDIIGHSGIRIHFDMAGPSVPREARALHLAVADWLTSAREGEAAQADRWQAFGLEDNAAAFSLVLDRLRETENFKKDAGFKAQISSWLTQLAEDAALRAKTFAMATEATSTCEDRVTHALHQMNNVQLVHNAEKGEYDNNLQGLVSTGREMFRLATLEQIAREKAGTLALVDDVEVYLAFQNKLKESLELTSVTSEMRFFDVSGVTVSDLQAAELQVKTAENSGFSKWILQWGPLHSVLERKVPERFNALREKQISDYEDTYRKLYDEVLKSSGLVDDTDAERTIGVSAMDSAKKEFLDGLRALVDEVLGSYLTARWRLN

来自鼠伤寒沙门氏菌的E3泛素连接酶SspH1,其是新型E3连接酶基序,具有如下所示的SEQ ID NO:34的核苷酸序列:

ATGTTTAATATCCGCAATACACAACCTTCTGTAAGTATGCAGGCTATTGCTGGTGCAGCGGCACCAGAGGCATCTCCGGAAGAAATTGTATGGGAAAAAATTCAGGTTTTTTTCCCGCAGGAAAATTACGAAGAAGCGCAACAGTGTCTCGCTGAACTTTGCCATCCGGCCCGGGGAATGTTGCCTGATCATATCAGCAGCCAGTTTGCGCGTTTAAAAGCGCTTACCTTCCCCGCGTGGGAGGAGAATATTCAGTGTAACAGGGATGGTATAAATCAGTTTTGTATTCTGGATGCAGGCAGCAAGGAGATATTGTCAATCACTCTTGATGATGCCGGGAACTATACCGTGAATTGTCAGGGGTACAGTGAAGCACATGACTTCATCATGGACACAGAACCGGGAGAGGAATGCACAGAATTCGCGGAGGGGGCATCCGGGACATCCCTCCGCCCTGCCACAACGGTTTCACAGAAGGCAGCAGAGTATGATGCTGTCTGGTCAAAATGGGAAAGGGATGCACCAGCAGGAGAGTCACCCGGCCGCGCAGCAGTGGTACAGGAAATGCGTGATTGCCTGAATAACGGCAATCCAGTGCTTAACGTGGGAGCGTCAGGTCTTACCACCTTACCAGACCGTTTACCACCGCATATTACAACACTGGTTATTCCTGATAATAATCTGACCAGCCTGCCGGAGTTGCCGGAAGGACTACGGGAGCTGGAGGTCTCTGGTAACCTACAACTGACCAGCCTGCCATCGCTGCCGCAGGGACTACAGAAGCTGTGGGCCTATAATAATTGGCTGGCCAGCCTGCCGACGTTGCCGCCAGGACTAGGGGATCTGGCGGTCTCTAATAACCAGCTGACCAGCCTGCCGGAGATGCCGCCAGCACTACGGGAGCTGAGGGTCTCTGGTAACAACCTGACCAGCCTGCCGGCGCTGCCGTCAGGACTACAGAAGCTGTGGGCCTATAATAATCGGCTGACCAGCCTGCCGGAGATGTCGCCAGGACTACAGGAGCTGGATGTCTCTCATAACCAGCTGACCCGCCTGCCGCAAAGCCTCACGGGTCTGTCTTCAGCGGCACGCGTATATCTGGACGGGAATCCACTGTCTGTACGCACTCTGCAGGCTCTGCGGGACATCATTGGCCATTCAGGCATCAGGATACACTTCGATATGGCGGGGCCTTCCGTCCCCCGGGAAGCCCGGGCACTGCACCTGGCGGTCGCTGACTGGCTGACGTCTGCACGGGAGGGGGAAGCGGCCCAGGCAGACAGATGGCAGGCGTTCGGACTGGAAGATAACGCCGCCGCCTTCAGCCTGGTCCTGGACAGACTGCGTGAGACGGAAAACTTCAAAAAAGACGCGGGCTTTAAGGCACAGATATCATCCTGGCTGACACAACTGGCTGAAGATGCTGCGCTGAGAGCAAAAACCTTTGCCATGGCAACAGAGGCAACATCAACCTGCGAGGACCGGGTCACACATGCCCTGCACCAGATGAATAACGTACAACTGGTACATAATGCAGAAAAAGGGGAATACGACAACAATCTCCAGGGGCTGGTTTCCACGGGGCGTGAGATGTTCCGCCTGGCAACACTGGAACAGATTGCCCGGGAAAAAGCCGGAACACTGGCTTTAGTCGATGACGTTGAGGTCTATCTGGCGTTCCAGAATAAGCTGAAGGAATCACTTGAGCTGACCAGCGTGACGTCAGAAATGCGTTTCTTTGACGTTTCCGGCGTGACGGTTTCAGACCTTCAGGCTGCGGAGCTTCAGGTGAAAACCGCTGAAAACAGCGGGTTCAGTAAATGGATACTGCAGTGGGGGCCGTTACACAGCGTGCTGGAACGCAAAGTGCCGGAACGCTTTAACGCGCTTCGTGAAAAGCAAATATCGGATTATGAAGACACGTACCGGAAGCTGTATGACGAAGTGCTGAAATCGTCCGGGCTGGTCGACGATACCGATGCAGAACGTACTATCGGAGTAAGTGCGATGGATAGTGCGAAAAAAGAATTTCTGGATGGCCTGCGCGCTCTTGTGGATGAGGTGCTGGGTAGCTATCTGACAGCCCGGTGGCGTCTTAACTAA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自鼠伤寒沙门氏菌的E3泛素连接酶SspH2,其是新型E3连接酶基序,并且具有SEQ ID NO:35的氨基酸序列:

MPFHIGSGCLPATISNRRIYRIAWSDTPPEMSSWEKMKEFFCSTHQTEALECIWTICHPPAGTTREDVINRFELLRTLAYAGWEESIHSGQHGENYFCILDEDSQEILSVTLDDAGNYTVNCQGYSETHRLTLDTAQGEEGTGHAEGASGTFRTSFLPATTAPQTPAEYDAVWSAWRRAAPAEESRGRAAVVQKMRACLNNGNAVLNVGESGLTTLPDCLPAHITTLVIPDNNLTSLPALPPELRTLEVSGNQLTSLPVLPPGLLELSIFSNPLTHLPALPSGLCKLWIFGNQLTSLPVLPPGLQELSVSDNQLASLPALPSELCKLWAYNNQLTSLPMLPSGLQELSVSDNQLASLPTLPSELYKLWAYNNRLTSLPALPSGLKELIVSGNRLTSLPVLPSELKELMVSGNRLTSLPMLPSGLLSLSVYRNQLTRLPESLIHLSSETTVNLEGNPLSERTLQALREITSAPGYSGPIIRFDMAGASAPRETRALHLAAADWLVPAREGEPAPADRWHMFGQEDNADAFSLFLDRLSETENFIKDAGFKAQISSWLAQLAEDEALRANTFAMATEATSSCEDRVTFFLHQMKNVQLVHNAEKGQYDNDLAALVATGREMFRLGKLEQIAREKVRTLALVDEIEVWLAYQNKLKKSLGLTSVTSEMRFFDVSGVTVTDLQDAELQVKAAEKSEFREWILQWGPLHRVLERKAPERVNALREKQISDYEETYRMLSDTELRPSGLVGNTDAERTIGARAMESAKKTFLDGLRPLVEEMLGSYLNVQWRRN

来自鼠伤寒沙门氏菌的E3泛素连接酶SspH2,其是新型E3连接酶基序,具有如下所示的SEQ ID NO:36的核苷酸序列:

ATGCCCTTTCATATTGGAAGCGGATGTCTTCCCGCCACCATCAGTAATCGCCGCATTTATCGTATTGCCTGGTCTGATACCCCCCCTGAAATGAGTTCCTGGGAAAAAATGAAGGAATTTTTTTGCTCAACGCACCAGACTGAAGCGCTGGAGTGCATCTGGACGATTTGTCACCCGCCGGCCGGAACGACGCGGGAGGATGTGATCAACAGATTTGAACTGCTCAGGACGCTCGCGTATGCCGGATGGGAGGAAAGCATTCATTCCGGCCAGCACGGGGAAAATTACTTCTGTATTCTGGATGAAGACAGTCAGGAGATATTGTCAGTCACCCTTGATGATGCCGGGAACTATACCGTAAATTGCCAGGGGTACAGTGAAACACATCGCCTCACCCTGGACACAGCACAGGGTGAGGAGGGCACAGGACACGCGGAAGGGGCATCCGGGACATTCAGGACATCCTTCCTCCCTGCCACAACGGCTCCACAGACGCCAGCAGAGTATGATGCTGTCTGGTCAGCGTGGAGAAGGGCTGCACCCGCAGAAGAGTCACGCGGCCGTGCAGCAGTGGTACAGAAAATGCGTGCCTGCCTGAATAATGGCAATGCAGTGCTTAACGTGGGAGAATCAGGTCTTACCACCTTGCCAGACTGTTTACCCGCGCATATTACCACACTGGTTATTCCTGATAATAATCTGACCAGCCTGCCGGCGCTGCCGCCAGAACTGCGGACGCTGGAGGTCTCTGGTAACCAGCTGACTAGCCTGCCGGTGCTGCCGCCAGGACTACTGGAACTGTCGATCTTTAGTAACCCGCTGACCCACCTGCCGGCGCTGCCGTCAGGACTATGTAAGCTGTGGATCTTTGGTAATCAACTGACCAGCCTGCCGGTGTTGCCGCCAGGGCTACAGGAGCTGTCGGTATCTGATAACCAACTGGCCAGCCTGCCGGCGCTGCCGTCAGAATTATGTAAGCTGTGGGCCTATAATAACCAGCTGACCAGCCTGCCGATGTTGCCGTCAGGGCTACAGGAGCTGTCGGTATCTGATAACCAACTGGCCAGCCTGCCGACGCTGCCGTCAGAATTATATAAGCTGTGGGCCTATAATAATCGGCTGACCAGCCTGCCGGCGTTGCCGTCAGGACTGAAGGAGCTGATTGTATCTGGTAACCGGCTGACCAGTCTGCCGGTGCTGCCGTCAGAACTGAAGGAGCTGATGGTATCTGGTAACCGGCTGACCAGCCTGCCGATGCTGCCGTCAGGACTACTGTCGCTGTCGGTCTATCGTAACCAGCTGACCCGCCTGCCGGAAAGTCTCATTCATCTGTCTTCAGAGACAACCGTAAATCTGGAAGGGAACCCACTGTCTGAACGTACTTTGCAGGCGCTGCGGGAGATCACCAGCGCGCCTGGCTATTCAGGCCCCATAATACGATTCGATATGGCGGGAGCCTCCGCCCCCCGGGAAACTCGGGCACTGCACCTGGCGGCCGCTGACTGGCTGGTGCCTGCCCGGGAGGGGGAACCGGCTCCTGCAGACAGATGGCATATGTTCGGACAGGAAGATAACGCCGACGCATTCAGCCTCTTCCTGGACAGACTGAGTGAGACGGAAAACTTCATAAAGGACGCGGGGTTTAAGGCACAGATATCGTCCTGGCTGGCACAACTGGCTGAAGATGAGGCGTTAAGAGCAAACACCTTTGCTATGGCAACAGAGGCAACCTCAAGCTGCGAGGACCGGGTCACATTTTTTTTGCACCAGATGAAGAACGTACAGCTGGTACATAATGCAGAAAAAGGGCAATACGATAACGATCTCGCGGCGCTGGTTGCCACGGGGCGTGAGATGTTCCGTCTGGGAAAACTGGAACAGATTGCCCGGGAAAAGGTCAGAACGCTGGCTCTCGTTGATGAAATTGAGGTCTGGCTGGCGTATCAGAATAAGCTGAAGAAATCACTCGGGCTGACCAGCGTGACGTCAGAAATGCGTTTCTTTGACGTATCCGGCGTGACGGTTACAGACCTTCAGGACGCGGAGCTTCAGGTGAAAGCCGCTGAAAAAAGCGAGTTCAGGGAGTGGATACTGCAGTGGGGGCCGTTACACAGAGTGCTGGAGCGCAAAGCGCCGGAACGCGTTAACGCGCTTCGTGAAAAGCAAATATCGGATTATGAGGAAACGTACCGGATGCTGTCTGACACAGAGCTGAGACCGTCTGGGCTGGTCGGTAATACCGATGCAGAGCGCACTATCGGAGCAAGAGCGATGGAGAGCGCGAAAAAGACATTTTTGGATGGCCTGCGACCTCTTGTGGAGGAGATGCTGGGGAGCTATCTGAACGTTCAGTGGCGTCGTAACTGA

可用作根据本申请的降解结构域的另一示例性E3泛素连接酶包括来自野油菜黄单胞菌(Xanthomonas campestris)的E3泛素连接酶XopL,其是非常规基序,并且具有SEQID NO:37的氨基酸序列:

MRRVDQPRPPGTPFGLREQTTSNADAPARTAPPAHPAPERPTGMLGGLTRYVPGDRSGRPPAMPAAAETSRRPTTSARPLPYGGSGSAARMNEAAGHPLRMPQLPQLSDIERARFHSVTTDSQHLRPVRPRMPPPVGASPLRRSTALRPYHDVLSQWQRHYNADRNRWHSAWRQANSNNPQIETRTGRALKATADLLEDATQPGRVALELRSVPLPQFPDQAFRLSHLQHMTIDAAGLMELPDTMQQFAGLETLTLARNPLRALPASIASLNRLRELSIRACPELTELPEPLASTDASGEHQGLVNLQSLRLEWTGIRSLPASIANLQNLKSLKIRNSPLSALGPAIHHLPKLEELDLRGCTALRNYPPIFGGRAPLKRLILKDCSNLLTLPLDIHRLTQLEKLDLRGCVNLSRLPSLIAQLPANCIILVPPHLQAQLDQHRPVARPAEPGRTGPTTPALSPSAAGDRAGPSSSATASELLLTAALERIEDTAQAMLSTVIDEERNPFLEGAPSYLPGKRPTDVTTFGQVPALRDMLAESRDLEFLQRVSDMAGPSPRIEDPSEEGLARHYTNVSNWKAQKSAHLGIVDHLGQFVYHEGSPLDVATLAKAVQMWKTRELIVHAHPQDRARFPELAVHIPEQVSDDSDSEQQTSPEPSGHQ

来自野油菜黄单胞菌的E3泛素连接酶XopL,其是非常规基序,具有如下所示的SEQID NO:38的核苷酸序列:

ATGCGACGCGTCGATCAACCACGCCCGCCGGGCACGCCTTTCGGACTGCGGGAGCAGACTACGTCCAATGCGGATGCGCCCGCGCGCACTGCCCCACCCGCACACCCCGCGCCCGAGCGCCCTACCGGCATGCTCGGCGGACTGACCAGATATGTGCCTGGCGATCGGTCCGGGCGACCGCCAGCAATGCCTGCCGCTGCCGAGACCTCTCGCCGGCCAACCACCTCCGCCCGCCCGCTTCCCTACGGCGGATCCGGCAGCGCCGCGCGGATGAACGAGGCGGCTGGACATCCTTTGCGGATGCCGCAATTGCCACAGCTCAGCGACATAGAACGCGCTCGCTTCCACTCCGTCACCACCGACTCGCAACACTTGCGGCCGGTGCGCCCCCGTATGCCACCGCCCGTGGGCGCTTCACCCTTACGGCGCTCCACAGCGCTGCGCCCGTACCACGACGTGCTGTCGCAATGGCAACGCCACTACAACGCAGATCGCAATCGCTGGCACAGCGCATGGCGCCAGGCCAACAGCAACAACCCGCAGATCGAGACTCGCACAGGCCGGGCGCTGAAGGCGACAGCCGACCTGCTGGAGGACGCAACCCAACCGGGCCGGGTCGCGCTGGAGCTGCGCTCAGTTCCGCTGCCGCAATTTCCCGACCAGGCATTCCGTCTTTCGCATCTGCAGCACATGACGATCGACGCGGCAGGGTTGATGGAGCTCCCGGACACCATGCAGCAATTTGCGGGCCTGGAAACACTCACGCTCGCACGCAATCCGCTTCGCGCGCTACCGGCATCCATCGCAAGCCTCAACCGATTACGCGAGCTCTCCATCCGCGCCTGCCCGGAATTGACGGAACTTCCCGAACCCCTGGCAAGCACCGATGCATCCGGCGAGCACCAGGGCTTGGTCAACCTGCAGAGCCTACGGCTGGAATGGACCGGGATCAGATCGCTTCCGGCGTCCATCGCCAACCTGCAAAATCTGAAAAGCCTGAAGATACGCAACTCGCCGCTGTCCGCCCTTGGCCCGGCCATCCATCACCTGCCAAAGTTGGAGGAGCTTGATTTGCGGGGCTGTACCGCGCTGCGCAACTATCCGCCGATTTTCGGCGGCCGTGCGCCACTGAAGCGACTGATTCTGAAAGACTGCAGCAACCTGCTCACGCTGCCACTGGACATTCACCGCCTGACGCAGCTGGAAAAACTCGATCTGCGAGGTTGCGTCAACCTTTCCAGACTGCCCTCGTTGATCGCCCAATTACCTGCCAATTGCATCATCCTGGTGCCGCCGCATCTCCAAGCGCAGCTCGACCAGCATCGTCCAGTTGCGCGCCCCGCCGAACCAGGGCGGACCGGACCGACCACCCCAGCTCTCTCGCCCTCTGCTGCCGGCGACCGCGCCGGGCCATCCTCTTCGGCGACCGCCAGCGAACTGCTTCTTACCGCTGCGCTCGAACGCATCGAAGACACCGCACAGGCCATGCTGAGCACGGTCATCGATGAAGAAAGAAATCCCTTTCTGGAAGGTGCTCCATCCTATCTCCCAGGAAAACGCCCTACCGATGTCACCACCTTCGGCCAAGTTCCGGCATTGCGGGACATGCTGGCAGAAAGCAGGGATCTTGAGTTCCTGCAACGGGTAAGCGACATGGCAGGCCCATCCCCCAGAATCGAAGACCCGAGCGAGGAAGGCCTCGCCCGCCACTACACGAACGTCAGCAACTGGAAGGCGCAGAAGAGCGCACACCTGGGCATCGTCGATCATCTCGGGCAGTTCGTTTATCACGAAGGAAGCCCGCTCGACGTAGCGACATTGGCCAAGGCAGTGCAGATGTGGAAGACCCGTGAGCTGATCGTCCACGCACACCCGCAAGACCGCGCGCGCTTTCCCGAGCTCGCTGTGCACATTCCCGAGCAGGTCAGCGACGACTCTGATAGCGAACAGCAGACAAGCCCGGAACCTTCAGGCCATCAGTAG

尽管靶向结构域具有固有的结合相互作用,例如,二级、三级或四级柔性,但是在与E3基序泛素区域的结合方面仍然必须具有柔性。在这方面,如果没有足够的间隔,则E3基序可能在空间上阻碍底物-靶结构域相互作用。这样,在一些实施例中,本申请采用足够长度的多肽接头以防止靶向结构域和底物之间结合的空间破坏。

在一些实施例中,靶向结构域通过在生理条件下可裂解或不可裂解的接头共价连接至泛素区域。接头可需要包含亲核或亲电反应基团的有机部分,其允许将靶向结构域共价连接至泛素区域剂。在一些实施例中,接头是烯醇醚、缩酮、亚胺、肟、腙、半卡巴腙、酰基酰亚胺或亚甲基。在一些实施例中,接头可以是酸可裂解的接头,可水解裂解的接头或酶可裂解的接头。

基于肽的连接基团在细胞中被酶如肽酶和蛋白酶裂解。基于肽的可裂解连接基团是在氨基酸之间形成的产生寡肽如二肽、三肽和多肽的肽键。基于肽的可裂解基团不包括酰胺基团(-C(O)NH-)。酰胺基团可以在任何亚烷基、亚烯基或亚炔基之间形成。肽键是在氨基酸之间形成的产生肽和蛋白质的特殊类型的酰胺键。基于肽的裂解基团通常限于在产生肽和蛋白质的氨基酸之间形成的肽键,即酰胺键,并且不包括整个酰胺官能团。肽可裂解的连接基团具有通式-NHCHR1C(O)NHCHR2C(O)-,其中R1和R2是两个相邻氨基酸的R基团。这些候选物可以使用类似于上述那些的方法进行评估。

对于体外应用,可以是用于将多肽缀合至固体支持物的交联剂的合适的接头包括可以与支持物表面上存在的官能团或与多肽或两者反应的多种试剂。可用作交联剂的试剂包括同-双-官能试剂,并且特别是杂-双-官能试剂。有用的双官能交联剂包括但不限于N-SIAB、双马来酰亚胺、DTNB、N-SATA、N-SPDP、SMCC和6-HYNIC。可以选择交联剂以在多肽和固体支持物之间提供可选择性裂解的键。例如,光不稳定的交联剂,如3-氨基-(2-硝基苯基)丙酸可用作从固体支持物上裂解多肽的手段。参见Brown等人,“A Single-Bead DecodeStrategy Using Electrospray Ionization Mass Spectrometry and a NewPhotolabile Linker:3-amino-3-(2-nitrophenyl)propionic Acid,”Mol.Divers 4-12(1995)和美国专利第5,643,722号,其全部内容特此通过引用并入本文。

抗体、多肽或其片段,例如靶向结构域,可以通过在羧基官能化的珠和多肽的氨基末端之间形成的共价酰胺键,或相反地,通过在氨基官能化的珠和多肽的羧基末端之间形成的共价酰胺键,固定在固体支持物如珠上。此外,双官能三苯甲基接头可以连接到支持物上,例如经由氨基树脂通过树脂上的氨基或羧基连接到树脂如Wang树脂上的4-硝基苯基活性酯上。使用双功能三苯甲基方法,固体支持物可能需要用挥发性酸如甲酸或三氟乙酸处理以确保多肽被裂解并可被除去。在这种情况下,多肽可以作为无珠贴剂沉积在固体支持物的孔的底部或固体支持物的平坦表面上。在加入基质溶液后,多肽可被解吸到MS中。

对于本领域技术人员显而易见的是,上述方法和技术可用于本申请的嵌合分子,包括其组成部分,例如降解结构域、泛素区域、靶区域及其修饰,以及如上所述的接头分子。

本申请的第二个方面涉及一种形成核糖核蛋白的方法。该方法包括提供编码本文所述的分离的嵌合分子的mRNA;提供一个或多个聚腺苷酸结合蛋白(“PABP”);和由所述mRNA和所述一个或多个PABP组装核糖核蛋白复合物。在一个实施例中,mRNA包含3'-末端聚腺苷酸(聚A)尾。

在该方面中描述的嵌合分子根据本申请的前述方面进行。

本文所述的聚腺苷酸结合蛋白(“PABP”)(也称为聚(A)结合蛋白)是指与mRNA的聚(A)尾结合的RNA结合蛋白。聚(A)尾位于mRNA的3'末端,长度为200-250个核苷酸。结合蛋白还通过帮助聚腺苷酸聚合酶在翻译前将聚(A)核苷酸尾加到前mRNA而参与mRNA前体。核同种型选择性地结合约50个核苷酸,并通过增加其对RNA的亲和力来刺激聚腺苷酸聚合酶的活性。在mRNA代谢过程中也存在聚(A)结合蛋白,包括无义介导的衰变和核质运输。聚(A)结合蛋白还可以保护尾巴免于降解并调节mRNA的产生。

在一个实施例中,核糖核蛋白,在本文中也称为纳米复合物,可以是纳米颗粒。在优选的实施例中,纳米复合物包括纳米颗粒。核糖核蛋白或纳米复合物是由药物纳米颗粒与带相反电荷的聚电解质形成的复合物。阳离子和阴离子药物都与带相反电荷的聚电解质形成复合物。与其他纳米结构相比,纳米复合物的产率通常更高,并且复合效率通常更好。与其他纳米结构相比,纳米复合物也更易于制备。使用扫描电子显微镜、差示扫描量热法、X射线衍射和透析研究通过生产收率、复合效率、药物负载、粒径和ζ电势来表征根据本申请的核糖核蛋白或纳米复合物制剂。纳米复合物在不同领域具有广泛的应用,例如癌症治疗、基因药物递送、向脑的药物递送以及蛋白质和肽药物递送。

核糖核蛋白或纳米复合物可以具有任何合适的大小。在至少一个实施例中,核糖核蛋白或纳米复合物的直径小于约200nm,直径小于约100nm、小于约95nm、小于约90nm、小于约85nm、小于约80nm、小于约75nm、小于约70nm、小于约65nm、小于约60nm、小于约55nm、小于约50nm、小于约45nm、小于约40nm、小于约35nm、小于约30nm、小于约25nm、小于约20nm、小于约15nm、小于约10nm、小于约9nm、小于约8nm、小于约7nm、小于约6nm、小于约5nm、小于约4nm、小于约3nm、小于约2nm或小于约1nm。还包括直径范围的上限为约100nm、约95nm、约90nm、约85nm、约80nm、约75nm、约70nm、约65nm、约60nm、约55nm、约50nm、约45nm、约40nm、约35nm、约30nm、约25nm、约20nm、约15nm、约10nm、约9nm、约8nm、约7nm、约6nm、约5nm、约4nm、约3nm或约2nm和下限为约95nm、约90nm、约85nm、约80nm、约75nm、约70nm、约65nm、约60nm、约55nm、约50nm、约45nm、约40nm、约35nm、约30nm、约25nm、约20nm、约15nm、约10nm、约9nm、约8nm、约7nm、约6nm、约5nm、约4nm、约3nm、约2nm或约1nm或其任何组合的纳米颗粒。在某些实施例中,本申请还提供纳米复合物的大小范围为约50nm至约200nm或约10nm至约100nm。在某些实施例中,纳米复合物的大小为约50nm至约150nm。在其他实施例中,纳米复合物的大小可以是约50nm、约75nm或约100nm。

可以优化核糖核蛋白和/或纳米复合物的大小以定位在受试者内的特定位置。例如,可以优化核糖核蛋白和/或纳米复合物,使得其可以移入受试者的各种器官。

在一个实施例中,核糖核蛋白和/或纳米复合物含有有机凝胶。

本申请的核糖核蛋白和/或纳米复合物可以具有任何合适的形状。例如,本申请的核糖核蛋白和/或纳米复合物可以具有网眼、球形、正方形、矩形、三角形、圆盘、立方体状形状、立方体、长方体(立方体)、圆锥体、圆柱体、棱柱、多面体、金字塔、直角圆柱体、杆、分支的圆柱体的形状以及其他规则或不规则形状。在一个实施例中,核糖核蛋白和/或纳米复合物的聚合物基质可含有缠结且共价结合的聚合物。在一个实施例中,基质是水凝胶。

在一个实施例中,对于由聚合物单元形成的每个颗粒,核糖核蛋白和/或纳米复合物基质中的聚合物单元的数量范围为10至5000,例如20至400。在另一个实施例中,聚合物单元的数量范围为10,000至200,000,例如15,000至200,000个聚合物单元。

根据本申请的核糖核蛋白和/或纳米复合物可以包括官能化的表面。在一个实施例中,核糖核蛋白和/或纳米复合物被负官能化。或者,核糖核蛋白和/或纳米复合物可以被正官能化。在其他实施例中,核糖核蛋白和/或纳米复合物不带电荷或为中性。

在一个实施例中,核糖核蛋白和/或纳米复合物是可生物降解的。在另一个实施例中,核糖核蛋白和/或纳米复合物是无毒的。

在一个实施例中,核糖核蛋白和/或纳米复合物可进一步包括至少一种稳定剂。稳定剂可以被吸附在核糖核蛋白和/或纳米复合物的表面上。核糖核蛋白和/或纳米复合物可以分散在液体介质中,并且稳定剂可以用作佐剂,以在分散过程中帮助分离单个核糖核蛋白和/或纳米复合物。稳定剂有助于分离单个核糖核蛋白和/或纳米复合物的能力可以通过比较含有稳定剂的组合物和不含稳定剂的对照组合物的分散过程来确定。稳定剂有助于分离单个纳米颗粒的能力可以通过较短的分散时间来表明。或者,可以使用稳定剂来促进分散的纳米复合物在液体介质,优选在水性介质中的稳定性。

本申请的第三方面涉及一种包含本文所述的嵌合分子和药学上可接受的载体的组合物。

根据本申请的方法,可以将嵌合分子掺入适合施用的药物组合物中。如本文所用,术语“药学上可接受的载体”旨在包括与药物施用相容的任何和所有溶剂、分散介质、包衣、抗细菌和抗真菌化合物、等渗和吸收延迟化合物等。

在该方面中描述的嵌合分子是根据本申请先前描述的方面进行的。

药物组合物通常需要适合于施用于受试者的形式的重组或基本上纯化的嵌合分子和药学上可接受的载体。药学上可接受的载体部分地取决于所施用的特定组合物以及用于施用该组合物的特定方法。因此,存在多种用于施用蛋白质组合物的药物组合物的合适制剂。参见例如,Remington’s Pharmaceutical Sciences,马克出版有限公司(MackPublishing Co.),伊斯顿,宾夕法尼亚州,第18版(1990),其全部内容特此通过引用并入本文。通常将药物组合物配制成无菌的、基本上等渗的并完全符合美国食品药品管理局的所有良好生产规范(GMP)规定。

如本文所用,术语药学上可接受的载体包括例如任何类型的无毒、惰性固体、半固体或液体填充剂、稀释剂、包囊材料或制剂助剂。由Gennaro编辑的Remington'sPharmaceutical Sciences,马克出版有限公司,伊斯顿,宾夕法尼亚州,1995(其全部内容特此通过引用并入本文)公开了用于配制药物组合物的各种载体及其制备的已知技术。可以用作药学上可接受的载体的材料的一些实例包括但不限于糖,例如乳糖、葡萄糖和蔗糖;淀粉,例如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,例如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;黄芪胶粉;麦芽;明胶;滑石;赋形剂,例如可可脂和栓剂蜡;油,例如花生油、棉籽油;红花油;芝麻油;橄榄油;玉米油和大豆油;二醇,例如丙二醇;酯,例如油酸乙酯和月桂酸乙酯;琼脂;洗涤剂,例如TWEEN

本申请的化合物可以口服、肠胃外,例如皮下、静脉内、肌内、腹膜内,通过鼻内滴注,或通过施于粘膜(例如鼻粘膜、喉粘膜)和支气管来施用。它们可以单独施用或与合适的药物载体一起施用,并且可以以固体或液体的形式,例如片剂、胶囊剂、粉剂、溶液、悬浮液或乳液施用。

本申请的组合物可以例如与惰性稀释剂或与可吸收的可食用载体一起口服施用,或者可以将它们封装在硬或软壳胶囊中,或者可以将它们压制成片剂,或者可以将它们直接与饮食的食物掺杂。对于口服治疗性施用,这些组合物可以与赋形剂掺杂并以片剂、胶囊剂、酏剂、悬浮剂、糖浆剂等形式使用。此类组合物和制剂应含有至少0.1%的活性化合物。当然,这些组合物中组合物的百分比可以变化,并且可以方便地为单位重量的约2%至约60%。制备根据本申请的优选组合物,使得口服剂量单位含有约1-250mg的活性化合物。

片剂、胶囊剂等还可含有粘合剂,例如黄蓍胶、阿拉伯树胶、玉米淀粉或明胶;赋形剂,例如磷酸二钙;崩解剂,例如玉米淀粉、马铃薯淀粉、海藻酸;润滑剂,例如硬脂酸镁;和甜味剂,例如蔗糖、乳糖或糖精。当剂量单位形式是胶囊剂时,除上述类型的材料外,它还可含有液体载体,例如脂肪油。

这些组合物也可以肠胃外施用。本发明组合物的溶液或悬浮液可以在水中适当地与表面活性剂如羟丙基纤维素混合而制备。也可以在油中在甘油、液体聚乙二醇及其混合物中制备分散体。示例性油是石油、动物、植物或合成来源的油,例如花生油、大豆油或矿物油。通常,水、盐水、右旋糖水溶液和相关的糖溶液,以及二醇如丙二醇或聚乙二醇是优选的液体载体,特别是对于可注射溶液。在常规的储存和使用条件下,这些制剂含有防腐剂以防止微生物的生长。

适用于可注射用途的药物形式包括无菌水溶液或分散体和用于临时制备无菌可注射溶液或分散体的无菌粉剂。在所有情况下,该形式都必须是无菌的,并且必须具有达到易于注射程度的流动性。它必须在生产和储存条件下稳定,并且必须保存以防微生物如细菌和真菌的污染。载体可以是溶剂或分散介质,其含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇)、其合适的混合物和植物油。

本申请的组合物也可以以气雾剂形式直接施用于气道。为了用作气雾剂,可以将本申请的溶液或悬浮液形式的组合物与合适的推进剂(例如,烃类推进剂,如丙烷、丁烷或异丁烷)与常规助剂一起包装在加压气雾剂容器中。本申请的材料还可以以非加压形式例如在喷雾器或雾化器中施用。

在一些实施例中,本申请的组合物进一步含有选自由以下组成的非限制性群组的第二药剂或药物组合物:抗炎剂、抗糖尿病药剂、降血脂药剂、化学治疗药剂、抗病毒药剂、抗生素、代谢性治疗药剂、小分子抑制剂、蛋白激酶抑制剂、佐剂、凋亡剂、增殖剂、亲器官性靶向剂、免疫剂、病原体抗原,所述病原体为例如病毒、细菌、真菌和寄生虫,任选以整个灭活生物体、肽、蛋白质、糖蛋白、碳水化合物或其组合的形式,可在已出版的文献中找到的落入上述类别且已获批准用于人类使用的药理学或免疫学药剂的任何实例、任何其他生物活性组分或这些中的任一种的任何组合。

在一些实施例中,第二药剂或药物组合物选自由以下组成的非限制性群组:抗炎剂、抗糖尿病药剂、降血脂药剂、化学治疗药剂、抗病毒药剂、抗生素、代谢性治疗药剂、小分子抑制剂、蛋白激酶抑制剂、佐剂、凋亡剂、增殖剂、亲器官性靶向剂。

E3泛素连接酶及其功能结构域的重要性通过它们调节的正常细胞过程的数量来突出,并且是与功能丧失或不适当靶向相关的伴随疾病的基础。参见Ardley等人,“E3Ubiquitin Ligases.Essays Biochem 41:15-30(2005),其全部内容特此通过引用并入本文。

本申请的第四方面涉及一种治疗疾病的方法。该方法包括选择患有疾病的受试者,并且向该受试者施用本文所述的组合物,以使该受试者具有与未患该疾病的受试者相比增加的底物表达水平。

在该方面中描述的嵌合分子是根据本申请先前描述的方面进行的。

如本文所用,术语“受试者”是指哺乳动物,例如人,但是也可以是另一种动物,例如家畜(例如狗、猫等)、农畜(例如牛、羊、猪、马等)或实验动物(例如猴、大鼠、小鼠、兔、豚鼠等)。术语“患者”是指患有或怀疑患有疾病或病况的“受试者”。

所述方法可以包括向疾病具有可测量表型的受试者施用组合物。在一些实施例中,与来自未患该疾病的受试者的表型相比,该疾病的表型涉及底物的表达水平增加。在这方面,本申请的药物组合物中包含的嵌合分子有效治疗或减轻疾病症状,该疾病的特征在于与来自未患病受试者的表型相比,一种或多种底物的表达水平的表型增加。

在本申请的上下文中可以治疗或预防的疾病的非限制性实例包括癌症、转移癌、实体癌、浸润性癌症、扩散性癌症、乳腺癌、肺癌、NSCLC癌症、肝癌、前列腺癌、脑癌、胰腺癌、淋巴癌、卵巢癌、子宫内膜癌、宫颈癌和其他本领域已知的实体癌、血细胞恶性肿瘤、淋巴瘤、白血病、骨髓瘤、中风、局部缺血、心肌梗塞、充血性心力衰竭、中风、缺血、外周血管疾病、酒精性肝病、肝硬化、帕金森氏病、阿尔茨海默氏病、糖尿病、癌症、关节炎、ALS、致病性疾病、特发性疾病、病毒性疾病、细菌、疾病、朊病毒疾病、真菌病、寄生虫病、关节炎、伤口愈合、免疫缺陷、炎性疾病、再生障碍性贫血、贫血、遗传性病症、先天性病症、1型糖尿病、2型糖尿病、妊娠糖尿病、高血糖、代谢综合征、脂肪营养不良综合征、血脂异常、胰岛素抗性、瘦素抗性、动脉粥样硬化、血管疾病、高胆固醇血症、高甘油三酯血症、非酒精性脂肪肝疾病、败血性休克、多器官功能障碍综合征、类风湿关节炎、创伤、中风、心肌梗塞、全身性自身免疫性疾病、慢性肝炎、超重和/或肥胖或其任何组合。

在一些实施例中,该疾病是癌症、转移癌、中风、缺血、外周血管疾病、酒精性肝病、肝炎、肝硬化、帕金森氏病、阿尔茨海默氏病、囊性纤维化糖尿病、ALS、致病性疾病、特发性疾病、病毒性疾病、细菌、疾病、朊病毒疾病、真菌病、寄生虫病、关节炎、伤口愈合、免疫缺陷、炎性疾病、再生障碍性贫血、贫血、遗传性病症、先天性病症、1型糖尿病、2型糖尿病、妊娠糖尿病、高血糖、代谢综合征、脂肪营养不良综合征、血脂异常、胰岛素抗性、瘦素抗性、动脉粥样硬化、血管疾病、高胆固醇血症、高甘油三酯血症、非酒精性脂肪肝疾病、超重或肥胖及其任意组合。

当在体内用于治疗时,将组合物以有效量,即具有所需治疗作用的量施用于受试者。剂量和给药方案将取决于受试者的疾病程度,所用特定肽的特征,例如其治疗指数,受试者和受试者的病史。有效量可以在临床前试验和临床试验期间通过医师和临床医生熟悉的方法确定。可通过多种众所周知的用于施用药物化合物的方法中的任何一种将有效量的在该方法中有用的肽施用给需要其的哺乳动物。

所述组合物的剂量、毒性和治疗功效可通过细胞培养或实验动物中的标准药学程序来确定,例如,用于确定LD

在一些实施例中,本申请的组合物通过口服、肠胃外、皮下、静脉内、肌内、腹膜内、通过鼻内滴注、通过植入、通过腔内或膀胱内滴注、眼内、动脉内、病灶内、经皮或通过施于粘膜来施用。

本申请的第五方面涉及一种用于底物沉默的方法。该方法包括选择待沉默的底物;提供本文所述的嵌合分子;和使底物与嵌合分子在有效允许形成底物-分子复合物的条件下接触,其中该复合物介导待沉默的底物的降解。

在该方面中描述的嵌合分子根据本申请的前述方面进行。

本申请的第六方面涉及一种筛选对疾病具有治疗功效的试剂的方法。该方法包括提供生物分子,其存在介导疾病状态;提供测试试剂,其包含(i)包含E3泛素连接酶(E3)基序的降解结构域,(ii)能够特异性地将所述降解结构域导向所述生物分子的靶向结构域,其中所述靶向结构域与所述降解结构域异源,和(iii)将所述降解结构域偶联至所述靶向结构域的接头;使所述生物分子在有效使所述测试试剂促进所述生物分子降解的条件下与所述测试试剂接触;确定作为接触的结果的生物分子的水平;以及基于所述确定,将降低所述生物分子水平的所述测试试剂鉴定为对所述疾病具有治疗功效的候选物。

在该方面中描述的嵌合分子根据本申请的前述方面进行。

如本文所用,术语“参考水平”或“对照水平”是指出于比较目的可能感兴趣的生物标志物(或生物分子、配体、底物等)的量或浓度。在一些实施例中,参考水平可以是至少一种生物标志物的水平,其表达为取自健康受试者的对照群体或取自具有蛋白质或底物异常表达的患病群体的至少一种生物标志物的水平的平均值。在另一个实施例中,参考水平可以是同一受试者中在较早时间,即在本测定之前的至少一种生物标志物的水平。在另一个实施例中,参考水平可以是在接受治疗方案之前受试者中至少一种生物标志物的水平。

如本文所用,术语“样品”可包括但不限于身体组织或体液,例如血液(或血液馏分,例如血浆或血清)、淋巴、粘液、眼泪、唾液、痰、尿、精液、粪便、CSF、腹水或全血,并且包括身体组织的活检样品。样品还可以包括从来自受试者的样品生长的微生物的体外培养物。样品可以从任何受试者获得,例如患有或怀疑患有以疾病为特征的疾病或病况的受试者/患者。

如本文所用,术语“筛选”是指确定嵌合分子或组合物是否具有预防或减缓(减轻)本文所述的靶向病理状况,即以特定疾病中的缺陷为特征的疾病或病况的能力或特征。

如本文所用,术语嵌合分子或组合物的“有效量”或“治疗有效量”是足以实现所需治疗和/或预防效果的量,例如,导致与所治疗疾病相关的症状的预防或减少的量。给予受试者的化合物的量将取决于疾病的类型和严重程度以及个体的特征,例如一般健康、年龄、性别、体重和对药物的耐受性。它还将取决于疾病的程度、严重性或阶段。技术人员将能够根据这些和其他因素确定适当的剂量。

如本文所用,术语“酶联免疫吸附测定”(ELISA)包括基于抗体的测定,其中通过产生可检测信号的酶反应完成目标抗原的检测。ELISA可以竞争性或非竞争性形式进行。ELISA还包括双位点或“夹心”测定,其中使用两种针对抗原的抗体,一种抗体捕获抗原,一种用酶或其他可检测标记物标记以检测捕获的抗体-抗原复合物。在典型的双位点ELISA中,抗原具有至少一个未标记抗体和酶联抗体可以高亲和力结合的表位。因此,可以使用酶联抗体亲和捕获和检测抗原。选择的典型的酶包括碱性磷酸酶或辣根过氧化物酶,当与适当的底物接触时,这两种酶都产生可检测的产物。

如本文所用,术语“表位”包括能够特异性结合抗体的蛋白质决定簇。表位通常由分子的化学活性表面基团如氨基酸或糖侧链组成,并且通常具有特定的三维结构特征以及特定的电荷特征。构象表位和非构象表位的区别在于在变性溶剂的存在下丧失与前者的结合,但不丧失与后者的结合。通常,表位将是形成底物的决定区,其可以被一个或多个靶结构域识别。

为了筛选具有表位的靶向结构域或底物,可以进行常规的交叉阻断测定,其例如描述于Antibodies,A Laboratory Manual,冷泉港实验室,Ed Harlow and David Lane(1988),其全部内容特此通过引用并入本文。该测定可用于确定靶结构域是否与不同的靶结构域、抗体、抗体片段等结合底物的相同位点或表位。或者或另外,表位作图可通过本领域已知的方法进行。例如,抗体序列可以被诱变,例如通过丙氨酸扫描诱变,以鉴定接触残基。在不同的方法中,对应于底物的不同区域的肽可以用于与测试靶结构域或与测试抗体和靶结构域或具有表征表位的抗体的竞争测定中。

如本文所用,术语“高变区”是指负责抗原结合的抗体的氨基酸残基。高变区通常包含来自“互补决定区”或“CDR”的氨基酸残基,例如在V

如本文所用,术语“分离的”或“纯化的”多肽、肽、分子或嵌合分子基本上不含来自衍生该药剂的细胞或组织来源的细胞材料或其他污染多肽,或基本上不含化学前体或化学合成的其他化学物质。例如,嵌合分子将不含会干扰此类分子预期功能、诊断或治疗用途的材料。除了嵌合分子、酶、激素和其他蛋白质和非蛋白质溶质所涵盖的材料之外,此类干扰材料还可能包括蛋白质或片段。

在一个实施例中,关于未患疾病的受试者的标准生物分子水平进行鉴定。在一些实施例中,还可以针对没有接触的生物分子水平进行鉴定。就此而言,可以使用对照水平与样品中生物分子的水平进行比较。在一些实施例中,对照水平是来自未患疾病的受试者的生物分子的水平。与从健康受试者获得的样品相比,从怀疑患有影响底物水平的疾病或病况的受试者获得的样品中的生物分子的过量表明在测试受试者中与生物分子相关的疾病或病况。

存在大量疾病,其中某些底物生物分子的过量程度已知可指示受试者是否患有疾病或可能发展疾病。参见例如,Anderson等人,“Discovering Robust Protein Biomarkersfor Disease from Relative Expression Reversals in 2-D DIGE Data,”Proteomics7:1197-1207(2007),其全部内容特此通过引用并入本文。与对照受试者相比,生物分子增加的病况的实例包括上述疾病。

因此,将本申请的嵌合分子和组合物施用于需要治疗的受试者。E3泛素连接酶如编码E3基序的E3基因产物如上所述,并且可用于本发明的筛选方法中以确定本文公开的嵌合分子的功效。在一些实施例中,进行合适的体外或体内测定以确定本申请的嵌合分子和组合物的作用以及是否指示施用以用于治疗。在用于人类受试者的测试之前,可以在合适的动物模型系统中测试用于治疗的组合物,所述动物模型系统包括但不限于大鼠、小鼠、鸡、牛、猴、兔等。类似地,对于体内测试,可以在施用于人类受试者之前使用本领域已知的任何动物模型系统。

可以采用本领域技术人员已知的使细胞、器官或组织与组合物接触的任何方法。体内方法通常包括向哺乳动物,合适地是人施用嵌合分子或组合物,例如上述那些。当在体内用于治疗时,如本文所述,将嵌合分子或组合物以有效量施用于受试者。可以根据本文所述方法开始时提出的经验变量确定结果。

体外方法通常包括测定嵌合分子或组合物(例如上述那些)对样品或提取物的作用。在一些实施例中,可通过评估对底物降解的影响,即嵌合分子和组合物在样品中施加表型变化的能力,来确定嵌合分子功效。此类方法包括但不限于免疫组织化学、免疫荧光、ELISPOT、ELISA或RIA。各种有用的免疫检测方法的步骤已经在科学文献中进行了描述,如例如Nakamura等人,Enzyme Immunoassays:Heterogeneous and Homogeneous Systems,Handbook of Experimental Immunology,Vol.1:Immunochemistry 27.1-27.20(1986),每个文献的全部内容并且特别是关于免疫检测方法的教导均通过引用并入本文。

从最简单和直接的意义上讲,免疫测定是涉及抗体与抗原之间结合的结合测定。免疫测定的许多类型和形式是已知的,并且都适用于检测公开的生物标志物。免疫测定的实例是酶联免疫吸附测定(ELISA)、酶联免疫斑点测定(ELISPOT)、放射免疫测定(RIA)、放射免疫沉淀测定(RIPA)、免疫珠捕获测定、蛋白质印迹、斑点印迹、凝胶迁移测定、流式细胞术、免疫组织化学、荧光显微法、蛋白质阵列、多重珠阵列、磁捕获、体内成像、荧光共振能量转移(FRET)和光漂白后的荧光恢复/定位(FRAP/FLAP)。

一般来说,免疫测定包括使怀疑含有目标分子(例如所公开的生物分子)的样品与目标分子的抗体接触,或使目标分子的抗体(例如所公开的生物分子的抗体)与可视情况在有效允许形成免疫复合物的条件下与抗体结合的分子接触。在这方面,技术人员将能够评估给定样品中特定生物分子的存在和/或水平。随后,将本申请的嵌合分子组合物加入测定中。此后,可以使用本文所述的免疫测定来评估生物分子的水平,即其存在或水平,以确定治疗后的表型效应。

免疫测定可以包括用于检测或定量样品中目标生物分子的量的方法,该方法通常涉及检测或定量结合过程中形成的任何免疫复合物。通常,免疫复合物形成的检测在本领域中是众所周知的,并且可以通过应用多种方法来实现。这些方法通常基于标记物或标志物的检测,例如任何放射性、荧光、生物或酶标签或任何其他已知标记物。参见,例如,美国专利3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149和4,366,241,每个专利的全部内容并且特别是关于免疫检测方法和标记物的教导均通过引用并入本文。

如上所述,本申请的治疗方法具有连接至靶向结构域的泛素区域。在一些实施例中,如上所述,靶向结构域结合细胞内生物分子。同样,本申请的治疗方法采用足够长度的多肽接头,以防止靶向结构域和底物之间结合的空间破坏。在一些实施例中,生物分子与如上所述的疾病有关。

在一个实施例中,该方法用多种测试剂进行。

本申请的第七方面涉及一种筛选疾病生物标志物的方法。该方法包括提供表达一种或多种配体的患病细胞的样品;提供多个嵌合分子,其包含(i)包含E3泛素连接酶(E3)基序的降解结构域,(ii)能够特异性地将所述降解结构域引导至所述一种或多种配体的靶向结构域,其中所述靶向结构域与所述降解结构域异源,和(iii)将所述降解结构域与所述靶向结构域偶联的接头;使样品在有效使患病细胞在不存在嵌合分子的情况下不能增殖的条件下与多个嵌合分子接触;确定哪些嵌合分子允许患病细胞增殖;和基于所述确定将与嵌合分子结合并允许患病细胞增殖的配体鉴定为疾病的生物标志物。

在该方面中描述的嵌合分子根据本申请的前述方面进行。

如本文所用,术语“生物标志物”或“生物分子”或“分子”是指与取自对照受试者或对照受试者群体的比较样品相比,不同地存在于取自患有疾病的患者的样品中的多肽(具有特定表达水平)。

如本文所用,术语“配体”或“底物”是指能够与蛋白质、分子、嵌合分子、配体(二聚体)、底物(二聚体)、第二底物、第二配体、靶结构域、区域、部分及其片段、泛素或E3基序区域、结构域或其部分、生物分子、生物标志物等结合并形成瞬时或稳定复合物以用于生物学目的的物质,例如在酶促反应过程中与酶相互作用的底物。配体还包括通过分子间力如离子键、氢键和范德华力与靶蛋白上的位点结合的信号触发分子。在一些实施例中,底物结合配体和/或配体结合底物。

许多(如果不是全部)疾病是复杂的和多因素的。例如,当考虑神经变性时,在病理表现之前会发生大量的神经元细胞丢失。改善症状的辅助疗法进一步阻碍了筛选和开发治疗神经退行性疾病的药物。因此,靶标检测被先前的治疗性施用所模糊,这又可能减慢疾病进程并进一步混淆治疗方案。以此方式,本申请提供了通过采用表型筛选分析来阐明疾病生物标志物的新的、创造性的筛选方法。参见例如,Pruss,R.M.,“Phenotypic ScreeningStrategies for Neurodegenerative Diseases:A Pathway to Discover Novel DrugCandidates and Potential Disease Targets or Mechanisms.”CNS&NeurologicalDisorders-Drug Targets,9,693-700(2010),其全部内容特此通过引用并入。

表型筛选涉及使用来自患有疾病的患者的合适样品,例如细胞、细胞提取物、神经元、组织等的类别,并使该样品经受本文所述的一种或多种嵌合分子。随后,根据患病细胞的存活力、增殖、细胞过程和/或表型特征,例如,收缩、膜电位丧失、形态变化等筛选样品。图像分析软件允许细胞体或其他物体凭经验评估结果。来自筛选的命中物可以通过刺激存活途径、模拟营养因子或抑制死亡信号来维持细胞存活。然后,可以将靶向二级测定中的较高含量筛选和分析用于鉴定靶标和有希望的命中物的作用机理。

可以进行生物标志物筛选分析的疾病病况的实例包括上述疾病。在一些实施例中,筛选疾病生物标志物的方法包括多个分子,其中所述分子具有如上所述的E3基序。在一些实施例中,生物标志物筛选方法包括具有如上所述的靶向结构域的分子。本申请的筛选方法使用足够长度的多肽接头,以防止靶向结构域与生物分子和/或配体之间结合的空间破坏。

一旦确定嵌合分子可提供治疗指示,就使用靶向结构域区域(或整个嵌合分子)从样品中免疫沉淀生物标志物以分离该生物标志物,然后使用本领域众所周知的方法进行鉴定。生物标志物的分离和纯化方法包括但不限于例如使用尺寸排阻或基于亲和力的柱树脂的HPLC或FPLC色谱法。参见例如Sambrook等人1989,冷泉港实验室出版社,其全部内容特此通过引用并入本文。

本申请的多肽的活性片段、衍生物或变体可以通过例如缺失或添加对多肽的性质、二级结构和生物学活性具有最小影响的氨基酸来识别。例如,多肽可以在蛋白质的N-末端与信号(或前导)序列连接,所述信号(或前导)序列共翻译或翻译后指导蛋白质的亚细胞或细胞外定位。

然后可以使用本领域已知的技术阐明生物标志物。在一些实施例中,使用MALDI-TOF、质谱分析法、质谱法、蛋白质测序、抗体相互作用、蛋白质印迹、免疫测定、ELISA、色谱技术、反向蛋白质组学、免疫沉淀、放射免疫测定和免疫荧光或其任何组合来进行生物标志物的鉴定。

用于研究和鉴定蛋白质的合适的质谱技术包括激光解吸电离质谱和电喷雾电离质谱。在激光解吸电离(LDI)质谱(MS)类别中,可以使用基质辅助LDI(MALDI)和表面辅助LDI(SELDI)飞行时间(TOF)MS。SELDI TOF-MS特别适合用于本方法,因为它为分析、定量低丰度蛋白(pg-ng/ml)和高可重复性的结果提供了埃摩尔灵敏度。

本文所述的方法可以例如通过利用预包装的试剂盒来进行,所述试剂盒包含至少一种试剂,例如本文所述的嵌合分子或组合物,其可以方便地用于例如临床环境中以治疗表现出涉及过度表达的底物、生物分子或生物标志物的疾病或疾患的症状的受试者。此外,其中可表达本申请的嵌合分子的任何细胞类型或组织适用于本文所述的试剂盒。

在本申请的另一个方面是使用本申请的嵌合分子和组合物的试剂盒或试剂系统。此类试剂盒将含有试剂组合,其包括根据本文公开的方法进行测定所需的特定要素。试剂系统以商业包装形式,作为组合物或混合物存在,其中在测试装置构造中将允许试剂的相容性,或更典型地作为测试试剂盒,即,装有必要试剂的一个或多个容器、装置等的包装组合,并且优选包括用于进行测定的书面说明书。试剂盒可以适用于任何构造的测定,并且可以包括用于进行本文所述的各种测定形式中的任一种的组合物。

可用于所公开方法的试剂可储存在溶液中或可冻干。当冻干时,一些或所有试剂可以容易地储存在微量滴定板孔中,以在重构后容易使用。预期本领域已知的用于冻干试剂的任何方法将适合于制备可用于所公开方法的干燥试剂。

本申请的范围内还包括包含本申请的嵌合分子/组合物和第二试剂以及使用说明书的试剂盒。试剂盒可用于检测生物样品中底物的存在,所述生物样品为例如任何体液,包括但不限于例如血清、血浆、淋巴、囊液、尿、粪便、脑脊液、腹水或血液,并且包括身体组织的活检样品。例如,试剂盒可包含一种或多种嵌合分子,其由与能够结合生物样品中底物的靶向结构域连接的E3基序泛素区域构成。

实例

提供以下实例以例示本申请的实施例,但是它们绝不旨在限制其范围。

包括以下实例以说明本申请的说明性实施例。本领域技术人员应当理解,以下实例中公开的技术代表发明人发现的在本申请的实践中良好发挥作用的技术,并且因此可以认为构成其实施的优选方式。然而,根据本申请,本领域技术人员应当理解,在不脱离本申请的精神和范围的情况下可以在所公开的具体实施例中进行多种改变,并且仍可获得相同或相似的结果。

实验方法

质粒。表1提供了本研究中使用的所有质粒。

表1.本研究中使用的菌株、细胞系和质粒。

大肠杆菌菌株DH5α用于构建和增殖所有质粒。为了构建pcDNA3-EGFP,使用引入5'Kozak序列的引物PCR扩增EGFP,并将得到的PCR产物连接到pcDNA3中。通过使用重叠延伸PCR,利用引入5'Kozak序列的引物进行ERK2和EGFP的基因组装,随后连接到pCDH1来产生质粒pCDH1-ERK2-EGFP。通过用加入5'Kozak序列和3'SV40 NLS序列的引物PCR扩增EGFP,然后将PCR产物连接到pcDNA3中,产生质粒pcDNA3-EGFP-NLS。通过用5'Kozak序列PCR扩增SHP2,然后连接到pcDNA3-EGFP中,产生质粒pcDNA3-SHP2-EGFP。通过PCR扩增来自质粒mEGFP-HRas G12V的EGFP-HRas

为了产生GFP-定向的uAb,通过使用在上游引入Kozak、6x-FIis和FLAG序列的引物PCR扩增来自pHFT2-GS2的GS2(Koide等人,“Teaching an Old Scaffold New Tricks:Monobodies Constructed Using Alternative Surfaces of the FN3 Scaffold,”J.Mol.Biol.415(2):393-405(2012),其全部内容特此通过引用并入本文),然后将其连接到pcDNA3中,使得BamHI和EcoRI限制性位点在GS2的上游可用以产生N-末端融合,来产生质粒pcDNA3-HF-GS2。对于C-末端融合,通过用引入上游Kozak序列和下游NheI和SbfI限制性位点的引物PCR扩增GS2,然后连接到pcDNA3中,产生质粒pcDNA3-GS2-FH。用引入NheI和SbfI位点的引物PCR扩增编码AvrPtoB、IpaH9.8、NleG2-3、NleG5-l、NleL、SlrP、SopA、SPOP、SspH1、SspH2和XopL的基因,然后将得到的PCR产物连接到pcDNA3-GS2-FH中。用引入BamHI和EcoRI位点的引物PCR扩增编码LegAU13、LegU1和SidC的基因,然后将得到的PCR产物连接到pcDNA3-HF-GS2中。通过使用引入上游HindIII和Kozak序列和下游NheI位点的引物PCR扩增来自pHFT2-GS2的GS2,然后连接至pcDNA3-R4-CHIPΔTPR代替scFvR4,产生质粒pcDNA3-GS2-CHIP。通过用引入HindII和XhoI(VHL)或BamHI和XhoI(βTrCP)位点的引物PCR扩增编码VHL和βTrCP的基因,之后将所得PCR产物连接在pcDNA3-NSlmb-GS2中代替NSlmb来产生质粒pcDNA3-VHL-GS2和pcDNA3-βTrCP-GS2。通过pcDNA3-GS2-IpaH9.8的定点诱变产生质粒pcDNA3-GS2-IpaH9.8

通过用引入NcoI和NotI(GS2-IpaH9.8)或NheI和NotI(IpaH9.8ΔLRR)位点的引物分别PCR扩增全长GS2-IpaH9.8和截短的IpaH9.8ΔLRR,然后将得到的PCR产物连接到pET24d(+),产生质粒pET24d-GS2-IpaH9.8和pET24d-IpaH9.8ΔLRR。使用引入上游NcoI位点和下游FLAG、6x-His和HindIII序列的引物,通过PCR扩增来自pHFT2-GS2的GS2,之后将所得PCR产物连接到pET28a(+)中,产生质粒pET28a-GS2。通过用引入EcoRV和HindIII位点的引物PCR扩增来自pcDNA3-GS2-IpaH9.8

细胞系、培养和转染。本研究中使用的所有细胞系均在表1中提供。简而言之,HEK293T和HeLa细胞获自ATCC,HeLa H2B-EGFP细胞由Elena Nigg慷慨提供,MCF10A rtTA细胞由Matthew Paszek慷慨提供,在含有4.5g/L葡萄糖和L-谷氨酰胺(VWR)且补充有10%FetalCloneI(VWR)和1%青霉素-链霉素-两性霉素B(赛默飞世尔(ThermoFisher))的DMEM中培养HEK293T、HeLa和HeLa H2B-EGFP细胞。在补充有5%马血清(赛默飞世尔)、20ng/mLEGF(派普泰克(Peprotech))、0.5mg/mL氢化可的松(西格玛(Sigma))、100ng/mL霍乱毒素(西格玛)、10μg/mL胰岛素(西格玛)和1%青霉素-链霉素-两性霉素B(赛默飞世尔)的DMEM/F12培养基(赛默飞世尔)中生长MCF-10a细胞。将所有细胞维持在37℃、5%CO

使用Nucleofection Kit V(瑞士龙沙(Lonza))和HyPBASE(一种用于PiggyBac转座酶的高活性形式的表达质粒)产生稳定的MCF10A rtTA细胞系。进行MCF10A rtTA细胞的转座以产生下列稳定的系:MCF10A EGFP-HRas

通过慢病毒转化产生表达EGFP、EGFP-HRas

蛋白质印迹分析。将HEK293T细胞以10,000个细胞/cm

流式细胞术分析。将细胞以10,000个细胞/cm

显微镜检查。将细胞以10,000个细胞/cm

蛋白质表达和纯化。通过使含有编码所需蛋白质的基于pET28a的质粒的大肠杆菌BL21(DE3)细胞或含有基于pTriEx-3的质粒的Rosetta(DE3)细胞在37℃下在200mL的Luria-Bertani(LB)培养基中生长来获得纯化的蛋白质。当培养物密度(Abs

ELISA。在4℃下用在0.05M NaCO

阳离子多肽的合成与表征。如本组研究人员最近所述,根据Uchida和同事的改进程序合成N4(TEP)多胺(Li等人,“Polyamine-Mediated Stoichiometric Assembly ofRibonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017),其全部内容特此通过引用并入本文)。Uchida等人,“ModulatedProtonation of Side Chain Aminoethylene Repeats in N-SubstitutedPolyaspartamides Promotes mRNA Transfection,”J.Amer.Chem.Soc.136(35):12396-405(2014),其全部内容特此通过引用并入本文。简而言之,在搅拌下向聚(β-苄基-L-天门冬氨酸盐)在N-甲基-2-吡咯烷酮(NMP)(西格玛)中的冷却溶液(2mL)中逐滴加入50当量的用NMP稀释两倍的四亚乙基五胺(西格玛)。在0℃下搅拌2小时后,在搅拌下通过逐滴加入冷的6N HCl将pH调节至1。将所得溶液从再生纤维素膜袋(仕必纯(Spectrum Laboratories),1kDa MWCO)中针对0.01N HCl透析,然后针对蒸馏水透析,冷冻并冻干以得到白色粉末。在25℃下使用Bruker Avance 400MHz NMR光谱仪在氘化氧(剑桥同位素实验室(CambridgeIsotope Laboratories))中通过

通过体外转录制备mRNA。通过用XbaI和NotI位点替换GFP片段,将编码uAb的cDNA克隆到pGEM4Z/GFP/A64中。另外,使用NotI和EcoRI将人α-球蛋白3'UTR序列置于cDNA和聚A尾之间,以改善mRNA翻译。用SpeI进行线性化,然后用HiScribe

纳米复合物转染。将多胺溶解在10mM HEPES缓冲液(pH 7.4)中。对于96孔板的每个孔,在室温下将在5μl OptiMEM(赛默飞世尔)中稀释的200ng mRNA与5μl含PABP的OptiMEM(mRNA:PABP重量比=1:5)混合10分钟。然后,加入5μl含多胺的OptiMEM并在室温下孵育15分钟,然后转染到稳定表达d2EGFP的HEK293T中。调整多胺以达到50:1(N/P)的比例以进行转染。在转染后的不同时间点通过BD FACSCelesta(贝迪医疗(Becton Dickinson))测量EGFP表达。

动物实验。根据既定的机构指南和MIT比较医学系批准的方案,在无病原体的条件下进行小鼠护理和实验程序。C57BL/6-Tg(UBC-GFP)30Scha/J小鼠购自杰克逊实验室(Jackson Laboratory)。在麻醉下,对8-10周龄小鼠的耳朵皮下注射在25μl OptiMEM体积中的用N4(TEP)多胺包装的5μg mRNA和25μg PABP。用安装在不透光样品盒(精诺真(Xenogen))中的CCD相机进行荧光成像。曝光时间为1秒。信号的成像和定量由LivingImage采集和分析软件(精诺真)控制。

实例1-工程化的IpaH9.8有效沉默哺乳动物细胞中的GFP

为了确定是否可以重新设计来自致病菌的E3泛素连接酶模拟物以沉默非天然靶标,重点是一组14种候选酶,这些酶代表了迄今为止在细菌中发现的主要E3类别(下文表2)。Maculins等人,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons ofInvasion.Cell Res.26(4):499-5l0(2016)和Lin等人,“Exploitation of the Host CellUbiquitin Machinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017),其全部内容特此通过引用并入本文。

表2.在本研究中评估的细菌E3泛素连接酶。

表2中的缩写:NEL,新型E3连接酶;HECT,与E6AP C末端同源;SCF,Skp1/Cdc53或Cullen-1/F-box蛋白;SPOP,斑点型POZ蛋白;VHL,希佩尔-林道;ECV,延伸蛋白B/C,卡伦-2,VHL

[12]Janjusevic等人,“A Bacterial Inhibitor of Host Programmed CellDeath Defenses is an E3 ubiquitin ligase,”Science 311:222-26(2006),其全部内容特此通过引用并入本文

[13]Zhou等人,“Harnessing the Ubiquitination Machinery to Target theDegradation of Specific Cellular Proteins,”Mol.Cell 6:751-56(2000),其全部内容特此通过引用并入本文

[14]Portnoff等人,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases EndowedWith Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289:7844-55(2014),其全部内容特此通过引用并入本文

[15]Ashida等人,“Shigella Chromosomal IpaH Proteins are Secreted Viathe Type III Secretion System and act as effectors,”Mol Microbiol.63:680-93(2007),其全部内容特此通过引用并入本文

[16]Okuda等人Shigella Effector IpaH9.8 Binds to a Splicing FactorU2AF(35)to Modulate Host Immune Responses,”Biochem.Biophys.Res.Commun.333:531-39(2005),其全部内容特此通过引用并入本文

[17]Ensminger,A.W.,“RR E3 Ubiquitin Ligase Activity and Targeting ofBAT3 by Multiple Legionella pneumophila Translocated Substrates,”Infect.Immun.78:3905-19(2010),其全部内容特此通过引用并入本文

[18]Quaile等人,“Molecular Characterization of LubX:FunctionalDivergence of the U-Box Fold by Legionella pneumophila,”Structure 23:1459-69(2015),其全部内容特此通过引用并入本文

[19]Wu等人,“NleG Type 3Effectors From Enterohaemorrhagic Escherichiacoli are U-Box E3 Ubiquitin Ligases,”PLoS Pathog.6:el000960(2010),其全部内容特此通过引用并入本文

[20]Lin等人,“Biochemical and Structural Studies of a HECT-likeUbiquitin Ligase From Escherichia coli Ol57:H7,”J.Biol.Chem.286:441-49(2011),其全部内容特此通过引用并入本文

[21]Hsu等人,“The Legionella Effector SidC Defines a Unique Family ofUbiquitin Ligases Important for Bacterial Phagosomal Remodeling,”Proc.Natl.Acad.Sci.USA 111:10538-43(2014),其全部内容特此通过引用并入本文

[22]Zouhir等人,“The Structure of the Slrp-Trxl Complex Sheds Light onthe Autoinhibition Mechanism of the Type III Secretion System Effectors ofthe NEL family,”Biochem.J.464:135-44(2014),其全部内容特此通过引用并入本文

[23]Diao等人,“Crystal Structure of SopA,a Salmonella Effector ProteinMimicking a Eukaryotic Ubiquitin Ligase,”Nat.Struct.Mol.Biol.15:65-70(2008),其全部内容特此通过引用并入本文

[24]Shin等人,“Nanobody-Targeted E3-Ubiquitin Ligase Complex DegradesNuclear Proteins,”Sci.Rep.5:14269(2015),其全部内容特此通过引用并入本文

[25]Keszei等人,“Structure of an SspH1-PKN1 Complex Reveals the Basisfor Host Substrate Recognition and Mechanism of Activation for a Bacterial E3Ubiquitin Ligase,”Mol.Cell Biol.34:362-73(2014),其全部内容特此通过引用并入本文

[26]Bhavsar等人,“The Salmonella Type III Effector SspH2 SpecificallyExploits the NLR Co-Chaperone Activity of SGT1 to Subvert Immunity,”PLoSPathog.9:el0035l8(2013),其全部内容特此通过引用并入本文

[27]Maniaci等人,“Homo-PROTACs:Bivalent Small-Molecule Dimerizers ofthe VHL E3 Ubiquitin Ligase to Induce Self-Degradation,”Nat.Commun.8:830(2017),其全部内容特此通过引用并入本文

[28]Singer等人,“A Pathogen Type III Effector With a Novel E3Ubiquitin Ligase Architecture,”PLoS Pathog.9:el003121(2013),其全部内容特此通过引用并入本文

该组包括折叠与真核生物E3相似的E3模拟物,例如HECT型、RING或U-box(RING/U-box)型和F-box结构域,以及折叠不同于任何其他真核生物E3的非常规E3,例如新型E3连接酶(NEL)、含XL-box和SidC。通常,通过从每个E3模拟物中去除天然底物结合结构域并用合成的结合蛋白代替它(图1A)来工程化uAb,类似于先前基于人CHIP设计的uAb。Portnoff等人,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed With UnnaturalSubstrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014),其全部内容特此通过引用并入本文。例如,弗氏志贺氏菌IpaH9.8由具有8个20个残基的富亮氨酸重复序列(LRR)的N末端结构域组成,所述LRR介导与天然底物蛋白如NF-κB基本调节剂(NEMO)(Ashida等人,“A Bacterial E3 Ubiquitin Ligase IpaH9.8Targets NEMO/DCKgamma to Dampen the Host NF-KapPab-Mediated InflammatoryResponse,”Nat Cell Biol.l2(1):66-73,同上,pp.1-9(2010),其全部内容特此通过引用并入本文)和鸟苷酸结合蛋白(Li等人,“Ubiquitination and Degradation of GBPs by aShigella Effector to Suppress Host Defence,”Nature 551(7680):378-83(2017),其全部内容特此通过引用并入)的结合和特异性,而C末端结构域则采用了新型E3泛素连接酶结构。Zhu等人,“Structure of a Shigella Effector Reveals a New Class ofUbiquitin Ligases,”Nat.Struct.Mol.Biol.15(12):1302-08(2008)和Singer等人,“APathogen Type III Effector With a Novel E3 Ubiquitin Ligase Architecture,”PLoS Pathogens 9(1):el003121(2013),其全部内容特此通过引用并入本文。因此,IpaH9.8的N末端LRR结构域被GS2替代,GS2是一种以纳摩尔亲和力(K

鉴于这种强大的沉默活性,注意力集中在GS2-IpaH9.8上。在表达这种嵌合体的细胞中,EGFP的消除是有效的,去除了高达90%的荧光活性(图2A和2B),并且在细胞裂解物中没有可检测的EGFP蛋白(图2C)。重要的是,当IpaH9.8的催化半胱氨酸(Rohde等人,“TypeIII Secretion Effectors of the IpaH Family are E3 Ubiquitin Ligases,”CellHost Microbe 1(1):77-83(2007),其全部内容特此通过引用并入本文)突变为丙氨酸(GS2-IpaH9.8

为了衡量本工程化细菌连接酶的效力,将由GS2-IpaH9.8催化的GFP沉默活性与先前已被重新配置为靶向蛋白水解的基于真核生物E3机制的其他合成连接酶的活性相比。Zhou等人,“Harnessing the Ubiquitination Machinery to Target the Degradationof Specific Cellular Proteins,”Mol.Cell 6(3):751-56(2000);Zhang等人,“Exploring the Functional Complexity of Cellular Proteins by ProteinKnockout,”Proc.Natl.Acad.Sci.USA 100(24):14127-32(2003);Hatakeyama等人,“Targeted Destruction of C-Myc by an Engineered Ubiquitin Ligase SuppressesCell Transformation and Tumor Formation,”Cancer Res.65(17):7874-79(2005);Ma等人,“Targeted Degradation of KRAS by an Engineered Ubiquitin Ligase SuppressesPancreatic Cancer Cell Growth In Vitro and In Vivo”Mol.Cancer Ther.12(3):286-94(2013);Kong等人,“Engineering a Single Ubiquitin Ligase for the SelectiveDegradation of all Activated ErbB Receptor Tyrosine Kinases,”Oncogene 33(8):986-95(2014);Caussinus等人,“Fluorescent Fusion Protein Knockout Mediated byAnti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher等人,“Targeting Endogenous Proteins For Degradation Through the Affinity-DirectedProtein Missile System,”Open Biol.7(5):170066(2017);Fulcher等人,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin等人,“Nanobody-Targeted E3-Ubiquitin Ligase Complex DegradesNuclear Proteins,”Sci.Rep.5:14269(2015);和Kanner等人,“Sculpting Ion ChannelFunctional Expression with Engineered Ubiquitin Ligases,”Elife 6:e29744(2017),其全部内容特此通过引用并入本文。具体而言,用GS2抗体类似物替换来自人类的几种真核生物E3泛素连接酶的天然底物结合结构域,包括Hsc70相互作用蛋白(CHIP)、斑点型POZ蛋白(SPOP)、β转导素重复序列包含蛋白(βTrCP)和希佩尔-林道蛋白(VHL)以及果蝇额外肢体(supernumerary limbs(Slmb))蛋白的羧基末端,产生一组与GS2-IpaH9.8同源的合成连接酶。当在哺乳动物细胞中将所得的一组GFP特异的uAb与EGFP瞬时共表达时,其所有均能够可测量地降低EGFP水平,但在该测试的条件下,每种的沉默活性相对无效(约25-45%)(图1C和图6A-6B),使人联想到先前的Slmb-纳米抗体嵌合体在降低未融合的GFP水平方面同样无效的结果。Caussinus等人,“Fluorescent Fusion Protein KnockoutMediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011),其全部内容特此通过引用并入本文。此处观察到的Slmb-GS2的弱EGFP敲低实际上是先前用在Slmb与GFP特异性VHH纳米抗体之间的嵌合体cAbGFP4获得的结果的改进,cAbGFP4不能促进未融合的GFP的降解。Caussinus等人,“Fluorescent Fusion Protein Knockout Mediated byAnti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011),其全部内容特此通过引用并入本文。然而,应注意Slmb-cAbGFP4融合体消除了较大的GFP融合蛋白相关的荧光,表明本文报道的数据不一定指示uAb功能障碍,而是可以反映底物偏好/相容性或泛素修饰程度的差异。无论如何,涉及真核生物E3的工程化嵌合体无一显示GS2-IpaH9.8的效力和稳健性,其可重复地降低90-95%的细胞荧光。

实例2-GS2-IpaH9.8降解大范围的底物蛋白。

为了更深入地研究底物相容性问题,测试了GS2-IpaH9.8降解一系列不同底物的能力。多年来,越来越多的GFP衍生的荧光蛋白(FP)已经被开发和优化,提供了用于生物成像的新工具的多样化集合。Tsien,R.Y.,“The Green Fluorescent Protein,”Ann.Rev.Biochem.67:509-44(1998)和Shaner等人,“A Guide to Choosing FluorescentProteins,”Nat.Methods 2(12):905-09(2005),其全部内容特此通过引用并入本文。为了确定不同的FP靶可以降解的程度,GS2-IpaH9.8在哺乳动物细胞中与单体形式的Emerald、Venus和Cerulean以及增强的青色荧光蛋白(ECFP)瞬时共表达。大约65-85%的与每个FP相关的细胞荧光活性被GS2-IpaH9.8消除,而结构上不相关的mCherry蛋白不被GS2-IpaH9.8靶向,预期GS2对GFP折叠具有特异性(图8A)。有趣地是,超折叠GFP(sfGFP,一种快速折叠和稳健稳定的EGFP突变体)的荧光活性不受GS2-IpaH9.8影响,这与sfGFP对蛋白酶体降解有抗性的最近发现一致。Khmelinskii等人,“Incomplete Proteasomal Degradation ofGreen Fluorescent Proteins in the Context of Tandem Fluorescent ProteinTimers,”Mol.Biol.Cell 27(2):360-70(2016),其全部内容特此通过引用并入本文。

受到GS2-IpaH9.8降解不同FP的能力的促进,接下来评估GS2-IpaH9.8降解结构不同的FP标记的底物蛋白的能力。GS2-IpaH9.8熟练降解了15种独特的靶蛋白,它们的分子量(27-179kDa)和亚细胞定位(即细胞质、细胞核、膜相关和跨膜)不同(图3A和图8B)。例如,GS2-IpaH9.8引发80-92%的与FP融合相关的荧光活性降解,涉及胞质蛋白α-肌动蛋白、α-突触核蛋白(α-syn)、细胞外信号调节激酶2(ERK2)、黏着斑激酶(FAR)、F-tractin、桩蛋白(PXN)和黏着斑蛋白(VCL),如通过流式细胞术分析所测定的(图3A和图8B)。对于以下观察到类似的稳健沉默:核靶向FP融合体,其涉及组蛋白H2B和源自SV40大T-抗原的核定位信号(NLS);膜相关FP融合体,其涉及携带致癌G12V突变(HRas

实例3-GS2-IpaH9.8介导的蛋白质组编辑是灵活的和模块化的。

uAb的有吸引力的特征是它们的高度模块化结构-E3催化结构域和合成结合蛋白结构域可以互换以重新编程活性和特异性。实际上,上述结果揭示了不同的细菌和真核生物E3结构域可嵌合以形成功能性uAb的容易度。为了研究合成的结合蛋白结构域在基于IpaH9.8的uAb中的可互换性,首先用其他高亲和性GFP结合蛋白如FN3抗体类似物GS5(K

接下来,研究了IpaH9.8催化结构域与两种不同的FN3抗体类似物的相容性:NSa5对SHP2的Src-同源2(SH2)结构域具有特异性(Sha等人,“Dissection of the BCR-ABLSignaling Network Using Highly Specific Monobody Inhibitors to the SHP2 SH2Domains,”Proc.Natl.Acad.Sci.USA 110(37):14924-29(2013),其全部内容特此通过引用并入本文),并且RasInII对HRas、KRas和G12V突变体中的每一个具有特异性(Cetin等人,“Raslns:Genetically Encoded Intrabodies of Activated Ras Proteins,”J.Mol.Biol.429(4):562-573(2017),其全部内容特此通过引用并入本文)。通过流式细胞术分析,分别测试所得NSa5-IpaH9.8和RasInII-IpaH9.8嵌合体沉默SHP2-EGFP和EGFP-HRas

在上述所有实验中,当瞬时表达GS2-IpaH9.8及其对应的靶标时,实现了有效的敲低。但是,由于实验时间长短、需要精确的表达谱或使用顽固的哺乳动物细胞系,因此瞬时表达并非总是一种选择。因此,为了证明GS2-IpaH9.8介导的沉默的灵活性,针对表达为稳定整合的转基因的靶蛋白评估降解活性。具体地,当GS2-IpaH9.8在稳定地共表达EGFP的细胞中瞬时表达时,荧光活性的降低实际上与对于瞬时表达的EGFP观察到的相同(图9B)。还对ERK2-EGFP、H2B-EGFP和EGFP-HRas

实例4-编码GS2-IpaH9.8的mRNA的递送使得能够在小鼠中进行蛋白质组编辑。

从治疗的角度来看,基于蛋白质的技术如uAb面临的最大挑战之一是细胞内递送。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014),其全部内容特此通过引用并入本文。本小组的研究人员先前显示,由含有聚A尾的合成mRNA、PABP和生物相容性阳离子多肽构成的共组装纳米复合物(图5A)在体外和小鼠中均大大增强了mRNA表达。Li等人,“Polyamine-Mediated Stoichiometric Assembly ofRibonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017),其全部内容特此通过引用并入本文。在此,假设将GS2-IpaH9.8 mRNA/PABP纳米复合物递送至哺乳动物细胞将导致相比HEK293T细胞中相同的多胺单独进行mRNA转染产生明显更高的uAb表达,从而导致有效的蛋白质降解。为了测试该假设,首先通过定量d2EGFP的降解来体外评估GS2-IpaH9.8 mRNA/PABP纳米复合物递送,d2EGFP是一种不稳定的GFP变体,在HEK293T细胞中被表达为稳定的转基因。如所预期的,仅当阳离子纳米复合物含有活性的、靶标特异性的GS2-IpaH9.8 mRNA并且PABP稳健时,才实现了d2EGFP降解(图5B)。所有其他对照,包括催化失活的GS2-IpaH9.8

受这些结果的鼓励,接下来评估了uAb纳米复合物介导的体内递送和沉默活性。向在所有组织中组成型表达EGFP(Schaefer等人,“Observation of Antigen-Dependent CD8+T-Cell/Dendritic Cell Interactions In Vivo”Cell Immunol.214(2):110-22(2001),其全部内容特此通过引用并入本文)的转基因UBI-GFP/BL6小鼠的耳朵皮下注射GS2-IpaH9.8 mRNA/PABP纳米复合物。注意到尽管此小鼠品系普遍表达EGFP,但在被毛覆盖的区域中荧光被吸收且无法检测到。注射后24小时的荧光成像显示,接受GS2-IpaH9.8 mRNA/PABP纳米复合物注射的左耳中的EGFP荧光被强力消除,耳朵荧光降低了70%(图5C和5D)。与之形成鲜明对比的是,右耳中接受催化失活的GS2-IpaH9.8

实例5-实例1-4的讨论

Ubiquibody是一种较新的蛋白质组编辑方式,使得能够选择性去除体细胞中原本稳定的蛋白质(Portnoff等人,“Ubiquibodies,Synthetic E3 Ubiquitin LigasesEndowed With Unnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014),其全部内容特此通过引用并入本文),在基础研究、药物发现和治疗中具有潜在的应用。在本研究中,创造了一种新型的具有细菌E3泛素连接酶特征的uAb,从而为uAb的开发打开了一个尚未开发的泛素化活性来源之门。具体而言,评估了14种细菌E3连接酶,这些细菌E3连接酶属于不断增长的效应蛋白类别,其模拟宿主细胞E3连接酶以利用泛素化途径。Maculins等人,“Bacteria-Host Relationship:UbiquitinLigases as Weapons of Invasion.”Cell Res.26(4):499-510(2016)和Lin等人,“Exploitation of the Host Cell Ubiquitin Machinery by Microbial EffectorProteins,”J.Cell Sci.130(12):1985-96(2017),其全部内容特此通过引用并入本文。其中最引人注目的是来自弗氏志贺氏菌的IpaH9.8,当通过遗传融合的合成结合结构域直接导向靶底物时,它被证明是蛋白质转换的重要催化剂。发现这种沉默活性与底物的亚细胞定位(即细胞质、细胞核、质膜)或表达方式(即瞬时与稳定)无关。唯一具有类似功能的其他E3连接酶是在pWR100毒力质粒或染色体上在弗氏志贺氏菌中发现的IpaH9.8的同源物。Maculins等人,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons ofInvasion.”Cell Res.26(4):499-5l0(2016),其全部内容特此通过引用并入本文。这些酶的N末端催化NEL结构域具有惊人的同源性(99-100%),这说明了它们在uAb环境中的相似性能。因此,接下来功能最佳的细菌E3泛素连接酶是鼠伤寒沙门氏菌SspH1,它也是一种NEL型酶,与IpaH9.8的总体同一性为38%,并且在NEL结构域中的同一性为42%。Norkowski等人,The Species-Spanning Family of LPX-Motif Harbouring Effector Proteins,”Cell Microbiol.20(11):el2945(2018),其全部内容特此通过引用并入本文。还应该指出,在该测试的条件下,没有一个哺乳动物的E3泛素连接酶能够将EGFP水平降低到60%以下。尽管其原因尚不完全清楚,但鉴于先前报道的uAb格式的这些不同E3连接酶的成功敲低结果(Portnoff等人,“Ubiquibodies,Synthetic E3 Ubiquitin Ligases Endowed WithUnnatural Substrate Specificity for Targeted Protein Silencing,”J.Biol.Chem.289(11):7844-55(2014);Caussinus等人,“Fluorescent Fusion ProteinKnockout Mediated by Anti-GFP Nanobody,”Nat.Struct.Mol.Biol.19(1):117-21(2011);Fulcher等人,“Targeting Endogenous Proteins For Degradation Through theAffinity-Directed Protein Missile System,”Open Biol.7(5):170066(2017);Fulcher等人,“An Affinity-Directed Protein Missile System for Targeted Proteolysis,”Open Biol 6(10):160255(2016);Shin等人,“Nanobody-Targeted E3-Ubiquitin LigaseComplex Degrades Nuclear Proteins,”Sci.Rep.5:14269(2015);和Kanner等人,“Sculpting Ion Channel Functional Expression with Engineered UbiquitinLigases,”Elife 6:e29744(2017),所有文献的全部内容特此通过引用并入本文),表明EGFP可能代表这些工程化嵌合体的差底物。

虽然此处的工作主要集中在沉默FP和FP标记底物上,但仍设计了基于IpaH9.8的uAb,其有效降解包括HRas在内的疾病相关靶标,与KRas和NRas以及和SHP2(Ras/MAPK信号转导通路的调节剂)共同构成癌症中最常见的突变癌蛋白。重要的是,耗尽这些临床上重要的靶标以及所有其他FP融合体的能力用于突出uAb技术的非凡模块化。仅仅交换E3泛素连接酶的天然底物结合结构域可生成对不同底物蛋白具有特异性的定制uAb。有趣的是,志贺氏菌属已经形成一种类似的策略,用于在感染过程中推翻宿主防御,其中质粒和染色体编码的IpaH蛋白通过介导NF-κB相关蛋白的蛋白酶体降解在抑制宿主炎症反应中起关键作用。Ashida等人,“A Bacterial E3Ubiquitin Ligase IpaH9.8 Targets NEMO/IKKgammato Dampen the Host NF-KapPab-Mediated Inflammatory Response,”Nat Cell Biol.12(1):66-73,同上,pp.1-9(2010)和Ashida等人,“Shigella IpaH Family Effectors as aVersatile Model for Studying Pathogenic Bacteria,”Front CellInfect.Microbiol.5:100(2015),其全部内容特此通过引用并入本文。具体来说,通过采用不同的LRR结构域,它们仅共享约50%的相似度(Norkowski等人,“The Species-SpanningFamily of LPX-Motif Harboring Effector Proteins,”Cell Microbial.el 2945(2018),其全部内容特此通过引用并入本文),志贺氏菌能够将几乎相同的催化NEL结构域重定向到一系列宿主蛋白上(例如,对于IpaH9.8为NEMO、U2AF53;对于IpaH7.8为Glomulin;对于IpaH4.5为p65;对于IpaH2.5和IpaH1.4为HOIP;对于IpaH0722为TRAF2)。Maculins等人,“Bacteria-Host Relationship:Ubiquitin Ligases as Weapons of Invasion.CellRes.26(4):499-5l0(2016);Lin等人,“Exploitation of the Host Cell UbiquitinMachinery by Microbial Effector Proteins,”J.Cell Sci.130(12):1985-96(2017);和Ashida等人,“Shigella IpaH Family Effectors as a Versatile Model for StudyingPathogenic Bacteria,”Front Cell Infect.Microbiol.5:100(2015),所有文献的全部内容特此通过引用并入本文。据信泛素化这些结构多样的底物所需的固有构象灵活性有助于解释NEL基序对可定制靶标降解的显著能力。还应该指出,尽管此处的工作利用了先前确认的E3泛素连接酶,但可以使用类似的交换策略来创建基于GS2的uAb以鉴定新型E3连接酶。此类方法可以实现对E3连接酶的系统鉴定,这是一个重要的目标,考虑到人类基因组编码了600多种推定的E3连接酶(Metzger等人,“HECT and RING Finger Families of E3Ubiquitin Ligases at a Glance,”J.Cell Sci.125(Pt 3):531-37(2012),其全部内容特此通过引用并入本文),而细菌基因组可能编码了数百种其他酶,其中许多仍待确认是泛素转移的催化剂。

从药物开发的观点来看,传统上已经使用小分子抑制剂实现了基因产物的药理控制,所述小分子抑制剂靶向酶和受体,所述酶和受体具有定义明确的牢固结合小分子的疏水口袋。不幸的是,人类蛋白质组中的大多数(约80-85%)由难以治疗的靶标构成,例如转录因子、支架蛋白和非酶蛋白,其无法被药理学抑制并且因此视为“无成药性”。Crews,C.M.,“Targeting the Undruggable Proteome:The Small Molecules of My Dreams,”Chem.Biol.17(6):551 55(2010)和Arkin等人,“Small-Molecule Inhibitors ofProtein-Protein nteractions:Progressing Towards The Dream,”Nat.Rev.DrugDiscov.3(4):301-17(2004),其全部内容特此通过引用并入本文。作为替代方案,现在可以使用多种在DNA或RNA水平上沉默蛋白质的技术,例如CRISPR、RNAi、TALEN和ZFN,第一种RNAi疗法patisiran于2018年获得批准用于遗传性甲状腺素运载蛋白淀粉样变性。Adams等人,“Patisiran,An RNAi Therapeutic,For Hereditary Transthyretin Amyloidosis,”N.Engl.J.Med.379(1):11-21(2018),其全部内容特此通过引用并入本文。尽管如此,仍希望提供新的适应性技术,例如uAb和相关的PROTACs技术,其提供对蛋白质沉默的时间和翻译后控制,尤其是因为它们有潜力克服与基于核酸靶向的方法相关的某些局限性,例如不可逆性,缺乏时间控制力和脱靶效应。Deleavey等人,“Designing Chemically ModifiedOligonucleotides for Targeted Gene Silencing,”Chemistry&Biology 19(8):937-54(2012);Gaj等人,“TALEN,and CRISPR/Cas-Based Methods for Genome Engineering,”Trends Biotechnol.31(7):397-405(2013);Fu等人,“High-Frequency Off-TargetMutagenesis Induced by CRISPR-Cas Nucleases in Human Cells,”Nat.Biotechnol.31(9):822-26(2013);和Fedorov等人,“Off-Target Effects by siRNA Can Induce ToxicPhenotype,”RNA 12(7):1188-96(2006),其全部内容特此通过引用并入本文。原则上,uAb和PROTAC均可降解蛋白质,而不论其功能如何,包括目前无成药性的蛋白质组。此外,与传统的“基于占用率”的疗法不同,uAb和PROTAC具有催化作用,使其分别比构建它们的靶标结合抗体模拟物和小分子抑制剂显著更有效。

uAb的主要优势在于它们可以迅速适于命中各种细胞内靶标的容易度,这是由于它们的重组、模块化设计,这主要利用全部早已存在的合成结合蛋白以及系统的全基因组的努力来从头产生并验证针对人类蛋白质组的蛋白结合物。Colwill等人,“A Roadmap toGenerate Renewable Protein Binders to the Human Proteome,”Nat.Methods8(7):551—58(2011),其全部内容特此通过引用并入本文。因为获得以高特异性和亲和力结合靶标的抗体模拟物应该比获得具有相同特性的小分子更容易,所以使得定制设计的PROTAC可能是更具挑战性的任务。Osherovich,L.,“Degradation From Within,”Science-BusinessExchange 7:10-11(2014),其全部内容特此通过引用并入本文。尽管如此,PROTAC作为一种治疗方法是大有前途的,因为它基于具有大几率进入细胞的小分子。确实,令人印象深刻的临床前体外和体内数据推动了临床上可行的PROTAC的发展,2013年发现Arvinas和2016年发现C4 Therapeutics证明了这一点。但是,应该指出的是,将需要传统的药物化学方法来改善PROTAC的口服生物利用度、药代动力学以及吸收、分布、代谢、排泄和毒性(ADMET)特性。Neklesa等人,“Targeted Protein Degradation by PROTACs,”Pharmacol.Ther.17:4138-144(2017)和Deshaies,R.T,“Protein Degradation:Prime Time for PROTACs,”Nat.Chem.Biol.11(9):634-35(2015),其全部内容特此通过引用并入本文。与PROTAC相比,基于uAb的疗法的细胞内递送是一个更大的障碍,因为大多数球状蛋白药物由于其较大的尺寸和生化特性而不会自发穿过质膜。Osherovich,L.,“Degradation From Within,”Science-Business Exchange 7:10-11(2014),其全部内容特此通过引用并入本文。本文研究的一种可能的解决方案是使用mRNA作为体内治疗性基因产物的来源。近年来,通过结构修饰已大大克服了使用mRNA的障碍,包括其不稳定性和免疫原性,同时通过纳米技术和材料科学的进步解决了与递送和蛋白质表达谱有关的问题。Guan等人,“Nanotechnologiesin Delivery of mRNA Therapeutics Using Nonviral Vector-Based DeliverySystems,”Gene Ther.24(3):133-43(2017),其全部内容特此通过引用并入本文。在这里,利用了这种独特的方法来创建一流的治疗性uAb递送策略;该方法涉及最近证明的稳定预先形成的蛋白质-RNA复合物以进行递送的静电学策略。Li等人,“Polyamine-MediatedStoichiometric Assembly of Ribonucleoproteins for Enhanced mRNA Delivery,”Angew Chem.Int.Ed.Engl.56(44):13709-12(2017),其全部内容特此通过引用并入本文。在这里,将编码GFP导向的GS2-IpaH9.8嵌合体的合成mRNA与PABP共组装,并使用带有阳离子胺化侧基的结构明确的多肽将组装的核糖核蛋白包装成纳米尺寸的复合物。所得的纳米复合物在体外和体内均实现了GFP的高效沉默,从而证明了新的蛋白质组编辑范例,并为基于uAb的疗法的临床翻译打开了大门。

尽管本文已经详细描绘和描述了优选实施例,但是对于相关领域的技术人员来说显而易见的是,在不脱离本申请的精神的情况下,可以进行各种修改、增加、替换等,并且因此认为这些在以下权利要求所限定的本申请的范围之内。

序列表

<110> 康奈尔大学

麻省理工学院

<120> 用工程化细菌泛素连接酶模拟物进行的广谱蛋白质组编辑

<130> 8177-02-PCT

<150> 62/644,055

<151> 2018-03-16

<160> 38

<170> PatentIn版本3.5

<210> 1

<211> 553

<212> PRT

<213> 人工

<220>

<223> 来自丁香假单胞菌的AvrPtoB U-box基序

<400> 1

Met Ala Gly Ile Asn Arg Ala Gly Pro Ser Gly Ala Tyr Phe Val Gly

1 5 10 15

His Thr Asp Pro Glu Pro Val Ser Gly Gln Ala His Gly Ser Gly Ser

20 25 30

Gly Ala Ser Ser Ser Asn Ser Pro Gln Val Gln Pro Arg Pro Ser Asn

35 40 45

Thr Pro Pro Ser Asn Ala Pro Ala Pro Pro Pro Thr Gly Arg Glu Arg

50 55 60

Leu Ser Arg Ser Thr Ala Leu Ser Arg Gln Thr Arg Glu Trp Leu Glu

65 70 75 80

Gln Gly Met Pro Thr Ala Glu Asp Ala Ser Val Arg Arg Arg Pro Gln

85 90 95

Val Thr Ala Asp Ala Ala Thr Pro Arg Ala Glu Ala Arg Arg Thr Pro

100 105 110

Glu Ala Thr Ala Asp Ala Ser Ala Pro Arg Arg Gly Ala Val Ala His

115 120 125

Ala Asn Ser Ile Val Gln Gln Leu Val Ser Glu Gly Ala Asp Ile Ser

130 135 140

His Thr Arg Asn Met Leu Arg Asn Ala Met Asn Gly Asp Ala Val Ala

145 150 155 160

Phe Ser Arg Val Glu Gln Asn Ile Phe Arg Gln His Phe Pro Asn Met

165 170 175

Pro Met His Gly Ile Ser Arg Asp Ser Glu Leu Ala Ile Glu Leu Arg

180 185 190

Gly Ala Leu Arg Arg Ala Val His Gln Gln Ala Ala Ser Ala Pro Val

195 200 205

Arg Ser Pro Thr Pro Thr Pro Ala Ser Pro Ala Ala Ser Ser Ser Gly

210 215 220

Ser Ser Gln Arg Ser Leu Phe Gly Arg Phe Ala Arg Leu Met Ala Pro

225 230 235 240

Asn Gln Gly Arg Ser Ser Asn Thr Ala Ala Ser Gln Thr Pro Val Asp

245 250 255

Arg Ser Pro Pro Arg Val Asn Gln Arg Pro Ile Arg Val Asp Arg Ala

260 265 270

Ala Met Arg Asn Arg Gly Asn Asp Glu Ala Asp Ala Ala Leu Arg Gly

275 280 285

Leu Val Gln Gln Gly Val Asn Leu Glu His Leu Arg Thr Ala Leu Glu

290 295 300

Arg His Val Met Gln Arg Leu Pro Ile Pro Leu Asp Ile Gly Ser Ala

305 310 315 320

Leu Gln Asn Val Gly Ile Asn Pro Ser Ile Asp Leu Gly Glu Ser Leu

325 330 335

Val Gln His Pro Leu Leu Asn Leu Asn Val Ala Leu Asn Arg Met Leu

340 345 350

Gly Leu Arg Pro Ser Ala Glu Arg Ala Pro Arg Pro Ala Val Pro Val

355 360 365

Ala Pro Ala Thr Ala Ser Arg Arg Pro Asp Gly Thr Arg Ala Thr Arg

370 375 380

Leu Arg Val Met Pro Glu Arg Glu Asp Tyr Glu Asn Asn Val Ala Tyr

385 390 395 400

Gly Val Arg Leu Leu Asn Leu Asn Pro Gly Val Gly Val Arg Gln Ala

405 410 415

Val Ala Ala Phe Val Thr Asp Arg Ala Glu Arg Pro Ala Val Val Ala

420 425 430

Asn Ile Arg Ala Ala Leu Asp Pro Ile Ala Ser Gln Phe Ser Gln Leu

435 440 445

Arg Thr Ile Ser Lys Ala Asp Ala Glu Ser Glu Glu Leu Gly Phe Lys

450 455 460

Asp Ala Ala Asp His His Thr Asp Asp Val Thr His Cys Leu Phe Gly

465 470 475 480

Gly Glu Leu Ser Leu Ser Asn Pro Asp Gln Gln Val Ile Gly Leu Ala

485 490 495

Gly Asn Pro Thr Asp Thr Ser Gln Pro Tyr Ser Gln Glu Gly Asn Lys

500 505 510

Asp Leu Ala Phe Met Asp Met Lys Lys Leu Ala Gln Phe Leu Ala Gly

515 520 525

Lys Pro Glu His Pro Met Thr Arg Glu Thr Leu Asn Ala Glu Asn Ile

530 535 540

Ala Lys Tyr Ala Phe Arg Ile Val Pro

545 550

<210> 2

<211> 1659

<212> DNA

<213> 人工

<220>

<223> 来自丁香假单胞菌的AvrPtoB U-box基序

<400> 2

atggcgggta tcaatagagc gggaccatcg ggcgcttatt ttgttggcca cacagacccc 60

gagccagtat cggggcaagc acacggatcc ggcagcggcg ccagctcctc gaacagtccg 120

caggttcagc cgcgaccctc gaatactccc ccgtcgaacg cgcccgcacc gccgccaacc 180

ggacgtgaga ggctttcacg atccacggcg ctgtcgcgcc aaaccaggga gtggctggag 240

cagggtatgc ctacagcgga ggatgccagc gtgcgtcgta ggccacaggt gactgccgat 300

gccgcaacgc cgcgtgcaga ggcaagacgc acgccggagg caactgccga tgccagcgca 360

ccgcgtagag gggcggttgc acacgccaac agtatcgttc agcaattggt cagtgagggc 420

gctgatattt cgcatactcg taacatgctc cgcaatgcaa tgaatggcga cgcagtcgct 480

ttttctcgag tagaacagaa catatttcgc cagcatttcc cgaacatgcc catgcatgga 540

atcagccgag attcggaact cgctatcgag ctccgtgggg cgcttcgtcg agcggttcac 600

caacaggcgg cgtcagcgcc agtgaggtcg cccacgccaa caccggccag ccctgcggca 660

tcatcatcgg gcagcagtca gcgttcttta tttggacggt ttgcccgttt gatggcgcca 720

aaccagggac ggtcgtcgaa cactgccgcc tctcagacgc cggtcgacag gagcccgcca 780

cgcgtcaacc aaagacccat acgcgtcgac agggctgcga tgcgtaatcg tggcaatgac 840

gaggcggacg ccgcgctgcg ggggttagta caacaggggg tcaatttaga gcacctgcgc 900

acggcccttg aaagacatgt aatgcagcgc ctccctatcc ccctcgatat aggcagcgcg 960

ttgcagaatg tgggaattaa cccaagtatc gacttggggg aaagccttgt gcaacatccc 1020

ctgctgaatt tgaatgtagc gttgaatcgc atgctggggc tgcgtcccag cgctgaaaga 1080

gcgcctcgtc cagccgtccc cgtggctccc gcgaccgcct ccaggcgacc ggatggtacg 1140

cgtgcaacac gattgcgggt gatgccggag cgggaggatt acgaaaataa tgtggcttat 1200

ggagtgcgct tgcttaacct gaacccgggg gtgggggtaa ggcaggctgt tgcggccttt 1260

gtaaccgacc gggctgagcg gccagcagtg gtggctaata tccgggcagc cctggaccct 1320

atcgcgtcac aattcagtca gctgcgcaca atttcgaagg ccgatgctga atctgaagag 1380

ctgggtttta aggatgcggc agatcatcac acggatgacg tgacgcactg tctttttggc 1440

ggagaattgt cgctgagtaa tccggatcag caggtgatcg gtttggcggg taatccgacg 1500

gacacgtcgc agccttacag ccaagaggga aataaggacc tggcgttcat ggatatgaaa 1560

aaacttgccc aattcctcgc aggcaagcct gagcatccga tgaccagaga aacgcttaac 1620

gccgaaaata tcgccaagta tgcttttaga atagtcccc 1659

<210> 3

<211> 587

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH0722新型E3连接酶

<400> 3

Met Lys Pro Ala His Asn Pro Ser Phe Phe Arg Ser Phe Cys Gly Leu

1 5 10 15

Gly Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Asn Ile Thr Asp Tyr

20 25 30

His Arg Ile Trp Asp Asn Trp Ala Lys Glu Gly Ala Ala Thr Glu Asp

35 40 45

Arg Thr Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Ala Phe Gln Glu

50 55 60

Pro Ala Leu Asn Leu Ser Leu Leu Arg Leu Arg Ser Leu Pro Tyr Leu

65 70 75 80

Pro Pro His Ile Gln Glu Leu Asn Ile Ser Ser Asn Glu Leu Arg Ser

85 90 95

Leu Pro Glu Leu Pro Pro Ser Leu Thr Val Leu Lys Ala Ser Asp Asn

100 105 110

Arg Leu Ser Arg Leu Pro Ala Leu Pro Pro His Leu Val Ala Leu Asp

115 120 125

Val Ser Leu Asn Arg Val Leu Thr Cys Leu Pro Ser Leu Pro Ser Ser

130 135 140

Leu Gln Ser Leu Ser Ala Leu Leu Asn Ser Leu Glu Thr Leu Pro Asp

145 150 155 160

Leu Pro Pro Ala Leu Gln Lys Leu Ser Val Gly Asn Asn Gln Leu Thr

165 170 175

Ala Leu Pro Glu Leu Pro Cys Glu Leu Gln Glu Leu Ser Ala Phe Asp

180 185 190

Asn Arg Leu Gln Glu Leu Pro Pro Leu Pro Gln Asn Leu Arg Leu Leu

195 200 205

Asn Val Gly Glu Asn Gln Leu His Arg Leu Pro Glu Leu Pro Gln Arg

210 215 220

Leu Gln Ser Leu Tyr Ile Pro Asn Asn Gln Leu Asn Thr Leu Pro Asp

225 230 235 240

Ser Ile Met Asn Leu His Ile Tyr Ala Asp Val Asn Ile Tyr Asn Asn

245 250 255

Pro Leu Ser Thr Arg Thr Leu Gln Ala Leu Gln Arg Leu Thr Ser Ser

260 265 270

Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe Ser Met Ser Asp Gly Gln

275 280 285

Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe

290 295 300

Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu

305 310 315 320

His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser

325 330 335

Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala

340 345 350

Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser

355 360 365

Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala

370 375 380

Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser

385 390 395 400

Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg

405 410 415

Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val

420 425 430

Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln

435 440 445

Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met

450 455 460

Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala

465 470 475 480

Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe

485 490 495

Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp

500 505 510

Arg Trp Ala Leu Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu

515 520 525

Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly

530 535 540

Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr

545 550 555 560

Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala Leu Arg

565 570 575

Leu Pro Glu Asn Gly Ser Gln Leu His His Ser

580 585

<210> 4

<211> 1764

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH0722新型E3连接酶

<400> 4

atgaaacctg cccacaatcc ttcttttttc cgctcctttt gtggtttagg atgtatatcc 60

cgtttatccg tagaagagca aaatatcacg gattatcacc gcatctggga taactgggcc 120

aaggaaggtg ctgcaacaga agaccgaaca caggcagttc gattactgaa aatatgtctg 180

gcttttcaag agccagccct caatttaagt ttactcagat tacgctctct cccatacctg 240

cccccgcaca tacaagaact taacatctct agcaatgagc tacgctctct gccagaactc 300

cctccgtcct taactgtact taaagccagc gataacagac tgagcaggct cccggctctt 360

ccgcctcacc tggtcgctct tgatgtttca cttaacagag ttttaacatg tttgccttct 420

cttccatctt ccttgcagtc actctcagcc cttctcaata gcctggagac gctacctgat 480

cttcccccgg ctctacaaaa actttctgtt ggcaacaacc agcttactgc cttaccagaa 540

ttaccatgtg aactacagga actaagtgct tttgataaca gattacaaga gctaccgccc 600

cttcctcaaa atctgaggct tttaaacgtt ggggaaaacc aactacacag actgcccgaa 660

cttccacaac gtctgcaatc actatatatc cctaacaatc agctgaacac attgccagac 720

agtatcatga atctgcacat ttatgcagat gttaatattt ataacaatcc attgtcgact 780

cgcactctgc aagccctgca aagattaacc tcttcgccgg actaccacgg cccacggatt 840

tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900

acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960

catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020

gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080

tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140

gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200

gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260

ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320

atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctctactgcc 1380

gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440

gaagccatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500

ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgctggc agaagagcag 1560

aaatatgaga tgctggagaa tgagtaccct cagagggtgg ctgaccggct gaaagcatca 1620

ggtctgagcg gtgatgcgga tgcggagagg gaagccggtg cacaggtgat gcgtgagact 1680

gaacagcaga tttaccgtca gctgactgac gaggtactgg ccctgcgatt gcctgaaaac 1740

ggctcacaac tgcaccattc ataa 1764

<210> 5

<211> 575

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH1.4新型E3连接酶

<400> 5

Met Ile Lys Ser Thr Asn Ile Gln Ala Ile Gly Ser Gly Ile Met His

1 5 10 15

Gln Ile Asn Asn Ile Tyr Ser Leu Thr Pro Phe Pro Leu Pro Met Glu

20 25 30

Leu Thr Pro Ser Cys Asn Glu Phe Tyr Leu Lys Ala Trp Ser Glu Trp

35 40 45

Glu Lys Asn Gly Thr Pro Gly Glu Gln Arg Asn Ile Ala Phe Asn Arg

50 55 60

Leu Lys Ile Cys Leu Gln Asn Gln Glu Ala Glu Leu Asn Leu Ser Glu

65 70 75 80

Leu Asp Leu Lys Thr Leu Pro Asp Leu Pro Pro Gln Ile Thr Thr Leu

85 90 95

Glu Ile Arg Lys Asn Leu Leu Thr His Leu Pro Asp Leu Pro Pro Met

100 105 110

Leu Lys Val Ile His Ala Gln Phe Asn Gln Leu Glu Ser Leu Pro Ala

115 120 125

Leu Pro Glu Thr Leu Glu Glu Leu Asn Ala Gly Asp Asn Lys Ile Lys

130 135 140

Glu Leu Pro Phe Leu Pro Glu Asn Leu Thr His Leu Arg Val His Asn

145 150 155 160

Asn Arg Leu His Ile Leu Pro Leu Leu Pro Pro Glu Leu Lys Leu Leu

165 170 175

Val Val Ser Gly Asn Arg Leu Asp Ser Ile Pro Pro Phe Pro Asp Lys

180 185 190

Leu Glu Gly Leu Ala Met Ala Asn Asn Phe Ile Glu Gln Leu Pro Glu

195 200 205

Leu Pro Phe Ser Met Asn Arg Ala Val Leu Met Asn Asn Asn Leu Thr

210 215 220

Thr Leu Pro Glu Ser Val Leu Arg Leu Ala Gln Asn Ala Phe Val Asn

225 230 235 240

Val Ala Gly Asn Pro Leu Ser Gly His Thr Met Arg Thr Leu Gln Gln

245 250 255

Ile Thr Thr Gly Pro Asp Tyr Ser Gly Pro Arg Ile Phe Phe Ser Met

260 265 270

Gly Asn Ser Ala Thr Ile Ser Ala Pro Glu His Ser Leu Ala Asp Ala

275 280 285

Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile

290 295 300

Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala Phe

305 310 315 320

Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe

325 330 335

Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu

340 345 350

Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys

355 360 365

Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu

370 375 380

Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu

385 390 395 400

Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile

405 410 415

Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu Val

420 425 430

Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr

435 440 445

Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn

450 455 460

Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu

465 470 475 480

Phe Lys Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys

485 490 495

Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu

500 505 510

Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala

515 520 525

Ser Gly Leu Ser Gly Asp Thr Asp Ala Glu Arg Glu Ala Gly Ala Gln

530 535 540

Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu

545 550 555 560

Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Asn His Ile Ala

565 570 575

<210> 6

<211> 1728

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH1.4新型E3连接酶

<400> 6

atgattaaat caaccaatat acaggcaatc ggttctggta ttatgcatca aataaacaat 60

atatactcgt taactccatt tcctttacct atggaactga ctccatcttg taatgaattt 120

tatttaaaag cctggagtga atgggaaaag aacggtaccc caggcgagca acgcaatatc 180

gccttcaata ggctgaaaat atgtttacaa aatcaagagg cagaattaaa tttatctgag 240

ttagatttaa aaacattacc agatttaccg cctcagataa caacactgga aataagaaaa 300

aacctattaa cacatctccc tgatttacca ccaatgctta aggtaataca tgctcaattt 360

aatcaactgg aaagcttacc tgccttaccc gagacgttag aagagcttaa tgcgggtgat 420

aacaagataa aagaattacc atttcttcct gaaaatctaa ctcatttacg ggttcataat 480

aaccgattgc atattctgcc actattgcca ccggaactaa aattactggt agtttctgga 540

aacagattag acagcattcc cccctttcca gataagcttg aagggctggc tatggctaat 600

aattttatag aacaactacc ggaattacct tttagtatga acagggctgt gctaatgaat 660

aataatctga caacacttcc ggaaagtgtc ctgagattag ctcagaatgc cttcgtaaat 720

gttgcaggta atccactgtc tggccatacc atgcgtacac tacaacaaat aaccaccgga 780

ccagattatt ctggtcctcg aatatttttc tctatgggaa attctgccac aatttccgct 840

ccagaacact ccctggctga tgccgtgaca gcatggttcc cggaaaacaa acaatctgat 900

gtatcacaga tatggcatgc ttttgaacat gaagagcacg ccaacacctt ttccgcgttc 960

cttgaccgcc tttccgatac cgtctctgca cgcaatacct ccggattccg tgaacaggtc 1020

gctgcatggc tggaaaaact cagtgcctct gcggagcttc gacagcagtc tttcgctgtt 1080

gctgctgatg ccactgagag ctgtgaggac cgtgtcgcgc tcacatggaa caatctccgg 1140

aaaaccctcc tggtccatca ggcatcagaa ggccttttcg ataatgatac cggcgctctg 1200

ctctccctgg gcagggaaat gttccgcctc gaaattctgg aggacattgc ccgggataaa 1260

gtcagaactc tccattttgt ggatgagata gaagtctacc tggccttcca gaccatgctc 1320

gcagagaaac ttcagctctc cactgccgtg aaggaaatgc gtttctatgg cgtgtcggga 1380

gtgacagcaa atgacctccg cactgccgaa gccatggtca gaagccgtga agagaatgaa 1440

tttaaggact ggttctccct ctggggacca tggcatgctg tactgaagcg tacggaagct 1500

gaccgctggg cgcaggcaga agagcagaag tatgagatgc tggagaatga gtactctcag 1560

agggtggctg accggctgaa agcatcaggt ctgagcggtg atacggatgc ggagagggaa 1620

gccggtgcac aggtgatgcg tgagactgaa cagcagattt accgtcagtt gactgacgag 1680

gtactggccc tgcgattgtc tgaaaacggc tcaaatcata tcgcataa 1728

<210> 7

<211> 571

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH2.5新型E3连接酶

<400> 7

Met Leu Ile Arg Ile Leu Val Ile Met Ile Lys Ser Thr Asn Ile Gln

1 5 10 15

Ala Ile Gly Ser Gly Ile Met His Gln Ile Asn Asn Val Tyr Ser Leu

20 25 30

Thr Pro Leu Ser Leu Pro Met Glu Leu Thr Pro Ser Cys Asn Glu Phe

35 40 45

Tyr Leu Lys Thr Trp Ser Glu Trp Glu Lys Asn Gly Thr Pro Gly Glu

50 55 60

Gln Arg Asn Ile Ala Phe Asn Arg Leu Lys Ile Cys Leu Gln Asn Gln

65 70 75 80

Glu Ala Glu Leu Asn Leu Ser Glu Leu Asp Leu Lys Thr Leu Pro Asp

85 90 95

Leu Pro Pro Gln Ile Thr Thr Leu Glu Ile Arg Lys Asn Leu Leu Thr

100 105 110

His Leu Pro Asp Leu Pro Pro Met Leu Lys Val Ile His Ala Gln Phe

115 120 125

Asn Gln Leu Glu Ser Leu Pro Ala Leu Pro Glu Thr Leu Glu Glu Leu

130 135 140

Asn Ala Gly Asp Asn Lys Ile Lys Glu Leu Pro Phe Leu Pro Glu Asn

145 150 155 160

Leu Thr His Leu Arg Val His Asn Asn Arg Leu His Ile Leu Pro Leu

165 170 175

Leu Pro Pro Glu Leu Lys Leu Leu Val Val Ser Gly Asn Arg Leu Asp

180 185 190

Ser Ile Pro Pro Phe Pro Asp Lys Leu Glu Gly Leu Ala Leu Ala Asn

195 200 205

Asn Phe Ile Glu Gln Leu Pro Glu Leu Pro Phe Ser Met Asn Arg Ala

210 215 220

Val Leu Met Asn Asn Asn Leu Thr Thr Leu Pro Glu Ser Val Leu Arg

225 230 235 240

Leu Ala Gln Asn Ala Phe Val Asn Val Ala Gly Asn Pro Leu Ser Gly

245 250 255

His Thr Met Arg Thr Leu Gln Gln Ile Thr Thr Gly Pro Asp Tyr Ser

260 265 270

Gly Pro Arg Ile Phe Phe Ser Met Gly Asn Ser Ala Thr Ile Ser Ala

275 280 285

Pro Glu His Ser Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn

290 295 300

Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu

305 310 315 320

His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val

325 330 335

Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu

340 345 350

Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val

355 360 365

Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp

370 375 380

Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu

385 390 395 400

Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe

405 410 415

Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu

420 425 430

His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu

435 440 445

Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr

450 455 460

Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met

465 470 475 480

Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp

485 490 495

Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala

500 505 510

Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln

515 520 525

Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp

530 535 540

Ala Glu Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln

545 550 555 560

Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala

565 570

<210> 8

<211> 1716

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH2.5新型E3连接酶

<400> 8

atgttgataa gaattctagt tataatgatt aaatcaacca atatacaggc aatcggttct 60

ggcattatgc atcaaataaa caatgtatac tcgttaactc cattatcttt acctatggaa 120

ctgactccat cttgtaatga attttattta aaaacctgga gcgaatggga aaagaacggt 180

accccaggcg agcaacgcaa tatcgccttc aataggctga aaatatgttt acaaaatcaa 240

gaggcagaat taaatttatc tgagttagat ttaaaaacat taccagattt accgcctcag 300

ataacaacac tggaaataag aaaaaaccta ttaacacatc tccctgattt accaccaatg 360

cttaaggtaa tacatgctca atttaatcaa ctggaaagct tacctgcctt acccgagacg 420

ttagaagagc ttaatgcggg tgataacaag ataaaagaat taccatttct tcctgaaaat 480

ctaactcatt tacgggttca taataaccga ttgcatattc tgccactatt gccaccggaa 540

ctaaaattac tggtagtttc tggaaacaga ttagacagca ttcccccctt tccagataag 600

cttgaagggc tggctctggc taataatttt atagaacaac taccggaatt accttttagt 660

atgaacaggg ctgtgctaat gaataataat ctgacaacac ttccggaaag tgtcctgaga 720

ttagctcaga atgccttcgt aaatgttgca ggtaatccat tgtctggcca taccatgcgt 780

acactacaac aaataaccac cggaccagat tattctggtc ctcgaatatt tttctctatg 840

ggaaattctg ccacaatttc cgctccagaa cactccctgg ctgatgccgt gacagcatgg 900

ttcccggaaa acaaacaatc tgatgtatca cagatatggc atgcttttga acatgaagag 960

catgccaaca ccttttccgc gttccttgac cgcctttccg ataccgtctc tgcacgcaat 1020

acctccggat tccgtgaaca ggtcgctgca tggctggaaa aactcagtgc ctctgcggag 1080

cttcgacagc agtctttcgc tgttgctgct gatgccactg agagctgtga ggaccgtgtc 1140

gcgctcacat ggaacaatct ccggaaaacc ctcctggtcc atcaggcatc agaaggcctt 1200

ttcgataatg ataccggcgc tctgctctcc ctgggcaggg aaatgttccg cctcgaaatt 1260

ctggaggata ttgcccggga taaagtcaga actctccatt ttgtggatga gatagaagtc 1320

tacctggcct tccagaccat gctcgcagag aaacttcagc tctctactgc cgtgaaggaa 1380

atgcgtttct atggcgtgtc gggagtgaca gcaaatgacc tccgcactgc cgaagccatg 1440

gtcagaagcc gtgaagagaa tgaatttacg gactggttct ccctctgggg accatggcat 1500

gctgtactga agcgtacgga agctgaccgc tgggcgcagg cagaagagca gaagtatgag 1560

atgctggaga atgagtactc tcagagggtg gctgaccggc tgaaagcatc aggtctgagc 1620

ggtgatgcgg atgcggagag ggaagccggt gcacaggtga tgcgtgagac tgaacagcag 1680

atttaccgtc agttgactga cgaggtactg gcctga 1716

<210> 9

<211> 574

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH4.5新型E3连接酶

<400> 9

Met Lys Pro Ile Asn Asn His Ser Phe Phe Arg Ser Leu Cys Gly Leu

1 5 10 15

Ser Cys Ile Ser Arg Leu Ser Val Glu Glu Gln Cys Thr Arg Asp Tyr

20 25 30

His Arg Ile Trp Asp Asp Trp Ala Arg Glu Gly Thr Thr Thr Glu Asn

35 40 45

Arg Ile Gln Ala Val Arg Leu Leu Lys Ile Cys Leu Asp Thr Arg Glu

50 55 60

Pro Val Leu Asn Leu Ser Leu Leu Lys Leu Arg Ser Leu Pro Pro Leu

65 70 75 80

Pro Leu His Ile Arg Glu Leu Asn Ile Ser Asn Asn Glu Leu Ile Ser

85 90 95

Leu Pro Glu Asn Ser Pro Leu Leu Thr Glu Leu His Val Asn Gly Asn

100 105 110

Asn Leu Asn Ile Leu Pro Thr Leu Pro Ser Gln Leu Ile Lys Leu Asn

115 120 125

Ile Ser Phe Asn Arg Asn Leu Ser Cys Leu Pro Ser Leu Pro Pro Tyr

130 135 140

Leu Gln Ser Leu Ser Ala Arg Phe Asn Ser Leu Glu Thr Leu Pro Glu

145 150 155 160

Leu Pro Ser Thr Leu Thr Ile Leu Arg Ile Glu Gly Asn Arg Leu Thr

165 170 175

Val Leu Pro Glu Leu Pro His Arg Leu Gln Glu Leu Phe Val Ser Gly

180 185 190

Asn Arg Leu Gln Glu Leu Pro Glu Phe Pro Gln Ser Leu Lys Tyr Leu

195 200 205

Lys Val Gly Glu Asn Gln Leu Arg Arg Leu Ser Arg Leu Pro Gln Glu

210 215 220

Leu Leu Ala Leu Asp Val Ser Asn Asn Leu Leu Thr Ser Leu Pro Glu

225 230 235 240

Asn Ile Ile Thr Leu Pro Ile Cys Thr Asn Val Asn Ile Ser Gly Asn

245 250 255

Pro Leu Ser Thr Arg Val Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser

260 265 270

Pro Asp Tyr His Gly Pro Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln

275 280 285

Gln Asn Thr Leu His Arg Pro Leu Ala Asp Ala Val Thr Ala Trp Phe

290 295 300

Pro Glu Asn Lys Gln Ser Asp Val Ser Gln Ile Trp His Ala Phe Glu

305 310 315 320

His Glu Glu His Ala Asn Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser

325 330 335

Asp Thr Val Ser Ala Arg Asn Thr Ser Gly Phe Arg Glu Gln Val Ala

340 345 350

Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser

355 360 365

Phe Ala Val Ala Ala Asp Ala Thr Glu Ser Cys Glu Asp Arg Val Ala

370 375 380

Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu Leu Val His Gln Ala Ser

385 390 395 400

Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg

405 410 415

Glu Met Phe Arg Leu Glu Ile Leu Glu Asp Ile Ala Arg Asp Lys Val

420 425 430

Arg Thr Leu His Phe Val Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln

435 440 445

Thr Met Leu Ala Glu Lys Leu Gln Leu Ser Thr Ala Val Lys Glu Met

450 455 460

Arg Phe Tyr Gly Val Ser Gly Val Thr Ala Asn Asp Leu Arg Thr Ala

465 470 475 480

Glu Ala Met Val Arg Ser Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe

485 490 495

Ser Leu Trp Gly Pro Trp His Ala Val Leu Lys Arg Thr Glu Ala Asp

500 505 510

Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu

515 520 525

Tyr Ser Gln Arg Val Ala Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly

530 535 540

Asp Ala Asp Ala Gln Arg Glu Ala Gly Ala Gln Val Met Arg Glu Thr

545 550 555 560

Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp Glu Val Leu Ala

565 570

<210> 10

<211> 1725

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH4.5新型E3连接酶

<400> 10

atgaaaccga tcaacaatca ttcttttttt cgttcccttt gtggcttatc atgtatatct 60

cgtttatcgg tagaagaaca gtgtaccaga gattaccacc gcatctggga tgactgggct 120

agggaaggaa caacaacaga aaatcgcatc caggcggttc gattattgaa aatatgtctg 180

gatacccggg agcctgttct caatttaagc ttactgaaac tacgttcttt accaccactc 240

cctttgcata tacgtgaact taatatttcc aacaatgagt taatctccct acctgaaaat 300

tctccgcttt tgacagaact tcatgtaaat ggtaacaact tgaatatact cccgacactt 360

ccatctcaac tgattaagct taatatttca ttcaatcgaa atttgtcatg tctgccatca 420

ttaccaccat atttacaatc actctcggca cgttttaata gtctggagac gttaccagag 480

cttccatcaa cgctaacaat attacgtatt gaaggtaatc gccttactgt cttgcctgaa 540

ttgcctcata gactacaaga actctttgtt tccggcaaca gactacagga actaccagaa 600

tttcctcaga gcttaaaata tttgaaggta ggtgaaaatc aactacgcag attatccaga 660

ttaccgcaag aactattggc tctggatgtt tccaataacc tactaacttc attacccgaa 720

aatataatca cattgcccat ttgtacgaat gttaacattt cagggaatcc attgtcgact 780

cgcgttctgc aatccctgca aagattaacc tcttcgccgg actaccacgg cccgcagatt 840

tacttctcca tgagtgacgg acaacagaat acactccatc gccccctggc tgatgccgtg 900

acagcatggt tcccggaaaa caaacaatct gatgtatcac agatatggca tgcttttgaa 960

catgaagagc atgccaacac cttttccgcg ttccttgacc gcctttccga taccgtctct 1020

gcacgcaata cctccggatt ccgtgaacag gtcgctgcat ggctggaaaa actcagtgcc 1080

tctgcggagc ttcgacagca gtctttcgct gttgctgctg atgccactga gagctgtgag 1140

gaccgtgtcg cgctcacatg gaacaatctc cggaaaaccc tcctggtcca tcaggcatca 1200

gaaggccttt tcgataatga taccggcgct ctgctctccc tgggcaggga aatgttccgc 1260

ctcgaaattc tggaggacat tgcccgggat aaagtcagaa ctctccattt tgtggatgag 1320

atagaagtct acctggcctt ccagaccatg ctcgcagaga aacttcagct ctccactgcc 1380

gtgaaggaaa tgcgtttcta tggcgtgtcg ggagtgacag caaatgacct ccgcactgcc 1440

gaagctatgg tcagaagccg tgaagagaat gaatttacgg actggttctc cctctgggga 1500

ccatggcatg ctgtactgaa gcgtacggaa gctgaccgct gggcgcaggc agaagagcag 1560

aagtatgaga tgctggagaa tgagtactct cagagggtgg ctgaccggct gaaagcatca 1620

ggtctgagcg gtgatgcgga tgcgcagagg gaagccggtg cacaggtgat gcgtgagact 1680

gaacagcaga tttaccgtca gctgactgac gaggtactgg cctga 1725

<210> 11

<211> 565

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH7.8新型E3连接酶

<400> 11

Met Phe Ser Val Asn Asn Thr His Ser Ser Val Ser Cys Ser Pro Ser

1 5 10 15

Ile Asn Ser Asn Ser Thr Ser Asn Glu His Tyr Leu Arg Ile Leu Thr

20 25 30

Glu Trp Glu Lys Asn Ser Ser Pro Gly Glu Glu Arg Gly Ile Ala Phe

35 40 45

Asn Arg Leu Ser Gln Cys Phe Gln Asn Gln Glu Ala Val Leu Asn Leu

50 55 60

Ser Asp Leu Asn Leu Thr Ser Leu Pro Glu Leu Pro Lys His Ile Ser

65 70 75 80

Ala Leu Ile Val Glu Asn Asn Lys Leu Thr Ser Leu Pro Lys Leu Pro

85 90 95

Ala Phe Leu Lys Glu Leu Asn Ala Asp Asn Asn Arg Leu Ser Val Ile

100 105 110

Pro Glu Leu Pro Glu Ser Leu Thr Thr Leu Ser Val Arg Ser Asn Gln

115 120 125

Leu Glu Asn Leu Pro Val Leu Pro Asn His Leu Thr Ser Leu Phe Val

130 135 140

Glu Asn Asn Arg Leu Tyr Asn Leu Pro Ala Leu Pro Glu Lys Leu Lys

145 150 155 160

Phe Leu His Val Tyr Tyr Asn Arg Leu Thr Thr Leu Pro Asp Leu Pro

165 170 175

Asp Lys Leu Glu Ile Leu Cys Ala Gln Arg Asn Asn Leu Val Thr Phe

180 185 190

Pro Gln Phe Ser Asp Arg Asn Asn Ile Arg Gln Lys Glu Tyr Tyr Phe

195 200 205

His Phe Asn Gln Ile Thr Thr Leu Pro Glu Ser Phe Ser Gln Leu Asp

210 215 220

Ser Ser Tyr Arg Ile Asn Ile Ser Gly Asn Pro Leu Ser Thr Arg Val

225 230 235 240

Leu Gln Ser Leu Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro

245 250 255

Gln Ile Tyr Phe Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg

260 265 270

Pro Leu Ala Asp Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser

275 280 285

Asp Val Ser Gln Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn

290 295 300

Thr Phe Ser Ala Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg

305 310 315 320

Asn Thr Ser Gly Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu

325 330 335

Ser Ala Ser Ala Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp

340 345 350

Ala Thr Glu Ser Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu

355 360 365

Arg Lys Thr Leu Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn

370 375 380

Asp Thr Gly Ala Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu

385 390 395 400

Ile Leu Glu Asp Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val

405 410 415

Asp Glu Ile Glu Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys

420 425 430

Leu Gln Leu Ser Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser

435 440 445

Gly Val Thr Ala Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser

450 455 460

Arg Glu Glu Asn Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp

465 470 475 480

His Ala Val Leu Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu

485 490 495

Glu Gln Lys Tyr Glu Met Leu Glu Asn Glu Tyr Ser Gln Arg Val Ala

500 505 510

Asp Arg Leu Lys Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg

515 520 525

Glu Ala Gly Ala Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg

530 535 540

Gln Leu Thr Asp Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser

545 550 555 560

Arg Leu His His Ser

565

<210> 12

<211> 1698

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH7.8新型E3连接酶

<400> 12

atgttctctg taaataatac acactcatca gtttcttgct ccccctctat taactcaaac 60

tcaaccagta atgaacatta tctgagaatc ctgactgaat gggaaaagaa ctcttctccc 120

ggggaagagc gaggcattgc ttttaacaga ctctcccagt gctttcagaa tcaagaagca 180

gtattaaatt tatcagacct aaatttgacg tctcttcccg aattaccaaa gcatatttct 240

gctttgattg tagaaaataa taaattaaca tcattgccaa agctgcctgc atttcttaaa 300

gaacttaatg ctgataataa caggctttct gtgataccag aacttcctga gtcattaaca 360

actttaagtg ttcgttctaa tcaactggaa aaccttcctg ttttgccaaa ccatttaaca 420

tcattatttg ttgaaaataa caggctatat aacttaccgg ctcttcccga aaaattgaaa 480

tttttacatg tttattataa caggctgaca acattacccg acttaccgga taaactggaa 540

attctctgtg ctcagcgcaa taatctggtt acttttcctc aattttctga tagaaacaat 600

atcagacaaa aggaatatta ttttcatttt aatcagataa ccactcttcc ggagagtttt 660

tcacaattag attcaagtta caggattaat atttcaggga atccattgtc gactcgcgtt 720

ctgcaatccc tgcaaagatt aacctcttcg ccggactacc acggcccaca gatttacttc 780

tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 840

tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 900

gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 960

aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 1020

gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1080

gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1140

cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1200

attctggagg acattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1260

gtctacctgg ccttccagac catgctcgca gagaaacttc agctctctac tgccgtgaag 1320

gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1380

atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1440

catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaagtat 1500

gagatgctgg agaatgagta ctctcagagg gtggctgacc ggctgaaagc atcaggtctg 1560

agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1620

cagatttacc gtcagttgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1680

cgactgcacc attcataa 1698

<210> 13

<211> 545

<212> PRT

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH9.8新型E3连接酶

<400> 13

Met Leu Pro Ile Asn Asn Asn Phe Ser Leu Pro Gln Asn Ser Phe Tyr

1 5 10 15

Asn Thr Ile Ser Gly Thr Tyr Ala Asp Tyr Phe Ser Ala Trp Asp Lys

20 25 30

Trp Glu Lys Gln Ala Leu Pro Gly Glu Glu Arg Asp Glu Ala Val Ser

35 40 45

Arg Leu Lys Glu Cys Leu Ile Asn Asn Ser Asp Glu Leu Arg Leu Asp

50 55 60

Arg Leu Asn Leu Ser Ser Leu Pro Asp Asn Leu Pro Ala Gln Ile Thr

65 70 75 80

Leu Leu Asn Val Ser Tyr Asn Gln Leu Thr Asn Leu Pro Glu Leu Pro

85 90 95

Val Thr Leu Lys Lys Leu Tyr Ser Ala Ser Asn Lys Leu Ser Glu Leu

100 105 110

Pro Val Leu Pro Pro Ala Leu Glu Ser Leu Gln Val Gln His Asn Glu

115 120 125

Leu Glu Asn Leu Pro Ala Leu Pro Asp Ser Leu Leu Thr Met Asn Ile

130 135 140

Ser Tyr Asn Glu Ile Val Ser Leu Pro Ser Leu Pro Gln Ala Leu Lys

145 150 155 160

Asn Leu Arg Ala Thr Arg Asn Phe Leu Thr Glu Leu Pro Ala Phe Ser

165 170 175

Glu Gly Asn Asn Pro Val Val Arg Glu Tyr Phe Phe Asp Arg Asn Gln

180 185 190

Ile Ser His Ile Pro Glu Ser Ile Leu Asn Leu Arg Asn Glu Cys Ser

195 200 205

Ile His Ile Ser Asp Asn Pro Leu Ser Ser His Ala Leu Gln Ala Leu

210 215 220

Gln Arg Leu Thr Ser Ser Pro Asp Tyr His Gly Pro Arg Ile Tyr Phe

225 230 235 240

Ser Met Ser Asp Gly Gln Gln Asn Thr Leu His Arg Pro Leu Ala Asp

245 250 255

Ala Val Thr Ala Trp Phe Pro Glu Asn Lys Gln Ser Asp Val Ser Gln

260 265 270

Ile Trp His Ala Phe Glu His Glu Glu His Ala Asn Thr Phe Ser Ala

275 280 285

Phe Leu Asp Arg Leu Ser Asp Thr Val Ser Ala Arg Asn Thr Ser Gly

290 295 300

Phe Arg Glu Gln Val Ala Ala Trp Leu Glu Lys Leu Ser Ala Ser Ala

305 310 315 320

Glu Leu Arg Gln Gln Ser Phe Ala Val Ala Ala Asp Ala Thr Glu Ser

325 330 335

Cys Glu Asp Arg Val Ala Leu Thr Trp Asn Asn Leu Arg Lys Thr Leu

340 345 350

Leu Val His Gln Ala Ser Glu Gly Leu Phe Asp Asn Asp Thr Gly Ala

355 360 365

Leu Leu Ser Leu Gly Arg Glu Met Phe Arg Leu Glu Ile Leu Glu Asp

370 375 380

Ile Ala Arg Asp Lys Val Arg Thr Leu His Phe Val Asp Glu Ile Glu

385 390 395 400

Val Tyr Leu Ala Phe Gln Thr Met Leu Ala Glu Lys Leu Gln Leu Ser

405 410 415

Thr Ala Val Lys Glu Met Arg Phe Tyr Gly Val Ser Gly Val Thr Ala

420 425 430

Asn Asp Leu Arg Thr Ala Glu Ala Met Val Arg Ser Arg Glu Glu Asn

435 440 445

Glu Phe Thr Asp Trp Phe Ser Leu Trp Gly Pro Trp His Ala Val Leu

450 455 460

Lys Arg Thr Glu Ala Asp Arg Trp Ala Gln Ala Glu Glu Gln Lys Tyr

465 470 475 480

Glu Met Leu Glu Asn Glu Tyr Pro Gln Arg Val Ala Asp Arg Leu Lys

485 490 495

Ala Ser Gly Leu Ser Gly Asp Ala Asp Ala Glu Arg Glu Ala Gly Ala

500 505 510

Gln Val Met Arg Glu Thr Glu Gln Gln Ile Tyr Arg Gln Leu Thr Asp

515 520 525

Glu Val Leu Ala Leu Arg Leu Ser Glu Asn Gly Ser Gln Leu His His

530 535 540

Ser

545

<210> 14

<211> 1638

<212> DNA

<213> 人工

<220>

<223> 来自弗氏志贺氏菌的IpaH9.8新型E3连接酶

<400> 14

atgttaccga taaataataa cttttcattg ccccaaaatt ctttttataa cactatttcc 60

ggtacatatg ctgattactt ttcagcatgg gataaatggg aaaaacaagc gctccccggt 120

gaagagcgtg atgaggctgt ctcccgactt aaagaatgtc ttatcaataa ttccgatgaa 180

cttcgactgg accgtttaaa tctgtcctcg ctacctgaca acttaccagc tcagataacg 240

ctgctcaatg tatcatataa tcaattaact aacctacctg aactgcctgt tacgctaaaa 300

aaattatatt ccgccagcaa taaattatca gaattgcccg tgctacctcc tgcgctggag 360

tcacttcagg tacaacacaa tgagctggaa aacctgccag ctttacccga ttcgttattg 420

actatgaata tcagctataa cgaaatagtc tccttaccat cgctcccaca ggctcttaaa 480

aatctcagag cgacccgtaa tttcctcact gagctaccag cattttctga gggaaataat 540

cccgttgtca gagagtattt ttttgataga aatcagataa gtcatatccc ggaaagcatt 600

cttaatctga ggaatgaatg ttcaatacat attagtgata acccattatc atcccatgct 660

ctgcaagccc tgcaaagatt aacctcttcg ccggactacc acggcccacg gatttacttc 720

tccatgagtg acggacaaca gaatacactc catcgccccc tggctgatgc cgtgacagca 780

tggttcccgg aaaacaaaca atctgatgta tcacagatat ggcatgcttt tgaacatgaa 840

gagcatgcca acaccttttc cgcgttcctt gaccgccttt ccgataccgt ctctgcacgc 900

aatacctccg gattccgtga acaggtcgct gcatggctgg aaaaactcag tgcctctgcg 960

gagcttcgac agcagtcttt cgctgttgct gctgatgcca ctgagagctg tgaggaccgt 1020

gtcgcgctca catggaacaa tctccggaaa accctcctgg tccatcaggc atcagaaggc 1080

cttttcgata atgataccgg cgctctgctc tccctgggca gggaaatgtt ccgcctcgaa 1140

attctggagg atattgcccg ggataaagtc agaactctcc attttgtgga tgagatagaa 1200

gtctacctgg ccttccagac catgctcgca gagaaacttc agctctccac tgccgtgaag 1260

gaaatgcgtt tctatggcgt gtcgggagtg acagcaaatg acctccgcac tgccgaagcc 1320

atggtcagaa gccgtgaaga gaatgaattt acggactggt tctccctctg gggaccatgg 1380

catgctgtac tgaagcgtac ggaagctgac cgctgggcgc aggcagaaga gcagaaatat 1440

gagatgctgg agaatgagta ccctcagagg gtggctgacc ggctgaaagc atcaggtctg 1500

agcggtgatg cggatgcgga gagggaagcc ggtgcacagg tgatgcgtga gactgaacag 1560

cagatttacc gtcagctgac tgacgaggta ctggccctgc gattgtctga aaacggctca 1620

caactgcacc attcataa 1638

<210> 15

<211> 172

<212> PRT

<213> 人工

<220>

<223> 来自嗜肺军团菌的LegAU13 F-box基序

<400> 15

Met Lys Lys Asn Phe Phe Ser Asp Leu Pro Glu Glu Thr Ile Val Asn

1 5 10 15

Thr Leu Ser Phe Leu Lys Ala Asn Thr Leu Ala Arg Ile Ala Gln Thr

20 25 30

Cys Gln Phe Phe Asn Arg Leu Ala Asn Asp Lys His Leu Glu Leu His

35 40 45

Gln Leu Arg Gln Gln His Ile Lys Arg Glu Leu Trp Gly Asn Leu Met

50 55 60

Val Ala Ala Arg Ser Asn Asn Leu Glu Glu Val Lys Lys Ile Leu Lys

65 70 75 80

Lys Gly Ile Asp Pro Thr Gln Thr Asn Ser Tyr His Leu Asn Arg Thr

85 90 95

Pro Leu Leu Ala Ala Ile Glu Gly Lys Ala Tyr Gln Thr Ala Asn Tyr

100 105 110

Leu Trp Arg Lys Tyr Thr Phe Asp Pro Asn Phe Lys Asp Asn Tyr Gly

115 120 125

Asp Ser Pro Ile Ser Leu Leu Lys Lys Gln Leu Ala Asn Pro Ala Phe

130 135 140

Lys Asp Lys Glu Lys Lys Gln Ile Arg Ala Leu Ile Arg Gly Met Gln

145 150 155 160

Glu Glu Lys Ile Ala Gln Ser Lys Cys Leu Val Cys

165 170

<210> 16

<211> 519

<212> DNA

<213> 人工

<220>

<223> 来自嗜肺军团菌的LegAU13 F-box基序

<400> 16

atgaaaaaga attttttttc tgatcttcct gaggaaacaa ttgtcaatac attgagtttc 60

ttaaaagcaa acacactagc tcgtatagct cagacatgtc aattttttaa tcgcttggct 120

aatgataaac atctggagct gcatcaacta agacaacagc atataaagcg agagctatgg 180

ggaaatctta tggtggcggc aagaagcaat aacctggaag aggtcaaaaa gattctaaaa 240

aaaggaatcg atccaaccca gaccaatagc taccacttaa atagaacgcc tttacttgca 300

gctatcgaag gaaaagcata tcaaactgca aattacctct ggagaaaata cactttcgat 360

cccaatttta aagataacta tggtgattca cctatctctc ttcttaaaaa gcaactggca 420

aatccagcct tcaaggataa ggaaaaaaaa caaatacgcg ccttaattag gggaatgcaa 480

gaagaaaaaa tagcacagag caagtgcctt gtttgttaa 519

<210> 17

<211> 188

<212> PRT

<213> 人工

<220>

<223> 来自嗜肺军团菌的LegU1 F-box基序

<400> 17

Met Lys Ala Lys Tyr Asp Pro Thr Lys Pro Gly Leu Gln Lys Leu Pro

1 5 10 15

Pro Glu Ile Lys Val Met Ile Leu Glu Phe Leu Asp Ala Lys Ser Lys

20 25 30

Leu Ala Leu Ser Gln Thr Asn Tyr Gly Trp Arg Asp Leu Ile Leu Asp

35 40 45

Arg Pro Glu Tyr Thr Lys Glu Ile Thr Asn Thr Leu Phe Arg Leu Asp

50 55 60

Lys Lys Arg His Arg Gln Ala Ile Ala Gln Met Met Ser Gly Arg Val

65 70 75 80

Thr Ala Ser Ser Met Ala Lys Leu Phe Glu Glu Leu Leu Cys Phe Ser

85 90 95

Ile Pro Ser Ser Tyr Val Phe Leu Ile Phe Phe Ala Ser Gln Lys Ser

100 105 110

Val Ala Leu Ile Glu Val Leu Thr Val Ile Leu Val Phe Ala Ala Ile

115 120 125

Thr Ser Leu Ala His Asp Leu Val Asp Tyr Phe Ile Glu Ser Asp Thr

130 135 140

Lys Ala Glu Lys Gln His Ala His Arg Arg Ala Phe Gln Phe Phe Ala

145 150 155 160

Gln Pro Ser Gln Ser Ala Ala Gln Gln Asn Leu Glu Glu Glu Asn Leu

165 170 175

Ser Ala Asp Pro Lys Ala Cys Gln Cys Glu Pro Leu

180 185

<210> 18

<211> 567

<212> DNA

<213> 人工

<220>

<223> 来自嗜肺军团菌的LegU1 F-box基序

<400> 18

atgaaagcaa aatacgaccc cacaaagcct ggactccaaa agttacctcc tgaaatcaag 60

gtaatgattc ttgagtttct tgatgccaaa tcaaaactag ctctttcaca gacaaattat 120

ggttggcgtg atttaattct agaccggcca gaatatacca aagaaataac gaatacatta 180

tttcgtcttg ataaaaaacg ccatcgtcaa gcaatagcac aaatgatgtc aggaagagtt 240

acagcaagtt ctatggctaa gctatttgaa gaattactat gttttagcat accttcgtcc 300

tatgtgtttt taatcttttt cgcatcgcaa aaatctgtgg cgcttataga agtcttaacc 360

gtaatccttg tgtttgctgc aataacctct ctcgcccatg atctggtgga ttattttatt 420

gaaagtgata caaaagctga gaaacagcat gcacatcgcc gtgcttttca attctttgcc 480

caacccagtc aaagcgctgc acaacaaaac ttggaggaag agaatttaag tgctgatccc 540

aaggcctgcc aatgtgagcc attgtag 567

<210> 19

<211> 240

<212> PRT

<213> 人工

<220>

<223> 来自嗜肺军团菌的LubX U-box基序

<400> 19

Met Ala Thr Arg Asn Pro Phe Asp Ile Asp His Lys Ser Lys Tyr Leu

1 5 10 15

Arg Glu Ala Ala Leu Glu Ala Asn Leu Ser His Pro Glu Thr Thr Pro

20 25 30

Thr Met Leu Thr Cys Pro Ile Asp Ser Gly Phe Leu Lys Asp Pro Val

35 40 45

Ile Thr Pro Glu Gly Phe Val Tyr Asn Lys Ser Ser Ile Leu Lys Trp

50 55 60

Leu Glu Thr Lys Lys Glu Asp Pro Gln Ser Arg Lys Pro Leu Thr Ala

65 70 75 80

Lys Asp Leu Gln Pro Phe Pro Glu Leu Leu Ile Ile Val Asn Arg Phe

85 90 95

Val Glu Thr Gln Thr Asn Tyr Glu Lys Leu Lys Asn Arg Leu Val Gln

100 105 110

Asn Ala Arg Val Ala Ala Arg Gln Lys Glu Tyr Thr Glu Ile Pro Asp

115 120 125

Ile Phe Leu Cys Pro Ile Ser Lys Thr Leu Ile Lys Thr Pro Val Ile

130 135 140

Thr Ala Gln Gly Lys Val Tyr Asp Gln Glu Ala Leu Ser Asn Phe Leu

145 150 155 160

Ile Ala Thr Gly Asn Lys Asp Glu Thr Gly Lys Lys Leu Ser Ile Asp

165 170 175

Asp Val Val Val Phe Asp Glu Leu Tyr Gln Gln Ile Lys Val Tyr Asn

180 185 190

Phe Tyr Arg Lys Arg Glu Val Gln Lys Asn Gln Ile Gln Pro Ser Val

195 200 205

Ser Asn Gly Phe Gly Phe Phe Ser Leu Asn Phe Leu Thr Ser Trp Leu

210 215 220

Trp Gly Thr Glu Glu Lys Lys Glu Lys Thr Ser Ser Asp Met Thr Tyr

225 230 235 240

<210> 20

<211> 723

<212> DNA

<213> 人工

<220>

<223> 来自嗜肺军团菌的LubX U-box基序

<400> 20

atggcgacgc gaaatccttt tgatattgat cataaaagta aatacttaag agaagcagca 60

ttagaagcca atttatctca tccagaaaca acaccaacaa tgctgacttg ccctattgac 120

agcggatttc taaaagatcc cgtgatcaca cctgaaggtt ttgtttataa taaatcctct 180

attttaaaat ggttagaaac gaaaaaagaa gacccacaaa gccgtaaacc cttaacggct 240

aaagatttgc aaccattccc cgagttattg attatagtca atagatttgt tgagacacaa 300

acgaactatg aaaaattaaa aaacagatta gtgcaaaatg ctcgggttgc tgcacgccaa 360

aaagaataca ctgaaattcc ggatatattt ctttgcccaa taagtaaaac gcttatcaaa 420

acacctgtca ttactgccca agggaaagta tatgatcaag aagcattaag taactttctt 480

atcgcaacgg gtaataaaga tgaaacaggc aaaaaattat ccattgatga tgtagtggtg 540

tttgatgaac tctatcaaca gataaaagtt tataattttt accgcaaacg cgaagtgcaa 600

aaaaatcaaa ttcaaccttc agtaagtaat ggttttggct tttttagctt gaattttctc 660

acctcatggt tatggggaac tgaggagaaa aaagaaaaga catcatctga tatgacgtac 720

taa 723

<210> 21

<211> 191

<212> PRT

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleG2-3 U-box基序

<400> 21

Met Pro Leu Thr Ser Asp Ile Arg Ser His Ser Phe Asn Leu Gly Val

1 5 10 15

Glu Val Val Arg Ala Arg Ile Val Ala Asn Gly Arg Gly Asp Ile Thr

20 25 30

Val Gly Gly Glu Thr Val Ser Ile Val Tyr Asp Ser Thr Asn Gly Arg

35 40 45

Phe Ser Ser Ser Gly Gly Asn Gly Gly Leu Leu Ser Glu Leu Leu Leu

50 55 60

Leu Gly Phe Asn Ser Gly Pro Arg Ala Leu Gly Glu Arg Met Leu Ser

65 70 75 80

Met Leu Ser Asp Ser Gly Glu Ala Gln Ser Gln Glu Ser Ile Gln Asn

85 90 95

Lys Ile Ser Gln Cys Lys Phe Ser Val Cys Pro Glu Arg Leu Gln Cys

100 105 110

Pro Leu Glu Ala Ile Gln Cys Pro Ile Thr Leu Glu Gln Pro Glu Lys

115 120 125

Gly Ile Phe Val Lys Asn Ser Asp Gly Ser Asp Val Cys Thr Leu Phe

130 135 140

Asp Ala Ala Ala Phe Ser Arg Leu Val Gly Glu Gly Leu Pro His Pro

145 150 155 160

Leu Thr Arg Glu Pro Ile Thr Ala Ser Ile Ile Val Lys His Glu Glu

165 170 175

Cys Ile Tyr Asp Asp Thr Arg Gly Asn Phe Ile Ile Lys Gly Asn

180 185 190

<210> 22

<211> 576

<212> DNA

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleG2-3 U-box基序

<400> 22

atgccattaa cctcagatat tagatcacat tcatttaatc ttggggtgga ggttgttcgt 60

gcccgaattg tagccaatgg gcgcggagat attacagtcg gtggtgaaac tgtcagtatt 120

gtgtatgatt ctactaatgg gcgcttttca tccagtggcg gtaatggcgg attgctttct 180

gagttattgc ttttgggatt taatagtggt cctcgagccc ttggtgagag aatgctaagt 240

atgctttcgg actcaggtga agcacaatcg caagagagta ttcagaacaa aatatctcaa 300

tgtaagtttt ctgtttgtcc agagagactt cagtgcccgc ttgaggctat tcagtgtcca 360

attacactgg agcagcctga aaaaggtatt tttgtgaaga attcagatgg ttcagatgta 420

tgtactttat ttgatgccgc tgcattttct cgtttggttg gtgaaggctt accccaccca 480

ctgacccggg aaccaataac ggcatcaata attgtaaaac atgaagaatg catttatgac 540

gataccagag gaaacttcat tataaagggt aattga 576

<210> 23

<211> 213

<212> PRT

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleG5-1 U-box基序

<400> 23

Met Pro Val Asp Leu Thr Pro Tyr Ile Leu Pro Gly Val Ser Phe Leu

1 5 10 15

Ser Asp Ile Pro Gln Glu Thr Leu Ser Glu Ile Arg Asn Gln Thr Ile

20 25 30

Arg Gly Glu Ala Gln Ile Arg Leu Gly Glu Leu Met Val Ser Ile Arg

35 40 45

Pro Met Gln Val Asn Gly Tyr Phe Met Gly Ser Leu Asn Gln Asp Gly

50 55 60

Leu Ser Asn Asp Asn Ile Gln Ile Gly Leu Gln Tyr Ile Glu His Ile

65 70 75 80

Glu Arg Thr Leu Asn His Gly Ser Leu Thr Ser Arg Glu Val Thr Val

85 90 95

Leu Arg Glu Ile Glu Met Leu Glu Asn Met Asp Leu Leu Ser Asn Tyr

100 105 110

Gln Leu Glu Glu Leu Leu Asp Lys Ile Glu Val Cys Ala Phe Asn Val

115 120 125

Glu His Ala Gln Leu Gln Val Pro Glu Ser Leu Arg Thr Cys Pro Val

130 135 140

Thr Leu Cys Glu Pro Glu Asp Gly Val Phe Met Arg Asn Ser Met Asn

145 150 155 160

Ser Asn Val Cys Met Leu Tyr Asp Lys Met Ala Leu Ile His Leu Val

165 170 175

Lys Thr Arg Ala Ala His Pro Leu Ser Arg Glu Ser Ile Ala Val Ser

180 185 190

Met Ile Val Gly Arg Asp Asn Cys Ala Phe Asp Pro Asp Arg Gly Asn

195 200 205

Phe Val Leu Lys Asn

210

<210> 24

<211> 642

<212> DNA

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleG5-1 U-box基序

<400> 24

atgcctgtag atttaacgcc ttatatttta cctggggtta gttttttgtc tgacattcct 60

caagaaacct tgtctgagat acgtaatcag actattcgtg gagaagctca aataagactg 120

ggtgagttga tggtgtcaat acgacctatg caggtaaatg gatattttat gggaagtctt 180

aaccaggatg gtttatcgaa tgataatatc cagattggcc ttcaatatat agaacatatt 240

gaacgtacac ttaatcatgg tagtttgaca agccgtgaag ttacagtact gcgtgaaatt 300

gagatgctcg aaaatatgga tttgctttct aactaccagt tagaggagtt gttagataaa 360

attgaagtat gtgcatttaa tgtggagcat gcacaattgc aagtgccaga gagcttacga 420

acatgccctg ttacattatg tgaaccagaa gatggggtat ttatgaggaa ttcaatgaat 480

tcaaatgttt gtatgttgta tgataaaatg gcattaatac atcttgttaa aacaagggcg 540

gctcatcctt tgagcaggga atcaatcgca gtttcaatga ttgtaggaag agataattgt 600

gcttttgacc ctgacagagg taacttcgtt ttaaaaaatt aa 642

<210> 25

<211> 782

<212> PRT

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleL HECT基序

<400> 25

Met Leu Pro Thr Thr Asn Ile Ser Val Asn Ser Gly Val Ile Ser Phe

1 5 10 15

Glu Ser Pro Val Asp Ser Pro Ser Asn Glu Asp Val Glu Val Ala Leu

20 25 30

Glu Lys Trp Cys Ala Glu Gly Glu Phe Ser Glu Asn Arg His Glu Val

35 40 45

Ala Ser Lys Ile Leu Asp Val Ile Ser Thr Asn Gly Glu Thr Leu Ser

50 55 60

Ile Ser Glu Pro Ile Thr Thr Leu Pro Asp Leu Leu Pro Gly Ser Leu

65 70 75 80

Lys Glu Leu Val Leu Asn Gly Cys Thr Glu Leu Lys Ser Ile Asn Cys

85 90 95

Leu Pro Pro Asn Leu Ser Ser Leu Ser Met Val Gly Cys Ser Ser Leu

100 105 110

Glu Val Ile Asn Cys Ser Ile Pro Glu Asn Val Ile Asn Leu Ser Leu

115 120 125

Cys His Cys Ser Ser Leu Lys His Ile Glu Gly Ser Phe Pro Glu Ala

130 135 140

Leu Arg Asn Ser Val Tyr Leu Asn Gly Cys Asn Ser Leu Asn Glu Ser

145 150 155 160

Gln Cys Gln Phe Leu Ala Tyr Asp Val Ser Gln Gly Arg Ala Cys Leu

165 170 175

Ser Lys Ala Glu Leu Thr Ala Asp Leu Ile Trp Leu Ser Ala Asn Arg

180 185 190

Thr Gly Glu Glu Ser Ala Glu Glu Leu Asn Tyr Ser Gly Cys Asp Leu

195 200 205

Ser Gly Leu Ser Leu Val Gly Leu Asn Leu Ser Ser Val Asn Phe Ser

210 215 220

Gly Ala Val Leu Asp Asp Thr Asp Leu Arg Met Ser Asp Leu Ser Gln

225 230 235 240

Ala Val Leu Glu Asn Cys Ser Phe Lys Asn Ser Ile Leu Asn Glu Cys

245 250 255

Asn Phe Cys Tyr Ala Asn Leu Ser Asn Cys Ile Ile Arg Ala Leu Phe

260 265 270

Glu Asn Ser Asn Phe Ser Asn Ser Asn Leu Lys Asn Ala Ser Phe Lys

275 280 285

Gly Ser Ser Tyr Ile Gln Tyr Pro Pro Ile Leu Asn Glu Ala Asp Leu

290 295 300

Thr Gly Ala Ile Ile Ile Pro Gly Met Val Leu Ser Gly Ala Ile Leu

305 310 315 320

Gly Asp Val Lys Glu Leu Phe Ser Glu Lys Ser Asn Thr Ile Asn Leu

325 330 335

Gly Gly Cys Tyr Ile Asp Leu Ser Asp Ile Gln Glu Asn Ile Leu Ser

340 345 350

Val Leu Asp Asn Tyr Thr Lys Ser Asn Lys Ser Ile Leu Leu Thr Met

355 360 365

Asn Thr Ser Asp Asp Lys Tyr Asn His Asp Lys Val Arg Ala Ala Glu

370 375 380

Glu Leu Ile Lys Lys Ile Ser Leu Asp Glu Leu Ala Ala Phe Arg Pro

385 390 395 400

Tyr Val Lys Met Ser Leu Ala Asp Ser Phe Ser Ile His Pro Tyr Leu

405 410 415

Asn Asn Ala Asn Ile Gln Gln Trp Leu Glu Pro Ile Cys Asp Asp Phe

420 425 430

Phe Asp Thr Ile Met Ser Trp Phe Asn Asn Ser Ile Met Met Tyr Met

435 440 445

Glu Asn Gly Ser Leu Leu Gln Ala Gly Met Tyr Phe Glu Arg His Pro

450 455 460

Gly Ala Met Val Ser Tyr Asn Ser Ser Phe Ile Gln Ile Val Met Asn

465 470 475 480

Gly Ser Arg Arg Asp Gly Met Gln Glu Arg Phe Arg Glu Leu Tyr Glu

485 490 495

Val Tyr Leu Lys Asn Glu Lys Val Tyr Pro Val Thr Gln Gln Ser Asp

500 505 510

Phe Gly Leu Cys Asp Gly Ser Gly Lys Pro Asp Trp Asp Asp Asp Ser

515 520 525

Asp Leu Ala Tyr Asn Trp Val Leu Leu Ser Ser Gln Asp Asp Gly Met

530 535 540

Ala Met Met Cys Ser Leu Ser His Met Val Asp Met Leu Ser Pro Asn

545 550 555 560

Thr Ser Thr Asn Trp Met Ser Phe Phe Leu Tyr Lys Asp Gly Glu Val

565 570 575

Gln Asn Thr Phe Gly Tyr Ser Leu Ser Asn Leu Phe Ser Glu Ser Phe

580 585 590

Pro Ile Phe Ser Ile Pro Tyr His Lys Ala Phe Ser Gln Asn Phe Val

595 600 605

Ser Gly Ile Leu Asp Ile Leu Ile Ser Asp Asn Glu Leu Lys Glu Arg

610 615 620

Phe Ile Glu Ala Leu Asn Ser Asn Lys Ser Asp Tyr Lys Met Ile Ala

625 630 635 640

Asp Asp Gln Gln Arg Lys Leu Ala Cys Val Trp Asn Pro Phe Leu Asp

645 650 655

Gly Trp Glu Leu Asn Ala Gln His Val Asp Met Ile Met Gly Ser His

660 665 670

Val Leu Lys Asp Met Pro Leu Arg Lys Gln Ala Glu Ile Leu Phe Cys

675 680 685

Leu Gly Gly Val Phe Cys Lys Tyr Ser Ser Ser Asp Met Phe Gly Thr

690 695 700

Glu Tyr Asp Ser Pro Glu Ile Leu Arg Arg Tyr Ala Asn Gly Leu Ile

705 710 715 720

Glu Gln Ala Tyr Lys Thr Asp Pro Gln Val Phe Gly Ser Val Tyr Tyr

725 730 735

Tyr Asn Asp Ile Leu Asp Arg Leu Gln Gly Arg Asn Asn Val Phe Thr

740 745 750

Cys Thr Ala Val Leu Thr Asp Met Leu Thr Glu His Ala Lys Glu Ser

755 760 765

Phe Pro Glu Ile Phe Ser Leu Tyr Tyr Pro Val Ala Trp Arg

770 775 780

<210> 26

<211> 2349

<212> DNA

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(EHEC)O157:H7的NleL HECT基序

<400> 26

atgctgccca ctacaaatat ctctgtaaat tctggagtaa tatcttttga aagtcctgta 60

gattcaccat ctaacgagga tgttgaagtt gccctcgaaa agtggtgtgc tgagggagaa 120

tttagcgaaa atcgtcatga ggttgcatca aaaatacttg atgttataag tactaatgga 180

gagactttat caatcagtga gccaataaca acattaccag acttgcttcc aggttctctg 240

aaagaactgg ttttgaatgg atgtacagag cttaaatcaa taaactgctt accccccaac 300

ttatcttcat taagtatggt tggatgctca tcattagagg ttataaattg cagcatacct 360

gaaaatgtca ttaatttatc tttatgccat tgtagttctt tgaaacatat agaaggttcc 420

tttcctgagg cactcagaaa ttccgtatat ttaaatggct gtaattcatt aaatgaatcg 480

caatgtcaat tccttgcata tgatgtcagt caaggccgtg cctgcctgag caaagctgag 540

cttactgctg acttaatttg gttgtcagct aaccgaacgg gtgaagagtc tgctgaagaa 600

ttgaattact ctggatgtga cttgtcaggt ctaagtcttg tagggctgaa tttatcatca 660

gtaaattttt ctggagcagt gcttgatgat acagatctca ggatgagtga tttgtctcag 720

gctgtattgg aaaactgttc ttttaaaaac tcgattttga atgaatgtaa tttttgttat 780

gctaatttat ctaattgtat tattagggct ttgtttgaaa actctaattt cagcaattcc 840

aatcttaaaa atgcatcatt taaaggatct tcatatatac aatatcctcc aattttgaac 900

gaggctgatt taacaggagc tattataatt cctggaatgg ttttaagtgg tgctatctta 960

ggtgatgtaa aggagctctt tagtgaaaaa agtaatacca ttaatctagg agggtgttac 1020

atagatctat ctgacataca ggaaaatata ttatctgtgt tggataacta tacaaaatca 1080

aataaatcaa ttttattgac tatgaataca tctgatgata agtataacca tgataaagta 1140

agggccgctg aagaacttat caaaaaaata tctcttgacg aattagcggc gttccggccc 1200

tatgttaaga tgtctttggc tgattcattt agtattcatc cttatttgaa caacgcaaat 1260

atacagcaat ggctcgagcc tatatgtgat gacttttttg atactataat gtcttggttt 1320

aataattcaa taatgatgta tatggagaat ggtagtttat tgcaggcagg gatgtatttt 1380

gagcgacatc caggtgcgat ggtatcttat aatagttcct ttatacaaat tgtaatgaat 1440

ggttcacggc gtgatggaat gcaggaacga tttagggaac tctatgaagt atatttaaaa 1500

aatgaaaaag tttatcctgt cacacagcag agtgattttg gattgtgcga tggctctggg 1560

aagcctgact gggatgatga ttccgatttg gcttataact gggttttgtt atcatcacag 1620

gatgatggta tggcaatgat gtgttctttg agtcatatgg ttgatatgtt atctcctaat 1680

acatcaacta attggatgtc ctttttttta tataaggatg gagaagttca aaatacattt 1740

gggtattcat tgagcaatct tttttctgaa tcatttccaa ttttcagtat tccttatcat 1800

aaagcttttt cccagaattt cgtttctggt attctggata tactcatttc tgataatgaa 1860

ctcaaagaga gatttattga ggcacttaat tccaataaat cagattataa aatgattgct 1920

gatgatcagc aaaggaaact tgcctgtgtc tggaatccct ttcttgatgg ttgggaactg 1980

aacgctcagc atgtagatat gattatgggg agccatgtat tgaaagatat gccactaaga 2040

aaacaggctg aaatattatt ttgtttaggg ggggttttct gtaaatactc atcgagtgat 2100

atgtttggta cagagtatga ttctcctgag attctacgga gatatgcaaa tggattgatt 2160

gaacaagctt ataaaacaga tcctcaggta tttggctcag tttattatta caatgatatt 2220

ttagacaggc tacaaggaag aaataatgtt tttacttgta ccgctgtgct gactgatatg 2280

ctaacggagc atgcaaaaga atcttttcct gaaatatttt cattgtatta tcctgttgcg 2340

tggcgttga 2349

<210> 27

<211> 917

<212> PRT

<213> 人工

<220>

<223> 来自嗜肺军团菌的SidC非常规基序

<400> 27

Met Val Ile Asn Met Val Asp Val Ile Lys Phe Lys Glu Pro Glu Arg

1 5 10 15

Cys Asp Tyr Leu Tyr Val Asp Glu Asn Asn Lys Val His Ile Leu Leu

20 25 30

Pro Ile Val Gly Gly Asp Glu Ile Gly Leu Asp Asn Thr Cys Gln Thr

35 40 45

Ala Val Glu Leu Ile Thr Phe Phe Tyr Gly Ser Ala His Ser Gly Val

50 55 60

Thr Lys Tyr Ser Ala Glu His Gln Leu Ser Glu Tyr Lys Arg Gln Leu

65 70 75 80

Glu Glu Asp Ile Lys Ala Ile Asn Ser Gln Lys Lys Ile Ser Pro His

85 90 95

Ala Tyr Asp Asp Leu Leu Lys Glu Lys Ile Glu Arg Leu Gln Gln Ile

100 105 110

Glu Lys Tyr Ile Glu Leu Ile Gln Val Leu Lys Lys Gln Tyr Asp Glu

115 120 125

Gln Asn Asp Ile Arg Gln Leu Arg Thr Gly Gly Ile Pro Gln Leu Pro

130 135 140

Ser Gly Val Lys Glu Ile Ile Lys Ser Ser Glu Asn Ala Phe Ala Val

145 150 155 160

Arg Leu Ser Pro Tyr Asp Asn Asp Lys Phe Thr Arg Phe Asp Asp Pro

165 170 175

Leu Phe Asn Val Lys Arg Asn Ile Ser Lys Tyr Asp Thr Pro Ser Arg

180 185 190

Gln Ala Pro Ile Pro Ile Tyr Glu Gly Leu Gly Tyr Arg Leu Arg Ser

195 200 205

Thr Leu Phe Pro Glu Asp Lys Thr Pro Thr Pro Ile Asn Lys Lys Ser

210 215 220

Leu Arg Asp Lys Val Lys Ser Thr Val Leu Ser His Tyr Lys Asp Glu

225 230 235 240

Asp Arg Ile Asp Gly Glu Lys Lys Asp Glu Lys Leu Asn Glu Leu Ile

245 250 255

Thr Asn Leu Gln Asn Glu Leu Val Lys Glu Leu Val Lys Ser Asp Pro

260 265 270

Gln Tyr Ser Lys Leu Ser Leu Ser Lys Asp Pro Arg Gly Lys Glu Ile

275 280 285

Asn Tyr Asp Tyr Leu Val Asn Ser Leu Met Leu Val Asp Asn Asp Ser

290 295 300

Glu Ile Gly Asp Trp Ile Asp Thr Ile Leu Asp Ala Thr Val Asp Ser

305 310 315 320

Thr Val Trp Val Ala Gln Ala Ser Ser Pro Phe Tyr Asp Gly Ala Lys

325 330 335

Glu Ile Ser Ser Asp Arg Asp Ala Asp Lys Ile Ser Ile Arg Val Gln

340 345 350

Tyr Leu Leu Ala Glu Ala Asn Ile Tyr Cys Lys Thr Asn Lys Leu Ser

355 360 365

Asp Ala Asn Phe Gly Glu Phe Phe Asp Lys Glu Pro His Ala Thr Glu

370 375 380

Ile Ala Lys Arg Val Lys Glu Gly Phe Thr Gln Gly Ala Asp Ile Glu

385 390 395 400

Pro Ile Ile Tyr Asp Tyr Ile Asn Ser Asn His Ala Glu Leu Gly Leu

405 410 415

Lys Ser Pro Leu Thr Gly Lys Gln Gln Gln Glu Ile Thr Asp Lys Phe

420 425 430

Thr Lys His Tyr Asn Thr Ile Lys Glu Ser Pro His Phe Asp Glu Phe

435 440 445

Phe Val Ala Asp Pro Asp Lys Lys Gly Asn Ile Phe Ser His Gln Gly

450 455 460

Arg Ile Ser Cys His Phe Leu Asp Phe Phe Thr Arg Gln Thr Lys Gly

465 470 475 480

Lys His Pro Leu Gly Asp Leu Ala Ser His Gln Glu Ala Leu Gln Glu

485 490 495

Gly Thr Ser Asn Arg Leu His His Lys Asn Glu Val Val Ala Gln Gly

500 505 510

Tyr Glu Lys Leu Asp Gln Phe Lys Lys Glu Val Val Lys Leu Leu Ala

515 520 525

Glu Asn Lys Pro Lys Glu Leu Leu Asp Tyr Leu Val Ala Thr Ser Pro

530 535 540

Thr Gly Val Pro Asn Tyr Ser Met Leu Ser Lys Glu Thr Gln Asn Tyr

545 550 555 560

Ile Ala Tyr Asn Arg Asn Trp Pro Ala Ile Gln Lys Glu Leu Glu Lys

565 570 575

Ala Thr Ser Ile Pro Glu Ser Gln Lys Gln Asp Leu Ser Arg Leu Leu

580 585 590

Ser Arg Asp Asn Leu Gln His Asp Asn Leu Ser Ala Ile Thr Trp Ser

595 600 605

Lys Tyr Ser Ser Lys Pro Leu Leu Asp Val Glu Leu Asn Lys Ile Ala

610 615 620

Glu Gly Leu Glu Leu Thr Ala Lys Ile Tyr Asn Glu Lys Arg Gly Arg

625 630 635 640

Glu Trp Trp Phe Lys Gly Ser Arg Asn Glu Ala Arg Lys Thr Gln Cys

645 650 655

Glu Glu Leu Gln Arg Val Ser Lys Glu Ile Asn Thr Leu Leu Gln Ser

660 665 670

Glu Ser Leu Thr Lys Ser Gln Val Leu Glu Lys Val Leu Asn Ser Ile

675 680 685

Glu Thr Leu Asp Lys Ile Asp Arg Asp Ile Ser Ala Glu Ser Asn Trp

690 695 700

Phe Gln Ser Thr Leu Gln Lys Glu Val Arg Leu Phe Arg Asp Gln Leu

705 710 715 720

Lys Asp Ile Cys Gln Leu Asp Lys Tyr Ala Phe Lys Ser Thr Lys Leu

725 730 735

Asp Glu Ile Ile Ser Leu Glu Met Glu Glu Gln Phe Gln Lys Ile Gln

740 745 750

Asp Pro Ala Val Gln Gln Ile Val Arg Asp Leu Pro Ser His Cys His

755 760 765

Asn Asp Glu Ala Ile Glu Phe Phe Lys Thr Leu Asn Pro Glu Glu Ala

770 775 780

Ala Lys Val Ala Ser Tyr Leu Ser Leu Glu Tyr Arg Glu Ile Asn Lys

785 790 795 800

Ser Thr Asp Lys Lys Thr Leu Leu Glu Gln Asp Ile Pro Arg Leu Phe

805 810 815

Lys Glu Val Asn Thr Gln Leu Leu Ser Lys Leu Lys Glu Glu Lys Ala

820 825 830

Ile Asp Glu Gln Val His Glu Lys Leu Ser Gln Leu Ala Asp Lys Ile

835 840 845

Ala Pro Glu His Phe Thr Arg Asn Asn Ile Ile Lys Trp Ser Thr Asn

850 855 860

Pro Glu Lys Leu Glu Glu Ser Asn Leu Asn Glu Pro Ile Lys Ser Val

865 870 875 880

Gln Ser Pro Thr Thr Lys Gln Thr Ser Lys Gln Phe Arg Glu Ala Met

885 890 895

Gly Glu Ile Thr Gly Arg Asn Glu Pro Pro Thr Asp Thr Leu Tyr Thr

900 905 910

Gly Ile Ile Lys Lys

915

<210> 28

<211> 2754

<212> DNA

<213> 人工

<220>

<223> 来自嗜肺军团菌的SidC非常规基序

<400> 28

atggtgataa acatggttga cgtaatcaaa ttcaaagagc cggaacgttg tgattatcta 60

tatgttgatg aaaacaacaa agttcatatc cttttaccga ttgtaggagg agatgaaata 120

ggcctggata atacctgtca aacagcagtt gagttgatca catttttcta tggtagtgcg 180

cacagtggtg tgactaaata ttctgctgaa caccaactca gtgaatacaa aaggcaattg 240

gaagaagaca tcaaagccat caatagtcaa aagaaaattt cacctcatgc ttatgacgat 300

ttattaaaag agaaaataga acgcttacag caaattgaaa aatacattga attaattcaa 360

gtactaaaaa aacaatatga tgaacaaaat gatatcaggc aacttcgtac tggagggatt 420

ccgcaattac cctctggggt aaaggaaatc attaaatcct ctgaaaatgc tttcgctgtg 480

agactttctc catatgacaa cgataaattc actcgctttg atgacccttt attcaatgtc 540

aaaagaaaca tctcaaaata tgacacgccc tcaagacaag ctcctattcc aatatacgag 600

ggattaggtt atcgcctgcg ttcaacactg ttcccggaag ataaaacacc aactccaatt 660

aataaaaaat cacttaggga taaagttaaa agcactgttc ttagtcatta taaagatgaa 720

gatagaattg atggagaaaa aaaagatgaa aaattaaacg aactaattac taatcttcaa 780

aacgaacttg taaaagagtt agtaaaaagt gatcctcaat attcgaaact atctttatct 840

aaagatccaa gaggaaaaga aataaattac gattatttag taaatagttt gatgcttgta 900

gataacgact ctgaaattgg tgattggatt gatactattc tcgacgctac agtagattcc 960

actgtctggg tagctcaggc atccagccct ttctatgatg gtgctaaaga aatatcatca 1020

gaccgcgatg cggacaagat atccatcaga gttcagtacc tgttggccga agccaatatt 1080

tactgtaaaa caaacaaatt atcggatgct aactttggag aatttttcga caaagagcct 1140

catgctactg aaattgcgaa aagagtaaag gaaggattta cgcaaggtgc agatatagaa 1200

ccaattatat acgactatat taacagcaac catgccgagc tgggattaaa atctccgtta 1260

accggcaaac aacaacaaga aatcactgat aaatttacaa aacattataa tacgattaaa 1320

gaatctccac attttgatga gttttttgtc gctgatccgg ataaaaaagg caatatcttt 1380

tctcatcaag gcagaatcag ttgtcatttt ctggatttct ttactcgaca aaccaaaggc 1440

aaacatcctc ttggtgatct tgcaagtcat caggaagctc tccaggaagg aacctccaat 1500

cgcttacatc acaagaatga ggtagtagcc caggggtacg aaaaactgga tcaattcaag 1560

aaagaggttg tcaaactgct ggctgagaat aaaccaaaag aattattgga ttatttggtt 1620

gctacctcac ctacaggtgt tccaaattac tccatgcttt cgaaggaaac tcaaaattac 1680

attgcttata atcgtaactg gccagccatt caaaaagagc tggaaaaggc taccagcatc 1740

ccggagagtc aaaaacaaga tctttcaaga ttgctttctc gtgataattt acaacacgat 1800

aatctaagcg caattacctg gtcaaaatat tcctccaagc cattattgga tgtggaatta 1860

aataaaatcg ctgaaggatt agaactcact gcaaaaattt acaatgaaaa gagaggacgc 1920

gaatggtggt ttaaaggttc aagaaatgaa gctcgtaaga cccaatgtga agaattgcaa 1980

agagtatcca aagaaatcaa tactcttctg caaagtgaat ctttaacgaa aagccaggta 2040

cttgaaaagg ttttaaattc tatagaaaca ttagataaaa ttgacagaga catttctgcc 2100

gaatccaatt ggtttcaaag tactctgcaa aaggaagtca ggttatttcg agatcaattg 2160

aaagatattt gccaattgga caagtatgcc tttaaatcaa caaaacttga tgaaatcatc 2220

tctctggaaa tggaagaaca atttcaaaag atacaagatc ctgctgttca acaaattgtc 2280

agggacttgc cttctcattg ccacaatgat gaagcaattg aattctttaa gacattgaac 2340

cctgaagagg cagcaaaagt agctagctat ttaagcctgg aatacaggga aattaataaa 2400

tcaaccgata agaaaactct cctagaacaa gatattccca gactgtttaa agaagtcaat 2460

acgcagttac tctccaaact caaagaagaa aaagctattg atgagcaagt tcatgaaaaa 2520

ctcagtcaac tggctgacaa aattgcccct gagcatttta caagaaataa cattataaaa 2580

tggtctacca accctgaaaa gcttgaggaa tcaaatctta atgagccaat caaatcagtc 2640

caaagcccta ctactaaaca aacatcaaaa caattcaggg aagcgatggg tgaaatcact 2700

ggaagaaatg agcctcctac agacactttg tacacgggaa ttataaagaa atag 2754

<210> 29

<211> 765

<212> PRT

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(“EHEC”)O157:H7的SlrP新型E3连接酶

<400> 29

Met Phe Asn Ile Thr Asn Ile Gln Ser Thr Ala Arg His Gln Ser Ile

1 5 10 15

Ser Asn Glu Ala Ser Thr Glu Val Pro Leu Lys Glu Glu Ile Trp Asn

20 25 30

Lys Ile Ser Ala Phe Phe Ser Ser Glu His Gln Val Glu Ala Gln Asn

35 40 45

Cys Ile Ala Tyr Leu Cys His Pro Pro Glu Thr Ala Ser Pro Glu Glu

50 55 60

Ile Lys Ser Lys Phe Glu Cys Leu Arg Met Leu Ala Phe Pro Ala Tyr

65 70 75 80

Ala Asp Asn Ile Gln Tyr Ser Arg Gly Gly Ala Asp Gln Tyr Cys Ile

85 90 95

Leu Ser Glu Asn Ser Gln Glu Ile Leu Ser Ile Val Phe Asn Thr Glu

100 105 110

Gly Tyr Thr Val Glu Gly Gly Gly Lys Ser Val Thr Tyr Thr Arg Val

115 120 125

Thr Glu Ser Glu Gln Ala Ser Ser Ala Ser Gly Ser Lys Asp Ala Val

130 135 140

Asn Tyr Glu Leu Ile Trp Ser Glu Trp Val Lys Glu Ala Pro Ala Lys

145 150 155 160

Glu Ala Ala Asn Arg Glu Glu Pro Val Gln Arg Met Arg Asp Cys Leu

165 170 175

Lys Asn Asn Lys Thr Glu Leu Arg Leu Lys Ile Leu Gly Leu Thr Thr

180 185 190

Ile Pro Ala Tyr Ile Pro Glu Gln Ile Thr Thr Leu Ile Leu Asp Asn

195 200 205

Asn Glu Leu Lys Ser Leu Pro Glu Asn Leu Gln Gly Asn Ile Lys Thr

210 215 220

Leu Tyr Ala Asn Ser Asn Gln Leu Thr Ser Ile Pro Ala Thr Leu Pro

225 230 235 240

Asp Thr Ile Gln Glu Met Glu Leu Ser Ile Asn Arg Ile Thr Glu Leu

245 250 255

Pro Glu Arg Leu Pro Ser Ala Leu Gln Ser Leu Asp Leu Phe His Asn

260 265 270

Lys Ile Ser Cys Leu Pro Glu Asn Leu Pro Glu Glu Leu Arg Tyr Leu

275 280 285

Ser Val Tyr Asp Asn Ser Ile Arg Thr Leu Pro Ala His Leu Pro Ser

290 295 300

Glu Ile Thr His Leu Asn Val Gln Ser Asn Ser Leu Thr Ala Leu Pro

305 310 315 320

Glu Thr Leu Pro Pro Gly Leu Lys Thr Leu Glu Ala Gly Glu Asn Ala

325 330 335

Leu Thr Ser Leu Pro Ala Ser Leu Pro Pro Glu Leu Gln Val Leu Asp

340 345 350

Val Ser Lys Asn Gln Ile Thr Val Leu Pro Glu Thr Leu Pro Pro Thr

355 360 365

Ile Thr Thr Leu Asp Val Ser Arg Asn Ala Leu Thr Asn Leu Pro Glu

370 375 380

Asn Leu Pro Ala Ala Leu Gln Ile Met Gln Ala Ser Arg Asn Asn Leu

385 390 395 400

Val Arg Leu Pro Glu Ser Leu Pro His Phe Arg Gly Glu Gly Pro Gln

405 410 415

Pro Thr Arg Ile Ile Val Glu Tyr Asn Pro Phe Ser Glu Arg Thr Ile

420 425 430

Gln Asn Met Gln Arg Leu Met Ser Ser Val Asp Tyr Gln Gly Pro Arg

435 440 445

Val Leu Val Ala Met Gly Asp Phe Ser Ile Val Arg Val Thr Arg Pro

450 455 460

Leu His Gln Ala Val Gln Gly Trp Leu Thr Ser Leu Glu Glu Glu Asp

465 470 475 480

Val Asn Gln Trp Arg Ala Phe Glu Ala Glu Ala Asn Ala Ala Ala Phe

485 490 495

Ser Gly Phe Leu Asp Tyr Leu Gly Asp Thr Gln Asn Thr Arg His Pro

500 505 510

Asp Phe Lys Glu Gln Val Ser Ala Trp Leu Met Arg Leu Ala Glu Asp

515 520 525

Ser Ala Leu Arg Glu Thr Val Phe Ile Ile Ala Met Asn Ala Thr Ile

530 535 540

Ser Cys Glu Asp Arg Val Thr Leu Ala Tyr His Gln Met Gln Glu Ala

545 550 555 560

Thr Leu Val His Asp Ala Glu Arg Gly Ala Phe Asp Ser His Leu Ala

565 570 575

Glu Leu Ile Met Ala Gly Arg Glu Ile Phe Arg Leu Glu Gln Ile Glu

580 585 590

Ser Leu Ala Arg Glu Lys Val Lys Arg Leu Phe Phe Ile Asp Glu Val

595 600 605

Glu Val Phe Leu Gly Phe Gln Asn Gln Leu Arg Glu Ser Leu Ser Leu

610 615 620

Thr Thr Met Thr Arg Asp Met Arg Phe Tyr Asn Val Ser Gly Ile Thr

625 630 635 640

Glu Ser Asp Leu Asp Glu Ala Glu Ile Arg Ile Lys Met Ala Glu Asn

645 650 655

Arg Asp Phe His Lys Trp Phe Ala Leu Trp Gly Pro Trp His Lys Val

660 665 670

Leu Glu Arg Ile Ala Pro Glu Glu Trp Arg Glu Met Met Ala Lys Arg

675 680 685

Asp Glu Cys Ile Glu Thr Asp Glu Tyr Gln Ser Arg Val Asn Ala Glu

690 695 700

Leu Glu Asp Leu Arg Ile Ala Asp Asp Ser Asp Ala Glu Arg Thr Thr

705 710 715 720

Glu Val Gln Met Asp Ala Glu Arg Ala Ile Gly Ile Lys Ile Met Glu

725 730 735

Glu Ile Asn Gln Thr Leu Phe Thr Glu Ile Met Glu Asn Ile Leu Leu

740 745 750

Lys Lys Glu Val Ser Ser Leu Met Ser Ala Tyr Trp Arg

755 760 765

<210> 30

<211> 2298

<212> DNA

<213> 人工

<220>

<223> 来自肠出血性大肠杆菌(“EHEC”)O157:H7的SlrP新型E3连接酶

<400> 30

atgtttaata ttactaatat acaatctacg gcaaggcatc aaagtattag caatgaggcc 60

tcaacagagg tgcctttaaa agaagagata tggaataaaa taagtgcctt tttctcttca 120

gaacatcagg ttgaagcaca aaactgcatc gcttatcttt gtcatccacc tgaaaccgcc 180

tcgccagaag agatcaaaag caagtttgaa tgtttaagga tgttagcttt cccggcgtat 240

gcggataata ttcagtatag tagaggaggg gcagaccaat actgtatttt gagtgaaaat 300

agtcaggaaa ttctgtctat agtttttaat acagagggct ataccgttga gggaggggga 360

aagtcagtca cctatacccg tgtgacagaa agcgagcagg cgagtagcgc ttccggctcc 420

aaagatgctg tgaattatga gttaatctgg tctgagtggg taaaagaggc gccagcgaaa 480

gaggcagcaa atcgtgaaga acccgtacaa cggatgcgtg actgcctgaa aaataataag 540

acggaacttc gtctgaaaat attaggactt accactatac ctgcctatat tcctgagcag 600

ataactactc tgatactcga taacaatgaa ctgaaaagtt tgccggaaaa tttacaggga 660

aatataaaga ccctgtatgc caacagtaat cagctaacca gtatccctgc cacgttaccg 720

gataccatac aggaaatgga gctgagcatt aaccgtatta ctgaattgcc ggaacgtttg 780

ccttcagcgc ttcaatcgct ggatcttttc cataataaaa ttagttgctt acctgaaaat 840

ctacctgagg aacttcggta cctgagcgtt tatgataaca gcataaggac actgccagca 900

catcttccgt cagagattac ccatttgaat gtgcagagta attcgttaac cgctttgcct 960

gaaacattgc cgccgggcct gaagactctg gaggccggcg aaaatgcctt aaccagtctg 1020

cccgcatcgt taccaccaga attacaggtc ctggatgtaa gtaaaaatca gattacggtt 1080

ctgcctgaaa cacttcctcc cacgataaca acgctggatg tttcccgtaa cgcattgact 1140

aatctaccgg aaaacctccc ggcggcatta caaataatgc aggcctctcg caataacctg 1200

gtccgtctcc cggagtcgtt accccatttt cgtggtgaag gacctcaacc tacaagaata 1260

atcgtagaat ataatccttt ttcagaacga acaatacaga atatgcagcg gctaatgtcc 1320

tctgtagatt atcagggacc ccgggtattg gttgccatgg gcgacttttc aattgttcgg 1380

gtaactcgac cactgcatca agctgtccag gggtggctaa ccagtctcga ggaggaagac 1440

gtcaaccaat ggcgggcgtt tgaggcagag gcaaacgcgg cggctttcag cggattcctg 1500

gactatcttg gtgatacgca gaatacccga cacccggatt ttaaggaaca agtctccgcc 1560

tggctaatgc gcctggctga agatagcgca ctaagagaaa ccgtatttat tatagcgatg 1620

aatgcaacga taagctgtga agatcgggtc acactggcat accaccaaat gcaggaagcg 1680

acgttggttc atgatgctga aagaggcgcc tttgatagcc acttagcgga actgattatg 1740

gcggggcgtg aaatctttcg gctggagcaa atagaatcgc tcgccagaga aaaggtaaaa 1800

cggctgtttt ttattgacga agtcgaagta tttctggggt ttcagaatca gttacgagag 1860

tcgctgtcgc tgacaacaat gacccgggat atgcgatttt ataacgtttc gggtatcact 1920

gagtctgacc tggacgaggc ggaaataagg ataaaaatgg ctgaaaatag ggattttcac 1980

aaatggtttg cgctgtgggg gccgtggcat aaagtgctgg agcgcatagc gccagaagag 2040

tggcgtgaaa tgatggctaa aagggatgag tgtattgaaa cggatgagta tcagagccgg 2100

gtcaatgctg aactggaaga tttaagaata gcagacgact ctgacgcaga gcgtactact 2160

gaggtacaga tggatgcaga gcgtgctatt gggataaaaa taatggaaga gatcaatcag 2220

accctcttta ctgagatcat ggagaatata ttgctgaaaa aagaggtgag ctcgctcatg 2280

agcgcctact ggcgatag 2298

<210> 31

<211> 782

<212> PRT

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SopA HECT基序

<400> 31

Met Lys Ile Ser Ser Gly Ala Ile Asn Phe Ser Thr Ile Pro Asn Gln

1 5 10 15

Val Lys Lys Leu Ile Thr Ser Ile Arg Glu His Thr Lys Asn Gly Leu

20 25 30

Thr Ser Lys Ile Thr Ser Val Lys Asn Thr His Thr Ser Leu Asn Glu

35 40 45

Lys Phe Lys Thr Gly Lys Asp Ser Pro Ile Glu Phe Ala Leu Pro Gln

50 55 60

Lys Ile Lys Asp Phe Phe Gln Pro Lys Asp Lys Asn Thr Leu Asn Lys

65 70 75 80

Thr Leu Ile Thr Val Lys Asn Ile Lys Asp Thr Asn Asn Ala Gly Lys

85 90 95

Lys Asn Ile Ser Ala Glu Asp Val Ser Lys Met Asn Ala Ala Phe Met

100 105 110

Arg Lys His Ile Ala Asn Gln Thr Cys Asp Tyr Asn Tyr Arg Met Thr

115 120 125

Gly Ala Ala Pro Leu Pro Gly Gly Val Ser Val Ser Ala Asn Asn Arg

130 135 140

Pro Thr Val Ser Glu Gly Arg Thr Pro Pro Val Ser Pro Ser Leu Ser

145 150 155 160

Leu Gln Ala Thr Ser Ser Pro Ser Ser Pro Ala Asp Trp Ala Lys Lys

165 170 175

Leu Thr Asp Ala Val Leu Arg Gln Lys Ala Gly Glu Thr Leu Thr Ala

180 185 190

Ala Asp Arg Asp Phe Ser Asn Ala Asp Phe Arg Asn Ile Thr Phe Ser

195 200 205

Lys Ile Leu Pro Pro Ser Phe Met Glu Arg Asp Gly Asp Ile Ile Lys

210 215 220

Gly Phe Asn Phe Ser Asn Ser Lys Phe Thr Tyr Ser Asp Ile Ser His

225 230 235 240

Leu His Phe Asp Glu Cys Arg Phe Thr Tyr Ser Thr Leu Ser Asp Val

245 250 255

Val Cys Ser Asn Thr Lys Phe Ser Asn Ser Asp Met Asn Glu Val Phe

260 265 270

Leu Gln Tyr Ser Ile Thr Thr Gln Gln Gln Pro Ser Phe Ile Asp Thr

275 280 285

Thr Leu Lys Asn Thr Leu Ile Arg His Lys Ala Asn Leu Ser Gly Val

290 295 300

Ile Leu Asn Glu Pro Asp Asn Ser Ser Pro Pro Ser Val Ser Gly Gly

305 310 315 320

Gly Asn Phe Ile Arg Leu Gly Asp Ile Trp Leu Gln Met Pro Leu Leu

325 330 335

Trp Thr Glu Asn Ala Val Asp Gly Phe Leu Asn His Glu His Asn Asn

340 345 350

Gly Lys Ser Ile Leu Met Thr Ile Asp Ser Leu Pro Asp Lys Tyr Ser

355 360 365

Gln Glu Lys Val Gln Ala Met Glu Asp Leu Val Lys Ser Leu Arg Gly

370 375 380

Gly Arg Leu Thr Glu Ala Cys Ile Arg Pro Val Glu Ser Ser Leu Val

385 390 395 400

Ser Val Leu Ala His Pro Pro Tyr Thr Gln Ser Ala Leu Ile Ser Glu

405 410 415

Trp Leu Gly Pro Val Gln Glu Arg Phe Phe Ala His Gln Cys Gln Thr

420 425 430

Tyr Asn Asp Val Pro Leu Pro Ala Pro Asp Thr Tyr Tyr Gln Gln Arg

435 440 445

Ile Leu Pro Val Leu Leu Asp Ser Phe Asp Arg Asn Ser Ala Ala Met

450 455 460

Thr Thr His Ser Gly Leu Phe Asn Gln Val Ile Leu His Cys Met Thr

465 470 475 480

Gly Val Asp Cys Thr Asp Gly Thr Arg Gln Lys Ala Ala Ala Leu Tyr

485 490 495

Glu Gln Tyr Leu Ala His Pro Ala Val Ser Pro His Ile His Asn Gly

500 505 510

Leu Phe Gly Asn Tyr Asp Gly Ser Pro Asp Trp Thr Thr Arg Ala Ala

515 520 525

Asp Asn Phe Leu Leu Leu Ser Ser Gln Asp Ser Asp Thr Ala Met Met

530 535 540

Leu Ser Thr Asp Thr Leu Leu Thr Met Leu Asn Pro Thr Pro Asp Thr

545 550 555 560

Ala Trp Asp Asn Phe Tyr Leu Leu Arg Ala Gly Glu Asn Val Ser Thr

565 570 575

Ala Gln Ile Ser Pro Val Glu Leu Phe Arg His Asp Phe Pro Val Phe

580 585 590

Leu Ala Ala Phe Asn Gln Gln Ala Thr Gln Arg Arg Phe Gly Glu Leu

595 600 605

Ile Asp Ile Ile Leu Ser Thr Glu Glu His Gly Glu Leu Asn Gln Gln

610 615 620

Phe Leu Ala Ala Thr Asn Gln Lys His Ser Thr Val Lys Leu Ile Asp

625 630 635 640

Asp Ala Ser Val Ser Arg Leu Ala Thr Ile Phe Asp Pro Leu Leu Pro

645 650 655

Glu Gly Lys Leu Ser Pro Ala His Tyr Gln His Ile Leu Ser Ala Tyr

660 665 670

His Leu Thr Asp Ala Thr Pro Gln Lys Gln Ala Glu Thr Leu Phe Cys

675 680 685

Leu Ser Thr Ala Phe Ala Arg Tyr Ser Ser Ser Ala Ile Phe Gly Thr

690 695 700

Glu His Asp Ser Pro Pro Ala Leu Arg Gly Tyr Ala Glu Ala Leu Met

705 710 715 720

Gln Lys Ala Trp Glu Leu Ser Pro Ala Ile Phe Pro Ser Ser Glu Gln

725 730 735

Phe Thr Glu Trp Ser Asp Arg Phe His Gly Leu His Gly Ala Phe Thr

740 745 750

Cys Thr Ser Val Val Ala Asp Ser Met Gln Arg His Ala Arg Lys Tyr

755 760 765

Phe Pro Ser Val Leu Ser Ser Ile Leu Pro Leu Ala Trp Ala

770 775 780

<210> 32

<211> 2349

<212> DNA

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SopA HECT基序

<400> 32

atgaagatat catcaggcgc aattaatttt tctactattc ctaaccaggt taaaaaatta 60

attacctcta ttcgtgaaca tacgaaaaac gggctcacct caaaaataac cagtgttaaa 120

aacacgcata catctttaaa tgaaaaattt aaaacaggaa aggactcacc gattgagttc 180

gcgttaccac aaaaaataaa agacttcttt cagccgaaag ataaaaacac cttaaacaaa 240

acattgatta ctgttaaaaa tattaaagat acaaataatg caggcaagaa aaatatttca 300

gcagaagatg tctcaaaaat gaatgcagca ttcatgcgta agcatattgc aaatcaaaca 360

tgtgattata attacagaat gacaggtgcg gccccgctcc ccggtggagt ctctgtatca 420

gccaataaca ggcccacggt ttctgaaggt agaacaccac cagtatcccc ctccctctca 480

cttcaggcta cctcttcccc gtcatcacct gccgactggg ctaagaaact cacggatgca 540

gttttacgac agaaagccgg agaaaccctt acggccgcag atcgcgattt ttcaaacgca 600

gatttccgta atattacatt cagcaaaata ttgcccccca gcttcatgga gcgagacggc 660

gatattatta aggggttcaa cttttcaaat tcaaaattta cttattctga tatatctcat 720

ttacattttg acgaatgccg attcacttat tcgacactga gtgatgtagt ctgcagtaat 780

acgaaattta gtaattcaga catgaatgaa gtgtttttac agtattcaat tactacacaa 840

caacagccct cgtttattga tacaacatta aaaaatacgc ttatacgtca caaagccaac 900

ctctctggcg ttattttaaa tgaaccggat aattcatcac ctccgtcagt gtcagggggc 960

ggaaatttta ttcgtctagg tgatatctgg ctgcaaatgc cactcctttg gactgagaac 1020

gctgtggatg gatttttaaa tcatgagcac aataatggta aaagtattct gatgaccatt 1080

gacagcctgc ccgataaata cagtcaggaa aaagtccagg caatggaaga cctggttaag 1140

tcattgcggg gtggccgctt aacagaggca tgtatccggc cagttgaaag ttcgctggta 1200

agcgtactgg cccacccccc ctatacgcaa agtgcgctta tcagcgagtg gctcgggcct 1260

gttcaggaac gtttttttgc ccaccagtgc cagacctata atgacgttcc cctgccggct 1320

cctgacacat attatcagca gcgcatactg cctgtgttgc tggattcgtt tgacaggaac 1380

agcgccgcca tgaccactca cagcggactc tttaatcagg tgattttaca ctgtatgaca 1440

ggcgtggact gcactgatgg cacccgccag aaagctgcag cgctttatga acagtatctt 1500

gctcacccgg cggtgtctcc ccacatccat aatgggctct tcggcaatta tgatggcagc 1560

ccggactgga caacccgcgc tgcagataat ttcctgctgc tttcctccca agattcagac 1620

acggcgatga tgctctccac tgacacgctg ttaacaatgc taaaccctac tcctgacact 1680

gcatgggaca acttttacct gctgcgagcc ggagagaacg tttccaccgc gcaaatctct 1740

ccggtagagt tattccgtca tgactttccg gtgtttctcg ccgcatttaa tcagcaggcc 1800

acgcagcgac gctttgggga gctgattgat atcatcctca gcactgaaga gcacggggag 1860

ctgaaccagc agtttcttgc cgccacgaac cagaaacatt ccaccgtgaa gttgattgat 1920

gatgcctcag tgtcgcgtct ggccaccatt tttgacccct tgcttcctga aggcaaactc 1980

agcccggcac actaccagca catcctcagt gcttatcacc tgacggacgc caccccacag 2040

aagcaggcgg aaaccctgtt ctgtctcagt accgcattcg cacgctattc ctccagcgcc 2100

attttcggca ctgagcatga ctctccgccg gccctgagag gctatgcgga ggcgctgatg 2160

cagaaagcct gggagctgtc tccggcgata ttcccatcca gcgaacagtt taccgagtgg 2220

tccgaccgtt ttcacggcct ccatggcgcc tttacctgta ccagcgttgt ggcggatagt 2280

atgcaacgtc atgccagaaa atatttcccg agtgttctgt catccatcct gccactggcc 2340

tgggcgtaa 2349

<210> 33

<211> 700

<212> PRT

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SspH1新型E3连接酶

<400> 33

Met Phe Asn Ile Arg Asn Thr Gln Pro Ser Val Ser Met Gln Ala Ile

1 5 10 15

Ala Gly Ala Ala Ala Pro Glu Ala Ser Pro Glu Glu Ile Val Trp Glu

20 25 30

Lys Ile Gln Val Phe Phe Pro Gln Glu Asn Tyr Glu Glu Ala Gln Gln

35 40 45

Cys Leu Ala Glu Leu Cys His Pro Ala Arg Gly Met Leu Pro Asp His

50 55 60

Ile Ser Ser Gln Phe Ala Arg Leu Lys Ala Leu Thr Phe Pro Ala Trp

65 70 75 80

Glu Glu Asn Ile Gln Cys Asn Arg Asp Gly Ile Asn Gln Phe Cys Ile

85 90 95

Leu Asp Ala Gly Ser Lys Glu Ile Leu Ser Ile Thr Leu Asp Asp Ala

100 105 110

Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Ala His Asp Phe

115 120 125

Ile Met Asp Thr Glu Pro Gly Glu Glu Cys Thr Glu Phe Ala Glu Gly

130 135 140

Ala Ser Gly Thr Ser Leu Arg Pro Ala Thr Thr Val Ser Gln Lys Ala

145 150 155 160

Ala Glu Tyr Asp Ala Val Trp Ser Lys Trp Glu Arg Asp Ala Pro Ala

165 170 175

Gly Glu Ser Pro Gly Arg Ala Ala Val Val Gln Glu Met Arg Asp Cys

180 185 190

Leu Asn Asn Gly Asn Pro Val Leu Asn Val Gly Ala Ser Gly Leu Thr

195 200 205

Thr Leu Pro Asp Arg Leu Pro Pro His Ile Thr Thr Leu Val Ile Pro

210 215 220

Asp Asn Asn Leu Thr Ser Leu Pro Glu Leu Pro Glu Gly Leu Arg Glu

225 230 235 240

Leu Glu Val Ser Gly Asn Leu Gln Leu Thr Ser Leu Pro Ser Leu Pro

245 250 255

Gln Gly Leu Gln Lys Leu Trp Ala Tyr Asn Asn Trp Leu Ala Ser Leu

260 265 270

Pro Thr Leu Pro Pro Gly Leu Gly Asp Leu Ala Val Ser Asn Asn Gln

275 280 285

Leu Thr Ser Leu Pro Glu Met Pro Pro Ala Leu Arg Glu Leu Arg Val

290 295 300

Ser Gly Asn Asn Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu Gln

305 310 315 320

Lys Leu Trp Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Glu Met Ser

325 330 335

Pro Gly Leu Gln Glu Leu Asp Val Ser His Asn Gln Leu Thr Arg Leu

340 345 350

Pro Gln Ser Leu Thr Gly Leu Ser Ser Ala Ala Arg Val Tyr Leu Asp

355 360 365

Gly Asn Pro Leu Ser Val Arg Thr Leu Gln Ala Leu Arg Asp Ile Ile

370 375 380

Gly His Ser Gly Ile Arg Ile His Phe Asp Met Ala Gly Pro Ser Val

385 390 395 400

Pro Arg Glu Ala Arg Ala Leu His Leu Ala Val Ala Asp Trp Leu Thr

405 410 415

Ser Ala Arg Glu Gly Glu Ala Ala Gln Ala Asp Arg Trp Gln Ala Phe

420 425 430

Gly Leu Glu Asp Asn Ala Ala Ala Phe Ser Leu Val Leu Asp Arg Leu

435 440 445

Arg Glu Thr Glu Asn Phe Lys Lys Asp Ala Gly Phe Lys Ala Gln Ile

450 455 460

Ser Ser Trp Leu Thr Gln Leu Ala Glu Asp Ala Ala Leu Arg Ala Lys

465 470 475 480

Thr Phe Ala Met Ala Thr Glu Ala Thr Ser Thr Cys Glu Asp Arg Val

485 490 495

Thr His Ala Leu His Gln Met Asn Asn Val Gln Leu Val His Asn Ala

500 505 510

Glu Lys Gly Glu Tyr Asp Asn Asn Leu Gln Gly Leu Val Ser Thr Gly

515 520 525

Arg Glu Met Phe Arg Leu Ala Thr Leu Glu Gln Ile Ala Arg Glu Lys

530 535 540

Ala Gly Thr Leu Ala Leu Val Asp Asp Val Glu Val Tyr Leu Ala Phe

545 550 555 560

Gln Asn Lys Leu Lys Glu Ser Leu Glu Leu Thr Ser Val Thr Ser Glu

565 570 575

Met Arg Phe Phe Asp Val Ser Gly Val Thr Val Ser Asp Leu Gln Ala

580 585 590

Ala Glu Leu Gln Val Lys Thr Ala Glu Asn Ser Gly Phe Ser Lys Trp

595 600 605

Ile Leu Gln Trp Gly Pro Leu His Ser Val Leu Glu Arg Lys Val Pro

610 615 620

Glu Arg Phe Asn Ala Leu Arg Glu Lys Gln Ile Ser Asp Tyr Glu Asp

625 630 635 640

Thr Tyr Arg Lys Leu Tyr Asp Glu Val Leu Lys Ser Ser Gly Leu Val

645 650 655

Asp Asp Thr Asp Ala Glu Arg Thr Ile Gly Val Ser Ala Met Asp Ser

660 665 670

Ala Lys Lys Glu Phe Leu Asp Gly Leu Arg Ala Leu Val Asp Glu Val

675 680 685

Leu Gly Ser Tyr Leu Thr Ala Arg Trp Arg Leu Asn

690 695 700

<210> 34

<211> 2103

<212> DNA

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SspH1新型E3连接酶

<400> 34

atgtttaata tccgcaatac acaaccttct gtaagtatgc aggctattgc tggtgcagcg 60

gcaccagagg catctccgga agaaattgta tgggaaaaaa ttcaggtttt tttcccgcag 120

gaaaattacg aagaagcgca acagtgtctc gctgaacttt gccatccggc ccggggaatg 180

ttgcctgatc atatcagcag ccagtttgcg cgtttaaaag cgcttacctt ccccgcgtgg 240

gaggagaata ttcagtgtaa cagggatggt ataaatcagt tttgtattct ggatgcaggc 300

agcaaggaga tattgtcaat cactcttgat gatgccggga actataccgt gaattgtcag 360

gggtacagtg aagcacatga cttcatcatg gacacagaac cgggagagga atgcacagaa 420

ttcgcggagg gggcatccgg gacatccctc cgccctgcca caacggtttc acagaaggca 480

gcagagtatg atgctgtctg gtcaaaatgg gaaagggatg caccagcagg agagtcaccc 540

ggccgcgcag cagtggtaca ggaaatgcgt gattgcctga ataacggcaa tccagtgctt 600

aacgtgggag cgtcaggtct taccacctta ccagaccgtt taccaccgca tattacaaca 660

ctggttattc ctgataataa tctgaccagc ctgccggagt tgccggaagg actacgggag 720

ctggaggtct ctggtaacct acaactgacc agcctgccat cgctgccgca gggactacag 780

aagctgtggg cctataataa ttggctggcc agcctgccga cgttgccgcc aggactaggg 840

gatctggcgg tctctaataa ccagctgacc agcctgccgg agatgccgcc agcactacgg 900

gagctgaggg tctctggtaa caacctgacc agcctgccgg cgctgccgtc aggactacag 960

aagctgtggg cctataataa tcggctgacc agcctgccgg agatgtcgcc aggactacag 1020

gagctggatg tctctcataa ccagctgacc cgcctgccgc aaagcctcac gggtctgtct 1080

tcagcggcac gcgtatatct ggacgggaat ccactgtctg tacgcactct gcaggctctg 1140

cgggacatca ttggccattc aggcatcagg atacacttcg atatggcggg gccttccgtc 1200

ccccgggaag cccgggcact gcacctggcg gtcgctgact ggctgacgtc tgcacgggag 1260

ggggaagcgg cccaggcaga cagatggcag gcgttcggac tggaagataa cgccgccgcc 1320

ttcagcctgg tcctggacag actgcgtgag acggaaaact tcaaaaaaga cgcgggcttt 1380

aaggcacaga tatcatcctg gctgacacaa ctggctgaag atgctgcgct gagagcaaaa 1440

acctttgcca tggcaacaga ggcaacatca acctgcgagg accgggtcac acatgccctg 1500

caccagatga ataacgtaca actggtacat aatgcagaaa aaggggaata cgacaacaat 1560

ctccaggggc tggtttccac ggggcgtgag atgttccgcc tggcaacact ggaacagatt 1620

gcccgggaaa aagccggaac actggcttta gtcgatgacg ttgaggtcta tctggcgttc 1680

cagaataagc tgaaggaatc acttgagctg accagcgtga cgtcagaaat gcgtttcttt 1740

gacgtttccg gcgtgacggt ttcagacctt caggctgcgg agcttcaggt gaaaaccgct 1800

gaaaacagcg ggttcagtaa atggatactg cagtgggggc cgttacacag cgtgctggaa 1860

cgcaaagtgc cggaacgctt taacgcgctt cgtgaaaagc aaatatcgga ttatgaagac 1920

acgtaccgga agctgtatga cgaagtgctg aaatcgtccg ggctggtcga cgataccgat 1980

gcagaacgta ctatcggagt aagtgcgatg gatagtgcga aaaaagaatt tctggatggc 2040

ctgcgcgctc ttgtggatga ggtgctgggt agctatctga cagcccggtg gcgtcttaac 2100

taa 2103

<210> 35

<211> 788

<212> PRT

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SspH2新型E3连接酶

<400> 35

Met Pro Phe His Ile Gly Ser Gly Cys Leu Pro Ala Thr Ile Ser Asn

1 5 10 15

Arg Arg Ile Tyr Arg Ile Ala Trp Ser Asp Thr Pro Pro Glu Met Ser

20 25 30

Ser Trp Glu Lys Met Lys Glu Phe Phe Cys Ser Thr His Gln Thr Glu

35 40 45

Ala Leu Glu Cys Ile Trp Thr Ile Cys His Pro Pro Ala Gly Thr Thr

50 55 60

Arg Glu Asp Val Ile Asn Arg Phe Glu Leu Leu Arg Thr Leu Ala Tyr

65 70 75 80

Ala Gly Trp Glu Glu Ser Ile His Ser Gly Gln His Gly Glu Asn Tyr

85 90 95

Phe Cys Ile Leu Asp Glu Asp Ser Gln Glu Ile Leu Ser Val Thr Leu

100 105 110

Asp Asp Ala Gly Asn Tyr Thr Val Asn Cys Gln Gly Tyr Ser Glu Thr

115 120 125

His Arg Leu Thr Leu Asp Thr Ala Gln Gly Glu Glu Gly Thr Gly His

130 135 140

Ala Glu Gly Ala Ser Gly Thr Phe Arg Thr Ser Phe Leu Pro Ala Thr

145 150 155 160

Thr Ala Pro Gln Thr Pro Ala Glu Tyr Asp Ala Val Trp Ser Ala Trp

165 170 175

Arg Arg Ala Ala Pro Ala Glu Glu Ser Arg Gly Arg Ala Ala Val Val

180 185 190

Gln Lys Met Arg Ala Cys Leu Asn Asn Gly Asn Ala Val Leu Asn Val

195 200 205

Gly Glu Ser Gly Leu Thr Thr Leu Pro Asp Cys Leu Pro Ala His Ile

210 215 220

Thr Thr Leu Val Ile Pro Asp Asn Asn Leu Thr Ser Leu Pro Ala Leu

225 230 235 240

Pro Pro Glu Leu Arg Thr Leu Glu Val Ser Gly Asn Gln Leu Thr Ser

245 250 255

Leu Pro Val Leu Pro Pro Gly Leu Leu Glu Leu Ser Ile Phe Ser Asn

260 265 270

Pro Leu Thr His Leu Pro Ala Leu Pro Ser Gly Leu Cys Lys Leu Trp

275 280 285

Ile Phe Gly Asn Gln Leu Thr Ser Leu Pro Val Leu Pro Pro Gly Leu

290 295 300

Gln Glu Leu Ser Val Ser Asp Asn Gln Leu Ala Ser Leu Pro Ala Leu

305 310 315 320

Pro Ser Glu Leu Cys Lys Leu Trp Ala Tyr Asn Asn Gln Leu Thr Ser

325 330 335

Leu Pro Met Leu Pro Ser Gly Leu Gln Glu Leu Ser Val Ser Asp Asn

340 345 350

Gln Leu Ala Ser Leu Pro Thr Leu Pro Ser Glu Leu Tyr Lys Leu Trp

355 360 365

Ala Tyr Asn Asn Arg Leu Thr Ser Leu Pro Ala Leu Pro Ser Gly Leu

370 375 380

Lys Glu Leu Ile Val Ser Gly Asn Arg Leu Thr Ser Leu Pro Val Leu

385 390 395 400

Pro Ser Glu Leu Lys Glu Leu Met Val Ser Gly Asn Arg Leu Thr Ser

405 410 415

Leu Pro Met Leu Pro Ser Gly Leu Leu Ser Leu Ser Val Tyr Arg Asn

420 425 430

Gln Leu Thr Arg Leu Pro Glu Ser Leu Ile His Leu Ser Ser Glu Thr

435 440 445

Thr Val Asn Leu Glu Gly Asn Pro Leu Ser Glu Arg Thr Leu Gln Ala

450 455 460

Leu Arg Glu Ile Thr Ser Ala Pro Gly Tyr Ser Gly Pro Ile Ile Arg

465 470 475 480

Phe Asp Met Ala Gly Ala Ser Ala Pro Arg Glu Thr Arg Ala Leu His

485 490 495

Leu Ala Ala Ala Asp Trp Leu Val Pro Ala Arg Glu Gly Glu Pro Ala

500 505 510

Pro Ala Asp Arg Trp His Met Phe Gly Gln Glu Asp Asn Ala Asp Ala

515 520 525

Phe Ser Leu Phe Leu Asp Arg Leu Ser Glu Thr Glu Asn Phe Ile Lys

530 535 540

Asp Ala Gly Phe Lys Ala Gln Ile Ser Ser Trp Leu Ala Gln Leu Ala

545 550 555 560

Glu Asp Glu Ala Leu Arg Ala Asn Thr Phe Ala Met Ala Thr Glu Ala

565 570 575

Thr Ser Ser Cys Glu Asp Arg Val Thr Phe Phe Leu His Gln Met Lys

580 585 590

Asn Val Gln Leu Val His Asn Ala Glu Lys Gly Gln Tyr Asp Asn Asp

595 600 605

Leu Ala Ala Leu Val Ala Thr Gly Arg Glu Met Phe Arg Leu Gly Lys

610 615 620

Leu Glu Gln Ile Ala Arg Glu Lys Val Arg Thr Leu Ala Leu Val Asp

625 630 635 640

Glu Ile Glu Val Trp Leu Ala Tyr Gln Asn Lys Leu Lys Lys Ser Leu

645 650 655

Gly Leu Thr Ser Val Thr Ser Glu Met Arg Phe Phe Asp Val Ser Gly

660 665 670

Val Thr Val Thr Asp Leu Gln Asp Ala Glu Leu Gln Val Lys Ala Ala

675 680 685

Glu Lys Ser Glu Phe Arg Glu Trp Ile Leu Gln Trp Gly Pro Leu His

690 695 700

Arg Val Leu Glu Arg Lys Ala Pro Glu Arg Val Asn Ala Leu Arg Glu

705 710 715 720

Lys Gln Ile Ser Asp Tyr Glu Glu Thr Tyr Arg Met Leu Ser Asp Thr

725 730 735

Glu Leu Arg Pro Ser Gly Leu Val Gly Asn Thr Asp Ala Glu Arg Thr

740 745 750

Ile Gly Ala Arg Ala Met Glu Ser Ala Lys Lys Thr Phe Leu Asp Gly

755 760 765

Leu Arg Pro Leu Val Glu Glu Met Leu Gly Ser Tyr Leu Asn Val Gln

770 775 780

Trp Arg Arg Asn

785

<210> 36

<211> 2367

<212> DNA

<213> 人工

<220>

<223> 来自鼠伤寒沙门氏菌的SspH2新型E3连接酶

<400> 36

atgccctttc atattggaag cggatgtctt cccgccacca tcagtaatcg ccgcatttat 60

cgtattgcct ggtctgatac cccccctgaa atgagttcct gggaaaaaat gaaggaattt 120

ttttgctcaa cgcaccagac tgaagcgctg gagtgcatct ggacgatttg tcacccgccg 180

gccggaacga cgcgggagga tgtgatcaac agatttgaac tgctcaggac gctcgcgtat 240

gccggatggg aggaaagcat tcattccggc cagcacgggg aaaattactt ctgtattctg 300

gatgaagaca gtcaggagat attgtcagtc acccttgatg atgccgggaa ctataccgta 360

aattgccagg ggtacagtga aacacatcgc ctcaccctgg acacagcaca gggtgaggag 420

ggcacaggac acgcggaagg ggcatccggg acattcagga catccttcct ccctgccaca 480

acggctccac agacgccagc agagtatgat gctgtctggt cagcgtggag aagggctgca 540

cccgcagaag agtcacgcgg ccgtgcagca gtggtacaga aaatgcgtgc ctgcctgaat 600

aatggcaatg cagtgcttaa cgtgggagaa tcaggtctta ccaccttgcc agactgttta 660

cccgcgcata ttaccacact ggttattcct gataataatc tgaccagcct gccggcgctg 720

ccgccagaac tgcggacgct ggaggtctct ggtaaccagc tgactagcct gccggtgctg 780

ccgccaggac tactggaact gtcgatcttt agtaacccgc tgacccacct gccggcgctg 840

ccgtcaggac tatgtaagct gtggatcttt ggtaatcaac tgaccagcct gccggtgttg 900

ccgccagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccggcgctg 960

ccgtcagaat tatgtaagct gtgggcctat aataaccagc tgaccagcct gccgatgttg 1020

ccgtcagggc tacaggagct gtcggtatct gataaccaac tggccagcct gccgacgctg 1080

ccgtcagaat tatataagct gtgggcctat aataatcggc tgaccagcct gccggcgttg 1140

ccgtcaggac tgaaggagct gattgtatct ggtaaccggc tgaccagtct gccggtgctg 1200

ccgtcagaac tgaaggagct gatggtatct ggtaaccggc tgaccagcct gccgatgctg 1260

ccgtcaggac tactgtcgct gtcggtctat cgtaaccagc tgacccgcct gccggaaagt 1320

ctcattcatc tgtcttcaga gacaaccgta aatctggaag ggaacccact gtctgaacgt 1380

actttgcagg cgctgcggga gatcaccagc gcgcctggct attcaggccc cataatacga 1440

ttcgatatgg cgggagcctc cgccccccgg gaaactcggg cactgcacct ggcggccgct 1500

gactggctgg tgcctgcccg ggagggggaa ccggctcctg cagacagatg gcatatgttc 1560

ggacaggaag ataacgccga cgcattcagc ctcttcctgg acagactgag tgagacggaa 1620

aacttcataa aggacgcggg gtttaaggca cagatatcgt cctggctggc acaactggct 1680

gaagatgagg cgttaagagc aaacaccttt gctatggcaa cagaggcaac ctcaagctgc 1740

gaggaccggg tcacattttt tttgcaccag atgaagaacg tacagctggt acataatgca 1800

gaaaaagggc aatacgataa cgatctcgcg gcgctggttg ccacggggcg tgagatgttc 1860

cgtctgggaa aactggaaca gattgcccgg gaaaaggtca gaacgctggc tctcgttgat 1920

gaaattgagg tctggctggc gtatcagaat aagctgaaga aatcactcgg gctgaccagc 1980

gtgacgtcag aaatgcgttt ctttgacgta tccggcgtga cggttacaga ccttcaggac 2040

gcggagcttc aggtgaaagc cgctgaaaaa agcgagttca gggagtggat actgcagtgg 2100

gggccgttac acagagtgct ggagcgcaaa gcgccggaac gcgttaacgc gcttcgtgaa 2160

aagcaaatat cggattatga ggaaacgtac cggatgctgt ctgacacaga gctgagaccg 2220

tctgggctgg tcggtaatac cgatgcagag cgcactatcg gagcaagagc gatggagagc 2280

gcgaaaaaga catttttgga tggcctgcga cctcttgtgg aggagatgct ggggagctat 2340

ctgaacgttc agtggcgtcg taactga 2367

<210> 37

<211> 660

<212> PRT

<213> 人工

<220>

<223> 野油菜黄单胞菌的XopL非常规基序

<400> 37

Met Arg Arg Val Asp Gln Pro Arg Pro Pro Gly Thr Pro Phe Gly Leu

1 5 10 15

Arg Glu Gln Thr Thr Ser Asn Ala Asp Ala Pro Ala Arg Thr Ala Pro

20 25 30

Pro Ala His Pro Ala Pro Glu Arg Pro Thr Gly Met Leu Gly Gly Leu

35 40 45

Thr Arg Tyr Val Pro Gly Asp Arg Ser Gly Arg Pro Pro Ala Met Pro

50 55 60

Ala Ala Ala Glu Thr Ser Arg Arg Pro Thr Thr Ser Ala Arg Pro Leu

65 70 75 80

Pro Tyr Gly Gly Ser Gly Ser Ala Ala Arg Met Asn Glu Ala Ala Gly

85 90 95

His Pro Leu Arg Met Pro Gln Leu Pro Gln Leu Ser Asp Ile Glu Arg

100 105 110

Ala Arg Phe His Ser Val Thr Thr Asp Ser Gln His Leu Arg Pro Val

115 120 125

Arg Pro Arg Met Pro Pro Pro Val Gly Ala Ser Pro Leu Arg Arg Ser

130 135 140

Thr Ala Leu Arg Pro Tyr His Asp Val Leu Ser Gln Trp Gln Arg His

145 150 155 160

Tyr Asn Ala Asp Arg Asn Arg Trp His Ser Ala Trp Arg Gln Ala Asn

165 170 175

Ser Asn Asn Pro Gln Ile Glu Thr Arg Thr Gly Arg Ala Leu Lys Ala

180 185 190

Thr Ala Asp Leu Leu Glu Asp Ala Thr Gln Pro Gly Arg Val Ala Leu

195 200 205

Glu Leu Arg Ser Val Pro Leu Pro Gln Phe Pro Asp Gln Ala Phe Arg

210 215 220

Leu Ser His Leu Gln His Met Thr Ile Asp Ala Ala Gly Leu Met Glu

225 230 235 240

Leu Pro Asp Thr Met Gln Gln Phe Ala Gly Leu Glu Thr Leu Thr Leu

245 250 255

Ala Arg Asn Pro Leu Arg Ala Leu Pro Ala Ser Ile Ala Ser Leu Asn

260 265 270

Arg Leu Arg Glu Leu Ser Ile Arg Ala Cys Pro Glu Leu Thr Glu Leu

275 280 285

Pro Glu Pro Leu Ala Ser Thr Asp Ala Ser Gly Glu His Gln Gly Leu

290 295 300

Val Asn Leu Gln Ser Leu Arg Leu Glu Trp Thr Gly Ile Arg Ser Leu

305 310 315 320

Pro Ala Ser Ile Ala Asn Leu Gln Asn Leu Lys Ser Leu Lys Ile Arg

325 330 335

Asn Ser Pro Leu Ser Ala Leu Gly Pro Ala Ile His His Leu Pro Lys

340 345 350

Leu Glu Glu Leu Asp Leu Arg Gly Cys Thr Ala Leu Arg Asn Tyr Pro

355 360 365

Pro Ile Phe Gly Gly Arg Ala Pro Leu Lys Arg Leu Ile Leu Lys Asp

370 375 380

Cys Ser Asn Leu Leu Thr Leu Pro Leu Asp Ile His Arg Leu Thr Gln

385 390 395 400

Leu Glu Lys Leu Asp Leu Arg Gly Cys Val Asn Leu Ser Arg Leu Pro

405 410 415

Ser Leu Ile Ala Gln Leu Pro Ala Asn Cys Ile Ile Leu Val Pro Pro

420 425 430

His Leu Gln Ala Gln Leu Asp Gln His Arg Pro Val Ala Arg Pro Ala

435 440 445

Glu Pro Gly Arg Thr Gly Pro Thr Thr Pro Ala Leu Ser Pro Ser Ala

450 455 460

Ala Gly Asp Arg Ala Gly Pro Ser Ser Ser Ala Thr Ala Ser Glu Leu

465 470 475 480

Leu Leu Thr Ala Ala Leu Glu Arg Ile Glu Asp Thr Ala Gln Ala Met

485 490 495

Leu Ser Thr Val Ile Asp Glu Glu Arg Asn Pro Phe Leu Glu Gly Ala

500 505 510

Pro Ser Tyr Leu Pro Gly Lys Arg Pro Thr Asp Val Thr Thr Phe Gly

515 520 525

Gln Val Pro Ala Leu Arg Asp Met Leu Ala Glu Ser Arg Asp Leu Glu

530 535 540

Phe Leu Gln Arg Val Ser Asp Met Ala Gly Pro Ser Pro Arg Ile Glu

545 550 555 560

Asp Pro Ser Glu Glu Gly Leu Ala Arg His Tyr Thr Asn Val Ser Asn

565 570 575

Trp Lys Ala Gln Lys Ser Ala His Leu Gly Ile Val Asp His Leu Gly

580 585 590

Gln Phe Val Tyr His Glu Gly Ser Pro Leu Asp Val Ala Thr Leu Ala

595 600 605

Lys Ala Val Gln Met Trp Lys Thr Arg Glu Leu Ile Val His Ala His

610 615 620

Pro Gln Asp Arg Ala Arg Phe Pro Glu Leu Ala Val His Ile Pro Glu

625 630 635 640

Gln Val Ser Asp Asp Ser Asp Ser Glu Gln Gln Thr Ser Pro Glu Pro

645 650 655

Ser Gly His Gln

660

<210> 38

<211> 1983

<212> DNA

<213> 人工

<220>

<223> 野油菜黄单胞菌的XopL非常规基序

<400> 38

atgcgacgcg tcgatcaacc acgcccgccg ggcacgcctt tcggactgcg ggagcagact 60

acgtccaatg cggatgcgcc cgcgcgcact gccccacccg cacaccccgc gcccgagcgc 120

cctaccggca tgctcggcgg actgaccaga tatgtgcctg gcgatcggtc cgggcgaccg 180

ccagcaatgc ctgccgctgc cgagacctct cgccggccaa ccacctccgc ccgcccgctt 240

ccctacggcg gatccggcag cgccgcgcgg atgaacgagg cggctggaca tcctttgcgg 300

atgccgcaat tgccacagct cagcgacata gaacgcgctc gcttccactc cgtcaccacc 360

gactcgcaac acttgcggcc ggtgcgcccc cgtatgccac cgcccgtggg cgcttcaccc 420

ttacggcgct ccacagcgct gcgcccgtac cacgacgtgc tgtcgcaatg gcaacgccac 480

tacaacgcag atcgcaatcg ctggcacagc gcatggcgcc aggccaacag caacaacccg 540

cagatcgaga ctcgcacagg ccgggcgctg aaggcgacag ccgacctgct ggaggacgca 600

acccaaccgg gccgggtcgc gctggagctg cgctcagttc cgctgccgca atttcccgac 660

caggcattcc gtctttcgca tctgcagcac atgacgatcg acgcggcagg gttgatggag 720

ctcccggaca ccatgcagca atttgcgggc ctggaaacac tcacgctcgc acgcaatccg 780

cttcgcgcgc taccggcatc catcgcaagc ctcaaccgat tacgcgagct ctccatccgc 840

gcctgcccgg aattgacgga acttcccgaa cccctggcaa gcaccgatgc atccggcgag 900

caccagggct tggtcaacct gcagagccta cggctggaat ggaccgggat cagatcgctt 960

ccggcgtcca tcgccaacct gcaaaatctg aaaagcctga agatacgcaa ctcgccgctg 1020

tccgcccttg gcccggccat ccatcacctg ccaaagttgg aggagcttga tttgcggggc 1080

tgtaccgcgc tgcgcaacta tccgccgatt ttcggcggcc gtgcgccact gaagcgactg 1140

attctgaaag actgcagcaa cctgctcacg ctgccactgg acattcaccg cctgacgcag 1200

ctggaaaaac tcgatctgcg aggttgcgtc aacctttcca gactgccctc gttgatcgcc 1260

caattacctg ccaattgcat catcctggtg ccgccgcatc tccaagcgca gctcgaccag 1320

catcgtccag ttgcgcgccc cgccgaacca gggcggaccg gaccgaccac cccagctctc 1380

tcgccctctg ctgccggcga ccgcgccggg ccatcctctt cggcgaccgc cagcgaactg 1440

cttcttaccg ctgcgctcga acgcatcgaa gacaccgcac aggccatgct gagcacggtc 1500

atcgatgaag aaagaaatcc ctttctggaa ggtgctccat cctatctccc aggaaaacgc 1560

cctaccgatg tcaccacctt cggccaagtt ccggcattgc gggacatgct ggcagaaagc 1620

agggatcttg agttcctgca acgggtaagc gacatggcag gcccatcccc cagaatcgaa 1680

gacccgagcg aggaaggcct cgcccgccac tacacgaacg tcagcaactg gaaggcgcag 1740

aagagcgcac acctgggcat cgtcgatcat ctcgggcagt tcgtttatca cgaaggaagc 1800

ccgctcgacg tagcgacatt ggccaaggca gtgcagatgt ggaagacccg tgagctgatc 1860

gtccacgcac acccgcaaga ccgcgcgcgc tttcccgagc tcgctgtgca cattcccgag 1920

caggtcagcg acgactctga tagcgaacag cagacaagcc cggaaccttc aggccatcag 1980

tag 1983

技术分类

06120112157798