掌桥专利:专业的专利平台
掌桥专利
首页

靶向核蛋白的工程化去泛素化酶及其使用方法

文献发布时间:2024-04-18 19:58:30


靶向核蛋白的工程化去泛素化酶及其使用方法

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2020年11月6日提交的美国临时专利申请号63/110,616的权益,其全部公开内容通过引用并入本文。

1.领域

本公开内容涉及一种融合蛋白,其包含效应结构域,所述效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体;和靶向结构域,其包含特异性结合靶核蛋白的部分。本公开内容进一步涉及使用其的治疗方法。

2.背景

一部分遗传病与功能性核蛋白的表达水平的降低或核蛋白的稳定性的降低相关。例如,单倍剂量不足遗传病是由与功能丧失变异等位基因的杂合组合的单拷贝的野生型等位基因的存在引起的,其中表达的功能蛋白的水平不足以产生标准表型。单倍剂量不足可能由变异等位基因中的从头或遗传性功能丧失突变引起,使得它产生很少或不产生功能性蛋白质。尽管基因治疗最近取得了进展,但这些疾病仍然没有治愈性治疗,并且治疗通常集中在症状的管理上。因此,需要新的治疗来治疗与降低的功能性核蛋白表达或稳定性相关的疾病,例如遗传病。

3.概述

本文尤其提供了工程化的去泛素化酶(enDub),其包含特异性结合核靶蛋白的靶向部分和去泛素化酶的催化结构域。靶向部分将该去泛素化酶催化结构域引导至特定靶核蛋白以用于去泛素化。本文所述的融合蛋白特别可用于治疗遗传病(特别是与特定核蛋白的降低的表达或稳定性相关或由其引起的那些疾病)的方法。

在一个方面,本文提供了融合蛋白,其包含:包含去泛素化酶的催化结构域或其功能片段或功能变体的效应结构域;和包含特异性结合核蛋白的靶向部分的靶向结构域。

在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶或金属蛋白酶。

在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶。在一些实施方案中,半胱氨酸蛋白酶是泛素特异性蛋白酶(USP)、泛素C末端水解酶(UCH)、Machado-Josephin结构域蛋白酶(MJD)、卵巢肿瘤蛋白酶(OTU)、MINDY蛋白酶或ZUFSP蛋白酶。

在一些实施方案中,半胱氨酸蛋白酶是USP。在一些实施方案中,USP是USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45或USP46。

在一些实施方案中,半胱氨酸蛋白酶是UCH。在一些实施方案中,UCH是BAP1、UCHL1、UCHL3或UCHL5。

在一些实施方案中,半胱氨酸蛋白酶是MJD。在一些实施方案中,MJD是ATXN3或ATXN3L。

在一些实施方案中,半胱氨酸蛋白酶是OTU。在一些实施方案中,OTU是OTUB1或OTUB2。

在一些实施方案中,半胱氨酸蛋白酶是MINDY。在一些实施方案中,MINDY是MINDY1、MINDY2、MINDY3或MINDY4。

在一些实施方案中,半胱氨酸蛋白酶是ZUFSP。在一些实施方案中,ZUFSP是ZUP1。

在一些实施方案中,去泛素化酶是金属蛋白酶。在一些实施方案中,金属蛋白酶是Jab1/Mov34/Mpr1 Pad1 N-末端+(MPN+)(JAMM)结构域蛋白酶。

在一些实施方案中,去泛素化酶包含与SEQ ID NO:1-112中任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,催化结构域包含衍生自去泛素化酶的催化结构域,所述去泛素化酶与SEQ ID NO:1-112中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。

在一些实施方案中,催化结构域包含与SEQ ID NO:113-220或423中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,催化结构域包含与SEQ ID NO:423的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,特异性结合核蛋白的部分包含抗体或其功能片段或功能变体。在一些实施方案中,抗体或其功能片段或功能变体包括全长抗体、单链可变片段(scFv)、scFv2、scFv-Fc、Fab、Fab'、F(ab')2、F(v)、VHH、(VHH)

在一些实施方案中,核蛋白是转录因子。在一些实施方案中,核蛋白是克罗莫结构域-解旋酶DNA结合蛋白2(CHD2)、精氨酸-谷氨酸二肽重复蛋白(RERE)、细胞周期蛋白依赖性激酶样5(CDKL5)、甲基CpG结合蛋白2(MECP2)、组蛋白-赖氨酸N-甲基转移酶2D(KMT2D)、组蛋白-赖氨酸N-甲基转移酶SETD5(SETD5)、锌指E-盒结合同源异型框2(ZEB2)、钙调蛋白结合转录激活因子1(CAMTA1)、突触功能调节因子FMR1(FMR1)、前信使RNA加工剪接因子8(PRPF8)、视黄酸诱导蛋白1(RAI1)、CREB结合蛋白(CREBBP)、神经纤维瘤蛋白(NF1)、以及组蛋白-赖氨酸N-甲基转移酶2A(KMT2A)、克罗莫结构域-解旋酶DNA结合蛋白4(CHD4)、组蛋白-赖氨酸N-甲基转移酶、特异性H3赖氨酸-36(NSD1)、RNA聚合酶II转录亚基13样介体(MED13L)、染色体结构维持蛋白1A(SMC1A)、可能的全局转录转录激活因子SNF2L2(SMARCA2)、含AT丰富相互作用结构域蛋白1B(ARID1B)、具有ZNF结构域的pogo转座元件(POGZ)、组蛋白乙酰转移酶KAT6B(KAT6B)、含AT钩DNA结合基序蛋白1(AHDC1)、组蛋白乙酰转移酶p300(EP300)、含IQ基序和SEC7结构域蛋白2(IQSEC2)、转录因子20(TCF20)、推定多梳家族蛋白ASXL3(ASXL3)、组蛋白乙酰转移酶KAT6A(KAT6A)、核内小核糖核蛋白G(SNRPG)、U6snRNA相关Sm样蛋白LSm2(LSM2)或核蛋白2(NUPR2)。

在一些实施方案中,核蛋白是转录因子。在一些实施方案中,核蛋白是克罗莫结构域-解旋酶DNA结合蛋白2(CHD2)、精氨酸-谷氨酸二肽重复蛋白(RERE)、细胞周期蛋白依赖性激酶样5(CDKL5)、甲基CpG结合蛋白2(MECP2)、组蛋白-赖氨酸N-甲基转移酶2D(KMT2D)、组蛋白-赖氨酸N-甲基转移酶SETD5(SETD5)、锌指E-盒结合同源异型框2(ZEB2)、钙调蛋白结合转录激活因子1(CAMTA1)、突触功能调节因子FMR1(FMR1)、前信使RNA加工剪接因子8(PRPF8)、视黄酸诱导蛋白1(RAI1)、CREB结合蛋白(CREBBP)、神经纤维瘤蛋白(NF1)、以及组蛋白-赖氨酸N-甲基转移酶2A(KMT2A)、克罗莫结构域-解旋酶DNA结合蛋白4(CHD4)、组蛋白-赖氨酸N-甲基转移酶、特异性H3赖氨酸-36(NSD1)、RNA聚合酶II转录亚基13样介体(MED13L)、染色体结构维持蛋白1A(SMC1A)、可能的全局转录转录激活因子SNF2L2(SMARCA2)、含AT丰富相互作用结构域蛋白1B(ARID1B)、具有ZNF结构域的pogo转座元件(POGZ)、组蛋白乙酰转移酶KAT6B(KAT6B)、含AT钩DNA结合基序蛋白1(AHDC1)、组蛋白乙酰转移酶p300(EP300)、含IQ基序和SEC7结构域蛋白2(IQSEC2)、转录因子20(TCF20)、推定多梳家族蛋白ASXL3(ASXL3)和组蛋白乙酰转移酶KAT6A(KAT6A)。

在一些实施方案中,核蛋白包含与SEQ ID NO:221-248或424-426中任一个的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,效应结构域直接可操作地连接至靶向结构域。在一些实施方案中,效应结构域间接可操作地连接至靶向结构域。在一些实施方案中,效应结构域通过肽接头间接可操作地连接至靶向结构域。在一些实施方案中,效应结构域通过足够长度的肽接头间接融合至靶向结构域,使得效应结构域和靶向结构域能够同时结合各自的靶蛋白。在一些实施方案中,肽接头包含SEQ ID NO:427-436或249-367中任一个的氨基酸序列,或SEQ ID NO:427-436或249-367中任一个的包含1、2或3个氨基酸修饰的氨基酸序列。在一些实施方案中,肽接头包含SEQ ID NO:427-436中任一个的氨基酸序列,或SEQ ID NO:427-436中任一个的包含1、2或3个氨基酸修饰的氨基酸序列。

在一些实施方案中,效应结构域直接或间接可操作地连接至靶向结构域的C末端。在一些实施方案中,效应部分直接或间接可操作地连接至靶向结构域的N末端。

在一些实施方案中,融合蛋白进一步包含核定位信号(NLS)。在一些实施方案中,NLS在融合蛋白的N末端。在一些实施方案中,NLS包含SEQ ID NO:249-367中任一个的氨基酸序列。

在一个方面,本文提供编码本文所述融合蛋白的核酸分子。在一些实施方案中,核酸分子是DNA分子。在一些实施方案中,核酸分子是RNA分子。

在一个方面,本文提供包含本文所述的核酸分子(例如,编码本文所述的融合蛋白的核酸分子)的载体。在一些实施方案中,载体是质粒或病毒载体。

在一个方面,本文提供包含本文所述的核酸分子(例如,编码本文所述的融合蛋白的核酸分子)的病毒颗粒。

在一个方面,本文提供包含本文所述的融合蛋白、本文所述的核酸分子或本文所述的载体的体外细胞或细胞群。

在一个方面,本文提供了药物组合物,其包含本文所述的融合蛋白、本文所述的核酸、本文所述的载体或本文所述的病毒颗粒,以及赋形剂。

在一个方面,本文提供了制备本文所述的融合蛋白的方法,其包括将本文所述的核酸分子、本文所述的载体或本文所述的病毒颗粒引入体外细胞或细胞群中;在适于表达融合蛋白的条件下,在培养基中培养细胞或细胞群,从培养基分离融合蛋白,并任选地纯化融合蛋白。

在一个方面,本文提供治疗或预防受试者的疾病的方法,其包括向有需要的受试者施用本文所述的融合蛋白、本文所述的核酸分子、本文所述的载体、本文所述的病毒颗粒或本文所述的药物组合物。在一些实施方案中,受试者是人。

在一些实施方案中,该疾病与相对于未患病对照的核蛋白的功能形式的降低的表达相关。在一些实施方案中,该疾病与相对于未患病对照的核蛋白的功能形式的降低的稳定性相关。在一些实施方案中,疾病与相对于未患病对照的核蛋白的增加的泛素化相关。在一些实施方案中,疾病与相对于未患病对照的核蛋白的增加的泛素化和降解相关。在一些实施方案中,其中该疾病是遗传病。

在一些实施方案中,该疾病是CHD2脑病、CDKL5缺乏症、SETD5综合征、CAMTA1综合征、早期婴儿癫痫性脑病2型、儿童期发作癫痫性脑病、1p36缺失综合征、Rett综合征、Kabuki综合征1、精神发育迟缓常染色体显性遗传23、Mowat-Wilson综合征、小脑共济失调、脆性X综合征、色素性视网膜炎13、Smith-Magenis综合征、Rubinstein-Taybi综合征、神经纤维瘤病(例如1型)、Wiedmann-Steiner综合征、Sifrim-Hitz-Weiss综合征、Sotos综合征、MED13L综合征、SMC1A综合征、Nicolaides-Baraitser综合征、ARID1B相关病症、White-Sutton综合征、KAT6B病症、Xia-Gibbs综合征、Menke-Hennekam综合征2、IQSEC2相关病症、TCF20相关病症、Bainbridge-Ropers综合征或KATA6综合征。

在一些实施方案中,靶核蛋白是CHD2,并且疾病是儿童期发作癫痫性脑病;靶核蛋白是CHD2,并且疾病是CHD2脑病;靶核蛋白是RERE,并且疾病是1p36缺失综合征;靶核蛋白是CDKL5,并且疾病是早期婴儿癫痫性脑病(例如2型);靶核蛋白是CDKL5,并且疾病是CDKL5缺乏症;靶核蛋白是MECP2,并且疾病是Rett综合征;靶核蛋白是KMT2D,并且疾病是Kabuki综合征1;靶核蛋白是SETD5,并且疾病是精神发育迟缓常染色体显性遗传23;靶核蛋白是ZEB2,并且疾病是Mowat-Wilson综合征;靶核蛋白是KMT2A,并且疾病是Wiedmann-Steiner综合征;靶核蛋白是CHD4,并且疾病是Sifrim-Hitz-Weiss综合征;靶核蛋白是NSD1,并且疾病是Sotos综合征;靶核蛋白是SMC1A,并且疾病是SMC1A综合征;靶核蛋白是SMARCA2,并且疾病是Nicolaides-Baraitser综合征;靶核蛋白是ARID1B,并且疾病是ARID1B相关病症;靶核蛋白是POGZ,并且疾病是White-Sutton综合征;靶核蛋白是KAT6B,并且疾病是KAT6B病症;靶核蛋白是AHDC1,并且遗传病是Xia-Gibbs综合征;靶核蛋白是EP300,并且疾病是Menke-Hennekam综合征2;靶核蛋白是IQSEC2,并且疾病是IQSEC2相关病症;靶核蛋白是TCF20,并且疾病是TCF20相关病症;靶核蛋白是ASXL3,并且疾病是Bainbridge-Ropers综合征;靶核蛋白是KAT6A,并且疾病是KATA6综合征;靶核蛋白是MED13L,并且疾病是MED13L综合征;靶核蛋白是CAMTA1,并且疾病是CAMTA1综合征;靶核蛋白是FMR1,并且疾病是脆性X综合征;靶核蛋白是PRPF8,并且疾病是色素性视网膜炎13;靶核蛋白是RAI1,并且疾病是Smith-Magenis综合征;靶核蛋白是CREBBP,并且疾病是Rubinstein-Taybi综合征;或者靶核蛋白是NF1,并且疾病是神经纤维瘤病(例如1型)。

在一些实施方案中,该疾病是单倍剂量不足疾病。在一些实施方案中,单倍剂量不足疾病选自早期婴儿癫痫性脑病2型、儿童期发作癫痫性脑病、1p36缺失综合征、Rett综合征、精神发育迟缓常染色体显性遗传23、Mowat-Wilson综合征、小脑共济失调、Smith-Magenis综合征或神经纤维瘤病(例如1型)。

在一些实施方案中,融合蛋白以治疗有效剂量施用。在一些实施方案中,系统地或局部施用融合蛋白。在一些实施方案中,静脉内、皮下或肌肉内施用融合蛋白。

在一个方面,本文提供本文所述的融合蛋白、本文所述的多核苷酸、本文所述的DNA、本文所述的RNA、本文所述的载体、本文所述的病毒颗粒和本文所述的药物组合物用作药物。

在一个方面,本文提供本文所述的融合蛋白、本文所述的多核苷酸、本文所述的DNA、本文所述的RNA、本文所述的载体、本文所述的病毒颗粒和本文所述的药物组合物,用于治疗或抑制遗传病。

在一个方面,本文提供了融合蛋白,其包含:(a)包含去泛素化酶的催化结构域或其功能片段或功能变体的效应结构域;和(b)包含特异性结合核蛋白的靶向部分的靶向结构域。

在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶或金属蛋白酶。

在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶。在一些实施方案中,半胱氨酸蛋白酶是泛素特异性蛋白酶(USP)、泛素C末端水解酶(UCH)、Machado-Josephin结构域蛋白酶(MJD)、卵巢肿瘤蛋白酶(OTU)、MINDY蛋白酶或ZUFSP蛋白酶。

在一些实施方案中,半胱氨酸蛋白酶是USP。在一些实施方案中,USP选自USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45和USP46。

在一些实施方案中,半胱氨酸蛋白酶是UCH。在一些实施方案中,UCH选自BAP1、UCHL1、UCHL3和UCHL5。

在一些实施方案中,半胱氨酸蛋白酶是MJD。在一些实施方案中,MJD选自ATXN3和ATXN3L。

在一些实施方案中,半胱氨酸蛋白酶是OTU。在一些实施方案中,OTU选自OTUB1和OTUB2。

在一些实施方案中,半胱氨酸蛋白酶是MINDY。在一些实施方案中,MINDY选自MINDY1、MINDY2、MINDY3和MINDY4。

在一些实施方案中,半胱氨酸蛋白酶是ZUFSP。在一些实施方案中,ZUFSP是ZUP1。在一些实施方案中,去泛素化酶是金属蛋白酶。在一些实施方案中,金属蛋白酶是Jab1/Mov34/Mpr1 Pad1 N-末端+(MPN+)(JAMM)结构域蛋白酶。

在一些实施方案中,去泛素化酶包含与SEQ ID NO:1-112中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,催化结构域包含与SEQ ID NO:1-112中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,催化结构域包含与SEQ ID NO:113-220中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,特异性结合核蛋白的部分包含抗体或其功能片段或功能变体。在一些实施方案中,抗体或其功能片段或功能变体包括全长抗体、单链可变片段(scFv)、scFv2、scFv-Fc、Fab、Fab'、F(ab')2、F(v)或VHH。在一些实施方案中,抗体或其功能片段或功能变体包括VHH。

在一些实施方案中,核蛋白是转录因子。

在一些实施方案中,核蛋白是选自克罗莫结构域-解旋酶DNA结合蛋白2(CHD2)、精氨酸-谷氨酸二肽重复蛋白(RERE)、细胞周期蛋白依赖性激酶样5(CDKL5)、甲基CpG结合蛋白2(MECP2)、组蛋白-赖氨酸N-甲基转移酶2D(KMT2D)、组蛋白-赖氨酸N-甲基转移酶SETD5(SETD5)、锌指E-盒结合同源异型框2(ZEB2)、钙调蛋白结合转录激活因子1(CAMTA1)、突触功能调节因子FMR1(FMR1)、前信使RNA加工剪接因子8(PRPF8)、视黄酸诱导蛋白1(RAI1)、CREB结合蛋白(CREBBP)、神经纤维瘤蛋白(NF1)、以及组蛋白-赖氨酸N-甲基转移酶2A(KMT2A)、克罗莫结构域-解旋酶DNA结合蛋白4(CHD4)、组蛋白-赖氨酸N-甲基转移酶,特异性H3赖氨酸-36(NSD1)、RNA聚合酶II转录亚基13样介体(MED13L)、染色体结构维持蛋白1A(SMC1A)、可能的全局转录转录激活因子SNF2L2(SMARCA2)、含AT丰富相互作用结构域蛋白1B(ARID1B)、具有ZNF结构域的pogo转座元件(POGZ)、组蛋白乙酰转移酶KAT6B(KAT6B)、含AT钩DNA结合基序蛋白1(AHDC1)、组蛋白乙酰转移酶p300(EP300)、含IQ基序和SEC7结构域蛋白2(IQSEC2)、转录因子20(TCF20)、推定多梳家族蛋白ASXL3(ASXL3)和组蛋白乙酰转移酶KAT6A(KAT6A)。

在一些实施方案中,核蛋白包含与SEQ ID NO:221-248中的任一个至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,效应结构域直接融合至靶向结构域。在一些实施方案中,效应结构域间接融合至靶向结构域。在一些实施方案中,效应结构域通过肽接头间接融合至靶向结构域。在一些实施方案中,效应结构域通过足够长度的肽接头间接融合至靶向结构域,使得效应结构域和靶向结构域能够同时结合各自的靶蛋白。

在一些实施方案中,效应结构域融合至靶向结构域的C末端。在一些实施方案中,效应部分融合至靶向结构域的N末端。

在一些实施方案中,融合蛋白进一步包含核定位信号(NLS)。在一些实施方案中,NLS在融合蛋白的N末端。

在一个方面,本文提供编码本文所述融合蛋白的核酸分子。在一些实施方案中,核酸分子是DNA分子。在一些实施方案中,核酸分子是RNA分子。

在一个方面,本文提供包含本文所述的核酸分子的载体。在一些实施方案中,载体是质粒或病毒载体。

在一个方面,本文提供包含本文所述的核酸的病毒颗粒。

在一个方面,本文所述的是包含本文所述的融合蛋白、本文所述的核酸分子或本文所述的载体的体外细胞或细胞群。

在一个方面,本文提供了药物组合物,其包含本文所述的融合蛋白、本文所述的核酸分子、本文所述的载体或本文所述的病毒颗粒,以及赋形剂。

在一个方面,本文提供了制备本文所述的融合蛋白的方法,其包括(a)将本文所述的核酸、本文所述的载体或本文所述的病毒颗粒引入体外细胞或细胞群中;(b)在适合融合蛋白表达的条件下在培养基中培养细胞或细胞群,(c)从培养基分离融合蛋白,和(d)任选地纯化融合蛋白。

在一个方面,本文提供了治疗受试者的疾病的方法,其包括向有需要的受试者施用本文所述的融合蛋白、本文所述的核酸、本文所述的载体或本文所述的病毒颗粒或本文所述的药物组合物。

在一些实施方案中,受试者是人。

在一些实施方案中,疾病与相对于未患病对照的线粒体蛋白的功能形式的降低的表达相关。

在一些实施方案中,疾病与相对于未患病对照的线粒体蛋白的功能形式的降低的稳定性相关。

在一些实施方案中,疾病与相对于未患病对照的线粒体蛋白的增加的泛素化和降解相关。

在一些实施方案中,疾病是遗传病。

在一些实施方案中,该疾病是CHD2脑病、CDKL5缺乏症、SETD5综合征、CAMTA1综合征、早期婴儿癫痫性脑病2型、儿童期发作癫痫性脑病、1p36缺失综合征、Rett综合征、Kabuki综合征1、精神发育迟缓常染色体显性遗传23、Mowat-Wilson综合征、小脑共济失调、脆性X综合征、色素性视网膜炎13、Smith-Magenis综合征、Rubinstein-Taybi综合征、神经纤维瘤病(例如1型)、Wiedmann-Steiner综合征、Sifrim-Hitz-Weiss综合征、Sotos综合征、MED13L综合征、SMC1A综合征、Nicolaides-Baraitser综合征、ARID1B相关病症、White-Sutton综合征、KAT6B病症、Xia-Gibbs综合征、Menke-Hennekam综合征2、IQSEC2相关病症、TCF20相关病症、Bainbridge-Ropers综合征和KATA6综合征。

在一些实施方案中,该疾病是单倍剂量不足疾病。在一些实施方案中,单倍剂量不足疾病选自早期婴儿癫痫性脑病2型、儿童期发作癫痫性脑病、1p36缺失综合征、Rett综合征、精神发育迟缓常染色体显性遗传23、Mowat-Wilson综合征、小脑共济失调、Smith-Magenis综合征或神经纤维瘤病(例如1型)。

在一些实施方案中,融合蛋白以治疗有效剂量施用。在一些实施方案中,系统地或局部地施用融合蛋白。在一些实施方案中,静脉内、皮下或肌肉内施用融合蛋白。

4.附图简要说明

图1A-1D提供了本文所述的示例性融合蛋白的示意图。图1A是工程化的去泛素化酶的示意图,其从N'到C'末端包含特异性结合核靶蛋白的VHH和去泛素化酶的催化结构域。在这个具体的实施方案中,VHH的C末端直接连接到去泛素化酶的催化结构域的N末端。图1B是工程化的去泛素化酶的示意图,其从N'到C'末端包含特异性结合核靶蛋白的去泛素化酶的催化结构域和特异性结合核靶蛋白的VHH。在这个具体的实施方案中,去泛素化酶的催化结构域的C-末端直接连接到VHH的N-末端。图1C是工程化的去泛素化酶的示意图,其从N'到C'末端包含特异性结合核靶蛋白的VHH和去泛素化酶的催化结构域。在这个具体的实施方案中,VHH的C-末端通过肽接头间接连接到去泛素化酶的催化结构域的N-末端。图1D是工程化的去泛素化酶的示意图,其从N'到C'末端包含特异性结合核靶蛋白的去泛素化酶的催化结构域和特异性结合核靶蛋白的VHH。在这个具体的实施方案中,去泛素化酶的催化结构域的C末端通过肽接头间接连接至VHH的N末端。

图2是实施例3中使用的测定的示意图,以筛选不同核蛋白的靶向去泛素化对靶蛋白表达的影响。

图3是描绘SNRPG蛋白表达相对于对照(没有靶向α-标签的纳米抗体的去泛素化酶)的倍数变化的条形图。

图4是描绘LSM2蛋白表达相对于对照(没有靶向α-标签的纳米抗体的去泛素化酶)的倍数变化的条形图。

图5是描绘NUPR2蛋白表达相对于对照(没有靶向α-标签的纳米抗体的去泛素化酶)的倍数变化的条形图。

5.详细描述

5.1综述

泛素化是泛素连接酶介导泛素(一种76个氨基酸的调节蛋白)添加到底物蛋白的过程。泛素化通常始于单个泛素分子与底物蛋白的赖氨酸氨基酸残基的连接。Mevissen T.等人Mechanisms of Deubiquitinase Specificity and RegulationAnnual Review ofBiochemistry 86:1,159-192(2017),其全部内容通过引用并入本文。这些单泛素化事件非常丰富,并且具有多种功能。泛素本身包含七个赖氨酸残基,所有这些残基都可以被泛素化,从而产生多泛素化蛋白质。Komander,D.等人Breaking the chains:structure andfunction of the deubiquitinases.Nat Rev Mol Cell Biol 10,550-563(2009),其全部内容通过引用并入本文。单泛素化和多泛素化可以对底物蛋白产生多种影响,包括标记底物蛋白以通过蛋白酶体降解、改变蛋白质的细胞位置、改变蛋白质的活性和/或促进或阻止正常的蛋白质相互作用。参见例如Hershko A.等人The ubiquitin system.Annu RevBiochem.67:425-79(1998);Nandi D等人The ubiquitin-proteasome system.JBiosci.Mar;31(1):137-55(2006),其各自的全部内容均通过引用并入本文。通过从底物蛋白去除泛素蛋白,可以逆转或阻止泛素化的影响。从底物蛋白去除泛素是由去泛素化酶(DUB)蛋白介导的。同上。

许多遗传病与功能性核蛋白的表达水平或核蛋白的稳定性的降低相关或由其引起。例如,单倍剂量不足遗传病是由与功能丧失变异等位基因杂合组合的单个拷贝的野生型等位基因的存在引起的,其中表达的功能蛋白的水平不足以产生标准表型。参见例如Johnson,A.等人,Causes and effects of haploinsufficiency.Biol Rev,94:1774-1785(2019),其全部内容通过引用并入本文。单倍剂量不足可能由变异等位基因中的从头或遗传性功能丧失突变引起,使得它产生很少或不产生功能性蛋白质。其他遗传病是由变异但功能性的蛋白质的泛素化和随后的降解引起的,导致功能性蛋白质的表达的减少。

本公开内容尤其提供了新的融合蛋白,其包含去泛素化酶的催化结构域(或其功能片段)和特异性结合靶核蛋白的靶向部分,例如VHH。在一些实施方案中,靶核蛋白的功能形式的降低的表达或靶核蛋白的功能形式的降低的稳定性与疾病表型相关。因此,本文所述的融合蛋白特别可用于治疗以功能性靶核蛋白的表达水平或靶核蛋白的稳定性的降低为特征的遗传病。在由宿主细胞表达融合蛋白后,去泛素化酶的催化结构域将被特异性靶向至靶核蛋白并去泛素化,导致靶核蛋白的表达增加,例如,达到足以减轻疾病表型的水平。

5.2定义

本文使用的章节标题仅用于组织目的,并不应被解释为限制所描述的主题。

除非另有定义,本文使用的所有技术和科学术语具有与本公开内容相关领域的普通技术人员普遍理解的相同含义。例如,Concise Dictionary of Biomedicine andMolecular Biology,Juo,Pei-Show,2nd ed.,2002,CRC Press;The Dictionary of Celland Molecular Biology,3rd ed.,1999,Academic Press;和Oxford Dictionary OfBiochemistry And Molecular Biology,Revised,2000,Oxford University Press为技术人员提供了本公开内容中使用的许多术语的通用词典。

应当理解,前面的一般描述和下面的详细描述只是示例性和解释性的,并不限制所要求保护的任何主题。在本申请中,除非另有明确说明,否则单数的使用包括复数。

必须注意,如在说明书和所附权利要求中所使用的,单数形式“一个”、“一种”和“该”包括复数对象,除非上下文另有明确规定。此外,术语“包括”以及其他形式(例如“包含”、“含有”和“具有”)的使用不是限制性的。

应当理解,无论是否在本文中用语言“包括”描述方面,否则也提供在“由...组成”和/或“基本上由...组成”方面描述的类似方面。

本文使用的术语“和/或”应被视为有或没有另一个的两个指定特征或组分中的每一个的具体公开。因此,本文中诸如“A和/或B”的短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独的)和“B”“(单独的)。类似地,在诸如“A、B和/或C”的短语中使用的术语“和/或”旨在涵盖以下每个方面:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独的);B(单独的);和C(单独的)。

单位、前缀和符号以其Système International de Unites(SI)接受的形式表示。数值范围包括定义范围的数字。本文提供的标题不是对本公开内容的各个方面的限制,可以通过参考整个说明书来获得这些方面。因此,下面直接定义的术语通过参考整个说明书来更充分地定义。

如本文所述,任何浓度范围、百分比范围、比率范围或整数范围应理解为包括所述范围内的任何整数的值,并且在适当时,包括其分数(例如整数的十分之一和百分之一),除非另有说明。

术语“约”或“基本上包含”是指在如本领域普通技术人员所确定的特定值或组分的可接受误差范围内的值或组分,这将部分取决于如何测量或确定值或组分,即测量系统的局限性。例如,“约”或“基本上包含”可以表示根据本领域的实践在1个或大于1个标准偏差之内。或者,“约”或“基本上包含”可表示高达20%的范围。此外,特别是关于生物系统或过程,这些术语可以表示高达一个数量级或高达5倍的值。当在本申请和权利要求中提供特定值或组分时,除非另有说明,“约”或“基本上包含”的含义应被假定为在该特定值或组分的可接受的误差范围内。

如本文所用,关于去泛素化酶的术语“催化结构域”是指能够介导靶蛋白的去泛素化的去泛素化酶的氨基酸序列或其变体。催化结构域可包含天然存在的去泛素化酶的氨基酸序列或其可包含天然存在的去泛素化酶的变体氨基酸序列。催化结构域可包含介导靶蛋白的去泛素化的去泛素化酶的最小氨基酸序列。催化结构域可包含多于去泛素化酶的最小氨基酸序列以介导靶蛋白的去泛素化。

术语“多核苷酸”和“核酸序列”在本文中可互换使用并且指DNA或RNA的聚合物。多核苷酸序列可以是单链或双链的;含有天然、非天然或改变的核苷酸;并且包含天然的、非天然的或改变的核苷酸间键联,例如氨基磷酸酯键联或硫代磷酸酯键联,而不是在未修饰的多核苷酸序列的核苷酸之间发现的磷酸二酯。多核苷酸序列包括但不限于通过本领域可用的任何手段获得的所有多核苷酸序列,包括但不限于重组手段,例如使用普通克隆技术和聚合酶链反应从重组文库或细胞基因组克隆多核苷酸序列以及类似的,和通过合成手段。

术语“氨基酸序列”和“多肽”在本文中可互换使用并且指通过一个或多个肽键连接的氨基酸的聚合物。

如本文所用的关于蛋白质或多肽的术语“功能变体”是指与参考蛋白质的氨基酸序列相比包含至少一个氨基酸修饰(例如,取代、缺失、添加)的保留至少一种特定功能的蛋白质。在一些实施方案中,参考蛋白质是野生型蛋白质。例如,IL-2蛋白的功能变体可以指与野生型IL-2蛋白相比包含氨基酸取代的IL-2蛋白,其保留结合中等亲和力IL-2受体的能力但废除蛋白质结合高亲和力IL-2受体的能力。并非参考野生型蛋白质的所有功能都需要由蛋白质的功能变体保留。在一些情况下,一种或多种功能被选择性地减少或消除。

如本文所用的关于蛋白质或多肽的术语“功能片段”是指保留至少一种特定功能的参考蛋白质的片段。例如,抗HER2抗体的功能片段可以指保留特异性结合HER2抗原的能力的抗HER2抗体的片段。并非参考蛋白质的所有功能都需要由蛋白质的功能片段保留。在一些情况下,一种或多种功能被选择性地减少或消除。

如本文所用,关于多核苷酸序列的术语“修饰”是指与参考多核苷酸序列相比包含至少一个核苷酸取代、改变、倒置、添加或缺失的多核苷酸序列。修饰可以包括非天然核苷酸。如本文所用,关于氨基酸序列的术语“修饰”是指与参考氨基酸序列相比包含氨基酸残基的至少一个取代、改变、倒置、添加或缺失的氨基酸序列。修饰可以包括包含非天然存在的氨基酸残基。

如本文所用,关于氨基酸序列的术语“衍生自”是指与参考天然存在的氨基酸序列具有至少80%序列同一性的氨基酸序列。例如,衍生自天然存在的去泛素化酶的催化结构域是指该催化结构域具有与其衍生自的去泛素化酶催化结构域的序列具有至少80%序列同一性的氨基酸序列。本文使用的术语“衍生自”不表示用于获得氨基酸序列的任何特定过程或方法。例如,可以化学或重组合成氨基酸序列。

如本文所用,术语“融合蛋白”和语法等同物是指包含衍生自至少两种单独的蛋白质的氨基酸序列的蛋白质。至少两个单独的蛋白质的氨基酸序列可以通过肽键直接连接;或者可以通过氨基酸接头可操作地连接。因此,术语融合蛋白涵盖其中例如蛋白A的氨基酸序列通过肽键直接连接至蛋白B的氨基酸序列(蛋白A-蛋白B)的实施方案,以及其中例如蛋白A的氨基酸序列通过氨基酸接头可操作地连接至蛋白B的氨基酸序列(蛋白A-接头-蛋白B)的实施方案。

如本文所用,术语“融合”及其语法等同物是指衍生自一种蛋白质的氨基酸序列与衍生自不同蛋白质的氨基酸序列的可操作连接。术语融合包括两个氨基酸序列通过肽键的直接连接和通过氨基酸接头的间接连接。

“分离的抗体”是指基本上不含具有不同抗原特异性的其他抗体的抗体(例如,特异性结合HER2的分离的抗体基本上不含特异性结合HER2以外的抗原的抗体)。然而,与HER2特异性结合的分离的抗体可能与其他抗原(例如来自不同物种的HER2分子)交叉反应。此外,分离的抗体可以基本上不含其他细胞材料和/或化学物质。相比之下,“分离的”核酸是指与自然界中存在的核酸明显不同(即具有独特的化学特性、性质和效用)的物质的核酸组成。例如,与天然DNA不同,分离的DNA是天然DNA的独立部分,而不是自然界中发现的更大结构复合体(染色体)的组成部分。此外,与天然DNA不同,分离的DNA可用作PCR引物或杂交探针用于(除其他以外)测量基因表达和检测生物标志物基因或突变以诊断疾病或预测治疗效果。还可以使用本领域公知的标准技术纯化分离的核酸以便基本上不含其他细胞组分或其他污染物,例如其他细胞核酸或蛋白质。

如本文所用,术语“抗体(antibody)”或“抗体(antibodies)”以最广义使用并涵盖各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们表现出所需的抗原结合活性(即本文定义的抗原结合片段)。因此,术语抗体包括,例如,包括全长抗体、全长抗体的抗原结合片段、包含抗体CDR、VH区和/或VL区的分子;和抗体样支架(例如,纤连蛋白)。抗体的实例包括但不限于单克隆抗体、重组产生的抗体、单特异性抗体、多特异性抗体(包括双特异性抗体)、人抗体、人源化抗体、嵌合抗体、免疫球蛋白、合成抗体、包含两条重链和两条轻链分子的四聚体抗体、抗体轻链单体、抗体重链单体、抗体轻链二聚体、抗体重链二聚体、抗体轻链-抗体重链对、胞内抗体、异源缀合抗体、抗体-药物缀合物、单结构域抗体(例如,VHH、(VHH)

如本文所用,术语“全长抗体”是指具有与包含通过二硫键相互连接的两条重链和两条轻链的天然抗体结构基本上相似的结构的抗体。在一些实施方案中,两条重链包含基本上相同的氨基酸序列;并且两条轻链包含基本上相同的氨基酸序列。如果抗体链由于翻译后修饰(例如赖氨酸残基的C末端裂解、可替代的糖基化模式等)而不同,则抗体链可能基本上相同但不完全相同。

术语“抗原结合片段”和“抗原结合结构域”在本文中可互换使用,是指除全长抗体外的一种或多种多肽,其能够特异性结合抗原并包含全长抗体的一部分(例如,VH、VL)。示例性抗原结合片段包括但不限于单结构域抗体(例如,VHH、(VHH)

如本文所用,术语“(scFv)

如本文所用,术语“(VHH)

如本文所用,术语“Fab-Fc”是指包含可操作地连接至Fc结构域或Fc结构域的亚基的Fab的抗体。本文所述的全长抗体包含两个Fab,一个Fab可操作地连接至一个Fc结构域,另一个Fab可操作地连接至第二个Fc结构域。

如本文所用,术语“scFv-Fc”是指包含可操作地连接至Fc结构域或Fc结构域的亚基的scFv的抗体。

如本文所用,术语“VHH-Fc”是指包含可操作地连接至Fc结构域或Fc结构域的亚基的VHH的抗体。

如本文所用,术语“(scFv)

如本文所用,术语“(VHH)

“抗体样支架”是本领域已知的,例如,纤连蛋白和设计的锚蛋白重复蛋白(DARPin)已被用作抗原结合结构域的替代支架,参见,例如,Gebauer and Skerra,Engineered protein scaffolds as next-generation antibody therapeutics.CurrOpin Chem Biol 13:245-255(2009)和Stumpp等人,Darpins:A new generation ofprotein therapeutics.Drug Discovery Today13:695-701(2008)。示例性的抗体样支架蛋白包括但不限于脂质运载蛋白(Anticalin),蛋白A衍生分子如蛋白A的Z结构域(亲和体),A-结构域(Avimer/Maxibody),血清转铁蛋白(trans-body);设计的锚蛋白重复蛋白(DARPin),VNAR片段,纤连蛋白(AdNectin),C型凝集素结构域(Tetranectin);新抗原受体β-内酰胺酶的可变结构域(VNAR片段),人γ-晶状体蛋白或泛素(Affilin分子);人类蛋白酶抑制剂的kunitz型结构域,微体例如来自knottin家族的蛋白质,肽适体和纤连蛋白(adnectin)。

如本文所用,术语“CDR”或“互补决定区”是指在重链和轻链多肽的可变区内发现的非连续抗原结合位点。Kabat等人,J.Biol.Chem.252,6609-6616(1977)和Kabat等人,Sequences of protein of immunological interest.(1991)描述了这些特定区域,所有这些都通过引用整体并入本文。除非另有说明,术语“CDR”是如Kabat等人,J.Biol.Chem.252,6609-6616(1977)和Kabat等人,Sequences of protein ofimmunological interest.(1991)所定义的CDR。

如本文所用,术语“框架(FR)氨基酸残基”是指抗体可变区的框架区中的那些氨基酸。如本文所用,术语“框架区”或“FR区”包括作为可变区的一部分但不是CDR的一部分的氨基酸残基(例如,使用CDR的Kabat定义)。

如本文所用,术语“重链”当用于指代抗体时可以指基于恒定结构域的氨基酸序列的任何不同的类型,例如alpha(α)、delta(δ)、epsilon(ε)、gamma(γ)和mu(μ),其分别产生IgA、IgD、IgE、IgG和IgM类别的抗体,包括IgG的子类别,例如IgG

如本文所用,术语“轻链”当用于指代抗体时可以指基于恒定结构域的氨基酸序列的任何不同的类型,例如,kappa(κ)或lambda(λ)。轻链氨基酸序列是本领域众所周知的。在具体实施方案中,轻链是人轻链。

如本文所用,术语“可变区”是指抗体的一部分,通常是轻链或重链的一部分,典型地是成熟重链中的大约氨基末端的110至120个氨基酸或110至125个氨基酸和成熟轻链中的大约90至115个氨基酸,它们在抗体之间在序列上差异很大,并且用于特定抗体对其特定抗原的结合和特异性。序列的可变性集中在被称为互补决定区(CDR)的那些区域,而可变结构域中更高度保守的区域被称为框架区(FR)。不希望受任何特定机制或理论的束缚,据信轻链和重链的CDR主要负责抗体与抗原的相互作用和特异性。在某些实施方案中,可变区是人可变区。在某些实施方案中,可变区包含啮齿动物或鼠类CDR和人框架区(FR)。在具体实施方案中,可变区是灵长类动物(例如,非人灵长类动物)可变区。在某些实施方案中,可变区包含啮齿动物或鼠类CDR和灵长类动物(例如,非人灵长类动物)框架区(FR)。

术语“VL”和“VL结构域”可互换使用以指抗体的轻链可变区。

术语“VH”和“VH结构域”可互换使用以指抗体的重链可变区。

如本文所用,术语“恒定区”和“恒定结构域”是可互换的并且在本领域中是常见的。恒定区是抗体部分,例如轻链和/或重链的羧基末端部分,其不直接参与抗体与抗原的结合,但可以表现出各种效应子功能,例如与Fc受体的相互作用(例如,Fcγ受体)。免疫球蛋白(Ig)分子的恒定区通常相对于免疫球蛋白(Ig)可变结构域具有更保守的氨基酸序列。

如本文所用,术语“Fc区”是指免疫球蛋白(Ig)重链的C末端区域,其从N末端到C末端包含至少可操作地连接至CH3结构域的CH2结构域。在一些实施方案中,Fc区包含可操作地连接至CH2结构域的N末端的免疫球蛋白(Ig)铰链区。具有工程化Fc区的蛋白质的实例可以在Saunders2019(K.O.Saunders,“Conceptual Approaches to Modulating AntibodyEffector Functions and Circulation Half-Life,”2019,Frontiers in Immunology,V.10,Art.1296,pp.1-20,其通过引用并入本文)中找到。

如本文所用,术语“EU编号系统”是指抗体恒定区的EU编号约定,如Edelman,G.M.等人,Proc.Natl.Acad.USA,63,78-85(1969)和Kabat等人,Sequences of Proteins ofImmunological Interest,U.S.Dept.Health and Human Services,第5版,1991中所述,其各自通过引用整体并入本文。

如本文所用,术语“Kabat编号系统”是指抗体可变区的Kabat编号约定,参见例如,Kabat等人,Sequences of Proteins of Immunological Interest,U.S.Dept.Health andHuman Services,第5版,1991。除非另有说明,抗体可变区的编号根据Kabat编号系统表示。

如本文所用,术语“特异性结合”是指结合抗原(例如,表位或免疫复合物)的分子,如本领域技术人员所理解的此类结合。例如,特异性结合抗原的分子可以结合其他肽或多肽,通常具有较低的亲和力,如通过例如免疫测定、

“亲和力”是指分子(例如,受体)的单个结合位点与其结合配偶体(例如,配体)之间的非共价相互作用的总和的强度。除非另有说明,如本文所用,“结合亲和力”是指固有结合亲和力,其反映结合对成员(例如,抗原结合部分和抗原,或受体及其配体)之间的1:1相互作用。分子X对其伴侣Y的亲和力通常可以用解离常数(KD)表示,它是解离和结合速率常数(分别为koff和kon)之比。因此,等效亲和力可以包含不同的速率常数,只要速率常数的比率保持相同即可。可以通过本领域已知的良好建立的方法测量亲和力,包括本文所述的那些。一种测量亲和力的特定方法是表面等离子共振(SPR)。

可以使用数学算法来实现两个序列(例如,氨基酸序列或核酸序列)之间的“同一性百分比”的确定。同一性测量在具有由特定数学模型或计算机程序(即“算法”)处理的空位比对(如果有的话)的情况下两个或更多个序列中较小序列之间相同匹配的百分比。用于比较两个序列的数学算法的一个具体的、非限制性的实例是Karlin S&Altschul SF(1990)PNAS 87:2264-2268的算法,其如Karlin S&Altschul SF(1993)PNAS 90:5873-5877中所述修改,其各自通过引用整体并入本文。这种算法被并入Altschul SF等人,(1990)J MolBiol 215:403(其通过引用整体并入本文)的BLASTN、BLASTP、BLASTX程序。可以用NBLAST核苷酸程序参数集(例如,得分=100,字长=12)进行BLAST核苷酸搜索以获得与本文所述的核酸分子同源的核苷酸序列。可以使用BLASTP程序参数集(例如默认设置)执行BLAST蛋白质搜索;以获得与本文所述的蛋白质分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可以如Altschul SF等人,(1997)Nuc Acids Res 25:3389-3402(其通过引用整体并入本文)中所述使用空位BLAST。或者,PSI BLAST可用于执行迭代搜索,其检测分子之间的远距离关系(同上)。当利用BLAST、空位BLAST和PSI Blast程序时,可以使用相应程序(例如BLASTP和BLASTN的)的默认参数(参见,例如万维网上的美国国家生物技术信息中心(NCBI),ncbi.nlm.nih.gov)。用于比较序列的数学算法的另一个具体的、非限制性的实例是Myers和Miller,1988,CABIOS 4:11-17(其通过引用整体并入本文)的算法。这种算法并入在ALIGN程序(2.0版)中,它是GCG序列比对软件包的一部分。当使用ALIGN程序用于比较氨基酸序列时,可以使用PAM120权重残基表、12的空位长度罚分和4的空位罚分。两个序列之间的同一性百分比可以在允许或不允许空位的情况下使用与上述那些类似的技术来确定。在计算同一性百分比时,通常只计算精确匹配。如上所述,同一性百分比基于两种蛋白质中较小蛋白质之间的氨基酸匹配。因此,例如,使用默认设置的NCBI Basic LocalAlignment Tool-BLASTP程序(搜索参数:字长3,期望值0.05,hitlist 100,Gapcosts 11,1;Matrix BLOSUM62,Filter string:F;Genetic Code:1;窗口大小:40;阈值:11;基于成分的统计数据:2;Karlin-Altschul统计数据:Lambda:0.31293;0.267;K:0.132922;0.041;H:0.401809;0.14;以及相关统计数据:有效搜索空间:288906);SEQ ID NO:80和SEQ ID NO:423之间的同一性百分比是100%同一性。

如本文所用,术语“可操作地连接”是指处于功能关系中的多核苷酸序列元件或氨基酸序列元件的连接。例如,当多核苷酸序列被置于与另一个多核苷酸序列的功能关系中时,该多核苷酸序列被可操作地连接。在一些实施方案中,如果转录调节多核苷酸序列例如启动子、增强子或其他表达控制元件影响编码蛋白质的多核苷酸序列的转录,则其可操作地连接至编码蛋白质的多核苷酸序列。

术语“受试者”和“患者”在本文中可互换使用并且包括任何人类或非人类动物。术语“非人类动物”包括但不限于脊椎动物例如非人类灵长类动物、绵羊、狗和啮齿动物例如小鼠、大鼠和豚鼠。在一些实施方案中,受试者是人。

如本文所用,术语“施用”是指使用本领域技术人员已知的各种方法和递送系统中的任何一种将治疗剂(或在受试者体内代谢或改变以在体内产生治疗剂的治疗剂的前体)物理引入至受试者。示例性途径包括静脉内、肌肉内、皮下、腹膜内、脊髓或其他肠胃外施用途径,例如通过注射或输注。本文所用的术语“肠胃外施用”是指除肠内和局部施用以外的施用方式,通常通过注射,包括但不限于静脉内、肌肉内、动脉内、鞘内、淋巴管内、病灶内、囊内、眼眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下腔、脊柱内、硬膜外和胸骨内注射和输注,以及体内电穿孔。治疗剂可以通过非肠胃外途径或口服施用。其他非肠胃外途径包括局部、表皮或粘膜施用途径,例如鼻内、阴道、直肠、舌下或局部。也可以例如一次、多次和/或在一个或多个延长的时期内执行施用。

药物或治疗剂的“治疗有效量”或“治疗有效剂量”是当单独使用或与另一种治疗剂组合使用时保护受试者免于疾病发作或促进疾病消退(表现为疾病症状严重程度的降低、疾病无症状期的频率和持续时间的增加,或由疾病折磨引起的损伤或残疾的预防)的药物的任何量。可以使用技术人员已知的多种方法评估治疗剂促进疾病消退的能力,例如在临床试验期间在人类受试者中,在预测在人类中的功效的动物模型系统中,或通过测定试剂在体外测定中的活性。

术语“疾病”、“病症”和“综合征”在本文中可互换使用。

如本文所用,术语“治疗”、“医治”、“疗法”等指减轻或改善疾病和/或与其相关的症状或获得所需的药理和/或生理作用。应当理解,尽管不排除,但治疗疾病并不需要完全消除疾病或与其相关的症状。在一些实施方案中,作用是治疗性的,即但不限于,该作用部分或完全降低、减少、废除、消除、缓解、降低疾病和/或可归因于该疾病的不利症状的强度或治愈该疾病。在一些实施方案中,该作用是预防性的,即该作用保护或预防疾病的发生或复发。为此,目前公开的方法包括施用治疗有效量的如本文所述的组合物。

5.3融合蛋白

在某些方面,本文提供了融合蛋白,其含有包含去泛素化酶的催化结构域或其功能片段或功能变体效应结构域;和包含特异性结合靶胞质蛋白的部分的靶向结构域。

5.3.1效应结构域

在一些实施方案中,效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体。在一些实施方案中,去泛素化酶是人的。在一些实施方案中,催化结构域衍生自天然存在的去泛素化酶(例如,天然存在的人去泛素化酶)。

在一些实施方案中,效应结构域的氨基酸序列包含全长去泛素化酶的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含去泛素化酶的催化结构域的氨基酸序列和在催化结构域的N-末端、C-末端或N-末端和C-末端的额外氨基酸序列。

在一些实施方案中,催化结构域包含去泛素化酶的天然存在的氨基酸序列。在一些实施方案中,催化结构域包含天然存在的去泛素化酶的变体。在一些实施方案中,融合蛋白的催化结构域的氨基酸序列与天然存在的去泛素化酶的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在一些实施方案中,融合蛋白的催化结构域的氨基酸序列与天然存在的去泛素化酶的催化结构域的氨基酸序列相比包含1、2、3、4、5、6、7、8、9、10、15或20个氨基酸修饰。

在一些实施方案中,催化结构域包含足以介导靶蛋白的去泛素化的天然存在的去泛素化酶的最小氨基酸序列。在一些实施方案中,催化结构域包含多于足以介导靶蛋白的去泛素化的天然存在的去泛素化酶的最小氨基酸序列。

在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶或金属蛋白酶。在一些实施方案中,去泛素化酶是半胱氨酸蛋白酶。在一些实施方案中,去泛素化酶是金属蛋白酶。在一些实施方案中,去泛素化酶是泛素特异性蛋白酶(USP)、泛素C末端水解酶(UCH)、Machado-Josephin结构域蛋白酶(MJD)、卵巢肿瘤蛋白酶(OTU)、MINDY蛋白酶或ZUFSP蛋白酶。

示例性去泛素化酶包括但不限于USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45、USP46、BAP1、UCHL1、UCHL3、UCHL5、ATXN3、ATXN3L、OTUB1、OTUB2、MINDY1、MINDY2、MINDY3、MINDY4和ZUP1。用于本公开内容的示例性去泛素化酶也在Komander,D.等人Breaking the chains:structure andfunction of the deubiquitinases.Nat Rev Mol Cell Biol 10,550-563(2009)中公开,其全部内容通过引用并入本文。

在一些实施方案中,去泛素化酶选自USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45和USP46。

在一些实施方案中,去泛素化酶是BAP1、UCHL1、UCHL3或UCHL5。在一些实施方案中,去泛素化酶是ATXN3或ATXN3L。在一些实施方案中,去泛素化酶是OTUB1或OTUB2。在一些实施方案中,去泛素化酶是MINDY1、MINDY2、MINDY3或MINDY4。在一些实施方案中,去泛素化酶是ZUP1。在一些实施方案中,去泛素化酶是Jab1/Mov34/Mpr1 Pad1N-末端+(MPN+)(JAMM)结构域蛋白酶。

在一些实施方案中,去泛素化酶是表1中描述的去泛素化酶。在一些实施方案中,去泛素化酶的氨基酸序列包含与表1中的去泛素化酶的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与表1中的去泛素化酶的催化结构域至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域包含表1中的去泛素化酶的功能片段。在一些实施方案中,效应结构域去泛素化酶包含表1中的去泛素化酶的功能变体。在一些实施方案中,催化结构域包含表1中的去泛素化酶的催化结构域的功能片段。在一些实施方案中,催化结构域包含表1中的去泛素化酶的催化结构域的功能变体。

在一些实施方案中,去泛素化酶包含与SEQ ID NO:1-112中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶由与SEQID NO:1-112中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。

在一些实施方案中,去泛素化酶包含与SEQ ID NO:1至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:2至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:3至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:4至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:5至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:6至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:7至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:8至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:9至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:10至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:11至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:12至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:13至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:14至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:15至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:16至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:17至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:18至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:19至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:20至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:21至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:22至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:23至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:24至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:25至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:26至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:27至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:28至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:29至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:30至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:31至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:32至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:33至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:34至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:35至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:36至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:37至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:38至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:39至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:40至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:41至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:42至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:43至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:44至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:45至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:46至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:47至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:48至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:49至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:50至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:51至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:52至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:53至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:54至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:55至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:56至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:57至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:58至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:59至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:60至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:61至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:62至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:63至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:64至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:65至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:66至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:67至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:68至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:69至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:70至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:71至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:72至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:73至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:74至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:75至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:76至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:77至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:78至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:79至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:80至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:81至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:82至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:83至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:84至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:85至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:86至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:87至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:88至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:89至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:90至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:91至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:92至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:93至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:94至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:95至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:96至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些在实施方案中,去泛素化酶包含与SEQ ID NO:97至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:98至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:99至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:100至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:101至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:102至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:103至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ IDNO:104至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:105至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:106至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:107至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:108至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:109至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:110至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:111至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,去泛素化酶包含与SEQ ID NO:112至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:1-112中任一个的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列由与SEQ ID NO:1-112中任一个的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。

在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:1的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:2的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:3的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:4的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:5的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:6的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:7的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:8的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:9的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:10的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:11的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:12的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:13的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:14的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:15的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:16的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:17的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:18的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:19的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:20的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:21的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:22的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:23的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:24的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:25的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:26的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:27的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:28的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:29的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:30的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:31的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:32的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:33的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:34的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:35的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:36的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:37的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:38的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:39的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:40的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:41的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:42的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:43的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:44的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:45的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:46的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:47的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:48的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:49的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:50的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:51的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:52的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:53的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:54的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:55的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:56的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:57的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:58的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:59的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:60的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:61的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:62的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:63的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:64的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:65的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:66的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:67的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:68的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:69的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:70的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:71的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:72的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:73的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:74的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:75的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:76的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:77的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:78的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:79的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:80的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:81的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:82的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:83的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:84的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:85的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:86的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:87的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:88的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:89的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQID NO:90的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:91的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:92的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:93的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:94的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:95的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ IDNO:96的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:97的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:98的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:99的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:100的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:101的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:102的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:103的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:104的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:105的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:106的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:107的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:108的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:109的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:110的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:111的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,效应结构域的氨基酸序列包含与SEQ ID NO:112的催化结构域的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一些实施方案中,催化结构域衍生自去泛素化酶,其包含与SEQ ID NO:1-112中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:1-112中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。

在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:1的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:2的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:3的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:4的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:5的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:6的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:7的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:8的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:9的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:10的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:11的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:12的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:13的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:14的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:15的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:16的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:17的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:18的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:19的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:20的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:21的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:22的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:23的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:24的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:25的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:26的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:27的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:28的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:29的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:30的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:31的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:32的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:33的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:34的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:35的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:36的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:37的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:38的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:39的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:40的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:41的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:42的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:43的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:44的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:45的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:46的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:47的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:48的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:49的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:50的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:51的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:52的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:53的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:54的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:55的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:56的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:57的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:58的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:59的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:60的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:61的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:62的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:63的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:64的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:65的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:66的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:67的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:68的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:69的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:70的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:71的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:72的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:73的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:74的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:75的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:76的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:77的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:78的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:79的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:80的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:81的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:82的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:83的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:84的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:85的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:86的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:87的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:88的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:89的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:90的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:91的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:92的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:93的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:94的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:95的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:96的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:97的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:98的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:99的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:100的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:101的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:102的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:103的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:104的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:105的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:106的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:107的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:108的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:109的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:110的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ ID NO:111的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。在一些实施方案中,催化结构域衍生自去泛素化酶,其由与SEQ IDNO:112的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。

在一些实施方案中,催化结构域包含与SEQ ID NO:113-220或423中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域由与SEQ ID NO:113-220中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列组成。

在一些实施方案中,催化结构域包含与SEQ ID NO:113的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:114的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:115的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:116的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:117的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:118的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:119的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:120的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:121的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:122的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:123的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:124的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:125的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:126的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:127的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:128的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:129的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:130的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:131的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:132的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:133的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:134的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:135的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:136的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:137的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:138的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:139的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:140的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:141的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:142的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:143的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:144的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:145的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:146的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:147的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:148的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:149的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:150的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:151的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:152的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:153的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:154的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:155的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:156的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:157的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:158的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:159的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:160的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:161的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:162的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:163的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:164的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:165的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:166的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:167的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:168的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:169的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:170的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:171的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:172的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:173的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:174的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:175的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:176的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:177的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:178的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:179的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:180的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:181的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:182的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:183的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:184的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:185的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:186的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:187的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:188的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:189的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:190的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:191的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:192的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:193的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:194的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:195的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:196的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:197的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:198的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:199的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:200的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:201的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:202的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:203的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:204的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:205的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:206的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:207的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:208的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:209的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:210的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:211的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:212的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:213的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:214的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ IDNO:215的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:216的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:217的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:218的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:219的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:220的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,催化结构域包含与SEQ ID NO:423的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

下表1描述了示例性人去泛素化酶的氨基酸序列和示例性人去泛素化酶的示例性催化结构域。催化结构域是示例性的。本领域的普通技术人员可以容易地确定人去泛素化酶的足够氨基酸序列以介导去泛素化(例如,催化结构域)。任何人去泛素化酶(其功能片段或其变体)可用于衍生用于本文所述的融合蛋白的催化结构域。

表1.示例性人去泛素化酶的氨基酸序列及其示例性催化结构域

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

5.3.2靶向结构域

在一些实施方案中,靶向结构域包含特异性结合靶核蛋白的靶向部分。在一些实施方案中,靶向部分包含抗体(或其抗原结合片段)。在一些实施方案中,抗体是全长抗体、单链可变片段(scFv)、(scFv)

在一些实施方案中,靶向部分特异性结合野生型靶核蛋白。在一些实施方案中,靶向部分特异性结合野生型靶核蛋白,但不特异性结合与遗传病相关的靶核蛋白的变体。在一些实施方案中,靶向部分特异性结合靶核蛋白的天然存在的变体。在一些实施方案中,靶向部分特异性结合与遗传病(例如,本文所述的遗传病)相关的靶核蛋白的天然存在的变体。在一些实施方案中,靶向部分特异性结合其为遗传病(例如,本文所述的遗传病)的原因的靶核蛋白的天然存在的变体。在一些实施方案中,靶向部分特异性结合其为功能丧失变体的靶核蛋白的天然存在的变体。在一些实施方案中,靶向部分特异性结合其为与遗传病(例如,本文所述的遗传病)相关的功能丧失变体的靶核蛋白的天然存在的变体。在一些实施方案中,靶向部分特异性结合其为导致遗传病(例如,本文所述的遗传病)的功能丧失变体的靶核蛋白的天然存在的变体。

5.3.2.1示例性靶核蛋白

在一些实施方案中,靶向部分特异性结合靶核蛋白(例如,本文所述的核蛋白)。示例性靶核蛋白包括但不限于克罗莫结构域-解旋酶DNA结合蛋白2(CHD2)、精氨酸-谷氨酸二肽重复蛋白(RERE)、细胞周期蛋白依赖性激酶样5(CDKL5)、甲基CpG结合蛋白2(MECP2)、组蛋白-赖氨酸N-甲基转移酶2D(KMT2D)、组蛋白-赖氨酸N-甲基转移酶SETD5(SETD5)、锌指E-盒结合同源异型框2(ZEB2)、以及钙调蛋白结合转录激活因子1(CAMTA1)、突触功能调节因子FMR1(FMR1)、前信使RNA加工剪接因子8(PRPF8)、视黄酸诱导蛋白1(RAI1)、CREB结合蛋白(CREBBP)、神经纤维瘤蛋白1(NF1)、组蛋白-赖氨酸N-甲基转移酶2A(KMT2A)、克罗莫结构域-解旋酶DNA结合蛋白4(CHD4)、组蛋白-赖氨酸N-甲基转移酶、特异性H3赖氨酸-36(NSD1)、RNA聚合酶II转录亚基13样介体(MED13L)、染色体结构维持蛋白1A(SMC1A)、可能的全局转录转录激活因子SNF2L2(SMARCA2)、含AT丰富相互作用结构域蛋白1B(ARID1B)、具有ZNF结构域的pogo转座元件(POGZ)、组蛋白乙酰转移酶KAT6B(KAT6B)、含AT钩DNA结合基序蛋白1(AHDC1)、组蛋白乙酰转移酶p300(EP300)、含IQ基序和SEC7结构域蛋白2(IQSEC2)、转录因子20(TCF20)、推定多梳家族蛋白ASXL3(ASXL3)、以及组蛋白乙酰转移酶KAT6A(KAT6A)。在一些实施方案中,靶核蛋白是CHD2。在一些实施方案中,靶核蛋白是RERE。在一些实施方案中,靶核蛋白是CDKL5。在一些实施方案中,靶核蛋白是MECP2。在一些实施方案中,靶核蛋白是KMT2D。在一些实施方案中,靶核蛋白是SETD5。在一些实施方案中,靶核蛋白是ZEB2。在一些实施方案中,靶核蛋白是CAMTA1。在一些实施方案中,靶核蛋白是FMR1。在一些实施方案中,靶核蛋白是PRPF8。在一些实施方案中,靶核蛋白是RAI1。在一些实施方案中,靶核蛋白是CREBBP。在一些实施方案中,靶核蛋白是NF1。在一些实施方案中,靶核蛋白是KMT2A。在一些实施方案中,靶核蛋白是CHD4。在一些实施方案中,靶核蛋白是NSD1。在一些实施方案中,靶核蛋白是MED13L。在一些实施方案中,靶核蛋白是SMC1A。在一些实施方案中,靶核蛋白是SMARCA2。在一些实施方案中,靶核蛋白是ARID1B。在一些实施方案中,靶核蛋白是POGZ。在一些实施方案中,靶核蛋白是KAT6B。在一些实施方案中,靶核蛋白是AHDC1。在一些实施方案中,靶核蛋白是EP300。在一些实施方案中,靶核蛋白是IQSEC2。在一些实施方案中,靶核蛋白是TCF20。在一些实施方案中,靶核蛋白是ASXL3。在一些实施方案中,靶核蛋白是KAT6A。

在一些实施方案中,靶核蛋白包含与SEQ ID NO:221的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:222的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:223的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:224的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:225的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:226的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:227的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:228的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:229的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:230的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:231的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:232的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:233的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:234的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:235的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:236的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:237的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:238的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:239的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:240的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:241的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:242的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:243的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:244的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:245的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:246的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:247的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:248的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:424的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:425的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施方案中,靶核蛋白包含与SEQ ID NO:426的氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

下表2提供了示例性蛋白质的野生型氨基酸序列以靶向用于利用本文所述的融合蛋白的去泛素化。

表2.靶向用于利用本文所述的融合蛋白的去泛素化的示例性核蛋白的氨基酸序列和示例性疾病关联

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

5.3.3核定位信号

在一些实施方案中,融合蛋白在融合蛋白的N末端包含核定位信号(NLS)。表3中提供了示例性NLS。在一些实施方案中,NLS包含与SEQ ID NO:249-367之一至少95%、96%、97%、98%、99%或100%相同的氨基酸序列。

表3.示例性NLS的氨基酸序列

/>

/>

/>

/>

5.3.4取向和接头

在一些实施方案中,效应结构域在融合蛋白中靶向结构域的N末端。在一些实施方案中,靶向结构域在融合蛋白中效应结构域的N末端。在一些实施方案中,效应结构域可操作地连接(直接或间接)至靶向结构域的C末端。在一些实施方案中,效应结构域可操作地连接(直接或间接)至靶向结构域的N末端。在一些实施方案中,效应结构域直接可操作地连接至靶向结构域的C末端。在一些实施方案中,效应结构域直接可操作地连接至靶向结构域的N末端。

在一些实施方案中,效应结构域间接可操作地连接至靶向结构域的C末端。在一些实施方案中,效应结构域间接可操作地连接至靶向结构域的N末端。包含例如接头或编码一种或多种多肽的一种或多种氨基酸序列可以位于效应部分和靶向部分之间。在一些实施方案中,效应结构域通过肽接头间接可操作地连接至靶向结构域的C末端。在一些实施方案中,效应结构域通过肽接头间接可操作地连接至靶向结构域的N末端。

本文所述的融合蛋白的每个组分可以直接连接到另一个或通过肽接头间接连接到另一个。[0080]可以使用本领域已知的任何合适的肽接头,其使效应结构域和靶向结构域能够结合它们各自的抗原。在一些实施方案中,接头是可切割接头、不可切割接头、肽接头、柔性接头、刚性接头、螺旋接头或非螺旋接头中的一种或其任意组合。在一些实施方案中,接头是肽接头。在一些实施方案中,接头是包含甘氨酸或丝氨酸,或甘氨酸和丝氨酸氨基酸残基两者的肽接头。在一些实施方案中,肽接头包含约1-20、1-15、1-10、1-5、5-20、5-15、5-10或15-20个氨基酸。在一些实施方案中,肽接头包含或为约2-25、5-25、10-25、15-25、20-25、2-20、5-20、10-20、15-20、2-15、5-15、10-15、2-10或5-10个氨基酸。在一些实施方案中,接头是由甘氨酸或丝氨酸或甘氨酸和丝氨酸氨基酸残基两者组成的肽接头。在一些实施方案中,肽接头由约2-25、5-25、10-25、15-25、20-25、2-20、5-20、10-20、15-20、2-15、5-15、10-15、2-10或5-10个氨基酸组成或为约2-25、5-25、10-25、15-25、20-25、2-20、5-20、10-20、15-20、2-15、5-15、10-15、2-10或5-10个氨基酸。在一些实施方案中,肽接头包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸残基。在一些实施方案中,接头的长度为至少11个氨基酸。在一些实施方案中,接头的长度为至少15个氨基酸。在一些实施方案中,接头的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸残基。

在一些实施方案中,接头是甘氨酸/丝氨酸接头,例如基本上由氨基酸甘氨酸和丝氨酸组成的肽接头。在一些实施方案中,接头是甘氨酸/丝氨酸/脯氨酸接头,例如基本上由氨基酸甘氨酸、丝氨酸和脯氨酸组成的肽接头。

在一些实施方案中,接头的氨基酸序列包含SEQ ID NO:249-367或427-436中任一个的氨基酸序列,或SEQ ID NO:249-367或427-436中任一个的包含1、2或3个氨基酸修饰(例如,取代、缺失或添加)的氨基酸序列。在一些实施方案中,接头的氨基酸序列由SEQ IDNO:249-367或427-436中任一个的氨基酸序列,或SEQ ID NO:249-367或427-436中任一个的包含1、2或3个氨基酸修饰(例如,取代、缺失或添加)的氨基酸序列组成。

在一些实施方案中,接头的氨基酸序列包含SEQ ID NO:427-436中任一个的氨基酸序列,或SEQ ID NO:427-436中任一个的包含1,2个或3个氨基酸修饰(例如,取代、缺失或添加)的氨基酸序列。在一些实施方案中,接头的氨基酸序列由SEQ ID NO:427-436中任一个的氨基酸序列或SEQ ID NO:427-436中任一个的包含1、2或3个氨基酸修饰(例如,取代、缺失或添加)的氨基酸序列组成。

用于本文所述的任何一种或多种融合蛋白的示例性接头的氨基酸序列在下表4中提供。

表4.示例性接头的氨基酸序列

/>

/>

/>

5.3.4.1条件构建体

本文还描述了包含结合至效应结构域(例如,包含去泛素化酶的催化结构域的效应结构域,或包含去泛素化酶的效应结构域)的靶向结构域(例如,VHH、(VHH)

例如,条件构建体包括基于KBP/FRB的二聚化开关,例如,如US20170081411(其全部内容通过引用并入本文)中所描述的,可以在本文中使用。FKBP12(FKBP或FK506结合蛋白)是一种用作天然产物免疫抑制药物雷帕霉素的初始细胞内靶标的丰富的胞质蛋白。雷帕霉素与FKBP和与大的PI3K同系物FRAP(RAFT、mTOR)结合,从而用于使这些分子二聚化。在一些实施方案中,基于FKBP/FRAP的开关,在本文中也称为基于FKBP/FRB的开关,可以利用异二聚化分子,例如雷帕霉素或雷帕霉素类似物。FRB是FRAP的93个氨基酸部分,其足以结合FKBP-雷帕霉素复合物(Chen,J.,Zheng,X.F.,Brown,E.J.&Schreiber,S.L.(1995)Identification of an 11-kDa FKBP12-rapamycin-binding domain within the 289-kDa FKBP12-rapamycin-associated protein and characterization of acriticalserine residue.Proc Natl Acad Sci USA 92:4947-51),其全部内容通过引用并入本文。例如,靶向结构域可以附接到FKBP和效应结构域附接到FRB。因此,靶向结构域和效应结构域的缔合由雷帕霉素介导,并且仅在雷帕霉素存在的情况下发生。

可在此处使用的示例性条件激活系统包括但不限于US20170081411;Lajoie MJ等人,Designed protein logic to target cells with precise combinations ofsurface antigens.Science.2020Sep25;369(6511):1637-1643.doi:10.1126/science.aba6527.Epub 2020Aug 20.PMID:32820060;Farrants H等人,ChemogeneticControl of Nanobodies.Nat Methods.2020Mar;17(3):279-282.doi:10.1038/s41592-020-0746-7.Epub 2020Feb 17.PMID:32066961;和US20170081411中描述的那些,其中每一个的全部内容都针对所有目的通过引用并入本文。

5.3.5示例性融合蛋白

本公开内容的示例性融合蛋白包括但不限于下文所述的那些。在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含半胱氨酸蛋白酶去泛素化酶的催化结构域或其功能片段或功能变体;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含金属蛋白酶去泛素化酶的催化结构域或其功能片段或功能变体;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中该去泛素化酶是泛素特异性蛋白酶(USP)、泛素C末端水解酶(UCH)、Machado-Josephin结构域蛋白酶(MJD)、卵巢肿瘤蛋白酶(OTU)、MINDY蛋白酶或ZUFSP蛋白酶;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中该去泛素化酶选自USP1、USP2、USP3、USP4、USP5、USP6、USP7、USP8、USP9X、USP9Y、USP10、USP11、USP12、USP13、USP14、USP15、USP16、USP17、USP17L2、USP17L3、USP17L4、USP17L5、USP17L7、USP17L8、USP18、USP19、USP20、USP21、USP22、USP23、USP24、USP25、USP26、USP27X、USP28、USP29、USP30、USP31、USP32、USP33、USP34、USP35、USP36、USP37、USP38、USP39、USP40、USP41、USP42、USP43、USP44、USP45、USP46、BAP1、UCHL1、UCHL3、UCHL5、ATXN3 ATXN3L、OTUB1、OTUB2MINDY1、MINDY2、MINDY3、MINDY4或ZUP1;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中去泛素化酶描述于表1中;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中所选的核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中催化结构域描述于表1中;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中该去泛素化酶包含与SEQ ID NO:1-112中任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中催化结构域包含与SEQ ID NO:113-220或423中任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中该去泛素化酶包含与SEQ ID NO:1-112中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中所述核蛋白包含与SEQ ID NO:221-248中的任一个至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

在一个实施方案中,融合蛋白包含效应结构域,该效应结构域包含去泛素化酶的催化结构域或其功能片段或功能变体,其中该催化结构域包含与SEQ ID NO:113-220或423中的任一个至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列;和靶向结构域,其包含特异性结合核蛋白的靶向部分,其中所述核蛋白包含与SEQ ID NO:221-248中的任一个至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。

5.3.5.1其他示例性实施方案

下面提供本文所述的融合蛋白的其他示例性实施方案,其不应被解释为限制性的。

实施方案1.一种融合蛋白,其包含:(a)效应部分,其包含能够介导去泛素化的人去泛素化酶的功能片段,其中所述人去泛素化酶包含与SEQ ID NO:1-112中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,和靶向部分,其包含特异性结合核蛋白的VHH、(VHH)

实施方案2.一种融合蛋白,其包含效应部分,其包含能够介导去泛素化的人去泛素化酶的功能片段,其包含与SEQ ID NO:113-220或423中任一个的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,以及靶向部分,其包含特异性结合核蛋白的VHH、(VHH)

实施方案3.一种融合蛋白,其包含效应部分,其包含能够介导去泛素化的人去泛素化酶的功能片段,其包含与SEQ ID NO:423的氨基酸序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,以及靶向部分,其包含特异性结合核蛋白的VHH、(VHH)

实施方案4.实施方案1-3中任一项的融合蛋白,其中所述靶向部分是VHH或(VHH)

实施方案5.实施方案1-4中任一项的融合蛋白,其中所述核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3、KAT6A、SNRPG、LSM2或NUPR2。

实施方案6.实施方案1-5中任一项的融合蛋白,其中所述核蛋白是CHD2、RERE、CDKL5、MECP2、KMT2D、SETD5、ZEB2、CAMTA1、FMR1、PRPF8、RAI1、CREBBP、NF1、KMT2A、CHD4、NSD1、MED13L、SMC1A、SMARCA2、ARID1B、POGZ、KAT6B、AHDC1、EP300、IQSEC2、TCF20、ASXL3或KAT6A。

实施方案7.实施方案1-6中任一项的融合蛋白,其中所述核蛋白是SNRPG、LSM2或NUPR2。

5.3.6制备融合蛋白的方法

可通过本领域已知的任何常规技术(例如重组技术或化学合成(例如,固相肽合成))制备本文所述的融合蛋白。在一些实施方案中,融合蛋白通过在细胞(例如,真核细胞,例如,哺乳动物细胞)中的重组表达来制备。简而言之,可以通过合成编码融合蛋白的DNA并将该DNA克隆到任何合适的表达载体中来制备融合蛋白。许多克隆载体是本领域技术人员已知的,并且合适的克隆载体的选择是一个选择问题。基因可以置于启动子、核糖体结合位点(用于细菌表达)和任选地操纵子和/或一个或多个增强子元件的控制下,以便编码融合蛋白的DNA序列在由包含此表达构建体的载体转化的宿主细胞中转录成RNA。编码序列可能包含或可能不包含信号肽或前导序列。可将异源前导序列添加至导致表达的多肽从宿主生物体分泌的编码序列。也可能需要其他调节序列,其允许相对于宿主细胞的生长调节蛋白质序列的表达。这样的调节序列是本领域技术人员已知的,并且实例包括引起基因表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。其他类型的调节元件也可以存在于载体中,例如增强子序列。控制序列和其他调节序列可以在插入载体(例如上文所述的克隆载体)之前连接到编码序列。或者,编码序列可以直接克隆到已经包含控制序列和合适的限制性位点的表达载体中。

然后可以使用表达载体来转化合适的宿主细胞。许多哺乳动物细胞系是本领域已知的,包括可从美国典型培养物保藏中心(ATCC)获得的永生化细胞系,例如但不限于中国仓鼠卵巢(CHO)细胞,CHO-悬浮细胞(CHO-S),HeLa细胞,HEK293,幼仓鼠肾(BHK)细胞,猴肾细胞(COS),VERO,HepG2,MadinDarby牛肾(MDBK)细胞,NOS,U2OS,A549,HT1080,CAD,P19,NIH3T3,L929,N2a,MCF-7,Y79,SO-Rb50,DUKX-X11和J558L。

取决于所选择的表达系统和宿主,通过在表达融合蛋白的条件下培养被上述表达载体转化的宿主细胞来产生融合蛋白。然后从宿主细胞分离并纯化融合蛋白。如果表达系统将融合蛋白分泌到生长培养基中,则可以直接从培养基纯化融合蛋白。如果融合蛋白不被分泌,则将其从细胞裂解物分离出来。合适的生长条件和恢复方法的选择在本领域的技术范围内。一旦纯化,就可以确定融合蛋白的氨基酸序列,即通过Edman降解的重复循环,然后通过HPLC进行氨基酸分析。氨基酸测序的其他方法也是本领域已知的。一旦纯化,就可以评估融合蛋白的功能,例如,如本文所述,例如利用双功能ELISA。

如上所述,可以通过本领域已知的任何方法测试融合蛋白的功能。每个功能都可以在单独的测定中测量。例如,可以使用酶联免疫吸附测定(ELISA)测量靶向结构域与靶蛋白的结合。可以使用本领域已知的任何标准去泛素化酶活性测定来测量效应结构域的催化活性。例如,根据制造商的说明,BioVision去泛素化酶活性测定试剂盒(荧光)目录号#K485-100。本文所述的融合蛋白的去泛素化酶活性可以例如通过使用荧光去泛素化酶底物检测荧光底物裂解后的去泛素化酶活性来测量。也可以根据本文提供的实施例中阐述的材料和方法测量去泛素化酶活性。

5.4核酸、宿主细胞、载体和病毒颗粒

在一个方面,本文提供了编码本文所述的融合蛋白的核酸分子。在一些实施方案中,核酸分子是DNA分子。在一些实施方案中,核酸分子是RNA分子。在一些实施方案中,核酸分子含有至少一种修饰的核酸(例如,增加核酸分子的稳定性),例如硫代磷酸酯、N6-甲基腺苷(m6A)、N6,2'-O-二甲基腺苷(m6Am)、8-氧代-7,8-二氢鸟苷(8-oxoG)、假尿苷(Ψ)、5-甲基胞苷(m5C)和N4-乙酰胞苷(ac4C)。

在一个方面,本文提供了包含编码本文所述融合蛋白的核酸的宿主细胞(或宿主细胞群)。在一些实施方案中,核酸被并入宿主细胞的基因组中。在一些实施方案中,核酸没有并入宿主细胞的基因组中。在一些实施方案中,核酸以游离形式存在于细胞中。在一些实施方案中,宿主细胞是人类细胞。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是小鼠、大鼠、仓鼠、豚鼠、猫、狗或人类细胞。在一些实施方案中,宿主细胞在体外、离体或体内被修饰。

可以通过本领域已知(例如,如本文所述)的任何合适的方法将核酸引入宿主细胞。例如,病毒递送系统(例如逆转录病毒、腺病毒、腺相关病毒、疱疹病毒、慢病毒、痘病毒、痘苗病毒、水疱性口炎病毒、脊髓灰质炎病毒、新城疫病毒、Epstein-Barr病毒、流感病毒、呼肠孤病毒、粘液瘤病毒、马拉巴病毒、弹状病毒或柯萨奇病毒递送系统)可用于递送编码融合蛋白的核酸(例如,DNA或RNA分子)用于宿主细胞的表达。在一些实施方案中,编码融合蛋白的核酸以游离形式存在于宿主细胞内。在一些实施方案中,编码融合蛋白的核酸并入宿主细胞的基因组中。在一些实施方案中,病毒具有复制能力。在一些实施方案中,病毒是复制缺陷型的。

在一些实施方案中,使用编码融合蛋白的非病毒载体(例如,质粒)将核酸(DNA或RNA)递送至宿主细胞。在一些实施方案中,编码融合蛋白的核酸以游离形式存在于宿主细胞内。在一些实施方案中,编码融合蛋白的核酸并入宿主细胞的基因组中。本领域已知的示例性非病毒转染方法包括但不限于直接递送DNA,例如通过离体转染、通过注射(例如显微注射)、电穿孔、脂质体介导的转染、受体介导的转染、微粒轰击、通过使用碳化硅纤维的搅拌。通过应用诸如此类的技术,细胞可以用编码本文所述的融合蛋白的核酸稳定地或瞬时地转染以表达所编码的融合蛋白。

在一个方面,本文提供了包含编码本文所述的融合蛋白的核酸(例如,本文所述的核酸)的载体。在一些实施方案中,载体是病毒载体。示例性病毒载体包括但不限于逆转录病毒载体、腺病毒载体、腺相关病毒载体、疱疹病毒载体、慢病毒载体、痘病毒载体、痘苗病毒载体、水疱性口炎病毒载体、脊髓灰质炎病毒载体、新城疫病毒载体、Epstein-Barr病毒载体、流感病毒载体、呼肠孤病毒载体、粘液瘤病毒载体、马拉巴病毒载体、弹状病毒载体和柯萨奇病毒载体。在一些实施方案中,载体是非病毒载体。在一些实施方案中,非病毒载体是质粒。

在一个方面,本文提供了包含编码本文所述融合蛋白的核酸(例如,本文所述核酸)的病毒颗粒(或病毒颗粒群)。在一些实施方案中,病毒颗粒是RNA病毒。在一些实施方案中,病毒颗粒是DNA病毒。在一些实施方案中,病毒颗粒包含双链基因组。在一些实施方案中,病毒颗粒包含单链基因组。示例性病毒颗粒包括但不限于逆转录病毒、腺病毒、腺相关病毒、疱疹病毒、慢病毒、痘病毒、痘苗病毒、水疱性口炎病毒、脊髓灰质炎病毒、新城疫病毒、Epstein-Barr病毒、流感病毒、呼肠孤病毒、粘液瘤病毒、马拉巴病毒、弹状病毒或柯萨奇病毒。

5.5药物组合物

在一个方面,本文提供了药物组合物,其包含1)本文所述的融合蛋白、编码本文所述的融合蛋白的核酸、包含编码本文所述的融合蛋白的核酸的载体或包含编码本文所述的融合蛋白的核酸的病毒颗粒;和2)至少一种药学上可接受的承载体、赋形剂、稳定剂缓冲剂、稀释剂、表面活性剂、防腐剂和/或佐剂等(参见,例如,Remington’s PharmaceuticalSciences(1990)Mack Publishing Co.,Easton,PA)。本领域普通技术人员可以选择合适的赋形剂用于包含在药物组合物中。例如,药物组合物的制剂可以基于施用途径(例如,静脉内、皮下等)和/或药物组合物中包含的活性分子(例如,病毒颗粒、非病毒载体、不包含在载体内的核酸)而不同。

可接受的承载体、赋形剂或稳定剂优选在所用的剂量和浓度下对接受者无毒,并且包括缓冲剂例如磷酸盐、柠檬酸盐或其他有机酸;抗氧化剂,包括抗坏血酸或甲硫氨酸;防腐剂(例如十八烷基二甲基苄基氯化铵;六甲氯铵;苯扎氯铵、苄索氯铵;苯酚、丁基或苯甲醇;对羟基苯甲酸烷基酯,例如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯;邻苯二酚;间苯二酚;环己醇;3-戊醇;或间甲酚);低分子量(小于约10个残基)多肽;蛋白质,例如血清白蛋白、明胶或免疫球蛋白;亲水性聚合物例如聚乙烯吡咯烷酮;氨基酸例如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、双糖或其他碳水化合物,包括葡萄糖、甘露糖或糊精;螯合剂例如EDTA;糖类例如蔗糖、甘露糖醇、海藻糖或山梨糖醇;成盐抗衡离子,例如钠;金属络合物(例如,锌-蛋白质络合物);和/或非离子表面活性剂,例如TWEEN

在一个实施方案中,本公开内容提供了用作药物的包含本文所述的融合蛋白的药物组合物。在另一个实施方案中,本公开内容提供了用于治疗癌症的方法的药物组合物。在一些实施方案中,药物组合物包含在药学上可接受的承载体中的本文公开的融合蛋白和任选地一种或多种另外的预防剂或治疗剂。

可以配制药物组合物以用于对受试者的任何施用途径。施用途径的具体实例包括肠胃外施用(例如,静脉内、皮下、肌肉内)。在一些实施方案中,药物组合物被配制用于静脉内施用。在一些实施方案中,药物组合物被配制用于皮下施用。注射剂可以以常规形式制备,作为液体溶液或悬浮液。注射剂可包含一种或多种赋形剂。示例性赋形剂包括例如水、盐水、葡萄糖、甘油或乙醇。此外,如果需要,待施用的药物组合物还可含有少量无毒辅助物质,例如润湿剂或乳化剂、pH缓冲剂、稳定剂、溶解增强剂或其他此类试剂,例如乙酸钠、失水山梨糖醇单月桂酸酯、三乙醇胺油酸酯或环糊精。

在一些实施方案中,药物组合物被配制用于静脉内施用。适用于静脉内施用的承载体包括生理盐水或磷酸缓冲盐水(PBS),或含有增稠剂或增溶剂的溶液,例如葡萄糖、聚乙二醇或聚丙二醇或其混合物。

用于体内施用的组合物可以是无菌的。这很容易通过例如无菌过滤膜通过过滤来实现。

本文所述的肠胃外制剂中使用的药学上可接受的承载体包括例如水性媒介物、非水性媒介物、抗微生物剂、等渗剂、缓冲剂、抗氧化剂、局部麻醉剂、悬浮剂和分散剂、乳化剂、掩蔽剂或螯合剂或其他药学上可接受的物质。可以掺入本文所述的一种或多种制剂中的水性媒介物的实例包括氯化钠注射液、林格氏注射液、等渗葡萄糖注射液、无菌水注射液、葡萄糖或乳酸盐林格氏注射液。可掺入本文所述的一种或多种制剂中的非水性肠胃外媒介物包括植物来源的固定油、棉籽油、玉米油、芝麻油或花生油。可以将抑细菌或抑真菌浓度的抗微生物剂添加到本文所述的肠胃外制剂中并包装在多剂量容器中,其包括酚类或甲酚类、汞类、苯甲醇、氯丁醇、对羟基苯甲酸甲酯和对羟基苯甲酸丙酯、硫汞撒、苯扎氯铵或苄索氯铵。可以掺入本文所述的一种或多种制剂中的等渗剂包括氯化钠或葡萄糖。可掺入本文所述的一种或多种制剂中的缓冲剂包括磷酸盐或柠檬酸盐。可以掺入本文所述的一种或多种制剂中的抗氧化剂包括硫酸氢钠。可以掺入本文所述的一种或多种制剂中的局部麻醉剂包括盐酸普鲁卡因。可掺入本文所述的一种或多种制剂中的悬浮剂和分散剂包括羧甲基纤维素钠、羟丙基甲基纤维素或聚乙烯吡咯烷酮。可掺入本文所述的一种或多种制剂中的乳化剂包括聚山梨醇酯

在药物组合物中使用的精确剂量还将取决于施用途径和由此引起的病况的严重性,并且应该根据从业者的判断和每个受试者的情况来决定。例如,有效剂量还可以取决于施用方式、靶位点、受试者的生理状态(包括年龄、体重和健康)、施用的其他药物或疗法是预防性还是治疗性而变化。优选滴定治疗剂量以优化安全性和功效。

5.6治疗使用的方法

在一个方面,本文提供了通过向患有疾病的受试者施用本文所述的融合蛋白、编码本文所述的融合蛋白的核酸、包含编码本文所述的融合蛋白的核酸的载体或包含编码本文所述的融合蛋白的核酸的病毒颗粒来治疗受试者的疾病的方法。

可以通过本领域已知的任何方法将融合蛋白递送至宿主细胞。例如,可以利用病毒递送系统(例如逆转录病毒、腺病毒、腺相关病毒、疱疹病毒、慢病毒、痘病毒、痘苗病毒、水疱性口炎病毒、脊髓灰质炎病毒、新城疫病毒、Epstein-Barr病毒、流感病毒、呼肠孤病毒、粘液瘤病毒、马拉巴病毒、弹状病毒、溶瘤病毒(enadenotucirev)或柯萨奇病毒)来递送编码融合蛋白的核酸(例如,DNA或RNA分子)以用于在受试者的细胞群内表达。在一些实施方案中,编码融合蛋白的核酸以游离形式存在于受试者的细胞群中。在一些实施方案中,编码融合蛋白的核酸并入受试者的细胞群的基因组中。在一些实施方案中,病毒具有复制能力。在一些实施方案中,病毒是复制缺陷型的。

在一些实施方案中,将融合蛋白施用至受试者。在一些实施方案中,将核酸(DNA或RNA)施用至受试者。在一些实施方案中,核酸(DNA或RNA)在承载体(例如,纳米颗粒、脂质体、微球)内复合。在一些实施方案中,将编码融合蛋白的非病毒载体(例如,质粒)内的核酸(DNA或RNA)施用至受试者。

5.6.1施用

可以通过本领域已知的任何方法将融合蛋白递送至宿主细胞。例如,可以利用病毒递送系统(例如逆转录病毒、腺病毒、腺相关病毒、疱疹病毒、慢病毒、痘病毒、痘苗病毒、水疱性口炎病毒、脊髓灰质炎病毒、新城疫病毒、Epstein-Barr病毒、流感病毒、呼肠孤病毒、粘液瘤病毒、马拉巴病毒、弹状病毒、溶瘤病毒或柯萨奇病毒)来递送编码融合蛋白的核酸(例如,DNA或RNA分子)以用于在受试者的细胞群内表达。在一些实施方案中,编码融合蛋白的核酸以游离形式存在于受试者的细胞群中。在一些实施方案中,编码融合蛋白的核酸并入受试者的细胞群的基因组中。在一些实施方案中,病毒具有复制能力。在一些实施方案中,病毒是复制缺陷型的。

在一些实施方案中,将融合蛋白施用至受试者。在一些实施方案中,将核酸(DNA或RNA)施用至受试者。在一些实施方案中,核酸(DNA或RNA)在承载体(例如,纳米颗粒、脂质体、微球)内复合。在一些实施方案中,将编码融合蛋白的非病毒载体(例如,质粒)内的核酸(DNA或RNA)施用至受试者。

在一些实施方案中,融合蛋白是肠胃外施用的。在一些实施方案中,融合蛋白通过静脉内、肌肉内、动脉内、鞘内、淋巴管内、病灶内、囊内、眼眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下腔、脊柱内、硬膜外或胸骨内注射或输液施用。在一些实施方案中,静脉内施用融合蛋白。在一些实施方案中,皮下施用融合蛋白。在一些实施方案中,融合蛋白通过非肠胃外途径或口服施用。其他非肠胃外途径包括局部、表皮或粘膜施用途径,例如鼻内、阴道、直肠、舌下或局部。也可以例如一次、多次和/或在一个或多个延长的时期内进行施用。

在一些实施方案中,本文公开的方法用于代替标准护理疗法。在某些实施方案中,标准护理疗法与本文公开的任何方法组合使用。在一些实施方案中,本文公开的方法在标准护理疗法失败后使用。在一些实施方案中,融合蛋白与另外的治疗剂共同施用、在另外的治疗剂之前施用或在另外的治疗剂之后施用。在一些实施方案中,疾病是遗传病。

5.6.2示例性遗传病

在一些实施方案中,疾病是遗传病。在一些实施方案中,遗传病与功能性靶核蛋白的降低的表达相关。在一些实施方案中,遗传病与功能性靶核蛋白的降低的稳定性相关。在一些实施方案中,遗传病与靶核蛋白的增加的泛素化相关。在一些实施方案中,遗传病与靶核蛋白的增加的泛素化和降解相关。在一些实施方案中,遗传病是单倍剂量不足疾病。

在一些实施方案中,该疾病是选自早期CHD2脑病、CDKL5缺乏症、SETD5综合征、CAMTA1综合征、婴儿癫痫性脑病(例如2型)、儿童期发作癫痫性脑病、1p36缺失综合征、Rett综合征、Kabuki综合征1、精神发育迟缓常染色体显性遗传23、Mowat-Wilson综合征、Wiedmann-Steiner综合征、Sifrim-Hitz-Weiss综合征、Sotos综合征、MED13L综合征、SMC1A综合征、Nicolaides-Baraitser综合征、ARID1B相关病症、White-Sutton综合征、KAT6B病症、Xia-Gibbs综合征、Menke-Hennekam综合征2、IQSEC2相关病症、TCF20相关病症、Bainbridge-Ropers综合征和KATA6综合征。

在一些实施方案中,靶核蛋白是CHD2,并且疾病是儿童期发作癫痫性脑病。在一些实施方案中,靶核蛋白是CHD2,并且疾病是CHD2脑病。在一些实施方案中,靶核蛋白是RERE,并且疾病是1p36缺失综合征。在一些实施方案中,靶核蛋白是CDKL5,并且疾病是早期婴儿癫痫性脑病(例如2型)。在一些实施方案中,靶核蛋白是CDKL5,并且疾病是CDKL5缺乏症。在一些实施方案中,靶核蛋白是MECP2,并且疾病是Rett综合征。在一些实施方案中,靶核蛋白是KMT2D,并且疾病是Kabuki综合征1。在一些实施方案中,靶核蛋白是SETD5,并且疾病是精神发育迟缓常染色体显性遗传23。在一些实施方案中,靶核蛋白是ZEB2,并且疾病是Mowat-Wilson综合征。在一些实施方案中,靶核蛋白是KMT2A,并且疾病是Wiedmann-Steiner综合征。在一些实施方案中,靶核蛋白是CHD4,并且疾病是Sifrim-Hitz-Weiss综合征。在一些实施方案中,靶核蛋白是NSD1,并且疾病是Sotos综合征。在一些实施方案中,靶核蛋白是SMC1A,并且疾病是SMC1A综合征。在一些实施方案中,靶核蛋白是SMARCA2,并且疾病是Nicolaides-Baraitser综合征。在一些实施方案中,靶核蛋白是ARID1B,并且疾病是ARID1B相关病症。在一些实施方案中,靶核蛋白是POGZ,并且疾病是White-Sutton综合征。在一些实施方案中,靶核蛋白是KAT6B,并且疾病是KAT6B病症。在一些实施方案中,靶核蛋白是AHDC1,并且遗传病是Xia-Gibbs综合征。在一些实施方案中,靶核蛋白是EP300,并且疾病是Menke-Hennekam综合征2。在一些实施方案中,靶核蛋白是IQSEC2,并且疾病是IQSEC2相关病症。在一些实施方案中,靶核蛋白是TCF20,并且疾病是TCF20相关病症。在一些实施方案中,靶核蛋白是ASXL3,并且疾病是Bainbridge-Ropers综合征。在一些实施方案中,靶核蛋白是KAT6A,并且疾病是KATA6综合征。在一些实施方案中,靶核蛋白是MED13L,并且疾病是MED13L综合征。在一些实施方案中,靶核蛋白是CAMTA1,并且疾病是CAMTA1综合征。在一些实施方案中,靶核蛋白是FMR1,并且疾病是脆性X综合征。在一些实施方案中,靶核蛋白是PRPF8,并且疾病是色素性视网膜炎13。在一些实施方案中,靶核蛋白是RAI1,并且疾病是Smith-Magenis综合征。在一些实施方案中,靶核蛋白是CREBBP,并且疾病是Rubinstein-Taybi综合征。在一些实施方案中,靶核蛋白是NF1,并且疾病是神经纤维瘤病(例如1型)。

5.7试剂盒

在一个方面,本文提供了用于治疗用途的试剂盒,其包含本文所述的融合蛋白、编码本文所述的融合蛋白的核酸、包含编码本文所述的融合蛋白的核酸的载体或包含编码本文所述的融合蛋白的核酸的病毒颗粒。试剂盒通常包括指示试剂盒的内容物的预期用途的标签和使用说明。术语标签包括在试剂盒上或与试剂盒一起提供或者以其他方式随试剂盒提供的任何书写或记录的材料。因此,本公开内容提供了一种用于治疗患有疾病(例如,遗传病)的受试者的试剂盒,该试剂盒包括:(a)一定剂量的融合蛋白、编码本文所述融合蛋白的核酸、包含编码本文所述的融合蛋白的核酸的载体或包含编码本文所述的融合蛋白的核酸的病毒颗粒;和(b)用于在本文公开的任何治疗方法中使用融合蛋白的说明。

6.实施例

本发明通过以下不应被解释为进一步限制的实施例进一步说明。

6.1实施例1.靶向的工程化去泛素化酶的产生

本实施例提供了与荧光团标记的工程化去泛素化酶(enDUB)一起使用荧光标记的靶蛋白以证明在enDUB的情况下表达的上调的一般实验方法。为了举例说明的目的,下文公开的构建体将在适合哺乳动物表达的载体中合成。通常,靶蛋白将与C末端YFP后跟P2A裂解信号和作为第二报告因子的mCherry蛋白(靶蛋白-YFP-P2A-mCherry)一起表达。该构建体将在包含CFP蛋白后跟P2A信号和特异性结合YPF的纳米抗体后跟工程化的DUB(CFP-P2A-抗YFP纳米抗体-enDUB)的三功能融合蛋白存在的情况下共转染。在药物治疗的应用中,靶向纳米抗体(或其他特异性结合剂)将被定向到细胞中待上调的野生型(或致病突变体)蛋白质,而enDUB与被定向到靶蛋白的结合蛋白融合。靶蛋白结合部分可以是任何抗体或抗体片段、纳米抗体或任何其他非抗体支架,例如纤连蛋白、anticalin、锚蛋白重复序列或与待上调的靶蛋白特异性相互作用的天然结合蛋白。下表5提供了测试融合蛋白的组分的氨基酸序列。

表5.测试融合蛋白的组分的氨基酸序列

/>

/>

/>

测试融合蛋白的氨基酸序列在下表6中提供。

表6.示例性测试融合蛋白的氨基酸序列

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

6.2实施例2.靶向的工程化去泛素化酶的测试

为了证明在特异性靶向enDUB的情况下靶蛋白的上调,将进行以下实验。

使用的示意性构建体:

·使用非靶向enDUB融合体的对照实验

o靶标-YFP-P2A-mCherry

o CFP-P2A-enDUB(非靶向对照enDUB)

·用于上调的测试构建体:

o靶标-YFP-P2A-mCherry

o CFP-P2A-a-YFP纳米抗体-enDUB

·或特异性靶向enDUB融合体,其由以下组成

o CFP-P2A-抗-靶向结合剂-enDUB

将携带YFP标记的靶蛋白的质粒与融合至靶结合蛋白的enDUB一起共转染到HEK细胞中。在没有靶向结合剂的情况下携带enDUB的对照构建体也将与标记的靶蛋白一起共转染。24-48小时后,将通过FACS或相对于对照的上调分析转染的细胞。靶蛋白上的mCherry信号将用于标准化转染效率,而CFP信号将用于标准化enDUB构建体的转染效率。与靶蛋白融合的YFP是靶基因表达的读出,并且将相对于对照转染中的信号作图。在enDUB存在的情况下,YFP荧光相对于对照的相对增加将证明上调。

6.3实施例3.用于测试融合蛋白的筛选测定

下面的实施例描述了分析靶向的工程化的去泛素化酶(enDub)(例如,本文所述的enDub)增加靶蛋白的表达的能力的测定。通常,该测定涉及用荧光标签(例如NanoLuciferase(NLuc))和alfa-标签(α-标签)标记靶蛋白;并通过可裂解的接头用不同的荧光标签(例如萤火虫萤光素酶(FLuc))标记enDub和抗alfa标签纳米抗体的融合蛋白。使用两种不同的荧光标签使得能够标准化信号以补偿转染/表达的变化,因为第二个荧光标签通过可裂解接头的裂解从细胞内的enDub-抗alfa标签融合蛋白中快速裂解。图2提供了测定的细胞方面的一般示意图。方案(包括材料和方法)如下所述。

CHO-K1细胞用0.25%(w/v)胰蛋白酶-EDTA在37℃下消化5分钟。为CHO-K1细胞培养物添加完全培养基以停止消化。CHO-K1细胞以800rpm离心5分钟。离心后弃上清,将CHO-K1细胞重新悬浮于2mL培养基中并计数。将10^6个CHO-K1细胞在440V下用0.5ug编码用NLuc和alfa-标签标记的靶蛋白的质粒和1ug编码a)enDub-抗-alfa标签纳米抗体-FLuc融合蛋白(实验性)、b)enDub(对照)或抗-alfa标签纳米抗体(对照)的质粒进行电穿孔。将5E+4个细胞/孔置于24孔板中并在37℃、5%CO

测定中使用的融合蛋白的组分的氨基酸序列详述于下表7中。

表7.测试融合蛋白的组分的氨基酸序列

/>

包含靶蛋白、NLuc和Alfa标签的示例性靶融合蛋白的氨基酸序列详述于下表8中。

表8.示例性靶蛋白-NLuc-Alfa标签融合蛋白的氨基酸序列

/>

/>

/>

/>

包含对照或靶向的工程化去泛素化酶的示例性融合蛋白的氨基酸序列详述于下表9中。

表9.示例性enDub对照和筛选融合蛋白的氨基酸序列

/>

/>

利用上文表7和表8中描述的标记的蛋白和靶向的enDub进行测定。SNRPG靶向的结果显示在图3中,显示SNRPG蛋白表达增加2.37倍。LSM2靶向的结果显示在图4中,显示LSM2蛋白表达增加1.87倍。NUPR2靶向的结果显示在图5中,显示NURP2蛋白表达增加1.13倍。用于SNRPG、LSM2和NUPR2实验的对照是没有靶向alfa-标签的纳米抗体的工程化去泛素化酶。使用萤火虫萤光素酶信号作为参考进行转导效率的标准化,并将NLuc信号除以萤火虫萤光素酶信号之间的比率绘制在y轴上。

***

本发明的范围不受本文所述的具体实施方案的限制。实际上,除了所描述的那些之外,本发明的各种修改对于本领域的技术人员来说从前面的描述和附图将变得明显。这样的修改旨在落入所附权利要求的范围内。

本文引用的所有参考文献(例如,出版物或专利或专利申请)均通过引用整体并入本文并用于所有目的,其程度如同每个单独的参考文献(例如,出版物或专利或专利申请)被具体地并单独地指出出于所有目的通过引用整体并入。

其他实施方案在所附权利要求的范围内。

相关技术
  • 使用工程化的去泛素化酶探测泛素依赖性细胞过程的组合物和方法
  • 用于治疗神经变性疾病的具有E3泛素连接酶结合活性并靶向α-突触核蛋白的蛋白水解靶向嵌合(PROTAC)化合物
技术分类

06120116502736