掌桥专利:专业的专利平台
掌桥专利
首页

OMNI 90-99、101、104-110、114、116、118-123、125、126、128、129和131-138 CRISPR核酸酶

文献发布时间:2024-04-18 19:57:11


OMNI 90-99、101、104-110、114、116、118-123、125、126、128、129和131-138 CRISPR核酸酶

本申请要求于2021年6月24日提交的美国临时申请第63/214,506号和于2021年2月8日提交的美国临时申请第63/147,166号的权益,这两篇申请中的每篇申请的内容通过引入并入本文。

在整个本申请中,引用了各种公开案,其包含括号中引用的公开案。本申请中所提及的所有公开案的公开内容特此以引用的方式整体并入本申请中,以便提供对本发明所涉及的领域和可与本发明一起使用的领域中的特征的额外描述。

序列表的参考

本申请通过引用合并了存在于名为“220207_91677-B-PCT_Sequence_Listing_AWG.txt”的文件中的核苷酸序列,文件大小为980千字节,并且在2022年2月6日以与MS-Windows具有操作系统兼容性的IBM-PC机器格式创建,文件包含在作为本申请一部分的于2022年2月7日提交的文本文件中。

技术领域

本发明尤其涉及用于基因组编辑的组合物和方法。

背景技术

细菌和古菌适应性免疫的成簇的规律间隔短回文重复序列(CRISPR)系统显示蛋白组成和基因组座结构的极端多样性。CRISPR系统已成为研究和基因组工程改造的重要工具。然而,CRISPR系统的许多细节尚未确定,并且CRISPR核酸酶的适用性可能会受到序列特异性要求、表达或递送挑战的限制。不同的CRISPR核酸酶具有不同的特征,诸如:大小、PAM位点、中靶活性、特异性、切割模式(例如平末端、交错末端)以及切割后indel形成的突出模式。不同特征集合可适用于不同应用。例如,由于PAM位点的限制,一些CRISPR核酸酶可能能够靶向其它CRISPR核酸酶无法靶向的特定基因组座。此外,目前使用的一些CRISPR核酸酶表现出预免疫性,这可能会限制体内适用性。参见Charlesworth等人《自然医学(NatureMedicine)》(2019)和Wagner等人《自然医学》(2019)。因此,新型CRISPR核酸酶的发现、工程改造和改进具有重要意义。

发明内容

本文公开可用于基因组工程改造、表观基因组工程改造、基因组靶向、细胞基因组编辑和/或体外诊断的组合物和方法。

所公开的组合物可用于修饰基因组DNA序列。如本文所用,基因组DNA是指线性和/或染色体DNA和/或存在于一或多种所关注的细胞中的质粒或其它染色体外DNA序列。在一些实施例中,所关注的细胞为真核细胞。在一些实施例中,所关注的细胞为原核细胞。在一些实施例中,所述方法在基因组DNA序列中的预定靶位点处产生双链断裂(DSB),引起基因组中靶位点处DNA序列的突变、插入和/或缺失。

因此,在一些实施例中,所述组合物包含成簇的规律间隔短回文重复序列(CRISPR)核酸酶。在一些实施例中,所述CRISPR核酸酶为CRISPR相关蛋白。

OMNI CRISPR核酸酶

本发明的实施例提供如表1中所提供的指定为“OMNI”核酸酶的CRISPR核酸酶。

本发明提供了一种修饰哺乳动物细胞的基因组中靶位点处的核苷酸序列的方法,其包括将以下引入细胞:(i)组合物,其包含CRISPR核酸酶或核酸分子,所述CRISPR核酸酶与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性,所述核酸分子包含编码CRISPR核酸酶的序列,所述序列与选自由SEQ ID NO:40至50、52至89和91至117组成的群组的核酸序列具有至少95%同一性和(ii)靶向DNA的RNA分子,或编码靶向DNA的RNA分子的DNA多核苷酸,所述RNA分子包含与靶DNA中序列互补的核苷酸序列。

本发明还提供一种包含CRISPR相关系统的非天然存在的组合物,所述CRISPR相关系统包含:

a)一或多种包含连接到同向重复序列的引导序列部分的RNA分子,其中所述引导序列能够与靶序列杂交,或一或多种编码所述一或多种RNA分子的核苷酸序列;和

b)CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性的氨基酸序列,所述核酸分子包含编码所述CRISPR核酸酶的序列,并且

其中所述一或多个RNA分子与所述靶序列杂交,其中所述靶序列与原型间隔区邻近基序(PAM)的互补序列的3'端相邻,并且所述一或多个RNA分子与所述RNA-引导核酸酶形成复合物。

本发明还提供一种非天然存在的组合物,其包含:

a)CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性的序列,所述核酸分子包含编码所述CRISPR核酸酶的序列;和

b)一或多种RNA分子或一或多种编码所述一或多种RNA分子的DNA多核苷酸,所述RNA分子包含以下各项中的至少一者:

i)能够与所述CRISPR核酸酶相互作用/结合的核酸酶结合RNA核苷酸序列;和

ii)靶向DNA的RNA核苷酸序列,其包含与靶DNA序列中的序列互补的序列,

其中所述CRISPR核酸酶能够与所述一或多种RNA分子复合以形成能够与所述靶DNA序列杂交的复合物。

附图说明

图1A至图1D:来自OMNI-90、OMNI-114和OMNI-110的单引导RNA(sgRNA)(crRNA-tracrRNA)的预测二级结构。图1A:示出了OMNI-90的原生早熟的crRNA-tracrRNA双链体的表示,并注明了sgRNA的crRNA部分和tracrRNA部分。图1B:针对OMNI-114的V1 sgRNA设计的实例。图1C:针对OMNI-114的V2 sgRNA设计的实例。图1D:针对OMNI-110的sgRNA设计的V1的实例(表2)。

图2A至图2C:实现OMNI-90活性的各种较短版本的sgRNA 1。sgRNA 1支架(V2)通过使由V3产生的末端发夹缺失而缩短。使由V4产生的最后两个发夹缺失。在所有情况下,OMNI-90都保持其活性。

图3至图45:针对OMNI核酸酶的体外TXTL PAM耗竭结果。PAM标志是耗竭位点比的示意图表示(上图)。在TXTL反应的NGS之后计算PAM质粒库中特异性PAM序列(下图,左)的耗竭率(下图,右)。针对每个OMNI的计算基于沿PAM库的8bp序列上的4N窗口。所测试的OMNI的所需PAM和反应条件下的核酸酶活性的水平由耗竭率推断出来。针对以下图的体外PAM耗竭结果:图3至图45:图3A和图3B:OMNI-90。图4:OMNI-91。图5:OMNI-92。图6:OMNI-93。图7:OMNI-94。图8:OMNI-95。图9:OMNI-96。图10:OMNI-97。图11:OMNI-98。图12:OMNI-99。图13:OMNI-101。图14:OMNI-104。图15:OMNI-105。图16:OMNI-106。图17:OMNI-107。图18:OMNI-109。图19:OMNI-110。图20:OMNI-113与sgRNA 19。图21:OMNI-113与sgRNA 34。图22:OMNI-113与sgRNA 39。图23:OMNI-114。图24:OMNI-116。图25:OMNI-118。图26:OMNI-119。图27:OMNI-120。图28:OMNI-121。图29:OMNI-122。图30:OMNI-123。图31:OMNI-125。图32:OMNI-126。图33:OMNI-128。图34:OMNI-129。图35:OMNI-131。图36:OMNI-132与sgRNA 12。图37:OMNI-132与sgRNA 32。图38:OMNI-133。图39:OMNI-134与sgRNA 19。图40:OMNI-134与sgRNA34。图41:OMNI-134与sgRNA 39。图42:OMNI-135。图43:OMNI-136。图44:OMNI-137。图45:OMNI-138。

图46:sgRNA 4的单引导RNA(sgRNA)(crRNA-tracrRNA)的预测二级结构。针对OMNI-93V1(图46A)和V2(图46B)的crRNA-tracrRNA双链体的表示。注明sgRNA的crRNA部分和tracrRNA部分(见表2)。

图47.OMNI-93活性和间隔区优化作为U2OS细胞中的RNP。过表达并纯化OMNI-93CRIPSR核酸酶。纯化的蛋白与合成的sgRNA复合形成RNP。具有不同间隔区长度(20至25个核苷酸)的TRAC S119的RNP的体内测定:RNP被电穿孔到U2OS细胞系中,并通过下一代测序(NGS)评估编辑水平(indel)。

具体实施方式

根据本发明的一些方面,所公开的组合物包含成簇的规律间隔短回文重复序列(CRISPR)核酸酶和/或包含编码所述核酸酶的序列的核酸分子。

表1列出新颖CRISPR核酸酶,以及每种核酸酶内一或多个位置处将核酸酶转化为切口酶或无催化活性的核酸酶的取代。

表2提供crRNA、tracrRNA和单引导RNA(sgRNA)序列,以及crRNA、tracrRNA和sgRNA序列的部分,其与每一所列CRISPR核酸酶相容。因此,能够结合并靶向表2中列出的作为crRNA:tracrRNA复合物一部分的OMNI核酸酶的crRNA分子可以包含表2中列出的任何crRNA序列。类似地,能够结合并靶向表2中列出的作为crRNA:tracrRNA复合物的一部分的OMNI核酸酶的tracrRNA分子可以包含表2中列出的任何tracrRNA序列。此外,能够结合并靶向表2中列出的OMNI核酸酶的单引导RNA分子可以包含表2中列出的任何序列。

例如,OMNI-90核酸酶(SEQ ID NO:1)的crRNA分子可以包含SEQ ID NO:118至121中任一者的序列;OMNI-90核酸酶的tracrRNA分子可以包含SEQ ID NO:122至130和133中任一者的序列;并且OMNI-90核酸酶的sgRNA分子可以包含SEQ ID NO:118至135中任一者的序列。针对每种OMNI核酸酶的其它crRNA分子、tracrRNA分子或sgRNA分子可以以相同的方式衍生自表2中列出的序列。

本发明提供了一种非天然存在的组合物,其包含CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少90%同一性的序列,所述核酸分子包含编码所述CRISPR核酸酶的序列。核酸分子可以是,例如,DNA分子或RNA分子。

在一些实施例中,所述CRISPR核酸酶具有充分的催化活性,是一种切口酶,或是催化无活性的,并且与DNA相互作用蛋白或修饰蛋白融合。例如,所述CRISPR核酸酶可以与脱氨酶蛋白融合以用于碱基编辑方法。在另一实例中,所述CRISPR核酸酶可以与逆转录酶融合以用于先导编辑方法。

在一些实施例中,所述组合物进一步包含一或多种RNA分子或编码所述一或多种RNA分子中的任一者的DNA多核苷酸,其中所述一或多种RNA分子和所述CRISPR核酸酶不一起天然存在,并且所述一或多种RNA分子被配置成与所述CRISPR核酸酶形成复合物和/或将所述复合物靶向靶位点。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:1中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:118至135组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:1中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:118至121组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:122至130和133组成的群组中所示的序列。

在一些实施例中,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:118至135组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:2中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:136至146组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:2中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:136至139组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:140至145组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:2中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:136至146组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:3中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:147至162组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:3中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:147至150组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:151至158、161和162组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:3中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:147至162组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:4中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:163至181组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:4中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:163至166和178至181组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:167至175组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:4中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:163至181组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:5中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:182至197组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:5中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:182至185组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:186至193、196和197组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:5中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:182至197组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:6中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:198至212组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:6中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:198至201组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:202至209和212组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:6中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:198至212组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:7中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:213至234组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:7中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:213至216和227至230组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:217至224和231至234组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:7中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:213至234组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:8中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:235至252组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:8中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:235至238组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:239至247和250至252组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:8中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:235至252组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:9中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:253至265组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:9中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:253至256组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:257至264组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:9中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:253至265组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:10中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:266至279组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:10中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:266至269组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:270至278组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:10中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:266至279组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:11中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:11中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至282、302至305和313至316组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:283至286、306至311、317至321、UCUUUGUGU和UUUGUGU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:11中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:13中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:13中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至282、302至305和313至316组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:283至286、306至311、317至321、UCUUUGUGU和UUUGUGU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:13中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:14中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:14中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至282、302至305和313至316组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:283至286、306至311、317至321、UCUUUGUGU和UUUGUGU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:14中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:280至287、302至322、UCUUUGUGU和UUUGUGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:15中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:323至335和GGCUUUGCC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:15中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:323至326组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:327至334和GGCUUUGCC组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:15中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:323至335和GGCUUUGCC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:16中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:336至354组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:16中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:336至339组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:340至349和352至354组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:16中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:336至354组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:17中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:355至366组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:17中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:355至358组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:359至365组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:17中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:355至366组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:18中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:367至380组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:18中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:367至370组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:371至379组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:18中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:367至380组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:19中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:381至395、600至614、679至695、CGUUCAAAU和UUAAAGUAA组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:19中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:381至384、600至603、679至682和691至694组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:385至392、395、604至611、614、683至688、695、UUAAAGUAA和CGUUCAAAU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:19中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:381至395、600至614、679至695、CGUUCAAAU和UUAAAGUAA组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:20中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:396至418、CAAUAAAAC和CAAUAUAAC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:20中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:396至399和409至412组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:400至406、413至418、CAAUAAAAC和CAAUAUAAC组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:20中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:396至418、CAAUAAAAC和CAAUAUAAC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:21中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:396至418、CAAUAAAAC和CAAUAUAAC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:21中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:396至399和409至412组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:400至406、413至418、CAAUAAAAC和CAAUAUAAC组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:21中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:396至418、CAAUAAAAC和CAAUAUAAC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:22中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:419至434组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:22中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:419至422组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:423至430、433和434组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:22中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:419至434组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:23中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:435至447组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:23中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:435至438组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:439至446组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:23中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:435至447组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:24中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:448至464和GGUUUAACC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:24中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:448至451组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:452至460、463和GGUUUAACC组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:24中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:448至464和GGUUUAACC组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:25中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:465至476组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:25中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:465至468组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:469至475组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:25中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:465至476组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:26中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:477至490组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:26中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:477至480组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:481至489组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:26中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:477至490组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:27中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:491至503组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:27中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:491至494组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:495至502组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:27中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:491至503组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:28中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:504至516组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:28中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:504至507组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:508至515组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:28中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:504至516组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:29中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:517至530组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:29中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:517至520组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:521至529组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:29中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:517至530组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:30中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:531至544组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:30中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:531至534组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:535至543组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:30中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:531至544组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:31中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:545至560组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:31中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:545至548组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:549至556、559和560组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:31中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:545至560组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:32中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:561至575组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:32中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:561至564组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:565至574组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:32中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:561至575组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:33中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:288至301和576至590组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:33中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:288至291和576至579组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:292至298、301、580至586和590组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:33中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:288至301和576至590组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:34中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:591至599、UUACAAGGU和ACAAGGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:34中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:591和592组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:593至596、599、UUACAAGGU和ACAAGGU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:34中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:591至599、UUACAAGGU和ACAAGGU组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:35中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:381至395、600至614、679至695、CGUUCAAAU和UUAAAGUAA组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:35中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:381至384、600至603、679至682和691至694组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:385至392、395、604至611、614、683至688、695、UUAAAGUAA和CGUUCAAAU组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:35中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:381至395、600至614、679至695、CGUUCAAAU和UUAAAGUAA组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:36中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:615至631组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:36中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:615至618组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:619至628和631组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:36中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:615至631组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:37中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:632至646组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:37中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:632至635组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:636至643和646组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:37中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:632至646组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:38中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:647至665组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:38中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:647至650和662至665组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:651至659组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:38中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:647至665组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:39中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:666至678组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:39中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,其包含引导序列部分和选自由SEQ ID NO:666至669组成的群组的序列。

在一些实施例中,所述组合物进一步包含反式激活CRISPR RNA(tracrRNA)分子,其包含由SEQ ID NO:670至677组成的群组中所示的序列。

在一些实施例中,所述CRISPR核酸酶包含与SEQ ID NO:39中所示的所述氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,其包含引导序列部分和选自由SEQ ID NO:666至678组成的群组的序列。

在一些实施例中,所述CRISPR核酸酶是一种具有失活RuvC结构域的切口酶,所述结构域由表1第5列中为所述CRISPR核酸酶提供的位置处的氨基酸取代而产生。

在一些实施例中,所述CRISPR核酸酶是一种具有失活HNH结构域的切口酶,所述结构域由表1第6列中为所述CRISPR核酸酶提供的位置处的氨基酸取代而产生。

在一些实施例中,所述CRISPR核酸酶是一种具有失活RuvC结构域和失活HNH结构域的无催化活性的核酸酶,所述两个结构域由表1第7列中为所述CRISPR核酸酶提供的所述位置处的取代而产生。

例如,通过以OMNI-90(SEQ ID NO:1)的氨基酸序列的位置11的天冬氨酸残基(D)取代另一种氨基酸,例如,丙氨酸(A),使其RuvC结构域失活,可以为OMNI-90核酸酶生成切口酶。表1第5列至第7列中指示的每个氨基酸位置允许用任何其它氨基酸取代,除非氨基酸位置后跟星号,这表明除谷氨酸(E)对天冬氨酸(D)或天冬氨酸(D)对谷氨酸(E)外的任何取代都会导致失活。例如,通过以OMNI-90(SEQ ID NO:1)的氨基酸序列的位置596的谷氨酸残基(E)取代天冬氨酸(D)以外的氨基酸,例如丙氨酸(A),使其HNH结构域失活,可以为OMNI-90核酸酶生成切口酶。可以使用表1中的相同符号产生其它切口酶或无催化活性的核酸酶。

在一些实施例中,所述CRISPR核酸酶利用表3第2列或第3列中为所述CRISPR核酸酶提供的原型间隔区邻近基序(PAM)序列。

本发明还提供了一种用于修饰无细胞系统或细胞基因组中DNA靶位点的核苷酸序列的方法,其包括将上述组合物中的任何一种组合物引入所述细胞中。在一些实施例中,所述组合物包含CRISPR核酸酶和crRNA:tracrRNA复合物或sgRNA分子。

在一些实施例中,所述CRISPR核酸酶在与表3第2列或第3列中为所述CRISPR核酸酶提供的原型间隔区邻近基序(PAM)序列相邻的DNA链中实现DNA断裂,并且在与和所述PAM序列互补的序列相邻的DNA链中实现DNA断裂。例如,具有适当靶向sgRNA或crRNA:tracrRNA复合物的OMNI-90核酸酶能够在与NNVTDNNN或NNATWBNN序列相邻的链中形成DNA断裂,并在与和NNVTDNNN或NNATWBNN序列互补的序列相邻的DNA链中形成DNA断裂。在一些实施例中,DNA链在细胞的细胞核内。

在一些实施例中,所述CRISPR核酸酶是一种具有失活RuvC结构域的切口酶,所述结构域由表1第5列中为所述CRISPR核酸酶提供的位置处的氨基酸取代而产生,并且在与和所述PAM序列互补的序列相邻的DNA链中实现DNA断裂。

在一些实施例中,所述CRISPR核酸酶是一种具有失活HNH结构域的切口酶,所述结构域由表1第6列中为所述CRISPR核酸酶提供的位置处的氨基酸取代而产生,并且在与所述PAM序列相邻的DNA链中实现DNA断裂。

在一些实施例中,所述CRISPR核酸酶是一种具有失活RuvC结构域和失活HNH结构域的无催化活性的核酸酶,所述两个结构域通过表1第7列中为所述CRISPR核酸酶提供的位置处的取代而产生,并且在与所述PAM序列相邻的DNA链中实现DNA断裂。

在一些实施例中,所述细胞为真核细胞或原核细胞。

在一些实施例中,所述细胞是哺乳动物细胞。

在一些实施例中,所述细胞是人类细胞。

在一些实施例中,所述CRISPR核酸酶包含与如SEQ ID NO:1至11和13至39中的任一者中所示的CRISPR核酸酶具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%或82%氨基酸序列同一性的氨基酸序列。在一个实施例中,编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:40至50、52至89和91至117组成的群组的核酸序列具有至少95%的同一性。

本发明还提供了一种包含CRISPR核酸酶的非天然存在的组合物,其中所述CRISPR核酸酶包含对应于CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列的氨基酸序列,其中每个结构域序列与补充表1中为所述结构域识别的氨基酸具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性。

例如,一种包含CRISPR核酸酶的非天然存在的组合物,其中所述CRISPR核酸酶包含对应于SEQ ID NO:2的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列的氨基酸序列,

a)其中结构域A包含与SEQ ID NO:2的氨基酸1至40具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

b)其中结构域B包含与SEQ ID NO:2的氨基酸41至84具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

c)其中结构域C包含与SEQ ID NO:2的氨基酸85至129具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

d)其中结构域D包含与SEQ ID NO:2的氨基酸130至142具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

e)其中结构域E包含与SEQ ID NO:2的氨基酸143至251具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

f)其中结构域F包含与SEQ ID NO:2的氨基酸252至463具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

g)其中结构域G包含与SEQ ID NO:2的氨基酸464至511具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

h)其中结构域H包含与SEQ ID NO:2的氨基酸512至656具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;

i)其中结构域I包含与SEQ ID NO:2的氨基酸657至830具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;并且

j)其中结构域I包含与SEQ ID NO:2的氨基酸831至1084具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。

因此,补充表1可用于识别可包含在这种CRISPR核酸酶中的结构域。

根据本发明的一些方面,所公开的组合物包含DNA构建体或载体系统,其包含编码CRISPR核酸酶或变体CRISPR核酸酶的核苷酸序列。在一些实施例中,编码CRISPR核酸酶或变体CRISPR核酸酶的核苷酸序列以可操作方式连接到在所关注的细胞中可操作的启动子。在一些实施例中,所关注的细胞为真核细胞。在一些实施例中,所关注的细胞为哺乳动物细胞。在一些实施例中,编码经工程改造的CRISPR核酸酶的核酸序列经密码子优化以用于来自特定生物体的细胞。在一些实施例中,编码核酸酶的核酸序列针对大肠杆菌经密码子优化。在一些实施例中,编码核酸酶的核酸序列针对真核细胞经密码子优化。在一些实施例中,编码核酸酶的核酸序列针对哺乳动物细胞经密码子优化。

在一些实施例中,所述组合物包含重组核酸,其包含以可操作方式连接到编码CRISPR酶的多核苷酸的异源启动子,所述CRISPR酶与SEQ ID NO:1至11和13至39中的任一者具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%的同一性。每种可能性代表单独的实施例。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:1中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:40和79组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:2中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:41和80组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:3中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:42和81组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:4中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:43和82组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:5中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:44和83组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:6中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:45和84组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:7中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:46和85组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:8中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:47和86组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:9中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:48和87组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:10中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:49和88组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:11中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:50和89组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:13中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:52和91组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:14中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:53和92组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:15中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:54和93组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:16中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:55和94组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:17中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:56和95组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:18中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:57和96组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:19中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:58和97组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:20中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:59和98组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:21中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:60和99组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:22中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:61和100组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:23中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:62和101组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:24中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:63和102组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:25中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:64和103组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:26中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:65和104组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:27中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:66和105组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:28中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:67和106组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:29中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:68和107组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:30中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:69和108组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:31中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:70和109组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:32中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:71和110组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:33中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:72和111组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:34中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:73和112组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:35中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:74和113组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:36中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:75和114组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:37中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:76和115组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:38中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:77和116组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

在所述组合物的一个实施例中,所述CRISPR核酸酶与SEQ ID NO:39中所示的所述氨基酸序列具有至少75%、80%、85%、90%、95%或97%的同一性,或者编码所述CRISPR核酸酶的序列与选自由SEQ ID NO:78和117组成的群组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%的序列同一性。

根据一些实施例,提供了一种经工程改造或非天然存在的组合物,其包含CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%同一性的序列,所述核酸分子包含编码所述CRISPR核酸酶的序列。每种可能性代表单独的实施例。

在一个实施例中,所述CRISPR核酸酶是经工程改造或非天然存在的。CRISPR核酸酶也可以是重组的。此类CRISPR核酸酶使用实验室方法(分子克隆)产生以将来自多个来源的遗传物质放在一起,产生原本未在生物体中发现的序列。

在一个实施例中,当与一或多种RNA分子复合时,与SpCas9核酸酶相比,本发明的CRISPR核酸酶展现对靶位点提高的特异性。

在一个实施例中,与SpCas9核酸酶相比,本发明的CRISPR核酸酶与一或多种RNA分子的复合物展现至少维持的靶位点的中靶编辑活性和降低的脱靶活性。

在一个实施例中,所述CRISPR核酸酶进一步包含能够与靶向DNA的RNA分子(gRNA)相互作用的RNA结合部分和展现定点酶活性的活性部分。

在一个实施例中,所述组合物进一步包含靶向DNA的RNA分子或编码靶向DNA的RNA分子的DNA多核苷酸,其中所述靶向DNA的RNA分子包含引导序列部分,即与靶区中的序列互补的核苷酸序列,其中所述靶向DNA的RNA分子和所述CRISPR核酸酶不一起天然存在。

在一个实施例中,所述靶向DNA的RNA分子进一步包含可与CRISPR核酸酶形成复合物的核苷酸序列。

本发明还提供一种包含CRISPR相关系统的非天然存在的组合物,所述CRISPR相关系统包含:

a)一或多种包含连接到同向重复序列的引导序列部分的RNA分子,其中所述引导序列能够与靶序列杂交,或一或多种编码所述一或多种RNA分子的核苷酸序列;和

b)CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性的氨基酸序列,所述核酸分子包含编码所述CRISPR核酸酶的序列,

其中所述一或多个RNA分子与所述靶序列杂交,其中所述靶序列是原型间隔区邻近基序(PAM)的3',并且所述一或多个RNA分子与所述RNA引导核酸酶形成复合物。

在一个实施例中,所述组合物进一步包含RNA分子(例如,tracrRNA分子)或DNA多核苷酸,所述RNA分子包含可与CRISPR核酸酶形成复合物的核苷酸序列,所述DNA多核苷酸包含编码可与所述CRISPR核酸酶形成复合物的RNA分子的序列。

在一个实施例中,所述组合物进一步包含用于同源定向修复(HDR)的供体模板。

在一个实施例中,所述组合物能够编辑细胞基因组中的靶区。

根据一些实施例,提供一种非天然存在的组合物,其包含:

(a)CRISPR核酸酶或编码所述CRISPR核酸酶的多核苷酸,所述CRISPR核酸酶包含:

RNA结合部分;和

表现出位点定向酶活性的活性部分,其中所述CRISPR核酸酶与SEQ ID NO:1至11和13至39中的任一者具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%的同一性;和

(b)一或多种RNA分子或编码所述一或多种RNA分子的DNA多核苷酸,所述一或多种RNA分子包含:

i)靶向DNA的RNA核苷酸序列,其包含与靶DNA序列中的序列互补的核苷酸序列;和

ii)蛋白结合RNA序列,其能够与所述CRISPR核酸酶的所述RNA结合部分相互作用,

其中所述靶向DNA的RNA序列和所述CRISPR核酸酶不一起天然存在。每种可能性代表单独的实施例。

在一些实施例中,提供包含所述靶向DNA的RNA序列和所述蛋白结合RNA序列的单一RNA分子,其中所述RNA分子可与所述CRISPR核酸酶形成复合物并且用作DNA靶向模块。在一些实施例中,所述RNA分子具有至多1000个碱基、900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基、100个碱基、50个碱基的长度。每种可能性代表单独的实施例。在一些实施例中,包含所述靶向DNA的RNA序列的第一RNA分子和包含所述蛋白结合RNA序列的第二RNA分子通过碱基配对相互作用或可选地融合在一起以形成一或多个RNA分子,所述一或多个RNA分子与所述CRISPR核酸酶复合并用作DNA靶向模块。

本发明还提供一种非天然存在的组合物,其包含:

a)CRISPR核酸酶或核酸分子,所述CRISPR核酸酶包含与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性的序列,所述核酸分子包含编码所述CRISPR核酸酶的序列;和

b)一或多种RNA分子或一或多种编码所述一或多种RNA分子的DNA多核苷酸,所述RNA分子包含以下各项中的至少一者:

i)能够与所述CRISPR核酸酶相互作用/结合的核酸酶结合RNA核苷酸序列;和

ii)靶向DNA的RNA核苷酸序列,其包含与靶DNA序列中的序列互补的序列,

其中所述CRISPR核酸酶能够与所述一或多种RNA分子复合以形成能够与所述靶DNA序列杂交的复合物。

在一个实施例中,所述CRISPR核酸酶和所述一或多种RNA分子形成能够结合到所述靶DNA序列以实现所述靶DNA序列的切割的CRISPR复合物。

在一个实施例中,所述CRISPR核酸酶和所述一或多种RNA分子中的至少一者不一起天然存在。

在一个实施例中,

a)所述CRISPR核酸酶包含RNA结合部分和展现定点酶活性的活性部分;

b)所述靶向DNA的RNA核苷酸序列包含与靶DNA序列中的序列互补的核苷酸序列;以及

c)所述核酸酶结合RNA核苷酸序列包含与所述CRISPR核酸酶的所述RNA结合部分相互作用的序列。

在一个实施例中,所述核酸酶结合RNA核苷酸序列和所述靶向DNA的RNA核苷酸序列在单引导RNA分子(sgRNA)上,其中所述sgRNA分子可与所述CRISPR核酸酶形成复合物并且用作所述DNA靶向模块。

在一个实施例中,所述核酸酶结合RNA核苷酸序列在第一RNA分子上,并且所述靶向DNA的RNA核苷酸序列在第二RNA分子上,并且其中所述第一RNA分子和所述第二RNA分子通过碱基配对相互作用或融合在一起以形成RNA复合物或与所述CRISPR核酸酶形成复合物并用作DNA靶向模块的sgRNA。

在一个实施例中,所述sgRNA具有至多1000个碱基、900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基、100个碱基、50个碱基的长度。

在一个实施例中,所述组合物进一步包含用于同源定向修复(HDR)的供体模板。

在一个实施例中,所述CRISPR核酸酶是非天然存在的。

在一个实施例中,所述CRISPR核酸酶经工程改造并且包含非天然或合成氨基酸。

在一个实施例中,所述CRISPR核酸酶经工程改造并且包含核定位序列(NLS)、细胞穿透肽序列和/或亲和标签中的一或多者。

在一个实施例中,所述CRISPR核酸酶包含一或多种核定位序列,其强度足以驱动包含所述CRISPR核酸酶的CRISPR复合物在真核细胞的细胞核中以可检测量积累。

本发明还提供一种修饰无细胞系统或细胞基因组中的靶位点处的核苷酸序列的方法,其包括将本发明组合物中的任一者引入到细胞中。

在一个实施例中,所述细胞为真核细胞。

在另一实施例中,所述细胞为原核细胞。

在一些实施例中,所述一或多种RNA分子进一步包含包括可与所述RNA核酸酶形成复合物的核苷酸分子的RNA序列(tracrRNA),或编码包括可与所述CRISPR核酸酶形成复合物的核苷酸序列的RNA分子的DNA多核苷酸。

在一个实施例中,所述CRISPR核酸酶在所述氨基末端处或附近包含1、2、3、4、5、6、7、8、9、10或更多个NLS,在羧基末端处或附近包含1、2、3、4、5、6、7、8、9、10或更多个NLS,或包含在所述氨基末端处或附近1、2、3、4、5、6、7、8、9、10或更多个NLS与在羧基末端处或附近1、2、3、4、5、6、7、8、9、10或更多个NLS的组合。在一个实施例中,1-4个NLS与所述CRISPR核酸酶融合。在一个实施例中,NLS位于所述CRISPR核酸酶的开放阅读框(ORF)内。

在表达的蛋白的氨基末端处或附近、羧基末端处或附近或ORF内融合NLS的方法在所属领域中是众所周知的。例如,为了将NLS融合到CRISPR核酸酶的氨基末端,将NLS的核酸序列紧接在编码NLS融合的CRISPR核酸酶的核酸上的CRISPR核酸酶的起始密码子之后放置。相反,为了将NLS融合到CRISPR核酸酶的羧基末端,将NLS的核酸序列放置在编码CRISPR核酸酶的最后一个氨基酸的密码子之后且在终止密码子之前。

本发明考虑在沿CRISPR核酸酶的ORF的任何位置处的NLS、细胞穿透肽序列和/或亲和标签的任何组合。

本文所提供的CRISPR核酸酶的氨基酸序列和核酸序列可包括插入的NLS和/或TAG,以便中断CRISPR核酸酶的连续氨基酸或核酸序列。

在一个实施例中,所述一或多个NLS是串联重复序列。

在一个实施例中,当NLS的最近氨基酸沿多肽链距N或C末端在约1、2、3、4、5、10、15、20、25、30、40、50或更多个氨基酸内时,认为一所述或多个NLS接近N或C末端。

如所论述,CRISPR核酸酶可以经工程改造以包含核定位序列(NLS)、细胞穿透肽序列和/或亲和标签中的一或多者。

在一个实施例中,当与所述一或多个RNA分子复合时,与所述CRISPR核酸酶的野生型相比,所述CRISPR核酸酶对靶位点表现出增加的特异性。

在一个实施例中,与所述CRISPR核酸酶的野生型相比,所述CRISPR核酸酶与一或多种RNA分子的复合物展现至少维持的靶位点的中靶编辑活性和降低的脱靶活性。

在一个实施例中,所述组合物进一步包含重组核酸分子,其包含以可操作方式连接到包含编码所述CRISPR核酸酶的所述序列的所述核苷酸分子的异源启动子。

在一个实施例中,所述CRISPR核酸酶或包含编码所述CRISPR核酸酶的序列的核酸分子是非天然存在或经工程改造的。

本发明还提供了一种包含载体系统的非天然存在或经工程改造的组合物,所述载体系统包含所述核酸分子,所述核酸分子包含编码本发明的所述CRISPR核酸酶中的任何CRISPR核酸酶的序列。

本发明还提供本发明组合物中的任一者的用于治疗罹患与基因组突变相关的疾病的对象的用途,其包含修饰对象的基因组中靶位点处的核苷酸序列。

本发明提供了一种修饰哺乳动物细胞的基因组中靶位点处的核苷酸序列的方法,其包括将以下引入细胞:(i)组合物,其包含CRISPR核酸酶或核酸分子,所述CRISPR核酸酶与选自由SEQ ID NO:1至11和13至39组成的群组的氨基酸序列具有至少95%同一性,所述核酸分子包含编码CRISPR核酸酶的序列,所述序列与选自由SEQ ID NO:40至50、52至89和91至117组成的群组的核酸序列具有至少95%同一性和(ii)靶向DNA的RNA分子,或编码靶向DNA的RNA分子的DNA多核苷酸,所述RNA分子包含与靶DNA中序列互补的核苷酸序列。

在一些实施例中,所述方法离体进行。在一些实施例中,所述方法体内进行。在一些实施例中,所述方法的一些步骤离体进行并且一些步骤体内进行。在一些实施例中,所述哺乳动物细胞为人类细胞。

在一个实施例中,所述方法进一步包括将以下引入细胞:(iii)包含tracrRNA序列的RNA分子或编码包含tracrRNA序列的RNA分子的DNA多核苷酸。

在一个实施例中,所述靶向DNA的RNA分子包含crRNA重复序列。

在一个实施例中,包含tracrRNA序列的所述RNA分子能够结合所述靶向DNA的RNA分子。

在一个实施例中,所述靶向DNA的RNA分子和包含tracrRNA序列的所述RNA分子相互作用以形成RNA复合物,并且所述RNA复合物能够与所述CRISPR核酸酶形成活性复合物。

在一个实施例中,所述靶向DNA的RNA分子和包含核酸酶结合RNA序列的所述RNA分子以适合与所述CRISPR核酸酶形成活性复合物的单引导RNA分子的形式进行融合。

在一个实施例中,所述引导序列部分包含与原型间隔区序列互补的序列。

在一个实施例中,所述CRISPR核酸酶与所述靶向DNA的RNA分子形成复合物,并在原型间隔区邻近基序(PAM)的3'或5'区中实现双链断裂。

在本文描述的方法中的任一者的一个实施例中,所述方法用于治疗罹患与基因组突变相关的疾病的对象,其包含修饰所述对象的基因组中靶位点处的核苷酸序列。

在一个实施例中,所述方法包括首先选择罹患与基因组突变相关的疾病的对象并且从所述对象获得细胞。

本发明还提供通过本文描述的方法中的任一者获得的一或多种修饰的细胞。在一个实施例中,这一或多种修饰的细胞能够产生子代细胞。在一个实施例中,这一或多种修饰的细胞能够在植入后产生子代细胞。

本发明还提供一种组合物,其包含这些修饰的细胞和药学上可接受的载剂。还提供一种制备此组合物的体外或离体方法,其包括将细胞与药学上可接受的载剂混合。

本发明还提供了一种用于修饰无细胞系统或细胞基因组中DNA靶位点处的核苷酸序列的试剂盒,所述修饰包括将以下引入所述系统或细胞:与选自由SEQ ID NO:1至11和13至39组成的群组的所述氨基酸序列具有至少95%序列同一性的CRISPR核酸酶、配置为与所述CRISPR核酸酶形成复合物和/或将所述复合物靶向靶位点的一或多个RNA分子和用于将所述RNA分子和所述CRISPR核酸酶递送至所述细胞的说明。例如,试剂盒可以用作诊断试剂盒以检测细胞或试管中核苷酸分子中靶位点(例如,DNA序列)的存在。

靶向DNA的RNA分子

RNA分子的“引导序列部分”是指能够与特定靶DNA序列杂交的核苷酸序列,例如引导序列部分具有与沿引导序列部分的长度被靶向的DNA序列部分或完全互补的核苷酸序列。在一些实施例中,引导序列部分的长度为17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸,或长度为大约17至50、17至49、17至48、17至47、17至46、17至45、17至44、17至43、17至42、17至41、17至40、17至39、17至38、17至37、17至36、17至35、17至34、17至33、17至31、17至30、17至29、17至28、17至27、17至26、17至25、17至24、17至22、17至21、18至25、18至24、18至23、18至22、18至21、19至25、19至24、19至23、19至22、19至21、19至20、20至22、18至20、20至21、21至22或17至20个核苷酸。引导序列部分的整个长度与沿引导序列部分的长度被靶向的DNA序列完全互补。引导序列部分可以是可与CRISPR核酸酶形成复合物的RNA分子的一部分,其中引导序列部分用作CRISPR复合物的DNA靶向部分。当具有引导序列部分的DNA分子与CRISPR分子同时存在时,RNA分子能够将CRISPR核酸酶靶向特定靶DNA序列。每种可能性代表单独的实施例。RNA分子可以定制设计以靶向任何所需序列。因此,包含“引导序列部分”的分子是一种类型的靶向分子。在整个本申请中,术语“引导分子”、“RNA引导分子”、“引导RNA分子”和“gRNA分子”与包含引导序列部分的分子同义,并且术语“间隔区”与“引导序列部分”同义。

在本发明的实施例中,当与包含具有17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸的引导序列部分的RNA分子一起使用时,所述CRISPR核酸酶具有其最大切割活性。

单引导RNA(sgRNA)分子可用于将CRISPR核酸酶引导至所需靶位点。单引导RNA包含引导序列部分以及支架部分。支架部分与CRISPR核酸酶相互作用,并与引导序列部分一起激活CRISPR核酸酶并将CRISPR核酸酶靶向所需的靶位点。支架部分可以被进一步工程改造成,例如,尺寸减小。例如,OMNI-103CRIPSR核酸酶通过sgRNA分子表现出中靶核酸酶活性,sgRNA分子具有长度仅为79个核苷酸的经工程改造的支架部分。

根据本发明的一些方面,所公开的方法包括一种修饰无细胞系统或细胞基因组中靶位点处的核苷酸序列的方法,其包括将本文所描述的实施例中的任一者的组合物引入到细胞中。

在一些实施例中,所述细胞为真核细胞,优选哺乳动物细胞或植物细胞。

根据本发明的一些方面,所公开的方法包括本文所描述的组合物中的任一者用于治疗罹患与基因组突变相关的疾病的对象的用途,其包含修饰对象的基因组中靶位点处的核苷酸序列。

根据本发明的一些方面,所公开的方法包括一种治疗患有突变病症的对象的方法,其包括将本文所描述的组合物中的任一者靶向与突变病症相关的等位基因。

在一些实施例中,突变病症与选自以下中的任一者的疾病或病症有关:瘤形成、年龄相关性黄斑变性、精神分裂症、神经性、神经退行性或运动病症、脆性X综合征、分泌酶相关病症、朊病毒相关病症、ALS、成瘾、自闭症、阿尔茨海默病、中性粒细胞减少症、炎症相关病症、帕金森病、血液和凝血疾病和病症、β地中海贫血、镰状细胞性贫血、细胞失调和肿瘤疾病和病症、炎症和免疫相关疾病和病症、代谢、肝脏、肾脏和蛋白疾病和病症、肌肉和骨骼疾病和病症、皮肤疾病和病症、神经和神经元疾病和病症,以及眼部疾病和病症。

OMNI CRISPR核酸酶结构域

CRISPR核酸酶的特征靶向核酸酶活性由其特定结构域的各种功能赋予。在本申请中,OMNI CRISPR核酸酶结构域被定义为结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I和结构域J。

本文描述了每个OMNI CRISPR核酸酶结构域的活性,每个结构域活性提供了核酸酶的有利特征的方面。

具体而言,结构域A、结构域G和结构域I形成OMNI CRISPR核酸酶的结构单元,其含有参与DNA链切割的核酸酶活性位点。由结构域A、结构域G和结构域I形成的结构单元切割DNA链,DNA链被结合在双链DNA靶位点处的引导RNA分子置换。

结构域B参与在OMNI CRISPR核酸酶与靶DNA位点结合时启动DNA切割活性。

结构域C、结构域D、结构域E和结构域F结合引导RNA分子并参与提供靶位点识别的特异性。

结构域H含有参与DNA链切割的核酸酶活性位点。结构域H切割引导RNA分子在DNA靶位点所结合的DNA链。

结构域J参与向OMNI CRISPR核酸酶提供PAM位点特异性,其包括PAM位点询问和识别方面。结构域J也表现出拓扑异构酶活性。

其它CRISPR核酸酶结构域及其一般功能的进一步描述可见于,尤其是Mir等人,《ACS化学生物学(ACS Chem.Biol.)》(2019),Palermo等人,《生物物理学季度回顾(Quarterly Reviews of Biophysics)》(2018),Jiang和Doudna,《生物物理学年度回顾(Annual Review of Biophysics)》(2017),Nishimasu等人,《细胞(Cell)》(2014)和Nishimasu等人,《细胞》(2015),以上文献通过引用的方式并入本文。

在本发明的一个方面,与OMNI CRISPR核酸酶结构域具有相似性的氨基酸序列可用于设计并制造非天然存在的肽,例如,CRISPR核酸酶,使得肽显示出OMNI CRISPR核酸酶结构域活性的优势特征。

在一个实施例中,这种肽(例如,CRISPR核酸酶)包含氨基酸序列,其与所述OMNICRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中至少一者的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性。在一些实施例中,所述肽包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或至少十一个氨基酸序列,所述氨基酸序列选自与所述OMNI CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I和结构域J的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性的氨基酸序列。每种可能性代表单独的实施例。在一个实施例中,除了与所述OMNI CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性的氨基酸序列以外,所述肽相对于全长OMNI CRISPR核酸酶氨基酸序列表现出广泛的氨基酸变异性。在一个实施例中,所述肽包含两个结构域序列之间的间插氨基酸序列。在一个实施例中,所述间插氨基酸序列的长度为1至10、10至20、20至40、40至50、50至60、80至100、100至150、150至200、200至250、至多100、至多200或至多300个氨基酸。每种可能性代表单独的实施例。在一个实施例中,所述间插序列为接头序列。在一个实施例中,所述CRISPR核酸酶包含来自OMNI CRISPR核酸酶的多个结构域,并且所述结构域优选按字母顺序从所述CRISPR核酸酶的N末端到C末端进行组织。例如,一种包含OMNI的结构域A、结构域E和结构域I的CRISPR核酸酶,这些结构域在CRISPR核酸酶序列中的顺序将是结构域A、结构域E,最后是结构域I,每个结构域的任一端或两端都有间插序列的可能性。

在本发明的一个方面中,编码本文描述的OMNI CRISPR核酸酶的结构域中的任何一个结构域的氨基酸序列可以包含相对于原始OMNI CRISPR核酸酶结构域序列的一或多个氨基酸取代。氨基酸取代可以是保守取代,即取代与原始氨基酸具有相似化学性质的氨基酸。例如,带正电的氨基酸可以取代另外的带正电的氨基酸,例如精氨酸残基可以取代赖氨酸残基,或者极性氨基酸可以取代不同的极性氨基酸。保守取代更容易被接受,并且编码OMNI CRISPR核酸酶的结构域中的任何一个结构域的氨基酸序列可能含有多达10%的此类取代。氨基酸取代可以是自由基取代,即取代与原始氨基酸化学性质不同的氨基酸。例如,带正电的氨基酸可以取代带负电的氨基酸,例如精氨酸残基可以取代谷氨酸残基,或者极性氨基酸可以取代非极性氨基酸。氨基酸取代可以是半保守取代,或氨基酸取代可以是取代为任何其它氨基酸。取代可能会改变相对于原始OMNI CRISPR核酸酶结构域功能的活性,例如降低催化核酸酶活性。

根据本发明的一些方面,所公开的组合物包括非天然存在的组合物,其包含CRISPR核酸酶,其中CRISPR核酸酶包含对应于OMNI CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E或结构域F、结构域G、结构域H、结构域I或结构域J中至少一者的氨基酸序列的氨基酸序列。补充表1中提供了其各自OMNI CRISPR核酸酶氨基酸序列内的每个结构域的氨基酸范围。在本发明的一些实施例中,所述CRISPR核酸酶包含至少一个、至少两个、至少三个、至少四个或至少五个氨基酸序列,其中每个氨基酸序列对应于所述OMNICRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J的氨基酸序列中的任何一个氨基酸序列。因此,CRISPR核酸酶可以包含对应于OMNI CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E或结构域F中的任一者的氨基酸序列的任何组合。在一些实施例中,氨基酸序列的长度为至少100至250、250至500、500至1000、1000至1500、1000至1700或1000至2000个氨基酸。

疾病和疗法

本发明的某些实施例将核酸酶靶向与疾病或病症相关的特定基因座,作为基因编辑、治疗方法或疗法的一种形式。例如,为了诱导基因的编辑或敲除,可以使用定制设计的引导RNA分子将本文公开的新型核酸酶特异性靶向基因的致病突变等位基因。引导RNA分子优选通过首先考虑核酸酶的PAM要求来设计,如本文所示,这也取决于进行基因编辑的系统。例如,设计以将OMNI-90核酸酶靶向靶位点的引导RNA分子被设计为含有与邻近OMNI-90PAM序列(例如“NNVTDNNN”或“NNATWBNN”)的DNA双链区互补的间隔区。引导RNA分子进一步优选地被设计为含有足够长且优选为最佳长度的间隔区(即与靶等位基因具有互补性的引导RNA分子区域)以增强核酸酶的比活性并减少脱靶效应。

作为一个非限制性实例,可以设计引导RNA分子以将核酸酶靶向突变等位基因的特定区域,例如,靠近起始密码子,这样在核酸酶引起DNA损伤时,诱导非同源末端连接(NHEJ)途径,并通过引入移码突变使得突变等位基因沉默。这种引导RNA分子设计的方法特别适用于改变显性负性突变的效应并且从而治疗对象。作为单独的非限制性实例,引导RNA分子可以被设计成靶向突变等位基因的特定致病突变,使得在由核酸酶引起的DNA损伤后,诱导同源定向修复(HDR)路径并且引起突变等位基因的模板介导的校正。这种引导RNA分子设计的方法特别适用于改变突变等位基因的单倍剂量不足效应并且从而治疗对象。

可以靶向改变以治疗疾病或病症的特定基因的非限制性实例呈现于下文中。文献中描述了诱导突变病症的特定疾病相关基因和突变。此类突变可用于设计靶向DNA的RNA分子,以将CRISPR组合物靶向疾病相关基因的等位基因,其中CRISPR组合物会导致DNA损伤并诱导DNA修复途径来改变等位基因,从而治疗突变病症。

ELANE基因中的突变与中性粒细胞减少症相关。因此,不限于此,靶向ELANE的本发明实施例可用于治疗罹患中性粒细胞减少症对象的方法。

CXCR4是人类免疫缺陷病毒1型(HIV-1)感染的共受体。因此,不限于此,靶向CXCR4的本发明实施例可用于治疗罹患HIV-1的对象或赋予对象对HIV-1感染的抗性的方法。

程序性细胞死亡蛋白1(PD-1)破坏增强CAR-T细胞介导的肿瘤细胞杀伤,并且PD-1可以是其它癌症疗法中的靶标。因此,不限于此,靶向PD-1的本发明实施例可用于治疗罹患癌症的对象的方法。在一个实施例中,治疗为CAR-T细胞疗法,其中T细胞已根据本发明修饰为PD-1缺陷。

另外,BCL11A是一种在抑制血红蛋白生成中起作用的基因。可以通过抑制BCL11A来增加珠蛋白产生以治疗如地中海贫血或镰状细胞贫血等疾病。参见例如,PCT国际公开第WO2017/077394A2号;美国公开第US2011/0182867A1号;Humbert等人《科学转化医学(Sci.Transl.Med.)》(2019);和Canver等人《自然(Nature)》(2015)。因此,不限于此,靶向BCL11A增强子的本发明实施例可用于治疗罹患β地中海贫血或镰状细胞性贫血对象的方法。

本发明的实施例还可用于靶向任何疾病相关基因,用于研究、改变或治疗下文表A或表B中列出的任何疾病或病症。实际上,可以通过使用本文公开的核酸酶靶向适当的疾病相关基因来研究、改变或治疗与基因座相关的任何疾病,例如,美国公开第2018/0282762A1号和欧洲专利第EP3079726B1号中列出的核酸酶。

表A-疾病、病症及其相关基因

表B-疾病、病症及其相关基因

/>

/>

/>

除非另外定义,否则本文使用的所有技术术语和/或科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管与本文所述的方法和材料类似或同等的材料和方法可以用于本发明的实施例的实践或测试,但下文描述示例性的方法和/或材料。倘若有冲突,本专利说明书(包括定义)将为主。另外,材料、方法和实例仅为说明性的且并不意图为必定限制性的。

在论述中,除非另有说明,否则如“基本上”和“约”等修饰本发明的一个实施例的特征的条件或关系特征的形容词应理解为意指条件或特征被定义在其打算用于的应用的实施例操作可接受的容限内。除非另有说明,否则说明书和权利要求书中的“或”一词被认为是包含性的“或”而非排他性的“或”,并且表示其连接的项目中的至少一个和任意组合。

应理解,如上文和本文其它地方所用,术语“一个(a/an)”是指“一或多个”所列举的组分。所属领域的技术人员将清楚,除非另外具体陈述,否则单数的使用包括复数。因此,术语“一个”和“至少一个”在本申请中可互换使用。

为了更好地理解本教导而不以任何方式限制本教导的范围,除非另有说明,否则在说明书和权利要求书中使用的表示数量、百分比或比例的所有数字和其它数值应理解为在所有情况下均由术语“约”修饰。因此,除非有相反的指示,否则以下说明书和所附权利要求中列出的数字参数是近似值,近似值可以根据试图获得的期望特性而变化。至少,每个数值参数至少应根据报告的有效数字的数量并通过应用普通的舍入技术来解释。

应理解,在本文中引用数值范围的情况下,除非另有说明,否则本发明涵盖上限和下限之间的每个整数,并且包括上限和下限。

在本申请案的说明书和权利要求书中,动词“包含”、“包括”和“具有”以及其同根词中的每一者用以指示动词的一或多个客体不一定是动词的一或多个主体的组分、要素或部分的完整列表。如本文中使用的其它术语意在由其在所属领域中众所周知的含义来定义。

术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。这些术语是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由连锁分析定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。多核苷酸可包含一或多种修饰的核苷酸,如甲基化核苷酸和核苷酸类似物。如果存在对核苷酸结构的修饰,那么在组装聚合物之前或之后进行。核苷酸序列可以间杂有非核苷酸组分。可以在聚合后如通过与标记组分共轭而进一步修饰多核苷酸。

术语“核苷酸类似物”或“修饰的核苷酸”是指在核苷的含氮碱基(例如胞嘧啶(C)、胸腺嘧啶(T)或尿嘧啶(U)、腺嘌呤(A)或鸟嘌呤(G))中或其上、核苷的糖部分(例如核糖、脱氧核糖、修饰的核糖、修饰的脱氧核糖、六元糖类似物或开链糖类似物)或磷酸酯中或其上含有一或多个化学修饰(例如取代)的核苷酸。本文所描述的每一RNA序列可包含一或多个核苷酸类似物。

如本文所用,以下核苷酸识别符用于表示所参考的核苷酸碱基:

如本文所用,术语“靶向序列”或“靶向分子”是指包含能够与特定靶序列杂交的核苷酸序列的核苷酸序列或分子,例如靶向序列具有与沿靶向序列的长度被靶向的序列至少部分互补的核苷酸序列。靶向序列或靶向分子可以是可以与CRISPR核酸酶形成复合物的靶向RNA分子的一部分,其中靶向序列用作CRISPR复合物的靶向部分。当具有靶向序列的分子与CRISPR分子同时存在时,RNA分子能够将CRISPR核酸酶靶向特定靶序列。每种可能性代表单独的实施例。靶向RNA分子可以定制设计以靶向任何所需序列。

如本文所用,术语“靶向”是指靶向序列或靶向分子与具有被靶向的核苷酸序列的核酸的优先杂交。应理解,术语“靶向”涵盖可变杂交效率,使得存在对具有被靶向的核苷酸序列的核酸的优先靶向,但也可能发生除中靶杂交之外的无意脱靶杂交。应理解,在RNA分子靶向序列的情况下,RNA分子与CRISPR核酸酶分子的复合物靶向序列以供核酸酶活性。

在靶向存在于多个细胞中的DNA序列的情形下,应理解,靶向涵盖RNA分子的引导序列部分与一或多个细胞中的序列的杂交,并且涵盖RNA分子与多个细胞中少于所有细胞中的靶序列杂交。因此,应理解,在RNA分子靶向多个细胞中的序列的情况下,RNA分子与CRISPR核酸酶的复合物应理解为与一或多个细胞中的靶序列的杂交,并且还可以与少于所有细胞中的靶序列杂交。因此,应理解,RNA分子与CRISPR核酸酶的复合物引入与一或多个细胞中的靶序列的杂交相关的双链断裂,并且还可以引入与少于所有细胞中的靶序列的杂交相关的双链断裂。如本文所用,术语“修饰的细胞”是指双链断裂由于与靶序列杂交(即中靶杂交)而受到RNA分子和CRISPR核酸酶的复合物影响的细胞。

如本文所用,术语“野生型”是技术人员所理解的本领域的术语,并且意指生物体、菌株、基因或特征的典型形式,因为其天然存在,与突变或变体形式不同。因此,如本文所用,当氨基酸或核苷酸序列是指野生型序列时,变体是指该序列的变体,例如包含取代、缺失、插入。在本发明的实施例中,经工程改造的CRISPR核酸酶是与表1中所指示的任一CRISPR核酸酶的CRISPR核酸酶相比包含至少一种氨基酸修饰(例如取代、缺失和/或插入)的变体CRISPR核酸酶。

术语“非天然存在”或“经工程改造的”可互换使用并且指示人工操纵。当提及核酸分子或多肽时,术语可意指核酸分子或多肽至少基本上不含至少一种与其在自然界中天然相关并且在自然界中发现的其它组分。

如本文所用,术语“氨基酸”包括天然和/或非天然或合成氨基酸,其包括甘氨酸和D或I旋光异构体两者,以及氨基酸类似物和肽模拟物。

如本文所用,“基因组DNA”是指线性和/或染色体DNA和/或存在于一或多种所关注的细胞中的质粒或其它染色体外DNA序列。在一些实施例中,所关注的细胞为真核细胞。在一些实施例中,所关注的细胞为原核细胞。在一些实施例中,方法在基因组DNA序列中的预定靶位点处产生双链断裂(DSB),引起基因组中靶位点处DNA序列的突变、插入和/或缺失。

“真核”细胞包括但不限于真菌细胞(如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞。

如本文所用,术语“核酸酶”是指能够使核酸的核苷酸亚基之间的磷酸二酯键切割的酶。核酸酶可以从天然来源分离或衍生。天然来源可以是任何活生物体。替代地,核酸酶可以是保留磷酸二酯键切割活性的修饰的蛋白或合成的蛋白。

如本文所用,术语“PAM”是指位于被靶向DNA序列附近并被CRISPR核酸酶识别的靶DNA的核苷酸序列。PAM序列可能因核酸酶身份而异。

如本文所用,术语“突变病症”或“突变疾病”是指与由突变引起的基因功能失调相关的任何病症或疾病。表现为突变病症的功能失调基因在其至少一个等位基因中含有突变,并被称为“疾病相关基因”。突变可以在疾病相关基因的任何部分中,例如在调控、编码或非编码部分中。突变可以是任何类别的突变,如取代、插入或缺失。根据任何类型突变的机制,诸如隐性突变、显性失活突变、功能获得突变、功能丧失突变或导致基因产物单倍剂量不足的突变,疾病相关基因的突变可能表现为病症或疾病。

技术人员将理解,本发明实施例公开了RNA分子,这些分子能够与核酸酶(例如,CRISPR核酸酶)复合,例如与靠近原型间隔区邻近基序(PAM)的所关注的靶基因组DNA序列缔合。随后核酸酶介导靶DNA的切割以在前间隔区内产生双链断裂。

在本发明的实施例中,CRISPR核酸酶和靶向分子形成CRISPR复合物,其结合到靶DNA序列以实现靶DNA序列的切割。CRISPR核酸酶可形成包含CRISPR核酸酶和RNA分子而无另一单独tracrRNA分子的CRISPR复合物。替代地,CRISPR核酸酶可在CRISPR核酸酶、RNA分子和tracrRNA分子之间形成CRISPR复合物。

术语“蛋白结合序列”或“核酸酶结合序列”是指能够与CRISPR核酸酶以形成CRISPR复合物的序列。所属领域的技术人员将理解,能够与CRISPR核酸酶结合以形成CRISPR复合物的tracrRNA包含蛋白或核酸酶结合序列。

CRISPR核酸酶的“RNA结合部分”是指可以与RNA分子结合以形成CRISPR复合物的CRISPR核酸蛋白酶的一部分,例如tracrRNA分子的核酸酶结合序列。CRISPR核酸酶的“活性部分(activity portion或active portion)”是指例如当与靶向DNA的RNA分子复合时在DNA分子中实现双链断裂的CRISPR核酸酶的一部分。

RNA分子可以包括与tracrRNA分子充分互补的序列,以便通过碱基配对与tracrRNA杂交并促进CRISPR复合物的形成。(参见美国专利第8,906,616号)。在本发明的实施例中,RNA分子可进一步包含具有tracr配对序列的部分。

在本发明的实施例中,靶向分子可进一步包含tracrRNA分子的序列。此类实施例可被设计为RNA分子(gRNA或crRNA)的引导部分与反式激活crRNA(tracrRNA)的合成融合体,在一起形成单引导RNA(sgRNA)。(参见Jinek等人《科学(Science)》(2012))。本发明的实施例还可利用单独的tracrRNA分子和包含引导序列部分的单独RNA分子形成CRISPR复合物。在此类实施例中,tracrRNA分子可以通过碱基配对与RNA分子杂交并且在本文所描述的本发明的某些应用中可能是有利的。

在本发明的实施例中,RNA分子可以包括“连接”区和/或“发夹”区,其可进一步限定RNA分子的结构。(参见Briner等人,《分子细胞(Molecular Cell)》(2014))。

如本文所用,术语“同向重复序列”是指核苷酸序列的特点氨基酸序列的两个或更多个重复序列。

如本文所用,能够与CRISPR核酸酶“相互作用”或“结合”的RNA序列或分子是指RNA序列或分子与CRISPR核酸酶形成CRISPR复合物的能力。

如本文所用,术语“以可操作方式连接”是指两个序列或分子之间使它们以其预期方式起作用的关系(即融合、杂交)。在本发明的实施例中,当RNA分子以可操作方式连接到启动子时,允许RNA分子和启动子两者以其预期方式起作用。

如本文所用,术语“异源启动子”是指不与被启动的分子或路径一起天然存在的启动子。

如本文所用,如果分子的序列之间的碱基或氨基酸的X%相同且处于相同的相对位置,则序列或分子与另一序列或分子具有X%的“序列同一性”。例如,与第二核苷酸序列具有至少95%序列同一性的第一核苷酸序列将在相同的相对位置与其它序列具有至少95%的相同碱基。

核定位序列

术语“核定位序列”和“NLS”可互换使用以指示指导与其缔合的蛋白从细胞的细胞质跨越核被膜屏障转运的氨基酸序列/肽。术语“NLS”意图不仅涵盖特定肽的核定位序列,而且涵盖其能够指导细胞质多肽跨越核被膜屏障转位的衍生物。当连接到多肽的N末端、C末端或N末端和C末端两者时,NLS能够指导多肽的核转位。另外,具有通过N末端或C末端偶联到沿多肽的氨基酸序列随机定位的氨基酸侧链的NLS的多肽将转位。典型地,NLS由暴露在蛋白表面上的带正电的赖氨酸或精氨酸的一或多个短序列组成,但已知其它类型的NLS。NLS的非限制性实例包含衍生自以下的NLS序列:SV40病毒大T抗原、核质蛋白、c-myc、hRNPAl M9 NLS、来自输入蛋白-α的IBB结构域、肌瘤T蛋白、人类p53、小鼠c-abl IV、流感病毒NS1、肝炎病毒δ抗原、小鼠Mx1蛋白、人类聚(ADP-核糖)聚合酶和类固醇激素受体(人类)糖皮质激素。

递送

本文描述的CRISPR核酸酶或CRISPR组合物可以递送为蛋白、DNA分子、RNA分子、核糖核蛋白(RNP)、核酸载体或其任何组合。在一些实施例中,RNA分子包含化学修饰。合适的化学修饰的非限制性实例包含2'-0-甲基(M)、2'-0-甲基、3'硫代磷酸酯(MS)或2'-0-甲基、3'硫代PACE(MSP)、假尿苷和1-甲基假尿苷。每种可能性代表本发明的单独实施例。

本文所描述的CRISPR核酸酶和/或编码其的多核苷酸以及任选的额外蛋白(例如ZFP、TALEN、转录因子、限制酶)和/或如引导RNA的核苷酸分子可以通过任何合适手段递送到靶细胞。靶细胞可以是任何类型的细胞,例如真核细胞或原核细胞,在任何环境中,例如分离或未分离,维持在培养物中、体外、离体、体内或在植物中。

在一些实施例中,待递送的组合物包括核酸酶的mRNA和引导序列的RNA。在一些实施例中,待递送的组合物包括核酸酶的mRNA、引导序列的RNA和供体模板。在一些实施例中,待递送的组合物包括CRISPR核酸酶和引导RNA。在一些实施例中,待递送的组合物包括CRISPR核酸酶、引导RNA和用于通过例如同源定向修复进行基因编辑的供体模板。在一些实施例中,待递送的组合物包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA。在一些实施例中,待递送的组合物包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA以及供体模板。在一些实施例中,待递送的组合物包括CRISPR核酸酶、靶向DNA的RNA和tracrRNA。在一些实施例中,待递送的组合物包括CRISPR核酸酶、靶向DNA的RNA和tracrRNA以及用于通过例如同源性定向修复进行基因编辑的供体模板。

任何合适的病毒载体系统可用于递送RNA组合物。可使用常规的基于病毒和非病毒的基因转移方法将核酸和/或CRISPR核酸酶引入细胞(例如,哺乳动物细胞、植物细胞等)和靶组织。此类方法还可用于在体外向细胞投与编码核酸和/或CRISPR核酸酶蛋白。在某些实施例中,投与核酸和/或CRISPR核酸酶用于体内或离体基因疗法用途。非病毒载体递送系统包括裸核酸和与如脂质体或泊洛沙姆(poloxamer)等递送媒剂复合的核酸。有关基因疗法程序的综述,参见Anderson,《科学》(1992);Nabel和Felgner《TIBTECH》(1993);Mitani和Caskey,《TIBTECH》(1993);Dillon,《TIBTECH》(1993);Miller,《自然》(1992);Van Brunt,《生物技术(Biotechnology)》(1988);Vigne等人,《修复性神经病学和神经科学(Restorative Neurology and Neuroscience)》8:35-36(1995);Kremer和Perricaudet,《英国医学公报(British Medical Bulletin)》(1995);Haddada等人,《微生物学和免疫学的当前主题(Current Topics in Microbiology and Immunology)》(1995);和Yu等人,《基因疗法(Gene Therapy)》1:13-26(1994)。

核酸和/或蛋白的非病毒递送方法包括电穿孔、脂质转染、显微注射、生物射弹、粒子枪加速、病毒体、脂质体、免疫脂质体、脂质纳米粒(LNP)、聚阳离子或脂质:核酸共轭物、人工病毒粒子和试剂增强的核酸摄取,或者核酸和/或蛋白可被细菌或病毒(例如,农杆菌(Agrobacterium)、根瘤菌属NGR234(Rhizobium sp.NGR234)、苜蓿中华根瘤菌(Sinorhizoboiummeliloti)、百脉根中生根瘤菌(Mesorhizobium loti)、烟草花叶病毒、马铃薯病毒X、花椰菜花叶病毒和木薯叶脉花叶病毒)递送至植物细胞。参见例如,Chung等人《植物科学趋势(Trends Plant Sci.)》(2006)。使用例如Sonitron 2000系统(Rich-Mar)的声致穿孔也可以用于递送核酸。阳离子脂质介导递送蛋白和/或核酸也被考虑作为体内、离体或体外递送方法。参见Zuris等人,《自然生物技术(Nat.Biotechnol.)》(2015),Coelho等人,《新英格兰医学杂志(N.Engl.J.Med.)》(2013);Judge等人,《分子疗法(Mol.Ther.)》(2006);和Basha等人,《分子疗法》(2011)。

非病毒载体,诸如基于转座子的系统,例如重组睡美人转座子系统或重组PiggyBac转座子系统,也可以递送到靶细胞,并用于靶细胞中组合物分子的多核苷酸序列或编码组合物分子的多核苷酸序列的转座。

额外示例性核酸递送系统包括由

脂质:核酸复合物(包含被靶向脂质体(诸如免疫脂质复合物))的制备是本领域技术人员众所周知的(参见例如,Crystal,《科学》(1995);Blaese等人,《癌症基因疗法(Cancer Gene Ther.)》(1995);Behr等人,《生物共轭化学(Bioconjugate Chem.)》(1994);Remy等人,《生物共轭化学》(1994);Gao和Huang,《基因疗法》(1995);Ahmad和Allen,《癌症研究(Cancer Res.)》(1992);美国专利第4,186,183号;第4,217,344号;第4,235,871号;第4,261,975号;第4,485,054号;第4,501,728号;第4,774,085号;第4,837,028号和第4,946,787号)。

其它递送方法包括将待递送的核酸包装到EnGeneIC递送媒剂(EDV)中的使用。这些EDV使用双特异性抗体特异性递送到靶组织,其中抗体的一个臂对靶组织具有特异性并且另一个臂对EDV具有特异性。抗体将EDV带到靶细胞表面,并且随后通过内吞作用将EDV带入细胞。一旦在细胞中,内容物就释放(参见MacDiamid等人,《自然生物技术》(2009))。

递送媒剂包括但不限于细菌,优选非致病性细菌、媒剂、纳米颗粒、外泌体、微泡、例如,通过将组合物附着到通过“基因枪”发射到细胞中的金颗粒上的基因枪递送、病毒媒剂,其包括但不限于慢病毒、AAV和逆转录病毒、病毒样颗粒(VLP)、大病毒样颗粒(LVLP)、慢病毒样颗粒、转座子、病毒载体、裸载体、DNA或RNA,以及本领域已知的其它递送载体。

CRISPR核酸酶和/或编码CRIPSR核酸酶的多核苷酸,以及任选的额外核苷酸分子和/或额外蛋白或肽的递送,可以通过利用单个递送媒剂或方法或不同递送媒剂或方法的组合来进行。例如,CRISPR核酸酶可以利用LNP递送到细胞,而crRNA分子和tracrRNA分子可以利用AAV递送到细胞。替代地,CRISPR核酸酶可以利用AAV颗粒递送到细胞,而crRNA分子和tracrRNA分子可以利用单独的AAV颗粒递送到细胞,由于尺寸限制,这可能是有利的。

使用基于RNA或DNA病毒的系统来递送核酸利用将病毒靶向体内特定细胞并且将病毒有效负载运输到细胞核的高度进化的过程。病毒载体可以直接向患者投与(体内)或其可用于体外处理细胞并且向患者投与修饰的细胞(离体)。用于递送核酸的常规基于病毒的系统包括但不限于用于基因转移的重组逆转录病毒、慢病毒、腺病毒、腺相关病毒、牛痘和单纯疱疹病毒载体。然而,RNA病毒对于本文所描述的RNA组合物的递送是优选的。另外地,已在许多不同的细胞类型和靶组织中观察到高转导效率。本发明的核酸可以通过非整合慢病毒传递。任选地,利用慢病毒递送RNA。任选地,慢病毒包括核酸酶的mRNA、引导序列的RNA。任选地,慢病毒包括核酸酶的mRNA、引导序列的RNA和供体模板。任选地,慢病毒包括核酸酶蛋白、引导RNA。任选地,慢病毒包含核酸酶蛋白、引导RNA和/或用于通过例如同源定向修复进行基因编辑的供体模板。任选地,慢病毒包含核酸酶的mRNA、靶向DNA的RNA和tracrRNA。任选地,慢病毒包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA以及供体模板。任选地,慢病毒包含核酸酶蛋白、靶向DNA的RNA和tracrRNA。任选地,慢病毒包含核酸酶白、靶向DNA的RNA和tracrRNA,以及用于通过例如同源定向修复进行基因编辑的供体模板。

如上所述,本文描述的组合物可以使用非整合慢病毒颗粒方法(例如,

逆转录病毒的嗜性可以通过掺入外源包膜蛋白来改变,从而扩大靶细胞的潜在靶标群体。慢病毒载体是能够转导或感染非分裂细胞的逆转录病毒载体,并通常产生高病毒滴度。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体包含具有至多6-10kb外源序列包装能力的顺式作用长末端重复序列。最小顺式作用LTR对于载体的复制和包装是足够的,其随后用于将治疗基因整合到靶细胞中以提供永久转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的载体(参见例如,BuchscherPanganiban,《病毒学杂志(J.Virol.)》(1992);Johann等人,《病毒学杂志》(1992);Sommerfelt等人,《病毒学(Virol.)》(1990);Wilson等人,《病毒学杂志》(1989);Miller等人,《病毒学杂志》(1991);PCT国际公开第WO/1994/026877A1号)。

目前,至少六种病毒载体方法可用于临床试验中的基因转移,其利用涉及通过插入到辅助细胞系中的基因来补充缺陷载体以产生转导剂的方法。

pLASN和MFG-S是已用于临床试验的逆转录病毒载体的实例(Dunbar等人,《血液(Blood)》(1995);Kohn等人,《自然医学》(1995);Malech等人,《PNAS》(1997))。PA317/pLASN是第一种用于基因疗法试验的治疗载体。(布莱泽等人,《科学》(1995))。已观察到MFG-S包装载体的转导效率为50%或更高。(Ellem等人,《免疫学与免疫疗法(ImmunolImmunother)》(1997);Dranoff等人,《人类基因疗法(Hum.Gene Ther.)》(1997)。

包装细胞用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒、AAV的293细胞,以及包装逆转录病毒的psi.2细胞或PA317细胞。用于基因疗法的病毒载体通常由将核酸载体包装到病毒颗粒中的生产细胞系产生。载体典型地含有包装和随后整合到宿主(如果适用)中所需的最小病毒序列,其它病毒序列被编码待表达的蛋白的表达盒替换。缺失病毒功能由包装细胞系反式供应。例如,用于基因疗法的AAV载体典型地仅具有来自AAV基因组的反向末端重复(ITR)序列,序列是包装和整合到宿主基因组中所需的。病毒DNA包装于细胞系中,细胞系含有辅助质粒,其编码其它AAV基因,即rep和cap,但缺乏ITR序列。细胞系还感染作为辅助物的腺病毒。辅助病毒促进AAV载体复制和从辅助质粒表达AAV基因。由于缺乏ITR序列,辅助质粒不大量包装。可以通过例如热处理来减少腺病毒污染,腺病毒比AAV对热处理更敏感。此外,AAV可以使用杆状病毒系统以临床规模进行生产(参见美国专利第7,479,554号)。

在许多基因疗法应用中,需要对特定组织类型以高度特异性递送基因疗法载体。因此,病毒载体可以通过以与病毒的外表面上的病毒外壳蛋白的融合蛋白形式表达配体来修饰以对给定细胞类型具有特异性。配体选择为对已知存在于所关注的细胞类型上的受体具有亲和力。例如,Han等人,《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》(1995)报道了莫洛尼鼠白血病病毒可以被修饰以表达与gp70融合的人神经调节蛋白,并且重组病毒感染某些表达人表皮生长因子受体的人乳腺癌细胞。此原理可以延伸到其它病毒-靶细胞对,其中靶细胞表达受体并且病毒表达包含细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可以经工程改造以显示对几乎任何所选择的细胞受体具有特异性结合亲和力的抗体片段(例如FAB或Fv)。尽管以上描述主要适用于病毒载体,但相同原理可适用于非病毒载体。此类载体可以经工程改造以含有有利于特定靶细胞摄取的特定摄取序列。

基因疗法载体可以通过向个体患者投与体内递送,通常通过全身投药(例如静脉内、腹膜内、肌肉内、皮下或颅内输注)或局部施用,如下文所描述。替代地,可以将载体离体递送到细胞,如从个体患者取出的细胞(例如淋巴细胞、骨髓穿刺液、组织活检)或全适供体造血干细胞,接着通常在选择已并入载体的细胞后将细胞再植入患者体内。在一些实施例中,可以利用mRNA的体内和体外递送以及RNP递送。

用于诊断、研究或基因疗法的离体细胞转染(例如,通过将经转染的细胞再输注到宿主生物体中)是所属领域的技术人员众所周知的。在一个优选实施例中,细胞从对象生物体分离,用RNA组合物转染,并且再输注回到对象生物体(例如患者)中。适用于离体转染的各种细胞类型是本领域技术人员众所周知的(参见例如,Freshney,“动物细胞培养,基本技术和专业应用手册(Culture of Animal Cells,A Manual of Basic Technique andSpecialized Applications)”(第6版,2010))和以及其中引用的讨论如何从患者中分离并培养细胞的参考文献)。

合适的细胞包括但不限于真核和原核细胞和/或细胞系。此类细胞或由此类细胞产生的细胞系的非限制性实例包括COS、CHO(例如CHO--S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NSO、SP2/0-Ag14、海拉、HEK293(例如HEK293-F、HEK293-H、HEK293-T)和perC6细胞、任何植物细胞(分化或未分化)以及昆虫细胞,如草地贪夜蛾(Spodopterafugiperda)(Sf),或真菌细胞,如酵母菌属(Saccharomyces)、毕赤酵母属(Pichia)和裂殖酵母属(Schizosaccharomyces)。在某些实施例中,细胞系为CHO-K1、MDCK或HEK293细胞系。另外,原代细胞可以被分离并离体使用,以便在用核酸酶(例如,ZFN或TALEN)或核酸酶系统(例如,CRISPR)处理后重新引入待治疗的对象。合适的原代细胞包含外周血单核细胞(PBMC)和其它血细胞亚群,诸如但不限于CD4+T细胞或CD8+T细胞。合适的细胞还包含干细胞,诸如,例如,胚胎干细胞、诱导多能干细胞、造血干细胞(CD34+)、神经元干细胞和间充质干细胞。

在一个实施例中,干细胞用于细胞转染和基因疗法的离体程序中。使用干细胞的优势在于它们可以体外分化为其它细胞类型,或者可以引入它们将移植到骨髓中的哺乳动物(诸如细胞的供体)中。使用细胞因子(诸如GM-CSF、IFN-γ和TNF-α)将CD34+细胞体外分化为临床上重要的免疫细胞类型的方法是已知的(作为非限制性实例,参见Inaba等人,《实验医学杂志(J.Exp.Med.)》(1992))。

使用已知方法分离干细胞以用于转导和分化。例如,通过用结合不需要的细胞(诸如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化的抗原呈递细胞))的抗体对骨髓细胞进行淘选,从骨髓细胞中分离出干细胞(作为非限制性实例,参见Inaba等人,《实验医学杂志》(1992))。在一些实施例中,还可使用已经修饰的干细胞。

值得注意的是,本文描述的CRISPR核酸酶中的任何一种CRISPR核酸酶可适用于有丝分裂后细胞或任何不活跃分裂的细胞(例如,停滞的细胞)中的基因组编辑。可使用本发明的CRISPR核酸酶编辑的有丝分裂后细胞的实例包括但不限于肌细胞、心肌细胞、肝细胞、骨细胞和神经元。

含有治疗性RNA组合物的载体(例如,逆转录病毒、脂质体等)也可以直接施用于生物体以在体内转导细胞。替代地,可以投与裸RNA或mRNA。给药是通过通常用于引入分子以与血液或组织细胞最终接触的途径中的任一种进行,其包括但不限于注射、输注、表面施用和电致孔。给予这类核酸的合适的方法是所属领域的技术人员可用且众所周知的,并且尽管可以使用超过一种途径给予具体组合物,但具体途径通常可以提供比另一途径更迅速且更有效的反应。

适合于将转基因引入到免疫细胞(例如T细胞)中的载体包括非整合慢病毒载体。参见例如,美国专利公开第2009/0117617号。

通过所投予的特定组合物以及通过用以投予组合物的特定方法来部分确定药学上可接受的载剂。因此,有多种合适的可用药物组合物制剂,如下所述(参见例如,《雷明顿制药科学(Remington's Pharmaceutical Sciences)》,第17版,1989)。

通过同源重组进行DNA修复

术语“同源定向修复”或“HDR”是指用于修复细胞中DNA损伤的机制,例如在修复DNA中的双链和单链断裂期间。HDR需要核苷酸序列同源性并使用“核酸模板”(本文中可互换使用的核酸模板或供体模板)来修复发生双链或单链断裂的序列(例如,DNA靶序列)。此使得遗传信息从例如核酸模板转移到DNA靶序列。如果核酸模板序列不同于DNA靶序列并且部分或全部核酸模板多核苷酸或寡核苷酸并入DNA靶序列中,那么HDR可引起DNA靶序列的改变(例如插入、缺失、突变)。在一些实施例中,整个核酸模板多核苷酸、核酸模板多核苷酸的一部分或核酸模板的拷贝在DNA靶序列的位点处整合。

术语“核酸模板”和“供体”是指插入或复制到基因组中的核苷酸序列。核酸模板包含例如一或多种核苷酸的核苷酸序列,其将添加到靶核酸中或将模板化靶核酸中的变化或可用于修饰靶序列。核酸模板序列可具有任何长度,例如长度在2与10,000个核苷酸之间(或其间或以上的任何整数值),优选长度在约100与1,000个核苷酸之间(或其间的任何整数),更优选长度在约200与500个核苷酸之间。核酸模板可以是单链核酸、双链核酸。在一些实施例中,核酸模板包含对应于例如靶位置的靶核酸的野生型序列的例如一或多种核苷酸的核苷酸序列。在一些实施例中,核酸模板包含对应于例如靶位置的靶核酸的野生型序列的例如一或多种核糖核苷酸的核糖核苷酸序列。在一些实施例中,核酸模板包含修饰的核糖核苷酸。

还可以插入外源序列(也称为“供体序列”、“供体模板”或“供体”),例如,用于校正突变基因或增加野生型基因的表达。将显而易见的是,供体序列通常与其所在的基因组序列不同。供体序列可以含有两侧为两个同源区域的非同源序列,从而使得在所关注的位置进行有效的HDR。另外地,供体序列可包含载体分子,载体分子含有与细胞染色质中的所关注的区域不同源的序列。供体分子可含有几个与细胞染色质同源的不连续区域。例如,对于通常不存在于所关注的区域中的序列的靶向插入,所述序列可存在于供体核酸分子中,并且两侧是与所关注的区域中的序列同源的区域。

供体多核苷酸可以是单链/或双链的DNA或RNA,并且可以线性或环状形式引入细胞。参见例如,美国专利公开第2010/0047805号;第2011/0281361号;第2011/0207221号;和第2019/0330620号。如果以线性形式引入,则可通过本领域中的技术人员已知的方法保护供体序列的末端(例如免受核酸外切酶降解)。例如,将一或多个双脱氧核苷酸残基添加至线性分子的3'末端,和/或将自互补寡核苷酸扎结至一端或两端。例如,参见Chang和Wilson,《美国国家科学院院刊》(1987);Nehls等人,《科学》(1996)。保护外源多核苷酸不被降解的额外方法包括但不限于添加末端氨基基团和使用经修饰核苷酸间连接,诸如例如,硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。

因此,使用供体模板进行修复的本发明实施例可以使用可线性或环状形式引入细胞的DNA或RNA单链和/或双链供体模板。在本发明的实施例中,基因编辑组合物包含:(1)RNA分子,其包含引导序列以在修复之前实现基因中的双链断裂,和(2)用于修复的供体RNA模板,其包含引导序列的RNA分子是第一RNA分子并且供体RNA模板是第二RNA分子。在一些实施例中,引导RNA分子和模板RNA分子连接作为单分子的一部分。

供体序列也可以是寡核苷酸并且用于内源序列的基因校正或靶向改变。寡核苷酸可以被引入在载体上的细胞中,可以被电穿孔进入细胞,或者可以通过本领域已知的其它方法引入。寡核苷酸可用于‘校正’内源基因中的突变序列(例如,β珠蛋白中的镰状突变),或可用于将具有所需目的的序列插入内源基因座中。

多核苷酸可作为载体分子的一部分引入细胞,载体分子具有额外的序列,诸如例如,复制起点、启动子和编码抗生素抗性的基因。此外,供体多核苷酸可作为裸核酸、与诸如脂质体或泊洛沙姆等药剂复合的核酸引入,或者可由重组病毒(例如,腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷型慢病毒(IDLV))递送。

通常插入供体以使其表达由整合位点处的内源启动子驱动,即驱动供体插入的内源基因表达的启动子。然而,将显而易见的是,供体可包括启动子和/或增强子,例如组成型启动子或诱导型或组织特异性启动子。

可以将供体分子插入内源基因中,使得所有内源基因、内源基因中的一些内源基因表达或都不表达。例如,如本文所述的转基因可以插入内源基因座中,使得内源序列的一些(转基因的N-末端和/或C-末端)表达为例如与转基因的融合物或都不表达。在其它实施例中,转基因(例如,具有或不具有诸如用于内源基因的额外编码序列)被整合到任何内源基因座中,例如,安全港基因座,例如,CCR5基因、CXCR4基因、PPP1R12c(也称为AAVS1)基因、白蛋白基因或Rosa基因。参见例如,美国专利第7,951,925号和第8,110,379号;美国公开第2008/0159996号;第20100/0218264号;第2010/0291048号;第2012/0017290号;第2011/0265198号;第2013/0137104号;第2013/0122591号;第2013/0177983号和第2013/0177960号以及美国临时申请第61/823,689号)。

当内源序列(转基因的内源序列或一部分)与转基因一起表达时,内源序列可以是全长序列(野生型或突变型)或部分序列。优选地,内源序列是功能性的。这些全长或部分序列的功能的非限制性实例包含增加由转基因(例如,治疗基因)表达的多肽的血清半衰期和/或用作载体。

此外,尽管表达并不需要,但外源序列也可包含转录或翻译调节序列,例如,启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽和/或聚腺苷酸化信号的序列。

在某些实施例中,供体分子包括选自由以下组成的群组的序列:编码蛋白的基因(例如,编码细胞或个体中缺乏蛋白的编码序列或编码蛋白的基因的替代形式)、调节序列和/或编码结构核酸(诸如,microRNA或siRNA)的序列。

对于前述实施例来说,本文中所公开的每个实施例预期适用于其它所公开的实施例中的每一个。举例而言,应理解,本发明的任何RNA分子或组合物可用于本发明方法中的任一者。

如本文所用,所有标题仅用于组织,且并不意图以任何方式限制本公开。任何个别章节的内容可同等地适用于所有章节。

所属领域的普通技术人员在参阅以下实例后将变得显而易知本发明的其它目标、优势和新颖特征,实例并不打算是限制性的。另外,如上文所描绘并且如以下权利要求书部分中所要求的本发明的各种实施例和方面中的每一者在以下实例中找到实验支持。

应了解,本发明出于清楚的目的在分开的实施例的情形中描述的某些特征还可以组合形式提供于单个实施例中。相反地,为简便起见,在单个实施例的上下文中描述的本发明的各个特征也可以单独地或以任何合适的子组合或在适当情况下提供在本发明的任何其它描述实施例中。在各种实施例的上下文中描述的某些特征并非被认为是那些实施例的基本特征,除非实施例在不具有那些元件的情况下不起作用。

通常,本文使用的命名法和本发明中使用的实验室程序包括分子技术、生化技术、微生物技术和重组DNA技术。这些技术在文献中有充分解释。参见例如,Sambrook等人,“分子克隆:实验室手册(Molecular Cloning:laboratory Manual)”(1989);Ausubel,R.M.(编辑),“分子生物学实验指南(Current Protocols in Molecular Biology)”第I卷至第III卷(1994);Ausubel等人,“分子生物学实验指南”,约翰·威利父子出版公司(John Wileyand Sons),马里兰巴尔的摩(Baltimore,Maryland)(1989);Perbal,“分子克隆实用指南(APractical Guide to Molecular Cloning)”,约翰·威利父子出版公司,纽约(New York)(1988);Watson等人,“重组DNA(Recombinant DNA)”,《科学美国人书籍(ScientificAmerican Books)》,纽约;Birren等人(编辑),“基因组分析:实验室手册系列(GenomeAnalysis:A Laboratory Manual Series)”,第1卷至第4卷,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),纽约(1998);美国专利第4,666,828号;第4,683,202号;第4,801,531号;第5,192,659号和第5,272,057号中阐述的方法;Cellis,J.E.(编辑),“细胞生物学:实验室手册(Cell Biology:A Laboratory Handbook)”,第I卷至第III卷(1994);Freshney,“动物细胞培养-基本技术手册(Culture of Animal Cells-A Manualof Basic Technique)”第三版,纽约Wiley-Liss出版社(1994);Coligan J.E.(编辑),“免疫学实验指南(Current Protocols in Immunology)”第I卷至第III卷(1994);Stites等人(编辑),“基础和临床免疫学(Basic and Clinical Immunology)”(第8版),阿普尔顿-兰格出版社(Appleton&Lange),康涅狄格诺沃克(Norwalk,CT)(1994);Mishell和Shiigi(编辑),“蛋白纯化和表征策略-实验室课程手册(Strategies for Protein Purificationand Characterization-A Laboratory Course Manual)”,CSHL出版社(1996);Clokie和Kropinski的(编辑),“噬菌体方法和方案(Bacteriophage Methods and Protocols)”,第1卷:分离、表征和相互作用(Isolation,Characterization,and Interactions)(2009),所有内容通过引用并入。贯穿本文件提供了其它的一般参考文献。

下面提供实例,以促进更全面地理解本发明。以下实例说明制造和实践本发明的示例性模式。然而,本发明的范围不限于这些实例中公开的具体实施例,实施例仅用于说明的目的。

实验细节

下面提供实例,以促进更全面地理解本发明。以下实例说明制造和实践本发明的示例性模式。然而,本发明的范围不限于这些实例中公开的具体实施例,实施例仅用于说明的目的。

根据环境样品序列的不同宏基因组数据库预测CRISPR重复序列(crRNA)、反式激活crRNA(tracrRNA)、核酸酶多肽(OMNI)和原型间隔区邻近基序(PAM)序列。

OMNI核酸酶多肽的构建

为了构建新型核酸酶多肽(OMNI),针对人类细胞系表达,对几种已识别的OMNI的开放阅读框进行密码子优化。优化的ORF被克隆到细菌质粒pET9a和哺乳动物表达质粒pmOMNI中(表4)。

sgRNA的预测和构建

对于每个OMNI,通过检测各自细菌基因组中的CRISPR重复阵列序列和tracrRNA来预测单引导RNA(sgRNA)。原生早熟的crRNA和tracrRNA序列与四环‘gaaa’进行生物信息连接,并通过使用RNA二级结构预测工具预测双链体的二级结构元件。

全双链RNA元件(crRNA-tracrRNA嵌合体)的预测二级结构用于识别可能的tracrRNA序列,以设计sgRNA。通过缩短不同位置上茎的双链体来构建几种可能的sgRNA支架版本(所有OMNI的sgRNA设计列于表2中)。另外地,为了克服潜在的转录和结构限制,并评估sgRNA支架在人类细胞环境中的可塑性,在一些情况下,可能的sgRNA的核苷酸序列发生了微小变化(图1,表2)。最后,为每个OMNI合成了多达三个版本的可能设计的支架,并在下游连接到22-核苷酸通用独特间隔区序列(T2,SEQ ID NO:805),并在诱导型T7启动子与用于哺乳动物表达的U6启动子的组合下克隆到细菌表达质粒中(pShuttleGuide,表4)。

T2-GGAAGAGCAGAGCCTTGGTCTC(SEQ ID NO:805)

通过TXTL进行的体外耗竭测定

体外PAM序列的耗竭按照Maxwell等人《方法(Methods)》2018中所描述的执行。简而言之,将表达OMNI核酸酶的线性DNA和T7启动子下的sgRNA与表达T7聚合酶的线性构建体一起添加到体外无细胞转录翻译系统(TXTL混合物,(阿伯生物科学(Arbor Bioscience))中。由TXTL混合物进行的RNA表达和蛋白翻译形成了核糖核蛋白(RNP)复合物。由于使用了线性DNA,因此将Chi6 DNA序列添加到TXTL反应混合物中以抑制RecBCD的核酸外切酶活性,从而保护线性DNA不被降解。sgRNA间隔区设计旨在靶向含有靶向原型间隔区的质粒库(pbPOS T2库,表4),原型间隔区的两侧是8N随机的潜在PAM序列集。在使用PCR将必要的连接物和索引添加到切割库和表达非靶向gRNA的对照库时,通过高通量测序测量库中PAM序列的耗竭。在深度测序之后,体外活性通过相对于在对照库中的出现具有相同的PAM序列的耗竭序列的分数证实,表明OMNI核酸酶对DNA的功能性切割(图3至图45,表3)。

人类细胞对内源基因组靶标的活性

通过对用OMNI核酸酶和一组独特的sgRNA分子共同转染的HeLa细胞的NGS切割分析来评估每个OMNI对人类基因组靶标的编辑活性,每个sgRNA分子被设计成靶向不同的基因组位置。为此,将人优化的OMNI核酸酶克隆到框内P2A-mCherry表达载体中(pmOMNI,表4),并将sgRNA分子序列中的每个序列克隆到穿梭导向载体中(pShuttle Guide,表4)。根据相应的OMNIPAM偏好,sgRNA分子被设计为含有靶向人基因组中特定位置的22-核苷酸引导序列部分(表5),接着是TXTL发现的sgRNA支架序列(表3)。在转染后72小时,收获细胞。使用mCherry荧光作为标记,将一半收获的细胞用于通过FACS对OMNI核酸酶表达进行量化。对剩余细胞进行切割,并且提取其基因组DNA含量并将其用作相应基因组靶标的PCR扩增的模板。对扩增子进行下一代测序(NGS),然后使用所得读段计算每个靶位点中编辑事件的百分比。切割位点周围的短插入或缺失(indel)是核酸酶诱导DNA切割后DNA末端修复的典型结果。编辑%的计算是从Indel读段相对于每个扩增子内总比对读段的分数推导出来的。这些实验的结果汇总在表5中。

通过编辑U2OS细胞中RNP的活性来引导OMNI-93的优化

在哺乳动物细胞环境中测试OMNI-93RNP的间隔区长度优化。合成的OMNI-93sgRNA在3'端和5'端用三个2'-O-甲基3'-硫代磷酸酯合成(安捷伦(Agilent))。通过将100uM核酸酶与120uM具有不同间隔区长度(20至25个核苷酸,表6,图46B)的TRAC S119和100uM Cas9电穿孔增强剂(IDT)的合成引导物混合来组装RNP。在室温下温育10分钟后,根据制造商的方案,将RNP复合物与200,000个预洗涤的U2OS细胞混合,并使用Lonza SE细胞系4DNucleofectorTM X试剂盒(具有DN100)进行电穿孔。电穿孔后72小时,对细胞进行切割,并且提取其基因组DNA含量并将其用作其相应基因组靶标的PCR扩增的模板。使扩增子经历NGS,并且接着使用所得序列计算编辑事件的百分比。如图47和表7所示,20个核苷酸的间隔区显示出比21至25个核苷酸的间隔区更低的编辑水平,这表明高效编辑活性需要至少21个核苷酸的间隔区长度。

表1-OMNI CRISPR核酸酶序列

/>

/>

/>

/>

/>

/>

表1.OMNI核酸酶序列:表1列出了OMNI名称、其相应的核酸酶蛋白序列、其DNA序列,其人类优化的DNA序列、要取代以产生具有失活RuvC结构域的切口酶的替代位置、要取代以产生具有失活HNH结构域的切口酶的替代位置和要取代以产生具有失活RuvC结构域和HNH结构域的无催化活性的核酸酶的替代位置。第5列第至7列中指示的每个氨基酸位置允许用任何其它氨基酸取代,除非后跟星号,这表明除谷氨酸(E)对天冬氨酸(D)或天冬氨酸(D)对谷氨酸(E)外的任何取代都会导致失活。

补充表1-OMNI结构域

/>

补充表1.OMNI结构域:补充表1列出了OMNI CRISPR核酸酶的每个经识别的结构域的氨基酸范围。例如,OMNI-90的结构域G由SEQ ID NO:1的氨基酸462至510识别。所列出的氨基酸范围基于使用Smith-Waterman算法生成的局部比对的优选分析,然而,每个结构域范围的开始或结束可以增加或减少多达五个氨基酸。

表2-OMNI引导RNA和支架RNA序列

/>

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

表2(续)-OMNI引导RNA和支架RNA序列

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

表2(续)-OMNI引导RNA和支架RNA序列

/>

/>

表3-显示针对每个经测试的sgRNA的活性的OMNI PAM序列

/>

*耗竭分数-两个耗竭最严重位点比的平均值

表4-质粒和构建体

表4附录-构建体元件的细节

表5-哺乳动物细胞内源性背景下的核酸酶活性

/>

/>

/>

表5.哺乳动物细胞内源性背景下的核酸酶活性:OMNI核酸酶通过DNA转染与sgRNA表达质粒一起在哺乳动物细胞系统(HeLa)中表达。细胞溶解物用于位点特异性基因组DNA扩增和NGS。测量并分析插入缺失的百分比以确定编辑水平。间隔区3'基因组序列含有与每一OMNI核酸酶相关的预期PAM。

表6-针对OMNI-93的合成sgRNA(间隔区和支架)

表7-U2OS细胞中作为RNP的OMNI-93活性和间隔区优化

表7.OMNI-93 RNP用合成sgRNA(安捷伦,表6)组装并电穿孔到U2OS细胞中。基因名称、间隔区序列和长度在由NGS测量的编辑水平旁边标明。

参考文献

1.Ahmad和Allen(1992)“抗体介导的脂质体包覆阿霉素对肺癌细胞的体外特异性结合和细胞毒性(Antibody-mediated Specific Binding and Cytotoxicity ofLipsome-entrapped Doxorubicin to Lung Cancer Cells in Vitro)”,《癌症研究》52:4817-20。

2.Anderson(1992)“人类基因疗法(Human gene therapy)”,《科学》256:808-13。

3.Basha等人(2011)“阳离子脂质成分对抗原呈递细胞中siRNA脂质纳米颗粒制剂的基因沉默特性的影响(Influence of Cationic Lipid Composition on GeneSilencing Properties of Lipid Nanoparticle Formulations of siRNA in Antigen-Presenting Cells)”,《分子疗法》19(12):2186-200。

4.Behr(1994)“用合成阳离子两亲物进行的基因转移:基因疗法展望(Genetransfer with synthetic cationic amphiphiles:Prospects for gene therapy)”,《生物共轭化学》5:382-89。

5.Blaese等人(1995)“癌症治疗中的载体:它们将如何递送(Vectors in cancertherapy:how will they deliver)”,《癌症基因疗法》2:291-97。

6.Blaese等人(1995)“针对ADA-SCID的T淋巴细胞定向基因疗法:4年后的初步试验结果(T lymphocyte-directed gene therapy for ADA-SCID:initial trial resultsafter 4years)”,《科学》270(5235):475-80。

7.Briner等人(2014)“引导RNA功能模块引导Cas9活性和正交性(Guide RNAfunctional modules direct Cas9 activity and orthogonality)”,《分子细胞》56:333-39。

8.Buchschacher和Panganiban(1992)“用于诱导表达外源基因的人类免疫缺陷病毒载体(Human immunodeficiency virus vectors for inducible expression offoreign genes)”,《病毒学杂志》66:2731-39。

9.Burstein等人(2017)“来自未培养微生物的新CRISPR-Cas系统(New CRISPR-Cas systems from uncultivated microbes)”,《自然》542:237-41。

10.Canver等人(2015)“通过Cas9介导的原位饱和诱变对BCL11A增强子进行解剖(BCL11Aenhancer dissection by Cas9-mediated in situ saturating mutagenesis)”,《自然》第527卷,第192页至第214页。

11.Chang和Wilson(1987)“DNA末端的修饰可以减少相对于哺乳动物细胞同源重组的末端连接(Modification of DNA ends can decrease end-joining relative tohomologous recombination in mammalian cells)”,《美国国家科学院院刊》84:4959-4963。

12.Charlesworth等人(2019)“对人类Cas9蛋白的预先存在的适应性免疫的鉴定(Identification of preexisting adaptive immunity to Cas9 proteins inhumans)”,《自然医学》,25(2),249。

13.Chung等人(2006)“农杆菌并不唯一:病毒和其它细菌将基因转移到植物中(Agrobacterium is not alone:gene transfer to plants by viruses and otherbacteria)”,《植物科学趋势》11(1):1-4。

14.Coelho等人(2013)“RNAi疗法对转甲状腺素蛋白淀粉样变性的安全性和功效(Safety and efficacy of RNAi therapy for transthyretin amyloidosis)”,《新英格兰医学杂志》369,819-829。

15.Crystal(1995)“将基因转移到人类:早期教训和成功的障碍(Transfer ofgenes to humans:early lessons and obstacles to success)”,《科学》270(5235):404-10。

16.Dillon(1993)“基因疗法中的调节基因表达(Regulation gene expressionin gene therapy)”《生物技术趋势(Trends in Biotechnology)》11(5):167-173。

17.Dranoff等人(1997)“用经工程改造以分泌人粒细胞巨噬细胞集落刺激因子的自体、经辐照的黑色素瘤细胞进行疫苗接种的I期研究(A phase I study of vaccinationwith autologous,irradiated melanoma cells engineered to secrete humangranulocyte macrophage colony stimulating factor)”,《人类基因疗法》8(1):111-23。

18.Dunbar等人(1995)“逆转录病毒标记的富含CD34的外周血和骨髓细胞有助于自体移植后的长期移植(Retrovirally marked CD34-enriched peripheral blood andbone marrow cells contribute to long-term engraftment after autologoustransplantation)”,《血液》85:3048-57。

19.Ellem等人(1997)“病例报告:人类首次使用粒细胞/巨噬细胞集落刺激因子转导的自体黑色素瘤细胞进行免疫疗法的免疫反应和临床过程(A case report:immuneresponses and clinical course of the first human use of granulocyte/macrophage-colony-stimulating-factor-transduced autologous melanoma cells forimmunotherapy)”,《癌症免疫学与免疫疗法(Cancer Immunol Immunother)》44:10-20。

20.Gao和Huang(1995)“阳离子脂质体介导的基因转移(Cationic liposome-mediated gene transfer)”,《基因疗法》2(10):710-22。

21.Haddada等人(1995)“使用腺病毒载体进行基因疗法(Gene Therapy UsingAdenovirus Vectors)”,载于:《腺病毒分子库III:生物学和发病机制(The MolecularRepertoire of Adenoviruses III:Biology and Pathogenesis)》,Doerfler和

22.Han等人(1995)“配体定向逆转录病毒靶向人类乳腺癌细胞(Ligand-directedretro-viral targeting of human breast cancer cells)”,《美国国家科学院院刊》92(21):9747-51。

23.Humbert等人(2019)“通过在非人类灵长类动物中HbF再激活进行CRISPR-Cas9编辑的富含HSC的群体的治疗相关移植(Therapeutically relevant engraftment ofaCRISPR-Cas9-edited HSC-enriched population with HbF reactivation in nonhumanprimates)”,《科学转化医学》,第11卷,第1页至第13页。

24.Inaba等人(1992)“从补充有粒细胞/巨噬细胞集落刺激因子的小鼠骨髓培养物中产生大量树突细胞(Generation of large numbers of dendritic cells frommouse bone marrow cultures supplemented with granulocyte/macrophage colony-stimulating factor)”,《实验医学杂志》176(6):1693-702。

25.Jiang和Doudna(2017)“CRISPR-Cas9结构和机制(CRISPR-Cas9 Structuresand Mechanisms)”,《生物物理学年评(Annual Review of Biophysics)》46:505-29。

26.Jinek等人(2012)“适应性细菌免疫中的可编程双RNA引导的DNA核酸内切酶(Aprogrammabledual-RNA-guided DNA endonuclease in adaptive bacterialimmunity)”,《科学》337(6096):816-21。

27.Johan等人(1992)“GLVR1,一种长臂猿白血病病毒的受体,与粗糙脉孢菌的磷酸盐渗透酶同源,并在大脑和胸腺中高水平表达(GLVR1,a receptor for gibbon apeleukemia virus,is homologous to a phosphate permease of Neurospora crassa andis expressed at high levels in the brain and thymus)”,《病毒学杂志》66(3):1635-40。

28.Judge等人(2006)“介导体内强效基因沉默的非炎症性合成siRNA的设计(Design of noninflammatory synthetic siRNA mediating potent gene silencing invivo)”,《分子疗法》13(3):494-505。

29.Kohn等人(1995)“在腺苷脱氨酶缺乏症新生儿中植入基因修饰的脐带血细胞(Engraftment of gene-modified umbilical cord blood cells in neonates withadenosine deaminase deficiency)”,《自然医学》1:1017-23。

30.Kremer和Perricaudet(1995)“腺病毒和腺相关病毒介导的基因转移(Adenovirus and adeno-associated virus mediated gene transfer)”,《英国医学公报》51(1):31-44。

31.Macdiarmid等人(2009)“用含有siRNA或细胞毒性药物的靶向微细胞顺序治疗耐药肿瘤(Sequential treatment of drug-resistant tumors with targetedminicells containing siRNA or a cytotoxic drug)”,《自然生物技术》27(7):643-51。

32.Malech等人(1997)“慢性肉芽肿病基因疗法后NADPH氧化酶校正粒细胞的延长产生(Prolonged production of NADPH oxidase-corrected granulocyes after genetherapy of chronic granulomatous disease)”,《PNAS》94(22):12133-38。

33.Maxwell等人(2018)“一种破译CRISPR原型间隔区邻近基序的详细的基于无细胞转录翻译的测定(A detailed cell-free transcription-translation-based assayto decipher CRISPR protospacer adjacent motifs)”,《方法》14348-57。

34.Miller等人(1991)“基于长臂猿白血病病毒的逆转录病毒包装细胞的构建和特性(Construction and properties of retrovirus packaging cells based ongibbon ape leukemia virus)”,《病毒学杂志》65(5):2220-24。

35.Miller(1992)“人类基因疗法走向成熟(Human gene therapy comes ofage)”,《自然》357:455-60。

36.Mir等人(2019)“II-C型CRISPR-Cas9生物学、机制和应用(Type II-CCRISPR-Cas9 Biology,Mechanism and Application)”,《ACS化学生物学》13(2):357-365。

37.Mitani和Caskey(1993)“递送治疗基因-匹配方法和应用(Deliveringtherapeutic genes-matching approach and application)”,《生物技术趋势》11(5):162-66。

38.Nabel和Felgner(1993)“用于免疫疗法和免疫接种的直接基因转移(Directgene transfer for immunotherapy and immunization)”,《生物技术趋势》11(5):211-15。

39.Nehls等人(1996)“胸腺上皮分化的两个遗传可分离步骤(Two geneticallyseparable steps in the differentiation of thymic epithelium)”,《科学》272:886-889。

40.Nishimasu等人“与引导RNA和靶DNA复合的Cas9的晶体结构(Crystalstructure of Cas9 in complex with guide RNA and target DNA)”(2014),《细胞》156(5):935-49。

41.Nishimasu等人(2015)“金黄色葡萄球菌Cas9的晶体结构(Crystal Structureof Staphylococcus aureus Cas9)”,《细胞》162(5):1113-26。

42.Palermo等人(2018)“REC叶在CRISPR-Cas9激活过程中通过‘传感’、‘调节’和‘锁定’催化HNH结构域的关键作用(Key role of the REC lobe during CRISPR-Cas9activation by‘sensing’,‘regulatin’,and‘locking’the catalytic HNHdomain)”,《生物物理学季刊(Quarterly Reviews of Biophysics)》,51,e9,1-11。

43.Remy等人(1994)“具有一系列亲脂性DNA结合分子的基因转移(Gene Transferwith a Series of Lipophilic DNA-Binding Molecules)”,《生物共轭化学》5(6):647-54。

44.Sentmanat等人(2018)“CRISPR-Cas9编辑验证策略调查(A Survey ofValidation Strategies for CRISPR-Cas9 Editing)”,《科学报告(ScientificReports)》8:888,doi:10.1038/s41598-018-19441-8。

45.Sommerfelt等人(1990)“D型猿猴逆转录病毒在人类19号染色体上受体基因的定位(Localization of the receptor gene for type D simian retroviruses onhuman chromosome 19)”,《病毒学杂志》64(12):6214-20。

46.Van Brunt(1988)“分子框架:作为生物行为者的转基因动物(Molecularframing:transgenic animals as bioactors)”《生物技术》6:1149-54。

47.Vigne等人(1995)“用于基因疗法的第三代腺载体(Third-generationadenovectors for gene therapy)”,《修复性神经病学和神经科学》8(1,2):35-36。

48.Wagner等人(2019)“成人人群中化脓性链球菌Cas9反应性T细胞的高流行率(High prevalence of Streptococcus pyogenes Cas9-reactive T cells within theadult human population)”,《自然医学》,25(2),242。

49.Wilson等人(1989)“用长臂猿白血病病毒和人类T细胞白血病病毒逆转录病毒包膜糖蛋白以及莫洛尼鼠白血病病毒的gag和pol蛋白形成感染性杂交病毒粒子(Formation of infectious hybrid virion with gibbon ape leukemia virus andhuman T-cell leukemia virus retroviral envelope glycoproteins and the gag andpol proteins of Moloney murine leukemia virus)”,《病毒学杂志》63:2374-78。

50.Yu等人(1994)“HIV感染基因疗法的进展(Progress towards gene therapyfor HIV infection)”,《基因疗法》1(1):13-26。

51.Zetsche等人(2015)“Cpf1是2类CRISPR-Cas系统的单RNA引导的核酸内切酶(Cpf1 is a single RNA-guided endonuclease of a class 2CRIPSR-Cas system)”,《细胞》163(3):759-71。

52.Zuris等人(2015)“蛋白的阳离子脂质介导的递送能够体外和体内进行高效的基于蛋白的基因组编辑(Cationic lipid-mediated delivery of proteins enablesefficient protein based genome editing in vitro and in vivo)”,《自然生物技术》33(1):73-80。

相关技术
  • 一种燃料电池动力系统和包含该燃料电池动力系统的车辆
  • 燃料电池系统以及燃料电池系统的控制方法
  • 燃料电池系统以及燃料电池系统的控制方法
  • 燃料电池用集电板、燃料电池组、燃料电池系统及燃料电池系统的制造方法
  • 燃料电池用集电板、燃料电池组、燃料电池系统及燃料电池系统的制造方法
技术分类

06120116452946