掌桥专利:专业的专利平台
掌桥专利
首页

相关申请的交叉引用

本申请要求2018年07月31日提交的美国临时申请号62/712,809, 2018年10月26日提交的美国临时申请号62/751,421,2018年12月05 日提交的美国临时申请号62/775,865,2019年03月22日提交的美国临时申请号62/822,639和2019年07月11日提交的美国临时申请号 62/873,031的权益。以上确认的申请的全部内容特此通过引用完全并入本文。

关于联邦资助研究的声明

本发明是根据由美国国立卫生研究院(National Institutes of Health) 授予的拨款号HG009761、MH110049和HL141201在政府支持下完成的。政府享有本发明的某些权利。

电子序列表引用

电子序列表(“BROD-2660WP_ST25.txt”;大小为1,997,857字节,创建日期为2019年07月25日)的内容以引用方式整体并入本文。

技术领域

本发明总体上涉及用于控制涉及序列靶向(如基因转录物的扰动或核酸编辑)的基因表达的系统、方法和组合物,其可以使用涉及规律间隔成簇短回文重复序列(CRISPR)及其组分的载体系统。

背景技术

细菌和古细菌适应性免疫的CRISPR-CRISPR相关(Cas)系统是一些这样的系统,其显示出蛋白质组成和基因组基因座结构的极端多样性。 CRISPR-Cas系统基因座具有超过50种的基因家族并且不存在严格的通用基因,这表明了基因座结构的快速进化和极端多样性。到目前为止,采用了多分支方法,针对93种Cas蛋白存在约395个谱分析的全面cas 基因鉴定。分类包括特征基因谱分析加上基因座结构的特征。提出了一种新的CRISPR-Cas系统分类,其中这些系统宽泛地分成两类,具有多亚基效应子复合物的第1类和通过Cas9蛋白来示例的具有单亚基效应子模块的第2类。与第2类CRISPR-Cas系统相关联的新型效应蛋白可以被开发为强有力的基因组工程化工具,并且推定的新型效应蛋白的预测及其工程化和优化是重要的。新型Cas13b直系同源物及其用途是期望的。

在证明CRISPR-Cas9可以改换用途用于基因组编辑之后,对利用CRISPR系统的兴趣导致发现了数种具有新性质的新型Cas酶和CRISPR 系统(1-3)。在这些新发现中,值得注意的是第2类VI型CRISPR-Cas13 系统,其使用可编程CRISPR-RNA(crRNA)指导序列来使用单一酶以靶向RNA(1-6)。与靶单链RNA结合的Cas13激活了一般RNase活性,其切割靶点并且非特异性地降解周围的RNA(4)。已将VI型系统用于 RNA敲低、转录物标记、RNA编辑和超灵敏病毒检测(3、4、7-12)。根据Cas13蛋白的特性将CRISPR-Cas13系统进一步分成四种亚型(Cas13a-d)(2)。所有Cas13蛋白家族成员均含有两个高级原核生物和真核生物核苷酸结合(HEPN)结构域。本申请中的任何文献的引用或确定并不是承认该文献可作为本发明的现有技术。

迫切需要替代性的和稳健的系统和技术用于靶向核酸或多核苷酸 (例如,DNA或RNA或者任何杂交物或其衍生物),具有广泛应用,特别是开发具有改变的功能性的效应蛋白,例如包括但不限于增加或降低的特异性、增加或降低的活性、改变的特异性和/或活性、替代的PAM 识别等。本发明满足了这种需求并提供了相关的优点。将本申请的新型 RNA靶向系统添加到基因组、转录组和表观基因组靶向技术的库中可以通过直接检测、分析和操纵来改变对特定靶位点的研究和干扰或编辑。为了有效地利用本申请的RNA靶向系统来进行RNA靶向而没有有害影响,至关重要的是要了解这些RNA靶向工具的工程化和优化的方面。

发明内容

在一个方面中,本公开内容提供了一种工程化的CRISPR-Cas蛋白,其包含一个或多个HEPN结构域,以及还包含一个或多个修饰的氨基酸,其中所述氨基酸:与指导RNA相互作用,所述指导RNA与所述工程化 CRISPR-Cas蛋白形成复合物;在所述工程化CRISPR-Cas蛋白的HEPN 活性位点、结构域间接头结构域、盖结构域、螺旋结构域1、螺旋结构域2或桥螺旋结构域中;或者其组合。

在一些实施方式中,所述HEPN结构域包含RxxxxH基序。在一些实施方式中,所述RxxxxH基序包含R{N/H/K}X

在一些实施方式中,CRISPR-Cas蛋白是VI型CRISPR Cas蛋白在一些实施方式中,VI型CRISPR Cas蛋白是Cas13。在一些实施方式中, VI型CRISPR Cas蛋白是Cas13a、Cas13b、Cas13c或Cas13d。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、 K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、 R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、 K943、R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、E399、 K294、E400、R56、N157、H161、H452、N455、K484、N486、G566、 H567、A656、V795、A796、W842、K871、E873、R874、R1068、N1069或H1073。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H407、K457、 H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、 K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、 R830、Q831、K835、K836、R838、R618、D434、K431、R53、K943、 R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、E399、K294、 E400、R56、N157、H161、H452、N455、K484、N486、G566、H567、 W842、K871、E873、R874、R1068、N1069、H1073。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、 K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、 K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、 R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、 K943、R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、E399、 K294或E400。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、 N482、T405、H407、S658、N653、A656、K655、N652、H567、N455、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、H452、S757、N756、N486、 K484、N480、K457、K741、R56、N157、H161、R1068、N1069或H1073。

在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N482、H407、S658、N653、K655、N652、 H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、N486、 K484、N480、K457、K741、R56、N157、H161、R1068、N1069或H1073。

在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:W842、K846、K870、E873或R877。在一些实施方式中,在螺旋结构域1中对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:W842、K846、K870、E873或R877。在一些实施方式中,在螺旋结构域1-3中对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:W842、K846、K870、E873 或R877。在一些实施方式中,在桥螺旋结构域中对应于PbCas13b的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:W842、K846、 K870、E873或R877。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N480、N482、N652或 N653。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N480或N482。在一些实施方式中,在盖结构域中对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N480或N482。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:N652或 N653。在一些实施方式中,在螺旋结构域2中对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:N652或N653。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、S658、N653、A656、K655、N652、H567、N455、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 V795、A796、R791、G566、K590、R638、H452、S757、N756、N486、 K484、N480、K457或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H407、S658、N653、K655、 N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、 N486、K484、N480、K457或K741。在一些实施方式中,对应于PbCas13b 的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、A656、K655、 N652、H567、H500、K871、K857、K870、W842、E873、R877、K846、 R874、R762、V795、A796、R791、G566、K590、R638、S757、N756 或K741。在一些实施方式中,在螺旋结构域中对应于PbCas13b的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、 A656、K655、N652、H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、 S757、N756或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、 S757或N756。

在一些实施方式中,在螺旋结构域1中对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、 R791、G566、S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、R762、V795、 A796、R791、G566、S757或N756。在一些实施方式中,在螺旋结构域 1中对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、R762、V795、A796、R791、G566、S757或 N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、K846或 R874。在一些实施方式中,在桥螺旋结构域中对应于PbCas13b的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、K846或R874。在一些实施方式中,对应于 PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H567、H500或 G566。

在一些实施方式中,在螺旋结构域1-2中对应于PbCas13b的螺旋结构域1-2中的下述氨基酸的氨基酸的一个或多个突变是:H567、H500或 G566。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、K846、R874、 R762、V795、A796、R791、S757或N756。在一些实施方式中,在螺旋结构域1-3中对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、K846、 R874、R762、V795、A796、R791、S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:R762、 V795、A796、R791、S757或N756。在一些实施方式中,在螺旋结构域 1-3中对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:R762、V795、A796、R791、S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、A656、K655、N652、K590、R638或K741。在一些实施方式中,在螺旋结构域2中对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、A656、K655、 N652、K590、R638或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、N486、K484、 N480、H452、N455或K457。在一些实施方式中,在盖结构域中对应于 PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是: T405、H407、N486、K484、N480、H452、N455或K457。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是: S658、N653、K655、N652、H567、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、R791、G566、K590、R638、S757、N756或K741。在一些实施方式中,在螺旋结构域中对应于PbCas13b的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、 K655、N652、H567、H500、K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、G566、K590、R638、S757、N756或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、G566、S757或N756。在一些实施方式中,在螺旋结构域1中对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、R791、G566、S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、R762、R791、G566、S757或N756。在一些实施方式中,在螺旋结构域1中对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H567、H500、R762、R791、G566、 S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、S757或N756。在一些实施方式中,在螺旋结构域1-3中对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、S757或N756。

在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:R762、R791、S757或N756。在一些实施方式中,在螺旋结构域1-3中对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:R762、R791、S757或N756。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是: S658、N653、K655、N652、K590、R638或K741。在一些实施方式中,在螺旋结构域2中对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、K655、N652、K590、R638或 K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H407、N486、K484、N480、H452、N455或K457。

在一些实施方式中,在盖结构域中对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:H407、N486、K484、N480、 H452、N455或K457。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:R56、N157、H161、R1068、N1069 或H1073。在一些实施方式中,在HEPN结构域中对应于PbCas13b的 HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R56、N157、 H161、R1068、N1069或H1073。在一些实施方式中,对应于PbCas13b 的下述氨基酸的氨基酸的一个或多个突变是:R56、N157或H161。在一些实施方式中,在HEPN结构域1中对应于PbCas13b的HEPN结构域1 中的下述氨基酸的氨基酸的一个或多个突变是:R56、N157或H161。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:R1068、N1069或H1073。在一些实施方式中,在HEPN结构域 2中对应于PbCas13b的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:R1068、N1069或H1073。在一些实施方式中,对应于 PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、 N482、T405、H407、N486、K484、N480、H452、N455或K457。在一些实施方式中,在盖结构域中对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N482、T405、H407、 N486、K484、N480、H452、N455或K457。在一些实施方式中,对应于 PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、 N482、H407、N486、K484、N480、H452、N455或K457。在一些实施方式中,在盖结构域中对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N482、H407、N486、K484、 N480、H452、N455或K457。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、S658、N653、 A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457、K741、K393、 R402或N482。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:H407、S658、N653、K655、N652、H567、 N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、 N480、K457、K741、K393、R402或N482。在一些实施方式中,对应于 PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、K655、N652、H567、N455、H500、K871、K857、 K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457或K741。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:N486、K484、N480、H452、N455或K457。

在一些实施方式中,在盖结构域中对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:N486、K484、N480、H452、 N455或K457。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、N482、N486、K484、N480、 H452、N455或K457。在一些实施方式中,在盖结构域中对应于PbCas13b 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K393、R402、 N482、N486、K484、N480、H452、N455或K457。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:S658、 N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、 K590、R638、H452、S757、N756、N486、K484、N480、K457、K741、 K393、R402或N482。在一些实施方式中,对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变是:S658、N653、K655、N652、H567、 N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、 N480、K457、K741、K393、R402或N482。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、 K943或R1041。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53 或Y164。在一些实施方式中,对应于颊普雷沃菌(Prevotellabuccae) Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K943 或R1041。在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K943或R1041。在一些实施方式中,在HEPN结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:R53或Y164。在一些实施方式中,在HEPN结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K943或R1041。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、 K943、R1041、R56、N157、H161、R1068、N1069或H1073。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、R56、N157 或H161。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K943、 R1041、R1068、N1069或H1073。在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN 结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K943、 R1041、R56、N157、H161、R1068、N1069或H1073。在一些实施方式中,在HEPN结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、R56、N157或H161。在一些实施方式中,在HEPN 结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K943、 R1041、R1068、N1069或H1073。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K183、K193、K943或R1041。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K183或K193。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K943或 R1041。

在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K183、K193、K943或R1041。在一些实施方式中,在HEPN结构域1中对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K183或K193。在一些实施方式中,在HEPN 结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K943 或R1041。在一些实施方式中,对应于颊普雷沃菌(Prevotellabuccae) Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、 Y164、K183、K193、K943、R1041、R56、N157、H161、R1068、N1069 或H1073。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、 Y164、K183、K193、R56、N157或H161。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K943、R1041、R1068、N1069或H1073。在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K183、K193、K943、R1041、R56、 N157、H161、R1068、N1069或H1073。在一些实施方式中,在HEPN 结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:R53、 Y164、K183、K193、R56、N157或H161。

在一些实施方式中,在HEPN结构域2中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K943、R1041、R1068、N1069或 H1073。在一些实施方式中,对应于颊普雷沃菌(Prevotellabuccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K183或K193。在一些实施方式中,在HEPN结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:K183或K193。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K943或R1041。在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、Y164、K943或R1041。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、K943或R1041;优选地,R53A、R53K、R53D 或R53E;K943A、K943R、K943D或K943E;或者,R1041A、R1041K、 R1041D或R1041E。在一些实施方式中,在HEPN结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53、K943或R1041;优选地, R53A、R53K、R53D或R53E;K943A、K943R、K943D或K943E;或者,R1041A、R1041K、R1041D或R1041E。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸Y164 的氨基酸的突变是,优选地Y164A、Y164F或Y164W。

在一些实施方式中,在HEPN结构域1中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域1的氨基酸Y164 的氨基酸的突变是,优选地Y164A、Y164F或Y164W。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、K457、D434、K431、 R402、K393、R482、N480、D396、E397、D398或E399。在一些实施方式中,在盖结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是: T405、H407、K457、D434、K431、R402、K393、R482、N480、D396、 E397、D398或E399。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸H407的氨基酸突变是,优选地 H407Y、H407W或H407F。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R402、K393、R482、N480、D396、E397、D398或E399。在一些实施方式中,在盖结构域中对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:R402、K393、R482、N480、D396、E397、D398或E399。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K457、D434 或K431。在一些实施方式中,在盖结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K457、D434或K431。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、 K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、 R838、R618、Q646、N647、N653或N652。在一些实施方式中,在螺旋结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、 R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、Q646、N647、N653或N652。在一些实施方式中,对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、N756、S757、R762、R791、 K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、 K835、K836或R838。在一些实施方式中,在螺旋结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、N756、S757、 R762、R791、K846、K857、K870、R877、K826、K828、K829、R824、 R830、Q831、K835、K836或R838。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、N756、S757、R762或R791。在一些实施方式中,在螺旋结构域1中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变是:H500、K570、N756、S757、R762或R791。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K846、K857、 K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836 或R838。在一些实施方式中,在桥螺旋结构域中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:K846、K857、K870、R877、K826、 K828、K829、R824、R830、Q831、K835、K836或R838。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H500或K570。在一些实施方式中,在螺旋结构域1-2中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-2中的下述氨基酸的氨基酸的一个或多个突变是:H500或K570。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762、R791、K846、K857、K870、R877、K826、K828、 K829、R824、R830、Q831、K835、K836或R838。在一些实施方式中,在螺旋结构域1-3中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762、R791、K846、K857、K870、R877、K826、 K828、K829、R824、R830、Q831、K835、K836或R838。在一些实施方式中,对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762或R791。在一些实施方式中,在螺旋结构域1-3中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762或R791。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762、R791、K846、K857、K870或R877。在一些实施方式中,在螺旋结构域1-3中对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的螺旋结构域1-3 中的下述氨基酸的氨基酸的一个或多个突变是:N756、S757、R762、R791、 K846、K857、K870或R877。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K826、K828、K829、R824、R830、Q831、K835、K836 或R838。在一些实施方式中,在螺旋结构域1-3中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变是:K826、K828、K829、R824、R830、 Q831、K835、K836或R838。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K590、N634、R638、N652、N653、K655、S658、K741、 K744、R600、K607、K612、R614、K617、R618、Q646、N647、N653 或N652。在一些实施方式中,在螺旋结构域2中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K590、N634、R638、N652、N653、K655、S658、K741、K744、R600、K607、K612、R614、K617、R618、 Q646、N647、N653或N652。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:Q646或N647。在一些实施方式中,在螺旋结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:Q646或N647。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N653或N652。在一些实施方式中,在螺旋结构域2中对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:N653或 N652。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K590、N634、 R638、N652、N653、K655、S658、K741或K744。在一些实施方式中,在螺旋结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K590、N634、R638、N652、N653、K655、S658、K741或K744。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R600、K607、 K612、R614、K617或R618。在一些实施方式中,在螺旋结构域2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域 2中的下述氨基酸的氨基酸的一个或多个突变是:R600、K607、K612、 R614、K617或R618。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R285、R287、K292、E296、N297或K294。在一些实施方式中,在盖结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:R285、R287、 K292、E296、N297或K294。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R285、K292、E296或N297。在一些实施方式中,在盖结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:R285、K292、 E296或N297。

在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:T405、H500、 K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、 N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、 Q831、K835、K836、R838、R618、D434、K431、R285、R287、K292、 E296、N297、Q646、N647或K294。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R402、K393、N653、N652、R482、N480、D396、E397、D398或E399。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53、K655、R762或R1041;优选地,R53A或R53D;K655A;R762A;或者,R1041E或R1041D。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N297、E296、K292或R285;优选地,N297A、E296A、 K292A或R285A。在一些实施方式中,在IDL结构域(的中央通道)中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的IDL结构域(的中央通道)中的下述氨基酸的氨基酸的一个或多个突变是:N297、 E296、K292或R285;优选地,N297A、E296A、K292A或R285A。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:Q831、K836、 R838、N652、N653、R830、K655或R762;优选地,Q831A、K836A、 R838A、N652A、N653A、R830A、K655A或R762A。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:N652、N653、R830、K655 or R762;优选地,N652A、N653A、R830A、K655A或R762A。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K655或R762;优选地,K655A 或R762A。在一些实施方式中,在螺旋结构域中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:Q831、K836、R838、N652、N653、R830、 K655或R762;优选地,Q831A、K836A、R838A、N652A、N653A、R830A、 K655A或R762A。

在一些实施方式中,在螺旋结构域中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变是:N652、N653、R830、K655 or R762;优选地,N652A、 N653A、R830A、K655A或R762A。在一些实施方式中,在螺旋结构域 2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:K655或R762;优选地,K655A或R762A。在一些实施方式中,对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R614、K607、K193、K183或R600;优选地,R614A、K607A、K193A、K183A或R600A。在一些实施方式中,在螺旋结构域 2中对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变是:Q646或N647;优选地,Q646A或N647A。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R53或R1041;优选地,R53A或R53D或R1041E或 R1041D。在一些实施方式中,在HEPN结构域中包含对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R53或R1041;优选地,R53A或R53D 或R1041E或R1041D。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K457、D397、E398、D399、E400、T405、H407或D434;优选地, D397A、E398A、D399A、E400A、T405A、H407A、H407W、H407Y、 H407F或D434A。在一些实施方式中,在盖结构域中对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的盖结构域中的下述氨基酸的氨基酸的一个或多个突变是:K457、D397、E398、D399、E400、T405、H407或D434;优选地,D397A、E398A、D399A、E400A、T405A、H407A、 H407W、H407Y、H407F或D434A。在一些实施方式中,所述氨基酸对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸:氨基酸46-57、73-79、152-164、1036-1046和1064-1074。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R156、N157、H161、R1068、 N1069和H1073。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R285、R287、K292、K294、E296和N297。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:K826、K828、K829、R824、R830、Q831、 K835、K836和R838。在一些实施方式中,对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变是:T405、H407、K457、H500、K570、K590、N634、R638、N652、 N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、 K857、K870和R877。

在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸T405。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸H407。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K457。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸H500。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K570。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K590。

在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N634。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R638。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N652。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N653。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K655。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸S658。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸K741。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K744。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N756。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸S757。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R762。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R791。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K846。在一些实施方式中氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K857。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K870。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R877。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸K183。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K193。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R600。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K607。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K612。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R614。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K617。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K826。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K828。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K829。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R824。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R830。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸Q831。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K835。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K836。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R838。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R618。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸D434。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸K431。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R53。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸K943。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R1041。在一些实施方式中,氨基酸突变对应于颊普雷沃菌 (Prevotella buccae)Cas13b(PbCas13b)的氨基酸Y164。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸R285。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R287。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b (PbCas13b)的氨基酸K292。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸E296。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸N297。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸Q646。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N647。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸R402。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸K393。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N653。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸N652。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R482。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b (PbCas13b)的氨基酸N480。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸D396。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸E397。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸D398。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸E399。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸K294。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸E400。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R56。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸N157。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸H161。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b (PbCas13b)的氨基酸H452。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N455。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸K484。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N486。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸G566。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae)Cas13b(PbCas13b)的氨基酸H567。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸A656。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸V795。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸A796。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸W842。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotellabuccae) Cas13b(PbCas13b)的氨基酸K871。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸E873。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的氨基酸R874。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸R1068。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的氨基酸N1069。在一些实施方式中,氨基酸突变对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H1073。

在一些实施方式中,对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变是:R597、N598、 H602、R1278、N1279或H1283。在一些实施方式中,对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变是:R597、N598、H602、R1278、N1279或H1283。在一些实施方式中,在HEPN结构域中对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R597、N598、H602、R1278、N1279或H1283。在一些实施方式中,对应于沙氏纤毛菌(Leptotrichiashahii)Cas13a (LshCas13a)的下述氨基酸的氨基酸的一个或多个突变是:R597、N598 或H602。在一些实施方式中,在HEPN结构域1中对应于沙氏纤毛菌 (Leptotrichia shahii)Cas13a(LshCas13a)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变是:R597、N598或H602。在一些实施方式中,对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a) 的下述氨基酸的氨基酸的一个或多个突变是:R1278、N1279或H1283。在一些实施方式中,在HEPN结构域2中对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:R1278、N1279或H1283。在一些实施方式中,对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R146、H151、R1116或H1121。在一些实施方式中,对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b (PguCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R146、H151、 R1116或H1121。在一些实施方式中,在HEPN结构域中对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:R146、H151、R1116或 H1121。在一些实施方式中,对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b)的下述氨基酸的氨基酸的一个或多个突变是: R146或H151。在一些实施方式中,在HEPN结构域1中对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b)的HEPN结构域 1中的下述氨基酸的氨基酸的一个或多个突变是:R146或H151。在一些实施方式中,对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b (PguCas13b)的下述氨基酸的氨基酸的一个或多个突变是:R1116或 H1121。在一些实施方式中,在HEPN结构域2中对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变是:R1116或H1121。在一些实施方式中,对应于普雷沃菌属种(Prevotellasp.)P5-125 Cas13b (PspCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H133或H1058。在一些实施方式中,对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的下述氨基酸的氨基酸的一个或多个突变是:H133 或H1058。在一些实施方式中,在HEPN结构域中对应于普雷沃菌属种 (Prevotella sp.)P5-125 Cas13b(PspCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变是:H133或H1058。在一些实施方式中,氨基酸突变对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的氨基酸H133。在一些实施方式中,在HEPN结构域1 中的氨基酸突变对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的HEPN结构域1中的氨基酸H133。在一些实施方式中,氨基酸突变对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的氨基酸H1058。在一些实施方式中,在HEPN结构域2 中的氨基酸突变对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的HEPN结构域2中的氨基酸H1058。

在一些实施方式中,所述氨基酸被突变为A、P或V,优选地,A。在一些实施方式中,所述氨基酸突变为疏水性氨基酸。在一些实施方式中,所述氨基酸被突变为芳香族氨基酸。在一些实施方式中,所述氨基酸被突变为带电荷的氨基酸。在一些实施方式中,所述氨基酸被突变为带正电的氨基酸。在一些实施方式中,所述氨基酸被突变为带负电的氨基酸。在一些实施方式中,所述氨基酸被突变为极性氨基酸。在一些实施方式中,所述氨基酸被突变为脂肪族氨基酸。在一些实施方式中,所述工程化CRISPR-Cas蛋白还包含功能性异源结构域。

在一些实施方式中,所述Cas13蛋白是或源于以下的种:别样杆菌属(Alistipes)、厌氧唾液杆菌(Anaerosalibacter)、拟杆菌属(Bacteroides)、拟杆菌门(Bacteroidetes)、伯杰菌属(Bergeyella)、布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、二氧化碳噬纤维菌属(Capnocytophaga)、肉食杆菌属(Carnobacterium)、绿曲挠丝状菌属(Chloroflexus)、金黄杆菌属(Chryseobacterium)、梭菌属(Clostridium)、Demequina、优杆菌科(Eubacteriaceae)、优杆菌属(Eubacterium)、黄杆菌属 (Flavobacterium)、梭杆菌属(Fusobacterium)、Herbinix、Insolitispirillum、毛螺菌科(Lachnospiraceae)、纤毛菌属(Leptotrichia)、李斯特氏菌属 (Listeria)、香味菌属(Myroides)、杆状杆菌(Paludibacter)、细菌杆菌(Phaeodactylibacter)、紫单胞菌科(Porphyromonadaceae)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、假丁酸弧菌属(Pseudobutyrivibrio)、冷弯菌属(Psychroflexus)、赖兴氏杆菌 (Reichenbachiella)、红杆菌属(Rhodobacter)、里氏杆菌属(Riemerella)、 Sinomicrobium、海旋菌属(Thalassospira)、瘤胃球菌属(Ruminococcus);优选地,沙氏纤毛菌(Leptotrichiashahii)、斯氏李斯特氏菌(Listeria seeligeri)、毛螺科菌细菌(Lachnospiraceaebacterium)(如Lb MA2020、 Lb NK4A179、Lb NK4A144)、Clostridium aminophilum(如CaDSM 10710)、鸡肉杆菌(Carnobacterium gallinarum)(如Cg DSM 4847)、丙酸杆菌(Paludibacter propionicigenes)(如Pp WB4)、魏斯特斯蒂芬氏李斯特氏菌(Listeriaweihenstephanensis)(如Lw FSL R9-0317)、李斯特氏菌科细菌(Listeriaceaebacterium)(如Lb FSL M6-0635)、瓦氏细单胞菌(Leptotrichia wadei)(如Lw F0279)、荚膜红杆菌(Rhodobacter capsulatus)(如Rc SB 1003、Rc R121、Rc DE442)、口腔纤毛菌(Leptotrichia buccalis)(如Lb C-1013-b)、Herbinix hemicellulosilytica、优杆菌科细菌(Eubacteriaceae bacterium)(如Eb CHKCI004)、布劳特氏菌属种(Blautia sp.)Marseille-P2398、纤毛菌属种(Leptotrichia sp.) 口腔分类单元879str.F0557、聚集绿屈扰菌(Chloroflexus aggregans)、 Demequina aurantiaca、海旋菌种(Thalassospirasp.)TSL5-1、假丁酸弧菌属种(Pseudobutyrivibrio sp.)OR37、丁酸弧菌属种(Butyrivibrio sp.) YAB3001、纤毛菌属种(Leptotrichia sp.)Marseille-P3007、Bacteroides ihuae、紫单孢菌科细菌(Porphyromonadaceae bacterium)(如PbKH3CP3RA)、Listeria riparia、Insolitispirillum peregrinum、别样杆菌属种(Alistipes sp.)ZOR0009、酿脓拟杆菌(Bacteroides pyogenes)(如 Bp F0041)、拟杆菌属细菌(Bacteroidetes bacterium)(如Bb GWA2_31_9)、动物溃疡伯格菌(Bergeyellazoohelcum)(如Bz ATCC 43767)、犬咬二氧化碳噬纤维菌(Capnocytophaga canimorsus)、希诺地米碳酸噬胞菌(Capnocytophaga cynodegmi)、Chryseobacterium carnipullorum、济州岛金黄杆菌(Chryseobacterium jejuense)、嗜鳃黄杆菌(Chryseobacteriumureilyticum)、嗜分支黄杆菌(Flavobacterium branchiophilum)、柱状黄杆菌(Flavobacterium columnare)、黄杆菌属种(Flavobacterium sp.)316、Myroidesodoratimimus(如Mo CCUG 10230、 Mo CCUG 12901、Mo CCUG 3837)、Paludibacterpropionicigenes、 Phaeodactylibacter xiamenensis、牙龈卟啉单胞菌(Porphyromonasgingivalis)(如Pg F0185、Pg F0568、Pg JCVI SC001、Pg W4087)、马铃薯红单胞菌(Porphyromonas gulae)、卟啉单胞菌属种(Porphyromonas sp.)COT-052OH4946、树蛙普雷沃菌(Prevotella aurantiaca)、颊普雷沃菌(Prevotella buccae)(如Pb ATCC 33574)、Prevotella falsenii、中间普雷沃菌(Prevotella intermedia)(如Pi 17、Pi ZT)、Prevotella pallens (如Pp ATCC 700821)、Prevotella pleuritidis、解糖普雷沃菌(Prevotella saccharolytica)(如Ps F0055)、普雷沃菌属种(Prevotella sp.)MA2016、普雷沃菌属种(Prevotella sp.)MSX73、普雷沃菌属种(Prevotella sp.) P4-76、普雷沃菌属种(Prevotella sp.)P5-119、普雷沃菌属种(Prevotella sp.)P5-125、普雷沃菌属种(Prevotella sp.)P5-60、扭曲冷弯曲菌(Psychroflexus torquis)、Reichenbachiellaagariperforans、鸭疫里默氏杆菌(Riemerella anatipestifer)、Sinomicrobium oceani、坏死梭杆菌 (Fusobacterium necrophorum)(如Fn subsp.funduliforme ATCC 51357、 FnDJ-2、Fn BFTR-1、Fn subsp.Funduliforme)、坏疽梭杆菌(Fusobacterium perfoetens)(如Fp ATCC 29250)、溃疡梭杆菌(Fusobacterium ulcerans) (如Fu ATCC 49185)、厌氧唾液杆菌属种(Anaerosalibacter sp.)ND1、产亚硝酸真杆菌(Eubacterium siraeum)、黄化瘤胃球菌(Ruminococcus flavefaciens)(如Rfx XPD3002)或白色瘤胃球菌(Ruminococcusalbus)。

在一些实施方式中,所述Cas13蛋白是Cas13a蛋白。

在一些实施方式中,所述Cas13a蛋白是或源于以下的种:拟杆菌属(Bacteroides)、布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、肉食杆菌属(Carnobacterium)、绿曲挠丝状菌属(Chloroflexus)、梭菌属(Clostridium)、Demequina、优杆菌属(Eubacterium)、Herbinix、 Insolitispirillum、毛螺菌科(Lachnospiraceae)、纤毛菌属(Leptotrichia)、李斯特氏菌属(Listeria)、杆状杆菌(Paludibacter)、紫单胞菌科 (Porphyromonadaceae)、假丁酸弧菌属(Pseudobutyrivibrio)、红杆菌属(Rhodobacter)或海旋菌属(Thalassospira);优选地,沙氏纤毛菌 (Leptotrichiashahii)、斯氏李斯特氏菌(Listeria seeligeri)、毛螺科菌细菌(Lachnospiraceaebacterium)(如Lb MA2020、Lb NK4A179、Lb NK4A144)、Clostridium aminophilum(如CaDSM 10710)、鸡肉杆菌 (Carnobacterium gallinarum)(如Cg DSM 4847)、丙酸杆菌(Paludibacter propionicigenes)(如Pp WB4)、魏斯特斯蒂芬氏李斯特氏菌(Listeriaweihenstephanensis)(如Lw FSL R9-0317)、李斯特氏菌科细菌 (Listeriaceaebacterium)(如Lb FSL M6-0635)、瓦氏细单胞菌 (Leptotrichia wadei)(如Lw F0279)、荚膜红杆菌(Rhodobacter capsulatus)(如Rc SB 1003、Rc R121、Rc DE442)、口腔纤毛菌(Leptotrichia buccalis)(如Lb C-1013-b)、Herbinix hemicellulosilytica、优杆菌科细菌(Eubacteriaceae bacterium)(如Eb CHKCI004)、布劳特氏菌属种(Blautia sp.)Marseille-P2398、纤毛菌属种(Leptotrichia sp.) 口腔分类单元879str.F0557、聚集绿屈扰菌(Chloroflexus aggregans)、 Demequina aurantiaca、海旋菌种(Thalassospirasp.)TSL5-1、假丁酸弧菌属种(Pseudobutyrivibrio sp.)OR37、丁酸弧菌属种(Butyrivibrio sp.) YAB3001、纤毛菌属种(Leptotrichia sp.)Marseille-P3007、Bacteroides ihuae、紫单孢菌科细菌(Porphyromonadaceae bacterium)(如PbKH3CP3RA)、Listeria riparia或Insolitispirillum peregrinum。

在一些实施方式中,所述Cas13蛋白是Cas13b蛋白。

在一些实施方式中,所述Cas13b蛋白是或源于以下的种:别样杆菌属(Alistipes)、拟杆菌属(Bacteroides)、拟杆菌门(Bacteroidetes)、伯杰菌属(Bergeyella)、二氧化碳噬纤维菌属(Capnocytophaga)、金黄杆菌属(Chryseobacterium)、黄杆菌属(Flavobacterium)、香味菌属 (Myroides)、杆状杆菌(Paludibacter)、细菌杆菌(Phaeodactylibacter)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、冷弯菌属 (Psychroflexus)、赖兴氏杆菌(Reichenbachiella)、里氏杆菌属 (Riemerella)或Sinomicrobium;优选地,别样杆菌属种(Alistipes sp.) ZOR0009、酿脓拟杆菌(Bacteroides pyogenes)(如Bp F0041)、拟杆菌属细菌(Bacteroidetes bacterium)(如BbGWA2_31_9)、动物溃疡伯格菌(Bergeyella zoohelcum)(如Bz ATCC 43767)、犬咬二氧化碳噬纤维菌(Capnocytophaga canimorsus)、希诺地米碳酸噬胞菌 (Capnocytophagacynodegmi)、Chryseobacterium carnipullorum、济州岛金黄杆菌(Chryseobacteriumjejuense)、嗜鳃黄杆菌(Chryseobacterium ureilyticum)、嗜分支黄杆菌(Flavobacterium branchiophilum)、柱状黄杆菌(Flavobacterium columnare)、黄杆菌属种(Flavobacterium sp.)316、 Myroides odoratimimus(如Mo CCUG 10230、Mo CCUG12901、Mo CCUG 3837)、丙酸杆菌(Paludibacter propionicigenes)、Phaeodactylibacterxiamenensis、牙龈卟啉单胞菌(Porphyromonas gingivalis)(如Pg F0185、 Pg F0568、PgJCVI SC001、Pg W4087)、马铃薯红单胞菌(Porphyromonas gulae)、卟啉单胞菌属种(Porphyromonas sp.)COT-052OH4946、树蛙普雷沃菌(Prevotella aurantiaca)、颊普雷沃菌(Prevotella buccae)(如 Pb ATCC 33574)、Prevotella falsenii、中间普雷沃菌(Prevotella intermedia) (如Pi 17,Pi ZT)、Prevotella pallens(如Pp ATCC 700821)、Prevotella pleuritidis、解糖普雷沃菌(Prevotella saccharolytica)(如Ps F0055)、普雷沃菌属种(Prevotella sp.)MA2016、普雷沃菌属种(Prevotella sp.) MSX73、普雷沃菌属种(Prevotella sp.)P4-76、普雷沃菌属种(Prevotella sp.)P5-119、普雷沃菌属种(Prevotella sp.)P5-125、普雷沃菌属种 (Prevotella sp.)P5-60、扭曲冷弯曲菌(Psychroflexus torquis)、 Reichenbachiella agariperforans、鸭疫里默氏杆菌(Riemerella anatipestifer) 或Sinomicrobium oceani。

在一些实施方式中,所述Cas13蛋白是Cas13c蛋白。

在一些实施方式中,所述Cas13c蛋白是或源于以下的种:梭杆菌属(Fusobacterium)或厌氧唾液杆菌(Anaerosalibacter);优选地,坏死梭杆菌(Fusobacterium necrophorum)(如Fn subsp.funduliforme ATCC 51357、Fn DJ-2、FnBFTR-1、Fn subsp.Funduliforme)、坏疽梭杆菌 (Fusobacterium perfoetens)(如Fp ATCC29250)、溃疡梭杆菌 (Fusobacterium ulcerans)(如Fu ATCC 49185)或厌氧唾液杆菌属种(Anaerosalibacter sp.)ND1。

在一些实施方式中,所述Cas13蛋白是Cas13d蛋白。

在一些实施方式中,所述Cas13d蛋白是或源于以下的种:优杆菌属(Eubacterium)或瘤胃球菌属(Ruminococcus),优选地,产亚硝酸真杆菌(Eubacteriumsiraeum)、黄化瘤胃球菌(Ruminococcus flavefaciens) (如Rfx XPD3002)或白色瘤胃球菌(Ruminococcus albus)。

在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的催化活性增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的催化活性降低。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的gRNA结合增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的gRNA 结合降低。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的特异性增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的特异性降低。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的稳定性增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的稳定性降低。在一些实施方式中,所述工程化CRISPR-Cas蛋白还包含使催化活性失活的一个或多个突变。在一些实施方式中,与对应的野生型CRISPR-Cas 蛋白相比,所述CRISPR-Cas蛋白的脱靶结合增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的脱靶结合降低。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的靶标结合增加。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的靶标结合降低。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,所述工程化 CRISPR-Cas蛋白具有更高蛋白酶活性或多核苷酸结合能力。在一些实施方式中,与对应的野生型CRISPR-Cas蛋白相比,PFS识别被改变。在一些实施方式中,所述工程化CRISPR-Cas蛋白还包含功能性异源结构域。在一些实施方式中,所述工程化CRISPR-Cas蛋白还包含NLS。

在另一个方面中,本公开内容提供了一个或多个HEPN结构域,且长度小于1000个氨基酸。在一些实施方式中,所述蛋白的尺寸小于950 个、小于900个、小于850个、小于800个、或小于750个氨基酸。在一些实施方式中,所述HEPN结构域包含RxxxxH基序。在一些实施方式中,所述RxxxxH基序包含R[N/H/K]X

在另一个方面中,本公开内容提供了一种多核苷酸,其编码本文的工程化CRISPR-Cas蛋白。在一些实施方式中,所述多核酸是密码子优化的。

在另一个方面中,本公开内容提供了一种CRISPR-Cas系统,其包含本文的工程化CRISPR-Cas蛋白,以及能够与所述工程化CRISPR-Cas蛋白形成复合物并能够与靶核酸序列杂交并引导所述复合物与所述靶核酸序列的序列特异性结合的核苷酸组分。

在另一个方面中,本公开内容提供了一种载体系统,其包含一个或多个载体,所述一个或多个载体包含编码所述工程化CRISPR-Cas蛋白的组分的一个或多个多核苷酸分子。

在另一个方面中,本公开内容提供了一种修饰靶核酸的方法,其包括:在包含所述靶核酸的细胞或生物体中引入本文所述工程化 CRISPR-Cas蛋白,所述多核苷酸,所述CRISPR-Cas系统,或者所述载体或载体系统,使得所述工程化CRISPR-Cas蛋白修饰在所述细胞或生物体中的所述靶核酸。

在一些实施方式中,所述工程化CRISPR-Cas系统是通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪、可植入装置或本文的载体系统递送引入。在一些实施方式中,所述工程化CRISPR-cas蛋白与一个或多个功能性结构域相关联。在一些实施方式中,所述靶核酸包含基因组基因座,并且所述工程化CRISPR-Cas蛋白改变在所述基因组基因座处编码的基因产物或所述基因产物的表达。在一些实施方式中,所述靶核酸是DNA或RNA,且其中所述靶核酸中的一个或多个核苷酸被碱基编辑。在一些实施方式中,所述靶核酸是DNA或RNA,且其中所述靶核酸被切割。在一些实施方式中,所述工程化CRISPR-Cas蛋白还切割非靶核酸。在一些实施方式中,所述方法还包括使活性可视化,以及任选地,使用可检测标记。在一些实施方式中,所述方法还包括检测所述CRISPR-Cas系统的一个或多个组分与所述靶核酸的结合。在一些实施方式中,所述细胞或生物体是原核细胞或生物体。在一些实施方式中,所述细胞或生物体是动物细胞或生物体。在一些实施方式中,所述细胞或生物体是植物细胞或生物体。

在另一个方面中,本公开内容提供了用于检测样品中的靶核酸的方法,其包括:将样品与下述接触:本文的工程化CRISPR-Cas蛋白;至少一种指导多核苷酸,其包含能够结合至所述靶核酸并被设计为与所述工程化CRISPR-Cas形成复合物的指导序列;和包含非靶序列的基于RNA 的掩蔽构建体;其中所述工程化CRISPR-Cas蛋白表现出附带RNase活性并切割所述检测构建体的所述非靶序列;和检测来自所述非靶序列的切割的信号,从而检测在所述样品中的所述靶核酸。

在一些实施方式中,所述方法还包括将所述样品与用于扩增所述靶核酸的试剂接触。在一些实施方式中,用于扩增的所述试剂包括等温扩增反应试剂。在一些实施方式中,所述等温扩增试剂包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导的等温扩增、链置换扩增、解旋酶依赖性扩增或切口酶扩增试剂。在一些实施方式中,所述靶核酸是DNA 分子,并且所述方法还包括将所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。在一些实施方式中,所述掩蔽构建体:抑制可检测阳性信号的产生直至所述掩蔽构建体被切割或失活,或者掩蔽可检测阳性信号或产生可检测阴性信号直至所述掩蔽构建体被切割或失活。

在一些实施方式中,所述掩蔽构建体包含:a.沉默RNA,其抑制由报告构建体编码的基因产物的产生,其中当表达时所述基因产物产生所述可检测阳性信号;b.核酶,其产生所述可检测阴性信号,并且其中当所述核酶失活时产生所述阳性可检测信号;c.核酶,其将底物转化为第一颜色,并且其中当所述核酶失活时所述底物转化为第二颜色;d.适体和/或包含多核苷酸栓系的抑制剂;e.多核苷酸,其附着有可检测配体和掩蔽组分;f.通过桥分子保持在聚集体中的纳米颗粒,其中至少一部分的所述桥分子包含多核苷酸,并且其中当所述纳米颗粒被支付在溶液中时所述溶液经历色移;g.通过连接分子连接至一个或多个淬灭剂分子的量子点或荧光团,其中至少一部分的所述连接分子包含多核苷酸;h.与嵌入剂复合的多核苷酸,其中在切割所述多核苷酸后所述嵌入剂改变吸光度;或者1.通过多核苷酸栓系的两个荧光团,其当从所述多核苷酸释放时经历荧光移位。

在一些实施方式中,所述适体a.包含螯合酶的多核苷酸栓系的抑制剂,其中在通过作用于底物而从所述适体或多核苷酸栓系的抑制剂释放后所述酶产生可检测信号;或者b.是抑制性适体,其抑制酶并阻止酶催化底物产生可检测信号,或其中所述多核苷酸栓系的抑制剂抑制酶并阻止酶催化底物产生可检测信号;或者c.螯合一对试剂,所述试剂当从所述适体释放时组合以产生可检测信号。在一些实施方式中,所述纳米颗粒是胶体金属。在一些实施方式中,所述至少一个指导多核苷酸包含错配。在一些实施方式中,所述错配是在所述一个或多个指导序列上的单核苷酸改变的上游或下游。

在另一个方面中,本公开内容提供了一种细胞或生物体,其包含本文的工程化CRISPR-Cas蛋白,本文的多核酸,本文的CRISPR-Cas系统或者本文的载体或载体系统。

在另一个方面中,本公开内容提供了一种工程化腺苷脱氨酶,其包含一个或多个突变,其中所述工程化腺苷脱氨酶具有胞苷脱氨酶活性。

在一些实施方式中,所述工程化腺苷脱氨酶具有胞苷脱氨酶活性。在一些实施方式中,所述工程化腺苷脱氨酶是融合蛋白的一部分。在一些实施方式中,所述融合蛋白包含功能性结构域。在一些实施方式中,所述功能性结构域能够引导所述工程化腺苷脱氨酶结合至靶核酸。在一些实施方式中,所述功能性结构域是本文的CRISPR-Cas蛋白。在一些实施方式中,所述CRISPR-Cas蛋白是死形式的CRISPR-Cas蛋白或 CRISPR-Cas切口酶蛋白。在一些实施方式中,基于hADAR2-D的氨基酸序列位置,所述一个或多个突变包含:E488Q、V351G、S486A、T375S、 S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、 V440I、S495N、K418E、S661T,以及在同源ADAR蛋白中的相应突变。在一些实施方式中,基于hADAR2-D的氨基酸序列位置,所述一个或多个突变包含:E488Q、V351G、S486A、T375S、S370C、P462A、N597I、 L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E 和S661T,以及在同源ADAR蛋白中的相应突变。

在另一个方面中,本公开内容提供了一种多核苷酸,其编码所述的工程化腺苷脱氨酶或其催化结构域。在另一个方面中,本公开内容提供了包括多核苷酸。

在另一个方面中,本公开内容提供了一种药物组合物,其包含配制成用于通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪或可植入装置递送的所述工程化腺苷脱氨酶或其催化结构域。

在另一个方面中,本公开内容提供了一种工程化细胞,其表达所述工程化腺苷脱氨酶或其催化结构域。在一些实施方式中,所述细胞瞬时表达所述工程化腺苷脱氨酶或其催化结构域。在一些实施方式中,所述细胞非瞬时表达所述工程化腺苷脱氨酶或其催化结构域。

另一个方面,本公开内容提供了一种用于在靶核酸中修饰核苷酸的工程化、非天然存在的系统,其包含:a)死CRISPR-Cas或CRISPR-Cas 切口酶蛋白,或者编码所述死Cas或Cas切口酶蛋白的核苷酸序列;b) 指导分子,其包含与靶序列杂交并设计为与所述死CRISPR-Cas或 CRISPR-Cas切口酶蛋白形成复合物的指导序列;和c)核苷酸脱氨酶蛋白或其催化结构域,或者编码所述核苷酸脱氨酶蛋白或其催化结构域的核苷酸序列,其中所述核苷酸脱氨酶蛋白或其催化结构域共价或非共价连接至所述死CRISPR-Cas或CRISPR-Cas切口酶蛋白,或者所述指导分子适于在递送后与其连接。

在一些实施方式中,所述腺苷脱氨酶蛋白或其催化结构域基于 hADAR2-D的氨基酸序列位置包含突变E488Q、V351G、S486A、T375S、 S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T中的一个或多个,以及以及在同源ADAR 蛋白中的相应突变。在一些实施方式中,所述腺苷脱氨酶蛋白或其催化结构域基于hADAR2-D的氨基酸序列位置包含突变:E488Q、V351G、 S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、 D619G、S582T、V440I、S495N、K418E和S661T,以及在同源ADAR蛋白中的相应突变。

在一些实施方式中,所述CRISPR-Cas蛋白是Cas9、Cas12、Cas13、 Cas 14、CasX或CasY。在一些实施方式中,所述CRISPR-Cas蛋白是 Cas13b。在一些实施方式中,所述CRISPR-Cas蛋白是Cas13b-t1、 Cas13b-t2或Cas13b-t3。在一些实施方式中,所述CRISPR-Cas是工程化 CRISPR-Cas蛋白。

在另一个方面中,本公开内容提供了一种用于在靶核酸中修饰核苷酸的方法,其包括:将所述工程化腺苷脱氨酶或所述系统递送至所述靶核酸,其中所述脱氨酶使在所述靶核酸上的一个或多个靶基因座处的核苷酸脱氨基。

在一些实施方式中,所述核苷酸脱氨酶蛋白或其催化结构域已被修饰以增加对DNA-RNA异源双链体的活性。在一些实施方式中,所述核苷酸脱氨酶蛋白或其催化结构域已被修饰以降低脱靶效应。在一些实施方式中,所述靶核酸在细胞内。在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,所述细胞是非人动物细胞。在一些实施方式中,所述细胞是人细胞。在一些实施方式中,所述细胞是植物细胞。在一些实施方式中,所述靶核酸在动物内。在一些实施方式中,所述靶核酸在植物内。在一些实施方式中,所述靶核酸在体外包含在DNA分子中。在一些实施方式中,所述工程化腺苷脱氨酶或者所述系统的一种或多种组分作为核糖核蛋白复合物递送到所述细胞中。在一些实施方式中,所述工程化腺苷脱氨酶或者所述系统的一种或多种组分通过一种或多种颗粒、一种或多种囊泡或者一种或多种病毒载体递送。在一些实施方式中,所述一种或多种颗粒包含脂质、糖、金属或蛋白。在一些实施方式中,所述一种或多种颗粒包括脂质纳米颗粒。在一些实施方式中,所述一种或多种囊泡包括外泌体或脂质体。在一些实施方式中,所述一种或多种病毒载体包括一种或多种腺病毒载体,一种或多种慢病毒载体或者一种或多种腺相关病毒载体。在一些实施方式中,所述方法通过在感兴趣的基因组基因座处操纵一个或多个靶序列来修饰细胞、细胞系或生物体。在一些实施方式中,在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用治疗由G→A或C→T点突变或病原性SNP引起的疾病。在一些实施方式中,所述疾病选自癌症、血友病、β地中海贫血,马凡氏综合征和维斯科特-奥尔德里奇综合征。在一些实施方式中,在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用治疗由T→C或A→G点突变或病原性SNP引起的疾病。在一些实施方式中,在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用使在所述靶基因座处的靶基因失活。在一些实施方式中,通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪、可植入装置或所述载体系统递送所述工程化腺苷脱氨酶或者所述系统的一种或多种组分。在一些实施方式中,所述核苷酸的修饰改变在所述靶基因座处编码的基因产物或所述基因产物的表达。

结合以下对所说明的示例性实施方式的详细说明,示例性实施方式的这些和其他方面、目的、特征和优点对于本领域普通技术人员而言将变得显而易见。

附图说明

通过参考对说明性实施方式进行阐述的以下详细说明,将获得对本发明的特征和优点的更好理解,在这些实施方式中利用了本发明的原理,并且在这些附图中:

图1A-1D。PbuCas13b-crRNA二元复合物的晶体结构。(图1A) PbuCas13b的线性结构域组织。活性位点的位置用星号表示。(图1B) 与PbuCas13b复合的crRNA发夹。(图1C)PbuCas13b的总体结构。两个视图彼此旋转180度。结构域的颜色与线性结构域图一致。crRNA涂成红色。(图1D)PbuCas13b的空间填充模型,每个视图彼此旋转180 度。

图2A-2E。PbuCas13b crRNA识别。(图2A)PbCas13b crRNA的图 (SEQ ID NO:1)。正向重复残基涂成红色,间隔子残基的颜色为浅蓝色。 (图2B)接近K393的crRNA的3’末端位置和PbuCas13b内的配位残基。 (图2C)在PbuCas13b复合物内crRNA的结构。颜色与嵌板一致(图 2A)。(图2D)碱基识别交换。上图,核酸酶活性;下图,热稳定性。散列填充表示野生型碱基识别。(图2E)PbuCas13b内配位和处理crRNA 的盖结构域残基的诱变。上图,SHERLOCK反应中的RNase活性;下图, crRNA处理。切割条带和预期大小用红色标记物表示,带有大小的梯形显示在左侧。

图3。PbuCas13b和crRNA(SEQ ID NO:2)之间的分子间接触的示意图。

图4A-4C。PbuCas13b与LshCas13a结构和活性位点的比较。(图 4A)PbuCas13b和LshCas13a(pdb 5wtk)的结构域组织的线性比较。crRNA 显示在右侧。(图4B)PbuCas13b的两个视图旋转90度。插图按与(图 4C)相同的方向放大了活性位点的残基。(图4C)LshCas13a的颜色与 (图4A)一致。标记同源残基。

图5A-5H。PbuCas13b的位点定向诱变;在哺乳动物细胞中的RNA 干扰。(图5A)所有all PbuCas13b位点定向突变对哺乳动物比中RNA 干扰的影响。最强的干扰敲低用浅蓝色表示。(图5B)带有标记的强突变的PbuCas13b,并用红色表示。(图5C-5H)按区域分隔的突变。

图6A-6D。(图6A)PbuCas13b的表面静电。(图6B)从图A旋转180度的PbuCas13b的表面静电。(图6C)除去盖结构域的PbuCas13b 的表面静电,显示了内部带正电的通道。(图6D)推定crRAN处理活性位点的表面静电。

图7。pgCas13b C末端截短的REPAIR测定。

图8A-8G。(图8A)PbuCas13b正向重复结构。(图8B)理想的A 型RNA。(图8C)正向重复碱基对和二级结构(SEQ ID NO:3)的图。 (图8D)多重一。(图8E)多重二。(图8F)多重三。(图8G)PbuCas13b 正向重复序列(SEQ ID NO:4-9)的比对。星号表示保守的核苷酸。

图9。带有突变的crRNA的PbuCas13的切割活性,以及crRNA突变体的热稳定性的扩展数据。

图10A-10D。(图10A)用于处理测定的crRNA底物的示意图(SEQ ID NO:10-11)。(图10B)显示未处理的互补DR的凝胶。(图10C) PbuCas13b突变体的crRNA处理。(图10D)测量一般RNase活性的 SHERLOCK测定。

图11A-11C。使用底物RNA和镁离子的PbuCas13b的熔解曲线。(图 11A)RNA底物对PbuCas13b热稳定性的影响。(图11B)PbuCas13b RNA 切割和热稳定性的影响。(图11C)镁对PbuCas13b热稳定性的影响。

图12。PbuCas13b与RNA底物的有限蛋白水解作用。PbuCas13b的有限蛋白水解作用。T=胰蛋白酶,C=糜蛋白酶,P=胃蛋白酶

图13A-13C。Cas13b桥螺旋。(图13A)带有桥螺旋的Cas13b用红色突出显示。RNA用粉色表示。(图13B)带有桥螺旋的Cas12(Cpf1) 用青色突出显示。RNA用浅蓝色表示,DNA用深蓝色表示。(图13C) 来自PbuCas13b和LbCas12的桥螺旋的人工序列比对(SEQ ID NO:12-13)。

图14。所有Cas13b家族成员的Cas13b邻接树。插图,具有PbuCas13b 的Cas13b子集(粗体)。

图15。Cas13b亚组的基于结构的比对(SEQ ID NO:14-22)。

图16。所有Cas13bs的基于结构的比对(SEQ ID NO:23-37)。

图17A-17D。图中显示了所有凝胶的未裁剪图像。(图17A)crRNA 处理凝胶1。(图17B)crRNA处理凝胶2。(图17C)crRNA处理凝胶 3。(图17D)有限的蛋白水解凝胶。

图18。PbuCas13b晶体结构的分组拓扑图。

图19显示了一个pymol文件,该文件显示了Cas13b活性位点中配位核苷酸的位置。

图20显示了一个示例性RNA环延伸。

图21显示了示例性融合点,核苷酸脱氨酶通过其连接至Cas13b。

图22显示了RESCUE v9突变的筛选。

图23显示了RESCUEv9对T翻转指导的作用的验证。

图24显示了RESCUEv9对C翻转指导的作用的验证。

图25显示了在内源性靶向方面RESCUEv9的性能。

图26显示了RESCUE v10突变的筛选。

图27显示了用于C翻转的30bp指导的检测结果。

图28显示了来自使用RESCUE v1至v8在Cas13b6和Cas13b12之间比较的Gluc/Cluc结果。

图29显示了来自使用RESCUE v1至v8在Cas13b6和Cas13b12之间比较的组分编辑结果。

图30显示了来自使用RESCUEv8在Cas13b6和Cas13b12之间比较的对内源性靶向(T翻转)的影响的结果。

图31显示了RESCUE对碱基转换的作用。

图32显示了CCN的3’基序靶向的检测结果。

图33A显示了具有与ADAR融合的dCas13b的构建体的示意图。图 33B显示了构建体的检测结果。

图34显示了N末端标签和接头的测序。

图35显示了脱靶的定量。

图36显示了脱靶编辑的测试。

图37显示了具有(GGS)2/Q507R的内源性基因靶点的检测结果。

图38和图39显示了在(GGS)2/Q507R上的突变的eGFP筛选。

图40A显示了具有Cas13b截短的构建体。图40B显示了构建体的检测结果。

图41显示了用于筛选的多道开关靶点指导(SEQ ID NO:38-39)。

图42A-42E显示了在RESCUEv10上的验证检测。图42A显示了 RESCUEv10的验证(第50、52轮)。图42B显示了RESCUEv10的验证(第53、54轮)。图42C显示了RESCUEv10的验证(第58轮)。图42D显示了RESCUEv10的验证(第59轮)。图42E显示了RESCUEv10 的验证(第61轮)。

图43显示了RESCUEv10的NGS分析。

图44显示了已鉴定的提高特异性的突变。

图45显示了RESCUE对内源性靶向(C翻转和T翻转)结果的影响。

图46显示了使用RESCUE v6和v9靶向β-连环蛋白。

图47显示了新的β-连环蛋白分泌的Gluc/Cluc报告基因。

图48显示了RESCUEv10靶向β-连环蛋白的结果。

图49显示了RESCUEv10靶向ApoE4。

图50显示了能够使用RESCUE产生的在PCSK9中的示例性突变。

图51显示了来自Cas13b-t1对哺乳动物细胞中Gluc敲低的结果。

图52显示了来自Cas13b-t2对哺乳动物细胞中Gluc敲低的结果。

图53显示了来自Cas13b-t3对哺乳动物细胞中Gluc敲低的结果。

图54A-54C显示了Cas13b-t1、Cas13b-t2和Cas13b-t3的基因座。

图55A-55C显示了Cas13b-t1、Cas13b-t2和Cas13b-t3(SEQ ID NO: 40-45)的基因座上的更多细节。

图56显示了Cas13b-t1、Cas13b-t2和Cas13b-t3与其他Cas13b直系同源物(SEQ IDNO:46-64)的比对。

图57显示了筛选的RESCUE突变的总结。

图58是说明选择更好的β-连环蛋白突变体的实验结果的图。

图59显示了说明RESCUE第12轮结果的图。

图60是说明β-连环蛋白迁移测定的示意图。

图61是显示由β-连环蛋白诱导的细胞迁移测定结果的图。

图62显示了说明特异性突变消除A-I脱靶的图。

图63显示了说明靶向Stat1/3磷酸化位点降低信号传导的图。

图64显示了说明靶向Stat1/3磷酸化位点降低信号传导的图(STAT1 未处理(左图)和STAT1 IFNγ处理(右图))。

图65显示了说明靶向Stat1/3磷酸化位点降低信号传导的图,其中图65A显示了STAT3 IL6活化的结果和图65B显示了STAT3未处理的结果。

图66显示了说明RESCUE第12轮结果的图。

图67显示了说明可能的RESCUE第13轮结果的图。

图68是显示由β-连环蛋白诱导的细胞迁移测定结果的图。

图69显示了说明对Gluc敲低的死的和活的微小直系同源物比较结果的图。

图70显示了说明Cas13b-t1的检测功能的图。

图71显示了说明Cas13b-t3的检测功能的图。

图72显示了说明指导、非靶向比较的图。

图73A-73G:针对胞苷脱氨的ADAR2脱氨酶结构域的定向进化。 (图73A)定向进化方法的示意图,包括合理诱变、酵母筛选,以及活性哺乳动物细胞验证。(图73B)RESCUE版本0-16在胞苷上的活性,其侧翼是Gluc转录物上的5’U和C’G。左图:报告了RESCUEv0-v16 的荧光素酶报告基因活性。右图:报告了RESCUEv0-v16的编辑水平百分比。(图73C)热图描述了在胞苷上RESCUEv0-v16的编辑水平百分比,其侧翼是在Gluc转录物上的不同碱基。(图73D)在转染的RESCUE 质粒水平不同的情况下,在胞苷上RESCUEv0-v16的编辑水平百分比,其侧翼是Gluc转录物上的5’U和C’G。(图73E)RESCUEv16和RESCUEv8对Gluc转录物上所有可能的16个胞苷侧翼碱基基序的编辑活性。使用具有来自靶胞苷的T翻转或C翻转的指导设计。(图73F) 将通过RESCUEv16进行的胞苷脱氨与使用指导RNA以及ADAR2dd、全长ADAR2或无蛋白的编辑进行比较。(图73G)还显示了在催化脱氨位点处突变体的放大晶体结构图,所述催化脱氨位点具有带有翻转碱基的RNA。

图74A-74G:通过RESCUE对内源性和疾病相关靶点的C到U编辑。 (图74A)RESCUEv16在覆盖多个基序的一组内源性基因上的编辑效率。 (图74B)描述在一组三个内源性基因上的RESCUE版本v0-v16的编辑效率的热图。(图74C)RESCUEv16在一组相关T>C疾病突变的合成版本上的编辑效率。(图74D)使用前crRNA指导阵列对C到U和A 到I进行多重编辑的示意图。(图74E)在β-连环蛋白转录物上同时进行C到U和A到I的编辑。(图74F)通过引入不利的碱基翻转(SEQ ID NO:65-66),合理防止相邻腺苷位点的脱靶活性的示意图。(图74G) 使用合理引入不利的碱基翻转的高斯荧光素酶(左图)和KRAS(右图) 的中靶C和脱靶A位点的编辑百分比。

图75A-75F:RESCUEv16的转录组范围特异性。(图75A)RESCUE v16和B6-REPAIRv1、B12-REPAIRv1和B12-REPAIRv2的中靶C到U 编辑以及C到U和A到I的转录组范围脱靶的总结。(图75B) RESCUEv16 A到I和C到U脱靶的Manhattan曲线。中靶C到U编辑以橙色突出显示。(图75C)ADAR2dd残基和双链RNA底物之间相互作用的示意图,在用于提高特异性的诱变筛选中使用的残基以红色突出显示(SEQ ID NO:67-68)。(图75D)针对RESCUEv16和95RESCUEv16 突变体显示了具有靶向指导(y轴)的C到U活性和具有非靶向指导(x 轴)A到I活性的荧光素酶值。以蓝色突出显示的突变体具有有效靶向的C到U活性,但失去了其残留的A到I活性,表明A到I的特异性得到了改善。(图75E)RESCUE v16和最高特异性突变体的中靶C到U 编辑以及C到U和A到I的转录组范围脱靶的总结。(图75F) RESCUEv16(+S375A)A到I和C到U脱靶的Manhattan曲线(SEQ ID NO:65-66)。中靶C到U编辑以橙色突出显示。

图76A-76H:针对细胞生长和信号传导的由C到U RNA编辑导向的表型结局。(图76A)靶向STAT3磷酸化残基以改变相关信号通路的 RNA示意图(SEQ ID NO:69-74)。(图76B)RESCUEv16在STAT3 (左图)和STAT1(右图)中相关磷酸化残基的编辑百分比。(图76C)如通过STAT驱动荧光素酶表达所测量的,通过RNA编辑的STAT3(左图)和STAT1(右图)信号传导的抑制。(图76D)靶向CTNNB1磷酸化残基以促进稳定化的RNA示意图(SEQ ID NO:75-77)。(图76E) 通过RESCUE编辑磷酸化残基激活β-连环蛋白,导致细胞生长增加的示意图。(图76F)RESCUEv16在CTNNB1中相关磷酸化残基的编辑百分比。(图76G)如通过CTNNB1驱动(TCF/LEF)荧光素酶表达所测量的,通过RNA编辑的CTNNB1信号传导的活化。(图76H)通过RNA 编辑的CTNNB1信号传导活化导致的细胞生长的定量。

图77A-77B:筛选失活的Gluc突变,以产生胞苷脱氨荧光素酶报告基因。(图77A)此前显示出对荧光素酶活性的某些影响[引用Gluc论文] 的一组各种Gluc突变体的荧光素酶活性。值表示平均值+/–S.E.M(n= 3)。(图77B)一组亮氨酸到脯氨酸Gluc突变体的荧光素酶活性。关注了亮氨酸到脯氨酸突变体报告基因,因为其产生了用于胞苷脱氨的 CCN基序位点(中央C被脱氨)。这允许测定所有四个CCN基序对 RESCUE脱氨活性的影响。值表示平均值+/–S.E.M(n=3)。

图78:在Gluc中CCG、ACG、GCG、CCA和CCU位点上 RESCUEv0-v16的胞苷脱氨活性。值表示平均值+/–S.E.M(n=3)。

图79A-79B:各种量的RESCUEv0-16的胞苷脱氨活性。(图78A) 如通过在Gluc转录物的UCG位点上荧光素酶活性的恢复所测量的, RESCUEv0-v16活性的剂量应答。值表示三次重复的平均值。(图78B) 如通过在CTNNB1转录物的T41I位点上荧光素酶活性的恢复所测量的, RESCUEv0-v16活性的剂量应答。值表示三次重复的平均值。

图80:RESCUEv6-v9以不同的指导和RESCUE质粒量对Gluc转录物中的UCG位点进行编辑的百分比。值表示平均值+/–S.E.M(n=3)。

图81:使用具有G或A错配指导,用RESCUEv16和v8,对具有 16个可能的5’和3’碱基组合的Gluc位点的编辑百分比。值表示平均值 +/–S.E.M(n=3)。

图82:使用不同U错配位置的指导RNA在Gluc转录物中的UCG 位点上的RESCUEv1和RESCUEv2-v8的编辑百分比。将RESCUE版本与RanCas13b和PspCas13b两者进行比较。值表示平均值+/–S.E.M(n= 3)。20/22表示针对RanCas13b的错配距离是20和针对PspCas13b的错配距离是22。

图83:使用具有不同U错配位置的30bp和50bp指导在Gluc转录物中的UCG位点上的RESCUEv16的编辑百分比。值表示平均值+/– S.E.M(n=3)。

图84A-84D:用于定向进化的各种酵母报告基因的编辑速率。(图 84A)通过具有靶向和非靶向指导的RESCUEv3、v7和v16的GFP突变 Y66H的荧光校正百分比。通过对10,000个细胞进行流式细胞术来测量荧光。(图84B)通过具有靶向和非靶向指导的RESCUEv3、v7和v16 的GFP突变Y66H的编辑校正百分比。值表示平均值+/–S.E.M(n=3)。 (图84C)通过具有靶向和非靶向指导的RESCUEv7和v16的HIS3突变P196L的编辑校正百分比。值表示平均值+/–S.E.M(n=3)。(图84D) 通过具有靶向和非靶向指导的RESCUEv7和v16的HIS3突变S129P的编辑校正百分比。值表示平均值+/–S.E.M(n=3)。

图85A-85B:使用重组蛋白的含RESCUEv2突变的ADAR2脱氨结构域的生物化学脱氨活性。(图85A)包含RESCUEv2突变的ADAR2 脱氨酶结构域蛋白的腺苷脱氨活性,其中22bp双链RNA底物包含与胞苷错配的中心腺苷。将反应孵育不同时间点,并且具有和不具有脱氨酶结构域。(图85B)包含RESCUEv2突变的ADAR2脱氨酶结构域蛋白的胞苷脱氨活性,其中22bp双链RNA底物包含与尿苷错配的中心胞苷。将反应孵育不同时间点,并且具有和不具有脱氨酶结构域。将反应孵育不同时间点,并且具有和不具有脱氨酶结构域。

图86A-86E:RESCUEv16、全长ADAR2(具有RESCUEv16突变)、 ADAR2脱氨酶结构域(具有RESCUEv16突变)和不含任何蛋白的胞苷脱氨酶活性比较。(图86A)在具有不同5’碱基的Gluc转录物中某一位点的编辑百分比,所述不同5’碱基具有靶向指导以及RESCUEv16、全长 ADAR2(具有RESCUEv16突变)、ADAR2脱氨酶结构域(具有 RESCUEv16突变)和无蛋白。值表示平均值+/–S.E.M(n=3)。(图 86B)在具有不同5’碱基的Gluc转录物中某一位点的编辑百分比,所述不同5’碱基具有非靶向指导以及RESCUEv16、全长ADAR2(具有 RESCUEv16突变)、ADAR2脱氨酶结构域(具有RESCUEv16突变) 和无蛋白。值表示平均值+/–S.E.M(n=3)。(图86C)在具有RESCUEv16 和指导RNA的Gluc转录物中UCG位点的编辑,所述指导RNA含有不同错配位置。值表示平均值+/–S.E.M(n=3)。(图86D)在具有全长 ADAR2(具有RESCUEv16突变)和指导RNA的Gluc转录物中UCG位点的编辑,所述指导RNA含有不同错配位置。值表示平均值+/–S.E.M (n=3)。(图86E)在具有ADAR2脱氨酶结构域(具有RESCUEv16 突变)和指导RNA的Gluc转录物中UCG位点的编辑,所述指导RNA 含有不同错配位置。值表示平均值+/–S.E.M(n=3)。

图87A-87C:错配位置平铺,以发现在内源性靶位点上针对 RESCUEv16的最佳编辑指导设计。(图87A)具有不同碱基基序的内源性靶位点的编辑百分比,所述碱基基序具有RESCUEv16和在位置7、9、 11和13具有错配的指导和U型碱基翻转。值表示平均值+/–S.E.M(n= 3)。(图87B)具有不同碱基基序的内源性靶位点的编辑百分比,所述碱基基序具有RESCUEv16和在位置7、9、11和13具有错配的指导和C 型碱基翻转。值表示平均值+/–S.E.M(n=3)。(图87C)具有不同碱基基序的内源性靶位点的编辑百分比,所述碱基基序具有RESCUEv16 和在位置3、5、7、9和11具有错配的指导和C型和U型碱基翻转。值表示平均值+/–S.E.M(n=3)。

图88:如通过在KRAS位点的编辑百分比所测量的,各种量的RESCUEv0-16的胞苷脱氨活性。值表示三次重复的平均值。

图89:使用RESCUEv16和具有不同错配位置的指导在合成报告基因上各种与疾病相关的图标的编辑百分比。值表示平均值+/–S.E.M(n= 3)。

图90:使用RESCUEv16和具有不同C型和U型错配位置的指导在两个ApoE4胞苷(rs429358和rs7412)处的编辑百分比。值表示平均值 +/–S.E.M(n=3)。

图91A-91C:在指导双链体窗的RESCUE版本的特异性。(图91A) 高斯荧光素酶突变体C82R的编辑位点的示意图,其中靶向的C以红色突出显示,以及对附近的腺苷碱基编号并用灰色突出显示。(图91B) 在高斯荧光素酶突变体C82R中在附近腺苷碱基处的编辑百分比,其是由RESCUEv0、RESCUEv8和RESCUEv16靶向的。(图91C)通过改变 RESCUEv0-v16的量,在腺苷20处,腺苷向鸟苷的编辑百分比。值表示三次重复的平均值。

图92A-92D:RESCUEv0-v16和RESCUEv16S的腺苷脱氨酶活性。 (图92A)使用靶向指导RNA,利用RESCUEv0-v16和RESCUEv16S,通过Gluc转录物的腺苷脱氨的荧光素酶校正。值表示平均值+/–S.E.M(n =3)。(图92B)使用非靶向指导RNA,利用RESCUEv0-v16和RESCUEv16S,通过Gluc转录物的腺苷脱氨的荧光素酶校正。值表示平均值+/–S.E.M(n=3)。(图92C)使用靶向指导RNA,利用RESCUEv0-v16 和RESCUEv16S,Gluc转录物的腺苷向肌苷的编辑百分比。值表示平均值+/–S.E.M(n=3)。(图92D)使用非靶向指导RNA,利用RESCUEv0-v16 和RESCUEv16S,Gluc转录物的腺苷向肌苷的编辑百分比。值表示平均值+/–S.E.M(n=3)。

图93A-93C:使用不同量的RESCUEv0-16和RESCUEv16S,在β- 连环蛋白靶位点上的胞苷脱氨活性和脱靶活性。(图93A)CTNNB1 T41I 的编辑位点的示意图,其中靶向的C以红色突出显示,以及附近脱靶腺苷碱基用灰色突出显示。(图93B)使用不同量的RESCUEv0-16和 RESCUEv16S,胞苷向尿苷(T41A)的编辑百分比。值表示三次重复的平均值。(图93C)使用不同量的RESCUEv0-16和RESCUEv16S,在脱靶腺苷处的腺苷向鸟苷的编辑百分比。值表示三次重复的平均值。

图94A-94E:在内源性靶点上RESCUEv16和RESCUEv16S的中靶和脱靶编辑。(图94A)使用RESCUEv16和RESCUEv16S,具有不同碱基基序的内源性靶位点的编辑百分比。值表示平均值+/–S.E.M(n=3)。 (图94B)使用RESCUEv16和RESCUEv16S靶向,在NRAS I21I中,在邻近腺苷碱基处的编辑百分比。(图94C)使用RESCUEv16和 RESCUEv16S靶向,在NF2 T21M中,在邻近腺苷碱基处的编辑百分比。 (图94D)使用RESCUEv16和RESCUEv16S靶向,在RAF1 P30S中,在邻近腺苷碱基处的编辑百分比。(图94E)使用RESCUEv16和 RESCUEv16S靶向,在CTNNB1 P44S中,在邻近腺苷碱基处的编辑百分比。

图95A-95B:RESCUE启用的氨基酸变化的总结。(图97A)通过 RESCUE使用胞苷脱氨可能的氨基酸转化。(图97B)显示通过RESCUE 的所有潜在氨基酸改变的可能性的密码子表。

图96:RESCUE v16S能够有效编辑内源性基因。

图97:RESCUE v16S保持一些A至I活性。

图98:将RESCUE v16用于靶向STAT,以减少INFγ/IL6诱导。

图99A-99B:RESCUE靶向诱导细胞生长。

图100:显示示例性转录追踪方法的示意图。

图101显示了根据本文一些实施方式的可编程的胞苷向尿苷转化的示例性系统和方法。

图102显示了根据本文一些实施方式的使用碱基编辑物校正突变和/ 或靶向翻译后信号传导或催化的示例性方法。

图103A-103E:在报告基因和内源性转录物中用于胞苷脱氨的 ADAR2脱氨酶结构域的进化。图103A。高斯荧光素酶报告基因转录物 (SEQ ID NO:712-714)的催化残基突变体(C82R)的RNA靶向的示意图。图103B。描述在胞苷上RESCUEr0-r16的编辑水平百分比的热图,胞苷的侧翼为在Gluc转录物上的各种碱基。有利性更高的编辑基序显示在上部,而有利性更低的基序(5’C)显示在下部。图103C。在具有U 型翻转或C翻转指导的Gluc转录物上在所有可能的16个胞苷侧翼碱基基序上RESCUE的编辑活性。图103D。RESCUE、ADAR2dd(不具有Cas13)、全长ADAR2(不具有Cas13)或无蛋白之间的活性比较。图 103E。在覆盖多个基序的一组内源性基因上RESCUE的编辑有效性。图 125中显示了整个指导嵌板中所示的针对每个位点的最佳指导。

图104A-104F:在细胞生长和信号传导上RESCUE的表型结局。图 104A。b-连环蛋白结构域和RESCUE靶向引导(SEQ ID NO:715-717) 的示意图。图104B。通过RESCUE编辑的b-连环蛋白活化和细胞生长的示意图。图104C。在CTNNB1转录物中在相关位置RESCUE的编辑百分比。图104D。如通过b-连环蛋白驱动(TCF/LEF)荧光素酶表达所测量的,通过RNA编辑的Wnt/b-连环蛋白的活化。图104E。在HEK293FT 细胞中RESCUE CTNNB1靶向和非靶向指导的代表性显微图像。图 104F。由于在HEK293FT细胞中通过RNA编辑的CTNNB1信号传导活化的胞内生长的定量。

图105A-105D:通过指导体工程化进行的RESCUE和REPAIR多路复用和特异性增强。图105A。使用前-crRNA指导阵列进行的多路复用C 到U和A到I编辑的示意图。图105B。在CTNNB1转录物上同时进行的C到U和A到I编辑。图105C。具有鸟苷碱基翻转以防止在相邻腺苷位点处的脱靶活性的合理工程化示意图(SEQ ID NO:718-719)。图 105D。使用合理引入不利的碱基翻转,针对高斯荧光素酶(左图)和KRAS (右图),在中靶C和脱靶A位点处的编辑百分比。

图106A-106G:RESCUE的全转录组特异性。图106A。与REPAIR 相比,针对RESCUE的中靶C到U编辑以及C到U和A到I全转录组脱靶的总结。图106B。RESCUE A到I(左图)和C到U(右图)脱靶的Manhattan曲线。中靶C到U编辑用橙色突出显示。图106C。ADAR2dd 残基以及双链RNA底物之间的相互作用的示意图,用红色突出显示针对改善特异性的诱变筛选中使用的残基(SEQ ID NO:720-721)。图106D。针对RESCUE和95RESCUE突变体显示的,针对具有靶向指导(y轴) 的C到U活性以及具有非靶向指导(x轴)的A到I活性的荧光素酶值。以蓝色突出显示的突变体具有更高的特异性,并保持C到U的活性。 RESCUE以红色突出显示。产生REPAIRv2的T375G突变以橙色显示。图106E。RESCUE、REPAIR和最高特异性突变体的中靶C到U编辑,以及C到U和A到I全转录组脱靶的总结。图106F。RESCUE-S(+S375A) A到I(左图)和C到U(右图)脱靶的Manhattan曲线。中靶C到U 编辑以橙色突出显示。图106G。针对RESCUE(上图)和RESCUE-S(下图)在中靶Gluc编辑位点(蓝色三角形)周围的代表性RNA测序读数。 A到I编辑以红色突出显示;C到U(T)编辑以蓝色突出显示;测序错误以黄色突出显示(SEQ IDNO:722-767)。

图107A-107B:靶向RNA胞苷到尿苷编辑使得能够实现新的碱基转换。图107A。通过RESCUE使用胞苷脱氨基化的可能氨基酸转换,具有相应的翻译后修饰和生物学活性。图107B。定向进化方法的示意图,包括合理诱变、酵母筛选,以及活性的哺乳动物细胞验证。合理诱变始于靶向已知与RNA底物接触的残基,如在来源于ADAR2dd(23)的晶体结构的上部示意图所示的。使用饱和诱变靶向的残基以红色突出显示。对于定向进化,使用HIS3生长报告基因以使得能够在酵母中使用C到U 编辑和HIS3基因恢复来进行ADAR2dd突变体的阳性选择。针对C到U 编辑活性在哺乳动物细胞中评价每轮酵母进化的排在前面的突变体,然后将排在前面的突变体用于下一轮的酵母进化。

图108。比较使用靶向和非靶向指导的在酵母中的 RanCas13b-REPAIR和PspCas13b-REPAIR腺苷脱氨基化活性。在EGPF 中Y66H突变的A到I校正恢复GFP荧光,并通过流式细胞术进行测量。由于使用来自鸭疫里默氏杆菌(Riemerella anatipestifer)的催化失活 Cas13b直系同源物(dRanCas13b)的REPAIR比使用来自普雷沃菌属种 (Prevotellasp.)P5-125的催化失活Cas13b直系同源物(dPspCas13b) 的REPAIR更有效,我们开始使用dRanCas13b-ADAR2dd融合蛋白开发RESCUE。

图109A-109B:用于产生胞嘧啶脱氨基化荧光素酶报告基因的失活 Gluc突变的筛选。图109A。此前显示对荧光素酶活性具有一定影响的一组各种各样的Gluc突变体的荧光素酶活性(33)。值表示平均值+/–S.E.M (n=3)。图109B。一组亮氨酸到脯氨酸Gluc突变体的荧光素酶活性。关注亮氨酸到脯氨酸突变体报告基因是因为其产生了针对胞苷脱氨基化的CCN基序位点(中央C是脱氨基化的)。这允许测定所有四种CCN 基序对RESCUE脱氨基化活性的影响。值表示平均值+/–S.E.M(n=3); WT,野生型Gluc序列。

图110。在Gluc中UCG、CCG、ACG、GCG、CCA和CCU位点上 RESCUEr0-r16的胞苷脱氨基化活性。值表示平均值+/–S.E.M(n=3)。

图111A-111C:不同量的RESCUEr0-r16的胞苷脱氨基化活性。图 111A。RESCUEr0-r16活性的剂量应答,通过在Gluc转录物中UCG位点上的荧光素酶活性的恢复来测量。值表示三次重复的平均值。图111B。 RESCUEr0-r16活性的剂量应答,通过在Gluc转录物中UCG位点上的C 到U编辑来测量。值表示三次重复的平均值。图111C。RESCUEr0-r16 活性的剂量应答,通过在CTNNB1转录物中T41I位点上的荧光素酶活性的恢复测量。值表示三次重复的平均值。

图112。以不同指导和RESCUE质粒的量,通过RESCUEr6-r9在Gluc 转录物中UCG位点进行的编辑百分比。值表示平均值+/–S.E.M(n=3)。

图113A-113E:针对定向进化的各种酵母报告基因的编辑速率。图 113A。使用靶向和非靶向指导,通过RESCUEr3、r7和r16进行的GFP 突变Y66H的荧光校正百分比。在10,000个细胞上通过进行流式细胞术测量荧光。T,靶向指导;NT,非靶向指导。图113B。使用靶向和非靶向指导,通过RESCUEr3、r7和r16进行的GFP突变Y66H的编辑校正百分比。T,靶向指导;NT,非靶向指导。图113C。使用靶向和非靶向指导,通过RESCUEr7和r16进行的HIS3突变P196L的编辑校正百分比。 T,靶向指导;NT,非靶向指导。图113D。使用靶向和非靶向指导,通过RESCUEr7和r16进行的HIS3突变S129P的编辑校正百分比。T,靶向指导;NT,非靶向指导。图113E。在RESCUE诱导后的不同小时,使用各种错配距离的靶向指导和非靶向指导,通过RESCUEr3、r7和r16 进行的HIS3突变S22P的编辑校正百分比。NT,非靶向指导。

图114A-114C:使用具有U、C、G或A错配的指导,使用RESCUEr16 和r8,使用所有16种可能的5’和3’碱基组合的Gluc位点的编辑百分比。图114A。使用具有U或C错配的指导,使用RESCUEr8,使用所有16 种可能的

图115。使用具有不同U错配位置的30bp和50bp指导,在Gluc 转录物的UCG位点上RESCUE的编辑百分比。值表示平均值+/–S.E.M (n=3)。

图116。使用具有不同U错配位置的指导RNA,在Gluc转录物中的 UCG位点上RESCUEr1和RESCUEr3-r8的编辑百分比。将候选轮与 RanCas13b和PspCas13b两者进行比较。值表示平均值+/–S.E.M(n=3)。 20/22表示针对RanCas13b的错配距离为20和针对PspCas13b的错配距离为22。由于REPAIR使用ADAR2dd与dPspCas13b的融合体(7),我们将我们的RESCUE候选轮与PspCas13b和RanCas13b的融合体进行了比较,并发现其具有同等活性。

图117A-117B:在ADAR2脱氨酶结构域的晶体结构上的RESCUE 突变的视图。图117A。RESCUE突变体与紫色建模的翻出的胞苷一起显示在ADAR2晶体结构(蓝色)中。图117B。在催化脱氨基化位点处的突变体的放大晶体结构视图,其中带有翻出碱基的RNA也显示为紫色。

图118A-118D:RESCUEr0-r16和RESCUEr16-S的腺苷脱氨酶活性。采用REPAIR,腺苷脱氨基化的效率取决于相对于靶腺苷的位置的指导设计选择和碱基翻转选择(7),因为ADAR2dd倾向于在错配气泡中脱氨基。在指导:靶标dsRNA双链体内的靶碱基的位置是特别重要的,因为 Cas13指导可以被置于任何位置而没有任何序列限制,并且ADAR2dd的最佳活性窗很小(7)。对于RESCUE,我们检测了靶胞嘧啶上所有可能的指导碱基翻转,并发现胞苷脱氨基化的最佳碱基翻转是C或U,UCG 基序的最佳编辑是使用30nt指导RNA,靶向碱基翻转位置26个碱基对是来自靶标的

图119A-119D:在REPAIR上添加的个体RESCUE突变(RESCUEr0) 或从RESCUEr16除去的个体突变的评价。图119A。如通过荧光素酶活性恢复所测量的,在靶向荧光素酶转录物上的位点的REPAIR (RESCUEr0)上添加的个体RESCUE突变的C到U脱氨酶活性的评价。值表示平均值+/–S.E.M(n=3);WT,RESCUEr0序列。图119B。如通过编辑百分比所测量的,在靶向荧光素酶转录物上的位点的REPAIR (RESCUEr0)上添加的个体RESCUE突变的C到U脱氨酶活性的评价。值表示平均值+/–S.E.M(n=3);WT,RESCUEr0序列。图119C。如通过荧光素酶活性恢复所测量的,靶向荧光素酶转录物的位点的、除去个体突变的RESCUEr16构建体的C到U脱氨酶活性的评价。值表示平均值+/–S.E.M(n=3);WT,RESCUEr16序列。图119D。如通过编辑百分比所测量的,靶向荧光素酶转录物上的位点的、除去个体突变的 RESCUEr16构建体的C到U脱氨酶活性的评价。值表示平均值+/–S.E.M (n=3);WT,RESCUEr16序列。

图120A-120D:使用重组蛋白,含有RESCUEr0、r2、r8、13和r16 突变的ADAR2脱氨酶结构域的生化脱氨基化活性。图120A。含有各种候选突变的ADAR2脱氨酶结构域蛋白的腺苷脱氨基化活性,22bp双链 RNA底物含有与胞苷错配的中心腺嘌呤。在具有和不具有脱氨酶结构域的情况下,将反应孵育不同时间点。值表示平均值+/–S.E.M(n=3,一些误差线被符号遮挡)。图120B。含有各种候选突变的ADAR2脱氨酶结构域蛋白的胞苷脱氨基化活性,22bp双链RNA底物含有与尿苷错配的中心胞苷。在具有和不具有脱氨酶结构域的情况下,将反应孵育不同时间点。值表示平均值+/–S.E.M(n=3,一些误差线被符号遮挡)。图 120C。在RNA和DNA底物上的RESCUE r0和r16胞苷脱氨酶活性,包括与互补DNA退火的RNA(RNA:DNA)中的胞苷,与互补RNA退火的DNA(DNA:RNA)中的脱氧胸苷,在双链DNA(dsDNA)中的脱氧胞苷和在ssDNA中的脱氧胞苷。所有双链模板均含有与胸苷错配的胞苷。值表示平均值+/–S.E.M(n=3)。图120D。在RNA和DNA底物上的 RESCUE r0和r16腺苷脱氨酶活性,包括与互补DNA退火的RNA (RNA:DNA)中的腺苷,与互补RNA退火的DNA(DNA:RNA)中的脱氧腺苷,在双链DNA(dsDNA)中的脱氧腺苷和在ssDNA中的脱氧腺苷。所有双链模板均含有与腺苷错配的胞苷。值表示平均值+/–S.E.M (n=3)。

图121A-121D:RESCUEr16、全长ADAR2(具有RESCUEr16突变)、 ADAR2脱氨酶结构域(具有RESCUEr16突变)和无任何蛋白的胞苷脱氨酶活性的比较。图121A。使用靶向指导以及RESCUEr16、全长ADAR2 (具有RESCUEr16突变)、ADAR2脱氨酶结构域(具有RESCUEr16 突变)和无任何蛋白,通过Cluc活性恢复测量的腺苷脱氨酶活性。值表示平均值+/–S.E.M(n=3)。图121B。使用靶向指导以及RESCUEr16、全长ADAR2(具有RESCUEr16突变)、ADAR2脱氨酶结构域(具有 RESCUEr16突变)和无任何蛋白,通过Gluc活性恢复测量的胞苷脱氨酶活性。值表示平均值+/–S.E.M(n=3)。图121C。使用靶向指导以及 RESCUEr16、全长ADAR2(具有RESCUEr16突变)、ADAR2脱氨酶结构域(具有RESCUEr16突变)和无蛋白,使用不同

图122A-122C:RESCUEr16、全长ADAR2(具有RESCUEr16突变)、 ADAR2脱氨酶结构域(具有RESCUEr16突变)和无任何蛋白的胞苷脱氨酶活性的比较。图122A。使用RESCUEr16和包含不同错配位点的指导RNA,在Gluc转录物中的UCG位点的编辑。值表示平均值+/–S.E.M(n=3)。图122B。使用全长ADAR2(具有RESCUEr16突变)和包含不同错配位点的指导RNA,在Gluc转录物中的UCG位点的编辑。值表示平均值+/–S.E.M(n=3)。图122C。使用ADAR2脱氨酶结构域(具有RESCUEr16突变)和包含不同错配位点的指导RNA,在Gluc转录物中的UCG位点的编辑。值表示平均值+/–S.E.M(n=3)。

图123A-123C:使用没有长度为30或50nt的直接重复和各种错配的指导,在Gluc转录物上的RESCUEr16的胞苷脱氨基化活性。图123A。使用没有直接重复和各种错配的30nt指导,在Gluc转录物上的 RESCUEr16的胞苷脱氨基化活性。值表示平均值+/–S.E.M(n=3)。图123B。使用没有直接重复和各种错配的50nt指导,在Gluc转录物上的 RESCUEr16的胞苷脱氨基化活性。值表示平均值+/–S.E.M(n=3)。图 123C。使用具有直接重复和各种错配的30nt指导,在Gluc转录物上的 RESCUEr16的胞苷脱氨基化活性。值表示平均值+/–S.E.M(n=3)。

图124A-124F:具有掺入其中的RESCUE突变的替代RNA编辑技术的胞苷脱氨基化活性。图124A。使用具有不同碱基翻转和各种错配的30 nt指导,在Gluc转录物上使用RESCUE突变的MS2募集的ADAR脱氨酶结构域(24)的胞苷脱氨基化活性。通过荧光素酶活性的恢复测量活性。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。图124B。使用具有不同碱基翻转和各种错配的30nt指导,在Gluc转录物上使用 RESCUE突变的MS2募集的ADAR脱氨酶结构域(24)的Gluc编辑百分比。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。图124C。使用具有不同碱基翻转和各种错配的30nt指导,在Gluc转录物上使用含有RESCUE突变的脱氨酶结构域的关联ADAR指导RNA技术(24) 的胞苷脱氨基化活性。通过荧光素酶活性的恢复测量活性。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。图124D。使用具有不同碱基翻转和各种错配的30nt指导,在Gluc转录物上使用含有RESCUE突变的脱氨酶结构域的关联ADAR指导RNA技术(24)的Gluc编辑百分比。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。图124E。使用具有不同碱基翻转和各种错配的30nt指导,在Gluc转录物上使用RESCUE 突变的指导RNA募集的ADAR脱氨酶结构域(11)的胞苷脱氨基化活性。通过荧光素酶活性的恢复测量活性。值表示平均值+/–S.E.M(n=3); NT,非靶向指导。图124F。使用具有不同碱基翻转和各种错配的30nt 指导,在Gluc转录物上使用RESCUE突变的指导RNA募集的ADAR脱氨酶结构域(11)的Gluc编辑百分比。值表示平均值+/–S.E.M(n=3); NT,非靶向指导。

图125A-125C:错配位置平铺,以发现在内源性靶位点上针对 RESCUE的最佳编辑指导设计。图125A。使用RESCUE和在位置7、9、 11和13处具有错配和U型碱基翻转的指导,具有不同碱基基序的内源性靶位点的编辑百分比。值表示平均值+/–S.E.M(n=3)。图125B。使用RESCUE和在位置7、9、11和13处具有错配和C型碱基翻转的指导,具有不同碱基基序的内源性靶位点的编辑百分比。值表示平均值+/– S.E.M(n=3)。图125C。使用RESCUE和在位置3、5、7、9和11处具有错配和C型和U型碱基翻转的指导,具有不同碱基基序的内源性靶位点的编辑百分比。值表示平均值+/–S.E.M(n=3)。

图126A-126B:如通过在各种内源性位点和不同量处的编辑百分比所测量的,RESCUEr0-r16的胞苷脱氨基化活性。图126A。热图描述了在一组三个内源性基因上RESCUEr0-r16的编辑效率。值表示三次重复的平均值。图126B。如通过在KRAS位点处的编辑百分比所测量的,不同量的RESCUEr0-r16的胞苷脱氨基化活性。值表示三次重复的平均值。

图127A-127B:在合成报告基因上各种疾病相关突变的编辑百分比。图127A。在一组相关T>C疾病突变的合成版本上RESCUE的编辑效率,采用每个靶位点的最佳可能错配指导。编辑率在1%和42%之间变化,并且按照编辑效率显示条件。在表31中列出了针对合成位点的所有编辑率。值表示平均值+/–S.E.M(n=3)。图127B。使用RESCUE和具有各种错配位置的指导的疾病相关突变的编辑。值表示平均值+/–S.E.M(n =3)。

图128。使用具有各种C和U错配位置的指导的RESCUE在ApoE4 胞嘧啶处的编辑百分比。ApoE4变体(rs429358和rs7412)显著增加阿尔茨海默氏症的风险,并且被通过RESCUE进行编辑,在两个位点上的比率高达5%和12%。在表31中列出了针对合成位点的所有编辑率。值表示平均值+/–S.E.M(n=3)。

图129A-129F:通过RESCUE进行的RNA编辑和STAT1/STAT3的信号调节。STAT3和STAT1是转录因子,其在通过JAK/STAT途径进行的信号转导中起重要作用,通常通过细胞因子和生长因子的磷酸化来激活。为了证明通过RNA编辑进行的信号传导调节,我们在48小时过程中通过用RESCUE编辑STAT3上的Y705和S727以及STAT1上的Y701 和S727磷酸化位点来改变STAT通路的激活。图129A。靶向STAT3的磷酸化残基以改变相关信号传导通路的STAT3结构域和RESCUE指导的示意图(SEQ ID NO:768-770)。图129B。通过RESCUE在STAT3中在相关磷酸化残基处进行的编辑百分比。在HEK293FT细胞中,我们观察到S727 STAT3位点的6%编辑,以及Y701和S727 STAT1位点分别的11%和7%编辑。图129C。如通过使用具有不同碱基翻转的指导进行的STAT3驱动荧光素酶表达所测量的,通过RNA编辑进行的STAT3信号传导的抑制。这些编辑导致STAT3和STAT1活性的13%抑制。图129D。使用具有不同碱基翻转的指导,通过RESCUE在STAT1中S727F磷酸化残基处进行的编辑百分比。图129E。使用具有不同碱基翻转的指导,通过RESCUE在STAT1中Y701C磷酸化残基处进行的编辑百分比。图 129F。如通过STAT驱动荧光素酶表达所测量的,使用RESCUE通过RNA 编辑进行的STAT1信号传导的抑制。

图130A-130B:在HUVEC细胞中b-连环蛋白磷酸化和细胞生长的调节。图130A。通过在HUVEC细胞中的RNA编辑进行的CTNNB1信号传导的活化造成的细胞生长的定量。RESCUE刺激HUVEC生长达到与过表达b-连环蛋白磷酸化无效突变体的细胞中观察到的水平相当的水平。NT,非靶向指导。图130B。在HUVEC细胞中RESCUE CTNNB1 靶向和非靶向指导的代表性显微图像。

图131。在带有不同dRanCas13b的C末端截短的靶点周围,使用不同5’和3’侧翼碱基在转录物上的RESCUE C到U和A到I活性。

图132A-132C:在指导双链体窗中的候选轮的特异性。图132A。高斯荧光素酶突变体C82R的编辑位点的示意图,其中被靶向的C用红色突出显示,以及将附近的腺嘌呤碱基编号并用灰色突出显示(SEQ ID NO:771)。图132B。通过RESCUEr0、RESCUEr8和RESCUEr16进行靶向,在高斯荧光素酶突变体C82R中的附近腺嘌呤碱基的编辑百分比。图132C。通过不同量的RESCUEr0-r16,在腺嘌呤20处,腺嘌呤至鸟苷的编辑百分比。值表示三次重复的平均值。

图133A-133D:在通过RESCUE r0、r8和r16进行的单路和多路靶向中在靶点胞苷附近的脱靶。图133A。KRAS转录物的编辑位点的示意图,其中被靶向的C用红色突出显示,以及将附近的腺嘌呤碱基编号并用灰色突出显示(SEQ ID NO:772)。图133B。通过RESCUEr0、RESCUEr8 和RESCUEr16进行靶向,在KRAS转录物中的附近腺嘌呤碱基的编辑百分比。图133C。CTNNB1转录物的多路复用编辑位点的示意图,其中两个被靶向的C位点用红色突出显示,以及将附近的腺嘌呤碱基编号并用灰色突出显示(SEQ ID NO:773)。FIG 133D。通过RESCUEr0、RESCUEr8 和RESCUEr16进行多路复用靶向,在CTNNB1转录物中的附近腺嘌呤碱基的编辑百分比。

图134A-134F:RESCUE和RESCUE-S全转录组脱靶的表征。图 134A。具有靶向指导的RESCUE对荧光素酶转录物上的位点的全转录组脱靶编辑的预测作用。图134B。具有靶向指导的RESCUE对荧光素酶转录物上的位点的全转录组脱靶编辑的预测致癌作用。图134C。具有靶向指导的RESCUE对荧光素酶转录物上的位点以每个转录物的脱靶编辑数量来可视化的全转录组脱靶。图134D。具有靶向指导的RESCUE-S对荧光素酶转录物上的位点的全转录组脱靶编辑的预测作用。图134E。具有靶向指导的RESCUE-S对荧光素酶转录物上的位点的全转录组脱靶编辑的预测致癌作用。图134F。具有靶向指导的RESCUE-S对荧光素酶转录物上的位点以每个转录物的脱靶编辑数量来可视化的全转录组脱靶。

图135A-135C:全转录组脱靶的5’和3’侧翼碱基的表征。图135A。具有靶向指导的RESCUE针对荧光素酶转录物上的位点,使用所有16 种可能的

图136A-136B:使用重组蛋白,含有RESCUEr0、RESCUEr16和 RESCUEr16-S突变的ADAR脱氨酶结构域的生化脱氨基化活性。图 136A。含有各种候选突变的ADAR2脱氨酶结构域蛋白的腺苷脱氨基化活性,22bp双链RNA底物含有与胞嘧啶错配的中心腺嘌呤。在具有和不具有脱氨酶结构域的情况下,将反应孵育不同时间点。值表示平均值 +/–S.E.M(n=3,一些误差线被符号遮挡)。图136B。含有各种候选突变的ADAR2脱氨酶结构域蛋白的胞苷脱氨基化活性,22bp双链RNA 底物含有与尿苷错配的中心胞嘧啶。在具有和不具有脱氨酶结构域的情况下,将反应孵育不同时间点。值表示平均值+/–S.E.M(n=3,一些误差线被符号遮挡)。

图137A-137D:RESCUE和RESCUE-S的腺苷脱氨酶活性。图137A。使用靶向指导RNA,利用RESCUE和RESCUE-S,通过Gluc转录物的腺苷脱氨基化进行的荧光素酶校正。值表示平均值+/–S.E.M(n=3)。图137B。使用非靶向指导RNA,利用RESCUE和RESCUE-S,通过Gluc 转录物的腺苷脱氨基化进行的荧光素酶校正。值表示平均值+/–S.E.M(n =3)。图137C。使用靶向指导RNA,利用RESCUE和RESCUE-S,Gluc 转录物的腺苷到肌苷的编辑百分比。值表示平均值+/–S.E.M(n=3)。图137D。使用非靶向指导RNA,利用RESCUE和RESCUE-S,Gluc转录物的腺苷到肌苷的编辑百分比。值表示平均值+/–S.E.M(n=3)。

图138A-138C:使用各种量的RESCUEr0-r16和RESCUEr16-S在b- 连环蛋白靶位点上的胞苷脱氨基化活性和脱靶活性。图138A。CTNNB1 T41I的编辑位点的示意图,其中被靶向的C以红色突出显示,以及附近脱靶腺嘌呤碱基以灰色突出显示(SEQ ID NO:774)。图138B。通过各种量的RESCUEr0-r16和RESCUEr16-S进行的胞嘧啶到尿苷(T41A)的编辑百分比。值表示三次重复的平均值。图138C。通过各种量的 RESCUEr0-r16和RESCUEr16-S在脱靶腺嘌呤处进行的腺嘌呤到鸟苷的编辑百分比。值表示三次重复的平均值。

图139A-139C:通过RESCUE和RESCUE-S进行的STAT1和STAT3 的编辑。图139A。通过C到U和A到I编辑在STAT3处编辑的位点的示意图(SEQ ID NO:775-778)。图139B。通过RESCUE和RESCUE-S 在STAT1和STAT3中在酪氨酸残基处进行的A到I编辑百分比。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。图139C。通过RESCUE 和RESCUE-S在STAT1和STAT3中在丝氨酸残基处进行的C到U编辑百分比。值表示平均值+/–S.E.M(n=3);NT,非靶向指导。

图140A-140E:在内源性靶点上的RESCUE和RESCUE-S的中靶和脱靶编辑。图140A。使用RESCUE和RESCUE-S,具有不同碱基基序的内源性靶位点的编辑百分比。值表示平均值+/–S.E.M(n=3)。图140B。通过RESCUE和RESCUE-S进行靶向,在NRAS I21I中的邻近腺嘌呤碱基的编辑百分比。图140C。通过RESCUE和RESCUE-S进行靶向,在 NF2 T21M中的邻近腺嘌呤碱基的编辑百分比。图140D。通过RESCUE 和RESCUE-S进行靶向,在RAF1 P30S中的邻近腺嘌呤碱基的编辑百分比。图140E。通过RESCUE和RESCUE-S进行靶向,在CTNNB1 P44S 中的邻近腺嘌呤碱基的编辑百分比。

图141:RESCUE使得能够进行的氨基酸变化的总结。密码子表显示了通过RESCUE可能发生的所有潜在氨基酸变化。

本文中的附图仅用于说明目的,而不一定按比例绘制。

具体实施方式

定义

除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook,Fritsch和Maniatis); Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel 等编辑);the series Methods in Enzymology(Academic Press,Inc.):PCR 2: A PracticalApproach(1995)(M.J.MacPherson,B.D.Hames和G.R.Taylor 编辑):Antibodies,ALaboratory Manual(1988)(Harlow和Lane编辑): Antibodies A Laboratory Manual第2版2013(E.A.Greenfield编辑); Animal Cell Culture(1987)(R.I.Freshney编辑);Benjamin Lewin,Genes IX, Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等(编辑), The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994 (ISBN 0632021829);Robert A.Meyers编辑,Molecular Biology andBiotechnology:a Comprehensive Desk Reference,VCH Publishers出版,Inc., 1995(ISBN 9780471185710);Singleton等,Dictionary of Microbiology and MolecularBiology第2版,J.Wiley&Sons(New York,N.Y.1994),三月, Advanced Organic ChemistryReactions,Mechanisms and Structure第4版, John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。

除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种”和“所述”包括单数和复数指示物。

术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生或可能不发生,并且该描述包括事件或情形发生的情况和不发生的情况。

通过端点表述的数值范围包括在对应范围内的所有数值和分数,以及所表述的端点。

如本文所用的术语“约”或“近似”当涉及诸如参数、量、时距等可测量的值时,有意涵盖指定值的变化和从指定值的变化,诸如指定值和从指定值+/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此类变化适于在所公开的发明中执行即可。应当理解,修饰语“约”或“近似”所涉及的值本身也是具体地且优选地公开的。

如本文所用,“生物样品”可以含有全细胞和/或活细胞和/或细胞碎片。生物样品可以含有(或来源于)“体液”。本发明涵盖以下实施方式,其中体液选自羊水、房水、玻璃体液、胆汁、血清、母乳、脑脊液、耳屎(耳垢)、乳糜、食糜、内淋巴液、外淋巴液、渗出液、粪便、女性射液、胃酸、胃液、淋巴液、粘液(包括鼻引流和痰)、心包液、腹膜液、胸膜液、脓液、发炎性分泌物、唾液、皮脂(皮油)、精液、痰涎、滑液、汗液、眼泪、尿液、阴道分泌物、呕吐物以及这些物质中一者或多者的混合物。生物样品包括细胞培养物、体液、来自体液的细胞培养物。体液可以例如通过穿刺或其他收集或采样程序从哺乳生物体获得。

术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选地是哺乳动物,更优选地是人类。哺乳动物包括但不限于鼠、猴、人类、农场动物、运动型动物和宠物。还包括在体内获得或在体外培养的生物实体的组织、细胞和他们的子代。

每当在本文中提及Cas13时,将理解的是,除非另外明确指出,是指根据本发明的突变的或工程化Cas13。每当在本文中提及Cas13时,将理解的是,除非另外明确指出,是指根据本发明的突变的或工程化 Cas13a、Cas13b、Cas13c或Cas13d。每当在本文中提及Cas13时,将理解的是,除非另外明确指出,是指根据本发明的突变的或工程化Cas13b。

在下文中描述各种实施方式。应当指出的是,具体实施方式不旨在作为详尽的描述或作为对本文所论述的更广泛方面的限制。结合特定实施方式描述的一个方面不必限于该实施方式,而是可以与任何其他一个或多个实施方式一起实践。在本说明书通篇提及“一个实施方式”、“实施方式”、“示例性实施方式”意指结合实施方式描述的特定特征、结构或特性包括于本发明的至少一个实施方式中。因此,在本说明书通篇各处出现短语“在一个实施方式中”、“在实施方式中”或“示例性实施方式”不一定全部指代同一实施方式,但也有可能如此。此外,如本领域技术人员从本公开将明显了解的,在一个或多个实施方式中,特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所述的一些实施方式包括其他实施方式中所包括的一些特征而非其他特征,但不同实施方式的特征的组合有意处于本发明的范围内。举例来说,在所附权利要求中,任何所要求保护的实施方式可以按任何组合使用。

本文所引用的所有公布、公布的专利文献和专利申请特此以引用方式并入,如同每个单独公布、公布的专利文献或专利申请被确切地且单独地指明为以引用方式整体并入。

综述

在一个方面中,本文公开的实施方式涉及一种工程化CRISPR-Cas 蛋白,其包含一种或多种修饰的氨基酸。在某些实施方式中,与相应野生型CRISPR-Cas蛋白相比,工程化CRISPR-Cas蛋白增加或降低以下的一种或多种:PFS识别/特异性、gRNA结合、蛋白酶活性、多核苷酸结合能力、稳定性、特异性、靶标结合、脱靶结合和/或催化活性。在某些实施方式中,CRISPR-Cas蛋白包含一个或多个HEPN结构域,以及包含一种或多种修饰的氨基酸。修饰的氨基酸可以与指导RNA相互作用,所述指导RNA与CRISPR-Cas蛋白形成复合物,和/或在CRISPR-Cas蛋白的HEPN活性位点、结构域间接头结构域、盖结构域、螺旋结构域或桥螺旋结构域,或其组合中。在一些实例中,工程化CRISPR-Cas蛋白包含一个或多个HEPN结构域,以及还包含一种或多种修饰的氨基酸,其中所述氨基酸与指导RNA相互作用,所述指导RNA与CRISPR-Cas蛋白形成复合物;在工程化CRISPR-Cas蛋白的HEPN活性位点、结构域间接头结构域、盖结构域、螺旋结构域1、螺旋结构域2或桥螺旋结构域,或其组合中。

在另一个方面中,本文公开的实施方式提供了新鉴定的CRISPR-Cas 直系同源物子集,其尺寸小于此前发现的CRISPR-Cas直系同源物,包括对其的进一步修饰和用途。在特定实施方式中,CRISPR-Cas直系同源物小于约1000个氨基酸,并且可以任选地作为融合蛋白的一部分提供。

本文还提供了工程化核苷酸脱氨酶。在某些实施方式中,工程化核苷酸脱氨酶是腺苷脱氨酶,可以将其工程化以包含胞苷脱氨酶活性。在实施方式中,可以将工程化核苷酸融合至Cas蛋白,包括本文公开的 CRISPR-Cas蛋白。

在另一个方面中,本文公开的实施方式包括此类修饰的CRISPR-Cas 蛋白的系统和用途,包括但不限于诊断、碱基编辑疗法和检测方法。包含CRISPR Cas蛋白的融合蛋白(包括本文公开的那些)和核苷酸脱氨酶也可以用于碱基编辑。还提供了所公开的蛋白和系统的递送,包括递送至各种细胞以及通过各种颗粒、囊泡和载体。

一般CRISPR-CAS系统

在通常情况下,CRISPR-Cas或CRISPR系统统称为与CRISPR相关 (“Cas”)基因表达或指导其活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如,tracrRNA或活性部分 tracrRNA)、tracr配对序列(在内源性CRISPR系统背景下包含“正向重复”和tracrRNA处理的部分正向重复)、指导序列(在内源性CRISPR 系统背景下也称为“间隔子”),或本文中使用的术语“RNA”(例如,指导Cas(如Cas9)的RNA,例如,CRISPRRNA和反式激活(tracr)RNA 或单一指导RNA(sgRNA)(嵌合RNA))或者来自CRISPR基因座的其他序列和转录物。在通常情况下,CRISPR系统的特征是促进靶序列位点上CRISPR复合物形成的元件(在内源性CRISPR系统背景下也称为原间隔子)。当CRISPR蛋白是2类VI型效应物时,不需要tracrRNA,在本发明的工程化系统中,正向重复可以包含天然存在的序列或非天然存在的序列。本发明的正向重复不限于天然存在的长度和序列。正向重复的长度可以是36nt,但是更长或更短的正向重复可以变化。例如,正向重复可以是30nt或更长,如30-100nt或更长。例如,正向重复的长度可以是30nt、40nt、50nt、60nt、70nt、70nt、80nt、90nt、100nt 或更长。在一些实施方式中,本发明的正向重复可以包括插入在天然存在的正向重复序列的5’和3’末端之间的合成核苷酸序列。在某些实施方式中,插入的序列可以是自我互补的,例如,20%、30%、40%、50%、 60%、70%、80%、90%或100%自我互补。此外,本发明的正向重复可以包括核苷酸插入,如适体或结合至衔接子蛋白(用于与功能性结构域结合)的序列。在某些实施方式中,包含此类插入的正向重复的一端大约是短DR的前一半,而一端大约是短DR的后一半。

CRISPR-Cas蛋白(在本文中与“Cas蛋白”、“Cas效应物”互换使用) 可以包括Cas9、Cas 12(例如,Cas12a、Cas12b、Cas12c、Cas12d等)、 Cas13(例如,Cas13a、Cas13b(如Cas13b-t1、Cas13b-t2、Cas13b-t3)、Cas13c、Cas13d等)、Cas14、CasX和CasY。在一些实施方式中, CRISPR-Cas蛋白可以是VI型CRISPR-Cas蛋白。例如,VI型CRISPR-Cas 蛋白可以是Cas13蛋白。Cas13蛋白可以是Cas13a、Cas13b、Cas13c或 Cas13d。在一些实例中,CRISPR-Cas蛋白是Cas13a。在一些实例中, CRISPR-Cas蛋白是Cas13b。在一些实例中,CRISPR-Cas蛋白是Cas13c。在一些实例中,CRISPR-Cas蛋白是Cas13d。

在一些实施方式中,工程化CRISPR-Cas蛋白包含一个或多个HEPN 结构域并且长度小于1000个氨基酸。例如,蛋白的尺寸可以小于950、小于900、小于850、小于800或小于750个氨基酸。

在某些示例性实施方式中,RISPR-Cas蛋白包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域,本领域公知的HEPN结构域以及通过与共有序列基序相比而被识别为HEPN结构域的结构域。本文中提供若干此类结构域。在一个非限制性实例中,共有序列可以来源于本文所提供的C2c2或Cas13b直系同源物的序列。在某些示例性实施方式中,效应蛋白包含单个HEPN结构域。在某些其他示例性实施方式中,效应蛋白包含两个HEPN结构域。

在一个实例实施方式中,效应蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以是但不限于来自本文所述的HEPN结构域或本领域中已知的HEPN结构域。RxxxxH基序序列还包括通过组合两个或更多个HEPN结构域的部分而建立的基序序列。如所指出的,共有序列可以来源于以下文献中公开的直系同源物的序列:题为“新颖的VI型CRISPR直系同源物和系统(Novel CRISPR Enzymes and Systems)”的美国临时专利申请62/432,240,2017年3月15日提交的题为“新颖的VI型CRISPR直系同源物和系统(NovelType VI CRISPR Orthologs and Systems)”的美国临时专利申请62/471,710和律所案号为 47627-05-2133并于2017年4月12日提交的题为“新颖的VI型CRISPR 直系同源物和系统(Novel Type VI CRISPR Orthologs and Systems)”的美国临时专利申请。

在本发明的一个实施方式中,HEPN结构域包含至少一个RxxxxH基序,其包含R{N/H/K}X1X2X3H的序列。在本发明的一个实施方式中, HEPN结构域包含RxxxxH基序,其包含R{N/H}X

在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR 复合物的形成。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方式中,靶序列位于细胞的细胞核或细胞质中。在一些实施方式中,可以通过搜索满足以下任何或所有条件的重复基序,在计算机上鉴定正向重复序列:1.在II型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和3.间隔20至50bp。在一些实施方式中,可以使用这些标准中的2个,例如1和2、2和3或1和3。在一些实施方式中,可以使用所有3个标准。

在本发明的实施方式中,术语指导序列和指导RNA,例如,能够将 CRISPR-Cas效应蛋白指导至靶基因座的RNA,可以互换使用,如本文引用的文献,如WO 2014/093622(PCT/US2013/074667)。在通常情况下,指导序列(或间隔子序列)是与靶多核苷酸序列具有足够互补性的任何多核苷酸序列,可与目标序列杂交并引导与CRISPR复合物的序列特异性结合。在一些实施方式中,当使用合适的比对算法进行最佳比对时,指导序列与其对应的靶序列之间的互补程度约为或大于约50%、60%、 75%、80%、85%、90%、95%、97.5%、99%或更高。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman算法)、尼德曼-翁施算法(Needleman-Wunsch 算法)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如,巴罗斯-维勒比对仪(Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(NovocraftTechnologies;在www.novocraft.com 上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。在一些实施方式中,指导序列(或间隔子序列)的长度是约或多于约5、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方式中,指导序列的长度短于约75、50、45、40、35、30、25、20、 15、12个或更少个核苷酸。优选地,指导序列是10-40个核苷酸长,如 20-30个或20-40个核苷酸长或更长,如30个核苷酸长或约30个核苷酸长。在某些实施方式中,针对CRISPR-Cas效应物,指导序列是10-30个核苷酸长,如20-30个或20-40个核苷酸长或更长,如30个核苷酸长或约30个核苷酸长。在某些实施方式中,指导序列是10-30个核苷酸长,如20-30个核苷酸长,如30个核苷酸长。指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力可以通过任何合适的测定法来评估。例如,可将足以形成CRISPR复合物的CRISPR系统组分(包括待测的指导序列)提供给具有相应靶序列的宿主细胞,例如通过转染编码 CRISPR序列组分的载体,然后通过评估靶序列内的优先切割,例如通过本文所述的Surveyor测定。类似地,可通过提供靶序列,CRISPR复合物的组分(包括待测试的指导序列和不同于该测试指导序列的对照指导序列),并比较在测试和对照指导序列反应之间在靶序列处裂解的结合或速率来在试管中评估靶多核苷酸序列的切割。其他测定是可能的,并且对本领域技术人员而言将是显而易见的。

在经典CRISPR-Cas系统中,指导序列与其对应的靶序列之间的互补程度可以是约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、 99%或100%;指导或RNA或crRNA可以是长度约或大于约5、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、35、40、45、50、75个或更多个核苷酸;或者指导或RNA 或crRNA可以是长度小于约75、50、45、40、35、30、25、20、15、12 个或更少个核苷酸;以及有利地tracr RNA的长度是30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少指导与具有低互补性的靶序列相互作用。实际上,在实例中,显示出本发明涉及突变,其导致CRISPR-Cas系统能够区分具有大于80%至约95%的互补性,例如,83%-84%或88-89%或94-95%互补性的靶序列和脱靶序列(例如,区分具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶)。因此,在本发明的背景下,指导序列与其对应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或 98.5%或99%或99.5%或99.9%或100%。脱靶是在序列和指导之间的互补性小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或 91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%,有利地,脱靶是在序列和指导之间的互补性是100%或99.9%或99.5%或99%或99%或或98.5%或98%或97.5%或97%或96.5%或96%或或95.5%或95%或94.5%。

在某些实施方式中,可以通过引入错配来利用切割效率的调节,例如,1个或更多个错配,如间隔子序列和靶序列之间1或2个错配,包括沿着间隔子/靶点不匹配的位置。例如,双链错配越集中(即,不是3’或5’),则切割效率受到的影响越大。因此,通过选择沿着间隔子的错配位置,可以调节切割效率。举例来说,如果期望靶点的切割小于100%(例如,在细胞群中),则可以在间隔子序列中引入1个或更多个,如优选地在间隔子与靶序列之间的2个错配。沿着错配位置的间隔子越中心,切割百分数越低。

如本文所述的根据本发明的方法包括在如本文所述的真核细胞中 (在体外,即在分离的真核细胞中)诱导一种或多种核苷酸修饰,包括将如本文所述的载体递送至细胞。所述突变可以包括通过指导RNA或 sgRNA在细胞的每个靶序列上引入、缺失或取代一个或多个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代 1-75个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75 个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代5、10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或 75个核苷酸。突变可以包括通过指导RNA在所述细胞的每个靶序列上引入、缺失或取代40、45、50、75、100、200、300、400或500个核苷酸。

对于最小化毒性和脱靶效应,控制Cas mRNA或蛋白和指导RNA递送的浓度将是重要的。可以通过在细胞或非人真核生物动物模型中测试不同的浓度并使用深度测序来分析潜在脱靶基因组基因座的修饰程度来确定Cas mRNA或蛋白和指导RNA的最佳浓度。

通常地,在内源性CRISPR系统的背景下,CRISPR复合物(包含与靶序列杂交并与一个或多个Cas蛋白复合的指导序列)的形成导致在靶序列中或附近(例如,距离1、2、3、4、5、6、7、8、9、10、20、50 个或更多个碱基对内)的切割,但是可能取决于二级结构,特别是在RNA靶点的情况下。在一些情况下,在内源性CRISPR系统背景下,CRISPR 复合物(包含与靶序列杂交并与一个或多个Cas蛋白复合的指导序列) 的形成导致在靶序列中或附近(例如,距离1、2、3、4、5、6、7、8、 9、10、20、50个或更多个碱基对内)一条或两条链(如适用)的切割。

在根据本发明特别优选的实施方式中,指导RNA(能够将Cas引导至靶基因座)可以包含(1)能够与真核细胞中的靶基因座(多核苷酸靶基因座,如RNA靶基因座)杂交的指导序列;(2)正向重复(DR)序列,该序列位于单个RNA中,即sgRNA(以5’至3’方向排列)或crRNA。

在本发明的实践中,关于CRISPR/Cas系统、其组分、及此类组分的递送(包括方法、材料、递送媒介物、载体、颗粒、以及其制造和使用 (包括关于量和配制品))的一般信息,参考以下:美国专利号8,999,641、 8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、 8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359;美国专利公开号US 2014-0310830(美国申请系列号14/105,031)、US 2014-0287938 A1(美国申请系列号14/213,991)、US 2014-0273234 A1 (美国申请系列号14/293,674)、US2014-0273232 A1(美国申请系列号 14/290,575)、US 2014-0273231(美国申请系列号14/259,420)、US 2014-0256046 A1(美国申请系列号14/226,274)、US 2014-0248702 A1 (美国申请系列号14/258,458)、US 2014-0242700 A1(美国申请系列号 14/222,930)、US 2014-0242699 A1(美国申请系列号14/183,512)、US 2014-0242664 A1(美国申请系列号14/104,990)、US 2014-0234972 A1 (美国申请系列号14/183,471)、US 2014-0227787 A1(美国申请系列号 14/256,912)、US 2014-0189896 A1(美国申请系列号14/105,035)、US 2014-0186958(美国申请系列号14/105,017)、US 2014-0186919 A1(美国申请系列号14/104,977)、US 2014-0186843 A1(美国申请系列号 14/104,900)、US 2014-0179770 A1(美国申请系列号14/104,837)和US 2014-0179006 A1(美国申请系列号14/183,486)、US 2014-0170753(美国申请系列号14/183,429);欧洲专利EP 2 784 162 B1和EP 2 771 468 B1;欧洲专利申请EP 2 771 468(EP13818570.7)、EP 2 764 103 (EP13824232.6)和EP 2 784162(EP14170383.5);和PCT专利公开号PCT专利公开号WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595 (PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、 WO 2014/093709(PCT/US2013/074812)、WO 2014/093622 (PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、 WO 2014/093655(PCT/US2013/074736)、WO 2014/093712 (PCT/US2013/074819)、WO 2014/093701(PCT/US2013/074800)、 WO 2014/018423(PCT/US2013/051418)、WO 2014/204723 (PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、 WO 2014/204725(PCT/US2014/041803)、WO 2014/204726 (PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、 WO2014/204728(PCT/US2014/041808)、WO 2014/204729 (PCT/US2014/041809)。还参考了美国临时专利申请号61/758,468; 61/802,174;61/806,375;61/814,263;61/819,803和61/828,130,其分别在2013年01月30日;2013年03月15日;2013年03月28日;2013 年04月20日;2013年05月06日和2013年05月28日提交。还参考了在2013年06月17日提交的美国临时专利申请号61/836,123。另外参考了均在2013年06月17日提交的美国临时专利申请号61/835,931、 61/835,936、61/836,127、61/836,101、61/836,080和61/835,973。还参考了在2013年08月05日提交的美国临时申请号61/862,468和61/862,355;在2013年08月28日提交的61/871,301;在2013年09月25日提交的 61/960,777和在2013年10月28日提交的61/961,980。进一步参考了: PCT专利申请号:PCT/US2014/041803、PCT/US2014/041800、 PCT/US2014/041809、PCT/US2014/041804和PCT/US2014/041806,其均在2014年06月10日提交;在2014年06月11日提交的 PCT/US2014/041808;和在2014年10月28日提交的PCT/US2014/62558,以及美国临时专利申请系列号:61/915,150、61/915,301、61/915,267和 61/915,260,其均在2013年12月12日提交;61/757,972和61/768,959,其在2013年01月29日和2013年02月25日提交;61/835,936、61/836,127、 61/836,101、61/836,080、61/835,973和61/835,931,其在2013年06月 17日提交;62/010,888和62/010,879,均在2014年06月11日提交; 62/010,329和62/010,441,分别在2014年06月10日提交;61/939,228 和61/939,242,均在2014年02月12日提交;61/980,012,其在2014年 04月15日提交;62/038,358,其在2014年08月17日提交;62/054,490、 62/055,484、62/055,460和62/055,487,其分别在2014年09月25日提交;以及62/069,243,其在2014年10月27日提交。还参考了美国临时专利申请号62/055,484、62/055,460、62/055,487,其在2014年09月25日提交;美国临时专利申请号61/980,012,其在2014年04月15日提交;和美国临时专利申请号61/939,242,其在2014年02月12日提交。尤其参见指定美国的PCT申请,申请号PCT/US14/41806,2014年06月10日提交。参考了于2014年01月22日提交的美国临时专利申请号 61/930,214。参考了美国临时专利申请号61/915,251;61/915,260和 61/915,267,其均在2013年12月12日提交。参考了于2014年04月15 日提交的美国临时专利申请号USSN 61/980,012。尤其参见指定美国的 PCT申请,申请号PCT/US14/41806,2014年06月10日提交。参考了 2014年01月22日提交的美国临时专利申请号61/930,214。参考了美国临时专利申请号61/915,251;61/915,260和61/915,267,其均在2013年 12月12日提交。

还提到了2014年12月12日提交的美国申请号62/091,455,受保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));2014年12月 24日提交的美国申请号62/096,708,受保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));2014年12月24日提交的美国申请号 62/091,462,CRISPR转录因子的死指导(DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS);2014年12月23日提交的美国申请号 62/096,324,CRISPR转录因子的死指导(DEAD GUIDESFOR CRISPR TRANSCRIPTION FACTORS);2014年12月12日提交的美国申请号 62/091,456,用于CRISPR-CAS系统的受护航和官能化的指导 (ESCORTED AND FUNCTIONALIZED GUIDESFOR CRISPR-CAS SYSTEMS);2014年12月12日提交的美国申请号62/091,461,用于关于造血干细胞(HSC)的基因组编辑的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSCs));2014年12月19日提交的美国申请号62/094,903,通过基因组范围的插入捕获测序对双链断裂和基因组重排的无偏鉴定 (UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS ANDGENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING);2014年12月24日提交的美国申请号62/096,761,用于序列操纵的系统、方法及优化的酶以及指导序列支架的工程化 (ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDESCAFFOLDS FOR SEQUENCE MANIPULATION);2014 年12月30日提交的美国申请号62/098,059,RNA靶向系统 (RNA-TARGETING SYSTEM);2014年12月24日提交的美国申请号 62/096,656,具有稳定化结构域或与稳定化结构域相关联的CRISPR (CRISPR HAVING ORASSOCIATED WITH DESTABILIZATION DOMAINS);2014年12月24日提交的美国申请号62/096,697,具有 AAV或与AAV相关联的CRISPR(CRISPR HAVING OR ASSOCIATED WITH AAV);2014年12月30日提交的美国申请号62/098,158,工程化CRISPR复合物插入靶向系统(ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS);2015年04月22日提交的美国申请号,用于胞外核外报告的细胞靶向(CELLULAR TARGETING FOR EXTRACELLULAREXOSOMAL REPORTING);2014年12月24日提交的美国申请号62/054,490,使用粒子递送组分靶向病症和疾病的 CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS);2014年09月25日提交的美国申请号62/055,484,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年12月04日提交的美国申请号62/087,537,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITHOPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年09月24日提交的美国申请号62/054,651,用于对体内多种癌症突变的竞争建模的 CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCERMUTATIONS IN VIVO);2014年10月23日提交的美国申请号62/067,886,用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORMODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);2014年12月24日提交的美国申请号62/054,675,在神经元细胞/组织中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES);2014年09月24日提交的美国申请号62/054,528,在免疫疾病或病症中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS IN IMMUNE DISEASES OR DISORDERS);2014年09月25日提交的美国申请号62/055,454,用于使用细胞穿透肽(CPP)靶向病症和疾病的 CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELLPENETRATION PEPTIDES(CPP));2014年09月25日提交的美国申请号62/055,460,多功能性CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL-CRISPRCOMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);2014年12月04日提交的美国申请号62/087,475,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年09月25日提交的美国申请号 62/055,487,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年12月04日提交的美国申请号 62/087,546,多功能性CRISPR复合物和/或优化的酶连接的功能性 CRISPR复合物(MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYMELINKED FUNCTIONAL-CRISPR COMPLEXES);以及2014年12月30日提交的美国申请号62/098,285,对肿瘤生长和转移的CRISPR介导的体内建模以及遗传筛选(CRISPR MEDIATED INVIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS)。

此外,关于CRISPR-Cas系统的一般信息,请注意以下内容(也通过引用并入本文):

在本发明的实践中,可以考虑将每一个都通过引用并入本文,并在下面简要讨论:

末端编辑

而且,“用于高度特异性基因组编辑的二聚体CRISPR RNA指导FokI 核酸酶(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genomeediting)”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter, Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin, Martin J.Aryee,J.Keith JoungNature Biotechnology 32(6):569-77(2014),涉及二聚体RNA引导的FokI核酸酶,其识别延伸的序列并且可以在人细胞中高效编辑内源基因。此外,提及PCT申请号PCT/US14/70057,律所案号47627.99.2060和BI-2013/107,发明名称为“使用颗粒递送组合物,用于治疗病症和疾病的CRISPR-CAS系统和组合物的递送、用途和治疗应用(DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS)(要求以下美国临时专利申请的一个或多个或全部的优先权:2014年09月24日提交的62/054,490;2014年06月10日提交的 62/010,441;和均在2013年12月12日提交的61/915,118、61/915,215 和61/915,148)(“颗粒递送PCT”),其通过引用并入本文,其涉及制备含sgRNA和Cas9蛋白的颗粒的方法,该方法包括将包含sgRNA和Cas9 蛋白的混合物(和任选地HDR模板)与包含或基本上由表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和乙醇;以及来自此过程的颗粒混合。例如,其中Cas9蛋白和sgRNA以适宜的(例如,3:1至1:3或2:1至1:2 或1:1)摩尔比,在适宜温度下(例如,15-30C,例如,20-25C,例如,室温),以适宜时间(例如,15-45,如30分钟),优选地在无菌、无核酸酶的缓冲液(例如,1X PBS)中混合在一起。单独地,将颗粒组分,诸如或包含:表面活性剂,例如,阳离子脂质,例如,1,2-二油酰基-3- 三甲基铵丙烷(DOTAP);磷脂,例如,二豆蔻酰基磷脂酰胆碱(DMPC);可生物降解的聚合物(例如乙二醇聚合物或PEG)和脂蛋白(例如低密度脂蛋白)(例如,胆固醇)溶于醇,最好是C

指导序列

在本发明的实施方式中,术语指导序列和指导RNA,即,能够将Cas 导向靶基因组基因座的RNA,如前面引用的文献诸如WO2014/093622 (PCT/US2013/074667)中所述互换使用。在通常情况下,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物序列特异性地结合至靶序列的任何多核苷酸序列。在一些实施方式中,当使用合适的比对算法最佳比对时,指导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman算法)、尼德曼-翁施算法(Needleman-Wunsch算法)、基于巴罗斯-维勒变换 (Burrows-Wheeler Transform)的算法(例如,巴罗斯-维勒比对仪 (Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign (Novocraft Technologies;在www.novocraft.com上可得)、ELAND (Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得) 和Maq(在maq.sourceforge.net上可得)。在一些实施方式中,指导序列的长度是约或多于约5、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75 个或更多个核苷酸。在一些实施方式中,指导序列的长度短于约75、50、 45、40、35、30、25、20、15、12个或更少个核苷酸。优选地,指导序列是10-30个核苷酸长,如30个核苷酸长。指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力可以通过任何合适的测定法来评估。例如,可将足以形成CRISPR复合物的CRISPR系统组分(包括待测的指导序列)提供给具有相应靶序列的宿主细胞,例如通过转染编码 CRISPR序列组分的载体,然后通过评估靶序列内的优先切割,例如通过本文所述的Surveyor测定。类似地,可通过提供靶序列,CRISPR复合物的组分(包括待测试的指导序列和不同于该测试指导序列的对照指导序列),并比较在测试和对照指导序列反应之间在靶序列处裂解的结合或速率来在试管中评估靶多核苷酸序列的切割。其他测定是可能的,并且对本领域技术人员而言将是显而易见的。可以对指导序列进行选择以靶向任何靶序列。在一些实施方式中,靶序列是在细胞基因组中的序列。示例性靶序列包括靶基因组中独特的那些。

在通常情况下,以及在本说明书通篇,术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体包括但不限于,单链、双链或部分双链的核酸分子;包含一个或多个游离端、不包含游离端(例如,环状)的核酸分子;包含DNA、RNA或二者的核酸分子;以及本领域已知的其他种类多核苷酸。一种类型的载体是“质粒”,该质粒是指一种环状双链DNA环,可以诸如通过标准分子克隆技术向该环中插入另外的DNA 区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于包装到病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒以及腺相关病毒)中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在引入到宿主细胞后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。此外,某些载体能够引导它们可操作地连接的基因的表达。此类载体在此被称为“表达载体”。用于真核细胞并在真核细胞中表达的载体在本文中可以称为“真核表达载体”。在重组DNA技术中实用的常见表达载体常常是质粒形式。

重组表达载体可以包含处于适用于核酸在宿主细胞中表达的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调节元件,这些调节元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指感兴趣的核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调节元件。

术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点 (IRES)以及其他表达控制元件(例如,转录终止信号,诸如多聚腺苷酸化信号和聚U序列)。此类调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中。调节元件包括引导核苷酸序列在许多类型的宿主细胞中连续表达的那些元件和引导核苷酸序列仅在某些宿主细胞中表达的那些元件(例如,组织特异性调节序列)。组织特异性启动子可以引导主要在希望的感兴趣的组织诸如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如,肝脏、胰脏)、或特定细胞类型 (例如,淋巴细胞)中的表达。调节元件还可以时间依赖性方式诸如细胞周期依赖性或发育阶段依赖性方式引导表达,这可以是或也可以不是组织特异性或细胞类型特异性的。在一些实施方式中,体包含一个或多个pol III启动子(例如,1、2、3、4、5、或更多个pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5、或更多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5、或更多个pol I启动子) 或其组合。pol III启动子的实例包括但不限于,U6和H1启动子。pol II 启动子的实例包括但不限于,逆转录病毒劳斯氏肉瘤病毒(RSV)LTR 启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,Boshart等,Cell,41:521-530(1985)]、 SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、以及EF1α启动子。术语“调节元件”还涵盖增强子元件,诸如WPRE;CMV增强子;HTLV-I的LTR中的R-U5’区段(Mol.Cell. Biol.,Vol.8(1),p.466-472,1988);SV40增强子;以及兔β-球蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,Vol.78(3),p. 1527-31,1981)。本领域技术人员将了解的是,表达载体的设计可以取决于诸如有待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以引入到宿主细胞中从而产生由在此所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,成簇规律间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。

有利的载体包括慢病毒和腺伴随病毒并且此类载体类型还可以针对靶向的特定细胞类型来选择。

如在此所用,术语VI型CRISPR-Cas座位效应蛋白的“crRNA”或“指导RNA”或“单一指导RNA”或“sgRNA”或“一种或多种核酸组分”包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并引导核酸靶向复合物与靶核酸序列的序列特异性结合的任何多核苷酸序列。

在某些实施方式中,如本文所提供的CRISPR系统可以利用包含指导序列的crRNA或类似的多核苷酸,其中所述多核苷酸是RNA、DNA 或者RNA和DNA的混合物,和/或所述多核苷酸包含一种或多种核苷酸类似物。所述序列可以包含任何结构,包括但不限于天然crRNA的结构,如凸起、发夹或茎环结构。在某些实施方式中,包含指导序列的多核苷酸与第二多核苷酸序列形成双链体,所述第二多核苷酸序列可以是RNA 或DNA序列。

在某些实施方式中,本发明的指导包括非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物,和/或化学修饰。非天然存在的核酸可以包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸和/或碱基部分被修饰在本发明的一个实施方式中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方式中,指导序列包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的一个实施方式中,指导序列包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2’和4’碳原子之间的亚甲基桥的锁定核酸(LNA)或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2’-O- 甲基类似物、2’-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或 2'-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2’-O-甲基(M)、2’-O-甲基-3’-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基(cEt),或2’-O-甲基-3’-硫代PACE(MSP)。此类化学修饰的指导序列与未修饰的指导序列相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见,Hendel,2015, Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年06月29日网络发表;Allerson等,J.Med.Chem.2005,48:901-904;Bramsen等,Front.Genet.,2012,3:154;Deng等,PNAS,2015,112:11870-11875;Sharma等, MedChemComm.,2014,5:1454-1471;Li等,Nature Biomedical Engineering, 2017,1,0066DOI:10.1038/s41551-017-0066)。

在一些实施方式中,指导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等,2016,J.Biotech.233:74-83)。在某些实施方式中,指导序列在结合至靶DNA的区域中包含核糖核苷酸,并在结合至Cas9、Cpf1 或C2c1的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的一个实施方式中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化指导结构(诸如但不限于5’端和/或3’端、茎环区和种子区)中。在某些实施方式中,修饰不在茎环区的5’柄(5’-handle)中。指导序列的茎环区的5’柄中的化学修饰可能会废除其功能(参见Li等,Nature Biomedical Engineering,2017,1:0066)。在某些实施方式中,指导序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、 50或75个核苷酸经化学修饰。在一些实施方式中,指导序列的3’或5’端的3-5个核苷酸经化学修饰。在一些实施方式中,在种子区中仅引入较小的修饰,诸如2’-F修饰。在一些实施方式中,在指导序列的3’端引入2’-F修饰。在某些实施方式中,指导序列的5’和/3’端的3至5个核苷酸用2’-O-甲基(M)、2’-O-甲基3’硫代磷酸酯(MS)、S-约束乙基(cEt)或2’-O-甲基3’硫代PACE(MSP)化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方式中,指导序列的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方式中,指导序列的5’和/3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)化学修饰。这种化学修饰的指导序列可以介导增强的基因破坏水平(参见Ragdarm等, 0215,PNAS,E7110-E7111)。在本发明的一个实施方式中,指导序列被修饰成在其3’和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫代基、二苯并环辛炔(DBCO)或若丹明。在某些实施方式中,化学部分通过接头诸如烷基链缀合至指导序列。在某些实施方式中,修饰的指导序列的化学部分可用于将指导序列附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学修饰的指导序列可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等,eLife,2017, 6:e25312,DOI:10.7554)。

在一些实施方式中,对指导序列的修饰是化学修饰、插入、缺失或拆分。在一些实施方式中,化学修饰的实例包括但不限于并入2’-O-甲基 (M)类似物、2’-脱氧类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、 2’-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2’-O-甲基-3’- 硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS)或2’-O-甲基-3’-硫代PACE(MSP)。在一些实施方式中,指导序列包含一种或多种硫代磷酸酯修饰。在某些实施方式中,指导序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或25 个核苷酸经化学修饰。在某些实施方式中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方式中,在3’端的一个或多个核苷酸经化学修饰。在某些实施方式中,5’柄中的核苷酸均未经化学修饰。在一些实施方式中,种子区中的化学修饰是次要修饰,诸如并入2’-氟类似物。在具体实施方式中,种子区的一个核苷酸被2’-氟类似物替代。在一些实施方式中,3’端中的5或10个核苷酸经化学修饰。在Cpf1 CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等,NatureBiomedical Engineering,2017,1:0066)。在具体实施方式中,3’端中的5个核苷酸被 2’-氟类似物替代。在具体实施方式中,3’端中的10个核苷酸被2’-氟类似物替代。在具体实施方式中,3’端中的5个核苷酸被2’-O-甲基(M) 类似物替代。

在一些实施方式中,指导序列的5’柄的环经修饰。在一些实施方式中,指导序列的5’柄的环被修饰为具有缺失、插入、拆分或化学修饰。在某些实施方式中,环包含3、4或5个核苷酸。在某些实施方式中,环包含序列UCUU、UUUU、UAUU或UGUU。

在一个方面中,引导物包括通过非磷酸二酯键化学连接或共轭的部分。在一个方面中,在一个非限制性实例中,该引导物包括通过非核苷酸环化学连接或缀合的正向重复序列部分和靶向序列部分。在一些实施方式中,这些部分通过非磷酸二酯共价接头连接。共价接头的实例包括但不限于选自以下的化学修饰:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、富勒烯、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键、C-C键形成基团,如Diels-Alder环加成对或闭环易位对和Michael 反应对。

在一些实施方式中,首先使用标准亚磷酰胺合成方法合成指导的各部分(Herdewijn,P.编著,Methods in Molecular Biology Col 288, OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在一些实施方式中,使用本领域已知的标准方案,可以将非靶向引导部分官能化以包含合适的用于连接的官能团(Hermanson, G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯代羰基、咪唑基羰基、氢叠氮化物、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、亚磺酰基、烯丙基、炔丙基、二烯、炔和叠氮化物。一旦指导的非靶向部分被官能化,就可以在两个寡核苷酸之间形成共价化学键或键。示例性的化学键包括但不限于基于氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、富勒烯、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键、C-C键形成基团,如Diels-Alder环加成对或闭环易位对和Michael反应对的那些。

在一些实施方式中,指导的一个或多个部分可以是化学合成的。在一些实施方式中,化学合成使用具有2’-乙酰氧基乙基原酸酯(2’-ACE) 的自动化固相寡核苷酸合成机(Scaringe等,J.Am.Chem.Soc.(1998)120: 11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2’-硫代氨基甲酸酯(2’-TC)化学(Dellinger等,J.Am.Chem.Soc.(2011)133: 11540-11546;Hendel等,Nat.Biotechnol.(2015)33:985-989)。

在一些实施方式中,通过修饰糖、核苷酸间磷酸二酯键、嘌呤和嘧啶残基,可以使用各种生物缀合反应、环、桥和非核苷酸键将引导部分共价连接。Sletten等,Angew.Chem.Int.Ed.(2009)48:6974-6998; Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等, Oligonucleotides(2008)18:305-19;Watts等,Drug.Discov.Today(2008) 13:842-55;Shukla等,ChemMedChem(2010)5:328-49。

在一些实施方式中,可以使用点击化学将指导部分共价连接。在一些实施方式中,可以使用三唑接头指导部分共价连接。在一些实施方式中,可以使用涉及炔烃和叠氮化物的Huisgen 1,3-偶极环加成反应将导向部分共价连接,以产生高度稳定的三唑连接基(He等,ChemBioChem (2015)17:1809-1812;WO 2016/186745)。在一些实施方式中,通过连接5’-己炔部分和3’-叠氮化物部分将指导部分共价连接。在一些实施方式中,5’-己炔指导部分和3’-叠氮化物指导部分中的一个或两个都可以用 2’-乙酰氧基乙基原酸酯(2’-ACE)基团保护,随后可以使用Dharmacon 方案将其除去(Scaringe等,J.Am.Chem.Soc.(1998)120:11820-11821; Scaringe,Methods Enzymol.(2000)317:3-18)。

在一些实施方式中,指导部分可以通过接头(例如,非核苷酸环) 共价连接,该接头包含诸如间隔子、附着、生物缀合物、生色团、报道基团、染料标记的RNA和非天然存在的核苷酸类似物的部分。更具体地,用于本发明目的的合适的间隔子包括但不限于聚醚(例如,聚乙二醇、多元醇、聚丙二醇或乙烯和丙二醇的混合物),聚胺基团(例如,斯潘宁、亚精胺及其聚合物衍生物)、聚酯(例如,聚(丙烯酸乙酯))、聚磷酸二酯、亚烷基及其组合。合适的附接物包括可以被添加到接头以向接头增加附加性质的任何部分,例如但不限于荧光标记。合适的生物缀合物包括但不限于肽、糖苷、脂质、胆固醇、磷脂、二酰基甘油和二烷基甘油、脂肪酸、烃、酶底物、类固醇、生物素、洋地黄毒苷、碳水化合物、多糖。合适的生色团、报道基团和染料标记的RNA包括但不限于荧光染料,例如荧光素和若丹明、化学发光、电化学发光和生物发光标记化合物。将两个RNA组分缀合的示例接头的设计也在WO 2004/015075中进行了描述。

接头(例如,非核苷酸环)可以是任何长度。在一些实施方式中,接头的长度约等于0-16个核苷酸。在一些实施方式中,接头的长度约等于0-8个核苷酸。在一些实施方式中,接头的长度约等于0-4个核苷酸。在一些实施方式中,接头的长度约等于2个核苷酸。示例性接头设计也在WO2011/008730中进行了描述。

在一些实施方式中,当使用合适的比对算法进行最佳比对时,互补度约为或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。可以使用任何合适的用于比对序列的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman算法)、尼德曼 -翁施算法(Needleman-Wunsch算法)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如,巴罗斯-维勒比对仪 (Burrows WheelerAligner)、ClustalW、Clustal X、BLAT、Novoalign (Novocraft Technologies;在www.novocraft.com上可得)、ELAND (Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得) 和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定指导序列(在RNA靶向指导RNA或crRNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。例如,足以形成核酸靶向复合物的RAN靶向CRISPR-Cas系统的组分,包括有待测试的指导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如,切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列) 和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择指导序列并且因此选择核酸靶向指导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方式中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA (miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方式中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方式中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方式中,靶序列可以是mRNA分子或前体mRNA分子内的序列。

在一些实施方式中,选择RNA靶向指导RNA或crRNA以降低RNA 靶向指导RNA或crRNA内的二级结构程度。在一些实施方式中,当最佳折叠时,RNA靶向指导RNA的约或小于约75%、50%、40%、30%、 25%、20%、15%、10%、5%、1%或更少的核苷酸参与自身互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能(Gibbs free energy)。一种此类算法的实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的 mFold。另一个示例性折叠算法是维也纳大学(University of Vienna)的理论化学研究所开发的使用质心结构预测算法的在线网络服务器 RNAfold(参见例如,A.R.Gruber等,2008,Cell 106(1):23-24;和PA Carr andGM Church,2009,Nature Biotechnology 27(12):1151-62)。

在一些实施方式中,设计或选择靶向核酸的指导序列以调节指导分子之间,例如不同指导分子的茎环区域之间的分子间相互作用。应当理解,碱基对形成茎环的指导中的核苷酸也能够与第二个指导进行碱基配对以形成分子间双链体,并且这种分子间双链体将不具有与CRISPR复合物形成相容的二级结构。因此,对于选择或设计DR序列以调节茎环形成和CRISPR复合物形成是有用的。在一些实施方式中,大约或低于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更低的核酸靶向指导是在分子间双链体中。应当理解,茎-环变异通常将在 DR-CRISPR效应子相互作用所施加的限度内。调节茎环形成或改变茎环与分子间双链体之间平衡的一种方法是改变DR茎环的茎中的核苷酸对。例如,在一个实施方式中,G-C对被替代为A-U或U-A对。在另一个实施方式中,A-U对被替代为G-C或C-G对。在另一个实施方式中,天然存在的核苷酸被替代为核苷酸类似物。调节茎环形成或改变茎环与分子间双链体之间的平衡的另一种方法是修饰DR的茎环的环。不希望受到理论的束缚,该环可以看作是插入序列,其侧翼是两个彼此互补的序列。当该插入序列不是自身互补的时,其作用将是破坏分子间双链体的形成。当多重复用指导时,适用相同的原理:虽然靶向序列可能不同,但修改不同指导的DR中的茎环区域可能是有利的。此外,当对指导进行多重复用时,可以通过平衡每个指导的活动来调节不同指导的相对活动。在某些实施方式中,确定分子间茎环与分子间双链体之间的平衡。该确定可以通过物理或生化手段进行,并且可以在存在或不存在CRISPR效应子的情况下进行。

在某些实施方式中,指导RNA或crRNA可以包含,基本上由正向重复(DR)序列和指导序列或间隔子序列组成或由其组成。在某些实施方式中,指导RNA或crRNA可以包含,基本上由或由与指导序列或间隔子序列融合或连接的正向重复序列组成。在某些实施方式中,正向重复序列可以位于指导序列或间隔区序列上游(即,5’)。在其他实施方式中,正向重复序列可以位于指导序列或间隔区序列下游(即,3’)。在其他实施方式中,可以存在多重DR(如双重DR)。

在某些实施方式中,crRNA包含茎环,优选单个茎环。在某些实施方式中,正向重复序列形成茎环,优选单个茎环。

在某些实施方式中,指导RNA的间隔子长度为15至35nt。在某些实施方式中,指导RNA的间隔区长度为至少15个核苷酸。在某些实施方式中,间隔区长度为15至17nt,例如,15、16或17nt;17至20nt,例如17、18、19或20nt;20至24nt,例如20、21、22、23或24nt; 23至25nt,例如23、24或25nt;24至27nt,例如24、25、26或27nt; 27-30nt,例如27、28、29或30nt;30-35nt,例如30、31、32、33、 34或35nt;或35nt或更长。

“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以进行杂交的任何多核苷酸序列。在通常情况下,互补度是指沿着两个序列中较短的一个序列的sca序列和tracr序列的最佳比对。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步考虑二级结构,例如sca 序列或tracr序列内的自互补性。在一些实施方式中,最优比对时,tracr 序列和sca序列沿着两者较短者的长度的互补程度约为或大于约25%、 30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在某些实施方式中,tracrRNA可能是不需要的。实际上,来自动物溃疡伯格菌(Bergeyella zoohelcum)及其直系同源物的CRISPR-Cas效应蛋白不需要tracrRNA来确保RNA靶标的切割。

在进一步细节中,如下针对DNA靶进行测定。在此测定中使用两种大肠杆菌菌株。一种携带编码来自细菌菌株的内源性效应蛋白座位的质粒。另一种菌株携带空质粒(例如pACYC184,对照菌株)。将所有可能的7或8bp PAM序列呈递在抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。将PAM定位成靠近原型间隔区1的序列(内源性效应蛋白座位中的第一间隔区的DNA靶)。克隆了两个PAM文库。一个具有原型间隔区的8个随机bp 5’(例如总的65536个不同PAM序列=复杂度)。另一个文库具有原型间隔区的7个随机bp 3’(例如总复杂度是16384个不同的PAM)。将两个文库克隆成具有平均500个质粒/可能的PAM。用5’PAM和3’PAM文库在单独的转化中转化测试菌株和对照菌株并且将转化的细胞分别接种在氨苄青霉素板上。使用质粒的识别和随后的切割/干扰使得细胞对氨苄青霉素易感并且阻止了生长。转化后大约12h,收获由测试菌株和对照菌株形成的所有群落并且分离出质粒 DNA。使用质粒DNA作为用于PCR扩增和随后的深度测序的模板。未转化的文库中的所有PAM的表现度显示转化细胞中的PAM的预期表现度。对照菌株中发现的所有PAM的表现度显示真实的表现度。测试菌株中的所有PAM的表现度显示哪个PAM未被酶识别并且与对照菌株的比较允许提取出缺失的PAM的序列。在特定实施方式中,切割(如PNA 切割)不是PAM依赖性的。实际上,对于动物溃疡伯格菌(Bergeyella zoohelcum)Cas13b效应蛋白及其直系同源物,RNA靶标裂解似乎是PAM 非依赖性的,因此本发明的表1Cas13b可以以PAM非依赖性的方式起作用。

为了使毒性和脱靶作用最小化,控制递送的靶向RNA的指导RNA 的浓度将很重要。可以通过在细胞或非人真核生物动物模型中测试不同的浓度并使用深度测序来分析潜在脱靶基因组基因座的修饰程度来确定 Cas mRNA或蛋白和指导RNA的最佳浓度。给出基于靶修饰的最高水平,同时最小化的脱靶修饰的水平的浓度应被选择用于体内递送。RNA靶向系统有利地衍生自CRISPR-Cas系统。在一些实施方式中,RNA靶向系统的一个或多个元件来自特定生物,该特定生物包括如本文所述的表1-4 Cas13效应蛋白系统的内源RNA靶向系统。

死指导序列

在一个方面中,本发明提供了以允许形成CRISPR Cas复合物并成功与靶标结合的方式进行修饰的指导序列,而同时不允许或不允许成功的核酸酶活性(即,无核酸酶活性/没有indel活性)。为了说明的目的,这种修饰的指导序列被称为"死指导”或“死指导序列”。就核酸酶活性而言,可以认为这些死指导或死指导序列是催化失活的或构象失活的。实际上,死指导序列就促进催化活性或区分靶上和靶外结合活性的能力而言可能不足以参与生产性碱基配对。简而言之,该测定涉及合成CRISPR 靶RNA和包含与靶RNA错配的指导RNA,将其与RNA靶向酶结合,并基于裂解产物产生的条带的存在情况基于凝胶分析裂解,并基于相对条带强度定量裂解。

因此,在相关方面,本发明提供了非天然存在的或工程化组合物RNA 靶向CRISPR-Cas系统,其包含本文所述的功能性RNA靶向酶,以及指导RNA(gRNA)或crRNA,其中所述gRNA或crRNA包含死亡的RNA。指导序列,其中gRNA能够与靶序列杂交,从而将靶向CRISPR-Cas系统的RNA定向到细胞中的目标基因组位点,而该系统的非突变RNA靶向酶没有可检测的RNA裂解活性。应当理解,如本文其他地方所述,根据本发明的任何gRNA或crRNA可以用作包含死指导序列的死亡 gRNA/crRNA。

可以通过任何合适的测定来评估死指导序列指导CRISPR复合物与 RNA靶序列的序列特异性结合的能力。例如,可将足以形成CRISPR-Cas 复合体的CRISPR-Cas系统组分(包括待测试的死指导序列)提供给具有相应靶序列的宿主细胞,如通过用编码系统组成部分的载体转染,然后评估靶序列内的优先切割。

如本文进一步解释的,几个结构参数允许适当的框架到达这样的死指导。死指导序列通常可以短于相应的指导序列,从而导致活性RNA裂解。在特定实施方式中,死指导比对应的相同指导短5%、10%、20%、30%、40%、50%或更短。

如下述解释和本领域公知的,gRNA或crRNA的一个方面——RNA 靶向特异性是正向重复序列,该序列应适当地连接至此类指导。特别是,这意味着正向重复序列的设计取决于RNA靶向酶的来源。可用于验证的死指导序列的结构数据可用于设计CRISPR-Cas特异性等同物。例如,两个或多个CRISPR-Cas效应蛋白的直向同源核酸酶结构域HEPN之间的结构相似性可用于转移设计等效的死指导。因此,本文的死指导可以在长度和序列上进行适当修饰以反映这种CRISPR-Cas特异性等同物,从而允许形成CRISPR-Cas复合物并成功结合靶RNA,而同时不允许成功的核酸酶活性。

死指导允许人们使用gRNA或crRNA作为基因靶向的手段,而无核酸酶活性的结果,同时提供了激活或抑制的直接手段。可以修饰包含死指导的指导RNA或crRNA,使其以允许激活或抑制基因活性的方式进一步包括元件,尤其是本文其他地方所述的允许基因效应物(例如,基因活性的激活剂或阻遏物)功能性定位的蛋白质衔接子(例如,适体)。一个例子是掺入适体,如本文和现有技术中所述。通过工程化包含死指导的gRNA或crRNA来掺入与蛋白质相互作用的适体(Konermann等,“Genome-scale transcription activation by anengineered CRISPR-Cas9 complex,”doi:10.1038/nature14136,其通过引用并入本文),可以组装多个不同的效应物结构域。其可以在自然过程之后进行建模。

一般的CAS13

本发明提供了特别的Cas13效应物、核酸、载体和使用方法。Cas13 的特征和功能也可以是本文所述的其他CRISPR-Cas蛋白的特征和功能。

如本文所用,术语Cas13b-s1辅助蛋白、Cas13b-s1蛋白质、Cas13b-s1、 Csx27和Csx27蛋白可互换使用,术语Cas13b-s2辅助蛋白、Cas13b-s2 蛋白、Cas13b-S2,Csx28和Csx28蛋白可以互换使用。

在特定实施方式中,野生型Cas13效应蛋白具有RNA结合和切割功能。

在特定实施方式中,(野生型或突变的)Cas13效应蛋白可以具有 RNA和/或DNA切割功能,优选RNA切割功能。在这些实施方式中,可以基于本文提供的效应蛋白提供本发明的方法,所述效应蛋白理解如本文所讨论的在真核细胞中(在体外,即在分离的真核细胞中)诱导一种或多种突变,包括将本文所讨论的载体递送至细胞。所述突变可以包括通过指导RNA或sgRNA或crRNA在细胞的每个靶序列上引入、缺失或取代一个或多个核苷酸。所述突变可以包括通过指导RNA或sgRNA 或crRNA在细胞的每个靶序列上引入,缺失或取代一个或多个核苷酸。所述突变可包括通过指导RNA或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代1-75个核苷酸。突变可以包括通过指导RNA 或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代1、5、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代10、11、12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代20、21、22、23、24、25、26、27、28、 29、30、35、40、45、50或75个核苷酸。突变可以包括通过指导RNA或sgRNA或crRNA在所述细胞的每个靶序列上引入,缺失或取代40、 45、50、75、100、200、300、400或500个核苷酸。

为了使毒性和脱靶作用最小化,控制递送的Cas13 mRNA和指导 RNA的浓度将很重要。可以通过在细胞或非人真核生物动物模型中测试不同的浓度并使用深度测序来分析潜在脱靶基因组基因座的修饰程度来确定Cas13 mRNA或蛋白和指导RNA的最佳浓度。使毒性和脱靶效应最小化的指导序列和策略可以在WO 2014/093622(PCT/US2013/074667) 中;或,通过此处的突变。

编码Cas13的核酸分子有利地是密码子优化的。密码子优化序列的一个例子,在这种情况下是为在真核生物例如人中表达而优化的序列 (即,为在人中表达而优化),或为本文所讨论的另一种真核生物,动物或哺乳动物而优化的序列;参见例如,WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化序列。尽管这是优选的,但应理解,其他实例也是可能的,并且已知除人类以外的宿主物种的密码子优化或针对特定器官的密码子优化。在一些实施方式中,对编码Cas 的酶编码序列进行密码子优化以在特定细胞如真核细胞中表达。真核细胞可以是诸如哺乳动物的特定生物的细胞或衍生自其的细胞,所述哺乳动物包括但不限于本文所述的人或非人真核生物或动物或哺乳动物,例如小鼠,大鼠,兔,狗,家畜或非人类的哺乳动物或灵长类动物。在一些实施方式中,可能不包括用于修饰人类种系遗传特性的过程和/或用于修饰可能导致人类遭受痛苦而对人或动物没有任何实质性医学益处的动物的过程,以及由此过程产生的动物。在通常情况下,密码子优化是指通过替换至少一个密码子(例如约或大于约1、2、3、4、5、10、15、 20、25、50或50个以上的密码子)和在该宿主细胞的基因中更常用或最常用的密码子,同时又保留了天然氨基酸序列。各种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA (mRNA)的翻译效率又被认为尤其取决于翻译的密码子的性质和特定密码子。转移RNA(tRNA)分子的可用性。所选tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。所选tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物中最佳基因表达。密码子使用情况表是易于获得的,例如,可在www.kazusa.orjp/codon/中获得“密码子使用数据库”,这些表可以通过多种方式进行修改。参见,Nakamura,Y.等,“Codonusage tabulated from the international DNA sequence databases:status for theyear 2000”Nucl.Acids Res.28:292(2000)。还可以使用用于优化特定序列以在特定宿主细胞中表达的密码子的计算机算法,例如Gene Forge(Aptagen; Jacobus,PA)。在一些实施方式中,编码Cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多或所有密码子) 对应于特定氨基酸最常用的密码子。

在一些实施方式中,Cas13可以直接在靶序列的位置或附近(例如,在靶序列和/或内部)切割一条或两条核酸链,如在靶序列的互补序列之内或在与靶序列相关的序列之内,例如,从目标序列的第一个或最后一个核苷酸开始在大约1、2、3、4、5、6、7、8、9、10、15、20、25、 50、100、200、500或更多个碱基对之内。在一些实施方式中,Cas13蛋白可指导靶序列内和/或靶序列的互补序列内或与靶序列相关的序列中的一条或两条链的不止一个切割(例如一,二,三,四,五或更多个切割)。靶序列和/或距第一个或最后一个碱基对约1、2、3、4、5、6、7、 8、9、10、15、20、25、50、100、200、500或更多个碱基对内靶序列的核苷酸。在一些实施方式中,切割可以是钝的,即,产生钝末端。在一些实施方式中,切割可以是错开的,即产生粘性末端。。在一些实施方式中,载体编码可以相对于相应的野生型酶突变的靶向核酸的Cas13 蛋白,使得突变的靶向核酸的Cas13蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力,例如,在HEPN结构域中的改变或突变以产生基本上没有所有RNA切割活性的突变Cas13,例如,该突变酶的RNA 切割活性大约不超过25%、10%、5%、1%、0.1%、0.01%或以下非突变形式的酶的核酸裂解活性;一个例子可以是当突变形式的核酸切割活性与非突变形式相比为零或可忽略时。所谓衍生,申请人是指衍生的酶在很大程度上与野生型酶具有高度的序列同源性,但是它已经以本领域已知或本文描述的某种方式进行了突变(修饰)。

通常,在内源性RNA靶向系统的情况下,RNA靶向复合物(包含与靶序列杂交并与一种或多种RNA靶向效应蛋白复合的指导RNA或 crRNA)的形成导致RNA链断裂(一个或多个)在靶序列中或其附近(例如,在1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对之内)。如本文所用,术语“与感兴趣的靶基因座相关的序列”是指靠近靶序列附近的序列(例如在1、2、3、4、5、6、7、8、9、10、20、50或更多个来自靶序列的碱基对,其中靶序列包含在感兴趣的靶基因座内)。

密码子优化序列的一个例子,在这种情况下是为在真核生物例如人中表达而优化的序列(即,为在人中表达而优化),或为本文所讨论的另一种真核生物,动物或哺乳动物而优化的序列;参见例如,WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化序列(根据本领域的知识和本公开内容,密码子优化编码核酸分子,尤其是关于效应子蛋白(例如,Cas13)的密码子优化在本领域技术人员的能力范围内)。尽管这是优选的,但应理解,其他实例也是可能的,并且已知除人类以外的宿主物种的密码子优化或针对特定器官的密码子优化。在一些实施方式中,对编码靶向RNA的Cas13蛋白的酶编码序列进行密码子优化以在特定细胞如真核细胞中表达。真核细胞可以是诸如哺乳动物的特定生物的细胞或衍生自其的细胞,所述哺乳动物包括但不限于本文所述的人或非人真核生物或动物或哺乳动物,例如小鼠,大鼠,兔,狗,家畜或非人类哺乳动物或灵长类动物。在一些实施方式中,可能不包括用于修饰人类种系遗传特性的过程和/或用于修饰可能导致人类遭受痛苦而对人或动物没有任何实质性医学益处的动物的过程,以及由此过程产生的动物。在通常情况下,密码子优化是指通过置换至少一个密码子(例如,约或大于约1、2、3、4、5、10、15、20、25、50或更多个密码子)和在该宿主细胞的基因中更常用或最常用的密码子,同时又保持了天然氨基酸序列。各种物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率又被认为尤其取决于翻译的密码子的性质和特定密码子的转移RNA(tRNA)分子可用性。所选tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。所选 tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物中最佳基因表达。密码子使用情况表是易于获得的,例如,可在www.kazusa.orjp/codon/中获得“密码子使用数据库”,这些表可以通过多种方式进行修改。参见,Nakamura,Y. 等,“Codon usage tabulated from the international DNA sequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)。还可以使用用于优化特定序列以在特定宿主细胞中表达的密码子的计算机算法,例如 Gene Forge(Aptagen;Jacobus,PA)。在一些实施方式中,编码DNA/RNA 靶向Cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、 20、25、50或更多或所有密码子)对应于特定氨基酸最常用的密码子。

(i)Cas13或编码它的核酸分子或(ii)crRNA可以分开递送;且有利地,(i)和(ii)之一,例如组装的复合物,是通过颗粒或纳米颗粒复合物递送的。可以在靶向RNA的指导RNA或crRNA之前递送靶向 RNA的效应蛋白mRNA,以留出时间表达靶向核酸的效应蛋白。靶向RNA的效应蛋白(Cas13)mRNA可以在施用RNA靶向的指导RNA或 crRNA之前1-12小时(最好在2-6小时左右)施用。或者,可以一起施用靶向RNA的效应蛋白mRNA和靶向RNA的指导RNA或crRNA。有利地,可以在初次施用靶向RNA的效应子(Cas13)蛋白mRNA+指导 RNA后1-12小时(优选约2-6小时)施用指导RNA或crRNA的第二加强剂量。靶向RNA的效应蛋白mRNA和/或指导RNA或crRNA的其他给药可能对获得最有效的基因组修饰水平有用。

在一个方面中,本发明提供了使用RNA靶向系统的一个或多个元件的方法。本发明的靶向RNA的复合物提供了修饰单链或双链,线性或超螺旋靶RNA的有效手段。本发明的靶向RNA的复合物具有多种用途,包括修饰(例如,缺失,插入,转运,失活,活化)多种细胞类型的靶 RNA。因此,本发明的靶向RNA的复合物在例如基因治疗,药物筛选,疾病诊断和预后方面具有广泛的应用。示例性的RNA靶向复合物包括与与感兴趣的靶基因座内的靶序列杂交的指导RNA或crRNA复合的RNA 靶向效应蛋白。

在一个实施方式中,本发明提供了一种切割靶RNA的方法。该方法可以包括使用与靶RNA结合并实现所述靶RNA的切割的RNA靶向复合物来修饰靶RNA。在一个实施方式中,本发明的靶向RNA的复合物被引入细胞中时,可在RNA序列中产生断裂(例如,单链断裂或双链断裂)。例如,该方法可用于裂解细胞中的疾病RNA。例如,可以将包含要被整合的序列侧接上游序列和下游序列的外源RNA模板引入细胞中。上游和下游序列与RNA中整合位点的任一侧共享序列相似性。需要时,供体 RNA可以是mRNA。外源RNA模板包含要整合的序列(例如,突变的 RNA)。整合序列可以是细胞内源或外源的序列。待整合的序列的实例包括编码蛋白质的RNA或非编码RNA(例如,微小RNA)。因此,用于整合的序列可以可操作地连接至合适的一个或多个控制序列。备选地,要整合的序列可以提供调节功能。选择外源RNA模板中的上游和下游序列以促进目的RNA序列和供体RNA之间的重组。上游序列是与用于整合的靶位点上游的RNA序列具有序列相似性的RNA序列。类似地,下游序列是与整合靶位点下游的RNA序列具有序列相似性的RNA序列。外源RNA模板中的上游和下游序列可以与目标RNA序列具有75%, 80%,85%,90%,95%,或100%的序列同一性。优选地,外源RNA模板中的上游和下游序列与靶RNA序列具有约95%,96%,97%,98%, 99%,或100%的序列同一性。在一些方法中,外源RNA模板中的上游和下游序列与靶RNA序列具有约99%或100%的序列同一性。上游或下游序列可包含约20bp至约2500bp,例如,约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500, 1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性的上游或下游序列具有约200bp至约2000bp,约600bp至约1000bp,或更特别地约700bp至约1000bp。在一些方法中,外源RNA模板可以进一步包含标记。这样的标记可以使针对目标集成的筛选变得容易。合适的标记的例子包括限制性位点,荧光蛋白或选择标记。可以使用重组技术构建本发明的外源RNA模板(参见,例如, Sambrook等,2001和Ausubel等,1996)。在通过整合外源RNA模板来修饰靶RNA的方法中,通过核酸靶向复合物将断裂(例如,双链或单链RNA中的双链或单链断裂)引入RNA序列,该断裂被修复。通过与外源RNA模板的同源重组,从而将模板整合到RNA靶标中。双链断裂的存在促进了模板的整合。在其他实施方式中,本发明提供了一种修饰 RNA在真核细胞中表达的方法。该方法包括通过使用与DNA或RNA(例如,mRNA或pre-mRNA)结合的核酸靶向复合物来增加或减少靶多核苷酸的表达。在一些方法中,可以使靶RNA失活以影响细胞中表达的修饰。例如,在RNA靶向复合物与细胞中的靶序列结合后,靶RNA被灭活,使得该序列不被翻译,不产生编码蛋白或该序列不作为野生型起作用。顺序呢。例如,可以使蛋白质或微RNA编码序列失活,从而不产生蛋白质或微RNA或前微RNA转录物。RNA靶向复合物的靶RNA可以是真核细胞内源性或外源性的任何RNA。例如,靶RNA可以是存在于真核细胞核中的RNA。靶RNA可以是编码基因产物(例如蛋白质)的序列 (例如mRNA或mRNA前体)或非编码序列(例如ncRNA,lncRNA, tRNA或rRNA)。靶RNA的例子包括与信号生化途径相关的序列,例如与信号生化途径相关的RNA。靶RNA的实例包括疾病相关RNA。“与疾病相关的”RNA是指与受感染的组织或组织相比,在受疾病影响的组织得到的细胞中,以异常水平或异常形式产生翻译产物的任何RNA。

在一些实施方式中,该方法可以包括使靶向RNA的复合物与靶RNA 结合以实现所述靶RNA的切割,从而修饰靶RNA,其中所述靶向RNA 的复合物包含靶向核酸的效应子(Cas13与指导RNA或crRNA复合的蛋白质,所述指导RNA或crRNA与所述靶RNA内的靶序列杂交。在一个方面中,本发明提供了一种在真核细胞中修饰RNA表达的方法。在一些实施方式中,该方法包括使靶向RNA的复合物结合至RNA,使得所述结合导致所述RNA的表达增加或减少。其中靶向RNA的复合物包含与指导RNA复合的核酸靶向效应子(Cas13)蛋白。修饰靶RNA的方法可以在真核细胞中,其可以在体内,离体或体外。在一些实施方式中,该方法包括从人或非人动物中取样细胞或细胞群,并修饰该细胞。培养可以在离体的任何阶段进行。所述一种或多种细胞甚至可以重新引入非人类动物或植物中。对于重新导入的细胞,特别优选的是细胞是干细胞。

两种不同适体的使用(每个均与不同的靶向RNA的指导RNA相关) 允许使用激活剂-适配器蛋白融合体和阻抑剂-蛋白融合体,并使用不同的靶向RNA的指导RNA或crRNA激活蛋白的表达。RNA,同时抑制另一个。它们以及它们不同的指导RNA或crRNA可以以多重方式一起或基本上一起施用。可以同时全部使用大量此类修饰的靶向RNA的指导RNA 或crRNA,例如10或20或30等,而效应蛋白(Cas13)仅一种(或最少数量)由于递送相对较少数量的效应蛋白分子可与大量修饰的引导物一起使用,因此需要递送这些分子。衔接子蛋白可以与一种或多种激活剂或一种或多种抑制子缔合(优选连接或融合)。例如,衔接蛋白可以与第一活化剂和第二活化剂相关。第一和第二活化剂可以相同,但是优选它们是不同的活化剂。可以使用三个或更多或什至四个或更多的活化剂(或阻遏物),但包装尺寸可能会限制其数量高于5个不同的功能域。优选在与衔接蛋白直接融合的情况下使用接头,其中两个或更多个功能域与衔接蛋白缔合。合适的链接器可能包括GlySer链接器。

还可以设想,靶向RNA的效应蛋白指导RNA复合物整体上可以与两个或更多个功能域结合。例如,可能有两个或多个与靶向RNA的效应子蛋白相关的功能域,或者可能有两个或多个与指导RNA或crRNA相关的功能域(通过一个或多个衔接子蛋白),或者可能有一个或多个与靶向RNA的效应子蛋白相关的更多功能域和与指导RNA或crRNA相关的一个或多个功能域(通过一种或多种衔接蛋白)。

衔接子蛋白与活化剂或阻遏物之间的融合体可包括接头。例如,可以使用GlySer接头GGGS。它们可以以3((GGGGS)3(SEQ ID NO: 79))或6、9甚至12或更多的重复序列使用,以根据需要提供合适的长度。可以在指导RNA与功能域(激活物或阻遏物)之间,或在靶向核酸的效应蛋白与功能域(激活物或阻遏物)之间使用接头。链接器使用户可以设计适当数量的“机械灵活性”。

CRISPR效应子(Cas13)蛋白或其mRNA(或更普遍地为其核酸分子)和指导RNA或crRNA也可以分开给药,例如在给药前1-12小时(最好在2-6小时左右)指导RNA或crRNA或一起引导。初次给药后1-12 小时(最好在2-6小时左右)可以再给予第二次指导RNA或crRNA加强剂量。

Cas13效应蛋白有时在本文中称为CRISPR酶。应当理解,效应蛋白是基于酶或衍生自酶,因此在一些实施方式中,术语“效应蛋白”当然包括“酶”。然而,还应理解,效应蛋白可以按要求以某种方式具有DNA或 RNA结合活性,但不一定具有切割或切刻的活性,包括死Cas效应蛋白的功能。

细胞靶标包括造血干/祖细胞(CD34+);人T细胞;和眼睛(视网膜细胞)–例如,感光细胞前体细胞。

本发明的方法可以进一步包括模板的递送。模板的递送可以通过同时或与任何或所有CRISPR效应蛋白(Cas13)或向导或crRNA的递送同时进行,或者可以通过相同或不同的递送机制进行。

在某些实施方式中,本文描述的方法可以包括提供一种Cas13转基因细胞,其中提供或引入编码一种或多种指导RNA的一种或多种核酸,并在该细胞中与包含一个或多个启动子的调控元件可操作地连接。或更多感兴趣的基因。如本文所用,术语“Cas13转基因细胞”是指已在基因组上整合了Cas13基因的细胞,例如真核细胞。根据本发明,细胞的性质,类型或来源没有特别限制。同样,Cas13转基因导入细胞的方式可以改变,并且可以是本领域已知的任何方法。在某些实施方式中,通过将Cas13 转基因导入分离的细胞中获得Cas13转基因细胞。在某些其他实施方式中,通过从Cas13转基因生物中分离细胞来获得Cas13转基因细胞。举例来说,但不限于,本文所指的Cas13转基因细胞可以衍生自Cas13转基因真核生物,例如Cas13敲入真核生物。参考WO 2014/093622 (PCT/US13/74667),其通过引用并入本文。可以修改转让给Sangamo BioSciences,Inc的,靶向Rosa基因座的美国专利公开号20120017290 和20110265198的方法,以利用本发明的CRISPR Cas系统。也可以修改转让给Cellectis的,旨在靶向Rosa基因座的美国专利公开号20130236946 的方法,以利用本发明的CRISPR Cas系统。通过进一步的示例,参考 Platt等人。等(Cell;159(2):440-455(2014)),描述了Cas9敲入小鼠,其通过引用并入本文。Cas13转基因可进一步包含 Lox-Stop-polyA-Lox(LSL)盒,从而使得可通过Cre重组酶诱导Cas13 表达。或者,可以通过将Cas13转基因引入分离的细胞中来获得Cas13 转基因细胞。转基因的递送系统是本领域众所周知的。举例来说,Cas13 转基因可通过载体(例如,AAV,腺病毒,慢病毒)和/或颗粒和/或颗粒递送而在例如真核细胞中递送,如本文其他地方所述。

本领域技术人员将理解,如本文所指的细胞,例如Cas13转基因细胞,除了具有整合的Cas13基因或当与具有RNA功能的RNA复合时由 Cas13的序列特异性作用引起的突变之外,还可包含其他基因组改变。将 Cas13引导至靶基因座的过程,例如一种或多种致癌突变,例如但不限于在Platt等人(2014),Chen等人(2014)或Kumar等人(2009)中描述的。

在一些实施方式中,Cas13序列与一个或多个核定位序列(NLS)融合,例如约或大于约1、2、3、4、5、6、7、8、9、10或在一些实施方式中,Cas13在氨基末端处或附近,在大约或附近包含约或大于约1、2、 3、4、5、6、7、8、9、10或更多个NLS。羧基末端或附近的NLS数量超过约1,2、3、4、5、6、7、8、9、10或更多,或这些的组合(例如零或至少一个或多个NLS)氨基末端,在羧基末端为零或一个或多个NLS)。当存在一个以上的NLS时,可以彼此独立地进行选择,以使单个NLS可以一个以上的副本存在和/或与一个或多个其他NLS一起存在一个或多个副本中。在本发明的一个优选实施方式中,Cas13包含至多6 个NLS。在一些实施方式中,当NLS的最接近的氨基酸在约1、2、3内时,NLS被认为在N端或C端附近。N或C端沿着多肽链的4、5、10、 15、15、20、25、30、40、50或更多个氨基酸。NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID NO:80);和来自核纤溶酶的NLS(例如具有序列KRPAATKKAGQAKKKK的核纤溶蛋白二分NLS)(SEQ ID NO: 81);具有氨基酸序列PAAKRVKLD(SEQ ID NO:82)或RQRRNELKRSP (SEQ ID NO:83)的c-myc NLS;具有序列 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 84)的hRNPA1 M9 NLS;IBB结构域的Importin-α序列 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:85);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:86)和PPKKARED (SEQ ID NO:87);人p53的序列POPKKKPL(SEQ ID NO:88);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:89);流感病毒 NS1的DRLRR序列(SEQ ID NO:90)和PKQKKRK序列(SEQ ID NO: 91)。肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:92);小鼠 Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:93);人聚(ADP-核糖) 聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:94);类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:95)。在通常情况下,一个或多个NLS具有足够的强度来驱动Cas 在真核细胞核中的积聚。在通常情况下,核定位活动的强度可能来自Cas 中NLS的数量,所使用的特定NLS或这些因素的组合。核中积累的检测可以通过任何合适的技术来进行。例如,可将可检测的标记融合到Cas 上,从而可以将细胞内的位置可视化,例如结合用于检测细胞核位置的手段(例如,对细胞核特异的染色剂,例如DAPI)。也可以从细胞中分离细胞核,然后可以通过用于检测蛋白质的任何合适的方法,例如免疫组织化学,蛋白质印迹或酶活性测定来分析其内容。也可以间接确定细胞核中的蓄积,例如通过测定CRISPR复合物形成的作用(例如测定靶序列上的DNA裂解或突变,或测定受CRISPR复合物形成和/或影响的基因表达活性的改变)与未暴露于Cas或复合物或未暴露于缺少一种或多种NLS的对照的对照相比)。

指导RNA,例如sgRNA或crRNA编码序列和/或Cas13编码序列,可以在功能上或操作上与调节元件连接,因此调节元件驱动表达。启动子可以是组成型启动子和/或条件启动子和/或诱导型启动子和/或组织特异性启动子。启动子可以选自RNA聚合酶,pol I,pol II,pol III,T7,U6,H1,逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子,巨细胞病毒(CMV) 启动子,SV40启动子,二氢叶酸还原酶启动子,β-肌动蛋白启动子,磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是启动子是 U6。

在一些实施方式中,CRISPR效应子(Cas 13n)蛋白可能形成诱导系统的组成部分。该系统的可诱导性质将允许使用一种能量来时空控制基因编辑或基因表达。能量的形式可以包括但不限于电磁辐射,声能,化学能和热能。诱导系统的实例包括四环素诱导型启动子(Tet-On或 Tet-Off),小分子双杂交转录激活系统(FKBP,ABA等)或光诱导系统(植物色素,LOV结构域或隐色素)。一个实施方式中,CRISPR效应蛋白可以是光诱导转录效应子(LITE)的一部分,以序列特异性方式指导转录活性的变化。灯的成分可以包括CRISPR效应蛋白,光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制域。在US 61/736465和US61/721,283以及WO 2014018423 A2中提供了可诱导的 DNA结合蛋白的进一步实例及其使用方法,其通过引用整体并入本文。

每当在本文中提及Cas13时,将理解的是,除非另外明确指出,否则本文所描述的根据本发明的突变的Cas13是指。除非另外明确指出,否则本文中每当提及Cas13时,均意指本文所述的根据本发明的突变的 Cas13a,Cas13b,Cas13c或Cas13d。除非另外明确指出,否则本文中每当提及Cas13时,优选是指本文所述的根据本发明的突变的Cas13b。

在一个方面中,本发明提供了如本文所述的突变的Cas13,例如优选但不限于如本文其他地方所述的Cas13b,其具有一种或多种导致减少脱靶效应的突变,即用于实现修饰的改进的CRISPR酶。靶向位点,但降低或消除针对脱靶的活性,例如与指导RNA结合时,以及改进的CRISPR 酶,例如与指导RNA结合时,可提高CRISPR酶的活性。应当理解,本文下文所述的突变酶可用于本文其他地方所述的根据本发明的任何方法。如本文其他地方所述的任何方法,产品,组合物和用途均与突变的 CRISPR酶同样适用,如下文进一步详述。

Slaymaker等,最近,他描述了一种产生具有增强的特异性的Cas9 直向同源物的方法(Slaymaker等,2015“Rationally engineered Cas9 nucleases with improvedspecificity”)。该策略可用于增强Cas13蛋白的特异性。用于诱变的主要残基优选是HEPN结构域内的所有正电荷残基。另外的残基是在不同直系同源物之间保守的带正电荷的残基。

一方面,本发明还提供了用于调节Cas13结合活性和/或结合特异性的方法和突变。在某些实施方式中,使用缺乏核酸酶活性的Cas13蛋白。在某些实施方式中,采用修饰的指导RNA来促进Cas13核酸酶的结合但不促进核酸酶活性。在这样的实施方式中,可以增加或减少靶上结合。同样,在这样的实施方式中,可以增加或减少脱靶结合。此外,关于靶上结合与脱靶结合的特异性可以增加或降低。

可以以各种组合使用的方法和突变,以增加或减少靶上与脱靶活性的活性和/或特异性,或增加或减少靶上与脱靶结合的结合和/或特异性。可用于补偿或增强为促进其他作用而进行的突变或修饰。为促进其他作用而进行的此类突变或修饰包括对Cas13的突变或修饰和/或对指导RNA 的突变或修饰。本发明的方法和突变用于调节Cas13核酸酶活性和/或与化学修饰的指导RNA结合。

一方面,本发明提供了用于调节如本文所定义的本发明的Cas13蛋白的结合和/或结合特异性的方法和突变,其包括功能域,例如核酸酶,转录激活因子,转录阻遏物等。例如,可以通过引入突变,例如本文其他地方所述的Cas13突变,使Cas13蛋白变为无核酸酶,或具有改变或降低的核酸酶活性。核酸酶缺陷的Cas13蛋白可用于RNA引导的靶序列依赖的功能域的传递。本发明提供了用于调节Cas13蛋白的结合的方法和突变。在一个实施方式中,功能结构域包含VP64,提供RNA指导的转录因子。在另一个实施方式中,功能域包含FokI,提供RNA引导的核酸酶活性。提到了美国专利公开号2014/0356959,美国专利公开号2014/0342456,美国专利公开号2015/0031132和Mali,P.等2013,Science 339(6121):823-6,doi:10.1126/science.1232033,在线发表于2013年1月3 日,并且通过本文的教导,本发明理解了以下方法和材料这些文件结合本文的教导而应用。在某些实施方式中,靶上结合增加。在某些实施方式中,脱靶结合减少。在某些实施方式中,靶上结合减少。在某些实施方式中,靶上结合增加。因此,本发明还提供增加或降低功能化Cas13 结合蛋白的靶上结合vs脱靶结合的特异性。

Cas13作为RNA指导的结合蛋白的用途不限于无核酸酶的Ca13。当与某些指导RNA一起使用时,包含核酸酶活性的Cas13酶也可以充当 RNA引导的结合蛋白。例如,短指导RNA和包含与靶错配的核苷酸的指导RNA可以促进RNA指导的Cas13结合至靶序列,而很少或没有靶裂解。(参见例如Dahlman,2015,Nat Biotechnol.33(11):1159-1161,doi: 10.1038/nbt.3390,2015年10月5日在线发布)。一方面,本发明提供了调节具有核酸酶活性的Cas13蛋白结合的方法和突变。在某些实施方式中,靶上结合增加。在某些实施方式中,脱靶结合减少。在在某些实施方式中,脱靶结合减少。在某些实施方式中,脱靶结合增加。在某些实施方式中,靶上结合相对于脱靶结合的特异性增加或降低。在某些实施方式中,指导RNA-Cas13酶的核酸酶活性也被调节。

RNA-RNA双链体的形成对于整个靶区域的裂解活性和特异性很重要,不仅是最接近PAM的种子区域序列。因此,截短的指导RNA显示降低的切割活性和特异性。一方面,本发明提供了使用改变的指导RNA 来增加切割的活性和特异性的方法和突变。

在某些实施方式中,本发明的CRISPR-Cas蛋白(例如Cas13)的催化活性被改变或修饰。应当理解,如果催化活性不同于相应的野生型 CRISPR-Cas蛋白(例如,未突变的CRISPR-Cas蛋白)的催化活性,则突变的Cas13具有改变的或修饰的催化活性。催化活性可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过测定插入缺失百分比(例如在给定时间后或以给定剂量后)在体外或体内测定催化活性。在某些实施方式中,催化活性提高至少5%,优选至少10%,更优选至少 20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或至少100%。在某些实施方式中,催化活性降低。在某些实施方式中,催化活性至少降低5%,优选至少10%,更优选至少 20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上)100%。本文的一个或多个突变可以使催化活性失活,所述催化活性可以基本上是所有可催化的活性,低于可检测的水平,或者没有可测量的催化活性。

经改造的CRISPR-Cas蛋白的一个或多个特征可以与相应的野生型 CRISPR-Cas蛋白不同。此类特征的示例包括催化活性,gRNA结合, CRISPR-Cas蛋白的特异性(例如,编辑定义的靶标的特异性), CRISPR-Cas蛋白的稳定性,脱靶结合,靶标结合,蛋白酶活性,切口酶活性,PFS识别。在一些实例中,一种工程CRISPR-Cas蛋白可能包含一个或多个相应野生型CRISPR-Cas蛋白的突变。在一些实施方式中,该工程CRISPR-Cas蛋白的催化活性比相应的野生型CRISPR-Cas蛋白高。野生型CRISPR-Cas蛋白。在一些实施方式中,与相应的野生型CRISPR-Cas 蛋白相比,工程CRISPR-Cas蛋白的催化活性降低。在一些实施方式中,工程CRISPR-Cas的gRNA结合。与相应的野生型CRISPR-Cas蛋白相比,该蛋白增加了。在一些实施方式中,与相应的野生型CRISPR-Cas蛋白相比,工程化CRISPR-Cas蛋白的gRNA结合降低了。与相应的野生型 CRISPR-Cas蛋白相比,CRISPR-Cas蛋白的特异性增加。在一些实施方式中,与相应的野生型CRISPR-Cas蛋白相比,CRISPR-Cas蛋白的特异性降低。方式中,与在一些实施方式中,工程CRISPR-Cas蛋白还包含一种或两种以上的相应的野生型CRISPR-Cas蛋白。与一些相应的野生型 CRISPR-Cas蛋白相比,CRISPR-Cas蛋白的稳定性降低。在一些实施方式中,与靶点结合的脱靶结合增加。与一些野生型CRISPR-Cas蛋白相比, CRISPR-Cas的脱靶结合增加。与相应的野生型CRISPR-Cas蛋白相比, CRISPR-Cas蛋白降低了。在一些实施方式中,与相应的野生型 CRISPR-Cas蛋白相比,CRISPR-Cas蛋白的靶结合增加了。因此,与相应的野生型CRISPR-Cas蛋白相比,CRISPR-Cas蛋白的靶结合度降低了。在一些实施方式中,与相应的野生型相比,改造后的CRISPR-Cas蛋白具有更高的蛋白酶活性或多核苷酸结合能力。CRISPR-Cas蛋白。在一些实施方式中,PFS识别是可变的与相应的野生型CRISPR-Cas蛋白相比呈红色。

在某些实施方式中,本发明的Cas13蛋白的gRNA(crRNA)结合被改变或修饰。应当理解,如果gRNA结合不同于相应的野生型Cas13的 gRNA结合(即未突变的Cas13),则突变的Cas13具有改变的或修饰的 gRNA结合。gRNA结合可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过计算结合强度或亲和力(例如基于平衡常数,Ka, Kd等)来确定gRNA结合。在某些实施方式中,gRNA结合增加。实施方式中,gRNA结合增加至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或至少100%。在某些实施方式中,gRNA结合降低。在某些实施方式中,gRNA结合降低至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上)100%。

在某些实施方式中,本发明的Cas13蛋白的特异性被改变或修饰。应当理解,如果特异性不同于相应的野生型Cas13(即未突变的Cas13) 的特异性,则突变的Cas13具有改变的或修饰的特异性。特异性可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过比较靶上活性和靶外活性来确定特异性。在某些实施方式中,特异性提高。在某些实施方式中,特异性提高至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或至少100%。在某些实施方式中,特异性降低至少5%,优选至少10%,更优选至少20%。至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上)100%。

在某些实施方式中,本发明的Cas13蛋白的稳定性被改变或修饰。应当理解,如果稳定性不同于相应的野生型Cas13(即未突变的Cas13) 的稳定性,则突变的Cas13具有改变或修饰的稳定性。稳定性可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过确定Cas13 蛋白的半衰期来确定稳定性。在某些实施方式中,稳定性提高。在某些实施方式中,稳定性提高至少5%。优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或至少100%。在某些实施方式中,稳定性降低至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上)100%。

在某些实施方式中,本发明的Cas13蛋白的靶结合被改变或修饰。应当理解,如果靶结合不同于相应的野生型Cas13的靶结合(即未突变的Cas13),则突变的Cas13具有改变的或修饰的靶结合。靶结合可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过计算结合强度或亲和力(例如基于平衡常数,Ka,Kd等)来确定靶结合。在某些实施方式中,靶结合增加。方式中,靶结合增加至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或至少100%。在某些实施方式中,目标结合减少。在某些实施方式中,目标结合减少至少5%,最好在至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上)100%。

在某些实施方式中,本发明的Cas13蛋白的脱靶结合被改变或修饰。应当理解,如果脱靶结合不同于相应的野生型Cas13的脱靶结合(即未突变的Cas13),则突变的Cas13具有改变或修饰的脱靶结合。脱靶结合可以通过本领域已知的方法确定。举例来说,但不限于,可以通过计算结合强度或亲和力(例如基于平衡常数,Ka,Kd等)来确定脱靶结合。在某些实施方式中,脱靶结合增加。在某些实施方式中,脱靶结合增加至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或至少100%。在某些实施方式中,脱靶结合减少。在某些实施方式中,脱靶结合减少至少5%,优选至少10%,更优选至少20%,例如至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,或(基本上) 100%。

在某些实施方式中,本发明的Cas13蛋白的PFS(或PAM)识别或特异性被改变或修饰。应当理解,如果PFS识别或特异性不同于相应的野生型Cas13(即未突变的Cas13)的PFS识别或特异性,则突变的Cas13 具有改变或修饰的PFS识别或特异性。PFS的识别或特异性可以通过本领域已知的方法来确定。举例来说,但不限于,可以通过PFS(PAM) 筛查确定PFS的识别或特异性。在某些实施方式中,至少一种不同的PFS 被Cas13识别。在某种实施方式中,除突变型Cas13识别出一个PFS外,野生型Cas13也不能识别出一个PFS。在某些实施方式中,至少一种PFS 被突变的Cas13识别,而相应的野生型Cas13无法识别,并且不再识别野生型PFS。被突变的Cas13识别的PFS比野生型Cas13识别的PFS更长,例如长1、2或3个核苷酸。在某些实施方式中,被突变的Cas13识别的PFS比被识别的PFS短。由野生型Cas13组成,例如短1、2或3 个核苷酸。

本发明提供了一种非天然存在或工程化组合物,其包含

突变的Cas13效应蛋白,以及

crRNA,

其中crRNA包含:a)能够与靶RNA序列杂交的引导序列,和b) 正向重复序列,

由此形成包含与引导序列复合的Cas13效应蛋白的CRISPR复合物,该引导蛋白与靶RNA序列杂交。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触。或可以在体内形成。

在一些实施方式中,例如对于Cas13b,本发明的非天然存在或工程化组合物可包含增强VI-B型CRISPR-Cas效应蛋白活性的辅助蛋白。

在某些此类实施方式中,增强Cas13b效应子蛋白活性的辅助蛋白是 csx28蛋白。在这样的实施方式中,VI-B型CRISPR-Cas效应蛋白和VI-B 型CRISPR-Cas辅助蛋白可以来自相同来源或不同来源。

在一些实施方式中,本发明的非天然存在或工程化组合物包含抑制 Cas13b效应子蛋白活性的辅助蛋白。

在某些此类实施方式中,抑制Cas13b效应子蛋白活性的辅助蛋白是 csx27蛋白。在这样的实施方式中,VI-B型CRISPR-Cas效应蛋白和VI-B 型CRISPR-Cas辅助蛋白可以来自相同来源或不同来源。在本发明的某些实施方式中,VI-B型CRISPR-Cas效应蛋白来自表1。

在一些实施方式中,本发明的非天然存在或工程化组合物包含两个或更多个crRNA。

在一些实施方式中,本发明的非天然存在或工程化组合物包含与原核细胞中的靶RNA序列杂交的指导序列。

在一些实施方式中,本发明的非天然存在或工程化组合物包含与真核细胞中的靶RNA序列杂交的指导序列。

在一种实施方式中,Cas13效应蛋白包含一个或多个核定位信号 (NLS)。

在本实施方式中,本发明的Cas13效应蛋白是源自表1-4的蛋白质,或在其中,或由其构成,或基本上由其组成,或由其组成,或涉及或与之有关。并且包含本文其他地方所述的本发明的一种或多种突变。

在本发明的非天然存在或工程化组合物的一些实施方式中,Cas13 效应子蛋白与一个或多个功能域结合。所述结合可以通过效应子蛋白与功能域的直接连接,或通过与crRNA的结合。在非限制性实例中,crRNA 包含可与感兴趣的功能域结合的添加或插入的序列,所述功能域包括例如与核酸结合衔接子蛋白结合的适体或核苷酸。功能域可以是功能异源域。

在某些非限制性实施方式中,本发明的非天然存在或工程化组合物包含切割靶RNA序列的功能性结构域。

在某些非限制性实施方式中,本发明的非天然存在或工程化组合物包含修饰靶RNA序列的转录或翻译的功能域。

在本发明的组合物的一些实施方式中,Cas13效应子蛋白与一个或多个功能域结合;例如,Cas13效应蛋白与一个或多个功能域结合。并且效应蛋白在HEPN结构域内包含一个或多个突变,由此复合物可以传递表观遗传修饰子或转录或翻译激活或抑制信号。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触。或可以在体内形成。

在本发明的非天然存在或工程化组合物的一些实施方式中,Cas13b 效应蛋白和辅助蛋白来自同一生物。

在本发明的非天然存在或工程化组合物的一些实施方式中,Cas13b 效应蛋白和辅助蛋白来自不同生物。

本发明还提供了VI型CRISPR-Cas载体系统,其包含一个或多个载体,所述载体包括:

可操作地连接至编码Cas13效应蛋白的核苷酸序列的第一调节元件,和

第二调控元件可操作地连接至编码crRNA的核苷酸序列。

在某些实施方式中,本发明的载体系统还包含与VI-B型CRISPR-Cas 辅助蛋白的核苷酸序列可操作地连接的调节元件。

适当时,对编码VI型CRISPR-Cas效应蛋白的核苷酸序列(和/或任选地编码VI-BCRISPR-Cas辅助蛋白的核苷酸序列)进行密码子优化以在真核细胞中表达。

在本发明的载体系统的一些实施方式中,对编码Cas13效应子蛋白 (和任选地)辅助蛋白的核苷酸序列进行密码子优化以在真核细胞中表达。

在某个实施方式中,本发明的载体系统包含在单个载体中。

在本发明的载体系统的一些实施方式中,一种或多种载体包括病毒载体。

在本发明的载体系统的一些实施方式中,一种或多种载体包含一种或多种逆转录病毒,慢病毒,腺病毒,腺相关或单纯疱疹病毒载体。

本发明提供了一种递送系统,其被配置为递送Cas13效应子蛋白和非天然存在或工程化组合物的一种或多种核酸组分,包括

如本文所述的根据本发明的突变的Cas13效应子蛋白,和

crRNA,

其中crRNA包含a)与细胞中的靶RNA序列杂交的引导序列,和b) 正向重复序列,

其中Cas13效应蛋白与crRNA形成复合物,

其中所述指导序列指导序列特异性结合至靶RNA序列,

由此形成包含与引导序列复合的Cas13效应蛋白的CRISPR复合物,该引导蛋白与靶RNA序列杂交。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触。或可以在体内形成。

在本发明的递送系统的一些实施方式中,该系统包含一种或多种载体或一种或多种多核苷酸分子,该一种或多种载体或多核苷酸分子包含编码Cas13效应蛋白的一种或多种多核苷酸分子和一种或多种核酸。非天然成分或工程成分的成分。

在某实施方式中,本发明的递送系统包括递送载体,其包含脂质体,颗粒,外来体,微泡,基因枪或一种或多种病毒载体。。

在某个实施方式中,本发明的非天然存在或工程化组合物用于治疗的治疗方法或研究程序中。

在某个实施方式中,本发明的非天然存在的或工程化载体系统用于治疗的治疗方法或研究程序中。

在某个实施方式中,本发明的非天然存在或工程化递送系统用于治疗的治疗方法或研究程序中。

本发明提供了一种修饰感兴趣的靶基因表达的方法,该方法包括使靶RNA与一种或多种非天然存在或工程化组合物接触,所述组合物包含:

如本文所述的根据本发明的突变的Cas13效应子蛋白,和

crRNA,

其中crRNA包含a)与细胞中的靶RNA序列杂交的引导序列,和b) 正向重复序列,

其中Cas13效应蛋白与crRNA形成复合物,

其中所述指导序列指导序列特异性结合至细胞中的靶RNA序列,

从而形成一种CRISPR复合物,该复合物包含与指导序列复合的 Cas13效应蛋白,该指导序列与靶RNA序列杂交,

从而改变感兴趣的靶基因座的表达。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触。或可以在体内形成。

在某个实施方式中,修饰感兴趣的靶基因表达的方法还包括使靶RNA与增强Cas13b效应子蛋白活性的辅助蛋白接触。

在修饰感兴趣的靶基因表达的方法的一些实施方式中,增强Cas13b 效应子蛋白活性的辅助蛋白是csx28蛋白。

在某个实施方式中,修饰感兴趣的靶基因表达的方法进一步包括使靶RNA与抑制Cas13b效应子蛋白活性的辅助蛋白接触。

在修饰感兴趣的靶基因表达的方法的一些实施方式中,抑制Cas13b 效应子蛋白活性的辅助蛋白是csx27蛋白。

在某个实施方式中,修饰感兴趣的靶基因表达的方法包括切割靶 RNA。

在某个实施方式中,修饰感兴趣的靶基因表达的方法包括增加或减少靶RNA的表达。

在修饰感兴趣的靶基因表达的方法的一些实施方式中,靶基因在原核细胞中。

在修饰感兴趣的靶基因表达的方法的一些实施方式中,靶基因在真核细胞中。

本发明提供了包含修饰的目的靶的细胞,其中所述目的靶已经根据本文公开的任何方法修饰。

在本发明的一种实施方式中,该细胞是原核细胞。

在本发明的一种实施方式中,该细胞是真核细胞。

在某个实施方式中,细胞中感兴趣目标的修饰会导致:

包含至少一种基因产物的表达改变的细胞;

包含至少一种基因产物的表达改变的细胞,其中所述至少一种基因产物的表达增加;或者

包含至少一种基因产物的表达改变的细胞,其中所述至少一种基因产物的表达降低。

在某个实施方式中,该细胞是哺乳动物细胞或人类细胞。

本发明提供了本文公开的细胞或包含本文公开的细胞或通过本文公开的任何方法修饰的细胞或其后代的细胞系。

本发明提供了一种多细胞生物,其包含一个或多个本文公开的细胞或一个或多个根据本文公开的任何方法修饰的细胞。

本发明提供了一种植物或动物模型,其包含一个或多个本文公开的细胞或一个或多个根据本文公开的任何方法修饰的细胞。

本发明提供了来自本文公开的细胞或细胞系或生物或植物或动物模型的基因产物。

在某种实施方式中,表达的基因产物的量大于或小于未改变表达的细胞的基因产物的量。

在某些实施方式中,Cas13蛋白起源于以下种类:别样杆菌属 (Alistipes),厌氧杆菌,拟杆菌,拟杆菌,贝氏杆菌,Blautia,Butyrivibrio, Capnocytophaga,食肉杆菌,绿弯曲菌,Chryseobacterium,Clostridium, Demequina,Feubacteriaceaeae,Eubacteriaceae,Herbinix,Insolitispirillum, Lachnospiraceae,Leptotrichia,李斯特菌,Myroides,Paludibacter, Phaeodyylibacter,Porphyromonadaceae,Porphyromonas,Prevotella, Pseudobutyrivibrio,Psychroflexus,Reichenbachiella,Rhodobacter, Riemerella,中微芽孢杆菌。如本文所用,当Cas13蛋白起源于一个物种时,它可能是该物种中的野生型Cas13蛋白,或者是该物种中的野生型 Cas13蛋白的同源物。作为物种中的野生型Cas13蛋白的同源物的Cas13 蛋白可以包含野生型Cas13蛋白的一种或多种变异(例如,突变,截短等)。

在一些实施方式中,Cas13蛋白起源于沙丙氏梭菌,李斯特菌,链霉菌属细菌(例如Lb MA2020,Lb NK4A179,Lb NK4A144),氨基梭菌 (例如Ca DSM 10710),鸡冠状杆菌(例如Cg DSM)。4847),丙酸杆状杆菌(如Pp WB4),魏斯特氏李斯特菌(如Lw FSL R9-0317),李斯特菌属细菌(如Lb FSL M6-0635),Wepteptrichia wadei(如Lw F0279),荚膜红细菌(如RcSB 1003,Rc R121,Rc DE442),buccalis Leptotrichia buccalis(例如Lb C-1013-b),Herminix hemicellulosilytica, Eubacteriaceae细菌(例如Eb CHKCI004),Blautia,马赛-P2398, Leptotrichia sp.口腔分类单元879str.F0557,绿屈挠菌,Demequinaaurantiaca,Thalassospira sp TSL5-1,Pseudobutyrivibrio sp.OR37, Butyrivibriosp.YAB3001,Leptotrichia sp.马赛P3007,拟杆菌,猪肺菌科细菌(如Pb KH3CP3RA),利斯特氏菌,百日草不通杆菌,Alistipes sp。 ZOR0009,化脓性杆菌(如Bp F0041),拟杆菌属细菌(如Bb GWA2_31_9),兽疫伯尔氏菌(如Bz ATCC 43767),食管噬菌性,食环梭状芽胞杆菌,嗜酸梭状芽胞杆菌,黄杆菌属316,Myroides odoratimimus(如Mo CCUG 10230、Mo CCUG12901、Mo CCUG 3837),丙酸杆菌(Pluudibacter propionicigenes),厦门细菌(Phaeodactylibacter xiamenensis),牙龈卟啉单胞菌(Porphyromonas gingivalis)(如Pg F0185, Pg F0568,Pg JCVI SC001,Pg W4087,Porphyromonas。COT-052OH4946,橘色丙酸杆菌,颊普雷沃菌(如Pb ATCC 33574),假小肠丙酸杆菌,中间媒介小球藻(如Pi 17,PiZT),淡水小球藻(如Pp ATCC 700821),普氏小球藻,解毒小球藻(saccharchara)(如PsF0055),Prevotella sp.MA2016,Prevotella sp.MSX73,Prevotella sp.P4-76,Prevotella sp.P5-119,Prevotella sp.P5-125,Prevotella sp.P5-60,Psychoflexustorquis, Reichenbachiella agariperforans,Riemerella厌食菌,海洋微生物,坏死梭状芽孢杆菌(例如Fn亚种ATCC 51357,Fn DJ-2,Fn BFTR-1,Fn亚种 Funduliforme),产气梭状芽孢杆菌(例如Fp ATCC 29250),溃疡杆菌 (例如Fu ATCC 49185),厌氧消化细菌ND 1,西非杆菌(Eubacterium siraeum),黄褐球菌(Ruminococcus flavefaciens)(例如RfxXPD3002) 或黄褐球菌(Ruminococcus albus)。

在某些实施方式中,Cas13是Cas13a,起源于拟杆菌属,Blautia, Butyrivibrio,食肉杆菌,绿弯曲菌,梭状芽孢杆菌,Demequina,真细菌, Herpinix,不溶螺旋体,漆膜螺旋菌,Leptotrichia,李斯特菌,古菌,衣藻,红细菌或海藻。

在一些实施方式中,Cas13是Cas13a,起源于沙丙氏梭菌,李斯特菌,链霉菌属细菌(如Lb MA2020,Lb NK4A179,Lb NK4A144),氨基梭菌(如Ca DSM 10710),鸡食杆菌(如食管杆菌),Cg DSM 4847,丙酸杆菌(如Pp WB4),魏氏李斯特菌(如Lw FSL R9-0317),李斯特氏菌属细菌(如Lb FSL M6-0635),韦氏杆菌属(Leptotrichia wadei) (如Lw F0279),荚膜红细菌例如Rc SB 1003,Rc R121,Rc DE442),丁酸杆菌(Leptotrichia buccalis)(例如LbC-1013-b),Herminix hemicellululiilytica,真细菌科细菌(例如Eb CHKCI004),Blautia,马赛-P2398,Leptotrichia sp.口腔分类单元879str.F0557,绿屈挠菌,Demequina aurantiaca,Thalassospira sp.TSL5-1,Pseudobutyrivibrio sp.OR37,Butyrivibrio sp.YAB3001,Leptotrichia sp。马赛P3007,艾美拟杆菌,卟啉单胞菌属细菌(例如Pb KH3CP3RA),河岸李斯特菌或百日草不溶菌。

在某些实施方式中,Cas13是Cas13b,起源于以下种类:阿利培斯,拟杆菌,拟杆菌,贝氏杆菌,Capnocytophaga,金黄杆菌,黄杆菌,Myroides,古菌,杆状杆菌,卟啉单胞菌,普雷维氏菌,Psychroflexus,Riechenbach 或Reichenbach微生物。

在某些实施方式中,Cas13是Cas13b,起源于Alistipes sp.ZOR0009,化脓性杆菌(如Bp F0041),拟杆菌属细菌(如Bb GWA2_31_9),兽疫伯尔氏菌(如Bz ATCC 43767),食管噬菌性,食环梭状芽胞杆菌,嗜酸梭状芽胞杆菌,黄杆菌属316,香豌豆花(如Mo CCUG10230,Mo CCUG 12901,Mo CCUG 3837),丙酸杆菌(Pluudibacter propionicigenes),Phaeodactylibacter xiamenensis,牙龈卟啉单胞菌(Porphyromonas gingivalis)(如PgF0185,Pg F0568,Pg JCVI SC001,Pg W4087, Porphyromonas,COT-052OH4946,橘色丙酸杆菌,颊普雷沃菌(如Pb ATCC 33574),假小肠丙酸杆菌,中间媒介小球藻(如Pi 17,Pi ZT),淡水小球藻(如Pp ATCC 700821),普氏小球藻,解毒小球藻 (saccharchara)(如PsF0055),Prevotella sp.MA2016,Prevotella sp.MSX73,Prevotella sp.P4-76,Prevotella sp.P5-119,Prevotella sp.P5-125, Prevotella sp.P5-60,Psychoflexustorquis,Reichenbachiella agariperforans, Riemerella。在一些实例中,当Cas13是死拟南芥Riemerella Anatipestifer Cas13。在一些实例中,Cas13是Prevotella sp.P5-125。实例中,Cas13 是死去的Prevotella sp.P5-125。

在某些实施方式中,Cas13是Cas13c,起源于Fusobacter或 Anaerosalibacter属。

在某些实施方式中,Cas13是Cas13c,起源于坏死镰刀菌(例如Fn 亚种Fatuliforme ATCC 51357,Fn DJ-2,Fn BFTR-1,Fn亚种 Funduliforme),Fusobacterperfoetens(例如Fp ATCC 29250)),溃疡杆菌(例如Fu ATCC 49185)或厌氧弯曲杆菌(Anaerosalibacter sp.ND1。

在某些实施方式中,Cas13是Cas13d,起源于真细菌或鲁米诺球菌属。

在某些实施方式中,Cas13是Cas13d,起源于大肠杆菌,黄褐球菌 (如RfxXPD3002)或白蜡球菌。

在某些实施方式中,本发明提供了分离的Cas13效应蛋白,其包含或基本上由表1-4列出或由其组成,或由表1-4列出或由其组成,并且包含如本文其他地方所述的一个或多个突变。表1-4Cas13效应蛋白如本文结合表1-4更详细地讨论。本发明提供了编码Cas13效应蛋白的分离的核酸。在本发明的一些实施方式中,分离的核酸包含DNA序列,并且进一步包含编码crRNA的序列。本发明提供了分离的真核细胞,其包含编码Cas13效应蛋白的核酸。因此,在本文中,“Cas13效应蛋白”或“效应蛋白”或“Cas”或“Cas蛋白”或“RNA靶向效应蛋白”或“RNA靶向蛋白”或类似表达应理解为包括Cas13a,Cas13b,Cas13c或Cas13d;诸如“靶向RNA 的CRISPR系统”的表达应理解为包括Cas13a,Cas13b,Cas13c或Cas13d CRISPR系统,并且在某些实施方式中可以被理解为表1-4的Cas13效应蛋白CRISPR系统。结合指导RNA或sgRNA的参考文献应结合本文讨论的Cas13系统crRNA一起阅读,例如,在本发明中其他系统中的sgRNA 可被视为或类似于crRNA。

本发明提供了一种鉴定本发明的Cas13效应子蛋白的合适的指导序列的要求的方法(例如,表1-4),所述方法包括:

选择生物体内的一组必需基因

设计能够与这些基因的编码区以及这些基因的5'和3'UTR区域杂交的靶向指导序列文库

产生不与所述生物的基因组内任何区域杂交的随机指导序列作为对照指导

制备包含RNA靶向蛋白和第一抗性基因的质粒,以及包含所述靶向向导和所述对照向导以及第二抗性基因的向导质粒文库,

将所述质粒共引入宿主细胞

将所述宿主细胞引入用于所述第一抗性基因和第二抗性基因的选择性培养基上

对生长中的宿主细胞的必需基因进行测序

通过将细胞的损耗与对照向导进行比较,确定用靶向向导转化的细胞的损耗的重要性;和

基于耗尽的指导序列确定合适的指导序列的要求。

在这种方法的一方面,确定RNA靶向蛋白的合适的指导序列的PFS 序列是通过比较耗尽的细胞中的指导所靶向的序列。在这种方法的一方面,该方法还包括在不同的重复实验中比较不同条件下的指导序列丰度。在这种方法的一方面,选择对照指导序列是因为确定它们在重复实验中显示出指导序列消耗中的有限偏差。在这种方法的一个方面,消耗的显著性被确定为:(a)比最消耗的对照指导还多的消耗;(b)大于平均消耗加上对照指导的标准差的两倍的消耗。在这种方法的一方面,宿主细胞是细菌宿主细胞。在这种方法的一方面,共引入质粒的步骤是通过电穿孔,并且宿主细胞是电感受态宿主细胞。

本发明提供了修饰与感兴趣的靶基因座相关或在其上的序列的方法,该方法包括将包含Cas13效应蛋白和一种或多种核酸组分的非天然存在或工程化组合物递送至所述基因座,其中该效应蛋白当与所述一种或多种核酸成分形成复合物时,所述复合物与感兴趣的基因座结合后,效应子蛋白诱导与目标感兴趣的基因座相关或在其上的序列的修饰。在一个优选的实施方式中,修饰是引入链断裂。在一个优选的实施方式中,与感兴趣的靶基因座相关或在其上的序列包含RNA或由RNA组成。

本发明提供了修饰与感兴趣的靶基因座相关或在其上的序列的方法,该方法包括将包含Cas13效应子蛋白,任选的小辅助蛋白和一个或多个核酸的非天然存在或工程化组合物递送至所述基因座。酸组分,其中效应子蛋白与一种或多种核酸组分形成复合物,并且当所述复合物与感兴趣的基因座结合后,效应子蛋白诱导与感兴趣的靶基因座相关或在其上的序列的修饰。在一个优选的实施方式中,修饰是引入链断裂。在一个优选的实施方式中,与感兴趣的靶基因座相关或在其上的序列包含 RNA或由RNA组成。

本发明提供了一种修饰与感兴趣的靶位点相关或在其上的序列的方法,该方法包括向所述与靶位点相关或在该位点的序列递送包含Cas13 基因座效应子蛋白和一个或多个核酸的非天然存在或工程化组合物。酸组分,其中Cas13效应蛋白与一种或多种核酸组分形成复合物,并且当所述复合物结合至目的基因座时,效应蛋白诱导与感兴趣的靶基因座相关或在其上的序列的修饰。在一个优选的实施方式中,修饰是引入链断裂。在一个优选的实施方式中,Cas13效应蛋白与一种核酸组分形成复合物。有利地,工程或非天然存在的核酸组分。与感兴趣的靶基因座相关或在其上的序列的修饰的诱导可以是Cas13效应子蛋白-核酸引导的。在一个优选的实施方式中,一种核酸组分是CRISPR RNA(crRNA)。在一个优选的实施方式中,一种核酸组分是成熟的crRNA或指导RNA,其中该成熟的crRNA或指导RNA包含间隔子序列(或指导序列)和正向重复(DR)序列或其衍生物。在一个优选的实施方式中,间隔区序列或其衍生物包含种子序列,其中种子序列对于在靶基因座处的序列的识别和/或杂交是关键的。在本发明的优选实施方式中,crRNA是可以与短 DR序列相关的短crRNA。在本发明的另一个实施方式中,crRNA是可以与长DR序列(或双重DR)相关的长crRNA。本发明的方面涉及具有一种或多种非天然存在或工程改造或修饰或优化的核酸组分的Cas13效应蛋白复合物。在一个优选的实施方式中,核酸组分包含RNA。在一个优选的实施方式中,复合物的核酸组分可包含与正向重复序列连接的指导序列,其中该正向重复序列包含一个或多个茎环或优化的二级结构。在本发明的优选实施例中,正向重复可以是短DR或长DR(双DR)。在一个优选的实施方式中,可以修饰正向重复序列以包含一种或多种蛋白结合RNA适体。在一个优选的实施方式中,可以包括一个或多个适体,例如优化的二级结构的一部分。这样的适体可能能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可以选自Qβ,F2,GA,fr,JP501,MS2,M12, R17,BZ13,JP34,JP500,KU1,M11,MX1,TW18,VK,SP,FI,ID2,NL95,TW19,AP205,φCb5,φCb8r,φCb12r,φCb23r,7s和 PRR1。在一个优选的实施方式中,噬菌体外壳蛋白是MS2。本发明还提供了复合物的核酸成分,其长度为30个或更多个,40个或更多个或50 个或更多个核苷酸。

本发明提供了与感兴趣的靶位点相关或在其上的基因组编辑或修饰序列的方法,其中该方法包括将Cas13复合物引入任何所需的细胞类型,原核或真核细胞中,由此Cas13效应蛋白复合物有效地起作用以干扰 RNA。在真核或原核细胞中。在优选的实施方式中,细胞是真核细胞,并且RNA从哺乳动物基因组转录或存在于哺乳动物细胞中。在人细胞中 RNA编辑或基因组编辑的优选方法中,Cas13效应蛋白可以包括但不限于本文公开的Cas13效应蛋白的特定种类。

本发明还提供了修饰感兴趣的靶基因座的方法,该方法包括将包含 Cas13效应蛋白和一种或多种核酸成分的非天然存在或工程化组合物递送至所述基因座,其中Cas13效应蛋白形成复合物。在具有一种或多种核酸成分的情况下,并且在所述复合物与感兴趣的基因座结合后,效应子蛋白诱导目标感兴趣的基因座的修饰。在一个优选的实施方式中,修饰是引入链断裂。

在这样的方法中,感兴趣的靶基因座可以包含在RNA分子内。在这样的方法中,感兴趣的靶基因座可以体外包含在RNA分子中。

在这样的方法中,感兴趣的靶基因座可以包含在细胞内的RNA分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。通过本发明引入细胞的修饰可以是这样的,使得改变细胞和细胞的后代以改善生物产物如抗体,淀粉,醇或其他所需细胞输出的产生。通过本发明引入细胞的修饰可以使得细胞和细胞的后代包括改变产生的生物产物的改变。

哺乳动物细胞可以是非人类哺乳动物,例如灵长类动物,牛,绵羊,猪,犬,啮齿动物,鼠科,例如猴,牛,绵羊,猪,狗,兔,大鼠或小鼠细胞。该细胞可以是非哺乳动物的真核细胞,例如禽鸟(例如,鸡),脊椎动物(例如,鲑鱼)或贝类(例如,牡蛎,白鲑,龙虾,虾)细胞。该细胞也可以是植物细胞。植物细胞可以是单子叶植物或双子叶植物,也可以是农作物或谷物植物,例如木薯,玉米,高粱,大豆,小麦,燕麦或水稻。植物细胞还可以是藻类,树木或生产植物,水果或蔬菜(例如,柑橘树等树木,例如橙,葡萄柚或柠檬树;桃或油桃树;苹果或梨树;坚果树等)的细胞。杏仁树或核桃树或开心果树;茄属植物;芸苔属植物;Lectica属植物;菠菜属植物;辣椒属植物;棉花,烟草,芦笋,胡萝卜,白菜,西兰花,花椰菜,番茄,茄子,胡椒,生菜,菠菜,草莓,蓝莓,覆盆子,黑莓,葡萄,咖啡,可可等)。

本发明提供了一种修饰感兴趣的靶基因座的方法,该方法包括将包含Cas13效应蛋白和一种或多种核酸组分的非天然存在或工程化组合物递送至所述基因座,其中所述效应蛋白与所述靶蛋白形成复合物。一种或多种核酸组分,并且在所述复合物与感兴趣的基因座结合后,效应子蛋白诱导目标感兴趣的基因座的修饰。在一个优选的实施方式中,修饰是引入链断裂。

在这样的方法中,感兴趣的靶基因座可以包含在RNA分子内。在一个优选的实施方式中,感兴趣的靶基因座包含RNA或由RNA组成。

本发明还提供了修饰感兴趣的靶基因座的方法,该方法包括将包含 Cas13效应蛋白和一种或多种核酸成分的非天然存在或工程化组合物递送至所述基因座,其中Cas13效应蛋白形成复合物。在具有一种或多种核酸成分的情况下,并且在所述复合物与感兴趣的基因座结合后,效应子蛋白诱导目标感兴趣的基因座的修饰。在一个优选的实施方式中,修饰是引入链断裂。

优选地,在这样的方法中,感兴趣的靶基因座可以体外包含在RNA 分子中。同样优选地,在这种方法中,感兴趣的靶基因座可包含在细胞内的RNA分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该细胞可以是啮齿动物细胞。该细胞可以是小鼠细胞。

在任何描述的方法中,感兴趣的靶基因座可以是目的基因组或表观基因座。在所描述的任何方法中,复合体可以与多个引导件一起被递送以用于多重使用。在任何描述的方法中,可以使用一种以上的蛋白质。

在本发明的其他方面,核酸组分可以包含CRISPR RNA(crRNA) 序列。由于效应蛋白是Cas13效应蛋白,因此核酸组分可以包含CRISPR RNA(crRNA)序列,并且通常可以不包含任何反式激活crRNA(tracr RNA)序列。

在任何描述的方法中,效应蛋白和核酸组分可以通过编码该蛋白和/ 或核酸组分的一个或多个多核苷酸分子来提供,并且其中一个或多个多核苷酸分子被可操作地配置为表达该蛋白。和/或核酸成分。一种或多种多核苷酸分子可包含一种或多种可操作地配置为表达蛋白质和/或核酸组分的调控元件。一种或多种多核苷酸分子可包含在一种或多种载体内。在任何描述的方法中,感兴趣的靶基因座可以是基因组,表观基因组或转录组基因座。在所描述的任何方法中,复合体可以与多个引导件一起被递送以用于多重使用。在任何描述的方法中,可以使用一种以上的蛋白质。

在任何描述的方法中,链断裂可以是单链断裂或双链断裂。在优选的实施方式中,双链断裂可指RNA的两个部分的断裂,例如当单链RNA 分子自身折叠时形成的RNA的两个部分或由包含自身的RNA分子形成的推定的双螺旋。互补序列允许RNA的部分折叠并与其自身配对。

调节元件可包含诱导型启动子。多核苷酸和/或载体系统可以包括诱导系统。

在任何描述的方法中,一个或多个多核苷酸分子可包含在递送系统中,或所述一个或多个载体可包含在递送系统中。

在任何描述的方法中,可以通过脂质体,包括纳米颗粒,外来体,微囊泡,基因枪或一种或多种病毒载体的颗粒递送非天然存在或工程化组合物。

本发明还提供了一种非天然存在的或工程化组合物,其是具有如本文所讨论的或在本文所述的任何方法中定义的特征的组合物。

因此,在某些实施方式中,本发明提供了一种非天然存在或工程化组合物,例如特别是能够或被配置为修饰感兴趣的靶基因座的组合物,所述组合物包含Cas13效应蛋白和一种或多种核酸。组分,其中效应蛋白与一种或多种核酸组分形成复合物,并且当所述复合物与感兴趣的基因座结合后,效应蛋白诱导目标靶基因的修饰。效应蛋白可以是Cas13a,Cas13b,Cas13c或Cas13d效应蛋白,优选为Cas13b效应蛋白。

在另一方面,本发明还提供了非天然存在或工程化组合物,例如特别是能够或被配置为修饰感兴趣的靶基因座的组合物,所述组合物包含: (a)指导RNA分子(或指导RNA分子,例如第一指导RNA分子和第二指导RNA分子)或编码该指导RNA分子的核酸(或一个或多个编码指导RNA分子的组合的核酸);(b)一种Cas13效应蛋白。在某些实施方式中,效应蛋白可以是Cas13b效应蛋白。

在另一方面,本发明还提供了一种非天然存在的或工程化组合物,其包含:(I.)一个或多个CRISPR-Cas系统多核苷酸序列,其包含(a) 能够与多核苷酸基因座中的靶序列杂交的指导序列,(b)tracr mate(即正向重复)序列,和(II.)编码Cas13效应蛋白的第二个多核苷酸序列,其中在转录时,引导序列指导CRISPR复合物与靶序列的序列特异性结合,和其中,CRISPR复合物包含与引导序列复合的Cas13效应蛋白,该引导序列与靶序列杂交。在某些实施方式中,效应蛋白可以是Cas13b效应蛋白。

在某些实施方式中,可能不需要tracrRNA。因此,本发明在某些实施方式中还提供了一种非天然存在的或工程化组合物,其包含:(I.)一个或多个CRISPR-Cas系统多核苷酸序列,其包含(a)能够与多核苷酸基因座中的靶序列杂交的指导序列。(b)正向重复序列,和(II.)编码 Cas13效应蛋白的第二个多核苷酸序列,其中在转录时,引导序列指导 CRISPR复合物与靶序列的序列特异性结合,并且其中CRISPR该复合物包含与(1)与靶序列杂交的引导序列,和(2)正向重复序列复合的Cas13 效应蛋白。优选地,效应蛋白可以是Cas13b效应蛋白。在没有限制的情况下,申请人假设在这种情况下,正向重复序列可包含足以将crRNA加载到效应蛋白上的二级结构。借助于实例而非限制,这种二级结构可在正向重复序列内包含茎环(基本上由其组成)或由其组成(例如,一个或多个茎环)。

本发明还提供了包含一种或多种载体的载体系统,所述一种或多种载体包含一种或多种多核苷酸分子,所述多核苷酸分子编码非天然存在或工程化组合物的组分,所述非天然存在的或工程化组合物具有本文所述的任何特征所定义的组合物。方法。

本发明还提供了包含一种或多种载体或一种或多种多核苷酸分子的递送系统,所述一种或多种载体或多核苷酸分子包含编码非天然存在或工程化组合物的组分的一种或多种多核苷酸分子,所述非天然存在的或工程化组合物是具有本文讨论的或本文描述的任何方法中定义的特征。

本发明还提供了用于治疗方法的非天然存在或工程化组合物,或一种或多种编码所述组合物成分的多核苷酸,或包含编码所述组合物成分的一种或多种多核苷酸的载体或递送系统。治疗的治疗方法可以包括基因或基因组编辑或基因治疗。

本发明还提供了方法和组合物,其中效应蛋白的一个或多个氨基酸残基可以被修饰,例如,表1-4蛋白或由其组成或基本上由表1-4蛋白组成的工程或非天然存在的Cas13效应蛋白。在一个实施方式中,该修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。一种或多种突变可以在效应蛋白的一种或多种催化活性结构域中。与缺乏所述一种或多种突变的效应蛋白相比,效应蛋白可以具有降低或消除的核酸酶活性。效应蛋白可能不指导在感兴趣的靶位点切割一条RNA链。在一个优选的实施方式中,一个或多个突变可包含两个突变。在一个优选的实施方式中,在Cas13效应蛋白,例如工程化或非天然存在的Cas13效应蛋白中,一个或多个氨基酸残基被修饰。在本发明的实施方式中,效应子蛋白包含一个或多个HEPN结构域。在一个优选的实施方式中,效应蛋白包含两个HEPN结构域。在另一个优选的实施方式中,效应蛋白在该蛋白的C 末端包含一个HEPN结构域,在该蛋白质N末端包含另一个HEPN结构域。在效应蛋白的催化活性结构域中,其包括HEPN结构域或与HEPN 结构域同源的催化活性结构域。在某些实施方式中,效应蛋白包括以下一种或多种突变:R116A,H121A,R1177A,H1182A(其中氨基酸位置对应于源自兽疫伯克氏菌ATCC 43767的第29组蛋白质的氨基酸位置)。本领域技术人员将理解,可以将不同的Cas13蛋白中的相应氨基酸位置突变为相同的效果。在某些实施方式中,一个或多个突变完全或部分消除了该蛋白的催化活性(例如,裂解率改变,特异性改变)在某些实施方式中,该效应蛋白是一种“死亡”效应蛋白,例如死的Cas13效应蛋白 (即dCas13b)。在HEPN结构域1中有更多的突变。在某些实施方式中,效应蛋白在HEPN结构域2中有一个或多个突变。在某些实施方式中,效应蛋白在HEPN结构域1和HEPN结构域2中具有一个或多个突变。效应蛋白可以包含一个或多个异源功能域。一个或多个异源功能域可包含一个或多个核定位信号(NLS)域。一个或多个异源功能域可包含至少两个或多个NLS域。一个或多个NLS结构域可位于效应蛋白(例如,Cas13b效应蛋白)的末端处或附近或附近,并且如果有两个或多个 NLS,则两者中的每一个可位于或邻近或附近或附近。在效应蛋白(例如,Cas13效应蛋白)的末端附近。一个或多个异源功能域可包含一个或多个转录激活域。在一个优选的实施方式中,转录激活结构域可以包含 VP64。一个或多个异源功能域可包含一个或多个转录抑制域。在优选的实施方式中,转录抑制结构域包含KRAB结构域或SID结构域(例如 SID4X)。一个或多个异源功能结构域可包含一个或多个核酸酶结构域。在一个优选的实施方式中,核酸酶结构域包含Fok1。

本发明还提供了一个或多个异源功能域,具有以下一种或多种活性:甲基化酶活性,脱甲基酶活性,转录激活活性,转录抑制活性,转录释放因子活性,组蛋白修饰活性,核酸酶活性,单-链RNA切割活性,双链RNA切割活性,单链DNA切割活性,双链DNA切割活性和核酸结合活性。至少一个或多个异源功能结构域可以在效应蛋白的氨基末端处或附近,和/或其中至少一个或多个异源功能域在效应蛋白的羧基末端处或附近。所述一个或多个异源功能域可以与效应蛋白融合。所述一个或多个异源功能结构域可被束缚至效应蛋白。一个或多个异源功能域可以通过接头部分连接至效应蛋白。

在某些实施方式中,如本文所述的Cas13效应子蛋白可以与包含短的CRISPR重复序列的基因座相关,所述短的CRISPR重复序列长在30 至40bp之间,更通常在34至38bp之间,甚至更通常在36至37bp之间,例如30、31、32、33、34、35、36、37、38、39或40bp长。在某些实施方式中,CRISPR重复序列是在80至350bp长之间的长或双重复,例如在80至200bp之间,甚至更典型地在86至88bp之间,例如80、81、 82、83、84、85、86、87、88、89或90bp长

在某些实施方式中,原型间隔子邻近基序(PAM)或PAM样基序指导本文所述的效应子蛋白(例如Cas13效应子蛋白)复合物与感兴趣的靶位点的结合。PAM可以是5'PAM(即位于原间隔子5'末端的上游)。在其他实施例中,PAM可以是3’PAM(即,位于原间隔子的5’端的下游)。在其他实施例中,需要5′PAM和3′PAM。在本发明的某些实施方式中,指导效应子蛋白(例如Cas13效应子蛋白)的结合可能不需要PAM或 PAM样基序。在某些实施方式中,5'PAM是D(例如,A,G或U)。在某些实施方式中,Cas13b效应子的5'PAM是D。在本发明的某些实施方式中,在重复序列处的切割可以产生crRNA(例如,短或长的crRNA),其包含由短核苷酸(例如5、6、7、8、9或10nt或更长,如果有的话) 侧接的完整间隔子序列。是双重重复序列)在5'末端的重复序列(可称为crRNA“标签”),其余重复序列在3'末端。本文描述的蛋白质可能要求crRNA标签与靶标5'侧翼序列之间缺乏同源性。该要求可能与Samai 等人在下文中进一步描述的要求类似,“Co-transcriptional DNA and RNA Cleavage during Type IIICRISPR-Cas Immunity”Cell 161,1164–1174, 2015年05月21日,据认为该要求可区分从CRISPR阵列本身入侵的核酸的天然靶标,以及重复序列的存在会导致与crRNA标签完全同源并阻止自身免疫。

在某些实施方式中,Cas13效应蛋白经过工程改造,可以包含一种或多种减少或消除核酸酶活性,从而减少或消除RNA干扰活性的突变。也可以在邻近残基处,例如在参与核酸酶活性的那些氨基酸附近的氨基酸处进行突变。在一些实施方式中,一个或多个推定的催化核酸酶结构域被失活,效应蛋白复合物缺乏切割活性,并起RNA结合复合物的作用。在一个优选的实施方式中,所得的RNA结合复合物可以与一个或多个本文所述的功能性结构域连接。

在某些实施方式中,一个或多个功能域是可控的,即可诱导的。

在本发明的某些实施方式中,指导RNA或成熟crRNA包含,基本上由正向重复序列和指导序列或间隔子序列组成或由其组成。基本上由指导序列或间隔序列连接的正向重复序列组成或由其组成。在本发明的优选实施方式中,成熟crRNA包含茎环或优化的茎环结构或优化的二级结构。在优选的实施方式中,成熟crRNA在正向重复序列中包含茎环或优化的茎环结构,其中茎环或优化的茎环结构对于裂解活性是重要的。在某些实施方式中,正向重复序列优选包含单个茎环。在某些实施方式中,通过引入影响茎环RNA双链体结构的突变来修饰效应蛋白复合物的切割活性。在优选的实施方式中,可以引入维持茎环的RNA双链体的突变,从而保持效应蛋白复合物的切割活性。在其他优选的实施方式中,可以引入破坏茎环的RNA双链体结构的突变,从而完全消除效应蛋白复合物的切割活性。

本文提供的CRISPR系统可利用包含指导序列的crRNA或类似多核苷酸,其中多核苷酸是RNA,DNA或RNA和DNA的混合物,和/或其中多核苷酸包含一种或多种核苷酸类似物。该序列可以包含任何结构,包括但不限于天然crRNA的结构,例如凸起,发夹或茎环结构。在某些实施方式中,包含引导序列的多核苷酸与可以是RNA或DNA序列的第二多核苷酸序列形成双链体。

本公开还提供了包含工程化CRISPR-Cas蛋白的细胞,组织,生物体, CRISPR-Cas系统,编码CRISPR-Cas系统的一种或多种组分的多核苷酸和/或包含所述多核苷酸的载体。本发明还提供了编码效应子蛋白的核苷酸序列,该核苷酸蛋白经密码子优化以在本文所述的任何方法或组合物中在真核生物或真核细胞中表达。在本发明的一个实施方式中,密码子优化的效应子蛋白是本文讨论的任何Cas13效应子蛋白,并且对于在真核细胞或生物中,例如但不限于本文其他地方提到的这种细胞或生物,对密码子进行了优化。酵母细胞或哺乳动物细胞或生物,包括小鼠细胞,大鼠细胞和人细胞或非人真核生物,例如植物。

在本发明的某些实施方式中,至少一个核定位信号(NLS)附着于编码Cas13效应蛋白的核酸序列。在优选的实施方式中,至少一个或多个C端或N端NLS连接(因此编码Cas13效应子蛋白的核酸分子可以包括NLS编码,以便表达的产物具有NLS连接或连接)。在一个优选的实施方式中,为了在真核细胞,优选人细胞中的最佳表达和核靶向,连接了C端NLS。本发明还包括用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰了多个感兴趣的靶基因座。复合物的核酸组分可以包含一种或多种蛋白结合RNA适体。一种或多种适体可能能够结合噬菌体外壳蛋白。

在另一方面,本发明提供了包含修饰的感兴趣的靶基因座的真核细胞,其中所述感兴趣的靶基因座已根据本文所述的任何方法进行了修饰。另一方面提供了所述细胞的细胞系。另一方面提供了包含一个或多个所述细胞的多细胞生物。

在某些实施方式中,感兴趣的靶基因座的修饰可导致:真核细胞包含改变的至少一种基因产物的表达;该真核细胞包含改变的至少一种基因产物的表达,其中该至少一种基因产物的表达增加;该真核细胞包含改变的至少一种基因产物的表达,其中该至少一种基因产物的表达降低;或包含已编辑基因组的真核细胞。

在某些实施方式中,真核细胞可以是哺乳动物细胞或人类细胞。

在进一步的实施方式中,本说明书中描述的非天然存在或工程化组合物,载体系统或递送系统可用于:位点特异性基因敲除;定点基因组编辑;RNA序列特异性干扰;或多重基因组工程。

还提供了来自本文所述的细胞,细胞系或生物的基因产物。在某些实施方式中,表达的基因产物的量可以大于或小于来自细胞,细胞系或生物体的基因产物的量。没有改变表达或未编辑基因组。在某些实施方式中,与未改变表达或未编辑基因组的细胞的基因产物相比,该基因产物可能会发生改变。

在另一个方面中,本发明提供了一种鉴定新颖的核酸修饰效应子的方法,其包括:从编码推定的核酸修饰酶基因座的一组核酸序列中鉴定推定的核酸修饰基因座,所述核酸序列位于距所述抗体的限定距离内。基因座的保守基因组元件,其包含至少一种超过定义的大小限制的蛋白质,或两者兼有;将鉴定出的推定的核酸修饰基因座分组为包含同源蛋白质的子集;通过基于一个或多个以下子项从一个或多个子集中选择核酸修饰基因座,从而鉴定出候选核酸修饰基因座的最终集合;包含具有低域同源性的推定效应蛋白的基因座的子集与相对于其他子集中的基因座的已知蛋白质域相匹配,包含相对于其他亚组的保守基因组与保守基因组距离最小的推定蛋白质的子集,包含具有较大效应子蛋白的基因座的子集相对于其他子集中的大型效应蛋白而言,与推定的相邻辅助蛋白具有相同的方向,该子集包含相对于其他基因座而言具有较低现有核酸修饰分类的推定效应子蛋白,该子集包含的基因座与已知核酸修饰基因座相比具有更低的邻近性子集,以及每个子集中的候选基因座总数。

在一个实施方式中,该核酸序列集是从基因组或宏基因组数据库获得的,例如包含原核基因组或宏基因组序列的基因组或宏基因组数据库。

在一个实施方式中,距保守基因组元件的定义距离在1kb和25kb 之间。

在一个实施方式中,保守的基因组元件包括重复元件,例如CRISPR 阵列。在一个具体的实施方式中,距保守基因组元件的限定距离在 CRISPR阵列的10kb之内。

在一个实施方式中,推定的核酸修饰(效应子)基因座中包含的蛋白质的定义的大小限制大于200个氨基酸,或更具体地,定义的大小限制大于700个氨基酸。在一个实施方式中,推定的核酸修饰位点在900 至1800个氨基酸之间。

在一个实施方式中,使用重复的或模式发现分析对一组核酸(如 PILER-CR)进行鉴定,从而确定了保守的基因组元件。

在一个实施方式中,本文描述的方法的分组步骤至少部分地基于结构域同源性搜索或HHpred蛋白结构域同源性搜索的结果。

在一个实施方式中,定义的阈值为BLAST最近邻居截止值0到1e-7。

在一个实施方式中,本文所述的方法进一步包括过滤步骤,该过滤步骤仅包括具有900至1800个氨基酸之间的推定蛋白质的基因座。

在一个实施方式中,本文所述的方法还包括对候选核酸修饰效应子的核酸修饰功能进行实验验证,包括产生一组编码核酸修饰效应子的核酸构建体并进行一个或多个生化验证测定,例如通过在细菌菌落中使用 PAM验证,体外裂解测定,Surveyor方法,在哺乳动物细胞中进行实验, PFS验证或其组合。

在一个实施方式中,本文所述的方法进一步包括从所鉴定的核酸修饰基因座制备包含一种或多种蛋白质的非天然存在或工程化组合物。

在一个实施方式中,所鉴定的基因座包括2类CRISPR效应子,或者所鉴定的基因座缺少Cas1或Cas2,或者所鉴定的基因座包括单个效应子。

在一个实施方式中,单个大效应蛋白的长度大于900或大于1100个氨基酸,或包含至少一个HEPN结构域。

在一个实施方式中,至少一个HEPN结构域在效应蛋白的N端或C 端附近,或位于效应蛋白的内部位置。

在一个实施方式中,单个大效应蛋白在N和C端包含一个HEPN结构域,在该蛋白内部包含两个HEPN结构域。

在一个实施方式中,所鉴定的基因座进一步包含在CRISPR阵列的 2kb至10kb内的一个或两个小的推定的辅助蛋白。

在一个实施方式中,一种小的辅助蛋白质少于700个氨基酸。在一个实施方式中,小辅助蛋白的长度为50至300个氨基酸。

在一个实施方式中,小辅助蛋白包含多个预测的跨膜结构域,或包含四个预测的跨膜结构域,或包含至少一个HEPN结构域。

在一个实施方式中,小辅助蛋白包含至少一个HEPN结构域和至少一个跨膜结构域。

在一个实施方式中,该位点不包含来自CRISPR阵列的最大25kb的额外蛋白质。

在一个实施方式中,CRISPR阵列包含正向重复序列,其长度约为 36个核苷酸。在一个具体的实施方式中,正向重复在5'端包含GTTG/ GUUG,其与3'端的CAAC反向互补。

在一个实施方式中,CRISPR阵列包含间隔序列,该间隔序列包含约 30个核苷酸的长度。

在一个实施方式中,所鉴定的基因座缺少小辅助蛋白。

本发明提供了鉴定新颖的CRISPR效应子的方法,其包括:a)在编码CRISPR阵列的基因组或宏基因组数据库中鉴定序列;b)在CRISPR 阵列的10kb内,在所述选择的序列中鉴定一个或多个开放阅读框(ORF); c)基于大小在900-1800个氨基酸之间的推定的CRISPR效应蛋白的存在来选择基因座,d)选择编码50-300个氨基酸的推定的辅助蛋白的基因座;e)鉴定编码推定的CRISPR效应子和CRISPR辅助蛋白的基因座,并任选地基于结构分析对它们进行分类。

在一个实施方式中,CRISPR效应子是VI型CRISPR效应子。在一个实施方式中,步骤(a)包括:i)比较基因组和/或宏基因组数据库中的序列与至少一个预先确定的编码CRISPR阵列的种子序列,并选择包含所述种子序列的序列;ii)基于CRISPR算法鉴定CRISPR阵列。

在一个实施方式中,步骤(d)包括鉴定核酸酶结构域。在一个实施方式中,步骤(d)包括鉴定RuvC,HPN和/或HEPN结构域。

在一个实施方式中,CRISPR阵列10kb之内不存在编码Cas1或Cas2 的ORF。

在一个实施方式中,步骤(b)中的ORF编码一个50-300个氨基酸的辅助蛋白。

在一个实施方式中,将步骤(d)中获得的推定的新型CRISPR效应子用作种子序列,以进一步比较基因组和/或宏基因组学序列,并随后选择权利要求1的步骤a)至d)中所述的目的基因座。一种实施方式中,通过以下方法获得预先鉴定的种子序列:(a)在基因组或宏基因组数据库中鉴定CRISPR基序,(b)在所述鉴定的CRISPR基序中提取多个特征,(c)对CRISPR基因座进行分类使用无监督学习,(d)基于所述分类鉴定保守的基因座元件,和(e)从中选择适合作为种子序列的推定的CRISPR效应子。

在一个实施方式中,特征包括蛋白质元件,重复结构,重复序列,间隔子序列和间隔子作图。在一个实施方式中,基因组和宏基因组数据库是细菌和/或古细菌基因组。基因组和宏基因组序列可从Ensembl和/ 或NCBI基因组数据库中获得。在一个实施方式中,步骤(d)中的结构分析基于二级结构预测和/或序列比对。以及手动管理获得的簇。在另一个方面,一种包含一个或多个氨基酸突变的突变的Cas13蛋白,其中所述氨基酸与与所述突变的Cas13蛋白形成复合物的指导RNA相互作用;或在HEPN活性位点中,是一个有盖域,该域是用两个β发夹(参见图 1,图18)覆盖crRNA 3'末端的域,一个螺旋域,选自螺旋1或工程Cas 13蛋白的螺旋2结构域,域间接头(IDL)结构域或桥螺旋结构域。在某些实施方式中,螺旋结构域1是螺旋结构域1-1、1-2或1-3。在实施方式中,螺旋结构域2是螺旋结构域2-1或2-2。在一个方面中,与天然存在的对应Cas13蛋白相比,工程化Cas13蛋白具有更高的蛋白酶活性或多核苷酸结合能力。

在一些实施方式中,Cas13蛋白是Cas13a、Cas13b、Cas13c或Cas13d。在一些实施方式中,Cas13蛋白是Cas13b。在一些实施方式中,该等氨基酸与指导RNA相互作用,所述指导RNA与突变的Cas13蛋白形成复合物。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b (PbCas13b)的以下氨基酸:T405,H407,K457,H500,K570,K590, N634,R638,N652,N653,K655,S658,K741,K744,N756,S757, R762,R791,K846,K857,K870和R877。在一些实施方式中,该等氨基酸在HEPN活性位点中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:氨基酸46-57、73-79、152-164、 1036-1046和1064-1074。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:R156,N157,H161,R1068, N1069和H1073。在一些实施方式中,该等氨基酸位于突变的Cas 13蛋白的结构域间接头结构域中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:R285,R287,K292,K294, E296和N297。在一些实施方式中,该等氨基酸位于突变的Cas 13蛋白的桥螺旋结构域中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的以下氨基酸:K826,K828,K829,R824,R830, Q831,K835,K836和R838。

在另一个方面中,本公开内容提供了一种改变Cas13蛋白活性的方法,该方法包括:基于至少一部分Cas 13蛋白质的三维结构,识别Cas13 蛋白中的一个或多个候选氨基酸,其中一个或多个候选氨基酸与指导 RNA相互作用,该指导RNA与Cas13蛋白形成复合物,或者位于Cas13 蛋白的HEPN活性位点,域间接头结构域或桥螺旋结构域中;突变所述一个或多个候选氨基酸,从而产生突变的Cas13蛋白,其中所述突变的 Cas13蛋白的活性不同于所述Cas13蛋白。

在一些实施方式中,Cas13蛋白是Cas13a、Cas13b、Cas13c或Cas13d。在一些实施方式中,Cas13蛋白是Cas13b。在一些实施方式中,该等氨基酸与指导RNA相互作用,所述指导RNA与突变的Cas13蛋白形成复合物。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b (PbCas13b)的以下氨基酸:T405,H407,K457,H500,K570,K590, N634,R638,N652,N653,K655,S658,K741,K744,N756,S757, R762,R791,K846,K857,K870和R877。在一些实施方式中,该等氨基酸在HEPN活性位点中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:氨基酸46-57、73-79、152-164、 1036-1046和1064-1074。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:R156,N157,H161,R1068, N1069和H1073。在一些实施方式中,该等氨基酸位于突变的Cas 13蛋白的结构域间接头结构域中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:R285,R287,K292,K294, E296和N297。在一些实施方式中,该等氨基酸位于突变的Cas 13蛋白的桥螺旋结构域中。在一些实施方式中,该等氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的以下氨基酸:K826,K828,K829,R824,R830, Q831,K835,K836和R838。

在一些实施方式中,Cas13b是Cas13b。在一些实施方式中,Cas13b 是一个Cas13直系同源物,其大小比迄今发现的Cas13系统小。在一些实施方式中,Cas13b是Cas13b-t1,Cas13b-t1a,Cas13b-t2或Cas13b-t3。在一些实施方式中,Cas13b是Cas13b-t1。在一些实施方式中,Cas13b 是Cas13b-t2。在一些实施方式中,Cas13b是Cas13b-t3。 CAS13直系同源物

术语“同源物”(在本文中也称为“直系同源物”)和“同源物”(在本文中也称为“同源物”)在本领域中是众所周知的。通过进一步的指导,本文所用的蛋白质的“同源物”是与该蛋白质的同源物具有相同或相似功能的相同物种的蛋白质。同源蛋白质可以但不必在结构上相关,或仅在部分结构上相关。如本文所用,蛋白质的“同源物”是不同种类的蛋白质,其执行与其作为同源物的蛋白质相同或相似的功能。在特定实施方式中,本文所指的Cas13蛋白的同源物或直系同源物具有至少60%,优选至少70%的序列同源性或同一性。优选至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%具有下表1-4中列出的Cas13效应蛋白。在一个优选的实施方式中,Cas13b效应蛋白可以是表1-4中鉴定的生物或该生物所属的属或来自该表。

已经发现许多Cas13直向同源物以共同的基序为特征。因此,在特定实施方式中,Cas13b效应蛋白是包含与由DKHXFGAFLNLARHN(SEQ ID NO:96),GLLFFVSLFLDK(SEQ ID NO:97),SKIXGFK(SEQ ID NO:98),DMLNELXRCP(SEQ ID NO:99),RXZDRFPYFALRYXD (SEQ IDNO:100)和LRFQVBLGXY(SEQ ID NO:101)组成的序列中的一个或多个具有至少70%序列同一性的序列的蛋白质。在进一步的特定实施方式中,Cas13b效应蛋白包含具有与这序列中的至少2、3、4、 5或全部6个至少70%序列同一性的序列。在另外的特定实施方式中,与这些序列的序列同一性为至少75%,80%,85%,90%,95%或100%。在另外的特定实施方式中,Cas13b效应蛋白是包含与GLLFFVSLFL(SEQ ID NO:102)和RHQXRFPYF(SEQ ID NO:103)具有100%序列同一性的序列的蛋白。在另外的特定实施方式中,Cas13b效应子是Cas13b 效应子蛋白,其包含与RHQDRFPY(SEQ ID NO:104)具有100%序列同一性的序列。

在特定实施方式中,Cas13b效应蛋白是与来自颊普雷沃菌,牙龈卟啉单胞菌,解糖丙酸杆菌,抗黎氏杆菌的Cas13b蛋白具有至少65%,优选至少70%,75%,80%,85%,90%,95%或更高的序列同一性的Cas13b 效应蛋白。在进一步的特定实施方式中,Cas13b效应子选自酿脓拟杆菌 (Bacteroides pyogenes),普氏菌种(Prevotella sp.)MA2016,鸭疫里默氏杆菌(Riemerella anatipestifer),喉管卟啉单胞菌(Porphyromonas gulae),牙龈卟啉单胞菌(Porphyromonas gingivalis)和Porphyromonas sp.COT-052OH4946的Cas13b蛋白。

应当理解,可以在本发明范围内的表1Cas13b酶的直系同源物可以包括包含多个直系同源物的表1Cas13b酶的片段的嵌合酶。这样的直系同源物的例子在本文其他地方描述。嵌合酶可包含表1Cas13b酶的片段和来自另一种CRISPR酶的片段,例如生物体的表1Cas13b酶的直系同源物,该生物体包括但不限于Bergeyella,Prevotella,Porphyromonas, Bacteroides,Alistipes,Riemerella,Myroides,Flavobacterium,Capnocytophaga,Chryseobacterium,Phaeodactylibacter,Paludibacter或Psychroflexus。嵌合酶可以包含第一片段和第二片段,以及所述片段,其中所述第一片段和第二片段中的一个片段是或来自表1的Cas13b酶的,而另一个片段是或来自不同物种的CRISPR酶直系同源物的。在某些情况下,Cas13b是Cas13b-t。例如,Cas13b可以是Cas13b-t1(例如, Cas13b-t1a),Cas13b-t2或Cas13b-t3(例如,参见图54A-54C)。

在实施方式中,本文所指的靶向Cas13 RNA的Cas13效应蛋白也包括效应蛋白的功能变体或其同源物或直向同源物。如本文所用,蛋白质的“功能变体”是指这种蛋白质的变体,其至少部分地保留了该蛋白质的活性。功能性变体可以包括突变体(可以是插入,缺失或替代突变体),包括多晶型物等,包括如本文结合表1所讨论的。功能性变体中还包括的是这样的蛋白质与另外的、通常不相关的核酸,蛋白质,多肽或肽的融合产物。功能变体可以是天然存在的,也可以是人造的。在一个实施方式中,可以对编码Cas13 RNA靶向效应蛋白或其直系同源物或同源物的核酸分子进行密码子优化以在真核细胞中表达。真核生物可以如本文所述。核酸分子可以被工程化或非天然存在。

在一个实施方式中,靶向Cas13 RNA的效应蛋白或其直系同源物或同源物可包含一个或多个突变。所述突变可以是人为引入的突变,并且可以包括但不限于催化域中的一个或多个突变,例如,将一个或多个突变引入一个或多个HEPN结构域。

在一个实施方式中,Cas13蛋白或其直系同源物或同源物可以用作与功能域融合或可操作地连接的通用核酸结合蛋白。示例性功能结构域可包括但不限于翻译引发剂,翻译活化剂,翻译阻遏物,核酸酶,特别是核糖核酸酶,剪接体,珠,光诱导/可控结构域或化学诱导/可控结构域。

在一个有利的实施方式中,本发明包括表1-5提到的Cas13效应蛋白。在某些示例性实施方式中,Cas13效应蛋白来自表1-5中鉴定的生物。在某些示例性实施方式中,Cas13效应蛋白来自选自以下的生物体: Bergeyella zoohelcum,Prevotella intermedia,Prevotella buccae, Porphyromonas gingivalis,Bacteroides pyogenes,Alistipessp.ZOR0009, Prevotella sp.MA2016,Riemerella anatipestifer,Prevotellaaurantiaca, Prevotella saccharolytica,Myroides odoratimimus CCUG 10230,Capnocytophaga canimorsus,Porphyromonas gulae,Prevotella sp.P5-125,Flavobacterium branchiophilum,Myroides odoratimimus,Flavobacterium columnare,或Porphyromonas sp.COT-052OH4946。在另一个实施方式中,一种或多种指导RNA被设计成结合一种或多种诊断疾病状态的靶 RNA序列。

在某些示例性实施方式中,CRISPR效应蛋白是选自表1的Cas13b 蛋白。

表1

在某些示例实施方式中,所述CRISPR效应子蛋白是选自表2的Cas13a 蛋白。

表2

在某些示例实施方式中,靶向RNA的效应子蛋白是如2017年6月26 日提交的美国临时专利申请号62/525,165和2017年8月16日提交的PCT 申请号US 2017/047193中公开的Cas13c效应子蛋白。下表4中提供了Cas13c 的示例野生型直系同源序列。在某些示例实施方式中,所述CRISPR效应子蛋白是来自表3或表4的Cas13c蛋白。

表3

表4

在某些示例实施方式中,所述CRISPR效应子蛋白是选自表5的Cas13d蛋白。

表5

变体和变异

本公开提供了Cas蛋白的变体和突变形式。在一些实例中,本公开包括 Cas 13的变体和突变形式,例如Cas13b。与对应的野生型相比,Cas蛋白的变体或突变形式可以是催化失活的,例如不具有核酸酶活性或核酸酶活性降低。在某些实例中,Cas蛋白的变体或突变形式具有切口酶活性。

CAS13的突变

在一些情况下,本公开提供了包含一种或多种氨基酸修饰的突变Cas13 蛋白,其中所述氨基酸:(a)与和所述突变Cas 13蛋白形成复合物的引导RNA 相互作用;(b)在所述突变Cas 13蛋白的HEPN活性位点、结构域间接头结构域或桥接螺旋结构域中;或其组合。

术语“对应的氨基酸”或“对应于……的残基”指Cas13同系物或直系同源物中的特定氨基酸或其类似物,其与参照Cas蛋白中的氨基酸相同或在功能上等同。因此,如本文所用,提及指定的Cas 13蛋白的“对应于氨基酸位置 [X]的氨基酸位置”代表提及其他公认的Cas 13和结构同系物和家族中的等同位置的集合。本文所述的突变适用于所有Cas13蛋白,所述Cas13蛋白是所述Cas蛋白的直系同源物或同源物(例如PbCas13b)。例如,所述突变适用于 Cas13a、Cas13b、Cas13c、Cas13d、Cas13b-t1、Cas13b-t2或Cas13b-t3。

在一方面,本发明涉及一种突变Cas13蛋白,其包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:T405、 H407、K457、H500、K570、K590、N634、R638、N652、N653、K655、 S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、 K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、 R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、K943、 R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、 K393、N653、N652、R482、N480、D396、E397、D398、E399、K294、 E400、R56、N157、H161、H452、N455、K484、N486、G566、H567、A656、 V795、A796、W842、K871、E873、R874、R1068、N1069或H1073。

本文所用的PbCas13b优选地具有NCBI参照序列WP_004343973.1。的序列。应当理解,WP_004343973.1是指野生型(即未突变的)PbCas13b。如本文中所使用的LshCas13a(沙氏纤毛菌(Leptotrichia shahii)Cas13a)优选地具有 NCBI参照序列WP_018451595.1的序列。应当理解,WP_018451595.1是指野生型(即未突变的)LshCas13b。如本文所用的PguCas13b(古卟啉单胞菌Cas13b)优选地具有NCBI参照序列WP_039434803.1的序列。应当理解, WP_039434803.1是指野生型(即未突变的)Pgu Cas13b。本文所用的Psp Cas13b(普雷沃菌P5-125 Cas13b)优选地具有NCBI参照序列 WP_044065294.1的序列。应当理解,WP_044065294.1是指野生型(即未突变的)Psp Cas13b。

根据如本文所述的发明,在本发明的实施方式中,VI型系统包含突变 Cas13效应子蛋白(和可选地在Cas13b效应子蛋白的上游或下游编码的小辅助蛋白)。在某些实施方式中,所述小辅助蛋白增强所述Cas13b效应子靶向 RNA的能力。

从Cas13的结构中获得的见解使进一步的合理工程化成为可能,以改善 RNA靶向特异性、碱基编辑和核酸检测等的功能。基于阐明的Cas13效应子的晶体结构和本文所述的它的cRNA,可以假定合理工程化和诱变的功能含义,其非限制性突变例示于下表6中(参见PbCas13b;WP_004343973.1)。

表6

结构(亚)域

在另一方面,本公开提供了包含一个或多个氨基酸突变的突变Cas13蛋白,其中所述氨基酸:与和所述工程化Cas 13蛋白形成复合物的引导RNA 相互作用;或在所述突变Cas13蛋白的HEPN活性位点、lid结构域、螺旋结构域(选自螺旋1或螺旋2结构域)、结构域间接头(IDL)结构域(IDL)或桥接螺旋结构域或其组合中。

基于所述Cas蛋白的晶体结构,可以识别不同的结构域。除序列比对外,所述晶体结构和结构域构建的信息还允许不同的直系同源物(例如Cas13b直系同源物)和同系物(其他Cas13蛋白,例如Cas13a、Cas13c或Cas13d)的对应的氨基酸被识别。举例来说而不受其限制,在如本文报道的和crRNA的复合物中的PbCas13b的晶体结构识别了以下结构域(也见图1A):HEPN1和 HEPN2(催化结构域,其分别跨越氨基酸1至285和930至1127);IDL(结构域间接头,其跨越氨基酸286至301);螺旋结构域1和2,其中螺旋结构域在螺旋结构域1-1、1-2和1-3(其分别跨越氨基酸302至374、499至581 和747至929)和螺旋结构域2(其跨越氨基酸582至746)中分裂;LID(其跨越氨基酸375至498)。螺旋结构域1(特别是螺旋结构域1-3)包含桥接螺旋作为可识别的亚结构域。因此,根据如本文所述的发明的特定突变,除了在Cas13 多肽中具有指定的氨基酸位置之外,还可以与Cas13蛋白的特定结构域连接。因此,Cas13直系同源物或同系物中的对应的氨基酸可以在Cas13多肽中具有特定的氨基酸位置,并且属于对应的结构域(也见例如图4,其作为Cas13a 和Cas13b的HEPN1和HEPN2中的对应的氨基酸的实例)。可以通过结构(亚) 域中的位置,通过对应于特定Cas13蛋白(例如PbCas13b)的氨基酸的位置,通过与引导RNA的相互作用或其组合来识别突变。

突变的类型可以是保守突变或非保守突变。在某些优选的实施方式中,将突变氨基酸突变成丙氨酸(A)。在某些优选的实施方式中,如果要突变氨基酸是芳族氨基酸,则将其突变成丙氨酸或另一种芳族氨基酸(例如H、Y、 W或F)。在某些优选的实施方式中,如果要突变氨基酸是带电荷的氨基酸,则将其突变成丙氨酸或另一种带电荷的氨基酸(例如H、K、R、D或E)。在某些优选的实施方式中,如果要突变氨基酸是带电荷的氨基酸,则将其突变成丙氨酸或具有相同电荷的另一种带电荷的氨基酸。在某些优选的实施方式中,如果要突变氨基酸是带电荷的氨基酸,则将其突变成丙氨酸或具有相反电荷的另一种带电荷的氨基酸。

本发明还提供了方法和组合物,其中所述效应子蛋白(例如工程化的或非天然存在的效应子蛋白或Cas13)的一个或多个氨基酸残基可以被修饰。在一个实施方式中,所述修饰可包括所述效应子蛋白的一个或多个氨基酸残基的突变。所述一个或多个突变可以在所述效应子蛋白的一个或多个催化活性结构域中,或在与crRNA相互作用的结构域中(例如引导序列或正向重复序列)。所述效应子蛋白相比于缺乏所述一个或多个突变的效应子蛋白可具有降低或消除的核酸酶活性或可替代地提高的核酸酶活性。所述效应子蛋白可能不引导在靶RNA靶基因座处的RNA链的切割。在一个优选的实施方式中,一个或多个突变可包含两个突变。在一个优选的实施方式中,在Cas13b效应子蛋白(例如工程化的或非天然存在的效应子蛋白或Cas13b)中修饰一个或多个氨基酸残基。在某些情况下,所述CRISPR-Cas蛋白在所述螺旋结构域中包含一个或多个突变。

本文所述的Cas13蛋白可包含一个或多个突变。在一些情况下,所述 Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的以下氨基酸:T405、H407、K457、H500、K570、K590、 N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、 R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、 K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、 D434、K431、R53、K943、R1041、Y164、R285、R287、K292、E296、N297、 Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、 E399、K294、E400、R56、N157、H161、H452、N455、K484、N486、G566、 H567、A656、V795、A796、W842、K871、E873、R874、R1068、N1069 或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:H407、K457、H500、 K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、 K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、 R838、R618、D434、K431、R53、K943、R1041、Y164、R285、R287、K292、 E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、 E397、D398、E399、K294、E400、R56、N157、H161、H452、N455、K484、 N486、G566、H567、W842、K871、E873、R874、R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:T405、H407、 K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、 K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、 R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、 K943、R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、E399、 K294或E400。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的以下氨基酸:K393、R402、N482、T405、H407、S658、N653、A656、K655、N652、H567、N455、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 V795、A796、R791、G566、K590、R638、H452、S757、N756、N486、 K484、N480、K457、K741、R56、N157、H161、R1068、N1069或 H1073。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K393、R402、N482、H407、 S658、N653、K655、N652、H567、N455、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、R791、G566、K590、R638、 H452、S757、N756、N486、K484、N480、K457、K741、R56、N157、 H161、R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:W842、K846、K870、E873或R877。在某些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b螺旋结构域1中的以下氨基酸:W842、K846、 K870、E873或R877。在某些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b螺旋结构域1-3 中的以下氨基酸:W842、K846、K870、E873或R877。在某些情况下,所述Cas13蛋白在螺旋桥接域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b螺旋桥接域中的以下氨基酸:W842、K846、K870、E873或R877。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K393、R402、N480、N482、N652或N653。在某些情况下,Cas13蛋白包含一个或多个与PbCas13b的以下氨基酸相对应的氨基酸突变:K393,R402,N480或N482。在一些情况下,所述Cas13 蛋白在LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的LID结构域中的以下氨基酸:K393、R402、N480或N482。在一些情况下,Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的以下氨基酸:N652或N653。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b 的螺旋结构域2中的以下氨基酸:N652或N653。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:T405、H407、S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、 H452、S757、N756、N486、K484、N480、K457或K741。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b 的以下氨基酸:H407、S658、N653、K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、 K590、R638、H452、S757、N756、N486、K484、N480、K457或K741。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、A656、K655、N652、H567、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、 A796、R791、G566、K590、R638、S757、N756或K741。在一些情况下,所述Cas13蛋白在螺旋结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域中的以下氨基酸:S658、N653、A656、K655、 N652、H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、S757、N756或K741。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H567、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、G566、S757或 N756。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1中的以下氨基酸:H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 V795、A796、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸: H567、H500、R762、V795、A796、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1中的以下氨基酸:H567、H500、R762、 V795、A796、R791、G566、S757或N756。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K871、K857、K870、W842、E873、R877、 K846或R874。在一些情况下,所述Cas13蛋白在所述螺旋桥接域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述螺旋桥接域中的以下氨基酸:K871、K857、K870、W842、E873、R877、K846或R874。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H567、H500或G566。在一些情况下,所述Cas13 蛋白在螺旋结构域1-2中包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的螺旋结构域1-2中的以下氨基酸:H567、H500或G566。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的以下氨基酸:K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、S757或N756。在一些情况下,所述Cas13 蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的螺旋结构域1-3中的以下氨基酸:K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:R762、V795、A796、R791、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1-3中的以下氨基酸:R762、 V795、A796、R791、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、 N653、A656、K655、N652、K590、R638或K741。在一些情况下,所述Cas13 蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的螺旋结构域2中的以下氨基酸:S658、N653、A656、K655、N652、 K590、R638或K741。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:T405、H407、N486、 K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b 的所述LID结构域中的以下氨基酸:T405、H407、N486、K484、N480、H452、 N455或K457。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、K655、N652、 H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 R791、G566、K590、R638、S757、N756或K741。

在一些情况下,所述Cas13蛋白在螺旋结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域中的以下氨基酸:S658、 N653、K655、N652、H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、K590、R638、S757、N756或 K741。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H567、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1中的以下氨基酸:H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、 G566、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H567,H500,R762,R791, G566,S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1中的以下氨基酸:H567、H500、R762、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K871、K857、K870、W842、E873、R877、K846、 R874、R762、R791、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1-3中的以下氨基酸:K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、S757或N756。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸: R762、R791、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域 1-3中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域1-3中的以下氨基酸:R762、R791、S757或N756。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、K655、N652、K590、R638 或K741。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的螺旋结构域2中的以下氨基酸:S658、N653、K655、N652、K590、R638或K741。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H407、N486、K484、N480、H452、N455 或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述LID结构域中的以下氨基酸:H407、N486、K484、N480、H452、N455或K457。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:R56、N157、H161、R1068、N1069或 H1073。在一些情况下,所述Cas13蛋白在所述HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述HEPN结构域中的以下氨基酸:R56、N157、H161、R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:R56、N157或H161。在一些情况下,所述Cas13蛋白在所述HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述HEPN结构域1中的以下氨基酸:R56、N157 或H161。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在所述HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述HEPN结构域2中的以下氨基酸: R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K393、R402、N482、T405、H407、N486、 K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b 的所述LID结构域中的以下氨基酸:K393、R402、N482、T405、H407、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:K393、 R402、N482、H407、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述LID结构域中的以下氨基酸:K393、R402、N482、H407、N486、K484、N480、H452、N455或K457。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:T405、H407、S658、N653、A656、 K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、 H452、S757、N756、N486、K484、N480、K457、K741、K393、R402或 N482。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:H407、S658、N653、K655、 N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、 N486、K484、N480、K457、K741、K393、R402或N482。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、A656、K655、N652、 H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、 R874、R762、V795、A796、R791、G566、K590、R638、H452、S757、 N756、N486、K484、N480、K457或K741。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、K655、N652、H567、N455、H500、K871、K857、 K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457或K741。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述LID结构域中的以下氨基酸: N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸: K393、R402、N482、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的所述LID结构域中的以下氨基酸:K393、 R402、N482、N486、K484、N480、H452、N455或K457。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于PbCas13b的以下氨基酸:S658、N653、A656、K655、N652、 H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、H452、S757、 N756、N486、K484、N480、K457、K741、K393、R402或N482。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于 PbCas13b的以下氨基酸:S658、N653、K655、N652、H567、N455、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、 K457、K741、K393、R402或N482。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K943 或R1041。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53或 Y164。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K943或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53、Y164、K943或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域1中的以下氨基酸:R53或Y164。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域2 中的以下氨基酸:K943或R1041。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K943、 R1041、R56、N157、H161、R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、R56、 N157或H161。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K943、 R1041、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN 结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53、Y164、K943、 R1041、R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述 Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域1中的以下氨基酸: R53、Y164、R56、N157或H161。在一些情况下,所述Cas13蛋白在HEPN 结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域2中的以下氨基酸:K943、R1041、 R1068、N1069或H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K183、 K193、K943或R1041。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K183或K193。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K943或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53、Y164、K183、 K193、K943或R1041。

在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域1中的以下氨基酸:R53、Y164、K183或K193。在一些情况下,所述Cas13 蛋白在HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域2中的以下氨基酸:K943或 R1041。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、 K183、K193、K943、R1041、R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K183、K193、 R56、N157或H161。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸: K943、R1041、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53、Y164、K183、 K193、K943、R1041、R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域1中的以下氨基酸:R53、Y164、K183、K193、R56、N157或H161。

在一些情况下,所述Cas13蛋白在HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域2中的以下氨基酸:K943、R1041、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K183或K193。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域1中的以下氨基酸:K183或K193。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、Y164、K943 或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN 结构域中的以下氨基酸:R53、Y164、K943或R1041。在一些情况下,所述 Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的以下氨基酸:R53、K943或R1041;优选地,R53A、 R53K、R53D或R53E;K943A、K943R、K943D或K943E;或R1041A、R1041K、 R1041D或R1041E。

在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53、K943或R1041;优选地,R53A、R53K、R53D 或R53E;K943A、K943R、K943D或K943E;或R1041A、R1041K、R1041D或R1041E。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的氨基酸Y164,优选地,Y164A、 Y164F或Y164W。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的氨基酸Y164,优选地,Y164A、Y164F或Y164W。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:T405、H407、K457、 D434、K431、R402、K393、R482、N480、D396、E397、D398或E399。

在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的所述LID 结构域中的以下氨基酸:T405、H407、K457、D434、K431、R402、K393、R482、N480、D396、E397、D398或E399。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的氨基酸H407,优选地,H407Y、H407W或H407F。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R402、K393、R482、 N480、D396、E397、D398或E399。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的所述LID结构域中的以下氨基酸:R402、K393、R482、 N480、D396、E397、D398或E399。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K457、D434或K431。在一些情况下,所述Cas13蛋白在所述LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的所述LID结构域中的以下氨基酸:K457、D434或 K431。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:H500、K570、 K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、 R838、R618、Q646、N647、N653或N652。在一些情况下,所述Cas13蛋白在螺旋结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域中的以下氨基酸:H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、 R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、Q646、N647、N653或N652。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的以下氨基酸:H500、K570、N756、S757、R762、 R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、 Q831、K835、K836或R838。在一些情况下,所述Cas13蛋白在螺旋结构域 1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的螺旋结构域1中的以下氨基酸:H500,K570,N756、 S757、R762、R791、K846,K857,K870,R877,K826,K828,K829,R824, R830,Q831,K835,K836,或R838.

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:H500、K570、N756、 S757、R762或R791。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的螺旋结构域1中的以下氨基酸:H500、K570、N756、S757、R762或R791。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸: K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、 K836或R838。在一些情况下,所述Cas13蛋白在所述螺旋桥接结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的所述螺旋桥接结构域中的以下氨基酸:K846、K857、 K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或 R838。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:H500或K570。在一些情况下,所述Cas13蛋白在螺旋结构域1-2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域1-2 中的以下氨基酸:H500或K570。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:N756、S757、 R762、R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸:N756、S757、R762、 R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、 K835、K836或R838。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸: N756、S757、R762或R791。在一些情况下,所述Cas13蛋白在螺旋结构域 1-3中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸:N756、S757、R762 或R791。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:N756、S757、 R762、R791、K846、K857、K870或R877。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸:N756、S757、 R762、R791、K846、K857、K870或R877。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K826、K828、K829、 R824、R830、Q831、K835、K836或R838。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸:K826、K828、 K829、R824、R830、Q831、K835、K836或R838。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K590、N634、 R638、N652、N653、K655、S658、K741、K744、R600、K607、K612、 R614、K617、R618、Q646、N647、N653或N652。在一些情况下,所述 Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2中的以下氨基酸:K590、 N634、R638、N652、N653、K655、S658、K741、K744、R600、K607、K612、 R614、K617、R618、Q646、N647、N653或N652。在一些情况下,所述Cas13 蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:Q646或N647。在一些情况下,所述Cas13 蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2中的以下氨基酸:Q646或N647。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:N653或N652。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2中的以下氨基酸:N653或N652。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸: K590、N634、R638、N652、N653、K655、S658、K741或K744。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2中的以下氨基酸:K590、N634、R638、N652、N653、K655、S658、K741或K744。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R600、K607、K612、R614、 K617或R618。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2中的以下氨基酸:R600、K607、K612、R614、K617或R618。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R285、R287、K292、 E296、N297或K294。在一些情况下,所述Cas13蛋白在所述IDL结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的所述IDL结构域中的以下氨基酸:R285、R287、K292、 E296、N297或K294。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸: R285、K292、E296或N297。在一些情况下,所述Cas13蛋白在所述IDL 结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的所述IDL结构域中的以下氨基酸:R285、K292、E296 或N297。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:T405、H500、 K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、 N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、 Q831、K835、K836、R838、R618、D434、K431、R285、R287、K292、 E296、N297、Q646、N647或K294。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b) 的以下氨基酸:R402、K393、N653、N652、R482、N480、D396、E397、 D398或E399。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53、 K655、R762或R1041;优选地,R53A或R53D;K655A;R762A;或R1041E 或R1041D。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:N297、 E296、K292或R285;优选地,N297A、E296A、K292A或R285A。在一些情况下,所述Cas13蛋白在所述IDL结构域(例如其中央通道)中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的所述 IDL结构域(例如其中央通道)中的以下氨基酸:N297、E296、K292或R285;优选地,N297A、E296A、K292A或R285A。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的以下氨基酸:Q831、K836、R838、N652、N653、R830、 K655或R762;优选地,Q831A、K836A、R838A、N652A、N653A、R830A、 K655A或R762A。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:N652、N653、R830、 K655或R762;优选地,N652A、N653A、R830A、K655A或R762A。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:K655或R762;优选地, K655A或R762A。在一些情况下,所述Cas13蛋白在螺旋结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域中的以下氨基酸:Q831、K836、R838、N652、N653、R830、K655 或R762;优选地,Q831A、K836A、R838A、N652A、N653A、R830A、K655A 或R762A。在一些情况下,所述Cas13蛋白在螺旋结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域中的以下氨基酸:N652、N653、R830、K655或R762;优选地,N652A、 N653A、R830A、K655A或R762A。

在一些情况下,所述Cas13蛋白在螺旋结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2 中的以下氨基酸:K655或R762;优选地,K655A或R762A。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的以下氨基酸:R614、K607、K193、K183或R600;优选地,R614A、K607A、K193A、K183A或R600A。在一些情况下,所述 Cas13蛋白在螺旋结构域2的反式亚基环中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的螺旋结构域2的反式亚基环中的以下氨基酸:Q646或N647;优选地,Q646A或N647A。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌PbCas13b(PbCas13b)的以下氨基酸:R53或R1041;优选地,R53A或 R53D,或R1041E或R1041D。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的HEPN结构域中的以下氨基酸:R53或R1041;优选地,R53A或R53D,或R1041E或R1041D。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的以下氨基酸:K457、D397、E398、D399、E400、T405、 H407或D434;优选地,D397A、E398A、D399A、E400A、T405A、H407A、 H407W、H407Y、H407F或D434A。在一些情况下,所述Cas13蛋白在所述 LID结构域中包含一个或多个氨基酸突变,所述氨基酸对应于颊普雷沃菌 PbCas13b(PbCas13b)的所述LID结构域中的以下氨基酸:K457、D397、E398、 D399、E400、T405、H407或D434;优选地,D397A、E398A、D399A、E400A、 T405A、H407A、H407W、H407Y、H407F或D434A。

在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸T405。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸 H407。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K457。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸H500。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K570。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸K590。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N634。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R638。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N652。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N653。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸 K655。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸658。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K741。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K744。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N756。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸757。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸R762。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R791。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K846。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K857。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K870。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R877。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K183。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K193。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R600。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K607。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K612。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的氨基酸R614。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K617。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K826。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸 K828。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K829。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R824。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R830。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸Q831 of颊普雷沃菌Cas13b(PbCas13b)。

在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K835。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K836。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R838。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R618。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸D434。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸K431。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R53。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K943。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R1041。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸Y164。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸 R285。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R287。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K292。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸E296。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N297。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸Q646 of颊普雷沃菌 Cas13b(PbCas13b)。

在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N647。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R402。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K393。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N653。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N652。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸R482。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N480。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的氨基酸D396。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸E397。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸D398。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸E399。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K294。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸E400。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R56。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N157。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸H161。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的氨基酸H452。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N455。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的氨基酸K484。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸N486。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸G566。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸H567。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸A656。在一些情况下,所述Cas13 蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸V795。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸A796。在一些情况下,所述 Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸W842。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸K871。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的氨基酸E873。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R874。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸R1068。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸 N1069。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b)的氨基酸H1073。

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13b(PbCas13b)的以下氨基酸:R597、N598、H602、 R1278、N1279或H1283。本公开还包括一种包含一个或多个氨基酸突变的突变Cas13蛋白,所述氨基酸对应于沙氏纤毛菌Cas13a(LshCas13a)的以下氨基酸:R597、N598、H602、R1278、N1279或H1283。在一些情况下,所述 Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13a(LshCas13a)的HEPN结构域中的以下氨基酸:R597、 N598、H602、R1278、N1279或H1283。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13b(PbCas13b) 的以下氨基酸:R597、N598或H602。在一些情况下,所述Cas13蛋白在 HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13a(LshCas13a)的HEPN结构域1中的以下氨基酸:R597、N598或H602。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13b(PbCas13b)的以下氨基酸:R1278、N1279或 H1283。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于沙氏纤毛菌Cas13a(LshCas13a)的HEPN 结构域2中的以下氨基酸:R1278、N1279或H1283。在一些情况下,所述 Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌 Cas13b(PguCas13b)的以下氨基酸:R146、H151、R1116或H1121。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌Cas13b(PguCas13b)的以下氨基酸:R146、H151、R1116或H1121。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌Cas13b(PguCas13b)的HEPN结构域中的以下氨基酸:R146,H151,R1116,或H1121.

在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌Cas13b(PguCas13b)的以下氨基酸:R146或H151。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌Cas13b(PguCas13b)的HEPN结构域1 中的以下氨基酸:R146或H151。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌Cas13b(PguCas13b)的以下氨基酸:R1116或H1121。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含一个或多个氨基酸突变,所述氨基酸对应于古卟啉单胞菌 Cas13b(PguCas13b)的HEPN结构域2中的以下氨基酸:R1116或H1121。在一些情况下,所述Cas13蛋白包含一个或多个氨基酸突变,所述氨基酸对应于普雷沃菌P5-125 Cas13b(PspCas13b)的以下氨基酸:H133或H1058。本公开还提供了一种包含一个或多个氨基酸突变的突变Cas13蛋白,所述氨基酸对应于普雷沃菌P5-125 Cas13b(PspCas13b)的以下氨基酸:H133或H1058。在一些情况下,所述Cas13蛋白在HEPN结构域中包含一个或多个氨基酸突变,所述氨基酸对应于普雷沃菌P5-125 Cas13b(PspCas13b)的HEPN结构域中的以下氨基酸:H133或H1058。

在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于普雷沃菌P5-125 Cas13b(PspCas13b)的氨基酸H133。在一些情况下,所述Cas13 蛋白在HEPN结构域1中包含氨基酸突变,所述氨基酸对应于普雷沃菌 P5-125 Cas13b(PspCas13b)的HEPN结构域1中的氨基酸H133。在一些情况下,所述Cas13蛋白包含氨基酸突变,所述氨基酸对应于颊普雷沃菌 Cas13b(PbCas13b)的氨基酸H1058。在一些情况下,所述Cas13蛋白在HEPN 结构域2中包含氨基酸突变,所述氨基酸对应于颊普雷沃菌Cas13b(PbCas13b) 的HEPN结构域2中的氨基酸H1058。

本文所述的CRISPR-Cas蛋白可包含一个或多个突变氨基酸。在一些实施方式中,所述氨基酸突变为A、P或V,优选地为A。在一些实施方式中,所述氨基酸突变为疏水性氨基酸。在一些实施方式中,所述氨基酸突变为芳族氨基酸。在一些实施方式中,所述氨基酸突变为带电荷的氨基酸。在一些实施方式中,所述氨基酸突变为带正电荷的氨基酸。在一些实施方式中,所述氨基酸突变为带负电荷的氨基酸。在一些实施方式中,所述氨基酸突变为极性氨基酸。在一些实施方式中,所述氨基酸突变为脂族氨基酸。

本公开还提供了改变CRISPR-Cas蛋白的活性的方法。在一些实施例中,此类方法包括基于Cas 13蛋白的至少一部分的三维结构识别所述Cas13蛋白中的一个或多个候选氨基酸,其中所述一个或多个候选氨基酸与和所述 Cas13蛋白形成复合物的引导RNA相互作用,或在所述Cas13蛋白的HEPN 活性位点、结构域间接头结构域或桥接螺旋结构域中;和使所述一个或多个候选氨基酸突变,从而产生突变Cas13蛋白,其中所述突变Cas13蛋白的活性不同于所述Cas13蛋白。

不稳定的CAS13和融合蛋白

在某些实施方式中,如本文所述,根据本发明所述的效应子蛋白与去稳定结构域(DD)相关联或融合。在一些实施方式中,所述所述DD是ER 50。

在一些实施方式中,所述DD的对应的稳定配体是4HT。这样,在一些实施方式中,至少一个DD之一是ER 50,并且其稳定配体是4HT或CMP8。在一些实施方式中,所述DD是DHFR50。在一些实施方式中,所述DD的对应的稳定配体是TMP。这样,在一些实施方式中,至少一个DD之一是 DHFR50,并且其稳定配体是TMP。在一些实施方式中,所述DD是ER 50。在一些实施方式中,所述DD的对应的稳定配体是CMP8。因此,CMP8可以是所述ER50系统中的4HT的替代稳定配体。尽管可能可以/应该竞争性方式使用CMP8和4HT,但某些细胞类型可能更易受这两种配体中的一种或另一种影响,并且技术人员根据本公开内容和本领域中的知识可以使用 CMP8和/或4HT。

在一些实施方式中,可以将一个或两个DD融合至所述Cas13的N末端,其中将一个或两个DD融合至Cas13的C末端。在一些实施方式中,所述至少两个DD与所述Cas13关联,并且所述DD是相同的DD,即所述DD是同系的。因此,所述DD中的两者(或两个或多个)可以是ER50 DD。这在一些实施方式中是优选的。或者,所述DD中的两者(或两个或多个)可以是DHFR50 DD。在一些实施方式中,这也是优选的。在一些实施方式中,所述至少两个DD与所述Cas13关联,并且所述DD是不同的DD,即所述DD 是异源的。因此,所述DD之一可以是ER50,而所述DD中的一个或多个或任何其他DD可以是DHFR50。具有两个或更多个异源的DD可以是有利的,因为它将提供更高水平的降解控制。在N或C末端处的多于一个的DD 的衔接融合可以增强降解;并且这种衔接融合可以是例如ER50-ER50-Cas13 或DHFR-DHFR-Cas13。设想在不存在任何稳定配体的情况下会发生高水平的降解,在不存在一个稳定配体和存在其他(或另一个)稳定配体的情况下会发生中等水平的降解,而在所述稳定配体中的两者(或两个或更多个)存在的情况下会发生低水平的降解。也可以通过具有N末端ER50 DD和C末端DHFR50 DD来给予控制。

在一些实施方式中,所述Cas13与所述DD的融合体包含所述DD和所述Cas13之间的接头。在一些实施方式中,所述接头是GlySer接头。在一些实施方式中,所述DD-Cas13还包含至少一个核输出信号(NES)。在一些实施方式中,所述DD-Cas13包含两个或更多个NES。在一些实施方式中,所述 DD-Cas13包含至少一个核定位信号(NLS)。这可以是NES的补充。在一些实施方式中,所述Cas13包含定位(核输入或输出)信号或基本上由其组成或由其组成,所述定位(核输入或输出)信号作为所述Cas13和所述DD之间的所述接头或其部分)。HA或Flag标记作为接头也在本发明的范围内。申请人使用NLS和/或NES作为接头,并且还使用短至GS长至(GGGGS)3的甘氨酸丝氨酸接头。

去稳定结构域具有赋予多种蛋白不稳定性的普遍用途;参见例如 Miyazaki,J AmChem Soc.Mar 7,2012;134(9):3942–3945,其通过引用并入本文。CMP8或4-羟基他莫昔芬可以是去稳定结构域。更普遍而言,发现哺乳动物DHFR的温度敏感突变体(DHFRts),遵循N末端规则的去稳定残基,在允许的温度下稳定,但在37℃下不稳定。在表达DHFRts的细胞中加入甲氨蝶呤(哺乳动物DHFR的高亲和力配体)可部分抑制所述蛋白的降解。这是一个重要的证明,即小分子配体可以稳定蛋白,否则该蛋白将靶向细胞降解。雷帕霉素衍生物用于稳定mTOR的FRB结构域(FRB*)的不稳定突变体并恢复融合激酶GSK-3β.6和7的功能。该系统证明配体依赖性稳定性代表了一种有吸引力的调节特定蛋白在复杂生物环境中的功能的策略。当雷帕霉素诱导的FK506结合蛋白和FKBP12的二聚化引起泛素互补时,控制蛋白活性的系统可能涉及DD发挥功能。可以将人FKBP12或ecDHFR蛋白的突变体工程化为在缺乏高亲和力配体Shield-1或甲氧苄啶(TMP)的情况下在代谢上不稳定。这些突变体是可用于实施本发明的一些可能的去稳定结构域(DD),并且DD与Cas13融合时的不稳定性赋予Cas13通过蛋白酶体对整个融合蛋白的降解。Shield-1和TMP以剂量依赖性方式结合并稳定DD。雌激素受体配体结合结构域(ERLBD,ERS1的残基305-549)也可以被工程化为去稳定结构域。由于雌激素受体信号转导通路涉及多种疾病,例如乳腺癌,因此已经对该通路进行了广泛研究,并且已经开发出许多雌激素受体激动剂和拮抗剂。因此,已知ERLBD和药物的相容对。有些配体与ERLBD的突变型而非野生型结合。通过使用编码三个突变(L384M、M421G、G521R)12的这些突变结构域之一,使用不干扰内源雌激素敏感性网络的配体来调节ERLBD衍生 DD的稳定性是可能的。可以引入一个额外的突变(Y537S)以进一步破坏 ERLBD的稳定性并将其配置为潜在的DD候选物。该四突变体是有利的DD 发展。所述突变ERLBD可以与Cas13融合,并且其稳定性可以使用配体来调节或扰动,其中所述Cas13具有DD。另一DD可以是基于Shield1配体稳定的突变FKBP蛋白的12kDa(107-氨基酸)标记;参见例如Nature Methods 5,(2008)。例如,DD可以是修饰的FK506结合蛋白12(FKBP12),所述修饰的 FK506结合蛋白12与合成的生物学惰性小分子Shield-1结合并由其可逆地稳定;参见例如Banaszynski LA,Chen LC,Maynard-Smith LA,Ooi AG, Wandless TJ.A rapid,reversible,and tunablemethod to regulate protein function in living cells using synthetic smallmolecules.Cell.2006;126:995–1004; Banaszynski LA,Sellmyer MA,Contag CH,Wandless TJ,Thorne SH.Chemical control of protein stability and function inliving mice.Nat Med. 2008;14:1123–1127;Maynard-Smith LA,Chen LC,BanaszynskiLA,Ooi AG, Wandless TJ.A directed approach for engineering conditionalprotein stability using biologically silent small molecules.The Journal ofbiological chemistry. 2007;282:24866–24872;和Rodriguez,Chem Biol.Mar 23,2012;19(3): 391–398—所有这些内容均通过引用并入本文,并且可以在本发明的实践中的选定的DD与Cas13关联中使用。可以看出,本领域的知识包括许多DD,并且所述DD可以与Cas13关联(例如有利地与接头融合),由此可以在存在配体的情况下使DD稳定,并且在其不存在时,DD可变得不稳定,从而使 Cas13完全不稳定,或者可以在不存在配体的情况下使DD稳定,并且在存在配体时,DD可变得不稳定;所述DD允许Cas13被调控或控制(换言之,打开或关闭),从而允许CRISPR-Cas13复合体或系统被调控或控制(换言之,打开或关闭),从而提供了用于例如在体内或体外环境中调节或控制系统的手段。例如,当感兴趣的蛋白表达为与DD标记的融合体时,它在细胞中去稳定化并迅速降解,例如通过蛋白酶体。因此,稳定配体的缺失导致D关联的 Cas被降解。当新的DD与感兴趣的蛋白融合时,其不稳定性赋予给了感兴趣的蛋白,导致整个融合蛋白的迅速降解。Cas的峰值活性有时有利于减少脱靶效应。因此,短时间的高活性爆发是优选的。本发明能够提供这样的峰。在某种意义上,所述系统是可诱导的。在一些其他意义上,所述系统在不存在稳定配体的情况下被抑制,并在不存在稳定配体的情况下被去抑制化。

死的CAS蛋白

在某些实施方式中,本文所述的效应子蛋白是催化失活的或死的Cas蛋白。在一些情况下,根据如本文所述的发明的效应子蛋白(CRISPR酶;Cas13;效应子蛋白)是催化失活或死的Cas13效应子蛋白(dCas13)。在一些情况下,死的Cas蛋白(例如死的Cas13蛋白)具有切口酶活性。在一些实施方式中,所述dCas13效应子包含在所述核酸酶结构域中的突变。在一些实施方式中,所述dCas13效应子蛋白已被截短。在一些情况下,所述死的Cas蛋白可以与本文所述的脱氨酶(例如腺苷脱氨酶)融合。

为了减小所述Cas13效应子和所述一个或多个功能结构域的融合蛋白的大小,可以截短所述Cas13效应子的C末端而仍保持其RNA结合功能。例如,可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少50个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100 个氨基酸,至少120个氨基酸,至少140个氨基酸,至少150个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少250个氨基酸,至少260个氨基酸或至少 300个氨基酸,或至少350个氨基酸,或最多120个氨基酸,或最多140个氨基酸,或最多160个氨基酸,或最多180个氨基酸,或最多200个氨基酸,或最多250个氨基酸,或最多300个氨基酸,或最多350个氨基酸,或最多 400个氨基酸。Cas13截短的具体实例包括C末端Δ984-1090,C末端Δ1026-1090和C末端Δ1053-1090,C末端Δ934-1090,C末端Δ884-1090, C末端Δ834-1090,C末端Δ784-1090和C末端Δ734-1090,其中氨基酸位置对应于普雷沃菌P5-125 Cas13b蛋白的氨基酸位置。技术人员将明白可为其他Cas13b直系同源物或其他Cas13类型或亚类型(例如Cas13a、Cas13c 或Cas13d)设计相似的截短。在一些情况下,截短的Cas13b由普雷沃菌P5-125 Cas13b的nt 1-984或者Cas13b直系同源物或同系物的对应的nt编码。Cas13 截短的实例还包括C末端Δ795-1095,其中氨基酸位置对应于鸭疫里默氏杆菌Cas13b蛋白的氨基酸位置。Cas13截短的实例进一步包括C末端Δ875-1175、C末端Δ895-1175、C末端Δ915-1175、C末端Δ935-1175、C末端Δ955-1175、C末端Δ975-1175、C末端Δ995-1175、C末端Δ1015-1175、 C末端Δ1035-1175、C末端Δ1055-1175、C末端Δ1075-1175、C末端Δ1095-1175、C末端Δ1115-1175、C末端Δ1135-1175、C末端Δ1155-1175,其中氨基酸位置对应于古卟啉单胞菌Cas13b蛋白的氨基酸位置。

在一些实施方式中,可以截短所述Cas13效应子蛋白的N末端。例如,可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少50个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少150个氨基酸,至少 160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少250个氨基酸,至少260个氨基酸或至少300个氨基酸,或至少350个氨基酸,或最多120个氨基酸,或最多140个氨基酸,或最多160个氨基酸,或最多180个氨基酸,或最多200个氨基酸,或最多 250个氨基酸,或最多300个氨基酸,或最多350个氨基酸或最多400个氨基酸。Cas13截短的实例包括N末端Δ1-125、N末端Δ1-88或N末端Δ1-72,其中所述截短的氨基酸位置对应于普雷沃菌P5-125 Cas13b蛋白的氨基酸位置。

在一些实施方式中,可以截短所述Cas13效应子蛋白的N或C末端两者。例如,可以在所述Cas13效应子的C末端处截短至少20个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C 末端处截短至少40个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160 个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少60个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120 个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少80个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80 个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350 个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少100个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少 40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13 效应子的C末端处截短至少120个氨基酸,并且可以在所述Cas13效应子的 N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220 个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少140 个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180 个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少160个氨基酸,并且可以在所述Cas13 效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140 个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少180个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100 个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少200个氨基酸,并且可以在所述 Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60 个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300 个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少220个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少 20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240 个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少240个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200 个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C 末端处截短至少260个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160 个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少280个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120 个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少300个氨基酸,并且可以在所述Cas13效应子的N 末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350 个氨基酸。例如,可以在所述Cas13效应子的C末端处截短至少350个氨基酸,并且可以在所述Cas13效应子的N末端处截短至少20个氨基酸,至少 40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260 个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13 效应子的N末端处截短至少20个氨基酸,并且可以在所述Cas13效应子的 C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220 个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少40 个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180 个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少60个氨基酸,并且可以在所述Cas13 效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140 个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少80个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100 个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少100个氨基酸,并且可以在所述 Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60 个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300 个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少120个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240 个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少140个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200 个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N 末端处截短至少160个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160 个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少180个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120 个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少200个氨基酸,并且可以在所述Cas13效应子的C 末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少 80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350 个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少220个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少 40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260 个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13 效应子的N末端处截短至少240个氨基酸,并且可以在所述Cas13效应子的 C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220 个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少260 个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180 个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少280个氨基酸,并且可以在所述Cas13 效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140 个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少300个氨基酸,并且可以在所述Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60个氨基酸,至少80个氨基酸,至少100 个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300个氨基酸或至少350个氨基酸。例如,可以在所述Cas13效应子的N末端处截短至少350个氨基酸,并且可以在所述 Cas13效应子的C末端处截短至少20个氨基酸,至少40个氨基酸,至少60 个氨基酸,至少80个氨基酸,至少100个氨基酸,至少120个氨基酸,至少140个氨基酸,至少160个氨基酸,至少180个氨基酸,至少200个氨基酸,至少220个氨基酸,至少240个氨基酸,至少260个氨基酸,至少300 个氨基酸或至少350个氨基酸。

分裂蛋白

注意在该背景下并且对于本文所述的各种应用而言更普遍地,可以设想使用RNA靶向的效应子蛋白的分裂形式。确实,这不仅可以增加特异性,而且对于递送也可以是有利的。从Cas13酶的两个部分基本上包含功能性 Cas13的意义上说,Cas13是分裂的。理想情况下,所述分裂应始终使催化结构域不受影响。所述Cas13可以充当核酸酶,或者它可以是死的Cas13,所述死的Cas13由于其催化结构域中的典型突变而本质上是具有非常少或没有催化活性的RNA结合蛋白。

分裂的Cas13的每一半可以与二聚化配体融合。举例来说而不受限制地,采用雷帕霉素敏感的二聚化结构域允许产生化学上可诱导的分裂的Cas13以用于暂时控制Cas13的活性。因此,可以通过将Cas13分裂为两个片段来使其变为化学上可诱导的,并且雷帕霉素敏感的二聚化结构域可以用于所述 Cas13的受控重组。所述分裂的Cas13的所述两个部分可以被认为是所述分裂的Cas13的N’末端部分和C’末端部分。所述融合通常在所述Cas13的分裂点。换言之,所述分裂的Cas13的所述N’末端部分的所述C’末端与所述二聚体的一半融合,而所述C’末端部分的N’末端与所述二聚体的另一半融合。

从创建新分裂的意义上说,不必分裂所述Cas13。分裂点通常是由计算机设计的并被克隆到构建体中。所述分裂的Cas13的所述两个部分(所述N’末端和所述C’末端部分)一起构成完整的Cas13,所述完整的Cas13包含优选地至少70%或更多的所述野生型氨基酸(或编码它们的核苷酸),优选地至少 80%或更多、优选地至少90%或更多、优选地至少95%或更多和最优选地至少99%或更多的所述野生型氨基酸(或编码它们的核苷酸)。一些修整是可能的,并且设想了突变体。非功能性结构域可被完全去除。重要的是两个部分可以放于一起,以及恢复或重构所需的Cas13功能。所述二聚体可以是同二聚体或异二聚体。

在某些实施方式中,如本文所述的Cas13效应子可用于例如突变特异性或等位基因特异性靶向,例如用于突变特异性或等位基因特异性敲减。

此外,可将所述RNA靶向的效应子蛋白与另一功能性RNAe结构域(例如非特异性RNAe或Argonaute 2)融合,所述RNA靶向的效应子蛋白与所述另一功能性RNAe结构域协同作用以增加所述RNAe活性或确保所述消息的进一步降解。

调节Cas13效应子蛋白

本发明提供了调节CRISPR蛋白功能的辅助蛋白。在某些实施方式中,所述辅助蛋白调节CRISPR蛋白的催化活性。在本发明的实施方式中,辅助蛋白调节靶向的或序列特异性的核酸酶活性。在本发明的实施方式中,辅助蛋白调节附带核酸酶活性。在本发明的实施方式中,辅助蛋白调节与靶核酸的结合。

根据本发明,待调节的核酸酶活性可以针对包含RNA或由RNA组成的核酸,包括但不限于mRNA、miRNA、siRNA和包含可切割的RNA链接以及核酸类似物的核酸。在本发明的实施方式中,所述待调节的核酸酶活性可以针对包含DNA或由DNA组成的核酸,包括但不限于包含可切割的DNA 链接和核酸类似物的核酸。

在本发明的实施方式中,辅助蛋白增强CRISPR蛋白的活性。在某些这样的实施方式中,所述辅助蛋白包含HEPN结构域并增强RNA切割。在某些实施方式中,所述辅助蛋白抑制CRISPR蛋白的活性。在某些这样的实施方式中,所述辅助蛋白包含失活的HEPN结构域或完全缺失HEPN结构域。

根据本发明,VI型CRISPR系统的天然存在的辅助蛋白包含在CRISPR 基因座处或附近编码的小蛋白,所述小蛋白的功能是修饰CRISPR蛋白的活性。通常,CRISPR基因座可被识别为包含推定的CRISPR阵列和/或编码推定的CRISPR效应子蛋白。在实施方式中,效应子蛋白可以是800至2000 个氨基酸,或900至1800个氨基酸,或950至1300个氨基酸。在实施方式中,辅助蛋白可以在推定的CRISPR效应子蛋白或阵列的25kb内或20kb 内或15kb内或10kb内,或在推定的CRISPR效应子蛋白或阵列的2kb至 10kb的范围内编码。

在本发明的实施方式中,辅助蛋白是50至300个氨基酸,或100至300 个氨基酸或150至250个氨基酸或约200个氨基酸。辅助蛋白的非限制性实例包括本文所识别的csx27和csx28蛋白。

本发明的CRISPR辅助蛋白的识别和使用不依赖于CRISPR效应子蛋白分类。可以发现本发明所述的辅助蛋白与多种CRISPR效应子蛋白关联或被设计为与多种CRISPR效应子蛋白共同起作用。本文所识别并使用的辅助蛋白的实例通常代表CRISPR效应子蛋白。应当理解,CRISPR效应子蛋白分类可涉及同源性,特征位置(例如REC结构域、NUC结构域、HEPN序列的位置),核酸靶标(例如DNA或RNA),tracr RNA的缺失或存在,正向重复的引导/间隔序列5’或3’的位置,或其他条件。在本发明的实施方式中,辅助蛋白的识别和使用超越此类分类。

在靶向RNA的VI型CRISPR-Cas系统中,所述Cas蛋白通常包含两个保守的HEPN结构域,所述保守的HEPN结构域参与RNA切割。在某些实施方式中,所述Cas蛋白加工crRNA以产生成熟的crRNA。所述crRNA的引导序列识别具有互补序列的靶RNA,并且所述Cas蛋白降解靶链。更具体地,在某些实施方式中,在靶结合之后,所述Cas蛋白进行结构重排,所述结构重排集合两个HEPN结构域以形成活性HEPN催化位点,然后切割所述靶RNA。在所述Cas蛋白表面附近的所述催化位点的位置允许非特异性的附带ssRNA切割。

在某些实施方式中,辅助蛋白在增加或减少靶标和/或附带RNA切割中至关重要。不受理论束缚地,激活CRISPR活性的辅助蛋白(例如csx28蛋白或直系同源物或包含HEPN结构域的变体)可被设想为能够与Cas蛋白相互作用并且能够将其HEPN结构域与Cas蛋白的HEPN结构域结合以形成活性 HEPN催化位点,而抑制性辅助蛋白(例如缺失HEPN结构域的csx27)可被设想为能够与Cas蛋白相互作用并减少或阻断会集合两个HEPN结构域的Cas 蛋白的构象。

根据本发明,在某些实施方式中,增强VI型Cas蛋白或其复合物的活性包括使所述VI型Cas蛋白或其复合物与来自激活所述Cas蛋白的同一生物的辅助蛋白接触。在其他实施方式中,增强其复合物的VI型Cas蛋白的活性包括使所述VI型Cas蛋白或其复合物与来自同一亚纲内的不同生物的激活剂辅助蛋白(例如VI-b型)接触。在其他实施方式中,增强VI型Cas蛋白或其复合物的活性包括使所述VI型Cas蛋白或其复合物与不在所述亚类内的辅助蛋白(例如除具有VI-b型辅助蛋白的VI-b型以外的VI型Cas蛋白或与之相反的)接触。

根据本发明,在某些实施方式中,阻遏VI型Cas蛋白或其复合物的活性包括使所述VI型Cas蛋白或其复合物与来自同一生物的阻遏Cas蛋白的辅助蛋白接触。在其他实施方式中,阻遏VI型Cas蛋白或其复合物的活性包括使所述VI型Cas蛋白或其复合物与来自同一亚纲内的不同生物的阻遏辅助蛋白(例如VI-b型)接触。在其他实施方式中,阻遏VI型Cas蛋白或其复合物的活性包括使所述VI型Cas蛋白或其复合物与不在所述亚纲内的阻遏辅助蛋白接触(例如除具有VI-b型阻遏辅助蛋白的VI-b型以外的VI型Cas 蛋白或与之相反的)。

在所述VI型Cas蛋白和所述VI型辅助蛋白来自同一生物的某些实施方式中,所述两种蛋白将在CRISPR工程化系统中共同发挥作用。在某些实施方式中,期望例如通过修饰所述蛋白中的任一种或两者或它们的表达来改变所述工程化CRISPR系统的功能。在所述VI型Cas蛋白和所述VI型辅助蛋白来自不同生物(所述生物可以在同一纲或不同纲内)的实施方式中,所述蛋白可以在工程化CRISPR系统中一起发挥作用,但是常常期望或要求修饰所述蛋白中的任一种或两者以使其一起发挥作用。

因此,在本发明的某些实施方式中,可以修饰Cas蛋白和辅助蛋白中的任一种或两者以调节所述Cas蛋白和所述辅助蛋白之间的蛋白-蛋白相互作用的方面。在某些实施方式中,可以修饰Cas蛋白和辅助蛋白中的任一种或两者以调节蛋白-核酸相互作用的方面。调节蛋白-蛋白相互作用和蛋白-核酸相互作用的方法包括但不限于拟合分子表面、极性相互作用、氢键和调节范德华相互作用。在某些实施方式中,调节蛋白-蛋白相互作用或蛋白-核酸结合包括增加或减少结合相互作用。在某些实施方式中,调节蛋白-蛋白相互作用或蛋白-核酸结合包括偏向或不偏向所述蛋白或所述核酸的构象的修饰。

“拟合(fitting)”是指确定(包括通过自动或半自动方式)Cas13蛋白的一个或多个原子(和可选地,Cas13辅助蛋白的至少一个原子)之间的,或Cas13 蛋白的一个或多个原子与核酸的一个或多个原子之间(或可选地,Cas13辅助蛋白的的一个或多个原子与核酸之间)的相互作用,并计算这种相互作用稳定的程度。相互作用包括由电荷、空间考虑因素等带来的吸引和排斥。

VI型CRISPR蛋白或其复合物(和/或在Cas13b的背景下的VI型CRISPR 辅助蛋白或其复合物)的三维结构在本发明的背景下提供了另外的用于识别 Cas13的直系同源物中的其他突变的工具。所述晶体结构也可以作为设计新的特定Cas13(和可选地,Cas13辅助蛋白)的基础。进一步描述了各种用于拟合的基于计算机的方法。可以通过使用对接程序(docking program)的计算机建模的使用来检查Cas13(和可选的辅助蛋白)与核酸的结合相互作用。对接程序(例如GRAM、DOCK或AUTODOCK)是已知的(参见Walters等,DrugDiscovery Today,vol.3,no.4(1998),160-178,和Dunbrack等,Folding和设计2(1997),27-42)。该程序可以包括计算机拟合以确定所述结合配体的形状和化学结构有多好。可以对VI型系统的活性位点或结合位点进行计算机辅助的手动检查。例如GRID(定具有各种官能团的分子之间的可能的相互作用位点的程序)的程序(P.Goodford,J.Med.Chem,1985,28,849-57)也可以用于分析活性位点或结合位点以预测结合化合物的部分结构。可以使用计算机程序来估计两个结合配体(例如VI型CRISPR系统的组分,或核酸分子和VI 型CRISPR系统的组分)的吸引力、排斥力或空间位阻。

可以基于氨基酸特性(例如残基的极性、电荷、溶解度、疏水性、亲水性和/或两亲性质)的差异或相似性来进行氨基酸置换,因此将氨基酸一起分组于功能组中是有用的。可以仅基于氨基酸的侧链而将它们分组在一起。在比较直系同源物时,由于结构或催化原因,可能存在保守的残基。这些组可以以维恩图的形式描述(Livingstone C.D.and BartonG.J.(1993)“Protein sequence alignments:a strategy for the hierarchicalanalysis of residue conservation”Comput.Appl.Biosci.9:745-756)(Taylor W.R.(1986)“The classification of amino acid conservation”J.Theor.Biol.119;205-218)。可以例如根据下表来进行保守置换,该表描述了公认的氨基酸的维恩图分组(参见下表7)。

表7

在工程化Cas13系统中,修饰可包括所述Cas13蛋白的一个或多个氨基酸残基的修饰(和/或在Cas13b的情况下可包括所述Cas13辅助蛋白的一个或多个氨基酸残基的修饰)。

在工程化Cas13系统中,修饰可包括位于包含在未修饰的Cas13蛋白(和 /或Cas13辅助蛋白)中为带正电荷的残基的区域中的一个或多个氨基酸残基的修饰。

在工程化Cas13系统中,修饰可包括在所述未修饰的Cas13蛋白(和/或 Cas13辅助蛋白)中为带正电荷的一个或多个氨基酸残基的修饰。

在工程化Cas13系统中,修饰可包括在所述未修饰的Cas13蛋白(和/或 Cas13辅助蛋白)中为不带正电荷的一个或多个氨基酸残基。

所述修饰可包括修饰未修饰的Cas13蛋白(和/或Cas13辅助蛋白)中为不带电荷的一个或多个氨基酸残基的修饰。

所述修饰可包括在所述未修饰的Cas13蛋白(和/或Cas13辅助蛋白)中为带负电荷的一个或多个氨基酸残基的修饰。

所述修饰可以包括在未修饰的Cas13蛋白(和/或Cas13辅助蛋白)中为疏水性的一个或多个氨基酸残基的修饰。

所述修饰可包括在所述未修饰的Cas13蛋白(和/或Cas13辅助蛋白)中为极性的一个或多个氨基酸残基的修饰。

所述修饰可包括带电荷的氨基酸对疏水性氨基酸或极性氨基酸的置换,所述带电荷的氨基酸可以是带负电荷的或带正电荷的氨基酸。所述修饰可包括带正电荷的或极性或疏水性氨基酸对带负电荷的氨基酸的置换。所述修饰可包括带负电荷的或极性或疏水性氨基酸对带正电荷的氨基酸的置换。

本发明的实施方式包括序列(多核苷酸或多肽两者),所述序列可包含可发生的同源置换(本文使用了置换和取代两者以表示替代的残基或核苷酸对存在的氨基酸残基或核苷酸的交换),即,在氨基酸情况下的类似物间的置换,例如碱性对碱性、酸性对酸性、极性对极性等。也可发生非同源置换,即从一类残基到另一类残基,或者替代地涉及包含非天然的氨基酸,例如鸟氨酸 (以下称为Z)、二氨基丁酸鸟氨酸(以下称为B)、正亮氨酸鸟氨酸(以下称为 O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可包含可插入所述序列的任两个氨基酸残基之间的合适的间隔基,除了例如甘氨酸或β-丙氨酸残基的氨基酸间隔基外,所述合适的间隔基还包括烷基(例如甲基、乙基或丙基)。本领域技术人员可以很好地理解另一种形式的变异,其涉及类肽形式的一个或多个氨基酸残基的存在。为避免疑问,“所述类肽形式”用于表示变体氨基酸残基,其中α-碳取代基在残基的氮原子上,而非所述α-碳上。制备类肽形式的肽的方法是本领域已知的,例如Simon RJ 等,PNAS(1992)89(20),9367-9371和Horwell DC,Trends Biotechnol.(1995) 13(4),132-134。

同源性建模:可以通过Zhang等,2012(Nature;490(7421):556-60)和 Chen等,2015(PLoS Comput Biol;11(5):e1004248)的方法(计算蛋白-蛋白相互作用(PPI)的方法(预测结构域-基序交界面介导的相互作用的计算化蛋白- 蛋白相互作用(PPI)方法)来识别其他Cas13直系同源物中的对应的残基。 PrePPI(预测PPI)(基于结构的PPI预测方法)使用贝叶斯统计框架(Bayesian statistical framework)来结合结构证据与非结构证据。所述方法涉及获取一对查询蛋白和使用结构比对以识别对应于其实验确定的结构或同源性模型的结构代表。通过考虑整体和局部几何关系,进一步使用结构对比以识别近的和远的结构邻近物两者。每当所述结构代表的两个邻近物形成蛋白数据库(蛋白Data Bank)中报告的复合物时,这定义了用于对两个查询蛋白之间的相互作用进行建模的模板。通过将代表性结构叠加于他们在模板中的对应的结构邻近物上来创建复杂物的模型。这种方法在Dey等,2013(Prot Sci;22:359-66) 中。

附带活性

最近将附带活性用于名为SHERLOCK的高灵敏度和特异性核酸检测平台,所述核酸检测平台可用于许多临床诊断(Gootenberg,J.S.et al.Nucleic acid detection withCRISPR-Cas13a/C2c2.Science 356,438-442(2017))。

根据本发明,工程化CRISPR-Cas系统针对RNA核酸内切酶活性进行了优化,并且可以在哺乳动物细胞中表达和靶向以有效敲低细胞中的报告分子或转录物。

具有等温扩增的工程化CRISPR-Cas的附带作用提供了基于CRISPR的诊断,所述诊断提供了具有高灵敏度和单碱基错配特异性的快速的DNA或 RNA检测。基于CRISPR-Cas的分子检测平台用于检测特定病毒株,区分病原细菌,对人DNA进行基因分型和鉴定无细胞的肿瘤DNA突变。此外,可以冻干反应试剂以实现冷链独立性和长期保存,并可以很容易地在理论上重构所述反应试剂以用于现场应用。

在便携式平台上以高灵敏度和单碱基特异性快速地检测核酸的能力可有助于疾病诊断和监测、流行病学和一般实验室任务。尽管存在用于检测核酸的方法,但是它们在灵敏度、特异性、简单性、成本和速度之中有权衡。

微生物的成簇、规则间隔的短回文重复(CRISPR)和CRISPR相关的 (CRISPR-Cas)适应性免疫系统包含可编程的核酸内切酶,所述可编程的核酸内切酶可用于基于CRISPR的诊断(CRISPR-Dx)。可以使用CRISPR RNA(crRNA)对CRISPR-Cas进行重编程以提供用于特异性DNA感测的平台。激活的CRISPR-Cas在识别其DNA靶标之后参与附近的非靶标核酸(即RNA和/或ssDNA)的“附带”切割。这种crRNA编程的附带切割活性通过触发程序性细胞死亡或通过标记RNA或ssDNA的非特异性降解来使 CRISPR-Cas能够检测体内特异性DNA的存在。在此描述了一种基于核酸扩增和对商购报道分子RNA的CRISPR-Cas介导的附带切割的具有高灵敏度的体外核酸检测平台,所述体外核酸平台允许对靶标的实时检测。

非特异性ssDNA和RNA定向蛋白的保守性将不可避免地导致进一步的和潜在的改进的CRISPR蛋白,所述改进的CRISPR蛋白展现附带切割,并可用于检测,并为在扩增的和高度敏感的诊断系统(特别是SHERLOCK)中对核酸靶标进行多重检测提供了更大的广度。

基于RNA的掩蔽

在某些示例实施方式中,基于RNA的掩蔽构建体抑制可检测的阳性信号的产生,或者所述基于RNA的掩蔽构建体通过掩蔽所述可检测的阳性信号或替代地产生可检测的阴性信号来抑制可检测的阳性信号的产生,或者所述基于RNA的掩蔽构建体包含沉默RNA,所述沉默RNA抑制由报告构建体编码的基因产物的产生,其中所述基因产物在表达时产生可检测的阳性信号。

在另一示例实施方式中,所述基于RNA的掩蔽构建体是产生阴性可检测信号的核酶,并且其中当核酶失活时产生阳性可检测信号。在一个示例实施方式中,所述核酶将底物转化为第一颜色,并且其中所述底物在所述核酶失活时转化为第二颜色。在另一示例实施方式中,所述基于RNA的掩蔽试剂是螯合酶的适配体,其中所述酶通过作用于底物而在从所述适配体释放时产生可检测的信号,或者所述适配体螯合一对在从所述适配体释放时结合以产生可检测的信号的试剂。

在另一示例实施方式中,所述基于RNA的掩蔽构建体包含RNA寡核苷酸,可检测的配体寡核苷酸和掩蔽组分连接至所述RNA寡核苷酸。在某些示例实施方式中,所述可检测的配体是荧光团,并且所述掩蔽组分是淬灭分子。

在另一方面,本发明提供了一种用于检测样品中的靶核酸(例如RNA)的方法,其包括:将样品或样品组分配到一个或多个单独的离散体积中,所述单独的离散体积包括包含CRISPR系统(所述CRISPR系统包含效应子蛋白)、一个或多个引导RNA、基于RNA的掩蔽构建体;在足以允许所述一个或多个引导RNA与一个或多个靶分子结合的条件下孵育所述样品或样品组;通过所述一个或多个引导RNA与所述一个或多个靶分子的结合来激活所述CRISPR效应子蛋白,其中激活所述CRISPR效应子蛋白导致所述基于RNA 的掩蔽构建体的修饰,从而产生可检测的阳性信号;和检测所述可检测的阳性信号,其中检测到所述可检测的阳性信号表明所述样品中存在一个或多个靶分子。

在一些实施方式中,所述用于检测样品中的靶核酸的方法包括:使样品与以下物质接触:工程化的CRISPR-Cas蛋白;至少一个引导多核苷酸,所述引导多核苷酸包含能够与靶核酸结合并设计为与所述工程化CRISPR-Cas 形成复合物的引导序列;和包含非靶序列的基于RNA的掩蔽构建体;其中所述工程化CRISPR-Cas蛋白表现出附带的RNAe活性并切割所述检测构建体的所述非靶序列;和检测来自所述非靶序列的切割的信号,从而检测所述样品中的所述靶核酸。在一些实施方式中,所述方法进一步包括使所述样品与用于扩增所述靶核酸的试剂接触。在一些实施方式中,用于扩增的所述试剂包括等温扩增反应试剂。在一些实施方式中,所述等温扩增试剂包括基于核酸序列的扩增试剂、重组酶聚合酶扩增试剂、环介导的等温扩增试剂、链置换扩增试剂、解旋酶依赖性扩增试剂或切口酶扩增试剂。

在一些实施方式中,所述靶核酸是DNA分子,并且所述方法进一步包括使所述靶DNA分子与包含RNA聚合酶位点和RNA聚合酶的引物接触。

在一些实施方式中,所述掩蔽构建体:抑制可检测的阳性信号的产生,直到所述掩蔽构建体被切割或失活;或者掩蔽可检测的阳性信号或产生可检测的阴性信号,直到所述掩蔽构建体被切割或失活。

在一些实施方式中,所述掩蔽构建体包含:a.沉默RNA,其抑制由报告构建体编码的基因产物的产生,其中所述基因产物在表达时产生可检测的阳性信号;b.产生阴性可检测信号的核酶,并且其中所述可检测的阳性信号在所述核酶失活时产生正;或者c.核酶,其将底物转化为第一颜色,并且其中所述底物在所述核酶失活时为第二颜色;d.适配体和/或包含多核苷酸拴系的抑制剂;e.与可检测的配体和掩蔽组分连接的多核苷酸;f.通过桥接分子保持聚集的纳米粒子,其中所述桥接分子的至少一部分包含多核苷酸,并且其中,当将纳米粒子分散于溶液中时,所述溶液经历色移;g.通过连接分子与一个或多个猝灭分子连接的量子点或荧光团,其中所述连接分子的至少一部分包含多核苷酸;h.与嵌合剂复合的多核苷酸,其中所述嵌合剂在切割所述多核苷酸之后改变吸光度;或1.由多核苷酸栓系的两个荧光团,所述萤光团在从所述多核苷酸释放时发生荧光变化。在一些实施方式中,所述适配体a.包含螯合酶的多核苷酸栓系的抑制剂,其中所述酶通过作用于底物从所述适配体或多核苷酸栓系的抑制剂释放时产生可检测的信号;或b. 是抑制酶并防止所述酶催化从底物产生可检测的信号的抑制性适配体,或其中所述多核苷酸栓系的抑制剂抑制酶并防止所述酶催化从底物产生可检测的信号;或c.螯合一对试剂,所述试剂在从所述适配体释放后结合以产生可检测的信号。在一些实施方式中,所述纳米颗粒是胶态金属。在一些实施方式中,所述至少一个引导多核苷酸包含错配。在一些实施方式中,所述错配在所述一个或多个引导序列上的单个核苷酸变异的上或下游。

在另一方面,本发明提供了一种用于检测样品中的肽的方法,其包括:将样品或样品组分配到一个或多个单独的离散体积中,所述单独的离散体积包括包含肽检测适配体、包含效应子蛋白的CRISPR系统、一个或多个引导 RNA、基于RNA的掩蔽构建体;其中所述肽检测适配体包含掩蔽的RNA聚合酶位点并被配置为与一个或多个靶分子结合;在足以允许所述肽检测适体与所述一个或多个靶分子结合的条件下孵育所述样品或样品组,其中所述适配体与对应的靶分子的结合暴露所述RNA聚合酶结合位点,导致触发RNA 的RNA合成;通过所述一个或多个引导RNA与所述触发RNA的结合来激活所述CRISPR效应子蛋白,其中激活所述CRISPR效应子蛋白导致所述基于RNA的掩蔽构建体的修饰,从而产生可检测的阳性信号;和检测所述可检测的阳性信号,其中检测到所述可检测的阳性信号表明所述样品中存在一个或多个靶分子。

在某些示例实施方式中,所述一个或多个引导RNA设计为与诊断疾病状态的一个或多个靶分子结合。在某些其他示例实施方式中,所述疾病状态是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传疾病或环境获得性疾病、癌症或真菌感染、细菌感染、寄生虫感染或病毒感染。

在某些示例实施方式中,所述基于RNA的掩蔽构建体抑制可检测的阳性信号的产生,或者所述基于RNA的掩蔽构建体通过掩蔽所述可检测的阳性信号或替代地产生可检测的阴性信号来抑制可检测的阳性信号的产生,或者所述基于RNA的掩蔽构建体包含抑制由报道构建体编码的基因产物的生成的沉默RNA,其中所述基因产物在表达时产生所述可检测的阳性信号,或者所述基于RNA的掩蔽构建体是产生所述阴性可检测信号的核酶并且其中所述阳性可检测信号在所述核酶失活时产生。在其他示例实施方式中,所述核酶将底物转化为第一状态并且其中所述底物在所述核酶失火时转化为第二状态,或者所述基于RNA的掩蔽试剂是适配体,或者所述适配体契合酶,其中所述酶在从所述适配体释放后通过作用于底物来产生可检测的信号,或者所述适配体契合一对在从所述适配体释放时结合以产生可检测的信号的试剂。在再进一步的实施方式中,所述基于RNA的掩蔽构建体包含RNA 寡核苷酸,所述RNA寡核苷酸具有在所述RNA寡核苷酸的第一末端上的可检测的配体和在所述RNA寡核苷酸的第二末端上的掩蔽组分,或者所述可检测的配体是萤光团并且所述掩蔽组分是淬灭分子。

碱基编辑

本公开还提供了一种碱基编辑系统。通常,这样的系统可包含与Cas蛋白融合的脱氨酶(例如腺苷脱氨酶或胞苷脱氨酶)。所述Cas蛋白可以是死的 Cas蛋白或Cas切口酶蛋白。在某些实施例中,所述系统包含与死的 CRISPR-Cas或CRISPR-Cas切口酶融合的腺苷脱氨酶的突变形式。所述腺苷脱氨酶的所述突变形式可具有腺苷脱氨酶和胞苷脱氨酶活性两者。

在某些示例实施方式中,为了碱基编辑目的,dCas13b可以与腺苷脱氨酶或胞苷脱氨酶融合。在一些情况下,所述dCas13b是dCas13b-t1、dCas13b-t2 或dCas13b-t3.

在一个方面,本公开提供了一种工程化腺苷脱氨酶。所述工程化腺苷脱氨酶在本文中可包含一个或多个突变。在一些实施方式中,所述工程化腺苷脱氨酶具有胞苷脱氨酶活性。在某些实施例中,所述工程化腺苷脱氨酶具有胞苷脱氨酶活性和腺苷脱氨酶两者。图101显示了根据本文中的一些实施方式所述的可编程的胞苷至尿苷转化的示例系统和方法。在一些情况下,本文中由碱基编辑器进行的所述修饰可用于靶向翻译后信号传导或催化。图102 显示了示例方法。

腺苷脱氨酶

本文所用的术语“腺苷脱氨酶”或“腺苷脱氨酶蛋白”是指如本文所述的蛋白、多肽或或蛋白或多肽的一个或多个功能性结构域,其能够催化将腺嘌呤 (或分子的腺嘌呤部分)转化为次黄嘌呤(或分子的次黄嘌呤部分)的水解脱氨反应。在一些实施方式中,所述包含腺嘌呤的分子是腺苷(A),并且所述包含次黄嘌呤的分子是肌苷(I)。所述包含腺嘌呤的分子可以是脱氧核糖核酸 (DNA)或核糖核酸(RNA)。

根据本公开,可与本公开联合使用的腺苷脱氨酶包括但不限于被称为腺苷脱氨酶的作用于RNA(ADAR)上的酶家族成员、被称为腺苷脱氨酶的作用于tRNA(ADAT)上的酶家族成员和其他包含腺苷脱氨酶结构域(ADAD)的家族成员。根据本公开,所述腺苷脱氨酶能够靶向RNA/DNA和RNA双链核酸分子中的腺嘌呤。确实,Zheng等(Nucleic Acids Res.2017,45(6):3369-3377) 证实ADAR可在RNA/DNA和RNA/RNA双链核酸分子上实现腺苷至肌苷的编辑反应。如下文所详述的,在特定实施方式中,已经修饰了所述腺苷脱氨酶以增加其编辑RNA/DNA异源双链体中的DNA或RNA双链体的能力,如下文详述。

在一些实施方式中,所述腺苷脱氨酶源自一种或多种后生动物物种。包括但不限于哺乳动物、鸟类、青蛙、鱿鱼、鱼类,苍蝇和蠕虫。在一些实施方式中,所述腺苷脱氨酶是人、鱿鱼或果蝇腺苷脱氨酶。

在一些实施方式中,所述腺苷脱氨酶是人ADAR,所述人ADAR包括 hADAR1、hADAR2、hADAR3。在一些实施方式中,所述腺苷脱氨酶是秀丽隐杆线虫ADAR蛋白,所述秀丽隐杆线虫ADAR蛋白包括ADR-1和 ADR-2。在一些实施方式中,所述腺苷脱氨酶是果蝇ADAR蛋白,所述果蝇 ADAR蛋白包括dAdar。在一些实施方式中,所述腺苷脱氨酶是鱿鱼长翼鱿鱼ADAR蛋白,所述长翼鱿鱼ADAR蛋白包括sqADAR2a和sqADAR2b。在一些实施方式中,所述腺苷脱氨酶是人ADAT蛋白。在一些实施方式中,所述腺苷脱氨酶是果蝇ADAT蛋白。在一些实施方式中,所述腺苷脱氨酶是人ADAD蛋白,所述人ADAD蛋白包括TENR(hADAD1)和 TENRL(hADAD2)。

在一些实施方式中,所述腺苷脱氨酶是Tad蛋白,例如大肠杆菌TadA。见Kim等,Biochemistry 45:6407-6416(2006);Wolf等,EMBO J. 21:3841-3851(2002)。在一些实施方式中,所述腺苷脱氨酶是小鼠ADA。见 Grunebaum等,Curr.Opin.AllergyClin.Immunol.13:630-638(2013)。在一些实施方式中,所述腺苷脱氨酶是人ADAT2。见Fukui等,J.核酸 2010:260512(2010)。在一些实施方式中,所述脱氨酶(例如腺苷或胞苷脱氨酶) 是Cox等,Science.2017,November 24;358(6366):1019–1027;Komore等,Nature.2016May 19;533(7603):420-4和Gaudelli等,Nature.2017Nov 23;551(7681):464-471中描述的那些中的一种或多种。

在一些实施方式中,所述腺苷脱氨酶蛋白识别双链核酸底物中的一个或多个靶腺苷残基并将其转化为肌苷残基。在一些实施方式中,所述双链核酸底物是RNA-DNA杂合体双链核酸分子。在一些实施方式中,所述腺苷脱氨酶蛋白识别在所述双链底物上的结合窗口。在一些实施方式中,所述结合窗口包含至少一个靶腺苷残基。在一些实施方式中,所述结合窗口范围为约 3bp至约100bp。在一些实施方式中,所述结合窗口范围为约5bp至约50bp。在一些实施方式中,所述结合窗口范围为约10bp至约30bp。在一些实施方式中,所述结合窗口为约1bp、2bp、3bp、5bp、7bp、10bp、15bp、20bp、 25bp、30bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、 80bp、85bp、90bp、95bp或100bp。

在一些实施方式中,所述腺苷脱氨酶蛋白包含一个或多个脱氨酶结构域。不受特定理论的约束,预期所述脱氨酶结构域作用为识别包含于双链核酸底物中的一个或多个靶腺苷(A)残基并将其转化为肌苷(I)残基。在一些实施方式中,所述脱氨酶结构域包含活性中心。在一些实施方式中,所述活性中心包含锌离子。在一些实施方式中,在所述A至I编辑过程中,在所述靶腺苷残基处的碱基配对被中断,并且所述靶腺苷残基被“翻转”出所述双螺旋以变得可被所述腺苷脱氨酶接触。在一些实施方式中,在所述活性中心中或附近的氨基酸残基与一个或多个核苷酸5’至靶腺苷残基相互作用。在一些实施方式中,在所述活性中心中或附近的氨基酸残基与一个或多个核苷酸3’至靶腺苷残基相互作用。在一些实施方式中,在所述活性中心中或附近的氨基酸残基进一步与相反链上的所述靶腺苷残基互补的核苷酸相互作用。在一些实施方式中,所述氨基酸残基与所述核苷酸的2’羟基形成氢键。

在一些实施方式中,所述腺苷脱氨酶包含人ADAR2全蛋白(hADAR2) 或其脱氨酶结构域(hADAR2-D)。在一些实施方式中,所述腺苷脱氨酶是与 hADAR2或hADAR2-D同源的ADAR家族成员。

尤其是,在一些实施方式中,所述同源ADAR蛋白是人 ADAR1(hADAR1)或其所述脱氨酶结构域(hADAR1-D)。在一些实施方式中,hADAR1-D的甘氨酸1007对应于甘氨酸487hADAR2-D,并且 hADAR1-D的谷氨酸1008对应于hADAR2-D的谷氨酸488。

在一些实施方式中,所述腺苷脱氨酶包含hADAR2-D的野生型氨基酸序列。在一些实施方式中,所述腺苷脱氨酶在所述hADAR2-D序列中包含一个或多个突变,从而hADAR2-D的编辑效率和/或底物编辑偏好根据具体需求而改变。所述工程化腺苷脱氨酶可与Cas蛋白(例如Cas9,Cas 12(例如Cas12a, Cas12b,Cas12c,Cas12d等),Cas13(例如Cas13a,Cas13b(例如Cas13b-t1、 Cas13b-t2、Cas13b-t3),Cas13c,Cas13d等),Cas14,CasX,CasY,或所述Cas蛋白的工程化形式(例如受攻击的(invective)、死的形式、切口酶形式)) 融合。在一些实施例中,本文提供的包括与死的Cas13b蛋白或Cas13切口酶融合的工程化腺苷脱氨酶。

hADAR1和hADAR2蛋白的某些突变已描述于Kuttan等,Proc Natl Acad Sci U SA.(2012)109(48):E3295-304;Want等ACS Chem Biol.(2015) 10(11):2512-9;和Zheng等,核酸s Res.(2017)45(6):3369-337中,其每个通过引用整体并入本文。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的甘氨酸336或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置336处的所述甘氨酸残基被天冬氨酸残基取代(G336D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的甘氨酸487或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置487处的所述甘氨酸残基被被具有相对小的侧链的非极性氨基酸残基取代。例如,在一些实施方式中,在位置487处的所述甘氨酸残基被丙氨酸残基取代(G487A)。在一些实施方式中,在位置487处的所述甘氨酸残基被缬氨酸残基取代(G487V)。在一些实施方式中,在位置487处的所述甘氨酸残基被具有相对大的侧链的氨基酸残基取代。在一些实施方式中,在位置487处的所述甘氨酸残基被精氨酸残基取代(G487R)。在一些实施方式中,在位置487处的所述甘氨酸残基被赖氨酸残基取代(G487K)。在一些实施方式中,在位置487处的所述甘氨酸残基被色氨酸残基取代(G487W)。在一些实施方式中,在位置487处的所述甘氨酸残基被酪氨酸残基取代(G487Y)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的谷氨酸488或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置488处的所述谷氨酸残基被谷氨酰胺残基取代(E488Q)。在一些实施方式中,在位置488处的所述谷氨酸残基被组氨酸残基取代(E488H)。在一些实施方式中,在位置488处的所述谷氨酸残基被精氨酸残基取代 (E488R)。在一些实施方式中,在位置488处的所述谷氨酸残基被赖氨酸残基取代(E488K)。在一些实施方式中,在位置488处的所述谷氨酸残基被天冬氨酸残基取代(E488N)。在一些实施方式中,在位置488处的所述谷氨酸残基被丙氨酸残基取代(E488A)。在一些实施方式中,在位置488处的所述谷氨酸残基被甲硫氨酸残基取代(E488M)。在一些实施方式中,在位置488 处的所述谷氨酸残基被丝氨酸残基取代(E488S)。在一些实施方式中,在位置 488处的所述谷氨酸残基被苯基丙氨酸残基取代(E488F)。在一些实施方式中,在位置488处的所述谷氨酸残基被赖氨酸残基取代(E488L)。在一些实施方式中,在位置488处的所述谷氨酸残基被色氨酸残基取代(E488W)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的苏氨酸490或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置490处的所述苏氨酸残基被半胱氨酸残基取代(T490C)。在一些实施方式中,在位置490处的所述苏氨酸残基被丝氨酸残基取代(T490S)。在一些实施方式中,在位置490处的所述苏氨酸残基被丙氨酸残基取代 (T490A)。在一些实施方式中,在位置490处的所述苏氨酸残基被苯基丙氨酸残基取代(T490F)。在一些实施方式中,在位置490处的所述苏氨酸残基被酪氨酸残基取代(T490Y)。在一些实施方式中,在位置490处的所述苏氨酸残基被丝氨酸残基取代(T490R)。在一些实施方式中,在位置490处的所述苏氨酸残基被丙氨酸残基取代(T490K)。在一些实施方式中,在位置490处的所述苏氨酸残基被苯基丙氨酸残基取代(T490P)。在一些实施方式中,在位置490处的所述苏氨酸残基被酪氨酸残基取代(T490E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的缬氨酸493或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置493处的所述缬氨酸残基被丙氨酸残基取代(V493A)。在一些实施方式中,在位置493处的所述缬氨酸残基被丝氨酸残基取代(V493A)。在一些实施方式中,在位置493处的所述缬氨酸残基被苏氨酸残基取代 (V493T)。在一些实施方式中,在位置493处的所述缬氨酸残基被精氨酸残基取代(V493R)。在一些实施方式中,在位置493处的所述缬氨酸残基被天冬氨酸残基取代(V493D)。在一些实施方式中,在位置493处的所述缬氨酸残基被脯氨酸残基取代(V493P)。在一些实施方式中,在位置493处的所述缬氨酸残基被甘氨酸残基取代(V493G)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丙氨酸589或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置589处的所述丙氨酸残基被缬氨酸残基取代(A589V)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的天冬氨酸597或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置597处的所述天冬氨酸残基被赖氨酸残基取代(N597K)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597 处的所述天冬氨酸残基被精氨酸残基取代(N597R)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597处的所述天冬氨酸残基被丙氨酸残基取代(N597A)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597处的所述天冬氨酸残基被谷氨酸残基取代(N597E)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597处的所述天冬氨酸残基被组氨酸残基取代 (N597H)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597处的所述天冬氨酸残基被甘氨酸残基取代(N597G)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置597处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置597 处的所述天冬氨酸残基被酪氨酸残基取代(N597Y)。在一些实施方式中,在位置597处的所述天冬氨酸残基被苯基丙氨酸残基取代(N597F)。在一些实施方式中,所述腺苷脱氨酶包含突变N597I。在一些实施方式中,所述腺苷脱氨酶包含突变N597L。在一些实施方式中,所述腺苷脱氨酶包含突变N597V。在一些实施方式中,所述腺苷脱氨酶包含突变N597M。在一些实施方式中,所述腺苷脱氨酶包含突变N597C。在一些实施方式中,所述腺苷脱氨酶包含突变N597P。在一些实施方式中,所述腺苷脱氨酶包含突变N597T。在一些实施方式中,所述腺苷脱氨酶包含突变N597S。在一些实施方式中,所述腺苷脱氨酶包含突变N597W。在一些实施方式中,所述腺苷脱氨酶包含突变N597Q。在一些实施方式中,所述腺苷脱氨酶包含突变N597D。在某些示例实施方式中,在E488Q背景的上下文中进一步进行了上文所述的在 N597处的突变。

在一些实施方式中,所述腺苷脱氨包含在所述hADAR2-D氨基酸序列的丝氨酸599或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置599处的所述丝氨酸残基被苏氨酸残基取代(S599T)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的天冬氨酸613或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置613处的所述天冬氨酸残基被赖氨酸残基取代(N613K)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置613处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置613 处的所述天冬氨酸残基被精氨酸残基取代(N613R)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置613处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置613处的所述天冬氨酸残基被丙氨酸残基取代(N613A)。在一些实施方式中,所述腺苷脱氨酶包含在所述氨基酸序列的位置613处的突变,其在所述野生型序列中具有天冬氨酸残基。在一些实施方式中,在位置613处的所述天冬氨酸残基被谷氨酸残基取代(N613E)。在一些实施方式中,所述腺苷脱氨酶包含突变N613I。在一些实施方式中,所述腺苷脱氨酶包含突变N613L。在一些实施方式中,所述腺苷脱氨酶包含突变N613V。在一些实施方式中,所述腺苷脱氨酶包含突变N613F。在一些实施方式中,所述腺苷脱氨酶包含突变N613M。在一些实施方式中,所述腺苷脱氨酶包含突变N613C。在一些实施方式中,所述腺苷脱氨酶包含突变N613G。在一些实施方式中,所述腺苷脱氨酶包含突变 N613P。在一些实施方式中,所述腺苷脱氨酶包含突变N613T。在一些实施方式中,所述腺苷脱氨酶包含突变N613S。在一些实施方式中,所述腺苷脱氨酶包含突变N613Y。在一些实施方式中,所述腺苷脱氨酶包含突变N613W。在一些实施方式中,所述腺苷脱氨酶包含突变N613Q。在一些实施方式中,所述腺苷脱氨酶包含突变N613H。在一些实施方式中,所述腺苷脱氨酶包含突变N613D。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在N613处的突变。

在一些实施方式中,为了改善编辑效率,所述腺苷脱氨酶可包含以下一个或多个突变:G336D、G487A、G487V、E488Q、E488H、E488R、E488N、 E488A、E488S、E488M、T490C、T490S、V493T、V493S、V493A、V493R、 V493D、V493P、V493G、N597K、N597R、N597A、N597E、N597H、N597G、 N597Y、A589V、S599T、N613K、N613R、N613A、N613E(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

在一些实施方式中,为了降低编辑效率,所述腺苷脱氨酶可包含以下一个或多个突变:E488F、E488L、E488W、T490A、T490F、T490Y、T490R、 T490K、T490P、T490E、N597F(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在特定实施方式中,可能对使用具有降低的效能的腺苷脱氨酶来减少脱靶效应感兴趣。

在一些实施方式中,为了减少脱靶效应,所述腺苷脱氨酶包含在以下位置处的一个或多个突变:R348、V351、T375、K376、E396、C451、R455、 N473、R474、K475、R477、R481、S486、E488、T490、S495、R510(基于 hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶包含在E488或选自R348、V351、T375、 K376、E396、C451、R455、N473、R474、K475、R477、R481、S486、T490、 S495、R510的一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在T375处和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在N473处和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在V351处和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在E488和T375处和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在E488和N473处和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488和V351 和任选地在一个或多个附加位置处的突变。在一些实施方式中,所述腺苷脱氨酶包含在E488以及T375、N473和V351中的一个或多个处的突变。

在一些实施方式中,为了减少脱靶效应,所述腺苷脱氨酶包含一个或多个突变,所述一个或多个突变选自R348E、V351L、T375G、T375S、R455G、 R455S、R455E、N473D、R474E、K475Q、R477E、R481E、S486T、E488Q、 T490A、T490S、S495T和R510E(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q和选自R348E、V351L、T375G、T375S、R455G、R455S、 R455E、N473D、R474E、K475Q、R477E、R481E、S486T、T490A、T490S、 S495T和R510E的一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变T375G或T375S和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变N473D和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变V351L和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q,和T375G或 T375G,和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q和N473D和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q和V351L和任选地一个或多个附加突变。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q以及T375G/S、 N473D和V351L中的一个或多个。

在某些实施例中,所述腺苷脱氨酶蛋白或其催化结构域已被修饰为包含在所述hADAR2-D氨基酸序列的E488(优选地E488Q)或同源ADAR蛋白中的对应的位置处的突变,和/或其中所述腺苷脱氨酶蛋白或其催化结构域已被修饰为包含在所述hADAR2-D氨基酸序列的T375(优选地T375G)或同源 ADAR蛋白中的对应的位置处的突变。在某些实施例中,所述腺苷脱氨酶蛋白或其催化结构域已被修饰为包含在所述hADAR1d氨基酸序列的E1008(优选地E1008Q)或同源ADAR蛋白中的对应的位置处的突变。

与双链核酸分子RNA结合的所述人ADAR2脱氨酶结构域的晶体结构显示了结合所述修饰位点的5’侧上的RNA的蛋白环。该5’结合环是造成 ADAR家族成员之间底物特异性差异的一个原因。见Wang等,核酸Res., 44(20):9872-9880(2016),其内容通过引用整体并入本文。此外,在所述酶活性位点的附近识别了ADAR2特异性RNA结合环。见Mathews等,Nat.Struct. Mol.Biol.,23(5):426-33(2016),其内容通过引用整体并入本文。在一些实施方式中,所述腺苷脱氨酶包含在所述RNA结合环中的一个或多个突变以改善编辑特异性和/或效率。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丙氨酸454或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置454处的所述丙氨酸残基被丝氨酸残基取代(A454S)。在一些实施方式中,在位置454处的所述丙氨酸残基被半胱氨酸残基取代(A454C)。在一些实施方式中,在位置454处的所述丙氨酸残基被天冬氨酸残基取代 (A454D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸455或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置455处的所述精氨酸残基被丙氨酸残基取代(R455A)。在一些实施方式中,在位置455处的所述精氨酸残基被缬氨酸残基取代(R455V)。在一些实施方式中,在位置455处的所述精氨酸残基被组氨酸残基取代(R455H)。在一些实施方式中,在位置455处的所述精氨酸残基被甘氨酸残基取代(R455G)。在一些实施方式中,在位置455处的所述精氨酸残基被丝氨酸残基取代(R455S)。在一些实施方式中,在位置455处的所述精氨酸残基被谷氨酸残基取代(R455E)。在一些实施方式中,所述腺苷脱氨酶包含突变R455C。在一些实施方式中,所述腺苷脱氨酶包含突变R455I。在一些实施方式中,所述腺苷脱氨酶包含突变R455K。在一些实施方式中,所述腺苷脱氨酶包含突变R455L。在一些实施方式中,所述腺苷脱氨酶包含突变 R455M。在一些实施方式中,所述腺苷脱氨酶包含突变R455N。在一些实施方式中,所述腺苷脱氨酶包含突变R455Q。在一些实施方式中,所述腺苷脱氨酶包含突变R455F。在一些实施方式中,所述腺苷脱氨酶包含突变R455W。在一些实施方式中,所述腺苷脱氨酶包含突变R455P。在一些实施方式中,所述腺苷脱氨酶包含突变R455Y。在一些实施方式中,所述腺苷脱氨酶包含突变R455E。在一些实施方式中,所述腺苷脱氨酶包含突变R455D。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在R455处的突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的异亮氨酸456或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置456处的所述异亮氨酸残基被缬氨酸残基取代(I456V)。在一些实施方式中,在位置456处的所述异亮氨酸残基被亮氨酸残基取代(I456L)。在一些实施方式中,在位置456处的所述异亮氨酸残基被天冬氨酸残基取代 (I456D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的苯基丙氨酸457或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置457处的所述苯基丙氨酸被酪氨酸残基取代(F457Y)。在一些实施方式中,在位置457处的所述苯基丙氨酸被精氨酸残基取代(F457R)。在一些实施方式中,在位置457处的所述苯基丙氨酸被谷氨酸残基取代 (F457E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丝氨酸458或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置458处的所述丝氨酸残基被缬氨酸残基取代(S458V)。在一些实施方式中,在位置458处的所述丝氨酸残基被苯基丙氨酸残基取代(S458F)。在一些实施方式中,在位置458处的所述丝氨酸残基被脯氨酸残基取代 (S458P)。在一些实施方式中,所述腺苷脱氨酶包含突变458I。在一些实施方式中,所述腺苷脱氨酶包含突变458L。在一些实施方式中,所述腺苷脱氨酶包含突变458M。在一些实施方式中,所述腺苷脱氨酶包含突变458C。在一些实施方式中,所述腺苷脱氨酶包含突变458A。在一些实施方式中,所述腺苷脱氨酶包含突变458G。在一些实施方式中,所述腺苷脱氨酶包含突变458T。在一些实施方式中,所述腺苷脱氨酶包含突变458Y。在一些实施方式中,所述腺苷脱氨酶包含突变458W。在一些实施方式中,所述腺苷脱氨酶包含突变458Q。在一些实施方式中,所述腺苷脱氨酶包含突变458N。在一些实施方式中,所述腺苷脱氨酶包含突变458H。在一些实施方式中,所述腺苷脱氨酶包含突变458E。在一些实施方式中,所述腺苷脱氨酶包含突变458D。在一些实施方式中,所述腺苷脱氨酶包含突变458K。在一些实施方式中,所述腺苷脱氨酶包含突变458R。在一些实施方式中,结合E488Q 突变而进一步进行了上文所述的在S458处的突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的脯氨酸459或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置459处的所述脯氨酸残基被半胱氨酸残基取代(P459C)。在一些实施方式中,在位置459处的所述脯氨酸残基被组氨酸残基取代(P459H)。在一些实施方式中,在位置459处的所述脯氨酸残基被色氨酸残基取代 (P459W)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的组氨酸460或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置460处的所述组氨酸残基被精氨酸残基取代(H460R)。在一些实施方式中,在位置460处的所述组氨酸残基被异亮氨酸残基取代(H460I)。在一些实施方式中,在位置460处的所述组氨酸残基被脯氨酸残基取代 (H460P)。在一些实施方式中,所述腺苷脱氨酶包含突变H460L。在一些实施方式中,所述腺苷脱氨酶包含突变H460V。在一些实施方式中,所述腺苷脱氨酶包含突变H460F。在一些实施方式中,所述腺苷脱氨酶包含突变 H460M。在一些实施方式中,所述腺苷脱氨酶包含突变H460C。在一些实施方式中,所述腺苷脱氨酶包含突变H460A。在一些实施方式中,所述腺苷脱氨酶包含突变H460G。在一些实施方式中,所述腺苷脱氨酶包含突变H460T。在一些实施方式中,所述腺苷脱氨酶包含突变H460S。在一些实施方式中,所述腺苷脱氨酶包含突变H460Y。在一些实施方式中,所述腺苷脱氨酶包含突变H460W。在一些实施方式中,所述腺苷脱氨酶包含突变H460Q。在一些实施方式中,所述腺苷脱氨酶包含突变H460N。在一些实施方式中,所述腺苷脱氨酶包含突变H460E。在一些实施方式中,所述腺苷脱氨酶包含突变 H460D。在一些实施方式中,所述腺苷脱氨酶包含突变H460K。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在H460处的突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的脯氨酸462或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置462处的所述脯氨酸残基被丝氨酸残基取代(P462S)。在一些实施方式中,在位置462处的所述脯氨酸残基被色氨酸残基取代(P462W)。在一些实施方式中,在位置462处的所述脯氨酸残基被谷氨酸残基取代(P462E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的天冬氨酸469或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置469的所述天冬氨酸残基被谷氨酰胺残基取代(D469Q)。在一些实施方式中,在位置469的所述天冬氨酸残基被丝氨酸残基取代(D469S)。在一些实施方式中,在位置469的所述天冬氨酸残基被酪氨酸残基取代 (D469Y)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸470或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置470处的所述精氨酸残基被丙氨酸残基取代(R470A)。在一些实施方式中,在位置470处的所述精氨酸残基被异亮氨酸残基取代(R470I)。在一些实施方式中,在位置470处的所述精氨酸残基被天冬氨酸残基取代 (R470D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的组氨酸471或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置471处的所述组氨酸残基被赖氨酸残基取代(H471K)。在一些实施方式中,在位置471处的所述组氨酸残基被苏氨酸残基取代(H471T)。在一些实施方式中,在位置471处的所述组氨酸残基被缬氨酸残基取代 (H471V)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的脯氨酸472或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置472处的所述脯氨酸残基被赖氨酸残基取代(P472K)。在一些实施方式中,在位置472处的所述脯氨酸残基被苏氨酸残基取代(P472T)。在一些实施方式中,在位置472处的所述脯氨酸残基被天冬氨酸残基取代 (P472D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的天冬氨酸473或同源ADAR蛋白中的对应的位置处的突。在一些实施方式中,在位置473处的所述天冬氨酸残基被精氨酸残基取代(N473R)。在一些实施方式中,在位置473处的所述天冬氨酸残基被色氨酸残基取代(N473W)。在一些实施方式中,在位置473处的所述天冬氨酸残基被脯氨酸残基取代 (N473P)。在一些实施方式中,在位置473处的所述天冬氨酸残基被天冬氨酸残基取代(N473D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置 474处的所述精氨酸残基被赖氨酸残基取代(R474K)。在一些实施方式中,在位置474处的所述精氨酸残基被甘氨酸残基取代(R474G)。在一些实施方式中,在位置474处的所述精氨酸残基被天冬氨酸残基取代(R474D)。在一些实施方式中,在位置474处的所述精氨酸残基被谷氨酸残基取代(R474E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的赖氨酸475或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置475处的所述赖氨酸残基被谷氨酰胺残基取代(K475Q)。在一些实施方式中,在位置475处的所述赖氨酸残基被天冬氨酸残基取代(K475N)。在一些实施方式中,在位置475处的所述赖氨酸残基被天冬氨酸残基取代 (K475D)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丙氨酸476或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置476处的所述丙氨酸残基被丝氨酸残基取代(A476S)。在一些实施方式中,在位置476处的所述丙氨酸残基被精氨酸残基取代(A476R)。在一些实施方式中,在位置476处的所述丙氨酸残基被谷氨酸残基取代 (A476E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸477或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置477处的所述精氨酸残基被赖氨酸残基取代(R477K)。在一些实施方式中,在位置477处的所述精氨酸残基被苏氨酸残基取代(R477T)。在一些实施方式中,在位置477处的所述精氨酸残基被苯基丙氨酸残基取代 (R477F)。在一些实施方式中,在位置474处的所述精氨酸残基被谷氨酸残基取代(R477E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的甘氨酸478或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置478处的所述甘氨酸残基被丙氨酸残基取代(G478A)。在一些实施方式中,在位置478处的所述甘氨酸残基被精氨酸残基取代(G478R)。在一些实施方式中,在位置478处的所述甘氨酸残基被酪氨酸残基取代 (G478Y)。在一些实施方式中,所述腺苷脱氨酶包含突变G478I。在一些实施方式中,所述腺苷脱氨酶包含突变G478L。在一些实施方式中,所述腺苷脱氨酶包含突变G478V。在一些实施方式中,所述腺苷脱氨酶包含突变 G478F。在一些实施方式中,所述腺苷脱氨酶包含突变G478M。在一些实施方式中,所述腺苷脱氨酶包含突变G478C。在一些实施方式中,所述腺苷脱氨酶包含突变G478P。在一些实施方式中,所述腺苷脱氨酶包含突变G478T。在一些实施方式中,所述腺苷脱氨酶包含突变G478S。在一些实施方式中,所述腺苷脱氨酶包含突变G478W。在一些实施方式中,所述腺苷脱氨酶包含突变G478Q。在一些实施方式中,所述腺苷脱氨酶包含突变G478N。在一些实施方式中,所述腺苷脱氨酶包含突变G478H。在一些实施方式中,所述腺苷脱氨酶包含突变G478E。在一些实施方式中,所述腺苷脱氨酶包含突变G478D。在一些实施方式中,所述腺苷脱氨酶包含突变G478K。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在G478处的突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的谷氨酰胺479或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置479处的所述谷氨酰胺残基被天冬氨酸残基取代(Q479N)。在一些实施方式中,在位置479处的所述谷氨酰胺残基被丝氨酸残基取代 (Q479S)。在一些实施方式中,在位置479处的所述谷氨酰胺残基被脯氨酸残基取代(Q479P)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸348或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置348处的所述精氨酸残基被丙氨酸残基取代(R348A)。在一些实施方式中,在位置348处的所述精氨酸残基被谷氨酸残基取代(R348E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的缬氨酸351或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置351处的所述缬氨酸残基被亮氨酸残基取代(V351L)。在一些实施方式中,所述腺苷脱氨酶包含突变V351Y。在一些实施方式中,所述腺苷脱氨酶包含突变V351M。在一些实施方式中,所述腺苷脱氨酶包含突变 V351T。在一些实施方式中,所述腺苷脱氨酶包含突变V351G。在一些实施方式中,所述腺苷脱氨酶包含突变V351A。在一些实施方式中,所述腺苷脱氨酶包含突变V351F。在一些实施方式中,所述腺苷脱氨酶包含突变V351E。在一些实施方式中,所述腺苷脱氨酶包含突变V351I。在一些实施方式中,所述腺苷脱氨酶包含突变V351C。在一些实施方式中,所述腺苷脱氨酶包含突变V351H。在一些实施方式中,所述腺苷脱氨酶包含突变V351P。在一些实施方式中,所述腺苷脱氨酶包含突变V351S。在一些实施方式中,所述腺苷脱氨酶包含突变V351K。在一些实施方式中,所述腺苷脱氨酶包含突变 V351N。在一些实施方式中,所述腺苷脱氨酶包含突变V351W。在一些实施方式中,所述腺苷脱氨酶包含突变V351Q。在一些实施方式中,所述腺苷脱氨酶包含突变V351D。在一些实施方式中,所述腺苷脱氨酶包含突变V351R。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在V351处的突变。

在一些实施方式中,所述腺苷脱氨酶包含所述hADAR2-D氨基酸序列的苏氨酸375或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置375处的所述苏氨酸残基被甘氨酸残基取代(T375G)。在一些实施方式中,在位置375处的所述苏氨酸残基被丝氨酸残基取代(T375S)。在一些实施方式中,所述腺苷脱氨酶包含突变T375H。在一些实施方式中,所述腺苷脱氨酶包含突变T375Q。在一些实施方式中,所述腺苷脱氨酶包含突变T375C。在一些实施方式中,所述腺苷脱氨酶包含突变T375N。在一些实施方式中,所述腺苷脱氨酶包含突变T375M。在一些实施方式中,所述腺苷脱氨酶包含突变T375A。在一些实施方式中,所述腺苷脱氨酶包含突变T375W。在一些实施方式中,所述腺苷脱氨酶包含突变T375V。在一些实施方式中,所述腺苷脱氨酶包含突变T375R。在一些实施方式中,所述腺苷脱氨酶包含突变T375E。在一些实施方式中,所述腺苷脱氨酶包含突变T375K。在一些实施方式中,所述腺苷脱氨酶包含突变T375F。在一些实施方式中,所述腺苷脱氨酶包含突变T375I。在一些实施方式中,所述腺苷脱氨酶包含突变 T375D。在一些实施方式中,所述腺苷脱氨酶包含突变T375P。在一些实施方式中,所述腺苷脱氨酶包含突变T375L。在一些实施方式中,所述腺苷脱氨酶包含突变T375Y。在一些实施方式中,结合E488Q突变而进一步进行了上文所述的在T375Y处的突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸481或同源ADAR蛋白中的对应的位置处的突。在一些实施方式中,在位置481处的所述精氨酸残基被谷氨酸残基取代(R481E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丝氨酸486或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置486处的所述丝氨酸残基被苏氨酸残基取代(S486T)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的苏氨酸490或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置490处的所述苏氨酸残基被丙氨酸残基取代(T490A)。在一些实施方式中,在位置490处的所述苏氨酸残基被丝氨酸残基取代(T490S)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的丝氨酸495或同源ADAR蛋白中的对应的位置处的突。在一些实施方式中,在位置495处的所述丝氨酸残基被苏氨酸残基取代(S495T)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的精氨酸510或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置510处的所述精氨酸残基被谷氨酰胺残基取代(R510Q)。在一些实施方式中,在位置510处的所述精氨酸残基被丙氨酸残基取代(R510A)。在一些实施方式中,在位置510处的所述精氨酸残基被谷氨酸残基取代 (R510E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的谷氨酸593或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置593处的所述甘氨酸残基被丙氨酸残基取代(G593A)。在一些实施方式中,在位置593处的所述甘氨酸残基被谷氨酸残基取代(G593E)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的赖氨酸594或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置594处的所述赖氨酸残基被丙氨酸残基取代(K594A)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变: A454、R455、I456、F457、S458、P459、H460、P462、D469、R470、H471、P472、N473、R474、K475、A476、R477、G478、Q479、R348、R510、G593、 K594。

在一些实施方式中,所述腺苷脱氨酶包含所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变: A454S、A454C、A454D、R455A、R455V、R455H、I456V、I456L、I456D、 F457Y、F457R、F457E、S458V、S458F、S458P、P459C、P459H、P459W、 H460R、H460I、H460P、P462S、P462W、P462E、D469Q、D469S、D469Y、R470A、R470I、R470D、H471K、H471T、H471V、P472K、P472T、P472D、 N473R、N473W、N473P、R474K、R474G、R474D、K475Q、K475N、K475D、 A476S、A476R、A476E、R477K、R477T、R477F、G478A、G478R、G478Y、 Q479N、Q479S、Q479P、R348A、R510Q、R510A、G593A、G593E、K594A。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变,且任选地结合在E488处的突变:T375、V351、G478、S458、H460。在一些实施方式中,所述腺苷脱氨酶包含选自以下的一个或多个突变,且任选地结合E488Q:T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、G478R、S458F、H460I。

在一些实施方式中,所述腺苷脱氨酶包含选自以下的一个或多个突变,且任选地结合E488Q:T375H、T375Q、V351M、V351Y、H460P。

在一些实施方式中,所述腺苷脱氨酶包含突变T375S和S458F,且任选地结合E488Q。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的两个或更多个或同源ADAR蛋白中的对应的位置处的突变,且任选地结合在E488处的突变:T375、N473、R474、G478、S458、P459、 V351、R455、R455、T490、R348、Q479。在一些实施方式中,所述腺苷脱氨酶包含选自以下的两个或更多个突变,且任选地结合E488Q:T375G、T375S、N473D、R474E、G478R、S458F、P459W、V351L、R455G、R455S、 T490A、R348E、Q479P。

在一些实施方式中,所述腺苷脱氨酶包含突变T375G和V351L。在一些实施方式中,所述腺苷脱氨酶包含突变T375G和R455G。在一些实施方式中,所述腺苷脱氨酶包含突变T375G和R455S。在一些实施方式中,所述腺苷脱氨酶包含突变T375G和T490A。在一些实施方式中,所述腺苷脱氨酶包含突变T375G和R348E。在一些实施方式中,所述腺苷脱氨酶包含突变 T375S和V351L。在一些实施方式中,所述腺苷脱氨酶包含突变T375S和 R455G。在一些实施方式中,所述腺苷脱氨酶包含突变T375S和R455S。在一些实施方式中,所述腺苷脱氨酶包含突变T375S和T490A。在一些实施方式中,所述腺苷脱氨酶包含突变T375S和R348E。在一些实施方式中,所述腺苷脱氨酶包含突变N473D和V351L。在一些实施方式中,所述腺苷脱氨酶包含突变N473D和R455G。在一些实施方式中,所述腺苷脱氨酶包含突变N473D和R455S。在一些实施方式中,所述腺苷脱氨酶包含突变N473D 和T490A。在一些实施方式中,所述腺苷脱氨酶包含突变N473D和R348E。在一些实施方式中,所述腺苷脱氨酶包含突变R474E和V351L。在一些实施方式中,所述腺苷脱氨酶包含突变R474E和R455G。在一些实施方式中,所述腺苷脱氨酶包含突变R474E和R455S。在一些实施方式中,所述腺苷脱氨酶包含突变R474E和T490A。在一些实施方式中,所述腺苷脱氨酶包含突变R474E和R348E。在一些实施方式中,所述腺苷脱氨酶包含突变S458F 和T375G。在一些实施方式中,所述腺苷脱氨酶包含突变S458F和T375S。在一些实施方式中,所述腺苷脱氨酶包含突变S458F和N473D。在一些实施方式中,所述腺苷脱氨酶包含突变S458F和R474E。在一些实施方式中,所述腺苷脱氨酶包含突变S458F和G478R。在一些实施方式中,所述腺苷脱氨酶包含突变G478R和T375G。在一些实施方式中,所述腺苷脱氨酶包含突变G478R和T375S。在一些实施方式中,所述腺苷脱氨酶包含突变G478R 和N473D。在一些实施方式中,所述腺苷脱氨酶包含突变G478R和R474E。在一些实施方式中,所述腺苷脱氨酶包含突变P459W和T375G。在一些实施方式中,所述腺苷脱氨酶包含突变P459W和T375S。在一些实施方式中,所述腺苷脱氨酶包含突变P459W和N473D。在一些实施方式中,所述腺苷脱氨酶包含突变P459W和R474E。在一些实施方式中,所述腺苷脱氨酶包含突变P459W和G478R。在一些实施方式中,所述腺苷脱氨酶包含突变 P459W和S458F。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和 T375G。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和T375S。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和N473D。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和R474E。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和G478R。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和S458F。在一些实施方式中,所述腺苷脱氨酶包含突变Q479P和P459W。可以结合E488Q突变而进一步进行本段所述的所有突变。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变,任选地结合在E488处的突变:K475、Q479、P459、G478、S458。在一些实施方式中,所述腺苷脱氨酶包含选自以下的一个或多个突变,且任选地结合 E488Q:K475N、Q479N、P459W、G478R、S458P、S458F。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变,任选地结合在E488处的突变:T375、V351、R455、H460、A476。在一些实施方式中,所述腺苷脱氨酶包含选自以下的一个或多个突,且任选地结合E488Q:T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、 R455H、H460P、H460I、A476E。

在某些实施方式中,编辑的改善和脱靶修饰的减少是通过gRNA的化学修饰来实现的。如Vogel等(2014),Angew Chem Int Ed,53:6267-6271, doi:10.1002/anie.201402634(通过引用将其整体并入本文)中所示例的化学修饰的gRNA减少了脱靶活性并改善了中靶(on-target)效率。一般而言,2’-O- 甲基和硫代磷酸酯修饰的引导RNA改善细胞中的编辑效率。

众所周知,ADAR表现出对编辑的A的任一侧上的的相邻核苷酸的偏好。(www.nature.com/nsmb/journal/v23/n5/full/nsmb.3203.html,Matthews等 (2017),Nature Structural Mol Biol,23(5):426-433,其通过引用整体并入本文)。因此,在某些实施方式中,出于基序偏好而选择性地优化所述gRNA、靶标和/或ADAR。已在体外证实故意的错配可以编辑非优选的基序 (academic.oup.com/nar/article-lookup/doi/10.1093/nar/gku272;Schneider et al (2014),Nucleic Acid Res,42(10):e87);Fukuda et al.(2017),Scientific Reports,7, doi:10.1038/srep41478,通过引用整体并入本文)。因此,在某些实施方式中,为了改善非优选的5’或3’相邻碱基上的RNA编辑效率,引入相邻碱基中的故意的错配。

在一些实施方式中,所述腺苷脱氨酶可以是tRNA-特异性腺苷脱氨酶或其变体。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的W23L、W23R、R26G、H36L、N37S、P48S、P48T、P48A、 I49V、R51L、N72D、L84F、S97C、A106V、D108N、H123Y、G125A、A142N、S146C、D147Y、R152H、R152P、E155V、I156F、K157N、K161T。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的 D108N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、 H123Y、I156F。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌 TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、 I156F、A142N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌 TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、 I156F、H36L、R51L、S146C、K157N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、 E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、 S146C、K157N、P48S、A142N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、 L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、 R51L、S146C、K157N、P48S、W23R、P48A、A142N。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的:A106V、 D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、 K157N、P48S、W23R、P48A、R152P。在一些实施方式中,所述腺苷脱氨酶可包含以下突变中的一个或多个和对应于以下突变的同源脱氨酶蛋白中的突变:基于大肠杆菌TadA的氨基酸序列位置的:A106V、D108N、D147Y、 E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、 P48A、R152P、A142N。

结果显示相对于其他碱基,优选地编辑所述ADAR脱氨酶结构域的靶窗口中的A相对的C。此外,与靶向的碱基的若干碱基内的U碱基配对的A 显示了由CRISPR-Cas-ADAR融合体进行的低水平的编辑,其表明所述酶可以灵活地编辑多个A。这两个观察表明可以通过错配所有将用C编辑的A 来指定CRISPR-Cas-ADAR融合体的活性窗口中的多个A进行编辑。因此,在某些实施方式中,所述活性窗口中的多个A:C错配被设计为生成多个A: I编辑。在某些实施方式中,为了抑制所述活性窗口中的潜在脱靶编辑,将非靶向的A与A或G配对。

本文可交换地使用术语“编辑特异性”和“编辑偏好”来指在双链底物中的特定腺苷位点处的A至I编辑的程度。在一些实施方式中,所述底物编辑偏好由所述靶腺苷残基的5’最近邻近物和/或3’最近邻近物决定。在一些实施方式中,所述腺苷脱氨酶对所述底物的5’最近邻近物具有以下偏好: U>A>C>G(“>”表示更大偏好)。在一些实施方式中,所述腺苷脱氨酶对所述底物的3’最近邻近物具有以下偏好:G>C~A>U(“>”表示更大偏好;“~”表示相似偏好)。在一些实施方式中,所述腺苷脱氨酶对所述底物的3’最近邻近物具有以下偏好:G>C>U~A(“>”表示更大偏好;“~”表示相似偏好)。在一些实施方式中,所述腺苷脱氨酶对所述底物的3’最近邻近物具有以下偏好: G>C>A>U(“>”表示更大偏好)。在一些实施方式中,所述腺苷脱氨酶对所述底物的3’最近邻近物具有以下偏好:C~G~A>U(“>”表示更大偏好;“~”表示相似偏好)。在一些实施方式中,所述腺苷脱氨酶对包含所述靶腺苷残基的三联体序列具有以下偏好:TAG>AAG>CAC>AAT>GAA>GAC(“>”表示更大偏好),中心A为所述靶腺苷残基。

在一些实施方式中,腺苷脱氨酶的底物编辑偏好受所述腺苷脱氨酶蛋白中核酸结合结构域的存在或缺失的影响。在一些实施方式中,为了修改底物编辑偏好,将所述脱氨酶结构域与双链RNA结合结构域(dsRBD)或双链 RNA结合基序(dsRBM)连接。在一些实施方式中,所述dsRBD或dsRBM可以源自ADAR蛋白,例如hADAR1或hADAR2。在一些实施方式中,使用了包含至少一个dsRBD的全长ADAR蛋白和脱氨酶结构域。在一些实施方式中,所述一个或多个dsRBM或dsRBD在所述脱氨酶结构域的N末端。在其他实施方式中,所述一个或多个dsRBM或dsRBD在所述脱氨酶结构域的 C末端。

在一些实施方式中,腺苷脱氨酶的底物编辑偏好受所述酶的活性位点附近或活性位点中的氨基酸残基的影响。在一些实施方式中为了修改底物编辑偏好,所述腺苷脱氨酶可包含以下一个或多个突变:G336D、G487R、G487K、 G487W、G487Y、E488Q、E488N、T490A、V493A、V493T、V493S、N597K、 N597R、A589V、S599T、N613K、N613R(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

特别是,在一些实施方式中,为了减少编辑特异性,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V493A、N597K、N613K(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,为了增加编辑特异性,所述腺苷脱氨酶可包含突变T490A。

在一些实施方式中,为了增加对紧接5’G(例如包含三联体序列GAC的底物)的靶腺苷(A)(中心A为所述靶腺苷残基)的编辑偏好,所腺苷脱氨酶可包含以下一个或多个突变:G336D、E488Q、E488N、V493T、V493S、V493A、 A589V、N597K、N597R、S599T、N613K、N613R(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

特别是,在一些实施方式中,所述腺苷脱氨酶包含突变E488Q或同源 ADAR蛋白中的对应的突变以用于编辑包含以下三联体序列的底物:GAC、 GAA、GAU、GAG、CAU、AAU、UAC,中心A为所述靶腺苷残基。

在一些实施方式中,所述腺苷脱氨酶包含hADAR1-D的野生型氨基酸序列。在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR1-D序列中的一个或多个突变,以根据具体需求而改变hADAR1-D的编辑效率和/或底物编辑偏好。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR1-D氨基酸序列的甘氨酸1007或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置1007处的所述甘氨酸残基被具有相对小的侧链的非极性氨基酸残基取代。例如,在一些实施方式中,在位置1007处的所述甘氨酸残基被丙氨酸残基取代(G1007A)。在一些实施方式中,在位置1007处的所述甘氨酸残基被缬氨酸残基取代(G1007V)。在一些实施方式中,在位置1007处的所述甘氨酸残基被具有相对大的侧链的氨基酸残基取代。在一些实施方式中,在位置1007处的所述甘氨酸残基被精氨酸残基取代(G1007R)。在一些实施方式中,在位置1007处的所述甘氨酸残基被赖氨酸残基取代(G1007K)。在一些实施方式中,在位置1007处的所述甘氨酸残基被色氨酸残基取代 (G1007W)。在一些实施方式中,在位置1007处的所述甘氨酸残基被酪氨酸残基取代(G1007Y)。此外,在其他实施方式中,在位置1007处的所述甘氨酸残基被亮氨酸残基取代(G1007L)。在其他实施方式中,在位置1007处的所述甘氨酸残基被苏氨酸残基取代(G1007T)。在其他实施方式中,在位置 1007处的所述甘氨酸残基被丝氨酸残基取代(G1007S)。

在一些实施方式中,所述腺苷脱氨酶包含在所述hADAR1-D氨基酸序列的谷氨酸1008或同源ADAR蛋白中的对应的位置处的突变。在一些实施方式中,在位置1008处的所述谷氨酸残基被具有相对大的侧链的极性氨基酸残基取代。在一些实施方式中,在位置1008处的所述谷氨酸残基被谷氨酰胺残基取代(E1008Q)。在一些实施方式中,在位置1008处的所述谷氨酸残基被组氨酸残基取代(E1008H)。在一些实施方式中,在位置1008处的所述谷氨酸残基被精氨酸残基取代(E1008R)。在一些实施方式中,在位置1008 处的所述谷氨酸残基被赖氨酸残基取代(E1008K)。在一些实施方式中,在位置1008处的所述谷氨酸残基被非极性或小的极性氨基酸残基取代。在一些实施方式中,在位置1008处的所述谷氨酸残基被苯基丙氨酸残基取代 (E1008F)。在一些实施方式中,在位置1008处的所述谷氨酸残基被色氨酸残基取代(E1008W)。在一些实施方式中,在位置1008处的所述谷氨酸残基被甘氨酸残基取代(E1008G)。在一些实施方式中,在位置1008处的所述谷氨酸残基被异亮氨酸残基取代(E1008I)。在一些实施方式中,在位置1008处的所述谷氨酸残基被缬氨酸残基取代(E1008V)。在一些实施方式中,在位置 1008处的所述谷氨酸残基被脯氨酸残基取代(E1008P)。在一些实施方式中,在位置1008处的所述谷氨酸残基被丝氨酸残基取代(E1008S)。在其他实施方式中,在位置1008处的所述谷氨酸残基被天冬氨酸残基取代(E1008N)。在其他实施方式中,在位置1008处的所述谷氨酸残基被丙氨酸残基取代(E1008A)。在其他实施方式中,在位置1008处的所述谷氨酸残基被甲硫氨酸残基取代(E1008M)。在一些实施方式中,在位置1008处的所述谷氨酸残基被亮氨酸残基取代(E1008L)。

在一些实施方式中,为了改善编辑效率,所述腺苷脱氨酶可包含以下一个或多个突变:E1007S、E1007A、E1007V、E1008Q、E1008R、E1008H、 E1008M、E1008N、E1008K(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

在一些实施方式中,为了降低编辑效率,所述腺苷脱氨酶可包含以下一个或多个突变:E1007R、E1007K、E1007Y、E1007L、E1007T、E1008G、 E1008I、E1008P、E1008V、E1008F、E1008W、E1008S、E1008N、E1008K(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

在一些实施方式中,腺苷脱氨酶的底物编辑偏好、效率和/或选择性受所述酶的活性位点附近或活性位点中的氨基酸残基的影响。在一些实施方式中,所述腺苷脱氨酶包含在hADAR1-D序列中的谷氨酸1008位置或同源 ADAR蛋白中的对应的位置处的突变。在一些实施方式中,所述突变是 E1008R或同源ADAR蛋白中的对应的突变。在一些实施方式中,所述E1008R 突变体对在相反链上具有错配的G残基的靶腺苷残基具有增加的编辑效率。

在一些实施方式中,所述腺苷脱氨酶蛋白进一步包含一个或多个双链 RNA(dsRNA)结合基序(dsRBM)或结构域(dsRBD)或与其连接以识别双链核酸底物并与所述双链核酸底物结合。在一些实施方式中,所述腺苷脱氨酶和所述双链底物之间的相互作用由一个或多个附加蛋白因子(包括 CRISPR/CAS蛋白因子)介导。在一些实施方式中,所述腺苷脱氨酶和所述双链底物之间的相互作用由一个或多个核酸组分(包括引导RNA)进一步介导。

在某些示例实施方式中,可用定向进化来设计能够催化除腺嘌呤至次黄嘌呤的脱氨之外的附加反应的修饰ADAR蛋白。

具有C至U的脱氨活性的修饰腺苷脱氨酶

在某些示例实施方式中,可用定向进化来设计能够催化除腺嘌呤至次黄嘌呤的脱氨之外的附加反应的修饰ADAR蛋白。例如,所述修饰ADAR蛋白可能能够催化胞苷至尿嘧啶的脱氨。不受特定理论束缚的,改善C至U 活性的突变可改变所述结合口袋的形状以使其更适合较小的胞苷碱基。在一些情况下,经修饰的ADAR包含在催化核心中的残基和/或与RNA靶标接触的残基上的突变。在催化核心中的残基上的突变的实例包括V351G和 K350I(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在与RNA靶标接触的残基上的突变的实例包括S486A和 S495N(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

在某些实施方式中,工程化所述腺苷脱氨酶以将所述活性转化为胞苷脱氨酶。这样的工程化腺苷脱氨酶也可保留其腺苷脱氨酶活性,即这样的突变腺苷脱氨酶可具有腺苷脱氨酶和胞苷脱氨酶活性两者。因此,在一些实施方式中,所述腺苷脱氨酶包含在选自以下的位置中的一个或多个突变:E396、 C451、V351、R455、T375、K376、S486、Q488、R510、K594、R348、G593、 S397、H443、L444、Y445、F442、E438、T448、A353、V355、T339、P539、 T339、P539、V525 I520、P462和N579。在特定实施方式中,所述腺苷脱氨酶包含一个或多个突变in a位置selected from V351,L444,V355,V525和 I520。在一些实施方式中,所述腺苷脱氨酶可包含在选自以下的位置中的一个或多个突变:E488、V351、S486、T375、S370、P462、N597(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。

在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变: E488Q(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变E488Q、 V351G、S486A、T375S、S370C(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、 P462A(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、P462A、N597I(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、 S486A、T375S、S370C、P462A、N597I、L332I(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、 S370C、P462A、N597I、L332I、I398V(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、 P462A、N597I、L332I、I398V、K350I(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、 P462A、N597I、L332I、I398V、K350I,M383L(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、 S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、 S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源 ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、 I398V、K350I、M383L、D619G、S582T、V440I(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、 S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、 V440I、S495N(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源 ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、 I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E(基于hADAR2-D 的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施方式中,所述腺苷脱氨酶可包含以下一个或多个突变:E488Q、V351G、 S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、 D619G、S582T、V440I、S495N、K418E、S661T(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一些实施例中,本文中提供的包括突变腺苷脱氨酶,例如包含以下一个或多个突变的腺苷脱氨酶:E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、 I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T(基于hADAR2-D的氨基酸序列位置,和对应于上述的同源ADAR蛋白中的突变),其与死的CRISPR-Cas蛋白或CRISPR-Cas切口酶融合。在一个特定实施例中,本文提供的包括突变腺苷脱氨酶,例如包含以下突变的腺苷脱氨酶: E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、 K350I、M383L、D619G、S582T、V440I、S495N、K418E,和S661T(基于 hADAR2-D的氨基酸序列位置,和对应于上述的同源ADAR蛋白中的突变),其与死的CRISPR-Cas蛋白或CRISPR-Cas切口酶融合。

在一些实施方式中,具有C至U的脱氨活性的修饰腺苷脱氨酶包含在所述hADAR2-D氨基酸序列的以下位置中的任一个或多个或同源ADAR蛋白中的对应的位置处的突变:V351、T375、R455和E488。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q。在一些实施方式中,所述腺苷脱氨酶包含一个或多个突变,所述一个或多个突变选自V351I、V351L、V351F、V351M、 V351C、V351A、V351G、V351P、V351T、V351S、V351Y、V351W、V351Q、 V351N、V351H、V351E、V351D、V351K、V351R、T375I、T375L、T375V、 T375F、T375M、T375C、T375A、T375G、T375P、T375S、T375Y、T375W、 T375Q、T375N、T375H、T375E、T375D、T375K、T375R、R455I、R455L、 R455V、R455F、R455M、R455C、R455A、R455G、R455P、R455T、R455S、 R455Y、R455W、R455Q、R455N、R455H、R455E、R455D、R455K。在一些实施方式中,所述腺苷脱氨酶包含突变E488Q并进一步包含选自以下的一个或多个突变:V351I、V351L、V351F、V351M、V351C、V351A、V351G、 V351P、V351T、V351S、V351Y、V351W、V351Q、V351N、V351H、V351E、 V351D、V351K、V351R、T375I、T375L、T375V、T375F、T375M、T375C、 T375A、T375G、T375P、T375S、T375Y、T375W、T375Q、T375N、T375H、 T375E、T375D、T375K、T375R、R455I、R455L、R455V、R455F、R455M、 R455C、R455A、R455G、R455P、R455T、R455S、R455Y、R455W、R455Q、 R455N、R455H、R455E、R455D、R455K。

在一些情况下,所述修饰ADAR可进一步包含降低脱靶活性的一个或多个突变。在修饰ADAR具有C至U的脱氨活性的情况下,这样的突变可降低A至I的脱靶活性和增加C至U的靶向脱氨活性。一般而言,这样的突变可以在与RNA靶标相互作用的残基上。这样的突变的实例包括S375N、 S375C、S375A和N473I(基于hADAR2-D的氨基酸序列位置),和对应于上述的同源ADAR蛋白中的突变。在一个实施例中,所述ADAR具有S375N 突变。在一个实施例中,本文提供的包括突变腺苷脱氨酶,例如包含以下突变的腺苷脱氨酶:E488Q、V351G、S486A、T375S、S370C、P462A、N597I、 L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、 S661T,和S375N(基于hADAR2-D的氨基酸序列位置,和对应于上述的同源 ADAR蛋白中的突变),其与死的CRISPR-Cas蛋白或CRISPR-Cas切口酶融合。

与上述具有C至U的脱氨活性的修饰ADAR蛋白相关联的,本文所述的发明还涉及用于使感兴趣的靶RNA序列中的C脱氨的方法,其包括将本文公开的AD官能化组合物递送至靶RNA或DNA。

在某些示例实施方式中,所述用于使靶RNA序列中的C脱氨的方法包括向所述靶RNA递送以下物质:(a)催化失活的(死的)Cas;(b)引导分子,所述引导分子包含与正向重复序列连接的引导序列;和(c)具有C至U的脱氨活性或其催化结构域的修饰ADAR蛋白;其中所述修饰ADAR蛋白或其催化结构域与所述死的Cas蛋白或所述引导分子共价或非共价连接或被调适为在递送后与其连接;其中所述引导分子与所述死的Cas蛋白形成复合物并指引所述复合物结合所述感兴趣的靶RNA序列;其中所述引导序列能够与包含所述C的靶序列杂合以形成RNA双链核酸分子;其中,任选地,所述引导序列包含在对应于所述C的位置处的未配对的A或U,导致错配在所述 RNA双链核酸分子中形成;并且其中所述修饰ADAR蛋白或其催化结构域使所述RNA双链核酸分子中的所述C脱氨。

与上述具有C至U的脱氨活性的修饰ADAR蛋白相关联的,本文所述的发明进一步涉及适于使感兴趣的基因座中的C脱氨的工程化、非自然存在的系统,其包含:(a)引导分子,所述引导分子包含与正向重复序列连接的引导序列,或编码所述引导分子的核苷酸序列;(b)催化失活的CRISPR-Cas 蛋白,或编码所述催化失活的CRISPR-Cas蛋白的所述核苷酸序列;(c)修饰ADAR蛋白,其具有C至U的脱氨活性或其催化结构域,或编码所述修饰 ADAR蛋白或其催化结构域的核苷酸序列;其中所述修饰ADAR蛋白或其催化结构域与所述CRISPR-Cas蛋白或所述引导分子共价或非共价连接或被调适为在递送后与其连接;其中所述引导序列能够与包含C的靶RNA序列杂合以形成RNA双链核酸分子;其中,任选地,所述引导序列包含在对应于所述C的位置处的未配对的A或U,导致错配在所述RNA双链核酸分子中形成;其中,任选地,所述系统是载体系统,所述载体系统包含一种或多种载体,所述一种或多种载体包含:(a)与编码包含所述引导序列地所述引导分子的核苷酸序列可操作地连接的第一调节元素,(b)与编码所述催化失活的 CRISPR-Cas蛋白的核苷酸序列可操作地连接的第二调节元素;和(c)编码具有C至U的脱氨活性或其催化结构域的修饰蛋白的核苷酸序列,其在所述第一调节元素或所述第二调节元素的控制下,或与第三调节元素可操作地连接;其中,如果编码修饰ADAR蛋白或其催化结构域的所述核苷酸序列与第三调节元素可操作地连接,所述修饰ADAR蛋白或其催化结构域被调适为在表达后与所述引导分子或所述CRISPR-Cas蛋白连接;其中组分(a)、(b)和(c) 位于所述系统的相同或不同载体上,任选地,其中所述第一调节元素、第二调节元素和/或第三调节元素是可诱导的启动子。

在本发明的实施方式中,所述腺苷脱氨酶的所述底物是在所述引导分子与其DNA靶标结合之后形成的RNA/DNA异源双链核酸分子,其然后与所述CRISPR-Cas酶形成所述CRISPR-Cas复合物。所述RNA/DNA或 DNA/RNA异源双链核酸分子在本文中也被称为“RNA/DNA杂合体”、“DNA/RNA杂合体”或“双链底物”。

根据本发明,所述腺苷脱氨酶的所述底物是在所述引导分子与其DNA 靶标结合之后形成的RNA/DNRNA双链核酸分子,其然后与所述CRISPR-Cas酶形成所述CRISPR-Cas复合物。所述腺苷脱氨酶的所述底物也可以是在所述引导分子与其DNA靶标结合之后形成的RNA/RNA双链核酸分子,其然后与所述CRISPR-Cas酶形成所述CRISPR-Cas复合物。所述RNA/DNA或DNA/RNRNA双链核酸分子在本文中也被称为“RNA/DNA杂合体”、“DNA/RNA杂合体”或“双链底物”。所述引导分子和CRISPR-Cas酶的具体特征描述于下文。

本文所用的术语“编辑选择性”指由腺苷脱氨酶编辑的双链底物上的所有位点的部分。不受理论束缚的,预期腺苷脱氨酶的编辑选择性受所述双链底物的长度和二级结构(例如错配的碱基、突起和/或内环的存在)的影响。

在一些实施方式中,当所述底物与长于50bp的双链核酸分子完美地碱基配对时,所述腺苷脱氨酶可使所述双链核酸分子内的多个腺苷残基(例如所有腺苷残基中的50%)脱氨。在一些实施方式中,当所述底物短于50bp时,腺苷脱氨酶的编辑选择性受所述靶腺苷位点处的错配的存在的影响。特别是,在一些实施方式中,以高效率使在相反链上具有错配的胞苷(C)残基的腺苷(A)残基脱氨。在一些实施方式中,跳过在相反链上具有鸟苷(G)残基的腺苷(A)残基而编辑所述腺苷(A)残基。

在特定实施方式中,所述腺苷脱氨酶蛋白或其催化结构域被递送至所述细胞或在所述细胞内作为单独的蛋白表达,但被修饰为能够与所述Cas蛋白或所述引导分子连接。在特定实施方式中,这是通过正交RNA-结合蛋白或存在于菌体衣壳蛋白的多样性中的接头蛋白/适配体组合物的使用来确保的。这样的衣壳蛋白的实例包括但不限于以下:MS2、Qβ、F2、GA、fr、JP501、 M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、 ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。适配体可以是已通过体外选择或SELEX(通过指数富集进行的系统进化)的重复回合而被工程化为与特定靶标结合的自然存在的或合成的寡核苷酸。

在特定实施方式中,给所述引导分子提供了一个或多个可募集接头蛋白的不同的RNA环或不同的序列。可通过插入可募集接头蛋白的不同的RNA 环或不同的序列来延伸引导分子,而不使其与所述Cas蛋白碰撞,所述接头蛋白可与所述不同的RNA环或不同的序列结合。修饰引导的实例和它们在为所述Cas复合物募集效应子结构域中的用途提供于Konermann(Nature 2015, 517(7536):583–588)中。在特定实施方式中,所述适配体是选择性结合哺乳动物细胞中的二聚化MS2噬菌体衣壳蛋白并被引入(例如茎环和/或四环中的)引导分子中的最小的发夹适配体。在这些实施方式中,所述腺苷脱氨酶蛋白与MS2融合。然后将所述腺苷脱氨酶蛋白与所述Cas蛋白和对应的引导RNA 一起共递送。

在一些实施方式中,本文所述的Cas-ADAR碱基编辑系统包含(a)Cas蛋白,所述Cas蛋白是催化失活的或是切口酶;(b)包含引导序列的引导分子;和(c)腺苷脱氨酶蛋白或其催化结构域;其中所述腺苷脱氨酶蛋白或其催化结构域与所述Cas蛋白或所述引导分子共价或非共价连接或被调适为在递送后与其连接;其中所述引导序列与所述靶序列基本上互补但包含对应于被指定为脱氨的A的未配对的C,导致通过所述引导序列和所述靶序列形成的 DNA-RNA或RNA-RNA双链核酸分子中的A-C错配。至于在真核细胞中的应用,所述Cas蛋白和/或所述腺苷脱氨酶优选地为NLS-标记的。

在一些实施方式中,将所述组分(a)、(b)和(c)作为核糖核蛋白复合物递送至所述细胞。可通过一个或多个脂质纳米颗粒来递送所述核糖核蛋白复合物。

在一些实施方式中,将所述组分(a)、(b)和(c)作为一个或多个RNA分子 (例如编码所述Cas蛋白、所述腺苷脱氨酶蛋白和任选地所述接头蛋白的一个或多个引导RNA和一个或多个mRNA分子)递送至所述细胞。可通过一个或多个脂质纳米颗粒来递送所述RNA分子。

在一些实施方式中,将所述组分(a)、(b)和(c)作为一个或多个DNA分子递送至所述细胞。在一些实施方式中,所述一个或多个DNA分子包含于一个或多个载体(例如病毒载体(例如AAV))中。在一些实施方式中,所述一个或多个DNA分子包含一个或多个调节元素,所述一个或多个调节元素被可操作性地配置为表达所述Cas蛋白、所述引导分子和所述腺苷脱氨酶蛋白或其催化结构域,任选地,其中所述一个或多个调节元素包含可诱导的启动子。

在一些实施方式中,所述引导分子能够与包含将要在所述靶基因座处的第一DNA链或RNA链中脱氨的腺嘌呤的靶序列杂合,以形成包含与所述腺嘌呤相对的未配对的胞嘧啶的DNA-RNA或RNA-RNA双链核酸分子。在双链核酸分子形成之后,所述引导分子与所述Cas蛋白形成复合物并引导所述复合物结合在所述感兴趣的靶基因座处的所述第一DNA链或所述RNA链。所述Cas-ADAR碱基编辑系统的引导方面的细节提供于下文中。

在一些实施方式中,使用具有经典长度(例如针对AacCas约20nt)的 Cas引导RNA以与所述靶DNA或RNA形成DNA-RNA或RNA-RNA双链核酸分子。在一些实施方式中,使用长于所述标准长度(例如针对AacCas >20nt)的Cas引导分子以与所述靶DNA或RNA(包括在所述Cas-引导RNA- 靶DNA复合物之外)形成DNA-RNA或RNA-RNA双链核酸分子。在某些示例实施方式中,所述引导序列长度为约29-53nt,其能够与所述靶序列形成 DNA-RNA或RNA-RNA双链核酸分子。在某些其他示例实施方式中,所述引导序列长度为约40-50nt,其能够与所述靶序列形成DNA-RNA或 RNA-RNA双链核酸分子。在某些示例实施方式中,所述未配对的C和所述引导序列的5’末端之间的距离为20-30个核苷酸。在某些示例实施方式中,所述未配对的C和所述引导序列的3’末端之间的距离为20-30个核苷酸。

至少在第一个设计中,所述Cas-ADAR系统包含(a)与Cas蛋白融合或连接的腺苷脱氨酶,其中所述Cas蛋白是催化失活的或是切口酶,和(b)包含引导序列的引导分子,所述引导序列被设计为引入在所述引导序列和所述靶序列之间形成的DNA-RNA或RNA-RNA双链核酸分子中的A-C错配。在一些实施方式中,所述Cas蛋白和/或所述腺苷脱氨酶在N或C末端中的任一者或两者之上是NLS-标记的。

至少在第二个设计中,所述Cas-ADAR系统包含(a)Cas蛋白,所述Cas 蛋白是催化失活的或是切口酶,(b)包含引导序列和能够与接头蛋白(例如MS2 衣壳蛋白或PP7衣壳蛋白)结合的适配体序列(例如MS2 RNA基序或PP7 RNA基序)的引导分子,所述引导序列被设计为引入在所述引导序列和所述靶序列之间形成的DNA-RNA或RNA-RNA双链核酸分子中的A-C错配,和(c)与接头蛋白融合或连接的腺苷脱氨酶,其中所述适配体和所述接头蛋白的结合将所述腺苷脱氨酶募集至在所述引导序列和所述靶序列之间形成的所述DNA-RNA或RNA-RNA双链核酸分子以用于在所述A-C错配的A处进行靶向脱氨。在一些实施方式中,所述接头蛋白和/或所述腺苷脱氨酶在N 或C末端中的任一者或两者上是NLS-标记的。所述Cas蛋白也可以是NLS- 标记的。

不同适配体和对应的接头蛋白的使用也允许了正交基因编辑的实现。在一个实施例(其中将腺苷脱氨酶与胞苷脱氨酶联合使用以用于正交基因编辑/ 脱氨)中,用不同的RNA环修饰靶向不同基因座的sgRNA以分别募集MS2- 腺苷脱氨酶和PP7-胞苷脱氨酶(或PP7-腺苷脱氨酶和MS2-胞苷脱氨酶),从而分别导致所述感兴趣的靶基因座处的A或C的正交脱氨。PP7是噬菌体假单胞菌的RNA-结合衣壳蛋白。如MS2,它结合特定的RNA序列和二级结构。所述PP7 RNA-识别基序不同于的MS2的RNA-识别基序。因此,可以多重复用PP7和MS2以同时介导不同基因座处的不同作用。例如,靶向基因座A的sgRNA可用MS2环修饰,从而募集MS2-腺苷脱氨酶,而靶向基因座B的另一sgRNA可用PP7环修饰,从而募集PP7-胞苷脱氨酶。在相同细胞中,正交的基因座特异性修饰从而得以实现。可以延伸该原理以包含其他正交RNA-结合蛋白。

至少在第三个设计中,所述Cas-ADAR CRISPR系统包含(a)插入Cas蛋白的内环或非结构化区域中的腺苷脱氨酶,其中所述Cas蛋白是催化失活的或是切口酶,和(b)包含引导序列的引导分子,所述引导序列被设计为引入在所述引导序列和所述靶序列之间形成的DNA-RNA或RNA-RNA双链核酸分子中的A-C错配。

可借由晶体结构来识别适合于腺苷脱氨酶插入的Cas蛋白分裂位点。例如,对于AacCas突变体而言,其用于例如序列比对的对应的位置是什么应是显而易见的。至于其他Cas蛋白,如果直系同源物和预期的Cas蛋白之间存在较高程度的同源性,则可以使用所述直系同源物的晶体结构。

所述分裂位置可位于区域或环内。优选地,所述分裂位置发生于所述氨基酸序列的中断不导致结构特征(例如α-螺旋orβ-折叠)的部分或全部破坏处。非结构化区域(未在所述晶体结构中出现的区域,因为这些区域的结构化程度不足以“冻存”于晶体中)常常是优选的选择。在本发明的实践中预见了在暴露于Cas的表面上的所有非结构化区域中的分裂。在所述非结构化区域或外环内的位置可不需恰巧为上文所提供的数字,而可在上文提供的位置处的任一侧基于所述环的大小而变化1、2、3、4、5、6、7、8、9或甚至10 个氨基酸,只要所述分裂位置仍旧落于外环的非结构化区域内。

本文所述的Cas-ADAR系统可用于靶向DNA序列内的特定的腺嘌呤以用于脱氨。例如,所述引导分子可与所述Cas蛋白形成复合物并引导所述复合物结合所述感兴趣的靶基因座处的靶序列。因为所述引导序列被设计为具有未配对的C,在所述引导序列和所述靶序列之间形成的异源双链核酸分子包含A-C错配,所述A-C错配引导所述腺苷脱氨酶接触与所述未配对的C 相对的A并使其脱氨,从而将其转化为肌苷(I)。由于肌苷(I)与C碱基配对并在细胞过程中像G一样运作,本文所述的A的靶向脱氨可用于纠正不良的G-A和C-T突变以及获得理想的A-G和T-C突变。在一些实施方式中,所述引导可包含一个或多个错配以增加特异性。例如,所述引导可在脱靶腺苷对面包含一个或多个不良的鸟嘌呤错配。

碱基切除修复抑制剂

在一些实施方式中,所述AD-官能化CRISPR系统进一步包含碱基切除修复(BER)抑制剂。不期望受任何特定理论限制,对I:T配对的存在的细胞 DNA-修复应答可能是导致细胞中核碱基编辑效率降低的原因。烷基腺嘌呤 DNA糖基化酶(也称为DNA-3-甲基腺嘌呤糖基化酶、3-烷基腺嘌呤DNA糖基化酶或N-甲基嘌呤DNA糖基化酶)催化次黄嘌呤从细胞中的DNA的去除,所述去除可启动碱基切除修复并以所述I:T对至A:T对的回复为结果。

在一些实施方式中,所述BER抑制剂是烷基腺嘌呤DNA糖基化酶的抑制剂。在一些实施方式中,所述BER抑制剂是人烷基腺嘌呤DNA糖基化酶的抑制剂。在一些实施方式中,所述BER抑制剂是多肽抑制剂。在一些实施方式中,所述BER抑制剂是结合次黄嘌呤的蛋白。在一些实施方式中,所述BER抑制剂是结合DNA中的次黄嘌呤的蛋白。在一些实施方式中,所述BER抑制剂是催化失活的烷基腺嘌呤DNA糖基化酶蛋白或其结合结构域。在一些实施方式中,所述BER抑制剂是不从所述DNA切除次黄嘌呤的催化失活的烷基腺嘌呤DNA糖基化酶蛋白或其结合结构域。其他能够抑制 (例如位阻)烷基腺嘌呤DNA糖基化酶碱基-切除修复酶的蛋白在本公开的范围内。此外,任何阻碍或抑制碱基-切除修复的蛋白也在本公开的范围内。

不期望受任何特定理论限制,碱基切除修复可被结合编辑链,阻碍编辑碱基,抑制烷基腺嘌呤DNA糖基化酶,抑制碱基切除修复,保护编辑碱基和/或促进未编辑链的修复的分子抑制。相信本文所述的BER抑制剂的使用可增加能够催化A至I的变化的腺苷脱氨酶的编辑效率。

因此,在上文所述的AD-官能化CRISPR系统的所述第一个设计中,所述CRISPR-Cas蛋白或所述腺苷脱氨酶可与BER抑制剂(例如烷基腺嘌呤 DNA糖基化酶的抑制剂)融合或连接。在一些实施方式中,所述BER抑制剂可包含于以下结构之一(nCas=Cas切口酶;dCas=死的Cas)中:

[AD]-[任选的接头]-[nCas/dCas]-[任选的接头]-[BER抑制剂];

[AD]-[任选的接头]-[BER抑制剂]-[任选的接头]-[nCas/dCas];

[BER抑制剂]-[任选的接头]-[AD]-[任选的接头]-[nCas/dCas];

[BER抑制剂]-[任选的接头]-[nCas/dCas]-[任选的接头]-[AD];

[nCas/dCas]-[任选的接头]-[AD]-[任选的接头]-[BER抑制剂];

[nCas/dCas]-[任选的接头]-[BER抑制剂]-[任选的接头]-[AD]。

相似地,在上文所述的AD-官能化CRISPR系统的所述第二个设计中,所述CRISPR-Cas蛋白、所述腺苷脱氨酶或所述接头蛋白可与BER抑制剂(例如烷基腺嘌呤DNA糖基化酶的抑制剂)融合或连接。在一些实施方式中,所述BER抑制剂可包含于以下结构之一(nCas=Cas切口酶;dCas=死的Cas):

[nCas/dCas]-[任选的接头]-[BER抑制剂];

[BER抑制剂]-[任选的接头]-[nCas/dCas];

[AD]-[任选的接头]-[接头]-[任选的接头]-[BER抑制剂];

[AD]-[任选的接头]-[BER抑制剂]-[任选的接头]-[接头];

[BER抑制剂]-[任选的接头]-[AD]-[任选的接头]-[接头];

[BER抑制剂]-[任选的接头]-[接头]-[任选的接头]-[AD];

[接头]-[任选的接头]-[AD]-[任选的接头]-[BER抑制剂];

[接头]-[任选的接头]-[BER抑制剂]-[任选的接头]-[AD].

在上文所述的AD-官能化CRISPR系统的所述第三个设计中,所述BER 抑制剂可被插入至CRISPR-Cas蛋白的内环或非结构化区域内。

胞苷脱氨酶

在一些实施方式中,所述脱氨酶是胞苷脱氨酶。本文所用的术语“胞苷脱氨酶”或“胞苷脱氨酶蛋白”或“胞苷脱氨酶活性”指蛋白,多肽,或者能够催化如上文所示的将胞嘧啶(或分子的胞嘧啶部分)转化为尿嘧啶(或分子的尿嘧啶部分)的水解脱氨反应的蛋白或多肽的一个或多个功能性结构域在一些实施方式中,所述包含胞嘧啶的分子是胞苷(C),并且所述包含尿嘧啶的分子是尿苷(U)。所述包含胞嘧啶的分子可以是脱氧核糖核酸(DNA)或核糖核酸 (RNA)。在某些实施例中,胞苷脱氨酶可以是作用于RNA上的胞苷脱氨酶 (CDAR)。

根据本公开,可结合本公开使用的胞苷脱氨酶包括但不限于被称为载脂蛋白BmRNA-编辑复合物(APOBEC)家族脱氨酶、诱导激活的脱氨酶(AID) 或胞苷脱氨酶1(CDA1)的酶家族成员。在特定实施方式中,所述脱氨酶在 APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶和APOBEC3D脱氨酶、APOBEC3E脱氨酶、 APOBEC3F脱氨酶、POBEC3G脱氨酶、APOBEC3H脱氨酶或APOBEC4脱氨酶中。

在本发明的方法和系统中,所述胞苷脱氨酶或具有胞苷脱氨酶活性的工程化腺苷脱氨酶能够靶向DNA单链中的胞嘧啶。在一些示例性实施方式中,所述胞苷脱氨酶活性可在存在于所述结合组分(例如结合的CRISPR-Cas)之外的单链上编辑。在其他示例实施方式中,所述胞苷脱氨酶可在局部泡(例如通过在所述靶编辑位点而非所述引导序列处的错配形成的局部泡)处编辑。在一些示例性实施方式中,所述胞苷脱氨酶可包含帮助集中活性(如在Kim等, Nature Biotechnology(2017)35(4):371-377(doi:10.1038/nbt.3803)中公开的那些活性)区域的突变。

在一些实施方式中,所述胞苷脱氨酶源自一个或多个后生动物物种,所述一个或多个后生动物物种包括但不限于哺乳动物、鸟类、青蛙、鱿鱼、鱼类、苍蝇和蠕虫。在一些实施方式中,所述胞苷脱氨酶是人、灵长类动物、牛、狗、大鼠或小鼠胞苷脱氨酶。

在一些实施方式中,所述胞苷脱氨酶是人APOBEC,所述人APOBEC 包括但不限于hAPOBEC1或hAPOBEC3。在一些实施方式中,所述胞苷脱氨酶是人AID。

在一些实施方式中,所述胞苷脱氨酶蛋白识别RNA双链核酸分子的单链泡中的一个或多个靶胞嘧啶残基并将其转化为尿嘧啶残基。在一些实施方式中,所述胞苷脱氨酶蛋白识别RNA双链核酸分子的所述单链泡上的结合窗口。在一些实施方式中,所述结合窗口包含至少一个靶胞嘧啶残基。在一些实施方式中,所述结合窗口范围为约3bp至约100bp。在一些实施方式中,所述结合窗口范围为约5bp至约50bp。在一些实施方式中,所述结合窗口范围为约10bp至约30bp。在一些实施方式中,所述结合窗口为约1bp、2 bp、3bp、5bp、7bp、10bp、15bp、20bp、25bp、30bp、40bp、45bp、 50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp或 100bp。

在一些实施方式中,所述胞苷脱氨酶蛋白包含一个或多个脱氨酶结构域。不打算受理论束缚,预期所述脱氨酶结构域发挥作用以识别包含于RNA 双链核酸分子的单链泡中的一个或多个靶胞嘧啶(C)残基并将其转化为尿嘧啶(U)残基。在一些实施方式中,所述脱氨酶结构域包含活性中心。在一些实施方式中,所述活性中心包含锌离子。在一些实施方式中,在所述活性中心中或附近的氨基酸残基与靶胞嘧啶残基5’末端处的一个或多个核苷酸相互作用。在一些实施方式中,在所述活性中心中或附近的氨基酸残基与靶胞嘧啶残基3’末端处的一个或多个核苷酸3’相互作用。

在一些实施方式中,所述胞苷脱氨酶包含人APOBEC1全蛋白 (hAPOBEC1)或其脱氨酶结构域(hAPOBEC1-D)或其C末端截短形式 (hAPOBEC-T)。在一些实施方式中,所述胞苷脱氨酶是与hAPOBEC1、 hAPOBEC-D或hAPOBEC-T同源的APOBEC家族成员。在一些实施方式中,所述胞苷脱氨酶包含人AID1全蛋白(hAID)或其脱氨酶结构域(hAID-D) 或其C末端截短形式(hAID-T)。在一些实施方式中,所述胞苷脱氨酶是与 hAID、hAID-D或hAID-T同源的AID家族成员。在一些实施方式中,所述 hAID-T是C末端处截短20个氨基酸的hAID。

在一些实施方式中,所述胞苷脱氨酶包含胞嘧啶脱氨酶的野生型氨基酸序列。在一些实施方式中,所述胞苷脱氨酶包含在所述胞嘧啶脱氨酶序列中的一个或多个突变,从而根据具体需求而改变所述胞嘧啶脱氨酶的编辑效率和/或底物编辑偏好。

APOBEC1和APOBEC3蛋白的某些突变已描述于Kim等,Nature Biotechnology(2017)35(4):371-377(doi:10.1038/nbt.3803);和Harris等,Mol. Cell(2002)10:1247-1253,其每一个通过引用整体并入本文。

在一些实施方式中,所述胞苷脱氨酶是APOBEC1脱氨酶或 APOBEC3G脱氨酶,所述APOBEC1脱氨酶包含在对应于大鼠APOBEC1中的W90、R118、H121、H122、R126或R132的氨基酸位置处的一个或多个突变,所述APOBEC3G脱氨酶包含在对应于人APOBEC3G中的W285、R313、D316、D317X、R320或R326的氨基酸位置处的一个或多个突变。

在一些实施方式中,所述胞苷脱氨酶包含在所述大鼠APOBEC1氨基酸序列的色氨酸90或同源APOBEC蛋白中的对应的位置(例如APOBEC3G的色氨酸285)处的突变。在一些实施方式中,在位置90处的所述色氨酸残基被酪氨酸或苯基丙氨酸残基(W90Y或W90F)取代。

在一些实施方式中,所述胞苷脱氨酶包含在所述大鼠APOBEC1氨基酸序列的精氨酸118或同源APOBEC蛋白中的对应的位置处的突变。在一些实施方式中,在位置118处的所述精氨酸残基被丙氨酸残基取代(R118A)。

在一些实施方式中,所述胞苷脱氨酶包含在所述大鼠APOBEC1氨基酸序列的组氨酸121或同源APOBEC蛋白中的对应的位置处的突变。在一些实施方式中,在位置121处的所述组氨酸残基被精氨酸残基取代(H121R)。

在一些实施方式中,所述胞苷脱氨酶包含在所述大鼠APOBEC1氨基酸序列的组氨酸122或同源APOBEC蛋白中的对应的位置处的突变。在一些实施方式中,在位置122处的所述组氨酸残基被精氨酸残基取代(H122R)。

在一些实施方式中,所述胞苷脱氨酶包含在所述大鼠APOBEC1氨基酸序列的精氨酸126或同源APOBEC蛋白中的对应的位置(例如APOBEC3G 的精氨酸320)处的突变。在一些实施方式中,在位置126处的所述精氨酸残基被丙氨酸残基取代(R126A)或被谷氨酸取代(R126E)。

在一些实施方式中,所述胞苷脱氨酶包含在所述APOBEC1氨基酸序列的精氨酸132或同源APOBEC蛋白中的对应的位置处的突变。在一些实施方式中,在位置132处的所述精氨酸残基被谷氨酸残基取代(R132E)。

在一些实施方式中,为了缩小所述编辑窗口的宽度,所述胞苷脱氨酶可包含以下突变中的一个或多个:W90Y、W90F、R126E和R132E,(基于大鼠APOBEC1的氨基酸序列位置),和对应于上述的同源APOBEC蛋白中的突变。

在一些实施方式中,为了降低编辑效率,所述胞苷脱氨酶可包含以下突变中的一个或多个:W90A、R118A、R132E,(基于大鼠APOBEC1的氨基酸序列位置),和对应于上述的同源APOBEC蛋白中的突变。在特定实施方式中,对使用具有降低的效能的胞苷脱氨酶酶以减小脱靶效应可能感兴趣。

在一些实施方式中,所述胞苷脱氨酶使野生型大鼠 APOBEC1(rAPOBEC1)或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述rAPOBEC1序列中的一个或多个突变,从而根据具体需求而改变rAPOBEC1的编辑效率和/或底物编辑偏好。

rAPOBEC1: MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIW RHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEF LSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWR NFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:243)

在一些实施方式中,所述胞苷脱氨酶是野生型人APOBEC1(hAPOBEC1) 或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述 hAPOBEC1序列中的一个或多个突变,从而根据具体需求而改变hAPOBEC1 的编辑效率和/或底物编辑偏好。

APOBEC1: MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKI WRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIR EFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYH CWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQN HLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(SEQ ID NO:244)

在一些实施方式中,所述胞苷脱氨酶是野生型人 APOBEC3G(hAPOBEC3G)或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述hAPOBEC3G序列中的一个或多个突,从而根据具体需求而改变hAPOBEC3G的编辑效率和/或底物编辑偏好。

hAPOBEC3G: MELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATF LAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEF QHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNN EPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGR HAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVS LCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCP FQPWDGLDEHSQDLSGRLRAILQNQEN(SEQ ID NO:245)

在一些实施方式中,所述胞苷脱氨酶是野生型海七鳃鳗(Petromyzon marinus)CDA1(pmCDAl)或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述pmCDAl序列中的一个或多个突变,从而根据具体需求而改变pmCDAl的编辑效率和/或底物编辑偏好。

pmCDAl: MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFW GYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCA EKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLN VMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKIL HTTKSPAV(SEQ ID NO:246)

在一些实施方式中,所述胞苷脱氨酶是野生型人AID(hAID)或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述pmCDAl序列中的一个或多个突变,从而根据具体需求而改变pmCDAl的编辑效率和/或底物编辑偏好。

hAID: MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYL RNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFL RGNPYLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCW NTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGLL D(SEQ ID NO:247)

在一些实施方式中,所述胞苷脱氨酶是hAID的截短形式(hAID-DC)或其催化结构域。在一些实施方式中,所述胞苷脱氨酶包含在所述hAID-DC 中的一个或多个突变,从而根据具体需求而改变hAID-DC的编辑效率和/或底物编辑偏好of hAID-DC。

hAID-DC: MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYL RNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFL RGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCW NTFVENHERTFKAWEGLHENSVRLSRQLRRILL(SEQ ID NO:248)

所述胞苷脱氨酶的附加的实施方式公开于题为“核碱基编辑器及其用途(Nucleobase Editor and Uses Thereof)”的WO WO2017/070632,其通过引用整体并入本文。

在一些实施方式中,所述胞苷脱氨酶具有包围易受脱氨编辑的核苷酸的高效的脱氨窗口。因此,在一些实施方式中,所述“编辑窗口宽度”指在所述胞苷脱氨酶的编辑效率超过该靶位点的半最大值的指定靶位点处的核苷酸位置的数量。在一些实施方式中,所述胞苷脱氨酶的所述编辑窗口宽度的范围为约1至约6个核苷酸。在一些实施方式中,所述胞苷脱氨酶的所述编辑窗口宽度为1、2、3、4、5或6个核苷酸.

不打算受理论束缚,预期在一些实施方式中,所述接头序列的长度影响所述编辑窗口宽度。在一些实施方式中,所述编辑窗口宽度随所述接头延伸 (例如从约3至约21个氨基酸)而增加(例如从约3至约6个核苷酸)。在非限制实施例中,16个残基的接头提供了约5个氨基酸的高效的脱氨窗口。在一些实施方式中,所述引导RNA的长度影响所述编辑窗口宽度。在一些实施方式中,缩短所述引导RNA导致所述胞苷脱氨酶的高效脱氨窗口缩小。

在一些实施方式中,所述胞苷脱氨酶的突变影响所述编辑窗口宽度。在一些实施方式中,所述CD-官能化CRISPR系统的所述胞苷脱氨酶组分包含降低所述胞苷脱氨酶的催化效率的一个或多个突变,从而防止所述脱氨酶每个DNA结合事件脱氨多个胞苷。在一些实施方式中,在APOBEC1的残基90(W90)或同源序列中的对应的色氨酸残基处的色氨酸发生突变。在一些实施方式中,所述催化失活的CRISPR-Cas与包含W90Y或W90F突变的 APOBEC1突变体融合或连接。在一些实施方式中,在APOBEC3G的残基 285(W285)或同源序列中的对应的色氨酸残基处的色氨酸发生突变。在一些实施方式中,所述催化失活的CRISPR-Cas与包含W285Y或W285F突变的 APOBEC3G突变体融合或连接。

在一些实施方式中,CD-官能化CRISPR系统的胞苷脱氨酶组分包含降低胞苷至所述脱氨酶活性位点的非最佳呈递的耐受性的一个或多个突变。在一些实施方式中,所述胞苷脱氨酶包含改变所述脱氨酶活性位点的底物结合活性的一个或多个突变。在一些实施方式中,所述胞苷脱氨酶包含改变将要被所述脱氨酶活性位点识别并与其结合的DNA的构象的一个或多个突变。在一些实施方式中,所述胞苷脱氨酶包含改变所述底物对所述脱氨酶活性位点的可及性的一个或多个突变。在一些实施方式中,在APOBEC1的残基126 或同源序列中的对应的精氨酸残基处的精氨酸发生突变。在一些实施方式中,所述催化失活的CRISPR-Cas与包含R126A或R126E突变的APOBEC1 融合或连接。在一些实施方式中,在APOBEC3G的残基320(R320)或同源序列中的对应的精氨酸残基处的色氨酸发生突变。在一些实施方式中,所述催化失活的CRISPR-Cas与包含R320A或R320E突变的APOBEC3G突变体融合或连接。在一些实施方式中,在APOBEC1的残基132(R132)或同源序列中的对应的精氨酸残基处的精氨酸发生突变。在一些实施方式中,所述催化失活的CRISPR-Cas与包含R132E突变的APOBEC1突变体融合或连接。

在一些实施方式中,所述CD-官能化CRISPR系统的所述APOBEC1结构域包含选自W90Y、W90F、R126A、R126E和R132E的一个、两个或三个突变。在一些实施方式中,所述APOBEC1结构域包含W90Y和R126E的双重突变。在一些实施方式中,所述APOBEC1结构域包含W90Y和R132E 的双重突变。在一些实施方式中,所述APOBEC1结构域包含R126E和 R132E的双重突变。在一些实施方式中,所述APOBEC1结构域包含W90Y、 R126E和R132E三个突变。

在一些实施方式中,在如本文公开的胞苷脱氨酶中的一个或多个突变将所述编辑窗口宽度减小至约2个核苷酸。在一些实施方式中,在如本文公开的胞苷脱氨酶中的一个或多个突变将所述编辑窗口宽度减小至约1个核苷酸。在一些实施方式中,在如本文公开的胞苷脱氨酶中的一个或多个突变减小所述编辑窗口宽度而仅轻微或适度地影响所述酶的编辑效率。在一些实施方式中,在如本文公开的胞苷脱氨酶中的一个或多个突变减小所述编辑窗口宽度而不降低所述酶的编辑效率。在一些实施方式中,在如本文公开的胞苷脱氨酶中的一个或多个突变可区分相邻胞苷核苷酸,否则所述相邻相邻胞苷核苷酸将被所述胞苷脱氨酶以类似的效率进行编辑。

在一些实施方式中,所述胞苷脱氨酶蛋白进一步包含一个或多个双链 RNA(dsRNA)结合基序(dsRBM)或结构域(dsRBD)或者与所述一个或多个双链RNA(dsRNA)结合基序(dsRBM)或结构域(dsRBD)连接以用于识别双链核酸底物并与所述双链核酸底物结合。在一些实施方式中,所述胞苷脱氨酶与所述底物之间的相互作用由一个或多个附加蛋白因子(包括CRISPR/CAS蛋白因子)介导。在一些实施方式中,所述胞苷脱氨酶与所述底物之间的相互作用由一个或多个核酸组分(包括引导RNA)进一步介导。

根据本发明,所述胞苷脱氨酶的所述底物是包含感兴趣的胞嘧啶的RNA 双链核酸分子的DNA单链泡,其在所述引导分子与其DNA靶标的结合之后可与所述胞苷脱氨酶接触,其然后与所述CRISPR-Cas酶,形成所述 CRISPR-Cas复合物,从而所述胞嘧啶脱氨酶与所述CRISPR-Cas复合物的一个或多个组分(即所述CRISPR-Cas酶和/或所述引导分子)融合或能够与所述一个或多个组分结合。所述引导分和CRISPR-Cas酶的具体特征详细描述于下文。

所述胞苷脱氨酶或其催化结构域可为人、大鼠或七鳃鳗胞苷脱氨酶蛋白或其催化结构域。

所述胞苷脱氨酶蛋白或其催化结构域可为载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。所述胞苷脱氨酶蛋白或其催化结构域可为诱导激活的脱氨酶(AID)。所述胞苷脱氨酶蛋白或其催化结构域可为胞苷脱氨酶 1(CDA1)。

所述胞苷脱氨酶蛋白或其催化结构域可为APOBEC1脱氨酶。所述 APOBEC1脱氨酶可包含对应于大鼠APOBEC1中的W90A、W90Y、R118A、 H121R、H122R、126A、R126E或R132E的一个或多个突变,或APOBEC3G 脱氨酶包含对应于人APOBEC3G中的W285A、W285Y、R313A、D316R、 D317R、R320A、R320E或R326E的一个或多个突变。

所述系统可进一步包含尿嘧啶糖基化酶抑制剂(UGI)。在一些实施方式中,所述胞苷脱氨酶蛋白或其催化结构域与尿嘧啶糖基化酶抑制剂(UGI)一起被递送。所述GI可与所述胞苷脱氨酶蛋白或其催化结构域和/或催化失活的CRISPR-Cas蛋白连接(例如共价连接)。

基因产物的翻译后修饰的调节

在一些情况下,碱基编辑可用于调节基因产物的翻译后修饰。在一些情况下,可通过碱基编辑不可被修饰的氨基残基来使是翻译后修饰位点的氨基酸残基突变。这样的翻译后修饰的实例包括二硫键形成、糖基化、脂化、乙酰化、磷酸化、甲基化、泛素化、SUMO化或其任何组合。

在一些实施方式中,本文所述的碱基编辑可调节Stat3/IRF-5通路,例如以减轻炎症。例如,IRF-5的Stat3、Thr10、Ser158、Ser309、Ser317、Ser451 和/或Ser462的Tyr705上的磷酸化可与白介素信号传导有关。可使用本文所述的碱基编辑器以使这些繁殖位点中的一个或多个突变以调节免疫、自身免疫和/或炎症。

在一些实施方式中,本文所述的碱基编辑器可调节胰岛素受体底物(IRS) 通路.例如,Ser265、Ser302、Ser325、Ser336、Ser358、Ser407和/或 Ser408上的磷酸化可可参与调节(例如抑制)ISR通路。替代地或附加地,可使小鼠中的丝氨酸307(或人中的丝氨酸)突变,从而调节所述磷酸化。例如,丝氨酸307磷酸化可导致IRS-1的降解并减少MAPK信号传导。可在胰岛素不敏感的条件下(例如胰岛素过度刺激和/或TNFα治疗)诱导丝氨酸307磷酸化。在一些实施例中,可生成S307F突变以用于稳定IRS-1和所述通路中的其他组分之间的相互作用。可使用本文所述的碱基编辑以使这些繁殖位点中的一个或多个突变以用于for调节IRS通路。

基因产物的稳定性的调节

在一些实施方式中,碱基编辑可用于调节基因产物的稳定性。例如,可通过本文所述的碱基编辑器来使调节大鼠中蛋白降解的一个或多个氨基酸残基突变。在一些情况下,这样的氨基酸残基可在降解决定子中。降解决定子可指参与调节所述蛋白的降解速率的蛋白部分。降解决定子可包含短氨基酸序列、结构基序和暴露的氨基酸(例如赖氨酸或精氨酸)。一些蛋白可包含多个降解决定子。所述降解决定子为泛素依赖性(例如基于所述蛋白的泛素化调节蛋白降解)或非泛素依赖性。

在一些情况下,可使用所述碱基编辑来使单个肽中的一个或多个氨基酸残基突变以用于蛋白降解。在一些实施例中,所述单个肽可为PEST序列,所述PEST序列是富含脯氨酸(P)、谷氨酸(E)、丝氨酸(S)和苏氨酸(T)的肽序列。例如,可增加包含PEST序列的NANOG的稳定性,例如以促进胚胎干细胞多能性。

在一些实施例中,所述碱基编辑器可用于使SMN2突变(例如生成S270A 突变)以增加所述SMN2蛋白的稳定性,所述SMN2蛋白参与脊髓性肌萎缩。可通过碱基编辑器生成的SMN2中的其他突变包括描述于Cho S.等,Genes Dev.2010Mar 1;24(5):438–442中的那些。在某些实施例中,所述碱基编辑器可用于生成如Fortmann KT等,J Mol Biol.2015Aug 28;427(17): 2748–2756中描述的IκBα上的突变。可通过计算工具(例如 slim.ucd.ie/apc/index.php上提供的线上工具)来识别降解决定子中的靶位点。其他靶标包括Cdc25A磷酸酶。

可通过碱基编辑器靶向的基因的实例

在一些实施例中,所述碱基编辑器可用于修饰PCSK9。所述碱基编辑器可引入终止密码子和/或降低PCSK9活性的疾病相关的突变。所述碱基编辑可引入PCSK9中的以下突变中的一个或多个:R46L、R46A、A53V、A53A、 E57K、Y142X、L253F、R237W、H391N、N425S、A443T、I474V、I474A、 Q554E、Q619P、E670G、E670A、C679X、H417Q、R469W、E482G、F515L 和/或H553R。

在一些实施例中,所述碱基编辑器可用于修饰ApoE。所述碱基编辑器可靶向合成模型中的ApoE和/或源自患者的神经元(例如源自iPSC的那些)。可通过测序来测试所述靶向。

在一些实施例中,所述碱基编辑器可用于修饰Stat1/3。所述碱基编辑器可靶向Y705和/或S727以用于减少Stat1/3激活。可通过基于荧光素酶的启动子来测试所述碱基编辑。通过碱基编辑靶向Stat1/3可阻碍单核细胞进行巨噬细胞分化和响应巨噬细胞的ox-LDL刺激的炎症。

在一些实施例中,所述碱基编辑器可用于修饰TFEB(EB的转录因子)。所述碱基编辑器可靶向调节所述TFEB的易位的一个或多个氨基酸残基。在一些情况下,所述碱基编辑器可靶向调节自体吞噬的一个或多个氨基酸残基。

在一些实施例中,所述碱基编辑器可用于修饰鸟氨酸氨基甲酰转移酶 (OTC)。这样的修饰可用于修正鸟氨酸氨基甲酰转移酶缺乏症。例如,碱基编辑可通过将核苷酸134C转化为U来修正Leu45Pro突变。示例性方法示于图102中。

在一些实施例中,所述碱基编辑器可用于修饰Lipin1。所述碱基编辑器可靶向可被mTOR磷酸化的一个或多个丝氨酸。Lipin1的碱基编辑可调节脂质堆积。所述碱基编辑器可靶向3T3L1前脂肪细胞模型中的Lipin1。可通过测量脂质堆积的减少(例如通过油红)来测试所述碱基编辑的影响。

碱基编辑引导分子设计的考量

在一些实施方式中,所述引导序列是RNA序列,所述RNA序列的长度为10至50nt之间,但尤其为约20-30nt,有利地约20nt、23-25nt或24nt。在碱基编辑的实施方式中,选择所述引导序列以确保其与包含将要脱氨的腺苷的靶序列杂合。这更详细地描述于下文。选择可涵盖增加脱氨地效能和特异性地进一步步骤。

在一些实施方式中,所述引导序列长度为约20nt至约30nt且其与所述靶DNA链杂合以形成几乎完美配对的双链核酸分子,除了具有所述靶腺苷位点处的dA-C错配之外。特别是,在一些实施方式中,所述dA-C错配位于所述靶序列的中心的近处(因此在所述引导序列与所述靶序列的杂交之后的所述双链核酸分子的中心),从而限制所述腺苷脱氨酶至狭窄的编辑窗口 (例如约4bp宽)。在一些实施方式中,所述靶序列可包含多于一个将要脱氨的靶腺苷。在进一步的实施方式中,所述靶序列可进一步包含3’至所述靶腺苷位点的一个或多个dA-C错配。在一些实施方式中,为了避免所述靶序列中的非计划的腺嘌呤位点处的脱靶编辑,所述引导序列可被设计为包含在对应于非计划的腺嘌呤的位置处的未配对的鸟嘌呤以引入dA-G错配,所述 dA-G错配催化地不利于某些腺苷脱氨酶(例如ADAR1和ADAR2)。见Wong 等,RNA 7:846-858(2001),其通过引用整体并入本文。

在一些实施方式中,使用具有标准长度(例如约20nt)的CRISPR-Cas引导序列以形成具有所述靶DNA的异源双链核酸分子。在一些实施方式中,使用长于所述标准长度(例如>20nt)的CRISPR-Cas引导分子以形成具有所述靶DNA(包括在所述CRISPR-Cas-引导RNA-靶DNA复合物之外的)异源双链核酸分子。使感兴趣的核苷酸的指定延伸范围内的一个或多个腺嘌呤脱氨可为有利的。在替代的实施方式中,维持所述标准引导序列长度的限定可为有利的。在一些实施方式中,所述引导序列被设计为引入CRISPR-Cas引导物的所述标准长度之外的dA-C错配,其可通过CRISPR-Cas减少位阻并增加所述腺苷脱氨酶和所述dA-C错配之间的接触的频率。

在一些碱基编辑实施方式中,从所述PAM在DNA靶标上的位置处开始计算所述错配的核碱基(例如胞苷)的位置。在一些实施方式中,所述错配的核碱基位于距所述PAM 2-21nt,或距所述PAM 13-21nt,或距所述PAM 14-21nt,或距所述PAM 14-20nt,或距所述PAM15-20nt,或距所述PAM 16-20nt,或距所述PAM 14-19nt,或距所述PAM 15-19nt,或距所述PAM 16-19nt,或距所述PAM 17-19nt,或距所述PAM约20nt,或距所述PAM 约19nt,或距所述PAM约18nt,或距所述PAM约17nt,或距所述PAM 约16nt,或距所述PAM约15nt,或距所述PAM约14nt处。在优选实施方式中,所述错配的核碱基位于距所述PAM 17-19nt或18nt处。

错配距离是所述CRISPR-Cas间隔基的3’末端和所述错配的核碱基(例如胞苷)之间的碱基数,其中所述错配的碱基作为所述错配距离计算的一部分被包含。在一些实施方式中,所述错配距离为1-10nt或1-9nt或1-8nt或2-8nt 或2-7nt或2-6nt或3-8nt或3-7nt或3-6nt或3-5nt或约2nt或约3nt或约 4nt或约5nt或约6nt或约7nt或约8nt。在优选实施方式中,所述错配距离为3-5nt或4nt。

在一些实施方式中,本文所述的CRISPR-Cas-ADAR系统的所述编辑窗口为距所述PAM 12-21nt,或距所述PAM 13-21nt,或距所述PAM 14-21nt,或距所述PAM 14-20nt,或距所述PAM 15-20nt,或距所述PAM 16-20nt,或距所述PAM 14-19nt,或距所述PAM 15-19nt,或距所述PAM 16-19nt,或距所述PAM17-19 nt,或距所述PAM约20nt,或,距所述PAM约19nt,或距所述PAM约18nt,或距所述PAM约17nt,或距所述PAM约16nt,或距所述PAM约15nt,或距所述PAM约14nt。在一些实施方式中,本文所述的CRISPR-Cas-ADAR系统的所述编辑窗口为距所述CRISPR-Cas间隔基的3’末端1-10nt,或距所述CRISPR-Cas间隔基的3’末端1-9nt,或距所述CRISPR-Cas间隔基的3’末端1-8nt,或距所述CRISPR-Cas间隔基的3’末端2-8nt,或距所述CRISPR-Cas间隔基的3’末端2-7nt,或距所述 CRISPR-Cas间隔基的3’末端2-6nt,或距所述CRISPR-Cas间隔基的3’末端 3-8nt,或距所述CRISPR-Cas间隔基的3’末端3-7nt,或距所述CRISPR-Cas 间隔基的3’末端3-6nt,或距所述CRISPR-Cas间隔基的3’末端3-5nt,或距所述CRISPR-Cas间隔基的3’末端约2nt,或距所述CRISPR-Cas间隔基的3’末端约3nt,或距所述CRISPR-Cas间隔基的3’末端约4nt,或距所述 CRISPR-Cas间隔基的3’末端约5nt,或距所述CRISPR-Cas间隔基的3’末端约6nt,或距所述CRISPR-Cas间隔基的3’末端约7nt,或距所述CRISPR-Cas 间隔基的3’末端约8nt处。

接头

本文所述的脱氨酶可通过接头与Cas蛋白融合。进一步设想RNA腺苷甲基化酶(N(6)-甲基腺苷)可与靶向本发明的效应子蛋白的RNA融合,并可靶向感兴趣的转录物。该甲基化酶引起可逆的甲基化,具有调节作用并可通过调控多个细胞相关的细胞通路来影响基因表达和细胞命运决定(Fu等,Nat Rev Genet.2014;15(5):293-306)。

ADAR或其他RNA修饰酶可通过接头与CRISPR-Cas或死的 CRISPR-Cas蛋白(例如与CRISPR-Cas或死的CRISPR-Cas的C末端或N末端)连接(例如融合)。

本文中与融合蛋白联合使用的术语“接头”指与所述蛋白结合以形成融合蛋白的分子。一般而言,这样的分子除了与所述蛋白结合或保留所述蛋白之间的一些最小距离或其他空间距离之外没有特定生物活性。但是,在某些实施方式中,可选择所述接头以影响所述接头和/或所述融合蛋白的一些特性,例如所述接头的折叠、净电荷或疏水性。

用于本发明的所述方法中的合适接头是本领域技术人员众所周知的且包括但不限于直链或支链碳接头、杂环碳接头或肽接头。但是,如本文所用的接头也可为共价键(碳-碳键或碳-杂原子键)。在特定实施方式中,所述接头用于将所述CRISPR-Cas蛋白和所述核苷酸脱氨酶分离足够确保每个蛋白保留其需要的功能特性的距离。优选的肽接头序列采用灵活的延伸构象且没有显示出发展有序二级结构的倾向。在某些实施方式中,所述接头可为化学部分,所述化学部分可为单体、二聚体、多聚体或聚合体。优选地,所述接头包含氨基酸。在灵活的接头中的典型的氨基酸包括Gly、Asn和Ser。因此,在特定实施方式中,所述接头包含Gly、Asn和Ser氨基酸中一个或多个的组合。其他几乎中性的氨基酸(例如Thr和Ala)也可用于所述接头序列中。示例性接头公开于Maratea等(1985),Gene 40:39-46;Murphy等(1986)Proc.Nat'l. Acad.Sci.USA 83:8258-62;U.S.Pat.No.4,935,233;和U.S.Pat.No.4,751,180中。例如,可使用GlySer接头GGS、GGGS或GSG。可以三次重复来使用GGS、GSG、GGGS或GGGGS接头(例如(GGS)

在特定实施方式中,接头(例如(GGGGS)

接头的实例示于下表8中。

表8

核苷酸脱氨酶或其他RNA修饰酶可通过一个或多个氨基酸与 CRISPR-Cas或死的CRISPR-Cas连接。在一些情况下,所述核苷酸脱氨酶可通过氨基酸411-429、114-124、197-241和607-624中的一个或多个与所述 CRISPR-Cas或死的CRISPR-Cas连接。所述氨基酸位置可对应于本文公开的 CRISPR-Cas直系同源物。在某些实施例中,所述核苷酸脱氨酶可通过对应于颊普雷沃菌CRISPR-Cas的氨基411-429、114-124、197-241和607-624的一个或多个氨基酸与所述死的CRISPR-Cas连接。

一般使用方法

在另一方面,本公开公开了使用本文所述的组合物和系统的方法。一般而言,所述方法包括通过引入细胞或生物来修饰靶核酸,所述生物包含所述靶核酸,所述工程化CRISPR-Cas蛋白,编码工程化CRISPR-Cas蛋白的多核苷酸,所述CRISPR-Cas系统,或包含所述多核苷酸的所述载体或载体系统,从而使所述工程化CRISPR-Cas蛋白修饰所述细胞或生物中的所述靶核酸。可通过由脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组装、基因枪、可植入的装置或本文所述的载体系统进行的递送来引入所述工程化 CRISPR-Cas蛋白或系统。所述细胞或生物可为真核细胞或生物.所述细胞或生物是动物细胞或生物。所述细胞或生物是植物细胞或生物。核酸纳米组装的实例包括DNA折纸和RNA折纸,例如US8554489、US20160103951、 WO2017189914和WO2017189870(其通过引用整体并入本文)中描述的那些。基因枪可包括基因枪递送系统,所述基因枪递送系统是用于将外源DNA(转基因)递送至细胞的装置。效应分子可为涂敷有DNA(通常为质粒DNA)的重金属的基本粒子。CRISPR-Cas系统中的递送组分的实例描述于Svitashev等, Nat Commun.2016;7:13274中。

在一些实施方式中,所述靶核酸包含基因座,且所述工程化CRISPR-Cas 蛋白修饰在所述基因座处编码的基因产物或所述基因产物的表达。所述靶核酸是DNA或RNA且其中所述靶核酸中的一个或多个核苷酸可被碱基编辑。所述靶核酸可为DNA或RNA且其中所述靶核酸被切割。所述工程化 CRISPR-Cas蛋白可进一步切割非靶标核酸。

在一些实施方式中,所述方法可进一步包括可视化活性和任选地,使用可检测的标记。所述方法还可包括检测所述CRISPR-Cas系统的一个或多个组分与所述靶核酸的结合。

在其他方面,所述使用方法包括检测样品中的靶核酸。在一些实施方式中,所述方法包括使样品与以下物质接触:本文的工程化CRISPR-Cas蛋白;至少一个引导多核苷酸,所述引导多核苷酸包含引导序列,所述引导序列能够与所述靶核酸结合并被设计为与所述工程化CRISPR-Cas形成复合物;和包含非靶标序列的基于RNA的掩蔽构建体;其中所述工程化CRISPR-Cas 蛋白显示附带的核糖核酸酶活性且切割所述检测构建体的所述非靶标序列;和检测来自所述非靶标序列的切割的信号,从而检测所述样品中的所述靶核酸。所述方法可进一步包括使所述样品与用于扩增所述靶核酸的试剂接触。用于扩增的所述试剂可包含恒温扩增反应试剂.所述恒温扩增试剂可包含基于核酸序列的扩增、重组酶聚合酶扩增、环介导的恒温扩增、链置换扩增、解旋酶依赖性扩增或切口酶扩增试剂。所述靶核酸为DNA分子且所述方法可进一步包括使所述靶DNA分子与包含RNA聚合酶位点和RNA聚合酶的引物接触。

所述掩蔽构建体:抑制可检测的阳性信号的生成直至所述掩蔽构建体被切割或失活为止,或掩盖可检测的阳性信号或产生可检测的阴性信号直至所述掩蔽构建体被切割或失活为止。所述掩蔽构建体可包含:抑制由报道构建体编码的基因产物的生成的沉默RNA,其中所述基因产物在表达时产生所述可检测的阳性信号;产生所述阴性可检测信号的核酶,且其中所述阳性可检测信号在所述核酶失活时生成;或将底物转化为第一颜色的核酶,且其中所述底物在所述核酶失活时转化为第二颜色;适配体和/或包含多核苷酸栓系的抑制剂;与可检测的配体和掩蔽组分连接的多核苷酸;通过桥接分子保持于聚集体中的纳米颗粒,其中所述桥接分子中的至少一部分包含多核苷酸,且其中所述溶液在所述纳米颗粒分散于溶液中时经历色移;通过连接分子与一个或多个猝灭分子连接的量子点或荧光团,其中所述连接分子中的至少一部分包含多核苷酸;具有嵌合剂的复合物中的多核苷酸,其中所述嵌合剂在所述多核苷酸的切割之后改变了吸光度;或通过多核苷酸栓系的两个荧光团,所述荧光团在从所述多核苷酸释放时发生荧光变化。

所述适配体可包含契合酶的多核苷酸栓系的抑制剂,其中所述酶在通过作用于底物上而从所述适配体或多核苷酸-栓系的抑制剂释放时产生可检测的信号;或可为抑制酶且防止所述酶催化来自底物的可检测的信号的生成的抑制性适配体,或其中所述多核苷酸栓系的抑制剂抑制酶且防止所述酶催化来自底物的可检测的信号的生成;或契合试剂对,所述试剂对在从所述适配体释放时结合以生成可检测的信号。

所述纳米颗粒可为胶态金属。所述胶态金属材料可包含水溶性金属粒子或分散于液体、水溶胶或金属固体中的金属化合物。所述胶态金属可选自元素周期表的组IA、IB、IIB和IIIB中的金属以及过渡金属,特别是组VIII 的那些。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下的各种氧化态:锂、钠、镁、钾、钪、钛、钒、铬、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。所述金属优选地以粒子形式提供且源自合适地金属化合物,例如A1

当RNA桥被激活的CRISPR效应子切割时,观察到前述的色移。在一些示例性实施方式中,所述颗粒是胶态金属。在某些其他示例实施方式中,所述胶态金属是胶态金。在某些示例实施方式中,所述胶态纳米颗粒是15nm 金纳米颗粒(AuNPs)。由于胶态金纳米颗粒地独特表面特性,当完全分散在溶液中时,在520nm处观察到最大吸光度,并且肉眼呈现红色。AuNP聚集后,它们会显示出最大吸收率的红移,并显示为较深的颜色,最终从溶液中沉淀出来,成为深紫色的聚集体。

在一些实施方式中,至少一个引导多核苷酸包含错配。所述错配可在所述一个或多个引导序列上的单个核苷酸变异的上或下游。在某些实施方式中,可通过错配的引入来实现切割效率的调整,例如1个或多个错配,例如间隔基序列和靶序列之间的1个或2个错配,包括所述间隔基/靶标的错配位置。例如双错配的位置越中心(即不是not 3’或5’),则切割效率受到的影响就越大。因此,通过选择所述间隔基上的错配位置,可以调整切割效率。举例来说,如果需要小于100%的靶标切割(例如细胞群体中),1个或更多个(例如优选地2个)间隔基和靶序列之间的错配可引入所述间隔基序列。沿着所述错配位置的所述间隔基越中心,则切割百分比越低。在某些示例实施方式中,可利用所述切割效率来设计可区分两个或更多个相差单个核苷酸(例如单个核苷酸多态性(SNP)、变异或(点)突变)的靶标的单个引导物。所述CRISPR效应子可降低对SNP(或其他单个核苷酸变异)的敏感性并继续以某种效率水平切割SNP靶标。因此,对于两个靶标或靶标组而言,引导RNA可被设计为具有与所述靶标的中的一个互补的核苷酸序列,即靶上SNP。所述引导RNA 进一步被设计为具有合成的错配。如本文所用的,“合成的错配”指引入至所述自然存在的SNP的上游或下游的非自然存在的错配,例如至多5个核苷酸上游或下游,例如4、3、2或1个核苷酸上游或下游,优选地至多3个核苷酸上游或下游,更优选地至多2个核苷酸上游或下游,最优选地1个核苷酸上游或下游(即与所述SNP相邻)。当所述CRISPR效应子与所述靶上SNP 结合时,只有单个错配会与合成的错配形成复合物且所述CRISPR效应子将继续被激活且可检测的信号将继续生成。当所述引导RNA与脱靶SNP杂合时,两个错配将形成,所述错配来自所述SNP和所述合成的错配,且没有可检测的信号生成。因此,本文公开的系统可被设计为区分群体内的SNP。例如,所述系统可用于区分因单个SNP而不同的致病菌株或检测某些疾病特异性SNP,例如但不限于疾病相关的SNP,例如但不限于癌症相关的SNP。

在某些实施方式中,所述引导RNA被设计为以使所述SNP位于所述间隔基序列(从5’末端开始)的位置1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29 或30上。在某些实施方式中,所述引导RNA被设计为以使所述SNP位于所述间隔基序列(从5’末端开始)的所述间隔基序列(从5’末端开始)的位置1、 2、3、4、5、6、7、8或9上。在某些实施方式中,所述引导RNA被设计为以使所述SNP位于所述间隔基序列(从5’末端开始)的位置2、3、4、5、6 或7上。在某些实施方式中,所述引导RNA被设计为以使所述SNP位于所述间隔基序列(从5’末端开始)的位置3、4、5或6上。在某些实施方式中,所述引导RNA被设计为以使所述SNP位于所述间隔基序列(从5’末端开始) 的位置3上。

在某些实施方式中,所述引导RNA被设计为以使所述错配(例如所述合成的错配,即除SNP之外的附加突变)位于所述间隔基序列(从5’末端开始) 的位置1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29或30上。在某些实施方式中,所述引导RNA被设计为以使所述错配位于所述间隔基序列(从5’末端开始)的位置1、2、3、4、5、6、7、8或9上。在某些实施方式中,所述引导RNA被设计为以使所述错配位于所述间隔基序列(从5’末端开始)的位置4、5、6或7上。在某些实施方式中,所述引导RNA被设计为以使所述错配位于所述间隔基序列(从5’末端开始)的位置5上。

在某些实施方式中,所述引导RNA被设计为以使所述错配位于所述SNP 的上游2个核苷酸处(即一个间隔核苷酸)。在某些实施方式中,所述引导RNA 被设计为以使所述错配位于所述SNP下游的2个核苷酸处(即一个间隔核苷酸)。在某些实施方式中,所述引导RNA被设计为以使所述错配位于所述间隔基序列(从5’末端开始)的位置5上且所述SNP位于所述间隔基序列(从5’末端开始)的位置3上。

转录物追踪

在另一方面,本公开提供了用于转录物追踪的组合物和方法。在一些实施方式中,转录物追踪允许研究者可视化细胞、组织、器官或动物中的转录物,提供关于RNA动力学和功能的重要的空间-时间信息。示例性方法示于图102中。

在一些实施方式中,所述组合物可以是本文的具有一个或多个标记的 CRISPR-Cas蛋白或包含如此标记的CRISPR-Cas蛋白的CRISPR-Cas系统。所述CRISPR-Cas蛋白或系统可与一个或多个转录物结合,从而可通过使用所述CRISPR-Cas蛋白上的所述标记来检测(例如可视化)所述转录物。

在一些实施方式中,本公开包括用于表达具有一个或多个多核苷酸或多核苷酸标记的CRISPR-Cas蛋白的系统。所述系统可包含编码所述 CRISPR-Cas蛋白和/或所述标记的多核苷酸。所述系统可进一步包含载体系统,所述载体系统包含这样的多核苷酸。例如,CRISPR-Cas蛋白可与荧光蛋白或其片段融合。荧光蛋白的实例包括GFP蛋白,EGFP,Azami-Green, Kaede,ZsGreen1和CopGFP;CFP蛋白,例如Cerulean,mCFP,AmCyan1,MiCy, 和CyPet;BFP蛋白,例如EBFP;YFP蛋白,例如EYFP,YPet,Venus,ZsYellow 和mCitrine;OFP蛋白,例如cOFP,mKO和mOrange;红色荧光蛋白,或 RFP;来自任何其他物种的红色或远红荧光蛋白,例如异形珊瑚礁珊瑚 (Heteractis reef coral)和海葵(Actinia)或Entacmaea海葵及其变异体。RFP包括例如Discosoma变异体,例如mRFP1,mCherry,tdTomato,mStrawberry,mTangerine,DsRed2和DsRed-T1,花水母亚目(Anthomedusa)J-Red和海葵 (Anemonia)AsRed2。远红荧光蛋白包括例如 Actinia AQ143,Entacmaea eqFP611,Discosoma变异体,例如mPlum和 mRasberry,和Heteractis HcRed1和t-HcRed。

在一些情况下,所述系统可以诱导表达标记的CRISPR-Cas蛋白。例如,所述系统在可调节的启动子的控制下,在所述CRISPR-Cas蛋白和/或标记的编码下编码所述CRISPR-Cas蛋白和/或标记。这样的系统可以允许对所述标记的表达进行空间和/或时间控制,从而实现对转录追踪的空间和/或时间控制。

在某些情况下,所述CRISPR-Cas可以用可检测的标签标记。标记可以在细胞中进行。或者,可以首先进行标记,然后将标记的CRISPR-Cas蛋白递送到细胞、组织、器官或器官中。

所述可检测的标记可以被检测到(例如通过成像,超声或MRI可视化)。这种可检测标签的实例包括可检测的寡核苷酸标签,其可以是但不限于包含独特核苷的寡核苷酸。在某些情况下,所述可检测的标记包含标记物质,可通过光谱法检测到,光化学,生物化学,免疫化学,电气,光学或化学手段。此类标签包括用于标记的链霉亲和素偶联物染色的生物素,磁珠(例如

在一些实施方式中,本公开提供了用于递送所述标记的CRISPR-Cas蛋白或标记的CRISPR-Cas系统的系统。所述递送系统可包含任何递送载体,例如本文描述的那些,例如RNP、脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组装、基因枪、可植入的装置或本文所述的载体系统。

核酸靶向

在某些实施方式中,本发明所述的CRISPR-Cas效应子蛋白是来自表1-4 或所述表中所示的这样的蛋白,或在所述蛋白中,或包含所述蛋白,或基本由所述蛋白组成,或由所述蛋白组成,或涉及所述蛋白,其中一个或多个氨基酸如本文他处所描述的那样发生突变。因此,在一些实施方式中,所述效应子蛋白可为RNA-结合蛋白,例如死的-Cas型效应子蛋白,其可任选地如本文所述的那样例如通过转录激活或抑制结构域,NLS或其他功能性结构域而官能化。在一些实施方式中,所述效应子蛋白可为切割RNA单链的RNA- 结合蛋白。如果结合的RNA是ssRNA,则ssRNA被完全切割。在一些实施方式中,所述效应子蛋白可为RNA-结合蛋白,其切割一条RNA双链,例如,如果它包含两个RNAe结构域。如果结合的RNA是dsRNA,则dsRNA被完全切割。在一些实施方式中,所述效应子蛋白可为具有结合酶活性的RNA 结合蛋白,即它与dsRNA结合,但仅切割RNA链中的一个。

CRISPR系统中的核糖核酸酶功能是已知的,例如,已经报道了针对某些III型CRISPR-Cas系统的mRNA靶向(Hale et al.,2014,Genes Dev,vol.28, 2432-2443;Hale etal.,2009,Cell,vol.139,945-956;Peng et al.,2015,Nucleic acids research,vol.43,406-417)和提供了显著优势。从而提供了通过存在的效应子蛋白靶向RNA的CRISPR-Cas系统、组合物或方法。

所述靶RNA,即所述感兴趣的RNA,是本发明旨在靶向的RNA,本发明导致在所述靶RNA上的所述感兴趣的靶位点处的所述效应子蛋白的募集和结合。所述靶RNA可为任何合适的RNA形式。这在一些实施方式中可包含mRNA。在其他实施方式中,所述靶RNA可包含tRNA或rRNA。

自激活系统

一旦编辑了细胞中所有RNA的拷贝,就不再需要在该细胞中继续进行 CRISPR-Cas效应子蛋白表达或活性。依靠所述CRISPR-Cas或crRNA的RNA 作为所述引导靶序列的自灭活系统可以通过阻止CRISPR-Cas或复合物形成的表达而关闭所述系统。

靶RNA的实例

本文所述的组合物和系统可用于编辑各种类型的靶RNA。靶RNA的实例描述于下文。

干扰RNA(RNAi)和微小RNA(miRNA)

在其他实施方式中,所述靶RNA可包含干扰RNA,即参与RNA干扰通路的RNA,例如shRNA、siRNA等。在其他实施方式中,所述靶RNA可包含微小RNA(miRNA)。对干扰RNA或miRNA的控制可通过减少体内或体外干扰RNA或miRNA的寿命来帮助减少那些方法中所见的脱靶效应 (OTE)。

如果选择性地表达所述效应子蛋白和合适的引导物(例如在适当的启动子(例如组织或细胞周期特异性的启动子和/或增强子)的控制下在空间或时间上)表达,则可能是用于保护细胞或系统(体内或体外)免受RNAi侵害。这对于不需要RNAi的邻近组织或细胞可能有用,或者用于比较未表达所述效应子蛋白和合适的引导区和的细胞或组织的目的(即在不受RNAi控制的地方或在没有RNAi的地方)所述效应子蛋白可用于控制或结合至包含或由 RNA组成的分子,例如核酶,核糖体或核糖开关。在本发明的实施方式中,RNA引导可募集所述效应。子蛋白与这些分子结合,使得所述效应子蛋白能够与它们结合。

核糖体RNA(rRNA)

例如,阿扎利德抗生素(例如阿奇霉素)是众所周知的。他们靶向并破坏了50S核糖体亚基。可以将该效应子蛋白与合适的引导RNA一起靶向50S 核糖体亚基,并招募并与50S核糖体亚基结合。因此,提供了与针对核糖体 (尤其是50s核糖体亚基)靶标的合适的引导物协同作用的该效应子蛋白。该效应子蛋白与针对核糖体(尤其是50年代核糖体亚基)靶标的所述适当的引导物的配合使用可能包括抗生素的使用。特别是,抗生素的使用类似于阿扎利德抗生素(例如阿奇霉素)的作用。在一些实施方式中,原核生物的核糖体亚基,例如原核生物中的70S亚基,上述50S亚基,30S亚基以及16S和5S 亚基都可以被靶向。在其他实施方式中,真核生物核糖体亚基,例如真核生物中的80S亚基,60S亚基,40S亚基以及28S,18S。可能以5.8S和5S亚单位为靶RNA。

如本文所述,所述效应子蛋白可为RNA-结合蛋白。在一些实施方式中,所述效应子蛋白可为RNA切割单链的RNA结合蛋白。在任一种情况下,但是特别是在RNA的RNA结合蛋白切割单链的情况下,核糖体功能都可以被调节,特别是被减少或破坏。这可能适用于任何核糖体RNA和任何核糖体亚基,rRNA的序列是众所周知的。

因此,设想通过使用本效应子蛋白与合适的引导至核糖体靶标的结合来控制核糖体活性。这可以通过切割或结合到所述核糖体来实现。特别地,设想减少核糖体活性。这可用于体内或体外测定核糖体功能,也可作为体内或体外控制基于核糖体活性的疗法的手段。此外,设想在体内或体外系统中控制(即减少)蛋白质合成,这种控制包括抗生素,研究和诊断用途。

核糖开关

核糖开关(也称为辅酶)是与小分子结合的Messenger RNA分子的调控片段。这通常导致由mRNA编码的所述蛋白的产量发生变化。因此,因此设想通过使用本效应子蛋白与合适的引导结合到核糖开关靶标来控制核糖开关活性。这可以通过切割或绑定到核糖开关来实现。特别地,设想了核糖开关活性的降低。这可用于体内或体外测定核糖开关功能,也可用作体内或体外控制基于核糖开关活性的疗法的手段。此外,设想在体内或体外系统中控制 (即减少)蛋白质合成。对于rRNA的这种控制可能包括抗生素,研究和诊断用途。

核酶

核酶是具有催化性质的RNA分子,类似于酶(其当然是蛋白)。由于核酶是天然存在的和经过工程改造的,包含或由RNA组成,它们也可能被本RNA 结合效应子蛋白靶向。在一些实施方式中,所述效应子蛋白可为RNA-结合蛋白切割所述核酶,从而使其失效。因此,设想通过使用本效应子蛋白与合适的引导结合到核酶靶标上来控制核酶活性。这可能是通过切割或结合到核酶来实现的。特别地,设想减少核酶活性。这可用于体内或体外测定核酶功能,也可用作体内或体外控制基于核酶活性的疗法的手段。

RNA靶向应用

基因表达,包括RNA加工

所述效应子蛋白还可与合适的指南一起用于靶向基因表达,包括通过RNA加工的控制。对RNA加工的控制可能包括RNA加工反应,例如通过靶向RNApol进行RNA剪接(包括其他剪接);病毒复制(尤其是卫星病毒,噬菌体和逆转录病毒,例如HBV,HBC和HIV和本文所列出的其他)包括植物中的病毒体;和tRNA生物合成。所述效应子蛋白和适当的引导也可用于控制RNA激活(核糖核酸酶)。核糖核酸酶可促进基因表达,因此可通过破坏或减少核糖核酸来实现对基因表达的控制。酶和因此对基因表达的促进较少。

RNAi筛选

鉴定其基因敲除与表型变化有关的基因产物,可以通过RNAi筛选来询问生物学通路并鉴定其组成部分。也可以通过使用所述效应子蛋白和适当的引导来去除或降低筛选中RNAi的活性,从而对这些筛选进行控制,从而恢复(先前干扰的)基因产物的活性或减少干扰/压制)。

也可以治疗卫星RNA(satRNA)和卫星病毒。

本文中关于核糖核酸酶活性的控制通常是指减少,负面破坏或敲下或敲出。

体内RNA应用

基因表达的抑制

本文提供的靶标特异性RNA允许对靶标RNA进行非常特异性的切割。 RNA水平的干扰可以无创地在空间和时间上进行调节,因为基因组没有被修饰。

已经证明可以通过mRNA靶向治疗许多疾病。尽管这些研究大多数都与 siRNA的给药有关,但很显然,本文提供的RNA印迹效应子蛋白可以类似的方式应用。

mRNA靶标(以及相应的疾病治疗方法)包括VEGF,VEGF-R1和 RTP801(在AMD和/或DME治疗中),胱天蛋白酶2(在Naion治疗中), ADRB2(在眼压治疗中),TRPVI(在干眼症治疗中),Syk激酶(在哮喘治疗中),Apo B(在高胆固醇血症治疗中),PLK1,KSP和VEGF(在实体瘤治疗中),Ber-Abl(在CML治疗中)(Burnett和Rossi Chem Biol.2012,19(1): 60–71))。相似地,RNA靶向已被证明可有效治疗RNA病毒介导的疾病,例如HIV(靶向HIV Tet和Rev),RSV(靶向RSV核衣壳)和HCV(靶向 miR-122)(Burnett和Rossi Chem Biol.2012,19(1):60–71)。

可以设计特异性靶向转录的mRNA中包含突变或等位基因特异性序列的序列的引导RNA。这样的特异性敲低特别适用于与突变或等位基因特异性基因产物有关的疾病有关的治疗应用。例如,大多数家族性低血脂蛋白血症 (FHBL)是由所述APOB基因中的突变引起的。该基因编码载脂蛋白B蛋白的两个版本:一个短版本(ApoB-48)和一个较长版本(ApoB-100)。导致FHBL 的几个ApoB基因突变导致两个版本的ApoB异常短。用本发明的RNA靶向效应子蛋白特异性靶向和敲除突变的ApoB mRNA转录物可能对FHBL的治疗有益。另一个实例,亨廷顿舞蹈病(HD)是由亨廷顿蛋白编码基因中的CAG 三联体重复序列扩增引起的,从而导致蛋白质异常。用本发明的RNA靶向效应子蛋白特异性靶向和敲低编码Huntingtin蛋白的突变或等位基因特异性 mRNA转录物可能对HD治疗有益。

通过调节RNA功能来调节基因表达

除了通过切割mRNA对基因表达产生直接影响外,RNA靶向还可以用于影响细胞内RNA加工的特定方面,这可能允许对基因表达进行更细微的调节。一般而言,调节可以例如通过干扰蛋白与RNA的结合来介导,例如阻断蛋白的结合或募集RNA结合蛋白。确实,可以在不同水平确保调节,例如mRNA的剪接,转运,定位,翻译和翻转。类似地,在治疗方面,可以设想通过使用RNA特异性靶向分子来解决每个水平的(致病性)功能障碍。在这些实施方式中,在许多情况下,优选的是RNA剪切蛋白是“死的”CRISPR-Cas,其丧失了切割RNA靶标的能力但是保持了其与之结合的能力,例如本文所述的CRISPR-Cas的突变形式。

可变剪接

由于所述剪接,许多所述人基因表达了多种mRNA。已经显示出不同的疾病与异常剪接有关,导致表达基因的功能丧失或功能获得。尽管其中一些疾病是由引起剪接缺陷的突变引起的,但许多并非如此。一种治疗选择是直接靶向剪接机制。本文描述的RNA效应子蛋白可以例如用于剪切或促进切片,包括或排除外显子和影响特定同工型的表达和/或刺激替代的蛋白产物的表达。这样的应用将在下面更详细地描述。

靶RNA结合的RNA靶向效应子蛋白可以在空间上限制剪接因子进入 RNA序列。靶向剪接位点的RNA靶向效应子蛋白可以在该位点剪接,还可以将剪接重定向至相邻位点。例如RNA靶向效应子蛋白与5'剪接位点结合的结合可以阻碍剪接一些的U1组分的募集,从而有利于该外显子的跳过。或者,靶向剪接增强子或沉默子的RNA靶向效应子蛋白可以防止靶位点处的交易性调节剪接因子结合并有效阻碍或促进剪接。外显子排斥可以进一步通过如本文所述的RNA靶向效应子蛋白将ILF2/3募集到外显子附近的前体 mRNA上来实现。作为另一个实例,可以附着碱性甘氨酸的结构域用于招募 hnRNP A1和外显子排阻(Del Gatto-Konczak et al.Mol Cell Biol.1999 Jan;19(1):251-60)。

在某些实施方式中,通过gRNA的适当选择,具体剪接变异体可有针对性的,而其他的剪接变异体将无法定位。

RNA靶向效应子蛋白可以与能够稳定剪接调节性茎环以进一步剪接的效应子结合。RNA收缩效应子蛋白可以与特定剪接因子的共有结合位点序列连接,以将所述蛋白募集到靶DNA上。

与异常剪接相关的疾病的实例包括但不限于副肿瘤性视神经支配性肌阵挛共济失调(或POMA),这是由于失去了在突触中起作用的蛋白的调节剪接所引起的Nov蛋白的丧失,以及囊性纤维化,由囊性纤维化跨膜电导调节器的剪接不良引起的,导致产生无功能的氯离子通道。在其他疾病中,异常的RNA剪接会导致功能获得。例如在强直性肌营养不良中,这是由于 mRNA的3'UTR中CUG三联体重复扩增(从50到>1500次重复)引起的,从而导致剪接缺陷。

RNA靶向效应子蛋白可通过将剪接因子(例如U1)募集到所需外显子周围的5'剪切位点以促进切除内含子来用于包含外显子。可通过与富含精氨酸 /丝氨酸的结构域的融合来介导这样的募集,所述富含精氨酸/丝氨酸的结构域作为剪接激活子发挥作用(GravelyBR and Maniatis T,Mol Cell.1998 (5):765-71)。

前导RNA效应因子子蛋白可用于在所需基因座处限制剪接机制,从而防止外显子识别和另一种蛋白产物的表达。可以治疗的疾病的一个实例是 Duchenne肌营养不良症(DMD),它是由肌营养不良蛋白蛋白编码基因的突变引起的。几乎所有DMD突变都会导致移码,从而导致肌营养不良蛋白翻译受损。RNA标记效应子蛋白可以与剪接点或外显子剪接增强子(ESE)配对,从而阻止外显子识别,从而导致部分功能蛋白的翻译。这将使致命的Duchenne表型转化为不太严重的Becker表型。

RNA修饰

RNA编辑是一种自然过程,通过轻微修饰RNA,可以增加指定序列的基因产物的多样性。通常,修饰涉及腺苷(A)到肌苷(I)的转化,从而产生不同于基因组编码的RNA序列。通常通过ADAR酶确保RNA修饰,从而使 pre-RNA靶标通过包含要编辑的腺苷酸的外显子与内含子非编码元件之间的碱基配对,形成不完美的双链核酸分子RNA。A-I编辑的一个经典示例是谷氨酸受体GluR-B mRNA,该变化导致通道的电导特性发生了改变(Higuchi M, 等Cell.1993;75:1361–70)。

在人中,ADAR1基因中的杂合功能无效突变导致皮肤疾病,人色素性皮肤病(Miyamura Y,等Am J Hum Genet.2003;73:693–9)。可以设想,本发明的RNA靶向效应子蛋白可以用于纠正功能异常的RNA修饰。

聚腺苷酸化

mRNA的聚腺苷酸化对于核转运,mRNA的翻译效率和稳定性很重要,所有这些以及聚腺苷酸化的过程都取决于特定的RBP。大多数真核mRNA 在转录后会接受约200核苷酸的3'poly(A)尾巴。聚腺苷酸化涉及不同的RNA 结合蛋白复合物,它们刺激了聚(A)聚合酶的活性(Minvielle-Sebastia L等Curr Opin Cell Biol.1999;11:352–7)。可以设想,本文提供的靶向RNA的效应子蛋白可以用于干扰或促进RNA结合蛋白与RNA之间的相互作用。

与参与多腺苷酸化的缺陷蛋白有关的疾病实例是眼咽肌营养不良 (OPMD)(BraisB等,Nat Genet.1998;18:164–7)。

RNA输出

在mRNA前的加工后,mRNA从细胞核输出到细胞质。这是通过涉及载体复合物生成的细胞机制来确保的,该复合物然后通过核孔转运并释放细胞质中的mRNA,并随后循环利用载体。

已发现在RNA出口中起作用的蛋白(如TAP)的过度表达会增加在非洲爪蟾中无效出口的转录物的出口(Katahira J,等EMBO J.1999;18:2593–609)。

mRNA定位

mRNA定位可确保空间调节d蛋白的产生。在特定的实施方式中,可以设想本文所述的所述效应子蛋白可用于将定位元件靶向于所述靶标的RNA。可以设计所述效应子蛋白以结合靶转录物并将它们穿梭到所述细胞中由其肽信号标签决定的位置。更特别地,例如,与核定位信号(NLS)融合的RNA 靶向效应子蛋白可用于改变RNA定位。

定位信号的其他实例包括邮编结合蛋白(ZBP1),其确保β-肌动蛋白在几种不对称细胞类型中定位于细胞质,KDEL保留序列(定位于内质网),核输出信号(定位于细胞质),线粒体靶向信号(定位于线粒体),过氧化物酶体靶向信号(定位于过氧化物酶)和m6A标记/YTHDF2(定位于p抗体)。其他设想的方法是将RNA标记效应子蛋白与已知定位的蛋白融合(例如膜,突触)。

或者,根据本发明的所述效应子蛋白可以例如用于定位敲低。通过将所述效应子蛋白融合至合适的定位信号,将效应子靶向特定的细胞腔室。仅存在于该区室中的靶RNA将被有效地靶向,而否则存在于不同细胞区室中的相同靶标将不被靶向,从而可以建立依赖于定位的敲低。

翻译

本文所述的RNA靶向效应子蛋白可用于增强或抑制翻译。可以设想,上调翻译是控制蜂窝电路的非常可靠的方法。此外,对于功能性研究,蛋白质翻译筛选可能优于转录上调筛选,后者的缺点是转录上调不会转化为增加的蛋白产量。

设想本文所述的RNA靶向效应子蛋白可用于引入翻译起始因子,例如在感兴趣的信使RNA的5′非翻译重复序列(5′UTR)附近产生EIF4G以驱动翻译。(如在De Gregorio等,EMBO J.1999;18(17):4865-74中描述的关于不可重编程的RNA结合蛋白)。作为另一实例,细胞质聚(A)聚合酶GLD2 可通过RNA靶向效应子蛋白募集至靶mRNA。这将允许靶mRNA的定向聚腺苷酸化,从而刺激翻译。

类似地,本文设想的RNA靶向效应子蛋白可用于抑制mRNA的翻译阻遏物,例如ZBP1(Huttelmaier S,等Nature.2005;438:512–5)。通过与靶RNA 的翻译起始位点结合,可以直接影响翻译。

此外,将RNA靶向效应子蛋白与稳定mRNA的蛋白融合(例如通过阻止其通过例如核糖核酸酶抑制剂降解),可能可以增加的蛋白从所述感兴趣的转录物生成。

设想本文所述的RNA靶向效应子蛋白可通过结合在RNA转录物的 5'UTR区域中并用于阻止所述核糖体形成和开始翻译而用于抑制翻译。

进一步地,RNA干扰效应子蛋白可用于将CCR4–NOT死的烯基酶复合物的组分Caf1募集到靶RNAmRNA,从而导致死的烯基化或靶RNA转录物和蛋白翻译的抑制。

例如,本发明的RNA靶向效应子蛋白可用于增加或减少治疗相关蛋白的翻译。可以使用RNA表达效应子蛋白下调或上调翻译的治疗应用实例是肌萎缩性侧索硬化症(ALS)和心血管疾病。据报道,ALS运动皮层和脊髓中神经胶质谷氨酸转运蛋白EAAT2的水平降低,以及ALS脑组织中多个异常的EAAT2 mRNA转录物也有报道。EAAT2蛋白和功能的丧失被认为是ALS 兴奋性毒性的主要原因。EAAT2蛋白水平和功能的恢复可提供治疗益处。因此,如上所述,RNA阻断效应子蛋白可以有效地通过上调翻译抑制因子或稳定mRNA而上调EAAT2蛋白的表达。载脂蛋白A1是高密度脂蛋白(HDL) 的主要蛋白组分)和ApoA1和HDL通常被认为具有抗动脉粥样硬化作用。可以设想,如上所述,RNA阻断效应子蛋白可通过阻断翻译阻遏物或稳定 mRNA而有益地用于上调ApoA1的表达。

mRNA周转

翻译与mRNA更新和调节的mRNA稳定性紧密相关。已经描述了特定蛋白与转录物和tristetraprolin(TTP)的稳定性有关(例如神经元中的ELAV/Hu 蛋白,Keene JD,1999,Proc Natl Acad Sci U S A.96:5–7)。这些蛋白通过保护信息在细胞质中免受降解来稳定靶mRNA(Peng SS等,1988,EMBO J. 17:3461–70)。

可以设想,本发明的靶向RNA的效应子蛋白可用于干扰或促进作用以稳定mRNA转录物的蛋白活性,从而影响mRNA更新。例如,使用RNA靶向效应子蛋白将人TTP募集至所述靶RNA将允许富含腺苷酸-尿苷酸的元素 (富含AU的元素)介导的翻译抑制和靶降解。在许多mRNA的3'UTR中发现了富含AU的元素,这些元素编码原癌基因,核转录因子,细胞因子和促进 RNA的稳定性。作为另一实例,该RNA靶向效应子蛋白可以与HuR融合,HuR是另一种mRNA稳定蛋白(Hinman MN和Lou H,Cell Mol Life Sci 2008;65:3168-81),并将其募集至靶RNA转录物以延长其寿命或稳定短命的 mRNA。

进一步设想本文所述的RNA靶向效应子蛋白可用于促进降解靶RNA转录物。例如,可以将m6A甲基转移酶募集至靶标转录物以将该转录物定位于导致靶标降解的P-体。

作为又一个实例,如本文所述的RNA靶向效应子蛋白可以与非特异性核酸内切酶结构域PilTN末端(PIN)融合,以将其募集至靶转录物并允许其降解。

患有副肿瘤性神经系统疾病(PND)-相关性脑脊髓炎和神经病的患者是在中枢神经系统以外的肿瘤中产生针对Hu蛋白的自身抗体的患者(Szabo A 等1991,细胞.;67:325–33),其然后穿过血脑屏障。可以设想,本发明的靶向 RNA的效应子蛋白可以用于干扰自身抗体与mRNA转录物的结合。

P由营养不良性肌强直蛋白激酶(DMPK)基因3'UTR中的(CUG)n扩展引起的1型营养不良型患者(DM1)的特征是这种转录物在细胞核中的积累。设想本发明的RNA靶向效应子蛋白与靶向(CUG)n重复序列的核酸内切酶融合可以抑制这种异常转录物的积累。

与多功能蛋白的相互作用

一些RNA结合蛋白与多个RNA上的多个位点结合,从而在多种过程中发挥作用。例如,已发现hnRNP A1蛋白结合外显子剪接沉默子序列,拮抗剪接因子,与端粒末端缔合(从而刺激端粒活性),并结合miRNA以促进 Drosha介导的加工,从而影响成熟。设想本发明的RNA-结合效应子蛋白可以在一个或多个位置处干扰RNA-结合蛋白的结合。

RNA折叠

RNA采用确定的结构以执行其生物学活性。交替三级结构中构象的转变对大多数RNA介导的过程至关重要。但是,RNA折叠可能与几个问题有关。例如,RNA可能会折叠成不正确的替代构象,并被其坚持,和/或正确的三级结构可能在热力学上没有比替代的结构更受青睐。发明所述的死的RNA 转录蛋白)可用于直接折叠(m)RNA和/或捕获其正确的三级结构。

RNA-靶向效应子蛋白在调控细胞状态中的用途

在某种实现方式中,具有crRNA的复合物中的CRISPR-Cas与靶RNA 结合后被激活,随后切割附近的任何ssRNA靶(即“附带”或“旁观者”效应)。同源靶标,可以切割其他(非互补)RNA分子。这种混杂的RNA切割可能会引起细胞毒性,或其他影响细胞生理或细胞状态。

因此,在本文实施方式中,非天然存在的或工程化的组合物,载体系统,或递送系统用于或用于诱导细胞休眠。如本文所述的-天然存在的或工程化组合物,载体系统,或递送系统用于或用于诱导细胞周期停滞。在某些实施方式中,非天然存在的或工程化组合物,载体系统,或本文所述的递送系统用于或用于减少细胞生长和/或细胞增殖,在某些实施方式中,非天然存在的或工程化组合物,如本文所述在某些实施方式中,本文所述的非天然或工程化组合物,载体系统,或递送系统用于或用于诱导细胞无能。在某些实施方式中,本文所述的非天然存在的或工程化组合物,载体系统,或递送系统用于或用于诱导细胞坏死。如本文所述的非天然存在的或工程化组合物,载体系统,或递送系统用于或用于在某些实施方式中,本文所述的非天然存在的或工程化的组合物,载体系统或递送系统用于或用于诱发程序性细胞死亡。

在某些实施方式中,本发明涉及一种诱导细胞休眠的方法,包括引入或诱导本文所述的非天然存在的或工程化的组合物,载体系统或递送系统。本发明涉及一种诱导细胞周期停滞的方法,包括引入或诱导本文所述的非天然存在的或工程化的组合物,载体系统或递送系统。本发明所述的细胞生长和 /或细胞增殖的方法,包括引入或诱导非天然存在的或工程化组合物,载体系统或递送系统。在某些实施方式中,本发明涉及一种诱导细胞凋亡的方法,该方法包括引入或诱导非天然存在的或工程化的组合物。在某些实施方式中,本发明涉及一种诱导细胞坏死的方法,包括引入或诱导非天然存在。在某些实施方式中,本发明涉及一种诱导细胞死亡的方法,该方法包括引入或诱导非天然存在的或工程化组合物,载体系统。在某些实施方式中,本发明涉及一种诱导程序性细胞死亡的方法,包括引入或诱导本文所述的非天然存在的或工程化的组合物,载体系统或递送系统。

本文所述的方法和用途可以是治疗性或预防性和可复制的特定细胞,细胞(亚群)或细胞/组织类型。特别地,本文描述的方法和用途可以是治疗性或预防性和可切除的特定细胞,亚群,或表达一种或多种靶序列,例如一种或多种特定靶RNA(例如sss)的细胞/组织类型。不受限制地,靶细胞可以是表达特定转录物,例如指定类的神经元,引起例如自身免疫的免疫细胞或被特定(例如病毒)病原体感染的细胞等的癌症细胞。

因此,在某些实施方式中,本发明涉及一种以存在不良细胞(宿主细胞) 为特征的病理状态的方法,包括引入或诱导非天然存在的或工程化的组分,载体系统,或在某些实施方式中,本发明涉及使用本文所述的非天然或工程化组合物,载体系统或递送系统来治疗特征在于存在不良细胞的病理状况在某些实施方式中,本发明涉及本文所述的非天然存在的或工程化组合物,载体系统或递送系统,用于治疗特征在于存在不良细胞(宿主)的病理状况应当理解,优选地所述CRISPR-Cas系统靶向针对不良细胞的特异性靶。在某些实施方式中,本发明涉及使用非天然存在的或工程化的组合物,在某些实施方式中,本发明涉及本文所述的非天然存在的或工程化组合物,该载体系统,或递送系统用于治疗,预防或减轻癌症。用于治疗,预防或减轻癌症。在某些实施方式中,本发明涉及一种治疗,预防或减轻癌症的方法,包括引入或诱导本文所述的非天然存在的或工程化的组合物,载体系统或递送系统。应当理解,优选地所述CRISPR-Cas系统靶向癌症细胞特异的靶。在某些实施方式中,本发明与使用非天然存在的或工程化的组合物,载体系统有关。在某些实施方式中,本发明涉及本文所述的非天然存在的或工程化组合物,载体系统或递送系统。在某些实施方式中,本发明涉及一种用于治疗,预防或减轻病原体对细胞的感染的方法,包括引入或诱导非天然方法。如本文所述发生的或工程化的组分,载体系统,或交付系统。应当理解,优选地所述CRISPR-Cas系统的靶标是针对由病原体感染的细胞的特异性靶标(例如病原体衍生的靶标)。在某些实施方式中,本发明涉及非天然存在的或工程化组合物,载体系统,如本文所述用于治疗,预防或减轻自身免疫性疾病。在某些实施方式中,本发明涉及一种用于治疗,预防或减轻自身免疫性疾病的方法,包括引入或诱导非免疫性疾病。如本文所述的天然存在的或工程化组合物,载体系统,或递送系统。应当理解,优选地所述CRISPR-Cas系统靶向针对负责自身免疫疾病的细胞的特异性靶标(例如特异性免疫细胞)。

RNA-靶向效应子蛋白在RNA检测中的用途

进一步设想了RNA印迹效应子蛋白可以用于Northern印迹测定中。 Northern印迹涉及使用电泳按大小分离RNA样品。RNA标记效应子蛋白可用于特异性结合和检测所述靶RNA序列。

RNA靶向效应子蛋白可以与荧光蛋白(例如GFP)融合,并用于追踪活细胞中的RNA定位。更特别是,RNA靶向效应子蛋白可以不再被切割RNA 而失活。在特定实施方式中,设想可以使用分裂的RNA靶向效应子蛋白,其信号依赖于结合为了确保更精确的可视化,对这两个亚蛋白进行了分析。或者,可以使用分裂的荧光蛋白,当多个RNA靶向效应子蛋白复合物结合至靶转录物时,该分裂的荧光蛋白被重建。进一步设想,转录物靶向mRNA 上的多个结合位点,因此荧光信号可以放大真实信号,并可以用于病灶鉴定。作为另一种选择,可以将荧光蛋白重构组分裂内含蛋白。

RNA靶向效应子蛋白适用于确定RNA或特异性剪接变异体的定位, mRNA转录物的水平,转录物的上调或下调和疾病特异性诊断。用于通过荧光显微镜或流式细胞术(例如荧光激活细胞分选(FACS))对(活)细胞中的RNA 进行可视化,从而可以高通量筛选细胞并在细胞分选后回收活细胞。此外,可以在压力下同时评估不同转录物的表达水平,例如使用分子抑制剂或低氧条件对细胞的癌症生长抑制作用。另一个应用将是使用两个光子显微镜在神经刺激过程中跟踪转录物到突触连接的定位。

如本文所述,本发明所述的根据本发明的所述组分或复合物可以用于原位杂合的多重稳健误差荧光中,(MER鱼类;Chen等Science;2015; 348(6233)),例如用(荧光)标记的CRISPR-Cas效应子。

体外APEX标记

细胞过程取决于蛋白质,RNA和DNA之间的分子相互作用网络。准确检测蛋白-DNA和蛋白-RNA相互作用是了解此类过程的关键。体外接近标记技术采用了亲和标签和例如可光激活的探针相结合,以在体外标记靶RNA 蛋白质或RNA附近的多肽和RNA。紫外线照射后,可光激活基团与紧邻标记分子的蛋白质和其他分子发生反应,从而对其进行标记。随后可以回收和鉴定标记的相互作用分子。用于将探针靶向所选的RNA序列。

这些应用也可以在动物模型中用于疾病相关应用或难于培养的细胞类型的体内成像。

RNA-靶向效应子蛋白在RNA折纸/体外组装线中的用途–组合式 RNA折纸是指使用RNA作为集成模板创建二维或三维结构的纳米级折叠结构。折叠的结构被编码在RNA中,因此合成的RNA序列决定了所得RNA 的形状(Geary等,2014.Science,345(6198),pp.799-804)。RNA折纸可以用作将其他组分例如蛋白排列到复合物中的支架。本发明的RNA标记效应子蛋白可以例如使用合适的引导RNA用于将感兴趣的蛋白靶向RNA折纸。

这些应用也可以在动物模型中用于疾病相关应用或难于培养的细胞类型的体内成像。

RNA靶向效应子蛋白在RNA分离、纯化、富集或消耗中的用途

进一步设想当与RNA复合时,RNA包裹效应子蛋白可以用于分离和/ 或纯化RNA。RNA印迹效应子蛋白可以例如与亲和标签融合,该亲和标签可以用于分离和/或纯化。或纯化靶向效应子蛋白复合物的RNA-RNA。这样的应用对于分析细胞中的基因表达谱是有用的。

在特定实施方式中,可以设想RNA靶向效应子蛋白可用于靶向特定的非编码RNA(ncRNA),从而阻断其活性,从而提供有用的功能探针。如本文所述的蛋白可用于特异性富集特定RNA(包括但不限于增加稳定性等),或可替代性地特异性耗尽特定RNA(例如但不限于特定剪接变异体、同种型等)。

LINCRNA功能和其他核RNA的询问

当前的RNA敲低策略例如siRNA具有缺点,因为所述蛋白质机制是胞质的,所以它们主要限于靶向胞质的转录物。本发明的靶向效应子蛋白的 RNA的优点是对细胞功能不是必不可少的外源性系统,它可以用于细胞中的任何区室。通过将NLS信号融合到RNA附加效应子蛋白上,可以将其引导至细胞核,从而使核RNA成为靶标。例如,设想了探测lincRNA的功能。长的基因间非编码RNA(lincRNA)是一个尚未得到充分研究的领域。迄今为止,大多数lincRNA具有未知功能,可以使用本发明的RNA靶向效应子蛋白进行研究。

蛋白RNA结合蛋白的鉴定

鉴定与特定RNA结合的蛋白可能有助于理解许多RNA的作用。例如,许多lincRNA与转录和表观遗传调控因子结合,以控制转录。了解与指定的 lincRNA结合的蛋白可以帮助阐明组分的调控通路。可以设计本发明的RNA 靶向效应子蛋白以募集生物素连接酶至特定的转录物,以便用生物素标记局部结合的蛋白。然后可以将所述蛋白下拉并通过质谱分析以鉴定它们。

复合物在RNA和底物上的组装

发明的RNA靶向效应子蛋白可以进一步用于在RNA上组装复合物。这可以通过用多个相关蛋白(例如特定合成通路的组分)功能化RNA标记效应子蛋白来实现。或者,可以用这种不同的相关蛋白功能化多个靶向靶子蛋白的RNA,并靶向相同或相邻的靶标RNA。在RNA上组装复合物的有用应用是例如促进底物在蛋白质之间穿梭。

合成生物学

生物系统的开发具有广泛的用途,包括在临床应用中。设想可以使用本发明的可编程RNA靶向效应子蛋白融合以分裂毒性结构域的蛋白,以靶向细胞死亡,例如使用癌症连锁的RNA作为靶转录物。另外,在具有合成蛋白的生物系统中,涉及带有蛋白质-蛋白质相互作用的通路可以通过带有合适效应子(例如激酶或其他酶)的融合复合物来实现。

蛋白剪接:内含肽

蛋白剪切是翻译后的过程,在该过程中,称为内含肽的中间多肽催化其自身从被称为内蛋白的所说的裂开其的多肽中切下,并随后进行该内蛋白的连接。如本文所述在靶转录物上的两个或更多个RNA靶向效应子蛋白的组装可用于引导分裂内含肽的释放(Topilina和Mills Mob DNA.2014Feb 4;5(1):5),从而可以直接计算mRNA转录物的存在和随后释放的蛋白质产物,例如代谢酶或转录因子(用于下游激活转录通路)。该应用在合成生物学中可能具有重要意义(请参见上文))或大规模生物生产(仅在某些条件下生产产品)。

可诱导的、适量的和自我激活的系统

在一种实施方式中,将包含本发明的RNA靶向效应子蛋白和效应子组分的融合复合物设计为可诱导的,例如光诱导的或化学诱导的。这种诱导性允许在期望的时刻激活效应子组分。

通过设计融合复合物实现了光诱导性,其中将CRY2PHR/CIBN配对用于融合。该系统对于光诱导活细胞中蛋白质相互作用特别有用(Konermann S 等,Nature.2013;500:472–476)。

通过设计融合物,例如FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合)配对来提供化学诱导性。使用该系统雷帕霉素对于结合蛋白是必需的 (Zetsche等,NatBiotechnol.2015;33(2):139-42本系统关于Cas9的用途)。

进一步地,当以DNA形式引入所述细胞时,本发明的RNA表达效应子蛋白可以通过可诱导的启动子来调节,例如四环素或强力霉素控制的转录激活(Tet-On和Tet-Off表达系统),激素诱导基因表达系统例如蜕皮激素诱导的基因表达系统和阿拉伯糖诱导的基因表达系统。当以RNA的形式传递时,可以通过核糖开关调节RNA嵌入效应子蛋白的表达,它可以感应像四环素这样的小分子(如在Goldfless等,Nucleic Acids Res.2012;40(9):e64中描述地)。

在一个实施方式中,可以调节本发明的RNA表达效应子蛋白的所述递送以改变细胞中蛋白或crRNA的量,从而改变所需作用或任何不期望的脱靶效应的大小。

在一个实施方式中,可以将本文所述的RNA靶向效应子蛋白设计为自灭活的。当作为RNA传递到细胞时,mRNA或作为复制RNA治疗剂 (Wrobleska等,NatBiotechnol.2015Aug;33(8):839–841),它们可以通过破坏自身的RNA来使表达及其后续作用失活,从而减少驻留和潜在的不良影响。

对于本文所述的RNA靶向效应子蛋白的进一步体内应用,参考Mackay JP等(NatStruct Mol Biol.2011Mar;18(3):256-61),Nelles等(Bioessays.2015 Jul;37(7):732-9)和Abil Z和Zhao H(Mol Biosyst.2015Oct;11(10):2658-65),其通过引用并入本文。尤其是,通过使用催化失活的CRISPR-Cas:增强翻译(例如CRISPR-Cas–翻译促进因子融合(例如)eIF4融合));抑制翻译(例如gRNA 靶向核糖体结合位点);外显子跳跃(例如gRNA靶向剪接供体和/或受体位点);外显子包涵(例如靶向特定外显子剪接供体的gRNA和/或受体位点至将其包括在内或将CRISPR-Cas融合至或招募剪接一些组分(例如U1 snRNA);访问RNA定位(例如CRISPR-Cas标记融合(例如EGFP融合));改变RNA 定位(例如CRISPR-Cas定位信号融合)(例如NLS或NES融合物);RNA降解(在这种情况下,如果依靠CRISPR-Cas的活性,则不使用催化失活的 CRISPR-Cas,或者为了增加数量,可以使用分裂的CRISPR-Cas)使用);抑制非编码RNA功能(例如miRNA),例如通过gRNA与功能位点的降解或结合(可能通过CRISPR-Cas-信号序列融合重新定位在特定的位点滴定)。

如本文之前和实施例中所述,CRISPR-Cas功能对于crRNA的5'或3'延伸和crRNA环的延伸具有鲁棒性。因此,设想可以将MS2环和其他募集结构域添加至crRNA,而不会影响复合物的形成和与靶转录物的结合。对 crRNA的此类修饰以募集各种效应子结构域可适用于上述RNA靶向的效应子蛋白的用途。

CRISPR-Cas能够介导对RNA噬菌体的抗性。因此,设想CRISPR-Cas 可用于针对仅RNA的病原体免疫例如动物,人和植物,包括但不限于埃博拉病毒和寨卡病毒。

在某些实施方式中,CRISPR-Cas可以加工(切割)自己的阵列。这适用于野生型CRISPR-Cas蛋白和包含一个或多个本文所述的突变的氨基酸残基的突变的CRISPR-Cas蛋白。因此,可以设想为不同的靶转录物和/或应用设计的多个crRNA可以作为一个启动子驱动的作为pre-crRNA或as转录物的形式来递送。这种递送方法的优点在于,其在病毒系统中实质上更紧凑,更容易合成和易于递送。应当理解,对于本文的CRISPR-Cas的直系同源物,确切的氨基酸位置可以变化,如本领域已知的和如本文其他地方所述,可以通过蛋白比对来适当地确定。本发明的方面还包括本文所述的组合物和系统在基因组工程中的方法和用途,例如用于改变或操纵一个或多个基因或所述一个或多个基因种子在原核或真核细胞中的体外、体内或离体的表达。

一方面,本发明提供了用于调节例如减少靶RNA在细胞中的表达的方法和组合物。在主题方法中,提供了本发明的CRISPR-Cas系统,其干扰RNA 的转录,稳定性和/或翻译。

在某些实施方式中,有效量的CRISPR-Cas系统用于切割RNA或以其他方式抑制RNA表达。在这方面,该系统具有与siRNA和shRNA相似的用途,因此也可以替代此类方法。该方法包括但不限于使用CRISPR-Cas系统替代例如干扰核糖核酸(例如siRNA或shRNA)或其转录模板例如编码shRNA的 DNA。CRISPR-Cas系统例如通过被施用于包括靶细胞的哺乳动物而被引入靶细胞。

有利地,本发明的CRISPR-Cas系统是特异性的。例如,尽管干扰核糖核酸(例如siRNA或shRNA)多核苷酸系统受到设计和稳定性问题以及脱靶结合的困扰,但是可以高特异性地设计本发明的CRISPR-Cas系统。

在本发明的一个方面,本申请的也称为RNA或RNA靶向CRISPR系统的新型RNA靶向系统,其基于本文确定的CRISPR-Cas蛋白,且不需要生成定制蛋白即可靶向特异性RNA。RNA分子可对单个序列进行序列化,而单个酶则可识别特定的RNA靶标,换句话说,可使用所述RNA分子将该酶募集至特定的RNA靶标。

在一些实施方式中,核酸靶向系统的一个或多个元件衍生自包含内源性 CRISPRRNA靶向系统的特定生物。在某些实施方式中,在Eubacterium和 Ruminococcus中发现了CRISPR RNA靶向系统。在某些实施方式中,效应子蛋白包含靶向的和附带的ssRNA切割活性。在某些实施方式中,效应子蛋白包含双重HEPN结构域。在某些实施方式中,效应子蛋白缺乏Cas13a 的Helical-1结构域的对应物。在某些实施方式中,效应子蛋白小于先前表征的2类CRISPR效应子,中值大小为928aa。该中值大小比Cas13c小190 aa(17%),比Cas13b小200aa(18%),比Cas13a小300aa(26%)。在某些实施方式中,效应子蛋白不需要侧翼序列(例如PFS、PAM)。

在某些实施方式中,效应子蛋白基因座结构包括含有WYL结构域的辅助蛋白(因此在这些结构域的最初鉴定的组中保守的三个氨基酸之后表示;参见例如WYL结构域IPR026881)。在某些实施方式中,WYL结构域辅助蛋白包含至少一个螺旋-转-螺旋(HTH)或带-螺旋-螺旋(RHH)DNA结合结构域。在某些实施方式中,含有WYL结构域的辅助蛋白增加了靶向RNA的效应子蛋白的靶向ssRNA和附带的ssRNA切割活性。在某些实施方式中,含有WYL结构域的辅助蛋白包含N-末端RHH结构域,以及主要疏水的保守残基的模式,包括对应于原始WYL基序的不变的酪氨酸-亮氨酸双峰。在某些实施方式中,含有WYL结构域的辅助蛋白是WYL1。WYL1是主要与Ruminococcus 相关的单个WYL域蛋白。

在其他示例实施方式中,靶向VI型RNA的Cas酶是Cas 13d。在某些实施方式中,Cas13d是西非杆菌(Eubacterium siraeum)DSM 15702(EsCas13d) 或鲁米诺球菌(Ruminococcus sp.)。N15.MGS-57(RspCas13d)(参见例如Yan等, Cas13d Is a CompactRNA-Targeting Type VI CRISPR Effector Positively Modulated by a WYL-Domain-Containing Accessory Protein,Molecular Cell (2018),doi.org/10.1016/j.molcel.2018.02.028)。RspCas13d和EsCas13d没有侧翼序列要求(例如PFS、PAM)。

CRISPR-CAS蛋白在优化功能RNA靶向系统中的应用

在一方面,本发明提供了用于将功能组分特定递送至RNA环境的系统。可以使用本发明所述的包含RNA片段效应子蛋白的CRISPR系统来确保这一点,所述CRISPR系统允许将不同组分特异性靶向RNA。更特别地,此类组分包括RNA翻译,降解等的激活剂或阻遏物,例如激活剂或阻遏物。该系统的应用在本文其他地方描述。

根据一个方面,本发明提供了一种非天然存在的或工程改造的组合物,其包含引导RNA,所述引导RNA包含能够与细胞中目的基因组位点中的靶序列杂交的引导序列,其中通过插入一个RNA来修饰所述引导RNA。或更多结合衔接蛋白的独特RNA序列。在特定实施方式中,RNA序列可以结合两个或更多个衔接蛋白(例如适体),并且其中每个衔接蛋白与一个或多个功能域结合。已显示本文所述的CRISPR-Cas酶的引导RNA适合于引导序列的修饰。在特定实施方式中,通过在正向重复序列的3'内或正向重复序列的3' 中插入正向重复序列的不同RNA序列5'来修饰引导RNA。当存在一个以上的功能域时,这些功能域可以相同或不同,例如,相同或两个不同的激活剂或阻遏物中的两个。一方面,本发明提供了本文讨论的组合物,其中所述一个或多个功能结构域连接至RNA靶向酶,从而在与靶RNA结合后,功能结构域处于空间取向,从而允许功能结构域在其中起作用。其归因功能;一方面,本发明提供了本文讨论的组合物,其中所述组合物包含具有至少三个功能域的CRISPR-Cas复合物,其中至少一个与RNA靶向酶缔合,并且其中至少两个与gRNA缔合。

因此,一方面,本发明提供了非天然存在的或工程改造的CRISPR-Cas 复合物组合物,其包含本文讨论的引导RNA和作为RNA靶向酶的 CRISPR-Cas,其中任选地,RNA靶向酶包含至少一种突变。从而使RNA靶向酶具有不具有至少一种突变的酶的核酸酶活性的不超过5%,并且任选地具有至少一种或多种核定位序列的一种或多种。在特定的实施方式中,引导 RNA被额外地或替代地被修饰,以仍然确保RNA靶向酶的结合,但是防止被RNA靶向酶切割(如本文其他地方所详述)。

在特定实施方式中,RNA靶向酶是CRISPR-Cas蛋白,与不具有至少一种突变的CRISPR-Cas酶相比,其核酸酶活性降低了至少97%或100%。在一个方面,本发明提供了本文讨论的组合物,其中CRISPR-Cas酶包含两个或多个如本文另外讨论的突变。

在特定的实施方式中,如上所述提供了RNA靶向系统,其包含两个或更多个功能域。在特定实施方式中,两个或更多个功能域是异源功能域。在特定实施方式中,系统包含衔接蛋白,其是包含功能性结构域的融合蛋白,该融合蛋白任选地包含衔接蛋白和功能性结构域之间的接头。在特定实施例中,接头包括GlySer接头。另外地或可替代地,一个或多个功能域通过接头,任选地为GlySer接头,与RNA效应子蛋白连接。在特定的实施方式中,一个或多个功能结构域通过一个或两个HEPN结构域连接至RNA靶向酶。

在一方面,本发明提供了本文讨论的组合物,其中与衔接蛋白或RNA 靶向酶相关的一个或多个功能域是能够激活或抑制RNA翻译的域。一方面,本发明提供了本文讨论的组合物,其中与衔接蛋白相关的一个或多个功能域中的至少一个具有一种或多种活性,包括甲基化酶活性,脱甲基酶活性,转录激活活性,转录抑制活性,转录释放。因子活性,组蛋白修饰活性,DNA 整合活性RNA切割活性,DNA切割活性或核酸结合活性,或分子开关活性或化学诱导性或光诱导性。

在一方面,本发明提供了本文讨论的组合物,其包含适配体序列。在特定实施方式中,所述适配体序列是对相同接头蛋白具有特异性的两个或多个适配体序列。在一方面,本发明提供了本文所讨论的组合物,其中所述适配体序列是对不同接头蛋白具有特异性的两个或多个适配体序列。在一方面,本发明提供了本文所讨论的组合物,其中所述接头蛋白包含MS2、PP7、Qβ、 F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、 TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。因此,在特定实施方式中,所述适配体选自特异性结合上文所列的接头蛋白中任一个的结合蛋白。在一方面,本发明提供了本文所讨论的组合物,其中所述细胞是真核细胞。在一方面,本发明提供了本文所讨论的组合物,其中所述真核细胞是哺乳动物细胞、植物细胞或酵母细胞,其中所述哺乳动物细胞任选地是小鼠细胞。在一方面,本发明提供了本文所讨论的组合物,其中所述哺乳动物细胞是人细胞。

在一方面,本发明提供了本文上文所讨论的组合物,其中有多于一个的引导RNA或gRNA或crRNA,且这些靶向不同序列,其中当使用所述组合物时,有多重复用。在一方面,本发明提供了组合物,其中有多于一个的通过插入与一个或多个接头蛋白结合的不同RNA序列而修饰的引导RNA或 gRNA或crRNA。

在一方面,本发明提供了本文所讨论的组合物其中与一个或多个功能结构域相关联的一个或多个接头蛋白存在且与插入所述RNA中的所述不同 RNA序列结合。

在一方面,本发明提供了本文所讨论的组合物其中所述引导RNA被修饰为具有至少一个非编码的功能环;例如,其中所述至少一个非编码的功能环是抑制性的;例如,其中至少一个非编码的功能环包含Alu。

在一方面,本发明提供了用于修饰基因表达的方法,其包括向宿主的施用或如本文所讨论的组合物中的一个或多个在宿主体内的表达。

在一方面,本发明提供了本文讨论的方法,其包括所述组合物或编码其的核酸分子的递送,其中所述核酸分子与调节序列可操作地连接且在体内表达。在一方面,本发明提供了本文讨论的方法,其中通过慢病毒、腺病毒或AAV进行所述体内表达。

在一方面,本发明提供了本文讨论的细胞的哺乳动物细胞系细胞,其中所述细胞系任选地是人细胞系或小鼠细胞系。在一方面,本发明提供了转基因哺乳动物模型,任选地大鼠,其中所述模型已用本文所讨论的组合物转化或是所述转化体的后代。

在一方面,本发明提供了编码引导RNA或RNA靶向CRISPR-Cas复合物或如本文讨论的组合物的核酸分子。在一方面,本发明提供了载体,其包含:编码引导RNA(gRNA)或crRNA的核酸分子,其包含能够与细胞中的RNA 靶序列杂合的引导序列,其中通过插入与两个或更多个接头蛋白结合的不同 RNA序列来修饰所述gRNA或crRNA的正向重复,且其中每个接头蛋白与一个或多个功能结构域相关联;或者,其中所述gRNA被修饰为具有至少一个非编码的功能环。在一方面,本发明提供了包含编码以下物质的核酸分子的载体:非自然存在的或工程化CRISPR-Cas复合物组合物,所述 CRISPR-Cas复合物组合物包含本文讨论的gRNA或crRNA,和RNA靶向酶,其中任选地,RNA靶向酶包含至少一个突变,从而RNA靶向酶具有少于5%的RNA靶向酶的核酸酶活性,所述RNA靶向酶不具有所述至少一个突变和任选地一包含至少一个或多个核定位序列。在一方面,载体可进一步包含可在真核细胞中运作的调节元素,所述调节元素与编码所述引导RNA(gRNA) 或crRNA的核酸分子以及编码RNA靶向酶和/或所述任选的核定位序列的核酸分子可操作地连接。

在一个方面,本发明提供了试剂盒,所述试剂盒包含本文所述的组分中的一个或多个。在一些实施方式中,所述试剂盒包含如本文所述的载体系统和关于使用所述试剂盒的说明书。

在一个方面,本发明提供了一种筛选功能获得(GOF)或功能丧失(LOF) 或筛选非编码RNA或潜在调控区(例如增强子,阻遏子)的方法,所述方法包含本文所述的细胞系。本文讨论的模型细胞或含有或表达RNA靶向酶的本文所述细胞或将本文讨论的组合物引入细胞系或模型细胞,其中gRNA或 crRNA包含激活剂或阻遏物,并监测GOF或关于引入的gRNA或crRNA 包括激活子的那些细胞的LOF,或者关于引入的gRNA或crRNA包括阻抑子的那些细胞的LOF。

在一个方面,本发明提供了非天然存在的或工程化的组合物的文库,每个组合物包含靶向CRISPR引导RNA(gRNA)或crRNA的RNA,所述RNA 包含能够与细胞中目的靶RNA序列杂交的引导序列,RNA靶向酶,其中所述RNA靶向酶包含至少一种突变,使得所述RNA靶向酶具有不具有所述至少一种突变的RNA靶向酶的核酸酶活性的不超过5%,其中所述gRNA或crRNA被修饰通过插入与一种或多种衔接蛋白结合的不同RNA序列,并且其中衔接蛋白与一个或多个功能域结合,其中所述组合物包含一种或多种或两种或更多种衔接蛋白,其中每个蛋白质与一个或多个功能域结合,并且其中gRNA或crRNA包括全基因组文库,其包含多个靶向RNA的导向 RNA(gRNA)或crRNA。一方面,本发明提供了本文所讨论的文库,其中与不具有至少一种突变的RNA靶向酶相比,靶向RNA的RNA靶向酶的核酸酶活性降低了至少97%或100%。一方面,本发明提供了本文所讨论的文库,其中衔接蛋白是包含功能性结构域的融合蛋白。在一个方面,本发明提供了如本文所讨论的文库,其中通过插入与一个或两个或多个衔接蛋白结合的不同RNA序列,不修饰gRNA或crRNA。在一方面,本发明提供了如本文所讨论的文库,其中一个或两个或更多个功能域与RNA靶向酶相关。一方面,本发明提供了如本文所讨论的文库,其中细胞的细胞群是真核细胞群。一方面,本发明提供了本文所讨论的文库,其中所述真核细胞是哺乳动物细胞,植物细胞或酵母细胞。在一方面,本发明提供了如本文所讨论的文库,其中哺乳动物细胞是人细胞。在一个方面,本发明提供了如本文所讨论的文库,其中细胞群是胚胎干(ES)细胞群。

在一方面,本发明提供了如本文所讨论的文库,其中靶向是约100个或更多个RNA序列。在一方面,本发明提供了如本文所讨论的文库,其中靶向是约1000个或更多个RNA序列。在一个方面,本发明提供了如本文所讨论的文库,其中靶向是约20,000或更多个序列。在一方面,本发明提供了如本文所讨论的文库,其中靶向是整个转录组的。在一个方面,本发明提供了如本文所讨论的文库,其中所述靶向是针对相关或期望通路的一组靶序列。一方面,本发明提供了如本文所述的文库,其中所述通路是免疫通路。在一方面,本发明提供了如本文所讨论的文库,其中所述通路是细胞分裂通路。

一方面,本发明提供了一种产生包含具有修饰的表达的基因的模型真核细胞的方法。在一些实施方式中,疾病基因是与患病或发展疾病的风险增加相关的任何基因。在一些实施方式中,该方法包括(a)将编码本文上文所述系统的组分的一种或多种载体引入真核细胞,和(b)使CRISPR复合物结合至靶多核苷酸,从而修饰a的表达。基因,从而产生包含修饰的基因表达的模型真核细胞。

本文提供的结构信息允许询问引导RNA或crRNA与靶RNA和RNA靶向酶的相互作用,从而允许工程化或改变引导RNA结构以优化整个靶向 RNA的CRISPR-Cas系统的功能。例如,可以通过插入可以结合RNA的衔接蛋白来扩展引导RNA或crRNA,而不会与RNA靶向蛋白发生冲突。这些衔接蛋白可以进一步募集包含一个或多个功能域的效应子蛋白或融合蛋白。

本发明的一个方面是上述元素包含在单一组合物中或包含在单独的组合物中。这些组合物可有利地应用于宿主以在基因组水平上引发功能作用。

技术人员将理解,对引导RNA或crRNA的修饰允许结合衔接子+功能域,但不能正确定位衔接子+功能域(例如由于CRISPR-Cas复合物的三维结构内的空间位阻))是无意的修改。一个或多个修饰的引导RNA或crRNA可以通过在引导序列的正向重复或3'内引入正向重复的5'的不同RNA序列来修饰。

修饰的引导RNA或crRNA,灭活的RNA靶向酶(具有或不具有功能域) 和具有一个或多个功能域的结合蛋白可各自单独地包含在组合物中并单独或共同地施用于宿主。或者,这些组分可以以单一组合物的形式提供给宿主。可以通过本领域技术人员已知或本文描述的用于递送至宿主的病毒载体(例如慢病毒载体,腺病毒载体,AAV载体)进行对宿主的施用。如本文所述,使用不同的选择标记(例如用于慢病毒gRNA或crRNA选择)和gRNA或 crRNA的浓度(例如取决于是否使用多个gRNA或crRNA)可能有利于引起改善的效果。

使用提供的组合物,本领域技术人员可以有利地和特异性地靶向具有相同或不同功能域的单个或多个基因座,以引发一个或多个基因组事件。所述组合物可以以多种方法用于在细胞中的文库中筛选和体内功能建模(例如 lincRNA的基因激活和功能鉴定;功能获得建模;功能丧失建模;用途)。本发明的组合物以建立用于优化和筛选目的的细胞系和转基因动物。

本发明包括本发明的组合物用于建立和利用条件或诱导型CRISPR-Cas RNA靶向事件的用途。(参见例如Platt等,细胞(2014), dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的PCT专利公布,例如 WO 2014/093622(PCT/US2013/074667),其不被认为是先于本发明或申请)。

功能效应子的递送

RISPR-Cas13敲低允许通过使用人工转录因子来暂时减少基因表达,例如,通过突变Cas13蛋白质裂解结构域中的残基导致产生催化失活的Cas13 蛋白质。具有催化活性的Cas13与引导RNA或crRNA形成复合物,并位于由引导RNA或crRNA的靶向域指定的RNA序列上,但是,它不能切割靶标。失活的Cas13蛋白与效应子结构域,例如转录抑制结构域的融合使得能够将效应子募集到由引导RNA指定的任何位点。

优化的功能RNA靶向系统

因此,一方面,本发明提供了用于将功能性组分特异性递送至RNA环境的系统。可以使用包含本发明的RNA靶向效应子蛋白的CRISPR系统确保这一点,所述CRISPR靶向蛋白允许将不同组分特异性靶向RNA。更具体地,此类组分包括激活剂或阻遏物,例如RNA翻译,降解等的激活剂或阻遏物。

根据一个方面,本发明提供了一种非天然存在的或工程改造的组合物,其包含引导RNA或crRNA,所述引导RNA或crRNA包含能够与细胞中的靶RNA靶序列杂交的引导序列,其中通过插入一个RNA来修饰所述引导 RNA或crRNA。或更多结合衔接蛋白的独特RNA序列。在特定实施方式中, RNA序列可以结合两个或更多个衔接蛋白(例如适体),并且其中每个衔接蛋白与一个或多个功能域结合。当存在一个以上的功能域时,这些功能域可以相同或不同,例如,相同或两个不同的激活剂或阻遏物中的两个。一方面,本发明提供了本文讨论的组合物,其中所述一个或多个功能结构域连接至 RNA靶向酶,从而在与靶RNA结合后,功能结构域处于空间取向,从而允许功能结构域在其中起作用。其归因功能;一方面,本发明提供了本文讨论的组合物,其中所述组合物包含具有至少三个功能域的CRISPR-Cas13复合物,其中至少一个与RNA靶向酶相关联,并且至少两个与gRNA或crRNA 相关联。gRNA或crRNA。

RNA靶向技术在植物和酵母中的应用

定义:

一般而言,术语“植物”涉及植物界的任何各种光合作用,真核,单细胞或多细胞生物,其特征在于通过细胞分裂而生长,含有叶绿体并且具有由纤维素组成的细胞壁。术语植物包括单子叶植物和双子叶植物。具体而言,所述植物旨在包括但不限于被子植物和裸子植物,例如阿拉伯树胶、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆、甜菜、桦木、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、栗子、樱桃、大白菜、柑橘、柑桔、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、花生、樱桃木、铁杉、山核桃、羽衣甘蓝、奇异果、大头菜、落叶松、生菜、韭菜、柠檬、石灰、蝗虫、松树、女仆、玉米、芒果、枫、瓜、小米、蘑菇、芥末、坚果、橡木、燕麦、油棕、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕榈、欧芹、欧洲防风草、豌豆、桃子、花生、梨、泥煤、胡椒、柿子、木豆、松树、菠萝、车前草、李子、石榴、马铃薯、南瓜、拉迪基奥、萝卜、油菜籽、覆盆子、米饭、黑麦、高粱、红花、蜡黄、大豆、菠菜、云杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树木、小黑麦、草皮草、萝卜、藤蔓、核桃、豆瓣菜、西瓜、小麦、山药、紫杉和西葫芦。术语植物还包括藻类,藻类主要是光合自养生物,主要由于缺乏根,叶和其他代表高等植物的器官而统一。

使用本文所述的使用RNA靶向系统调节基因表达的方法可用于在基本上任何植物上赋予期望的性状。使用本公开内容的核酸构建体和上述各种转化方法,可以针对本文所述的所需生理和农艺学特性对各种各样的植物和植物细胞系统进行工程改造。在优选的实施方式中,用于工程化的靶植物和植物细胞包括但不限于那些单子叶和双子叶植物,例如包括谷类作物(例如小麦、玉米、水稻、小米、大麦)的作物,水果作物(例如番茄,苹果,梨,草莓,橙子,牧草作物(例如苜蓿),块根蔬菜作物(例如胡萝卜、马铃薯、甜菜、山药),叶类蔬菜作物(例如生菜、菠菜);开花植物(例如矮牵牛、玫瑰、菊花),针叶树和松树(例如松木、云杉);用于植物修复的植物(例如重金属积累植物);油料作物(例如向日葵、油菜籽)和用于实验目的的植物(例如拟南芥)。因此,所述方法和CRISPR-Cas系统可以在广泛的植物中使用,例如用于属于以下目的双子叶植物:木兰目、八角目、樟目、胡椒目、马兜铃目、睡莲目、毛茛目、罂粟目、瓶子草科、昆栏树目、金缕梅目、Eucomiales、塞子木目、杨梅目、山毛榉目、木麻黄目、石竹目、肉穗果目、蓼目、蓝雪目、五桠果目、山茶目、锦葵目、荨麻目、玉蕊目、紫堇目、杨柳目、白花菜目、杜鹃花目、岩梅目、柿树目、报春花目、蔷薇目、豆目、川苔草目、小二仙草目、桃金娘目、山茱萸目、山龙眼目、檀香目、大花草目、卫矛目、大戟目、鼠李目、无患子目、胡桃目、牻牛儿苗目、远志目、伞形目、龙胆目、花葱目、唇形目、车前目、玄参目、桔梗目、茜草目、川续断目和菊目。所述方法和 CRISPR-Cas系统可以与单子叶植物一起使用,例如属于目泽泻目、水鳖目、茨藻目、霉草目、鸭跖草目、谷精草目、帚灯草目、禾本目、灯心草目、莎草目、香蒲目、凤梨目、姜目、槟榔目、环花目、露兜树目、天南星目、合目和兰目的植物;或可与属于裸子植物的植物一起使用,例如属于目松柏目、银杏目、苏铁目、南洋杉目、柏目和买麻藤目的那些。

本文所述的靶向RNA的CRISPR系统和使用方法可在以下双子叶植物,单子叶植物或裸子植物属的非限制性列表中广泛使用的植物物种中:颠茄属、油丹属、漆树科、花生属、琼楠属、芸苔属、红花、球果、巴豆、黄瓜、柑桔、柑桔、辣椒、长春花、科科斯、咖啡、南瓜、胡萝卜、杜鹃花属、花菱草属、榕属、草莓、海罂粟属、甘氨酸、棉酚、向日葵、橡胶树、轻海豚草、番茄属、羽扇豆、玛尼霍特、马约拉那、马卢斯、紫花苜蓿、烟草、烟叶、银胶菊属、罂粟、鳄梨属、菜豆、黄连木、豌豆属、梨属、李属、萝卜属、蓖麻属、千里光属、风龙属、千金藤属、白芥属、茄属、可可属、车轴草属、胡卢巴属、野豌豆、长春花、Vilis和豇豆属;和属葱属、须芒草属、Aragrostis、芦笋、燕麦属、狗牙根属、油棕属、羊茅属、羊茅黑麦草属、 Heterocallis、大麦属、浮萍属、黑麦草、穆萨、稻属、黍属、狼尾草属、梯牧草属、早熟禾属、黑麦属、高粱、小麦属、玉蜀黍属、冷杉属、杉木属、麻黄属、云杉属、松属和黄杉属。

RNA靶向CRISPR系统和使用方法也可以在广泛的“藻类”或“藻类细胞”中使用;包括例如选自几种真核门的藻类,包括红藻门(红藻)、绿藻门(绿藻)、褐藻门(褐藻)、硅藻门(硅藻)、真眼点藻门和鞭毛藻门以及原核门蓝藻门(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属、鱼腥藻属、纤维藻属、葡萄藻属、角毛藻属、衣藻属、小球藻属、绿球藻属、小环藻属、细柱藻属、杜氏藻属、球石藻属、裸藻属、红球藻属、等鞭金藻属、单鞭金藻属、单壳缝藻属、微球藻属、微拟球藻属、舟形藻属、肾鞭藻属、肾爿藻属、菱形藻属、节球藻属、念珠藻属、Oochromonas、卵囊藻属、Oscillartoria、巴夫藻属、三角褐指藻属、扁藻属、颗石藻属、紫菜、假鱼腥藻属、塔胞藻属、裂丝藻属、聚球藻属、集胞藻属、四爿藻属、海链藻属和束毛藻属。

可以根据本发明的方法处理植物的一部分,即“植物组织”,以产生改良的植物。植物组织也包括植物细胞。如本文所用,术语“植物细胞”是指完整植物的完整单位或在体外组织培养中,培养基或琼脂上,悬浮于生长培养基或缓冲液或作为较高组织单位的一部分,例如植物组织,植物器官或整株植物。

“原生质体”是指通过使用例如机械或酶促方法已完全或部分去除了保护性细胞壁的植物细胞,从而形成了完整的生物体生化主管单元,可以重整其细胞壁,使其增殖并再生生长。在适当的生长条件下变成完整的植物。

术语“转化(transformation)”广义上是指通过农杆菌或多种化学或物理方法之一通过引入DNA对植物宿主进行遗传修饰的过程。如本文所用,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官或后代。可以转化许多合适的植物组织或植物细胞,包括但不限于原生质体、体细胞胚、花粉、叶片、幼苗、茎、愈伤组织、匍匐枝、微块茎和芽。植物组织还指这样的植物、种子、后代、繁殖体的任何克隆(论是有性或无性繁殖的)以及任何这些植物的后代,例如插条或种子。

如本文所用,术语“转化的”是指已向其中引入外源DNA分子例如构建体的细胞、组织、器官或生物。可以将引入的DNA分子整合到受体细胞、组织、器官或生物体的基因组DNA中,从而使引入的DNA分子被传递至随后的后代。在这些实施方式中,“转化的”或“转基因的”细胞或植物还可以包括该细胞或植物的后代,以及从育种程序产生的后代,该育种程序采用这种转化的植物作为亲本在杂交中并表现出由其产生的改变的表型。引入的DNA 分子的存在。优选地,转基因植物是可育的并且能够通过有性繁殖将引入的 DNA传递至后代。

术语“后代”,例如转基因植物的后代,是由该植物或该转基因植物的出生,生于或衍生自该植物或该转基因植物的后代。引入的DNA分子也可以被瞬时引入受体细胞中,使得引入的DNA分子不会被随后的后代遗传,因此不被认为是“转基因的”。因此,如本文所用,“非转基因”植物或植物细胞是不包含稳定整合到其基因组中的外源DNA的植物。

如本文所用,术语“植物启动子”是能够启动植物细胞中的转录的启动子,而不管其起源是否是植物细胞。示例性的合适的植物启动子包括但不限于从植物,植物病毒以及包含在植物细胞中表达的基因的细菌如农杆菌或根瘤菌获得的那些。

如本文所用,“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的毛舌藻包括子囊菌、担子菌、芽枝霉门、壶菌门、球囊菌门、微孢子虫和新丽鞭毛菌门。真菌细胞可包括酵母、霉菌和丝状真菌。在一些实施方式中,真菌细胞是酵母细胞。

如本文所用,术语“酵母细胞”是指子囊菌门和子孢子菌门内的任何真菌细胞。酵母细胞可包括出芽的酵母细胞、裂变酵母细胞和霉菌细胞。不限于这些生物,在实验室和工业环境中使用的许多类型的酵母是子囊门的一部分。在一些实施方式中,酵母细胞是啤酒酵母、马克斯克鲁维酵母或东方伊萨氏菌细胞。其他酵母细胞可包括但不限于假丝酵母属(例如白色念珠菌)、耶氏酵母(例如解脂耶氏酵母)、毕赤酵母(例如巴斯德毕赤酵母)、克鲁维酵母属(例如乳酸克鲁维酵母和马克斯克鲁维酵母)、神经孢菌(例如克氏神经孢菌)、镰刀菌(例如尖孢镰刀菌(Fusarium oxysporum))和伊萨氏菌(例如东方伊萨酵母(又名库德里阿兹威毕赤酵母(Pichia kudriavzevii))和Candida acidothermophilum)。在一些实施方式中,真菌细胞是丝状真菌细胞。如本文所用,术语“丝状真菌细胞”是指在丝状体中生长的任何类型的真菌细胞,即菌丝或菌丝体。丝状真菌细胞的实例可包括但不限于曲霉(例如黑曲霉)、木霉(例如里氏木霉)、根霉(例如米根霉(Rhizopus oryzae))和被孢霉(例如深黄被孢霉)。

在一些实施方式中,真菌细胞是工业菌株。如本文所用,“工业菌株”是指在工业过程中使用或分离的任何真菌细胞菌株,例如,以商业或工业规模生产产品。工业菌株可以指通常在工业过程中使用的真菌种类,或者可以指也可以用于非工业目的(例如实验室研究)的真菌种类的分离物。工业过程的实例可以包括发酵(例如在食品或饮料产品的生产中),蒸馏,生物燃料的生产,化合物的生产和多肽的生产。工业菌株的实例可以包括但不限于JAY270 和ATCC4124。

在一些实施方式中,真菌细胞是多倍体细胞。如本文所用,“多倍体”细胞可以指其基因组以一个以上拷贝存在的任何细胞。多倍体细胞可以是指天然存在于多倍体状态的细胞类型,也可以是指已被诱导以多倍体状态存在的细胞(例如通过特定的调控,改变,失活,激活或减数分裂,胞质分裂或DNA 复制的修饰)。多倍体细胞可以是指其整个基因组是多倍体的细胞,或者可以是指在特定的特定基因组位点中是多倍体的细胞。不希望受理论的束缚,据认为,引导RNA的丰度在多倍体细胞的基因组工程中比在单倍体细胞中更经常是限速组分,因此使用本文所述的CRISPR-Cas CRISPR系统的方法可能会利用某些真菌细胞类型的优势。

在一些实施方式中,真菌细胞是二倍体细胞。如本文所用,“二倍体”细胞可以指其基因组以两个拷贝存在的任何细胞。二倍体细胞可以指天然存在于二倍体状态的细胞类型,也可以指已经被诱导以二倍体状态存在的细胞(例如通过特定的调控,改变,失活,激活或减数分裂,胞质分裂或DNA复制的修饰)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。二倍体细胞可以是指其整个基因组是二倍体的细胞,或者它可以指的是在特定的特定基因组位点中是二倍体的细胞。在一些实施方式中,真菌细胞是单倍体细胞。如本文所用,“单倍体”细胞可以指其基因组以一个拷贝存在的任何细胞。单倍体细胞可以指天然存在于单倍体状态的细胞类型,也可以指已经被诱导以单倍体状态存在的细胞(例如通过特定的调控,改变,失活,激活或减数分裂,胞质分裂或DNA复制的修饰)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。单倍体细胞可以是指其整个基因组是单倍体的细胞,或者它可以指的是在特定的特定基因组位点中是单倍体的细胞。

如本文所用,“酵母表达载体”是指包含一个或多个编码RNA和/或多肽的序列并且可以进一步包含控制核酸表达的任何所需元件的核酸,以及能够在酵母细胞内部复制和维持表达载体的任何元素。许多合适的酵母表达载体及其特征在本领域中是已知的。例如,多种载体和技术说明于Yeast Protocols,第二版本,Xiao,W.编辑(Humana Press,New York,2007),和 Buckholz,R.G.和Gleeson,M.A.(1991)Biotechnology(NY)9(11):1067-72之中。酵母载体可包含但不限于着丝粒(CEN)序列,自主复制序列(ARS),可操作地连接至靶RNA序列或基因的启动子(如RNA聚合酶III启动子),终止子 (如RNA聚合酶III终止子),复制起点和标记基因(例如营养缺陷型抗生素或其他选择性标记)。用于酵母的表达载体的实例可包括质粒、酵母人工染色体、 2μ质粒、酵母整合质粒、酵母复制质粒、穿梭载体和游离质粒。

植物和植物细胞基因组中靶向RNA的CRISP系统组分的稳定整合

在特定的实施方式中,设想引入了编码靶向靶向CRISPR系统的RNA 的组分的多核苷酸以用于稳定整合到植物细胞的基因组中。在这些实施方式中,可以根据何时,何处以及在什么条件下表达引导RNA和/或RNA靶向基因来调整转化载体或表达系统的设计。

在特定的实施方式中,设想将靶向CRISPR系统的RNA的组分稳定地引入植物细胞的基因组DNA中。另外地或可替代地,设想引入靶向CRISPR 系统的RNA的组分以稳定整合到植物细胞器的DNA中,所述植物细胞器例如但不限于质体,线粒体或叶绿体。

用于稳定整合到植物细胞的基因组中的表达系统可以包含一种或多种以下元件:可用于在植物细胞中表达引导RNA和/或RNA靶向酶的启动子元件;一个5'非翻译区域,以增强表达;内含子元件,以进一步增强某些细胞如单子叶植物细胞中的表达;多克隆位点,为插入一个或多个引导RNA和/ 或靶向RNA的基因序列和其他所需元件提供方便的限制性位点;3'非翻译区,以有效终止表达的转录物。

表达系统的元件可以在一个或多个表达构建体上,这些构建体可以是环状的,例如质粒或转化载体,或者是非环状的,例如线性双链DNA。

在一个特定的实施方式中,靶向CRISPR的RNA表达系统至少包含:

编码与植物中的靶序列杂交的引导RNA(gRNA)的核苷酸序列,其中该引导RNA包括引导序列和正向重复序列,和

编码RNA靶向蛋白的核苷酸序列,

其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可以在植物细胞中可操作的相同或不同的调节元件的控制下。

可以通过多种常规技术将包含靶向CRISPR系统的RNA的组分的DNA 构建体引入植物,植物部分或植物细胞的基因组中。该方法通常包括以下步骤:选择合适的宿主细胞或宿主组织,将构建体引入宿主细胞或宿主组织,并从中再生植物细胞或植物。

在特定实施方式中,可使用诸如但不限于植物细胞原生质体的电穿孔,显微注射,气溶胶束注射的技术将DNA构建体引入植物细胞,或可使用生物弹射法(例如DNA轰击)将DNA构建体直接引入植物组织(另见Fu等, Transgenic Res.2000Feb;9(1):11-9)。粒子轰击的基础是被感兴趣基因包被的粒子向细胞的加速,从而导致原生质被粒子穿透,并通常稳定地整合到基因组中(参见例如Klein等,Nature(1987),Klein等,Bio/Technology(1992),Casas 等,Proc.Natl.Acad.Sci.USA(1993))。

在特定的实施方式中,可以通过农杆菌介导的转化将包含靶向CRISPR 系统的RNA的组分的DNA构建体引入植物中。可以将DNA构建体与合适的T-DNA侧翼区域组合,并引入常规的根癌土壤杆菌宿主载体中。通过感染植物或通过用含有一种或多种Ti(诱导肿瘤)质粒的农杆菌属细菌孵育植物原生质体,可以将外源DNA掺入植物的基因组中。(参见例如Fraley等, (1985),Rogers等,(1987)和美国专利号5,563,055)。

植物启动子

为了确保在植物细胞中的适当表达,本文所述的CRISPR-Cas CRISPR 系统的组分通常置于植物启动子,即在植物细胞中可操作的启动子的控制下。设想使用不同类型的启动子。

组成型植物启动子是能够在植物的全部或几乎所有发育阶段表达其在所有或几乎所有植物组织中控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。本发明设想了修饰RNA序列的方法,因此也设想了调节植物生物分子的表达。因此,在本发明的特定实施方式中,将RNA靶向CRISPR系统的一种或多种元件置于可调节的启动子的控制下是有利的。“调控启动子”是指不是组成型地而是以时间和/或空间调控的方式引导基因表达的启动子,包括组织特异性的,组织优选的和诱导型的启动子。在特定的实施方式中,靶向 CRISPR组分的一种或多种RNA在组成型启动子例如花椰菜花叶病毒的控制下表达。可以利用35S启动子优先选择的启动子来靶向特定植物组织内某些细胞类型(例如叶或根中的维管细胞或种子的特定细胞)中的增强表达。用于RNA靶向CRISPR系统的特定启动子的实例可在Kawamata等,(1997)Plant Cell Physiol 38:792-803;Yamamoto等,(1997)Plant J 12:255-65;Hire等,(1992)Plant Mol Biol 20:207-18,Kuster等,(1995)Plant Mol Biol 29:759-72,和Capana等,(1994)Plant Mol Biol 25:681-91中找到。

可诱导的并且允许时空控制基因编辑或基因表达的启动子的实例可以使用能量的形式。能量的形式可以包括但不限于声能,电磁辐射,化学能和 /或热能。诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off),小分子双杂交转录激活系统(FKBP、ABA等)或光诱导系统(光致色素、LOV结构域或隐色)。作为光诱导转录效应子(LITE)的一种,它以序列特异性方式引导转录活性的变化。光诱导系统的组分可以包括靶向CRISPR-Cas的RNA,光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制域。可诱导的 DNA结合蛋白的进一步实例及其使用方法在美国61/736465和美国 61/721,283中提供,其通过引用整体并入本文。

在特定的实施方式中,瞬时或可诱导的表达可以通过使用例如化学调节的启动子来实现,即,由此外源化学物质的应用诱导基因表达。基因表达的调节也可以通过化学可抑制的启动子获得,其中化学试剂的应用抑制基因表达。化学诱导型启动子包括但不限于由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等,(1997)Plant CellPhysiol 38:568-77),玉米 GST启动子(GST-1127,WO93/01294)(其被用作发芽前除草剂的疏水性亲电化合物激活),和烟草PR-1a启动子(Ono等,(2004)Biosci Biotechnol Biochem68:803-7)被水杨酸激活。也可以在本文中使用由抗生素调节的启动子,例如四环素诱导型和四环素抑制型启动子(Gatz等,(1991)Mol Gen Genet 227:229-37;U.S.Patent Nos.5,814,618and 5,789,156)。

特定植物器官的转运和/或表达

表达系统可包含用于易位至和/或在特定植物细胞器中表达的元件。

叶绿体靶向

在特定的实施方式中,设想将靶向CRISPR系统的RNA用于特异性修饰叶绿体基因的表达和/或翻译或确保在叶绿体中的表达。为此目的,使用叶绿体转化方法或将靶向CRISPR组分的RNA分隔到叶绿体上。例如,在质体基因组中例如通过花粉的基因流引入遗传修饰可以减少生物安全性问题。

叶绿体转化的方法是本领域已知的,包括粒子轰击,PEG处理和显微注射。另外,可以使用如WO2010061186中所述的涉及将转化盒从核基因组转移至质体的方法。

或者,设想将一种或多种靶向CRISPR组分的RNA靶向植物叶绿体。这是通过将表达叶绿体转运肽(CTP)或质体转运肽的序列掺入表达构建体中来实现的,该序列可操作地连接至编码RNA靶向蛋白的序列的5'区域。 CTP在易位到叶绿体中的处理步骤中被去除。所表达蛋白质的叶绿体靶向是本领域技术人员众所周知的(参见例如Protein Transport intoChloroplasts, 2010,Annual Review of Plant Biology,Vol.61:157-180))。在这样的实施方式中,还期望将一种或多种引导RNA靶向植物叶绿体。可用于通过叶绿体定位序列将引导RNA转移到叶绿体中的方法和构建体描述于例如美国 20040142476中,其通过引用并入本文。可以将这种构建体的变体并入本发明的表达系统中,以有效地使RNA靶向-引导RNA移位。

在藻类细胞中引入包含CRISPR-RNA靶向系统的多核苷酸。

转基因藻类(或其他植物,如油菜)在生产植物油或生物燃料(如醇(尤其是甲醇和乙醇)或其他产品)中可能特别有用。这些可以被设计成表达或过量表达用于石油或生物燃料工业的高含量的油或醇。

美国8945839描述了一种使用Cas9工程化微藻类(莱茵衣藻细胞)物种的方法。使用类似的工具,本文所述的RNA靶向CRISPR系统的方法可以应用于衣藻属物种和其他藻类。在特定实施方式中,将RNA靶向蛋白和一种或多种引导RNA引入使用在组成性启动子例如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达RNA靶向蛋白的载体表达的藻类中。可选地,使用含有T7 启动子的载体来递送引导RNA。或者,可以将靶向mRNA的RNA和体外转录的引导RNA递送至藻类细胞。电穿孔方案对于技术人员是可用的,例如来自GeneArtChlamydomonas Engineering试剂盒的标准推荐方案。

在酵母细胞中引入编码RNA靶向组分的多核苷酸

在特定的实施方式中,本发明涉及RNA靶向CRISPR系统在酵母细胞中RNA编辑中的用途。转化酵母细胞的方法可用于引入编码靶向CRISPR 系统组分的RNA的多核苷酸,这是本领域技术人员众所周知的,并且Kawai 等,2010,Bioeng Bugs.2010Nov-Dec;1(6):395–403)对其进行了评论。非限制性实例包括通过乙酸锂处理(其可进一步包括载体DNA和PEG处理)轰击或通过电穿孔转化酵母细胞。

植物和植物细胞中的RNA靶向CRISP系统组分的瞬时表达

在特定的实施方式中,设想了引导RNA和/或RNA靶向基因在植物细胞中瞬时表达。在这些实施方式中,仅当引导RNA和RNA靶向蛋白都存在于细胞中时,靶向RNA的CRISPR系统才能确保修饰RNA靶分子,从而可以进一步控制基因表达。由于RNA靶向酶的表达是瞬时的,因此从此类植物细胞再生的植物通常不包含外源DNA。在特定的实施方式中,RNA靶向酶由植物细胞稳定表达,并且引导序列是瞬时表达的。

特别优选的实施方式中,可以使用植物病毒载体将靶向CRISPR系统组分的RNA引入植物细胞中(Scholthof等,1996,Annu Rev Phytopathol. 1996;34:299-323)。在另外的特定实施方式中,所述病毒载体是来自DNA病毒的载体。例如,双生病毒(例如卷心菜叶卷曲病毒、豆黄矮化病毒、小麦矮化病毒、番茄叶卷曲病毒、玉米条纹病毒,烟草叶卷曲病毒或番茄金黄花叶病毒)或纳米病毒(例如蚕豆坏死黄色)病毒)。在其他特定的实施方式中,所述病毒载体是来自RNA病毒的载体。例如,妥布病毒(例如烟草拨浪鼓病毒、烟草花叶病毒),potex病毒(例如马铃薯病毒X)或大肠病毒(例如大麦条纹花叶病毒)。植物病毒的复制基因组是非整合载体,在避免生产转基因植物的背景下,这是令人感兴趣的。

在特定实施方式中,用于RNA靶向CRISPR构建体的瞬时表达的载体是例如pEAQ载体,该载体针对农杆菌介导的瞬时表达进行了定制 (Sainsbury F.等,Plant BiotechnolJ.2009Sep;7(7):682-93)。使用修饰的卷心菜叶卷曲病毒(CaLCuV)载体证明了基因组位置的精确靶向,可以在表达 Cas13的稳定转基因植物中表达gRNA(参见Scientific Reports5,Article number:14926(2015),doi:10.1038/srep14926)。

在特定的实施方式中,可以将编码引导RNA或crRNA和/或RNA靶向基因的双链DNA片段瞬时引入植物细胞中。在这样的实施方式中,以足够的量提供引入的双链DNA片段以修饰细胞中的RNA分子,但是在经过预期的时间段之后或在一个或多个细胞分裂之后不持续存在。植物中直接DNA 转移的方法是技术人员已知的(参见例如Davey等,Plant MolBiol.1989 Sep;13(3):273-85)。

在其他实施方式中,将编码RNA靶向蛋白的RNA多核苷酸引入植物细胞,然后由宿主细胞翻译和加工,从而产生足够数量的蛋白来修饰RNA分子细胞(在至少一个引导RNA的存在下),但其在经过一段预期的时间后或在一个或多个细胞分裂后不会持续存在。将mRNA引入植物原生质体以进行瞬时表达的方法是本领域技术人员已知的(参见例如Gallie,Plant Cell Reports(1993),13;119-122)。还设想了上述不同方法的组合。

将靶向RNA的CRISPR组分递送至植物细胞

在特定实施方式中,令人感兴趣的是将靶向CRISPR系统的RNA的一种或多种组分直接递送至植物细胞。这尤其对于非转基因植物的产生是有意义的。在特定的实施方式中,一种或多种RNA靶向组分是在植物或植物细胞外部制备并递送至细胞的。例如,在特定的实施方式中,在导入植物细胞之前在体外制备RNA靶向蛋白。靶向RNA的蛋白可以通过本领域技术人员已知的多种方法来制备,并且包括重组生产。表达后,将RNA靶向蛋白分离出来,必要时对其进行折叠,纯化并任选进行处理以去除任何纯化标签,例如His标签。一旦获得粗制的,部分纯化的或更完全纯化的RNA靶向蛋白,就可以将蛋白引入植物细胞。

在特定的实施方式中,将RNA靶向蛋白与靶向目的RNA的引导RNA 混合以形成预组装的核糖核蛋白。

可以通过电穿孔,通过用RNA靶向相关的基因产物包被的颗粒轰击,通过化学转染或通过某种其他跨细胞膜运输的方式,通过电穿孔将单个组分或预组装的核糖核蛋白引入植物细胞。例如,已经证明用预组装的CRISPR 核糖核蛋白转染植物原生质体以确保植物基因组的靶向修饰(如Woo等, Nature Biotechnology,2015;DOI:10.1038/nbt.3389所述)。可以对这些方法进行修饰,以实现植物中RNA分子的靶向修饰。

在特定的实施方式中,使用纳米颗粒将靶向CRISPR系统组分的RNA 引入植物细胞。可以将作为蛋白质或核酸或其组合的组分上载或包装在纳米颗粒中并施用于植物上(例如WO 2008042156和US 20130185823所述)。特别地,本发明的实施方式包括与编码RNA靶向蛋白的DNA分子一起上传或填充的纳米颗粒,如WO2015089419中所述的编码引导RNA和/或分离的引导RNA的DNA分子。

将靶向RNA的CRISPR系统的一种或多种组分引入植物细胞的其他方法是使用细胞穿透肽(CPP)。因此,特别地,本发明的实施方式包括包含与 RNA靶向蛋白连接的细胞穿透肽的组合物。在本发明的特定实施方式中,将靶向RNA的蛋白质和/或引导RNA与一个或多个CPP偶联以有效地将其转运至植物原生质体内(Ramakrishna(2014,Genome Res.2014年6月; 24(6):1020-7for Cas9 in human cells)。在其他实施方式中,RNA靶向基因和/ 或引导RNA由与一个或多个CPP偶联的一个或多个环状或非环状DNA分子编码。CPPs通常被描述为少于35个氨基酸的短肽,其来源于蛋白质或嵌合序列,能够在细胞内跨细胞膜转运生物分子。CPP可以是阳离子肽,具有疏水序列的肽,两性肽,具有富含脯氨酸和抗微生物序列的肽以及嵌合或二分肽(Pooga和Langel 2005)。可以穿透生物膜并因此触发各种生物分子穿过细胞膜进入细胞质并改善其细胞内路径,从而促进生物分子与靶标的相互作用。CPP的实例包括:Tat,HIV 1型病毒复制所需的核转录激活蛋白,渗透素,卡波西成纤维细胞生长因子(FGF)信号肽序列,整联蛋白β3信号肽序列;聚精氨酸肽Args序列,鸟嘌呤富分子转运蛋白,甜箭肽等。

为植物、藻类或真菌应用设想的靶RNA

靶RNA,即感兴趣的RNA,是本发明靶向的RNA,导致在靶RNA上感兴趣的靶位点募集并与RNA靶向蛋白结合。靶RNA可以是任何合适形式的RNA。在一些实施方式中,这可以包括mRNA。在其他实施方式中,靶 RNA可以包括转移RNA(tRNA)或核糖体RNA(rRNA)。在其他实施方式中,靶RNA可以包括干扰RNA(RNAi),微RNA(miRNA),微开关,微酶,卫星 RNA和RNA病毒。靶RNA可以位于植物细胞的细胞质中,或位于细胞核中或植物细胞器中,例如线粒体,叶绿体或质体中。

在特定的实施方式中,靶向RNA的CRISPR系统用于切割RNA或以其他方式抑制RNA表达。

利用RNA靶向CRISPR系统通过RNA调控来调控植物基因表达、

还可通过控制RNA加工,将RNA靶向蛋白与合适的引导RNA一起用于靶向基因表达。RNA加工的控制可以包括RNA加工反应,例如RNA剪接,包括替代剪接;RNA剪接。病毒复制(尤其是植物病毒,包括植物体内的类病毒体和tRNA生物合成。RNA靶向蛋白与合适的引导RNA结合也可用于控制RNA激活(RNAa)。RNAa促进基因表达,因此可以通过破坏或减少RNAa从而减少基因表达的促进来实现对基因表达的控制。

本发明的靶向RNA的效应子蛋白可以进一步用于植物中的抗病毒活性,特别是针对RNA病毒的抗病毒活性。可以使用对所选病毒RNA序列有选择性的合适的引导RNA,将效应子蛋白靶向病毒RNA。特别地,效应子蛋白可以是切割RNA的活性核酸酶,例如单链RNA。因此,提供了本发明的RNA靶向效应子蛋白作为抗病毒剂的用途。可以以这种方式抵抗的病毒的示例包括但不限于烟草花叶病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯病毒Y(PVY)、花椰菜花叶病毒(CaMV)(RT病毒)、李子痘病毒(PPV)、雀麦花叶病毒(BMV)和马铃薯X病毒(PVX)。

本文进一步描述了调节植物,藻类或真菌中RNA表达的实例,作为靶向基因修饰的替代方案。

特别令人感兴趣的是通过mRNA的调控切割对基因表达的调控。这可以通过将靶向RNA的元件置于如本文所述的受调控的启动子的控制下来实现。

使用RNA靶向CRISPR系统恢复TRNA分子的功能

Pring等描述了植物线粒体和叶绿体中的RNA编辑,这些编辑可以改变mRNA序列以编码不同于DNA的蛋白质。(Plant Mol.Biol.(1993)21(6): 1163–1170.doi:10.1007/BF00023611)。在本发明的特定实施方式中,可以将特异性靶向线粒体和叶绿体mRNA的靶向CRISPR系统的RNA的元件引入植物或植物细胞中,以在这种植物细胞器中表达不同的蛋白质,从而模拟体内发生的过程。

使用RNA靶向CRISPR系统作为替代RNA干扰抑制RNA表达的方法

RNA靶向CRISPR系统具有类似于RNA抑制或RNA干扰的用途,因此也可以替代此类方法。在特定的实施方式中,本发明的方法包括使用靶向CRISPR的RNA作为例如RNA的替代物。干扰核糖核酸(例如siRNA或 shRNA或dsRNA)。本文进一步描述了抑制植物,藻类或真菌中RNA表达的实例,作为靶向基因修饰的替代方案。

使用RNA靶向CRISPR系统控制RNA干扰

通过减少体内或体外干扰RNA或miRNA的寿命,对干扰RNA或miRNA 的控制可能有助于减少那些方法所产生的脱靶效应(OTE)。在特定实施方式中,靶RNA可以包括干扰RNA,即参与RNA干扰途径的RNA,例如shRNA、siRNA等。在其他实施方式中,靶RNA可以包括微小RNA(miRNA)或双链 RNA(dsRNA)。

在其他特定的实施方式中,如果RNA靶向蛋白和合适的引导RNA被选择性地表达(例如在受调控的启动子例如组织或细胞周期特异性启动子和/或增强子的控制下在空间或时间上)。这可用于“保护”细胞或系统(体内或体外) 免受这些细胞中RNAi的侵害。这在不需要RNAi的邻近组织或细胞中或用于比较表达或不表达效应子蛋白和合适的引导的细胞或组织的目的可能是有用的(例如分别在不控制RNAi的地方或不存在RNAi的地方)。RNA靶向蛋白可用于控制或结合包含RNA或由RNA组成的分子,例如核酶,核糖体或核糖开关。在本发明的实施方式中,引导RNA可以将RNA靶向蛋白募集到这些分子,使得RNA靶向蛋白能够与它们结合。

根据本公开内容,本发明的靶向RNA的CRISPR系统无需过度实验即可用于植物体内RNAi技术领域,包括昆虫害虫管理、植物病害管理和除草剂抗性管理以及在植物测定中和用于其他应用(参见例如Kim等,in Pesticide Biochemistry and Physiology(ImpactFactor:2.01).01/2015;120.DOI: 10.1016/j.pestbp.2015.01.002;Sharma等,inAcademic Journals(2015), Vol.12(18)pp2303-2312);Green J.M,inPest ManagementScience,Vol 70(9),pp 1351-1357),因为本申请为所述系统的有根据的工程化提供了基础。

利用RNA靶向CRISPR系统修饰核糖开关并控制植物、藻类和真菌的代谢调节。

核糖开关(也称为核酶)是信使RNA的调控片段,与小分子结合,进而调控基因表达。这种机制使细胞能够感知这些小分子的细胞内浓度。特定的核糖开关通常通过改变该基因的转录,翻译或剪接来调节其邻近基因。因此,在本发明的特定实施方式中,设想通过使用RNA靶向蛋白与合适的引导 RNA结合以靶向核糖开关来控制核糖开关活性。这可以通过切割或结合至核糖开关来实现。在特定的实施方式中,设想了核糖开关活性的降低。近来,表征了结合硫胺焦磷酸盐(TPP)的核糖开关,并发现其调节植物和藻类中的硫胺生物合成。此外,似乎该元素是植物中初级代谢的必需调节剂(Bocobza 和Aharoni,Plant J.2014年8月;79(4):693-703.doi:10.1111/tpj.12540.Epub 2014年6月17日)。TPP核糖开关还存在于某些真菌中,例如在Neurospora crassa中,它控制选择性剪接以有条件地产生上游开放阅读框(uORF),从而影响下游基因的表达(Cheah MT等,(2007)Nature 447(7143):497–500. doi:10.1038/nature05769)。本文所述的靶向CRISPR系统的RNA可用于操纵植物、藻类或真菌中的内源核糖开关活性,并因此改变其控制的下游基因的表达。在特定的实施方式中,靶向RNA的CRISP系统可以用于体内或体外测定核糖开关功能以及研究其与代谢网络的相关性。在特定实施方式中,靶向CRISPR系统的RNA可以潜在地用于改造核糖开关,作为植物和平台中用于基因控制的代谢物传感器。

RNA靶向CRISPR系统在植物、藻类或真菌的RNAI中的应用

鉴定其敲除与表型改变有关的基因产物,可以通过RNAi筛查生物学途径并鉴定组成部分。在本发明的特定实施方式中,还可通过使用本文所述的指南29或指南30蛋白和合适的引导RNA在这些筛选之上或期间施加控制,以去除或降低筛选中RNAi的活性,从而恢复活性。(先前受干扰的)基因产物的表达(通过消除或减少干扰/抑制)。

RNA靶向蛋白在体内和体外RNA分子可视化中的应用

在特定的实施方式中,本发明提供了核酸结合系统。RNA与互补探针的原位杂交是一项强大的技术。通常,荧光DNA寡核苷酸用于通过杂交检测核酸。通过某些修饰,例如锁定核酸(LNA),已经获得了提高的效率,但是仍然需要有效且通用的替代方案。因此,RNA靶向系统的标记元件可以用作高效、可调适的原位杂交系统的替代品。

RNA靶向CRISPR系统在植物和酵母中的进一步应用

RNA靶向CRISPR系统在生物燃料生产中的用途

如本文所用,术语“生物燃料”是由植物和植物来源的资源制成的替代燃料。可以从有机物质中提取可再生的生物燃料,这些有机物质的能量是通过固碳过程获得的,或者是通过利用或转化生物质制得的。该生物质可以直接用于生物燃料,也可以通过热转化、化学转化和生化转化转化为方便的含能量物质。这种生物质转化可以产生固体,液体或气体形式的燃料。有两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程生产的,淀粉主要来自玉米和甘蔗。另一方面,生物柴油主要来自油料作物,例如油菜籽、棕榈和大豆。生物燃料主要用于运输。

增强植物特性以生产生物燃料

在特定的实施方式中,使用本文所述的使用RNA靶向CRISPR系统的方法来改变细胞壁的特性,以便于关键水解剂的进入,从而更有效地释放糖以进行发酵。在特定的实施方式中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成是共同调节的。通过减少植物中木质素的比例,可以增加纤维素的比例。在特定的实施方式中,本文所述的方法用于下调植物中木质素的生物合成,从而增加可发酵的碳水化合物。更具体而言,本文所述的方法用于下调至少第一个木质素生物合成基因,该基因选自如WO 2008064289 A2中所公开的4-香豆酸酯3-羟化酶 (C3H)、苯丙氨酸氨裂合酶(PAL)、肉桂酸4-羟化酶(C4H)、羟肉桂酰基转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰基辅酶A 3-O-甲基转移酶 (CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰基辅酶 A还原酶(CCR)、4-香豆酸酯-CoA连接酶(4CL)、单木酚-木脂蛋白特异性糖基转移酶和醛脱氢酶(ALDH)。

在特定的实施方式中,本文所述的方法用于产生在发酵过程中产生较低水平的乙酸的植物块(也参见WO 2010096488)。

修饰酵母以生产生物燃料

在特定的实施方式中,本文提供的RNA靶向酶用于通过重组微生物生产生物乙醇。例如,RNA靶向酶可用于工程改造微生物,例如酵母,以由可发酵糖产生生物燃料或生物聚合物,并任选地能够降解源自农业废物的植物来源的木质纤维素作为可发酵糖的来源。更具体地,本发明提供了方法,其中靶向RNA的CRISPR复合物用于修饰生物燃料生产所需的内源基因的表达和/或修饰为什么可能干扰生物燃料合成的内源基因。更特别地,该方法包括刺激一种或多种核苷酸序列的编码在酶例如丙酮酸向乙醇或另一目的产物的转化中的酶在微生物如酵母中的表达。在特定的实施方式中,该方法确保刺激一种或多种酶的表达,这允许微生物降解纤维素,例如纤维素酶。在另外的实施方式中,靶向CRISPR复合物的RNA用于抑制与生物燃料生产途径竞争的内源性代谢途径。

修饰类和植物以生产植物油或生物燃料

例如,转基因藻类或其他植物(例如油菜)在生产植物油或生物燃料(例如醇(尤其是甲醇和乙醇))中可能特别有用。这些可以被设计成表达或过量表达用于石油或生物燃料工业的高含量的油或醇。

US 8945839描述了一种使用Cas9工程化微藻类(莱茵衣藻细胞)物种的方法。使用类似的工具,本文所述的RNA靶向CRISPR系统的方法可以应用于衣藻属物种和其他藻类。在特定的实施方式中,将RNA靶向效应子蛋白和引导RNA引入使用表达的藻类的载体中,所述载体在组成型启动子如 Hsp70A-Rbc S2或β2-微管蛋白的控制下表达RNA靶向效应子蛋白。引导 RNA将使用含有T7启动子的载体进行递送。或者,可以将体外转录的引导 RNA递送至藻类细胞。电穿孔方案遵循GeneArt Chlamydomonas Engineering 试剂盒中推荐的标准推荐方案。

RNA靶向酶在植物中的特定应用

在特定的实施方式中,本发明由于能够切割病毒RNA而可以用作植物系统中病毒去除的疗法。先前在人体系统中的研究表明,利用CRISPR成功靶向单链RNA病毒丙型肝炎(A.Price等,Proc.Natl.Acad.Sci,2015)。这些方法也可以适用于在植物中使用RNA靶向CRISPR系统。

改良的植物

本发明还提供了可通过本文提供的方法获得和获得的植物和酵母细胞。通过本文所述方法获得的改良植物可通过基因的修饰表达而用于食品或饲料生产,例如确保对植物害虫、除草剂、干旱,低温或高温、过量水分等的耐受性。

通过本文描述的方法获得的改良植物,特别是农作物和藻类,通过表达例如比野生型中通常可见的更高的蛋白质,碳水化合物,营养或维生素水平,可用于食品或饲料生产。在这方面,优选改良的植物,尤其是豆类和块茎。

改良的藻类或其他植物(例如油菜)在生产植物油或生物燃料(例如醇(尤其是甲醇和乙醇))中特别有用。这些可以被设计成表达或过量表达用于石油或生物燃料工业的高含量的油或醇。

本发明还提供了植物的改良部分。植物部分包括但不限于叶、茎、根、块茎、种子、胚乳、胚珠和花粉。本文所设想的植物部分可以是存活的、不能存活的、可再生的和/或不可再生的。

本文还涵盖提供根据本发明的方法产生的植物细胞和植物。通过传统育种方法产生的包含遗传修饰的植物的配子、种子、胚胎、合子或体细胞的后代或杂种也包括在本发明的范围内。这样的植物可以包含插入或代替靶序列的异源或外源DNA序列。或者,此类植物可以在一个或多个核苷酸中仅包含改变(突变、缺失、插入、取代)。因此,此类植物将仅通过存在特定修饰而与其祖先植物不同。

在本发明的一个实施方式中,CRISPR-Cas系统用于工程化病原体抗性植物,例如通过对细菌,真菌或病毒引起的疾病产生抗性。在某些实施方式中,病原体抗性可以通过对农作物进行改造以产生将被害虫摄入的 CRISPR-Cas系统来实现,从而导致死亡。在本发明的一个实施方式中, CRISPR-Cas系统用于工程化非生物胁迫耐受性。在另一个实施方式中,使用CRISPR-Cas系统来工程化干旱胁迫耐受性或盐胁迫耐受性,或冷或热胁迫耐受性。Younis et al.2014,Int.J.Biol.Sci.10;1150评述了植物育种方法的潜在目标,所有这些均可通过使用本文所述的CRISPR-Cas系统进行校正或改良。一些非限制性目标作物包括拟南芥(Arabidops Zea mays thaliana)、水稻 (Oryza sativa L)、李属(Prunus domesticaL.)、陆地棉(Gossypium hirsutum)、仿古烟草(Nicotianarusta)、玉米(Zea mays)、苜蓿(Medicago sativa)、本氏烟草 (Nicotiana benthamiana)和拟南芥(Arabidopsisthaliana)。

在本发明的一个实施方式中,CRISPR-Cas系统用于处理农作物害虫。例如,可在植物害虫中操作的CRISPR-Cas系统可从植物宿主表达或直接转移至靶标,例如使用病毒载体。

在一个实施方式中,本发明提供了一种从杂合非人类起始生物有效产生纯合生物的方法。在一个实施方式中,本发明用于植物育种。在另一个实施方式中,本发明用于动物育种。在这样的实施方式中,通过干扰或抑制参与双链断裂、染色体配对和/或链交换的至少一种靶基因来防止或抑制重组来生成纯合生物(例如植物或动物)。

CRISPR-CAS效应子蛋白复合物可以在植物中使用。

在一些实施方式中,本发明包括修饰细胞或生物的方法。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人类的灵长类、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物的真核细胞,例如家禽、鱼或虾。该细胞也可以是植物细胞。植物细胞可以是农作物,例如木薯、玉米、高粱、小麦或水稻。植物细胞也可以是藻类,树木或蔬菜。通过本发明引入细胞的修饰可以是这样的,使得改变细胞和细胞的后代以改善生物产物(如抗体、淀粉、醇或其他所需细胞)输出的产生。通过本发明引入细胞的修饰可以使得细胞和细胞的后代包括改变产生的生物产物的改变。该系统可以包括一个或多个不同的载体。在本发明的一方面,效应子蛋白经密码子优化以表达所需的细胞类型,优选为真核细胞,优选为哺乳动物细胞或人细胞。可以将CRISPR-Cas系统(例如单个或多重)与作物基因组学的最新进展结合使用。此类CRISPR系统可用于执行有效且具有成本效益的植物基因或基因组或转录组查询或编辑或操作-例如,用于快速研究和/或选择和/或询问和/或比较和/或操作和/或植物基因或基因组的转化;例如,创建、鉴定、开发、优化或赋予植物特征或特性或转化植物基因组。因此,可以提高植物的产量,具有新的性状或特征组合的新植物或具有增强的性状的新植物。这样的CRISPR系统可以在定点整合(SDI)或基因编辑(GE) 或任何近反向育种(NRB)或反向育种(RB)技术中用于植物。因此,除非另有说明,否则本文中对动物细胞的引用在细节上作必要修改后也可适用于植物细胞。并且,本文中具有降低脱靶作用的酶和采用这种酶的系统可以用于植物应用中,包括本文中提及的那些。如所提供的,通过效应子蛋白和合适的引导(crRNA)修饰的工程植物及其后代。这些可能包括抗病或抗旱的农作物,例如小麦、大麦、水稻、大豆或玉米;经过修饰以去除或降低自花授粉的能力的植物(但可以替代地,可以替代地杂交);以及过敏性食品,例如花生和坚果,其中的免疫原性蛋白已通过效应子蛋白和合适的导向物靶向而被禁用,破坏或破坏。使用经典CRIPSR-Cas系统的任何方面均可适用于与Cas 蛋白无关的CRISPR系统,例如Cas13效应子蛋白系统。

条件模型

本发明的方法可用于产生植物,动物或细胞,所述植物,动物或细胞可用于建模和/或研究目的遗传或表观遗传条件,例如通过目的突变模型或疾病模型。如本文所用,“疾病”是指受试者中的疾病,病症或适应症。例如,本发明的方法可用于产生动物或细胞,该动物或细胞包括与疾病相关的一个或多个核酸序列的修饰,或其中表达一个或多个核酸序列的植物,动物或细胞。与疾病相关的改变。这样的核酸序列可以编码或翻译疾病相关的蛋白质序列,或者可以是疾病相关的控制序列。因此,应理解在本发明的实施方式中,植物、受试者、患者、生物或细胞可以是非人类受试者、患者、生物或细胞。因此,本发明提供了通过本方法产生的植物,动物或细胞或其后代。后代可以是所生产的植物或动物的克隆,或者可以是通过与相同物种的其他个体杂交以将其他所需性状渗入其后代的有性繁殖而产生的。在多细胞生物特别是动物或植物的情况下,细胞可以是体内或离体的。在培养细胞的情况下,如果满足适当的培养条件,并且优选地如果该细胞适合于该目的,则可以建立细胞系(例如干细胞)。还设想了本发明产生的细菌细胞系。因此,还设想了细胞系。在某些方法中,可以使用常用的方法,使用疾病模型来研究突变或更普遍的变化(例如基因或基因产物的表达减少)对动物或细胞以及疾病的发展和/或进展的影响。在疾病的研究中。或者,这种疾病模型可用于研究药物活性化合物对疾病的影响。在某些方法中,疾病模型可用于评估潜在基因治疗策略的功效。即,可以修饰与疾病相关的RNA,从而显示或抑制或减少疾病的发展和/或进展,然后测试化合物对进展或抑制或减少的作用。

在利用CRISPR-Cas效应子蛋白及其复合物和编码其的核酸分子以及使用其的方法用于实施本发明时,参考了以下内容:Genome-Scale CRISPR-Cas9 Knockout Screeningin Human Cells,Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi, X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG., Zhang,F.Science Dec 12.(2013).[线上公布早于纸印];以一下最终编辑形式出版:Science.2014Jan 3;343(6166):84–87。Shalem等涉及一种在基因组范围内询问基因功能的新方法。他们的研究表明,以18,080个基因为目标的基因组规模的CRISPR-Cas9基因敲除(GeCKO)文库的递送具有64,751个独特的引导序列,可在人细胞中进行阴性和阳性选择筛选。首先,作者展示了使用GeCKO文库鉴定癌症和多能干细胞中细胞活力所必需的基因。接下来,在黑色素瘤模型中,作者筛选了基因丢失与维拉非尼抗药性有关的基因,维拉非尼是一种抑制突变蛋白激酶BRAF的药物。他们的研究表明,排名最高的候选基因包括先前验证的基因NF1和MED12,以及新型的hitsNF2、CUL3、 TADA2B和TADA1。作者观察到靶向相同基因的独立引导RNA之间的高度一致性和较高的命中率,从而证明了用Cas9进行基因组规模筛选的希望。还参考美国专利公开号US20140357530;美国专利公开号US20140357530;和PCT专利公开WO2014093701,其通过引用并入本文。

在此使用的术语“与...相关联”是指功能域与CRISPR-Cas效应子蛋白或衔接蛋白的结合。关于一个分子如何与另一个分子“相关联”,例如在衔接蛋白和功能结构域之间或在CRISPR-Cas效应子蛋白和功能结构域之间,它被使用。在这种蛋白质-蛋白质相互作用的情况下,可以以抗体识别表位的方式从识别的角度看待这种联系。或者,一种蛋白质可以通过两者的融合与另一种蛋白质缔合,例如一个亚基与另一亚基融合。融合通常通过将一个氨基酸序列与另一个氨基酸序列相加而发生,例如通过将编码每种蛋白质或亚基的核苷酸序列剪接在一起。或者,这可以基本上被视为两个分子之间的结合或直接键合,例如融合蛋白。在任何情况下,融合蛋白可在两个感兴趣的亚基之间(即在酶和功能域之间或在衔接蛋白和功能域之间)包括接头。因此,在一些实施方式中,CRISPR-Cas效应子蛋白或衔接蛋白通过与功能域结合而与之结合。在其他实施方式中,CRISPR-Cas效应子蛋白或衔接蛋白与功能结构域相关联,因为二者任选地经由中间接头融合在一起。

治疗应用

由于本申请为系统的知情工程提供了基础,因此根据本公开内容,可以将本发明的系统应用于本发明的先前的RNA切割技术领域,而无需进行过多的实验,而无需进行过多的实验。本发明提供了由RNA,有毒RNA和/ 或突变的RNA(例如剪接缺陷或截短)的过表达引起的疾病的治疗性治疗。毒性RNA的表达可能与核内含物的形成以及脑,心脏或骨骼肌中迟发性退行性改变有关。在研究得最好的实例中,肌强直性营养不良,看来毒性RNA 的主要致病作用是螯合结合蛋白并损害其他剪接的调控(Hum.Mol.Genet. (2006)15(suppl 2):R162-R169)。遗传学家特别关注强直性肌营养不良症[肌营养不良症(DM)],因为它可产生极为广泛的临床特征。部分列出的内容包括肌肉消瘦,白内障,胰岛素抵抗,睾丸萎缩,心脏传导减慢,皮肤肿瘤以及对认知的影响。DM的经典形式,现在称为DM 1型(DM1),是由DMPK(编码胞质蛋白激酶的基因)的3'-非翻译区(UTR)中CTG重复序列的扩增引起的。

先天免疫系统主要通过识别被感染细胞内部的病毒核酸来检测病毒感染,这被称为DNA或RNA感应。体外RNA感应测定可用于检测特定的RNA 底物。RNA靶向效应子蛋白可以例如用于活细胞中基于RNA的感测。应用的实例是通过感测例如疾病特异性RNA的诊断方法。本发明的靶向RNA的效应子蛋白可以进一步用于抗病毒活性,特别是针对RNA病毒。可以使用对所选病毒RNA序列有选择性的合适的引导RNA,将效应子蛋白靶向病毒 RNA。特别地,效应子蛋白可以是切割RNA的活性核酸酶,例如单链RNA。预期本发明的酶系统靶向RNA和上述RNA的治疗剂量为约0.1至约 2mg/kg,该剂量可以在监测到的应答下依次给药,并且如果需要的话可以重复给药,最高至约40mg/kg。每位患者7至10剂。有利地,在治疗方案期间从每个患者收集样品,以确定治疗的有效性。例如,可以分离并定量RNA 样品以确定表达是否降低或改善。这种诊断在本领域技术人员的能力范围内。

在一些实施例中,所述疾病是由G→A或C→T点突变或病原性SNP引起的。在一些实施例中,所述疾病由T→C或A→G点突变或病原性SNP引起。例如,所述疾病可以是癌症,血友病,β地中海贫血,马凡氏综合症和维斯科特-奥尔德里奇综合症。

示例性疗法

本发明还考虑了将CRISPR-Cas系统和本文所述的碱基编辑器用于多种疾病和病症的治疗。在一些实施方式中,本文所述的发明涉及一种治疗方法,其中通过CRISPR或碱基编辑器离体编辑细胞以调节至少一个基因,随后将经编辑的细胞施用于需要其的患者。在一些实施方式中,编辑涉及敲入、敲除或敲低细胞中至少一种靶基因的表达。在特定实施方式中,编辑将可包含一个或多个外显子和内含子或天然或合成内含子的外源,基因,小基因或序列插入靶基因的基因座,热点基因座,安全港基因座中。可以引入新基因或遗传元件而不破坏相邻基因的表达或调控,或不通过插入或缺失进行校正的 DNA序列中编码目标基因调控元件的一个或多个突变的基因组位置。在一些实施方式中,编辑包括在靶细胞中的核酸(例如基因组DNA)中引入一个或多个点突变。

在实施方式中,所述治疗是针对器官的疾病/病症,包括肝病、眼病、肌肉病、心脏病、血液病、脑病、肾脏病、或者可以包括自身免疫性疾病、中枢神经系统疾病的治疗、癌症和其他增生性疾病、神经退行性疾病、炎性疾病、代谢性疾病、肌肉骨骼疾病等。

特定疾病/疾病包括软骨发育不全、色盲、酸性麦芽糖酶缺乏症、肾上腺髓质营养不良症、心功能不全综合征、α-1抗胰蛋白酶缺乏症、α地中海贫血、雄激素不敏感综合征、精子综合征、致心律失常性右心室、发育不良、共济失调毛细血管扩张症、β贫血综合征、蓝色橡胶泡痣综合征、canavan 病、慢性肉芽肿性疾病(CGD)、cri du chat综合征、囊性纤维化、真皮病、外胚层发育不良、范可尼贫血、骨化性骨增生、渐进性X综合征、半乳糖症、全身型神经节苷脂贮积病(例如GM1)、血色素沉着病、β-珠蛋白(HbC)第六密码子中的血红蛋白C突变、血友病、亨廷顿氏病、霍勒氏综合症、低血磷症、克莱氏症候群、克拉伯斯病、朗格-基迪翁氏综合症、白细胞营养不良、长QT综合征、马凡氏综合症、莫比乌斯氏综合症、黏多糖贮积症(MPS)、指甲髌骨综合征、肾原性肾病血吸虫病、神经纤维瘤病、奈曼-皮克病、成骨不全症、卟啉症、Prader-Willi综合征、早衰症、变形杆菌综合征、视网膜母细胞瘤、Rett综合征、Rubinstein-Taybi综合征、Sanfilippo综合征、严重合并免疫缺陷症(SCID)、Shwachman综合征、镰状细胞疾病(镰状细胞性贫血)、史密斯·马格尼斯综合征、斯蒂克勒综合征、Tay-Sachs病、血小板缺乏症半径(TAR)综合征、特里格·柯林斯综合征、三染色体疾病、结节性硬化症、特纳综合征、尿素循环紊乱、冯·希佩尔·朗道病、Waardenburg综合征、威廉斯氏综合征、威尔逊病和Wiskott-Aldrich综合征。

在一些实施方式中,该疾病与肿瘤抗原的表达相关,例如,与该肿瘤抗原的表达相关的增生性疾病,癌前状态,癌症或与非癌相关的适应症,其在一些实施方式中可以包含靶标。选自B2M,CD247,CD3D,CD3E,CD3G, TRAC,TRBC1,TRBC2,HLA-A,HLA-B,HLA-C,DCK,CD52,FKBP1A, CIITA,NLRC5,RFXANK,RFX5,RFXAP或NR3C1,HAVCR2,LAG3, PDCD1,PD-L2,CTLA4,CEACAM(CEACAM-1,CEACAM-3和/或 CEACAM-5),VISTA,BTLA,TIGIT,LAIR1,CD160、2B4,CD80,CD86, B7-H3(CD113),B7-H4(VTCN1),HVEM(TNFRSF14或CD107),KIR,A2aR, MHC I类,MHC II类,GAL9,腺苷和TGFβ,或PTPN11 DCK,CD52,NR3C1, LILRB1,CD19;CD123;CD22;CD30;CD171;CS-1(也称为CD2子集1, CRACC,SLAMF7,CD319和19A24);C型凝集素样分子-1(CLL-1或 CLECL1);CD33;表皮生长因子受体变体III(EGFRvIII);神经节苷脂G2(GD2);神经节苷脂GD3(aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer); TNF受体家族成员B细胞成熟(BCMA);Tn抗原((Tn Ag)或 (GalNAca-Ser/Thr));前列腺特异性膜抗原(PSMA);受体酪氨酸激酶样孤儿受体1(ROR1);Fms样酪氨酸激酶3(FLT3);肿瘤相关糖蛋白72(TAG72);CD38; CD44v6;癌胚抗原(CEA);上皮细胞粘附分子(EPCAM);B7H3(CD276);套件(CD117);白介素13受体亚基α-2(IL-13Ra2或CD213A2);间皮素;白介素11受体α(IL-11Ra);前列腺干细胞抗原(PSCA);丝氨酸蛋白酶21(Testisin或 PRSS21);血管内皮生长因子受体2(VEGFR2);Lewis(Y)抗原;CD24;血小板衍生的生长因子受体β(PDGFR-β);阶段特异性胚胎抗原4(SSEA-4);CD20;叶酸受体α;受体酪氨酸蛋白激酶ERBB2(Her2/neu);n激酶ERBB2(Her2/neu);粘蛋白1,细胞表面缔合(MUC1);表皮生长因子受体(EGFR);神经细胞粘附分子(NCAM);采购前列腺酸磷酸酶(PAP);延伸因子2突变(ELF2M);以弗林 B2;成纤维细胞激活蛋白α(FAP);胰岛素样生长因子1受体(IGF-1受体),碳酸酐酶IX(CAIX);蛋白酶体(前体、巨蛋白因子)亚基,β型,9(LMP2);糖蛋白100(gp100);癌基因融合蛋白,由断点簇区域(BCR)和Abelson鼠白血病病毒病毒癌基因同源物1(Abl)(bcr-abl)组成;酪氨酸酶ephrin A型受体2(EphA2);岩藻糖基GM1;唾液酸化的路易斯粘附分子(sLe);神经节苷脂 GM3(aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);转谷氨酰胺酶5(TGS5);高分子量黑素瘤相关抗原(HMWMAA);邻乙酰基GD2神经节苷脂(OAcGD2);叶酸受体β;肿瘤内皮标记物1(TEM1/CD248);肿瘤内皮标志物7相关(TEM7R); claudin 6(CLDN6);甲状腺刺激激素受体(TSHR);G蛋白偶联受体C类5 组,成员D(GPRC5D);X染色体开放阅读框61(CXORF61);CD97;CD179a;间变性淋巴瘤激酶(ALK);聚唾液酸;胎盘特异性1(PLAC1);globoH糖神经酰胺(GloboH)的六糖部分;乳腺分化抗原(NY-BR-1);uroplakin 2(UPK2);甲型肝炎病毒细胞受体1(HAVCR1);肾上腺素受体β3(ADRB3);pannexin 3(PANX3); G蛋白偶联受体20(GPR20);淋巴细胞抗原6复合体,基因座K 9(LY6K);嗅觉受体51E2(OR51E2);TCRγ备用阅读框蛋白(TARP);Wilms肿瘤蛋白 (WT1);癌症/睾丸抗原1(NY-ESO-1);癌症/睾丸抗原2(LAGE-1a);黑色素瘤相关抗原1(MAGE-A1);位于12p染色体上的ETS易位变异基因 6(ETV6-AML);精子蛋白17(SPA17);X抗原家族,成员1A(XAGE1);血管生成素结合细胞表面受体2(Tie 2);黑色素瘤睾丸抗原-1(MAD-CT-1);黑色素瘤睾丸抗原2(MAD-CT-2);Fos相关抗原1;肿瘤蛋白p53(p53);p53突变体;前列腺素幸存端粒酶前列腺癌肿瘤抗原1(PCTA-1或Galectin 8),被T细胞 1(MelanA或MART1)识别的黑色素瘤抗原;大鼠肉瘤(Ras)突变体;人端粒酶逆转录酶(hTERT);肉瘤易位断点;黑色素瘤凋亡抑制剂(ML-IAP);ERG(跨膜蛋白酶,丝氨酸2(TMPRSS2)ETS融合基因);N-乙酰氨基葡萄糖氨基转移酶V(NA17);配对盒蛋白Pax-3(PAX3);雄激素受体;细胞周期蛋白B1;v-myc禽骨髓细胞瘤病病毒致癌基因神经母细胞瘤同源物(MYCN);Ras Homolog家庭成员C(RhoC);酪氨酸酶相关蛋白2(TRP-2);细胞色素P450 1B1(CYP1B1);CCCTC结合因子(锌指蛋白)样(BORIS或印迹部位调节剂的兄弟),T细胞3识别的鳞状细胞癌抗原(SART3);配对盒蛋白Pax-5(PAX5); proacrosin结合蛋白sp32(OY-TES1);淋巴细胞特异性蛋白酪氨酸激酶(LCK);激酶锚蛋白4(AKAP-4);滑膜肉瘤,X断点2(SSX2);先进糖基化终产物受体(RAGE-1);肾无处不在1(RU1);肾无处不在2(RU2);豆uma人乳头瘤病毒 E6(HPV E6);人乳头瘤病毒E7(HPV E7);肠道羧基酯酶;热激蛋白70-2 突变(mut hsp70-2);CD79a;CD79b;CD72;白细胞相关的免疫球蛋白样受体1(LAIR1);IgA受体的Fc片段(FCAR或CD89);白细胞免疫球蛋白样受体亚家族A成员2(LILRA2);CD300分子样家族成员f(CD300LF);C型凝集素结构域家族12成员A(CLEC12A);骨髓基质细胞抗原2(BST2);含有 EGF样模块的类粘蛋白样激素受体样2(EMR2);淋巴细胞抗原75(LY75); Glypican-3(GPC3);Fc受体样5(FCRLS);免疫球蛋白λ样多肽1(IGLL1), CD19,BCMA,CD70,G6PC,肌营养不良蛋白,包括通过缺失或切除修饰外显子51,DMPK,CFTR(囊性纤维化跨膜电导调节剂)。在实施方式中,靶标包括CD70或CD33的敲入和B2M的敲除。在实施方式中,靶标包含或不具有其他靶标基因的TRAC和B2M或TRAC B2M和PD1的敲除。在某些实施方式中,所述疾病是囊性纤维化,其靶向SCNN1A基因,例如非编码或编码区,例如启动子区,或转录序列,例如内含子或外显子序列,靶向敲入CFTR内含子2内的序列,例如可引入编码CFTR外显子3-27的CFTR序列; CFTR内含子10中的序列和序列,其中可引入编码CFTR外显子11-27的序列。

在实施方式中,该疾病是异色性白细胞营养不良,并且靶标是芳基硫酸酯酶A,该疾病是维斯科特-奥尔德里奇综合症,并且该靶标是维斯科特-奥尔德里奇综合症蛋白,该疾病是肾上腺白质营养不良,并且该靶标是ATP 结合盒DI,该疾病是人类免疫缺陷病毒,靶标是5-CC趋化因子受体或 CXCR4基因,疾病是β地中海贫血,靶标是血红蛋白β亚基,疾病是X连锁严重结合ID受体亚基γ,靶标是间白蛋白-2受体亚单位γ,疾病是多系统性溶酶体贮积病的胱氨酸病,靶标是胱氨酸,疾病是Diamon-Blackfan贫血,靶标是核糖体蛋白S19,疾病是范可尼贫血,靶标是范可尼贫血补充组(例如 FNACA)(FNACB,FANCC,FANCD1,FANCD2,FANCE,FANCF,RAD51C),该疾病是Shwachman-Bodian-Diamond Bodian-Diamond综合征,而目标是 Shwachman综合征e基因,该疾病是高雪氏病,目标是葡萄糖脑苷脂酶,该疾病是A血友病,目标是抗血友病因子OR因子VIII,圣诞节因子,丝氨酸蛋白酶,B血友病因子IX,该疾病是腺苷脱氨酶缺乏症(ADA-SCID),目标是腺苷脱氨酶,疾病是GM1神经节苷脂酶,目标是β-半乳糖苷酶,疾病是 II型糖原贮积病,庞贝病,疾病是酸性麦芽糖酶缺乏酸,目标是α-葡萄糖苷酶,该疾病是Niemann-Pick病,与SMPD1相关(鞘磷脂磷酸二酯酶1或A 和B型)酸,目标是鞘磷脂酶,该疾病是Krabbe病,球状细胞白细胞营养不良,目标是半乳糖苷酸神经酰胺酶或半乳糖苷神经酰胺脂酶,目标是半乳糖苷,人类白细胞抗原DR-15,DQ-6,该疾病是多发性硬化症(MS)DRB1,该疾病是单纯疱疹病毒1或2,目标是敲低RS1,RL2和/或LAT基因中的一个、两个或三个。在实施方式中,该疾病是HPV相关的癌症,其治疗包括编辑的细胞,该细胞包含结合分子,例如TCR或其抗原结合片段,以及抗体和其抗原结合片段,例如识别或结合人乳头瘤病毒的抗体。该疾病可以是乙肝,其目标是PreC、C、X、PreS1、PreS2、S、P和/或SP基因中的一个或多个。

在实施方式中,免疫疾病是严重的联合免疫缺陷(SCID),Omenn综合征,并且在一方面,靶标是重组激活基因1(RAG1)或白介素7受体(IL7R)。在特定实施方式中,该疾病是运甲状腺素蛋白淀粉样变性(ATTR),家族性淀粉样蛋白性心肌病,并且在一方面,靶标是TTR基因,包括TTR基因中的一个或多个突变。在具体实施方式中,该疾病是Α-1抗胰蛋白酶缺乏症(AATD) 或牵连Α-1抗胰蛋白酶的另一种疾病,例如GvHD、器官移植排斥反应、糖尿病、肝病、COPD、肺气肿和囊性纤维化,目标是SERPINA1。

在一些实施方式中,所述疾病是原发性高草酸尿症,在某些实施方式中,所述靶标包含乳酸脱氢酶A(LDHA)和羟酸氧化酶1(HAO 1)中的一种或多种。在实施方式中,所述疾病是原发性高草酸尿症1型(ph1)和其他丙氨酸- 乙醛酸氨基转移酶(agxt)基因相关的病症或失调,例如腺癌、慢性酒精中毒、阿尔茨海默氏病、库利氏贫血、动脉瘤、焦虑症、哮喘、恶性乳腺肿瘤、皮肤恶性肿瘤、肾细胞癌、心血管疾病、子宫颈恶性肿瘤、冠状动脉硬化症、冠心病、糖尿病、糖尿病、非糖尿病、非胰岛素依赖型、糖尿病性肾病、子痫、湿疹、亚急性心内膜炎、胶质母细胞瘤、II型糖原贮积病、感觉神经性听力减退(疾病)、肝炎、甲型肝炎、乙型肝炎、同型半胱氨酸尿症、遗传性感觉自主神经病1型、醛固酮增多症、高胆固醇血症、高草酸尿症、原发性高草酸尿症、高血压病、肾结石、肾脏疾病、慢性肾功能衰竭、平滑肌弓形瘤、代谢性疾病、先天性代谢错误、二尖瓣脱垂综合征、心肌梗塞、肿瘤转移、肾病综合征、肥胖症、卵巢疾病、牙周炎、多囊卵巢综合征、肾脏衰竭、成人呼吸窘迫综合征、视网膜疾病、脑血管病综合征、病毒性肝炎、牙齿脱落、卵巢早衰、原发性高血压、左心室肥大、偏头痛、皮肤黑色素瘤、高血压心脏病、慢性肾小球肾炎、先兆性偏头痛、继发性高血压、急性心肌梗死、主动脉粥样硬化、过敏性哮喘、主动脉粥样硬化、过敏性哮喘皮母细胞瘤、肺恶性肿瘤、原发性高草酸尿症I型、原发性高草酸尿症2型、炎性乳腺癌、子宫颈癌、再狭窄、出血性溃疡、婴儿广义糖原贮积病、肾结石症、慢性肾移植排斥反应、尿石症、皮肤刺伤、代谢综合征X、垫神经性高血压、颈动脉粥样硬化、癌变、乳腺癌、肺癌、肾病、微白蛋白尿、家族性视网膜母细胞瘤、收缩性心力衰竭缺血性中风、左心室收缩功能不全、马尾神经节副神经节瘤、多发性肝癌、草酸钙肾结石症、Ablepharon-Macrostomia综合征、冠状动脉疾病、肝癌、慢性肾脏疾病5期、变应性鼻炎(疾病)、Crigler Najjar 综合征2型和缺血性脑血管意外。在某些实施方式中,治疗针对肝脏。在实施方式中,该基因是AGXT,其细胞遗传学位置为2q37.3,并且基因组坐标在前链的染色体2上的位置240,868,479至240,880,502。

治疗还可以针对与胶原蛋白viiα1链(col7a1)基因相关的疾病或病症,例如皮肤恶性肿瘤、鳞状细胞癌、结肠直肠肿瘤、克罗恩病、大疱性表皮松解症、腹股沟疝、瘙痒症、精神分裂症、皮肤病、遗传性皮肤病、畸胎瘤、 Cockayne-Touraine病、表皮松解性大疱性肌营养不良症、结节性表皮松解性大疱、Hallopeau-Siemens病、大疱性皮肤病、胼胝体发育不良、性肌营养不良、水疱性口炎、表皮松解性大疱性皮炎指甲的皮肤和畸形、少年性肌阵挛性癫痫、食道鳞状细胞癌、金德勒皮肤癌、大疱性表皮松解性大疱性营养不良性表皮松解症(局部性)、局限性隐性营养不良性表皮松解性大疱性大疱病、全身性隐性营养不良、表皮松解性大疱、皮肤乳腺肿瘤、表皮松解性单纯性趾甲营养不良、新生儿的短暂性大疱性皮肤松解、常染色体隐性表皮松解性大肌萎缩变体和常染色体隐性表皮松解性大隐性肌萎缩。

在实施方式中,该疾病是靶向髓母细胞瘤I(WTI)和HLA表达细胞的急性髓细胞性白血病(AML)。在实施方式中,所述疗法是T细胞疗法,如本文其他地方所述,其包括具有WTI特异性TCR的工程化T细胞。在某些实施方式中,靶标是AML中的CD157。

在实施方式中,该疾病是血液疾病。在某些实施方式中,疾病是血友病,在一方面,靶标是因子XI。在其他实施方式中,所述疾病是血红蛋白病,例如镰状细胞病,镰状细胞性状,血红蛋白C病,血红蛋白C性状,血红蛋白 S/C病,血红蛋白D病,血红蛋白E病,地中海贫血,与血红蛋白相关的疾病氧亲和力增加,与血红蛋白相关的疾病,氧亲和力降低,不稳定的血红蛋白疾病,高铁血红蛋白血症。也可以治疗止血和X因子和XII因子缺乏症。在一些实施方式中,靶标是BCL11A基因(例如人BCL11a基因),BCL11a 增强子(例如人BCL11a增强子)或HFPH区(例如人HPFH区),β球蛋白,胎儿血红蛋白,球蛋白基因(例如,HBG1,HBG2或HBG1和HBG2),BCL11A 基因的类胡萝卜素特异性增强子(BCL11Ae)或其组合。

在实施方式中,靶基因座可以是RAC、TRBC1、TRBC2、CD3E、 CD3G、CD3D、B2M、CIITA、CD247、HLA-A、HLA-B、HLA-C、 DCK、CD52、FKBP1A、NLRC5、RFXANK、RFX5、RFXAP、NR3C1、CD274、HAVCR2、LAG3、PDCD1、PD-L2、HCF2、PAI、TFPI、PLAT、 PLAU、PLG、RPOZ、F7、F8、F9、F2、F5、F7、F10、F11、F12、 F13A1、F13B、STAT1、FOXP3、IL2RG、DCLRE1C、ICOS、MHC2TA、 GALNS、HGSNAT、ARSB、RFXAP、CD20、CD81、TNFRSF13B、SEC23B、PKLR、IFNG、SPTB、SPTA、SLC4A1、CPOEPB42、VFW、 SERPINCA1、CTLA4、CEACAM(例如CEACAM-1、CEACAM-3和/或 CEACAM-5)、VISTA、BTLA、TIGIT、LAIR1、CD160、2B4、CD80、 CD86、B7-H3(CD113)、B7-H4(VTCN1)、HVEM(TNFRSF14或CD107)、 KIR、A2aR、I类MHC、II类MHC、GAL9、腺苷和TGFβ、PTPN11及其组合。在实施方式中,基因组核酸序列内的靶序列在Chr 1: 5,250,094-5,250,237,-链,hg38;和-hg38。Chrl l:5,255,022-5,255,164,-链, HG38;非缺失HFPH区;曲线1:5,249,833至曲线1:5,250,237-链,hg38;曲线1:5,254,738至曲线1:5,255,164,-链,hg38;Chrl 1:5,249,833-5,249,927, -链,hg3;Chrl 1:5,254,738-5,254,851,-链,HG38;Chrl 1:5,250, 139-5,250,237,-链,hg38。

在实施方式中,该疾病与高胆固醇有关,并且提供了胆固醇的调节。在一些实施方式中,调节是通过靶PCSK9中的修饰来实现的。可牵涉PCSK9 并因此成为本文所述系统和方法目标的其他疾病包括无脂蛋白血症、腺瘤、动脉硬化、动脉粥样硬化、心血管疾病、胆石症、冠状动脉硬化、冠心病、非胰岛素依赖型糖尿病、高胆固醇血症、家族性高胆固醇血症、高胰岛素血症、高脂血症、家族性合并高脂血症、低β脂蛋白血症、慢性肾功能衰竭、肝病、肝脏肿瘤、黑色素瘤、心肌梗死、嗜睡症、肿瘤转移、肾母细胞瘤、肥胖症、皮脂瘤、肥胖症、黄瘤病、周围血管疾病、心肌缺血、血脂异常、葡萄糖耐量受损、黄瘤、多基因高胆固醇血症、继发于肝脏的恶性肿瘤、痴呆、超重、丙型肝炎、慢性、颈动脉粥样硬化、高脂蛋白血症H型、颅内颅内动脉粥样硬化、缺血性中风、急性冠脉综合征、主动脉钙化、心血管疾病、 lib型高脂蛋白血症、周围动脉疾病、II型家族性醛固酮过多症、家族性低脂蛋白血症、常染色体隐性高胆固醇血症、常染色体显性胆固醇血症、常染色体显性胆固醇血症事故和动脉硬化性心血管疾病NOS。在实施方式中,治疗可以靶向肝脏,即PCSK9活性的主要位置。

在实施方式中,所述疾病或病症是Hyper IGM综合征或以缺陷的CD40 信号转导为特征的病症。在某些实施方式中,CD40L外显子的插入用于恢复适当的CD40信号传导和B细胞类别开关重组。在特定实施方式中,在例如 T细胞或造血干细胞(HSC)的细胞中,在CD40L基因的外显子2-5中的一个或多个上对CD40配体(CD40L)进行编辑。

在实施方式中,该疾病是缺乏铁蛋白的先天性肌营养不良症(mdcmd)和其他层粘连蛋白α2(lama2)基因相关的病症或失调。该治疗可以针对肌肉,例如骨骼肌、平滑肌和/或心肌。在某些实施方式中,靶标是层粘连蛋白,α2(LAMA2),其也可以称为层粘连蛋白-12亚基α、层粘连蛋白-2亚基、层粘连蛋白4亚基α3、肌球蛋白重链、层粘连蛋白M链、LAMM、先天性肌营养不良症和肌球蛋白。LAMA2的细胞遗传学位置为6q22.33,基因组坐标位于前链第6号染色体上的128,883、141-129,516,563位置。在实施方式中,所治疗的疾病可以是缺乏肌球蛋白的先天性肌营养不良症(MDCMD)、肌萎缩性侧索硬化症、膀胱肿瘤、炭疽病、大肠癌、挛缩症、囊肿、杜氏肌营养不良症、疲劳、远视、肾血管性高血压、黑色素瘤、精神发育迟滞、肌病、肌肉营养不良、近视、肌炎、神经肌肉疾病、周围神经病变、屈光不正、精神分裂症、严重智力低下(IQ 20-34)、甲状腺肿瘤、烟草使用障碍、严重合并免疫缺陷、滑膜癌(疾病)、肿瘤进展、草莓痣、皮肤变性、小牙畸形、沃克- 沃堡先天性肌营养不良、慢性牙周炎、白细胞性脑病、认知障碍、福山型先天性肌营养不良、硬化性肌营养不良肌肉营养不良、神经病、肌肉眼脑疾病、肢体肌肉萎缩症麻疹、腰带、先天性肌营养不良(疾病)、肌肉纤维化、癌症复发、耐药性癫痫、呼吸衰竭、粘液样囊肿、呼吸异常、肌营养不良、先天性肌营养不良、先天性肌营养不良、结直肠癌、部分LAMA2缺陷导致的先天性肌营养不良和常染色体显性颅干骺端发育不良。

在某些实施方式中,靶标是AAVS1(PPPIR12C)、ALB基因、Angptl3基因、ApoC3基因、ASGR2基因、CCR5基因、FIX(F9)基因、G6PC基因、 Gys2基因、HGD基因、Lp(a)基因、Pcsk9基因、Serpinal基因、TF基因和 TTR基因。评估将HDR/NHEJ介导的cDNA敲入第一个外显子的效率可以利用cDNA敲入“安全港”位点,例如:单链或双链DNA与以下区域之一具有同源臂,例如:ApoC3(chr11:116829908-116833071),Angptl3 (chr1:62,597,487-62,606,305),Serpinal(chr14:94376747-94390692),Lp(a) (chr6:160531483-160664259),Pcsk9(chr1:55,039,475-55,064,852),FIX (chrX:139,530,736-139,563,458),ALB(chr4:73,404,254-73,421,411),TTR(chr1 8:31,591,766-31,599,023),TF(chr3:133,661,997-133,779,005),G6PC (chr17:42,900,796-42,914,432),Gys2(chr12:21,536,188-21,604,857),AAVS1 (PPP1R12C)(chr19:55,090,912-55,117,599),HGD (chr3:120,628,167-120,682,570),CCR5(chr3:46,370,854-46,376,206)或ASGR2 (chr17:7,101,322-7,114,310)。

一方面,靶标是可溶的超氧化物歧化酶1(SOD1),其可帮助治疗与基因相关的疾病或病症。在特定实施方式中,所述疾病或病症与SOD1相关,并且可以是例如腺癌、白蛋白尿、慢性酒精中毒、阿尔茨海默氏病、健忘症、淀粉样变性病、肌萎缩性侧索硬化症、贫血、自身免疫性溶血性贫血、镰状细胞性贫血、贫血、焦虑症、主动脉疾病、动脉硬化、类风湿性关节炎、窒息新生儿、哮喘、动脉粥样硬化、自闭症、自身免疫性疾病、巴雷特食管、白塞综合征、膀胱恶性肿瘤、乳腺恶性肿瘤、脑肿瘤、恶性肿瘤结肠癌、支气管癌、非小细胞肺癌、鳞状细胞癌、移行细胞癌、心血管疾病、颈动脉血栓形成、赘生性细胞转化、脑梗死、脑缺血、短暂性脑缺血发作、炭黑-玛丽 -牙病、霍乱、结肠炎、大肠癌、冠状动脉硬化症、冠心病缓解、新型隐球菌感染、耳聋、生命中断、脱水失调、老年性痴呆、抑郁症、接触性皮炎、糖尿病、糖尿病、实验性糖尿病、胰岛素依赖型糖尿病、非胰岛素依赖型糖尿病、、糖尿病性肾病、糖尿病性视网膜病、唐氏综合症、侏儒症、水肿、日本脑炎、毒性表皮坏死、颞叶癫痫症、皮疹、肌肉束、酒精性脂肪肝、胎儿发育迟缓、纤维肌痛、纤维肉瘤、破伤风X线型胶质瘤、头痛、部分听力下降、心脏骤停、心力衰竭、房间隔缺损、蠕虫病、血色素沉着症、溶血(疾病)、慢性肝炎、HIV感染、亨廷顿病、高胆固醇血症、高血糖症、增生、高血压疾病、甲状腺功能亢进症、低蛋白血症、低血压、自然低温、甲状腺功能低下、免疫缺陷综合症、免疫系统疾病、炎症、炎症性肠病、流行性感冒、肠道疾病、缺血、Kearns-Sayre综合征、圆锥角膜、肾结石、肾脏疾病、急性肾功能衰竭、慢性肾功能衰竭、多囊炎、白血病、髓样白血病、急性早幼粒细胞白血病、肝硬化、肝病、肝肿瘤、锁定综合征、慢性阻塞性气道疾病、肺肿瘤、系统性红斑狼疮、非霍奇金淋巴瘤、马查多-约瑟夫病、疟疾、恶性肿瘤胃、动物乳腺肿瘤、马凡氏综合症、脑膜脊髓球囊扩张、精神发育迟缓、二尖瓣狭窄、获得性牙齿氟中毒、运动障碍、多发性硬化症、肌肉僵硬、肌肉痉挛、肌肉萎缩、脊髓性肌肉萎缩、肌病、真菌病、心肌梗塞再灌注损伤、坏死、肾病、肾病综合征、神经变性神经系统疾病、神经痛、神经母细胞瘤、神经瘤、神经肌肉疾病、肥胖症、职业病、眼高血压、少精子症、变性多关节炎、骨质疏松症、卵巢癌、疼痛、胰腺炎、Papillon-Lefevre病、麻痹、帕金森病、苯丙氨酸尿毒症疾病、先兆子痫、前列腺肿瘤、蛋白质缺乏症、蛋白尿、牛皮癣、肺纤维化、肾动脉阻塞、再灌注损伤、视网膜变性、视网膜疾病、视网膜母细胞瘤、血吸虫病、曼氏血吸虫病、曼氏血吸虫病、精神分裂症、羊搔痒症、年龄脊髓受压、脑血管意外、蛛网膜下腔出血、进行性核上性麻痹、破伤风、三体性、特纳综合征、单极抑郁症、荨麻疹、白癜风、声带麻痹、肠扭转、体重增加、HMN(遗传性运动神经病)近端I型、运动神经元疾病、神经原纤维变性(形态逻辑异常)、烧灼感、冷漠、情绪波动、滑膜囊肿、白内障、偏头痛、坐骨神经病、感觉神经病、皮肤萎缩、肌肉无力、食管癌、舌面部颊运动障碍、特发性肺动脉高压、先兆性偏头痛、混合性传导-感觉神经性听力减退、缺铁性贫血、营养不良、朊病毒疾病、线粒体肌病、 MELAS综合征、慢性进行性眼外肌麻痹、全身性麻痹、早衰综合症、颤动、精神病症状、记忆力减退、肌肉退化、神经系统症状、胃出血、胰腺癌、脑部疾病、肝纤维化、肺恶性肿瘤、与年龄有关的黄斑变性、帕金森氏病、疾病进展、低血钾症、细胞色素C氧化酶缺乏症、原发性震颤、家族性运动神经元疾病、下运动神经元疾病、变性性脊髓病、糖尿病多发性神经病、肝和肝内胆道癌波斯湾综合症、老年斑、萎缩性、额颞痴呆、语义性痴呆、偏头痛、认知障碍、肝脏恶性肿瘤、胰腺恶性肿瘤、前列腺恶性肿瘤、纯自主神经衰竭、运动症状、痉挛、痴呆、神经退行性疾病、关岛慢性丙型肝炎、肌萎缩性侧索硬化症、四肢僵硬、多系统疾病、头皮脱落、前列腺癌、肝肺综合征、桥本病、进行性肿瘤病、乳腺癌、末期疾病、肺癌、迟发性运动障碍、淋巴结继发性恶性肿瘤、结肠癌癌、胃癌、中枢神经母细胞瘤、胸主动脉夹层动脉瘤、糖尿病性黄斑水肿、微白蛋白尿、大脑中动脉闭塞、大脑中动脉梗塞、上运动神经元体征、额颞叶大叶变性、记忆力减退、古典苯丙酮酸钾血症步态障碍、2型脊髓小脑性共济失调、路易体病、肌肉萎缩、脊髓小球、 21号染色体单一性、血小板增多症、皮肤上的斑点、药物诱发的肝损伤、遗传性脑白质萎缩症、脑缺血、卵巢肿瘤、颅骨病变、大血管病变、持续性肺动脉高压、卵巢恶性肿瘤、黏液样囊肿、玻璃疣、肉瘤、体重减轻、重度抑郁症、轻度认知障碍、退化性疾病、部分三体症、心血管疾病、听力障碍、认知障碍、输尿管结石、乳腺疾病肿瘤、大肠癌、慢性肾脏病、最小变化肾病综合征、非赘生性疾病、X连锁球脑脊髓萎缩、乳腺X线密度、正常张力性青光眼易感性、白癜风相关的多种自身免疫性疾病易感性1(发现)、肌萎缩性侧索硬化症和/或额颞叶性痴呆1、肌萎缩性侧索硬化症1、偶发性肌萎缩性侧索硬化症、单体性肌萎缩症、冠状动脉疾病、转化的偏头痛、返流、尿道上皮癌、运动障碍、肝癌、蛋白歧义失调、T43早幼粒细胞白血病、体重增加不利事件、线粒体细胞病变、特发性肺动脉高压、进行性cGVHD、感染、GRN相关额颞叶痴呆、线粒体病理和听力减退。

在特定的实施方式中,该疾病与基因ATXN1、ATXN2或ATXN3相关,其可以靶向治疗。在一些实施方式中,靶向位于ATXN1的外显子8、ATXN2 的外显子1或ATXN3的外显子10的CAG重复区。在实施方式中,该疾病是脊髓小脑共济失调3(sca3)、sca1或sca2和其他相关疾病,例如先天性异常、阿尔茨海默氏病、肌萎缩性侧索硬化症、共济失调、共济失调毛细血管扩张症、小脑共济失调、小脑疾病、舞蹈病、Cho囊性纤维化、精神抑郁症、抑郁症、肌张力障碍、食道肿瘤、外斜视、心脏骤停、亨廷顿病、马查多- 约瑟夫病、运动障碍、肌肉营养不良、肌强直性营养不良、嗜睡症、神经退行性变、神经母细胞瘤、帕金森病、无周围神经病变腿综合征、视网膜变性、色素性视网膜炎、精神分裂症、胆怯综合征、睡眠障碍、遗传性痉挛性截瘫、血栓栓塞、硬人综合征、脊髓小脑共济失调、食道癌、多发性神经病、热感、紫杉醇征、肌肉抽搐、肌肉抽搐神经系统症状、脑萎缩、帕金森病、蛋白质 S缺乏症、Cer小脑变性、家族性淀粉样神经病、葡萄牙型、痉挛综合征、垂直眼球震颤、眼球震颤终位、抗凝血酶III缺乏症、萎缩症、复杂的遗传性痉挛性截瘫、多系统萎缩、帕卢迪洛斯变性、肌张力障碍、纯正自主神经功能衰竭、血栓形成缺乏、先天性肌强直性营养不良、运动症状、神经病、神经退行性疾病、食道恶性肿瘤、视力障碍、激活的C抵抗力、绝症、肌强直、中枢神经母细胞瘤、失眠、阑尾共济失调、嗜睡症-多发性综合症、 Machado-Joseph病I、Machado-Joseph疾病II型、Machado-Joseph疾病III 型、齿状核红核苍白球丘脑下部核萎缩、步态共济失调、脊髓小脑共济失调1型、脊髓小脑共济失调2型、脊髓小脑共济失调6型(失调)、脊髓小脑共济失调7型、肌肉脊髓小球型、基因组不稳定性、情节性共济失调2型(疾病)、 X线脊髓萎缩症、脆性X震颤/共济失调综合症、因激活的C蛋白抗性导致的血栓形成性疾病(失调)、肌萎缩性侧索硬化症、神经元核内包涵体疾病、遗传性抗凝血酶II缺乏症和迟发性帕金森病。

在实施方式中,该疾病与肿瘤抗原-癌症或非癌症相关的适应症的表达有关,例如急性淋巴白血病、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、慢性淋巴细胞性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤。在实施方式中,靶标可以是TET2内含子,TET2内含子-外显子连接,chr4基因组区域内的序列。

在实施方式中,可以治疗神经退行性疾病。在特定实施方式中,靶标是突触核蛋白(SNCA)。在某些实施方式中,所治疗的疾病是与疼痛有关的疾病,包括先天性疼痛不敏感、压迫性神经病、阵发性极端疼痛疾病、高级房室传导阻滞、小纤维神经病和家族性发作性疼痛综合征2。在某些实施方式中,靶标是钠通道、电压门控、X型α子单元(SCNIOA)。

在某些实施方式中,造血干细胞和祖干细胞被编辑,包括敲入。在特定的实施方式中,敲入用于治疗溶酶体贮积病,糖原贮积病,粘多糖多糖或蛋白质分泌将改善该疾病的任何疾病。在一实施方式中,该疾病是镰状细胞病 (SCD)。在另一个实施方式中,该疾病是β-地中海贫血。

在某些实施方式中,T细胞或NK细胞用于癌症治疗,并可包括包含重组受体(例如CAR)和一种或多种选自CCR7+、4-1BB+(CD137+)、TIM3+、 CD27+,CD62L+、CD127+、CD45RA+、D45RO-、t-betl'w、IL-7Ra+、 CD95+、IL-2RP+、CXCR3+或LFA-1+的表型标志物的T细胞。在某些实施方式中,用于癌免疫疗法的T细胞的编辑包括改变一个或多个T细胞表达的基因,例如FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、B2M、TRAC 和TRBC基因中的一个或多个。在一些实施方式中,编辑包括引入到CBLB 靶位点中或附近的改变,以减少T细胞中的CBLB基因表达以治疗增生性疾病,并且可以包括在一个或多个CBLB靶位点处的较大插入或缺失。TGFBR2 靶序列的T细胞编辑可以例如位于TGFBR2基因的外显子3、4或5中,并用于癌症和淋巴瘤治疗。

可以编辑用于移植的细胞,并且可以包括对细胞的一种或多种免疫原性基因(例如HLA基因)进行等位基因特异性修饰,例如HLA-A、HLA-B、 HLA-C、HLA-DRB1、HLA-DRB3/4/5、HLA-DQ和HLA-DP MiHA以及任何其他I类或II类MHC基因或基因座,其中可能包括将一个或多个匹配的受体HLA等位基因递送至原始位置找到一个或多个不匹配的供体HLA等位基因,并且可以包括将一个或多个匹配的受体HLA等位基因插入“安全港”基因座。在一个实施方式中,该方法进一步包括在基因中引入用于体内选择的化疗抗性基因。

方法和系统可以靶向肌营养不良症肌强直蛋白激酶(DMPK)进行编辑,在特定实施方式中,靶标是DMPK基因的3'非翻译区(UTR)中的CTG三核苷酸重复。与DMPK相关的疾病或疾病包括动脉粥样硬化、无精子症、肥厚型心肌病、乳糜泻、先天性染色体疾病、糖尿病、局灶性肾小球硬化症、亨廷顿病、性腺机能减退、肌肉萎缩、肌病、肌营养不良、肌强直、肌萎缩性疾病、轻瘫、精神分裂症、白内障、脊髓小脑性共济失调、肌肉无力、肾上腺皮质营养不良、中心核肌病、间质纤维化、强直性肌营养不良、精神异常、X连锁性Charcot-Marie-Tooth病、先天性强直性营养不良、双侧性白内障先天性纤维类型失调、肌强直性疾病、多系统障碍、3-甲基谷氨酸酸尿症 3型、心脏事件、心源性晕厥、先天性结构性肌病、精神障碍、肾上腺神经病、肌营养不良症2和智力障碍。

在实施方式中,该疾病是先天性代谢错误。该疾病可以选自碳水化合物代谢紊乱(糖原贮积病、G6PD缺乏症),氨基酸代谢紊乱(苯酮尿症、枫糖浆尿病、戊二酸血症1型),尿素循环障碍或尿素循环缺陷(氨基甲酰基磷酸合成酶I缺乏症),有机酸代谢紊乱(链蛋白尿症,2-羟基戊二酸尿症),脂肪酸氧化/线粒体代谢紊乱(中链酰基辅酶A脱氢酶缺乏症),卟啉代谢紊乱(急性间歇性卟啉症),嘌呤紊乱/嘧啶代谢(Lesch-Nynan综合征),类固醇代谢障碍 (类脂性先天性肾上腺增生,先天性肾上腺增生),线粒体功能障碍 (Kearns-Sayre综合征),过氧化物酶体功能障碍(Zellweger综合征)或溶酶体贮积症(高雪氏病、尼曼-皮克病)。

在实施方式中,靶标可包含重组激活基因1(RAG1)、BCL11A、PCSK9、层粘连蛋白、α2(lama2)、ATXN3、丙氨酸-乙醛酸转氨酶(AGXT)、VII型胶原VII链(COL7a1)、脊髓小脑共济失调1型蛋白(ATXN1)、类血管生成素 3(ANGPTL3)、Frataxin(FXN)、超氧化物酶歧化酶1、可溶性(SOD1)、突触核蛋白、α(SNCA)、钠通道、电压门控、X型Α亚基(SCN10A)、脊髓小脑共济失调2型蛋白(ATXN2)、肌营养不良症肌强直蛋白激酶(DMPK)、11号染色体上的β球蛋白基因座、中链脂肪酸的酰基辅酶A脱氢酶(ACADM)、长链3-羟基辅酶A脱氢酶长链脂肪酸(HADHA)、超长链脂肪酸的酰基辅酶A 脱氢酶(ACADVL)、载脂蛋白C3(APOCIII)、运甲状腺素蛋白(TTR)、血管生成素样4(ANGPTL4)、钠电压门控通道Α亚基9(SCN9A)、白介素7受体 (IL7R)、葡萄糖6磷酸酶、催化(G6PC)、遗传性血色素沉着病(HFE)、 SERPINA1、C9ORF72、β-珠蛋白、肌营养不良蛋白、γ-珠蛋白。

在某些实施方式中,所述疾病或病症与载脂蛋白C3(APOCIII)有关,所述载脂蛋白C3可以被靶向用于编辑。在实施方式中,所述疾病或病症可以是血脂异常、2型高脂蛋白血症、狼疮肾炎、威尔姆斯肿瘤5、病态肥胖和生精、青光眼、糖尿病性视网膜病、关节炎、肾功能不全胆汁淤积综合症、认知障碍、对心肌梗塞的反应改变、G对甘油三酸酯生物合成过程、肾功能不全、慢性、高脂血症、慢性肾脏衰竭、载脂蛋白C-III缺乏症、冠心病、新生儿糖尿病、新生儿、先天性甲状腺功能减退、高胆固醇血症常染色体显性3、高脂蛋白血症、III型高脂血症的积极调节疾病、肾动脉阻塞、代谢综合征X、高脂血症、家族性合并症、胰岛素抵抗、短暂性婴儿高甘油三酯血症、糖尿病性肾病、糖尿病(1型)、有或没有眼部异常的肾病综合征5和肾综合征出血热。

在某些实施方式中,靶标是血管生成素样4(ANGPTL4)。可以治疗的与 ANGPTL4相关的疾病或紊乱包括ANGPTL4与血脂异常、血浆甘油三酯水平低、血管生成调节剂和调节肿瘤发生以及严重的糖尿病性视网膜病、增生性糖尿病视网膜病变和非增生性糖尿病视网膜病变相关。

在实施方式中,编辑可用于治疗脂肪酸疾病。在某些实施方式中,靶标是ACADM,HADHA,ACADVL中的一种或多种。在实施方式中,靶向编辑是选自中链脂肪酸的酰基辅酶A脱氢酶(ACADM)基因,长链脂肪酸的长链3-羟基辅酶A脱氢酶(HADHA)基因和超长链脂肪酸(ACADVL)基因的酰基辅酶A脱氢酶。一方面,该疾病是中链酰基辅酶A脱氢酶缺乏症(MCADD),长链3-羟基辅酶A脱氢酶缺乏症(LCHADD)和/或极长链酰基辅酶A脱氢酶缺乏症(VLCADD)。

免疫正交直系同源物

在一些实施方式中,当需要在受试者中表达或施用CRISPR酶时,可以通过向受试者顺序表达或施用CRISPR酶的免疫正交直系同源物来降低 CRISPR酶的免疫原性。如本文所用,术语“免疫正交直系同源物”是指具有相似或基本相同的功能或活性,但是与彼此产生的免疫反应没有或具有低交叉反应性的直系同源蛋白质。在一些实施方式中,此类直系同源物的顺序表达或施用引起低或无继发免疫应答。免疫正交直系同源物可以避免被抗体(例如在直系同源物表达或施用之前宿主中存在的抗体)中和。表达直系同源物的细胞可以避免被宿主的免疫系统清除(例如被激活的CTL清除)。在一些实例中,来自不同物种的CRISPR酶直系同源物可以是免疫正交直系同源物。

免疫正交直系同源物可以通过分析一组候选直系同源物的序列,结构和 /或免疫原性来鉴定。在示例方法中,可以通过以下方法来鉴定一组免疫正交直系同源物:a)比较一组候选直系同源物(例如,来自不同物种的直系同源物) 的序列,以鉴定具有低序列相似性或无序列相似性的候选子集;b)评估候选者子集中各成员之间的免疫重叠,以识别没有免疫重叠或免疫重叠低的候选者。在某些情况下,可以通过确定候选直系同源物与宿主的MHC(例如I型和/或MHC II型)之间的结合(例如亲和力)来评估候选者之间的免疫重叠。替代地或另外地,可以通过确定候选直系同源物的B细胞表位来评估候选者之间的免疫重叠。在一个实例中,可以使用Moreno AM等于2018年1月10 日在线发表于doi:doi.org/10.1101/245985上的BioRxiv中描述的方法鉴定免疫正交直系同源物。

患者特异性筛查方法

靶向RNA的核酸靶向系统可用于筛选患者或患者样品中是否存在特定 RNA。

转录物检测方法

本发明的效应子蛋白和系统可用于特异性检测细胞或其他样品中的 RNA。在存在目标RNA靶标的情况下,引导依赖性CRISPR-Cas核酸酶活性可能伴随着针对附带靶标的非特异性RNA酶活性。为了利用RNase活性,所需的只是可检测地裂解的报告底物。例如,报道分子可以包含RNA,其在一端标记有荧光报道分子(fluor),而在另一端标记有淬灭剂。在没有 CRISPR-Cas RNase活性的情况下,淬灭剂的物理接近性将荧光从荧光抑制到低水平。当通过存在感兴趣的RNA靶标和合适的引导RNA激活 CRISPR-Cas靶标特异性切割时,含RNA的报告分子被非特异性切割,并且荧光和猝灭剂在空间上分离。当被适当波长的光激发时,这会导致荧光发出可检测的信号。在一种示例性测定方法中,将CRISPR-Cas效应子,目标靶标特异性引导RNA和报道分子添加到细胞样品中。荧光增加表明存在感兴趣的RNA靶标。在另一示例性方法中,提供了一种检测阵列。阵列的每个位置均配有CRISPR-Cas效应子,报道分子和目标靶标特异性引导RNA。取决于要进行的测定,在阵列的每个位置处的目标靶标特异性引导RNA可以相同,不同或组合。例如,当需要测试单个来源样品中的一个或多个目标时,可能会提供不同的目标感兴趣的特定引导RNA。可能在每个位置提供相同的目标特异性靶引导RNA,例如,当需要为同一目标测试多个样品时。

在某些实施方式中,CRISPR-Cas在体外系统或细胞中瞬时或稳定地提供或表达,并靶向或触发非特异性切割细胞核酸。在一个实施方式中,将 CRISPR-Cas工程化以敲低ssDNA,例如病毒ssDNA。在另一个实施方式中,将CRISPR-Cas工程化以敲低RNA。可以设计该系统,使得敲除依赖于细胞或体外系统中存在的靶DNA,或通过向该系统或细胞中添加靶核酸来触发。

在一个实施方式中,将CRISPR-Cas系统工程化以非特异性地切割细胞的亚群中的RNA,所述细胞的亚群可通过异常DNA序列的存在而区分,例如,异常DNA的切割可能是不完全的或无效的。在一个非限制性实例中,靶向存在于癌细胞中并驱动细胞转化的DNA易位。经历染色体DNA修复的细胞亚群可以存活,而非特异性的核糖核酸酶活性则有利地导致潜在存活者的细胞死亡。

应用的额外方面

本发明在例如基因治疗、药物筛选、疾病诊断和预后方面具有广泛的应用。

术语“多核苷酸”,“核苷酸”,“核苷酸序列”,“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸的聚合形式,即脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、从连锁分析中定义的基因座(基因座)、外显子、内含子、信使 RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和底物。该术语还包括具有合成主链的核酸样结构,参见例如Eckstein, 1991;Baserga等,1992;Milligan,1993;WO 97/03211;WO 96/39154;Mata, 1997;Strauss-Soukup,1997;和Samstag,1996。多核苷酸可以包含一个或多个修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在的话,可以在聚合物组装之前或之后对核苷酸结构进行修饰。核苷酸的序列可以被非核苷酸组分打断。多核苷酸可在聚合后进一步修饰,例如通过与标记组分缀合。如本文所用,术语“野生型”是本领域技术人员理解的术语,是指与突变体或变体形式不同的自然存在的生物,菌株,基因或特征的典型形式。“野生型”可以是基线。如本文所使用的,术语“变体”应被理解为表示具有与自然界中所发生的模式不同的样式的品质的展现。术语“非自然发生”或“工程化”可互换使用,表示人为介入。当提及核酸分子或多肽时,该术语是指该核酸分子或多肽至少基本上不含至少一种其他组分,它们在自然界中是自然缔合的,以及在自然界中发现的。“互补性”是指核酸通过传统的Watson-Crick碱基配对或其他非传统类型与另一核酸序列形成氢键的能力。互补性百分数表示可以与第二个核酸序列(例如10个中的5个、6个、7个、8个、9个、10 个)形成氢键(例如Watson-Crick碱基配对)的核酸分子中的残基百分比是 50%,60%,70%,80%,90%和100%互补)。“完全互补”是指核酸序列的所有连续残基将与第二核酸序列中相同数目的连续残基氢键键合。如本文所用,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补度,或指在严格条件下杂交的两个核酸。如本文所用,用于杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交而基本上不与非靶序列杂交的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993),Laboratory Techniques InBiochemistry And Molecular Biology-Hybridization With Nucleic Acid ProbesPart I,Second Chapter“Overview of principles of hybridization and thestrategy of nucleic acid probe assay”,Elsevier,N.Y.之中。当提及多核苷酸序列时,那么也设想了互补或部分互补的序列。这些优选能够在高度严格的条件下与参考序列杂交。通常,为了最大化杂交速率,选择相对严格的杂交条件:比热熔点(Tm)低约20至25℃。Tm是在定义的离子强度和pH下溶液中50%的特定靶序列与完美互补的探针杂交时的温度。通常,为了要求杂交序列具有至少约85%的核苷酸互补性,将高度严格的洗涤条件选择为比Tm低约5至 15℃。为了要求杂交序列的至少约70%的核苷酸互补性,将中等严格的洗涤条件选择为比Tm低约15至30℃。高度允许(非常低的严格性)洗涤条件可能比Tm低50℃,从而允许杂交序列之间的高度错配。本领域技术人员将认识到,杂交和洗涤阶段中的其他物理和化学参数也可以被改变以从靶序列和探针序列之间的特定同源性水平影响可检测到的杂交信号的结果。优选的高度严格条件包括在42℃下于50%甲酰胺、5xSSC和1%SDS中孵育,或在65℃在5xSSC和1%SDS中孵育,并在0.2xSSC和0.1%SDS中洗涤。65℃。“杂交”是指一种或多种多核苷酸反应形成复合物的反应,该复合物通过核苷酸残基的碱基之间的氢键而稳定化。氢键可以通过Watson Crick碱基配对, Hoogstein结合或以任何其他序列特异性方式发生。该复合物可以包括形成双链体结构的两条链,形成多链复合物的三条或更多条链,一条自杂交链,或这些的任何组合。杂交反应可以构成更广泛过程中的一个步骤,例如PCR 的启动或酶对多核苷酸的切割。能够与给定序列杂交的序列称为给定序列的“补体”。如本文所用,术语“基因组基因座”或“基因座”(多个基因座)是基因或 DNA序列在染色体上的特定位置。“基因”是指编码多肽或RNA链的DNA 或RNA片段,该片段具有在生物体中发挥功能的功能,因此是生物体中遗传的分子单元。为了本发明的目的,可以认为基因包括调节基因产物产生的区域,无论这些调节序列是否与编码和/或转录序列相邻。因此,基因包括但不限于启动子序列,终止子,翻译调节序列,如核糖体结合位点和内部核糖体进入位点,增强子,沉默子,绝缘子,边界元件,复制起点,基质附着位点和基因座控制区域。如本文所用,“基因组基因座的表达”或“基因表达”是将来自基因的信息用于功能性基因产物的合成的过程。基因表达的产物通常是蛋白质,但是在非蛋白质编码基因(例如rRNA基因或tRNA基因)中,产物是功能性RNA。基因表达的过程被所有已知的生命-真核生物(包括多细胞生物),原核生物(细菌和古细菌)和病毒所利用,以生成能够存活的功能性产物。如本文所用,基因或核酸的“表达”不仅涵盖细胞基因表达,而且涵盖在克隆系统中以及在任何其他情况下核酸的转录和翻译。如本文所用,“表达”还指从DNA模板转录多核苷酸的过程(例如转化为mRNA或其他RNA转录物)和/或随后将转录的mRNA翻译为肽,多肽的过程。或蛋白质。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则表达可包括在真核细胞中剪接mRNA。术语“多肽”,“肽”和“蛋白质”在本文可互换使用,是指任何长度的氨基酸的聚合物。该聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且可以被非氨基酸中断。该术语还涵盖已被修饰的氨基酸聚合物。例如,二硫键的形成,糖基化,脂化,乙酰化,磷酸化或任何其他操作,例如与标记组分的缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L旋光异构体,以及氨基酸类似物和拟肽。如本文所用,术语“结构域”或“蛋白质结构域”是指可以独立于蛋白质链的其余部分而存在和起作用的蛋白质序列的一部分。如本发明的方面所述,序列同一性与序列同源性有关。同源性比较可以通过眼睛进行,或更通常地,借助于容易获得的序列比较程序进行。这些可商购的计算机程序可以计算两个或更多个序列之间的同源性百分比(%),还可以计算两个或更多个氨基酸或核酸序列共有的序列同一性。

[1]如本文所用,术语“野生型”是本领域技术人员理解的术语,是指与突变体或变体形式不同的自然存在的生物,菌株,基因或特征的典型形式。“野生型”可以是基线。

如本文所使用的,术语“变体”应被理解为表示具有与自然界中所发生的模式不同的样式的品质的展现。术语“非自然发生”或“工程化”可互换使用,表示人为介入。当提及核酸分子或多肽时,该术语是指该核酸分子或多肽至少基本上不含至少一种其他组分,它们在自然界中是自然缔合的,以及在自然界中发现的。在所有方面和实施例中,无论它们是否包括这些术语,应理解,优选地,其可以是任选的,因此优选地包括或不优选地不包括。此外,术语“非天然存在的”和“工程化的”可以互换使用,因此可以单独使用或组合使用,并且一个或另一个可以代替两者的提及。特别地,“工程化的”代替“非自然发生的”或“非自然发生的和/或工程化的”是优选的。

序列同源性可以通过本领域已知的许多计算机程序中的任何一种来生成,例如BLAST或FASTA等。用于进行这种比对的合适的计算机程序是 GCG Wisconsin Bestfit软件包(美国威斯康星大学;Devereux)。等人,1984,核酸研究12:387)。除可以执行序列比较之外的其他软件的示例包括但不限于BLAST软件包(请参见Ausubel等,1999同上,第18章),FASTA(Atschul 等,1990,J。Mol。Biol。,403-410)和GENEWORKS比较工具套件。BLAST 和FASTA均可用于离线和在线搜索(请参见Ausubel等,1999同上,第7-58 至7-60页)。但是,最好使用GCG Bestfit程序。可以在连续序列上计算百分比(%)序列同源性,即,一个序列与另一序列比对,一个序列中的每个氨基酸或核苷酸直接与另一序列中相应的氨基酸或核苷酸进行比较,一个残基为一个时间。这称为“空位”对齐。通常,仅在相对短数量的残基上进行这种无缺口的比对。尽管这是一种非常简单且一致的方法,但是它没有考虑到例如在其他相同的序列对中,一个插入或缺失可能导致以下氨基酸残基失配,从而潜在地导致当进行整体比对时,同源性百分比大大降低。因此,大多数序列比较方法被设计为产生最佳比对,该比对考虑了可能的插入和缺失而不会过度惩罚总体同源性或同一性得分。这是通过在序列比对中插入“缺口”以尝试最大化局部同源性或同一性来实现的。但是,这些更复杂的方法将“空位罚分”分配给比对中出现的每个空位,以便对于相同数目的相同氨基酸,以尽可能少的空位进行序列比对-反映了两个比较序列之间更高的相关性-可能会获得比许多差距更高的分数。通常使用“亲和缺口成本”,其对于缺口的存在收取相对较高的成本,并对缺口中的每个后续残基收取较小的损失。这是最常用的差距评分系统。当然,高空位罚分可以产生具有较少空位的优化比对。大多数比对程序都允许修改空位罚分。但是,在使用此类软件进行序列比较时,最好使用默认值。例如,当使用GCG Wisconsin Bestfit软件包时,氨基酸序列的默认空位罚分对于空位是-12,对于每个延伸是-4。因此,最大同源性百分比的计算首先需要考虑缺口罚分的情况下产生最佳比对。用于进行这种比对的合适的计算机程序是GCG Wisconsin Bestfit软件包(Devereux 等,1984Nuc.Acids Research 12p387)。除了可以进行序列比较之外的其他软件的实例包括但不限于BLAST程序包(参见Ausubel等人,1999Short Protocols in Molecular Biology,第四版-第18章),FASTA(Altschul等,1990J. Mol.Biol.403-410)和GENEWORKS比较工具套件。BLAST和FASTA都可用于脱机和在线搜索(参见Ausubel等,1999,Short Protocols in Molecular Biology,pages 7-58至7-60)。但是,对于某些应用程序,最好使用GCG Bestfit 程序。还提供了一种称为BLAST2Sequences的新工具来比较蛋白质和核苷酸序列(参见FEMS Microbiol Lett.1999 174(2):247-50;FEMS Microbiol Lett. 1999 177(1):187-8和美国国家卫生研究院网站上的国家生物技术中心信息网站)。尽管可以根据同一性来衡量最终的同源性百分比,但比对过程本身通常不是基于全有或全无对比较。取而代之的是,通常使用缩放的相似性得分矩阵,该矩阵基于化学相似性或进化距离为每个成对比较分配得分。通常使用的这种矩阵的一个示例是BLOSUM62矩阵-BLAST程序套件的默认矩阵。如果提供的话,GCG威斯康星州程序通常使用公用默认值或自定义符号比较表(有关更多详细信息,请参见用户手册)。对于某些应用程序,最好使用GCG 包的公共默认值,或者在其他软件的情况下,使用默认矩阵,例如BLOSUM62。可替代地,可以基于类似于CLUSTAL(Higgins DG&Sharp PM (1988),Gene 73(1),237-244)的算法,使用DNASISTM(Hitachi Software)中的多重比对特征来计算同源性百分比。一旦软件产生了最佳比对,就可以计算同源性百分比,最好是序列同一性百分比。该软件通常将其作为序列比较的一部分,并生成数值结果。该序列还可以具有氨基酸残基的缺失,插入或取代,其产生沉默变化并产生功能上等同的物质。可以根据氨基酸特性(例如残基的极性,电荷,溶解度,疏水性,亲水性和/或两亲性质)的相似性来进行有意的氨基酸取代,因此将氨基酸一起分组功能组。氨基酸可仅基于其侧链的性质而分组在一起。但是,也包含突变数据会更有用。出于结构原因,由此衍生的氨基酸组可能是保守的。这些集合可以以维恩图的形式描述 (Livingstone C.D.和Barton G.J.(1993)“Proteinsequence alignments:a strategy for the hierarchical analysis of residueconservation”Comput.Appl.Biosci.9: 745-756)(Taylor W.R.(1986)“Theclassification of amino acid conservation”J. Theor.Biol.119;205-218)。可以例如根据表7制备保守性,该表7描述了公认的氨基酸的维恩图分组。

术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选为哺乳动物,更优选为人。哺乳动物包括但不限于鼠类,猿猴,人类,农场动物,运动动物和宠物。还包括体内获得或体外培养的生物实体的组织,细胞及其后代。

术语“治疗剂”,“可治疗剂”或“治疗剂”可互换使用,并且是指在施用于受试者时赋予一些有益作用的分子或化合物。有益效果包括启用诊断确定;改善疾病,症状,病症或病理状况;减少或预防疾病,症状,病症或病状的发作;并且通常可以抵抗疾病,症状,疾病或病理状况。如本文所用,“治疗”或“疗法”或“缓解”或“改善”可互换使用。这些术语是指获得有益或期望结果的方法,包括但不限于治疗益处和/或预防益处。治疗益处是指对一种或多种治疗中的疾病,病症或症状的任何与治疗有关的改善或作用。为了预防有益,可以将所述组合物施用于有发展为特定疾病,病症或症状的风险的受试者,或施用于报告疾病的一种或多种生理症状的受试者,即使该疾病,病症或症状也是如此。可能尚未显现。术语“有效量”或“治疗有效量”是指足以实现有益或期望结果的试剂的量。治疗有效量可以根据以下一项或多项而变化:受试者和所治疗的疾病状况,受试者的体重和年龄,疾病状况的严重程度,给药方式等,可以通过以下方式容易地确定:本领域普通技术之一。该术语还适用于将提供图像以通过本文所述的任何一种成像方法进行检测的剂量。具体剂量可以根据以下一项或多项而变化:所选的特定试剂,要遵循的给药方案,是否与其他化合物联合给药,给药时间,要成像的组织以及体内的物理递送系统。它是随身携带的。

除非另有说明,否则本发明的实施采用免疫学,生物化学,化学,分子生物学,微生物学,细胞生物学,基因组学和重组DNA的常规技术,它们在本领域技术范围内。参见Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,2nd edition(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel,et al.eds.,(1987));the series METHODS IN ENZYMOLOGY(Academic Press,Inc.):PCR 2:A PRACTICALAPPROACH(M.J.MacPherson,B.D.Hames and G.R.Taylor eds. (1995)),Harlow和Lane,eds.(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE(R.I.Freshney编辑(1987))。本发明的几个方面涉及包含一个或多个载体,或这样的载体的载体系统。可设计载体以在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞如大肠杆菌,昆虫细胞(使用杆状病毒表达载体),酵母细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel, GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185, Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调节序列和T7聚合酶。本发明的实施方式包括可能包含同源取代的序列(多核苷酸或多肽)(取代和置换在本文中均用于表示现有氨基酸残基或核苷酸与替代残基或核苷酸的互换),即在氨基酸的情况下,类似的取代,如碱性的对碱性,酸性的对酸性,极性的对极性等,也可以发生非同源的取代,即从一类残基到另一类残基,或者涉及包括非天然氨基酸,例如鸟氨酸(以下称为Z),二氨基丁酸鸟氨酸(以下称为B),正亮氨酸鸟氨酸(以下称为O),吡啶基丙氨酸,噻吩丙氨酸,萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括合适的间隔基,其可以插入序列的任何两个氨基酸残基之间,除了氨基酸间隔基例如甘氨酸或β-丙氨酸残基外,所述烷基还包括烷基例如甲基,乙基或丙基。本领域技术人员可以很好地理解另一种形式的变异,其涉及类肽形式的一个或多个氨基酸残基的存在。为避免疑问,“类肽形式”用于表示变异的氨基酸残基,其中α-碳取代基位于残基的氮原子上,而不是α-碳。类肽形式的肽的制备方法是本领域已知的,例如Simon RJ等,PNAS(1992)89(20),9367-9371,和Horwell DC,TrendsBiotechnol.(1995)13(4),132-134。同源性建模:其他CRISPR-Cas直系同源物中的相应残基可通过Zhang等,2012(Nature;490(7421):556-60)和Chen等, 2015(PLoS Comput Biol;11(5):e1004248)的方法(计算蛋白-蛋白相互作用 (PPI)的方法,其用于预测域-基序界面介导的相互作用)鉴定。PrePPI(预测PPI) 是一种基于结构的PPI预测方法,它使用贝叶斯统计框架将结构证据与非结构证据结合在一起。该方法涉及获取一对查询蛋白,并使用结构比对来鉴定与其实验确定的结构或同源性模型相对应的结构代表。通过考虑整体和局部几何关系,结构对齐还可用于识别近邻和远邻结构邻居。每当结构代表的两个邻居形成蛋白质数据库中报告的复合物时,这就会定义一个用于对两个查询蛋白质之间的相互作用进行建模的模板。通过将代表性结构叠加在模板中其对应的结构邻居上来创建复合物的模型。这种方法在Dey等,2013(Prot Sci; 22:359-66)中进一步描述。

为了本发明的目的,扩增是指使用能够以合理的保真度复制靶序列的引物和聚合酶的任何方法。可以通过天然或重组DNA聚合酶(例如TaqGold

在一些实施方式中,提供了引导RNA或crRNA中的环。这可以是茎环或四环。该环优选是GAAA,但不限于该序列或实际上仅是4bp的长度。实际上,用于发夹结构的优选的环形成序列的长度为四个核苷酸,并且最优选具有序列GAAA。但是,可以使用更长或更短的循环序列,也可以使用其他序列。序列优选包括核苷酸三联体(例如AAA)和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。

在实施本文公开的任何方法中,可以通过本领域已知的一种或多种方法将合适的载体引入细胞或胚胎,所述方法包括但不限于显微注射,电穿孔,声纳穿孔,生物弹药,磷酸钙介导的转染,阳离子转染,脂质体转染,树状大分子转染,热休克转染,核转染,磁转染,脂质转染,转染,光学转染,专有试剂对核酸的吸收以及通过脂质体、免疫脂质体、病毒体或人工病毒体的递送。在一些方法中,通过显微注射将载体引入胚胎。可以将一种或多种载体微注射到胚胎的核或细胞质中。在一些方法中,可以通过核转染将一种或多种载体引入细胞。

可设计载体以在原核或真核细胞中表达CRISPR转录物(例如核酸转录物,蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞如大肠杆菌,昆虫细胞(使用杆状病毒表达载体),酵母细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步讨论。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调节序列和T7聚合酶。

可以在原核或原核细胞中引入和繁殖载体。在一些实施方式中,原核生物用于扩增将要引入真核细胞的载体的拷贝或作为中间载体,以产生要引入真核细胞的载体(例如将质粒作为病毒的一部分扩增)。向量包装系统)。在一些实施方式中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,从而提供一种或多种蛋白质的来源以递送至宿主细胞或宿主生物。蛋白质在原核生物中的表达最常见的是在大肠杆菌中与含有引导融合蛋白或非融合蛋白表达的组成型或诱导型启动子的载体一起进行。融合载体将许多氨基酸添加到其中编码的蛋白质上,例如添加到重组蛋白质的氨基末端上。此类融合载体可用于一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;(iii)通过在亲和纯化中充当配体来帮助重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的连接处引入蛋白水解切割位点,以使得在纯化融合蛋白之后能够从融合部分分离重组蛋白。这样的酶及其同源识别序列包括因子Xa,凝血酶和肠激酶。融合表达载体的实例包括融合谷胱甘肽S-的pGEX(Pharmacia Biotech Inc;Smith和Johnson,1988.Gene 67:31-40),pMAL(New England Biolabs,Beverly,Mass.)和pRIT5(Pharmacia, Piscataway,NJ)。转移酶(GST)、麦芽糖E结合蛋白或蛋白A分别转移至目标重组蛋白。合适的诱导型非融合大肠杆菌表达载体的实例包括 pTrc(Amrann等,(1988)Gene 69:301-315)和pET 11d(Studier等,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185, Academic Press,SanDiego,Calif.(1990)60-89)。在一些实施方式中,载体是酵母表达载体。在酵母酿酒酵母中表达的载体的实例包括pYepSec1(Baldari 等,1987.EMBO J.6:229-234),pMFa(Kuijan和Herskowitz,1982.Cell 30: 933-943),pJRY88(Schultz等,1987.Gene 54:113-123),pYES2(Invitrogen Corporation,San Diego,Calif.)和picZ(InVitrogen Corp,SanDiego,Calif.)。在一些实施方式中,载体使用杆状病毒表达载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括 pAc系列(Smith等,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow 和Summers,1989.Virology 170:31-39)。在一些实施方式中,载体能够使用哺乳动物表达载体驱动哺乳动物细胞中一个或多个序列的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature 329:840)和pMT2PC(Kaufman, et al.,1987.EMBO J.6:187-195)和pMT2PC(Kaufman等,1987.EMBO J.6: 187-195)。当用于哺乳动物细胞时,表达载体的控制功能通常由一个或多个调节元件提供。例如,常用的启动子衍生自多瘤、腺病毒2、巨细胞病毒、猿猴病毒40以及本文公开的和本领域已知的其他启动子。对于用于原核和真核细胞的其他合适的表达系统,参见例如Sambrook等,MOLECULAR CLONING:A LABORATORY MANUAL.,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y., 1989的第16章和第17章。在一些实施方式中,重组哺乳动物表达载体能够引导核酸优先在特定细胞类型中表达(例如组织特异性调节元件用于表达核酸)。组织特异性调节元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性;Pinkert等,1987.Genes Dev.1: 268-277),淋巴样特异性启动子(Calame和Eaton,1988.Adv.Am.Chem.Soc。, 95:1877-1959)。Immunol.43:235-275),特别是T细胞受体的启动子(Winoto 和Baltimore,1989.EMBO J.8:729-733)和免疫球蛋白(Baneiji等,1983.Cell 33:729-740;Queen和Baltimore,1983.Cell 33:741-748),神经元特异性启动子(例如神经丝启动子;Byrne和Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477),胰腺特异性启动子(Edlund等,1985.Science 230:912-916)和乳腺特异性启动子(例如乳清启动子;美国专利号4,873,316和欧洲申请公开号 264,166)。还包括发育调节的启动子,例如鼠hox启动子(Kessel和Gruss, 1990.Science 249:374-379)和α-甲胎蛋白启动子(Campes和Tilghman,1989. Genes Dev.3:537-546)。关于这些原核和真核载体,提到了美国专利 6,750,059,其内容通过引用整体并入本文。本发明的其他实施方式可以涉及病毒载体的使用,关于病毒载体的提及是美国专利申请13/092,085,其内容通过引用整体并入本文。组织特异性调节元件在本领域中是已知的,并且在这方面,提及美国专利7,776,321,其内容通过引用整体并入本文。

在一些实施方式中,调节元件可操作地连接至或编码CRISPR Cas系统或复合物的一个或多个元件,以驱动CRISPR系统的一个或多个元件的表达。通常,CRISPRs(聚簇的规则间隔的短回文重复序列),也称为SPIDR(空间穿插的正向重复序列),构成通常对特定细菌物种特异的DNA基因座家族。 CRISPR基因座包含在大肠杆菌中识别的不同种类的散布的短序列重复序列 (SSR)(Ishino等,J.Bacteriol.,169:5429-5433[1987];和Nakata等,J.Bacteriol., 171:3553-3556[1989])和相关基因。类似的散布的SSR已经在地中海嗜盐杆菌、化脓性链球菌、鱼腥藻和结核分枝杆菌中得到鉴定(参见Groenen等,Mol.Microbiol.,10:1057-1065[1993];Hoe等,Emerg.Infect.Dis.,5:254-263 [1999];Masepohl等,Biochim.Biophys.Acta 1307:26-30[1996];和Mojica等, Mol.Microbiol.,17:85-93[1995])。CRISPR基因座通常与其他SSR的不同之处在于重复序列的结构,这些重复序列被称为短规则间隔重复序列 (SRSR)(Janssen等,OMICS J.Integ.Biol.,6:23-33[2002];和Mojica等,Mol. Microbiol.,36:244-246[2000])。通常,重复序列是短簇,出现在簇中,簇中的簇被具有恒定长度的独特插入序列规则间隔(Mojica等,[2000],同上)。尽管菌株之间的重复序列高度保守,但是散布的重复序列的数目和间隔区的序列通常因菌株而异(van Embden等,J.Bacteriol.,182:2393-2401[2000])。已在40多个原核生物中鉴定了CRISPR基因座(参见例如Jansen等,Mol. Microbiol.,43:1565-1575[2002];和Mojica等,[2005]),包括但不限于气杆菌、嗜热菌、硫磺杆菌、古生球菌、盐杆菌、甲烷菌、甲烷球菌、甲烷菌、甲烷菌属、热球菌、Pictophilus、嗜热菌、棒状杆菌、分枝杆菌、链霉菌、阿基菲克斯氏菌、卟啉单胞菌、支原体、芽孢杆菌、芽孢杆菌、芽孢杆菌、芽孢杆菌、嗜热杆菌属梭菌、海藻、染色体、奈瑟菌、亚硝酸盐单胞菌、脱硫弧菌、土杆菌、粘球菌、弯曲杆菌、沃林氏菌、不动杆菌、欧文氏菌、大肠埃希氏菌、军团菌、甲基球菌、巴斯德氏菌、光细菌、沙门氏菌、黄单胞菌、嗜热菌、耶尔森氏菌、曲霉。通常,本申请中使用的“RNA靶向系统”统指涉及RNA靶向的CRISPR相关13(Cas13)基因的表达或引导RNA的活性的转录物和其他元件(本文也称为“Cas13”)。(如效应子蛋白),包括编码靶向 RNA的Cas(效应子)蛋白和引导RNA(或crRNA序列)的序列,参考本文讨论的突变的CRISPR-Cas。通常,RNA靶向系统的特征在于促进在靶序列的位点形成RNA靶向复合物的元件。在形成靶向RNA的复合物的上下文中,“靶序列”是指引导序列(或引导或crRNA)被设计成具有互补性的RNA序列,其中靶序列与引导之间的杂交RNA促进RNA靶向复合物的形成。如果存在足够的互补性以引起杂交并促进RNA靶向复合物的形成,则不一定需要完全互补。在一些实施方式中,靶序列位于细胞的核或细胞质中。在一些实施方式中,靶序列可以在真核细胞的细胞器内。可以用于重组为包含靶序列的靶基因座的序列或模板被称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的方面,外源模板RNA可以被称为编辑模板。在本发明的一方面,重组是同源重组。通常,引导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且将核酸靶向复合物直接序列特异性结合至靶序列的任何多核苷酸序列。在一些实施方式中,当使用合适的比对算法最佳比对时,引导序列与其对应的靶序列之间的互补程度为约或大于约50%,60%,75%,80%, 85%,90%,95%,97.5%,99%或更高。可以使用任何合适的用于比对序列的算法来确定最佳比对,其非限制性实例包括Smith-Waterman算法, Needleman-Wunsch算法,基于Burrows-Wheeler变换的算法(例如Burrows Wheeler Aligner),ClustalW,Clustal X,BLAT,Novoalign(Novocraft Technologies,ELAND(Illumina,圣地亚哥,加利福尼亚),SOAP(可在 soap.genomics.org.cn上获得)和Maq(可在maq.sourceforge.net上获得)。在一些实施方式中,引导序列为约或大于约5、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28,29、30、35、40、 45、50、75或更多个核苷酸的长度。在一些实施方式中,引导序列的长度小于约75、50、45、40、35、30、25、20、15、12或更少个核苷酸。引导序列引导RNA靶向复合物与靶序列的序列特异性结合的能力可以通过任何合适的测定法来评估。模板多核苷酸可以具有任何合适的长度,例如约或大于约10、15、20、25、50、75、100、150、200、500、1000或更多个核苷酸的长度。在一些实施方式中,模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,模板多核苷酸可能与靶序列的一个或多个核苷酸重叠(例如,约或大于约1、5、10、15、20、25、30、35、40、45、50、60、 70,80、90、100或更多个核苷酸)。在一些实施方式中,当模板序列和包含靶序列的多核苷酸最佳比对时,模板多核苷酸的最接近核苷酸在距靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000或更多个核苷酸内。在一些实施方式中,靶向RNA的效应子蛋白是包含一个或多个异源蛋白结构域的融合蛋白的一部分(例如,除了靶向核酸的效应子蛋白外,大约或多于大约1、2、3、4、5、6、7、8、9、10或更多个结构域)。在一些实施方式中,CRISPR Cas效应子蛋白/酶是包含一个或多个异源蛋白结构域的融合蛋白的一部分(例如,除了CRISPR Cas酶外,大约或多于大约1、2、3、4、5、6、7、8、9、10或更多个结构域)。可以与效应子蛋白融合的蛋白结构域的实例包括但不限于表位标签,报道基因序列和具有以下一种或多种活性的蛋白结构域:甲基化酶活性,脱甲基酶活性,转录激活活性,转录抑制活性,转录释放因子活性,组蛋白修饰活性,RNA裂解活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签,V5标签,FLAG标签,流感血凝素(HA)标签,Myc标签,VSV-G标签和硫氧还蛋白(Trx) 标签。报道基因的实例包括但不限于谷胱甘肽-S-转移酶(GST),辣根过氧化物酶(HRP),氯霉素乙酰基转移酶(CAT)β-半乳糖苷酶,β-葡糖醛酸糖苷酶,荧光素酶,绿色荧光蛋白(GFP),HcRed,DsRed,青色荧光蛋白(CFP),黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。可以将靶向核酸的效应子蛋白与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列融合,所述蛋白质或蛋白质片段包括但不限于麦芽糖结合蛋白(MBP),S-标签,Lex DNA结合结构域(DBD)融合,GAL4 DNA结合域融合和单纯疱疹病毒(HSV)BP16蛋白融合。可以形成包含核酸靶向效应子蛋白的融合蛋白的一部分的另外的结构域描述于US20110059502中,其通过引用并入本文。在一些实施方式中,使用标记的核酸靶向效应子蛋白来鉴定靶序列的位置。在一些实施方式中,CRISPR Cas酶可以形成诱导系统的组分。该系统的可诱导性质将允许使用一种能量来时空控制基因编辑或基因表达。能量的形式可以包括但不限于电磁辐射,声能,化学能和热能。诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off),小分子双杂交转录激活系统(FKBP,ABA等)或光诱导系统(植物色素,LOV域或隐色色素)。在一个实施方式中,CRISPR CRISPR-Cas酶可以是光诱导转录效应子(LITE)的一部分,以序列特异性方式引导转录活性的变化。灯的组分可以包括CRISPR酶,光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制域。可诱导的 DNA结合蛋白的进一步实例及其使用方法在US 61/736465和US 61/721,283 以及WO 2014/018423和US8889418,US8895308,US20140186919, US20140242700,US20140273234,US20140335620,WO2014093635中提供,其通过引用整体并入本文。在一些方面,本发明提供了包括将一种或多种多核苷酸例如本文所述的一种或多种载体,其一种或多种转录物和/或从其转录的一种或多种蛋白质递送至宿主细胞的方法。在一些方面,本发明进一步提供了通过此类方法产生的细胞,以及包含此类细胞或由此类细胞产生的生物 (例如动物、植物或真菌)。在一些实施方式中,与导向RNA或crRNA结合(并且任选地与之结合)的靶向RNA的效应子蛋白被递送至细胞。常规的基于病毒和非病毒的基因转移方法可用于在哺乳动物细胞或靶组织中引入核酸。此类方法可用于向培养中或宿主生物中的细胞施用编码RNA靶向系统组分的核酸。非病毒载体递送系统包括DNA质粒,RNA(例如本文所述载体的转录物),裸核酸以及与诸如脂质体的递送载体复合的核酸。病毒载体递送系统包括DNA和RNA病毒,它们在递送至细胞后具有游离基因组或整合的基因组。有关基因治疗程序的评论,请参见Anderson,Science 256:808-813(1992); Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等,Current Topics inMicrobiology and Immunology,Doerfler和

本文所述的核酸靶向系统、载体系统、载体和组合物可用于多种核酸靶向应用:改变或修饰基因产物(例如蛋白质)的合成,核酸切割、核酸编辑、核酸剪接,靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。

示例性递送方法

通过本公开和本领域的知识,TALEs、CRISPR-Cas系统或其组分或其核酸分子(包括例如HDR模板)或编码或提供其组分的核酸分子可通过本文中概括和详细描述的递送系统递送。

载体递送,例如质粒、病毒递送:CRISPR酶和/或任何本发明的RNA,例如指导RNA,可以使用任何合适的载体递送,例如质粒或病毒载体,例如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型,或其组合。效应蛋白和一种或多种指导RNA可被包装到一种或多种载体中,例如质粒或病毒载体。在一些实施方式中,载体(例如质粒或病毒载体)通过例如肌内注射递送至感兴趣的组织,而在其他时间递送是通过静脉内、经皮、鼻内、口腔、粘膜或其他递送方法。这样的递送可通过单剂或多剂进行。本领域技术人员理解,根据多种因素,例如载体选择、靶细胞、生物或组织、待治疗对象的一般状况、所寻求的转化/修饰程度、施用途径、施用模式、所寻求的转化/修饰类型等,本文中待递送的实际剂量可能有很大差异。

该剂量可进一步包含例如载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼胶、果胶、花生油、麻油等)、稀释剂、药学上可接受的载体(例如磷酸盐缓冲盐水)、药学上可接受的赋型剂和/或本领域已知的其他化合物。该剂量可进一步包含一种或多种药学上可接受的盐,例如无机酸盐,例如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;和有机酸的盐,例如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。此外,辅助物质,例如湿润剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、香料、着色剂、微球、聚合物、悬浮剂等。也可以存在于此。另外,一种或多种其他常规药物成分,例如防腐剂、湿润剂、助悬剂、表面活性剂、抗氧化剂、抗结块剂、填充剂、螯合剂、涂层剂、化学稳定剂等也可以存在,尤其是当剂型为可重构形式时。合适的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨醇酯80、苯乙醇、氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯苯酚、明胶、白蛋白及其组合。REMINGTON’S PHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991)对药学上可接受的辅料进行了详尽的讨论,其通过引用并入本文。

在本发明的一个实施方式中,通过腺病毒进行递送,其可以是包含至少1×10

在本文的一个实施方式中,递送通过AAV进行。据信,将AAV体内递送至人体的治疗有效剂量为约20至约50ml含约1×10

在本发明的一个实施方式中,通过质粒进行递送。在这样的质粒组合物中,剂量应足以引发反应。例如,质粒组合物中质粒DNA的合适数量可以为每70kg个体约0.1至约2mg,或约1μg至约10μg。本发明的质粒通常包含(I)启动子;(ii)编码可操作地连接至所述启动子的核酸靶向 CRISPR酶的序列;(iii)可选标志物;(iv)复制起点;和(v)位于(ii)下游并可操作地连接至(ii)的转录终止子。该质粒也可以编码CRISPR复合物的 RNA组分,但其中这些中的一种或多种也可以在不同的载体上编码。

本文的剂量基于平均70kg个体。施用频率在医学或兽医学从业人员 (例如,医生、兽医)或本领域技术人员的范围内。还应注意的是,实验中使用的小鼠通常约为20g,并且从小鼠实验中可以放大至70kg个体。

在一些实施方式中,本发明的RNA分子以脂质体或脂质体制剂等形式递送,并且可以通过本领域技术人员公的方法制备。这样的方面描述于例如,第5,593,972号、第5,589,466号和第5,580,859号美国专利中,通过引用并入本文。已经开发了专门用于增强和改善向哺乳动物细胞递送siRNA的递送系统(例如,参见Shen et al FEBS Let.2003,539:111-114; Xia et al.,Nat.Biotech.2002,20:1006-1010;Reich et al.,Mol.Vision.2003,9:210-216;Sorensen et al.,J.Mol.Biol.2003,327:761-766;Lewis et al.,Nat.Gen.2002,32:107-108and Simeoni et al.,NAR 2003,31,11: 2717-2724),并可适用于本发明。siRNA最近已成功用于抑制灵长目动物的基因表达(例如参见。Tolentino etal.,Retina 24(4):660,其也可适用于本发明。

事实上,RNA递送是一种有效的体内递送方法。可以使用脂质体或颗粒将核酸靶向的Cas蛋白和指导RNA递送(例如,HR修复模板)入细胞。因此,本发明的核酸靶向的CRISPR-Cas蛋白的递送和/或指导RNA 或crRNA的递送可以是RNA形式并通过微泡、脂质体或颗粒进行。例如,CRISPR-Cas mRNA和指导RNA或crRNA可被包装成脂质体颗粒用于体内递送。脂质体转染试剂(例如Life Technologies的lipofectamine)和市场上的其他试剂可以有效地将RNA分子递送至肝脏。

RNA递送的方式还优选包括通过纳米颗粒(Cho,S.,Goldberg,M., Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.and Anderson, D.,Lipid-likenanoparticles for small interfering RNA delivery to endothelial cells,Advanced Functional Materials,19:3112-3118,2010)或外泌体(exosome)(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.,and Anderson, D.,Lipid-basednanotherapeutics for siRNA delivery,Journal of Internal Medicine,267:9-21,2010,PMID:20059641)递送RNA。事实上,外泌体已被证明对递送siRNA特别有用,该系统与RNA靶向系统有些相似之处。例如El-Andaloussi S,et al.(“Exosome-mediated deliveryof siRNA in vitro and in vivo.”Nat Protoc.2012Dec;7(12):2112-26.doi: 10.1038/nprot.2012.131.Epub 2012Nov 15)描述外泌体如何成为跨越不同生物屏障进行药物递送的有前景的工具,并可用于在体外和体内递送 siRNA。他们的方法是通过转染表达载体产生靶向外泌体,该表达载体包含与肽配体融合的外泌体蛋白。然后从转染的细胞上清液中纯化并鉴定外泌体,然后将RNA装载到外泌体中。根据本发明的递送或施用可以用外泌体进行,特别是但不限于脑。维生素E(α-生育酚)可与核靶向的Cas 蛋白缀合,并与HDL(HDL)一起递送至大脑,例如,以与Uno et al. (HUMAN GENE THERAPY 22:711–719(June 2011))类似的方式将短干扰 RNA(siRNA)递送至大脑。通过渗透微型泵(1007D型;Alzet,Cupertino,CA)灌注小鼠,其填充有磷酸盐缓冲液(PBS)或游离TocsiBACE or Toc-siBACE/HDL,并与Brain Infusion Kit 3(Alzet)连接。将脑注入套管放置在正中线上前囟后方约0.5毫米处,用于注入第三脑室背侧。Uno 等发现,通过相同的ICV注入方法,仅3nmol的Toc-siRNA与HDL就能诱导靶标降低相当程度。在本发明中,可考虑将类似剂量的核酸靶向效应蛋白与α-生育酚缀合并与靶向大脑的HDL共同施用于人类,例如,可考虑将约3nmol至约3μmol的核酸靶向效应蛋白用于大脑。Zou等 (HUMAN GENE THERAPY 22:465-475(2011年4月))描述了一种以慢病毒介导的递送针对PKCγ的短发卡RNA的方法,用于在大鼠脊髓中进行体内基因沉默。Zou等通过鞘内导管施用约10μl重组慢病毒,其滴度为 1×10

就向大脑的局部传递而言,这可以通过多种方式实现。例如,材料可以通过例如注射的方式进行层内(intrastriatally)递送。注射可以通过开颅术进行立体定向。

一般的包装和启动子

将编码核酸分子(例如DNA)的RNA靶向效应蛋白(CRISPR-Cas蛋白) 包装到载体(例如病毒载体)中以在体内介导基因组修饰的方法包括:

单一病毒载体:

包含两个或更多个表达盒的载体:

启动子-编码核酸靶向效应蛋白的核酸分子-终止子

启动子-指导RNA1-终止子

启动子-指导RNA(N)-终止子(不超过载体的大小限制) 双病毒载体:

载体1包含一个表达盒,用于驱动靶向RNA的效应蛋白 (CRISPR-Cas)的表达

启动子-编码RNA靶向效应(CRISPR-Cas)蛋白的核酸分子-终止子

载体2包含一个或多个表达盒,用于驱动一个或多个指导RNA 或crRNA的表达

启动子-指导RNA1或crRNA1-终止子

启动子-指导RNA1(N)或crRNA1(N)-终止子(不超过载体的大小限制)。

用于驱动编码RNA靶向效应蛋白的核酸分子的表达的启动子可包括AAV·ITR可作为启动子:这有利于消除对另外的启动子元件(其可占据载体中的空间)的需求。释放的另外的空间可用于驱动另外元件的表达 (gRNA等)。此外,ITR活性相对较弱,因此可用于降低因核酸靶向效应蛋白过度表达而产生的潜在毒性。对于泛表达,可以使用启动子:CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。对于大脑或其他中枢神经系统的表达,可以使用启动子:Synapsin I用于所有神经元,CaMKII alpha用于兴奋性神经元,GAD67或GAD65或VGAT用于γ-氨基丁酸能神经元等。对于肝脏表达,可使用白蛋白启动子。对于肺表达,可以使用SP-B。对于内皮细胞,可以使用ICAM。对于造血细胞,可使用IFNbeta 或CD45。成骨细胞可以使用OG-2。用于驱动指导RNA的启动子可包括: Pol III启动子,例如U6或H1;Pol II启动子和内含子盒,用于表达指导 RNA或crRNA。

腺相关病毒(AAV)

CRISPR-Cas和一种或多种指导RNA或crRNA可使用腺相关病毒 (AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型递送,特别是使用来自例如美国专利第8,454,972号(腺病毒制剂、剂量)、第8,404,658号 (AAV制剂、剂量)和第5,846,946号(DNA质粒制剂、剂量)以及来自关于慢病毒、AAV和腺病毒临床试验的临床试验和出版物的制剂和剂量。例如,就AAV而言,施用途径、制剂和剂量可与美国专利第8,454,972号和涉及AAV的临床试验相同。就腺病毒而言,其施用途径、制剂和剂量可参见美国专利第8,404,658号和涉及腺病毒的临床试验。就质粒递送而言,施用途径、制剂和剂量可参见美国专利5,846,946和涉及质粒的临床研究。剂量可以基于平均70千克的个体(例如,成年男性),也可以根据患者、受试者、不同体重和种类的哺乳动物进行调整。根据通常的因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及所治疗的特定状况或症状,施用频率属于医疗或兽医从业人员(例如医生、兽医) 的范围。病毒载体可以被注射到感兴趣的组织中。对于细胞类型特异性的基因组修饰,可通过细胞类型特异性的启动子驱动靶向RNA的效应蛋白(CRISPR-Cas效应蛋白)的表达。例如,肝脏特异性表达可能使用白蛋白启动子,神经元特异性表达(例如,用于靶向中枢神经系统疾病)可能使用Synapsin I启动子。就体内递送而言,AAV优于其他病毒载体,原因如下:低毒性(这可能是由于纯化方法不需要对可激活免疫反应的细胞颗粒超离心)和因其未整合入宿主基因组而导致低概率的插入突变。

AAV的包装限制为4.5或4.75Kb。这意味着,靶向RNA的效应蛋白(CRISPR-Cas效应蛋白)的编码序列以及启动子和转录终止子都必须适合同一病毒载体。就AAV而言,AAV可以是AAV1、AAV2、AAV5或其任何组合。可以根据待靶向的细胞相关的AAV选择AAV;例如,可以选择AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合,用于靶向脑或神经细胞;并且可以选择AAV4用于靶向心脏组织。AAV8可用于递送至肝脏。本文中的启动子和载体是单独优选的。关于这些细胞的某些AAV血清型的列表(参见Grimm,D.et al,J.Virol.82:5887-5911(2008))如下:

表9

慢病毒

慢病毒是一种复杂的反转录病毒,能够在分裂细胞和分裂后细胞中感染和表达其基因。最常见的慢病毒是人类免疫缺陷病毒(HIV),它利用其他病毒的包膜糖蛋白来针对广泛的细胞类型。慢病毒的制备方法如下。在克隆pCasES10(其包含慢病毒转移质粒主链)后,在转染前一天,将低代HEK293FT(p=5)接种于T-75烧瓶中达到50%融合在10%胎牛血清(无抗生素)的DMEM。20小时后,将培养基更换为OptiMEM(无血清)培养基,4小时后进行转染。用10μg慢病毒转移质粒(pCasES10)和下列包装质粒:(5μg pMD2.G)(VSV-g假型)和7.5μg psPAX2(gag/pol/rev/tat)转染细胞。在4mL OptiMEM中用阳离子脂质递送剂(50uLLipofectamine 2000和100ul Plus试剂)进行转染。6小时后,用10%胎牛血清将培养基更换为无抗生素的DMEM。这些方法在细胞培养过程中使用血清,但优选无血清方法。

慢病毒可按如下方式纯化。48小时后收集病毒上清液。首先清除上清液中的碎片,并通过0.45um低蛋白结合(pdf)过滤器过滤。然后在超速离心机中以24,000rpm的速度旋转2小时。将病毒颗粒在50ul的 DMEM溶液中于4C下悬浮过夜。然后将其等分并立即在-80℃冷冻。

在另一个实施方式中,也考虑了基于马传染性贫血病毒(EIAV)的最小非灵长目慢病毒载体,尤其是用于眼睛基因治疗(例如参见Balagaan, J Gene Med 2006;8:275–285)。在另一个实施方式中,还考虑了

在另一个实施方式中,可以使用和/或适应于本发明的核酸靶向系统改造自失活的慢病毒载体,其包含靶向由HIV tat/rev共享的共同外显子的siRNA、核仁定位TAR诱饵和抗CCR5特异性锤头核酶(例如参见 DiGiusto et al.(2010)Sci Transl Med 2:36ra43)。每kg患者体重至少可收集2.5×10

慢病毒载体已被公开用于治疗帕金森氏病,例如参见美国专利公开号20120295960和美国专利7303910和7351585。还公开了用于治疗眼睛疾病的慢病毒载体,例如参见美国专利公开号20060281180, 20090007284,20110117189;US20090017543;US20070054961, US20100317109。慢病毒载体也被公开用于递送至大脑,例如参见美国专利公开号US20110293571;US20110293571,US20040013648,US20070025970,US20090111106和US专利号7259015。

RNA递送

RNA递送:靶向核酸的CRISPR-Cas蛋白和/或指导RNA也可以以 RNA的形式递送。可使用包含以下元件的PCR盒合成mRNA:T7_启动子-kozak序列(GCCACC)-效应蛋白-来自β珠蛋白的3’UTR-polyA尾(一串120或更多的腺嘌呤)。该盒可用于T7聚合酶的转录。也可以使用体外转录从含有T7_promoter-GG-指导RNA或crRNA序列的盒中转录指导 RNA或crRNA。

颗粒递送系统和/或制剂:

已知多种类型的颗粒递送系统和/或制剂可用于各种生物医学应用。一般而言,颗粒被定义为一个小物体,它作为一个完整的单元在其传输和性质方面发挥作用。颗粒根据直径进一步分类。粗颗粒涵盖在2,500 至10,000纳米之间的范围。细微粒的尺寸在100至2500纳米之间。超细颗粒或纳米颗粒的尺寸通常在1至100纳米之间。100纳米限制的基础是,将颗粒与散装材料区分开来的新性质通常在低于100纳米的临界长度范围内形成。

如本文所用,颗粒递送系统/制剂被定义为包括根据本发明的颗粒的任何生物递送系统/制剂。根据本发明的颗粒是具有小于100微米(μm)的最大尺寸(例如直径)的任何实体。在一些实施方式中,本发明的颗粒具有小于10μm的最大尺寸。在一些实施方式中,本发明的颗粒具有小于2000 纳米(nm)的最大尺寸。在一些实施方式中,本发明的颗粒具有小于1000 纳米(nm)的最大尺寸。在一些实施方式中,本发明的颗粒具有小于900 纳米、800纳米、700纳米、600纳米、500纳米、400纳米、300纳米、 200纳米或100纳米的最大尺寸。典型地,本发明的颗粒具有500纳米或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有 250纳米或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有200纳米或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有150纳米或更小的最大尺寸(例如,直径)。在一些实施方式中,本发明的颗粒具有100纳米或更小的最大尺寸(例如,直径)。在本发明的一些实施方式中使用更小的颗粒,例如最大尺寸为50纳米或更小的颗粒。在一些实施方式中,本发明的颗粒具有25纳米至200纳米范围内的最大尺寸。

使用各种不同的技术进行颗粒表征(包括例如表征形态、尺寸等)。常用的技术有电子显微术、原子力显微术、动态光散射术(DLS)、X射线光电子光谱术、粉末X射线衍射术、傅里叶变换红外光谱术、基质辅助激光解吸附/离子化飞行时间质谱术、紫外-可见光谱术、双偏振干涉术和核磁共振。可对天然颗粒(即预载)或货物装载后(本文货物指例如CRISPR-Cas系统的一种或多种成分,例如CRISPR-Cas酶或mRNA或指导RNA或其任何组合,并可包括另外的载体和/或赋形剂)进行表征(尺寸测量),以提供最佳尺寸的颗粒用于本发明的任何体外、离体和/或体内应用。在某些优选实施方式中,颗粒尺寸(例如直径)表征基于使用动态激光散射(DLS)的测量。提及美国专利第8,709,843号;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利第5,543,158号专利;以及JamesE.Dahlman和Carmen Barnes等于2014年5月11日在线发布的出版物NatureNanotechnology(2014) (doi:10.1038/nnano.2014.84),内容涉及颗粒、制备和使用及其测量的方法。另见Dahlman等,“Orthogonal gene control with a catalytically activeCas9 nuclease,”Nature Biotechnology 33,1159-1161(November,2015)。

本发明范围内的颗粒递送系统可以任何形式提供,包括但不限于固体、半固体、乳状或胶态颗粒。因此,本文所述的任何递送系统,包括但不限于,例如,基于脂质的系统、脂质体、微胶团、微泡、外泌体或基因枪,均可作为本发明范围内的颗粒递送系统提供。

颗粒

CRISPR-Cas mRNA和指导RNA或crRNA可使用颗粒或脂包膜同时递送;例如,本发明的CRISPR酶和RNA(例如,作为复合物)可通过 Dahlman等、WO2015089419 A2和其中引用的文件,例如7C1(参见James E.Dahlman和Carmen Barnes等2014年5月11日在线出版的Nature Nanotechnology(2014)(doi:10.1038/nnano.2014.84)中的颗粒递送,例如,包含脂质或类脂的递送颗粒,和亲水聚合物,例如包含脂质或类脂质和亲水性聚合物(例如阳离子脂质和亲水性聚合物)的递送颗粒,例如其中阳离子脂质包括1,2-二油酰基-3-三甲基铵丙烷(DOTAP)或1,2-二十四烷酰基-sn-甘油-3-磷酸胆碱(DMPC)和/或其中亲水性聚合物包括乙二醇或PEG(PEG);和/或其中颗粒进一步包含胆固醇(例如,来自制剂1的颗粒=DOTAP100,DMPC 0,PEG 0,胆固醇0;制剂编号2= DOTAP 90,DMPC 0,PEG 10,胆固醇0;制剂编号3=DOTAP 90,DMPC 0,PEG 5,胆固醇5),其中使用高效的多步骤方法形成颗粒,其中首先将效应蛋白和RNA例如以1:1的摩尔比,例如在室温下混合在一起,例如持续30分钟,例如在无菌的、无核酸酶的1X PBS中;分别将适用于制剂的DOTAP,DMPC,PEG和胆固醇溶解在酒精(例如100%乙醇) 中;然后将两种溶液混合在一起,形成含有复合物的颗粒。CRISPR-Cas 效应蛋白mRNA和指导RNA可以使用颗粒或脂质包膜同时递送。该 Dahlman等的技术可以应用在本发明中。可以使用环氧化物修饰的脂质聚合物将本发明的核酸靶向系统递送至肺、心血管或肾细胞,但是,本领域技术人员可以使该系统适应于递送至其他靶器官。设想的剂量范围为约0.05至约0.6mg/kg。还设想了几天或几周的剂量,总剂量为约2 mg/kg。例如,Su X,Fricke J,Kavanagh DG,Irvine DJ(“In vitro and in vivo mRNA delivery usinglipid-enveloped pH-responsive polymer nanoparticles”Mol Pharm.2011Jun 6;8(3):774-87.doi: 10.1021/mp100390w.Epub 2011Apr 1)描述了具有可被生物降解的核-壳结构的颗粒,该颗粒具有被磷脂双层壳包围的聚(β-氨基酯)(PBAE) 核。这些被开发用于体内mRNA递送。选择pH响应性PBAE组分以促进内体破坏,而选择脂质表面层以最大程度降低聚阳离子核心的毒性。因此,这对于递送本发明的RNA是优选的。

在一个实施方式中,考虑了基于自组装生物粘附性聚合物的颗粒,该颗粒可用于经口递送肽、经静脉递送肽和经鼻递送肽,这些均可用于脑。也考虑了其他实施方式,例如疏水性药物的口服吸收和眼内递送。分子包膜技术涉及受保护并递送至疾病部位的工程化聚合物包膜(例如,参见Mazza,M.et al.ACSNano,2013.7(2):1016-1026;Siew,A.,etal.Mol Pharm,2012.9(1):14-28;Lalatsa,A.,et al.J Contr Rel,2012.161(2):523-36;Lalatsa,A.,et al.,Mol Pharm,2012.9(6):1665-80;Lalatsa,A.,et al.Mol Pharm,2012.9(6):1764-74;Garrett,N.L.,et al.J Biophotonics,2012. 5(5-6):458-68;Garrett,N.L.,et al.J Raman Spect,2012.43(5):681-688; Ahmad,S.,et al.J RoyalSoc Interface 2010.7:S423-33;Uchegbu,I.F. Expert Opin Drug Deliv,2006.3(5):629-40;Qu,X.,et al.Biomacromolecules, 2006.7(12):3452-9and Uchegbu,I.F.,etal.Int J Pharm,2001. 224:185-199)。根据靶组织的不同,预计剂量为约5mg/kg,单次或多次施用。

关于颗粒,参见Alabi et al.,Proc Natl Acad Sci U S A.2013Aug 6;110(32):12881-6;Zhang et al.,Adv Mater.2013Sep 6;25(33):4641-5; Jiang et al.,NanoLett.2013Mar 13;13(3):1059-64;Karagiannis et al.,ACS Nano.2012Oct 23;6(10):8484-7;Whitehead et al.,ACS Nano.2012Aug 28;6(8):6922-9和Lee et al.,NatNanotechnol.2012Jun 3;7(6):389-93。

美国专利申请20110293703涉及脂烯醚萜类化合物,也特别适用于多聚核苷酸的施用,其可用于递送本发明的核酸靶向系统。在一个方面,氨基醇类脂质化合物与待递送至细胞或受试者的试剂组合,以形成微粒、纳米颗粒、脂质体或胶束。待由颗粒、脂质体或胶束递送的试剂可以是气体、液体或固体的形式,并且试剂可以是多核苷酸、蛋白质、肽或小分子。氨基醇类脂质化合物可与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等结合以形成颗粒。然后,这些颗粒可任选地与药物赋形剂结合形成药物组合物。美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。允许一种或多种当量的胺与一种或多种当量的环氧化物封端的化合物在合适的条件下反应,以形成本发明的氨基醇类脂质化合物。在某些实施方式中,胺的所有氨基与环氧化物封端的化合物完全反应形成叔胺。在其他实施方式中,胺的所有氨基未与环氧化物封端的化合物完全反应以形成叔胺,从而在氨基醇类脂质化合物中产生伯胺或仲胺。这些伯胺或仲胺保持原样,或可与另一亲电试剂(例如不同的环氧化物封端的化合物)反应。如本领域技术人员将理解的,胺与少于过量的环氧化物封端的化合物反应将产生具有不同尾数的多种不同的氨基醇类脂质化合物。某些胺可以用两个环氧化物衍生的化合物尾完全功能化,而其他分子不会用环氧化物衍生的化合物尾完全功能化。例如,二胺或多胺可包括一种、两种、三种或四种衍生自环氧化物的化合物,该化合物从分子的各种氨基部分脱落,产生伯、仲和叔胺。在某些实施方式中,并非所有的氨基都被完全功能化。在某些实施方式中,使用两种相同类型的环氧化物封端的化合物。在其他实施方式中,使用两种或更多种不同的环氧化物封端的化合物。氨基醇类脂质化合物的合成在有或无溶剂的情况下进行,并且合成可在30-100℃的较高温度下进行,优选在约50-90℃下进行。制备的氨基醇类脂质化合物可任选地被纯化。例如,可以对氨基醇类脂质化合物的混合物进行纯化,得到具有特定数量环氧化物衍生化合物尾的氨基醇类脂质化合物。或者可以对混合物进行纯化以产生特定的立体或区域异构体。氨基醇类脂质化合物也可以使用烷基卤(例如甲基碘)或其他烷基化试剂进行烷基化,和/或它们可以被酰化。

美国专利公开号20110293703也提供了通过本发明方法制备的氨基醇类脂质化合物的库。可以使用高通量技术(包括液体处理器、机器人、微量滴定板、计算机等)制备和/或筛选这些氨基醇类脂质化合物。在某些实施方式中,对氨基醇类脂质化合物进行筛选,以确定其将多核苷酸或其他试剂(例如,蛋白、肽、小分子)转入细胞的能力。美国专利公开号20130302401涉及一类使用组合聚合制备的聚(β-氨基醇)(PBAA)。本发明的PBAA可在生物技术和生物医学应用中用作涂层(例如用于医疗器械或植入体的膜或多层膜的涂层)、添加剂、材料、赋形剂、非生物污垢剂、微图案形成剂和细胞包裹剂。当用作表面涂层时,这些PBAA根据其化学结构在体外和体内引发不同程度的炎症,取决于他们的化学结构。这类材料的化学多样性使我们能够在体外识别抑制巨噬细胞激活的聚合物涂层。此外,在皮下植入羧化聚苯乙烯微粒后,这些涂层减少了炎性细胞的募集,并减少了纤维变性。这些聚合物可用于形成用于细胞包裹的聚电解质复合胶囊。本发明还可具有许多其他生物应用,例如抗微生物涂层、DNA或siRNA递送以及干细胞组织工程。美国专利公开号 20130302401的教导可应用于本发明的核酸靶向系统。

在另一个实施方式中,考虑了脂质纳米颗粒(LNP)。抗甲状腺素运载蛋白小干扰RNA已被包裹在脂质纳米颗粒中并被递送至人体(例如参见Coelho等,N Engl J Med 2013;369:819-29),并且这种系统可适用于本发明的核酸靶向系统。每千克体重静脉注射约0.01至约1毫克的剂量是可以考虑的。可考虑使用降低输注相关反应风险的药物,例如地塞米松、乙酰氨基酚、苯海拉明或西替利嗪以及雷尼替丁。多次剂量也可考虑每4周分五次施用,每次约0.3毫克/千克。LNP已被证明能高效地将siRNA递送至肝脏(例如,参见Tabernero etal.,Cancer Discovery,April 2013,Vol.3,No.4,pages 363-470),因此可用于将编码靶向核酸的效应蛋白的RNA递送至肝脏。可考虑每两周使用约四剂6mg/kg的LNP。 Tabernero等证明,在以0.7mg/kg剂量施用的前2个周期的LNP后,观察到肿瘤消退,并且在6个周期结束时,患者获得了部分响应,淋巴结转移完全消退,并且肝脏肿瘤显著缩小。该患者在接受40剂后获得完全缓解,并在接受超过26个月的剂量后完成治疗。两名具有肾癌和肝外疾病的患者(包括肾脏,肺和淋巴结)(先前用VEGF途径抑制剂治疗后进展)所有部位疾病稳定约8至12个月,而PNET和肝转移患者继续扩展研究18个月(36剂),病情稳定。但是,必须考虑LNP的电荷。阳离子脂质与带负电荷的脂质结合以诱导促进细胞内递送的非双层结构。由于带电荷的LNP在静脉内注射后迅速从循环中清除,因此开发出pKa 值低于7的可电离的阳离子脂质(请参阅例如Rosin et al,Molecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011)。可以将带负电荷的聚合物(例如RNA)以低pH值(例如pH 4)加载到LNP中,在低pH值下可电离脂质显示正电荷。但是,在生理pH值下,LNP的表面电荷低,循环时间更长。四种可离子化的阳离子脂质已得到关注,分别是1,2- 二亚油基-3-二甲基铵-丙烷(DLinDAP),1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA),1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经显示,包含这些脂质的LNP siRNA系统在体内肝细胞中表现出显著不同的基因沉默特性,其效力根据采用因子 VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>> DLinDAP系列而变化(参见,例如Rosin et al,Molecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011)。可以考虑1μg/ml剂量LNP或与在 LNP中或与LNP相关的CRISPR-Cas RNA,特别是对于含有 DLinKC2-DMA的制剂。

LNP和CRISPR-Cas胶囊的制备可使用和/或改造自Rosin et al, MolecularTherapy,vol.19,no.12,pages 1286-2200,Dec.2011。阳离子脂质1,2-二亚油酰基-3-二甲基铵丙烷(DLinDAP),1,2-二亚油基氧基-3-N,N- 二甲基氨基丙烷(DLinDMA),1,2-二亚油基氧基酮-N,N-二甲基-3-氨基丙烷(DLinK-DMA),1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA),(3-o-[2”-(甲氧基PEG2000)琥珀酰]-1,2- 二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG)和R-3-[(ω-甲氧基-聚(乙二醇) 2000)氨基甲酰基]-1,2-二肉豆蔻基氧丙基-3-胺(PEG-C-DOMG)可以由Tekmira Pharmaceuticals(加拿大温哥华)提供或合成;胆固醇可以从 Sigma(圣路易斯,密苏里州)购买。特定的核酸靶向复合物(CRISPR-Cas) RNA可以封装在含有DLinDAP,DLinDMA,DLinK-DMA和 DLinKC2-DMA(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG 于摩尔比为40:10:40:10)的LNP中。在需要时添加0.2%SP-DiOC18 (Invitrogen,加拿大伯灵顿)可以评估细胞的吸收,细胞内传递和生物分布。通过将包含阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)的脂质混合物溶解在乙醇中至最终脂质浓度为10mmol/L进行封装。可以将这种脂质的乙醇溶液逐滴添加至pH 4.0的50mmol/l柠檬酸盐中以形成多层囊泡,以产生30%乙醇体积/体积的最终浓度。在使用挤出机(Northern Lipids,加拿大温哥华)通过两个堆叠的80nm Nuclepore 聚碳酸酯滤膜挤出多层囊泡后,可能会形成大的单层囊泡。通过将溶于含有30%乙醇体积/体积的50mmol/l柠檬酸,pH 4.0的浓度为2mg/ml 的RNA逐滴滴加到挤出的预制大单层囊泡中,并在31℃孵育30分钟并持续混合至最终的RNA/脂质重量比为0.06/1wt/wt来实现包封。使用Spectra/Por 2再生纤维素透析膜,通过针对pH 7.4的磷酸盐缓冲盐水 (PBS)透析16小时,以去除乙醇并中和制剂缓冲液。粒径分布可通过使用NICOMP 370粒度仪,囊泡/强度模式和高斯拟合(Nicomp Particle Sizing,加利福尼亚州圣巴巴拉)的动态光散射来确定。所有三个LNP 系统的粒径都可以是直径约70nm。RNA封装效率可以通过使用 VivaPureD MiniH色谱柱(Sartorius Stedim Biotech)从透析前后收集的样品中除去游离RNA来确定。可以从洗脱的颗粒中提取包封的RNA,并在260nm处定量。通过使用来自Wako Chemicals USA(Richmond,VA) 的胆固醇E酶法测定囊泡中的胆固醇含量来确定RNA与脂质的比率。结合本文对LNP和PEG脂质的讨论,PEG化脂质体或LNP同样适用于递送核酸靶向系统或其组分。可以使用/和/或改造自Rosin et al,Molecular Therapy,vol.19,no.12,pages 1286-2200,Dec.2011。可以在含有 DLinKC2-DMA,DSPC和胆固醇的乙醇中以50:10:38.5摩尔比制备脂质预混溶液(总脂质浓度为20.4mg/ml)。乙酸钠可以以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)添加到脂质预混合物中。随后可以通过在剧烈搅拌下将混合物与1.85体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0) 合并来水化脂质,从而在含有35%乙醇的水性缓冲液中自发形成脂质体。脂质体溶液可以在37℃下温育,以便随时间增加粒径。在孵育过程中的不同时间可以取出等分试样,以通过动态光散射(Zetasizer Nano ZS, Malvern Instruments,伍斯特郡,英国)研究脂质体大小的变化。一旦达到所需的粒径,就可以将PEG脂质水溶液(储备液=10mg/ml PEG-DMG 在35%(体积/体积)乙醇中的溶液)添加到脂质体混合物中,以使最终 PEG摩尔浓度为3.5%总脂质。加入PEG-脂质后,脂质体应达到其大小,从而有效地抑制进一步的生长。然后可以将RNA以大约1:10(wt:wt) 的RNA与总脂质比率添加到空脂质体中,然后在37℃下孵育30分钟以形成负载的LNP。随后可以将混合物在PBS中透析过夜,并用0.45-μm 注射器过滤器过滤。

球形核酸(SNA

可结合本发明的教导使用的文献包括Cutler et al.,J.Am.Chem.Soc. 2011133:9254-9257,Hao et al.,Small.2011 7:3158-3162,Zhang et al.,ACS Nano.2011 5:6962-6970,Cutler et al.,J.Am.Chem.Soc.2012 134:1376-1391,Young et al.,NanoLett.2012 12:3867-71,Zheng et al.,Proc. Natl.Acad.Sci.USA.2012 109:11975-80,Mirkin,Nanomedicine 2012 7:635-638Zhang et al.,J.Am.Chem.Soc.2012 134:16488-1691,Weintraub, Nature 2013 495:S14-S16,Choi et al.,Proc.Natl.Acad.Sci.USA.2013 110(19):7625-7630,Jensen et al.,Sci.Transl.Med.5,209ra152(2013)and Mirkin,et al.,Small,10:186-192。

具有RNA的自组装颗粒可以用聚乙烯亚胺(PEI)构建,该PEI与连接在PEG(PEG)远端的Arg-Gly-Asp(RGD)肽配体PEG化。例如,该系统已被用作靶向表达整合素的肿瘤新生血管并递送抑制血管内皮生长因子受体-2(VEGF R2)表达的siRNA的手段,从而实现肿瘤血管生成(参见,例如Schiffelers et al.,Nucleic Acids Research,2004,Vol.32,No.19)。纳米颗粒可通过混合等体积的阳离子聚合物和核酸的水溶液来制备,以使可电离的氮(聚合物)与磷酸盐(核酸)的净摩尔过量在2至6的范围内。阳离子聚合物和核酸之间的静电相互作用导致形成平均颗粒尺寸分布约为100 nm的聚复合物,因此在此称为纳米复合物。预计约100至200mg的核酸靶向复合物RNA的剂量用于在Schiffelers等的自组装颗粒中递送。

Bartlett等(PNAS,September 25,2007,vol.104,no.39)的纳米复合物也可应用于本发明。Bartlett等的纳米复合物通过混合等体积的阳离子聚合物和核酸的水溶液来制备,使可电离的氮(聚合物)与磷酸盐(核酸)的净摩尔过量在2至6的范围内。阳离子聚合物和核酸之间的静电相互作用导致形成平均颗粒尺寸分布约为100纳米的聚复合物,因此在此称为纳米复合物。Bartlett等的DOTA-siRNA的合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基丁二酰亚胺酯)(DOTA-NHSester)由 Macrocyclics(得克萨斯州达拉斯)订购。将在碳酸缓冲液(pH 9)中具有100 倍摩尔过量DOTA-NHS-酯的胺修饰的RNA有义链加入微量离心管。内容物在室温下搅拌反应4小时。DOTA-RNA正义缀合物经乙醇沉淀,重新悬浮于水中,并与未修饰的反义链退火,产生DOTA-siRNA。所有液体均经Chelex-100(Bio-Rad,Hercules,CA)预处理,以去除痕量金属污染物。Tf靶向和非靶向的siRNA颗粒可通过使用含环糊精的聚阳离子形成。通常,颗粒在水中以3(+/-)的电荷比和0.5g/升的siRNA浓度形成。靶向颗粒表面1%的金刚烷-PEG分子被Tf(金刚烷-PEG-Tf)改性。将颗粒悬浮在5%(重量/体积)的葡萄糖载体溶液中用于注射。

Davis等(Nature,Vol 464,15April 2010)进行了一项使用靶向微粒递送系统的RNA临床试验(临床试验注册号NCT00689065)。在21天周期的第1天、第3天、第8天和第10天,通过30分钟的静脉注射,给予对标准护理治疗无效的实体癌症患者一定剂量的靶向颗粒。所述颗粒包含、基本上包含或由合成递送系统组成,所述合成递送系统包含:(1)线性的、基于环糊精的聚合物(CDP)、(2)显示在纳米颗粒外部的人转铁蛋白蛋白(TF)靶向配体,以与癌细胞表面的TF受体(TFR)结合,(3)用于促进生物液体中纳米颗粒稳定性的亲水性聚合物(PEG),和(4)旨在降低RRM2 表达的siRNA(临床中使用的序列先前称为siR2B+5)。众所周知,TFR在恶性细胞中的表达上调,而RRM2是公认的抗癌靶标。在对非人类灵长目动物的多剂量研究中,这些颗粒(临床版本称为CALAA-01)被证明具有良好的耐受性。尽管单个慢性髓细胞性白血病患者通过脂质体递送接受了siRNA,但Davis等的临床试验是首次采用靶向递送系统递送siRNA 并治疗实体癌症患者的人体试验。为了确定靶向施用系统是否能够向人体肿瘤有效地递送功能性siRNA,Davis等调查了来自三个不同施用队列的三名患者的活组织检查;患者A、B和C均患有转移性黑色素瘤,分别接受了18、24和30mg m-2siRNA CALAA-01剂量。对于本发明的核酸靶向系统,也可以考虑类似的剂量。本发明的递送可通过包含线性环糊精基聚合物(CDP)、显示在颗粒外部以与癌细胞表面上的TF受体(TFR) 结合的人转铁蛋白蛋白(TF)靶向配体和/或亲水性聚合物(例如用于促进生物液体中颗粒稳定性的PEG)的颗粒来实现。

就本发明而言,优选具有一种或多种RNA靶向复合物的成分,例如核酸靶向效应物(CRISPR-Cas)蛋白或其mRNA,或使用颗粒或脂包膜递送的指导RNA或crRNA。其他递送系统或载体可与本发明的颗粒方面结合使用。本发明包含的颗粒可以不同形式提供,例如固体颗粒(例如银、金、铁、钛等金属)、非金属、脂基固体、聚合物、颗粒悬浮液或其组合。可以制备金属、介电和半导体颗粒以及混合结构(例如核-壳颗粒)。由半导体材料制成的颗粒如果足够小(通常小于10纳米)以至于发生电子能级量化,也可以被标记为量子点。这种纳米颗粒在生物医学应用中用作药物载体或成像剂,并且可适用于本发明的类似目的。

已经制造了半固体和软颗粒,并且在本发明的范围内。半固体性质的原型颗粒是脂质体。各种类型的脂质体颗粒目前在临床上用作抗癌药和疫苗的递送系统。一半为亲水性,另一半为疏水性的颗粒称为Janus 颗粒,对稳定乳浊液特别有效。它们可以在水/油界面和担任固体表面活性剂上自组装。

美国专利第8,709,843号(通过引用并入本文)提供了一种用于将含治疗剂的颗粒定向递送至组织、细胞和细胞内隔室的药物递送系统。本发明提供了包含与表面活性剂、亲水性聚合物或脂质缀合的聚合物的靶向颗粒。美国专利第6,007,845号提供了具有多嵌段共聚物核的颗粒,该多嵌段共聚物通过将多功能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成,并且该颗粒包含生物活性材料。美国专利第5,855,913号(通过引用并入本文)提供了一种颗粒组合物,其具有振实密度小于0.4g/cm

外泌体

外泌体是转运RNA和蛋白质的内源性纳米囊泡,可将RNA递送至大脑和其他靶器官。为降低免疫原性,Alvarez-Erviti等(2011,Nat Biotechnol 29:341)使用自衍生树状细胞进行外泌体生产。通过对树状细胞进行工程化,使其表达Lamp2b(一种融合于神经元特异性RVG肽的外泌体膜蛋白),从而实现了对大脑的定位。用电穿孔法将纯化的外泌体负载外源性RNA。通过静脉注射以RVG靶向的外泌体,将GAPDH siRNA 特异性递送至大脑中的神经元、小胶质细胞和少突胶质细胞,从而导致特定的基因敲除。预先暴露于RVG外泌体不会减弱敲除作用,也未观察到其他组织的非特异性吸收。外泌体介导的siRNA递送的治疗潜力通过 BACE1(阿尔茨海默病的治疗靶标)的强mRNA(60%)和蛋白(62%)敲除得到证实。

为了获得免疫惰性外泌体的池,Alvarez-Erviti等从近交系C57BL/6 小鼠中收获了具有同质主要组织相容性复合物(MHC)单体型的骨髓。由于未成熟的树状细胞产生大量不含T细胞激活剂(如MHC-II和CD86)的外泌体,Alvarez-Erviti等选择了含有粒细胞/巨噬细胞集落刺激因子 (GM-CSF)的树状细胞培养7天。所产生的外泌体在物理上是均一的,通过颗粒追踪分析(NTA)和电子显微术确定,其尺寸分布在直径80nm处达到峰值。Alvarez-Erviti等每10

El-and loussi等(Nature Protocols 7,2112–2126(2012))提供了来源于培养细胞的外泌体,用于在体外和体内递送RNA。该方案首先描述了通过转染表达载体产生靶向外泌体,该表达载体包含与肽配体融合的外泌体蛋白。接下来,El-and loussi等解释了如何从转染的细胞上层清液中纯化和鉴定外泌体。接下来,El-and loussi等详述了将RNA装载到外泌体的关键步骤。最后,El-and loussi等概述了如何使用外泌体在体外和体内有效地在小鼠脑中递送RNA。还提供了通过功能性测定和成像评估外泌体介导的RNA递送的预期结果的例子。整个方案耗时3周。根据本发明的递送或施用可以使用自衍生树状细胞产生的外泌体进行。根据本文的教导,这可以用于本发明的实践中。

在另一个实施方式中,考虑了Wahlgren et al.(Nucleic Acids Research,2012,Vol.40,No.17e130)的血浆外泌体。外泌体是由多种细胞类型(包括树状细胞、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞)产生的纳米大小的囊泡(大小为30-90纳米)。这些小泡由后期内体向内出芽形成,然后在与质膜融合后释放至细胞外环境。由于外泌体在细胞间自然携带 RNA,这一性质可用于基因治疗,并且从本公开中可用于本发明的实践。通过在900g离心血沉棕黄层20分钟以分离血浆,然后收集细胞上清液,在300g离心10分钟以去除细胞,在16 500g离心30分钟,然后通过0.22 mm过滤器过滤,可以制备来自血浆的外泌体。通过120,000g超速离心 70分钟使外泌体沉淀。根据制造商在RNAi Human/MouseStarter Kit (Quiagen,Hilden,Germany)中的说明,将siRNA化学转染入外泌体。将 siRNA以2mmol/ml的最终浓度加入100ml的PBS中。在加入HiPerFect 转染试剂后,混合物在室温下孵育10分钟。为了除去过量的胶团,使用醛/硫酸盐乳胶珠重新分离外泌体。核酸靶向系统向外泌体的化学转染可以类似于siRNA进行。外泌体可与从健康供体外周血中分离的单核细胞和淋巴细胞共同培养。因此,可以考虑将含有核酸靶向系统的外泌体引入人的单核细胞和淋巴细胞,并自动重新引入人。因此,根据本发明的递送或施用可以使用血浆外泌体进行。

脂质体

根据本发明的递送或施用可以用脂质体进行。脂质体是由围绕内部水室的单层或多层脂双层和相对不渗透的外部亲脂磷脂双层组成的球形囊泡结构。由于脂质体具有生物相容性、无毒性、既能递送亲水性又能递送亲脂性药物分子、保护其货物免受血浆酶的降解、并能将其货物运输通过生物膜和血脑屏障(BBB),因此作为药物递送载体受到了广泛关注 (例如,参见Spuch and Navarro,Journal of Drug Delivery,vol.2011,Article ID469679,12pages,2011.doi:10.1155/2011/469679供审阅)。脂质体可由几种不同类型的脂质制成;然而,磷脂最常用于生成作为药物载体的脂质体。尽管当脂质膜与水溶液混合时,脂质体的形成是自发的,但也可以通过使用均质器、超声波发生器或挤压设备施加振动形式的力来加速形成(例如,参见Spuch and Navarro,Journal of Drug Delivery,vol.2011, Article ID 469679,12pages,2011.doi:10.1155/2011/469679供审阅)。

为了改变脂质体的结构和性质,可以在脂质体中加入其他几种添加剂。例如,可以向脂质体混合物中加入胆固醇或鞘磷脂,以帮助稳定脂质体结构并防止脂质体内部货物的渗漏。此外,脂质体由氢化的卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和二乙酰磷酸酯制备,并且其平均囊泡尺寸被调整至约50和100nm。(参见,例如,Spuch and Navarro,Journal ofDrug Delivery,vol.2011,Article ID 469679,12pages,2011. doi:10.1155/2011/469679供审阅)。脂质体制剂可主要由天然磷脂和脂质组成,例如1,2-二硬脂酰-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂。由于该制剂仅由磷脂组成,脂质体制剂遇到了许多挑战,其中之一是血浆的不稳定性。已经进行了多次尝试来克服这些挑战,特别是在操纵脂质膜方面。其中一项尝试的重点是控制胆固醇。向常规制剂中添加胆固醇可减少胶囊化生物活性化合物向血浆中的快速释放,或1,2-二油酰-sn-甘油-3-磷酸乙醇胺(DOPE)可提高稳定性(例如,参见Spuch and Navarro,Journal of DrugDelivery,vol.2011, Article ID 469679,12pages,2011.doi:10.1155/2011/469679供审阅)。在一个特别有利的实施方式中,特洛伊木马脂质体(也称为分子特洛伊木马) 是理想的,并且可以在 cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long.找到方案。这些颗粒允许在血管内注射后将转基因递送至整个大脑。不受限制地,据信具有结合于表面的特定抗体的中性脂质颗粒允许通过内吞作用穿过血脑屏障。申请人假设利用特洛伊木马脂质体通过血管内注射将CRISPR-Cas 复合物递送至大脑,这将允许全脑转基因动物无需胚胎操作。约1-5g的 DNA或RNA可被考虑用于脂质体的体内施用。

在另一个实施方式中,核酸靶向系统或其组分可以脂质体形式施用,例如稳定的核酸-脂质颗粒(SNALP)(参见,例如,Morrissey et al.,Nature Biotechnology,Vol.23,No.8,August 2005)。预计每天静脉注射在SNALP 中靶向的约1、3或5mg/kg/天的特定核酸靶向系统。每日治疗可超过约三天,然后每周治疗约五周。在另一个实施方式中,也考虑了通过静脉注射以约1或2.5mg/kg的剂量施用的特定核酸靶向系统(例如,参见 Zimmermanet al.,Nature Letters,Vol.441,4May 2006)。SNALP制剂可包含3-N-[(wm乙氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二嘧啶氧基丙胺 (PEG-丙甲氧基)、1,2-二氢氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2- 二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC)和胆固醇,其摩尔比为2:40:10:48(参见Zimmerman et al.,Nature Letters,Vol.441,4May 2006)。在另一个实施方式中,稳定的核酸-脂质颗粒已被证明是高度血管化的HepG2衍生的肝肿瘤的有效递送分子,但在血管化不良的HCT-116衍生的肝肿瘤中并非如此(参见,例如Li,GeneTherapy(2012)19,775–780)。SNALP脂质体可通过将D-Lin-DMA和PEG-C-DMA与二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA按25:1的脂质/siRNA比率和48/40/10/2的胆固醇 /D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比率配制而成。生成的SNALP 脂质体的大小约为80-100nm。在另一个实施方式中,SNALP可包含合成的胆固醇(Sigma-Aldrich,St Louis,MO,USA)、二棕榈酰磷脂酰胆碱 (美国Alabaster,AL),3-N-[(w-甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2- 二苯乙烯基丙胺,以及阳离子1,2-二氢丙酰氧基-3-N,N-二甲基氨基丙烷(例如参见Geisbert等,Lancet 2010375:1896-905)。可以考虑以例如静脉推注的方式施用每次剂量约为2mg/kg总核酸靶向系统。在又一实施方式中,SNALP可包含合成胆固醇(Sigma-Aldrich)、1,2-二硬脂酰-sn-甘油 -3-磷酸胆碱(DSPC;Avanti Polar LipidsInc.)、PEG-cDMA和1,2-二亚油酰氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(例如,参见Judge,J.Clin. Invest.119:661-673(2009))。用于体内研究的制剂可包含约9:1的最终脂质/RNA质量比率。

RNAi纳米药物的安全性概况已由Alnylam Pharmaceuticals的Barros 和Gollob审阅(例如参见Advanced Drug Delivery Reviews 64(2012) 1730–1737)。稳定的核酸脂质颗粒(SNALP)由四种不同的脂质组成——一种在低pH值下呈阳离子的可电离脂质(DLinDMA)、一种中性辅助脂质、胆固醇和一种可扩散的PEG脂质。该颗粒的直径约为80nm,在生理pH 值下为中性电荷。在制剂过程中,可电离的脂质在颗粒形成过程中与阴离子RNA发生凝聚。当在酸性越来越强的内体条件下带正电时,可电离的脂质还介导了SNALP与内体膜的融合,从而使RNA释放到胞质中。 PEG脂质稳定了颗粒并减少了制剂过程中的聚集,随后提供了中性的亲水性外观,改善了药物动力学性质。迄今为止,已启动了两个使用含RNA的SNALP制剂的临床项目。Tekmira Pharmaceuticals最近完成了一项针对低密度脂蛋白胆固醇升高的成年志愿者的单剂量研究。ApoB主要在肝脏和空肠表达,对VLDL和LDL的组装和分泌至关重要。17名受试者接受了单一剂量的SNALP-ApoB(跨7个剂量水平的剂量递增)。没有证据表明存在肝毒性(根据临床前研究,预计为潜在的剂量限制毒性)。最高剂量的两个受试者中有一个出现了与免疫系统刺激相一致的流感样症状,并决定结束试验。AlnylamPharmaceuticals具有类似的先进的ALN-TTR01,其采用上述SNALP技术,并针对突变型和野生型TTR的肝细胞生成治疗TTR淀粉样变性(ATTR)。已经描述了三种ATTR综合征:家族性淀粉样多神经病(FAP)和家族性淀粉样心肌病(FAC)——均由TTR的常染色体显性突变引起;以及由野生型TTR引起的老年系统性淀粉样变(SSA)。最近在ATTR患者中完成了一项安慰剂对照、单次剂量递增的 ALN-TTR01第一阶段试验。对31名患者(23名使用研究药物,8名使用安慰剂)进行了15分钟的静脉注射ALN-TTR01,剂量范围为 0.01-1.0mg/kg(基于siRNA)。治疗耐受性良好,肝功能检查无明显增加。 23例患者中有3例出现≥0.4mg/kg的输液相关反应;所有受试者均对输注速率减慢作出反应,并且均继续进行研究。在最高剂量为1mg/kg的两名患者中发现了血清细胞因子IL-6、IP-10和IL-1ra的轻微和短暂升高 (根据临床前和NHP研究的预期)。在1mg/kg的剂量下观察到血清 TTR(ALN-TTR 01的预期药效)降低。

在另一个实施方式中,可通过将阳离子脂质、DSPC、胆固醇和PEG 脂质(例如分别以40:10:40:10的摩尔比)溶解在乙醇中来制备SNALP(参见,Semple et al.,NatureNiotechnology,Volume 28Number 2February 2010,pp.172-177)。将脂质混合物加入水性缓冲液(50mM柠檬酸盐,pH 4)中,混合至最终的乙醇和脂质浓度分别为30%(体积/体积)和6.1mg/ml,并在挤出前在22℃平衡2分钟。使用Lipex挤塑机(Northern Lipids)在 22℃下通过两个堆叠的80纳米孔径过滤器(Nuclepore)挤出水合脂质,直至通过动态光散射分析确定的囊泡直径达到70-90纳米。这通常需要1-3 次通过。在混合的情况下,将siRNA(溶解于含30%乙醇的50mM柠檬酸钠pH 4水溶液中)以约5ml/min的速率加入到预平衡(35℃)的囊泡中。在达到0.06(重量/重量)的最终目标siRNA/脂质比率后,将混合物在35℃下再保温30分钟,以使囊泡重组并包裹siRNA。然后通过透析或切向流渗滤去除乙醇,并用PBS(155mM氯化钠、3mM Na2HPO4、1mM KH2PO4、pH 7.5)替换外部缓冲液。使用受控的逐步稀释法工艺将siRNA 封装在SNALP中。KC2-SNALP的脂质成分为DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;Avanti Polar Lipids),合成胆固醇 (Sigma)和PEG-C-DMA,以摩尔比为57.1:7.1:34.3:1.4使用。在形成负载颗粒后,将SNALP对PBS进行透析,并在使用前通过0.2μm的过滤器进行过滤消毒。平均颗粒尺寸为75-85纳米,90-95%的siRNA被包裹在脂质颗粒中。用于体内测试的制剂中的最终siRNA/脂质比率约为 0.15(重量/重量)。在使用前立即将含有因子VII siRNA的LNP-siRNA系统稀释至适当浓度,并通过尾侧静脉以10ml/kg的总体积静脉内施用。该方法和这些递送系统可外推到本发明的核酸靶向系统。

其他脂质

其他阳离子脂质,例如氨基脂质2,2-二甲醇-4-二甲胺基乙基-[1, 3]-二氧戊环(DLin-KC2-DMA)可用于包裹核酸靶向系统或其自分或编码其的核酸分子,例如类似于SiRNA(参见J Jayaraman,Angew.Chem.Int. Ed.2012,51,8529–8533),因此可用于本发明的实践。可考虑具有以下脂质组成的预成型囊泡:氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八氧基)丙-1-(甲氧基聚(乙二醇)2000)丙氨基甲酸酯(PEG-脂质),其摩尔比率为40/10/40/10,且FVII siRNA/总脂质比率为约0.05 (w/w)。为确保70-90nm范围内的窄颗粒尺寸分布和0.11±0.04(n=56)的低多分散指数,在加入指导RNA之前,颗粒可通过80纳米的膜挤出三次。可使用含有高效氨基脂质16的颗粒,其中四种脂质成分16、DSPC、胆固醇和PEG脂质的摩尔比率(50/10/38.5/1.5)可进一步优化至提升体内活性。

Michael S D Kormann等(Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice:Nature Biotechnology, Volume:29,Pages:154–157(2011))描述了使用脂包膜递送RNA的方法。在本发明中也优选使用脂包膜。

在另一个实施方式中,可以用本发明的RNA靶向系统 (CRISPR-Cas13复合物,即与crRNA复合的Cas13)或其组分或编码其的核酸分子来制备脂质,以形成脂质纳米颗粒(LNPs)。脂质包括但不限于 DLin-KC2-DMA4、C12-200和二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG,可以用RNA靶向系统而非siRNA系统进行配制(例如,参见 Novobrantseva,Molecular Therapy–Nucleic Acids(2012)1,e4; doi:10.1038/mtna.2011.3)使用自发囊泡形成程序。组分摩尔比可以为约 50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇 /PEG-DMG)。在DLin-KC2-DMA和C12-200脂质颗粒的情况下,最终脂质与siRNA的重量比为约12:1和9:1。制剂的平均颗粒直径约为80纳米,包封率大于90%。可考虑3毫克/千克的剂量。Tekmira在美国和海外拥有约95个专利家族,涉及LNP和LNP制剂的各个方面(例如,参见美国专利号第7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651; 7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658和欧洲专利号1766035;1519714;1781593和1664316),所有这些都可以用于和/或适用于本发明。

可将RNA靶向系统或其组分或编码其的核酸分子包裹在PLGA微球中递送,例如美国公开申请20130252281和20130245107和 20130244279(转让给Moderna Therapeutics)中进一步描述的,该申请涉及包含可编码蛋白质、蛋白质前体或部分或完全加工形式的蛋白质或蛋白质前体的经修饰的核酸分子的组合物的制剂方面。制剂的摩尔比为 50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)。PEG脂质可选自但不限于PEG-c-DOMG、PEG-DMG。融合脂质可能是DSPC。另请参见Schrum et al.,Delivery andFormulation of Engineered Nucleic Acids 和美国公开申请20120251618。

Nanomerics技术解决了生物利用度挑战,涉及广泛的治疗方法,包括低分子量疏水药物、肽和基于核酸的治疗方法(质粒、siRNA、miRNA)。该技术已显示出明显优势的具体施用途径包括口服途径、跨血脑屏障转运、递送至实体肿瘤以及眼睛。参见,例如,Mazza etal.,2013,ACS Nano. 2013Feb 26;7(2):1016-26;Uchegbu and Siew,2013,J Pharm Sci.102(2):305-10and Lalatsa et al.,2012,J Control Release.2012Jul 20; 161(2):523-36。

美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子(例如多聚核苷酸分子、肽和多肽和/或药剂)的阳离子树状大分子。树状大分子适合于将生物活性分子靶向递送至例如肝、脾、肺、肾或心脏(或甚至大脑)。树状大分子是由简单的支化单体单元逐步制备的合成三维大分子,其性质和功能易于控制和改变。树状大分子是通过向多功能核中重复添加结构单元(分散合成法)或向多功能核中重复添加结构单元(聚合合成法)来合成的,并且每次添加结构单元的三维壳都会导致形成更高代的树状大分子。聚丙烯胺树状大分子从二氨基丁烷核开始,通过向伯胺中双迈克尔加成丙烯腈,然后氢化腈,向其中加入两倍数量的氨基。这导致氨基加倍。聚丙烯胺树状大分子包含100%的可质子化氮和最多64个末端氨基(第5代,DAB 64)。可质子化的基团通常是能够在中性pH值下接受质子的胺基。树状大分子作为基因递送剂的使用主要集中在聚酰胺胺的使用上。以及分别以胺/酰胺或N-P(O

超电荷蛋白质

超电荷蛋白质是一类具有异常高的正或负理论净电荷的工程或天然存在的蛋白质,可用于递送核酸靶向系统或其组分或编码其的核酸分子。超负电荷和超正电荷荷的蛋白质均表现出抵抗热或化学诱导聚集的显著能力。超正电荷蛋白质也能够穿透哺乳动物细胞。将货物与这些蛋白质 (例如质粒DNA、RNA或其他蛋白质)结合,能够使这些大分子在体外和体内功能性地递送至哺乳动物细胞。David Liu实验室于2007年报告了超电荷蛋白质的产生和特性(Lawrence et al.,2007,Journal of the American Chemical Society129,10110–10112)。

将RNA和质粒DNA非病毒递送至哺乳动物细胞对研究和治疗应用均有价值(Akincet al.,2010,Nat.Biotech.26,561–569)。将纯化的+36GFP 蛋白(或其他超正电荷的蛋白)与RNA在适当的无血清介质中混合,并在加入细胞前进行复合。在此阶段加入血清会抑制超电荷蛋白-RNA复合物的形成,降低治疗效果。以下方案已被发现对多种细胞系有效(McNaughton et al.,2009,Proc.Natl.Acad.Sci.USA 106,6111–6116)。但是,应进行改变蛋白质和RNA剂量的试点实验,以优化特定细胞系的程序。(1)治疗前一天,在48孔平板中每孔平板1×10

+36GFP被发现在一系列细胞中是有效的质粒递送试剂。另请参见,例如McNaughton et al.,Proc.Natl.Acad.Sci.USA 106,6111-6116(2009); Cronican etal.,ACS Chemical Biology 5,747-752(2010);Cronican et al., Chemistry&Biology18,833-838(2011);Thompson et al.,Methods in Enzymology 503,293-319(2012);Thompson,D.B.,et al.,Chemistry& Biology 19(7),831-843(2012)。超电荷蛋白的方法可用于和/或适用于递送本发明的RNA靶向系统或其组分或编码其的核酸分子。

细胞渗透肽(CPP)

在另一个实施方式中,细胞渗透肽(CPP)被考虑用于CRISPR Cas系统的递送。CPP是促进细胞吸收各种分子货物(从纳米颗粒到小化学分子和大DNA片段)的短肽。本文中使用的术语“货物”包括但不限于由治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、颗粒(包括纳米颗粒)、脂质体、发色团、小分子和放射性材料组成的组。在本发明的方面,货物还可以包括CRISPR Cas系统的任何组件或整个功能性 CRISPR Cas系统。本发明的方面进一步提供了用于将所需货物递送至受试者的方法,包括:(a)制备包含本发明的细胞渗透肽和所需货物的复合物,和(b)经口、关节内、腹膜内、鞘内、动脉内、鼻内、实质内、皮下、肌内、静脉内、皮肤内、直肠内或局部给予受试者该复合物。货物通过共价键的化学连接或非共价相互作用与肽结合。CPP的功能是将货物运送到细胞内,这一过程通常通过将货物运送到活的哺乳动物细胞的内体而发生。细胞渗透肽具有不同的大小、氨基酸序列和电荷,但所有CPP 都有一个独特的特征,即能够转运质膜并促进各种分子货物向胞质或细胞器的递送。CPP转运可分为三种主要的进入机制:直接渗透入膜、胞吞作用介导的进入和通过形成过渡结构的转运。CPP作为药物递送剂已在医学中发现了许多应用,用于治疗不同疾病,包括癌症和病毒抑制剂,以及用于细胞标记的对比剂。后者的例子包括作为GFP、MRI相差剂或量子点的载体。CPP作为体外和体内递送载体在研究和医学中具有巨大潜力。CPP的氨基酸组成通常包含相对丰富的带正电的氨基酸,例如赖氨酸或精氨酸,或者包含极性/带电的氨基酸和非极性、疏水的氨基酸的交替模式的序列。这两类结构分别称为聚阳离子或两亲性结构。第三类 CPP是仅含非极性残基、净电荷低或具有对细胞吸收至关重要的疏水氨基酸基团的疏水肽。最初发现的CPP之一是来自人类免疫缺陷病毒1 (HIV-1)的反式激活转录激活因子(Tat),发现其在培养过程中被多种细胞类型有效地从周围介质中吸收。自那时起,已知CPP的数量大幅增加,并且产生了具有更有效的蛋白质转导性质的小分子合成类似物。CPP包括但不限于渗透素、Tat(48-60)、Transportan和(R-AhX-R4)(AhX=氨基己酰)。

美国专利8,372,951提供了一种来源于嗜酸细胞阳离子蛋白(ECP)的 CPP,其表现出高细胞渗透效率和低毒性。还提供了将CPP及其货物递送给脊椎动物受试者的方面。美国专利8,575,305;8,614,194和8,044,019 中描述了CPP及其递送的其他方面。CPP可用于递送CRISPR-Cas系统或其组件。“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA”,by Suresh Ramakrishna,Abu-Bonsrah Kwaku Dad,Jagadish Beloor,et al.Genome Res.2014Apr 2.[Epub ahead ofprint] 一文也提供了CPP可用于递送CRISPR-Cas系统或其组件,通过引用并入本文,其中证明了用CPP缀合的重组Cas9蛋白和CPP复合的指导RNA 处理会导致人细胞系的内源性基因破坏。在本文中,Cas9蛋白通过硫醚键与CPP缀合,而指导RNA与CPP复合,形成凝聚的带正电的颗粒。研究表明,用经修饰的Cas9和指导RNA同时和顺序处理人细胞,包括胚胎干细胞、皮肤成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞,可导致有效的基因破坏,减少与质粒转染相关的非靶突变。CPP递送可用于本发明的实践。

植入式设备

在另一个实施方式中,还考虑了可植入装置用于递送RNA靶向系统或其组分或编码其的核酸分子。例如,美国专利公开20110195123公开了一种可植入的医疗装置,其在局部和长时间内洗脱药物,包括该装置的几种类型、实施的治疗模式和植入方法。该装置包括用作装置主体的聚合物基底,例如基质,和药物,在某些情况下还包括额外的支架材料,例如金属或额外的聚合物,以及提升可见性和成像材料。植入式递送装置可有利于提供局部和长时间的释放,其中药物被直接释放至患病区域的细胞外基质(ECM),例如肿瘤、炎症、退化或用于症状性目的,或用于受损的平滑肌细胞,或用于预防。如上所述,一种药物是RNA,该系统可用于/和/或适用于本发明的核酸靶向系统。在一些实施方式中,植入的模式是现有的植入程序,这些植入程序目前被开发并用于其他治疗,包括近距离放射治疗和针活组织检查。在这种情况下,本发明中描述的新植入体的尺寸与原始植入体相似。通常在同一治疗过程中植入一些装置。美国专利公开20110195123提供了一种可植入或可插入的药物递送系统,包括适用于例如腹腔的腔和/或药物递送系统未被固定或连接的任何其他类型的施用的系统,包括生物稳定和/或可降解和/或生物可吸收的聚合物基质,其可以例如可选地为基质。应当注意,术语“插入”也包括植入。药物递送系统优选实施为美国专利公开20110195123中所述的“Loder”。所述一种或多种聚合物是生物相容的,包含试剂和/或多种试剂,能够以受控的速率释放试剂,其中在一些实施方式中,聚合物基质(例如基质)的总体积可选地且优选地不大于允许达到试剂治疗水平的最大体积。作为非限制性示例,该体积优选在0.1m

任选地,系统(例如包含组合物的装置)的插入与在靶部位和该部位附近向外基质注射材料相关联,以影响局部pH和/或温度和/或影响药物在外基质、靶部位和该部位附近的扩散和/或药物动力学的其他生物因素。可选地,根据一些实施方式,所述试剂的释放可与在插入之前和/或插入时和/或插入之后通过非侵入性和/或最小侵入性和/或其他激活和/或加速 /减速方法(包括激光束、辐射、加热和冷却)和超声波(包括聚焦超声波和 /或射频(射频)方法或装置)以及化学激活剂操作的感测和/或激活设备相关联。

根据可用于实施本发明的美国专利公开20110195123的实施方式,该药物优选包含一种RNA,例如用于如下所述的乳腺、胰腺、脑、肾、膀胱、肺和前列腺的局部癌症病例。尽管以RNAi为例,但许多药物适用于被包裹在Loder中,并且可与本发明结合使用,只要这样的药物可被包裹在Loder基质(例如基质)中,并且该系统可被用于和/或适于递送本发明的核酸靶向系统。作为具体应用的另一个例子,神经和肌肉退化性疾病因基因表达异常而发展。局部递送RNA可能具有干扰这种异常基因表达的治疗性质。局部递送抗凋亡、抗炎和抗退化药物(包括小药物和大分子)也可以任选地具有治疗作用。在这种情况下,Loder以恒定速率和/或通过单独植入的专用装置申请长期释放。

所有这些均可用于和/或适用于本发明的RNA靶向系统。本文讨论的可植入装置技术可与本文的教导一起使用,因此通过本公开和本领域的知识,CRISPR-Cas13系统或其复合物或成分或其核酸分子或编码或提供成分可通过可植入装置递送。

聚合物基颗粒

本文的系统和组合物可以使用基于聚合物的颗粒(例如,纳米颗粒) 递送。在一些实施方式中,基于聚合物的颗粒可以模拟膜融合的病毒机制。基于聚合物的颗粒可以是流感病毒机器的合成拷贝,并与细胞通过内吞途径(包括形成酸室的过程)吸收的各种类型的核酸(siRNA、miRNA、质粒DNA或shRNA、mRNA)形成转染复合物。后期内体的低pH值起到化学交换机的作用,使颗粒表面疏水并促进膜交叉。一旦进入胞质溶胶,颗粒释放其有效载荷用于细胞活动。这种主动内体逃避技术是安全的,并且由于使用了自然吸收途径,因此最大限度地提高了转染效率。在一些实施方式中,基于聚合物的颗粒可包含烷基化和碳烷基化的支化聚乙烯亚胺。在一些实施方式中,基于聚合物的颗粒为VIROMER,例如 VIROMER RNAi、VIROMER RED、VIROMER mRNA、VIROMER CRISPR。在此递送系统和组合物的示例性方法包括Bawage SS等中所述的方法,合成表达的Cas13a减轻了RNA病毒感染, www.biorxiv.org/content/10.1101/370460v1.full doi: doi.org/10.1101/370460,

载体

在某些方面,本发明涉及载体,例如用于在细胞中递送或引入CRISPR-Cas和/或能够指导CRISPR-Cas至靶位点的RNA(即指导RNA),以及用于繁殖这些成分(例如在原核细胞中)。这里使用的“载体”是允许或促进实体从一个环境转移到另一个环境的工具。它是一种复制子,例如质粒、噬菌体或粘粒,可以在其中插入另一个DNA片段,从而实现插入片段的复制。通常,当载体与适当的控制元件相关联时,载体能够复制。一般而言,术语“载体”指能够运输与其连接的另一种核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如圆形)的核酸分子;包含DNA、RNA或两者的核酸分子;和本领域已知的其他多聚核苷酸。一种载体类型是“质粒”,指可插入额外DNA片段的环状双链DNA环,例如通过标准分子克隆技术。另一类载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于载体中,用于包装成病毒(例如,反转录病毒、复制缺陷型反转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)。病毒载体还包括病毒携带的用于转染入宿主细胞的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加体哺乳动物载体)。其他载体(例如,非附加体哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与其有效连接的基因的表达。该载体在本文中称为“表达载体”。重组DNA 技术中常用的表达载体通常为质粒形式。

重组表达载体可包含本发明的核酸,其形式适合于在宿主细胞中表达该核酸,这意味着重组表达载体包含一种或多种调节元件,其可基于待用于表达的宿主细胞进行选择,并与待表达的核酸序列有效连接。在重组表达载体中,“可操作地连接”是指感兴趣的核苷酸序列以允许该核苷酸序列表达的方式(例如,在体外转录/翻译系统中或当载体被引入宿主细胞时在宿主细胞中)连接至调节元件。关于重组和克隆方法,请参见美国专利申请10/815,730,该申请于2004年9月2日公布为US 2004-0171156A1,其全部内容通过引用并入本文。

载体可包括调节元件,例如启动子。载体可包含CRISPR-Cas编码序列,和/或单个,但也可能包含至少2、3或8或16或32或48或50个指导RNA(例如,crRNA)编码序列,例如1-2、1-3、1-4、1-5、3-6、3-7、 3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50个RNA(crRNA)。在单个载体中,每一个RNA(例如,crRNA)可以有一个启动子,有利的是,最多约有16个RNA(例如,crRNA);并且,当单个载体提供16个以上的RNA(例如,crRNA)时,一个或多个启动子可以驱动一个以上的 RNA(例如,crRNA)的表达,例如,当有32个RNA(例如,sgRNA或crRNA) 时,每个启动子可以驱动两个RNA(例如,sgRNA或crRNA)的表达,当有48个RNA(例如sgRNA或crRNA)时,每个启动子可驱动三个RNA(例如,sgRNA或crRNA)的表达。通过简单的算术和完善的克隆方案以及本公开中的教导,本领域技术人员可以容易地针对适合的示例性载体例如AAV和合适的启动子例如U6启动子,例如U6-sgRNA或-crRNA实施本发明的RNA例如sgRNA或crRNA。例如,AAV的包装限制为~4.7kb。技术人员可以容易地在单个载体中装配约12-16个,例如13个U6-sgRNA 或crRNA盒。可以通过任何合适的方式进行组装,例如用于TALE组装的金门策略(www.genome-engineering.org/taleffectors/)。技术人员还可以使用串联指导策略将U6-sgRNA或-crRNA的数量增加约1.5倍,例如,从12-16,例如13增加至约18-24,例如,19个U6-sgRNA或-crRNA。因此,本领域技术人员可以在单个载体例如AAV载体中容易地达到约 18-24,例如约19个启动子-RNA,例如U6-sgRNA或-crRNA。增加载体中启动子和RNA(例如sgRNA或crRNA)数量的另一种方法是使用单个启动子(例如U6)来表达RNA阵列,例如sgRNA或crRNA由可切割序列分隔。并且用于增加载体中的启动子-RNA例如sgRNA或crRNA的数目的另一种方法是表达在载体中被编码序列或基因的内含子中的可切割序列分开的启动子-RNA例如sgRNA或crRNA的阵列;并且,在这种情况下,使用聚合酶II启动子是有利的,该启动子可以增加表达并能够以组织特异性方式转录长RNA。(例如,参见nar.oxfordjournals.org/content/34/7/e53.short, www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施方式中,AAV可以包装靶向多达约50个基因的U6串联sgRNA。因此,根据本领域的知识和本公开的教导,本领域技术人员可以容易地制备和使用在控制下或可操作地或功能性连接至一个或多个启动子的表达多个RNA或指导或sgRNA或crRNA的载体,例如单个载体——特别是本文讨论的RNA或指导或sgRNA或crRNA的数量,无需进行任何不适当的实验。

试剂盒

一方面,本发明提供了包含上述方法和组合物中公开的任何一种或多种组分的试剂盒。在一些实施方式中,试剂盒包括本文所述的载体系统或本文所述的CRISPR/Cas系统或复合物的一种或多种成分,例如 crRNA和或/CRISPR-Cas效应蛋白或CRISPR-Cas效应蛋白编码mRNA,以及使用试剂盒的说明。元件可以单独提供或组合提供,并且可以在任何合适的容器中提供,例如小瓶、瓶或管。在一些实施方式中,试剂盒包括一种或多种语言的说明书,例如多种语言的说明书。这样的说明书可特定于本文所述的应用和方法。在一些实施方式中,试剂盒包含一种或多种试剂,用于使用本文所述一种或多种组分的方法。试剂可在任何合适的容器中提供。例如,试剂盒可提供一种或多种反应或储存缓冲液。试剂可以以可用于特定测定的形式提供,或者以在使用前需要添加一种或多种其他成分的形式提供(例如,以浓缩或冷冻干燥的形式)。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方式中,缓冲液是碱性的。在一些实施方式中,缓冲液的pH值为约7至约10。在一些实施方式中,试剂盒包含一种或多种对应于插入载体的指导序列的寡核苷酸,以便可操作地连接指导序列或crRNA序列和调节元件。在一些实施方式中,试剂盒包含同源重组模板多核苷酸。在一些实施方式中,试剂盒包含一种或多种载体和/或一种或多种本文所述的多核苷酸。该试剂盒可有利地允许提供本发明系统的所有组分。

本申请还提供了以下编号的陈述中所述的方面和实施方式:

1.一种工程化CRISPR-Cas蛋白,其包含一个或多个HEPN结构域,以及还包含一个或多个修饰的氨基酸,其中所述氨基酸:

a.与指导RNA相互作用,所述指导RNA与所述工程化CRISPR-Cas 蛋白形成复合物;

b.在所述工程化CRISPR-Cas蛋白的HEPN活性位点、结构域间接头结构域、盖结构域、螺旋结构域1、螺旋结构域2或桥螺旋结构域中;或者

c.其组合。

2.根据陈述1所述的工程化CRISPR-Cas蛋白,其中所述HEPN结构域包含RxxxxH基序。

3.根据陈述1或2所述的工程化CRISPR-Cas蛋白,其中所述RxxxxH 基序包含R{N/H/K}X

4.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中:

X

X

X

5.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。

6.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述VI型CRISPR-Cas蛋白是Cas13。

7.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述VI型CRISPR-Cas蛋白是Cas13a、Cas13b、Cas13c或Cas13d。

8.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:T405、H407、K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、 R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、 K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、 K836、R838、R618、D434、K431、R53、K943、R1041、Y164、R285、 R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、 R482、N480、D396、E397、D398、E399、K294、E400、R56、N157、 H161、H452、N455、K484、N486、G566、H567、A656、V795、A796、 W842、K871、E873、R874、R1068、N1069或H1073。

9.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:H407、K457、H500、K570、K590、N634、 R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、 R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、 R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、 R838、R618、D434、K431、R53、K943、R1041、Y164、R285、R287、 K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、 N480、D396、E397、D398、E399、K294、E400、R56、N157、H161、 H452、N455、K484、N486、G566、H567、W842、K871、E873、R874、 R1068、N1069或H1073。

10.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:T405、H407、K457、H500、K570、K590、 N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、 R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、 K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、K943、R1041、Y164、R285、 R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、 R482、N480、D396、E397、D398、E399、K294或E400。

11.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K393、R402、N482、T405、H407、S658、 N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、 K590、R638、H452、S757、N756、N486、K484、N480、K457、K741、 R56、N157、H161、R1068、N1069或H1073。

12.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N482、H407、S658、N653、K655、N652、H567、N455、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、 K590、R638、H452、S757、N756、N486、K484、N480、K457、K741、 R56、N157、H161、R1068、N1069或H1073。

13.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:W842、 K846、K870、E873或R877。

14.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:W842、K846、K870、E873或R877。

15.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:W842、K846、K870、E873或R877。

16.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在桥螺旋结构域中包含对应于PbCas13b的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变:W842、K846、K870、E873或R877。

17.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N480、N482、N652或N653。

18.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N480或N482。

19.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K393、R402、N480或N482。

20.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:N652或 N653。

21.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:N652或N653。

22.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:T405、H407、 S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、 K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、 G566、K590、R638、H452、S757、N756、N486、K484、N480、K457 或K741。

23.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H407、S658、 N653、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、K457或K741。

24.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 A656、K655、N652、H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、 S757、N756或K741。

25.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域中包含对应于PbCas13b的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变:S658、N653、A656、K655、N652、H567、H500、 K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、S757、N756或K741。

26.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H567、H500、 K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、 A796、R791、G566、S757或N756。

27.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、S757或N756。

28.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H567、H500、 R762、V795、A796、R791、G566、S757或N756。

29.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H567、H500、R762、V795、A796、R791、G566、 S757或N756。

30.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K871、K857、 K870、W842、E873、R877、K846或R874。

31.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在桥螺旋结构域中包含对应于PbCas13b的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变:K871、K857、K870、W842、E873、R877、 K846或R874。

32.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H567、H500 或G566。

33.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-2中包含对应于PbCas13b的螺旋结构域1-2中的下述氨基酸的氨基酸的一个或多个突变:H567、H500或G566。

34.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K871、K857、 K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、 S757或N756。

35.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:K871、K857、K870、W842、E873、R877、 K846、R874、R762、V795、A796、R791、S757或N756。

36.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:R762、V795、 A796、R791、S757或N756。

37.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:R762、V795、A796、R791、S757或N756。

38.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 A656、K655、N652、K590、R638或K741。

39.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:S658、N653、A656、K655、N652、K590、R638 或K741。

40.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:T405、H407、 N486、K484、N480、H452、N455或K457。

41.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:T405、H407、N486、K484、N480、H452、N455或 K457。

42.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 K655、N652、H567、H500、K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、G566、K590、R638、S757、N756或K741。

43.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域中包含对应于PbCas13b的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变:S658、N653、K655、N652、H567、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、R638、S757、N756或K741。

44.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H567、H500、 K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、S757或N756。

45.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、S757或N756。

46.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H567、H500、 R762、R791、G566、S757或N756。

47.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H567、H500、R762、R791、G566、S757或N756。

48.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K871、K857、 K870、W842、E873、R877、K846、R874、R762、R791、S757或N756。

49.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:K871、K857、K870、W842、E873、R877、 K846、R874、R762、R791、S757或N756。

50.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:R762、R791、S757或N756。

51.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:R762、R791、S757或N756。

52.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、K655、N652、K590、R638或K741。

53.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于PbCas13b的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:S658、N653、K655、N652、K590、R638或K741。

54.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H407、N486、 K484、N480、H452、N455或K457。

55.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:H407、N486、K484、N480、H452、N455或K457。

56.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:R56、N157、 H161、R1068、N1069或H1073。

57.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于PbCas13b的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R56、N157、H161、R1068、N1069或H1073。

58.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:R56、N157 或H161。

59.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于PbCas13b的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R56、N157或H161。

60.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:R1068、 N1069或H1073。

61.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于PbCas13b的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:R1068、N1069或H1073。

62.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N482、T405、H407、N486、K484、N480、H452、N455或K457。

63.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K393、R402、N482、T405、H407、N486、K484、N480、 H452、N455或K457。

64.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N482、H407、N486、K484、N480、H452、N455或K457。

65.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K393、R402、N482、H407、N486、K484、N480、H452、 N455或K457。

66.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:T405、H407、 S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、 K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、 G566、K590、R638、H452、S757、N756、N486、K484、N480、K457、 K741、K393、R402或N482。

67.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:H407、S658、 N653、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、R791、G566、K590、R638、H452、 S757、N756、N486、K484、N480、K457、K741、K393、R402或N482。

68.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457或K741。

69.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、 N756、N486、K484、N480、K457或K741。

70.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:N486、K484、 N480、H452、N455或K457。

71.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:N486、K484、N480、H452、N455或K457。

72.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:K393、R402、 N482、N486、K484、N480、H452、N455或K457。

73.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于PbCas13b的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K393、R402、N482、N486、K484、N480、H452、N455 或K457。

74.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、 E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457、K741、K393、 R402或N482。

75.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于PbCas13b的下述氨基酸的氨基酸的一个或多个突变:S658、N653、 K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、 N756、N486、K484、N480、K457、K741、K393、R402或N482。

76.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943或R1041。

77.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53或Y164。

78.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K943或R1041。

79.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943或R1041。

80.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R53或Y164。

81.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:K943或R1041。

82.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943、R1041、R56、N157、 H161、R1068、N1069或H1073。

83.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、R56、N157或H161。

84.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K943、R1041、R1068、N1069或H1073。

85.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943、R1041、R56、N157、H161、R1068、N1069或H1073.

86.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、R56、N157或H161。

87.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:K943、R1041、R1068、N1069或H1073。

88.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、K943或R1041。

89.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183或K193。

90.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K943或R1041。

91.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、K943或R1041。

92.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183或K193。

93.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:K943 or R1041。

94.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、K943、R1041、 R56、N157、H161、R1068、N1069或H1073。

95.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、R56、N157 或H161。

96.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K943、R1041、R1068、N1069或H1073。

97.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、K943、R1041、R56、N157、H161、R1068、 N1069或H1073。

98.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K183、K193、R56、N157或H161。

99.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:K943、R1041、R1068、N1069或H1073。

100.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K183或K193。

101.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:K183或K193。

102.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943或R1041。

103.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、Y164、K943或R1041。

104.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、K943或R1041;优选地R53A、 R53K、R53D或R53E;K943A、K943R、K943D或K943E;或者R1041A、 R1041K、R1041D或R1041E。

105.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53、K943或R1041;优选地R53A、R53K、R53D或R53E;K943A、 K943R、K943D或K943E;或者R1041A、R1041K、R1041D或R1041E。

106.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 Y164的氨基酸的突变,优选地Y164A、Y164F或Y164W。

107.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在HEPN结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域1的氨基酸Y164的氨基酸的突变,优选地Y164A、Y164F或Y164W。

108.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:T405、H407、K457、D434、K431、 R402、K393、R482、N480、D396、E397、D398或E399。

109.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:T405、H407、 K457、D434、K431、R402、K393、R482、N480、D396、E397、D398 或E399。

110.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H407的氨基酸的突变,优选地H407Y、H407W或H407F。

111.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R402、K393、R482、N480、D396、E397、D398或E399。

112.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:R402、K393、 R482、N480、D396、E397、D398或E399。

113.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K457、D434或K431。

114.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K457、D434 或K431。

115.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:H500、K570、K590、N634、R638、 N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、R614、K617、K826、 K828、K829、R824、R830、Q831、K835、K836、R838、R618、Q646、 N647、N653或N652。

116.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变: H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、 K744、N756、S757、R762、R791、K846、K857、K870、R877、R600、 K607、K612、R614、K617、K826、K828、K829、R824、R830、Q831、 K835、K836、R838、R618、Q646、N647、N653或N652。

117.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:H500、K570、N756、S757、R762、 R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。

118.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H500、K570、N756、S757、R762、R791、K846、K857、K870、R877、 K826、K828、K829、R824、R830、Q831、K835、K836或R838。

119.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:H500、K570、N756、S757、R762或 R791。

120.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1中的下述氨基酸的氨基酸的一个或多个突变:H500、K570、N756、S757、R762或R791。

121.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K846、K857、K870、R877、K826、 K828、K829、R824、R830、Q831、K835、K836或R838。

122.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在桥螺旋结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的桥螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变:K846、K857、K870、R877、K826、K828、K829、R824、R830、 Q831、K835、K836或R838。

123.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:H500或K570。

124.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-2中的下述氨基酸的氨基酸的一个或多个突变:H500或K570。

125.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762、R791、K846、 K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。

126.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762、R791、K846、K857、K870、R877、K826、 K828、K829、R824、R830、Q831、K835、K836或R838。

127.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762或R791。

128.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762或R791。

129.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762、R791、K846、 K857、K870或R877。

130.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:N756、S757、R762、R791、K846、K857、K870或R877。

131.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K826、K828、K829、R824、R830、 Q831、K835、K836或R838。

132.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域1-3中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域1-3中的下述氨基酸的氨基酸的一个或多个突变:K826、K828、K829、R824、R830、Q831、K835、K836或R838。

133.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K590、N634、R638、N652、N653、 K655、S658、K741、K744、R600、K607、K612、R614、K617、R618、Q646、N647、N653或N652。

134.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:K590、N634、R638、N652、N653、K655、S658、K741、K744、R600、K607、K612、R614、K617、R618、Q646、N647、N653或N652。

135.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:Q646或N647。

136.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:Q646或N647。

137.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N653或N652。

138.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:N653或N652。

139.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K590、N634、R638、N652、N653、 K655、S658、K741或K744。

140.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:K590、N634、R638、N652、N653、K655、S658、K741或K744。

141.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R600、K607、K612、R614、K617或 R618。

142.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:R600、K607、K612、R614、K617或R618。

143.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R285、R287、K292、E296、N297或 K294。

144.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 IDL结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的IDL结构域中的下述氨基酸的氨基酸的一个或多个突变: R285、R287、K292、E296、N297或K294。

145.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R285、K292、E296或N297。

146.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 IDL结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的IDL结构域中的下述氨基酸的氨基酸的一个或多个突变: R285、K292、E296或N297。

147.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:T405、H500、K570、K590、N634、 R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、 R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、 R838、R618、D434、K431、R285、R287、K292、E296、N297、Q646、N647或K294。

148.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R402、K393、N653、N652、R482、 N480、D396、E397、D398或E399。

149.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53、K655、R762或R1041;优选地 R53A或R53D;K655A;R762A;或者R1041E或R1041D。

150.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N297、E296、K292或R285;优选地 N297A、E296A、K292A或R285A。

151.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 IDL结构域(的中央通道)中包含对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的IDL结构域(的中央通道)中的下述氨基酸的氨基酸的一个或多个突变:N297、E296、K292或R285;优选地N297A、 E296A、K292A或R285A。

152.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:Q831、K836、R838、N652、N653、 R830、K655或R762;优选地Q831A、K836A、R838A、N652A、N653A、 R830A、K655A或R762A。

153.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:N652、N653、R830、K655 or R762;优选地N652A、N653A、R830A、K655A或R762A。

154.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K655或R762;优选地K655A或 R762A。

155.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变: Q831、K836、R838、N652、N653、R830、K655或R762;优选地Q831A、K836A、R838A、N652A、N653A、R830A、K655A或R762A。

156.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域中的下述氨基酸的氨基酸的一个或多个突变: N652、N653、R830、K655或R762;优选地N652A、N653A、R830A、 K655A或R762A。

157.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的螺旋结构域2中的下述氨基酸的氨基酸的一个或多个突变:K655或R762;优选地K655A或R762A。

158.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R614、K607、K193、K183或R600;优选地R614A、K607A、K193A、K183A或R600A。

159.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在螺旋结构域2的反式亚基环中包含对应于颊普雷沃菌(Prevotella buccae) Cas13b(PbCas13b)的螺旋结构域2的反式亚基环中的下述氨基酸的氨基酸的一个或多个突变:Q646或N647;优选地Q646A或N647A。

160.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R53或R1041;优选地R53A或R53D 或R1041E或R1041D。

161.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R53或R1041;优选地R53A或R53D或R1041E或R1041D。

162.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K457、D397、E398、D399、E400、 T405、H407或D434;优选地D397A、E398A、D399A、E400A、T405A、 H407A、H407W、H407Y、H407F或D434A。

163.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在盖结构域中包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的盖结构域中的下述氨基酸的氨基酸的一个或多个突变:K457、D397、E398、D399、E400、T405、H407或D434;优选地D397A、E398A、D399A、 E400A、T405A、H407A、H407W、H407Y、H407F或D434A。

164.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b) 的下述氨基酸:氨基酸46-57、73-79、152-164、1036-1046和1064-1074。

165.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R156、N157、H161、R1068、N1069 和H1073。

166.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:R285、R287、K292、K294、E296和 N297。

167.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:K826、K828、K829、R824、R830、 Q831、K835、K836和R838。

168.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的下述氨基酸的氨基酸的一个或多个突变:T405、H407、K457、H500、K570、 K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870和R877。

169.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 T405的氨基酸的突变。

170.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H407的氨基酸的突变。

171.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K457的氨基酸的突变。

172.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H500的氨基酸的突变。

173.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K570的氨基酸的突变。

174.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K590的氨基酸的突变。

175.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N634的氨基酸的突变。

176.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R638的氨基酸的突变。

177.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N652的氨基酸的突变。

178.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N653的氨基酸的突变。

179.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K655的氨基酸的突变。

180.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 S658的氨基酸的突变。

181.根据前述前述陈述中任一项中任一项55所述的工程化 CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b (PbCas13b)的氨基酸K741的氨基酸的突变。

182.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K744的氨基酸的突变。

183.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N756的氨基酸的突变。

184.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 S757的氨基酸的突变。

185.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R762的氨基酸的突变。

186.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R791的氨基酸的突变。

187.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K846的氨基酸的突变。

188.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K857的氨基酸的突变。

189.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K870的氨基酸的突变。

190.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R877的氨基酸的突变。

191.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K183的氨基酸的突变。

192.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K193的氨基酸的突变。

193.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R600的氨基酸的突变。

194.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K607的氨基酸的突变。

195.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K612的氨基酸的突变。

196.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R614的氨基酸的突变。

197.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K617的氨基酸的突变。

198.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K826的氨基酸的突变。

199.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K828的氨基酸的突变。

200.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K829的氨基酸的突变。

201.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R824的氨基酸的突变。

202.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R830的氨基酸的突变。

203.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 Q831的氨基酸的突变。

204.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K835的氨基酸的突变。

205.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K836的氨基酸的突变。

206.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R838的氨基酸的突变。

207.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R618的氨基酸的突变。

208.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 D434的氨基酸的突变。

209.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K431的氨基酸的突变。

210.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R53的氨基酸的突变。

211.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K943的氨基酸的突变。

212.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R1041的氨基酸的突变。

213.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸Y164的氨基酸的突变。

214.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R285的氨基酸的突变。

215.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R287的氨基酸的突变。

216.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K292的氨基酸的突变。

217.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 E296的氨基酸的突变。

218.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N297的氨基酸的突变。

219.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 Q646的氨基酸的突变。

220.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N647的氨基酸的突变。

221.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R402的氨基酸的突变。

222.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K393的氨基酸的突变。

223.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N653的氨基酸的突变。

224.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸N652的氨基酸的突变。

225.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R482的氨基酸的突变。

226.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N480的氨基酸的突变。

227.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 D396的氨基酸的突变。

228.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 E397的氨基酸的突变。

229.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 D398的氨基酸的突变。

230.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 E399的氨基酸的突变。

231.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K294的氨基酸的突变。

232.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 E400的氨基酸的突变。

233.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R56的氨基酸的突变。

234.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N157的氨基酸的突变。

235.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H161的氨基酸的突变。

236.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H452的氨基酸的突变。

237.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N455的氨基酸的突变。

238.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K484的氨基酸的突变。

239.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N486的氨基酸的突变。

240.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 G566的氨基酸的突变。

241.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 H567的氨基酸的突变。

242.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 A656的氨基酸的突变。

243.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 V795的氨基酸的突变。

244.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 A796的氨基酸的突变。

245.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 W842的氨基酸的突变。

246.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 K871的氨基酸的突变。

247.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 E873的氨基酸的突变。

248.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R874的氨基酸的突变。

249.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 R1068的氨基酸的突变。

250.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸 N1069的氨基酸的突变。

251.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于颊普雷沃菌(Prevotella buccae)Cas13b(PbCas13b)的氨基酸H1073的氨基酸的突变。

252.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变:R597、N598、H602、R1278、N1279 或H1283。

253.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变:R597、N598、H602、R1278、N1279 或H1283。

254.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a (LshCas13a)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R597、N598、H602、R1278、N1279或H1283。

255.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变:R597、N598或H602。

256.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a (LshCas13a)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R597、N598或H602。

257.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a(LshCas13a)的下述氨基酸的氨基酸的一个或多个突变:R1278、N1279或H1283。

258.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于沙氏纤毛菌(Leptotrichia shahii)Cas13a (LshCas13a)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:R1278、N1279或H1283。

259.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b) 的下述氨基酸的氨基酸的一个或多个突变:R146、H151、R1116或H1121。

260.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b) 的下述氨基酸的氨基酸的一个或多个突变:R146、H151、R1116或H1121。

261.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于喉管卟啉单胞菌(Porphyromonas gulae) Cas13b(PguCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:R146、H151、R1116或H1121。

262.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b) 的下述氨基酸的氨基酸的一个或多个突变:R146或H151。

263.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于喉管卟啉单胞菌(Porphyromonas gulae) Cas13b(PguCas13b)的HEPN结构域1中的下述氨基酸的氨基酸的一个或多个突变:R146或H151。

264.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于喉管卟啉单胞菌(Porphyromonas gulae)Cas13b(PguCas13b) 的下述氨基酸的氨基酸的一个或多个突变:R1116或H1121。

265.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于喉管卟啉单胞菌(Porphyromonas gulae) Cas13b(PguCas13b)的HEPN结构域2中的下述氨基酸的氨基酸的一个或多个突变:R1116或H1121。

266.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的下述氨基酸的氨基酸的一个或多个突变:H133或H1058。

267.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的下述氨基酸的氨基酸的一个或多个突变:H133或H1058。

268.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域中包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的HEPN结构域中的下述氨基酸的氨基酸的一个或多个突变:H133或H1058。

269.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的氨基酸H133的氨基酸突变。

270.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域1中包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的HEPN结构域1中的氨基酸H133的氨基酸突变。

271.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b(PspCas13b)的氨基酸H1058的氨基酸突变。

272.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其在 HEPN结构域2中包含对应于普雷沃菌属种(Prevotella sp.)P5-125 Cas13b (PspCas13b)的HEPN结构域2中的氨基酸H1058的氨基酸突变。

273.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为A、P或V,优选地A。

274.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为疏水性氨基酸。

275.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为芳香族氨基酸。

276.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为带电荷的氨基酸。

277.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为带正电的氨基酸。

278.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为带负电的氨基酸。

279.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为极性氨基酸。

280.根据陈述8至272中任一项所述的工程化CRISPR-Cas蛋白,其中所述氨基酸被突变为脂肪族氨基酸。

281.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述Cas13蛋白是或源于以下的种:别样杆菌属(Alistipes)、厌氧唾液杆菌(Anaerosalibacter)、拟杆菌属(Bacteroides)、拟杆菌门 (Bacteroidetes)、伯杰菌属(Bergeyella)、布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、二氧化碳噬纤维菌属(Capnocytophaga)、肉食杆菌属(Carnobacterium)、绿曲挠丝状菌属(Chloroflexus)、金黄杆菌属(Chryseobacterium)、梭菌属(Clostridium)、Demequina、优杆菌科(Eubacteriaceae)、优杆菌属(Eubacterium)、黄杆菌属 (Flavobacterium)、梭杆菌属(Fusobacterium)、Herbinix、Insolitispirillum、毛螺菌科(Lachnospiraceae)、纤毛菌属(Leptotrichia)、李斯特氏菌属 (Listeria)、香味菌属(Myroides)、杆状杆菌(Paludibacter)、细菌杆菌(Phaeodactylibacter)、紫单胞菌科(Porphyromonadaceae)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、假丁酸弧菌属 (Pseudobutyrivibrio)、冷弯菌属(Psychroflexus)、赖兴氏杆菌 (Reichenbachiella)、红杆菌属(Rhodobacter)、里氏杆菌属(Riemerella)、 Sinomicrobium、海旋菌属(Thalassospira)、瘤胃球菌属(Ruminococcus);优选地,沙氏纤毛菌(Leptotrichia shahii)、斯氏李斯特氏菌(Listeriaseeligeri)、毛螺科菌细菌(Lachnospiraceae bacterium)(如Lb MA2020、 Lb NK4A179、LbNK4A144)、Clostridium aminophilum(如Ca DSM 10710)、鸡肉杆菌(Carnobacteriumgallinarum)(如Cg DSM 4847)、丙酸杆菌(Paludibacter propionicigenes)(如Pp WB4)、魏斯特斯蒂芬氏李斯特氏菌(Listeria weihenstephanensis)(如Lw FSL R9-0317)、李斯特氏菌科细菌(Listeriaceae bacterium)(如Lb FSL M6-0635)、瓦氏细单胞菌(Leptotrichia wadei)(如Lw F0279)、荚膜红杆菌(Rhodobacter capsulatus)(如Rc SB1003、Rc R121、Rc DE442)、口腔纤毛菌(Leptotrichia buccalis)(如Lb C-1013-b)、Herbinix hemicellulosilytica、优杆菌科细菌(Eubacteriaceae bacterium)(如EbCHKCI004)、布劳特氏菌属种(Blautia sp.)Marseille-P2398、纤毛菌属种(Leptotrichiasp.) 口腔分类单元879str.F0557、聚集绿屈扰菌(Chloroflexus aggregans)、 Demequinaaurantiaca、海旋菌种(Thalassospira sp.)TSL5-1、假丁酸弧菌属种(Pseudobutyrivibrio sp.)OR37、丁酸弧菌属种(Butyrivibrio sp.) YAB3001、纤毛菌属种(Leptotrichia sp.)Marseille-P3007、Bacteroides ihuae、紫单孢菌科细菌(Porphyromonadaceae bacterium)(如Pb KH3CP3RA)、Listeria riparia、Insolitispirillum peregrinum、别样杆菌属种(Alistipes sp.)ZOR0009、酿脓拟杆菌(Bacteroides pyogenes)(如 Bp F0041)、拟杆菌属细菌(Bacteroidetes bacterium)(如Bb GWA2_31_9)、动物溃疡伯格菌(Bergeyella zoohelcum)(如Bz ATCC 43767)、犬咬二氧化碳噬纤维菌(Capnocytophaga canimorsus)、希诺地米碳酸噬胞菌(Capnocytophagacynodegmi)、Chryseobacterium carnipullorum、济州岛金黄杆菌(Chryseobacteriumjejuense)、嗜鳃黄杆菌(Chryseobacterium ureilyticum)、嗜分支黄杆菌(Flavobacterium branchiophilum)、柱状黄杆菌(Flavobacterium columnare)、黄杆菌属种(Flavobacterium sp.)316、Myroides odoratimimus(如Mo CCUG 10230、 Mo CCUG12901、Mo CCUG 3837)、Paludibacter propionicigenes、 Phaeodactylibacterxiamenensis、牙龈卟啉单胞菌(Porphyromonas gingivalis)(如Pg F0185、Pg F0568、PgJCVI SC001、Pg W4087)、马铃薯红单胞菌(Porphyromonas gulae)、卟啉单胞菌属种(Porphyromonas sp.)COT-052OH4946、树蛙普雷沃菌(Prevotella aurantiaca)、颊普雷沃菌(Prevotella buccae)(如Pb ATCC 33574)、Prevotella falsenii、中间普雷沃菌(Prevotella intermedia)(如Pi 17、Pi ZT)、Prevotella pallens (如Pp ATCC 700821)、Prevotella pleuritidis、解糖普雷沃菌(Prevotella saccharolytica)(如Ps F0055)、普雷沃菌属种(Prevotella sp.)MA2016、普雷沃菌属种(Prevotella sp.)MSX73、普雷沃菌属种(Prevotella sp.) P4-76、普雷沃菌属种(Prevotella sp.)P5-119、普雷沃菌属种(Prevotella sp.)P5-125、普雷沃菌属种(Prevotella sp.)P5-60、扭曲冷弯曲菌(Psychroflexus torquis)、Reichenbachiella agariperforans、鸭疫里默氏杆菌(Riemerella anatipestifer)、Sinomicrobium oceani、坏死梭杆菌 (Fusobacteriumnecrophorum)(如Fn subsp.funduliforme ATCC 51357、 Fn DJ-2、Fn BFTR-1、Fnsubsp.Funduliforme)、坏疽梭杆菌(Fusobacterium perfoetens)(如Fp ATCC 29250)、溃疡梭杆菌(Fusobacterium ulcerans) (如Fu ATCC 49185)、厌氧唾液杆菌属种(Anaerosalibacter sp.)ND1、产亚硝酸真杆菌(Eubacterium siraeum)、黄化瘤胃球菌(Ruminococcus flavefaciens)(如Rfx XPD3002)或白色瘤胃球菌(Ruminococcus albus)。

282.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述Cas13蛋白是Cas13a蛋白。

283.根据陈述282所述的工程化CRISPR-Cas蛋白,其中所述Cas13a 蛋白是或源于以下的种:拟杆菌属(Bacteroides)、布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、肉食杆菌属(Carnobacterium)、绿曲挠丝状菌属(Chloroflexus)、梭菌属(Clostridium)、Demequina、优杆菌属 (Eubacterium)、Herbinix、Insolitispirillum、毛螺菌科(Lachnospiraceae)、纤毛菌属(Leptotrichia)、李斯特氏菌属(Listeria)、杆状杆菌 (Paludibacter)、紫单胞菌科(Porphyromonadaceae)、假丁酸弧菌属(Pseudobutyrivibrio)、红杆菌属(Rhodobacter)或海旋菌属 (Thalassospira);优选地,沙氏纤毛菌(Leptotrichia shahii)、斯氏李斯特氏菌(Listeria seeligeri)、毛螺科菌细菌(Lachnospiraceae bacterium) (如Lb MA2020、Lb NK4A179、Lb NK4A144)、Clostridiumaminophilum (如Ca DSM 10710)、鸡肉杆菌(Carnobacterium gallinarum)(如Cg DSM4847)、丙酸杆菌(Paludibacter propionicigenes)(如Pp WB4)、魏斯特斯蒂芬氏李斯特氏菌(Listeria weihenstephanensis)(如Lw FSL R9-0317)、李斯特氏菌科细菌(Listeriaceae bacterium)(如Lb FSL M6-0635)、瓦氏细单胞菌(Leptotrichia wadei)(如Lw F0279)、荚膜红杆菌(Rhodobacter capsulatus)(如Rc SB 1003、Rc R121、RcDE442)、口腔纤毛菌(Leptotrichia buccalis)(如Lb C-1013-b)、Herbinixhemicellulosilytica、优杆菌科细菌(Eubacteriaceae bacterium)(如Eb CHKCI004)、布劳特氏菌属种(Blautia sp.)Marseille-P2398、纤毛菌属种(Leptotrichia sp.)口腔分类单元879str.F0557、聚集绿屈扰菌 (Chloroflexus aggregans)、Demequina aurantiaca、海旋菌种(Thalassospira sp.)TSL5-1、假丁酸弧菌属种(Pseudobutyrivibrio sp.)OR37、丁酸弧菌属种(Butyrivibrio sp.)YAB3001、纤毛菌属种(Leptotrichia sp.) Marseille-P3007、Bacteroides ihuae、紫单孢菌科细菌(Porphyromonadaceae bacterium)(如PbKH3CP3RA)、Listeria riparia或Insolitispirillum peregrinum。

284.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述Cas13蛋白是Cas13b蛋白。

285.根据陈述284所述的工程化CRISPR-Cas蛋白,其中所述Cas13b 蛋白是或源于以下的种:别样杆菌属(Alistipes)、拟杆菌属(Bacteroides)、拟杆菌门(Bacteroidetes)、伯杰菌属(Bergeyella)、二氧化碳噬纤维菌属(Capnocytophaga)、金黄杆菌属(Chryseobacterium)、黄杆菌属 (Flavobacterium)、香味菌属(Myroides)、杆状杆菌(Paludibacter)、细菌杆菌(Phaeodactylibacter)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、冷弯菌属(Psychroflexus)、赖兴氏杆菌(Reichenbachiella)、里氏杆菌属(Riemerella)或Sinomicrobium;优选地,别样杆菌属种(Alistipes sp.)ZOR0009、酿脓拟杆菌(Bacteroides pyogenes)(如Bp F0041)、拟杆菌属细菌(Bacteroidetesbacterium)(如 Bb GWA2_31_9)、动物溃疡伯格菌(Bergeyella zoohelcum)(如Bz ATCC43767)、犬咬二氧化碳噬纤维菌(Capnocytophaga canimorsus)、希诺地米碳酸噬胞菌(Capnocytophaga cynodegmi)、Chryseobacterium carnipullorum、济州岛金黄杆菌(Chryseobacterium jejuense)、嗜鳃黄杆菌(Chryseobacterium ureilyticum)、嗜分支黄杆菌(Flavobacterium branchiophilum)、柱状黄杆菌(Flavobacterium columnare)、黄杆菌属种(Flavobacterium sp.)316、Myroides odoratimimus(如Mo CCUG 10230、 Mo CCUG12901、Mo CCUG 3837)、丙酸杆菌(Paludibacter propionicigenes)、Phaeodactylibacterxiamenensis、牙龈卟啉单胞菌 (Porphyromonas gingivalis)(如Pg F0185、Pg F0568、PgJCVI SC001、 Pg W4087)、马铃薯红单胞菌(Porphyromonas gulae)、卟啉单胞菌属种(Porphyromonas sp.)COT-052OH4946、树蛙普雷沃菌(Prevotella aurantiaca)、颊普雷沃菌(Prevotella buccae)(如Pb ATCC 33574)、 Prevotella falsenii、中间普雷沃菌(Prevotella intermedia)(如Pi 17,Pi ZT)、Prevotella pallens(如Pp ATCC 700821)、Prevotella pleuritidis、解糖普雷沃菌(Prevotella saccharolytica)(如Ps F0055)、普雷沃菌属种(Prevotella sp.)MA2016、普雷沃菌属种(Prevotella sp.)MSX73、普雷沃菌属种(Prevotella sp.)P4-76、普雷沃菌属种(Prevotella sp.)P5-119、普雷沃菌属种(Prevotella sp.)P5-125、普雷沃菌属种(Prevotella sp.) P5-60、扭曲冷弯曲菌(Psychroflexus torquis)、Reichenbachiella agariperforans、鸭疫里默氏杆菌(Riemerella anatipestifer)或 Sinomicrobium oceani。

286.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述Cas13蛋白是Cas13c蛋白。

287.根据陈述286所述的工程化CRISPR-Cas蛋白,其中所述Cas13c 蛋白是或源于以下的种:梭杆菌属(Fusobacterium)或厌氧唾液杆菌 (Anaerosalibacter);优选地,坏死梭杆菌(Fusobacterium necrophorum) (如Fn subsp.funduliforme ATCC 51357、Fn DJ-2、Fn BFTR-1、Fn subsp. Funduliforme)、坏疽梭杆菌(Fusobacterium perfoetens)(如FpATCC 29250)、溃疡梭杆菌(Fusobacterium ulcerans)(如Fu ATCC 49185) 或厌氧唾液杆菌属种(Anaerosalibacter sp.)ND1。

288.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中所述Cas13蛋白是Cas13d蛋白。

289.根据陈述288所述的工程化CRISPR-Cas蛋白,其中所述Cas13d 蛋白是或源于以下的种:优杆菌属(Eubacterium)或瘤胃球菌属(Ruminococcus),优选地,产亚硝酸真杆菌(Eubacterium siraeum)、黄化瘤胃球菌(Ruminococcus flavefaciens)(如RfxXPD3002)或白色瘤胃球菌(Ruminococcus albus)。

290.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的催化活性增加。

291.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的催化活性降低。

292.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的 gRNA结合增加。

293.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的 gRNA结合降低。

294.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的特异性增加。

295.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的特异性降低。

296.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的稳定性增加。

297.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白的稳定性降低。

298.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其还包含使催化活性失活的一个或多个突变。

299.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的脱靶结合增加。

300.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的脱靶结合降低。

301.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的靶标结合增加。

302.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的靶标结合降低。

303.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,所述工程化CRISPR-Cas蛋白具有更高蛋白酶活性或多核苷酸结合能力。

304.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其中与对应的野生型CRISPR-Cas蛋白相比,PFS识别被改变。

305.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其还包含功能性异源结构域。

306.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其还包含NLS。

307.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白,其还包含NES。

308.一种工程化CRISPR-Cas蛋白,其包含一个或多个HEPN结构域,且长度小于1000个氨基酸。

309.根据陈述308所述的工程化CRISPR-Cas蛋白,其中所述蛋白的尺寸小于950个、小于900个、小于850个、小于800个、或小于750 个氨基酸。

310.根据陈述308或309所述的工程化CRISPR-Cas蛋白,其中所述HEPN结构域包含RxxxxH基序。

311.根据陈述310所述的工程化CRISPR-Cas蛋白,其中所述 RxxxxH基序包含R[N/H/K]X

312.根据陈述311所述的工程化CRISPR-Cas蛋白,其中:

X

X

X

313.根据陈述308-313中任一项所述的工程化CRISPR-Cas蛋白,其中所述CRISPR-Cas蛋白是VI型CRISPR Cas蛋白。

314.根据陈述313所述的工程化CRISPR-Cas蛋白,其中所述VI型 CRISPR Cas蛋白是Cas13a、Cas13b、Cas13c或Cas13d。

315.根据陈述308-315中任一项所述的工程化CRISPR-Cas蛋白,其中所述CRISPR-Cas蛋白与功能性结构域相关联。

316.根据陈述308-316中任一项所述的工程化CRISPR-Cas蛋白,其中所述CRISPR-Cas蛋白包含与陈述[1386]57-[1386]329中任一项所述的突变等价的一个或多个突变。

317.根据陈述316所述的工程化CRISPR-Cas蛋白,其中所述 CRISPR-Cas蛋白包含在螺旋结构域中的一个或多个突变。

318.根据陈述308-318中任一项所述的工程化CRISPR-Cas蛋白,其中所述CRISPR-Cas蛋白是死形式或具有切口酶活性。

319.一种多核苷酸,其编码陈述1至318中任一项所述的工程化 CRISPR-Cas蛋白。

320.根据陈述319所述的多核苷酸,其是密码子优化的。

321.一种CRISPR-Cas系统,其包含陈述1至[1386]367中任一项所述的工程化CRISPR-Cas蛋白或者陈述318或319所述的多核苷酸,以及能够与所述工程化CRISPR-Cas蛋白形成复合物并能够与靶核酸序列杂交并且引导所述复合物与所述靶核酸序列的序列特异性结合的核苷酸组分。

322.一种载体系统,其包含一个或多个载体,所述一个或多个载体包含编码陈述321所述的工程化CRISPR-Cas蛋白的组分的一个或多个多核苷酸分子。

323.一种修饰靶核酸的方法,其包括:在包含所述靶核酸的细胞或生物体中引入根据陈述1至318中任一项所述的工程化CRISPR-Cas蛋白,根据陈述319或320所述的多核酸,根据陈述321所述的CRISPR-Cas 系统,或者根据陈述322所述的载体或载体系统,使得所述工程化 CRISPR-Cas蛋白修饰在所述细胞或生物体中的所述靶核酸。

324.根据陈述[1386]372所述的方法,其中所述工程化CRISPR-Cas 系统是通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪、可植入装置或陈述322所述的载体系统递送引入。

325.根据陈述323或324所述的方法,其中所述工程化CRISPR-cas 蛋白与一个或多个功能性结构域相关联。

326.根据陈述323-325中任一项所述的方法,其中所述靶核酸包含基因组基因座,并且所述工程化CRISPR-Cas蛋白改变在所述基因组基因座处编码的基因产物或所述基因产物的表达。

327.根据陈述323-326中任一项所述的方法,其中所述靶核酸是 DNA或RNA,且其中所述靶核酸中的一个或多个核苷酸被碱基编辑。

328.根据陈述323-327中任一项所述的方法,其中所述靶核酸是 DNA或RNA,且其中所述靶核酸被切割。

329.根据陈述328所述的方法,其中所述工程化CRISPR-Cas蛋白还切割非靶核酸。

330.根据陈述328或329所述的方法,其还包括使活性可视化,以及任选地,使用可检测标记。

331.根据陈述328-330中任一项所述的方法,其还包括检测所述 CRISPR-Cas系统的一个或多个组分与所述靶核酸的结合。

332.根据陈述328-331中任一项所述的方法,其中所述细胞或生物体是原核细胞或生物体。

333.根据陈述328-332中任一项所述的方法,其中所述细胞或生物体是动物细胞或生物体。

334.根据陈述328-333中任一项所述的方法,其中所述细胞或生物体是植物细胞或生物体。

335.一种用于检测样品中的靶核酸的方法,其包括:

将样品与下述接触:

陈述1-318中任一项所述的工程化CRISPR-Cas蛋白;

至少一种指导多核苷酸,其包含能够结合至所述靶核酸并被设计为与所述工程化CRISPR-Cas形成复合物的指导序列;和

包含非靶序列的基于RNA的掩蔽构建体;

其中所述工程化CRISPR-Cas蛋白表现出附带RNase活性并切割所述检测构建体的所述非靶序列;和

检测来自所述非靶序列的切割的信号,从而检测在所述样品中的所述靶核酸。

336.根据陈述335所述的方法,其还包括将所述样品与用于扩增所述靶核酸的试剂接触。

337.根据陈述336所述的方法,其中用于扩增的所述试剂包括等温扩增反应试剂。

338.根据陈述337所述的方法,其中所述等温扩增试剂包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导的等温扩增、链置换扩增、解旋酶依赖性扩增或切口酶扩增试剂。

339.根据陈述335-338中任一项所述的方法,其中所述靶核酸是 DNA分子,并且所述方法还包括将所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。

340.根据陈述335-339中任一项所述的方法,其中所述掩蔽构建体:

抑制可检测阳性信号的产生直至所述掩蔽构建体被切割或失活,或者

掩蔽可检测阳性信号或产生可检测阴性信号直至所述掩蔽构建体被切割或失活。

341.根据陈述335-340中任一项所述的方法,其中所述掩蔽构建体包含:

a.沉默RNA,其抑制由报告构建体编码的基因产物的产生,其中当表达时所述基因产物产生所述可检测阳性信号;

b.核酶,其产生所述可检测阴性信号,并且其中当所述核酶失活时产生所述阳性可检测信号;

c.核酶,其将底物转化为第一颜色,并且其中当所述核酶失活时所述底物转化为第二颜色;

d.适体和/或包含多核苷酸栓系的抑制剂;

e.多核苷酸,其附着有可检测配体和掩蔽组分;

f.通过桥分子保持在聚集体中的纳米颗粒,其中至少一部分的所述桥分子包含多核苷酸,并且其中当所述纳米颗粒被释放在溶液中时所述溶液经历色移;

g.通过连接分子连接至一个或多个淬灭剂分子的量子点或荧光团,其中至少一部分的所述连接分子包含多核苷酸;

h.与嵌入剂复合的多核苷酸,其中在切割所述多核苷酸后所述嵌入剂改变吸光度;或者

1.通过多核苷酸栓系的两个荧光团,其当从所述多核苷酸释放时经历荧光移位。

342.根据陈述341所述的方法,其中所述适体

a.包含螯合酶的多核苷酸栓系的抑制剂,其中在通过作用于底物而从所述适体或多核苷酸栓系的抑制剂释放后所述酶产生可检测信号;或者

b.是抑制性适体,其抑制酶并阻止酶催化底物产生可检测信号,或其中所述多核苷酸栓系的抑制剂抑制酶并阻止酶催化底物产生可检测信号;或者

c.螯合一对试剂,所述试剂当从所述适体释放时组合以产生可检测信号。

343.根据陈述341或342所述的方法,其中所述纳米颗粒是胶体金属。

344.根据陈述335-343中任一项所述的方法,其中所述至少一个指导多核苷酸包含错配。

345.根据陈述344所述的方法,其中所述错配是在所述一个或多个指导序列上的单核苷酸改变的上游或下游。

346.一种细胞或生物体,其包含根据陈述1-318中任一项所述的工程化CRISPR-Cas蛋白,根据陈述319或320所述的多核酸,根据陈述 321所述的CRISPR-Cas系统或者根据陈述322所述的载体或载体系统。 347.一种工程化腺苷脱氨酶,其包含一个或多个突变,其中所述工程化腺苷脱氨酶具有胞苷脱氨酶活性。

348.根据陈述347所述的工程化腺苷脱氨酶,其中所述工程化腺苷脱氨酶具有腺苷脱氨酶活性。

349.根据陈述347或348所述的工程化腺苷脱氨酶,其中所述工程化腺苷脱氨酶是融合蛋白的一部分。

350.根据陈述349所述的工程化腺苷脱氨酶,其中所述融合蛋白包含功能性结构域。

351.根据陈述350所述的工程化腺苷脱氨酶,其中所述功能性结构域能够引导所述工程化腺苷脱氨酶结合至靶核酸。

352.根据陈述350或351所述的工程化腺苷脱氨酶,其中所述功能性结构域是陈述1至318中任一项所述的CRISPR-Cas蛋白。

353.根据陈述352所述的工程化腺苷脱氨酶,其中所述CRISPR-Cas 蛋白是死形式的CRISPR-Cas蛋白或CRISPR-Cas切口酶蛋白。

354.根据陈述347-353中任一项所述的工程化腺苷脱氨酶,其中基于hADAR2-D的氨基酸序列位置,所述一个或多个突变包含:E488Q、 V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、 M383L、D619G、S582T、V440I、S495N、K418E、S661T,以及在同源ADAR蛋白中的相应突变。

355.根据陈述347-354中任一项所述的工程化腺苷脱氨酶,其中基于hADAR2-D的氨基酸序列位置,所述一个或多个突变包含:E488Q、 V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、 M383L、D619G、S582T、V440I、S495N、K418E和S661T,以及在同源 ADAR蛋白中的相应突变。

356.一种多核苷酸,其编码陈述347-355中任一项所述的工程化腺苷脱氨酶或其催化结构域。

357.一种载体,其包含陈述356所述的多核苷酸。

358.一种药物组合物,其包含配制成用于通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪或可植入装置递送的陈述347-355 中任一项所述的工程化腺苷脱氨酶或其催化结构域。

359.一种工程化细胞,其表达陈述347-355中任一项所述的工程化腺苷脱氨酶或其催化结构域。

360.根据陈述359所述的工程化细胞,其中所述细胞瞬时表达所述工程化腺苷脱氨酶或其催化结构域。

361.根据陈述359或360所述的工程化细胞,其中所述细胞非瞬时表达所述工程化腺苷脱氨酶或其催化结构域。

362.一种用于在靶核酸中修饰核苷酸的工程化、非天然存在的系统,其包含:

a)死CRISPR-Cas或CRISPR-Cas切口酶蛋白,或者编码所述死Cas 或Cas切口酶蛋白的核苷酸序列;

b)指导分子,其包含与靶序列杂交并设计为与所述死CRISPR-Cas 或CRISPR-Cas切口酶蛋白形成复合物的指导序列;和

c)核苷酸脱氨酶蛋白或其催化结构域,或者编码所述核苷酸脱氨酶蛋白或其催化结构域的核苷酸序列,其中所述核苷酸脱氨酶蛋白或其催化结构域共价或非共价连接至所述死CRISPR-Cas或CRISPR-Cas切口酶蛋白,或者所述指导分子适于在递送后与其连接。

363.根据陈述362所述的系统,其中所述腺苷脱氨酶蛋白或其催化结构域基于hADAR2-D的氨基酸序列位置包含突变E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、 D619G、S582T、V440I、S495N、K418E、S661T中的一个或多个,以及在同源ADAR蛋白中的相应突变。

364.根据陈述362或363所述的系统,其中所述腺苷脱氨酶蛋白或其催化结构域基于hADAR2-D的氨基酸序列位置包含突变:E488Q、 V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、 M383L、D619G、S582T、V440I、S495N、K418E和S661T,以及在同源 ADAR蛋白中的相应突变。

365.根据陈述362-364中任一项所述的系统,其中所述CRISPR-Cas 蛋白是Cas9、Cas12、Cas13、Cas 14、CasX或CasY。

366.根据陈述362-365中任一项所述的系统,其中所述CRISPR-Cas 蛋白是Cas13b。

367.根据陈述362-366中任一项所述的系统,其中所述CRISPR-Cas 蛋白是Cas13b-t1、Cas13b-t2或Cas13b-t3。

368.根据陈述362-367中任一项所述的系统,其中所述CRISPR-Cas 是根据陈述1-318中任一项所述的工程化CRISPR-Cas蛋白。

369.一种用于在靶核酸中修饰核苷酸的方法,其包括:

将陈述347-355中任一项所述的工程化腺苷脱氨酶或陈述362-368 中任一项所述的系统递送至所述靶核酸,其中所述脱氨酶使在所述靶核酸上的一个或多个靶基因座处的核苷酸脱氨基。

370.根据陈述369所述的方法,其中所述核苷酸脱氨酶蛋白或其催化结构域已被修饰以增加对DNA-RNA异源双链体的活性。

371.根据陈述369或370所述的方法,其中所述核苷酸脱氨酶蛋白或其催化结构域已被修饰以降低脱靶效应。

372.根据陈述369-371中任一项所述的方法,其中所述靶核酸在细胞内。

373.根据陈述372所述的方法,其中所述细胞是真核细胞。

374.根据陈述372或373所述的方法,其中所述细胞是非人动物细胞。

375.根据陈述372至374中任一项所述的方法,其中所述细胞是人细胞。

376.根据陈述372至375中任一项所述的方法,其中所述细胞是植物细胞。

377.根据陈述369至376中任一项所述的方法,其中所述靶核酸在动物内。

378.根据陈述369至377中任一项所述的方法,其中所述靶核酸在植物内。

379.根据陈述369至378中任一项所述的方法,其中所述靶核酸在体外包含在DNA分子中。

380.根据陈述369至377中任一项所述的方法,其中所述工程化腺苷脱氨酶或者所述系统的一种或多种组分作为核糖核蛋白复合物递送到所述细胞中。

381.根据陈述380所述的方法,其中所述工程化腺苷脱氨酶或者所述系统的一种或多种组分通过一种或多种颗粒、一种或多种囊泡或者一种或多种病毒载体递送。

382.根据陈述381所述的方法,其中所述一种或多种颗粒包含脂质、糖、金属或蛋白。

383.根据陈述381或382所述的方法,其中所述一种或多种颗粒包括脂质纳米颗粒。

384.根据陈述381-383中任一项所述的方法,其中所述一种或多种囊泡包括外泌体或脂质体。

385.根据陈述381-384中任一项所述的方法,其中所述一种或多种病毒载体包括一种或多种腺病毒载体,一种或多种慢病毒载体或者一种或多种腺相关病毒载体。

386.根据陈述369-385中任一项所述的方法,其中所述方法通过在感兴趣的基因组基因座处操纵一个或多个靶序列来修饰细胞、细胞系或生物体。

387.根据陈述386所述的方法,其中在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用治疗由G→A或C→T点突变或病原性SNP 引起的疾病。

388.根据陈述387所述的方法,其中所述疾病选自癌症、血友病、β地中海贫血,马凡氏综合征和维斯科特-奥尔德里奇综合征。

389.根据陈述386、387或388所述的方法,其中在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用治疗由T→C或A→G点突变或病原性SNP引起的疾病。

390.根据陈述389所述的方法,其中在所述感兴趣的靶基因座处的所述核苷酸的所述脱氨基作用使在所述靶基因座处的靶基因失活。

391.根据陈述380-390中任一项所述的方法,其中通过脂质体、纳米颗粒、外泌体、微囊泡、核酸纳米组件、基因枪、可植入装置或陈述302所述的载体系统递送所述工程化腺苷脱氨酶或者所述系统的一种或多种组分。

392.根据陈述369-392中任一项所述的方法,其中所述核苷酸的修饰改变在所述靶基因座处编码的基因产物或所述基因产物的表达。

393.根据陈述347-355中任一项所述的工程化腺苷脱氨酶或陈述 362-368中任一项所述的系统,其中所述腺苷蛋白或其催化结构域基于 hADAR2-D的氨基酸序列位置包含在S375上的突变,以及在同源ADAR 蛋白中的相应突变。

394.根据陈述393所述的工程化腺苷脱氨酶或系统,其中所述在 S375上的突变是S375N。

395.根据前述陈述中任一项所述的工程化CRISPR-Cas蛋白或工程化腺苷脱氨酶在制备用于治疗疾病的药物中的用途。

396.一种药学制剂,其包含前述陈述中任一项所述的工程化 CRISPR-Cas蛋白或工程化腺苷脱氨酶用作药物。

本发明在以下实施例中进一步描述,这些实施例不限制权利要求中描述的本发明的范围。

实施例1-与crRNA复合的Cas13b的晶体结构

方法

蛋白纯化用于结晶

在购自New England Biolabs的化学感受态BL21 DE3细胞中,用基于pET28的、具有在N端融合的twin-strep-sumo标签的载体中表达 PbuCas13b。将具有该表达质粒的细胞在37℃生长至OD 0.2,然后将温度调至21℃。持续生长至OD 0.6,然后用5μM IPTG诱导。培养物生长 18-20小时,然后以5000rpm离心收获细胞并于-80℃冷冻。将冷冻细胞糊在补充有核酸酶(benzonase)和溶菌酶(lysozyme)的缓冲液A(500 mM氯化钠,50mM Hepes pH7.5,2mM DTT)中匀浆。细胞在20000psi 下的微流化器中经过两次破碎,并通过10000rpm离心将细胞碎片从可溶性级分中分离出来。使可溶性级分通过Streptactin树脂(GE lifesciences),并用10倍柱体积的缓冲液A、然后是10倍柱体积的洗涤缓冲液(1M氯化钠,50mMHepes 7.5,2mM DTT),最后是10倍柱体积的裂解缓冲液(400mM氯化钠,20mM Hepes 7.5,2mM DTT)洗涤。通过添加5mM脱硫生物素(desthiobiotin)(Sigma)从树脂洗脱 PbuCas13b,然后在补充20mM DTT后,用sumo蛋白酶切割过夜。在切割后,该蛋白通过肝素柱,浓缩至500μL,并通过在存储缓冲液(500mM 氯化钠,10mM Hepes pH 7.0,2mM DTT)中平衡的superdex200柱(GE life sciences)。合并峰级分并浓缩至至少20mg/ml。除了在每种缓冲液中补充5mM DTT外,类似地纯化硒代甲硫氨酸蛋白。用Pierce试剂 (Thermo)定量蛋白。

结晶和数据收集

将RNA底物以2:1摩尔比添加到PbuCas13b蛋白中,并在透析缓冲液(50mM氯化钠,10mM Hepes 7.0,2mM TCEP)中透析7小时。用透析缓冲液将复合PbuCas13b+RNA稀释至10mg/ml,并在不同的滴比 (drop ratio)下,在165mM柠檬酸钠pH 4.6,5.5%PEG6000和2mMTCEP下,通过悬挂滴液蒸汽扩散在20度设置。棒状晶体生长过夜并在1-2个月内达到最大尺寸。将晶体从滴液转移至冷冻稳定缓冲液(140mM 柠檬酸钠pH 4.6,5%PEG6000,35%PEG400)中,浸泡长达24小时,然后在液氮中快速冷冻。在补充5mM TCEP的相似条件下生长用于定相 (phasing)的硒晶体。

来自PbuCas13b和指导RNA的晶体的原生衍射数据是在高级光子源,Argonne国家实验室在光束23-ID-B/D上收集的,而异常数据是在金刚石光源在光束I04上收集的。使用准直(23-ID)或聚焦(金刚石)到 20微米的小光束,沿着晶体的长度收集多个数据集。在0.97934(峰值), 0.97958(拐点)和0.97204(远端)埃波长处收集到异常数据集。使用 XDS(1,2)处理衍射数据,并在autoPROC工具箱(4)中实施无目标缩放(sclaed in aimless)(3)。统计总结在下表10中。

表10

*最高分辨率的外壳显示在括号中。

**Rfree是使用5%的数据计算得出的。

#使用MolProbity程序(1)计算Ramachandran图中的二面角分布。

参考文献:1.V.B.Chen等,MolProbity:all-atom structure validation formacromolecular crystallography.Acta Crystallographica Section D-BiologicalCrystallography 66,12-21(2010).

结构解析

PbuCas13b的晶体结构通过使用硒作为反常散射的多波长反常衍射 (MAD)进行解析。用phenix.autosol(5,6)测定并细化27个SeMet 位点的位置。通过使用具有优值(merit)0.35的图的

结构分析

使用DSSR(15)分析RNA结构。使用Consurf服务器(16)完成到结构的蛋白质保守映射。使用PDBSUM Web服务器分析蛋白二级结构 (17)。APBS作为PyMol可视化程序的一部分用于计算静电(18)。

蛋白质比对

如在Geneious(19)中实施的,使用ClustalW或Muscle对Cas13b 酶进行比对。使用Jukes-Cantor距离模型生成邻接树。在成功地将HEPN 结构域活性位点残基与其他家族成员进行匹配的树亚组上进行结构分析的保守比对(图14-16)。

凝胶过滤实验

指导序列复合物的形成:在室温下,在100μL缓冲液(125mM NaCl, 10mM HEPES pH7.0,2mM TCEP)中,将100μg PbuCas13b与两摩尔当量的指导RNA一起孵育20分钟。指导序列-靶标复合物的形成:如上所述,将100μg PbuCas13b与两摩尔当量的指导RNA共孵育20分钟。然后将两摩尔当量的靶RNA加入到溶液中,并将混合物在室温下再孵育 20分钟(共100μL,125mM NaCl,10mM HEPES pH 7.0,2mM TCEP)。类似地,Apo蛋白在125mM NaCl,10mMHEPES pH 7.0,2mM TCEP 的缓冲液中同样稀释至1μg/μL。将样品从2mL毛细环注射到GESuperdex 200Increase 10/300GL柱上,并用500mM NaCl,10mM HEPES pH 7.0,2mM DTT缓冲液运行。

ThermoFluor熔化测定

方案改编自(20)。在终浓度为50mM NaCl,10mM HEPES pH 7.0, 6.25x SYPROTM橙色染料的溶液中,(如上制备的apo、指导序列、或指导序列-靶标复合物)将样品制备成具有1μg PbuCas13b的20μL最终体积。对于MgCl2切割和结合实验,将终浓度6mM的Mg2+加入到上述缓冲混合物中。对于用非互补RNA进行的对照实验,将2摩尔当量的 RNA与蛋白复合物一起孵育。在Roche LightCycler 480II上一式三份进行熔化实验。

受限的蛋白水解

将10μg PbuCas13b与crRNA或crRNA及靶标一起在室温下孵育30 分钟。加入400μg蛋白酶(胰蛋白酶、糜蛋白酶(Chemotrypsin)或胃蛋白酶),并将混合物在37℃下孵育5分钟,然后快速放置在冰上2分钟,再添加SDS上样缓冲液并在4-12%丙烯酰胺凝胶上运行。

PbuCas13b前crRNA加工突变体的蛋白表达和纯化

使用来自TwinStrep-SUMO-PbuCas13b表达质粒的PIPE定点诱变克隆产生在每个推定的crRNA加工催化残基处的丙氨酸突变体,并将其转化到BL21(DE3)pLysE大肠杆菌细胞中。对于每个突变体,在补充了100 μg/mL氨苄青霉素的2L Terrific Broth培养基(12g/L胰蛋白胨,24g/L 酵母提取物,9.4g/L K2HPO,2.2g/L KH2PO4)中接种15mL过夜起始培养物并生长至OD600为0.4-0.6。加入0.5mM IPTG诱导蛋白表达,并在21℃以250RPM振荡速度进行16小时。5000RPM离心10分钟收集细胞,并将糊状物直接用于蛋白纯化(总细胞糊10-20g)。对于裂解,通过在4℃搅拌下将细菌糊状物重悬于50mL裂解缓冲液(50mM Tris-HClpH 7.5,500mM NaCl,1mM DTT)中,其中补充了50mg溶菌酶,1片蛋白酶抑制剂(cOmplete,无EDTA,Roche Diagnostics Corporation)和500U核酸酶(Sigma)。将悬浮液在25000psi下通过 LM20微流化器,并通过在10000RPM,4℃下离心1小时来使裂解物澄清。将裂解物与2mLStrepTactin超流动树脂(Oiagen)在旋转振荡器上 4℃孵育2小时。将与蛋白结合的树脂用10mL裂解缓冲液洗涤三次,然后在20mL IGEPAL裂解缓冲液(0.2%IGEPAL)中加入50μLSUMO蛋白酶(内部)。SUMO标签的切割和天然蛋白的释放在Econo柱色谱柱中于4℃在台式摇床上轻轻混合下过夜进行。收集经切割的蛋白作为流通液,用5mL裂解缓冲液洗涤三次并在SDS-PAGE凝胶上检查。

用不含盐的离子交换缓冲液A(50mM Tris-HCl pH 7.5,1mM DTT) 将蛋白质稀释两倍,以使NaCl起始浓度为250mM。然后将蛋白质上样到5mL肝素HP色谱柱(GE HealthcareLife Sciences),并在250mM至 1M的NaCl梯度上洗脱。通过SDS-PAGE凝胶和考马斯亮蓝染色分析洗脱的蛋白级分(约700mM),合并并使用50MWCO离心滤器(Amicon) 浓缩至1mL。将浓缩的蛋白上样到预先平衡的尺寸排阻柱上,并使用含有50mM Tris-HCl pH 7.5,500mMNaCl,2mM DTT的S200缓冲液洗脱。通过SDS-PAGE凝胶和考马斯亮蓝染色分析单分散蛋白级分,然后浓缩并进行缓冲液交换至蛋白存储缓冲液(600mM NaCl,50mM Tris-HCl pH 7.5,1mM DTT)中。

前crRNA加工测定

订购了用于前crRNA加工和核酸酶测定的RNA作为Ultramers (IDT),并使用HiScribe T7快速高产RNA合成试剂盒(New England Biolabs)进行体外转录。用AmpureXPRNA清洁珠纯化RNA,并保存在 -20℃以备将来使用。为了测试前crRNA加工,将WT和突变蛋白与前 crRNA孵育,蛋白质相对RNA为四倍摩尔过量。前crRNA加工是在Cas13b crRNA加工缓冲液(10mM TrisHCl pH 7.5,50mM NaCl,0.5mM MgCl2,20U SUPERase(ThermoFisherScientific),0.1%BSA)中于37℃进行30分钟,通过加入2x TBE-Urea凝胶上样缓冲液停止,95℃下变性 5分钟。立即将样品置于冰上10分钟,然后将其在1x TBE缓冲液中的 15%TBE-Urea凝胶上以200V运行40分钟。在1x TBE中的1x Sybr Gold 上进行凝胶染色15分钟,在BioRad gel doc系统上成像。

前crRNA突变体的荧光附带RNA切割测定

在核酸酶测定缓冲液(20mM HEPES,60mM NaCl,6mM MgCl2,pH 6.8)和0.5μL鼠RNase抑制剂(New England Biolabs)和125nM poly-U 均聚物RNA传感器(Trilink)中,以等摩尔比的PbuCas13b或PbuCas13b 突变体、crRNA和RNA靶标一式四份进行检测测定。将样品在装备了 FAM过滤器组的荧光读板器上于37℃孵育3小时。每隔5分钟记录一次测量,并将数据标准化到第一个时间点。

切割片段文库

为了绘制Cas14切割产物的图谱,如上所述,用LwCas13a和 PbuCas13b,它们各自的crRNA和靶标RNA或对照进行体外切割反应。切割进行5分钟或30分钟,并使用RNA寡聚清洁和浓缩试剂盒(Zymo research)进行纯化。根据NEB Multiplex小分子RNA测序试剂盒在Illumina NextSeq 500仪器上制备了小RNA测序文库。

设计和克隆用于RNA编辑的哺乳动物构建体

通过将HEPN结构域的催化位点中的两个精氨酸和两个组氨酸残基突变为丙氨酸(R146A/H151A/R1116A/H1121A),使PguCas13b催化失活(dPguCas13b)。将这些催化失活的Cas13b Gibson克隆到pcDNA-CMV 载体主链中,该主链包含通过GS接头(21)与Cas13b的C末端融合的 ADAR2(E488Q)的脱氨酶结构域。为了产生截短形式,设计了引物以 PCR扩增从C末端截短60bp(20个氨基酸)逐渐至900bp的dCas13b (共15个截短),并将这些截短的Cas13b基因Gibson克隆到上述 pcDNA-CMV-ADAR2主链中。使用金门克隆法将靶向Cluc的指导RNA 克隆到哺乳动物表达载体中,该载体包含该直向同源物在间隔序列目的位点的3'端处的正向重复序列,在U6启动子下。

使用的荧光素酶报告基因是Cox等(2017)用来测量RNA编辑的 CMV-Cluc(W85X)EF1α-Gluc双荧光素酶报告基因(21)。该报告基因载体将功能性Gluc表达为标准化对照,但是由于添加了W85X预终止位点,因此存在缺陷性Gluc。

哺乳动物细胞培养

哺乳动物细胞培养实验是在HEK293FT细胞系(American Type CultureCollection(ATCC))中进行的,其在含高葡萄糖、丙酮酸钠和 GlutaMAX(Thermo FisherScientific)、另外还补充了1×青霉素-链霉素(Thermo Fisher Scientific)和10%胎牛血清(VWR Seradigm)的 Dulbecco’s Modified Eagle培养基中生长。

所有转染均在96孔板上用Lipofectamine 2000(Thermo Fisher Scientific)进行。转染前16-18小时,将细胞以约20000细胞/孔铺板以确保转染时达到90%的融合度。对于板上的每个孔,将转染质粒与 Opti-MEM I还原血清培养基(Thermo Fisher)混合至25μl。分别地将 24.5μl的Opti-MEM与0.5μl的Lipofectamine 2000混合。然后将质粒和脂质体转染溶液混合并移液到细胞上。

哺乳动物中的RNA敲除

为了用报道基因构建体评估哺乳动物中的RNA靶向,将150ng的 Cas13构建体与300ng的指导序列表达质粒和45ng的双荧光素酶报告基因构建体一起共转染。转染后48小时,收获含有分泌的荧光素酶的培养基,并在具有注射方案的读板仪(Biotek Synergy H4)上用BioLux Cypridinia和Biolux Gaussia荧光素酶测定试剂盒(New England Biolabs)测量活性。将来自被靶向的Gluc的信号相对于来自未被靶向的Gluc的信号进行标准化,随后将PbCas13b突变体荧光素酶信号的实验相对于仅使用指导序列荧光素酶信号的实验进行标准化(三个生物学重复的平均值)。进行的所有重复都是生物学重复。

哺乳动物细胞中的REPAIR编辑

为了评估哺乳动物细胞中的REPAIR活性,申请人转染了150ng REPAIR载体、300ng指导序列表达质粒和45ng RNA编辑报告基因。然后申请人在48小时后收获了含分泌的荧光素酶的培养基,并在 Dulbecco磷酸盐缓冲液(PBS)中以1:10的比例稀释该培养基(10μl培养基至90μl PBS中)。申请人在具有注射方案的读板仪(Biotek Synergy Neo2)上使用BioLux Cypridinia和Biolux Gaussia荧光素酶测定试剂盒 (New England Biolabs)测量了荧光素酶活性。进行的所有重复都是生物学重复。

参考文献:

1.W.Kabsch,Integration,scaling,space-group assignment and post-refinement. Acta Crystallogr D Biol Crystallogr 66,133-144(2010).

2.W.Kabsch,Xds.Acta Crystallogr D Biol Crystallogr 66,125-132(2010).

3.P.R.Evans,G.N.Murshudov,How good are my data and what is theresolution? Acta Crystallogr D Biol Crystallogr 69,1204-1214(2013).

4.C.Vonrhein等,Data processing and analysis with the autoPROCtoolbox.Acta Crystallogr D Biol Crystallogr 67,293-302(2011).

5.P.D.Adams等,PHENIX:a comprehensive Python-based system formacromolecular structure solution.Acta Crystallogr D Biol Crystallogr 66,213-221(2010).

6.T.C.Terwilliger等,Decision-making in structure solution usingBayesian estimates of map quality:the PHENIX AutoSol wizard.Acta CrystallogrD Biol Crystallogr 65,582-601(2009).

7.T.C.Terwilliger等,Iterative model building,structure refinement anddensity modification with the PHENIX AutoBuild wizard.Acta Crystallogr D BiolCrystallogr 64, 61-69(2008).

8.P.Emsley,B.Lohkamp,W.G.Scott,K.Cowtan,Features and development ofCoot.Acta Crystallogr D Biol Crystallogr 66,486-501(2010).

9.P.Emsley,K.Cowtan,Coot:model-building tools for moleculargraphics.Acta Crystallogr D Biol Crystallogr 60,2126-2132(2004).

10.P.V.Afonine等,Towards automated crystallographic structurerefinement with phenix.refine.Acta Crystallogr D Biol Crystallogr 68,352-367(2012).

11.N.Echols等,Automated identification of elemental ions inmacromolecular crystal structures.Acta Crystallogr D Biol Crystallogr 70,1104-1114(2014).

12.P.H.Zwart等,Automated structure solution with the PHENIXsuite.Methods Mol Biol 426,419-435(2008).

13.N.W.Moriarty,R.W.Grosse-Kunstleve,P.D.Adams,electronic LigandBuilder and Optimization Workbench(eLBOW):a tool for ligand coordinate andrestraint generation.Acta Crystallogr D Biol Crystallogr 65,1074-1080(2009).

14.The PyMOL Molecular Graphics System,Version 2.0

15.X.J.Lu,H.J.Bussemaker,W.K.Olson,DSSR:an integrated software toolfor dissecting the spatial structure of RNA.Nucleic Acids Res 43,e142(2015).

16.H.Ashkenazy等,ConSurf 2016:an improved methodology to estimate andvisualize evolutionary conservation in macromolecules.Nucleic Acids Res 44,W344-350 (2016).

17.T.A.de Beer,K.Berka,J.M.Thornton,R.A.Laskowski,PDBsum additions.Nucleic Acids Res 42,D292-296(2014).

18.E.Jurrus等,Improvements to the APBS biomolecular solvationsoftware suite. Protein Sci 27,112-128(2018).

19.L.A.Ripma,M.G.Simpson,K.Hasenstab-Lehman,Geneious!Simplifiedgenome skimming methods for phylogenetic systematic studies:A case study inOreocarya (Boraginaceae).Appl Plant Sci 2,(2014).

20.K.Huynh,C.L.Partch,Analysis of protein stability and ligandinteractions by thermal shift assay.Curr Protoc Protein Sci 79,28 29 21-14(2015).

21.D.B.T.Cox等,RNA editing with CRISPR-Cas13.Science 358,1019-1027(2017).

结果

VI型CRISPR-Cas系统包含可编程的单效应子RNA指导的Rnase,其包括Cas13b(它是四个已知的VI型亚型家族成员之一)。Cas13b在其线性结构域结构和CRISPR RNA(crRNA)结构方面在这些蛋白家族中是独一无二的。申请人报道了结合至crRNA的颊普雷沃菌Cas13b (PbuCas13b)在1.97埃分辨率下的晶体结构。该结构表明,该指导RNA 在Cas13b内通过介导核酸酶活性的直接和间接相互作用的网络而进行配位。申请人鉴定了用于crRNA加工的第二个活性位点并显示该位点中关键残基的突变消除了加工活性。申请人还发现HEPN2核酸酶结构域对于RNA靶向是非必需的,并建立了用Cas13b进行RNA靶向的结构导向工程化的基础。

在此申请人报道了与crRNA手柄(handle)和部分间隔子复合的来自颊普雷沃菌的Cas13b(PbuCas13b)在1.97埃分辨率下的结构。我们的结构揭示了Cas13b核酸酶的整体结构以及crRNA识别和切割的分子基础。

申请人解析了与36-核苷酸正向重复序列和短5-核苷酸间隔子复合的PbuCas13b的晶体结构(图1)。类似于其他2类CRISPR效应物, PbuCas13b的整体形状是双叶的(13-19)。在该结构中有五个结构域很明显:两个HEPN结构域(HEPN1和HEPN2),两个主要螺旋结构域(螺旋-1和螺旋-2),以及用两个β发夹覆盖crRNA的3'末端的结构域(盖结构域)(图1、图18)。为了鉴定与蛋白质数据库中其他结构域的相似性,使用DALI服务器查询完整的PbuCas13b结构以及分离的结构域 (15)。HEPN1与LshCas13a的HEPN2结构域匹配。

两个HEPN结构域都主要是α螺旋:HEPN1由十二个线性连接的α螺旋组成,在螺旋之间具有柔性环。HEPN2由九个α螺旋、几个短β链和在末端带有带电荷残基的β发夹组成,其指向活性部位口袋。HEPN2 靠在HEPN1上,使得活性位点残基(R156、N157、H161和R1068、N1069、 H1073)组装成经典HEPN活性位点,尽管在线性蛋白的N-和C-末端处 (图1)(3、17、18、20)。HEPN1结构域通过高度保守的结构域间接头(IDL)连接到螺旋-1结构域,该接头穿过大的、带正电的内部通道的中心(图1)。将IDL的保守残基(R285、K292、E296)突变为丙氨酸降低了PbuCas13b通过切割荧光素酶mRNA来干扰哺乳动物细胞中荧光素酶表达的能力,证明了在一般核酸酶活性中的作用(图5A、C)。

螺旋-1被螺旋-2和盖结构域线性拆分为三个片段。螺旋-1使大量的糖磷酸和核碱基与正向重复RNA接触(图2、图3)。螺旋-1还与HEPN1/2 和盖结构域两者有少量的界面接触。盖结构域混合了α和β二级结构,并用两个带电荷的β发夹覆盖了正向重复RNA的3'游离端。两个β发夹中较长的一个穿过RNA环以接触螺旋-1结构域,从而在游离RNA末端上形成了盖。来自盖结构域的带正电残基指向贯穿蛋白复合物的中心的大型中央通道(图1、图6C)。在盖结构域的无序环(K431至T438) 和两个HEPN结构域之间形成了从外部溶剂穿透到内部通道的带正电荷的侧通道(图6A)。螺旋-2结构域由十一个α-螺旋组成,并通过其与螺旋-1的连接包裹在正向重复RNA的主体下。螺旋-2与HEPN1结构域广泛连接,并与盖结构域的延伸β-发夹少量接触。第二个带正电的侧通道在螺旋-1和螺旋-2之间,为crRNA提供了大量的溶剂可及性(图6B)。所有结构域、IDL和crRNA形成该大型中央通道,其内部衬有带正电的残基(图6C)。

与ADAR脱氨酶结构域融合的核酸酶死亡Cas13b用于REPAIR以实现靶向RNA碱基编辑(11)。AAV介导的递送常用于基因治疗,但REPAIR 超过了AAV的载货能力的尺寸限制(11、21)。申请人先前显示了颊普雷沃菌P5-125(PspCas13b)的C端截短不降低REPAIR活性。申请人还使用了来自喉管卟啉单胞菌的另一种Cas13b直向同源物(PguCas13b),其与PbuCas13b相反,在哺乳动物细胞中稳定表达并显示出高活性(11)。基于PbuCas13b和PguCas13b之间的比对,申请人进行截短以移除 HEPN2结构域,将其融合至ADAR,并测试其用REPAIR系统进行碱基编辑的能力。出人意料的是,不仅是这些截短的突变体保留了RNA靶向,而且有些在RNA编辑方面显著更加有效率(图7)。

Cas13b已显示在crRNA有各种长度、间隔子范围为30至84个核苷酸的REPAIR中有效地发挥作用(11)。所有RNA碱基的明确的密度使得正向重复RNA的完整模型得以建立。该结构表明Cas13b通过广泛糖- 磷酸和核碱基相互作用来识别正向重复序列(图2和3)。该正向重复序列大部分埋在两个螺旋结构域和盖结构域之间,但略微从螺旋-1突出,这说明了Cas13b如何能够利用替代的、较长的crRNA。整个crRNA结构是变形的A型双链体,其包含茎(碱基G(-1)-G(-4),C(-33)-C(-36))、环(C(-5)-U(-8),A(-29)-A(-32))、茎(U(-9)-U(-14),A(-23)-A(-28))、凸起(C(-15),G(-21))和发夹环(U(-16)-U(-20))构造(图2和3)。螺旋-1和螺旋-2介导crRNA发夹与盖结构域一起的直接和间接识别,该盖结构域覆盖了3'游离端。

C(-8)、U(-20)和A(-29)这三个碱基从RNA的主体中翻转出来。T754 的主链羰基通过与碱基N4胺相互作用而使翻转出来的、高度保守的C (-8)碱基稳定,使该碱基保留在螺旋-1和螺旋-2结构域中的高度保守残基(Y540、566-571、K751、753-761)的疏水口袋中。该碱基翻转通过C(-8)N3`和U(-7)的糖(O2`)之间的相互作用而进一步稳定。如热稳定性测定中测量的,将C(-8)改为G或U降低核酸酶活性,并使蛋白质-RNA 复合物去稳定(图3)。U(-20)在Cas13b正向重复序列中也是绝对保守的,并通过完全保守的残基来配位,最著名的是与核碱基O2接触的R762,和插入在G(-21)和U(-20)之间的R874,从而维持碱基在外并与U(-20)糖 O4`接触。将R762突变为丙氨酸大大减少哺乳动物细胞中的RNA干扰 (图5A)。将U(-20)突变为G降低核酸酶活性(图3)。与C(-8)和U(-20) 相反,A(-29)在Cas13b正向重复序列中不保守,并且是不通过任何氨基酸来配位的核碱基。相反,A(-29)参与与G(-26)和C(-11)的多重碱基配对 (图8F)(22)。A(-29)可以耐受向任何其他碱基的身份变化,但是突变为G略微降低一般核酸酶活性(图9)。影响一般核酸酶活性的碱基身份变化也降低了Cas13+crRNA复合物的热稳定性。与该观察结果一致,申请人发现将U(-27)和G(-10)之间的摆动碱基配对变为沃森-克里克碱基配对增加了一般核酸酶活性(图2D)。但是,将A(-32)变为G(这也产生沃森克里克碱基配对)降低了稳定性并降低了RNase活性(图2D)。

发夹环被来自螺旋-2结构域内的高度保守残基的蛋白质相互作用的网络所识别(图3)。K870与来自U(-16)和U(-19)两者的O4配位,其在发夹转折处间接地将U(-17)翻转到溶剂中,无可见的残基接触。W842 与U(-18)的核碱基堆叠,同时与K846一起与磷酸盐主链相互作用。R877 和E873通过与碱基N3和O2位置的相互作用而进一步稳定了U(-18)。R874和R762分别通过糖O4`和碱基O2`相互作用来稳定U20位置。

crRNA的发夹环末端(-1至-4和-33至-36)呈螺旋状,并通过碱基和主链相互作用的联合而被识别(图3)。值得注意的是,N653和N652 与U(-2)和C(-36)进行关键性小沟直接接触,并配位发夹的5'和3'末端。这些碱基身份的破坏或N653或N652突变为丙氨酸,在体外和哺乳动物干扰试验中均显著降低了Cas13b活性(图2E、图5)。C(-33)通过N756 经由核碱基O2和糖O2’配位,将该C改变为A或G消除了一般RNase 活性且降低了蛋白质稳定性(图2D、图9)。

RNA发夹末端(核苷酸-17至-20)通过广泛的磷酸主链氢键键合和碱基相互作用而稳定(图2、3)。将U(-18)突变为G消除了一般核酸酶活性。对于U(-19)或U(-20)观察到相同的结果,但其他碱基是耐受性的,这表明G O6或N2核碱基原子破坏了核酸酶活性(图9)。

结晶的RNA底物包括5碱基的间隔子序列(U1-G5),尽管在密度上只有该正向重复的5’第一个核苷酸可见。该RNA正向重复的5’端和间隔子的第一个碱基由来自螺旋-2的残基支持,并指向盖和HEPN结构域之间的中央通道中并指向侧通道(图3)。U(1)不受碱基特异性接触的配位,但位于盖结构域的带净正电口袋中。间隔子U(1)附近带电荷和芳香族氨基酸的突变对一般核酸酶活性影响很小,这表明这些残基对间隔子 RNA的配位不存在或不是必需的(图5H)。

一些2类CRISPR系统将长前crRNA加工成成熟crRNA(3、7、11、 23)。Cas13b已显示在3’端处加工其自身的crRNA(3)。许多高度保守的残基与该RNA的3’末端接触或在其附近,并可能形成第二个非 HEPN核酸酶位点。为了测试第二个核酸酶位点,申请人突变了在该3’RNA末端附近的四个保守残基,并测试了这些突变体的crRNA加工和靶向激活核酸酶活性(图2)。K393当突变为丙氨酸时消除了RNA加工,但保留了靶向核酸酶活性,从而确认了负责crRNA加工的盖结构域中的第二个核酸酶位点的位置(图2、6、10)。R482A轻微影响了crRNA加工,但显著影响了一般核酸酶活性。这可能是由于使crRNA稳定的重要性(图2)。

该解析的间隔子核苷酸指向HEPN叶并指向带正电的通道中。但是,该通道的大小不足以容纳RNA双链体,这表明Cas13b响应于靶标结合而采取了开放构象。申请人使用热变性测定法测量了apo、指导序列、和指导序列+靶标RNA复合物中Cas13b构象的变化。靶标结合的Cas13b 相对于仅有指导序列的Cas13b采用较不稳定的构象,但在非靶标RNA 存在的情况下没有观察到这种变化(图11)。有限的蛋白水解得到相似的结果;指导序列+靶标结合的复合物比仅有指导序列的复合物具有更低的蛋白酶抗性。

尽管该晶体的不对称单元中只有一个分子,但来自一个单体的环与另一个形成反式接触,从而在活性位点配位了来自结晶缓冲液的结合柠檬酸盐。为了测试该反式亚基(trans-subunit)接触是否是功能性的,以及PbuCas13b是否通过该环而反式协同作用,申请人对该环的尖端处的残基(Q646和N647)进行了突变以观察它们是否会影响活性。每个突变均降低了哺乳动物细胞中的RNA干扰,启示了一般核酸酶活性的反式亚基调节的可能性(图5F)。

最后,申请人将Cas13b与LshCas13a的结构进行了比较(图4)(17)。除了这些家族成员之间的一般功能相似性外,核酸酶之间有结构相似性,尤其是在HEPN结构域和活性位点结构中(图4B、C)。但是,SAS搜索提供了与(以前称为LbCpf1)的晶体结构的匹配,并突出了Cas13b 内的桥螺旋样亚结构域(24)。尽管该结构域在Cas13b家族中保守性很差,但它似乎是与介导必需核酸接触的Cas12a共同的结构特征(图5D、 13)。考虑到Cas13b和Cas12a之间的根本差异,申请人假定该桥螺旋会聚地出现且并不表明这两种蛋白质的共同祖先。尽管如此,申请人将此特征称为桥螺旋,以与其他2类效应物的命名法保持一致(1、14)。

下表11列出了产生和测试的示例性PbCas13b突变体。

表11:测试RNA干扰的突变的列表。突变和来自三个生物学重复的平均标准化荧光值的列表。

PbuCas13b的结构为VI型蛋白家族的结构多样性提供了新的信息,并凸显了Cas13a和b之间的差异和相似性。申请人显示了crRNA识别和加工的结构基础,并揭示了核酸酶活性在指导RNA和蛋白两者中的关键调节剂。基于PbuCas13b的结构,申请人能够生成REPAIR平台的较小变体,其保持碱基编辑效率并可以打包到AVV中。我们的数据表明在靶标识别过程中发生了主结构域重构。来自PbuCas13b的结构的洞见使得能够进行合理工程化以改善RNA靶向特异性、碱基编辑和核酸检测的功能性(11、12、25、26)。

实施例2

图19显示了pymol文件,其显示了Cas13b的活性位点中的配位核苷酸的位置。这是基于与U核苷酸复合的RNAseL的晶体结构的结构比对。该比对将该核苷酸置于Cas13b的活性位点内,并揭示了可能的残基相互作用。图中标注了涉及碱基特异性的环。

实施例3

RNA环可以被延伸。延伸的RNA指导环可以添加功能性RNA基序。图20显示了示例性RNA环延伸。

实施例4

图21显示了示例性融合点,核苷酸脱氨酶通过该融合点连接至 Cas13b。该融合点可以是Cas13b上的一个或多个氨基酸。例如,融合点可以是氨基酸411-429、114-124、197-241和607-624中的一个或多个。在一个实例中,该等氨基酸存在于颊普雷沃菌Cas13b中。

实施例5

使用酵母筛选来筛选影响ADAR活性的ADAR中的突变。该筛选进行了多轮。每轮筛选产生一组候选突变。然后在哺乳动物细胞中验证所述候选突变。表现最好的突变被加入到突变的最新版中并进行重新筛选。下表显示了在10轮中筛选出的突变。在第n轮中鉴定的突变体称为 "RESCUE vn-1"。如本文所述,RESCUE是指将腺苷脱氨酶活性转化为胞苷脱氨酶活性的突变。

表12

进行了RESCUE v9的突变的筛选(图22)。在T翻转指导序列(图 23)和C翻转指导序列(图24)上验证了RESCUEv9的作用。使用 RESCUEv9,实现对T、A和C基序的至少约60%编辑,对G基序的25%编辑。用内源性靶向(与T翻转指导序列)测试了RESCUEv9的性能(图25)。

进行了RESCUE v10的突变的筛选(图26)。

测试了30-bp指导序列的C翻转(图27)。

用RESCUE v1至v8进行了Cas13b6和Cas13b12之间的比较。 Gluc/Cluc结果显示在图28中,编辑分数结果显示在图29中,以及 RESCUEv8对内源性靶向的作用(T-翻转)显示在图30中。

比较了RESCUE对碱基转化(C至U和A至I活性)的作用(图31)。测试了CCN 3’基序靶向(图32)。

实施例6

产生(图33A)并测试(图33B)了通过接头与ADAR融合的具有各种死Cas13b(包括dCas13b)的构建体。该等构建体还具有N端标签 (HIVNES)。进行了该N端标签和接头的测序(图34)。

进行了脱靶的定量(图35)。测试了脱靶编辑(图36)。测试了用(GGS)2/Q507R靶向的内源基因(图37)。进行了(GGS)2/Q507R上的突变的eGFP筛选(图38和39)。

产生(图40A)并测试(图40B)了具有为Cas13b截短的dCas13b 的构建体。该等构建体还具有N端标签(NES/NLS)。产生了多重中靶/ 脱靶指导序列用于筛选(图41)。

实施例7

使用酵母筛选来筛选影响ADAR活性的ADAR中的突变。筛选进行了多轮。每轮筛选产生一组候选突变。然后在哺乳动物细胞中验证所述候选突变。表现最好的突变被加入到突变的最新版中并进行重新筛选。下表显示了在10轮中筛选出的突变。在第n轮中鉴定的突变体称为 "RESCUE vn-1"。如本文所述,RESCUE是指将腺苷脱氨酶活性转化为胞苷脱氨酶活性的突变。

表13

对RESCUEv10进行了多轮验证(图42A-42E)。通过下一代测序 (NGS)分析了RESCUEv10(图43)。鉴定出改善特异性的突变(图 44)。测试了RESCUE对内源性靶向(C翻转和T翻转)的作用(图45)。

使用RESCUE靶向β-连环蛋白。图46显示了使用RESCUE v6和v9 靶向β-连环蛋白。图47显示了新的β-连环蛋白分泌的Gluc/Cluc报道体。图48显示了RESCUEv10靶向β-连环蛋白的结果。

RESCUE也可用于靶向其他基因。图49显示了RESCUEv10靶向 ApoE4。

实施例8

本实施例显示了使用RESCUE碱基编辑β-连环蛋白以增加β-连环蛋白的稳定性,以改善HUVEC在营养缺陷型培养基中的增殖和存活。

HUVEC在营养丰富的培养基中生长。用含有RESCUE构建体的腺病毒转化细胞。该RESCUE靶向β-连环蛋白并产生S37A突变。转化的细胞以低汇合度传入营养缺陷型培养基中。使用细胞计数试剂盒测量细胞增殖和存活率。

实施例9

本实施例显示了在HepG2细胞中碱基编辑丝氨酸蛋白酶PCSK9。该碱基编辑通过在PCSK9上诱导患者衍生的突变来调节HepG2细胞中的低密度脂蛋白(LDL)胆固醇更新。

使用各种转染试剂将GFP表达构建体转染到HepG2。选择产生最佳 GFP表达的最佳转染试剂用于转染RESCUE构建体。使用具有在5’,5、 7、9、11处的靶位点的30bp指导序列转染RESCUE构建体。通过RESCUE 产生PCSK9中的一个或多个突变。示例性突变显示于图50。

进行RT-PCR和测序以确定表现最佳的指导序列。胞质LDL被荧光标记,并通过细胞成像测量胞质LDL的细胞更新。使用ELISA和/或免疫沉淀监测PCSK9分泌。

实施例10

本实施例列出了与Cas13b-t有关的信息和数据。Cas13b-t1、Cas13b-t2 和Cas13b-t3的各自大小列于表14。

表14

Cas13b-t1、Cas13b-t2和Cas13b-t3的氨基酸序列如下所示:

Cas13b-t1

mndkstwqlklhrivrwsflrrqrvgcdishhfdfilvrrsgiknmefenikktsnkevysieqyegekkwcfaivlnra qtnleenpklfeqtltrfekimkqdwfneetkkliyekeeenkvkeeiqiaaserlknlrnyfshylhapdclifnrndt iriimekayeksrfeakkkqqedisiefpelfeeedkitsagvvffvsffierrflnrlmgyvqgfrktegeynitrqvf skyclkdsysvqaqdhdavmfrdilgylsrvpteiyqhikltrkrsqdqlserktdkfilfalkyledyglkdladytac farskikrenedtketdgnkhkfhrekpvveihfdkekqdqfyikrnnvilkaqkkggqsnvfrmgvyelkylvllsllg kaeeaiqridryisslkkqlpyldkisneeiqksinflprfvrsrlgllqvddekrlktrleyvkakwtdkkegsrklel hrkgrdilryinercdrplsrkeynnilkfivnkdfagfyneleelkrtrrldkniiqklsghttlnalhervcdlvlqe lgslqsenlkeyiglipkeekevtfrekvdrileqpvvykgflryeffkedkksfarlveeaiktkwsdfdiplgeeyyn ipsldrfdrtnkklyetlamdrlclmmarqyylrlneklaekaqhiywkkedgreviifkfqnpkeqkksfsirfsildy tkmyvmddpeflsrlweyfipkeakeidyhkhyarafdkytnlqkegidailklegriierrkikpaknyiefqeimnrs gynndqqvalkrvrnallhynlnferehlkrfygvvkregiekkwsliv(SEQ ID NO:272)

Cas13b-t2

mqvenikkgssqgmysieqyegakkwcfaivlnraqtnlqgnpklfeetltrferirkedwfdqetkkliyakqeqneve eeiqkaadeklrdlrnyfshyfhtpdcliftqndpvriimekayekarfeqakkeqedisiefgelfeengritsagvvf fasffaerrflnrlmgyvqgftrtegeykitrdvfstyclrdsysvktpdhdavmfrdilgylsrvpsesyqrikesqmr setqlserktdkfilfalnyledygledladytacfartrikreqdentdgkeqkphrkkprveihferaegdpfyikhn nvilrtqkkgaqtyifrmgvyelkylvllsllgkgaeavkridryvhslrnqlphiekksteeiegyvrflprfvrshlg llgvddekkikarvdyvkakwlekkeksrelqlhrkgrdilryinercerplnideynrilellvtkhldgfyreleelk ktrridknivcnlsrhksvnalhekvcdlvvqeleslgreelkeyvglipkeekevsfeektdrvvkqpviykgflrnef fresrksfarlveeavrekgevydvplggeyyeivsldtfdkdnkrlyetlamdrlllmiarqyhlslnkelakraqqie wkkedgeeviiftlknpaqpeqscsvrfslrdytklyvmddaeflarlcdyflpkdeeqidyhrlytqgmnrytnlqreg ieailelekktigpeqprppknyipfseimdksayneddqkalrrvrnallhhnlnfaradfkrfcgimkregiekrwsl av(SEQ ID NO:273)

Cas13b-t3

maqvskqtskkrelsideyqgarkwcftiafnkalvnrdkndglfvesllrhekyskhdwydedtralikcstqaanaka ealrnyfshyrhspgcltftaedelrtimerayeraifecrrreteviiefpslfegdrittagvvffvsffverrvldr lygavsglkknegqykltrkalsmyclkdsrftkawdkrvllfrdilaqlgripaeayeyyhgeqgdkkrandnegtnpk rhkdkfiefalhyleaqhseicfgrrhivreeagagdehkkhrtkgkvvvdfskkdedqsyyisknnvivridknagprs yrmglnelkylvllslqgkgddaiaklyryrqhvenildvvkvtdkdnhvflprfvleqhgigrkafkqridgrvkhvrg vwekkkaatnemtlhekardilqyvnenctrsfnpgeynrllvclvgkdvenfqaglkrlqlaeridgrvysifaqtsti nemhqvvcdqilnrlcrigdqklydyvglgkkdeidykqkvawfkehisirrgflrkkfwydskkgfaklveehlesggg qrdvgldkkyyhidaigrfeganpalyetlardrlclmmaqyflgsvrkelgnkivwsndsielpvegsvgneksivfsv sdygklyvlddaeflgriceyfmphekgkiryhtvyekgfrayndlqkkcveavlafeekvvkakkmsekegahyidfre ilaqtmckeaektavnkvrraffhhhlkfvidefglfsdvmkkygiekewkfpvk(SEQ ID NO:274)

Cas13b-t1、Cas13b-t2和Cas13b-t3的基因座显示于图54A-54C。基因座的序列显示如下:

Cas13b-t1基因座

agctgtcccgctgagcttattaacaagcattaccgctaaattttccgcggactgttggttttcagcttcgtgaatgccaa caacaaaaggccctgtcgaaagcacaatttcggtggtgtcatagaaatccaggactttgccttcgagggttttattggtt gccttctttgctgtggcgccattttcaatcagaaagctgcgatagctttctgcgactgcctcggcatctttgggaccgga gcgtttgctcagaaatgccgtgatggtttcaccgttaagctggtatccggcagcgaagatgtcagtcaatccttcaaagc caaatgcacttgccagataaagcttaatgcttcctgggaccaaattatcctttggcaggtgctcgatttcaggtatagcg gtatcatcgtgaacggccaggttcgtgggaattttccttgcgacttccgccattgccgcaaacagctcatccgattcggc gaagccgaccagctcgatataatattggccgtgcgcaagataaaacgcattactggttttgtatgcaaattgcatatccg gcaggttctcaacttcgggccttttttgcacgctgtaaaccgagaatgcgtttctggttctggccatatcaaagatatag agctccatcaccaggttttcatccgcctggcttacaaatctctgggtggacaattttataaaaccagcgtcgatataaag gggggccttgccgttaatcttttcgtaaagattttcggtggtgtagacttcaatttctgaaagcgttttgaatccgtaag gcagaagaaaagtcaggtctttcttttgttttggcatctgctttatgaataccccaacggcgataagtaagagaatcgct aataagcagatgcctataacagattcgagacgttttgcccggcttggtaccgaacccataaccaactccagtaatgacaa attacttgactttataaccgggctggattataatttttgccggtgttgctgtcaaccccaaatgctacaggtgaaaaagg cgaagatagatttctaacgaggttgacaaagcaggtcagggcgtgttataataggttgctaaagtaaaaaggagactgaaatgattgaatatgcacaatatttggggttttggacgccgggcccccttgaaattgctgttattgcgattgtcgctcttct gatattcggcagacggctgcctgaaatcgcccgcaacgtaggcaagagcctgactgaattcaagaaggggcttcacgagg ccaaggagaccaaggacgaattggtggatgatgtccgggaagtcaaggatgatgtggtaagagaggcgaaggatgccgcc gggctgaatgaagaggatacaatgggctctgattgattattgataaaggggaactaatcactgagaacaattgtcaatca ttaatcaacaatcaatattgaagatccgcctgtggcggaatcaatttttaagatgggcgatacaaagaagaaagaggacc tccttgattccactatgagtctgggcgaccaccttgaggaattgcggatgcggctgattcgcgcgctggtgggcctggcg ttagctcttattatctgtctgatcttcggcaagctgctgatatcatttattcaaaaaccttacgttgctgtgatgggtga agaggctactctgaagacgcttgccccggcccaagggattaacagctacgtaaaaatagccttggtctcaggcttgatat tctcatcgccctgggtcttctaccagttatggatgttcgtggctgcaggactctatcctaatgaaaaaagatatgtgtat gtagcagtacctttttcggtggtattatttgttgccggagctttgtttttcatctttgtagtggcagaagtgtctcttgc tttcttaataaaggtcgacaggtggctcggactggaacccgactggactttcccgaagtatgtgacctttgtaaccaccc tgatgctggtatttggtgttgcgtttcagaccccgatagctattttctttttgaacaagacaggtctggtttcagtccag gcgttacggcggtcaagaaaatatgtactgctacttatcgttgtagtagcagctatggcgactccgcctgatgtggtttc tcaagtaacactggcgataccgttgtatgtgctgtttgaattaggcatactgctgagttactttgcagaactaaaaaaga gaaagtcgaaaaacaaccagtgataagccgacaatccccagctttcccagtaccgactacttgtttctttcgggcctggt ttttatttcgtcaatcgagcgactaagaaatcttcaaaggcgcttaaatccttccataccgtggcacagttaatggtttt ggctttgttatctattacggtgtatccatagtcggtaacccgaatgccgagtttttcgggctcattttagacatttgcat ctatgccgccggcagcgctgaaggttttttcggagctaattgagtattcagcataaatgttgaacggttttgccaatgcg ggtactatgatgttgatgctaacgttgataaatacaaatgtgatggtccctcccatagggcctgtcggcctggactatat cgcaggagccgtcagggcagccgggaaccaggcagacgtagttgatttatgtcttgctgatgacccgtcaaagactctcc agggctatttcgctacgcacagcccgcaattggtgggggtctcttttcgcaatgtggacgattctttctggccaagcgcc cggtggttcgtccccgacctggctgacactatccgtacgatacgaagtatgacggatgcaccaattgtagttggcggcgt tggcttttccattttttccgagcgaatcgtcgaatataccggcgctgactttgggattcggggcgacggagagcaggcaa tagtttcacttcttaatcagctgcagcggccggaacggcttgaacgcatagatgggttagtccggcggcgcgacggagtt attcacagcaaccgaccagcgtggcctgcaccgctttctttgcgcaccgaacgtgatgcgattgataacctcgcttactt caaaaaaggagggcagtgtggtgtggagaccaaacggggctgtaaccgccgatgcctatattgtgccgacccgctggcta agggtgcggcagtcaggccgagggccccgtcggaggtcgccgatgaggtccagtctctaataggcaagggaatagaagta ttgcatttgtgcgactctgagttcaacatctctcaaagccacgcctatgcggtctgcgaagagttcagccgtcgctcatt tgcgaaaaaggtgcgctggtacacatatatggcggtggtgccattcgatgccgagcttgccggggctatgagcagagcgg gctgtgtcggtatcgactttaccggcgactctgcgtgcccatcaattctaaagacctatcgccagcggcatcataaagaa gaccttgcctcggcggtgcgtttgtgccgtgctaacggcataacggttatgatagacctgctgtttggcggcccgggtga aacgccggaaacggtcgcagagacaatagatttcattaagcaaattgacccggattgcgcaggggctccgctcggtataa gaatctaccccggcaccgaaatggcccgaatagtggcaaacgaaggcccaccggaaacgaacccgaacgttcaccgaaag tacgaggggcctgtggatttcttcaaaccaacttactatatatctgaagccctcggtgagcagccggccgggcttatcaa ggatttgatttcggcagatgaaagattctttgagccgatgccggaaatagccccggaggctctaaaaagtagccagtcca ccgaccacaattacaatgataataccgaacttgtagaagcaatcagcaaaggtgcacgcggggcatattgggatatactg cgcaagcttcgctgcgactaagcagcttatggtagtagatgattcccgcctgcgggagattggcccgaatcctgaggaat ttgttagaagcggatgcaatgttgatttttggggtaaaaacgggggcagggggatttggtccccggtttgaggattccga gaagcccacccgtagggatctccgctcccttagggataaattcgcttcgagtttgaaattggtccccggtttgaggattc cgagaagctcacccgtagtgatctccgcttcgcttcggctttgtttgggtttgttttccccgcgtctgcgaagtggttca ttttcataatcctttataacatataagtttacgttcattttgggctttcggcaaattgggtttgaattgggtttgttttt ttggactgcgaaatcatctttttttctgtaaacctttgttataagagagtttacattcatttgggcatttagtaaattgg gtttgattggctttgaattgggtttgttttcaccaagtgtccaattggatttattttcataatcctttgtattatatgga tttacgttcatttgagcatccagaaaattggctttgttttgcataaaaagggctgatttgtagaggactctttacagttg tagagggcaagttagttaagagtgagctaaagtgcctaaagtgaactaaagttggattctcgattctcgtatagcgtata gcgtatttcacggttattcaccattcattaaggaataaatttgattaggcctgctggcccctccggcgattagtaaatggttctcggcggcaaaacaacgcgcctctataattgggcgaacatgcacgtttgagtcgaaaattggtgctttcttgacagg ataaacaggagtaactcgttgtgagaaaaggagtaaaattttttttcaattttccgattttaggttccaactacctgcac ttttgattgaaaaatcacaaatgtcttgcctattttaacgcagtttttcgtcgaaacgtcagcgaactaggaaaataggc gatttctgggggaaaacaaataaaaaatgcacaaaagtgacaaaaaaacggccaaaaaagtgctttttttggctgccttt accccgtgagatgatttaccaaaccttcctctgctattcctatgcaagtttgctcagggctggtgtgaatactataaaaa tttgtgctgtaatcactccacaaatcggaggcttcttcagcgtggaaattctggaggccaaaatgaaatacgctgtaatc accccacaaatcggaggcttcttcagcttcactacctctcaaatcgcccaactatacgctgtaatcaccccacaaatcgg aggcttcttcagctcgcaagtcccgtccacgcacaaagtttgagctgtaatcaccccacaaatcggaggcttcttcagca tgagcttttggttgtgctggatatgccagctgtaatcaccccacaaatcggaggcttcttcagcacaaaacggttcaaca aggtcgaagaactagctgtaatcaccccacaaatcggaggcttcttcagcttctgcggagtctttcgccggtgttcaaat gctgtaatcaccccacaaatcggaggcttcttcagcctatcctttataatacattttcctatatagatttacaatacaaa acccacgacaaaactgacttcttcttttgaatcatgccgtattataacacttttttacactatcaaagaccacttttttt ctattccttctcttttcacgaccccatagaatctcttcagatgttccctctcaaaattgagattatagtgcaaaagcgca tttcgcacccgctttaaagcaacctgttgatcattattataaccgcttctattcattatctcctgaaattctatataatt ttttgctggtttaatctttcttcgttcgataatccttccttcaagctttagtattgcatcgattccctctttttgaaggt ttgtatatttgtcgaacgcccttgcatagtgcttatggtagtctatttcttttgcttcttttgggataaaatattcccaa agtctgcttaaaaattcaggatcgtccattacatacatctttgtataatccaagatcgaaaagcgtatcgaaaaactctt cttttgctcttttggattttggaatttgaaaataatcacttctctgccatcttccttcttccaatagatatgctgtgcct tttctgcaagtttttcgttcaatctgagataatattgccttgccatcataaggcaaagtctgtccattgccagtgtttca tatagcttcttgtttgttctgtcaaatcgatcaagagatgggatgttataatactcttcaccaagaggaatatcaaaatc cgaccactttgtcttaattgcttcttcaacaagtctggcaaaactctttttgtcttctttgaagaattcgtatctcaaaa atcccttataaacaaccggctgttccaaaatcctatctaccttttctctaaaagttacctctttttcttctttaggtatc agcccaatatattccttgagattctccgattgcaaactgcccagttcttgtagaaccaaatcacataccctttcatgaag tgcattgagcgttgtatgcccggaaagcttctggataatatttttgtctaatcgtctggttcttttcagttcttcaagtt cattataaaatccggcgaagtctttgttcactataaactttaaaatattattatattccttcctgctaagtggcctatcg catcgctcgttgatatatctgagtatatcccttccttttcgatgtagttcaagcttcctcgatccctcttttttatccgt ccacttggccttaacatattccaatcgagtctttaaccttttctcatcatcaacctgtaaaagacctagtcttgaacgta cgaatcttggaaggaagtttatagatttttgaatctcctcattacttattttatctaaataaggcaactgcttctttaaa ctactaatatagcggtcaattctttgaattgcctcttcggcttttcccaatagactcaaaagaacaagatatttaagttc ataaactcccatcctgaatacgttggactgtccaccttttttttgagccttcagaataacattatttcgtttaatataaa attggtcttgcttctctttgtcaaaatgaatctcgactaccggcttttccctgtgaaatttgtgtttgttaccatctgtc tctttcgtatcttcgttctcccttttaattttacttcttgcaaaacatgctgtgtagtctgccaaatccttaagtccata atcctcaagatatttcagtgcaaataatatgaacttgtccgtctttctttcgctcaactgatcctggcttctctttcgag ttagtttgatatgctgatatatctcagtgggaactcgggacaggtatccgagaatatccctgaacataactgcatcatgg tcctgcgcctgaaccgaataactatccttaagacaatatttggaaaaaacttgccgtgttatattatattcaccctctgt ttttctaaacccttggacatatcccattaagcgatttaaaaatcttctttcaataaaaaatgagacaaagaatactacac ctgctgatgttatcttatcttcttcttcaaataactctggaaattcaatcgaaatatcttcttgttgttttttcttcgct tcaaaacggctcttttcgtatgctttttccataattatccttatggtgtcatttcgattgaatatcaggcagtcaggcgc gtgaagataatgtgagaaataattccttaaattctttagtctttcactggccgctatttgaatttcttcttttactttgt tttcctcttctttttcataaatcagtttttttgtttcctcattaaaccaatcctgtttcatgattttttcaaatcttgta agtgtttgctcaaataactttggattttcctctaaatttgtttgtgctctattaagaactattgcaaaacaccacttttt ttctccttcatattgctcgatagaatacacttctttattgcttgttttttttatattttcaaactccatatttttaatcc ccgatcttcttactaatataaagtcaaagtggtgcgaaatatcgcaccctaccctctgcctgcgcaggaaagaccaacgg acgattcgatgcagtttgagctgccaggtgcttttatcattcaaggggtaaaatagcagaaaagccttaatgtgtcaagg ggattttagatttactatttccaatttacgattttggattgagattgcttcggcctaaaagacaggcctcgcaatgaccc ccttagagttgaaagcactctaaacaagggggcaggcggggggaatatcgaatatcgaatctgaatgtccaatgtcgaagtgcaactgcgcgggaatgacaggtcggcagatttatttaattctgtggccagatccctccgcttcgtccacctgcggtgg acttcggtcgggatgacactgggggtgtgccattgctccgctcg(SEQ ID NO:275)

Cas13b-t2基因座

agccgagtcgatggtagctaaggtgaacgacaagcgtggttatacggagataagttgatgcgactggttatccatgagga cgaagtagattcgatggattggttatatggaattagatcgaaacgtatacctatgaagctcacagtcaaataccaatcgg gatagaaatgcggcgcgcgcaaccttaggcaaaggcttggctgtttcagcgtttccgctttacgtgcccgtttagccttc accatagtccacctttccgcaagcctccctgcgatcccggacagtcggatttcccaaatccggttctggtctcggcccta tttgtcattttctggataaaggccttcctgtacaatttgagacttaagtgctagctcacttgcaccccataattgtacag tttaccagtatcctcgttccgagagtccatggcattcgttccagttcggtgcctggatgcacatgccttactcagaacca ccgagtacccagagcccctttgtcaggcgtgggcgctacccactacctggatgactttgaaagtcacctcagaagacatt actcttccttcatagctcatacggactcatgcgccagaccaaatccctcccaacgtcttggttttcccttgtacgttagg tctttgcaggttgtcgccagtccctgctgggaaacggcccttcccgacattatctctgcaatccttgtataggtgcaagg acccttaccccgcagcgtcccttcggtgcccttgcccgtttcttcccgaaggactgcggtctcacctcaggatttaaagg ttcgacacgccaattatccgtcgcaatgcaacttcaacaacggggcaaatttcggggctgcagtcattccataacgttca agctcctatacctgctatgccctgcggttgcacccaccactgagcatatatgagctcagggcagccgggccgtttacacc acgcatcgcccggatggttacccattccgagatgtggcatcgctacgtgcctgaatcgggcaactggcacgacgggactt tcacccgctggattgcagccttgtcggctgctccaaatccctgttgccacaaaaattttctttgaggcatccacgttacgacgtgtcggccacgcttcgtagcttatctgaacagcctttcgacttcacgatgcattataatggacatcgtgaatctagc tatgtcatggtcaatcgtagtgtggccaggggccggccaatcgagtatacttgataaagtgttcatgaagctgtattctt taatctcccaagagtatgcttcgaacgtttaagaaatgacagatagtggtgaagtggtctgaaaacgggcccgggaggcg aagacgtgagtacaggtacagtgaaatggtttaatgcaagaaggggatacggttttattgtccccgatgatggcggagat gatttatttgttcaccgttcggacattaacacagaggactatgcatcgcgagattattaaggtcggcaacgacatggttg ccgaccatatcaatcataagggcttggataatcgcaaggccaatttgcgagcggcgacgattgcgcagaatgcgtggaac cgccagcgcaaaagaagcggatttatgggcgtagtgtggaataagcagatgaggaaatggcgtgttaatatcagtcacga gggcacgtgcaggcatatcggctacttcgatgatgaggttgaagcggcgaaggcgcacgaccgggcagcgaaaaaatatc acggagagttcgcgagtttgaatttcacgcgttaaagccacatcacagcgagtccgactatggcggacgcagcaatctta agcatatttggctgcgcaatgtgttgcgcgggttcctgcttggggcgagctatcgaggtgtaatcaccccacaaatcggg ggcttctccagcgccgtaaaagttgataagaattttagatgcgccgtaatcacccctcaaatcgggggcttctccagcgc tgaccgaattgataaaaccaagagagcgctgtaatcaccccacaaatcgggggcttctccagctgtacgacaaatcataa cagaatatttgaagctgcaatcaccccacaaatcgggggcttctccagcaaaatgagacaccacgcttgacgtcactgtg ctgtaatcaccccacaaatcgggggcttctccagcttcgagctatatctggctcggtctgatttggctgtaatcacccca caaatcgggggcttctccagcactggcttagcaagttcctttgggcgtttcgctgtaatcaccccacaaatcgggggctt ctccagctaatcgaagatgagaccgaagactatcactgctgtaatcaccccacaaatcgggggcttctccagctgattgg gaaagcactccttacgcacgagagctgtaatcaccccacaaatcgggggcttctccagcacatcctcgataatacgttat ctcgattggatttacaacagaaaaatcactgaaaataccagggtttttggtgcaatgcgcacacattagaacctgttttc atactgctaaagaccagcgtttttcaatcccttcccttttcataattccacagaacctcttaaaatctgccctggcaaaa ttaaggttatgatgcaaaagcgcgtttcgcacacgtcggagagctttctggtcatcttcattgtaggcgcttttatccat tatctcgctaaatgggatgtagttctttggaggtcttggctgctctggaccgatagtctttttctcaagctcgagtatgg cttcaattccttccctttgcaggtttgtgtatctgttcatcccttgcgtataaagcctatggtagtcgatttgttcttcg tcttttggcaaaaaataatcgcaaagtcgggccaaaaactccgcgtcgtccatcacatagagtttcgtataatccctcag cgagaaccgtaccgaacaactctgctccggctgtgccggattcttcaaggtgaaaataattacttcttcgccatcctctt tcttccactcgatttgctgtgccctcttggcaagctctttgttaagactaagatgatattgccttgcgatcatcagcaaa agcctgtccattgccagtgtttcatacagtctcttattgtctttatcaaacgtatcaagtgacacgatttcgtaatactc cccccccagaggaacatcataaacctctcctttttccctcaccgcttcttcaacaagcctcgcaaaactctttctgcttt ctctgaagaattcattcctcaaaaatcctttataaataaccggctgtttcacaaccctgtccgtcttttcttcaaatgac acctctttttcttctttgggtatcagtccaacatattccttcagttcttctctgcctaggctttcaagttcttgcacgac caaatcgcacaccttttcgtgcagcgcattgacgcttttatgcctggaaagattgcacacgatgttcttatctatccgtc tggtcttcttcaattcttcaagctctcggtaaaacccgtcgaggtgcttagtgaccaaaagctccaaaatacggttatat tcatcgatgttcagcggcctctcacaccgctcattgatatacctcagaatatcccgtccttttcgatggagctgaagctc cctcgacttttcttttttctccaaccacttggccttaacataatcaactcgcgccttgatctttttttcatcatcaaccc ctaagagacccagatgggaacgcacaaacctcggaagaaatctcacgtatccttcaatctcttccgtgcttttcttctct atgtgaggcaactggttgcgcaagctatgaacatacctgtcgattcttttgactgcctctgctccttttcctaataagct cagtagaacaagatatttaagctcgtagacgcccatcctgaatatataggtttgggcgcctttcttctgagttcgcagaa tgacgttattgtgtttgatataaaatgggtctccttcggctctctcaaaatgaatctcgactctcggcttcttcctgtga ggtttctgctccttgccatctgtattttcgtcctgctcccgcttaatcctcgttctggcaaaacatgctgtgtagtctgc caaatcctccagcccgtaatcctcaagatagttcagcgcaaacaatatgaacttgtccgtctttctttcgcttaactggg tttcgcttcgcatttgcgattctttgatacgctgatacgactcactgggaactcgtgacaaataccccagaatatcccgg aacatgaccgcatcatgatccggcgtcttaaccgaataactgtccctaagacaatatgtcgaaaaaacgtcccgcgttat tttatattccccctctgtacgcgtaaacccctgaacatatcccattaaccgatttaggaaccttctctcagcaaaaaatg acgcgaaaaataccacacctgctgatgttatcctgccgttctcttcgaacaactccccaaattcaatcgaaatatcttcc tgttccttttttgcctgttcaaaacgcgccttttcgtacgctttttccataattatcctgaccgggtcattttgggtgaa tatcaggcagtcaggcgtatgaaaatagtgcgagaaataattcctcaaatctctaagcttttcatcagccgctttttgaa tttcctcctctacttcgttttgttcttgttttgcatagatcagttttttcgtttcctggtcaaaccaatcttcctttctgatcctttcgaatcgtgtcagcgtttcctcgaacaacttcggattcccctgcaaatttgtttgcgccctattaagcactat cgcaaaacaccacttcttggccccctcatattgctcgatagaatacattccttggctgcttcctttcttgatattttcaa cctgcatatctcagactctcccaattgttgtttttcgccatttttgttgaagtccccgaatgtcagtctattgggccagc tgagtcaacccacaaggcacaatgtacatacagtctcgagtcatttcgagaagactttccgctcgcccgataagataagc tttgagtatctcacggggtggacccgagcagataattccacatctcgtatccggtgaagctatccggcataaattcgtgc ttagtgaatcgtgtttcgtgttgatacggctcccggctgcattcacttttcacggcagagaatatcgcaaaataaggcaa cagtcaaaggaaaaagggtaaaaatggtgaaatagatgagcgagcagtgaattgttgtggcaagcaagccgcaaatgaat ccttcggccacgctc(SEQ ID NO:276)

Cas13b-t3基因座

tatccaaaatgtggtttgaattcaagaatcaacgctttattccttaaaaaggggcggtgcgatggaaaaagaaccagaaa catccgtgcaatcggcgtcgggacacaatatggatatcccgattgactggtcggtaacctcacgctatttcgaagatgaa gatacgctgatgcaggtggtggggatatttgctgaagactctccgcagaccgtccgggaccttgccaaggctatacagac gcaaatatcccaggatgttcaattgcacgctcacagcctgaagggagcctcggctcttatcggggccgaacatctgcggc aaagagcctggcggcttgaatacgccgcccaggagaaaaacacggcggcgtttgaggcgctgtttgacgagacaaaggcc gagttcgacaagctgatgtcgttcctttaccgcgccgattggattgaagcagcaaaagaacgccactgcaacaggcaaca ggccgagcaggtatgaaacatcttttggaaaagaaggcgatggaatgagtggatggttctccattttgatcattgatgat gacaggatggttacagacaagttggagaagatcagcggcgccaaggctgcaaagaaaaggttcagcctggcaggcgtttt ctcaaagggcgcctgaagccctttatttgcaggcgtgctaccgcttgtcaacgggcaggggacagaaccgcaatcaggat taccatcagtttcttcattccattaacctcgctttttcctctcgttctttttcttcttcctggttttcgcagcgttgggc tgtctttttgccggttttgtatagttgtcgccgtaaatgtcaatgagtgcggcttttagtttttcgggccagttgcggtt ttcaaaagcgcacacgagcggatcgccgctttgtttcatccagttatgaagccggccctgcatcttcttgatttcgctcc tttgctctgcggaatcgataaggttgttgaggcagtcggggtcatttctgagatcatagaactcctcggccgcgcgatat ctgaacatcttgacgcgctgtgcggcgaacttattcgttggagcggcctcgaccatcgccttcatggtaaggccctcgttgttgtttcggtaccagaatctgccgtcggcccacggattgaagatatagccgaagcgcttatcctggacgcaccgcatcg ggacagcgtctccgccggctttcatgtctatctgcgtaaagaccacgtcgcgtccggattgcttttcgcctttcaacagc cccaggaaagaggaaccgtcaagccccctgggtatgcccagaccgaccgcttcgagcaccgtcgggaagaagtcgatccc tgagataaagtgcgccttatcgacggcgcctgcttttaccatttgcggccaacgaacgatccacggcgtccgcgtgctgg caagataggcgttgcattttgcaaacggtatggcgatgccgttgtcggagaggaacatcacaagcgtattctcctcgaag cccgactccttcagggcctgcaacgtcttgccgaaggtatcgtcgagtcggcggacggagttgagatagcagctcagttc ctgccgaacgcccggcaggtcgcagacaaaaccgggaaccgcaacctcatcgggcttatacgtctttgaaggttcctttg cccccttgattggcttgccgccgatatgatacgggcgatgcggatcgtgcgagttgaccataaagtagaagggcttattc tcgcggcgacacctcgccagaaactccttgcagtaaactgtaatagagttccggatcgcggccggcgccgagttccttct ggtcatgcacaaaatcccatttgtaatccgcatggggcgttgagtgccccaccttgccgagaataccggtaagatagccg gcatccctcagcgtctgcatgacagtcatcaccaaggcggcgcccaatcctgcggcccttagaaaatcacgacgattcat cattgtccccactaatccttattgttcttctcaagataccccgacaatttctgcatttgccgatacaggccgccgggaca tatcagtatagccgcaaaccttgaaaatatcaacctcccggaatataacgtcgacttccaacccagatcgccaatccaga ataagaaaacaaagcaaaacgcttcaaattcgtttaaccccagggttcgcctgaggttcgtaaacaccatctcgatgtac atcgggattcaaattcgttgagccccagcccttcttgtggctcttgttcggcaagaaacgctgtaatcaccccacaaatc gggggctgctccagcatcgccaagacgggcaatgccgctttgaggctgtaatcaccccacaaatcgggggctgctccagc tgatttcgagtttcgatgctttcggacagggctgtaatcaccccacaaatcgggggctgctccagcactccttatggaga aggagcttatcgtgtcgctgtaatcaccccacaaatcgggggctgctccagcttattccttccatcatcccgacagcagt gggctgtaatcaccccacaaatcgggggctgctccagcccactttcgtaaccattttactcgcaaacgcttataacgaaa acactttccaaaaaccataccaacgtcctcatttaacaggaaacttccactccttttcaattccatatttcttcataaca tcactaaacaacccaaattcatctatcacaaactttaaatgatgatggaaaaacgctctacgcaccttattcacggcggt cttctccgcctctttacacattgtttgtgccagtatctcacgaaaatcaatataatgcgccccttccttctcgctcatct ttttggctttgacaaccttctcttcaaacgccagcaccgcctcgacacatttcttctgcagatcattatatgccctaaac cctttttcgtaaactgtatgataccgtatcttccctttttcgtgcggcataaagtactcacatatccgcccaagaaactc agcgtcatccaacacatataacttgccgtaatcactcactgagaagacgatgcttttttcgttacccactgagccctcca cgggcaactcgatgctatcattcgaccacacaattttattacccaattccttgcgtacactccccaggaagtattgcgcc atcatcagacacaaacggtctcgcgccagcgtttcatacaaggctggattagcaccctcgaatcgcccaatcgcatcaat atgataatactttttatccagcccaacgtccctctgtccgccgccgctttccaaatgctcttccacaagcttcgcgaatc ccttcttgctgtcataccagaacttcttgcgcaagaaacccctgcggatagaaatatgctccttgaaccatgcaaccttc tgcttgtaatctatttcatccttcttcccaagccccacataatcgtagagcttctgatcgccgattcggcaaagtctgtt gagaatctgatcacacaccacctgatgcatctcgtttattgtggaggtctgcgcaaaaattgaatatacccgcccgtcga ttcgctcggccagttgcaggcgtttcagtcccgcctgaaaattctcaacatccttgccaaccagacacaccagcagccgg ttgtactcgccgggattgaaagacctcgtgcaattttcatttacgtattgaagaatgtcccgcgccttctcgtgaagtgt catctcgttggtcgccgccttcttcttttcccacacccctcgaacatgctttactctgccgtctattctttgcttaaaag ctttcctgccaatcccatgttgctccagcacaaatcgcggcaggaagacgtgattatccttatctgtgaccttcactaca tccagaatgttctccacatgctgccgatacctgtacagttttgcaatcgcatcgtcgccctttccctgaaggctaagcaa tacaaggtatttcaattcgttaagccccatgcgataactccgaggcccggcattcttatcaatcctgacgataacattgt tcttactgatatagtatgactgatcttcgtctttttttgaaaagtcgacaactaccttgcctttggtcctgtgctttttg tgttcgtcgcctgccccggcctcctccctgacaatgtgtcgccgcccgaagcatatctcactgtgttgcgcctccagata atgcagtgcaaactcgatgaacttgtctttatggcgtttcggattcgtcccctcattgtcgtttgctcttttcttgtcgc cctgctctccgtggtagtattcatacgcctccgcagggatgcgtccaagctgcgcgagtatatccctgaaaagcagcacg cgtttgtcccacgccttcgtgaaacgactgtctttcaggcaatacatcgaaagcgccttccgagtcagcttgtactgtcc ttcgtttttcttaagcccacttaccgcaccgtacaaacgatccagcacccgccgttcaacaaagaacgaaacgaaaaaca caacccccgccgtagtgatccggtcgccttcgaacaggctgggaaactcgatgatcacttcagtttcgcgtctcctgcat tcaaagatcgcccgctcatacgccctttccatgattgtccgcaactcatcttctgctgtaaatgtcagacacccgggcga atgtcgatagtgggagaaatagtttcttaacgcctcggccttcgcattggccgcttgtgtgctacacttgatcaaagcgcgtgtatcctcatcgtaccagtcgtgctttgaatacttttcatggcgtaacagcgactcgacaaaaagcccgtcgttctta tctcgattcacaagagccttgttgaaggcaatcgtaaaacaccatttccgagcaccttgatattcatcgatagacaactc tctctttttcgaagtctgctttgacacttgcgccattgagcacctcccattccagattttagtgcgatctttacctcatg cctccacaacactcccagcgccaaacgttgagcaaagcaaaatacgccgcaggcgggctccgtcgaatccgtaatcctaa tttctaacttcccaatcatctaaaccgcccgcaaccgatttgtcaaccaaaaaccacatcaatccgcagatggccgcaga taaccgcagatattgcaactaatccacccaacccaaaacctctgttccatctgcgccctctgcgaaatctgcggacagct ttttttttcgtgcccttcatgtcttcgtggtgaatttcatttaacatttgacaaatatcaaacggcatggtataatgcgt tgcgtatttaaggacaaagcaacaccaaaaacagggggagtaaaaaaccgtgtccatccaaaaagaatcgcaggccgcag gcctgccacctatgattaacctcggtctttcagccaaggatgctccccacacccaaacaagcgaaacgaaccgtgcgcca agctaagctggtgcaattcagcaggtgtaatcctgcccggtcaaaggttagccgcccggccggaatgaacatgtacgtat aaggaggcaacaaat(SEQ ID NO:277)

在Cas13b-t基因座上的更详细的序列和特征显示在图55A-55C中。

Cas13b-t1、Cas13b-t2和Cas13b-t3与其他Cas13b直向同源物的比对显示于图56中。在图56中,序列#6是Cas13b-t1,序列#1是Cas13b-t2,和序列#2是Cas13b-t3。其他序列是Cas13b直向同源物。

Cas 13b-t与来自Alistipes sp.ZOR0009的Cas13b相似(Cas13b4, NCBIaccession WP_047447904)。使用由GenScript合成到用于哺乳动物表达的pcDNA3.1(+)主链中的人密码子优化蛋白(通过GeneArt算法进行密码子优化)。通过两个指导RNA与非靶向对照在HEK293FT中测试了高斯荧光素酶的敲低。RanCas13b(B6)用作阳性对照。将荧光素酶值相对于非靶向对照进行标准化,如果未敲低,值为~1。在此测量中发现了一些噪声,因此某些值略高于1,但在可接受的范围内可归因于噪声。 Cas13b-t1、Cas13b-t2和Cas13b-t3在哺乳动物细胞中的Gluc敲低分别显示在图51-53。表15、16和17分别列出了Cas13b-t1、Cas13b-t2和Cas13b-t3 的指导RNA键。

表15.指导RNA键-Cas13b-t1

表16.指导RNA键-Cas13b-t2

表17.指导RNA键-Cas13b-t3

实施例11

本实施例总结了RESCUE第1-12轮的结果(见图57-68)。测试的额外表型包括PCSK9、Stat3、IRS1和TFEB。PCSK9显示克隆改善了启动子。Stat3显示在位点上的~10%编辑。信号转导的抑制将用荧光素酶报告基因进行测试。对于IRS1,将在转移至前脂肪细胞前测试合成位点的靶向。对于TFEB,可以将靶向设计为引起转录因子->自噬的易位。此外,还将测试一组12个内源性磷酸靶标和48个合成靶标。酵母中的筛选将 V11背景上以S22P继续进行。在V12上为V13筛选顶部命中,并将评估新轮次的酵母命中。将评估荧光素酶上的几百个额外筛选结果,并验证Ade2编辑的特异性筛选。基因混编还将测试针对文库复杂性和不同酵母报道基因进行测试。

实施例12

本实施例列出了与Cas13b-t有关的更多信息和数据。

通过两个指导RNA在HEK293FT细胞中测试了高斯荧光素酶的敲低。RanCas13b(B6)用作阳性对照。荧光素酶值相对于非靶向对照进行标准化。一些值高于1,但在一定范围内可归因于噪声。如果没有敲低,值是约1。死亡形式具有在两个已鉴定的HEPN结构域中均突变为丙氨酸的精氨酸和组氨酸残基两者。

该实验中使用的间隔子序列示于下表18中。

表18

用于Gluc敲低的死的和活的微小直向同源物的比较显示在图69中。

测试了通过RNA编辑来恢复功能性海萤荧光素酶(W85X)的能力。

错配距离表示从正向重复序列的5'端到规定期望编辑位点的A:C错配的距离。除非另有说明,间隔子序列均为30bp。B6间隔子是30bp,错配距离为22。REPAIRv1、v2间隔子是50bp,错配距离为34(如公布的)。该微小直向同源物构建了 HIVNES-GS-dRanCas13bt-(GGS)2-huADAR2dd(E488Q)。

阳性对照构建体如下:

B6构建体: HIVNES-GS-dRanCas13b(B6)-(GGS)2-huADAR2dd(E488Q)

REPAIRv1构建体: dPspCas13b(B12)-GS-HIVNES-GS-huADAR2dd(E488Q)

REPAIRv2构建体: dPspCas13b(B12)-GS-HIVNES-GS-huADAR2dd(E488Q/T375G)

关于Cas13b-t1的数据显示于图70中,关于Cas13b-t3的数据显示于图71中。指导序列、非靶向比较显示于图72中。可以进行全转录组测序以进行详细的特异性和活性分析。

实施例13

可编程RNA编辑提供了基因组编辑的替代方法,具有安全性和靶向灵活性的优点。利用VI型可编程RNA指导RNase CRISPR-Cas13进行 RNA编辑的方法,通过将融合的ADAR2的腺苷脱氨酶活性引导至目标转录物,允许腺苷向肌苷的特异性转化。在此,申请人通过直接使ADAR2 进化为具有胞苷脱氨酶活性,将RNA编辑能力扩展到额外的碱基转化,催化活性提高1000倍以上。该系统称为"用于特异性C至U交换的RNA 编辑(RESCUE)",缺乏严格的序列约束,以高效率编辑内源性转录,并执行C到U和A到I的多重编辑。申请人进行了额外的合理诱变以产生RESCUE的高度特异性变体,其中A至I脱靶降低10倍以上,其保留了有效的C至U中靶活性。申请人在本文中显示了RESCUE改变细胞中磷酸化信号传导通路并调节STAT激活和细胞生长的能力。RESCUE 通过使得能够校正额外突变并调节更多的蛋白质残基,扩展了RNA编辑工具箱,可广泛应用于生物医学研究和治疗。

细胞中的核酸的可编程修饰在基础研究和治疗中,尤其是在遗传疾病的治疗中,具有许多应用。随着基于CRISPR核酸酶的工具的开发,包括Cas9和Cpf1/Cas12a,DNA编辑(通常通过双链断裂(DSB)的生成来刺激内源性DNA修复通路,例如非同源末端结合(NHEJ)或同源定向修复(HDR))已变得广泛可用。但是,特定编辑的引入(包括单个碱基变化)依赖于HDR并且在许多细胞型中效率低下。此外,脱靶切割或DNA损伤反应的可能性带来潜在的安全风险。规避DSB形成的 DNA编辑(例如碱基编辑)提供了可行的替代方式,尽管它们可受到测序约束的限制,例如在期望编辑位点附近对原型间隔子邻近基序(PAM) 的要求,并且有显著的脱靶。但是,通过RNA碱基编辑来暂时控制核酸编辑避免了这些问题中的许多,并有许多应用,包括细胞信号传导、蛋白质稳定性或其他翻译后修饰残基的调节。

RNA碱基编辑为DNA碱基编辑器提供了一种替代方法,其利用作用于酶的RNA(ADAR)家族的腺苷脱氨酶使腺苷发生特异性水解脱氨基化为肌苷,肌苷在翻译和剪切方面功能等同于鸟苷。已经开发了多种 RNA编辑技术,其将ADAR或高活性变体的活性引导至靶标转录物,包括用于可编程A至I(G)替换的RNA编辑(REPAIR),其使用RNA 指导的、RNA靶向的CRISPR酶Cas13。尽管这些技术可以有效地将A 转换为I(G),但其他碱基变化仍然难以获得,从而阻止了编辑与翻译后修饰相关的多样化疾病相关突变和功能残基。通过水解脱氨基化活性进行的胞苷到尿苷的编辑将打开靶向空间并提供多种新型的残基变化。但是,许多胞苷脱氨酶,例如载脂蛋白B mRNA编辑酶,催化多肽样(APOBEC)酶家族,仅可在单链底物上操作,并且将在APOBEC结合位点附近使胞嘧啶中的许多脱氨基。

在此,申请人利用腺苷脱氨酶ADAR2的特征。使用ADAR2,REPAIR 允许通过使用指导RNA形成双链RNA底物来进行精确编辑,其将人 ADAR2催化脱氨酶结构域(ADAR2dd[E488Q])活性的高活性突变体引导至通过引入的错配选择的单个腺苷。申请人进行了用于胞苷脱氨基化的ADAR2dd的进化,以将这种精确度水平赋予胞苷碱基转化。申请人使用组合的合理诱变和定向进化方案来将ADAR2dd的胞苷脱氨基化活性迭代地提高超过1000倍。融合至来自鸭疫里默氏菌(Rimerella anatipestifer)的Cas13b直向同源物(RanCas13b)的该突变体ADAR2dd 允许对哺乳动物细胞中的报告基因和内源转录物两者进行用于特异性C至U交换的RNA编辑(RESCUE)。最后,申请人通过合理诱变将RESCUE 的特异性提高了10倍以上,并展示了通过用RESCUE进行的C至U编辑而进行的蛋白质信号传导和细胞生长的表型调节。

为了产生能够产生可编程C至U修饰的Cas13b指导核苷脱氨酶,申请人对RanCas13b-ADAR2dd融合开始了一系列工程化步骤(图 73A-73G)。通过在涉及靶向碱基的结合的残基处的饱和诱变来选择初始突变。评价突变体的C至U编辑和高斯荧光素酶(Gluc)突变体(C82R) 催化活性的恢复(图77A)。三轮合理工程化产生了对TCG基序具有~15%编辑的构建体(RESCUEv3)(图73B)。由于周围的基序强烈决定了A 至I编辑的RNA编辑效率,因此申请人测试了荧光素酶突变体的活性的恢复,该突变体具有在Gluc C82R位点的所有四个可能的5’碱基和在 Gluc L77P突变处的两个3’基序(图77B),发现与这些其他基序的活性的适度增加。为了加快进一步的改进,申请人开始了在ADAR2dd蛋白中的定向进化以确定额外候选突变用于增加RESCUE的活性。

为了针对C至U活性进行选择,申请人基于GFP荧光的恢复或HIS 营养缺陷型选择基因的原养型逆转设计了一套酵母报告基因测定法(图73A,有关所有筛选和所得突变请参见表19)。使用类似的方法,也可以进行作用于RNA(CDAR)的胞苷脱氨酶的定向进化。

表19

对分别用于GFP和His还原的FACS分类培养物或存活菌落进行测序,选择ADAR2dd结构域中的单个突变,将其引入先前RESCUE版本并评估荧光素酶或CTNNB1编辑报告基因构建体在哺乳动物细胞中的活性。这些轮次的进化以最终构建体RESCUEv16告终,导致所测试的所有六个基序中活性的稳定增加并降低了编辑和恢复荧光素酶活性所需的 RESCUE和指导质粒剂量(图73C、73D、78、79A-79B、80)。另外, RESCUEv16在直接5’和3’碱基的16种可能基序组合中的12种上实现了超过20%的编辑,并且具有最佳的C或U碱基翻转(图73E和81)。申请人比较了我们的RESCUE版本与PspCas13b和RanCas13b的融合,发现它们具有同等的活性(图82)。当REPAIR使用50nt的指导序列时, RESCUEv16用30nt的指导RNA最优地编辑了TCG构建体,该指导RNA 具有从靶标的5’端起的靶向碱基翻转26碱基对(图83)。

为了验证来自酵母系统中定向进化管线的改进,申请人测试了多个 RESCUE迭代的酵母中活性和生化活性两者。在酵母中检测EGFP和His 恢复两者,申请人发现RESCUE的最近版本在这两个靶标上都更有效地执行C至U编辑(图84A-84D)。将RESCUE构建体引入纯化的hADAR2dd 蛋白中的生化表征揭示了RESCUE突变改善了在体外底物上C到U编辑的动力学(图85A-85B)。

此外,申请人在不存在Cas13b构建体的情况下测定了C至U活性。申请人将RESCUEv16突变引入到ADAR2脱氨酶结构域或全长ADAR2 蛋白两者中。申请人发现,与ADARdd、全长ADAR或不存在蛋白时相比,对于完整的RESCUEv16构建体,荧光素酶活性的编辑和恢复在所有5’基序上均显著更高(图73F和86A),而且,尽管某些指导位置在使用全长ADAR时实现几乎20%的编辑(图86B-86D),与RESCUE相比最大效率明显降低,这证明RanCas13b融合对于其功能是必需的。 RESCUEv16中16个突变的位置使它们位于ADAR2dd的整个结构中(图 73G),指示引入的残基与催化口袋的直接相互作用以及远距离变构效应两者。

随着RESCUE进化以对报告基因构建体具有活性,申请人评估了 RESCUE可以在HEK293FT细胞中对内源转录物发挥多大的作用。申请人测试了一组具有可变错配位置的指导RNA,其靶向9个基因中的24 个不同位点(图74A和87A-87C),尤其选择这些基因中的位点以具有不同的5’碱基身份以询问不同基序上的脱氨基化活性。申请人发现,在所有测试的位点,RESCUEv16实现了在~5%-35%之间的编辑率,并且理想的错配位置或碱基翻转是位点相关性的。此外,RESCUEv16在多个内源位点上的性能均优于所有其他版本,并且需要比早期版本更少的剂量 (图74B和88)。为了更好地评估RESCUEv16与治疗的相关性,申请人设计了一系列22个200bp的靶标,以对来自ClinVar的疾病相关突变进行模型编辑(参见表20)。

表20:疾病相关突变的疾病信息

RESCUEv16能够以~1%-42%的效率编辑这些位点(图74C和89)。申请人进一步测试了在ApoE4等位基因上的治疗应用,其使阿尔兹海默病的ris10倍升高约10倍,并涉及到两个胞嘧啶单核苷酸多态性,其需要转化为胸腺嘧啶以产生保护性ApoE2等位基因。申请人在来自ApoE4 等位基因的表达合成片段上测试了RESCUEv16,并发现该系统在两个位点上实现了约5%和12%的编辑(图90)。

由于RESCUEv16保留了腺苷脱氨酶活性,因此Cas13b的天然前 crRNA加工活性使多重腺嘌呤和胞嘧啶脱氨基化成为可能。通过在相同的CTNNB1转录物中递送RESCUEv16以及靶向腺嘌呤和胞嘧啶的前 crRNA(图74D),申请人发现RESCUEv16能够编辑同一群体中的靶向残基两者,分别以~15%和5%的速率将腺嘌呤转化为肌苷和将胞嘧啶转化为尿苷(图74E)。此外,申请人发现当编辑Gluc和内源基因时,在指导双链体内发生了被靶向的胞嘧啶附近A至I脱靶(图91A-91C)。为了消除这些脱靶,申请人在脱靶腺苷对面的指导序列中引入了不利的鸟嘌呤错配(图74F)。这种方法显著减少了Gluc和KRAS两者上的脱靶编辑,同时最小程度地干扰中靶编辑(图74G)。

在指导双链体窗口中观察到的A至I脱靶表明RESCUEv16可能在整个转录组中具有明显的脱靶腺苷脱氨酶活性。使用全转录组RNA测序分析脱靶,申请人发现尽管RESCUEv16在Gluc转录物上有约80%的C 至U编辑(图75A),其因此具有188C至U脱靶和1695A至I脱靶,与REPAIRv1的A至I脱靶是可比较的,其具有24C至U脱靶和2214A 至I脱靶(图75A、75B)。为了提高RESCUEv16的特异性,申请人在与RNA靶标相互作用的残基处进行了合理诱变(图75C),从而产生具有如通过荧光素酶报告基因测试的降低的A至I脱靶活性和高C至U中靶脱氨基化活性的多个RESCUEv16突变体(图75D)。RESCUEv16上的最高特异性突变体S375A(RESCUEv16S)保持约76%中靶C至U编辑(图75E),但仅有103C至U脱靶和139A至I脱靶,腺嘌呤脱氨基化脱靶的数量减少约10倍(图75E、75F)。尽管RESCUEv16S的脱靶编辑减少,但它仍保持了显著的中靶A至I编辑活性(图92A-92D)。申请人重新评估了RESCUEv16S在前一组内源位点上的效力,发现它在许多位点处保留了与RESCUEv16类似的活性,在大量位点上处表现优于RESCUEv16(图93A-93C和94A)。此外,在指导双链体窗口内, RESCUEv16S特异性高得多,显著减少了在许多局部脱靶位点处的编辑(图93C、94B-94E)。

RESCUEv16的胞苷和腺苷脱氨基化活性允许通过错义突变来调节翻译后修饰,例如磷酸化底物丝氨酸和酪氨酸。STAT3和STAT1是转录因子,其在通过JAK/STAT通路进行信号转导中起重要作用,并通常被细胞因子和生长因子激活。为了展示通过RNA编辑进行的信号传导调节,申请人通过使用RESCUEv16编辑STAT3上的磷酸化位点Y705和 S727以及STAT1上的Y701和S727来改变STAT通路的激活(图76A)。在HEK293FT细胞中,申请人分别观察到Y705和S727 STAT3位点的 8%和9%编辑,以及Y701和S727 STAT1位点的11%和7%的编辑(图 76B)。使用针对STAT激活的荧光素酶报告基因,这些编辑导致STAT3 和STAT1活性的16%-27%抑制(图76C)。

如同JAK/STAT通路,Wnt通路可以通过组成蛋白(最有名的是β- 连环蛋白)的磷酸化来调节。β-连环蛋白上的磷酸化残基,例如S33和 S37,促进泛素化和降解。Wnt信号传导阻断残基磷酸化并稳定β-连环蛋白,从而允许该蛋白与转录因子(如LEF和TCF1/2/3)接合,从而促进靶基因的表达,并导致细胞增殖增加。申请人测试了一组针对已知参与β-连环蛋白的磷酸化的残基的指导序列,并发现编辑水平在5%-28%之间 (图76F),从而导致如通过TCF/LEF依赖性荧光素酶报告基因测量的,β-连环蛋白的至多5倍激活(图76G)。相应地,用靶向磷酸化位点的 RESCUEv16转染的细胞在最激活β-连环蛋白的条件下(靶向T41I转化) 导致细胞生长增加40%(图76H)。

RESCUEv16是一种可编程的碱基编辑工具,其能够将RNA中的胞苷精确转化为尿苷。使用定向进化,申请人证明了腺苷脱氨酶可以被放宽以接受其他碱基,从而产生一种新型胞苷脱氨基化机制,该机制可以通过碱基翻转来编辑双链RNA。申请人已经能够将ADAR2dd的胞苷脱氨酶活性提高1000倍,从而导致对内源转录物高达40%的编辑。可以进行进一步的进化轮次以进一步增强活性。RESCUE的胞苷脱氨基化活性的更大可靶向氨基酸空间增加了翻译后修饰(如磷酸化、糖基化和甲基化位点)的可能调节以及更好地靶向常见催化残基(图95A-95B)。此外,胞苷脱氨基化活性允许通过RNA编辑和产生保护性等位基因(例如 ApoE2)来扩展与疾病相关突变的靶向性。总而言之,RESCUE扩展了具有新碱基编辑功能的RNA靶向工具包,从而允许更好地建模和治疗遗传疾病。

RESCUE v16S能够有效编辑内源基因(图96)。RESCUE v16S保持了一些A至I活性(图97)。RESCUE v16被用于靶向STAT以减少 INFα/IL6诱导(图98)。RESCUE靶向诱导细胞生长(图99A-99B)。

材料与方法

为了在酵母中表达dRanCas13b-hADAR2dd构建体,通过修饰 pML104(Addgene#67638)将该融合蛋白克隆到pRSII426主链中pGAL 启动子的下游。为了提高表达,在融合蛋白之间克隆GS接头,并针对酵母对ADAR2dd进行了密码子优化。通过Gibson克隆引入与RESCUE 迭代相对应的额外密码子突变。

对用于测试酵母中活性的靶向质粒进行工程化以用于荧光筛选 (GFP)和营养缺陷选择筛选(His)两者。将所有靶向质粒克隆到 pYES3/CT主链(Thermo Scientific)中。所有质粒包含用于RESCUE的 RanCas13b指导盒,其表达由ADH1启动子驱动,以及侧接HH和HDV核酶的间隔子和DR序列[cite ng and dean]。克隆了间隔子被金门位点取代的构建体以便利模块指导序列克隆。

为了生成C至U RNA编辑活性的GFP指示剂,将Y66H绿色至蓝色突变引入由TEF启动子驱动的酵母密码子优化的EGFP(yeGFP)中。成功的C至U RNA编辑恢复该构建体的绿色荧光。通过测试HIS3中的保守残基当突变为可通过RNA编辑来挽救的残基时的活性丧失来生成用于C至U编辑的His报告基因。将生成失活HIS3的突变在其天然HIS3 启动子下克隆到pYES3/CT主链中的HIS3基因中。

为了生成用于在酵母系统中筛选突变的诱变文库,使用Genemorph II (AgilentTechnologies)对hADAR2脱氨酶结构域进行了突变,用于通过2倍稀释系列,差异在于74ng-9.4μg的模板输入的8个50mL反应的易错PCR。扩增后,将反应物合并,在去离子水中以1:4稀释,并加载到含有溴化乙锭的2%凝胶中。使用MinElute PCR纯化试剂盒(Qiagen) 纯化提取的样品,然后在37℃下用Dpn1(Thermo Fisher Scientific)处理 2h以去除残留的模板质粒,然后进行凝胶和MinElute纯化。

通过用KflI、RruI和Eco72I(Thermo Fisher Scientific)消化7μg模板质粒1小时来生成主链。用MinElute PCR纯化试剂盒对消化物进行凝胶纯化,并在30μL的预加温水中洗脱。

使用Gibson Assembly(New England Biosciences)连接经纯化的PCR 插入序列和经消化的主链,具体而言,将456ng PCR插入序列和800ng 主链消化物在80μL Gibson反应中运行1小时。用异丙醇沉淀将产物浓缩,重悬于12μL TE-EF再溶解缓冲液(Macherey-Nagel)中,并在300 r.p.m振荡的同时加热至50℃5分钟。将50μL Endura电感受态细胞(Lucigen)在冰上解冻10分钟,然后加入2μL重悬的Gibson产物。遵循最佳Endura设置(1.0mm吸收池、10μF、600欧姆和1800伏),使用GenePulser Xcell(Bio-Rad)对混合物进行电穿孔。将来自每个电穿孔的样品回收到1mL的回收培养基(Lucigen)中,并在37℃下孵育1小时同时在300r.p.m摇动。每个诱变文库进行两次电穿孔。将回收的培养物铺板在大型预加温100μg/mL氨苄青霉素板上。制备系列稀释物以测定每个文库的c.f.u.。将板在37℃下孵育16小时,并使用Nucleobond Xtra Maxi Kit(Macherey-Nagel)收获。

如前所述进行大规模酵母转化。简而言之,将含有Y66H EGFP或 HIS3报告质粒的群落放入300mL-Trp 2%葡萄糖选择培养基中并在30℃生长过夜。生长后,测定细胞的OD600,并将2.5e9细胞加入到500mL 预加温2×YPAD中,并在30℃孵育4小时。洗涤细胞沉淀多次,然后重悬于36mL转化混合物中,该混合物包含24mL PEG 3350(50%w/v)、 3.6mL的1.0M乙酸锂、5mL的2.0mg/mL的变性单链载体鲑鱼精子DNA (ThermoFisher Scientific)、2.9mL水、和500μL的1μg/μL质粒文库。在42℃下孵育60分钟后,将细胞沉淀重悬于750mL的-Ura/-Trp 2%葡萄糖选择培养基中,并生长过夜直至培养物达到OD600为5-6。此时,将6mL的培养物接种到250mL的2%棉子糖-Ura/-Trp选择培养基并孵育直至OD600为0.5-1。加入27mL的30%半乳糖来诱导培养物,并在 30℃下孵育过夜12-14小时。然后对细胞进行细胞分选或铺板到选择板上,如下所述。

诱导后,通过与阴性非诱导和非靶向指导序列对照相比,对EGFP 荧光进行门控,在SH800S细胞分选仪上对细胞进行分选。在将1亿个细胞分选到2%葡萄糖-Ura/-Trp选择培养基中后,申请人将分选的细胞孵育过夜,然后在其OD600为5-6时将其接种到2%棉子糖-Ura/-Trp选择培养基中。然后当OD600在0.5-1之间时诱导细胞,并孵育过夜12-14 小时,然后再次分选。进行分选直至分选了1-2千万个细胞。迭代生长和分选又重复了2-3次,分选细胞的每次迭代均收集质粒并通过Ilumina NextSeq下一代测序进行测序以确定突变体在每一轮选择中的存在。单独订购最富集的突变体,并按如下所述进行克隆用于哺乳动物验证测试。

诱导后,将细胞文库铺板在2%棉子糖/3%半乳糖-Ura/-Trp/-His选择板上。随着群落生长,将它们挑到水中并在2%棉子糖/3%半乳糖 -Ura/-Trp/-His选择板上划线。条纹生长过夜后,对每个条纹进行菌落PCR 并对ADAR2催化结构域以及His基因进行桑格测序以检查重组和DNA 诱变。单独订购突变并按如下所述进行克隆用于哺乳动物验证测试。

通过在HEPN结构域的催化位点处的组氨酸至丙氨酸和精氨酸至丙氨酸突变(R142A/H147A/R1039A/H1044A)使RanCas13b催化失活 (dRanCas13b)。合成脱氨酶结构域和ADAR2并进行PCR扩增以Gibson 克隆到pcDNA-CMV载体主链中,并通过GS-mapkNES-GS(GSSLQKKLEELELGS(SEQ ID NO:309))接头在C端处与dRanCas13b 融合。将用于改变胞嘧啶脱氨基化活性或特异性的ADAR2脱氨酶结构域中的突变通过Gibson克隆引入到dRanCas13b-GS-mapkNES-GS-ADAR2dd主链中。表25列出了ADAR2dd 中引入的所有用于进化C至U编辑的突变。

为了在不同Cas13b直向同源物之间进行比较,通过Gibson克隆到 REPAIR构建体dPspCas13b-GS-HIVNES-GS-ADAR2dd上,在dRanCas13b 主链上测试的突变被转移至dPspCas13b融合载体。为了单独测试不含 dRanCas13b的ADAR2dd和全长ADAR2,申请人使用Gibson克隆将所有突变加入到具有ADAR2dd或全长ADAR2的pcDNA-CMV载体主链上,之前已克隆以测试REPAIR。

通过筛选先前报道的荧光素酶报告质粒中Gluc中的潜在突变,生成了用于测量C至U RNA编辑活性的荧光素酶报道载体。该报道载体将功能性Cluc表达为标准化对照,但是由于添加了突变体(C82R或L77P) 而导致了缺陷型Gluc。为了测试RESCUE编辑基序偏好,申请人克隆了 Gluc的密码子82(AAX CXC)处的胞嘧啶周围的每个可能基序。从M50 Super 8xTOPFlash(Addgene#12456)和M50 Super 8x FOPFlash(Addgene #12457)生成了用于测试CTNNB1编辑效率的分泌的荧光素酶报道载体。通过Gibson克隆,在TCF/LEF应答元件(TOPFlash)或模拟结合位点 (TOPFlash)的控制下,将最初的萤火虫荧光素酶替换为分泌型高斯荧光素酶。克隆进了由CMV启动子驱动表达的额外的海萤荧光素酶充当转染对照。表22列出了所有的哺乳动物质粒。

选择表现与RESCUE的现有版本表现相当或更好的突变,用于在6 个荧光素酶报告基因的整个组上进行筛选。对于RESCUE v4至v10的选择,首先在TCG基序上筛选候选突变;使用GCG基序作为初筛分离了 RESCUE v11。使用对内源性CTNNB1的T41I残基的编辑进行的初筛,在哺乳动物细胞中验证了RESCUE v12至v14的选择,导致β-连环蛋白通路激活(其用通路活性的发光报告基因进行了谱分析),以及通过对 Gluc的L77P CCT基序的活性选择了RESCUE v15和v16。表25列出了用于产生它们的所有轮次和酵母筛选。

为了产生用于测试REPAIR活性的疾病相关突变,选择了ClinVar 中定义的与疾病发病机理相关的23个U>C突变(独立性地分组为一组 22个基因和ApoE)。从Integrated DNATechnologies订购了选择的靶标作为突变位点周围200-bp的区域,并在Ef1α启动子下克隆到mScarlet 的下游。

为了表达用于RESCUE的哺乳动物指导RNA,使用先前描述的具有前面是在U6表达下的金门受体位点的RanCas13b正向重复序列的构建体。通过金门克隆将各个指导序列克隆到该表达主链中。为了确定用于选择位点的最佳指导序列,测试了C和U翻转两者,以及在最常见的最佳指导序列范围(错配距离为~24)附近的平铺指导序列。

表21-26列出了用于RESCUE试验的指导序列、所有酵母质粒以及在酵母实验中使用的所有靶向指导序列。

表21:用于荧光素酶编辑的指导序列

表22:用于内源基因编辑的指导序列

表23:用于合成靶标编辑的指导序列

表24:哺乳动物质粒和图谱

表25:酵母质粒和图谱

表26:用于酵母靶向的指导序列

除非另有说明,否则哺乳动物细胞培养实验在HEK293FT细胞系 (American TypeCulture Collection(ATCC))中进行,在含有葡萄糖、丙酮酸钠和GlutaMAX(Thermo FisherScientific),并补充有1×青霉素-链霉素(Thermo Fisher Scientific)和10%胎牛血清(VWR Seradigm)的Dulbecco 改良Eagle培养基中生长。细胞保持在低于80%的汇合度。

除非另有说明,否则所有转染均用Lipofectamine 2000(Thermo FisherScientific)在涂覆聚D-赖氨酸(BD Biocoat)的96孔板上进行。转染前 16小时,将细胞以约20,000个细胞/孔铺板以确保转染时达到90%的融合度。对于板上的每个孔,将转染质粒与Opti-MEM I还原血清培养基 (Thermo Fisher)混合至总计25μl。分别地将24.5μl的Opti-MEM与 0.5μl的Lipofectamine 2000混合。然后将质粒和脂质体转染溶液合并并孵育5分钟,然后将它们移液到细胞上。

为了评估哺乳动物细胞中的RESCUE活性,申请人转染了150ng RESCUE载体、300ng指导序列表达质粒,和当使用报告基因时(荧光素酶、STAT活性或β连环蛋白活性)的40ngRNA编辑报告基因。48 小时后,从细胞中收获RNA并使用先前所述的方法(33)用基因特异性逆转录引物进行逆转录。然后使用NEBNext High-Fidelity 2X PCR Master Mix(NewEngland Biolabs)将提取的cDNA进行两轮PCR,以添加Illumina 接头和样品条码。然后将文库在Illumina NextSeq或MiSeq上进行下一代测序。然后在测序窗口内在所有腺苷处评估RNA编辑率。

在靶向荧光素酶报告基因用于RNA编辑的实验中,申请人还在RNA 收获之前收获具有分泌的荧光素酶的培养基。申请人在具有注射方案的读板仪(Biotek Synergy Neo2)上使用海萤和高斯荧光素酶测定试剂盒 (Targeting Systems)测量了荧光素酶活性。进行的所有重复都是生物学重复。

在RESCUE质粒的输入量发生变化的实验中,除非另有说明,否则通过用表达CMV驱动的mScarlet的填充质粒替换RESCUE表达质粒,使质粒的总量保持恒定。在指导质粒的输入量发生变化的实验中,通过非靶向指导序列的替换使质粒总量保持恒定(“具有填充质粒”),或不保持恒定(“不具有填充质粒”);在该实验中,没有用于RESCUE质粒的填充质粒。

为了评估包含RESCUE突变的hADAR2脱氨酶结构域的动力学活性,将多次迭代克隆到包含URA3基因的 pGAL-His6-TwinStrep-SUMO-hADAR2dd主链中。将该质粒转化到BCY123感受态酵母细胞中。简而言之,将冷冻细胞在37℃水浴中解冻 15-30秒。将每种条件下的10μL细胞在微量离心机中以13,000g离心2 分钟,然后去除上清液。对每个构建体制备的转化混合物包含以50%w/ v制备的260μL PEG 3350、50μL变性鲑鱼精子(Thermo FisherScientific)、36μL 1M乙酸锂和14μL DI H2O中的750ng质粒。将酵母沉淀物用转化混合物重悬,并在42℃水浴中温育30分钟,然后以13,000g 离心30秒,然后去除上清液。然后将沉淀重悬于1mL DI H2O中,并取 50μL与1mL DI H2O混合。随后,将200μL铺板到减去尿嘧啶的基本葡萄糖平板上进行原养型选择。

将平板在30℃下孵育48小时,然后将单个菌落接种到10mL的补充有右旋糖的酵母基本培养基中。这包含酵母脱落补充剂Y2001(1.39 g/L)、不含氨基酸的酵母氮基础(6.7g/L)、腺嘌呤半硫酸盐(0.022g /L)、组氨酸(0.076g/L)、亮氨酸(0.38g/L)、色氨酸(0.076g/L) 和右旋糖(20g/L)。培养物生长过夜,然后将全部10mL接种到100mL 基本培养基/右旋糖培养物中。生长8小时后,将每种构建体接种到两个 2L烧瓶中,其中含有补充有20g棉子糖(VWR)的1L基本培养基。将这些生长过夜,并在收获前用100mL的30%半乳糖诱导8小时。将培养物在Beckman Coulter Avanti J-E离心机上以6,000r.p.m旋下20分钟,并将沉淀物保存在-80℃下。

纯化方法

为了分析整个转录组中的脱靶RNA编辑位点,申请人使用RNeasy Plus Miniprep试剂盒(Oiagen)从转染后48小时的细胞中收获总RNA。然后使用NEBNext Poly(A)mRNA磁性分离模块(NEB)富集mRNA级分,然后使用NEBNext Ultra RNA Library Prep Kit forIllumina(NEB)制备此RNA用于测序。然后将文库在Illumina NextSeq上测序并加载,使得每个样品有至少500万个读取结果。

使用自定义工作流程: portal.firecloud.org/#methods/m/rna_editing_final_workflow/rna_editing_fin al_workflow/1,在FireCloud计算框架(software.broadinstitute.org/firecloud/)上进行全转录组编辑RNA测序数据的分析。为了进行分析,除非另有说明,否则序列文件被随机降采样至500万个读取结果。使用添加了Gluc和Cluc序列的RefSeq GRCh38 组件生成了索引,并使用Bowtie/RSEM版本1.3.0对读取结果进行比对和定量。然后使用REDitools(35,36)对比对BAM进行RNA编辑位点的分选和分析,参数如下:-t 8-e-d-l-U[AG或TC或CT或者GA]-p-u -m20-T6-0-W-v 1-n 0.0。在未转染或EGFP转染的条件下发现的任何重要编辑均视为SNP或转染伪影,并从脱靶分析中滤除。如果通过 Benjamini Hochberg校正进行的多个假设校正后,Fisher精密检验得出小于0.05的p值,并且3个生物学重复中至少有2个识别了该编辑位点,则认为脱靶是显著的。相对于最大可能重叠,计算样品之间的编辑的重叠,相当于两个样本之间的编辑的较少次数。重叠编辑位点的百分比计算为共享编辑位点的数量除以两个样品的最小编辑数量再乘以100。使用Kaviar(37)方法对已知SNP位置进行额外一层过滤以识别SNP。

差异基因表达分析

如上所述使用lipofectamine 2000,用RESCUE质粒、靶向STAT3 和STAT1上的残基的指导质粒、以及用于STAT3(Qiagen Cignal STAT3 Reporter)和STAT1信号传导(QiagenCignal GAS Reporter)的荧光素酶报告基因转染细胞,并孵育48小时。48小时后,使用Dual-Glo荧光素酶测定法(Promega)来测量细胞中的萤火虫和海肾荧光素酶活性。将萤火虫信号相对于海肾信号进行标准化以测量STAT3和STAT1的相对激活。

转染前24小时将细胞铺板在含有防止细胞在孔中心生长的核的细胞迁移板上。24小时后,如上所述使用lipofectamine 2000,用RESCUE质粒、靶向β-连环蛋白上的残基的指导质粒、以及用于β-连环蛋白激活的荧光素酶报告基因(Qiagen TCF/LEF CignalReporter)转染细胞并孵育。 24小时后,去除中心核以允许细胞向孔中心生长。再孵育24小时后,测定培养基的Gluc和Cluc荧光素酶信号。计算Gluc与Cluc的相对比率,以确定条件之间的相对β连环蛋白激活。在第3天,将细胞与CellTracker Green CMFDA Dye(ThermoFisher Scientific)一起孵育10分钟,然后用培养基洗涤。每天使用荧光对细胞成像以测量细胞生长。使用ImageJ软件通过计算中心生长区域中荧光的总面积来测量细胞向孔中心区域中的生长。使用自动宏通过以下命令处理图像:

//ImageJ macro for calculating cellular area

run("8-bit");

run("Auto Local Threshold","method=Bernsen radius=15 parameter_1=0parameter_2=0white");

setAutoThreshold("Default dark");

run("Measure");

1.S.Shmakov等,Discovery and Functional Characterization of DiverseClass 2CRISPR-Cas Systems.Mol Cell 60,385-397(2015).

2.S.Shmakov等,Diversity and evolution of class 2CRISPR-Cassystems.Nat Rev Microbiol 15,169-182(2017).

3.A.A.Smargon等,Cas13b Is a Type VI-B CRISPR-Associated RNA-GuidedRNase Differentially Regulated by Accessory Proteins Csx27 and Csx28.Mol Cell65,618-630e617(2017).

4.O.O.Abudayyeh等,C2c2 is a single-component programmable RNA-guidedRNA-targeting CRISPR effector.Science 353,aaf5573(2016).

5.S.Konermann等,Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors.Cell 173,665-676e614(2018).

6.W.X.Yan等,Cas13d Is a Compact RNA-Targeting Type VI CRISPR EffectorPositively Modulated by a WYL-Domain-Containing Accessory Protein.Mol Cell70,327-339e325(2018).

7.A.East-Seletsky等,Two distinct RNase activities of CRISPR-C2c2enable guide-RNA processing and RNA detection.Nature 538,270-273 (2016).

8.J.S.Gootenberg等,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017).

9.O.O.Abudayyeh等,RNA targeting with CRISPR-Cas13.Nature 550,280-284(2017).

10.A.East-Seletsky,M.R.O'Connell,D.Burstein,G.J.Knott,J.A. Doudna,RNATargeting by Functionally Orthogonal Type VI-A CRISPR-Cas Enzymes.Mol Cell66,373-383e373(2017).

11.D.B.T.Cox et al.,RNA editing with CRISPR-Cas13.Science 358, 1019-1027(2017).

12.J.S.Gootenberg等,Multiplexed and portable nucleic acid detectionplatform with Cas13,Cas12a,and Csm6.Science 360,439-444(2018).

13.H.Nishimasu等,Crystal structure of Cas9 in complex with guide RNAand target DNA.Cell 156,935-949(2014).

14.T.Yamano等,Crystal Structure of Cpf1 in Complex with Guide RNA andTarget DNA.Cell 165,949-962(2016).

15.L.Holm,L.M.Laakso,Dali server update.Nucleic Acids Res 44, W351-355(2016).

16.H.Yang,P.Gao,K.R.Rajashankar,D.J.Patel,PAM-Dependent Target DNARecognition and Cleavage by C2c1 CRISPR-Cas Endonuclease. Cell 167,1814-1828e1812(2016).

17.L.Liu等,Two Distant Catalytic Sites Are Responsible for C2c2 RNaseActivities.Cell 168,121-134e112(2017).

18.L.Liu等,The Molecular Architecture for RNA-Guided RNA Cleavage byCas13a.Cell 170,714-726e710(2017).

19.G.J.Knott等,Guide-bound structures of an RNA-targeting A-cleavingCRISPR-Cas13a enzyme.Nat Struct Mol Biol 24,825-833(2017).

20.N.F.Sheppard,C.V.Glover,3rd,R.M.Terns,M.P.Terns,The CRISPR-associated Csx1 protein of Pyrococcus furiosus is an adenosine-specificendoribonuclease.RNA 22,216-224(2016).

21.Z.Wu,H.Yang,P.Colosi,Effect of genome size on AAV vectorpackaging.Mol Ther 18,80-86(2010).

22.X.J.Lu,H.J.Bussemaker,W.K.Olson,DSSR:an integrated software toolfor dissecting the spatial structure of RNA.Nucleic Acids Res 43,e142(2015).

23.I.Fonfara,H.Richter,M.Bratovic,A.Le Rhun,E.Charpentier,The CRISPR-associated DNA-cleaving enzyme Cpf1 also processes precursor CRISPRRNA.Nature 532,517-521(2016).

24.D.Milburn,R.A.Laskowski,J.M.Thornton,Sequences annotated bystructure:a tool to facilitate the use of structural information in sequenceanalysis.Protein Eng 11,855-859(1998).

25.I.M.Slaymaker et al.,Rationally engineered Cas9 nucleases withimproved specificity.Science 351,84-88(2016).

26.L.Gao等,Engineered Cpf1 variants with altered PAM specificities.Nat Biotechnol 35,789-792(2017).

实施例14-腺嘌呤脱氨酶ADAR2到胞嘧啶脱氨酶的转化用于可编程 RNA编辑

可编程RNA编辑可以实现RNA信息的可逆编码用于研究和疾病治疗。在此,本实施例通过将ADAR2定向进化为胞苷脱氨酶,显示了C 至U RNA编辑器,称为“用于特异性C至U交换的RNA编辑(RESCUE)”。 RESCUE使通过RNA编辑可靶向的致病突变的数量翻倍,并使得能够调节与磷酸化信号传导相关的残基(例如苏氨酸和丝氨酸)。申请人应用RESCUE来驱动β-连环蛋白激活和细胞生长。此外,RESCUE保留了A 至I编辑活性,通过使用定制的指导RNA使得能够进行C至U和A至I 多重编辑。

总而言之,本实施例显示具有融合至CRISPR-Cas13的定向进化 ADAR2的可编程胞苷至尿苷RNA编辑扩展了RNA编辑工具箱。

申请人先前开发了称为REPAIR(用于可编程A至I(G)置换的RNA 编辑)的RNA碱基编辑技术,其使用RNA靶向CRISPR效应子Cas13(1-6) 将ADAR2的催化结构域引导至特定RNA转录物以以单碱基精确度实现腺嘌呤至肌苷的转化(7)。用于将胞苷转化为尿苷的精确RNA编辑的技术将极大地扩展可处理疾病突变的范围,并允许通过翻译后修饰位点的改变来调节细胞中的信号传导通路(图107A)。

尽管已利用能够催化C至U转化的天然酶进行DNA碱基编辑(16、 17),但它们仅在单链底物上操作(18),在基因组和转录组上均显示脱靶(19-21),并且在窗口内使多个碱基脱氨基。在本实施例中,申请人采用合成方法来进化ADAR2的腺嘌呤脱氨酶结构域(ADAR2dd),其天然作用于双链RNA底物并优先将与胞苷错配对的靶腺嘌呤脱氨基为胞苷脱氨酶。申请人将这种进化的胞苷脱氨酶与dCas13融合,以开发哺乳动物细胞中的用于特异性C至U交换的可编程RNA编辑(RESCUE) (图107B),申请人用其编辑STAT和β-连环蛋白的磷酸化信号传导并调节细胞生长。最后,申请人展示了通过RESCUE进行A至I和C至U 碱基的多重转化,并通过合理诱变将RESCUE特异性提高了10倍以上,从而生成了高特异性和精确性的C至U RNA编辑工具。

基于显示出其催化核心之间的显著结构同源性的大肠杆菌胞苷脱氨酶和人ADAR2dd的比较(22)(图107B),申请人选择了与RNA底物接触的ADAR2dd的残基(23),用于在与来自鸭疫里默氏菌的催化失活CAS13b直向同源物(dRANCas13b)融合的ADAR2dd上进行了三轮合理诱变,产生了具有15%编辑活性的RESCUE第3轮(RESCUEr3) (图103A-103B、108、109A-109B)。然后申请人开始在ADAR2dd上进行定向进化以鉴定增加酵母中RESCUE活性的额外候选突变。

16轮进化以最终构建体RESCUEr16(以下简称RESCUE)告终,导致所有被测基序中增加的胞苷脱氨酶活性,在紧邻的5'和3'碱基的16种可能基序组合中的12种上具有高于20%的编辑(图103C、110、 111A-111C、112、113A-113E)。申请人还表征了稳健活性所必需的指导序列特征,发现使用30-nt指导序列,RESCUE在靶标碱基中具有C 或U碱基翻转时具有最佳活性(图103C、114A-114C、115)。此外,由于dRanCas13b和来自Prevotella sp.P5-125的催化失活Cas13b直向同源物(dPspCas13b)是等价的,因此最终的RESCUE构建体使用dRanCas13b(图116)。

RESCUE中的16个突变分布在ADAR2dd的整个结构中(图117A),指示进化的残基与催化口袋内的RNA靶标的直接相互作用以及间接作用两者(图117B)。这些突变使得能够适合腺苷或胞苷,因为RESCUE 能够进行腺苷和胞苷两者的脱氨基化(图108A-108D)。申请人通过将突变体单独地添加到REPAIR或从RESCUE去除它们来评估每个突变体的作用(图119A-119D)。申请人发现,催化核心中的突变(V351G、K350I)以及与RNA靶标接触的突变(S486A、S495N)对于RESCUE 活性很重要。纯化的ADAR2dd上的RESCUE突变的生化表征显示对 dsDNA、ssDNA或DNA-RNA异源双链体无活性,进化后的突变在体外改善了dsRNA底物上的C至U编辑的动力学(图120A-120D)。

由于ADAR2已在无Cas13的其他RNA编辑平台上使用(8、9、11、 13),因此申请人在不存在Cas13融合的情况下测定了C至U的活性。申请人将RESCUE突变引入到哺乳动物细胞中与指导RNA一起的 ADAR2dd或全长ADAR2蛋白中,并测定了这些构建体恢复荧光素酶活性的能力,发现完整的RESCUE构建体(包括指导RNA正向重复)对于腺苷和胞苷脱氨基化活性都是必需的(图103D、图121A-121D、 122A-122C、123A-123C)。为了在替代RNA编辑系统中测试C至U编辑,该系统依赖于MS2-ADAR2dd融合(24)的募集或用RNA指导进行的全长ADAR2募集(11、24),申请人将RESCUE突变引入到这些构建体中并发现与基于Cas13b的RESCUE相比,编辑效率显著降低(图 124A-124F)。

申请人接下来通过细胞群的批量测序评估了RESCUE在HEK293FT 细胞中对于内源转录物的效率。申请人测试了在9个基因中的24个不同位点以及来自ClinVar的24个合成疾病相关突变靶标的多种指导序列设计,发现编辑率高达42%(图103E、图125A-125C、126A-126B、 127A-127B、130;表28)。在所测试的指导序列中(表29-31),申请人发现了多种指导序列设计规则,其中最明显的是涉及基序的特征(优选5’U或A)和指导序列错配位置。

为了展示通过翻译后修饰位点的RNA编辑来控制信号通路,申请人通过调节关键磷酸化残基来改变STAT和Wnt/β-连环蛋白通路的激活(图 104A、129A-129F)。对β-连环蛋白上的磷酸化残基(例如S33、S37和 T41)进行突变抑制了泛素化和降解,从而允许蛋白质与LEF和TCF1/2/3 等转录因子接合并导致细胞增殖增加(25)(图104B)。申请人测试了一组在已知被磷酸化的残基处靶向β-连环蛋白转录物(CTNNB1)的指导序列并观察到5%至28%之间的编辑水平(图104C),导致Wnt/β-连环蛋白信号传导的多达5倍激活(图104D)以及在HEK293FT(图 104E-104F)和人脐静脉内皮细胞(HUVECs)(图130A-130B)中增加的细胞生长。由于使用RESCUE的治疗应用可受益于用于病毒递送的较短构建体,因此申请人还用dRanCas13b的C端截短评估了RESCUE活性并发现相似或改善的脱氨酶活性(图131)。

由于RESCUE保留了腺苷脱氨酶活性(图118A-118D),因此 Cas13b(4)的天然前crRNA加工活性使得能够进行多重腺苷和胞苷脱氨基化。通过递送RESCUE以及靶向CTNNB1转录物中的腺苷和胞苷的前 crRNA(图105A),申请人发现RESCUE可以分别以~15%和5%的比率编辑被靶向的残基S33F和T41A两者(图105B)。但是,在这些实验以及单重试验中,申请人发现被靶向的胞苷附近的A至I脱靶(图 132A-132C、133A-133D)。为了消除这些脱靶,申请人在脱靶腺苷对面的指导序列中引入了不利的鸟嘌呤错配(图105C),显著减少了脱靶编辑,同时最小程度地干扰中靶编辑(图105D)。

申请人用全转录组RNA测序对脱靶进行了谱分析,发现虽然 RESCUE在Gluc转录物上有~80%C至U编辑(图106A),但其有188C 至U脱靶和1,695A至I脱靶,与REPAIRv1(7)的A至I脱靶是可比较的(图108A、108B)。为了提高RESCUE的特异性,申请人对ADAR2dd 在与RNA靶标相互作用的残基处进行了合理诱变(图106C),从而产生多个RESCUE突变体,其如通过荧光素酶报告基因(图106D)和RNA 测序(图106E-106G)测量的,具有降低的A至I脱靶活性和高C至U 中靶脱氨基化活性。RESCUE上的最高特异性突变体S375A(以下简称 RESCUE-S)保持约76%中靶C至U编辑(图106E),但仅有103C至 U脱靶和139A至I脱靶,腺嘌呤脱氨基化脱靶的数量减少约10倍(图 106E-106G),具有减少的错义突变和差异调控的转录物(图134A-134F、 135A-135C、136A-136B、137A-137D)。申请人还发现RESCUE-S在许多内源位点保留了与RESCUE类似的C至U活性,甚至超过其在一些位点处(图138A-138C、139A-139C、140A)具有在局部指导序列窗口内更高的特异性(图138C、140B-140E)。

RESCUE是一种可编程的碱基编辑工具,其能够将RNA中的胞苷精确转化为尿苷。使用定向进化,申请人展示了腺苷脱氨酶可以被放宽以接受其他碱基,从而产生了可以编辑dsRNA的新型胞苷脱氨基化机制。尽管在本研究中,申请人利用了Cas13的RNA指导靶向机制,但其他 RNA靶向机制(8-15、24)也可以与进化的ADAR2dd突变体类似地结合以在RNA转录物上实现精确的胞苷脱氨基化。RESCUE的胞苷脱氨基化活性的较大可靶向氨基酸密码子空间使得能够调节更多的翻译后修饰 (例如磷酸化、糖基化和甲基化)以及扩大对常见催化残基的靶向性(图 107和141)。此外,胞苷脱氨酶介导的RNA编辑允许对疾病相关突变的额外靶向,并产生保护性等位基因,例如ApoE2。总而言之,RESCEU 扩展了具有新碱基编辑功能的RNA靶向工具包,从而允许扩展对遗传疾病的建模和潜在治疗。

参考文献

1.O.O.Abudayyeh等,C2c2 is a single-component programmable RNA-guidedRNA-targeting CRISPR effector.Science 353,aaf5573(2016).

2.C.Cassidy-Amstutz等,Identification of a Minimal Peptide Tag for inVivo and in Vitro Loading of Encapsulin.Biochemistry 55,3461-3468(2016).

3.S.Shmakov等,Discovery and Functional Characterization of DiverseClass 2CRISPR-Cas Systems.Mol Cell 60,385-397(2015).

4.A.A.Smargon等,Cas13b Is a Type VI-B CRISPR-Associated RNA-GuidedRNase Differentially Regulated by Accessory Proteins Csx27 and Csx28.Mol Cell65,618-630e617(2017).

5.A.East-Seletsky等,Two distinct RNase activities of CRISPR-C2c2enable guide-RNA processing and RNA detection.Nature 538,270-273(2016).

6.O.O.Abudayyeh等,RNA targeting with CRISPR-Cas13.Nature 550, 280-284(2017).

7.D.B.T.Cox等,RNA editing with CRISPR-Cas13.Science 358, 1019-1027(2017).

8.T.Merkle等,Precise RNA editing by recruiting endogenous ADARs withantisense oligonucleotides.Nat Biotechnol 37,133-138(2019).

9.P.Vogel等,Efficient and precise editing of endogenous transcriptswith SNAP-tagged ADARs.Nat Methods 15,535-538(2018).

10.M.Fukuda等,Construction of a guide-RNA for site-directed RNAmutagenesis utilizing intracellular A-to-I RNA editing.Sci Rep 7,41478(2017).

11.J.Wettengel,P.Reautschnig,S.Geisler,P.J.Kahle,T.Stafforst,Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).

12.M.F.Montiel-Gonzalez,I.C.Vallecillo-Viejo,J.J.Rosenthal,Anefficient system for selectively altering genetic information within mRNAs.Nucleic Acids Res 44,e157(2016).

13.P.Vogel,M.F.Schneider,J.Wettengel,T.Stafforst,Improving site-directed RNA editing in vitro and in cell culture by chemical modification ofthe guideRNA.Angew Chem Int Ed Engl 53,6267-6271(2014).

14.M.F.Montiel-Gonzalez,I.Vallecillo-Viejo,G.A.Yudowski,J.J.Rosenthal,Correction of mutations within the cystic fibrosis transmembraneconductance regulator by site-directed RNA editing.Proc Natl Acad Sci U S A110,18285-18290(2013).

15.H.A.Rees,D.R.Liu,Base editing:precision chemistry on the genomeand transcriptome of living cells.Nat Rev Genet 19,770-788(2018).

16.A.C.Komor,Y.B.Kim,M.S.Packer,J.A.Zuris,D.R.Liu, Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424(2016).

17.K.Nishida等,Targeted nucleotide editing using hybrid prokaryoticand vertebrate adaptive immune systems.Science 353,(2016).

18.J.D.Salter,R.P.Bennett,H.C.Smith,The APOBEC Protein Family: Unitedby Structure,Divergent in Function.Trends Biochem Sci 41,578-594 (2016).

19.S.Jin等,Cytosine,but not adenine,base editors induce genome-wideoff-target mutations in rice.Science,(2019).

20.E.Zuo等,Cytosine base editor generates substantial off-targetsingle-nucleotide variants in mouse embryos.Science,(2019).

21.J.Grünewald等,Transcriptome-wide off-target RNA editing induced byCRISPR-guided DNA base editors.Nature,(2019).

22.M.R.Macbeth等,Inositol hexakisphosphate is bound in the ADAR2 coreand required for RNA editing.Science 309,1534-1539(2005).

23.M.M.Matthews等,Structures of human ADAR2 bound to dsRNA revealbase-flipping mechanism and basis for site selectivity.Nature structural&molecular biology 23,426-433(2016).

24.D.Katrekar等,In vivo RNA editing of point mutations via RNA-guidedadenosine deaminases.Nat Methods 16,239-242(2019).

25.B.T.MacDonald,K.Tamai,X.He,Wnt/beta-catenin signaling: components,mechanisms,and diseases.Dev Cell 17,9-26(2009).

26.M.K.Chee,S.B.Haase,New and Redesigned pRS Plasmid Shuttle Vectorsfor Genetic Manipulation of Saccharomycescerevisiae.G3(Bethesda)2, 515-526(2012).

27.M.F.Laughery等,New vectors for simple and streamlined CRISPR-Cas9genome editing in Saccharomyces cerevisiae.Yeast 32,711-720 (2015).

28.M.R.Macbeth,B.L.Bass,Large-scale overexpression and purificationof ADARs from Saccharomyces cerevisiae for biophysical and biochemicalstudies.Methods Enzymol 424,319-310(2007).

29.H.Ng,N.Dean,Dramatic Improvement of CRISPR/Cas9 Editing in Candidaalbicans by Increased Single Guide RNA Expression.mSphere 2,(2017).

30.R.Heim,D.C.Prasher,R.Y.Tsien,Wavelength mutations andposttranslational autoxidation of green fluorescent protein.Proc Natl AcadSci U S A 91,12501-12504(1994).

31.Y.Wang,P.A.Beal,Probing RNA recognition by human ADAR2 using ahigh-throughput mutagenesis method.Nucleic Acids Res 44,9872-9880(2016).

32.R.D.Gietz,R.H.Schiestl,Large-scale high-efficiency yeasttransformation using the LiAc/SS carrier DNA/PEG method.Nat Protoc 2,38-41(2007).

33.M.T.Veeman,D.C.Slusarski,A.Kaykas,S.H.Louie,R.T.Moon, Zebrafishprickle,a modulator of noncanonical Wnt/Fz signaling,regulates gastrulationmovements.Curr Biol 13,680-685(2003).

材料与方法

为了在酵母中表达dRanCas13b-hADAR2dd构建体,通过修饰pML104(Addgene#67638)(27)将该融合蛋白克隆到pRSII426主链 (26)中pGAL启动子的下游。为了提高表达,在该融合蛋白之间克隆GS 接头,并针对酵母对ADAR2dd进行了密码子优化(28)。通过Gibson 克隆引入对应于RESCUE的轮次的额外密码子突变。

对用于测试酵母中活性的靶向质粒进行工程化以用于荧光筛选 (GFP)和营养缺陷选择筛选(His)。将所有靶向质粒克隆到pYES3/CT 主链(Thermo Scientific)。所有质粒包含用于RESCUE的RanCas13b指导盒,其表达由ADH1启动子驱动,以及侧接HH和HDV核酶的间隔子和DR序列(29)。克隆了用金门位点替代间隔子的构建体以便利模块指导序列克隆。

为了产生C至U RNA编辑活性的GFP指示剂,将Y66H绿色至蓝色突变(30)引入由TEF启动子驱动的酵母密码子优化的EGFP(yeGFP) (31)中。成功的C至U RNA编辑恢复该构建体的绿色荧光。通过测试 HIS3中的保守残基当突变为可通过RNA编辑来挽救的残基时的活性丧失来生成用于C至U编辑的His报告基因(图128)。将生成失活HIS3 的突变在其天然HIS3启动子下克隆到pYES3/CT主链中的HIS3基因中。

表33列出了所有酵母质粒,表34列出了酵母实验中使用的所有靶向指导序列。

为了针对酵母中的C至U活性进行选择,申请人基于GFP荧光的恢复或HIS营养缺陷型选择基因的原养型逆转设计了一组酵母报告基因检测方法。对在没有组氨酸的情况下存活的GFP阳性培养物或菌落进行测序,选择了ADAR2dd结构域中的个体突变,将其引入先前RESCUE候选轮中并使用各种报告基因构建体评估其在哺乳动物细胞中的活性。在优化UCG荧光素酶位点(C82R)上的荧光素酶活性11轮后,申请人转向在CTNNB1转录物上的T41位点处进行了两轮优化,然后又在Gluc 转录物上的CCU位点(L77P)处进行了两轮优化。在最后一轮中,申请人测试了荧光素酶突变体的活性的恢复,该荧光素酶突变体具有在Gluc C82R位点的所有四个可能5′碱基(UCG、ACG、CCG和GCG)以及在 Gluc L77P突变处的两个额外基序(CCU和CCA),发现了在这些基序下的活性增加(图103B、图110)。为了在我们的酵母系统中进一步验证来自定向进化管线的我们的RESCUEr版本,申请人测试了多个 RESCUEr迭代在酵母和体外试验两者中的活性(图113A-113E和 120A-120D)。在酵母中检测EGFP和His恢复两者,申请人发现RESCUEr 的最新版本可以在两个靶标上更有效地执行C至U编辑(图113A-113E)。在每轮酵母筛选后,在一系列哺乳动物报告基因上评估了居首位的突变们以验证活性并选择居首位的突变体用于下一轮酵母筛选。表27列出了所有筛选和所得突变。

为了生成用于在酵母系统中筛选突变的诱变文库,使用Genemorph II (AgilentTechnologies)对hADAR2脱氨酶结构域进行了突变,用于通过两倍稀释系列,在模板输入范围为74ng-9.4μg的8个50mL反应中进行易错PCR。扩增后,将反应物合并,在去离子水中以1:4稀释,并加载到含有溴化乙锭的2%凝胶中。使用MinElute PCR纯化试剂盒(Qiagen) 纯化提取的样品,然后在37℃下用Dpn1(Thermo Fisher Scientific)处理 2h以去除残留的模板质粒,然后进行凝胶和MinElute纯化。通过用KflI、 RruI和Eco72I(Thermo FisherScientific)消化7μg模板质粒1小时来生成主链。用MinElute PCR纯化试剂盒对消化物进行凝胶纯化,并在30μL 的预加温水中洗脱。

使用Gibson Assembly(New England Biosciences)组装经纯化的PCR 插入序列和经消化的主链,将456ng PCR插入序列和800ng主链消化物在80μL反应中孵育1小时。用异丙醇沉淀将产物沉淀,并通过加热至 50℃5分钟重悬于12μL Tris-EDTA缓冲液中。将50μLEndura电感受态细胞(Lucigen)在冰上解冻10分钟,然后加入2μL重悬的Gibson产物。遵循最佳Endura设置(1.0mm吸收池、10μF、600欧姆和1800伏),使用GenePulser Xcell(Bio-Rad)对混合物进行电穿孔。将来自每个电穿孔的样品回收到1mL的回收培养基(Lucigen)中,并在37℃下孵育1 小时同时在300r.p.m摇动。每个诱变文库进行两次电穿孔。将回收的培养物铺板在大型预加温100μg/mL氨苄青霉素板上,并将板在37℃下孵育16小时,然后使用Nucleobond Xtra Maxi Kit(Macherey-Nagel)收获。

所有酵母实验均使用INVSc1(ThermoFisher Scientific)进行。如前所述进行大规模酵母转化(32)。简而言之,将含有Y66H EGFP或HIS3 报告质粒的菌落挑到300mL-Trp2%葡萄糖选择培养基中并在30℃生长过夜。生长后,测定细胞的OD600,并将2.5e9细胞加入到500mL预加温的2×YPAD中,并在30℃孵育4小时。洗涤细胞沉淀多次,然后重悬于36mL转化混合物中,该混合物包含24mL PEG 3350(50%w/v)、 3.6mL的1.0M乙酸锂、5mL的2.0mg/mL的变性单链载体鲑鱼精子DNA (ThermoFisher Scientific)、2.9mL水、和500μL的1μg/μL质粒文库。在42℃下孵育60分钟后,将细胞沉淀重悬于750mL的-Ura/-Trp 2%葡萄糖选择培养基中,并生长过夜直至培养物达到OD600为5-6。此时,将6mL的培养物接种到250mL的2%棉子糖-Ura/-Trp选择培养基并孵育直至OD600为0.5-1。加入27mL的30%半乳糖来诱导培养物,并在 30℃下孵育过夜12-14小时。然后对细胞进行细胞分选或铺板到选择板上,如下所述。任何涉及单个突变体的验证实验都以类似的方式进行转化,但是使用上述大规模转化的按比例缩小版本。

诱导后,通过与阴性非诱导和非靶向指导序列对照相比对EGFP荧光进行门控,在SH800S细胞分选仪上对细胞进行分选。在将1亿个细胞分选到2%葡萄糖-Ura/-Trp选择培养基中后,将分选的细胞孵育过夜,然后在OD600为5-6以1:40稀释到2%棉子糖-Ura/-Trp选择培养基中。将细胞放回振荡器中,在OD600在0.5-1之间用半乳糖诱导,孵育过夜 12-14小时,然后再次分选。进行分选直至分选了1-2千万个细胞。迭代生长和分选又重复了2-3次,用Zymoprep Yeast Plasmid Miniprep II (Zymo)收获分选细胞的每次迭代的质粒。通过Ilumina NextSeq NGS 对质粒的Adar2dd区进行PCR扩增和测序以确定突变体在每一轮选择中的存在。单独订购最富集的突变体,并按如下所述进行克隆用于哺乳动物验证测试。

诱导后,将细胞文库铺板在2%棉子糖/3%半乳糖-Ura/-Trp/-His选择板上。随着菌落生长,将它们挑到水中并在2%棉子糖/3%半乳糖 -Ura/-Trp/-His选择板上划线。条纹生长过夜后,对每个条纹进行菌落PCR 并对ADAR2催化结构域以及His基因进行桑格测序以检查重组和DNA 诱变。单独订购突变并按如下所述进行克隆用于哺乳动物验证测试。

通过在HEPN结构域的催化位点处的组氨酸至丙氨酸和精氨酸至丙氨酸突变(R142A/H147A/R1039A/H1044A)使RanCas13b催化失活 (dRanCas13b)。合成脱氨酶结构域和ADAR2并进行PCR扩增以Gibson 克隆到pcDNA-CMV载体主链中,并通过GS-mapkNES-GS(GSSLQKKLEELELGS(SEQ ID NO:779))接头在C端处与dRanCas13b 融合。将用于改变胞嘧啶脱氨基化活性或特异性的ADAR2脱氨酶结构域中的突变体通过Gibson克隆引入到dRanCas13b-GS-mapkNES-GS-ADAR2dd主链中。表27列出了ADAR2dd 中引入的所有用于进化C至U编辑的突变。

为了在不同的Cas13b直向同源物之间进行比较,通过Gibson克隆到REPAIR构建体dPspCas13b-GS-HIVNES-GS-ADAR2dd上(7),在 dRanCas13b主链上测试的突变被转移至dPspCas13b融合载体。为了单独测试不含dRanCas13b的ADAR2dd和全长ADAR2,申请人使用Gibson 克隆将所有突变添加到具有ADAR2dd或全长ADAR2的pcDNA-CMV载体主链上,之前已克隆以测试REPAIR(7)。通过筛选先前报道的荧光素酶报告质粒中Gluc中的潜在突变,生成了用于测量C至U RNA编辑活性的荧光素酶报道载体(7)。该报道载体将功能性Cluc表达为标准化对照,但是由于添加了突变体(C82R或L77P)而导致了缺陷型Gluc。为了测试RESCUE编辑基序偏好,申请人克隆了在Gluc的密码子82 (AAX CXC)处的胞嘧啶周围的每个可能基序。评价了突变体的C82R 的C至U编辑和催化活性的恢复(33)。由于周围的基序强烈地决定了用于A至I编辑的RNA编辑效率(7),申请人最初靶向UCG位点,因为5’U和3’G是ADAR2dd最佳活性的优选侧翼碱基。从M50 Super 8x TOPFlash(Addgene#12456)和M50 Super 8xFOPFlash(Addgene#12457) (34)生成了用于测试CTNNB1编辑效率的分泌的荧光素酶报道载体。通过Gibson克隆,在TCF/LEF应答元件(TOPFlash)或模拟结合位点 (TOPFlash)的控制下,将最初的萤火虫荧光素酶替换为分泌型高斯荧光素酶。克隆进了由CMV启动子驱动表达的额外的海萤荧光素酶充当转染对照。表32列出了所有哺乳动物质粒。

选择表现与现有候选轮次相当或更好的突变,用于在6个荧光素酶报告基因的整个组中进行筛选。对于RESCUEr4至RESCUEr10的选择,首先在TCG基序上筛选候选突变;使用GCG基序作为初筛分离了候选轮次RESCUEr11。使用对内源性CTNNB1的T41I残基的编辑进行的初筛,在哺乳动物细胞中验证了候选轮次RESCUEr12至RESCUEr14的选择,导致β-连环蛋白通路激活(其用通路活性的发光报告基因进行了谱分析),以及通过对Gluc的L77P CCT基序的活性来选择候选轮次 RESCUEr15和RESCUEr16。表27列出了所有轮次和用于产生它们的酵母筛选。

为了产生用于测试REPAIR活性的疾病相关突变,选择了ClinVar 中定义的与疾病发病机理相关的23个U>C突变(独立分组为一组22个基因和ApoE)。从Integrated DNATechnologies订购了选择的靶标作为突变位点周围的200-bp区域,并在Ef1α启动子下克隆到mScarlet的下游。

为了表达用于RESCUE的哺乳动物指导RNA,使用先前描述的具有前面是在U6表达下的金门受体位点的RanCas13b正向重复序列的构建体(7)。通过金门克隆将个体指导序列克隆到该表达主链中。为了确定用于选择位点的最佳指导序列,测试了C和U翻转两者以及在最常见的最佳指导序列范围(错配距离为~24)附近的平铺指导序列。表29-31列出了用于RESCUE实验的指导序列。

除非另有说明,否则哺乳动物细胞培养实验是在HEK293FT细胞系 (AmericanType Culture Collection(ATCC))中进行,在含葡萄糖、丙酮酸钠和GlutaMAX(ThermoFisher Scientific)、补充了1×青霉素-链霉素 (Thermo Fisher Scientific)和10%胎牛血清(VWR Seradigm)的 Dulbecco’s Modified Eagle培养基中生长。细胞保持在低于80%的汇合度。

除非另有说明,否则所有转染均用Lipofectamine 2000(Thermo FisherScientific)在涂覆聚D-赖氨酸(BD Biocoat)的96孔板上进行。转染前 16小时,将细胞以约20,000个细胞/孔铺板以确保转染时90%的融合度。对于板上的每个孔,将转染质粒与Opti-MEM I还原血清培养基(Thermo Fisher)混合至总计25μl。分别地将24.5μl的Opti-MEM与0.5μl的 Lipofectamine 2000混合。然后将质粒和脂质体转染溶液合并并孵育5分钟,然后将它们移液到细胞上。

将HUVEC细胞(Lonza)在内皮生长培养基-2(Lonza)中在Nunc Collagen I CoatedEasYFlasks(Thermo Fisher Scientific)上培养。细胞保持在低于80%的汇合度。HUVEC转染用Lipofectamine LTX(Thermo Fisher Scientific)在胶原I(BD Biocoat)涂覆的96孔板中进行。转染前16小时,将细胞以约5,000个细胞/孔接种。转染前立即用新鲜的EGM-2替换培养基。对于板上的每个孔,将转染质粒与1μl Plus试剂和Opti-MEM 混合至总计25μl。分别地将24.7μl的Opti-MEM与0.3μl的Lipofectamine LTX混合。然后将质粒和LTX溶液合并并孵育25分钟,然后将它们移液到细胞上。4小时后,用PBS洗涤细胞并用新鲜的EGM-2替换培养基。

为了评估哺乳动物细胞中的RESCUE活性,申请人转染了150ng RESCUE载体、300ng指导表达质粒,和当使用报告基因时(荧光素酶、 STAT活性或β连环蛋白活性)40ng RNA编辑报告基因。48小时后,从细胞中收获RNA并使用先前所述的方法(33)用基因特异性逆转录引物进行逆转录。然后使用NEBNext High-Fidelity 2X PCR Master Mix(New EnglandBiolabs)将提取的cDNA进行两轮PCR,以添加Illumina接头和样品条码。然后将文库在Illumina NextSeq或MiSeq上进行下一代测序。然后评估在测序窗口内的所有腺苷处的RNA编辑率。

在靶向荧光素酶报告基因用于RNA编辑的实验中,申请人还在RNA 收获之前收获具有分泌的荧光素酶的培养基。申请人在具有注射方案的读板仪(Biotek Synergy Neo2)上使用海萤和高斯荧光素酶测定试剂盒 (Targeting Systems)测量荧光素酶活性。进行的所有重复都是生物学重复。

在RESCUE质粒的输入量发生变化的实验中,除非另有说明,否则通过用表达CMV驱动的mScarlet的填充质粒替换RESCUE表达质粒,使质粒的总量保持恒定。在指导质粒的输入量发生变化的实验中,通过非靶向指导序列的替换使质粒的总量保持恒定("具有填充质粒"),或不保持恒定("不具有填充质粒");在该实验中,没有用于RESCUE质粒的填充质粒。

申请人测试了一组具有不同错配位置的指导RNA,其靶向9个基因中的24个不同位点(表103E、125A-125C),特别选择了不同的5'碱基身份来询问不同基序上的脱氨基化活性。申请人发现,在所有测试的位点上,RESCUE实现高达35%的编辑率,并且理想的错配位置或碱基翻转(C或U)是位点依赖性的。此外,RESCUE在多个内源位点上的性能均优于前面所有轮次的突变体并且需要比早期版本更少的转染质粒 (图126A-126B)。为了更好地评估RESCUE与治疗的相关性,申请人设计了一系列24个靶标,以对来自ClinVar的疾病相关突变的编辑进行建模(参见表28),并发现通过批量测序测得的高达42%的编辑率(图 129A-129B),包括阿尔兹海默症风险相关的ApoE4等位基因(图128)。

在分析了本文中的所有指导序列后,申请人发现最佳的指导序列设计在靶标位点之间有所不同。申请人建议针对每个新靶标位点测试各种指导序列设计,包括C翻转和U翻转两者以及不同的错配位置。待测的设计的实例将包括30nt的指导序列,其具有C或U翻转和在以下位置的错配:28、26、24、22和20。总而言之,申请人发现任何侧接U或A 的胞苷位点均具有强大的编辑活性。具有5’C或G的位点将以较低的效率进行编辑。

为了评估包含RESCUE突变的hADAR2脱氨酶结构域的动力学活性,将多次迭代克隆到包含URA3基因的 pGAL-His6-TwinStrep-SUMO-hADAR2dd主链中。将质粒转化到BCY123感受态酵母细胞中(10)。简而言之,将冷冻细胞在37℃水浴中解冻15-30 秒。将每种条件下的10μL细胞在微量离心机中以13,000g离心2分钟,然后去除上清液。为每个构建体制备的转化混合物包含以50%w/v制备的260μL PEG 3350、50μL变性鲑鱼精子(Thermo FisherScientific)、 36μL 1M乙酸锂和14μL DI H2O中的750ng质粒。将酵母沉淀物用转化混合物重悬,并在42℃水浴中温育30分钟,然后以13,000离心30秒,然后去除上清液。然后将沉淀重悬于1mL DI H2O中,并取50μL至1mL DI H2O中混合。随后,将200μL铺板到减去尿嘧啶的基本葡萄糖平板上进行原养型选择。

将平板在30℃下孵育48小时,然后将单个菌落接种到10mL的补充有右旋糖(20g/L)的酵母基本培养基中。基本培养基用酵母脱落补充剂Y2001(1.39g/L)、不含氨基酸的酵母氮基础(6.7g/L)、腺嘌呤半硫酸盐(0.022g/L)、组氨酸(0.076g/L)、亮氨酸(0.38g/L)和色氨酸(0.076g/L)制备。培养物生长过夜,然后将全部10mL培养物接种到100mL基本培养基/右旋糖培养物中。生长8小时后,将每种构建体接种到两个2L烧瓶中,其含有补充有20g棉子糖(VWR)的1L基本培养基。将这些生长过夜,并通过添加溶于200mL基本培养基的30g半乳糖诱导;然后在收获前将培养物再培养8小时。将培养物在Beckman Coulter AvantiJ-E离心机上以5,000r.p.m旋下20分钟,所得沉淀物保存在-80℃下。

根据Macbeth和Bass(28)中描述的方案修改了不同的RESCUE候选hADAR2脱氨酶结构域的蛋白质纯化。简而言之,将5-10g冷冻酵母沉淀重悬于补充有一片无EDTA的微型cOmplete ULTRA蛋白酶抑制剂 (Sigma)的50mL裂解缓冲液(20mM TrisHCl pH 8、5%甘油、750mM NaCl、1mMβ-巯基乙醇、0.01%Triton-X)中。使悬浮液在25,000psi 下通过LM20微流化器七次,并通过在9500RPM下离心80分钟来沉淀细胞碎片。倾析出澄清的裂解物,并与1mLStrepTactin超流动树脂 (Qiagen)一起孵育2.5小时,在4℃下使用旋转振荡器轻轻摇动。将悬浮液添加到用裂解缓冲液预平衡的Econo柱色谱柱中,并用40mL裂解缓冲液洗涤树脂。三次后续洗涤(每次40mL)降低了盐浓度(500mM, 250mM、然后100mM NaCl)。通过在台式摇床上在20mL补充了100μg SUMO蛋白酶(内部)的裂解缓冲液中轻轻摇动过夜,将蛋白质从树脂上切割下来。收集流出物并与用裂解缓冲液从树脂洗涤的3x 5mL洗涤物合并。将包含经切割的蛋白的全部级分上样至5mL肝素HP阳离子交换柱(GE Healthcare Life Sciences),并在100mM至1M的NaCl梯度上洗脱(缓冲液20mM Tris-HCl pH 8、5%甘油、1mMβ-巯基乙醇,具有相应的NaCl浓度)。检查级分的纯度,并使用SDS-PAGE和考马斯亮蓝染色进行分析,合并含蛋白质的级分并使用10MWCO离心过滤器 (Amicon)浓缩。通过考马斯染色和针对BSA连续稀释液(从1mg/mL 开始)的SDS-PAGE电泳来测定每种蛋白质的mg/mL浓度。使用ImageLab软件(BioRad Image Lab Software 6.0.1)定量条带,并通过对BSA标准品的线性回归进行内插来估算浓度。

将具有DNA手柄的ssRNA和DAN寡核苷酸(Integrated DNA Technologies)在1x双链体缓冲液(HEPES 30mM pH 7.5、K+乙酸盐100 mM)中于85℃退火5分钟,缓慢升温至4℃,然后使用Oligo Clean& Concentrator(Zymo)纯化,用Nanodrop定量,并标准化为100ng/μL。

如前所述(23)进行体外测定,但稍有改动。在25nM RNA底物、 50nM ADAR蛋白和0.16U/uL RNase抑制剂,以及15.6mM NaCl在1x 测定缓冲液(17mM TrisHCl pH 7.5、5%甘油、1.6mM EDTA、0.003% NP-40、0.5mM TCEP)中建立测定。将20μL反应物(三个技术重复)在30℃下孵育一定范围的时间点(0、5、10、30和60分钟)。加入10uL 的0.5%SDS溶液(至总浓度为0.166%SDS)淬灭反应,并在95℃变性5 分钟。

使用RNA XP清洁珠(Beckman Coulter)从反应混合物中纯化RNA,其中磁珠和异丙醇与样品体积的比率分别为10:3和3:1。根据制造商说明书使用qScript Flex cDNA试剂盒,带有修改,对经纯化的RNA进行逆转录。具体而言,将12.85μL纯化RNA与2μL GSP增强子和0.15μL 的100μM RT引物组合,通过涡旋混合并在65℃下孵育5分钟,然后进入42℃维持。此时,向每个反应中加入4μL qScript flex reaction mastermix (5x)和1μL qScriptRT,并通过移液混合,然后在42℃孵育1小时,然后在85℃加热5分钟。用两轮PCR扩增以添加Illumina接头和条码以制备cDNA用于测序,并在Illumina NextSeq上测序。测定在测序窗口内的所有胞苷(C至U活性)和腺苷(A至I活性)处的体外RNA编辑率。

为了分析转录组中的脱靶RNA编辑位点,转染后48小时,使用 RNeasy PlusMiniprep试剂盒(Qiagen)从细胞中收集总RNA。然后使用 NEBNext Poly(A)mRNA磁性分离模块(NEB)富集mRNA级分,然后使用NEBNext Ultra RNA Library Prep Kit for Illumina(NEB)制备此RNA 用于测序。然后将文库在Illumina NextSeq上测序并加载,使得有每个样品至少500万个读取结果。

使用开发用于此公布的自定义工作流程: portal.firecloud.org/#methods/m/rna_editing_final_workflow/rna_editing_fin al_workflow/1,在FireCloud计算框架(software.broadinstitute.org/firecloud/)上进行全转录组编辑RNA测序数据的分析。

为了进行分析,除非另有说明,序列文件被随机降采样至500万个读取结果。使用添加了Gluc和Cluc序列的RefSeq GRCh38组件生成了索引,并使用Bowtie/RSEM版本1.3.0对读取结果进行比对和定量。然后使用REDitools(35,36)对比对BAM进行RNA编辑位点的分选和分析,参数如下:-t 8-e-d-l-U[AG或TC或CT或者GA]-p-u-m20-T6-0-W -v 1-n 0.0。在未转染或EGFP转染的条件下发现的任何显著编辑均视为 SNP或转染伪影,并从脱靶分析中滤除。如果通过Benjamini Hochberg 校正进行多个假设校正后,Fisher精密检验得出小于0.05的p值,并且 3个生物学重复中至少有2个识别了编辑位点,则认为脱靶是显著的。相对于最大可能重叠,计算样品之间的编辑重叠,相当于两个样本之间的编辑的较少次数。重叠编辑位点的百分比计算为共享编辑位点的数量除以两个样品的最小编辑数量再乘以100。使用Kaviar(37)方法对已知 SNP位置进行额外一层过滤以识别SNP。

基于人hg38 UCSC基因组和RefSeq转录组创建Bowtie指数。接着,运行RSEMv1.3.157,命令行选项为"--estimate-rspd-bowtie-chunkmbs 512 -paired-end",以使用Bowtie将成对末端读取结果直接与该索引比对,并基于比对结果估计每百万转录物(TPM)中的表达水平。为了分析转录组变化,如果RESCUE或GFP对照条件的平均TPM大于1,则认为检测到了转录物。进行了学生t检验以识别p值通过0.01FDR校正的差异表达同种型。

如上所述使用lipofectamine 2000,用RESCUE质粒、靶向STAT3 和STAT1上的残基的指导质粒、以及用于STAT3(Qiagen Cignal STAT3 Reporter)和STAT1信号传导(QiagenCignal GAS Reporter)的荧光素酶报告基因转染细胞并孵育48小时。48小时后,使用Dual-Glo荧光素酶测定法(Promega)来测量细胞中的萤火虫和海肾荧光素酶活性。将萤火虫信号相对于海肾信号进行标准化以测量STAT3和STAT1的相对激活。

转染前24小时将细胞铺板在含有防止细胞在孔中心生长的核的细胞迁移板上。24小时后,如上所述使用lipofectamine 2000,用RESCUE质粒、靶向β-连环蛋白上的残基的指导质粒、以及用于β-连环蛋白激活的荧光素酶报告基因(Qiagen TCF/LEF CignalReporter)转染细胞并孵育。 24小时后,去除中心核以允许细胞向孔中心生长。再孵育24小时后,测定培养基中的Gluc和Cluc荧光素酶信号。计算Gluc与Cluc的相对比率,以确定条件之间的相对β连环蛋白激活。在第3天,将细胞与 CellTracker Green CMFDA Dye(ThermoFisher Scientific)一起孵育10分钟,然后用培养基洗涤。每天使用荧光对细胞成像以测量细胞生长。使用ImageJ软件通过计算中心生长区域中荧光的总面积来测量细胞向孔中心区域中的细胞生长。使用自动宏通过以下命令处理图像:

//ImageJ macro for calculating cellular area run("8-bit");

run("Auto Local Threshold","method=Bernsen radius=15 parameter_1=0parameter_2=0white");

setAutoThreshold("Default dark");run("Measure");

转染前16小时,将HUVEC铺板在胶原I涂覆的细胞迁移板上。在上述转染方案中使用了100ng包含RESCUE构建体和指导序列的单一载体。24小时后,去除中心核并用补充有氢化可的松、hFGF-B、FBS、抗坏血酸、GA-1000和来自EGM-2补充包(Lonza)的肝素的内皮基础培养基2(Lonza)代替培养基。在第3天,将细胞与在EBM-2中稀释的 CellTracker GreenCMFDA Dye一起孵育10分钟,然后用培养基洗涤。每天使用荧光对细胞成像。使用ImageJ软件通过手动概括和定量每个孔中的无细胞面积来测量细胞生长。

表27.RESCUE进化表

表28疾病相关突变的疾病信息

表29用于荧光素酶编辑的指导序列

表30用于内源基因编辑的指导序列

表31用于合成靶标编辑的指导序列

表32哺乳动物质粒和图谱

表33酵母质粒和图谱

表34用于酵母靶向的指导序列

参考文献

1.O.O.Abudayyeh等,C2c2 is a single-component programmable RNA-guidedRNA-targeting CRISPR effector.Science 353,aaf5573(2016).

2.C.Cassidy-Amstutz等,Identification of a Minimal Peptide Tag for inVivo and in Vitro Loading of Encapsulin.Biochemistry 55,3461-3468(2016).

3.S.Shmakov等,Discovery and Functional Characterization of DiverseClass 2CRISPR-Cas Systems.Mol Cell 60,385-397(2015).

4.A.A.Smargon等,Cas13b Is a Type VI-B CRISPR-Associated RNA-GuidedRNase Differentially Regulated by Accessory Proteins Csx27 and Csx28.Mol Cell65,618-630e617(2017).

5.A.East-Seletsky等,Two distinct RNase activities of CRISPR-C2c2enable guide-RNA processing and RNA detection.Nature 538,270-273(2016).

6.O.O.Abudayyeh等,RNA targeting with CRISPR-Cas13.Nature 550, 280-284(2017).

7.D.B.T.Cox等,RNA editing with CRISPR-Cas13.Science 358, 1019-1027(2017).

8.T.Merkle等,Precise RNA editing by recruiting endogenous ADARs withantisense oligonucleotides.Nat Biotechnol 37,133-138(2019).

9.P.Vogel等,Efficient and precise editing of endogenous transcriptswith SNAP-tagged ADARs.Nat Methods 15,535-538(2018).

10.M.Fukuda等,Construction of a guide-RNA for site-directed RNAmutagenesis utilising intracellular A-to-I RNA editing.Sci Rep 7,41478(2017).

11.J.Wettengel,P.Reautschnig,S.Geisler,P.J.Kahle,T.Stafforst,Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).

12.M.F.Montiel-Gonzalez,I.C.Vallecillo-Viejo,J.J.Rosenthal,Anefficient system for selectively altering genetic information within mRNAs.Nucleic Acids Res 44,e157(2016).

13.P.Vogel,M.F.Schneider,J.Wettengel,T.Stafforst,Improving site-directed RNA editing in vitro and in cell culture by chemical modification ofthe guideRNA.Angew Chem Int Ed Engl 53,6267-6271(2014).

14.M.F.Montiel-Gonzalez,I.Vallecillo-Viejo,G.A.Yudowski,J.J.Rosenthal,Correction of mutations within the cystic fibrosis transmembraneconductance regulator by site-directed RNA editing.Proc Natl Acad Sci U S A110,18285-18290(2013).

15.H.A.Rees,D.R.Liu,Base editing:precision chemistry on the genomeand transcriptome of living cells.Nat Rev Genet 19,770-788(2018).

16.A.C.Komor,Y.B.Kim,M.S.Packer,J.A.Zuris,D.R.Liu, Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424(2016).

17.K.Nishida等,Targeted nucleotide editing using hybrid prokaryoticand vertebrate adaptive immune systems.Science 353,(2016).

18.J.D.Salter,R.P.Bennett,H.C.Smith,The APOBEC Protein Family: Unitedby Structure,Divergent in Function.Trends Biochem Sci 41,578-594 (2016).

19.S.Jin等,Cytosine,but not adenine,base editors induce genome-wideoff-target mutations in rice.Science,(2019).

20.E.Zuo等,Cytosine base editor generates substantial off-targetsingle-nucleotide variants in mouse embryos.Science,(2019).

21.J.Grünewald等,Transcriptome-wide off-target RNA editing induced byCRISPR-guided DNA base editors.Nature,(2019).

22.M.R.Macbeth等,Inositol hexakisphosphate is bound in the ADAR2 coreand required for RNA editing.Science 309,1534-1539(2005).

23.M.M.Matthews等,Structures of human ADAR2 bound to dsRNA revealbase-flipping mechanism and basis for site selectivity.Nature structural&molecular biology 23,426-433(2016).

24.D.Katrekar等,In vivo RNA editing of point mutations via RNA-guidedadenosine deaminases.Nat Methods 16,239-242(2019).

25.B.T.MacDonald,K.Tamai,X.He,Wnt/beta-catenin signaling: components,mechanisms,and diseases.Dev Cell 17,9-26(2009).

26.M.K.Chee,S.B.Haase,New and Redesigned pRS Plasmid Shuttle Vectorsfor Genetic Manipulation of Saccharomycescerevisiae.G3(Bethesda)2, 515-526(2012).

27.M.F.Laughery等,New vectors for simple and streamlined CRISPR-Cas9genome editing in Saccharomyces cerevisiae.Yeast 32,711-720 (2015).

28.M.R.Macbeth,B.L.Bass,Large-scale overexpression and purificationof ADARs from Saccharomyces cerevisiae for biophysical and biochemicalstudies.Methods Enzymol 424,319-331(2007).

29.H.Ng,N.Dean,Dramatic Improvement of CRISPR/Cas9 Editing in Candidaalbicans by Increased Single Guide RNA Expression.mSphere 2, (2017).

30.R.Heim,D.C.Prasher,R.Y.Tsien,Wavelength mutations andposttranslational autoxidation of green fluorescent protein.Proc Natl AcadSci U S A 91,12501-12504(1994).

31.Y.Wang,P.A.Beal,Probing RNA recognition by human ADAR2 using ahigh-throughput mutagenesis method.Nucleic Acids Res 44,9872-9880(2016).

32.R.D.Gietz,R.H.Schiestl,Large-scale high-efficiency yeasttransformation using the LiAc/SS carrier DNA/PEG method.Nat Protoc 2,38-41(2007).

33.S.B.Kim,H.Suzuki,M.Sato,H.Tao,Superluminescent variants of marineluciferases for bioassays.Anal Chem 83,8732-8740(2011).

34.M.T.Veeman,D.C.Slusarski,A.Kaykas,S.H.Louie,R.T.Moon, Zebrafishprickle,a modulator of noncanonical Wnt/Fz signaling,regulates gastrulationmovements.Curr Biol 13,680-685(2003).

本发明的所描述的方法、药物组合物和试剂盒的各种修改和变化对本领域技术人员将是显而易见的,而不脱离本发明的范围和精神。尽管已经结合特定实施方式描述了本发明,但是应当理解能够进行进一步的修改,并且所要求保护的发明不应不适当地限于这样的特定实施方式。实际上,对于本领域技术人员显而易见的用于实施本发明的所描述的方式的各种修改都旨在在本发明的范围内。本申请旨在覆盖总体上遵循本发明的原理的本发明的任何变型,使用或修改,并且包括这种与本公开的偏离均落入本发明所属领域内的已知惯例中,并且可以在阐述之前适用于本文的必要特征。

相关技术
  • 新型CRISPR-Cas12N酶和系统
  • 新型CRISPR-Cas12j.23酶和系统
技术分类

06120113293861