掌桥专利:专业的专利平台
掌桥专利
首页

CRISPR/CAS13在RNA病毒和/或细菌诱导的疾病的治疗中的应用

文献发布时间:2024-04-18 19:48:15



本申请要求于2020年12月22日递交的LU 102326的权益。该申请通过引用以其整体并入本文。

技术领域

本发明涉及包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物,所述组合物包含i)至少一种CRISPR相关蛋白13(Cas13)或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至至少一个核输出序列(NES)的至少一个核定位信号(NLS)融合,以及ii)至少一种向导RNA(gRNA)或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交。此外,本发明涉及一种包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物,该组合物包含i)至少一种CRISPR相关蛋白13(Cas13)或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与至少一个核定位信号(NLS)融合,或与至少一个核输出序列(NES)融合,以及ii)至少一种向导RNA(gRNA)或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交,所述编码所述gRNA的核苷酸序列与至少一种病毒输出元件融合。本发明还涉及所述组合物用在治疗中。特别地,本发明涉及所述组合物用于预防或治疗受试者中的病毒性或细菌性疾病的方法中。本发明还涉及包含编码所述组合物的所述Cas13蛋白和/或所述gRNA的核苷酸序列的核酸分子、涉及包含所述核酸分子的载体和包含所述载体或所述核酸分子的宿主细胞。此外,本发明涉及包含所述组合物的试剂盒。本发明还包括生产本发明所述组合物的方法。

背景技术

从临床的观点来看,病毒或细菌菌株快速传播的问题通常是药物的开发花费太多的时间以至于不能在合理的时间内开发治疗剂。特别是对于作为冠状病毒科的(+)-RNA病毒,并且在2020年10月初就已经在全世界引起了超过1.000.000例死亡的新型冠状病毒SARS-CoV-2,药物开发是关键问题。RNA病毒也是造成最近的另外两种流行病(epidemics)和大流行病(pandemics)的原因(SARS-CoV-1和MERS-CoV)。这两种流行病与COVID-19共同点是具有高毒力,并具有通过飞沫感染的有效传播途径(P.Anfinrud等,(2020),N Engl JMed 382,2061-2063;J.Chen(2020)Microbes Infect 22,69-71)。

为此,唯一可用的手段是对已经获批的药物“再利用”。例如,目前正在讨论将最初开发为用于埃博拉病毒的药物瑞德西韦用于COVID-19的治疗(J.Grein等,(2020),N EnglJ Med 382,2327-2336)。然而,由于抗体和基于小分子的疗法(如瑞德西韦用)利用蛋白的三级结构作为靶结构,因此,通常不可能将已获批的抑制剂应用于新的病毒或细菌菌株,另外,病毒或细菌突变也可改变治疗剂的结合性质。

原核免疫系统CRISPR/Cas的作用不同于高等真核生物的免疫系统。CRISPR/Cas系统不是结合到蛋白质抗原,而是在核糖核酸水平上直接识别噬菌体的遗传信息。通过简单表达与噬菌体基因组互补的向导RNA(gRNA),将效应子核酸酶引导至噬菌体的基因组,并诱导基因组的切割(F.Hille等,(2018),Cell 172,1239-1259)。CRISPR/Cas系统分为两类,有六种类型(K.S.Makarova等,(2020),Nat Rev Microbiol 18,67-83)。除了作为可编程DNAse的Cas9之外,最近发现了Cas13。与Cas9不同,Cas13不切割DNA,而是切割攻击原核宿主的噬菌体的RNA(O.O.Abudayyeh等,(2016),Science 353)。Cas13效应子的核酸酶是HEPN(高等真核生物和原核生物核苷酸-结合)结构域,其在蛋白质内是分裂的并因此是无活性的。一旦靶标RNA被结合,蛋白质的三级结构就会发生变化,由此分离的核酸酶结构域被接近并活化(O.O.Abudayyeh等,(2016))。

在现有技术中,已经对一些模型病毒(如甲型流感)以及在将合成SARS-CoV-2序列转染到已经表达Cas13的人细胞中的人工实验系统中证明了使用Cas13的不同方法(C.A.Freije等,(2019),Mol Cell 76,826-837,Abbott等,(2020),Cell 181,865-876)。尽管目前尝试开发针对人类致病性病毒以及细菌感染的疫苗,但仍需要提供用于治疗和/或预防由人类致病性病毒或细菌引起的疾病的替代或改进的药剂、组合物和方法。因此,本申请所面临的技术问题是满足这种需要。

通过提供权利要求中反映的、说明书中描述的以及随后的实施例和附图中示出的实施方案,解决了上述技术问题。

发明内容

本发明人已经开发了一种新型的基于CRISPR-Cas的方法,该方法用于治疗病毒性疾病和细菌性疾病,所述病毒性疾病优选为由RNA病毒引起的诸如COVID-19的病毒性疾病,在细菌性疾病中,侵入的或细胞复制的病毒/细菌mRNA在存在互补gRNA(CRISPR相关的RNA)的情况下由Cas13蛋白结合,并被Cas13的RNAse活性降解,从而使其无害。该种新型CRISPR/Cas概念直接靶向核糖核酸序列而非蛋白质的三级结构,并且可以用作直接攻击(特别是SARS-CoV-2的)病毒RNA序列和/或细菌RNA序列的抗病毒/抗细菌疗法。因此,这种方法是模块化的和可适应的。这种基于RNA的治疗方法的优点是病毒基因组以及细菌基因组可以作为靶标,这意味着相比于解决蛋白质的三级结构可更容易且更快地获得潜在的治疗。

具体地,本发明人测试了对gRNA和Cas13蛋白的许多修饰,并识别了提高Cas13蛋白的敲低效率的三种组分(参见图6、图11和14)。最重要的优化步骤涉及融合至至少一个核输出信号(NES)的至少一个核定位信号(NLS)与Cas13蛋白的融合(参见图1)。此外,所述优化步骤包括gRNA的延伸(参见图1和2)和支持gRNA的折叠的tRNA的融合以及核酶与所述gRNA的融合(参见图3)。包含所有三种修饰的本发明组合物可指如本文其它地方定义的Cas13-IDG。另外,发现包括以下修饰中的任一种的Cas13蛋白和/或gRNA在RNA水平上的其它修饰甚至更多地改善Cas13蛋白的敲低效率:比如修饰的5'和/或3’UTR、5’CAP结构的转录后添加或共转录添加、N1-甲基假尿苷(N1-Methylpseudo-UTP)对UTP的替换、或2'-O-甲基-3’P-硫代酸对两个5'和/或3'末端核苷酸的替换(参见图10和15)。此外,本发明人还发现在DNA水平上对gRNA的另一种修饰进一步提高了用于DNA递送的Cas13蛋白的敲低效率,所述另一种修饰包括使至少一个病毒输出元件,优选地使至少一个组成型转运元件(CTE)或VARdm,最优选地使至少一个CTE与gRNA融合,所述Cas13蛋白与融合至至少一个NES的至少一个NLS融合(参见图16)。

gRNA在细胞核中转录,并且根据本发明人,为了激活Cas13d RNAse活性,首先必须结合gRNA(参见图4)。理想地,该步骤仅可在细胞核中发生。相对地,病毒或细菌感染后的病毒或细菌mRNA靶标分子基本上位于细胞质中。所述定位信号的融合导致Cas13蛋白定位到细胞质中并导致该蛋白在该区室中稳定。与已经公开的Cas13变体不同,该步骤首次允许降解细胞质RNA而非细胞核RNA。该步骤是必需的,因为例如许多RNA病毒(如冠状病毒)的复制只在细胞质中发生。然而,如果本发明的组合物不以基于DNA的系统而是以基于RNA或蛋白质的系统递送,则包含上述修饰的所述新型组合物例如对于位于细胞核和细胞质中的病毒(如正粘病毒科,优选流感病毒)也是非常重要的,其中在两个细胞区室中仍然需要平衡的Cas13蛋白定位,这通过将Cas13蛋白与融合至至少一个NES的至少一个NLS融合来实现。

总之,已经证明这种高度非常规和非显而易见的方法是将翻译的Cas13蛋白引导至细胞核中以装载gRNA,然后将其输出到细胞质中,或如上所述反之亦然的几种测试策略中最合适的,从而导致所需靶标结构降解的效率增加-由此在诊断和治疗中具有巨大的潜力(参见图6和7)。

因此,在第一方面,本发明涉及一种包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物,所述组合物包含i)至少一种CRISPR相关蛋白13(Cas13)或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至至少一个核输出序列(NES)的至少一个核定位信号(NLS)融合,以及ii)至少一种向导RNA (gRNA)或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交。

本发明还公开了如本文其它地方定义的组合物,其中所述Cas13蛋白通过连接子与融合至所述至少一个NES的所述至少一个NLS融合。

发明人现在还发现,通过包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物实现了相同的效果,即实现了期望的靶标结构降解的效率增加的效果,所述组合物包含i)至少一种CRISPR相关蛋白13(Cas13)或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与至少一个核定位信号(NLS)融合,或与至少一个核输出序列(NES)融合,以及ii)至少一种向导RNA(gRNA)或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交,所述编码所述gRNA的核苷酸序列与至少一种病毒输出元件融合。在本文中,通过使至少一种病毒输出元件与所述gRNA融合,Cas13-NES或-NLS的细胞质敲低增加,其中所述病毒输出元件优选为组成型转运元件(CTE)或腺病毒VA1 RNA的小螺旋体(VARm),最优选地为CTE(参见图17)。

本文还包括如本文其它地方定义的组合物,其中所述Cas13蛋白是Cas13d蛋白。

本文还描述了如本文其它地方定义的组合物,其中所述Cas13d蛋白衍生自瘤胃球菌属,优选衍生自生黄瘤胃球菌。

本发明还公开了如本文其它地方所定义的组合物,其中所述gRNA具有至少约23个核苷酸的长度。

本发明还公开了如本文其它地方所定义的组合物,其中所述gRNA具有约26至约30个核苷酸的长度。

本文还描述了本文其它地方定义的组合物,其中所述gRNA与所述一种或多种靶标RNA分子具有至少约80%的互补序列同一性。

本文还包括如本文其它地方定义的组合物,其中所述gRNA能够与所述一种或多种靶标RNA分子的(a)5’-和/或3’-非翻译区杂交。

本发明还公开了如本文其它地方所定义的组合物,其中所述编码所述gRNA的核苷酸序列与tRNA或核酶融合。

本发明还公开了如本文其它地方所定义的组合物,其中所述一种或多种靶标RNA分子是病毒或细菌靶标RNA分子。

本发明还公开了如本文其它地方所定义的组合物,其中所述组合物用于灭活细菌或病毒ssRNA。

本文还包括如本文其它地方所定义的组合物,其中所述组合物是药物组合物,优选地所述组合物还包含至少一种药学上可接受的载体。

在第二方面,本发明还涉及所述组合物,其用于治疗。

在第三方面,本发明还涉及所述组合物,其用于预防或治疗受试者中的病毒性或细菌性疾病的方法中,所述方法包括向所述受试者施用治疗有效量的所述组合物。

此外,本发明还公开了本文其它地方所定义的所述应用的组合物,其中病毒性疾病由RNA病毒引起,优选地,所述病毒性疾病是冠状病毒疾病、甲型流感、埃博拉、麻疹、丙型肝炎、蜱传脑炎(TBE)、委内瑞拉马脑炎(VEE)病毒感染、登革热、黄热病或寨卡热中的任一种,甚至更优选地,所述病毒性疾病是COVID-19疾病。

在第四方面,本发明涉及包含编码如本文其它地方所定义的所述Cas13蛋白和所述gRNA的核苷酸序列的核酸分子、包含如本文定义的所述核酸分子的载体或涉及包含本文其它地方所定义的所述核酸分子或所述载体的宿主细胞。

在第五方面,本发明还涉及包含如本文其它地方定义的所述组合物的试剂盒。本发明还公开了如本文其它地方所定义的试剂盒,其进一步包含递送系统和/或标签。

在第六方面,本发明还涉及生产本发明的组合物的方法,其中通过基因工程方法从编码如本文定义的所述Cas13蛋白和所述gRNA的核酸开始生产所述组合物,从而产生所述组合物;任选地获得所产生的组合物。

附图说明

图1:不同Cas13蛋白和gRNA变体的敲低效率。将每个变体靶向共转染的萤火虫萤光素酶,并标准化为非靶向gRNA。与仅NLS变体相比,NLS-NES串联信号与Cas13d的融合提高了效率。gRNA的延长进一步提高了效率。将所有条件均与最新一代的miRNA/RNA干扰(Fellmann等,2013,在Cell报告中)进行比较。

图2:表征靶向共转染的纳米荧光素酶的Cas13d-NLS-NES的不同gRNA长度的表征。gRNA的最佳长度在26bp至30bp的范围内。

图3:tRNA(MHV68 M1-7)或核酶(HDV)与30bp gRNA的融合提高了Cas13d-NLS-NES对共转染的纳米荧光素酶(Nanoluciferase)的敲低效率。

图4:比较了将gRNA从细胞核输出到细胞质的不同策略。对于不同的Cas13d蛋白定位和不同的gRNA表达策略,测量了针对共转染的纳米荧光素酶的敲低效率。聚合酶III驱动的gRNA保留在细胞核中。因此,细胞核定位的Cas13d(NLS)优于系胞质的Cas13d(NES)。串联融合(NLS-NES)使敲低效率最大化,原因是在细胞核中拾取gRNA并对编码纳米荧光素酶的胞质mRNA具有活性。蛋白质印迹证实了gRNA与Cas13d存在于相同的区室中,稳定了蛋白质。通过从聚合酶II驱动的启动子表达来输出gRNA的互补策略不能改善效率。

图5:不同Cas13d蛋白和gRNA变体的敲低效率。将每个变体靶向共转染的萤火虫萤光素酶,并标准化为非靶向gRNA。在同一孔中测量的但并非gRNA直接靶向的共转染纳米荧光素酶是靶RNA诱导的旁切(collateral)活性的读出结果。与仅NLS变体相比,NLS-NES串联信号的融合提高了效率。gRNA的延长进一步提高了效率。将所有条件均与最新一代的miRNA/RNA干扰进行比较。

图6:(A)开发优化的Cas13系统的分析示意图。(B)不同的Cas13系统与增强的Cas13-IDG(NLS-NES,30bp gRNA,3’tRNA)的比较。通过共转染的纳米荧光素酶测量敲低效率。(C)与Cas13d-NLS相比,Cas13d-NLS-NES的部分细胞质定位。(D)Cas13d通过直接降解编码mRNA和次要(secondary)切割28S rRNA的特定位置而影响细胞翻译的预期机制。(E)靶向共转染的mRuby3的Cas13d-NLS-NES,和随后的在生物分析仪芯片上的核糖体RNA的分析。

图7:(A)基于Cas13的抗病毒策略的预期作用模式。通过直接靶向病毒基因组、相关基因组拷贝、亚基因组mRNA或通过抑制病毒蛋白质翻译来实现四级病毒抑制。(B)通过蛋白质印迹证实的人工表达的病毒蛋白RNA依赖性RNA聚合酶(RdRp)(HA标记)的有效敲低。此外,通过共转染无关的mRuby3蛋白证实了旁切作用。(C)使用ACE2、Cas13d-NLS-NES和gRNA转染的HEK293T细胞感染SARS-CoV-2,72小时后,通过RT-qPCR定量病毒载量。

图8:测定用活性或非活性Cas13d-NLS-NES、gRNA和靶RNA转染的细胞的整体细胞蛋白质翻译。

图9:从用或不用Cas13d-NLS-NES、靶标RNA和互补gRNA转染的细胞中提取的RNA的琼脂凝胶。显示了28S rRNA的切割产物。对于用或不用纯化的Cas13d、gRNA和靶标RNA一起温育的纯化的80S核糖体,在体外发现了相同的28S rRNA切割产物。

图10:(A)通过优化转染的Cas13 mRNA或gRNA的不同方面来提高Cas13的RNA递送的敲低效率。通过靶向共转染的纳米荧光素酶并标准化为非靶向gRNA来测量效率。(B)通过修饰UTR、5’CAP结构或N1-甲基假尿苷对UTP的替换来提高mRNA的Cas13表达水平。

图11:(A)与不同定位信号融合的Cas13d变体的图解。(B)不同定位的Cas13d变体对共转染的纳米荧光素酶靶标RNA(crRNA 1和crRNA 2)的敲低效率。Cas13d-IDG的细胞核和细胞质定位信号的平衡组使对两种crRNA的敲低效率最大化。

图12:(A)显示与不同定位信号融合的Cas13d蛋白变体的定位的代表性图。(B)100个细胞中不同Cas13d变体的细胞质/细胞核分布的定量。

图13:对于聚合酶II驱动的gRNA(细胞质)和聚合酶III驱动的gRNA(细胞核),通过蛋白质印迹分析与不同定位信号融合的Cas13d变体的稳定性。在两种组分定位于相同区室的条件下,复合的蛋白质/gRNA是最稳定的。

图14:靶向不同结构元件的gRNA的半细胞质Cas13-NLS-NES和细胞核定位的Cas13-NLS对委内瑞拉马脑炎(VEE)复制子的敲低效率的比较,这通过mGreenLantern表达的降低测量。自复制的VEE RNA由病毒非翻译区(UTR)、非结构蛋白(nsp)、干扰素抑制蛋白(B18R、E3L)、mGreenLantern(mGL)报告子和嘌呤霉素抗性基因组成。Cas13d-NLS-NES显著增强了细胞质复制VEE的敲低。

图15:(A)针对采用Cas13d-IDG和靶向结构病毒元件的不同的gRNA(NT:非靶,CDS:编码序列,UTR:非翻译区)的处理条件的SARS-CoV-2-GFP复制的连续分析。化学修饰的3’UTR gRNA在抑制病毒复制中最有效。(B)Cas13d-IDG靶向不同的SARS-CoV-2变体。以生物学六次重复和技术两次重复,通过RT-qPCR分析对两个病毒靶基因的敲低效率。

图16:对于与Cas13融合的NES或串联NLS-NES,靶向共转染的纳米荧光素酶的两种gRNA的敲低效率的比较。另外,测试了未修饰的或CTE融合的gRNA。NLS-NES和CTE-gRNA的组合使敲低效率最大化。

图17:(A)不同的crRNA输出策略的图解。聚合酶III(pol III)驱动的crRNA保留在细胞核中,聚合酶II(pol II)驱动的crRNA被输出到细胞质中,与组成型转运元件(CTE)融合的crRNA被输出,同样与腺病毒VA1RNA的小螺旋体(VARmd)融合的crRNA也被输出。(B)不同crRNA输出基序以及细胞质(NES)或细胞核(NLS)Cas13d蛋白对纳米荧光素酶靶标RNA(crRNA 1和crRNA 2)的敲低效率的比较。与CTE输出基序融合的CrRNA在细胞质中在驱动基于Cas13d的敲低方面是最有效的。

具体实施方式

尽管下面详细描述了本发明,但是应当理解,本发明不限于本文所述的特定方法学、方案和试剂,因为这些可以变化。还应理解,本文所用的术语仅用于描述特定实施方案的目的,并不旨在限制本发明的范围,本发明的范围仅由所附权利要求书限定。除非另有定义,否则本文所用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同的含义。

在下文中,将描述本发明的要素。这些要素随具体实施方案列出,然而,应当理解,这些要素可以任何方式和任何数量组合以产生另外的实施方案。在整个说明书中描述的各描述的实例和优选实施方案不应被解释为将本发明限制为仅明确描述的实施方案。本说明书应当被理解为支持并涵盖将明确描述的实施方案与任何数量的所公开和/或优选要素组合的实施方案。此外,除非上下文另有说明,否则本文所述的所有要素的任何排列和组合应被认为是由本申请的说明书所公开。

贯穿本说明书和随后的权利要求,除非上下文另有要求,词语“包括/包含(comprise)”以及变形词语比如“包括/包含(comprises)”和“包括/包含(comprising)”将被理解为意指包括陈述的成员、整数或步骤、或成员、整数或步骤的集合,但并不排除任何其它的成员、整数或步骤、或成员、整数或步骤的集合,尽管在一些实施方案中可排除此类其它的成员、整数或步骤、或成员、整数或步骤的集合,即该主题在于包括陈述的成员、整数或步骤、或成员、整数或步骤的集合。当本文使用时,术语“包括/包含(comprising)”能够被术语“含有(containing)”或“包括(including)”替代,或有时本文使用时会以术语“具有”替代。当本文使用时,“由…组成”排除未指定的任何要素、步骤或成分。

除非本文中另外指明或与上下文明显矛盾,否则将在描述本发明的上下文中(尤其是在权利要求书的上下文中)使用的术语“一种”和“一个”和“该/所述”以及类似的指代解释为覆盖单数和复数。本文中值的范围的记载仅旨在用作单独引用落入该范围的每个单独的值的速记方法。除非本文中另外指明,否则将每个单独的值并入本说明书中,如同其在本文中被单独记载一样。

除非本文中另外指明或者与上下文明显矛盾,否则本文中描述的所有方法可以以任何合适的顺序进行。除非另外要求,本文中提供的任何和所有实施例或示例性语言(例如,“比如”)的使用仅旨在更好地举例说明本发明,并不对本发明的范围进行限制。说明书中的任何语言均不应被解释为表示对实施本发明必要的任何未要求保护的要素。

除非另有说明,否则在一系列要素之前的术语“至少”应理解为是指该系列中的每个要素。术语“至少一个”是指一个、两个、三个或更多个,例如四个、五个、六个、七个、八个、九个、十个和更多个。本领域技术人员将认识到或采用不超过常规实验能够确定本文所述的本发明的具体实施方案的许多等同方案。这些等同方案也涵盖在本发明中。

术语“小于”或“大于”或“低于”不包括具体的数字。

在本文中任意处使用的术语“和/或”均包括“和”、“或”以及“由该术语连接的要素的全部或任意其它组合”的含义。

当在本文使用时,“由……组成”排除了未在声称的要素中规定的任何要素、步骤或整数。当本文使用时,“本质上由...组成”并不排除实质上不影响声称的基本和新颖特征的材料或步骤。

术语“包括”意指“包括但不限于”。“包括”和“包括但不限于”可互换使用。

术语“约”意指正或负20%,优选正或负10%,更优选正或负5%,最优选正或负1%。

贯穿本说明书和随后的权利要求,除非上下文另有要求,否则单数包括复数。特别地,在使用不定冠词的情况下,除非上下文另有要求,否则说明书应被理解为既考虑复数又考虑单数。

应当理解,本发明不限于本文所述的特定方法学、方案、材料、试剂和物质等,因为这些可以变化。本文所用的术语仅用于描述特定实施方案的目的,并不旨在限制本发明的范围,本发明的范围仅由权利要求书限定。

在本说明书的整个文本中引用了若干文献。本文中引用的每篇文献(包括所有专利、专利申请、科学出版物、制造商的说明书、指南等),无论在上文还是在下文中,均通过引用整体并入本文。本文中的任何内容都不应被解释为承认本发明无权由于在先发明而先于这样的公开内容。在通过引用并入的材料与本说明书矛盾或不一致的程度上,本说明书将取代任何这样的材料。

在本文中引用的所有文献和专利文献的内容均通过引用整体并入。

从仅用于说明目的实施例可以更好地理解本发明及其优点。这些实施例不旨在以任何方式限制本发明的范围。

CRISPR组合物

Cas13蛋白

本发明涉及一种包含如在本文其它地方所描述的CRISPR系统的组合物。这种CRISPR-Cas系统代表“成簇的、规律间隔的、短回文重复(CRISPR)/CRISPR-相关蛋白”。CRISPR系统基于细菌和古细菌进化的适应性防御机制,以保护它们免受病毒、细菌和质粒的侵入,其依赖于小RNA用于序列特异性检测和沉默外源核糖核酸。CRISPR/Cas系统由组织在操纵子中的cas基因和CRISPR阵列组成,CRISPR阵列由散布有相同重复序列的基因组靶向序列(称为间隔区)组成(Bhaya等,(2011)Annu Rev Genet 45:273-297;Barrangou R和Horvath P(2012)Annu Rev Food Sci Technol 3:143-162)。向导RNA(gRNA)的靶标识别通过与gRNA复合起作用的Cas蛋白指导外源序列的沉默。

更详细地并且一般而言,CRISPR-Cas或CRISPR系统总体上是指参与CRISPR相关(“Cas”)基因的表达或指导其活性的转录物和其它元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(如tracrRNA或tracrRNA的活性部分)、tracr-配对序列(在内源性CRISPR系统的背景下包含“直接重复序列”和tracrRNA加工的部分直接重复序列)、向导序列(在内源性CRISPR系统的背景下也称为“间隔子”)或如该术语在本文中使用的“RNA”(如,导向Cas的RNA,如CRISPR RNA和反式激活(tracr)RNA或单一导向RNA(sgRNA)(嵌合RNA)或来自CRISPR基因座的其它序列和转录物。通常,CRISPR系统的特征在于促进CRISPR复合物在靶序列的位点处(在内源性CRISPR系统的背景下也称为前间隔区(protospacer))形成的元件。

在本发明中,包含所述特定系统的所述组合物是指CRISPR-Cas13系统。在本发明中,包含所述CRISPR系统的组合物包含至少一种(一种或多种)成簇的、规律间隔的、短回文重复(CRISPR)相关(Cas)蛋白,其为Cas13蛋白。因此,该组合物包含至少一种(一种或多种),比如一种、两种、三种、四种、五种或更多种如本文其它地方定义的Cas13蛋白。CRISPR-Cas13是一种RNA靶向和编辑系统,该系统基于保护细菌免受病毒和细菌的影响的细菌免疫系统。在VI型CRISPR-Cas系统中,Cas13是靶向并切割来自病毒和细菌的侵入核糖核酸的效应蛋白。CRISPR-Cas13系统类似于CRISPR-Cas9系统。然而,与靶向DNA的Cas9不同,Cas13,一种RNA酶,靶向/检测和切割/降解单链RNA(ssRNA)。因此,Cas13蛋白也指(VI型)靶向RNA的效应蛋白。Cas13酶具有两个较高等的真核和原核核苷酸结合(HEPN)endoRNase结构域,其介导精确的RNA裂解,并优先选择具有生化和细菌中观察到的前间隔区侧翼位点(PFS)的靶标。靶向RNA的效应蛋白的实例包括C2c2(现在称为Cas13a)、Cas13b、Cas13c和Cas13d。Cas13首先在沙阿(沙氏)纤毛菌(一种纤毛菌种)中发现,当时研究人员正在寻找以前未识别的CRISPR系统。自从2016年由张锋(Broad Institute,MIT)团队识别了Cas13蛋白以来,迄今为止已经描述并深入研究了四种不同的亚型(Cas13a-d)。它们在序列上有很大差异,但均具有两个HEPN结构域(较高等真核和原核核苷酸结合结构域)的共同特征,这两个HEPN结构域负责RNA酶活性。所述Cas13蛋白的该种结构域介导精确的RNA裂解,并优先选择具有前间隔区侧翼位点(PFS)的靶标。相对地,Cas13蛋白不像如先前提及的Cas9蛋白那样显示针对DNA的活性。

在一个实施方案中,Cas13蛋白包含至少一个HEPN结构域,所述HEPN结构域包括但不限于本领域已知的HEPN结构域,以及通过与共有序列基序比较而被识别为HEPN结构域的结构域。在一些实施方案中,Cas13蛋白包含单个HEPN结构域。在一些其它实施方案中,Cas13蛋白包含两个HEPN结构域。在另一实施方案中,Cas13蛋白包含一个或多个包含RxxxxH基序序列的HEPN结构域。RxxxxH基序序列可以,但不限于,来自本领域已知的HEPN结构域。RxxxxH基序序列进一步包括通过组合两个或更多个HEPN结构域的部分而产生的基序序列。如所述,共有序列可以衍生自以下专利申请中公开的直系同源物的序列:名称为“新型CRISPR酶和系统”的美国临时专利申请62/432,240,2017年3月15日提交的名称为“新型VI型CRISPR直系同源物和系统”的美国临时专利申请62/471,710,以及2017年4月12日提交的、标记代理机构卷号为47627-05-2133的、名称为“新型VI型CRISPR直系同源物和系统”的美国临时专利申请。

由于本发明的所述组合物靶向RNA分子,其中至少一种Cas13蛋白与至少一种gRNA形成复合物,并且其中所述至少一种gRNA将所述复合物引导至一种或多种靶标RNA分子,从而靶向所述一种或多种靶标RNA分子,因此包含所述CRISPR系统的所述组合物还可以指包含核糖核酸检测系统的组合物。由于所述组合物不仅通过所述Cas13 Rnase靶向RNA分子,而且还随后切割所述靶标RNA分子,从而降解所述RNA分子,因此包含所述CRISPR系统的所述组合物还可以指包含核糖核酸降解系统的组合物。

在一个实施方案中,所述至少一种Cas13蛋白或编码所述蛋白的核苷酸序列是Cas13a蛋白或其功能变体或其同系物或直系同源物。在另一个实施方案中,所述至少一种Cas13蛋白或编码所述蛋白的核苷酸序列是Cas13b蛋白或其功能变体或其同系物或直系同源物。在甚至另一实施方案中,所述至少一种Cas13蛋白或编码所述蛋白的核苷酸序列是Cas13c蛋白或其功能变体或其同源物或直向同源物。Cas13a蛋白可来自选自以下的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、优杆菌属、链球菌属、乳酸杆菌属、枝原体属、拟杆菌属、Flaviivola、黄杆菌属、Sphaerochaeta、固氮螺菌属、葡糖醋杆菌、奈瑟氏菌属、罗氏菌属(Roseburia)、Parvibaculum、葡萄球菌属、Nitratifractor、枝原体属和弯曲菌属以及毛螺菌属,或者Cas13a蛋白选自:沙阿(沙氏)纤毛菌、韦德纤毛菌、斯氏李斯特氏菌、毛螺旋菌(Lachnospiraceae bacterium)、嗜氨基梭菌(Clostridium aminophilum)、鸡肉杆菌(Carnobacterium gallinarum)、产丙酸栖沼泽杆菌(Paludibacter propionicigenes)、Listeria weihenstephanensis、荚膜红细菌(Rhodobacter capsulatus),优选地来自韦德纤毛菌。在另一个实施方案中,所述Cas13a蛋白可选自这样的氨基酸序列,其与通过引用并入本文的US20200165594的表4和5中列出的任意序列具有至少80%序列同一性。在一些实施方案中,Cas13b来自选自以下的生物体:伯杰氏菌属、普雷沃菌属、卟啉单胞菌属、拟杆菌属、另枝菌属(Alistipes)、鸭疫里默氏杆菌、嗜二氧化碳噬细胞菌属、黄杆菌属、类香味菌属、金黄杆菌属、Paludibacter、冷弯曲菌属、Phaeodactylibacter、中华微杆菌属、Reichenbachiella,优选地为普雷沃菌属,甚至更优选地为普雷沃菌属sp.P5-125。在另一个实施方案中,Cas13b蛋白为或包含与通过引用并入本文的US20200165594的表6中列出的任意序列具有至少80%序列同一性的氨基酸序列。在一些实施方案中,Cas13c蛋白是如在2017年6月26日递交的美国临时专利申请62/525,165中和2017年8月16日递交的PCT申请US2017/047193中公开的一种。

在本发明的优选实施方案中,Cas13蛋白或编码所述蛋白的核苷酸序列是Cas13d或其功能变体或其同系物或直系同源物。Cas13d蛋白可来自选自以下的属的生物体:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、优杆菌属、瘤胃球菌属、链球菌属、乳酸杆菌属、枝原体属、拟杆菌属、Flaviivola、黄杆菌属、Sphaerochaeta、固氮螺菌属、葡糖醋杆菌、奈瑟氏菌属、罗氏菌属(Roseburia)、Parvibaculum、葡萄球菌属、Nitratifractor、枝原体属、弯曲菌属和毛螺菌属,优选地来自优杆菌属或瘤胃球菌属,最优选地来自瘤胃球菌属。已经表明来自生黄瘤胃球菌,优选来自生黄瘤胃球菌XPD3002的Cas13d降解靶标RNA最有效。因此,在甚至更优选的实施方案中,Cas13d蛋白或编码所述蛋白的核苷酸序列衍生自瘤胃球菌属,最优选衍生自生黄瘤胃球菌。所谓衍生的,是指衍生的蛋白质在很大程度上是基于野生型蛋白质(在具有高度序列同源性的意义上),在本文中,采用来自瘤胃球菌属,优选来自生黄瘤胃球菌的Cas13d,并因此提供与所述野生型蛋白质相同的功能,但它已经以本领域已知的或本文所述的一些方式进行了突变(修饰)。衍生自瘤胃球菌属,优选来自生黄瘤胃球菌的Cas13d蛋白也可以指如本文其它地方定义的功能变体。本文还包括并且最优选如本文所定义的组合物,其中所述Cas13蛋白来自瘤胃球菌属,优选来自生黄瘤胃球菌。

在具体的实施方案中,如本文其它地方定义的所述Cas13d蛋白的功能变体与生黄色瘤胃球菌的Cas13d蛋白的野生型氨基酸序列(SEQ ID NO.1)具有至少约50%、或至少约60%、或至少约70%、或至少约80%、更优选至少约85%、甚至更优选至少约90%、比如例如至少约95%、至少约96%、至少约97%、至少约98%或甚至至少约99%氨基酸序列同一性的序列同源性或同一性。因此,本发明还包括如本文其它地方定义的组合物,其中Cas13蛋白或编码所述蛋白的核苷酸序列为这样的Cas13d蛋白,该种Cas13d蛋白包含与SEQ ID NO.:1的氨基酸序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%或甚至100%序列同一性的氨基酸序列。

如本文所用的一种蛋白质的“功能变体”是指至少部分保留该蛋白质活性的该蛋白质的变体。功能变体可以包括突变体(其可以是本领域技术人员已知的插入、缺失或取代),包括多晶型物等。功能变体中还包括这种蛋白质与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人工合成的。有利的实施方案可涉及本文定义的工程化或非天然存在的Cas13蛋白。因此,如本文所述的Cas13蛋白的功能变体保留了其所衍生自的Cas13蛋白的生物活性。通常,Cas13蛋白变体与其所衍生自的Cas13蛋白具有至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或甚至至少约99%的氨基酸序列同一性。

术语“直系同源物”(本文也称为“直接同源物”)和“同系物”(本文也称为“同源物”)是本领域熟知的。通过进一步的指导,本文所用蛋白质的“同系物”是和与其为同系物的蛋白质执行相同或相似功能的相同物种的蛋白质。同源蛋白可以但不必是结构相关的,或仅是部分结构相关的。本文所用的蛋白质的“直系同源物”是和与其为直系同源物的蛋白质执行相同或相似功能的不同物种的蛋白质。直系同源蛋白可以但不必是结构相关的,或仅是部分结构相关的。在具体的实施方案中,如文本提及的Cas13蛋白(如Cas13a、b、c或d)的同系物或直系同源物与Cas13蛋白(如Cas13a、b、c或d)具有至少80%、更优选至少85%、甚至更优选至少90%、比如例如至少95%的序列同源性或同一性。在进一步的实施方案中,如文本提及的Cas13蛋白(如Cas13a、b、c或d)的同系物或直系同源物与野生型Cas13蛋白(如Cas13a、b、c或d)具有至少80%、更优选至少85%、甚至更优选至少90%、比如例如至少95%的序列同一性。涉及如本文定义的Cas13蛋白的各实施方案也可适用于其功能变体或其同系物或直系同源物。

“同一性”或“序列同一性”是衡量序列的相似性或关系的序列特性。如本发明所使用的术语“序列同一性”或“同一性”意指在本发明的多肽序列与所讨论的序列(同源性)比对之后,相对于这两个序列中较长一个的残基数量的配对相同残基的百分比。通过将相同残基的数量除以残基总数再使结果乘以100来量度序列同一性。在本文中可以采用程序BLASTP,blastp2.2.5版(2002年11月16日;参考Altschul,S.F.等,(1997)Nucl.AcidsRes.25,3389-3402)测定序列同一性百分比。在本实施方案中,同源性百分比基于包括相应序列的完整多肽序列比对(矩阵:BLOSUM 62;间隙罚分:11.1;截止值设置为10

在一些实施方案中,前间隔区邻近基序(PAM)或PAM样基序指导如本文所公开的Cas13蛋白复合物与目的靶基因座的结合。在一些实施方案中,PAM可以是5’PAM(即,位于前间隔区的5'端的上游)。在其它实施方案中,PAM可以是3’PAM(即位于前间隔区的5'端的下游)。如本文其它地方也提及的,术语“PAM”可与术语“PFS”或“前间隔区侧翼位点”或“前间隔区侧翼序列”互换使用。

如本文其它地方所述的降解靶标RNA分子的效率增加是由于本发明系统的特定设计。本发明人能够显示Cas13蛋白的细胞定位对总体组合物的降解效率具有决定性的影响,并且如前所述需要Cas13存在于细胞核和细胞质中。包含所述特定CRISPR系统的新型组合物使用创新性的NLS(核定位信号)和NES(核输出序列)的串联组合。在蛋白质水平上,如实施例所示,可以检测到病毒SARS-CoV-2RNA依赖性RNA聚合酶(RdRp)降低90%(也参见图1和4)。

因此,本发明的组合物所包含的CRISPR系统的Cas 13蛋白总是与至少一个(例如一个、两个、三个、四个、五个、六个或更多个)核定位信号(NLS)融合,该核定位信号(NLS)与至少一个(例如一个、两个、三个、四个、五个、六个或更多个)核输出序列(NES)融合。对所述系统的这种修饰是最重要的修饰。NES是蛋白质中含有4个疏水残基的短靶肽,该蛋白质靶向所述蛋白,即Cas13以便当例如包含所述系统的组合物作为基于DNA的系统递送时,Cas13利用核转运通过核孔复合体从细胞核输出至细胞质。当例如包含所述系统的组合物作为本文其它地方定义的基于RNA或蛋白质的系统递送时,NLS靶向位于细胞质中的蛋白质,即Cas13,以便输入细胞核。

所述融合至所述至少一种NES的所述至少一种NLS指(串联)定位信号,该定位信号因此允许Cas13蛋白在细胞核和细胞质之间穿梭,在细胞核中Cas13蛋白可通过与所述至少一种gRNA结合而被激活,在细胞质中在例如受试者感染病毒或细菌后定位靶标RNA分子。也进入细胞核的病毒(例如来自正粘病毒科的病毒,优选流感病毒)既在细胞核中又在细胞质中提供靶标RNA分子,其中当组合物可以在RNA或蛋白质水平上被递送以允许系统从细胞质穿梭至细胞核以在细胞核中降解靶标RNA分子时,组合物再次需要如本文所定义的定位信号。

优选通过至少1个氨基酸长度的本领域技术人员已知的任何肽连接子将本文定义的所述Cas13蛋白融合至所述定位信号(换言之,融合至所述至少一个NES的所述至少一个NLS)。因此,在本上下文中,本文也可以使用措辞,即本文定义的所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS连接。由于应用了肽接头,这种连接也可以指间接融合或连接。因此,在本上下文中也可以使用词语“间接融合”或“间接连接”。优选地,所述连接子的长度为1至20个氨基酸。更优选地,连接子的长度为1至15个氨基酸,甚至更优选地,连接子的长度为1至10个氨基酸,比如长度为1至5个氨基酸。甚至更优选地,连接子的长度为10、9、8、7、6、5、5、3、2、1个氨基酸。优选的是,连接子分子是线性或螺旋连接子,甚至更优选的是,连接子是螺旋连接子。进一步优选的是,连接子是采用例如氨基酸甘氨酸和/或丝氨酸的柔性连接子。在本发明的特别优选的实施方案中,连接子分子的50%至100%,特别地60%至100%,特别地70%至100%,特别地80%至100%,特别地90%至100%,尤其是100%的氨基酸残基是甘氨酸和丝氨酸残基,优选地它们形成α-螺旋结构。

优选地,Cas13蛋白和定位信号之间的融合/连接包括GlySer连接子,比如GGGS。它们可以以3((GGGS)

包含本文其它地方定义的融合至所述至少一个NES的所述至少一个NLS的所述定位信号可与所述Cas13蛋白的N-末端或C-末端融合。因此,在一个实施方案中,包含本文其它地方定义的融合至所述至少一个NES的所述至少一个NLS的所述定位信号与所述Cas13蛋白的C-末端融合。在另一个实施方案中,包含本文其它地方定义的融合至所述至少一个NES的所述至少一个NLS的所述定位信号与所述Cas13蛋白的N-末端融合。在优选实施方案中,包含本文其它地方定义的融合至所述至少一种NES的所述至少一种NLS的所述定位信号与所述Cas13蛋白的C-末端融合。根据本发明,所述信号的所述至少一个NLS可直接融合至所述至少一个NES,这意味着氨基酸序列(也称为肽序列)一个接一个排列,不含本文其它地方定义的连接子。因此,本发明全文使用的“直接融合”或“直接地融合”指不采用任何连接将所述至少一个NLS融合至本文其它地方定义的所述至少一个NES,从而形成包含至少一个NLS和至少一个NES的定位信号。如上所述的直接融合的定义可以应用于涉及直接融合的任何背景中。如果将一个以上的NLS或NES用于所述定位信号,则直接融合或“直接地融合”还指所述NLS或NES彼此之间的融合。在本上下文中,本发明包括任何排列,无论所述Cas13蛋白是首先与所述定位信号的所述至少一个NLS融合还是首先与所述至少一个NES融合。因此,如本文定义的所述Cas13蛋白可以如所述首先与至少一个NLS融合/连接,随后与至少一个NES融合/连接,或反之亦然。同样,当所述定位信号采用一个或多个NLS和一个或多个NES时,它们在所述定位信号中的任何排列都是可能的(例如NLS-NES-NLS或NES-NES-NLS或NLS-NLS-NES-NES等),并由此包含在本发明内。NLS的非限制性实例包括但不限于衍生自SV40病毒大T-抗原的NLS的具有氨基酸序列PKKKRKV(SEQ ID NO:2)的NLS序列、衍生自SV40病毒大T-抗原的所述NLS的延伸形式的具有氨基酸序列PPKKKRKVED(SEQ ID NO:5)的NLS序列、具有氨基酸序列PAAKKKLD(SEQ ID NO:3)的NLS共有序列(也称为合成NLS)、具有氨基酸序列PAAKRVKLD(SEQ ID NO:6)的c-myc NLS、或具有氨基酸序列KRPAATKKAGQAKKKK(SEQ IDNO:7)的核质蛋白二分(bipartite)NLS。NES的非限制性实例包括但不限于衍生自HIV病毒的NES的具有氨基酸序列LQLPPLERLTL(SEQ ID NO:4)的NES序列。在优选实施方案中,如本文定义的融合至所述至少一个NES的至少一个NLS包含具有SEQ ID NO:5所示氨基酸序列的SV40 NLS、具有SEQ ID NO:4所示氨基酸序列的HIV NES和具有SEQ ID NO:3所示氨基酸序列的NLS共有序列(参见图11)。由此,本文包括所提及的所述至少一个NLS(也可为一个以上的根据SEQ ID NO:5的NLS,和/或一个以上的根据SEQ ID NO:3的NLS)和所定义的所述至少一个NES(也可为一个以上的根据SEQ ID NO:4的NES)的任何排列。在一个更优选的实施方案中,具有SEQ ID NO:5所示氨基酸序列的所述SV40 NLS融合/连接至Cas13蛋白,优选融合/连接至所述Cas13蛋白的C-末端,然后融合至具有SEQ ID NO:4所示氨基酸序列的所述HIV NES,所述HIV NES随后连接至具有SEQ ID NO:3所示氨基酸序列的所述NLS共有序列(也称为合成NLS)。因此,优选地,如本文定义的本发明的组合物包含融合至如本文定义的Cas13蛋白的两个NLS和一个NES,甚至更优选地,其中如本文定义的组合物的所述Cas13蛋白与融合至一个NES的两个NLS融合。

在一些实施方案中,本文所述的Cas13蛋白可与一个或多个肽标签融合,所述肽标签包括His-标签、GST-标签或myc-标签。在一些实施方案中,本文所述的Cas13蛋白可与诸如荧光蛋白(例如绿色荧光蛋白或黄色荧光蛋白)的可检测部分融合。

根据本发明,Cas13蛋白可以作为如上定义的蛋白引入,但是可选地,Cas13蛋白也可以以编码所述蛋白的核苷酸序列的形式引入。换言之,它还可以以包含编码所述蛋白质的核苷酸序列的核酸分子的形式引入。应当理解,该核苷酸序列编码可表达形式的所述Cas13蛋白,使得表达产生功能性Cas13蛋白。确保功能性多肽表达的手段和方法是本领域熟知的。对于所述至少一种Cas13蛋白,也可使用编码所述至少一种Cas13蛋白的至少一种核苷酸序列。意味着当例如所述系统中包含两种Cas13蛋白时,所述一种Cas13蛋白由一种核苷酸序列编码,而另一种Cas13蛋白独立地由另一种核苷酸序列编码。例如,编码序列可以包含在载体中,所述载体比如质粒、粘粒、病毒、噬菌体或在如遗传工程中常规使用的其它载体。插入载体中的编码序列可以例如通过标准方法合成,或从天然来源中分离。编码序列可进一步与转录调节元件和/或其它氨基酸编码序列连接。此类调节序列是本领域技术人员熟知的,包括但不限于确保转录开始的调节序列、内部核糖体进入位点(IRES)(Owens,Proc.Natl.Acad.Sci.USA 98(2001),1471-1476)以及任选地确保转录终止和转录物稳定的调节元件。确保转录开始的调节元件的非限制性实例包括翻译起始密码子、转录增强子(例如SV40增强子)、绝缘子和/或启动子,比如例如巨细胞病毒(CMV)启动子、SV40启动子、RSV启动子(劳斯氏肉瘤病毒)、lacZ启动子、鸡β-肌动蛋白启动子、CAG启动子(鸡β肌动蛋白启动子和巨细胞病毒立即早期增强子的组合)、gai10启动子、人延伸因子lot-启动子、AOX1启动子、GAL1启动子CaM-激酶启动子、lac、trp或tac启动子、lacUV5启动子、苜蓿银纹夜蛾核型多角体病毒(AcMNPV)多角启动子或哺乳动物和其它动物细胞中的珠蛋白内含子。确保转录终止的调节元件的非限制性实例包括V40-聚-A位点、tk-聚-A位点或SV40、lacZ或AcMNPV多角聚腺苷酸化信号,其包括在本发明核酸序列的下游。其它调节元件可包括翻译增强子、Kozak序列和侧翼为用于RNA剪接的供体和受体位点的间插序列。此外,也可以包括诸如复制起点、药物抗性基因或调节子(作为诱导型启动子的一部分)的元件。编码所述Cas13蛋白的核苷酸序列包括DNA和RNA,所述DNA例如cDNA或基因组DNA。优选地,描述“RNA”的实施方案涉及mRNA。

因此,本发明包括包含所述CRISPR系统的组合物,所述组合物包含编码如本文定义的所述至少一种Cas13蛋白的至少一种DNA序列和编码如本文定义的所述至少一种gRNA的至少一种DNA序列,该种组合物可以指基于DNA的系统。然而,本发明还包括包含所述CRISPR系统的组合物,所述组合物包含编码如本文定义的所述至少一种Cas13蛋白的至少一种RNA序列(mRNA序列)和如本文定义的至少一种gRNA,该种组合物可以指基于RNA的系统。

有利地,编码所述Cas13蛋白,特别是Cas13d的核苷酸序列是密码子优化的CRISPR蛋白。在这种情况下,密码子优化序列的实例是针对在真核生物(例如人)中表达而优化的序列(即,为在人中表达而优化的序列),或针对本文讨论的另一真核生物、动物或哺乳动物而优化的序列。虽然这是优选的,但应理解其它实例也是可能的,并且针对非人宿主物种的密码子优化或针对特定器官的密码子优化是已知的。在一些实施方案中,编码所述Cas13蛋白的核苷酸序列是针对在特定细胞(如真核细胞)中的表达而优化的密码子。真核细胞可以是特定生物体的那些或衍生自特定生物体(例如植物或哺乳动物),所述特定生物体包括但不限于如本文所讨论的人或非人真核生物或动物或哺乳动物,如小鼠、大鼠、兔、狗、家畜或非人哺乳动物或灵长类动物。通常,密码子优化是指通过用在该宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,约或大于约1、2、3、4、5、10、15、20、25、50或更多个密码子),同时保持天然氨基酸序列来修饰核苷酸序列以增强在目的宿主细胞中的表达的过程。不同物种对特定氨基酸的特定密码子显示出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而翻译效率又被认为尤其取决于待翻译的密码子的性质和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物体中实现最佳基因表达。密码子使用表是容易获得的,例如,在kazusa.orjp/codon/可获得的“密码子使用数据库”中获得,并且这些表可以以多种方式进行调整。参见Nakamura,Y.,等,“Codon usage tabulated from the international DNAsequence databases:status for the year2000”Nucl.Acids Res.28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可用的,Gene Forge(Aptagen;Jacobus,Pa.)。在一些实施方案中,编码所述Cas13蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸的最频繁使用的密码子。

本领域技术人员容易理解,根据本发明,由于遗传密码的简并性,存在一种以上的核苷酸序列可以编码Cas13蛋白,优选Cas13d蛋白。简并性的产生是因为三联体密码指定20个氨基酸和一个终止密码子。因为存在四种碱基用于编码遗传信息,所以需要三联体密码子产生至少21种不同的密码。三联体中碱基的43种可能性产生64种可能的密码子,这意味着一定存在一定的简并性。因此,一些氨基酸由一个以上三联体,即由多达六个三联体编码。简并性主要由三联体中第三位的改变引起。这意味着根据本发明可以使用具有不同序列但仍编码相同Cas13蛋白的核苷酸序列。根据本发明使用的核苷酸序列可以是天然的以及(半)合成来源的。因此,核苷酸序列可以是,例如根据有机化学的常规方案合成的核苷酸序列。本领域技术人员熟悉所述探针的制备和用途(参见,例如Sambrook和Russel"Molecular Cloning,A Laboratory Manual",Cold Spring Harbor Laboratory,N.Y.(2001))。此外,根据本发明,根据本发明使用的核苷酸序列可以是本领域已知的核酸模拟分子,例如核苷酸序列的合成或半合成衍生物和混合聚合物。如本领域技术人员容易理解的,这些核苷酸序列可以含有另外的非天然或衍生的核苷酸碱基。本发明的核酸模拟分子或衍生物包括但不限于硫代磷酸核酸、磷酸酰胺核酸、吗啉代核酸、己糖醇核酸(HNA)、肽核酸(PNA)和锁核酸(LNA)。

gRNA

如其在本发明中的情况,当CRISPR蛋白是Cas13蛋白时,在如本文其它地方所述的组合物中tracrRNA不是必需的。然而,所述组合物还另外包含至少一种能够与本文定义的一种或多种靶标RNA分子杂交的向导RNA(gRNA)。

如本文所用,术语“向导RNA”、“gRNA”或“互补crRNA”是指这样一种多核苷酸,该种多核苷酸包含与一种或多种靶标RNA分子具有足够的互补性以便与所述一种或多种靶标RNA分子杂交并引导包含gRNA和CRISPR Cas13蛋白的RNA靶向复合物与所述一种或多种靶标RNA分子的序列特异性结合的任何多核苷酸序列。通常,gRNA可以是任何多核苷酸序列,该任何多核苷酸序列(i)能够与CRISPR蛋白(例如Cas13)形成复合物并且(ii)包含与靶标多核苷酸序列具有足够的互补性以便与靶标序列杂交并且引导CRISPR复合物与靶标序列的序列特异性结合的序列。如本文所用,术语“能够杂交的gRNA”是指与一种或多种靶标RNA分子具有足够互补性以便与其杂交并介导CRISPR复合物与该靶标RNA结合的gRNA的亚部分。通常,作为gRNA的一部分的向导序列是任何多核苷酸序列,该任何多核苷酸序列与如本文其它地方定义的靶标多核苷酸序列具有足够互补性以便与靶标序列杂交并引导CRISPR复合物与靶标序列的序列特异性结合。

如本文所用,术语“能够与Cas13蛋白形成复合物”是指具有允许Cas13蛋白与gRNA特异性结合从而形成复合物的结构的gRNA,所述复合物能够以序列特异性方式结合靶标RNA分子并能够对所述靶标RNA发挥功能。gRNA的结构组件可包括直接重复和向导序列(或间隔区)。与靶标RNA特异性结合的序列由gRNA的一部分(“向导序列”)介导,该序列与靶标RNA互补。

在进一步的步骤中,本发明人对所述至少一种gRNA进行了优化。通常使用22个碱基的互补序列作为标准。如本文所用且本发明的组合物所包含的至少一种gRNA或编码所述gRNA的核苷酸序列优选地包含至少约23个,比如至少约24个、至少约25个、至少约26个、至少约27个、至少约28个、至少约29个或至少约30个核苷酸的长度。因此,本发明的gRNA已通过延长其长度进行了优化,作为对本文公开的新型组合物的另外修饰。

在更优选的实施方案中,本发明的组合物所包含的所述至少一种gRNA或编码所述gRNA的核苷酸序列包含约23至约30个核苷酸,比如23、24、25、26、27、28、29或30个核苷酸,优选约24至约30个核苷酸,更优选约25至约30个核苷酸,最优选约26至约30个核苷酸的长度。本发明人能够特别表明,包含约26至约30、约27至约30、约28至约30、约29至约30个核苷酸的长度的较长gRNA显著增加所述Cas13蛋白的酶活性(参见图1和2)。优选地,所述至少一种gRNA具有约26、27、28、29或约30个核苷酸的长度。

在优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约26至约30个核苷酸的长度。在另一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约27至约30个核苷酸的长度。在又一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约28至约30个核苷酸的长度。在另又一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约29至约30个核苷酸的长度。在一个甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约26个核苷酸的长度。在另一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约27个核苷酸的长度。在又一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约28个核苷酸的长度。在再一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约29个核苷酸的长度。在另又一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)所述至少一种Cas13蛋白或编码它的所述核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)如本文定义的至少一种gRNA或编码它的核苷酸序列,其中所述gRNA具有约30个核苷酸的长度。

在优选的实施方案中,所述至少一种gRNA或编码所述gRNA的核苷酸序列与所述一种或多种靶标RNA分子具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或甚至100%的互补序列同一性。本发明人发现,与所述一种或多种靶标RNA分子具有一个错配是可以耐受的,这种错配指,根据gRNA的长度,gRNA与所述一种或多种靶标RNA分子具有至少约95%的互补序列同一性。两个相邻的错配导致活性的显著降低。如果两个错配彼此不相邻,则对活性的影响显著较小。然而,如果存在与所述一种或多种靶标RNA分子的三个错配,则所述至少一种gRNA不能再与所述一种或多种靶标RNA分子杂交。优选地,所述至少一种gRNA或编码所述gRNA的核苷酸序列与所述一种或多种靶标RNA分子具有至少约85%的互补序列同一性。在一些实施方案中,当使用合适的比对算法进行最佳比对时,作为如本文其它地方定义的gRNA的一部分的向导序列与靶标RNA分子所包含的其相应的靶标序列之间的互补性程度为约或大于约80%、85%、90%、95%、96%、97%、98%、99%或更高,优选地为约或大于约85%。最佳比对可以通过使用用于比对序列的任何合适的算法来确定,其非限制性实例包括Smith-Waterman算法,Needleman-Wunsch算法,基于Burrows-Wheeler Transform的算法(如Burrows WheelerAligner),ClustalW,Clustal X,BLAT,Novoalign(Novocraft Technologies;可在novocraft.com上获得),ELAND(Illumina,San Diego,Calif.),SOAP(在soap.genomics.org.cn上获得)和Maq(在maq.sourceforge.net上获得)。

可以将至少一种(一种或多种),例如一种、两种、三种、四种、五种和更多种gRNA用于本发明的组合物中。因此,不同的gRNA中的每一个均可以结合基因组中的病毒或细菌序列。本发明也可以使用一种以上的不同gRNA的同时应用,它们针对病毒/细菌基因组的数个区域。这涉及一种称为“多路复用(multiplexing)”的过程。因此,即使病毒/细菌发生突变,也可以确保有效和持续的降解。

在一些实施方案中,至少一种(一种或多种)gRNA能够结合/结合至RNA的编码链。在一些实施方案中,gRNA能够结合/结合至RNA的非编码链。在一些实施方案中,gRNA结合病毒/细菌基因组RNA(正义或负义或编码或非编码链)。在一些实施方案中,gRNA结合来自病毒/细菌基因组DNA的转录RNA(正义或负义或编码或非编码链)。

在一个优选的实施方案中,所述至少一种(一种或多种)gRNA能够与所述一种或多种靶标RNA分子的5'-和/或3'-非翻译区杂交/结合或杂交/结合,或能够杂交/结合至所述一种或多种靶标RNA分子的5'-和/或3'-非翻译区(参见图7a)。术语“非编码区”/“非编码序列”可以与术语“非翻译区”互换使用。由于这两个区域存在于任何病毒/细菌的基因组和所有亚基因组mRNA中,因此Cas13的抗病毒/抗菌效果在这些位置处最强。

此外,所述组合物包含的所述gRNA也可由核苷酸序列编码。换言之,所述gRNA还可以以包含编码所述gRNA的核苷酸序列的核酸分子的形式引入。上文关于编码所述Cas13蛋白的核苷酸序列所列举的定义和优选实施方案加以必要的修改也适用于编码所述gRNA的核苷酸序列。

作为对本文其它地方所述的包含所述新型CRISPR系统的所述组合物的另外修饰,编码所述gRNA的核苷酸序列与一种tRNA的融合证明是有利的,因为这支持gRNA的折叠(参见图3)。由此,如本文其它地方所定义的,将所述tRNA直接融合到编码所述gRNA的核苷酸序列的3'端,优选地,其中所述核苷酸序列是DNA。因此,本文还包含这样的组合物,其中编码所述gRNA的DNA核苷酸序列与tRNA在所述核苷酸序列的3'端直接融合。可以使用本领域技术人员已知的任何tRNA。细胞中所选tRNA的优势通常反映了肽合成中最常使用的密码子。因此,可以基于如本文其它地方定义的密码子优化来定制基因以在给定生物体中实现最佳基因表达。优选地,将具有SEQ ID NO:8所示氨基酸序列的、衍生自鼠γ-疱疹病毒68(MHV68)的tRNA用于所述融合。在此上下文中,并且对于与核酶的融合,可以应用如本文其它地方定义的“衍生自”的定义,指也与tRNA或与其所衍生自的核酶具有至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或甚至至少约99%的RNA序列同一性。本发明还包括,所述tRNA可通过本文定义的连接子与本文其它地方定义的所述gRNA融合。

或者,编码所述gRNA的所述核苷酸序列(其中所述序列优选指DNA序列)也可如本文所定义直接与核糖核酸酶(简称:核酶)融合。“核酶”是具有催化特定生化反应能力的RNA分子,所述特定生化反应包括本领域技术人员已知的基因表达中的RNA剪接。在本文中可以将天然或甚至合成的核酶用于所述融合。在优选的实施方案中,所述核酶如本文其它地方所定义的那样衍生自具有SEQ ID NO:9所示的氨基酸序列的丁型肝炎病毒(HDV)。与本文所用和定义的tRNA不同,该tRNA在一段时间后可以被RNAse P和RNAse Z裂解,这产生所述gRNA的清晰的确定的末端,优选产生所述gRNA的清晰的确定的3’-末端,本文所用核酶从所述gRNA切除其自身,然而也产生所述gRNA的清晰的确定的末端,优选产生所述gRNA的清晰的确定的3’-末端-这两种修饰随后都将导致本文所述的效率改善。

本发明的主题还在于与编码所述gRNA的所述核苷酸序列融合的分离的核酶或核酶部分(参见图3)。这种核酶包含与所述序列特异性共价融合的基序,结果是核酶与该序列特异性连接。本发明的核酶可以是连续序列,或者可以由两个彼此相互作用形成完整核酶的非连续组分组成。所述两个非连续组分是与所述序列特异性共价融合的核酶区段和含有剩余核酶的核酶区段。

与所述核苷酸序列特异性共价融合的核酶RNA以核酶存在(为核酶的组成或区段),该核酶是连续序列(整个核酶是一个连续的序列)或由两个非连续组分组成:一个组分含有与所说序列特异性共价融合的核酶RNA,另一组分含有核酶序列的剩余部分。剩余的核酶序列是与共价融合所说序列的组分组合构成完整核酶的核酶序列。与所述序列共价融合的核酶序列或区段的长度可以短至一个核苷酸,并且可以来自核酶中的任何位置(例如5'端、内部区段、3'端)。在一个实施方案中,核酶区段包括1个至约18个核苷酸,比如核酶的第1个至约第18个核苷酸(从5'端开始)。在进一步的实施方案中,核酶区段是核酶的前13-18个核苷酸(从5'端开始)(例如,从5'端开始的前13、14、15、16、17或18个核苷酸)。另一组分是剩余的核酶序列(形成功能性核酶所必需的核酶的剩余部分)。两个核酶组分彼此相互作用形成功能性(完整)核酶。核酶RNA的5'末端任选地包含三个磷酸基团或mRNA帽,例如7-甲基鸟苷酸三磷酸。因此,本文还包括,编码所述gRNA的所述核苷酸序列与本文所定义的核酶RNA共价融合。优选地,如本文其它地方所定义的所述核酶如本文其它地方所定义的直接融合至编码所述gRNA的核苷酸序列的3'端,优选地,其中所述核苷酸序列为DNA。因此,本文还包括这样的组合物,其中编码所述gRNA的DNA核苷酸序列与本文其它地方定义的核酶在所述核苷酸序列的3'端直接融合。

如上所述,直接融合至编码所述gRNA的DNA核苷酸序列的所述tRNA和/或所述核酶的融合可以是共价的。因此,本发明还包括编码所述gRNA的所述核苷酸序列(DNA序列)与tRNA和/或核酶(直接)共价融合。在本上下文中,当使用术语“共价融合”时,在编码本发明所述gRNA的核苷酸序列与如上定义的tRNA或核酶之间形成共价键。在这些实施方案中,术语“直接”同样是指编码所述gRNA和tRNA和/或核酶的核苷酸序列依次排列,而不含本文其它地方定义的连接子。

在优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约26至约30个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在另一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约27至约30个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在又一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约28至约30个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在再一优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约29至约30个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约26个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在另一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约27个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在又一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约28个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在再一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约29个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。在另又一甚至更优选的实施方案中,本文还设想了包含CRISPR系统的组合物,所述组合物包含i)编码所述至少一种Cas13蛋白的核苷酸序列,所述Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS融合,和ii)编码如本文定义的所述至少一种gRNA的核苷酸序列,其中所述gRNA具有约30个核苷酸的长度和其中编码所述gRNA的所述核苷酸序列还与如所定义的tRNA或核酶融合。

向导RNA核苷酸序列和/或Cas核苷酸序列可以功能性地或可操作地连接至调节元件,从而调节元件驱动表达。启动子可以是组成型启动子和/或条件型启动子和/或诱导型启动子和/或组织特异性启动子。合适的启动子先前已经提及,并且可以进一步选自RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯氏肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、3-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、EF1α启动子和U6启动子、TetOn/Off、7SK、CAG、CBh、UbC或任何四环素依赖性或干扰素依赖性启动子。

本发明还包括的是包含如本文其它地方定义的所述CRISPR系统的组合物,其中编码如本文其它地方定义的所述Cas13蛋白和/或所述gRNA的核苷酸序列可以进一步在RNA水平上修饰。换言之,编码如本文定义的所述Cas13蛋白和/或所述gRNA的RNA序列可以包含经修饰的UTR(参见图15)、5’CAP结构的转录后添加或共转录添加,优选为5’CAP结构的转录后添加、N1-甲基假尿苷对UTP的替换,和/或2'-O-甲基-3’P-硫代酸对所述gRNA的两个5'和/或3'末端核苷酸的替换(参见图10A)。还包括在本文中,并且为了增强表达和降低可能的毒性,作为上述修饰替代或补充,如本文其它地方定义的编码所述Cas13蛋白和/或所述向导RNA的核苷酸序列可以如使用假-U和/或5-甲基-C进行修饰,以使其包含一个或多个修饰的核苷。在优选的实施方案中,本发明包括包含本文其它地方定义的所述CRISPR系统的组合物,其中编码本文其它地方定义的所述gRNA的核苷酸序列通过2'-O-甲基-3’P-硫代酸(也称为2'-O-甲基-硫代磷酸)对所述gRNA的两个5'和/或3'末端核苷酸的替换而进一步被修饰。

使用来自β-珠蛋白聚A尾(一串120个或更多个腺嘌呤)的5'和/或3’UTR的修饰UTR可以稳定所述RNA。另外,所述转录后或共转录5’端帽(5’CAP)是本发明RNA转录物的5'末端上特别改变的核苷酸,它保护mRNA免受核酸外切酶的降解,并且对于从细胞核中放出和翻译的启动也是重要的。另一个关键的进步可以在通过用修饰的碱基替换标准碱基(例如用假尿苷替换尿苷)来制备化学修饰的mRNA中看到。由此,mRNA的半衰期、翻译效率和其免疫学特性得到改善。与未修饰的mRNA相比,N1-甲基-假尿苷导致更有效的翻译,同时抑制先天免疫应答,因此是优选的。可以稳定gRNA的最后修饰(2'-O-甲基-3’P-硫代酸对所述gRNA的两个5'和/或3'末端核苷酸的替换)包括该RNA的糖上的2'OH可以被甲基基团替换,并且该RNA骨架中的磷酸二酯键可以被硫修饰,由此该gRNA变得对RNA酶具有抗性。对所述RNA的上述每种修饰的任意组合也可包含在本文中。

所述RNA(Cas13 mRNA和/或gRNA)的这些修饰提高了Cas13蛋白的RNA递送的敲低效率(参见图10B或图15)。因此,通过对本发明组合物中包含的所述CRISPR系统所包含的编码如本文所定义的所述Cas13蛋白和/或所述gRNA的所述RNA应用另外的修饰,可以再次导致Cas13蛋白的敲低效率增加,如本发明已经描述的,除了融合至少一个融合至NES的至少一个NLS的融合之外,将应用于所述系统的另外修饰用作其它修饰。因此,本发明的组合物所包含的CRISPR系统的编码如本文所定义的所述Cas13蛋白和/或所述gRNA的所述RNA序列可以另外(除了如本发明所提及的所述系统的所述其它修饰之外)包含选自如下的任意修饰:如本文所定义的经修饰的UTR、经修饰的核苷(例如使用假-U和/或5-甲基-C)、转录后或共转录(优选转录后)的5’CAP结构、N1-甲基假尿苷对UTP的替换以及2'-O-甲基-3’P-硫代酸对所述gRNA的两个5'和/或3'末端核苷酸的替换。在一个具体实施方案中,本发明组合物所包含的CRISPR系统的所述RNA序列(其编码如本文所定义的所述Cas13蛋白和/或所述gRNA)可以另外(除了如本发明所提及的所述系统的所述其它修饰之外)包含经修饰的3’UTR,特别地包含具有SARS-CoV-2敲低的N基因和/或RdRP基因敲低的3’UTR(参见图15)。

本发明还包括的是包含如本文其它地方定义的所述CRISPR系统的组合物,其中编码如本文其它地方定义的所述Cas13蛋白和/或所述gRNA的核苷酸序列可以进一步在DNA水平上修饰,这种修饰包括将编码gRNA的核苷酸序列(优选地,其中该核苷酸序列是DNA)与至少一种病毒输出元件融合。证明了编码所述gRNA的核苷酸序列与本文所定义的至少一种病毒输出元件的融合是有利的,因为这甚至更大地增加了敲低效率(参见图16)。然后,如本文其它地方所定义的,将如本文所定义的所述至少一个病毒输出元件融合至编码所述gRNA的核苷酸序列的5'端,优选地,其中所述核苷酸序列是DNA。在本上下文中,融合意指编码所述gRNA的核苷酸序列和至少一种病毒输出元件通过连接子融合,比如通过任何核苷酸连接子融合。因此,本文还包含这样的组合物,其中编码所述gRNA的DNA核苷酸序列经由连接子(比如任何核苷酸连接子)与本文定义的至少一种病毒输出元件在所述核苷酸序列的5'端融合。术语“至少一种病毒输出元件”意指也可使用两种、三种、四种、五种或更多种如本文所定义的病毒输出元件。在一个优选的实施方案中,所述至少一种病毒输出元件是CTE或VARdm,优选地为CTE,其如本文所定义与编码所述gRNA的核苷酸序列(优选地为DNA序列)融合。总之,NLS-NES和CTE-gRNA的组合使敲低效率最大化。与gRNA的这种融合也可以在所述组合物的蛋白质水平上进行。

另外,本发明人还发现,包含如本文其它地方定义的所述新型CRISPR系统的所述组合物在哺乳动物细胞中具有旁切RNAse-活性(参见图5)。由此得出这样的结论,包含所述至少一种Cas13蛋白的组合物的所述修饰系统可另外具有非特异性RNAse-活性,其超出了针对由所述至少一种RNA杂交/由所述Cas13蛋白切割的互补靶序列的作用,并且尤其针对核糖体RNA(rRNA)。换言之,不仅结合的靶标RNA被切割/降解,而且发生旁观者效应(所谓的旁切活性),其中邻近的RNA(主要是rRNA)也被降解。所述组合物包含的所述系统的所述额外活性可存在于所有种类的哺乳动物细胞中。此类哺乳动物细胞的实例可以是小鼠成神经细胞瘤(N2a)、小鼠成肌细胞(C2C12)、人胶质母细胞瘤(U87M)、人肝癌细胞(HepG2)、小鼠小胶质细胞(BV-2)或原代细胞。

通过应用如本文修饰的新系统,甚至增强了根据本发明的所述系统对除如本文定义的一种或多种靶标RNA分子之外的作为旁切靶标的病毒或细菌rRNA的切割。因此,通过组合物所包含的所述系统的这种旁切活性,另外地降低了病毒或细菌的必需结构蛋白的形成。这被认为是另外的机制,以便通过进一步减慢细胞中的病毒复制来降低例如病毒负荷(参见图5)。

通过与28S rRNA的特异性结合来显示Cas13蛋白主要针对rRNA的这种旁切RNA-se活性。换言之,包含如本文定义的所述特定系统的组合物能够结合并切割28S rRNA。本发明人已经实验证明,核糖体RNA的减少可能导致细胞中由于核糖体量减少而引起的暂时翻译阻断,这意味着所述病毒或细菌也可以在更高水平的受到攻击。(参见图8)。因此,组合物中包含的所述系统可优选28S核糖体RNA的限定位置,这就是所述Cas13蛋白可首先切割其靶标RNA的原因。只有当发现靶标RNA时,Cas13蛋白才被激活,并且还可以切割核糖体RNA的限定位置,这最终导致蛋白翻译的瞬时抑制(也参见图6D和E;图9)。

可以使用任何合适的载体递送诸如Cas13蛋白的CRISPR蛋白和/或任何本发明的RNA(例如向导RNA),所述合适的载体例如质粒或病毒载体,比如腺相关病毒(AAV)、慢病毒、腺病毒或其它病毒载体类型或它们的组合。可以将这些蛋白质和一种或多种向导RNA包装到一种或多种载体中,例如质粒或病毒载体中。在一些实施方案中,通过例如肌内注射将载体(例如质粒或病毒载体)递送至目的组织,而其他时间的递送是通过静脉内、经皮、鼻内、口服、粘膜或其他递送方法。这种递送可以是通过单剂量或多剂量。本领域技术人员理解,本文递送的实际剂量可以根据多种因素而极大地变化,所述因素例如载体选择、靶细胞、生物体或组织、如本文其它地方提及的待治疗受试者的一般状况、寻求的转化/修饰的程度、施用途径、施用方式、寻求的转化/修饰的类型等。此类剂量可进一步包含本文其它地方定义的载体。

在本文的一个实施方案中,通过腺病毒递送包含基于DNA水平的所述系统的所述组合物,其可以是单次加强剂量。在本文的另一个实施方案中,通过多剂量递送腺病毒。在本文的另一个实施方案中,通过质粒递送包含基于DNA水平的所述系统的所述组合物。在这样的质粒组合物中,剂量应该是引发应答的足够量的质粒。例如,质粒组合物中质粒DNA的合适量可以是每70kg个体约0.1至约2mg,或约1μg至约10μg。本发明的质粒通常包含(i)启动子;(ii)编码如本文定义的Cas13蛋白的序列,其与所述启动子可操作地连接;(iii)选择标志物;(iv)复制起点;和(v)在(ii)下游并与其可操作地连接的转录终止子。优选地,质粒还编码CRISPR复合物的RNA组分,例如包含编码如本文定义的所述gRNA的核苷酸序列,但这些中的一种或多种可以替代地在不同的载体上编码。在本文的另一个实施方案中,包含基于DNA水平的所述系统的所述组合物通过本文其它地方定义的颗粒和/或纳米颗粒递送。

在一些实施方案中,本发明的包含基于RNA水平(包括例如编码所述Cas13蛋白的mRNA和已经化学合成的gRNA)以及基于蛋白质水平(包括Cas13蛋白和已经化学合成的gRNA)的所述系统的所述组合物在脂质体或脂质转染体制剂等中递送,并且可以通过本领域技术人员熟知的方法制备。这些方法描述在例如美国专利5,593,972、5,589,466和5,580,859中,它们通过引用并入本文。因此,可以以RNA形式,并且通过脂质体、颗粒微囊泡递送本发明的编码Cas13蛋白的核苷酸序列的递送和/或gRNA。例如,可将Cas13 mRNA和gRNA包装到脂质体颗粒中用于体内递送。

脂质体是球形囊泡结构,由包围内部水性区室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂双层组成。脂质体作为药物递送载体已经获得了相当大的关注,原因在于它们是生物相容的、无毒的,可以递送亲水性和亲脂性药物分子,保护它们的货物不被血浆酶降解,并且将它们的负载转运穿过生物膜和血脑屏障(BBB)。脂质体可以由几种不同类型的脂质制成;然而,磷脂最常用于产生作为药物载体的脂质体。诸如来自LifeTechnologies的lipofectamine的脂质体转染试剂和市场上的其它试剂可以有效地将RNA分子递送到肝脏中。

通常,将颗粒定义为相对于其传输和性质表现为整体单元的小物体。根据直径进一步对颗粒进行分类。粗颗粒覆盖2,500至10,000纳米的范围。细颗粒的尺寸在100至2,500纳米之间。超细颗粒或纳米颗粒的尺寸通常在1和100纳米之间。100nm极限的基础是这样的事实,即,使颗粒与本体材料区分的新颖特性通常在小于100nm的临界长度尺度上产生。本发明范围内的颗粒递送系统可以以任何形式提供,包括但不限于固体、半固体、乳液或胶体颗粒。因此,本文所述的任何递送系统,包括但不限于,例如,基于脂质的系统、脂质体、胶束、微囊泡、外泌体(exosomes)或基因枪,可以作为本发明范围内的颗粒递送系统提供。通常,“纳米颗粒”是指直径小于1000nm的任何颗粒。

RNA/蛋白质的递送方式还优选包括通过纳米颗粒(Cho,S.,Goldberg,等,Advanced Functional Materials,19:3112-3118,2010)或外泌体(Schroeder,A.,等,,Journal of Internal Medicine,267:9-21,2010)递送RNA或蛋白质。在一些优选的实施方案中,本发明的纳米颗粒具有500nm或更小的最大尺寸(例如直径)。在其它优选的实施方案中,本发明的纳米颗粒具有25nm-200nm的最大尺寸。在其它优选的实施方案中,本发明的颗粒具有100nm或更小的最大尺寸。在其它优选的实施方案中,本发明的纳米颗粒具有35nm-60nm的最大尺寸。外泌体是转运RNA和蛋白质的内源性纳米囊泡,并且其可以将RNA递送至脑和其它靶器官。事实上,已证明外泌体在递送siRNA中特别有用,所述siRNA是一种与RNA靶向系统有些相似的系统。关于DNA递送(AAV、慢病毒等)或RNA/蛋白质递送(脂质体、颗粒、外泌体等)的递送系统的更多细节描述于US20200165594中,其通过引用并入本文。

也可以分开递送CRISPR Cas13 mRNA和gRNA。可以在gRNA之前递送CRISPR Cas13mRNA以给予CRISPR Cas13蛋白表达的时间。可以在施用gRNA之前1-12小时(优选约2-6小时)施用CRISPR Cas13 mRNA。或者,CRISPR Cas13 mRNA和gRNA可以一起施用。有利地,可在CRISPR Cas13 mRNA+gRNA的初始施用后1-12小时(优选约2-6小时)施用第二加强剂量的gRNA。

也可以分开递送CRISPR Cas13蛋白和gRNA。优选地,CRISPR Cas13蛋白和gRNA一起递送。在所述递送之前,可以将所述蛋白质和所述gRNA混合并冷冻为复合物,直至施用该复合物。有利地,可在CRISPR Cas13蛋白+gRNA的初始施用后1-12小时(优选约2-6小时)施用第二加强剂量的gRNA。

靶标RNA分子

如本文已经提到的,所述至少一种gRNA能够与一种或多种靶标RNA分子杂交。在CRISPR复合物形成的上下文中,“靶标序列”是指这样一种序列,其中将向导序列(gRNA的一部分)设计成与该序列具有如本文其它地方定义的互补性,其中靶标序列与向导序列之间的杂交促进CRISPR复合物的形成。靶标序列可以包括RNA多核苷酸。术语“靶标RNA分子”是指作为或包含靶标序列的RNA多核苷酸(靶标RNA)。换言之,靶标RNA可以是RNA多核苷酸或RNA多核苷酸的一部分,其中gRNA(即向导序列)的一部分被设计为与该靶标RNA具有本文所述的互补性,并且包含CRISPR效应蛋白和gRNA的复合物介导的效应物功能将被引导至该靶标RNA。在一些实施方案中,靶标RNA分子和靶标RNA序列位于细胞的细胞核和/或细胞质中。靶标RNA,即目的RNA,是本发明靶向的RNA,其导致Cas13蛋白募集到靶标RNA上的目的靶位点处并与其结合。一种或多种靶标RNA分子可以是任何合适形式的RNA。在一些实施方案中,这可以包括mRNA。在其它实施方案中,一种或多种靶标RNA分子可以包括tRNA或rRNA。在其它实施方案中,所述一种或多种靶标RNA分子可以包括miRNA。在其它实施方案中,一种或多种靶标RNA分子可以包括siRNA。

在一些实施方案中,包含靶标序列的一种或多种靶标RNA分子或靶标序列本身可以是RNA分子内的序列,所述RNA分子选自信使RNA(mRNA)、前mRNA、核糖体RNA (rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小核RNA (snRNA)、小核仁RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA (scRNA)。在一些优选的实施方案中,包含靶标序列的一种或多种靶标RNA分子或靶序列本身可以是RNA分子内的序列,所述RNA分子选自mRNA、前mRNA和rRNA的序列。在一些其它优选的实施方案中,包含靶标序列的一种或多种靶标RNA分子或靶标序列本身可以是RNA分子内的的序列,所述RNA分子选自ncRNA和lncRNA。在一些其它优选的实施方案中,包含靶标序列的一种或多种靶标RNA分子或靶标序列本身可以是mRNA分子或前mRNA分子内的序列。

因此,能够如本文其它地方所定义的与一种或多种靶标RNA分子杂交的至少一种gRNA还可以包括与一种或多种RNA靶标序列的杂交。优选地,通过靶向一种或多种靶标RNA分子/RNA靶标序列,本文其它地方定义的一定程度上与所述分子/靶标序列互补的至少一种gRNA聚集于本文其它地方已经定义的所述RNA分子(mRNA分子)的5'和/或3'非翻译区/部分。

在优选的实施方案中,所述一种或多种靶标RNA分子是病毒或细菌靶标RNA分子。在具体的实施方案中,病毒是RNA病毒。在进一步的实施方案中,病毒是单链或双链RNA病毒。在进一步的实施方案中,病毒是正义RNA病毒或反义RNA病毒或双义RNA病毒。在进一步的实施方案中,病毒是逆转录病毒科病毒、慢病毒科病毒、冠状病毒科病毒、小核糖核酸病毒科病毒、杯状病毒科病毒、黄病毒科病毒、披膜病毒科病毒、Bomaviridae、丝状病毒科、副粘病毒科、肺病毒科、弹状病毒科、沙粒病毒科、布尼亚病毒科、正粘病毒科或德尔塔病毒。在具体实施方案中,病毒选自淋巴细胞性脑膜脊髓炎病毒、冠状病毒、HIV、SARS、委内瑞拉马脑炎(VEE)病毒、脊髓灰质炎病毒、鼻病毒、甲型肝炎、诺沃克病毒、黄热病毒、西尼罗病毒、丙型肝炎病毒、登革热病毒、寨卡病毒、风疹病毒、罗斯河病毒、辛德毕斯病毒、基孔肯雅病毒、博尔纳病病毒、埃博拉病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、尼帕病毒、亨得拉病毒、新城疫病毒、人呼吸道合胞病毒、狂犬病病毒、拉沙病毒、汉坦病毒、克里米亚-刚果出血热病毒、流感和丁型肝炎病毒。在另一个具体实施方案中,病毒是DNA病毒。在进一步的实施方案中,病毒是单链或双链DNA病毒。在进一步的实施方案中,病毒是正义DNA病毒或负义DNA病毒或双义DNA病毒。在进一步的实施方案中,所述病毒是肌病毒科、短尾噬菌体科、长尾噬菌体科、异疱疹病毒科、疱疹病毒科(包括人疱疹病毒和水痘病毒)、软体动物疱疹病毒科、脂毛噬菌体科、古噬菌体科、腺病毒科、瓶状病毒科、囊泡病毒科、阿斯法病毒科(包括非洲猪瘟病毒)、杆状病毒科、Cicaudaviridae、棒状病毒科、覆盖噬菌体科、微小纺锤形噬菌体科、球状病毒科、滴状病毒科、肥大唾腺炎病毒科、虹彩病毒科、Maseilleviridae、拟菌病毒科、裸杆状病毒科、线极病毒科、Pandoraviridae、乳头瘤病毒科、藻类去氧核糖核酸病毒科、芽生噬菌体科、多核糖核酸病毒、多瘤病毒科(包括猿猴病毒40、JC病毒、BK病毒)、痘病毒科(包括牛痘和天花)、Sphaerolipoviridae、复层病毒科、Turriviridae、Dinodnavirus、盐末端蛋白病毒或Rhizidovirus。在一些示例性实施方案中,病毒可以是逆转录病毒。逆转录病毒的实例可以包括以下病毒属或病毒科的一种或多种或它们的任意组合:甲型逆转录病毒属、乙型逆转录病毒属、丙型逆转录病毒属、丁型逆转录病毒属、戊型逆转录病毒属、慢病毒属、泡沫病毒属,或转座病毒科、假病毒科和逆转录病毒科(包括HIV)、肝脱氧核糖核酸病毒科(包括乙型肝炎病毒)和花椰菜病毒科(包括花椰菜花叶病毒)。在一些实施方案中,病毒是药物抗性病毒,因此属于本文其它地方定义的多重抗性病菌。作为实例,并且没有限制,病毒可以是利巴韦林抗性病毒。利巴韦林是一种非常有效的抗病毒药物,其命中许多RNA病毒。在更优选的实施方案中,本发明通篇使用的术语“病毒”指冠状病毒、甲型流感病毒、埃博拉病毒、麻疹病毒、肝炎病毒、黄病毒如TBE病毒、登革热病毒、黄热病毒和/或寨卡病毒。

关于细菌靶标RNA分子,可以包含来自任何细菌的如本文定义的任何RNA分子,其可以与如本文定义的所述gRNA杂交。由于细菌还包含RNA,似乎合理地证明了包含所述CRISPR系统的所述组合物还可以用于靶向一种或多种细菌RNA分子。在一些实施方案中,细菌是药物抗性细菌,因此属于多重抗性病菌。作为实例,并且没有限制,抗性细菌可以是金黄色葡萄球菌、肺炎链球菌、凝固酶阴性的葡萄球菌、粪肠球菌、粪肠球菌、大肠杆菌、佛里德兰德氏杆菌、克雷伯肠杆菌、赤红杆菌、枸橼酸杆菌属、铜绿假单胞菌、鲍曼不动杆菌和斯特诺托菌属麦芽糖菌。如本文所用的这种多重抗性病菌指微生物(如病毒或细菌)的物种,其包括对至少一种本领域技术人员已知的抗微生物药物的抗微生物抗性。

因此,本发明还包括的是,本文定义的所述组合物适于灭活细菌或病毒单链(ss)RNA。在本上下文中,术语“灭活/失活(inactiving)”或“灭活/失活(inactivate)”或“灭活/失活(inactivation)”是指包含如本文定义的所述CRISPR系统的组合物,其中所述至少一种Cas13蛋白与至少一种gRNA形成复合物,并且其中至少一种gRNA将复合物引导至一种或多种靶标RNA分子,Cas13蛋白不仅靶向/检测一种或多种靶标RNA分子,而且还切割/降解所述靶标RNA分子。因此,术语“切割(cleaving/cleave/cleavage)”或“降解(degrading)”、“降解(degrade)”或“降解(degradation)”也可与术语“灭活(inactiving)”、“灭活(inactivate)”或“灭活(inactivation)”互换使用。

药物组合物

根据本发明,如本发明通篇定义的组合物可以进一步包含至少一种如本文其它地方定义的载体。本发明还涉及如本文所定义的所述组合物,其是药物组合物。因此,所述药物组合物在此用于治疗目的。此外,本发明涉及如上文所公开的所述组合物用于制备药物组合物的用途。

根据本发明,术语“药物组合物”涉及一种用于向患者、优选地向人类患者施用的组合物。药物组合物或制剂通常是这样的形式,该种形式允许活性成分的生物活性是有效的,并且因此可以如本文所述的那样施用于受试者用于治疗用途。该药物组合物可通过吸入、注射、输注或口服施用。因此,药物组合物可以是用于口服、肠胃外、经皮、腔内、动脉内、静脉内、鞘内和/或鼻内施用或用于直接注射到组织中的组合物。可以以合适的剂量将药物组合物施用于受试者。剂量方案将由主治医师和临床因素确定。如医学领域所熟知的,用于任一患者的剂量取决于许多因素,包括患者的体型、体表面积、年龄、待施用的具体化合物、性别、施用时间和途径、一般健康状况和同时施用的其它药物。

本发明还可以涵盖如本文定义的药物组合物,其进一步包含至少一种药学上可接受的载体。因此,本发明的治疗组合物进一步包含药学上可接受的载体、稀释剂或赋形剂。所述的这些术语可以互换使用。所述药学上可接受的载体(也称为赋形剂或稀释剂)包括本身不会引起对接受该药物组合物的受试者有害的不良反应的任何赋形剂/载体/稀释剂。

合适的载体通常是大的、代谢缓慢的大分子,例如蛋白质、多糖、聚乳酸、聚乙醇酸、聚合氨基酸、氨基酸共聚物和脂质聚集体,比如油滴或脂质体。与本发明的(药物)组合物组合使用的载体可以是水基的并且形成水性溶液。包含本发明系统的油基载体溶液是水性载体溶液的替代方案。水性或油基溶液还含有增稠剂,以提供具有搽剂、霜剂、软膏剂、凝胶剂等的粘度的(药物)组合物。合适的增稠剂是本领域技术人员熟知的。

根据本发明的药学上可接受的载体包括,作为说明而非限制,稀释剂,崩解剂,粘合剂,黏合剂,润湿剂,聚合物,润滑剂,助流剂,加入以掩盖或抵消不良质地、味道或气味的物质,调味剂,染料,芳香剂和加入以改善所述组合物外观的物质。可接受的赋形剂包括乳糖、蔗糖、粉状淀粉、玉米淀粉或它们的衍生物,烷酸的纤维素酯,纤维素烷基酯,滑石,硬脂酸,硬脂酸镁,氧化镁,磷酸和硫酸的钠盐和钙盐,明胶,阿拉伯树胶,海藻酸钠,聚乙烯吡咯烷酮和/或聚乙烯醇,盐水,右旋糖,甘露醇,乳糖,卵磷脂,白蛋白,谷氨酸钠,盐酸半胱氨酸等。用于软明胶胶囊的合适载体的实例包括:植物油,蜡,脂肪,半固体和液体多元醇。用于制备溶液和糖浆的合适载体包括而不限于水,多元醇,蔗糖,转化糖和葡萄糖。用于可注射溶液的合适载体包括而不限于水,醇,多元醇,甘油和植物油。药物组合物可另外包括防腐剂,增溶剂,稳定剂,润湿剂,乳化剂,甜味剂,着色剂,调味剂,缓冲剂,包衣剂或抗氧化剂。合适的药物载体记载于Remington的Pharmaceutical Sciences,(马克出版公司),其是本领域的标准参考书。

此外,(药物)组合物的载体还可以指稀释剂,比如水、盐水、甘油、乙醇、抑菌注射用水(BWFI)、林格氏溶液、葡萄糖溶液或盐和/或缓冲液的水性溶液等。此外,对于制剂目的所必需的物质可以作为可接受的载体包含在所述组合物中,例如本领域技术人员已知的乳化剂、稳定剂、表面活性剂和/或pH缓冲物质。

所述稳定剂可以作为张力调节剂。术语“稳定剂”是指改善或增强制剂,特别是包含在所述(药物)组合物中的系统的稳定性的试剂。作为张力调节剂的稳定剂可以是非还原糖、糖醇或其组合。本发明(药物)组合物的张力调节剂确保溶液的张力(即摩尔渗透压浓度)基本上与正常生理液体相同,并因此可以防止由于组合物和生理液体之间的离子浓度不同而导致的施用后组合物的溶胀或快速吸收。优选地,稳定剂/张力调节剂是一种或多种非还原糖(比如蔗糖或海藻糖),或一种或多种糖醇(比如甘露醇或山梨醇),同样优选非还原糖和糖醇的组合。

在本发明的(药物)组合物中,表面活性剂的添加可用于减少储存期间的蛋白质降解。聚山梨醇酯20和80(吐温20和吐温80)是用于此目的公认的赋形剂。本领域普通技术人员将理解,可以以任何适当的顺序对要包括在制剂中的各种组分进行组合。本领域普通技术人员还应当理解,这些化学品中的一些在一些组合中可能不相容,因此容易被具有类似性质但在相关混合物中相容的不同化学品替代。

本文所用的术语“缓冲剂”包括将pH保持在所需范围内的那些试剂。缓冲剂是由弱酸和其共轭碱或弱碱和其共轭酸的混合物组成的水性溶液。缓冲剂具有当加入少量强酸或强碱时溶液的pH变化非常小的性质。在各种化学应用中,缓冲溶液被用作将pH保持在几乎恒定的值的手段。通常,当在本发明的制剂中应用缓冲剂时,缓冲剂优选稳定包含在本发明的所述(药物)组合物中的系统。

此外,药物组合物可以包含一种或多种佐剂。术语“佐剂”根据其众所周知的含义与药物组合物一起使用。具体地,佐剂是免疫试剂,其修饰,优选增强所述组合物的效果,同时当其本身被给予时,如果有的话,对免疫系统具有很少的期望的免疫原性效果。合适的佐剂可以是无机佐剂或有机佐剂,所述无机佐剂比如如铝盐(如磷酸铝、氢氧化铝)、单磷酰脂质A,所述有机佐剂比如角鲨烯或油基佐剂,以及病毒小体(virosome)。

本发明的所述(药物)组合物可以是液体组合物,优选为水性组合物。本文还包括如本文所定义的(药物)组合物的干燥或冷冻形式。在本上下文中,冷冻形式可以指至少约-20℃的组合物,包括例如至少约-30℃、至少约-40℃、至少约-50℃、至少约-60℃、至少约-70℃、至少约-80℃或更高的组合物。优选地,所述(药物)组合物是液体组合物,甚至更优选为水性组合物。因此,所述(药物)组合物可以直接以液体形式储存以备以后使用,以冷冻状态储存并在使用前解冻,或以干燥形式(例如冻干、风干或喷雾干燥形式)制备,以备以后在使用前重构成液体形式或其它形式。因此,设想本文所述的(药物)组合物可以通过本领域技术人员已知的任何方法储存。非限制性实例包括冷却、冷冻、冻干和喷雾干燥制剂,其中优选通过冷却储存。

体内治疗应用

本发明还涉及如本文其它地方定义的组合物,其用作药物。因此,本发明的组合物也可用于治疗,即治疗如本文所定义的需要本申请的组合物的诊断应用的受试者中的病毒和/或细菌疾病。因此,本发明的组合物特别适合用在预防或治疗有此需要的受试者的病毒和/或细菌疾病的方法中。

因此,本发明还提供了用于预防或治疗受试者中的病毒和/或细菌疾病的方法,所述方法包括向有此需要的受试者施用治疗有效量的本发明的组合物。

因此,本文所用的术语“治疗/处理(“treat”、“treating”或“treatment”)”是指减轻(减缓(减轻))、稳定或抑制或至少部分缓解或消除与相应疾病相关的症状的进展。因此,其包括将包含所述系统的所述组合物,优选以药物的形式,施用于本文其它地方定义的受试者。需要治疗的那些受试者包括已经患有疾病的那些受试者,所述疾病在此为如本文其它地方所述的病毒和/或细菌疾病。优选地,治疗减轻(减缓(减轻))、稳定、或抑制或至少部分缓解或消除与疾病或病理状况的存在和/或进展相关的症状的进展。“治疗/处理”是指治疗性治疗。特别地,在本发明的上下文中,治疗或处理是指在有此需要的受试者中与如本文其它地方定义的所述病毒和/或细菌疾病相关的症状的改善。在本上下文中,术语“治疗/处理”是指直接攻击本文定义的特定病毒/细菌的靶标(病毒和/或细菌)RNA分子序列的抗病毒和/或抗细菌疗法。因此,如本文所定义的包含所述系统的组合物也可用作抗病毒和/或抗细菌治疗剂。

如本文所用的术语“预防(“prevent”、“preventing”或“prevention”)”是指预防性或防止性措施,其中受试者预防生物体中的异常(包括病理性)状况,该种异常的状况随后将导致确定的疾病,即如本文所定义的所述病毒和/或所述细菌疾病。换言之,所述术语是指其目的在于预防疾病的医疗程序,这意味着抑制受试者将可能患有如本文所定义的任何未来病毒和/或细菌疾病。如本文所用,这些术语还指降低在诊断患有本文定义的任何病毒和/或细菌疾病的患者中获得或发展给定病症的风险。因此,其还包括将包含所述系统的所述组合物,优选以药物的形式,施用于本文其它地方定义的受试者。需要预防的那些受试者包括倾向于患有疾病的那些受试者,所述疾病例如本文定义的所述病毒和/或所述细菌疾病。换言之,需要预防的那些受试者是处于发展这种疾病的风险中并因此在不久的将来可能患上所述疾病的人。因此,本文定义的组合物也可用作预防,而不是作为用于已经感染的本文定义的受试者的治疗剂。这可防止Cas13蛋白被病毒RNA分子淹没。

当在本文中使用时,术语“受试者”包括哺乳动物和非哺乳动物受试者。优选地,本发明的受试者是哺乳动物,包括人、家畜和农场动物、非人灵长类动物和具有乳腺组织的任何其它动物。在一些实施方案中,哺乳动物是小鼠。在一些实施方案中,哺乳动物是大鼠。在一些实施方案中,哺乳动物是豚鼠。在一些实施方案中,哺乳动物是兔。在一些实施方案中,哺乳动物是猫。在一些实施方案中,哺乳动物是狗。在一些实施方案中,哺乳动物是猴。在一些实施方案中,哺乳动物是马。在最优选的实施方案中,本发明的哺乳动物是人。受试者还包括人和兽医的患者。

本文献中描述的用途、试剂盒和组合物通常适用于人类和兽类疾病。当受试者是可以接受本文所述疾病或病症治疗的有生命的人时,其也称为“患者”。在一些实施方案中,本发明的受试者处于发展如本文所述的所述病毒和/或所述细菌疾病的风险中。在一些实施方案中,本发明的受试者患有如本文所述的所述病毒和/或所述细菌疾病。如本文所用的术语“患有”意指受试者不再是健康受试者。术语“健康”意指相应的受试者没有明显的或显著的相应疾病的标志或症状。这进一步意味着患有所述病毒和/或所述细菌疾病的受试者是“需要”采用包含本发明的所述系统的组合物的相应治疗的受试者。需要治疗的那些受试者包括已经患有疾病的那些以及倾向于患有病症的那些或其病症需要被预防(预防(prophylaxis))的那些。

用在预防或治疗患有本文其它地方定义的病毒和/或细菌性疾病的受试者的方法中的本发明的包含所述系统的组合物通常以治疗有效量施用至受试者。所述治疗有效量足以抑制或减轻所述病毒和/或所述细菌性疾病的症状。“治疗效果”或“治疗有效”意指所用的缀合物将引起研究者、兽医、医生或其他临床医师所寻求的组织、系统、动物或人的生物学或医学应答。术语“治疗有效”还指引起或促成疾病或病症的因素的抑制。术语“治疗有效量”包括当施用时足以显著改善所治疗疾病的进展或足以预防所述疾病发展的药剂的量。根据优选的实施方案,治疗有效量足以减轻或治愈如本文定义的所述病毒和/或细菌性疾病。

治疗有效量将根据本发明的所述组合物、疾病及其严重性和受试者的个体因素和/或所述施用(也称为递送)如何起作用而变化。因此,并非所有情况下本发明的组合物均被证明是治疗有效的,因为由于还涉及个体因素,本文公开的方法不能提供受试者是否可以响应于检测系统的100%安全预测。预期年龄、体重、一般健康状况、性别、饮食、药物相互作用等可能对用于治疗患有所述疾病的受试者的化合物是否将是治疗有效的具有普遍影响。

在贯穿本发明的各个方面中使用的术语“施用(“administering”或“administered”或“administration”)”意指将如本文定义的包含所述系统的组合物以适当的形式和剂量并且使用适当的措施给予相应的受试者。本发明的组合物的施用可以通过本领域已知的任何方法进行。

如本文其它地方定义的所述组合物的施用或治疗有效量的所述组合物的施用可以通过吸入、注射、输注或口服进行。如本文其它地方定义的组合物或包含所述组合物的组合物的施用可以腹膜内、静脉内、动脉内、皮下、肌内、肠胃外、透皮、腔内、鞘内和/或鼻内进行,或直接施用到组织中。

当所述组合物通过输注施用时,其可以用含有无菌药用级水或盐水的输注小瓶分散。当所述组合物通过注射施用时,可以提供一安瓿注射用无菌水或盐水,以便在施用前将各成分混合。当组合物通过吸入施用时,可以使用本领域技术人员已知的适当的吸入装置。

在一个具体实施方案中,所述组合物的所述施用包括基于所述组合物是以基于DNA、RNA还是蛋白质的系统递送的事实,通过不同的方法向所述受试者递送。如果所述组合物以基于DNA的系统递送-换言之,当所述组合物可以如本文所定义的作为包含编码如本文所定义的所述Cas13蛋白的核苷酸序列和编码如本文所定义的所述gRNA的核苷酸序列的核酸分子,其中所述核酸分子是DNA,施用时-其可以使用如本文所述的任何载体和/或使用颗粒和/或纳米颗粒来施用,所述载体诸如用于AAV-介导的基因递送的腺相关病毒(AAV)载体或针对所述至少一种gRNA和所述至少一种Cas13基因的表达优化的腺病毒或慢病毒载体。如果所述组合物以基于RNA的系统递送-换言之,当所述组合物可以如本文所定义的作为包含编码如本文所定义的所述Cas13蛋白的核苷酸序列和编码如本文所定义的所述gRNA的核苷酸序列的核酸分子,其中所述核酸分子是RNA,施用时-其可以使用如本领域技术人员已知的包含所述组合物的特定颗粒和/或纳米颗粒和/或脂质体和/或外泌体,优选通过纳米颗粒来施用。如果所述组合物以基于蛋白质的系统递送-换言之,当包含本文其它地方定义的所述至少一种Cas13蛋白和本文所定义的所述至少一种gRNA的所述组合物如本文所定义的施用时-则其也可使用本领域技术人员已知的包含所述组合物的特定颗粒和/或纳米颗粒和/或脂质体和/或外泌体,优选通过纳米颗粒来施用。对于基于RNA和蛋白质的系统,在所述组合物的所述递送之前,已经以正确的形式化学合成了所述至少一种gRNA,而对于基于DNA的系统,可能需要在细胞中转录所述gRNA。

通过使用所述组合物预防或治疗的病毒性疾病可以指由本文其它地方定义的DNA病毒、RNA病毒或逆转录病毒引起的疾病,优选由RNA病毒引起的疾病。在具体的实施方案中,病毒感染由双链RNA病毒、正义RNA病毒、负义RNA病毒或它们的组合引起。在更优选的实施方案中,通过使用所述组合物预防或治疗的病毒性疾病是冠状病毒病、甲型流感、埃博拉、麻疹、丙型肝炎、蜱传脑炎(TBE)、委内瑞拉马脑炎(VEE)病毒感染、登革热、黄热病或寨卡热中的任一种,甚至更优选地为冠状病毒病或流感疾病。“冠状病毒”可以是SARS-CoV、SARS-CoV2或MERS或相关的新的染自动物的或突变的冠状病毒。冠状病毒群组由属于冠状病毒科的包膜正链RNA病毒组成,并包括称为α-、β-、γ-和δ冠状病毒的亚型。α和β影响哺乳动物,而γ影响鸟类,δ可以影响两者。冠状病毒家族包括几个众所周知的致病成员。迄今为止,β冠状病毒家族对人类造成最大的危险,并且现在包括最著名的病毒靶标,包括严重急性呼吸综合征冠状病毒(SARS-CoV-1)、中东呼吸综合征冠状病毒(MERS-CoV)和出现的最新形式的新型冠状病毒(SARS-CoV-2)。在最优选的实施方案中,通过使用包含所述系统的所述组合物预防或治疗的所述病毒性疾病是COVID-19疾病。在COVID-19的情况下,SARS-CoV-2感染的临床范围似乎很广,包括无症状感染、轻度上呼吸道疾病和伴有呼吸衰竭甚至死亡并且许多患者都住院的严重的病毒性肺炎。

由于任何细菌也包含ssRNA,ssRNA可以被靶向/检测,然后也被切割/降解,从而使所述细菌ssRNA失活,所以使用根据本发明的所述组合物的所述治疗方法还可以用于治疗或预防由细菌(如本文其它地方定义的药物抗性细菌)引起的任何细菌疾病。

在替代实施方案中,本发明的用于治疗所述病毒和/或细菌性疾病的组合物还可以与另外的治疗剂(药物)组合施用。在这方面有用的药物或治疗剂包括但不限于药物样分子、蛋白质、肽和小分子。蛋白质治疗剂包括但不限于肽、酶、抗体、结构蛋白、受体和其它细胞或循环蛋白以及它们的片段和衍生物,优选地,本发明上下文中的另外的治疗剂/药物可以是用在本文其它地方所述的病毒和/或细菌性疾病中的药物,尤其是用于所述疾病的组合疗法的药物。本发明的所述组合可以作为组合制剂施用或彼此分开施用。

本发明还包括一种预防或治疗受试者中的病毒或细菌性疾病的方法,所述方法包括向受试者施用治疗有效量的如本文所定义的组合物。本文还包括如本文其它地方定义的所述组合物用于制备用于在受试者的病毒或细菌性疾病中的治疗应用的药物的用途。关于第一和第二医药用途的定义和实施方案也可以应用于本发明。

如本文其它地方所述,本发明还包括一种包含CRISPR系统的组合物,所述组合物包含i)至少一种Cas13蛋白或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与至少一个NLS融合,或与至少一个NES融合,以及ii)至少一种gRNA或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交,所述编码所述gRNA的核苷酸序列与至少一种病毒输出元件融合,其中此类RNA输出元件(如CTE或VARdm)驱动gRNA从细胞核输出至细胞质。在此,编码gRNA的核苷酸序列,优选地其中所述核苷酸序列为DNA,与至少一种病毒输出元件融合。如本文所定义的所述至少一种病毒输出元件如本文其它地方所定义的融合至编码所述gRNA的核苷酸序列的5'端,优选地其中所述核苷酸序列是DNA。在本上下文中,融合也指编码所述gRNA的核苷酸序列和至少一种病毒输出元件通过连接子(比如任何核苷酸连接子)融合。因此,本发明还包括一种组合物,其中编码上述组合物(包含至少一种Cas13蛋白或编码所述蛋白的核苷酸序列,所述Cas13蛋白与至少一种NLS或与至少一种NES融合)的所述gRNA的DNA核苷酸序列经由连接子(比如任何核苷酸连接子)与本文定义的至少一种病毒输出元件在所述核苷酸序列的5'端融合。此外,术语“至少一种病毒输出元件”是指两种、三种、四种、五种或更多种如本文所定义的病毒输出元件。在一个优选的实施方案中,所述至少一种病毒输出元件是CTE或VARdm,优选为CTE,其与编码所述gRNA的核苷酸序列按照本文所定义的融合,所述gRNA优选为DNA序列。已证明编码所述gRNA的核苷酸序列与如本文定义的至少一种病毒输出元件的融合物是有利的,因为这增加了与NLS或NES融合的所述Cas13蛋白的敲低效率,优选地为将病毒CTE与所述gRNA融合,最优选地为将病毒CTE与所述gRNA融合并且将NES与所述Cas13蛋白融合(参见图17)。与gRNA的这种融合也可在此类组合物的蛋白质水平上应用。

上述关于包含与融合至至少一个NES的至少一个NLS融合的至少一种Cas13蛋白的组合物的任何定义,在适用的情况下,可以(以任何组合)应用至包含与至少一个NLS或至少一个NES融合的Cas13蛋白且还包含与所述gRNA融合的至少一种病毒输出元件的组合物。

核酸分子

本发明还包括的一种核酸分子,其包含编码所述Cas13蛋白的核苷酸序列和/或编码如本文其它地方所定义的所述gRNA的核苷酸序列。这意味着当应用包含编码所述Cas13蛋白的核苷酸序列的核酸分子时,如本文定义的所述Cas13蛋白由所述分子编码,根据本发明所述该种Cas13蛋白与融合至所述至少一个NES的所述至少一个NLS(它们也由核苷酸序列编码)融合。此外,当应用包含编码所述gRNA的核苷酸序列的所述核酸分子时,如本文所定义的所述gRNA,例如就所述修饰而言,可以由所述分子编码。

包含编码所述Cas13蛋白和/或所述gRNA的核苷酸序列的核酸分子包括DNA和RNA,所述DNA例如cDNA或基因组DNA。优选地,描述“RNA”的实施方案涉及mRNA。

本发明还涉及如本文定义的核酸分子,其包含如本文所述的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列。由于遗传密码的简并性允许一些密码子被限定相同氨基酸的其它密码子替换,本发明不限于如本文定义的编码所述Cas13和/或gRNA的特定核酸分子,而是包括包含如本文定义的编码功能性Cas13蛋白和/或gRNA的核苷酸序列的所有核酸分子。

在一些实施方案中,包含本申请中公开的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列的核酸分子(例如DNA或RNA)可包含彼此“可操作地连接”的核苷酸序列,即如上所述的,编码本文其它地方所述的所述至少一种Cas13蛋白的核苷酸序列(如果使用大于一种Cas13蛋白,也可应用大于一种的编码所述Cas13蛋白的核苷酸序列)、编码本文其它地方定义的所述至少一种gRNA的核苷酸序列(如果使用大于一种gRNA,也可应用大于一种编码所述gRNA的核苷酸序列)、和编码本文其它地方定义的所述定位信号的核苷酸序列。所述核苷酸序列彼此可操作地连接。在这方面,可操作的连接是其中一个核苷酸序列的序列元件和另一个核苷酸序列的序列元件以使得检测系统能够表达的方式连接的连接。

本发明还包括本文其它地方所述的核酸分子,其包括实验诱变的所示序列位置之外的其它突变。此类突变通常是可接受的,或者甚至可以证明是有利的,例如如果此类突变有助于改善的折叠效率、血清稳定性、热稳定性或配体结合亲和力。

本申请中公开的核酸分子可以“可操作地连接”至一种调节序列(或多种调节序列)以允许该核酸分子的表达。

如果诸如DNA或RNA的核酸分子包括含有关于转录和/或翻译调节的信息的序列元件,则其被称为“能够表达核酸分子”或能够“允许核苷酸序列的表达”,并且此类序列“可操作地连接”至如本文其它地方定义的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列。可操作的连接是其中调节序列元件和待表达的序列以能够使基因表达的方式连接的连接。基因表达所必需的调节区域的确切性质在物种之间可以变化,但是通常这些区域包括启动子,在原核生物中,该启动子包含启动子本身,即指导转录起始的DNA元件,以及当转录成RNA时将发出翻译起始信号的DNA元件。这种启动子区域通常包括参与转录和翻译起始的5'非编码序列,比如原核生物中的-35/-10框和Shine-Dalgarno元件,或真核生物中的TATA框、CAAT序列和5'-加帽元件。这些区域也可以包括增强子或阻遏子元件以及翻译的信号和用于将天然多肽靶向宿主细胞的特定区室前导序列。

此外,3'非编码序列可以含有参与转录终止、聚腺苷酸化等的调节元件。然而,如果这些终止序列在特定宿主细胞中的功能无法令人满意,那么可以采用在该细胞中有功能的信号替换它们。

因此,本发明的核酸分子可以包括调节序列,比如启动子序列。在一些实施方案中,本发明的核酸分子包括启动子序列和转录终止序列。合适的启动子可选自RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯氏肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、(3-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、EF1α启动子和U6启动子、TetOn/Off、7SK、CAG、CBh、UbC或任何四环素依赖性或干扰素依赖性启动子。

载体

本发明的核酸分子也可以是载体或任何其它种类的克隆用载体的一部分,比如质粒、噬菌粒、噬菌体、杆状病毒、粘粒或人工染色体,优选为载体的一部分。

在一些方面,本发明涉及这类载体,该种载体例如用于在细胞中递送或引入Cas和/或能够将Cas引导至靶标基因座的RNA(即向导RNA),而且还用于(例如在原核细胞中)繁殖这些组分。本文所用的“载体”是允许或促进实体从一个环境转移至另一个环境的工具。载体是一种复制子,例如质粒、噬菌体或粘粒,可以将另一个DNA片段插入其中以便引起插入区段的复制。通常,当与适当的控制元件连接时,载体能够复制。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其它多核苷酸变体。一种类型的载体是“质粒”,其是指一种环状双链DNA环,例如通过标准分子克隆技术可以向其中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中以包装入病毒(如逆转录病毒、复制缺陷逆转录病毒、腺病毒、复制缺陷腺病毒和腺相关病毒(AAV))。病毒载体还包括由病毒携带的用于转染到宿主细胞中的多核苷酸。一些载体能够在它们所导入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型(episomal)哺乳动物载体)。其它载体(如,非游离型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,一些载体能够指导与它们可操作地连接的基因的表达。在本文中将此类载体称为“表达载体”。在重组DNA技术中常用的表达载体通常是质粒的形式。

重组表达载体可以包含适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包括一种或多种调节元件,所述调节元件可以基于用于表达的宿主细胞进行选择,其可操作地连接至待表达的核苷酸序列。在重组表达载体内,“可操作地连接”意指目标核苷酸序列以允许核苷酸序列(例如,在体外转录/翻译系统中或当载体引入宿主细胞时在宿主细胞中)表达的方式与调节元件连接。关于重组和克隆方法,在2004年9月2日公开为US2004-0171156A1的美国专利申请10/815,730中有所提及,该专利申请的内容通过引用以其整体并入本文。因此,本文公开的实施方案还可以包括包含CRISPR效应系统的转基因细胞。在一些示例性实施方案中,转基因细胞可以作为单独的离散容积(discretevolume)起作用。换言之,可以将包含掩蔽构建体的样品递送到细胞,例如在合适的递送囊泡中,并且如果靶标存在于递送囊泡中,则CRISPR效应子被激活并且产生可检测的信号。载体可以包括调节元件,例如启动子。载体可以包含Cas编码序列,和/或单一的,但也可能包含至少3或8或16或32或48或50个向导RNA编码序列,比如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50个RNA。在单个载体中,当存在多达约16个RNA时,有利地,每个RNA可以有一个的启动子;,当单个载体提供多于16个RNA时,一个或多个启动子可以驱动一个以上的RNA的表达,例如,当存在32个RNA时,每个启动子可以驱动两个RNA的表达,并且当存在48个RNA时,每个启动子可以驱动三个RNA的表达。通过简单的算术和完善建立的克隆方案以及本公开内容的教导,本领域技术人员可以容易地就用于合适的示例性载体(比如AAV)和合适的启动子(比如U6启动子)的RNA实施本发明。例如,AAV的包装限制是~4.7kb。单个U6-gRNA的长度(加上用于克隆的限制性位点)是361bp。因此,技术人员可以容易地将约12-16个,例如13个U6-gRNA盒装配在单个载体中。这可以通过任何合适的方法来组装,例如用于TALE组装的金门策略(genome-engineering.org/taleffectors/)。技术人员也可以使用串联向导策略将U6-gRNA的数量增加约1.5倍,例如从12-16个,例如13个增加至约18-24个,例如约19个U6-gRNA。因此,本领域技术人员可容易地在诸如如AAV载体的单个载体中获得约18-24个,如约19个启动子-RNA(如U6-gRNA)。增加载体中启动子和RNA数量的另一种手段是使用单个启动子(如U6)来表达由可切割序列分隔的RNA阵列。并且,增加载体中启动子-RNA数量的又一种方法是表达由编码序列或基因的内含子中的可切割序列分隔的启动子-RNA阵列;并且,在这种情况下,使用聚合酶II启动子是有利的,其可以具有增加的表达并能够以组织特异性方式转录长RNA。(参见例如nar.oxfordjournals.org/content/34/7/e53.short和nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个实施方式中,AAV可包装靶向多达约50个基因的U6串联gRNA。因此,根据本领域的知识和本公开内容的教导,本领域技术人员可以无需任何过度的实验而容易地制备和使用表达在控制下或者与一个或多个启动子可操作或功能性连接的多种RNA或向导(尤其是本文讨论的RNA或向导的数目)的载体(如单个载体)。

除了上述调节序列和如本文所述的包含编码Cas13蛋白和/或gRNA的核苷酸序列的核酸分子之外,此类克隆载体可以包括衍生自与用于表达的宿主细胞相容的物种的复制子和控制序列,以及赋予转化或转染细胞可选择表型的选择标志物。大量合适的克隆载体是本领域已知的,并且是商购可获得的。

可以将本文所述的核酸分子,特别是包含如本文定义的Cas13蛋白和/或gRNA的编码序列的克隆载体转化到能够表达该基因的宿主细胞中。转化可以使用标准技术(Sambrook,J.等,(1988)Molecular Cloning:ALaboratory Manual,2nd Ed)进行。

宿主细胞

因此,本发明还涉及一种宿主细胞,其包含本文所述的所述核酸分子或所述载体。

在适于表达如本文定义的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列的条件下培养转化的宿主细胞。合适的宿主细胞可以是原核的(比如大肠杆菌(E.coli)或枯草芽孢杆菌)或真核的(比如酿酒酵母、巴斯德毕赤酵母、SF9或High5昆虫细胞),永生化哺乳动物细胞系(比如HeLa细胞或CHO细胞),或原代哺乳动物细胞,优选地为大肠杆菌。

试剂盒

本发明还涉及一种试剂盒,其包含如本文中本发明所定义的组合物。因此,当试剂盒包含组合物时,所述组合物可以在小瓶或容器中提供,优选地在所述小瓶或容器中还包含至少一种如本文所定义的载体。因此,当试剂盒包含药物组合物时,所述组合物可以在小瓶或容器中提供,优选地其中还包含至少一种药学上可接受的载体和/或如本文定义的佐剂。此外,所述试剂盒可以与说明书相关联,该说明书为管理药物或生物制品的制造、使用或销售的政府机构所规定的形式,其反映了该机构对该产品用于人类施用或诊断的制造、使用或销售的许可。所述试剂盒可以包含如本文定义的组合物,所述组合物优选地在小瓶或容器中,其为干燥形式(比如冻干、风干或喷雾干燥形式(粉末形式)),以便稍后在使用之前重构为液体形式或其它形式。此外,所述试剂盒还可包含组合物,该组合物优选在小瓶或容器中,并为需在使用前解冻的冷冻状态。

根据本发明的试剂盒还可以包括递送系统。转基因的递送系统是本领域熟知的。例如,Cas转基因并且因此包含DNA形式的所述CRISPR系统的组合物可以借助于载体(如AAV、腺病毒、慢病毒、质粒)和/或借助于如本文其它地方定义的颗粒和/或纳米粒子递送至例如真核细胞中。包含RNA形式或蛋白质水平的所述CRISPR系统的组合物可以借助于同样如本文其它地方所述的颗粒和/或纳米颗粒和/或脂质体和/或外泌体递送至例如真核细胞中。此类递送系统也可以包含在如上定义的试剂盒的一个或多个小瓶或容器中,或包含在所述试剂盒的另外的一个或多个小瓶或容器中,优选地,在所述一个或多个小瓶或容器中还包含任何适于所述递送系统与之混合/接触的赋形剂。

本发明的试剂盒还可以包含标记物。本文所用的标记物可以指能够靶向包含在所述组合物中的所述系统的化合物。所述化合物可以指抗体、偶联/包被至抗体的珠子,例如偶联/包被至抗体的dynabeads,当在蛋白质水平上生产组合物时,其优选用于经典的纯化过程,例如层析。此外,所述标记物可以是oligodT磁珠。当在RNA水平上生产组合物,此类珠子能够结合全长RNA的聚A尾,随后如本领域技术人员已知对其进一步纯化。

在一些实施方案中,所述标记物还可以包含在如上定义的包含所述组合物的试剂盒的一个或多个容器或小瓶中,或包含在所述试剂盒的另外的一个或多个小瓶或容器中,优选地,在所述一个或多个小瓶或容器中还包含适于所述标记物与之混合/接触的任何赋形剂。

体外和体内应用

本发明还涉及一种生产本发明的组合物的方法,换言之,生产由所述组合物包含的所述CRISPR系统。在本上下文中,通过遗传工程方法从编码如本文定义的所述Cas13蛋白和/或所述gRNA的核酸开始生产组合物。同样,在本上下文中,所述编码的Cas13蛋白是与所述至少一个NLS融合的Cas13蛋白,如贯穿本发明所述的所述NLS与所述的至少一个NES融合。因此,所提供的生产方法的终产物是本发明的组合物,该组合物可以是包含核酸分子形式的所述系统的组合物或者是基于蛋白质的系统的形式的组合物,所述核酸分子包含如本文其它地方定义的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列,其中所述核酸分子是DNA(“基于DNA的系统”)或RNA(“基于RNA的系统”)。

因此,当在本文中将术语“通过遗传工程编码的核酸”用于基于DNA的系统时,其是指人工基因合成(编码所述Cas13蛋白和/或gRNA的所述核苷酸序列)的体外使用。如本领域技术人员已知的,此类合成是指在合成生物学中使用的方法,以核苷酸从头构建和组装基因。当在本文中将术语“通过遗传工程编码的核酸”用于基于RNA的系统时,本领域技术人员已知的其指RNA合成(所述Cas13 mRNA和/或所述gRNA)的体外施用。当在本文中将术语“通过遗传工程编码的核酸”用于基于蛋白质的系统时,应将其分为在体内或体外进行所述方法。在一些实施方案中,当涉及如本文其它地方定义的所述组合物的基于蛋白质的系统时,该方法可以在体内进行,这意味着该组合物可以例如在细菌或真核宿主生物体中产生,然后通过本领域技术人员已知的手段从该宿主生物体或其培养物中分离。当在体内产生组合物时,通过重组DNA技术将包含如本文定义的编码所述Cas13蛋白和/或所述gRNA的核苷酸序列的核酸分子引入合适的细菌或真核宿主生物体中。为此,首先使用已建立的标准方法用包含本文所述核酸分子的克隆载体转化宿主细胞。然后在允许异源DNA表达并因此允许合成相应CRISPR系统的条件下培养宿主细胞。随后,之后从宿主细胞或从培养基中分离组合物。在其它实施方案中,并且当涉及基于蛋白质的系统时,所述方法的核酸编码可以在体外进行,这意味着还可以通过使用体外翻译系统产生所述本发明的组合物。

在如上定义的核酸编码之后,所述方法可以进一步包括获得所产生的组合物。

当在DNA(意指编码所述Cas13蛋白和/或gRNA的核苷酸序列)水平上产生组合物时,当用于这个方面时术语“获得(“obtain”或“obtaining”)”可以理解为通过使用例如人工基因合成在核酸编码后从使用的(反应)缓冲液中提取产生的组合物,并且在使用所述组合物前可能将其纯化。这种基于DNA的系统的经典纯化方法可以包括使用本领域技术人员已知的二氧化硅柱。当在RNA(意指Cas13 mRNA和/或gRNA)水平上产生组合物时,当用于这个方面时术语“获得“obtain”或“obtaining””可以理解为通过使用例如RNA合成在核酸编码后从使用的(反应)缓冲液中提取产生的组合物,并且在使用所述组合物前可能将其纯化。这种基于RNA的系统的经典纯化方法可以包括使用本领域技术人员已知的oligodT磁珠。此类珠子能够结合所述CRISPR系统的组分的RNA的聚A尾,其中可以分离副产物,因此实现所述组分的更好纯度。当在体内蛋白质(Cas13蛋白和/或gRNA)水平上产生组合物时,当在这方面使用时术语“获得(“obtain”或“obtaining”)”可以理解为,然后通过如上所述本领域技术人员已知的手段从宿主生物体或其培养物中分离产生的组合物。当组合物在体外以蛋白质水平产生时,术语“获得(“obtain”或“obtaining”)”可以理解为,通过使用例如体外翻译系统在核酸编码之后从使用的(反应)缓冲液中提取所产生的组合物,并且在使用所述组合物之前可能纯化所产生的组合物。可以使用的经典纯化方法可以指本领域技术人员已知的合适的色谱法。术语“回收(“recover”或“recovering”)”在本文中可以与术语“获得(“obtain”或“obtaining”)”互换使用。

上述关于核酸分子、载体、宿主细胞、试剂盒和体外以及体内应用的段落和定义,在适用的情况下,也可以应用于包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物,所述组合物包含i)至少一种CRISPR相关蛋白13(Cas13)或编码所述Cas13蛋白的核苷酸序列,所述Cas13蛋白与至少一个核定位信号(NLS)融合,或与至少一个核输出序列(NES)融合,以及ii)至少一种向导RNA(gRNA)或编码所述gRNA的核苷酸序列,所述gRNA能够与一种或多种靶标RNA分子杂交,如本文其它地方所定义的,所述编码所述gRNA的核苷酸序列与至少一种病毒输出元件融合。

本发明的实施例

关键构建体的克隆。

将Cas13编码序列排序为合成片段(gBlock,IDT)并克隆到pCAG骨架中。通过连接或Gibson组装将不同的定位序列融合到C-末端。将Cas13gRNA支架序列排序为合成片段(gBlock,IDT)并克隆到U6骨架中。通过退火互补寡核苷酸(Metabion)将不同的gRNA克隆到支架中。通过一步法RT-PCR(SuperScript IV One-step RT-PCR,Thermo Fisher)从片段化的、合成的SARS-CoV-2基因组(Twist Bioscience)扩增HA标记的SARS-CoV-2。本文使用的所有荧光素酶均与衍生自小鼠鸟氨酸脱羧酶的C-末端Degron,以使RNA和蛋白水平紧密相连。将tRNA和核酶排序为合成片段(gBlock,IDT),并通过Gibson装配添加至gRNA的3'端。从HEK293T基因组DNA扩增5'和3'β珠蛋白稳定UTR,并克隆到Cas13编码序列的上游或下游。

标准RNA制备。

通过质粒模板的线性化产生体外转录的模板。将消化物(Monarch DNA CleanupKit,New England Biolabs)纯化并随后用于mRNA合成(HiScribe T7ARCA mRNA withtailing Kit,New England Biolabs)。纯化(Monarch RNA Cleanup,New EnglandBiolabs)合成的RNA并将其储存在-80℃下,通过延伸部分重叠的寡核苷酸(Q5 Mastermix,New England Biolabs)产生gRNA模板并将其直接用于体外转录。纯化(Monarch RNACleanup,New England Biolabs)合成的gRNA并将其储存在-80℃下。

细胞系和培养。

所有实验均在HEK293T细胞中进行。将细胞在37℃下,在7.5% CO

通过萤光素酶分析测量的敲低效率。

用不同的Cas13系统以及编码纳米荧光素酶的mRNA或DNA转染细胞。转染24-72小时后,裂解细胞并测定纳米荧光素酶(NanoGlo Assay,Promega)。在定量中靶(on-target)和脱靶(off-target)活性的实验中,将纳米荧光素酶与萤火虫荧光素酶一起转染到同一孔中。转染24-72小时后,裂解细胞并独立测量两种荧光素酶(NanoGlo Dual LuciferaseAssay,Promega)。

蛋白质稳定性和SARS-CoV-2RdRP敲低的评估。

在用不同的Cas13变体转染后72小时,将细胞在补充有Halt Protease InhibitorCocktail(Thermo Fisher)的M-PER缓冲液(Thermo Fisher)中裂解。将裂解物在Laemmli缓冲液(Sigma-Aldrich)中制备,并在SDS PAGE(Thermo Fisher)上运行。将蛋白质转移到PVDF膜上以20V,封闭,与一级M2抗-FLAG(Merck Millipore)抗体温育以染色Cas13或用HA抗体(Cell Signaling)温育以染色HA-标记的SARS-CoV-2RdRP过夜,并用Amersham ECLPrime底物(Sigma-Aldrich)成像。

Cas13蛋白定位。

在用不同Cas13变体转染72小时后,将细胞在福尔马林中固定,透化并与一级M2抗-FLAG(Merck Millipore)抗体温育。用二级抗体温育后,细胞另外进行DAPI染色并在EVOS细胞成像系统(Thermo Fisher)中成像。

SARS-CoV-2抑制。

在96孔板中用编码ACE2(20ng)、Cas13 NLS-NES(40ng)和gRNA(40ng)的mRNA转染细胞。采用MessengerMax(Thermo Fisher)进行mRNA转染。转染24小时后,在BSL3条件下用SARS-CoV-2-GFP感染细胞。转染72小时后,裂解细胞,通过在Trizol中在60℃下加热灭活病毒。通过Trizol/氯仿提取来提取RNA。然后在CDC批准的诊断分析(用于病毒N基因,IDT)中通过RT-qPCR(Luna Universal Probe One-Step Assay,New England Biolabs)对提取的RNA进行定量。

细胞翻译的测量。

用Cas13、mRuby3和靶向mRuby3的gRNA转染细胞。转染72小时后,根据制造商的方案l(Protein Synthesis Assay Kit,Cayman Chemical)记录新生蛋白质翻译并染色。通过FACS分析染色的细胞。

核糖体测定。

用Cas13、gRNA和靶标RNA转染细胞。转染72小时后,提取总RNA(Monarch TotalRNA Miniprep Kit,New England Biolabs)并将其在琼脂糖凝胶上分析。作为比较,将纯化的80S核糖体在NEB 4缓冲液中用纯化的Cas13蛋白(通过体外翻译产生:NEBExpress,NewEngland Biolabs)、体外转录的gRNA和体外转录的靶标RNA(如上所述)温育1小时。通过加入0.5M EDTA猝灭反应。然后将反应物与蛋白酶K在37℃下温育1小时,随后在琼脂糖凝胶上分析。

RNA递送的优化。

为了稳定Cas13 mRNA,将5'β珠蛋白UTR的片段和两个拷贝的β珠蛋白3’UTR添加到Cas13编码序列中。另外,添加遗传编码的162个核苷酸聚A尾。用N1-甲基假尿苷(JenaBioscience)替换UTP,并通过疫苗加帽系统和2'-O-甲基转移酶(均为New EnglandBiolads)转录后进行5'加帽。通过化学合成(IDT)用2'O-甲基-硫代磷酸酯(2’O-Methly-Phosphorothioate)替换5'和3'末端的两个末端核苷酸来稳定gRNA。

实施例1:Cas13的最佳敲低条件的表征。

为了找到基于Cas13的敲低工具的最佳组成,在萤火虫萤光素酶敲低分析中直接比较Cas13d变体和基于miRNA的RNA干扰。已知的具有22bp gRNA的Cas13d-NLS产生中等的敲低效率,而通过将gRNA长度增加至30bp并通过将Cas13蛋白与NLS和NES融合使该敲低效率得到改善。这种优化的系统甚至比最新一代的RNA干扰更有效(图1)。

最初,在使用纯化组分的体外分析中发现Cas13d的最佳gRNA长度为22bp(Konermann等,(2018),Cell 173(3):665–676)。本发明人通过靶向共转染的纳米荧光素酶,表征了哺乳动物细胞系中不同gRNA长度的敲低效率。与先前的体外工作不同,最佳gRNA长度在26至30bp的范围内(图2)。

发明人假设,将经历由RNAse P/Z或自裂解核酶加工的tRNA添加到gRNA的3'可以支持gRNA折叠。另外,两个基序都切除U-区段(stretch),该区段在pol III启动子(如U6启动子)的转录终止过程中加入到gRNA中。与未修饰的gRNA相比,两种基序的添加均显示出提高的敲低效率(图3)。

实施例2:将Cas13d转移至细胞质的不同策略的开发。

本发明人在基于萤光素酶的分析中比较了具有不同定位信号的Cas13d蛋白的敲低效率。pol III驱动的gRNA表达并保留在核中,因此输出至细胞质(NES)的Cas13d几乎没有活性。另外,蛋白质印迹分析显示如果蛋白不与相同区室中的gRNA结合,则该蛋白是不稳定的。输入细胞核(NLS)的Cas13d变体具有活性且是稳定的,原因在于其与gRNA存在于相同的区室中并形成gRNA/Cas13d复合物。对于由两种定位信号(NLS-NES)组成的Cas13d融合蛋白,预期了穿梭机制。将该蛋白输入细胞核(NLS),拾取gRNA,然后再次输出至细胞质(NES),在细胞质中大部分萤光素酶mRNA被靶向降解。这种NLS-NES策略稳定了细胞质中的蛋白并使敲低效率最大化。gRNA本身通过从pol II启动子表达而输出至细胞质的互补策略支持该假设,因为在这种情况下,Cas13d-NES是最有活性的。通过直接比较这两种策略,Cas13d-NLS-NES是最有效的(图4)。

实施例3:Cas13d的特异性的评价。

所有Cas13系统的体外实验提示了基于靶标RNA的活化机制,该种机制释放(unleashes)了非特异性RNA降解,称为旁切RNA裂解(Abudayyeh等,(2016),Konermann等,(2018))。令人惊讶地,这种非特异性RNA降解在所有真核细胞系统中都不存在(Abudayyeh等,(2017)Nature 550,280-284,Konermann等,(2018))。真核细胞的转录组比原核细胞的转录组复杂得多(内含子/外显子结构、非编码RNA、小RNA等)。本发明人假设原核和真核之间在Cas13机制中观察到的差异可能与Cas13系统的活性差异直接相关。对于中等活性的Cas13系统,在高度复杂的真核转录组中可以监管旁切RNA裂解。因此,本发明人测试了高活性Cas13-IDG的旁切裂解。如所预期的,当靶向萤火虫荧光素酶时,已知的Cas13d系统以及miRNA没有导致对共转染的和不相关的纳米荧光素酶的实质性抑制。对于Cas13-IDG,测到了纳米荧光素酶敲低的增加以及萤火虫萤光素酶敲低的增加(图5)。这导致本发明人得出这样的结论,即Cas13-IDG表现出旁切活性的预先监管特征,可以将其用于靶转录物诱导的病毒抑制。

实施例4:异源表达的mRNA的有效敲低。

现有技术在单个系统的效率方面得到了非常不同的结果,这就是为什么本发明人开发了基于萤光素酶的分析,使他们能够将已知的Cas13系统与96孔形式的几种gRNA和靶标RNA直接进行比较(图6A)。结果表明来自生黄瘤胃球菌XPD3002的Cas13d降解靶标RNA最有效。基于该分析,本发明人能够测试对gRNA和Cas13蛋白的许多修饰,并鉴定了将Cas13d的敲低效率从50%提高至90%以上的三种修饰(图6B)。优化步骤包括gRNA的延伸、tRNA的融合以支持gRNA的折叠、以及细胞核和另外的细胞质定位信号与Cas13d蛋白的融合。两种定位信号融合在一起导致了Cas13d向细胞质中的定位(图6C)。与公开的Cas13d变体不同,该步骤首次允许降解细胞质而不是细胞核RNA。包含三种修饰中每一种的修饰的Cas13d组合物是指Cas13-IDG。

在Cas13-IDG的工作过程中,本发明人能够证实最初描述的在哺乳动物细胞中Cas13组合物的原核系统中的旁切活性。与已知的体外(实验无细胞系统)和细菌系统的旁切活性不同,Cas13-IDG似乎具有在确定的位置结合和切割28S核糖体RNA的偏好(图6D、6E),这最终导致整体细胞蛋白质翻译的瞬时抑制(图8)。通过分析体外系统中纯化的Cas13对纯化的80S核糖体的影响,证实了28S rRNA直接被Cas13切割,而不是通过内源细胞机制切割(图9)。

实施例5:Cas13-IDG对SARS-CoV-2的抑制作用。

基于Cas13-IDG对细胞翻译影响的一般性优化和发现,本发明人进一步开发了这些发现以用于抗病毒治疗。为此,发明人使用与SARS-CoV-2病毒的不同区域互补的gRNA,集中于病毒的5'和3'部分。由于这两个区域存在于病毒基因组和所有亚基因组mRNA中,因此Cas13的抗病毒作用在这些位置可能最强。此外,最近证明,在感染后病毒RNA有大量复制,该病毒RNA在短时间后超过内源RNA的量。因此,如果Cas13是针对5'或3'病毒UTR,本发明人预期了一种四级病毒抑制:1)直接靶向病毒基因组,2)靶向病毒基因组的拷贝,3)病毒mRNA的降解,4)在感染的细胞中Cas13-IDG的显著活化以及由此导致的对病毒的蛋白质翻译产生的强的旁切作用(图7A)。

本发明人证明Cas13-IDG与靶向人工表达的SARS-CoV-2的RdRp蛋白质的gRNA一起敲低了该蛋白质的大约90%(图7B)。基于此,本发明人开始测试Cas13-IDG对SARS-CoV-2感染的细胞的抗病毒作用(在BSL-3条件下)。最初的结果表明,根据gRNA的位置,病毒减少高达80%(图7C)。在该实验中,Cas13-IDG组合物作为RNA而不是DNA递送,因为RNA的瞬时效应有望在临床前和临床模型中简化翻译。

实施例6:基于RNA的Cas13递送系统的优化。

为了进一步增强基于RNA的递送系统中Cas13-IDG的敲低,通过测量针对共转染的纳米荧光素酶mRNA的敲低效率来测试几种修饰。首先,证明了JetMessenger转染试剂优选于MessengerMax。部分5'β球蛋白UTR和两个拷贝的3'β球蛋白UTR的添加增加了Cas13 mRNA的稳定性。通过疫苗加帽系统和2'-O-甲基转移酶从常用的共转录ARCA-基5'加帽切换到转录后加帽进一步提高了敲低效率。用N1-甲基假尿苷替换Cas13mRNA中的UTP增加了Cas13蛋白的表达,这通过Cas13-P2A-mRuby3融合构建体显示(图10B)。除了改进Cas13 mRNA之外,发现通过用2'-O-甲基硫代磷酸酯修饰的核苷酸替换两个5'和3'末端核苷酸来稳定gRNA进一步改进了敲低效率(图10A)。

实施例7:与不同定位信号融合的Cas13d变体的图解。

将Cas13d与不同的单一或串联定位信号融合以诱导细胞核/细胞质穿梭(图11A)。通过两种gRNA与不同定位的Cas13变体的组合靶向共转染的纳米荧光素酶。发现两个NLS以及一个NES信号的组合(Cas13d-NLS-NES/Cas13d-IDG)是最佳的,这可能是由于足够的核输入以拾取gRNA和细胞质定位以有效靶向主要在细胞质中的纳米荧光素酶mRNA(图11B)。

实施例8:与不同定位信号融合的Cas13d蛋白变体的定位。

为了分析不同的单个或串联定位序列对Cas13d定位的影响,进行了免疫组织化学。在高内涵分析系统中转染不同的融合构建体并成像(图12A)。随后,对每种构建体的100个细胞进行细胞质和细胞核级分的荧光强度测量。细胞质至细胞核的分布分析揭示了,蛋白定位逐渐转移至细胞质,NLS信号降低并NES信号增加(图12B)。Cas13d-NES-NLS显示中度的(intermediate)定位,这支持了假设的穿梭机制。

实施例9:与不同定位信号融合的Cas13d变体的稳定性。

为了测试gRNA和相关蛋白定位是否对Cas13稳定性有影响,进行了蛋白质印迹分析。因此,将融合至不同定位信号的Cas13变体转染到HEK293T细胞中,随后进行分析。聚合酶II驱动的gRNA被输出到细胞质中,并由此稳定了主要的细胞质Cas13变体,而聚合酶III驱动的gRNA保留在细胞核中,并由此稳定,优选细胞核Cas13变体(图13)。

实施例10:针对委内瑞拉马脑炎(VEE)复制子的敲低效率的比较。

为了研究部分细胞质Cas13d-NLS-NES对细胞质RNA敲低的影响,靶向衍生自委内瑞拉马脑炎(VEE)病毒的自我复制RNA以模拟病毒感染。VEE仅在细胞质中复制,而不通过细胞核屏障,而一般(conventual)Cas13d-NLS位于细胞核中。将mGreenLantern报告基因克隆到VEE复制子表达构建体上,以测量VEE复制子的复制速率。将报告复制子体外转录并转染入HEK293T细胞。在2周的选择后,转染不同的Cas13构建体,并通过流式细胞术分析它们对VEE复制的影响。对于所有测试的gRNA,Cas13d-NLS-NES优于Cas13d-NLS,因此支持了与先前描述的Cas13-NLS相比Cas13d-NLS-NES在降解细胞质RNA中更有效(图14)。

实施例11:对于用Cas13d-IDG和不同gRNA的处理条件,SARS-CoV-2-GFP复制的连续分析。

SARS-CoV-2是正链RNA病毒,其仅在细胞质中复制,而Cas13d-NLS-NES有效降解细胞质RNA。为了测量Cas13-NLS-NES对病毒复制的影响,用Cas13d-NLS-NES编码mRNA与不同的gRNA一起转染HEK293T-ACE2细胞,并用SARS-CoV-2-GFP感染。SARS-CoV-2-GFP编码病毒基因组上的另外的绿色荧光蛋白,使得能够在时程实验中测量病毒复制。靶向病毒3’UTR的化学修饰的gRNA和靶向5'和3'病毒UTR的gRNA集合强烈抑制病毒复制(图15A)。为了进一步验证这些结果,通过转染Cas13d-NLS-NES以及化学修饰的gRNA靶向不同的SARS-CoV-2变体(α和δ)(图15B)。随后通过RT-qPCR针对病毒N或RdRp基因测定SARS-CoV-2的病毒载量,证实了所建立的系统能够抑制SARS-CoV-2变体而无需进一步修饰。

实施例12:对于与Cas13融合的NES或串联NLS-NES,靶向共转染的纳米荧光素酶的两种gRNA的敲低效率的比较。

Cas13d-NLS-NES进入细胞核以拾取gRNA,而CTE融合的gRNA自身被输出至细胞质。两种输出系统的组合可以具有叠加效应。因此,用两种靶向纳米荧光素酶的gRNA转染HEK293T细胞,所述gRNA具有或不具有融合的CTE基序以及具有Cas13-NES或Cas13-NLS-NES。转染后48小时,测定敲低效率。单独的两种gRNA输出策略表现相似,但是两种输出系统的协同效应进一步使效率最大化(图16)。

实施例13:不同的crRNA输出策略的图解。

一般gRNA由聚合酶III启动子(例如U6启动子)表达,并由此保留在表达细胞的细胞核中。为了靶向细胞质RNA,采用了不同的gRNA输出策略。使聚合酶II驱动的gRNA(例如CAG启动子)加帽、聚腺苷酸化,并因此将其输出。或者,病毒RNA输出元件(如CTE或VARdm)驱动gRNA从细胞核向细胞质的输出(图17A)。将这些输出策略应用于靶向共转染的纳米纤维素酶的两种gRNA,并比较细胞质或细胞核Cas13蛋白(图17B)。如前所示,一般pol III驱动的gRNA与细胞核Cas13系统组合更有效。相比于细胞核Cas13蛋白,pol II gRNA表达和融合病毒输出基序更有利于细胞质Cas13蛋白。与病毒CTE基序融合的gRNA在驱动Cas13d-NES的细胞质敲低中最有效。

本发明的特征还在于以下项目:

1.一种包含成簇的、规律间隔的、短回文重复(CRISPR)系统的组合物,所述组合物包含i)至少一种CRISPR相关蛋白13(Cas13),所述Cas13蛋白与融合至至少一个核输出序列(NES)的至少一个核定位信号(NLS)融合,以及ii)至少一种向导RNA (gRNA),所述gRNA能够与一种或多种靶标RNA分子杂交。

2.根据项目1所述的组合物,其中所述Cas13蛋白由核苷酸序列编码。

3.根据项目1或2所述的组合物,其中所述gRNA由核苷酸序列编码。

4.根据前述项目中任一项所述的组合物,其中所述Cas13蛋白通过连接子与所述融合至至少一个NES的至少一个NLS融合。

5.根据前述项目中任一项所述的组合物,其中所述Cas13蛋白是Cas13d蛋白。

6.根据项目5所述的组合物,其中所述Cas13d蛋白衍生自瘤胃球菌属,优选地衍生自生黄瘤胃球菌。

7.根据前述项目中任一项所述的组合物,其中所述gRNA具有至少约23个核苷酸的长度。

8.根据前述项目中任一项所述的组合物,其中所述gRNA具有约26至约30个核苷酸的长度。

9.根据前述项目中任一项所述的组合物,其中所述gRNA与所述一种或多种靶标RNA分子具有至少约80%的互补序列同一性。

10.根据前述项目中任一项所述的组合物,其中所述gRNA能够与所述一种或多种靶标RNA分子的(a)5’-和/或3’-非翻译区杂交。

11.根据项目3-10中任一项所述的组合物,其中编码所述gRNA的所述核苷酸序列与tRNA或核酶融合。

12.根据前述项目中任一项所述的组合物,其中所述一种或多种靶标RNA分子是病毒或细菌靶标RNA分子。

13.根据前述项目中任一项所述的组合物,其中所述组合物用于灭活细菌或病毒ssRNA。

14.根据前述项目中任一项所述的组合物,其中所述组合物是药物组合物。

15.根据项目14所述的组合物,其还包含至少一种药学上可接受的载体。

16.根据项目1-15中任一项所述的组合物,其用于治疗。

17.根据项目1-15中任一项所述的组合物,其用于预防或治疗受试者中的病毒性或细菌性疾病的方法中,所述方法包括向所述受试者施用治疗有效量的项目1-15中任一项所述的组合物。。

18.根据项目17所述应用的组合物,其中所述病毒性疾病由RNA病毒引起。

19.根据项目18所述应用的组合物,其中所述病毒性疾病是冠状病毒疾病、甲型流感、埃博拉、麻疹、丙型肝炎、蜱传脑炎(TBE)、登革热、黄热病或寨卡热中的任一种。

20.根据项目19所述应用的组合物,其中所述病毒性疾病是COVID-19疾病。

21.一种核酸分子,其包含编码如前述项目中任一项所定义的所述Cas13蛋白和/或所述gRNA的核苷酸序列。

22.一种载体,其包含项目21所述的核酸分子。

23.一种宿主细胞,其包含项目22所述的载体或项目21所述的核酸分子。

24.一种试剂盒,其包含根据项目1-15中任一项所述的组合物。

25.根据项目24所述的试剂盒,其还包含递送系统和/或标签。

26.一种生产项目1-15中任一项所述的组合物的方法,所述方法包括

a)通过基因工程方法的项目1-15中任一项定义的所述Cas13蛋白和所述gRNA的核酸编码,从而产生所述组合物;任选地

b)获得步骤a)所产生的组合物。

                         序列表

<110>  亥姆霍兹慕尼黑中心-德国健康与环境研究中心(有限公司)

<120>  CRISPR/CAS13在RNA病毒和/或细菌诱导的疾病的治疗中的应用

<130>  LC23310012P

<150>  LU 102326

<151>  2020-12-22

<160>  9

<170>  PatentIn version 3.5

<210>  1

<211>  967

<212>  PRT

<213>  生黄瘤胃球菌(Rumniococcus flavefaciens)

<400>  1

Met Ile Glu Lys Lys Lys Ser Phe Ala Lys Gly Met Gly Val Lys Ser

1               5                   10                  15

Thr Leu Val Ser Gly Ser Lys Val Tyr Met Thr Thr Phe Ala Glu Gly

            20                  25                  30

Ser Asp Ala Arg Leu Glu Lys Ile Val Glu Gly Asp Ser Ile Arg Ser

        35                  40                  45

Val Asn Glu Gly Glu Ala Phe Ser Ala Glu Met Ala Asp Lys Asn Ala

    50                  55                  60

Gly Tyr Lys Ile Gly Asn Ala Lys Phe Ser His Pro Lys Gly Tyr Ala

65                  70                  75                  80

Val Val Ala Asn Asn Pro Leu Tyr Thr Gly Pro Val Gln Gln Asp Met

                85                  90                  95

Leu Gly Leu Lys Glu Thr Leu Glu Lys Arg Tyr Phe Gly Glu Ser Ala

            100                 105                 110

Asp Gly Asn Asp Asn Ile Cys Ile Gln Val Ile His Asn Ile Leu Asp

        115                 120                 125

Ile Glu Lys Ile Leu Ala Glu Tyr Ile Thr Asn Ala Ala Tyr Ala Val

    130                 135                 140

Asn Asn Ile Ser Gly Leu Asp Lys Asp Ile Ile Gly Phe Gly Lys Phe

145                 150                 155                 160

Ser Thr Val Tyr Thr Tyr Asp Glu Phe Lys Asp Pro Glu His His Arg

                165                 170                 175

Ala Ala Phe Asn Asn Asn Asp Lys Leu Ile Asn Ala Ile Lys Ala Gln

            180                 185                 190

Tyr Asp Glu Phe Asp Asn Phe Leu Asp Asn Pro Arg Leu Gly Tyr Phe

        195                 200                 205

Gly Gln Ala Phe Phe Ser Lys Glu Gly Arg Asn Tyr Ile Ile Asn Tyr

    210                 215                 220

Gly Asn Glu Cys Tyr Asp Ile Leu Ala Leu Leu Ser Gly Leu Arg His

225                 230                 235                 240

Trp Val Val His Asn Asn Glu Glu Glu Ser Arg Ile Ser Arg Thr Trp

                245                 250                 255

Leu Tyr Asn Leu Asp Lys Asn Leu Asp Asn Glu Tyr Ile Ser Thr Leu

            260                 265                 270

Asn Tyr Leu Tyr Asp Arg Ile Thr Asn Glu Leu Thr Asn Ser Phe Ser

        275                 280                 285

Lys Asn Ser Ala Ala Asn Val Asn Tyr Ile Ala Glu Thr Leu Gly Ile

    290                 295                 300

Asn Pro Ala Glu Phe Ala Glu Gln Tyr Phe Arg Phe Ser Ile Met Lys

305                 310                 315                 320

Glu Gln Lys Asn Leu Gly Phe Asn Ile Thr Lys Leu Arg Glu Val Met

                325                 330                 335

Leu Asp Arg Lys Asp Met Ser Glu Ile Arg Lys Asn His Lys Val Phe

            340                 345                 350

Asp Ser Ile Arg Thr Lys Val Tyr Thr Met Met Asp Phe Val Ile Tyr

        355                 360                 365

Arg Tyr Tyr Ile Glu Glu Asp Ala Lys Val Ala Ala Ala Asn Lys Ser

    370                 375                 380

Leu Pro Asp Asn Glu Lys Ser Leu Ser Glu Lys Asp Ile Phe Val Ile

385                 390                 395                 400

Asn Leu Arg Gly Ser Phe Asn Asp Asp Gln Lys Asp Ala Leu Tyr Tyr

                405                 410                 415

Asp Glu Ala Asn Arg Ile Trp Arg Lys Leu Glu Asn Ile Met His Asn

            420                 425                 430

Ile Lys Glu Phe Arg Gly Asn Lys Thr Arg Glu Tyr Lys Lys Lys Asp

        435                 440                 445

Ala Pro Arg Leu Pro Arg Ile Leu Pro Ala Gly Arg Asp Val Ser Ala

    450                 455                 460

Phe Ser Lys Leu Met Tyr Ala Leu Thr Met Phe Leu Asp Gly Lys Glu

465                 470                 475                 480

Ile Asn Asp Leu Leu Thr Thr Leu Ile Asn Lys Phe Asp Asn Ile Gln

                485                 490                 495

Ser Phe Leu Lys Val Met Pro Leu Ile Gly Val Asn Ala Lys Phe Val

            500                 505                 510

Glu Glu Tyr Ala Phe Phe Lys Asp Ser Ala Lys Ile Ala Asp Glu Leu

        515                 520                 525

Arg Leu Ile Lys Ser Phe Ala Arg Met Gly Glu Pro Ile Ala Asp Ala

    530                 535                 540

Arg Arg Ala Met Tyr Ile Asp Ala Ile Arg Ile Leu Gly Thr Asn Leu

545                 550                 555                 560

Ser Tyr Asp Glu Leu Lys Ala Leu Ala Asp Thr Phe Ser Leu Asp Glu

                565                 570                 575

Asn Gly Asn Lys Leu Lys Lys Gly Lys His Gly Met Arg Asn Phe Ile

            580                 585                 590

Ile Asn Asn Val Ile Ser Asn Lys Arg Phe His Tyr Leu Ile Arg Tyr

        595                 600                 605

Gly Asp Pro Ala His Leu His Glu Ile Ala Lys Asn Glu Ala Val Val

    610                 615                 620

Lys Phe Val Leu Gly Arg Ile Ala Asp Ile Gln Lys Lys Gln Gly Gln

625                 630                 635                 640

Asn Gly Lys Asn Gln Ile Asp Arg Tyr Tyr Glu Thr Cys Ile Gly Lys

                645                 650                 655

Asp Lys Gly Lys Ser Val Ser Glu Lys Val Asp Ala Leu Thr Lys Ile

            660                 665                 670

Ile Thr Gly Met Asn Tyr Asp Gln Phe Asp Lys Lys Arg Ser Val Ile

        675                 680                 685

Glu Asp Thr Gly Arg Glu Asn Ala Glu Arg Glu Lys Phe Lys Lys Ile

    690                 695                 700

Ile Ser Leu Tyr Leu Thr Val Ile Tyr His Ile Leu Lys Asn Ile Val

705                 710                 715                 720

Asn Ile Asn Ala Arg Tyr Val Ile Gly Phe His Cys Val Glu Arg Asp

                725                 730                 735

Ala Gln Leu Tyr Lys Glu Lys Gly Tyr Asp Ile Asn Leu Lys Lys Leu

            740                 745                 750

Glu Glu Lys Gly Phe Ser Ser Val Thr Lys Leu Cys Ala Gly Ile Asp

        755                 760                 765

Glu Thr Ala Pro Asp Lys Arg Lys Asp Val Glu Lys Glu Met Ala Glu

    770                 775                 780

Arg Ala Lys Glu Ser Ile Asp Ser Leu Glu Ser Ala Asn Pro Lys Leu

785                 790                 795                 800

Tyr Ala Asn Tyr Ile Lys Tyr Ser Asp Glu Lys Lys Ala Glu Glu Phe

                805                 810                 815

Thr Arg Gln Ile Asn Arg Glu Lys Ala Lys Thr Ala Leu Asn Ala Tyr

            820                 825                 830

Leu Arg Asn Thr Lys Trp Asn Val Ile Ile Arg Glu Asp Leu Leu Arg

        835                 840                 845

Ile Asp Asn Lys Thr Cys Thr Leu Phe Arg Asn Lys Ala Val His Leu

    850                 855                 860

Glu Val Ala Arg Tyr Val His Ala Tyr Ile Asn Asp Ile Ala Glu Val

865                 870                 875                 880

Asn Ser Tyr Phe Gln Leu Tyr His Tyr Ile Met Gln Arg Ile Ile Met

                885                 890                 895

Asn Glu Arg Tyr Glu Lys Ser Ser Gly Lys Val Ser Glu Tyr Phe Asp

            900                 905                 910

Ala Val Asn Asp Glu Lys Lys Tyr Asn Asp Arg Leu Leu Lys Leu Leu

        915                 920                 925

Cys Val Pro Phe Gly Tyr Cys Ile Pro Arg Phe Lys Asn Leu Ser Ile

    930                 935                 940

Glu Ala Leu Phe Asp Arg Asn Glu Ala Ala Lys Phe Asp Lys Glu Lys

945                 950                 955                 960

Lys Lys Val Ser Gly Asn Ser

                965

<210>  2

<211>  7

<212>  PRT

<213>  人工序列

<220>

<223>  SV40 NLS

<400>  2

Pro Lys Lys Lys Arg Lys Val

1               5

<210>  3

<211>  8

<212>  PRT

<213>  人工序列

<220>

<223>  NLS共有序列

<400>  3

Pro Ala Ala Lys Lys Lys Leu Asp

1               5

<210>  4

<211>  11

<212>  PRT

<213>  人工序列

<220>

<223>  HIV NES

<400>  4

Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu

1               5                   10

<210>  5

<211>  10

<212>  PRT

<213>  人工序列

<220>

<223>  SV40 NLS延伸的

<400>  5

Pro Pro Lys Lys Lys Arg Lys Val Glu Asp

1               5                   10

<210>  6

<211>  9

<212>  PRT

<213>  人工序列

<220>

<223>  c-myc NLS

<400>  6

Pro Ala Ala Lys Arg Val Lys Leu Asp

1               5

<210>  7

<211>  16

<212>  PRT

<213>  人工序列

<220>

<223>  核质蛋白NLS

<400>  7

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1               5                   10                  15

<210>  8

<211>  72

<212>  PRT

<213>  鼠γ疱疹病毒4

<400>  8

Gly Cys Cys Ala Gly Gly Gly Thr Ala Gly Cys Thr Cys Ala Ala Thr

1               5                   10                  15

Thr Gly Gly Thr Ala Gly Ala Gly Cys Ala Thr Cys Ala Gly Gly Cys

            20                  25                  30

Thr Ala Gly Thr Ala Thr Cys Cys Thr Gly Thr Cys Gly Gly Thr Thr

        35                  40                  45

Cys Cys Gly Gly Thr Thr Cys Ala Ala Gly Thr Cys Cys Gly Gly Gly

    50                  55                  60

Cys Cys Cys Thr Gly Gly Thr Thr

65                  70

<210>  9

<211>  84

<212>  PRT

<213>  丁型肝炎病毒

<400>  9

Gly Gly Cys Cys Gly Gly Cys Ala Thr Gly Gly Thr Cys Cys Cys Ala

1               5                   10                  15

Gly Cys Cys Thr Cys Cys Thr Cys Gly Cys Thr Gly Gly Cys Gly Cys

            20                  25                  30

Cys Gly Gly Cys Thr Gly Gly Gly Cys Ala Ala Cys Ala Thr Thr Cys

        35                  40                  45

Cys Gly Ala Gly Gly Gly Gly Ala Cys Cys Gly Thr Cys Cys Cys Cys

    50                  55                  60

Thr Cys Gly Gly Thr Ala Ala Thr Gly Gly Cys Gly Ala Ala Thr Gly

65                  70                  75                  80

Gly Gly Ala Cys

技术分类

06120116308607