掌桥专利:专业的专利平台
掌桥专利
首页

拟杆菌属中的基因组编辑

文献发布时间:2023-06-19 16:08:01



本申请要求于2019年12月17日提交的美国临时申请号62/949,314的优先权利益,所述美国临时申请的整体内容通过引用并入本文。

本申请包含序列表,所述序列表已经由EFS-Web以ASCII格式提交,并且在此通过引用以其整体并入。于2020年12月17日创建的ASCII副本命名为P19-235_WO-PCT_SL.txt,且大小为38,913字节。

技术领域

本公开内容涉及用于拟杆菌属中的基因组编辑的组合物和方法。

背景技术

控制特异性修饰微生物基因组中的DNA序列的能力是医学和生物技术研究的重要方面。最近的进展指示RNA引导的系统可以设计为靶向微生物基因组中的特定DNA序列,然而,各种微生物基因组中存在的独特DNA修复状态和分子表观遗传结构产生了关于特定基因组编辑技术的有效性的不确定性。在此处,我们描述了对于修饰拟杆菌属物种的基因组有效的组合物和方法。

附图说明

专利或申请文件含有至少一幅彩色绘图。本专利或专利申请公开的带有彩色附图的副本将在请求和支付必要费用后由专利局提供。

专利或申请文件含有至少一幅彩色绘图。本专利或专利申请公开的带有彩色附图的副本将在请求和支付必要费用后由专利局提供。

图1呈现了用于CRISPR碱基编辑(dSpCas9-CDA/sgRNA)的示意性模型。dSpCas9-CDA/sgRNA复合物与双链DNA结合,以sgRNA和PAM依赖性方式形成R环。CDA催化定位于PAM上游15-20个碱基内的底部(非互补)链处的胞嘧啶的脱氨,其导致C至T诱变。

图2呈现了靶向多形拟杆菌中的

图3A显示了通过dSpCas9-CDA编辑的

图3B呈现了通过dSpCas9-CDA编辑的

图4呈现了CRISPR碱基编辑器稳定维持的质粒(pmobA.repA.CRISPR-CDA.NT)的示意图,所述质粒具有并不靶向多形拟杆菌VPI-5482基因组的非靶向的引导RNA乱序核苷酸序列。

图5A显示了25 µg/ml红霉素(Em)和200 µg/ml庆大霉素(Gm)脑心浸液(BHI)血琼脂平板,所述平板用100 µl来自重构的1 ml需氧大肠杆菌/多形拟杆菌VPI-5482接合浆料(conjugation slurry)的1:10稀释物铺平板。这些重构的接合浆料来自非选择BHI血琼脂平板。平板从左到右显示了非靶向样品、BT_0362样品和BT_0364样品。

图5B显示了在25 µg/ml Em、200 µg/ml Gm和100 ng/ml脱水四环素(aTc)选择和诱导的BHI血琼脂平板上的无菌环生长划线。来自图5A中所示的每块平板的各个菌落在5ml选择和诱导TYG液体培养基中生长,所述TYG液体培养基补充有25 µg/ml Em、200 µg/mlGm和100 ng/ml aTc。无菌环样品取自这些选择和诱导TYG液体培养基培养物。平板从左到右显示了非靶向样品、BT_0362样品和BT_0364样品。

图6A示出了使用MilliporeSigma内部开发的称为“SangerTrace”的软件的定量突变分析。该分析软件基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”桑格测序数据来计算突变百分比。顶部的桑格迹线是非靶向样品,其中引导RNA序列是加下划线的。红色箭头显示了相对于PAM的碱基-17,其为胞嘧啶脱氨的定位,所述胞嘧啶脱氨导致C至T诱变和截断BT_0362编码序列的终止密码子的引入。中间的桑格轨迹显示了BT_0362编辑的样品,并且下图显示了C至T突变频率。图6A按出现次序分别公开了SEQ ID NO 18-20。

图6B示出了使用MilliporeSigma内部开发的称为“SangerTrace”的软件的定量突变分析。该分析软件基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”桑格测序数据来计算突变百分比。顶部的桑格迹线是非靶向样品,其中引导RNA序列是加下划线的。红色箭头显示了相对于PAM的碱基-18、-19和-20,其为胞嘧啶脱氨的定位,所述胞嘧啶脱氨导致C至T诱变和截断BT_0364编码序列的终止密码子的引入。中间的桑格轨迹显示了BT_0364编辑的样品,并且下图显示了C至T突变频率。图6B按出现次序分别公开了SEQ ID NO 21-23。

具体实施方式

本公开内容提供了可以用于修饰特定DNA序列的改造的RNA引导的基因组修饰系统。特别地,RNA引导的基因组修饰系统被改造为靶向细菌界的靶向成员的染色体DNA中的特定基因座,特别是拟杆菌门(

本公开内容的一个方面提供了蛋白质-核酸复合物,其包含与靶细菌物种(或该物种的菌株水平变种)的染色体缔合的改造的RNA引导的核碱基修饰系统,其中所述改造的RNA引导的核碱基修饰系统靶向生物体的染色体中的特定基因座,并且所述生物体的染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1: (MNKADLISAVAAEAGLSKVDAKKAVEAFVSTVTKALQEGDKVSLIGFGTFSVAERSARTGINPSTKATITIPAKKVTKFKPGAELADAIK)的氨基酸序列具有至少50%序列同一性(例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%序列同一性)的氨基酸序列,并且所述物种/菌株的染色体与HU家族DNA结合蛋白缔合,所述HU家族DNA结合蛋白与SEQ ID NO: 1的氨基酸序列具有至少50%的序列同一性(例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)。

在各个实施方案中,RNA引导的核碱基修饰系统包括(i)包含CRISPR蛋白和引导RNA (gRNA)的成簇规律间隔短回文重复(CRISPR)系统、以及(ii)核碱基修饰酶或催化其结构域,其中所述CRISPR蛋白是核酸酶缺陷型CRISPR变体(例如,死亡的CRISPR)或CRISPR切口酶。CRISPR系统的gRNA被改造为指导RNA引导的核碱基修饰系统与细菌物种/菌株的染色体中的特定基因座的结合。因为在一些实施方案中,CRISPR蛋白是核酸酶缺陷型CRISPR变体或CRISPR切口酶,所以可以修饰细菌染色体的特定基因座中的一个或多个核碱基,而不在生物体的染色体中生成可以是致命的双链断裂。细菌生物体表达与细菌染色体DNA缔合的HU家族蛋白。因此,本文公开的蛋白质-核酸复合物包含与DNA/蛋白质复合物(细菌染色体DNA和相关的HU家族蛋白)结合的核糖核蛋白复合物(gRNA/CRISPR蛋白/核碱基修饰酶)。

(a)改造的RNA引导的核碱基修饰系统

本文公开的蛋白质-核酸复合物通常包含改造的RNA引导的核碱基修饰系统,其包括(i)包含CRISPR蛋白和引导RNA (gRNA)的CRISPR系统,其中所述CRISPR蛋白是核酸酶缺陷型CRISPR变体或CRISPR切口酶,以及(ii)核碱基修饰酶或其催化结构域。

RNA引导的CRISPR系统是细菌和古细菌中天然存在的防御机制,其已重新用作RNA引导的DNA靶向平台,其用于许多细胞类型中的基因编辑。参见例如,Chen等人的国际公开号WO 2014/089190 (在此通过引用以其整体并入本文)。如下文详述的,与CRISPR蛋白相互作用的引导RNA可以进行改造,以与目的核酸中的特定序列碱基配对,从而将CRISPR蛋白靶向目的核酸中的特定序列。

本文公开的RNA引导的核碱基修饰系统的CRISPR系统可以衍生自I型CRISPR系统、II型CRISPR系统、III型CRISPR系统、IV型CRISPR系统、V型CRISPR系统或VI型CRISPR系统。在具体实施方案中,CRISPR核酸酶可以来自单亚基效应系统,例如II型、V型或VI型系统。在各个实施方案中,CRISPR蛋白可以衍生自II型Cas9蛋白、V型Cas12 (以前称为Cpf1)蛋白、VI型Cas13 (以前称为C2cd)蛋白、CasX蛋白或CasY蛋白。在一个特定实施方案中,CRISPR核酸酶衍生自II型Cas9蛋白。在另一个特定实施方案中,CRISPR核酸酶衍生自V型Cas12蛋白。

CRISPR蛋白可以衍生自单细胞蓝藻菌属物种(

在一些方面,CRISPR蛋白可以衍生自化脓性链球菌(

在一些实施方案中,本文公开的RNA引导的核碱基修饰系统的CRISPR蛋白可以是核酸酶缺陷型CRISPR变体,其已修饰为缺乏所有核酸酶活性。野生型CRISPR核酸酶一般包含两个核酸酶结构域,例如,Cas9核酸酶包含RuvC和HNH结构域,其各自切割双链序列的一条链。RuvC核酸酶结构域和HNH核酸酶结构域中的一种或多种突变可以消除所有核酸酶活性。例如,核酸酶缺陷型CRISPR变体可以包含RuvC结构域中的突变如D10A、D8A、E762A和/或D986A,以及HNH结构域中的突变如H840A、H559A、N854A、N856A和/或N863A (参考化脓性链球菌Cas9,SpyCas9的编号系统。核酸酶缺陷型Cas12变体可以包含在两个核酸酶结构域中的可比较突变。在一些实施方案中,核酸酶缺陷型CRISPR变体可以是具有D10A和H840A突变的死亡Cas9 (dCas9)变体。

在其它实施方案中,本文公开的RNA引导的核碱基修饰系统的CRISPR蛋白可以是CRISPR切口酶,其切割双链序列的一条链。可以经由CRISPR核酸酶的核酸酶结构域之一的失活来改造切口酶。例如,Cas9蛋白的RuvC结构域或HNH结构域可以通过如上所述的一种或多种突变进行失活,以生成Cas9切口酶(例如,nCas9)。其它CRISPR核酸酶中的可比较突变可以生成其它CRISPR切口酶(例如,nCas12)。

另外,CRISPR蛋白可以进行修饰,以具有改善的靶向特异性、改善的保真度、改变的PAM特异性和/或增加的稳定性。例如,CRISPR蛋白可以进行修饰,以包含一种或多种突变(即,至少一个氨基酸的取代、缺失和/或插入)。改善靶向特异性、改善保真度和/或减少脱靶效应的突变的非限制性实例包括N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060A和/或D1135E (参考SpyCas9的编号系统)。

CRISPR系统还包含引导RNA。引导RNA与CRISPR蛋白和目的核酸中的靶序列相互作用,并且将CRISPR蛋白引导至靶序列。靶序列没有序列限制,除了序列与前间隔序列邻近基序(PAM)序列相邻之外。不同的CRISPR蛋白识别不同的PAM序列。例如,Cas9蛋白的PAM序列包括5'-NGG、5'-NGGNG、5'-NNAGAAW、5'-NNNNGATT、5-NNNNRYAC、5’-NNNNCAAA、5’-NGAAA、5’-NNAAT、5’-NNNRTA、5’-NNGG、5’-NNNRTA、5’-MMACCA、5’-NNNNGRY、5’-NRGNK、5’-GGGRG、5’-NNAMMMC和5’-NNG,并且Cas12a蛋白的PAM序列包括5'-TTN和5'-TTTV,其中N定义为任何核苷酸,R定义为G或A,W定义为A或T,Y定义为C或T,而V定义为A、C或G。一般而言,Cas9 PAM定位于靶序列的3',而Cas12a PAM定位于靶序列的5'。各种PAM序列和识别其的CRISPR蛋白是本领域已知的,例如,美国专利申请公开2019/0249200;Leenay,Ryan T.等人"Identifying and visualizing functional PAM diversity across CRISPR-Cassystems." Molecular cell 62.1 (2016): 137-147;以及Kleinstiver,Benjamin P.等人"Engineered CRISPR-Cas9 nucleases with altered PAM specificities." Nature523.7561 (2015): 481,所述参考文献各自通过引用以其整体并入本文。

引导RNA被改造为与特定的CRISPR蛋白复合。一般而言,引导RNA包含(i) CRISPRRNA (crRNA),其包含在5'端处的在靶位点处杂交的引导或间隔区序列,以及(ii)与crRNA和CRISPR蛋白相互作用的反式作用crRNA (tracrRNA)序列。每种引导RNA的引导或间隔区序列是不同的(即,是序列特异性的)。引导RNA序列的剩余部分在设计为与特定CRISPR蛋白复合的引导RNA中一般是相同的。

crRNA包含在5'端处的引导序列,以及在3'端处的另外序列,其与在tracrRNA的5'端处的序列碱基配对以形成双链体结构,并且tracrRNA包含形成与CRISPR核酸酶相互作用的至少一个茎环结构的另外序列。引导RNA可以是单分子(例如,单引导RNA (sgRNA)或1片sgRNA),其中所述crRNA序列与tracrRNA序列连接。可替代地,引导RNA可以是双分子gRNA,其包含分开的分子,即crRNA和tracrRNA。

crRNA引导序列被设计为与目的核酸中的靶序列(即前间隔序列)的互补体杂交。“靶核酸”为双链分子;一条链包含靶序列,并且被称为“PAM链”,而另一条互补链被称为“非PAM链”。本领域技术人员认识到gRNA间隔区序列与定位于靶核酸的非PAM链中的靶序列的反向互补体杂交。一般而言,引导序列和靶序列之间的序列同一性为至少80%、至少85%、至少90%、至少95%或至少99%。在具体实施方案中,互补性是完全的(即,100%)。在各个实施方案中,crRNA引导序列的长度范围可以为约15个核苷酸至约25个核苷酸。例如,crRNA引导序列的长度可以为约15、16、17、18、19、20、21、22、23、24或25个核苷酸。在具体实施方案中,引导的长度是约19、20或21个核苷酸。在一个实施方案中,crRNA引导序列具有20个核苷酸的长度。在某些实施方案中,crRNA可以包含与tracrRNA相互作用的另外的3'序列。另外序列可以包含约10至约40个核苷酸。在其中引导RNA包含单个分子的实施方案中,gRNA的crRNA和tracrRNA部分可以通过形成环的序列连接。形成环的序列的长度范围可以为约4个核苷酸至约10个或更多个核苷酸。

如上文提到的,tracrRNA包含形成至少一个茎环结构的重复序列,其与CRISPR核酸酶相互作用。每个环和茎的长度可以变化。例如,环的长度范围可以为约3至约10个核苷酸,而茎的长度范围可以为约6至约20个碱基对。茎可以包含1至约10个核苷酸的一个或多个凸起。引导RNA中的tracrRNA序列一般基于与野生型CRISPR核酸酶相互作用的野生型tracrRNA的序列。野生型序列可以进行修饰,以促进二级结构形成、增加二级结构稳定性等等。例如,可以将一种或多种核苷酸变化引入引导RNA序列内。tracrRNA序列的长度范围可以为约50个核苷酸至约300个核苷酸。在各个实施方案中,tracrRNA的长度范围可以为约50至约90个核苷酸、约90至约110个核苷酸、约110至约130个核苷酸、约130至约150个核苷酸、约150至约170个核苷酸,约170至约200个核苷酸、约200至约250个核苷酸或约250至约300个核苷酸。tracrRNA可以包含在tracrRNA的3'端处的任选延伸。

引导RNA可以包含标准核糖核苷酸和/或修饰的核糖核苷酸。在一些实施方案中,引导RNA可以包含标准或修饰的脱氧核糖核苷酸。在其中酶促合成(即,在体内或体外)引导RNA的实施方案中,引导RNA一般包含标准核糖核苷酸。在其中化学合成引导RNA的实施方案中,引导RNA可以包含标准或修饰的核糖核苷酸和/或脱氧核糖核苷酸。修饰的核糖核苷酸和/或脱氧核糖核苷酸包括碱基修饰(例如假尿苷、2-硫代尿苷、N6-甲基腺苷等等)和/或糖修饰(例如2'-O-甲基、2'-氟、2'-氨基、锁核酸(LNA)等等)。引导RNA的骨架也可以进行修饰,以包含硫代磷酸酯键合、硼烷磷酸酯键合或肽核酸。

接头是经由至少一个共价键连接一个或多个其它化学基团的化学基团。合适的接头包括氨基酸、肽、核苷酸、核酸、有机接头分子(例如,马来酰亚胺衍生物、N-乙氧基苄基咪唑、联苯-3,4',5-三羧酸、对氨基苄氧羰基等等)、二硫键接头和聚合物接头(例如,PEG)。接头可以包括一个或多个间隔基团,包括但不限于亚烷基、亚烯基、亚炔基、烷基、烯基、炔基、烷氧基、芳基、杂芳基、芳烷基、芳烯基、芳炔基等等。接头可以是中性的,或者携带正电荷或负电荷。在一些实施方案中,接头可以是肽接头。肽接头可以是柔性氨基酸接头(例如,包含小的、非极性或极性氨基酸)。可替代地,肽接头可以是刚性氨基酸接头(例如,α-螺旋)。肽接头的长度可以从约四个氨基酸直到一百个或更多个氨基酸不等。例如,合适的接头可以包含10-20个氨基酸、20-40个氨基酸、40-80个氨基酸或80-120个氨基酸。合适接头的实例是本领域众所周知的,并且设计接头的程序是容易获得的(Crasto等人,Protein Eng.,2000,13 (5):309-312)。

本文公开的改造的RNA引导的(CRISPR)核碱基修饰系统还包含核碱基修饰酶或其催化结构域。

各种核碱基修饰酶适用于本文公开的系统。核碱基修饰酶可以是DNA碱基编辑器。在一些实施方案中,DNA碱基编辑器可以是胞苷脱氨酶,其将胞苷转换成尿苷,所述尿苷被聚合酶读取为胸腺嘧啶。胞苷脱氨酶的非限制性实例包括胞苷脱氨酶1 (CDA1)、胞苷脱氨酶2 (CDA2)、活化诱导胞苷脱氨酶(AICDA)、载脂蛋白B mRNA编辑复合物(APOBEC)家族胞苷脱氨酶(例如,APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4)、APOBEC1互补因子/APOBEC1刺激因子(ACF1/ASF)胞苷脱氨酶、作用于RNA的胞嘧啶脱氨酶(CDAR)、细菌长同种型胞苷脱氨酶(CDD

核碱基修饰酶(碱基编辑器)可以是野生型或其片段、其修饰形式(例如,可以缺失非必需结构域)或其改造的形式。核碱基修饰酶(碱基编辑器)可以具有真核、细菌或古细菌起源。

在一些实施方案中,核碱基修饰酶(碱基编辑器)可以是胞苷脱氨酶或其催化结构域。胞苷脱氨酶可以具有人、小鼠、七鳃鳗、鲍鱼或大肠杆菌起源。在其中核碱基修饰酶是胞苷脱氨酶的实施方案中,RNA引导的核碱基修饰系统可以进一步包含至少一种尿嘧啶糖基化酶抑制剂(UGI)结构域。通过UGI抑制了从DNA中去除尿嘧啶,这是胞嘧啶脱氨基作用的结果。合适的UGI结构域是本领域已知的。

在一些实施方案中,如果这些组分是过表达的,则采用胞苷脱氨酶和UGI的系统可能具有负面效应。为了防止过表达,可以添加降解标签。降解标签发出蛋白质待被蛋白质回收系统降解的信号。这些降解标签导致不同的蛋白质半衰期。非限制性降解标签的实例是LVA、AAV、ASV和LAA。

核碱基修饰酶或其催化结构域与衔接蛋白之间的键合可以是经由共价键直接的。可替代地,核碱基修饰酶或其催化结构域与衔接蛋白之间的键合可以是经由接头间接的。接头在上文部分(I) (a) (i)中进行描述。衔接蛋白可以连接至核碱基修饰酶或其催化结构域的氨基末端和/或羧基末端。

本文公开的改造的RNA引导的核碱基修饰系统包含(i)不具有核酸酶活性或具有切口酶活性的CRISPR系统(在上文部分(I) (a) (i)中描述),以及(ii)核碱基修饰酶(碱基编辑器)或其催化结构域(在上文部分(I) (a) (ii)中描述)。CRISPR系统和核碱基修饰酶或其催化结构域可以以各种方式相互作用。

在一些实施方案中,CRISPR系统的CRISPR蛋白可以连接至核碱基修饰酶或其催化结构域。在一些方面,CRISPR蛋白和核碱基修饰酶或其催化结构域之间的键合可以是经由共价键(例如肽键)直接的。在其它方面,CRISPR蛋白和核碱基修饰酶或其催化结构域之间的键合可以是经由接头。接头在上文部分(I) (a) (i)中进行描述。核碱基修饰酶或其催化结构域可以连接至CRISPR蛋白的氨基末端和/或羧基末端。

在其它实施方案中,核碱基修饰酶或其催化结构域可以连接至衔接蛋白(在上文部分(I) (a) (ii)中描述),并且CRISPR蛋白或gRNA可以包含能够结合衔接蛋白的适体序列(在上文部分(I) (a) (i)中描述)。例如,核碱基修饰酶(例如胞苷/腺苷脱氨酶)可以连接至MS2细菌噬菌体外壳蛋白,并且CRISPR系统的gRNA可以包含形成茎环结构的MCP适体序列,其中所述MS2蛋白可以结合MSP适体序列,从而形成CRISPR-胞苷/腺苷脱氨酶系统。

CRISPR系统的引导RNA被改造为将RNA引导的(CRISPR)核碱基修饰系统靶向细菌染色体DNA中的特定基因座,使得可以形成如上所述的蛋白质-核酸复合物。一般而言,蛋白质-核酸复合物在细菌细胞内形成。

在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰系统可以由编码所述系统的至少一种核酸表达,所述核酸整合到细菌物种或菌株的染色体内。在其它实施方案中,改造的RNA引导的(CRISPR)核碱基修饰系统可以由编码所述系统的至少一种核酸表达,所述核酸在至少一种染色体外载体上携带。用于将核酸引入细菌内的技术是本领域众所周知的,如用于将核酸整合到细菌染色体内的手段一样。

可以调控改造的RNA引导的(CRISPR)核碱基修饰系统的表达。例如,改造的CRISPR核酸酶系统的表达可以由诱导型启动子调控,如下文部分(II)中所述。

在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰系统可以形成为合并的引导RNA文库,以平行靶向许多基因组定位,使得能够产生拟杆菌属细胞群体,每个细胞具有不同的RNA引导的基因组修饰。然后可以将这些合并的细胞群体置于选择压力下,并且通过DNA测序分析选择的细胞。

(b) 细菌染色体

本文公开的蛋白质-核酸复合物进一步包含细菌染色体,其中所述细菌染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1的氨基酸序列具有至少50%序列同一性(与SEQ ID NO: 1至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)的氨基酸序列,并且所述细菌的染色体DNA与所述HU家族DNA结合蛋白缔合。DNA结合蛋白的HU家族包含小的(~ 90个氨基酸)碱性组蛋白样蛋白,其结合双链DNA而无序列特异性,并且结合DNA结构如叉、三/四向连接、切口、突出端和凸起。HU家族DNA结合蛋白的结合可以稳定DNA,并且保护其免于在极端环境条件下的变性。拟杆菌属HU家族DNA蛋白与染色体DNA的缔合产生了独特的结构环境,其它DNA结合蛋白例如CRISPR系统的那些必须与所述结构环境相容,以便结合染色体靶并且充当核酸酶、切口酶、脱氨酶或其它基因组修饰模式。

一般而言,染色体(或其染色体区域)可以在拟杆菌门的任何成员内。在一些实施方案中,HU家族DNA结合蛋白包含与SEQ ID NO: 1具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%序列同一性的氨基酸序列。在其它实施方案中,HU家族DNA结合蛋白具有SEQ ID NO: 1的氨基酸序列。

在一些实施方案中,生物体是拟杆菌属的成员。拟杆菌属物种是哺乳动物肠道微生物群的占优势厌氧共生体。它们含有各种糖分解酶,并且是肠道中多糖的主要发酵剂。当保留在肠道中时,它们维持与宿主复杂且一般有益的关系,但如果它们逃离这个环境,则可以引起显著的病理状况。拟杆菌属物种的非限制性实例包括产酸拟杆菌(

在一些实施方案中,染色体(或其染色体区域)选自多形拟杆菌、普通拟杆菌、解纤维素拟杆菌、脆弱拟杆菌、溃疡拟杆菌、卵形拟杆菌、萨氏拟杆菌、单形拟杆菌或解木糖拟杆菌以及这些物种的菌株水平变种。

在一些实施方案中,染色体(或其染色体区域)选自巴恩斯氏菌属物种(

例如,染色体区域可以具有与质粒DNA或细菌人工染色体相关的长度(大约2,000至350,000个碱基的长度)、或与初级细菌染色体相关的长度(130,000个碱基至14,000,000个碱基的长度)。

因此,例如,染色体区域的长度可以是约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10000、约11000、约12000、约13000、约14000、约15000、约16000、约17000、约18000、约19000、约20000、约21000、约22000、约23000、约24000、约25000、约26000、约27000、约28000、约29000、约30000、约31000、约32000、约33000、约34000、约35000、约36000、约37000、约38000、约39000、约40000、约41000、约42000、约43000、约44000、约45000、约46000、约47000、约48000、约49000、约50000、约51000、约52000、约53000、约54000、约55000、约56000、约57000、约58000、约59000、约60000、约61000、约62000、约63000、约64000、约65000、约66000、约67000、约68000、约69000、约70000、约71000、约72000、约73000、约74000、约75000、约76000、约77000、约78000、约79000、约80000、约81000、约82000、约83000、约84000、约85000、约86000、约87000、约88000、约89000、约90000、约91000、约92000、约93000、约94000、约95000、约96000、约97000、约98000、约99000、约100000、约101000、约102000、约103000、约104000、约105000、约106000、约107000、约108000、约109000、约110000、约111000、约112000、约113000、约114000、约115000、约116000、约117000、约118000、约119000、约120000、约121000、约122000、约123000、约124000、约125000、约126000、约127000、约128000、约129000、约130000、约131000、约132000、约133000、约134000、约135000、约136000、约137000、约138000、约139000、约140000、约141000、约142000、约143000、约144000、约145000、约146000、约147000、约148000、约149000、约150000、约151000、约152000、约153000、约154000、约155000、约156000、约157000、约158000、约159000、约160000、约161000、约162000、约163000、约164000、约165000、约166000、约167000、约168000、约169000、约170000、约171000、约172000、约173000、约174000、约175000、约176000、约177000、约178000、约179000、约180000、约181000、约182000、约183000、约184000、约185000、约186000、约187000、约188000、约189000、约190000、约191000、约192000、约193000、约194000、约195000、约196000、约197000、约198000、约199000、约200000、约201000、约202000、约203000、约204000、约205000、约206000、约207000、约208000、约209000、约210000、约211000、约212000、约213000、约214000、约215000、约216000、约217000、约218000、约219000、约220000、约221000、约222000、约223000、约224000、约225000、约226000、约227000、约228000、约229000、约230000、约231000、约232000、约233000、约234000、约235000、约236000、约237000、约238000、约239000、约240000、约241000、约242000、约243000、约244000、约245000、约246000、约247000、约248000、约249000、约250000、约251000、约252000、约253000、约254000、约255000、约256000、约257000、约258000、约259000、约260000、约261000、约262000、约263000、约264000、约265000、约266000、约267000、约268000、约269000、约270000、约271000、约272000、约273000、约274000、约275000、约276000、约277000、约278000、约279000、约280000、约281000、约282000、约283000、约284000、约285000、约286000、约287000、约288000、约289000、约290000、约291000、约292000、约293000、约294000、约295000、约296000、约297000、约298000、约299000、约300000、约301000、约302000、约303000、约304000、约305000、约306000、约307000、约308000、约309000、约310000、约311000、约312000、约313000、约314000、约315000、约316000、约317000、约318000、约319000、约320000、约321000、约322000、约323000、约324000、约325000、约326000、约327000、约328000、约329000、约330000、约331000、约332000、约333000、约334000、约335000、约336000、约337000、约338000、约339000、约340000、约341000、约342000、约343000、约344000、约345000、约346000、约347000、约348000、约349000、约350000、约351000、约352000、约353000、约354000、约355000、约356000、约357000、约358000、约359000、约360000、约361000、约362000、约363000、约364000、约365000、约366000、约367000、约368000、约369000、约370000、约371000、约372000、约373000、约374000、约375000、约376000、约377000、约378000、约379000、约380000、约381000、约382000、约383000、约384000、约385000、约386000、约387000、约388000、约389000、约390000、约391000、约392000、约393000、约394000、约395000、约396000、约397000、约398000、约399000、约400000、约401000、约402000、约403000、约404000、约405000、约406000、约407000、约408000、约409000、约410000、约411000、约412000、约413000、约414000、约415000、约416000、约417000、约418000、约419000、约420000、约421000、约422000、约423000、约424000、约425000、约426000、约427000、约428000、约429000、约430000、约431000、约432000、约433000、约434000、约435000、约436000、约437000、约438000、约439000、约440000、约441000、约442000、约443000、约444000、约445000、约446000、约447000、约448000、约449000、约450000、约451000、约452000、约453000、约454000、约455000、约456000、约457000、约458000、约459000、约460000、约461000、约462000、约463000、约464000、约465000、约466000、约467000、约468000、约469000、约470000、约471000、约472000、约473000、约474000、约475000、约476000、约477000、约478000、约479000、约480000、约481000、约482000、约483000、约484000、约485000、约486000、约487000、约488000、约489000、约490000、约491000、约492000、约493000、约494000、约495000、约496000、约497000、约498000、约499000、约500000、约501000、约502000、约503000、约504000、约505000、约506000、约507000、约508000、约509000、约510000、约511000、约512000、约513000、约514000、约515000、约516000、约517000、约518000、约519000、约520000、约521000、约522000、约523000、约524000、约525000、约526000、约527000、约528000、约529000、约530000、约531000、约532000、约533000、约534000、约535000、约536000、约537000、约538000、约539000、约540000、约541000、约542000、约543000、约544000、约545000、约546000、约547000、约548000、约549000、约550000、约551000、约552000、约553000、约554000、约555000、约556000、约557000、约558000、约559000、约560000、约561000、约562000、约563000、约564000、约565000、约566000、约567000、约568000、约569000、约570000、约571000、约572000、约573000、约574000、约575000、约576000、约577000、约578000、约579000、约580000、约581000、约582000、约583000、约584000、约585000、约586000、约587000、约588000、约589000、约590000、约591000、约592000、约593000、约594000、约595000、约596000、约597000、约598000、约599000、约600000、约601000、约602000、约603000、约604000、约605000、约606000、约607000、约608000、约609000、约610000、约611000、约612000、约613000、约614000、约615000、约616000、约617000、约618000、约619000、约620000、约621000、约622000、约623000、约624000、约625000、约626000、约627000、约628000、约629000、约630000、约631000、约632000、约633000、约634000、约635000、约636000、约637000、约638000、约639000、约640000、约641000、约642000、约643000、约644000、约645000、约646000、约647000、约648000、约649000、约650000、约651000、约652000、约653000、约654000、约655000、约656000、约657000、约658000、约659000、约660000、约661000、约662000、约663000、约664000、约665000、约666000、约667000、约668000、约669000、约670000、约671000、约672000、约673000、约674000、约675000、约676000、约677000、约678000、约679000、约680000、约681000、约682000、约683000、约684000、约685000、约686000、约687000、约688000、约689000、约690000、约691000、约692000、约693000、约694000、约695000、约696000、约697000、约698000、约699000、约700000、约701000、约702000、约703000、约704000、约705000、约706000、约707000、约708000、约709000、约710000、约711000、约712000、约713000、约714000、约715000、约716000、约717000、约718000、约719000、约720000、约721000、约722000、约723000、约724000、约725000、约726000、约727000、约728000、约729000、约730000、约731000、约732000、约733000、约734000、约735000、约736000、约737000、约738000、约739000、约740000、约741000、约742000、约743000、约744000、约745000、约746000、约747000、约748000、约749000、约750000、约751000、约752000、约753000、约754000、约755000、约756000、约757000、约758000、约759000、约760000、约761000、约762000、约763000、约764000、约765000、约766000、约767000、约768000、约769000、约770000、约771000、约772000、约773000、约774000、约775000、约776000、约777000、约778000、约779000、约780000、约781000、约782000、约783000、约784000、约785000、约786000、约787000、约788000、约789000、约790000、约791000、约792000、约793000、约794000、约795000、约796000、约797000、约798000、约799000、约800000、约801000、约802000、约803000、约804000、约805000、约806000、约807000、约808000、约809000、约810000、约811000、约812000、约813000、约814000、约815000、约816000、约817000、约818000、约819000、约820000、约821000、约822000、约823000、约824000、约825000、约826000、约827000、约828000、约829000、约830000、约831000、约832000、约833000、约834000、约835000、约836000、约837000、约838000、约839000、约840000、约841000、约842000、约843000、约844000、约845000、约846000、约847000、约848000、约849000、约850000、约851000、约852000、约853000、约854000、约855000、约856000、约857000、约858000、约859000、约860000、约861000、约862000、约863000、约864000、约865000、约866000、约867000、约868000、约869000、约870000、约871000、约872000、约873000、约874000、约875000、约876000、约877000、约878000、约879000、约880000、约881000、约882000、约883000、约884000、约885000、约886000、约887000、约888000、约889000、约890000、约891000、约892000、约893000、约894000、约895000、约896000、约897000、约898000、约899000、约900000、约901000、约902000、约903000、约904000、约905000、约906000、约907000、约908000、约909000、约910000、约911000、约912000、约913000、约914000、约915000、约916000、约917000、约918000、约919000、约920000、约921000、约922000、约923000、约924000、约925000、约926000、约927000、约928000、约929000、约930000、约931000、约932000、约933000、约934000、约935000、约936000、约937000、约938000、约939000、约940000、约941000、约942000、约943000、约944000、约945000、约946000、约947000、约948000、约949000、约950000、约951000、约952000、约953000、约954000、约955000、约956000、约957000、约958000、约959000、约960000、约961000、约962000、约963000、约964000、约965000、约966000、约967000、约968000、约969000、约970000、约971000、约972000、约973000、约974000、约975000、约976000、约977000、约978000、约979000、约980000、约981000、约982000、约983000、约984000、约985000、约986000、约987000、约988000、约989000、约990000、约991000、约992000、约993000、约994000、约995000、约996000、约997000、约998000、约999000、约1000000、约1001000、约1002000、约1003000、约1004000、约1005000、约1006000、约1007000、约1008000、约1009000、约1010000、约1011000、约1012000、约1013000、约1014000、约1015000、约1016000、约1017000、约1018000、约1019000、约1020000、约1021000、约1022000、约1023000、约1024000、约1025000、约1026000、约1027000、约1028000、约1029000、约1030000、约1031000、约1032000、约1033000、约1034000、约1035000、约1036000、约1037000、约1038000、约1039000、约1040000、约1041000、约1042000、约1043000、约1044000、约1045000、约1046000、约1047000、约1048000、约1049000、约1050000、约1051000、约1052000、约1053000、约1054000、约1055000、约1056000、约1057000、约1058000、约1059000、约1060000、约1061000、约1062000、约1063000、约1064000、约1065000、约1066000、约1067000、约1068000、约1069000、约1070000、约1071000、约1072000、约1073000、约1074000、约1075000、约1076000、约1077000、约1078000、约1079000、约1080000、约1081000、约1082000、约1083000、约1084000、约1085000、约1086000、约1087000、约1088000、约1089000、约1090000、约1091000、约1092000、约1093000、约1094000、约1095000、约1096000、约1097000、约1098000、约1099000、约1100000、约1101000、约1102000、约1103000、约1104000、约1105000、约1106000、约1107000、约1108000、约1109000、约1110000、约1111000、约1112000、约1113000、约1114000、约1115000、约1116000、约1117000、约1118000、约1119000、约1120000、约1121000、约1122000、约1123000、约1124000、约1125000、约1126000、约1127000、约1128000、约1129000、约1130000、约1131000、约1132000、约1133000、约1134000、约1135000、约1136000、约1137000、约1138000、约1139000、约1140000、约1141000、约1142000、约1143000、约1144000、约1145000、约1146000、约1147000、约1148000、约1149000、约1150000、约1151000、约1152000、约1153000、约1154000、约1155000、约1156000、约1157000、约1158000、约1159000、约1160000、约1161000、约1162000、约1163000、约1164000、约1165000、约1166000、约1167000、约1168000、约1169000、约1170000、约1171000、约1172000、约1173000、约1174000、约1175000、约1176000、约1177000、约1178000、约1179000、约1180000、约1181000、约1182000、约1183000、约1184000、约1185000、约1186000、约1187000、约1188000、约1189000、约1190000、约1191000、约1192000、约1193000、约1194000、约1195000、约1196000、约1197000、约1198000、约1199000、约1200000、约1201000、约1202000、约1203000、约1204000、约1205000、约1206000、约1207000、约1208000、约1209000、约1210000、约1211000、约1212000、约1213000、约1214000、约1215000、约1216000、约1217000、约1218000、约1219000、约1220000、约1221000、约1222000、约1223000、约1224000、约1225000、约1226000、约1227000、约1228000、约1229000、约1230000、约1231000、约1232000、约1233000、约1234000、约1235000、约1236000、约1237000、约1238000、约1239000、约1240000、约1241000、约1242000、约1243000、约1244000、约1245000、约1246000、约1247000、约1248000、约1249000、约1250000、约1251000、约1252000、约1253000、约1254000、约1255000、约1256000、约1257000、约1258000、约1259000、约1260000、约1261000、约1262000、约1263000、约1264000、约1265000、约1266000、约1267000、约1268000、约1269000、约1270000、约1271000、约1272000、约1273000、约1274000、约1275000、约1276000、约1277000、约1278000、约1279000、约1280000、约1281000、约1282000、约1283000、约1284000、约1285000、约1286000、约1287000、约1288000、约1289000、约1290000、约1291000、约1292000、约1293000、约1294000、约1295000、约1296000、约1297000、约1298000、约1299000、约1300000、约1301000、约1302000、约1303000、约1304000、约1305000、约1306000、约1307000、约1308000、约1309000、约1310000、约1311000、约1312000、约1313000、约1314000、约1315000、约1316000、约1317000、约1318000、约1319000、约1320000、约1321000、约1322000、约1323000、约1324000、约1325000、约1326000、约1327000、约1328000、约1329000、约1330000、约1331000、约1332000、约1333000、约1334000、约1335000、约1336000、约1337000、约1338000、约1339000、约1340000、约1341000、约1342000、约1343000、约1344000、约1345000、约1346000、约1347000、约1348000、约1349000、约1350000、约1351000、约1352000、约1353000、约1354000、约1355000、约1356000、约1357000、约1358000、约1359000、约1360000、约1361000、约1362000、约1363000、约1364000、约1365000、约1366000、约1367000、约1368000、约1369000、约1370000、约1371000、约1372000、约1373000、约1374000、约1375000、约1376000、约1377000、约1378000、约1379000、约1380000、约1381000、约1382000、约1383000、约1384000、约1385000、约1386000、约1387000、约1388000、约1389000、约1390000、约1391000、约1392000、约1393000、约1394000、约1395000、约1396000、约1397000、约1398000、约1399000或约1400000个碱基对。

(c)特定的蛋白质-核酸复合物

在具体实施方案中,蛋白质-核酸复合物可以包含改造的RNA引导的(CRISPR)核碱基修饰系统,其包含(i)核酸酶缺陷型Cas9或Cas12a变体和(ii)碱基编辑器,例如与拟杆菌属染色体结合或缔合的胞苷脱氨酶或腺苷脱氨酶(或其催化结构域)。在一些实施方案中,改造的RNA引导的(CRISPR)核碱基修饰系统包含与胞苷脱氨酶或腺苷脱氨酶(或其催化结构域)连接的核酸酶缺陷型Cas9或Cas12a变体。

本公开内容的一个进一步方面提供了用于生成如上文部分(I)中所述的复合物的方法,所述复合物包含改造的RNA引导的(CRISPR)核碱基修饰系统和编码HU家族DNA结合蛋白的细菌染色体。所述方法包括(a)改造核碱基修饰系统的CRISPR系统,以靶向细菌染色体中的特定基因座,并且(b)将改造的RNA引导的(CRISPR)核碱基修饰系统引入拟杆菌属物种/菌株内。

改造核碱基修饰系统的CRISPR系统包括设计引导RNA,其crRNA引导序列靶向细菌染色体中的特定(~19-22 nt)序列或基因座,所述特定序列或基因座与PAM序列(其由目的CRISPR蛋白识别)相邻,并且其tracrRNA序列由目的CRISPR蛋白识别,如上文部分(I) (a)(i)中所述。

可以将改造的CRISPR核碱基修饰系统作为至少一种编码核酸引入细菌细胞内。例如,编码核酸可以是一种或多种载体的部分。编码改造的CRISPR核碱基修饰系统(例如,CRISPR-碱基编辑器融合物和一种或多种gRNA)的载体可以是质粒载体、噬菌粒载体、病毒载体、细菌噬菌体载体、细菌噬菌体-质粒杂合载体或其它合适的载体。载体可以是整合载体、接合载体、穿梭载体、表达载体、染色体外载体等等。用于将各种载体递送或引入拟杆菌属内的手段是本领域众所周知的。

编码CRISPR-碱基编辑器融合物的核酸序列可以与启动子可操作地连接,用于在目的细菌中表达。在具体实施方案中,编码CRISPR-碱基编辑器融合物的序列可以与调控型启动子可操作地连接。在一些方面,调控型启动子可以由启动子诱导化学制品调控。在此类实施方案中,启动子可以是pTetO,其基于大肠杆菌Tn10衍生的tet调控系统,并且由含有强tet操纵子(tetO)的分枝杆菌启动子和阻遏物TetR)的表达盒组成,并且启动子诱导化学制品可以是脱水四环素(aTc)。在其它实施方案中,启动子可以是pBAD或araC-ParaBAD,并且启动子诱导化学制品可以是阿拉伯糖。在进一步的实施方案中,启动子可以是pLac或tac(trp-lac),并且启动子诱导化学制品可以是乳糖/IPTG。在其它实施方案中,启动子可以是pPrpB,并且启动子诱导化学制品可以是丙酸盐。

编码至少一种引导RNA的核酸序列可以与启动子可操作地连接,用于在目的细菌中表达。一般而言,至少一种引导RNA的表达可以由组成型启动子调控。在其中目的细菌是拟杆菌属的实施方案中,组成型启动子可以是P1启动子,其位于多形拟杆菌16S rRNA基因BT_r09的上游(Wegmann等人,

在一些实施方案中,载体可以是整合载体,并且可以进一步包含编码重组酶的序列、以及一个或多个重组酶识别位点。一般而言,重组酶是不可逆的重组酶。合适重组酶的非限制性实例包括拟杆菌属intN2酪氨酸整合酶(由NBU2基因编码)、链霉菌属(

上述载体中的任一种都可以进一步包含至少一个转录终止序列,以及至少一个复制起点和/或至少一个可选择标记物序列(例如抗生素抗性基因),用于在目的拟杆菌属细胞中的繁殖和选择。

关于载体及其使用的另外信息可以在“Current Protocols in MolecularBiology” Ausubel等人,John Wiley & Sons,New York,2003,或“Molecular Cloning: ALaboratory Manual” Sambrook & Russell,Cold Spring Harbor Press,Cold SpringHarbor,NY,第3版,2001中找到。

在其中编码改造的CRISPR核碱基修饰系统的载体是整合载体的实施方案中,在载体递送至生物体(和重组酶/整合酶的表达)后,编码改造的系统的核酸(或整个载体)可以稳定地整合到拟杆菌属染色体内。在其中编码改造的CRISPR核碱基修饰系统的载体并非整合载体的实施方案中,在载体递送至细菌后,载体可以保持在染色体外。

在其中编码CRISPR-碱基编辑器融合物的核酸序列与诱导型启动子可操作连接的实施方案中,CRISPR核碱基修饰系统的表达可以通过将启动子诱导化学制品引入细菌内进行诱导。在具体实施方案中,启动子诱导化学制品可以是脱水四环素。在诱导后,CRISPR-碱基编辑器融合物被合成并与至少一种引导RNA复合,所述引导RNA将CRISPR核碱基修饰系统靶向细菌染色体中的靶基因座,从而形成如本文公开的蛋白质-核酸复合物。

本公开内容的一个进一步方面涵盖用于修饰拟杆菌属的靶成员的染色体中的至少一个核碱基的方法。该方法包括在靶物种/菌株中表达改造的RNA引导的(CRISPR)核碱基修饰系统,其中所述改造的RNA引导的(CRISPR)核碱基修饰系统靶向靶细菌的染色体中的特定基因座,并且所述改造的RNA引导的核碱基修饰系统修饰在特定基因座内的至少一个核碱基,使得包含特定基因座的基因被修饰和/或失活,并且其中所述靶细菌物种/菌株的染色体编码HU家族DNA结合蛋白,其包含与SEQ ID NO: 1具有至少50%序列同一性(例如,与SEQ ID NO: 1至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的序列同一性)的氨基酸序列。核碱基修饰(例如,胞嘧啶转换为胸腺嘧啶或腺嘌呤转换为鸟嘌呤)可以在特定基因座内引入单核苷酸多态性(SNP)和/或终止密码子。作为至少一种核碱基修饰的结果,靶细菌的包含特定基因座的至少一种基因的表达可以被改变、降低或消除。

上文部分(I) (a)中所述的任何RNA引导的(CRISPR)核碱基修饰系统都可以如上文部分(II)中所述进行改造,以靶向目的拟杆菌属系统发育谱系中的细菌物种/菌株的染色体中的特定基因座,其在上文部分(I) (b)中进行描述。改造的CRISPR核碱基修饰系统可以作为载体的部分引入细菌内,如上文部分(II)中所述。一般而言,CRISPR-核碱基修饰系统是可诱导的(例如,编码CRISPR-碱基编辑器融合物的核酸序列可操作地连接至诱导型启动子)。因此,CRISPR核碱基修饰系统可以在限定的时间点表达。在不存在启动子诱导化学制品的情况下,无法生成CRISPR核碱基修饰系统。CRISPR-碱基编辑器融合物可以通过将细菌暴露于启动子诱导化学制品来产生,使得CRISPR-碱基编辑器融合蛋白由如上文部分(II)中所述的染色体整合的编码序列或染色体外编码序列表达。CRISPR-碱基编辑器融合物与至少一种引导RNA复合,所述引导RNA由染色体整合的编码序列或染色体外编码序列组成型表达,从而形成活性CRISPR核碱基修饰系统。CRISPR核碱基修饰系统靶向细菌染色体中的特定基因座,在其中它修饰至少一个核碱基,使得改变、降低或消除包含特定基因座的基因的表达。

在一些实施方案中,靶生物可以是拟杆菌属物种或菌株水平变种,如上文部分(I)(b)中详述的。

在其它实施方案中,生物体可以包含在哺乳动物的消化道(或肠道)中,其中启动子诱导化学制品的施用可以导致核碱基修饰(例如,胞嘧啶转换为胸腺嘧啶或腺嘌呤转换为鸟嘌呤),其可能导致肠道微生物群中靶细菌的水平降低或消除。启动子诱导化学制品可以经口(例如,经由食物、饮料或药物制剂)施用。哺乳动物可以是小鼠、大鼠或其它研究动物。在具体实施方案中,哺乳动物可以是人。例如,靶细菌生物体(例如,拟杆菌属的成员)的减少或消除可以导致改善的肠道健康。

混合的细菌群体(在细胞培养物或消化道中)可以包含广泛多样的分类群。例如,人肠道微生物群可以包含数百个不同的细菌物种,伴随着显著的菌株水平多样性。

在某些实施方案中,哺乳动物(例如,人)可以正在经历癌症免疫疗法,其中与无应答者相比,免疫疗法应答者已显示在其肠道微生物群中具有较低水平的拟杆菌属物种(Gopalakrishnan等人,

在某些实施方案中,哺乳动物(例如,人、犬科动物、猫科动物、猪科动物、马科动物或牛科动物)可以出于多种原因而经历肠道手术,所述原因包括但不限于炎性肠病、克罗恩氏病、憩室炎、肠阻塞、息肉切除、癌性组织切除、溃疡性结肠炎、肠切除术、直肠切除术、完全结肠切除术或部分结肠切除术,其中通过诱导型CRISPR核碱基修饰系统在术前减弱哺乳动物肠道内的脆弱拟杆菌物种,可以降低在肠道外但在哺乳动物体内的定位处的术后脆弱拟杆菌感染风险。肠道外的定位包括肠道的外表面。可以将脆弱拟杆菌内的诱导型CRISPR核碱基修饰系统靶向修饰与致病岛、毒素(即脆弱拟杆菌毒素或BFT)、或者与脆弱拟杆菌的感染性菌株或已知引起术后感染的其它天然肠道细菌相关的其它独特序列相似的定位,但不限于此。例如,非产毒脆弱拟杆菌(NTBF)和产肠毒素脆弱拟杆菌(ETBF)的水平可以使用置于ETBF菌株而非NTBF菌株内的改造的诱导型CRISPR核碱基修饰系统进行选择性调节。在肠道手术后有风险引起感染的其它肠道细菌可能包括多毛拟杆菌、大肠杆菌、粪肠球菌(

本公开内容的又一个方面涵盖例如用作益生菌的改造的细菌菌株。改造的菌株包含在部分(I) (a)中所述的任何改造的CRISPR核碱基修饰系统,其整合到细菌染色体内或作为附加型载体维持在目的生物体内。在一些实施方案中,改造的细菌是改造的拟杆菌属,其包含诱导型CRISPR核碱基修饰系统。向哺乳动物受试者施用改造的拟杆菌属,随后为CRISPR系统的诱导,可以用于靶向细菌染色体中的特定基因座。通过该CRISPR系统修饰至少一个核碱基,使得改变、降低或消除包含特定基因座的基因的表达,从而为哺乳动物受试者提供治疗益处。在其它实施方案中,拟杆菌属菌株可以进行改造,以在与肠道微生物群中拟杆菌属的野生型菌株的竞争中胜出。在这些及其它实施方案中,然后可以通过诱导型CRISPR核碱基修饰系统的诱导,从哺乳动物受试者中移出对于哺乳动物受试者提供治疗益处的改造的拟杆菌属菌株。

除非另有定义,否则本文使用的所有技术和科学术语都具有由本发明所属领域的技术人员通常理解的含义。下述参考文献为技术人员提供了本发明中使用的许多术语的一般定义:Singleton等人,Dictionary of Microbiology and Molecular Biology (第2版,1994);The Cambridge Dictionary of Science and Technology (Walker编辑,1988);The Glossary of Genetics,第5版,R. Rieger等人(编辑),Springer Verlag (1991);以及Hale & Marham,The Harper Collins Dictionary of Biology (1991)。如本文使用的,除非另有说明,否则下述术语具有归于其的含义。

当介绍本公开内容或其优选实施方案的要素时,冠词“一个”、“一种”、“该”和“所述”预期意指存在一个或多个要素。术语“包含”、“包括”和“具有”预期是包含性的,并且意指可以存在除所列要素外的另外要素。

当关于数值x使用时,术语“约”例如意指x ± 5%。

如本文使用的,术语“互补的”或“互补性”指通过特定氢键的碱基配对的双链核酸缔合。碱基配对可以是标准的沃森-克里克碱基配对(例如5’-A G T C-3’与互补序列3’-TC A G-5’配对)。碱基配对也可以是Hoogsteen或反向Hoogsteen氢键合。互补性通常关于双链体区域进行测量,并且因此,例如排除突出端。如果仅一些(例如70%)碱基是互补的,则双链体区域的两条链之间的互补性可以是部分的,并且表示为百分比(例如70%)。并不互补的碱基是“错配的”。如果双链体区域中的所有碱基都是互补的,则互补性也可以是完全的(即,100%)。

关于基因或多核苷酸的术语“表达”指基因或多核苷酸的转录,以及适当时mRNA转录物翻译成蛋白质或多肽。因此,如根据上下文中将明确的,蛋白质或多肽的表达起因于开放读码框的转录和/或翻译。

如本文使用的,“基因”指编码基因产物的DNA区域(包括外显子和内含子),以及调控基因产物的产生的所有DNA区域,无论此类调控序列是否与编码序列和/或转录序列相邻。相应地,基因包括但不一定限于启动子序列、终止子、翻译调控序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区域。

术语“异源的”指对于目的细胞并非内源或天然的实体。例如,异源蛋白质指衍生自或最初衍生自外源来源(例如外源引入的核酸序列)的蛋白质。在一些情况下,异源蛋白质通常并非由目的细胞产生。

术语“切口酶”指切割双链核酸序列的一条链的酶。

与术语“核酸内切酶”可互换使用的术语“核酸酶”指切割双链核酸序列的两条链或切割单链核酸序列的酶。

术语“核酸”和“多核苷酸”指呈线性或环状构象、以及以单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本公开内容的目的,这些术语不应解释为关于聚合物长度的限制。该术语可以涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸酯部分(例如,硫代磷酸酯骨架)中修饰的核苷酸。一般而言,特定核苷酸的类似物具有相同的碱基配对特异性;即A的类似物将与T碱基配对。

术语“核苷酸”指脱氧核糖核苷酸或核糖核苷酸。核苷酸可以是标准核苷酸(即,腺苷、鸟苷、胞苷、胸苷和尿苷),核苷酸异构体或核苷酸类似物。核苷酸类似物指具有修饰的嘌呤或嘧啶碱基或者修饰的核糖部分的核苷酸。核苷酸类似物可以是天然存在的核苷酸(例如肌苷、假尿苷等)或非天然存在的核苷酸。核苷酸的糖或碱基部分上的修饰的非限制性实例包括乙酰基、氨基、羧基、羧甲基、羟基、甲基、磷酰基和硫醇基的添加(或去除),以及碱基的碳和氮原子被其它原子的取代(例如7-脱氮嘌呤)。核苷酸类似物还包括双脱氧核苷酸、2'-O-甲基核苷酸、锁核酸(LNA)、肽核酸(PNA)和吗啉代寡核苷酸(morpholino)。

术语“多肽”和“蛋白质”可互换使用,以指氨基酸残基的聚合物。

术语“靶序列”、“靶位点”和“特定基因座”可互换使用,以指CRISPR系统所靶向的目的核酸(例如,染色体DNA或细胞RNA)中的特定序列,以及CRISPR系统修饰核酸或与核酸缔合的蛋白质的位点。

用于确定核酸和氨基酸序列同一性的技术是本领域已知的。通常,此类技术包括确定基因的mRNA的核苷酸序列和/或确定由此编码的氨基酸序列,并且将这些序列与第二核苷酸或氨基酸序列进行比较。基因组序列也可以以这种方式来确定且比较。一般而言,同一性分别指两个多核苷酸或多肽序列的精确核苷酸对核苷酸或氨基酸对氨基酸的对应关系。可以通过确定其同一性百分比来比较两个或更多个序列(多核苷酸或氨基酸)。两个序列(无论是核酸序列还是氨基酸序列)的同一性百分比是两个比对序列之间的精确匹配数目除以较短序列的长度,且乘以100。核酸序列的近似比对由Smith和Waterman,Advancesin Applied Mathematics 2:482-489(1981)的局部同源性算法提供。这种算法可以通过使用评分矩阵应用于氨基酸序列,所述评分矩阵由Dayhoff,Atlas of Protein Sequencesand Structure,M. O. Dayhoff编辑,5 suppl. 3:353-358,National BiomedicalResearch Foundation,Washington,D.C.,USA开发,并且由Gribskov,Nucl. Acids Res.14(6):6745-6763(1986)标准化。这种算法确定序列的同一性百分比的示例性实现由“BestFit”实用应用程序中的Genetics Computer Group(Madison,Wis.)提供。用于计算序列之间的同一性或相似性百分比的其它合适程序是本领域一般已知的,例如,另一种比对程序是与缺省参数一起使用的BLAST。例如,可以使用下述缺省参数来使用BLASTN和BLASTP:遗传密码=标准;过滤器=无;链=两条;截断=60;期望=10;矩阵=BLOSUM62;描述=50个序列;排序方式=高得分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序的详细信息可以在GenBank网站上找到。

由于可以在上述细胞和方法中作出各种变化,而不背离本发明的范围,因此预期上述说明和下文给出的实施例中包含的所有内容,都应该解释为示例性的而不是限制性的。

实施例

下述实施例示出了本公开内容的某些方面。

实施例1. 多形拟杆菌中的CRISPR碱基编辑

在拟杆菌属中进行脱氨酶介导的靶向碱基编辑,以直接编辑由引导RNA指定的在靶基因座处的核苷酸,而无需DNA切割或模板供体DNA (图1)。实现了接近100%的编辑效率,而不诱导细胞死亡,并且因此适合于拟杆菌属的基因组改造。

构建了拟杆菌属dCas9-AlD载体pNBU2.CRISPR-CDA。该载体表达(i)在脱水四环素诱导型启动子下,与海七鳃鳗(

在该具体实例中,构建了三种质粒,其表达非靶向对照引导RNA (5'-TGATGGAGAGGTGCAAGTAG -3',称为'NT',SEQ ID NO: 4)、或者靶向

用红霉素选择将pNBU2.CRISPR-CDA质粒与Bt细胞接合,每次接合导致500-1000个菌落。由于缺乏拟杆菌属的复制起点,这些质粒无法维持。红霉素抗性菌落很可能是染色体整合体。从每次接合中挑选菌落,用于在

对于

对于

实施例2. 在多形拟杆菌

构建了拟杆菌属dCas9-AID载体pmobA.repA.CRISPR-CDA.NT。该载体表达(i)在脱水四环素诱导型启动子下,与海七鳃鳗(

TCGGGACGCTCATCAATATCCACCCTGCCTGGGATAAATCCTCGCCCTGCATTTTTAGAACCACGTTTGGCATACCTGCGACCTTGTCTGCGAAGATATTTGTGCAGTTTGCCACCCCGCCGCTTATCCTCCCAAATCCAGCGATATATCGTTTCGTGAGATACCATCGCAATTCCCTCCAAGCGGCTCCTGCCGACAATCTGCTCCGGGCTGAATCCTTTCTTCAACAGCTTTATTATCCGTTTTCTCATTGCCGGTGTAAGCACTTCCTTGCGATGTTTTTGCTGCTTGCGCCTGTCTGCTTTTCGCTGGGCAAGCTCCATGCTATAGCTACCACTTCGGGCGTCGCAATTGCGCTTTATCTCCCTGTAAACAGTGCTTTTATCTACTCCGATAGCTTCCGCTATTGCTTTTTTGCTCATCGGTATTTGCAACATCATAGAAATTGCATACCTTTGTTCCTCGGTTATATGTTTGCTCATCTGCAACTTTTTTTTCTTTGGACGGACAATTAAAGCAAAGATAGCAAACTTTATCCATTCAGAGTGAGAGAAAGGGGGACATTGTCTCTCTTTCCTCTCTGAAAAATAAATGTTTTTATTGCTTATTATCCGCACCCAAAAAGTTGCATTTATAAGTTGAACTCAAGAAGTATTCACCTGTAAGAAGTTACTAATGACAAAAAAGAAATTGCCCGTTCGTTTTACGGGTCAGCACTTTACTATTGATAAAGTGCTAATAAAAGATGCAATAAGACAAGCAAATATAAGTAATCAGGATACGGTTTTAGATATTGGGGCAGGCAAGGGGTTTCTTACTGTTCATTTATTAAAAATCGCCAACAATGTTGTTGCTATTGAAAACGACACAGCTTTGGTTGAACATTTACGAAAATTATTTTCTGATGCCCGAAATGTTCAAGTTGTCGGTTGTGATTTTAGGAATTTTGCAGTTCCGAAATTTCCTTTCAAAGTGGTGTCAAATATTCCTTATGGCATTACTTCCGATATTTTCAAAATCCTGATGTTTGAGAGTCTTGGAAATTTTCTGGGAGGTTCCATTGTCCTTCAATTAGAACCTACACAAAAGTTATTTTCGAGGAAGCTTTACAATCCATATACCGTTTTCTATCATACTTTTTTTGATTTGAAACTTGTCTATGAGGTAGGTCCTGAAAGTTTCTTGCCACCGCCAACTGTCAAATCAGCCCTGTTAAACATTAAAAGAAAACACTTATTTTTTGATTTTAAGTTTAAAGCCAAATACTTAGCATTTATTTCCTGTCTGTTAGAGAAACCTGATTTATCTGTAAAAACAGCTTTAAAGTCGATTTTCAGGAAAAGTCAGGTCAGGTCAATTTCGGAAAAATTCGGTTTAAACCTTAATGCTCAAATTGTTTGTTTGTCTCCAAGTCAATGGTTAAACTGTTTTTTGGAAATGCTGGAAGTTGTCCCTGAAAAATTTCATCCTTCGTAGTTCAAAGTCGGGTGGTTGTCAAGATGATTTTTTTGGTTTGGTGTCGTCTTTTTTTAAGCTGCCGCATAACGGCTGGCAAATTGGCGATGGAGCCGACTTTGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGCATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTAGACATATTCGTTTAATATCATAAATAATTTATTTTATTTTAAAATGCGCGGGTGCAAAGGTAAGAGGTTTTATTTTAACTACCAAATGTTTTCGGAAGTTTTTTCGCTTTTCTTTTTCTATCGTTTCTCAGACTCTCTTAGCGAAAGGGAAAGAAGGTAAAGAAGAAAAACAAAACGCCTTTTCTTTTTTGCACCCGCTTTCCAAGAGAAGAAAGCCTTGTTAAATTGACTTAGTGTAAAAGCGCAGTACTGCTTGACCATAAGAACAAAAAAATCTCTATCACTGATAGGGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTCTCCCTATCAGTGATAGAGACGAAATAAAGACATATAAAAGAAAAGACACCATGGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATGCCATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACGGTGGAGGAGGTTCTGGAGGTGGAGGTTCTGCTGAGTATGTGCGAGCCCTCTTTGACTTTAATGGGAATGATGAAGAGGATCTTCCCTTTAAGAAAGGAGACATCCTGAGAATCCGGGATAAGCCTGAGGAGCAGTGGTGGAATGCAGAGGACAGCGAAGGAAAGAGGGGGATGATTCCTGTCCCTTACGTGGAGAAGTATTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGCTCGAGTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGCATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAATCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAATTAATGCGGCTGCAATTTTTTTGGGCGGGGCCGCCCAAAAAAATCCTAGCACCCTGCAGCAGTACTGCTTGACCATAAGAACAAAAAAACTTCCGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTTGATGGAGAGGTGCAAGTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACACACCATAAACTTTTTTTAGAATAAGCACACAACCGTTTTCCGAACCCTGCAAAATGTTTTCTGAATCCGAACGGTGTAACACTCCATTGAGAGAGGCTGCCGTTTGGTCGCTCCCCCTTTGGGGGCGGGGGGGGGTTACATACCCATGCCGAAACCTCTGCTTCTGGTGATTTGCTTGAATAGGTCTTTCCCCTCTTCCATAGCTTTTGATATGTTTGGGAAATGATGCCTTAAAGCCTCCAGTTGTTCGGAATTGAACAAGTCTTTCATCTTACCAAGTTCTTTTTTCAACTCCTTGGTTTCGGCTTTTAGTTTTTGGTTCTCCGTCCTTAATAGGTTACTGGTTGTCCTTGCGTTGTCCATTTGTTGTCTATAATACTCCTTGTCATTCTCGGCTTTGAATGCCTTTGTGCTGTTTCGCTCTTTTTCAAGTATAGCCTTTCCCAGTCTATCGGATAGTTGTTCATTTTCCCCCTCTAAAGTCTTTACTTTGGCTTTTAAGGCATCCTTTTCCCTATCGTTGACTGTTTTTCCAATCAAGCCGTAAAACTTCTCTGAAGCCTTAGAAATGAGTTTTTGGACGTTCTTCTTTGTTTCAATGGAACGTAGTTCCTTCTGAAGCTGAAGAAGCTGGTTTTGTGCGTCCTTGTATTTGTCTAATGCACTGGATATATCGTTGGATAGTTCCTGAAGCTGTTCTTTCGCACATTCGGTCTTGTACTGCATAGCCGATAAGTGTTTGCGGTCAGAAGAAACGCCACGTTCCATGCCCAGTGTTTCAGATGCTATGGTTTGGAGTTCTGCCATGTCATCACGCGATAAACGCACACTTTTCCCATTCGGCTGCGTCCAATCGAAAACTACATGGGCATGAAGGTTAGGTGTCCACTGCTTTGCGTTCATGTATCCTTCGTCCTTGTGTATATGGATTTGAAACGCTTCGATACCGAAACGTTCTTTGCAGACCGTGGCAAACTGCTGGAGTTCCTGCATAGTGGTTTCTTGTTTGATTACTATTACTCCCTCTCGTATGGGTGCGGCTTTAGCCTGCATCTTCTGCCCAACCGTATCGAGATATCTTTGTTTTGCACTCTCCAGCCGATGGGAAATGCTATCTCCAACCCAGCTTTCATTCAAATGACTAAGTTCGGGACGAACATAGTCCAACTCTTTTTCCCTAAAGTTGTGAATCTCGCTCCCCGGCTTCACTGCTTGTACATGAATACTTGTTGCTCCCATAAGTTAACATTTTTGTGACAATCGATAACAGCCGGTGACAGCCGGCTGACAGGGGGTTAAGGGGGCTTGTCCCCTTACACACGCACTCTTTAGGGTGCTAGTGTGCTATCACCATACTGCATAGGTGCGAAGTTAGTGAATGTTTTGTAAATGCACAAATAAAGGGAAAAACATTTGGATTTGCGATAATAAAGTACTACCTTTGTTGCTGACCAAACGGTAGCTGACCGATACGGGAGAGTTACCAAAATACAAGCCGCTGGAGTTAATTGACGGACATCCGACATCTCCAGCGGCTTTATTTTTGCCTATCTGCTTCGCCTAGGCACACCAGTACCTCTACTAAAAATGTACTTCAAAGATACTTATTTTCTACCGACTTGATAGTTTTTACCCCATATTCTTGGACATTTTTCCCCCATGAGGTTATCTTTGTAGGGTGAAAGAGAAACCCATAAACGGGGATAGATTGAATGCTGGGAAGCATAAACAATCGGGGTAAGGTTAGCGAACCTTGCCTTTCATCCCCCATTATAACTTTACATAGAGGAACTTTATCTATCCCCCCCCGCCCCCAAAGGGGGAGCGACCAAACGGCAGCTTCACTCAATGGAGTGTTACTGTTCATCAAAGCCAAGTGATAATTGTCGTTTCTCTGCTTCTTCTTTCTTTTGGGCAGCTAAAGTCTTTTTCCGAACGTATGTTTTAGCAAATGTCACTCGGTCACCATTGAATACTATCAGAGGATTAATAAACCAAAGATTATCGGCTGGTCCTCGGGCTATGATTTCAGCTTTTACAAGTTCTGCAAGTCCTTTATAAACGGCTTTGTCTGTTTTGTATTTGGTATATTCTAGGCATTTTTTTCTATTGAAAATGATTAAATCATTTTTGGGTTTCATGCAGGTCATAAAGTAACCAAAAACCCGAATAGCTGCTTGTGATAGGTCAAAGAATGCAGCAAAGTTAGAAAGATACAATTTAGTGAATTGTTCTTCATCTACTTCTATTTGACGGATAAACGAAGTCTTAAACACTTCTCCAGTTTCAGTGTCGGCTAAAGCTACTACAGCTCTCTTATCGCCACCACTATTACTCTTATACTTTTTAACAACATGATTTTCAATACCTTCTATAGCTTGTTTCATAAAAGGATTTTCTTCGTTCTTTTGAAAATCGGTTAACTTAACTGCTTTTTTATTTTCCATTTTGATATGTTTTTGGGAAATATTATTCTCCACAAAGTAAACTATTATTTTCCATAAAAACAATATTAAGGGAAATATTATTTTCCTATTTAGTATCATATTAGGAAATCGGTATTTTCTAGATTGGAAAATGAGAATTTCCAATATGGAAAATGCCCTATATTGTGTATCAAGTACTTAACTTATTCTATTTCTTTTATTCTTAATATACCCCCAAAACAGCACAAAATCAGTCACTTAAAAATCATCGGTCGGGGAATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGCTAAATTTAAATATAAACAA

在该具体实例中,构建了三种质粒,其表达非靶向对照引导RNA (5’-TGATGGAGAGGTGCAAGTAG -3’,称为‘NT’,SEQ ID NO: 4)、或者靶向

pmobA.repA.CRISPR-CDA质粒最初在需氧条件下,在脑心浸液(BHI;BecktonDickinson,Co.)血琼脂平板上,无需选择或诱导与

从这三块aTc100琼脂平板中挑选菌落。执行BT_0362和BT_0364区域的菌落PCR,随后为桑格测序。使用MilliporeSigma内部开发的软件的定量突变分析指示,BT_0362和BT_0364碱基编辑的样品aTc100琼脂平板包含对于BT_0362样品在相对于PAM的-17位置处,以及对于BT_0364样品在相对于PAM的-18、-19和-20位置处的预计的C至T取代。代表性的BT_0362和BT_0364样品显示于(图6A和B)中。这些C-T取代导致在BT_0362和BT_0364碱基编辑样品两者中的早期终止密码子引入。NT菌株在aTC诱导后并未显示在靶向BT_0362或BT_0364区域中的任何C-T取代。

这个分析软件被称为“SangerTrace”。它基于Applied Biosystem’s,Inc.格式(ABI)文件提取每个碱基信号峰值,并且通过比较“对照”和“样品”的桑格测序数据来计算突变百分比。

实施例3. 其它拟杆菌属菌株中的CRISPR碱基编辑

基于公开的基因组序列,NBU2整合酶重组tRNA-ser位点(5’-CCTGTCTCTCCGC-3’(SEQ ID NO: 2)是保守的,并且存在于许多拟杆菌属菌株中,包括普通拟杆菌、解纤维素拟杆菌、脆弱拟杆菌、溃疡拟杆菌、卵形拟杆菌、萨氏拟杆菌、单形拟杆菌和解木糖拟杆菌。表达靶向引导RNA的诱导型CRISPR-CDA盒可以整合到这些拟杆菌属菌株的染色体上,并且可以通过用aTc诱导剂处理来实现表达靶向引导RNA的菌株中的特定基因的靶向CRISPR-CDAC至T碱基编辑(如实施例1中所述)。在其中特定物种的染色体上不存在NBU2整合酶位点的情况下,这13个碱基对的DNA序列可以如本领域中描述的经由重组(例如,Cre//oxP)或等位基因交换容易地插入染色体上,以允许染色体CRISPR-CDA整合和靶向基因碱基编辑。

实施例4. 小鼠肠道中的拟杆菌属的CRISPR碱基编辑

小鼠肠道原位的特定拟杆菌属物种的靶向、诱导型CRISPR-CDA C至T碱基编辑,可以通过经由细菌接合通过NBU2整合酶介导的CRISPR-CDA盒整合到其基因组的染色体上来进行,所述CRISPR-CDA盒表达靶向物种特异性前间隔序列的引导RNA。在示例性的情况下,小鼠是由一种或多种拟杆菌属定殖的定菌动物,所述拟杆菌属衍生自哺乳动物肠道微生物群,包括人。aTc诱导剂可以在特定的时间点应用于小鼠肠道,导致肠道微生物群的物种中特定基因的靶向突变或失活。

技术分类

06120114712593