通过靶向DUX4基因来治疗面肩肱型肌营养不良症(FSHD)的方法
文献发布时间:2024-04-18 19:52:40
技术领域
本发明涉及通过靶向人双同源框蛋白4(DUX4)基因等来治疗面肩肱型肌营养不良症(FSHD)的方法。更具体地,本发明涉及通过使用靶向人DUX4基因的特定序列的向导RNA以及转录抑制因子与CRISPR效应蛋白的融合蛋白等抑制人DUX4基因表达来治疗或预防FSHD的方法和药剂。
背景技术
面肩肱型肌营养不良症(FSHD)是最普遍的肌病之一,影响着所有年龄的男性和女性。
FSHD有两种类型。“FSHD1”归因于4号染色体上端粒(4q35)基因组序列(D4Z4)的缩短重复序列(10个重复序列或更少),而“FSHD2”归因于除FSHD1以外的复杂因素。在正常的D4Z4重复序列中,DNA高度甲基化。在FSHD1和FSHD2中,由于相应的基因组异常,染色质结构发生变化,伴随DNA低甲基化,并且最初不在肌肉(祖细胞)细胞中表达的基因(DUX4转录因子)被激活。尽管DUX4蛋白在发育阶段很重要,但它通常不存在于成熟细胞中,并且已知FSHD骨骼肌中的DUX4激活会导致细胞死亡。预防DUX4激活预计治疗FSHD,作为其一部分,已经尝试通过使用基因编辑技术减少DUX4 mRNA的量(非专利文献1)。
另一方面,近年来已经开发了使用具有失活核酸酶活性的Cas9(dCas9)与转录激活结构域或转录阻遏结构域的组合的系统,其中通过使用向导RNA使蛋白质靶向基因而不切割基因的DNA序列来控制靶基因的表达(专利文献1,其以引用的方式整体并入本文)。其临床应用前景广阔(参见非专利文献2,其以引用的方式整体并入本文)。然而,存在编码dCas9、向导RNA和共转录阻遏物的复合物的序列超出最常用的病毒载体(例如,AAV)的容量的问题,所述病毒载体代表了最有前景的体内基因递送方法(参见非专利文献3,其以引用的方式整体并入本文)。
引用列表
专利文献
[专利文献1]WO2013/176772
非专利文献
[非专利文献1]Mol Ther.2016年3月;24(3):527-535
[非专利文献2]Dominguez A.等人,Nat Rev Mol Cell Biol.2016年1月;17(1):5-15
[非专利文献3]Liao H.等人,Cell.2017年12月14日;171(7):1495-507
发明内容
技术问题
因此,本发明的一个目标是提供面肩肱型肌营养不良症(FSHD)的新颖治疗方法。
已经通过本申请发明人的发现,即通过使用靶向人DUX4基因的特定序列的向导RNA和转录阻遏物与核酸酶缺陷型CRISPR效应蛋白的融合蛋白,可以强烈地抑制人DUX4基因(基因ID:100288687)的表达,实现了这个目标和其它目标,所述目标将在下面的详细描述过程中变得显而易见。此外,本申请发明人已经发现,使用紧凑型核酸酶缺陷型CRISPR效应蛋白和紧凑型转录阻遏物时,携带编码融合蛋白的碱基序列和编码向导RNA的碱基序列的单个AAV载体可以强烈地抑制人DUX4基因的表达。
因此,本发明提供了:
[1]一种多核苷酸,其包含以下碱基序列:
(a)编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列,以及
(b)编码向导RNA的碱基序列,所述向导RNA靶向人DUX4基因的表达调控区中SEQID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的连续区域。
[2]根据[1]所述的多核苷酸,其中所述编码向导RNA的碱基序列包含SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的碱基序列,或者其中缺失、替换、插入和/或添加1至3个碱基的SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的碱基序列。
[3]根据[1]或[2]所述的多核苷酸,其包含至少两个不同的所述编码向导RNA的碱基序列。
[4]根据[1]至[3]中任一项所述的多核苷酸,其中所述转录阻遏物选自KRAB、MeCP2、SIN3A、HDT1、MBD2B、NIPP1和HP1A。
[5]根据[4]所述的多核苷酸,其中所述转录阻遏物是KRAB。
[6]根据[1]至[5]中任一项所述的多核苷酸,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
[7]根据[6]所述的多核苷酸,其中所述dCas9来源于金黄色葡萄球菌(Staphylococcus aureus)。
[8]根据[1]至[7]中任一项所述的多核苷酸,其还包含所述编码向导RNA的碱基序列的启动子序列和/或所述编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的启动子序列。
[9]根据[8]所述的多核苷酸,其中所述编码向导RNA的碱基序列的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
[10]根据[9]所述的多核苷酸,其中所述编码向导RNA的碱基序列的启动子序列是U6启动子。
[11]根据[8]至[10]中任一项所述的多核苷酸,其中所述编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的启动子序列是广泛性启动子或神经元特异性启动子。
[12]根据[11]所述的多核苷酸,其中所述广泛性启动子选自EFS启动子、CMV启动子和CAG启动子。
[13]一种载体,其包含根据[1]至[12]中任一项所述的多核苷酸。
[14]根据[13]所述的载体,其中所述载体是质粒载体或病毒载体。
[15]根据[14]所述的载体,其中所述病毒载体选自腺相关病毒(AAV)载体、腺病毒载体和慢病毒载体。
[16]根据[15]所述的载体,其中所述AAV载体选自AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、Anc80、AAV
[17]根据[16]所述的载体,其中所述AAV载体是AAV9。
[18]一种药物组合物,其包含根据[1]至[12]中任一项所述的多核苷酸或根据[13]至[17]中任一项所述的载体。
[19]根据[18]所述的药物组合物,其用于治疗或预防FSHD。
[20]一种治疗或预防FSHD的方法,其包括向有需要的受试者施用根据[1]至[12]中任一项所述的多核苷酸或根据[13]至[17]中任一项所述的载体。
对本发明的更完整了解和许多伴随优点将容易获得,因为通过参考下面的详细描述结合附图考虑时,它们将变得更好理解。
有益效果
根据本发明,可以抑制人DUX4基因的表达,因此,本发明预计能够治疗FSHD。
附图说明
[图1]图1示出了所靶向的基因组区域相对于人DUX4基因的位置。
[图2]图2示出了通过使用含有由SEQ ID NO:1至76所示的靶向序列编码的crRNA的sgRNA对来源于FSHD患者的两个成淋巴细胞细胞系(LCL;GM16343 LCL和GM16414 LCL)中人DUX4基因的表达抑制作用的评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
[图3A]图3A示出了通过使用含有由所选择的27个靶向序列编码的crRNA的sgRNA对GM16343 LCL中人DUX4基因的表达抑制作用的评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
[图3B]图3B示出了通过使用含有由所选择的27个靶向序列编码的crRNA的sgRNA对GM16414 LCL中人DUX4基因的表达抑制作用的评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
[图4]图4示出了来自使用FSHD患者来源的LCL的验证实验中所鉴定的6个最佳sgRNA的DUX4和FSHD生物标志物TRIM43、MBD3L2和ZSCAN4的定量评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
[图5]图5示出了所靶向的基因组区域相对于人DUX4基因的位置。
[图6]图6示出了通过使用含有由SEQ ID NO:104至188所示的靶向序列编码的crRNA的sgRNA对来源于FSHD患者的一个成淋巴细胞细胞系(LCL;GM16343 LCL)中人DUX4基因的表达抑制作用的评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
[图7]图7示出了来自使用FSHD患者来源的LCL的验证实验(N=2)中所鉴定的6个最佳sgRNA的DUX4和FSHD生物标志物TRIM43、MBD3L2和ZSCAN4的定量评估结果。水平轴示出了含有由各个靶向序列编码的crRNA的sgRNA,垂直轴示出了使用各个sgRNA时的DUX4基因表达水平与使用对照sgRNA时的DUX4基因表达水平(作为1)的比率。
具体实施方式
下面详细说明本发明的实施方案。
1.多核苷酸
本发明提供了一种包含以下碱基序列的多核苷酸(下文有时也称为“本发明的多核苷酸”):
(a)编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列,以及
(b)编码向导RNA的碱基序列,所述向导RNA靶向人DUX4基因的表达调控区中SEQID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的连续区域。
将本发明的多核苷酸引入到所期望的细胞中并转录以产生核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白,以及靶向人DUX4基因的表达调控区的特定区域的向导RNA。这些融合蛋白和向导RNA形成了复合物(在下文,所述复合物有时称为“核糖核蛋白;RNP”)并协同作用于上述特定区域,从而抑制人DUX4基因的转录。在本发明的一个实施方案中,人DUX4基因的表达可以被抑制例如不低于约40%、不低于约50%、不低于约60%、不低于约70%、不低于约75%、不低于约80%、不低于约85%、不低于约90%、不低于约95%或约100%。
(1)定义
在本说明书中,“人双同源框蛋白4(DUX4)基因的表达调控区”意指其中可以通过RNP与该区域结合来抑制人DUX4基因表达的任何区域。即,人DUX4基因的表达调控区可以存在于人DUX4基因的任何区域如启动子区域、增强子区域、内含子和外显子中,只要RNP的结合抑制人DUX4基因的表达即可。在本说明书中,当表达调控区由特定序列表示时,表达调控区在概念上包括有义链序列和反义链序列。
在本发明中,通过向导RNA将核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白募集到人DUX4基因的表达调控区的特定区域中。在本说明书中,“靶向……的向导RNA”意指“将融合蛋白募集到……中的向导RNA”。
在本说明书中,“向导RNA(也称为‘gRNA’)”是一种包含基因组特异性CRISPR-RNA(称为‘crRNA’)的RNA。crRNA是一种与靶向序列(稍后描述)的互补序列结合的RNA。当Cpf1用作CRISPR效应蛋白时,“向导RNA”是指包含由crRNA和附接至其5’末端的特定序列(例如,在FnCpf1的情况下,SEQ ID NO:80所示的RNA序列)组成的RNA的RNA。当Cas9用作CRISPR效应蛋白时,“向导RNA”是指包含crRNA和附接至其3’末端的反式激活crRNA(称为“tracrRNA”)的嵌合体RNA(称为“单向导RNA(sgRNA)”)(参见例如Zhang F.等人,Hum MolGenet.2014年9月15日;23(R1):R40-6和Zetsche B.等人,Cell.2015年10月22日;163(3):759-71,所述文献以全文引用的方式整体并入本文)。
在本说明书中,与crRNA在人DUX4基因的表达调控区中所结合的序列互补的序列称为“靶向序列”。即,在本说明书中,“靶向序列”是存在于人DUX4基因的表达调控区中并与PAM(原间隔子相邻基序)相邻的DNA序列。当Cpf1用作CRISPR效应蛋白时,PAM与靶向序列的5’侧相邻。当Cas9用作CRISPR效应蛋白时,PAM与靶向序列的3’侧相邻。靶向序列可以存在于人DUX4基因的表达调控区的有义链序列侧或反义链序列侧(参见例如上述Zhang F.等人,Hum Mol Genet.2014年9月15日;23(R1):R40-6和Zetsche B.等人,Cell.2015年10月22日;163(3):759-71,所述文献以引用的方式整体并入本文)。
(2)核酸酶缺陷型CRISPR效应蛋白
在本发明中,使用核酸酶缺陷型CRISPR效应蛋白,将与其融合的转录阻遏物募集到人DUX4基因的表达调控区。本发明所用的核酸酶缺陷型CRISPR效应蛋白(下文简称为“CRISPR效应蛋白”)不受特别限制,只要它与gRNA形成复合物并且被募集到人DUX4基因的表达调控区即可。例如,可以包括核酸酶缺陷型Cas9(下文有时也称为“dCas9”)或核酸酶缺陷型Cpf1(下文有时也称为“dCpf1”)。
上述dCas9的实例包括但不限于酿脓链球菌(Streptococcus pyogenes)来源的Cas9(SpCas9;PAM序列:NGG(N为A、G、T或C。在下文中相同))、嗜热链球菌(Streptococcusthermophilus)来源的Cas9(StCas9;PAM序列:NNAGAAW(W为A或T。在下文中相同))、脑膜炎奈瑟氏球菌(Neisseria meningitidis)来源的Cas9(NmCas9;PAM序列:NNNNGATT)或金黄色葡萄球菌来源的Cas9(SaCas9;PAM序列:NNGRRT(R为A或G。在下文中相同))等的核酸酶缺陷型变体(参见例如Nishimasu等人,Cell.2014年2月27日;156(5):935-49,Esvelt KM等人,Nat Methods.2013年11月;10(11):1116-21,Zhang Y.Mol Cell.2015年10月15日;60(2):242-55,以及Friedland AE等人,Genome Biol.2015年11月24日;16:257,所述文献以引用的方式整体并入本文)。例如,在SpCas9的情况下,可以使用其中第10位Asp残基转变为Ala残基且第840位His残基转变为Ala残基的双突变体(有时称为“dSpCas9”)(参见例如上述Nishimasu等人,Cell.2014)。或者,在SaCas9的情况下,可以使用其中第10位Asp残基转变为Ala残基且第580位Asn残基转变为Ala残基的双突变体(SEQ ID NO:81)或其中第10位Asp残基转变为Ala残基且第557位His残基转变为Ala残基的双突变体(SEQ ID NO:82)(在下文中,这些双突变体中的任一个有时称为“dSaCas9”)(参见例如上述Friedland AE等人,Genome Biol.2015,所述文献以引用的方式整体并入本文)。
此外,在本发明的一个实施方案中,作为dCas9,还可以使用通过修饰上述dCas9的氨基酸序列的一部分而获得的变体,所述变体与gRNA形成复合物并且被募集到人DUX4基因的表达调控区。此类变体的实例包括具有部分缺失氨基酸序列的截短变体。在本发明的一个实施方案中,作为dCas9,可以使用WO2019/235627和WO2020/085441所公开的变体,所述文献以引用的方式整体并入本文。具体地,可以使用通过从作为其中第10位Asp残基转变为Ala残基且第580位Asn残基转变为Ala残基的双突变体的dSaCas9中缺失第721个至第745个氨基酸而获得的dSaCas9(SEQ ID NO:83),或其中所述缺失部分被肽接头替换的dSaCas9(例如其中所述缺失部分被GGSGGS接头(SEQ ID NO:84)替换的dSaCas9如SEQ ID NO:85所示,其中所述缺失部分被SGGGS接头(SEQ ID NO:86)替换的dSaCas9如SEQ ID NO:87所示,等等)(在下文中,这些双突变体中的任一个有时称为“dSaCas9[-25]”),或者通过从作为上述双突变体的dSaCas9中缺失第482个至第648个氨基酸而获得的dSaCas9(SEQ ID NO:88),或其中所述缺失部分被肽接头替换的dSaCas9(其中所述缺失部分被GGSGGS接头替换的dSaCas9如SEQ ID NO:89所示)。
上述dCpf1的实例包括但不限于新凶手弗朗西丝菌(Francisella novicida)来源的Cpf1(FnCpf1;PAM序列:NTT)、氨基酸球菌属(Acidaminococcus sp.)来源的Cpf1(AsCpf1;PAM序列:NTTT)或毛螺旋菌科(Lachnospiraceae)细菌来源的Cpf1(LbCpf1;PAM序列:NTTT)等的核酸酶缺陷型变体(参见例如Zetsche B.等人,Cell.2015年10月22日;163(3):759-71,Yamano T等人,Cell.2016年5月5日;165(4):949-62,以及Yamano T等人,MolCell.2017年8月17日;67(4):633-45,所述文献以引用的方式整体并入本文)。例如,在FnCpf1的情况下,可以使用其中第917位Asp残基转变为Ala残基且第1006位Glu残基转变为Ala残基的双突变体(参见例如上述Zetsche B等人,Cell.2015,所述文献以引用的方式整体并入本文)。在本发明的一个实施方案中,作为dCpf1,还可以使用通过修饰上述dCpf1的氨基酸序列的一部分而获得的变体,所述变体与gRNA形成复合物并且被募集到人DUX4基因的表达调控区。
在本发明的一个实施方案中,dCas9用作核酸酶缺陷型CRISPR效应蛋白。在一个实施方案中,dCas9是dSaCas9,在一个具体实施方案中,dSaCas9是dSaCas9[-25]。
包含编码CRISPR效应蛋白的碱基序列的多核苷酸可以例如以下方法进行克隆:基于其cDNA序列信息合成覆盖编码所述蛋白的所期望部分的区域的oligoDNA引物,并使用从产生所述蛋白的细胞制备的总RNA或mRNA级分作为模板,通过PCR方法扩增所述多核苷酸。此外,包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以通过在对针对DNA切割活性非常重要的位点上利用已知的定点诱变方法将突变引入到编码所克隆的CRISPR效应蛋白的核苷酸序列中从而将氨基酸残基(例如,在SaCas9的情况下可以包括第10位Asp残基、第557位His残基和第580位Asn残基;在FnCpf1的情况下可以包括第917位Asp残基和第1006位Glu残基等等,但不限于这些)转变为其它氨基酸来获得。
或者,包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以基于其cDNA序列信息通过化学合成或化学合成与PCR方法或吉布森组装方法的组合来获得,也可以进一步构建为经过密码子优化以得到适合在人体内表达的密码子的碱基序列。
(3)转录阻遏物
在本发明中,人DUX4基因表达在与核酸酶缺陷型CRISPR效应蛋白融合的转录阻遏物的作用下受到阻遏。在本说明书中,“转录阻遏物”意指能够阻遏人DUX4基因的基因转录的蛋白质或保留其功能的肽片段。本发明所用的转录阻遏物不受特别限制,只要它可以阻遏人DUX4基因的表达即可。它包括例如克鲁佩尔相关框(KRAB)、MBD2B、v-ErbA、SID(包括SID链态(SID4X))、MBD2、MBD3、DNMT家族(例如DNMT1、DNMT3A、DNMT3B)、Rb、MeCP2、ROM2、LSD1、AtHD2A、SET1、HDAC11、SETD8、EZH2、SUV39H1、PHF19、SALI、NUE、SUVR4、KYP、DIM5、HDAC8、SIRT3、SIRT6、MESOLO4、SET8、HST2、COBB、SET-TAF1B、NCOR、SIN3A、HDT1、NIPP1、HP1A、ERF阻遏结构域(ERD)及其具有转录阻遏能力的变体、其融合物等等。在本发明的一个实施方案中,KRAB用作转录阻遏物。
包含编码转录阻遏物的碱基序列的多核苷酸可以通过化学合成或化学合成与PCR方法或吉布森组装方法的组合来构建。此外,包含编码转录阻遏物的碱基序列的多核苷酸还可以构建为密码子优化的DNA序列,以成为适合在人体内表达的密码子。
包含编码转录阻遏物与核酸酶缺陷型CRISPR效应蛋白的融合蛋白的碱基序列的多核苷酸可以通过直接或在添加编码接头、NLS(核定位信号)的碱基序列(例如SEQ ID NO:90或SEQ ID NO:91所示的碱基序列)、标签和/或其它后将编码CRISPR效应蛋白的碱基序列连接至编码转录阻遏物的碱基序列来制备。在本发明中,转录阻遏物可以与核酸酶缺陷型CRISPR效应蛋白的N末端或C末端融合。作为接头,可以使用氨基酸数为约2至50的接头,其具体实例包括但不限于其中甘氨酸(G)和丝氨酸(S)交替连接的G-S-G-S接头等。在本发明的一个实施方案中,作为包含编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的多核苷酸,可以使用SEQ ID NO:92所示的碱基序列,所述碱基序列将SV40NLS、dSaCas9(例如D10A和N580A突变体)、NLS和KRAB编码为融合蛋白。如果需要,则可以含有其它碱基序列(参见下面的“(6)其它碱基序列”)和选择标志物(例如Puro)。
(4)向导RNA
在本发明中,核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白可以通过向导RNA募集到人DUX4基因的表达调控区。如上述“(1)定义”所述,向导RNA包含crRNA,crRNA与靶向序列的互补序列结合。crRNA可以与靶向序列的互补序列不完全互补,只要向导RNA可以将融合蛋白募集到靶区域即可,并且可以包含其中缺失、替换、插入和/或添加至少1至3个碱基的靶向序列的碱基序列。
例如,当dCas9用作核酸酶缺陷型CRISPR效应蛋白时,靶向序列可以使用公开gRNA设计网站(CRISPR Design Tool、CRISPR direct等)来确定。具体地,从靶基因(即,人DUX4基因)序列中,列出了PAM(例如在SaCas9的情况下为NNGRRT)与其3’侧相邻的长度为约20个核苷酸的候选靶向序列,在这些候选靶向序列中,在人类基因组中具有少量脱靶位点的候选靶向序列可以用作靶向序列。靶向序列的碱基长度为18至24个核苷酸长度,优选为20至23个核苷酸长度,更优选为21至23个核苷酸长度。作为预测脱靶位点数的初步筛检,许多生物信息学工具是已知和公开可用的,并且可以用于预测具有最低脱靶效应的靶向序列。其实例包括生物信息学工具,如Benchling(https://benchling.com)和COSMID(具有错配、插入和缺失的CRISPR脱靶位点)(可在互联网上的https://crispr.bme.gatech.edu上获得)。使用这些,可以总结出与gRNA所靶向的碱基序列的相似性。当所用的gRNA设计软件不具备检索靶基因组的脱靶位点的功能时,例如,可以通过对于候选靶向序列3’侧上的8至12个核苷酸(对所靶向的核苷酸序列具有高辨别能力的种子序列)对靶基因组进行Blast检索来检索脱靶位点。
在本发明的一个实施方案中,在人4号染色体(Chr 4)的GRCh38/hg38中存在的区域中,“190,065,500-190,068,500”区域和“190,047,000-190,052,000”区域可能是人DUX4基因的表达调控区。因此,在本发明的一个实施方案中,在人4号染色体(Chr 4)的GRCh38/hg38中存在的“190,065,500-190,068,500”和“190,047,000-190,052,000”区域中,靶向序列可以是18至24个核苷酸的长度,优选20至23个核苷酸的长度,更优选21至23个核苷酸的长度。
在本发明的一个实施方案中,在人4号染色体(Chr 4)的GRCh38/hg38中存在的“190,065,000-190,093,000”(D4Z4重复区域)和“190,173,000-190,176,000”(DUX4基因)区域中,靶向序列可以是18至24个核苷酸的长度,优选20至23个核苷酸的长度,更优选21至23个核苷酸的长度。
在本发明的一个实施方案中,编码crRNA的碱基序列可以与靶向序列的碱基序列相同。例如,当SEQ ID NO:4(CCCTCCACCGGGCTGACCGGCC)所示的靶向序列作为编码crRNA的碱基序列引入到细胞中时,从所述序列转录的crRNA是CCCUCCACCGGGCUGACCGGCC(SEQ IDNO:93)并与GGCCGGTCAGCCCGGTGGAGGG(SEQ ID NO:94)结合,后者是与SEQ ID NO:4所示的碱基序列互补的序列并存在于人DUX4基因的表达调控区中。在另一个实施方案中,作为其中缺失、替换、插入和/或添加至少1至3个碱基的靶向序列的碱基序列可以用作编码crRNA的碱基序列,只要向导RNA可以将融合蛋白募集到靶区域即可。因此,在本发明的一个实施方案中,作为编码crRNA的碱基序列,可以使用SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的碱基序列,或其中缺失、替换、插入和/或添加1至3个碱基的SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的碱基序列。
在本发明的一个优选实施方案中,作为编码crRNA的碱基序列,可以使用SEQ IDNO:2、3、4、20、51、68、138、142、146、156、158或161所示的碱基序列,或其中缺失、替换、插入和/或添加1至3个碱基的SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的碱基序列。
当dCpf1用作核酸酶缺陷型CRISPR效应蛋白时,编码gRNA的碱基序列可以设计为编码5’末端附接有特定RNA的crRNA的DNA序列。此类附接至crRNA 5’末端的RNA和编码所述RNA的DNA序列可以由本领域普通技术人员根据所用的dCpf1适当地进行选择。例如,当使用dFnCpf1时,其中SEQ ID NO:95AATTTCTACTGTTGTAGAT附接至靶向序列5’侧的碱基序列可以用作编码gRNA的碱基序列(当转录至RNA时,加下划线部分的序列形成碱基对以形成茎-环结构)。添加至5’末端的序列可以是其中缺失、替换、插入和/或添加至少1至6个碱基的通常用于各种Cpf1蛋白的序列,只要转录后gRNA可以将融合蛋白募集到表达调控区即可。
当dCas9用作CRISPR效应蛋白时,编码gRNA的碱基序列可以设计为其中编码已知tracrRNA的DNA序列连接至编码crRNA的DNA序列的3’末端的DNA序列。此类tracrRNA和编码所述tracrRNA的DNA序列可以由本领域普通技术人员根据所用的dCas9适当地选择。例如,当使用dSaCas9时,SEQ ID NO:96所示的碱基序列用作编码tracrRNA的DNA序列。编码tracrRNA的DNA序列可以是其中缺失、替换、插入和/或添加至少1至6个碱基的通常用于各种Cas9蛋白的编码tracrRNA的碱基序列,只要转录后gRNA可以将融合蛋白募集到表达调控区即可。
包含如此设计的编码gRNA的碱基序列的多核苷酸可以使用已知的DNA合成方法化学合成。
在本发明的另一个实施方案中,本发明的多核苷酸可以包含至少两个不同的编码gRNA的碱基序列。例如,多核苷酸可以包含至少两个不同的编码向导RNA的碱基序列,其中所述至少两个不同的碱基序列选自包含SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的的碱基序列,优选地选自包含SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列。
(5)启动子序列
在本发明的一个实施方案中,启动子序列可以可操作地连接至编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列和/或编码gRNA的碱基序列中每一个的上游。可能连接的启动子不受特别限制,只要它在靶细胞中显示出启动子活性即可。可能连接至编码gRNA的碱基序列上游的启动子序列的实例包括但不限于U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子、H1启动子和tRNA启动子,它们是polIII启动子,等等。在本发明的一个实施方案中,U6启动子可以用作编码向导RNA的碱基序列的启动子序列。在本发明的一个实施方案中,当多核苷酸包含两个或更多个分别编码向导RNA的碱基序列时,单个启动子序列可以可操作地连接至所述两个或更多个碱基序列的上游。在另一个实施方案中,当多核苷酸包含两个或更多个分别编码向导RNA的碱基序列时,启动子序列可以可操作地连接至所述两个或更多个碱基序列中每一个的上游,其中可操作地连接至每一个碱基序列的启动子序列可以相同或不同。
由于上述启动子序列可能连接至编码融合蛋白的碱基序列的上游,因此可以使用广泛性启动子或神经元特异性启动子。广泛性启动子的实例包括但不限于EF-1α启动子、EFS启动子、CMV(巨细胞病毒)启动子、hTERT启动子、SRα启动子、SV40启动子、LTR启动子、CAG启动子、RSV(劳氏肉瘤病毒)启动子等等。在本发明的一个实施方案中,EFS启动子、CMV启动子或CAG启动子可以用作广泛性启动子。神经元特异性启动子的实例包括但不限于神经元特异性烯醇酶(NSE)启动子、人神经丝轻链(NEFL)启动子。上述启动子可以具有任何修饰和/或改变,只要它在靶细胞中具有启动子活性即可。
在本发明的一个实施方案中,U6用作编码所述向导RNA的碱基序列的启动子,而CMV启动子可以用作编码所述融合蛋白的碱基序列的启动子序列。
(6)其它碱基序列
此外,为了改善通过编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的转录产生的mRNA的翻译效率,除上述那些之外,本发明的多核苷酸还可以包含诸多已知序列,如聚腺苷酸化(polyA)信号、Kozak一致序列等。例如,本发明中的聚腺苷酸化信号可以包括hGH polyA、bGH polyA、2x sNRP-1polyA(参见US7557197B2,其以引用的方式整体并入本文)等等。此外,本发明的多核苷酸可以包含编码接头序列的碱基序列、编码NLS的碱基序列和/或编码标签的碱基序列。此外,本发明的多核苷酸可以包含插入序列。插入序列的优选实例是编码IRES(内部核糖体进入位点)2A肽的序列。2A肽是来源于病毒的约20个氨基酸残基的肽序列,被细胞中存在的蛋白酶(2A肽酶)识别,并在C末端第1个残基的位置被切割。通过2A肽连接为一个单元的多个基因被转录和翻译为一个单元,然后被2A肽酶切割。2A肽酶的实例包括F2A(来源于口蹄疫病毒)、E2A(来源于马鼻炎A病毒)、T2A(来源于明脉扁刺蛾(Thosea asigna)病毒)和P2A(来源于猪捷申病毒-1)。
(7)本发明的示例实施方案
在本发明的一个实施方案中,提供了包含以下的多核苷酸:
编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列,
编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的启动子序列,
一个或两个分别编码向导RNA的碱基序列,其中所述一个或两个碱基序列选自包含SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列,优选地选自包含SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列;或包含其中缺失、替换、插入和/或添加了1至3个碱基的SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列,优选地选自包含其中缺失、替换、插入和/或添加了1至3个碱基的SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列,以及
编码gRNA的碱基序列的启动子序列,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9或dSaCas9[-25],
其中所述转录阻遏物选自KRAB、MeCP2、SIN3A、HDT1、MBD2B、NIPP1和HP1A,
其中所述编码融合蛋白的碱基序列的启动子序列选自EFS启动子、CMV启动子和CAG启动子,
其中所述编码gRNA的碱基序列的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
在本发明的一个实施方案中,提供了包含以下的多核苷酸:
编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列,
编码核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白的碱基序列的CMV启动子,
一个或两个分别编码向导RNA的碱基序列,其中所述一个或两个碱基序列选自包含SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列,优选地选自包含SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列;或包含其中缺失、替换、插入和/或添加了1至3个碱基的SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列,优选地选自包含其中缺失、替换、插入和/或添加了1至3个碱基的SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列,以及
编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9,
其中所述转录阻遏物是KRAB。
2.载体
本发明提供了一种包含本发明的多核苷酸的载体(下文有时称为“本发明的载体”)。本发明的载体可以是质粒载体或病毒载体。
当本发明的载体是质粒载体时,所用的质粒载体不受特别限制,并且可以是任何质粒载体,如克隆质粒载体和表达质粒载体。所述质粒载体是通过利用已知的方法将本发明的多核苷酸插入质粒载体中而制备。
当本发明的载体是病毒载体时,所用的病毒载体不受特别限制,其实例包括但不限于腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、逆转录病毒载体、仙台病毒载体等。在本说明书中,“病毒载体”还包括其衍生物。考虑到在基因疗法中使用,优选使用AAV载体,因为它可以长时间表达转基因,并且它来源于非致病性病毒并具有高安全性。
包含本发明的多核苷酸的病毒载体可以通过已知的方法制备。简而言之,制备其中插入了本发明多核苷酸的病毒表达用质粒载体,将所述载体转染到适当的宿主细胞中以允许短暂产生包含本发明多核苷酸的病毒载体,并收集病毒载体。
在本发明的一个实施方案中,当使用AAV载体时,AAV载体的血清型不受特别限制,只要可以激活靶标中人DUX4基因的表达即可,并且可以使用AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh.10等中的任一个(关于AAV的各种血清型,参见例如WO 2005/033321和EP2341068(A1),所述文献以引用的方式整体并入本文)。AAV变体的实例包括但不限于具有经修饰衣壳的新血清型(例如WO 2012/057363,所述文献以引用的方式整体并入本文)等。例如,在本发明的一个实施方案中,可以使用具有改善肌细胞感染性的经修饰衣壳的新血清型,如AAV
当制备AAV载体时,可以使用已知的方法,如(1)使用质粒的方法,(2)使用杆状病毒的方法,(3)使用单纯疱疹病毒的方法,(4)使用腺病毒的方法,或(5)使用酵母的方法(例如Appl Microbiol Biotechnol.2018;102(3):1045-1054等,所述文献以引用的方式整体并入本文)。例如,当通过使用质粒的方法制备AAV载体时,首先制备了包含在野生型AAV基因组序列两端的反向末端重复序列(ITR)和代替编码Rep蛋白和衣壳蛋白的DNA插入的本发明多核苷酸的载体质粒。另一方面,将形成病毒粒子所必需的编码Rep蛋白和衣壳蛋白的DNA插入其它质粒中。此外,将包含负责AAV增殖所必需的腺病毒辅助作用的基因(E1A、E1B、E2A、VA和E4orf6)的质粒制备为腺病毒辅助质粒。这三种质粒共转染至宿主细胞中在所述细胞中产生了重组AAV(即,AAV载体)。作为宿主细胞,优选使用能够提供负责上述辅助作用的基因的部分基因产物(蛋白质)的细胞(例如293细胞等)。当使用此类细胞时,上述腺病毒辅助质粒中不必携带编码可由宿主细胞提供的蛋白质的基因。所产生的AAV载体存在于细胞核中。因此,所期望的AAV载体是通过利用冻融破坏宿主细胞,收集病毒然后利用使用氯化铯的密度梯度超速离心法、柱法等对病毒级分进行分离和纯化来制备。
AAV载体在安全性、基因转导效率等方面具有很大优势,并用于基因疗法。然而,已知可以包装在AAV载体中的多核苷酸的大小受限制。例如,在本发明的一个实施方案中,包括包含编码dSaCas9与miniVR或microVR的融合蛋白的碱基序列、编码靶向人DUX4基因的表达调控区的gRNA的碱基序列以及作为启动子序列的EFS启动子序列或CK8启动子序列和U6启动子序列以及ITR部分的多核苷酸的碱基长度的整个长度是约4.85kb,并且它们可以包装在单个AAV载体中。
3.药物组合物
本发明还提供了包含本发明的多核苷酸或本发明的载体的药物组合物(下文有时称为“本发明的药物组合物”)。本发明的药物组合物可用于治疗或预防FSHD。
本发明的药物组合物包含本发明的多核苷酸或本发明的载体作为活性成分,并且可以制备为包含此类活性成分(即,本发明的多核苷酸或本发明的载体)和通常药学上可接受的载剂的制剂。
本发明的药物组合物经肠胃外施用,并且可以局部或全身施用。本发明的药物组合物可以通过例如但不限于静脉内施用、动脉内施用、皮下施用、腹膜内施用或肌肉内施用来施用。
本发明的药物组合物对受试者的剂量不受特别限制,只要它是治疗和/或预防有效量即可。可以根据活性成分、剂型、受试者的年龄和体重、施用日程表、施用方法等适当地优化。
在本发明的一个实施方案中,本发明的药物组合物不仅可以施用于受FSHD影响的受试者,而且还可以基于遗传背景分析等预防性地施用于未来可能罹患FSHD的受试者。本说明书中的术语“治疗”包括缓解疾病以及治愈疾病。此外,术语“预防”还可以包括延迟疾病发作以及预防疾病发作。本发明的药物组合物还可以称为“本发明的药剂”等。
4.治疗或预防FSHD的方法
本发明还提供一种治疗或预防FSHD的方法,其包括向有需要的受试者施用本发明的多核苷酸或本发明的载体(下文有时称为“本发明的方法”)。此外,本发明包括本发明的多核苷酸或本发明的载体,用于治疗或预防FSHD。此外,本发明包括本发明的多核苷酸或本发明的载体用于制造用以治疗或预防FSHD的药物组合物的用途。
本发明的方法可以通过将上述本发明的药物组合物施用于受FSHD影响的受试者来实施,并且剂量、施用途径、受试者等与上述那些相同。
症状的测量可以在开始使用本发明的方法治疗前和治疗后的任何时间进行,以确定受试者对治疗的反应。
5.核糖核蛋白
本发明提供了包含以下的核糖核蛋白(下文有时称为“本发明的RNP”):
(c)核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白,以及
(d)靶向人DUX4基因的表达调控区中SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的连续区域的向导RNA,优选地选自包含SEQ ID NO:2、3、4、20、51、68、138、142、146、156、158或161所示的序列的碱基序列。
作为本发明的RNP中所包含的核酸酶缺陷型CRISPR效应蛋白、转录阻遏物和向导RNA,可以使用上述“1.多核苷酸”部分详细说明的核酸酶缺陷型CRISPR效应蛋白、转录阻遏物和向导RNA。本发明的RNP所包含的核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白可以通过例如将编码所述融合蛋白的多核苷酸引入到细胞、细菌或其它生物体中以允许其表达或通过使用所述多核苷酸的体外翻译系统来产生。此外,本发明的RNP所包含的向导RNA可以通过例如化学合成或使用编码所述向导RNA的多核苷酸的体外转录系统来产生。将如此制备的融合蛋白和向导RNA混合以制备本发明的RNP。必要时,可以混合其它物质,如金粒子。为了将本发明的RNP直接递送到靶细胞、组织等,可以通过已知的方法将RNP包封在脂质纳米粒子(LNP)中。本发明的RNP可以通过已知的方法引入到靶细胞、组织等中。关于包封在LNP中和引入方法,可以参考例如Lee K.等人,Nat Biomed Eng.2017;1:889-901,WO2016/153012等,所述文献以引用的方式整体并入本文。
在本发明的一个实施方案中,本发明的RNP所包含的向导RNA靶向人4号染色体(Chr 4)的GRCh38/hg38中存在的“190,065,500-190,068,500”和“190,047,000-190,052,000”区域中连续18至24个核苷酸的长度,优选20至23个核苷酸的长度,更优选21至23个核苷酸的长度。
在本发明的一个实施方案中,本发明的RNP所包含的向导RNA靶向人4号染色体(Chr 4)的GRCh38/hg38中存在的“190,065,000-190,093,000”和“190,173,000-190,176,000”区域中连续18至24个核苷酸的长度,优选20至23个核苷酸的长度,更优选21至23个核苷酸的长度。
6.其它
本发明还提供了一种用于抑制人DUX4基因表达的组合物或药盒,其包含以下:
(e)核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白,或编码所述融合蛋白的多核苷酸,以及
(f)向导RNA或编码所述向导RNA的多核苷酸,所述向导RNA靶向人DUX4基因的表达调控区中SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的连续区域,优选地选自包含SEQ ID NO:2、3、4、20、51、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列。
本发明还提供了一种治疗或预防FSHD的方法,其包括施用以下(e)和(f):
(e)核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白,或编码所述融合蛋白的多核苷酸,以及
(f)向导RNA或编码所述向导RNA的多核苷酸,所述向导RNA靶向人DUX4的表达调控区中SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的连续区域,优选地选自包含SEQ ID NO:2、3、4、20、51、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列。
本发明还提供了以下(e)和(f)用于制造用以治疗或预防FSHD的药物组合物的用途:
(e)核酸酶缺陷型CRISPR效应蛋白与转录阻遏物的融合蛋白,或编码所述融合蛋白的多核苷酸,以及
(f)向导RNA或编码所述向导RNA的多核苷酸,所述向导RNA靶向人DUX4基因的表达调控区中SEQ ID NO:2、3、4、8、15、17、18、20、25、31、32、33、35、39、40、42、44、50、51、52、55、57、58、59、65、67、68、113、116、135、138、142、144、146、156、158、161或171所示的连续区域,优选地选自包含SEQ ID NO:2、3、4、20、51、68、113、116、135、138、142、144、146、156、158、161或171所示的序列的碱基序列。
作为本发明的核酸酶缺陷型CRISPR效应蛋白、转录阻遏物、向导RNA以及编码它们的多核苷酸和其中携带它们的载体,可以使用上述“1.多核苷酸”、“2.载体”和“5.核糖核蛋白”部分详细说明的那些。上述(e)和(f)的剂量、施用途径、受试者、配方等与“3.药物组合物”部分所述的那些相同。
本发明的其它特征将在以下示例性实施方案的描述过程中变得显而易见,所述示例性实施方案是为了说明本发明而提供,而不意在对其具有限制性。
实施例
实施例描述了使用dCas9与转录阻遏物的融合蛋白抑制所定义的人DUX4基因的表达调控区中的基因表达,由此选择性地抑制人DUX4基因的表达。实施例还描述了赋予人DUX4基因选择性抑制而没有最低限度地影响其它基因表达的特定基因组区域的定义。本发明的抑制人DUX4基因表达的方法代表了如本文所描述和说明的FSHD的新颖治疗或预防策略。
(1)实验方法
DUX4靶向序列的选择-1
基于人骨骼肌细胞基因组的H3K4me3、H3K27Ac模式,扫描了人DUX4基因的推定启动子区域周围约8kb的序列,以得到可以用与本文定义为靶向序列的gRNA复合的无催化活性SaCas9(D10A和N580A突变体;dSaCas9)靶向的序列。所靶向的基因组区域相对于DUX4基因的位置描绘于图1中,下面指出了其坐标:
1.Chr4:GRCh38/hg38;190,065,500-190,068,500->~3kb(启动子A)
2.Chr4:GRCh38/hg38;190,047,000-190,052,000->~5kb(启动子B)
靶向序列规定为与具有序列NNGRRT的原间隔子相邻基序(PAM)相邻的21个核苷酸片段(5’-21nt靶向序列-NNGRRT-3’)(表1-1至表1-3)。
[表1-1]
[表1—2]
[表1-3]
DUX4靶向序列的选择-2
在之前的选择(DUX4靶向序列的选择-1)中,我们基于人骨骼肌细胞基因组的H3K4me3、H3K27Ac模式,在人DUX4基因的推定启动子区域周围大约8kb的序列中测试了靶向序列。现在我们将研究重点扩展到包括整个D4Z4重复区和DUX4编码基因的更大区域。扫描所述区域,以得到可以通过与本文定义为靶向序列的gRNA复合的无催化活性SaCas9(D10A和N580A突变体;dSaCas9)靶向的序列。所靶向的基因组区域相对于DUX4基因的位置描绘于图5中,下面指出了其坐标:
1.Chr4:GRCh38/hg38;190,065,000-190,093,000→~28kb(D4Z4重复区)
2.Chr4:GRCh38/hg38;chr4:190,173,000-190,176,000→~3kb(DUX4基因)
靶向序列规定为与具有序列NNGRRT的原间隔子相邻基序(PAM)相邻的21个核苷酸片段(5’-21nt靶向序列-NNGRRT-3’)(表2-1至表2-4)。
[表2-1]
[表2-2]
[表2—3]
[表2-4]
慢病毒转移质粒(pED316)的构建
pLentiCRISPR v2购自Genscript(https://www.genscript.com),并进行了以下修饰:将SpCas9 gRNA支架序列替换为SaCas9 gRNA支架序列;将SpCas9-FLAG替换为与克鲁佩尔相关框(KRAB)结构域融合的dSaCas9(D10A和N580A突变体)。KRAB转录抑制结构域在定位于启动子时可以通过募集抑制元件来抑制基因表达。KRAB拴系到dSaCas9的末端,下文称为dSaCas9-KRAB,并根据靶向序列的指导靶向人DUX4基因调控区(表1和表2)。所产生的骨架质粒命名为pED316。
gRNA克隆
将三种阴性对照非靶向序列、三种阳性对照靶向序列、76种靶向序列(表1)和85种靶向序列(表2)克隆到pED316中。正向寡核苷酸和反向寡核苷酸通过Integrated DNATechnologies按以下形式合成:正向:5’CACC(G)-21碱基对靶向序列-3’,反向:5’AAAC-19—21碱基对反向互补靶向序列-(C)-3’,其中如果靶标不是以G开始,则添加括号中的碱基。使寡核苷酸以100μM重悬在Tris—EDTA缓冲液(pH 8.0)中。将1μl各互补寡核苷酸合并在NE Buffer 3.1(New England Biolabs)中的10μl反应物中。将反应物加热至95℃,并在热循环仪中冷却至25℃,由此退火有与克隆到pED316相容的粘性末端悬垂物的寡聚物。将退火的寡核苷酸与经BsmBI消化和凝胶纯化的慢病毒转移质粒pED316合并,并且用T4 DNA连接酶(NEB目录号:M0202S)根据制造商的方案连接。根据制造商的方案将2μ1连接反应物转化至10μ1 NEB稳定感受态细胞(NEB目录号:C3040I)中。所得构建体通过U6启动子驱动包含由与tracrRNA(gttttagtactctggaaacagaatctactaaaacaaggcaaaatgccgtgtttatctcgtcaacttgttggcgagatttttt;SEQ ID NO:97)融合的个别靶向序列编码的crRNA的sgRNA的表达。
慢病毒产生
将HEK293TA细胞以0.75×10
FSHD患者来源的成淋巴细胞细胞系(LCL)的转导
当使用表1所列出的靶向序列时:
两株FSHD患者来源的B成淋巴细胞细胞系(LCL)GM16343和GM16414获自Coriell研究所。在补充有15%胎牛血清的RPMI-1640培养基中培养所述细胞。为了转导,将100,000个细胞与8μg/ml聚凝胺(Sigma目录号:TR-1003-G)混合,并向每一个孔(96孔板)加入对应于各sgRNA(表1)的200μl慢病毒上清液(参见上文)。然后将细胞和病毒混合物在1200×g、37℃下旋转1小时,然后以0.25×10
当使用表2所列出的靶向序列时:
FSHD患者来源的B成淋巴细胞细胞系(LCL)GM16343获自Coriell研究所。在补充有15%胎牛血清的RPMI-1640培养基中培养所述细胞。为了转导,将500,000个细胞与6.66μg/ml聚凝胺(Sigma目录号:TR-1003-G)混合,并向每一个孔(24孔板)加入对应于各sgRNA(表2)的500μl慢病毒上清液(参见上文)。然后将细胞和病毒混合物在1200×g、37℃下旋转1小时,然后以0.5×10
基因表达分析
为了进行基因表达分析,根据大容量cDNA反转录试剂盒(Applied Biosystems;ThermoFisher目录号:4368813)方案以10μl体积由约0.5-0.8μg总RNA产生cDNA。将cDNA稀释10倍,并使用Taqman Fast Advanced Master Mix根据制造商的方案进行分析。Taqman探针(DUX4:定制设计;MBD3L2:Assay Id Hs00544743_m1;TRIM43:Assay Id Hs00299174_m1;ZSCAN4:Assay Id Hs00537549_m1;HPRT:Assay Id Hs99999909_m1 VIC_PL)获自LifeTechnologies。通过QuantStudio 5实时PCR系统,在Taqman Fast Advanced Master Mix方案的指导下处理和分析基于Taqman探针的实时PCR反应。
数据分析
对于各个样品和对照物,通过从HPRT探针减去靶基因(DUX4、MBD3L2、TRIM43和ZSCAN4)探针的3个技术重复实验的平均Ct值来计算ΔCt值(平均Ct DUX4-平均Ct HPRT)。然后计算3个对照sgRNA的平均ΔCt。然后从平均对照ΔCt减去各个样品和对照物的ΔCt,得到各个样品和对照物的ΔΔCt。然后使用式2^-(ΔΔCt)来确定各个样品和对照物的归一化表达值。在这种情况下,各个对照物的个别表达值相对于所有三个对照样品的平均表达值进行归一化。表示对照样品的图示条柱是三个对照物在三个独立实验中的平均值。
(2)结果
通过dSaCas9-KRAB:sgRNA抑制DUX4基因表达
在初步sgRNA筛检实验中,产生了将dSaCas9-KRAB的表达盒和各个靶向序列的sgRNA递送到FSHD患者来源的LCL的慢病毒。选择耐受嘌呤霉素7天(对于表1所列出的靶向序列)或14天(对于表2所列出的靶向序列)的转导细胞,并使用Taqman测定法对DUX4表达进行定量。每一个样品的表达值相对于经对照sgRNA转导的细胞中的DUX4表达平均值进行归一化。
当使用表1所列出的靶向序列时:
如图2所示,在76个被测序列中,有27个靶向序列在两种LCL中的任一种中示出了DUX4 mRNA表达下调至少50%(图2和表3)。
[表3]
与对照sgRNA(设为1.0)相比,用来自初步sgRNA筛检实验的所选择的27种sgRNA处理的LCL DUX4表达水平
接下来,我们对由初步筛检鉴定的这27种最有效候选sgRNA进行了验证筛检,这次选择了耐受嘌呤霉素15天的转导细胞来探索更长时间处理产生更佳抑制的可能性。如图3所示,7个sgRNA靶向序列在两种LCL中都示出了DUX4 mRNA表达下调至少50%,其中sgRNA-#2示出了约99%抑制。这一结果还表明,对于某些sgRNA,通过更长时间的处理,可以大大提高抑制效力。
DUX4的表达导致许多下游靶标的异常上调,包括生殖系中和早期发育时表达的基因。TRIM43、ZSCAN4和MBD3L2是DUX4的下游靶标,发现它们在本研究所用的FSHD患者来源的LCL培养物中也上调。为了确定dCas9-KRAB介导的DUX4抑制是否也会抑制这些DUX4靶基因,我们测量了经验证实验所鉴定的最有效sgRNA处理的样品中的TRIM43、ZSCAN4和MBD3L2的水平。正如所料,所有这些dCas9-KRAB:sgRNA都显著降低了所有三个DUX4靶标的表达,达到内源水平的约50-99%(图4),并且抑制效力与DUX4抑制效力密切相关(表4)。
[表4]
用6种最佳sgRNA(sgDUX4-2、sgDUX4-3、sgDUX4-4、sgDUX4-20、sgDUX4-51和sgDUX4-68)处理的FSHD患者来源的LCL中DUX4、TRIM43、MBD3L2和ZSCAN4 mRNA水平的皮尔森相关性分析。
(表中所示的数字是DUX4、TRIM43、MBD3L2和ZSCAN4 mRNA水平中每一个的皮尔森相关性系数)
当使用表2所列出的靶向序列时:
除了85个新靶向序列之外,还测试了另外3个先前被证明抑制DUX4表达的靶向序列(sgDUX4-2、sgDUX4-20、sgDUX4-51)以供比较。
根据3个筛检实验,在85个被测新靶向序列中,11个靶向序列示出了DUX4 mRNA表达平均下调至少50%(图6)。在这11个靶向序列中,有6个靶向序列在所有三个单独筛检实验中导致DUX4表达与对照非靶向序列相比<60%[第1组]。11个靶向序列中另外5个在3个单独筛检实验中的2个中导致DUX4表达<60%[第2组](图6,表5)。
[表5]
与对照sgRNA(设为1.0)相比,用来自初步sgRNA筛检实验的11种最佳sgRNA处理的LCL的DUX4表达水平
接下来,我们对由初步筛检鉴定的6种最有效候选sgRNA[第1组]进行了验证筛检,这次选择了耐受嘌呤霉素17天的转导细胞来探索更长时间处理产生更佳抑制的可能性(图7)。
DUX4的表达导致许多下游靶标的异常上调,包括生殖系中和早期发育时表达的基因。TRIM43、ZSCAN4和MBD3L2是DUX4的下游靶标,发现它们在本研究所用的FSHD患者来源的LCL培养物中也上调。为了确定dCas9-KRAB介导的DUX4抑制是否也会抑制这些DUX4靶基因,我们测量了用验证实验所鉴定的最有效sgRNA处理的样品中的TRIM43、ZSCAN4和MBD3L2的水平。正如所料,所有这些dCas9-KRAB:sgRNA都显著降低了所有三个DUX4靶标的表达(图7),并且抑制效力与DUX4抑制效力密切相关(表6)。
[表6]
用6种最佳sgRNA(sgDUX4-122、sgDUX4-126、sgDUX4-130、sgDUX4-140、sgDUX4-142、sgDUX4-145)处理的FSHD患者来源的LCL中DUX4、TRIM43、MBD3L2和ZSCAN4 mRNA水平的皮尔森相关性分析。
(表中所示的数字是DUX4、TRIM43、MBD3L2和ZSCAN4 mRNA水平中每一个的皮尔森相关性系数)
工业实用性
根据本发明,可以抑制DUX4基因在人细胞中的表达。因此,本发明预计对治疗和/或预防FSHD非常有用。
在本文阐述数值界限或范围时,包括端点。此外,明确包括数值界限或范围内的所有值和子范围,就如同明确书写出来一样。
如本文所用,措辞“一个”和“一种”等具有“一个或多个”的含义。
显然,根据上述教导内容,本发明可能有许多修改和变化。因此,应当理解,在所附权利要求书的范围内,本发明可以不像本文具体描述那样实施。
上述所有专利和其它参考文献以引用的方式全部并入本文,与详细阐述无异。
本申请基于在美国提交的美国临时专利申请第63/072,327号(申请日期:2020年8月31日)和美国临时专利申请第63/235,359号(申请日期:2021年8月20日),二者的内容全部并入本文。
序列表
<110> 摩大力斯医疗株式会社(Modalis Therapeutics Corporation)
<120> 通过靶向DUX4基因来治疗面肩肱型肌营养不良症(FSHD)的方法
<130> 093184
<150> US63/072,327
<151> 2020-08-31
<150> US63/235,359
<151> 2021-08-20
<160> 182
<170> PatentIn第3.5版
<210> 1
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gggaggtgga gctgccccgg ct 22
<210> 2
<211> 22
<212> DNA
<213> 智人
<400> 2
ctcatccagc agcaggccgc ag 22
<210> 3
<211> 22
<212> DNA
<213> 智人
<400> 3
agcccggtat tcttcctcgc tg 22
<210> 4
<211> 22
<212> DNA
<213> 智人
<400> 4
ccctccaccg ggctgaccgg cc 22
<210> 5
<211> 22
<212> DNA
<213> 智人
<400> 5
gtgggccgcc tactgcgcac gc 22
<210> 6
<211> 22
<212> DNA
<213> 智人
<400> 6
ggggcccggt gtttcgcggg ac 22
<210> 7
<211> 22
<212> DNA
<213> 智人
<400> 7
gcgtcccggt gtgcgccggg cc 22
<210> 8
<211> 22
<212> DNA
<213> 智人
<400> 8
aacgggagac ctagaggggc gg 22
<210> 9
<211> 22
<212> DNA
<213> 智人
<400> 9
ggaaaagcgg tcctcggcct cc 22
<210> 10
<211> 22
<212> DNA
<213> 智人
<400> 10
cgggtgaaaa cccgacggca ac 22
<210> 11
<211> 22
<212> DNA
<213> 智人
<400> 11
cctgcgtgtg gctcctccgt gg 22
<210> 12
<211> 22
<212> DNA
<213> 智人
<400> 12
ttgcaccctt ccctgcatgt tt 22
<210> 13
<211> 22
<212> DNA
<213> 智人
<400> 13
cgccggggag gcatctcctc tc 22
<210> 14
<211> 22
<212> DNA
<213> 智人
<400> 14
gaactgaacc tccgtgggag tc 22
<210> 15
<211> 22
<212> DNA
<213> 智人
<400> 15
agagagcggc ttcccgttcc cg 22
<210> 16
<211> 22
<212> DNA
<213> 智人
<400> 16
ggccggctct ccggacctct cc 22
<210> 17
<211> 22
<212> DNA
<213> 智人
<400> 17
gtcgaggcct ggggccggcc gg 22
<210> 18
<211> 22
<212> DNA
<213> 智人
<400> 18
gccggcccca ggcctcgacg cc 22
<210> 19
<211> 22
<212> DNA
<213> 智人
<400> 19
cctcgacgcc ctgggtccct tc 22
<210> 20
<211> 22
<212> DNA
<213> 智人
<400> 20
gggggctcac cgccattcat ga 22
<210> 21
<211> 22
<212> DNA
<213> 智人
<400> 21
ggcaggcagg ctccacccct tc 22
<210> 22
<211> 22
<212> DNA
<213> 智人
<400> 22
ggccatcgcg gtgagccccg gc 22
<210> 23
<211> 22
<212> DNA
<213> 智人
<400> 23
ttccgcgggg agggtgctgt cc 22
<210> 24
<211> 22
<212> DNA
<213> 智人
<400> 24
ctcgtccccg ggcttccgcg gg 22
<210> 25
<211> 22
<212> DNA
<213> 智人
<400> 25
ctcgctttgg ctcggggtcc aa 22
<210> 26
<211> 22
<212> DNA
<213> 智人
<400> 26
aggccatcgg cattccggag cc 22
<210> 27
<211> 22
<212> DNA
<213> 智人
<400> 27
cggcgaaagc ggaccgccgt ca 22
<210> 28
<211> 22
<212> DNA
<213> 智人
<400> 28
gagagacggg cctcccggag tc 22
<210> 29
<211> 22
<212> DNA
<213> 智人
<400> 29
cctgtgcagc gcggcccccg gc 22
<210> 30
<211> 22
<212> DNA
<213> 智人
<400> 30
tgggtcgcct tcgcccacac cg 22
<210> 31
<211> 22
<212> DNA
<213> 智人
<400> 31
tttcagtttc cctttacttg ca 22
<210> 32
<211> 22
<212> DNA
<213> 智人
<400> 32
tccaaaatgc aacctgaagc ta 22
<210> 33
<211> 22
<212> DNA
<213> 智人
<400> 33
cactttcaat ggcgcctttt tc 22
<210> 34
<211> 22
<212> DNA
<213> 智人
<400> 34
ggaagatttc tctcaaaaac gg 22
<210> 35
<211> 22
<212> DNA
<213> 智人
<400> 35
gaggagtacg tcttctgcag cc 22
<210> 36
<211> 22
<212> DNA
<213> 智人
<400> 36
caggtctggg ctgagcattg ag 22
<210> 37
<211> 22
<212> DNA
<213> 智人
<400> 37
cctccctcca gggctatgga cc 22
<210> 38
<211> 22
<212> DNA
<213> 智人
<400> 38
agctcccagc atattaggtg gg 22
<210> 39
<211> 22
<212> DNA
<213> 智人
<400> 39
gtagcccttt gaccaaaggg tt 22
<210> 40
<211> 22
<212> DNA
<213> 智人
<400> 40
gcagccctgt gaccaaaggg ct 22
<210> 41
<211> 22
<212> DNA
<213> 智人
<400> 41
cccagcatgc accaggctca gg 22
<210> 42
<211> 22
<212> DNA
<213> 智人
<400> 42
cccagcatgc accaggctca gg 22
<210> 43
<211> 22
<212> DNA
<213> 智人
<400> 43
gaagctcagt tgtgttcact tt 22
<210> 44
<211> 22
<212> DNA
<213> 智人
<400> 44
aactatagct atctgcaata tc 22
<210> 45
<211> 22
<212> DNA
<213> 智人
<400> 45
atacgatcca gcaatttcac at 22
<210> 46
<211> 21
<212> DNA
<213> 智人
<400> 46
gtcaagcaga tgccaagtcg t 21
<210> 47
<211> 21
<212> DNA
<213> 智人
<400> 47
tcagtaaatg ttctgtcatt g 21
<210> 48
<211> 21
<212> DNA
<213> 智人
<400> 48
atgagccaag tgaaaacacc a 21
<210> 49
<211> 21
<212> DNA
<213> 智人
<400> 49
ggcatcacaa atggcaaacc a 21
<210> 50
<211> 21
<212> DNA
<213> 智人
<400> 50
aatgcataaa gcctgaaggg a 21
<210> 51
<211> 21
<212> DNA
<213> 智人
<400> 51
gaacggacag caaacgacaa g 21
<210> 52
<211> 21
<212> DNA
<213> 智人
<400> 52
atcgataaat acgctaacca c 21
<210> 53
<211> 21
<212> DNA
<213> 智人
<400> 53
gtcacccgca ttctttagag a 21
<210> 54
<211> 21
<212> DNA
<213> 智人
<400> 54
gaatattttg aaaattaagt g 21
<210> 55
<211> 21
<212> DNA
<213> 智人
<400> 55
tgctggagaa accctcttta t 21
<210> 56
<211> 21
<212> DNA
<213> 智人
<400> 56
tagcatctta aatctccacc c 21
<210> 57
<211> 21
<212> DNA
<213> 智人
<400> 57
aatcaaaatg cacatgctct g 21
<210> 58
<211> 21
<212> DNA
<213> 智人
<400> 58
acttttaaga cgtggagcac t 21
<210> 59
<211> 21
<212> DNA
<213> 智人
<400> 59
ttttggagct tgtccactta a 21
<210> 60
<211> 21
<212> DNA
<213> 智人
<400> 60
acaagactca cgcctcagaa a 21
<210> 61
<211> 21
<212> DNA
<213> 智人
<400> 61
cgtactcctc tggaaagaac c 21
<210> 62
<211> 21
<212> DNA
<213> 智人
<400> 62
ggaaaaggta aggtatcttt g 21
<210> 63
<211> 21
<212> DNA
<213> 智人
<400> 63
tgccgactct ttgcaaggag a 21
<210> 64
<211> 21
<212> DNA
<213> 智人
<400> 64
agctataatc ccagcatgta c 21
<210> 65
<211> 21
<212> DNA
<213> 智人
<400> 65
gcgcagccct ggaagaaggg g 21
<210> 66
<211> 21
<212> DNA
<213> 智人
<400> 66
caaagggttg ggagtgttta t 21
<210> 67
<211> 21
<212> DNA
<213> 智人
<400> 67
gcaagttgaa agaaggtccc t 21
<210> 68
<211> 21
<212> DNA
<213> 智人
<400> 68
gtagttctta ggagctagag g 21
<210> 69
<211> 21
<212> DNA
<213> 智人
<400> 69
tcattccact tatgagatac t 21
<210> 70
<211> 21
<212> DNA
<213> 智人
<400> 70
catgcatgac gtaccatgtg t 21
<210> 71
<211> 21
<212> DNA
<213> 智人
<400> 71
tgatggtaat tcaaacaaca c 21
<210> 72
<211> 21
<212> DNA
<213> 智人
<400> 72
acatttccac caacagtgta c 21
<210> 73
<211> 21
<212> DNA
<213> 智人
<400> 73
ggtattaagt gatatgtcat t 21
<210> 74
<211> 21
<212> DNA
<213> 智人
<400> 74
aagtagtttg ttttattgtt g 21
<210> 75
<211> 21
<212> DNA
<213> 智人
<400> 75
taggggaaac acgtcataac a 21
<210> 76
<211> 21
<212> DNA
<213> 智人
<400> 76
ctgtaagaaa aaattaacta a 21
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 77
acggaggcta agcgtcgcaa 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 78
cgcttccgcg gcccgttcaa 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 79
gtaggcgcgc cgctctctac 20
<210> 80
<211> 19
<212> RNA
<213> 新凶手弗朗西斯菌(Francisella novicid)
<220>
<221> misc_feature
<222> (1)..(19)
<223> crRNA的5’-把手
<400> 80
aauuucuacu guuguagau 19
<210> 81
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> VARIANT
<222> (580)..(580)
<223> Asn残基转变为Ala残基
<400> 81
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 10001005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
101010151020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
102510301035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
104010451050
<210> 82
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> VARIANT
<222> (557)..(557)
<223> His残基转变为Ala残基
<400> 82
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 10001005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
101010151020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
102510301035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
104010451050
<210> 83
<211> 1028
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸残基(dSaCas9的第721个至第745个
氨基酸残基)缺失突变体
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> VARIANT
<222> (580)..(580)
<223> Asn残基转变为Ala残基
<400> 83
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys
725 730 735
His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys
740 745 750
Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys
755 760 765
Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr
770 775 780
Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu
785 790 795 800
Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys
805 810 815
Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr
820 825 830
Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn
835 840 845
Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
850 855 860
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val
865 870 875 880
Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly
885 890 895
Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu
900 905 910
Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu
915 920 925
Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn
930 935 940
Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn
945 950 955 960
Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr
965 970 975
Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile
980 985 990
Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp
995 10001005
Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln
101010151020
Ile Ile Lys Lys Gly
1025
<210> 84
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> GGSGGS接头
<400> 84
Gly Gly Ser Gly Gly Ser
1 5
<210> 85
<211> 1034
<212> PRT
<213> 人工序列
<220>
<223> 具有GGSGGS接头的氨基酸残基(dSaCas9的第721个至
第745个氨基酸残基)缺失突变体
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> VARIANT
<222> (580)..(580)
<223> Asn残基转变为Ala残基
<220>
<221> MISC_FEATURE
<222> (721)..(726)
<223> GGSGGS接头
<400> 85
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Gly Gly Ser Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile
725 730 735
Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr
740 745 750
Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr
755 760 765
Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn
770 775 780
Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu
785 790 795 800
Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln
805 810 815
Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys
820 825 830
Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys
835 840 845
Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr
850 855 860
Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn
865 870 875 880
Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp
885 890 895
Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu
900 905 910
Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr
915 920 925
Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile
930 935 940
Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
945 950 955 960
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn
965 970 975
Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys
980 985 990
Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
995 10001005
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
101010151020
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
10251030
<210> 86
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> SGGGS接头
<400> 86
Ser Gly Gly Gly Ser
1 5
<210> 87
<211> 1033
<212> PRT
<213> 人工序列
<220>
<223> 具有SGGGS接头的氨基酸残基(dSaCas9的第721个至
第745个氨基酸残基)缺失突变体
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> VARIANT
<222> (580)..(580)
<223> Asn残基转变为Ala残基
<220>
<221> MISC_FEATURE
<222> (721)..(725)
<223> SGGGS接头
<400> 87
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Ser Gly Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr
725 730 735
Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser
740 745 750
His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu
755 760 765
Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn
770 775 780
Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile
785 790 795 800
Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr
805 810 815
Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn
820 825 830
Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr
835 840 845
Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
850 855 860
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser
865 870 875 880
Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val
885 890 895
Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp
900 905 910
Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu
915 920 925
Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
930 935 940
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg
945 950 955 960
Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met
965 970 975
Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
980 985 990
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys
995 10001005
Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser
101010151020
Lys Lys His Pro Gln Ile Ile Lys Lys Gly
10251030
<210> 88
<211> 886
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸残基(dSaCas9的第482个至第648个氨基酸残基)
缺失突变体
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<400> 88
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr
485 490 495
Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly
500 505 510
Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn
515 520 525
Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala
530 535 540
Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val
545 550 555 560
Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu
565 570 575
Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln
580 585 590
Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val
595 600 605
Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr
610 615 620
Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly
625 630 635 640
Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser
645 650 655
Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys
660 665 670
Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr
675 680 685
Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys
690 695 700
Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu
705 710 715 720
Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys
725 730 735
Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
740 745 750
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys
755 760 765
Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys
770 775 780
Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr
785 790 795 800
Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly
805 810 815
Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile
820 825 830
Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg
835 840 845
Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser
850 855 860
Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro
865 870 875 880
Gln Ile Ile Lys Lys Gly
885
<210> 89
<211> 892
<212> PRT
<213> 人工序列
<220>
<223> 具有GGSGGS接头的氨基酸残基(dSaCas9的第482个至
第648个氨基酸残基)缺失突变体
<220>
<221> VARIANT
<222> (10)..(10)
<223> Asp残基转变为Ala残基
<220>
<221> MISC_FEATURE
<222> (482)..(487)
<223> GGSGGS接头
<400> 89
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 1015
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
202530
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
354045
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
505560
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65707580
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
859095
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Gly Gly Ser Gly Gly Ser Thr Arg Tyr Ala Thr Arg Gly Leu Met
485 490 495
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
500 505 510
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
515 520 525
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
530 535 540
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
545 550 555 560
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
565 570 575
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
580 585 590
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
595 600 605
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
610 615 620
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
625 630 635 640
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
645 650 655
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
660 665 670
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
675 680 685
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
690 695 700
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
705 710 715 720
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
725 730 735
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
740 745 750
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
755 760 765
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
770 775 780
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
785 790 795 800
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
805 810 815
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
820 825 830
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
835 840 845
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln
850 855 860
Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val
865 870 875 880
Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
885 890
<210> 90
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 编码NLS的DNA序列
<400> 90
gccccaaaga agaagcggaa ggtcggtatc cacggagtcc cagcagcc 48
<210> 91
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 编码NLS的DNA序列
<400> 91
aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 48
<210> 92
<211> 3477
<212> DNA
<213> 人工序列
<220>
<223> 与KRAB (DNA)融合的dSaCas9
<400> 92
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220
aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280
gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240
gcaaaaaaga aaaagggatc catggatgct aagtcactaa ctgcctggtc ccggacactg 3300
gtgaccttca aggatgtatt tgtggacttc accagggagg agtggaagct gctggacact 3360
gctcagcaga tcgtgtacag aaatgtgatg ctggagaact ataagaacct ggtttccttg 3420
ggttatcagc ttactaagcc agatgtgatc ctccggttgg agaagggaga agagccc 3477
<210> 93
<211> 22
<212> RNA
<213> 智人
<220>
<221> misc_feature
<222> (1)..(22)
<223> 与靶序列(SEQ ID NO:4)对应的crRNA
<400> 93
cccuccaccg ggcugaccgg cc 22
<210> 94
<211> 22
<212> DNA
<213> 智人
<220>
<221> misc_feature
<222> (1)..(22)
<223> 与靶序列(SEQ ID NO:4)互补的序列
<400> 94
ggccggtcag cccggtggag gg 22
<210> 95
<211> 19
<212> DNA
<213> 新凶手弗朗西斯菌
<220>
<221> misc_feature
<223> crRNA的5’-把手
<400> 95
aatttctact gttgtagat 19
<210> 96
<211> 60
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<222> (1)..(83)
<223> 编码tracrRNA的序列
<400> 96
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
<210> 97
<211> 82
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<222> (1)..(82)
<223> tracRNA
<400> 97
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgagatttt tt 82
<210> 98
<211> 22
<212> DNA
<213> 智人
<400> 98
ctaaggcttt ttctctccct cc 22
<210> 99
<211> 22
<212> DNA
<213> 智人
<400> 99
tgggaggatt ttgcctgtga gt 22
<210> 100
<211> 22
<212> DNA
<213> 智人
<400> 100
agattctggg aggattttgc ct 22
<210> 101
<211> 22
<212> DNA
<213> 智人
<400> 101
gaactcacag gcaaaatcct cc 22
<210> 102
<211> 22
<212> DNA
<213> 智人
<400> 102
ttatgttctc acaagattct gg 22
<210> 103
<211> 22
<212> DNA
<213> 智人
<400> 103
tgactagttt ggcattgctt tt 22
<210> 104
<211> 22
<212> DNA
<213> 智人
<400> 104
gatttataaa taatggcatg ac 22
<210> 105
<211> 22
<212> DNA
<213> 智人
<400> 105
gtgaggggag atggggagac at 22
<210> 106
<211> 22
<212> DNA
<213> 智人
<400> 106
ccagccaggc cgcgccggca ga 22
<210> 107
<211> 22
<212> DNA
<213> 智人
<400> 107
ctcccaacct gccccggcgc gc 22
<210> 108
<211> 22
<212> DNA
<213> 智人
<400> 108
tgcggaggcc accgaggagc ct 22
<210> 109
<211> 22
<212> DNA
<213> 智人
<400> 109
tcccggtcct cccggctttt gc 22
<210> 110
<211> 22
<212> DNA
<213> 智人
<400> 110
gggcccggca ggccgtcgcg ct 22
<210> 111
<211> 22
<212> DNA
<213> 智人
<400> 111
ctcaagcggg gccgcagggc ca 22
<210> 112
<211> 22
<212> DNA
<213> 智人
<400> 112
ccaccacgga ctcccctggg ac 22
<210> 113
<211> 22
<212> DNA
<213> 智人
<400> 113
gcttgcgcca cccacgtccc ag 22
<210> 114
<211> 22
<212> DNA
<213> 智人
<400> 114
gagtccgtgg tggggctggg gc 22
<210> 115
<211> 22
<212> DNA
<213> 智人
<400> 115
ctgctggagg agctttagga cg 22
<210> 116
<211> 22
<212> DNA
<213> 智人
<400> 116
gctttaggac gcggggttgg ga 22
<210> 117
<211> 22
<212> DNA
<213> 智人
<400> 117
aggacgcggg gttgggacgg gg 22
<210> 118
<211> 22
<212> DNA
<213> 智人
<400> 118
caccggcctg gacctagaag gc 22
<210> 119
<211> 22
<212> DNA
<213> 智人
<400> 119
agaatggcag ttctccgcgg tg 22
<210> 120
<211> 22
<212> DNA
<213> 智人
<400> 120
gggatccccg ggatgcccag ga 22
<210> 121
<211> 22
<212> DNA
<213> 智人
<400> 121
gccattcttt cctgggcatc cc 22
<210> 122
<211> 22
<212> DNA
<213> 智人
<400> 122
cctgggccgg ctctgggatc cc 22
<210> 123
<211> 22
<212> DNA
<213> 智人
<400> 123
ctgctggtac ctgggccggc tc 22
<210> 124
<211> 22
<212> DNA
<213> 智人
<400> 124
tggggatggg gcggtcaggc gg 22
<210> 125
<211> 22
<212> DNA
<213> 智人
<400> 125
ccgggggtgg ggggtggggg gt 22
<210> 126
<211> 22
<212> DNA
<213> 智人
<400> 126
cgttttccgg gggtgggggg tg 22
<210> 127
<211> 22
<212> DNA
<213> 智人
<400> 127
gacgacgcgt tttccggggg tg 22
<210> 128
<211> 22
<212> DNA
<213> 智人
<400> 128
cccaggggac gacgcgtttt cc 22
<210> 129
<211> 22
<212> DNA
<213> 智人
<400> 129
ggaaaacgcg tcgtcccctg gg 22
<210> 130
<211> 22
<212> DNA
<213> 智人
<400> 130
gctgaccgtt ttcccggagg gc 22
<210> 131
<211> 22
<212> DNA
<213> 智人
<400> 131
ctgggccccg gaaccggggc ga 22
<210> 132
<211> 22
<212> DNA
<213> 智人
<400> 132
ctccctgggc cccggaaccg gg 22
<210> 133
<211> 22
<212> DNA
<213> 智人
<400> 133
ttcgccccgg ttccggggcc ca 22
<210> 134
<211> 22
<212> DNA
<213> 智人
<400> 134
ctccgggaca aaagaccggg ac 22
<210> 135
<211> 22
<212> DNA
<213> 智人
<400> 135
aagaccggga ctcgggttgc cg 22
<210> 136
<211> 22
<212> DNA
<213> 智人
<400> 136
ggatgtgcgg tctgtgaacc gc 22
<210> 137
<211> 22
<212> DNA
<213> 智人
<400> 137
gccgcgttgc agggctcagc ct 22
<210> 138
<211> 22
<212> DNA
<213> 智人
<400> 138
gggcacccgg aaacatgcag gg 22
<210> 139
<211> 22
<212> DNA
<213> 智人
<400> 139
attcccgcgt gcggcaacgt gg 22
<210> 140
<211> 22
<212> DNA
<213> 智人
<400> 140
actcccccac gttgccgcac gc 22
<210> 141
<211> 22
<212> DNA
<213> 智人
<400> 141
tccccggcgt gatggcctga cg 22
<210> 142
<211> 22
<212> DNA
<213> 智人
<400> 142
gagtgtggaa ctgaacctcc gt 22
<210> 143
<211> 22
<212> DNA
<213> 智人
<400> 143
aaaccagcct gggagggtgg ag 22
<210> 144
<211> 22
<212> DNA
<213> 智人
<400> 144
cagcagggag aaaccagcct gg 22
<210> 145
<211> 22
<212> DNA
<213> 智人
<400> 145
ctcgcagggc ctcgctttgg ct 22
<210> 146
<211> 22
<212> DNA
<213> 智人
<400> 146
tctctggtgg cgatgcccgg gt 22
<210> 147
<211> 22
<212> DNA
<213> 智人
<400> 147
agccgttctc tggtggcgat gc 22
<210> 148
<211> 22
<212> DNA
<213> 智人
<400> 148
accaaatctg gaccctgggc tc 22
<210> 149
<211> 22
<212> DNA
<213> 智人
<400> 149
gcccagggtc cagatttggt tt 22
<210> 150
<211> 22
<212> DNA
<213> 智人
<400> 150
cgccagctga ggcagcaccg gc 22
<210> 151
<211> 22
<212> DNA
<213> 智人
<400> 151
ggctcggagg agcagggcgg tc 22
<210> 152
<211> 22
<212> DNA
<213> 智人
<400> 152
cctgctcctc cgagcctttg ag 22
<210> 153
<211> 22
<212> DNA
<213> 智人
<400> 153
ctggccagag agacgggcct cc 22
<210> 154
<211> 22
<212> DNA
<213> 智人
<400> 154
cccttcgatt ctgaaaccag at 22
<210> 155
<211> 22
<212> DNA
<213> 智人
<400> 155
gtccaggatt cagatctggt tt 22
<210> 156
<211> 22
<212> DNA
<213> 智人
<400> 156
tcgaagggcc aggcacccgg ga 22
<210> 157
<211> 22
<212> DNA
<213> 智人
<400> 157
gcgggcgccc tgccaccctg tc 22
<210> 158
<211> 22
<212> DNA
<213> 智人
<400> 158
gcgaaggcga cccacgaggg ag 22
<210> 159
<211> 22
<212> DNA
<213> 智人
<400> 159
gcgggggtca ccctgctccc tc 22
<210> 160
<211> 22
<212> DNA
<213> 智人
<400> 160
agccccaggc gcgcagggca cg 22
<210> 161
<211> 22
<212> DNA
<213> 智人
<400> 161
accgggccta gacctagaag gc 22
<210> 162
<211> 22
<212> DNA
<213> 智人
<400> 162
gcgttttccg ggggtggggg gt 22
<210> 163
<211> 22
<212> DNA
<213> 智人
<400> 163
cgtccccggt gtgcgccggg cc 22
<210> 164
<211> 22
<212> DNA
<213> 智人
<400> 164
cgggtgaaga cccgacggca ac 22
<210> 165
<211> 22
<212> DNA
<213> 智人
<400> 165
ggatgtgggg tctgtgaacc gc 22
<210> 166
<211> 22
<212> DNA
<213> 智人
<400> 166
gactccccac gttgccgcac gc 22
<210> 167
<211> 22
<212> DNA
<213> 智人
<400> 167
ggtggtggtg gtggtggggg gg 22
<210> 168
<211> 22
<212> DNA
<213> 智人
<400> 168
ccagccaggc cgcgccggca ga 22
<210> 169
<211> 22
<212> DNA
<213> 智人
<400> 169
accgggcctg gacctagaag gc 22
<210> 170
<211> 22
<212> DNA
<213> 智人
<400> 170
tggggagggg gcggtcaggc gg 22
<210> 171
<211> 22
<212> DNA
<213> 智人
<400> 171
gattcccgcg tgcggcaacg tg 22
<210> 172
<211> 22
<212> DNA
<213> 智人
<400> 172
tggtggtggt ggtggtgggg gg 22
<210> 173
<211> 22
<212> DNA
<213> 智人
<400> 173
agaaaggcag ttctccgcgg ag 22
<210> 174
<211> 22
<212> DNA
<213> 智人
<400> 174
aggaaagaaa ggcagttctc cg 22
<210> 175
<211> 22
<212> DNA
<213> 智人
<400> 175
gcctttcttt cctgggcatc cc 22
<210> 176
<211> 22
<212> DNA
<213> 智人
<400> 176
gcgagctccc ttgcacgtca gc 22
<210> 177
<211> 22
<212> DNA
<213> 智人
<400> 177
ttgttcttcc gtgaaattct gg 22
<210> 178
<211> 22
<212> DNA
<213> 智人
<400> 178
aaggtggggg gagacattca gc 22
<210> 179
<211> 22
<212> DNA
<213> 智人
<400> 179
ttccgacgct gtctaggcaa ac 22
<210> 180
<211> 22
<212> DNA
<213> 智人
<400> 180
cgctgtctag gcaaacctgg at 22
<210> 181
<211> 22
<212> DNA
<213> 智人
<400> 181
acctggatta gagttacatc tc 22
<210> 182
<211> 22
<212> DNA
<213> 智人
<400> 182
tatattaaaa tgccccctcc ct 22