掌桥专利:专业的专利平台
掌桥专利
首页

抗凝因子的基因编辑

文献发布时间:2023-06-19 11:11:32



技术领域

本发明涉及对凝血抑制基因的人工操纵或修饰以得到正常凝血系统。更具体而言,本发明涉及能够人工调节凝血的系统,所述系统包括能够人工操纵凝血抑制基因以激活异常的凝血系统(即失活的凝血系统)的组合物。

背景技术

血友病是由凝血因子缺乏引起的出血性疾病。血液中的凝血因子由因子I至因子XIII组成,并且血友病由相应因子的遗传缺陷引起。血友病A由因子VIII缺乏引起,并已知影响每5000名男婴中的一名。血友病B由因子IX缺乏引起,并已知影响每20,000名男婴中的一名。全世界的血友病患者估计超过700,000名。

迄今为止已知的疗法主要为持续使用所缺乏的因子,而没有根本性的治疗方法。

因此,存在对能够在单一疗法中实现长期效果的治疗剂的需求,所述治疗剂可以实质上使用基因编辑来敲除使凝血系统失活的蛋白质的表达。

发明内容

技术问题

本发明的一个实施方式是提供治疗凝血病的方法。

本发明的另一实施方式是提供用于基因操纵的组合物。

本发明的又一实施方式是提供一种能够靶向凝血抑制基因的引导核酸。

技术方案

为了解决上述问题,本发明提供了用于基因操纵的组合物,以人工操纵存在于细胞基因组中的凝血抑制基因来调节凝血系统。更具体而言,本发明提供了用于基因操纵的组合物,所述组合物包含能够靶向凝血抑制基因的引导核酸和编辑蛋白。另外,本发明提供了使用用于基因操纵以人工操纵凝血抑制基因的组合物来治疗或改善凝血病的方法。

为了治疗血友病,本发明提供了治疗血友病的方法,所述方法包括向待治疗的受试者中给予(引入)用于基因操纵的组合物。

在一个实施方式中,治疗血友病的方法可以包括向待治疗的受试者中引入(给予)用于基因操纵的组合物。

用于基因操纵的组合物可以包括以下:

引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及

编辑蛋白或编码所述编辑蛋白的核酸序列。

凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。

引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列。

互补结合可包括0个至5个的错配结合。

在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ IDNO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ IDNO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ IDNO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:687和SEQ ID NO:688。

在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ IDNO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ IDNO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ IDNO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ IDNO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。

引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。

引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。

编辑蛋白可为由酿脓链球菌(Streptococcus pyogenes)衍生而来的Cas9蛋白、由金黄色葡萄球菌(Staphylococcus aureus)衍生而来的Cas9蛋白或由空肠弯曲杆菌(Campylobacter jejuni)衍生而来的Cas9蛋白。

用于基因操纵的组合物可为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式。

此处,引导核酸可为引导RNA(gRNA)。

所述引导核酸和所述编辑蛋白可分别以核酸序列的形式存在于一个或多个载体中。

此处,所述载体可为质粒或病毒载体。

此处,所述病毒载体可为选自于由以下病毒载体所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。

用于基因操纵的组合物可任选地进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。

此处,待插入的核酸序列可为凝血抑制基因的部分核酸序列。

此处,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。

例如,凝血相关蛋白可为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。

引导核酸、编辑蛋白和供体可分别以核酸序列的形式存在于一种或多种载体中。

此处,载体可为质粒或病毒载体。

此处,病毒载体可为选自于由以下所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。

给予(引入)可通过注射、输注、植入或移植进行。

给予(引入)可通过选自如下的给予途径进行:肝内、皮下、皮内、眼内、玻璃体内、肿瘤内、结节内、髓内、肌内、静脉内、淋巴管内和腹膜内途径。

血友病可为血友病A、血友病B或血友病C。

待治疗的受试者为哺乳动物,包括人、猴、小鼠和大鼠。

或者,本发明提供了用于特定目的的用于基因操纵的组合物。

在一个实施方式中,用于基因操纵的组合物可以包括以下:

引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及

编辑蛋白或编码所述编辑蛋白的核酸序列。

凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。

引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列。

互补结合可包括0个至5个错配结合。

靶序列可为选自SEQ ID NO:19至SEQ ID NO:424中的一个或多个序列。

在一个实施方式中,靶序列可为选自以下的一个或多个序列:SEQ ID NO:21、SEQID NO:22、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:55、SEQID NO:57、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQID NO:229、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQID NO:270、SEQ ID NO:271、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:281和SEQ ID NO:282。

在一个实施方式中,靶序列可为选自以下的一个或多个序列:SEQ ID NO:286、SEQID NO:288、SEQ ID NO:299、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:315、SEQ ID NO:320、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:334、SEQ ID NO:335、SEQID NO:336、SEQ ID NO:342、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQID NO:391、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:408、SEQID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423和SEQ ID NO:424。

引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ ID NO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ ID NO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:687和SEQ ID NO:688。

引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ ID NO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ ID NO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ ID NO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。

引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。

引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。

引导核酸可包括引导结构域。

此处,引导结构域中可包含引导序列。

引导核酸可包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域的一个或多个结构域。

编辑蛋白可为由酿脓链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白或由空肠弯曲杆菌衍生而来的Cas9蛋白。

用于基因操纵的组合物可为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式。

此处,引导核酸可为引导RNA(gRNA)。

引导核酸和编辑蛋白可分别以核酸序列的形式存在于一种或多种载体中。

此处,载体可为质粒或病毒载体。

此处,病毒载体可为选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种病毒载体。

用于基因操纵的组合物可以任选地进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。

此处,待插入的核酸序列可为凝血抑制基因的部分核酸序列。

此处,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。

例如,凝血相关蛋白可为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。

引导核酸、编辑蛋白和供体可分别以核酸序列的形式存在于一种或多种载体中。

此处,载体可为质粒或病毒载体。

此处,病毒载体可为选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种病毒载体。

本发明提供了能够用于特定目的的靶向免疫参与基因的引导核酸。

在一个实施方式中,所述引导核酸可包括与位于凝血抑制基因中的靶序列形成互补结合的引导序列。

凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。

引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一种或多种引导序列。

互补结合可包括0个至5个错配结合。

引导核酸可与编辑蛋白形成复合体。

在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ IDNO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ IDNO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ IDNO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:687和SEQ ID NO:688。

在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ IDNO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ IDNO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ IDNO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ IDNO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。

引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。

引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。

引导核酸可包含引导结构域。

此处,引导结构域中可包含引导序列。

引导核酸可包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域中的一个或多个结构域。

有益效果

根据本发明,可以使用用于基因操纵的组合物来调节凝血系统。更具体而言,根据本发明,可以使用用于基因操纵的组合物通过人工操纵和/或修饰凝血抑制基因以调节凝血抑制基因的功能和/或表达来调节凝血系统,所述组合物包含靶向凝血抑制基因的引导核酸和编辑蛋白。另外,可以使用用于基因操纵以人工操纵凝血抑制基因的组合物来治疗或改善凝血病。

具体实施方式

除非另有定义,本文使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。与本文所述的方法和材料类似或相同的方法和材料可用于本发明的实践或测试中。本文提及的所有出版物、专利申请、专利和其它参考文献都以引用的方式将它们整体并入。此外,材料、方法和实例仅为说明性的,而不旨在为限制性的。

本说明书的公开内容的一个方面涉及引导核酸。

“引导核酸”是指识别靶核酸、基因或染色体并且与编辑蛋白相互作用的核苷酸序列。此处,引导核酸可互补结合至靶核酸、基因或染色体中的部分核苷酸序列。此外,引导核酸的部分核苷酸序列可与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。

引导核酸可执行诱导引导核酸-编辑蛋白复合体定位于靶核酸、基因或染色体的靶区域中的功能。

引导核酸可以以DNA、RNA或DNA/RNA杂合体的形式存在,并且可具有5nt-150nt的核酸序列。

引导核酸可具有一条连续的核酸序列。

例如,所述一条连续的核酸序列可为(N)m,其中N代表A、T、C或G,或A、U、C或G;并且m为1-150的整数。

引导核酸可具有两条以上连续的核酸序列。

例如,所述两条以上连续的核酸序列可为(N)

引导核酸可包含一个或多个结构域。

所述结构域可为功能结构域,所述功能结构域为引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域或尾部结构域,但不限于此。

此处,一个引导核酸可具有两个以上功能结构域。此处,两个以上功能结构域可彼此不同。或者,一个引导核酸中包含的两个以上功能结构域可彼此相同。例如,一个引导核酸可具有两个以上近端结构域。又例如,一个引导核酸可具有两个以上尾部结构域。但是,一个引导核酸中包含的功能结构域是相同的结构域的描述并不意为两个功能结构域的序列是相同的。即使序列不同,在功能上执行相同功能时,两个功能结构域也可为相同结构域。

将在下面详细描述功能结构域。

i)引导结构域

术语“引导结构域”是能够与靶基因或核酸的双链的任一条链的部分序列互补结合的结构域,并与靶基因或核酸特异性相互作用。例如,引导结构域可执行诱导引导核酸-编辑蛋白复合体定位于靶基因或核酸的特定核苷酸序列的功能。

引导结构域可为10个-35个核苷酸的序列。

在实例中,引导结构域可为10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。

在另一实例中,引导结构域可为10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。

引导结构域可包括引导序列。

“引导序列”为与靶基因或核酸的双链的任一条链的部分序列互补的核苷酸序列。此处,引导序列可为具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高互补性或完全互补性的核苷酸序列。

引导序列可为10个-25个核苷酸的序列。

在实例中,引导序列可为10个-25个核苷酸、15个-25个核苷酸或20个-25个核苷酸的序列。

在另一实例中,引导序列可为10个-15个核苷酸、15个-20个核苷酸或20个-25个核苷酸的序列。

此外,引导结构域可进一步包含额外核苷酸序列。

额外核苷酸序列可用于改善或降低引导结构域的功能。

额外核苷酸序列可用于改善或降低引导序列的功能。

额外核苷酸序列可为1个-10个核苷酸的序列。

在一个实例中,额外核苷酸序列可为2个-10个核苷酸、4个-10个核苷酸、6个-10个核苷酸或8个-10个核苷酸的序列。

在另一实例中,额外核苷酸序列可为1-3个核苷酸、3-6个核苷酸或7-10个核苷酸的序列。

在一个实施方式中,额外核苷酸序列可为1个核苷酸的序列、2个核苷酸的序列、3个核苷酸的序列、4个核苷酸的序列、5个核苷酸的序列、6个核苷酸的序列、7个核苷酸的序列、8个核苷酸的序列、9个核苷酸的序列或10个核苷酸的序列。

例如,额外核苷酸序列可为一个核苷酸的序列G(鸟嘌呤)或者两个核苷酸的序列GG。

额外核苷酸序列可位于引导序列的5′端。

额外核苷酸序列可位于引导序列的3′端。

ii)第一互补结构域

术语“第一互补结构域”是包含与下文描述的第二互补结构域互补的核苷酸序列的结构域,其具有足够的互补性以与第二互补结构域形成双链。例如,第一互补结构域可为与第二互补结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。

第一互补结构域可通过互补结合与第二互补结构域形成双链。此处,所形成的双链可通过与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。

第一互补结构域可为5个-35个核苷酸的序列。

在实例中,第一互补结构域可为5个-35个核苷酸、10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。

在另一实例中,第一互补结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。

iii)接头结构域

术语“接头结构域”是连接两个以上结构域(两个以上相同或不同的结构域)的核苷酸序列。接头结构域可借助共价结合或非共价结合与两个以上结构域连接,或可共价或非共价地连接两个以上结构域。

接头结构域可为1个-30个核苷酸的序列。

在一个实例中,接头结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸或25个-30个核苷酸的序列。

在另一实例中,接头结构域可为1个-30个核苷酸、5个-30个核苷酸、10个-30个核苷酸、15个-30个核苷酸、20个-30个核苷酸或25个-30个核苷酸的序列。

iv)第二互补结构域

术语“第二互补结构域”是包含与上述第一互补结构域互补的核苷酸序列的结构域,其具有足够的互补性以与第一互补结构域形成双链。例如,第二互补结构域可为与第一互补结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。

第二互补结构域可通过互补结合与第一互补结构域形成双链。此处,所形成的双链可通过与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。

第二互补结构域可具有与第一互补结构域互补的核苷酸序列,以及与第一互补结构域没有互补性的核苷酸序列(例如不与第一互补结构域形成双链的核苷酸序列),并可具有比第一互补结构域更长的序列。

第二互补结构域可具有5个-35个核苷酸的序列。

在实例中,第二互补结构域可为1个-35个核苷酸、5个-35个核苷酸、10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。

在另一实例中,第二互补结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。

v)近端结构域

术语“近端结构域”是临近第二互补结构域定位的核苷酸序列。

近端结构域中可包含互补核苷酸序列,并可由于互补核苷酸序列而形成双链。

近端结构域可为1个-20个核苷酸的序列。

在一个实例中,近端结构域可为1个-20个核苷酸、5个-20个核苷酸、10个-20个核苷酸或15个-20个核苷酸的序列。

在另一实例中,近端结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸或15个-20个核苷酸的序列。

vi)尾部结构域

术语“尾部结构域”为位于引导核酸两个末端中的一个或多个末端处的核苷酸序列。

尾部结构域中可包含互补核苷酸序列,并可由于互补核苷酸序列而形成双链。

尾部结构域可为1个-50个核苷酸的序列。

在实例中,尾部结构域可为5个-50个核苷酸、10个-50个核苷酸、15个-50个核苷酸、20个-50个核苷酸、25个-50个核苷酸、30个-50个核苷酸、35个-50个核苷酸、40个-50个核苷酸或45个-50个核苷酸的序列。

在另一实例中,尾部结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸、30个-35个核苷酸、35个-40个核苷酸、40个-45个核苷酸或45个-50个核苷酸的序列。

同时,所述结构域(即引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域)中包含的部分或全部核酸序列可选择性地或额外地包含化学修饰。

化学修饰可为但不限于甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2′-O-甲基3′硫代磷酸酯(MS)或2′-O-甲基3′硫代PACE(MSP)。

引导核酸包含一个或多个结构域。

引导核酸可包含引导结构域。

引导核酸可包含第一互补结构域。

引导核酸可包含接头结构域。

引导核酸可包含第二互补结构域。

引导核酸可包含近端结构域。

引导核酸可包含尾部结构域。

此处,引导核酸可包含1、2、3、4、5、6个或更多个结构域。

引导核酸可包含1、2、3、4、5、6个或更多个引导结构域。

引导核酸可包含1、2、3、4、5、6个或更多个第一互补结构域。

引导核酸可包含1、2、3、4、5、6个或更多个接头结构域。

引导核酸可包含1、2、3、4、5、6个或更多个第二互补结构域。

引导核酸可包含1、2、3、4、5、6个或更多个近端结构域。

引导核酸可包含1、2、3、4、5、6个或更多个尾部结构域。

此处,引导核酸可双重地包含一种类型的结构域。

引导核酸可单个地或双重地包含数个结构域。

引导核酸可包含相同类型的结构域。此处,相同类型的结构域可具有相同的核酸序列或不同的核酸序列。

引导核酸可包含两种类型的结构域。此处,两种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。

引导核酸可包含三种类型的结构域。此处,三种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。

引导核酸可包含四种类型的结构域。此处,四种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。

引导核酸可包含五种类型的结构域。此处,五种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。

引导核酸可包含六种类型的结构域。此处,六种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。

例如,引导核酸可由[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[接头结构域]-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]组成。此处,两个引导结构域可包含用于不同或相同靶标的引导序列;两个第一互补结构域和两个第二互补结构域可具有相同或不同的核酸序列。当引导结构域包含用于不同靶标的引导序列时,引导核酸可与两种不同靶标特异性结合;此处,该特异性结合可以同时进行或顺序进行。此外,接头结构域可被特定的酶切割,并在特定的酶的存在下,引导核酸可被分为两个或三个部分。

在本说明书的公开内容的一个实施方式中,引导核酸可为gRNA。

gRNA

“gRNA”指能够使gRNA-CRISPR酶复合体(即,CRISPR复合体)相对于靶基因或核酸特异性靶向的RNA。此外,gRNA指对靶基因或核酸而言特异的RNA,其可结合至CRISPR酶并将CRISPR酶引导至该靶基因或核酸。

gRNA可包含多个结构域。由于各结构域,相互作用可出现在三维结构或者gRNA链的活性形式中或者这些链之间。

gRNA可称为单链gRNA(单个RNA分子;单个gRNA;sgRNA)或者双链gRNA(包含多于一个RNA分子,通常为两个离散的RNA分子)。

在一个示例性实施方式中,单链gRNA从5′至3′方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、接头结构域、第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。

在另一实施方式中,双链gRNA可包含第一链和第二链;从5′至3′方向,所述第一链包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)以及第一互补结构域,所述第二链包含第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。

此处,第一链可指crRNA,且第二链可指tracrRNA。crRNA可包含引导结构域和第一互补结构域;并且tracrRNA可包含第二互补结构域、近端结构域和任选的尾部结构域。

在又一实施方式中,单链gRNA从3′至5′方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、和第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)。

此处,第一互补结构域可与天然第一互补结构域具有同源性,或可由天然第一互补结构域衍生而来。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的核苷酸序列中存在差异、可由天然存在的物种中含有的第一互补结构域衍生而来、或可与天然存在的物种中含有的第一互补结构域具有部分或完全同源性。

在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌(Streptococcus thermophilus)、金黄色葡萄球菌或脑膜炎奈瑟菌(Neisseriameningitides)的第一互补结构域或由它们衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性。

例如,当第一互补结构域是酿脓链球菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-GUUUUAGAGCUA-3′(SEQ ID NO:1)或与5′-GUUUUAGAGCUA-3(SEQ ID NO:1)具有部分(即至少50%以上)或完全同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)

在另一实例中,当第一互补结构域为空肠弯曲杆菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)或者与5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)具有部分(即至少50%以上)或完全同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)

在另一实施方式中,第一互补结构域可与如下菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性:俭菌总门细菌(Parcubacteria bacterium)(GWC2011_GWC2_44_17)、毛螺菌科细菌(Lachnospiraceaebacterium)(MC2017)、Butyrivibrio proteoclasiicus、异域菌门细菌(Peregrinibacteria bacterium)(GW2011_GWA_33_10)、氨基酸球菌属(Acidaminococcussp.)(BV3L6)、猕猴卟啉单胞菌(Porphyromonas macacae)、毛螺菌科细菌(ND2006)、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃菌(Prevotella disiens)、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体(Leptospirainadai)、毛螺菌科细菌(MA2020)、新凶手弗朗西斯菌(Francisella novicida)(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌(Eubacterium eligens)。

例如,当第一互补结构域是俭菌总门细菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-UUUGUAGAU-3′(SEQ ID NO:4)或与5′-UUUGUAGAU-3′(SEQ ID NO:4)具有部分(即至少50%以上)同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)

此处,接头结构域可为使得第一互补结构域与第二互补结构域连接的核苷酸序列。

接头结构域可分别与第一互补结构域和第二互补结构域形成共价结合或非共价结合。

接头结构域可将第一互补结构域与第二互补结构域共价或非共价连接。

接头结构域适合用于单链gRNA分子中,并可用于通过共价或非共价结合与双链gRNA的第一链和第二链连接或者连接第一链和第二链来产生单链gRNA。

接头结构域可用于通过共价或非共价结合与双链gRNA的crRNA和tracrRNA连接或者连接crRNA和tracrRNA来产生单链gRNA。

此处,第二互补结构域可与天然第二互补结构域具有同源性,或可由天然第二互补结构域衍生而来。此外,第二互补结构域可取决于天然存在的物种而在第二互补结构域的核苷酸序列中存在差异、可由天然存在的物种中含有的第二互补结构域衍生而来、或可与天然存在的物种中含有的第二互补结构域具有部分或完全同源性。

在示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或由它们衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性。

例如,当第二互补结构域是酿脓链球菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-

在另一实例中,当第二互补结构域是空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-

在另一实施方式中,第二互补结构域可与如下菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性:俭菌总门细菌(GWC2011_GWC2_44_17)、毛螺菌科细菌(MC2017)、Butyrivibrio proteoclasiicus、异域菌门细菌(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌科细菌(ND2006)、狗口腔卟啉单胞菌、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌科细菌(MA2020)、新凶手弗朗西斯菌(U112)、CandidatusMethanoplasma termitum或挑剔真杆菌。

例如,当第二互补结构域是俭菌总门细菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-AAAUU

此处,第一互补结构域和第二互补结构域可彼此互补地结合。

第一互补结构域和第二互补结构域可通过互补结合形成双链。

形成的双链可与CRISPR酶相互作用。

任选地,第一互补结构域可包含不互补结合至第二链的第二互补结构域的额外核苷酸序列。

此处,额外核苷酸序列可为1个-15个核苷酸的序列。例如,额外核苷酸序列可为1个-5个核苷酸、5个-10个核苷酸或10个-15个核苷酸的序列。

此处,近端结构域可为位于第二互补结构域的3′端方向的结构域。

近端结构域可与天然近端结构域具有同源性,或可由天然近端结构域衍生而来。此外,近端结构域可取决于天然存在的物种而在核苷酸序列中存在差异、可由天然存在的物种中含有的近端结构域衍生而来、或可与天然存在的物种中含有的近端结构域具有部分或完全同源性。

在示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或由它们衍生而来的近端结构域具有部分(即至少50%以上)或完全同源性。

例如,当近端结构域是酿脓链球菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)或与5′-AAGGCUAGUCCG-3′(SEQ IDNO:9)具有部分(即至少50%以上)同源性的核苷酸序列。此处,近端结构域可进一步包含(X)

在又一实施方式中,当近端结构域是空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5′-AAAGAGUUUGC-3′(SEQ ID NO:10)或与5′-AAAGAGUUUGC-3′(SEQ ID NO:10)具有至少50%以上同源性的核苷酸序列。此处,近端结构域可进一步包含(X)

此处,尾部结构域为能够被选择性地添加至单链gRNA的3′端或双链gRNA的第一链或第二链的结构域。

尾部结构域可与天然尾部结构域具有同源性,或可由天然尾部结构域衍生而来。此外,尾部结构域可取决于天然存在的物种而在核苷酸序列中存在差异、可由天然存在的物种中含有的尾部结构域衍生而来、或可与天然存在的物种中含有的尾部结构域具有部分或完全同源性。

在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域或由它们衍生而来的尾部结构域具有部分(即至少50%以上)或完全同源性。

例如,当尾部结构域是酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)或与5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)具有部分(即至少50%以上)同源性的核苷酸序列。此处,尾部结构域可进一步包含(X)

在另一实例中,当尾部结构域是空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ IDNO:12)或与5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ ID NO:12)具有部分(即至少50%以上)同源性的核苷酸序列。此处,尾部结构域可进一步包含(X)

在另一实施方式中,尾部结构域可在3′端包含参与体外或体内转录方法的1nt-10nt的序列。

例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。

gRNA可包含上文所述的多个结构域,并因此可根据gRNA中含有的结构域来调整核酸序列的长度;并且由于各结构域,相互作用可出现在三维结构或者gRNA的活性形式的链中或者这些链之间。

gRNA可指单链gRNA(单个RNA分子)或者双链gRNA(包含多于一个RNA分子,通常为两个离散的RNA分子)。

双链gRNA

双链gRNA由第一链和第二链组成。

此处,第一链可由

5′-[引导结构域]-[第一互补结构域]-3′组成;以及

第二链可由

5′-[第二互补结构域]-[近端结构域]-3′或者

5′-[第二互补结构域]-[近端结构域]-[尾部结构域]-3′组成。

此处,第一链可以指crRNA,第二链可以指tracrRNA。

此处,第一链和第二链可任选地包含额外核苷酸序列。

在一个实施方式中,第一链可为

5′-(N

5′-(X)

此处,N

此处,(Q)

例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由酿脓链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由空肠弯曲杆菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由嗜热链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

此外,(X)

在一个示例性实施方式中,第二链可为5′-(Z)

在另一实施方式中,第二链可为5′-(Z)

此处,(Z)

例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由酿脓链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

(P)

例如,当近端结构域与酿脓链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

(F)

例如,当尾部结构域与酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

在又一实施方式中,当尾部结构域与嗜热链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

此外,(F)

例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。

此外,(X)

单链gRNA

单链gRNA可分为第一单链gRNA和第二单链gRNA。

第一单链gRNA

第一单链gRNA为其中通过接头结构域使得双链gRNA的第一链和第二链连接的单链gRNA。

具体而言,单链gRNA可由如下组成:

5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-3′,

5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3′,或

5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3′。

第一单链gRNA可选择性地包含额外核苷酸序列。

在一个示例性实施方式中,第一单链gRNA可为

5′-(N

5′-(N

5′-(N

在另一实施方式中,第一单链gRNA可为

5′-(X)

5′-(X)

5′-(X)

此处,N

(Q)

例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

此外,(L)

(Z)

例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

(P)

例如,当近端结构域与酿脓链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)

(F)

例如,当尾部结构域与酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

在又一实例中,当尾部结构域与嗜热链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)

此外,(F)

例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。

此外,(X)

第二单链gRNA

第二单链gRNA可为由引导结构域、第一互补结构域和第二互补结构域组成的单链gRNA。

此处,第二单链gRNA可由如下组成:

5′-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3′;或者

5′-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3′。

第二单链gRNA可任选地包含额外核苷酸序列。

在一个示例性实施方式中,第二单链gRNA可为

5′-(Z)

5′-(X)

在另一实施方式中,单链gRNA可为

5′-(Z)

5′-(X)

此处,N

(Q)

例如,当第一互补结构域与俭菌总门细菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)

(Z)

例如,当第二互补结构域与俭菌总门细菌的第二互补结构域或由俭菌总门细菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)

此外,(L)

此外,(X)

在本说明书的公开内容的一个方面,引导核酸可为能够与凝血抑制基因的靶序列互补结合的gRNA。

术语“凝血抑制基因”是指直接参与抑制凝血或血凝块形成或使凝血系统失活、或具有抑制凝血或血凝块形成或使凝血系统失活的间接作用的所有类型的基因。在这种情况下,由于凝血抑制基因本身或由该凝血抑制基因表达的蛋白质,凝血抑制基因可发挥功能以抑制或阻抑与凝血系统有关的各种基因或各种蛋白质的活性,并发挥功能以直接抑制凝血。术语“凝血系统”是指在体内发生的凝血的整个过程。在这种情况下,凝血系统包括所有类型的正常凝血系统和凝血被延迟的异常凝血系统。由凝血抑制基因表达的蛋白质可以与术语“凝血抑制因子”或“抗凝因子”互换使用。

凝血抑制基因可抑制或阻抑凝血。

凝血抑制基因可抑制或阻抑凝血相关蛋白的表达。

凝血抑制基因可抑制或阻抑凝血相关蛋白的活性。

在这种情况下,凝血相关蛋白可包括因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。

凝血抑制基因可为抗凝血酶(AT)基因。

AT基因是指编码由432个氨基酸组成、可使凝血系统中的各种酶失活的蛋白质的基因,也被称为SERPINC1基因。作为一个实例,AT基因可以包括选自于由以下所组成的组中的一种或多种,但是本发明不限于此:编码人AT(例如NCBI登录号NP_000479等)的基因,例如由NCBI登录号NM_000488等表示的AT基因。

凝血抑制基因可为组织因子途径抑制剂(TFPI)基因。

TFPI基因是指编码能够可逆地抑制因子Xa的蛋白质的基因(全长DNA、cDNA或mRNA)。对于人类而言,TFPI基因位于染色体2q31-q32.1上,并具有9个外显子。作为一个实例,TFPI基因可包括选自以下所组成的组中的一种或多种,但本发明不限于此:编码人TFPI(例如,NCBI登录号NP_001027452、NP_001305870、NP_001316168、NP_001316169、NP_001316170等)的基因,例如由NCBI登录号NM_001032281、NM_006287、NM_001318941、NM_001329239、NM_001329240等表示的TFPI基因。

凝血抑制基因可由哺乳动物衍生而来,所述哺乳动物包括灵长类动物(如人、猴等)、啮齿动物(如大鼠、小鼠等)。

遗传信息可以从诸如NCBI(美国国家生物技术信息中心)的GenBank的已知数据库获得。

在本说明书中的公开内容的一个实施方式中,引导核酸可为靶向AT基因和/或TFP1基因的靶序列的gRNA。

“靶序列”是靶基因或核酸中存在的核苷酸序列,并且具体而言,是靶基因或核酸中的靶区域的部分核苷酸序列;并且此处,“靶区域”是靶基因或核酸中可被引导核酸-编辑蛋白修饰的区域。

在下文中,靶序列可用于指两种类型的核苷酸序列信息。例如,在靶基因的情况下,靶序列可指靶基因DNA的转录链的核苷酸序列信息,或非转录链的核苷酸序列信息。

例如,靶序列可指靶基因A的靶区域中的部分核苷酸序列(转录链),即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17),或者与其互补的核苷酸序列(非转录链),即5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)。

靶序列可为5nt-50nt的序列。

在一个示例性实施方式中,靶序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。

靶序列包含引导核酸结合序列或引导核酸非结合序列。

“引导核酸结合序列”是与包含在引导核酸的引导结构域中的引导序列具有部分或完全互补性的核苷酸序列,并且可与包含在引导核酸的引导结构域中的引导序列互补结合。靶序列和引导核酸结合序列为可根据靶基因或核酸(即,待遗传操纵或编辑的对象)而改变的核苷酸序列,并且可根据靶基因或核酸进行多种设计。

“引导核酸非结合序列”是与包含在引导核酸的引导结构域中的引导序列具有部分或完全同源性的核苷酸序列,并且可不与包含在引导核酸的引导结构域中的引导序列互补结合。此外,引导核酸非结合序列可为与引导核酸结合序列具有互补性的核苷酸序列,并且可与引导核酸结合序列互补结合。

引导核酸结合序列可为靶序列的部分核苷酸序列,并且靶序列为具有彼此不同的序列顺序的两个核苷酸序列中的一个核苷酸序列,即引导核酸结合序列可为能够彼此互补结合的两个核苷酸序列之一。此处,引导核酸非结合序列可为与靶序列的引导核酸结合序列不同的核苷酸序列。

例如,在靶基因A的靶区域中,当将靶序列设计为部分核苷酸序列,即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17),以及其互补的核苷酸序列,即5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18),引导核酸结合序列可为两个靶序列之一,即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)或5′-CGAACTAGTCTGCCAATGAT-3′(SEQ IDNO:18)。此处,当引导核酸结合序列为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)时,引导核酸非结合序列可为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18);或当引导核酸结合序列为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)时,引导核酸非结合序列可为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)。

引导核酸结合序列可为靶序列之一,即与转录链相同的核苷酸序列以及与非转录链相同的核苷酸序列。此处,引导核酸非结合序列可为与靶序列的引导核酸结合序列不同的核苷酸序列。它可为不同于与转录链或非转录链相同的核苷酸序列的核苷酸序列

引导核酸结合序列可具有与靶序列相同的长度。

引导核酸非结合序列可具有与靶序列或引导核酸结合序列相同的长度。

引导核酸结合序列可为5nt-50nt的序列。

在一个示例性实施方式中,引导核酸结合序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。

引导核酸非结合序列可为5nt-50nt的序列。

在一个示例性实施方式中,引导核酸非结合序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。

引导核酸结合序列可部分或完全互补结合至引导核酸的引导结构域中包含的引导序列,并且引导核酸结合序列的长度可与引导序列的长度相同。

引导核酸结合序列可为与引导核酸的引导结构域中包含的引导序列互补的核苷酸序列,并且例如具有至少70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。

作为实例,引导核酸结合序列可具有或包含不与引导核酸的引导结构域中包含的引导序列互补的1nt-8nt的序列。

引导核酸非结合序列可与引导核酸的引导结构域中包含的引导序列具有部分或完全同源性,并且引导核酸非结合序列的长度可与引导序列的长度相同。

引导核酸非结合序列可为与引导核酸的引导结构域中包含的引导序列具有同源性的核苷酸序列,并且例如具有至少70%、75%、80%、85%、90%、95%或更高的同源性或完全同源性的核苷酸序列。

在一个实例中,引导核酸非结合序列可具有或包含不与引导核酸的引导结构域中包含的引导序列同源的1nt-8nt的序列。

引导核酸非结合序列可与引导核酸结合序列互补结合,并且引导核酸非结合序列可具有与引导核酸结合序列相同的长度。

引导核酸非结合序列可为与引导核酸结合序列互补的核苷酸序列,并且例如具有至少90%、95%或更高的互补性或完全互补性的核苷酸序列。

在一个实例中,引导核酸非结合序列可具有或包含不与引导核酸结合序列互补的1nt-2nt的序列。

此外,引导核酸结合序列可为位于被编辑蛋白识别的核苷酸序列附近的核苷酸序列。

在一个实例中,引导核酸结合序列可为临近被编辑蛋白识别的核苷酸序列的5′端和/或3′端定位的连续的5nt-50nt的序列。

此外,引导核酸非结合序列可为位于被编辑蛋白识别的核苷酸序列附近的核苷酸序列。

在一个实例中,引导核酸非结合序列可为临近被编辑蛋白识别的核苷酸序列的5′端和/或3′端定位的5nt-50nt的连续序列。

“靶向”指与靶基因或核酸中存在的靶序列的引导核酸结合序列互补结合。此处,互补结合可为100%完全互补结合,或70%以上且小于100%的不完全互补结合。因此,“靶向gRNA”是指与靶基因或核酸中存在的靶序列的引导核酸结合序列互补结合的gRNA。

本说明书中公开的靶基因可为凝血抑制基因。

本说明书中公开的靶基因可为AT基因和/或TFPI基因。

在一个实施方式中,本说明书中公开的靶序列可为位于凝血抑制基因的启动子区域中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的启动子区域中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的启动子区域中的10个-25个连续的核苷酸序列。

本说明书中公开的靶序列可为位于凝血抑制基因的内含子区域中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的内含子区域中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的内含子区域中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为位于凝血抑制基因的外显子区域中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的外显子区域中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的外显子区域中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为位于凝血抑制基因的增强子区域中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的增强子区域中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的增强子区域中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为位于凝血抑制基因的编码区、非编码区或混合区中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的编码区、非编码区或混合区中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的编码区、非编码区或混合区中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为位于凝血抑制基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的启动子、增强子、3’UTR,多聚A区或混合区中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为位于凝血抑制基因的外显子、内含子或混合区中的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为位于AT基因的外显子、内含子或混合区中的10nt-25-nt的连续序列。

在另一实例中,靶序列可为位于TFPI基因的外显子、内含子或混合区中的10nt-25nt的连续序列。

本说明书中公开的靶序列可为包含或临近凝血抑制基因的突变部分(例如,不同于野生型基因的部分)的10nt-35nt的连续序列。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为包含或临近AT基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列。

在另一实例中,靶序列可为包含或临近TFPI基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列。

在本说明书中公开的靶序列可为临近凝血抑制基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-35nt的连续序列。

“前间区序列邻近基序(PAM)序列”是可被编辑蛋白识别的核苷酸序列。此处,根据编辑蛋白的类型和编辑蛋白来源物种,PAM序列可具有不同的核苷酸序列。

此处,PAM序列可为例如如下序列中的一种或多种(以5′至3′方向来描述):

NGG(N为A、T、C或G);

NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T);

NNAGAAW(N各自独立地为A、T、C或G;并且W为A或T);

NNNNGATT(N各自独立地为A、T、C或G);

NNGRR(T)(N各自独立地为A、T、C或G;并且R为A或G);以及

TTN(N为A、T、C或G)。

此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。

或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。

在一个实例中,靶序列可为临近AT基因的核酸序列中的PAM序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实例中,靶序列可为临近TFPI基因的核酸序列中的PAM序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

在一个实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。

下文中,表1和表2中列出了可用于本说明书中公开的示例性实施方式中的靶序列的实例。表1和表2中公开的靶序列为引导核酸非结合序列及其互补序列,即可从表中列出的序列预测引导核酸结合序列。此外,表1和表2中示出的靶标名称根据编辑蛋白命名,对于SpCas9命名为Sp,对于SaCas9命名为Sa,对于CjCas9命名为Cj。

表1 SERPINC1基因(AT基因)的靶序列

表2 TFPI基因的靶序列

作为本说明书中的公开内容的一个实施方式,引导核酸可为包含与AT基因和/或TFPI基因的靶序列互补结合的引导序列的gRNA。

“引导序列”是与靶基因或核酸的双链的任一链的部分序列互补的核苷酸序列。此处,引导序列可为具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。

引导序列可以是10个至25个核苷酸的序列。

在一个实例中,引导序列可为10个至25个、15个至25个、或20个至25个核苷酸的序列。

在另一实例中,引导序列可为10个至15个、15个至20个、或20个至25个核苷酸的序列。

本说明书中公开的靶基因可为凝血抑制基因。

本说明书中公开的靶基因可为AT基因(SERPINC1基因)和/或TFPI基因。

引导序列能够与靶序列形成互补结合。

靶序列可为引导核酸结合序列。

“引导核酸结合序列”是与包含在引导核酸的引导结构域中的引导序列具有互补性的核苷酸序列,并且可与包含在引导核酸的引导结构域中的引导序列互补结合。靶序列和引导核酸结合序列为可根据靶基因或核酸(即,待遗传操纵或编辑的对象)而改变的核苷酸序列,并且可根据靶基因或核酸以各种方式进行设计。

与靶序列和引导核酸结合序列有关的描述与上述相同。

引导核酸结合序列可具有与引导序列相同的长度。

引导核酸结合序列可具有比引导序列更短的长度。

引导核酸结合序列可具有比引导序列更长的长度。

引导序列可为与引导核酸结合序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。

在一个实例中,引导序列可具有或包含与引导核酸结合序列不互补的1个至8个核苷酸的序列。

在一个实施方式中,本说明书中公开的引导序列可以与位于凝血抑制基因的启动子区域中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的启动子区域中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与位于TFPI基因的启动子区域中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与位于凝血抑制基因的内含子区域中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的内含子区域中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与位于TFPI基因的内含子区域中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与位于凝血抑制基因的外显子区域中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的外显子区域中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与位于TFPI基因的外显子区域中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与位于凝血抑制基因的增强子区域中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的增强子区域中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与位于TFPI基因的增强子区域中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与位于凝血抑制基因的编码区、非编码区或混合区中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的编码区、非编码区或混合区中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与位于TFPI基因的编码区、非编码区或混合区中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与位于凝血抑制基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可以与位于AT基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可以与位于TFPI基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可以与位于凝血抑制基因的外显子、内含子或混合区中的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与位于AT基因的外显子、内含子或混合区中的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可以与位于TFPI基因的外显子、内含子或混合区中的10nt-25nt的连续序列形成互补结合。

本说明书中公开的引导序列可与包含或临近凝血抑制基因的突变部分(例如,不同于野生型基因的部分)的10nt-35nt的连续序列形成互补结合。

在一个实例中,引导序列可与包含或临近AT基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与包含或临近TFPI基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列形成互补结合。

在本说明书中公开的引导序列可与临近凝血抑制基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-35nt的连续序列形成互补结合。

“前间区序列邻近基序(PAM)序列”是可被编辑蛋白识别的核苷酸序列。此处,根据编辑蛋白的类型和编辑蛋白来源物种,PAM序列可具有不同的核苷酸序列。

此处,PAM序列可为例如如下序列中的一种或多种(以5′至3′方向描述):

NGG(N为A、T、C或G);

NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T);

NNAGAAW(N各自独立地为A、T、C或G;并且W为A或T);

NNNNGATT(N各自独立地为A、T、C或G);

NNGRR(T)(N各自独立地为A、T、C或G;并且R为A或G);以及

TTN(N为A、T、C或G)。

在一个实例中,引导序列可与临近AT基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一实例中,引导序列可与临近TFPI基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。

下文中,表3和表4中列出了可用于本说明书中公开的示例性实施方式中的引导序列的实例。表3和表4中公开的引导序列为能够靶向AT基因(SERPINC1基因)或TFPI基因的引导序列,并且可与位于AT基因(SERPINC1基因)或TFPI基因中的靶序列形成互补结合。表3和表4中公开的引导序列为分别能够靶向表1和表2的靶序列的引导序列。此外,表3和表4中示出的靶标名称根据编辑蛋白命名,对于SpCas9命名为Sp,对于SaCas9命名为Sa,对于CjCas9命名为Cj。

表3能够靶向SERPINC1基因(AT基因)的引导序列

表4能够靶向TFPI基因的引导序列

本说明书的公开内容的一个方面涉及用于基因操纵的组合物,以人工操纵凝血抑制基因。

用于基因操纵的组合物可用于生成经人工操纵的凝血抑制基因。此外,由用于基因操纵的组合物人工操纵的凝血抑制基因可以调节凝血系统。

“经人工操纵(经人工修饰或经工程化或经人工工程化)”是指经人工修饰的状态,而不是以自然发生状态存在。下文中,可以将非天然的经人工操纵或修饰的凝血抑制基因与人工凝血抑制基因互换使用。

可以考虑基因表达调节过程进行基因操纵。

在一个实施方式中,可以通过选择适合于转录调节、RNA加工调节、RNA转运调节、RNA切割调节、翻译调节或蛋白质修饰调节的每个步骤的操纵工具来实现基因操纵。

例如,可以使用RNAi(RNA干扰或RNA沉默)控制遗传信息的表达,以允许小RNA(sRNA)来干扰mRNA或降低mRNA的稳定性,并任选地破坏mRNA,从而防止其提供蛋白质合成信息。

在一个实施方式中,可以使用野生型或变体酶进行基因操纵,所述酶可以催化DNA或RNA分子(优选DNA分子)中的核苷酸之间的键的水解(裂解)。可以使用引导核酸-编辑蛋白复合体。

例如,可以通过使用选自于由大范围核酸酶、锌指核酸酶、CRISPR/Cas9(Cas9蛋白)、CRISPR-Cpf1(Cpf1蛋白)和TALE核酸酶所组成的组中的一种或多种核酸酶操纵基因来控制遗传信息的表达。

本说明书中公开的用于基因操纵的组合物可以包括引导核酸和编辑蛋白。

在一个实施方式中,用于基因操纵的组合物可包括:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及

(b)一种或多种编辑蛋白或编码所述编辑蛋白的核酸序列。

与凝血抑制基因有关的描述与上述相同。

与靶序列有关的描述与上述相同。

在另一实施方式中,用于基因操纵的组合物可以包括:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及

(b)一种或多种编辑蛋白或编码所述编辑蛋白的核酸序列。

与凝血抑制基因有关的描述与上述相同。

与靶序列有关的描述与上述相同。

与引导序列有关的描述与上述相同。

用于基因操纵的组合物可以包括引导核酸-编辑蛋白复合体。

术语“引导核酸-编辑蛋白复合体”是指通过引导核酸与编辑蛋白之间的相互作用形成的复合体。

与引导核酸有关的描述如上所述。

术语“编辑蛋白”指能够与核酸直接结合或无需直接结合而与核酸相互作用的肽、多肽或蛋白。

此处,核酸可为靶核酸、基因或染色体中含有的核酸。

此处,核酸可为引导核酸。

编辑蛋白可为酶。

此处,术语“酶”是指含有能够切割核酸、基因或染色体的结构域的多肽或蛋白。

酶可为核酸酶或限制性酶。

编辑蛋白可包括完全活性的酶。

此处,“完全活性的酶”是指具有与野生型酶的核酸、基因或染色体切割功能相同的功能的酶。例如,切割双链DNA的野生型酶可为将双链DNA全部切割的完全活性的酶。作为另一实例,当切割双链DNA的野生型酶由于人工工程化而经历氨基酸序列的部分序列的删除或置换时,经人工工程化的酶变体与野生型酶一样切割双链DNA,该经人工工程化的酶变体可为完全活性的酶。

此外,完全活性的酶可包括与野生型酶相比具有改善的功能的酶。例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式可具有高于野生型酶的完全的酶活性,即增加的切割双链DNA的活性。

编辑蛋白可包括不完全或部分活性的酶。

此处,“不完全或部分活性的酶”是指具有野生型酶的核酸、基因或染色体切割功能的一些的酶。例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式可为具有第一功能的形式或具有第二功能的形式。此处,第一功能为切割双链DNA的第一链的功能,并且第二功能可为切割双链DNA的第二链的功能。此处,具有第一功能的酶或具有第二功能的酶可为不完全或部分活性的酶。

编辑蛋白可包括失活的酶。

此处,“失活的酶”是指其中野生型酶的核酸、基因或染色体切割功能完全失活的酶。例如,野生型酶的特定修饰或经操纵的形式可为同时丧失第一功能和第二功能的形式,即切割双链DNA的第一链的第一功能和切割其第二链的第二功能均丧失。此处,第一功能和第二功能均丧失的酶可为失活的酶。

编辑蛋白可为融合蛋白。

此处,术语“融合蛋白”是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。

所述额外的结构域、肽、多肽或蛋白可具有与所述酶中包含的功能结构域、肽、多肽或蛋白相同或不同的功能。

融合蛋白可为以下形式,其中,将功能结构域、肽、多肽或蛋白添加至酶的氨基末端或其附近、酶的羧基末端或其附近、酶的中间部分或它们的组合中的一个或多个处。

此处,功能结构域、肽、多肽或蛋白可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域、肽、多肽或蛋白,或者为用于纯化和分离蛋白(包括肽)的标签或报告基因,但本发明不限于此。

功能结构域、肽、多肽或蛋白可为脱氨酶。

标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。

此外,功能结构域、肽、多肽或蛋白可为核定位序列或信号(NLS)或者核输出序列或信号(nuclear export sequence or signal,NES)。

NLS可为:具有氨基酸序列PKKKRKV(SEQ ID NO:831)的SV40病毒大T抗原的NLS;由核质蛋白衍生而来的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:832)的核质蛋白双分型(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:833)或RORRNELKRSP(SEQ ID NO:834)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:835)的hRNPA1 M9 NLS;由输入蛋白α(importin-α)衍生而来的IBB结构域序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:836);肌瘤T蛋白序列VSRKRPRP(SEQ ID NO:837)和PPKKARED(SEQ ID NO:838);人p53序列PQPKKKPL(SEQ IDNO:839);小鼠c-ab1 IV序列SALIKKKKKMAP(SEQ ID NO:840);流感病毒NS1序列DRLRR(SEQID NO:841)和PKQKKRK(SEQ ID NO:842);肝炎病毒δ抗原序列RKLKKKIKKL(SEQ ID NO:843);小鼠Mx1蛋白序列REKKKFLKRR(SEQ ID NO:844);人多聚(ADP-核糖)聚合酶序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:845);或者类固醇激素受体(人)糖皮质激素序列RKCLQAGMNLEARKTKK(SEQ ID NO:846),但本发明不限于此。

额外的结构域、肽、多肽或蛋白可为不执行特定功能的非功能结构域、肽、多肽或蛋白。此处,非功能结构域、肽、多肽或蛋白可为不影响酶功能的结构域、肽、多肽或蛋白。

融合蛋白可为以下形式,其中,将非功能结构域、肽、多肽或蛋白添加至酶的氨基末端或其附近、酶的羧基末端或其附近、酶的中间部分或它们的组合中的一个或多个处。

编辑蛋白可为天然存在的野生型酶或融合蛋白。

编辑蛋白可为部分修饰的酶或融合蛋白的形式。

编辑蛋白可为在天然状态下不存在的人工产生的酶或融合蛋白。

编辑蛋白可为在天然状态下不存在的部分修饰的人工酶或融合蛋白的形式。

此处,修饰可为对编辑蛋白中含有的氨基酸进行置换、去除、添加或其组合。

或者,修饰可为对编码编辑蛋白的核苷酸序列中的一些核苷酸进行置换、去除、添加或其组合。

此外,任选地,用于基因操纵的组合物可进一步包含具有待插入的期望的特定核苷酸序列的供体(donor),或编码所述供体的核酸序列。

此处,待插入的核酸序列可为凝血抑制基因的部分核苷酸序列。

此处,待插入的核酸序列可为用于引入至待操纵的凝血抑制基因中并用于修正该凝血抑制基因的突变的核酸序列。

术语“供体”是指有助于经破坏的基因或核酸的基于同源重组(HR)的修复的核苷酸序列。

供体可为双链核酸或单链核酸。

供体可以线性或环状存在。

供体可包含与靶基因或核酸具有同源性的核苷酸序列。

例如,供体可包含与特定核苷酸序列所插入的位置(经破坏的核酸存在于其中)的上游(左侧)和下游(右侧)的各核苷酸序列具有同源性的核苷酸序列。此处,待插入的特定核苷酸序列可位于与经破坏生物核酸的左侧核苷酸序列具有同源性的核苷酸序列和与经破坏的核酸的右侧核苷酸序列具有同源性的核苷酸序列之间。此处,具有同源性的核苷酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全同源性。

供体可选择性地包含额外核苷酸序列。此处,额外核酸序列可在增强供体的稳定性、插入靶标中的效率或同源重组效率中发挥作用。

例如,额外的核苷酸序列可为富含核苷酸A和T的核酸序列(即富A-T结构域)。例如,额外的核苷酸序列可为支架/基质附着区(SMAR)。

可以以多种方式将本说明书公开的引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或导入受试者中。

此处,术语“受试者”是指导入引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体,其中运行(operates)引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或获取自所述有机体的试样或样本。

受试者可为包含引导核酸-编辑蛋白复合体的靶基因或染色体的有机体。

有机体可为动物、动物组织或动物细胞。

有机体可为人、人组织或人细胞。

组织可为眼球、皮肤、肝、肾、心脏、肺、脑、肌肉组织或血液。

细胞可为肝脏细胞、免疫细胞、血细胞或干细胞。

试样或样本可从包含靶基因或染色体的有机体获取,例如唾液、血液、肝组织、脑组织、肝脏细胞、神经细胞、吞噬细胞、巨噬细胞、T细胞、B细胞、星形胶质细胞、癌细胞或干细胞等。

优选地,受试者可为包含凝血抑制基因的有机体。

可以以DNA、RNA的形式或其混合形式将引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或导入受试者中。

此处,可通过本领域已知的方法将编码引导核酸和/或编辑蛋白的DNA、RNA的形式或其混合形式递送入或导入受试者中。

或者,可通过载体、非载体或它们的组合将编码引导核酸和/或编辑蛋白的DNA、RNA的形式或其混合形式递送入或导入受试者中。

载体可为病毒载体或非病毒载体(例如质粒)。

非载体可为裸DNA、DNA复合体或mRNA。

在一个实施方式中,可通过载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者中。

载体可包含编码引导核酸和/或编辑蛋白的核酸序列。

在一个实例中,载体可同时包含编码引导核酸和编辑蛋白的核酸序列。

在另一实例中,载体可包含编码引导核酸的核酸序列。

作为实例,引导核酸中包含的结构域可全部包含于一个载体中,或可将其分割并随后包含于不同载体中。

在另一实例中,载体可包含编码编辑蛋白的核酸序列。

作为实例,在编辑蛋白的情况下,编码编辑蛋白的核酸序列可包含于一个载体中,或可将其分割并随后包含于数个载体中。

载体可含有一种或多种调节/调控成分。

此处,调节/调控成分可包括启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。

启动子可为由RNA聚合酶II识别的启动子。

启动子可为由RNA聚合酶III识别的启动子。

启动子可为诱导型启动子。

启动子可为受试者特异性启动子。

启动子可为病毒或非病毒启动子。

就启动子而言,可根据控制区(即,编码引导核酸或编辑蛋白的核酸序列)而使用适当的启动子。

例如,用于引导核酸的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于编辑蛋白的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。

载体可为病毒载体或重组病毒载体。

病毒可为DNA病毒或RNA病毒。

此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。

此处,RNA病毒可为单链RNA(ssRNA)病毒。

病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。

一般说来,病毒可感染宿主(例如细胞),由此将编码病毒遗传信息的核酸导入宿主中或将编码遗传信息的核酸插入宿主基因组中。可使用具有此类特征的病毒将引导核酸和/或编辑蛋白导入受试者中。使用病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中瞬时表达。或者,使用病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中长时间持续表达(例如1、2、3周,1、2、3、6、9个月,1、2年,或永久)。

根据病毒的类型,病毒的包装能力可在至少2kb至50kb间变化。取决于此类包装能力,可设计包含引导核酸或编辑蛋白的病毒载体或者包含引导核酸和编辑蛋白二者的病毒载体。或者,可设计包含引导核酸、编辑蛋白和额外成分的病毒载体。

在一个实例中,可通过重组慢病毒对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。

在另一实例中,可通过重组腺病毒对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。

在又一实例中,可通过重组AAV对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。

在又一实例中,可通过杂合病毒(例如本文列出的病毒的一种或多种的杂合)对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。

在另一实施方式中,可通过非载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者中。

非载体可包含编码引导核酸和/或编辑蛋白的核酸序列。

非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。

可通过电穿孔、基因枪、声致穿孔(sonoporation)、磁性转染、瞬时细胞压缩或挤压(transient cell compression or squeezing)(例如在文献“Lee等(2012)Nano Lett.,12,6322-6327”中所记载的)、脂质介导的转染、树枝状大分子、纳米粒子、磷酸钙、二氧化硅、硅酸盐(Ormosil)或它们的组合将非载体递送入或导入受试者中。

在一个实例中,可通过将细胞与编码引导核酸和/或编辑蛋白的核酸序列在卡盒(cartridge)、腔室(chamber)或比色皿(cuvette)中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。

在另一实例中,可使用纳米粒子递送非载体。纳米粒子可为无机纳米粒子(例如磁性纳米粒子、二氧化硅等)或有机纳米粒子(例如聚乙二醇(PEG)包覆的脂质等)。纳米粒子的外表面可缀合有可附着的带正电的聚合物(例如聚乙烯亚胺、聚赖氨酸、聚丝氨酸等)。

在某些实施方式中,可使用脂质壳递送非载体。

在某些实施方式中,可使用外泌体(exosome)递送非载体。外泌体是用于转移蛋白和RNA的内源性纳米囊泡,可将RNA递送至脑和另一靶器官。

在某些实施方式中,可使用脂质体递送非载体。脂质体为球形囊泡结构,由围绕内部水性区室的单个或多个层状脂质双层以及相对不透明的外部亲脂磷脂双层组成。尽管脂质体可由数种不同类型的脂质制成,最常使用磷脂来生产作为药物运载体的脂质体。

此外,用于非载体递送的组合物可包含其它添加剂。

可将编辑蛋白以肽、多肽或蛋白的形式递送入或导入受试者中。

可通过本领域已知的方法以肽、多肽或蛋白的形式将编辑蛋白递送入或导入受试者中。

可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所记载的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将肽、多肽或蛋白形式递送入或导入受试者中。

肽、多肽或蛋白可与编码引导核酸的核酸序列一起递送。

在一个实例中,可通过将待导入编辑蛋白的细胞与引导核酸或不与引导核酸在卡盒、腔室或比色皿中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。

可将引导核酸和编辑蛋白以核酸和蛋白混合的形式递送入或导入受试者中。

可以以引导核酸-编辑蛋白复合体的形式将引导核酸和编辑蛋白递送入或导入受试者中。

例如,引导核酸可为DNA、RNA或其混合物。编辑蛋白可为肽、多肽或蛋白。

在一个实例中,可以以包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体(即核糖核蛋白(RNP))的形式将引导核酸和编辑蛋白递送入或导入受试者中。

本说明书公开的引导核酸-编辑蛋白复合体可对靶核酸、基因或染色体进行修饰。

例如,引导核酸-编辑蛋白复合体诱导靶核酸、基因或染色体的序列的修饰。作为结果,可对由靶核酸、基因或染色体表达的蛋白在结构和/或功能上进行修饰,或可调控或抑制该蛋白的表达。

引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。

在一个实例中,引导核酸-编辑蛋白复合体可操纵或修饰靶基因,来对靶基因编码的蛋白的表达进行调控(例如抑制、阻遏、降低、增加或促进)、或表达其活性受到调控(例如抑制、阻遏、降低、增加或促进)或修饰的蛋白。

引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。

在一个实例中,引导核酸-编辑蛋白复合体可促进或抑制靶基因的转录,从而调控(例如抑制、阻遏、降低、增加或促进)靶基因编码的蛋白的表达。

在另一实例中,引导核酸-编辑蛋白复合体可促进或抑制靶基因的翻译,从而调控(例如抑制、阻遏、降低、增加或促进)靶基因编码的蛋白的表达。

在本说明书的公开内容的一个实施方式中,用于基因操纵的组合物可包含gRNA和CRISPR酶。

在一个实施方式中,用于基因操纵的组合物可包含:

(a)gRNA或编码所述gRNA的核酸序列,所述gRNA能够靶向凝血抑制基因的靶序列;以及

(b)一种或多种CRISPR酶或编码所述CRISPR酶的核酸序列。

与凝血抑制基因有关的描述与上述相同。

与靶序列有关的描述与上述相同。

在另一实施方式中,用于基因操纵的组合物可以包括:

(a)gRNA或编码所述gRNA的核酸序列,所述gRNA包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及

(b)一种或多种CRISPR酶或编码所述CRISPR酶的核酸序列。

与凝血抑制基因有关的描述与上述相同。

与靶序列有关的描述与上述相同。

与引导序列有关的描述与上述相同。

用于基因操纵的组合物可包含gRNA-CRISPR酶复合体。

术语“gRNA-CRISPR酶复合体”是指由gRNA和CRISPR酶之间的相互作用形成的复合体。

与gRNA有关的描述如上所述。

术语“CRISPR酶”是CRISPR-Cas系统的主要蛋白组分,并且与gRNA形成复合体,从而形成CRISPR-Cas系统。

CRISPR酶可为具有编码CRISPR酶的序列的核酸或多肽(或蛋白)。

CRISPR酶可为II型CRISPR酶。

根据对两种以上类型的天然微生物II型CRISPR酶分子的研究(Jinek等,Science,343(6176):1247997,2014)以及对酿脓链球菌Cas9(SpCas9)与gRNA复合的研究(Nishimasu等,Cell,156:935-949,2014;和Anders等,Nature,2014,doi:10.1038/nature13579),确定了II型CRISPR酶的晶体结构。

II型CRISPR酶包含两个叶(lobes),即识别(REC)叶和核酸酶(NUC)叶,并且各叶包含数个结构域。

REC叶包含富含精氨酸的桥螺旋(BH)结构域、REC1结构域和REC2结构域。

此处,BH结构域为长的α螺旋和富含精氨酸的区域,而REC1结构域和REC2结构域在识别gRNA(例如单链gRNA、双链gRNA或tracrRNA)中形成的双链中起重要作用。

NUC叶包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。此处,RuvC结构域涵盖RuvC样结构域,并且HNH结构域涵盖HNH样结构域。

此处,RuvC结构域与包含II型CRISPR酶的天然存在的微生物家族的成员共享结构相似性,并切割单链(例如靶基因或核酸的非互补链,即不与gRNA形成互补结合的链)。在本领域中,RuvC结构域有时指RuvCI结构域、RuvCII结构域或RuvCIII结构域,并且一般称为RuvCI、RuvCII或RuvCIII。

HNH结构域与HNH核酸内切酶共享结构相似性,并切割单链(例如靶核酸分子的互补链,即与gRNA形成互补结合的链)。HNH结构域位于RuvCII和RuvCIII基序之间。

PI结构域识别靶基因或核酸中的特定核苷酸序列(即前间区序列邻近基序(PAM))或与PAM相互作用。此处,PAM可根据II型CRISPR酶的来源而变化。例如,当CRISPR酶是SpCas9时,PAM可为5′-NGG-3′;当CRISPR酶是嗜热链球菌Cas9(StCas9)时,PAM可为5′-NNAGAAW-3′(W=A或T);当CRISPR酶是脑膜炎奈瑟菌Cas9(NmCas9)时,PAM可为5′-NNNNGATT-3′;当CRISPR酶是空肠弯曲杆菌Cas9(CjCas9)时,PAM可为5′-NNNVRYAC-3′(V=G或C或A;R=A或G;Y=C或T),其中,N为A、T、G或C,或A、U、G或C。然而,尽管通常理解根据如上所述的酶的来源来确定PAM,PAM可随着由相应来源衍生而来的酶的突变体的研究进展而改变。

II型CRISPR酶可为Cas9。

Cas9可由多种微生物衍生而来,例如,酿脓链球菌、嗜热链球菌、链球菌属(Streptococcus sp.)、金黄色葡萄球菌、空肠弯曲杆菌、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomyces viridochromogenes)、绿色产色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌、酸热脂环酸芽孢杆菌(AlicyclobacHlusacidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、Bacillusselenitireducens、Exiguobacterium sibiricum、德氏乳杆菌(Lactobacillusdelbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、Microscilla marina、伯克氏菌目细菌(Burkholderiales bacterium)、Polaromonas naphthalenivorans、极地单胞菌属(Polaromonas sp.)、Crocosphaera watsonii、蓝杆藻属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、Ammonifex degensii、Caldicelulosiruptor bescii、Candidatus Desulforudis、肉毒梭状芽胞杆菌(Clostridium botulinum)、艰难梭状芽胞杆菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、Natranaerobiusthermophilus、Pelotomaculum thermopropionicum、喜温嗜酸硫杆菌(Acidithiobacilluscaldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、Allochromatiumvinosum、海杆菌属(Marinobacter sp.)、Nitrosococcus halophilus、Nitrosococcuswatsonii、Pseudoalteromonas haloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、鞘丝藻属(Lyngbyasp.)、Microcoleus chthonoplastes、颤藻属(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)以及Acaryochloris marina。

Cas9为与gRNA结合从而切割或修饰靶基因或核酸的靶序列或位置的酶,并且可由HNH结构域(能够切割与gRNA形成互补结合的核酸链)、RuvC结构域(能够切割与gRNA形成非互补结合的核酸链)、REC结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于Cas9的具体结构特征,可参见Hiroshi Nishimasu等,(2014)Cell 156:935-949。

Cas9可从天然存在的微生物中分离或者通过重组或合成方法非天然地产生。

此外,CRISPR酶可为V型CRISPR酶。

V型CRISPR酶包含类似的RuvC结构域(对应于II型CRISPR酶的RuvC结构域),并且缺乏II型CRISPR酶的HNH结构域。但是它反过来包含Nuc结构域并可由REC结构域和WED结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于V型CRISPR酶的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。

V型CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下允许引导序列接近包含PAM序列的靶序列。此处,V型CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。

PAM序列可为靶基因或核酸中存在的序列,并被V型CRISPR酶的PI结构域识别。PAM序列可根据V型CRISPR酶的来源而具有不同的序列。即,每个种类具有能够被特异性识别的PAM序列。例如,由Cpf1识别的PAM序列可为5′-TTN-3′(N为A、T、C或G)。尽管通常理解PAM根据如上所述的酶的来源来确定,但PAM可随着由相应来源衍生而来的酶的突变体的研究进展而改变。

V型CRISPR酶可为Cpf1。

Cpf1可由以下衍生而来:链球菌(Streptococcus)、弯曲杆菌(Campylobacter)、Nitratifractor、葡萄球菌(Staphylococcus)、Parvibaculum、罗氏菌(Roseburia)、奈瑟菌(Neisseria)、葡糖醋杆菌(Gluconacetobacter)、固氮螺菌(Azospirillum)、Sphaerochaeta、乳杆菌(Lactobacillus)、真杆菌(Eubacterium)、棒状杆菌(Corynebacter)、肉食杆菌(Carnobacterium)、红杆菌(Rhodobacter)、李斯特菌(Listeria)、Paludibacter、梭菌(Clostridium)、毛螺菌(Lachnospiraceae)、Clostridiaridium、纤毛菌(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团杆菌(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌(Porphyromonas)、普雷沃菌(Prevotella)、拟杆菌(Bacteroidetes)、创伤球菌(Helcococcus)、钩端螺旋体(Letospira)、脱硫弧菌(Desulfovibrio)、Desulfonatronum、丰祜菌(Opitutaceae)、肿块芽孢杆菌(Tuberibacillus)、芽孢杆菌(Bacillus)、短芽孢杆菌(Brevibacilus)、甲基杆菌(Methylobacterium)或氨基酸球菌(Acidaminococcus)。

Cpf1包含RuvC样结构域(对应于Cas9的RuvC结构域),并缺乏Cas9的HNH结构域。但是它反过来包含Nuc结构域,并可由REC结构域和WED结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于Cpf1的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。

Cpf1可从天然存在的微生物分离或者通过重组或合成方法非天然地产生。

CRISPR酶可为具有切割靶基因或核酸中的双链核酸的功能的核酸酶或限制性酶。

CRISPR酶可为完全活性的CRISPR酶。

术语“完全活性”是指酶具有与野生型CRISPR酶相同的功能的状态,此状态下的CRISPR酶被称为完全活性的CRISPR酶。此处,“野生型CRISPR酶的功能”是指酶具有切割双链DNA的功能的状态,即具有切割双链DNA的第一链的第一功能和切割双链DNA的第二链的第二功能的状态。

完全活性的CRISPR酶可为切割双链DNA的野生型CRISPR酶。

完全活性的CRISPR酶可为通过对切割双链DNA的野生型CRISPR酶进行修饰或操纵形成的CRISPR酶变体。

CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的一个或多个氨基酸被置换为其它氨基酸或一个或多个氨基酸去除的酶。

CRISPR酶变体可为向野生型CRISPR酶的氨基酸序列添加了一个或多个氨基酸的酶。此处,添加的氨基酸的位置可为野生型酶的N端、C端或氨基酸序列中。

CRISPR酶变体可为与野生型CRISPR酶相比具有改善的功能的完全活性的酶。

例如,野生型CRISPR酶的特定修饰或经操纵的形式(即CRISPR酶变体)可切割双链DNA而不与待切割的双链DNA结合或与其保持一定距离。在这种情况下,修饰或经操纵的形式可为与野生型CRISPR酶相比具有改善的功能活性的完全活性的CRISPR酶。

CRISPR酶变体可为与野生型CRISPR酶相比功能降低的完全活性的CRISPR酶。

例如,野生型CRISPR酶的特定修饰或经操纵的形式(即CRISPR酶变体)可在非常接近待切割的双链DNA或与其形成特异性结合的情况下切割双链DNA。此处,特异性结合可为例如CRISPR酶的特定区域处的氨基酸与切割位置处的DNA核苷酸序列之间的结合。在这种情况下,修饰或经操纵的形式可为与野生型CRISPR酶相比功能活性降低的完全活性的CRISPR酶。

CRISPR酶可为不完全或部分活性的CRISPR酶。

术语“不完全或部分活性”是指酶具有选自野生型CRISPR酶的功能(即,切割双链DNA的第一链的第一功能,以及切割双链DNA的第二链的第二功能)之一的状态。处于此状态下的CRISPR酶称为不完全或部分活性的CRISPR酶。此外,不完全或部分活性的CRISPR酶可称为切口酶(nickase)。

术语“切口酶”是指经操纵或修饰而仅切割靶基因或核酸的双链的一条链的CRISPR酶,切口酶具有切割单链(例如与靶基因或核酸的gRNA互补的链或不与其互补的链)的核酸酶活性。因此,为了切割双链需要两种切口酶的核酸酶活性。

切口酶可具有借助CRISPR酶的RuvC结构域的核酸酶活性。即,切口酶可不包含CRISPR酶的HNH结构域的核酸酶活性,为此可对HNH结构域进行操纵或修饰。

在一个实例中,当CRISPR酶是II型CRISPR酶时,切口酶可为包含修饰的HNH结构域的II型CRISPR酶。

例如,在II型CRISPR酶为野生型SpCas9的情况下,切口酶可为其中通过突变使HNH结构域的核酸酶活性失活的SpCas9变体,所述突变为将野生型SpCas9的氨基酸序列中的第840位氨基酸由组氨酸突变为丙氨酸。由于由此产生的切口酶(即SpCas9变体)具有RuvC结构域的核酸酶活性,因此它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。

又例如,在II型CRISPR酶为野生型CjCas9的情况下,切口酶可为其中通过突变使HNH结构域的核酸酶活性失活的CjCas9变体,所述突变为野生型CjCas9的氨基酸序列中的第559位氨基酸由组氨酸突变为丙氨酸。由于由此产生的切口酶(即CjCas9变体)具有RuvC结构域的核酸酶活性,因此它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。

此外,切口酶可具有借助CRISPR酶的HNH结构域的核酸酶活性。即,切口酶可不包含RuvC结构域的核酸酶活性,为此可对RuvC结构域进行操纵或修饰。

在一个实例中,当CRISPR酶是II型CRISPR酶时,切口酶可为包含经修饰的RuvC结构域的II型CRISPR酶。

例如,在II型CRISPR酶为野生型SpCas9的情况下,切口酶可为其中通过突变使RuvC结构域的核酸酶活性失活的SpCas9变体,所述突变为野生型SpCas9的氨基酸序列中的第10位氨基酸由天冬氨酸突变为丙氨酸。由于由此产生的切口酶(即SpCas9变体)具有HNH结构域的核酸酶活性,因此它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。

又例如,在II型CRISPR酶为野生型CjCas9的情况下,切口酶可为其中通过突变使RuvC结构域的核酸酶活性失活的CjCas9变体,所述突变为野生型CjCas9的氨基酸序列中的第8位氨基酸由天冬氨酸突变为丙氨酸。由于由此产生的切口酶(即CjCas9变体)具有HNH结构域的核酸酶活性,因此它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。

CRISPR酶可为失活的CRISPR酶。

术语“失活”是指野生型CRISPR酶的功能(即切割双链DNA的第一链的第一功能和切割双链DNA的第二链的第二功能)均丧失的状态。处于此类状态下的CRISPR酶被称为失活的CRISPR酶。

由于野生型CRISPR酶的具有核酸酶活性的结构域中的突变,失活的CRISPR酶可使核酸酶失活。

失活的CRISPR酶可能由于RuvC结构域和HNH结构域中的突变而使核酸酶失活。即,失活的CRISPR酶可不具有由CRISPR酶的RuvC结构域和HNH结构域生成的核酸酶活性,并且为此可对RuvC结构域和HNH结构域进行操纵或修饰。

在一个实例中,当CRISPR酶为II型CRISPR酶时,失活的CRISPR酶可为具有经修饰的RuvC结构域和HNH结构域的II型CRISPR酶。

例如,当II型CRISPR酶为野生型SpCas9时,失活的CRISPR酶可为其中通过野生型SpCas9的氨基酸序列中的第10位天冬氨酸和第840位组氨酸均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性均失活的SpCas9变体。此处,由于所产生的失活的CRISPR酶(即SpCas9变体)中的RuvC结构域和HNH结构域的核酸酶活性失活,不能完全地切割靶基因或核酸的双链。

在另一实例中,当II型CRISPR酶为野生型CjCas9时,失活的CRISPR酶可为其中通过野生型CjCas9的氨基酸序列中的第8位天冬氨酸和第559位组氨酸均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性均失活的CjCas9变体。此处,由于所产生的失活的CRISPR酶(即CjCas9变体)中的RuvC结构域和HNH结构域的核酸酶活性失活,不能完全地切割靶基因或核酸的双链。

除上述核酸酶活性外,CRISPR酶可具有解旋酶活性,即,使得双链核酸的螺旋结构退火的能力。

此外,相对于CRISPR酶的解旋酶活性,可对CRISPR酶进行修饰以使CRISPR酶完全、不完全或部分地活化、或失活。

CRISPR酶可为通过对野生型CRISPR酶进行人工操纵或修饰产生的CRISPR酶变体。

CRISPR酶变体可为经人工操纵或修饰的CRISPR酶变体以修饰野生型CRISPR酶的功能(即,切割双链DNA的第一链的第一功能,和/或切割双链DNA的第二链的第二功能)。

例如,CRISPR酶变体可为其中野生型CRISPR酶功能的第一功能丧失的形式。

或者,CRISPR酶变体可为其中野生型CRISPR酶功能的第二功能丧失的形式。

例如,CRISPR酶变体可为其中野生型CRISPR酶的两种功能(即第一功能和第二功能)均丧失的形式。

CRISPR酶变体可通过与gRNA相互作用而形成gRNA-CRISPR酶复合体。

CRISPR酶变体可为经人工操纵或修饰以修饰野生型CRISPR酶的与gRNA相互作用的功能的CRISPR酶变体。

例如,CRISPR酶变体可为具有与野生型CRISPR酶相比降低的与gRNA的相互作用的形式。

或者,CRISPR酶变体可为具有与野生型CRISPR酶相比增加的与gRNA的相互作用的形式。

例如,CRISPR酶变体可为具有野生型CRISPR酶的第一功能以及降低的与gRNA的相互作用的形式。

或者,CRISPR酶变体可为具有野生型CRISPR酶的第一功能以及增加的与gRNA的相互作用的形式。

例如,CRISPR酶变体可为具有野生型CRISPR酶的第二功能以及降低的与gRNA的相互作用的形式。

或者,CRISPR酶变体可为具有野生型CRISPR酶的第二功能以及增加的与gRNA的相互作用的形式。

例如,CRISPR酶变体可为不具有野生型CRISPR酶的第一功能和第二功能并具有降低的与gRNA的相互作用的形式。

或者,CRISPR酶变体可为不具有野生型CRISPR酶的第一功能和第二功能并具有增加的与gRNA的相互作用的形式。

此处,可根据gRNA与CRISPR酶变体之间的相互作用强度来形成多种gRNA-CRISPR酶复合体,并且接近或切割靶序列的功能可根据CRISPR酶变体而存在差异。

例如,仅当非常接近或定位于与gRNA完全互补结合的靶序列时,由与gRNA的相互作用降低的CRISPR酶变体形成的gRNA-CRISPR酶复合体才能够切割靶序列的双链或单链。

CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被修饰的形式。

作为实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被置换的形式。

作为另一实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被删除的形式。

作为又一实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被添加的形式。

在一个实例中,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被置换、删除和/或添加的形式。

此外,任选地,除了野生型CRISPR酶的原始功能(即,切割双链DNA的第一链的第一功能以及切割其第二链的第二功能)外,CRISPR酶变体可进一步包含功能结构域。此处,除了野生型CRISPR酶的原始功能外,CRISPR酶变体可具有额外功能。

功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域,或者为用于分离和纯化蛋白(包括肽)的标签或报告基因,但本发明不限于此。

标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。

功能结构域可为脱氨酶。

例如,可进一步包含胞苷脱氨酶作为不完全或部分活性的CRISPR酶的功能结构域。在一个示例性实施方式中,可将胞苷脱氨酶(例如载脂蛋白B编辑复合体1(APOBEC1))添加至SpCas9切口酶,从而产生融合蛋白。如上所述形成的[SpCas9切口酶]-[APOBEC1]可用于由C到T或U的核苷酸编辑或者由G到A的核苷酸编辑中。

在另一实例中,可进一步包含腺嘌呤脱氨酶作为不完全或部分活性的CRISPR酶的功能结构域。在一个示例性实施方式中,可将腺嘌呤脱氨酶(例如TadA变体、ADAR2变体或ADAT2变体等)添加至SpCas9切口酶,从而产生融合蛋白。如上所述形成的[SpCas9切口酶]-[TadA变体]、[SpCas9切口酶]-[ADAR2变体]或[SpCas9切口酶]-[ADAT2变体]可用于由A到G的核苷酸编辑或者由T到C的核苷酸编辑中,由于融合蛋白将核苷酸A修饰为肌苷,经修饰的肌苷被聚合酶识别为核苷酸G,从而实质上表现出由A到G的核苷酸编辑。

功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。

在一个实例中,CRISPR酶可包含一个或多个NLS。此处,NLS可包含于CRISPR酶的N端或其附近、所述酶的C端或其附近,或者它们的组合。NLS可为由如下NLS衍生而来的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV(SEQ ID NO:831)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:832)的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:833)或RQRRNELKRSP(SEQ ID NO:834)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:835)的hRNPA1 M9 NLS;来自输入蛋白α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:836);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:837)和PPKKARED(SEQ ID NO:838);人p53的序列PQPKKKPL(SEQ ID NO:839);小鼠c-ab1 IV的序列SALIKKKKKMAP(SEQ ID NO:840);流感病毒NS1的序列DRLRR(SEQ ID NO:841)和PKQKKRK(SEQ ID NO:842);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:843);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:844);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:845);或者由类固醇激素受体(人)糖皮质激素的序列衍生而来的序列RKCLQAGMNLEARKTKK(SEQ ID NO:846)。

此外,CRISPR酶突变体可包括通过将CRISPR酶分为两个以上部分而制备的拆分型(split-type)CRISPR酶。术语“拆分”是指对蛋白进行功能或结构性划分,或者将蛋白随机划分为两个以上部分。

拆分型CRISPR酶可为完全活性的酶、不完全或部分活性的酶或失活的酶。

例如,当CRISPR酶为SpCas9时,可在第656位残基(酪氨酸)和第657位残基(苏氨酸)之间将SpCas9分为两部分,由此生成拆分型SpCas9。

拆分型CRISPR酶可选择性地包含用于重构(reconstitution)的额外的结构域、肽、多肽或蛋白。

用于重构的额外的结构域、肽、多肽或蛋白可组装以形成在结构上与野生型CRISPR酶相同或类似的拆分型CRISPR酶。

用于重构的额外的结构域、肽、多肽或蛋白可为FRB和FKBP二聚化结构域;内含肽(intein);ERT和VPR结构域;或者在特定条件下形成异二聚体的结构域。

例如,当CRISPR酶为SpCas9时,可在第713位残基(丝氨酸)和第714位残基(甘氨酸)之间将SpCas9分为两部分,从而生成拆分型SpCas9。可将FRB结构域连接至两部分中的一个部分,并将FKBP结构域连接至另一部分。在由此产生的拆分型SpCas9中,FRB结构域和FKBP结构域可以在存在雷帕霉素的环境中形成二聚体,从而生成重构的CRISPR酶。

本说明书中公开的CRISPR酶或CRISPR酶变体可为多肽、蛋白或者具有编码所述多肽、蛋白的序列的核酸,并可针对待导入所述CRISPR酶或CRISPR酶变体的受试者实施密码子优化。

术语“密码子优化”是指通过如下对核酸序列修饰的过程:在保持天然氨基酸序列的同时将天然序列中的至少一个密码子替换为在宿主细胞中更常或最常使用的密码子来改善在宿主细胞中的表达。多种物种对特定氨基酸的特定密码子具有特定偏好,该密码子偏好(不同生物体间密码子使用的差别)通常与mRNA的翻译效率相关,认为这取决于所翻译的密码子的特征和特定tRNA分子的可获得性。细胞中选择的优势tRNA通常反映了肽合成中最常使用的密码子。因此,可基于密码子优化在给定生物体中通过优化基因表达来对基因进行定制化。

可以借助多种形式将本说明书中公开的gRNA、CRISPR酶或gRNA-CRISPR酶复合体递送入或导入受试者中。

受试者相关的描述如上所述。

在一个实施方式中,可通过载体将编码gRNA和/或CRISPR酶的核酸序列递送入或导入受试者中。

载体可包含编码gRNA和/或CRISPR酶的核酸序列。

在一个实例中,载体可同时包含编码gRNA和CRISPR酶的核酸序列。

在另一实例中,载体可包含编码gRNA的核酸序列。

例如,gRNA中包含的结构域可包含在一个载体中,或者可将其分割并随后包含在不同载体中。

在另一实例中,载体可包含编码CRISPR酶的核酸序列。

例如,在CRISPR酶的情况下,编码CRISPR酶的核酸序列可包含在一个载体中,或者可将编码CRISPR酶的核酸序列分割并随后包含在数个载体中。

载体可包含一种或多种调节/调控成分。

此处,调节/调控成分可包括:启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。

启动子可为由RNA聚合酶II识别的启动子。

启动子可为由RNA聚合酶III识别的启动子。

启动子可为诱导型启动子。

启动子可为受试者特异性启动子。

启动子可为病毒启动子或非病毒启动子。

就启动子而言,可根据控制区(即,编码gRNA和/或CRISPR酶的核酸序列)而使用恰当的启动子。

例如,用于gRNA的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于CRISPR酶的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。

载体可为病毒载体或重组病毒载体。

病毒可为DNA病毒或RNA病毒。

此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。

此处,RNA病毒可为单链RNA(ssRNA)病毒。

所述病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。

在一个实例中,可通过重组慢病毒对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。

在另一实例中,可通过重组腺病毒对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。

在又一实例中,可通过重组AAV对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。

在又一实例中,可通过杂合病毒(例如本文所述的病毒的一种多种的杂合)对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。

在一个实施方式中,可将gRNA-CRISPR酶复合体递送入或导入受试者中。

例如,gRNA可以以DNA、RNA或其混合物的形式存在。CRISPR酶可以以肽、多肽或蛋白的形式存在。

在一个实例中,可以以包含RNA型gRNA和蛋白型CRISPR的gRNA-CRISPR酶复合体(即核糖核蛋白(RNP))的形式将gRNA和CRISPR酶递送入或导入受试者中。

可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所描述的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将gRNA-CRISPR酶复合体递送入或导入受试者中。

本说明书中公开的gRNA-CRISPR酶复合体可用于对靶基因(即凝血抑制基因)进行人工操纵或修饰。

可使用上述的gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因进行操纵或修饰。此处,靶基因的操纵或修饰可包括以下二者:i)对靶基因进行切割或损伤;以及ii)对损伤的靶基因进行修复。

i)靶基因的切割或损伤可为使用CRISPR复合体对靶基因进行切割或损伤,具体而言对靶基因的靶序列进行切割或损伤。

靶序列可成为gRNA-CRISPR酶复合体的靶标,并且靶序列可包含由CRISPR酶识别的PAM序列或者可不包含由CRISPR酶识别的PAM序列。此类靶序列可为参与gRNA设计的人提供关键标准。

靶序列可由gRNA-CRISPR酶复合体的gRNA特异性识别,因此,gRNA-CRISPR酶复合体可位于所识别的靶序列附近。

靶位点处的“切割”是指多聚核苷酸的共价骨架的断裂。切割包括但不限于磷酸二酯键的酶促水解或化学水解,但本发明不限于此。除此之外,可通过多种方法进行切割。单链切割和双链切割都是可能的,其中双链切割可以作为两条不同的单链切割的结果而发生。双链切割可产生平末端或交错(staggered)末端(或粘性末端)。

在一个实例中,使用CRISPR复合体对靶基因进行切割或损伤可为将靶序列的双链完全切割或损伤。

在一个示例性实施方式中,当CRISPR酶为野生型SpCas9时,与gRNA形成互补结合的靶序列的双链可被CRISPR复合体完全切割。

在另一示例性实施方式中,当CRISPR酶为SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,与gRNA形成互补结合的靶序列的两条单链可分别被每种CRISPR复合体切割。即,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,并且可顺序或同时实施切割。

在另一实例中,使用CRISPR复合体对靶基因或核酸进行切割或损伤可为仅对靶序列的双链中的单链进行切割或损伤。此处,单链可为与gRNA互补结合的靶序列中的引导核酸结合序列(即互补单链),或不与gRNA互补结合的引导核酸非结合序列(即与gRNA非互补的单链)。

在一个示例性实施方式中,当CRISPR酶为SpCas9切口酶(D10A)时,CRISPR复合体可通过SpCas9切口酶(D10A)切割与gRNA互补结合的靶序列的引导核酸结合序列(即互补单链),而可不切割不与gRNA互补结合的引导核酸非结合序列(即与gRNA非互补的单链)。

在另一示例性实施方式中,当CRISPR酶为SpCas9切口酶(H840A)时,CRISPR复合体可通过SpCas9切口酶(H840A)切割与gRNA不互补结合的靶序列的引导核酸非结合序列(即与gRNA非互补的单链),而可不切割与gRNA互补结合的靶序列的引导核酸结合序列(即互补单链)。

在又一实例中,使用CRISPR复合体对靶基因或核酸的切割或损伤可为去除核酸序列的部分片段。

在一个示例性实施方式中,当CRISPR复合体由野生型SpCas9和互补结合至不同靶序列的两个gRNA组成时,可切割与第一gRNA形成互补结合的靶序列的双链,并可切割与第二gRNA形成互补结合的靶序列的双链,从而引起通过第一gRNA和第二gRNA以及SpCas9去除核酸片段。

ii)损伤的靶基因的修复可为借助非同源末端接合(NHEJ)和同源介导的修复(HDR)进行的修复或恢复。

非同源末端接合(NHEJ)是通过将被切割的双链或单链的两端连接在一起来对DNA中的双链断裂进行恢复或修复的方法,一般而言,当将通过双链断裂(例如切割)形成的两个相容末端频繁地彼此接触以将两个末端完全相接,损伤的双链得以修复。NHEJ是能够用于整个细胞周期的恢复方法,并且通常在细胞中无同源基因组用作模板时(例如G1期)发生。

在使用NHEJ对损伤的基因或核酸进行修复的过程中,NHEJ修复区中出现核酸序列的一些插入和/或缺失(插入缺失),此类插入和/或缺失导致读码框位移,产生移码的转录组mRNA。其结果是,由于无义介导的衰变(nonsense-mediated decay)或正常蛋白无法合成,造成固有功能丧失。此外,尽管读码框保持不变,其中序列的相当量的插入或缺失的突变也可导致蛋白功能破坏。由于相比蛋白的非重要区域的突变,重要功能结构域中的突变可能更少被耐受,突变为基因座依赖型的。

尽管不能预期在天然状态下由NHEJ产生的插入缺失突变,特定的插入缺失序列优选在指定的受损区中,并可来自于微同源的小区域。常规地,缺失的长度范围为1bp-50bp,插入趋向于更短,并通常包含直接包围受损区的短重复序列。

此外,NHEJ是造成突变的过程,并且当不必须生成特定的最终序列时,可将NHEJ用于对短序列的基序进行删除。

可使用该NHEJ进行CRISPR复合体所靶向的基因的特异性敲除。可使用CRISPR酶(例如Cas9或Cpf1)切割靶基因或核酸的双链或两条单链,并可借助NHEJ使得受损的双链或两条单链具有插入缺失,从而诱导靶基因或核酸的特异性敲除。此处,被CRISPR酶切割的靶基因或核酸的位点可为非编码区或编码区,此外,由NHEJ恢复的靶基因或核酸的位点可为非编码区或编码区。

在一个实例中,可使用CRISPR复合体切割靶基因的双链,并且可通过借助NHEJ的修复在修复区生成多种插入缺失(插入和缺失)。

术语“插入缺失”是指通过向DNA的核苷酸序列中插入部分核苷酸或从DNA的核苷酸序列中删除部分核苷酸而形成的变异。当gRNA-CRISPR酶复合体如上所述切割凝血抑制基因的核酸(DNA、RNA)时,在通过HDR或NHEJ进行修复期间,可向靶序列中引入插入缺失。

同源介导修复(HDR)是无错修正方法,其使用同源序列作为模板对损伤的核酸或基因进行修复或恢复,一般而言,为修复或恢复受损DNA(即,恢复细胞的固有信息),利用未被修饰的互补核苷酸序列的信息或者姐妹染色单体的信息对受损DNA进行修复。HDR最常见的类型为同源重组(HR)。HDR是通常出现在活跃分裂的细胞的S期或G2/M期的修复或恢复方法。

为使用HDR而不使用细胞的姐妹染色单体或互补核苷酸序列对损伤的DNA进行修复或恢复,可将使用互补核苷酸序列或同源核苷酸序列的信息人工合成的DNA模板(即,包含互补核苷酸序列或同源核苷酸序列的核酸模板)提供至细胞,从而修复或恢复受损DNA。此处,当进一步将核酸序列或核酸片段添加至核酸模板来修复或恢复受损DNA时,可使进一步添加至受损DNA的核酸序列或核酸片段经受敲入。进一步添加的核酸序列或核酸片段可为对由正常基因的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸,但本发明不限于此。

在一个实例中,可使用CRISPR复合体切割靶基因或核酸的双链或单链,可将核酸模板(该核酸模板包含与临近切割位点的核苷酸序列互补的核苷酸序列)提供至细胞,并可借助HDR修复或恢复靶基因或核酸的被切割的核苷酸序列。

此处,包含互补核苷酸序列的核酸模板可具有受损DNA(即,被切割的双链或单链)的互补核苷酸序列,并进一步包含待被插入至受损DNA中的核酸序列或核酸片段。可使用包含互补核苷酸序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至受损DNA中(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。互补核苷酸序列可为与受损DNA互补结合的核苷酸序列(即,靶基因或核酸被切割的双链或单链的右侧和左侧的核苷酸序列)。或者,互补核苷酸序列可为与受损DNA互补结合的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的3′和5′端)。互补核苷酸序列可为15nt-3000nt的序列,可根据靶基因或核酸或核酸模板的大小对互补核苷酸序列的长度或大小进行适当设计。此处,核酸模板可为双链或单链的核酸,并可为线性或环状,但本发明不限于此。

在另一实例中,使用CRISPR复合体切割靶基因或核酸的双链或单链,将核酸模板(该核酸模板包含与临近切割位点的核苷酸序列具有同源性的核苷酸序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸的被切割的核苷酸序列。

此处,包含同源核苷酸序列的核酸模板可具有与受损DNA(即,被切割的双链或单链)具有同源性的核苷酸序列,并进一步包含待插入至受损DNA的核酸序列或核酸片段。可使用包含同源核苷酸序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至受损DNA(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。同源核苷酸序列可为与受损DNA具有同源性的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的右侧和左侧的核苷酸序列)。或者,互补的核苷酸序列可为与受损DNA具有同源性的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的3′和5′端)。同源核苷酸序列可为15nt-3000nt的序列,可根据靶基因或核酸或核酸模板的大小对同源核苷酸序列的长度或大小进行适当设计。此处,核酸模板可为双链或单链的核酸,并可为线性或环状,但本发明不限于此。

除了NHEJ和HDR,存在多种对损伤的靶基因进行修复或恢复的方法。例如,对损伤的靶基因进行修复或恢复的方法可为单链退火、单链断裂修复、错配修复、核苷酸切割修复或使用核苷酸切割修复的方法。

单链退火(SSA)是对靶核酸中存在的两个重复序列间的双链断裂进行修复的方法,一般使用多于30个核苷酸的重复序列。对重复序列进行切割(以具有粘性末端),从而在靶核酸双链的各断裂端处具有单链,并且在切割后用RPA蛋白对含有重复序列的单链垂悬部分(overhang)进行包覆,来防止重复序列彼此的不适当退火。RAD52结合至垂悬部分上的各重复序列,并排列能够对互补重复序列进行退火的序列。退火后,垂悬部分的单链flap被切割,合成新DNA来填充特定缺口,从而恢复DNA双链。该修复或恢复的结果是两个重复间的DNA序列被删除,并且删除长度可取决于多种因素(包括本文使用的两个重复的位置以及切割过程的路径或程度)。

就对靶核酸序列进行修饰或修正而言,与HDR类似,SSA利用互补序列(即互补重复序列);与HDR不同,SSA不需要核酸模板。

可通过单链断裂修复(SSBR,与上述修复机制不同的机制)对基因组中的单链断裂进行修复或恢复。在单链DNA断裂的情况下,PARP1和/或PARP2识别断裂并动员修复机制。PARP1对DNA断裂的结合和活性是暂时的,通过促进损伤区域中SSBR蛋白复合体的稳定性来促进SSBR。SSBR复合体中最重要的蛋白是XRCC1,它与促进DNA的3′和5′端加工的蛋白相互作用来稳定DNA。末端加工通常涉及将损伤的3′端修复为羟基化状态和/或将损伤的5′端修复为磷酸部分,并在末端加工后发生DNA缺口填充。存在两种DNA缺口填充方法,即短补丁(patch)修复和长补丁修复,而短补丁修复涉及单核苷酸的插入。在DNA缺口填充后,DNA连接酶促进末端连接。

错配修复(MMR)作用于错配的DNA核苷酸。MSH2/6或MSH2/3复合体各自具有ATPase活性,并因此在识别错配和引发修复中起到重要作用,并且MSH2/6主要识别核苷酸-核苷酸错配并识别一个或两个核苷酸的错配,而MSH2/3主要识别更长的错配。

碱基切除修复(BER)是在整个细胞周期中均活跃的修复方法,其用于从基因组中去除小的非螺旋扭曲碱基损伤区。在损伤的DNA中,通过切割连接核苷酸与脱氧核糖-磷酸骨架的N-糖苷键去除损伤的核苷酸,随后切割磷酸二酯键骨架,从而生成单链DNA中的断裂。去除由此形成的受损单链末端,并利用新的互补核苷酸填充由于单链去除而造成的缺口,随后通过DNA连接酶将新填充的互补核苷酸的末端连接至骨架,引起对损伤DNA的修复或恢复。

核苷酸切除修复(NER)是对于从DNA中去除大的螺旋扭曲损伤而言重要的切除机制,当识别到损伤时,去除含有损伤区域的短单链DNA片段,产生22-30个核苷酸的单链缺口。利用新的互补核苷酸填充生成的缺口,并通过DNA连接酶将新填充的互补核苷酸的末端与骨架连接,引起对损伤DNA的修复或恢复。

通过gRNA-CRISPR酶复合体对靶基因(即,凝血抑制基因)进行人工操纵的效果可主要为敲除、敲减、敲入。

“敲除”是指靶基因或核酸的失活,而“靶基因或核酸的失活”是指不发生靶基因或核酸的转录和/或翻译的状态。通过敲除可对造成疾病的基因或具有异常功能的基因的转录和翻译进行抑制,阻止蛋白表达。

例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或染色体进行切割。可通过NHEJ对使用CRISPR复合体损伤的靶基因或染色体进行修复。通过NHEJ在损伤的靶基因或染色体中生成了插入缺失,从而诱导靶基因或染色体的特异性敲除。

在另一实例中,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)和供体对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或核酸进行切割。使用CRISPR复合体损伤的靶基因或核酸可使用供体借助HDR进行修复。此处,供体包含同源核苷酸序列和期望插入的核苷酸序列。此处,可根据插入的位置或目的来对待插入的核苷酸序列的数目进行改变。当使用供体对损伤的靶基因或染色体进行修复时,将待插入的核苷酸序列插入到损伤的核苷酸序列区域,从而诱导靶基因或染色体的特异性敲除。

“敲减”是指靶基因或核酸的转录和/或翻译或靶蛋白的表达降低。通过借助敲减对基因或蛋白的过表达进行调节,可预防疾病发作或可治疗疾病。

例如,当使用gRNA-CRISPR失活酶-转录抑制活性结构域复合体(即,包含转录抑制活性结构域的CRISPR失活复合体)对靶基因或染色体进行编辑时,CRISPR失活复合体可特异性地结合至靶基因或染色体,并通过CRISPR失活复合体中包含的转录抑制活性结构域对靶基因或染色体的转录进行抑制,从而诱导敲减(其中靶基因或染色体的表达被抑制)。

在另一实例中,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或染色体的启动子和/或增强子区域进行切割。此处,gRNA可以将靶基因或染色体的启动子和/或增强子区域的部分核苷酸序列识别为靶序列。可以通过NHEJ对使用CRISPR复合体损伤的靶基因或染色体进行修复。通过NHEJ在损伤的靶基因或染色体中生成了插入缺失,从而诱导靶基因或染色体特异性敲减。或者,当任选地使用供体时,可以通过HDR对使用CRISPR复合体损伤的靶基因或染色体进行修复。当使用供体对损伤的靶基因或染色体进行修复时,将待插入的核苷酸序列插入至损伤的核苷酸序列区域,从而诱导靶基因或染色体特异性敲减。

“敲入”是指将特定核酸或基因插入至靶基因或核酸,此处,“特定核酸或基因”是指待插入或待表达的感兴趣的核酸或基因。借助敲入通过修正至正常或插入正常基因来诱导正常基因的表达,可将造成疾病的突变基因用于疾病治疗。

此外,敲入可进一步需要供体。

例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)和供体对靶基因或核酸进行编辑时,可使用CRISPR复合体对靶基因或核酸进行切割。可使用供体借助HDR对使用CRISPR复合体损伤的靶基因或核酸进行修复。此处,供体可包含特定核酸或基因,并可用于将特定核酸或基因插入至损伤的基因或染色体。此处,插入的特定核酸或基因可诱导蛋白的表达。

在本说明书的公开内容的一个实施方式中,gRNA-CRISPR酶复合体可将人工操作或修饰赋予至AT基因和/或TFPI基因。

gRNA-CRISPR酶复合体可以特异性识别AT基因和/或TFPI基因的靶序列。

靶序列可被gRNA-CRISPR酶复合体的gRNA特异性识别,因此,gRNA-CRISPR酶复合体可位于所识别的靶序列附近。

靶序列可为在AT基因和/或TFPI基因中发生人工修饰的区域或区。

靶序列可为位于AT基因和/或TFPI基因的启动子区域中的10bp-25bp的连续核苷酸序列。

靶序列可为位于AT基因和/或TFPI基因的内含子区域中的10bp-25bp的连续核苷酸序列。

靶序列可为位于AT基因和/或TFPI基因的外显子区域中的10bp-25bp的连续核苷酸序列。

靶序列可为位于AT基因和/或TFPI基因的增强子区域中的10bp-25bp的连续核苷酸序列。

靶序列可为位于AT基因和/或TFPI基因的核酸序列中的PAM序列的5′端和/或3′端附近的10bp-25bp的连续核苷酸序列。

此处,PAM序列可为如下序列中的一种或多种(以5′至3′方向来描述):

NGG(N为A、T、C或G);

NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;且Y为C或T);

NNAGAAW(N各自独立地为A、T、C或G;且W为A或T);

NNNNGATT(N各自独立地为A、T、C或G);

NNGRR(T)(N各自独立地为A、T、C或G;且R为A或G);以及

TTN(N为A、T、C或G)。

在一个实施方式中,靶序列可为选自表1中描述的核苷酸序列中的一个或多个核苷酸序列。

gRNA-CRISPR酶复合体可由gRNA和CRISPR酶组成。

gRNA可包含能够与AT基因和/或TFPI基因的靶序列的引导核酸结合序列部分或完全互补结合的引导结构域。

引导结构域可与引导核酸结合序列具有至少70%、75%、80%、85%、90%或95%的互补性或完全互补性。

引导结构域可包含与AT基因的靶序列的引导核酸结合序列互补的核苷酸序列。此处,互补核苷酸序列可以包含0个至5个、0个至4个、0个至3个或0个至2个错配。

引导结构域可包含与TFPI基因的靶序列的引导核酸结合序列互补的核苷酸序列。此处,互补核苷酸序列可以包含0个至5个、0个至4个、0个至3个或0个至2个错配。

gRNA可包含选自于由第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域所组成的组中的一个或多个结构域。

CRISPR酶可为选自于由以下所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。在一个实例中,编辑蛋白可为空肠弯曲杆菌衍生而来的Cas9蛋白或金黄色葡萄球菌衍生而来的Cas9蛋白。

gRNA-CRISPR酶复合体可将多种人工操纵或修饰赋予至AT基因和/或TFPI基因。

在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可发生一种或多种修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1-50bp的连续核苷酸序列区域中可删除一个或多个核苷酸。在一个实例中,删除的核苷酸可以是1bp、2bp、3bp、4bp或5bp的序贯或非序贯的核苷酸。在另一实例中,删除的核苷酸可为由2bp以上的序贯的核苷酸组成的核苷酸片段。此处,核苷酸片段的大小可为2bp至5bp、6bp至10bp、11bp至15bp、16bp至20bp、21bp至25bp、26bp至30bp、31bp至35bp、36bp至40bp、41bp至45bp或46bp至50bp。在又一实例中,删除的核苷酸可为两个以上的核苷酸片段。此处,两个以上的核苷酸片段可为不连续的独立核苷酸片段(即具有一个或多个核苷酸序列缺口),并且由于两个以上的删除的核苷酸片段而可产生两个以上的删除位点。

或者,例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可发生一个或多个核苷酸的插入。在一个实例中,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的序贯的核苷酸。在另一实例中,插入的核苷酸可为由5bp以上的序贯的核苷酸组成的核苷酸片段。此处,核苷酸片段的大小可为5bp至10bp、11bp至50bp、50bp至100bp、100bp至200bp、200bp至300bp、300bp至400bp、400bp至500bp、500bp至750bp或750bp至1000bp。在又一实例中,插入的核苷酸可为特定基因的部分或完整的核苷酸序列。此处,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中不包含的从外部引入的基因。或者,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中包含的基因。例如,特定基因可为存在于人细胞的基因组中的基因。

或者,例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可删除和插入一个或多个核苷酸。在一个实例中,删除的核苷酸可为1bp、2bp、3bp、4bp或5bp的序贯或非序贯的核苷酸。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可以序贯发生或同时发生。此处,插入的核苷酸片段的大小可为5bp至10bp、11bp至50bp、50bp至100bp、100bp至200bp、200bp至300bp、300bp至400bp、400bp至500bp、500bp至750bp或750bp至1000bp。此处,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中不包含的从外部引入的基因。或者,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中包含的基因。例如,特定基因可为存在于人细胞的基因组中的基因。在另一实例中,删除的核苷酸可为由2bp以上的核苷酸组成的核苷酸片段。此处,删除的核苷酸片段的大小可为2bp至5bp、6bp至10bp、11bp至15bp、16bp至20bp、21bp至25bp、26bp至30bp、31bp至35bp、36bp至40bp、41bp至45bp或46bp至50bp。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可序贯发生或同时发生。在另一实例中,缺失的核苷酸可为两个以上的核苷酸片段。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可以序贯发生或同时发生。此外,插入可发生在两个以上的被删除部分的局部或完整的部分中。

根据gRNA和CRISPR酶的类型,gRNA-CRISPR酶复合体可以将多种人工操纵或修饰赋予至AT基因和/或TFPI基因。

在一个实例中,当CRISPR酶为SpCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NGG-3′(N为A、T、G或C)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

在另一实例中,当CRISPR酶为CjCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNNNRYAC-3′(N各自独立地为A、T、G或C,R为A或G,且Y为C或T)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

在又一实例中,当CRISPR酶为StCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNAGAAW-3(N各自独立地为A、T、C或G,且W为A或T)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

在一个实例中,当CRISPR酶为NmCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNNNGATT-3′(N各自独立地为A、T、C或G)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

在又一实例中,当CRISPR酶为SaCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNGRR(T)-3′(N各自独立地为A、T、C或G,R为A或G,且(T)意指任何可插入序列)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

在又一实例中,当CRISPR酶为Cpf1蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-TNN-3′(N为A、T、C或G)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:

i)一个或多个核苷酸的删除,

ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,

iii)一个或多个核苷酸的插入,或

iv)选自于i)至iii)中的两种以上的组合。

由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲除。

由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为抑制由AT基因和/或TFPI基因中的每一个所编码的蛋白质的表达。

由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲减。

由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为减少由AT基因和/或TFPI基因中的每一个所编码的蛋白质的表达。

由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲入。

此处,敲入作用可由gRNA-CRISPR酶复合体和额外包含外源核苷酸序列或基因的供体进行诱导。

由gRNA-CRISPR酶复合体和供体引起的对AT基因和/或TFPI基因的人工操纵作用可为对由外源核苷酸序列或基因编码的肽或蛋白质进行表达。

本说明书中公开的一个方面涉及使用用于基因操纵以治疗凝血病的组合物来治疗凝血病的方法。

本说明书中公开的一个实施方式提供了使用以下方法治疗凝血病的用途,所述方法包括向治疗受试者中给予用于基因操纵以人工操纵凝血抑制基因的组合物。

此处,治疗受试者可为哺乳动物,包括灵长类动物(如人、猴等)和啮齿动物(如大鼠、小鼠等)。

术语“凝血病(即,出血性障碍)”是指血液凝块的形成被异常的凝血系统抑制或阻抑的病症。该凝血病包括凝血(即血栓形成)被抑制或阻抑、并因此出血不停止或止血被延迟的病症。它是指包括由此引起的所有类型疾病的病理状况。

在这种情况下,凝血病包括由异常的凝血系统和凝血抑制因子引起的所有类型的疾病。

术语“凝血抑制因子诱导的疾病”是指包括由于凝血抑制因子的异常形式(例如突变等)或表达异常而引起的所有类型的疾病的所有病症。

凝血病可为血友病,是由体内异常凝血系统引起的疾病。

在一个实施方式中,凝血病可为血友病A、血友病B或血友病C。

血友病(或血友病)是由凝血因子缺乏而天生地引起的先天性出血性疾病。迄今为止,已知有12种凝血因子。在先天性凝血缺乏的症状中,血友病A由因子VIII的缺乏引起,血友病B由因子IX(Christmas病)的缺乏引起,且血友病C由因子XI的缺乏引起。血友病A和血友病B占血友病的95%或更多,并且由于两种疾病均具有与内在凝血机制相关的凝血因子,因此可能不容易在临床上彼此区分开。血友病A和血友病B天生地为X连锁隐性性状,女性为沉默携带者,而只有男婴保持为患者。

血友病A是VIII因子缺乏的症状。血友病A的20%至30%由无家族史的突变引起。其发病率约为每4,000至10,000名男婴中的一名,而血友病A的发病率为血友病B的约5至8倍。

血友病B是遗传性凝血障碍的第二常见类型,并且据观察,儿童和青少年中血友病B的出血症状比在成人中更为明显。女性携带者有轻微的症状,但是10%的女性携带者有出血的风险。其发病率约为每20,000至25,000名男婴中一名。

血友病C占所有凝血因子缺乏症的约2%至3%。在韩国,尚无血友病C病例的报道,其天生地为常染色体隐性的。

血友病A的临床症状是外伤、拔牙和手术后不受控制的出血。严重的血友病A可能在出生后一年内被诊断出,并且在不进行治疗的情况下在2个月至5个月出现自发性出血症状。

同样,中度严重的血友病A倾向于发展出自发性出血。但是,由于症状出现的延迟,其在5岁至6岁之前通过轻微创伤后不受控制的出血被诊断。在轻度血友病A的情况下未观察到自发性出血。轻度血友病A具有手术、拔牙和重伤后不受控制的出血的症状,并在许多情况下,可能一生中不被诊断。血友病A的出血症状在儿童和青少年中比在成人中更为明显。女性携带者具有轻度症状,但是10%的女性携带者有出血的风险。

由于缺乏因子IX,血友病B具有在外伤、拔牙或手术停止后的最初出血后出现不受控制的出血的症状。在严重的B型血友病中经常观察到关节积血。严重的血友病B可能在出生后一年内被诊断出,并且在不进行治疗的情况下在2个月至5个月出现自发性出血症状。此外,中度严重的血友病B倾向于发展出自发性出血,但与严重的血友病B相比,其出现延迟。中度严重的血友病B具有外伤后不受控制的出血的症状,并在5岁至6岁之前被诊断出。轻度血友病B没有自发性出血,并且具有手术、拔牙和重伤后不受控制的出血的症状。轻度血友病B可能一生中完全不会被诊断出,因为它没有任何症状。

血友病的一般治疗是通过补充不足的凝血因子来实现的。在这种情况下,当前使用因子VIII和因子IX制剂,并且在治疗过程中产生抗体时给予旁路因子(Kemton CL等,Blood.2009;113(1):11-17)。

本说明书的公开内容的一个实施方式提供了如下的药物组合物,所述药物组合物包含可人工操纵凝血抑制基因的用于基因操纵的组合物。

与用于基因操纵的组合物有关的描述如上所述。

在一个实施方式中,用于基因操纵的组合物可包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

此处,凝血抑制基因可为AT基因和/或TFPI基因。

此处,用于基因操纵的组合物可包含载体,所述载体包含分别编码引导核酸和/或编辑蛋白的核酸序列。

此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列可以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。

在另一实施方式中,用于基因操纵的组合物可以包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白;以及

(c)供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。

此处,待插入的核酸序列可为凝血抑制基因的部分序列。

或者,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。

此处,凝血相关蛋白可为因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。

此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列、以及包含待插入的核酸序列的供体或编码所述供体的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。

该药物组合物可进一步包含额外的组分。

额外的组分可包括用于递送至受试者体内的合适的载体。

在另一实施方式中,用于基因操纵的组合物可以包括以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

此处,凝血抑制基因可为AT基因和/或TFPI基因。

此处,用于基因操纵的组合物可包含载体,所述载体包含分别编码引导核酸和/或编辑蛋白的核酸序列。

此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。

在另一实施方式中,用于基因操纵的组合物可以包括以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白;以及

(c)供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。

此处,待插入的核酸序列可为凝血抑制基因的部分序列。

或者,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。

此处,与凝血相关的蛋白质可以是因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。

此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列、以及包含待插入的核酸序列的供体或编码所述供体的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。

该药物组合物可以进一步包含额外的组分。

额外的组分可包括用于递送到受试者体内的合适的载体。

本说明书的公开内容的一个实施方式提供了治疗凝血病的方法,所述方法包括向患有凝血病的有机体给予用于基因操纵的组合物以治疗凝血病。

该治疗方法可为通过操纵有机体的基因来调节凝血系统的治疗方法。此类治疗方法可通过将用于基因操纵的组合物直接注射到体内以操纵有机体的基因来实现。

与用于基因操纵的组合物有关的描述如上所述。

在一个实施方式中,用于基因操纵的组合物可包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

或者,在另一实施方式中,用于基因操纵的组合物可包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

此处,凝血抑制基因可为AT基因和/或TFPI基因。

引导核酸和编辑蛋白可以各自以核酸序列的形式存在于一种或多种载体中,或者通过将引导核酸和编辑蛋白结合形成复合体而存在。

任选地,用于基因操纵的组合物可以进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。

引导核酸和编辑蛋白和/或供体可各自以核酸序列的形式存在于一种或多种载体中。

此处,载体可为质粒或病毒载体。

此处,病毒载体可以是选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种。

与凝血病有关的描述如上所述。

凝血病可为血友病A、血友病B或血友病C。

可向患有凝血病的治疗受试者中给予用于基因操纵的组合物。

治疗受试者可为哺乳动物,包括灵长类动物(如人、猴等)和啮齿动物(如大鼠、小鼠等)。

可以向治疗受试者给予用于基因操纵的组合物。

给予可通过注射、输注、植入或移植进行。

给予可通过选自如下的给予途径进行:肝内、皮下、皮内、眼内、玻璃体内、肿瘤内、结节内、髓内、肌内、静脉内、淋巴管内和腹膜内途径。

用于基因操纵的组合物的剂量(用于获得预定的期望的效果的药学上有效的量)为约10

当使用根据本说明书中公开的一些实施方式的方法和组合物对凝血抑制基因进行人工操纵时,可以使凝血系统正常化,从而达到抑制或改善异常出血症状等的效果。

本说明书中公开的一个实施方式涉及修饰真核细胞中的凝血抑制基因的方法,所述方法可以在体内、离体或在体外进行。

在一些实施方式中,该方法包括从人或非人动物中取出细胞或细胞群,并修饰该一个或多个细胞。培养可以在离体的任何阶段进行。该一个或多个细胞甚至可以重新引入非人动物或植物中。

该方法可为人工操纵真核细胞的方法,所述方法包括将用于基因操纵的组合物引入真核细胞。

与用于基因操作的组合物有关的描述如上所述。

在一个实施方式中,用于基因操纵的组合物可包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

或者,在另一实施方式中,用于基因操纵的组合物可包含以下组分:

(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及

(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。

此处,凝血抑制基因可为AT基因和/或TFPI基因。

引导核酸和编辑蛋白可各自以核酸序列的形式存在于一种或多种载体中,或者通过将引导核酸和编辑蛋白结合形成复合体而存在。

引入步骤可以在体内或离体进行。

例如,可以通过选自电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白质转位结构域(PTD)融合蛋白方法中的一种或多种方法来进行引入步骤。

例如,病毒载体可为选自于由以下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。

实施例

下文中,将参考实施例更详细地描述本发明。

提供这些实施例仅是为了阐明本发明,并且将对于本领域的普通技术人员显而易见的是,本发明的范围不限于以下实施例。

1.sgRNA的设计

使用CRISPR RGEN工具(韩国基础科学研究院,韩国)的Cas-Designer程序,考虑到每个PAM,从人SERPINC1和TFPI基因中提取CRISPR/SpCas9或CRISPR/SaCas9或CRISPR/CjCas9的靶标。而且,使用Cas-Offinder程序筛选了靶标,所述靶标的1个碱基和2个碱基错配的脱靶位点在人基因组中不期望。将本实验中使用的sgRNA设计为包括表3和表4中所列出的至少一个引导序列。

2.对引导RNA活性的确认和脱靶分析

使用Lipofectamine 2000,用克隆有各引导RNA序列的250ng的sgRNA表达载体与750ng的Cas9表达载体一起转染HEK293和Jurkat人细胞系(细胞计数:2×10

对于经筛选的引导RNA的脱靶分析,首先,使用CRISPR RGEN工具的Cas-Offinder通过计算机模拟方法筛选3碱基错配脱靶列表,并通过对应于每个脱靶位点的基因组某个区域的靶向深度测序的方法进行验证。作为第二种方法,使人全基因组DNA经受全基因组测序,并通过Digenome-seq分析确定了潜在的清单,所述人全基因组DNA用引导RNA和Cas9蛋白在37℃下处理过夜。然后,通过每个脱靶候选者的基因组的某个区域的靶向深度测序的方法,对插入缺失是否添加至脱靶位点处进行验证。

3.AAV构建

使用双AAV系统递送SpCas9基因编辑工具。即,通过合成构建以下中每一个:包含BGHA、在其C末端或N末端处具有NLS-HA标签的人密码子优化的Cas9和在AAV2的反向串联重复序列(ITR)之间的哺乳动物表达启动子(EFS、TBG和ICAM2)的载体(pAAV-SpCas9),以及包含U6启动子sgRNA序列的载体(pAAV-U6-sgRNA)。

此外,另一双AAV系统使用Split SpCas9。在一个AAV中,构建了包含在ITR之间的启动子(TBG、ICAM2)-SpCas9-Nterm-Intein的载体(pAAV-SpCas9-split-Nterm),并且在另一AAV中,构建了包含在ITR之间的启动子(TBG、ICAM2)-Intein-SpCas9-Cterm-U6-SgRNA的载体(pAAV-SpCas9-split-C-term-U6-SgRNA)。

使用单个AAV系统递送CjCas9基因编辑工具。即,通过合成构建包含如下的载体(pAAV-CjCas9-U6-sgRNA):在AAV2 ITR之间的启动子(EFS、TBG和ICAM2),在其C末端或N末端处具有NLS-HA标签的人密码子优化的Cas9,BGHA、U6启动子和sgRNA序列。为了生产AAV,将HEK293细胞用AAV衣壳的假型的载体、构建的pAAV载体(pAAV-EFS-SpCas9或pAAV-U6-sgRNA或pAAV-EFS-CjCas9-U6-sgRNA)以及pHelper载体以1∶1∶1的摩尔浓度同时进行转染。72小时后,裂解细胞,然后通过使用碘克沙醇(Sigma-Aldrich)的逐步梯度超速离心分离并纯化得到的病毒颗粒,并通过使用qPCR的滴定法进行AAV的定量测定。

4.动物和注射

将F8-KO小鼠和F9-KO大鼠分别用作血友病A和血友病B模型动物。使用静脉内或腹膜内注射所构建的AAV和LNP的方法,将每种CRISPR/Cas9递送至动物模型。

5.体内编辑测试

AAV和LNP注射后约4周至6周,取出肝脏,并提取基因组DNA,以通过PCR和靶向深度测序来评价中靶和脱靶位点处的插入缺失。

6.血友病指示物测试

AAV和LNP注射后,在各个时间点(1W-4W-8W-16W-32W等)收集血液,以通过ELISA评价血液中的Serpinc1和TFPI蛋白的量,或通过PT、aPTT测定法、免疫组织化学、切尾测定法(tail cutting assay)(失血定量)等来评价血友病指示物。

1.对引导RNA的活性的验证

通过插入缺失(%)证实了靶向SERPINC1基因(AT基因)和TFPI基因中的每一种的gRNA的活性,以筛选gRNA。

1)SERPINC1基因(AT基因)

①SpCas9

表5对于SpCas9,选择gRNA以靶向SERPINC1基因(AT基因)

②SaCas9

表6对于SaCas9,选择gRNA以靶向SERPINC1基因(AT基因)

③CjCas9

表7对于CjCas9,选择gRNA以靶向SERPINC1基因(AT基因)

2)TFPI基因

①SpCas9

表8对于SpCas9,选择gRNA以靶向TFPI基因

②SaCas9

表9对于SaCas9,选择gRNA以靶向TFPI基因

③CjCas9

表10对于CjCas9,选择gRNA以靶向TFPI基因

因此,预期包含靶向本研究中提出的AT基因和TFPI基因的gRNA和Cas9的组合物可用于治疗血友病。

工业实用性

根据本发明,可以使用用于基因操纵的组合物通过人工操纵和/或修饰凝血抑制基因以调节凝血抑制基因的功能和/或表达来调节凝血系统,所述组合物包含靶向凝血抑制基因的引导核酸和编辑蛋白,并因此可以使用该用于基因操纵的组合物来治疗或改善凝血病。

序列表文本

AT基因和TFPI基因的靶序列和能够靶向该靶序列的引导序列。

<110> 株式会社图尔金(TOOLGEN INCORPORATED)

<120> 抗凝因子的基因编辑

<130> OPP17-052-PCT

<150> US 62/703578

<151> 2018-07-26

<160> 848

<170> KoPatentIn 3.0

<210> 1

<211> 12

<212> RNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 1

guuuuagagc ua 12

<210> 2

<211> 25

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 2

guuuuagucc cuuuuuaaau uucuu 25

<210> 3

<211> 13

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 3

guuuuagucc cuu 13

<210> 4

<211> 9

<212> RNA

<213> 未知

<220>

<223> 俭菌总门细菌(Parcubacteria bacterium)

<400> 4

uuuguagau 9

<210> 5

<211> 14

<212> RNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 5

uagcaaguua aaau 14

<210> 6

<211> 25

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 6

aagaaauuua aaaagggacu aaaau 25

<210> 7

<211> 13

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 7

aagggacuaa aau 13

<210> 8

<211> 11

<212> RNA

<213> 未知

<220>

<223> 俭菌总门细菌(Parcubacteria bacterium)

<400> 8

aaauuucuac u 11

<210> 9

<211> 12

<212> RNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 9

aaggcuaguc cg 12

<210> 10

<211> 11

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 10

aaagaguuug c 11

<210> 11

<211> 34

<212> RNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<400> 11

uuaucaacuu gaaaaagugg caccgagucg gugc 34

<210> 12

<211> 38

<212> RNA

<213> 空肠弯曲杆菌(Campylobacter jejuni)

<400> 12

gggacucugc gggguuacaa uccccuaaaa ccgcuuuu 38

<210> 13

<211> 22

<212> RNA

<213> 嗜热链球菌(Streptococcus thermophilus)

<400> 13

guuuuagagc uguguuguuu cg 22

<210> 14

<211> 24

<212> RNA

<213> 嗜热链球菌(Streptococcus thermophilus)

<400> 14

cgaaacaaca cagcgaguua aaau 24

<210> 15

<211> 13

<212> RNA

<213> 嗜热链球菌(Streptococcus thermophilus)

<400> 15

aaggcuuagu ccg 13

<210> 16

<211> 38

<212> RNA

<213> 嗜热链球菌(Streptococcus thermophilus)

<400> 16

uacucaacuu gaaaaggugg caccgauucg guguuuuu 38

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 靶序列

<400> 17

atcattggca gactagttcg 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 靶序列

<400> 18

cgaactagtc tgccaatgat 20

<210> 19

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 19

tcctatcaca ttggaataca 20

<210> 20

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 20

ggttacagtt cctatcacat 20

<210> 21

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 21

gccatgtatt ccaatgtgat 20

<210> 22

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 22

gtgataggaa ctgtaacctc 20

<210> 23

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 23

cccctcttac ctttttccag 20

<210> 24

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 24

gaactgtaac ctctggaaaa 20

<210> 25

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 25

ccagaagcca atgagcagca 20

<210> 26

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 26

cttttgtcct tgctgctcat 20

<210> 27

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 27

ccttgctgct cattggcttc 20

<210> 28

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 28

cttgctgctc attggcttct 20

<210> 29

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 29

tgggactgcg tgacctgtca 20

<210> 30

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 30

gggactgcgt gacctgtcac 20

<210> 31

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 31

gtccacaggg ctcccgtgac 20

<210> 32

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 32

gacctgtcac gggagccctg 20

<210> 33

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 33

tggctgtgca gatgtccaca 20

<210> 34

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 34

ttggctgtgc agatgtccac 20

<210> 35

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 35

acatctgcac agccaagccg 20

<210> 36

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 36

catctgcaca gccaagccgc 20

<210> 37

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 37

catgggaatg tcccgcggct 20

<210> 38

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 38

ggattcatgg gaatgtcccg 20

<210> 39

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 39

taaatgcaca tgggattcat 20

<210> 40

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 40

gtaaatgcac atgggattca 20

<210> 41

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 41

ggggagcggt aaatgcacat 20

<210> 42

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 42

cggggagcgg taaatgcaca 20

<210> 43

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 43

catgtgcatt taccgctccc 20

<210> 44

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 44

ttgccttctt ctccggggag 20

<210> 45

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 45

ctcagttgcc ttcttctccg 20

<210> 46

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 46

cctcagttgc cttcttctcc 20

<210> 47

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 47

tcctcagttg ccttcttctc 20

<210> 48

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 48

ttaccgctcc ccggagaaga 20

<210> 49

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 49

cccggagaag aaggcaactg 20

<210> 50

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 50

gaagaaggca actgaggatg 20

<210> 51

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 51

aagaaggcaa ctgaggatga 20

<210> 52

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 52

gggctcagaa cagaagatcc 20

<210> 53

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 53

ctcagaacag aagatcccgg 20

<210> 54

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 54

cacgccggtt ggtggcctcc 20

<210> 55

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 55

acacgccggt tggtggcctc 20

<210> 56

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 56

agatcccgga ggccaccaac 20

<210> 57

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 57

ttcccagaca cgccggttgg 20

<210> 58

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 58

cagttcccag acacgccggt 20

<210> 59

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 59

tggacagttc ccagacacgc 20

<210> 60

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 60

aggccaccaa ccggcgtgtc 20

<210> 61

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 61

ggccaccaac cggcgtgtct 20

<210> 62

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 62

gcgtgtctgg gaactgtcca 20

<210> 63

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 63

agcaaagcgg gaattggcct 20

<210> 64

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 64

agtggtagca aagcgggaat 20

<210> 65

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 65

atagaaagtg gtagcaaagc 20

<210> 66

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 66

gatagaaagt ggtagcaaag 20

<210> 67

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 67

tgccaggtgc tgatagaaag 20

<210> 68

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 68

taccactttc tatcagcacc 20

<210> 69

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 69

tgtcattctt ggaatctgcc 20

<210> 70

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 70

aatgttatca ttgtcattct 20

<210> 71

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 71

tggagatact caggggtgac 20

<210> 72

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 72

aaagccgtgg agatactcag 20

<210> 73

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 73

aaaagccgtg gagatactca 20

<210> 74

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 74

caaaagccgt ggagatactc 20

<210> 75

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 75

gtcacccctg agtatctcca 20

<210> 76

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 76

cttggtcata gcaaaagccg 20

<210> 77

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 77

ggcttttgct atgaccaagc 20

<210> 78

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 78

gcttttgcta tgaccaagct 20

<210> 79

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 79

gtcattacag gcacccagct 20

<210> 80

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 80

ttgctggagg gtgtcattac 20

<210> 81

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 81

tacctccatc agttgctgga 20

<210> 82

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 82

gtacctccat cagttgctgg 20

<210> 83

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 83

gtcgtacctc catcagttgc 20

<210> 84

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 84

tgacaccctc cagcaactga 20

<210> 85

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 85

caccctccag caactgatgg 20

<210> 86

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 86

atcagatgtt ttctcagata 20

<210> 87

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 87

tcagtttggc aaagaagaag 20

<210> 88

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 88

atagagtcgg cagttcagtt 20

<210> 89

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 89

tgttggcttt tcgatagagt 20

<210> 90

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 90

tactaacttg gaggatttgt 20

<210> 91

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 91

attggctgat actaacttgg 20

<210> 92

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 92

gcgattggct gatactaact 20

<210> 93

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 93

tttgtctcca aaaaggcgat 20

<210> 94

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 94

gtatcagcca atcgcctttt 20

<210> 95

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 95

taagggattt gtctccaaaa 20

<210> 96

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 96

gtaggtctca ttgaaggtaa 20

<210> 97

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 97

ggtaggtctc attgaaggta 20

<210> 98

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 98

gtcctggtag gtctcattga 20

<210> 99

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 99

taccttcaat gagacctacc 20

<210> 100

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 100

caactcactg atgtcctggt 20

<210> 101

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 101

ataccaactc actgatgtcc 20

<210> 102

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 102

ctaccaggac atcagtgagt 20

<210> 103

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 103

gacatcagtg agttggtata 20

<210> 104

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 104

gaagtccagg ggctggagct 20

<210> 105

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 105

tggagccaag ctccagcccc 20

<210> 106

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 106

tcaccttgaa gtccaggggc 20

<210> 107

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 107

caactcacct tgaagtccag 20

<210> 108

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 108

gcaactcacc ttgaagtcca 20

<210> 109

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 109

tgcaactcac cttgaagtcc 20

<210> 110

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 110

gctccagccc ctggacttca 20

<210> 111

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 111

gattgctctg cattttcctg 20

<210> 112

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 112

aaatgcagag caatccagag 20

<210> 113

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 113

ccatttgttg atggccgctc 20

<210> 114

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 114

attggacacc catttgttga 20

<210> 115

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 115

ccagagcggc catcaacaaa 20

<210> 116

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 116

cagagcggcc atcaacaaat 20

<210> 117

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 117

gattcggcct tcggtcttat 20

<210> 118

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 118

tgggtgtcca ataagaccga 20

<210> 119

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 119

gacatcggtg attcggcctt 20

<210> 120

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 120

agggaatgac atcggtgatt 20

<210> 121

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 121

ggcttccgag ggaatgacat 20

<210> 122

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 122

aatcaccgat gtcattccct 20

<210> 123

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 123

agctcattga tggcttccga 20

<210> 124

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 124

gagctcattg atggcttccg 20

<210> 125

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 125

cagaacagtg agctcattga 20

<210> 126

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 126

catcaatgag ctcactgttc 20

<210> 127

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 127

tgagctcact gttctggtgc 20

<210> 128

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 128

tctgagtacc ttgaagtaaa 20

<210> 129

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 129

ggttaacacc atttacttca 20

<210> 130

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 130

actttgactt ccacaggccc 20

<210> 131

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 131

tgattctctt ccagggcctg 20

<210> 132

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 132

ggctgaactt tgacttccac 20

<210> 133

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 133

gttccttcct tgtgttctca 20

<210> 134

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 134

agttccttcc ttgtgttctc 20

<210> 135

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 135

agttcagccc tgagaacaca 20

<210> 136

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 136

cagccctgag aacacaagga 20

<210> 137

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 137

aaggaaggaa ctgttctaca 20

<210> 138

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 138

gaactgttct acaaggctga 20

<210> 139

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 139

ttcagcatct atgatgtacc 20

<210> 140

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 140

gcatctatga tgtaccagga 20

<210> 141

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 141

gataacggaa cttgccttcc 20

<210> 142

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 142

aggaaggcaa gttccgttat 20

<210> 143

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 143

cttcagccac gcgccgataa 20

<210> 144

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 144

caagttccgt tatcggcgcg 20

<210> 145

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 145

cgttatcggc gcgtggctga 20

<210> 146

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 146

gcgcgtggct gaaggcaccc 20

<210> 147

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 147

gaagggcaac tcaagcacct 20

<210> 148

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 148

tgaagggcaa ctcaagcacc 20

<210> 149

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 149

gtgcttgagt tgcccttcaa 20

<210> 150

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 150

gtgatgtcat cacctttgaa 20

<210> 151

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 151

ggtgatgtca tcacctttga 20

<210> 152

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 152

caaaggtgat gacatcacca 20

<210> 153

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 153

cttgggcaag atgaggacca 20

<210> 154

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 154

tctcaggctt gggcaagatg 20

<210> 155

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 155

gccaggctct tctcaggctt 20

<210> 156

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 156

ggccaggctc ttctcaggct 20

<210> 157

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 157

accttggcca ggctcttctc 20

<210> 158

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 158

gcccaagcct gagaagagcc 20

<210> 159

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 159

gcctgagaag agcctggcca 20

<210> 160

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 160

gttccttctc taccttggcc 20

<210> 161

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 161

ggtgagttcc ttctctacct 20

<210> 162

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 162

gagcctggcc aaggtagaga 20

<210> 163

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 163

agagaaggaa ctcaccccag 20

<210> 164

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 164

ccactcttgc agcacctctg 20

<210> 165

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 165

gccactcttg cagcacctct 20

<210> 166

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 166

agccactctt gcagcacctc 20

<210> 167

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 167

ccccagaggt gctgcaagag 20

<210> 168

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 168

agaggtgctg caagagtggc 20

<210> 169

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 169

gcaagagtgg ctggatgaat 20

<210> 170

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 170

agagtggctg gatgaattgg 20

<210> 171

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 171

tgaattggag gagatgatgc 20

<210> 172

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 172

attggaggag atgatgctgg 20

<210> 173

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 173

caatgcggaa gcggggcatg 20

<210> 174

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 174

ccgtcctcaa tgcggaagcg 20

<210> 175

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 175

gccgtcctca atgcggaagc 20

<210> 176

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 176

agccgtcctc aatgcggaag 20

<210> 177

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 177

catgccccgc ttccgcattg 20

<210> 178

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 178

aactgaagcc gtcctcaatg 20

<210> 179

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 179

ccccgcttcc gcattgagga 20

<210> 180

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 180

tgaggacggc ttcagtttga 20

<210> 181

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 181

gaaggagcag ctgcaagaca 20

<210> 182

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 182

aaggagcagc tgcaagacat 20

<210> 183

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 183

cagggctgaa cagatcgaca 20

<210> 184

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 184

ctgggagttt ggacttttca 20

<210> 185

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 185

cctgggagtt tggacttttc 20

<210> 186

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 186

cctagacaaa cctgggagtt 20

<210> 187

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 187

cctgaaaagt ccaaactccc 20

<210> 188

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 188

cggccttctg caacaatacc 20

<210> 189

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 189

cttccaggta ttgttgcaga 20

<210> 190

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 190

ctgagacata gaggtcatct 20

<210> 191

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 191

ggaatgcatc tgagacatag 20

<210> 192

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 192

tgtctcagat gcattccata 20

<210> 193

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 193

tcacctcaag aaatgcctta 20

<210> 194

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 194

attccataag gcatttcttg 20

<210> 195

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 195

gacctgcagg taaatgaaga 20

<210> 196

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 196

acggccagca atcacaacag 20

<210> 197

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 197

agtaccgctg ttgtgattgc 20

<210> 198

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 198

ccctgttggg gtttagcgaa 20

<210> 199

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 199

gccgttcgct aaaccccaac 20

<210> 200

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 200

ccgttcgcta aaccccaaca 20

<210> 201

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 201

ccttgaaagt caccctgttg 20

<210> 202

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 202

gccttgaaag tcaccctgtt 20

<210> 203

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 203

ggccttgaaa gtcaccctgt 20

<210> 204

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 204

ccccaacagg gtgactttca 20

<210> 205

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 205

gggtgacttt caaggccaac 20

<210> 206

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 206

aaaaaccagg aaaggcctgt 20

<210> 207

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 207

caaggccaac aggcctttcc 20

<210> 208

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 208

tctcttataa aaaccaggaa 20

<210> 209

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 209

gaacttctct tataaaaacc 20

<210> 210

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 210

atgaagataa tagtgttcag 20

<210> 211

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 211

tctgaacact attatcttca 20

<210> 212

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 212

ctgaacacta ttatcttcat 20

<210> 213

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 213

attttactta acacaagggt 20

<210> 214

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 214

gaacatttta cttaacacaa 20

<210> 215

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 215

agaacatttt acttaacaca 20

<210> 216

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 216

ggttacagtt cctatcacat 20

<210> 217

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 217

ccaagccgcg ggacattccc 20

<210> 218

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 218

taaatgcaca tgggattcat 20

<210> 219

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 219

cggggagcgg taaatgcaca 20

<210> 220

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 220

ccccggagaa gaaggcaact 20

<210> 221

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 221

acacgccggt tggtggcctc 20

<210> 222

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 222

atagaaagtg gtagcaaagc 20

<210> 223

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 223

atcagcacct ggcagattcc 20

<210> 224

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 224

aatgttatca ttgtcattct 20

<210> 225

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 225

ataacatttt cctgtcaccc 20

<210> 226

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 226

caaaagccgt ggagatactc 20

<210> 227

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 227

cggcttttgc tatgaccaag 20

<210> 228

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 228

cgtacctcca tcagttgctg 20

<210> 229

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 229

ttcagtttgg caaagaagaa 20

<210> 230

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 230

aggatttgtt ggcttttcga 20

<210> 231

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 231

gattggctga tactaacttg 20

<210> 232

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 232

ggtaggtctc attgaaggta 20

<210> 233

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 233

tgagacctac caggacatca 20

<210> 234

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 234

tccagcccct ggacttcaag 20

<210> 235

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 235

cccatttgtt gatggccgct 20

<210> 236

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 236

tccagagcgg ccatcaacaa 20

<210> 237

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 237

gtgtccaata agaccgaagg 20

<210> 238

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 238

agctcattga tggcttccga 20

<210> 239

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 239

actgttctac aaggctgatg 20

<210> 240

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 240

ggctgaaggc acccaggtgc 20

<210> 241

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 241

ttgaagggca actcaagcac 20

<210> 242

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 242

actcttgcag cacctctggg 20

<210> 243

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 243

agccactctt gcagcacctc 20

<210> 244

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 244

actcacccca gaggtgctgc 20

<210> 245

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 245

cagaggtgct gcaagagtgg 20

<210> 246

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 246

ggtgctgcaa gagtggctgg 20

<210> 247

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 247

tcacctcaag aaatgcctta 20

<210> 248

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 248

tccataaggc atttcttgag 20

<210> 249

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 249

ggccgttcgc taaaccccaa 20

<210> 250

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 250

ggccttgaaa gtcaccctgt 20

<210> 251

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 251

aacactatta tcttcatggg 20

<210> 252

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 252

aagaacattt tacttaacac 20

<210> 253

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 253

gaggttacag ttcctatcac at 22

<210> 254

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 254

ctgtcacggg agccctgtgg ac 22

<210> 255

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 255

gccttcttct ccggggagcg gt 22

<210> 256

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 256

gggaattggc cttggacagt tc 22

<210> 257

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 257

tcccgctttg ctaccacttt ct 22

<210> 258

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 258

gcttggtcat agcaaaagcc gt 22

<210> 259

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 259

tatgaccaag ctgggtgcct gt 22

<210> 260

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 260

tcagttgctg gagggtgtca tt 22

<210> 261

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 261

atgacaccct ccagcaactg at 22

<210> 262

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 262

ttgacttcta taggtattta ag 22

<210> 263

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 263

tttctcagat atggtgtcaa ac 22

<210> 264

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 264

tttgtctcca aaaaggcgat tg 22

<210> 265

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 265

gtccaggggc tggagcttgg ct 22

<210> 266

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 266

ggtgattcgg ccttcggtct ta 22

<210> 267

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 267

tgagctcact gttctggtgc tg 22

<210> 268

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 268

taccttgaag taaatggtgt ta 22

<210> 269

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 269

tgctggttaa caccatttac tt 22

<210> 270

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 270

gtggaagtca aagttcagcc ct 22

<210> 271

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 271

ggagagtcgt gttcagcatc ta 22

<210> 272

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 272

ccttcctggt acatcataga tg 22

<210> 273

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 273

cgccgataac ggaacttgcc tt 22

<210> 274

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 274

gttccgttat cggcgcgtgg ct 22

<210> 275

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 275

gtcatcacct ttgaagggca ac 22

<210> 276

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 276

ctccaattca tccagccact ct 22

<210> 277

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 277

agaggtcatc tcggccttct gc 22

<210> 278

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 278

attccataag gcatttcttg ag 22

<210> 279

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 279

tgaagaaggc agtgaagcag ct 22

<210> 280

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 280

gcgaacggcc agcaatcaca ac 22

<210> 281

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 281

ggtttttata agagaagttc ct 22

<210> 282

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 282

tgcaaagaat aagaacattt ta 22

<210> 283

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 283

tgaagaaagt acatgcactt 20

<210> 284

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 284

gaagaaagta catgcacttt 20

<210> 285

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 285

caggggcaag attaagcagc 20

<210> 286

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 286

atcagcatta agaggggcag 20

<210> 287

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 287

aatcagcatt aagaggggca 20

<210> 288

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 288

gaatcagcat taagaggggc 20

<210> 289

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 289

ctcagaatca gcattaagag 20

<210> 290

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 290

cctcagaatc agcattaaga 20

<210> 291

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 291

tcctcagaat cagcattaag 20

<210> 292

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 292

ccctcttaat gctgattctg 20

<210> 293

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 293

gaagaacaca caattatcac 20

<210> 294

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 294

ttatttttac tttatagata 20

<210> 295

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 295

gaatgcataa gtttcagtgg 20

<210> 296

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 296

aatgaatgca taagtttcag 20

<210> 297

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 297

gcattcattt tgtgcattca 20

<210> 298

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 298

ttcattttgt gcattcaagg 20

<210> 299

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 299

tgtgcattca aggcggatga 20

<210> 300

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 300

ttttcatgat tgctttacat 20

<210> 301

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 301

cttttcatga ttgctttaca 20

<210> 302

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 302

cagtgcgaag aatttatata 20

<210> 303

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 303

agtgcgaaga atttatatat 20

<210> 304

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 304

gtgcgaagaa tttatatatg 20

<210> 305

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 305

tgcgaagaat ttatatatgg 20

<210> 306

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 306

tttatatatg ggggatgtga 20

<210> 307

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 307

tcagaatcga tttgaaagtc 20

<210> 308

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 308

tgcaaaaaaa tgtgtacaag 20

<210> 309

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 309

aaaaaatgtg tacaagaggt 20

<210> 310

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 310

tgattacaga taatgcaaac 20

<210> 311

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 311

ataaagacaa cattgcaaca 20

<210> 312

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 312

tcttccaaaa agcagaaatc 20

<210> 313

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 313

aaagccagat ttctgctttt 20

<210> 314

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 314

tgctttttgg aagaagatcc 20

<210> 315

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 315

atataacctc gacatattcc 20

<210> 316

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 316

gaagatcctg gaatatgtcg 20

<210> 317

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 317

tatgtcgagg ttatattacc 20

<210> 318

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 318

ctgattgtta taaaaatacc 20

<210> 319

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 319

cagtgtgaac gtttcaagta 20

<210> 320

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 320

tgtgaacgtt tcaagtatgg 20

<210> 321

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 321

tttcaagtat ggtggatgcc 20

<210> 322

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 322

ttcaagtatg gtggatgcct 20

<210> 323

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 323

caaaattgtt catattgccc 20

<210> 324

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 324

tatgaacaat tttgagacac 20

<210> 325

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 325

tgcaagaaca tttgtgaaga 20

<210> 326

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 326

ctgtattttt ttccagcgaa 20

<210> 327

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 327

tccacctgga aaccattcgc 20

<210> 328

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 328

ttttccagcg aatggtttcc 20

<210> 329

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 329

tccagcgaat ggtttccagg 20

<210> 330

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 330

gggttccata attatccacc 20

<210> 331

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 331

ggtttccagg tggataatta 20

<210> 332

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 332

gttattcaca gcattgagct 20

<210> 333

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 333

agttattcac agcattgagc 20

<210> 334

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 334

cttggttgat tgcggagtca 20

<210> 335

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 335

ccttggttga ttgcggagtc 20

<210> 336

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 336

ctgggaacct tggttgattg 20

<210> 337

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 337

cctgactccg caatcaacca 20

<210> 338

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 338

accaaaaagg ctgggaacct 20

<210> 339

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 339

agattcttac caaaaaggct 20

<210> 340

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 340

aagattctta ccaaaaaggc 20

<210> 341

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 341

accaaggttc ccagcctttt 20

<210> 342

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 342

ccacaagatt cttaccaaaa 20

<210> 343

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 343

cctttttggt aagaatcttg 20

<210> 344

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 344

gtgaaattct aaaaacaatc 20

<210> 345

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 345

tgattgtttt tagaatttca 20

<210> 346

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 346

tagaatttca cggtccctca 20

<210> 347

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 347

gctggagtga gacaccatga 20

<210> 348

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 348

tgctggagtg agacaccatg 20

<210> 349

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 349

cgacacaatc ctctgtctgc 20

<210> 350

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 350

tgtctcactc cagcagacag 20

<210> 351

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 351

gtagtagaat ctgttctcat 20

<210> 352

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 352

ttctactaca attcagtcat 20

<210> 353

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 353

tctactacaa ttcagtcatt 20

<210> 354

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 354

atccactgta cttaaatggg 20

<210> 355

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 355

cacatccact gtacttaaat 20

<210> 356

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 356

ccacatccac tgtacttaaa 20

<210> 357

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 357

tgccgcccat ttaagtacag 20

<210> 358

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 358

ccatttaagt acagtggatg 20

<210> 359

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 359

catttaagta cagtggatgt 20

<210> 360

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 360

atttaagtac agtggatgtg 20

<210> 361

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 361

tttaagtaca gtggatgtgg 20

<210> 362

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 362

tgccctcaga cattcttgtt 20

<210> 363

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 363

cttccaaaca agaatgtctg 20

<210> 364

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 364

ttccaaacaa gaatgtctga 20

<210> 365

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 365

tgtctgaggg catgtaaaaa 20

<210> 366

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 366

atgaaaccta taagaggaag 20

<210> 367

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 367

ctttggatga aacctataag 20

<210> 368

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 368

ggcctccttt tgatattctt 20

<210> 369

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 369

ttcatccaaa gaatatcaaa 20

<210> 370

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 370

atccaaagaa tatcaaaagg 20

<210> 371

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 371

tttttctttt ggttttaatt 20

<210> 372

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 372

ctgcttcttt ctttttcttt 20

<210> 373

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 373

tgtgtgttct tcatcttcct 20

<210> 374

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 374

ttatttttac tttatagata 20

<210> 375

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 375

atccgccttg aatgcacaaa 20

<210> 376

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 376

attcattttg tgcattcaag 20

<210> 377

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 377

tacatgggcc atcatccgcc 20

<210> 378

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 378

tatataaatt cttcgcactg 20

<210> 379

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 379

tattttcact cgacagtgcg 20

<210> 380

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 380

gtgcgaagaa tttatatatg 20

<210> 381

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 381

atgggggatg tgaaggaaat 20

<210> 382

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 382

gaatcgattt gaaagtctgg 20

<210> 383

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 383

ttgattacag ataatgcaaa 20

<210> 384

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 384

tgctttttgg aagaagatcc 20

<210> 385

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 385

aatataacct cgacatattc 20

<210> 386

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 386

gtgtgaacgt ttcaagtatg 20

<210> 387

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 387

gaacaatttt gagacactgg 20

<210> 388

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 388

ttccagcgaa tggtttccag 20

<210> 389

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 389

gagttattca cagcattgag 20

<210> 390

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 390

atggaaccca gctcaatgct 20

<210> 391

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 391

cttggttgat tgcggagtca 20

<210> 392

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 392

ctgggaacct tggttgattg 20

<210> 393

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 393

aggttcccag cctttttggt 20

<210> 394

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 394

cgacacaatc ctctgtctgc 20

<210> 395

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 395

gtgtctcact ccagcagaca 20

<210> 396

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 396

tcccaatgac tgaattgtag 20

<210> 397

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 397

tgggcggcat ttcccaatga 20

<210> 398

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 398

atgccgccca tttaagtaca 20

<210> 399

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 399

aaacaatttt acttccaaac 20

<210> 400

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 400

cctcttatag gtttcatcca 20

<210> 401

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 401

aggcctcctt ttgatattct 20

<210> 402

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 402

gaaatttttg ttaaaaatat 20

<210> 403

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 403

tgggttctgt atttcagaga tg 22

<210> 404

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 404

tcttcattgt gtaaatcatc tc 22

<210> 405

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 405

cagagatgat ttacacaatg aa 22

<210> 406

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 406

tgatttacac aatgaagaaa gt 22

<210> 407

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 407

caggcataca gaagcccaaa gt 22

<210> 408

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 408

ggcaggggca agattaagca gc 22

<210> 409

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 409

aatgctgatt ctgaggaaga tg 22

<210> 410

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 410

tgctgattct gaggaagatg aa 22

<210> 411

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 411

tacatgggcc atcatccgcc tt 22

<210> 412

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 412

tcacatcccc catatataaa tt 22

<210> 413

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 413

aagtctggaa gagtgcaaaa aa 22

<210> 414

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 414

aacctacctc ttgtacacat tt 22

<210> 415

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 415

agggttccca gaaacctacc tc 22

<210> 416

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 416

cactgttttg tctgattgtt at 22

<210> 417

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 417

aggcatccac catacttgaa ac 22

<210> 418

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 418

ttgttcatat tgcccaggca tc 22

<210> 419

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 419

gcctgggcaa tatgaacaat tt 22

<210> 420

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 420

cacaatcctc tgtctgctgg ag 22

<210> 421

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 421

tagtagaatc tgttctcatt gg 22

<210> 422

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 422

aattgtagta gaatctgttc tc 22

<210> 423

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 423

gtcattggga aatgccgccc at 22

<210> 424

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 424

ttgttttcat ttcccccaca tc 22

<210> 425

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 425

uccuaucaca uuggaauaca 20

<210> 426

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 426

gguuacaguu ccuaucacau 20

<210> 427

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 427

gccauguauu ccaaugugau 20

<210> 428

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 428

gugauaggaa cuguaaccuc 20

<210> 429

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 429

ccccucuuac cuuuuuccag 20

<210> 430

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 430

gaacuguaac cucuggaaaa 20

<210> 431

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 431

ccagaagcca augagcagca 20

<210> 432

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 432

cuuuuguccu ugcugcucau 20

<210> 433

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 433

ccuugcugcu cauuggcuuc 20

<210> 434

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 434

cuugcugcuc auuggcuucu 20

<210> 435

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 435

ugggacugcg ugaccuguca 20

<210> 436

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 436

gggacugcgu gaccugucac 20

<210> 437

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 437

guccacaggg cucccgugac 20

<210> 438

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 438

gaccugucac gggagcccug 20

<210> 439

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 439

uggcugugca gauguccaca 20

<210> 440

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 440

uuggcugugc agauguccac 20

<210> 441

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 441

acaucugcac agccaagccg 20

<210> 442

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 442

caucugcaca gccaagccgc 20

<210> 443

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 443

caugggaaug ucccgcggcu 20

<210> 444

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 444

ggauucaugg gaaugucccg 20

<210> 445

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 445

uaaaugcaca ugggauucau 20

<210> 446

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 446

guaaaugcac augggauuca 20

<210> 447

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 447

ggggagcggu aaaugcacau 20

<210> 448

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 448

cggggagcgg uaaaugcaca 20

<210> 449

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 449

caugugcauu uaccgcuccc 20

<210> 450

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 450

uugccuucuu cuccggggag 20

<210> 451

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 451

cucaguugcc uucuucuccg 20

<210> 452

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 452

ccucaguugc cuucuucucc 20

<210> 453

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 453

uccucaguug ccuucuucuc 20

<210> 454

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 454

uuaccgcucc ccggagaaga 20

<210> 455

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 455

cccggagaag aaggcaacug 20

<210> 456

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 456

gaagaaggca acugaggaug 20

<210> 457

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 457

aagaaggcaa cugaggauga 20

<210> 458

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 458

gggcucagaa cagaagaucc 20

<210> 459

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 459

cucagaacag aagaucccgg 20

<210> 460

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 460

cacgccgguu gguggccucc 20

<210> 461

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 461

acacgccggu ugguggccuc 20

<210> 462

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 462

agaucccgga ggccaccaac 20

<210> 463

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 463

uucccagaca cgccgguugg 20

<210> 464

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 464

caguucccag acacgccggu 20

<210> 465

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 465

uggacaguuc ccagacacgc 20

<210> 466

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 466

aggccaccaa ccggcguguc 20

<210> 467

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 467

ggccaccaac cggcgugucu 20

<210> 468

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 468

gcgugucugg gaacugucca 20

<210> 469

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 469

agcaaagcgg gaauuggccu 20

<210> 470

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 470

agugguagca aagcgggaau 20

<210> 471

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 471

auagaaagug guagcaaagc 20

<210> 472

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 472

gauagaaagu gguagcaaag 20

<210> 473

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 473

ugccaggugc ugauagaaag 20

<210> 474

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 474

uaccacuuuc uaucagcacc 20

<210> 475

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 475

ugucauucuu ggaaucugcc 20

<210> 476

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 476

aauguuauca uugucauucu 20

<210> 477

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 477

uggagauacu caggggugac 20

<210> 478

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 478

aaagccgugg agauacucag 20

<210> 479

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 479

aaaagccgug gagauacuca 20

<210> 480

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 480

caaaagccgu ggagauacuc 20

<210> 481

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 481

gucaccccug aguaucucca 20

<210> 482

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 482

cuuggucaua gcaaaagccg 20

<210> 483

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 483

ggcuuuugcu augaccaagc 20

<210> 484

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 484

gcuuuugcua ugaccaagcu 20

<210> 485

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 485

gucauuacag gcacccagcu 20

<210> 486

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 486

uugcuggagg gugucauuac 20

<210> 487

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 487

uaccuccauc aguugcugga 20

<210> 488

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 488

guaccuccau caguugcugg 20

<210> 489

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 489

gucguaccuc caucaguugc 20

<210> 490

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 490

ugacacccuc cagcaacuga 20

<210> 491

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 491

cacccuccag caacugaugg 20

<210> 492

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 492

aucagauguu uucucagaua 20

<210> 493

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 493

ucaguuuggc aaagaagaag 20

<210> 494

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 494

auagagucgg caguucaguu 20

<210> 495

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 495

uguuggcuuu ucgauagagu 20

<210> 496

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 496

uacuaacuug gaggauuugu 20

<210> 497

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 497

auuggcugau acuaacuugg 20

<210> 498

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 498

gcgauuggcu gauacuaacu 20

<210> 499

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 499

uuugucucca aaaaggcgau 20

<210> 500

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 500

guaucagcca aucgccuuuu 20

<210> 501

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 501

uaagggauuu gucuccaaaa 20

<210> 502

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 502

guaggucuca uugaagguaa 20

<210> 503

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 503

gguaggucuc auugaaggua 20

<210> 504

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 504

guccugguag gucucauuga 20

<210> 505

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 505

uaccuucaau gagaccuacc 20

<210> 506

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 506

caacucacug auguccuggu 20

<210> 507

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 507

auaccaacuc acugaugucc 20

<210> 508

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 508

cuaccaggac aucagugagu 20

<210> 509

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 509

gacaucagug aguugguaua 20

<210> 510

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 510

gaaguccagg ggcuggagcu 20

<210> 511

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 511

uggagccaag cuccagcccc 20

<210> 512

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 512

ucaccuugaa guccaggggc 20

<210> 513

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 513

caacucaccu ugaaguccag 20

<210> 514

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 514

gcaacucacc uugaagucca 20

<210> 515

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 515

ugcaacucac cuugaagucc 20

<210> 516

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 516

gcuccagccc cuggacuuca 20

<210> 517

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 517

gauugcucug cauuuuccug 20

<210> 518

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 518

aaaugcagag caauccagag 20

<210> 519

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 519

ccauuuguug auggccgcuc 20

<210> 520

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 520

auuggacacc cauuuguuga 20

<210> 521

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 521

ccagagcggc caucaacaaa 20

<210> 522

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 522

cagagcggcc aucaacaaau 20

<210> 523

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 523

gauucggccu ucggucuuau 20

<210> 524

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 524

ugggugucca auaagaccga 20

<210> 525

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 525

gacaucggug auucggccuu 20

<210> 526

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 526

agggaaugac aucggugauu 20

<210> 527

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 527

ggcuuccgag ggaaugacau 20

<210> 528

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 528

aaucaccgau gucauucccu 20

<210> 529

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 529

agcucauuga uggcuuccga 20

<210> 530

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 530

gagcucauug auggcuuccg 20

<210> 531

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 531

cagaacagug agcucauuga 20

<210> 532

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 532

caucaaugag cucacuguuc 20

<210> 533

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 533

ugagcucacu guucuggugc 20

<210> 534

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 534

ucugaguacc uugaaguaaa 20

<210> 535

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 535

gguuaacacc auuuacuuca 20

<210> 536

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 536

acuuugacuu ccacaggccc 20

<210> 537

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 537

ugauucucuu ccagggccug 20

<210> 538

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 538

ggcugaacuu ugacuuccac 20

<210> 539

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 539

guuccuuccu uguguucuca 20

<210> 540

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 540

aguuccuucc uuguguucuc 20

<210> 541

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 541

aguucagccc ugagaacaca 20

<210> 542

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 542

cagcccugag aacacaagga 20

<210> 543

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 543

aaggaaggaa cuguucuaca 20

<210> 544

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 544

gaacuguucu acaaggcuga 20

<210> 545

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 545

uucagcaucu augauguacc 20

<210> 546

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 546

gcaucuauga uguaccagga 20

<210> 547

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 547

gauaacggaa cuugccuucc 20

<210> 548

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 548

aggaaggcaa guuccguuau 20

<210> 549

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 549

cuucagccac gcgccgauaa 20

<210> 550

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 550

caaguuccgu uaucggcgcg 20

<210> 551

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 551

cguuaucggc gcguggcuga 20

<210> 552

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 552

gcgcguggcu gaaggcaccc 20

<210> 553

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 553

gaagggcaac ucaagcaccu 20

<210> 554

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 554

ugaagggcaa cucaagcacc 20

<210> 555

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 555

gugcuugagu ugcccuucaa 20

<210> 556

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 556

gugaugucau caccuuugaa 20

<210> 557

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 557

ggugauguca ucaccuuuga 20

<210> 558

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 558

caaaggugau gacaucacca 20

<210> 559

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 559

cuugggcaag augaggacca 20

<210> 560

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 560

ucucaggcuu gggcaagaug 20

<210> 561

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 561

gccaggcucu ucucaggcuu 20

<210> 562

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 562

ggccaggcuc uucucaggcu 20

<210> 563

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 563

accuuggcca ggcucuucuc 20

<210> 564

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 564

gcccaagccu gagaagagcc 20

<210> 565

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 565

gccugagaag agccuggcca 20

<210> 566

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 566

guuccuucuc uaccuuggcc 20

<210> 567

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 567

ggugaguucc uucucuaccu 20

<210> 568

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 568

gagccuggcc aagguagaga 20

<210> 569

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 569

agagaaggaa cucaccccag 20

<210> 570

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 570

ccacucuugc agcaccucug 20

<210> 571

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 571

gccacucuug cagcaccucu 20

<210> 572

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 572

agccacucuu gcagcaccuc 20

<210> 573

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 573

ccccagaggu gcugcaagag 20

<210> 574

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 574

agaggugcug caagaguggc 20

<210> 575

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 575

gcaagagugg cuggaugaau 20

<210> 576

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 576

agaguggcug gaugaauugg 20

<210> 577

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 577

ugaauuggag gagaugaugc 20

<210> 578

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 578

auuggaggag augaugcugg 20

<210> 579

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 579

caaugcggaa gcggggcaug 20

<210> 580

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 580

ccguccucaa ugcggaagcg 20

<210> 581

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 581

gccguccuca augcggaagc 20

<210> 582

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 582

agccguccuc aaugcggaag 20

<210> 583

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 583

caugccccgc uuccgcauug 20

<210> 584

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 584

aacugaagcc guccucaaug 20

<210> 585

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 585

ccccgcuucc gcauugagga 20

<210> 586

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 586

ugaggacggc uucaguuuga 20

<210> 587

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 587

gaaggagcag cugcaagaca 20

<210> 588

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 588

aaggagcagc ugcaagacau 20

<210> 589

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 589

cagggcugaa cagaucgaca 20

<210> 590

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 590

cugggaguuu ggacuuuuca 20

<210> 591

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 591

ccugggaguu uggacuuuuc 20

<210> 592

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 592

ccuagacaaa ccugggaguu 20

<210> 593

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 593

ccugaaaagu ccaaacuccc 20

<210> 594

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 594

cggccuucug caacaauacc 20

<210> 595

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 595

cuuccaggua uuguugcaga 20

<210> 596

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 596

cugagacaua gaggucaucu 20

<210> 597

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 597

ggaaugcauc ugagacauag 20

<210> 598

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 598

ugucucagau gcauuccaua 20

<210> 599

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 599

ucaccucaag aaaugccuua 20

<210> 600

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 600

auuccauaag gcauuucuug 20

<210> 601

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 601

gaccugcagg uaaaugaaga 20

<210> 602

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 602

acggccagca aucacaacag 20

<210> 603

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 603

aguaccgcug uugugauugc 20

<210> 604

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 604

cccuguuggg guuuagcgaa 20

<210> 605

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 605

gccguucgcu aaaccccaac 20

<210> 606

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 606

ccguucgcua aaccccaaca 20

<210> 607

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 607

ccuugaaagu cacccuguug 20

<210> 608

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 608

gccuugaaag ucacccuguu 20

<210> 609

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 609

ggccuugaaa gucacccugu 20

<210> 610

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 610

ccccaacagg gugacuuuca 20

<210> 611

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 611

gggugacuuu caaggccaac 20

<210> 612

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 612

aaaaaccagg aaaggccugu 20

<210> 613

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 613

caaggccaac aggccuuucc 20

<210> 614

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 614

ucucuuauaa aaaccaggaa 20

<210> 615

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 615

gaacuucucu uauaaaaacc 20

<210> 616

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 616

augaagauaa uaguguucag 20

<210> 617

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 617

ucugaacacu auuaucuuca 20

<210> 618

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 618

cugaacacua uuaucuucau 20

<210> 619

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 619

auuuuacuua acacaagggu 20

<210> 620

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 620

gaacauuuua cuuaacacaa 20

<210> 621

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 621

agaacauuuu acuuaacaca 20

<210> 622

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 622

gguuacaguu ccuaucacau 20

<210> 623

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 623

ccaagccgcg ggacauuccc 20

<210> 624

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 624

uaaaugcaca ugggauucau 20

<210> 625

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 625

cggggagcgg uaaaugcaca 20

<210> 626

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 626

ccccggagaa gaaggcaacu 20

<210> 627

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 627

acacgccggu ugguggccuc 20

<210> 628

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 628

auagaaagug guagcaaagc 20

<210> 629

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 629

aucagcaccu ggcagauucc 20

<210> 630

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 630

aauguuauca uugucauucu 20

<210> 631

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 631

auaacauuuu ccugucaccc 20

<210> 632

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 632

caaaagccgu ggagauacuc 20

<210> 633

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 633

cggcuuuugc uaugaccaag 20

<210> 634

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 634

cguaccucca ucaguugcug 20

<210> 635

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 635

uucaguuugg caaagaagaa 20

<210> 636

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 636

aggauuuguu ggcuuuucga 20

<210> 637

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 637

gauuggcuga uacuaacuug 20

<210> 638

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 638

gguaggucuc auugaaggua 20

<210> 639

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 639

ugagaccuac caggacauca 20

<210> 640

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 640

uccagccccu ggacuucaag 20

<210> 641

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 641

cccauuuguu gauggccgcu 20

<210> 642

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 642

uccagagcgg ccaucaacaa 20

<210> 643

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 643

guguccaaua agaccgaagg 20

<210> 644

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 644

agcucauuga uggcuuccga 20

<210> 645

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 645

acuguucuac aaggcugaug 20

<210> 646

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 646

ggcugaaggc acccaggugc 20

<210> 647

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 647

uugaagggca acucaagcac 20

<210> 648

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 648

acucuugcag caccucuggg 20

<210> 649

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 649

agccacucuu gcagcaccuc 20

<210> 650

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 650

acucacccca gaggugcugc 20

<210> 651

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 651

cagaggugcu gcaagagugg 20

<210> 652

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 652

ggugcugcaa gaguggcugg 20

<210> 653

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 653

ucaccucaag aaaugccuua 20

<210> 654

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 654

uccauaaggc auuucuugag 20

<210> 655

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 655

ggccguucgc uaaaccccaa 20

<210> 656

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 656

ggccuugaaa gucacccugu 20

<210> 657

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 657

aacacuauua ucuucauggg 20

<210> 658

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 658

aagaacauuu uacuuaacac 20

<210> 659

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 659

gagguuacag uuccuaucac au 22

<210> 660

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 660

cugucacggg agcccugugg ac 22

<210> 661

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 661

gccuucuucu ccggggagcg gu 22

<210> 662

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 662

gggaauuggc cuuggacagu uc 22

<210> 663

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 663

ucccgcuuug cuaccacuuu cu 22

<210> 664

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 664

gcuuggucau agcaaaagcc gu 22

<210> 665

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 665

uaugaccaag cugggugccu gu 22

<210> 666

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 666

ucaguugcug gaggguguca uu 22

<210> 667

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 667

augacacccu ccagcaacug au 22

<210> 668

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 668

uugacuucua uagguauuua ag 22

<210> 669

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 669

uuucucagau auggugucaa ac 22

<210> 670

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 670

uuugucucca aaaaggcgau ug 22

<210> 671

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 671

guccaggggc uggagcuugg cu 22

<210> 672

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 672

ggugauucgg ccuucggucu ua 22

<210> 673

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 673

ugagcucacu guucuggugc ug 22

<210> 674

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 674

uaccuugaag uaaauggugu ua 22

<210> 675

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 675

ugcugguuaa caccauuuac uu 22

<210> 676

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 676

guggaaguca aaguucagcc cu 22

<210> 677

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 677

ggagagucgu guucagcauc ua 22

<210> 678

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 678

ccuuccuggu acaucauaga ug 22

<210> 679

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 679

cgccgauaac ggaacuugcc uu 22

<210> 680

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 680

guuccguuau cggcgcgugg cu 22

<210> 681

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 681

gucaucaccu uugaagggca ac 22

<210> 682

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 682

cuccaauuca uccagccacu cu 22

<210> 683

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 683

agaggucauc ucggccuucu gc 22

<210> 684

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 684

auuccauaag gcauuucuug ag 22

<210> 685

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 685

ugaagaaggc agugaagcag cu 22

<210> 686

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 686

gcgaacggcc agcaaucaca ac 22

<210> 687

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 687

gguuuuuaua agagaaguuc cu 22

<210> 688

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 688

ugcaaagaau aagaacauuu ua 22

<210> 689

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 689

ugaagaaagu acaugcacuu 20

<210> 690

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 690

gaagaaagua caugcacuuu 20

<210> 691

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 691

caggggcaag auuaagcagc 20

<210> 692

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 692

aucagcauua agaggggcag 20

<210> 693

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 693

aaucagcauu aagaggggca 20

<210> 694

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 694

gaaucagcau uaagaggggc 20

<210> 695

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 695

cucagaauca gcauuaagag 20

<210> 696

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 696

ccucagaauc agcauuaaga 20

<210> 697

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 697

uccucagaau cagcauuaag 20

<210> 698

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 698

cccucuuaau gcugauucug 20

<210> 699

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 699

gaagaacaca caauuaucac 20

<210> 700

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 700

uuauuuuuac uuuauagaua 20

<210> 701

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 701

gaaugcauaa guuucagugg 20

<210> 702

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 702

aaugaaugca uaaguuucag 20

<210> 703

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 703

gcauucauuu ugugcauuca 20

<210> 704

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 704

uucauuuugu gcauucaagg 20

<210> 705

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 705

ugugcauuca aggcggauga 20

<210> 706

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 706

uuuucaugau ugcuuuacau 20

<210> 707

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 707

cuuuucauga uugcuuuaca 20

<210> 708

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 708

cagugcgaag aauuuauaua 20

<210> 709

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 709

agugcgaaga auuuauauau 20

<210> 710

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 710

gugcgaagaa uuuauauaug 20

<210> 711

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 711

ugcgaagaau uuauauaugg 20

<210> 712

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 712

uuuauauaug ggggauguga 20

<210> 713

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 713

ucagaaucga uuugaaaguc 20

<210> 714

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 714

ugcaaaaaaa uguguacaag 20

<210> 715

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 715

aaaaaaugug uacaagaggu 20

<210> 716

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 716

ugauuacaga uaaugcaaac 20

<210> 717

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 717

auaaagacaa cauugcaaca 20

<210> 718

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 718

ucuuccaaaa agcagaaauc 20

<210> 719

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 719

aaagccagau uucugcuuuu 20

<210> 720

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 720

ugcuuuuugg aagaagaucc 20

<210> 721

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 721

auauaaccuc gacauauucc 20

<210> 722

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 722

gaagauccug gaauaugucg 20

<210> 723

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 723

uaugucgagg uuauauuacc 20

<210> 724

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 724

cugauuguua uaaaaauacc 20

<210> 725

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 725

cagugugaac guuucaagua 20

<210> 726

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 726

ugugaacguu ucaaguaugg 20

<210> 727

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 727

uuucaaguau gguggaugcc 20

<210> 728

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 728

uucaaguaug guggaugccu 20

<210> 729

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 729

caaaauuguu cauauugccc 20

<210> 730

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 730

uaugaacaau uuugagacac 20

<210> 731

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 731

ugcaagaaca uuugugaaga 20

<210> 732

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 732

cuguauuuuu uuccagcgaa 20

<210> 733

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 733

uccaccugga aaccauucgc 20

<210> 734

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 734

uuuuccagcg aaugguuucc 20

<210> 735

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 735

uccagcgaau gguuuccagg 20

<210> 736

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 736

ggguuccaua auuauccacc 20

<210> 737

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 737

gguuuccagg uggauaauua 20

<210> 738

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 738

guuauucaca gcauugagcu 20

<210> 739

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 739

aguuauucac agcauugagc 20

<210> 740

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 740

cuugguugau ugcggaguca 20

<210> 741

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 741

ccuugguuga uugcggaguc 20

<210> 742

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 742

cugggaaccu ugguugauug 20

<210> 743

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 743

ccugacuccg caaucaacca 20

<210> 744

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 744

accaaaaagg cugggaaccu 20

<210> 745

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 745

agauucuuac caaaaaggcu 20

<210> 746

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 746

aagauucuua ccaaaaaggc 20

<210> 747

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 747

accaagguuc ccagccuuuu 20

<210> 748

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 748

ccacaagauu cuuaccaaaa 20

<210> 749

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 749

ccuuuuuggu aagaaucuug 20

<210> 750

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 750

gugaaauucu aaaaacaauc 20

<210> 751

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 751

ugauuguuuu uagaauuuca 20

<210> 752

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 752

uagaauuuca cggucccuca 20

<210> 753

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 753

gcuggaguga gacaccauga 20

<210> 754

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 754

ugcuggagug agacaccaug 20

<210> 755

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 755

cgacacaauc cucugucugc 20

<210> 756

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 756

ugucucacuc cagcagacag 20

<210> 757

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 757

guaguagaau cuguucucau 20

<210> 758

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 758

uucuacuaca auucagucau 20

<210> 759

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 759

ucuacuacaa uucagucauu 20

<210> 760

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 760

auccacugua cuuaaauggg 20

<210> 761

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 761

cacauccacu guacuuaaau 20

<210> 762

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 762

ccacauccac uguacuuaaa 20

<210> 763

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 763

ugccgcccau uuaaguacag 20

<210> 764

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 764

ccauuuaagu acaguggaug 20

<210> 765

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 765

cauuuaagua caguggaugu 20

<210> 766

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 766

auuuaaguac aguggaugug 20

<210> 767

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 767

uuuaaguaca guggaugugg 20

<210> 768

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 768

ugcccucaga cauucuuguu 20

<210> 769

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 769

cuuccaaaca agaaugucug 20

<210> 770

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 770

uuccaaacaa gaaugucuga 20

<210> 771

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 771

ugucugaggg cauguaaaaa 20

<210> 772

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 772

augaaaccua uaagaggaag 20

<210> 773

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 773

cuuuggauga aaccuauaag 20

<210> 774

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 774

ggccuccuuu ugauauucuu 20

<210> 775

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 775

uucauccaaa gaauaucaaa 20

<210> 776

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 776

auccaaagaa uaucaaaagg 20

<210> 777

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 777

uuuuucuuuu gguuuuaauu 20

<210> 778

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 778

cugcuucuuu cuuuuucuuu 20

<210> 779

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 779

uguguguucu ucaucuuccu 20

<210> 780

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 780

uuauuuuuac uuuauagaua 20

<210> 781

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 781

auccgccuug aaugcacaaa 20

<210> 782

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 782

auucauuuug ugcauucaag 20

<210> 783

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 783

uacaugggcc aucauccgcc 20

<210> 784

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 784

uauauaaauu cuucgcacug 20

<210> 785

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 785

uauuuucacu cgacagugcg 20

<210> 786

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 786

gugcgaagaa uuuauauaug 20

<210> 787

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 787

augggggaug ugaaggaaau 20

<210> 788

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 788

gaaucgauuu gaaagucugg 20

<210> 789

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 789

uugauuacag auaaugcaaa 20

<210> 790

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 790

ugcuuuuugg aagaagaucc 20

<210> 791

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 791

aauauaaccu cgacauauuc 20

<210> 792

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 792

gugugaacgu uucaaguaug 20

<210> 793

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 793

gaacaauuuu gagacacugg 20

<210> 794

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 794

uuccagcgaa ugguuuccag 20

<210> 795

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 795

gaguuauuca cagcauugag 20

<210> 796

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 796

auggaaccca gcucaaugcu 20

<210> 797

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 797

cuugguugau ugcggaguca 20

<210> 798

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 798

cugggaaccu ugguugauug 20

<210> 799

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 799

agguucccag ccuuuuuggu 20

<210> 800

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 800

cgacacaauc cucugucugc 20

<210> 801

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 801

gugucucacu ccagcagaca 20

<210> 802

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 802

ucccaaugac ugaauuguag 20

<210> 803

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 803

ugggcggcau uucccaauga 20

<210> 804

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 804

augccgccca uuuaaguaca 20

<210> 805

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 805

aaacaauuuu acuuccaaac 20

<210> 806

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 806

ccucuuauag guuucaucca 20

<210> 807

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 807

aggccuccuu uugauauucu 20

<210> 808

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 808

gaaauuuuug uuaaaaauau 20

<210> 809

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 809

uggguucugu auuucagaga ug 22

<210> 810

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 810

ucuucauugu guaaaucauc uc 22

<210> 811

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 811

cagagaugau uuacacaaug aa 22

<210> 812

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 812

ugauuuacac aaugaagaaa gu 22

<210> 813

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 813

caggcauaca gaagcccaaa gu 22

<210> 814

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 814

ggcaggggca agauuaagca gc 22

<210> 815

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 815

aaugcugauu cugaggaaga ug 22

<210> 816

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 816

ugcugauucu gaggaagaug aa 22

<210> 817

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 817

uacaugggcc aucauccgcc uu 22

<210> 818

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 818

ucacaucccc cauauauaaa uu 22

<210> 819

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 819

aagucuggaa gagugcaaaa aa 22

<210> 820

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 820

aaccuaccuc uuguacacau uu 22

<210> 821

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 821

aggguuccca gaaaccuacc uc 22

<210> 822

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 822

cacuguuuug ucugauuguu au 22

<210> 823

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 823

aggcauccac cauacuugaa ac 22

<210> 824

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 824

uuguucauau ugcccaggca uc 22

<210> 825

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 825

gccugggcaa uaugaacaau uu 22

<210> 826

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 826

cacaauccuc ugucugcugg ag 22

<210> 827

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 827

uaguagaauc uguucucauu gg 22

<210> 828

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 828

aauuguagua gaaucuguuc uc 22

<210> 829

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 829

gucauuggga aaugccgccc au 22

<210> 830

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> 引导序列

<400> 830

uuguuuucau uucccccaca uc 22

<210> 831

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 831

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 832

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 832

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 833

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 833

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 834

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 834

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 835

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 835

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 836

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 836

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 837

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 837

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 838

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 838

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 839

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 839

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 840

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 840

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 841

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 841

Asp Arg Leu Arg Arg

1 5

<210> 842

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 842

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 843

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 843

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 844

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 844

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 845

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 845

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 846

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 核定位序列

<400> 846

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 847

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 847

gtccatctcc tccgccagcg 20

<210> 848

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 848

gagagggcca gaaatcaccc aa 22

相关技术
  • 抗凝因子的基因编辑
  • 一种抗凝血因子XI活化形式因子XIa的抗体及其制备方法和应用
技术分类

06120112831782