掌桥专利:专业的专利平台
掌桥专利
首页

新的核酸酶结构域及其利用

文献发布时间:2023-06-19 11:17:41



技术领域

本发明涉及新的核酸酶结构域、和包含该核酸酶结构域的人工核酸切割酶。

背景技术

近年来,作为基因组编辑工具,已经可以利用锌指核酸酶(Zinc-fingernuclease;ZFN)、转录激活因子样效应物核酸酶(Transcription activator-likeeffector nuclease;TALEN)、CRISPR/Cas(成簇的规律间隔的短回文重复/CRISPR关联,Clustered regularly interspaced short palindromic repeat/CRISPR-associated)系统这样的能够特异性地识别目标序列、在其邻近切割的核酸酶。这些核酸酶包含核酸结合结构域和核酸切割结构域,能够在基因组DNA的特定碱基序列造成DNA双链的切割(DNAdouble-strand break;DSB)。作为由这些核酸酶带来的DSB的修复,已知容易产生修复错误的非同源末端连接修复(nonhomologous end joining;NHEJ)和同源重组修复(homologousrecombination;HR)等。由于细胞修复DSB时主要使用NHEJ途径进行修复,因而容易产生修复错误、引起移码,其结果造成丧失基因功能。这样,能够利用细胞所具有的机理进行基因破坏等的基因组编辑技术在生命科学中逐渐被广泛利用,例如向疾病研究、农作物的应用等。

在ZFN、TALEN中,通常作为核酸切割结构域使用FokI核酸酶结构域(以下也称为“FokI-ND”)。已知FokI-ND对核酸具有结合能力,但不识别碱基序列,另外通过形成二聚体而切割作为目标的核酸。因此,在ZFN、TALEN中,需要2个核酸结合结构域的目标序列,FokI-ND在这2个目标序列所夹的间隔物序列内发挥作用,造成DSB。在ZFN中,将2个目标序列分别称为目标半位点L(Target half-site L)和目标半位点R(Target half-site R)。

ZFN包含FokI-ND、由锌指蛋白(Zinc-finger protein;ZFP)构成的核酸结合结构域、和连接它们的连接物(intermolecular linker)。在ZFN中,来自间隔物序列的长度、连接物的性质的制约强,其设计需要工夫。因此,作为涉及ZFN的技术,报告了间隔物序列的长度、连接物的改变(非专利文献1)。

另外,报告了TALE等核酸结合结构域、与Clostridium spec.7_2_43FAA株来源的核酸酶结构域的融合蛋白(专利文献1)。

现有技术文献

专利文献

专利文献1:美国专利第9410134号

非专利文献

非专利文献1:Handel,E.M.,Alwin,S.and Cathomen,T.(2009)Expanding orrestricting the目标site repertoire of zinc-finger nucleases:the inter-domainlinker as a major determinant of目标site selectivity.Mol Ther,17,104-111

发明内容

发明要解决的课题

本发明的目的是提供切割活性、切割效率高、且由目标序列、间隔物序列、或连接物序列等造成的制约少的新的核酸酶结构域、和包含该核酸酶结构域的人工核酸切割酶。

用于解决课题的手段

本发明者们探索了与作为基因组编辑酶的核酸切割结构域现在标准地使用的FokI-ND不同的核酸酶结构域,结果发现了在切割活性、特异性、细胞毒性、目标序列的选择性等功能性方面超过现有的FokI-ND的新的核酸酶结构域,从而完成了本发明。

即,本发明提供以下方案。

(1)人工核酸切割酶,包含核酸酶结构域和核酸结合结构域,

所述核酸酶结构域是包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽或其突变体多肽。

(2)根据上述(1)所述的人工核酸切割酶,进一步包含位于所述核酸酶结构域与所述核酸结合结构域之间的连接物。

(3)根据上述(1)或(2)所述的人工核酸切割酶,所述核酸结合结构域包含锌指、TALE、CRISPR/Cas或PPR。

(4)分离的核酸,包含编码上述(1)~(3)的任一项所述的人工核酸切割酶的核酸序列。

(5)载体,包含上述(4)所述的核酸或者其转录产物或翻译产物。

(6)改变目标核酸的方法,包括将上述(1)~(3)的任一项所述的人工核酸切割酶、上述(4)所述的核酸或上述(5)所述的载体导入细胞。

(7)根据上述(6)所述的方法,所述人工核酸切割酶是2种以上的人工核酸切割酶,所述核酸是编码该2种以上的人工核酸切割酶的核酸,或者所述载体是包含该核酸、其转录产物或其翻译产物的载体。

(8)用于改变目标核酸的试剂盒,包含上述(1)~(3)的任一项所述的人工核酸切割酶、上述(4)所述的核酸或上述(5)所述的载体。

(9)根据上述(8)所述的试剂盒,所述人工核酸切割酶是2种以上的人工核酸切割酶,所述核酸是编码该2种以上的人工核酸切割酶的核酸,或者所述载体是包含该核酸、其转录产物或其翻译产物的载体。

(10)包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽或其突变体多肽。

(11)分离的核酸,包含编码上述(10)所述的多肽或其突变体多肽的核酸序列。

(12)载体,包含上述(11)所述的核酸或者其转录产物或翻译产物。

发明的效果

本发明的核酸酶结构域,提供在切割活性、特异性、目标序列的选择性等功能性方面比与现有的FokI-ND优异的核酸切割作用。通过使本发明的核酸酶结构域与核酸结合结构域结合,从而提供活性高、具有目标序列灵活性、特异性地切割目标序列的核酸切割酶。该核酸切割酶作为基因组编辑工具是非常有用的。

附图说明

图1A是ZFA36-ND的示意图。上半部分显示2个ZFN目标部位被间隔物序列分开。下半部分显示ZFN包含3个锌指分子、短的7个氨基酸的TGAAARA连接物和FokI的核酸酶结构域。如果一对ZFN与被规定的长度的间隔物序列隔开的目标半位点结合,则核酸酶结构域二聚体化,能够切割核酸。

图1B显示FokI核酸酶结构域同源物的氨基酸序列比对。使用MAFFT比对氨基酸序列。将确定异源二聚体核酸酶结构域的氨基酸和对应的点突变用箭头、星号和冒号表示。图中,“Fok1”是指FokI-ND。

图1C显示实施例2中实施的利用基于HEK293T细胞的SSA测定而得的细胞活性的结果。将数据用平均±SEM(n=3)表示。+和-显示锌指目标序列报告物质粒的有无。

图2A显示核酸酶结构域对目标基因组的切割活性。将转染了ZFA36-ND的CHO-K1细胞在37℃孵育,在72小时之后回收,接着制备基因组DNA模板。将包含ZFA36目标部位的PCR产物用GeneArt基因组切割检测试剂盒切割。将切割片段通过电泳(MultiNA系统)进行分析。由非切割条带和更大的切割片段的摩尔浓度计算切割效率。图中,“FokI”是指FokI-ND。

图2B用切割效率显示实施例3中实施的、核酸酶结构域对目标基因组的切割活性试验的结果。

图3显示表示ZFA36-ND的表达水平的蛋白质印记(Western blot)分析结果。通过HEK293T细胞使AcV5标签-ZFA36-ND表达。将转染后的细胞在72小时之后回收,用针对AcV5标签和α-微管蛋白两者的抗体探测细胞溶解物。图中,“FokI”是指FokI-ND。

图4显示HEK293T细胞中的ZFA36-ND-EGFP的LSM图像。是ZFA36-ND-EGFP过表达细胞的显微镜照片。通过DAPI染色将DNA可视化。比例尺:40μm。图中,“FokI”是指FokI-ND。

图5显示不同的间隔物长度下的ZFA36-ND连接物突变体的报告物活性图谱。显示实施例5中实施的SSA报告物测定的结果。ZFN连接物突变体和间隔物长度作为6bp(A)、5bp(B)和7bp(C)显示。数据是相对于6bp间隔物长度的FokI的TGAAARA-连接物的荧光素酶活性进行归一化而得的。将数据用平均±SEM(n=3)表示。图中,“FokI”是指FokI-ND。

图6显示ZFA36-ND-Sharkey突变体的报告物活性图谱。图中,“FokI”是指FokI-ND。(A)ZFN的示意图。对于相当于FokI-ND的414-445位的氨基酸序列的ND1、ND2和各sharkey突变体的序列进行显示。图中,氨基酸数基于各核酸酶结构域的全长氨基酸。(B)显示实施例6中实施的SSA报告物测定的结果。-表示不存在ZFN质粒。将数据用平均±SEM(n=3)表示。

图7显示通过基于细胞的SSA测定而测定得到的具有异源二聚体型突变的ZFN的单独使用时的核酸酶活性。用各ZFN表达质粒、报告物质粒和参照质粒同时转染HEK293T细胞并进行Dual-Luciferase(双荧光素酶报告系统)测定。转染之后,将细胞孵育24小时,溶解,分析荧光素酶活性。(A)hPGRN_ZFL1-6bp-hPGRN_ZFL1报告物。(B)ZFA36-6bp-ZFA36报告物。图中,“FokI”是指FokI-ND。

图8A显示利用SSA报告物测定得到的、同源二聚体和异源二聚体的切割反应的分析。用各对ZFN表达质粒、报告物质粒和参照质粒同时转染HEK293T细胞并进行Dual-Luciferase测定。转染之后将细胞孵育24小时,溶解,分析荧光素酶活性。将数据用平均±SEM(n=3)表示。图中,“FokI”是指FokI-ND。

图8B显示利用Cel-I测定得到的、同源二聚体和异源二聚体的切割反应的分析。将转染了各ZFN质粒的CHO-K1细胞在37℃孵育72小时。接着,从转染后的细胞制备基因组DNA,扩增包含ZFA36-ZFL1目标部位的片段。将PCR产物用GeneArt基因组切割检测试剂盒切割。将切割而得的片段通过琼脂糖凝胶电泳进行分析。图中,“FokI”是指FokI-ND。

图9显示通过基于细胞的SSA测定而测定得到的杂种ZFN的核酸酶活性。基于HEK293T细胞的SSA测定。用各对ZFN表达质粒、报告物质粒和参照质粒同时转染HEK293T细胞并进行Dual-Luciferase测定。转染之后将细胞孵育24小时,溶解,分析荧光素酶活性。白色和灰色的柱分别表示ZFA36-FokI和ZFN不存在。(A)ZFL1-FokI-DDD和适当的核酸酶结构域。(B)ZFL1-ND1-DDD和适当的核酸酶结构域。(C)ZFL1-ND2-DDD和适当的核酸酶结构域。将数据用平均±SEM(n=3)表示。图中,“FokI”是指FokI-ND。

图10显示实施例9中实施的目标部位的测序分析结果。图中,“FokI”是指FokI-ND。

图11A显示实施例10中实施的、包含本发明的新的核酸酶结构域和TALE的人工核酸切割酶的切割试验的结果。图中,“FokI”是指FokI-ND。

图11B显示实施例10中实施的、包含本发明的新的核酸酶结构域和TALE的人工核酸切割酶的切割试验的结果。图中,“FokI”是指FokI-ND。

图12A显示将通过电穿孔法导入植物细胞中的ZF-ND1和ZF-FokI的核酸酶活性通过SSA报告物测定进行检测而得的结果。

图12B是将图12A的结果作图而得的。

图13显示将通过蛋白质转导法导入植物细胞中的ZF-ND1和ZF-FokI的核酸酶活性通过SSA报告物测定进行检测而得的结果。

具体实施方式

为了开发比FokI-ND高性能的新的核酸酶结构域,以FokI-ND的氨基酸序列为基础,通过Protein-protein BLAST进行有同源性的天然原材料的检索。从存在于与FokI-ND的同源性为35%~70%的范围内的同源序列中选择数种,进一步进行分析,发现了具有比FokI-ND优异的核酸酶活性的核酸酶结构域1(以下称为“ND1”)和核酸酶结构域2(以下称为“ND2”)。

将包含ND1的全长蛋白质(来源于芽孢杆菌(Bacillus)SGD-V-76)的氨基酸序列示于序列号1,将其碱基序列示于序列号2。将包含ND2的全长蛋白质(来源于肉毒杆菌)的氨基酸序列示于序列号3,将其碱基序列示于序列号4。ND1典型地是相当于序列号1的391~585位的部分肽,ND2典型地是相当于序列号3的389~579位的部分肽。

ND1具有与FokI-ND的氨基酸序列同一性70%,ND2具有与FokI-ND的氨基酸序列同一性57%,但是,是本发明中首次分离出的新的多肽。

因此,本发明提供作为包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽或其突变体多肽的核酸酶结构域(以下也称为“本发明的核酸酶结构域”)。本发明的核酸酶结构域包含作为由序列号1的391~585位或序列号3的389~579位所示的氨基酸序列组成的多肽或其突变体多肽的核酸酶结构域。换言之,本发明提供包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽或其突变体多肽、例如由序列号1的391~585位或序列号3的389~579位所示的氨基酸序列组成的多肽或其突变体多肽作为核酸酶结构域的使用。

本说明书中,所谓包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽的突变体多肽,是具有与序列号1的391~585位或序列号3的389~579位所示的氨基酸序列类似的氨基酸序列、并且具有核酸酶活性的多肽。作为该突变体多肽的例子,可列举包含在序列号1的391~585位或序列号3的389~579位所示的氨基酸序列中置换、缺失、插入或添加了1至数个氨基酸残基的氨基酸序列、且具有核酸酶活性的多肽;和由在序列号1的391~585位或序列号3的389~579位所示的氨基酸序列中置换、缺失、插入或添加1至数个氨基酸的氨基酸序列组成、且具有核酸酶活性的多肽。其中,“1至数个”例如为1~10个、优选为1~6个,例如为1个、2个、3个、4个或5个。

另外作为别的例子,该突变体多肽可以是包含相对于序列号1的391~585位或序列号3的389~579位所示的氨基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%的序列同一性的氨基酸序列、且具有核酸酶活性的多肽,例如,由相对于序列号1的391~585位或序列号3的389~579位所示的氨基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%的序列同一性的氨基酸序列组成、且具有核酸酶活性的多肽。另外,作为该突变体多肽的进一步的例子,可列举包含由相对于序列号2的1171~1755位或序列号4的1165~1737位所示的碱基序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%的序列同一性的碱基序列编码的氨基酸序列、且具有核酸酶活性的多肽;和由由相对于序列号2的1171~1755位或序列号4的1165~1737位所示的碱基序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%的序列同一性的碱基序列所编码的氨基酸序列组成、且具有核酸酶活性的多肽。

本发明中,氨基酸序列的“序列同一性”通过将在序列的一致最大的状态下比对的2个序列进行比较而确定。求出序列同一性的数值(%)的方法是本领域技术人员公知的。作为用于获得最适的比对和序列同一性的算法,利用本领域技术人员已知的任意算法(例如,BLAST算法、FASTA算法等)即可。氨基酸序列的序列同一性可以使用例如BLASTP、FASTA等测序分析软件来确定。

进而,上述的突变体多肽优选可以包含在相当于FokI的氨基酸序列中的483位的位置具有天冬氨酸(以下称为“D483”)、和/或在相当于FokI的氨基酸序列中的487位的位置具有精氨酸(以下称为“R487”)的氨基酸序列。另外,上述的突变体多肽优选可以包含在相当于FokI的氨基酸序列中的450位、467位和469位的位置分别具有天冬氨酸、天冬氨酸和赖氨酸(以下分别称为“D450”、“D467”和“K469”)的氨基酸序列。进一步优选上述突变体多肽包含具有D483和/或R487、且具有D450、D467和K469的氨基酸序列。D483和R487是被认为在FokI-ND形成具有切割活性的二聚体时必须的氨基酸残基,在ND1和ND2的氨基酸序列中保持。进而关于FokI-ND的催化部位,通过使用氨基酸置换的分析而搞清楚了D450和D467参与核酸的切割。进而搞清楚了也包含这些氨基酸邻近的K469的序列是在EcoRI、EcoRV中也发现的基序,这些氨基酸参与磷酸二酯键的切割活性。D450、D467和K469在ND1和ND2的氨基酸序列中保持。

另外,上述的突变体多肽为了本发明的核酸酶结构域在核酸切割时形成异源二聚体,可以在相当于FokI的氨基酸序列中的483位、487位和496位的位置包含天冬氨酸(以下称为“D483、D487和D496”)(以下称为“DDD型突变体”),或者可以在相当于FokI的氨基酸序列中的483位、487位和537位的位置包含精氨酸(以下也为“R483、R487和R537”)(以下也称为“RRR型突变体”)。

本发明的包含序列号1的391~585位或序列号3的389~579位所示的氨基酸序列的多肽、其突变体多肽的链长通常为500氨基酸以下,例如为400氨基酸以下、300氨基酸以下、或200氨基酸以下。

进而,本说明书中,上述的突变体多肽也包含含有修饰氨基酸和/或非天然氨基酸的多肽。作为修饰氨基酸不限定,可列举例如,甲基化、酯化、酰胺化、乙酰化、烷基化、卤化等。该修饰氨基酸和非天然氨基酸可以通过公知的方法导入。

本发明的核酸酶结构域具有与FokI-ND同等以上的核酸酶活性。例如,本发明的核酸酶结构域与FokI-ND相比具有至少0.8倍、至少0.9倍、至少1倍、至少1.3倍、至少1.5倍、至少1.8倍、至少2倍、至少2.3倍、至少2.5倍、至少2.8倍、至少3倍、至少3.3倍、至少3.5倍、至少3.8倍、或至少4倍的核酸酶活性。核酸酶活性可以通过该领域已知的方法确认。例如,可以将核酸酶结构域装入ZFN系统,通过SSA(single-strand annealing)法和Cel-I法测定核酸切割活性、例如DNA切割活性,从而确认。

本发明的核酸酶结构域如后所述,在人工核酸切割酶中的连接物的选择中的灵活性和成为目标切割部位的间隔物的选择中的灵活性方面,具有与FokI-ND不同的性质(实施例5)。另外,即使在本发明的核酸酶结构域中导入已知在FokI-ND中带来活性上升的Sharkey突变,也未见活性的上升(实施例6)。另外,本发明的ND1与FokI-ND不同,即使形成异源二聚体核酸酶活性也不降低(实施例7)。这样,本发明的核酸酶结构域是具有与现有的FokI-ND相比更优异的性质和/或不同的性质的核酸酶结构域。

本发明的核酸酶结构域可以是分离核酸酶结构域。本发明还提供编码本发明的核酸酶结构域的分离核酸。本说明书中,“分离”是指从自然界或生物体分离出的状态。

本发明的人工核酸切割酶包含本发明的核酸酶结构域和核酸结合结构域。该人工核酸切割酶介由核酸结合结构域与核酸上的目标序列结合,通过核酸酶结构域而在目标切割部位切割核酸。因此,该人工核酸切割酶是能够特异性地切割核酸中的目标部位的序列特异的核酸切割酶。

本说明书中,“核酸”包含DNA和RNA的两者。作为本发明的人工核酸切割酶所切割的核酸,可列举例如,双链DNA、单链DNA、或单链RNA。作为该DNA,例如,虽然不限定,但可列举真核生物核基因组DNA、线粒体DNA、质体DNA、原核生物基因组DNA、噬菌体DNA、或质粒DNA等。优选本发明的人工核酸切割酶切割基因组上的双链DNA。作为该RNA,例如,虽然不限定,但可列举单链RNA、双链RNA、或由单链DNA和单链RNA组成的DNA-RNA杂种双链等。

核酸结合结构域只要是与任意的核酸序列(目标序列)特异性地结合的蛋白质结构域即可,例如,虽然不限定,但可列举锌指、TALE、CRISPR/Cas(Cas蛋白质与向导RNA的复合体)、Pentatricopeptide repeat(三角状五肽重复,PPR)等或包含它们的组合的DNA结合结构域。作为CRISPR/Cas,可列举例如,CRISPR-Cas9、CRISPR-Cpf1(Cas12a)、CRISPR-Cas12b、CRISPR-CasX(Cas12e)、CRISPR-Cas14、CRISPR-Cas3等。包含锌指的核酸结合结构域优选可以包含2个以上的锌指,虽然不限定,但可以包含例如,由3~9个锌指组成的锌指阵列(以下也称为“ZFA”)。已知1个锌指识别3碱基序列,例如,已知识别GNN、ANN、或CNN等的锌指。作为CRISPR/Cas,优选列举使核酸酶活性失活而得的Cas、例如dCas(使核酸酶活性失活而得的Cas、例如,dCas9)等。核酸结合结构域可以以与所期望的目标序列结合的方式由本领域技术人员适宜设计。此外,本说明书中,“CRISPR/Cas”是指向导RNA与Cas蛋白质的复合体,该向导RNA识别、结合目标序列。

在本发明的人工核酸切割酶中,核酸酶结构域和核酸结合结构域可以直接连接,或者介由连接物连接。连接物例如由2个以上的氨基酸残基组成,长度不特别限定,但可以为例如,2~20个氨基酸长,例如,2个、4个、6个、8个、9个、12个、16个、或20个氨基酸长。连接物的种类也不另外特别限定,可列举例如,TGAAARA、GS、RPGEKP、TGPGAAARA等。连接物的有无以及连接物的长度和种类可以考虑核酸结合结构域的种类等而由本领域技术人员适宜选择。已知包含现有的FokI-ND的ZFN的核酸酶活性受到连接ZF与FokI-ND的连接物序列较大影响,但在本发明的人工核酸切割酶的情况下,与现有的ZFN相比,其核酸酶活性对连接物序列的依赖性低。特别是在ND1中,基本观察不到由使连接物序列变化造成的核酸酶活性的降低(实施例5)。因此,本发明的人工核酸切割酶的连接物序列的灵活性高。

本发明的人工核酸切割酶的目标序列是核酸上的任意序列。该目标序列优选是夹着间隔物序列的2个序列。间隔物序列的长度、目标序列的长度和碱基序列不特别限定。本领域技术人员可以适宜设定由所期望的长度和碱基序列组成的目标序列。该2个目标序列可以互为回文序列,或者可以为非回文序列。在该2个目标序列是非回文序列的情况下,制备以各序列为目标的2种人工核酸切割酶。进而,在使用包含CRISPR/Cas的核酸结合结构域的情况下,选择位于前间隔物邻近基序(PAM)序列的邻近的序列作为目标序列。即,以使得PAM存在于两目标序列的外侧或间隔物序列中的方式,设定目标序列。目标序列可以是双链序列、或单链序列的任一者。此外,本说明书中,“邻近”包含邻接的位置或靠近的位置两方。

本发明的人工核酸切割酶中,如果核酸结合结构域与核酸上的目标序列结合,则核酸酶结构域在目标切割部位切割该核酸。目标切割部位存在于与目标序列邻接的间隔物序列中或其邻近。间隔物序列的长度不特别限定,可列举例如,1~20bp、优选为3~8bp、进一步优选为5~7bp。已知在包含现有的FokI-ND的ZFN的情况下,最适的间隔物长度为6bp,其核酸酶活性受到间隔物长度较大的影响,但在本发明的人工核酸切割酶的情况下,与现有的ZFN相比,间隔物长度的灵活性高。本发明的人工核酸切割酶可以通过例如改变连接物长度,对较短的间隔物、较长的间隔物也显示高的切割活性(实施例5)。另一方面,在包含现有的FokI-ND的ZFN中,即使改变连接物长度,针对比最适间隔物长度短的间隔物、长的间隔物,切割活性也显著降低。间隔物长度规定识别序列之间的距离,因此本发明的人工核酸切割酶通过间隔物长度的灵活性高,从而目标切割部位和识别序列的选择范围扩大。

本发明的人工核酸切割酶可以通过该领域已知的方法在体外或体内制造。可列举例如,以氨基酸序列信息为基础进行人工合成的方法;人工合成编码本发明的人工核酸切割酶的核酸、或编码本发明的核酸酶结构域和核酸结合结构域的各核酸,插入适当的表达载体中,接着导入适当的宿主细胞中,在该细胞内使该人工核酸切割酶表达的方法。或者可列举将编码本发明的人工核酸切割酶的核酸通过体外或体内翻译合成蛋白质,将其导入适当的细胞,在该细胞内使该人工核酸切割酶作用;或者通过体外转录合成编码本发明的人工核酸切割酶的RNA,导入适当的宿主细胞中,在该细胞内使该人工核酸切割酶作用的方法。作为表达载体,不特别限定,从该领域使用的载体中选择即可。可列举例如,质粒载体、病毒载体、噬菌体载体、噬菌粒载体、BAC载体、YAC载体、MAC载体、HAC载体等。

作为宿主细胞不特别限定,可列举大肠杆菌、放线菌、古细菌等原核生物,酵母、海胆、蚕、斑马鱼、小鼠、大鼠、蛙、烟草、拟南芥、稻等真核生物、和培养细胞等。

在本发明的进一步方案中,还提供包含编码本发明的人工核酸切割酶的核酸序列的分离的核酸、以及该核酸的转录产物和翻译产物。上述核酸也可以是由编码本发明的人工核酸切割酶的核酸序列组成的分离核酸。另外,也可以进行密码子最优化。本说明书中,“核酸”包含DNA和RNA两者。

如果将本发明的人工核酸切割酶导入细胞,则该细胞内的核酸上的目标部位被该酶切割,该切割接下来通过非同源末端连接修复(NHEJ)或同源重组修复(HR)等而被修复。此时,在成为主要的修复途径的利用NHEJ的修复中,在该切割部位插入1个以上的突变,该核酸被改变。因此,在本发明的进一步方案中,还提供改变目标核酸的方法,包括将本发明的人工核酸切割酶、或编码该人工核酸切割酶的核酸导入细胞中。上述的酶或核酸可以是该核酸的转录产物或其翻译产物。上述核酸还可以以在上述细胞中高表达的方式进行密码子最优化。此外,本说明书中,“改变”包含至少1个核苷酸的缺失、插入、或置换、或它们的组合。另外,本说明书中,在对于核酸使用“突变”的术语的情况下,是指核苷酸的缺失、插入、或置换。

上述的酶或核酸向细胞的导入可以是物理的导入、或介由病毒或生物的感染等的导入,可以使用在该领域已知的各种方法。作为物理的导入方法,虽然不限定,但可列举例如,电穿孔法、基因枪法、显微注射法、脂质体转染法、蛋白质转导法等。作为介由病毒或生物的感染等的导入方法,虽然不限定,但可列举例如,病毒转导、农杆菌法、噬菌体感染、接合等。上述导入中适宜使用载体。作为载体,根据所导入的细胞的种类适宜选择即可,不特别限定,可列举例如,质粒载体、病毒载体、噬菌体载体、噬菌粒载体、BAC载体、YAC载体、MAC载体、HAC载体等。另外,可列举能够搬运翻译产物(蛋白质)、转录产物(mRNA)的脂质体、慢病毒等载体、和能够将融合或结合的分子导入细胞内的细胞穿透性肽等肽载体。

因此,在本发明的进一步方案中,提供包含编码本发明的人工核酸切割酶的核酸的载体、或包含该核酸的转录产物或其翻译产物的载体。包含该核酸的转录产物或其翻译产物的载体,也包括在包含该核酸的载体内转录有该核酸的载体、进一步产生翻译产物的载体。

上述的细胞可以是原核细胞或真核细胞的任一细胞,不特别限定。可列举例如,细菌、古细菌、酵母、植物细胞、昆虫细胞、动物细胞(例如,人细胞、非人细胞、非哺乳动物脊椎动物细胞、无脊椎动物细胞等)。该细胞还可以是生物体内的细胞,或者可以是分离的细胞,另外,可以是原代细胞,也可以是培养细胞。该细胞还可以是体细胞、生殖细胞、或干细胞。

具体地,作为上述细胞所来源的原核生物,可列举例如,大肠杆菌、放线菌、古细菌等。另外,作为上述细胞所来源的真核生物,可列举例如,酵母、蘑菇、霉等真菌类、海胆、海星、海参等棘皮动物、蚕、蝇等昆虫类、金枪鱼、比目鱼、河豚、斑马鱼等鱼类、小鼠、大鼠、豚鼠、仓鼠、松鼠等啮齿类、牛、野猪、猪、绵羊、山羊等偶蹄类、马等奇蹄类、蜥蜴等爬行类、蛙等两栖类、兔等兔形目、狗、猫、雪貂等食肉目、鸡、鸵鸟、鹌鹑等鸟类、烟草、拟南芥、稻、玉米、香蕉、花生、向日葵、番茄、油菜籽、小麦、大麦、马铃薯、大豆、棉花、康乃馨等植物。作为“动物细胞”,可列举例如,各阶段的胚胎的胚细胞(例如,1细胞期胚、2细胞期胚、4细胞期胚、8细胞期胚、16细胞期胚、桑葚期胚等);人工多能干(iPS)细胞、胚胎干(ES)细胞、造血干细胞等干细胞;成纤维细胞、造血细胞、神经元、肌肉细胞、骨细胞、肝细胞、胰脏细胞、脑细胞、肾细胞等体细胞;受精卵等。

目标核酸可以是上述细胞中的基因组DNA中的任意基因或基因外区域的DNA。为了切割目标核酸中的目的序列,以本发明的人工核酸切割酶所包含的核酸结合结构域与该目的序列的邻近的序列(作为该核酸结合结构域的目标序列选择)结合的方式,设计本发明的人工核酸切割酶。其结果是,该目标核酸中的所期望的序列被切割,例如,该基因的表达降低或消失,或该基因的功能降低或功能不表达。

在本发明的目标核酸改变方法中,除了上述的人工核酸切割酶之外,还可以将供体多核苷酸导入细胞中。供体多核苷酸包含至少1个供体序列,所述供体序列包含想要在目标切割部位导入的改变。供体多核苷酸可以基于该领域已知的技术由本领域技术人员适宜设计。在本发明的目标核酸改变方法中存在供体多核苷酸的情况下,在目标切割部位发生同源重组修复,供体多核苷酸被插入该部位,或该部位被供体序列置换。其结果是在目标切割部位导入所期望的改变。

在本发明的目标核酸改变方法中不存在供体多核苷酸的情况下,目标切割部位主要通过非同源末端结合(NHEJ)而被修复。NHEJ由于容易发生错误,因此至少1个核苷酸的缺失、插入、或置换、或它们的组合可以在该切割的修复中发生。于是,该核酸在目标切割部位被改变。

在本发明的目标核酸改变方法中,可以将2种以上的上述人工核酸切割酶导入细胞中。作为该2种以上的人工核酸切割酶,可列举例如,核酸结合结构域不同的2种以上的人工核酸切割酶、核酸酶结构域不同的2种以上的人工核酸切割酶、核酸酶结构域和核酸结合结构域双方都不同的2种以上的人工核酸切割酶、或连接物序列不同的2种以上的人工核酸切割酶等。核酸结合结构域不同的2种以上的人工核酸切割酶,包含核酸结合结构域所结合的目标序列不同的2种以上的人工核酸切割酶、和核酸结合结构域的种类不同的2种以上的人工核酸切割酶,作为一例,可列举核酸酶结构域不同、且核酸结合结构域所结合的目标序列不同的2种以上的人工核酸切割酶。例如,在核酸上的要改变的区域不存在回文序列的情况下,可以使用以分别不同的序列作为目标的2种人工核酸切割酶。此时,可以进一步在该2种人工核酸切割酶的核酸酶结构域导入促进该核酸酶结构域的异源二聚体形成那样的突变。由此,能够在增加该人工核酸切割酶的识别序列的同时,降低脱靶的几率。这样的突变为例如,向D483、D487和D496的置换(以下也称为“DDD型突变”)、和向R483、R487和R537的置换(以下也称为“RRR型突变”),在一方的人工核酸切割酶的核酸酶结构域中导入DDD型突变、在另一方的人工核酸切割酶的核酸酶结构域中导入RRR型突变。此外,在突变导入前的核酸酶结构域序列已经具有上述所示的DDD型突变和RRR型突变的任一氨基酸残基的情况下,仅实施这以外的氨基酸置换即可。分别导入了促进这样的异源二聚体的形成的一对突变(例如,DDD型突变和RRR型突变)的2种核酸酶结构域可以除了上述突变以外是同一核酸酶结构域,或者可以是从上述突变导入前就本来不同的核酸酶结构域。例如,可以将包含ND1的DDD型突变体的人工核酸切割酶和包含ND1的RRR型突变体的人工核酸切割酶在本发明的方法中使用。另外,例如,可以将包含ND2的DDD型突变体的人工核酸切割酶包含ND1的RRR型突变体的人工核酸切割酶在本发明的方法中使用。根据本发明,ND1的DDD型突变体和ND1的RRR型突变体的组合、或ND2的DDD型突变体和ND1的RRR型突变体的组合显示特别高的特异性和核酸酶活性(实施例8)。

在本发明的进一步的方案中,提供用于目标核酸改变的试剂盒,包含本发明的人工核酸切割酶、编码该人工核酸切割酶的核酸、或包含该核酸、该核酸的转录产物或其翻译产物的载体。进而,该试剂盒可以包含如上所述的2种以上的人工核酸切割酶。进而,该试剂盒可以包含编码该2种以上的人工核酸切割酶的核酸、或者包含该核酸、该核酸的转录产物或其翻译产物的载体。优选本发明的试剂盒包含1种或2种人工核酸切割酶、编码该1种或2种人工核酸切割酶的核酸、或者包含该核酸、该核酸的转录产物或其翻译产物的载体。上述2种以上的人工核酸切割酶可以为例如,包含ND1的DDD型突变体的人工核酸切割酶和包含ND1的RRR型突变体的人工核酸切割酶。进而,上述2种以上的人工核酸切割酶可以为例如,包含ND2的DDD型突变体的人工核酸切割酶和包含ND1的RRR型突变体的人工核酸切割酶。该试剂盒有时包含一种或多种补充的试剂,作为补充的试剂,可列举例如,稀释缓冲液、再构成溶液、洗涤缓冲液、核酸导入试剂、蛋白质导入试剂、对照试剂,但不限于这些。通常,试剂盒附带操作说明书。

本说明书中的术语的含义只要不特别定义,可以解释为生物学、分子生物学、生化学、遗传学等领域通常理解的含义。

实施例

以下,通过实施例具体地说明本发明,但本发明不受这些实施例任何限定。

此外,实施例中使用的细胞如下培养。

<细胞培养>

HEK293T细胞用包含10%FBS(Difco)、1%链霉素-青霉素(和光纯药工业)、1%NEAA(Difco)的D-MEM培养基(和光纯药工业)进行维持。CHO-K1细胞用包含10%FBS、1%链霉素-青霉素、5%卡那霉素(和光纯药工业)的Ham’s-F12(Difco)进行维持。以下,在对于培养温度没有特别记载的情况下,培养细胞以37℃、二氧化碳浓度5%进行维持,在有记载的情况下按照所记载的温度。另外,对于培养液,也是在没有记载的情况下使用上述各自的培养基。

以FokI的C末端侧的氨基酸序列为基础,通过Protein-protein BLAST进行有同源性的天然原材料的检索。在所得的检索结果中,从与FokI-ND的同源性为35%~70%的原材料中任意选择4种候选。将它们从同源性高的序列开始称为ND1(氨基酸序列同一性70%;全长氨基酸序列:序列号1;对应碱基序列:序列号2)、ND2(氨基酸序列同一性57%;全长氨基酸序列:序列号3;对应碱基序列:序列号4)、ND3(氨基酸序列同一性49%;全长氨基酸序列:序列号5;对应碱基序列:序列号6)、ND4(氨基酸序列同一性45%;全长氨基酸序列:序列号7;对应碱基序列:序列号8)。

将ND1~ND4的氨基酸序列与FokI-ND的氨基酸序列进行比较,结果表明虽然产生了氨基酸的缺失、置换,但与FokI-ND核酸酶结构域的长度基本相同。另外,ND1~ND4保持了被认为是FokI-ND形成具有切割活性的二聚体时所需的氨基酸(D483、R487)、和推定参与通过水解DNA的磷酸二酯键而进行的切割的氨基酸(D450、D467和K469)(图1B)。因此,认为ND1~ND4具有核酸酶活性。

为了评价ND1~ND4的核酸酶活性,制作分别包含ND1~ND4的ZFN质粒(pSTL-ZFA36-ND),通过SSA报告物测定来对各新的核酸酶结构域的切割活性进行测定。

(1)ZFN质粒构建

将ND1~ND4的碱基序列进行密码子最优化,通过IDT社进行人工合成。ZFN质粒(pSTL-ZFA36)使用由落合等制作的构建物(Ochiai et al.(2010)Targeted mutagenesisin the sea urchin embryo using zinc-finger nucleases.Genes to Cells 15:875-885)。为了将pSTL-ZFA36的FokI-ND置换成新鉴定出的ND1~ND4,利用各核酸酶结构域置换用引物对通过PrimeSTAR Max(Takara)进行PCR。PCR在98℃处理2分钟之后、将98℃10秒、60℃5秒、68℃40秒这样的反应进行40循环。使用In-Fusion(Clontech)使所得的PCR产物和人工合成的ND1~ND4反应,转化大肠杆菌。从所得的转化体提取质粒,确认碱基序列,从而得到作为目的的各pSTL-ZFA36-ND质粒。将所得的ZFA(锌指阵列)36-ND的示意图示于图1A。该ZFA36-ND具有TGAAARA连接物。

(2)SSA报告物测定

制备包含SSA报告物质粒120ng、上述的各pSTL-ZFA36-ND质粒240ng、参照质粒pRL-CMV(Promega)(用于将转导效率标准化的质粒)24ng的7.2μL质粒溶液。该SSA报告物质粒以被Luc序列的重叠区域所夹,并且以插入了包含6bp的间隔物序列的ZF阵列(ZFA36)的目标序列的方式,按照已知的方法制备(Ochiai et al.(2010)Targeted mutagenesis inthe sea urchin embryo using zinc-finger nucleases.Genes to Cells 15:875-885)。在多聚赖氨酸涂布处理后的96孔多孔板(Iwaki)中加入25μL的无血清D-MEM培养液,混合6μL的质粒溶液。在其中加入对于每无血清的D-MEM培养液25μL添加了0.7μL的LipofectamineLTX(Life Technologies)的溶液25.7μL,室温放置30分钟。这期间通过胰蛋白酶处理使HEK293T细胞从100mm的组织培养皿(Iwaki)解离出来,以1000rpm离心3分钟之后,除去上清,再次用5mL的培养液悬浮。分取10μL的细胞悬浮液,测量细胞数。根据所得的细胞数,加入培养液进行调整,使得细胞悬浮液中的细胞数为6×10

除去进行转导并培养24小时后的HEK293T细胞的培养液75μL,将附属于Dual Glo荧光素酶测定系统(Promega)的Dual Glo荧光素酶底物在各孔中加入75μL,在暗处、室温处理10分钟。然后,通过酶标仪TriStar LB941测定荧光素酶活性。测定之后,对各样品加入稀释100倍的包含Dual Glo Stop&Glo Substrate的Dual Glo Stop&Glo Buffer 75μL,在暗处、室温处理10分钟,与之前步骤同样地用酶标仪测定参照质粒的荧光素酶活性。作为对照,使用包含FokI-ND的ZFA36-FokI同样地进行测定。关于测定结果,计算出将SSA报告物的荧光素酶活性除以参照质粒的荧光素酶活性而得的值的变化,求出以ZFA36-FokI的值作为1时的各样品中的相对值。

(3)结果

结果示于图1C。由图1C表明,ND1和ND2与一直以来使用的FokI-ND相比,切割活性高20%以上。另一方面,表明ND3和ND4中切割活性低,仅具有FokI-ND的约2成左右。

进而,确认了在细胞内不表达核酸酶结构域时,该细胞内本来存在的核酸酶是否以荧光素酶报告物作为目标。其结果可知,由于对FokI-ND的相对活性显著降低,因而荧光素酶报告物不成为HEK293T细胞内存在的各种核酸酶的目标。通过该分析表明,ND1和ND2超越ZFN中一直以来使用的FokI-ND的切割活性,是来源于天然原材料的新的核酸酶结构域。

为了确认在实施例2中确认了具有核酸酶活性的新的核酸酶结构域ND1和ND2在生物体中对基因组DNA带来怎样程度的突变导入,通过Cel-I测定而进行新的核酸酶结构域对培养细胞中的基因组DNA的突变导入率的分析。作为比较对照,对于FokI-ND、ND3和ND4也同样地进行分析。

(1)Cel-I测定

在转导有TALEN、ZFN等基因组编辑工具的细胞中,进行利用它们所具有的核酸酶结构域的目标DNA的切割、和利用细胞内存在的修复机制的切割部位的修复,但该过程中产生修复错误。如果用PCR扩增包含该基因组DNA的目标序列的区域,则获得野生型等位基因的PCR片段和包含突变的PCR片段的混合产物。如果使这些产物背离之后再装配,则产生由野生型等位基因和包含突变的等位基因的PCR片段组成的包含错配的双链DNA,其被错配特异的内切核酸酶(Cel-I核酸酶)切割。通过检测该切割图谱,可以评价突变导入。

通过胰蛋白酶处理使CHO-K1细胞解离,以1000rpm离心3分钟之后,除去上清,然后用10mL的培养液悬浮。使用10μL的细胞悬浮液测定细胞数,以细胞数为1×10

在500μL的Opti-MEM(Difco)中加入实施例2中制作的各ZFN质粒使其为800ng,在室温放置5分钟。在500μL的Opti-MEM中加入32μL的Lipofectamine LTX,将其总量与包含上述的质粒的Opti-MEM培养基混合,在室温放置30分钟。这期间,将生长一晚的CHO-K1细胞的培养液交换成4mL的Opti-MEM。在该细胞培养液中加入在上述的室温放置30分钟后的质粒溶液总量,在37℃、二氧化碳浓度5%培养一晚。在第二天的上午将培养液由Opti-MEM交换成10mL的培养液,进而在37℃、二氧化碳浓度5%继续培养。另外,从24小时之后开始添加嘌呤霉素(和光纯药工业)使其终浓度为500μg/mL。以后每天进行培养液交换和嘌呤霉素添加,进行3天培养。

将如上所述转导了ZFN质粒的CHO-K1细胞通过胰蛋白酶处理而从培养皿回收。将回收的细胞用PBS(-)进行一次洗涤。将所得的细胞通过利用DNA纯化试剂盒(Qiagen)或GeneArt基因组切割检测试剂盒(Life Technologies)所包含的细胞裂解缓冲液和蛋白质分解剂(Protein degrader)的任一处理来制备基因组DNA。以制备的基因组DNA为模板,使用KOD Fx Neo(ToYoBo)或AmpliTaq Gold(Life Technologies)进行PCR。PCR在KOD Fx Neo的情况下,在95℃加热2分钟之后,将95℃30秒、60℃30秒、68℃30秒这样的循环进行40循环,扩增靶标。在AmpliTaq Gold的情况下,在95℃处理10分钟之后,将95℃10秒、60℃30秒、72℃40秒这样的循环进行40循环之后,最后在72℃处理7分钟来扩增靶标。对于所得的各PCR产物,将等量使用GeneArt基因组切割检测试剂盒,按照手册,进行利用检测酶的切割反应。反应之后的溶液通过琼脂糖电泳或MultiNA(岛津制作所)来检测切割片段。由非切割条带和更大的切割片段的摩尔浓度计算出切割效率。

(2)结果

利用MultiNA的泳动的结果示于图2。将分析中使用的CHO-K1细胞中的ZFN的基因组目标(ZFA36-ZFA36)候选序列示于表1。另外,后述的实施例7中使用的ZFN的基因组目标(ZFL1-ZFA36)候选序列也示于表1。

表1

目标部位的序列

在所分析的全部目标序列中,目标半位点(L)与ZF阵列的目标序列完全一致。另一方面,目标半位点(R)与ZF阵列的目标序列完全不一致,在3’侧存在错配。如果将这些目标候选序列用Cel-I切割,则与荧光素酶报告物分析的结果同样地,表明了作为新的核酸酶结构域的ND1和ND2的切割效率比FokI-ND高约1.5倍以上(图2A和B)。特别是ND1的突变导入活性在所分析的全部目标候选序列中,都具有与ND2相比更稳定的高的切割活性。由这些结果表明,与实施例2的利用荧光素酶的发光的报告物分析中的结果同样地,ND1和ND2对生物体内的目标基因组序列也是与现有类型的FokI-ND相比为高活性的天然原材料来源的新的核酸酶结构域。

另一方面,ND3中虽然通过目标候选序列而突变导入活性发生变化,但仍为FokI-ND的活性的25~45%左右。另外,ND4中,对于所分析的全部目标候选序列没有发现能检测的对目标候选序列的突变导入。

为了搞清楚新的核酸酶结构域的突变导入率高于FokI-ND,是否是通过细胞内蓄积的量多于FokI-ND而表观的突变导入率变高,对ZFN添加标签,通过使用识别该标签的抗体,来分析各核酸酶结构域的蓄积量。为了进行该分析,制作在ZFN的N末端新添加了AcV5标签的构建物,用于分析。

(1)细胞内蓄积量的分析(蛋白质印记(Western blot)分析)

为了分析细胞内的ZFN的蓄积量,以实施例2中制作的各pSTL-ZFA36-ND为模板进行PCR,In-Fusion反应之后向大肠杆菌转化,得到了在ZF阵列的N末端侧添加了AcV5标签的各ZFN质粒。制备含有该ZFN质粒240ng的7.2μL的质粒溶液。将该质粒溶液与实施例2所记载的SSA测定同样地向HEK293T细胞转导,在37℃、二氧化碳浓度5%培养3天。培养液每天交换。

将培养而得的HEK293T细胞进行胰蛋白酶处理,离心之后,除去上清。将所得的沉淀用PBS悬浮,加入由2%SDS、10%甘油、10mM DTT、0.005%BPB和62.5mM Tris-HCl(pH6.8)组成的样品处理液,在95℃煮沸5分钟。然后,通过超声波处理打断核酸等。所得的蛋白质样品以BSA作为外标,通过蛋白质测定试剂盒(Bio-Rad)进行蛋白质定量。将以成为10μg的方式制备的各样品通过SDS-PAGE分离,通过半干印迹转移转印到PVDF膜。转印之后的PVDF膜用包含5%脱脂乳的PBS进行封闭,与稀释到2000倍的α-微管蛋白抗体(Abcam)、和AcV5-tag抗体(Sigma)一起孵育。用PBST洗涤之后,与稀释到2000倍的山羊抗小鼠IgG抗体缀合HRP(Bio-Rad)一起孵育。用PBST洗涤之后,使用Supersignal West Dura Extended DurationSubstrate(Thermo Fisher)使其发光,使X射线胶片感光。

(2)结果

结果示于图3。作为内标使用针对α-微管蛋白的单克隆抗体,进行细胞破碎液中的蛋白质的量的比较,结果在未转导ZFN的对照细胞中,微管蛋白的蓄积量变多。在使包含各核酸酶结构域的ZFN表达的情况下,可见FokI-ND和ND1稍微变少,但显示基本等量的微管蛋白蓄积量,显示基本等量的蛋白质利用SDS-PAGE的分离和向PVDF膜的转印。

另一方面,由微管蛋白的蓄积量可知,在对照中,虽然以比表达各核酸酶结构域的细胞破碎液更多的蛋白质的量进行分析,也观察不到来源于AcV5标签抗体的非特异的信号,AcV5抗体特异性地识别标签。如果通过该AcV5抗体进行蛋白质蓄积量的分析,则在转导了各核酸酶结构域的细胞破碎液中,对于FokI-ND、ND1~ND3在期待的大小约35kDa附近得到了来源于AcV5标签的信号。另外,FokI-ND、ND1和ND2的信号基本为同程度。合并考虑作为内标使用的微管蛋白的量,则关于FokI-ND、ND1和ND2的各核酸酶结构域的细胞内的蓄积量,提示FokI-ND最多在细胞内蓄积,接着ND1、ND2依次蓄积。另一方面,对于ND3,得到了与FokI-ND等等相比显著强的来源于AcV5标签的信号,因而表明细胞内的ND3的蓄积量比FokI-ND等多。

(3)细胞内蓄积量和局部存在的分析(ZFN-EGFP的表达分析)

进而,尽管丧失了切割活性,但为了搞清楚各ZFN的细胞内的蓄积量和局部存在,制作了在C末端融合了EGFP的构建物。使用制作的构建物向HEK293T细胞转导,用共聚焦激光显微镜观察GFP来源的荧光从而搞清楚ZFN的表达量,同时为了搞清楚细胞内局部存在,将核进行DAPI染色而分析。

以实施例2中制作的各pSTL-ZFA36-ND作为模板进行PCR,在In-Fusion反应之后,向大肠杆菌转化,得到在ZF阵列的C末端侧添加了EGFP的各ZFN质粒。制备含有该ZFN质粒240ng的7.2μL的质粒溶液。该质粒溶液与实施例2所述的SSA测定同样地向HEK293T细胞转导,以37℃、二氧化碳浓度5%培养3天。将HEK293T细胞向进行了胶原处理的24孔玻璃底板涂布。

将生长的HEK293T细胞用多聚甲醛固定。用PBS(-)洗涤之后,进行利用DAPI的核酸染色。再次用PBS(-)洗涤之后,用共聚焦激光显微镜(FD-1000D、Olympus)进行观察。EGFP在Ex:473nm/Em:510nm获得荧光图像,DAPI在Ex:405nm/Em:473nm获得荧光图像。

(4)结果

结果示于图4。在不表达ZFN的阴性对照中,观察不到GFP来源的荧光,仅观察到由DAPI产生的核酸来源的荧光。在各核酸酶结构域中导入了融合有EGFP的ZFN的细胞中,虽然GFP来源的荧光强度观察到不同,但在细胞质和核中能够观察到GFP来源的荧光。

如果使FokI-ND-EGFP表达,则看到了大量在细胞质中观察到GFP的荧光的细胞、以及在核中也观察到GFP的荧光的细胞。如果使ND1-EGFP表达,则比FokI-ND时更多的细胞看到了GFP来源的荧光,但各自的荧光强度比FokI-ND时弱。如果使ND2-EGFP表达,则可知在观察的细胞中,具有GFP来源的荧光的细胞的数比FokI-ND少,但局部存在于细胞质和核中。如果使ND3-EGFP表达,则与FokI-ND等同样地,在核和细胞质中观察到GFP来源的荧光。另外,在ND3中也看到GFP来源的荧光比其他核酸酶结构域强,因而考虑在该部分细胞内表达量多。ND3在利用蛋白质印记(Western blot)的分析中结果也是细胞内的蓄积量比FokI-ND多,但即使能在核中局部存在,表观的突变导入率也低,另外考虑到最适温度与FokI-ND不同等酶的生化学特性也不同。

(5)总结

由利用抗体的分析和利用GFP的荧光的分析结果表明,FokI-ND与ND1和ND2同程度地在细胞内蓄积。这表明,作为新的核酸酶结构域的ND1和ND2的切割活性高,并不是因为细胞内的蓄积量多,而是因为切割活性比FokI-ND高,意味着ND1和ND2是具有超越一直以来在ZFN等中使用的FokI-ND的切割活性的天然原材料来源的核酸酶结构域。

为了进一步验证ND1和ND2的有用性,尝试了ZF阵列与核酸酶结构域之间的连接物序列的改变。报告了如果在现有的ZFN中进行连接物序列的改变,则显示切割活性的间隔物序列的长度、带给细胞的毒性不同。因此,构建在到目前为止的分析中一直使用的作为现有型连接物序列的TGAAARA连接物、以及GS连接物、RPGEKP连接物和TGPGAAARA连接物中进行了改变的ZFN载体,用于分析。

(1)实验方法

作为具有TGAAARA连接物的ZFN载体,使用实施例2中制作的各pSTL-ZFA36-ND。GS连接物、RPGEKP连接物和TGPGAAARA连接物的选择参考Handel等(2009)(非专利文献1)、Wilson等(2013)(Wilson et al.(2013)Expanding the Repertoire of Target Sites用于Zinc Nuclease-mediated Genome modification.Mol.Ther-Nucleic Acids 2:e88)、和Nomuraら(2012)(Nomura et al.(2012)Effects of DNA Binding of the Zinc Fingerand Linkers用于Domain Fusion on the Catalytic Activity of Sequence-SpecificChimeric Recombinase Determined by a Facile FluorescentSystem.Biochemistry.51:1510-1517)的报告。将改变了各连接物的ZFN载体,以pSTL-ZFA36-ND作为模板,用各连接物改变用引物对通过PrimeSTAR Max(Takara)进行PCR。使用In-Fusion(Clontech)使所得的PCR产物反应,转化大肠杆菌。由所得的转化体提取质粒,确认碱基序列,从而获得作为目的的质粒。进而,使用将间隔物的长度改变为5bp或7bp的SSA报告物质粒,如实施例2所记载那样进行SSA报告物测定,从而测定各ZFN的核酸酶活性。

(2)结果

结果示于图5。此外,切割活性均用以包含现有型连接物、间隔物序列6bp的ZFA-FokI-ND的切割活性作为100%时的相对活性表示。

以间隔物序列的长度作为6bp时,在FokI-ND中,与用现有型连接物(TGAAARA)连接ZF阵列与核酸酶结构域时的切割活性相比,改变成GS连接物或RPGEKP连接物,则活性降低到20%以下。另一方面,改变成TGPGAAARA连接物,则FokI-ND的切割活性为连接物改变前的约90%左右(图5A)。

ND1中,在间隔物序列为6bp的情况下,即使改变连接物序列切割活性也不受影响,有连接物序列改变前的FokI-ND的约90%左右的切割活性。ND2中,在间隔物序列为6bp的情况下,与连接物序列改变前的FokI-ND的切割活性相比,改变成GS连接物序列,则切割活性降低到约60%,改变成RPGEKP连接物序列,则切割活性降低到约35%左右。由这些结果表明,如到目前为止报告的那样,即使间隔物序列的长度相同,分析中使用连接物序列也会影响核酸酶结构域的切割活性。

如果间隔物序列的长度为5bp,则与6bp时相比,FokI-ND的切割活性在现有型连接物序列(TGAAARA连接物)中降低到约40%左右,但如果改变成GS连接物,则约50%左右的切割活性残留。然而,改变成RPGEKP连接物、TGPGAAARA连接物,则FokI-ND的切割活性变为现有型连接物序列的情况下的约20%,基本不能切割。在ND1中,表明在间隔物序列为5bp的情况下,改变成GS连接物,则切割活性仍然高,但在现有型连接物序列的情况下,切割活性降低到约30%左右,另外变成其他连接物序列,则基本不能切割。

在ND2中,如果间隔物序列的长度为5bp,则即使改变连接物序列,也基本不显示切割活性。考虑在间隔物序列的长度短时,连接物序列的影响大,连接物序列越短越容易维持切割活性。

使间隔物序列的长度为7bp的情况下,在FokI-ND中,仅在改变成TGPGAAARA连接物时看到切割活性,但该活性为现有类型的连接物序列中间隔物序列的长度为6bp的切割活性的50%左右。变成其他连接物序列时基本不显示切割活性。

ND1中,在间隔物序列的长度为7bp的情况下,可知如果改变成GS连接物序列则不显示切割活性,但如果改变成其他连接物序列则显示约50%以上的切割活性。特别考虑在TGPGAAATA连接物序列的情况下,高于成为对象的FokI-ND的切割活性。另一方面,对于ND2,在现有类型的连接物序列的情况下显示约40%左右的切割活性,但如果改变成其他连接物序列则基本不显示切割活性。在间隔物序列的长度长的情况下,连接物序列越长则切割活性越倾向于变高。

由以上的结果表明,与FokI-ND相比,ND1不易受到连接物序列的改变的影响,且对间隔物序列的限制低,显示高于FokI-ND的切割活性。这显示,ND1在目标序列的选择性等方面,也是比FokI-ND通用性更高的核酸酶结构域。

到目前为止,在ZFN中,对于FokI-ND的改变没有报告。另外,也有将核酸酶结构域本身由FokI-ND改变成PvuII、I-TevI这样的内切核酸酶的报告。使用了该I-TevI的改变ZFN,虽然与FokI-ND相比切割活性高,但由于ZF阵列、以及存在于I-TevI内的分子内连接物、DNA结合基序,因而间隔物序列为约30bp左右,比FokI时边长。改变成PvuII时也同样间隔物序列变长。其结果考虑在ZFN中发挥作用的DNA序列也容易受到长的碱基序列的限制。另一方面,本发明的核酸酶结构域在ZFN中利用的情况下,虽然是与现有类型的FokI-ND相同的蛋白质的结构,但具有高的突变导入率,在ZFN中发挥作用的目标DNA序列全体也短至24bp。由此,本发明的核酸酶结构域与I-TevI等相比减缓了受到碱基序列的限制,作为更简便的基因组编辑工具容易操作。

已知如果导入FokI-ND中则切割活性变高的氨基酸置换(Sharkey突变)(Guo,J.,Gaj,T.and Barbas,C.F.,3rd.(2010)Directed evolution of an enhanced and highlyefficient FokI cleavage domain用于zinc finger nucleases.J Mol Biol,400,96-107)。于是,为了在新的核酸酶结构域ND1和ND2中进一步提高切割活性,尝试了分别导入与Sharkey突变相同的氨基酸置换。

(1)实验方法

将包含导入了Sharkey突变(FokI-ND中的S418P和K441E氨基酸置换、和其他核酸酶结构域中的对应氨基酸置换)的各核酸酶结构域的ZFN载体,参考Guo等的报告以各pSTL-ZFA36-ND作为模板,用Sharkey突变导入用引物对通过PrimeSTAR Max(Takara)进行PCR。使用In-Fusion(Clontech)使所得的PCR产物反应,转化到大肠杆菌中。由所得的转化体提取质粒,确认碱基序列,从而获得作为目的的质粒。如实施例2所记载那样进行SSA报告物测定,从而测定各ZFN的核酸酶活性。作为不具有Sharkey突变的对照,使用实施例2中制作的各pSTL-ZFA36-ND。

(2)结果

通过将FokI-ND、Sharkey突变、ND1和ND2的氨基酸序列进行比较,从而特定由Sharkey突变所带来的氨基酸置换部位(图6)。将结果示于图6。此外,切割活性均用以不具有Sharkey突变的ZFA-FokI-ND的切割活性作为1时的相对活性表示。

在ND1中,与作为Sharkey突变的导入所需的氨基酸的部位的FokI-ND的S418和K441的位置相当的氨基酸与FokI-ND相同,分别为S424和K447。另一方面,在ND2中,与FokI-ND的S418的位置相当的氨基酸与Sharkey突变相同(P422),但与FokI-ND的K441的位置相当的氨基酸变成S445。因此,将在上述氨基酸部位导入了与Sharkey突变相同的氨基酸置换的ND1和ND2分别作为ND1-Sharkey、ND2-Sharkey。使用它们利用荧光素酶报告物测定切割活性,结果在FokI-ND的Sharkey突变中切割活性上升约1.5倍左右(图6B)。如已经报告的那样,清楚了Sharkey突变提高FokI-ND的切割活性。然而,在ND1-Sharkey和ND2-Sharkey的任一者中,与氨基酸置换导入前相比其切割活性都降低,都不能获得期待的高切割活性。该结果意味着,ND1、ND2的核酸酶的切割机理与FokI-ND不同。因此,新的核酸酶结构域ND1和ND2是与FokI-ND不同的核酸酶结构域。

用ZFN切割目标序列时,FokI-ND形成二聚体。进而已知FokI-ND可以通过置换特定的氨基酸而向仅在异源二聚体形成时显示切割活性的DDD型/RRR型等的突变体进行功能变换。于是,为了在新的核酸酶结构域ND1和ND2中搞清楚能够维持切割活性那样的功能改变,进一步进行了分析。

通过制作与FokI-ND的比对来验证参与异源二聚体形成的氨基酸在ND1和ND2中是否具有保守性(图1B)。其结果是,在FokI-ND中搞清楚的向异源二聚体型核酸酶的氨基酸置换部位,除了存在于最C末端侧的组氨酸残基以外的氨基酸在ND1和ND2中也保守。由此可以推测,ND1和ND2与FokI-ND同样地,能够向异源二聚体型进行功能变换。于是,在ND1和ND2中测定了异源二聚体形成时的切割活性。

(1)实验方法

为了对ND1和ND2进行向异源二聚体型的功能变换,如表2所示,在相应的氨基酸部位导入置换。此外,表中,“FokI”是指FokI-ND。表中,氨基酸数基于各核酸酶结构域的全长氨基酸。

表2

FokI核酸酶结构域和同源物的氨基酸序列

为了进行异源二聚体形成的分析,需要作为ZF阵列的目标序列的目标半位点-L与目标半位点-R是不同的序列。使用以与到目前为止的实施例中使用的ZF阵列不同的序列作为目标序列的ZF阵列来构建构建物。作为该ZF阵列,将hPGRN_ZFL1由IDT社人工合成(以下也称为“ZFL1”)。将实施例2中制作的各pSTL-ZFA36-ND的ZF阵列置换成hPGRN_ZFL1,因此用ZF阵列置换用引物对,以各pSTL-ZFA36-ND作为模板,通过PrimeSTAR Max进行PCR。使用In-Fusion使所得的PCR产物和hPGRN_ZFL1反应,转化大肠杆菌。由所得的转化体提取质粒、确认碱基序列,从而获得作为目的的各pSTL-hPGRN_ZFL1-ND质粒。

进而,为了将与参与FokI-ND的异源二聚体化的氨基酸(D483、R487、N496)相当的各新的核酸酶结构域的氨基酸向DDD型进行功能变换,以各pSTL-hPGRN_ZFL1-ND作为模板,使用引物对,通过PrimeSTAR Max进行PCR。另外,为了向RRR型进行功能变换,以各pSTL-ZFA36-ND作为模板,同样地进行PCR。将所得的各PCR产物在In-Fusion反应之后向大肠杆菌进行转化。由所得的各转化体提取质粒,进行序列确认之后,制备作为目的的构建物(以下,分别称为“DDD型突变ZFL1-ND”和“RRR型突变ZFA36-ND”)。使用所得的各DDD型ZFL1-ND和各RRR型ZFA36-ND,如实施例2所记载那样进行SSA报告物测定,从而测定各ZFN的核酸酶活性。但是,将SSA报告物测定中使用的质粒溶液7.2μL中的各ZFN质粒的量对于目标半位点L变更为120ng、和对于目标半位点R变更为120ng。进而,与实施例3的记载同样地,通过Cel-I测定来测定核酸酶活性。

(2)结果

将SSA报告物测定的结果示于图7和图8A。切割活性与到目前为止的报告物分析同样地,制成6bp间隔物序列,以相对于ZFA36识别左右二个目标序列的ZFA36-FokI的切割活性的相对活性计算出。Cel-I测定的结果示于图8B。

以形成同源二聚体的方式,用在ZFL1连接了各核酸酶结构域的构建物,测定报告物上的目标序列(ZFL1-ZFL1)的切割活性,结果与图1C所示的结果同样地,ND1、ND2的活性比FokI-ND高(图7A)。由该结果表明,即使使用不同的ZF阵列,新的核酸酶结构域ND1和ND2的高切割活性也具有普遍性。

使用将ZFL1与核酸酶结构域连接而成的构建物形成同源二聚体,测定报告物上的目标序列(ZFL1-ZFA36)的切割活性,结果ND1具有约40%的切割活性,但FokI-ND和ND2中几乎未见切割活性(图8A)。另一方面,用实施例2~6中使用过的将ZF阵列(ZFA36)与核酸酶结构域连接而成的构建物形成同源二聚体,同样地进行分析,则FokI-ND、ND2中也发现切割活性,分别为约35%和约50%。进而在ND1中切割活性更高,变为约90%左右(图8A)。

使用ZFA36和作为ZFL1的ZFN构建物使上述同源二聚体型的各核酸酶结构域的ZF阵列形成异源二聚体,分析切割活性,结果与仅用ZFA36分析时同样地ND1和ND2的活性比FokI-ND变高(图8A)。由此可知,ND1和ND2与ZF阵列无关地具有高切割活性,具有普遍性。

接着,为了验证在仅表达异源二聚体型的各核酸酶结构域时是否形成二聚体、显示切割活性,测定了报告物上的目标序列(ZFL1-ZFL1或ZFA36-ZFA36)的切割活性。在与ZFL1连接的各核酸酶结构域中导入了DDD型突变,在与ZFA36连接的各核酸酶结构域中导入了RRR型突变,但报告物分析的结果是,DDD型突变ZFL1-ND和RRR型突变ZFA36-ND的分别单独均基本观察不到切割活性(图7A和图7B)。由此表明,在新的核酸酶结构域ND1和ND2中,也与FokI-ND同样地通过向DDD型/RRR型的氨基酸置换而同源二聚体不能形成。

以使各核酸酶结构域形成异源二聚体型的方式进行转导,测定报告物上的目标序列(ZFL1-ZFA36)的切割活性。结果示于图8A。FokI-ND的切割活性减少到对象的约60%左右。但是,ND1中,作为异源二聚体型也未发现切割活性的降低,观察到与对象相比高达约1.6倍左右的活性。另一方面,ND2中,如果为异源二聚体型则切割活性基本消失。由这些结果表明,ND1能够向具有比FokI-ND高的切割活性的异源二聚体型进行功能变换。

进而,为了搞清楚各异源二聚体型核酸酶对基因组目标序列的突变导入效率,进行了利用Cel-I的分析(图8B)。如表1所示,基因组上的目标碱基序列在第1位点完全一致。由表达同源二聚体型和异源二聚体型核酸酶的CHO-K1细胞制备基因组,将包含这些目标序列的PCR片段用Cel-I处理,结果对于同源二聚体型,与到目前为止得到的结果同样地,各核酸酶结构域切割目标基因组DNA。另一方面,对于异源二聚体型,与SSA报告物分析的结果同样地,虽然在FokI-ND中也确认了突变导入,但ND1的突变导入率更高。ND2中,目标基因组序列中没有发现能够检测的突变导入,考虑切割活性消失。

这些结果提示,与FokI-ND不同,ND1能够向维持高活性的异源二聚体型进行功能变换,另外向异源二聚体型的变换可能给ND2带来大的结构变化,这说明各自的结构特性与FokI-ND不同。

对于能否通过改变异源二聚体形成时的核酸酶结构域的组合,而显示比现有类型的FokI-ND更高的切割活性,进一步进行分析。

使用实施例7中制作的各DDD型突变ZFL1-ND和各RRR型突变ZFA36-ND进行各种组合,与实施例2的记载同样地通过SSA报告物测定来测定核酸酶活性。结果示于图9。

用DDD型突变FokI-ND、和导入了RRR型突变的各核酸酶结构域进行分析,结果即使与到目前为止切割活性高的ND1组合,也未观察到报告物的切割活性的上升,为FokI-ND同源二聚体型的切割活性的约60%。另外,与ND2的组合基本未发现切割活性(图9A)。

对于DDD型突变ND1,在与RRR型突变FokI-ND的组合中成为约80%左右的切割活性,但在与RRR型突变ND2的组合中,与DDD型突变FokI-ND时同样地,基本丧失切割活性(图9B)。

与DDD型突变FokI-ND、DDD型突变ND1的结果不同,对于DDD型突变ND2,仅在与RRR型突变ND1的组合中,确认了高的切割活性,在与RRR型突变FokI-ND或RRR型突变ND2的组合中,切割活性基本丧失(图9C)。该结果表明,如果制成RRR型突变ND2的异源二聚体型,则无论核酸酶结构域的组合如何,都丧失切割活性。

已知能够实现显示切割活性的异源二聚体型核酸酶结构域的组合,但在这次分析的氨基酸置换中,仅在DDD型突变ND1与RRR型突变ND1的组合中能够提高切割活性。另外,搞清楚了即使在DDD型突变ND2与RRR型突变ND1的组合中,也具有与FokI-ND的同源二聚体同等的切割活性。由这些结果可知,在ND1和ND2形成二聚体时,受到与FokI-ND不同的结构的特性的影响。

调查通过利用ZFN向目标序列的突变导入而碱基序列发生了怎样的变化。

(1)测序分析

为了搞清楚针对CHO-K1细胞的基因组序列上存在的ZFA36的目标序列(第1位点和第2位点),通过利用ZFN的突变导入带来了怎样的碱基序列的变化,如下进行包含目标序列的基因组区域的测序分析。与实施例3所述的Cel-I测定同样地,以转导有各ZFN的CHO-K1基因组DNA作为模板,使用KOD Fx Neo进行PCR。将所得的PCR产物通过TArget clone plus(Toyobo)对PCR产物进行A添加之后,进行TA克隆。在大肠杆菌中克隆该PCR产物,随机地选择至少16个以上独立的大肠杆菌转化体,分别提取质粒。对所得的质粒400ng加入M13-f引物使其终浓度为6.4pmol,委托Fasmac社进行PCR和测序分析。由所得的测序序列计算出各ZFN中的目标序列的突变型序列的序列及其比例。

(2)结果

结果示于图10。在ZFA36-ZFA36的第1位点,对于FokI-ND,在所分析的17个克隆中,1碱基插入得到了1个克隆、4碱基插入得到了3个克隆。对于ND1,在能分析的14个克隆中存在1碱基插入、2碱基缺失和8碱基缺失各1个克隆。进而成为2碱基插入且1碱基缺失的突变得到了2个克隆,成为4碱基插入的突变得到了在本次分析中最多的6个克隆。对于ND2,在能分析的13个克隆中得到了1碱基插入、2碱基插入、2碱基缺失和4碱基缺失各1个克隆。在能分析的ND3的15个克隆和ND4的16个克隆中,在这次的ZFA36-ZFA36第1位点的分析中没有确认碱基的插入、缺失。另外,分析了ZFA36目标序列的第2位点中的各核酸酶结构域的突变导入,结果对于FokI,所分析的20个克隆中,2碱基插入、5碱基插入和2碱基缺失分别得到了各1个克隆,超过230碱基的插入也得到了1个克隆。另外与ZFA36第1位点同样,4碱基插入的突变得到了最多的3个克隆。对于ND1,分析的17个克隆中,2碱基缺失和4碱基缺失分别得到了各2个克隆。此外,4碱基插入得到了3个克隆,2碱基插入得到了在本分析中最多的6个克隆。对于ND2,分析的16个克隆中,1碱基插入得到了1个克隆,此外,2碱基插入得到了2个克隆,4碱基插入得到了分析中最多的5个克隆。另外,71碱基这样的大的碱基的插入得到了1个克隆。对于ND3,与第1位点不同,在第2位点存在对目标序列的突变导入,在分析的16个克隆中,2碱基插入、2碱基缺失和8碱基缺失分别得到了各1个克隆。对于ND4,能分析的14个克隆全部与第1位点同样在第2位点也未发现对目标序列的突变导入。

测序分析的结果是,利用ND1、ND2向目标序列的突变导入与FokI-ND类似,发现大量4碱基插入的克隆,但在FokI-ND中未见那样的各种图谱作为向基因组的突变被发现。可能通过新的核酸酶结构域产生的碱基的突出端与FokI核酸酶结构域不同。将通过测序分析而所得的ZFA36的各目标位点的突变率示于表3。表明在本分析条件中,在测序分析中,目标基因组序列中的各核酸酶结构域的突变导入率也与Cel-I测定同样。

表3

为了搞清楚是否本发明的新的核酸酶结构域使用ZFA以外的核酸结合结构域也具有高于FokI-ND的切割活性,制作包含ND1和TALE的人工核酸切割酶,测定其切割活性。具体地,使用发明者的研究室所开发的Platinum TALEN(doi:10.1038/srep03379)技术制作TALE-FokI-ND和TALE-ND1,通过SSA报告物测定法评价它们的切割活性。

(1)TALE-ND1的目标载体的构建

以作为未插入核酸结合结构域的Platinum TALEN用目标载体的ptCMV-153/47-VR-NG(https://www.addgene.org/50704/)作为模板,使用ptTALE-核酸酶结构域置换用引物对(载体扩增用)通过PrimeStar Max进行扩增,获得载体片段。另外,使用ptTALE-核酸酶结构域置换用引物对(插入物扩增用)获得ND1的插入物片段。将这些载体片段和插入物片段混合,进行In-Fusion反应。转化大肠杆菌之后,由所得的转化体提取质粒,获得作为目的的TALE-ND1的目标载体(将ptCMV-153/47-VR-NG中的FokI-ND置换成ND1的载体)。

(2)核酸结合结构域的插入和SSA报告物质粒的构建

在上述(1)所得的目标载体中,通过Golden Gate法装入用于识别CHO-K1细胞的ROSA26基因座和HPRT1基因座的序列的核酸结合结构域(依据doi:10.1038/srep03379中记载的方法)。使用所得的载体转化大肠杆菌,由所得的转化体获得作为目的的质粒(TALE-ROSA26-ND1和TALE-HPRT1-ND1)。另外,对于保持有现有类型的FokI-ND的TALEN(TALE-FokI)也同样地制备插入了核酸结合结构域的构建物(TALE-ROSA26-FokI和TALE-HPRT1-FokI)。关于SSA报告物质粒,通过常规方法制备包含各自的目标序列的质粒(SSA-CHO-ROSA26报告物和SSA-CHO-HPRT1报告物)。ROSA26基因座和HPRT1基因座的目标序列示于下述表4。

表4

(3)向细胞的导入和报告物测定

使用上述(2)中制作的、插入了用于识别目标序列的核酸结合结构域的TALEN质粒(TALE-FokI-ND、和TALE-ND1)、和插入了目标序列的SSA报告物质粒,对HEK293T细胞使用Lipofectamine LTX进行转导,使用转导之后24小时的细胞与实施例2同样地进行SSA报告物测定。作为对照,使用包含FokI-ND的ZFN质粒(pSTL-ZFA36)和仅表达FokI-ND的质粒pSTL同样地进行测定。作为以ZFA36-FokI对包含ZFA36的目标序列的报告物的切割活性的值为1时的相对活性,计算出各TALE-ND的切割活性。

(4)结果

结果示于图11A和图11B。图11A中显示以ROSA26基因座来源的序列作为目标时的结果,图11B中显示以HPRT1基因座来源的序列作为目标时的结果。

由图11A表明,Platinum TALEN的核酸酶结构域为现有型FokI-ND的TALE-ROSA26-FokI,具有以ROSA26基因座来源的序列作为目标的报告物的切割活性与以ZFA36报告物为目标的ZFA36-FokI的切割活性接近的活性。另一方面,在将Platinum TALEN的核酸酶结构域置换成ND1的TALE-ROSA26-ND1中,以ROSA26基因座来源的序列为目标的报告物的切割活性相对于TALE-ROSA26-FokI成为约2倍左右的高值。由以上显示,以CHO-K1细胞的内在性基因组的ROSA26基因座来源的序列为目标时,TALE-ND1具有比核酸酶结构域为现有类型的FokI-ND的TALE-FokI更高的切割活性。

另外,以来源于作为与ROSA26基因座不同的座位的HPRT1基因座的序列为目标,同样地进行分析。其结果如图11B所示,表明了在Platinum TALEN的核酸酶结构域为现有型FokI-ND的TALE-HPRT1-FokI中,以HPRT1基因座来源的序列为目标的报告物的切割活性是以ZFA36报告物为目标的ZFA36-FokI的切割活性的一半左右。另一方面,在将PlatinumTALEN的核酸酶结构域置换成ND1的TALE-HPRT1-ND1中,以HPRT基因座来源的序列为目标的报告物的切割活性显示比TALE-FokI高约2倍左右的活性,得到了与ROSA26基因座来源的序列同样的结果。

由这些结果表明,以ND1作为Platinum TALEN的核酸酶结构域的TALE-ND1显示比具有现有类型的FokI-ND的TALE-FokI更高的切割活性。由以上提示,不仅ZFN,在使用其他核酸结合结构域的情况下,本发明的新的核酸酶结构域也是具有比FokI-ND更优异的切割活性的核酸酶结构域。

由以上证实,本发明的新的核酸酶结构域具有以下的主要特征。

(i)本发明的ND1和ND2、特别是ND1具有显著高于FokI-ND的切割活性。另外,对于ND1,根据识别其他序列的ZF阵列、在TALE中也显示超过FokI-ND的切割活性的事实,由ND1产生的切割活性的上升效果具有普遍性。

(ii)通过改变ZF阵列与ND之间的连接物,在ND1中5bp、7bp的间隔物也显示与6bp间隔物同程度的切割活性,因而ND1在二聚体化时具有高于FokI-ND的灵活性,能够减缓目标序列的限制。

(iii)通过在ND1和ND2中导入DDD型突变和RRR型突变,能够与FokI-ND同样地抑制同源二聚体化。进而,通过组合ZFL1-DDD与ZFA36-RRR,能够在ND1中实现利用异源二聚体的切割。另外此时的切割活性与野生型ND1为同程度,因而通过使用ND1-DDD/RRR,能够获得同时具有高特异性和高切割活性的核酸酶结构域。

(iv)将DDD/RRR型的FokI-ND、ND1、ND2相互组合而验证活性,结果表明在全部组合中ND1-DDD与ND1-RRR的配对显示最高的活性,证明了ND1-DDD/ND1-RRR异源二聚体系统的优越性。

(1)ZF-ND1和ZF-FokI的表达载体的构建

对在N末端包含His标签的pET-MCS质粒的XhoI位点和SalI位点进行切割,插入ZF-ND1片段。ZF-ND1片段包含核定位信号NLS、锌指(Zinc-Finger,以下省略为ZF)、和核酸酶结构域ND1。作为ZF,使用识别2种序列的结构域。一个是ZFA36,识别12碱基对的DNA序列GAAGATGGT。另一个是ZFL1,识别12碱基对的DNA序列GAAGGTGAC。因此,作为表达ZF(ZFA36A)-ND1、和ZF(ZFL1)-ND1的质粒,分别制成pET-ZF(ZFA36A)ND1、和pET-ZF(ZFL1)ND1。

以上述质粒为基础,分别制成插入限制性酶FokI的核酸酶结构域(以下省略为FokI)代替了ND1的质粒、pET-ZF(ZFA36A)-FokI、和pET-ZF(ZFL1)-FokI。ZF(ZFA36A)-ND1、ZF(ZFL1)-ND1、ZF(ZFA36A)-FokI、和ZF(ZFL1)-FokI的氨基酸序列示于序列号119~122。

(2)大肠杆菌中的ZF-ND1蛋白质的表达和纯化

将表达ZF-ND1或ZF-FokI的pET质粒、以及pRARE2(ストラタジーン社)向大肠杆菌株BL21(DE3)转化,用包含卡那霉素和氯霉素的LB培养基进行培养。将转化后的大肠杆菌在37℃培养至OD(600nm中的吸光度)为0.6,然后在18℃培养1小时。添加异丙基硫代-β-D-半乳糖苷(IPTG)使其终浓度为0.1mM,诱导蛋白质的表达。进而在18℃振荡培养17小时之后,将大肠杆菌使用裂解缓冲液(20mM Tris-HCl、500mM NaCl、10%甘油、10mM咪唑、1mM苯甲基磺酰氟、1mM二硫苏糖醇、pH8.0)进行裂解。接下来使蛋白质吸附于镍-NTA柱,使用洗涤缓冲液(20mM Tris-HCl、500mM NaCl、10%甘油、20mM咪唑、pH8.0)除去杂质。蛋白质的溶出使用溶出缓冲液(20mM Tris-HCl、500mM NaCl、10%甘油、500mM咪唑、pH8.0)进行。溶出的蛋白质的一部分为了蛋白质收量的分析而溶解于SDS样品缓冲液。溶出的蛋白质使用凝胶过滤层析HiPrep 16/60Sephacryl S-200HR(GE healthcare、美利坚合众国、伊利诺斯州)和缓冲液A(20mM HEPES、150mM NaCl、10%甘油、pH7.4)进行纯化,使用液氮瞬时冷冻之后,在-80℃保存。为了蛋白质收量的分析,使咪唑溶出的蛋白质级分、和最终纯化的蛋白质溶解在SDS样品缓冲液中,通过SDS-PAGE进行电泳。电泳时,将已知浓度的BSA蛋白质在其他泳道泳动,将PAGE之后的凝胶进行考马斯亮蓝染色,将目的的蛋白质分子量的条带通过ChemiDocXRS+定量化,由蛋白质的分子量分析蛋白质的收量。

(3)结果

将ZFN蛋白质用大肠杆菌表达纯化时,蛋白质收量低是问题。考虑作为ZFN蛋白质的根本性质的可溶性低、凝集是其原因。对于与作为现有技术的FokI相比,新的ND1的蛋白质的可溶性为怎样程度进行了验证。

表5

如表5所示,使ZF-ND1在大肠杆菌中表达,结果总体上比ZF-FokI可溶性高,每1L大肠杆菌培养液的收量提高。因为可溶性越高越能够高浓度地导入蛋白质,因此特别是在使用蛋白质的基因组编辑中便利性高。

(1)报告物细胞的构建

为了评价ZF-ND1或ZF-FokI的活性而诱导了DNA切割之后的SSA(single-strandannealing:单链退火)的情况下,构建了全长2.1kb的GUS(β-glucuronidase:β-葡糖醛酸糖苷酶)基因表达的报告物细胞。具体地,将GUS基因的上游1.8kb、ZFA36的识别序列(GAAGCTGGT)、和GUS基因的下游0.8kb导入pCAMBIA1305.2(Marker Gene社)中。上述GUS基因的上游1.8kb、和GUS基因的下游0.8kb具有500bp作为共同序列(重叠区域)。将该载体介由农杆菌向拟南芥T87培养细胞株(理化学研究所)转化,将所建立的细胞株作为T87-GUUS(ZFA36)。GUS的表达能够使用作为蓝色的染色试剂的X-Gluc容易地可视化·检测,因而通过GUS蛋白质的检测来评价ZF-ND1或ZF-FokI向核内的导入和SSA诱导活性。

(2)利用电穿孔法的导入

将实施例11中制成的蛋白质通过电穿孔法导入。使用建立的T87-GUUS(ZFA36)细胞,对具有细胞壁的状态的T87细胞尝试利用电穿孔法的ZF-ND1和ZF-FokI的导入。电穿孔使用由ネッパジーン社销售的NEPA21 Type II。使用Opti-MEMI缓冲液进行电穿孔,在2天之后进行GUS活性的评价。其结果如图12所示,使用Opti-MEMI进行电穿孔时,非常多的细胞表达GUS。可知在使用ZF-ND1蛋白质的实验中,与使用ZF-FokI蛋白质的情况相比SSA诱导活性高2倍左右。本实验中表明,在ZF-ND1不仅作为基因表达载体、还作为蛋白质导入的情况下,与ZF-FokI相比也具有高活性;和在ZF-ND1不仅在动物细胞、而且在植物细胞中也与ZF-FokI相比具有高活性。

(3)利用蛋白质转导法的导入

使用实施例11中制成的蛋白质,尝试利用蛋白质转导法的导入。即对具有细胞壁的T87-GUUS(ZFA36),添加最终浓度0.1-2μM的ZF(ZFA36A)-ND1蛋白质或ZF(ZFA36A)-FokI蛋白质,然后在1小时之后用培养培养基进行洗涤,进行3天的培养。在添加蛋白质时,完全不进行蛋白酶处理等的生物化学处理、电穿孔等物理化学处理。因此,是期待蛋白质的自发摄入的实验。其结果如图13所示,表明了虽然为与电穿孔法相比较少的比例,但通过蛋白质转导法而ZF(ZFA36A)-ND1蛋白质和ZF(ZFA36A)-FokI蛋白质被摄入,能够进行基因组编辑。在使用蛋白质转导法的情况下,ZF(ZFA36A)-ND1的活性与ZF(ZFA36A)-FokI相比为同等或其以上的活性。

产业可利用性

本发明的新的核酸酶结构域具有与FokI的核酸酶结构域不同的优异特性,包含本发明的核酸酶结构域的人工核酸切割酶作为基因组编辑工具非常有用。

序列表自由文本

序列号:9;ND1置换正向引物

序列号:10;ND1置换反向引物

序列号:11;ND2置换正向引物

序列号:12;ND2置换反向引物

序列号:13;ND3置换正向引物

序列号:14;ND3置换反向引物

序列号:15;ND4置换正向引物

序列号:16;ND4置换反向引物

序列号:17;用于连接物改变的正向引物,ZFN-FokI-GS-F

序列号:18;用于连接物改变的反向引物,ZFN-GS-inverse-R

序列号:19;用于连接物改变的正向引物,ZFN-ND1-GS-F

序列号:20;用于连接物改变的反向引物,ZFN-GS-inverse-R

序列号:21;用于连接物改变的正向引物,ZFN-ND2-GS-F

序列号:22;用于连接物改变的反向引物,ZFN-GS-inverse-R

序列号:23;用于连接物改变的正向引物,ZFN-FokI-RPGEKP-F

序列号:24;用于连接物改变的反向引物,ZFN-RPGEKP-R

序列号:25;用于连接物改变的正向引物,ZFN-ND1-RPGEKP-F

序列号:26;用于连接物改变的反向引物,ZFN-RPGEKP-R

序列号:27;用于连接物改变的正向引物,ZFN-ND2-RPGEKP-F

序列号:28;用于连接物改变的反向引物,ZFN-RPGEKP-R

序列号:29;用于连接物改变的正向引物,ZFN-FokI-TGPGAAARA-F

序列号:30;用于连接物改变的反向引物,ZFN-FokI-TGPGAAARA-R

序列号:31;用于连接物改变的正向引物,ZFN-ND1-TGPGAAARA-F

序列号:32;用于连接物改变的反向引物,ZFN-FokI-TGPGAAARA-R

序列号:33;用于连接物改变的正向引物,ZFN-ND2-TGPGAAARA-F

序列号:34;用于连接物改变的反向引物,ZFN-FokI-TGPGAAARA-R

序列号:35;用于在FokI-ND中导入Sharkey突变的正向引物

序列号:36;用于在FokI-ND中导入Sharkey突变的反向引物

序列号:37;用于在ND1中导入Sharkey突变的正向引物

序列号:38;用于在ND1中导入Sharkey突变的反向引物

序列号:39;用于在ND2中导入Sharkey突变的正向引物

序列号:40;用于在中ND2导入Sharkey突变的反向引物

序列号:41;ZFA置换正向引物

序列号:42;ZFA置换反向引物

序列号:43;用于FokI-DDD突变导入的正向引物

序列号:44;用于FokI-DDD突变导入的反向引物

序列号:45;用于ND1-DDD突变导入的正向引物

序列号:46;用于ND1-DDD突变导入的反向引物

序列号:47;用于ND2-DDD突变导入的正向引物

序列号:48;用于ND2-DDD突变导入的反向引物

序列号:49;用于FokI-RRR载体突变导入的正向引物

序列号:50;用于FokI-RRR载体突变导入的反向引物

序列号:51;用于FokI-RRR插入物突变导入的正向引物

序列号:52;用于FokI-RRR插入物突变导入的反向引物

序列号:53;用于ND1-RRR载体突变导入的正向引物

序列号:54;用于ND1-RRR载体突变导入的反向引物

序列号:55;用于ND1-RRR插入物突变导入的正向引物

序列号:56;用于ND1-RRR插入物突变导入的反向引物

序列号:57;用于ND2-RRR载体突变导入的正向引物

序列号:58;用于ND2-RRR载体突变导入的反向引物

序列号:59;用于ND2-RRR插入物突变导入的正向引物

序列号:60;用于ND2-RRR插入物突变导入的反向引物

序列号:61;M13-F引物

序列号:62;CHO-K1 ZFA36-ZFA36目标第1位点

序列号:63;CHO-K1 ZFA36-ZFA36目标第2位点

序列号:64;CHO-K1 ZFA36-ZFA36目标第3位点

序列号:65;CHO-K1 ZFL1-ZFA36目标第1位点

序列号:66;CHO-K1 ZFL1-ZFA36目标第2位点

序列号:67;FokI-DDD氨基酸序列

序列号:68;FokI-RRR氨基酸序列

序列号:69;ND1-DDD氨基酸序列

序列号:70;ND1-RRR氨基酸序列

序列号:71;ND2-DDD氨基酸序列

序列号:72;ND2-RRR氨基酸序列

序列号:73;FokI-S418P/K441E氨基酸序列

序列号:74;ND1-S418P/K441E氨基酸序列

序列号:75;ND2-S441E氨基酸序列

序列号:76;FokI切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:77;FokI切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:78;FokI切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:79;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:80;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:81;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:82;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:83;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:84;ND1切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:85;ND2切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:86;ND2切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:87;ND2切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:88;ND2切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:89;ND2切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:90;ND3切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:91;ND4切割的CHO-K1 ZFA36-ZFA36目标第1位点

序列号:92;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:93;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:94;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:95;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:96;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:97;FokI切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:98;ND1切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:99;ND1切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:100;ND1切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:101ND1切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:102ND1切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:103;ND2切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:104;ND2切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:105;ND2切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:106;ND2切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:107;ND2切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:108;ND3切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:109;ND3切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:110;ND3切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:111;ND3切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:112;ND4切割的CHO-K1 ZFA36-ZFA36目标第2位点

序列号:113;用于应用于ptTALE-ND置换的载体扩增的正向引物,ptTALEN-inverse-F

序列号:114;用于应用于ptTALE-ND置换的载体扩增的反向引物,NC-inverse-R_2

序列号:115;用于应用于ptTALE-ND置换的插入物扩增的正向引物,ND1-NC-F_v2

序列号:116;用于应用于ptTALE-ND置换的插入物扩增的反向引物,ND1-ptTALEN-R

序列号:117;CHO-K1细胞中的ROSA26基因座上的目标序列

序列号:118;CHO-K1细胞中的HPRT1基因座上的目标序列

序列号:119;ZF(ZFA36A)-ND1氨基酸序列

序列号:120;ZF(ZFL1)-ND1氨基酸序列

序列号:121;ZF(ZFA36A)-FokI氨基酸序列

序列号:122;ZF(ZFL1)-FokI氨基酸序列

相关技术
  • 新的核酸酶结构域及其利用
  • 核糖核酸酶与毒蛋白膜转位结构域融合蛋白及其制备方法和用途
技术分类

06120112876272