一种基于人的改造后的APOBEC3A的胞嘧啶碱基编辑器
文献发布时间:2023-06-19 19:30:30
技术领域
本发明涉及一种基于人的改造后的APOBEC3A的胞嘧啶碱基编辑器,属于基因工程技术领域。
背景技术
当前基因编辑技术不断快速发展,通过改造特定的基因,可以研究基因功能、遗传病的发病机理、开发新药以及用于基因治疗和改良作物等。近年来,基于CRISPR-Cas系统的各种衍生技术更是广泛应用在生命科学和医学领域,其中的单碱基编辑器(Base editor,BE)已成为基因编辑技术的重要组成部分。BE是在CRISPR-Cas9系统的基础上设计的,将野生型的Cas9蛋白进行改造后与胞嘧啶脱氨酶或腺嘌呤脱氨酶连接,然后通过sgRNA(smallguide RNA)的引导,在不产生DNA双链断裂(Double strandedbreak,DSB)的情况下直接进行单个碱基的编辑。BE主要分为两大类:胞嘧啶碱基编辑器(Cytosine Base Editor,CBE)和腺嘌呤碱基编辑器(Adenine Base Editor,ABE)。2016年Dvid R Liu.团队开发的CBE系统中采用的胞嘧啶脱氨酶可将非互补链中相应的胞嘧啶(Cytosine,C)经过脱氨基作用变为尿嘧啶(Uracil,U),在DNA复制或修复的过程中U被识别为胸腺嘧啶(Thymine,T),而互补链上相对应的鸟嘌呤(Guanine,G)将会变成腺嘌呤(Adenine,A),最终实现非互补链上C>T和互补链上G>A的转换。2017年,Dvid R Liu.团队又开发ABE系统,原理和CBE系统相似,只是将胞嘧啶脱氨酶换成了腺嘌呤脱氨酶,可以完成非互补链上A>G和互补链上T>C的编辑,进一步补充了单碱基编辑器的类型。
BE系统中的Cas9蛋白可进一步优化,一种是可结合靶基因但不切割靶基因的无核酸内切酶活性的dCas9(Catalytically dead Cas9),另一种是具有单链DNA切口酶活性的nCas9(Cas9 nickase),两种Cas9蛋白均不会产生DBS,从而避免了非同源末端连接(Non-homologous end-joining,NHEJ)的错配,也不用考虑同源重组修复(Homology-directedrepair,HDR)的低效率问题。随后又在BE中加入了尿嘧啶糖基化酶抑制剂(uracilglycosylase inhibitor,UGI)可抑制中间产物U的切除,提高了DNA链上C>T的编辑效率。目前,BE系统发展迅速,CBE系统已优化到第四代BE4,ABE系统也优化到ABE7.10版本,甚至开发出一些将CBE和ABE系统功能融合的双碱基编辑器,可在相同的靶位点同时实现C>T和A>G的转换。
传统的CBE系统中采用的胞嘧啶脱氨酶是大鼠的Apobec1(rA1),Jason M Gehrke等人2018年时尝试采用人的改造后的APOBEC3A(eA3A)去替换第三代CBE系统(BE3)中的rA1,他们将人的APOBEC3A(hA3A)进行定点突变构建了一系列携带hA3A单个氨基酸突变的BE3突变体编辑器,其中hA3A-N57G的靶向(HBB
此外,由于单基因遗传病的致病突变大部分为点突变,而BE系统可以针对DNA序列的单个碱基进行编辑,从而对遗传病人的致病位点突变进行修正,实现“分子手术”,在致病的物质基础上对遗传病进行根治。且已知大约有75000个人类基因组位点突变和遗传疾病有关,其中估计有约50%是CBE系统潜在的治疗靶点。因此,开发更高效、准确的单碱基编辑器并进行优化,对单基因遗传病的治疗具有非常重要的意义。
发明内容
采用改造的人APOBEC3A(eA3A)的BE3突变体编辑器的编辑精确度高,但编辑效率整体偏低,编辑产物的纯度未知,现在急需构建一种产物纯度高尤其是编辑效率提高的胞嘧啶碱基编辑器。
为了解决上述问题,本发明提供了一种编辑效率高且产物纯度高的基因编辑工具。
本发明的第一个目的是提供一种来源于人的胞嘧啶脱氨酶突变体,所述突变体是在氨基酸序列如SEQ ID NO:1的亲本酶的基础上,在第26和27位氨基酸中间依次插入丝氨酸(S)、缬氨酸(V)和精氨酸(R)三个氨基酸残基。
在一种实施方式中,所述突变体的氨基酸序列如SEQ ID NO:2所示。
本发明的第二个目的是提供编码上述胞嘧啶脱氨酶突变体的基因。
在一种实施方式中,所述突变体基因的核苷酸序列如SEQ ID NO:3所示。
本发明的第三个目的是提供一种表达盒,所述表达盒包含上述编码上述胞嘧啶脱氨酶突变体的基因。
在一种实施方式中,所述表达盒还含有启动子、nCas9(D10A)、尿嘧啶DNA糖基化酶抑制剂(UGI)、核定位序列NLS、终止序列。
在一种实施方式中,所述启动子启动编码上述胞嘧啶脱氨酶突变体的基因表达,按连接顺序依次为启动子、权利要求2所述基因、nCas9(D10A)、尿嘧啶DNA糖基化酶抑制剂、NLS和终止序列。
在一种实施方式中,所述启动子包括CMV启动子和U6启动子。
在一种实施方式中,所述nCas9(D10A)的核苷酸序列如SEQ ID NO:4所示,UGI的核苷酸序列如SEQ ID NO:5所示,所述NLS的核苷酸序列如SEQ ID NO:6所示,所述终止序列的核苷酸序列如SEQ ID NO:7所示。
本发明的第四个目的是提供一种基于人的胞嘧啶脱氨酶(APOBEC3A)的CBE单碱基编辑器BE4-hA3A-SVR
在一种实施方式中,所述启动子包括CMV启动子和U6启动子。
在一种实施方式中,红色荧光蛋白的核苷酸序列如SEQ ID NO:8所示。
在一种实施方式中,所述sgRNA转录单元的核苷酸序列如SEQ ID NO:9所示。
本发明的第五个目的是提供上述CBE单碱基编辑器在基因编辑领域中的应用。
在一种实施方式中,根据靶基因设计sgRNA序列并插入至上述CBE单碱基编辑系统的sgRNA转录单元,获得具有特异性靶向基因的CBE单碱基编辑系统,将CBE单碱基编辑系统导入受体细胞中,实现靶标碱基C突变为T,获得含有单碱基突变的细胞。
在一种实施方式中,所述细胞为真核生物细胞。
在一种实施方式中,所述真核生物细胞为哺乳动物细胞。
在一种实施方式中,所述哺乳动物细胞包括人胚肾上皮细胞。
本发明的第六个目的是提供所述CBE单碱基编辑系统BE4-hA3A-SVR
(1)以pSpCas9(BB)-2A-dTomato(PX458)质粒为模板扩增得到红色荧光蛋白dTomato基因及其CMV增强子和启动子,获得载体骨架Part1;
(2)以BE3-rA1质粒为模板,扩增获得插入sgRNA序列的携带框架及其U6启动子,获得载体骨架Part2;
(3)以食蟹猴的cDNA为模板扩增获得APOBEC3A(mA3A-B5)的核苷酸序列,获得载体骨架Part3;
(4)以质粒BE4-rA1为模板扩增获得包括nCas9(D10A)、UGI、NLS、bGH poly(A)signal及CMV增强子和启动子基因序列的载体骨架Part4;
(5)以质粒BE4-rA1为模板扩增获得colE1高拷贝复制起点和氨苄青霉素抗性筛选基因及其氨苄青霉素启动子序列的载体骨架Part5;
(6)按照Part1、Part2、Part3、Part4、Part5的顺序连接五个片段,获得载体质粒BE4-mA3A-B5。
(7)以pcDNA3.1+hA3A+MYC DDK质粒为模板,PCR扩增获得插入SVR序列的hA3A序列即hA3A-SVR
(8)将步骤(7)的插入SVR序列的hA3A序列与双酶切去除mA3A-B5片段的BE4-mA3A-B5载体进行连接,获得载体质粒BE4-hA3A-SVR
(9)设计结合靶基因的sgRNA序列并插入到步骤(2)中的携带框架,获得可以针对不同靶基因相应位点的单碱基编辑器。
在一种实施方式中,pSpCas9(BB)-2A-dTomato(PX458)质粒的构建方式为在质粒pSpCas9(BB)-2A-GFP(PX458)的基础上将GFP替换为dTomato,所述dTomato的核苷酸序列如SEQ ID NO:8所示。
在一种实施方式中,pcDNA3.1+hA3A+MYC DDK质粒的构建方式为在pcDNA3.1-2xFLAG-SREBP-2质粒的基础上,将hA3A片段和一个化学合成的MYCDDK标签片段与EcoRⅠ和XbaⅠ双酶切后的载体连接而成。
在一种实施方式中,所述hA3A片段的核苷酸序列如SEQ ID NO:10所示。
在一种实施方式中,所述mA3A-B5的核苷酸序列如SEQ ID NO:11所示。
本发明还提供上述突变体在基因编辑领域的应用。
本发明还提供上述表达盒在基因编辑领域的应用。
本发明的有益效果:
1、本发明构建的单碱基编辑器BE4-hA3A-SVR
2、本发明基于在人源的胞嘧啶脱氨酶hA3A氨基酸序列的第26位和27位中间依次插入SVR三个氨基酸残基,成功构建了一种在编辑效率,产物纯度和编辑窗口宽度方面都优于原始的BE4-rA1的胞嘧啶碱基编辑器BE4-hA3A-SVR
附图说明
图1:胞嘧啶碱基编辑器BE4-mA3A-B5的质粒图谱;
图2:过表达质粒pcDNA3.1+hA3A+MYCDDK的质粒图谱;
图3:胞嘧啶碱基编辑器BE4-hA3A-SVR
图4:BamHI和SmaI双酶切BE4-mA3A-B5(~11kb)质粒的电泳图;
图5:人的APOBEC3A的基因序列(hA3A)及其插入SVR序列的突变体(hA3A-SVR
图6:Sanger测序验证不同胞嘧啶单碱基编辑器(BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图7:Sanger测序验证不同胞嘧啶单碱基编辑器(BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图8:Sanger测序验证不同胞嘧啶单碱基编辑器(BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图9:Sanger测序验证不同胞嘧啶单碱基编辑器(BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图10:Sanger测序验证不同胞嘧啶单碱基编辑器(BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图11:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图12:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图13:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图14:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图15:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
图16:BE4-hA3A和BE4-hA3A-SVR
图17:BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
具体实施方式
下述实施例中涉及到的质粒:
BE4质粒:Addgene Plasmid#100802。
pSpCas9(BB)-2A-dTomato(PX458)质粒:本实验室在pSpCas9(BB)-2A-GFP(PX458)(Addgene Plasmid#48138)质粒的基础上,化学合成dTomato(SEQ ID NO:8)替换GFP构建的。
BE3-rA1质粒:杨辉教授赠送,已在此Off-target RNAmutation inducedbyDNAbase editing and its elimination by mutagenesis文章中报道,文章中的BE3在本发明中即为BE3-rA1。
BE4-rA1质粒:本实验室构建的,在BE4质粒(Addgene Plasmid#100802)的基础上,在NotⅠ酶切位点依次插入化学合成的dTomato基因序列(SEQ ID NO:8)以及BE3-rA1质粒的U6promoter+sgRNA scaffold+CMV enhancer+CMVpromoter片段。
pcDNA3.1+hA3A+MYCDDK质粒:本实验室构建的,以pcDNA3.1-2xFLAG-SREBP-2(Addgene Plasmid#26807)质粒为骨架,EcoRⅠ和XbaⅠ双酶切载体后,将hA3A片段(SEQ IDNO:10)和一个化学合成的MYCDDK标签片段与酶切后的载体连接而成(图2)。
BE4-mA3A-B5质粒:本实验室构建的,具体构建方法见实施例1。
本发明所涉及的食蟹猴购买于广州相观生物科技有限公司(生产许可证号:SCXK(粤)2018-0043),实验前经记录和兽医检查证实健康状况良好,动物设施符合国家实验动物标准(GB14925-2010)。随后挑选了经过19个月高糖高脂饮食处理产生高胆固醇血症并且可自行恢复到正常血脂的食蟹猴进行本发明胞嘧啶单碱基编辑器(BE4-mA3A-B5)的构建。
实施例1:胞嘧啶单碱基编辑器(BE4-mA3A-B5)的构建
(1)目的基因的获取(mA3A-B5)
本发明采用Paxgene管取得了食蟹猴的血液样品,并通过TIANGEN的血液RNA提取试剂盒提取该食蟹猴的RNA,通过Takara的反转试剂盒获得该食蟹猴的cDNA序列,以其cDNA序列为模板,通过引物对5’-TATAGGGAGAGCCGCCACCATGGAAGCCAGCCCAG-3’和5’-ACCAGAAGAACCACCAGAGTTTCCCTGATTCTGG-3’进行PCR扩增得到mA3A-B5基因片段(即Part3),再用TIANGEN的琼脂糖凝胶DNA提取试剂盒纯化PCR产物。PCR反应体系如表1。
表1 PCR反应体系
反应程序如下:95℃预变性3min;95℃15s,60℃15s,72℃25s,进行35个循环;72℃延伸5min,降温至4℃,最终得到mA3A-B5(Part3)。
(2)线性化质粒载体的制备(BE4)
以BE4-rA1质粒为模板,通过引物对5’-TCTGGTGGTTCTTCTGGTGGTTCTAGCGGC-3’和5’-GGTGGCGGCTCTCCCTATAGTGAGTCGTAT-3’进行PCR扩增,获得PCR产物Part4,包括nCas9(D10A)、UGI、NLS、及CMV增强子和启动子基因序列;
以BE4-rA1质粒为模板,通过引物对5’-CGGTGGCTTCGATAGCCCTACAGTTGCCT-3’和5’-CTACTAGGACAGAATAGGCAACTGTAGGGC-3’进行PCR扩增,获得PCR产物Part5,包括colE1高拷贝复制起点和氨苄青霉素抗性筛选基因及其氨苄青霉素启动子序列。
通过TIANGEN的琼脂糖凝胶DNA提取试剂盒纯化PCR产物Part4和Part5。
(3)红色荧光蛋白(dTomato)的基因获取
以pSpCas9(BB)-2A-dTomato(PX458)质粒为模板,通过引物5’-TAGAGATCCGCGCCACCATGGTGAGC-3’和5’-GAAGGCACAGTTACTTGTACAGCTCG-3’进行PCR扩增,获得红色荧光蛋白dTomato基因及其CMV增强子和启动子,即载体骨架Part1。再用TIANGEN的琼脂糖凝胶DNA提取试剂盒纯化PCR产物Part1。
(4)sgRNA的携带框架及U6启动子的基因获取
以BE3-rA1质粒为模板,利用以下引物5’-GCTCACATGTGAGGGCCTATTTCCC-3’和5’-ATAGGCCCTCACATGTGAGCAAAAG-3’进行PCR扩增,获得用于插入sgRNA序列的携带框架及其U6启动子,即载体骨架Part2。再用TIANGEN的琼脂糖凝胶DNA提取试剂盒纯化PCR产物Part2。
(5)构建载体质粒BE4-mA3A-B5(同源重组法)
采用诺唯赞公司的MultiS One Step Cloning Kit试剂盒将步骤(1)~(4)中纯化后的五个PCR片段Part1、Part2、Part3、Part4和Part5进行连接,获得连接产物,转化大肠杆菌DH5α并涂布在含有0.05%Amp(浓度为100μg/mL的氨苄青霉素)抗性的LB平板上,37℃倒置过夜培养。
在每个克隆平板上挑选3个菌落接种至含有0.1%Amp(浓度为100μg/mL的氨苄青霉素)抗性的液体LB培养基中培养8h以上,然后将菌液送到金唯智公司进行Sanger测序验证。将片段成功插入的克隆载体进行扩大培养,然后采用康为世纪公司的无内毒素的质粒提取试剂盒获得载体质粒并命名为BE4-mA3A-B5,-20℃存放备用。BE4-mA3A-B5质粒图谱如图1所示。
实施例2:基于人APOBEC3A(hA3A)及其突变体的胞嘧啶单碱基编辑器的构建
(1)线性化质粒载体的制备(BE4-mA3A-B5)
通过Takara公司的快切酶BamHI和SmaI双酶切实施例1中获得的BE4-mA3A-B5载体,去除载体中食蟹猴的APOBEC3A,以便接下来进行胞嘧啶脱氨酶的替换,酶切体系及反应条件如表2。然后使用TIANGEN的普通DNA产物纯化试剂盒纯化酶切产物,获得线性化载体(见图4)。
表2BamHI和SmaI双酶切体系
()目的基因的获取(hA3A和hA3A-SVR
以本实验室前期构建的过表达hA3A的质粒pcDNA3.1+hA3A+MYC DDK为模板,通过引物对5’-CCAGACACTTGATGGATCCACACATATTCACTTCCAAC-3’和5’-GGACTCTGAGGTCCCGGGAGTCTCGCTGCC-3’进行PCR扩增得到hA3A的基因序列;同样以过表达hA3A的质粒pcDNA3.1+hA3A+MYC DDK为模板,通过引物对5’-CCAGACACTTGATGGATCCACACATATTCACTTCCAACTTTAACAATGGCATTTCGGTCCGTGG AAGGCATAAG-3’和5’-GGACTCTGAGGTCCCGGGAGTCTCGCTGCC-3’进行PCR扩增得到hA3A-SVR
表3 PCR反应体系
反应程序如下:95℃预变性3min;95℃15s,60℃15s,72℃25s,进行35个循环;72℃延伸5min,降温至4℃,最终得到hA3A基因片段。
(3)构建载体质粒BE4-hA3A-SVR
采用诺唯赞公司的ClonExpress II One Step Cloning Kit试剂盒将步骤(2)中纯化后的hA3A或hA3A-SVR
在每个克隆平板上挑选3个菌落接种至含有0.1%Amp(浓度为100μg/mL的氨苄青霉素)抗性的液体LB培养基中培养8h以上,然后将菌液送到金唯智公司进行Sanger测序验证。将片段成功插入的克隆载体进行扩大培养,然后采用康为世纪公司的无内毒素的质粒提取试剂盒获得载体质粒并命名为BE4-hA3A和BE4-hA3A-SVR
实施例3:胞嘧啶碱基编辑器BE4-hA3A-SVR
(1)插入特异性靶向基因的sgRNA
由于单碱基编辑器是基于CRISPR/Cas9系统的,它的靶向特异性是由两部分组成的,一部分是sgRNA和靶DNA序列之间的碱基互补配对,另一部分是Cas9蛋白和位于靶DNA序列3’末端的短DNA序列决定的。其中靶DNA序列被称为原间隔子(细菌天然免疫防御时将外来DNA片段称为原间隔子,即protospacer),位于靶DNA序列3’末端的短DNA序列被称为PAM(protospacer adjacent motif)。
为了更好的和已有研究做对比,采用的sgRNA是已经有文献报道的序列,具体见表4。
表4:sgRNA及其PAM序列表
1)利用BbsI分别酶切原始的BE3-rA1质粒、BE4-rA1质粒以及实施例2中构建的胞嘧啶碱基编辑器(BE4-hA3A和BE4-hA3A-SVR
2)分别化学合成表6中靶点site3、RNF2、EMX1、HEK2和HEK4的sgRNA的克隆引物,并通过热激退火使克隆引物自连成双链寡核苷酸片段(sgRNA自连体系见表7),将双链寡核苷酸片段与步骤1)中线性化载体连接(连接体系见表8),将连接好的载体转化至感受态大肠杆菌细胞(DH5α),测序鉴定及质粒提取,最后获得一系列靶向site3、RNF2、EMX1、HEK2和HEK4基因的胞嘧啶单碱基编辑器。
表5 BbsI酶切体系
表6 sgRNA克隆引物表
表7 sgRNA自连体系
表8连接体系
(2)细胞转染
高糖DMEM完全培养基的配制:高糖DMEM培养基中含10%胎牛血清(FBS)和1%三抗(青霉素-链霉素-庆大霉素)。
1)细胞培养:从液氮罐中取出冻存的人胚肾上皮细胞(HEK293T细胞),置于37℃水浴中迅速融化,将融化的细胞悬液加入到10mL高糖DMEM完全培养基中,离心收集细胞沉淀,使用高糖DMEM完全培养基重悬细胞并加入到含有10mL高糖DMEM完全培养基的细胞培养皿中,并放置于含有5%CO
2)细胞铺板:待HEK293T细胞长满培养皿,用0.25%胰酶消化细胞1min,高糖DMEM完全培养基终止消化,1500rpm平衡离心2min,弃去上清,用1mL高糖DMEM完全培养基重悬细胞,并按照1×10
3)细胞转染:在一支1.5mL的EP管中,用125μL Opti-MEM培养基稀释3.75μL的转染试剂Lipofectamine 3000,充分混匀,获得混合液A;在另一支1.5mL的EP管中,使用125μLOpti-MEM培养基稀释2.5μg步骤(1)中构建的靶向site3、RNF2、EMX1、HEK2或HEK4基因的胞嘧啶单碱基编辑器,并添加5μL P3000辅助转染试剂,充分混匀,获得混合液B;将混合液A和B以1:1的比例混合,室温孵育15min,获得混合物;将混合物添加至步骤2)中刚刚铺好细胞的6孔板中,轻柔混匀,避免损伤细胞;然后将6孔板放回37℃,5%CO
(3)流式分选
先用0.25%胰酶消化转染72h后的细胞,高糖DMEM完全培养基终止消化,1500rpm平衡离心2min收集细胞沉淀,然后加入2mL含有2%胎牛血清(FBS)的PBS重悬清洗细胞,1500rpm平衡离心2min,重复清洗两次后用1mL含有2%FBS的PBS重悬细胞,然后将细胞悬液通过带有滤膜的流式分选小管进行收集,去除较大的细胞碎片聚集物,避免分选时堵塞仪器。
将制备好的细胞悬液和对应的含有2mL高糖DMEM完全培养基的收集管均放置于冰上,然后进行流式上机分选操作,因为本发明构建的胞嘧啶碱基编辑器上携带有红色荧光蛋白(dTomato),根据激发波长(554nm)和发射波长(581nm)直接进行分选收集获得dTomato阳性细胞。BE3-rA1质粒携带的是绿色荧光蛋白(GFP),根据其激发波长(488nm)和发射波长(507nm)直接进行分选收集获得GFP阳性细胞。每个样品至少分得10万细胞。
(4)Sanger测序验证
将步骤(3)中收集的dTomato阳性细胞或GFP阳性细胞,1500rpm平衡离心2min后收集沉淀,然后通过诺唯赞的细胞/组织DNA提取试剂盒提取细胞的DNA。以DNA为模板,采用高保真酶进行PCR扩增获得PCR产物,测序引物见表9。取5μL PCR产物进行琼脂糖凝胶电泳,将条带大小符合预期的PCR产物送到金唯智公司进行Sanger测序。通过采用Chromas软件对Sanger测序的峰图进行查看,通过SnapGene Viewer软件对Sanger测序的结果进行分析各个碱基的占比。
表9 sgRNA的Sanger测序引物表
实施例4:胞嘧啶碱基编辑器的编辑效率对比
将靶向site3、RNF2、EMX1、HEK2和HEK4基因的一系列编辑器(如BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
不同编辑器在site3、RNF2、EMX1、HEK2和HEK4基因靶向位点的编辑效率对比结果分别见图6、图7、图8、图9和图10。结果显示,相比原始的BE3-rA1和BE4-rA1质粒,携带hA3A或hA3A-SVR
实施例5:胞嘧啶碱基编辑器的产物纯度对比
将靶向site3、RNF2、EMX1、HEK2和HEK4基因的一系列编辑器(如BE3-rA1、BE4-rA1、BE4-hA3A和BE4-hA3A-SVR
不同编辑器在site3、RNF2、EMX1、HEK2和HEK4基因靶向位点的产物纯度对比结果分别见图11、图12、图13、图14和图15,其结果显示,插入SVR序列的BE4-hA3A-SVR
实施例6:胞嘧啶碱基编辑器的编辑窗口对比
整合所有测试过的基因(site3、RNF2、EMX1、HEK2和HEK4)中C碱基的编辑情况,根据C碱基在原间隔子中的位置(PAM位于21-23位)对这5个基因位点中C的平均编辑效率进行了整理。其中BE3-rA1和BE4-rA1的编辑窗口较小,只有C4-C6之间才能有效编辑,且编辑效率较低(最高不超过30%)。与BE3-rA1和BE4-rA1相比,可以看出BE4-hA3A和BE4-hA3A-SVR
单独比较BE4-hA3A和BE4-hA3A-SVR
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一种基于人的改造后的APOBEC3A的胞嘧啶碱基编辑器
<130> BAA211147A
<160> 11
<170> PatentIn version 3.3
<210> 1
<211> 199
<212> PRT
<213> 人工序列
<400> 1
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 1015
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
202530
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
354045
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
505560
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65707580
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
859095
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 2
<211> 202
<212> PRT
<213> 人工序列
<400> 2
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 1015
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Ser Val Arg Gly Arg His
202530
Lys Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser
354045
Val Lys Met Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn
505560
Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp
65707580
Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr
859095
Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu
100 105 110
Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln
130 135 140
Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 3
<211> 609
<212> DNA
<213> 人工序列
<400> 3
atggaagcca gcccagcatc cgggcccaga cacttgatgg atccacacat attcacttcc 60
aactttaaca atggcatttc ggtccgtgga aggcataaga cctacctgtg ctacgaagtg 120
gagcgcctgg acaatggcac ctcggtcaag atggaccagc acaggggctt tctacacaac 180
caggctaaga atcttctctg tggcttttac ggccgccatg cggagctgcg cttcttggac 240
ctggttcctt ctttgcagtt ggacccggcc cagatctaca gggtcacttg gttcatctcc 300
tggagcccct gcttctcctg gggctgtgcc ggggaagtgc gtgcgttcct tcaggagaac 360
acacacgtga gactgcgtat cttcgctgcc cgcatctatg attacgaccc cctatataag 420
gaggcactgc aaatgctgcg ggatgctggg gcccaagtct ccatcatgac ctacgatgaa 480
tttaagcact gctgggacac ctttgtggac caccagggat gtcccttcca gccctgggat 540
ggactagatg agcacagcca agccctgagt gggaggctgc gggccattct ccagaatcag 600
ggaaactga 609
<210> 4
<211> 4101
<212> DNA
<213> 人工序列
<400> 4
gataaaaagt attctattgg tttagccatc ggcactaatt ccgttggatg ggctgtcata 60
accgatgaat acaaagtacc ttcaaagaaa tttaaggtgt tggggaacac agaccgtcat 120
tcgattaaaa agaatcttat cggtgccctc ctattcgata gtggcgaaac ggcagaggcg 180
actcgcctga aacgaaccgc tcggagaagg tatacacgtc gcaagaaccg aatatgttac 240
ttacaagaaa tttttagcaa tgagatggcc aaagttgacg attctttctt tcaccgtttg 300
gaagagtcct tccttgtcga agaggacaag aaacatgaac ggcaccccat ctttggaaac 360
atagtagatg aggtggcata tcatgaaaag tacccaacga tttatcacct cagaaaaaag 420
ctagttgact caactgataa agcggacctg aggttaatct acttggctct tgcccatatg 480
ataaagttcc gtgggcactt tctcattgag ggtgatctaa atccggacaa ctcggatgtc 540
gacaaactgt tcatccagtt agtacaaacc tataatcagt tgtttgaaga gaaccctata 600
aatgcaagtg gcgtggatgc gaaggctatt cttagcgccc gcctctctaa atcccgacgg 660
ctagaaaacc tgatcgcaca attacccgga gagaagaaaa atgggttgtt cggtaacctt 720
atagcgctct cactaggcct gacaccaaat tttaagtcga acttcgactt agctgaagat 780
gccaaattgc agcttagtaa ggacacgtac gatgacgatc tcgacaatct actggcacaa 840
attggagatc agtatgcgga cttatttttg gctgccaaaa accttagcga tgcaatcctc 900
ctatctgaca tactgagagt taatactgag attaccaagg cgccgttatc cgcttcaatg 960
atcaaaaggt acgatgaaca tcaccaagac ttgacacttc tcaaggccct agtccgtcag 1020
caactgcctg agaaatataa ggaaatattc tttgatcagt cgaaaaacgg gtacgcaggt 1080
tatattgacg gcggagcgag tcaagaggaa ttctacaagt ttatcaaacc catattagag 1140
aagatggatg ggacggaaga gttgcttgta aaactcaatc gcgaagatct actgcgaaag 1200
cagcggactt tcgacaacgg tagcattcca catcaaatcc acttaggcga attgcatgct 1260
atacttagaa ggcaggagga tttttatccg ttcctcaaag acaatcgtga aaagattgag 1320
aaaatcctaa cctttcgcat accttactat gtgggacccc tggcccgagg gaactctcgg 1380
ttcgcatgga tgacaagaaa gtccgaagaa acgattactc catggaattt tgaggaagtt 1440
gtcgataaag gtgcgtcagc tcaatcgttc atcgagagga tgaccaactt tgacaagaat 1500
ttaccgaacg aaaaagtatt gcctaagcac agtttacttt acgagtattt cacagtgtac 1560
aatgaactca cgaaagttaa gtatgtcact gagggcatgc gtaaacccgc ctttctaagc 1620
ggagaacaga agaaagcaat agtagatctg ttattcaaga ccaaccgcaa agtgacagtt 1680
aagcaattga aagaggacta ctttaagaaa attgaatgct tcgattctgt cgagatctcc 1740
ggggtagaag atcgatttaa tgcgtcactt ggtacgtatc atgacctcct aaagataatt 1800
aaagataagg acttcctgga taacgaagag aatgaagata tcttagaaga tatagtgttg 1860
actcttaccc tctttgaaga tcgggaaatg attgaggaaa gactaaaaac atacgctcac 1920
ctgttcgacg ataaggttat gaaacagtta aagaggcgtc gctatacggg ctggggacga 1980
ttgtcgcgga aacttatcaa cgggataaga gacaagcaaa gtggtaaaac tattctcgat 2040
tttctaaaga gcgacggctt cgccaatagg aactttatgc agctgatcca tgatgactct 2100
ttaaccttca aagaggatat acaaaaggca caggtttccg gacaagggga ctcattgcac 2160
gaacatattg cgaatcttgc tggttcgcca gccatcaaaa agggcatact ccagacagtc 2220
aaagtagtgg atgagctagt taaggtcatg ggacgtcaca aaccggaaaa cattgtaatc 2280
gagatggcac gcgaaaatca aacgactcag aaggggcaaa aaaacagtcg agagcggatg 2340
aagagaatag aagagggtat taaagaactg ggcagccaga tcttaaagga gcatcctgtg 2400
gaaaataccc aattgcagaa cgagaaactt tacctctatt acctacaaaa tggaagggac 2460
atgtatgttg atcaggaact ggacataaac cgtttatctg attacgacgt cgatcacatt 2520
gtaccccaat cctttttgaa ggacgattca atcgacaata aagtgcttac acgctcggat 2580
aagaaccgag ggaaaagtga caatgttcca agcgaggaag tcgtaaagaa aatgaagaac 2640
tattggcggc agctcctaaa tgcgaaactg ataacgcaaa gaaagttcga taacttaact 2700
aaagctgaga ggggtggctt gtctgaactt gacaaggccg gatttattaa acgtcagctc 2760
gtggaaaccc gccaaatcac aaagcatgtt gcacagatac tagattcccg aatgaatacg 2820
aaatacgacg agaacgataa gctgattcgg gaagtcaaag taatcacttt aaagtcaaaa 2880
ttggtgtcgg acttcagaaa ggattttcaa ttctataaag ttagggagat aaataactac 2940
caccatgcgc acgacgctta tcttaatgcc gtcgtaggga ccgcactcat taagaaatac 3000
ccgaagctag aaagtgagtt tgtgtatggt gattacaaag tttatgacgt ccgtaagatg 3060
atcgcgaaaa gcgaacagga gataggcaag gctacagcca aatacttctt ttattctaac 3120
attatgaatt tctttaagac ggaaatcact ctggcaaacg gagagatacg caaacgacct 3180
ttaattgaaa ccaatgggga gacaggtgaa atcgtatggg ataagggccg ggacttcgcg 3240
acggtgagaa aagttttgtc catgccccaa gtcaacatag taaagaaaac tgaggtgcag 3300
accggagggt tttcaaagga atcgattctt ccaaaaagga atagtgataa gctcatcgct 3360
cgtaaaaagg actgggaccc gaaaaagtac ggtggcttcg atagccctac agttgcctat 3420
tctgtcctag tagtggcaaa agttgagaag ggaaaatcca agaaactgaa gtcagtcaaa 3480
gaattattgg ggataacgat tatggagcgc tcgtcttttg aaaagaaccc catcgacttc 3540
cttgaggcga aaggttacaa ggaagtaaaa aaggatctca taattaaact accaaagtat 3600
agtctgtttg agttagaaaa tggccgaaaa cggatgttgg ctagcgccgg agagcttcaa 3660
aaggggaacg aactcgcact accgtctaaa tacgtgaatt tcctgtattt agcgtcccat 3720
tacgagaagt tgaaaggttc acctgaagat aacgaacaga agcaactttt tgttgagcag 3780
cacaaacatt atctcgacga aatcatagag caaatttcgg aattcagtaa gagagtcatc 3840
ctagctgatg ccaatctgga caaagtatta agcgcataca acaagcacag ggataaaccc 3900
atacgtgagc aggcggaaaa tattatccat ttgtttactc ttaccaacct cggcgctcca 3960
gccgcattca agtattttga cacaacgata gatcgcaaac gatacacttc taccaaggag 4020
gtgctagacg cgacactgat tcaccaatcc atcacgggat tatatgaaac tcggatagat 4080
ttgtcacagc ttgggggtga c 4101
<210> 5
<211> 249
<212> DNA
<213> 人工序列
<400> 5
actaatctgt cagatattat tgaaaaggag accggtaagc aactggttat ccaggaatcc 60
atcctcatgc tcccagagga ggtggaagaa gtcattggga acaagccgga aagcgatata 120
ctcgtgcaca ccgcctacga cgagagcacc gacgagaatg tcatgcttct gactagcgac 180
gcccctgaat acaagccttg ggctctggtc atacaggata gcaacggtga gaacaagatt 240
aagatgctc 249
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<400> 6
cccaagaaga agaggaaagt c 21
<210> 7
<211> 225
<212> DNA
<213> 人工序列
<400> 7
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggttgacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 8
<211> 705
<212> DNA
<213> 人工序列
<400> 8
atggtgagca agggcgagga ggtcatcaaa gagttcatgc gcttcaaggt gcgcatggag 60
ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggcacccaga ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcat gtacggctcc aaggcgtacg tgaagcaccc cgccgacatc 240
cccgattaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gtctggtgac cgtgacccag gactcctccc tgcaggacgg cacgctgatc 360
tacaaggtga agatgcgcgg caccaacttc ccccccgacg gccccgtaat gcagaagaaa 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccacc aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagacc 540
atctacatgg ccaagaagcc cgtgcaactg cccggctact actacgtgga caccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgagcg ctccgagggc 660
cgccaccacc tgttcctgta cggcatggac gagctgtaca agtaa 705
<210> 9
<211> 343
<212> DNA
<213> 人工序列
<400> 9
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgc 343
<210> 10
<211> 600
<212> DNA
<213> 人工序列
<400> 10
atggaagcca gcccagcatc cgggcccaga cacttgatgg atccacacat attcacttcc 60
aactttaaca atggcattgg aaggcataag acctacctgt gctacgaagt ggagcgcctg 120
gacaatggca cctcggtcaa gatggaccag cacaggggct ttctacacaa ccaggctaag 180
aatcttctct gtggctttta cggccgccat gcggagctgc gcttcttgga cctggttcct 240
tctttgcagt tggacccggc ccagatctac agggtcactt ggttcatctc ctggagcccc 300
tgcttctcct ggggctgtgc cggggaagtg cgtgcgttcc ttcaggagaa cacacacgtg 360
agactgcgta tcttcgctgc ccgcatctat gattacgacc ccctatataa ggaggcactg 420
caaatgctgc gggatgctgg ggcccaagtc tccatcatga cctacgatga atttaagcac 480
tgctgggaca cctttgtgga ccaccaggga tgtcccttcc agccctggga tggactagat 540
gagcacagcc aagccctgag tgggaggctg cgggccattc tccagaatca gggaaactga 600
<210> 11
<211> 609
<212> DNA
<213> 人工序列
<400> 11
atggaagcca gcccagcatc caggcccaga cacttgatgg atccaaacac gttcactttc 60
aactttaaca atgacctttc ggtccgtgga cggcaccaga cctacttgtg ctacgaggtg 120
gagcgcctgg acaatggcac ctgggtcccg atggacgagc gcaggggctt tctatgcaac 180
aaggctaaga atgttccctg tggtgattat ggctgccacg cggagctgtg cttcctgggc 240
gaggttcctt cttggcagtt ggacccggcc cagacgtaca gggtcacttg gttcatctcc 300
tggagcccct gcttcaggag gggctgtgcc gagcaagtgc gtgcgttcct tcaggagaac 360
acacacatga gactgcgcat ctttgctgcc cgcatctatg attacgattt cctgtatcag 420
gaggcactgc gaacgctgcg ggatgctggg gcccaagtct ccatcatgac ctacgaggaa 480
tttaagcact gctgggacac ctttgtggac cgccagggac gtcccttcca gccctgggat 540
ggactagatg agcacagcca agccctgagt gggaggcttc gggacattct ccagaatcag 600
ggaaactga 609
- 一种基于食蟹猴APOBEC3A及其突变体的胞嘧啶碱基编辑器
- 基于人APOBEC3A脱氨酶的碱基编辑器及其用途