掌桥专利:专业的专利平台
掌桥专利
首页

Cas13蛋白、CRISPR-Cas系统及其应用

文献发布时间:2024-05-24 17:48:49


Cas13蛋白、CRISPR-Cas系统及其应用

技术领域

本发明涉及Cas13蛋白、CRISPR-Cas系统及其应用,属于生物技术领域。

背景技术

CRISPR(Clustered regularly interspaced short palindromic repeats)系统是细菌和古细菌为了防御入侵噬菌体的DNA而形成的。CRISPR系统包括2个家族,1类系统进一步分为I型、III型和IV型,2类系统分为II型、V型和VI型。这6种系统类型又细分为19种亚型。许多原核生物包含多个CRISPR-Cas系统,这表明它们是兼容的并且可能共享组件。

CRISPR/Cas13系统是能够靶向RNA进行切割的CRISPR系统,该系统由Cas13蛋白和CRISPR RNA(向导RNA)组装形成一个由向导RNA引导的RNA靶向效应复合物。目前,Cas13家族共鉴定出四种亚型,包括Cas13a、Cas13b、Cas13c、Cas13d等。

相对于RNAi技术和CRISPRi技术,CRISPR/Cas13系统能够实现更高的RNA降解,同时脱靶可能性更低。但是,目前已经发现的Cas13蛋白还存在如体积大、切割活性低等的缺陷,这些缺陷会影响CRISPR/Cas13系统对靶RNA的编辑性能。不同微生物来源的CRISPR/Cas13系统显示出功能和结构上的多样性。因此,还需要继续挖掘更多Cas13蛋白以构建性能更优的CRISPR-Cas13系统。

发明内容

本公开提供了新的Cas13蛋白及CRSPR-Cas13系统以解决上述问题。

本公开的一个方面,提供了一种Cas13蛋白,所述Cas13蛋白为如下(a)或(b)的蛋白质:

(a)包含如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ ID NO.5、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8或SEQ ID NO.9所示的氨基酸序列的蛋白质;

(b)在(a)限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且基本保留了其源自的序列的生物学功能的蛋白质。

在一些优选的实施方式中,(b)中所述蛋白质的氨基酸序列与(a)相比,具有至少85%的序列同一性,并且基本保留了其源自的序列的生物学功能。

在一些优选的实施方式中,(b)中所述蛋白质的氨基酸序列与(a)相比,具有至少95%的序列同一性,并且基本保留了其源自的序列的生物学功能。

本公开的第二方面中,提供了一种融合蛋白,所述融合蛋白包含前述Cas13蛋白以及异源功能结构域。

在一些优选的实施方式中,所述异源功能结构域包括脱氨酶、报告蛋白、检测标记、定位信号、蛋白质靶向域、DNA结合域、表位标签、转录激活功能域、转录抑制功能域、核酸酶、甲基化活性酶、脱甲基酶、转录释放因子、RNA裂解多肽、核酸连接酶、组蛋白修饰活性因子或核酸结合活性因子中的至少一种。

在一些优选的实施方式中,所述异源功能结构域在所述Cas13蛋白的N端或C端进行融合,或者,所述异源功能结构域在所述Cas13蛋白的内部进行融合。

在一些优选的实施方式中,所述定位信号是核定位信号或核输出信号。

本公开的第三方面中,提供了一种CRISPR-Cas系统,所述CRISPR-Cas系统包含第一方面的Cas13蛋白以及向导RNA,或者,所述CRISPR-Cas系统包含第二方面的融合蛋白以及向导RNA;所述向导RNA能够与Cas13蛋白结合形成复合物并引导所述复合物与靶RNA接触。

在一些优选的实施方式中,所述向导RNA包含间隔序列和同向重复序列;所述间隔序列的大小为15~60个核苷酸;所述同向重复序列的大小为15~40个核苷酸。

在一些优选的实施方式中,所述的间隔序列在25-35个核苷酸之间。

在一些优选的实施方式中,所述的间隔序列在30个核苷酸左右。

在一些优选的实施方式中,所述间隔序列与靶RNA之间至少有15个核苷酸存在互补。

本公开的第四方面中,提供了一种多核苷酸,所述多核苷酸编码第一方面的Cas13蛋白,或者,所述多核苷酸编码第二方面的融合蛋白,或者,所述多核苷酸编码第三方面的CRISPR-Cas系统。

本公开的第五方面中,提供了一种载体,所述载体携带第四方面所述的多核苷酸。

在一些优选的实施方式中,所述载体携带的多核苷酸连接调控元件。

在一些优选的实施方式中,所述调控元件包括启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号、转座子、前导序列、多腺苷酸序列或标记基因中的至少一种。

在一些优选的实施方式中,所述载体包括病毒载体或非病毒载体中的至少一种。

在一些优选的实施方式中,所述病毒载体包括逆转录病毒载体、噬菌体载体、腺病毒载体、腺相关病毒载体、痘苗病毒载体、杂合病毒载体、杆状病毒载体、单纯疱疹病毒载体或慢病毒载体中的至少一种。

在一些优选的实施方式中,所述非病毒载体包括质粒载体。

本公开的第六方面中,提供了一种递送系统,所述递送系统携带第一方面的Cas13蛋白、第二方面所述的融合蛋白、第三方面的CRISPR-Cas系统、第四方面的多核苷酸或第五方面所述的载体。

在一些优选的实施方式中,所述递送系统的递送载体包括脂质体载体、壳聚糖载体、聚合物载体、纳米颗粒载体、外泌体载体、外来体载体、微泡载体、病毒载体、基因枪或电穿孔装置中的至少一种。

本公开的第七方面中,提供了一种宿主细胞,所述宿主细胞携带第一方面的Cas13蛋白、第二方面所述的融合蛋白、第三方面所述的CRISPR-Cas系统、第四方面所述的多核苷酸或第五方面所述的载体。

本公开的第八方面中,提供了一种模型,所述模型为植物模型或动物模型;所述植物模型或动物模型包含第七方面所述的宿主细胞。

本公开的第九方面中,提供了一种基因编辑的方法,所述方法包括将靶RNA与第一方面的Cas13蛋白、第二方面所述的融合蛋白、第三方面所述的CRISPR-Cas系统、第四方面所述的多核苷酸、第五方面所述的载体或第七方面所述的宿主细胞接触。

在一些优选的实施方式中,所述向导RNA与Cas13蛋白结合形成复合物,并引导所述复合物与靶RNA接触,以对靶RNA进行基因编辑。

在本公开的第十方面中,提供了一种基因编辑产物,所述基因编辑产物是使用第九方面所述的方法对靶RNA进行基因编辑所得。

在本公开的第十一方面,提供了第一方面所述的Cas13蛋白或第二方面所述的融合蛋白或第三方面所述的CRISPR-Cas系统或第四方面所述的多核苷酸或第五方面所述的载体或第六方面所述的递送系统或第七方面的宿主细胞或第九方面所述的方法在基因编辑中的应用。

在本公开的第十二方面,提供了一种试剂盒,所述试剂盒包含第一方面所述的Cas13蛋白或第二方面所述的融合蛋白或第三方面所述的CRISPR-Cas系统或第四方面所述的多核苷酸或第五方面所述的载体或第六方面所述的递送系统或第七方面的宿主细胞。

在本公开的第十三方面,提供了一种核酸检测方法,所述方法为使用第十二方面所述的试剂盒对待测样本进行核酸检测。

在本公开的第十四方面,提供了第一方面所述的Cas13蛋白或第二方面所述的融合蛋白或第三方面所述的CRISPR-Cas系统或第四方面所述的多核苷酸或第五方面所述的载体或第六方面所述的递送系统或第七方面的宿主细胞或第十二方面所述的试剂盒或第十三方面所述的核酸检测方法在核酸检测中的应用。

在本发明的第十五方面,提供了第一方面所述的Cas13蛋白或第二方面所述的融合蛋白或第三方面所述的CRISPR-Cas系统或第四方面所述的多核苷酸或第五方面所述的载体或第六方面所述的递送系统或第七方面的宿主细胞在制备用于治疗有需要的受试者的病症或疾病的药物中的应用。

本发明的第十六方面,提供了一种在有需要的受试者中治疗病症或疾病的方法,所述方法包括:给予所述受试者一种组合物,其含有本发明第三方面的CRISPR-Cas系统或编码该系统的多核苷酸;其中间隔序列与疾病或病症相关的靶RNA中至少15个核苷酸互补;其中所述Cas13蛋白与向导RNA结合形成复合物,且复合物与靶RNA结合,所述Cas13蛋白对靶RNA进行编辑(例如,切割),实现治疗受试者的病症或疾病的目的。

在一些优选的实施方案中,所述病症或疾病是癌症、传染性疾病或其他疾病。

在一些实施方案中,所述癌症是威尔姆斯肿瘤、尤因肉瘤、神经内分泌肿瘤、成胶质细胞瘤、神经母细胞瘤、黑素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、子宫颈癌、子宫内膜癌、食道癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、神经胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性骨髓性白血病、慢性淋巴细胞性白血病、慢性粒细胞性白血病、霍奇金淋巴瘤、非霍奇金淋巴瘤或膀胱癌。

在一些实施方案中,所述的其他疾病包括神经系统疾病(例如,神经发育障碍性疾病“安格曼(Angelman)综合征”、渐冻症等)、耳科疾病(例如,显性遗传性耳聋等)、肌肉异常(例如,脊髓性肌萎缩)、眼科疾病(例如,先天性黑蒙2型疾病)。

在一些实施方案中,所述方法是体外方法、体内方法或离体方法。

本发明技术方案,具有如下优点:

本发明所提供的Cas13蛋白,包括Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2与已经报道的Cas13蛋白同源性较低,并表现出RNA核酸酶对靶RNA的编辑活性,因此,Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2均在基因编辑中极具应用前景。

本发明涉及的Cas蛋白具有旁切活性,可以用于RNA检测,例如本发明的Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2蛋白显示出非特异性/附带的RNase活性(旁切活性),可以用于检测特定RNA的存在,能够实现高灵敏、便捷的核酸检测,例如,可广泛应用于各种医学、生物、环境样本的现场检测,有着十分广阔的应用前景。

另外,Cas13a_10仅有519个氨基酸,Cas13a_11仅有726个氨基酸,Cas13T_15有543个氨基酸,Cas13T_16仅有845个氨基酸,Cas13Z_2有849个氨基酸,更小的Cas13蛋白有利于基因编辑过程中的包封、包装和递送,例如,仅需要AAV载体即可实现递送。

附图说明

图1示出了CRISPR-Cas系统的基因组基因座结构示意图。

图2示出了与Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5关联的同向重复(DR)序列预测的二级结构,其中,由于Cas13a_10和Cas13a_11的DR序列相同,将两者的DR序列命名为DR-Cas13a_10/11。

图3示出了与Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2关联的同向重复(DR)序列预测的二级结构。

图4示出了Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2与此前已鉴定出的Cas13蛋白的系统树。

图5示出了Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_15、Cas13T_16、Cas13Z_2的保守结构域结构,示出了RXXXXH基序的相对位置。

图6示出了Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9预测的蛋白三维结构。

图7示出了Cas13T_15、Cas13T_16、Cas13 Z_2预测的蛋白三维结构。

图8示出了采用不同结构的向导RNA与Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_5对靶RNA的编辑活性关系(即转染后的人HEK293T细胞的报告基因mCherry表达量敲低情况)。图中,纵坐标为相对平均荧光强度,横坐标为不同的crRNA。

图9示出了采用不同结构的向导RNA与Cas13b_4、Cas13T_9、Cas13T_15对靶RNA的编辑活性关系(即转染后的人HEK293T细胞的报告基因mCherry表达量敲低情况)。图中,纵坐标为相对平均荧光强度,横坐标为不同的crRNA。

图10示出了采用不同结构的向导RNA与Cas13T_16、Cas13Z_2对靶RNA的编辑活性关系(即转染后的人HEK293T细胞的报告基因mCherry表达量敲低情况)。图中,纵坐标为相对平均荧光强度,横坐标为不同的crRNA。

图11示出了不同间隔序列(spacer)与Cas13b_3、Cas13 b_4、Cas13T_9对GFP报告基因的旁切活性关系(即经转染的人HEK293T细胞的GFP敲低效率代表上述Cas蛋白的非特异性核酸酶活性)。图中,纵坐标为相对平均荧光强度,横坐标为不同的crRNA。

图12示出了不同间隔序列(spacer)与Cas13T_15、Cas13T_16对GFP报告基因的旁切活性关系(即经转染的人HEK293T细胞的GFP敲低效率代表上述Cas蛋白的非特异性核酸酶活性)。图中,纵坐标为相对平均荧光强度,横坐标为不同的crRNA。

图13示出了用于构建向导RNA重组质粒的U6-BbSI-PUC57的质粒图谱。

图14示出了Cas13T_9、Cas13Z_2、Cas13T_15、Cas13T_16、Cas13b_3与Cas13d在特定位点的切割活性比较。

图15示出了Cas13T_15对各个内源性基因的mRNA表达的敲低作用。

具体实施方式

本发明的实施方式涉及Cas13蛋白。

Cas13蛋白是一类具有切割单链RNA的能力的蛋白。本发明涉及9种具有全新的Cas13蛋白,包括:

如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ ID NO.5、SEQ IDNO.6、SEQ ID NO.7、SEQ ID NO.8或SEQ ID NO.9中任一项所示的氨基酸序列的蛋白质,以及其功能活性变体,即氨基酸序列与SEQ ID NO.1-9中任一项不完全相同,但是具有其活性或基本相同活性的蛋白质或多肽,例如按照实施例表征的活性计算,活性为SEQ ID NO.1-9中任一项的0.3倍、0.4倍、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1.0倍、1.2倍、1.5倍、1.8倍、2倍等。

本领域技术人员熟知,Cas13蛋白可以出现氨基酸变化,例如取代、缺失或添加,产生的Cas13蛋白能够保持其功能或活性。

所述的“取代”指在氨基酸序列中的某个位置的某个氨基酸残基被其他氨基酸残基替代;其中,“取代”可以是保守氨基酸取代。

“保守修饰”、“保守取代”或“保守置换”是指具有类似特征(例如电荷、侧链大小、疏水性/亲水性、主链构象和刚性等)的其它氨基酸置换蛋白中的氨基酸,使得可频繁进行改变而不改变蛋白的生物学活性。

本领域技术人员知晓,一般而言,多肽的非必需区域中的单个氨基酸置换基本上不改变生物学活性(参见Watson等(1987),Molecular Biology of the Gene,The Benjamin/CummingsPub.Co.,第224页,(第4版))。另外,结构或功能类似的氨基酸的置换不大可能破环生物学活性。示例性保守取代于“示例性氨基酸保守取代”中陈述(见表1)。

表1示例性氨基酸保守取代

本发明的实施方式涉及包含本发明的Cas13蛋白的融合蛋白。本发明的优选实施方式涉及包含本发明的Cas13蛋白以及异源功能结构域的融合蛋白。

在本发明的一些实施方式中,融合蛋白的异源功能结构域包括脱氨酶、报告蛋白、检测标记、定位信号、蛋白质靶向域、DNA结合域、表位标签、转录激活功能域、转录抑制功能域、核酸酶、甲基化活性酶、脱甲基酶、转录释放因子、RNA裂解多肽、核酸连接酶、组蛋白修饰活性因子或核酸结合活性因子中的至少一种。

本发明的Cas13与异源功能结构域融合之后得到的本发明的融合蛋白,可以通过两种或多种蛋白功能活性的结合实现特定的检测、突变、或治疗目的,例如如下所述。

在一些实施方式中,包含本发明Cas13的融合蛋白可借助核定位序列(NLS)、锌指蛋白及KRAB结构域,利用负反馈调节机制提升信噪比。

在一些实施方式中,包含本发明Cas13的融合蛋白可实现特定位点的RNA甲基化和/或实现特定位点RNA去甲基化。

在一些实施方式中,包含本发明Cas13的融合蛋白可靶向致病性tau pre-mRNA,改变可变剪接方式,取得显著的治疗效果。

本发明的实施方式涉及包含本发明的Cas13蛋白的CRISPR-Cas系统。

本发明的CRISPR-Cas系统包含本发明的Cas13蛋白以及向导RNA,或者,包含本发明的融合蛋白以及向导RNA。

在一些实施方式中,本发明的所述向导RNA能够与Cas13蛋白结合形成复合物并引导所述复合物与靶RNA接触。

本发明的所述向导RNA包含间隔序列和同向重复序列;所述间隔序列的大小为15~60个核苷酸,例如20~50个核苷酸、30~40个核苷酸或30个核苷酸;所述同向重复(DR)序列的大小为15~40个核苷酸,例如20~35个核苷酸、25~30个核苷酸或30个核苷酸。

在一些实施方式中,所述的向导RNA经过化学修饰,例如,在一个或多个末端核苷酸处掺入2’-O-甲基、2’-O-甲基3’硫代磷酸酯或2’-O-甲基3’硫代PACE。与未经修饰的向导RNA相比,上述经化学修饰的向导RNA更稳定,活性也会增加。

在一些实施方式中,所述间隔序列与靶RNA之间至少有15个,例如15个、16个、18个、19个、20个、21-30个核苷酸存在互补。

本发明的CRISPR-Cas系统可用于核酸检测。在本发明的一些实施方式中,CRISPR-Cas13系统与crRNA、底物RNA结合形成三元复合体后,Cas13蛋白被激活,此时Cas13蛋白不仅能特异性切割底物RNA,还能切割游离在环境内的任意单链RNA,这个现象被称为非特异性核酸酶活性、附带活性或旁切活性(collateral cleavage)。利用该特性,本发明的系统能够检测RNA,例如在10-15分钟内检测灵敏度达到飞摩尔级别。与传统的核酸检测金标准qPCR相比,本发明的检测速度更快且对设备的依赖性更低。

本发明的CRISPR-Cas系统可用于RNA成像。在本发明的一些实施方式中,对Cas13蛋白进行突变,得到丧失切割酶活性,但保留了结合酶活性的蛋白变体,因此能够靶向目标RNA分子。

本发明的CRISPR-Cas系统可用于转录组调控。在本发明的一些实施方式中,在Cas13蛋白或其丧失切割酶活性,但保留了结合酶活性的蛋白变体上融合各种效应蛋白,能够实现各种针对RNA的调控。例如甲基化调控,对单碱基突变引起的遗传疾病的治疗。

将本发明的Cas13蛋白特定突变体(例如,失去部分或全部的核酸酶活性的突变体)与脱氨酶(例如ADAR2DD等)融合,能够构建出RNA碱基编辑器。

在一些实施方式中,本发明的CRISPR-Cas系统通过靶向过表达的RNA或存在毒性的RNA,或突变RNA(例如像剪接缺陷或截短,其过表达会引起疾病)能够实现的治疗目的。或者,本发明的CRISPR-Cas系统还可以通过靶向导致疾病发生的RNA依赖性功能的反式作用突变序列进行治疗,例如,SNHG5基因的突变与多种癌症(例如,前列腺癌)相关,通过靶向其表达的RNA,可以对相关疾病进行治疗。

本发明的实施方式涉及多核苷酸。

本发明的多核苷酸编码本发明的Cas13蛋白,或者,所述多核苷酸编码本发明的融合蛋白,或者,所述多核苷酸编码本发明的CRISPR-Cas系统。

在一些实施方式中,上述多核苷酸是DNA分子。在另外一些实施方案中,所述多核苷酸是RNA分子(如编码所述Cas13蛋白、其衍生物或其功能片段的mRNA分子)。在一些实施方案中,上述RNA分子(例如mRNA分子)被加帽、聚腺苷酸化,或者被2'-O-甲基类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲基腺苷类似物、2'-氟代类似物、5-甲基胞嘧啶核苷、假尿苷取代,或以上任意组合,包括但不限于2-氨基嘌呤、5-溴代-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷等的修饰。

在一些实施方式中,所述多核苷酸与本发明所公开的核苷酸序列存在至少50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%的核苷酸序列。

在一些实施方式中,所述多核苷酸所编码的氨基酸序列与SEQ ID NO.1-9中任一项所示的氨基酸序列具有至少85%(例如85%、95%、99%)的序列同一性。

本发明的实施方式涉及载体,这些载体能够将本发明所涉及的Cas13蛋白(包括其同源物)和/或向导RNA递送或引入宿主细胞中,在一些具体的细胞(例如原核细胞)中还能够复制这些组分(例如在原核细胞中)。当与适当的调控元件可操作地连接时,载体能够复制。前述的载体包括多种载体,常见的有病毒载体和非病毒载体,一种类型载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒载体、噬菌体载体、腺病毒载体、腺相关病毒载体、痘苗病毒载体、杂合病毒载体、杆状病毒载体、单纯疱疹病毒载体或慢病毒载体)的载体中。病毒载体常包括由用于转染到宿主细胞中的病毒携带的多核苷酸。另外,非病毒载体常见的是质粒,其是可以例如通过标准分子克隆技术插入另外的DNA区段的环状双链DNA环。某些质粒载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被引入的宿主细胞中自主复制。

本发明的载体携带以上描述的多核苷酸,例如编码本发明的Cas13蛋白,或者,编码前述Cas13蛋白的融合蛋白,或者,编码本发明的CRISPR-Cas系统的多核苷酸。

所述的多核苷酸还包括编码如SEQ ID NO.20-27所述的同向重复(DR)序列的核苷酸序列。

在本发明的一些实施方式中,所述载体携带的多核苷酸连接调控元件。

在本发明的一些实施方式中,所述调控元件包括启动子、内部核糖体进入位点(IRES)、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号、转座子、前导序列、多腺苷酸序列或标记基因中的至少一种。

启动子包括组织特异性启动子,其可以引导主要在感兴趣的组织诸如肌肉、神经元、骨骼、皮肤、血液或特定器官(例如肝脏、胰脏)、或特定细胞类型(例如淋巴细胞)中的表达。具体地,启动子可以包含U6启动子、H1启动子、逆转录病毒劳斯氏肉瘤病毒LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、以及EF1α启动子。

增强子元件包括CMV增强子、RSV增强子、SV40增强子等。在设计表达载体时,可能会考虑待转化宿主细胞、预期的表达水平等因素。载体可以引入到宿主细胞中从而产生由在此所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,成簇规律间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。

本发明的实施方式涉及递送系统。本发明的递送系统用于将本发明的蛋白、核酸、系统或载体递送到体内,进行检测和治疗。

在本发明的一些实施方式中,所述递送系统携带本发明的Cas13蛋白、或本发明的融合蛋白、或本发明的CRISPR-Cas系统、或本发明的多核苷酸或本发明的载体。

在本发明的一些实施方式中,所述递送系统的递送载体包括脂质体载体、壳聚糖载体、聚合物载体、纳米颗粒载体、外泌体载体、外来体载体、微泡载体、病毒载体、基因枪或电穿孔装置中的至少一种。

此外,当递送对象为一些细胞(例如植物细胞)时,还会采用诸如细胞穿透肽(CPP)进行递送的方式。例如,在一个具体实施方式中,Cas蛋白和/或至少一种向导RNA与一种或多种CPP偶联,从而有效地将偶联有Cas蛋白和/或向导RNA的CPP运输到植物细胞内(例如原生质体内)。CPP具有少于35个氨基酸的短肽,其衍生自蛋白质或衍生自嵌合序列,能够以非受体依赖性方式跨细胞膜运输生物分子。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸及抗微生物序列的肽以及嵌合或二分肽。CPP能够穿透生物膜,并且因此触发不同生物分子跨细胞膜移动到细胞质中,并能改进它们的细胞内通路,并且因此促进生物分子与靶标的相互作用。

示例性的,CPP包括Tat(为通过HIV 1型进行病毒复制所需的核转录活化蛋白)、穿透素、卡波西(Kaposi)成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列、聚精氨酸肽Arg序列、富含鸟嘌呤分子转运体、甜箭头肽等。

本发明的实施方式涉及宿主细胞,所述宿主细胞携带本发明的Cas13蛋白、本发明的融合蛋白、本发明的CRISPR-Cas系统、本发明的多核苷酸或本发明的载体。

在一些实施方式中,所述的宿主细胞为离体的、体内的或体外的细胞,或细胞系或子代,所述细胞或细胞系或子代包含:所述的Cas13蛋白、融合蛋白、CRISPR-Cas系统、多核苷酸、载体、递送系统。

在一些实施方式中,所述细胞是原核细胞,例如,大肠杆菌。

在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,所述细胞是酵母细胞、植物细胞或哺乳动物细胞(包括人和非人哺乳动物)。在一些实施方式中,所述细胞是是非人哺乳动物细胞,例如非人灵长类动物、牛、羊、猪、犬、猴、兔、啮齿类(如大鼠或小鼠)的细胞。在一些实施方式中,所述细胞是非哺乳动物真核细胞,例如鸟类(如鸡)、鱼类或甲壳动物的细胞。在一些实施方式中,所述细胞是植物细胞,例如单子叶植物或双子叶植物具有的细胞或栽培植物或粮食作物如玉米、高粱、大豆、小麦、燕麦或水稻的细胞。在一些实施方式中,所述细胞是干细胞或干细胞系。在某些情况下,本发明的宿主细胞包含基因或基因组的修饰,该修饰是在其野生型中不存在的修饰。

在一些实施方式中,所述宿主细胞选自下组:大肠杆菌、麦胚细胞,昆虫细胞,SF9、Hela、HEK293、CHO、酵母细胞、或其组合。

本发明的实施方式涉及模型。

在本发明的一些实施方式中,所述模型包含本发明所述的宿主细胞。

本发明的实施方式涉及基因编辑的方法。

在本发明的一些实施方式中,所述方法包括将靶RNA与本发明的Cas13蛋白、本发明的融合蛋白、本发明的CRISPR-Cas系统、本发明的多核苷酸或本发明的载体接触。在本发明的一些实施方式中,所述接触能够通过Cas13蛋白进行编辑。

在本发明的一些实施方式中,所述方法中,向导RNA与Cas13蛋白结合形成复合物,并引导所述复合物与靶RNA接触,以对靶RNA进行基因编辑。

本发明的实施方式涉及基因编辑产物。在本发明的一些实施方式中,所述基因编辑产物是通过本发明所述基因编辑的方法对靶RNA进行基因编辑所得。

因此,本发明的实施方式涉及在基因编辑中的应用。

本发明的实施方式涉及试剂盒。

在本发明的一些实施方式中,所述试剂盒包含本发明的Cas13蛋白、本发明的融合蛋白、本发明的CRISPR-Cas系统、本发明的多核苷酸、本发明的载体、本发明的递送系统或本发明的宿主细胞。在一些实施方式中,试剂盒还包括使用该试剂盒的说明书,例如一种以上语言的说明书。试剂盒还可以包含一种或多种试剂,用于利用上述一种或多种组分的过程中。试剂可在任何合适容器中提供。例如,试剂盒可提供一种或多种反应或储存缓冲液。上述试剂可以在使用前以需要添加一种或多种其他组分的形式(例如,以浓缩或冻干形式)提供;缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及它们的组合。缓冲液可以具有适合的酸碱度(pH值),例如,可以是碱性的。在一些实施方案中,缓冲液的pH为约7-10之间。

本发明的实施方式涉及核酸检测方法。在本发明的一些实施方式中,使用本发明的试剂盒,或其中包含一种获得多种成分,例如Cas13蛋白、融合蛋白、CRISPR-Cas系统、多核苷酸、载体、递送系统或宿主细胞,对待测样本进行核酸检测,从而完成本发明的核酸检测方法。

在一些实施方式中,本发明所述的CRISPR-Cas系统可用于DNA和/或RNA检测。例如,在实施例中所示的,当间隔(spacer)序列为约30个核苷酸,被其向导RNA依赖的特异性RNase活性激活时,本发明的Cas13b_3、Cas13b_4、Cas13T_9、Cas13T_15、Cas13T_16显示出了旁切活性(非特异性切割活性)。因此,本发明所涉及的Cas13蛋白,通过对向导RNA(crRNA)重新编程进行样本核酸检测,实现特定RNA检测。

例如,本发明的CRISPR-Cas系统可以采用SHERLOCK方法(方法可参见例如Gootenberg等,Nucleic acid detection with CRISPR-Cas13a/C2c2,Science,356(6336):438-442(2017))中,将该文献通过援引以其全文并入本文。

本发明的实施方式涉及在核酸检测中的应用,或本发明的实施方式涉及制备病症或疾病的药物中的应用。

在本发明的应用的一些实施方式中,使用本发明的试剂盒,或其中包含一种获得多种成分,例如Cas13蛋白、融合蛋白、CRISPR-Cas系统、多核苷酸、载体、递送系统或宿主细胞,进行上述核酸检测。

除非另有定义,本文使用的所有技术和科学术语均具有本发明所属领域的技术人员通常理解的含义。如本文所用,下述术语具有下述赋予它们的含义,除非另有说明。

“多核苷酸”和“核酸”是指具有任何长度的核苷酸(比如,RNA或DNA)的聚合形式。该术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体或包含嘌呤碱基和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。

“编码特定RNA的DNA序列”是指转录成RNA的DNA核苷酸序列。

“调节元件”或“调控元件”是指转录和翻译调节序列,诸如启动子、增强子、终止子等。

“启动子(又称启动子序列)”是能够结合RNA聚合酶并启动下游(3'方向)编码或非编码序列的转录的DNA调控区。通常来说,包括诱导型启动子在内的各种启动子可用于驱动本发明的各种载体的表达。

“密码子优化”是指核酸序列进行修饰,以使得前述核酸序列在宿主细胞中更好表达,通常来说,是通过将原核酸序列中的至少一个密码子(例如,可以是1个或多个,如10个、20个或更多个)替换为所述宿主细胞基因中更频繁或最频繁使用的密码子,同时保持其表达出的仍然为天然的氨基酸序列。

“靶RNA”可以是任何靶标RNA分子,可以是天然存在的RNA分子,或是工程化RNA分子(例如,可以是mRNA、tRNA、核糖体RNA(rRNA)、microRNA(miRNA)、干扰RNA(siRNA)、核酶、卫星RNA或病毒RNA等)。所述靶RNA可以与病症或疾病(例如传染病或癌症)关联的靶RNA。靶RNA与向导RNA的完全互补性不是必需的,只要存在足够互补性以引起杂交并促进CRISPR-Cas复合物形成即可。

“天然存在的(也称为未修饰的、未经修饰的、野生型的(wt))”是指存在于自然界中的核酸、多肽、细胞或生物体。例如,存在于生物体中的可从自然界中的来源分离的多肽或多核苷酸序列是天然存在的。

“融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基末端(N-末端)部分或羧基末端(C-末端)蛋白,从而分别形成氨基末端融合蛋白或羧基末端融合蛋白。

“CRISPR-Cas系统”(又称为“CRISPR系统”),其通常包含与CRISPR相关(“Cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述Cas基因活性的转录产物或其他元件。在一些实施例中,CRISPR系统的组分可以包含编码系统的一种或多种组分的核酸(例如,载体)、蛋白质形式的组分或其组合。

“Cas蛋白”是指CRISPR相关蛋白(Cas)(又称为“CRISPR相关蛋白”、“CRISPR效应子”、“效应子”、“Cas蛋白”、“Cas酶”或“CRISPR酶”)是指执行酶活性和/或结合由RNA向导指定的核酸上的靶位点的蛋白。在一些实施方式中,Cas蛋白具有内切核酸酶活性、切口酶活性、核酸外切酶活性、转座酶活性和/或切除活性;在另外一些实施例中,所述Cas蛋白可能是核酸酶失活的。

“向导RNA(又称为指导RNA、gRNA或crRNA)”是指有利于将本发明的Cas13蛋白靶向至靶核酸(诸如DNA和/或RNA)的任何RNA分子。

在CRISPR-Cas系统中,向导RNA与其相应的靶核酸之间的互补程度可以不是100%,例如是约50%、55%、60%、75%、80%、85%、90%、95%、97.5%、99%。为减少脱靶相互作用,例如为了减少向导RNA与具有低互补性的靶核酸之间的相互作用,可以在CRISPR-Cas系统中引入突变,从而使CRISPR-Cas系统能够区分具有大于80%、85%、90%、95%、99%互补性的靶核酸和脱靶序列。在一些具体的实施方式中,所述的向导RNA与对应的靶核酸之间的杂交/互补程度是从80%至95%(例如,存在约83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的互补)。因此,在一些实施方式中,向导RNA与其相应的靶序列之间的互补程度大于93%、93.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或99.9%。在一些实施例中,互补程度是100%。

在本领域已知,在有足够的互补性发挥作用的基础上,不需要完全的互补性,因此,在需要的情况下,可以通过引入错配(例如,间隔(spacer)序列与靶核酸之间的一个或多个错配,诸如1或2个核苷酸的错配(包括沿着间隔序列/靶标序列的错配的位置))来实现对切割效率的调节。如果错配(例如,双错配)位于越靠近中心(即,不在3'或5'端处)的位置,切割效率受到的影响越大。因此,通过选择沿着间隔(spacer)序列的错配位置,可以调节切割效率。例如,如果期望靶标的小于100%的切割率(例如,在细胞群体中),则间隔序列中可以引入间隔序列与靶序列之间的1或2个错配。

“载体”是指用于将核酸转移、递送或引入宿主细胞内的多核苷酸组合物。适合的载体包括质粒载体、噬菌体载体、病毒载体(例如,逆转录病毒载体、腺相关病毒载体、单纯疱疹病毒载体、AAV载体、慢病毒载体、杆状病毒载体)等。

“递送系统”,其包含递送载体,所述递送载体包括一种或多种脂质体、纳米颗粒、外泌体、微泡、病毒载体或基因枪。

在一些实施方式中,可以通过例如以下方式将载体(例如,病毒载体或非病毒载体,例如慢病毒载体或质粒)递送至目的组织:肌肉内注射、静脉内施用、经皮施用、鼻内施用、口服施用或粘膜施用。上述递送可以是经由单剂量或者多剂量进行的。本领域技术人员应理解的是,本文有待递送的实际剂量可以在很大程度上根据多种因素而变化,该多种因素包括但不限于载体选择、靶细胞、生物体、组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用方式和所寻求的转化/修饰的类型。

“功能片段”是指蛋白或多肽序列包括相比蛋白或多肽的原始序列更少的氨基酸,但剩余的氨基酸序列相对于原始参考序列的功能活性,仍存在一定比例(如10%、20%、30%、40%、50%或60-99%、100%)的功能活性(例如,可通过取代、插入、缺失和/或添加一个或多个氨基酸来修饰蛋白或多肽,同时保留一定比例的酶活性)。

“同一性”是指两个多肽或两个核酸之间匹配的序列。当两个进行比较的序列中的位置都被相同的碱基或氨基酸单体亚单元占据(例如,如果两个DNA分子的每一个中的位置都被腺嘌呤占据,或两个多肽的每一个中的位置都被赖氨酸占据)时,各个分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置的数目除以进行比较的位置的数目再乘以100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。

“杂交”或“互补的”或“基本上互补的”是指核酸(例如RNA、DNA)包含这样的核苷酸序列,所述核苷酸序列使所述核酸能够在适当的体外和/或体内温度和溶液离子强度条件下,与另一核酸以序列特异性、反向平行方式(即,核酸特异性结合互补核酸)非共价结合(即,形成Watson-Crick碱基对和/或G/U碱基对)、“退火”或“杂交”。杂交需要两个核酸含有互补序列,但是碱基之间的错配是可能的。通常,可杂交核酸的长度为8个核苷酸或更多个(例如,10个核苷酸或更多个、12个核苷酸或更多个、15个核苷酸或更多个、20个核苷酸或更多个、22个核苷酸或更多个、25个核苷酸或更多个或30个核苷酸或更多个)。

“同向重复(DR)序列(又称为DR序列)”是指CRISPR基因座中的DNA编码序列,或指向导RNA中由其编码的RNA,当描述为RNA水平时,DNA编码序列中的每个T应理解为代表一个U。

同向重复序列包含与SEQ ID NO.20-27中任一个中列出的核苷酸序列至少80%(例如,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)相同的核苷酸序列。

“宿主细胞”包括体外的、离体的或体内的细胞或细胞系或它们的子代,所述细胞或细胞系或它们的子代包含:本发明所述的Cas13蛋白、融合蛋白、CRISPR-Cas组合物、重组载体、递送载体。

在一些实施方式中,本发明所提供的CRISPR-Cas系统可以用于原核细胞或真核细胞。示例性的,原核细胞包括大肠杆菌。真核细胞,包括但不限于植物细胞、真菌细胞(例如,酵母细胞,示例性的,如毕氏酵母、克鲁维酵母、乳酸克鲁维酵母等)、哺乳动物细胞、爬行动物细胞、昆虫细胞、鸟类细胞、鱼细胞、寄生虫细胞、节肢动物细胞、无脊椎动物细胞、脊椎动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类细胞或人细胞。在一些实施方式中,真核细胞在体外培养物中。在一些实施方式中,真核细胞是体内的。在一些实施例中,真核细胞是离体(体外)的。

提供下述实施例是为了更好地进一步理解本发明,并不局限于所述最佳实施方式,不对本发明的内容和保护范围构成限制,任何人在本发明的启示下或是将本发明与其他现有技术的特征进行组合而得出的任何与本发明相同或相近似的产品,均落在本发明的保护范围之内。

下述实施例中未注明具体实验步骤或条件者,按照本领域内的文献所描述的常规实验步骤的操作或条件即可进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。

实施例1新型Cas13蛋白的鉴定

发明人通过宏基因组进行分析、去冗余(去除相同的蛋白序列)、蛋白质聚类分析,鉴定得到了9个新的Cas13蛋白,通过分析发现它们属于四个Cas13蛋白家族:Cas13a、Cas13b、Cas13T、Cas13Z家族(其中,Cas13T、Cas13Z家族不属于此前已鉴定出的Cas13蛋白均不同,属于全新的Cas13家族):包括Cas13a_10(SEQ ID NO:1)、Cas13a_11(SEQ ID NO:2)、Cas13b_3(SEQ ID NO:3)、Cas13b_4(SEQ ID NO:4)、Cas13b_5(SEQ ID NO:5)、Cas13T_9(SEQ ID NO:6)、Cas13T_15(SEQ ID NO:7)、Cas13T_16(SEQ ID NO:8)、Cas13Z_2(SEQ ID NO:9),通过分析发现上述四个Cas13家族的基因组基因座结构如图1所示,该基因座中各个组成部分并非按照比例,如图中所示,标示有“Cas12a/b/T/Z”的一头尖的条形部分表示Cas编码序列,矩形表示DR序列,菱形表示间隔序列。经对比发现,这9个Cas13蛋白与此前已被鉴定出的Cas13蛋白相似度较低。

通过序列分析,找出与上述Cas13蛋白相关联的同向重复(DR)序列,编码所述同向重复(DR)序列的DNA序列见表2。

表2与不同Cas13蛋白关联的同向重复(DR)序列的编码序列

利用RNA二级结构预测软件RNAfold对Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2关联的同向重复(DR)序列的二级结构进行分析,结构分析结果见图2~图3。由图2-图3可以看出,所有DR序列具有相对保守的二级结构。

Cas13a家族的两个蛋白Cas13a_10、Cas13a_11的DR序列是完全相同的,从其二级结构可以看出,其形成了由具有3个碱基对(5’-GCA-3’及其互补碱基)组成的茎部,接着形成两个较小的突起,紧接着又是由5个碱基对(5’-CGCCC-3’及其互补碱基)组成的茎部,末端则是由7个碱基形成的环状结构(5’-UUCACUU-3’)。

Cas13b家族的三个蛋白中,Cas13b_3、Cas13b_4的DR序列的二级结构非常相似,其均形成了由5个碱基对(5’-GUUGU-3’及其互补碱基)组成的茎部,紧接着是一个突起结构(该突起结构的碱基种类及碱基数量存在不同,对于Cas13b_3来说,关联的DR序列该位置形成的突起结构由3+3个碱基组成;而Cas13b_4来说,其关联的DR序列在该位置形成的突起由4+4个碱基组成),再接下来是一个茎部结构(该茎部结构的碱基种类及碱基数量存在不同,对于Cas13b_3来说,关联的DR序列该位置形成的茎部结构由5’-UGCCUUG-3’及其互补碱基组成;而Cas13b_4来说,其关联的DR序列在该位置形成的茎部由5’-GCCCUUG-3’及互补碱基组成),紧接着是一个环状结构(该环状结构的碱基种类及碱基数量存在不同,对于Cas13b_3来说,关联的DR序列该位置形成的突起结构由6个碱基组成;而Cas13b_4来说,其关联的DR序列在该位置形成的突起由4个碱基组成);而Cas13b_5关联的DR序列的二级结构与Cas13b_3、Cas13b_4差异明显;由图2可以看出,其存在3个分别包括5个碱基对、3个碱基对、6个碱基对组成的茎部结构,在第1和2茎部之间、第2和3茎部之间存在突起结构,在末端也存在由6个碱基构成的环状结构。

在Cas13T家族中,Cas13T_9、Cas13T_15、Cas13T_16所关联的DR序列二级结构相似,包含由5个碱基对组成的茎部结构(Cas13T_9和Cas13T_16的该部分结构完全相同,均由5’-GUUGU-3’及其互补碱基组成;Cas13T_15的该茎部结构组成碱基对的碱基种类有所不同),接着是由多个碱基组成的突起结构(其中,Cas13T_9、Cas13T_15关联的DR二级结构的该突起部分由5+5个碱基构成,而Cas13T_16所关联的DR二级结构的该突起结构由3+3个碱基构成,碱基种类也有所不同),紧接着又是一个茎部结构(其中,Cas13T_9、Cas13T_15关联的DR二级结构的该茎部结构完全相同,均由4个碱基对5’-CCUU-3’及其互补碱基组成,Cas13T_16关联的DR二级结构的该茎部结构则由7个碱基对5’-UGUCUUU-3’及其互补碱基组成),末端均是一个环状结构(Cas13T_9、Cas13T_15关联的DR二级结构的该环状结构由8个碱基构成,存在一个碱基的不同,其余碱基均相同;而Cas13T_16关联的DR二级结构的该环状结构则由5个碱基组成,且碱基种类与Cas13T_9、Cas13T_15存在明显差异)。

从Cas13Z_2关联的DR序列二级结构可以看出,其包括一个由5’-GC-3’及其互补碱基组成的茎部结构,接着是一个小的突起结构,之后是一个由5’-GU-3’及其互补碱基组成的茎部结构,紧接着是5+5个碱基构成的突起结构,之后是一个5’-CCUU-3’及其互补碱基构成的茎部结构,末端是一个由8个碱基构成的环状结构。

利用序列对比软件将上述Cas13蛋白与先前鉴定的Cas13家族蛋白进行多序列比对,并构建进化树,构建结果见图4。由图4可以看出,Cas13a_10、Cas13a_11位于系统树相对接近的两个分支上,Cas13b_3、Cas13b_4、Cas13b_5在系统树上比较接近,Cas13b_3、Cas13b_5两者更为接近。Cas13T_9、Cas13T_15、Cas13T_16三者在系统树的关系较近,Cas13Z_2与其他Cas13蛋白在系统树的关系均比较远。

发明人还利用已公开Cas蛋白数据库对上述各个Cas13进行了功能注释以及多序列对比,分析出这9个Cas13蛋白序列保守区域,鉴定出这9个Cas13蛋白的保守RXXXXH基序位置,鉴定结果见图5。

由图5发现,Cas13a_10、Cas13b_5、Cas13T_15、Cas13T_16均仅包含一个RXXXXH基序,其中,Cas13a_10、Cas13T_15、Cas13T_16的RXXXXH基序均更接近C端,而Cas13b_5的RXXXXH基序更接近N端。Cas13a_11、Cas13b_3、Cas13b_4、Cas13Z_2均包含两个RXXXXH基序,Cas13a_11的两个RXXXXH基序更接近C端,Cas13b_3、Cas13b_4、Cas13Z_2的两个RXXXXH基序更接近两端(N端和C端)。

具体地,Cas13a_10的一个RXXXXH基序位于第490-495位,Cas13a_11的两个RXXXXH基序分别位于第453-458位和第581-586位,Cas13b_3的两个RXXXXH基序分别位于第125-130位和第1079-1084位,Cas13b_4的两个RXXXXH基序分别位于第148-153位和第1176-1181位。Cas13b_5的一个RXXXXH基序位于第128-133位。Cas13T_15的一个RXXXXH基序位于第480-486位。Cas13T_16的一个RXXXXH基序位于第800-805位。Cas13Z_2的两个RXXXXH基序分别位于第143-148位和第813-818位。在Cas13T_9蛋白未发现明显的RXXXXH基序。RXXXXH基序是Cas13蛋白的可能催化活性位点,在这一结构域上进行突变可能会产生Cas13蛋白的核酸酶活性失活蛋白,同时基本上保持与向导RNA、与靶RNA结合的能力。

申请人还利用蛋白结构预测软件对上述Cas13蛋白进行了三维结构预测,具体可以参见图6-图7,Cas13b_3、Cas13b_4的两个RXXXXH基序在蛋白序列上非常靠近N端和C端,但在三维结构中非常相近(参见图6)。Cas13Z_2的两个RXXXXH基序相对靠近N端和C端,但在三维结构上看起来则相对较近(参见图7)。

实施例2Cas13蛋白的活性验证

1.为验证Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2这9个Cas13蛋白是否具有RNA核酸酶活性,本实施例提供了这9个Cas13蛋白的切割活性验证实验,具体实验过程如下:

(1)将经密码子优化(以更适合在人类细胞中表达)的编码Cas13a_10、Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_15、Cas13T_16、Cas13Z_2的多核苷酸(SEQ ID NO.10-18)分别克隆到带有编码绿色荧光蛋白(GFP)基因(SEQ ID NO.28)的p23_puro_NPLS_Cas13_msfGFP_NLS_3xFlag_C质粒中(p23_puro_NPLS_Cas13_msfGFP_NLS_3xFlag_C质粒的核苷酸序列如SEQID NO.29所示,酶切位点为NheI:XbaI),得到Cas13蛋白重组质粒(Cas13蛋白重组质粒中,Cas13蛋白的多核苷酸替换p23_puro_NPLS_Cas13_msfGFP_NLS_3xFlag_C质粒中第3472~6369位置的序列)。

(2)取mCherry报告基因重组质粒(mCherry报告基因重组质粒的核苷酸序列如SEQ IDNO.30所示)。

(3)spacer_1~spacer_10(SEQ ID NO.33-42)为靶向mCherry(SEQ ID NO.31)不同位置的间隔序列,NT-spacer(SEQ ID NO.43)是不靶向mCherry的间隔序列,具体序列设计参见表3。

表3靶向mCherry以及不靶向mCherry的间隔序列

理论上CRISPR/Cas13系统中向导RNA前体在成熟过程中可以产生两种结构的向导RNA(即crRNA):同向重复(DR)序列+间隔序列(即5’DR,DR序列连接在间隔(spacer)序列的5’端)和间隔序列+同向重复(DR)序列(即3’DR,DR序列连接在间隔(spacer)序列的3’端)。由于Cas13a_10、Cas13a_11的DR序列完全相同,故两者的DR序列命名为DR-Cas13a_10/11,针对Cas13a_10,发明人构建了3’DR结构的向导RNA,在图8中,该向导RNA命名为Cas13a_10-crRNA_1;针对Cas13a_11,发明人构建了5’DR结构的向导RNA,图8中,命名为Cas13a_11-crRNA_1。类似地,将DR-Cas13b_3、DR-Cas13b_4、DR-Cas13b_5、DR-Cas13T_9、DR-Cas13T_15、DR-Cas13T_16、DR-Cas13Z_2分别连接在spacer_1~spacer_10的3’端或5’端,构建出靶向报告基因mCherry的向导RNA;并将前述各个Cas蛋白的DR序列分别连接在NT-spacer的3’端或5’端,构建出不靶向报告基因mCherry的向导RNA向导RNA。

(3)将靶向报告基因mCherry的向导RNA和不靶向报告基因mCherry的向导RNA的编码序列分别克隆到酶切(酶切位点为BbSI)后的U6-BbSI-PUC57质粒(购自上海生工公司,U6-BbSI-PUC57质粒的质粒图谱见图13,质粒核苷酸序列如SEQ ID NO.32所示)中,得到向导RNA重组质粒;其中,靶向mCherry的向导RNA和不靶向mCherry的向导RNA均由同向重复(DR)序列和间隔(spacer)序列构成。对于9个Cas13蛋白所采用的靶向mCherry的向导RNA和不靶向mCherry的向导RNA结构见表4。

表4向导RNA

(4)将人HEK293T细胞(购自ATCC)以1×10

(5)培养48h后,通过显微镜观察发现,实验组经转染人HEK293T细胞与阴性对照组细胞、空白对照组细胞生长和形态相似。在荧光显微镜下对经转染人HEK293T细胞进行观察,最后通过流式细胞仪进行检测和定量分析,分析结果见图8-图10。通过流式细胞术(flowcytometry,FCM)分析发现,阴性对照组中,使用不靶向报告基因mCherry的向导RNA未能敲低mCherry荧光信号表达;与阴性对照组相比,实验组经转染人HEK293T细胞的mCherry荧光信号强度显著降低,这说明9个Cas13蛋白均能够利用靶向mCherry的向导RNA有效敲低mCherry的mRNA水平,进而降低mCherry蛋白的表达量。在采用3’DR结构的向导RNA(Cas13a_10-crRNA9)时,Cas13a_10对mCherry表达的敲低效果显著,荧光信号强度显著降低达80%左右(采用crRNA_9时)。在采用特定结构的向导RNA时,Cas13T_15、Cas13T_16、Cas13Z_2对mCherry表达均有较好敲低效果,荧光信号强度大幅降低。Cas13a_11、Cas13b_3、Cas13b_4、Cas13b_5、Cas13T_9、Cas13T_16对mCherry表达有敲低效果,明显降低了荧光信号强度。通过比较,发现采用靶向mCherry质粒不同位置的间隔序列(crRNA)时,荧光信号强度降低的程度不同,这说明靶向靶RNA不同位置的间隔序列对Cas13蛋白的编辑效果存在影响,例如,Cas13b_4对于两种结构(3’DR、5’DR)的向导RNA存在明显偏好性,其中,Cas13b_4在使用3’DR的crRNA引导时,部分间隔序列(spacer)对应的mCherry的敲低效果相对更好。

2.发明人还将Cas13d与Cas13b_3、Cas13T_15、Cas13T_16、Cas13b_4、Cas13T_9针对特定crRNA做了对比实验,具体如下:

(1)构建Cas13d重组表达质粒

将编码Cas13d的核苷酸序列进行哺乳动物密码优化,核苷酸序列如SEQ ID NO.56所示,采用与实施例2步骤1(1)相同的方式,构建出Cas13d重组质粒(Cas13d蛋白重组质粒中,编码Cas13d蛋白的多核苷酸替换p23_puro_NPLS_Cas13_msfGFP_NLS_3xFlag_C质粒中第3472~6369位置的序列)。

(2)取mCherry报告基因重组质粒(mCherry报告基因重组质粒的核苷酸序列如SEQ IDNO.30所示)。

(3)设计用于对比的向导RNA重组质粒,将本领域已知具有Cas13活性的Cas13d作为比较对象,验证部分本发明所涉及的Cas13蛋白的切割活性,Cas13d所用到的DR序列如SEQ ID NO.57所示。根据需要设计了两组实验,其中,

第一组实验采用的间隔序列为spacer_1(SEQ ID NO.33),Cas13d所用的向导RNA(crRNA)为Cas13d-DR-spacer_1(SEQ ID NO.58),Cas13T_9和Cas13Z_2所用的crRNA分别为DR-Cas13T_9-spacer_1(SEQ ID NO.59)、DR-Cas13Z_2-spacer_1(SEQ ID NO.60);

第二组实验采用的间隔序列为spacer_6(SEQ ID NO.38),Cas13d所用的crRNA为Cas13d-DR-spacer_6(SEQ ID NO.61),Cas13b_3、Cas13T_15、Cas13T_16所用的crRNA分别为DR-Cas13b_3-spacer_6(SEQ ID NO.62)、DR-Cas13T_15-spacer_6(SEQ ID NO.63)、DR-Cas13T_16-spacer_6(SEQ ID NO.19)。

另外,针对第一、二组中的每一个Cas13蛋白,分别设置非靶向对照组,所用间隔序列均为NT-spacer(SEQ ID NO:43),DR序列均为每个Cas13蛋白所对应的DR序列,crRNA序列结构均为DR-NT-spacer(5’DR)。

采用与实施例2步骤1中的方式,分别将每一组实验所涉及的Cas13蛋白及对应的crRNA分别克隆构建到p23_puro_NPLS_Cas13_msfGFP_NLS_3xFlag_C质粒和U6-BbSI-PUC57质粒上,之后采用同样的方式分别与mCherry报告基因重组质粒转染至人HEK293T细胞(购自ATCC)中进行切割活性检测,通过流式细胞仪检测分析发现,在一个位点(spacer_1靶向位置),Cas13Z_2的切割活性高于Cas13d,Cas13T_9的切割活性与Cas13d相当;在另一个位点(spacer_6靶向序列位置)上,Cas13T_15、Cas13T_16的切割效率高于Cas13d,Cas13b_3的切割活性略低于Cas13d(参见图14)。

实施例3Cas13蛋白的旁切活性(即非特异性切割活性)验证

为了验证上述Cas13蛋白的旁切活性,申请人还对部分Cas13蛋白的旁切活性进行了验证实验,实验过程如下:

(1)采用与实施例2中相同的靶向mCherry的向导RNA,并重复实施例2的实验,将带有编码Cas13b_3、Cas13b_4、Cas13T_9、Cas13T_15、Cas13T_16的核苷酸序列的Cas13蛋白重组质粒分别与mCherry报告基因重组质粒和向导RNA重组质粒(包含不靶向报告基因mCherry的向导RNA)共转染至人HEK293T细胞。

(2)利用流式细胞术分析转染48小时后细胞中GFP报告基因的敲低效率,GFP的敲低效率代表了Cas13的非特异性切割活性,实验结果见图11-图12。

从图11-图12可以看出,Cas13b_3、Cas13b_4、Cas13T_9、Cas13T_15、Cas13T_16均存在非特异性切割活性,不同的间隔(spacer)序列所对应的向导RNA对旁切活性的高低也存在影响。例如,图11中,采用向导RNA中crRNA_1、crRNA_3、crRNA_8、crRNA_10时,Cas13T_9具有相对其他向导RNA更高的非特异性切割活性;而对于Cas13b_4来说,采用3’DR和5’DR结构的crRNA,旁切活性的高低也存在差异;如图12所示,在采用crRNA_4时,Cas13T_15具有更高的旁切活性,上述Cas13蛋白的旁切活性能够用于DNA和/或RNA分子检测。

实施例4真核细胞内源性基因切割活性验证

申请人为验证本发明所述Cas13蛋白的真核细胞内源性基因的切割活性,选择了多个真核细胞的内源性基因:ANXA4、B4GALNT1、EZH2、PPIB和KRAS作为靶向基因,并结合qPCR相对定量方法进行确定。

申请人选择了Cas13T_15作为验证对象,设计了靶向内源性基因ANXA4、B4GALNT1、EZH2、PPIB和KRAS mRNA的间隔序列(spacer),具体如下表5所示:

表5人内源性基因ANXA4、B4GALNT1、EZH2、PPIB和KRAS mRNA的间隔序列(spacer)

将DR-Cas13T_15分别连接到表5中的各个间隔序列(spacer)的5’端(即采用5’DR形式的向导RNA)得到各个靶向内源性基因mRNA的向导RNA,并设置不靶向任何内源性基因RNA的NT向导RNA作为对照。将各个向导RNA的编码序列采用与实施例2相同的方式克隆至U6-BbSI-PUC57质粒上,得到各个靶向不同内源性基因mRNA的向导RNA重组质粒。

将实施例1中得到的Cas13T_15重组质粒及上述各个靶向不同内源性基因mRNA的向导RNA重组质粒、NT对照向导RNA分别转染(转染方式与实施例2相同)至HEK293细胞(购自ATCC)中得到实验组和对照组,然后用RT-PCR确定内源性基因mRNA的表达,进而来评估敲低效率,与Cas13T_15重组质粒/NT对照向导RNA重组质粒转染的对照细胞相比较。在37℃、5%(v/v)CO

定量分析结果如图15所示,其结果显示,Cas13T_15对各个内源性基因的mRNA表达均有不同程度的敲低。采用特定向导RNA时,对ANXA4 mRNA、KRAS mRNA和B4GALNT1mRNA表达有超过60%的敲低效果,而EZH2、PPIB的mRNA表达也具有显著的mRNA敲低作用,这也证明了Cas13T_15能够在真核细胞中发挥靶向切割作用。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

相关技术
  • Cas13蛋白、CRISPR-Cas系统及其应用
  • 一种调控1类CRISPR-Cas系统活性的AcrIE10蛋白及其编码核酸和应用
技术分类

06120116620789