掌桥专利:专业的专利平台
掌桥专利
首页

调控里氏木霉蛋白表达效率的因子、调控方法及应用

文献发布时间:2023-06-19 11:50:46



技术领域

本发明属于生物技术领域,更具体地,本发明涉及调控里氏木霉蛋白表达效率的因子、调控方法及应用。

背景技术

里氏木霉(Trichoderma reesei)是纤维素酶工业中利用最多的菌株。里氏木霉菌株Qm6a为各个高产纤维素酶菌株的出发株,为了获取高产纤维素酶的新菌株,Qm6a经过两轮直线加速器的诱变和筛选得到了更高效的产纤维素酶突变菌株Qm9414,但是仍然受到碳代谢阻遏,产酶状况会随着发酵时间增加,葡萄糖浓度升高,纤维素酶的合成逐渐受到抑制。为了获得更高的纤维素酶产量,对Qm6a重新进行育种,通过三轮诱变和筛选得到了抗碳代谢阻遏的高产菌株Rut-C30:第一轮通过紫外诱变和抗代谢阻遏筛选获得了菌株M7;第二轮对M7通过N-硝基胍诱变得到突变株NG14,相比Qm9414,NG14胞外蛋白产量和滤纸酶活分别提高了1倍和4倍;第三轮在NG14的基础上经过紫外诱变和抗代谢阻遏筛选的得到了更高效的产纤维素酶菌株Rut-C30。此外,在NG14的基础上紫外诱变获取了另一突变株RL-P37,另一工业上广泛应用的纤维素酶高产菌株CL-847是由Qm9414诱变而来。由于其高产纤维素酶的能力,在工业上被广泛用于纺织、造纸、制浆及生物能源等领域。该菌目前最高发酵水平可达100g/L的蛋白产量,具有很强的蛋白分泌能力,同时对人畜安全,已经被开发成表达同源蛋白和异源蛋白的良好真菌宿主。在纤维素酶工业应用中,里氏木霉的产酶和蛋白分泌能力的进一步提高有助于纤维素酶应用市场的进一步打开。

虽然传统的诱变育种可以获得不少优良的工业菌株,但Kubicek等认为,从1978年到1991年单纯通过传统诱变方法获得里氏木霉的突变株,在产酶能力上已经没有大的改观。近年来,随着分子生物学的进一步发展,人们已经逐渐从常规的诱变育种和改善发酵条件等传统生物学转向利用比较基因组学、蛋白质组学、转录组学和代谢组学等系统生物学,以此来分析了解一些高产菌株重要突变基因的功能和相关分子机制,并利用这些机制进行进一步遗传改造以获取更符合工业需求的生产菌株。然而,里氏木霉产纤维素酶的真正诱导机制还并未发现。此外里氏木霉突变株强大蛋白分泌能力也未被解析。只有弄清楚这些机理,才能从根源上改造里氏木霉,使其具有更高的纤维素酶产量以及蛋白分泌能力。

因此,有必要对里氏木霉进行更加深入的改造,提高其产酶能力和蛋白分泌能力,降低纤维素酶的工业生产成本,进而获得有用的工业菌株。

发明内容

本发明的目的在于提供调控里氏木霉蛋白表达效率的因子、调控方法及应用。

在本发明的第一方面,提供一种提高里氏木霉的蛋白表达效率的方法,包括:下调里氏木霉基因组中的靶基因,所述靶基因选自:编码ORF4蛋白的基因,编码β-葡萄糖苷酶的基因。

在一个优选例中,所述的蛋白是里氏木霉内源蛋白或异源蛋白。

在另一优选例中,所述的内源蛋白包括(但不限于):纤维素酶,半纤维素酶,β葡萄糖苷酶,糖类透过酶,蛋白合成分泌途径相关酶。

在另一优选例中,所述的异源蛋白包括非纤维素酶分泌蛋白;较佳地,包括(但不限于):异源葡萄糖苷酶,异源阿魏酸酯酶FEA,结构蛋白(如蜘蛛丝蛋白、蚕丝蛋白等),功能蛋白(如免疫调节蛋白、血清白蛋白等)。

在另一优选例中,所述的异源蛋白的编码基因插入(替换)到里氏木霉基因组中;或,所述的异源蛋白的编码基因由表达载体引入到里氏木霉细胞内。

在另一优选例中,所述的异源蛋白的编码基因插入(替换)到里氏木霉基因组中cbh1位置。

在另一优选例中,所述的里氏木霉菌株的出发菌株为Rut-C30,Qm9414,RC30-8。

在另一优选例中,下调里氏木霉基因组中的靶基因包括:抑制、敲除、沉默或突变所述的靶基因,或抑制所述的靶基因编码的蛋白的表达或活性;或将下调所述靶基因的下调剂转入里氏木霉中(较佳地包括抑制或敲除所述的靶基因或抑制所述的靶基因编码的蛋白的表达或活性的作用的试剂);或调节所述靶基因的上游信号通路或上游基因,下调所述靶基因。

在另一优选例中,通过采用CRISPR/Cas技术进行基因编辑以敲除所述的靶基因;或通过同源重组技术,对靶基因所在区段进行缺失或插入的操作以敲除所述的靶基因;或通过干扰分子干扰靶基因的表达;所述的干扰分子是以所述靶基因或其转录本为抑制或沉默靶标的dsRNA、反义核酸、小干扰RNA、微小RNA,或能表达或形成所述dsRNA、反义核酸、小干扰RNA、微小RNA的构建物。

在另一优选例中,所述的ORF4蛋白具有SEQ ID NO:2所示的氨基酸序列,还包括其同源物(同源序列)。

在另一优选例中,所述β-葡萄糖苷酶具有SEQ ID NO:15所示的氨基酸序列,还包括其同源物(同源序列)。

在另一优选例中,通过引入阿魏酸酯酶FEA表达框同源替换编码ORF4蛋白的基因,从而敲除该编码ORF4蛋白的基因,同时引入阿魏酸酯酶FEA表达框。

在另一优选例中,所述编码ORF4蛋白的基因具有SEQ ID NO:1所示的核苷酸序列,基于该序列,靶向于其第257-277位,使该靶位置发生剪切,破坏基因功能。

在另一优选例中,所述编码β-葡萄糖苷酶的基因具有SEQ ID NO:3所示的核苷酸序列,基于该序列,靶向于其第2607-2626位,使该靶位置发生剪切,破坏基因功能。

在本发明的另一方面,提供靶基因的调节剂的用途,用于提高里氏木霉的蛋白表达效率;所述调节剂包括下调剂;所述下调剂为靶向于ORF4蛋白或其编码基因或靶向于内源葡萄糖苷酶或其编码基因的下调剂。

在一个优选例中,所述的下调剂包括:靶向且敲除靶基因的CRISPR/Cas基因编辑试剂(如SEQ ID NO:14所示的sgRNA);或通过同源重组对靶基因进行缺失或插入操作、从而敲除所述的靶基因的试剂(如针对靶基因的同源臂);或干扰分子,其包括以所述靶基因或其转录本为抑制或沉默靶标的dsRNA、反义核酸、小干扰RNA、微小RNA,或能表达或形成所述dsRNA、反义核酸、小干扰RNA、微小RNA的构建物。

在本发明的另一方面,提供一种重组的里氏木霉菌株或其孢子、菌丝体、原生质体,其基因组中的靶基因被下调;其中,下调的靶基因选自:编码ORF4蛋白的基因,编码内源β-葡萄糖苷酶的基因。

在一个优选例中,所述的里氏木霉菌株或其孢子、菌丝体、原生质体中,所述靶基因被抑制、敲除、沉默或突变,或该靶基因编码的蛋白的表达或活性被抑制;或所述里氏木霉菌株或其孢子、菌丝体、原生质体中,转入了所述靶基因的下调剂;较佳地,所述靶基因的下调剂包括:抑制或敲除所述的靶基因,或抑制所述的靶基因编码的蛋白的表达或活性的作用的试剂。

在另一优选例中,所述的里氏木霉菌株或其孢子、菌丝体、原生质体,其中还包括异源蛋白的编码基因;较佳地,所述异源蛋白的编码基因由表达载体引入到里氏木霉细胞内,或插入(同源替换)到里氏木霉基因组中,如(但不限于)插入到的cbh1位置。

在本发明的另一方面,提供前面任一所述的里氏木霉菌株或其孢子、菌丝体、原生质体的用途,用于表达里氏木霉内源蛋白或异源蛋白。

在本发明的另一方面,提供一种重组表达异源蛋白方法,包括:将异源蛋白的编码基因插入到任一所述的重组的里氏木霉菌株或其孢子、菌丝体、原生质体的基因组中,培养该里氏木霉菌株或其孢子、菌丝体、原生质体,从而表达异源蛋白;较佳地,所述的异源蛋白的编码基因插入(同源替换)到里氏木霉或其孢子、菌丝体、原生质体基因组中的cbh1位置。

在本发明的另一方面,提供一种重组表达里氏木霉内源蛋白方法,包括:培养所述的重组的里氏木霉菌株或其孢子、菌丝体、原生质体,从而重组表达里氏木霉内源蛋白(如纤维素酶)。

在本发明的另一方面,提供一种用于蛋白表达的试剂盒,其中包含:前面任一所述的重组的里氏木霉菌株或其孢子、菌丝体、原生质体;或靶基因的下调剂(如用于敲除靶基因的质粒,或RNA干扰试剂),所述靶基因选自:编码ORF4蛋白的基因,编码内源β-葡萄糖苷酶的基因。

在一个优选例中,所述的内源蛋白包括(但不限于):纤维素酶,半纤维素酶,β葡萄糖苷酶,糖类透过酶,蛋白合成分泌途径相关酶。

在另一优选例中,所述的异源蛋白包括非纤维素酶分泌蛋白;较佳地,包括(但不限于):异源葡萄糖苷酶,异源阿魏酸酯酶FEA,结构蛋白(如蜘蛛丝蛋白、蚕丝蛋白等),功能蛋白(如免疫调节蛋白、血清白蛋白等)。

本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。

附图说明

图1、利用酵母双杂系统验证orf4和ACE1存在蛋白互作。阳性对照为已经报道存在蛋白互作的Lae1和Vel1,实验组为AD-orf4和BD-ACE1,阴性对照为AD-orf4和BD空载体,以及AD空载体和BD-ACE1。显蓝色说明存在蛋白互作。

具体实施方式

里氏木霉是商业纤维素酶的主要生产微生物,目前工业上应用的常见菌株虽然相比野生株纤维素酶产量已经有了一定的提高,但是还有一定的上升空间。加上里氏木霉产纤维素酶的诱导机制还未被真正解析,因此寻找新的产酶以及蛋白分析相关的关键因子显得尤为重要。本发明人经过深入的研究,发现里氏木霉基因组中的一些靶基因与该菌株的内源或外源蛋白产量和/或活性密切相关,下调这些靶基因,可以极为显著地提高该菌株的内源或外源蛋白产量和/或活性。因此,所述靶基因或调节所述靶基因的物质和方法可应用于实现里氏木霉的改良,提高里氏木霉的蛋白表达效率,增强其表达的内源或外源蛋白产量和/或活性。

在本发明中,“ORF4多肽(蛋白)”指具有SEQ ID NO:2序列的多肽,还包括具有与ORF4多肽相同功能的、SEQ ID NO:2序列的变异形式或同源物。这些变异形式包括(但并不限于):若干个(如1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个,还更佳如1-8个、1-5个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。

在本发明中,“β-葡萄糖苷酶”指具有SEQ ID NO:15序列的多肽,还包括具有与β-葡萄糖苷酶多肽相同功能的、SEQ ID NO:15序列的变异形式或同源物。这些变异形式包括(但并不限于):若干个(如1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个,还更佳如1-8个、1-5个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。

任何与所述的ORF4多肽或β-葡萄糖苷酶同源性高(比如与SEQ ID NO:2或15所示的序列的同源性为85%或更高;优选的,同源性为90%或更高;更优选的,同源性为95%或更高,如同源性98%或99%)的、且具ORF4多肽或β-葡萄糖苷酶相同功能的蛋白也包括在本发明内。

尽管本发明的具体实施例中,列举了具体的ORF4多肽或β-葡萄糖苷酶,但是应理解,由于里氏木霉存在一些不同的变种,它们之间序列高度保守,来自于这些菌中的同源多肽或多核苷酸也应被包含在本发明中,对这些同源多肽或多核苷酸(同源物)的如本发明类似或相同的调控方法也应被包含在本发明中。比对序列相同性的方法和工具也是本领域周知的,例如BLAST。

本发明人通过里氏木霉基因组逐步敲除,发现敲除株的蛋白分泌能力有所增加。再对这段序列进行单基因的筛选工作,最终发现该区域的甲基转移酶和产纤维素酶的调控有关,通过实验验证,该甲基转移酶酶可通过调控纤维素酶的抑制因子ACE1来调控纤维素酶的分泌。而且其他位点的基因也和纤维素酶的产量有关。该甲基转移酶的敲除可以使里氏木霉Rut-C30的FPU酶活提高25%以上。因此是一个产纤维素酶的关键因子,可用于里氏木霉工业菌株改造,非常具有应用价值。另一方面,本发明人还进一步对一个预测为β-葡萄糖苷酶的基因进行敲除,发现敲除株的蛋白分泌能力还能进一步提高。通过实验发现,该β-葡萄糖苷酶对里氏木霉诱导产酶的最强诱导物槐糖有较强的水解能力,可能导致胞内诱导物下降,和上述甲基转移酶都是诱导产纤维素酶的关键因子。

因此,本发明首次确定里氏木霉基因组中的一些靶基因与该菌株的内源或外源蛋白产量和/或活性密切相关。基于该新发现,本发明提供了一种提高里氏木霉的蛋白表达效率的方法,所述方法包括:下调里氏木霉基因组中的靶基因;其中,所述下调的靶基因选自:编码ORF4蛋白的基因,编码内源β-葡萄糖苷酶的基因。

在得知了所述的靶基因后,可以采用本领域人员熟知的多种方法来调节(下调或变异)它们。包括但不限于抑制、敲除、沉默或突变所述的靶基因,或抑制所述的靶基因编码的蛋白的表达或活性;或将下调所述靶基因的下调剂转入里氏木霉中;或通过定点突变试剂来进行靶向突变。

可以采用多种本领域已知的方法在里氏木霉株中下调所述靶基因,包括基因沉默、基因阻断、基因敲除、基因抑制等。这些方法均被包含在本发明中。

例如,可以通过基于同源重组的基因插入或缺失的基因阻断技术来改造基因组中的靶基因,从而使得靶基因被阻断;也可以针对靶基因设计干扰性RNA或反义核苷酸来使靶基因表达抑制或沉默。

一种下调靶基因的方法是基因阻断技术,在本发明的优选实施方式中,体外构建靶基因阻断质粒,通过同源重组的方法,在里氏木霉株染色体靶基因中插入其他无关元件,从而使得染色体上的靶基因不再能够编码活性的蛋白质。当进行基因阻断时,无关元件的选择是本领域技术人员易于选择到的,例如应用一些抗性基因。一种基因阻断(敲除)的方法例如可参见Genetic Manipulation of Streptomyces:a Laboratory Manual中所记载的。

在设计用于进行基因阻断或敲除的构建物时,同时包含抗性筛选基因是优选的,从而有利于后续筛选出发生基因被阻断或敲除的菌株。

本发明还提供了下调所述靶基因的里氏木霉或其孢子、菌丝体、原生质体,更特别的是采用CRISPR/Cas技术缺失靶基因后获得的里氏木霉或其孢子、菌丝体、原生质体,该菌株或其孢子、菌丝体、原生质体不表达所述靶基因或表达量显著性降低。本发明还涉及所述菌株或其孢子、菌丝体、原生质体的用途,用于提高里氏木霉的蛋白表达效率。

基于本发明人的工作,本发明还提供了一种用于蛋白表达的试剂盒,其中包含:本发明的遗传工程化(重组)的里氏木霉或其孢子、菌丝体、原生质体。

本发明还提供了一种用于蛋白表达的试剂盒,其中包含:所述靶基因的下调剂,如用于敲除靶基因的质粒,或RNA干扰试剂,或定点突变试剂等。

所述的用于蛋白表达的试剂盒中,还可以包括其它应用于里氏木霉生产过程的试剂,例如里氏木霉的基础培养基。

所述的用于蛋白表达的试剂盒中,还可以包括使用说明书,说明培养所述里氏木霉的方法,或说明利用所述下调剂或定点突变试剂下调里氏木霉中靶基因的方法。

在本发明实施例中,本发明人通过对Rut-C30的基因组SEQ ID NO:1中的ORF进行敲除发现,这段序列和里氏木霉纤维素酶产量及蛋白分泌能力相关。本发明人还在该区域同源重组表达异源基因获得了比其他位点表达更高的产量,在此基础上进一步敲除一个预测为β-葡萄糖苷酶的基因SEQ ID NO:3可以进一步提高产量。因此,本发明涉及的基因及非编码多核苷酸序列对里氏木霉菌株具有很好的工业应用前景。

在本发明的具体实施例中,在里氏木霉Rut-C30菌株中敲除ORF4的多核苷酸序列后,其孢子生产的纤维素酶的酶活高于15IU/mL(U/mL);较佳地高于18IU/mL。在本发明的另一实施例中,在里氏木霉Rut-C30菌株中阿魏酸酯酶FEA表达框(SEQ ID NO:5)在cbh1位点同源重组表达后,进一步敲除SEQ ID NO:1所示的多核苷酸序列后,其孢子生产的纤维素酶的酶活高于200IU/mL;较佳地高于220IU/mL。

在本发明的另一具体实施例中,在里氏木霉已经缺失SEQ ID NO:1的高产异源β-葡萄糖苷酶菌株U10中进一步还敲除SEQ ID NO:3所示的多核苷酸,其孢子生产的β-葡萄糖苷酶酶活(pNPGase)高于2000IU/ml;较佳地高于2500IU/mL。

通过本发明的改造获得高产菌株,加上转化子发酵培养的碳源是麸皮等简单易得的农用废弃物,在提高纤维素酶制剂的水解效率方面有着十分明显的作用,如应用在食品其他行业生产中,也将大大降低其生产成本,有着更为广泛的工业应用潜力。

进一步地,本发明的活性位点,还可以用于异源基因的重组表达。通过农杆菌介导的转化、PEG介导的原生质体转化、基于ku70/ku80、CRSIPR/Cas9等手段将异源基因表达框引入到基因组中,优选引入到cbh1位置,取代该序列的部分或全部序列进行重组表达,进行进一步改良而获得产量更高或酶系更为优化的衍生菌株或者其他重组蛋白的工程菌株。这些工程菌株还可以进一步建立无筛选标记的基因操作,在工业上有着巨大的应用前景。

更进一步的,本发明的菌株可以作为进一步优化衍生菌株或者其他重组蛋白的工程菌株的基础,构建无标记筛选系统后,可作为分子操作的对象,可以敲入和敲除基因等遗传操作,进行有目的性的遗传改造,或过表达里氏木霉表达量过少的纤维素酶基因,如过表达纤维素酶激活因子Xyr1等,或敲除纤维素酶阻遏因子Cre1等,获得进一步高产的工程菌株。

本发明的改造菌株是活体细胞,一旦获得了本发明菌株的孢子、菌丝、原生质体及其相关的还有活体细胞的培养混合物,就可以用接种传代、再生等手段来大批量地获得本发明的菌株。这通常是将其接种到固体平板培养基或液体培养基中进行菌株的扩大培养而获得本发明的活体细胞。而获得的活体细胞可进一步进行实验室驯化、遗传育种和分子遗传操作等来获得突变体和转化子。也可利用本发明作为异源表达的宿主细胞。

本领域的技术人员熟知的方法能用于诱变本发明的活体细胞,而造成活体细胞的基因编码改变、酶活特性和形态学上的改变。这些方法包括利用射线、粒子、激光、紫外光等物理方法,利用烷化剂、碱基类似物(base analog)、羟胺(hydroxylamine)、吖啶色素等化学诱变方法。诱变可是以上一种方法或多种方法的多代诱变,且不限于这些方法。基于本发明提供的菌株,可以进一步进行物理化学等方式进行育种,也可以导入新的纤维素酶基因和相关调控基因,获得的突变体和转化子产酶性能可获得进一步提高,所述的育种方法为上述的一种或一种以上相结合。

本领域的技术人员熟知的方法将本发明的多核苷酸序列用于构建表达构建物(载体)和进一步改造宿主细胞。例如,对于菌株中已发现或新发现的与纤维素酶生产相关的信号途径、信号通路及其中涉及的蛋白进行进一步的改良(例如增加有益因子的表达,减少有害因子的表达)。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。所用的步骤在本领域众所周知。如农杆菌介导的真菌转化方法,原生质体转化方法、电击转化方法、CRISPR/Cas9基因组编辑法、基因枪法等,且不限于这些方法。

本发明通过改造获得的里氏木霉优化菌株能够利用含有木质纤维素的工农业生产废弃物,如麸皮、玉米浆、豆饼粉等廉价原料,通过液态或固态发酵生产纤维素酶,其优势在于所产纤维素酶活力高,组分合理,水解木质纤维素能力强。本发明为解决纤维素资源利用中酶活力不高、酶组分不合理导致的生产成本高,糖化效率低等问题提供了新的菌种资源。

本发明通过引入FEA表达框同源替换cbh1后进一步敲除SEQ ID NO:1获得的里氏木霉工程菌株能够利用含有木质纤维素的工农业生产废弃物,如麸皮、玉米浆、豆饼粉等廉价原料,通过液态或固态发酵生产纤维素酶,其优势在于所产纤维素酶活力高,组分合理,水解木质纤维素能力强。相同发酵条件下,该菌株是随机引入FEA表达框产量的2倍。本发明为解决纤维素资源利用中酶活力不高、酶组分不合理导致的生产成本高,糖化效率低等问题提供了新的菌种资源。

本发明通过敲除SEQ ID NO:3获得的里氏木霉优化菌株能够利用含有木质纤维素的工农业生产废弃物,如麸皮、玉米浆、豆饼粉等廉价原料,通过液态或固态发酵生产纤维素酶,其优势在于所产纤维素酶活力高,组分合理,水解木质纤维素能力强。本发明为解决纤维素资源利用中酶活力不高、酶组分不合理导致的生产成本高,糖化效率低等问题提供了新的菌种资源。

本发明的方法获得的里氏木霉优化菌株能够利用含有木质纤维素的工农业生产废弃物,如豆饼粉等廉价原料,通过液态或固态发酵生产纤维素酶,其优势在于所产纤维素酶显著下降。本发明的敲除菌株可为表达非纤维素酶分泌蛋白提供表达宿主。

本发明在制备纤维素酶和异源蛋白方面的应用可以通过液态发酵实现,作为一个优选实施例方式,发酵方法包括:(1)将里氏木霉菌种在土豆培养基制成的斜面或平板活化后,制成浓度为10

应用于培养本发明的菌株的培养基和培养方法并不限于以上公布的那些,其它常规应用于培养里氏木霉的培养基和培养方法也可以应用于本发明中。

如上所述发酵体系可以进行体系放大进行工业生产,根据体系的大小不同,本领域技术人员根据所掌握的一般知识可以进行适当的调整以有利于菌株的生长或生产。

如上所述液体发酵粗酶液,可经超滤、盐析或有机溶剂沉淀等方法获得较纯的纤维素酶、酶粉或其他异源重组蛋白。通过发酵并测定所产纤维素酶的滤纸酶活(FPA)、CMC酶活、β-葡萄糖苷酶酶活及其他重组蛋白的活性。应理解,分离和纯化纤维素酶、重组蛋白的方法不受限于本发明中所提供的那些,其它本领域技术人员已知的方法也可应用于本发明中。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。

实施例1、SEQ ID NO:1多核苷酸的获得

1、培养里氏木霉菌株

将里氏木霉Rut-C30菌种(购自ATCC,菌株编号:ATCC 56765)接种在土豆培养基制成的平板上,置于28℃培养7天后,制成浓度为10

2、抽提里氏木霉基因组DNA

收集菌液到离心管,12000g离心获得菌丝。弃去上清液,加入0.5ml酚:氯仿:异戊醇(v:v:v=25:24:1),再加入0.5ml DES(0.1M Tris-HCl,pH 8.0,1.0%SDS,2%Triton X-100,10mM EDTA,0.1M NaCl)。加入0.1g beads后,放入Fastprep,6M/S,破碎30s,间隔5分钟后重复一次。裂解后的菌液12000g,4℃,离心10min。吸取上清0.4ml,加入等体积的异丙醇,-20℃沉淀30分钟。12000g,4℃,离心10min,弃上清。沉淀用75%乙醇洗涤后,12000g,4℃,离心5min,弃上清,晾干5min,之后加入200μl无菌水。

3、orf4多核苷酸(SEQ ID NO:1)的克隆

从上述分离到的里氏木霉基因组DNA,以正向引物为:5’ATGTCCCAATACGACTCCATCGG 3’(SEQ ID NO:6),其5’端添加XbaI识别位点:TCTAGA;反向引物为5’TTACAACCGCAACTAAAACAC 3’(SEQ ID NO:7),其5’端添加XbaI识别位点。

将PCR产物纯化后用XbaI酶切,应用AxygenPCR产物柱回收试剂盒回收酶切的DNA片段,将该DNA片段和经同样酶切的回收的载体pHDt/sk(含有Kan和hyg筛选标记,购自Sigma公司)去磷酸化处理后,用T4 DNA连接酶在16℃下连接过夜,得到载体pHDt/sk-full。并通过测序验证序列正确与否。

SEQ ID NO:1(orf4)核酸序列:

ATGTCCCAATACGACTCCATCGGCGCCTCCTATAATGTCCTTGAGCAACTTGCCTACAGAGCTGTGGAGAAGTACAACGTGTACACAACTATTAAGCCACTACTCAGACCGGGGGTGCATGTTCTAGATCTTGCCTGCGGTACCGGCTTCTACTCATCACATCTTCTTGCATGGGGCGCTGAAGACGTCCTCGGCGTGGATATATCATCTGCAATGCTTGAGAGTGCCGTATCTCGATTATCATCAGAGATTTCTG

SEQ ID NO:2(orf4)多肽序列:

MSQYDSIGASYNVLEQLAYRAVEKYNVYTTIKPLLRPGVHVLDLACGTGFYSSHLLAWGAEDVLGVDISSAMLESAVSRLSSEISAGKAQFVLGDGVIPQSFAPDNSRGFFGMVFGAWFLNYASSKDQLVAMFTNISLNLTVDGVFVGVVPYPTNDIQERAKNSEQISLRQYFPRNELVIMLRL

实施例2、orf4功能研究

1、里氏木霉CRISPR/Cas9底盘细胞的构建

通过对酿脓链球菌(Streptococcus pyogenes)的Cas9编码基因的密码子进行分析,以人工优化的Cas9基因(SEQ ID NO:4;其中第4117-4137位为入核信号)为模板,通过引物Cas9F(ATGGACAAGAAGTACAGCATTGG(SEQ ID NO:8))和Cas9R(TTAGACCTTGCGCTTCTTCTTGGG(SEQ ID NO:9))PCR分离获得该序列。以pDHt/sk载体为骨架,构建密码子优化的Cas9基因表达载体。

以里氏木霉基因组DNA为模板,利用正向引物:5’ACGACGGCCAGTGCCAAGCTTAGGACTTCCAGGGCTACTTG 3’(SEQ ID NO:10)和反向引物:5’GATTGTGCTGTAGCTGCGCTGCTTTGATCGTTTTGAGGTGC 3’(SEQ ID NO:11)扩增获得Ppdc作为优化的Cas9基因表达的启动子。

以里氏木霉基因组DNA为模板,利用正向引物5’AGAAGAAGAGGAAGGTGTGACCCGGCATGAAGTCTGACCG 3’(SEQ ID NO:16)和反向引物5’TAATTGCGCGGATCCTCTAGATGGACGCCTCGATGTCTTCC 3’(SEQ ID NO:17)扩增Tpdc作为终止子。

采用一步法克隆的方法构建载体,通过验证序列成功构建包含诱导型启动子的重组载体pDHt/sk-ppdc-Cas9-tpdc。

将上述构建好的质粒转化入根癌农杆菌AGL1中,在根癌农杆菌的介导下转化入里氏木霉Rut-C30中,用潮霉素作为筛选压力,将长出的转化子接种于SDB培养液中,2天后抽提DNA为模板,通过载体上的启动子处设计正向引物5’TACGTCGGCCCCCTGGCC 3’(SEQ IDNO:12)和Cas9基因的反向引物为5’GAGGTTGTCAAACTTGCGCTGCG 3’(SEQ ID NO:13)PCR鉴定阳性转化子。获得的转化子分别命名为C30-pc。

2.orf4的功能性敲除

建立sgRNA:5’TAATACGACTCACTATA

将构建好的sgRNA连入pMD18T(购自Takara公司,Amp抗性),以此为模板,获得的体外转录模板用苯酚:氯仿:异戊醇(25:24:1)抽提纯化,最后用Nuclease free water溶解DNA,即可用于gRNA的体外转录。

gRNA的体外转录,具体方法参考试剂盒说明书。将C30-pc孢子接种于PDA平板,28℃培养7d,使用0.85%NaCl+0.02%吐温80洗下孢子。用灭菌的镊子在PDA平板上盖一张玻璃纸,将其铺平,在玻璃纸上加入150ul左右的孢子悬液,用玻棒涂布均匀,做6个同样的处理,28度培养约14h。用裂解酶(Sigma#L1412 lysing enzymes)裂解细胞壁,除去细胞壁碎片后即可获得原生质体悬液,与纯化gRNA片段混合后用PEG介导的原生质转化法转化,涂布于的筛选平板,置28℃培养,5天左右可观察到菌丝长出。待转化子长出后,验证后即可获得对应sgRNA的敲除子。

3.敲除子酶活筛选

(1)将里氏木霉菌种接种在土豆培养基制成的平板上置于28℃培养7天后,制成浓度为10

(2)将步骤(1)获得的发酵液离心分离,取上清液作为粗酶液;所述的发酵培养基是含有5%诱导物(3%微晶纤维素和2%麸皮)的无机盐培养液(0.4%KH2PO4,0.28%(NH

(3)在0.05mol/L pH5.0的醋酸-醋酸钠或柠檬酸-柠檬酸钠缓冲液中,将里氏木霉出发株及其敲除子粗酶液加入到滤纸中,50~60℃水解60min,测定滤纸上的纤维素酶的酶活(单位:Filter Paper Unit,FPU)。测得酶活如表1。

表1、里氏木霉转化子及其敲除菌株的滤纸酶活

由表1结果可见,orf4敲除使得纤维素酶的酶活显著性升高,因此其与纤维素酶的产酶相关,是关键基因。

实施例3、SEQ ID NO:1编码的蛋白的互作蛋白筛选

利用酵母双杂交载体pGADT7 AD Vector,pGBKT7 DNA-BD Vector(购于Takara公司)分别构建orf4(即SEQ ID NO:1)和其他已知转录调控因子包括:ACE1(GenBank登录号AF190793),Vel1(GenBank登录号XM_006966084),Hda1(GenBank登录号XP_006968036),Cre1(GenBank登录号AAB01677),Lae1(GenBank登录号AFX86442等,得到AD-orf4,AD-ACE1,AD-Vel1,AD-Hda1,AD-Cre1,AD-Lae1,AD-Cre1以及BD-orf4,BD-ACE1,BD-Vib1,BD-Hda1,BD-Cre1,BD-Lae1,BD-Cre1等。将不同组合的AD和BD载体转化的AH109酵母菌株(购自Takara),并分别做好空白对照,分别涂布于含有SD+Dropout+Ade+His培养基筛选平板。30℃培养2~3天后,挑取菌落少许至SD+Dropout+3-AT+X-α-GAL营养缺陷培养基,30℃培养2-3天,观察酵母菌能生长同时变蓝色的说明两个蛋白之间存在互作。

结果发现,共转化AD-orf4和BD-ACE1的转化子能够生长并显蓝色,如图1所示,说明orf4和ACE1存在互作。

ACE1是一个纤维素酶抑制因子,该结果提示orf4通过对ACE1某些位点进行修饰,进而激活其抑制纤维素酶转录的功能。

实施例4、利用orf4表达异源蛋白

以实施例2获得的C30-pc菌株为出发株,利用CRISPR/Cas9技术将阿魏酸酯酶FEA(SEQ ID NO:5所示的核苷酸)同源替换里氏木霉cbh1位置,继而敲除SEQ ID NO:1,获得的转化子命名为U10FEA1~U10FEA5,仅同源替换里氏木霉cbh1位置而不敲除SEQ ID NO:1的菌株作为对照(FEAΔ1)。将转化子和C30-pc接种到在土豆培养基制成的平板上置于28℃培养7天后,制成浓度为10

表2、C30-pc及其转化子的pNPF酶活

由表2结果可见,替换cbh1后进一步敲除orf4(SEQ ID NO:1)可以获得比仅替换cbh1位点更高的异源蛋白表达量。敲除orf4是提高异源蛋白表达产量的一个优选策略。

实施例5、通过对内源β-葡萄糖苷酶的操作提高胞外分泌蛋白水平

以里氏木霉菌株Qm9414(购自ATCC 26921)为出发株,用实施例1中的方法,敲除β-葡萄糖苷酶编码基因(SEQ ID NO:3所示的核苷酸),设计sgRNA:5’TAATACGACTCACTATA

β-葡萄糖苷酶的基因(SEQ ID NO:3):

ATGACCTCGTTTCACGACGGCGTCAAGTTGTCCACTGTGACGTGTGTCCTGTCCGGCTTGGTGGCTCTAGGAAGTGCCGGACCTACTGCTGCGTCGGCAAATGCACAAGTAGCGGCGGCTGCGGCTGCCCAAGCCTGGGTTCCAGATGGCTACTATGTGCCGCCGTATTATCCTGCGCCGTACGGTGGATGGGTGGAGGATTGGCAAGAGAGTTATACCAAGGCCAAGGCTCTGGTCGATTCCATGACTCTGGCAGAAAAGACCAATATCACTGCAGGAACTGGCATCTATATGGGTGAGTGGTGGCTTCCTTGAGGATGAGAGGCAGTTTCAGACTGTGTGTGGATGAGCGAGTAATTGTATGCTAACCAGCGAGAACAGGGTGAGTTATTTGGAGCCTTGCCAACGTACAGACCGAAGCCTCTTCAAGGGATGAAAGGCTTTTGTCAGAACTTCAGCAAACGGGTCTTGTACACCATATGCTGGGATGATGATAACCCATTGAGAGATTATAAACTAACACTGATCAAGGCGATGTGCCGGAAACACAGGCTCTGCGTTTCGAGTTTCCTTTCCCCAGCTGTGTCTCAACGACAGCCCGGCGGGTGTCCGACATGCGGACAATGTAACAGCTTTTCCTGACGGAATCACCGTCGGCGCAACGTTCGACAAGGCCCTCATGTACAAGCGCGGCGTGGCCATTGGAAAGGAGAACCGCGGAAAGGGCGTCAATGTCTGGCTGGGACCAACTGTTGGGCCGATAGGCCGCAAGCCAAAGGGCGGCCGCAACTGGGAAGGCTTCGGTGCTGATCCTGTGCTCCAGGCCGTCGGTGCTCGAGAGACGATCAAGGGCGTTCAAGAGCAGGGGGTCATTGCGACTATCAAACACTTTATCGGCAACGAGCAGGAGATGTACCGCATGTACAATCCCTTTCAATACGCATACAGCTCAAATATTGGTACGTGTTTCCAGCGGAATGAAGAGTAAAAGTGAGATAAGATGCTGACAATGAGTTGACGGGTAAAAGACGATAGGACGCTGCATGAAGTATATGCCTGGCCATTCGCCGAGGGCATCCGAGCGGGTGTTGGCGCCGTCATGATGGCTTACAATGCTGTAAGTGATTCTGAGACGAGTGGCTTGATTGTCCAGCAGCTAATTGCTTTTCTCCCGCCAGGTGAACGGGACTGCGTGCTCTCAACACCCATATCTTATGAGTGCCCTTCTCAAGGATGAGATGGGCTTTCAAGGCTTCATCATGACCGACTGGCTCGCTCACATGTCTGGCGTCGCTTCTGCCATTGCCGGCCTGGATATGGACATGCCTGGCGACGTTCAGATTCCCTTCTTCGGCGGCTCATACTGGATGTATGAGCTCACTCGGTCTGCTCTTAATGGTTCGGTTCCCATGGATCGCATCAACGACGCGGCTACACGCATAGCCGCTGCGTGGTACAAGATGGGCCAGGACAAGGGATTCCCCGCGACGAATTTCGACACCAACTCTCGTGCTGCCTTCAACCCGCTGTATCCTGCCGCGCTGCCACTTTCGCCATTTGGCATCACAAACGAGTTTGTACCGGTCCAAGACGATCACGACGTAATTGCTCGCCAAATTTCTCAGGAAGCAATCACCCTGTTGAAGAACGACGGCGACATCCTCCCTCTATCGCCTTCGCAGCACCTCAAGGTTTTCGGCACCGATGCTCAGAAAAACCCAGACGGCATCAATTCATGCACAGATCGCAATTGCAACAAGGGAACTCTGGGCCAAGGATGGGGCTCGGGAACTGTCGATTACCCCTATTTGGACGATCCCATCTCAGCTATCACTGCAGAGGCCGACAATGTCACGTTTTACAACACGGACAAGTTCCCTTCTGTCGGCGAAGTATCAGATAGCGACGTCGCCATCGTCTTTGTCAACTCGGATGCTGGCGAAAACACCTACACCGTGGAAGGCAACCACGGCGACCGTGACAAATCCGGCTTGTACGCATGGCACGACGGCGATAAGCTTGTGCAGGACGCCGCGAGCAAGTTCAGCAACGTCATTGTCGTGATACACACTGTTGGCCCCCTGATCCTCGAGAAGTGGATCGATCTGCCATCCGTCAAGGCGGTGCTCGTCGCACATCTGCCCGGCCAGGAAGCCGGCAAGTCTCTTACAAACGTCCTCTTTGGACACGCCTCGCCGTGCGGACACTTGCCTTATTCCATCACGAAAGAGGAGGACGACCTTCCCAAAAGCGTCACTACGCTCATTGACTCGGAGTTCCTCAACCAGCCCCAAGACACATACACAGAGGGTCTGTACATTGACTACCGCTGGCTCAACAAGAACAAGACCAAGCCTCGCTACGCCTTTGGCCACGGTCTGAGCTACACAAACTTCACCTTCAAGGCAGCATCCATCAAACAGGTCGCCAGGCTGAGCGCATACCCGCCGGCTCGCCCAGCCAAGGGCAGCACCCCCGATTTTGCGCAATCCATTCCATCCGCAAGCGAAGCCGTTGCGCCGTCAGGCTTCGGCAAGATCCCCCGCTACATCTACTCTTGGCTGTCGCAGGGCGATGCCAACCGGGCCATTTCAGACGGCAAGACG

β-葡萄糖苷酶的蛋白(SEQ ID NO:15):

MTSFHDGVKLSTVTCVLSGLVALGSAGPTAASANAQVAAAAAAQAWVPDGYYVPPYYPAPYGGWVEDWQESYTKAKALVDSMTLAEKTNITAGTGIYMGERCAGNTGSAFRVSFPQLCLNDSPAGVRHADNVTAFPDGITVGATFDKALMYKRGVAIGKENRGKGVNVWLGPTVGPIGRKPKGGRNWEGFGADPVLQAVGARETIKGVQEQGVIATIKHFIGNEQEMYRMYNPFQYAYSSNIDDRTLHEVYAWPFAEGIRAGVGAVMMAYNAVNGTACSQHPYLMSALLKDEMGFQGFIMTDWLAHMSGVASAIAGLDMDMPGDVQIPFFGGSYWMYELTRSALNGSVPMDRINDAATRIAAAWYKMGQDKGFPATNFDTNSRAAFNPLYPAALPLSPFGITNEFVPVQDDHDVIARQISQEAITLLKNDGDILPLSPSQHLKVFGTDAQKNPDGINSCTDRNCNKGTLGQGWGSGTVDYPYLDDPISAITAEADNVTFYNTDKFPSVGEVSDSDVAIVFVNSDAGENTYTVEGNHGDRDKSGLYAWHDGDKLVQDAASKFSNVIVVIHTVGPLILEKWIDLPSVKAVLVAHLPGQEAGKSLTNVLFGHASPCGHLPYSITKEEDDLPKSVTTLIDSEFLNQPQDTYTEGLYIDYRWLNKNKTKPRYAFGHGLSYTNFTFKAASIKQVARLSAYPPARPAKGSTPDFAQSIPSASEAVAPSGFGKIPRYIYSWLSQGDANRAISDGKTGKYPYPDGYSTTQKPGARAGGGEGGNPALWDVAYSLTVTVQNTGDEYAGKASVQAYLQFPDDIDYDTPIIQLRDFEKTKELKPGETTTVTLTLTRKDVSVWDVVAQDWKVPAVDGGYKVWIGDASDSLSIVCHTDTLECETGVVGPV

将转化子和Qm9414接种到在土豆培养基制成的平板上置于28℃培养7天后,制成浓度为10

表3、Qm9414及其转化子的发酵液的纤维素酶酶活

由表3的结果可见,敲除内源β-葡萄糖苷酶可显著提高内源纤维素酶的产量。

实施例6、通过对内源β-葡萄糖苷酶的操作进一步提高外源蛋白产量

以过表达外源β葡萄糖苷酶trbgls的里氏木霉菌株(专利号201210258194.6,以RC30-8为出发株),用实施例1中的方法进行对SEQ ID NO:1序列进行敲除,获得U10。以U10为出发株,将内源β-葡萄糖苷酶编码基因SEQ ID NO:3所示的核苷酸敲除(sgRNA:5’TAATACGACTCACTATA

将转化子和U10接种到在土豆培养基制成的平板上置于28℃培养7天后,制成浓度为10

以对硝基苯-β-D-葡萄糖苷(pNPG)为底物检测异源葡萄糖苷酶的酶活及理化特性,具体操作如下:

(1)对硝基苯酚(pNP)标准曲线制备

取8*3排列的PCR板,按表4加入溶液,共8组,每组3个平行重复。

表4

pNP浓度为10mg/ml。上表每份标样加100μl 1M NaCO

(2)异源葡萄糖苷酶的标准酶活测定

在100μl反应体系中,加入50μl浓度为4mM的pNPG,然后加入浓度为0.1M的NaAc/HAc(pH5.0)缓冲液稀释至一定稀释度的酶液50μl,60℃反应10分钟,再加入100μl 1MNaCO

酶活单位(U)定义:1U为每分钟催化pNPG产生1μmol pNP所需的酶量。

表5、U10及其转化子的发酵液的pNPG酶活

由表5的结果可见,敲除内源β-葡萄糖苷酶可以进一步提高外源蛋白(异源葡萄糖苷酶)产量。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院上海生命科学研究院

<120> 调控里氏木霉蛋白表达效率的因子、调控方法及应用

<130> 185371

<160> 19

<170> SIPOSequenceListing 1.0

<210> 1

<211> 995

<212> DNA

<213> 里氏木霉(Trichoderma reesei)

<400> 1

atgtcccaat acgactccat cggcgcctcc tataatgtcc ttgagcaact tgcctacaga 60

gctgtggaga agtacaacgt gtacacaact attaagccac tactcagacc gggggtgcat 120

gttctagatc ttgcctgcgg taccggcttc tactcatcac atcttcttgc atggggcgct 180

gaagacgtcc tcggcgtgga tatatcatct gcaatgcttg agagtgccgt atctcgatta 240

tcatcagaga tttctgcggg aaaggcacaa ttcgtgttgg gggatggtgt cattccacag 300

tcgttcgccc cagacaacag tcgaggattt ttcggcatgg tctttggtgc gtggtttctc 360

aattatgcgt cgagcaaaga ccaattggtt gccatgttca caaatatctc cctcaacctc 420

acagtggatg gcgtttttgt gggagttgtc ccttatccaa caaatgatat ccaggaacgg 480

gccaaaaact ctgagcaaat ctcactacgg cagtatttcc cacgcaacga gtatgtagaa 540

gagctgagct caggcgacgg ctggagctta cgggtatttc aagtgatgat ggggtggatt 600

tcatgacctg gcatatgaag aaaagcgttt acgaggaagc cgcaagactg ggaggtttgc 660

ggggcaaatt ggagtggcgc gatgagactc tgggaacaga aaattcagag cagcaatttg 720

gtttgacagc tgacgagtgg tcaatcagag tacaaaaccc tcacttggga atattggtcg 780

cctggaagag ttggttcaat actggaaaga gaacaaatcg ttaagctgag agtagtaaca 840

ggaacggagg ctatggagca tcttcataat acctttggca gttaacaaac gtcatcaatt 900

cataactgag caactatata cctgatacta gactggttat catggtatct taggagaggg 960

gttgaagaag gtaagtgttt tagttgcggt tgtaa 995

<210> 2

<211> 184

<212> PRT

<213> 里氏木霉(Trichoderma reesei)

<400> 2

Met Ser Gln Tyr Asp Ser Ile Gly Ala Ser Tyr Asn Val Leu Glu Gln

1 5 10 15

Leu Ala Tyr Arg Ala Val Glu Lys Tyr Asn Val Tyr Thr Thr Ile Lys

20 25 30

Pro Leu Leu Arg Pro Gly Val His Val Leu Asp Leu Ala Cys Gly Thr

35 40 45

Gly Phe Tyr Ser Ser His Leu Leu Ala Trp Gly Ala Glu Asp Val Leu

50 55 60

Gly Val Asp Ile Ser Ser Ala Met Leu Glu Ser Ala Val Ser Arg Leu

65 70 75 80

Ser Ser Glu Ile Ser Ala Gly Lys Ala Gln Phe Val Leu Gly Asp Gly

85 90 95

Val Ile Pro Gln Ser Phe Ala Pro Asp Asn Ser Arg Gly Phe Phe Gly

100 105 110

Met Val Phe Gly Ala Trp Phe Leu Asn Tyr Ala Ser Ser Lys Asp Gln

115 120 125

Leu Val Ala Met Phe Thr Asn Ile Ser Leu Asn Leu Thr Val Asp Gly

130 135 140

Val Phe Val Gly Val Val Pro Tyr Pro Thr Asn Asp Ile Gln Glu Arg

145 150 155 160

Ala Lys Asn Ser Glu Gln Ile Ser Leu Arg Gln Tyr Phe Pro Arg Asn

165 170 175

Glu Leu Val Ile Met Leu Arg Leu

180

<210> 3

<211> 3050

<212> DNA

<213> 里氏木霉(Trichoderma reesei)

<400> 3

atgacctcgt ttcacgacgg cgtcaagttg tccactgtga cgtgtgtcct gtccggcttg 60

gtggctctag gaagtgccgg acctactgct gcgtcggcaa atgcacaagt agcggcggct 120

gcggctgccc aagcctgggt tccagatggc tactatgtgc cgccgtatta tcctgcgccg 180

tacggtggat gggtggagga ttggcaagag agttatacca aggccaaggc tctggtcgat 240

tccatgactc tggcagaaaa gaccaatatc actgcaggaa ctggcatcta tatgggtgag 300

tggtggcttc cttgaggatg agaggcagtt tcagactgtg tgtggatgag cgagtaattg 360

tatgctaacc agcgagaaca gggtgagtta tttggagcct tgccaacgta cagaccgaag 420

cctcttcaag ggatgaaagg cttttgtcag aacttcagca aacgggtctt gtacaccata 480

tgctgggatg atgataaccc attgagagat tataaactaa cactgatcaa ggcgatgtgc 540

cggaaacaca ggctctgcgt ttcgagtttc ctttccccag ctgtgtctca acgacagccc 600

ggcgggtgtc cgacatgcgg acaatgtaac agcttttcct gacggaatca ccgtcggcgc 660

aacgttcgac aaggccctca tgtacaagcg cggcgtggcc attggaaagg agaaccgcgg 720

aaagggcgtc aatgtctggc tgggaccaac tgttgggccg ataggccgca agccaaaggg 780

cggccgcaac tgggaaggct tcggtgctga tcctgtgctc caggccgtcg gtgctcgaga 840

gacgatcaag ggcgttcaag agcagggggt cattgcgact atcaaacact ttatcggcaa 900

cgagcaggag atgtaccgca tgtacaatcc ctttcaatac gcatacagct caaatattgg 960

tacgtgtttc cagcggaatg aagagtaaaa gtgagataag atgctgacaa tgagttgacg 1020

ggtaaaagac gataggacgc tgcatgaagt atatgcctgg ccattcgccg agggcatccg 1080

agcgggtgtt ggcgccgtca tgatggctta caatgctgta agtgattctg agacgagtgg 1140

cttgattgtc cagcagctaa ttgcttttct cccgccaggt gaacgggact gcgtgctctc 1200

aacacccata tcttatgagt gcccttctca aggatgagat gggctttcaa ggcttcatca 1260

tgaccgactg gctcgctcac atgtctggcg tcgcttctgc cattgccggc ctggatatgg 1320

acatgcctgg cgacgttcag attcccttct tcggcggctc atactggatg tatgagctca 1380

ctcggtctgc tcttaatggt tcggttccca tggatcgcat caacgacgcg gctacacgca 1440

tagccgctgc gtggtacaag atgggccagg acaagggatt ccccgcgacg aatttcgaca 1500

ccaactctcg tgctgccttc aacccgctgt atcctgccgc gctgccactt tcgccatttg 1560

gcatcacaaa cgagtttgta ccggtccaag acgatcacga cgtaattgct cgccaaattt 1620

ctcaggaagc aatcaccctg ttgaagaacg acggcgacat cctccctcta tcgccttcgc 1680

agcacctcaa ggttttcggc accgatgctc agaaaaaccc agacggcatc aattcatgca 1740

cagatcgcaa ttgcaacaag ggaactctgg gccaaggatg gggctcggga actgtcgatt 1800

acccctattt ggacgatccc atctcagcta tcactgcaga ggccgacaat gtcacgtttt 1860

acaacacgga caagttccct tctgtcggcg aagtatcaga tagcgacgtc gccatcgtct 1920

ttgtcaactc ggatgctggc gaaaacacct acaccgtgga aggcaaccac ggcgaccgtg 1980

acaaatccgg cttgtacgca tggcacgacg gcgataagct tgtgcaggac gccgcgagca 2040

agttcagcaa cgtcattgtc gtgatacaca ctgttggccc cctgatcctc gagaagtgga 2100

tcgatctgcc atccgtcaag gcggtgctcg tcgcacatct gcccggccag gaagccggca 2160

agtctcttac aaacgtcctc tttggacacg cctcgccgtg cggacacttg ccttattcca 2220

tcacgaaaga ggaggacgac cttcccaaaa gcgtcactac gctcattgac tcggagttcc 2280

tcaaccagcc ccaagacaca tacacagagg gtctgtacat tgactaccgc tggctcaaca 2340

agaacaagac caagcctcgc tacgcctttg gccacggtct gagctacaca aacttcacct 2400

tcaaggcagc atccatcaaa caggtcgcca ggctgagcgc atacccgccg gctcgcccag 2460

ccaagggcag cacccccgat tttgcgcaat ccattccatc cgcaagcgaa gccgttgcgc 2520

cgtcaggctt cggcaagatc ccccgctaca tctactcttg gctgtcgcag ggcgatgcca 2580

accgggccat ttcagacggc aagacgggca agtatccgta tcccgacggc tactctacca 2640

cccagaagcc cggcgctcgc gctggcggcg gcgagggagg caaccccgcg ctctgggacg 2700

ttgcgtacag cctcacggtg acggtgcaga atacgggcga tgagtatgct ggcaaggcct 2760

ccgtgcaggc atatctccaa ttcccggacg atatcgacta cgatacgcca atcattcagc 2820

tccgtgactt tgaaaagaca aaggagctaa agccggggga gacgacgact gtgacgctga 2880

ctcttacacg caaggacgtc agtgtgtggg acgtggtggc gcaggattgg aaggttcctg 2940

cggttgacgg agggtataag gtgtggattg gggatgccag tgattcgtta agtattgtat 3000

gtcatacgga tacgttggag tgtgagactg gtgttgttgg gcctgtgtag 3050

<210> 4

<211> 4140

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggacaaga agtacagcat tggcctggac attggcacga actcggtcgg ctgggccgtc 60

atcacggacg agtacaaggt cccctccaag aagtttaagg tcctgggcaa caccgaccgc 120

cactccatca agaagaacct cattggcgcc ctgctcttcg actccggcga gaccgccgag 180

gccacccgcc tcaagcgcac cgcccgccgc cgatacacgc gccgcaagaa ccgcatctgc 240

tacctgcagg agattttctc caacgagatg gccaaggtcg acgactcctt ctttcaccgc 300

ctggaggagt cgttcctcgt cgaggaagac aagaagcacg agcgccaccc catctttggc 360

aacattgtcg acgaggtcgc ctaccacgag aagtacccca cgatctacca cctgcgcaag 420

aagctcgtcg actccaccga caaggccgac ctccgcctga tctacctcgc cctggcccac 480

atgattaagt tccgcggcca ctttctgatc gagggcgacc tcaaccccga caacagcgac 540

gtcgacaagc tgttcatcca gctcgtccag acctacaacc agctctttga ggagaacccc 600

attaacgcct ccggcgtcga cgccaaggcc atcctctcgg cccgcctctc caagagccgc 660

cgactcgaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720

ctcatcgccc tctccctggg cctcaccccc aacttcaagt cgaactttga cctcgccgag 780

gacgccaagc tgcagctctc caaggacacc tacgacgacg acctggacaa cctcctggcc 840

cagatcggcg accagtacgc cgacctgttc ctcgccgcca agaacctgtc cgacgccatc 900

ctcctgtcgg acattctccg cgtcaacacc gagattacga aggcccctct ctccgcctcg 960

atgatcaagc gctacgacga gcaccaccag gacctgaccc tgctcaaggc cctggtccgc 1020

cagcagctcc ccgagaagta caaggagatc ttctttgacc agagcaagaa cggctacgcc 1080

ggctacatcg acggcggcgc tagccaagag gagttctaca agtttatcaa gcccattctg 1140

gagaagatgg acggcacgga ggagctcctg gtcaagctca accgcgagga cctcctgcgc 1200

aagcagcgca ccttcgacaa cggcagcatc ccccaccaga ttcacctcgg cgagctgcac 1260

gccatcctcc gccgacaaga ggacttctac ccctttctca aggacaaccg cgagaagatc 1320

gagaagattc tgacgttccg catcccctac tacgtcggcc ccctggcccg cggcaacagc 1380

cgctttgcct ggatgacccg caagtccgag gagaccatca cgccctggaa cttcgaggaa 1440

gtcgtcgaca agggcgcctc ggcccagtcc ttcatcgagc gcatgaccaa ctttgacaag 1500

aacctgccca acgagaaggt cctccccaag cactcgctcc tgtacgagta cttcaccgtc 1560

tacaacgagc tcacgaaggt caagtacgtc accgagggca tgcgcaagcc cgccttcctg 1620

tcgggcgagc agaagaaggc catcgtcgac ctcctgttta agaccaaccg caaggtcacg 1680

gtcaagcagc tcaaggaaga ctacttcaag aagattgagt gctttgacag cgtcgagatc 1740

tccggcgtcg aggaccgctt taacgcctcc ctgggcacct accacgacct cctgaagatc 1800

attaaggaca aggacttcct ggacaacgag gagaacgagg acatcctcga ggacattgtc 1860

ctgaccctca cgctgtttga ggaccgcgag atgatcgagg agcgcctgaa gacgtacgcc 1920

cacctcttcg acgacaaggt catgaagcag ctcaagcgcc gccgatacac cggctggggc 1980

cgcctgagcc gcaagctcat caacggcatt cgcgacaagc agtcgggcaa gacgatcctc 2040

gacttcctga agagcgacgg cttcgccaac cgcaacttta tgcagctgat tcacgacgac 2100

tccctcacct tcaaggaaga catccagaag gcccaggtct ccggccaggg cgactccctg 2160

cacgagcaca tcgccaacct cgccggcagc cccgccatca agaagggcat tctgcagacc 2220

gtcaaggtcg tcgacgagct cgtcaaggtc atgggccgcc acaagcccga gaacatcgtc 2280

attgagatgg cccgcgagaa ccagaccacg cagaagggcc agaagaacag ccgcgagcgc 2340

atgaagcgca tcgaggaagg catcaaggag ctgggctccc agatcctcaa ggagcacccc 2400

gtcgagaaca cccagctgca gaacgagaag ctctacctgt actacctcca gaacggccgc 2460

gacatgtacg tcgaccagga gctggacatt aaccgcctct cggactacga cgtcgaccac 2520

atcgtccccc agagcttcct gaaggacgac tccatcgaca acaaggtcct cacccgcagc 2580

gacaagaacc gcggcaagag cgacaacgtc ccctccgagg aagtcgtcaa gaagatgaag 2640

aactactggc gccagctcct gaacgccaag ctgatcacgc agcgcaagtt tgacaacctc 2700

accaaggccg agcgaggcgg cctctcggag ctggacaagg ccggcttcat caagcgccag 2760

ctggtcgaga cccgccagat cacgaagcac gtcgcccaga ttctcgactc gcgcatgaac 2820

acgaagtacg acgagaacga caagctgatc cgcgaggtca aggtcattac cctgaagtcg 2880

aagctcgtca gcgacttccg caaggacttc cagttttaca aggtccgcga gatcaacaac 2940

taccaccacg cccacgacgc ctacctcaac gccgtcgtcg gcaccgccct gatcaagaag 3000

taccccaagc tcgagtccga gttcgtctac ggcgactaca aggtctacga cgtccgcaag 3060

atgatcgcca agtccgagca ggagattggc aaggccaccg ccaagtactt cttttactcg 3120

aacatcatga acttctttaa gaccgagatc accctcgcca acggcgagat ccgcaagcgc 3180

cccctcattg agaccaacgg cgagaccggc gagatcgtct gggacaaggg ccgcgacttc 3240

gccaccgtcc gcaaggtcct cagcatgccc caggtcaaca tcgtcaagaa gaccgaggtc 3300

cagacgggcg gcttctcgaa ggagagcatt ctgcccaagc gcaactccga caagctcatc 3360

gcccgcaaga aggactggga ccccaagaag tacggtggct tcgactcccc caccgtcgcc 3420

tactcggtcc tggtcgtcgc caaggtcgag aagggcaagt cgaagaagct caagagcgtc 3480

aaggagctcc tgggcatcac cattatggag cgcagctcct tcgagaagaa ccccatcgac 3540

tttctcgagg ccaagggcta caaggaagtc aagaaggacc tgatcattaa gctccccaag 3600

tactccctct tcgagctgga gaacggccgc aagcgcatgc tcgcctccgc cggcgagctc 3660

cagaagggca acgagctcgc cctgcccagc aagtacgtca acttcctcta cctggccagc 3720

cactacgaga agctcaaggg ctcccccgag gacaacgagc agaagcagct gtttgtcgag 3780

cagcacaagc actacctcga cgagatcatt gagcagattt ccgagttctc gaagcgcgtc 3840

atcctggccg acgccaacct ggacaaggtc ctcagcgcct acaacaagca ccgcgacaag 3900

cccatccgcg agcaggccga gaacatcatt cacctcttca ccctgaccaa cctcggcgcc 3960

cccgccgcct tcaagtactt tgacaccacg atcgaccgca agcgctacac ctcgacgaag 4020

gaagtcctgg acgccaccct catccaccag agcattaccg gcctctacga gacgcgcatc 4080

gacctcagcc agctcggcgg cgactcccgc gccgacccca agaagaagcg caaggtctaa 4140

<210> 5

<211> 846

<212> DNA

<213> 链霉菌属(Streptomyces sp. )

<400> 5

atgaagcaat tctctgcaaa attcgctctc gcgctgtctg cggccgccgg gcaggccttg 60

gcggcctcta cgcagggcat ctccgaagac ctctacaacc gtctggttga gatggccacc 120

atctcgcaag cggcctacgc caacatgtgc aacatcccct cgaccatcac cgtcggggag 180

aagatctaca acgcccagac cgacatcaac ggatgggtgc tccgcgacga cagcaccaag 240

gaaatcatca ccgtcttccg cggcaccggc agcgacacca acctgcagct cgacaccaac 300

tacaccctca cgcccttcag caccttctcc gagtgcagcg gctgcgaggt gcacggcggg 360

tactttatcg gctggtcctc tgtccaagac caagtcatgt cgcttgtcaa agaacaggcc 420

gaccagtacc cggactacac gctgactgtc accggccaca gtctgggagc gtcaatggcg 480

actctcgctg ccgcccagct gtccggtaca tacgacaaca tcaccctgta cacgttcggc 540

gagccgcgca gcggcaacga ggccttcgcg tcgtacatga acgacaagtt caccgccacg 600

agcgcggaca cgaccaagta cttccgggtc actcattcca acgacggtat cccgaacctg 660

cccccggctg agcagggcta tgtccatggc ggtgtggagt actggagcgt ggacccctac 720

agtgcccaga acacctatgt ctgcactggg gatgaggtcc agtgctgtga ggcgcagggc 780

ggacagggcg tcaacgatgc gcacaccact tactttggaa tgaccagcgg agcttgcacc 840

tggtaa 846

<210> 6

<211> 23

<212> DNA

<213> 引物(Primer)

<400> 6

atgtcccaat acgactccat cgg 23

<210> 7

<211> 21

<212> DNA

<213> 引物(Primer)

<400> 7

ttacaaccgc aactaaaaca c 21

<210> 8

<211> 23

<212> DNA

<213> 引物(Primer)

<400> 8

atggacaaga agtacagcat tgg 23

<210> 9

<211> 24

<212> DNA

<213> 引物(Primer)

<400> 9

ttagaccttg cgcttcttct tggg 24

<210> 10

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 10

acgacggcca gtgccaagct taggacttcc agggctactt g 41

<210> 11

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 11

gattgtgctg tagctgcgct gctttgatcg ttttgaggtg c 41

<210> 12

<211> 18

<212> DNA

<213> 引物(Primer)

<400> 12

tacgtcggcc ccctggcc 18

<210> 13

<211> 23

<212> DNA

<213> 引物(Primer)

<400> 13

gaggttgtca aacttgcgct gcg 23

<210> 14

<211> 57

<212> DNA

<213> 向导RNA(sgRNA)

<400> 14

taatacgact cactataggg aaaggcacaa ttcgtgtgtt ttagagctag aaatagc 57

<210> 15

<211> 895

<212> PRT

<213> 里氏木霉(Trichoderma reesei)

<400> 15

Met Thr Ser Phe His Asp Gly Val Lys Leu Ser Thr Val Thr Cys Val

1 5 10 15

Leu Ser Gly Leu Val Ala Leu Gly Ser Ala Gly Pro Thr Ala Ala Ser

20 25 30

Ala Asn Ala Gln Val Ala Ala Ala Ala Ala Ala Gln Ala Trp Val Pro

35 40 45

Asp Gly Tyr Tyr Val Pro Pro Tyr Tyr Pro Ala Pro Tyr Gly Gly Trp

50 55 60

Val Glu Asp Trp Gln Glu Ser Tyr Thr Lys Ala Lys Ala Leu Val Asp

65 70 75 80

Ser Met Thr Leu Ala Glu Lys Thr Asn Ile Thr Ala Gly Thr Gly Ile

85 90 95

Tyr Met Gly Glu Arg Cys Ala Gly Asn Thr Gly Ser Ala Phe Arg Val

100 105 110

Ser Phe Pro Gln Leu Cys Leu Asn Asp Ser Pro Ala Gly Val Arg His

115 120 125

Ala Asp Asn Val Thr Ala Phe Pro Asp Gly Ile Thr Val Gly Ala Thr

130 135 140

Phe Asp Lys Ala Leu Met Tyr Lys Arg Gly Val Ala Ile Gly Lys Glu

145 150 155 160

Asn Arg Gly Lys Gly Val Asn Val Trp Leu Gly Pro Thr Val Gly Pro

165 170 175

Ile Gly Arg Lys Pro Lys Gly Gly Arg Asn Trp Glu Gly Phe Gly Ala

180 185 190

Asp Pro Val Leu Gln Ala Val Gly Ala Arg Glu Thr Ile Lys Gly Val

195 200 205

Gln Glu Gln Gly Val Ile Ala Thr Ile Lys His Phe Ile Gly Asn Glu

210 215 220

Gln Glu Met Tyr Arg Met Tyr Asn Pro Phe Gln Tyr Ala Tyr Ser Ser

225 230 235 240

Asn Ile Asp Asp Arg Thr Leu His Glu Val Tyr Ala Trp Pro Phe Ala

245 250 255

Glu Gly Ile Arg Ala Gly Val Gly Ala Val Met Met Ala Tyr Asn Ala

260 265 270

Val Asn Gly Thr Ala Cys Ser Gln His Pro Tyr Leu Met Ser Ala Leu

275 280 285

Leu Lys Asp Glu Met Gly Phe Gln Gly Phe Ile Met Thr Asp Trp Leu

290 295 300

Ala His Met Ser Gly Val Ala Ser Ala Ile Ala Gly Leu Asp Met Asp

305 310 315 320

Met Pro Gly Asp Val Gln Ile Pro Phe Phe Gly Gly Ser Tyr Trp Met

325 330 335

Tyr Glu Leu Thr Arg Ser Ala Leu Asn Gly Ser Val Pro Met Asp Arg

340 345 350

Ile Asn Asp Ala Ala Thr Arg Ile Ala Ala Ala Trp Tyr Lys Met Gly

355 360 365

Gln Asp Lys Gly Phe Pro Ala Thr Asn Phe Asp Thr Asn Ser Arg Ala

370 375 380

Ala Phe Asn Pro Leu Tyr Pro Ala Ala Leu Pro Leu Ser Pro Phe Gly

385 390 395 400

Ile Thr Asn Glu Phe Val Pro Val Gln Asp Asp His Asp Val Ile Ala

405 410 415

Arg Gln Ile Ser Gln Glu Ala Ile Thr Leu Leu Lys Asn Asp Gly Asp

420 425 430

Ile Leu Pro Leu Ser Pro Ser Gln His Leu Lys Val Phe Gly Thr Asp

435 440 445

Ala Gln Lys Asn Pro Asp Gly Ile Asn Ser Cys Thr Asp Arg Asn Cys

450 455 460

Asn Lys Gly Thr Leu Gly Gln Gly Trp Gly Ser Gly Thr Val Asp Tyr

465 470 475 480

Pro Tyr Leu Asp Asp Pro Ile Ser Ala Ile Thr Ala Glu Ala Asp Asn

485 490 495

Val Thr Phe Tyr Asn Thr Asp Lys Phe Pro Ser Val Gly Glu Val Ser

500 505 510

Asp Ser Asp Val Ala Ile Val Phe Val Asn Ser Asp Ala Gly Glu Asn

515 520 525

Thr Tyr Thr Val Glu Gly Asn His Gly Asp Arg Asp Lys Ser Gly Leu

530 535 540

Tyr Ala Trp His Asp Gly Asp Lys Leu Val Gln Asp Ala Ala Ser Lys

545 550 555 560

Phe Ser Asn Val Ile Val Val Ile His Thr Val Gly Pro Leu Ile Leu

565 570 575

Glu Lys Trp Ile Asp Leu Pro Ser Val Lys Ala Val Leu Val Ala His

580 585 590

Leu Pro Gly Gln Glu Ala Gly Lys Ser Leu Thr Asn Val Leu Phe Gly

595 600 605

His Ala Ser Pro Cys Gly His Leu Pro Tyr Ser Ile Thr Lys Glu Glu

610 615 620

Asp Asp Leu Pro Lys Ser Val Thr Thr Leu Ile Asp Ser Glu Phe Leu

625 630 635 640

Asn Gln Pro Gln Asp Thr Tyr Thr Glu Gly Leu Tyr Ile Asp Tyr Arg

645 650 655

Trp Leu Asn Lys Asn Lys Thr Lys Pro Arg Tyr Ala Phe Gly His Gly

660 665 670

Leu Ser Tyr Thr Asn Phe Thr Phe Lys Ala Ala Ser Ile Lys Gln Val

675 680 685

Ala Arg Leu Ser Ala Tyr Pro Pro Ala Arg Pro Ala Lys Gly Ser Thr

690 695 700

Pro Asp Phe Ala Gln Ser Ile Pro Ser Ala Ser Glu Ala Val Ala Pro

705 710 715 720

Ser Gly Phe Gly Lys Ile Pro Arg Tyr Ile Tyr Ser Trp Leu Ser Gln

725 730 735

Gly Asp Ala Asn Arg Ala Ile Ser Asp Gly Lys Thr Gly Lys Tyr Pro

740 745 750

Tyr Pro Asp Gly Tyr Ser Thr Thr Gln Lys Pro Gly Ala Arg Ala Gly

755 760 765

Gly Gly Glu Gly Gly Asn Pro Ala Leu Trp Asp Val Ala Tyr Ser Leu

770 775 780

Thr Val Thr Val Gln Asn Thr Gly Asp Glu Tyr Ala Gly Lys Ala Ser

785 790 795 800

Val Gln Ala Tyr Leu Gln Phe Pro Asp Asp Ile Asp Tyr Asp Thr Pro

805 810 815

Ile Ile Gln Leu Arg Asp Phe Glu Lys Thr Lys Glu Leu Lys Pro Gly

820 825 830

Glu Thr Thr Thr Val Thr Leu Thr Leu Thr Arg Lys Asp Val Ser Val

835 840 845

Trp Asp Val Val Ala Gln Asp Trp Lys Val Pro Ala Val Asp Gly Gly

850 855 860

Tyr Lys Val Trp Ile Gly Asp Ala Ser Asp Ser Leu Ser Ile Val Cys

865 870 875 880

His Thr Asp Thr Leu Glu Cys Glu Thr Gly Val Val Gly Pro Val

885 890 895

<210> 16

<211> 40

<212> DNA

<213> 引物(Primer)

<400> 16

agaagaagag gaaggtgtga cccggcatga agtctgaccg 40

<210> 17

<211> 41

<212> DNA

<213> 引物(Primer)

<400> 17

taattgcgcg gatcctctag atggacgcct cgatgtcttc c 41

<210> 18

<211> 57

<212> DNA

<213> 向导RNA(sgRNA)

<400> 18

taatacgact cactataggc aagtatccgt atcccgagtt ttagagctag aaatagc 57

<210> 19

<211> 57

<212> DNA

<213> 向导RNA(sgRNA)

<400> 19

taatacgact cactataggc aagtatccgt atcccgagtt ttagagctag aaatagc 57

相关技术
  • 调控里氏木霉蛋白表达效率的因子、调控方法及应用
  • 源于里氏木霉的转录调控因子及编码基因和应用
技术分类

06120113071791